KR20220141332A - 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 - Google Patents
홍역-벡터화된 covid-19 면역원성 조성물 및 백신 Download PDFInfo
- Publication number
- KR20220141332A KR20220141332A KR1020227031638A KR20227031638A KR20220141332A KR 20220141332 A KR20220141332 A KR 20220141332A KR 1020227031638 A KR1020227031638 A KR 1020227031638A KR 20227031638 A KR20227031638 A KR 20227031638A KR 20220141332 A KR20220141332 A KR 20220141332A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- polypeptide
- construct
- cov
- sars
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/155—Paramyxoviridae, e.g. parainfluenza virus
- A61K39/165—Mumps or measles virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56983—Viruses
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6854—Immunoglobulins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5254—Virus avirulent or attenuated
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5256—Virus expressing foreign proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/53—DNA (RNA) vaccination
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/572—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
- C12N2015/8518—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/18011—Paramyxoviridae
- C12N2760/18411—Morbillivirus, e.g. Measles virus, canine distemper
- C12N2760/18441—Use of virus, viral particle or viral elements as a vector
- C12N2760/18443—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Communicable Diseases (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Pulmonology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Oncology (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Analytical Chemistry (AREA)
Abstract
본 발명은 코로나바이러스에 대한 면역의 분야에 관한 것이다. 본 발명은 코로나바이러스에 대한 면역 반응을 유발하는 코로나바이러스로부터 유래된 벡터화된 항원을 제공한다. 따라서, 본 발명은 코로나바이러스 항원을 발현하는 생 약독화 재조합 홍역 바이러스인 유효 성분, 및 면역, 특히 SARS-CoV-2 균주에 대한 보호 면역 및 유리하게는 다양한 코로나바이러스 균주에 대한 광범위한 보호 면역을 유도하기 위한 그의 용도에 관한 것이다.
Description
본 발명은 코로나바이러스에 대한 면역의 분야에 관한 것이다.
코로나바이러스는 큰 게놈(26 내지 32kb)을 가진 외피가 있는 포지티브 센스 단일 가닥 RNA 바이러스이다. 4개의 속(알파, 베타, 감마 및 델타)이 기술되어 왔으며 이 중 베타코로나바이러스는 4개의 계통(A, B, C 및 D)으로 세분화되었다. 코로나바이러스에 대해 확인된 숙주 중에서 인간을 포함한 조류 및 포유동물은 특히 매년 순환하는 균주 또는 대유행 발병을 일으킬 수 있는 균주에 의해 감염된 것으로 확인되어 왔다. 인간 코로나바이러스에는 연간 균주(annual strain)인 HCoV-OC43, HCoV-229E, HCoV-HKU1, HCoV-NL63 및 2003년에 분리된 SARS-CoV(중증 급성 호흡기 증후군 코로나바이러스) 또는 2012년에 분리되고 여전히 순환하고 있는 MERS-CoV(중동 호흡기 증후군 코로나바이러스)와 같은 유행성 균주가 포함된다. SARS-CoV 및 MERS-CoV는 각각 베타 코로나바이러스 계통 B와 계통 C에 속한다. 이 코로나바이러스는 공기를 통해 전염되며 사람에서 사람으로 전염되는 것으로 확인되었다.
이러한 알려진 균주 외에도, 2019-nCoV로 지정된 새로운 코로나바이러스 변종(또는 보다 최근에는 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)로 지정됨)은 2019년에 현재 중국에서 사람들을 감염시키고 있으며 전 세계적으로 퍼져서 많은 수의 감염된 인간 숙주가 중병에 걸리거나 사망한 것으로 확인되었다. 이러한 고병원성 균주는 동물 저장소에서 인간 집단으로 출현했으며 이미 코로나바이러스 대유행에 대한 큰 우려를 야기하는 인간 대 인간 전염에 의한 것을 포함하여 높은 치사율의 원인이 되는 것으로 입증되었다. 2020년 1월 30일에, 이 발병은 세계보건기구(WHO)에 의해 국제적 공중보건 비상사태로 선언된 후 2020년 3월 11일에 팬데믹으로 특징지어졌다. WHO는 또한 이 새로운 코로나바이러스 질병의 이름을 COVID -19로 발표했다.
현재까지 전 세계적으로 거의 1억 명이 SARS-CoV-2 대유행의 영향을 받았고 200만 명 이상이 COVID-19로 사망했다. 팬데믹으로 인해, 전 세계적으로 3조 3천억 달러의 "낙관적 손실(optimistic loss)" 및 82조 달러의 최악의 시나리오 손실(worst-case scenario loss)이 예상되는 전례 없는 전 세계적인 사회 및 경제적 혼란이 발생했다(GDP Risk; 2020). 이 바이러스는 현재 유럽과 북반구에서 2차 유행으로 폭발적으로 확장되고 있지만, 그 질병을 예방하거나 치료하는 특정 치료법은 확인되지 않았다. 공중 보건 조치의 시행과 함께, COVID-19 이전의 정상 상태로 돌아가려면 효과적인 백신이 필요하다. 따라서, SARS-CoV-2에 대한 면역 반응을 유도하고 잠재적으로 SARS-CoV-2 또는 가능하면 더 넓은 범위의 코로나바이러스 균주(예: 전염병 또는 대유행 균주)에 대한 보호를 제공하기 위한 백신 후보를 제안할 필요가 있다.
본 발명은 이러한 요구 및 기타 요구를 충족한다.
본 발명은 코로나바이러스에 대한 면역 반응을 유발하는 코로나바이러스로부터 유래된 벡터화된 항원(vectorized antigen)을 제공한다. 따라서, 본 발명은 코로나바이러스 항원(들)을 발현하는 생 약독화 재조합 홍역 바이러스인 유효 성분 및 면역, 특히 2019-nCoV(SARS-CoV-2) 균주에 대한 보호 면역 및 유리하게는 다양한 코로나바이러스 균주에 대한 광범위한 보호 면역을 유도하기 위한 그의 용도에 관한 것이다. 또한, 본 발명은 SARS-CoV-2의 천연 항원으로부터 유래된 폴리펩티드에 관한 것으로, 여기서 폴리펩티드는 효율적인 면역원을 설계, 특히 코로나바이러스 감염에 대한 백신 후보를 설계하는데 유용한 특성을 갖는다. 또한, 본 발명은 SARS-CoV-2의 천연 항원을 암호화하는 폴리뉴클레오티드 또는 SARS-CoV-2의 천연 항원으로부터 유래된 폴리펩티드를 암호화하는 폴리뉴클레오티드, 특히 재조합 홍역 바이러스에 의한 발현 또는 생산 세포로부터의 개선된 회수를 위해 적합한 폴리뉴클레오티드에 관한 것이다.
또한, 본 발명은 SARS-CoV-2의 항원으로부터 수득된 폴리펩티드를 발현하는 재조합 홍역 바이러스의 제조 수단 및 이에 따라 수득된 재조합 홍역 바이러스에 관한 것이다.
또한, 본 발명은 SARS-CoV-2의 항원으로부터 수득된 폴리펩티드를 발현하는 재조합 홍역 바이러스를 포함하는 면역원성 조성물에 관한 것이다. 또한, 본 발명은 SARS-CoV-2 및 선택적으로 다른 코로나바이러스 또는 감염으로 인한 질병에 대하여 동물 숙주, 특히 포유동물 숙주, 특히 인간 숙주에서 보호 면역 반응을 유도하기 위한 이러한 면역원성 조성물의 용도에 관한 것이다. 또한, 본 발명은 SARS-CoV-2에 의한 감염 및 선택적으로 다른 코로나바이러스 또는 감염에 의해 야기되는 질병에 대한 특히 예방적 치료를 필요로 하는 숙주의 치료 방법에 관한 것이다.
특히, 본 발명의 제1 양태는 핵산 작제물을 제공하며, 이는: 홍역 바이러스(MV)의 약독화된 균주의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및 제1 이종 폴리뉴클레오티드;를 포함하고, 상기 제1 이종 폴리뉴클레오티드는: (a) 서열번호 3의 SARS-CoV-2의 스파이크(S) 단백질, 또는 (b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는 (c) 1 내지 10개의 아미노산이 삽입, 치환 또는 결실에 의해 변형되어 있는 (a) 또는 (b)의 변이체를 암호화한다. 일부 구현예에서, 상기 (c)의 변이체는: (i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 및/또는 (ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 및/또는 (iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는 (iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이를 포함하는 폴리펩티드를 암호화하며, 상기 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치한다. 일부 구현예에서, 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고, 및/또는 S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 위치 675와 아미노산 위치 685 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고, 및/또는 EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고, 및/또는 S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고, 및/또는 (c)의 변이체는, 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드를 암호화한다.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치한다.
제1 측면의 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 암호화한다.
제1 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화한다.
제1 측면의 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 하기로 이루어진 군으로부터 선택된 오픈 리딩 프레임을 갖는다:
i. S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36,
ii. S1 폴리펩티드를 암호화하는 서열번호 10,
iii. S2 폴리펩티드를 암호화하는 서열번호 12,
iv. stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4,
v. Secto 폴리펩티드를 암호화하는 서열번호 6,
vi. stab-Secto 폴리펩티드를 암호화하는 서열번호 8,
vii. stab-S2 폴리펩티드를 암호화하는 서열번호 14,
ⅷ. tri-Secto 폴리펩티드를 암호화하는 서열번호 16,
ix. tristab-Secto 폴리펩티드를 암호화하는 서열번호 18,
x. S3F 폴리펩티를 암호화하는 서열번호 42,
xi. S2P3F 폴리펩티드를 암호화하는 서열번호 44,
xii. S2PΔF 폴리펩티드를 암호화하는 서열번호 46,
xiii. S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48,
xiv. T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51,
xv. S6P 폴리펩티드를 암호화하는 서열번호 53,
xvi. S6P3F 폴리펩티드를 암호화하는 서열번호 55,
xvii. S6PΔF 폴리펩티드를 암호화하는 서열번호 57,
xviii. SCCPP 폴리펩티드를 암호화하는 서열번호 59,
xix. SCC6P 폴리펩티드를 암호화하는 서열번호 61,
xx. SMVopt2P 폴리펩티드를 암호화하는 서열번호 63,
xxi. SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 및
xxii. SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 5'에서 3' 말단 방향으로 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고 MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며 T7 프로모터 및 T7 터미네이터에 의해 구성되고(framed) 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
제1 측면의 몇몇 구현예에서, 핵산 작제물은 (a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및 (b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임(δ)의 서열을 추가로 포함한다.
제2 이종 폴리뉴클레오티드를 갖는 제1 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 SARS-CoV-2의 N 폴리펩티드를 암호화하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드에서 클로닝에 사용된 ATU와 다른 위치의 ATU에서 클로닝된다.
제1 측면의 몇몇 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU3 내에 위치된다.
제1 측면의 몇몇 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치하고, 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치하고, 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치된다.
제1 측면의 몇몇 구현예에서, 홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주이다.
제2 측면에서, 본 발명은 (1) 홍역 바이러스(MV)의 약독화 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및 (2) 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하는 SARS-CoV-2의 S 단백질 또는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드를 포함하는 핵산 작제물을 제공하고, 여기서 삽입, 치환 또는 결실은 S 단백질 또는 이의 면역원성 단편의 세포 표면 발현을 증가시키고, 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 3'에 위치한 ATU에 위치한다. 몇몇 구현예에서, 상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 치환을 포함한다. 몇몇 구현예에서, 상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 전체 또는 부분의 결실을 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 발현된 S 단백질을 그의 융합전 형태(prefusion conformation)로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 K986 및 V987에 상응하는 아미노산 위치에서 아미노산 치환 K986P 및 V987P를 추가로 포함한다. 몇몇 구현예에서, 암호화된 S 단백질 또는 이의 면역원성 단편은 이중 도메인 S 단백질이다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는 ATU2에 위치한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는 SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81을 포함한다. 몇몇 구현예에서, 제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75를 포함한다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은, 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은 뉴클레오캡시드(N) 폴리펩티드; 기질 (M) 폴리펩티드; E 폴리펩티드; 8a 폴리펩티드; 7a 폴리펩티드; 3A 폴리펩티드; 및 이의 면역원성 단편으로 이루어진 군에서 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치한다. 제2 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및/또는 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치된다.
제2 측면의 몇몇 구현예에서, 제2 이종 단백질은 MV의 N 유전자의 업스트림인 ATU(ATU1) 내부, MV의 P 및 M 유전자 사이의 ATU(ATU2), 또는 H 및 L 유전자 사이의 ATU(ATU3)에 위치한다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은 5'에서 3' 방향으로 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 추가로 포함한다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열의 제어 하에 있으며 T7 프로모터 및 T7 터미네이터에 의해 구성되고(framed), 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
제2 측면의 몇몇 구현예에서, 핵산 작제물은:
(a) 약독화된 MV 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
(b) 약독화된 MV 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 핵산 작제물의 3'-말단에 있는 델타 간염 바이러스 리보자임(δ)의 뉴클레오티드 서열을 추가로 포함한다.
제2 측면의 몇몇 구현예에서, 홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주이다. 몇몇 구현예에서, 핵산 작제물은 Schwarz 균주인 홍역 바이러스를 추가로 포함한다.
본 발명의 제1 및 제2 측면의 핵산 작제물은 본 발명의 추가 측면에 포함될 수 있다
제3 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는, 재조합 홍역 바이러스(MV)의 구출(rescue)를 위한 전달 벡터를 제공한다. 몇몇 구현예에서, 전달 벡터는 하기로 이루어진 군으로부터 선택된 SARS-CoV-2의 폴리펩티드를 암호화하는 서열을 포함한다:
i. 서열번호 1 또는 2 또는 36 (작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii.
서열번호 16(작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii.
서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii.
서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii.
서열번호 64 (작제물 SMVoptΔF), 및
xxiii. 서열번호 66 (작제물 SMVopt2PΔF).
제4 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는 플라스미드 벡터를 제공하며, 여기서 플라스미드 벡터는 서열번호 29(pTM2-MVSchw-gfp, 또한 pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2로도 명명됨) 또는 서열번호 38(pTM3-MVSchw-gfp, 또한 pTM-MVSchw2-GFP 또는 pTM-MVSchwarz-ATU3로도 명명됨)이다.
제5 측면에서, 본 발명은 본 발명의 핵산 작제물을 포함하는 재조합 홍역 바이러스를 제공한다. 몇몇 구현예에서, 재조합 홍역 바이러스는 Schwarz 균주의 것이다. 몇몇 구현예에서, 재조합 홍역 바이러스는 이의 게놈에서 이에 작동가능하게 연결된 발현 카세트를 포함하고, 발현 카세트는 본 발명에 따른 핵산 작제물을 포함한다. 몇몇 구현예에서, 재조합 홍역 바이러스는 SARS-CoV-2 균주의 N, M, E, ORF7a, ORF8 및 ORF3a, 또는 이의 면역원성 단편으로부터 선택된 적어도 하나의 폴리펩티드를 추가로 발현한다.
제6 측면에서, 본 발명은 본 발명의 재조합 홍역 바이러스를 포함하는 면역원성 조성물 및 백신을 제공한다. 몇몇 구현예에서, 면역원성 조성물 또는 백신은 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는데 사용하기 위한 것이다. 몇몇 구현예에서, 면역원성 조성물 및 백신은 (i) 유효 용량의 본 발명의 재조합 홍역 바이러스, 및 (ii)약학적으로 허용되는 비히클을 포함하고, 여기서 조성물 또는 백신은 단일 면역화 후 동물 숙주에서 SARS-CoV-2의 폴리펩티드(들)에 대한 중화 체액 반응 및/또는 세포 반응을 유도한다. 몇몇 구현예에서, 면역원성 조성물 또는 백신은 이를 필요로 하는 숙주에서 SARS-CoV-2에 대한 보호 체액성 면역 반응 및/또는 세포성 면역 반응을 유도하는데 사용하기 위한 것이다.
제7 측면에서, 본 발명은 본 발명의 재조합 홍역 바이러스를 구출(rescuing)하는 방법을 제공한다. 이 방법은,
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를 (i) 본 발명에 따른 핵산 작제물 또는 본 발명에 따른 핵산 작제물을 포함하는 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하고;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 헬퍼 세포를 유지하고;
(c) (b)의 형질감염된 헬퍼 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키고;
(d) 재조합 홍역 바이러스를 수확하는 것을 포함한다.
제8 측면에서, 본 발명은 하기로 이루어진 군으로부터 선택된 폴리뉴클레오티드를 포함하는 핵산 분자를 제공한다:
i. 서열번호 1 또는 2 또는 36(작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii.
서열번호 16 (작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii.
서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii.
서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii.
서열번호 64 (작제물 SMVoptΔF),
xxiii. 서열번호 66 (작제물 SMVopt2PΔF),
xxiv.
서열번호 75 (작제물 SF-2P-dER), 및
xxv. 서열번호 81 (작제물 SF-2P-2a).
제9 측면에서, 본 발명은 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩티드를 제공한다:
i. 서열번호 3 (작제물 S);
ii. 서열번호 5 (작제물 stab-S);
iii. 서열번호 7 (작제물 Secto);
iv. 서열번호 9 (작제물 stab-Secto);
v. 서열번호 11 (작제물 S1),
vi. 서열번호 13 (작제물 S2),
vii. 서열번호 15 (작제물 stab-S2),
viii.
서열번호 17 (작제물 tri-Secto),
ix. 서열번호 19 (작제물 tristab-Secto),
x. 서열번호 43 (작제물 S3F),
xi. 서열번호 45 (작제물 S2P3F),
xii. 서열번호 47 (작제물 S2PΔF),
xiii.
서열번호 49 (작제물 S2PΔF2A),
xiv. 서열번호 22 (작제물 N),
xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
xvi. 서열번호 54 (작제물 S6P),
xvii.
서열번호 56 (작제물 S6P3F),
xviii. 서열번호 58 (작제물 S6PΔF),
xix. 서열번호 60 (작제물 SCCPP),
xx. 서열번호 62 (작제물 SCC6P),
xxi. 서열번호 65 (작제물 SMVoptΔF),
xxii.
서열번호 76 (작제물 SF-2P-dER), 및
xxiii. 서열번호 82 (작제물 SF-2P-2a).
제10 측면에서, 본 발명은 본 발명의 전달 벡터에 의해 발현되는 재조합 단백질을 제공한다. 재조합 단백질은 시험관내 또는 생체내에서 발현될 수 있다. 몇몇 구현예에서, 재조합 단백질은 정제를 위한 아미노산 태그를 추가로 포함한다.
제11 측면에서, 본 발명은 SARS-CoV-2 감염이 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62, 65, 76 및 82 중 어느 하나의 서열을 갖는 항원의 시험관내 용도를 제공하고, 여기서 폴리펩티드는 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
제12 측면에서, 본 발명은 생물학적 샘플을 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62, 65, 76, 및 82중 어느 하나의 아미노산 서열을 포함하는 폴리펩티드 또는 이의 면역원성 단편과 접촉시키고 생물학적 샘플에 존재하는 항체와 폴리펩티드 사이의 항체-항원 복합체의 형성을 검출하는 것을 포함하는 방법을 제공한다. 몇몇 구현예에서, 생물학적 샘플은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 수득된다.
제13 측면에서, 본 발명은 본 발명에 따른 면역원성 조성물 또는 백신을 대상체에게 투여하는 것을 포함하는, 대상체(예를 들어, 인간 숙주)에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법을 제공한다. 또한, 본 발명에 따른 면역원성 조성물 또는 백신을 대상체에게 투여하는 것을 포함하는, 대상체(예를 들어, 인간 숙주)에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법이 제공된다. 감염을 치료 또는 예방하거나 면역 반응을 유도하는 방법의 몇몇 구현예에서, 방법은 면역원성 조성물 또는 백신의 1차 투여 및 면역원성 조성물 또는 백신의 2차 투여를 포함한다. 몇몇 구현예에서, 2차 투여는 1차 투여 후 1 내지 2개월에 수행된다.
도 1: 플라스미드 pKP-MVSchw(17858bp)의 제한 지도.
도 2: SARS-CoV-2 스파이크 단백질의 기본 구조 및 돌연변이 위치의 개략도. 스파이크 단백질은 푸린 절단 부위에 의해 분리된 2개의 하위 도메인인 S1 및 S2로 구성된다. S2 도메인에는, heptad 반복부 1(HR1), 중심 나선(CH), 연결 도메인(CD), heptad 반복부 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)가 도시되어 있다. 설명된 돌연변이의 위치는 화살표를 사용하여 표시된다. 전장 단백질을 안정화시키기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685). 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 잠재적으로 세포 표면 발현을 향상시키기 위한 소포체 회수(retrieval) 신호의 돌연변이(K1269A+H1271A).
도 3a 내지 도 3c: 재조합 MV 벡터의 SARS-CoV-2 스파이크 작제물의 개략도. 도 3a. S 단백질 및 변형 위치의 단순화된 개략도. 도 3b/3c. SARS-CoV-2 스파이크의 합성 서열은 MV 벡터의 ATU3(3B) 또는 ATU2(3C) 위치에 클로닝되었다. ATU3의 모든 작제물(construct)은 전장의 막 결합 S 단백질(서열번호 2)의 완전한 인간 코돈 최적화 서열을 기반으로 한다. ATU2의 모든 작제물은 홍역-최적화된 서열(MVopt, 서열번호 36)을 기반으로 한다. 서로 다른 작제물에서 S 단백질의 변형이 표시되고 해당하는 구출된(rescued) 바이러스의 이름이 표시된다. MV 단백질은 하기와 같이 표시된다: N(핵단백질), P(인단백질), M(기질), F(융합 단백질), H(혈구응집소), L(대형 단백질), T7 RNA 폴리머라제 프로모터(T7), T7 RNA 폴리머라제터미네이터(T7t), 해머 헤드 리보자임(hh), 델타 간염 바이러스 리보자임(hδh).
도 4a 내지 도 4b: 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S 검출. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었더나 감염되지 않았다(NI). 감염 후 39시간에 총 세포 추출물을 제조하고 NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고 PVDF 멤브레인으로 옮기고 항-SARS-CoV-1 스파이크 다클론 토끼 항체로 검출했다(Escriou 등, Virology, 2014), AlexaFluor 680 결합 항토끼 항체 및 NearIR 이미지. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 5a 및 도 5b: 다양한 재조합 MV의 비교 융합성 특성. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었다. 감염 후 39시간에, 세포 단층이 관찰되었고 융합된 세포 영역이 표시되었다.
도 6a 및 도 6b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 항체 반응은 프라임(그래프의 왼쪽 부분) 또는 부스트(그래프의 오른쪽 부분) 후에 수집된 혈청에서 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)에 의해 측정되었다. 막대는 중앙값을 표시한다. 항-MV ELISA에서 검출 한계(점선)는 50 ELISA 유닛이었다. 항-S ELISA에 대한 검출 한계는 부스트 후에 수집된 혈청의 경우 200 ELISA 단위였으며 다른 모든 분석에서는 50 ELISA 단위였다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다.
도 7a 및 도 7b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 SARS-CoV-2 미세중화 역가. A. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 중화 역가는 프라임(그래프의 왼쪽 부분) 또는 프라임/부스트(그래프의 오른쪽 부분) 면역화 후 미세중화 분석에 의해 측정되었으며, 세포변성 효과에 의해 득점된 50% SARS-CoV-2 감염성의 중화를 초래하는 혈청 희석의 역수로 표현되었다. 막대는 중앙값을 표시한다. 검출 한계는 역가 20이었다. 중화 활성을 검출할 수 없는 샘플에는 검출 한계의 절반과 동일한 10의 값이 할당되었다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다. B. 미량중화 분석에서 연구 시약 20/118(4개의 회복기 인간 혈청인 20/120,122,124,126 및 대조군 인간 혈청인 128으로 구성된 패널) 및 NIBSC(National Institute of Biological Standards and Controls)에 의해 제공된 20/130의 평가는 다른 분석과 결과를 비교할 수 있었다. 연구 시약은 MV-ATU3-S2PΔF를 이용한 2차 면역 후에 얻은 혈청 풀(S2PF-IS2 pool)과 함께 중화 분석에서 서로 다른 날짜에서 4번 측정되었다. 동일한 SARS-CoV-2 균주의 두 가지 다른 스톡(C2 및 C3.4)이 사용되었다. 분석에 사용된 역적정 SARS-CoV-2 TCID50이 도시된다. NIBSC에서 제공한 결과는 비교를 위해 나열되며, 세포변성 효과(CPE) 또는 플라크 분석(PRNT50)에 의해 점수가 매겨진 바이러스 감염성을 50% 억제한 혈청 희석액의 역수로 표시된다.
도 8: 부스트 면역화 후 면역화된 마우스에서 MV 및 S-특이적 IFN-γ T 세포. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 3주 간격으로 2회 면역화시켰다. S 단백질(S1, S2)에 걸쳐 있는 펩티드 풀 또는 2개의 특정 홍역 펩티드 풀로 자극된 비장세포에서 IFN-γ ELISpot 반응(스팟 형성 단위, SPU)의 합계가 도시된다. 막대는 중앙값을 표시한다.
도 9a 내지 도 9c: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화된 마우스에서의 MV 및 S-특이적 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF), MV-ATU3-S2PΔF2A (S2PΔF2A) 또는 모체 MV Schwarz(Schw)로 면역화시켰다. 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(B)가 S1에 걸친 펩티드 풀에 반응하여 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13을 생성하는 빈도 또는 SARS-CoV-2 스파이크 단백질의 S2 도메인은 누적되어 도시되어 있다(S1 및 S2 풀에 대한 합산된 반응). MV에 대한 INF-γ/TNF-α 또는 IL-5/IL-13 CD8+ T 세포 반응(2개의 H-2b 클래스 I - 제한된 홍역 펩티드의 풀)은 패널 C에 도시되어 있다.
도 10a 내지 도 10d: MV-ATU3-S2PΔF2A로 면역화된 마우스에서 MV 및 S-특이적 이중 및 단일 사이토카인-양성 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 면역화시켰다. SARS-CoV-2 스파이크 단백질의 S1 또는 S2 도메인에 걸쳐 있는 펩티드 풀에 반응하여 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(C)에서 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13(각각 이중 양성 세포)을 생산하는 빈도는 누적되어 도시되어 있다(S1 및 S2 풀에 대한 반응 합계). 또한, MV 백본에 대한 T 세포 반응을 평가하기 위해 2개의 H-2b 클래스 I - 제한된 홍역 펩티드 풀을 사용했다. S 펩티드 풀에 반응하여 CD4+ T 세포(B) 또는 CD8+ T 세포(D)를 생성하는 단일 사이토카인의 빈도는 TNF-α 생산 CD4+ T 세포를 제외하고, MV-ATU3-S2PΔF2A 또는 MVSchw 대조군으로 면역화된 마우스에서 유의하게 다르지 않았다(ns). 통계적 분석은 Mann-Whitney test를 이용하여 수행하였다(** p≤0.005, * p≤0.05).
도 11a 내지 도 11d: SARS-CoV-2를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 IgG1 및 IgG2a 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. A. ELISA로 측정한 SARS-CoV-2 스파이크에 대한 동형 특이적(IgG1 및 IgG2a) 항체 반응. 막대는 중앙값을 표시한다. 검출 한계는 50 ELISA 단위였다. B/D. 각 작제물/면역원에 대해 계산된 IgG2a 대 IgG1의 비율. C. 대조 실험은 HEK293 세포(T4S2P3F-8H)에서 발현된 명반-아주반트가 첨가된 삼량체화된 스파이크 엑토도메인으로 wt 129/Sv 마우스를 면역화시켜 수행하였다.
도 12a 및 도 12b: 프라임 및 부스트(A) 또는 단일(B) 면역화 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. A. 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), MV-AUT3-S2P(S2P), MV-ATU3-S2PΔF(S2PΔF) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 4주 간격으로 2회 면역화되었다. 혈액 샘플은 2차 면역화 20일 후에 채취하고 각각의 중화 역가(μNT)를 측정했다. 마우스에 추가 면역화 25일 후에 Ad5:hACE2를 주입하고 4일 후에 SARS-CoV-2로 챌린지(challenge)했다. B. 마우스를 모체 MV Schwarz 균주(Schw) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 165일에 혈액 샘플을 채취하고 μNT 역가를 측정하였다. 173일째에 마우스에 Ad5:hACE2 25를 주입하고 4일 후에 챌린지했다. 두 실험 모두에서, 챌린지 4일 후에 폐를 채취했다. 폐 바이러스 부하은 게놈 등가물(GEQ)의 RNA 수준 또는 폐당 플라크 형성 단위(PFU)의 감염 역가에 대하여 측정하였다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석(A) 또는 Mann-Whitney 테스트(B)와 함께 비모수 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005, **** p<0.0001. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 13a 내지 도 13b: ATU2 및 ATU3 작제물에서 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S의 검출. Vero 세포는 MOI=1에서 (A) 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S)의 4개의 상이한 클론(1 내지 4), 또는 MV-ATU2-SMVopt(SMVopt)의 6개의 상이한 클론(1 내지 6), 및 (B) 모체 MV Schwarz 균주(Schw), MV-ATU2-SMVopt(SMVopt)의 하나의 대표적인 클론, MV-ATU3-S2P(S2P), MV-ATU3-S2P3F(S2P3F), MV-ATU3-S2PΔF(S2PΔF), 또는 MV-ATU2-SMVopt2P(SMVopt2P), MV-ATU2-SMVoptΔF(SMVoptΔF), MV-ATU2-SMVopt2PΔF(SMVopt2PΔF)의 2개의 상이한 클론으로 감염시켰다. 단백질 세포 추출물은 감염 후 24시간에 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체인 AlexaFluor 680-접합된 항-토끼 항체 및 NearIR 이미징으로 검출했다. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 14a 내지 도 14c: ATU2 또는 ATU3에서 SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화한 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B) 및 미세중화 역가(C)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), 또는 MV-ATU2-SMVopt(SMVopt)로 면역화시켰다. 프라임 또는 부스트 후에 수집된 혈청의 항체 반응은 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)로 측정되었으며, 중화 항체는 미세중화 분석(C)으로 측정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다.
도 15: 6P-안정화된 SARS-CoV-2 스파이크를 발현하는 재조합 MV Schwarz의 시험관내 및 생체내 평가.
Vero 세포는 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2PΔF 또는 MV-AUT3-S6P(2개의 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체 AlexaFluor 680-접합 항-토끼 항체 및 NearIR 이미징(A, 상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(A, 하부 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
IFNAR-KO 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P), MV-AUT3-S2PF(S2PΔF) 또는 MV-ATU3-S6P(S6P)로 4주 간격으로 두 번 면역화시켰다. 홍역 특이적 ELISA(B), SARS-CoV-2 스파이크 특이적 ELISA(C) 및 SARS-CoV-2 미세중화 분석(μNT, D)에 의해 프라임 또는 부스트 후 3주에 수집된 혈청에서 항체 반응을 측정했다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐(E)당 RNA 수준(GEQ)으로 결정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. GEQ 역가 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 16: 재조합 MV에 의해 암호화되는 S 및 다양한 돌연변이된 S 단백질의 융합 특성의 비교 분석. HEK-293T-GFP10 세포를 플라스미드로 형질감염시켜 S(wt-S), S2P(S-2P), S3F(S-3F), S2P3F(S-2PΔ3F) 또는 S2PF(S-2PΔF)의 일시적 발현을 가능하게 하고, hACE2 발현 플라스미드로 형질감염된 HEK-293T-GFP11 세포와 공동 배양하여, 문헌[Buchrieser 등 (2020)]에서 S에 대해 설명된 분석법에 따라 두 세포 하위 집단 간에 융합이 발생하는 경우 GFP 활성을 재구성할 수 있도록 하였다. 음성(neg, mock-transfected) 및 양성(pos, 높은 수준에서 S를 발현하는 플라스미드로 형질전환됨) 대조군이 포함되었다. 세포 시트의 이미지를 형질감염 후 18시간에 기록하였다. 융합 비율은 세포 면적당 GFP 면적으로 점수를 매기고 이미지 아래에 그래프에 표시했다.
도 17: 프라임만 면역화한 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 3주에 혈액 샘플을 채취하고 홍역 특이적 ELISA(A), SARS-CoV-2 스파이크 특이적 ELISA(B) 및 SARS-CoV-2 미세중화 분석(μNT, C)에 의해 항체 반응을 측정했다. 면역화 후 24주에 마우스에 Ad5:hACE를 주입하고 4일 후에 챌린지하였다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐당 RNA 수준(GEQ) 또는 감염 역가(PFU)로 결정하였다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 중요성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 18: 동종삼량체로의 효율적인 분비 및 조립을 위한 SARS-CoV-2 스파이크 엑토도메인 작제물의 최적화. (A). Ser-Gly-Gly 연결 링커 DLGN Twin-strep-tag (Strep Tag)를 통해 C-말단에서 foldon(T4 또는 GCN4)에 융합된 S의 전장 엑토도메인에 해당하는 스파이크(tri-Secto)의 분비되고 삼량체화된 형태의 개략도. 신호 펩티드, 서브도메인 S1 및 S2, 푸린 절단 부위, 융합 펩티드, 헵타드(heptad) 반복부(HR) 1 및 2 및 커넥터 도메인(CD)의 위치가 표시되어 있다. 텍스트에 설명된 돌연변이의 위치는 개략도 아래에 화살표를 사용하여 표시되어 있다. 작제물은 돌연변이 및 폴돈의 조합에 따라 명명되었다. 예를 들어, T4-S2P3F는 2P 및 3F 돌연변이 및 T4 피브리틴 폴돈을 겸비했다. 전장 단백질을 안정화하기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685); 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 삼량체화 폴돈: T4 또는 GCN4(B). HEK 293T 세포는 표시된 pCI-Spike_ectomain 플라스미드 DNA로 일시적으로 형질감염되거나(패널의 오른쪽 부분, 분비된 엑토도메인에 대한 foldon T4 또는 GCN4가 표시됨) 대조군으로서, 스파이크의 전체 길이 변이체(패널의 왼쪽 부분, 전체 길이 막 고정(mb) 스파이크)를 암호화하는 pCI-S2P, pCI-S2PF 및 pCI-S3F 플라스미드 DNA 로 형질감염되었다. 상청액을 형질감염 후 48시간에 수집하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-접합 항-토끼 항체 및 근적외선 이미징으로 검출했다. 분자량 마커의 위치(kDa)가 도시되어 있다. (C). T4-S2P3F, GCN4-S2P3F 및 T4-S2P 폴리펩티드는 Superdex200 컬럼에서 크기 배제 크로마토그래피에 의해 분리되었다. 용리 프로파일은 280nm(mAU)에서의 흡광도에 의해 기록되었다.
도 19: MV-ATU3-T4-S2P3F 감염된 세포의 상청액에서 SARS-CoV-2 스파이크 엑토도메인의 검출. Vero 세포는 0.05의 MOI에서 MV-ATU3-S2P3F, MV-ATU3-Secto, MV-ATU3-T4-S2P3F(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 감염시키거나 감염시키지 않았다(NI). 상층액(상단 패널)을 수집하고, 감염 후 39시간에 총 세포 추출물(중간 패널)을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 멤브레인으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-결합 항토끼 항체 및 근적외선 이미징으로 검출했다. 총 세포 추출물에 대한 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(하단 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질/엑토도메인, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 되시되어 있다.
도 20: ATU2-N 및 ATU2-NMVopt 바이러스에 감염된 세포의 용해물에서 SARS-CoV-2 N의 발현 수준. Vero 세포는 MV-ATU2-N(4개 바이러스 클론), MV-ATU2-NMVopt(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 핵단백질 다클론 토끼 항체, AlexaFluor 680-접합된 항-토끼 항체 및 근적외선 이미징(상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)를 사용하여 MV N 단백질을 검출하였다(하부 패널). SARS-CoV-2 핵단백질, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 21 . SARS-CoV-2의 고유 S 단백질 개략도. 천연 S 단백질의 길이는 1273개 아미노산(aa)이다. 단백질은 푸린 절단 부위(F)에서 절단에 의해 생성된 2개의 서브유닛인 S1 및 S2를 포함한다. S1은 신호 펩티드(SP), N-말단 도메인(NTD) 및 수용체 결합 도메인(RBD)을 포함한다. S2는 융합 펩티드(FP), 헵타드 반복 1(HR1) 및 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)를 포함한다. 2P는 두 개의 돌연변이된 프롤린인 K986P와 V987P를 나타낸다. 문자 KLHYT는 CT에서 서열번호 149의 소포체 검색 신호(ERRS) 모티프 KxHxx를 나타낸다. dER은 CT에서 11개의 C-말단 아미노산이 결실된 작제물을 나타낸다.
도 22a 내지 도 22d . S 유전자 작제물의 개략도 및 S-발현 rMV의 특성 규명. a 주목할만한 도메인이 있는 SARS-CoV-2의 고유 S 유전자는 MV 벡터에 클로닝된 S 유전자 구조와 관련하여 도시되어 있다. 2P 및 dER 변형도 도시되어 있다. 모든 S 작제물은 MV 벡터 플라스미드인 pTM-MVSchwarz(MV Schwarz)의 두 번째(ATU2) 또는 세 번째(ATU3) 추가 전사 단위에 클로닝되었다. MV 게놈은 핵단백질(N), 인단백질(P), V 및 C 부속 단백질, 기질(M), 융합체(F), 혈구응집소(H) 및 폴리머라제(L) 유전자를 포함한다. 플라스미드 요소에는 T7 RNA 폴리머라제 프로모터(T7), 해머헤드 리보자임(hh), 델타 간염 바이러스 리보자임(δ) 및 T7 RNA 폴리머라제 터미네이터(T7t)가 포함된다. b 0.1의 MOI에서 Vero 세포를 감염시키는데 사용되는 rMV 작제물의 성장 동역학. 세포 관련 바이러스 역가는 TCID50/ml로 표시된다. c 2P 돌연변이가 있거나 없는 ATU2 또는 ATU3의 Sf-dER 또는 S2-dER을 발현하는 rMV로 감염된 Vero 세포의 세포 용해물에서 SARS-CoV-2 S 단백질의 웨스턴 블롯 분석. d 감염 24시간 후 표시된 rMV로 감염된 Vero 세포의 면역형광 염색. 투과되거나 투과되지 않은 세포는 S, MV N 및 핵에 대해 염색되었다.
도 23a 내지 23f . 프라임-부스트 백신접종에 의한 체액성 반응의 유도. a IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)의 상동 프라임-부스트는 0일과 28일에 표시된 rMV의 1x105 TCID50으로 복강내 면역화하였다. 면역화 28일 및 42일 후에 혈청을 수집하고 b MV 항원 또는 c S-SARS-CoV-2 S에 대한 특이적 항체 반응을 평가했다. 데이터는 개별 동물을 나타내는 각 데이터 포인트와 함께 상호 종말점 희석 역가(reciprocal endpoint dilution titer)를 보여준다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e 1차 면역화 후 4주째에 마우스에서 S-특이적 항체 반응의 IgG 서브클래스. f IgG2a/IgG1 또는 Th1/Th2 반응의 비율. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시된다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(** p<0.01 및 **** p<0.001)를 나타낸다.
도 24a 내지 도 24d. rMV 백신접종에 의한 S-특이적 세포 반응의 유도. a 표시된 rMV의 1x105 TCID50으로 복강내 면역화된 IFNAR -/- 마우스의 면역화(빈 MV 대조군의 경우 n=12 또는 n=3). 면역화 7일 후, 새로 추출된 비장세포에서 IFN-γ에 대한 ELISPOT을 수행했다. 데이터는 CD8+ 또는 CD4+ T 세포에 특이적인 b MV Schwarz 또는 c SARS-CoV-2 S 펩티드 풀로 자극한 후 검출된 1x106 비장세포당 IFN-γ 분비 세포 또는 반점 형성 세포(SFC)로 표시된다. d MV Schwarz에 의해 자극된 세포에 대한 CD4+ 또는 CD8+ 펩티드에 의해 자극된 IFNγ-분비 세포의 비율. 각 데이터 포인트는 개별 마우스를 나타낸다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 25a 및 도 25b . T 세포의 사이토카인 발현 프로필. 표시된 rMV의 1x105 TCID50으로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(빈 MV 대조군의 경우 n=12 또는 n=3) 및 비장세포를 S-특이적 펩티드 풀로 자극하였다. S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα 및 IL-5에 대해 염색하였다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 26a 내지 도 26f. 중화 항체 및 면역 보호의 지속성. a IFNAR -/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물을 0일 및 28일에 상동 프라임-부스트에 의해 복강내 면역화시켰다. 혈청을 52일, 72일 및 110일에 수집하였다. 동물은 110일째에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c SARS-CoV-2 S에 대한 특정 항체의 수준에 대해 평가하였다. d SARS-CoV-2 바이러스에 대한 중화 항체 반응은 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현하였다. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출하였으며, 카피/폐로 계산하였다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 27a 내지 도 27g . 단일 예방 접종 후 면역 반응 및 보호. a IFNAR-/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물은 0일에 복강내 면역화하였다. 혈청은 24일 및 48일에 수집하였다. 동물은 48일에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c S-SARS-CoV-2 단백질에 대한 특이적 항체의 수준에 대해 평가되었다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출되었으며, 카피/폐로 계산되었다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 항체 반응에 대한 통계적 유의성(상단 패널)은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 나머지 데이터(하단 패널)는 Mann-Whitney U-test로 분석되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 28 . 형질감염된 HEK293T 세포의 표면에서 SARS-CoV-2 S 항원의 발현. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합된 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의(mock) 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
도 29 . 형질감염된 Vero 세포에서 S 단백질 매개 신시튬(syncytium) 형성. SARS-CoV-2 S 단백질을 암호화하는 pcDNA 발현 벡터로 형질감염된 Vero 세포의 이미지를 형질감염 24시간 후에 획득했다. 상단 이미지는 천연 형태 S 항원을 암호화하는 플라스미드로 형질감염된 Vero 세포를 보여주는 반면, 하단 이미지는 융합전 안정화 S 항원으로 형질감염된 세포 및 형질감염되지 않은 대조 Vero 세포를 보여준다. 회색 선은 syncytia의 경계를 나타낸다. 천연(native) SF는 손상되지 않은 CT가 있는 천연 형태의 전장 S 단백질을 나타낸다.
도 30 . 재조합 MV 백신으로 감염된 Vero 세포에서 세포내 S 단백질 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3-결합 염소 항-토끼 IgG를 사용하여 사포닌 투과성 세포에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화되었다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 31 . 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 표면 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3 결합 염소 항토끼 IgG를 사용하여 비투과성 세포 표면에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화하였다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 32 . 연속 계대 유래의 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 발현의 웨스턴 블롯 분석. SF-dER 또는 SF-2P-dER 항원을 발현하는 MV ATU2 백신은 P1에서 P10까지 Vero 세포에서 연속적으로 계대되었고 S 단백질 발현은 P1, P5 및 P10 세포 용해물의 면역블롯팅에 의해 측정되었다. 빈 MV로 감염된 Vero 세포를 병렬로 검사하고 음성 대조군으로 사용했다.
도 33A 내지 도 33C . 1x10 5 TCID 50 의 MV-ATU2-SF-2P-dER 또는 빈 MV로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(대조군 빈 MV 그룹의 경우 n=5 또는 n=3)에서 평가된 T 세포의 사이토카인 발현 프로파일. S-특이적 CD4 또는 CD8 펩티드로 비장세포를 자극하였다(표 6A 및 표 6B). S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα, IL-5 및 IL13에 대해 염색하였다. c S-특이적 CD4+ 메모리 T 세포를 세포내 IL-5 및 IL13에 대해 염색하였다. 별표(*)는 다중 비교 테스트를 통해 Kruskal-Wallis ANOVA에 의해 결정된 유의한 평균 차이(* p<0.05)를 나타낸다.
도 34A 내지 도 34C . 용량 의존적 상동 프라임-부스트 면역. IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)를 0일 및 28일에 1x105 TCID50 또는 1x104 TCID50에서 표시된 rmV 백신 후보로 복강내 면역화시켰다. 면역화 후 28일 및 50일 에 혈청을 수집하고, a MV 항원 또는 b SARS-CoV-2 S 단백질에 대한 특이적 항체 반응을 평가했다. 데이터는 각 데이터 포인트가 개별 동물을 나타내는 상호 종말점 희석 역가를 보여준다. c 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(*p<0.05, **p<0.01 및 ****p<0.001).
도 35. SARS-CoV-2의 S 단백질을 발현하는 pCDNA로 형질감염된 HEK293T 세포의 FACS 분석. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
도 2: SARS-CoV-2 스파이크 단백질의 기본 구조 및 돌연변이 위치의 개략도. 스파이크 단백질은 푸린 절단 부위에 의해 분리된 2개의 하위 도메인인 S1 및 S2로 구성된다. S2 도메인에는, heptad 반복부 1(HR1), 중심 나선(CH), 연결 도메인(CD), heptad 반복부 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)가 도시되어 있다. 설명된 돌연변이의 위치는 화살표를 사용하여 표시된다. 전장 단백질을 안정화시키기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685). 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 잠재적으로 세포 표면 발현을 향상시키기 위한 소포체 회수(retrieval) 신호의 돌연변이(K1269A+H1271A).
도 3a 내지 도 3c: 재조합 MV 벡터의 SARS-CoV-2 스파이크 작제물의 개략도. 도 3a. S 단백질 및 변형 위치의 단순화된 개략도. 도 3b/3c. SARS-CoV-2 스파이크의 합성 서열은 MV 벡터의 ATU3(3B) 또는 ATU2(3C) 위치에 클로닝되었다. ATU3의 모든 작제물(construct)은 전장의 막 결합 S 단백질(서열번호 2)의 완전한 인간 코돈 최적화 서열을 기반으로 한다. ATU2의 모든 작제물은 홍역-최적화된 서열(MVopt, 서열번호 36)을 기반으로 한다. 서로 다른 작제물에서 S 단백질의 변형이 표시되고 해당하는 구출된(rescued) 바이러스의 이름이 표시된다. MV 단백질은 하기와 같이 표시된다: N(핵단백질), P(인단백질), M(기질), F(융합 단백질), H(혈구응집소), L(대형 단백질), T7 RNA 폴리머라제 프로모터(T7), T7 RNA 폴리머라제터미네이터(T7t), 해머 헤드 리보자임(hh), 델타 간염 바이러스 리보자임(hδh).
도 4a 내지 도 4b: 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S 검출. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었더나 감염되지 않았다(NI). 감염 후 39시간에 총 세포 추출물을 제조하고 NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고 PVDF 멤브레인으로 옮기고 항-SARS-CoV-1 스파이크 다클론 토끼 항체로 검출했다(Escriou 등, Virology, 2014), AlexaFluor 680 결합 항토끼 항체 및 NearIR 이미지. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 5a 및 도 5b: 다양한 재조합 MV의 비교 융합성 특성. Vero 세포는 0.05의 MOI에서 A) MV-ATU3-S, 또는 B) MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 또는 MV-ATU3-S2PΔF2A, 또는 모체 MV Schwarz 균주(MVSchw)로 감염되었다. 감염 후 39시간에, 세포 단층이 관찰되었고 융합된 세포 영역이 표시되었다.
도 6a 및 도 6b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 항체 반응은 프라임(그래프의 왼쪽 부분) 또는 부스트(그래프의 오른쪽 부분) 후에 수집된 혈청에서 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)에 의해 측정되었다. 막대는 중앙값을 표시한다. 항-MV ELISA에서 검출 한계(점선)는 50 ELISA 유닛이었다. 항-S ELISA에 대한 검출 한계는 부스트 후에 수집된 혈청의 경우 200 ELISA 단위였으며 다른 모든 분석에서는 50 ELISA 단위였다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다.
도 7a 및 도 7b: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 SARS-CoV-2 미세중화 역가. A. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. 중화 역가는 프라임(그래프의 왼쪽 부분) 또는 프라임/부스트(그래프의 오른쪽 부분) 면역화 후 미세중화 분석에 의해 측정되었으며, 세포변성 효과에 의해 득점된 50% SARS-CoV-2 감염성의 중화를 초래하는 혈청 희석의 역수로 표현되었다. 막대는 중앙값을 표시한다. 검출 한계는 역가 20이었다. 중화 활성을 검출할 수 없는 샘플에는 검출 한계의 절반과 동일한 10의 값이 할당되었다. 두 개 이상의 독립적인 실험의 대표적인 결과가 도시되어 있다. B. 미량중화 분석에서 연구 시약 20/118(4개의 회복기 인간 혈청인 20/120,122,124,126 및 대조군 인간 혈청인 128으로 구성된 패널) 및 NIBSC(National Institute of Biological Standards and Controls)에 의해 제공된 20/130의 평가는 다른 분석과 결과를 비교할 수 있었다. 연구 시약은 MV-ATU3-S2PΔF를 이용한 2차 면역 후에 얻은 혈청 풀(S2PF-IS2 pool)과 함께 중화 분석에서 서로 다른 날짜에서 4번 측정되었다. 동일한 SARS-CoV-2 균주의 두 가지 다른 스톡(C2 및 C3.4)이 사용되었다. 분석에 사용된 역적정 SARS-CoV-2 TCID50이 도시된다. NIBSC에서 제공한 결과는 비교를 위해 나열되며, 세포변성 효과(CPE) 또는 플라크 분석(PRNT50)에 의해 점수가 매겨진 바이러스 감염성을 50% 억제한 혈청 희석액의 역수로 표시된다.
도 8: 부스트 면역화 후 면역화된 마우스에서 MV 및 S-특이적 IFN-γ T 세포. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 3주 간격으로 2회 면역화시켰다. S 단백질(S1, S2)에 걸쳐 있는 펩티드 풀 또는 2개의 특정 홍역 펩티드 풀로 자극된 비장세포에서 IFN-γ ELISpot 반응(스팟 형성 단위, SPU)의 합계가 도시된다. 막대는 중앙값을 표시한다.
도 9a 내지 도 9c: SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화된 마우스에서의 MV 및 S-특이적 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF), MV-ATU3-S2PΔF2A (S2PΔF2A) 또는 모체 MV Schwarz(Schw)로 면역화시켰다. 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(B)가 S1에 걸친 펩티드 풀에 반응하여 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13을 생성하는 빈도 또는 SARS-CoV-2 스파이크 단백질의 S2 도메인은 누적되어 도시되어 있다(S1 및 S2 풀에 대한 합산된 반응). MV에 대한 INF-γ/TNF-α 또는 IL-5/IL-13 CD8+ T 세포 반응(2개의 H-2b 클래스 I - 제한된 홍역 펩티드의 풀)은 패널 C에 도시되어 있다.
도 10a 내지 도 10d: MV-ATU3-S2PΔF2A로 면역화된 마우스에서 MV 및 S-특이적 이중 및 단일 사이토카인-양성 CD4+ 및 CD8+ T 세포 반응. 마우스를 MV-ATU3-S2PΔF2A(S2PΔF2A) 또는 모체 MV Schwarz(MVSchw)로 면역화시켰다. SARS-CoV-2 스파이크 단백질의 S1 또는 S2 도메인에 걸쳐 있는 펩티드 풀에 반응하여 비장 CD4+ T 세포(A) 또는 CD8+ T 세포(C)에서 Th1 특징적인 사이토카인 IFN-γ 및 TNF-α 또는 Th2 특징적인 사이토카인 IL-5 및 IL-13(각각 이중 양성 세포)을 생산하는 빈도는 누적되어 도시되어 있다(S1 및 S2 풀에 대한 반응 합계). 또한, MV 백본에 대한 T 세포 반응을 평가하기 위해 2개의 H-2b 클래스 I - 제한된 홍역 펩티드 풀을 사용했다. S 펩티드 풀에 반응하여 CD4+ T 세포(B) 또는 CD8+ T 세포(D)를 생성하는 단일 사이토카인의 빈도는 TNF-α 생산 CD4+ T 세포를 제외하고, MV-ATU3-S2PΔF2A 또는 MVSchw 대조군으로 면역화된 마우스에서 유의하게 다르지 않았다(ns). 통계적 분석은 Mann-Whitney test를 이용하여 수행하였다(** p≤0.005, * p≤0.05).
도 11a 내지 도 11d: SARS-CoV-2를 발현하는 재조합 MV로 프라임 및 부스트 면역화 후 IFNAR-KO 마우스에서 IgG1 및 IgG2a 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S), MV-AUT3-S2P (S2P), MV-ATU3-S2P3F (S2P3F), MV-ATU3-S2PΔF (S2PΔF) or MV-ATU3-S2PΔF2A (S2PΔF2A)로 면역화시켰다. A. ELISA로 측정한 SARS-CoV-2 스파이크에 대한 동형 특이적(IgG1 및 IgG2a) 항체 반응. 막대는 중앙값을 표시한다. 검출 한계는 50 ELISA 단위였다. B/D. 각 작제물/면역원에 대해 계산된 IgG2a 대 IgG1의 비율. C. 대조 실험은 HEK293 세포(T4S2P3F-8H)에서 발현된 명반-아주반트가 첨가된 삼량체화된 스파이크 엑토도메인으로 wt 129/Sv 마우스를 면역화시켜 수행하였다.
도 12a 및 도 12b: 프라임 및 부스트(A) 또는 단일(B) 면역화 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. A. 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), MV-AUT3-S2P(S2P), MV-ATU3-S2PΔF(S2PΔF) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 4주 간격으로 2회 면역화되었다. 혈액 샘플은 2차 면역화 20일 후에 채취하고 각각의 중화 역가(μNT)를 측정했다. 마우스에 추가 면역화 25일 후에 Ad5:hACE2를 주입하고 4일 후에 SARS-CoV-2로 챌린지(challenge)했다. B. 마우스를 모체 MV Schwarz 균주(Schw) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 165일에 혈액 샘플을 채취하고 μNT 역가를 측정하였다. 173일째에 마우스에 Ad5:hACE2 25를 주입하고 4일 후에 챌린지했다. 두 실험 모두에서, 챌린지 4일 후에 폐를 채취했다. 폐 바이러스 부하은 게놈 등가물(GEQ)의 RNA 수준 또는 폐당 플라크 형성 단위(PFU)의 감염 역가에 대하여 측정하였다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석(A) 또는 Mann-Whitney 테스트(B)와 함께 비모수 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005, **** p<0.0001. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 13a 내지 도 13b: ATU2 및 ATU3 작제물에서 세포 용해물에서 웨스턴 블롯에 의한 SARS-CoV-2 S의 검출. Vero 세포는 MOI=1에서 (A) 모체 MV Schwarz 균주(Schw), MV-ATU3-S (S)의 4개의 상이한 클론(1 내지 4), 또는 MV-ATU2-SMVopt(SMVopt)의 6개의 상이한 클론(1 내지 6), 및 (B) 모체 MV Schwarz 균주(Schw), MV-ATU2-SMVopt(SMVopt)의 하나의 대표적인 클론, MV-ATU3-S2P(S2P), MV-ATU3-S2P3F(S2P3F), MV-ATU3-S2PΔF(S2PΔF), 또는 MV-ATU2-SMVopt2P(SMVopt2P), MV-ATU2-SMVoptΔF(SMVoptΔF), MV-ATU2-SMVopt2PΔF(SMVopt2PΔF)의 2개의 상이한 클론으로 감염시켰다. 단백질 세포 추출물은 감염 후 24시간에 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체인 AlexaFluor 680-접합된 항-토끼 항체 및 NearIR 이미징으로 검출했다. 로딩 대조군으로 항-MV 핵단백질 다클론 토끼 항체(Covalab)를 사용하여 홍역의 N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 14a 내지 도 14c: ATU2 또는 ATU3에서 SARS-CoV-2 스파이크를 발현하는 재조합 MV로 면역화한 후 IFNAR-KO 마우스에서 홍역(A) 및 SARS-CoV-2 S(B) 및 미세중화 역가(C)에 대한 항체 반응. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S(S), 또는 MV-ATU2-SMVopt(SMVopt)로 면역화시켰다. 프라임 또는 부스트 후에 수집된 혈청의 항체 반응은 홍역 특이적 ELISA(A) 및 SARS-CoV-2 스파이크 특이적 ELISA(B)로 측정되었으며, 중화 항체는 미세중화 분석(C)으로 측정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다.
도 15: 6P-안정화된 SARS-CoV-2 스파이크를 발현하는 재조합 MV Schwarz의 시험관내 및 생체내 평가.
Vero 세포는 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2PΔF 또는 MV-AUT3-S6P(2개의 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체 AlexaFluor 680-접합 항-토끼 항체 및 NearIR 이미징(A, 상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(A, 하부 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
IFNAR-KO 마우스는 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P), MV-AUT3-S2PF(S2PΔF) 또는 MV-ATU3-S6P(S6P)로 4주 간격으로 두 번 면역화시켰다. 홍역 특이적 ELISA(B), SARS-CoV-2 스파이크 특이적 ELISA(C) 및 SARS-CoV-2 미세중화 분석(μNT, D)에 의해 프라임 또는 부스트 후 3주에 수집된 혈청에서 항체 반응을 측정했다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐(E)당 RNA 수준(GEQ)으로 결정되었다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. GEQ 역가 차이의 통계적 유의성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 16: 재조합 MV에 의해 암호화되는 S 및 다양한 돌연변이된 S 단백질의 융합 특성의 비교 분석. HEK-293T-GFP10 세포를 플라스미드로 형질감염시켜 S(wt-S), S2P(S-2P), S3F(S-3F), S2P3F(S-2PΔ3F) 또는 S2PF(S-2PΔF)의 일시적 발현을 가능하게 하고, hACE2 발현 플라스미드로 형질감염된 HEK-293T-GFP11 세포와 공동 배양하여, 문헌[Buchrieser 등 (2020)]에서 S에 대해 설명된 분석법에 따라 두 세포 하위 집단 간에 융합이 발생하는 경우 GFP 활성을 재구성할 수 있도록 하였다. 음성(neg, mock-transfected) 및 양성(pos, 높은 수준에서 S를 발현하는 플라스미드로 형질전환됨) 대조군이 포함되었다. 세포 시트의 이미지를 형질감염 후 18시간에 기록하였다. 융합 비율은 세포 면적당 GFP 면적으로 점수를 매기고 이미지 아래에 그래프에 표시했다.
도 17: 프라임만 면역화한 후 SARS-CoV-2에 의한 챌린지에 대한 마우스의 보호. 마우스를 모체 MV Schwarz 균주(Schw), MV-ATU3-S2P(S2P) 또는 MV-ATU3-S2PΔF2A(S2PΔF2A)로 1회 면역화시켰다. 면역화 후 3주에 혈액 샘플을 채취하고 홍역 특이적 ELISA(A), SARS-CoV-2 스파이크 특이적 ELISA(B) 및 SARS-CoV-2 미세중화 분석(μNT, C)에 의해 항체 반응을 측정했다. 면역화 후 24주에 마우스에 Ad5:hACE를 주입하고 4일 후에 챌린지하였다. 챌린지 후 4일째에 폐를 채취하였다. 폐 바이러스 부하은 폐당 RNA 수준(GEQ) 또는 감염 역가(PFU)로 결정하였다. 막대는 중앙값을 표시한다. 정량화의 하한은 점선으로 표시된다. 미세중화 역가, GEQ 및 감염성 바이러스의 차이의 통계적 중요성은 Dunn의 수정되지 않은 사후 분석과 함께 Kruskal-Wallis 테스트를 사용하여 평가되었다. * p<0.05, ** p<0.005, *** p<0.0005. GraphPad Prism 8을 사용하여 분석을 수행했다.
도 18: 동종삼량체로의 효율적인 분비 및 조립을 위한 SARS-CoV-2 스파이크 엑토도메인 작제물의 최적화. (A). Ser-Gly-Gly 연결 링커 DLGN Twin-strep-tag (Strep Tag)를 통해 C-말단에서 foldon(T4 또는 GCN4)에 융합된 S의 전장 엑토도메인에 해당하는 스파이크(tri-Secto)의 분비되고 삼량체화된 형태의 개략도. 신호 펩티드, 서브도메인 S1 및 S2, 푸린 절단 부위, 융합 펩티드, 헵타드(heptad) 반복부(HR) 1 및 2 및 커넥터 도메인(CD)의 위치가 표시되어 있다. 텍스트에 설명된 돌연변이의 위치는 개략도 아래에 화살표를 사용하여 표시되어 있다. 작제물은 돌연변이 및 폴돈의 조합에 따라 명명되었다. 예를 들어, T4-S2P3F는 2P 및 3F 돌연변이 및 T4 피브리틴 폴돈을 겸비했다. 전장 단백질을 안정화하기 위한 푸린 절단 부위의 돌연변이(3F:R682G+R683S+R685G) 또는 결실(DetaF: 6756QTQTNSPRRAR-685); 돌연변이(2P: K986P+V987P)는 융합전 형태의 단백질을 잠근다. 삼량체화 폴돈: T4 또는 GCN4(B). HEK 293T 세포는 표시된 pCI-Spike_ectomain 플라스미드 DNA로 일시적으로 형질감염되거나(패널의 오른쪽 부분, 분비된 엑토도메인에 대한 foldon T4 또는 GCN4가 표시됨) 대조군으로서, 스파이크의 전체 길이 변이체(패널의 왼쪽 부분, 전체 길이 막 고정(mb) 스파이크)를 암호화하는 pCI-S2P, pCI-S2PF 및 pCI-S3F 플라스미드 DNA 로 형질감염되었다. 상청액을 형질감염 후 48시간에 수집하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-접합 항-토끼 항체 및 근적외선 이미징으로 검출했다. 분자량 마커의 위치(kDa)가 도시되어 있다. (C). T4-S2P3F, GCN4-S2P3F 및 T4-S2P 폴리펩티드는 Superdex200 컬럼에서 크기 배제 크로마토그래피에 의해 분리되었다. 용리 프로파일은 280nm(mAU)에서의 흡광도에 의해 기록되었다.
도 19: MV-ATU3-T4-S2P3F 감염된 세포의 상청액에서 SARS-CoV-2 스파이크 엑토도메인의 검출. Vero 세포는 0.05의 MOI에서 MV-ATU3-S2P3F, MV-ATU3-Secto, MV-ATU3-T4-S2P3F(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 감염시키거나 감염시키지 않았다(NI). 상층액(상단 패널)을 수집하고, 감염 후 39시간에 총 세포 추출물(중간 패널)을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 멤브레인으로 옮기고 항-SARS-CoV-2 스파이크 다클론 토끼 항체, AlexaFluor 680-결합 항토끼 항체 및 근적외선 이미징으로 검출했다. 총 세포 추출물에 대한 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)(하단 패널)를 사용하여 MV N 단백질을 검출하였다. SARS-CoV-2 스파이크 단백질/엑토도메인, S1 및 S2 하위 도메인, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 되시되어 있다.
도 20: ATU2-N 및 ATU2-NMVopt 바이러스에 감염된 세포의 용해물에서 SARS-CoV-2 N의 발현 수준. Vero 세포는 MV-ATU2-N(4개 바이러스 클론), MV-ATU2-NMVopt(4개 바이러스 클론) 또는 모체 MV Schwarz 균주(MVSchw)로 MOI 1로 감염시키거나 감염시키지 않았다(NI). 감염 후 24시간에 총 세포 추출물을 제조하고, NuPAGE 4-12% Bis-Tris 겔에서 전기영동으로 분리하고, PVDF 막으로 옮기고, 항-SARS-CoV-2 핵단백질 다클론 토끼 항체, AlexaFluor 680-접합된 항-토끼 항체 및 근적외선 이미징(상단 패널)으로 검출했다. 로딩 대조군으로서, 항-MV 핵단백질 폴리클로날 토끼 항체(Covalab)를 사용하여 MV N 단백질을 검출하였다(하부 패널). SARS-CoV-2 핵단백질, 홍역 N 단백질 및 분자량 마커(kDa 단위)의 위치가 도시되어 있다.
도 21 . SARS-CoV-2의 고유 S 단백질 개략도. 천연 S 단백질의 길이는 1273개 아미노산(aa)이다. 단백질은 푸린 절단 부위(F)에서 절단에 의해 생성된 2개의 서브유닛인 S1 및 S2를 포함한다. S1은 신호 펩티드(SP), N-말단 도메인(NTD) 및 수용체 결합 도메인(RBD)을 포함한다. S2는 융합 펩티드(FP), 헵타드 반복 1(HR1) 및 2(HR2), 막횡단 도메인(TM) 및 세포질 꼬리(CT)를 포함한다. 2P는 두 개의 돌연변이된 프롤린인 K986P와 V987P를 나타낸다. 문자 KLHYT는 CT에서 서열번호 149의 소포체 검색 신호(ERRS) 모티프 KxHxx를 나타낸다. dER은 CT에서 11개의 C-말단 아미노산이 결실된 작제물을 나타낸다.
도 22a 내지 도 22d . S 유전자 작제물의 개략도 및 S-발현 rMV의 특성 규명. a 주목할만한 도메인이 있는 SARS-CoV-2의 고유 S 유전자는 MV 벡터에 클로닝된 S 유전자 구조와 관련하여 도시되어 있다. 2P 및 dER 변형도 도시되어 있다. 모든 S 작제물은 MV 벡터 플라스미드인 pTM-MVSchwarz(MV Schwarz)의 두 번째(ATU2) 또는 세 번째(ATU3) 추가 전사 단위에 클로닝되었다. MV 게놈은 핵단백질(N), 인단백질(P), V 및 C 부속 단백질, 기질(M), 융합체(F), 혈구응집소(H) 및 폴리머라제(L) 유전자를 포함한다. 플라스미드 요소에는 T7 RNA 폴리머라제 프로모터(T7), 해머헤드 리보자임(hh), 델타 간염 바이러스 리보자임(δ) 및 T7 RNA 폴리머라제 터미네이터(T7t)가 포함된다. b 0.1의 MOI에서 Vero 세포를 감염시키는데 사용되는 rMV 작제물의 성장 동역학. 세포 관련 바이러스 역가는 TCID50/ml로 표시된다. c 2P 돌연변이가 있거나 없는 ATU2 또는 ATU3의 Sf-dER 또는 S2-dER을 발현하는 rMV로 감염된 Vero 세포의 세포 용해물에서 SARS-CoV-2 S 단백질의 웨스턴 블롯 분석. d 감염 24시간 후 표시된 rMV로 감염된 Vero 세포의 면역형광 염색. 투과되거나 투과되지 않은 세포는 S, MV N 및 핵에 대해 염색되었다.
도 23a 내지 23f . 프라임-부스트 백신접종에 의한 체액성 반응의 유도. a IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)의 상동 프라임-부스트는 0일과 28일에 표시된 rMV의 1x105 TCID50으로 복강내 면역화하였다. 면역화 28일 및 42일 후에 혈청을 수집하고 b MV 항원 또는 c S-SARS-CoV-2 S에 대한 특이적 항체 반응을 평가했다. 데이터는 개별 동물을 나타내는 각 데이터 포인트와 함께 상호 종말점 희석 역가(reciprocal endpoint dilution titer)를 보여준다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e 1차 면역화 후 4주째에 마우스에서 S-특이적 항체 반응의 IgG 서브클래스. f IgG2a/IgG1 또는 Th1/Th2 반응의 비율. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시된다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(** p<0.01 및 **** p<0.001)를 나타낸다.
도 24a 내지 도 24d. rMV 백신접종에 의한 S-특이적 세포 반응의 유도. a 표시된 rMV의 1x105 TCID50으로 복강내 면역화된 IFNAR -/- 마우스의 면역화(빈 MV 대조군의 경우 n=12 또는 n=3). 면역화 7일 후, 새로 추출된 비장세포에서 IFN-γ에 대한 ELISPOT을 수행했다. 데이터는 CD8+ 또는 CD4+ T 세포에 특이적인 b MV Schwarz 또는 c SARS-CoV-2 S 펩티드 풀로 자극한 후 검출된 1x106 비장세포당 IFN-γ 분비 세포 또는 반점 형성 세포(SFC)로 표시된다. d MV Schwarz에 의해 자극된 세포에 대한 CD4+ 또는 CD8+ 펩티드에 의해 자극된 IFNγ-분비 세포의 비율. 각 데이터 포인트는 개별 마우스를 나타낸다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 25a 및 도 25b . T 세포의 사이토카인 발현 프로필. 표시된 rMV의 1x105 TCID50으로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(빈 MV 대조군의 경우 n=12 또는 n=3) 및 비장세포를 S-특이적 펩티드 풀로 자극하였다. S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα 및 IL-5에 대해 염색하였다. 별표(*)는 Mann-Whitney U-검정에 의해 결정된 유의미한 평균 차이(* p<0.05; ** p<0.01 및 **** p<0.001)를 나타낸다.
도 26a 내지 도 26f. 중화 항체 및 면역 보호의 지속성. a IFNAR -/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물을 0일 및 28일에 상동 프라임-부스트에 의해 복강내 면역화시켰다. 혈청을 52일, 72일 및 110일에 수집하였다. 동물은 110일째에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c SARS-CoV-2 S에 대한 특정 항체의 수준에 대해 평가하였다. d SARS-CoV-2 바이러스에 대한 중화 항체 반응은 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현하였다. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출하였으며, 카피/폐로 계산하였다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 27a 내지 도 27g . 단일 예방 접종 후 면역 반응 및 보호. a IFNAR-/- 마우스(n=6)에 대한 면역화 및 챌린지 일정. 동물은 0일에 복강내 면역화하였다. 혈청은 24일 및 48일에 수집하였다. 동물은 48일에 1.5 x 105 PFU에서 마우스 적응 SARS-CoV-2 바이러스(MACo3)의 비강내 접종에 의해 챌린지하였다. 혈청은 b MV 및 c S-SARS-CoV-2 단백질에 대한 특이적 항체의 수준에 대해 평가되었다. d 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. e SARS-CoV-2 바이러스 RNA 카피는 감염된 동물의 균질화된 폐에서 RT-qPCR에 의해 검출되었으며, 카피/폐로 계산되었다. f PFU/폐로 표현되는 면역화된 동물의 균질화된 폐로부터 회수된 감염성 바이러스 입자의 역가. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 항체 반응에 대한 통계적 유의성(상단 패널)은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 나머지 데이터(하단 패널)는 Mann-Whitney U-test로 분석되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(* p<0.05; ** p<0.01 및 **** p<0.001).
도 28 . 형질감염된 HEK293T 세포의 표면에서 SARS-CoV-2 S 항원의 발현. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합된 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의(mock) 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
도 29 . 형질감염된 Vero 세포에서 S 단백질 매개 신시튬(syncytium) 형성. SARS-CoV-2 S 단백질을 암호화하는 pcDNA 발현 벡터로 형질감염된 Vero 세포의 이미지를 형질감염 24시간 후에 획득했다. 상단 이미지는 천연 형태 S 항원을 암호화하는 플라스미드로 형질감염된 Vero 세포를 보여주는 반면, 하단 이미지는 융합전 안정화 S 항원으로 형질감염된 세포 및 형질감염되지 않은 대조 Vero 세포를 보여준다. 회색 선은 syncytia의 경계를 나타낸다. 천연(native) SF는 손상되지 않은 CT가 있는 천연 형태의 전장 S 단백질을 나타낸다.
도 30 . 재조합 MV 백신으로 감염된 Vero 세포에서 세포내 S 단백질 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3-결합 염소 항-토끼 IgG를 사용하여 사포닌 투과성 세포에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화되었다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 31 . 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 표면 발현의 면역형광 분석. Vero 세포는 SARS-CoV-2 S 단백질 또는 빈 MV Schwarz를 발현하는 rMV로 감염시켰다. 감염 24시간 후, 토끼 항-S 항체에 이어 Cy3 결합 염소 항토끼 IgG를 사용하여 비투과성 세포 표면에서 S 단백질을 검출하였다. MV N 단백질은 마우스 모노클로날 항-N 항체에 이어 Alexa Fluor 488-접합 염소 항-마우스 IgG를 사용하여 시각화하였다. 핵은 DAPI로 염색되었다. 형광 현미경을 사용하여 이미지를 획득했다.
도 32 . 연속 계대 유래의 재조합 MV 백신으로 감염된 Vero 세포에서 S 단백질 발현의 웨스턴 블롯 분석. SF-dER 또는 SF-2P-dER 항원을 발현하는 MV ATU2 백신은 P1에서 P10까지 Vero 세포에서 연속적으로 계대되었고 S 단백질 발현은 P1, P5 및 P10 세포 용해물의 면역블롯팅에 의해 측정되었다. 빈 MV로 감염된 Vero 세포를 병렬로 검사하고 음성 대조군으로 사용했다.
도 33A 내지 도 33C . 1x10 5 TCID 50 의 MV-ATU2-SF-2P-dER 또는 빈 MV로 복강내(i.p.) 면역화된 IFNAR -/- 마우스(대조군 빈 MV 그룹의 경우 n=5 또는 n=3)에서 평가된 T 세포의 사이토카인 발현 프로파일. S-특이적 CD4 또는 CD8 펩티드로 비장세포를 자극하였다(표 6A 및 표 6B). S-특이적 a CD8+ 및 b CD4+ T-세포를 세포내 IFN-γ, TNFα, IL-5 및 IL13에 대해 염색하였다. c S-특이적 CD4+ 메모리 T 세포를 세포내 IL-5 및 IL13에 대해 염색하였다. 별표(*)는 다중 비교 테스트를 통해 Kruskal-Wallis ANOVA에 의해 결정된 유의한 평균 차이(* p<0.05)를 나타낸다.
도 34A 내지 도 34C . 용량 의존적 상동 프라임-부스트 면역. IFNAR -/- 마우스(빈 MV 대조군의 경우 n=6 또는 n=4)를 0일 및 28일에 1x105 TCID50 또는 1x104 TCID50에서 표시된 rmV 백신 후보로 복강내 면역화시켰다. 면역화 후 28일 및 50일 에 혈청을 수집하고, a MV 항원 또는 b SARS-CoV-2 S 단백질에 대한 특이적 항체 반응을 평가했다. 데이터는 각 데이터 포인트가 개별 동물을 나타내는 상호 종말점 희석 역가를 보여준다. c 50% 플라크 감소 중화 시험(PRNT50) 역가로 표현되는 SARS-CoV-2 바이러스에 대한 중화 항체 반응. 데이터는 기하학적 SD를 나타내는 선과 오차 막대와 함께 기하학적 평균으로 표시되어 있다. 통계적 유의성은 다중 비교를 위해 조정된 양방향 ANOVA에 의해 결정되었다. 별표(*)는 유의미한 평균 차이를 나타낸다(*p<0.05, **p<0.01 및 ****p<0.001).
도 35. SARS-CoV-2의 S 단백질을 발현하는 pCDNA로 형질감염된 HEK293T 세포의 FACS 분석. 전장 S 또는 S2 소단위 항원을 암호화하는 pcDNA 발현 벡터로 형질감염된 세포를 항-S 항체에 이어 Alexa Fluor 488-접합 염소 항-토끼 IgG로 간접 면역형광을 위해 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다(상단 점 도표). 히스토그램은 전장 S(왼쪽 히스토그램) 또는 S2 소단위 단백질(오른쪽 히스토그램)의 표면 발현을 보여준다. 천연 형태 S 항원(밝은 회색), 사전 융합 안정화된 S(진한 회색), 모의 형질감염된 대조군 세포(검정 히스토그램) 및 해당 평균 형광 강도(MFI)가 도시되어 있다.
정의
본원에서 사용되는 관사 "a" 및 "an"은 관사의 문법적 대상의 하나 또는 하나 초과(즉, 적어도 하나)를 지칭한다. 예를 들어, "요소(element)"는 하나의 요소 또는 하나 이상의 요소를 의미한다. 또한, "포함하는" 및 "포함하는", "포함하는" 및 "포함된"과 같은 다른 형태의 사용은 제한적이지 않다.
본원에서 사용되는 정량적 용어에서 용어 "약"은 이것이 수식하는 값의 플러스 또는 마이너스 10%를 의미한다(값이 분자 또는 뉴클레오티드의 수와 같이 세분할 수 없는 경우 가장 가까운 정수로 반올림됨).
본원에 개시된 모든 범위는 인용된 종점을 포함하고 독립적으로 조합 가능하다(예를 들어, "50 mg 내지 500 mg"의 범위는 종점인 50 mg 및 500 mg, 및 모든 중간 값을 포함한다).
본원에서 사용되는 "포함하는"이라는 용어는 "~로 구성된" 및 "본질적으로 구성되는" 구현예를 포함할 수 있다. 본원에서 사용되는 용어 "포함하다comprise(s)", "포함하다include(s)", "갖다", "갖다", "포함하다contain(s)" 및 이들의 변형은 개방형 전환 구, 용어, 또는 명명된 성분/단계의 존재를 요구하고 다른 성분/단계의 존재를 허용하는 단어인 것으로 의도된다. 그러나, 그러한 설명은 그 범위 내에서, 임의의 허용가능한 담체 또는 유체와 함께 명명된 구성요소 또는 화합물의 존재를 허용하고 다른 구성 요소 또는 화합물은 제외하는 열거된 구성요소로 "구성되는" 및 "본질적으로 구성되는" 것으로서 조성물 또는 공정을 포괄하는 것으로 해석되어야 한다.
용어 "상류" 및 "하류"는 더 긴 핵산 서열의 RNA 전사 방향(5'에서 3')에 상대적인 더 긴 핵산 서열 내의 핵산 서열의 상대 위치를 지칭하기 위해 본원에서 사용된다. "상류"라는 용어는 더 긴 핵산 서열의 5' 말단(RNA 전사의 초기 단계)에 더 가까운 핵산 서열을 의미한다. "하류"라는 용어는 더 긴 핵산 서열의 3' 말단(RNA 전사의 나중 단계)에 더 가까운 핵산 서열을 의미한다.
본원에서 사용되는 용어 "항원성 폴리펩티드"는 폴리펩티드가 유래되는 바이러스에 대한 면역 반응을 유도할 수 있는 폴리펩티드를 의미한다.
본원에 사용되는 폴리펩티드의 "면역원성 단편"이라는 용어는 폴리펩티드가 유래되는 바이러스에 대한 면역 반응을 유도할 수 있는 폴리펩티드 단편을 의미한다. 면역원성 단편의 비제한적 예로는 SARS-CoV-2의 Secto 폴리펩티드, SARS-CoV-2의 stab-Secto 폴리펩티드, SARS-CoV-2의 S1 폴리펩티드, SARS-CoV-2의 S2 폴리펩티드, SARS-CoV-2의 tri-Secto 폴리펩티드, SARS-CoV-2의 tristab-Secto 폴리펩티드, 및 소포체 보유에 관여하는 도메인에서 돌연변이된 S가 있다.
본 발명의 목적을 위해, 바이러스 균주 SARS-CoV-2는 Genbank에 MN908947 서열로 개시되어 있고 2020년 1월 20일부터 NBCBI로부터 공개적으로 입수가능하고 그 날짜 이후 MN908947.3로 업데이트된 그의 뉴클레오티드 서열(야생형 서열)을 참조하여 특히 기술될 것이다.
텍스트, 도면 및 서열 목록 전체에서 "코로나바이러스 2019-nCoV", "2019-nCoV", "nCoV" 또는 "SARS-CoV-2"라는 표현은 상호교환적으로 사용할 수 있다.
"폴리펩티드" 또는 "코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드"라는 표현은 아미노산 잔기의 연결로 인한 분자를 정의한다.
본원에서 사용되는 것으로, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 S-단백질 또는 이중 도메인 S-단백질의 "증가된 세포 표면 발현"은 인간 배아 신장 세포(HEK) 293T(ATCC CRL-3216)를 발현 작제물로 형질감염시켜서 돌연변이 단백질을 동시에 발현하여 상응하는 비돌연변이 단백질로 형질감염된 HEK 293T 세포를 제어하고 면역 분석법을 사용하여 세포 표면 발현을 측정함으로써 측정된다. 세포 표면 발현은 삽입, 치환 또는 결실에 의한 추가 돌연변이, 예를 들어 2P 돌연변이와 같은 융합전 형태로 S 단백질을 유지하는 추가 돌연변이에 의해 추가로 증가될 수 있다. 예시적인 분석법은 실시예에 설명되어 있고 분석의 특정 결과는 도 28 및 도 35에 제시되어 있다.
본원에서 정의되는 "dER"이라는 표현은 S 단백질, 특히 서열번호 3의 SARS-CoV-2의 S 단백질의 세포질 꼬리로부터 11개의 C-말단 아미노산 잔기(aa 1263-1273)의 결실에 의한 돌연변이를 의미한다. 세포질 꼬리로부터 그 도메인의 결실은 이 폴리펩티드 단편을 발현하는 재조합 MV로 감염된 세포에서 S의 폴리펩티드 단편의 표면 발현을 증가시킨다.
본원에서 정의되는 용어 "2P"는 2개의 아미노산 잔기의 돌연변이, 즉 사전융합 형태로 S 단백질을 유지하는 서열번호 3의 SARS-CoV의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2개의 프롤린 잔기의 치환에 의한 돌연변이를 의미한다. 그 돌연변이는 S2 도메인, 예를 들어, heptad 반복부 1(HR1)과 중심 나선(CH)의 사이에서 발생한다.
본원에서 정의되는 용어 "2A" 또는 "2a"는 잠재적으로 세포 표면 발현을 증가시키기 위한 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열에서 소포체 회수(retrieval) 신호의 2개의 아미노산 잔기(K1269A + H1271A)의 돌연변이를 의미한다.
본원에서 사용되는 문구 "이중 도메인 S 단백질"은 S1 및 S2 도메인을 모두 포함하는 코로나바이러스 스파이크(S) 단백질을 의미한다. 이중 도메인 S 단백질은 돌연변이(치환, 결실 및/또는 추가)를 포함할 수 있지만 전체 S1 또는 S2 도메인이 누락하지는 않는다.
본원에서 사용되는 "암호화"라는 표현은 핵산 분자가 전사되고 적절한 경우 선택된 세포 또는 세포주로의 생성물 발현을 위해 번역되는 능력을 정의한다. 따라서, 핵산 작제물은 코딩 서열의 전사를 제어하는 조절 요소, 특히 전사에 대한 프로모터 및 종결 서열 및 가능하게는 인핸서 및 기타 시스-작용 요소를 포함할 수 있다. 이들 조절 요소는 CoV, 특히 SARS-CoV-2 폴리뉴클레오티드 서열에 대하여 이종성일 수 있다.
"작동가능하게 연결된"이라는 표현은 본 발명의 핵산 작제물의 상이한 폴리뉴클레오티드 사이에 존재하는 기능적 연결을 의미한다. 이러한 기능적 연결에 의하여, 상이한 폴리뉴클레오티드 및 핵산 작제물은 특히 세포 또는 세포주, 특히 본 발명의 재조합 감염성 MV 입자의 생성 또는 증폭을 위한 구출 시스템의 일부로서 사용되는 세포 또는 세포주 또는 숙주 세포, 특히 포유동물 또는 인간 세포에서 효율적으로 전사되고 적절한 경우 번역된다.
본원에서 사용되는 용어 "레플리콘"은 DNA 또는 RNA 복제(즉, 자가 복제)의 자율 단위로서 기능하는 임의의 유전 요소(예: 플라스미드, 염색체, 바이러스 RNA)를 의미한다. 레플리콘은 바이러스 게놈에서 유래할 수 있으며, 야생형 바이러스 게놈과 비교하여 결실 또는 외래 유전자로 대체된 하나 이상의 구조 단백질을 갖는 바이러스 게놈 복제를 위한 바이러스 비구조 유전자를 함유할 수 있다.
본원에서 사용되는 용어 "재조합"은 예를 들어 벡터의 형태로 세포 내로 하나 이상의 폴리뉴클레오티드를 도입하는 것을 의미하며, 폴리뉴클레오티드는 세포 게놈(예를 들어, 상기 정의됨)에 통합(전체 또는 부분적으로)되거나 통합되지 않는다.
본원에서 사용되는 용어 "이동"은 재조합 세포를 상이한 유형의 세포, 특히 상이한 유형의 세포의 단층 상에 플레이팅하는 것을 의미한다. 이들 후자의 세포는 감염성 MV-CoV 입자의 복제 및 생산, 즉 각각 세포 내부에서 감염성 바이러스의 형성 및 세포 외부에서 이러한 감염성 바이러스의 방출을 유지하는 능력이 있다. 이러한 전달은 이전 문장에 정의된 적격 세포와 본 발명의 재조합 세포의 공동 배양을 초래한다. 상기 전달은 재조합 세포가 충분히 효율적인 바이러스 생산 배양물이 아닌 경우, 즉 감염성 MV-CoV 입자가 이들 재조합 세포로부터 효율적으로 회수될 수 없는 경우에 추가적인, 즉 선택적인 단계일 수 있다.
본원에서 사용되는 것으로, 본원에서 개시된 백신 조성물의 용량 또는 양과 관련하여 "유효 용량"이라는 어구는 항체 및/또는 세포성 면역 반응을 유도하는데 필요한 용량을 지칭하며, 이는 후속 챌린지 동안 감염성 물질, 예를 들어 코로나바이러스의 감염의 가능성 또는 중증도를 상당히 감소시키는 용량이다. 몇몇 구현예에서, 유효 용량은 백신 조성물에 대한 패키지 삽입물에 나열된 용량이다.
본원에서 사용되는 것으로, 백신과 같은 예방적 조성물을 언급할 때 사용되는 용어 "부스터"는 본 개시의 면역원성 조성물, 또는 다른 예방적 또는 치료적 화합물의 추가 투여를 의미한다.
본원에서 사용되는 용어 "바이러스-유사 입자"(VLP)는 본 개시의 핵산 작제물에 의해 암호화되지만 핵산 작제물을 포함하지 않는 것으로, 홍역 바이러스 구조 단백질 및 적어도 하나의 SARS-CoV-2 S 폴리펩티드 또는 이의 면역원성 단편을 포함하는 구조를 의미한다. 본 발명의 VLP는 비-감염성 및 비-복제성이다.
본원에서 사용되는 용어 "연관된" 또는 "연관"은 둘 이상의 열거된 요소, 예를 들어 재조합 감염성 복제 MV-CoV 입자 및 VLP를 함유하는 CoV 단백질 및/또는 CoV의 독특한 조성물의 존재를 의미한다. 연관된 요소는 물리적으로 별도의 엔터티일 수 있다.
당업계에 알려진 용어 "동일성"은 서열을 비교함으로써 결정되는 2개 이상의 폴리펩티드 또는 폴리뉴클레오티드의 서열 사이의 관계를 의미한다. 당업계에서, 동일성은 또한 2개 이상의 아미노산 잔기 또는 핵산 잔기의 스트링(string) 간의 매치의 수에 의해 결정되는 것으로 2개 서열 간의 서열 관련성의 정도를 의미한다. 동일성은 특정 수학적 모델 또는 컴퓨터 프로그램(예: "알고리즘")에 의해 처리되는 간격 정렬(있는 경우)이 있는 둘 이상의 서열 중 더 작은 것 간의 동일한 일치의 비율을 측정한다. 관련 펩티드의 동일성은 공지된 방법으로 쉽게 계산할 수 있다. 폴리펩티드 또는 폴리뉴클레오티드 서열에 적용되는 용어 "% 동일성"은, 필요한 경우 최대 퍼센트 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후 제2 서열의 아미노산 서열 또는 핵산 서열과 동일한 후보 아미노산 또는 핵산 서열의 잔기(아미노산 잔기 또는 핵산 잔기)의 백분율로 정의된다. 정렬을 위한 방법 및 컴퓨터 프로그램은 당업계에 잘 알려져 있다. 동일성은 퍼센트 동일성의 계산에 의존하지만 계산에 도입된 갭 및 패널티로 인해 값이 다를 수 있다. 일반적으로, 특정 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 본원에 기술되고 당업자에게 공지된 서열 정렬 프로그램 및 매개변수에 의해 결정된 것으로 특정 참조 폴리뉴클레오티드 또는 폴리펩티드에 대해 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상 100% 미만의 서열 동일성을 갖는다. 이러한 정렬 도구에는 BLAST 제품군의 도구가 포함된다(Stephen F. Altschul 등 (1997)." Gapped BLAST and PSI-BLAST: a new generation of protein database search programs," Nucleic Acids Res. 25:3389-3402). 또 다른 대중적인 국소 정렬 기법은 스미스-워터만 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecule subsequences." J. Mol. Biol. 147:195-197)을 기반으로 한다. 동적 프로그래밍을 기반으로 하는 일반적인 전역(global) 정렬 기법은 Needleman-Wunsch 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general methodapply the search for similarities of amino acid sequence of two protein." J. Mol. Biol. 48:443-453)을 기반으로 한다. 보다 최근에는, Needleman-Wunsch 알고리즘을 포함한 다른 최적의 전역 정렬 방법보다 빠르게 뉴클레오티드 및 단백질 서열의 전역 정렬을 생성한다고 알려진 FOGSAA(Fast Optimal Global Sequence Alignment Algorithm)가 개발되었습니다. 다른 본원에 설명되어 있으며 특히 아래의 "ID" 정의에서 설명되어 있다.
본원에서 사용되는 용어 "상동성"은 중합체 분자 사이, 예를 들어, 핵산 분자(예: DNA 분자) 및/또는 폴리펩티드 분자 사이의 전반적인 관련성을 의미한다. 일치하는 잔기의 정렬에 의해 결정되는 역치 수준의 유사성 또는 동일성을 공유하는 중합체 분자(예: 핵산 분자(예: DNA 분자) 및/또는 폴리펩티드 분자)를 상동성이라고 한다. 상동성은 분자 간의 관계를 설명하는 정성적 용어이며 정량적 유사성 또는 동일성을 기반으로 할 수 있다. 유사성 또는 동일성은 두 비교된 서열 간의 서열 일치의 정도를 정의하는 정량적 용어이다. 몇몇 구현예에서, 중합체 분자는 서열이 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 이상 동일하거나 유사한 경우 서로 "상동성"이다. "상동성"이라는 용어는 반드시 적어도 2개의 서열(폴리뉴클레오티드 또는 폴리펩티드 서열) 간의 비교를 의미한다. 2개의 폴리뉴클레오티드 서열은 이들이 암호화하는 폴리펩티드가 적어도 20개 아미노산의 적어도 하나의 스트레치에 대해 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 심지어 99%인 경우 상동인 것으로 간주된다. 몇몇 구현예에서, 상동성 폴리뉴클레오티드 서열은 적어도 4 내지 5개의 고유하게 특정된 아미노산의 스트레치를 암호화하는 능력을 특징으로 한다. 길이가 60개 미만의 뉴클레오티드인 폴리뉴클레오티드 서열의 경우, 상동성은 적어도 4 내지 5개의 고유하게 지정된 아미노산의 스트레치를 암호화하는 능력에 의해 결정된다. 20개 이상의 아미노산으로 구성된 1개 이상의 스트레치에 대해 단백질이 50%, 60%, 70%, 80%, 또는 90% 이상 동일한 경우 2개의 단백질 서열은 상동성으로 간주된다.
상동성은 비교된 서열이 공통 기원에서 진화적으로 분기되었음을 의미한다. 용어 "상동체"는 공통 조상 서열로부터의 후손에 의한 제2 아미노산 서열 또는 핵산 서열과 관련된 제1 아미노산 서열 또는 핵산 서열(예를 들어, 유전자(DNA 또는 RNA) 또는 단백질 서열)을 의미한다. "상동체"라는 용어는 종분화의 사건에 의해 분리된 유전자 및/또는 단백질 간의 관계 또는 유전적 복제의 사건에 의해 분리된 유전자 및/또는 단백질 간의 관계에 적용될 수 있다. "이종상동체(Ortholog)"는 종분화에 의해 공통 조상 유전자(또는 단백질)에서 진화한 다른 종의 유전자(또는 단백질)이다. 일반적으로.이종상동체는 진화 동안에 동일한 기능을 유지한다. "동종상동체(Paralog)"는 게놈 내 복제에 의해 관련된 유전자(또는 단백질)이다. 이종상동체는 진화하는 동안 동일한 기능을 유지하는 반면 동종상동체는 새로운 기능이 원래 기능과 관련이 있더라도 새로운 기능을 발전시킨다.
본원에서 사용되는 용어 "변이체"는 천연 서열 또는 참조 서열과 비교하여 그의 아미노산 서열 또는 핵산 서열이 상이한 분자이다. 서열 변이체는 천연 서열 또는 참조 서열과 비교하여 서열 내의 특정 위치에서 치환, 결실, 삽입 또는 전술한 것 중 임의의 2개 또는 3개의 조합을 가질 수 있다. 일반적으로, 변이체는 천연 서열 또는 참조 서열에 대해 적어도 50% 동일성을 갖는다. 몇몇 구현예에서, 변이체는 천연 서열 또는 참조 서열과 적어도 80% 동일성 또는 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는다.
본원에서 정의되는 용어 "6P"는 6개의 아미노산 잔기의 돌연변이, 즉 S2 도메인에서 발생하는 융합전 형태로 S 단백질을 유지하는, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이를 의미하고, 상기 돌연변이는 S2 도메인에서 발생한다(Hsieh 등, 2020). K986P 및 V987P 돌연변이는 heptad 반복부 1(HR1)과 중심나선(CH) 사이에서 발생하고, F817P, A892P 및 A899P는 융합펩티드(FP)와 HR1 사이의 연결부위에서 발생하고, A942P 돌연변이는 HR1에서 발생한다.
본원에서 정의되는 용어 "CC"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 383번 및 985번 위치(S383C 및 D985C)에 있는 2개의 시스테인 잔기의 치환에 의한 돌연변이 또는 폐쇄 형태로 수용체 결합 도메인(RBD)을 유지하는 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 413 및 987(G413C 및 P987C) 에 있는 2개의 시스테인 잔기의 치환에 의한 돌연변이를 의미한다(McCallum 등, 2020).
본원에서 정의되는 용어 "폴돈(foldon)"은 인공 삼량체화 도메인, 특히 S 단백질의 엑토도메인의 삼량체화를 촉진하고 가용성 삼량체 형태, 즉 S 단백질의 가용성 삼량체 형태에서 그의 발현을 허용하는 T4 폴돈(즉, 박테리오파지 T4의 피브리틴의 삼량체화 도메인)을 의미한다. 예를 들어, T4 폴돈은 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 51 및 서열번호 52의 서열에서 사용되었다. 폴돈의 또 다른 예는 GCN4 폴돈이며, 이는 효모 GCN4 전사활성화제의 삼량체화 도메인에서 유래한 것이다.
본원에서 정의되는 용어 "3F"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685에서 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이를 의미한다: R682G + R683S + R685G.
본원에서 정의되는 용어 "ΔF"는 서열번호 3의 위치 675의 SARS-CoV-2의 S 단백질의 아미노산과 위치 685의 아미노산 사이의 S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 의미한다.
본원에서 정의되는 "SARS-CoV-2의 S3F 폴리펩티드"는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미하며, 여기서 S1/S2 푸린 절단 부위는 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 682번, 683번 및 685번 위치에 있는 3개의 아미노산 잔기의 돌연변이에 의해 불활성화되었다.
본원에서 정의되는 "SARS-CoV-2의 S2P3F 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987에서 2P 돌연변이를 갖고, 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 "SARS-CoV-2의 S2PΔF 폴리펩티드"는 서열번호 3의 SARS-CoV-의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 3의 S 단백질의 아미노산 서열의 위치 675와 685 사이에 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 갖는 안정화된 S 단백질을 포함하는 폴리펩티드에 관한 것이다. SARS-CoV-2의 S2PΔF 폴리펩티드에서, 2P 돌연변이는 서열번호 47의 위치 975 및 976(K975P + V976P)에서 발생한다.
본원에서 정의되는 "SARS-CoV-2의 S2PΔF2A 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 675와 685 사이에서 서열번호 50의 아미노산 결실 QTQTNSPRRAR을 갖고, 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 1269 및 1271(K1269A + H1271A)의 2개의 아미노산 잔기의 변이에 의한 ERR 신호의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드에 관한 것이다. SARS-CoV-2의 S2PΔF2A 폴리펩티드에서, 2P 돌연변이는 서열번호 49의 위치 975 및 976(K975P + V976P)에서 발생하고 ERR 신호의 불활성화가 예를 들어 서열번호 49의 아미노산 서열의 위치 1258 및 1260(K1258A + H1260A)에서 2개의 아미노산 잔기의 돌연변이에 의해 발생한다.
본원에서 정의되는 "SARS-CoV-2의 T4-S2P3F 폴리펩티드"(tristab-Secto-3F라고도 함)는 2P 및 3F 돌연변이가 있는 S 단백질의 가용성 삼량체화된 형태를 포함하는 폴리펩티드, 특히 T4 폴돈 삼량체화 도메인, 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고 예를 들어 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질인 T4 폴돈 삼량체화 도메인을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6P 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6P 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6P3F 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6P3F 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고 예를 들어. 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 682, 683 및 685(R682G + R683S + R685G)에 있는 3개의 아미노산 잔기의 돌연변이에 의한 S1/S2 푸린 절단 부위의 불활성화를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "S6PΔF 폴리펩티드" 또는 SARS-CoV-2의 "SMVopt6PΔF 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고, S1/S2 푸린 절단 부위를 포함하는 루프의 결실, 즉 서열번호 3의 SARS-CoV-2의 S 단백질 아미노산 서열의 위치 675 및 685 사이에서 서열번호 50의 아미노산 서열 QTQTNSPRRAR의 결실을 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다. SARS-CoV-2의 S6PΔF 폴리펩티드에서 6P 돌연변이는 서열번호 58의 806, 881, 888, 931, 975, 976 위치에서 발생한다.
본원에서 정의되는 SARS-CoV-2의 "SCCPP 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P + V987P)에서 2P 돌연변이를 갖고 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 CC 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 정의되는 SARS-CoV-2의 "SCC6P 폴리펩티드"는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 817, 892, 899, 942, 986 및 987(F817P + A892P + A899P + A942P + K986P + V987P)에서 6P 돌연변이를 갖고 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 CC 돌연변이를 갖는 안정화된 S 단백질을 포함하는 폴리펩티드를 의미한다.
본원에서 사용되는 "전장 S 단백질"이라는 문구는 S1 및 S2 도메인을 모두 포함하는 코로나바이러스 스파이크(S) 단백질을 의미한다. 전장 S 단백질은 돌연변이(치환, 결실 및/또는 추가)를 포함할 수 있지만 전체 S1 또는 S2 도메인이 누락되지는 않는다. 전장 S 단백질은 푸린 절단 부위, 또는 S1 및 S2 도메인 사이에 돌연변이된 푸린 절단 부위를 포함할 수 있다.
코로나바이러스의 생물학
SARS-CoV-2는 코로나바이러스과(Coronavidae family) 및 β-코로나바이러스(β-coronavirus) 속에 속하는 외피가 있는 단일 가닥 포지티브 센스 RNA 바이러스이다(Zhou, 2020). SARS-CoV-2의 전체 게놈 시퀀싱은 SARS-CoV-1과 79.6%의 염기서열 유사성을 나타냈다(Wu, 2020). SARS-CoV-2의 게놈은 스파이크 단백질(S), 외피 단백질(E), 막 단백질(M) 및 뉴클레오캡시드(N)의 4가지 구조 단백질을 암호화한다. 비리온의 표면에 국한된 삼량체 클래스 I 융합 단백질인 S 단백질은 바이러스 부착 및 숙주 세포로의 진입에서 핵심 역할을 한다. 숙주 프로테아제에 의한 S 단백질의 S1 및 S2 서브유닛으로의 절단(Jaimes, 2020)은 바이러스 감염에 필수적이다. S1 서브유닛에는 수용체 결합 도메인(RBD)이 포함되어 있어 바이러스가 이의 진입 수용체인 안지오텐신 전환 효소 2(ACE2)에 결합할 수 있다(Zhou, 2020; Hoffmann, 2020). 수용체와 도킹한 후, S1 서브유닛이 방출되고 S2 서브유닛이 막 융합 및 바이러스 진입을 매개하는 융합 펩티드를 드러낸다(Du, 2020).
코로나바이러스는 숙주 세포의 세포질에서 복제한다. RNA 게놈의 5' 말단에는 캐핑된 구조가 있고 3' 말단에는 polyA 꼬리가 있다. 바이러스의 외피는 이의 표면에서 스피큘(또는 스파이크 단백질)이라고 하는 peplomeric 구조를 포함한다.
게놈은 5' 말단에서 3' 말단 방향으로 다음과 같은 오픈 리딩 프레임 또는 ORF를 포함한다: 전사-복제 복합체의 단백질에 해당하는 ORF1a 및 ORF1b, 그리고 구조 단백질 S, E, M 및 N에 해당하는 ORF-S, ORF-E, ORF-M 및 ORF-N. 또한 이는 ORF-S와 ORF-E 사이에 위치하고 후자와 중첩되는 영역에 의해 암호화된 미지 기능의 단백질에 해당하는 ORF를 포함하고, 그 영역은 ORF-M과 ORF-N 사이에 위치하며 ORF-N에 포함된다.
S 단백질은 바이러스 외피의 표면에서 나오는 가시(spicule) 또는 스파이크의 형태로 존재하는 막 당단백질(200-220 kDa)이다. 이는 숙주 세포의 수용체에 바이러스를 부착하고 바이러스 외피와 세포막의 융합을 유도하는 역할을 한다. S 단백질은 기능적으로 2개의 하위 영역 S1 및 S2로 나눌 수 있으며, 여기서 S1은 숙주 세포의 바이러스 수용체에 대한 결합에 관여하는 S 단백질의 머리를 형성하고 S2는 줄기 구조를 형성한다. S 단백질은 중화 항체가 표적으로 하는 주요 에피토프를 포함하고 있어 인간 코로나바이러스에 대한 백신 개발을 위한 주요 항원으로 간주된다(Du, 2020; Escriou, 2014; Liniger, 2008; Bodmer, 2018; Zhu, 2020). RBD를 표적으로 하는 항체는 숙주 세포의 수용체에의 바이러스 결합을 차단하고 진입을 방지함으로써 바이러스를 중화할 수 있다. 또한, SARS-CoV의 S2 소단위체의 두 번째 헵타드 영역(HR2)을 표적으로 하는 항체 및 모방 합성 펩티드는 막 융합에 필요한 구조적 변화를 방지함으로써 강력한 중화 활성을 갖는 것으로 관찰되었다(Bosh, 2004; Keng, 2005; Lip, 2006; Zhang, 2004; Zhong , 2005). 따라서, SARS-CoV-2 백신을 개발하려는 노력은 S 단백질에 대한 반응을 유도하는 초점을 두었다.
sM(작은 막)이라고도 하는 작은 외피 단백질(E)은 약 10kDa의 글리코실화되지 않은 막관통 단백질이며, 비리온에 가장 적은 양으로 존재하는 단백질이다. 이는 소포체(ER) 및 골지체의 중간 구획의 수준에서 발생하는 코로나바이러스 발아(budding) 과정에 관여한다.
M 단백질 또는 기질 단백질(25-30 kDa)은 M/E 상호작용에 의해 바이러스 입자에 통합되는 보다 풍부한 막 당단백질인 반면, 입자에의 S의 통합은 S/M 상호작용에 의해 지시된다. 이는 코로나바이러스의 바이러스 성숙 및 바이러스 입자가 조립되는 위치를 결정하는데 중요한 것으로 보인다.
코로나바이러스 구조 단백질 중 가장 잘 보존된 N 단백질 또는 뉴클레오캡시드 단백질(45-50kDa)은 게놈 RNA를 캡슐화한 다음 비리온으로의 통합을 지시하는데 필요하다. 이 단백질은 아마도 RNA 복제에도 관여할 것이다.
숙주 세포가 감염되면, 바이러스 게놈의 5' 영역에 위치한 리딩 프레임(reading frame, ORF)은 바이러스 프로테아제에 의해 절단되는 다단백질(polyprotein)로 번역된 다음, RNA 의존성 RNA 폴리머라제(Rep) 및 ATPase 헬리카제(Hel)와 같은 여러 비구조적 단백질을 방출한다. 이 두 단백질은 바이러스 게놈의 복제 및 바이러스 단백질 합성에 사용되는 전사체 생성에 관여한다. 이러한 서브게놈 mRNA가 생성되는 메커니즘은 완전히 이해되지 않았다. 그러나, 최근의 사실은 각 유전자의 5' 말단에서 전사 조절을 위한 서열이 서브게놈 mRNA의 불연속 전사를 조절하는 신호를 나타낸다는 것을 나타낸다는 것이다.
바이러스 막의 단백질(S, E 및 M 단백질)은 중간 구획에 삽입되는 반면, 복제된 RNA(+ 가닥)는 N(뉴클레오캡시드) 단백질과 조립된다. 이 단백질-RNA 복합체는 소포체의 막에 포함된 M 단백질과 결합하고 뉴클레오캡시드 복합체가 소포체로 발아하면 바이러스 입자가 형성된다. 그런 다음 바이러스는 골지체 복합체를 가로질러 이동하고 결국 세포외유출(exocytosis)에 의해 세포를 떠난다. 바이러스가 숙주 세포에 부착되는 부위는 S 단백질의 수준이다.
재조합 홍역 바이러스
기존 또는 신흥, 아마도 대유행성 코로나바이러스에 대한 백신, 특히 어린이(특히 어린 아이 또는 영유아) 또는 성인 집단 또는 둘 모두에서 사용할 수 있는 백신을 개발하기 위해, 본 발명자들은 홍역 바이러스 벡터에 의한 선택된 항원(또는 이의 적합한 부분(들))에서 유래된 폴리펩티드의 발현을 기반으로 하는 전략을 설계했는데, 여기서 특히 홍역 바이러스(MV 또는 MeV)는 백신 홍역 바이러스와 같은 약독화된 생 홍역 바이러스로부터 선택된다. 특정 구현예에서, 생 약독화 홍역 바이러스는 Schwarz 균주이다.
본 발명은 스파이크 유래 항원을 포함하는 코로나바이러스 항원 또는 이로부터 유래된 폴리펩티드를 숙주의 면역계에 제공하기 위한 새로운 접근법을 제안하고, 특히 포유동물 숙주, 특히 인간 숙주에서 면역 반응을 유도하여 코로나바이러스, 특히 SARS-CoV-2 균주에 의해 야기되는 질병에 대한 보호, 특히 예방적 보호를 부여하기 위한 이러한 폴리펩티드 또는 항원을 발현하기 위한 홍역 바이러스 벡터의 용도를 제공한다. 또한, 홍역 바이러스를 코로나바이러스의 면역원성 폴리펩티드의 벡터로 사용하는 이 접근법은 벡터 특성, 특히 벡터의 면역 특성으로부터 이점을 취하여 숙주에서 면역 반응의 품질을 개선한다. 따라서 본 발명자들은 포유동물, 특히 인간 개체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염으로 인한 질병에 대해 효과적이고 오래 지속되는 면역 반응을 유도할 수 있는 재조합 감염성 생 약독화 홍역 바이러스, 예를 들어 Schwarz 균주를 사용하여 얻은 재조합 홍역 바이러스를 제공한다.
따라서 본 발명은 코로나바이러스 면역원 또는 코로나바이러스 항원의 에피토프를 발현하기 위한 벡터로서의 홍역 바이러스의 용도에 관한 것이다. 몇몇 구현예에서, 상기 면역원 또는 에피토프는 코로나바이러스의 S, E, N, ORF3a, ORF8, ORF7a 및 M 단백질과 같은 위에서 일반적으로 기재한 바와 같거나 SARS-CoV-2 균주에 대해 구체적으로 설명되고 본 설명에 예시되어 있는 SARS-CoV-2의 야생형 항원에서 유래된 폴리펩티드를 포함한다.
재조합 홍역 바이러스 입자는 포유동물 숙주에서 면역 반응을 유도하기에 충분한 에피토프를 포함하는 야생형 SARS-CoV-2 항원, 이의 단편, 또는 돌연변이되거나 절단된 항원을 발현할 수 있고, 여기서의 천연 항원의 아미노산 잔기 또는 영역의 결실로 인한 돌연변이 또는 절단 또는 단편은 항원의 면역원성 특성을 보존하고 이들의 생산 또는 면역원성 조성물에서의 이들의 사용을 가능하게 한다. 따라서, 돌연변이된 항원 또는 항원의 단편은 세포에서 개선된 안정성을 가질 수 있고/있거나 항원의 가용화된 형태 및/또는 항원의 다량체 형태, 특히 이의 삼량체(예를 들어, 스파이크 유래 항원의 경우)의 회수를 가능하게 할 수 있다. 본원에 개시된 폴리펩티드는 특히 CoV, 특히 SARS-CoV-2로부터 유래하고, 천연 단백질과 동일할 수 있거나 대안적으로 돌연변이, 특히 치환(특히 보존적 아미노산 잔기에 의한), 또는 아미노산 잔기의 추가 또는 번역 후 2차 변형(글리코실화 포함)에 의해 또는 천연 단백질(들)의 일부를 결실시켜 천연 단백질보다 짧은 크기를 갖는 단편을 얻는 것을 비롯한 표적화된 점 돌연변이에 의해 유래될 수 있는 구조적 단백질이다. 단편은 숙주, 특히 포유동물 숙주, 특히 인간 숙주에서 면역 반응, 바람직하게는 CoV, 특히 SARS-CoV-2에 대한 보호를 가능하게 하는 반응을 유도하기에 적합한 천연 단백질의 에피토프를 보유하는 정도로 본 발명에 포함된다. 에피토프는 특히 단백질이 투여된 숙주 또는 본 발명의 감염성 복제 입자 투여 후 발현되는 숙주에서 항체 생성의 활성화를 통해 체액성 면역 반응을 유도하는데 관여하는 B 세포 에피토프 유형이다. 에피토프는 대안적으로 세포 매개 면역 반응(CMI 반응)의 유도에 관여하는 유형의 T 세포 에피토프일 수 있다. 단편은 CoV, 특히 SARS-CoV-2의 천연 단백질의 아미노산 서열 크기의 50% 초과, 바람직하게는 적어도 90% 또는 95%를 나타내는 크기를 가질 수 있다. 대안적으로, 단편은 천연 단백질의 에피토프(들)를 보유하는 10개 이상의 아미노산 잔기를 갖는 짧은 폴리펩티드일 수 있다. 이와 관련하여 단편은 또한 본원에 정의된 폴리에피토프를 포함한다. 특정 구현예에서, 폴리펩티드는 항원의 가용성 부분을 함유하거나 항원의 가용성 부분으로 구성되고/되거나 점 돌연변이된(예를 들어, 천연 항원의 아미노산 잔기의 1, 2 또는 5% 미만의 치환에 의한) 천연 항원의 단편이다. 돌연변이는 세포에서 안정성을 향상시키도록 설계될 수 있다. 폴리펩티드(예: S 폴리펩티드)는 특히 코로나바이러스 천연 또는 변형 항원의 삼량체 형태 또는 삼량체화 형태로 발현될 수 있다. "폴리펩티드" 및 "항원"이라는 단어는 본원에 제공된 정의에 따라 본 발명에 따른 "코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드"를 정의하기 위해 상호교환적으로 사용된다. 따라서 폴리펩티드의 아미노산 서열은 CoV의 천연 성숙 또는 전구체 단백질인 폴리펩티드를 포함하여 CoV 균주, 특히 SARS-CoV-2의 항원에 있는 대응물과 동일하거나, 이의 면역원성 단편 또는 이의 변이체를 정의하기 위한 삽입, 치환 또는 결실에 의해 변형된다.
특히, 천연 발생 CoV 폴리펩티드와 적어도 50%, 적어도 80%, 적어도 90% 또는 적어도 95% 아미노산 서열 동일성을 갖는 단편 또는 변이체. 아미노산 서열 동일성은 본원에 정의된 바와 같이 결정될 수 있다. 본 발명의 CoV 단백질의 단편 또는 돌연변이체는 본원에 예시된 특정 아미노산 서열과 관련하여 정의될 수 있다.
본 발명의 제1 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2의 당단백질 S로부터 유래되고: 이들은 글리코실화 또는 비-글리코실화된 형태의 S 폴리펩티드일 수 있거나, 이들은 기능적 도메인(들), 특히 바이러스의 수명 주기에 영향을 미치는 도메인(들)이 결핍되거나 변형되어 있는 전장 S 폴리펩티드의 더 짧은 단편을 비롯한, 면역원성 단편 S1 및/또는 S2와 같은 이의 단편 또는 이의 더 짧은 단편일 수 있다. 본 발명에 따르면, 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드의 단편은 재조합 바이러스 입자의 맥락에서 면역 반응을 유도하기에 적합한 에피토프를 포함한다. 본 발명에 따른 S의 특정 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 하기에 열거된 폴리펩티드이며, 이러한 폴리펩티드는 특히 하기에 기재되는 뉴클레오티드 서열에 의해 암호화되거나 본원에 기재된 아미노산 서열을 갖는다: SARS-CoV-2의 S 폴리펩티드, SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함), SARS-CoV-2의 Secto 폴리펩티드, SARS-CoV-의 stab-Secto 폴리펩티드 2, SARS-CoV-2의 S1 폴리펩티드, SARS-CoV-2의 S2 폴리펩티드, SARS-CoV-2의 tri-Secto 폴리펩티드, SARS-CoV-2의 tristab-Secto 폴리펩티드, SARS-CoV-2의 S3F 폴리펩티드, SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2P_F 폴리펩티드, S2PΔF2A SARS-CoV-2의 폴리펩티드, SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F) 폴리펩티드, SARS-CoV-2의 S6P 폴리펩티드, SARS-CoV-2의 S6P3F 폴리펩티드, SARS-CoV-2의 S6PΔF 폴리펩티드, SARS-CoV-2의 SCCPP 폴리펩티드, SARS-CoV-2의 SCC6P 폴리펩티드, SARS-CoV-2의 SMVopt2P 폴리펩티드, SARS-CoV-2의 SMVoptΔF 폴리펩티드, SARS-CoV-2의 SMVopt2PΔF 폴리펩티드. 이는 바람직하게는 SARS-CoV-2의 S, stab-S(S2P라고도 함), S3F, S2P3F, S2PΔF 및 S2PΔF2A 폴리펩티드로 이루어진 군에서 선택된다. 단편은 야생형 서열로부터 수득될 수 있거나 야생형 서열에 대해 돌연변이 및/또는 결실될 수 있다. 본 발명에 따른 S의 바람직한 단편 또는 S의 돌연변이된 단편은 하기로 이루어진 군으로부터 선택된다: SARS-CoV-2의 S 폴리펩티드, SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함), SARS-CoV-2의 S3F 폴리펩티드, SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2PΔF 폴리펩티드, SARS-CoV-2의 S2PΔF2A 폴리펩티드, SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F) 폴리펩티드, SARS-CoV-2의 S6P 폴리펩티드, SARS-CoV-2의 S6P3F 폴리펩티드, SARS-CoV-2의 S6PΔF 폴리펩티드, SARS-CoV-2의 SCCPP 폴리펩티드, SARS-CoV-2의 SCC6P 폴리펩티드, SARS-CoV-2의 SMVopt2P 폴리펩티드, SARS-CoV-2의 SMVoptΔF 폴리펩티드 및 SARS-CoV-2의 SMVopt2PΔF 폴리펩티드. 본 발명에 따른 S의 보다 바람직한 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 SARS-CoV-2의 S2P3F 폴리펩티드, SARS-CoV-2의 S2PΔF 폴리펩티드, SARS-CoV-2의 S2PΔF2A 폴리펩티드로 이루어진 군으로부터 선택되고, 바람직하게는 SARS-CoV-2의 S2PΔF 폴리펩티드, 더욱 바람직하게는 SARS-CoV-2의 S2PΔF2A 폴리펩티드이다.
바람직하게는, 1, 2, 3개 이상의 아미노산 돌연변이(들), 즉 아미노산 치환(들), 삽입(들) 및/또는 결실(들)이 하기에 기재된 것을 위해 CoV, 특히 코로나바이러스 SARS-CoV-2의 S 단백질의 아미노산 서열 내로 도입된다:
- 발현된 단백질을 융합전 상태(2P 돌연변이)로 유지하기 위해, 및/또는
- S1/S2 절단(3F 돌연변이 또는 포함하는 루프의 F 결실을 통한 푸린 절단 부위 불활성화)을 방지하기 위해, 및/또는
- 소포체 검색 신호(ERRS)(아래에 정의된 바와 같은 2A 돌연변이)를 불활성화하기 위해, 및/또는
- 닫힌 형태(즉, 하향 위치 또는 닫힌 하향 상태)에서 S 단백질의 S1 도메인에 국한된 수용체 결합 도메인(RBD)을 유지하기 위해.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질, 특히 N 단백질의 하기 항원 중 하나로부터 유래된다.
따라서, 본 발명은 다음을 포함하는 핵산 작제물에 관한 것이다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 특히 상기 개시된 것들을 포함하여 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 가지는 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제1 이종 폴리뉴클레오티드, 특히 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드를 암호화하는 상기 제1 폴리뉴클레오티드, 또는 이의 면역원성 단편, 또는 S 폴리펩티드의 변이체 또는 이의 단편.
여기서의 제1 이종 폴리뉴클레오티드는 재조합 MV-CoV, 특히 MV-CoVS 핵산 분자를 제공하기 위해 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한다(작동적으로 클로닝된다).
본 발명의 바람직한 구현예에서, 핵산 작제물은 다음을 포함한다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 하기를 암호화하는 제1 이종 폴리뉴클레오티드:
(a) 서열번호 3의 SARS-CoV-2의 전장 스파이크(S) 단백질, 또는
(b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군에서 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는
(c) 1, 2, 3개 이상의 아미노산 잔기 치환(들), 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환, 삽입 및/또는 결실을 갖는 (a) 또는 (b)의 변이체,
바람직하게는 돌연변이 항원은 하기를 포함한다:
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 특히 S2 도메인에서 발생하는 아미노산 잔기(들)의 치환에 의한 돌연변이, 바람직하게는 S2 도메인에서 발생하는 적어도 2개의 프롤린 잔기의 치환에 의한 돌연변이, 및/또는
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 특히 S1/S2 푸린 절단 부위에서 발생하는 아미노산 잔기(들)의 삽입, 치환 또는 결실에 의한 돌연변이, 및/또는
(iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는
(iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이. 여기서의 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치한다.
본 발명의 특정 구현예에서, 핵산 작제물에서:
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고/이거나
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 위치 675와 아미노산 위치 685 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고/이거나
(iii) EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고/이거나,
(iv) S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고/이거나
(v) (c)의 변이체는 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열(A570D)의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이, 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드로서, 특히 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 변이(K417N), 및 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T)로 이루어진 군에서 선택된 돌연변이를 포함하는 폴리펩티드를 암호화한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드는 서열번호 3의 SARS-CoV-2의 전장 S 단백질이다.
몇몇 구현예에서, 전장 S 단백질의 면역원성 단편 또는 항원성 단편은 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 K986P 및 V987P, 또는 서열번호 3의 아미노산 돌연변이 F817P, A892P, A899P, A942P, K986P 및 V987P를 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 S 단백질의 푸린 절단 부위를 불활성화시키는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 R682G, R683S 및 R685G, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 위치 675의 아미노산과 위치 685의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR으로 이루어지는 루프의 결실을 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 EERS를 불활성화시키는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서 2개의 알라닌 잔기의 치환을 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 S383C 및 D985C를 추가로 포함한다. 몇몇 구현예에서, 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 G413C 및 P987C를 추가로 포함한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70에서 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145에서 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 전장 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
몇몇 구현예에서, 전장 S 단백질 또는 면역원성 단편 또는 항원성 단편의 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 서열번호 52와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 986 및 987에서 변화하지 않은 변이체; 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 서열번호 54와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 서열번호 56과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 서열번호 58과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 서열번호 60과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 서열번호 62과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 817, 892, 899, 942, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 서열번호 5과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 986 및 987에서 변화하지 않은 변이체; 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 서열번호 65과 90% 이상의 동일성을 가지는 이의 변이체; 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드, 또는 서열번호 47과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 975 및 976에서 변화하지 않은 변이체; 또는 (j) SMVopt6P 폴리펩티드, 또는 MVopt6P 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (k) SMVopt6PΔF 폴리펩티드, 또는 MVopt6PΔF 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (l) SMVopt6P3F 폴리펩티드, 또는 SMVopt6P3F 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체;이다. 몇몇 구현예에서, 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드이다.
몇몇 구현예에서, 핵산 작제물은 서열번호 2의 완전히 최적화된 유전자 S 대신 서열번호 36의 홍역 최적화된 유전자 SMVopt를 사용하여 설계될 수 있다.
특정 구현예에서, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2 또는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다. 바람직하게는, 제1 이종 폴리뉴클레오티드는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다.
본 발명에 따른 핵산 작제물은 특히, 서로 작동가능하게 연결된 상이한 기원의 다양한 폴리뉴클레오티드의 재조합에 의해 수득되거나 수득가능한 정제된 DNA 분자이다. 이것은 또한 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 분자의 cDNA로 지정된 결과로 cDNA로 상호 교환 가능한 것으로 지정된다.
"작동가능하게 연결된"이라는 표현은 본 발명의 핵산 작제물의 상이한 폴리뉴클레오티드 사이에 존재하는 기능적 연결을 의미한다. 이러한 기능적 연결에 의하여, 상이한 폴리뉴클레오티드 및 핵산 작제물은 특히 세포 또는 세포주, 특히 본 발명의 재조합 감염성 MV 입자의 생성 또는 증폭을 위한 구출 시스템의 일부로서 사용되는 세포 또는 세포주 또는 숙주 세포, 특히 포유동물 또는 인간 세포에서 효율적으로 전사되고 적절한 경우 번역된다.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스에 의한 발현을 위한 추가의 이종 폴리펩티드는 코로나바이러스, 특히 SARS-CoV-2의 당단백질 S로부터 유래되고: 이들은 글리코실화 또는 비-글리코실화된 형태의 S 폴리펩티드일 수 있거나, 이들은 기능적 도메인(들), 특히 바이러스의 수명 주기에 영향을 미치는 도메인(들)이 결핍되거나 변형되어 있는 전장 S 폴리펩티드의 더 짧은 단편을 비롯한, 면역원성 단편 S1 및/또는 S2와 같은 이의 단편 또는 이의 더 짧은 단편일 수 있다. 본 발명에 따르면, 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드의 단편은 재조합 바이러스 입자의 맥락에서 면역 반응을 유도하기에 적합한 에피토프를 포함한다. 본 발명에 따른 S의 특정 단편 또는 S의 돌연변이된 단편 또는 S의 돌연변이된 항원은 하기에 열거된 폴리펩티드이며, 이러한 폴리펩티드는 특히 하기에 기재되는 뉴클레오티드 서열에 의해 암호화되거나 본원에 기재된 아미노산 서열을 갖는다: SARS-CoV-2의 S 폴리펩티드(서열번호 3), SARS-CoV-2의 stab-S 폴리펩티드(SARS-CoV-2의 S2P 폴리펩티드라고도 함)(서열번호 5), SARS-CoV-2의 Secto 폴리펩티드(서열번호 7), SARS-CoV-의 stab-Secto 폴리펩티드 2(서열번호 9), SARS-CoV-2의 S1 폴리펩티드(서열번호 11), SARS-CoV-2의 S2 폴리펩티드(서열번호 13), SARS-CoV-2의 tri-Secto 폴리펩티드(서열번호 17), SARS-CoV-2의 tristab-Secto 폴리펩티드(서열번호 19), 또는 소포체 보유에 관여하는 도메인에서 돌연변이된 S. 몇몇 구현예에서, 소포체 보유에 관여하는 도메인에서 돌연변이된 S는 바람직하게는 SARS-CoV-2의 S(서열번호 3) 또는 stab-S(S2P로도 명명됨)(서열번호 5) 폴리펩티드이거나 그로부터 유래된다. 단편은 야생형 서열로부터 수득될 수 있거나 야생형 서열에 대해 돌연변이 및/또는 결실될 수 있다.
본 발명에 따른 S의 바람직한 단편 또는 S의 돌연변이된 단편은 SARS-CoV-2의 S 폴리펩티드(서열번호 3), SARS-CoV-2의 stab-S 폴리펩티드(S2P로도 명명됨)(서열번호 5)로 이루어진 군으로부터 선택된다.
바람직하게는, 1, 2, 3개 이상의 아미노산 돌연변이(들), 즉 아미노산 치환(들), 삽입(들) 및/또는 결실(들)이 하기에 기재된 것을 위해 CoV, 특히 SARS-CoV-2의 S 단백질의 아미노산 서열 내로 도입된다:
- 발현된 단백질을 융합전 상태(2P 돌연변이)로 유지하기 위해, 및/또는
- 소포체 검색 신호(ERRS)를 불활성화하기 위해(서열번호 149의 KXHXX 모티프의 2A 돌연변이 또는 결실), 및/또는
- 세포내 체류의 활성, 특히 골지체와 소포체(ER) 구획 사이의 순환을 포함하는 체류의 활성을 방지하기 위해.
특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 적어도 ER에서 폴리펩티드의 회수(retrieval)를 손상시키고, 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 수행되고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함한다. 이러한 특정 도메인의 돌연변이는 생성된 폴리펩티드를 세포의 원형질막으로 수송할 수 있게 한다.
특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 이중 도메인 S 단백질의 세포 표면 발현을 적어도 증가시키고, 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬될 수 있는 S 단백질의 11개 아미노산 잔기 서열에서 수행되고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함한다. 이러한 특정 도메인의 돌연변이는 생성된 폴리펩티드를 세포의 원형질막으로 수송할 수 있게 한다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은, 야생형 전장 S 단백질의 세포 표면 발현과 비교하여 적어도 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 또는 약 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은, 야생형 전장 S 단백질의 세포 표면 발현과 비교하여 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은 약 1% 내지 약 100%, 약 5% 내지 약 100%, 약 10% 내지 약 100%, 약 15% 내지 약 100%, 약 20% 내지 약 100%, 약 25% 내지 약 100%, 약 30% 내지 약 100%, 약 35% 내지 약 100%, 약 40% 내지 약 100%, 약 45% 내지 약 100%, 약 50% 내지 약 100%, 약 55% 내지 약 100%, 약 60% 내지 약 100%, 약 65% 내지 약 100%, 약 70% 내지 약 100%, 약 75% 내지 약 100%, 약 80% 내지 약 100%, 약 85% 내지 약 100%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100% 증가된다. 특정 구현예에서, 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이를 갖는 이중 도메인 S 단백질의 세포 표면 발현은 1% 내지 100%, 5% 내지 100%, 10% 내지 100%, 15% 내지 100%, 20% 내지 100%, 25% 내지 100%, 30% 내지 100%, 35% 내지 100%, 40% 내지 100%, 45% 내지 100%, 50% 내지 100%, 55% 내지 100%, 60% 내지 100%, 65% 내지 100%, 70% 내지 100%, 75% 내지 100%, 80% 내지 100%, 85% 내지 100%, 90% 내지 100%, 또는 95% 내지 100% 증가된다.
본 발명의 또 다른 측면에서, 재조합 홍역 바이러스는 코로나바이러스, 특히 SARS-CoV-2의 하기 항원 중 하나로부터 유래된 항원성 폴리펩티드인 제2 이종 폴리펩티드를 발현할 수 있다: E(서열번호 23), N(서열번호 22), ORF3a(서열번호 26), ORF8(서열번호 25), ORF7a(서열번호 27) 또는 M(서열번호 24) 단백질, 특히 N(서열번호 22) 단백질.
따라서, 본 발명은 다음을 포함하는 핵산 작제물에 관한 것이다:
(1) 약독화된 홍역 바이러스(MV) 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제1 폴리뉴클레오티드, 특히 코로나바이러스(CoV), 특히 코로나바이러스 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드를 암호화하는 상기 제1 폴리뉴클레오티드, 또는 특히 상기 개시된 것들을 비롯하여, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편.
여기서의 제1 이종 폴리뉴클레오티드는 재조합 MV-CoV, 특히 MV-CoVS 핵산 분자를 제공하기 위해 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 다음을 포함한다:
(1) 약독화된 홍역 바이러스(MV) 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 하기 (a) 또는 (b)를 암호화하는 제1 이종 폴리뉴클레오티드:
(a) 다음을 포함하는 SARS-CoV-2의 이중 도메인 S 단백질 폴리펩티드:
- 이중 도메인 S 단백질의 세포질 꼬리에서 삽입, 치환 또는 결실에 의한 돌연변이. 여기서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273에 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 이루어지고, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하고, 여기서의 상기 삽입, 치환 또는 결실에 의한 돌연변이는 소포체(ER)내의 폴리펩티드의 검색을 적어도 손상시킨다. 특히 서열번호 3의 아미노산 서열의 위치 1263부터 1273까지의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하는 SARS-CoV-2의 이중 도메인 S 단백질, 단, 서열번호 3의 아미노산 서열의 위치 1269부터 위치 1273까지의 서열번호 150의 KLHYT 모티프의 적어도 2개의 아미노산 잔기가 치환에 의해 돌연변이되거나 또는 서열번호 3의 아미노산 서열의 위치 1269부터 1273까지 서열번호 150의 KLHYT 모티프가 결실되어 있다.
- 선택적으로, 발현된 이중 도메인 S 단백질을 융합전 형태로 유지하는 치환에 의한 추가 돌연변이.
(b) (a)의 이중 도메인 S 단백질의 면역원성 단편 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이된 항원.
여기서의 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU2)에 위치하거나, 또는 MV(ATU3)의 H 유전자의 하류에 위치한 추가 전사 단위, 바람직하게는 ATU2에 위치한다.
본 발명의 특정 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 하기로 이루어진 군으로부터 선택된 돌연변이를 추가로 포함한다: 서열번호 3의 아미노산 서열의위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G). 특히, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 하기로 이루어진 군으로부터 선택된 돌연변이를 추가로 포함한다: 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 및 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T).
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이의 특정 구현예에서, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 모든 아미노산 잔기가 치환되거나 결실된다.
S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이의 또 다른 특정 구현예에서, 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 일부가 치환되거나 결실된다.
본 발명의 특정 구현예에서, S 단백질의 세포질 꼬리에서의 삽입, 치환 또는 결실에 의한 돌연변이는 서열번호 149의 KXHXX 모티프를 포함하는 ERRS 신호의 아미노산 잔기의 전부 또는 일부의 삽입, 치환 또는 결실에 의한 돌연변이, 및 1, 2, 3, 4, 5 또는 6개의 아미노산 잔기(들)의 삽입, 치환 또는 결실에 의한 돌연변이를 포함하고, 상기 돌연변이는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬될 수 있는 S 단백질의 11개 아미노산 잔기 서열에서 발생한다.
바람직하게는, 제1 이종 폴리뉴클레오티드는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서 2개의 알라닌 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 아미노산 서열의 위치 1269 내지 1273의 아미노산 잔기의 결실, 또는 서열번호 3의 아미노산 서열의 위치 1263 내지 1273의 아미노산 잔기의 결실포함하는 SARS-CoV-2의 이중 도메인 S 단백질을 암호화한다.
더 바람직하게는, 제1 이종 폴리뉴클레오티드는 (a) 서열번호 3의 아미노산 서열의 위치 986 및 987에서 2개의 프롤린 잔기의 치환에 의한 돌연변이 및 서열번호 3의 아미노산 서열의 위치 1263 내지 1273의 11개의 C-말단 아미노산 잔기의 결실을 포함하는 SARS-CoV-2의 융합전-안정화된(prefusion-stabilized) SF-2P-dER 폴리펩티드, 또는 (b) 서열번호 3의 아미노산 서열의 위치 986 및 987의 2개의 프롤린 잔기의 치환에 의한 돌연변이 및 서열번호 3의 아미노산 서열의 위치 1269 및 1271의 2개의 알라닌 잔기의 치환에 의한 돌연변이를 포함하는 SARS-CoV-2의 융합전-안정화 SF-2P-2a 폴리펩티드를 암호화한다. 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2 또는 MV의 H 유전자의 하류에 위치한 ATU3에 위치한다. 바람직하게는, 제1 이종 폴리뉴클레오티드는 MV의 P 유전자와 M 유전자 사이에 위치한 ATU2에 위치한다. 본 발명에 따른 핵산 작제물은 서로 작동가능하게 연결된 상이한 기원의 다양한 폴리뉴클레오티드의 재조합에 의해 얻거나 얻을 수 있는 정제된 DNA 분자이다. 핵산 작제물은 홍역 바이러스(MV)의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자를 포함할 수 있다.
본 발명의 특정 구현예에서, 핵산 작제물은 코로나바이러스, 특히 코로나바이러스 SARS-CoV-2의 적어도 하나의 폴리펩티드, 이의 면역원성 단편 (야생형 또는 돌연변이된 단편 포함), 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이된 항원을 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 여기서의 폴리펩티드는 제1 이종 폴리뉴클레오티드에 의해 암호화된 적어도 하나의 폴리펩티드 또는 제1 이종 폴리뉴클레오티드에 의해 암호화된 폴리펩티드와 상이하고, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 단편 또는 이의 돌연변이 단편, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택되고, 제2 이종 폴리뉴클레오티드는 ATU 내에서 제1 이종 폴리뉴클레오티드의 위치와 별개의 위치에 위치한다.
본 발명의 특정 구현예에서, 핵산 작제물은 코로나바이러스, 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드, 이의 면역원성 단편 또는 이의 항원성 단편(야생형 또는 돌연변이된 단편 포함), 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이 항원을 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 여기서의 폴리펩티드는 제1 이종 폴리뉴클레오티드에 의해 암호화된 적어도 하나의 폴리펩티드와 상이하고, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 단편 또는 이의 돌연변이된 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택되고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 별개의 위치에서 추가 전사 단위(ATU) 내부, 특히 MV(ATU1)의 N 유전자 상류의 추가 전사 단위 내부, 또는 특히 ATU2 내부 또는 특히 ATU3 내부에 위치한다.
제2 이종 폴리뉴클레오티드의 클로닝을 위한 ATU는 제1 이종 폴리뉴클레오티드의 클로닝에 사용된 ATU와 상이한 위치에 위치하고, 특히 ATU1에서 MV의 N 유전자의 상류에 위치하거나, 특히 ATU2에서 MV의 P 유전자와 M 유전자 사이의 위치에서 ATU 내에 위치하거나 특히 ATU3에서 MV의 H 유전자의 하류의 위치에서 ATU내에 위치합니다.
추가의 측면에서, 본 발명은 하기를 포함하는 핵산 작제물에 관한 것이다:
(1) 홍역 바이러스(MV)의 전장, 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 및 ORF3a 폴리펩티드, 또는 이의 면역원성 또는 항원성 단편 또는 이의 돌연변이된 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 돌연변이 항원으로 이루어진 군에서 선택된, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하고 ATU 내에 위치하는 이종 폴리뉴클레오티드.
추가의 전사 단위(ATU) 서열, 특히 본 발명에서 사용되는 ATU1, ATU2, ATU3은 이종 폴리뉴클레오티드를 MV의 cDNA로 클로닝하는데 사용되는 MV의 cDNA에 있는 서열이다. ATU 서열은 선행 유전자의 프로모터와 같은 도입유전자(transgene)의 MV-의존성 발현에 필요한 시스 작용 서열을 포함하고, 삽입체는 폴리뉴클레오티드, 예를 들어, 제1 또는 제2 폴리뉴클레오티드로 표시되고, 제1 또는 제2 폴리뉴클레오티드는 코로나바이러스의 적어도 하나의 폴리펩티드, 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하거나, 특히 뉴클레오캡시드(N) 폴리펩티드, 매트릭스(M), E 폴리펩티드, ORF8 폴리펩티드, ORF7a 폴리펩티드 또는 ORF3a 폴리펩티드, 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편 또는 이의 돌연변이 단편 또는 이의 돌연변이 항원을 암호화한다. 또한, 상기 폴리뉴클레오티드의 삽입을 위한 다중 클로닝 부위 카세트을 포함한다. 유전자의 유전자간 서열(전사를 촉진하는 유전자 시작부(GS) 및 삽입물(이종 폴리뉴클레오티드)의 전사를 종결시키는 MV의 P 유전자의 유전자 말단부(GE) 포함) 외에도, ATU는 이종 폴리뉴클레오티드의 삽입을 위한 폴리링커 서열을 포함한다. ATU 서열은 본 발명의 작제물에 예시되어 있다.
본 발명을 수행하기 위해 사용될 때, ATU는 유리하게는 MV의 안티게놈의 전장 (+)RNA 가닥을 암호화하는 cDNA 분자의 N-말단 서열 내에 위치하고, 특히 N 유전자(ATU1)의 상류측에 위치하거나 또는 이 바이러스의 P와 M 유전자 사이(ATU2) 또는 H와 L 유전자 사이(ATU3)에 위치한다. MV의 바이러스 RNA의 전사는 5'에서 3' 말단으로의 구배를 따르는 것으로 관찰되었다. 따라서, cDNA의 코딩 서열의 5' 말단에 삽입된 ATU는 cDNA의 코딩 서열의 3' 말단에 더 가깝게 삽입된 ATU보다 ATU 내에서 이종 DNA 서열의 더 큰 발현을 가능하게 할 것이다. 예시적인 ATU는 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드와 같은 적어도 하나의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드를 포함할 수 있다.
따라서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 암호화하는 폴리뉴클레오티드는 특히 ATU에서 MV의 cDNA 분자의 임의의 유전자간 영역에 삽입될 수 있다. 본 발명의 특정 작제물은 실시예에 예시된 것들이다.
본 발명의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 암호화하는 폴리뉴클레오티드는 MV cDNA 분자(ATU2)의 P 및 M 유전자 사이, 또는 MV cDNA 분자(ATU3)의 H 및 L 유전자 사이의 분자간 영역, 바람직하게는 ATU3에 삽입된다.
본 발명의 특정 구현예에서, 작제물은 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티트, 특히 스파이크 (S) E, N, ORF3a, ORF8, ORF7a 또는 M 폴리펩티드(예를 들어, Genbank MN908947.3에 개시된 서열을 갖는 S 폴리펩티드 또는 천연 S 항원에서 유래하고 본원에 예시된 임의의 폴리펩티드, 특히 S 단편 또는 S의 변형 단편), 또는 본 명세서에 개시된 바와 같은 이의 면역원성 단편(돌연변이된 단편 포함) 또는 1, 2, 3개 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 돌연변이 항원을 암호화하는 폴리뉴클레오티드를, MV의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA에 클로닝함으로써 제조된다.
대안적으로, 본 발명의 핵산 작제물은 핵산 단편의 합성 단계 또는 PCR에 의한 것을 포함하는 주형으로부터의 중합 단계를 사용하여 제조될 수 있다.
본 발명의 핵산 작제물 및 본 발명의 MV-CoV는 코로나바이러스, 또는 특히 SARS-CoV-2 균주의 S, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질로 이루어진 군으로부터 선택되는 적어도 하나의 폴리펩티드, 특히 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하거나 발현한다.
바람직한 구현예에 따르면, 본 발명은 또한, 코로나바이러스, 특히 SARS-CoV-2 균주의 S, E, N, ORF3a, ORF8, ORF7a 또는 M 단백질로 이루어진 군에서 선택된 적어도 하나의 폴리펩티드, 특히 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편이 숙주, 특히 인간 숙주에서 MV-CoV의 키메라 감염 입자의 표면에서 효율적으로 발현되는 것을 가능하게 하는 폴리뉴클레오티드의 변형 및 최적화에 관한 것이다.
이러한 구현예에 따르면, 폴리뉴클레오티드 서열의 최적화는 다음을 포함하는 핵산 분자의 시스-활성 도메인을 피하여 작동될 수 있다: 내부 TATA-박스, 카이(chi) 부위 및 리보솜 진입 부위; AT-풍부 또는 GC-풍부 시퀀스 스트레치; AU-풍부 서열 요소(ARE), 억제 서열 요소(INS) 및 시스 작용 억제자(CRS) 서열 요소; 반복 서열 및 RNA 2차 구조; 크립틱(cryptic) 스플라이스 공여 및 수용 부위, 및 분기점(branch point).
최적화된 폴리뉴클레오티드는 또한 특정 세포 유형에서의 발현을 위해 코돈 최적화될 수 있다. 이 최적화를 통해 발현된 단백질(들)에 영향을 주지 않고 세포에서 키메라 감염 입자 생산의 효율성을 높일 수 있다.
본 발명의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)를 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드는 인간에서 사용하기 위해 코돈 최적화된 것이다.
코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드, 또는 이의 면역원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 S 폴리펩티드 또는 이의 단편의 변이체를 암호화하는 폴리뉴클레오티드의 최적화는 원래의 것에 대한 코돈으로부터 번역된 아미노산 잔기의 동일성에 영향을 미치지 않으면서 코돈에서 워블 위치(wobble position)의 변형에 의해 수행될 수 있다.
전사 편집을 초래할 수 있는 홍역 바이러스로부터 특정 서열을 제거하기 위해 최적화도 수행된다. 홍역 바이러스 전사체의 편집은 특히 홍역 바이러스의 P 유전자에 의해 암호화된 전사체에서 발생한다. P 전사체 내의 특정 부위에의 여분의 G 잔기를 삽입에 의한 이러한 편집은 P 단백질에 비해 잘린 새로운 단백질을 생성한다. 단일 G 잔기만 추가하면 고유한 카르복실 말단을 포함하는 V 단백질이 발현된다(Cattaneo R 등, Cell. 1989 Mar 10;56(5):759-64).
본 발명의 특정 구현예에서, 홍역 전사체 편집 서열은 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드로부터 변경된 것이다. 하기의 다음 홍역 전사 편집 서열이 돌연변이될 수 있다: AAAGGG, AAAAGG, GGGAAA, GGGGAA, TTAAA, AAAA 및 이들의 상보적 서열: TTCCCC, TTTCCC, CCTTTT, CCCCTT, TTTAA, TTTT. 예를 들어, AAAGGC는 AAAGGC에서 돌연변이될 수 있고, AAAAGG는 AGAAGG 또는 TAAAGG 또는 GAAAGG에서 돌연변이될 수 있고, GGGAAA는 GCGAAA에서 돌연변이될 수 있다.
본 발명의 특정 구현예에서, 특정 펩티드/단백질/항원을 암호화하는 폴리뉴클레오티드의 천연 및 코돈 최적화된 뉴클레오티드 서열 뿐만 아니라 본 발명의 이러한 펩티드/단백질/항원의 아미노산 서열은 서열번호 1 내지 49, 51 내지 66 및 73 내지 82하기 개시된 서열로부터 선택된다. 이러한 많은 서열에 대한 추가 정보는 하기 표 1 및 3을 참조한다.
코돈 최적화 유전자는 잘 전사/번역되지 않은 유전자의 높은 수준의 발현을 촉진하고 높고 안정적인 항원 발현으로 홍역 기반 백신 후보를 회수하는데 모두 유용하다. 그러나, 이들은 이들의 디자인과 최종 코돈(최종 숙주 게놈에서 가장 많이 사용되는 코돈) 및 뉴클레오티드(높은 GC/AT 비율) 조성과 본질적으로 관련이 있는 주요 단점을 가지고 있다. 따라서, 코돈 최적화된 유전자는 가장 자주, 높은 수준의 번역을 촉진하여 높은 수준으로 전사되면 번역 및 번역 후 세포 기계의 포화를 초래하고 발현된 단백질의 품질과 세포 자체(ER 및 Golgi 스트레스)에 대한 관련 결과를 초래한다. 자연적으로 높은 GC/조성(보통 55-60% 이상)은 MV 게놈의 GC 조성이 훨씬 낮기 때문에(47.4%) 안정적인 재조합 MV 벡터의 조작에 확실히 최적이 아니다. 따라서 본 발명자들은 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드(들)를 암호화하는 폴리뉴클레오티드에서 하기의 특징을 갖는 MV 플랫폼용으로 최적화된 유전자를 조작하기로 결정했다:
- 양 가닥에서 MV 편집(AnGn, n≥3) 및 코어 유전자 말단(A4CKT) 유사 서열의 부재,
- 적용가능한 경우, 내부 TATA 박스, 카이 사이트 및 리보솜 진입 사이트의 제거(번역 효율성을 위해),
- 적용 가능한 경우, AT-풍부 또는 GC-풍부 서열 스트레치, RNA 불안정성 모티프, 반복 서열 및 RNA 2차 구조의 제거(전사 효율, mRNA 안정성 및 번역 효율을 위해), 및/또는
- 균형 잡힌 코돈 조성, 적용 가능한 경우 희귀 코돈 및 가장 빈번한 코돈의 높은 사용을 회피(번역 기계의 포화 없이 번역의 효율성, 정확성 및 속도를 위해),
- 44 내지 50%의 타겟 GC 조성(MV 게놈의 조성에 맞게 조정).
또한, 고등 진핵생물에서 잠복 스플라이스 공여 및 수용 부위를 제거하기 위한 기준이 추가되었으며, 이는 MV 플랫폼에는 중요하지 않지만 포유동물 세포에서 일시적 형질감염에 의한 합성 유전자 발현을 모니터링하는 것을 가능하게 한다.
BsiWI 및 BssHII 제한 부위는 각각 설계된 뉴클레오티드 서열의 5' 및 3' 말단에 추가되었고, 생성된 cDNA가 뉴클레오티드 수를 규정하는 "6법칙"을 준수하도록 적절한 스페이서 서열이 삽입되었다. MV 게놈의 뉴클레오티드의 수는 6의 배수여야 한다.
얻어지는 cDNA는 S_MV 최적화된 합성 유전자로 명명되었고 N_MV 최적화된 합성 유전자는 본원에서 각각 서열번호 36 및 서열번호 37로 개시되어 있다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드는 아래 표 1에 언급한 바와 같이, 서열번호 34(pKM-ATU2-S_2019-nCoV(즉, SARS-CoV-2)) 또는 서열번호 35(pKM-ATU3- S_2019-nCoV(즉, SARS-CoV-2))를 갖는다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드는, 서열번호 144 (pTM2-SF-dER_SARS-CoV-2), 서열번호 145 (pTM2-S2-dER_SARS-CoV-2), 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2), 서열번호 147 (pTM2-S2-2P-dER_SARS-CoV-2) 및 서열번호 148 (pTM2-SF-2P-2a_SARS-CoV-2)로 구성된 군으로부터 선택된 최적화된 서열, 바람직하게는 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2) 또는 서열번호 148 (pTM2-SF-2P-2a_SARS-CoV-2)의 서열, 더 바람직하게는 서열번호 146 (pTM2-SF-2P-dER_SARS-CoV-2)의 서열을 가진다.
본 발명의 특정 구현예에서, 전달 벡터 플라스미드 내에 본원에 정의된 바와 같은 핵산 작제물의 삽입은 돌연변이, 특히 침묵 돌연변이(들)를 유발할 수 있다.
본 발명의 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 S 폴리펩티드의 서열번호 11의 S1 도메인 또는 서열번호 13의 S2 도메인, 바람직하게는 서열번호 3의 야생형 S 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖는 돌연변이된 항원을 포함할 수 있다. 치환은 안정성을 향상시키도록 설계될 수 있다.
본 발명의 특정 구현예에서, 제1 이종 폴리뉴클레오티드는 서열번호 3의 야생형 S 폴리펩티드, 또는 이의 면역원성 단편을 암호화한다. 면역원성 단편은 S 폴리펩티드의 서열번호 11의 S1 도메인 또는 서열번호 13의 S2 도메인, 바람직하게는 서열번호 3의 야생형 S 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖는 돌연변이된 항원, 특히 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환, 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환을 갖고 본원에 개시된 바와 같이 세포질 꼬리에 최대 11개의 아미노산 잔기 결실을 갖는 돌연변이된 항원을 포함할 수 있다. 치환은 특히 안정성을 개선하도록 설계될 수 있다. 결실은 세포에서 폴리펩티드의 표면 발현을 개선하도록 설계될 수 있다. 특정 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17 및 19로 이루어진 군으로부터 선택된 아미노산 서열의 폴리펩티드, 특히 서열번호 5의아미노산 서열의 폴리펩티드를 암호화한다. 바람직한 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 서열번호 82의 SF-2P-2a 폴리펩티드, 바람직하게는 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 및/또는 결실을 갖는 돌연변이된 항원을 암호화한다.
특정 구현예에 따르면, 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65, 특히 서열번호 5, 43, 45, 47 및 49, 바람직하게는 서열번호 43, 45, 47 및 49, 더욱 바람직하게는 서열번호 45, 47 및 49로 이루어진 군으로부터 선택된 아미노산 서열, 더욱 더 바람직하게는 서열번호 47 또는 서열번호 49, 더욱 더 바람직하게는 서열번호 49의 아미노산 서열을 갖는 돌연변이 항원을 암호화한다.
본 발명의 특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 단일 폴리펩티드는 핵산 작제물에 의해 암호화되고 폴리펩티드는 본원에 기재된 바와 같은 S 폴리펩티드 또는 이의 일부분 또는 단편이다.
본 발명의 핵산 작제물의 특정 구현예에서, 제2 이종 폴리뉴클레오티드는 (i) 서열번호 22의 N 폴리펩티드, 이의 면역원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 또는 결실을 갖는 N 폴리펩티드의 돌연변이 항원, 및/또는 (ii) 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, (iii) 서열번호 23의 E 폴리펩티드, (iv) 서열번호 25의 ORF8 폴리펩티드, (v) 서열번호 27의 ORF7a 폴리펩티드 및/또는 (vi) 코로나바이러스, 특히 SARS-CoV-2의 서열번호 26의 ORF3a 폴리펩티드, 이의 면역원성 단편 또는 이의 항원성 단편, 또는 1, 2, 3개 또는 그 이상의 아미노산 잔기 치환(들) 또는 삽입(들) 및/또는 결실(들), 특히 10개 미만, 또는 5개 미만의 아미노산 잔기 치환 또는 부가 및/또는 결실을 갖는 돌연변이 항원을 암호화한다. 본 발명의 바람직한 구현예에서, N 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드는 서열번호 20, 21 또는 37의 서열, 바람직하게는 서열번호 21 또는 서열번호 37의 서열을 갖는다.
본 발명의 바람직한 구현예에서, S 폴리펩티드, S1 폴리펩티드 또는 S2 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실을 갖는 이의 면역원성 단편을 암호화하는 이종 폴리뉴클레오티드는 야생형 유전자의 오픈 리딩 프레임을 포함하거나 그로 구성하거나 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈 최적화된 오픈 리딩 프레임(들)(coORF)을 가지며, 특히 이종 폴리뉴클레오티드는 다음 서열:
- S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36, 바람직하게는 서열번호 2, 또는
- S1 폴리펩티드를 암호화하는 서열번호 10, 또는
- S2 폴리펩티드를 암호화하는 서열번호 12, 또는
- stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4(S2P 폴리펩티드라고도 함), 또는
- Secto 폴리펩티드를 암호화하는 서열번호 6, 또는
- stab-Secto 폴리펩티드를 암호화하는 서열번호 8, 또는
- stab-S2 폴리펩티드를 암호화하는 서열번호 14, 또는
- tri-Secto 폴리펩티드를 암호화하는 서열번호 16, 또는
- tristab-Secto 폴리펩티드를 암호화하는 서열번호 18, 또는
- S3F 폴리펩티를 암호화하는 서열번호 42, 또는
- S2P3F 폴리펩티드를 암호화하는 서열번호 44, 또는
- S2PΔF 폴리펩티드를 암호화하는 서열번호 46, 또는
- S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48, 또는
- T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51, 또는
- S6P 폴리펩티드를 암호화하는 서열번호 53, 또는
- S6P3F 폴리펩티드를 암호화하는 서열번호 55, 또는
- S6PΔF 폴리펩티드를 암호화하는 서열번호 57, 또는
- SCCPP 폴리펩티드를 암호화하는 서열번호 59, 또는
- SCC6P 폴리펩티드를 암호화하는 서열번호 61, 또는
- SMVopt2P 폴리펩티드를 암호화하는 서열번호 63, 또는
- SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 또는
- SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66 중 하나를 포함하며,
바람직하게는 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 42, 서열번호 44, 서열번호 46, 및 서열번호 48로 이루어진 군으로부터 선택되는 서열을 포함하며, 더 바람직하게는 이종 폴리뉴클레오티드는 S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48의 서열을 포함한다.
본 발명의 특정 구현예에서, 핵산 작제물은 ORFs를 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 코로나바이러스, 특히 SARS-CoV-2의 S 폴리펩티드, 특히 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU), 특히 ATU2 또는 ATU3, 바람직하게는 ATU3 내에 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 상기 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다. 본 발명의 핵산 작제물의 보다 바람직한 구현예에서, (i) 제1 이종 폴리뉴클레오티드는 홍역 바이러스-최적화된 뉴클레오티드 서열, 특히 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군에서 선택된 서열을 포함하고, ATU2 내에 위치하거나, 또는 (ii) 제1 이종 폴리뉴클레오티드는 코돈 최적화된 뉴클레오티드 서열, 특히 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61로 이루어진 군에서 선택된 서열을 포함하고, ATU3 내에 위치한다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 (i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치하고, 제2 이종 폴리뉴클레오티드, 특히 N 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되며, 또는 (ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치하고, 제2 이종 폴리뉴클레오티드, 특히 N 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치된다.
또 다른 구현예에서, 제1 이종 폴리뉴클레오티드는 제2 이종 폴리뉴클레오티드로 대체된다.
본 발명의 또 다른 측면에서, 핵산 작제물은 ATU2 또는 ATU3 내에 위치하는, 본원에 정의된 바와 같은 이른바 제2 이종 폴리뉴클레오티드와 같은 단 하나의 이종 폴리뉴클레오티드를 포함한다. 몇몇 구현예에서, 이러한 제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화한다. 몇몇 구현예에서, N 폴리펩티드를 암호화하는 이러한 제2 이종 폴리뉴클레오티드는 서열번호 20, 21 또는 37의 서열, 바람직하게는 서열번호 21 또는 서열번호 37의 서열을 갖는다. 이 핵산 작제물은 또 다른 이종 폴리뉴클레오티드, 예를 들어 본원에 정의된 바와 같은 이른바 제1 이종 폴리뉴클레오티드를 추가로 포함할 수 있다. 본 명세서에 개시된 모든 정의 및 구현예는 본 발명의 이러한 다른 측면에 적용되며 모든 단락은 서로 결합될 수 있다.
본 발명의 바람직한 구현예에서, S 폴리펩티드, S1 폴리펩티드 또는 S2 폴리펩티드, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편를 암호화하는 이종 폴리뉴클레오티드는 야생형 유전자의 오픈 리딩 프레임을 포함하거나 이로 구성되거나, 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈-최적화된 오픈 리딩 프레임(들)(coORF)을 가지며, 특히 이종 폴리뉴클레오티드는 다음 서열:
- S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36, 바람직하게는 서열번호 2, 또는
- S1 폴리펩티드를 암호화하는 서열번호 10, 또는
- S2 폴리펩티드를 암호화하는 서열번호 12, 또는
- stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4(S2P 폴리펩티드라고도 함), 또는
- Secto 폴리펩티드를 암호화하는 서열번호 6, 또는
- stab-Secto 폴리펩티드를 암호화하는 서열번호 8, 또는
- stab-S2 폴리펩티드를 암호화하는 서열번호 14, 또는
- tri-Secto 폴리펩티드를 암호화하는 서열번호 16, 또는
- tristab-Secto 폴리펩티드를 암호화하는 서열번호 18, 중 하나를 포함하며,
바람직하게는 이종 폴리뉴클레오티드는 서열번호 2 또는 서열번호 4의 서열을 포함한다.
본 발명의 더 바람직한 구현예에서, SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드, 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 이종 폴리뉴클레오티드는 포유동물 세포 및/또는 초파리 세포에서의 발현을 위한 코돈-최적화된 오픈 리딩 프레임(들)(coORF)의 오픈 리딩 프레임을 가지며, 특히, 이종 폴리뉴클레오티드는 하기 서열 중 하나를 포함한다:
i. SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는
ii. SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81.
바람직하게는, 이종 폴리뉴클레오티드는 SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75의 서열을 포함한다.
본 발명의 특정 구현예에서, 핵산 작제물은 ORFs를 암호화하는 하기 폴리뉴클레오티드를 5'에서 3' 말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 적어도 S 폴리펩티드를 암호화하는 제1 이종 폴리뉴클레오티드, 코로나바이러스, 특히 SARS-CoV-2의, 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU), 특히 ATU2 또는 ATU3, 바람직하게는 ATU3 내에 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
본 발명의 바람직한 구현예에서, 핵산 작제물은 오픈 리딩 프레임을 암호화하는 하기 폴리뉴클레오티드를 5'-에서 3'-말단 방향으로 포함하는 cDNA 작제물이다:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 본 발명에 따른 제1 이종 폴리뉴클레오티드, 특히 SARS-CoV-2의 SF-2P-dER 또는 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 여기서 제1 이종 폴리뉴클레오티드는 ATU2 또는 ATU3, 바람직하게는 ATU2 내에 위치함;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드; 및
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 추가적으로 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위로 구성된다.
또 다른 구현예에서, 제1 핵산 작제물은 제2 핵산 작제물로 대체된다.
"N 단백질", "P 단백질", "M 단백질", "F 단백질", "H 단백질" 및 "L 단백질"이라는 표현은 각각 MV의 핵단백질(N), 인단백질(P), 기질 단백질( M), 융합 단백질(F), 헤마글루티닌 단백질(H) 및 RNA 폴리머라제 대형 단백질(L)을 의미한다(Fields, Virology(Knipe & Howley, 2001)).
본 발명의 작제물에서, 재조합 게놈의 레플리콘에 잔류할 추가된 폴리뉴클레오티드 서열과 함께 취해진 MV 서열과 관련하여 본원에 개시된 폴리뉴클레오티드 서열은 MV 게놈이 효율적인 구출을 가능하게 하기 위해 정확하게 발생하기 위한 역유전학(reverse genetics )을 위한 6개의 뉴클레오티드 길이의 정확한 배수인 요건을 특징지우는 "6의 법칙(rule of six)"을 따른다.
본 발명의 특정 구현예에서, MV 안티게놈을 암호화하는 cDNA의 첫 번째 뉴클레오티드와 MV 안티게놈을 암호화하는 cDNA의 마지막 뉴클레오티드 사이의 재조합 MV-CoV 핵산 분자의 서열은 6개 뉴클레오티드의 배수이다.
따라서 "6의 법칙"은 코로나바이러스 항원(들)을 암호화하는 서열을 포함하는 본 발명에 따라 제조된 작제물에도 적용된다.
"6의 법칙"은 MV(+) 가닥 RNA 게놈을 나타내는 핵산 또는 이를 포함하는 핵산 작제물에 존재하는 뉴클레오티드의 총 수가 6의 배수라는 사실로 표현된다. "6의 법칙"은 MV 게놈 RNA의 효율적이거나 최적화된 복제를 가능하게 하는 MV 게놈의 총 뉴클레오티드 수에 관한 요구 사항으로 최신 기술에서 인정되었다. 6의 규칙을 충족하는 핵산 작제물을 정의하는 본 발명의 구현예에서, 개별적으로 또는 집합적으로 취해질 때 전장 MV(+) 가닥 RNA 게놈 및 모든 삽입된 서열을 암호화하는 cDNA를 지정하는 핵산 작제물에 그 규칙이 적용된다.
특히, 본 발명의 핵산 작제물은, 6의 배수인 다수의 뉴클레오티드로 구성되는 MV의 전장 감염성 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자와 함께 취해진 경우, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 스파이크(S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드와 조합된 경우, MV 게놈의 6의 법칙을 따른다. 특정 구현예에서, 6의 법칙은 MV의 전장 감염성 안티게놈 (+) RNA 가닥을 암호화하는 적용되고, cDNA에 클로닝되고 CoV, 특히 SARS-CoV-2의 적어도 스파이크 (S) 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 폴리뉴클레오티드에 적용된다. 대안적으로, 6의 법칙의 준수는 재조합 홍역 바이러스의 구출을 위해 사용된 세포에서 전체 작제물 또는 작제물로부터 수득된 전사체를 고려하여 결정될 수 있다.
MV의 게놈의 구성 및 이들의 복제 및 전사 과정은 선행 기술에서 충분히 확인되었으며 특히 문헌[Horikami S.M. and Moyer S.A. (Curr. Top. Microbiol. Immunol. (1995) 191, 35-50)] 또는 Schwarz 백신 접종 균주 또는 광범위하게 고려된 네거티브 센스 RNA 바이러스의 경우 문헌[Combredet C. 등 (Journal of Virology, Nov 2003, p11546-11554)] 및 문헌[Neumann G. 등 (Journal of General Virology (2002) 83, 2635-2662)]에 개시되어 있다.
본 발명의 바람직한 구현예에서, 홍역 바이러스는 약독화된 바이러스 균주이다.
홍역 바이러스의 "약독화 균주"는 숙주에 투여될 때 면역원성 및 가능하게는 면역증강성을 유지하면서, 즉 T 세포 공동자극 단백질 또는 사이토카인 IL-12의 유도와 같은 면역우세 T 및 B 세포 에피토프 및 가능하게는 보존하면서, 동일한 숙주에서 모 균주보다 독성이 없거나 덜 독성인 균주로 정의된다.
따라서, MV의 약독화된 균주는 선택된 세포에서 연속적으로 계대되고 아마도 다른 세포에 적응되어 병원성으로의 복귀 또는 숙주 염색체의 통합을 허용하지 않는 안정한 게놈을 보유하는 백신 균주의 제조에 적합한 종자 균주를 생산하도록 적응된 균주를 의미한다. 특정 "약독화 균주"로서, 백신에 대해 승인된 균주는 FDA(미국 식품의약국)에서 정의한 기준, 즉 실험실 및 임상 데이터에 대한 엄격한 검토 후(www.fda.gov/cber/vaccine/vacappr.htm) 안전성, 효능, 품질 및 재현성 기준을 충족하는 경우 본 발명에 적합한 약독화된 균주이다.
본 발명을 구현하고 특히 핵산 작제물의 MV cDNA를 유도하기 위해 사용될 수 있는 특정한 약독화된 균주는 Schwarz 균주, Zagreb 균주, AIK-C 균주 및 Moraten 균주, 보다 바람직하게는 Schwarz 균주이다. 이들 균주 모두는 선행 기술에 기재되어 있고 이들에 대한 접근은 특히 상업적 백신으로서 제공된다. 본 발명의 특정 구현예에서, MV-CoV 분자의 재조합 DNA 또는 cDNA는 이종 발현 조절 서열의 제어하에 놓이게 된다. DNA/cDNA의 발현을 위한 이러한 대조군의 삽입은, 이 DNA/cDNA의 발현이 본래의 제어 서열을 갖는 DNA/cDNA의 완전한 전사를 가능하게 하지 않는 세포 유형에서 추구될 때 유리하다.
본 발명의 특정 구현예에서, 이종 발현 조절 서열은 T7 프로모터 및 T7 터미네이터 서열을 포함한다. 이들 서열은 각각 MV의 전장 안티게놈 (+)RNA 가닥에 대한 코딩 서열의 5' 및 3'에 위치하며 이 코딩 서열 주위의 인접 서열로부터 위치한다. 따라서, 특정 구현예에서, 본 발명의 핵산 작제물은 이러한 추가 제어 서열을 포함한다.
본 발명의 특정 구현예에서, 본원에 정의된 이종 폴리뉴클레오티드와 재조합된 홍역 바이러스의 안티게놈 RNA를 암호화하는 재조합 핵산 분자 또는 핵산 잣제물은 추가로 변형된다. 즉 추가의 뉴클레오티드 서열 또는 모티프를 포함한다.
바람직한 구현예에서, 본 발명에 따른 이종 폴리뉴클레오티드와 재조합된 홍역 바이러스의 안티게놈 RNA를 암호화하는 핵산 작제물 또는 재조합 핵산 분자는 하기 (a) 및 (b)를 추가로 포함한다. (a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및 (b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임의 서열, 따라서, 델타 간염 바이러스 리보자임(δ)은 전장 항-게놈(+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접하여 3'-말단에 제공되는 것이 유리하다.
상기 코딩 서열의 첫 번째 뉴클레오티드에 인접한 5' 말단에 위치한 GGG 모티프는 cDNA 코딩 서열의 전사 효율을 향상시킨다. 홍역 바이러스 입자의 적절한 조립을 위해서는 본 발명의 핵산 작제물의 안티게놈 (+)RNA를 암호화하는 cDNA가 6의 법칙을 준수해야 하므로, GGG 모티프가 추가될 때 리보자임도 cDNA의 코딩 서열의 5' 말단, GGG 모티브로부터 3'에 추가됨으로써, MV의 전장 안티게놈 (+)RNA 가닥의 첫 번째 코딩 뉴클레오티드에서 전사체의 절단을 가능하게 한다.
본 발명의 특정 구현예에서, 본 발명의 핵산 작제물을 제조하기 위해, 선행 기술에 개시된 MV의 전장 안티게놈(+) RNA를 암호화하는 cDNA 분자의 제조는 공지된 방법에 의해 달성된다. cDNA는 플라스미드와 같은 벡터에 삽입될 때 특히 게놈 벡터를 제공한다.
본 발명의 핵산 작제물의 제조에 적합한 특정 cDNA 분자는 MV의 Schwarz 균주를 사용하여 얻은 것이다. 따라서, 본 발명에서 사용되는 홍역 바이러스의 안티게놈을 암호화하는 cDNA는 WO2004/000876호에 개시된 바와 같이 얻어질 수 있거나, 또는 Collection Nationale de Culture de Microorganismes(CNCM)(주소: 프랑스 75724 Paris Cedex 15, 28 rue du Dr Roux)에 파스퇴르 연구소(Institut Pasteur)에 의해 2002년 6월 12일에 기탁번호 I-2889로 기탁된 플라스미드 pTM-MVSchw로부터 얻어질 수 있다. 플라스미드 pTM-MVSchw의 서열은 본원에 참고로 포함되는 WO2004/000876호에 개시되어 있다. 플라스미드 pTM-MVSchw는 Bluescript 플라스미드로부터 얻었고, T7 RNA 폴리머라제의 프로모터의 제어 하에 배치된 Schwarz 균주의 전장 홍역 바이러스(+) RNA 가닥을 암호화하는 폴리뉴클레오티드를 포함한다. 플라스미드 pTM-MVSchw는 18967개의 뉴클레오티드 및 서열번호 28의 서열을 가지고 있다. 다른 MV 균주 유래의 cDNA 분자(편의를 위해 홍역 바이러스의 cDNA 또는 MV cDNA로도 나타냄)는 본원에 기재된 바와 같늠 약독화 MV의 바이러스 입자로부터 정제된 핵산으로부터 출발하여 유사하게 수득될 수 있다.
본 발명에서 사용되는 홍역 바이러스의 안티게놈을 암호화하는 cDNA는 Collection Nationale de Culture de Microorganismes(CNCM)(주소: 프랑스 75724 Paris Cedex 15, 28 rue du Dr Roux)에 파스퇴르 연구소에 의해 2002년 6월 12일에 기탁번호 I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp로부터 얻어질 수도 있다. 이는 19795개의 뉴클레오티드 및 서열번호 29로 표시되는 서열을 갖는다. 이 플라스미드는 결실될 수 있는 eGFP 마커를 암호화하는 서열을 포함한다.
또한, 상기 인용된 pTM-MVSchw 플라스미드는, 코로나바이러스, 특히 SARS-CoV-2 균주의 항원으로부터 유래된 폴리펩티드를 암호화하는 이종 폴리뉴클레오티드(특히 본원에 개시된 바와 같은 S 항원으로부터 유래된 폴리펩티드)를, ATU1 또는 ATU2 또는 ATU3, 바람직하게는 ATU3의 삽입을 위한 것으로 알려진 위치에 삽입된 하나 이상의 ATU를 이용하여 홍역 바이러스의 안티게놈을 암호화하는 cDNA에 클로닝함으로써 본 발명의 핵산 작제물의 제조에 사용될 수 있다.
특정 구현예에서, 본 발명의 핵산 작제물은 서열번호 34 또는 서열번호 35의 서열에서 위치 1 내지 위치 20152에 위치한 재조합 MV-CoV 핵산 분자를 포함하거나 이로 그로 이루어진다. 이 작제물은 홍역 바이러스 안티게놈을 암호화하는 cDNA에 삽입된 ATU2 또는 ATU3에 각각 위치한 SARS-CoV-2의 S 폴리펩티드를 암호화한다.
특정 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어, 본원에 개시된 S 항원 단편의 서열, 특히 stab-S(S2P라고도 함), Secto, stab-Secto, S1, S2, stab-S2, tri-Secto, tristab-Secto, S3F, S2P3F, S2PΔF, S2PΔF2A 폴리펩티드 중 하나를 암호화하는 뉴클레오티드 서열, 특히 각각 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 42, 44, 46 또는 48, 바람직하게는 서열번호 4, 42, 44, 46 또는 48로 개시된 서열의 폴리뉴클레오티드, 보다 바람직하게는 서열번호 44, 46 또는 48, 더욱 더 바람직하게는 서열번호 46 또는 서열번호 48, 훨씬 더 바람직하게는 서열번호 48, 또는 각각 서열번호 5, 7, 9, 11, 13, 15, 17, 19, 43, 45, 47 또는 49, 바람직하게는 서열번호 5, 43, 45, 47 또는 49, 더 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 SEQ ID NO: 49, 훨씬 더 바람직하게는 서열번호 49의 아미노산 서열을 암호화하는 폴리뉴클레오티드. 이러한 구현예에서, 서열번호 34의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 3538 내지 위치 7362이고, 서열번호 35의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 9340 내지 위치 13164이다.
특정 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어, 본원에 개시된 S 항원 단편의 서열, 특히 stab-S(S2P라고도 함), Secto, stab-Secto, S1, S2, stab-S2, tri-Secto, tristab-Secto, SF-2P-dER 또는 SF-2P-2a 폴리펩티드 중 하나를 암호화하는 뉴클레오티드 서열, 특히 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 75 또는 81, 바람직하게는 서열번호 4, 75 또는 81, 보다 바람직하게는 서열번호 75 또는 81, 훨씬 더 바람직하게는 서열번호 75로서 개시된 서열의 폴리뉴클레오티드, 또는 각각 서열번호 5, 7, 9, 11, 13, 15, 17, 19, 76 또는 82, 바람직하게는 서열번호 5, 76 또는 82, 보다 바람직하게는 서열번호 76 또는 82, 훨씬 더 바람직하게는 서열번호 76의 아미노산 서열을 암호화하는 폴리뉴클레오티드. 이러한 구현예에서, 서열번호 34의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 3538 내지 위치 7362이고, 서열번호 35의 서열에서 대체될 폴리뉴클레오티드 영역은 위치 9340 내지 위치 13164이다.
다른 구현예에서, 본 발명은 S 단백질을 암호화하는 서열을 하기의 폴리뉴클레오티드로 대체함으로써 상기로부터 유래된 핵산 작제물에 관한 것이다: 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드를 암호화하는 폴리뉴클레오티드, 예를 들어 코로나바이러스, 특히 SARS-CoV-2의 N, E, M, ORF3a, ORF7a, ORF8 폴리펩티드를 암호화하는 서열, 또는 Genbank MN908947.3에 개시된 서열을 사용하여 수득될 수 있거나 본원에 개시된 뉴클레오티드 서열을 가질 수 있는 이의 항원성 또는 면역원성 단편.
본 발명의 바람직한 구현예에서, 핵산 작제물은 코로나바이러스, 특히 SARS-CoV-2의 N 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제2 이종 폴리뉴클레오티드를 포함하는 재조합 MV-CoV 핵산 분자를 포함하거나 그로 구성되고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드를 클로닝하는데 사용되는 ATU와 다른 위치의 ATU에서 클로닝된다,
특정 구현예에서, 이러한 핵산 작제물은 삽입되고, 특히 발현 벡터 또는 전달 벡터, 예를 들어 플라스미드에 클로닝된다. 적합한 플라스미드의 예는 Combredet 등 (2003) 또는 WO 04/00876호에 공지된 pTM 플라스미드, 또는 본원에 개시된 pKM 플라스미드이다.
본원에 기술된 임의의 핵산 작제물은 재조합 감염성 복제 홍역 - 코로나바이러스 바이러스(MV-CoV)의 제조에 적합하고 그 제조에 의도된 것이다. 따라서, 핵산 작제물은 (i) MV-CoV의 생성 및 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편, 특히 본원에 개시된 바와 같은 스파이크(S) 폴리펩티드 또는 이의 면역원성 단편의 산출을 위해, 결과적으로 홍역 바이러스, 특히 Schwarz 균주의 cDNA 분자를 포함하는 전달 게놈 벡터에 삽입하기 위해 사용되거나, 또는 (ii) 이러한 전달 벡터, 특히 플라스미드 벡터이다.
핵산 작제물은 또한 바이러스-유사 입자(VLP), 특히 CoV VLP의 생산을 위해 사용될 수 있다.
예로서, pTM-MVSchw 플라스미드 또는 pTM2-MVSchw 플라스미드는, 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드 또는 N, M, E, ORF7a, ORF3a 또는 ORF8과 같은 또 다른 항원, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편의 발현을 위해 필요한 CoV 폴리뉴클레오티드(들)의 삽입을 통해 전달 벡터를 제조하기에 적합하다. 대안적으로, 그러한 전달 벡터는 pKP-MVSchw-ATU1(eGFP), pKP-MVSchw-ATU2(eGFP), pKP-MVSchw-ATU3(eGFP)를 포함하는, 실시예에 상세히 기재된 pKM 벡터일 수 있고, 여기서 eGFP의 뉴클레오티드 서열은 코로나바이러스(CoV), 특히 SARS-CoV-2의 적어도 하나의 스파이크(S) 폴리펩티드 또는 N, M, E, ORF7a, ORF3a 또는 ORF8과 같은 또 다른 항원, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 대체된다. 본원에 개시된 서열은 당업자가 특히 실시예의 개시내용을 사용하여 삽입체 치환을 설계 및 제조하기 위해 플라스미드에 함유된 삽입체의 위치에 접근할 수 있게 한다.
CNCM에서의 기탁과 관련하여 본원에 인용된 모든 플라스미드는 Collection Nationale de Cultures de Microorganismes(주소: 프랑스 75724 Paris Cedex 15, 25 rue du Docteur Roux)에 기탁되었다.
핵산 작제물의 특정 측면에 따르면, 본 발명은 하기를 포함하는 재조합 홍역 바이러스(MV)의 구출(rescue)에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이다: 본 발명에 따른 핵산 작제물, 특히 서열번호 28의 플라스미드(pTM-MVSchwarz), 서열번호 29의 플라스미드(pTM2-MVSchw-gfp, 또한 pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2-CNCM I-3034로 명명됨, 2003년 5월 26일에 기탁됨, GFPbis 코딩 서열의 삽입), 서열번호 38의 플라스미드(pTM3-MVSchw-gfp, 또한 pTM-MVSchw3-GFP 또는 pTM-MVSchwarz-ATU3-CNCM I-3037로 명명됨, 2003년 5월 26일에 기탁됨, GFP 코딩 서열의 삽입), 서열번호 30의 플라스미드(pKP-MVSchwarz), 서열번호 31의 플라스미드(pKP-MVSchwarz-ATU1), 서열번호 32의 플라스미드(pKP-MVSchwarz-ATU2) 및 서열번호 33의 플라스미드(pKP-MVSchwarz-ATU3)로 이루어진 군에서 선택된 전달 벡터. 여기서의 전달 벡터는 (i) 안티게놈(+) RNA의 cDNA 내에 삽입된 추가 전사 단위(ATU) 내에 위치한 것으로, 코로나바이러스, 특히 SARS-CoV-2의 스파이크 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 암호화하는 제1 이종 DNA 폴리뉴클레오티드와 재조합되거나, (ii) 코로나바이러스, 특히 SARS-CoV-2의 또 다른 폴리펩티드, 예를 들어, 코로나바이러스, 특히 SARS-CoV-2의 N, E, M, ORF3a, ORF7a, ORF8 폴리펩티드의 서열, 예를 들어, Genbank MN908947.3에 개시된 서열로부터 유래되거나 또는 본원에 개시된 서열에 상응하는 서열을 암호화하는 제2 이종 폴리뉴클레오티드와 재조합된다.
핵산 작제물의 바람직한 측면에 따르면, 본 발명은 본 발명에 따른 핵산 작제물, 특히 서열번호 32의 플라스미드(pKP-MVSchwarz-ATU2) 및 서열번호 33 의 플라스미드(pKP-MVSchwarz-ATU3)로 이루어진 군으로부터 선택된 전달 벡터를 포함하는 재조합 홍역 바이러스(MV)의 구출에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이고, 여기서의 전달 벡터는 ATU2 또는 ATU3 내에 위치한 제1항, 제2항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 SARS-CoV-2의 폴리펩티드를 암호화하는 제1 이종 DNA 폴리뉴클레오티드와 재조합된다.
특정 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 1 또는 2 또는 36(작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨);
- 서열번호 6 (작제물 Secto);
- 서열번호 8 (작제물 stab-Secto);
- 서열번호 10 (작제물 S1),
- 서열번호 12 (작제물 S2),
- 서열번호 14 (작제물 stab-S2),
- 서열번호 16 (작제물 tri-Secto),
- 서열번호 18 (작제물 tristab-Secto),
- 서열번호 42 (작제물 S3F),
- 서열번호 44 (작제물 S2P3F),
- 서열번호 46 (작제물 S2PΔF),
- 서열번호 48 (작제물 S2PΔF2A),
- 서열번호 21 또는 37 (작제물 N),
- 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
- 서열번호 53 (작제물 S6P),
- 서열번호 55 (작제물 S6P3F),
- 서열번호 57 (작제물 S6PΔF),
- 서열번호 59 (작제물 SCCPP),
- 서열번호 61 (작제물 SCC6P),
- 서열번호 63 (작제물 SMVopt2P),
- 서열번호 64 (작제물 SMVoptΔF), 및
- 서열번호 66 (작제물 SMVopt2PΔF).
바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 2 (작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P라고도 함);
- 서열번호 42 (작제물 S3F),
- 서열번호 44 (작제물 S2P3F),
- 서열번호 46 (작제물 S2PΔF), 및
- 서열번호 48 (작제물 S2PΔF2A).
더 바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 서열번호 48(작제물 S2PΔF2A)이다. eGFP를 암호화하는 서열이 플라스미드에 존재하는 경우, 이는 ATU에 삽입된 상기 정의된 군에서 선택된 서열로 유리하게 치환된다.
특정 구현예에서, 전달 벡터는 하기 중에서 선택된 플라스미드로부터 유래된것이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 pKP-MVSchwarz(또는 pKM-Schwarz),
- 2020년 2월 12일에 기탁번호 CNCM I-5494로 기탁된 pKM-ATU2(eGFP),
- 2020년 2월 12일에 기탁번호 CNCM I-5495로 기탁된 pKM-ATU3(eGFP). 특히, 플라스미드는 서열번호 1, 2 또는 36, 바람직하게는 서열번호 2, 또는 특히 eGFP 코딩 서열을 대체하기 위해 ATU, 바람직하게는 ATU3에 삽입된 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 42, 44, 46, 48, 21 또는 37, 특히 서열번호 4, 42, 44, 46, 48, 바람직하게는 서열번호 44, 46 또는 48, 바람직하게는 서열번호 46 또는 서열번호 48, 훨씬 더 바람직하게는 서열번호 48의 서열을 갖는 폴리뉴클레오티드 중에서 선택된 폴리뉴클레오티드를 포함하는 플라스미드 중 하나이다.
또는, 하기로 이루어진 군으로부터 선택된 플라스미드로 중 하나이고:
- 2020년 2월 12일에 기탁번호 CNCM I-5496로 기탁된 pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 2월 12일에 기탁번호 CNCM I-5497로 기탁된 pKM-ATU3-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5532로 기탁된 pKM-ATU3-S2PΔF_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5534로 기탁된 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5534로 기탁된 pKM-ATU3-S2P3F_2019-nCoV(즉, SARS-CoV-2),
- 2020년 7월 1일에 기탁번호 CNCM I-5535로 기탁된 pKM-ATU3-S3F_2019-nCoV(즉, SARS-CoV-2), 및
- 2020년 7월 1일에 기탁번호 CNCM I-5536로 기탁된 pKM-ATU3-stab-S_2019-nCoV(즉, SARS-CoV-2)(pKM-ATU3-S2P_2019-nCoV(즉, SARS-CoV-2)라고도 함),
바람직하게는 pKM-ATU3-S2P3F_2019-nCoV(즉, SARS-CoV-2), pKM-ATU3-S2PΔF_2019-nCoV(즉, SARS-CoV-2) 및 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2)로 이루어진 군으로부터 선택되는 플라스미드이며, 더 바람직하게는 2020년 7월 1일에 기탁번호 CNCM I-5533으로 기탁된 플라스미드 pKM-ATU3-S2PΔF2A_2019-nCoV(즉, SARS-CoV-2)이다.
핵산 작제물의 바람직한 측면에 따르면, 본 발명은 본 발명에 따른 핵산 작제물, 특히 서열번호 29의 플라스미드(pTM2-MVSchw-gfp, pTM-MVSchw2-GFPbis 또는 pTM-MVSchwarz-ATU2로도 명명됨) 또는 서열번호 38의 플라스미드(pTM3-MVSchw-gfp, *?*F_2019-nCoV (pTM-MVSchw3-GFP로도 명명됨) 또는 pTM-MVSchwarz-ATU3)로 이루어진 전달 벡터를 포함하는 재조합 홍역 바이러스(MV)의 구출에 적합한 전달 벡터, 특히 플라스미드 벡터에 관한 것이고, 여기서의 전달 벡터는 SARS-CoV-2의 SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드를 암호화하거나, ATU2 또는 ATU3, 바람직하게는 ATU2 내에 위치한 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역 단편으로 구성되는 제1 이종 DNA 폴리뉴클레오티드와 재조합된다.
특정 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 1 또는 2 또는 36 (작제물 S);
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨);
- 서열번호 6 (작제물 Secto);
- 서열번호 8 (작제물 stab-Secto);
- 서열번호 10 (작제물 S1),
- 서열번호 12 (작제물 S2),
- 서열번호 14 (작제물 stab-S2),
- 서열번호 16 (작제물 tri-Secto),
- 서열번호 18 (작제물 tristab-Secto), 및
- 서열번호 21 또는 37 (작제물 N).
바람직한 구현예에서, 전달 벡터는 플라스미드, 특히 재조합 DNA MV-CoV 서열과 재조합된 상기 플라스미드 중 하나이며, 여기서 SARS-CoV-2의 폴리펩티드를 암호화하는 서열은 하기로 이루어진 군으로부터 선택된다:
- 서열번호 2 (작제물 S); 및
- 서열번호 4 (작제물 stab-S, 작제물 S2P로도 명명됨).
더 바람직한 구현예에서, 전달 벡터는 MV-CoV의 재조합 DNA와 재조합된 플라스미드이며, 여기서 SF-2P-dER 폴리펩티드를 암호화하는 서열은 서열번호 75이고 SF-2P-2a 폴리펩티드를 암호화하는 서열은 서열번호 81이며, 바람직하게는 SARS-CoV-2의 SF-2P-dER 폴리펩티드를 암호화하는 서열은 서열번호 75이다. eGFP를 암호화하는 서열이 플라스미드에 존재하는 경우, 이는 유리하게는 ATU에 삽입된 상기 정의된 군에서 선택된 서열로 치환된다.
특정 구현예에서, 전달 벡터는 하기 중에서 선택된 플라스미드로부터 유래된것이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 pKP-MVSchwarz(또는 pKM-Schwarz),
- 2020년 2월 12일에 기탁번호 CNCM I-5494로 기탁된 pKM-ATU2(eGFP),
- 2020년 2월 12일에 기탁번호 CNCM I-5495로 기탁된 pKM-ATU3(eGFP), 특히 플라스미드는 서열번호 1, 2 또는 36, 바람직하게는 서열번호 2, 또는 특히 eGFP 코딩 서열을 대체하기 위해 ATU, 바람직하게는 ATU3에 삽입된 서열번호 4, 6, 8, 10, 12, 14, 16, 18, 21 또는 37, 특히 서열번호 4의 서열을 갖는 폴리뉴클레오티드 중에서 선택된 폴리뉴클레오티드를 포함하는 플라스미드 중 하나이다.
또는, 하기로 이루어진 군으로부터 선택된 플라스미드로 중 하나이다:
- 2020년 2월 12일에 기탁번호 CNCM I-5496로 기탁된 pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2),
- 2020년 2월 12일에 기탁번호 CNCM I-5497로 기탁된 pKM-ATU3-S_2019-nCoV (즉, SARS-CoV-2), 및
- 2020년 7월 1일에 기탁번호 CNCM I-5536로 기탁된 pKM-ATU3-stab-S_2019-nCoV(즉, SARS-CoV-2)(pKM-ATU3-S2P_2019-nCoV(즉, SARS-CoV-2)라고도 함).
다른 특정 구현예에서, 전달 벡터는 서열번호 144의 pTM2-SF-dER_SARS-CoV-2, 서열번호 145의 pTM2-S2-dER_SARS-CoV-2, 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2, 서열번호 147의 pTM2-S2-2P-dER_SARS-CoV-2 및 서열번호 148의 pTM2-SF-2P-2a_SARS-CoV-2로 이루어진 군으로부터 선택되는 플라스미드 중 하나이고, 바람직하게는 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2 또는 서열번호 148의 pTM2-SF-2P-2a_SARS-CoV-2, 더 바람직하게는 서열번호 146의 pTM2-SF-2P-dER_SARS-CoV-2 인 플라스미드 중 하나이다.
본 발명은 또한 바이러스 MV-CoV 입자의 구출에 적합한 세포를 형질전환, 특히 플라스미드 또는 본 발명의 핵산 작제물을 보유하는 바이러스 벡터로 이러한 세포를 각각 형질감염시키거나 형질도입하기 위한 상기 전달 벡터의 용도에 관한 것이고, 상기 세포는 재조합 감염 복제 MV-CoV 입자에서 본 발명의 핵산 작제물에 상응하는 바이러스의 재조합 게놈의 적절한 복제, 전사 및 캡슐화에 필요한 MV 단백질을 발현하는 그의 능력에 대해 선택된다.
바람직한 구현예에서, 본 발명은 본 발명에 따른 핵산 작제물 또는 본 발명에 따른 전달 플라스미드 벡터로 형질감염되거나, 본 발명에 따른 재조합 홍역 바이러스로 감염된 헬퍼 세포, 증폭 세포 또는 생산 세포, 특히 포유동물 세포, VERO NK 세포, CEF 세포, 인간 배아 신장 세포주 293 또는 이로부터 유래된 세포주(CNCM(프랑스 파리)에 2006년 6월 14일에 기탁번호 I-3618로 기탁된 293T 또는 293T-T7 세포) 또는 MRC5 세포인 세포에 관한 것이다.
따라서, 폴리뉴클레오티드가 세포에 존재하는데, 이는 재조합 바이러스 MV-CoV 입자의 전사 및 복제에서 기능하는 적어도 N 및 P 단백질에 대한 안정적으로 발현된 단백질 또는 일시적으로 발현된 단백질로서, 특히 MV의 N, P 및 L 단백질(즉, 레플리콘으로서 리보핵단백질(RNP) 복합체를 형성할 수 있는 천연 MV 단백질 또는 이의 기능적 변이체)를 포함하는 단백질을 암호화한다, N 및 P 단백질은 코딩 서열을 포함하는 플라스미드로부터 세포에서 발현될 수 있거나 세포의 게놈에 삽입된 DNA 분자로부터 발현될 수 있다. L 단백질은 다른 플라스미드에서 발현될 수 있다. 이는 일시적으로 표현될 수 있다. 헬퍼 세포는 또한 가능하게는 안정적으로 발현된 RNA 폴리머라제로서, 본 발명의 핵산 작제물로부터 유래된 재조합 RNA의 합성을 가능하게 하는데 적합한 RNA 폴리머라제를 발현할 수 있다. RNA 폴리머라제는 T7 파지 폴리머라제 또는 이의 핵 형태(nlsT7)일 수 있다.
본 발명의 한 구현예에서, MV의 cDNA 클론은 N 단백질 및/또는 P 단백질 및/또는 L 단백질과 동일한 MV 균주로부터 유래한다. 본 발명의 또 다른 구현예에서, MV의 cDNA 클론은 N 단백질 및/또는 P 단백질 및/또는 L 단백질과 상이한 바이러스 균주로부터 유래한다.
본 발명은 또한 하기를 포함하는 재조합 감염성 홍역 바이러스(MV) 입자의 제조 방법에 관한 것이다:
1) 바이러스 입자 조립을 가능하게 하는 조건에서 그의 cDNA로부터 MV의 안티게놈 (+)RNA 서열의 전사, 복제 및 캡슐화에 필요한 단백질을 또한 발현하는 헬퍼 세포주에 본 발명의 핵산 작제물 또는 이러한 핵산 작제물을 함유하는 전달 벡터를 전달, 특히 형질감염시키는 단계; 및
2) 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 감염성 MV-CoV 입자를 회수하는 단계.
본 발명의 특정 구현예에서, 이 방법은 다음을 포함한다:
1) RNA 폴리머라제를 발현하고 MV 바이러스의 N, P, L 단백질을 발현하기 위한 헬퍼 기능을 발현할 수 있는 헬퍼 세포를 본 발명에 따른 핵산 작제물 및 전달 벡터로 감염시키는 단계;
2) 단계 1)의 형질감염된 헬퍼 세포를 cDNA가 유래하는 MV 약독화된 균주의 계대에 적합한 계대된 세포와 공동 배양하는 단계;
3) 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 이루어지거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 이루어진 적어도 하나의 폴리펩티드를 발현하는 재조합 감염성 MV-CoV 입자를 회수하는 단계.
본 발명의 또 다른 특정 구현예에서, 재조합 감염성 MV-CoV 입자의 생산 방법은 다음을 포함한다:
1) RNA 폴리머라제, MV의 N 단백질 및 MV의 P 단백질을 안정적으로 생산하는 세포 또는 세포 배양물을 본 발명의 핵산 작제물 및 MV의 L 단백질을 암호화하는 핵산을 포함하는 벡터와 재조합하는 단계, 및
2) 재조합 세포 또는 재조합 세포의 배양물로부터 재조합 감염성 MV-CoV 입자를 회수하는 단계.
방법의 특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 MV, 특히 동일한 CoV 단백질(들)을 발현하는 CoV VLP가 생성된다.
따라서 본 발명은 구출(rescue) 헬퍼 세포 또는 생산 세포에서 회수될 수 있는 재조합 감염 복제 MV-CoV 입자에 관한 것이다. 선택적으로, 본 발명에 따라 개시된 CoV 항원을 발현하는 VLP는 추가로 회수될 수 있다.
특정 구현예에서, 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하는 재조합 MV가 생성된다.
특정 구현예에서, 재조합 MV 입자는 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현한다.
특정 구현예에서, 재조합 MV 입자는 코로나바이러스(CoV), 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 발현하고, 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 개시된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드를 추가로 발현한다.
본 발명의 특정 구현예에서, 입자는 여기에 개시된 모든 구현예에 따른 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade로 이루어진 군으로부터 선택되는 약독화 바이러스 균주, 특히 Schwarz 균주인 홍역 바이러스로부터 얻어진다.
특정 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 이의 게놈에서, 코로나바이러스, 특히 SARS-CoV-2의 스파이크 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편로 구성된 적어도 하나의 폴리펩티드, 또는 코로나바이러스(CoV), 특히 SARS-CoV-2의 N, E, M, ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성된 하나의 폴리펩티드를 암호화하는 핵산 작제물을 포함하고, 특히 이의 게놈에서, 본 발명의 뉴클레오티드 작제물의 전사체, 특히 본 발명의 전달 벡터의 레플리콘인 상기 정의된 바와 같은 핵산 작제물을 포함하고, 상기 핵산 작제물은 발현 카세트에서 게놈과 작동 가능하게 연결된다. 바람직한 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 이의 게놈에서, 본 발명에 따른 핵산 작제물, SF-2P-dER 폴리펩티드 또는 SARS-CoV-2의 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 75 또는 서열번호 81, 바람직하게는 서열번호 75의 뉴클레오티드 서열에 의해 암호화된 폴리펩티드를 암호화하는 핵산 작제물, 특히 본 발명의 전달 벡터의 레플리콘인 핵산 작제물을 포함하고, 상기 핵산 작제물은 발현 카세트에서 게놈과 작동 가능하게 연결된다. 보다 바람직한 구현예에서, 재조합 홍역 바이러스, 특히 Schwarz 균주의 재조합 홍역 바이러스는 SARS-CoV-2 균주의 SF-2P-dER 폴리펩티드 또는 SF-2P-2a 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 발현하고, SARS-CoV-2 균주의 N 폴리펩티드, M 폴리펩티드, E 폴리펩티드, ORF7a, ORF8 또는 ORF3a 폴리펩티드 중 적어도 하나, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 선택적으로 추가로 발현한다.
보다 바람직한 구현예에서, 재조합 홍역 바이러스는 SARS-CoV-2 균주의 N 폴리펩티드, M 폴리펩티드, E 폴리펩티드, ORF7a, ORF8 또는 ORF3a 폴리펩티드 중 적어도 하나를 추가로 발현하고, 특히 서열번호 22의 N 폴리펩티드, 또는 1, 2 또는 10개 미만의 아미노산 잔기(들), 특히 5개 미만의 아미노산 잔기의 치환에 의한 N 폴리펩티드의 면역원성 단편 또는 이의 항원성 단편, 또는 돌연변이된 항원, 및/또는 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번 27의 ORF7a 폴리펩티드, 및/또는 SARS-CoV-2의 서열번호 26의 ORF3a 폴리펩티드, 또는 1, 2, 3 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 추가로 발현한다.
특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 21, 36, 37, 42, 44, 46 및 48으로 이루어진 군으로부터 선택된다.
본 발명의 특정 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 21, 36 및 37로 이루어진 군으로부터 선택된다.
본 발명의 바람직한 구현예에서, 핵산 분자는 서열번호 75(작제물 SF-2P-dER) 또는 서열번호 81(작제물 SF-2P-2a)의 폴리뉴클레오티드, 바람직하게는 서열번호 75의 폴리뉴클레오티드(작제물 SF-2P-dER)를 포함한다.
바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 2, 4, 42, 44, 46 및 48으로 이루어진 군으로부터 선택되며, 바람직하게는 서열번호 2, 4, 42로 이루어진 군, 또는 서열번호 44, 46 및 48으로 이루어진 군으로부터 선택되며, 더 바람직하게는 서열번호 44, 46 및 48으로 이루어진 군으로부터 선택된다.
바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 2 또는 4이다.
더 바람직한 구현예에서, 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드를 암호화하는 핵산 분자의 뉴클레오티드 서열은 서열번호 46 또는 서열번호 48이며, 바람직하게는 서열번호 48이다.
본 발명은 또한 (i) 코로나바이러스(CoV), 특히 SARS-CoV-2의 ORF7a, ORF3a, ORF8 폴리펩티드로 구성되거나 본원에 기재된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편으로 구성되는 적어도 하나의 폴리펩티드, 또는 (ii) 코로나바이러스, 특히 SARS-CoV-2의 스파이크(S) 폴리펩티드로 구성되거나 본원에 기재된 다양한 구현예에 따른 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 그의 면역원성 단편으로 구성되는 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출하는 방법으로서,
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 세포, 특히 헬퍼 세포, 특히 HEK293 헬퍼 세포를 (i) 본 발명에 따른 핵산 작제물 또는 적어도 하나의 폴리펩티드를 암호화하는 본 발명에 따른 전달 플라스미드 벡터 및 (ii) MV L 폴리머라제를 암호화하는 벡터, 특히 플라스미드로 공동-형질감염시키는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 상기 형질감염된 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 세포, 특히 VERO 세포와 공동 배양함으로써 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
(d) 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드, 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편을 적어도 발현하는 재조합 홍역 바이러스를 회수하는 단계를 포함하는 방법에 관한 것이다.
본 발명의 바람직한 구현예에 따르면, 상기 정의된 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화된 SARS-CoV-2의 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출하는 방법은 다음을 포함한다:
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 세포, 특히 헬퍼 세포, 특히 HEK293 헬퍼 세포를 (i) 본 발명의 핵산 작제물 또는 본 발명의 전달 플라스미드 벡터 및 (ii) MV L 폴리머라제를 암호화하는 벡터, 특히 플라스미드로 공동-형질감염시키는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 상기 형질감염된 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 세포, 특히 VERO 세포와 공동 배양함으로써 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
(d) 상기 정의된 바와 같은 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화되는 SARS-CoV-2의 폴리펩티드 및 선택적으로 N, M 또는 3A 폴리펩티드 중 적어도 하나, 또는 SARS-CoV-2의 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 면역원성 단편 또는 이의 돌연변이된 항원을 발현하는 재조합 홍역 바이러스를 회수하는 단계.
이 방법의 바람직한 구현예에 따르면, 재조합 홍역 바이러스는 상기 정의된 바와 같은 돌연변이된 폴리펩티드를 발현하고, 여기서 돌연변이는 소포체(ER)에서 폴리펩티드의 검색을 적어도 손상시키고, 선택적으로 발현된 단백질, 특히 서열번호 76의 SF-2P-dER 폴리펩티드, 또는 특히 서열번호 82의 SF-2P-2a 폴리펩티드를 이의 융합전 상태로 유지한다.
방법의 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 34, 서열번호 35의 서열을 갖거나, CNCM에 기탁되고 본원에서 번호 I-5496, I-5497 및 I-5536으로 개시된 벡터 중 하나이다.
방법의 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 34, 서열번호 35의 서열을 갖거나, CNCM에 기탁되고 본원에서 번호 I-5496, I-5497, I-5532, I-5533, I-5534, I-5535 및 I-5536으로 개시된 벡터 중 하나이다.
상기 방법의 또 다른 특정 구현예에 따르면, 전달 벡터 플라스미드는 서열번호 146 또는 서열번호 148, 바람직하게는 서열번호 146의 서열을 갖는다.
특정 구현예에 따르면, 재조합은 본 발명의 핵산 작제물인 제1 폴리뉴클레오티드를 사용하여 얻어질 수 있다. 재조합은 또한 또는 대안적으로 MV의 RNA 폴리머라제 대형 단백질(L)을 암호화하는 벡터인 폴리뉴클레오티드의 도입을 포함할 수 있으며, 그의 정의, 발현의 성질 및 안정성은 본원에 기술되어 있다.
본 발명에 따르면, RNA 폴리머라제, 홍역 바이러스의 핵단백질(N) 및 홍역 바이러스의 폴리머라제 보조인자 인단백질(P)을 안정적으로 생산하는 세포 또는 세포주 또는 세포의 배양물은 본 명세서에서 정의된 세포 또는 세포주 또는 본 명세서에서 정의된 세포의 배양물이다. 즉, 상기 정의된 바와 같은 하나 이상의 폴리뉴클레오티드의 도입에 의해 변형된 정도로 재조합 세포이다. 본 발명의 특정 구현예에서, RNA 폴리머라제, N 및 P 단백질을 안정적으로 생산하는 세포 또는 세포주 또는 세포의 배양물은 홍역 바이러스의 L 단백질을 생산하지 않거나, 예를 들어, 그의 일시적인 발현 또는 생산을 가능하게 하는 홍역 바이러스의 L 단백질을 안정적으로 생산하지 않는다.
본 발명의 재조합 감염성 복제 MV-CoV 입자의 생산은 본원에 기재된 바와 같이 형질전환된 세포의 전달을 수반할 수 있다. 이 단계는 본 발명의 재조합 세포와 본 발명의 핵산 작제물, 및 선택적으로 홍역 바이러스의 RNA 폴리머라제 대형 단백질(L)을 암호화하는 핵산을 포함하는 벡터를 추가로 재조합한 후에 도입된다.
본 발명의 특정 구현예에서, 쉽게 재조합되는 능력을 위해 일반적으로 선택된 재조합 세포가 재조합 감염성 MV-CoV 입자의 유지 및 생산에 충분히 효율적이지 않기 때문에 전달 단계가 필요하다. 구현예에서, 상기 정의된 방법의 단계 1)의 세포 또는 세포주 또는 세포의 배양물은 본 발명에 따른 재조합 세포 또는 세포주 또는 재조합 세포의 배양물이다.
본 발명의 재조합 세포의 제조에 적합한 세포는 원핵 또는 진핵 세포, 특히 동물 또는 식물 세포, 보다 특히 포유동물 세포, 예컨대 인간 세포 또는 비인간 포유동물 세포 또는 조류 세포 또는 효모 세포이다. 특정 구현예에서, 세포는 이의 게놈의 재조합 전에 1차 배양물 또는 세포주로부터 분리된다. 본 발명의 세포는 분열 세포 또는 비분열 세포일 수 있다.
바람직한 구현예에 따르면, 헬퍼 세포는 인간 배아 신장 세포주 293으로부터 유래되며, 이 세포주 293은 기탁번호 CRL-1573으로 ATCC에 기탁되어 있다. 특정 세포주 293은 국제 출원 WO2008/078198에 개시된 세포주(즉, 2006년 6월 14일에 CNCM(프랑스 파리)에 기탁번호 번호 I-3618로 기탁된 HEK-293-T7-NP 또는 HEK-293T-NP MV 세포주)이고 및 다음 실시예에서 언급되어 있다.
이 방법의 또 다른 측면에 따르면, 계대에 적합한 세포는 CEF 세포이다. CEF 세포는 EARL Morizeau사(주소: 프랑스 28190 Dangers, 8 rue Moulin) 또는 임의의 다른 수정 달걀 생산자로부터 얻은 수정 달걀으로부터 준비할 수 있다.
본 발명에 따라 개시된 방법은 면역원성 조성물에 사용될 수 있는 감염성 복제 MV-CoV 입자의 생산에 유리하게 사용된다. 선택적으로, CoV 항원을 발현하는 VLP는 또한 발현되고 면역화 조성물에 사용하기에 적절할 수 있다. 따라서, 본 발명은 동물 숙주, 특히 포유동물 숙주, 특히 인간에서 체액성, 특히 보호성, 특히 중화 체액성 반응 및/또는 세포성 반응을 유도하는데 사용하기 위한 본 발명의 재조합 MV-CoV 입자에 관한 것이다. 재조합 MV-CoV 입자는 특히 코로나바이러스, 특히 SARS-CoV-2에 의한 감염에 대한 예방적 반응을 유도하는데 사용하기 위한 것이다.
따라서 본 발명은 면역원성 조성물, 유리하게는 (i) 본 발명에 따른 재조합 홍역 바이러스 및/또는 본 발명에 따른 재조합 VLP의 유효량 및 (ii) 약학적으로 허용되는 비히클을 포함하는 백신 조성물에 관한 것이고, 여기서의 조성물 또는 백신은 그것이 발현되는 코로나바이러스, 특히 SARS-CoV-2의 폴리펩티드(들) 또는 이의 단편에 대하여 특히 단일 면역화 후 동물 숙주, 특히 인간에서 체액성, 특히 보호성, 특히 중화 체액성 반응 및/또는 세포성 반응을 유도한다.
본 발명의 특정 구현예에서, 조성물은 이를 필요로 하는 숙주, 특히 인간 숙주, 특히 어린이에서 코로나바이러스 단백질(들) 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 및/또는 결실(들)을 갖는 이의 항원 단편(들) 또는 이의 돌연변이된 항원(들)을 인식하는 항체의 유도, 및/또는 코로나바이러스에 대한 세포 및/또는 체액 및 세포 반응의 유도에 의하여 SARS-CoV-2 또는 SARS-CoV-2 및 추가로 구별되는 코로나바이러스(들)에 대한 보호적이고 우선적으로 예방적인 면역 반응을 유도하는데 사용된다. 바람직하게는, 조성물은 첨가된 보조제가 없다.
또한, 본 발명은 이를 필요로 하는 숙주, 특히 인간 숙주, 특히 어린이에서 CoV, 특히 SARS-CoV-2에 의한 감염의 예방 또는 치료 또는 CoV에 의한 감염의 임상 결과의 예방에 사용하기 위한 것으로, (i) 본 발명에 따른 재조합 홍역 바이러스 및/또는 본 발명에 따른 재조합 VLP의 유효 용량 및 (ii) 약학적으로 허용되는 비히클을 포함하는 면역원성 또는 백신 조성물에 관한 것이다. 특정 구현예에서, 조성물은 어린이, 청소년 또는 여행자에게 투여하기 위한 것이다.
치료 방법
본원에서는 코로나바이러스 감염, 특히 인간 및/또는 다른 포유동물에서 SARS-CoV-2 바이러스 감염의 예방 및/또는 치료를 위한 조성물(예를 들어, 약학 조성물), 방법, 키트 및 시약을 제공한다. 본 개시의 홍역 바이러스는 면역 반응을 유도하기 위해 또는 백신을 비롯한 치료제 또는 예방제로서 사용될 수 있다. 이들은 감염성 질병을 예방 및/또는 치료하기 위해 의학에서 사용될 수 있다. 예시적인 측면에서, 본 개시의 재조합 홍역 바이러스 백신은 코로나바이러스, 특히 SARS-CoV-2 바이러스로부터 예방적 보호를 제공하기 위해 사용된다. SARS-CoV-2 바이러스로부터의 예방적 보호는 본 개시의 재조합 홍역 바이러스 및/또는 면역원성 조성물의 투여 후에 달성될 수 있다. 백신은 1회, 2회, 3회, 4회 또는 그 이상 투여할 수 있다. 덜 바람직하지만 치료 반응을 달성하기 위해 감염된 개체에게 백신을 투여하는 것이 가능하다. 투여량은 특정 구현예에서 그에 따라 조정될 수 있다.
몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 및 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염을 예방하는 방법으로서 사용될 수 있고, 방법은 대상체에게 본원에 제공된 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염을 치료하는 방법으로서 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 대상체에게 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 대상체에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염의 발병률을 감소시키는 방법으로서 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 대상체에게 투여하는 것을 포함한다. 몇몇 구현예에서, 본 개시의 재조합 홍역 바이러스 또는 면역원성 조성물은 코로나바이러스에 감염된 제1 대상체로부터 코로나바이러스, 특히 SARS-CoV-2에 감염되지 않은 제2 대상체로의 코로나바이러스, 특히 SARS-CoV-2의 확산을 억제하는 방법으로 사용될 수 있고, 방법은 본원에 제공된 바와 같은 적어도 하나의 재조합 홍역 바이러스 또는 면역원성 조성물을 제1 대상체 및 상기 제2 대상체 중 적어도 하나에게 투여하는 것을 포함한다.
코로나바이러스, 특히 SARS-CoV-2에 대한 대상체에서 면역 반응을 유도하는 방법이 본 발명의 측면에서 제공된다. 방법은 대상체에게 본원에 기재된 재조합 홍역 바이러스 또는 면역원성 조성물을 투여함으로써 대상체에서 코로나바이러스 항원성 폴리펩티드 또는 이의 면역원성 단편, 특히 전장 SARS-CoV-2 항원성 폴리펩티드에 대한 특이적인 면역 반응을 유도하는 것을 포함한다.
몇몇 구현예에서, 전장 S 단백질 또는 면역원성 단편 또는 항원성 단편의 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 서열번호 52와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 986 및 987에서 변화하지 않은 변이체; 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 서열번호 54와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 서열번호 56과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 서열번호 58과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 서열번호 60과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 서열번호 62과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 383, 817, 892, 899, 942, 985, 986 및 987에서 변화하지 않은 변이체; 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 서열번호 5과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 986 및 987에서 변화하지 않은 변이체; 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 서열번호 65과 90% 이상의 동일성을 가지는 이의 변이체; 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드, 또는 서열번호 47과 90% 이상의 동일성을 가지는 이의 변이체로서 위치 975 및 976에서 변화하지 않은 변이체; 또는 (j) SMVopt6P 폴리펩티드, 또는 MVopt6P 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체; 또는 (k) SMVopt6PΔF 폴리펩티드, 또는 MVopt6PΔF 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 806, 881, 888, 931, 975 및 976에서 변화하지 않은 변이체; 또는 (l) SMVopt6P3F 폴리펩티드, 또는 SMVopt6P3F 폴리펩티드와 90% 이상의 동일성을 가지는 이의 변이체로서 위치 682, 683, 685, 817, 892, 899, 942, 986 및 987에서 변화하지 않은 변이체;이다. 몇몇 구현예에서, 돌연변이 항원은, (a) 서열번호 52의 TA-S2P3F 폴리펩티드, 또는 (b) 서열번호 54의 S6P 폴리펩티드, 또는 (c) 서열번호 56의 S6P3F 폴리펩티드, 또는 (d) 서열번호 58의 S6PΔF 폴리펩티드, 또는 (e) 서열번호 60의 SCCPP 폴리펩티드, 또는 (f) 서열번호 62의 SCC6P 폴리펩티드, 또는 (g) 서열번호 5의 SMVopt2P 폴리펩티드, 또는 (h) 서열번호 65의 SMVoptΔF 폴리펩티드, 또는 (i) 서열번호 47의 SMVopt2PΔF 폴리펩티드이다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드는 SARS-CoV-2의 이중 도메인 S 단백질이다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하고, 여기서의 삽입, 치환 또는 결실은 이중 도메인 S 단백질의 세포 표면 발현을 증가시킨다. 몇몇 구현예에서, 이중 도메인 S 단백질은 발현된 이중 도메인 S 단백질을 이의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함한다. 몇몇 구현예에서, 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K986P 및 V987P를 추가로 포함한다. 몇몇 구현예에서, 이중 도메인 단백질은: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화한다. 몇몇 구현예에서, 이중 도메인 S 단백질: (a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는 (b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화한다.
몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 N501Y을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 A570D를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 P681H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 T716I를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 S982A를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D1118H를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 E484K를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417N을 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 K417T를 추가로 포함한다. 몇몇 구현예에서, SARS-CoV-2 항원성 폴리펩티드의 이중 도메인 S 단백질은 서열번호 3의 아미노산 돌연변이 D614G를 추가로 포함한다.
상기한 방법의 몇몇 구현예에서, 코로나바이러스 항원성 폴리펩티드 또는 이의 면역원성 단편은, 뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3A 폴리펩티드 또는 3 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 포함하거나 이로 이루어진다.
예방 및 치료 조성물
예방적 유효 용량은 임상적으로 허용되는 수준에서 바이러스 감염을 예방하는 치료적 유효량이다. 몇몇 구현예에서, 치료적 유효 용량은 백신에 대한 패키지 삽입물에 나열된 용량이다.
예를 들어, 인간 및 기타 포유동물에서 코로나바이러스 감염, 특히 SARS-CoV-2 감염의 예방, 치료 또는 진단을 위한 조성물(예를 들어, 약학적 조성물), 방법, 키트 및 시약이 본원에서 제공된다. 코로나바이러스 조성물은 예방제 또는 치료제로서 사용될 수 있다. 이들은 감염성 질병을 예방 및/또는 치료하기 위해 의학에서 사용될 수 있다. 몇몇 구현예에서, 본 개시의 조성물은 예를 들어 생체외에서 말초혈 단핵 세포(PBMC)를 활성화하기 위해 면역 이펙터 세포의 프라이밍에 사용되며, 이 세포는 이어서 대상체로 주입(재주입)된다. 몇몇 구현예에서, 본 개시에 따른 조성물은 코로나바이러스 감염, 특히 SARS-CoV-2의 치료에 사용될 수 있다.
면역원성 조성물은 건강한 개체에 대한 능동 면역화 계획의 일부로서 예방학적으로 또는 치료학적으로 투여될 수 있거나, 잠복기 동안 또는 증상 개시 후 활성 감염 동안 감염 초기에 투여될 수 있다. 몇몇 구현예에서, 세포, 조직 또는 대상체에 제공되는 본 개시의 면역원성 조성물의 양은 면역 예방에 효과적인 양일 수 있다.
본 개시의 면역원성 조성물은 다른 예방적 또는 치료적 화합물과 함께 투여될 수 있다. 비제한적 예로서, 예방적 또는 치료적 화합물은 애주번트 또는 부스터일 수 있다. 부스터(또는 부스터 백신)는 예방적 조성물의 조기 투여 후에 제공될 수 있다. 예방 조성물의 초기 투여와 부스터 사이의 투여 시간은 1분, 2분, 3 분, 4 분, 5 분, 6 분, 7 분, 8 분, 9 분, 10 분, 15 분, 20 분, 35 분, 40 분, 45 분, 50 분, 55 분, 1 시간, 2 시간, 3 시간, 4 시간, 5 시간, 6 시간, 7 시간, 8 시간, 9 시간, 10 시간, 11 시간, 12 시간, 13 시간, 14 시간, 15 시간, 16 시간, 17 시간, 18 시간, 19 시간, 20 시간, 21 시간, 22 시간, 23 시간, 1 일, 36 시간, 2 일, 3 일, 4 일, 5 일, 6 일, 1 주, 10 일, 2 주, 3 주, 1 개월, 2 개월, 3 개월, 4 개월, 5 개월, 6 개월, 7 개월, 8 개월, 9 개월, 10 개월, 11 개월, 1 년, 18 개월, 2 년, 3 년, 4 년, 5 년, 6 년, 7 년, 8 년, 9 년, 10 년, 11 년, 12 년, 13 년, 14 년, 15 년, 16 년, 17 년, 18 년, 19 년, 20 년, 25 년, 30 년, 35 년, 40 년, 45 년, 50 년, 55 년, 60 년, 65 년, 70 년, 75 년, 80 년, 85 년, 90 년, 95 년, 또는 99 년 이상일 수 있으나, 이에 제한되지 않는다. 몇몇 구현예에서, 예방 조성물의 초기 투여와 부스터 사이의 투여 시간은 1 주, 2 주, 3 주, 1 개월, 2 개월, 3 개월, 6 개월, 또는 1 년일 수 있으나, 이에 제한되지 않는다.
몇몇 구현예에서, 본 개시의 면역원성 조성물은 근육내 또는 피내 투여될 수 있다. 몇몇 구현예에서, 면역원성 조성물은 근육내 투여된다.
본 개시의 면역원성 조성물은 감염의 유병률 또는 충족되지 않은 의학적 요구의 정도 또는 수준에 따라 다양한 설정(setting)에서 이용될 수 있다. 백신은 훨씬 더 큰 항체 역가 및/또는 세포 면역 반응을 생성하고 상업적으로 이용 가능한 항바이러스제/조성물보다 더 빨리 반응을 생성한다는 점에서 우수한 특성을 가지고 있다.
본 개시의 재조합 홍역 바이러스 및/또는 본 개시의 재조합 VLP를 선택적으로 하나 이상의 약학적으로 허용되는 부형제와 조합하여 포함하는 약학적 조성물이 본원에서 제공된다. 면역원성 조성물은 투여에 적합한 비히클을 포함할 수 있다. 예를 들어, 숙주, 특히 인간 숙주에 대한 약학적으로 허용되는 비히클은 숙주에서 면역 반응을 향상시키기 위한 애주번트를 추가로 포함할 수 있지만 반드시 그런 것은 아니다. 본 발명의 조성물에 유용한 약제학적으로 허용되는 비히클은 물, 식염수, 덱스트로스, 글리세롤, 에탄올, 완충액 등, 및 이들의 조합과 같은, 사용되는 투여량 및 농도에서 환자에게 비독성인 임의의 상용성 제제를 포함한다. 비히클은 또한 안정화제, 가용화제, NaCl, MgCl2 또는 CaCl2 등과 같은 등장성 개질제, 계면활성제, 및 이들의 혼합물과 같은 추가 성분을 함유할 수 있다. 본 발명자들은 실제로 본 발명의 활성 성분의 투여가 외부 애주번트의 필요 없이 면역 반응을 유도할 수 있음을 확인하였다. 몇몇 구현예에서, 본원에 개시된 면역원성 조성물은 애주번트를 포함하지 않는다(애주번트가 없음).
이러한 백신 조성물은 벡터로부터 구출된(rescued) 재조합 감염성 복제 MV-CoV 입자를 포함하는 유리하게 유효 성분(활성 성분) 및 동일한 CoV 단백질을 포함하는 VLP와 선택적으로 회합된 본원에 정의된 바와 같은 작제물을 포함한다.
투여 계획 및 투여 요법은 위에서 언급한 CoV 단백질과 관련하여, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP와 관련하여 본 발명에 따른 재조합 감염성 복제 MV-CoV 입자의 선택된 용량의 고유한 투여를 요구할 수 있다.
대안적으로 여러 번 투여해야 할 수도 있다.
특정 구현예에서 투여는 프라임-부스트 요법에 따라 수행된다. 프라이밍 및 부스팅은 상기 언급된 CoV 단백질, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP와 관련된 재조합 감염 복제 MV-CoV 입자로 구성된 동일한 활성 성분으로 달성될 수 있다.
대안적으로 프라이밍 및 부스팅 투여는 적어도 하나의 투여 단계에서 상기 언급된 CoV 단백질, 특히 동일한 CoV 단백질을 발현하는 CoV-VLP, 및 다른 투여 단계에서, 동일한 CoV 단백질을 발현하는 상기 언급된 CoV 폴리펩티드 또는 CoV-VLP와 같은 CoV의 기타 활성 면역원과 함께 재조합 감염성 복제 MV-CoV 입자를 포함하는 상이한 활성 성분으로 달성될 수 있다.
동일한 CoV 단백질을 발현하는 CoV-VLP와 함께 본 발명에 따른 재조합 감염 복제 MV-CoV 입자의 투여는 면역 반응을 유도하고 다양한 CoV 균주에 대해 교차 반응성인 항체를 유도할 수 있다. 따라서, 본 발명에 따른 유효 성분의 투여는 CoV의 특정 균주의 코딩 서열로 제조될 때 CoV의 균주 그룹에 대한 면역 반응을 유도할 수 있다.
인간 MV 백신에 대한 현재 알려진 용량이 103 내지 105 TCID50 범위임을 고려하면, 투여될 재조합 MV-CoV의 적절한 용량은 0.1 내지 10ng, 특히 0.2 내지 6ng의 범위일 수 있고, 몇몇 구현예에서는 0.2 내지 2ng만큼 낮을 수 있다.
본 발명의 특정 구현예에 따르면, 본원에 정의된 면역원성 또는 백신 조성물은 또한 홍역 바이러스에 의한 감염에 대한 보호를 위해 사용될 수 있다.
본 발명은 또한 코로나바이러스 바이러스 관련 질병, 특히 SARS-CoV-2, 즉 COVID-19에 의한 감염과 관련된 질병을 예방하는 방법에 관한 것이고, 이 방법은 본 발명에 따른 재조합 홍역 바이러스의 주사, 특히 피하 주사에 의해 포유동물, 특히 인간, 특히 어린이를 면역화하는 것을 포함한다.
본 발명은 또한 코로나바이러스 바이러스 관련 질병, 특히 SARS-CoV-2, 즉 COVID-19에 의한 감염과 관련된 질병을 치료하는 방법에 관한 것이고, 이 방법은 본 발명에 따른 재조합 홍역 바이러스의 주사, 특히 피하 주사에 의해 포유동물, 특히 인간, 특히 어린이를 면역화하는 것을 포함한다.
백신 투여 방식
면역원성 조성물은 치료적으로 효과적인 결과를 초래하는 임의의 경로에 의해 투여될 수 있다. 여기에는 피내, 근육내, 비강내 및/또는 피하 투여가 포함되지만 이에 제한되지는 않는다. 본 개시는 면역원성 조성물을 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 방법을 제공한다. 요구되는 정확한 양은 대상체의 종, 연령 및 일반적인 상태, 질병의 중증도, 특정 조성, 투여 방식, 활성 모드 등에 따라 대상체마다 다를 것이다. 면역원성 조성물은 투여의 용이성과 투여량의 균일성을 위해 일반적으로 투여 단위 형태로 제형화된다. 그러나, 백신 조성물의 총 일일 사용량은 건전한 의학적 판단의 범위 내에서 주치의 판단에 의해 결정될 수 있음을 이해할 것이다. 특정 환자에 대한 특정 치료 효과, 예방 효과 또는 적절한 이미징 용상 수준은 치료 중인 장애 및 장애의 중증도; 사용된 특정 화합물의 활성; 사용된 특정 조성; 환자의 연령, 체중, 일반적인 건강, 성별 및 식이; 사용된 특정 화합물의 투여 시간, 투여 경로 및 배설 속도; 치료 기간; 사용된 특정 화합물과 함께 또는 동시에 사용되는 약물; 및 의학 분야에서 잘 알려진 유사한 요인을 포함한 다양한 요인에 따라 달라진다.
본원에 기재된 면역원성 조성물은 본원에 기재된 투여 형태, 예를 들어 비강내, 기관내, 또는 주사가능한(예를 들어, 정맥내, 안내, 유리체내, 근육내, 피내, 심장내, 복강내, 비강내 및 피하) 투여 형태로 제형화될 수 있다.
면역원성 제형 및 사용 방법
본 개시의 몇몇 측면은 면역원성 조성물의 제형를 제공하고, 여기서 백신은 대상체에서 항원 특이적 면역 반응(예를 들어, 코로나바이러스 항원성 폴리펩티드에 특이적인 항체의 생산)을 생성하기 위한 유효량으로 제형화된다. "유효량"은 항원-특이적 면역 반응을 생성하는데 효과적인 면역원성 조성물의 용량이다. 또한 대상체에서 항원-특이적 면역 반응을 유도하는 방법이 본원에서 제공된다.
몇몇 구현예에서, 항원-특이적 면역 반응은 본원에 제공된 바와 같은 면역원성 조성물이 투여된 대상체에서 생성된 항-항원 폴리펩티드 항체 역가를 측정하는 것을 특징으로 한다. 항체 역가는 대상체 내의 항체, 예를 들어 특정 항원(예를 들어, 돌연변이된 전장 S 단백질 또는 돌연변이된 이중 도메인 S 단백질) 또는 항원의 에피토프에 특이적인 항체의 양을 측정한 것이다. 항체 역가는 일반적으로 양성 결과를 제공하는 최대 희석의 역수로 표시된다. 효소 결합 면역흡착 분석법(ELISA)은 예를 들어 항체 역가를 결정하기 위한 일반적인 분석법이다.
몇몇 구현예에서, 항체 역가는 대상체가 감염되었는지 여부를 평가하거나 면역화가 필요한지 여부를 결정하는데 사용됩니다. 몇몇 구현예에서, 항체 역가는 자가면역 반응의 강도를 결정하고, 추가 면역화가 필요한지 여부를 결정하고, 이전 백신이 효과적인지 여부를 결정하고, 임의의 최근 또는 이전 감염을 확인하는데 사용된다. 본 개시에 따르면, 항체 역가는 면역원성 조성물에 의해 대상체에서 유도된 면역 반응의 강도를 측정하기 위해 사용될 수 있다.
또한, 본 발명은 SARS-CoV-2의 폴리펩티드를 암호화하고 천연 서열과 비고하여 변형된 핵산 분자에 관한 것이다. 특히, 본 발명은 하기 표 1에 개시된 바와 같은 서열의 폴리뉴클레오티드를 포함하거나 이로 구성되는 핵산 분자에 관한 것이다.
작제물 | 서열번호 |
nCoV의 S 폴리펩티드(즉, SARS-CoV-2) | 서열번호 1 또는 서열번호 2 |
nCoV의 stab-S 폴리펩티드(즉, SARS-CoV-2)(nCoV의 S2P 폴리펩티드라고도 함(즉, SARS-CoV-2)) | 서열번호 4 |
nCoV의 Secto 폴리펩티드(즉, SARS-CoV-2)) | 서열번호 6 |
nCoV의 stab-Secto 폴리펩티드(즉, SARS-CoV-2) | 서열번호 8 |
nCoV의 S1 폴리펩티드(즉, SARS-CoV-2) | 서열번호 10 |
nCoV의 S2 폴리펩티드(즉, SARS-CoV-2) | 서열번호 12 |
nCoV의 stab-S2 폴리펩티드(즉, SARS-CoV-2) | 서열번호 14 |
nCoV의 tri-Secto 폴리펩티드(즉, SARS-CoV-2) | 서열번호 16 |
nCoV의 nCoV의 tristab-Secto 폴리펩티드(즉, SARS-CoV-2) | 서열번호 18 |
nCoV의 S3F 폴리펩티드(즉, SARS-CoV-2) | 서열번호 42 |
nCoV의 S2P3F 폴리펩티드(즉, SARS-CoV-2) | 서열번호 44 |
nCoV의 S2PΔF 폴리펩티드(즉, SARS-CoV-2) | 서열번호 46 |
nCoV의 S2PΔF2A 폴리펩티드(즉, SARS-CoV-2) | 서열번호 48 |
SARS-CoV-2의 T4-S2P3F 폴리펩티드(tristab-Secto-3F라고도 함) | 서열번호 51 |
SARS-CoV-2의 S6P 폴리펩티드 | 서열번호 53 |
SARS-CoV-2의 S6P3F 폴리펩티드 | 서열번호 55 |
SARS-CoV-2의 S6PΔF 폴리펩티드 | 서열번호 57 |
SARS-CoV-2의 SCCPP 폴리펩티드 | 서열번호 59 |
SARS-CoV-2의 SCC6P 폴리펩티드 | 서열번호 61 |
SARS-CoV-2의 S MVopt 2P 폴리펩티드 | 서열번호 63 |
SARS-CoV-2의 S MVopt ΔF 폴리펩티드 | 서열번호 64 |
SARS-CoV-2의 S MVopt 2PΔF 폴리펩티드 | 서열번호 66 |
nCoV의 SF-dER(즉, SARS-CoV-2) | 서열번호 73 |
nCoV의 SF-2P-dER(즉, SARS-CoV-2) | 서열번호 75 |
nCoV의 S2-dER(즉, SARS-CoV-2) | 서열번호 77 |
nCoV의 S2-2P-dER(즉, SARS-CoV-2) | 서열번호 79 |
nCoV의 SF-2P-2a(즉, SARS-CoV-2) | 서열번호 81 |
또한, 본 발명은 하기 표 2에 개시된 플라스미드에 관한 것이다.
플라스미드 | 서열번호 |
pKP-MVSchw | 서열번호 30 |
pKP-MVSchw-ATU1(eGFP) | 서열번호 31 |
pKP-MVSchw-ATU2(eGFP) | 서열번호 32 |
pKP-MVSchw-ATU3(eGFP) | 서열번호 33 |
pKM-ATU2-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) | 서열번호 34 |
pKM-ATU3-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) | 서열번호 35 |
pTM2-SF-dER_SARS-CoV-2(최적화된 서열) | 서열번호 144 |
pTM2-S2-dER_SARS-CoV-2(최적화된 서열) | 서열번호 145 |
pTM2-SF-2P-dER_SARS-CoV-2(최적화된 서열) | 서열번호 146 |
pTM2-S2-2P-dER_SARS-CoV-2(최적화된 서열) | 서열번호 147 |
pTM2-SF-2P-2a_SARS-CoV-2(최적화된 서열) | 서열번호 148 |
특정 측면에서, 본 발명은 2020년 2월 12일에 기탁번호 CNCM I-5493로 기탁된 플라스미드 pKP-MVSchwarz 또는 서열번호 30의 서열을 갖는 플라스미드 pKP-MVSchw에 관한 것이다. 이 플라스미드는 임의의 폴리뉴클레오티드를 클로닝하기 위한 플라스미드로 사용될 수 있다.
또 다른 특정 측면에서, 본 발명은 2002년 6월 12일자로 기탁번호 CNCM I-2889로 기탁된 플라스미드 pTM-MVSchw(또는 서열번호 28의 서열을 가짐), 또는 2002년 6월 12일에 기탁번호 CNCM I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp(또는 서열번호 29의 서열을 가짐), 또는 서열번호 38의 서열을 갖는 플라스미드 pTM3-MVSchw-gfp, 바람직하게는 2002년 6월 12일에 기탁번호 CNCM I-2890로 기탁된 플라스미드 pTM2-MVSchw-gfp(또는 서열번호 29의 서열을 가짐)에 관한 것이다. 이 플라스미드는 임의의 폴리뉴클레오티드를 클로닝하기 위한 플라스미드로 사용될 수 있다.
화합물의 이름, 즉 펩티드/단백질/항원(약어) | 화합물을 암호화하는 폴리뉴클레오티드의 천연 뉴클레오티드 서열의 서열번호 | 화합물을 암호화하는 폴리뉴클레오티드의 코돈 최적화된 뉴클레오티드 서열의 서열번호 | 화합물을 암호화하는 폴리뉴클레오티드의 MV-최적화된 뉴클레오티드 서열의 서열번호 | 화합물의 아미노산 서열의 서열번호 |
nCoV의 S 폴리펩티드(즉, SARS-CoV-2) | 1 | 2 | 36 | 3 |
nCoV의 stab-S 폴리펩티드(즉, SARS-CoV-2)(nCoV의 S2P 폴리펩티드라고도 함(즉, SARS-CoV-2)) | 4 | 5 | ||
nCoV의 Secto 폴리펩티드(즉, SARS-CoV-2) | 6 | 7 | ||
nCoV의 stab-Secto 폴리펩티드(즉, SARS-CoV-2) | 8 | 9 | ||
nCoV의 S1 폴리펩티드(즉, SARS-CoV-2) | 10 | 11 | ||
nCoV의 S2 폴리펩티드(즉, SARS-CoV-2) | 12 | 13 | ||
nCoV의 stab-S2 폴리펩티드(즉, SARS-CoV-2) | 14 | 15 | ||
nCoV의 tri-Secto 폴리펩티드(즉, SARS-CoV-2) | 16 | 17 | ||
nCoV의 tristab-Secto 폴리펩티드(즉, SARS-CoV-2) | 18 | 19 | ||
nCoV의 N 폴리펩티드(즉, SARS-CoV-2) | 20 | 21 | 37 | 22 |
nCoV의 E 폴리펩티드(즉, SARS-CoV-2) | 23 | |||
nCoV의 M 폴리펩티드(즉, SARS-CoV-2) | 24 | |||
nCoV의 ORF8 폴리펩티드(즉, SARS-CoV-2) | 25 | |||
nCoV의 ORF3a 폴리펩티드(즉, SARS-CoV-2) | 26 | |||
nCoV의 ORF7a 폴리펩티드(즉, SARS-CoV-2) | 27 | |||
nCoV의 S3F 폴리펩티드(즉, SARS-CoV-2) | 42 | 43 | ||
nCoV의 S2P3F 폴리펩티드(즉, SARS-CoV-2) | 44 | 45 | ||
nCoV의 S2PΔF 폴리펩티드(즉, SARS-CoV-2) | 46 | 47 | ||
nCoV의 S2PΔF2A 폴리펩티드(즉, SARS-CoV-2) | 48 | 49 | ||
SARS-CoV-2의 T4-S2P3F 폴리펩티드(SARS-CoV-2의 tristab-Secto-3F 폴리펩티드라고도 함) | 51 | 52 | ||
SARS-CoV-2의 S6P 폴리펩티드 | 53 | 54 | ||
SARS-CoV-2의 S6P3F 폴리펩티드 | 55 | 56 | ||
SARS-CoV-2의 S6PΔF 폴리펩티드 | 57 | 58 | ||
SARS-CoV-2의 SCCPP 폴리펩티드 | 59 | 60 | ||
SARS-CoV-2의 SCC6P 폴리펩티드 | 61 | 62 | ||
SARS-CoV-2의 S MVopt 2P 폴리펩티드 | 63 | 5 | ||
SARS-CoV-2의 S MVopt ΔF 폴리펩티드 | 64 | 65 | ||
SARS-CoV-2의 S MVopt 2PΔF 폴리펩티드 | 66 | 47 | ||
nCoV의 SF-dER(즉, SARS-CoV-2) | 73 | 74 | ||
nCoV의 SF-2P-dER(즉, SARS-CoV-2) | 75 | 76 | ||
nCoV의 S2-dER(즉, SARS-CoV-2) | 77 | 78 | ||
nCoV의 S2-2P-dER(즉, SARS-CoV-2) | 79 | 80 | ||
nCoV의 SF-2P-2a(즉, SARS-CoV-2) | 81 | 82 |
전달 벡터 플라스미드 및 요소의 이름 | 서열번호 |
pTM-MVSchw | 28 |
pTM2-MVSchw-gfp | 29 |
pKP-MVSchw | 30 |
pKP-MVSchw-ATU1(eGFP) | 31 |
pKP-MVSchw-ATU2(eGFP) | 32 |
pKP-MVSchw-ATU3(eGFP) | 33 |
pKM-ATU2-S_2019-nCoV (즉, SARS-CoV-2)(최적화된 서열) | 34 |
pKM-ATU3-S_2019-nCoV(즉, SARS-CoV-2)(최적화된 서열) | 35 |
pTM3-MVSchw-gfp | 38 |
ATU1(eGFP) | 39 |
ATU2(eGFP) | 40 |
ATU3(eGFP) | 41 |
개시된 서열은 뉴클레오티드 또는 아미노산 잔기에 관한 다음의 주석에 의하여 추가로 특성화된다:
nCoV의 스파이크 (S) 폴리펩티드의 천연 뉴클레오티드 서열 (서열번호 1)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..3846
/cds_type="ORF"
/product="spike protein (S)"
/label="2019-nCoV_S ORF"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (S) 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 2)
특징(FEATURES) 위치/검증자(Location/Qualifiers)
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-S) 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 4)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike protein (S)"
/label="2019-nCoV_stab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-S) 폴리펩티드의 안정화된 형태(서열번호 5)
특징 위치/검증자
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
nCoV의 스파이크 (Secto) 엑토도메인 폴리펩티드의 가용성 및 단량체 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 6)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..3667
/product="soluble S ectodomain"
/label="2019-NCoV_Secto-opt ORF"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site join(3671..3676,3671^3672)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-Secto) 엑토도메인 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열(서열번호 8)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..3667
/product="stabilized soluble S ectodomain"
/label="2019-NCoV_stab-Secto-opt ORF"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2984..2989
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Site join(3671..3676,3671^3672)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (stab-Secto) 엑토도메인 폴리펩티드의 안정화된 형태(서열번호 9)
특징 위치/검증자
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
nCoV의 S1 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 10)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 29..2077
/product="soluble S1 subdomain"
/label="2019-NCoV_S1opt ORF"
Site join(2081..2086,2081^2082)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열(서열번호 12)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1842
/product="S2 domain linked to TM and cytoplasmic domain
and fused to signal peptide"
/label="S2-TM-cyto_2019-NCoV-opt"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: NgoMIV"
/note="Pattern: gccggc"
/label="NgoMIV"
Region 67..72
/region_type="Connecting peptide"
/label="Ala-Gly linker"
Region 73..1656
/region_type="Domain"
/label="S2 domain"
Region 1657..1725
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Region 1726..1836
/region_type="Cytoplasmic"
/label="cytoplasmic domain"
Site join(1843..1848,1843^1844)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 폴리펩티드 (서열번호 13)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 15..16
/region_type="Connecting peptide"
/label="AG linker"
Region 17..544
/region_type="Extracellular"
/label="S2_domain"
Region 545..567
/site_type="transmembrane-region"
/label="TM_domain"
Region 568..604
/region_type="Cytoplasmic"
/label="cytoplasmic_domain"
nCoV의 S2 (stab-S2) 폴리펩티드의 안정화된 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 14)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1842
/product="stabilized S2 domain linked to TM and
cytoplasmic domain and fused to signal peptide"
/label="stab-S2-TM-cyto_2019-NCoV-opt"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: NgoMIV"
/note="Pattern: gccggc"
/label="NgoMIV"
Region 67..72
/region_type="Connecting peptide"
/label="Ala-Gly linker"
Region 73..1656
/region_type="Domain"
/label="S2 domain (stabilized)"
Site 973..978
/site_type="mutagenized site"
/note="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 1657..1725
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Region 1726..1836
/region_type="Cytoplasmic"
/label="cytoplasmic domain"
Site join(1843..1848,1843^1844)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2 (stab-S2) 폴리펩티드의 안정화된 형태 (서열번호 15)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 15..16
/region_type="Connecting peptide"
/label="AG linker"
Region 17..544
/region_type="Extracellular"
/label="S2_domain"
Site 317..318
/site_type="mutagenized site"
/label="K986P + V987P mutations"
Region 545..567
/site_type="transmembrane-region"
/label="TM_domain"
Region 568..604
/region_type="Cytoplasmic"
/label="cytoplasmic_domain"
nCoV의 스파이크 (tri-Secto) 폴리펩티드의 가용성 및 단량체 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 16)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 29..3754
/product="trimerized soluble S ectodomain"
/label="2019-NCoV_tri-Secto-opt ORF"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Region 74..3661
/region_type="Domain"
/label="S ectodomain"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 3662..3670
/region_type="Connecting peptide"
/label="SGG linker"
Region 3668..3748
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
Site join(3755..3760,3755^3756)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 (tri-Secto) 폴리펩티드의 가용성 및 단량체 형태 (서열번호 17)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 16..1211
/region_type="Extracellular"
/label="S_ectodomain"
Region 1212..1214
/region_type="Connecting peptide"
/label="SGG_linker"
Region 1214..1240
/region_type="Coiled coil"
/label="T4_fibritin_foldon"
nCoV의 스파이크 엑토도메인 (tristab-Secto) 폴리펩티드의 안정화된 및 삼량체화된 형태의 코돈 최적화된 뉴클레오티드 서열 (서열번호 18)
특징 위치/검증자
Site join(17..22,17^18)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 29..3754
/product="stabilized and trimerized soluble S ectodomain"
/label="2019-NCoV_tristab-Secto-opt ORF"
sig_peptide 29..73
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Region 74..3661
/region_type="Domain"
/label="S ectodomain (stabilized)"
Site 2072..2083
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2984..2989
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3662..3670
/region_type="Connecting peptide"
/label="SGG linker"
Region 3668..3748
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
Site join(3755..3760,3755^3756)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 스파이크 엑토도메인 (tristab-Secto) 폴리펩티드의 안정화된 및 삼량체화된 형태 (서열번호 19)
특징 위치/검증자
sig_peptide 1..15
/label="signal_peptide"
Region 16..1211
/region_type="Extracellular"
/label="S_ectodomain"
Site 986..987
/site_type="mutagenized site"
/label="K986P + V987P mutations"
Region 1212..1214
/region_type="Connecting peptide"
/label="SGG_linker"
Region 1214..1240
/region_type="Coiled coil"
/label="T4_fibritin_foldon"
nCoV의 N 폴리펩티드의 천연 뉴클레오티드 서열 (서열번호 20)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1284
/cds_type="ORF"
/product="nucleoprotein (N)"
/label="2019-nCoV_N ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 N 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 21)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1287
/product="nucleoprotein (N)"
/label="2019-nCoV_Nopt ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
pKP-MVSchw (서열번호 30)
LOCUS pKP-MVSchw 17858 bp DNA circular UNA
DEFINITION Abbreviated names : pKP-MSchwarz, pKM
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..15976
/label="MVSchwarz_antigenome"
misc_signal 83..134
/standard_name="leader"
misc_feature 135..137
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="leader-N GJ"
promoter 138..148
/function="start of transcription"
/label="N gene start"
CDS 190..1767
/codon_start=1
/product="nucleocapsid protein"
/label="N ORF"
terminator 1816..1826
/function="polyadenylation signal"
/label="N gene end"
misc_feature 1827..1829
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="N-P GJ"
promoter 1830..1840
/function="restart of transcription"
/label="P/V/C gene start"
CDS join(1889..2580,2580..2787)
/note="addition of an additional G at 2499 to generate V
mRNA"
/label="V ORF"
CDS 1889..3412
/codon_start=1
/product="phosphoprotein"
/label="P ORF"
CDS 1911..2471
/codon_start=1
/product="nonstructural C protein"
/label="C ORF"
misc_signal 2570..2586
/function="co-transcriptional editing of mRNA"
/note="addition of an additional G at 2499 to generate V
mRNA"
/label="editing motif"
Site join(3446..3451,3446^3447)
/site_type="restriction site"
/note="Name: SalI"
/note="Pattern: gtcgac"
/label="SalI"
Site join(3455..3460,3455^3456)
/site_type="restriction site"
/note="Name: SpeI"
/note="Pattern: actagt"
/label="SpeI"
terminator 3474..3484
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 3485..3487
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 3488..3498
/function="restart of transcription"
/label="M gene start"
CDS 3520..4527
/codon_start=1
/product="matrix protein"
/label="M ORF"
terminator 4943..4953
/function="polyadenylation signal"
/label="M gene end"
misc_feature 4954..4956
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 4957..4967
/function="restart of transcription"
/label="F gene start"
CDS 5531..7192
/codon_start=1
/product="fusion protein (alternate product)"
/label="F ORF (alt.)"
CDS 5540..7192
/codon_start=1
/product="fusion protein (main product)"
/label="F ORF"
Site join(6353..6358,6353^6354)
/site_type="restriction site"
/note="Name: SalI"
/note="Pattern: gtcgac"
/label="SalI"
terminator 7319..7329
/function="polyadenylation signal"
/label="F gene end"
misc_feature 7330..7332
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="F-H GJ"
promoter 7333..7343
/function="restart of transcription"
/label="H gene start"
CDS 7353..9206
/codon_start=1
/product="hemagglutinin protein"
/label="H ORF"
Site join(9257..9262,9257^9258)
/site_type="restriction site"
/note="Name: SpeI"
/note="Pattern: actagt"
/label="SpeI"
terminator 9280..9290
/function="polyadenylation signal"
/label="H gene end"
misc_feature 9291..9293
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 9294..9304
/function="restart of transcription"
/label="L gene start"
CDS 9316..15867
/codon_start=1
/product="large polymerase"
/label="L ORF"
terminator 15926..15936
/function="polyadenylation signal"
/label="L gene end"
misc_feature 15937..15939
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="L-trailer GJ"
misc_signal 15940..15976
/standard_name="trailer"
Site 15977..16060
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
Region 16074..16196
/note="nt 24107..24229 from bact. T7 DNA"
/label="full terminator region from bacteriophage T7"
terminator 16131..16177
/label="T7 terminator"
Site join(16203..16210,16204^16205)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 16211..17858
/label="plasmid_backbone"
CDS 16261..17070
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17134..17807
/label="pUC origin"
pKP-MVSchw-ATU1(eGFP) (서열번호 31)
LOCUS pKP-MVSchw-ATU1(eGFP) 18734 bp DNA circular UNA
DEFINITION Abbreviated names : pKM-ATU1(eGFP) ; pKM1-eGFP
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16852
/label="MVSchw-ATU1-eGFP_antigenome"
misc_feature 135..137
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="identical to leader-N GJ"
/label="leader-ATU1 GJ"
misc_feature 135..1010
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU1"
promoter 138..148
/function="start of transcription"
/note="identical to N gene start"
/label="ATU1 gene start"
Site join(190..195,190^191)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(193..198,193^194)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 199..918
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(919..924,919^920)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(925..930,927^928)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(933..938,937^938)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 1000..1010
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered ATU1 gene end"
misc_feature 1011..1013
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="original leader-N GJ"
/label="ATU1-N GJ"
promoter 1014..1024
/function="start of transcription"
/note="original N gene start"
/label="N gene start"
Site 16853..16936
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 17007..17053
/label="T7 terminator"
Site join(17079..17086,17080^17081)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17087..18734
/label="plasmid_backbone"
CDS 17137..17946
/function="kanamycin resistance"
/label="kanaR"
rep_origin 18010..18683
/label="pUC origin"
pKP-MVSchw-ATU2(eGFP) (서열번호 32)
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16804
/label="MVSchw-ATU2-eGFP_antigenome"
misc_feature 3460..4287
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 3476..3486
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 3487..3489
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 3490..3500
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(3523..3528,3523^3524)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(3526..3531,3526^3527)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 3532..4251
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(4252..4257,4252^4253)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(4258..4263,4260^4261)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(4266..4271,4270^4271)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 4302..4312
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 4313..4315
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 4316..4326
/function="restart of transcription"
/label="M gene start"
terminator 5771..5781
/function="polyadenylation signal"
/label="M gene end"
misc_feature 5782..5784
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 5785..5795
/function="restart of transcription"
/label="F gene start"
Site 16805..16888
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 16959..17005
/label="T7 terminator"
Site join(17031..17038,17032^17033)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17039..18686
/label="plasmid_backbone"
CDS 17089..17898
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17962..18635
/label="pUC origin"
pKP-MVSchw-ATU3(eGFP) (서열번호 33)
LOCUS pKP-MVSchw-ATU3(eGFP) 18686 bp DNA circular UNA
DEFINITION Abbreviated names : pKM-ATU3(eGFP) ; pKM3-eGFP
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..16804
/label="MVSchw-ATU3-eGFP_antigenome"
misc_feature 9258..10085
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 9278..9288
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 9289..9291
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 9292..9302
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(9325..9330,9325^9326)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(9328..9333,9328^9329)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 9334..10053
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(10054..10059,10054^10055)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(10060..10065,10062^10063)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(10068..10073,10072^10073)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 10108..10118
/function="polyadenylation signal"
/label="H gene end"
misc_feature 10119..10121
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 10122..10132
/function="restart of transcription"
/label="L gene start"
Site 16805..16888
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 16959..17005
/label="T7 terminator"
Site join(17031..17038,17032^17033)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 17039..18686
/label="plasmid_backbone"
CDS 17089..17898
/function="kanamycin resistance"
/label="kanaR"
rep_origin 17962..18635
/label="pUC origin"
pKM-ATU2-S_2019-nCoV (최적화된 서열) (서열번호 34)
LOCUS pKM-ATU2-S_2019-nCoV 21800 bp DNA circular UNA
DEFINITION Abbreviated names : pKM2-S_nCoV
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..19918
/label="MVSchw-ATU2-S_2019-nCoV"
misc_feature 3460..7401
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 3476..3486
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 3487..3489
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 3490..3500
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(3523..3528,3523^3524)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(3526..3531,3526^3527)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 3538..7362
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
sig_peptide 3538..3582
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Site 5581..5592
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 7177..7245
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(7366..7371,7366^7367)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(7372..7377,7374^7375)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(7380..7385,7384^7385)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 7416..7426
/function="polyadenylation signal"
/label="P/V/C gene end"
misc_feature 7427..7429
/function="nontranscribed intergenic trinucleotide"
/label="P-M GJ"
promoter 7430..7440
/function="restart of transcription"
/label="M gene start"
terminator 8885..8895
/function="polyadenylation signal"
/label="M gene end"
misc_feature 8896..8898
/function="non transcribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="M-F GJ"
promoter 8899..8909
/function="restart of transcription"
/label="F gene start"
Site 19919..20002
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 20073..20119
/label="T7 terminator"
Site join(20145..20152,20146^20147)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 20153..21800
/label="plasmid_backbone"
CDS 20203..21012
/function="kanamycin resistance"
/label="kanaR"
rep_origin 21076..21749
/label="pUC origin"
pKM-ATU3-S_2019-nCoV (최적화된 서열) (서열번호 35)
LOCUS pKM-ATU3-S_2019-nCoV 21800 bp DNA circular UNA
DEFINITION Abbreviated names : pKM3-S_nCoV
COMMENT
특징 위치/검증자
Site join(1..8,5^6)
/site_type="restriction site"
/note="Name: AsiSI"
/note="Pattern: gcgatcgc"
/label="AsiSI"
promoter 9..28
/label="T7 promoter"
Site 29..97
/site_type="cleavage site"
/function="self-cleaves after position 54 to generate an
antigenome with an exact 5' end"
/label="hammerhead ribozyme"
misc_RNA 83..19918
/label="MVSchw-ATU3-eGFP_antigenome"
misc_feature 9258..13199
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 9278..9288
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 9289..9291
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 9292..9302
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(9325..9330,9325^9326)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(9328..9333,9328^9329)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 9340..13164
/product="spike protein (S)"
/label="2019-nCoV_Sopt ORF"
sig_peptide 9340..9384
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
Site 11383..11394
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Region 12979..13047
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(13168..13173,13168^13169)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(13174..13179,13176^13177)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(13182..13187,13186^13187)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 13222..13232
/function="polyadenylation signal"
/label="H gene end"
misc_feature 13233..13235
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/label="H-L GJ"
promoter 13236..13246
/function="restart of transcription"
/label="L gene start"
Site 19919..20002
/site_type="cleavage site"
/function="self-cleaves before position a to generate an
antigenome with an exact 3' end"
/label="genomic HDV ribozyme"
terminator 20073..20119
/label="T7 terminator"
Site join(20145..20152,20146^20147)
/site_type="restriction site"
/note="Name: NotI"
/note="Pattern: gcggccgc"
/label="NotI"
misc_feature 20153..21800
/label="plasmid_backbone"
CDS 20203..21012
/function="kanamycin resistance"
/label="kanaR"
rep_origin 21076..21749
/label="pUC origin"
nCoV의 스파이크 (S) 폴리펩티드의 MV-최적화된 뉴클레오티드 서열 (서열번호 36)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..3849
/product="spike protein (S)"
/label="2019-nCoV_Smvopt ORF"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 N 폴리펩티드의 MV-최적화된 뉴클레오티드 서열 (서열번호 37)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 25..1287
/product="nucleoprotein (N)"
/label="2019-nCoV_Nmvopt ORF"
Site join(1291..1296,1291^1292)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
ATU1(eGFP) (SEQ ID NO : 39)
특징 위치/검증자
misc_feature 1..876
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU1"
misc_feature 1..3
/function="nontranscribed intergenic trinucleotide"
/standard_name="Gene Junction"
/note="identical to leader-N GJ"
/label="leader-ATU1 GJ"
promoter 4..14
/function="start of transcription"
/note="identical to N gene start"
/label="ATU1 gene start"
Site join(56..61,56^57)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(59..64,59^60)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 65..784
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(785..790,785^786)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(791..796,793^794)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(799..804,803^804)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
terminator 866..876
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered ATU1 gene end"
ATU2(eGFP) (서열번호 40)
특징 위치/검증자
misc_feature 1..828
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU2"
terminator 17..27
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 28..30
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 31..41
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(64..69,64^65)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(67..72,67^68)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 73..792
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(793..798,793^794)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(799..804,801^802)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(807..812,811^812)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
ATU3(eGFP) (서열번호 41)
특징 위치/검증자
misc_feature 1..828
/feature_type="Insertion"
/function="additional transcription unit"
/label="ATU3"
terminator 21..31
/function="polyadenylation signal"
/note="corresponds to N gene end sequence"
/label="engineered P/V/C gene end"
misc_feature 32..34
/function="nontranscribed intergenic trinucleotide"
/standard_name="gene junction"
/label="P-ATU2 GJ"
promoter 35..45
/function="restart of transcription"
/note="corresponds to P/V/C gene start sequence"
/label="ATU2 gene start"
Site join(68..73,68^69)
/site_type="restriction site"
/note="Name: MluI"
/note="Pattern: acgcgt"
/label="MluI"
Site join(71..76,71^72)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
CDS 77..796
/cds_type="ORF"
/product="enhanced Green Fluorescent Protein"
/label="eGFP ORF"
Site join(797..802,797^798)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
Site join(803..808,805^806)
/site_type="restriction site"
/note="Name: AfeI"
/note="Pattern: agcgct"
/label="AfeI"
Site join(811..816,815^816)
/site_type="restriction site"
/note="Name: AatII"
/note="Pattern: gacgtc"
/label="AatII"
nCoV의 S3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 42)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (inactivation of
furin S1/S2 cleavage site)"
/label="2019-nCoV_3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2P3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 44)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
CDS 25..3849
/product="stabilized spike (S) protein (2P mutation &
inactivation of furin S1/S2 cleavage site)"
/label="2019-nCoV_2P+3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="TMHMM2.0 TMHELIX"
/note="PHOBIUS TRANSMEM"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2PΔF 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 46)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3816
/product="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2P+ΔFstab-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S2PΔF2A 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 48)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
/label="Signal_peptide"
CDS 25..3816
/product="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site) with inactivation of the ERR signal"
/label="2019-nCoV_2P+Fstab+2Amut-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site 3796..3804
/site_type="mutagenized site"
/function="inactivation of ERR signal"
/note="2A mutation"
/label="K1258A + H1260A mutations"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
nCoV의 S3F 폴리펩티드 (서열번호 43)
특징 위치/검증자
Site 682..685
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
nCoV의 S2P3F 폴리펩티드 (서열번호 45)
특징 위치/검증자
Site 682..685
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 986..987
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
nCoV의 S2PΔF 폴리펩티드 (서열번호 47)
특징 위치/검증자
misc_feature 674..675
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 975..976
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
nCoV의 S2PΔF2A 폴리펩티드 (서열번호 49)
특징 위치/검증자
misc_feature 674..675
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 975..976
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Site 1258..1260
/site_type="mutagenized site"
/function="inactivation of ERR signal"
/label="K1258A + H1260A mutations"
/label="TM domain"
SARS-CoV-2의 T4-S2P3F(tristab-Secto-3F 또는 S2P3F의 가용성 삼량체화된 형태라고도 함) 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 51)
특징 위치/검증자
CDS 13..3738
/product="stabilized (2P mutation + inactivated furin
S1/S2 cleavage site) and trimerized (T4 foldon) soluble S
ectodomain"
/label="2019-NCoV_T4-S2P3F-opt ORF"
sig_peptide 13..57
/note="predicted from Phobius"
/note="predicted from SignalP-5.0"
Region 58..3645
/region_type="Domain"
/label="S ectodomain (2P+3F stabilized)"
Site 2056..2067
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2968..2973
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3646..3654
/region_type="Connecting peptide"
/label="SGG linker"
Region 3652..3732
/region_type="Coiled coil"
/function="trimerization foldon"
/label="T4 fibritin foldon"
SARS-CoV-2의 S6P 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 53)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (6P mutation)"
/note
/note
/label="2019-nCoV_6Pstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S6P3F 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 55)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (6P mutation &
inactivation of furin S1/S2 cleavage site)"
/label="2019-nCoV_6P+3Fstab-Sopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="RRAR -> GSAG substitution"
/label="inactivated S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S6PΔF 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 57)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/function="stabilized spike (S) protein (6P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_6P+ΔFstab-Sopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2440..2442
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2665..2667
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2686..2688
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2815..2817
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3631..3699
/site_type="transmembrane-region"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 SCCPP 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 59)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (CC+2P mutations)"
/label="2019-nCoV_CC+PPstab-Sopt ORF"
Site 1171..1173
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with D985C"
/label="S383C"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2977..2979
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with S383C"
/label="D985C"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 SCC6P 폴리펩티드의 코돈 최적화된 뉴클레오티드 서열 (서열번호 61)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/product="stabilized spike (S) protein (CC+6P mutations)"
/label="2019-nCoV_CC+6Pstab-Sopt ORF"
Site 1171..1173
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with D985C"
/label="S383C"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2473..2475
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="F817P"
Site 2698..2700
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A892P"
Site 2719..2721
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A899P"
Site 2848..2850
/site_type="mutagenized site"
/function="stabilizing mutation"
/label="A942P"
Site 2977..2979
/site_type="mutagenized site"
/function="stabilizing mutation : disulfide bond
formation with S383C"
/label="D985C"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations 2P"
Region 3664..3732
/site_type="transmembrane-region"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2P 폴리펩티드(S
MVopt
2P)의 MV-최적화된 뉴클레오티드 서열 (서열번호 63)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3849
/cds_type="ORF"
/function="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2Pstab-Smvopt ORF"
Site 2068..2079
/site_type="cleavage site"
/note="polybasic furin-like cleavage site"
/label="predicted S1/S2 cleavage site"
Site 2980..2985
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3664..3732
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3853..3858,3853^3854)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2PΔF 폴리펩티드(S
MVopt
2PΔF)의 MV-최적화된 뉴클레오티드 서열 (서열번호 64)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/cds_type="ORF"
/function="stabilized spike (S) protein (deletion of loop
encompassing the S1/S2 furin cleavage site)"
/label="2019-nCoV_Fstab-Smvopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
SARS-CoV-2의 S2PΔF 폴리펩티드(S
MVopt
2PΔF)의 MV-최적화된 뉴클레오티드 서열 (서열번호 66)
특징 위치/검증자
Site join(13..18,13^14)
/site_type="restriction site"
/note="Name: BsiWI"
/note="Pattern: cgtacg"
/label="BsiWI"
sig_peptide 25..69
/label="Signal_peptide"
CDS 25..3816
/cds_type="ORF"
/function="stabilized spike (S) protein (2P mutation &
deletion of loop encompassing the S1/S2 furin cleavage
site)"
/label="2019-nCoV_2P+Fstab-Smvopt ORF"
misc_feature 2044..2049
/feature_type="Deletion"
/note="deletion of QTQTNSPRRAR (loop encompassing S1/S2
cleavage site)"
/label="11-aa-deletion"
Site 2947..2952
/site_type="mutagenized site"
/function="stabilizing double mutation"
/label="K986P + V987P mutations"
Region 3631..3699
/site_type="transmembrane-region"
/note="predicted from TMHMM2.0"
/note="predicted from PHOBIUS"
/label="TM domain"
Site join(3817..3822,3817^3818)
/site_type="restriction site"
/note="Name: BssHII"
/note="Pattern: gcgcgc"
/label="BssHII"
또한, 본 발명은 S 폴리펩티드 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편을 포함하는 재조합 바이러스 유사 입자(VLP)에 관한 것이고, 여기서의 S 폴리펩티드 또는 면역원성 단편은 본 발명에 따른 핵산 작제물, 또는 본 발명에 따른 전달 플라스미드 벡터, 또는 본 발명에 따른 재조합 홍역 바이러스의 제1 및 선택적으로 제2 이종 폴리뉴클레오티드(들)에 의해 암호화되거나 본 발명에 따른 숙주 세포 내에서 생산되는 것이다.
본 발명에 따르면, VLP는 다량으로 생산될 수 있고 재조합 감염성 MV-CoV 입자와 함께 발현된다. VLP는 CoV의 VLP이다.
본 발명의 바람직한 구현예에 따르면, 재조합 MV 벡터는 이러한 방식으로 설계되고 생산 방법은, 백신 접종에 적합한 MV 균주로부터 유래된 벡터로 형질감염되거나 형질전환된 헬퍼 세포에서 생산된 바이러스 입자가 재조합 감염 복제 MV의 생산 및 면역원성 조성물, 바람직하게는 보호 또는 백신 조성물에 사용하기 위한 CoV-VLP의 생산을 가능하게 하도록 세포를 포함한다.
유리하게는, 본 발명의 재조합 감염성 MV-CoV 입자의 게놈은 복제 가능하다. "복제 가능"은 MV의 N, P 및 L 단백질을 발현하는 헬퍼 세포주로 형질도입될 때 새로운 바이러스 입자를 생성하기 위해 전사 및 발현될 수 있는 핵산을 의미한다.
또한, MV-CoV의 재조합 게놈의 제조를 위해 MV cDNA를 사용하여 수득된 본 발명의 재조합 바이러스의 복제는 숙주, 특히 재조합 MV-CoV가 투여되는 인간 숙주에서 생체내에서 달성될 수도 있다.
또한, 본 발명은 본 발명에 따른 핵산 분자에 의해 코딩되는 코로나바이러스(CoV), 특히 SARS-CoV-2의 폴리펩티드에 관한 것이다.
본 발명의 특정 구현예에서, 폴리펩티드는 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함한다:
i. 서열번호 3 (작제물 S);
ii. 서열번호 5 (작제물 stab-S);
iii. 서열번호 7 (작제물 Secto);
iv. 서열번호 9 (작제물 stab-Secto);
v. 서열번호 11 (작제물 S1),
vi. 서열번호 13 (작제물 S2),
vii. 서열번호 15 (작제물 stab-S2),
viii.
서열번호 17 (작제물 tri-Secto),
ix. 서열번호 19 (작제물 tristab-Secto),
x. 서열번호 43 (작제물 S3F),
xi. 서열번호 45 (작제물 S2P3F),
xii. 서열번호 47 (작제물 S2PΔF),
xiii.
서열번호 49 (작제물 S2PΔF2A),
xiv. 서열번호 22 (작제물 N),
xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
xvi. 서열번호 54 (작제물 S6P),
xvii.
서열번호 56 (작제물 S6P3F),
xviii. 서열번호 58 (작제물 S6PΔF),
xix. 서열번호 60 (작제물 SCCPP), 및
xx. 서열번호 62 (작제물 SCC6P).
바람직하게는, 폴리펩티드는 S서열번호 5, 서열번호 43, 서열번호 45, 서열번호 47 및 서열번호 49로 이루어진 군으로부터 선택된 아미노산 서열을 가지며, 더 바람직하게는 서열번호 45, 서열번호 47 및 서열번호 49로 이루어진 군으로부터 선택된 아미노산 서열을 가지며, 더 바람직하게는 서열번호 47 또는 서열번호 49의 폴리펩티드이다.
본 발명의 바람직한 구현예에서, 폴리펩티드는 서열번호 76(작제물 SF-2P-dER) 또는 서열번호 82(작제물 SF-2P-2a)의 아미노산 서열, 바람직하게는 서열번호 76(작제물 SF-2P-dER)의 아미노산 서열을 갖는다.
또한, 본 발명은 본 발명에 따른 전달 벡터에 의해 발현되는 재조합 단백질에 관한 것이다.
본 발명의 특정 구현예에서, 재조합 단백질은 정제를 위한 아미노산 태그를 추가로 포함한다.
또한, 본 발명은 본 발명에 따른 전달 벡터에 의해 시험관내 또는 생체내에서 발현되는 재조합 단백질에 관한 것이다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 전술한 바와 같은 스파이크 항원 또는 이의 면역원성 단편 또는 이의 돌연변이 항원, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26 또는 27, 바람직하게는 서열번호 3 또는 5의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, SF-2P-dER 항원 또는 SF-2P-2a 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 76 또는 서열번호 82, 바람직하게는 서열번호 76의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
또한, 본 발명은 진단 또는 백신 목적으로 또는 융합전 구성(pre-fusion configuration)으로서, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이다.
코로나바이러스, 특히 코로나바이러스 SARS-CoV-2를 시험관내 진단하는 방법은 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47 또는 49, 바람직하게는 서열번호 3, 5, 43, 45, 47 또는 49, 보다 바람직하게는 서열번호 45, 47 또는 49, 훨씬 더 바람직하게는 서열번호 47 또는 49, 훨씬 더 바람직하게는 서열번호 49의 서열을 갖는 항원인 SARS-CoV-2의 항원을 사용하는 것을 포함한다.
또한, 본 발명은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, 스파이크 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26 또는 27, 바람직하게는 서열번호 3 또는 5의 서열을 갖는 항원인 SARS-CoV-2의 항원의 시험관내 용도에 관한 것이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
바람직하게는, SARS-CoV-2의 항원의 시험관내 용도에서의 항원은 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 시료, 특히 혈액 또는 혈청 시료에서의 검출을 위한, SF-2P-dER 항원 또는 SF-2P-2a 항원 또는 1, 2, 3개 또는 그 이상의 아미노산 치환(들), 삽입(들) 또는 결실(들)을 갖는 이의 면역원성 단편, 특히 서열번호 76 또는 82, 바람직하게는 서열번호 76의 서열을 갖는 항원이고, 여기서의 항원은 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉된다.
본 발명의 특정 구현예에서, 항원은 코로나바이러스, 특히 SARS-CoV-2에 감염된 것으로 의심되는 개체로부터 이전에 수득된 생물학적 샘플, 특히 혈액 또는 혈청 샘플과 접촉되도록 배치되고, 항원에 대한 항체의 존재가 결정된다.
또한, 본 발명은 본 발명에 따른 면역원성 또는 백신 조성물을 숙주에 투여하는 것을 포함하는, 숙주, 특히 인간 숙주에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법에 관한 것이다.
또한, 본 발명은 본 발명에 따른 면역원성 또는 백신 조성물을 숙주에 투여하는 것을 포함하는, 숙주, 특히 인간 숙주에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법에 관한 것이다.
방법의 특정 구현예에서, 투여는 적어도 2개의 연속 투여 단계를 포함한다. 바람직하게는, 2차 투여는 1차 투여 후 2주 내지 6개월, 특히 1차 투여 후 1개월 또는 2개월 후에 수행된다.
항원/항원성 폴리펩티드
몇몇 구현예에서, 항원성 폴리펩티드는 유전자 산물, 천연 발생 폴리펩티드, 합성 폴리펩티드, 상동체, 이종상동체, 동종상동체, 단편 및 전술한 것의 다른 등가물, 변이체 및 유사체를 포함한다. 폴리펩티드는 단일 분자일 수 있거나 이량체, 삼량체 또는 사량체와 같은 다분자 복합체일 수 있다. 또한, 폴리펩티드는 단일 사슬 폴리펩티드 또는 다중사슬 폴리펩티드를 포함할 수 있고, 서로 회합되거나 연결될 수 있다. 가장 일반적으로, 이황화 결합은 다중 사슬 폴리펩티드에서 발견된다. 또한, "폴리펩티드"라는 용어는 하나 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공 화학적 유사체인 아미노산 중합체에 적용될 수 있다.
당업자에 의해 인식되는 바와 같이, 단백질 단편, 기능적 단백질 도메인 및 상동 단백질도 관심 폴리펩티드의 범위 내에 있는 것으로 간주된다. 예를 들어, 본원에서는 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 100개 초과의 아미노산 길이를 갖는 참조 단백질의 임의의 단백질 단편(참조 폴리펩티드 서열보다 적어도 하나의 아미노산 잔기 만큼 짧지만 다른 점은 동일한 폴리펩티드 서열을 의미함)을 제공한다. 또 다른 예에서, 본원에 기재된 임의의 서열과 40%, 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 20, 30, 40, 50, 또는 100개(연속적) 아미노산의 스트레치를 포함하는 임의의 단백질이 본 개시에 따라 이용될 수 있다. 몇몇 구현예에서, 폴리펩티드는 본원에 제공되거나 본원에 언급된 임의의 서열에 나타낸 바와 같은 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 돌연변이를 포함한다. 또 다른 예에서, 본원에 기재된 임의의 서열과 80% 초과, 90% 초과, 95% 초과 또는 100% 동일한 20, 30, 40, 50, 또는 100개 아미노산의 스트레치를 포함하는 임의의 단백질은 본원에 기재된 임의의 서열과 80%, 75%, 70%, 65% 내지 60% 미만인 5, 10, 15, 20, 25, 또는 30개 아미노산의 스트레치를 갖고 본 개시에 따라 이용될 수 있다.
본 개시의 폴리펩티드 또는 폴리뉴클레오티드 분자는 참조 분자(예를 들어, 참조 폴리펩티드 또는 참조 폴리뉴클레오티드), 예를 들어, 당업계에 기술된 분자(예를 들어, 조작되거나 설계된 분자 또는 야생형 분자)와 특정 정도의 서열 유사성 또는 동일성을 가질 수 있다.
본 발명의 다른 특징 및 이점은 이하의 실시예로부터 명백할 것이고 또한 도면에 예시될 것이며, 이들 중 어느 것도 제한적인 것으로 의도되지 않는다.
실시예
A. 실시예 1
1. 물질 및 방법
SARS-CoV-2의 특정 항원 서열의 설계
SARS-CoV-2 유래의 천연 스파이크 및 핵단백질 항원을 암호화하는 cDNA는 2020년 1월 20일 NBCBI로부터 공개적으로 이용가능한 Genbank MN908947 서열을 기반으로 설계하였다. 그런 다음, 이러한 서열을 GeneArt(ThermoFisher)의 프로젝트 관리자 플랫폼을 통해 처리하여 포유류 및 초파리 세포에서 높은 발현을 위한 코돈-최적화 뉴클레오티드 서열을 얻었다. GC 함량이 매우 높거나(>80%) 낮은(<30%) 영역은 가능한 한 피하고, 내부 TATA 박스, 카이 사이트, 리보솜 진입 부위, ARE, INS 및 CRS 서열과 같은 시스 작용 서열 모티프뿐만 아니라 반복적인 서열, RNA 2차 구조, 스플라이스 공여체 및 수용체 부위는 피했다. 두 서열은 두 가닥 모두에서 MV 편집(AnGn, n≥3) 및 핵심 유전자 말단(A4CKT) 유사 서열을 제거하기 위해 추가로 편집하였다. 그런 다음, BsiWI 및 BssHII 제한 부위를 뉴클레오티드 서열의 5' 및 3' 말단에 각각 추가하였다. 생성된 cDNA는 "6의 법칙"을 따르고, 이 법칙은 MV 게놈의 뉴클레오티드 수가 6의 배수여야 한다는 것이고, 그 cDNA는 서열 20AAP6IP-S-2019-nCoV(즉, SARS-CoV-2)-opt(2x)(서열번호 2) 및 20AASUIP-N-2019-nCoV(즉, SARS-CoV-2)-opt(2X)(서열번호 21)를 각각 갖는다(아래 참조).
천연 스파이크 및 핵단백질 서열도 GeneArt(ThermoFisher)의 프로젝트 관리자 플랫폼을 통해 처리되어 홍역 백신 플랫폼을 위한 최적화된 유전자를 생성했다. 코딩 서열은 44-50%의 표적 GC 조성과 균형 잡힌 코돈 조성을 갖는 서열을 생성하기 위해 변형되었으며, 적용 가능한 경우 희귀 코돈과 가장 빈번한 코돈의 높은 사용을 피했다. 위에서 설명한 완전히 코돈-최적화된 서열의 생성과 관련하여, 매우 높거나(>80%) 또는 낮은(<30%) GC 함량 영역은 가능한 한 피하고, 내부 TATA 박스, chi 부위, 리보솜 진입 부위, ARE, INS 및 CRS 서열 요소와 같은 cis-작용 서열 모티프뿐만 아니라 반복 서열, RNA 2차 구조 및 스플라이스 공여자 및 수용체 부위는 피했다. 두 서열은 또한 두 가닥에서 MV 편집(AnGn, n≥3) 및 핵심 유전자 말단(A4CKT) 유사 서열을 제거하기 위해 추가로 편집하였다. 그런 다음, BsiWI 및 BssHII 제한 부위를 뉴클레오티드 서열의 5' 및 3' 말단에 각각 추가하였다. 얻어지는 cDNA는 MV 게놈의 뉴클레오티드 수가 6의 배수여야 한다는 "6의 법칙"을 준수하고, 각각 서열 20AAS76C_S-2019-nCoV_mod(서열번호 36) 및 20AAS77C_N-2019-nCoV-HS_mod(서열번호 37)를 갖는다(아래 참조).
얻어지는 4개의 cDNA를 Geneart(ThermoFisher) 시설에서 합성했다.
플라스미드 벡터 구성 및 백신 후보 구출(rescue)
MVSchw 재조합 플라스미드 구조는 새로운 pKP-MVSchw-ATU1(eGFP), -ATU2 및 -ATU3 플라스미드 벡터(약칭: pKM1, pKM2, pKM3)에서 유래되었다. 이러한 벡터는 각각 원래의 pTM-MVSchw-ATU1, -ATU2 및 -ATU3 플라스미드 벡터로부터 제작되었다(WO04/000876호 및 Combredet 등, J Virol, 2003). pKM 및 pTM 플라스미드 벡터 시리즈는 P와 M 유전자 사이(ATU2) 및 H와 L 유전자 사이(ATU3)에서, Schwarz MV 백신 균주의 안티게놈에 해당하는 동일한 감염성 cDNA 및 N 유전자(ATU1)의 상류측에 외래 오픈 리딩 프레임을 삽입하기 위한 고유한 BsiWI 및 BssHII 제한 부위를 포함하는 추가 전사 단위를 보유한다.
우선, 원래의 pTM2-eGFP 플라스미드(두 Not1 부위 사이에 위치한 17038 bp)의 전체 T7 구조 카세트를 상업적 pENTR2 최소 플라스미드(ThermoFisher사)의 의도적으로 변형된 버전으로 옮겨서 pKM2-eGFP를 얻었다. 다음으로, pKM2-eGFP로부터 pKM, pKM3-eGFP 및 pKM1-eGFP를 순차적으로 유도하였다. 새로운 pKM, pKM1-, pKM2- 및 pKM3-eGFP 벡터는 pTM 플라스미드 벡터 시리즈에서 관찰된 것과 유사한 효율성으로 해당 홍역 바이러스 및 벡터를 구출하는 능력에 대하여 검증하였다. 새로운 pKM1, pKM2 및 pKM3 플라스미드 벡터로부터 구출된 바이러스는 각각 원래의 pTM1, pTM2 및 pTM3 벡터로부터 구출된 바이러스와 동일한 게놈 서열을 갖는다는 점을 강조하는 것이 중요하다.
pKM 플라스미드 시리즈는 단일, 이중 및 삼중 재조합 벡터에 다양한 바이러스 항원을 삽입하는데 사용하기에 적합하며 원래의 pTM 플라스미드 시리즈보다 훨씬 높은 클로닝 효율, 안정성 및 DNA 수율을 제공하므로 홍역 백신 플렛폼에 가장 유용한 구출 도구이다.
위에서 설명한 SARS-CoV-2 핵단백질 및 스파이크 항원을 암호화하는 cDNA를 BsiWI/BssHII-절단된 pKM2 및 pKM3 벡터에 삽입하였으며, 얻어지는 pKM-nCoV 플라스미드는 이전에 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-nCoV 백신 후보를 구출하는데 사용된다(Combredet 등, J Virol, 2003).
플라스미드 pKM2-nCoV_NP 및 임의의 pKM3-nCoV_Spike 작제물(전장-S, stab-S, Secto, S1, tri-Secto, tristab-Secto)은 SalI 제한 효소로 절단되고 라이게이션되어 일련의 이중 재조합 pKM-nCoV-N&S 플라스미드를 생성한다.
대안적으로, 이중 재조합 플라스미드는 N 및 S ATU 카세트를 P 및 M 유전자 사이(MV 게놈의 위치 3) 또는 H 및 L 유전자 사이(MV 게놈의 위치 6)에 나란히 삽입하여 얻을 수 있다. 얻어지는 pKM-nCoV-N&S 플라스미드는 위에서 설명한 바와 같이 이중 재조합 MV-nCoV-N&S 백신 후보를 구출하는데 사용될 것이다.
백신 후보의 세포내 특성규명
단일 및 이중 재조합 백신 후보는 WO 04/000876호에 개시된 바와 같이 Vero-NK 세포에서 증폭된다. 모든 바이러스 스톡은 0.1의 MOI에서 감염 후 생산되고, -80℃에서 보관되고, Vero-NK 세포 단층에 대한 종말점 제한 희석 분석에 의해 적정된다. 감염 역가는 Reed and Munsch 방법(Reed 등, Am. J. Hyg., 1938)에 따라 50% 조직 배양 감염 용량(TCID50)으로 결정된다.
백신 후보는 본질적으로 MV-SARS 백신 후보에 대해 설명된 대로 특성규명된다(Escriou 등, Virology, 2014):
- 백신 후보 및 모 MVSchw의 성장 곡선은 MOI 0.1에서 감염된 Vero-NK 세포에 대해 결정되고,
- SARS-CoV-2 항원의 발현 수준은 VeroNK에 감염된 세포에 대해 수행된 간접 면역형광 분석(IFA) 및 감염된 세포로부터 제조된 용해물에 대한 웨스턴 블롯에 의해, 사용 가능한 항-SARS 교차 반응성 마우스 및 토끼 항체 및 항-SARS-CoV-2 항체를 사용하여 평가되고,
- 백신 후보의 게놈 안정성은 VeroNK 세포의 연속 계대와 구출 및 계대된 바이러스 스톡의 전체 게놈 NGS 시퀀싱에 의해 평가된다.
SARS-CoV-2 S 단백질을 발현하는 재조합 MV Schwarz 바이러스의 생성
감염성 MV cDNA가 있는 플라스미드에 SARS-CoV-2 S 단백질의 클로닝
플라스미드 pKM-MVSchw는 Schwarz MV 백신 균주의 안티게놈에 해당하는 감염성 MV cDNA를 포함한다. 이는 이전에 설명된 pTM-MVSchw(Combredet 등, J Virol, 2003)에서 유래되었다. 두 플라스미드 모두 Schwarz MV 백신 균주의 구출을 허용한다. 2020년 초에 순환하는 바이러스의 전장, 막 결합, 고유 SARS-CoV2 스파이크 당단백질(공개적으로 사용 가능)을 암호화하는 최적화된 cDNA가 화학적으로 합성되었다(GeneArt/ThermoFisher사, 독일). 완전한 서열은 MV 게놈에 추가되는 뉴클레오티드의 수가 6의 배수여야 한다고 규정하는 "6의 법칙"을 준수하며, 양쪽 말단에서 BsiWI 및 BssHII 제한 부위를 포함한다. 스파이크 뉴클레오티드 서열은 MV 벡터로부터의 전사(특히 크립틱 신호의 제거 및 RNA 1차 서열의 최적화에 국한되지 않음) 및 인간 세포에서의 번역(특히 코돈 최적화 및 RNA 2차 구조에 국한되지 않음) 모두에 대해 최적화하였다. 이 cDNA는 Schwarz MV 게놈의 혈구응집소와 폴리머라제 유전자 사이에서 추가 전사 단위를 포함하는 BsiWI/BssHII-절단된 pKM-MVSchw-ATU3에 삽입하였다. 얻어지는 플라스미드는 pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2)로 명명하였다.
이 플라스미드로부터 출발하여, 스파이크 아미노산 서열에 여러 돌연변이를 도입하였다(도 2). 발현된 단백질을 융합 전 상태(2P 돌연변이)에서 잠그고, S1/S2 절단(3F 돌연변이 또는 포함하는 루프의 F 결실을 통한 퓨린 절단 부위 불활성화)을 방지하고, 소포체 검색 신호를 불활성화(2A 돌연변이)시키도록 아미노산 서열을 순차적으로 변형시켰다. 얻어지는 플라스미드는 다음과 같이 명명하였다: pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2), pKM-ATU3-stab S_2019-nCOV(즉, SARS-CoV-2)(2P 돌연변이), pKM-ATU3-S2P3F_2019-nCOV(즉. SARS-CoV-2), pKM-ATU3-S2PΔF_2019-nCOV(즉, SARS-CoV-2), pKM-ATU3-S2PΔF2A_2019-nCOV(즉, SARS-CoV-2). 도 3에 도시된 작제물에 더하여, 2P 돌연변이가 결여된 pKM-ATU3-S3F_2019-nCOV가 생성되었다.
다른 작제물은 ATU2 부위에서 유사한 코딩 서열을 생성하도록 설계되었다. 우선, Schwarz MV 게놈의 인단백질과 기질 유전자 사이에 추가적인 전사 단위를 포함하는 BsiWI/BssHII-digested pKM-MVSchw-ATU2에 최적화된 SARS-CoV2 스파이크 cDNA를 삽입하여 서열번호 34의 pKM-ATU2-S_2019-nCOV(즉, SARS-CoV-2)를 생성하였다.
또한, pKM-ATU2-SMVopt는 뉴클레오티드 조성 및 트랜스진의 발현 수준을 미세 조정하고 재조합 홍역 바이러스의 향상된 적합성 및 안정성을 촉진하기 위한 노력의 일환으로 홍역-최적화 서열(서열번호 36)을 사용하여 생성하였다. 이 플라스미드로부터 출발하여, 2P 돌연변이, 푸린 절단 부위의 결실(ΔF), 및 두 돌연변이/결실의 조합(2PΔF)을 ATU3에서와 유사한 삽입을 생성하기 위해 스파이크 아미노산 코딩 서열(도 3c)에 도입하였다. 얻어지는 플라스미드는 다음과 같이 명명하였다: pKM-ATU2-SMVopt, pKM-ATU2-S2PMVopt, pKM-ATU2-SΔFMVopt, 및 pKM-ATU2-S2PFMVopt.
HEK 293-T7-NP 세포의 시딩
헬퍼 세포주 HEK 293-T7-NP(US8,586,364 특허)를 신선하게 해동하여 증식시켰다. 90% 컨플루언시(confluency)에 도달하면, 세포를 수확하고 10% FBS를 함유하는 DMEM에 재현탁시켰다. 6-웰 플레이트에 웰당 2mL 세포 현탁액을 시딩하고 37℃ 및 5% CO2에서 밤새 인큐베이션하였다.
서열번호 35의 플라스미드 pKM-ATU3-S_2019-nCOV(즉, SARS-CoV-2), 서열번호 34의 pKM-ATU2-S_2019-nCOV(즉, SARS-CoV-2), pKM-ATU2-S
MVopt
또는 유도체를 이용한 형질감염 및 열 충격
50-70% 컨플루언시에서, 배지를 새로운 2mL DMEM + 10% FCS로 교환하고 플레이트를 37℃ 및 5% CO2에서 4시간 동안 인큐베이션했다. pKM 플라스미드와 홍역 Schwarz 폴리머라제를 암호화하는 pEMC-La 플라스미드의 공동 형질감염은 이전에 설명한 대로 인산칼슘으로 수행하였다(Combredet 등, J Virol, 2003). 형질감염 혼합물을 배지에 적가하였다. 플레이트를 부드럽게 흔들어 형질감염 혼합물을 균일하게 분배하고 37℃ 및 5% CO2에서 밤새 인큐베이션하였다.
형질감염 배지를 2mL 신선한 DMEM + 10% FCS로 조심스럽게 교체했다. 형질감염된 세포를 37℃에서 3시간 동안 인큐베이션한 후 43.5℃ 및 5% CO2에서 3시간 열 충격을 가하였다.
이후 세포층이 합류할 때까지 37℃에서 2일 동안 인큐베이션을 계속하였다.
HEK와 VERO 세포의 공동 배양
공동 배양 하루 전에, 48웰 플라크(plaque)에 DMEM + 5% FCS 중 2 x 104개 세포/0.25mL 농도의 Vero 세포를 접종했다. 형질감염 후 3일째에, 즉 공동 배양 0일째에, 형질감염된 HEK 세포를 2mL의 배지(플레이트의 각 웰에 함유됨)에 부드럽게 재현탁시키고, 24mL까지 희석하고, Vero 세포에 0.25mL/웰에 첨가하였다(공동 배양). 공동 배양 플레이트를 부드럽게 흔들어 혼합하고 37℃ 및 5% CO2에서 인큐베이션하였다. 공동 배양 3일째부터, 세포를 CPE 및 합포체(syncytium) 형성에 대해 매일 관찰하였다.
합포체의 수확(구출된 바이러스)
CPE 또는 합포체의 단일 초점을 나타내는 공동 배양 플레이트의 웰을 PBS로 헹구고 트립신(트립신/EDTA 200μl)으로 수확했다. 48웰 플라크에서의 공동 배양과 함께, 구출된 바이러스의 클론성을 보장했다. 37℃에서 2 내지 5분 인큐베이션한 후, 세포를 2.5 mL의 DMEM + 5% FCS의 최종 부피로 6-웰 플레이트의 단일 웰에 옮겼다. 상이한 플라스미드로 형질감염된 세포로부터 단일 융합체를 함유하는 다중 웰을 수확하고 새로운 6-웰 플레이트로 옮겼다. 6웰 플레이트를 37℃ 및 5% CO2에서 인큐베이션하고 CPE 또는 합포체 형성을 매일 관찰했다.
구출된 바이러스는 다음과 같이 명명했다:
구출된 바이러스의 증식(expansion)
합포체/CPE가 세포 단층의 30 내지 50%에 도달하면, 구출된 바이러스 클론을 추가로 증식시켰다. 이들 웰의 세포 단층을 트립신처리에 의해 수확하고, 합류까지 성장한 T75 플라스크에서 유래한 트립신처리된 Vero 세포 2~3x106개와 함께 75 cm2 플라스크로 옮기고 37℃ 및 5% CO2에서 인큐베이션하였다.
증식된 구조된 바이러스의 수확
바이러스 증식 1 내지 2일 후, 합포체/CPE는 구출된 바이러스 클론 각각으로 감염된 Vero 세포 단층의 70 내지 90%에 도달했다. 세포 단층을 1.5mL의 상청액에 동결/해동하여 용해시키고 정화를 위해 4℃에서 2000g에서 5분 동안 원심분리하였다. 얻어지는 상층액을 계대 0(P0)으로 지정하고 분취하여 -80℃에서 보관하였다.
삽입물의 항원 발현 및 서열은 각각의 구출된 클론(도 4 및 도 13) 및 Sanger 시퀀싱의 P0에 대한 웨스턴 블롯에 의해 확인하였다. 우수한 항원 발현 및 검증된 삽입 서열을 갖는 클론을 추가 증식을 위해 선택하였다.
세포 배양에서 바이러스 클론 증식
구출된 재조합 MV 클론의 P0 종자를 해동시켰다. 바이러스 증식은 T150 플라스크에서 DMEM + 5% FCS에서 배양된 Vero 세포에서 수행하였으며, 0.05의 다중도(M.O.I)로 감염시키고 37℃ + 5% CO2에서 인큐베이션하였다. 감염 후 2 내지 3일에, 합포체/CPE가 Vero 세포 단층의 80 내지 95%에 도달했을 때, 2.5mL의 상청액에서 긁어낸 세포 단층의 동결/해동 주기에 의해 바이러스를 수확했다. 세포 파편을 4℃에서 2000g에서 5분간 원심분리하여 제거하였다(계대 1, P1). 각긱의 선택된 클론의 P1에 대해 삽입물의 항원 발현 및 서열을 확인하였다. 구출된 바이러스의 유전적 안정성에 대한 추가 계대 및 평가를 위해, 이러한 단계를 반복하였다.
MV 및 SARS-CoV-2 S에 특이적인 ELISA 분석
면역화된 마우스에서 MV 및 SARS-CoV-2 특이적 항체의 유도는 이전에 설명한 대로 간접 ELISA에 의해 평가하였다(Escriou 등, 2014). 마이크로타이터 플레이트를 정제된 홍역 항원(Jena Bioscience) 또는 HEK 293T 세포에서 각각 발현된 재조합 삼량체화 SARS-CoV-2 스파이크 엑토도메인으로 코팅하고 마우스 혈청의 연속 희석액과 함께 인큐베이션했다. 결합된 항체는 양고추냉이 퍼옥시다제(Southern Biotech) 및 TMB(KPL)에 결합된 마우스 특이적 항-IgG(감마 사슬 특이적) 이차 항체로 밝혀졌다. ELISA IgG 역가는 0.5의 흡광도를 제공하는 개별 혈청의 최고 희석도의 역수로 계산되었다.
SARS-CoV-2 미세중화 분석
DMEM + 1% BSA + 10mMTricine에서 열 불활성화된 마우스 혈청 샘플의 2배 또는 3배 연속 희석액을 SARS-CoV-2의 20 TCID50과 함께 37℃에서 2시간 동안 인큐베이션하고, 96웰 마이크로타이터 플레이트의 DMEM + 5% FCS에 플레이트된 FRhK-4 세포의 서브컨플루언트 단층에 첨가했다. 각각의 혈청 희석액은 4중으로 테스트하였으며 세포변성 효과(CPE) 종말점은 37℃ + 5% CO2에서 접종 후 5일까지 판독하였다. 중화 항체 역가는 4개의 웰 중 적어도 2개에서 CPE를 방지한 혈청의 최고 희석도의 역수로 Reed and Muench 방법(Reed and Muench, 1938)에 따라 결정하였다.
MV 및 SARS-CoV-2 ELISPOT 분석
면역화된 또는 대조군 마우스로부터 비장세포를 수확하고, 단일 세포 현탁액을 제조하고, MV 및 SARS-CoV-2-특이적 IFN-γ-생산 T 세포의 빈도를 표준 ELISPOT 분석에서 정량화하였다. 간단히 말해서, 96웰 멀티스크린 PVDF 플레이트(Millipore)를 PBS 중 5㎍/ml 래트 항-마우스 IFN-γ 항체(AN18, Becton-Dickinson사)로 코팅했다. 플레이트를 세척하고 완전한 RPMI 배지(10% FCS, 10mM Hepes, 5x10-5M β-메르캅토에탄올, 비필수 아미노산, 소듐 피루베이트, 100U/ml 페니실린 및 100㎍/ml 스티렙토마이신이 보충된 RPMI 1640)로 2 시간동안 블로킹했습다. 면역화된 마우스 및 대조군 마우스 유래의 다양한 수의 비장세포(일반적으로 4x105, 2x105 및 1x105)를 적절한 펩티드(1-10μM) 및 IL2(10U/ml)의 존재 또는 부재하에 3중으로 플레이팅하였다. 세포를 37℃에서 20시간 동안 인큐베이션한 후, 광범위한 세척 후, 비오틴화된 래트 항-마우스 IFNγ 항체(R46A2, Becton-Dickinson사), 알칼리성 포스파타제-접합 스트렙타비딘(Becton-Dickinson사) 및 기질로서 5-브로모-4-클로로-3-인돌릴포스페이트/니트로블루 테트라졸륨(NBT/BCIP, Sigma)과의 연속적 배양을 통해 스팟을 확인했다. 자동 ImmunoSpot® 분석기 및 관련 Biospot 7.0 소프트웨어(CTL)를 사용하여 스팟을 계수했다. 각각의 마우스에 대해, 펩티드-특이적 IFNγ-생산 세포의 수는 음성 대조 펩티드의 존재 및 특정 펩티드의 존재하에서 생성된 스팟 수 사이의 차이를 계산함으로써 결정하였다. 결과는 106개의 비장세포당 스팟 형성 세포(SFC)의 수로 표현되었다.
SARS-CoV-2 스파이크 단백질에 대한 반응을 결정하기 위해, T 세포는 10개의 아미노산 중복(Mimotopes)이 있는 15-mer 펩티드를 포함하는 S1 및 S2 도메인에 걸쳐 있는 펩티드 풀로 총 농도 10μM에서 자극하였다. 이들 풀에는 각각 135개와 118개의 펩티드가 포함되었다.
홍역 H22-30(서열번호 67의 RIVINREHL) 및 H446-454(서열번호 68의 SNHNNVYWL) 펩티드 및 NP366(SCOT) 펩티드(서열번호 69의 ASNENMDTM)는 Eurogentec에 의해 합성되어 각각 1μM의 농도에서 양성 및 음성 대조 펩티드로서 각각 사용되었다.
세포내 사이토카인 염색
백신 접종 마우스 또는 대조군 마우스로부터의 비장세포를 수확하고 단일 세포 현탁액을 제조하였다. 100만 개의 비장세포를 Glutamax(ThermoFisher사), 10% FBS, 1% 페니실린-스트렙토마이신, 10IU/ml IL-2(Miltenyi Biotec사), 100ng/ml IL-7(Miltenyi Biotec사)과 함께 IMDM에서 배양했다. 세포는 펩티드 당 2 ㎍/ml의 최종 농도(5% DMSO에서 재구성됨)의 펩티드 풀로 37℃에서 6시간 동안 자극하였다. BD GolgiPlug 및 BD GolgiStop(BD Biosciences사)을 마지막 4시간 동안 첨가했다. 양성 대조군의 경우, 세포를 50ng/ml PMA(Sigma Aldrich) 및 1 ㎍/ml 이오노마이신(Sigma Aldrich사)으로 자극하고, 음성 대조군의 경우, DMSO가 포함된 배지를 사용했다. 세포를 마우스 Fc 수용체 블록(항-마우스 2.4G2) 및 고정 가능한(Fixable) 생존성 염료 eFluor506(eBioscience)과 함께 인큐베이션하여 죽은 세포를 배제했다. 세포를 α-CD45 BUV395(BD Pharmingen # 564279), α-CD19 AF700(eBioscience # 56-0193-80), α-CD11b AF700(eBioscience # 56-0112-82), α-CD19 AF700(eBioscience # 56-0112-82), 56-0114-82), α-CD3e BV650(BD Pharmingen # 564378), α-CD4 eFluor 450(eBioscience # 48-0041-80), α-CD8a PerCp Cy5.5(BD Pharmingen # 564378), α-CD8a PerCp Cy5.5(BD Pharmingen # 54511 BV786(BD Pharmingen # 563736), α-CD62L APC-Cy7(BioLegend # 104427)로 염색했다. 고정 및 투과화(BD Cytofix/Cytoperm, BD Biosciences) 후, 세포를 α-TNFα FITC(eBioscience #11-7321-81), α-IFNγ PE-Cy7(BD Pharmingen # 55764), α-IL-5 PE(eBioscience # 12-7052-82), α-IL-13 eFluor 660(eBioscience # 50-7133-82)로 세포 내 염색했다. Fortessa(BD Biosciences사)를 사용하여 유세포 분석에 의해 세포를 획득하고 FlowJo v10.7 소프트웨어로 데이터를 분석했다.
SARS-CoV-2를 사용한 IFNAR-KO 마우스의 챌린지
홍역 백신을 허용하는 129/Sv 백그라운드에서 6 내지 9주 된 IFNα/ßR-/- 마우스 그룹(IFNAR-KO)에 재조합 MVSchw/SARS-CoV-2-S 또는 모체 MVSchw의 105 TCID50을 복강 내(i.p.) 주사했다. 부스터 주사액은 4주 후에 투여하였다. 표시된 시점에서 혈청 샘플을 수집했다.
인간 ACE2 수용체의 발현을 유도하기 위해, 면역화된 마우스를 케타민/자일라진 용액(각각 50mg/kg 및 10mg/kg)으로 가볍게 마취하고 30μL PBS 중 6.0x108 ICU의 Ad5-hACE2(SARS-CoV-2의 인간 ACE2 수용체를 발현하는 아데노바이러스 5, Ku 등, 2021)를 비강내 투여하였다. 4일 후, 마우스를 위에서 설명한 대로 마취하고 PBS 30μL 중 France/IDF0372/2020 SARS-CoV2 균주의 2x104 TCID50(Tissue Culture Infectious Dose 50%)을 비강내 접종했다.
감염된 마우스는 SARS-CoV-2 챌린지 후 4일째 경추 탈구에 의해 안락사시켰다. 각 폐엽의 절반을 무균적으로 제거하고 PBS로 광범위하게 헹구고, 2개의 균질화 주기 사이에 얼음 위에서 인큐베이션하면서 20초 동안 4m/s로 두 번의 연속 펄스에 의해 FastPrep®-24 균질화기와 6.35mm 직경의 산화지르코늄 세라믹 분쇄 구체(MP Biomedical)를 함유하는 Lysing Matrix M 튜브를 이용하여 750μL의 얼음-냉각 PBS에서 분쇄시까지 얼음위에서 유지했다. 균질물을 4℃에서 2000g에서 10분 동안 원심분리하여 정화하고 일회용 분취량으로 -80℃에서 보관했다.
폐의 SARS-CoV-2 게놈 RNA 부하은 제조사의 절차에 따라 QIAamp Viral RNA Mini Kit(Qiagen)를 사용하여 70μL의 폐 균질액으로부터 바이러스 RNA를 추출하여 결정하였다. 폐 균질액에서 추정적인 비미립자 바이러스 RNA를 제거하기 위해, QIAamp Viral RNA Mini Kit의 AVL 완충액으로 불활성화하기 전에 70μL 샘플을 37℃에서 30분 동안 100U RNaseI(Ambion)로 처리했다. 바이러스 부하(게놈 등가물(GEQ)/폐로 표현됨)는, 하기 표 7에 나타낸 바와 같이 SuperScriptTM III Platinum One-Step Quantitative RT-PCR System(Invitrogen사)과 SARS-CoV-2 봉투(E) 유전자를 표적으로 하는 프라이머 및 프로브(Eurofins사)를 사용하여, 본질적으로 Corman 등(Euro Surveill. 2020)에 의해 설명된 바와 같이 역전사 및 실시간 TaqMan® PCR에 따라 결정하였다. 플라스미드 pCI/SARS-CoV E에서 유래된 시험관 내 전사된 RNA는 T7 RiboMAX Express Large Scale RNA 생산 시스템(Promega)을 사용하여 합성한 다음, 페놀/클로로포름 추출 및 에탄올을 사용한 두 번의 연속 침전을 통해 정제했다. RNA 농도를 광학 밀도 측정을 통해 결정한 다음, 100μg/mL tRNA 운반체가 포함된 RNAse가 없는 물에 RNA를 109 게놈 당량/μL로 희석하고 -80℃에서 일회용 분취액에 보관했다. Agilent 2100 bioanalyzer_Eukaryote Total RNA Nano Series II에서 RNA 품질을 제어했다. 이 시험관 내 전사된 RNA의 연속 희석액을 10μg/mL tRNA 운반체를 함유하는 RNAse가 없는 물에서 제조하고 각 분석에서 표준 곡선을 설정하는데 사용했다. 열 사이클링 조건은 다음과 같았다: (i) 55℃에서 10분 동안 역전사, (ii) 95℃에서 3분 동안 효소 불활성화, (iii) 95℃에서 15초, 58℃에서 30초 동안 45 사이클의 변성/증폭. 생성물은 ABI 7500 Fast real-time PCR 시스템(Applied Biosystems사)에서 분석하였다.
프라이머/프로브 명칭 | DNA 서열 | 서열번호 |
E_Sarbeco_F1 | 5'- ACAGGTACGTTAATAGTTAATAGCGT -3' | 70 |
E_Sarbeco_R2 | 5'- ATATTGCAGCAGTACGCACACA -3' | 71 |
E_Sarbeco_P1 | 5'- FAM-ACACTAGCCATCCTTACTGCGCTTCG-BHQ-1 -3' | 72 |
폐 균질액 내의 감염성 SARS-CoV-2 역가는 12웰 플레이트에 접종된 Vero-E6 세포에서 측정하였다. 이중 웰 내의 세포를 10mM 트리신 및 1mg/mL BSA를 함유하는 DMEM 배지에서 폐 균질액의 각 5배 연속 희석액으로 감염시켰다. 37℃, 5% CO2 분위기에서 1시간 인큐베이션한 후, 바이러스 접종물을 회수하고 세포를 1μg/mL 트립신 및 1.2% Avicel RC581(FMC Biopolymer사)을 포함하는 배지에 넣은 다음, 37℃에서 72시간 동안 추가로 인큐베이션했다. 그런 다음, 세포 시트를 포름알데히드로 고정하고 0.1% 크리스탈 바이올렛으로 염색하고 플라크를 계수했다. 감염성 바이러스 역가는 플라크 형성 단위(PFU)/폐로 표현하였다.
2. 결과 및 고찰
세포 배양에서 재조합 MV의 구출 및 특성규명
성장 특성
ATU3로부터 SARS-CoV-2 S를 발현하는 재조합 MV가 성공적으로 구출되었다. MV-ATU3-S는 Vero NK 세포에서 증식되었고 107 조직 배양 감염 용량 50(TCID50) 이상의 높은 역가로 성장했다. 유전적 안정성은 ATU의 Sanger 시퀀싱 및 형질감염 후 검색된 독립적인 바이러스 클론의 전장 게놈의 NGS 시퀀싱에 의해 확인하였다. 대표적인 클론에 대해 도 4a에 나타낸 바와 같이 MV-ATU3-S의 각 클론으로 감염된 세포에서 효율적인 S 발현이 입증되었다. 시간 경과 실험에서, MV-ATU3-S 바이러스는 48시간 후에 피크 역가에 도달한 다음, 48시간에서 72시간 사이에 안정적인 바이러스 역가를 보인 MV-Schw와 대조적으로 약 1 log 역가만큼 감소했다. 세포의 감염 시, 홍역 바이러스는 일반적으로 바이러스 융합(F) 및 부착(H) 당단백질과 숙주 세포 원형질막 사이의 상호작용의 결과로 다핵 세포(합포체, 도 5)의 형성을 유도한다. 궁극적으로, 첫 번째 합포체는 점진적으로 서로 융합되어 넓은 영역 또는 융합된 세포를 생성한다. MV-ATU3-S로 감염된 세포에서 이러한 큰 합포체의 증가된 수가 감염 후 늦은 시간에 관찰되었다(도 5). MV-ATU3-S의 이 융합형 표현형은 감염 후 초기부터 관찰되었으며(도시되지 않음) 융합 영역의 더 큰 확장은 감염 후 48시간에 바이러스 역가의 피크와 일치했다. 이 시점에서, 큰 합포체는 붕괴되고 감염된 세포 단층은 광범위한 세포병원성 효과(CPE)를 나타내어 MV-Schw에 비해 MV-ATU3-S의 바이러스 복제에 영향을 미쳤다. 융합형 표현형은 MV-ATU3-S에 감염된 세포에서 세포 표면에 발현된 천연 스파이크가 이웃 세포의 ACE2 수용체와 상호작용하고 세포 융합을 촉진할 수 있다는 의미에서 기능적임을 시사했다. 백신 후보를 생성하기 위해, MV-ATU3-S에서 관찰된 것과 같은 강화된 융합 유전자 표현형은 홍역 벡터 바이러스의 친화성을 변경할 수 있으므로 잠재적인 안전 위험으로 간주되었다.
따라서, 융합 생성 특성이 감소 또는 폐지된 스파이크 단백질 변이체는, "2P" 돌연변이(K986P + V987P)를 통해 융합전 상태의 스파이크를 안정화하거나 다염기 절단 부위의 "3F" 돌연변이(R682G+R683S+R685G) 또는 포함되는 Q675-R685 루프의 "F" 결실을 통해 S1/S2 접합부에서의 절단을 방지하는 것을 기반으로, 두 가지 보완적 접근 방식을 통해 설계되었다(도 2). 전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 발현하는 변형된 스파이크 유전자를 생성하고, 먼저 split-GFP 시스템을 보유하는 세포에 기초한 분석에서 hACE2 발현의 존재 하에 일시적 형질감염 후 세포 융합을 촉진하는 그의 능력에 대해 평가하였다(Buchrieser 등, 2020). 데이터는 "2P" 돌연변이 단독, 다염기성 S1/S2 푸린 절단 부위 단독의 "3F" 돌연변이, 또는 "2P"와 "3F"의 조합, 또는 "2P" 및 푸린 절단 부위 "ΔF"(도 2)는 천연 스파이크와 대조적으로 hACE2-발현 HEK 293T 세포의 융합을 유도하지 않았다는 것을 나타냈다(도 16).
이러한 결과에 의해 암시된 바와 같이, "2P" 돌연변이를 도입하여 사전 융합 상태에서 S 단백질을 잠그면(도 2) 이러한 안정화된 스파이크 변이체를 발현하는 재조합 홍역 벡터 바이러스의 강화된 융합성 표현형이 폐지되었다. 재조합 MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A는 실제로 성공적으로 구출되었고 모두 107 TCID50 이상의 높은 역가로 성장했다. Vero NK 세포를 MV-AUT3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A로 감염하면, 모체 MV Schwarz 감염과 유사한 합포체 형성이 나타났으며(도 5), 따라서 천연 S를 발현하는 MV-ATU3-S와 비교하여 향상된 융합 활성의 부재가 확인되었다. 2P 안정화 돌연변이를 보유하는 모든 4개 작제물의 유전적 안정성은 ATU의 Sanger 시퀀싱 및 전장 바이러스 게놈의 NGS 시퀀싱에 의해 세포 배양에서 5회 계대 후 확인되었다.
ATU2의 천연 SARS-CoV-2 S를 발현하는 재조합 MV 클론은 모체 홍역 Schwarz보다 훨씬 더 낮은 역가로 성장했거나 구출 직후(P0) 또는 고역가 성장을 회복한 후속 계대 1(P1) 직후 스파이크 이식유전자에서 말도 안되는 보상 돌연변이가 발생했다. 이것은 완전히 코돈-최적화된 S 유전자가 ATU2 위치에 삽입될 때 불안정한 MV 벡터를 생성함을 나타낸다. 이에 대한 가능한 설명은 MV 복제에 의해 생성된 유전자 발현의 구배와 관련하여 하류측 ATU3 위치보다 상류측 ATU2 위치에서 유도된 증가된 S 발현 수준과 관련이 있을 수 있다(Plumet, 2005). 따라서, ATU2 위치에 삽입된 홍역-최적화 뉴클레오티드 서열에서 천연 및 변이 스파이크 단백질을 발현하는 홍역 벡터 작제물이 생성되었다(도 3c). 이들 작제물인 MV-ATU2-SMVopt, MV-ATU2-SMVopt2P, MV-ATU2-SMVoptΔF, MV-ATU2-SMVopt2PΔF는 107 TCID50 초과의 역가로 성장했다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱을 통해 확인되었으며, 이는 홍역-최적화된 S 유전자가 ATU2 위치에 삽입되었을 때 안정적인 MV 벡터를 현저하게 생성함을 나타낸다.
항원 발현
재조합 MV-감염 Vero 세포에서의 스파이크 발현은 SARS-CoV-1(Escriou 등, Virology, 2014) 또는 SARS-CoV-2의 재조합 S 단백질에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다. 도 4에 도시된 바와 같이, 전장 S 단백질의 발현을 나타내는 180kDa의 예상 겉보기 분자량을 갖는 모든 샘플이 경우 주요 밴드가 검출되었다. MV-ATU3-S 및 MV-ATU3-S2P로 감염된 세포로부터 제조된 용해물의 경우 각각 겉보기 분자량이 100 및 80 kDa인 작은 밴드가 검출되었으며, 이는 S가 S1 및 S2 도메인으로 부분적으로 절단되었음을 입증한다. 돌연변이(MV-ATU3-S2P3F) 또는 작은 포괄 루프의 결실(MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A)에 의한 푸린 절단 부위의 불활성화는 예상대로 절단을 폐지했다(도 4b). 또한, 스파이크 폴리펩티드의 발현은 비투과성 합포체의 간접 면역형광(IFA)에 의해 쉽게 검출되었으며, 이는 천연 및 돌연변이된 S가 표면으로 효율적으로 수송되었음을 나타낸다(도 5b).
ATU2에 홍역-최적화된 뉴클레오티드 서열(서열번호 36)을 삽입하면 ATU3에 완전히 코돈-최적화된 뉴클레오티드 서열이 삽입된 것과 유사한 발현 수준이 나타났다(도 13a). ATU3에서 완전히 코돈-최적화된 뉴클레오티드 서열로부터 발현된 스파이크 단백질과 동등하게, ATU2에서 발현된 SMVopt2P 단백질은 부분적으로 S1 및 S2로 절단된 반면, MV-ATU2-SMVoptΔF 및 MV-ATU2-SMVopt2PΔF에 의해 발현된 푸린 부위 결실이 있는 스파이크 단백질은 절단되지 않았다(도 13b).
면역원성
코로나19 백신의 면역원성은 홍역-벡터 백신의 평가에 적합한 소형 동물 모델인 129sv 1형 인터페론 수용체(인터페론-α/β 수용체, IFNAR)-결핍 마우스에서 평가했다. 모든 실험은 파리의 파스퇴르 연구소의 실험 동물 관리실 지침에 따라 승인 및 수행되었다. IFNAR KO 마우스는 파스퇴르 연구소 동물 시설에서 특정 병원균이 없는 조건 하에 수용하였다. 6 내지 10주령 IFNAR KO 마우스 6마리 그룹을 백신 후보의 1x105 TCID50으로 3 내지 4주 간격으로 2회 복강내 주사로 면역화하거나 1회만 면역화시켰다. 대조군으로서, 빈 MV 벡터 MV-Schwarz(1x105 TCID50)가 주입된 마우스 그룹이 각 연구에 포함되었다. 마우스 혈청은 1차 및 2차 주사 후 18 내지 21일에 수집하였다.
체액성 반응
체액성 반응을 평가하기 위해, SARS-CoV-2 및 MV-특이적 항체 반응을 간접 ELISA로 각 개별 마우스에 대해 평가했다. SARS-CoV-2 스파이크를 발현하는 상이한 재조합 홍역 바이러스로 면역화된 마우스는 홍역-특이적 ELISA에 의해 결정된 바와 같이 프라임 면역화 후 홍역 바이러스로 혈청변환되었다(도 6a). 항-홍역 반응은 시험된 모든 MV 작제물 및 모체 MV-Schwarz의 경우에 유사했으며, 이는 재조합 바이러스에 의한 이종 S 단백질의 발현이 생체내 복제를 변경하지 않고 홍역-특이적 면역원성을 변형시키지 않았음을 시사한다. 몇몇의 마우스는 1차 면역화에 반응하지 않거나 제대로 반응하지 않았지만 부스트 면역화 후에는 반응했다. 부스트 후, 항-MV 항체 수준은 마우스에 대한 이전 연구에서 예상한 대로 약 10배 증가했다.
또한, 항-홍역 항체로 반응한 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A로 면역화된 모든 마우스는 SARS-CoV-2 스파이크 단백질의 엑토도메인에 대해 특이적인 ELISA에 의해 측정된 것으로, 프라임 후 104 범위에서 높은 역가의 스파이크-특이적 항체와 반응했다(도 6b). 부스트 후, 항-MV 항체에서 볼 수 있는 바와 같이 항-S 항체 수준이 약 10배 증가하였다. 대조적으로, 빈 MV-Schwarz로 면역화된 대조군 마우스는 모두 음성으로 테스트되었다. 통계적으로 유의하지는 않지만, MV-AUT3-S 및 MV-ATU3-S2P에 의해 유도된 것과 비교하여, 퓨린 절단 부위가 비활성화된 작제물(MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A)에 의해 유도된 항-S 항체 수준이 더 높은 경향이 약간 있었다.
항-SARS-CoV-2 중화 항체는 미세중화 분석을 사용하여 검출되었다. SARS-CoV-2 S를 발현하는 모든 재조합 MV는 1회의 면역화 후에 중화 항체를 유도했다(도 7).
도 7에 나타내고 추가 실험(데이터는 나타내지 않음)에서 반복된 바와 같이, 하기 작제물로 면역화된 마우스에서 프라임 후 중화 역가가 증가하는 경향이 있었다: MV-ATU3-S < MV-ATU3-S2P < MV-ATU3- S2P3F < MV-ATU3-S2PΔF/MV-ATU3-S2PΔF2A. 부스트 후, 중화 역가는 10배 이상 증가했다. 푸린 절단 부위가 비활성화된 SARS-CoV-2 S를 발현하는 모든 재조합 MV는 부스트 후 유사한 중화 항체 수준을 유도하고 MV-ATU3-S 및 MV-ATU3-S2P보다 더 높은 수준을 유도한다. MV-ATU3-S2P 및 MV-ATU3-S2P3F의 부스트 후 중화 역가 간의 차이는 통계적으로 유의하다(p=0.0216 Mann-Whitney 테스트). 이것은 플라크 감소 중화 테스트 90(PRNT90)에 의해 확인되었다.
2020년 3월 18일 ICMRA(International Coalition of Medicinal Regulatory Agencies)의 권고에 따르면, SARS-CoV-1 백신 후보를 가진 동물 모델에서 관찰된 잠재적인 질병 증진의 위험을 완화하기 위해 Th1 반응의 유도를 확보하는 것이 중요하다. IgG 이소타입 분석을 통해 진행 중인 CD4+ 헬퍼 T 세포 반응이 1형(Th1) 또는 2형(Th2) 반응으로 편향되는 첫 번째 징후를 얻을 수 있으므로, IgG2a 대 IgG1 항체 역가의 비율은 이소타입 특이적 항-S ELISA로 측정하였다. 도 11a 및 11b에 도시된 바와 같이, 이 분석은 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A가 모두 Th1 반응을 나타내는 IgG1 수준보다 더 높은 IgG2a를 유도함을 나타내었다. 대조 실험은 wt 129/Sv 마우스를 명반-보조된 삼량체화된 스파이크 엑토도메인으로 면역화하여 수행했다. 프라임 및 부스트 후 이들 마우스는 IgG2a 항체 역가보다 훨씬 더 높은 IgG1을 가졌고(도 11c 및 도 11d), 이는 유도된 면역 반응은 명반-보조 SARS-CoV-1 스파이크 엑토도메인으로 면역화한 후 이전에 관찰된 바와 같이 주로 Th2 유형임을 나타낸다(Escriou, 2014).
항-MV ELISA, 항-S ELISA 및 SARS-CoV-2 미세중화에 의해 평가된 MV-ATU3-S 및 MV-ATU2-SMVopt의 면역원성을 비교한 결과 1차 및 2차 면역화 후 두 홍역 벡터 바이러스에 의해 유도된 항체 반응에 차이가 없었다(도 14).
T 세포 반응
비장 T 세포 반응을 분석하여 T 헬퍼 세포 반응의 유형과 세포독성 T 세포 반응을 직접 평가했다. S 단백질-특이적 T 세포 반응은 부스트 면역화 후 19 내지 25일에 비장세포에서 측정하였다. T 세포는 각각 10개의 아미노산 중첩을 갖는 15-mer 펩티드를 함유하는 스파이크 단백질의 S1 및 S2 도메인의 전체 길이에 걸쳐 있는 펩티드 풀로 자극하였다. 대조군으로서, CD8+ T 세포에 특이적인 2개의 홍역 펩티드의 풀을 사용하여 홍역 특이적 반응을 평가하였다(Reuter 등, PLoS ONE, 2012, 7(3), e33989, 1-8).
IFN-γ 생성 T 세포는 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 ELISpot에 의해 열거되었으며 S 단백질에 걸쳐 있는 펩티드에 대한 세포 반응을 입증했다(도 8). 홍역 벡터 골격에 대한 세포 반응도 확인하였다(도 8).
CD4+ T 세포 및 CD8+ T 세포에 의한 사이토카인 생산은 유세포 분석에 의해 분석된 세포내 사이토카인 염색을 특징으로 하였다. 마우스를 MV-ATU3-S, MV-AUT3-S2P, MV-AUT3-S2P3F, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A 또는 모체 MV Schwarz 균주로 면역화시켰다. SARS-CoV-2 스파이크 단백질을 발현하는 재조합 MV로 면역화된 모든 마우스에서 비장세포의 세포내 사이토카인 염색은 전체 S 단백질에 걸쳐 있는 S1 및 S2 펩티드 풀에 대한 반응으로 IFN-γ 및 TNF-α 이중 양성 CD8+ 및 CD4+ T 세포를 검출했다. 이것은 이들 T 세포의 기능적 상태를 나타내고 S-특이적 Th1-유형 반응이 백신 후보에 의해 유도되었음을 확인하였다(도 9, 패널 A 및 B). 또한, 홍역 벡터 백본에 대한 CD8+ T 세포 반응은 재조합 후보 및 모체 MVSchw를 투여 받은 마우스에서 IFN-γ 및 TNF-α 이중 양성 CD8+ T 세포를 입증함으로써 확인되었다(도 9, 패널 A 및 C). 대조적으로, Th2 반응의 특징인 IL-5 및 IL-13을 발현하는 S-특이적 T 세포의 극미한 부분만이 재조합 후보 중 하나를 투여 받은 마우스에서 검출되었다(도 9, 패널 A 및 B).
T 세포 반응을 더 자세히 특성규명하기 위해, S 펩티드 풀(도 10, 패널 B 및 D)에 반응하여 단일 사이토카인을 생성하는 T 세포를 이중 사이토카인 양성 T 세포외에도 MV-ATU3-S2PΔF2A 및 모체 MV Schwarz로 면역화된 마우스에서 평가했다(도 10, 패널 A 및 C, 동일한 결과가 도 9에도 포함되어 있다). TNF-α 생성 CD4+ T 세포만이 MVSchw 대조군으로 면역화된 마우스보다 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 더 높은 빈도로 존재하였다(도 10, 패널 B). 다른 모든 CD4+ 및 CD8+ 단일 사이토카인 생성 T 세포는 MV-ATU3-S2PΔF2A 및 MWSchw 면역 마우스에서 유사한 빈도로 발견되었으며(도 9, 패널 B 및 D), 이는 이러한 반응이 스파이크 단백질에 특이적이지 않다는 것을 나타낸다.
종합하면, 이러한 결과는, S 단백질의 에피토프를 표적으로 하는 기능적 Th1형 T 세포 반응은 MV-ATU3-S, MV-AUT3-S2P, MV-AUT3-S2P, MV-AUT3-S2P3F, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A를 비롯한, SARS-CoV-2 스파이크 단백질을 발현하는 재조합 MV로서의 면역화 후에 유도된다는 것을 나타냈다. 이 반응은 IFN-γ 및 TNF-α 생성 CD8+ T 세포와 IFN-γ 및 TNF-α 생성 CD4+ T 세포의 우세한 유도를 특징으로 한다.
SARS-CoV-2 챌린지에 대한 보호
SARS-CoV-2에 의한 실험적 챌린지에 대한 보호를 유도하기 위한 홍역 벡터 작제물의 가능성을 평가하기 위해, 본 발명자들은 SARS-CoV-2에 의한 후속 감염을 가능하게 하기 위해 IFNAR-KO 마우스의 폐에서 인간 ACE2 수용체의 일시적 발현 모델을 사용하였다(Ku 등, 2021).
프라임 및 부스트 면역화 후 보호를 평가하기 위해, 마우스를 MV-ATU3-S, MV-ATU3-S2P, MV-ATU3-S2PΔF, MV-ATU3-S2PΔF2A, 또는 대조군으로서 모체 MV Schwarz 균주로 면역화시켰다.
2차 면역접종 25일 후 마우스에 AD5:hACE2를 주입하고 4일 후 SARS-CoV-2 2x104 pfu를 비강에 접종했다. 폐에서 SARS-CoV-2 바이러스의 존재는 게놈 등가물(GEQ) RNA 수준을 측정하는 RT-qPCR과 Vero 세포에서 감염성 바이러스의 정량화에 의해 평가하였다. 도 12의 패널 A에 나타낸 바와 같이, 모든 홍역 벡터 작제물은 MVSchw 모체 바이러스와 비교하여 폐의 바이러스 부하을 유의하게 감소시켰다. GEQ는 MV-ATU3-S, MV-ATU3-S2P에 의해 약 1.5 로그, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A에 의해 2.5 로그 만큼 감소했다. 또한, MV-ATU3-S와 MV-ATU3-S2P를 면역화된 군에서 각각 1마리씩, 특히 면역반응이 좋지 않고 중화항체역가가 매우 낮은 마우스에서만 감염성 바이러스가 낮은 잔류역가로 검출되었다. 그리고 MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF2A로 면역화된 마우스에서는 그렇지 않았다. 이러한 결과는 모두 재조합 MV를 사용한 백신 접종이 동물의 폐에서 바이러스 부하을 유의하게 감소시켰고 특히 감염성 바이러스의 존재가 예방되었음을 보여주었다. 주목할만한 것은, 보호 효율이 중화 항체 수준의 유도에 대해 관찰된 계층 구조를 따랐다는 것인데, MV-ATU3-S2PΔF 및 MV-ATU3-S2PΔF는 MV-ATU3-S 및 MV-ATU3-S2P보다 더 나은 보호를 제공한다.
현저하게, GEQ(p=0.0149) 및 PFU(p=0.0253)의 수준에 의해 평가된 바와 같이, 챌린지 9일 전에 채취한 혈액 샘플에서 중화 항체 역가의 수준은 개별 마우스(어떤 면역원이든)의 보호 효율과 반비례했다. 이는 혈액 내 중화 항체 수치가 감염 후 SARS-CoV-2 복제 감소에 직간접적으로 기여함을 시사한다.
프라임 및 부스트 면역화 후의 유망한 결과에 기초하여, 프라임 후의 보호는 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 평가하였다. 또한, 이 실험은 1차 면역화 후 최대 165일까지 항체 반응의 수명을 조사하도록 설계되었다. 프라임 후 약 6개월에 측정된 미세중화 역가(도 12, 패널 B, μNT)는 103 범위로 높았지만 이 벡터로 추가 면역화한 후 도달한 수준보다 약 10배 낮았다(도 12, 패널 A, μNT). 챌린지 및 바이러스 부하 분석을 위에서 설명한 대로 수행했다. 2 로그만큼 GEQ/폐의 유의한 감소가 관찰되었다(도 12, 패널 B). 전염성 SARS-CoV-2 바이러스는 MV-ATU3-S2PΔF2A로 면역화된 마우스 6마리 중 1마리의 폐에서 매우 낮은 역가로만 회수되었으며, 이는 MV-ATU3-S2PF2A로만 1차 면역시킨 후의 강력한 보호를 입증한다.
또한, 프라임후 만의 보호는 MV-ATU3-S2P로 면역화된 마우스 및 대조군으로서 빈 벡터 MV-Schwarz로 면역화된 마우스와 비교하여 MV-ATU3-S2PΔF2A로 면역화된 마우스에서 평가하였다. 이 실험은 프라임 면역화 4주 후에 단기 보호를 조사하도록 설계되었다. 도 6b에 도시된 실험에서 이미 확인된 바와 같이, MV-ATU3-S2P 및 MV-ATU3-S2PF2A로 면역화된 모든 마우스는 ELISA에 의해 측정된 바와 같이 104 범위로 높은 역가의 홍역 특이적 및 스파이크 특이적 항체와 반응했다(도 17, 패널 A). 유의하게 더 높은 중화 항체 수준(p=0.0087 Mann-Whitney)은 2P-안정화된 S [2.1±0.2 log10(NT 역가)]를 갖는 MV-ATU3-S2P에 의해 유도된 것과 비교하여 불활성화된 푸린 절단 부위[ 2.6±0.1 log10(NT 역가)]를 갖는 MV-ATU3-S2PΔF2A 작제물에 의해 유도되었다.
SARS-CoV-2에 의한 챌린지로부터의 보호는 위에서 설명한 대로 평가하였다. 도 17의 패널 B에 나타낸 바와 같이, 홍역 벡터 작제물 둘 다를 사용한 면역화는 MVSchw 모체 바이러스와 비교하여 폐의 바이러스 부하를 유의하게 감소시켰다. GEQ RNA 수준은 MV-ATU3-S2P에 의해 약 0.8 log 만큼, MV-ATU3-S2PΔF2A에 의해 1.3 log 만큼 감소되었다. 또한, 감염성 바이러스는 MV-ATU3-S2P로 면역된 6마리 마우스의 절반, 특히 가장 낮은 중화 항체 역가를 갖는 마우스에서만 낮은 잔류 역가로 검출되었다. MV-ATU3-S2PΔF2A로 면역화된 마우스에서는 감염성 바이러스가 검출되지 않았다.
종합하면, 이 실험은 재조합 MV를 사용한 백신접종이 프라임 면역화 후 빠르면 4주에 동물의 폐에서 바이러스 부하를 유의하게 감소시킴을 보여주었다. 또한 보호 효율성이 중화 항체 수준의 유도에 대해 관찰된 계층 구조를 따른다는 것을 확인하였다. 즉, MV-ATU3-S2PΔF2A는 MV-ATU3-S2P보다 프라임 후에 더 나은 보호를 제공한다.
SARS-CoV-2 S6P, 6P3F 및 6PΔF 단백질을 발현하는 재조합 MV Schwarz 바이러스의 향상된 면역원성 및 보호 가능성
스파이크 단백질을 더욱 안정화하기 위한 노력의 일환으로, 스파이크 단백질 변이체는 "6P" 돌연변이(F817P, A892P, A899P, A942P, K986P, V987P)를 위에서 설명한 "3F" 돌연변이(R682G+R683S+R685G) 또는 "ΔF" 결실(서열번호 50의 Q675-R685 루프)과 조합함으로써 설계되었다(도 2). 전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 암호화하는 변형된 스파이크 유전자를 생성하고 pKM-MVSchw-ATU3 벡터에 삽입하였다. 얻어지는 pKM3-S6P 플라스미드를 사용하여 상기한 바와 같이 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-ATU3-S6P 백신 후보를 성공적으로 구출하였다. MV-ATU3-S6P 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장했으며, ATU의 Sanger 시퀀싱에 의해 유전적으로 안정적인 것으로 확인되었다. Vero NK 세포를 MV-ATU3-S6P로 감염시키면 모체 MV Schwarz(도시하지 않음) 감염과 유사한 합포체 형성이 발생했으며, 이는 천연 S를 발현하는 MV-ATU3-S에서 관찰된 향상된 융합 활성의 부재를 나타내며, 따라서 융합전 상태에서 S6P의 효율적인 잠금이 확인된다. S 발현은 MV-ATU3-S6P의 각 클론으로 감염된 세포에서 입증되었으며 S1 및 S2 도메인으로의 부분적 절단을 보여주었다(도 15A). 주목할만한 것은 MV-ATU3-S, MV-ATU3-2P 및 MV-ATU3-S6P로 감염된 세포에서 유사한 발현 수준이 관찰되었다는 것이다. 이것은 HEK293T 세포에서 일시적인 발현 시 S2P의 발현 수준과 비교한 S6P의 분비 및 절단되지 않은 엑토도메인에 대해 Hsieh 등(Science, 2020)에 의해 관찰된 실질적으로 더 높은 발현 수준과 대조된다. MV-ATU3-S6P 발현 수준이 2P의 범위에 있다는 사실은 S2P와 S6P의 고유 면역원성 특성의 비교 평가를 가능하게 할 것이다. MV-ATU3-S6P3F 및 MV-ATU3-S6PF는 감염된 Vero NK 세포에서 S6P 항원의 절단되지 않은 및 전장 형태(S6P3F, S6PΔF)의 발현을 입증하기 위해 본질적으로 상기 기재된 바와 같이 구출되고 특성규명될 것이다.
MV-ATU3-S6P로 면역화된 대부분의 마우스는 ELISA에 의해 측정된 바와 같이 104 범위의 높은 역가의 홍역 특이적 및 스파이크 특이적 항체로 프라이밍 후에 반응했다(도 15, 패널 B 및 C). SARS-CoV-2 중화 역가는 102 범위에 있었다(도 15, 패널 D). 프라임 후 홍역 반응 마우스 중에서, 하기의 작제물로 면역화된 마우스에서 SARS-CoV-2-특이적 ELISA의 증가 및 역가 중화의 경향이 있었다: MV-ATU3-S2P [3.8±0.1 log10(ELISA 역가); 1.5±0.2 log10(NT 역가)] < MV-ATU3-S6P [4.1±0.1 log10(ELISA 역가); 2.1±0.2 log10(NT 역가)] < MV-ATU3-S2PF [4.6±0.3 log10(ELISA 역가); 2.5±0.3 log10(NT 역가)]. MV-ATU3-S2P 및 MV-ATU3-S6P 프라임 후 중화 역가 간의 차이는 통계적으로 유의하다(p=0.0079 Mann-Whitney 테스트).
부스트 후, 항-MV 항체에 대해 관찰된 바와 같이 그리고 홍역 플랫폼에 의해 벡터화된 대부분의 스파이크 변이체에 대해 이미 언급된 바와 같이, 항-S 항체 수준이 약 10배 증가했다. 통계학적으로 유의하지는 않지만, MV-ATU3-S6P[3.9±0.1 log10(NT titers)]는 MV-ATU3-S2P[3.5±0.3 log10(NT titers)]보다 부스트 후 약간 더 높은 중화 항체 수준을 유도하고 MV-ATU3-S2PΔF(4.1±0.2 log10(NT 역가)보다 낮은 수준을 유도했다.
챌린지 및 폐 바이러스 부하의 분석을 상기 기재된 바와 같이 부스트 면역화 4주 후에 수행하였다. 도 15의 패널 E에 나타낸 바와 같이, 모든 홍역 벡터 작제물은 MVSchw 모체 바이러스에 비해 폐의 바이러스 부하를 유의하게 감소시켰다. GEQ RNA 수준은 MV-ATU3-S2P에 의해 약 1.7 log 만큼, MV-ATU3-S6P 및 MV-ATU3-S2PΔF2A에 의해 2.2 log 만큼 감소했다. 주목할만한 것은, 보호 효율이 중화 항체 수준의 유도에 대해 관찰된 경향을 따랐다는 것이다. MV-ATU3-S2PΔF는 MV-ATU3-S2P 및 MV-ATU3-S6P보다 약간 더 나은 보호를 제공한다.
이러한 실험으로부터, 우리는 S6P가 S2P 항원보다 중화 항체의 유도 측면에서 더 나은 성능을 발휘한다는 결론을 내렸습니다. 두 항원이 홍역 벡터로부터 유사한 수준으로 발현된다는 사실을 감안할 때, 이는 S6P가 S2P보다 융합전 상태에서 더 효율적으로 고정되고/되거나 더 높은 안정성을 갖는다는 것을 시사한다. "3F" 돌연변이 및 "F" 결실이 중화 항체 유도를 위해 "2P" 돌연변이와 상승 작용한다는 사실을 감안할 때, 우리는 이것이 "6P" 돌연변이의 경우일 수 있고 MV-ATU3- S6P3F 및 MV-ATU3-S6PF는 각각 MV-ATU3-S6P 및 MV-ATU3-S2P3F 및 MV-ATU3-S2PΔF보다 보호 중화 항체 유도에 더 나은 성능을 보인다는 것을 확인했다.
폐쇄 형태로 안정화된 SARS-CoV-2 스파이크 변이체를 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
SARS-CoV-2에 대한 보호 항체 반응을 유도하기 위한 대안적 접근법으로서, 본 발명자들은 단일/이중 프롤린 치환에 의해 융합전 상태에 잠겨 있고 추가로 이황화 결합에 의해 폐쇄 구조에서 공유적으로 안정화된 전장 SARS-CoV-2 스파이크 변이체를 설계했다. 여기에는 위에서 설명한 "2P" 또는 "6P" 돌연변이와 이중 S383C/D985C "CC" 돌연변이(SCCPP 및 SCC6P)의 조합이 포함되지만 이에 제한되지는 않는다. 이 "CC" 돌연변이는 McCallum 등, Henderson 등, Xiong 등(2020)에 의해 독립적으로 보고되었으며 다운 형태의 RBD와 닫힌 형태의 스파이크 엑토도메인을 효율적으로 안정화시키는 것으로 확인되었다. 대안적으로, 본 발명자들은 이중 G413C/P987C "CC2" 돌연변이와 임의의 융합전 안정화 돌연변이를 조합할 수 있으며, 이는 또한 Xiong 등에 의해 폐쇄 형태로 스파이크를 안정화시키는 것으로 확인되었다. 또한, 본 발명자들은 이황화 결합의 단독 첨가에 의해 공유적으로 안정화된 SARS-CoV-2 스파이크 변이체에 의존할 수 있고 이러한 이중 시스테인 돌연변이자체가 폐쇄된 융합전 형태로 스파이크를 안정화할 수 있다는 가설을 세울 수 있다.
주목할만한 것은, 푸린 절단 부위가 상기 기재된 SCCPP 및 SCC6P 작제물에서 불활성화되지 않고, 본 발명자들은 RBD 폐쇄 상태가 이들 작제물에서 절단 부위의 접근을 제한할 수 있어 푸린-매개 단백질분해에 내성이 있게 할 것으로 예상한다는 점이다. 대안적으로, 스파이크 단백질을 추가로 안정화시키기 위한 노력으로, 스파이크 단백질 변이체는 "SCCPP" 또는 "SCC6P" 돌연변이를 상기 특성규명된 "3F" 돌연변이 또는 "F" 결실과 조합함으로써 설계될 수 있다.
전술한 변형 및 이들의 조합을 갖는 변이체 스파이크 단백질을 암호화하는 변형된 스파이크 유전자가 생성되어 pKM-MVSchw-ATU3 벡터에 삽입된다. 상응하는 백신 후보는 본질적으로 상기 기재된 바와 같이 구출되고 특성규명될 수 있다. 이러한 MV 작제물은 다운 형태의 RBD와 폐쇄 형태의 절단되지 않은 전체 길이 스파이크를 발현할 수 있고 대부분 폐색될 수 있다. 발현된 닫힌 스파이크는 SARS-CoV-2의 ACE-2 수용체에 대해 훨씬 감소된 결합 친화도를 가질 수 있으며, 이는 본 발명자들이 MV-ATU3-S에 대해 관찰되고 잠재적인 안전 위험으로 간주한 향상된 융합성 표현형을 방지하기 때문에 홍역 플랫폼에 의한 벡터화에 대한 주요 이점이다.
IFNAR-KO 마우스에서 이러한 백신 후보의 면역원성과 보호 가능성을 평가할 수 있다. "닫힌" 스파이크를 발현하는 MV 작제물은 ACE-2 결합을 방지하는 중화 RBD 특이적 항체의 수준이 더 낮고 하향 위치에서 RBD에 결합하는 항체의 수준이 더 높으면서 천연 단백질(예: S2P)에 대해 발생하는 것과 다른 면역 반응을 유도할 수 있다.
분비된 형태의 SARS-CoV-2 스파이크를 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
SARS-CoV-2에 대한 보호 반응을 유도하고 전장 스파이크를 발현하는 MV 후보에 대해 본 발명자들이 관찰한 강화된 융합형성 표현형을 피하기 위한 대안적 접근으로서, 본 발명자들은 S의 가용성 및 분비 형태로서 스파이크 엑토도메인을 발현하는 MV 후보를 평가하였다.
완전히 코돈-최적화된 스파이크 유전자로부터 여러 작제물을 조작했으며 그 중 몇몇은 일시적인 발현 분석을 위해 먼저 C-말단 Twin-Strep-Tag를 사용하여 pCI 플라스미드(Promega)에 클로닝했다. 이러한 작제물은 도 18A에 도식화되어 있으며 다음을 포함한다.
- 전장 엑토도메인(Secto: M1-K1211)에 해당하는 가용성이고 가장 가능성 있는 단량체 형태의 스파이크. 이의 디자인은 MV 플랫폼으로 성공적으로 발현된 SARS Sol 보호 면역원과 유사하다(Escriou 등, 2014).
- 시작 메티오닌으로부터 예측된 RRAR 푸린 절단 부위 바로 앞에 있는 프롤린 681까지의 S 엑토도메인의 가용성 및 단량체성 S1 영역(M1-P681).
- Ser-Gly-Gly 연결 링커를 통해 GCN4 또는 T4 피브리틴 폴돈에 융합된 전장 엑토도메인에 해당하는 스파이크(tri-Secto)의 가용성 및 삼량체 형태.
- 이중 K986P 및 V987P "2P" 돌연변이(tristab-Secto), "3F" 돌연변이(R682G+R683S+R685G) 및/또는 "ΔF" 결실(서열번호 50의 Q675-R685 루프)을 포함하는 tri-Secto의 안정화된 변이체.
HEK 293T 세포를 pCI-Spike_ectomain 플라스미드 DNA 세트로 일시적으로 형질감염시키거나, 대조군으로서 스파이크의 전장 변이체를 암호화하는 pCI-S2P, pCI-S2PF 및 pCI-S3F 플라스미드 DNA로 형질감염시켰다. 상청액을 형질감염 후 48시간에 수집하고 스파이크 엑토도메인 분비를 항-StrepTag 모노클로날 항체를 사용한 웨스턴 블롯 분석에 의해 비교하였다. (삼량체화된) 엑토도메인의 가용성 형태만이 상청액에서 검출되었으며, 이는 막횡단 및 C-말단 세포질 도메인이 절단될 때 효율적인 분비를 나타낸다(도 18B). S1/S2 절단 부위가 "3F" 돌연변이 또는 "F" 결실로 불활성화되었을 때와 T4 폴돈 대신 GCN4 폴돈이 사용되었을 때 상청액에서 더 높은 수준의 스파이크가 검출되었다. 전체 세포 추출물의 발현 수준이 모든 작제물에 대해 동일한 범위에 있었기 때문에(도시되지 않음), 이는 비절단 및 GCN4-삼량체화된 엑토도메인의 배양 배지에서의 보다 효율적인 분비 또는 증가된 안정성을 시사한다.
T4-S2P3F, GCN4-S2P3F 및 T4-S2P 폴리펩티드를 일시적으로 형질감염된 Expi293F 세포의 상청액으로부터 StrepTactin 컬럼에서 친화성 크로마토그래피로 정제하고 Superdex200 컬럼에서 크기 배제 크로마토그래피로 분리했다(도 18C). 용리 프로파일은 280nm(mAU)에서의 흡광도에 의해 기록되었으며 T4-S2P3F는 단독 삼량체로만 구성된 반면 GCN4-S2P3F 및 T4-S2P는 상당한 비율의 이량체 및 이량체/단량체를 각각 포함한다는 것을 나타냈다.
종합하면, 이러한 결과는 T4 폴돈이 "2P" 돌연변이 및 S1/S2 절단 부위의 불활성화와 조합될 때 가장 효율적인 분비 및 동종삼량체 폴딩이 얻어짐을 나타낸다.
개념 증명으로서, 천연 스파이크 엑토도메인(Secto)을 암호화딩하는 완전히 코돈-최적화된 cDNA와 삼량체화된 엑토도메인 변이체의 최고 성능 T4-S2P3F 작제물(위에 설명된 일시적 발현 시스템에서 분석됨)을 BsiWI/BssHII-절단된 pKM-MVSchw-ATU3에 삽입했다. 해당 MV-ATU3-Secto 및 MV-ATU3-T4-S2P3F 백신 후보는 위에서 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 효율적으로 구출되었다. 독립적인 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장했다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱에 의해 확인하였으며, 이는 S의 분비된 형태를 암호화하는 cDNA를 홍역 벡터에 삽입하면 유전적으로 안정적인 MV 재조합체가 얻어진다는 것을 나타낸다. MV-ATU3-Secto 및 MV-ATU3-T4-S2P3F를 사용한 Vero NK 세포의 감염은 모체 MV Schwarz(표시되지 않음) 감염과 유사한 합포체 형성을 초래였는데, 이는 양호한 적합성과 예상대로 이들 바이러스의 강화된 융합 활성의 부재를 나타낸다.
재조합 MV로 감염된 Vero 세포에서 스파이크 엑토도메인 발현 및 분비는 SARS-CoV-2의 재조합 S 단백질에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다(미공개). 예상대로, 전장 S2P3F 단백질은 세포 용해물에서만 검출되었다(도 19의 중간 패널). 대조적으로, Secto 및 T4-S2P3F는 감염 후 39시간에 감염된 Vero 세포의 용해물 및 상청액 모두에서 명확하게 검출되어, 효율적인 분비가 확인되었다(도 19의 상단 및 중간 패널). 일관되게, 세포 배양 배지에서 분비된 Secto 및 T4-S2P3F 단백질은, 분비 전에 ER에서 Golgi로 이동할 때 성숙을 겪는 당단백질과 일치하게, 세포 용해물 내에서 관찰된 상대 분자보다 더 높은 겉보기 분자량으로 이동했다. 주목할만한 것은, T4-S2P3F가 Secto보다 감염된 세포의 용해물 및 상청액에서 현저히 더 높은 수준으로 존재했으며, 이는 T4 폴돈-매개 삼량체화가 "2P" 돌연변이 및 S1/S2 절단 부위의 불활성화와 조합될 때 S 엑토도메인의 더 정확한 접힘 및/또는 증가된 안정성을 확인시켜준다.
MV-ATU3-T4-S2P3F의 면역원성은 CD4+ 및 CD8+ T 세포 반응뿐만 아니라 중화 항체 반응의 유도와 관련하여 전장 작제물에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. Th1 편향 반응의 유도 및 분비된 T4-S2P3F 대 막 고정 S2P3F에 의해 유도된 반응의 미세 조정의 평가를 확인할 수 있다. 보호의 효율성은 Ad5:Ace2로 비강 내 형질도입 및 SARS-CoV-2로 챌린지한 후 폐 바이러스 부하를 정량화하여 평가할 수 있다.
단독으로 또는 SARS-CoV-2 스파이크와 조합하여 SARS-CoV-2 핵단백질을 발현하는 재조합 MV Schwarz의 면역원성 및 보호 가능성
pKM2-nCoV_NP 또는 pKM-ATU2-N으로 약칭되는 플라스미드 pKM-ATU2-N_2019-nCoV(2019-nCoV=SARS-CoV-2)는 "플라스미드 벡터 작제물 및 백신 후보 구출"이라는 제목의 섹션에 설명되어 있으며, MV Schwarz 게놈의 인단백질과 기질 유전자 사이에 추가 전사 단위를 포함하는 BsiWI/BssHII-절단된 pKM-MVSchw-ATU2에 완전히 코돈-최적화된 SARS-CoV2 핵단백질(N) cDNA(서열번호 21)를 삽입하여 생성하였다. pKM-ATU2-NMVopt는 뉴클레오티드 조성 및 트랜스진의 발현 수준을 미세 조정하고 재조합 홍역 바이러스의 향상된 적합성 및 안정성을 촉진하기 위한 노력의 일환으로 홍역 최적화 서열(서열번호 37)을 사용하여 유사하게 생성하였다.
pKM-ATU2-N 및 pKM-ATU2-NMVopt 플라스미드는 위에서 설명한 대로 헬퍼 세포 기반 시스템을 사용하여 단일 재조합 MV-ATU2-N 및 MV-ATU2-NMVopt 백신 후보를 성공적으로 구출하는데 사용되었다. 독립적인 바이러스 클론은 Vero NK 세포에서 증식되었고 107 TCID50/mL 이상의 높은 역가로 성장하였다. 삽입체의 정확한 서열은 ATU의 Sanger 시퀀싱으로 확인하였으며, 이는 ATU2 위치에 삽입된 완전히 코돈-최적화된 SARS-CoV-2 N 유전자와 홍역-최적화된 SARS-CoV-2 N 유전자 모두 안정적인 MV 벡터의 생산을 현저하게 가능하게 함을 나타낸다. MV-ATU2-N 및 MV-ATU2-NMVopt를 사용한 Vero NK 세포의 감염은 모체 MV Schwarz(도시되지 않음) 감염과 유사한 합포체 형성을 초래하여, 이러한 바이러스의 양호한 적합성이 확인되었다.
재조합 MV에 감염된 Vero 세포에서 SARS-CoV-2 핵단백질 발현은 SARS-CoV-2 N 단백질(미공개)에 대해 생성된 다클론 토끼 항혈청을 사용한 웨스턴 블롯 분석에 의해 확인하였다. 도 20에 도시된 바와 같이, 포화 검출 수준에 가까운 매우 높은 강도의 주요 밴드가 45 kDa의 예상 겉보기 분자량을 갖는 모든 샘플에 대해 검출되어서, 전장 N 단백질의 발현을 확인하였다. 주요 밴드의 강도는 MV-ATU2-N보다 MV-ATU2-NMVopt가 더 강했다. 저분자량의 다른 밴드도 MV-ATU2-NMVopt에 대해 관찰되었는데 이는 아마도 사소한 분해 단편에 해당할 것이다. 종합하면, SARS-CoV-2 핵단백질이 홍역 벡터의 ATU2에 삽입된 완전히 코돈-최적화된 유전자 및 홍역-최적화된 유전자로부터 효율적으로 발현되었고 완전히 코돈-최적화된 유전자가 핵단백질의 더 높은 발현을 유도했을 가능성이 가장 높은 것으로 확인되었다.
MV-ATU3-N 및 MV-ATU3-NMVopt의 면역원성은 CD4+ 및 CD8+ T 세포 반응의 유도를 모니터링함으로써 MV-S 작제물에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. IFN-γ 생성 T 세포는 N 단백질에 걸쳐 있는 펩티드 풀에 의한 자극 후 ELISpot에 의해 열거될 수 있다. CD4+ T 세포 및 CD8+ T 세포에 의한 사이토카인 생산은 유세포 분석에 의해 분석된 세포내 사이토카인 염색을 특징으로 할 수 있으므로, 본 발명자들은 Th1 편향 반응의 유도를 확인할 수 있다. 보호의 효율성은 Ad5:Ace2의 비강 내 형질도입 및 SARS-CoV-2의 챌린지 후 폐 바이러스 부하를 정량화하여 평가할 수 있다.
플라스미드 pKM-ATU2-N 및 임의의 pKM3-Spike 작제물, 특히 S6P 및 유래된 변이체(S6P3F, S6PF 및 SCC6P)는 SalI 제한 효소로 절단되고 라이게이션되어, 완전히 코돈 최적화된 SARS-CoV N 및 S 유전자를 포함하는 일련의 이중 재조합 pKM-N&S 플라스미드를 생성할 수 있다. 유사한 pKM-NMVopt&SMVopt 플라스미드는 홍역-최적화된 SARS-CoV N 및 S 유전자를 이용하여 제작할 수 있다. 이들 플라스미드는 이중 재조합 MV-N&S 백신 후보를 구출하는데 사용될 수 있으며, 이는 위에서 설명한 바와 같이 시험관 내에서 비교적 특성규명될 수 있다. 면역원성은 N 및 S 펩티드 풀을 표적으로 하는 CD4+ 및 CD8+ T 세포 반응의 유도 및 중화 항체의 유도와 관련하여 단일 재조합 구조에 대해 설명된 바와 같이 IFNAR-KO 마우스에서 조사할 수 있다. 임상 연구 결과는 SARS-CoV-2 감염 회복에 있어 체액성 면역과 세포 매개 면역 모두에 대한 보호 역할을 제안하였기 때문에(Del Valle, 2020), 이중 재조합 MV-N&S 백신 후보가 이의 단일 재조합 모체 후보보다 SARS-CoV-2의 비강 내 챌린지에 대해 더 나은 보호를 제공하는지 여부를 조사할 수 있다.
B. 실시예 2
1. 물질 및 방법
세포 및 바이러스
인간 배아 신장 세포(HEK) 293T(ATCC CRL-3216), HEK293T7-NP 헬퍼 세포(MV-N 및 MV-P 유전자를 안정적으로 발현), 아프리카 녹색 원숭이 신장 세포(Vero) 및 Vero C1008 클론 E6(ATCC CRL-1586)은 5%(Vero 세포의 경우) 또는 10%(HEK293T 세포의 경우) 열불활성화 소태아혈청(FBS)(Corning사), 100unit/ml의 페니실린-스트렙토마이신 및 100ug/ml의 스트렙토마이신이 보충된 Dulbecco의 변형된 Eagle 배지(DMEM)(Thermo Fisher사)에서 37℃, 5% CO2에서 유지하였다. SARS-CoV-2 BetaCoV/France/IDF0372/2020 균주는 파스퇴르 연구소(프랑스 파리) 산하 National Reference Centre for Respiratory Viruses에 의해 제공되었다. BetaCoV/France/IDF0372/2020 균주가 분리된 인간 샘플은 프랑스 파리 비샤 병원의 X. Lescure 박사와 Pr. Y. Yazdanpanah에 의해 제공되었다. 마우스 적응 SARS-CoV-2(MACo-3)는 다른 곳에서 기재되었다.
변형된 SARS-CoV-2 S 단백질 작제물을 발현하는 pTM-MVSchwarz의 제작
Zhou 등(Zhou, 2020)이 발표한 서열에 기반한 SARS-CoV-2 스파이크(S) 유전자는 포유동물 세포에서의 발현을 위해 코돈 최적화하였다. 제한 부위 BsiWI 및 BssHII를 S 5' 및 3' 말단에 각각 도입하는 프라이머를 사용하여 뉴클레오티드 1-3799를 증폭하여 pCDNA 5.1로 클로닝을 위한 11개의 C-말단 아미노산(SF-dER)이 결실된 전장 S(SF))을 생성하였다(도 21). S2 작제물을 생성하기 위해, 프라이머는 BsmBI 제한 부위를 이용한 역 PCR을 위해 설계되었는데, 천연 S 신호 펩티드의 C-말단에 4-뉴클레오티드 겹침이 있고 푸린 절단 부위에 바로 인접하여 S2가 있었다(표 5A 내지 표 5C). S2 영역, pCDNA 백본 및 S 신호 펩티드를 포함하는 증폭 산물을 BsmBI(NEB)로 절단하고 자가 결찰하여 S2-dER을 생성했다. 융합전 상태에서 S의 형태를 유지하기 위해, HR1, K986P 및 V987P(2P 돌연변이)의 힌지에 2개의 돌연변이를 도입하였다(도 21). 돌연변이를 도입하는 프라이머는 돌연변이된 중첩 뉴클레오티드 및 BsmBI 부위를 가지도록 설계되었다(표 5A 내지 표 5C). SF-dER 및 S2-dER 작제물을 증폭, 절단 및 자가 결찰하여 융합전-안정화된 SF-2P-dER 및 S2-2P-dER 작제물을 생성했다. pCDNA 배경의 S 작제물은 FugeneHD를 사용하여 Vero 세포로 형질감염시켰다. 형질감염된 세포를 융합형 표현형에 대해 형질감염 후 24시간 및 48시간에 관찰하였다.
이후에, 모든 S 유전자는 MV Schwarz 백신 균주의 안티게놈에 해당하는 감염성 MV cDNA를 암호화하는 pTM-MVSchwarz에 클로닝하였다. 삽입된 모든 유전자는 뉴클레오티드의 총 수가 6의 배수가 되도록 정지 코돈에서 변형하였다(Calain, 1993).
바이러스 구출, 증식 및 적정
재조합 MV 바이러스의 구출은 이전에 설명한 대로(Combredet, 2003) 헬퍼 세포 기반 시스템을 사용하여 수행하였다. 간략히 말해서, 헬퍼 HEK293T7-NP 세포를 5㎍의 pTM-MVSchwarz 기반 SARS-CoV-2 S 플라스미드 및 0.02㎍의 MV 폴리머라제(L) 유전자 발현 pEMC-La 플라스미드로 개별적으로 형질감염시켰다(Duprex, 2002). 37℃에서 밤새 인큐베이션한 후, 형질감염 배지를 새로운 DMEM 배지로 교체하였다. 형질감염된 세포를 37℃ 인큐베이터로 되돌리기 전에 42℃에서 3시간 동안 열 충격을 가하였다. 2일 후, 형질감염된 세포를 Vero 세포의 단층이 접종된 100-mm 접시에 옮겼다. 2 내지 3일의 공동 배양 후에 나타난 합포체를 단독으로 선택하고 6-웰 플레이트에 접종된 Vero 세포로 옮겼다. 감염된 세포를 트립신 처리하고 5% FBS가 포함된 DMEM에서 75-cm2 및 이어서 150-cm2 플라스크에서 증식시켰다. 합포체가 80% 내지 90% 범위에 도달했을 때(또는 최대 세포변성 효과(CPE)가 관찰되었을 때, 일반적으로 감염 후 36 내지 48시간 이내), 세포를 소량의 OptiMEM(Thermo Fisher사)으로 긁어냈다. 세포를 단일 동결-해동 주기에 의해 용해하고 세포 용해물은 저속 원심분리에 의해 정화하였다. 감염성 상청액을 채취하여 -80℃에서 보관하였다.
rMV의 역가는, 96웰 플레이트에 7500개 세포/웰로 시딩되고 5% FBS가 포함된 DMEM에서 바이러스의 연속 10배 희석액으로 감염된 Vero 세포에서 측정하였다. 7일 동안 배양한 후 세포를 크리스탈 바이올렛으로 염색하고 Karber 방법(Karber, 1931)을 사용하여 TCID50 값을 계산했다. SARS-CoV-2 및 MACo3의 역가는 유사한 플라크 분석에서 Vero-E6에 대해 평가하였다. 감염 후 3일에 플라크의 수를 판독하였다.
rMV의 바이러스 성장 동역학은 6웰 플레이트에서 Vero 세포의 단층에서 연구하였다. 세포를 0.1 MOI에서 rMV로 감염시켰다. rMV 작제물당 하나의 플레이트를 사용하였다. 감염 후 다양한 시점에서, 감염된 세포를 1 ml OptiMEM으로 긁어내고, 동결-해동에 의해 용해시키고, 원심분리에 의해 정화하고, 상기 기재된 바와 같이 적정하였다.
S 발현의 안정성을 평가하기 위해, 동결-해동 주기에 의해 생성된 세포 용해물을 사용하여 10회 계대 동안 반복적으로 Vero 세포를 감염시켰다. 계대 1(P1), P5 및 P10 바이러스를 사용하여 6개의 웰 플레이트에서 Vero를 이중으로 감염시키고 RT-PCR 및 웨스턴 블롯팅을 사용하여 각각 S mRNA 및 단백질 수준을 평가했다.
RT-PCR
rMV 작제물에서 S 발현을 확인하기 위해, RNeasy Mini Kit(Qiagen사)를 사용하여 감염된 Vero 세포에서 전체 RNA를 추출했다. cDNA 합성 및 PCR 단계는 제조사의 지침에 따라 ATU2 및 ATU3을 표적으로 하는 프라이머(표 5A 및 표 5B)가 있는 RNA LA PCR 키트(Takara Bio)를 사용하여 수행되었다. RT-PCR 생성물은 표 5C에 나타낸 프라이머를 사용하여 Sanger 시퀀싱(Eurofins Genomics)에 의해 검증되었다.
웨스턴 블롯 분석
6웰 플레이트의 Vero 세포를 MOI 0.1에서 다양한 rMV로 감염시켰다. 감염 후 36 내지 48시간(80% 합포체)에서, 감염된 세포를 RIPA 용해 완충액(Thermo Fisher사)에서 용해시켰다. 샘플을 간단히 원심분리하고 NuPAGE-MOP 러닝(running) 완충액(Invitrogen사)과 함께 NuPAGE-pre-cast 4-12% 구배 겔을 사용하여 SDS-PAGE를 수행하였다. 니트로셀룰로오스 멤브레인(GE Healthcare사)으로 옮기고 0.1% Tween, 5% 밀크가 포함된 TBS(Tris-buffered saline) 완충액으로 블로킹한 후, 보존된 1124개 아미노산 내지 1140개 아미노산 에피토프를 인식하는 토끼 다클론성 항-SARS-CoV S 항체(ABIN199984, Antibody Online, 1:2000 희석) 및 이어서 양고추냉이 퍼옥시다제(HRP)-접합된 돼지 항-토끼 IgG 항체로 멤브레인을 후속적으로 프로빙했다(P0399, Dako, 1:3000 희석). 밴드는 SuperSignal West pico Plus 화학발광 HRP 기질(Thermo Fisher사)을 사용하여 시각화하였다. 로딩 제어를 위해, 멤브레인을 5분 동안 5% NaOH로 스트라이프한 다음 블로킹했다. 그런 다음, 멤브레인을 마우스 모노클로날 항-MV-N 항체(ab9397, Abcam, 1:20000 희석) 및 이어서 HRP-접합 항-마우스 IgG(NA931V, GE Healthcare, 1:10000 희석)로 다시 프로빙했다.
면역형광 분석
Vero 세포를 0.1의 MOI에서 다양한 rMV로 감염시켰다. 감염 후 24 내지 36시간에서, 세포를 4% 파라포름알데히드로 고정하고 2% 염소 혈청으로 밤새 블로킹한 다음 0.1% 사포닌 A(Sigma사)로 처리하거나 처리하지 않았다. 그런 다음, 고정된 세포를 1차 항체로서 마우스 단일클론 항-SARS-CoV S 항체(ab273433, Abcam, 1:300 희석)로 검출했다. Alexa Fluor 488-접합 염소 항-토끼 IgG(A-11008, Thermo Fisher사)를 2차 항체로 사용하였다. 항-MV-N으로 염색한 후 Cy3-접합 염소 항-토끼 항체(A10520, Jackson ImmunoResearch, 1:1000 희석) 를 사용하여 동일한 감염된 세포에서 MV를 검출했다. 핵은 DAPI로 염색되었다. 20x 대물렌즈가 장착된 도립 Leica DM IRB 형광 현미경을 사용하여 이미지를 수집했다.
유세포 분석
융합전 안정화 또는 천연 형태 전장 S 및 S2 서브유닛 항원을 암호화하는 pcDNA5.1 발현 벡터를 사용하여 제조사의 지침에 따라 JetPrime 형질감염 키트(PolyPlus)를 사용하여 HEK293T 세포를 형질감염시켰다. 형질감염 48시간 후, S2를 표적으로 하는 10㎍/ml의 토끼 다클론성 항-S 항체(ABIN199984)에 이어서 Alexa Fluor 488-접합 염소 항-토끼 IgG(A-11008)를 사용하여 간접 면역형광을 위해 세포를 염색하였다. 요오드화 프로피듐은 게이팅에 의해 죽은 세포를 배제하는데 사용되었다. Attune NxT 유세포 분석기(Invitrogen)에서 염색된 세포를 수집하고 FlowJo v10.7 소프트웨어(FlowJo LLC)를 사용하여 데이터를 분석했다.
마우스 면역화 및 챌린지
모든 실험은 파스퇴르 연구소의 동물 실험실의 승인을 받았으며 지침에 따라 수행되었다. I형 IFN 수용체가 결핍된(IFNAR-/-) 6 내지 8주령 마우스 그룹에 105 TCID50 rMV, 즉 ATU2 또는 ATU3에서 SF-2P-dER 또는 S2-2P-dER, 또는 대조군인 빈 MV Schwarz을 복강내 주사했다. 체액성 반응을 연구하기 위해, 4주 간격으로 2회 면역화를 실시했다. 혈청은 1차 면역화 전(-1일), 이어서 2차 면역화 전(28일) 및 후(42일)에 수집하였다. 모든 혈청 샘플은 56℃에서 30분 동안 열-불활성화시켰다. 보호를 평가하기 위해, 1회 또는 2회 예방접종을 받은 마우스에 1.5 x 105 PFU 마우스-적응 SARS-CoV-2 바이러스(MACo3)를 비강내 접종으로 챌린지했다. 챌린지 3일 후, 마우스를 희생시키고 폐 샘플을 수집하였다. 제조사의 프로토콜(E3006)에 따라 Luna Universal Pr―be One-Step RT-qPCR 키트를 사용하여 바이러스 성장, 감염성 바이러스 입자의 PFU 및 vRNA를 측정하여 폐에서 MACo3 바이러스의 존재를 검출하였다. 사용된 프라이머 및 프로브는 WHO 웹사이트에 설명된 바와 같이 nCoV_IP4 패널(표 5A 내지 표 5C)에 해당한다(Protocol, Institut Pasteur, 2020).
ELISA
Edmonston 균주 유래 MV 항원(Jena Bioscience사) 또는 R683A 및 R685A 돌연변이가 있는 아미노산 잔기 16~1213을 포함하는 재조합 S 단백질(ABIN6952426, Antibodies Online사)을 1x 인산완충식염수(PBS) 중 1μg/ml로 NUNC MAXISORP 96-웰 면역 플레이트(Thermo Fisher사)에 코팅했다. 코팅된 플레이트를 4℃에서 밤새 인큐베이션하고, 세척 완충액(PBS, 0.05% Tween)으로 3회 세척하고, 블로킹 완충액(PBS, 0.05% Tween, 5% 밀크)으로 37℃에서 1 시간 동안 추가로 블로킹하였다. 면역화된 마우스의 혈청 샘플을 결합 완충액(PBS, 0.05% Tween, 2.5% 밀크)에 연속적으로 희석하고 37℃에서 1시간 동안 플레이트에서 인큐베이션했다. 세척 단계 후, HRP-접합된 염소 항-마우스 IgG(H+L) 항체(Jackson ImmunoResearch, 115-035-146, 1:5000 희석)를 37℃에서 1시간 동안 첨가하였다. TMB 기질(Eurobio사)을 첨가하여 항체 결합을 검출하고 100㎕의 30% H2SO4로 반응을 멈추었다. EnSpire 2300 Multilabel Plate Reader(Perkin Elmer사)를 사용하여 450 및 620 nm 파장에서 광학 밀도를 기록했다. 각 개별 혈청 샘플에 대한 종말점 역가는 음성 대조군 혈청의 흡광도의 2배를 제공하는 마지막 희석의 역수로 계산되었다. 항체 반응의 이소형 결정은 HRP-접합 이소형 특이적(IgG1 또는 IgG2a) 염소 항-마우스 항체를 사용하여 수행되었다(AB97240 및 AB97245, Abcam, 1:5000).
플라크 감소 중화 시험
열-불활성화된 혈청 샘플의 2배 연속 희석액을 FBS가 없는 DMEM 배지에서 50PFU의 SARS-CoV-2 바이러스와 함께 37℃에서 1시간 동안 인큐베이션하고 24웰 플레이트에 접종된 Vero E6 세포의 단층에 첨가했다. 바이러스를 37℃에서 2시간 동안 흡착시켰다. 상청액을 제거하고 세포를 1 ml의 플라크 분석 오버레이 배지(5% FBS 및 1.5% 카르복시메틸셀룰로스가 첨가된 보충된 DMEM)로 덮었다. 플레이트를 3일 동안 5% CO2 및 37℃에서 인큐베이션하였다. 바이러스를 불활성화시키고, 세포를 고정하고 20% 에탄올 및 10% 포름알데히드(모두 Sigma사)를 함유하는 30% 크리스탈 바이올렛 용액으로 염색하였다. 혈청 중화 역가는 SARS-CoV-2 플라크를 50% 감소시킨 희석액(PRNT50)으로 카운트되었다.
ELISPOT
면역화된 마우스의 비장세포를 분리하고 Hybri-Max Red Blood Cell Lysing Buffer(Sigma)를 사용하여 적혈구를 용해했다. 비장세포는 특정 자극 시 IFN-γ를 분비하는 능력에 대해 테스트하였다. 멀티스크린-HA 96-웰 플레이트(Millipore사)를 PBS 중 10㎍/ml의 항-마우스 IFN-γ(551216, BD Biosciences사)로 웰당 100㎕로 4℃에서 밤새 코팅한 후, 200 μl 완전 MEM-α (10% FBS, 1x 비필수 아미노산, 1mM 피루브산 나트륨, 2mM L-글루타민, 10mM HEPES, 1% 페니실린-스트렙토마이신 및 50μM β-메르캅토에탄올이 보충된 MEM-α(Thermo Fisher사))를 이용하여 37℃에서 2시간동안 세척 및 블로킹하였다. 배지는 10U/ml의 마우스 IL-2(Roche사)가 보충된 완전한 MEM-α에서 각 웰에 1x105 비장세포를 포함하는 100μl의 세포 현탁액 및 100μl의 자극제로 교체하였다. 사용된 자극제는 양성 대조군의 경우 2.5μg/ml 콘카나발린 A(Sigma Aldrich사), 음성 대조군의 경우 완전한 MEM-α, MOI 1의 MV Schwarz 바이러스, 또는 펩티드당 2μg/ml의 SARS-CoV-2 S 펩티드 풀(표 6A 내지 표 6B)이었다. 37℃, 5% CO2에서 40시간 동안 인큐베이션한 후, 플레이트를 PBS로 1회 세척한 다음 세척 완충액(PBS, 0.05% Tween)으로 3회 세척하였다. 세척 완충액중 1㎍/ml의 비오틴화된 항-마우스 IFN-γ 항체(554410, BD Biosciences사)를 첨가하고 플레이트를 실온에서 120분 동안 인큐베이션하였다. 광범위한 세척 후, 100 μl의 스트렙타비딘-알칼리성 포스파타제 접합체(Roche사)를 1:1000의 희석액으로 첨가하고 플레이트를 실온에서 1식간 동안 추가로 인큐베이션하였다. 웰을 세척 완충액으로 두 번 세척한 다음 Tween이 없는 PBS 완충액으로 세척했습니다. 스팟은 BCIP/NBT(Sigma사)로 전개되었으며 CTL ImmunoSpot® ELISPOT 판독기에서 계수되었다.
세포내 사이토카인 염색
백신 접종된 마우스의 비장세포를 이전에 기재된 바와 같이 추출하였다. 웰당 마우스당 2백만 개의 비장세포를 200μL의 완전한 MEM-α 배지(Thermo Fisher사)에서 인큐베이션했다. 제조사의 지시에 따라 BD Golgi Stop(554724, BD Biosciences사)을 배지에 첨가하였다. 비장세포는 펩티드당 2㎍/ml의 최종 농도에서 SARS-CoV-2 S 단백질(표 6A 및 표 6B)의 예측된 CD4 및 CD8 T-세포 에피토프를 커버하는 펩티드 풀로 자극하였다. PMA/Ionomycin Cell Stimulation Cocktail(eBioscience사)를 양성 대조군에 대한 자극으로 사용하였고, 배지 단독은 음성 대조군에 사용하였다. 비장세포를 37℃에서 4시간 동안 자극하였다. 자극된 세포를 Mouse BD Fc Block(553141, BD Biosciences사)과 함께 인큐베이션하고 Live/Dead Fixable Aqua Viability Dye(ThermoFisher)로 염색하여 게이팅에 의해 죽은 세포를 배제했다. 이어서, 세포를 CD3e PE(클론 145-2C11, 12-0031-83, eBioscience사) 및 Invitrogen사의 CD4 PerCP-eFluor710(클론 RM4-5, 46-0042-82) 및 CD8 Alexa Fluor 488(클론 53-6.7, 53-0081-82) 항체로 염색하였다. 세포를 고정하고 BD 고정/투과 키트(BD Biosciences)로 투과화하고 IFN-γ APC/Fire750(클론 XMG1.2, 505860, BioLegend사), TNF-α BV421(클론 MP6-XT22, 563387, BD Horizon사) 및 IL-5 APC(클론 TRFK5, 505860, BD Biosciences사) 항체로 염색했다. Attune NxT 유세포 분석기(Invitrogen사)를 사용하여 샘플을 수집하고 FlowJo v10.7 소프트웨어(FlowJo LLC)를 사용하여 데이터를 분석했다.
통계 정보
통계 분석은 GraphPad Prism v.8.0.2를 사용하여 수행되었다. 결과는 p < 0.05인 경우 유의미한 것으로 간주되었다. 모든 그래프의 선은 기하학적 평균을 나타내고 오차 막대는 기하학적 SD를 나타낸다. 항체 반응, ELISA 및 PRNT50의 통계적 분석은 다중 비교를 위해 조정된 양방향 ANOVA를 사용하여 수행되었다. 양측 비모수 Mann-Whitney의 U 검정을 적용하여 두 그룹 간의 차이를 비교했다.
2. 결과
SARS-CoV-2 S 항원의 설계
SARS-CoV-1 S를 발현하는 MV에 대한 본 발명자들의 예전의 연구(Escriou, 2014)에 기반하여 그리고 SARS-CoV 및 SARS-CoV-2 S 단백질이 높은 수준의 유사성을 공유하기 때문에(Chan, 2020), 전장 SARS-CoV-2의 S 단백질이 MV 벡터에 의해 발현될 주요 항원으로 선택되었다. 본 발명자들은 그의 발현 및 면역원성을 개선하기 위해 천연 S 서열에 다수의 변형을 도입하였다(도 21). 첫째, 인간 세포에서 그의 발현을 증가시키기 위해 RNA 서열을 코돈-최적화하였다. 두 번째로, 본 발명자들은 융합전 형태로 S 단백질을 안정화시켜서 S 단백질의 발현 및 면역원성을 증가시키는 입증된 전략에 따라, S2 영역에서 2개의 아미노산을 프롤린(K986P 및 V987P)로 치환하여 2P 작제물의 서브세트를 생성하였다(Kirchdoerfer, 2018; Pallesen, 2017; Wrapp, 2020). 셋째, MV-감염된 세포에서 S 단백질의 표면 발현을 증가시키기 위해, 본 발명자들은 S 세포질 꼬리로부터 11개의 C-말단 아미노산(aa 1263-1273)을 결실시켜 dER 작제물을 생성하였다. 코로나바이러스 S 단백질의 세포질 꼬리는 서열번호 149의 KxHxx 또는 KKxx 모티프를 포함하는 소포체 검색 신호(ERRS) 및 티로신 의존성 국소화 신호 Yxxζ라는 하나 또는 두 개의 고유한 유지 신호를 포함한다(Ujiker, 2016). ERRS가 있는 S 단백질은 코토머(coatomer) 복합체 I(COPI)로 모집되고 역행으로 골지체에서 ER로 재순환된다. 따라서, ER과 골지체 사이의 S 단백질의 반복적인 순환은 S 단백질 세포내 체류를 유도하는 반면, ERRS가 결여된 돌연변이 S 단백질은 원형질막으로 수송된다(McBride, 2007; Ujike, 2015). 유사하게, Yxxζ 모티프가 있는 알파 코로나바이러스의 S 단백질은 세포 표면으로 이동하는 S 단백질이 거의 또는 전혀 없이 ER에 유지된다(Schwegmann-Wessels, 2004). 따라서, 본 발명자들은 세포질 꼬리로부터 가능한 모든 유지 신호가 결실된 SARS-CoV-2 S 항원을 설계하였다.
SARS-CoV-1 및 SARS-CoV-2 임상 분리주를 모두 표적으로 하는 광범위한 백신을 생성할 가능성을 조사하기 위해, 본 발명자들은 S2 서브유닛 항원도 설계했다(도 22a). SARS-CoV-2의 S2 소단위는 SARS-유사 CoV 중에서 고도로 보존되어 있으며 박쥐 SARS 유사 CoV(SL-CoV ZXC21 및 ZC45) 및 인간 SARS-CoV-1와 99% 동일성을 갖는다(Chan, 2020). 따라서, 본 발명자들은 항원을 세포 표면으로 표적화하기 위해 N-말단에 삽입된 S 단백질의 신호 펩티드를 갖는 천연 삼량체 및 융합전-안정화된 형태 둘 모두의 S2 서브유닛 항원을 설계하였다.
종합하면, 본 발명자들은 하기의 4개의 상이한 SARS-CoV-2 S 작제물을 설계하였다(도 22a): 1) 천연 형태 전장 S 삼량체(SF-dER); 2) 융합전-안정화된 전장 S(SF-2P-dER); 3) 천연 형태 삼량체 S2 서브유닛(S2-dER); 및 4) 융합전-안정화된 S2 서브유닛(S2-2P-dER).
SARS-CoV-2 S 항원의 발현 프로필
전장 S 및 S2 서열을 우선 pCDNA에 클로닝하고 HEK293T 세포에 형질감염시켜서 발현을 확인하고 표면 염색 후 유세포 분석에 의해 표면 단백질 국소화를 평가했다. 융합전-안정화된 S 작제물은 형질감염된 세포의 표면에 더 강하게 국소화되는 것으로 관찰되었다(도 28). ACE-2를 발현하는 Vero 세포에서 동일한 pCDNA 벡터를 형질감염시켜 S 단백질의 기능을 분석하였다. 일단 S 단백질이 ACE-2 수용체에 결합하면, 융합 단백질의 활성화는 세포 사이에 큰 융합체의 형성을 통해 관찰될 수 있다. 천연 S 단백질을 발현하는 Vero 세포(온전한 CT가 있는 전장 S)는 유의한 합포체 형성을 나타내므로(도 29), 기능적 S 단백질이 세포 표면에서 발현되었음을 알 수 있다. 특히, SdER 돌연변이체는 천연 SF에 비해 증가된 융합을 유도하므로, ERRS가 결실된 경우의 S 단백질의 예상되는 증가된 표면 발현이 확인되었다. 흥미롭게도, S2 소단위 단독의 발현은 Vero 세포에서 과융합 표현형을 초래했다. 이는 프로테아제가 S2' 부위를 절단하고 융합 펩티드를 유리시킴으로써 비수용체 매개 막 융합을 유발한다는 것을 시사한다. 반대로, 2P-안정화된 SF-2P-dER과 S2-2P-dER은 모두 합포체 형성을 유도하지 않았고, 따라서 2P 돌연변이에 의해 그의 융합 활성이 소멸되었음을 알 수 있다.
SARS-CoV-2 S 및 S2 단백질을 발현하는 rMV의 생성
4개의 항원 작제물은 추가 전사 단위(ATU)에서 pTM-MVSchwarz 플라스미드에 개별적으로 클로닝되었는데, ATU2는 MV 게놈의 P 및 M 유전자 사이에, ATU3은 H 및 L 유전자 사이에 위치하였다(Combredet, 2003)(도 22a). MV 유전자의 발현 구배 감소로 인해, ATU2에 클로닝하면 항원의 높은 수준의 발현이 가능한 반면 ATU3에 클로닝하면 낮은 수준의 발현을 초래된다(Plumet, 2005). ATU3로부터의 더 낮은 발현은 독성이 있거나 발현하기 어려운 항원을 암호화하는 rMV의 구출을 용이하게 하기 위한 절충안이다.
S 단백질을 발현하는 모든 rMV는 역유전학에 의해 성공적으로 구출되었고 Vero 세포에서 증식되었다. rMV가 약간 지연된 성장 동역학을 나타내긴 했지만, 최종 바이러스 수율은 높았고 모체 MV Schwarz(약 107 TCID50/ml)의 수율과 동일했다(도 22b). S 항원의 발현은 웨스턴 블롯팅(WB) 및 면역형광 염색(IF)에 의해 감염된 Vero 세포에서 검출되었다(도 22c, 도 22d 및 도 30 및 도 31). 예상대로, ATU3에 비해 ATU2 벡터에서 훨씬 더 높은 항원 발현이 관찰되었다(도 22c).
재조합 바이러스 벡터를 백신으로 사용할 때, 작제물의 유전적 안정성은 여러 제조 단계 후에 백신의 유효성을 보장하기 때문에 주요 관심사이다. Vero 세포에서 연속 계대 후의 rMV의 이러한 분석 결과, ATU2로부터 천연 S를 발현하는 MV-ATU2-SF-dER이 계대 5에 의해 S 발현의 손실과 함께 불안정한 것으로 밝혀졌다(도 32).
대조적으로, 그의 2P 대응물은 계대 10까지 안정적이고 효율적으로 발현되었다. 따라서, 본 발명자들은 천연 S를 발현하는 백신 후보를 버리고 추가 면역원성 연구를 위해 융합전-안정화된 SF-2P 및 S2-2P 작제물을 발현하는 것들을 선택하였다.
마우스에서 SARS-CoV-2 중화 항체의 유도
본 발명자들은 MV 감염에 민감한 IFNAR -/- 마우스에서, 선택된 rMV 백신 후보의 면역원성을 조사하였다(Mura, 2018). 동물은 0일 및 30일에 1x105 TCID50에서 rMV 후보를 1회 또는 2회 복강내 투여하여 면역화시켰다(도 23a). 빈 MV Schwarz를 대조군 백신 접종에 사용했다. 마우스 혈청은 프라임 후 4주 및 부스트 후 12일에 수집하였다. S- 및 MV-특이적 IgG 항체의 존재는 SARS-CoV-2 S 재조합 단백질 및 천연 MV 항원을 각각 사용하여 간접 ELISA에 의해 평가하였다.
모든 동물은 모든 그룹에서 비슷한 역가(약 104-105 IgG 역가)에서 프라임 후 높은 MV-특이적 IgG 항체를 발생시켰으므로, 모든 동물에서 효과적인 백신 섭취가 확인되었다(도 23b). 부스트 면역화는 모든 그룹에서 MV-특이 항체 역가를 증가시켰고, 이는 모든 동물이 성공적인 프라임-부스트 백신 접종을 받았음을 나타낸다. SARS-CoV-2 S에 대한 특정 IgG 항체는 면역된 마우스의 100%에서 검출되었다. 흥미롭게도, ATU2로부터 SF-2P-dER 또는 S2-2P-dER 항원을 발현하는 rMV는 특히 부스팅 후에 ATU3 벡터보다 더 높은 수준의 항-S 항체를 유도했다(도 23c). 빈 MV를 투여 받은 대조군 동물의 면역전 혈청 및 혈청은 항-S 항체에 대해 음성으로 남아 있었다(데이터는 도시되지 않음).
다음으로, 본 발명자들은 Vero E6 단층의 SARS-CoV-2 바이러스 감염을 통한 플라크 감소 중화 시험(PRNT)을 사용하여 SARS-CoV-2 중화 항체(NAb)의 존재를 평가하였다. 프라임 후, SARS-CoV-2 NAb는 ATU2로부터 발현된 SF-2P-dER로 면역화된 모든 마우스에서 발견되었지만 ATU3 작제물로 면역화된 마우스는 단 한 마리였다(도 23d). 2차 면역화 후, NAb 역가는 두 그룹 모두에서 증가했으며, ATU2 그룹은 ATU3 그룹에 비해 10배 더 높은 NAb 역가를 나타냈다. 높은 수준의 항-S 항체에도 불구하고 S2 후보로 면역화된 동물에서는 NAb가 검출되지 않았다(도 23c).
IgG 이소타입 전환이 Th1 및 Th2 반응의 간접적인 지표로 작용할 수 있기 때문에(Finkelman, 1990), 본 발명자들은 면역화된 마우스의 혈청에서 S-특이적 IgG1 및 IgG2a 아이소타입 역가를 측정했다(도 23f, 도 23g). 본 발명자들의 이전 결과(Escriou, 2014)와 유사하게, rMV 후보는 IgG1보다 훨씬 더 높은 IgG2a 항체 역가를 유도했는데, 이는 우세한 Th1-유형 면역 반응을 반영한다(도 23f, 도 23g). 활성화된 T 세포는 Th1 및 Th2 사이토카인 생성에 중요한 역할을 하기 때문에, 본 발명자들은 MV-면역화된 마우스에서 S-특이적 T-세포 반응을 더 자세히 분석하였다.
S-특이적 T-세포 반응의 유도
면역화에 의해 유도된 세포 매개 면역 반응은 IFN-γ ELISPOT 분석을 사용하여 먼저 조사하였다. IFNAR-/- 마우스 그룹을 1차 면역화 1주일 후에 희생시켰다(도 24a). S-특이적 반응을 평가하기 위해, 비장세포는 129sv IFNAR-/- 마우스의 MHC-I H-2Kb/H-2Db 및 MHC-II I-Ab 일배체형과 일치하는 SARS-CoV-2 S 단백질의 예측된 CD8+ 및 CD4+ T-세포 에피토프를 커버하는 합성 펩티드 풀로 생체 외 자극하였다(표 6A 및 표 6B). 또한, 비장세포는 MV 벡터-특이적 T-세포 반응을 검출하기 위해 빈 MV 바이러스로 자극하였다.
SARS-CoV-2 S 및 MV에 대한 높은 수준의 T 세포 반응은 1차 백신 접종 후 초기에 유도되었다(도 24). MV-ATU2-SF-2P-dER로 백신 접종한 마우스의 비장세포는 MHC 클래스 I-제한 S 펩티드 풀로 자극한 후 현저하게 높은 IFN-γ 분비 수준을 나타내어 106개 비장세포당 약 2,500개의 스팟 형성 세포(SFC)를 생성했다. 더 낮은 IFN-γ 반응은 대략 400개의 SFC/106 비장세포에서 MHC 클래스 II-제한 S 펩티드로 자극시에 관찰되었다(도 24b, 도 24c). 또한, 이들 마우스의 비장세포는 비교적 낮은 벡터 특이적 IFN-γ 반응(~990 SFC/106 비장세포)을 나타내었으므로, 균형 잡힌 S-대-MV 벡터 반응 비율을 나타내었다(도 24d). 동일한 백신의 ATU3 대응물은 더 많은 벡터 특이적 IFN-γ 분비 세포(약 1,320 SFC/106 비장세포)를 생성하는 경향이 있는 반면, MHC 클래스 II-제한 S 펩티드(약 130 SFC/106 비장세포)로 자극한 후 S-특이적 IFN-γ 분비 세포를 생성하는데는 덜 효율적이었다. MHC 클래스 I-제한 S 펩티드로 자극한 후의 IFN-γ 반응은 ATU2 대응물(약 1,980 SFC/106 비장세포)의 반응과 크게 다르지 않았지만, S-대-MV 벡터 반응 비율은 MV-ATU2-SF-2P-dER의 경우에 상당히 더 높았다(도 24b).
대조적으로, S2-단독 작제물에 의해 유발된 S-특이적 IFN-γ 반응은 S 펩티드 풀 중 하나를 사용한 자극 후에 낮았다(도 24c, 도 24d). S-대-MV 벡터 반응 비율은 또한 이들 동물에서 매우 낮게 유지되었으며, 이는 S2 단백질 서브유닛 단독으로 면역화가 강력한 보호 세포 면역 반응을 유도하기에 충분하지 않을 수 있음을 시사한다(도 24e, 도 24f). MV-ATU3-S2-2P-dER 및 빈 MV는 S-특이적 IFN-γ 반응을 유도할 수 없었다.
다음으로, 본 발명자들은 세포내 사이토카인 염색(ICS) 후 유세포 분석에 의해 S-특이적 CD4+ 및 CD8+ T 세포를 연구하였다. S-특이적 IFN-γ+ 및 TNF-α+ 반응은 CD8+ T 세포에서 관찰된 반면, CD4+ T 세포는 S 펩티드 풀 자극에 잘 반응하지 않았다(도 25a, 도 25b). ELISPOT 결과와 유사하게, ATU2 또는 ATU3로부터 발현된 SF-2P-dER은 상당히 높고 필적할만한 비율의 S-특이적 IFN-γ+ 및 TNF-α+ CD8+ T 세포를 유도한 반면, ATU2로부터 발현된 S2 단백질은 면역원성이 10배 작았다. MV-ATU3-S2-2P-dER 및 빈 MV는 S-특이적 IFN-γ- 또는 TNF-α-생산 T-세포를 유도할 수 없었다. IL-5-분비 세포(Th2 편향된 반응을 나타냄)는 면역화 그룹에서 검출되지 않았다. MV-ATU2-SF-2P-dER로 면역된 마우스에서 T 세포 반응에 대한 추가적인 상세한 분석 결과, 높은 수준의 S-특이적 IFN-γ+ 및 TNF-α+ 생성 CD8+ T 세포뿐만 아니라 이중 양성 IFN-γ+/TNF-α+ 생산 CD8+ T 세포의 CD8 구획의 강한 자극이 확인되었다. IL-5 또는 IL-13은 CD4+ 또는 CD8+ T 세포뿐만 아니라 CD4+/CD44+/CD62L-기억 T 세포에서 검출되지 않았으며, 이는 S-특이적 기억 T 세포도 Th1-지향성(oriented)임을 확인시켜준다(도 33).
종합하면, 이러한 결과는 MV-ATU2-SF-2P-dER이 MV-ATU3-SF-2P-dER보다 상당히 높은 수준에서 SARS-CoV-2 S 항원에 대한 강력한 Th1-구동 T 세포 면역 반응을 유도한다는 것을 입증한다. S2 후보는 이전에 NAb 수준에서 관찰된 바와 같이 훨씬 더 낮은 세포 반응을 유도했으며, 이는 S2 단독으로는 이러한 마우스에서 효율적인 면역 반응을 유도하기에 충분하지 않음을 나타낸다. 따라서, 본 발명자들은 추가 분석에서 S2 후보를 제외시켰다.
중화항체의 지속성 및 비강내 챌린지로부터의 보호
본 발명자들은 MV-ATU2-SF-2P-dER 또는 MV-ATU3-SF-2P-dER로 2회 면역화된 마우스에서 항-S 항체의 지속성을 모니터링하였다(도 26a). MV 반응에 대해 일반적으로 관찰되는 바와 같이(도 26b), S-특이적 IgG 역가는 부스팅 후 최대 3개월 동안 ATU2 및 ATU3 후보 모두에 대해 높은 수준(105-106 제한 희석 역가)으로 지속되고 안정화되었다(도 26c). 그러나, ATU2 작제물을 사용한 면역화는 실험 기간에 걸쳐 유의하게 더 높은 수준의 S-특이적 IgG 및 NAb 역가(103-104 제한 희석 역가)를 초래하였다(도 26d).
이러한 반응이 SARS-CoV-2 감염으로부터 보호를 제공하는지 여부를 확인하기 위해, 면역화된 마우스에 마우스-적응 SARS-CoV-2 바이러스인 MACo3의 1.5 x 105 PFU를 비강 내로 챌린지했다. 챌린지 3일 후, 마우스를 희생시키고 폐 균질액에서 바이러스의 존재를 조사하였다. SARS-CoV-2 RNA는 RdRP 유전자-특이적 프라이머를 사용하여 RT-qPCR에 의해 측정하였고(Protocol, Institut Pasteur, 2020)(표 5A 내지 표 5C), 감염성 바이러스 수준은 Vero E6 세포에서 적정하였다. SARS-CoV-2 바이러스 RNA는 챌린지 후 모든 면역화된 마우스의 폐에서 검출되었으며, ATU2 그룹은 빈 MV 대조군과 비교하여 평균 2log10 감소를 나타내고 ATU3 그룹은 1log10 감소를 나타냈다(도 26e). 그러나, ATU2 그룹의 폐 및 ATU3 그룹의 하나를 제외한 모든 폐에서 감염성 바이러스가 검출되지 않았다(도 26f). 이러한 결과는 비록 바이러스 복제가 낮은 수준에서 발생했지만 접종된 바이러스와 자손 바이러스의 감염성이 효율적으로 중화되었음을 나타낸다.
1회 접종 후 비강내 챌린지로부터 부분적 보호
다음으로, 본 발명자들은 단일 면역화가 MACo3 바이러스 챌린지로부터 IFNAR-/- 마우스를 보호할 수 있는지 여부를 확인하였다(도 27a). 면역화된 동물을 챌린지 전에 면역화 후 28일 및 48일에 면역 반응에 대해 검사하였다. 모든 동물은 MV- 및 S-특이적 항체를 나타냈다(도 27b, 도 27c). S 항원뿐만 아니라 SARS-CoV-2 NAb에 대한 Th1-관련 IgG 반응은 2회 면역화 후보다 낮은 수준이었지만 챌린지 전에 존재하였다(도 27d, 도 27e). 그 다음, 마우스를 비강내로 챌린지하고 챌린지 3일 후에 폐 샘플을 수집하였다. 시험군과 대조군 사이의 바이러스 RNA 수준의 차이가 관찰되지 않았지만(도 27f), MV-ATU2-SF-2P-dER로 면역화된 동물의 절반은 폐의 감염성 바이러스에 대해 음성이었고(도 27g), 따라서 단일 투여 후에도 부분적 보호를 나타냈다. 대조적으로, MV-ATU3-SF-2P-dER로 면역화된 동물은 단일 투여 후에 보호되지 않았다. 그러나, 프라임/부스트 후, 두 작제물 모두 보호적인 것으로 확인되었다(도 26).
3. 고찰
여기에서 본 발명자들은 SARS-CoV-2 S 단백질을 표적으로 하는 MV 기반 COVID-19 백신 후보의 개발 및 테스트를 보고했다. 다른 백신 플랫폼과 유사하게, 전장 융합전-안정화 S는 가장 면역원성이 있어 가장 강력한 체액 및 세포 반응을 유도했다. 그들의 주요 후보인 MV-ATU2-SF-2P-dER은 SARS-CoV-2에 대한 중화 항체의 높은 수준과 강력한 Th1 지향 T 세포 반응을 유도했다. 프라임-부스트 면역화는 마우스-적응된 SARS-CoV-2 바이러스에 의한 비강내 챌린지로부터 보호를 제공했다. 또한, NAb 역가는 면역화 후에도 몇 달 동안 지속되었다. 이러한 오래 지속되는 면역은 복제 벡터 백신의 특징이다(Amanna, 2007). 바이러스 부하 및 바이러스 증식을 제어하고 감소시키는데 필수적인 T 세포 반응(Rydyznski, 2020)은 단일 면역화 후 7일 이내에 유도되었다. 특히, Th1 반응의 우세는 SARS-CoV-1 및 MERS-CoV 백신 연구에 대하여 이전에 보고된 바와 같이 이러한 백신 후보가 백신-유도 질병 강화로 인해 면역 병리학을 유도할 가능성이 적음을 시사했다(Roberts, 2010; Luo, 2018; Qin, 2006; Niu, 2018; Zhang, 2016). 또한, 1회 접종 후, 주요 후보인 MV-ATU2-SF-2P-dER도 최소 50%의 COVID-19 백신 1차 효능에 대한 WHO 권고(Considerations for evaluation of COVID19, WHO, 2020)에 따른 충분한 면역 보호를 제공했다. 이는 그들의 주요 백신 후보가 SARS-CoV-2 감염 및 질병 모두로부터 보호할 수 있음을 시사한다.
광범위한 백신을 생성하는 가능성을 탐색하기 위해, 본 발명자들은 SARS-CoV-1 및 SARS-CoV-2 바이러스 중에서 고도로 보존된 S2 서브유닛만을 발현하는 백신 후보도 시험하였다. S2 서브유닛은 면역우성 및 중화 에피토프를 보유하는 것으로 확인되었다(Zhang, 2004; He, 2004; Wang, 2020). 이 보고서에서, MV 맥락에서 S2는 높은 S-특이적 항체 역가를 유도했지만, 이러한 항체는 SARS-CoV-2 바이러스를 중화할 수 없었다. 세포 반응의 관점에서, S2는 S-특이적 CD4+, CD8+ 또는 IL-5+ T-세포 반응을 유도하지 않았다. 이러한 관찰은 S2 소단위만으로는 면역 보호를 유도하기에 충분하지 않음을 시사했다. 비-중화 항체의 높은 역가를 감안할 때, SARS-CoV-2 감염에 대한 면역 반응에서 항체의 역할을 특성규명하고 면역병리학에 기여할 수 있는지 여부를 조사하는 것은 흥미로울 것이다.
또한, 본 발명자들의 결과는 ATU2 대 ATU3으로부터 표적 항원을 발현하는 rMV 백신의 면역원성에서 흥미로운 차이를 나타내었다. S 항원은 ATU2에서 더 높은 수준으로 발현되었으며, 이는 더 높은 체액성 반응 및 세포 반응과 상관관계가 있었다. ATU2 후보의 면역화 용량을 1x104 TCID50으로 감소시키는 것은 여전히 1x105 TCID50에서의 ATU3 백신보다 더 높은 NAb 역가를 유도하였다(도 34). 추가적으로, MV 벡터에 대한 T-세포 반응은 또한 ATU2 작제물에서 더 낮았다. 이러한 관찰 결과는 더 높은 항원 발현이 생체내 바이러스 복제를 감소시킬 수 있고, 결과적으로 벡터 자체에 대한 더 낮은 세포 반응을 초래할 수 있음을 시사했다. MV 백신이 벡터에 대한 기존의 면역에도 불구하고 효과적인 것으로 확인되었지만, 항원 및 벡터의 면역원성의 보다 바람직한 균형은 ATU2 작제물의 더 큰 백신 효능에 기여할 가능성이 있다. 그럼에도 불구하고, 미래의 백신을 위한 rMV 비히클로서 ATU3 개념은 불안정하거나 독성이 있거나 발현하기 어려운 항원을 발현하는데 여전히 유용하다.
[참고문헌]
Combredet, C., V. Labrousse, L. Mollet, C. Lorin, F. Delebecque, B. Hurtrel, H. McClure, M. B. Feinberg, M. Brahic and F. Tangy (2003). "A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice." J Virol 77(21): 11546-54.
Escriou, N., B. Callendret, V. Lorin, C. Combredet, P. Marianneau, M. Fevrier and F. Tangy (2014). "Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein." Virology 452-453: 32-41.
Reed, L. J. and H. Muench (1938). "A simple method of estimating fifty percent endpoints." Am. J. Hyg. 27: 493-497.
Reuter 등, PLoS ONE, 2012, 7(3), e33989, 1-8.
Ku 등. (2021) Cell Host & Microbe - for challenge model with Ad5:hACE2.
Hsieh 등. (2020) Science 369, 1501-1505.
MCCallum 등. (2020) Nat. Struct. Mol. Biol., 27, 942-949.
Buchrieser 등. (2020) EMBO Journal, 39:e106267.
Plumet (2005) J. Virol (2005) 79(11):6900-8.
Del Valle (2020), Nat Med., Chen, J. Clin. Invest., 2020.
Xiong 등 (2020), Nature Structural & Molecular Biology.
Combredet, C., V. Labrousse, L. Mollet, C. Lorin, F. Delebecque, B. Hurtrel, H. McClure, M. B. Feinberg, M. Brahic and F. Tangy (2003). "A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice." J Virol 77(21): 11546-54.
Escriou, N., B. Callendret, V. Lorin, C. Combredet, P. Marianneau, M. Fevrier and F. Tangy (2014). "Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein." Virology 452-453: 32-41.
Reed, L. J. and H. Muench (1938). "A simple method of estimating fifty percent endpoints." Am. J. Hyg. 27: 493-497.
The GDP@Risk over five years from COVID-19 could range from $3.3 trillion to $82 trillion, says the Centre for Risk Studies www.jbs.cam.ac.uk/insight/2020/economic-impact/. In: Brain food / Economic impact) (2020).
Callaway E, Cyranoski D. China coronavirus: Six questions scientists are asking. Nature 577, 605-607 (2020).
Graham BS. Rapid COVID-19 vaccine development. Science (New York, NY) 368, 945-946 (2020).
Zhou P, 등. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature 579, 270-273 (2020).
Wu F, 등. A new coronavirus associated with human respiratory disease in China. Nature 579, 265-269 (2020).
Jaimes J, Millet J, Whittaker G. Proteolytic Cleavage of the SARS-CoV-2 Spike Protein and the Role of the Novel S1/S2 Site. Ssrn, 3581359 (2020).
Hoffmann M, 등. SARS-CoV-2 Cell Entry Depends on ACE2 and TMPRSS2 and Is Blocked by a Clinically Proven Protease Inhibitor. Cell 181, 271-280.e278 (2020).
Du L, He Y, Zhou Y, Liu S, Zheng BJ, Jiang S. The spike protein of SARS-CoV--a target for vaccine and therapeutic development. Nature reviews Microbiology 7, 226-236 (2009).
Escriou N, 등. Protection from SARS coronavirus conferred by live measles vaccine expressing the spike glycoprotein. Virology 452-453, 32-41 (2014).
Liniger M, 등. Induction of neutralising antibodies and cellular immune responses against SARS coronavirus by recombinant measles viruses. Vaccine 26, 2164-2174 (2008).
Bodmer BS, Fiedler AH, Hanauer JRH, Prfer S, Mhlebach MD. Live-attenuated bivalent measles virus-derived vaccines targeting Middle East respiratory syndrome coronavirus induce robust and multifunctional T cell responses against both viruses in an appropriate mouse model. Virology 521, 99-107 (2018).
Zhu FC, 등. Safety, tolerability, and immunogenicity of a recombinant adenovirus type-5 vectored COVID-19 vaccine: a dose-escalation, open-label, non-randomised, first-in-human trial. Lancet (London, England) 395, 1845-1854 (2020).
Bosch BJ, 등. Severe acute respiratory syndrome coronavirus (SARS-CoV) infection inhibition using spike protein heptad repeat-derived peptides. Proceedings of the National Academy of Sciences of the United States of America 101, 8455-8460 (2004).
Keng CT, 등. Amino acids 1055 to 1192 in the S2 region of severe acute respiratory syndrome coronavirus S protein induce neutralizing antibodies: implications for the development of vaccines and antiviral agents. Journal of virology 79, 3289-3296 (2005).
Lip KM, 등. Monoclonal antibodies targeting the HR2 domain and the region immediately upstream of the HR2 of the S protein neutralize in vitro infection of severe acute respiratory syndrome coronavirus. Journal of virology 80, 941-950 (2006).
Zhang H, 등. Identification of an antigenic determinant on the S2 domain of the severe acute respiratory syndrome coronavirus spike glycoprotein capable of inducing neutralizing antibodies. Journal of virology 78, 6938-6945 (2004).
Zhong X, 등. B-cell responses in patients who have recovered from severe acute respiratory syndrome target a dominant site in the S2 domain of the surface spike glycoprotein. Journal of virology 79, 3401-3408 (2005).
Frantz PN, Teeravechyan S, Tangy F. Measles-derived vaccines to prevent emerging viral diseases. Microbes Infect 20, 493-500 (2018).
Ramsauer K, 등. Immunogenicity, safety, and tolerability of a recombinant measles-virus-based chikungunya vaccine: a randomised, double-blind, placebo-controlled, active-comparator, first-in-man trial. The Lancet Infectious diseases 15, 519-527 (2015).
Reisinger EC, 등. Immunogenicity, safety, and tolerability of the measles-vectored chikungunya virus vaccine MV-CHIK: a double-blind, randomised, placebo-controlled and active-controlled phase 2 trial. Lancet (London, England) 392, 2718-2727 (2019).
Mateo M, 등. Vaccines inducing immunity to Lassa virus glycoprotein and nucleoprotein protect macaques after a single shot. Science translational medicine 11, (2019).
Nrnberger C, Bodmer BS, Fiedler AH, Gabriel G, Mhlebach MD. A Measles Virus-Based Vaccine Candidate Mediates Protection against Zika Virus in an Allogeneic Mouse Pregnancy Model. Journal of virology 93, (2019).
Malczyk AH, 등. A Highly Immunogenic and Protective Middle East Respiratory Syndrome Coronavirus Vaccine Based on a Recombinant Measles Virus Vaccine Platform. Journal of virology 89, 11654-11667 (2015).
Chan JF, 등. Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan. Emerging microbes & infections 9, 221-236 (2020).
Kirchdoerfer RN, 등. Stabilized coronavirus spikes are resistant to conformational changes induced by receptor recognition or proteolysis. Scientific reports 8, 15701 (2018).
Pallesen J, 등. Immunogenicity and structures of a rationally designed prefusion MERS-CoV spike antigen. Proceedings of the National Academy of Sciences of the United States of America 114, E7348-e7357 (2017).
Wrapp D, 등. Cryo-EM structure of the 2019-nCoV spike in the prefusion conformation. Science (New York, NY) 367, 1260-1263 (2020).
Ujike M, Huang C, Shirato K, Makino S, Taguchi F. The contribution of the cytoplasmic retrieval signal of severe acute respiratory syndrome coronavirus to intracellular accumulation of S proteins and incorporation of S protein into virus-like particles. The Journal of general virology 97, 1853-1864 (2016).
McBride CE, Li J, Machamer CE. The cytoplasmic tail of the severe acute respiratory syndrome coronavirus spike protein contains a novel endoplasmic reticulum retrieval signal that binds COPI and promotes interaction with membrane protein. Journal of virology 81, 2418-2428 (2007).
Ujike M, Taguchi F. Incorporation of spike and membrane glycoproteins into coronavirus virions. Viruses 7, 1700-1725 (2015).
Schwegmann-Wessels C, 등. A novel sorting signal for intracellular localization is present in the S protein of a porcine coronavirus but absent from severe acute respiratory syndrome-associated coronavirus. The Journal of biological chemistry 279, 43661-43666 (2004).
Combredet C, 등. A molecularly cloned Schwarz strain of measles virus vaccine induces strong immune responses in macaques and transgenic mice. Journal of virology 77, 11546-11554 (2003).
Plumet S, Duprex WP, Gerlier D. Dynamics of viral RNA synthesis during measles virus infection. Journal of virology 79, 6900-6908 (2005).
Mura M, Ruffie C, Billon-Denis E, Combredet C, Tournier JN, Tangy F. hCD46 receptor is not required for measles vaccine Schwarz strain replication in vivo: Type-I IFN is the species barrier in mice. Virology 524, 151-159 (2018).
Finkelman FD, 등. Lymphokine control of in vivo immunoglobulin isotype selection. Annual review of immunology 8, 303-333 (1990).
Protocol: Real-time RT-PCR assays for the detection of SARS-CoV-2 Institut Pasteur, Paris.). Protocol: Real-time RT-PCR assays for the detection of SARS-CoV-2 Institut Pasteur, Paris (2020).
Amanna IJ, Carlson NE, Slifka MK. Duration of humoral immunity to common viral and vaccine antigens. The New England journal of medicine 357, 1903-1915 (2007).
Rydyznski Moderbacher C, 등. Antigen-Specific Adaptive Immunity to SARS-CoV-2 in Acute COVID-19 and Associations with Age and Disease Severity. Cell, (2020).
Roberts A, 등. Immunogenicity and protective efficacy in mice and hamsters of a beta-propiolactone inactivated whole virus SARS-CoV vaccine. Viral Immunol 23, 509-519 (2010).
Luo F, Liao FL, Wang H, Tang HB, Yang ZQ, Hou W. Evaluation of Antibody-Dependent Enhancement of SARS-CoV Infection in Rhesus Macaques Immunized with an Inactivated SARS-CoV Vaccine. Virol Sin 33, 201-204 (2018).
Qin E, 등. Immunogenicity and protective efficacy in monkeys of purified inactivated Vero-cell SARS vaccine. Vaccine 24, 1028-1034 (2006).
Niu P, 등. A novel human mAb (MERS-GD27) provides prophylactic and postexposure efficacy in MERS-CoV susceptible mice. Sci China Life Sci 61, 1280-1282 (2018).
Zhang N, 등. Identification of an ideal adjuvant for receptor-binding domain-based subunit vaccines against Middle East respiratory syndrome coronavirus. Cell Mol Immunol 13, 180-190 (2016).
CONSIDERATIONS FOR EVALUATION OF COVID19 VACCINESFORWHO EUL v24092020. (ed Vaccine and Immunization Devices Assessment Team (VAX) PUP, Regulation and Prequalification Department (RPQ), Access to Medicineand Health Products(MHP), World Health Organization, Geneva,Switzerland) (2020).
He Y, 등. Identification of immunodominant sites on the spike protein of severe acute respiratory syndrome (SARS) coronavirus: implication for developing SARS diagnostics and vaccines. J Immunol 173, 4050-4057 (2004).
Wang Q, Qiu Y, Li JY, Zhou ZJ, Liao CH, Ge XY. A Unique Protease Cleavage Site Predicted in the Spike Protein of the Novel Pneumonia Coronavirus (2019-nCoV) Potentially Related to Viral Transmissibility. Virol Sin 35, 337-339 (2020).
Print RDB. Draft landscape of COVID-19 candidate vaccines.). World Health Organization (2020).
Ahi YS, Bangari DS, Mittal SK. Adenoviral vector immunity: its implications and circumvention strategies. Curr Gene Ther 11, 307-320 (2011).
Folegatti PM, 등. Safety and immunogenicity of the ChAdOx1 nCoV-19 vaccine against SARS-CoV-2: a preliminary report of a phase 1/2, single-blind, randomised controlled trial. Lancet (London, England) 396, 467-478 (2020).
Zuniga A, 등. Attenuated measles virus as a vaccine vector. Vaccine 25, 2974-2983 (2007).
Domingo C, 등. Long-term immunity against yellow fever in children vaccinated during infancy: a longitudinal cohort study. The Lancet Infectious diseases 19, 1363-1370 (2019).
Pebody RG, 등. Immunogenicity of second dose measles-mumps-rubella (MMR) vaccine and implications for serosurveillance. Vaccine 20, 1134-1140 (2002).
Mura M, Combredet C, Najburg V, Sanchez David RY, Tangy F, Komarova AV. Nonencapsidated 5' Copy-Back Defective Interfering Genomes Produced by Recombinant Measles Viruses Are Recognized by RIG-I and LGP2 but Not MDA5. Journal of virology 91, (2017).
Sankoh O, 등. The non-specific effects of vaccines and other childhood interventions: the contribution of INDEPTH Health and Demographic Surveillance Systems. Int J Epidemiol 43, 645-653 (2014).
Benn CS, Fisker AB, Whittle HC, Aaby P. Revaccination with Live Attenuated Vaccines Confer Additional Beneficial Nonspecific Effects on Overall Survival: A Review. EBioMedicine 10, 312-317 (2016).
Aaby P, 등. Non-specific effects of standard measles vaccine at 4.5 and 9 months of age on childhood mortality: randomised controlled trial. BMJ 341, c6495 (2010).
Buitrago-Garcia D, 등. Occurrence and transmission potential of asymptomatic and presymptomatic SARS-CoV-2 infections: A living systematic review and meta-analysis. PLoS Med 17, e1003346 (2020).
Calain P, Roux L. The rule of six, a basic feature for efficient replication of Sendai virus defective interfering RNA. Journal of virology 67, 4822-4830 (1993).
Duprex WP, Collins FM, Rima BK. Modulating the function of the measles virus RNA-dependent RNA polymerase by insertion of green fluorescent protein into the open reading frame. Journal of virology 76, 7322-7328 (2002).
SEQUENCE LISTING
<110> INSTITUT PASTEUR
<120> MEASLES-VECTORED COVID-19 IMMUNOGENIC COMPOSITIONS AND VACCINES
<130> IP20224174FR
<140> PCTxxxx
<141> 2021-02-12
<150> EP20305141.2
<151> 2020-02-13
<150> US62/976,083
<151> 2020-02-13
<150> EP20305790.6
<151> 2020-07-08
<160> 150
<170> PatentIn version 3.5
<210> 1
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Native nucleotide sequence of the spike (S) polypeptide of nCoV
<400> 1
gctagcggat cccgtacggc caccatgttt gtttttcttg ttttattgcc actagtctct 60
agtcagtgtg ttaatcttac aaccagaact caattacccc ctgcatacac taattctttc 120
acacgtggtg tttattaccc tgacaaagtt ttcagatcct cagttttaca ttcaactcag 180
gacttgttct tacctttctt ttccaatgtt acttggttcc atgctataca tgtctctggg 240
accaatggta ctaagaggtt tgataaccct gtcctaccat ttaatgatgg tgtttatttt 300
gcttccactg agaagtctaa cataataaga ggctggattt ttggtactac tttagattcg 360
aagacccagt ccctacttat tgttaataac gctactaatg ttgttattaa agtctgtgaa 420
tttcaatttt gtaatgatcc atttttgggt gtttattacc acaaaaacaa caaaagttgg 480
atggaaagtg agttcagagt ttattctagt gcgaataatt gcacttttga atatgtctct 540
cagccttttc ttatggacct tgaaggaaaa cagggtaatt tcaaaaatct tagggaattt 600
gtgtttaaga atattgatgg ttattttaaa atatattcta agcacacgcc tattaattta 660
gtgcgtgatc tccctcaggg tttttcggct ttagaaccat tggtagattt gccaataggt 720
attaacatca ctaggtttca aactttactt gctttacata gaagttattt gactcctggt 780
gattcttctt caggttggac agctggtgct gcagcttatt atgtgggtta tcttcaacct 840
aggacttttc tattaaaata taatgaaaat ggaaccatta cagatgctgt agactgtgca 900
cttgaccctc tctcagaaac aaagtgtacg ttgaaatcct tcactgtaga aaaaggaatc 960
tatcaaactt ctaactttag agtccaacca acagaatcta ttgttagatt tcctaatatt 1020
acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc tgtttatgct 1080
tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata taattccgca 1140
tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga tctctgcttt 1200
actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca aatcgctcca 1260
gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt tacaggctgc 1320
gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta taattacctg 1380
tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc aactgaaatc 1440
tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta ctttccttta 1500
caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag agtagtagta 1560
ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa gtctactaat 1620
ttggttaaaa acaaatgtgt caatttcaac ttcaatggtt taacaggcac aggtgttctt 1680
actgagtcta acaaaaagtt tctgcctttc caacaatttg gcagagacat tgctgacact 1740
actgatgctg tccgtgatcc acagacactt gagattcttg acattacacc atgttctttt 1800
ggtggtgtca gtgttataac accaggaaca aatacttcta accaggttgc tgttctttat 1860
caggatgtta actgcacaga agtccctgtt gctattcatg cagatcaact tactcctact 1920
tggcgtgttt attctacagg ttctaatgtt tttcaaacac gtgcaggctg tttaataggg 1980
gctgaacatg tcaacaactc atatgagtgt gacataccca ttggtgcagg tatatgcgct 2040
agttatcaga ctcagactaa ttctcctcgg cgggcacgta gtgtagctag tcaatccatc 2100
attgcctaca ctatgtcact tggtgcagaa aattcagttg cttactctaa taactctatt 2160
gccataccca caaattttac tattagtgtt accacagaaa ttctaccagt gtctatgacc 2220
aagacatcag tagattgtac aatgtacatt tgtggtgatt caactgaatg cagcaatctt 2280
ttgttgcaat atggcagttt ttgtacacaa ttaaaccgtg ctttaactgg aatagctgtt 2340
gaacaagaca aaaacaccca agaagttttt gcacaagtca aacaaattta caaaacacca 2400
ccaattaaag attttggtgg ttttaatttt tcacaaatat taccagatcc atcaaaacca 2460
agcaagaggt catttattga agatctactt ttcaacaaag tgacacttgc agatgctggc 2520
ttcatcaaac aatatggtga ttgccttggt gatattgctg ctagagacct catttgtgca 2580
caaaagttta acggccttac tgttttgcca cctttgctca cagatgaaat gattgctcaa 2640
tacacttctg cactgttagc gggtacaatc acttctggtt ggacctttgg tgcaggtgct 2700
gcattacaaa taccatttgc tatgcaaatg gcttataggt ttaatggtat tggagttaca 2760
cagaatgttc tctatgagaa ccaaaaattg attgccaacc aatttaatag tgctattggc 2820
aaaattcaag actcactttc ttccacagca agtgcacttg gaaaacttca agatgtggtc 2880
aaccaaaatg cacaagcttt aaacacgctt gttaaacaac ttagctccaa ttttggtgca 2940
atttcaagtg ttttaaatga tatcctttca cgtcttgaca aagttgaggc tgaagtgcaa 3000
attgataggt tgatcacagg cagacttcaa agtttgcaga catatgtgac tcaacaatta 3060
attagagctg cagaaatcag agcttctgct aatcttgctg ctactaaaat gtcagagtgt 3120
gtacttggac aatcaaaaag agttgatttt tgtggaaagg gctatcatct tatgtccttc 3180
cctcagtcag cacctcatgg tgtagtcttc ttgcatgtga cttatgtccc tgcacaagaa 3240
aagaacttca caactgctcc tgccatttgt catgatggaa aagcacactt tcctcgtgaa 3300
ggtgtctttg tttcaaatgg cacacactgg tttgtaacac aaaggaattt ttatgaacca 3360
caaatcatta ctacagacaa cacatttgtg tctggtaact gtgatgttgt aataggaatt 3420
gtcaacaaca cagtttatga tcctttgcaa cctgaattag actcattcaa ggaggagtta 3480
gataaatatt ttaagaatca tacatcacca gatgttgatt taggtgacat ctctggcatt 3540
aatgcttcag ttgtaaacat tcaaaaagaa attgaccgcc tcaatgaggt tgccaagaat 3600
ttaaatgaat ctctcatcga tctccaagaa cttggaaagt atgagcagta tataaaatgg 3660
ccatggtaca tttggctagg ttttatagct ggcttgattg ccatagtaat ggtgacaatt 3720
atgctttgct gtatgaccag ttgctgtagt tgtctcaagg gctgttgttc ttgtggatcc 3780
tgctgcaaat ttgatgaaga cgactctgag ccagtgctca aaggagtcaa attacattac 3840
acatgataac gagcgcgcct cgaggaattc 3870
<210> 2
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the spike (S) polypeptide
of nCoV
<400> 2
gctagcggat cccgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700
gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggata aggtggaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 3
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> Spike (S) polypeptide of nCoV
<400> 3
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 4
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of a stabilized form of the
spike (stab-S) polypeptide of nCoV
<400> 4
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700
gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 5
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> Stabilized form of the spike (stab-S) polypeptide of nCoV
<400> 5
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 6
<211> 3680
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the soluble and monomeric
form of the spike (Secto) ectodomain polypeptide of nCoV
<400> 6
actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60
gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120
cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180
ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240
cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300
ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360
tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420
cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480
ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540
gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600
gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660
cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720
cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780
aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840
gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900
tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960
catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020
tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080
cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140
cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200
cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260
cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320
ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380
cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440
aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500
actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560
ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620
caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680
gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740
tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800
cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860
gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920
aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980
tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040
cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100
catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160
cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220
gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280
cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340
cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400
cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460
gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520
cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580
cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640
ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700
tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760
gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820
cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880
ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940
cgccatcagt agcgtgctga acgatatcct gagccgcctg gataaggtgg aagccgaggt 3000
gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060
gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120
atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180
cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240
agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300
cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360
gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420
cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480
actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540
aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600
gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660
gtgataacga gcgcgctact 3680
<210> 7
<211> 1211
<212> PRT
<213> Artificial sequence
<220>
<223> Soluble and monomeric form of the spike (Secto) ectodomain
polypeptide of nCoV
<400> 7
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys
1205 1210
<210> 8
<211> 3680
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the stabilized form of the
spike (stab-Secto) ectodomain polypeptide of nCoV
<400> 8
actagctagc agatctcgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60
gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120
cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180
ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240
cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300
ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360
tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420
cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480
ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540
gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600
gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660
cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720
cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780
aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840
gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900
tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960
catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020
tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080
cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140
cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200
cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260
cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320
ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380
cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440
aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500
actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560
ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620
caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680
gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740
tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800
cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860
gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920
aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980
tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040
cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100
catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160
cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220
gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280
cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340
cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400
cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460
gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520
cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580
cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640
ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700
tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760
gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820
cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880
ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940
cgccatcagt agcgtgctga acgatatcct gagccgcctg gatccaccag aagccgaggt 3000
gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060
gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120
atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180
cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240
agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300
cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360
gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420
cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480
actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540
aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600
gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660
gtgataacga gcgcgctact 3680
<210> 9
<211> 1211
<212> PRT
<213> Artificial sequence
<220>
<223> Stabilized form of the spike (stab-Secto) ectodomain polypeptide
of nCoV
<400> 9
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys
1205 1210
<210> 10
<211> 2090
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S1 polypeptide of nCoV
<400> 10
actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60
gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120
cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180
ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240
cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300
ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360
tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420
cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480
ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540
gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600
gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660
cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720
cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780
aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840
gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900
tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960
catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020
tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080
cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140
cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200
cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260
cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320
ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380
cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440
aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500
actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560
ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620
caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680
gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740
tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800
cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860
gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920
aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980
tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040
cgcctcctat cagacccaga ccaatagtcc atgataacga gcgcgctact 2090
<210> 11
<211> 681
<212> PRT
<213> Artificial sequence
<220>
<223> S1 polypeptide of nCoV
<400> 11
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro
675 680
<210> 12
<211> 1860
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2 polypeptide of nCoV
<400> 12
gctagcggat cccgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcaggccg gcagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 120
gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 180
gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 240
atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 300
cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 360
ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 420
ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 480
ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 540
ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 600
ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 660
attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 720
atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 780
ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 840
gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 900
ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 960
agccgcctgg ataaggtgga agccgaggtg cagatcgatc gcctgattac cggacgcctg 1020
cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 1080
gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 1140
ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 1200
tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 1260
tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 1320
tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 1380
gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 1440
cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 1500
cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 1560
gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 1620
gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 1680
gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 1740
agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 1800
gagccagtgc tgaagggcgt caagctgcac tacacctgat aagcgcgcct cgaggaattc 1860
<210> 13
<211> 604
<212> PRT
<213> Artificial sequence
<220>
<223> S2 polypeptide of nCoV
<400> 13
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Ala Gly
1 5 10 15
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
20 25 30
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
35 40 45
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
50 55 60
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
65 70 75 80
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
85 90 95
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
100 105 110
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
115 120 125
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
130 135 140
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
145 150 155 160
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
165 170 175
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
180 185 190
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
195 200 205
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
210 215 220
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
225 230 235 240
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
245 250 255
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
260 265 270
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
275 280 285
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
290 295 300
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
305 310 315 320
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
325 330 335
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
340 345 350
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
355 360 365
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
370 375 380
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
385 390 395 400
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
405 410 415
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
420 425 430
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
435 440 445
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
450 455 460
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
465 470 475 480
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp
485 490 495
Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
500 505 510
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
515 520 525
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
530 535 540
Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
545 550 555 560
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
565 570 575
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser
580 585 590
Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
595 600
<210> 14
<211> 1860
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the stabilized form of the
S2 (stab-S2) polypeptide of nCoV
<400> 14
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcaggccg gcagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 120
gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 180
gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 240
atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 300
cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 360
ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 420
ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 480
ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 540
ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 600
ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 660
attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 720
atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 780
ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 840
gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 900
ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 960
agccgcctgg atccaccaga agccgaggtg cagatcgatc gcctgattac cggacgcctg 1020
cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 1080
gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 1140
ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 1200
tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 1260
tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 1320
tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 1380
gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 1440
cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 1500
cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 1560
gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 1620
gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 1680
gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 1740
agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 1800
gagccagtgc tgaagggcgt caagctgcac tacacctgat aagcgcgcct cgaggaattc 1860
<210> 15
<211> 604
<212> PRT
<213> Artificial sequence
<220>
<223> Stabilized form of the S2 polypeptide (stab-S2) of nCoV
<400> 15
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Ala Gly
1 5 10 15
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
20 25 30
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
35 40 45
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
50 55 60
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
65 70 75 80
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
85 90 95
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
100 105 110
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
115 120 125
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
130 135 140
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
145 150 155 160
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
165 170 175
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
180 185 190
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
195 200 205
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
210 215 220
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
225 230 235 240
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
245 250 255
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
260 265 270
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
275 280 285
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
290 295 300
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
305 310 315 320
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
325 330 335
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
340 345 350
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
355 360 365
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
370 375 380
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
385 390 395 400
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
405 410 415
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
420 425 430
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
435 440 445
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
450 455 460
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys
465 470 475 480
Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp
485 490 495
Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys
500 505 510
Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu
515 520 525
Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
530 535 540
Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
545 550 555 560
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
565 570 575
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser
580 585 590
Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
595 600
<210> 16
<211> 3772
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the soluble and trimerized
form of the spike (tri-Secto) polypeptide of nCoV
<400> 16
actagctagc ggatcccgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60
gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120
cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180
ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240
cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300
ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360
tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420
cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480
ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540
gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600
gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660
cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720
cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780
aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840
gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900
tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960
catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020
tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080
cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140
cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200
cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260
cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320
ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380
cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440
aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500
actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560
ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620
caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680
gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740
tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800
cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860
gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920
aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980
tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040
cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100
catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160
cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220
gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280
cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340
cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400
cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460
gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520
cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580
cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640
ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700
tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760
gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820
cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880
ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940
cgccatcagt agcgtgctga acgatatcct gagccgcctg gataaggtgg aagccgaggt 3000
gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060
gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120
atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180
cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240
agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300
cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360
gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420
cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480
actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540
aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600
gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660
gtccggaggc tacatccccg aggccccacg cgatggccag gcctacgtgc gcaaggacgg 3720
cgagtgggtg ctgctgtcca ccttcctgtg ataagcgcgc ctcgaggaat tc 3772
<210> 17
<211> 1240
<212> PRT
<213> Artificial sequence
<220>
<223> Soluble and trimerized form of the spike (tri-Secto) polypeptide
of nCoV
<400> 17
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu
1205 1210 1215
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp
1220 1225 1230
Val Leu Leu Ser Thr Phe Leu
1235 1240
<210> 18
<211> 3772
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the stabilized and
trimerized form of the spike ectodomain (tristab-Secto)
polypeptide of nCoV
<400> 18
actagctagc agatctcgta cggccaccat gttcgtgttt ctggtgctgc tgccactggt 60
gtccagtcag tgcgtgaacc tgaccacacg aacacagctg ccaccagcct acaccaatag 120
cttcacccgc ggagtgtact accccgacaa ggtgttccgc agcagcgtgc tgcatagcac 180
ccaggatctg tttctgccct tcttcagcaa cgtgacctgg ttccacgcca tccacgtgtc 240
cggcaccaat ggcaccaagc gcttcgataa tcccgtgctg cccttcaacg atggcgtgta 300
ctttgccagc accgagaagt ccaatatcat ccgcggctgg atcttcggca ccacactgga 360
tagcaagacc cagagcctgc tgatcgtgaa caacgccacc aacgtggtca tcaaagtgtg 420
cgagttccag ttctgcaacg accccttcct gggcgtctac taccacaaga acaacaagag 480
ctggatggaa agcgagttcc gcgtgtacag cagcgccaac aactgcacct tcgagtacgt 540
gtcccagcca ttcctgatgg acctggaagg caagcagggc aacttcaaga acctgcgcga 600
gttcgtgttc aagaacatcg acggctactt caaaatctac agcaagcaca ccccaatcaa 660
cctcgtgcgc gatctgccac agggattcag tgctctggaa cccctggtgg atctgcccat 720
cggcatcaac attacccgct ttcagacact gctggccctg caccgcagtt acttgacacc 780
aggcgatagc agcagtggat ggacagctgg tgccgccgct tactacgttg gatatctgca 840
gccacgcacc tttctgctga agtacaacga gaacggcacc atcaccgacg ccgtggattg 900
tgctctcgat cccctgagcg agacaaagtg caccctgaag tccttcaccg tcgagaaggg 960
catctaccag accagcaatt tccgcgtgca gcccaccgag agcatcgtgc gcttccccaa 1020
tatcaccaat ctgtgcccct tcggcgaggt gttcaatgcc acacgctttg cctccgtgta 1080
cgcctggaat cgcaagcgca ttagcaactg cgtggccgac tactccgtgc tgtacaatag 1140
cgccagcttc agcaccttca agtgctacgg cgtgtcaccc accaagctga acgacctgtg 1200
cttcaccaat gtgtacgccg acagcttcgt gatccgcgga gatgaagtgc gacagattgc 1260
cccaggccag accggcaaga tcgccgacta caattacaag ctgcccgacg acttcaccgg 1320
ctgcgtgatc gcctggaaca gcaacaacct ggattccaaa gtcggcggca actacaacta 1380
cctgtaccgc ctgttccgca agagcaatct gaagcccttc gagcgcgaca tcagcaccga 1440
aatctaccag gccggaagca ccccatgcaa cggcgtggaa ggcttcaact gctacttccc 1500
actgcagtcc tacggatttc agcccacaaa tggcgtgggc taccagccat atcgagtggt 1560
ggtgctgagc ttcgaactgc tgcatgctcc agctaccgtg tgcggcccca agaagagtac 1620
caacctggtc aagaacaaat gcgtgaactt caacttcaac ggcctgaccg gaaccggcgt 1680
gctgaccgag agtaacaaga agttcctgcc attccagcag tttggccgcg acattgccga 1740
tacaaccgat gccgttcgcg atccccagac cttggagatc ctggatatta ccccatgctc 1800
cttcggcggc gtgtccgtga ttacaccagg caccaatacc agcaaccagg tggccgttct 1860
gtaccaggat gtgaattgca cagaggtgcc cgtggccatt cacgccgatc aattgacacc 1920
aacatggcgc gtgtactcca ccggcagcaa tgtgtttcaa acccgcgctg gatgcctgat 1980
tggagccgag cacgtgaaca atagctacga gtgcgatatc cccatcggag ccggaatctg 2040
cgcctcctat cagacccaga ccaatagtcc acgacgagcc cgaagtgtgg ccagccagag 2100
catcattgcc tataccatga gcctgggcgc cgagaatagc gtggcctact ccaacaacag 2160
cattgctatc cccaccaact tcaccatcag cgtgaccacc gagatcctgc cagtgtccat 2220
gaccaagacc agcgtggact gcaccatgta catctgcgga gatagcaccg agtgcagcaa 2280
cctgctgctg cagtacggaa gtttctgcac ccagctgaat cgcgccctga caggcattgc 2340
cgtggaacag gataagaaca cccaagaggt gttcgcccaa gtgaagcaaa tctacaagac 2400
cccaccaatc aaggatttcg gcggcttcaa tttcagccag attctgcccg atccaagcaa 2460
gcccagcaag cgcagcttca tcgaggacct gctgttcaac aaagtgacac tggccgacgc 2520
cggattcatc aagcagtatg gcgattgcct gggcgatatt gccgcacgcg atctgatttg 2580
cgcccagaag tttaacggac tgaccgtcct gccaccactg ctgacagatg agatgatcgc 2640
ccagtacaca agtgccctgc tggccggaac cattaccagc ggatggacat ttggagccgg 2700
tgccgctctg cagattccct tcgctatgca gatggcctac cgcttcaatg gcattggcgt 2760
gacccagaat gtgctgtacg agaaccagaa gctgatcgcc aaccagttca acagcgccat 2820
cggcaagatt caggacagcc tgagtagtac cgccagcgct ctgggaaagc tgcaggatgt 2880
ggtcaaccag aacgctcagg ccctgaacac cctggttaag cagctgagca gcaacttcgg 2940
cgccatcagt agcgtgctga acgatatcct gagccgcctg gatccaccag aagccgaggt 3000
gcagatcgat cgcctgatta ccggacgcct gcagtccctg cagacctatg tgacacagca 3060
gctgatccga gccgccgaga ttcgagctag tgctaatctg gccgccacca agatgagcga 3120
atgtgtgctg ggacagagca agcgcgtgga cttttgcggc aagggatacc acctgatgag 3180
cttcccacag agtgctccac acggcgtggt gtttctgcat gtgacctacg tgcccgctca 3240
agagaagaat ttcaccaccg ctccagccat ctgccacgac ggaaaggccc attttccacg 3300
cgagggcgtg ttcgttagca acggcactca ttggttcgtc acccagcgca acttctacga 3360
gccccagatc atcaccaccg acaacacctt cgtcagcggc aactgcgacg tcgtgatcgg 3420
cattgtgaac aacaccgtgt acgatccact gcagcccgag ctggacagct tcaaagagga 3480
actggacaag tactttaaga accacacaag ccccgacgtg gacctgggag acattagcgg 3540
aatcaacgcc agcgtggtca acatccagaa agagattgac cgcctgaacg aggtggccaa 3600
gaatctgaac gagagcctga tcgacctgca agaactgggc aaatacgagc agtacattaa 3660
gtccggaggc tacatccccg aggccccacg cgatggccag gcctacgtgc gcaaggacgg 3720
cgagtgggtg ctgctgtcca ccttcctgtg ataagcgcgc ctcgaggaat tc 3772
<210> 19
<211> 1240
<212> PRT
<213> Artificial sequence
<220>
<223> Stabilized and trimerized form of the spike ectodomain
(tristab-Secto) polypeptide of nCoV
<400> 19
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu
1205 1210 1215
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp
1220 1225 1230
Val Leu Leu Ser Thr Phe Leu
1235 1240
<210> 20
<211> 1308
<212> DNA
<213> Artificial sequence
<220>
<223> Native nucleotide sequence of the N polypeptide of CoV
<400> 20
gctagcggat cccgtacggc caccatgtct gataatggac cccaaaatca gcgaaatgca 60
ccccgcatta cgtttggtgg accctcagat tcaactggca gtaaccagaa tggagaacgc 120
agtggggcgc gatcaaaaca acgtcggccc caaggtttac ccaataatac tgcgtcttgg 180
ttcaccgctc tcactcaaca tggcaaggaa gaccttaaat tccctcgagg acaaggcgtt 240
ccaattaaca ccaatagcag tccagatgac caaattggct actaccgaag agctaccaga 300
cgaattcgtg gtggtgacgg taaaatgaaa gatctcagtc caagatggta tttctactac 360
ctaggaactg ggccagaagc tggacttccc tatggtgcta acaaagacgg catcatatgg 420
gttgcaactg agggagcctt gaatacacca aaagatcaca ttggcacccg caatcctgct 480
aacaatgctg caatcgtgct acaacttcct caaggaacaa cattgccaaa aggcttctac 540
gcagaaggga gcagaggcgg cagtcaagcc tcttctcgtt cctcatcacg tagtcgcaac 600
agttcaagaa attcaactcc aggcagcagt aggggaactt ctcctgctag aatggctggc 660
aatggcggtg atgctgctct tgctttgctg ctgcttgaca gattgaacca gcttgagagc 720
aaaatgtctg gtaaaggcca acaacaacaa ggccaaactg tcactaagaa atctgctgct 780
gaggcttcta agaagcctcg gcaaaaacgt actgccacta aagcatacaa tgtaacacaa 840
gctttcggca gacgtggtcc agaacaaacc caaggaaatt ttggggacca ggaactaatc 900
agacaaggaa ctgattacaa acattggccg caaattgcac aatttgcccc cagcgcttca 960
gcgttcttcg gaatgtcgcg cattggcatg gaagtcacac cttcgggaac gtggttgacc 1020
tacacaggtg ccatcaaatt ggatgacaaa gatccaaatt tcaaagatca agtcattttg 1080
ctgaataagc atattgacgc atacaaaaca ttcccaccaa cagagcctaa aaaggacaaa 1140
aagaagaagg ctgatgaaac tcaagcctta ccgcagagac agaagaaaca gcaaactgtg 1200
actcttcttc ctgctgcaga tttggatgat ttctccaaac aattgcaaca atccatgagc 1260
agtgctgact caactcaggc ctgataacga gcgcgcctcg aggaattc 1308
<210> 21
<211> 1308
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the N polypeptide of CoV
<400> 21
gctagcggat cccgtacggc caccatgagc gataatggac cccagaatca gcgcaacgcc 60
ccacgcatta ccttcggagg accaagcgat agcaccggca gcaatcagaa tggcgaacga 120
agcggagccc gaagcaaaca gcgacgacca cagggactgc caaacaacac cgccagttgg 180
tttaccgctc tgacccagca cggcaaagag gacctgaagt ttccacgagg acagggcgtg 240
cccatcaaca ccaatagcag cccagacgac cagatcggct actatcgacg agccacacga 300
cgcattcgag gcggcgacgg aaagatgaag gatctgagcc cacgctggta cttctactac 360
ctcggaacag gaccagaggc cggactgcca tatggtgcca acaaggatgg catcatctgg 420
gttgccaccg aaggcgccct gaacacccca aaggatcaca ttggaacccg caatccagcc 480
aacaacgccg ccattgtgct gcagttgcca cagggaacaa cactgcccaa gggattctac 540
gctgagggaa gtcgcggagg aagccaggcc agtagtcgca gtagtagccg cagccgcaat 600
agctcccgaa atagcacacc cggaagcagc cgaggaacca gtccagctcg aatggctgga 660
aatggcggag atgctgctct ggctctgctg ctgctggatc gcctgaatca gctggaaagc 720
aagatgagcg gcaagggcca gcagcaacag ggacagaccg tgacaaagaa gagtgccgcc 780
gaagccagca agaagccacg acagaagcga accgccacca aggcctataa tgtgacccag 840
gcctttggac gacgcggacc agaacagacc cagggcaatt tcggcgatca agagctgatt 900
cgccagggca ccgattacaa gcactggcca cagattgccc agtttgcccc aagcgccagc 960
gccttctttg gaatgagccg catcggaatg gaagtgaccc caagtggaac ctggctgacc 1020
tacacaggcg ccatcaagct ggatgacaag gaccccaact tcaaggacca agtgatcctg 1080
ctgaacaagc acatcgacgc ctacaagacc tttccaccaa ctgagcccaa gaaggacaag 1140
aagaagaagg ccgacgagac acaggctctg ccacagcgcc aaaagaagca gcagaccgtt 1200
acactgctgc cagccgccga cctggatgat ttttccaaac agctgcagca gtccatgagc 1260
agcgccgata gcacacaggc ctgataacga gcgcgcctcg aggaattc 1308
<210> 22
<211> 419
<212> PRT
<213> Artificial sequence
<220>
<223> N polypeptide of CoV
<400> 22
Met Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile Thr
1 5 10 15
Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu Arg
20 25 30
Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn Asn
35 40 45
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp Leu
50 55 60
Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser Pro
65 70 75 80
Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg Gly
85 90 95
Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr Tyr
100 105 110
Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys Asp
115 120 125
Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys Asp
130 135 140
His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu Gln
145 150 155 160
Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly Ser
165 170 175
Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg Asn
180 185 190
Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro Ala
195 200 205
Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu Leu
210 215 220
Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln Gln
225 230 235 240
Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser Lys
245 250 255
Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr Gln
260 265 270
Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly Asp
275 280 285
Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln Ile
290 295 300
Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg Ile
305 310 315 320
Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly Ala
325 330 335
Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile Leu
340 345 350
Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro
355 360 365
Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro Gln
370 375 380
Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu
385 390 395 400
Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp Ser
405 410 415
Thr Gln Ala
<210> 23
<211> 75
<212> PRT
<213> Artificial sequence
<220>
<223> E polypeptide of CoV
<400> 23
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Ser Phe Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Arg Val Pro Asp Leu Leu Val
65 70 75
<210> 24
<211> 222
<212> PRT
<213> Artificial sequence
<220>
<223> M polypeptide of CoV
<400> 24
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile
20 25 30
Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile
35 40 45
Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys
50 55 60
Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile
65 70 75 80
Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe
85 90 95
Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe
100 105 110
Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile
115 120 125
Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile
130 135 140
Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp
145 150 155 160
Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu
165 170 175
Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly
180 185 190
Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr
195 200 205
Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210> 25
<211> 121
<212> PRT
<213> Artificial sequence
<220>
<223> ORF8 polypeptide of CoV
<400> 25
Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala Phe
1 5 10 15
His Gln Glu Cys Ser Leu Gln Ser Cys Thr Gln His Gln Pro Tyr Val
20 25 30
Val Asp Asp Pro Cys Pro Ile His Phe Tyr Ser Lys Trp Tyr Ile Arg
35 40 45
Val Gly Ala Arg Lys Ser Ala Pro Leu Ile Glu Leu Cys Val Asp Glu
50 55 60
Ala Gly Ser Lys Ser Pro Ile Gln Tyr Ile Asp Ile Gly Asn Tyr Thr
65 70 75 80
Val Ser Cys Leu Pro Phe Thr Ile Asn Cys Gln Glu Pro Lys Leu Gly
85 90 95
Ser Leu Val Val Arg Cys Ser Phe Tyr Glu Asp Phe Leu Glu Tyr His
100 105 110
Asp Val Arg Val Val Leu Asp Phe Ile
115 120
<210> 26
<211> 275
<212> PRT
<213> Artificial sequence
<220>
<223> ORF3a polypeptide of CoV
<400> 26
Met Asp Leu Phe Met Arg Ile Phe Thr Ile Gly Thr Val Thr Leu Lys
1 5 10 15
Gln Gly Glu Ile Lys Asp Ala Thr Pro Ser Asp Phe Val Arg Ala Thr
20 25 30
Ala Thr Ile Pro Ile Gln Ala Ser Leu Pro Phe Gly Trp Leu Ile Val
35 40 45
Gly Val Ala Leu Leu Ala Val Phe Gln Ser Ala Ser Lys Ile Ile Thr
50 55 60
Leu Lys Lys Arg Trp Gln Leu Ala Leu Ser Lys Gly Val His Phe Val
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Val Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Leu Glu Ala Pro Phe Leu Tyr Leu Tyr Ala Leu Val
100 105 110
Tyr Phe Leu Gln Ser Ile Asn Phe Val Arg Ile Ile Met Arg Leu Trp
115 120 125
Leu Cys Trp Lys Cys Arg Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Leu Cys Trp His Thr Asn Cys Tyr Asp Tyr Cys Ile Pro Tyr
145 150 155 160
Asn Ser Val Thr Ser Ser Ile Val Ile Thr Ser Gly Asp Gly Thr Thr
165 170 175
Ser Pro Ile Ser Glu His Asp Tyr Gln Ile Gly Gly Tyr Thr Glu Lys
180 185 190
Trp Glu Ser Gly Val Lys Asp Cys Val Val Leu His Ser Tyr Phe Thr
195 200 205
Ser Asp Tyr Tyr Gln Leu Tyr Ser Thr Gln Leu Ser Thr Asp Thr Gly
210 215 220
Val Glu His Val Thr Phe Phe Ile Tyr Asn Lys Ile Val Asp Glu Pro
225 230 235 240
Glu Glu His Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Val
245 250 255
Asn Pro Val Met Glu Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser
260 265 270
Val Pro Leu
275
<210> 27
<211> 121
<212> PRT
<213> Artificial sequence
<220>
<223> ORF7a polypeptide of CoV
<400> 27
Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Ser Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Phe Ser Thr Gln Phe Ala
50 55 60
Phe Ala Cys Pro Asp Gly Val Lys His Val Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Glu Leu
85 90 95
Tyr Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu
100 105 110
Cys Phe Thr Leu Lys Arg Lys Thr Glu
115 120
<210> 28
<211> 18967
<212> DNA
<213> Artificial sequence
<220>
<223> pTM-MVSchw
<400> 28
gcggccgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480
aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540
gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600
gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660
gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720
ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780
gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840
aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900
gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960
ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020
aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080
ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140
aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200
aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260
tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320
aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380
aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440
gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500
gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560
ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620
ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680
gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740
cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800
cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860
tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920
acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980
acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040
ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100
gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160
aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220
aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280
aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340
accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400
cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460
cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520
gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580
actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640
ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700
agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760
agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820
gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880
gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940
cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000
ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060
tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120
ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180
gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240
gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300
tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360
agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420
gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480
tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540
tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600
gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660
ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720
ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780
cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840
caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900
ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960
ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020
catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080
atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140
cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200
aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260
cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320
taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380
ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440
ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500
tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560
tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620
acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680
gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740
agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800
atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860
ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920
ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980
taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040
gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100
gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160
tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220
ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280
atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340
caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400
acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460
cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520
tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580
acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640
gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700
atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760
tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820
caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880
tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940
atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000
cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060
gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120
ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180
gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240
gacatcaggc atacccacta gtgtgaaata gacatcagaa ttaagaaaaa cgtagggtcc 9300
aagtggttcc ccgttatgga ctcgctatct gtcaaccaga tcttataccc tgaagttcac 9360
ctagatagcc cgatagttac caataagata gtagccatcc tggagtatgc tcgagtccct 9420
cacgcttaca gcctggagga ccctacactg tgtcagaaca tcaagcaccg cctaaaaaac 9480
ggattttcca accaaatgat tataaacaat gtggaagttg ggaatgtcat caagtccaag 9540
cttaggagtt atccggccca ctctcatatt ccatatccaa attgtaatca ggatttattt 9600
aacatagaag acaaagagtc aacgaggaag atccgtgaac tcctcaaaaa ggggaattcg 9660
ctgtactcca aagtcagtga taaggttttc caatgcttaa gggacactaa ctcacggctt 9720
ggcctaggct ccgaattgag ggaggacatc aaggagaaag ttattaactt gggagtttac 9780
atgcacagct cccagtggtt tgagcccttt ctgttttggt ttacagtcaa gactgagatg 9840
aggtcagtga ttaaatcaca aacccatact tgccatagga ggagacacac acctgtattc 9900
ttcactggta gttcagttga gttgctaatc tctcgtgacc ttgttgctat aatcagtaaa 9960
gagtctcaac atgtatatta cctgacattt gaactggttt tgatgtattg tgatgtcata 10020
gaggggaggt taatgacaga gaccgctatg actattgatg ctaggtatac agagcttcta 10080
ggaagagtca gatacatgtg gaaactgata gatggtttct tccctgcact cgggaatcca 10140
acttatcaaa ttgtagccat gctggagcct ctttcacttg cttacctgca gctgagggat 10200
ataacagtag aactcagagg tgctttcctt aaccactgct ttactgaaat acatgatgtt 10260
cttgaccaaa acgggttttc tgatgaaggt acttatcatg agttaactga agctctagat 10320
tacattttca taactgatga catacatctg acaggggaga ttttctcatt tttcagaagt 10380
ttcggccacc ccagacttga agcagtaacg gctgctgaaa atgttaggaa atacatgaat 10440
cagcctaaag tcattgtgta tgagactctg atgaaaggtc atgccatatt ttgtggaatc 10500
ataatcaacg gctatcgtga caggcacgga ggcagttggc caccgctgac cctccccctg 10560
catgctgcag acacaatccg gaatgctcaa gcttcaggtg aagggttaac acatgagcag 10620
tgcgttgata actggaaatc ttttgctgga gtgaaatttg gctgctttat gcctcttagc 10680
ctggatagtg atctgacaat gtacctaaag gacaaggcac ttgctgctct ccaaagggaa 10740
tgggattcag tttacccgaa agagttcctg cgttacgacc ctcccaaggg aaccgggtca 10800
cggaggcttg tagatgtttt ccttaatgat tcgagctttg acccatatga tgtgataatg 10860
tatgttgtaa gtggagctta cctccatgac cctgagttca acctgtctta cagcctgaaa 10920
gaaaaggaga tcaaggaaac aggtagactt tttgctaaaa tgacttacaa aatgagggca 10980
tgccaagtga ttgctgaaaa tctaatctca aacgggattg gcaaatattt taaggacaat 11040
gggatggcca aggatgagca cgatttgact aaggcactcc acactctagc tgtctcagga 11100
gtccccaaag atctcaaaga aagtcacagg ggggggccag tcttaaaaac ctactcccga 11160
agcccagtcc acacaagtac caggaacgtg agagcagcaa aagggtttat agggttccct 11220
caagtaattc ggcaggacca agacactgat catccggaga atatggaagc ttacgagaca 11280
gtcagtgcat ttatcacgac tgatctcaag aagtactgcc ttaattggag atatgagacc 11340
atcagcttgt ttgcacagag gctaaatgag atttacggat tgccctcatt tttccagtgg 11400
ctgcataaga ggcttgagac ctctgtcctg tatgtaagtg accctcattg cccccccgac 11460
cttgacgccc atatcccgtt atataaagtc cccaatgatc aaatcttcat taagtaccct 11520
atgggaggta tagaagggta ttgtcagaag ctgtggacca tcagcaccat tccctatcta 11580
tacctggctg cttatgagag cggagtaagg attgcttcgt tagtgcaagg ggacaatcag 11640
accatagccg taacaaaaag ggtacccagc acatggccct acaaccttaa gaaacgggaa 11700
gctgctagag taactagaga ttactttgta attcttaggc aaaggctaca tgatattggc 11760
catcacctca aggcaaatga gacaattgtt tcatcacatt tttttgtcta ttcaaaagga 11820
atatattatg atgggctact tgtgtcccaa tcactcaaga gcatcgcaag atgtgtattc 11880
tggtcagaga ctatagttga tgaaacaagg gcagcatgca gtaatattgc tacaacaatg 11940
gctaaaagca tcgagagagg ttatgaccgt taccttgcat attccctgaa cgtcctaaaa 12000
gtgatacagc aaattctgat ctctcttggc ttcacaatca attcaaccat gacccgggat 12060
gtagtcatac ccctcctcac aaacaacgac ctcttaataa ggatggcact gttgcccgct 12120
cctattgggg ggatgaatta tctgaatatg agcaggctgt ttgtcagaaa catcggtgat 12180
ccagtaacat catcaattgc tgatctcaag agaatgattc tcgcctcact aatgcctgaa 12240
gagaccctcc atcaagtaat gacacaacaa ccgggggact cttcattcct agactgggct 12300
agcgaccctt actcagcaaa tcttgtatgt gtccagagca tcactagact cctcaagaac 12360
ataactgcaa ggtttgtcct gatccatagt ccaaacccaa tgttaaaagg attattccat 12420
gatgacagta aagaagagga cgagggactg gcggcattcc tcatggacag gcatattata 12480
gtacctaggg cagctcatga aatcctggat catagtgtca caggggcaag agagtctatt 12540
gcaggcatgc tggataccac aaaaggcttg attcgagcca gcatgaggaa gggggggtta 12600
acctctcgag tgataaccag attgtccaat tatgactatg aacaattcag agcagggatg 12660
gtgctattga caggaagaaa gagaaatgtc ctcattgaca aagagtcatg ttcagtgcag 12720
ctggcgagag ctctaagaag ccatatgtgg gcgaggctag ctcgaggacg gcctatttac 12780
ggccttgagg tccctgatgt actagaatct atgcgaggcc accttattcg gcgtcatgag 12840
acatgtgtca tctgcgagtg tggatcagtc aactacggat ggttttttgt cccctcgggt 12900
tgccaactgg atgatattga caaggaaaca tcatccttga gagtcccata tattggttct 12960
accactgatg agagaacaga catgaagctt gccttcgtaa gagccccaag tcgatccttg 13020
cgatctgctg ttagaatagc aacagtgtac tcatgggctt acggtgatga tgatagctct 13080
tggaacgaag cctggttgtt ggctaggcaa agggccaatg tgagcctgga ggagctaagg 13140
gtgatcactc ccatctcaac ttcgactaat ttagcgcata ggttgaggga tcgtagcact 13200
caagtgaaat actcaggtac atcccttgtc cgagtggcga ggtataccac aatctccaac 13260
gacaatctct catttgtcat atcagataag aaggttgata ctaactttat ataccaacaa 13320
ggaatgcttc tagggttggg tgttttagaa acattgtttc gactcgagaa agataccgga 13380
tcatctaaca cggtattaca tcttcacgtc gaaacagatt gttgcgtgat cccgatgata 13440
gatcatccca ggatacccag ctcccgcaag ctagagctga gggcagagct atgtaccaac 13500
ccattgatat atgataatgc acctttaatt gacagagatg caacaaggct atacacccag 13560
agccatagga ggcaccttgt ggaatttgtt acatggtcca caccccaact atatcacatt 13620
ttagctaagt ccacagcact atctatgatt gacctggtaa caaaatttga gaaggaccat 13680
atgaatgaaa tttcagctct cataggggat gacgatatca atagtttcat aactgagttt 13740
ctgctcatag agccaagatt attcactatc tacttgggcc agtgtgcggc catcaattgg 13800
gcatttgatg tacattatca tagaccatca gggaaatatc agatgggtga gctgttgtca 13860
tcgttccttt ctagaatgag caaaggagtg tttaaggtgc ttgtcaatgc tctaagccac 13920
ccaaagatct acaagaaatt ctggcattgt ggtattatag agcctatcca tggtccttca 13980
cttgatgctc aaaacttgca cacaactgtg tgcaacatgg tttacacatg ctatatgacc 14040
tacctcgacc tgttgttgaa tgaagagtta gaagagttca catttctctt gtgtgaaagc 14100
gacgaggatg tagtaccgga cagattcgac aacatccagg caaaacactt atgtgttctg 14160
gcagatttgt actgtcaacc agggacctgc ccaccaattc gaggtctaag accggtagag 14220
aaatgtgcag ttctaaccga ccatatcaag gcagaggcta tgttatctcc agcaggatct 14280
tcgtggaaca taaatccaat tattgtagac cattactcat gctctctgac ttatctccgg 14340
cgaggatcga tcaaacagat aagattgaga gttgatccag gattcatttt cgacgccctc 14400
gctgaggtaa atgtcagtca gccaaagatc ggcagcaaca acatctcaaa tatgagcatc 14460
aaggctttca gacccccaca cgatgatgtt gcaaaattgc tcaaagatat caacacaagc 14520
aagcacaatc ttcccatttc agggggcaat ctcgccaatt atgaaatcca tgctttccgc 14580
agaatcgggt tgaactcatc tgcttgctac aaagctgttg agatatcaac attaattagg 14640
agatgccttg agccagggga ggacggcttg ttcttgggtg agggatcggg ttctatgttg 14700
atcacttata aagagatact taaactaaac aagtgcttct ataatagtgg ggtttccgcc 14760
aattctagat ctggtcaaag ggaattagca ccctatccct ccgaagttgg ccttgtcgaa 14820
cacagaatgg gagtaggtaa tattgtcaaa gtgctcttta acgggaggcc cgaagtcacg 14880
tgggtaggca gtgtagattg cttcaatttc atagttagta atatccctac ctctagtgtg 14940
gggtttatcc attcagatat agagaccttg cctgacaaag atactataga gaagctagag 15000
gaattggcag ccatcttatc gatggctctg ctcctgggca aaataggatc aatactggtg 15060
attaagctta tgcctttcag cggggatttt gttcagggat ttataagtta tgtagggtct 15120
cattatagag aagtgaacct tgtataccct agatacagca acttcatctc tactgaatct 15180
tatttggtta tgacagatct caaggctaac cggctaatga atcctgaaaa gattaagcag 15240
cagataattg aatcatctgt gaggacttca cctggactta taggtcacat cctatccatt 15300
aagcaactaa gctgcataca agcaattgtg ggagacgcag ttagtagagg tgatatcaat 15360
cctactctga aaaaacttac acctatagag caggtgctga tcaattgcgg gttggcaatt 15420
aacggaccta agctgtgcaa agaattgatc caccatgatg ttgcctcagg gcaagatgga 15480
ttgcttaatt ctatactcat cctctacagg gagttggcaa gattcaaaga caaccaaaga 15540
agtcaacaag ggatgttcca cgcttacccc gtattggtaa gtagcaggca acgagaactt 15600
atatctagga tcacccgcaa attctggggg cacattcttc tttactccgg gaacaaaaag 15660
ttgataaata agtttatcca gaatctcaag tccggctatc tgatactaga cttacaccag 15720
aatatcttcg ttaagaatct atccaagtca gagaaacaga ttattatgac ggggggtttg 15780
aaacgtgagt gggtttttaa ggtaacagtc aaggagacca aagaatggta taagttagtc 15840
ggatacagtg ccctgattaa ggactaattg gttgaactcc ggaaccctaa tcctgcccta 15900
ggtggttagg cattatttgc aatatattaa agaaaacttt gaaaatacga agtttctatt 15960
cccagctttg tctggtggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac 16020
attccgaggg gaccgtcccc tcggtaatgg cgaatgggac gcggccgatc cggctgctaa 16080
caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac tagcataacc 16140
ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa ctatatccgg 16200
atgcggccgc gggccctatg gtacccagct tttgttccct ttagtgaggg ttaattccga 16260
gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc 16320
cacacaacat aggagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgaggt 16380
aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc 16440
agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt 16500
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 16560
ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 16620
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 16680
tccataggct cggcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 16740
gaaacccgac aggactataa agataccagg cgttcccccc tggaagctcc ctcgtgcgct 16800
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 16860
tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 16920
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 16980
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 17040
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 17100
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 17160
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 17220
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 17280
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 17340
tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 17400
caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 17460
cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactg cccgtcgtgt 17520
agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 17580
acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 17640
gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 17700
ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 17760
tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 17820
ggcgagttac atgatccccc atgttgtgaa aaaaagcggt tagctccttc ggtcctccga 17880
tcgttgtcag aagtaagttg gccgcagtgt tatcactcat gcttatggca gcactgcata 17940
attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 18000
agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 18060
ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 18120
ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 18180
cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 18240
gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 18300
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 18360
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 18420
tgccacctga aattgtaaac gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa 18480
tcagctcatt ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat 18540
agaccgagat agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg 18600
tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac 18660
catcacccta atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta 18720
aagggagccc ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag 18780
ggaagaaagc gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg 18840
taaccaccac acccgccgcg cttaatgcgc cgctacaggg cgcgtcccat tcgccattca 18900
ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagccac 18960
cgcggtg 18967
<210> 29
<211> 19795
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-MVSchw-gfp
<400> 29
gcggccgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480
aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac gatggtgagc 3540
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 3600
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 3660
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 3720
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 3780
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 3840
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 3900
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 3960
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4020
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4080
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 4140
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 4200
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta ggcgcgcagc 4260
gcttagacgt ctcgcgatcg atactagtac aacctaaatc cattataaaa aacttaggag 4320
caaagtgatt gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca 4380
tgggacatca aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg 4440
gtgccccagg tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg 4500
tacatgtttc tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga 4560
gcatttgggt tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc 4620
aaagaggcca ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg 4680
gtgttctaca acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca 4740
gggagtgtct tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc 4800
ccgcagaggt tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac 4860
accgttccta gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg 4920
gtgaccctta ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa 4980
cttcctgagg caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc 5040
tactctgccg attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt 5100
gggatagggg gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat 5160
gcacaactcg ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt 5220
aatcgattac tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca 5280
tcagttcctc aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta 5340
ttcaaagttc tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga 5400
cagccagaag gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg 5460
ccagccagca gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga 5520
cacaaggcca ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa 5580
cccccaaggc tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa 5640
acccccagca attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa 5700
ccgcacaagc gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc 5760
tccccggcaa actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga 5820
ccccggccca cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc 5880
ccgccggctc ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc 5940
aaccatcgac aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag 6000
ccagcaccgc gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc 6060
agaccaccct gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca 6120
caacccgcgc accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa 6180
gagcgatccc cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa 6240
gtcccccggt ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga 6300
cactcaactc cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat 6360
gtccatcatg ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct 6420
ccaaacaccc accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat 6480
aggaagtgca agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt 6540
aatgcccaat ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag 6600
actactgaga acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat 6660
aagaccggtt cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct 6720
ggcaggtgcg gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca 6780
ccagtccatg ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa 6840
tcaggcaatt gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt 6900
ccaagactac atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat 6960
cggccagaag ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg 7020
ccccagttta cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct 7080
tggaggagac atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg 7140
catcttagag agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt 7200
cattgtcctc agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg 7260
gctagagggg gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta 7320
tgttgcaacc caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc 7380
agaggggact gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg 7440
cctccggggg tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg 7500
gttcatttta tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta 7560
cacaacagga acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga 7620
tcactgcccg gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc 7680
agacgctgtg tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga 7740
cgtagggaca aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga 7800
gtcatcggac cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat 7860
cctgattgca gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag 7920
ggggcgttgt aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga 7980
tcttacggga acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac 8040
acaaatgtcc cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc 8100
cacctgaaat tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt 8160
agggtgcaag atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag 8220
ataaccccca tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata 8280
gaccttatgt tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag 8340
ccattgcagg cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc 8400
tcagcaccaa tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac 8460
cactcttcaa aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc 8520
tagtgaaatt aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca 8580
gagatctcac ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact 8640
gtgcagatgt ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga 8700
ccagaacaac caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa 8760
tcagaggtca attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt 8820
acaatgtgtc atctatagtc actatgacat cccagggaat gtatggggga acttacctag 8880
tggaaaagcc taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag 8940
tgtttgaagt aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa 9000
actatcttga gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc 9060
tcaaactcgc agccctttgt cacggggaag attctatcac aattccctat cagggatcag 9120
ggaaaggtgt cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc 9180
aatcctgggt ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc 9240
acagaggtgt tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg 9300
acaagttgcg aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct 9360
gcgagaatcc cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt 9420
ctgttgatct gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat 9480
tgatcacaca cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc 9540
tgactatccc gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac 9600
cgagattcaa ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact 9660
gccatgcccc aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc 9720
tggtgattct acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg 9780
ttgaacatgc tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc 9840
cttttaggtt gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg 9900
accaaaaact ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata 9960
tcactcactc tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa 10020
ccaatcgcag atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat 10080
acccactagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140
gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200
atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260
ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320
caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380
ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440
aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500
gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560
gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620
cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680
aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740
tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800
gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860
atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920
tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980
gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040
ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100
gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160
actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220
agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280
attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340
tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400
acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460
tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520
ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580
tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640
gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700
ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760
aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820
gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880
gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940
ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000
acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060
caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120
atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180
gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240
cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300
atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360
gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420
tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480
acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540
actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600
gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660
gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720
atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780
gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840
attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900
ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960
atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020
tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080
caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140
tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200
tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260
gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320
gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380
gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440
ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500
ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560
ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620
cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680
tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740
gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800
agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860
agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920
tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980
atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040
tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100
tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160
gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220
gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280
atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340
gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400
caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460
acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520
tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580
ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640
cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700
agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760
aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820
aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880
ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940
gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000
tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060
ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120
aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180
aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240
gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300
cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360
cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420
aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480
ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540
gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600
ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660
gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720
gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780
tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840
atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900
cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960
gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020
acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080
tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140
tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200
aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260
ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320
atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380
atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440
acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500
tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560
aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620
gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680
ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740
ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800
tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860
ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920
ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980
taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcgg 17040
gccctatggt acccagcttt tgttcccttt agtgagggtt aattccgagc ttggcgtaat 17100
catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatag 17160
gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa 17220
ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 17280
gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc 17340
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 17400
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 17460
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcg 17520
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 17580
gactataaag ataccaggcg ttcccccctg gaagctccct cgtgcgctct cctgttccga 17640
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 17700
aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 17760
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 17820
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 17880
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 17940
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 18000
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 18060
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 18120
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 18180
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 18240
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 18300
cgatctgtct atttcgttca tccatagttg cctgactgcc cgtcgtgtag ataactacga 18360
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 18420
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 18480
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 18540
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 18600
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 18660
gatcccccat gttgtgaaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 18720
gtaagttggc cgcagtgtta tcactcatgc ttatggcagc actgcataat tctcttactg 18780
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 18840
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 18900
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 18960
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 19020
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 19080
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 19140
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 19200
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgaaa 19260
ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 19320
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 19380
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 19440
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcaccctaat 19500
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 19560
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 19620
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 19680
ccgccgcgct taatgcgccg ctacagggcg cgtcccattc gccattcagg ctgcgcaact 19740
gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagccaccg cggtg 19795
<210> 30
<211> 17858
<212> DNA
<213> Artificial sequence
<220>
<223> pKP-MVSchw
<400> 30
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480
aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540
gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600
gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660
gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720
ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780
gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840
aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900
gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960
ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020
aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080
ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140
aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200
aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260
tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320
aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380
aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440
gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500
gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560
ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620
ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680
gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740
cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800
cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860
tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920
acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980
acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040
ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100
gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160
aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220
aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280
aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340
accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400
cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460
cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520
gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580
actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640
ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700
agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760
agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820
gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880
gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940
cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000
ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060
tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120
ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180
gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240
gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300
tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360
agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420
gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480
tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540
tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600
gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660
ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720
ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780
cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840
caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900
ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960
ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020
catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080
atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140
cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200
aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260
cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320
taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380
ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440
ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500
tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560
tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620
acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680
gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740
agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800
atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860
ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920
ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980
taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040
gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100
gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160
tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220
ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280
atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340
caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400
acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460
cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520
tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580
acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640
gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700
atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760
tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820
caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880
tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940
atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000
cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060
gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120
ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180
gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240
gacatcaggc atacccacta gtgtgaaata gacatcagaa ttaagaaaaa cgtagggtcc 9300
aagtggttcc ccgttatgga ctcgctatct gtcaaccaga tcttataccc tgaagttcac 9360
ctagatagcc cgatagttac caataagata gtagccatcc tggagtatgc tcgagtccct 9420
cacgcttaca gcctggagga ccctacactg tgtcagaaca tcaagcaccg cctaaaaaac 9480
ggattttcca accaaatgat tataaacaat gtggaagttg ggaatgtcat caagtccaag 9540
cttaggagtt atccggccca ctctcatatt ccatatccaa attgtaatca ggatttattt 9600
aacatagaag acaaagagtc aacgaggaag atccgtgaac tcctcaaaaa ggggaattcg 9660
ctgtactcca aagtcagtga taaggttttc caatgcttaa gggacactaa ctcacggctt 9720
ggcctaggct ccgaattgag ggaggacatc aaggagaaag ttattaactt gggagtttac 9780
atgcacagct cccagtggtt tgagcccttt ctgttttggt ttacagtcaa gactgagatg 9840
aggtcagtga ttaaatcaca aacccatact tgccatagga ggagacacac acctgtattc 9900
ttcactggta gttcagttga gttgctaatc tctcgtgacc ttgttgctat aatcagtaaa 9960
gagtctcaac atgtatatta cctgacattt gaactggttt tgatgtattg tgatgtcata 10020
gaggggaggt taatgacaga gaccgctatg actattgatg ctaggtatac agagcttcta 10080
ggaagagtca gatacatgtg gaaactgata gatggtttct tccctgcact cgggaatcca 10140
acttatcaaa ttgtagccat gctggagcct ctttcacttg cttacctgca gctgagggat 10200
ataacagtag aactcagagg tgctttcctt aaccactgct ttactgaaat acatgatgtt 10260
cttgaccaaa acgggttttc tgatgaaggt acttatcatg agttaactga agctctagat 10320
tacattttca taactgatga catacatctg acaggggaga ttttctcatt tttcagaagt 10380
ttcggccacc ccagacttga agcagtaacg gctgctgaaa atgttaggaa atacatgaat 10440
cagcctaaag tcattgtgta tgagactctg atgaaaggtc atgccatatt ttgtggaatc 10500
ataatcaacg gctatcgtga caggcacgga ggcagttggc caccgctgac cctccccctg 10560
catgctgcag acacaatccg gaatgctcaa gcttcaggtg aagggttaac acatgagcag 10620
tgcgttgata actggaaatc ttttgctgga gtgaaatttg gctgctttat gcctcttagc 10680
ctggatagtg atctgacaat gtacctaaag gacaaggcac ttgctgctct ccaaagggaa 10740
tgggattcag tttacccgaa agagttcctg cgttacgacc ctcccaaggg aaccgggtca 10800
cggaggcttg tagatgtttt ccttaatgat tcgagctttg acccatatga tgtgataatg 10860
tatgttgtaa gtggagctta cctccatgac cctgagttca acctgtctta cagcctgaaa 10920
gaaaaggaga tcaaggaaac aggtagactt tttgctaaaa tgacttacaa aatgagggca 10980
tgccaagtga ttgctgaaaa tctaatctca aacgggattg gcaaatattt taaggacaat 11040
gggatggcca aggatgagca cgatttgact aaggcactcc acactctagc tgtctcagga 11100
gtccccaaag atctcaaaga aagtcacagg ggggggccag tcttaaaaac ctactcccga 11160
agcccagtcc acacaagtac caggaacgtg agagcagcaa aagggtttat agggttccct 11220
caagtaattc ggcaggacca agacactgat catccggaga atatggaagc ttacgagaca 11280
gtcagtgcat ttatcacgac tgatctcaag aagtactgcc ttaattggag atatgagacc 11340
atcagcttgt ttgcacagag gctaaatgag atttacggat tgccctcatt tttccagtgg 11400
ctgcataaga ggcttgagac ctctgtcctg tatgtaagtg accctcattg cccccccgac 11460
cttgacgccc atatcccgtt atataaagtc cccaatgatc aaatcttcat taagtaccct 11520
atgggaggta tagaagggta ttgtcagaag ctgtggacca tcagcaccat tccctatcta 11580
tacctggctg cttatgagag cggagtaagg attgcttcgt tagtgcaagg ggacaatcag 11640
accatagccg taacaaaaag ggtacccagc acatggccct acaaccttaa gaaacgggaa 11700
gctgctagag taactagaga ttactttgta attcttaggc aaaggctaca tgatattggc 11760
catcacctca aggcaaatga gacaattgtt tcatcacatt tttttgtcta ttcaaaagga 11820
atatattatg atgggctact tgtgtcccaa tcactcaaga gcatcgcaag atgtgtattc 11880
tggtcagaga ctatagttga tgaaacaagg gcagcatgca gtaatattgc tacaacaatg 11940
gctaaaagca tcgagagagg ttatgaccgt taccttgcat attccctgaa cgtcctaaaa 12000
gtgatacagc aaattctgat ctctcttggc ttcacaatca attcaaccat gacccgggat 12060
gtagtcatac ccctcctcac aaacaacgac ctcttaataa ggatggcact gttgcccgct 12120
cctattgggg ggatgaatta tctgaatatg agcaggctgt ttgtcagaaa catcggtgat 12180
ccagtaacat catcaattgc tgatctcaag agaatgattc tcgcctcact aatgcctgaa 12240
gagaccctcc atcaagtaat gacacaacaa ccgggggact cttcattcct agactgggct 12300
agcgaccctt actcagcaaa tcttgtatgt gtccagagca tcactagact cctcaagaac 12360
ataactgcaa ggtttgtcct gatccatagt ccaaacccaa tgttaaaagg attattccat 12420
gatgacagta aagaagagga cgagggactg gcggcattcc tcatggacag gcatattata 12480
gtacctaggg cagctcatga aatcctggat catagtgtca caggggcaag agagtctatt 12540
gcaggcatgc tggataccac aaaaggcttg attcgagcca gcatgaggaa gggggggtta 12600
acctctcgag tgataaccag attgtccaat tatgactatg aacaattcag agcagggatg 12660
gtgctattga caggaagaaa gagaaatgtc ctcattgaca aagagtcatg ttcagtgcag 12720
ctggcgagag ctctaagaag ccatatgtgg gcgaggctag ctcgaggacg gcctatttac 12780
ggccttgagg tccctgatgt actagaatct atgcgaggcc accttattcg gcgtcatgag 12840
acatgtgtca tctgcgagtg tggatcagtc aactacggat ggttttttgt cccctcgggt 12900
tgccaactgg atgatattga caaggaaaca tcatccttga gagtcccata tattggttct 12960
accactgatg agagaacaga catgaagctt gccttcgtaa gagccccaag tcgatccttg 13020
cgatctgctg ttagaatagc aacagtgtac tcatgggctt acggtgatga tgatagctct 13080
tggaacgaag cctggttgtt ggctaggcaa agggccaatg tgagcctgga ggagctaagg 13140
gtgatcactc ccatctcaac ttcgactaat ttagcgcata ggttgaggga tcgtagcact 13200
caagtgaaat actcaggtac atcccttgtc cgagtggcga ggtataccac aatctccaac 13260
gacaatctct catttgtcat atcagataag aaggttgata ctaactttat ataccaacaa 13320
ggaatgcttc tagggttggg tgttttagaa acattgtttc gactcgagaa agataccgga 13380
tcatctaaca cggtattaca tcttcacgtc gaaacagatt gttgcgtgat cccgatgata 13440
gatcatccca ggatacccag ctcccgcaag ctagagctga gggcagagct atgtaccaac 13500
ccattgatat atgataatgc acctttaatt gacagagatg caacaaggct atacacccag 13560
agccatagga ggcaccttgt ggaatttgtt acatggtcca caccccaact atatcacatt 13620
ttagctaagt ccacagcact atctatgatt gacctggtaa caaaatttga gaaggaccat 13680
atgaatgaaa tttcagctct cataggggat gacgatatca atagtttcat aactgagttt 13740
ctgctcatag agccaagatt attcactatc tacttgggcc agtgtgcggc catcaattgg 13800
gcatttgatg tacattatca tagaccatca gggaaatatc agatgggtga gctgttgtca 13860
tcgttccttt ctagaatgag caaaggagtg tttaaggtgc ttgtcaatgc tctaagccac 13920
ccaaagatct acaagaaatt ctggcattgt ggtattatag agcctatcca tggtccttca 13980
cttgatgctc aaaacttgca cacaactgtg tgcaacatgg tttacacatg ctatatgacc 14040
tacctcgacc tgttgttgaa tgaagagtta gaagagttca catttctctt gtgtgaaagc 14100
gacgaggatg tagtaccgga cagattcgac aacatccagg caaaacactt atgtgttctg 14160
gcagatttgt actgtcaacc agggacctgc ccaccaattc gaggtctaag accggtagag 14220
aaatgtgcag ttctaaccga ccatatcaag gcagaggcta tgttatctcc agcaggatct 14280
tcgtggaaca taaatccaat tattgtagac cattactcat gctctctgac ttatctccgg 14340
cgaggatcga tcaaacagat aagattgaga gttgatccag gattcatttt cgacgccctc 14400
gctgaggtaa atgtcagtca gccaaagatc ggcagcaaca acatctcaaa tatgagcatc 14460
aaggctttca gacccccaca cgatgatgtt gcaaaattgc tcaaagatat caacacaagc 14520
aagcacaatc ttcccatttc agggggcaat ctcgccaatt atgaaatcca tgctttccgc 14580
agaatcgggt tgaactcatc tgcttgctac aaagctgttg agatatcaac attaattagg 14640
agatgccttg agccagggga ggacggcttg ttcttgggtg agggatcggg ttctatgttg 14700
atcacttata aagagatact taaactaaac aagtgcttct ataatagtgg ggtttccgcc 14760
aattctagat ctggtcaaag ggaattagca ccctatccct ccgaagttgg ccttgtcgaa 14820
cacagaatgg gagtaggtaa tattgtcaaa gtgctcttta acgggaggcc cgaagtcacg 14880
tgggtaggca gtgtagattg cttcaatttc atagttagta atatccctac ctctagtgtg 14940
gggtttatcc attcagatat agagaccttg cctgacaaag atactataga gaagctagag 15000
gaattggcag ccatcttatc gatggctctg ctcctgggca aaataggatc aatactggtg 15060
attaagctta tgcctttcag cggggatttt gttcagggat ttataagtta tgtagggtct 15120
cattatagag aagtgaacct tgtataccct agatacagca acttcatctc tactgaatct 15180
tatttggtta tgacagatct caaggctaac cggctaatga atcctgaaaa gattaagcag 15240
cagataattg aatcatctgt gaggacttca cctggactta taggtcacat cctatccatt 15300
aagcaactaa gctgcataca agcaattgtg ggagacgcag ttagtagagg tgatatcaat 15360
cctactctga aaaaacttac acctatagag caggtgctga tcaattgcgg gttggcaatt 15420
aacggaccta agctgtgcaa agaattgatc caccatgatg ttgcctcagg gcaagatgga 15480
ttgcttaatt ctatactcat cctctacagg gagttggcaa gattcaaaga caaccaaaga 15540
agtcaacaag ggatgttcca cgcttacccc gtattggtaa gtagcaggca acgagaactt 15600
atatctagga tcacccgcaa attctggggg cacattcttc tttactccgg gaacaaaaag 15660
ttgataaata agtttatcca gaatctcaag tccggctatc tgatactaga cttacaccag 15720
aatatcttcg ttaagaatct atccaagtca gagaaacaga ttattatgac ggggggtttg 15780
aaacgtgagt gggtttttaa ggtaacagtc aaggagacca aagaatggta taagttagtc 15840
ggatacagtg ccctgattaa ggactaattg gttgaactcc ggaaccctaa tcctgcccta 15900
ggtggttagg cattatttgc aatatattaa agaaaacttt gaaaatacga agtttctatt 15960
cccagctttg tctggtggcc ggcatggtcc cagcctcctc gctggcgccg gctgggcaac 16020
attccgaggg gaccgtcccc tcggtaatgg cgaatgggac gcggccgatc cggctgctaa 16080
caaagcccga aaggaagctg agttggctgc tgccaccgct gagcaataac tagcataacc 16140
ccttggggcc tctaaacggg tcttgagggg ttttttgctg aaaggaggaa ctatatccgg 16200
atgcggccgc catgaacaat aaaactgtct gcttacataa acagtaatac aaggggtgtt 16260
atgagccata ttcaacggga aacgtcgagg ccgcgattaa attccaacat ggatgctgat 16320
ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcgc 16380
ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 16440
aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 16500
accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 16560
ggaaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 16620
gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 16680
agcgatcgtg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat 16740
gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 16800
cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 16860
aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 16920
gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 16980
ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 17040
tttcatttga tgctcgatga gtttttctaa tcagaattgg ttaattggtt gtaacattat 17100
tcagattggg ccccgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 17160
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 17220
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 17280
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 17340
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 17400
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 17460
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 17520
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 17580
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 17640
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 17700
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 17760
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 17820
ttatcccctg attctgtgga taaccgtatt accgctag 17858
<210> 31
<211> 18734
<212> DNA
<213> Artificial sequence
<220>
<223> pKP-MVSchw-ATU1(eGFP)
<400> 31
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga cgcgtacgat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc 240
atcctggtcg agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc 300
gagggcgatg ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg 360
cccgtgccct ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc 420
taccccgacc acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc 480
caggagcgca ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag 540
ttcgagggcg acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac 600
ggcaacatcc tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg 660
gccgacaagc agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac 720
ggcagcgtgc agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg 780
ctgctgcccg acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag 840
aagcgcgatc acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg 900
gacgagctgt acaagtaggc gcgcagcgct tagacgtctc gcgatcgatt agtgcgagag 960
gccgagggcc agaacaacat ccgcctacca tccatcattg ttataaaaaa cttaggattc 1020
aagatcctat tatcagggac aagagcagga ttagggatat ccgagatggc cacactttta 1080
aggagcttag cattgttcaa aagaaacaag gacaaaccac ccattacatc aggatccggt 1140
ggagccatca gaggaatcaa acacattatt atagtaccaa tccctggaga ttcctcaatt 1200
accactcgat ccagacttct ggaccggttg gtgaggttaa ttggaaaccc ggatgtgagc 1260
gggcccaaac taacaggggc actaataggt atattatcct tatttgtgga gtctccaggt 1320
caattgattc agaggatcac cgatgaccct gacgttagca taaggctgtt agaggttgtc 1380
cagagtgacc agtcacaatc tggccttacc ttcgcatcaa gaggtaccaa catggaggat 1440
gaggcggacc aatacttttc acatgatgat ccaattagta gtgatcaatc caggttcgga 1500
tggttcggga acaaggaaat ctcagatatt gaagtgcaag accctgaggg attcaacatg 1560
attctgggta ccatcctagc ccaaatttgg gtcttgctcg caaaggcggt tacggcccca 1620
gacacggcag ctgattcgga gctaagaagg tggataaagt acacccaaca aagaagggta 1680
gttggtgaat ttagattgga gagaaaatgg ttggatgtgg tgaggaacag gattgccgag 1740
gacctctcct tacgccgatt catggtcgct ctaatcctgg atatcaagag aacacccgga 1800
aacaaaccca ggattgctga aatgatatgt gacattgata catatatcgt agaggcagga 1860
ttagccagtt ttatcctgac tattaagttt gggatagaaa ctatgtatcc tgctcttgga 1920
ctgcatgaat ttgctggtga gttatccaca cttgagtcct tgatgaacct ttaccagcaa 1980
atgggggaaa ctgcacccta catggtaatc ctggagaact caattcagaa caagttcagt 2040
gcaggatcat accctctgct ctggagctat gccatgggag taggagtgga acttgaaaac 2100
tccatgggag gtttgaactt tggccgatct tactttgatc cagcatattt tagattaggg 2160
caagagatgg taaggaggtc agctggaaag gtcagttcca cattggcatc tgaactcggt 2220
atcactgccg aggatgcaag gcttgtttca gagattgcaa tgcatactac tgaggacaag 2280
atcagtagag cggttggacc cagacaagcc caagtatcat ttctacacgg tgatcaaagt 2340
gagaatgagc taccgagatt ggggggcaag gaagatagga gggtcaaaca gagtcgagga 2400
gaagccaggg agagctacag agaaaccggg cccagcagag caagtgatgc gagagctgcc 2460
catcttccaa ccggcacacc cctagacatt gacactgcaa cggagtccag ccaagatccg 2520
caggacagtc gaaggtcagc tgacgccctg cttaggctgc aagccatggc aggaatctcg 2580
gaagaacaag gctcagacac ggacacccct atagtgtaca atgacagaaa tcttctagac 2640
taggtgcgag aggccgaggg ccagaacaac atccgcctac catccatcat tgttataaaa 2700
aacttaggaa ccaggtccac acagccgcca gcccatcaac catccactcc cacgattgga 2760
gccaatggca gaagagcagg cacgccatgt caaaaacgga ctggaatgca tccgggctct 2820
caaggccgag cccatcggct cactggccat cgaggaagct atggcagcat ggtcagaaat 2880
atcagacaac ccaggacagg agcgagccac ctgcagggaa gagaaggcag gcagttcggg 2940
tctcagcaaa ccatgcctct cagcaattgg atcaactgaa ggcggtgcac ctcgcatccg 3000
cggtcaggga cctggagaga gcgatgacga cgctgaaact ttgggaatcc ccccaagaaa 3060
tctccaggca tcaagcactg ggttacagtg ttattacgtt tatgatcaca gcggtgaagc 3120
ggttaaggga atccaagatg ctgactctat catggttcaa tcaggccttg atggtgatag 3180
caccctctca ggaggagaca atgaatctga aaacagcgat gtggatattg gcgaacctga 3240
taccgaggga tatgctatca ctgaccgggg atctgctccc atctctatgg ggttcagggc 3300
ttctgatgtt gaaactgcag aaggagggga gatccacgag ctcctgagac tccaatccag 3360
aggcaacaac tttccgaagc ttgggaaaac tctcaatgtt cctccgcccc cggaccccgg 3420
tagggccagc acttccggga cacccattaa aaagggcaca gacgcgagat tagcctcatt 3480
tggaacggag atcgcgtctt tattgacagg tggtgcaacc caatgtgctc gaaagtcacc 3540
ctcggaacca tcagggccag gtgcacctgc ggggaatgtc cccgagtgtg tgagcaatgc 3600
cgcactgata caggagtgga cacccgaatc tggtaccaca atctccccga gatcccagaa 3660
taatgaagaa gggggagact attatgatga tgagctgttc tctgatgtcc aagatattaa 3720
aacagccttg gccaaaatac acgaggataa tcagaagata atctccaagc tagaatcact 3780
gctgttattg aagggagaag ttgagtcaat taagaagcag atcaacaggc aaaatatcag 3840
catatccacc ctggaaggac acctctcaag catcatgatc gccattcctg gacttgggaa 3900
ggatcccaac gaccccactg cagatgtcga aatcaatccc gacttgaaac ccatcatagg 3960
cagagattca ggccgagcac tggccgaagt tctcaagaaa cccgttgcca gccgacaact 4020
ccaaggaatg acaaatggac ggaccagttc cagaggacag ctgctgaagg aatttcagct 4080
aaagccgatc gggaaaaaga tgagctcagc cgtcgggttt gttcctgaca ccggccctgc 4140
atcacgcagt gtaatccgct ccattataaa atccagccgg ctagaggagg atcggaagcg 4200
ttacctgatg actctccttg atgatatcaa aggagccaat gatcttgcca agttccacca 4260
gatgctgatg aagataataa tgaagtagct acagctcaac ttacctgcca accccatgcc 4320
agtcgaccca actagtacaa cctaaatcca ttataaaaaa cttaggagca aagtgattgc 4380
ctcccaaggt ccacaatgac agagacctac gacttcgaca agtcggcatg ggacatcaaa 4440
gggtcgatcg ctccgataca acccaccacc tacagtgatg gcaggctggt gccccaggtc 4500
agagtcatag atcctggtct aggcgacagg aaggatgaat gctttatgta catgtttctg 4560
ctgggggttg ttgaggacag cgattcccta gggcctccaa tcgggcgagc atttgggttc 4620
ctgcccttag gtgttggcag atccacagca aagcccgaaa aactcctcaa agaggccact 4680
gagcttgaca tagttgttag acgtacagca gggctcaatg aaaaactggt gttctacaac 4740
aacaccccac taactctcct cacaccttgg agaaaggtcc taacaacagg gagtgtcttc 4800
aacgcaaacc aagtgtgcaa tgcggttaat ctgataccgc tcgatacccc gcagaggttc 4860
cgtgttgttt atatgagcat cacccgtctt tcggataacg ggtattacac cgttcctaga 4920
agaatgctgg aattcagatc ggtcaatgca gtggccttca acctgctggt gacccttagg 4980
attgacaagg cgataggccc tgggaagatc atcgacaata cagagcaact tcctgaggca 5040
acatttatgg tccacatcgg gaacttcagg agaaagaaga gtgaagtcta ctctgccgat 5100
tattgcaaaa tgaaaatcga aaagatgggc ctggtttttg cacttggtgg gatagggggc 5160
accagtcttc acattagaag cacaggcaaa atgagcaaga ctctccatgc acaactcggg 5220
ttcaagaaga ccttatgtta cccgctgatg gatatcaatg aagaccttaa tcgattactc 5280
tggaggagca gatgcaagat agtaagaatc caggcagttt tgcagccatc agttcctcaa 5340
gaattccgca tttacgacga cgtgatcata aatgatgacc aaggactatt caaagttctg 5400
tagaccgtag tgcccagcaa tgcccgaaaa cgacccccct cacaatgaca gccagaaggc 5460
ccggacaaaa aagccccctc cgaaagactc cacggaccaa gcgagaggcc agccagcagc 5520
cgacggcaag cgcgaacacc aggcggcccc agcacagaac agccctgaca caaggccacc 5580
accagccacc ccaatctgca tcctcctcgt gggacccccg aggaccaacc cccaaggctg 5640
cccccgatcc aaaccaccaa ccgcatcccc accacccccg ggaaagaaac ccccagcaat 5700
tggaaggccc ctccccctct tcctcaacac aagaactcca caaccgaacc gcacaagcga 5760
ccgaggtgac ccaaccgcag gcatccgact ccctagacag atcctctctc cccggcaaac 5820
taaacaaaac ttagggccaa ggaacataca cacccaacag aacccagacc ccggcccacg 5880
gcgccgcgcc cccaaccccc gacaaccaga gggagccccc aaccaatccc gccggctccc 5940
ccggtgccca caggcaggga caccaacccc cgaacagacc cagcacccaa ccatcgacaa 6000
tccaagacgg gggggccccc ccaaaaaaag gcccccaggg gccgacagcc agcaccgcga 6060
ggaagcccac ccaccccaca cacgaccacg gcaaccaaac cagaacccag accaccctgg 6120
gccaccagct cccagactcg gccatcaccc cgcagaaagg aaaggccaca acccgcgcac 6180
cccagccccg atccggcggg gagccaccca acccgaacca gcacccaaga gcgatccccg 6240
aaggaccccc gaaccgcaaa ggacatcagt atcccacagc ctctccaagt cccccggtct 6300
cctcctcttc tcgaagggac caaaagatca atccaccaca cccgacgaca ctcaactccc 6360
cacccctaaa ggagacaccg ggaatcccag aatcaagact catccaatgt ccatcatggg 6420
tctcaaggtg aacgtctctg ccatattcat ggcagtactg ttaactctcc aaacacccac 6480
cggtcaaatc cattggggca atctctctaa gataggggtg gtaggaatag gaagtgcaag 6540
ctacaaagtt atgactcgtt ccagccatca atcattagtc ataaaattaa tgcccaatat 6600
aactctcctc aataactgca cgagggtaga gattgcagaa tacaggagac tactgagaac 6660
agttttggaa ccaattagag atgcacttaa tgcaatgacc cagaatataa gaccggttca 6720
gagtgtagct tcaagtagga gacacaagag atttgcggga gtagtcctgg caggtgcggc 6780
cctaggcgtt gccacagctg ctcagataac agccggcatt gcacttcacc agtccatgct 6840
gaactctcaa gccatcgaca atctgagagc gagcctggaa actactaatc aggcaattga 6900
gacaatcaga caagcagggc aggagatgat attggctgtt cagggtgtcc aagactacat 6960
caataatgag ctgataccgt ctatgaacca actatcttgt gatttaatcg gccagaagct 7020
cgggctcaaa ttgctcagat actatacaga aatcctgtca ttatttggcc ccagtttacg 7080
ggaccccata tctgcggaga tatctatcca ggctttgagc tatgcgcttg gaggagacat 7140
caataaggtg ttagaaaagc tcggatacag tggaggtgat ttactgggca tcttagagag 7200
cggaggaata aaggcccgga taactcacgt cgacacagag tcctacttca ttgtcctcag 7260
tatagcctat ccgacgctgt ccgagattaa gggggtgatt gtccaccggc tagagggggt 7320
ctcgtacaac ataggctctc aagagtggta taccactgtg cccaagtatg ttgcaaccca 7380
agggtacctt atctcgaatt ttgatgagtc atcgtgtact ttcatgccag aggggactgt 7440
gtgcagccaa aatgccttgt acccgatgag tcctctgctc caagaatgcc tccgggggta 7500
caccaagtcc tgtgctcgta cactcgtatc cgggtctttt gggaaccggt tcattttatc 7560
acaagggaac ctaatagcca attgtgcatc aatcctttgc aagtgttaca caacaggaac 7620
gatcattaat caagaccctg acaagatcct aacatacatt gctgccgatc actgcccggt 7680
agtcgaggtg aacggcgtga ccatccaagt cgggagcagg aggtatccag acgctgtgta 7740
cttgcacaga attgacctcg gtcctcccat atcattggag aggttggacg tagggacaaa 7800
tctggggaat gcaattgcta agttggagga tgccaaggaa ttgttggagt catcggacca 7860
gatattgagg agtatgaaag gtttatcgag cactagcata gtctacatcc tgattgcagt 7920
gtgtcttgga gggttgatag ggatccccgc tttaatatgt tgctgcaggg ggcgttgtaa 7980
caaaaaggga gaacaagttg gtatgtcaag accaggccta aagcctgatc ttacgggaac 8040
atcaaaatcc tatgtaaggt cgctctgatc ctctacaact cttgaaacac aaatgtccca 8100
caagtctcct cttcgtcatc aagcaaccac cgcacccagc atcaagccca cctgaaatta 8160
tctccggctt ccctctggcc gaacaatatc ggtagttaat caaaacttag ggtgcaagat 8220
catccacaat gtcaccacaa cgagaccgga taaatgcctt ctacaaagat aacccccatc 8280
ccaagggaag taggatagtc attaacagag aacatcttat gattgataga ccttatgttt 8340
tgctggctgt tctgtttgtc atgtttctga gcttgatcgg gttgctagcc attgcaggca 8400
ttagacttca tcgggcagcc atctacaccg cagagatcca taaaagcctc agcaccaatc 8460
tagatgtaac taactcaatc gagcatcagg tcaaggacgt gctgacacca ctcttcaaaa 8520
tcatcggtga tgaagtgggc ctgaggacac ctcagagatt cactgaccta gtgaaattaa 8580
tctctgacaa gattaaattc cttaatccgg atagggagta cgacttcaga gatctcactt 8640
ggtgtatcaa cccgccagag agaatcaaat tggattatga tcaatactgt gcagatgtgg 8700
ctgctgaaga gctcatgaat gcattggtga actcaactct actggagacc agaacaacca 8760
atcagttcct agctgtctca aagggaaact gctcagggcc cactacaatc agaggtcaat 8820
tctcaaacat gtcgctgtcc ctgttagact tgtatttagg tcgaggttac aatgtgtcat 8880
ctatagtcac tatgacatcc cagggaatgt atgggggaac ttacctagtg gaaaagccta 8940
atctgagcag caaaaggtca gagttgtcac aactgagcat gtaccgagtg tttgaagtag 9000
gtgttatcag aaatccgggt ttgggggctc cggtgttcca tatgacaaac tatcttgagc 9060
aaccagtcag taatgatctc agcaactgta tggtggcttt gggggagctc aaactcgcag 9120
ccctttgtca cggggaagat tctatcacaa ttccctatca gggatcaggg aaaggtgtca 9180
gcttccagct cgtcaagcta ggtgtctgga aatccccaac cgacatgcaa tcctgggtcc 9240
ccttatcaac ggatgatcca gtgatagaca ggctttacct ctcatctcac agaggtgtta 9300
tcgctgacaa tcaagcaaaa tgggctgtcc cgacaacacg aacagatgac aagttgcgaa 9360
tggagacatg cttccaacag gcgtgtaagg gtaaaatcca agcactctgc gagaatcccg 9420
agtgggcacc attgaaggat aacaggattc cttcatacgg ggtcttgtct gttgatctga 9480
gtctgacagt tgagcttaaa atcaaaattg cttcgggatt cgggccattg atcacacacg 9540
gttcagggat ggacctatac aaatccaacc acaacaatgt gtattggctg actatcccgc 9600
caatgaagaa cctagcctta ggtgtaatca acacattgga gtggataccg agattcaagg 9660
ttagtcccta cctcttcact gtcccaatta aggaagcagg cgaagactgc catgccccaa 9720
catacctacc tgcggaggtg gatggtgatg tcaaactcag ttccaatctg gtgattctac 9780
ctggtcaaga tctccaatat gttttggcaa cctacgatac ttccagggtt gaacatgctg 9840
tggtttatta cgtttacagc ccaagccgct cattttctta cttttatcct tttaggttgc 9900
ctataaaggg ggtccccatc gaattacaag tggaatgctt cacatgggac caaaaactct 9960
ggtgccgtca cttctgtgtg cttgcggact cagaatctgg tggacatatc actcactctg 10020
ggatggtggg catgggagtc agctgcacag tcacccggga agatggaacc aatcgcagat 10080
agggctgcta gtgaaccaat cacatgatgt cacccagaca tcaggcatac ccactagtgt 10140
gaaatagaca tcagaattaa gaaaaacgta gggtccaagt ggttccccgt tatggactcg 10200
ctatctgtca accagatctt ataccctgaa gttcacctag atagcccgat agttaccaat 10260
aagatagtag ccatcctgga gtatgctcga gtccctcacg cttacagcct ggaggaccct 10320
acactgtgtc agaacatcaa gcaccgccta aaaaacggat tttccaacca aatgattata 10380
aacaatgtgg aagttgggaa tgtcatcaag tccaagctta ggagttatcc ggcccactct 10440
catattccat atccaaattg taatcaggat ttatttaaca tagaagacaa agagtcaacg 10500
aggaagatcc gtgaactcct caaaaagggg aattcgctgt actccaaagt cagtgataag 10560
gttttccaat gcttaaggga cactaactca cggcttggcc taggctccga attgagggag 10620
gacatcaagg agaaagttat taacttggga gtttacatgc acagctccca gtggtttgag 10680
ccctttctgt tttggtttac agtcaagact gagatgaggt cagtgattaa atcacaaacc 10740
catacttgcc ataggaggag acacacacct gtattcttca ctggtagttc agttgagttg 10800
ctaatctctc gtgaccttgt tgctataatc agtaaagagt ctcaacatgt atattacctg 10860
acatttgaac tggttttgat gtattgtgat gtcatagagg ggaggttaat gacagagacc 10920
gctatgacta ttgatgctag gtatacagag cttctaggaa gagtcagata catgtggaaa 10980
ctgatagatg gtttcttccc tgcactcggg aatccaactt atcaaattgt agccatgctg 11040
gagcctcttt cacttgctta cctgcagctg agggatataa cagtagaact cagaggtgct 11100
ttccttaacc actgctttac tgaaatacat gatgttcttg accaaaacgg gttttctgat 11160
gaaggtactt atcatgagtt aactgaagct ctagattaca ttttcataac tgatgacata 11220
catctgacag gggagatttt ctcatttttc agaagtttcg gccaccccag acttgaagca 11280
gtaacggctg ctgaaaatgt taggaaatac atgaatcagc ctaaagtcat tgtgtatgag 11340
actctgatga aaggtcatgc catattttgt ggaatcataa tcaacggcta tcgtgacagg 11400
cacggaggca gttggccacc gctgaccctc cccctgcatg ctgcagacac aatccggaat 11460
gctcaagctt caggtgaagg gttaacacat gagcagtgcg ttgataactg gaaatctttt 11520
gctggagtga aatttggctg ctttatgcct cttagcctgg atagtgatct gacaatgtac 11580
ctaaaggaca aggcacttgc tgctctccaa agggaatggg attcagttta cccgaaagag 11640
ttcctgcgtt acgaccctcc caagggaacc gggtcacgga ggcttgtaga tgttttcctt 11700
aatgattcga gctttgaccc atatgatgtg ataatgtatg ttgtaagtgg agcttacctc 11760
catgaccctg agttcaacct gtcttacagc ctgaaagaaa aggagatcaa ggaaacaggt 11820
agactttttg ctaaaatgac ttacaaaatg agggcatgcc aagtgattgc tgaaaatcta 11880
atctcaaacg ggattggcaa atattttaag gacaatggga tggccaagga tgagcacgat 11940
ttgactaagg cactccacac tctagctgtc tcaggagtcc ccaaagatct caaagaaagt 12000
cacagggggg ggccagtctt aaaaacctac tcccgaagcc cagtccacac aagtaccagg 12060
aacgtgagag cagcaaaagg gtttataggg ttccctcaag taattcggca ggaccaagac 12120
actgatcatc cggagaatat ggaagcttac gagacagtca gtgcatttat cacgactgat 12180
ctcaagaagt actgccttaa ttggagatat gagaccatca gcttgtttgc acagaggcta 12240
aatgagattt acggattgcc ctcatttttc cagtggctgc ataagaggct tgagacctct 12300
gtcctgtatg taagtgaccc tcattgcccc cccgaccttg acgcccatat cccgttatat 12360
aaagtcccca atgatcaaat cttcattaag taccctatgg gaggtataga agggtattgt 12420
cagaagctgt ggaccatcag caccattccc tatctatacc tggctgctta tgagagcgga 12480
gtaaggattg cttcgttagt gcaaggggac aatcagacca tagccgtaac aaaaagggta 12540
cccagcacat ggccctacaa ccttaagaaa cgggaagctg ctagagtaac tagagattac 12600
tttgtaattc ttaggcaaag gctacatgat attggccatc acctcaaggc aaatgagaca 12660
attgtttcat cacatttttt tgtctattca aaaggaatat attatgatgg gctacttgtg 12720
tcccaatcac tcaagagcat cgcaagatgt gtattctggt cagagactat agttgatgaa 12780
acaagggcag catgcagtaa tattgctaca acaatggcta aaagcatcga gagaggttat 12840
gaccgttacc ttgcatattc cctgaacgtc ctaaaagtga tacagcaaat tctgatctct 12900
cttggcttca caatcaattc aaccatgacc cgggatgtag tcatacccct cctcacaaac 12960
aacgacctct taataaggat ggcactgttg cccgctccta ttggggggat gaattatctg 13020
aatatgagca ggctgtttgt cagaaacatc ggtgatccag taacatcatc aattgctgat 13080
ctcaagagaa tgattctcgc ctcactaatg cctgaagaga ccctccatca agtaatgaca 13140
caacaaccgg gggactcttc attcctagac tgggctagcg acccttactc agcaaatctt 13200
gtatgtgtcc agagcatcac tagactcctc aagaacataa ctgcaaggtt tgtcctgatc 13260
catagtccaa acccaatgtt aaaaggatta ttccatgatg acagtaaaga agaggacgag 13320
ggactggcgg cattcctcat ggacaggcat attatagtac ctagggcagc tcatgaaatc 13380
ctggatcata gtgtcacagg ggcaagagag tctattgcag gcatgctgga taccacaaaa 13440
ggcttgattc gagccagcat gaggaagggg gggttaacct ctcgagtgat aaccagattg 13500
tccaattatg actatgaaca attcagagca gggatggtgc tattgacagg aagaaagaga 13560
aatgtcctca ttgacaaaga gtcatgttca gtgcagctgg cgagagctct aagaagccat 13620
atgtgggcga ggctagctcg aggacggcct atttacggcc ttgaggtccc tgatgtacta 13680
gaatctatgc gaggccacct tattcggcgt catgagacat gtgtcatctg cgagtgtgga 13740
tcagtcaact acggatggtt ttttgtcccc tcgggttgcc aactggatga tattgacaag 13800
gaaacatcat ccttgagagt cccatatatt ggttctacca ctgatgagag aacagacatg 13860
aagcttgcct tcgtaagagc cccaagtcga tccttgcgat ctgctgttag aatagcaaca 13920
gtgtactcat gggcttacgg tgatgatgat agctcttgga acgaagcctg gttgttggct 13980
aggcaaaggg ccaatgtgag cctggaggag ctaagggtga tcactcccat ctcaacttcg 14040
actaatttag cgcataggtt gagggatcgt agcactcaag tgaaatactc aggtacatcc 14100
cttgtccgag tggcgaggta taccacaatc tccaacgaca atctctcatt tgtcatatca 14160
gataagaagg ttgatactaa ctttatatac caacaaggaa tgcttctagg gttgggtgtt 14220
ttagaaacat tgtttcgact cgagaaagat accggatcat ctaacacggt attacatctt 14280
cacgtcgaaa cagattgttg cgtgatcccg atgatagatc atcccaggat acccagctcc 14340
cgcaagctag agctgagggc agagctatgt accaacccat tgatatatga taatgcacct 14400
ttaattgaca gagatgcaac aaggctatac acccagagcc ataggaggca ccttgtggaa 14460
tttgttacat ggtccacacc ccaactatat cacattttag ctaagtccac agcactatct 14520
atgattgacc tggtaacaaa atttgagaag gaccatatga atgaaatttc agctctcata 14580
ggggatgacg atatcaatag tttcataact gagtttctgc tcatagagcc aagattattc 14640
actatctact tgggccagtg tgcggccatc aattgggcat ttgatgtaca ttatcataga 14700
ccatcaggga aatatcagat gggtgagctg ttgtcatcgt tcctttctag aatgagcaaa 14760
ggagtgttta aggtgcttgt caatgctcta agccacccaa agatctacaa gaaattctgg 14820
cattgtggta ttatagagcc tatccatggt ccttcacttg atgctcaaaa cttgcacaca 14880
actgtgtgca acatggttta cacatgctat atgacctacc tcgacctgtt gttgaatgaa 14940
gagttagaag agttcacatt tctcttgtgt gaaagcgacg aggatgtagt accggacaga 15000
ttcgacaaca tccaggcaaa acacttatgt gttctggcag atttgtactg tcaaccaggg 15060
acctgcccac caattcgagg tctaagaccg gtagagaaat gtgcagttct aaccgaccat 15120
atcaaggcag aggctatgtt atctccagca ggatcttcgt ggaacataaa tccaattatt 15180
gtagaccatt actcatgctc tctgacttat ctccggcgag gatcgatcaa acagataaga 15240
ttgagagttg atccaggatt cattttcgac gccctcgctg aggtaaatgt cagtcagcca 15300
aagatcggca gcaacaacat ctcaaatatg agcatcaagg ctttcagacc cccacacgat 15360
gatgttgcaa aattgctcaa agatatcaac acaagcaagc acaatcttcc catttcaggg 15420
ggcaatctcg ccaattatga aatccatgct ttccgcagaa tcgggttgaa ctcatctgct 15480
tgctacaaag ctgttgagat atcaacatta attaggagat gccttgagcc aggggaggac 15540
ggcttgttct tgggtgaggg atcgggttct atgttgatca cttataaaga gatacttaaa 15600
ctaaacaagt gcttctataa tagtggggtt tccgccaatt ctagatctgg tcaaagggaa 15660
ttagcaccct atccctccga agttggcctt gtcgaacaca gaatgggagt aggtaatatt 15720
gtcaaagtgc tctttaacgg gaggcccgaa gtcacgtggg taggcagtgt agattgcttc 15780
aatttcatag ttagtaatat ccctacctct agtgtggggt ttatccattc agatatagag 15840
accttgcctg acaaagatac tatagagaag ctagaggaat tggcagccat cttatcgatg 15900
gctctgctcc tgggcaaaat aggatcaata ctggtgatta agcttatgcc tttcagcggg 15960
gattttgttc agggatttat aagttatgta gggtctcatt atagagaagt gaaccttgta 16020
taccctagat acagcaactt catctctact gaatcttatt tggttatgac agatctcaag 16080
gctaaccggc taatgaatcc tgaaaagatt aagcagcaga taattgaatc atctgtgagg 16140
acttcacctg gacttatagg tcacatccta tccattaagc aactaagctg catacaagca 16200
attgtgggag acgcagttag tagaggtgat atcaatccta ctctgaaaaa acttacacct 16260
atagagcagg tgctgatcaa ttgcgggttg gcaattaacg gacctaagct gtgcaaagaa 16320
ttgatccacc atgatgttgc ctcagggcaa gatggattgc ttaattctat actcatcctc 16380
tacagggagt tggcaagatt caaagacaac caaagaagtc aacaagggat gttccacgct 16440
taccccgtat tggtaagtag caggcaacga gaacttatat ctaggatcac ccgcaaattc 16500
tgggggcaca ttcttcttta ctccgggaac aaaaagttga taaataagtt tatccagaat 16560
ctcaagtccg gctatctgat actagactta caccagaata tcttcgttaa gaatctatcc 16620
aagtcagaga aacagattat tatgacgggg ggtttgaaac gtgagtgggt ttttaaggta 16680
acagtcaagg agaccaaaga atggtataag ttagtcggat acagtgccct gattaaggac 16740
taattggttg aactccggaa ccctaatcct gccctaggtg gttaggcatt atttgcaata 16800
tattaaagaa aactttgaaa atacgaagtt tctattccca gctttgtctg gtggccggca 16860
tggtcccagc ctcctcgctg gcgccggctg ggcaacattc cgaggggacc gtcccctcgg 16920
taatggcgaa tgggacgcgg ccgatccggc tgctaacaaa gcccgaaagg aagctgagtt 16980
ggctgctgcc accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt 17040
gaggggtttt ttgctgaaag gaggaactat atccggatgc ggccgccatg aacaataaaa 17100
ctgtctgctt acataaacag taatacaagg ggtgttatga gccatattca acgggaaacg 17160
tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa atgggctcgc 17220
gataatgtcg ggcaatcagg tgcgacaatc tatcgcttgt atgggaagcc cgatgcgcca 17280
gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga tgagatggtc 17340
agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt tatccgtact 17400
cctgatgatg catggttact caccactgcg atccccggaa aaacagcatt ccaggtatta 17460
gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt cctgcgccgg 17520
ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgtgtatt tcgtctcgct 17580
caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga tgacgagcgt 17640
aatggctggc ctgttgaaca agtctggaaa gaaatgcata aacttttgcc attctcaccg 17700
gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga cgaggggaaa 17760
ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca ggatcttgcc 17820
atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct ttttcaaaaa 17880
tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct cgatgagttt 17940
ttctaatcag aattggttaa ttggttgtaa cattattcag attgggcccc gttccactga 18000
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 18060
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 18120
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 18180
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 18240
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 18300
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 18360
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 18420
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 18480
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 18540
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 18600
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 18660
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 18720
cgtattaccg ctag 18734
<210> 32
<211> 18686
<212> DNA
<213> Artificial sequence
<220>
<223> pKP-MVSchw-ATU2(eGFP)
<400> 32
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480
aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac gatggtgagc 3540
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 3600
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 3660
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 3720
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 3780
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 3840
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 3900
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 3960
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 4020
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 4080
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 4140
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 4200
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagta ggcgcgcagc 4260
gcttagacgt ctcgcgatcg atactagtac aacctaaatc cattataaaa aacttaggag 4320
caaagtgatt gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca 4380
tgggacatca aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg 4440
gtgccccagg tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg 4500
tacatgtttc tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga 4560
gcatttgggt tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc 4620
aaagaggcca ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg 4680
gtgttctaca acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca 4740
gggagtgtct tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc 4800
ccgcagaggt tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac 4860
accgttccta gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg 4920
gtgaccctta ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa 4980
cttcctgagg caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc 5040
tactctgccg attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt 5100
gggatagggg gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat 5160
gcacaactcg ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt 5220
aatcgattac tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca 5280
tcagttcctc aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta 5340
ttcaaagttc tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga 5400
cagccagaag gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg 5460
ccagccagca gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga 5520
cacaaggcca ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa 5580
cccccaaggc tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa 5640
acccccagca attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa 5700
ccgcacaagc gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc 5760
tccccggcaa actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga 5820
ccccggccca cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc 5880
ccgccggctc ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc 5940
aaccatcgac aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag 6000
ccagcaccgc gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc 6060
agaccaccct gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca 6120
caacccgcgc accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa 6180
gagcgatccc cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa 6240
gtcccccggt ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga 6300
cactcaactc cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat 6360
gtccatcatg ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct 6420
ccaaacaccc accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat 6480
aggaagtgca agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt 6540
aatgcccaat ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag 6600
actactgaga acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat 6660
aagaccggtt cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct 6720
ggcaggtgcg gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca 6780
ccagtccatg ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa 6840
tcaggcaatt gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt 6900
ccaagactac atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat 6960
cggccagaag ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg 7020
ccccagttta cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct 7080
tggaggagac atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg 7140
catcttagag agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt 7200
cattgtcctc agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg 7260
gctagagggg gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta 7320
tgttgcaacc caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc 7380
agaggggact gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg 7440
cctccggggg tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg 7500
gttcatttta tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta 7560
cacaacagga acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga 7620
tcactgcccg gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc 7680
agacgctgtg tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga 7740
cgtagggaca aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga 7800
gtcatcggac cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat 7860
cctgattgca gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag 7920
ggggcgttgt aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga 7980
tcttacggga acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac 8040
acaaatgtcc cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc 8100
cacctgaaat tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt 8160
agggtgcaag atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag 8220
ataaccccca tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata 8280
gaccttatgt tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag 8340
ccattgcagg cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc 8400
tcagcaccaa tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac 8460
cactcttcaa aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc 8520
tagtgaaatt aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca 8580
gagatctcac ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact 8640
gtgcagatgt ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga 8700
ccagaacaac caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa 8760
tcagaggtca attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt 8820
acaatgtgtc atctatagtc actatgacat cccagggaat gtatggggga acttacctag 8880
tggaaaagcc taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag 8940
tgtttgaagt aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa 9000
actatcttga gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc 9060
tcaaactcgc agccctttgt cacggggaag attctatcac aattccctat cagggatcag 9120
ggaaaggtgt cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc 9180
aatcctgggt ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc 9240
acagaggtgt tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg 9300
acaagttgcg aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct 9360
gcgagaatcc cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt 9420
ctgttgatct gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat 9480
tgatcacaca cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc 9540
tgactatccc gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac 9600
cgagattcaa ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact 9660
gccatgcccc aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc 9720
tggtgattct acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg 9780
ttgaacatgc tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc 9840
cttttaggtt gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg 9900
accaaaaact ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata 9960
tcactcactc tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa 10020
ccaatcgcag atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat 10080
acccactagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140
gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200
atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260
ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320
caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380
ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440
aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500
gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560
gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620
cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680
aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740
tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800
gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860
atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920
tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980
gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040
ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100
gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160
actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220
agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280
attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340
tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400
acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460
tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520
ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580
tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640
gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700
ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760
aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820
gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880
gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940
ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000
acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060
caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120
atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180
gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240
cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300
atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360
gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420
tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480
acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540
actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600
gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660
gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720
atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780
gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840
attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900
ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960
atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020
tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080
caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140
tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200
tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260
gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320
gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380
gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440
ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500
ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560
ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620
cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680
tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740
gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800
agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860
agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920
tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980
atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040
tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100
tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160
gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220
gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280
atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340
gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400
caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460
acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520
tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580
ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640
cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700
agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760
aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820
aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880
ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940
gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000
tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060
ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120
aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180
aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240
gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300
cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360
cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420
aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480
ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540
gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600
ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660
gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720
gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780
tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840
atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900
cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960
gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020
acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080
tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140
tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200
aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260
ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320
atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380
atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440
acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500
tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560
aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620
gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680
ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740
ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800
tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860
ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920
ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980
taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcca 17040
tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt 17100
caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 17160
aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag 17220
cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 17280
gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 17340
tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca 17400
ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 17460
ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgtgta 17520
tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 17580
gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg 17640
ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 17700
gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 17760
caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 17820
ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 17880
ctcgatgagt ttttctaatc agaattggtt aattggttgt aacattattc agattgggcc 17940
ccgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18000
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18060
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18120
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18180
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18240
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18300
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18360
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18420
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 18480
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 18540
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 18600
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 18660
tctgtggata accgtattac cgctag 18686
<210> 33
<211> 18686
<212> DNA
<213> Artificial sequence
<220>
<223> pKP-MVSchw-ATU3(eGFP)
<400> 33
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480
aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540
gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600
gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660
gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720
ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780
gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840
aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900
gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960
ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020
aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080
ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140
aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200
aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260
tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320
aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380
aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440
gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500
gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560
ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620
ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680
gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740
cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800
cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860
tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920
acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980
acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040
ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100
gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160
aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220
aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280
aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340
accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400
cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460
cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520
gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580
actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640
ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700
agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760
agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820
gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880
gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940
cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000
ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060
tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120
ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180
gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240
gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300
tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360
agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420
gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480
tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540
tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600
gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660
ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720
ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780
cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840
caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900
ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960
ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020
catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080
atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140
cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200
aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260
cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320
taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380
ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440
ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500
tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560
tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620
acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680
gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740
agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800
atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860
ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920
ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980
taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040
gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100
gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160
tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220
ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280
atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340
caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400
acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460
cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520
tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580
acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640
gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700
atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760
tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820
caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880
tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940
atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000
cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060
gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120
ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180
gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240
gacatcaggc atacccacta gtctaccctc catcattgtt ataaaaaact taggaaccag 9300
gtccacacag ccgccagccc atcaacgcgt acgatggtga gcaagggcga ggagctgttc 9360
accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc 9420
gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc 9480
accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg 9540
cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg 9600
cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc 9660
cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc 9720
gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac 9780
aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc 9840
cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc 9900
ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc 9960
aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg 10020
atcactctcg gcatggacga gctgtacaag taggcgcgca gcgcttagac gtctcgcgat 10080
cgatgctagt gtgaaataga catcagaatt aagaaaaacg tagggtccaa gtggttcccc 10140
gttatggact cgctatctgt caaccagatc ttataccctg aagttcacct agatagcccg 10200
atagttacca ataagatagt agccatcctg gagtatgctc gagtccctca cgcttacagc 10260
ctggaggacc ctacactgtg tcagaacatc aagcaccgcc taaaaaacgg attttccaac 10320
caaatgatta taaacaatgt ggaagttggg aatgtcatca agtccaagct taggagttat 10380
ccggcccact ctcatattcc atatccaaat tgtaatcagg atttatttaa catagaagac 10440
aaagagtcaa cgaggaagat ccgtgaactc ctcaaaaagg ggaattcgct gtactccaaa 10500
gtcagtgata aggttttcca atgcttaagg gacactaact cacggcttgg cctaggctcc 10560
gaattgaggg aggacatcaa ggagaaagtt attaacttgg gagtttacat gcacagctcc 10620
cagtggtttg agccctttct gttttggttt acagtcaaga ctgagatgag gtcagtgatt 10680
aaatcacaaa cccatacttg ccataggagg agacacacac ctgtattctt cactggtagt 10740
tcagttgagt tgctaatctc tcgtgacctt gttgctataa tcagtaaaga gtctcaacat 10800
gtatattacc tgacatttga actggttttg atgtattgtg atgtcataga ggggaggtta 10860
atgacagaga ccgctatgac tattgatgct aggtatacag agcttctagg aagagtcaga 10920
tacatgtgga aactgataga tggtttcttc cctgcactcg ggaatccaac ttatcaaatt 10980
gtagccatgc tggagcctct ttcacttgct tacctgcagc tgagggatat aacagtagaa 11040
ctcagaggtg ctttccttaa ccactgcttt actgaaatac atgatgttct tgaccaaaac 11100
gggttttctg atgaaggtac ttatcatgag ttaactgaag ctctagatta cattttcata 11160
actgatgaca tacatctgac aggggagatt ttctcatttt tcagaagttt cggccacccc 11220
agacttgaag cagtaacggc tgctgaaaat gttaggaaat acatgaatca gcctaaagtc 11280
attgtgtatg agactctgat gaaaggtcat gccatatttt gtggaatcat aatcaacggc 11340
tatcgtgaca ggcacggagg cagttggcca ccgctgaccc tccccctgca tgctgcagac 11400
acaatccgga atgctcaagc ttcaggtgaa gggttaacac atgagcagtg cgttgataac 11460
tggaaatctt ttgctggagt gaaatttggc tgctttatgc ctcttagcct ggatagtgat 11520
ctgacaatgt acctaaagga caaggcactt gctgctctcc aaagggaatg ggattcagtt 11580
tacccgaaag agttcctgcg ttacgaccct cccaagggaa ccgggtcacg gaggcttgta 11640
gatgttttcc ttaatgattc gagctttgac ccatatgatg tgataatgta tgttgtaagt 11700
ggagcttacc tccatgaccc tgagttcaac ctgtcttaca gcctgaaaga aaaggagatc 11760
aaggaaacag gtagactttt tgctaaaatg acttacaaaa tgagggcatg ccaagtgatt 11820
gctgaaaatc taatctcaaa cgggattggc aaatatttta aggacaatgg gatggccaag 11880
gatgagcacg atttgactaa ggcactccac actctagctg tctcaggagt ccccaaagat 11940
ctcaaagaaa gtcacagggg ggggccagtc ttaaaaacct actcccgaag cccagtccac 12000
acaagtacca ggaacgtgag agcagcaaaa gggtttatag ggttccctca agtaattcgg 12060
caggaccaag acactgatca tccggagaat atggaagctt acgagacagt cagtgcattt 12120
atcacgactg atctcaagaa gtactgcctt aattggagat atgagaccat cagcttgttt 12180
gcacagaggc taaatgagat ttacggattg ccctcatttt tccagtggct gcataagagg 12240
cttgagacct ctgtcctgta tgtaagtgac cctcattgcc cccccgacct tgacgcccat 12300
atcccgttat ataaagtccc caatgatcaa atcttcatta agtaccctat gggaggtata 12360
gaagggtatt gtcagaagct gtggaccatc agcaccattc cctatctata cctggctgct 12420
tatgagagcg gagtaaggat tgcttcgtta gtgcaagggg acaatcagac catagccgta 12480
acaaaaaggg tacccagcac atggccctac aaccttaaga aacgggaagc tgctagagta 12540
actagagatt actttgtaat tcttaggcaa aggctacatg atattggcca tcacctcaag 12600
gcaaatgaga caattgtttc atcacatttt tttgtctatt caaaaggaat atattatgat 12660
gggctacttg tgtcccaatc actcaagagc atcgcaagat gtgtattctg gtcagagact 12720
atagttgatg aaacaagggc agcatgcagt aatattgcta caacaatggc taaaagcatc 12780
gagagaggtt atgaccgtta ccttgcatat tccctgaacg tcctaaaagt gatacagcaa 12840
attctgatct ctcttggctt cacaatcaat tcaaccatga cccgggatgt agtcataccc 12900
ctcctcacaa acaacgacct cttaataagg atggcactgt tgcccgctcc tattgggggg 12960
atgaattatc tgaatatgag caggctgttt gtcagaaaca tcggtgatcc agtaacatca 13020
tcaattgctg atctcaagag aatgattctc gcctcactaa tgcctgaaga gaccctccat 13080
caagtaatga cacaacaacc gggggactct tcattcctag actgggctag cgacccttac 13140
tcagcaaatc ttgtatgtgt ccagagcatc actagactcc tcaagaacat aactgcaagg 13200
tttgtcctga tccatagtcc aaacccaatg ttaaaaggat tattccatga tgacagtaaa 13260
gaagaggacg agggactggc ggcattcctc atggacaggc atattatagt acctagggca 13320
gctcatgaaa tcctggatca tagtgtcaca ggggcaagag agtctattgc aggcatgctg 13380
gataccacaa aaggcttgat tcgagccagc atgaggaagg gggggttaac ctctcgagtg 13440
ataaccagat tgtccaatta tgactatgaa caattcagag cagggatggt gctattgaca 13500
ggaagaaaga gaaatgtcct cattgacaaa gagtcatgtt cagtgcagct ggcgagagct 13560
ctaagaagcc atatgtgggc gaggctagct cgaggacggc ctatttacgg ccttgaggtc 13620
cctgatgtac tagaatctat gcgaggccac cttattcggc gtcatgagac atgtgtcatc 13680
tgcgagtgtg gatcagtcaa ctacggatgg ttttttgtcc cctcgggttg ccaactggat 13740
gatattgaca aggaaacatc atccttgaga gtcccatata ttggttctac cactgatgag 13800
agaacagaca tgaagcttgc cttcgtaaga gccccaagtc gatccttgcg atctgctgtt 13860
agaatagcaa cagtgtactc atgggcttac ggtgatgatg atagctcttg gaacgaagcc 13920
tggttgttgg ctaggcaaag ggccaatgtg agcctggagg agctaagggt gatcactccc 13980
atctcaactt cgactaattt agcgcatagg ttgagggatc gtagcactca agtgaaatac 14040
tcaggtacat cccttgtccg agtggcgagg tataccacaa tctccaacga caatctctca 14100
tttgtcatat cagataagaa ggttgatact aactttatat accaacaagg aatgcttcta 14160
gggttgggtg ttttagaaac attgtttcga ctcgagaaag ataccggatc atctaacacg 14220
gtattacatc ttcacgtcga aacagattgt tgcgtgatcc cgatgataga tcatcccagg 14280
atacccagct cccgcaagct agagctgagg gcagagctat gtaccaaccc attgatatat 14340
gataatgcac ctttaattga cagagatgca acaaggctat acacccagag ccataggagg 14400
caccttgtgg aatttgttac atggtccaca ccccaactat atcacatttt agctaagtcc 14460
acagcactat ctatgattga cctggtaaca aaatttgaga aggaccatat gaatgaaatt 14520
tcagctctca taggggatga cgatatcaat agtttcataa ctgagtttct gctcatagag 14580
ccaagattat tcactatcta cttgggccag tgtgcggcca tcaattgggc atttgatgta 14640
cattatcata gaccatcagg gaaatatcag atgggtgagc tgttgtcatc gttcctttct 14700
agaatgagca aaggagtgtt taaggtgctt gtcaatgctc taagccaccc aaagatctac 14760
aagaaattct ggcattgtgg tattatagag cctatccatg gtccttcact tgatgctcaa 14820
aacttgcaca caactgtgtg caacatggtt tacacatgct atatgaccta cctcgacctg 14880
ttgttgaatg aagagttaga agagttcaca tttctcttgt gtgaaagcga cgaggatgta 14940
gtaccggaca gattcgacaa catccaggca aaacacttat gtgttctggc agatttgtac 15000
tgtcaaccag ggacctgccc accaattcga ggtctaagac cggtagagaa atgtgcagtt 15060
ctaaccgacc atatcaaggc agaggctatg ttatctccag caggatcttc gtggaacata 15120
aatccaatta ttgtagacca ttactcatgc tctctgactt atctccggcg aggatcgatc 15180
aaacagataa gattgagagt tgatccagga ttcattttcg acgccctcgc tgaggtaaat 15240
gtcagtcagc caaagatcgg cagcaacaac atctcaaata tgagcatcaa ggctttcaga 15300
cccccacacg atgatgttgc aaaattgctc aaagatatca acacaagcaa gcacaatctt 15360
cccatttcag ggggcaatct cgccaattat gaaatccatg ctttccgcag aatcgggttg 15420
aactcatctg cttgctacaa agctgttgag atatcaacat taattaggag atgccttgag 15480
ccaggggagg acggcttgtt cttgggtgag ggatcgggtt ctatgttgat cacttataaa 15540
gagatactta aactaaacaa gtgcttctat aatagtgggg tttccgccaa ttctagatct 15600
ggtcaaaggg aattagcacc ctatccctcc gaagttggcc ttgtcgaaca cagaatggga 15660
gtaggtaata ttgtcaaagt gctctttaac gggaggcccg aagtcacgtg ggtaggcagt 15720
gtagattgct tcaatttcat agttagtaat atccctacct ctagtgtggg gtttatccat 15780
tcagatatag agaccttgcc tgacaaagat actatagaga agctagagga attggcagcc 15840
atcttatcga tggctctgct cctgggcaaa ataggatcaa tactggtgat taagcttatg 15900
cctttcagcg gggattttgt tcagggattt ataagttatg tagggtctca ttatagagaa 15960
gtgaaccttg tataccctag atacagcaac ttcatctcta ctgaatctta tttggttatg 16020
acagatctca aggctaaccg gctaatgaat cctgaaaaga ttaagcagca gataattgaa 16080
tcatctgtga ggacttcacc tggacttata ggtcacatcc tatccattaa gcaactaagc 16140
tgcatacaag caattgtggg agacgcagtt agtagaggtg atatcaatcc tactctgaaa 16200
aaacttacac ctatagagca ggtgctgatc aattgcgggt tggcaattaa cggacctaag 16260
ctgtgcaaag aattgatcca ccatgatgtt gcctcagggc aagatggatt gcttaattct 16320
atactcatcc tctacaggga gttggcaaga ttcaaagaca accaaagaag tcaacaaggg 16380
atgttccacg cttaccccgt attggtaagt agcaggcaac gagaacttat atctaggatc 16440
acccgcaaat tctgggggca cattcttctt tactccggga acaaaaagtt gataaataag 16500
tttatccaga atctcaagtc cggctatctg atactagact tacaccagaa tatcttcgtt 16560
aagaatctat ccaagtcaga gaaacagatt attatgacgg ggggtttgaa acgtgagtgg 16620
gtttttaagg taacagtcaa ggagaccaaa gaatggtata agttagtcgg atacagtgcc 16680
ctgattaagg actaattggt tgaactccgg aaccctaatc ctgccctagg tggttaggca 16740
ttatttgcaa tatattaaag aaaactttga aaatacgaag tttctattcc cagctttgtc 16800
tggtggccgg catggtccca gcctcctcgc tggcgccggc tgggcaacat tccgagggga 16860
ccgtcccctc ggtaatggcg aatgggacgc ggccgatccg gctgctaaca aagcccgaaa 16920
ggaagctgag ttggctgctg ccaccgctga gcaataacta gcataacccc ttggggcctc 16980
taaacgggtc ttgaggggtt ttttgctgaa aggaggaact atatccggat gcggccgcca 17040
tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt 17100
caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 17160
aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag 17220
cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 17280
gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 17340
tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca 17400
ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 17460
ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgtgta 17520
tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 17580
gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg 17640
ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 17700
gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 17760
caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 17820
ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 17880
ctcgatgagt ttttctaatc agaattggtt aattggttgt aacattattc agattgggcc 17940
ccgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt 18000
tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 18060
ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag 18120
ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta 18180
gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat 18240
aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg 18300
ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg 18360
agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac 18420
aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga 18480
aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt 18540
ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta 18600
cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat 18660
tctgtggata accgtattac cgctag 18686
<210> 34
<211> 21800
<212> DNA
<213> Artificial sequence
<220>
<223> pKM-ATU2-S_2019-nCoV (optimized sequence)
<400> 34
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagc ctaccctcca tcattgttat 3480
aaaaaactta ggaaccaggt ccacacagcc gccagcccat caacgcgtac ggccaccatg 3540
ttcgtgtttc tggtgctgct gccactggtg tccagtcagt gcgtgaacct gaccacacga 3600
acacagctgc caccagccta caccaatagc ttcacccgcg gagtgtacta ccccgacaag 3660
gtgttccgca gcagcgtgct gcatagcacc caggatctgt ttctgccctt cttcagcaac 3720
gtgacctggt tccacgccat ccacgtgtcc ggcaccaatg gcaccaagcg cttcgataat 3780
cccgtgctgc ccttcaacga tggcgtgtac tttgccagca ccgagaagtc caatatcatc 3840
cgcggctgga tcttcggcac cacactggat agcaagaccc agagcctgct gatcgtgaac 3900
aacgccacca acgtggtcat caaagtgtgc gagttccagt tctgcaacga ccccttcctg 3960
ggcgtctact accacaagaa caacaagagc tggatggaaa gcgagttccg cgtgtacagc 4020
agcgccaaca actgcacctt cgagtacgtg tcccagccat tcctgatgga cctggaaggc 4080
aagcagggca acttcaagaa cctgcgcgag ttcgtgttca agaacatcga cggctacttc 4140
aaaatctaca gcaagcacac cccaatcaac ctcgtgcgcg atctgccaca gggattcagt 4200
gctctggaac ccctggtgga tctgcccatc ggcatcaaca ttacccgctt tcagacactg 4260
ctggccctgc accgcagtta cttgacacca ggcgatagca gcagtggatg gacagctggt 4320
gccgccgctt actacgttgg atatctgcag ccacgcacct ttctgctgaa gtacaacgag 4380
aacggcacca tcaccgacgc cgtggattgt gctctcgatc ccctgagcga gacaaagtgc 4440
accctgaagt ccttcaccgt cgagaagggc atctaccaga ccagcaattt ccgcgtgcag 4500
cccaccgaga gcatcgtgcg cttccccaat atcaccaatc tgtgcccctt cggcgaggtg 4560
ttcaatgcca cacgctttgc ctccgtgtac gcctggaatc gcaagcgcat tagcaactgc 4620
gtggccgact actccgtgct gtacaatagc gccagcttca gcaccttcaa gtgctacggc 4680
gtgtcaccca ccaagctgaa cgacctgtgc ttcaccaatg tgtacgccga cagcttcgtg 4740
atccgcggag atgaagtgcg acagattgcc ccaggccaga ccggcaagat cgccgactac 4800
aattacaagc tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg 4860
gattccaaag tcggcggcaa ctacaactac ctgtaccgcc tgttccgcaa gagcaatctg 4920
aagcccttcg agcgcgacat cagcaccgaa atctaccagg ccggaagcac cccatgcaac 4980
ggcgtggaag gcttcaactg ctacttccca ctgcagtcct acggatttca gcccacaaat 5040
ggcgtgggct accagccata tcgagtggtg gtgctgagct tcgaactgct gcatgctcca 5100
gctaccgtgt gcggccccaa gaagagtacc aacctggtca agaacaaatg cgtgaacttc 5160
aacttcaacg gcctgaccgg aaccggcgtg ctgaccgaga gtaacaagaa gttcctgcca 5220
ttccagcagt ttggccgcga cattgccgat acaaccgatg ccgttcgcga tccccagacc 5280
ttggagatcc tggatattac cccatgctcc ttcggcggcg tgtccgtgat tacaccaggc 5340
accaatacca gcaaccaggt ggccgttctg taccaggatg tgaattgcac agaggtgccc 5400
gtggccattc acgccgatca attgacacca acatggcgcg tgtactccac cggcagcaat 5460
gtgtttcaaa cccgcgctgg atgcctgatt ggagccgagc acgtgaacaa tagctacgag 5520
tgcgatatcc ccatcggagc cggaatctgc gcctcctatc agacccagac caatagtcca 5580
cgacgagccc gaagtgtggc cagccagagc atcattgcct ataccatgag cctgggcgcc 5640
gagaatagcg tggcctactc caacaacagc attgctatcc ccaccaactt caccatcagc 5700
gtgaccaccg agatcctgcc agtgtccatg accaagacca gcgtggactg caccatgtac 5760
atctgcggag atagcaccga gtgcagcaac ctgctgctgc agtacggaag tttctgcacc 5820
cagctgaatc gcgccctgac aggcattgcc gtggaacagg ataagaacac ccaagaggtg 5880
ttcgcccaag tgaagcaaat ctacaagacc ccaccaatca aggatttcgg cggcttcaat 5940
ttcagccaga ttctgcccga tccaagcaag cccagcaagc gcagcttcat cgaggacctg 6000
ctgttcaaca aagtgacact ggccgacgcc ggattcatca agcagtatgg cgattgcctg 6060
ggcgatattg ccgcacgcga tctgatttgc gcccagaagt ttaacggact gaccgtcctg 6120
ccaccactgc tgacagatga gatgatcgcc cagtacacaa gtgccctgct ggccggaacc 6180
attaccagcg gatggacatt tggagccggt gccgctctgc agattccctt cgctatgcag 6240
atggcctacc gcttcaatgg cattggcgtg acccagaatg tgctgtacga gaaccagaag 6300
ctgatcgcca accagttcaa cagcgccatc ggcaagattc aggacagcct gagtagtacc 6360
gccagcgctc tgggaaagct gcaggatgtg gtcaaccaga acgctcaggc cctgaacacc 6420
ctggttaagc agctgagcag caacttcggc gccatcagta gcgtgctgaa cgatatcctg 6480
agccgcctgg ataaggtgga agccgaggtg cagatcgatc gcctgattac cggacgcctg 6540
cagtccctgc agacctatgt gacacagcag ctgatccgag ccgccgagat tcgagctagt 6600
gctaatctgg ccgccaccaa gatgagcgaa tgtgtgctgg gacagagcaa gcgcgtggac 6660
ttttgcggca agggatacca cctgatgagc ttcccacaga gtgctccaca cggcgtggtg 6720
tttctgcatg tgacctacgt gcccgctcaa gagaagaatt tcaccaccgc tccagccatc 6780
tgccacgacg gaaaggccca ttttccacgc gagggcgtgt tcgttagcaa cggcactcat 6840
tggttcgtca cccagcgcaa cttctacgag ccccagatca tcaccaccga caacaccttc 6900
gtcagcggca actgcgacgt cgtgatcggc attgtgaaca acaccgtgta cgatccactg 6960
cagcccgagc tggacagctt caaagaggaa ctggacaagt actttaagaa ccacacaagc 7020
cccgacgtgg acctgggaga cattagcgga atcaacgcca gcgtggtcaa catccagaaa 7080
gagattgacc gcctgaacga ggtggccaag aatctgaacg agagcctgat cgacctgcaa 7140
gaactgggca aatacgagca gtacattaag tggccctggt acatctggct gggcttcatt 7200
gccggactga ttgccatcgt gatggtcacc attatgctgt gctgcatgac cagttgctgc 7260
agctgcctga agggatgctg cagttgcgga agctgctgca agttcgacga ggatgatagc 7320
gagccagtgc tgaagggcgt caagctgcac tacacctgat aacgagcgcg cagcgcttag 7380
acgtctcgcg atcgatacta gtacaaccta aatccattat aaaaaactta ggagcaaagt 7440
gattgcctcc caaggtccac aatgacagag acctacgact tcgacaagtc ggcatgggac 7500
atcaaagggt cgatcgctcc gatacaaccc accacctaca gtgatggcag gctggtgccc 7560
caggtcagag tcatagatcc tggtctaggc gacaggaagg atgaatgctt tatgtacatg 7620
tttctgctgg gggttgttga ggacagcgat tccctagggc ctccaatcgg gcgagcattt 7680
gggttcctgc ccttaggtgt tggcagatcc acagcaaagc ccgaaaaact cctcaaagag 7740
gccactgagc ttgacatagt tgttagacgt acagcagggc tcaatgaaaa actggtgttc 7800
tacaacaaca ccccactaac tctcctcaca ccttggagaa aggtcctaac aacagggagt 7860
gtcttcaacg caaaccaagt gtgcaatgcg gttaatctga taccgctcga taccccgcag 7920
aggttccgtg ttgtttatat gagcatcacc cgtctttcgg ataacgggta ttacaccgtt 7980
cctagaagaa tgctggaatt cagatcggtc aatgcagtgg ccttcaacct gctggtgacc 8040
cttaggattg acaaggcgat aggccctggg aagatcatcg acaatacaga gcaacttcct 8100
gaggcaacat ttatggtcca catcgggaac ttcaggagaa agaagagtga agtctactct 8160
gccgattatt gcaaaatgaa aatcgaaaag atgggcctgg tttttgcact tggtgggata 8220
gggggcacca gtcttcacat tagaagcaca ggcaaaatga gcaagactct ccatgcacaa 8280
ctcgggttca agaagacctt atgttacccg ctgatggata tcaatgaaga ccttaatcga 8340
ttactctgga ggagcagatg caagatagta agaatccagg cagttttgca gccatcagtt 8400
cctcaagaat tccgcattta cgacgacgtg atcataaatg atgaccaagg actattcaaa 8460
gttctgtaga ccgtagtgcc cagcaatgcc cgaaaacgac ccccctcaca atgacagcca 8520
gaaggcccgg acaaaaaagc cccctccgaa agactccacg gaccaagcga gaggccagcc 8580
agcagccgac ggcaagcgcg aacaccaggc ggccccagca cagaacagcc ctgacacaag 8640
gccaccacca gccaccccaa tctgcatcct cctcgtggga cccccgagga ccaaccccca 8700
aggctgcccc cgatccaaac caccaaccgc atccccacca cccccgggaa agaaaccccc 8760
agcaattgga aggcccctcc ccctcttcct caacacaaga actccacaac cgaaccgcac 8820
aagcgaccga ggtgacccaa ccgcaggcat ccgactccct agacagatcc tctctccccg 8880
gcaaactaaa caaaacttag ggccaaggaa catacacacc caacagaacc cagaccccgg 8940
cccacggcgc cgcgccccca acccccgaca accagaggga gcccccaacc aatcccgccg 9000
gctcccccgg tgcccacagg cagggacacc aacccccgaa cagacccagc acccaaccat 9060
cgacaatcca agacgggggg gcccccccaa aaaaaggccc ccaggggccg acagccagca 9120
ccgcgaggaa gcccacccac cccacacacg accacggcaa ccaaaccaga acccagacca 9180
ccctgggcca ccagctccca gactcggcca tcaccccgca gaaaggaaag gccacaaccc 9240
gcgcacccca gccccgatcc ggcggggagc cacccaaccc gaaccagcac ccaagagcga 9300
tccccgaagg acccccgaac cgcaaaggac atcagtatcc cacagcctct ccaagtcccc 9360
cggtctcctc ctcttctcga agggaccaaa agatcaatcc accacacccg acgacactca 9420
actccccacc cctaaaggag acaccgggaa tcccagaatc aagactcatc caatgtccat 9480
catgggtctc aaggtgaacg tctctgccat attcatggca gtactgttaa ctctccaaac 9540
acccaccggt caaatccatt ggggcaatct ctctaagata ggggtggtag gaataggaag 9600
tgcaagctac aaagttatga ctcgttccag ccatcaatca ttagtcataa aattaatgcc 9660
caatataact ctcctcaata actgcacgag ggtagagatt gcagaataca ggagactact 9720
gagaacagtt ttggaaccaa ttagagatgc acttaatgca atgacccaga atataagacc 9780
ggttcagagt gtagcttcaa gtaggagaca caagagattt gcgggagtag tcctggcagg 9840
tgcggcccta ggcgttgcca cagctgctca gataacagcc ggcattgcac ttcaccagtc 9900
catgctgaac tctcaagcca tcgacaatct gagagcgagc ctggaaacta ctaatcaggc 9960
aattgagaca atcagacaag cagggcagga gatgatattg gctgttcagg gtgtccaaga 10020
ctacatcaat aatgagctga taccgtctat gaaccaacta tcttgtgatt taatcggcca 10080
gaagctcggg ctcaaattgc tcagatacta tacagaaatc ctgtcattat ttggccccag 10140
tttacgggac cccatatctg cggagatatc tatccaggct ttgagctatg cgcttggagg 10200
agacatcaat aaggtgttag aaaagctcgg atacagtgga ggtgatttac tgggcatctt 10260
agagagcgga ggaataaagg cccggataac tcacgtcgac acagagtcct acttcattgt 10320
cctcagtata gcctatccga cgctgtccga gattaagggg gtgattgtcc accggctaga 10380
gggggtctcg tacaacatag gctctcaaga gtggtatacc actgtgccca agtatgttgc 10440
aacccaaggg taccttatct cgaattttga tgagtcatcg tgtactttca tgccagaggg 10500
gactgtgtgc agccaaaatg ccttgtaccc gatgagtcct ctgctccaag aatgcctccg 10560
ggggtacacc aagtcctgtg ctcgtacact cgtatccggg tcttttggga accggttcat 10620
tttatcacaa gggaacctaa tagccaattg tgcatcaatc ctttgcaagt gttacacaac 10680
aggaacgatc attaatcaag accctgacaa gatcctaaca tacattgctg ccgatcactg 10740
cccggtagtc gaggtgaacg gcgtgaccat ccaagtcggg agcaggaggt atccagacgc 10800
tgtgtacttg cacagaattg acctcggtcc tcccatatca ttggagaggt tggacgtagg 10860
gacaaatctg gggaatgcaa ttgctaagtt ggaggatgcc aaggaattgt tggagtcatc 10920
ggaccagata ttgaggagta tgaaaggttt atcgagcact agcatagtct acatcctgat 10980
tgcagtgtgt cttggagggt tgatagggat ccccgcttta atatgttgct gcagggggcg 11040
ttgtaacaaa aagggagaac aagttggtat gtcaagacca ggcctaaagc ctgatcttac 11100
gggaacatca aaatcctatg taaggtcgct ctgatcctct acaactcttg aaacacaaat 11160
gtcccacaag tctcctcttc gtcatcaagc aaccaccgca cccagcatca agcccacctg 11220
aaattatctc cggcttccct ctggccgaac aatatcggta gttaatcaaa acttagggtg 11280
caagatcatc cacaatgtca ccacaacgag accggataaa tgccttctac aaagataacc 11340
cccatcccaa gggaagtagg atagtcatta acagagaaca tcttatgatt gatagacctt 11400
atgttttgct ggctgttctg tttgtcatgt ttctgagctt gatcgggttg ctagccattg 11460
caggcattag acttcatcgg gcagccatct acaccgcaga gatccataaa agcctcagca 11520
ccaatctaga tgtaactaac tcaatcgagc atcaggtcaa ggacgtgctg acaccactct 11580
tcaaaatcat cggtgatgaa gtgggcctga ggacacctca gagattcact gacctagtga 11640
aattaatctc tgacaagatt aaattcctta atccggatag ggagtacgac ttcagagatc 11700
tcacttggtg tatcaacccg ccagagagaa tcaaattgga ttatgatcaa tactgtgcag 11760
atgtggctgc tgaagagctc atgaatgcat tggtgaactc aactctactg gagaccagaa 11820
caaccaatca gttcctagct gtctcaaagg gaaactgctc agggcccact acaatcagag 11880
gtcaattctc aaacatgtcg ctgtccctgt tagacttgta tttaggtcga ggttacaatg 11940
tgtcatctat agtcactatg acatcccagg gaatgtatgg gggaacttac ctagtggaaa 12000
agcctaatct gagcagcaaa aggtcagagt tgtcacaact gagcatgtac cgagtgtttg 12060
aagtaggtgt tatcagaaat ccgggtttgg gggctccggt gttccatatg acaaactatc 12120
ttgagcaacc agtcagtaat gatctcagca actgtatggt ggctttgggg gagctcaaac 12180
tcgcagccct ttgtcacggg gaagattcta tcacaattcc ctatcaggga tcagggaaag 12240
gtgtcagctt ccagctcgtc aagctaggtg tctggaaatc cccaaccgac atgcaatcct 12300
gggtcccctt atcaacggat gatccagtga tagacaggct ttacctctca tctcacagag 12360
gtgttatcgc tgacaatcaa gcaaaatggg ctgtcccgac aacacgaaca gatgacaagt 12420
tgcgaatgga gacatgcttc caacaggcgt gtaagggtaa aatccaagca ctctgcgaga 12480
atcccgagtg ggcaccattg aaggataaca ggattccttc atacggggtc ttgtctgttg 12540
atctgagtct gacagttgag cttaaaatca aaattgcttc gggattcggg ccattgatca 12600
cacacggttc agggatggac ctatacaaat ccaaccacaa caatgtgtat tggctgacta 12660
tcccgccaat gaagaaccta gccttaggtg taatcaacac attggagtgg ataccgagat 12720
tcaaggttag tccctacctc ttcactgtcc caattaagga agcaggcgaa gactgccatg 12780
ccccaacata cctacctgcg gaggtggatg gtgatgtcaa actcagttcc aatctggtga 12840
ttctacctgg tcaagatctc caatatgttt tggcaaccta cgatacttcc agggttgaac 12900
atgctgtggt ttattacgtt tacagcccaa gccgctcatt ttcttacttt tatcctttta 12960
ggttgcctat aaagggggtc cccatcgaat tacaagtgga atgcttcaca tgggaccaaa 13020
aactctggtg ccgtcacttc tgtgtgcttg cggactcaga atctggtgga catatcactc 13080
actctgggat ggtgggcatg ggagtcagct gcacagtcac ccgggaagat ggaaccaatc 13140
gcagataggg ctgctagtga accaatcaca tgatgtcacc cagacatcag gcatacccac 13200
tagtgtgaaa tagacatcag aattaagaaa aacgtagggt ccaagtggtt ccccgttatg 13260
gactcgctat ctgtcaacca gatcttatac cctgaagttc acctagatag cccgatagtt 13320
accaataaga tagtagccat cctggagtat gctcgagtcc ctcacgctta cagcctggag 13380
gaccctacac tgtgtcagaa catcaagcac cgcctaaaaa acggattttc caaccaaatg 13440
attataaaca atgtggaagt tgggaatgtc atcaagtcca agcttaggag ttatccggcc 13500
cactctcata ttccatatcc aaattgtaat caggatttat ttaacataga agacaaagag 13560
tcaacgagga agatccgtga actcctcaaa aaggggaatt cgctgtactc caaagtcagt 13620
gataaggttt tccaatgctt aagggacact aactcacggc ttggcctagg ctccgaattg 13680
agggaggaca tcaaggagaa agttattaac ttgggagttt acatgcacag ctcccagtgg 13740
tttgagccct ttctgttttg gtttacagtc aagactgaga tgaggtcagt gattaaatca 13800
caaacccata cttgccatag gaggagacac acacctgtat tcttcactgg tagttcagtt 13860
gagttgctaa tctctcgtga ccttgttgct ataatcagta aagagtctca acatgtatat 13920
tacctgacat ttgaactggt tttgatgtat tgtgatgtca tagaggggag gttaatgaca 13980
gagaccgcta tgactattga tgctaggtat acagagcttc taggaagagt cagatacatg 14040
tggaaactga tagatggttt cttccctgca ctcgggaatc caacttatca aattgtagcc 14100
atgctggagc ctctttcact tgcttacctg cagctgaggg atataacagt agaactcaga 14160
ggtgctttcc ttaaccactg ctttactgaa atacatgatg ttcttgacca aaacgggttt 14220
tctgatgaag gtacttatca tgagttaact gaagctctag attacatttt cataactgat 14280
gacatacatc tgacagggga gattttctca tttttcagaa gtttcggcca ccccagactt 14340
gaagcagtaa cggctgctga aaatgttagg aaatacatga atcagcctaa agtcattgtg 14400
tatgagactc tgatgaaagg tcatgccata ttttgtggaa tcataatcaa cggctatcgt 14460
gacaggcacg gaggcagttg gccaccgctg accctccccc tgcatgctgc agacacaatc 14520
cggaatgctc aagcttcagg tgaagggtta acacatgagc agtgcgttga taactggaaa 14580
tcttttgctg gagtgaaatt tggctgcttt atgcctctta gcctggatag tgatctgaca 14640
atgtacctaa aggacaaggc acttgctgct ctccaaaggg aatgggattc agtttacccg 14700
aaagagttcc tgcgttacga ccctcccaag ggaaccgggt cacggaggct tgtagatgtt 14760
ttccttaatg attcgagctt tgacccatat gatgtgataa tgtatgttgt aagtggagct 14820
tacctccatg accctgagtt caacctgtct tacagcctga aagaaaagga gatcaaggaa 14880
acaggtagac tttttgctaa aatgacttac aaaatgaggg catgccaagt gattgctgaa 14940
aatctaatct caaacgggat tggcaaatat tttaaggaca atgggatggc caaggatgag 15000
cacgatttga ctaaggcact ccacactcta gctgtctcag gagtccccaa agatctcaaa 15060
gaaagtcaca ggggggggcc agtcttaaaa acctactccc gaagcccagt ccacacaagt 15120
accaggaacg tgagagcagc aaaagggttt atagggttcc ctcaagtaat tcggcaggac 15180
caagacactg atcatccgga gaatatggaa gcttacgaga cagtcagtgc atttatcacg 15240
actgatctca agaagtactg ccttaattgg agatatgaga ccatcagctt gtttgcacag 15300
aggctaaatg agatttacgg attgccctca tttttccagt ggctgcataa gaggcttgag 15360
acctctgtcc tgtatgtaag tgaccctcat tgcccccccg accttgacgc ccatatcccg 15420
ttatataaag tccccaatga tcaaatcttc attaagtacc ctatgggagg tatagaaggg 15480
tattgtcaga agctgtggac catcagcacc attccctatc tatacctggc tgcttatgag 15540
agcggagtaa ggattgcttc gttagtgcaa ggggacaatc agaccatagc cgtaacaaaa 15600
agggtaccca gcacatggcc ctacaacctt aagaaacggg aagctgctag agtaactaga 15660
gattactttg taattcttag gcaaaggcta catgatattg gccatcacct caaggcaaat 15720
gagacaattg tttcatcaca tttttttgtc tattcaaaag gaatatatta tgatgggcta 15780
cttgtgtccc aatcactcaa gagcatcgca agatgtgtat tctggtcaga gactatagtt 15840
gatgaaacaa gggcagcatg cagtaatatt gctacaacaa tggctaaaag catcgagaga 15900
ggttatgacc gttaccttgc atattccctg aacgtcctaa aagtgataca gcaaattctg 15960
atctctcttg gcttcacaat caattcaacc atgacccggg atgtagtcat acccctcctc 16020
acaaacaacg acctcttaat aaggatggca ctgttgcccg ctcctattgg ggggatgaat 16080
tatctgaata tgagcaggct gtttgtcaga aacatcggtg atccagtaac atcatcaatt 16140
gctgatctca agagaatgat tctcgcctca ctaatgcctg aagagaccct ccatcaagta 16200
atgacacaac aaccggggga ctcttcattc ctagactggg ctagcgaccc ttactcagca 16260
aatcttgtat gtgtccagag catcactaga ctcctcaaga acataactgc aaggtttgtc 16320
ctgatccata gtccaaaccc aatgttaaaa ggattattcc atgatgacag taaagaagag 16380
gacgagggac tggcggcatt cctcatggac aggcatatta tagtacctag ggcagctcat 16440
gaaatcctgg atcatagtgt cacaggggca agagagtcta ttgcaggcat gctggatacc 16500
acaaaaggct tgattcgagc cagcatgagg aagggggggt taacctctcg agtgataacc 16560
agattgtcca attatgacta tgaacaattc agagcaggga tggtgctatt gacaggaaga 16620
aagagaaatg tcctcattga caaagagtca tgttcagtgc agctggcgag agctctaaga 16680
agccatatgt gggcgaggct agctcgagga cggcctattt acggccttga ggtccctgat 16740
gtactagaat ctatgcgagg ccaccttatt cggcgtcatg agacatgtgt catctgcgag 16800
tgtggatcag tcaactacgg atggtttttt gtcccctcgg gttgccaact ggatgatatt 16860
gacaaggaaa catcatcctt gagagtccca tatattggtt ctaccactga tgagagaaca 16920
gacatgaagc ttgccttcgt aagagcccca agtcgatcct tgcgatctgc tgttagaata 16980
gcaacagtgt actcatgggc ttacggtgat gatgatagct cttggaacga agcctggttg 17040
ttggctaggc aaagggccaa tgtgagcctg gaggagctaa gggtgatcac tcccatctca 17100
acttcgacta atttagcgca taggttgagg gatcgtagca ctcaagtgaa atactcaggt 17160
acatcccttg tccgagtggc gaggtatacc acaatctcca acgacaatct ctcatttgtc 17220
atatcagata agaaggttga tactaacttt atataccaac aaggaatgct tctagggttg 17280
ggtgttttag aaacattgtt tcgactcgag aaagataccg gatcatctaa cacggtatta 17340
catcttcacg tcgaaacaga ttgttgcgtg atcccgatga tagatcatcc caggataccc 17400
agctcccgca agctagagct gagggcagag ctatgtacca acccattgat atatgataat 17460
gcacctttaa ttgacagaga tgcaacaagg ctatacaccc agagccatag gaggcacctt 17520
gtggaatttg ttacatggtc cacaccccaa ctatatcaca ttttagctaa gtccacagca 17580
ctatctatga ttgacctggt aacaaaattt gagaaggacc atatgaatga aatttcagct 17640
ctcatagggg atgacgatat caatagtttc ataactgagt ttctgctcat agagccaaga 17700
ttattcacta tctacttggg ccagtgtgcg gccatcaatt gggcatttga tgtacattat 17760
catagaccat cagggaaata tcagatgggt gagctgttgt catcgttcct ttctagaatg 17820
agcaaaggag tgtttaaggt gcttgtcaat gctctaagcc acccaaagat ctacaagaaa 17880
ttctggcatt gtggtattat agagcctatc catggtcctt cacttgatgc tcaaaacttg 17940
cacacaactg tgtgcaacat ggtttacaca tgctatatga cctacctcga cctgttgttg 18000
aatgaagagt tagaagagtt cacatttctc ttgtgtgaaa gcgacgagga tgtagtaccg 18060
gacagattcg acaacatcca ggcaaaacac ttatgtgttc tggcagattt gtactgtcaa 18120
ccagggacct gcccaccaat tcgaggtcta agaccggtag agaaatgtgc agttctaacc 18180
gaccatatca aggcagaggc tatgttatct ccagcaggat cttcgtggaa cataaatcca 18240
attattgtag accattactc atgctctctg acttatctcc ggcgaggatc gatcaaacag 18300
ataagattga gagttgatcc aggattcatt ttcgacgccc tcgctgaggt aaatgtcagt 18360
cagccaaaga tcggcagcaa caacatctca aatatgagca tcaaggcttt cagaccccca 18420
cacgatgatg ttgcaaaatt gctcaaagat atcaacacaa gcaagcacaa tcttcccatt 18480
tcagggggca atctcgccaa ttatgaaatc catgctttcc gcagaatcgg gttgaactca 18540
tctgcttgct acaaagctgt tgagatatca acattaatta ggagatgcct tgagccaggg 18600
gaggacggct tgttcttggg tgagggatcg ggttctatgt tgatcactta taaagagata 18660
cttaaactaa acaagtgctt ctataatagt ggggtttccg ccaattctag atctggtcaa 18720
agggaattag caccctatcc ctccgaagtt ggccttgtcg aacacagaat gggagtaggt 18780
aatattgtca aagtgctctt taacgggagg cccgaagtca cgtgggtagg cagtgtagat 18840
tgcttcaatt tcatagttag taatatccct acctctagtg tggggtttat ccattcagat 18900
atagagacct tgcctgacaa agatactata gagaagctag aggaattggc agccatctta 18960
tcgatggctc tgctcctggg caaaatagga tcaatactgg tgattaagct tatgcctttc 19020
agcggggatt ttgttcaggg atttataagt tatgtagggt ctcattatag agaagtgaac 19080
cttgtatacc ctagatacag caacttcatc tctactgaat cttatttggt tatgacagat 19140
ctcaaggcta accggctaat gaatcctgaa aagattaagc agcagataat tgaatcatct 19200
gtgaggactt cacctggact tataggtcac atcctatcca ttaagcaact aagctgcata 19260
caagcaattg tgggagacgc agttagtaga ggtgatatca atcctactct gaaaaaactt 19320
acacctatag agcaggtgct gatcaattgc gggttggcaa ttaacggacc taagctgtgc 19380
aaagaattga tccaccatga tgttgcctca gggcaagatg gattgcttaa ttctatactc 19440
atcctctaca gggagttggc aagattcaaa gacaaccaaa gaagtcaaca agggatgttc 19500
cacgcttacc ccgtattggt aagtagcagg caacgagaac ttatatctag gatcacccgc 19560
aaattctggg ggcacattct tctttactcc gggaacaaaa agttgataaa taagtttatc 19620
cagaatctca agtccggcta tctgatacta gacttacacc agaatatctt cgttaagaat 19680
ctatccaagt cagagaaaca gattattatg acggggggtt tgaaacgtga gtgggttttt 19740
aaggtaacag tcaaggagac caaagaatgg tataagttag tcggatacag tgccctgatt 19800
aaggactaat tggttgaact ccggaaccct aatcctgccc taggtggtta ggcattattt 19860
gcaatatatt aaagaaaact ttgaaaatac gaagtttcta ttcccagctt tgtctggtgg 19920
ccggcatggt cccagcctcc tcgctggcgc cggctgggca acattccgag gggaccgtcc 19980
cctcggtaat ggcgaatggg acgcggccga tccggctgct aacaaagccc gaaaggaagc 20040
tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 20100
ggtcttgagg ggttttttgc tgaaaggagg aactatatcc ggatgcggcc gccatgaaca 20160
ataaaactgt ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg 20220
gaaacgtcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 20280
gctcgcgata atgtcgggca atcaggtgcg acaatctatc gcttgtatgg gaagcccgat 20340
gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 20400
atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa gcattttatc 20460
cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggaaaaac agcattccag 20520
gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 20580
cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg tgtatttcgt 20640
ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 20700
gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataaact tttgccattc 20760
tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 20820
gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 20880
cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 20940
caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 21000
gagtttttct aatcagaatt ggttaattgg ttgtaacatt attcagattg ggccccgttc 21060
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 21120
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 21180
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 21240
aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 21300
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 21360
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 21420
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 21480
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 21540
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 21600
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 21660
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 21720
ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 21780
gataaccgta ttaccgctag 21800
<210> 35
<211> 21800
<212> DNA
<213> Artificial sequence
<220>
<223> pKM-ATU3-S_2019-nCoV (optimized sequence)
<400> 35
gcgatcgcta atacgactca ctatagggcc aactttgttt ggtctgatga gtccgtgagg 60
acgaaacccg gagtcccggg tcaccaaaca aagttgggta aggatagttc aatcaatgat 120
catcttctag tgcacttagg attcaagatc ctattatcag ggacaagagc aggattaggg 180
atatccgaga tggccacact tttaaggagc ttagcattgt tcaaaagaaa caaggacaaa 240
ccacccatta catcaggatc cggtggagcc atcagaggaa tcaaacacat tattatagta 300
ccaatccctg gagattcctc aattaccact cgatccagac ttctggaccg gttggtgagg 360
ttaattggaa acccggatgt gagcgggccc aaactaacag gggcactaat aggtatatta 420
tccttatttg tggagtctcc aggtcaattg attcagagga tcaccgatga ccctgacgtt 480
agcataaggc tgttagaggt tgtccagagt gaccagtcac aatctggcct taccttcgca 540
tcaagaggta ccaacatgga ggatgaggcg gaccaatact tttcacatga tgatccaatt 600
agtagtgatc aatccaggtt cggatggttc gggaacaagg aaatctcaga tattgaagtg 660
caagaccctg agggattcaa catgattctg ggtaccatcc tagcccaaat ttgggtcttg 720
ctcgcaaagg cggttacggc cccagacacg gcagctgatt cggagctaag aaggtggata 780
aagtacaccc aacaaagaag ggtagttggt gaatttagat tggagagaaa atggttggat 840
gtggtgagga acaggattgc cgaggacctc tccttacgcc gattcatggt cgctctaatc 900
ctggatatca agagaacacc cggaaacaaa cccaggattg ctgaaatgat atgtgacatt 960
gatacatata tcgtagaggc aggattagcc agttttatcc tgactattaa gtttgggata 1020
gaaactatgt atcctgctct tggactgcat gaatttgctg gtgagttatc cacacttgag 1080
tccttgatga acctttacca gcaaatgggg gaaactgcac cctacatggt aatcctggag 1140
aactcaattc agaacaagtt cagtgcagga tcataccctc tgctctggag ctatgccatg 1200
ggagtaggag tggaacttga aaactccatg ggaggtttga actttggccg atcttacttt 1260
gatccagcat attttagatt agggcaagag atggtaagga ggtcagctgg aaaggtcagt 1320
tccacattgg catctgaact cggtatcact gccgaggatg caaggcttgt ttcagagatt 1380
gcaatgcata ctactgagga caagatcagt agagcggttg gacccagaca agcccaagta 1440
tcatttctac acggtgatca aagtgagaat gagctaccga gattgggggg caaggaagat 1500
aggagggtca aacagagtcg aggagaagcc agggagagct acagagaaac cgggcccagc 1560
agagcaagtg atgcgagagc tgcccatctt ccaaccggca cacccctaga cattgacact 1620
gcaacggagt ccagccaaga tccgcaggac agtcgaaggt cagctgacgc cctgcttagg 1680
ctgcaagcca tggcaggaat ctcggaagaa caaggctcag acacggacac ccctatagtg 1740
tacaatgaca gaaatcttct agactaggtg cgagaggccg agggccagaa caacatccgc 1800
ctaccatcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 1860
caaccatcca ctcccacgat tggagccaat ggcagaagag caggcacgcc atgtcaaaaa 1920
cggactggaa tgcatccggg ctctcaaggc cgagcccatc ggctcactgg ccatcgagga 1980
agctatggca gcatggtcag aaatatcaga caacccagga caggagcgag ccacctgcag 2040
ggaagagaag gcaggcagtt cgggtctcag caaaccatgc ctctcagcaa ttggatcaac 2100
tgaaggcggt gcacctcgca tccgcggtca gggacctgga gagagcgatg acgacgctga 2160
aactttggga atccccccaa gaaatctcca ggcatcaagc actgggttac agtgttatta 2220
cgtttatgat cacagcggtg aagcggttaa gggaatccaa gatgctgact ctatcatggt 2280
tcaatcaggc cttgatggtg atagcaccct ctcaggagga gacaatgaat ctgaaaacag 2340
cgatgtggat attggcgaac ctgataccga gggatatgct atcactgacc ggggatctgc 2400
tcccatctct atggggttca gggcttctga tgttgaaact gcagaaggag gggagatcca 2460
cgagctcctg agactccaat ccagaggcaa caactttccg aagcttggga aaactctcaa 2520
tgttcctccg cccccggacc ccggtagggc cagcacttcc gggacaccca ttaaaaaggg 2580
cacagacgcg agattagcct catttggaac ggagatcgcg tctttattga caggtggtgc 2640
aacccaatgt gctcgaaagt caccctcgga accatcaggg ccaggtgcac ctgcggggaa 2700
tgtccccgag tgtgtgagca atgccgcact gatacaggag tggacacccg aatctggtac 2760
cacaatctcc ccgagatccc agaataatga agaaggggga gactattatg atgatgagct 2820
gttctctgat gtccaagata ttaaaacagc cttggccaaa atacacgagg ataatcagaa 2880
gataatctcc aagctagaat cactgctgtt attgaaggga gaagttgagt caattaagaa 2940
gcagatcaac aggcaaaata tcagcatatc caccctggaa ggacacctct caagcatcat 3000
gatcgccatt cctggacttg ggaaggatcc caacgacccc actgcagatg tcgaaatcaa 3060
tcccgacttg aaacccatca taggcagaga ttcaggccga gcactggccg aagttctcaa 3120
gaaacccgtt gccagccgac aactccaagg aatgacaaat ggacggacca gttccagagg 3180
acagctgctg aaggaatttc agctaaagcc gatcgggaaa aagatgagct cagccgtcgg 3240
gtttgttcct gacaccggcc ctgcatcacg cagtgtaatc cgctccatta taaaatccag 3300
ccggctagag gaggatcgga agcgttacct gatgactctc cttgatgata tcaaaggagc 3360
caatgatctt gccaagttcc accagatgct gatgaagata ataatgaagt agctacagct 3420
caacttacct gccaacccca tgccagtcga cccaactagt acaacctaaa tccattataa 3480
aaaacttagg agcaaagtga ttgcctccca aggtccacaa tgacagagac ctacgacttc 3540
gacaagtcgg catgggacat caaagggtcg atcgctccga tacaacccac cacctacagt 3600
gatggcaggc tggtgcccca ggtcagagtc atagatcctg gtctaggcga caggaaggat 3660
gaatgcttta tgtacatgtt tctgctgggg gttgttgagg acagcgattc cctagggcct 3720
ccaatcgggc gagcatttgg gttcctgccc ttaggtgttg gcagatccac agcaaagccc 3780
gaaaaactcc tcaaagaggc cactgagctt gacatagttg ttagacgtac agcagggctc 3840
aatgaaaaac tggtgttcta caacaacacc ccactaactc tcctcacacc ttggagaaag 3900
gtcctaacaa cagggagtgt cttcaacgca aaccaagtgt gcaatgcggt taatctgata 3960
ccgctcgata ccccgcagag gttccgtgtt gtttatatga gcatcacccg tctttcggat 4020
aacgggtatt acaccgttcc tagaagaatg ctggaattca gatcggtcaa tgcagtggcc 4080
ttcaacctgc tggtgaccct taggattgac aaggcgatag gccctgggaa gatcatcgac 4140
aatacagagc aacttcctga ggcaacattt atggtccaca tcgggaactt caggagaaag 4200
aagagtgaag tctactctgc cgattattgc aaaatgaaaa tcgaaaagat gggcctggtt 4260
tttgcacttg gtgggatagg gggcaccagt cttcacatta gaagcacagg caaaatgagc 4320
aagactctcc atgcacaact cgggttcaag aagaccttat gttacccgct gatggatatc 4380
aatgaagacc ttaatcgatt actctggagg agcagatgca agatagtaag aatccaggca 4440
gttttgcagc catcagttcc tcaagaattc cgcatttacg acgacgtgat cataaatgat 4500
gaccaaggac tattcaaagt tctgtagacc gtagtgccca gcaatgcccg aaaacgaccc 4560
ccctcacaat gacagccaga aggcccggac aaaaaagccc cctccgaaag actccacgga 4620
ccaagcgaga ggccagccag cagccgacgg caagcgcgaa caccaggcgg ccccagcaca 4680
gaacagccct gacacaaggc caccaccagc caccccaatc tgcatcctcc tcgtgggacc 4740
cccgaggacc aacccccaag gctgcccccg atccaaacca ccaaccgcat ccccaccacc 4800
cccgggaaag aaacccccag caattggaag gcccctcccc ctcttcctca acacaagaac 4860
tccacaaccg aaccgcacaa gcgaccgagg tgacccaacc gcaggcatcc gactccctag 4920
acagatcctc tctccccggc aaactaaaca aaacttaggg ccaaggaaca tacacaccca 4980
acagaaccca gaccccggcc cacggcgccg cgcccccaac ccccgacaac cagagggagc 5040
ccccaaccaa tcccgccggc tcccccggtg cccacaggca gggacaccaa cccccgaaca 5100
gacccagcac ccaaccatcg acaatccaag acgggggggc ccccccaaaa aaaggccccc 5160
aggggccgac agccagcacc gcgaggaagc ccacccaccc cacacacgac cacggcaacc 5220
aaaccagaac ccagaccacc ctgggccacc agctcccaga ctcggccatc accccgcaga 5280
aaggaaaggc cacaacccgc gcaccccagc cccgatccgg cggggagcca cccaacccga 5340
accagcaccc aagagcgatc cccgaaggac ccccgaaccg caaaggacat cagtatccca 5400
cagcctctcc aagtcccccg gtctcctcct cttctcgaag ggaccaaaag atcaatccac 5460
cacacccgac gacactcaac tccccacccc taaaggagac accgggaatc ccagaatcaa 5520
gactcatcca atgtccatca tgggtctcaa ggtgaacgtc tctgccatat tcatggcagt 5580
actgttaact ctccaaacac ccaccggtca aatccattgg ggcaatctct ctaagatagg 5640
ggtggtagga ataggaagtg caagctacaa agttatgact cgttccagcc atcaatcatt 5700
agtcataaaa ttaatgccca atataactct cctcaataac tgcacgaggg tagagattgc 5760
agaatacagg agactactga gaacagtttt ggaaccaatt agagatgcac ttaatgcaat 5820
gacccagaat ataagaccgg ttcagagtgt agcttcaagt aggagacaca agagatttgc 5880
gggagtagtc ctggcaggtg cggccctagg cgttgccaca gctgctcaga taacagccgg 5940
cattgcactt caccagtcca tgctgaactc tcaagccatc gacaatctga gagcgagcct 6000
ggaaactact aatcaggcaa ttgagacaat cagacaagca gggcaggaga tgatattggc 6060
tgttcagggt gtccaagact acatcaataa tgagctgata ccgtctatga accaactatc 6120
ttgtgattta atcggccaga agctcgggct caaattgctc agatactata cagaaatcct 6180
gtcattattt ggccccagtt tacgggaccc catatctgcg gagatatcta tccaggcttt 6240
gagctatgcg cttggaggag acatcaataa ggtgttagaa aagctcggat acagtggagg 6300
tgatttactg ggcatcttag agagcggagg aataaaggcc cggataactc acgtcgacac 6360
agagtcctac ttcattgtcc tcagtatagc ctatccgacg ctgtccgaga ttaagggggt 6420
gattgtccac cggctagagg gggtctcgta caacataggc tctcaagagt ggtataccac 6480
tgtgcccaag tatgttgcaa cccaagggta ccttatctcg aattttgatg agtcatcgtg 6540
tactttcatg ccagagggga ctgtgtgcag ccaaaatgcc ttgtacccga tgagtcctct 6600
gctccaagaa tgcctccggg ggtacaccaa gtcctgtgct cgtacactcg tatccgggtc 6660
ttttgggaac cggttcattt tatcacaagg gaacctaata gccaattgtg catcaatcct 6720
ttgcaagtgt tacacaacag gaacgatcat taatcaagac cctgacaaga tcctaacata 6780
cattgctgcc gatcactgcc cggtagtcga ggtgaacggc gtgaccatcc aagtcgggag 6840
caggaggtat ccagacgctg tgtacttgca cagaattgac ctcggtcctc ccatatcatt 6900
ggagaggttg gacgtaggga caaatctggg gaatgcaatt gctaagttgg aggatgccaa 6960
ggaattgttg gagtcatcgg accagatatt gaggagtatg aaaggtttat cgagcactag 7020
catagtctac atcctgattg cagtgtgtct tggagggttg atagggatcc ccgctttaat 7080
atgttgctgc agggggcgtt gtaacaaaaa gggagaacaa gttggtatgt caagaccagg 7140
cctaaagcct gatcttacgg gaacatcaaa atcctatgta aggtcgctct gatcctctac 7200
aactcttgaa acacaaatgt cccacaagtc tcctcttcgt catcaagcaa ccaccgcacc 7260
cagcatcaag cccacctgaa attatctccg gcttccctct ggccgaacaa tatcggtagt 7320
taatcaaaac ttagggtgca agatcatcca caatgtcacc acaacgagac cggataaatg 7380
ccttctacaa agataacccc catcccaagg gaagtaggat agtcattaac agagaacatc 7440
ttatgattga tagaccttat gttttgctgg ctgttctgtt tgtcatgttt ctgagcttga 7500
tcgggttgct agccattgca ggcattagac ttcatcgggc agccatctac accgcagaga 7560
tccataaaag cctcagcacc aatctagatg taactaactc aatcgagcat caggtcaagg 7620
acgtgctgac accactcttc aaaatcatcg gtgatgaagt gggcctgagg acacctcaga 7680
gattcactga cctagtgaaa ttaatctctg acaagattaa attccttaat ccggataggg 7740
agtacgactt cagagatctc acttggtgta tcaacccgcc agagagaatc aaattggatt 7800
atgatcaata ctgtgcagat gtggctgctg aagagctcat gaatgcattg gtgaactcaa 7860
ctctactgga gaccagaaca accaatcagt tcctagctgt ctcaaaggga aactgctcag 7920
ggcccactac aatcagaggt caattctcaa acatgtcgct gtccctgtta gacttgtatt 7980
taggtcgagg ttacaatgtg tcatctatag tcactatgac atcccaggga atgtatgggg 8040
gaacttacct agtggaaaag cctaatctga gcagcaaaag gtcagagttg tcacaactga 8100
gcatgtaccg agtgtttgaa gtaggtgtta tcagaaatcc gggtttgggg gctccggtgt 8160
tccatatgac aaactatctt gagcaaccag tcagtaatga tctcagcaac tgtatggtgg 8220
ctttggggga gctcaaactc gcagcccttt gtcacgggga agattctatc acaattccct 8280
atcagggatc agggaaaggt gtcagcttcc agctcgtcaa gctaggtgtc tggaaatccc 8340
caaccgacat gcaatcctgg gtccccttat caacggatga tccagtgata gacaggcttt 8400
acctctcatc tcacagaggt gttatcgctg acaatcaagc aaaatgggct gtcccgacaa 8460
cacgaacaga tgacaagttg cgaatggaga catgcttcca acaggcgtgt aagggtaaaa 8520
tccaagcact ctgcgagaat cccgagtggg caccattgaa ggataacagg attccttcat 8580
acggggtctt gtctgttgat ctgagtctga cagttgagct taaaatcaaa attgcttcgg 8640
gattcgggcc attgatcaca cacggttcag ggatggacct atacaaatcc aaccacaaca 8700
atgtgtattg gctgactatc ccgccaatga agaacctagc cttaggtgta atcaacacat 8760
tggagtggat accgagattc aaggttagtc cctacctctt cactgtccca attaaggaag 8820
caggcgaaga ctgccatgcc ccaacatacc tacctgcgga ggtggatggt gatgtcaaac 8880
tcagttccaa tctggtgatt ctacctggtc aagatctcca atatgttttg gcaacctacg 8940
atacttccag ggttgaacat gctgtggttt attacgttta cagcccaagc cgctcatttt 9000
cttactttta tccttttagg ttgcctataa agggggtccc catcgaatta caagtggaat 9060
gcttcacatg ggaccaaaaa ctctggtgcc gtcacttctg tgtgcttgcg gactcagaat 9120
ctggtggaca tatcactcac tctgggatgg tgggcatggg agtcagctgc acagtcaccc 9180
gggaagatgg aaccaatcgc agatagggct gctagtgaac caatcacatg atgtcaccca 9240
gacatcaggc atacccacta gtctaccctc catcattgtt ataaaaaact taggaaccag 9300
gtccacacag ccgccagccc atcaacgcgt acggccacca tgttcgtgtt tctggtgctg 9360
ctgccactgg tgtccagtca gtgcgtgaac ctgaccacac gaacacagct gccaccagcc 9420
tacaccaata gcttcacccg cggagtgtac taccccgaca aggtgttccg cagcagcgtg 9480
ctgcatagca cccaggatct gtttctgccc ttcttcagca acgtgacctg gttccacgcc 9540
atccacgtgt ccggcaccaa tggcaccaag cgcttcgata atcccgtgct gcccttcaac 9600
gatggcgtgt actttgccag caccgagaag tccaatatca tccgcggctg gatcttcggc 9660
accacactgg atagcaagac ccagagcctg ctgatcgtga acaacgccac caacgtggtc 9720
atcaaagtgt gcgagttcca gttctgcaac gaccccttcc tgggcgtcta ctaccacaag 9780
aacaacaaga gctggatgga aagcgagttc cgcgtgtaca gcagcgccaa caactgcacc 9840
ttcgagtacg tgtcccagcc attcctgatg gacctggaag gcaagcaggg caacttcaag 9900
aacctgcgcg agttcgtgtt caagaacatc gacggctact tcaaaatcta cagcaagcac 9960
accccaatca acctcgtgcg cgatctgcca cagggattca gtgctctgga acccctggtg 10020
gatctgccca tcggcatcaa cattacccgc tttcagacac tgctggccct gcaccgcagt 10080
tacttgacac caggcgatag cagcagtgga tggacagctg gtgccgccgc ttactacgtt 10140
ggatatctgc agccacgcac ctttctgctg aagtacaacg agaacggcac catcaccgac 10200
gccgtggatt gtgctctcga tcccctgagc gagacaaagt gcaccctgaa gtccttcacc 10260
gtcgagaagg gcatctacca gaccagcaat ttccgcgtgc agcccaccga gagcatcgtg 10320
cgcttcccca atatcaccaa tctgtgcccc ttcggcgagg tgttcaatgc cacacgcttt 10380
gcctccgtgt acgcctggaa tcgcaagcgc attagcaact gcgtggccga ctactccgtg 10440
ctgtacaata gcgccagctt cagcaccttc aagtgctacg gcgtgtcacc caccaagctg 10500
aacgacctgt gcttcaccaa tgtgtacgcc gacagcttcg tgatccgcgg agatgaagtg 10560
cgacagattg ccccaggcca gaccggcaag atcgccgact acaattacaa gctgcccgac 10620
gacttcaccg gctgcgtgat cgcctggaac agcaacaacc tggattccaa agtcggcggc 10680
aactacaact acctgtaccg cctgttccgc aagagcaatc tgaagccctt cgagcgcgac 10740
atcagcaccg aaatctacca ggccggaagc accccatgca acggcgtgga aggcttcaac 10800
tgctacttcc cactgcagtc ctacggattt cagcccacaa atggcgtggg ctaccagcca 10860
tatcgagtgg tggtgctgag cttcgaactg ctgcatgctc cagctaccgt gtgcggcccc 10920
aagaagagta ccaacctggt caagaacaaa tgcgtgaact tcaacttcaa cggcctgacc 10980
ggaaccggcg tgctgaccga gagtaacaag aagttcctgc cattccagca gtttggccgc 11040
gacattgccg atacaaccga tgccgttcgc gatccccaga ccttggagat cctggatatt 11100
accccatgct ccttcggcgg cgtgtccgtg attacaccag gcaccaatac cagcaaccag 11160
gtggccgttc tgtaccagga tgtgaattgc acagaggtgc ccgtggccat tcacgccgat 11220
caattgacac caacatggcg cgtgtactcc accggcagca atgtgtttca aacccgcgct 11280
ggatgcctga ttggagccga gcacgtgaac aatagctacg agtgcgatat ccccatcgga 11340
gccggaatct gcgcctccta tcagacccag accaatagtc cacgacgagc ccgaagtgtg 11400
gccagccaga gcatcattgc ctataccatg agcctgggcg ccgagaatag cgtggcctac 11460
tccaacaaca gcattgctat ccccaccaac ttcaccatca gcgtgaccac cgagatcctg 11520
ccagtgtcca tgaccaagac cagcgtggac tgcaccatgt acatctgcgg agatagcacc 11580
gagtgcagca acctgctgct gcagtacgga agtttctgca cccagctgaa tcgcgccctg 11640
acaggcattg ccgtggaaca ggataagaac acccaagagg tgttcgccca agtgaagcaa 11700
atctacaaga ccccaccaat caaggatttc ggcggcttca atttcagcca gattctgccc 11760
gatccaagca agcccagcaa gcgcagcttc atcgaggacc tgctgttcaa caaagtgaca 11820
ctggccgacg ccggattcat caagcagtat ggcgattgcc tgggcgatat tgccgcacgc 11880
gatctgattt gcgcccagaa gtttaacgga ctgaccgtcc tgccaccact gctgacagat 11940
gagatgatcg cccagtacac aagtgccctg ctggccggaa ccattaccag cggatggaca 12000
tttggagccg gtgccgctct gcagattccc ttcgctatgc agatggccta ccgcttcaat 12060
ggcattggcg tgacccagaa tgtgctgtac gagaaccaga agctgatcgc caaccagttc 12120
aacagcgcca tcggcaagat tcaggacagc ctgagtagta ccgccagcgc tctgggaaag 12180
ctgcaggatg tggtcaacca gaacgctcag gccctgaaca ccctggttaa gcagctgagc 12240
agcaacttcg gcgccatcag tagcgtgctg aacgatatcc tgagccgcct ggataaggtg 12300
gaagccgagg tgcagatcga tcgcctgatt accggacgcc tgcagtccct gcagacctat 12360
gtgacacagc agctgatccg agccgccgag attcgagcta gtgctaatct ggccgccacc 12420
aagatgagcg aatgtgtgct gggacagagc aagcgcgtgg acttttgcgg caagggatac 12480
cacctgatga gcttcccaca gagtgctcca cacggcgtgg tgtttctgca tgtgacctac 12540
gtgcccgctc aagagaagaa tttcaccacc gctccagcca tctgccacga cggaaaggcc 12600
cattttccac gcgagggcgt gttcgttagc aacggcactc attggttcgt cacccagcgc 12660
aacttctacg agccccagat catcaccacc gacaacacct tcgtcagcgg caactgcgac 12720
gtcgtgatcg gcattgtgaa caacaccgtg tacgatccac tgcagcccga gctggacagc 12780
ttcaaagagg aactggacaa gtactttaag aaccacacaa gccccgacgt ggacctggga 12840
gacattagcg gaatcaacgc cagcgtggtc aacatccaga aagagattga ccgcctgaac 12900
gaggtggcca agaatctgaa cgagagcctg atcgacctgc aagaactggg caaatacgag 12960
cagtacatta agtggccctg gtacatctgg ctgggcttca ttgccggact gattgccatc 13020
gtgatggtca ccattatgct gtgctgcatg accagttgct gcagctgcct gaagggatgc 13080
tgcagttgcg gaagctgctg caagttcgac gaggatgata gcgagccagt gctgaagggc 13140
gtcaagctgc actacacctg ataacgagcg cgcagcgctt agacgtctcg cgatcgatgc 13200
tagtgtgaaa tagacatcag aattaagaaa aacgtagggt ccaagtggtt ccccgttatg 13260
gactcgctat ctgtcaacca gatcttatac cctgaagttc acctagatag cccgatagtt 13320
accaataaga tagtagccat cctggagtat gctcgagtcc ctcacgctta cagcctggag 13380
gaccctacac tgtgtcagaa catcaagcac cgcctaaaaa acggattttc caaccaaatg 13440
attataaaca atgtggaagt tgggaatgtc atcaagtcca agcttaggag ttatccggcc 13500
cactctcata ttccatatcc aaattgtaat caggatttat ttaacataga agacaaagag 13560
tcaacgagga agatccgtga actcctcaaa aaggggaatt cgctgtactc caaagtcagt 13620
gataaggttt tccaatgctt aagggacact aactcacggc ttggcctagg ctccgaattg 13680
agggaggaca tcaaggagaa agttattaac ttgggagttt acatgcacag ctcccagtgg 13740
tttgagccct ttctgttttg gtttacagtc aagactgaga tgaggtcagt gattaaatca 13800
caaacccata cttgccatag gaggagacac acacctgtat tcttcactgg tagttcagtt 13860
gagttgctaa tctctcgtga ccttgttgct ataatcagta aagagtctca acatgtatat 13920
tacctgacat ttgaactggt tttgatgtat tgtgatgtca tagaggggag gttaatgaca 13980
gagaccgcta tgactattga tgctaggtat acagagcttc taggaagagt cagatacatg 14040
tggaaactga tagatggttt cttccctgca ctcgggaatc caacttatca aattgtagcc 14100
atgctggagc ctctttcact tgcttacctg cagctgaggg atataacagt agaactcaga 14160
ggtgctttcc ttaaccactg ctttactgaa atacatgatg ttcttgacca aaacgggttt 14220
tctgatgaag gtacttatca tgagttaact gaagctctag attacatttt cataactgat 14280
gacatacatc tgacagggga gattttctca tttttcagaa gtttcggcca ccccagactt 14340
gaagcagtaa cggctgctga aaatgttagg aaatacatga atcagcctaa agtcattgtg 14400
tatgagactc tgatgaaagg tcatgccata ttttgtggaa tcataatcaa cggctatcgt 14460
gacaggcacg gaggcagttg gccaccgctg accctccccc tgcatgctgc agacacaatc 14520
cggaatgctc aagcttcagg tgaagggtta acacatgagc agtgcgttga taactggaaa 14580
tcttttgctg gagtgaaatt tggctgcttt atgcctctta gcctggatag tgatctgaca 14640
atgtacctaa aggacaaggc acttgctgct ctccaaaggg aatgggattc agtttacccg 14700
aaagagttcc tgcgttacga ccctcccaag ggaaccgggt cacggaggct tgtagatgtt 14760
ttccttaatg attcgagctt tgacccatat gatgtgataa tgtatgttgt aagtggagct 14820
tacctccatg accctgagtt caacctgtct tacagcctga aagaaaagga gatcaaggaa 14880
acaggtagac tttttgctaa aatgacttac aaaatgaggg catgccaagt gattgctgaa 14940
aatctaatct caaacgggat tggcaaatat tttaaggaca atgggatggc caaggatgag 15000
cacgatttga ctaaggcact ccacactcta gctgtctcag gagtccccaa agatctcaaa 15060
gaaagtcaca ggggggggcc agtcttaaaa acctactccc gaagcccagt ccacacaagt 15120
accaggaacg tgagagcagc aaaagggttt atagggttcc ctcaagtaat tcggcaggac 15180
caagacactg atcatccgga gaatatggaa gcttacgaga cagtcagtgc atttatcacg 15240
actgatctca agaagtactg ccttaattgg agatatgaga ccatcagctt gtttgcacag 15300
aggctaaatg agatttacgg attgccctca tttttccagt ggctgcataa gaggcttgag 15360
acctctgtcc tgtatgtaag tgaccctcat tgcccccccg accttgacgc ccatatcccg 15420
ttatataaag tccccaatga tcaaatcttc attaagtacc ctatgggagg tatagaaggg 15480
tattgtcaga agctgtggac catcagcacc attccctatc tatacctggc tgcttatgag 15540
agcggagtaa ggattgcttc gttagtgcaa ggggacaatc agaccatagc cgtaacaaaa 15600
agggtaccca gcacatggcc ctacaacctt aagaaacggg aagctgctag agtaactaga 15660
gattactttg taattcttag gcaaaggcta catgatattg gccatcacct caaggcaaat 15720
gagacaattg tttcatcaca tttttttgtc tattcaaaag gaatatatta tgatgggcta 15780
cttgtgtccc aatcactcaa gagcatcgca agatgtgtat tctggtcaga gactatagtt 15840
gatgaaacaa gggcagcatg cagtaatatt gctacaacaa tggctaaaag catcgagaga 15900
ggttatgacc gttaccttgc atattccctg aacgtcctaa aagtgataca gcaaattctg 15960
atctctcttg gcttcacaat caattcaacc atgacccggg atgtagtcat acccctcctc 16020
acaaacaacg acctcttaat aaggatggca ctgttgcccg ctcctattgg ggggatgaat 16080
tatctgaata tgagcaggct gtttgtcaga aacatcggtg atccagtaac atcatcaatt 16140
gctgatctca agagaatgat tctcgcctca ctaatgcctg aagagaccct ccatcaagta 16200
atgacacaac aaccggggga ctcttcattc ctagactggg ctagcgaccc ttactcagca 16260
aatcttgtat gtgtccagag catcactaga ctcctcaaga acataactgc aaggtttgtc 16320
ctgatccata gtccaaaccc aatgttaaaa ggattattcc atgatgacag taaagaagag 16380
gacgagggac tggcggcatt cctcatggac aggcatatta tagtacctag ggcagctcat 16440
gaaatcctgg atcatagtgt cacaggggca agagagtcta ttgcaggcat gctggatacc 16500
acaaaaggct tgattcgagc cagcatgagg aagggggggt taacctctcg agtgataacc 16560
agattgtcca attatgacta tgaacaattc agagcaggga tggtgctatt gacaggaaga 16620
aagagaaatg tcctcattga caaagagtca tgttcagtgc agctggcgag agctctaaga 16680
agccatatgt gggcgaggct agctcgagga cggcctattt acggccttga ggtccctgat 16740
gtactagaat ctatgcgagg ccaccttatt cggcgtcatg agacatgtgt catctgcgag 16800
tgtggatcag tcaactacgg atggtttttt gtcccctcgg gttgccaact ggatgatatt 16860
gacaaggaaa catcatcctt gagagtccca tatattggtt ctaccactga tgagagaaca 16920
gacatgaagc ttgccttcgt aagagcccca agtcgatcct tgcgatctgc tgttagaata 16980
gcaacagtgt actcatgggc ttacggtgat gatgatagct cttggaacga agcctggttg 17040
ttggctaggc aaagggccaa tgtgagcctg gaggagctaa gggtgatcac tcccatctca 17100
acttcgacta atttagcgca taggttgagg gatcgtagca ctcaagtgaa atactcaggt 17160
acatcccttg tccgagtggc gaggtatacc acaatctcca acgacaatct ctcatttgtc 17220
atatcagata agaaggttga tactaacttt atataccaac aaggaatgct tctagggttg 17280
ggtgttttag aaacattgtt tcgactcgag aaagataccg gatcatctaa cacggtatta 17340
catcttcacg tcgaaacaga ttgttgcgtg atcccgatga tagatcatcc caggataccc 17400
agctcccgca agctagagct gagggcagag ctatgtacca acccattgat atatgataat 17460
gcacctttaa ttgacagaga tgcaacaagg ctatacaccc agagccatag gaggcacctt 17520
gtggaatttg ttacatggtc cacaccccaa ctatatcaca ttttagctaa gtccacagca 17580
ctatctatga ttgacctggt aacaaaattt gagaaggacc atatgaatga aatttcagct 17640
ctcatagggg atgacgatat caatagtttc ataactgagt ttctgctcat agagccaaga 17700
ttattcacta tctacttggg ccagtgtgcg gccatcaatt gggcatttga tgtacattat 17760
catagaccat cagggaaata tcagatgggt gagctgttgt catcgttcct ttctagaatg 17820
agcaaaggag tgtttaaggt gcttgtcaat gctctaagcc acccaaagat ctacaagaaa 17880
ttctggcatt gtggtattat agagcctatc catggtcctt cacttgatgc tcaaaacttg 17940
cacacaactg tgtgcaacat ggtttacaca tgctatatga cctacctcga cctgttgttg 18000
aatgaagagt tagaagagtt cacatttctc ttgtgtgaaa gcgacgagga tgtagtaccg 18060
gacagattcg acaacatcca ggcaaaacac ttatgtgttc tggcagattt gtactgtcaa 18120
ccagggacct gcccaccaat tcgaggtcta agaccggtag agaaatgtgc agttctaacc 18180
gaccatatca aggcagaggc tatgttatct ccagcaggat cttcgtggaa cataaatcca 18240
attattgtag accattactc atgctctctg acttatctcc ggcgaggatc gatcaaacag 18300
ataagattga gagttgatcc aggattcatt ttcgacgccc tcgctgaggt aaatgtcagt 18360
cagccaaaga tcggcagcaa caacatctca aatatgagca tcaaggcttt cagaccccca 18420
cacgatgatg ttgcaaaatt gctcaaagat atcaacacaa gcaagcacaa tcttcccatt 18480
tcagggggca atctcgccaa ttatgaaatc catgctttcc gcagaatcgg gttgaactca 18540
tctgcttgct acaaagctgt tgagatatca acattaatta ggagatgcct tgagccaggg 18600
gaggacggct tgttcttggg tgagggatcg ggttctatgt tgatcactta taaagagata 18660
cttaaactaa acaagtgctt ctataatagt ggggtttccg ccaattctag atctggtcaa 18720
agggaattag caccctatcc ctccgaagtt ggccttgtcg aacacagaat gggagtaggt 18780
aatattgtca aagtgctctt taacgggagg cccgaagtca cgtgggtagg cagtgtagat 18840
tgcttcaatt tcatagttag taatatccct acctctagtg tggggtttat ccattcagat 18900
atagagacct tgcctgacaa agatactata gagaagctag aggaattggc agccatctta 18960
tcgatggctc tgctcctggg caaaatagga tcaatactgg tgattaagct tatgcctttc 19020
agcggggatt ttgttcaggg atttataagt tatgtagggt ctcattatag agaagtgaac 19080
cttgtatacc ctagatacag caacttcatc tctactgaat cttatttggt tatgacagat 19140
ctcaaggcta accggctaat gaatcctgaa aagattaagc agcagataat tgaatcatct 19200
gtgaggactt cacctggact tataggtcac atcctatcca ttaagcaact aagctgcata 19260
caagcaattg tgggagacgc agttagtaga ggtgatatca atcctactct gaaaaaactt 19320
acacctatag agcaggtgct gatcaattgc gggttggcaa ttaacggacc taagctgtgc 19380
aaagaattga tccaccatga tgttgcctca gggcaagatg gattgcttaa ttctatactc 19440
atcctctaca gggagttggc aagattcaaa gacaaccaaa gaagtcaaca agggatgttc 19500
cacgcttacc ccgtattggt aagtagcagg caacgagaac ttatatctag gatcacccgc 19560
aaattctggg ggcacattct tctttactcc gggaacaaaa agttgataaa taagtttatc 19620
cagaatctca agtccggcta tctgatacta gacttacacc agaatatctt cgttaagaat 19680
ctatccaagt cagagaaaca gattattatg acggggggtt tgaaacgtga gtgggttttt 19740
aaggtaacag tcaaggagac caaagaatgg tataagttag tcggatacag tgccctgatt 19800
aaggactaat tggttgaact ccggaaccct aatcctgccc taggtggtta ggcattattt 19860
gcaatatatt aaagaaaact ttgaaaatac gaagtttcta ttcccagctt tgtctggtgg 19920
ccggcatggt cccagcctcc tcgctggcgc cggctgggca acattccgag gggaccgtcc 19980
cctcggtaat ggcgaatggg acgcggccga tccggctgct aacaaagccc gaaaggaagc 20040
tgagttggct gctgccaccg ctgagcaata actagcataa ccccttgggg cctctaaacg 20100
ggtcttgagg ggttttttgc tgaaaggagg aactatatcc ggatgcggcc gccatgaaca 20160
ataaaactgt ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg 20220
gaaacgtcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 20280
gctcgcgata atgtcgggca atcaggtgcg acaatctatc gcttgtatgg gaagcccgat 20340
gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 20400
atggtcagac taaactggct gacggaattt atgcctcttc cgaccatcaa gcattttatc 20460
cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggaaaaac agcattccag 20520
gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 20580
cgccggttgc attcgattcc tgtttgtaat tgtcctttta acagcgatcg tgtatttcgt 20640
ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 20700
gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataaact tttgccattc 20760
tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 20820
gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 20880
cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 20940
caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 21000
gagtttttct aatcagaatt ggttaattgg ttgtaacatt attcagattg ggccccgttc 21060
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 21120
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 21180
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 21240
aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 21300
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 21360
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 21420
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 21480
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 21540
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 21600
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 21660
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 21720
ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 21780
gataaccgta ttaccgctag 21800
<210> 36
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> MV-optimized nucleotide sequence of the spike (S) polypeptide of
nCoV
<400> 36
gctagcggat cccgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60
agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120
acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180
gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240
acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300
gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360
aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420
tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480
atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540
cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600
gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660
gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720
atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780
gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840
cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900
cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960
taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020
acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080
tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140
agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200
accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260
ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320
gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380
tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440
tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500
cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560
ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620
ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680
actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740
acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800
ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860
caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920
tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980
gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040
agttatcaga cccaaacaaa tagtccaaga cgagcaagaa gtgtggccag tcagagtatt 2100
attgcctata caatgagtct gggagccgag aatagtgtgg cctatagtaa caattccatt 2160
gctatcccca ccaactttac cattagtgtg acaacagaga ttctgccagt gtccatgaca 2220
aagacaagtg tggattgcac catgtacatt tgcggagata gtacagaatg cagtaatctg 2280
ctgctgcagt atggaagttt ctgtacacaa ctgaatagag ccctgactgg aattgctgtg 2340
gaacaggata agaatactca agaggtgttc gcccaagtga agcaaatcta taagacccca 2400
cctattaagg atttcggcgg attcaatttc agtcagattt tgccagatcc aagcaagcca 2460
tccaaacgca gttttattga ggacctgctg ttcaacaaag tgacattggc tgatgctggc 2520
tttattaagc aatatggcga ttgtctggga gatatagctg ccagagattt gatttgcgcc 2580
caaaagttta atggattgac agttttgcca ccactgctga cagatgagat gattgctcag 2640
tatacaagtg ctctgctggc cggaacaatt acatcaggat ggacatttgg agctggtgca 2700
gcattgcaaa taccatttgc tatgcagatg gcctaccgct ttaatggtat tggagttacc 2760
cagaacgtgc tgtacgaaaa tcagaagctg atcgccaatc agttcaatag cgccattgga 2820
aaaattcagg atagcctgag tagtactgct agtgctcttg gaaaactgca ggatgtggtt 2880
aatcagaatg ctcaggctct gaatactctg gttaagcagt tgagttccaa tttcggagct 2940
attagcagtg tgctgaacga tattctgagt cgtttggata aggttgaggc cgaagttcag 3000
attgatagac tgattacagg acgactgcag agcttgcaga catatgttac acaacaactg 3060
attcgagccg ctgaaattag agctagtgct aatttggctg ccacaaagat gagtgaatgt 3120
gtgcttggac agagcaaaag agtggatttt tgcggcaaag gataccatct gatgagcttt 3180
ccacaaagtg ctccacatgg tgttgtgttt ctgcatgtta cttatgtgcc cgctcaagag 3240
aagaatttca caacagctcc agccatttgc catgatggaa aagctcattt tccacgagaa 3300
ggcgtgttcg ttagtaatgg tactcattgg ttcgtgaccc agcgcaattt ttacgagcca 3360
cagattatta ccaccgacaa tactttcgtg tccggcaatt gtgatgttgt gattggaatc 3420
gtgaacaaca cagtgtacga tccattgcag ccagagctgg atagttttaa agaggaactg 3480
gacaagtact tcaagaacca tacaagtcca gatgtggatc tgggcgatat tagtggaatc 3540
aatgcctccg tggtcaacat ccagaaagaa attgatcgac tgaacgaagt ggccaagaat 3600
ttgaatgaga gcctgattga tctgcaagag ctgggcaaat acgagcagta tattaagtgg 3660
ccttggtaca tttggctggg attcattgct ggactgattg ccattgtgat ggttaccatt 3720
atgctgtgtt gcatgacaag ttgttgcagt tgcctgaaag gatgctgtag ttgcggtagt 3780
tgctgcaagt ttgatgagga tgatagtgaa ccagtgctga aaggcgtgaa gctgcattat 3840
acttgataac gagcgcgcct cgaggaattc 3870
<210> 37
<211> 1308
<212> DNA
<213> Artificial sequence
<220>
<223> MV-optimized nucleotide sequence of the N polypeptide of CoV
<400> 37
gctagcggat cccgtacggc caccatgagt gataatggac cacaaaatca acgcaatgcc 60
ccaagaatta catttggagg accaagtgat agcaccggaa gtaatcaaaa tggcgaaaga 120
agtggtgcta gaagtaaaca aagacgacca caaggactgc caaacaatac tgctagttgg 180
tttacagctc tgacccagca tggaaaagag gatttgaaat ttccaagagg acagggcgtg 240
ccaatcaata ccaatagtag tccagatgat cagattggct attatagacg agctacaaga 300
agaatacgag gcggagatgg aaaaatgaag gatttgagtc cacgctggta cttctattat 360
cttggaacag gaccagaggc tggattgcca tatggtgcta acaaagatgg aattatttgg 420
gttgcaacag aaggtgccct gaatacccca aaagatcata ttggaacacg caatcctgcc 480
aacaatgctg caattgtgtt gcaattgcca cagggaacaa cactgcctaa aggattctat 540
gctgagggaa gtagaggtgg aagtcaagct agttcaagaa gtagtagtcg cagtagaaat 600
agcagtcgaa atagtacacc tggaagtagt agaggaacaa gtccagctag aatggctgga 660
aatggtggtg atgctgcttt ggctttgttg ctgttggata gactgaatca gctggaaagc 720
aaaatgagtg gcaaaggaca acaacagcag ggacagacag ttacaaagaa aagtgctgct 780
gaagcaagca agaaaccacg tcaaaaacga acagccacaa aggcctataa tgtgacacaa 840
gcttttggac gaagaggacc agaacagaca cagggaaatt ttggagatca agaactgatt 900
cgccagggaa cagattacaa acattggcca caaattgccc agtttgctcc aagtgctagt 960
gctttctttg gaatgagtcg aattggaatg gaagtgacac caagtggaac atggttgaca 1020
tatacaggtg ccatcaagct ggatgataag gacccaaatt tcaaggatca agtgatcctg 1080
ctgaacaaac acatcgacgc ctataagaca tttccaccaa cagaacccaa gaaggataag 1140
aagaagaaag ctgacgaaac acaagctctg ccacagagac aaaagaaaca gcaaacagtt 1200
actctgctgc cagctgctga tctggatgat ttcagtaaac aactgcagca gagcatgagt 1260
agtgctgata gtacacaagc ctgataacga gcgcgcctcg aggaattc 1308
<210> 38
<211> 19795
<212> DNA
<213> Artificial sequence
<220>
<223> pTM3-MVSchw-gfp
<400> 38
accaaacaaa gttgggtaag gatagttcaa tcaatgatca tcttctagtg cacttaggat 60
tcaagatcct attatcaggg acaagagcag gattagggat atccgagatg gccacacttt 120
taaggagctt agcattgttc aaaagaaaca aggacaaacc acccattaca tcaggatccg 180
gtggagccat cagaggaatc aaacacatta ttatagtacc aatccctgga gattcctcaa 240
ttaccactcg atccagactt ctggaccggt tggtgaggtt aattggaaac ccggatgtga 300
gcgggcccaa actaacaggg gcactaatag gtatattatc cttatttgtg gagtctccag 360
gtcaattgat tcagaggatc accgatgacc ctgacgttag cataaggctg ttagaggttg 420
tccagagtga ccagtcacaa tctggcctta ccttcgcatc aagaggtacc aacatggagg 480
atgaggcgga ccaatacttt tcacatgatg atccaattag tagtgatcaa tccaggttcg 540
gatggttcgg gaacaaggaa atctcagata ttgaagtgca agaccctgag ggattcaaca 600
tgattctggg taccatccta gcccaaattt gggtcttgct cgcaaaggcg gttacggccc 660
cagacacggc agctgattcg gagctaagaa ggtggataaa gtacacccaa caaagaaggg 720
tagttggtga atttagattg gagagaaaat ggttggatgt ggtgaggaac aggattgccg 780
aggacctctc cttacgccga ttcatggtcg ctctaatcct ggatatcaag agaacacccg 840
gaaacaaacc caggattgct gaaatgatat gtgacattga tacatatatc gtagaggcag 900
gattagccag ttttatcctg actattaagt ttgggataga aactatgtat cctgctcttg 960
gactgcatga atttgctggt gagttatcca cacttgagtc cttgatgaac ctttaccagc 1020
aaatggggga aactgcaccc tacatggtaa tcctggagaa ctcaattcag aacaagttca 1080
gtgcaggatc ataccctctg ctctggagct atgccatggg agtaggagtg gaacttgaaa 1140
actccatggg aggtttgaac tttggccgat cttactttga tccagcatat tttagattag 1200
ggcaagagat ggtaaggagg tcagctggaa aggtcagttc cacattggca tctgaactcg 1260
gtatcactgc cgaggatgca aggcttgttt cagagattgc aatgcatact actgaggaca 1320
agatcagtag agcggttgga cccagacaag cccaagtatc atttctacac ggtgatcaaa 1380
gtgagaatga gctaccgaga ttggggggca aggaagatag gagggtcaaa cagagtcgag 1440
gagaagccag ggagagctac agagaaaccg ggcccagcag agcaagtgat gcgagagctg 1500
cccatcttcc aaccggcaca cccctagaca ttgacactgc aacggagtcc agccaagatc 1560
cgcaggacag tcgaaggtca gctgacgccc tgcttaggct gcaagccatg gcaggaatct 1620
cggaagaaca aggctcagac acggacaccc ctatagtgta caatgacaga aatcttctag 1680
actaggtgcg agaggccgag ggccagaaca acatccgcct accatccatc attgttataa 1740
aaaacttagg aaccaggtcc acacagccgc cagcccatca accatccact cccacgattg 1800
gagccaatgg cagaagagca ggcacgccat gtcaaaaacg gactggaatg catccgggct 1860
ctcaaggccg agcccatcgg ctcactggcc atcgaggaag ctatggcagc atggtcagaa 1920
atatcagaca acccaggaca ggagcgagcc acctgcaggg aagagaaggc aggcagttcg 1980
ggtctcagca aaccatgcct ctcagcaatt ggatcaactg aaggcggtgc acctcgcatc 2040
cgcggtcagg gacctggaga gagcgatgac gacgctgaaa ctttgggaat ccccccaaga 2100
aatctccagg catcaagcac tgggttacag tgttattacg tttatgatca cagcggtgaa 2160
gcggttaagg gaatccaaga tgctgactct atcatggttc aatcaggcct tgatggtgat 2220
agcaccctct caggaggaga caatgaatct gaaaacagcg atgtggatat tggcgaacct 2280
gataccgagg gatatgctat cactgaccgg ggatctgctc ccatctctat ggggttcagg 2340
gcttctgatg ttgaaactgc agaaggaggg gagatccacg agctcctgag actccaatcc 2400
agaggcaaca actttccgaa gcttgggaaa actctcaatg ttcctccgcc cccggacccc 2460
ggtagggcca gcacttccgg gacacccatt aaaaagggca cagacgcgag attagcctca 2520
tttggaacgg agatcgcgtc tttattgaca ggtggtgcaa cccaatgtgc tcgaaagtca 2580
ccctcggaac catcagggcc aggtgcacct gcggggaatg tccccgagtg tgtgagcaat 2640
gccgcactga tacaggagtg gacacccgaa tctggtacca caatctcccc gagatcccag 2700
aataatgaag aagggggaga ctattatgat gatgagctgt tctctgatgt ccaagatatt 2760
aaaacagcct tggccaaaat acacgaggat aatcagaaga taatctccaa gctagaatca 2820
ctgctgttat tgaagggaga agttgagtca attaagaagc agatcaacag gcaaaatatc 2880
agcatatcca ccctggaagg acacctctca agcatcatga tcgccattcc tggacttggg 2940
aaggatccca acgaccccac tgcagatgtc gaaatcaatc ccgacttgaa acccatcata 3000
ggcagagatt caggccgagc actggccgaa gttctcaaga aacccgttgc cagccgacaa 3060
ctccaaggaa tgacaaatgg acggaccagt tccagaggac agctgctgaa ggaatttcag 3120
ctaaagccga tcgggaaaaa gatgagctca gccgtcgggt ttgttcctga caccggccct 3180
gcatcacgca gtgtaatccg ctccattata aaatccagcc ggctagagga ggatcggaag 3240
cgttacctga tgactctcct tgatgatatc aaaggagcca atgatcttgc caagttccac 3300
cagatgctga tgaagataat aatgaagtag ctacagctca acttacctgc caaccccatg 3360
ccagtcgacc caactagtac aacctaaatc cattataaaa aacttaggag caaagtgatt 3420
gcctcccaag gtccacaatg acagagacct acgacttcga caagtcggca tgggacatca 3480
aagggtcgat cgctccgata caacccacca cctacagtga tggcaggctg gtgccccagg 3540
tcagagtcat agatcctggt ctaggcgaca ggaaggatga atgctttatg tacatgtttc 3600
tgctgggggt tgttgaggac agcgattccc tagggcctcc aatcgggcga gcatttgggt 3660
tcctgccctt aggtgttggc agatccacag caaagcccga aaaactcctc aaagaggcca 3720
ctgagcttga catagttgtt agacgtacag cagggctcaa tgaaaaactg gtgttctaca 3780
acaacacccc actaactctc ctcacacctt ggagaaaggt cctaacaaca gggagtgtct 3840
tcaacgcaaa ccaagtgtgc aatgcggtta atctgatacc gctcgatacc ccgcagaggt 3900
tccgtgttgt ttatatgagc atcacccgtc tttcggataa cgggtattac accgttccta 3960
gaagaatgct ggaattcaga tcggtcaatg cagtggcctt caacctgctg gtgaccctta 4020
ggattgacaa ggcgataggc cctgggaaga tcatcgacaa tacagagcaa cttcctgagg 4080
caacatttat ggtccacatc gggaacttca ggagaaagaa gagtgaagtc tactctgccg 4140
attattgcaa aatgaaaatc gaaaagatgg gcctggtttt tgcacttggt gggatagggg 4200
gcaccagtct tcacattaga agcacaggca aaatgagcaa gactctccat gcacaactcg 4260
ggttcaagaa gaccttatgt tacccgctga tggatatcaa tgaagacctt aatcgattac 4320
tctggaggag cagatgcaag atagtaagaa tccaggcagt tttgcagcca tcagttcctc 4380
aagaattccg catttacgac gacgtgatca taaatgatga ccaaggacta ttcaaagttc 4440
tgtagaccgt agtgcccagc aatgcccgaa aacgaccccc ctcacaatga cagccagaag 4500
gcccggacaa aaaagccccc tccgaaagac tccacggacc aagcgagagg ccagccagca 4560
gccgacggca agcgcgaaca ccaggcggcc ccagcacaga acagccctga cacaaggcca 4620
ccaccagcca ccccaatctg catcctcctc gtgggacccc cgaggaccaa cccccaaggc 4680
tgcccccgat ccaaaccacc aaccgcatcc ccaccacccc cgggaaagaa acccccagca 4740
attggaaggc ccctccccct cttcctcaac acaagaactc cacaaccgaa ccgcacaagc 4800
gaccgaggtg acccaaccgc aggcatccga ctccctagac agatcctctc tccccggcaa 4860
actaaacaaa acttagggcc aaggaacata cacacccaac agaacccaga ccccggccca 4920
cggcgccgcg cccccaaccc ccgacaacca gagggagccc ccaaccaatc ccgccggctc 4980
ccccggtgcc cacaggcagg gacaccaacc cccgaacaga cccagcaccc aaccatcgac 5040
aatccaagac gggggggccc ccccaaaaaa aggcccccag gggccgacag ccagcaccgc 5100
gaggaagccc acccacccca cacacgacca cggcaaccaa accagaaccc agaccaccct 5160
gggccaccag ctcccagact cggccatcac cccgcagaaa ggaaaggcca caacccgcgc 5220
accccagccc cgatccggcg gggagccacc caacccgaac cagcacccaa gagcgatccc 5280
cgaaggaccc ccgaaccgca aaggacatca gtatcccaca gcctctccaa gtcccccggt 5340
ctcctcctct tctcgaaggg accaaaagat caatccacca cacccgacga cactcaactc 5400
cccaccccta aaggagacac cgggaatccc agaatcaaga ctcatccaat gtccatcatg 5460
ggtctcaagg tgaacgtctc tgccatattc atggcagtac tgttaactct ccaaacaccc 5520
accggtcaaa tccattgggg caatctctct aagatagggg tggtaggaat aggaagtgca 5580
agctacaaag ttatgactcg ttccagccat caatcattag tcataaaatt aatgcccaat 5640
ataactctcc tcaataactg cacgagggta gagattgcag aatacaggag actactgaga 5700
acagttttgg aaccaattag agatgcactt aatgcaatga cccagaatat aagaccggtt 5760
cagagtgtag cttcaagtag gagacacaag agatttgcgg gagtagtcct ggcaggtgcg 5820
gccctaggcg ttgccacagc tgctcagata acagccggca ttgcacttca ccagtccatg 5880
ctgaactctc aagccatcga caatctgaga gcgagcctgg aaactactaa tcaggcaatt 5940
gagacaatca gacaagcagg gcaggagatg atattggctg ttcagggtgt ccaagactac 6000
atcaataatg agctgatacc gtctatgaac caactatctt gtgatttaat cggccagaag 6060
ctcgggctca aattgctcag atactataca gaaatcctgt cattatttgg ccccagttta 6120
cgggacccca tatctgcgga gatatctatc caggctttga gctatgcgct tggaggagac 6180
atcaataagg tgttagaaaa gctcggatac agtggaggtg atttactggg catcttagag 6240
agcggaggaa taaaggcccg gataactcac gtcgacacag agtcctactt cattgtcctc 6300
agtatagcct atccgacgct gtccgagatt aagggggtga ttgtccaccg gctagagggg 6360
gtctcgtaca acataggctc tcaagagtgg tataccactg tgcccaagta tgttgcaacc 6420
caagggtacc ttatctcgaa ttttgatgag tcatcgtgta ctttcatgcc agaggggact 6480
gtgtgcagcc aaaatgcctt gtacccgatg agtcctctgc tccaagaatg cctccggggg 6540
tacaccaagt cctgtgctcg tacactcgta tccgggtctt ttgggaaccg gttcatttta 6600
tcacaaggga acctaatagc caattgtgca tcaatccttt gcaagtgtta cacaacagga 6660
acgatcatta atcaagaccc tgacaagatc ctaacataca ttgctgccga tcactgcccg 6720
gtagtcgagg tgaacggcgt gaccatccaa gtcgggagca ggaggtatcc agacgctgtg 6780
tacttgcaca gaattgacct cggtcctccc atatcattgg agaggttgga cgtagggaca 6840
aatctgggga atgcaattgc taagttggag gatgccaagg aattgttgga gtcatcggac 6900
cagatattga ggagtatgaa aggtttatcg agcactagca tagtctacat cctgattgca 6960
gtgtgtcttg gagggttgat agggatcccc gctttaatat gttgctgcag ggggcgttgt 7020
aacaaaaagg gagaacaagt tggtatgtca agaccaggcc taaagcctga tcttacggga 7080
acatcaaaat cctatgtaag gtcgctctga tcctctacaa ctcttgaaac acaaatgtcc 7140
cacaagtctc ctcttcgtca tcaagcaacc accgcaccca gcatcaagcc cacctgaaat 7200
tatctccggc ttccctctgg ccgaacaata tcggtagtta atcaaaactt agggtgcaag 7260
atcatccaca atgtcaccac aacgagaccg gataaatgcc ttctacaaag ataaccccca 7320
tcccaaggga agtaggatag tcattaacag agaacatctt atgattgata gaccttatgt 7380
tttgctggct gttctgtttg tcatgtttct gagcttgatc gggttgctag ccattgcagg 7440
cattagactt catcgggcag ccatctacac cgcagagatc cataaaagcc tcagcaccaa 7500
tctagatgta actaactcaa tcgagcatca ggtcaaggac gtgctgacac cactcttcaa 7560
aatcatcggt gatgaagtgg gcctgaggac acctcagaga ttcactgacc tagtgaaatt 7620
aatctctgac aagattaaat tccttaatcc ggatagggag tacgacttca gagatctcac 7680
ttggtgtatc aacccgccag agagaatcaa attggattat gatcaatact gtgcagatgt 7740
ggctgctgaa gagctcatga atgcattggt gaactcaact ctactggaga ccagaacaac 7800
caatcagttc ctagctgtct caaagggaaa ctgctcaggg cccactacaa tcagaggtca 7860
attctcaaac atgtcgctgt ccctgttaga cttgtattta ggtcgaggtt acaatgtgtc 7920
atctatagtc actatgacat cccagggaat gtatggggga acttacctag tggaaaagcc 7980
taatctgagc agcaaaaggt cagagttgtc acaactgagc atgtaccgag tgtttgaagt 8040
aggtgttatc agaaatccgg gtttgggggc tccggtgttc catatgacaa actatcttga 8100
gcaaccagtc agtaatgatc tcagcaactg tatggtggct ttgggggagc tcaaactcgc 8160
agccctttgt cacggggaag attctatcac aattccctat cagggatcag ggaaaggtgt 8220
cagcttccag ctcgtcaagc taggtgtctg gaaatcccca accgacatgc aatcctgggt 8280
ccccttatca acggatgatc cagtgataga caggctttac ctctcatctc acagaggtgt 8340
tatcgctgac aatcaagcaa aatgggctgt cccgacaaca cgaacagatg acaagttgcg 8400
aatggagaca tgcttccaac aggcgtgtaa gggtaaaatc caagcactct gcgagaatcc 8460
cgagtgggca ccattgaagg ataacaggat tccttcatac ggggtcttgt ctgttgatct 8520
gagtctgaca gttgagctta aaatcaaaat tgcttcggga ttcgggccat tgatcacaca 8580
cggttcaggg atggacctat acaaatccaa ccacaacaat gtgtattggc tgactatccc 8640
gccaatgaag aacctagcct taggtgtaat caacacattg gagtggatac cgagattcaa 8700
ggttagtccc tacctcttca ctgtcccaat taaggaagca ggcgaagact gccatgcccc 8760
aacataccta cctgcggagg tggatggtga tgtcaaactc agttccaatc tggtgattct 8820
acctggtcaa gatctccaat atgttttggc aacctacgat acttccaggg ttgaacatgc 8880
tgtggtttat tacgtttaca gcccaagccg ctcattttct tacttttatc cttttaggtt 8940
gcctataaag ggggtcccca tcgaattaca agtggaatgc ttcacatggg accaaaaact 9000
ctggtgccgt cacttctgtg tgcttgcgga ctcagaatct ggtggacata tcactcactc 9060
tgggatggtg ggcatgggag tcagctgcac agtcacccgg gaagatggaa ccaatcgcag 9120
atagggctgc tagtgaacca atcacatgat gtcacccaga catcaggcat acccactagt 9180
ctaccctcca tcattgttat aaaaaactta ggaaccaggt ccacacagcc gccagcccat 9240
caacgcgtac gatggtgagc aagggcgagg agctgttcac cggggtggtg cccatcctgg 9300
tcgagctgga cggcgacgta aacggccaca agttcagcgt gtccggcgag ggcgagggcg 9360
atgccaccta cggcaagctg accctgaagt tcatctgcac caccggcaag ctgcccgtgc 9420
cctggcccac cctcgtgacc accctgacct acggcgtgca gtgcttcagc cgctaccccg 9480
accacatgaa gcagcacgac ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc 9540
gcaccatctt cttcaaggac gacggcaact acaagacccg cgccgaggtg aagttcgagg 9600
gcgacaccct ggtgaaccgc atcgagctga agggcatcga cttcaaggag gacggcaaca 9660
tcctggggca caagctggag tacaactaca acagccacaa cgtctatatc atggccgaca 9720
agcagaagaa cggcatcaag gtgaacttca agatccgcca caacatcgag gacggcagcg 9780
tgcagctcgc cgaccactac cagcagaaca cccccatcgg cgacggcccc gtgctgctgc 9840
ccgacaacca ctacctgagc acccagtccg ccctgagcaa agaccccaac gagaagcgcg 9900
atcacatggt cctgctggag ttcgtgaccg ccgccgggat cactctcggc atggacgagc 9960
tgtacaagta ggcgcgcagc gcttagacgt ctcgcgatcg atgctagtgt gaaatagaca 10020
tcagaattaa gaaaaacgta gggtccaagt ggttccccgt tatggactcg ctatctgtca 10080
accagatctt ataccctgaa gttcacctag atagcccgat agttaccaat aagatagtag 10140
ccatcctgga gtatgctcga gtccctcacg cttacagcct ggaggaccct acactgtgtc 10200
agaacatcaa gcaccgccta aaaaacggat tttccaacca aatgattata aacaatgtgg 10260
aagttgggaa tgtcatcaag tccaagctta ggagttatcc ggcccactct catattccat 10320
atccaaattg taatcaggat ttatttaaca tagaagacaa agagtcaacg aggaagatcc 10380
gtgaactcct caaaaagggg aattcgctgt actccaaagt cagtgataag gttttccaat 10440
gcttaaggga cactaactca cggcttggcc taggctccga attgagggag gacatcaagg 10500
agaaagttat taacttggga gtttacatgc acagctccca gtggtttgag ccctttctgt 10560
tttggtttac agtcaagact gagatgaggt cagtgattaa atcacaaacc catacttgcc 10620
ataggaggag acacacacct gtattcttca ctggtagttc agttgagttg ctaatctctc 10680
gtgaccttgt tgctataatc agtaaagagt ctcaacatgt atattacctg acatttgaac 10740
tggttttgat gtattgtgat gtcatagagg ggaggttaat gacagagacc gctatgacta 10800
ttgatgctag gtatacagag cttctaggaa gagtcagata catgtggaaa ctgatagatg 10860
gtttcttccc tgcactcggg aatccaactt atcaaattgt agccatgctg gagcctcttt 10920
cacttgctta cctgcagctg agggatataa cagtagaact cagaggtgct ttccttaacc 10980
actgctttac tgaaatacat gatgttcttg accaaaacgg gttttctgat gaaggtactt 11040
atcatgagtt aactgaagct ctagattaca ttttcataac tgatgacata catctgacag 11100
gggagatttt ctcatttttc agaagtttcg gccaccccag acttgaagca gtaacggctg 11160
ctgaaaatgt taggaaatac atgaatcagc ctaaagtcat tgtgtatgag actctgatga 11220
aaggtcatgc catattttgt ggaatcataa tcaacggcta tcgtgacagg cacggaggca 11280
gttggccacc gctgaccctc cccctgcatg ctgcagacac aatccggaat gctcaagctt 11340
caggtgaagg gttaacacat gagcagtgcg ttgataactg gaaatctttt gctggagtga 11400
aatttggctg ctttatgcct cttagcctgg atagtgatct gacaatgtac ctaaaggaca 11460
aggcacttgc tgctctccaa agggaatggg attcagttta cccgaaagag ttcctgcgtt 11520
acgaccctcc caagggaacc gggtcacgga ggcttgtaga tgttttcctt aatgattcga 11580
gctttgaccc atatgatgtg ataatgtatg ttgtaagtgg agcttacctc catgaccctg 11640
agttcaacct gtcttacagc ctgaaagaaa aggagatcaa ggaaacaggt agactttttg 11700
ctaaaatgac ttacaaaatg agggcatgcc aagtgattgc tgaaaatcta atctcaaacg 11760
ggattggcaa atattttaag gacaatggga tggccaagga tgagcacgat ttgactaagg 11820
cactccacac tctagctgtc tcaggagtcc ccaaagatct caaagaaagt cacagggggg 11880
ggccagtctt aaaaacctac tcccgaagcc cagtccacac aagtaccagg aacgtgagag 11940
cagcaaaagg gtttataggg ttccctcaag taattcggca ggaccaagac actgatcatc 12000
cggagaatat ggaagcttac gagacagtca gtgcatttat cacgactgat ctcaagaagt 12060
actgccttaa ttggagatat gagaccatca gcttgtttgc acagaggcta aatgagattt 12120
acggattgcc ctcatttttc cagtggctgc ataagaggct tgagacctct gtcctgtatg 12180
taagtgaccc tcattgcccc cccgaccttg acgcccatat cccgttatat aaagtcccca 12240
atgatcaaat cttcattaag taccctatgg gaggtataga agggtattgt cagaagctgt 12300
ggaccatcag caccattccc tatctatacc tggctgctta tgagagcgga gtaaggattg 12360
cttcgttagt gcaaggggac aatcagacca tagccgtaac aaaaagggta cccagcacat 12420
ggccctacaa ccttaagaaa cgggaagctg ctagagtaac tagagattac tttgtaattc 12480
ttaggcaaag gctacatgat attggccatc acctcaaggc aaatgagaca attgtttcat 12540
cacatttttt tgtctattca aaaggaatat attatgatgg gctacttgtg tcccaatcac 12600
tcaagagcat cgcaagatgt gtattctggt cagagactat agttgatgaa acaagggcag 12660
catgcagtaa tattgctaca acaatggcta aaagcatcga gagaggttat gaccgttacc 12720
ttgcatattc cctgaacgtc ctaaaagtga tacagcaaat tctgatctct cttggcttca 12780
caatcaattc aaccatgacc cgggatgtag tcatacccct cctcacaaac aacgacctct 12840
taataaggat ggcactgttg cccgctccta ttggggggat gaattatctg aatatgagca 12900
ggctgtttgt cagaaacatc ggtgatccag taacatcatc aattgctgat ctcaagagaa 12960
tgattctcgc ctcactaatg cctgaagaga ccctccatca agtaatgaca caacaaccgg 13020
gggactcttc attcctagac tgggctagcg acccttactc agcaaatctt gtatgtgtcc 13080
agagcatcac tagactcctc aagaacataa ctgcaaggtt tgtcctgatc catagtccaa 13140
acccaatgtt aaaaggatta ttccatgatg acagtaaaga agaggacgag ggactggcgg 13200
cattcctcat ggacaggcat attatagtac ctagggcagc tcatgaaatc ctggatcata 13260
gtgtcacagg ggcaagagag tctattgcag gcatgctgga taccacaaaa ggcttgattc 13320
gagccagcat gaggaagggg gggttaacct ctcgagtgat aaccagattg tccaattatg 13380
actatgaaca attcagagca gggatggtgc tattgacagg aagaaagaga aatgtcctca 13440
ttgacaaaga gtcatgttca gtgcagctgg cgagagctct aagaagccat atgtgggcga 13500
ggctagctcg aggacggcct atttacggcc ttgaggtccc tgatgtacta gaatctatgc 13560
gaggccacct tattcggcgt catgagacat gtgtcatctg cgagtgtgga tcagtcaact 13620
acggatggtt ttttgtcccc tcgggttgcc aactggatga tattgacaag gaaacatcat 13680
ccttgagagt cccatatatt ggttctacca ctgatgagag aacagacatg aagcttgcct 13740
tcgtaagagc cccaagtcga tccttgcgat ctgctgttag aatagcaaca gtgtactcat 13800
gggcttacgg tgatgatgat agctcttgga acgaagcctg gttgttggct aggcaaaggg 13860
ccaatgtgag cctggaggag ctaagggtga tcactcccat ctcaacttcg actaatttag 13920
cgcataggtt gagggatcgt agcactcaag tgaaatactc aggtacatcc cttgtccgag 13980
tggcgaggta taccacaatc tccaacgaca atctctcatt tgtcatatca gataagaagg 14040
ttgatactaa ctttatatac caacaaggaa tgcttctagg gttgggtgtt ttagaaacat 14100
tgtttcgact cgagaaagat accggatcat ctaacacggt attacatctt cacgtcgaaa 14160
cagattgttg cgtgatcccg atgatagatc atcccaggat acccagctcc cgcaagctag 14220
agctgagggc agagctatgt accaacccat tgatatatga taatgcacct ttaattgaca 14280
gagatgcaac aaggctatac acccagagcc ataggaggca ccttgtggaa tttgttacat 14340
ggtccacacc ccaactatat cacattttag ctaagtccac agcactatct atgattgacc 14400
tggtaacaaa atttgagaag gaccatatga atgaaatttc agctctcata ggggatgacg 14460
atatcaatag tttcataact gagtttctgc tcatagagcc aagattattc actatctact 14520
tgggccagtg tgcggccatc aattgggcat ttgatgtaca ttatcataga ccatcaggga 14580
aatatcagat gggtgagctg ttgtcatcgt tcctttctag aatgagcaaa ggagtgttta 14640
aggtgcttgt caatgctcta agccacccaa agatctacaa gaaattctgg cattgtggta 14700
ttatagagcc tatccatggt ccttcacttg atgctcaaaa cttgcacaca actgtgtgca 14760
acatggttta cacatgctat atgacctacc tcgacctgtt gttgaatgaa gagttagaag 14820
agttcacatt tctcttgtgt gaaagcgacg aggatgtagt accggacaga ttcgacaaca 14880
tccaggcaaa acacttatgt gttctggcag atttgtactg tcaaccaggg acctgcccac 14940
caattcgagg tctaagaccg gtagagaaat gtgcagttct aaccgaccat atcaaggcag 15000
aggctatgtt atctccagca ggatcttcgt ggaacataaa tccaattatt gtagaccatt 15060
actcatgctc tctgacttat ctccggcgag gatcgatcaa acagataaga ttgagagttg 15120
atccaggatt cattttcgac gccctcgctg aggtaaatgt cagtcagcca aagatcggca 15180
gcaacaacat ctcaaatatg agcatcaagg ctttcagacc cccacacgat gatgttgcaa 15240
aattgctcaa agatatcaac acaagcaagc acaatcttcc catttcaggg ggcaatctcg 15300
ccaattatga aatccatgct ttccgcagaa tcgggttgaa ctcatctgct tgctacaaag 15360
ctgttgagat atcaacatta attaggagat gccttgagcc aggggaggac ggcttgttct 15420
tgggtgaggg atcgggttct atgttgatca cttataaaga gatacttaaa ctaaacaagt 15480
gcttctataa tagtggggtt tccgccaatt ctagatctgg tcaaagggaa ttagcaccct 15540
atccctccga agttggcctt gtcgaacaca gaatgggagt aggtaatatt gtcaaagtgc 15600
tctttaacgg gaggcccgaa gtcacgtggg taggcagtgt agattgcttc aatttcatag 15660
ttagtaatat ccctacctct agtgtggggt ttatccattc agatatagag accttgcctg 15720
acaaagatac tatagagaag ctagaggaat tggcagccat cttatcgatg gctctgctcc 15780
tgggcaaaat aggatcaata ctggtgatta agcttatgcc tttcagcggg gattttgttc 15840
agggatttat aagttatgta gggtctcatt atagagaagt gaaccttgta taccctagat 15900
acagcaactt catctctact gaatcttatt tggttatgac agatctcaag gctaaccggc 15960
taatgaatcc tgaaaagatt aagcagcaga taattgaatc atctgtgagg acttcacctg 16020
gacttatagg tcacatccta tccattaagc aactaagctg catacaagca attgtgggag 16080
acgcagttag tagaggtgat atcaatccta ctctgaaaaa acttacacct atagagcagg 16140
tgctgatcaa ttgcgggttg gcaattaacg gacctaagct gtgcaaagaa ttgatccacc 16200
atgatgttgc ctcagggcaa gatggattgc ttaattctat actcatcctc tacagggagt 16260
tggcaagatt caaagacaac caaagaagtc aacaagggat gttccacgct taccccgtat 16320
tggtaagtag caggcaacga gaacttatat ctaggatcac ccgcaaattc tgggggcaca 16380
ttcttcttta ctccgggaac aaaaagttga taaataagtt tatccagaat ctcaagtccg 16440
gctatctgat actagactta caccagaata tcttcgttaa gaatctatcc aagtcagaga 16500
aacagattat tatgacgggg ggtttgaaac gtgagtgggt ttttaaggta acagtcaagg 16560
agaccaaaga atggtataag ttagtcggat acagtgccct gattaaggac taattggttg 16620
aactccggaa ccctaatcct gccctaggtg gttaggcatt atttgcaata tattaaagaa 16680
aactttgaaa atacgaagtt tctattccca gctttgtctg gtggccggca tggtcccagc 16740
ctcctcgctg gcgccggctg ggcaacattc cgaggggacc gtcccctcgg taatggcgaa 16800
tgggacgcgg ccgatccggc tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc 16860
accgctgagc aataactagc ataacccctt ggggcctcta aacgggtctt gaggggtttt 16920
ttgctgaaag gaggaactat atccggatgc ggccgcgggc cctatggtac ccagcttttg 16980
ttccctttag tgagggttaa ttccgagctt ggcgtaatca tggtcatagc tgtttcctgt 17040
gtgaaattgt tatccgctca caattccaca caacatagga gccggaagca taaagtgtaa 17100
agcctggggt gcctaatgag tgaggtaact cacattaatt gcgttgcgct cactgcccgc 17160
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 17220
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 17280
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 17340
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 17400
taaaaaggcc gcgttgctgg cgtttttcca taggctcggc ccccctgacg agcatcacaa 17460
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 17520
cccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 17580
gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct 17640
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 17700
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 17760
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 17820
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 17880
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 17940
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 18000
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 18060
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 18120
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 18180
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 18240
catagttgcc tgactgcccg tcgtgtagat aactacgata cgggagggct taccatctgg 18300
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 18360
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 18420
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 18480
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 18540
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgaaaaaa 18600
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 18660
actcatgctt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 18720
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 18780
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 18840
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 18900
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 18960
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 19020
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 19080
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 19140
ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt 19200
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 19260
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 19320
gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 19380
tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 19440
ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 19500
gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct 19560
ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct 19620
acagggcgcg tcccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 19680
ggcctcttcg ctattacgcc agccaccgcg gtggcggccg ctaatacgac tcactatagg 19740
gccaactttg tttggtctga tgagtccgtg aggacgaaac ccggagtccc gggtc 19795
<210> 39
<211> 876
<212> DNA
<213> Artificial sequence
<220>
<223> ATU1(eGFP)
<400> 39
cttaggattc aagatcctat tatcagggac aagagcagga ttagggatat ccgagacgcg 60
tacgatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 120
ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac 180
ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 240
caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat 300
gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 360
cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 420
cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 480
gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa 540
gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct 600
cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 660
ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 720
ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 780
gtaggcgcgc agcgcttaga cgtctcgcga tcgattagtg cgagaggccg agggccagaa 840
caacatccgc ctaccatcca tcattgttat aaaaaa 876
<210> 40
<211> 828
<212> DNA
<213> Artificial sequence
<220>
<223> ATU2(eGFP)
<400> 40
cctaccctcc atcattgtta taaaaaactt aggaaccagg tccacacagc cgccagccca 60
tcaacgcgta cgatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg 120
gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc 180
gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg 240
ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc 300
gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag 360
cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag 420
ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac 480
atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat catggccgac 540
aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc 600
gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg 660
cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc 720
gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag 780
ctgtacaagt aggcgcgcag cgcttagacg tctcgcgatc gatactag 828
<210> 41
<211> 828
<212> DNA
<213> Artificial sequence
<220>
<223> ATU3(eGFP)
<400> 41
ctagtctacc ctccatcatt gttataaaaa acttaggaac caggtccaca cagccgccag 60
cccatcaacg cgtacgatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat 120
cctggtcgag ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga 180
gggcgatgcc acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc 240
cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta 300
ccccgaccac atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca 360
ggagcgcacc atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt 420
cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg 480
caacatcctg gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc 540
cgacaagcag aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg 600
cagcgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct 660
gctgcccgac aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa 720
gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga 780
cgagctgtac aagtaggcgc gcagcgctta gacgtctcgc gatcgatg 828
<210> 42
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S3F polypeptide of
nCoV
<400> 42
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700
gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggata aggtggaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 43
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> S3F polypeptide of nCoV
<400> 43
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 44
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2P3F polypeptide of
nCoV
<400> 44
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700
gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 45
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> S2P3F polypeptide of nCoV
<400> 45
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 46
<211> 3834
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2PdeltaF polypeptide
of nCoV
<400> 46
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040
tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100
agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160
accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220
ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280
aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340
caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400
cagattctgc ccgatccaag caagcccagc aagcgcagct tcatcgagga cctgctgttc 2460
aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520
attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580
ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640
agcggatgga catttggagc cggtgccgct ctgcagattc ccttcgctat gcagatggcc 2700
taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccgccagc 2820
gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880
aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940
ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000
ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060
ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120
ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180
catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240
gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300
gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360
ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420
gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480
gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540
gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600
ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660
ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720
ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780
gtgctgaagg gcgtcaagct gcactacacc tgataagcgc gcctcgagga attc 3834
<210> 47
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> S2PdeltaF polypeptide of nCoV
<400> 47
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
675 680 685
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro
690 695 700
Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met
705 710 715 720
Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr
725 730 735
Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu
740 745 750
Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln
755 760 765
Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys
770 775 780
Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys
785 790 795 800
Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr
805 810 815
Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
820 825 830
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
835 840 845
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser
850 855 860
Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
865 870 875 880
Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
885 890 895
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile
900 905 910
Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
915 920 925
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn
930 935 940
Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
945 950 955 960
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro
965 970 975
Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser
980 985 990
Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg
995 1000 1005
Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu
1010 1015 1020
Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
1025 1030 1035
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His
1040 1045 1050
Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1055 1060 1065
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1070 1075 1080
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe
1085 1090 1095
Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly
1100 1105 1110
Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1115 1120 1125
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
1130 1135 1140
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile
1145 1150 1155
Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1160 1165 1170
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1175 1180 1185
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
1190 1195 1200
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
1205 1210 1215
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
1220 1225 1230
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp
1235 1240 1245
Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 48
<211> 3834
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2PdeltaF2A
polypeptide of nCoV
<400> 48
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040
tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100
agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160
accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220
ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280
aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340
caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400
cagattctgc ccgatccaag caagcccagc aagcgcagct tcatcgagga cctgctgttc 2460
aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520
attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580
ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640
agcggatgga catttggagc cggtgccgct ctgcagattc ccttcgctat gcagatggcc 2700
taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccgccagc 2820
gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880
aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940
ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000
ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060
ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120
ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180
catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240
gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300
gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360
ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420
gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480
gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540
gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600
ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660
ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720
ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780
gtgctgaagg gcgtcgccct ggcctacacc tgataagcgc gcctcgagga attc 3834
<210> 49
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> S2PdeltaF2A polypeptide of nCoV
<400> 49
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
675 680 685
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro
690 695 700
Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met
705 710 715 720
Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr
725 730 735
Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu
740 745 750
Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln
755 760 765
Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys
770 775 780
Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys
785 790 795 800
Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr
805 810 815
Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
820 825 830
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
835 840 845
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser
850 855 860
Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
865 870 875 880
Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
885 890 895
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile
900 905 910
Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
915 920 925
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn
930 935 940
Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
945 950 955 960
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro
965 970 975
Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser
980 985 990
Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg
995 1000 1005
Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu
1010 1015 1020
Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
1025 1030 1035
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His
1040 1045 1050
Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1055 1060 1065
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1070 1075 1080
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe
1085 1090 1095
Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly
1100 1105 1110
Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1115 1120 1125
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
1130 1135 1140
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile
1145 1150 1155
Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1160 1165 1170
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1175 1180 1185
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
1190 1195 1200
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
1205 1210 1215
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
1220 1225 1230
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp
1235 1240 1245
Asp Ser Glu Pro Val Leu Lys Gly Val Ala Leu Ala Tyr Thr
1250 1255 1260
<210> 50
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> S1/S2 furin cleavage site of the spike (S) polypeptide of nCoV
<400> 50
Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
1 5 10
<210> 51
<211> 3744
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the T4-S2P3F polypeptide
of SARS-CoV-2
<400> 51
cgtacggcca ccatgttcgt gtttctggtg ctgctgccac tggtgtccag tcagtgcgtg 60
aacctgacca cacgaacaca gctgccacca gcctacacca atagcttcac ccgcggagtg 120
tactaccccg acaaggtgtt ccgcagcagc gtgctgcata gcacccagga tctgtttctg 180
cccttcttca gcaacgtgac ctggttccac gccatccacg tgtccggcac caatggcacc 240
aagcgcttcg ataatcccgt gctgcccttc aacgatggcg tgtactttgc cagcaccgag 300
aagtccaata tcatccgcgg ctggatcttc ggcaccacac tggatagcaa gacccagagc 360
ctgctgatcg tgaacaacgc caccaacgtg gtcatcaaag tgtgcgagtt ccagttctgc 420
aacgacccct tcctgggcgt ctactaccac aagaacaaca agagctggat ggaaagcgag 480
ttccgcgtgt acagcagcgc caacaactgc accttcgagt acgtgtccca gccattcctg 540
atggacctgg aaggcaagca gggcaacttc aagaacctgc gcgagttcgt gttcaagaac 600
atcgacggct acttcaaaat ctacagcaag cacaccccaa tcaacctcgt gcgcgatctg 660
ccacagggat tcagtgctct ggaacccctg gtggatctgc ccatcggcat caacattacc 720
cgctttcaga cactgctggc cctgcaccgc agttacttga caccaggcga tagcagcagt 780
ggatggacag ctggtgccgc cgcttactac gttggatatc tgcagccacg cacctttctg 840
ctgaagtaca acgagaacgg caccatcacc gacgccgtgg attgtgctct cgatcccctg 900
agcgagacaa agtgcaccct gaagtccttc accgtcgaga agggcatcta ccagaccagc 960
aatttccgcg tgcagcccac cgagagcatc gtgcgcttcc ccaatatcac caatctgtgc 1020
cccttcggcg aggtgttcaa tgccacacgc tttgcctccg tgtacgcctg gaatcgcaag 1080
cgcattagca actgcgtggc cgactactcc gtgctgtaca atagcgccag cttcagcacc 1140
ttcaagtgct acggcgtgtc acccaccaag ctgaacgacc tgtgcttcac caatgtgtac 1200
gccgacagct tcgtgatccg cggagatgaa gtgcgacaga ttgccccagg ccagaccggc 1260
aagatcgccg actacaatta caagctgccc gacgacttca ccggctgcgt gatcgcctgg 1320
aacagcaaca acctggattc caaagtcggc ggcaactaca actacctgta ccgcctgttc 1380
cgcaagagca atctgaagcc cttcgagcgc gacatcagca ccgaaatcta ccaggccgga 1440
agcaccccat gcaacggcgt ggaaggcttc aactgctact tcccactgca gtcctacgga 1500
tttcagccca caaatggcgt gggctaccag ccatatcgag tggtggtgct gagcttcgaa 1560
ctgctgcatg ctccagctac cgtgtgcggc cccaagaaga gtaccaacct ggtcaagaac 1620
aaatgcgtga acttcaactt caacggcctg accggaaccg gcgtgctgac cgagagtaac 1680
aagaagttcc tgccattcca gcagtttggc cgcgacattg ccgatacaac cgatgccgtt 1740
cgcgatcccc agaccttgga gatcctggat attaccccat gctccttcgg cggcgtgtcc 1800
gtgattacac caggcaccaa taccagcaac caggtggccg ttctgtacca ggatgtgaat 1860
tgcacagagg tgcccgtggc cattcacgcc gatcaattga caccaacatg gcgcgtgtac 1920
tccaccggca gcaatgtgtt tcaaacccgc gctggatgcc tgattggagc cgagcacgtg 1980
aacaatagct acgagtgcga tatccccatc ggagccggaa tctgcgcctc ctatcagacc 2040
cagaccaata gtccaggatc cgccggaagt gtggccagcc agagcatcat tgcctatacc 2100
atgagcctgg gcgccgagaa tagcgtggcc tactccaaca acagcattgc tatccccacc 2160
aacttcacca tcagcgtgac caccgagatc ctgccagtgt ccatgaccaa gaccagcgtg 2220
gactgcacca tgtacatctg cggagatagc accgagtgca gcaacctgct gctgcagtac 2280
ggaagtttct gcacccagct gaatcgcgcc ctgacaggca ttgccgtgga acaggataag 2340
aacacccaag aggtgttcgc ccaagtgaag caaatctaca agaccccacc aatcaaggat 2400
ttcggcggct tcaatttcag ccagattctg cccgatccaa gcaagcccag caagcgcagc 2460
ttcatcgagg acctgctgtt caacaaagtg acactggccg acgccggatt catcaagcag 2520
tatggcgatt gcctgggcga tattgccgca cgcgatctga tttgcgccca gaagtttaac 2580
ggactgaccg tcctgccacc actgctgaca gatgagatga tcgcccagta cacaagtgcc 2640
ctgctggccg gaaccattac cagcggatgg acatttggag ccggtgccgc tctgcagatt 2700
cccttcgcta tgcagatggc ctaccgcttc aatggcattg gcgtgaccca gaatgtgctg 2760
tacgagaacc agaagctgat cgccaaccag ttcaacagcg ccatcggcaa gattcaggac 2820
agcctgagta gtaccgccag cgctctggga aagctgcagg atgtggtcaa ccagaacgct 2880
caggccctga acaccctggt taagcagctg agcagcaact tcggcgccat cagtagcgtg 2940
ctgaacgata tcctgagccg cctggatcca ccagaagccg aggtgcagat cgatcgcctg 3000
attaccggac gcctgcagtc cctgcagacc tatgtgacac agcagctgat ccgagccgcc 3060
gagattcgag ctagtgctaa tctggccgcc accaagatga gcgaatgtgt gctgggacag 3120
agcaagcgcg tggacttttg cggcaaggga taccacctga tgagcttccc acagagtgct 3180
ccacacggcg tggtgtttct gcatgtgacc tacgtgcccg ctcaagagaa gaatttcacc 3240
accgctccag ccatctgcca cgacggaaag gcccattttc cacgcgaggg cgtgttcgtt 3300
agcaacggca ctcattggtt cgtcacccag cgcaacttct acgagcccca gatcatcacc 3360
accgacaaca ccttcgtcag cggcaactgc gacgtcgtga tcggcattgt gaacaacacc 3420
gtgtacgatc cactgcagcc cgagctggac agcttcaaag aggaactgga caagtacttt 3480
aagaaccaca caagccccga cgtggacctg ggagacatta gcggaatcaa cgccagcgtg 3540
gtcaacatcc agaaagagat tgaccgcctg aacgaggtgg ccaagaatct gaacgagagc 3600
ctgatcgacc tgcaagaact gggcaaatac gagcagtaca ttaagtccgg aggctacatc 3660
cccgaggccc cacgcgatgg ccaggcctac gtgcgcaagg acggcgagtg ggtgctgctg 3720
tccaccttcc tgtgataagc gcgc 3744
<210> 52
<211> 1240
<212> PRT
<213> Artificial sequence
<220>
<223> T4-S2P3F polypeptide of SARS-CoV-2
<400> 52
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Ser Gly Gly Tyr Ile Pro Glu
1205 1210 1215
Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp
1220 1225 1230
Val Leu Leu Ser Thr Phe Leu
1235 1240
<210> 53
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S6P polypeptide of
SARS-CoV-2
<400> 53
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700
gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 54
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> S6P polypeptide of SARS-CoV-2
<400> 54
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 55
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S6P3F polypeptide of
SARS-CoV-2
<400> 55
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccagga tccgccggaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700
gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctggatc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 56
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> S6P3F polypeptide of SARS-CoV-2
<400> 56
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 57
<211> 3834
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S6PdeltaF polypeptide
of SARS-CoV-2
<400> 57
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tcacccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgca 2040
tcctatagtg tggccagcca gagcatcatt gcctatacca tgagcctggg cgccgagaat 2100
agcgtggcct actccaacaa cagcattgct atccccacca acttcaccat cagcgtgacc 2160
accgagatcc tgccagtgtc catgaccaag accagcgtgg actgcaccat gtacatctgc 2220
ggagatagca ccgagtgcag caacctgctg ctgcagtacg gaagtttctg cacccagctg 2280
aatcgcgccc tgacaggcat tgccgtggaa caggataaga acacccaaga ggtgttcgcc 2340
caagtgaagc aaatctacaa gaccccacca atcaaggatt tcggcggctt caatttcagc 2400
cagattctgc ccgatccaag caagcccagc aagcgcagcc caatcgagga cctgctgttc 2460
aacaaagtga cactggccga cgccggattc atcaagcagt atggcgattg cctgggcgat 2520
attgccgcac gcgatctgat ttgcgcccag aagtttaacg gactgaccgt cctgccacca 2580
ctgctgacag atgagatgat cgcccagtac acaagtgccc tgctggccgg aaccattacc 2640
agcggatgga catttggagc cggtccagct ctgcagattc ccttcccaat gcagatggcc 2700
taccgcttca atggcattgg cgtgacccag aatgtgctgt acgagaacca gaagctgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggaca gcctgagtag taccccaagc 2820
gctctgggaa agctgcagga tgtggtcaac cagaacgctc aggccctgaa caccctggtt 2880
aagcagctga gcagcaactt cggcgccatc agtagcgtgc tgaacgatat cctgagccgc 2940
ctggatccac cagaagccga ggtgcagatc gatcgcctga ttaccggacg cctgcagtcc 3000
ctgcagacct atgtgacaca gcagctgatc cgagccgccg agattcgagc tagtgctaat 3060
ctggccgcca ccaagatgag cgaatgtgtg ctgggacaga gcaagcgcgt ggacttttgc 3120
ggcaagggat accacctgat gagcttccca cagagtgctc cacacggcgt ggtgtttctg 3180
catgtgacct acgtgcccgc tcaagagaag aatttcacca ccgctccagc catctgccac 3240
gacggaaagg cccattttcc acgcgagggc gtgttcgtta gcaacggcac tcattggttc 3300
gtcacccagc gcaacttcta cgagccccag atcatcacca ccgacaacac cttcgtcagc 3360
ggcaactgcg acgtcgtgat cggcattgtg aacaacaccg tgtacgatcc actgcagccc 3420
gagctggaca gcttcaaaga ggaactggac aagtacttta agaaccacac aagccccgac 3480
gtggacctgg gagacattag cggaatcaac gccagcgtgg tcaacatcca gaaagagatt 3540
gaccgcctga acgaggtggc caagaatctg aacgagagcc tgatcgacct gcaagaactg 3600
ggcaaatacg agcagtacat taagtggccc tggtacatct ggctgggctt cattgccgga 3660
ctgattgcca tcgtgatggt caccattatg ctgtgctgca tgaccagttg ctgcagctgc 3720
ctgaagggat gctgcagttg cggaagctgc tgcaagttcg acgaggatga tagcgagcca 3780
gtgctgaagg gcgtcaagct gcactacacc tgataagcgc gcctcgagga attc 3834
<210> 58
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> S6PdeltaF polypeptide of SARS-CoV-2
<400> 58
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
675 680 685
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro
690 695 700
Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met
705 710 715 720
Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr
725 730 735
Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu
740 745 750
Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln
755 760 765
Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys
770 775 780
Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys
785 790 795 800
Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr
805 810 815
Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
820 825 830
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
835 840 845
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser
850 855 860
Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
865 870 875 880
Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn
885 890 895
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile
900 905 910
Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
915 920 925
Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn
930 935 940
Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
945 950 955 960
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro
965 970 975
Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser
980 985 990
Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg
995 1000 1005
Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu
1010 1015 1020
Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
1025 1030 1035
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His
1040 1045 1050
Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1055 1060 1065
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1070 1075 1080
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe
1085 1090 1095
Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly
1100 1105 1110
Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1115 1120 1125
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
1130 1135 1140
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile
1145 1150 1155
Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1160 1165 1170
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1175 1180 1185
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
1190 1195 1200
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
1205 1210 1215
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
1220 1225 1230
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp
1235 1240 1245
Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 59
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the SCCPP polypeptide of
SARS-CoV-2
<400> 59
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tgtcccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcttcatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtgcc 2700
gctctgcaga ttcccttcgc tatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtaccgcc agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctgtgtc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 60
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> SCCPP polypeptide of SARS-CoV-2
<400> 60
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Cys Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Cys Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 61
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the SCC6P polypeptide of
SARS-CoV-2
<400> 61
gctagcagat ctcgtacggc caccatgttc gtgtttctgg tgctgctgcc actggtgtcc 60
agtcagtgcg tgaacctgac cacacgaaca cagctgccac cagcctacac caatagcttc 120
acccgcggag tgtactaccc cgacaaggtg ttccgcagca gcgtgctgca tagcacccag 180
gatctgtttc tgcccttctt cagcaacgtg acctggttcc acgccatcca cgtgtccggc 240
accaatggca ccaagcgctt cgataatccc gtgctgccct tcaacgatgg cgtgtacttt 300
gccagcaccg agaagtccaa tatcatccgc ggctggatct tcggcaccac actggatagc 360
aagacccaga gcctgctgat cgtgaacaac gccaccaacg tggtcatcaa agtgtgcgag 420
ttccagttct gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagagctgg 480
atggaaagcg agttccgcgt gtacagcagc gccaacaact gcaccttcga gtacgtgtcc 540
cagccattcc tgatggacct ggaaggcaag cagggcaact tcaagaacct gcgcgagttc 600
gtgttcaaga acatcgacgg ctacttcaaa atctacagca agcacacccc aatcaacctc 660
gtgcgcgatc tgccacaggg attcagtgct ctggaacccc tggtggatct gcccatcggc 720
atcaacatta cccgctttca gacactgctg gccctgcacc gcagttactt gacaccaggc 780
gatagcagca gtggatggac agctggtgcc gccgcttact acgttggata tctgcagcca 840
cgcacctttc tgctgaagta caacgagaac ggcaccatca ccgacgccgt ggattgtgct 900
ctcgatcccc tgagcgagac aaagtgcacc ctgaagtcct tcaccgtcga gaagggcatc 960
taccagacca gcaatttccg cgtgcagccc accgagagca tcgtgcgctt ccccaatatc 1020
accaatctgt gccccttcgg cgaggtgttc aatgccacac gctttgcctc cgtgtacgcc 1080
tggaatcgca agcgcattag caactgcgtg gccgactact ccgtgctgta caatagcgcc 1140
agcttcagca ccttcaagtg ctacggcgtg tgtcccacca agctgaacga cctgtgcttc 1200
accaatgtgt acgccgacag cttcgtgatc cgcggagatg aagtgcgaca gattgcccca 1260
ggccagaccg gcaagatcgc cgactacaat tacaagctgc ccgacgactt caccggctgc 1320
gtgatcgcct ggaacagcaa caacctggat tccaaagtcg gcggcaacta caactacctg 1380
taccgcctgt tccgcaagag caatctgaag cccttcgagc gcgacatcag caccgaaatc 1440
taccaggccg gaagcacccc atgcaacggc gtggaaggct tcaactgcta cttcccactg 1500
cagtcctacg gatttcagcc cacaaatggc gtgggctacc agccatatcg agtggtggtg 1560
ctgagcttcg aactgctgca tgctccagct accgtgtgcg gccccaagaa gagtaccaac 1620
ctggtcaaga acaaatgcgt gaacttcaac ttcaacggcc tgaccggaac cggcgtgctg 1680
accgagagta acaagaagtt cctgccattc cagcagtttg gccgcgacat tgccgataca 1740
accgatgccg ttcgcgatcc ccagaccttg gagatcctgg atattacccc atgctccttc 1800
ggcggcgtgt ccgtgattac accaggcacc aataccagca accaggtggc cgttctgtac 1860
caggatgtga attgcacaga ggtgcccgtg gccattcacg ccgatcaatt gacaccaaca 1920
tggcgcgtgt actccaccgg cagcaatgtg tttcaaaccc gcgctggatg cctgattgga 1980
gccgagcacg tgaacaatag ctacgagtgc gatatcccca tcggagccgg aatctgcgcc 2040
tcctatcaga cccagaccaa tagtccacga cgagcccgaa gtgtggccag ccagagcatc 2100
attgcctata ccatgagcct gggcgccgag aatagcgtgg cctactccaa caacagcatt 2160
gctatcccca ccaacttcac catcagcgtg accaccgaga tcctgccagt gtccatgacc 2220
aagaccagcg tggactgcac catgtacatc tgcggagata gcaccgagtg cagcaacctg 2280
ctgctgcagt acggaagttt ctgcacccag ctgaatcgcg ccctgacagg cattgccgtg 2340
gaacaggata agaacaccca agaggtgttc gcccaagtga agcaaatcta caagacccca 2400
ccaatcaagg atttcggcgg cttcaatttc agccagattc tgcccgatcc aagcaagccc 2460
agcaagcgca gcccaatcga ggacctgctg ttcaacaaag tgacactggc cgacgccgga 2520
ttcatcaagc agtatggcga ttgcctgggc gatattgccg cacgcgatct gatttgcgcc 2580
cagaagttta acggactgac cgtcctgcca ccactgctga cagatgagat gatcgcccag 2640
tacacaagtg ccctgctggc cggaaccatt accagcggat ggacatttgg agccggtcca 2700
gctctgcaga ttcccttccc aatgcagatg gcctaccgct tcaatggcat tggcgtgacc 2760
cagaatgtgc tgtacgagaa ccagaagctg atcgccaacc agttcaacag cgccatcggc 2820
aagattcagg acagcctgag tagtacccca agcgctctgg gaaagctgca ggatgtggtc 2880
aaccagaacg ctcaggccct gaacaccctg gttaagcagc tgagcagcaa cttcggcgcc 2940
atcagtagcg tgctgaacga tatcctgagc cgcctgtgtc caccagaagc cgaggtgcag 3000
atcgatcgcc tgattaccgg acgcctgcag tccctgcaga cctatgtgac acagcagctg 3060
atccgagccg ccgagattcg agctagtgct aatctggccg ccaccaagat gagcgaatgt 3120
gtgctgggac agagcaagcg cgtggacttt tgcggcaagg gataccacct gatgagcttc 3180
ccacagagtg ctccacacgg cgtggtgttt ctgcatgtga cctacgtgcc cgctcaagag 3240
aagaatttca ccaccgctcc agccatctgc cacgacggaa aggcccattt tccacgcgag 3300
ggcgtgttcg ttagcaacgg cactcattgg ttcgtcaccc agcgcaactt ctacgagccc 3360
cagatcatca ccaccgacaa caccttcgtc agcggcaact gcgacgtcgt gatcggcatt 3420
gtgaacaaca ccgtgtacga tccactgcag cccgagctgg acagcttcaa agaggaactg 3480
gacaagtact ttaagaacca cacaagcccc gacgtggacc tgggagacat tagcggaatc 3540
aacgccagcg tggtcaacat ccagaaagag attgaccgcc tgaacgaggt ggccaagaat 3600
ctgaacgaga gcctgatcga cctgcaagaa ctgggcaaat acgagcagta cattaagtgg 3660
ccctggtaca tctggctggg cttcattgcc ggactgattg ccatcgtgat ggtcaccatt 3720
atgctgtgct gcatgaccag ttgctgcagc tgcctgaagg gatgctgcag ttgcggaagc 3780
tgctgcaagt tcgacgagga tgatagcgag ccagtgctga agggcgtcaa gctgcactac 3840
acctgataac gagcgcgcct cgaggaattc 3870
<210> 62
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> SCC6P polypeptide of SARS-CoV-2
<400> 62
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Cys Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile
885 890 895
Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Cys Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 63
<211> 3870
<212> DNA
<213> Artificial sequence
<220>
<223> MV-optimized nucleotide sequence of the S2P polypeptide
(SMVopt2P) of SARS-CoV-2
<400> 63
gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60
agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120
acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180
gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240
acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300
gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360
aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420
tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480
atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540
cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600
gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660
gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720
atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780
gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840
cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900
cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960
taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020
acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080
tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140
agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200
accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260
ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320
gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380
tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440
tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500
cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560
ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620
ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680
actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740
acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800
ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860
caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920
tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980
gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040
agttatcaga cccaaacaaa tagtccaaga cgagcaagaa gtgtggccag tcagagtatt 2100
attgcctata caatgagtct gggagccgag aatagtgtgg cctatagtaa caattccatt 2160
gctatcccca ccaactttac cattagtgtg acaacagaga ttctgccagt gtccatgaca 2220
aagacaagtg tggattgcac catgtacatt tgcggagata gtacagaatg cagtaatctg 2280
ctgctgcagt atggaagttt ctgtacacaa ctgaatagag ccctgactgg aattgctgtg 2340
gaacaggata agaatactca agaggtgttc gcccaagtga agcaaatcta taagacccca 2400
cctattaagg atttcggcgg attcaatttc agtcagattt tgccagatcc aagcaagcca 2460
tccaaacgca gttttattga ggacctgctg ttcaacaaag tgacattggc tgatgctggc 2520
tttattaagc aatatggcga ttgtctggga gatatagctg ccagagattt gatttgcgcc 2580
caaaagttta atggattgac agttttgcca ccactgctga cagatgagat gattgctcag 2640
tatacaagtg ctctgctggc cggaacaatt acatcaggat ggacatttgg agctggtgca 2700
gcattgcaaa taccatttgc tatgcagatg gcctaccgct ttaatggtat tggagttacc 2760
cagaacgtgc tgtacgaaaa tcagaagctg atcgccaatc agttcaatag cgccattgga 2820
aaaattcagg atagcctgag tagtactgct agtgctcttg gaaaactgca ggatgtggtt 2880
aatcagaatg ctcaggctct gaatactctg gttaagcagt tgagttccaa tttcggagct 2940
attagcagtg tgctgaacga tattctgagt cgtttggatc caccagaggc cgaagttcag 3000
attgatagac tgattacagg acgactgcag agcttgcaga catatgttac acaacaactg 3060
attcgagccg ctgaaattag agctagtgct aatttggctg ccacaaagat gagtgaatgt 3120
gtgcttggac agagcaaaag agtggatttt tgcggcaaag gataccatct gatgagcttt 3180
ccacaaagtg ctccacatgg tgttgtgttt ctgcatgtta cttatgtgcc cgctcaagag 3240
aagaatttca caacagctcc agccatttgc catgatggaa aagctcattt tccacgagaa 3300
ggcgtgttcg ttagtaatgg tactcattgg ttcgtgaccc agcgcaattt ttacgagcca 3360
cagattatta ccaccgacaa tactttcgtg tccggcaatt gtgatgttgt gattggaatc 3420
gtgaacaaca cagtgtacga tccattgcag ccagagctgg atagttttaa agaggaactg 3480
gacaagtact tcaagaacca tacaagtcca gatgtggatc tgggcgatat tagtggaatc 3540
aatgcctccg tggtcaacat ccagaaagaa attgatcgac tgaacgaagt ggccaagaat 3600
ttgaatgaga gcctgattga tctgcaagag ctgggcaaat acgagcagta tattaagtgg 3660
ccttggtaca tttggctggg attcattgct ggactgattg ccattgtgat ggttaccatt 3720
atgctgtgtt gcatgacaag ttgttgcagt tgcctgaaag gatgctgtag ttgcggtagt 3780
tgctgcaagt ttgatgagga tgatagtgaa ccagtgctga aaggcgtgaa gctgcattat 3840
acttgataac gagcgcgcct cgaggaattc 3870
<210> 64
<211> 3834
<212> DNA
<213> Artificial sequence
<220>
<223> MV-optimized nucleotide sequence of the SdeltaF polypeptide
(SMVoptdeltaF) of SARS-CoV-2
<400> 64
gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60
agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120
acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180
gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240
acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300
gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360
aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420
tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480
atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540
cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600
gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660
gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720
atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780
gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840
cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900
cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960
taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020
acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080
tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140
agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200
accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260
ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320
gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380
tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440
tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500
cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560
ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620
ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680
actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740
acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800
ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860
caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920
tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980
gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040
agttatagtg tggccagtca gagtattatt gcctatacaa tgagtctggg agccgagaat 2100
agtgtggcct atagtaacaa ttccattgct atccccacca actttaccat tagtgtgaca 2160
acagagattc tgccagtgtc catgacaaag acaagtgtgg attgcaccat gtacatttgc 2220
ggagatagta cagaatgcag taatctgctg ctgcagtatg gaagtttctg tacacaactg 2280
aatagagccc tgactggaat tgctgtggaa caggataaga atactcaaga ggtgttcgcc 2340
caagtgaagc aaatctataa gaccccacct attaaggatt tcggcggatt caatttcagt 2400
cagattttgc cagatccaag caagccatcc aaacgcagtt ttattgagga cctgctgttc 2460
aacaaagtga cattggctga tgctggcttt attaagcaat atggcgattg tctgggagat 2520
atagctgcca gagatttgat ttgcgcccaa aagtttaatg gattgacagt tttgccacca 2580
ctgctgacag atgagatgat tgctcagtat acaagtgctc tgctggccgg aacaattaca 2640
tcaggatgga catttggagc tggtgcagca ttgcaaatac catttgctat gcagatggcc 2700
taccgcttta atggtattgg agttacccag aacgtgctgt acgaaaatca gaagctgatc 2760
gccaatcagt tcaatagcgc cattggaaaa attcaggata gcctgagtag tactgctagt 2820
gctcttggaa aactgcagga tgtggttaat cagaatgctc aggctctgaa tactctggtt 2880
aagcagttga gttccaattt cggagctatt agcagtgtgc tgaacgatat tctgagtcgt 2940
ttggataagg ttgaggccga agttcagatt gatagactga ttacaggacg actgcagagc 3000
ttgcagacat atgttacaca acaactgatt cgagccgctg aaattagagc tagtgctaat 3060
ttggctgcca caaagatgag tgaatgtgtg cttggacaga gcaaaagagt ggatttttgc 3120
ggcaaaggat accatctgat gagctttcca caaagtgctc cacatggtgt tgtgtttctg 3180
catgttactt atgtgcccgc tcaagagaag aatttcacaa cagctccagc catttgccat 3240
gatggaaaag ctcattttcc acgagaaggc gtgttcgtta gtaatggtac tcattggttc 3300
gtgacccagc gcaattttta cgagccacag attattacca ccgacaatac tttcgtgtcc 3360
ggcaattgtg atgttgtgat tggaatcgtg aacaacacag tgtacgatcc attgcagcca 3420
gagctggata gttttaaaga ggaactggac aagtacttca agaaccatac aagtccagat 3480
gtggatctgg gcgatattag tggaatcaat gcctccgtgg tcaacatcca gaaagaaatt 3540
gatcgactga acgaagtggc caagaatttg aatgagagcc tgattgatct gcaagagctg 3600
ggcaaatacg agcagtatat taagtggcct tggtacattt ggctgggatt cattgctgga 3660
ctgattgcca ttgtgatggt taccattatg ctgtgttgca tgacaagttg ttgcagttgc 3720
ctgaaaggat gctgtagttg cggtagttgc tgcaagtttg atgaggatga tagtgaacca 3780
gtgctgaaag gcgtgaagct gcattatact tgataagcgc gcctcgagga attc 3834
<210> 65
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> SdeltaF polypeptide of SARS-CoV-2
<400> 65
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu
675 680 685
Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro
690 695 700
Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met
705 710 715 720
Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr
725 730 735
Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu
740 745 750
Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln
755 760 765
Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys
770 775 780
Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys
785 790 795 800
Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr
805 810 815
Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
820 825 830
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr
835 840 845
Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser
850 855 860
Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly
865 870 875 880
Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
885 890 895
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile
900 905 910
Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser
915 920 925
Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn
930 935 940
Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly
945 950 955 960
Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val
965 970 975
Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser
980 985 990
Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg
995 1000 1005
Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu
1010 1015 1020
Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
1025 1030 1035
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His
1040 1045 1050
Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro
1055 1060 1065
Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1070 1075 1080
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe
1085 1090 1095
Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly
1100 1105 1110
Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp
1115 1120 1125
Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
1130 1135 1140
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile
1145 1150 1155
Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp
1160 1165 1170
Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1175 1180 1185
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp
1190 1195 1200
Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met
1205 1210 1215
Val Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu
1220 1225 1230
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp
1235 1240 1245
Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 66
<211> 3834
<212> DNA
<213> Artificial sequence
<220>
<223> MV-optimized nucleotide sequence of the S2PdeltaF polypeptide
(SMVopt2PdeltaF) of SARS-CoV-2
<400> 66
gctagcagat ctcgtacggc caccatgttt gtgtttttgg ttttgttgcc actggtgtcc 60
agtcagtgtg ttaatttgac aacaagaaca cagctgccac cagcctacac aaatagtttt 120
acaaggggag tgtactaccc agataaggtg ttcagaagta gtgttctgca tagcacacag 180
gatctgtttc tgccattctt tagcaatgtg acctggttcc atgctattca tgtttccggt 240
acaaatggca ccaagcgctt tgataatcca gtgttgccat tcaatgatgg cgtgtacttt 300
gccagtaccg agaagagtaa tatcattcgc ggatggattt tcggaaccac actggatagt 360
aaaacccaga gtctgctgat tgtgaacaat gccaccaatg tggttatcaa agtgtgcgag 420
tttcagttct gcaatgatcc atttctgggc gtctactacc ataagaacaa caagagttgg 480
atggaaagcg agtttagagt gtacagtagt gccaacaatt gcacctttga atacgttagc 540
cagccattct tgatggattt ggagggaaag cagggcaatt tcaagaatct gcgcgagttc 600
gtgttcaaga atatcgacgg atacttcaaa atctacagca agcacacacc aatcaatctt 660
gttagagatt tgccacaggg attcagtgct ttggaaccat tggttgatct gccaatcgga 720
atcaatatta ccagatttca aacactgctg gccctgcata gaagttattt gacaccaggc 780
gattcaagta gtggatggac agctggtgct gctgcttatt atgttggata tctgcaacca 840
cgaacctttc tgctgaagta caatgagaat ggaacaatca cagatgctgt ggattgtgct 900
cttgatccac tgagtgaaac aaagtgcacc ctgaagagtt ttaccgttga gaagggaatc 960
taccagacca gtaattttcg agtgcagcca acagaaagta tcgtgcgctt cccaaatatt 1020
acaaatctgt gcccattcgg cgaagtgttt aatgctacaa gatttgctag tgtgtacgcc 1080
tggaatcgca agagaattag taattgcgtg gccgattaca gcgtgctgta taatagtgcc 1140
agctttagca cctttaagtg ctatggtgtt agtcccacaa agctgaatga tctgtgcttt 1200
accaatgtgt atgccgatag ttttgtgatc aggggagatg aagttcgaca aattgctcca 1260
ggacagactg gaaagattgc cgattataac tacaagctgc cagatgattt caccggatgt 1320
gtgattgcct ggaacagtaa caatctggat agcaaagttg gcggcaacta caattatctg 1380
tatcgcctgt ttcgcaagag caatctgaaa ccatttgagc gcgatatcag caccgaaatc 1440
tatcaagctg gaagtactcc atgcaatggc gtggaaggtt ttaattgcta ctttccactg 1500
cagtcctacg gatttcaacc tactaatggt gttggatacc agccatatag agtggtggtt 1560
ctgagttttg aattgctgca tgctccagct acagtgtgtg gaccaaagaa aagtaccaac 1620
ctggttaaga acaaatgcgt gaacttcaac ttcaatggac tgactggtac aggcgttctg 1680
actgagagta acaagaaatt cctgccattt cagcagtttg gacgagatat tgctgataca 1740
acagatgcag ttagagatcc ccaaacactg gaaattctgg atattacccc atgcagtttt 1800
ggcggagtta gtgttattac acccggcaca aataccagta atcaagttgc tgtgctgtac 1860
caggatgtga attgcacaga agttccagtt gcaattcatg cagatcagtt gacaccaaca 1920
tggcgagtgt atagtaccgg aagtaatgtt tttcagacac gagctggatg tctgattgga 1980
gccgaacatg ttaacaatag ctacgagtgc gatattccaa ttggtgctgg aatttgcgct 2040
agttatagtg tggccagtca gagtattatt gcctatacaa tgagtctggg agccgagaat 2100
agtgtggcct atagtaacaa ttccattgct atccccacca actttaccat tagtgtgaca 2160
acagagattc tgccagtgtc catgacaaag acaagtgtgg attgcaccat gtacatttgc 2220
ggagatagta cagaatgcag taatctgctg ctgcagtatg gaagtttctg tacacaactg 2280
aatagagccc tgactggaat tgctgtggaa caggataaga atactcaaga ggtgttcgcc 2340
caagtgaagc aaatctataa gaccccacct attaaggatt tcggcggatt caatttcagt 2400
cagattttgc cagatccaag caagccatcc aaacgcagtt ttattgagga cctgctgttc 2460
aacaaagtga cattggctga tgctggcttt attaagcaat atggcgattg tctgggagat 2520
atagctgcca gagatttgat ttgcgcccaa aagtttaatg gattgacagt tttgccacca 2580
ctgctgacag atgagatgat tgctcagtat acaagtgctc tgctggccgg aacaattaca 2640
tcaggatgga catttggagc tggtgcagca ttgcaaatac catttgctat gcagatggcc 2700
taccgcttta atggtattgg agttacccag aacgtgctgt acgaaaatca gaagctgatc 2760
gccaatcagt tcaatagcgc cattggaaaa attcaggata gcctgagtag tactgctagt 2820
gctcttggaa aactgcagga tgtggttaat cagaatgctc aggctctgaa tactctggtt 2880
aagcagttga gttccaattt cggagctatt agcagtgtgc tgaacgatat tctgagtcgt 2940
ttggatccac cagaggccga agttcagatt gatagactga ttacaggacg actgcagagc 3000
ttgcagacat atgttacaca acaactgatt cgagccgctg aaattagagc tagtgctaat 3060
ttggctgcca caaagatgag tgaatgtgtg cttggacaga gcaaaagagt ggatttttgc 3120
ggcaaaggat accatctgat gagctttcca caaagtgctc cacatggtgt tgtgtttctg 3180
catgttactt atgtgcccgc tcaagagaag aatttcacaa cagctccagc catttgccat 3240
gatggaaaag ctcattttcc acgagaaggc gtgttcgtta gtaatggtac tcattggttc 3300
gtgacccagc gcaattttta cgagccacag attattacca ccgacaatac tttcgtgtcc 3360
ggcaattgtg atgttgtgat tggaatcgtg aacaacacag tgtacgatcc attgcagcca 3420
gagctggata gttttaaaga ggaactggac aagtacttca agaaccatac aagtccagat 3480
gtggatctgg gcgatattag tggaatcaat gcctccgtgg tcaacatcca gaaagaaatt 3540
gatcgactga acgaagtggc caagaatttg aatgagagcc tgattgatct gcaagagctg 3600
ggcaaatacg agcagtatat taagtggcct tggtacattt ggctgggatt cattgctgga 3660
ctgattgcca ttgtgatggt taccattatg ctgtgttgca tgacaagttg ttgcagttgc 3720
ctgaaaggat gctgtagttg cggtagttgc tgcaagtttg atgaggatga tagtgaacca 3780
gtgctgaaag gcgtgaagct gcattatact tgataagcgc gcctcgagga attc 3834
<210> 67
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> measles H22-30 peptide
<400> 67
Arg Ile Val Ile Asn Arg Glu His Leu
1 5
<210> 68
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> measles H446-454 peptide
<400> 68
Ser Asn His Asn Asn Val Tyr Trp Leu
1 5
<210> 69
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> NP366 (SCOT) peptide
<400> 69
Ala Ser Asn Glu Asn Met Asp Thr Met
1 5
<210> 70
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> E_Sarbeco_F1 primer
<400> 70
acaggtacgt taatagttaa tagcgt 26
<210> 71
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> E_Sarbeco_R2 primer
<400> 71
atattgcagc agtacgcaca ca 22
<210> 72
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> E_Sarbeco_P1 primer (FAM in 5' and BHQ-1 in 3')
<400> 72
acactagcca tccttactgc gcttcg 26
<210> 73
<211> 3810
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the SF-dER polypeptide of
SARS-CoV-2
<400> 73
cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60
aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120
tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180
ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240
aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300
aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360
cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420
aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480
tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540
atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600
attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660
cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720
aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780
ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840
ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900
tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960
aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020
ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080
aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140
ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200
gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260
aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320
aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380
cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440
tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500
tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560
ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620
aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680
aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740
cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800
gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860
tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920
agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980
aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040
cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100
atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160
aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220
gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280
ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340
aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400
ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460
tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520
tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580
ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640
ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700
ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760
tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820
agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880
caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940
ctgaacgaca tcttgtctcg gctcgacaag gtcgaggccg aagtgcagat tgatcgcctg 3000
atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060
gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120
tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180
cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240
actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300
agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360
actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420
gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480
aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540
gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600
ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660
tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720
atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780
gatgaggatg attccgaata ataggcgcgc 3810
<210> 74
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> SF-dER polypeptide of SARS-CoV-2
<400> 74
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
1250 1255 1260
<210> 75
<211> 3810
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the SF-2P-dER polypeptide
of SARS-CoV-2
<400> 75
cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60
aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120
tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180
ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240
aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300
aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360
cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420
aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480
tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540
atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600
attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660
cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720
aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780
ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840
ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900
tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960
aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020
ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080
aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140
ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200
gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260
aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320
aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380
cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440
tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500
tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560
ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620
aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680
aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740
cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800
gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860
tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920
agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980
aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040
cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100
atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160
aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220
gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280
ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340
aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400
ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460
tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520
tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580
ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640
ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700
ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760
tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820
agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880
caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940
ctgaacgaca tcttgtctcg gctcgaccca ccagaggccg aagtgcagat tgatcgcctg 3000
atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060
gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120
tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180
cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240
actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300
agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360
actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420
gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480
aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540
gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600
ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660
tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720
atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780
gatgaggatg attccgaata ataggcgcgc 3810
<210> 76
<211> 1262
<212> PRT
<213> Artificial sequence
<220>
<223> SF-2P-dER polypeptide of SARS-CoV-2
<400> 76
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
1250 1255 1260
<210> 77
<211> 1794
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2-dER polypeptide of
SARS-CoV-2
<400> 77
cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgta 60
gcaagtcaga gtatcatagc ctatactatg agcctggggg cagaaaattc tgtcgcttat 120
agtaataaca gtattgcaat tcctactaac ttcactatta gcgtgactac agaaattctg 180
ccagtgagca tgaccaagac ctccgtcgac tgtaccatgt atatctgcgg agacagcaca 240
gaatgcagca acctgcttct gcagtacggt agcttttgta cccagctgaa cagggcactg 300
accggcatcg ctgtggaaca ggacaaaaat acgcaggagg tgttcgctca ggtcaagcag 360
atttataaga cacccccaat aaaagacttc ggcggcttta acttctccca gatcctgccc 420
gatccgtcaa aaccttccaa gagaagtttt atcgaggatc tgctgtttaa caaagtaaca 480
ttggctgatg ctggctttat taaacagtac ggcgattgtc tgggagatat cgccgctaga 540
gatctgatct gcgctcaaaa atttaatggc ctcactgtat tgccccccct gctgacggat 600
gaaatgattg cccaatacac atcagccctg ctggctggga caatcacttc cggctggacg 660
ttcggtgctg gagctgctct tcaaattcca tttgccatgc aaatggctta tagattcaac 720
ggaattggcg tgacccaaaa cgtgctgtac gaaaatcaaa agctgattgc taatcagttt 780
aactccgcta tcggtaagat acaggacagc ctgtctagta ctgccagcgc cctcggaaag 840
ctccaggatg tggtgaacca gaatgcgcag gcgctgaaca cactcgtcaa acagcttagc 900
agcaatttcg gcgcaattag cagtgtactg aacgacatct tgtctcggct cgacaaggtc 960
gaggccgaag tgcagattga tcgcctgatc actggccggc tccagtctct gcagacctac 1020
gtaacccagc aactcatacg cgctgccgaa attcgggctt cagctaacct ggccgcaaca 1080
aagatgtctg aatgtgttct tgggcagtcc aagagggtgg acttctgcgg gaaaggatat 1140
cacctgatgt ccttccctca gagcgcccct catggagtgg tgtttcttca tgttacctat 1200
gttccggccc aggaaaagaa ttttaccact gccccagcca tttgccatga tggtaaagca 1260
cacttcccaa gagagggcgt gtttgttagt aacggcaccc actggttcgt tacccagcgc 1320
aatttttacg aacctcaaat cattaccact gacaatacat ttgtatcagg caattgcgac 1380
gtggtgatcg gaatcgtaaa taatacagtc tacgatcccc tgcagccaga gcttgacagc 1440
tttaaagagg aactggacaa atacttcaaa aatcatacaa gccccgacgt cgacctggga 1500
gatatttctg gcatcaatgc ctccgtcgtg aatatccaaa aagagatcga ccgccttaat 1560
gaggttgcca aaaacctcaa cgagtccctg attgatctgc aggagctggg gaagtacgag 1620
cagtatatca aatggccctg gtacatctgg ctgggcttca ttgccgggct catagccatc 1680
gtgatggtga cgatcatgct gtgttgcatg acctcttgct gttcttgtct gaaggggtgc 1740
tgctcttgtg ggagttgttg taaattcgat gaggatgatt ccgaataagc gcgc 1794
<210> 78
<211> 591
<212> PRT
<213> Artificial sequence
<220>
<223> S2-dER polypeptide of SARS-CoV-2
<400> 78
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn
20 25 30
Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr
35 40 45
Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser
50 55 60
Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn
65 70 75 80
Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu
85 90 95
Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
100 105 110
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
115 120 125
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg
130 135 140
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
145 150 155 160
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
165 170 175
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro
180 185 190
Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
195 200 205
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln
210 215 220
Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val
225 230 235 240
Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe
245 250 255
Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser
260 265 270
Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu
275 280 285
Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser
290 295 300
Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val
305 310 315 320
Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr
325 330 335
Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
340 345 350
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
355 360 365
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
370 375 380
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
385 390 395 400
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
405 410 415
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
420 425 430
Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
435 440 445
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn
450 455 460
Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
465 470 475 480
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
485 490 495
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
500 505 510
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
515 520 525
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
530 535 540
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr
545 550 555 560
Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys
565 570 575
Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
580 585 590
<210> 79
<211> 1794
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the S2-2P-dER polypeptide
of SARS-CoV-2
<400> 79
cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgta 60
gcaagtcaga gtatcatagc ctatactatg agcctggggg cagaaaattc tgtcgcttat 120
agtaataaca gtattgcaat tcctactaac ttcactatta gcgtgactac agaaattctg 180
ccagtgagca tgaccaagac ctccgtcgac tgtaccatgt atatctgcgg agacagcaca 240
gaatgcagca acctgcttct gcagtacggt agcttttgta cccagctgaa cagggcactg 300
accggcatcg ctgtggaaca ggacaaaaat acgcaggagg tgttcgctca ggtcaagcag 360
atttataaga cacccccaat aaaagacttc ggcggcttta acttctccca gatcctgccc 420
gatccgtcaa aaccttccaa gagaagtttt atcgaggatc tgctgtttaa caaagtaaca 480
ttggctgatg ctggctttat taaacagtac ggcgattgtc tgggagatat cgccgctaga 540
gatctgatct gcgctcaaaa atttaatggc ctcactgtat tgccccccct gctgacggat 600
gaaatgattg cccaatacac atcagccctg ctggctggga caatcacttc cggctggacg 660
ttcggtgctg gagctgctct tcaaattcca tttgccatgc aaatggctta tagattcaac 720
ggaattggcg tgacccaaaa cgtgctgtac gaaaatcaaa agctgattgc taatcagttt 780
aactccgcta tcggtaagat acaggacagc ctgtctagta ctgccagcgc cctcggaaag 840
ctccaggatg tggtgaacca gaatgcgcag gcgctgaaca cactcgtcaa acagcttagc 900
agcaatttcg gcgcaattag cagtgtactg aacgacatct tgtctcggct cgacccacca 960
gaggccgaag tgcagattga tcgcctgatc actggccggc tccagtctct gcagacctac 1020
gtaacccagc aactcatacg cgctgccgaa attcgggctt cagctaacct ggccgcaaca 1080
aagatgtctg aatgtgttct tgggcagtcc aagagggtgg acttctgcgg gaaaggatat 1140
cacctgatgt ccttccctca gagcgcccct catggagtgg tgtttcttca tgttacctat 1200
gttccggccc aggaaaagaa ttttaccact gccccagcca tttgccatga tggtaaagca 1260
cacttcccaa gagagggcgt gtttgttagt aacggcaccc actggttcgt tacccagcgc 1320
aatttttacg aacctcaaat cattaccact gacaatacat ttgtatcagg caattgcgac 1380
gtggtgatcg gaatcgtaaa taatacagtc tacgatcccc tgcagccaga gcttgacagc 1440
tttaaagagg aactggacaa atacttcaaa aatcatacaa gccccgacgt cgacctggga 1500
gatatttctg gcatcaatgc ctccgtcgtg aatatccaaa aagagatcga ccgccttaat 1560
gaggttgcca aaaacctcaa cgagtccctg attgatctgc aggagctggg gaagtacgag 1620
cagtatatca aatggccctg gtacatctgg ctgggcttca ttgccgggct catagccatc 1680
gtgatggtga cgatcatgct gtgttgcatg acctcttgct gttcttgtct gaaggggtgc 1740
tgctcttgtg ggagttgttg taaattcgat gaggatgatt ccgaataagc gcgc 1794
<210> 80
<211> 591
<212> PRT
<213> Artificial sequence
<220>
<223> S2-2P-dER polypeptide of SARS-CoV-2
<400> 80
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn
20 25 30
Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr
35 40 45
Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser
50 55 60
Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn
65 70 75 80
Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu
85 90 95
Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
100 105 110
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
115 120 125
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg
130 135 140
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
145 150 155 160
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
165 170 175
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro
180 185 190
Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
195 200 205
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln
210 215 220
Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val
225 230 235 240
Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe
245 250 255
Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser
260 265 270
Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu
275 280 285
Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser
290 295 300
Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val
305 310 315 320
Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr
325 330 335
Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
340 345 350
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
355 360 365
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
370 375 380
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
385 390 395 400
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
405 410 415
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
420 425 430
Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
435 440 445
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn
450 455 460
Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
465 470 475 480
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
485 490 495
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
500 505 510
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
515 520 525
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
530 535 540
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr
545 550 555 560
Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys
565 570 575
Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu
580 585 590
<210> 81
<211> 3840
<212> DNA
<213> Artificial sequence
<220>
<223> Codon-optimized nucleotide sequence of the SF-2P-2a polypeptide
of SARS-CoV-2
<400> 81
cgtacggcca ccatgttcgt ctttctggta ttgcttcctc tggtgagttc ccagtgcgtg 60
aacctgacga ctcggacaca gctgccgcct gcatacacaa acagcttcac acgaggtgtt 120
tactatccgg acaaggtgtt ccggtcctct gtcttgcaca gtactcagga cctttttctg 180
ccattcttta gtaacgtaac atggttccac gctatccatg taagtggaac caatggcacc 240
aagcgcttcg acaatccagt cctgcctttc aacgatggcg tctacttcgc ctctaccgag 300
aaatcaaata ttattagagg gtggatcttc gggaccaccc ttgatagcaa gactcagagt 360
cttctgatcg tgaacaatgc tactaacgtc gtcataaaag tatgtgaatt tcagttctgc 420
aatgacccct tcctgggcgt gtactatcac aaaaataaca agtcctggat ggaatccgag 480
tttcgggtat acagcagcgc taataactgt accttcgaat atgtgagcca gccattcctg 540
atggacctgg aggggaagca gggcaacttc aaaaacctga gggaattcgt gttcaagaac 600
attgacggat acttcaaaat ctacagcaag cacactccaa ttaatcttgt tagggacctt 660
cctcaggggt tctccgcgct ggaacccttg gtggatctgc caattggtat taacatcacg 720
aggtttcaaa ccctgctcgc cctccaccgg tcatacctga ccccaggtga tagtagtagt 780
ggctggacag caggggccgc agcatactac gtcggctacc tccagccccg cacattcctg 840
ctgaagtata atgaaaacgg tactattaca gatgctgtgg actgcgcact tgatccattg 900
tccgagacta aatgcacctt gaagtctttt accgttgaga agggaatcta tcagaccagt 960
aatttcagag tgcaacccac cgagagcatc gtgcgatttc ctaatattac aaacctgtgc 1020
ccttttggcg aggtgtttaa cgccactcgc ttcgcgagcg tgtatgcatg gaaccggaaa 1080
aggattagca actgcgtggc tgattattca gtcctttata atagtgcctc tttcagtacg 1140
ttcaaatgct atggagtgtc cccaactaag cttaacgatc tgtgttttac caacgtgtat 1200
gccgactctt tcgtcatcag gggcgacgag gttagacaaa ttgcgcccgg acagacaggc 1260
aaaattgctg actacaatta taaactgcca gatgacttta caggatgcgt gattgcctgg 1320
aacagcaaca accttgattc taaggtgggc ggaaactaca actatctgta caggctgttc 1380
cgcaaatcaa acctgaagcc attcgaaagg gacatttcaa ctgagatcta ccaggccgga 1440
tctacacctt gcaacggggt ggaaggattc aactgctact tcccgctcca gtcatatggc 1500
tttcaaccta ccaatggagt gggctaccaa ccttatcgag tagttgttct ctctttcgag 1560
ttgttgcatg ccccagccac tgtctgcgga ccaaagaaat ccaccaatct ggtgaaaaac 1620
aagtgcgtca acttcaactt caatggactc accggtacag gggttcttac cgagtcaaac 1680
aagaaattcc ttccgtttca gcagtttgga cgcgatatcg ccgacactac ggatgcagta 1740
cgcgatcctc agacacttga gatcctggac atcactccat gctcttttgg aggggtgtct 1800
gtcatcactc ccgggacgaa taccagtaat caggtcgccg tgctctatca agatgtcaac 1860
tgcacagagg tgccagtcgc cattcacgcc gatcagctta cccctacttg gcgagtatat 1920
agcacagggt ccaacgtgtt tcagacaagg gcgggttgtc tgatcggcgc tgagcacgtc 1980
aataatagct acgaatgtga catccctatt ggagccggga tttgcgctag ctatcagact 2040
cagactaact caccccggcg agctaggtct gtagcaagtc agagtatcat agcctatact 2100
atgagcctgg gggcagaaaa ttctgtcgct tatagtaata acagtattgc aattcctact 2160
aacttcacta ttagcgtgac tacagaaatt ctgccagtga gcatgaccaa gacctccgtc 2220
gactgtacca tgtatatctg cggagacagc acagaatgca gcaacctgct tctgcagtac 2280
ggtagctttt gtacccagct gaacagggca ctgaccggca tcgctgtgga acaggacaaa 2340
aatacgcagg aggtgttcgc tcaggtcaag cagatttata agacaccccc aataaaagac 2400
ttcggcggct ttaacttctc ccagatcctg cccgatccgt caaaaccttc caagagaagt 2460
tttatcgagg atctgctgtt taacaaagta acattggctg atgctggctt tattaaacag 2520
tacggcgatt gtctgggaga tatcgccgct agagatctga tctgcgctca aaaatttaat 2580
ggcctcactg tattgccccc cctgctgacg gatgaaatga ttgcccaata cacatcagcc 2640
ctgctggctg ggacaatcac ttccggctgg acgttcggtg ctggagctgc tcttcaaatt 2700
ccatttgcca tgcaaatggc ttatagattc aacggaattg gcgtgaccca aaacgtgctg 2760
tacgaaaatc aaaagctgat tgctaatcag tttaactccg ctatcggtaa gatacaggac 2820
agcctgtcta gtactgccag cgccctcgga aagctccagg atgtggtgaa ccagaatgcg 2880
caggcgctga acacactcgt caaacagctt agcagcaatt tcggcgcaat tagcagtgta 2940
ctgaacgaca tcttgtctcg gctcgaccca ccagaggccg aagtgcagat tgatcgcctg 3000
atcactggcc ggctccagtc tctgcagacc tacgtaaccc agcaactcat acgcgctgcc 3060
gaaattcggg cttcagctaa cctggccgca acaaagatgt ctgaatgtgt tcttgggcag 3120
tccaagaggg tggacttctg cgggaaagga tatcacctga tgtccttccc tcagagcgcc 3180
cctcatggag tggtgtttct tcatgttacc tatgttccgg cccaggaaaa gaattttacc 3240
actgccccag ccatttgcca tgatggtaaa gcacacttcc caagagaggg cgtgtttgtt 3300
agtaacggca cccactggtt cgttacccag cgcaattttt acgaacctca aatcattacc 3360
actgacaata catttgtatc aggcaattgc gacgtggtga tcggaatcgt aaataataca 3420
gtctacgatc ccctgcagcc agagcttgac agctttaaag aggaactgga caaatacttc 3480
aaaaatcata caagccccga cgtcgacctg ggagatattt ctggcatcaa tgcctccgtc 3540
gtgaatatcc aaaaagagat cgaccgcctt aatgaggttg ccaaaaacct caacgagtcc 3600
ctgattgatc tgcaggagct ggggaagtac gagcagtata tcaaatggcc ctggtacatc 3660
tggctgggct tcattgccgg gctcatagcc atcgtgatgg tgacgatcat gctgtgttgc 3720
atgacctctt gctgttcttg tctgaagggg tgctgctctt gtgggagttg ttgtaaattc 3780
gatgaggatg attccgaacc tgtgctgaag ggagtcgcgc tcgcctatac gtaagcgcgc 3840
<210> 82
<211> 1273
<212> PRT
<213> Artificial sequence
<220>
<223> SF-2P-2a polypeptide of SARS-CoV-2
<400> 82
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Ala Leu Ala Tyr Thr
1265 1270
<210> 83
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (52-66)
<400> 83
Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His
1 5 10 15
<210> 84
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (469-483)
<400> 84
Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
1 5 10 15
<210> 85
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (512-526)
<400> 85
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
1 5 10 15
<210> 86
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (702-716)
<400> 86
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
1 5 10 15
<210> 87
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (882-896)
<400> 87
Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
1 5 10 15
<210> 88
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (901-915)
<400> 88
Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
1 5 10 15
<210> 89
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (932-946)
<400> 89
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly
1 5 10 15
<210> 90
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (1013-1027)
<400> 90
Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1 5 10 15
<210> 91
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (1046-1060)
<400> 91
Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val
1 5 10 15
<210> 92
<211> 15
<212> PRT
<213> Artificial sequence
<220>
<223> CD4 peptide (1069-1083)
<400> 92
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1 5 10 15
<210> 93
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (2-10)
<400> 93
Phe Val Phe Leu Val Leu Leu Pro Leu
1 5
<210> 94
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (16-24)
<400> 94
Val Asn Leu Thr Thr Arg Thr Gln Leu
1 5
<210> 95
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (54-62)
<400> 95
Leu Phe Leu Pro Phe Phe Ser Asn Val
1 5
<210> 96
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (60-68)
<400> 96
Ser Asn Val Thr Trp Phe His Ala Ile
1 5
<210> 97
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (62-70)
<400> 97
Val Thr Trp Phe His Ala Ile His Val
1 5
<210> 98
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (102-110)
<400> 98
Arg Gly Trp Ile Phe Gly Thr Thr Leu
1 5
<210> 99
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (133-141)
<400> 99
Phe Gln Phe Cys Asn Asp Pro Phe Leu
1 5
<210> 100
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (160-168)
<400> 100
Tyr Ser Ser Ala Asn Asn Cys Thr Phe
1 5
<210> 101
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (171-179)
<400> 101
Val Ser Gln Pro Phe Leu Met Asp Leu
1 5
<210> 102
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (202-210)
<400> 102
Lys Ile Tyr Ser Lys His Thr Pro Ile
1 5
<210> 103
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (233-241)
<400> 103
Ile Asn Ile Thr Arg Phe Gln Thr Leu
1 5
<210> 104
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (262-270)
<400> 104
Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
1 5
<210> 105
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (327-335)
<400> 105
Val Arg Phe Pro Asn Ile Thr Asn Leu
1 5
<210> 106
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (342-350)
<400> 106
Phe Asn Ala Thr Arg Phe Ala Ser Val
1 5
<210> 107
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (447-455)
<400> 107
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
1 5
<210> 108
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (503-511)
<400> 108
Val Gly Tyr Gln Pro Tyr Arg Val Val
1 5
<210> 109
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (510-518)
<400> 109
Val Val Val Leu Ser Phe Glu Leu Leu
1 5
<210> 110
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (539-547)
<400> 110
Val Asn Phe Asn Phe Asn Gly Leu Thr
1 5
<210> 111
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (612-620)
<400> 111
Tyr Gln Asp Val Asn Cys Thr Glu Val
1 5
<210> 112
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (691-699)
<400> 112
Ser Ile Ile Ala Tyr Thr Met Ser Leu
1 5
<210> 113
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (705-713)
<400> 113
Val Ala Tyr Ser Asn Asn Ser Ile Ala
1 5
<210> 114
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (797-805)
<400> 114
Phe Gly Gly Phe Asn Phe Ser Gln Ile
1 5
<210> 115
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (892-900)
<400> 115
Ala Ala Leu Gln Ile Pro Phe Ala Met
1 5
<210> 116
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (951-959)
<400> 116
Val Val Asn Gln Asn Ala Gln Ala Leu
1 5
<210> 117
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (1060-1068)
<400> 117
Val Val Phe Leu His Val Thr Tyr Val
1 5
<210> 118
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (1169-1177)
<400> 118
Ile Ser Gly Ile Asn Ala Ser Val Val
1 5
<210> 119
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (1216-1224)
<400> 119
Ile Trp Leu Gly Phe Ile Ala Gly Leu
1 5
<210> 120
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> CD8 peptide (1225-1233)
<400> 120
Ile Ala Ile Val Met Val Thr Ile Met
1 5
<210> 121
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BsiWI-Signal
<400> 121
taacgtacgg ccaccatgtt cgtctttctg gtattg 36
<210> 122
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BssHII-SF
<400> 122
taagcgcgcc tattattcgg aatcatcctc atcga 35
<210> 123
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BsmBI-signal
<400> 123
taacgtctcc gcactgggaa ctcaccagag gaag 34
<210> 124
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BsmBI-S2
<400> 124
taacgtctca gtgcgtagca agtcagagta tcatag 36
<210> 125
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BssHII-S2
<400> 125
taagcgcgct tattcggaat catcctcatc gaatttac 38
<210> 126
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BsmBI-2P-fwd
<400> 126
aatcgtctca caccagaggc cgaagtgcag attgatcgcc tg 42
<210> 127
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Construction primer BsmBI-2P-rev
<400> 127
atacgtctca ggtgggtcga gccgagacaa gatgtcgttc 40
<210> 128
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer Signal-fwd1
<400> 128
tctggtattg cttcctctgg tg 22
<210> 129
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer SF-fwd2
<400> 129
tgcgcacttg atccattgtc 20
<210> 130
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer S2-fwd3
<400> 130
gtaaagcaca cttcccaaga g 21
<210> 131
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer SF-fwd4
<400> 131
gatcctggac atcactccat gc 22
<210> 132
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer SF-rev1
<400> 132
ttccacttac atggatagcg tgg 23
<210> 133
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer S2-rev1
<400> 133
tactgttatt actataagcg acag 24
<210> 134
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer S2-rev3
<400> 134
gatctctagc ggcgatatct c 21
<210> 135
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer 3433
<400> 135
gaccttggga ggcaatcact 20
<210> 136
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer oligo8a
<400> 136
ggaatcgctg tcctcaacaa 20
<210> 137
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer 9119
<400> 137
agatagggct gctagtgaac caat 24
<210> 138
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Sequencing primer 9218
<400> 138
tggaccctac gtttttctta attct 25
<210> 139
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> qRT-PCR primer nCoV_IP4-14059Fw
<400> 139
ggtaactggt atgatttcg 19
<210> 140
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> qRT-PCR primer nCoV_IP4-14146Rv
<400> 140
ctggtcaagg ttaatatagg 20
<210> 141
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> qRT-PCR primer nCoV_IP4-14084Probe(+) - [5']Hex [3']BHQ-1 19
<400> 141
tcatacaaac cacgccagg 19
<210> 142
<211> 29
<212> PRT
<213> Artificial sequence
<220>
<223> Cytoplasmic tail from positions 1245 to 1273 of the native S
protein of SARS-CoV-2
<400> 142
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
1 5 10 15
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
20 25
<210> 143
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> dER polypeptide
<400> 143
Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
1 5 10 15
Ser Glu
<210> 144
<211> 22796
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-SF-dER_SARS-CoV-2 (optimized sequence)
<400> 144
tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60
cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120
atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180
tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240
cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300
caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360
taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420
ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480
gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540
caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600
gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660
aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720
tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780
agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840
tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900
tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960
atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020
aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080
ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140
actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200
gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260
atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320
ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380
caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440
catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500
ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560
gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620
caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680
tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740
acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800
taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860
aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920
ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980
gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040
gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100
gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160
actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220
gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280
caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340
gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400
cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460
gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520
gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580
acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640
acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700
gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760
acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820
ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880
ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940
cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000
atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060
cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120
aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180
cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240
tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300
cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360
aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420
aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480
aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540
tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600
cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660
tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720
taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780
cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840
gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900
atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960
gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020
gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080
agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140
aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200
cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260
tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320
ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380
acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440
ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500
ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560
ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620
tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680
tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740
tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800
attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860
attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920
agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980
gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040
gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100
ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160
acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220
ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280
ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340
cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400
tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460
tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520
gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580
ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640
aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700
tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760
tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820
agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880
tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940
tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000
tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060
gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120
cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180
tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240
tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300
tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360
ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420
tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480
ctcggctcga caaggtcgag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540
agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600
ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660
tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720
ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780
gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840
ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900
tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960
agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020
ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080
agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140
agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200
ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260
cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320
aataataggc gcgcagcgct tagacgtctc gcgatcgata ctagtacaac ctaaatccat 7380
tataaaaaac ttaggagcaa agtgattgcc tcccaaggtc cacaatgaca gagacctacg 7440
acttcgacaa gtcggcatgg gacatcaaag ggtcgatcgc tccgatacaa cccaccacct 7500
acagtgatgg caggctggtg ccccaggtca gagtcataga tcctggtcta ggcgacagga 7560
aggatgaatg ctttatgtac atgtttctgc tgggggttgt tgaggacagc gattccctag 7620
ggcctccaat cgggcgagca tttgggttcc tgcccttagg tgttggcaga tccacagcaa 7680
agcccgaaaa actcctcaaa gaggccactg agcttgacat agttgttaga cgtacagcag 7740
ggctcaatga aaaactggtg ttctacaaca acaccccact aactctcctc acaccttgga 7800
gaaaggtcct aacaacaggg agtgtcttca acgcaaacca agtgtgcaat gcggttaatc 7860
tgataccgct cgataccccg cagaggttcc gtgttgttta tatgagcatc acccgtcttt 7920
cggataacgg gtattacacc gttcctagaa gaatgctgga attcagatcg gtcaatgcag 7980
tggccttcaa cctgctggtg acccttagga ttgacaaggc gataggccct gggaagatca 8040
tcgacaatac agagcaactt cctgaggcaa catttatggt ccacatcggg aacttcagga 8100
gaaagaagag tgaagtctac tctgccgatt attgcaaaat gaaaatcgaa aagatgggcc 8160
tggtttttgc acttggtggg atagggggca ccagtcttca cattagaagc acaggcaaaa 8220
tgagcaagac tctccatgca caactcgggt tcaagaagac cttatgttac ccgctgatgg 8280
atatcaatga agaccttaat cgattactct ggaggagcag atgcaagata gtaagaatcc 8340
aggcagtttt gcagccatca gttcctcaag aattccgcat ttacgacgac gtgatcataa 8400
atgatgacca aggactattc aaagttctgt agaccgtagt gcccagcaat gcccgaaaac 8460
gacccccctc acaatgacag ccagaaggcc cggacaaaaa agccccctcc gaaagactcc 8520
acggaccaag cgagaggcca gccagcagcc gacggcaagc gcgaacacca ggcggcccca 8580
gcacagaaca gccctgacac aaggccacca ccagccaccc caatctgcat cctcctcgtg 8640
ggacccccga ggaccaaccc ccaaggctgc ccccgatcca aaccaccaac cgcatcccca 8700
ccacccccgg gaaagaaacc cccagcaatt ggaaggcccc tccccctctt cctcaacaca 8760
agaactccac aaccgaaccg cacaagcgac cgaggtgacc caaccgcagg catccgactc 8820
cctagacaga tcctctctcc ccggcaaact aaacaaaact tagggccaag gaacatacac 8880
acccaacaga acccagaccc cggcccacgg cgccgcgccc ccaacccccg acaaccagag 8940
ggagccccca accaatcccg ccggctcccc cggtgcccac aggcagggac accaaccccc 9000
gaacagaccc agcacccaac catcgacaat ccaagacggg ggggcccccc caaaaaaagg 9060
cccccagggg ccgacagcca gcaccgcgag gaagcccacc caccccacac acgaccacgg 9120
caaccaaacc agaacccaga ccaccctggg ccaccagctc ccagactcgg ccatcacccc 9180
gcagaaagga aaggccacaa cccgcgcacc ccagccccga tccggcgggg agccacccaa 9240
cccgaaccag cacccaagag cgatccccga aggacccccg aaccgcaaag gacatcagta 9300
tcccacagcc tctccaagtc ccccggtctc ctcctcttct cgaagggacc aaaagatcaa 9360
tccaccacac ccgacgacac tcaactcccc acccctaaag gagacaccgg gaatcccaga 9420
atcaagactc atccaatgtc catcatgggt ctcaaggtga acgtctctgc catattcatg 9480
gcagtactgt taactctcca aacacccacc ggtcaaatcc attggggcaa tctctctaag 9540
ataggggtgg taggaatagg aagtgcaagc tacaaagtta tgactcgttc cagccatcaa 9600
tcattagtca taaaattaat gcccaatata actctcctca ataactgcac gagggtagag 9660
attgcagaat acaggagact actgagaaca gttttggaac caattagaga tgcacttaat 9720
gcaatgaccc agaatataag accggttcag agtgtagctt caagtaggag acacaagaga 9780
tttgcgggag tagtcctggc aggtgcggcc ctaggcgttg ccacagctgc tcagataaca 9840
gccggcattg cacttcacca gtccatgctg aactctcaag ccatcgacaa tctgagagcg 9900
agcctggaaa ctactaatca ggcaattgag acaatcagac aagcagggca ggagatgata 9960
ttggctgttc agggtgtcca agactacatc aataatgagc tgataccgtc tatgaaccaa 10020
ctatcttgtg atttaatcgg ccagaagctc gggctcaaat tgctcagata ctatacagaa 10080
atcctgtcat tatttggccc cagtttacgg gaccccatat ctgcggagat atctatccag 10140
gctttgagct atgcgcttgg aggagacatc aataaggtgt tagaaaagct cggatacagt 10200
ggaggtgatt tactgggcat cttagagagc ggaggaataa aggcccggat aactcacgtc 10260
gacacagagt cctacttcat tgtcctcagt atagcctatc cgacgctgtc cgagattaag 10320
ggggtgattg tccaccggct agagggggtc tcgtacaaca taggctctca agagtggtat 10380
accactgtgc ccaagtatgt tgcaacccaa gggtacctta tctcgaattt tgatgagtca 10440
tcgtgtactt tcatgccaga ggggactgtg tgcagccaaa atgccttgta cccgatgagt 10500
cctctgctcc aagaatgcct ccgggggtac accaagtcct gtgctcgtac actcgtatcc 10560
gggtcttttg ggaaccggtt cattttatca caagggaacc taatagccaa ttgtgcatca 10620
atcctttgca agtgttacac aacaggaacg atcattaatc aagaccctga caagatccta 10680
acatacattg ctgccgatca ctgcccggta gtcgaggtga acggcgtgac catccaagtc 10740
gggagcagga ggtatccaga cgctgtgtac ttgcacagaa ttgacctcgg tcctcccata 10800
tcattggaga ggttggacgt agggacaaat ctggggaatg caattgctaa gttggaggat 10860
gccaaggaat tgttggagtc atcggaccag atattgagga gtatgaaagg tttatcgagc 10920
actagcatag tctacatcct gattgcagtg tgtcttggag ggttgatagg gatccccgct 10980
ttaatatgtt gctgcagggg gcgttgtaac aaaaagggag aacaagttgg tatgtcaaga 11040
ccaggcctaa agcctgatct tacgggaaca tcaaaatcct atgtaaggtc gctctgatcc 11100
tctacaactc ttgaaacaca aatgtcccac aagtctcctc ttcgtcatca agcaaccacc 11160
gcacccagca tcaagcccac ctgaaattat ctccggcttc cctctggccg aacaatatcg 11220
gtagttaatc aaaacttagg gtgcaagatc atccacaatg tcaccacaac gagaccggat 11280
aaatgccttc tacaaagata acccccatcc caagggaagt aggatagtca ttaacagaga 11340
acatcttatg attgatagac cttatgtttt gctggctgtt ctgtttgtca tgtttctgag 11400
cttgatcggg ttgctagcca ttgcaggcat tagacttcat cgggcagcca tctacaccgc 11460
agagatccat aaaagcctca gcaccaatct agatgtaact aactcaatcg agcatcaggt 11520
caaggacgtg ctgacaccac tcttcaaaat catcggtgat gaagtgggcc tgaggacacc 11580
tcagagattc actgacctag tgaaattaat ctctgacaag attaaattcc ttaatccgga 11640
tagggagtac gacttcagag atctcacttg gtgtatcaac ccgccagaga gaatcaaatt 11700
ggattatgat caatactgtg cagatgtggc tgctgaagag ctcatgaatg cattggtgaa 11760
ctcaactcta ctggagacca gaacaaccaa tcagttccta gctgtctcaa agggaaactg 11820
ctcagggccc actacaatca gaggtcaatt ctcaaacatg tcgctgtccc tgttagactt 11880
gtatttaggt cgaggttaca atgtgtcatc tatagtcact atgacatccc agggaatgta 11940
tgggggaact tacctagtgg aaaagcctaa tctgagcagc aaaaggtcag agttgtcaca 12000
actgagcatg taccgagtgt ttgaagtagg tgttatcaga aatccgggtt tgggggctcc 12060
ggtgttccat atgacaaact atcttgagca accagtcagt aatgatctca gcaactgtat 12120
ggtggctttg ggggagctca aactcgcagc cctttgtcac ggggaagatt ctatcacaat 12180
tccctatcag ggatcaggga aaggtgtcag cttccagctc gtcaagctag gtgtctggaa 12240
atccccaacc gacatgcaat cctgggtccc cttatcaacg gatgatccag tgatagacag 12300
gctttacctc tcatctcaca gaggtgttat cgctgacaat caagcaaaat gggctgtccc 12360
gacaacacga acagatgaca agttgcgaat ggagacatgc ttccaacagg cgtgtaaggg 12420
taaaatccaa gcactctgcg agaatcccga gtgggcacca ttgaaggata acaggattcc 12480
ttcatacggg gtcttgtctg ttgatctgag tctgacagtt gagcttaaaa tcaaaattgc 12540
ttcgggattc gggccattga tcacacacgg ttcagggatg gacctataca aatccaacca 12600
caacaatgtg tattggctga ctatcccgcc aatgaagaac ctagccttag gtgtaatcaa 12660
cacattggag tggataccga gattcaaggt tagtccctac ctcttcactg tcccaattaa 12720
ggaagcaggc gaagactgcc atgccccaac atacctacct gcggaggtgg atggtgatgt 12780
caaactcagt tccaatctgg tgattctacc tggtcaagat ctccaatatg ttttggcaac 12840
ctacgatact tccagggttg aacatgctgt ggtttattac gtttacagcc caagccgctc 12900
attttcttac ttttatcctt ttaggttgcc tataaagggg gtccccatcg aattacaagt 12960
ggaatgcttc acatgggacc aaaaactctg gtgccgtcac ttctgtgtgc ttgcggactc 13020
agaatctggt ggacatatca ctcactctgg gatggtgggc atgggagtca gctgcacagt 13080
cacccgggaa gatggaacca atcgcagata gggctgctag tgaaccaatc acatgatgtc 13140
acccagacat caggcatacc cactagtgtg aaatagacat cagaattaag aaaaacgtag 13200
ggtccaagtg gttccccgtt atggactcgc tatctgtcaa ccagatctta taccctgaag 13260
ttcacctaga tagcccgata gttaccaata agatagtagc catcctggag tatgctcgag 13320
tccctcacgc ttacagcctg gaggacccta cactgtgtca gaacatcaag caccgcctaa 13380
aaaacggatt ttccaaccaa atgattataa acaatgtgga agttgggaat gtcatcaagt 13440
ccaagcttag gagttatccg gcccactctc atattccata tccaaattgt aatcaggatt 13500
tatttaacat agaagacaaa gagtcaacga ggaagatccg tgaactcctc aaaaagggga 13560
attcgctgta ctccaaagtc agtgataagg ttttccaatg cttaagggac actaactcac 13620
ggcttggcct aggctccgaa ttgagggagg acatcaagga gaaagttatt aacttgggag 13680
tttacatgca cagctcccag tggtttgagc cctttctgtt ttggtttaca gtcaagactg 13740
agatgaggtc agtgattaaa tcacaaaccc atacttgcca taggaggaga cacacacctg 13800
tattcttcac tggtagttca gttgagttgc taatctctcg tgaccttgtt gctataatca 13860
gtaaagagtc tcaacatgta tattacctga catttgaact ggttttgatg tattgtgatg 13920
tcatagaggg gaggttaatg acagagaccg ctatgactat tgatgctagg tatacagagc 13980
ttctaggaag agtcagatac atgtggaaac tgatagatgg tttcttccct gcactcggga 14040
atccaactta tcaaattgta gccatgctgg agcctctttc acttgcttac ctgcagctga 14100
gggatataac agtagaactc agaggtgctt tccttaacca ctgctttact gaaatacatg 14160
atgttcttga ccaaaacggg ttttctgatg aaggtactta tcatgagtta actgaagctc 14220
tagattacat tttcataact gatgacatac atctgacagg ggagattttc tcatttttca 14280
gaagtttcgg ccaccccaga cttgaagcag taacggctgc tgaaaatgtt aggaaataca 14340
tgaatcagcc taaagtcatt gtgtatgaga ctctgatgaa aggtcatgcc atattttgtg 14400
gaatcataat caacggctat cgtgacaggc acggaggcag ttggccaccg ctgaccctcc 14460
ccctgcatgc tgcagacaca atccggaatg ctcaagcttc aggtgaaggg ttaacacatg 14520
agcagtgcgt tgataactgg aaatcttttg ctggagtgaa atttggctgc tttatgcctc 14580
ttagcctgga tagtgatctg acaatgtacc taaaggacaa ggcacttgct gctctccaaa 14640
gggaatggga ttcagtttac ccgaaagagt tcctgcgtta cgaccctccc aagggaaccg 14700
ggtcacggag gcttgtagat gttttcctta atgattcgag ctttgaccca tatgatgtga 14760
taatgtatgt tgtaagtgga gcttacctcc atgaccctga gttcaacctg tcttacagcc 14820
tgaaagaaaa ggagatcaag gaaacaggta gactttttgc taaaatgact tacaaaatga 14880
gggcatgcca agtgattgct gaaaatctaa tctcaaacgg gattggcaaa tattttaagg 14940
acaatgggat ggccaaggat gagcacgatt tgactaaggc actccacact ctagctgtct 15000
caggagtccc caaagatctc aaagaaagtc acaggggggg gccagtctta aaaacctact 15060
cccgaagccc agtccacaca agtaccagga acgtgagagc agcaaaaggg tttatagggt 15120
tccctcaagt aattcggcag gaccaagaca ctgatcatcc ggagaatatg gaagcttacg 15180
agacagtcag tgcatttatc acgactgatc tcaagaagta ctgccttaat tggagatatg 15240
agaccatcag cttgtttgca cagaggctaa atgagattta cggattgccc tcatttttcc 15300
agtggctgca taagaggctt gagacctctg tcctgtatgt aagtgaccct cattgccccc 15360
ccgaccttga cgcccatatc ccgttatata aagtccccaa tgatcaaatc ttcattaagt 15420
accctatggg aggtatagaa gggtattgtc agaagctgtg gaccatcagc accattccct 15480
atctatacct ggctgcttat gagagcggag taaggattgc ttcgttagtg caaggggaca 15540
atcagaccat agccgtaaca aaaagggtac ccagcacatg gccctacaac cttaagaaac 15600
gggaagctgc tagagtaact agagattact ttgtaattct taggcaaagg ctacatgata 15660
ttggccatca cctcaaggca aatgagacaa ttgtttcatc acattttttt gtctattcaa 15720
aaggaatata ttatgatggg ctacttgtgt cccaatcact caagagcatc gcaagatgtg 15780
tattctggtc agagactata gttgatgaaa caagggcagc atgcagtaat attgctacaa 15840
caatggctaa aagcatcgag agaggttatg accgttacct tgcatattcc ctgaacgtcc 15900
taaaagtgat acagcaaatt ctgatctctc ttggcttcac aatcaattca accatgaccc 15960
gggatgtagt catacccctc ctcacaaaca acgacctctt aataaggatg gcactgttgc 16020
ccgctcctat tggggggatg aattatctga atatgagcag gctgtttgtc agaaacatcg 16080
gtgatccagt aacatcatca attgctgatc tcaagagaat gattctcgcc tcactaatgc 16140
ctgaagagac cctccatcaa gtaatgacac aacaaccggg ggactcttca ttcctagact 16200
gggctagcga cccttactca gcaaatcttg tatgtgtcca gagcatcact agactcctca 16260
agaacataac tgcaaggttt gtcctgatcc atagtccaaa cccaatgtta aaaggattat 16320
tccatgatga cagtaaagaa gaggacgagg gactggcggc attcctcatg gacaggcata 16380
ttatagtacc tagggcagct catgaaatcc tggatcatag tgtcacaggg gcaagagagt 16440
ctattgcagg catgctggat accacaaaag gcttgattcg agccagcatg aggaaggggg 16500
ggttaacctc tcgagtgata accagattgt ccaattatga ctatgaacaa ttcagagcag 16560
ggatggtgct attgacagga agaaagagaa atgtcctcat tgacaaagag tcatgttcag 16620
tgcagctggc gagagctcta agaagccata tgtgggcgag gctagctcga ggacggccta 16680
tttacggcct tgaggtccct gatgtactag aatctatgcg aggccacctt attcggcgtc 16740
atgagacatg tgtcatctgc gagtgtggat cagtcaacta cggatggttt tttgtcccct 16800
cgggttgcca actggatgat attgacaagg aaacatcatc cttgagagtc ccatatattg 16860
gttctaccac tgatgagaga acagacatga agcttgcctt cgtaagagcc ccaagtcgat 16920
ccttgcgatc tgctgttaga atagcaacag tgtactcatg ggcttacggt gatgatgata 16980
gctcttggaa cgaagcctgg ttgttggcta ggcaaagggc caatgtgagc ctggaggagc 17040
taagggtgat cactcccatc tcaacttcga ctaatttagc gcataggttg agggatcgta 17100
gcactcaagt gaaatactca ggtacatccc ttgtccgagt ggcgaggtat accacaatct 17160
ccaacgacaa tctctcattt gtcatatcag ataagaaggt tgatactaac tttatatacc 17220
aacaaggaat gcttctaggg ttgggtgttt tagaaacatt gtttcgactc gagaaagata 17280
ccggatcatc taacacggta ttacatcttc acgtcgaaac agattgttgc gtgatcccga 17340
tgatagatca tcccaggata cccagctccc gcaagctaga gctgagggca gagctatgta 17400
ccaacccatt gatatatgat aatgcacctt taattgacag agatgcaaca aggctataca 17460
cccagagcca taggaggcac cttgtggaat ttgttacatg gtccacaccc caactatatc 17520
acattttagc taagtccaca gcactatcta tgattgacct ggtaacaaaa tttgagaagg 17580
accatatgaa tgaaatttca gctctcatag gggatgacga tatcaatagt ttcataactg 17640
agtttctgct catagagcca agattattca ctatctactt gggccagtgt gcggccatca 17700
attgggcatt tgatgtacat tatcatagac catcagggaa atatcagatg ggtgagctgt 17760
tgtcatcgtt cctttctaga atgagcaaag gagtgtttaa ggtgcttgtc aatgctctaa 17820
gccacccaaa gatctacaag aaattctggc attgtggtat tatagagcct atccatggtc 17880
cttcacttga tgctcaaaac ttgcacacaa ctgtgtgcaa catggtttac acatgctata 17940
tgacctacct cgacctgttg ttgaatgaag agttagaaga gttcacattt ctcttgtgtg 18000
aaagcgacga ggatgtagta ccggacagat tcgacaacat ccaggcaaaa cacttatgtg 18060
ttctggcaga tttgtactgt caaccaggga cctgcccacc aattcgaggt ctaagaccgg 18120
tagagaaatg tgcagttcta accgaccata tcaaggcaga ggctatgtta tctccagcag 18180
gatcttcgtg gaacataaat ccaattattg tagaccatta ctcatgctct ctgacttatc 18240
tccggcgagg atcgatcaaa cagataagat tgagagttga tccaggattc attttcgacg 18300
ccctcgctga ggtaaatgtc agtcagccaa agatcggcag caacaacatc tcaaatatga 18360
gcatcaaggc tttcagaccc ccacacgatg atgttgcaaa attgctcaaa gatatcaaca 18420
caagcaagca caatcttccc atttcagggg gcaatctcgc caattatgaa atccatgctt 18480
tccgcagaat cgggttgaac tcatctgctt gctacaaagc tgttgagata tcaacattaa 18540
ttaggagatg ccttgagcca ggggaggacg gcttgttctt gggtgaggga tcgggttcta 18600
tgttgatcac ttataaagag atacttaaac taaacaagtg cttctataat agtggggttt 18660
ccgccaattc tagatctggt caaagggaat tagcacccta tccctccgaa gttggccttg 18720
tcgaacacag aatgggagta ggtaatattg tcaaagtgct ctttaacggg aggcccgaag 18780
tcacgtgggt aggcagtgta gattgcttca atttcatagt tagtaatatc cctacctcta 18840
gtgtggggtt tatccattca gatatagaga ccttgcctga caaagatact atagagaagc 18900
tagaggaatt ggcagccatc ttatcgatgg ctctgctcct gggcaaaata ggatcaatac 18960
tggtgattaa gcttatgcct ttcagcgggg attttgttca gggatttata agttatgtag 19020
ggtctcatta tagagaagtg aaccttgtat accctagata cagcaacttc atctctactg 19080
aatcttattt ggttatgaca gatctcaagg ctaaccggct aatgaatcct gaaaagatta 19140
agcagcagat aattgaatca tctgtgagga cttcacctgg acttataggt cacatcctat 19200
ccattaagca actaagctgc atacaagcaa ttgtgggaga cgcagttagt agaggtgata 19260
tcaatcctac tctgaaaaaa cttacaccta tagagcaggt gctgatcaat tgcgggttgg 19320
caattaacgg acctaagctg tgcaaagaat tgatccacca tgatgttgcc tcagggcaag 19380
atggattgct taattctata ctcatcctct acagggagtt ggcaagattc aaagacaacc 19440
aaagaagtca acaagggatg ttccacgctt accccgtatt ggtaagtagc aggcaacgag 19500
aacttatatc taggatcacc cgcaaattct gggggcacat tcttctttac tccgggaaca 19560
aaaagttgat aaataagttt atccagaatc tcaagtccgg ctatctgata ctagacttac 19620
accagaatat cttcgttaag aatctatcca agtcagagaa acagattatt atgacggggg 19680
gtttgaaacg tgagtgggtt tttaaggtaa cagtcaagga gaccaaagaa tggtataagt 19740
tagtcggata cagtgccctg attaaggact aattggttga actccggaac cctaatcctg 19800
ccctaggtgg ttaggcatta tttgcaatat attaaagaaa actttgaaaa tacgaagttt 19860
ctattcccag ctttgtctgg tggccggcat ggtcccagcc tcctcgctgg cgccggctgg 19920
gcaacattcc gaggggaccg tcccctcggt aatggcgaat gggacgcggc cgatccggct 19980
gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca 20040
taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata 20100
tccggatgcg gccgcgggcc ctatggtacc cagcttttgt tccctttagt gagggttaat 20160
tccgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 20220
aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 20280
gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 20340
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 20400
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 20460
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 20520
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 20580
gtttttccat aggctcggcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 20640
gtggcgaaac ccgacaggac tataaagata ccaggcgttc ccccctggaa gctccctcgt 20700
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 20760
aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 20820
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 20880
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 20940
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 21000
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 21060
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 21120
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 21180
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 21240
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 21300
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 21360
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactgcccgt 21420
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 21480
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 21540
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 21600
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 21660
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 21720
atcaaggcga gttacatgat cccccatgtt gtgaaaaaaa gcggttagct ccttcggtcc 21780
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatgctta tggcagcact 21840
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 21900
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 21960
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 22020
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 22080
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 22140
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 22200
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 22260
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 22320
aaaagtgcca cctgaaattg taaacgttaa tattttgtta aaattcgcgt taaatttttg 22380
ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 22440
agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 22500
gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 22560
tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 22620
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 22680
ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 22740
gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt cccatt 22796
<210> 145
<211> 20780
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-S2-dER_SARS-CoV-2 (optimized sequence)
<400> 145
tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60
cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120
atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180
tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240
cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300
caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360
taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420
ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480
gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540
caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600
gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660
aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720
tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780
agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840
tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900
tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960
atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020
aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080
ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140
actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200
gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260
atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320
ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380
caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440
catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500
ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560
gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620
caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680
tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740
acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800
taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860
aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920
ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980
gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040
gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100
gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160
actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220
gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280
caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340
gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400
cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460
gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520
gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580
acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640
acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700
gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760
acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820
ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880
ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940
cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000
atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060
cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120
aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180
cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240
tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300
cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360
aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420
aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480
aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540
tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtagcaagt cagagtatca 3600
tagcctatac tatgagcctg ggggcagaaa attctgtcgc ttatagtaat aacagtattg 3660
caattcctac taacttcact attagcgtga ctacagaaat tctgccagtg agcatgacca 3720
agacctccgt cgactgtacc atgtatatct gcggagacag cacagaatgc agcaacctgc 3780
ttctgcagta cggtagcttt tgtacccagc tgaacagggc actgaccggc atcgctgtgg 3840
aacaggacaa aaatacgcag gaggtgttcg ctcaggtcaa gcagatttat aagacacccc 3900
caataaaaga cttcggcggc tttaacttct cccagatcct gcccgatccg tcaaaacctt 3960
ccaagagaag ttttatcgag gatctgctgt ttaacaaagt aacattggct gatgctggct 4020
ttattaaaca gtacggcgat tgtctgggag atatcgccgc tagagatctg atctgcgctc 4080
aaaaatttaa tggcctcact gtattgcccc ccctgctgac ggatgaaatg attgcccaat 4140
acacatcagc cctgctggct gggacaatca cttccggctg gacgttcggt gctggagctg 4200
ctcttcaaat tccatttgcc atgcaaatgg cttatagatt caacggaatt ggcgtgaccc 4260
aaaacgtgct gtacgaaaat caaaagctga ttgctaatca gtttaactcc gctatcggta 4320
agatacagga cagcctgtct agtactgcca gcgccctcgg aaagctccag gatgtggtga 4380
accagaatgc gcaggcgctg aacacactcg tcaaacagct tagcagcaat ttcggcgcaa 4440
ttagcagtgt actgaacgac atcttgtctc ggctcgacaa ggtcgaggcc gaagtgcaga 4500
ttgatcgcct gatcactggc cggctccagt ctctgcagac ctacgtaacc cagcaactca 4560
tacgcgctgc cgaaattcgg gcttcagcta acctggccgc aacaaagatg tctgaatgtg 4620
ttcttgggca gtccaagagg gtggacttct gcgggaaagg atatcacctg atgtccttcc 4680
ctcagagcgc ccctcatgga gtggtgtttc ttcatgttac ctatgttccg gcccaggaaa 4740
agaattttac cactgcccca gccatttgcc atgatggtaa agcacacttc ccaagagagg 4800
gcgtgtttgt tagtaacggc acccactggt tcgttaccca gcgcaatttt tacgaacctc 4860
aaatcattac cactgacaat acatttgtat caggcaattg cgacgtggtg atcggaatcg 4920
taaataatac agtctacgat cccctgcagc cagagcttga cagctttaaa gaggaactgg 4980
acaaatactt caaaaatcat acaagccccg acgtcgacct gggagatatt tctggcatca 5040
atgcctccgt cgtgaatatc caaaaagaga tcgaccgcct taatgaggtt gccaaaaacc 5100
tcaacgagtc cctgattgat ctgcaggagc tggggaagta cgagcagtat atcaaatggc 5160
cctggtacat ctggctgggc ttcattgccg ggctcatagc catcgtgatg gtgacgatca 5220
tgctgtgttg catgacctct tgctgttctt gtctgaaggg gtgctgctct tgtgggagtt 5280
gttgtaaatt cgatgaggat gattccgaat aagcgcgcag cgcttagacg tctcgcgatc 5340
gatactagta caacctaaat ccattataaa aaacttagga gcaaagtgat tgcctcccaa 5400
ggtccacaat gacagagacc tacgacttcg acaagtcggc atgggacatc aaagggtcga 5460
tcgctccgat acaacccacc acctacagtg atggcaggct ggtgccccag gtcagagtca 5520
tagatcctgg tctaggcgac aggaaggatg aatgctttat gtacatgttt ctgctggggg 5580
ttgttgagga cagcgattcc ctagggcctc caatcgggcg agcatttggg ttcctgccct 5640
taggtgttgg cagatccaca gcaaagcccg aaaaactcct caaagaggcc actgagcttg 5700
acatagttgt tagacgtaca gcagggctca atgaaaaact ggtgttctac aacaacaccc 5760
cactaactct cctcacacct tggagaaagg tcctaacaac agggagtgtc ttcaacgcaa 5820
accaagtgtg caatgcggtt aatctgatac cgctcgatac cccgcagagg ttccgtgttg 5880
tttatatgag catcacccgt ctttcggata acgggtatta caccgttcct agaagaatgc 5940
tggaattcag atcggtcaat gcagtggcct tcaacctgct ggtgaccctt aggattgaca 6000
aggcgatagg ccctgggaag atcatcgaca atacagagca acttcctgag gcaacattta 6060
tggtccacat cgggaacttc aggagaaaga agagtgaagt ctactctgcc gattattgca 6120
aaatgaaaat cgaaaagatg ggcctggttt ttgcacttgg tgggataggg ggcaccagtc 6180
ttcacattag aagcacaggc aaaatgagca agactctcca tgcacaactc gggttcaaga 6240
agaccttatg ttacccgctg atggatatca atgaagacct taatcgatta ctctggagga 6300
gcagatgcaa gatagtaaga atccaggcag ttttgcagcc atcagttcct caagaattcc 6360
gcatttacga cgacgtgatc ataaatgatg accaaggact attcaaagtt ctgtagaccg 6420
tagtgcccag caatgcccga aaacgacccc cctcacaatg acagccagaa ggcccggaca 6480
aaaaagcccc ctccgaaaga ctccacggac caagcgagag gccagccagc agccgacggc 6540
aagcgcgaac accaggcggc cccagcacag aacagccctg acacaaggcc accaccagcc 6600
accccaatct gcatcctcct cgtgggaccc ccgaggacca acccccaagg ctgcccccga 6660
tccaaaccac caaccgcatc cccaccaccc ccgggaaaga aacccccagc aattggaagg 6720
cccctccccc tcttcctcaa cacaagaact ccacaaccga accgcacaag cgaccgaggt 6780
gacccaaccg caggcatccg actccctaga cagatcctct ctccccggca aactaaacaa 6840
aacttagggc caaggaacat acacacccaa cagaacccag accccggccc acggcgccgc 6900
gcccccaacc cccgacaacc agagggagcc cccaaccaat cccgccggct cccccggtgc 6960
ccacaggcag ggacaccaac ccccgaacag acccagcacc caaccatcga caatccaaga 7020
cgggggggcc cccccaaaaa aaggccccca ggggccgaca gccagcaccg cgaggaagcc 7080
cacccacccc acacacgacc acggcaacca aaccagaacc cagaccaccc tgggccacca 7140
gctcccagac tcggccatca ccccgcagaa aggaaaggcc acaacccgcg caccccagcc 7200
ccgatccggc ggggagccac ccaacccgaa ccagcaccca agagcgatcc ccgaaggacc 7260
cccgaaccgc aaaggacatc agtatcccac agcctctcca agtcccccgg tctcctcctc 7320
ttctcgaagg gaccaaaaga tcaatccacc acacccgacg acactcaact ccccacccct 7380
aaaggagaca ccgggaatcc cagaatcaag actcatccaa tgtccatcat gggtctcaag 7440
gtgaacgtct ctgccatatt catggcagta ctgttaactc tccaaacacc caccggtcaa 7500
atccattggg gcaatctctc taagataggg gtggtaggaa taggaagtgc aagctacaaa 7560
gttatgactc gttccagcca tcaatcatta gtcataaaat taatgcccaa tataactctc 7620
ctcaataact gcacgagggt agagattgca gaatacagga gactactgag aacagttttg 7680
gaaccaatta gagatgcact taatgcaatg acccagaata taagaccggt tcagagtgta 7740
gcttcaagta ggagacacaa gagatttgcg ggagtagtcc tggcaggtgc ggccctaggc 7800
gttgccacag ctgctcagat aacagccggc attgcacttc accagtccat gctgaactct 7860
caagccatcg acaatctgag agcgagcctg gaaactacta atcaggcaat tgagacaatc 7920
agacaagcag ggcaggagat gatattggct gttcagggtg tccaagacta catcaataat 7980
gagctgatac cgtctatgaa ccaactatct tgtgatttaa tcggccagaa gctcgggctc 8040
aaattgctca gatactatac agaaatcctg tcattatttg gccccagttt acgggacccc 8100
atatctgcgg agatatctat ccaggctttg agctatgcgc ttggaggaga catcaataag 8160
gtgttagaaa agctcggata cagtggaggt gatttactgg gcatcttaga gagcggagga 8220
ataaaggccc ggataactca cgtcgacaca gagtcctact tcattgtcct cagtatagcc 8280
tatccgacgc tgtccgagat taagggggtg attgtccacc ggctagaggg ggtctcgtac 8340
aacataggct ctcaagagtg gtataccact gtgcccaagt atgttgcaac ccaagggtac 8400
cttatctcga attttgatga gtcatcgtgt actttcatgc cagaggggac tgtgtgcagc 8460
caaaatgcct tgtacccgat gagtcctctg ctccaagaat gcctccgggg gtacaccaag 8520
tcctgtgctc gtacactcgt atccgggtct tttgggaacc ggttcatttt atcacaaggg 8580
aacctaatag ccaattgtgc atcaatcctt tgcaagtgtt acacaacagg aacgatcatt 8640
aatcaagacc ctgacaagat cctaacatac attgctgccg atcactgccc ggtagtcgag 8700
gtgaacggcg tgaccatcca agtcgggagc aggaggtatc cagacgctgt gtacttgcac 8760
agaattgacc tcggtcctcc catatcattg gagaggttgg acgtagggac aaatctgggg 8820
aatgcaattg ctaagttgga ggatgccaag gaattgttgg agtcatcgga ccagatattg 8880
aggagtatga aaggtttatc gagcactagc atagtctaca tcctgattgc agtgtgtctt 8940
ggagggttga tagggatccc cgctttaata tgttgctgca gggggcgttg taacaaaaag 9000
ggagaacaag ttggtatgtc aagaccaggc ctaaagcctg atcttacggg aacatcaaaa 9060
tcctatgtaa ggtcgctctg atcctctaca actcttgaaa cacaaatgtc ccacaagtct 9120
cctcttcgtc atcaagcaac caccgcaccc agcatcaagc ccacctgaaa ttatctccgg 9180
cttccctctg gccgaacaat atcggtagtt aatcaaaact tagggtgcaa gatcatccac 9240
aatgtcacca caacgagacc ggataaatgc cttctacaaa gataaccccc atcccaaggg 9300
aagtaggata gtcattaaca gagaacatct tatgattgat agaccttatg ttttgctggc 9360
tgttctgttt gtcatgtttc tgagcttgat cgggttgcta gccattgcag gcattagact 9420
tcatcgggca gccatctaca ccgcagagat ccataaaagc ctcagcacca atctagatgt 9480
aactaactca atcgagcatc aggtcaagga cgtgctgaca ccactcttca aaatcatcgg 9540
tgatgaagtg ggcctgagga cacctcagag attcactgac ctagtgaaat taatctctga 9600
caagattaaa ttccttaatc cggataggga gtacgacttc agagatctca cttggtgtat 9660
caacccgcca gagagaatca aattggatta tgatcaatac tgtgcagatg tggctgctga 9720
agagctcatg aatgcattgg tgaactcaac tctactggag accagaacaa ccaatcagtt 9780
cctagctgtc tcaaagggaa actgctcagg gcccactaca atcagaggtc aattctcaaa 9840
catgtcgctg tccctgttag acttgtattt aggtcgaggt tacaatgtgt catctatagt 9900
cactatgaca tcccagggaa tgtatggggg aacttaccta gtggaaaagc ctaatctgag 9960
cagcaaaagg tcagagttgt cacaactgag catgtaccga gtgtttgaag taggtgttat 10020
cagaaatccg ggtttggggg ctccggtgtt ccatatgaca aactatcttg agcaaccagt 10080
cagtaatgat ctcagcaact gtatggtggc tttgggggag ctcaaactcg cagccctttg 10140
tcacggggaa gattctatca caattcccta tcagggatca gggaaaggtg tcagcttcca 10200
gctcgtcaag ctaggtgtct ggaaatcccc aaccgacatg caatcctggg tccccttatc 10260
aacggatgat ccagtgatag acaggcttta cctctcatct cacagaggtg ttatcgctga 10320
caatcaagca aaatgggctg tcccgacaac acgaacagat gacaagttgc gaatggagac 10380
atgcttccaa caggcgtgta agggtaaaat ccaagcactc tgcgagaatc ccgagtgggc 10440
accattgaag gataacagga ttccttcata cggggtcttg tctgttgatc tgagtctgac 10500
agttgagctt aaaatcaaaa ttgcttcggg attcgggcca ttgatcacac acggttcagg 10560
gatggaccta tacaaatcca accacaacaa tgtgtattgg ctgactatcc cgccaatgaa 10620
gaacctagcc ttaggtgtaa tcaacacatt ggagtggata ccgagattca aggttagtcc 10680
ctacctcttc actgtcccaa ttaaggaagc aggcgaagac tgccatgccc caacatacct 10740
acctgcggag gtggatggtg atgtcaaact cagttccaat ctggtgattc tacctggtca 10800
agatctccaa tatgttttgg caacctacga tacttccagg gttgaacatg ctgtggttta 10860
ttacgtttac agcccaagcc gctcattttc ttacttttat ccttttaggt tgcctataaa 10920
gggggtcccc atcgaattac aagtggaatg cttcacatgg gaccaaaaac tctggtgccg 10980
tcacttctgt gtgcttgcgg actcagaatc tggtggacat atcactcact ctgggatggt 11040
gggcatggga gtcagctgca cagtcacccg ggaagatgga accaatcgca gatagggctg 11100
ctagtgaacc aatcacatga tgtcacccag acatcaggca tacccactag tgtgaaatag 11160
acatcagaat taagaaaaac gtagggtcca agtggttccc cgttatggac tcgctatctg 11220
tcaaccagat cttataccct gaagttcacc tagatagccc gatagttacc aataagatag 11280
tagccatcct ggagtatgct cgagtccctc acgcttacag cctggaggac cctacactgt 11340
gtcagaacat caagcaccgc ctaaaaaacg gattttccaa ccaaatgatt ataaacaatg 11400
tggaagttgg gaatgtcatc aagtccaagc ttaggagtta tccggcccac tctcatattc 11460
catatccaaa ttgtaatcag gatttattta acatagaaga caaagagtca acgaggaaga 11520
tccgtgaact cctcaaaaag gggaattcgc tgtactccaa agtcagtgat aaggttttcc 11580
aatgcttaag ggacactaac tcacggcttg gcctaggctc cgaattgagg gaggacatca 11640
aggagaaagt tattaacttg ggagtttaca tgcacagctc ccagtggttt gagccctttc 11700
tgttttggtt tacagtcaag actgagatga ggtcagtgat taaatcacaa acccatactt 11760
gccataggag gagacacaca cctgtattct tcactggtag ttcagttgag ttgctaatct 11820
ctcgtgacct tgttgctata atcagtaaag agtctcaaca tgtatattac ctgacatttg 11880
aactggtttt gatgtattgt gatgtcatag aggggaggtt aatgacagag accgctatga 11940
ctattgatgc taggtataca gagcttctag gaagagtcag atacatgtgg aaactgatag 12000
atggtttctt ccctgcactc gggaatccaa cttatcaaat tgtagccatg ctggagcctc 12060
tttcacttgc ttacctgcag ctgagggata taacagtaga actcagaggt gctttcctta 12120
accactgctt tactgaaata catgatgttc ttgaccaaaa cgggttttct gatgaaggta 12180
cttatcatga gttaactgaa gctctagatt acattttcat aactgatgac atacatctga 12240
caggggagat tttctcattt ttcagaagtt tcggccaccc cagacttgaa gcagtaacgg 12300
ctgctgaaaa tgttaggaaa tacatgaatc agcctaaagt cattgtgtat gagactctga 12360
tgaaaggtca tgccatattt tgtggaatca taatcaacgg ctatcgtgac aggcacggag 12420
gcagttggcc accgctgacc ctccccctgc atgctgcaga cacaatccgg aatgctcaag 12480
cttcaggtga agggttaaca catgagcagt gcgttgataa ctggaaatct tttgctggag 12540
tgaaatttgg ctgctttatg cctcttagcc tggatagtga tctgacaatg tacctaaagg 12600
acaaggcact tgctgctctc caaagggaat gggattcagt ttacccgaaa gagttcctgc 12660
gttacgaccc tcccaaggga accgggtcac ggaggcttgt agatgttttc cttaatgatt 12720
cgagctttga cccatatgat gtgataatgt atgttgtaag tggagcttac ctccatgacc 12780
ctgagttcaa cctgtcttac agcctgaaag aaaaggagat caaggaaaca ggtagacttt 12840
ttgctaaaat gacttacaaa atgagggcat gccaagtgat tgctgaaaat ctaatctcaa 12900
acgggattgg caaatatttt aaggacaatg ggatggccaa ggatgagcac gatttgacta 12960
aggcactcca cactctagct gtctcaggag tccccaaaga tctcaaagaa agtcacaggg 13020
gggggccagt cttaaaaacc tactcccgaa gcccagtcca cacaagtacc aggaacgtga 13080
gagcagcaaa agggtttata gggttccctc aagtaattcg gcaggaccaa gacactgatc 13140
atccggagaa tatggaagct tacgagacag tcagtgcatt tatcacgact gatctcaaga 13200
agtactgcct taattggaga tatgagacca tcagcttgtt tgcacagagg ctaaatgaga 13260
tttacggatt gccctcattt ttccagtggc tgcataagag gcttgagacc tctgtcctgt 13320
atgtaagtga ccctcattgc ccccccgacc ttgacgccca tatcccgtta tataaagtcc 13380
ccaatgatca aatcttcatt aagtacccta tgggaggtat agaagggtat tgtcagaagc 13440
tgtggaccat cagcaccatt ccctatctat acctggctgc ttatgagagc ggagtaagga 13500
ttgcttcgtt agtgcaaggg gacaatcaga ccatagccgt aacaaaaagg gtacccagca 13560
catggcccta caaccttaag aaacgggaag ctgctagagt aactagagat tactttgtaa 13620
ttcttaggca aaggctacat gatattggcc atcacctcaa ggcaaatgag acaattgttt 13680
catcacattt ttttgtctat tcaaaaggaa tatattatga tgggctactt gtgtcccaat 13740
cactcaagag catcgcaaga tgtgtattct ggtcagagac tatagttgat gaaacaaggg 13800
cagcatgcag taatattgct acaacaatgg ctaaaagcat cgagagaggt tatgaccgtt 13860
accttgcata ttccctgaac gtcctaaaag tgatacagca aattctgatc tctcttggct 13920
tcacaatcaa ttcaaccatg acccgggatg tagtcatacc cctcctcaca aacaacgacc 13980
tcttaataag gatggcactg ttgcccgctc ctattggggg gatgaattat ctgaatatga 14040
gcaggctgtt tgtcagaaac atcggtgatc cagtaacatc atcaattgct gatctcaaga 14100
gaatgattct cgcctcacta atgcctgaag agaccctcca tcaagtaatg acacaacaac 14160
cgggggactc ttcattccta gactgggcta gcgaccctta ctcagcaaat cttgtatgtg 14220
tccagagcat cactagactc ctcaagaaca taactgcaag gtttgtcctg atccatagtc 14280
caaacccaat gttaaaagga ttattccatg atgacagtaa agaagaggac gagggactgg 14340
cggcattcct catggacagg catattatag tacctagggc agctcatgaa atcctggatc 14400
atagtgtcac aggggcaaga gagtctattg caggcatgct ggataccaca aaaggcttga 14460
ttcgagccag catgaggaag ggggggttaa cctctcgagt gataaccaga ttgtccaatt 14520
atgactatga acaattcaga gcagggatgg tgctattgac aggaagaaag agaaatgtcc 14580
tcattgacaa agagtcatgt tcagtgcagc tggcgagagc tctaagaagc catatgtggg 14640
cgaggctagc tcgaggacgg cctatttacg gccttgaggt ccctgatgta ctagaatcta 14700
tgcgaggcca ccttattcgg cgtcatgaga catgtgtcat ctgcgagtgt ggatcagtca 14760
actacggatg gttttttgtc ccctcgggtt gccaactgga tgatattgac aaggaaacat 14820
catccttgag agtcccatat attggttcta ccactgatga gagaacagac atgaagcttg 14880
ccttcgtaag agccccaagt cgatccttgc gatctgctgt tagaatagca acagtgtact 14940
catgggctta cggtgatgat gatagctctt ggaacgaagc ctggttgttg gctaggcaaa 15000
gggccaatgt gagcctggag gagctaaggg tgatcactcc catctcaact tcgactaatt 15060
tagcgcatag gttgagggat cgtagcactc aagtgaaata ctcaggtaca tcccttgtcc 15120
gagtggcgag gtataccaca atctccaacg acaatctctc atttgtcata tcagataaga 15180
aggttgatac taactttata taccaacaag gaatgcttct agggttgggt gttttagaaa 15240
cattgtttcg actcgagaaa gataccggat catctaacac ggtattacat cttcacgtcg 15300
aaacagattg ttgcgtgatc ccgatgatag atcatcccag gatacccagc tcccgcaagc 15360
tagagctgag ggcagagcta tgtaccaacc cattgatata tgataatgca cctttaattg 15420
acagagatgc aacaaggcta tacacccaga gccataggag gcaccttgtg gaatttgtta 15480
catggtccac accccaacta tatcacattt tagctaagtc cacagcacta tctatgattg 15540
acctggtaac aaaatttgag aaggaccata tgaatgaaat ttcagctctc ataggggatg 15600
acgatatcaa tagtttcata actgagtttc tgctcataga gccaagatta ttcactatct 15660
acttgggcca gtgtgcggcc atcaattggg catttgatgt acattatcat agaccatcag 15720
ggaaatatca gatgggtgag ctgttgtcat cgttcctttc tagaatgagc aaaggagtgt 15780
ttaaggtgct tgtcaatgct ctaagccacc caaagatcta caagaaattc tggcattgtg 15840
gtattataga gcctatccat ggtccttcac ttgatgctca aaacttgcac acaactgtgt 15900
gcaacatggt ttacacatgc tatatgacct acctcgacct gttgttgaat gaagagttag 15960
aagagttcac atttctcttg tgtgaaagcg acgaggatgt agtaccggac agattcgaca 16020
acatccaggc aaaacactta tgtgttctgg cagatttgta ctgtcaacca gggacctgcc 16080
caccaattcg aggtctaaga ccggtagaga aatgtgcagt tctaaccgac catatcaagg 16140
cagaggctat gttatctcca gcaggatctt cgtggaacat aaatccaatt attgtagacc 16200
attactcatg ctctctgact tatctccggc gaggatcgat caaacagata agattgagag 16260
ttgatccagg attcattttc gacgccctcg ctgaggtaaa tgtcagtcag ccaaagatcg 16320
gcagcaacaa catctcaaat atgagcatca aggctttcag acccccacac gatgatgttg 16380
caaaattgct caaagatatc aacacaagca agcacaatct tcccatttca gggggcaatc 16440
tcgccaatta tgaaatccat gctttccgca gaatcgggtt gaactcatct gcttgctaca 16500
aagctgttga gatatcaaca ttaattagga gatgccttga gccaggggag gacggcttgt 16560
tcttgggtga gggatcgggt tctatgttga tcacttataa agagatactt aaactaaaca 16620
agtgcttcta taatagtggg gtttccgcca attctagatc tggtcaaagg gaattagcac 16680
cctatccctc cgaagttggc cttgtcgaac acagaatggg agtaggtaat attgtcaaag 16740
tgctctttaa cgggaggccc gaagtcacgt gggtaggcag tgtagattgc ttcaatttca 16800
tagttagtaa tatccctacc tctagtgtgg ggtttatcca ttcagatata gagaccttgc 16860
ctgacaaaga tactatagag aagctagagg aattggcagc catcttatcg atggctctgc 16920
tcctgggcaa aataggatca atactggtga ttaagcttat gcctttcagc ggggattttg 16980
ttcagggatt tataagttat gtagggtctc attatagaga agtgaacctt gtatacccta 17040
gatacagcaa cttcatctct actgaatctt atttggttat gacagatctc aaggctaacc 17100
ggctaatgaa tcctgaaaag attaagcagc agataattga atcatctgtg aggacttcac 17160
ctggacttat aggtcacatc ctatccatta agcaactaag ctgcatacaa gcaattgtgg 17220
gagacgcagt tagtagaggt gatatcaatc ctactctgaa aaaacttaca cctatagagc 17280
aggtgctgat caattgcggg ttggcaatta acggacctaa gctgtgcaaa gaattgatcc 17340
accatgatgt tgcctcaggg caagatggat tgcttaattc tatactcatc ctctacaggg 17400
agttggcaag attcaaagac aaccaaagaa gtcaacaagg gatgttccac gcttaccccg 17460
tattggtaag tagcaggcaa cgagaactta tatctaggat cacccgcaaa ttctgggggc 17520
acattcttct ttactccggg aacaaaaagt tgataaataa gtttatccag aatctcaagt 17580
ccggctatct gatactagac ttacaccaga atatcttcgt taagaatcta tccaagtcag 17640
agaaacagat tattatgacg gggggtttga aacgtgagtg ggtttttaag gtaacagtca 17700
aggagaccaa agaatggtat aagttagtcg gatacagtgc cctgattaag gactaattgg 17760
ttgaactccg gaaccctaat cctgccctag gtggttaggc attatttgca atatattaaa 17820
gaaaactttg aaaatacgaa gtttctattc ccagctttgt ctggtggccg gcatggtccc 17880
agcctcctcg ctggcgccgg ctgggcaaca ttccgagggg accgtcccct cggtaatggc 17940
gaatgggacg cggccgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 18000
gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 18060
tttttgctga aaggaggaac tatatccgga tgcggccgcg ggccctatgg tacccagctt 18120
ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 18180
tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 18240
taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 18300
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 18360
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 18420
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 18480
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 18540
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc ggcccccctg acgagcatca 18600
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 18660
gttcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 18720
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 18780
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 18840
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 18900
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 18960
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 19020
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 19080
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 19140
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 19200
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 19260
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 19320
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 19380
atccatagtt gcctgactgc ccgtcgtgta gataactacg atacgggagg gcttaccatc 19440
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 19500
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 19560
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 19620
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 19680
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgaaa 19740
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 19800
atcactcatg cttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 19860
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 19920
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 19980
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 20040
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 20100
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 20160
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 20220
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 20280
aggggttccg cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt 20340
gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 20400
cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 20460
ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 20520
ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 20580
gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 20640
aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 20700
gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 20760
gctacagggc gcgtcccatt 20780
<210> 146
<211> 22796
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-SF-2P-dER_SARS-CoV-2 (optimized sequence)
<400> 146
tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60
cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120
atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180
tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240
cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300
caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360
taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420
ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480
gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540
caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600
gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660
aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720
tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780
agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840
tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900
tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960
atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020
aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080
ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140
actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200
gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260
atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320
ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380
caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440
catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500
ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560
gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620
caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680
tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740
acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800
taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860
aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920
ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980
gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040
gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100
gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160
actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220
gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280
caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340
gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400
cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460
gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520
gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580
acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640
acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700
gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760
acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820
ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880
ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940
cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000
atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060
cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120
aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180
cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240
tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300
cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360
aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420
aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480
aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540
tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600
cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660
tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720
taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780
cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840
gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900
atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960
gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020
gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080
agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140
aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200
cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260
tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320
ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380
acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440
ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500
ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560
ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620
tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680
tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740
tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800
attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860
attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920
agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980
gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040
gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100
ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160
acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220
ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280
ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340
cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400
tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460
tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520
gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580
ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640
aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700
tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760
tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820
agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880
tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940
tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000
tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060
gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120
cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180
tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240
tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300
tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360
ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420
tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480
ctcggctcga cccaccagag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540
agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600
ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660
tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720
ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780
gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840
ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900
tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960
agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020
ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080
agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140
agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200
ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260
cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320
aataataggc gcgcagcgct tagacgtctc gcgatcgata ctagtacaac ctaaatccat 7380
tataaaaaac ttaggagcaa agtgattgcc tcccaaggtc cacaatgaca gagacctacg 7440
acttcgacaa gtcggcatgg gacatcaaag ggtcgatcgc tccgatacaa cccaccacct 7500
acagtgatgg caggctggtg ccccaggtca gagtcataga tcctggtcta ggcgacagga 7560
aggatgaatg ctttatgtac atgtttctgc tgggggttgt tgaggacagc gattccctag 7620
ggcctccaat cgggcgagca tttgggttcc tgcccttagg tgttggcaga tccacagcaa 7680
agcccgaaaa actcctcaaa gaggccactg agcttgacat agttgttaga cgtacagcag 7740
ggctcaatga aaaactggtg ttctacaaca acaccccact aactctcctc acaccttgga 7800
gaaaggtcct aacaacaggg agtgtcttca acgcaaacca agtgtgcaat gcggttaatc 7860
tgataccgct cgataccccg cagaggttcc gtgttgttta tatgagcatc acccgtcttt 7920
cggataacgg gtattacacc gttcctagaa gaatgctgga attcagatcg gtcaatgcag 7980
tggccttcaa cctgctggtg acccttagga ttgacaaggc gataggccct gggaagatca 8040
tcgacaatac agagcaactt cctgaggcaa catttatggt ccacatcggg aacttcagga 8100
gaaagaagag tgaagtctac tctgccgatt attgcaaaat gaaaatcgaa aagatgggcc 8160
tggtttttgc acttggtggg atagggggca ccagtcttca cattagaagc acaggcaaaa 8220
tgagcaagac tctccatgca caactcgggt tcaagaagac cttatgttac ccgctgatgg 8280
atatcaatga agaccttaat cgattactct ggaggagcag atgcaagata gtaagaatcc 8340
aggcagtttt gcagccatca gttcctcaag aattccgcat ttacgacgac gtgatcataa 8400
atgatgacca aggactattc aaagttctgt agaccgtagt gcccagcaat gcccgaaaac 8460
gacccccctc acaatgacag ccagaaggcc cggacaaaaa agccccctcc gaaagactcc 8520
acggaccaag cgagaggcca gccagcagcc gacggcaagc gcgaacacca ggcggcccca 8580
gcacagaaca gccctgacac aaggccacca ccagccaccc caatctgcat cctcctcgtg 8640
ggacccccga ggaccaaccc ccaaggctgc ccccgatcca aaccaccaac cgcatcccca 8700
ccacccccgg gaaagaaacc cccagcaatt ggaaggcccc tccccctctt cctcaacaca 8760
agaactccac aaccgaaccg cacaagcgac cgaggtgacc caaccgcagg catccgactc 8820
cctagacaga tcctctctcc ccggcaaact aaacaaaact tagggccaag gaacatacac 8880
acccaacaga acccagaccc cggcccacgg cgccgcgccc ccaacccccg acaaccagag 8940
ggagccccca accaatcccg ccggctcccc cggtgcccac aggcagggac accaaccccc 9000
gaacagaccc agcacccaac catcgacaat ccaagacggg ggggcccccc caaaaaaagg 9060
cccccagggg ccgacagcca gcaccgcgag gaagcccacc caccccacac acgaccacgg 9120
caaccaaacc agaacccaga ccaccctggg ccaccagctc ccagactcgg ccatcacccc 9180
gcagaaagga aaggccacaa cccgcgcacc ccagccccga tccggcgggg agccacccaa 9240
cccgaaccag cacccaagag cgatccccga aggacccccg aaccgcaaag gacatcagta 9300
tcccacagcc tctccaagtc ccccggtctc ctcctcttct cgaagggacc aaaagatcaa 9360
tccaccacac ccgacgacac tcaactcccc acccctaaag gagacaccgg gaatcccaga 9420
atcaagactc atccaatgtc catcatgggt ctcaaggtga acgtctctgc catattcatg 9480
gcagtactgt taactctcca aacacccacc ggtcaaatcc attggggcaa tctctctaag 9540
ataggggtgg taggaatagg aagtgcaagc tacaaagtta tgactcgttc cagccatcaa 9600
tcattagtca taaaattaat gcccaatata actctcctca ataactgcac gagggtagag 9660
attgcagaat acaggagact actgagaaca gttttggaac caattagaga tgcacttaat 9720
gcaatgaccc agaatataag accggttcag agtgtagctt caagtaggag acacaagaga 9780
tttgcgggag tagtcctggc aggtgcggcc ctaggcgttg ccacagctgc tcagataaca 9840
gccggcattg cacttcacca gtccatgctg aactctcaag ccatcgacaa tctgagagcg 9900
agcctggaaa ctactaatca ggcaattgag acaatcagac aagcagggca ggagatgata 9960
ttggctgttc agggtgtcca agactacatc aataatgagc tgataccgtc tatgaaccaa 10020
ctatcttgtg atttaatcgg ccagaagctc gggctcaaat tgctcagata ctatacagaa 10080
atcctgtcat tatttggccc cagtttacgg gaccccatat ctgcggagat atctatccag 10140
gctttgagct atgcgcttgg aggagacatc aataaggtgt tagaaaagct cggatacagt 10200
ggaggtgatt tactgggcat cttagagagc ggaggaataa aggcccggat aactcacgtc 10260
gacacagagt cctacttcat tgtcctcagt atagcctatc cgacgctgtc cgagattaag 10320
ggggtgattg tccaccggct agagggggtc tcgtacaaca taggctctca agagtggtat 10380
accactgtgc ccaagtatgt tgcaacccaa gggtacctta tctcgaattt tgatgagtca 10440
tcgtgtactt tcatgccaga ggggactgtg tgcagccaaa atgccttgta cccgatgagt 10500
cctctgctcc aagaatgcct ccgggggtac accaagtcct gtgctcgtac actcgtatcc 10560
gggtcttttg ggaaccggtt cattttatca caagggaacc taatagccaa ttgtgcatca 10620
atcctttgca agtgttacac aacaggaacg atcattaatc aagaccctga caagatccta 10680
acatacattg ctgccgatca ctgcccggta gtcgaggtga acggcgtgac catccaagtc 10740
gggagcagga ggtatccaga cgctgtgtac ttgcacagaa ttgacctcgg tcctcccata 10800
tcattggaga ggttggacgt agggacaaat ctggggaatg caattgctaa gttggaggat 10860
gccaaggaat tgttggagtc atcggaccag atattgagga gtatgaaagg tttatcgagc 10920
actagcatag tctacatcct gattgcagtg tgtcttggag ggttgatagg gatccccgct 10980
ttaatatgtt gctgcagggg gcgttgtaac aaaaagggag aacaagttgg tatgtcaaga 11040
ccaggcctaa agcctgatct tacgggaaca tcaaaatcct atgtaaggtc gctctgatcc 11100
tctacaactc ttgaaacaca aatgtcccac aagtctcctc ttcgtcatca agcaaccacc 11160
gcacccagca tcaagcccac ctgaaattat ctccggcttc cctctggccg aacaatatcg 11220
gtagttaatc aaaacttagg gtgcaagatc atccacaatg tcaccacaac gagaccggat 11280
aaatgccttc tacaaagata acccccatcc caagggaagt aggatagtca ttaacagaga 11340
acatcttatg attgatagac cttatgtttt gctggctgtt ctgtttgtca tgtttctgag 11400
cttgatcggg ttgctagcca ttgcaggcat tagacttcat cgggcagcca tctacaccgc 11460
agagatccat aaaagcctca gcaccaatct agatgtaact aactcaatcg agcatcaggt 11520
caaggacgtg ctgacaccac tcttcaaaat catcggtgat gaagtgggcc tgaggacacc 11580
tcagagattc actgacctag tgaaattaat ctctgacaag attaaattcc ttaatccgga 11640
tagggagtac gacttcagag atctcacttg gtgtatcaac ccgccagaga gaatcaaatt 11700
ggattatgat caatactgtg cagatgtggc tgctgaagag ctcatgaatg cattggtgaa 11760
ctcaactcta ctggagacca gaacaaccaa tcagttccta gctgtctcaa agggaaactg 11820
ctcagggccc actacaatca gaggtcaatt ctcaaacatg tcgctgtccc tgttagactt 11880
gtatttaggt cgaggttaca atgtgtcatc tatagtcact atgacatccc agggaatgta 11940
tgggggaact tacctagtgg aaaagcctaa tctgagcagc aaaaggtcag agttgtcaca 12000
actgagcatg taccgagtgt ttgaagtagg tgttatcaga aatccgggtt tgggggctcc 12060
ggtgttccat atgacaaact atcttgagca accagtcagt aatgatctca gcaactgtat 12120
ggtggctttg ggggagctca aactcgcagc cctttgtcac ggggaagatt ctatcacaat 12180
tccctatcag ggatcaggga aaggtgtcag cttccagctc gtcaagctag gtgtctggaa 12240
atccccaacc gacatgcaat cctgggtccc cttatcaacg gatgatccag tgatagacag 12300
gctttacctc tcatctcaca gaggtgttat cgctgacaat caagcaaaat gggctgtccc 12360
gacaacacga acagatgaca agttgcgaat ggagacatgc ttccaacagg cgtgtaaggg 12420
taaaatccaa gcactctgcg agaatcccga gtgggcacca ttgaaggata acaggattcc 12480
ttcatacggg gtcttgtctg ttgatctgag tctgacagtt gagcttaaaa tcaaaattgc 12540
ttcgggattc gggccattga tcacacacgg ttcagggatg gacctataca aatccaacca 12600
caacaatgtg tattggctga ctatcccgcc aatgaagaac ctagccttag gtgtaatcaa 12660
cacattggag tggataccga gattcaaggt tagtccctac ctcttcactg tcccaattaa 12720
ggaagcaggc gaagactgcc atgccccaac atacctacct gcggaggtgg atggtgatgt 12780
caaactcagt tccaatctgg tgattctacc tggtcaagat ctccaatatg ttttggcaac 12840
ctacgatact tccagggttg aacatgctgt ggtttattac gtttacagcc caagccgctc 12900
attttcttac ttttatcctt ttaggttgcc tataaagggg gtccccatcg aattacaagt 12960
ggaatgcttc acatgggacc aaaaactctg gtgccgtcac ttctgtgtgc ttgcggactc 13020
agaatctggt ggacatatca ctcactctgg gatggtgggc atgggagtca gctgcacagt 13080
cacccgggaa gatggaacca atcgcagata gggctgctag tgaaccaatc acatgatgtc 13140
acccagacat caggcatacc cactagtgtg aaatagacat cagaattaag aaaaacgtag 13200
ggtccaagtg gttccccgtt atggactcgc tatctgtcaa ccagatctta taccctgaag 13260
ttcacctaga tagcccgata gttaccaata agatagtagc catcctggag tatgctcgag 13320
tccctcacgc ttacagcctg gaggacccta cactgtgtca gaacatcaag caccgcctaa 13380
aaaacggatt ttccaaccaa atgattataa acaatgtgga agttgggaat gtcatcaagt 13440
ccaagcttag gagttatccg gcccactctc atattccata tccaaattgt aatcaggatt 13500
tatttaacat agaagacaaa gagtcaacga ggaagatccg tgaactcctc aaaaagggga 13560
attcgctgta ctccaaagtc agtgataagg ttttccaatg cttaagggac actaactcac 13620
ggcttggcct aggctccgaa ttgagggagg acatcaagga gaaagttatt aacttgggag 13680
tttacatgca cagctcccag tggtttgagc cctttctgtt ttggtttaca gtcaagactg 13740
agatgaggtc agtgattaaa tcacaaaccc atacttgcca taggaggaga cacacacctg 13800
tattcttcac tggtagttca gttgagttgc taatctctcg tgaccttgtt gctataatca 13860
gtaaagagtc tcaacatgta tattacctga catttgaact ggttttgatg tattgtgatg 13920
tcatagaggg gaggttaatg acagagaccg ctatgactat tgatgctagg tatacagagc 13980
ttctaggaag agtcagatac atgtggaaac tgatagatgg tttcttccct gcactcggga 14040
atccaactta tcaaattgta gccatgctgg agcctctttc acttgcttac ctgcagctga 14100
gggatataac agtagaactc agaggtgctt tccttaacca ctgctttact gaaatacatg 14160
atgttcttga ccaaaacggg ttttctgatg aaggtactta tcatgagtta actgaagctc 14220
tagattacat tttcataact gatgacatac atctgacagg ggagattttc tcatttttca 14280
gaagtttcgg ccaccccaga cttgaagcag taacggctgc tgaaaatgtt aggaaataca 14340
tgaatcagcc taaagtcatt gtgtatgaga ctctgatgaa aggtcatgcc atattttgtg 14400
gaatcataat caacggctat cgtgacaggc acggaggcag ttggccaccg ctgaccctcc 14460
ccctgcatgc tgcagacaca atccggaatg ctcaagcttc aggtgaaggg ttaacacatg 14520
agcagtgcgt tgataactgg aaatcttttg ctggagtgaa atttggctgc tttatgcctc 14580
ttagcctgga tagtgatctg acaatgtacc taaaggacaa ggcacttgct gctctccaaa 14640
gggaatggga ttcagtttac ccgaaagagt tcctgcgtta cgaccctccc aagggaaccg 14700
ggtcacggag gcttgtagat gttttcctta atgattcgag ctttgaccca tatgatgtga 14760
taatgtatgt tgtaagtgga gcttacctcc atgaccctga gttcaacctg tcttacagcc 14820
tgaaagaaaa ggagatcaag gaaacaggta gactttttgc taaaatgact tacaaaatga 14880
gggcatgcca agtgattgct gaaaatctaa tctcaaacgg gattggcaaa tattttaagg 14940
acaatgggat ggccaaggat gagcacgatt tgactaaggc actccacact ctagctgtct 15000
caggagtccc caaagatctc aaagaaagtc acaggggggg gccagtctta aaaacctact 15060
cccgaagccc agtccacaca agtaccagga acgtgagagc agcaaaaggg tttatagggt 15120
tccctcaagt aattcggcag gaccaagaca ctgatcatcc ggagaatatg gaagcttacg 15180
agacagtcag tgcatttatc acgactgatc tcaagaagta ctgccttaat tggagatatg 15240
agaccatcag cttgtttgca cagaggctaa atgagattta cggattgccc tcatttttcc 15300
agtggctgca taagaggctt gagacctctg tcctgtatgt aagtgaccct cattgccccc 15360
ccgaccttga cgcccatatc ccgttatata aagtccccaa tgatcaaatc ttcattaagt 15420
accctatggg aggtatagaa gggtattgtc agaagctgtg gaccatcagc accattccct 15480
atctatacct ggctgcttat gagagcggag taaggattgc ttcgttagtg caaggggaca 15540
atcagaccat agccgtaaca aaaagggtac ccagcacatg gccctacaac cttaagaaac 15600
gggaagctgc tagagtaact agagattact ttgtaattct taggcaaagg ctacatgata 15660
ttggccatca cctcaaggca aatgagacaa ttgtttcatc acattttttt gtctattcaa 15720
aaggaatata ttatgatggg ctacttgtgt cccaatcact caagagcatc gcaagatgtg 15780
tattctggtc agagactata gttgatgaaa caagggcagc atgcagtaat attgctacaa 15840
caatggctaa aagcatcgag agaggttatg accgttacct tgcatattcc ctgaacgtcc 15900
taaaagtgat acagcaaatt ctgatctctc ttggcttcac aatcaattca accatgaccc 15960
gggatgtagt catacccctc ctcacaaaca acgacctctt aataaggatg gcactgttgc 16020
ccgctcctat tggggggatg aattatctga atatgagcag gctgtttgtc agaaacatcg 16080
gtgatccagt aacatcatca attgctgatc tcaagagaat gattctcgcc tcactaatgc 16140
ctgaagagac cctccatcaa gtaatgacac aacaaccggg ggactcttca ttcctagact 16200
gggctagcga cccttactca gcaaatcttg tatgtgtcca gagcatcact agactcctca 16260
agaacataac tgcaaggttt gtcctgatcc atagtccaaa cccaatgtta aaaggattat 16320
tccatgatga cagtaaagaa gaggacgagg gactggcggc attcctcatg gacaggcata 16380
ttatagtacc tagggcagct catgaaatcc tggatcatag tgtcacaggg gcaagagagt 16440
ctattgcagg catgctggat accacaaaag gcttgattcg agccagcatg aggaaggggg 16500
ggttaacctc tcgagtgata accagattgt ccaattatga ctatgaacaa ttcagagcag 16560
ggatggtgct attgacagga agaaagagaa atgtcctcat tgacaaagag tcatgttcag 16620
tgcagctggc gagagctcta agaagccata tgtgggcgag gctagctcga ggacggccta 16680
tttacggcct tgaggtccct gatgtactag aatctatgcg aggccacctt attcggcgtc 16740
atgagacatg tgtcatctgc gagtgtggat cagtcaacta cggatggttt tttgtcccct 16800
cgggttgcca actggatgat attgacaagg aaacatcatc cttgagagtc ccatatattg 16860
gttctaccac tgatgagaga acagacatga agcttgcctt cgtaagagcc ccaagtcgat 16920
ccttgcgatc tgctgttaga atagcaacag tgtactcatg ggcttacggt gatgatgata 16980
gctcttggaa cgaagcctgg ttgttggcta ggcaaagggc caatgtgagc ctggaggagc 17040
taagggtgat cactcccatc tcaacttcga ctaatttagc gcataggttg agggatcgta 17100
gcactcaagt gaaatactca ggtacatccc ttgtccgagt ggcgaggtat accacaatct 17160
ccaacgacaa tctctcattt gtcatatcag ataagaaggt tgatactaac tttatatacc 17220
aacaaggaat gcttctaggg ttgggtgttt tagaaacatt gtttcgactc gagaaagata 17280
ccggatcatc taacacggta ttacatcttc acgtcgaaac agattgttgc gtgatcccga 17340
tgatagatca tcccaggata cccagctccc gcaagctaga gctgagggca gagctatgta 17400
ccaacccatt gatatatgat aatgcacctt taattgacag agatgcaaca aggctataca 17460
cccagagcca taggaggcac cttgtggaat ttgttacatg gtccacaccc caactatatc 17520
acattttagc taagtccaca gcactatcta tgattgacct ggtaacaaaa tttgagaagg 17580
accatatgaa tgaaatttca gctctcatag gggatgacga tatcaatagt ttcataactg 17640
agtttctgct catagagcca agattattca ctatctactt gggccagtgt gcggccatca 17700
attgggcatt tgatgtacat tatcatagac catcagggaa atatcagatg ggtgagctgt 17760
tgtcatcgtt cctttctaga atgagcaaag gagtgtttaa ggtgcttgtc aatgctctaa 17820
gccacccaaa gatctacaag aaattctggc attgtggtat tatagagcct atccatggtc 17880
cttcacttga tgctcaaaac ttgcacacaa ctgtgtgcaa catggtttac acatgctata 17940
tgacctacct cgacctgttg ttgaatgaag agttagaaga gttcacattt ctcttgtgtg 18000
aaagcgacga ggatgtagta ccggacagat tcgacaacat ccaggcaaaa cacttatgtg 18060
ttctggcaga tttgtactgt caaccaggga cctgcccacc aattcgaggt ctaagaccgg 18120
tagagaaatg tgcagttcta accgaccata tcaaggcaga ggctatgtta tctccagcag 18180
gatcttcgtg gaacataaat ccaattattg tagaccatta ctcatgctct ctgacttatc 18240
tccggcgagg atcgatcaaa cagataagat tgagagttga tccaggattc attttcgacg 18300
ccctcgctga ggtaaatgtc agtcagccaa agatcggcag caacaacatc tcaaatatga 18360
gcatcaaggc tttcagaccc ccacacgatg atgttgcaaa attgctcaaa gatatcaaca 18420
caagcaagca caatcttccc atttcagggg gcaatctcgc caattatgaa atccatgctt 18480
tccgcagaat cgggttgaac tcatctgctt gctacaaagc tgttgagata tcaacattaa 18540
ttaggagatg ccttgagcca ggggaggacg gcttgttctt gggtgaggga tcgggttcta 18600
tgttgatcac ttataaagag atacttaaac taaacaagtg cttctataat agtggggttt 18660
ccgccaattc tagatctggt caaagggaat tagcacccta tccctccgaa gttggccttg 18720
tcgaacacag aatgggagta ggtaatattg tcaaagtgct ctttaacggg aggcccgaag 18780
tcacgtgggt aggcagtgta gattgcttca atttcatagt tagtaatatc cctacctcta 18840
gtgtggggtt tatccattca gatatagaga ccttgcctga caaagatact atagagaagc 18900
tagaggaatt ggcagccatc ttatcgatgg ctctgctcct gggcaaaata ggatcaatac 18960
tggtgattaa gcttatgcct ttcagcgggg attttgttca gggatttata agttatgtag 19020
ggtctcatta tagagaagtg aaccttgtat accctagata cagcaacttc atctctactg 19080
aatcttattt ggttatgaca gatctcaagg ctaaccggct aatgaatcct gaaaagatta 19140
agcagcagat aattgaatca tctgtgagga cttcacctgg acttataggt cacatcctat 19200
ccattaagca actaagctgc atacaagcaa ttgtgggaga cgcagttagt agaggtgata 19260
tcaatcctac tctgaaaaaa cttacaccta tagagcaggt gctgatcaat tgcgggttgg 19320
caattaacgg acctaagctg tgcaaagaat tgatccacca tgatgttgcc tcagggcaag 19380
atggattgct taattctata ctcatcctct acagggagtt ggcaagattc aaagacaacc 19440
aaagaagtca acaagggatg ttccacgctt accccgtatt ggtaagtagc aggcaacgag 19500
aacttatatc taggatcacc cgcaaattct gggggcacat tcttctttac tccgggaaca 19560
aaaagttgat aaataagttt atccagaatc tcaagtccgg ctatctgata ctagacttac 19620
accagaatat cttcgttaag aatctatcca agtcagagaa acagattatt atgacggggg 19680
gtttgaaacg tgagtgggtt tttaaggtaa cagtcaagga gaccaaagaa tggtataagt 19740
tagtcggata cagtgccctg attaaggact aattggttga actccggaac cctaatcctg 19800
ccctaggtgg ttaggcatta tttgcaatat attaaagaaa actttgaaaa tacgaagttt 19860
ctattcccag ctttgtctgg tggccggcat ggtcccagcc tcctcgctgg cgccggctgg 19920
gcaacattcc gaggggaccg tcccctcggt aatggcgaat gggacgcggc cgatccggct 19980
gctaacaaag cccgaaagga agctgagttg gctgctgcca ccgctgagca ataactagca 20040
taaccccttg gggcctctaa acgggtcttg aggggttttt tgctgaaagg aggaactata 20100
tccggatgcg gccgcgggcc ctatggtacc cagcttttgt tccctttagt gagggttaat 20160
tccgagcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 20220
aattccacac aacataggag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 20280
gaggtaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 20340
gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 20400
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 20460
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 20520
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 20580
gtttttccat aggctcggcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 20640
gtggcgaaac ccgacaggac tataaagata ccaggcgttc ccccctggaa gctccctcgt 20700
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 20760
aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 20820
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 20880
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 20940
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 21000
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 21060
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 21120
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 21180
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 21240
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 21300
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 21360
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactgcccgt 21420
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 21480
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 21540
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 21600
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 21660
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 21720
atcaaggcga gttacatgat cccccatgtt gtgaaaaaaa gcggttagct ccttcggtcc 21780
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatgctta tggcagcact 21840
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 21900
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 21960
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 22020
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 22080
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 22140
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 22200
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 22260
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 22320
aaaagtgcca cctgaaattg taaacgttaa tattttgtta aaattcgcgt taaatttttg 22380
ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 22440
agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 22500
gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 22560
tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 22620
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 22680
ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 22740
gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt cccatt 22796
<210> 147
<211> 20780
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-S2-2P-dER_SARS-CoV-2 (optimized sequence)
<400> 147
tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60
cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120
atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180
tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240
cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300
caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360
taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420
ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480
gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540
caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600
gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660
aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720
tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780
agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840
tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900
tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960
atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020
aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080
ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140
actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200
gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260
atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320
ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380
caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440
catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500
ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560
gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620
caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680
tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740
acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800
taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860
aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920
ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980
gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040
gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100
gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160
actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220
gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280
caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340
gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400
cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460
gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520
gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580
acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640
acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700
gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760
acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820
ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880
ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940
cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000
atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060
cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120
aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180
cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240
tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300
cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360
aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420
aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480
aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540
tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtagcaagt cagagtatca 3600
tagcctatac tatgagcctg ggggcagaaa attctgtcgc ttatagtaat aacagtattg 3660
caattcctac taacttcact attagcgtga ctacagaaat tctgccagtg agcatgacca 3720
agacctccgt cgactgtacc atgtatatct gcggagacag cacagaatgc agcaacctgc 3780
ttctgcagta cggtagcttt tgtacccagc tgaacagggc actgaccggc atcgctgtgg 3840
aacaggacaa aaatacgcag gaggtgttcg ctcaggtcaa gcagatttat aagacacccc 3900
caataaaaga cttcggcggc tttaacttct cccagatcct gcccgatccg tcaaaacctt 3960
ccaagagaag ttttatcgag gatctgctgt ttaacaaagt aacattggct gatgctggct 4020
ttattaaaca gtacggcgat tgtctgggag atatcgccgc tagagatctg atctgcgctc 4080
aaaaatttaa tggcctcact gtattgcccc ccctgctgac ggatgaaatg attgcccaat 4140
acacatcagc cctgctggct gggacaatca cttccggctg gacgttcggt gctggagctg 4200
ctcttcaaat tccatttgcc atgcaaatgg cttatagatt caacggaatt ggcgtgaccc 4260
aaaacgtgct gtacgaaaat caaaagctga ttgctaatca gtttaactcc gctatcggta 4320
agatacagga cagcctgtct agtactgcca gcgccctcgg aaagctccag gatgtggtga 4380
accagaatgc gcaggcgctg aacacactcg tcaaacagct tagcagcaat ttcggcgcaa 4440
ttagcagtgt actgaacgac atcttgtctc ggctcgaccc accagaggcc gaagtgcaga 4500
ttgatcgcct gatcactggc cggctccagt ctctgcagac ctacgtaacc cagcaactca 4560
tacgcgctgc cgaaattcgg gcttcagcta acctggccgc aacaaagatg tctgaatgtg 4620
ttcttgggca gtccaagagg gtggacttct gcgggaaagg atatcacctg atgtccttcc 4680
ctcagagcgc ccctcatgga gtggtgtttc ttcatgttac ctatgttccg gcccaggaaa 4740
agaattttac cactgcccca gccatttgcc atgatggtaa agcacacttc ccaagagagg 4800
gcgtgtttgt tagtaacggc acccactggt tcgttaccca gcgcaatttt tacgaacctc 4860
aaatcattac cactgacaat acatttgtat caggcaattg cgacgtggtg atcggaatcg 4920
taaataatac agtctacgat cccctgcagc cagagcttga cagctttaaa gaggaactgg 4980
acaaatactt caaaaatcat acaagccccg acgtcgacct gggagatatt tctggcatca 5040
atgcctccgt cgtgaatatc caaaaagaga tcgaccgcct taatgaggtt gccaaaaacc 5100
tcaacgagtc cctgattgat ctgcaggagc tggggaagta cgagcagtat atcaaatggc 5160
cctggtacat ctggctgggc ttcattgccg ggctcatagc catcgtgatg gtgacgatca 5220
tgctgtgttg catgacctct tgctgttctt gtctgaaggg gtgctgctct tgtgggagtt 5280
gttgtaaatt cgatgaggat gattccgaat aagcgcgcag cgcttagacg tctcgcgatc 5340
gatactagta caacctaaat ccattataaa aaacttagga gcaaagtgat tgcctcccaa 5400
ggtccacaat gacagagacc tacgacttcg acaagtcggc atgggacatc aaagggtcga 5460
tcgctccgat acaacccacc acctacagtg atggcaggct ggtgccccag gtcagagtca 5520
tagatcctgg tctaggcgac aggaaggatg aatgctttat gtacatgttt ctgctggggg 5580
ttgttgagga cagcgattcc ctagggcctc caatcgggcg agcatttggg ttcctgccct 5640
taggtgttgg cagatccaca gcaaagcccg aaaaactcct caaagaggcc actgagcttg 5700
acatagttgt tagacgtaca gcagggctca atgaaaaact ggtgttctac aacaacaccc 5760
cactaactct cctcacacct tggagaaagg tcctaacaac agggagtgtc ttcaacgcaa 5820
accaagtgtg caatgcggtt aatctgatac cgctcgatac cccgcagagg ttccgtgttg 5880
tttatatgag catcacccgt ctttcggata acgggtatta caccgttcct agaagaatgc 5940
tggaattcag atcggtcaat gcagtggcct tcaacctgct ggtgaccctt aggattgaca 6000
aggcgatagg ccctgggaag atcatcgaca atacagagca acttcctgag gcaacattta 6060
tggtccacat cgggaacttc aggagaaaga agagtgaagt ctactctgcc gattattgca 6120
aaatgaaaat cgaaaagatg ggcctggttt ttgcacttgg tgggataggg ggcaccagtc 6180
ttcacattag aagcacaggc aaaatgagca agactctcca tgcacaactc gggttcaaga 6240
agaccttatg ttacccgctg atggatatca atgaagacct taatcgatta ctctggagga 6300
gcagatgcaa gatagtaaga atccaggcag ttttgcagcc atcagttcct caagaattcc 6360
gcatttacga cgacgtgatc ataaatgatg accaaggact attcaaagtt ctgtagaccg 6420
tagtgcccag caatgcccga aaacgacccc cctcacaatg acagccagaa ggcccggaca 6480
aaaaagcccc ctccgaaaga ctccacggac caagcgagag gccagccagc agccgacggc 6540
aagcgcgaac accaggcggc cccagcacag aacagccctg acacaaggcc accaccagcc 6600
accccaatct gcatcctcct cgtgggaccc ccgaggacca acccccaagg ctgcccccga 6660
tccaaaccac caaccgcatc cccaccaccc ccgggaaaga aacccccagc aattggaagg 6720
cccctccccc tcttcctcaa cacaagaact ccacaaccga accgcacaag cgaccgaggt 6780
gacccaaccg caggcatccg actccctaga cagatcctct ctccccggca aactaaacaa 6840
aacttagggc caaggaacat acacacccaa cagaacccag accccggccc acggcgccgc 6900
gcccccaacc cccgacaacc agagggagcc cccaaccaat cccgccggct cccccggtgc 6960
ccacaggcag ggacaccaac ccccgaacag acccagcacc caaccatcga caatccaaga 7020
cgggggggcc cccccaaaaa aaggccccca ggggccgaca gccagcaccg cgaggaagcc 7080
cacccacccc acacacgacc acggcaacca aaccagaacc cagaccaccc tgggccacca 7140
gctcccagac tcggccatca ccccgcagaa aggaaaggcc acaacccgcg caccccagcc 7200
ccgatccggc ggggagccac ccaacccgaa ccagcaccca agagcgatcc ccgaaggacc 7260
cccgaaccgc aaaggacatc agtatcccac agcctctcca agtcccccgg tctcctcctc 7320
ttctcgaagg gaccaaaaga tcaatccacc acacccgacg acactcaact ccccacccct 7380
aaaggagaca ccgggaatcc cagaatcaag actcatccaa tgtccatcat gggtctcaag 7440
gtgaacgtct ctgccatatt catggcagta ctgttaactc tccaaacacc caccggtcaa 7500
atccattggg gcaatctctc taagataggg gtggtaggaa taggaagtgc aagctacaaa 7560
gttatgactc gttccagcca tcaatcatta gtcataaaat taatgcccaa tataactctc 7620
ctcaataact gcacgagggt agagattgca gaatacagga gactactgag aacagttttg 7680
gaaccaatta gagatgcact taatgcaatg acccagaata taagaccggt tcagagtgta 7740
gcttcaagta ggagacacaa gagatttgcg ggagtagtcc tggcaggtgc ggccctaggc 7800
gttgccacag ctgctcagat aacagccggc attgcacttc accagtccat gctgaactct 7860
caagccatcg acaatctgag agcgagcctg gaaactacta atcaggcaat tgagacaatc 7920
agacaagcag ggcaggagat gatattggct gttcagggtg tccaagacta catcaataat 7980
gagctgatac cgtctatgaa ccaactatct tgtgatttaa tcggccagaa gctcgggctc 8040
aaattgctca gatactatac agaaatcctg tcattatttg gccccagttt acgggacccc 8100
atatctgcgg agatatctat ccaggctttg agctatgcgc ttggaggaga catcaataag 8160
gtgttagaaa agctcggata cagtggaggt gatttactgg gcatcttaga gagcggagga 8220
ataaaggccc ggataactca cgtcgacaca gagtcctact tcattgtcct cagtatagcc 8280
tatccgacgc tgtccgagat taagggggtg attgtccacc ggctagaggg ggtctcgtac 8340
aacataggct ctcaagagtg gtataccact gtgcccaagt atgttgcaac ccaagggtac 8400
cttatctcga attttgatga gtcatcgtgt actttcatgc cagaggggac tgtgtgcagc 8460
caaaatgcct tgtacccgat gagtcctctg ctccaagaat gcctccgggg gtacaccaag 8520
tcctgtgctc gtacactcgt atccgggtct tttgggaacc ggttcatttt atcacaaggg 8580
aacctaatag ccaattgtgc atcaatcctt tgcaagtgtt acacaacagg aacgatcatt 8640
aatcaagacc ctgacaagat cctaacatac attgctgccg atcactgccc ggtagtcgag 8700
gtgaacggcg tgaccatcca agtcgggagc aggaggtatc cagacgctgt gtacttgcac 8760
agaattgacc tcggtcctcc catatcattg gagaggttgg acgtagggac aaatctgggg 8820
aatgcaattg ctaagttgga ggatgccaag gaattgttgg agtcatcgga ccagatattg 8880
aggagtatga aaggtttatc gagcactagc atagtctaca tcctgattgc agtgtgtctt 8940
ggagggttga tagggatccc cgctttaata tgttgctgca gggggcgttg taacaaaaag 9000
ggagaacaag ttggtatgtc aagaccaggc ctaaagcctg atcttacggg aacatcaaaa 9060
tcctatgtaa ggtcgctctg atcctctaca actcttgaaa cacaaatgtc ccacaagtct 9120
cctcttcgtc atcaagcaac caccgcaccc agcatcaagc ccacctgaaa ttatctccgg 9180
cttccctctg gccgaacaat atcggtagtt aatcaaaact tagggtgcaa gatcatccac 9240
aatgtcacca caacgagacc ggataaatgc cttctacaaa gataaccccc atcccaaggg 9300
aagtaggata gtcattaaca gagaacatct tatgattgat agaccttatg ttttgctggc 9360
tgttctgttt gtcatgtttc tgagcttgat cgggttgcta gccattgcag gcattagact 9420
tcatcgggca gccatctaca ccgcagagat ccataaaagc ctcagcacca atctagatgt 9480
aactaactca atcgagcatc aggtcaagga cgtgctgaca ccactcttca aaatcatcgg 9540
tgatgaagtg ggcctgagga cacctcagag attcactgac ctagtgaaat taatctctga 9600
caagattaaa ttccttaatc cggataggga gtacgacttc agagatctca cttggtgtat 9660
caacccgcca gagagaatca aattggatta tgatcaatac tgtgcagatg tggctgctga 9720
agagctcatg aatgcattgg tgaactcaac tctactggag accagaacaa ccaatcagtt 9780
cctagctgtc tcaaagggaa actgctcagg gcccactaca atcagaggtc aattctcaaa 9840
catgtcgctg tccctgttag acttgtattt aggtcgaggt tacaatgtgt catctatagt 9900
cactatgaca tcccagggaa tgtatggggg aacttaccta gtggaaaagc ctaatctgag 9960
cagcaaaagg tcagagttgt cacaactgag catgtaccga gtgtttgaag taggtgttat 10020
cagaaatccg ggtttggggg ctccggtgtt ccatatgaca aactatcttg agcaaccagt 10080
cagtaatgat ctcagcaact gtatggtggc tttgggggag ctcaaactcg cagccctttg 10140
tcacggggaa gattctatca caattcccta tcagggatca gggaaaggtg tcagcttcca 10200
gctcgtcaag ctaggtgtct ggaaatcccc aaccgacatg caatcctggg tccccttatc 10260
aacggatgat ccagtgatag acaggcttta cctctcatct cacagaggtg ttatcgctga 10320
caatcaagca aaatgggctg tcccgacaac acgaacagat gacaagttgc gaatggagac 10380
atgcttccaa caggcgtgta agggtaaaat ccaagcactc tgcgagaatc ccgagtgggc 10440
accattgaag gataacagga ttccttcata cggggtcttg tctgttgatc tgagtctgac 10500
agttgagctt aaaatcaaaa ttgcttcggg attcgggcca ttgatcacac acggttcagg 10560
gatggaccta tacaaatcca accacaacaa tgtgtattgg ctgactatcc cgccaatgaa 10620
gaacctagcc ttaggtgtaa tcaacacatt ggagtggata ccgagattca aggttagtcc 10680
ctacctcttc actgtcccaa ttaaggaagc aggcgaagac tgccatgccc caacatacct 10740
acctgcggag gtggatggtg atgtcaaact cagttccaat ctggtgattc tacctggtca 10800
agatctccaa tatgttttgg caacctacga tacttccagg gttgaacatg ctgtggttta 10860
ttacgtttac agcccaagcc gctcattttc ttacttttat ccttttaggt tgcctataaa 10920
gggggtcccc atcgaattac aagtggaatg cttcacatgg gaccaaaaac tctggtgccg 10980
tcacttctgt gtgcttgcgg actcagaatc tggtggacat atcactcact ctgggatggt 11040
gggcatggga gtcagctgca cagtcacccg ggaagatgga accaatcgca gatagggctg 11100
ctagtgaacc aatcacatga tgtcacccag acatcaggca tacccactag tgtgaaatag 11160
acatcagaat taagaaaaac gtagggtcca agtggttccc cgttatggac tcgctatctg 11220
tcaaccagat cttataccct gaagttcacc tagatagccc gatagttacc aataagatag 11280
tagccatcct ggagtatgct cgagtccctc acgcttacag cctggaggac cctacactgt 11340
gtcagaacat caagcaccgc ctaaaaaacg gattttccaa ccaaatgatt ataaacaatg 11400
tggaagttgg gaatgtcatc aagtccaagc ttaggagtta tccggcccac tctcatattc 11460
catatccaaa ttgtaatcag gatttattta acatagaaga caaagagtca acgaggaaga 11520
tccgtgaact cctcaaaaag gggaattcgc tgtactccaa agtcagtgat aaggttttcc 11580
aatgcttaag ggacactaac tcacggcttg gcctaggctc cgaattgagg gaggacatca 11640
aggagaaagt tattaacttg ggagtttaca tgcacagctc ccagtggttt gagccctttc 11700
tgttttggtt tacagtcaag actgagatga ggtcagtgat taaatcacaa acccatactt 11760
gccataggag gagacacaca cctgtattct tcactggtag ttcagttgag ttgctaatct 11820
ctcgtgacct tgttgctata atcagtaaag agtctcaaca tgtatattac ctgacatttg 11880
aactggtttt gatgtattgt gatgtcatag aggggaggtt aatgacagag accgctatga 11940
ctattgatgc taggtataca gagcttctag gaagagtcag atacatgtgg aaactgatag 12000
atggtttctt ccctgcactc gggaatccaa cttatcaaat tgtagccatg ctggagcctc 12060
tttcacttgc ttacctgcag ctgagggata taacagtaga actcagaggt gctttcctta 12120
accactgctt tactgaaata catgatgttc ttgaccaaaa cgggttttct gatgaaggta 12180
cttatcatga gttaactgaa gctctagatt acattttcat aactgatgac atacatctga 12240
caggggagat tttctcattt ttcagaagtt tcggccaccc cagacttgaa gcagtaacgg 12300
ctgctgaaaa tgttaggaaa tacatgaatc agcctaaagt cattgtgtat gagactctga 12360
tgaaaggtca tgccatattt tgtggaatca taatcaacgg ctatcgtgac aggcacggag 12420
gcagttggcc accgctgacc ctccccctgc atgctgcaga cacaatccgg aatgctcaag 12480
cttcaggtga agggttaaca catgagcagt gcgttgataa ctggaaatct tttgctggag 12540
tgaaatttgg ctgctttatg cctcttagcc tggatagtga tctgacaatg tacctaaagg 12600
acaaggcact tgctgctctc caaagggaat gggattcagt ttacccgaaa gagttcctgc 12660
gttacgaccc tcccaaggga accgggtcac ggaggcttgt agatgttttc cttaatgatt 12720
cgagctttga cccatatgat gtgataatgt atgttgtaag tggagcttac ctccatgacc 12780
ctgagttcaa cctgtcttac agcctgaaag aaaaggagat caaggaaaca ggtagacttt 12840
ttgctaaaat gacttacaaa atgagggcat gccaagtgat tgctgaaaat ctaatctcaa 12900
acgggattgg caaatatttt aaggacaatg ggatggccaa ggatgagcac gatttgacta 12960
aggcactcca cactctagct gtctcaggag tccccaaaga tctcaaagaa agtcacaggg 13020
gggggccagt cttaaaaacc tactcccgaa gcccagtcca cacaagtacc aggaacgtga 13080
gagcagcaaa agggtttata gggttccctc aagtaattcg gcaggaccaa gacactgatc 13140
atccggagaa tatggaagct tacgagacag tcagtgcatt tatcacgact gatctcaaga 13200
agtactgcct taattggaga tatgagacca tcagcttgtt tgcacagagg ctaaatgaga 13260
tttacggatt gccctcattt ttccagtggc tgcataagag gcttgagacc tctgtcctgt 13320
atgtaagtga ccctcattgc ccccccgacc ttgacgccca tatcccgtta tataaagtcc 13380
ccaatgatca aatcttcatt aagtacccta tgggaggtat agaagggtat tgtcagaagc 13440
tgtggaccat cagcaccatt ccctatctat acctggctgc ttatgagagc ggagtaagga 13500
ttgcttcgtt agtgcaaggg gacaatcaga ccatagccgt aacaaaaagg gtacccagca 13560
catggcccta caaccttaag aaacgggaag ctgctagagt aactagagat tactttgtaa 13620
ttcttaggca aaggctacat gatattggcc atcacctcaa ggcaaatgag acaattgttt 13680
catcacattt ttttgtctat tcaaaaggaa tatattatga tgggctactt gtgtcccaat 13740
cactcaagag catcgcaaga tgtgtattct ggtcagagac tatagttgat gaaacaaggg 13800
cagcatgcag taatattgct acaacaatgg ctaaaagcat cgagagaggt tatgaccgtt 13860
accttgcata ttccctgaac gtcctaaaag tgatacagca aattctgatc tctcttggct 13920
tcacaatcaa ttcaaccatg acccgggatg tagtcatacc cctcctcaca aacaacgacc 13980
tcttaataag gatggcactg ttgcccgctc ctattggggg gatgaattat ctgaatatga 14040
gcaggctgtt tgtcagaaac atcggtgatc cagtaacatc atcaattgct gatctcaaga 14100
gaatgattct cgcctcacta atgcctgaag agaccctcca tcaagtaatg acacaacaac 14160
cgggggactc ttcattccta gactgggcta gcgaccctta ctcagcaaat cttgtatgtg 14220
tccagagcat cactagactc ctcaagaaca taactgcaag gtttgtcctg atccatagtc 14280
caaacccaat gttaaaagga ttattccatg atgacagtaa agaagaggac gagggactgg 14340
cggcattcct catggacagg catattatag tacctagggc agctcatgaa atcctggatc 14400
atagtgtcac aggggcaaga gagtctattg caggcatgct ggataccaca aaaggcttga 14460
ttcgagccag catgaggaag ggggggttaa cctctcgagt gataaccaga ttgtccaatt 14520
atgactatga acaattcaga gcagggatgg tgctattgac aggaagaaag agaaatgtcc 14580
tcattgacaa agagtcatgt tcagtgcagc tggcgagagc tctaagaagc catatgtggg 14640
cgaggctagc tcgaggacgg cctatttacg gccttgaggt ccctgatgta ctagaatcta 14700
tgcgaggcca ccttattcgg cgtcatgaga catgtgtcat ctgcgagtgt ggatcagtca 14760
actacggatg gttttttgtc ccctcgggtt gccaactgga tgatattgac aaggaaacat 14820
catccttgag agtcccatat attggttcta ccactgatga gagaacagac atgaagcttg 14880
ccttcgtaag agccccaagt cgatccttgc gatctgctgt tagaatagca acagtgtact 14940
catgggctta cggtgatgat gatagctctt ggaacgaagc ctggttgttg gctaggcaaa 15000
gggccaatgt gagcctggag gagctaaggg tgatcactcc catctcaact tcgactaatt 15060
tagcgcatag gttgagggat cgtagcactc aagtgaaata ctcaggtaca tcccttgtcc 15120
gagtggcgag gtataccaca atctccaacg acaatctctc atttgtcata tcagataaga 15180
aggttgatac taactttata taccaacaag gaatgcttct agggttgggt gttttagaaa 15240
cattgtttcg actcgagaaa gataccggat catctaacac ggtattacat cttcacgtcg 15300
aaacagattg ttgcgtgatc ccgatgatag atcatcccag gatacccagc tcccgcaagc 15360
tagagctgag ggcagagcta tgtaccaacc cattgatata tgataatgca cctttaattg 15420
acagagatgc aacaaggcta tacacccaga gccataggag gcaccttgtg gaatttgtta 15480
catggtccac accccaacta tatcacattt tagctaagtc cacagcacta tctatgattg 15540
acctggtaac aaaatttgag aaggaccata tgaatgaaat ttcagctctc ataggggatg 15600
acgatatcaa tagtttcata actgagtttc tgctcataga gccaagatta ttcactatct 15660
acttgggcca gtgtgcggcc atcaattggg catttgatgt acattatcat agaccatcag 15720
ggaaatatca gatgggtgag ctgttgtcat cgttcctttc tagaatgagc aaaggagtgt 15780
ttaaggtgct tgtcaatgct ctaagccacc caaagatcta caagaaattc tggcattgtg 15840
gtattataga gcctatccat ggtccttcac ttgatgctca aaacttgcac acaactgtgt 15900
gcaacatggt ttacacatgc tatatgacct acctcgacct gttgttgaat gaagagttag 15960
aagagttcac atttctcttg tgtgaaagcg acgaggatgt agtaccggac agattcgaca 16020
acatccaggc aaaacactta tgtgttctgg cagatttgta ctgtcaacca gggacctgcc 16080
caccaattcg aggtctaaga ccggtagaga aatgtgcagt tctaaccgac catatcaagg 16140
cagaggctat gttatctcca gcaggatctt cgtggaacat aaatccaatt attgtagacc 16200
attactcatg ctctctgact tatctccggc gaggatcgat caaacagata agattgagag 16260
ttgatccagg attcattttc gacgccctcg ctgaggtaaa tgtcagtcag ccaaagatcg 16320
gcagcaacaa catctcaaat atgagcatca aggctttcag acccccacac gatgatgttg 16380
caaaattgct caaagatatc aacacaagca agcacaatct tcccatttca gggggcaatc 16440
tcgccaatta tgaaatccat gctttccgca gaatcgggtt gaactcatct gcttgctaca 16500
aagctgttga gatatcaaca ttaattagga gatgccttga gccaggggag gacggcttgt 16560
tcttgggtga gggatcgggt tctatgttga tcacttataa agagatactt aaactaaaca 16620
agtgcttcta taatagtggg gtttccgcca attctagatc tggtcaaagg gaattagcac 16680
cctatccctc cgaagttggc cttgtcgaac acagaatggg agtaggtaat attgtcaaag 16740
tgctctttaa cgggaggccc gaagtcacgt gggtaggcag tgtagattgc ttcaatttca 16800
tagttagtaa tatccctacc tctagtgtgg ggtttatcca ttcagatata gagaccttgc 16860
ctgacaaaga tactatagag aagctagagg aattggcagc catcttatcg atggctctgc 16920
tcctgggcaa aataggatca atactggtga ttaagcttat gcctttcagc ggggattttg 16980
ttcagggatt tataagttat gtagggtctc attatagaga agtgaacctt gtatacccta 17040
gatacagcaa cttcatctct actgaatctt atttggttat gacagatctc aaggctaacc 17100
ggctaatgaa tcctgaaaag attaagcagc agataattga atcatctgtg aggacttcac 17160
ctggacttat aggtcacatc ctatccatta agcaactaag ctgcatacaa gcaattgtgg 17220
gagacgcagt tagtagaggt gatatcaatc ctactctgaa aaaacttaca cctatagagc 17280
aggtgctgat caattgcggg ttggcaatta acggacctaa gctgtgcaaa gaattgatcc 17340
accatgatgt tgcctcaggg caagatggat tgcttaattc tatactcatc ctctacaggg 17400
agttggcaag attcaaagac aaccaaagaa gtcaacaagg gatgttccac gcttaccccg 17460
tattggtaag tagcaggcaa cgagaactta tatctaggat cacccgcaaa ttctgggggc 17520
acattcttct ttactccggg aacaaaaagt tgataaataa gtttatccag aatctcaagt 17580
ccggctatct gatactagac ttacaccaga atatcttcgt taagaatcta tccaagtcag 17640
agaaacagat tattatgacg gggggtttga aacgtgagtg ggtttttaag gtaacagtca 17700
aggagaccaa agaatggtat aagttagtcg gatacagtgc cctgattaag gactaattgg 17760
ttgaactccg gaaccctaat cctgccctag gtggttaggc attatttgca atatattaaa 17820
gaaaactttg aaaatacgaa gtttctattc ccagctttgt ctggtggccg gcatggtccc 17880
agcctcctcg ctggcgccgg ctgggcaaca ttccgagggg accgtcccct cggtaatggc 17940
gaatgggacg cggccgatcc ggctgctaac aaagcccgaa aggaagctga gttggctgct 18000
gccaccgctg agcaataact agcataaccc cttggggcct ctaaacgggt cttgaggggt 18060
tttttgctga aaggaggaac tatatccgga tgcggccgcg ggccctatgg tacccagctt 18120
ttgttccctt tagtgagggt taattccgag cttggcgtaa tcatggtcat agctgtttcc 18180
tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 18240
taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 18300
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 18360
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 18420
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 18480
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 18540
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc ggcccccctg acgagcatca 18600
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 18660
gttcccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 18720
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 18780
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 18840
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 18900
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 18960
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 19020
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 19080
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 19140
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 19200
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 19260
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 19320
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 19380
atccatagtt gcctgactgc ccgtcgtgta gataactacg atacgggagg gcttaccatc 19440
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 19500
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 19560
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 19620
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 19680
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgaaa 19740
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 19800
atcactcatg cttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 19860
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 19920
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 19980
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 20040
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 20100
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 20160
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 20220
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 20280
aggggttccg cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt 20340
gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat 20400
cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt 20460
ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt 20520
ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag 20580
gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg 20640
aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc 20700
gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc 20760
gctacagggc gcgtcccatt 20780
<210> 148
<211> 22826
<212> DNA
<213> Artificial sequence
<220>
<223> pTM2-SF-2P-2a_SARS-CoV-2 (optimized sequence)
<400> 148
tgtccgctaa tacgactcac tatagggcca actttgtttg gtctgatgag tccgtgagga 60
cgaaacccgg agtcccgggt caccaaacaa agttgggtaa ggatagttca atcaatgatc 120
atcttctagt gcacttagga ttcaagatcc tattatcagg gacaagagca ggattaggga 180
tatccgagat ggccacactt ttaaggagct tagcattgtt caaaagaaac aaggacaaac 240
cacccattac atcaggatcc ggtggagcca tcagaggaat caaacacatt attatagtac 300
caatccctgg agattcctca attaccactc gatccagact tctggaccgg ttggtgaggt 360
taattggaaa cccggatgtg agcgggccca aactaacagg ggcactaata ggtatattat 420
ccttatttgt ggagtctcca ggtcaattga ttcagaggat caccgatgac cctgacgtta 480
gcataaggct gttagaggtt gtccagagtg accagtcaca atctggcctt accttcgcat 540
caagaggtac caacatggag gatgaggcgg accaatactt ttcacatgat gatccaatta 600
gtagtgatca atccaggttc ggatggttcg ggaacaagga aatctcagat attgaagtgc 660
aagaccctga gggattcaac atgattctgg gtaccatcct agcccaaatt tgggtcttgc 720
tcgcaaaggc ggttacggcc ccagacacgg cagctgattc ggagctaaga aggtggataa 780
agtacaccca acaaagaagg gtagttggtg aatttagatt ggagagaaaa tggttggatg 840
tggtgaggaa caggattgcc gaggacctct ccttacgccg attcatggtc gctctaatcc 900
tggatatcaa gagaacaccc ggaaacaaac ccaggattgc tgaaatgata tgtgacattg 960
atacatatat cgtagaggca ggattagcca gttttatcct gactattaag tttgggatag 1020
aaactatgta tcctgctctt ggactgcatg aatttgctgg tgagttatcc acacttgagt 1080
ccttgatgaa cctttaccag caaatggggg aaactgcacc ctacatggta atcctggaga 1140
actcaattca gaacaagttc agtgcaggat cataccctct gctctggagc tatgccatgg 1200
gagtaggagt ggaacttgaa aactccatgg gaggtttgaa ctttggccga tcttactttg 1260
atccagcata ttttagatta gggcaagaga tggtaaggag gtcagctgga aaggtcagtt 1320
ccacattggc atctgaactc ggtatcactg ccgaggatgc aaggcttgtt tcagagattg 1380
caatgcatac tactgaggac aagatcagta gagcggttgg acccagacaa gcccaagtat 1440
catttctaca cggtgatcaa agtgagaatg agctaccgag attggggggc aaggaagata 1500
ggagggtcaa acagagtcga ggagaagcca gggagagcta cagagaaacc gggcccagca 1560
gagcaagtga tgcgagagct gcccatcttc caaccggcac acccctagac attgacactg 1620
caacggagtc cagccaagat ccgcaggaca gtcgaaggtc agctgacgcc ctgcttaggc 1680
tgcaagccat ggcaggaatc tcggaagaac aaggctcaga cacggacacc cctatagtgt 1740
acaatgacag aaatcttcta gactaggtgc gagaggccga gggccagaac aacatccgcc 1800
taccatccat cattgttata aaaaacttag gaaccaggtc cacacagccg ccagcccatc 1860
aaccatccac tcccacgatt ggagccaatg gcagaagagc aggcacgcca tgtcaaaaac 1920
ggactggaat gcatccgggc tctcaaggcc gagcccatcg gctcactggc catcgaggaa 1980
gctatggcag catggtcaga aatatcagac aacccaggac aggagcgagc cacctgcagg 2040
gaagagaagg caggcagttc gggtctcagc aaaccatgcc tctcagcaat tggatcaact 2100
gaaggcggtg cacctcgcat ccgcggtcag ggacctggag agagcgatga cgacgctgaa 2160
actttgggaa tccccccaag aaatctccag gcatcaagca ctgggttaca gtgttattac 2220
gtttatgatc acagcggtga agcggttaag ggaatccaag atgctgactc tatcatggtt 2280
caatcaggcc ttgatggtga tagcaccctc tcaggaggag acaatgaatc tgaaaacagc 2340
gatgtggata ttggcgaacc tgataccgag ggatatgcta tcactgaccg gggatctgct 2400
cccatctcta tggggttcag ggcttctgat gttgaaactg cagaaggagg ggagatccac 2460
gagctcctga gactccaatc cagaggcaac aactttccga agcttgggaa aactctcaat 2520
gttcctccgc ccccggaccc cggtagggcc agcacttccg ggacacccat taaaaagggc 2580
acagacgcga gattagcctc atttggaacg gagatcgcgt ctttattgac aggtggtgca 2640
acccaatgtg ctcgaaagtc accctcggaa ccatcagggc caggtgcacc tgcggggaat 2700
gtccccgagt gtgtgagcaa tgccgcactg atacaggagt ggacacccga atctggtacc 2760
acaatctccc cgagatccca gaataatgaa gaagggggag actattatga tgatgagctg 2820
ttctctgatg tccaagatat taaaacagcc ttggccaaaa tacacgagga taatcagaag 2880
ataatctcca agctagaatc actgctgtta ttgaagggag aagttgagtc aattaagaag 2940
cagatcaaca ggcaaaatat cagcatatcc accctggaag gacacctctc aagcatcatg 3000
atcgccattc ctggacttgg gaaggatccc aacgacccca ctgcagatgt cgaaatcaat 3060
cccgacttga aacccatcat aggcagagat tcaggccgag cactggccga agttctcaag 3120
aaacccgttg ccagccgaca actccaagga atgacaaatg gacggaccag ttccagagga 3180
cagctgctga aggaatttca gctaaagccg atcgggaaaa agatgagctc agccgtcggg 3240
tttgttcctg acaccggccc tgcatcacgc agtgtaatcc gctccattat aaaatccagc 3300
cggctagagg aggatcggaa gcgttacctg atgactctcc ttgatgatat caaaggagcc 3360
aatgatcttg ccaagttcca ccagatgctg atgaagataa taatgaagta gctacagctc 3420
aacttacctg ccaaccccat gccagtcgac ccaactagcc taccctccat cattgttata 3480
aaaaacttag gaaccaggtc cacacagccg ccagcccatc aacgcgtacg gccaccatgt 3540
tcgtctttct ggtattgctt cctctggtga gttcccagtg cgtgaacctg acgactcgga 3600
cacagctgcc gcctgcatac acaaacagct tcacacgagg tgtttactat ccggacaagg 3660
tgttccggtc ctctgtcttg cacagtactc aggacctttt tctgccattc tttagtaacg 3720
taacatggtt ccacgctatc catgtaagtg gaaccaatgg caccaagcgc ttcgacaatc 3780
cagtcctgcc tttcaacgat ggcgtctact tcgcctctac cgagaaatca aatattatta 3840
gagggtggat cttcgggacc acccttgata gcaagactca gagtcttctg atcgtgaaca 3900
atgctactaa cgtcgtcata aaagtatgtg aatttcagtt ctgcaatgac cccttcctgg 3960
gcgtgtacta tcacaaaaat aacaagtcct ggatggaatc cgagtttcgg gtatacagca 4020
gcgctaataa ctgtaccttc gaatatgtga gccagccatt cctgatggac ctggagggga 4080
agcagggcaa cttcaaaaac ctgagggaat tcgtgttcaa gaacattgac ggatacttca 4140
aaatctacag caagcacact ccaattaatc ttgttaggga ccttcctcag gggttctccg 4200
cgctggaacc cttggtggat ctgccaattg gtattaacat cacgaggttt caaaccctgc 4260
tcgccctcca ccggtcatac ctgaccccag gtgatagtag tagtggctgg acagcagggg 4320
ccgcagcata ctacgtcggc tacctccagc cccgcacatt cctgctgaag tataatgaaa 4380
acggtactat tacagatgct gtggactgcg cacttgatcc attgtccgag actaaatgca 4440
ccttgaagtc ttttaccgtt gagaagggaa tctatcagac cagtaatttc agagtgcaac 4500
ccaccgagag catcgtgcga tttcctaata ttacaaacct gtgccctttt ggcgaggtgt 4560
ttaacgccac tcgcttcgcg agcgtgtatg catggaaccg gaaaaggatt agcaactgcg 4620
tggctgatta ttcagtcctt tataatagtg cctctttcag tacgttcaaa tgctatggag 4680
tgtccccaac taagcttaac gatctgtgtt ttaccaacgt gtatgccgac tctttcgtca 4740
tcaggggcga cgaggttaga caaattgcgc ccggacagac aggcaaaatt gctgactaca 4800
attataaact gccagatgac tttacaggat gcgtgattgc ctggaacagc aacaaccttg 4860
attctaaggt gggcggaaac tacaactatc tgtacaggct gttccgcaaa tcaaacctga 4920
agccattcga aagggacatt tcaactgaga tctaccaggc cggatctaca ccttgcaacg 4980
gggtggaagg attcaactgc tacttcccgc tccagtcata tggctttcaa cctaccaatg 5040
gagtgggcta ccaaccttat cgagtagttg ttctctcttt cgagttgttg catgccccag 5100
ccactgtctg cggaccaaag aaatccacca atctggtgaa aaacaagtgc gtcaacttca 5160
acttcaatgg actcaccggt acaggggttc ttaccgagtc aaacaagaaa ttccttccgt 5220
ttcagcagtt tggacgcgat atcgccgaca ctacggatgc agtacgcgat cctcagacac 5280
ttgagatcct ggacatcact ccatgctctt ttggaggggt gtctgtcatc actcccggga 5340
cgaataccag taatcaggtc gccgtgctct atcaagatgt caactgcaca gaggtgccag 5400
tcgccattca cgccgatcag cttaccccta cttggcgagt atatagcaca gggtccaacg 5460
tgtttcagac aagggcgggt tgtctgatcg gcgctgagca cgtcaataat agctacgaat 5520
gtgacatccc tattggagcc gggatttgcg ctagctatca gactcagact aactcacccc 5580
ggcgagctag gtctgtagca agtcagagta tcatagccta tactatgagc ctgggggcag 5640
aaaattctgt cgcttatagt aataacagta ttgcaattcc tactaacttc actattagcg 5700
tgactacaga aattctgcca gtgagcatga ccaagacctc cgtcgactgt accatgtata 5760
tctgcggaga cagcacagaa tgcagcaacc tgcttctgca gtacggtagc ttttgtaccc 5820
agctgaacag ggcactgacc ggcatcgctg tggaacagga caaaaatacg caggaggtgt 5880
tcgctcaggt caagcagatt tataagacac ccccaataaa agacttcggc ggctttaact 5940
tctcccagat cctgcccgat ccgtcaaaac cttccaagag aagttttatc gaggatctgc 6000
tgtttaacaa agtaacattg gctgatgctg gctttattaa acagtacggc gattgtctgg 6060
gagatatcgc cgctagagat ctgatctgcg ctcaaaaatt taatggcctc actgtattgc 6120
cccccctgct gacggatgaa atgattgccc aatacacatc agccctgctg gctgggacaa 6180
tcacttccgg ctggacgttc ggtgctggag ctgctcttca aattccattt gccatgcaaa 6240
tggcttatag attcaacgga attggcgtga cccaaaacgt gctgtacgaa aatcaaaagc 6300
tgattgctaa tcagtttaac tccgctatcg gtaagataca ggacagcctg tctagtactg 6360
ccagcgccct cggaaagctc caggatgtgg tgaaccagaa tgcgcaggcg ctgaacacac 6420
tcgtcaaaca gcttagcagc aatttcggcg caattagcag tgtactgaac gacatcttgt 6480
ctcggctcga cccaccagag gccgaagtgc agattgatcg cctgatcact ggccggctcc 6540
agtctctgca gacctacgta acccagcaac tcatacgcgc tgccgaaatt cgggcttcag 6600
ctaacctggc cgcaacaaag atgtctgaat gtgttcttgg gcagtccaag agggtggact 6660
tctgcgggaa aggatatcac ctgatgtcct tccctcagag cgcccctcat ggagtggtgt 6720
ttcttcatgt tacctatgtt ccggcccagg aaaagaattt taccactgcc ccagccattt 6780
gccatgatgg taaagcacac ttcccaagag agggcgtgtt tgttagtaac ggcacccact 6840
ggttcgttac ccagcgcaat ttttacgaac ctcaaatcat taccactgac aatacatttg 6900
tatcaggcaa ttgcgacgtg gtgatcggaa tcgtaaataa tacagtctac gatcccctgc 6960
agccagagct tgacagcttt aaagaggaac tggacaaata cttcaaaaat catacaagcc 7020
ccgacgtcga cctgggagat atttctggca tcaatgcctc cgtcgtgaat atccaaaaag 7080
agatcgaccg ccttaatgag gttgccaaaa acctcaacga gtccctgatt gatctgcagg 7140
agctggggaa gtacgagcag tatatcaaat ggccctggta catctggctg ggcttcattg 7200
ccgggctcat agccatcgtg atggtgacga tcatgctgtg ttgcatgacc tcttgctgtt 7260
cttgtctgaa ggggtgctgc tcttgtggga gttgttgtaa attcgatgag gatgattccg 7320
aacctgtgct gaagggagtc gcgctcgcct atacgtaagc gcgcagcgct tagacgtctc 7380
gcgatcgata ctagtacaac ctaaatccat tataaaaaac ttaggagcaa agtgattgcc 7440
tcccaaggtc cacaatgaca gagacctacg acttcgacaa gtcggcatgg gacatcaaag 7500
ggtcgatcgc tccgatacaa cccaccacct acagtgatgg caggctggtg ccccaggtca 7560
gagtcataga tcctggtcta ggcgacagga aggatgaatg ctttatgtac atgtttctgc 7620
tgggggttgt tgaggacagc gattccctag ggcctccaat cgggcgagca tttgggttcc 7680
tgcccttagg tgttggcaga tccacagcaa agcccgaaaa actcctcaaa gaggccactg 7740
agcttgacat agttgttaga cgtacagcag ggctcaatga aaaactggtg ttctacaaca 7800
acaccccact aactctcctc acaccttgga gaaaggtcct aacaacaggg agtgtcttca 7860
acgcaaacca agtgtgcaat gcggttaatc tgataccgct cgataccccg cagaggttcc 7920
gtgttgttta tatgagcatc acccgtcttt cggataacgg gtattacacc gttcctagaa 7980
gaatgctgga attcagatcg gtcaatgcag tggccttcaa cctgctggtg acccttagga 8040
ttgacaaggc gataggccct gggaagatca tcgacaatac agagcaactt cctgaggcaa 8100
catttatggt ccacatcggg aacttcagga gaaagaagag tgaagtctac tctgccgatt 8160
attgcaaaat gaaaatcgaa aagatgggcc tggtttttgc acttggtggg atagggggca 8220
ccagtcttca cattagaagc acaggcaaaa tgagcaagac tctccatgca caactcgggt 8280
tcaagaagac cttatgttac ccgctgatgg atatcaatga agaccttaat cgattactct 8340
ggaggagcag atgcaagata gtaagaatcc aggcagtttt gcagccatca gttcctcaag 8400
aattccgcat ttacgacgac gtgatcataa atgatgacca aggactattc aaagttctgt 8460
agaccgtagt gcccagcaat gcccgaaaac gacccccctc acaatgacag ccagaaggcc 8520
cggacaaaaa agccccctcc gaaagactcc acggaccaag cgagaggcca gccagcagcc 8580
gacggcaagc gcgaacacca ggcggcccca gcacagaaca gccctgacac aaggccacca 8640
ccagccaccc caatctgcat cctcctcgtg ggacccccga ggaccaaccc ccaaggctgc 8700
ccccgatcca aaccaccaac cgcatcccca ccacccccgg gaaagaaacc cccagcaatt 8760
ggaaggcccc tccccctctt cctcaacaca agaactccac aaccgaaccg cacaagcgac 8820
cgaggtgacc caaccgcagg catccgactc cctagacaga tcctctctcc ccggcaaact 8880
aaacaaaact tagggccaag gaacatacac acccaacaga acccagaccc cggcccacgg 8940
cgccgcgccc ccaacccccg acaaccagag ggagccccca accaatcccg ccggctcccc 9000
cggtgcccac aggcagggac accaaccccc gaacagaccc agcacccaac catcgacaat 9060
ccaagacggg ggggcccccc caaaaaaagg cccccagggg ccgacagcca gcaccgcgag 9120
gaagcccacc caccccacac acgaccacgg caaccaaacc agaacccaga ccaccctggg 9180
ccaccagctc ccagactcgg ccatcacccc gcagaaagga aaggccacaa cccgcgcacc 9240
ccagccccga tccggcgggg agccacccaa cccgaaccag cacccaagag cgatccccga 9300
aggacccccg aaccgcaaag gacatcagta tcccacagcc tctccaagtc ccccggtctc 9360
ctcctcttct cgaagggacc aaaagatcaa tccaccacac ccgacgacac tcaactcccc 9420
acccctaaag gagacaccgg gaatcccaga atcaagactc atccaatgtc catcatgggt 9480
ctcaaggtga acgtctctgc catattcatg gcagtactgt taactctcca aacacccacc 9540
ggtcaaatcc attggggcaa tctctctaag ataggggtgg taggaatagg aagtgcaagc 9600
tacaaagtta tgactcgttc cagccatcaa tcattagtca taaaattaat gcccaatata 9660
actctcctca ataactgcac gagggtagag attgcagaat acaggagact actgagaaca 9720
gttttggaac caattagaga tgcacttaat gcaatgaccc agaatataag accggttcag 9780
agtgtagctt caagtaggag acacaagaga tttgcgggag tagtcctggc aggtgcggcc 9840
ctaggcgttg ccacagctgc tcagataaca gccggcattg cacttcacca gtccatgctg 9900
aactctcaag ccatcgacaa tctgagagcg agcctggaaa ctactaatca ggcaattgag 9960
acaatcagac aagcagggca ggagatgata ttggctgttc agggtgtcca agactacatc 10020
aataatgagc tgataccgtc tatgaaccaa ctatcttgtg atttaatcgg ccagaagctc 10080
gggctcaaat tgctcagata ctatacagaa atcctgtcat tatttggccc cagtttacgg 10140
gaccccatat ctgcggagat atctatccag gctttgagct atgcgcttgg aggagacatc 10200
aataaggtgt tagaaaagct cggatacagt ggaggtgatt tactgggcat cttagagagc 10260
ggaggaataa aggcccggat aactcacgtc gacacagagt cctacttcat tgtcctcagt 10320
atagcctatc cgacgctgtc cgagattaag ggggtgattg tccaccggct agagggggtc 10380
tcgtacaaca taggctctca agagtggtat accactgtgc ccaagtatgt tgcaacccaa 10440
gggtacctta tctcgaattt tgatgagtca tcgtgtactt tcatgccaga ggggactgtg 10500
tgcagccaaa atgccttgta cccgatgagt cctctgctcc aagaatgcct ccgggggtac 10560
accaagtcct gtgctcgtac actcgtatcc gggtcttttg ggaaccggtt cattttatca 10620
caagggaacc taatagccaa ttgtgcatca atcctttgca agtgttacac aacaggaacg 10680
atcattaatc aagaccctga caagatccta acatacattg ctgccgatca ctgcccggta 10740
gtcgaggtga acggcgtgac catccaagtc gggagcagga ggtatccaga cgctgtgtac 10800
ttgcacagaa ttgacctcgg tcctcccata tcattggaga ggttggacgt agggacaaat 10860
ctggggaatg caattgctaa gttggaggat gccaaggaat tgttggagtc atcggaccag 10920
atattgagga gtatgaaagg tttatcgagc actagcatag tctacatcct gattgcagtg 10980
tgtcttggag ggttgatagg gatccccgct ttaatatgtt gctgcagggg gcgttgtaac 11040
aaaaagggag aacaagttgg tatgtcaaga ccaggcctaa agcctgatct tacgggaaca 11100
tcaaaatcct atgtaaggtc gctctgatcc tctacaactc ttgaaacaca aatgtcccac 11160
aagtctcctc ttcgtcatca agcaaccacc gcacccagca tcaagcccac ctgaaattat 11220
ctccggcttc cctctggccg aacaatatcg gtagttaatc aaaacttagg gtgcaagatc 11280
atccacaatg tcaccacaac gagaccggat aaatgccttc tacaaagata acccccatcc 11340
caagggaagt aggatagtca ttaacagaga acatcttatg attgatagac cttatgtttt 11400
gctggctgtt ctgtttgtca tgtttctgag cttgatcggg ttgctagcca ttgcaggcat 11460
tagacttcat cgggcagcca tctacaccgc agagatccat aaaagcctca gcaccaatct 11520
agatgtaact aactcaatcg agcatcaggt caaggacgtg ctgacaccac tcttcaaaat 11580
catcggtgat gaagtgggcc tgaggacacc tcagagattc actgacctag tgaaattaat 11640
ctctgacaag attaaattcc ttaatccgga tagggagtac gacttcagag atctcacttg 11700
gtgtatcaac ccgccagaga gaatcaaatt ggattatgat caatactgtg cagatgtggc 11760
tgctgaagag ctcatgaatg cattggtgaa ctcaactcta ctggagacca gaacaaccaa 11820
tcagttccta gctgtctcaa agggaaactg ctcagggccc actacaatca gaggtcaatt 11880
ctcaaacatg tcgctgtccc tgttagactt gtatttaggt cgaggttaca atgtgtcatc 11940
tatagtcact atgacatccc agggaatgta tgggggaact tacctagtgg aaaagcctaa 12000
tctgagcagc aaaaggtcag agttgtcaca actgagcatg taccgagtgt ttgaagtagg 12060
tgttatcaga aatccgggtt tgggggctcc ggtgttccat atgacaaact atcttgagca 12120
accagtcagt aatgatctca gcaactgtat ggtggctttg ggggagctca aactcgcagc 12180
cctttgtcac ggggaagatt ctatcacaat tccctatcag ggatcaggga aaggtgtcag 12240
cttccagctc gtcaagctag gtgtctggaa atccccaacc gacatgcaat cctgggtccc 12300
cttatcaacg gatgatccag tgatagacag gctttacctc tcatctcaca gaggtgttat 12360
cgctgacaat caagcaaaat gggctgtccc gacaacacga acagatgaca agttgcgaat 12420
ggagacatgc ttccaacagg cgtgtaaggg taaaatccaa gcactctgcg agaatcccga 12480
gtgggcacca ttgaaggata acaggattcc ttcatacggg gtcttgtctg ttgatctgag 12540
tctgacagtt gagcttaaaa tcaaaattgc ttcgggattc gggccattga tcacacacgg 12600
ttcagggatg gacctataca aatccaacca caacaatgtg tattggctga ctatcccgcc 12660
aatgaagaac ctagccttag gtgtaatcaa cacattggag tggataccga gattcaaggt 12720
tagtccctac ctcttcactg tcccaattaa ggaagcaggc gaagactgcc atgccccaac 12780
atacctacct gcggaggtgg atggtgatgt caaactcagt tccaatctgg tgattctacc 12840
tggtcaagat ctccaatatg ttttggcaac ctacgatact tccagggttg aacatgctgt 12900
ggtttattac gtttacagcc caagccgctc attttcttac ttttatcctt ttaggttgcc 12960
tataaagggg gtccccatcg aattacaagt ggaatgcttc acatgggacc aaaaactctg 13020
gtgccgtcac ttctgtgtgc ttgcggactc agaatctggt ggacatatca ctcactctgg 13080
gatggtgggc atgggagtca gctgcacagt cacccgggaa gatggaacca atcgcagata 13140
gggctgctag tgaaccaatc acatgatgtc acccagacat caggcatacc cactagtgtg 13200
aaatagacat cagaattaag aaaaacgtag ggtccaagtg gttccccgtt atggactcgc 13260
tatctgtcaa ccagatctta taccctgaag ttcacctaga tagcccgata gttaccaata 13320
agatagtagc catcctggag tatgctcgag tccctcacgc ttacagcctg gaggacccta 13380
cactgtgtca gaacatcaag caccgcctaa aaaacggatt ttccaaccaa atgattataa 13440
acaatgtgga agttgggaat gtcatcaagt ccaagcttag gagttatccg gcccactctc 13500
atattccata tccaaattgt aatcaggatt tatttaacat agaagacaaa gagtcaacga 13560
ggaagatccg tgaactcctc aaaaagggga attcgctgta ctccaaagtc agtgataagg 13620
ttttccaatg cttaagggac actaactcac ggcttggcct aggctccgaa ttgagggagg 13680
acatcaagga gaaagttatt aacttgggag tttacatgca cagctcccag tggtttgagc 13740
cctttctgtt ttggtttaca gtcaagactg agatgaggtc agtgattaaa tcacaaaccc 13800
atacttgcca taggaggaga cacacacctg tattcttcac tggtagttca gttgagttgc 13860
taatctctcg tgaccttgtt gctataatca gtaaagagtc tcaacatgta tattacctga 13920
catttgaact ggttttgatg tattgtgatg tcatagaggg gaggttaatg acagagaccg 13980
ctatgactat tgatgctagg tatacagagc ttctaggaag agtcagatac atgtggaaac 14040
tgatagatgg tttcttccct gcactcggga atccaactta tcaaattgta gccatgctgg 14100
agcctctttc acttgcttac ctgcagctga gggatataac agtagaactc agaggtgctt 14160
tccttaacca ctgctttact gaaatacatg atgttcttga ccaaaacggg ttttctgatg 14220
aaggtactta tcatgagtta actgaagctc tagattacat tttcataact gatgacatac 14280
atctgacagg ggagattttc tcatttttca gaagtttcgg ccaccccaga cttgaagcag 14340
taacggctgc tgaaaatgtt aggaaataca tgaatcagcc taaagtcatt gtgtatgaga 14400
ctctgatgaa aggtcatgcc atattttgtg gaatcataat caacggctat cgtgacaggc 14460
acggaggcag ttggccaccg ctgaccctcc ccctgcatgc tgcagacaca atccggaatg 14520
ctcaagcttc aggtgaaggg ttaacacatg agcagtgcgt tgataactgg aaatcttttg 14580
ctggagtgaa atttggctgc tttatgcctc ttagcctgga tagtgatctg acaatgtacc 14640
taaaggacaa ggcacttgct gctctccaaa gggaatggga ttcagtttac ccgaaagagt 14700
tcctgcgtta cgaccctccc aagggaaccg ggtcacggag gcttgtagat gttttcctta 14760
atgattcgag ctttgaccca tatgatgtga taatgtatgt tgtaagtgga gcttacctcc 14820
atgaccctga gttcaacctg tcttacagcc tgaaagaaaa ggagatcaag gaaacaggta 14880
gactttttgc taaaatgact tacaaaatga gggcatgcca agtgattgct gaaaatctaa 14940
tctcaaacgg gattggcaaa tattttaagg acaatgggat ggccaaggat gagcacgatt 15000
tgactaaggc actccacact ctagctgtct caggagtccc caaagatctc aaagaaagtc 15060
acaggggggg gccagtctta aaaacctact cccgaagccc agtccacaca agtaccagga 15120
acgtgagagc agcaaaaggg tttatagggt tccctcaagt aattcggcag gaccaagaca 15180
ctgatcatcc ggagaatatg gaagcttacg agacagtcag tgcatttatc acgactgatc 15240
tcaagaagta ctgccttaat tggagatatg agaccatcag cttgtttgca cagaggctaa 15300
atgagattta cggattgccc tcatttttcc agtggctgca taagaggctt gagacctctg 15360
tcctgtatgt aagtgaccct cattgccccc ccgaccttga cgcccatatc ccgttatata 15420
aagtccccaa tgatcaaatc ttcattaagt accctatggg aggtatagaa gggtattgtc 15480
agaagctgtg gaccatcagc accattccct atctatacct ggctgcttat gagagcggag 15540
taaggattgc ttcgttagtg caaggggaca atcagaccat agccgtaaca aaaagggtac 15600
ccagcacatg gccctacaac cttaagaaac gggaagctgc tagagtaact agagattact 15660
ttgtaattct taggcaaagg ctacatgata ttggccatca cctcaaggca aatgagacaa 15720
ttgtttcatc acattttttt gtctattcaa aaggaatata ttatgatggg ctacttgtgt 15780
cccaatcact caagagcatc gcaagatgtg tattctggtc agagactata gttgatgaaa 15840
caagggcagc atgcagtaat attgctacaa caatggctaa aagcatcgag agaggttatg 15900
accgttacct tgcatattcc ctgaacgtcc taaaagtgat acagcaaatt ctgatctctc 15960
ttggcttcac aatcaattca accatgaccc gggatgtagt catacccctc ctcacaaaca 16020
acgacctctt aataaggatg gcactgttgc ccgctcctat tggggggatg aattatctga 16080
atatgagcag gctgtttgtc agaaacatcg gtgatccagt aacatcatca attgctgatc 16140
tcaagagaat gattctcgcc tcactaatgc ctgaagagac cctccatcaa gtaatgacac 16200
aacaaccggg ggactcttca ttcctagact gggctagcga cccttactca gcaaatcttg 16260
tatgtgtcca gagcatcact agactcctca agaacataac tgcaaggttt gtcctgatcc 16320
atagtccaaa cccaatgtta aaaggattat tccatgatga cagtaaagaa gaggacgagg 16380
gactggcggc attcctcatg gacaggcata ttatagtacc tagggcagct catgaaatcc 16440
tggatcatag tgtcacaggg gcaagagagt ctattgcagg catgctggat accacaaaag 16500
gcttgattcg agccagcatg aggaaggggg ggttaacctc tcgagtgata accagattgt 16560
ccaattatga ctatgaacaa ttcagagcag ggatggtgct attgacagga agaaagagaa 16620
atgtcctcat tgacaaagag tcatgttcag tgcagctggc gagagctcta agaagccata 16680
tgtgggcgag gctagctcga ggacggccta tttacggcct tgaggtccct gatgtactag 16740
aatctatgcg aggccacctt attcggcgtc atgagacatg tgtcatctgc gagtgtggat 16800
cagtcaacta cggatggttt tttgtcccct cgggttgcca actggatgat attgacaagg 16860
aaacatcatc cttgagagtc ccatatattg gttctaccac tgatgagaga acagacatga 16920
agcttgcctt cgtaagagcc ccaagtcgat ccttgcgatc tgctgttaga atagcaacag 16980
tgtactcatg ggcttacggt gatgatgata gctcttggaa cgaagcctgg ttgttggcta 17040
ggcaaagggc caatgtgagc ctggaggagc taagggtgat cactcccatc tcaacttcga 17100
ctaatttagc gcataggttg agggatcgta gcactcaagt gaaatactca ggtacatccc 17160
ttgtccgagt ggcgaggtat accacaatct ccaacgacaa tctctcattt gtcatatcag 17220
ataagaaggt tgatactaac tttatatacc aacaaggaat gcttctaggg ttgggtgttt 17280
tagaaacatt gtttcgactc gagaaagata ccggatcatc taacacggta ttacatcttc 17340
acgtcgaaac agattgttgc gtgatcccga tgatagatca tcccaggata cccagctccc 17400
gcaagctaga gctgagggca gagctatgta ccaacccatt gatatatgat aatgcacctt 17460
taattgacag agatgcaaca aggctataca cccagagcca taggaggcac cttgtggaat 17520
ttgttacatg gtccacaccc caactatatc acattttagc taagtccaca gcactatcta 17580
tgattgacct ggtaacaaaa tttgagaagg accatatgaa tgaaatttca gctctcatag 17640
gggatgacga tatcaatagt ttcataactg agtttctgct catagagcca agattattca 17700
ctatctactt gggccagtgt gcggccatca attgggcatt tgatgtacat tatcatagac 17760
catcagggaa atatcagatg ggtgagctgt tgtcatcgtt cctttctaga atgagcaaag 17820
gagtgtttaa ggtgcttgtc aatgctctaa gccacccaaa gatctacaag aaattctggc 17880
attgtggtat tatagagcct atccatggtc cttcacttga tgctcaaaac ttgcacacaa 17940
ctgtgtgcaa catggtttac acatgctata tgacctacct cgacctgttg ttgaatgaag 18000
agttagaaga gttcacattt ctcttgtgtg aaagcgacga ggatgtagta ccggacagat 18060
tcgacaacat ccaggcaaaa cacttatgtg ttctggcaga tttgtactgt caaccaggga 18120
cctgcccacc aattcgaggt ctaagaccgg tagagaaatg tgcagttcta accgaccata 18180
tcaaggcaga ggctatgtta tctccagcag gatcttcgtg gaacataaat ccaattattg 18240
tagaccatta ctcatgctct ctgacttatc tccggcgagg atcgatcaaa cagataagat 18300
tgagagttga tccaggattc attttcgacg ccctcgctga ggtaaatgtc agtcagccaa 18360
agatcggcag caacaacatc tcaaatatga gcatcaaggc tttcagaccc ccacacgatg 18420
atgttgcaaa attgctcaaa gatatcaaca caagcaagca caatcttccc atttcagggg 18480
gcaatctcgc caattatgaa atccatgctt tccgcagaat cgggttgaac tcatctgctt 18540
gctacaaagc tgttgagata tcaacattaa ttaggagatg ccttgagcca ggggaggacg 18600
gcttgttctt gggtgaggga tcgggttcta tgttgatcac ttataaagag atacttaaac 18660
taaacaagtg cttctataat agtggggttt ccgccaattc tagatctggt caaagggaat 18720
tagcacccta tccctccgaa gttggccttg tcgaacacag aatgggagta ggtaatattg 18780
tcaaagtgct ctttaacggg aggcccgaag tcacgtgggt aggcagtgta gattgcttca 18840
atttcatagt tagtaatatc cctacctcta gtgtggggtt tatccattca gatatagaga 18900
ccttgcctga caaagatact atagagaagc tagaggaatt ggcagccatc ttatcgatgg 18960
ctctgctcct gggcaaaata ggatcaatac tggtgattaa gcttatgcct ttcagcgggg 19020
attttgttca gggatttata agttatgtag ggtctcatta tagagaagtg aaccttgtat 19080
accctagata cagcaacttc atctctactg aatcttattt ggttatgaca gatctcaagg 19140
ctaaccggct aatgaatcct gaaaagatta agcagcagat aattgaatca tctgtgagga 19200
cttcacctgg acttataggt cacatcctat ccattaagca actaagctgc atacaagcaa 19260
ttgtgggaga cgcagttagt agaggtgata tcaatcctac tctgaaaaaa cttacaccta 19320
tagagcaggt gctgatcaat tgcgggttgg caattaacgg acctaagctg tgcaaagaat 19380
tgatccacca tgatgttgcc tcagggcaag atggattgct taattctata ctcatcctct 19440
acagggagtt ggcaagattc aaagacaacc aaagaagtca acaagggatg ttccacgctt 19500
accccgtatt ggtaagtagc aggcaacgag aacttatatc taggatcacc cgcaaattct 19560
gggggcacat tcttctttac tccgggaaca aaaagttgat aaataagttt atccagaatc 19620
tcaagtccgg ctatctgata ctagacttac accagaatat cttcgttaag aatctatcca 19680
agtcagagaa acagattatt atgacggggg gtttgaaacg tgagtgggtt tttaaggtaa 19740
cagtcaagga gaccaaagaa tggtataagt tagtcggata cagtgccctg attaaggact 19800
aattggttga actccggaac cctaatcctg ccctaggtgg ttaggcatta tttgcaatat 19860
attaaagaaa actttgaaaa tacgaagttt ctattcccag ctttgtctgg tggccggcat 19920
ggtcccagcc tcctcgctgg cgccggctgg gcaacattcc gaggggaccg tcccctcggt 19980
aatggcgaat gggacgcggc cgatccggct gctaacaaag cccgaaagga agctgagttg 20040
gctgctgcca ccgctgagca ataactagca taaccccttg gggcctctaa acgggtcttg 20100
aggggttttt tgctgaaagg aggaactata tccggatgcg gccgcgggcc ctatggtacc 20160
cagcttttgt tccctttagt gagggttaat tccgagcttg gcgtaatcat ggtcatagct 20220
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacataggag ccggaagcat 20280
aaagtgtaaa gcctggggtg cctaatgagt gaggtaactc acattaattg cgttgcgctc 20340
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 20400
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 20460
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 20520
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 20580
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctcggcc cccctgacga 20640
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 20700
ccaggcgttc ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 20760
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 20820
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 20880
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 20940
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 21000
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 21060
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 21120
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 21180
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 21240
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 21300
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 21360
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 21420
tcgttcatcc atagttgcct gactgcccgt cgtgtagata actacgatac gggagggctt 21480
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 21540
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 21600
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 21660
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 21720
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 21780
gtgaaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 21840
agtgttatca ctcatgctta tggcagcact gcataattct cttactgtca tgccatccgt 21900
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 21960
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 22020
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 22080
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 22140
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 22200
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 22260
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 22320
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa 22380
tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 22440
cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt 22500
tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa 22560
aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg 22620
gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg 22680
acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc 22740
tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa 22800
tgcgccgcta cagggcgcgt cccatt 22826
<210> 149
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> Endoplasmic reticulum retrieval signal (ERRS) motif
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occuring amino acid
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa can be any naturally occuring amino acid
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occuring amino acid
<400> 149
Lys Xaa His Xaa Xaa
1 5
<210> 150
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> KLHYT motif
<400> 150
Lys Leu His Tyr Thr
1 5
Claims (63)
- 핵산 작제물로서:
(1) 홍역 바이러스(MV)의 약독화된 균주의 전장, 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 제1 이종 폴리뉴클레오티드로서,
(a) 서열번호 3의 SARS-CoV-2의 스파이크(S) 단백질, 또는
(b) 서열번호 11의 S1 폴리펩티드, 서열번호 13의 S2 폴리펩티드, 서열번호 7의 Secto 폴리펩티드, 및 서열번호 16의 tri-Secto 폴리펩티드로 이루어진 군으로부터 선택된 (a)의 전장 S 단백질의 면역원성 단편, 또는
(c) 1 내지 10개의 아미노산이 삽입, 치환 또는 결실에 의해 변형되어 있는 (a) 또는 (b)의 변이체,
를 암호화하는 제1 이종 폴리뉴클레오티드;
를 포함하는, 핵산 작제물. - 제1항에 있어서,
상기 (c)의 변이체는:
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이, 및/또는
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이, 및/또는
(iii) 소포체 검색 신호(EERS)를 불활성화하는 돌연변이, 및/또는
(iv) S 단백질의 S1 도메인에 국한된 수용체-결합 도메인(RBD)을 폐쇄 형태로 유지하는 돌연변이,를 포함하는 폴리펩티드를 암호화하며,
상기 제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 하류에 위치한 ATU에 위치하는, 핵산 작제물. - 제2항에 있어서,
(i) 발현된 전장 S 단백질을 이의 융합전 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 986 및 987(K986P 및 V987P)에 있는 2개의 프롤린 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 817, 892, 899, 942, 986 및 987(F817P, A892P, A899P, A942P, K986P 및 V987P)에서 6개의 프롤린 잔기의 치환에 의한 돌연변이이고, 및/또는
(ii) S 단백질의 푸린 절단 부위를 불활성화시키는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 682, 683 및 685(R682G, R683S 및 R685G)에서의 S1/S2 푸린 절단 부위에서 발생하는 3개의 아미노산 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 위치 675에서의 아미노산과 위치 685 에서의 아미노산 사이의 아미노산 사이에 S1/S2 푸린 절단 부위를 포함하고 서열번호 50의 아미노산 서열 QTQTNSPRRAR로 이루어진 루프의 결실에 의한 돌연변이이고, 및/또는
(iii) EERS를 불활성화시키는 돌연변이는 서열번호 3의 아미노산 서열의 위치 1269 및 1271에서의 2개의 알라닌 잔기의 치환에 의한 돌연변이이고, 및/또는
(iv) S 단백질의 S1 도메인에 국한된 RBD를 폐쇄 형태로 유지하는 돌연변이는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 383 및 985(S383C 및 D985C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이, 또는 서열번호 3의 SARS-CoV-2의 S 단백질의 아미노산 서열의 위치 413 및 987(G413C 및 P987C)에서 2개의 시스테인 잔기의 치환에 의한 돌연변이이고, 및/또는
(v) (c)의 변이체는, 서열번호 3의 아미노산 서열의 위치 69 및 70의 아미노산 잔기의 결실, 서열번호 3의 아미노산 서열의 위치 144 및 145의 아미노산 잔기의 결실로 이루어진 군에서 선택되는 돌연변이, 서열번호 3의 아미노산 서열의 위치 501의 티로신 잔기의 치환에 의한 돌연변이(N501Y), 서열번호 3의 아미노산 서열의 위치 570의 아스파라긴산 잔기의 치환에 의한 돌연변이(A570D), 서열번호 3의 아미노산 서열의 위치 681의 히스티딘 잔기의 치환에 의한 돌연변이(P681H), 서열번호 3의 아미노산 서열의 위치 716의 이소류신 잔기의 치환에 의한 돌연변이(T716I), 서열번호 3의 아미노산 서열의 위치 982의 알라닌 잔기의 치환에 의한 돌연변이(S982A), 서열번호 3의 아미노산 서열의 위치 1118의 히스티딘 잔기의 치환에 의한 돌연변이(D1118H), 서열번호 3의 아미노산 서열의 위치 484의 라이신 잔기의 치환에 의한 돌연변이(E484K), 서열번호 3의 아미노산 서열의 위치 417의 아스파라긴 잔기의 치환에 의한 돌연변이(K417N), 서열번호 3의 아미노산 서열의 위치 417의 트레오닌 잔기의 치환에 의한 돌연변이(K417T), 및 서열번호 3의 아미노산 서열의 위치 614의 글리신 잔기의 치환에 의한 변이(D614G)를 포함하는 폴리펩티드를 암호화하는, 핵산 작제물. - 제1항 내지 제3항 중 어느 한 항에 있어서,
뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 3A 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체, 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물. - 제1항 내지 제4항 중 어느 한 항에 있어서,
상기 제1 이종 폴리뉴클레오티드는 서열번호 5, 7, 9, 15, 17, 19, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 폴리펩티드를 암호화하는, 핵산 작제물. - 제4항에 있어서,
상기 제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인(endodomain), 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하는, 핵산 작제물. - 제1항 내지 제6항 중 어느 한 항에 있어서,
상기 제1 이종 폴리뉴클레오티드가 하기로 이루어진 군으로부터 선택된 오픈 리딩 프레임을 갖는, 핵산 작제물:
i. S 폴리펩티드를 암호화하는 서열번호 1 또는 2 또는 36,
ii. S1 폴리펩티드를 암호화하는 서열번호 10,
iii. S2 폴리펩티드를 암호화하는 서열번호 12,
iv. stab-S 폴리펩티드(S2P)를 암호화하는 서열번호 4,
v. Secto 폴리펩티드를 암호화하는 서열번호 6,
vi. stab-Secto 폴리펩티드를 암호화하는 서열번호 8,
vii. stab-S2 폴리펩티드를 암호화하는 서열번호 14,
ⅷ. tri-Secto 폴리펩티드를 암호화하는 서열번호 16,
ix. tristab-Secto 폴리펩티드를 암호화하는 서열번호 18,
x. S3F 폴리펩티를 암호화하는 서열번호 42,
xi. S2P3F 폴리펩티드를 암호화하는 서열번호 44,
xii. S2PΔF 폴리펩티드를 암호화하는 서열번호 46,
xiii. S2PΔF2A 폴리펩티드를 암호화하는 서열번호 48,
xiv. T4-S2P3F 폴리펩티드(tristab-Secto-3F)를 암호화하는 서열번호 51,
xv. S6P 폴리펩티드를 암호화하는 서열번호 53,
xvi. S6P3F 폴리펩티드를 암호화하는 서열번호 55,
xvii. S6PΔF 폴리펩티드를 암호화하는 서열번호 57,
xviii. SCCPP 폴리펩티드를 암호화하는 서열번호 59,
xix. SCC6P 폴리펩티드를 암호화하는 서열번호 61,
xx. SMVopt2P 폴리펩티드를 암호화하는 서열번호 63,
xxi. SMVoptΔF 폴리펩티드를 암호화하는 서열번호 64, 및
xxii. SMVopt2PΔF 폴리펩티드를 암호화하는 서열번호 66. - 제1항 내지 제7항 중 어느 한 항에 있어서,
5'에서 3' 말단 방향으로 오픈 리딩 프레임을 암호화하는 다음의 폴리뉴클레오티드를 포함하는 cDNA 작제물인, 핵산 작제물:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열과 같은 전사 조절 요소 및 바이러스 복제의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성(framed)되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위에 의해 구성됨(framed). - 제1항 내지 제8항 중 어느 한 항에 있어서,
(a) 약독화된 MV 백신 균주, 특히 Schwarz 균주 또는 Moraten 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
(b) 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 재조합 MV-CoV 핵산 분자의 3'-말단에 있는 리보자임의 뉴클레오티드 서열, 특히 델타 간염 바이러스 리보자임(δ)의 서열,
을 추가로 포함하는, 핵산 작제물. - 제4항 내지 제9항 중 어느 한 항에 있어서,
상기 제2 이종 폴리뉴클레오티드는 SARS-CoV-2의 N 폴리펩티드를 암호화하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드를 클로닝하는데 사용된 ATU와 다른 위치의 ATU에서 클로닝되는, 핵산 작제물. - 제1항 내지 제10항 중 어느 한 항에 있어서,
(i) 제1 이종 폴리뉴클레오티드는 서열번호 36, 서열번호 63, 서열번호 64 및 서열번호 66으로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU2 내에 위치되거나, 또는
(ii) 제1 이종 폴리뉴클레오티드는 서열번호 2, 서열번호 4, 서열번호 44, 서열번호 46, 서열번호 48, 서열번호 51, 서열번호 53, 서열번호 55, 서열번호 57, 서열번호 59 및 서열번호 61로 이루어진 군으로부터 선택되는 서열을 포함하고, ATU3 내에 위치되는, 핵산 작제물. - 제4항 내지 제10항 중 어느 한 항에 있어서,
(i) 제1 이종 폴리뉴클레오티드는 ATU3 내에 위치되고, 제2 이종 폴리뉴클레오티드는 ATU2 내에 위치되거나, 또는
(ii) 제1 이종 폴리뉴클레오티드는 ATU2 내에 위치되고, 제2 이종 폴리뉴클레오티드는 ATU3 내에 위치되는, 핵산 작제물. - 제1항 내지 제12항 중 어느 한 항에 있어서,
홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주인, 핵산 작제물. - 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물을 포함하는, 재조합 홍역 바이러스(MV)의 구출(rescue)를 위한 전달 벡터.
- 하기로 이루어진 군으로부터 선택된 SARS-CoV-2의 폴리펩티드를 암호화하는 서열을 포함하는, 전달 벡터:
i. 서열번호 1 또는 2 또는 36 (작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii. 서열번호 16 (작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii. 서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii. 서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii. 서열번호 64 (작제물 SMVoptΔF), 및
xxiii. 서열번호 66 (작제물 SMVopt2PΔF). - Schwarz 균주의 재조합 홍역 바이러스로서, 이의 게놈에 이에 작동가능하게 연결된 발현 카세트를 포함하고, 상기 발현 카세트는 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물을 포함하는, 재조합 홍역 바이러스.
- 제16항에 있어서,
SARS-CoV-2 균주의 N, M, E, ORF7a, ORF8 및 ORF3a, 및 이의 면역원성 단편으로부터 선택되는 적어도 하나의 폴리펩티드를 추가로 발현하는, 재조합 홍역 바이러스. - 면역원성 조성물 또는 백신으로서,
(i) 유효 용량의 제16항 또는 제17항에 따른 재조합 홍역 바이러스, 및 (ii) 약학적으로 허용되는 비히클을 포함하고,
상기 조성물 또는 백신은 단일 면역화 후 동물 숙주에서 SARS-CoV-2의 폴리펩티드(들)에 대한 중화 체액 반응 및/또는 세포 반응을 유도하는, 면역원성 조성물 또는 백신. - 제18항에 있어서,
이를 필요로 하는 숙주에서 SARS-CoV-2에 대한 보호 체액성 면역 반응 및/또는 세포성 면역 반응을 유도하는데 사용되는, 면역원성 조성물 또는 백신. - 제1항 내지 제3항, 제4항 및 제6항 중 어느 한 항에 정의된 바와 같은 SARS-CoV-2의 제1 이종 폴리뉴클레오티드에 의해 암호화되는 SARS-CoV-2의 폴리펩티드를 발현하는 재조합 홍역 바이러스를 구출(rescuing)하는 방법으로서,
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를 (i) 제1항 내지 제13항 중 어느 한 항에 따른 핵산 작제물 또는 제13항 또는 제14항에 따른 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계;
(d) 재조합 홍역 바이러스를 수확하는 단계;를 포함하는, 방법. - 하기로 이루어진 군으로부터 선택된 폴리뉴클레오티드를 포함하는 핵산 분자:
i. 서열번호 1 또는 2 또는 36 (작제물 S);
ii. 서열번호 4 (작제물 stab-S);
iii. 서열번호 6 (작제물 Secto);
iv. 서열번호 8 (작제물 stab-Secto);
v. 서열번호 10 (작제물 S1),
vi. 서열번호 12 (작제물 S2),
vii. 서열번호 14 (작제물 stab-S2),
viii. 서열번호 16 (작제물 tri-Secto),
ix. 서열번호 18 (작제물 tristab-Secto),
x. 서열번호 42 (작제물 S3F),
xi. 서열번호 44 (작제물 S2P3F),
xii. 서열번호 46 (작제물 S2PΔF),
xiii. 서열번호 48 (작제물 S2PΔF2A),
xiv. 서열번호 21 또는 37 (작제물 N),
xv. 서열번호 51 (작제물 T4-S2P3F(tristab-Secto-3F)),
xvi. 서열번호 53 (작제물 S6P),
xvii. 서열번호 55 (작제물 S6P3F),
xviii. 서열번호 57 (작제물 S6PΔF),
xix. 서열번호 59 (작제물 SCCPP),
xx. 서열번호 61 (작제물 SCC6P),
xxi. 서열번호 63 (작제물 SMVopt2P),
xxii. 서열번호 64 (작제물 SMVoptΔF), 및
xxiii. 서열번호 66 (작제물 SMVopt2PΔF). - 하기로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는 폴리펩티드:
i. 서열번호 3 (작제물 S);
ii. 서열번호 5 (작제물 stab-S);
iii. 서열번호 7 (작제물 Secto);
iv. 서열번호 9 (작제물 stab-Secto);
v. 서열번호 11 (작제물 S1),
vi. 서열번호 13 (작제물 S2),
vii. 서열번호 15 (작제물 stab-S2),
viii. 서열번호 17 (작제물 tri-Secto),
ix. 서열번호 19 (작제물 tristab-Secto),
x. 서열번호 43 (작제물 S3F),
xi. 서열번호 45 (작제물 S2P3F),
xii. 서열번호 47 (작제물 S2PΔF),
xiii. 서열번호 49 (작제물 S2PΔF2A),
xiv. 서열번호 22 (작제물 N),
xv. 서열번호 52 (작제물 T4-S2P3F (tristab-Secto-3F)),
xvi. 서열번호 54 (작제물 S6P),
xvii. 서열번호 56 (작제물 S6P3F),
xviii. 서열번호 58 (작제물 S6PΔF),
xix. 서열번호 60 (작제물 SCCPP),
xx. 서열번호 62 (작제물 SCC6P), 및
xxi. 서열번호 65 (작제물 SMVoptΔF). - 제14항 또는 제15항에 따른 전달 벡터에 의해 발현되는 재조합 단백질로서, 정제를 위한 아미노산 태그를 추가로 포함하는, 재조합 단백질.
- 제14항 또는 제15항에 따른 전달 벡터에 의해 시험관내 또는 생체내에서 발현되는, 재조합 단백질.
- SARS-CoV-2 감염이 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 서열번호 3, 5, 7, 9, 11, 13, 15, 17, 19, 22, 23, 24, 25, 26, 27, 43, 45, 47, 49, 52, 54, 56, 58, 60, 62 및 65 중 어느 하나의 서열을 갖는 항원의 시험관내 용도로서, 폴리펩티드가 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉되는, 용도.
- 인간 숙주에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법으로서, 제18항에 따른 면역원성 조성물 또는 백신을 숙주에 투여하는 것을 포함하는, 방법.
- 숙주에서 SARS-CoV-2에 대한 보호 면역 반응을 유도하는 방법으로서, 제18항에 따른 면역원성 조성물 또는 백신을 숙주에 투여하는 것을 포함하는, 방법.
- 제26항 또는 제27항에 있어서,
면역원성 조성물의 1차 투여 및 면역원성 조성물의 2차 투여를 포함하는, 방법. - 제28항에 있어서,
상기 2차 투여는 1차 투여 후 1 개월 내지 2개월 후에 수행되는, 방법. - 핵산 작제물로서,
(1) 홍역 바이러스(MV)의 약독화 균주의 전장 안티게놈(+) RNA 가닥을 암호화하는 cDNA 분자; 및
(2) 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 삽입, 치환 또는 결실을 포함하는 SARS-CoV-2의 S 단백질 또는 이의 면역원성 단편을 암호화하는 제1 이종 폴리뉴클레오티드로서, 삽입, 치환 또는 결실은 S 단백질 또는 이의 면역원성 단편의 세포 표면 발현을 증가시키는, 제1 이종 폴리뉴클레오티드;를 포함하며,
제1 이종 폴리뉴클레오티드는 MV(ATU2)의 P 유전자와 M 유전자 사이에 위치한 추가 전사 단위(ATU)에 위치하거나 또는 MV(ATU3)의 H 유전자의 3'에 위치한 ATU에 위치하는, 핵산 작제물. - 제30항에 있어서,
상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 치환을 포함하는, 핵산 작제물. - 제30항에 있어서,
상기 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 1263 내지 1273과 정렬된 S 단백질의 11개 아미노산 잔기 서열에서 전체 또는 부분의 결실을 포함하는, 핵산 작제물. - 제30항 내지 제32항 중 어느 한 항에 있어서,
암호화된 S 단백질 또는 이의 면역원성 단편은 발현된 S 단백질을 그의 융합전 형태로 유지하는 하나 이상의 추가 치환을 추가로 포함하는, 핵산 작제물. - 제33항에 있어서,
암호화된 S 단백질 또는 이의 면역원성 단편은 서열번호 3의 아미노산 서열의 위치 K986 및 V987에 상응하는 아미노산 위치에서 아미노산 치환 K986P 및 V987P를 추가로 포함하는, 핵산 작제물. - 제30항 내지 제34항 중 어느 한 항에 있어서,
암호화된 S 단백질 또는 이의 면역원성 단편은 이중 도메인 S 단백질인, 핵산 작제물. - 제30항 내지 제35항 중 어느 한 항에 있어서,
제1 이종 폴리뉴클레오티드는 ATU2에 위치되는, 핵산 작제물. - 제30항 내지 제36항 중 어느 한 항에 있어서,
제1 이종 폴리뉴클레오티드는:
(a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드, 또는 서열번호 76과 90% 이상의 동일성을 가지고 위치 986 및 987에서 변화한 이의 변이체; 또는
(b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드, 또는 서열번호 82와 90% 이상의 동일성을 가지고 위치 986, 987, 1269, 및 1271에서 변화한 이의 변이체;를 암호화하는, 핵산 작제물. - 제37항에 있어서,
제1 이종 폴리뉴클레오티드는,
(a) 서열번호 76의 융합전-안정화된 SF-2P-dER 폴리펩티드; 또는
(b) 서열번호 82의 융합전-안정화된 SF-2P-2a 폴리펩티드;를 암호화하는, 핵산 작제물. - 제38항에 있어서,
제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75, 또는 SF-2P-2a 폴리펩티드를 암호화하는 서열번호 81을 포함하는, 핵산 작제물. - 제39항에 있어서,
제1 이종 폴리뉴클레오티드는, SF-2P-dER 폴리펩티드를 암호화하는 서열번호 75를 포함하는, 핵산 작제물. - 제30항 내지 제40항 중 어느 한 항에 있어서,
뉴클레오캡시드(N) 폴리펩티드 또는 N 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 기질(matrix) (M) 폴리펩티드 또는 M 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; E 폴리펩티드 또는 E 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 8a 폴리펩티드 또는 8a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 7a 폴리펩티드 또는 7a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 3a 폴리펩티드 또는 3a 폴리펩티드와 적어도 90% 동일성을 갖는 이의 변이체; 및 이의 면역원성 단편으로 이루어진 군으로부터 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물. - 제30항 내지 제40항 중 어느 한 항에 있어서,
뉴클레오캡시드(N) 폴리펩티드; 기질 (M) 폴리펩티드; E 폴리펩티드; 8a 폴리펩티드; 7a 폴리펩티드; 3A 폴리펩티드; 및 이의 면역원성 단편으로 이루어진 군에서 선택된 SARS-CoV-2의 적어도 하나의 폴리펩티드를 암호화하는 제2 이종 폴리뉴클레오티드를 추가로 포함하고, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치되는, 핵산 작제물. - 제42항에 있어서,
제2 이종 폴리뉴클레오티드는 N 폴리펩티드를 암호화하고, 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가 전사 단위(ATU) 내에 위치되는, 핵산 작제물. - 제30항 내지 제40항 중 어느 한 항에 있어서,
제2 이종 폴리뉴클레오티드는 서열번호 22의 N 폴리펩티드, 서열번호 24의 M 폴리펩티드 또는 이의 엔도도메인, 서열번호 23의 E 폴리펩티드, 서열번호 25의 ORF8 폴리펩티드, 서열번호 27의 ORF7a 폴리펩티드, 및/또는 서열번호 26의 ORF3a 폴리펩티드 중 적어도 하나를 암호화하며, 상기 제2 이종 폴리뉴클레오티드는 제1 이종 폴리뉴클레오티드의 ATU와 상이한 위치에서 추가의 전사 단위(ATU) 내에 위치되는, 핵산 작제물. - 제41항 내지 제44항 중 어느 한 항에 있어서,
제2 이종 단백질은 MV의 N 유전자의 업스트림인 ATU(ATU1) 내부, MV의 P 및 M 유전자 사이의 ATU(ATU2), 또는 H 및 L 유전자 사이의 ATU(ATU3)에 위치되는, 핵산 작제물. - 제30항 내지 제45항 중 어느 한 항에 있어서,
5'에서 3' 방향으로 오픈 리딩 프레임을 암호화하는 다음의 폴리뉴클레오티드를 포함하는 핵산 작제물:
(a) MV의 N 단백질을 암호화하는 폴리뉴클레오티드;
(b) MV의 P 단백질을 암호화하는 폴리뉴클레오티드;
(c) 제1 이종 폴리뉴클레오티드;
(d) MV의 M 단백질을 암호화하는 폴리뉴클레오티드;
(e) MV의 F 단백질을 암호화하는 폴리뉴클레오티드;
(f) MV의 H 단백질을 암호화하는 폴리뉴클레오티드;
(g) MV의 L 단백질을 암호화하는 폴리뉴클레오티드;
여기서, 폴리뉴클레오티드는 핵산 작제물 내에서 작동 가능하게 연결되고, MV 리더 및 트레일러(trailer) 서열의 제어 하에 있으며, T7 프로모터 및 T7 터미네이터에 의해 구성되고, 재조합 MV-CoV 발현 카세트를 제공하도록 벡터에서의 클로닝에 적합한 제한 부위에 의해 구성됨. - 제30항 내지 제45항 중 어느 한 항에 있어서,
(a) 약독화된 MV 백신 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 첫 번째 뉴클레오티드에 인접한 것으로, 핵산 작제물의 5'-말단에서 해머헤드 리보자임 서열이 뒤따르는 GGG 모티프, 및
(b) 약독화된 MV 백신 균주의 전장 안티게놈 (+)RNA 가닥을 암호화하는 뉴클레오티드 서열의 마지막 뉴클레오티드에 인접한 것으로, 핵산 작제물의 3'-말단에서 델타 간염 바이러스 리보자임(δ)의 뉴클레오티드 서열,
을 추가로 포함하는, 핵산 작제물. - 제30항 내지 제47항 중 어느 한 항에 있어서,
홍역 바이러스는 Schwarz 균주, Zagreb 균주, AIK-C 균주, Moraten 균주, Philips 균주, Beckenham 4A 균주, Beckenham 16 균주, CAM-70 균주, TD 97 균주, Leningrad-16 균주, Shanghai 191 균주 및 Belgrade 균주로 이루어진 군으로부터 선택되는 약독화 바이러스 균주인, 핵산 작제물. - 제48항에 있어서,
홍역 바이러스는 Schwarz 균주인, 핵산 작제물. - 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물을 포함하는 플라스미드 벡터로서, 상기 플라스미드 벡터는 서열번호 29 또는 서열번호 38인, 플라스미드 벡터.
- 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물을 게놈에 포함하는 재조합 홍역 바이러스.
- 제51항에 따른 재조합 홍역 바이러스와 약학적으로 허용되는 비히클을 포함하는 면역원성 조성물.
- 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는데 사용하기 위한, 제51항에 따른 재조합 홍역 바이러스 또는 제52항에 따른 면역원성 조성물.
- 대상체에서 SARS-CoV-2에 의한 감염을 치료 또는 예방하는 방법으로서, 제52항에 따른 면역원성 조성물을 대상체에게 투여하는 것을 포함하는, 방법.
- 대상체에서 SARS-CoV-2 바이러스에 대한 면역 반응을 유도하는 방법으로서, 제52항에 따른 면역원성 조성물을 대상체에게 투여하는 것을 포함하는, 방법.
- 제54항 또는 제55항에 있어서,
면역원성 조성물의 1차 투여 및 면역원성 조성물의 2차 투여를 포함하는, 방법. - 제56항에 있어서,
2차 투여는 1차 투여 후 1 내지 2개월 후에 수행되는, 방법. - 제51항에 따른 재조합 홍역 바이러스를 구출(rescuing)하는 공정으로서:
(a) T7 RNA 폴리머라제 및 홍역 바이러스 N 및 P 단백질을 안정적으로 발현하는 헬퍼 세포를, (i) 제30항 내지 제49항 중 어느 한 항에 따른 핵산 작제물 또는 제50항에 따른 핵산 작제물을 포함하는 플라스미드 벡터, 및 (ii) MV L 폴리머라제를 암호화하는 벡터로 공동-형질감염하는 단계;
(b) 재조합 홍역 바이러스의 생산에 적합한 조건에서 형질감염된 헬퍼 세포를 유지하는 단계;
(c) 단계 (b)의 형질감염된 헬퍼 세포와 공동 배양하여 재조합 홍역 바이러스의 증식을 가능하게 하는 세포를 감염시키는 단계; 및
(d) 재조합 홍역 바이러스를 수확하는 단계;를 포함하는, 공정. - 서열번호 75 (작제물 SF-2P-dER) 또는 서열번호 81 (작제물 SF-2P-2a)의 폴리뉴클레오티드를 포함하는, 핵산 분자.
- 서열번호 76 (작제물 SF-2P-dER) 또는 서열번호 82 (작제물 SF-2P-2a)의 아미노산 서열을 갖는, 폴리펩티드.
- SARS-CoV-2에 의해 감염된 것으로 의심되는 개체로부터 이전에 얻은 생물학적 샘플에서 항원에 대한 항체의 존재를 검출하기 위한 제60항에 따른 폴리펩티드의 항원의 시험관내 용도로서, 상기 폴리펩티드는 항원에 대한 항체의 존재를 결정하기 위해 생물학적 샘플과 접촉되는, 용도.
- 생물학적 샘플을 제60항에 따른 폴리펩티드와 접촉시키고, 생물학적 샘플에 존재하는 항체와 폴리펩티드 사이의 항체-항원 복합체의 형성을 검출하는 것을 포함하는 방법.
- 제62항에 있어서,
생물학적 샘플은 SARS-CoV-2에 의해 감염된 것으로 의심되는 개체로부터 수득되는, 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062976083P | 2020-02-13 | 2020-02-13 | |
US62/976,083 | 2020-02-13 | ||
EP20305141.2A EP3865180A1 (en) | 2020-02-13 | 2020-02-13 | Live recombinant measles virus expressing coronavirus antigens - its use in eliciting immunity against coronaviruses |
EP20305141.2 | 2020-02-13 | ||
EP20305790 | 2020-07-08 | ||
EP20305790.6 | 2020-07-08 | ||
PCT/EP2021/053540 WO2021160850A1 (en) | 2020-02-13 | 2021-02-12 | Measles-vectored covid-19 immunogenic compositions and vaccines |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220141332A true KR20220141332A (ko) | 2022-10-19 |
Family
ID=77292795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227031638A KR20220141332A (ko) | 2020-02-13 | 2021-02-12 | 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230021583A1 (ko) |
EP (1) | EP4103282A1 (ko) |
JP (1) | JP2023513913A (ko) |
KR (1) | KR20220141332A (ko) |
CN (1) | CN116472279A (ko) |
AU (1) | AU2021218985A1 (ko) |
BR (1) | BR112022015764A2 (ko) |
CA (1) | CA3166811A1 (ko) |
MX (1) | MX2022009989A (ko) |
TW (1) | TW202146044A (ko) |
WO (1) | WO2021160850A1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11241493B2 (en) | 2020-02-04 | 2022-02-08 | Curevac Ag | Coronavirus vaccine |
US20240277830A1 (en) | 2020-02-04 | 2024-08-22 | CureVac SE | Coronavirus vaccine |
BR112022019781A2 (pt) | 2020-04-22 | 2022-12-13 | BioNTech SE | Vacina para o coronavírus |
WO2022092921A1 (ko) * | 2020-10-29 | 2022-05-05 | 에스케이바이오사이언스 주식회사 | 사스-코로나바이러스-2 항원을 포함하는 바이럴 벡터 및 이의 이용 |
KR20230164648A (ko) | 2020-12-22 | 2023-12-04 | 큐어백 에스이 | SARS-CoV-2 변이체에 대한 RNA 백신 |
US20240261392A1 (en) * | 2021-07-09 | 2024-08-08 | Atossa Therapeutics, Inc. | Compositions and methods to increase coronavirus immune response |
CN113470745B (zh) * | 2021-08-25 | 2023-09-08 | 南京立顶医疗科技有限公司 | SARS-CoV-2潜在突变位点的筛选方法及其应用 |
CN115960252A (zh) * | 2021-08-26 | 2023-04-14 | 江苏瑞科生物技术股份有限公司 | 新型冠状病毒免疫原性物质、其制备方法和应用 |
WO2023047348A1 (en) * | 2021-09-24 | 2023-03-30 | Janssen Pharmaceuticals, Inc. | Stabilized corona virus spike protein fusion proteins |
WO2023047349A1 (en) * | 2021-09-24 | 2023-03-30 | Janssen Pharmaceuticals, Inc. | Stabilized coronavirus spike protein fusion proteins |
WO2023122257A2 (en) * | 2021-12-22 | 2023-06-29 | La Jolla Institute For Immunology | Coronavirus spike glycoprotein with improved expression and stability |
CN116925195B (zh) * | 2022-04-22 | 2024-06-21 | 仁景(苏州)生物科技有限公司 | 一种基于新型冠状病毒的mRNA疫苗 |
WO2023244044A1 (ko) * | 2022-06-16 | 2023-12-21 | 연세대학교 산학협력단 | 변형된 코로나바이러스 스파이크 항원 단백질 및 이의 용도 |
WO2024002985A1 (en) | 2022-06-26 | 2024-01-04 | BioNTech SE | Coronavirus vaccine |
WO2024086575A1 (en) | 2022-10-17 | 2024-04-25 | BioNTech SE | Combination vaccines against coronavirus infection, influenza infection, and/or rsv infection |
CN115850399A (zh) * | 2022-12-13 | 2023-03-28 | 中山大学附属第七医院(深圳) | 一种热稳定刺突蛋白以及一种新型冠状病毒抗体检测试纸条 |
CN116785422B (zh) * | 2023-06-25 | 2024-05-28 | 中国医学科学院病原生物学研究所 | 含有新型冠状病毒联合抗原的麻疹减毒疫苗及其拯救方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK1375512T3 (da) * | 2002-06-20 | 2009-10-26 | Pasteur Institut | Infektiös cDNA af en godkendt vaccinestamme af mæslingevirus. Anvendelse til immunogene sammensætninger |
ES2423518T3 (es) | 2006-12-22 | 2013-09-20 | Institut Pasteur | Células y metodología para generar virus de ARN de cadena de sentido negativo no segmentada |
-
2021
- 2021-02-12 BR BR112022015764A patent/BR112022015764A2/pt not_active Application Discontinuation
- 2021-02-12 US US17/797,570 patent/US20230021583A1/en active Pending
- 2021-02-12 JP JP2022549011A patent/JP2023513913A/ja active Pending
- 2021-02-12 EP EP21703950.2A patent/EP4103282A1/en active Pending
- 2021-02-12 MX MX2022009989A patent/MX2022009989A/es unknown
- 2021-02-12 CN CN202180020854.4A patent/CN116472279A/zh active Pending
- 2021-02-12 KR KR1020227031638A patent/KR20220141332A/ko unknown
- 2021-02-12 AU AU2021218985A patent/AU2021218985A1/en active Pending
- 2021-02-12 WO PCT/EP2021/053540 patent/WO2021160850A1/en active Application Filing
- 2021-02-12 CA CA3166811A patent/CA3166811A1/en active Pending
- 2021-02-17 TW TW110105383A patent/TW202146044A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
US20230021583A1 (en) | 2023-01-26 |
MX2022009989A (es) | 2022-11-08 |
EP4103282A1 (en) | 2022-12-21 |
JP2023513913A (ja) | 2023-04-04 |
BR112022015764A2 (pt) | 2022-10-11 |
CA3166811A1 (en) | 2021-08-19 |
AU2021218985A1 (en) | 2022-08-25 |
TW202146044A (zh) | 2021-12-16 |
CN116472279A (zh) | 2023-07-21 |
WO2021160850A1 (en) | 2021-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220141332A (ko) | 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 | |
AU2019203955B2 (en) | Multipartite signaling proteins and uses thereof | |
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
US20040013648A1 (en) | Vector system | |
CA2462455C (en) | Development of a preventive vaccine for filovirus infection in primates | |
AU2022200903B2 (en) | Engineered Cascade components and Cascade complexes | |
DK2718440T3 (en) | NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF | |
KR100950104B1 (ko) | 코어 글리코실화된 hcv 엔빌로프 단백질 | |
KR102494564B1 (ko) | 말라리아 백신 | |
US20030119104A1 (en) | Chromosome-based platforms | |
DK2623594T3 (da) | Antistof mod human prostaglandin-E2-receptor EP4 | |
KR20210080375A (ko) | 암 면역요법을 위한 재조합 폭스바이러스 | |
KR20160029124A (ko) | Pd-1 항원 또는 pd-1 리간드 항원을 포함하는 바이러스 유사 입자 | |
KR20180020202A (ko) | T 세포 수용체 특이적 항체 | |
KR20210105382A (ko) | 단백질을 코딩하는 rna | |
KR20220007155A (ko) | 코로나바이러스 스파이크 단백질의 변형된 s1 서브유닛 | |
CN117222415A (zh) | 多顺反子rna疫苗及其用途 | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
AU2017252409A1 (en) | Compositions and methods for nucleic acid expression and protein secretion in bacteroides | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
TW202308669A (zh) | 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途 | |
KR20220078607A (ko) | 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들 | |
KR20230031929A (ko) | 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도 | |
US11814412B2 (en) | Artificial proteins and compositions and methods thereof | |
KR20210005167A (ko) | 리소좀 축적병을 완화시키기 위한 렌티벡터-형질도입된 t-rapa 세포의 용도 |