KR20230002571A

KR20230002571A - 큰 서열 범-코로나바이러스 백신 조성물

Info

Publication number: KR20230002571A
Application number: KR1020227038797A
Authority: KR
Inventors: 르바키르 벤모하메드
Original assignee: 더 리전츠 오브 더 유니버시티 오브 캘리포니아
Priority date: 2020-04-14
Filing date: 2021-04-14
Publication date: 2023-01-05
Also published as: US20230226173A1; CN116033920A; WO2021211748A1; EP4135765A1; EP4135762A1; WO2021211749A1; CA3178834A1; EP4135765A4; JP2023521837A; EP4135762A4; EP4135764A1; EP4135764A4; AU2021254768A1; WO2021211760A1; IL297335A

Abstract

모든 코로나바이러스 감염 및 질환에 대해 효율적이고 강력하며 오래 지속되는 보호를 유도하기 위한 범-코로나바이러스 백신은 코로나바이러스 감염 및/또는 질환을 예방하기 위한 면역 반응을 개발하기 위해 신체에 대한 다중 표적을 제공하는 데 도움이 되는 하나 이상의 보존된 B, CD4 및 CD8 T 세포 에피토프를 포함할 수 있는 다중 고도로 보존된 큰 서열을 포함한다. 특정 구현예에서, 큰 서열은 보존된 단백질 또는 큰 서열, 예를 들어 인간 코로나바이러스 및/또는 동물 코로나바이러스(예를 들어, 코로나바이러스 감염에 취약한 동물로부터 단리된 코로나바이러스) 사이에 고도로 보존된 서열이다.

Description

큰 서열 범-코로나바이러스 백신 조성물

관련 출원의 교차 참조

본원은 2020년 4월 14일자로 출원된 미국 가출원 제63/009,907호 및 2020년 9월 28일에 출원된 미국 가출원 제63/084,421호의 이익을 주장하며, 그 명세서(들)의 그 전체가 참고로 본 명세서에 포함된다.

서열 목록에 대한 참조

출원인은 UCI_20_06B_PCT_Sequence_Listing_ST25라는 제목으로 규정 13ter.1(a)에 따라 제출된 Annex C/ST.25 텍스트 파일 형식으로 기록된 정보가 제출된 국제 출원의 일부를 형성하는 정보와 동일하다고 주장한다. 서열 목록의 내용은 그 전체가 참고로 본 명세서에 포함된다.

발명의 분야

본 발명은 백신, 예를 들어 바이러스 백신, 예를 들어 범-코로나바이러스 백신과 같은 코로나바이러스에 대한 백신에 관한 것이다.

지난 20년 동안, 신종 동물매개감염 CoV: SARS-CoV, MERS-CoV, 및 현재 COVID-19 세계적 대유행을 일으킨 전염성이 높고 치명적인 최근 SARS-CoV-2로 인해 인간에 치명적인 코로나바이러스(CoV)가 발생하였다. 세 가지 치명적인 CoV는 모두 천연 숙주인 박쥐에서 유래했으며 다양한 중간 동물 저장소(예를 들어, 천산갑, 사향 고양이 및 낙타)를 통해 인간에게 전염되었다. 현재 보편적인 범-코로나바이러스 백신은 이용가능하기 않기 때문에, 백신을 접종하지 않은 인간 집단으로 알려지지 않은 동물매개감염 박쥐 유래 SARS 유사 코로나바이러스(SL-CoV)의 또 다른 여파로 인해 향후 몇 년 안에 다른 전 세계적인 COVID-유사 대유행이 나타날 가능성이 매우 높다.

중화 항체와 항바이러스 효과기 CD4⁺ 및 CD8⁺ T 세포는 대다수의 감염된 무증상 및 회복기 환자에서 바이러스 부하를 줄이는 데 중요한 것으로 보인다. 그러나 인간과 박쥐 코로나바이러스 균주 사이에 보존된 B 세포와 CD4⁺ 및 CD8⁺ T 세포 에피토프의 항원 풍경(landscape)과 레퍼토리에 대한 정보는 거의 없다.

무증상 COVID-19 환자에게서 보이는 내성과 상관관계가 있는 B 세포 및 CD4+ 및 CD8+ T 세포의 레퍼토리, 표현형 및 기능뿐만 아니라 인간 및 동물 코로나바이러스 사이에서 항원성, 면역원성, 보호성 및 보존성인 항원 및 에피토프 지형을 결정하는 것은 향후 범-코로나바이러스 백신 개발에 정보를 제공할 수 있다. 본 발명은 고도로 보존된, 예를 들어 하기에서 고도로 보존된 인간 B 세포, CD4+ 및 CD8+ T 세포 에피토프를 포함하는 여러 항원성, 면역원성, 보호 고도로 보존된 큰 서열을 확인하기 위해 인간에서 시험관내 및 동물 모드(예를 들어, 마우스, 햄스터 및 원숭이)에서 생체내 둘 모두에서 여러 면역정보학 및 서열 정렬 접근법 및 여러 면역학적 검정을 사용하는 것을 기재한다.: (i) 6개 대륙의 190개 국가에서 확인된 81,000개 초과의 SARS-CoV-2 인간 균주; (ii) "보통 감기"의 이전 인간 발병을 일으킨 6개의 순환 CoV; (iii) 박쥐에서 단리된 9개의 SL-CoV; (iv) 천산갑에서 단리된 9개의 SL-CoV; (v) 사향 고양이에서 단리된 3개의 SL-CoV; 및 (vi) 낙타에서 단리된 4개의 MERS 균주. 또한, 본 발명은 다음과 같은 교차 반응성 에피토프의 확인을 개재한다: COVID-19 환자와 SARS-CoV-2에 노출된 적이 없는 건강한 개체로부터 회수된 B 세포, CD4+ 및 CD8+ T 세포; 및 "인간화" 인간 백혈구 항원(HLA)-DR1/HLA-A^*02:01 이중 형질전환 마우스 및 HLA-DR-1 또는 HLA-A^*02:01 일배체형을 발현하지 않는 인간에서 유도된 강력한 B 세포 및 T 세포 반응. 특정 HLA 일배체형으로 제한되는 작은 에피토프와 달리, 큰 서열은 다수의 HLA 일배체형으로 제한된 몇 개의 에피토프를 포괄하므로 HLA 일배체형과 인종 및 민족과 관계없이 인간 집단의 대규모 백신 적용 범위를 확인한다.

본 발명은 인간에 사용하기 위한 백신 조성물에 제한되지 않는다. 본 발명은 개, 고양이 등과 같은 다른 애완 동물에 사용하기 위한 백신 조성물을 포함한다.

본 명세서의 백신 조성물은 코로나바이러스 돌연변이에 관계없이 지속적인 B 및 T 세포 면역성을 제공할 가능성이 있다. 이는 적어도 부분적으로, 백신 조성물이 모든 인간 및 동물 코로나바이러스 변이체 및 균주에서 발견되는 낮은 돌연변이율을 가진 다른 코로나바이러스 구조적 및 비구조적 항원과 조합하여, 고도로 보존된 구조적 및 비-구조적 코로나바이러스 항원, 예컨대 코로나바이러스 핵단백질 (또한 뉴클레오캡시드로 알려져 있음)를 표적으로 하기 때문일 수 있다.

본 발명은 또한 바이러스 내부에 고도로 보존된 구조적(예를 들어, 스파이크 단백질) 및 비-구조적 코로나바이러스 항원(예를 들어, 뉴클레오캡시드와 같은 비-스파이크 단백질)을 선택하는 것에 관한 것으로, 이는 일반적으로 반드시 면역 체계에 의한 돌연변이 압력이 있을 필요는 없는 바이러스 단백질일 수 있다.

본 발명은 인간과 애완동물 및 동물에서 강력하고 오래 지속되는 B 및 T 세포 보호 면역 반응을 유도하는 범-코로나바이러스 재조합 백신 조성물을 제공한다.

특정 구현예에서, 백신 조성물은 인간에서 사용하기 위한 것이다. 특정 구현예에서, 백신 조성물은 마우스, 고양이, 개, 비-인간 영장류, 코로나바이러스 감염에 취약한 다른 동물, 코로나바이러스 감염에 대한 전임상 동물 모델로서 기능할 수 있는 다른 동물, 등으로 제한되지 않는 것과 같은 동물에 사용하기 위한 것이다.

본원에서 사용된 바와 같이, 용어 "다중-에피토프"는 하나 초과의 B 및 T 세포 에피토프를 포함하는 조성물을 지칭하며, 적어도 하나의 CD4 및/또는 CD8 T 세포 에피토프는 MHC-제한되고 TCR에 의해 인식되고, 하나 이상의 에피토프는 B 세포 에피토프이다. 예를 들어, 본 명세서의 백신 조성물은 다중-에피토프 범-코로나바이러스 백신 조성물일 수 있다.

본원에서 사용된 바와 같이, 용어 "재조합 백신 조성물"은 하나 이상의 재조합 유전자, 예를 들어, 상기 유전자(들)의 발현을 지원하는 하나 이상의 시스템으로 클로닝된 유전자에 의해 인코딩되는 하나 이상의 단백질 또는 펩티드를 지칭할 수 있다. 용어 "재조합 백신 조성물"은 재조합 유전자 또는 상기 재조합 유전자의 발현을 지원하는 시스템을 지칭할 수 있다.

예를 들어, 본 발명은 1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 제공하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 2개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 2개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 2개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 2개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다: 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하고, 이 조성물은 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 이 조성물은 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

상기 언급된 조성물 및 본 명세서의 구현예를 참조하면, 일부 구현예에서, 비-스파이크 단백질은 ORF1ab 단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 및 ORF10 단백질이다.

일부 구현예에서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 1개 이상의 큰 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 보존된 큰 서열은 염려 변이체 또는 관심 변이체로부터 선택된다.

일부 구현예에서, 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 3개 이상의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 2개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 3개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 4개의 큰 서열을 포함한다. 일부 구현예에서, 조성물은 5개의 큰 서열을 포함한다.

일부 구현예에서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된다. 일부 구현예에서, 큰 서열 또는 표적 에피토프는 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된 SARS-CoV-2 단백질로부터 유래된다.

일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 RBD이다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 NTD이다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 RBD 및 NTD 영역 둘 다를 포함한다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 항체를 중화 및 차단함으로써 인식된다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 항체의 중화 및 차단을 유도한다. 일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 바이러스를 인식하고 중화하는 항체의 중화 및 차단을 유도한다.

일부 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열 또는 표적 에피토프는 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도한다.

일부 구현예에서, ORF1ab 단백질은 비구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab₁₆₇₅ _-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab_3183-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab₆₇₄₉ _-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10_5-13으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6_12-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a₁ _-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13-37로부터 선택된다. 일부 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택된다. 일부 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택된다.

일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열의 형태이다. 일부 구현예에서, 큰 서열은 전장 스파이크 당단백질이다. 일부 구현예에서, 큰 서열은 부분 스파이크 당단백질이다. 일부 구현예에서, 스파이크 당단백질은 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는다. 일부 구현예에서, 스파이크 당단백질은 Tyr-83 및 Tyr-489, Gln-24 및 Asn-487을 포함하는 아미노산 위치에서 단일 아미노산 치환을 갖는다. 일부 구현예에서, 스파이크 단백질의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛에서 중심 나선의 상단에 있는 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화된다.

일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 전체 단백질 서열로부터 유래된다. 일부 구현예에서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 부분 단백질 서열로부터 유래된다. 일부 구현예에서, 스파이크 단백질로부터의 1개 이상의 큰 보존된 서열은 전장 스파이크 당단백질로부터의 것이다. 일부 구현예에서, 스파이크 단백질로부터의 1개 이상의 큰 보존된 서열은 부분 스파이크 당단백질로부터의 것이다. 일부 구현예에서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 막 단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함한다. 일부 구현예에서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함한다. 일부 구현예에서, 스파이크 당단백질의 일부는 RBD이다. 일부 구현예에서, 1개 이상의 큰 서열은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된다. 일부 구현예에서, ORF1ab 단백질은 비구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함한다. 일부 구현예에서, 큰 서열 중 1개 이상은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형으로 제한된 T-세포 에피토프를 포함하고 클래스 1에 대한 HLA-0201 또는 클래스 2에 대한 HLA-DR로 제한된다.

일부 구현예에서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된다.

본 발명은 또한 전장 스파이크 단백질을 포함하는 재조합 백신 조성물을 특징으로 한다. 본 발명은 또한 전장 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는 재조합 백신 조성물을 특징으로 한다.

일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487을 포함한다. 일부 구현예에서, Tyr-489 및 Asn-487은 ACE-2 상의 Tyr 83 및 Gln-24와의 상호작용을 돕는다. 일부 구현예에서, 스파이크 단백질은 Gln-493을 포함한다. 일부 구현예에서, Gln-493은 ACE-2 상의 Glu-35 및 Lys-31과의 상호작용을 돕는다. 일부 구현예에서, 스파이크 단백질은 Tyr-505를 포함한다. 일부 구현예에서, Tyr-505는 ACE-2 상의 Glu-37 및 Arg-393과의 상호작용을 돕는다.

일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 스파이크 당단백질 RBD 항원을 하나 이상의 고도로 보존된 구조적 및 비-구조적 SARS-CoV-2 항원과 함께 인코딩한다. 일부 구현예에서, 항원에 대한 서열은 GenBank 수탁 번호, MN908947.3이다. 일부 구현예에서, 보존된 큰 서열은 염려 변이체 및 관심 변이체로부터 선택된다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다.

일부 구현예에서, 조성물은 적어도 1개의 프롤린 치환을 포함한다. 일부 구현예에서, 조성물은 2개 이상의 프롤린 치환을 포함한다. 일부 구현예에서, 프롤린 치환은 위치 K986 및 V987에 있다. 일부 구현예에서, 조성물은 K986P 및 V987P 돌연변이를 포함한다.

일부 구현예에서, 큰 서열은 서열번호: 182-185 (표 1) 또는 서열번호: 148-159 (표 10)로부터 선택된다.

일부 구현예에서, 조성물은 약제학적 담체를 추가로 포함한다.

일부 구현예에서, 링커는 T2A를 포함한다. 일부 구현예에서, 링커는 T2A, E2A, 및 P2A로부터 선택된다. 일부 구현예에서, 상이한 링커는 각각의 열린 해독틀 사이에 배치된다.

일부 구현예에서, 백신 작제물은 인간에 대한 것이다. 일부 구현예에서, 조성물은 인간 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함한다. 일부 구현예에서, 백신 작제물은 동물에 대한 것이다. 일부 구현예에서, 조성물은 동물 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함한다. 일부 구현예에서, 동물은 고양이 및 개이다.

일부 구현예에서, 전달 시스템은 아데노바이러스 시스템이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 큰 서열 중 1개 이상은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 일반 프로모터는 CMV 또는 CAG 프로모터이다. 일부 구현예에서, 1개 이상의 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, 폐 특이적 프로모터는 SpB 또는 CD144이다. 일부 구현예에서, 조성물은 T 세포 유인 케모카인을 추가로 포함한다.

일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하며, 제2 전달 시스템은 T 세포 유인 케모카인을 인코딩한다. 일부 구현예에서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, T 세포 유인 케모카인은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 유인 케모카인은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 조성물은 T 세포 증식을 촉진하는 조성물을 추가로 포함한다.

일부 구현예에서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하고, 제2 전달 시스템은 T 세포 증식을 촉진하는 조성물을 인코딩한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2, 또는 IL-15이다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 일부 구현예에서, 백신은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물을 포함하는 펩티드를 추가로 인코딩한다. 일부 구현예에서, 펩티드는 폐 특이적 프로모터에 작동적으로 연결된다. 일부 구현예에서, 펩티드는 일반 프로모터에 작동적으로 연결된다. 일부 구현예에서, 폐 특이적 프로모터는 SpB 또는 CD144이다. 일부 구현예에서, 일반 프로모터는 CMV 또는 CAG 프로모터이다.

일부 구현예에서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 2개의 전달 시스템을 포함하며, 제2 전달 시스템은 분자 보조제를 인코딩한다. 일부 구현예에서, 분자 보조제는 CpG이다. 일부 구현예에서, 분자 보조제는 CpG 중합체이다. 일부 구현예에서, 분자 보조제는 플라젤린이다. 일부 구현예에서, 분자 보조제는 프로모터에 작동적으로 연결된다. 일부 구현예에서, 프로모터는 폐 특이적 프로모터 또는 일반 프로모터이다.

일부 구현예에서, 큰 서열 중 1개 이상은 링커에 의해 분리된다. 일부 구현예에서, 각각의 큰 서열은 링커에 의해 분리된다. 일부 구현예에서, 링커는 길이가 2 내지 10개의 아미노산이다.

일부 구현예에서, 재조합 백신 조성물은 태그를 포함하고, 예를 들어 큰 서열 중 1개 이상은 태그를 포함한다. 일부 구현예에서, 태그는 His 태그이다.

본 발명은 또한 본 명세서의 임의의 백신 조성물을 포함하는 rVSV-panCoV 재조합 백신 조성물을 포함한다.

본 발명은 또한 본 명세서의 임의의 백신 조성물을 포함하는 rAdV-panCoV 재조합 백신 조성물을 포함한다.

일부 구현예에서, 조성물은 백신으로 사용하기 위한 것이다. 일부 구현예에서, 조성물은 코로나바이러스 감염 및 질환의 예방 및 치료를 위한 면역요법으로서 사용하기 위한 것이다. 일부 구현예에서, 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용된다. 일부 구현예에서, 조성물은 대상체에서 예방적으로 코로나바이러스 감염을 방지하기 위해 사용된다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킨다.

본 발명은 또한 서열번호: 139-147(표 10)을 포함하는 범-코로나바이러스 재조합 백신 조성물을 포함한다.

비-스파이크 단백질은 스파이크 이외의 임의의 코로나바이러스 단백질, 예를 들어 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질 등을 포함하나 이에 제한되지는 않는다.

특정 구현예에서, 본 발명의 조성물, 예를 들어 큰 서열은 하나 이상의 보존된 표적 에피토프, 예를 들어, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 5개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 10개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 15개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 20개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 25개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 30개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 35개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 40개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 일부 구현예에서, 보존된 표적 에피토프는 서열 정렬 및 분석에서 확인된 50개의 가장 보존된 에피토프(이의 에피토프 유형에 대해, 예를 들어, B 세포, CD4 T 세포, CD8 T 세포) 중 하나인 것이다. 서열 정렬 및 분석의 예는 본 명세서에 기재되어 있다. 예를 들어, 보존된 큰 서열을 선택하거나 확인하기 위한 단계 또는 방법은 먼저 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석을 수행하여 분석된 서열 그룹 간의 서열 유사성 또는 동일성을 결정하는 것을 포함할 수 있다. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 보존된 큰 서열은 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석을 수행하여 분석된 서열의 그룹 간의 서열 유사성 또는 동일성을 결정함으로써 확인된다. 보존된 큰 서열은 분석에서 확인된 가장 고도로 보존된 서열 중 하나이다. 예를 들어, 보존된 큰 서열은 확인된 2개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 8개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 10개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 15개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 20개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 30개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 40개의 가장 고도로 보존된 서열일 수 있다. 본 발명은 전술한 역치에 제한되지 않는다. 일부 구현예에서, 50개 이상의 서열, 100개 이상의 서열, 200개 이상의 서열, 300개 이상의 서열, 400개 이상의 서열, 500개 이상의 서열, 1000개 이상의 서열, 2000개 이상의 서열, 3000개 이상의 서열, 4000개 이상의 서열, 5000개 이상의 서열, 10,000개 이상의 서열, 15,00개 이상의 서열, 15,000개 초과의 서열, 등에 대한 정렬 및 분석. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 본원에서 논의된 바와 같이, 표적 에피토프를 포함하는 1개 이상의 보존된 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존되어 있다. 본 명세서의 임의의 구현예에 대해, 선택된 에피토프는 결합 검정(예를 들어, HLA 분자에 대한 결합에 대해)에서 특정 점수를 달성하는 에피토프일 수 있다.

특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab₁₆₇₅ _-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab₃₁₈₃ _-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab_6749-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10₅ _-13으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택된다.

특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a_1-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택된다.

특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택된다. 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13-37로부터 선택된다. 특정 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택된다. 특정 구현예에서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택된다.

이전에 논의된 바와 같이, 특정 구현예에서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열, 예를 들어 전체 스파이크 단백질 또는 부분 스파이크 단백질(예를 들어, 전체 스파이크 단백질의 일부)의 형태이다. 일부 구현예에서, 전체 스파이크 단백질 또는 이의 일부는 안정화된 형태로 존재한다. 특정 구현예에서, 스파이크 단백질 (또는 이의 일부)의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는다. 특정 구현예에서, 스파이크 당단백질은 예를 들어 안정화를 위해 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Tyr-83에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Tyr-489에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Gln-24에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 아미노산 위치 Asn-487에서 아미노산 치환을 갖는다. 특정 구현예에서, 스파이크 단백질 또는 이의 일부는 Tyr-83, Tyr-489, Gln-24, Gln-493, 및 Asn-487 중 하나 이상에서 아미노산 치환을 가지며, 예를 들어, 스파이크 단백질 또는 이의 일부는 Tyr-489 및 Asn-487을 포함할 수 있고, 스파이크 단백질 또는 이의 일부는 Gln-493을 포함할 수 있고, 스파이크 단백질 또는 이의 일부는 Tyr-505를 포함할 수 있다. Tyr-489 및 Asn-487은 ACE-2 상의 Tyr 83 및 Gln-24와의 상호작용에 도움이 될 수 있다. Gln-493은 ACE-2 상의 Glu-35 및 Lys-31과의 상호작용에 도움이 될 수 있다. Tyr-505는 ACE-2 상의 Glu-37 및 Arg-393과의 상호 작용에 도움이 될 수 있다.

특정 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다. 특정 구현예에서, 조성물은 적어도 1개의 프롤린 치환을 포함한다. 특정 구현예에서, 조성물은 예를 들어 위치 K986 및 V987에서 적어도 2개의 프롤린 치환을 포함한다.

특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 RBD이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 NTD이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 예를 들어 RBD 및 NTD 영역 둘 다를 포함하는 1개 이상의 큰 서열이다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 항체를 중화 및 차단함으로써 인식된다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 항체의 중화 및 차단을 유도한다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 바이러스를 인식하고 중화하는 항체의 중화 및 차단을 유도한다. 특정 구현예에서, 스파이크 당단백질로부터 유래된 큰 서열은 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도한다.

특정 구현예에서, 링커는 예를 들어 에피토프 사이, 큰 서열 사이 등에 사용된다. 특정 구현예에서, 링커는 그 길이가 2 내지 10개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 3 내지 12개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 5 내지 15개의 아미노산이다. 특정 구현예에서, 링커는 그 길이가 10개 이상의 아미노산이다. 링커의 비제한적인 예는 AAY, KK, 및 GPGPG(서열번호: 186)를 포함한다.

일부 구현예에서, 조성물은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가를 포함한다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다.

특정 구현예에서, 조성물은 T 세포 유인 케모카인을 추가로 포함한다. 예를 들어, 조성물은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합 중 하나 또는 조합을 추가로 포함할 수 있다.

특정 구현예에서, 조성물은 T 세포 증식을 촉진하는 조성물을 추가로 포함한다. 예를 들어, 조성물은 IL-7, IL-15, IL-2, 또는 이들의 조합을 추가로 포함할 수 있다.

특정 구현예에서, 조성물은 분자 보조제를 추가로 포함한다. 예를 들어, 조성물은 CpG(예를 들어, CpG 중합체) 또는 플라젤린 중 하나 또는 이들의 조합을 추가로 포함할 수 있다.

특정 구현예에서, 조성물은 태그를 포함한다. 예를 들어, 큰 서열 중 1개 이상은 태그를 포함할 수 있다. 특정 구현예에서, 에피토프는 2개 이상의 항원 형태이고, 항원 중 1개 이상은 태그를 포함한다. 태그의 비제한적인 예는 His 태그를 포함한다.

특정 구현예에서, "항원 전달 시스템"은 2개의 전달 시스템을 지칭할 수 있으며, 예를 들어, 큰 서열의 일부 (또는 케모카인 등과 같은 다른 성분)는 하나의 전달 시스템에 의해 인코딩될 수 있고, 큰 서열의 일부 (또는 다른 구성요소)는 제2 전달 시스템 (또는 제3 전달 시스템 등)에 의해 인코딩될 수 있다.

항원 전달 시스템과 관련하여, 특정 구현예에서 항원 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 특정 구현예에서, 항원 전달 시스템은 아데노바이러스(예를 들어, Ad26, Ad5, Ad35 등)이다.

큰 서열은 프로모터에 작동적으로 연결된다. 특정 구현예에서, 프로모터는 일반 프로모터(예를 들어, CMV, CAG 등)이다. 특정 구현예에서, 프로모터는 폐 특이적 프로모터(예를 들어, SpB, CD144)이다. 특정 구현예에서, 큰 서열은 동일한 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열 중 1개 이상은 제1 프로모터에 작동적으로 연결되고 1개 이상의 큰 서열은 제2 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열은 2개 이상의 프로모터에 작동적으로 연결되고, 예를 들어, 일부는 제1 프로모터에 작동적으로 연결되고, 일부는 제2 프로모터에 작동적으로 연결된다. 특정 구현예에서, 큰 서열은 3개 이상의 프로모터에 작동적으로 연결되고, 예를 들어, 일부는 제1 프로모터에 작동적으로 연결되고, 일부는 제2 프로모터에 작동적으로 연결되고, 일부는 제3 프로모터에 작동적으로 연결된다. 특정 구현예에서, 제1 프로모터는 제2 프로모터와 동일하다. 특정 구현예에서, 제2 프로모터는 제1 프로모터와 상이하다. 특정 구현예에서, 프로모터는 일반 프로모터(예를 들어, CMV, CAG 등)이다. 특정 구현예에서, 프로모터는 폐 특이적 프로모터(예를 들어, SpB, CD144) 프로모터이다.

특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인을 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물 둘 다를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 분자 보조제를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인, T 세포 증식을 촉진하는 조성물 및 분자 보조제를 인코딩한다. 특정 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 유인 케모카인 및 분자 보조제를 인코딩한다. 일부 구현예에서, 항원 전달 시스템 또는 별도의 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물 및 분자 보조제를 인코딩한다.

특정 구현예에서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 IL-7 또는 IL-15 또는 IL-2이다. 일부 구현예에서, 분자 보조제는 CpG(예를 들어, CpG 중합체), 플라젤린 등)이다.

특정 구현예에서, T 세포 유인 케모카인은 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, T 세포 유인 케모카인은 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, T 세포 증식을 촉진하는 조성물은 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, 분자 보조제는 폐 특이적 프로모터(예를 들어, SpB, CD144)에 작동적으로 연결된다. 특정 구현예에서, 분자 보조제는 일반 프로모터(예를 들어, CMV, CAG 등)에 작동적으로 연결된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 분자 보조제 및 T 세포 유인 케모카인은 상이한 프로모터에 의해 구동된다.

특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 링커에 의해 분리된다. 특정 구현예에서, 링커는 T2A를 포함한다. 특정 구현예에서, 링커는 E2A를 포함한다. 특정 구현예에서, 링커는 P2A를 포함한다. 특정 구현예에서, 링커는 T2A, E2A, 및 P2A로부터 선택된다.

항원 전달 시스템과 관련하여, 특정 구현예에서, 링커는 각각의 열린 해독틀 사이에 배치된다. 특정 구현예에서, 상이한 링커는 각각의 열린 해독틀 사이에 배치된다. 특정 구현예에서, 특정 열린 해독틀 사이에 동일한 링커가 사용될 수 있고 다른 열린 해독틀 사이에 상이한 링커가 사용될 수 있다.

일부 구현예에서, 백신 조성물은 아데노바이러스를 사용하여 투여된다.

본 명세서의 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 본 발명의 조성물은 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용될 수 있다. 본 명세서의 조성물은 대상체에서 면역 반응을 유도하기 위해 사용될 수 있다. 본 명세서에서 "대상체"라는 용어는 인간, 비-인간 영장류, 마우스, 쥐, 고양이, 개와 같은 동물, 코로나바이러스 감염에 걸리기 쉬운 기타 동물, 또는 전임상 모델링에 사용되는 기타 동물을 지칭할 수 있다. 본 명세서의 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킬 수 있다. 특정 구현예에서, 조성물은 상주 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도한다. 일부 구현예에서, 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 된다. 일부 구현예에서, T-세포 유인 케모카인은 순환에서 폐로 T-세포를 끌어당기는 것을 돕는다.

특정 구현예에서, 조성물은 약제학적 담체를 추가로 포함한다.

본 발명은 본 명세서에 기재된 임의의 백신 조성물, 예를 들어 나노입자, 예를 들어 지질 나노입자와 함께 전달하기 위한 전술한 백신 조성물을 포함한다. 예를 들어, 본 발명은 지질 나노입자에 캡슐화된 본 명세서의 백신 조성물을 포함한다.

본 발명은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 및 구조적 단백질 (예를 들어, 핵단백질, 등) 및 비-구조적 단백질 (예를 들어, Nsp4, 등)로부터 선택된 하나 이상의 고도로 보존된 SARS-CoV-2 서열을 포함하고/하거나 이를 인코딩하는 본 명세서에 기재된 조성물을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시킨다.

본 발명은 또한 본 발명의 범-코로나바이러스 재조합 백신 조성물의 제조 방법을 특징으로 한다.

예를 들어, 일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열을 적어도 선택하는 것을 포함한다. 다른 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열 중 적어도 2개를 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 포함하는 항원 또는 항원들을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 1개 이상의 보존된 큰 서열을 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 포함하는 항원 또는 항원들을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 백신 조성물을 약제학적 담체에 도입하는 것을 추가로 포함한다. 1개 이상의 보존된 큰 서열을 선택하는 단계가 본 명세서에 개시되어 있다. 재조합 단백질을 합성하는 방법은 당업자에게 잘 알려져 있다. 백신 조성물은 본 명세서에 개시되어 있다. 일부 구현예에서, 백신 조성물은 DNA, RNA, 변형된 RNA, 단백질 (또는 펩티드), 또는 이들의 조합의 형태이다.

일부 구현예에서, 방법은 하나 이상의 코로나바이러스 B-세포 에피토프; 하나 이상의 코로나바이러스 CD4+ T 세포 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 에피토프를 포함하는 적어도 1개의 보존된 큰 서열을 선택하는 것을 포함한다. 적어도 하나의 큰 서열은 비-스파이크 단백질에서 유래된다. 방법은 선택된 큰 서열을 인코딩하는 항원 전달 시스템을 합성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 백신 조성물을 약제학적 담체에 도입하는 것을 추가로 포함한다. 1개 이상의 보존된 큰 서열을 선택하는 단계가 본 명세서에 개시되어 있다. 항원 전달 시스템을 합성하는 방법은 당업자에게 잘 알려져 있다. 백신 조성물은 본 명세서에 개시되어 있다. 일부 구현예에서, 백신 조성물은 DNA, RNA, 변형된 RNA, 단백질 (또는 펩티드), 또는 이들의 조합의 형태이다.

예로서, 보존된 큰 서열을 선택하거나 확인하기 위한 단계 또는 방법은 먼저 서열 정렬 및 특정 수의 코로나바이러스 서열, 예를 들어, 50개 이상의 서열, 100개 이상의 서열, 200개 이상의 서열, 300개 이상의 서열, 400개 이상의 서열, 500개 이상의 서열, 1000개 이상의 서열, 2000개 이상의 서열, 3000개 이상의 서열, 4000개 이상의 서열, 5000개 이상의 서열, 10,000개 이상의 서열, 15,00개 이상의 서열, 15,000개 초과의 서열 등의 분석을 수행하여 분석된 서열 그룹 간의 서열 유사성 또는 동일성을 결정한다. 일부 구현예에서, 정렬에 사용되는 서열은 인간 및 동물 서열을 포함할 수 있다. 특정 구현예에서, 정렬에 사용되는 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래된다. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 2개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 5개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 10개의 서열로 간주될 수 있다. 일부 구현예에서, 보존된 큰 서열은 정렬에서 확인된 큰 서열의 가장 고도로 보존된 15개의 서열로 간주될 수 있다.

본 발명은 또한 코로나바이러스 질환을 예방하는 방법을 특징으로 한다. 이 방법은 대상체에게 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물의 치료적 유효량을 투여하는 것을 포함하며, 조성물은 대상체에서 면역 반응을 유도하고 코로나바이러스 질환을 예방하는 데 도움이 된다.

본 발명은 또한 대상체에서 코로나바이러스 감염을 예방적으로 방지하는 방법을 특징으로 한다. 일부 구현예에서, 방법은 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물의 예방적 유효량을 대상체에게 투여하는 것을 포함하며, 백신 조성물은 코로나바이러스 감염을 예방한다.

본 발명은 또한 본 발명에 따른 조성물을 대상체에게 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법을 특징으로 하며, 백신 조성물은 대상체에서 면역 반응을 유도한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 바이러스 복제를 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 사이토카인 폭풍을 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 염증 또는 염증 반응을 방지한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 T 세포의 귀소 및 체류를 개선한다. 본 발명은 또한 대상체에서 코로나바이러스 질환을 예방하는 방법을 특징으로 하며; 방법은 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하며, 조성물은 기억 B 및 T 세포를 유도한다. 본 발명은 또한 범-코로나바이러스 재조합 백신에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는 방법을 특징으로 하며, 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 범-코로나바이러스 재조합 백신을 동시 발현시키는 것을 포함한다. 본 발명은 또한 범-코로나바이러스 백신에 의해 유도된 폐로의 기억 T 세포의 체류를 연장하고 바이러스 특이적 조직 상주 기억 T-세포(TRM 세포)를 증가시키는 방법을 특징으로 하며, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 범-코로나바이러스 재조합 백신을 동시 발현시키는 것을 포함한다. 본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법을 특징으로 하며, 조성물은 코로나바이러스의 돌연변이 및 변이체의 발달을 예방한다.

간결함을 위해, 앞서 언급된 방법에서 언급된 백신 조성물은 이전에 논의된 백신 조성물, 하기에 기재된 구현예, 및 도면의 구현예를 포함한다는 점에 유의한다.

일부 구현예에서, 백신 조성물은 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로(s.l.)를 통해 투여된다.

일부 구현예에서, 백신 조성물은 아데노바이러스 또는 다른 적절한 전달 시스템을 사용하여 투여된다.

이전에 논의된 바와 같이, 본 명세서의 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 본 발명의 조성물은 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용될 수 있다. 본 명세서의 조성물은 대상체에서 면역 반응을 유도하기 위해 사용될 수 있다. 본 명세서에서 "대상체"라는 용어는 인간, 비-인간 영장류, 마우스, 쥐, 고양이, 개와 같은 동물, 코로나바이러스 감염에 걸리기 쉬운 기타 동물, 또는 전임상 모델링에 사용되는 기타 동물을 지칭할 수 있다. 본 명세서의 조성물은 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시킬 수 있다. 특정 구현예에서, 조성물은 상주 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도한다. 일부 구현예에서, 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도한다. 일부 구현예에서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 된다. 일부 구현예에서, T-세포 유인 케모카인은 순환에서 폐로 T-세포를 끌어당기는 것을 돕는다.

본 발명은 또한 올리고뉴클레오티드 조성물을 특징으로 한다. 예를 들어, 본 발명은 서열 목록에 개시된 올리고뉴클레오티드를 포함한다. 본 발명은 또한 항원 전달 시스템 형태의 올리고뉴클레오티드를 포함한다. 본 발명은 또한 본 명세서에 개시된 보존된 큰 서열을 인코딩하는 올리고뉴클레오티드를 포함한다. 본 발명은 또한 본 발명에 따른 임의의 백신 조성물을 인코딩하는 하나 이상의 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 조성물을 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 DNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 DNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 RNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 RNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 mRNA를 포함한다. 일부 구현예에서, 올리고뉴클레오티드는 변형된 mRNA를 포함한다.

본 발명은 또한 펩티드 조성물을 특징으로 한다. 예를 들어, 본 발명은 서열 목록에 개시된 펩티드를 포함한다. 본 발명은 또한 본 발명에 따른 임의의 백신 조성물을 포함하는 펩티드 조성물을 포함한다. 본 발명은 또한 본 발명에 따른 보존된 큰 서열 중 임의의 것을 포함하는 펩티드 조성물을 포함한다.

간결함을 위해, 앞서 언급된 올리고뉴클레오티드 및 펩티드 조성물에서 언급된 백신 조성물은 이전에 논의된 백신 조성물, 하기에 기재된 구현예, 및 도면의 구현예를 포함한다는 점에 유의한다.

본 발명은 또한 서열번호: 139-147(표 9)을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.

본 발명은 또한 서열번호: 139-147(표 9)과 적어도 99% 동일한 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.

본 발명은 또한 제1 전달 시스템을 사용하여 제1 범-코로나바이러스 재조합 백신 용량을 투여하는 단계, 및 제2 전달 시스템을 사용하여 제2 백신 용량을 투여하는 단계를 포함하는 방법을 특징으로 하며, 제1 및 제2 전달 시스템은 상이하다. 일부 구현예에서, 제1 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있다. 일부 구현예에서, 제2 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, 제2 백신 용량은 제1 백신 용량 후 14일에 투여된다.

본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 8일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 30일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다.

본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계; 및 T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 사이토카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여된다. 일부 구현예에서, 펩티드 전달 시스템은 아데노바이러스이다. 일부 구현예에서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 펩티드 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인의 투여 후 10일에 투여된다. 일부 구현예에서, 사이토카인은 IL-7, IL-15, IL2 또는 이들의 조합이다.

본 발명은 또한 본 발명에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 범-코로나바이러스 재조합 백신 조성물을 투여한 후 하나 이상의 T-세포 유인 케모카인을 투여하는 단계; 및 하나 이상의 점막 케모카인(들)을 투여하는 단계를 포함하는 방법을 특징으로 한다. 일부 구현예에서, 백신 조성물은 아데노바이러스를 사용하여 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템, 또는 다른 전달 시스템을 통해 투여된다. 일부 구현예에서, 점막 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템, 또는 다른 전달 시스템을 통해 투여된다. 일부 구현예에서, 아데노바이러스는 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물의 투여 후 14일에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합이다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인의 투여 후 10일에 투여된다. 일부 구현예에서, 점막 케모카인은 CCL25, CCL28, CXCL14, 또는 CXCL17, 또는 이들의 조합이다.

이전에 논의된 바와 같이, 일부 구현예에서, 백신 조성물은 인간에서 사용하기 위한 것이다. 일부 구현예에서, 백신 조성물은 동물, 예를 들어 고양이, 개 등에 사용하기 위한 것이다. 일부 구현예에서, 백신 조성물은 인간 CXCL-11 및/또는 인간 IL-7 (또는 IL-15, IL-2)을 포함한다. 일부 구현예에서, 백신 조성물은 동물 CLCL-11 및/또는 동물 IL-7 (또는 IL-15, IL-2)을 포함한다.

본 발명은 rVSV-panCoV 백신 조성물 형태의 백신 조성물을 포함한다. 본 발명은 rAdV-panCoV 백신 조성물 형태의 백신 조성물을 포함한다.

본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 핵산을 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 벡터를 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 융합 단백질을 포함한다. 본 발명은 또한 본 명세서의 백신 조성물에 사용하기 위한 면역원성 조성물을 포함한다.

본 명세서의 백신 조성물은 18세 내지 55세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 55세 내지 65세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 65세 내지 85세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 85세 내지 100세의 성인에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 12세 내지 18세 아동에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다. 본 명세서의 백신 조성물은 12세 미만의 아동에서 높은 수준의 바이러스 차단 및 바이러스 중화 항체뿐만 아니라 CD4+ T 세포 및 CD8+ T 세포 둘 다를 유도하도록 설계될 수 있다.

본 발명은 백신 조성물에 제한되지 않는다. 예를 들어, 특정 구현예에서, 보존된 큰 서열 중 하나 이상은 코로나바이러스를 검출하고/하거나 코로나바이러스 감염을 진단하기 위해 사용된다.

이전에 논의된 바와 같이, 일부 구현예에서, 1개 이상의 보존된 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 보존된 큰 서열은 서열 정렬 및 특정 수의 코로나바이러스 서열의 분석에서 확인된 가장 고도로 보존된 큰 서열 중 하나이다. 예를 들어, 보존된 큰 서열은 확인된 2개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 8개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 10개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 15개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 20개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 30개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 확인된 40개의 가장 고도로 보존된 큰 서열일 수 있다. 일부 구현예에서, 1개 이상의 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래될 수 있다. 일부 구현예에서, 1개 이상의 보존된 큰 서열은 확인된 5개의 가장 고도로 보존된 큰 서열은 하기중 하나 이상으로부터 유래된다: 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스. 일부 구현예에서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택된다. 일부 구현예에서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 하기로부터 선택된다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스. 일부 구현예에서, 백신 조성물은 인간을 위한 것이다. 일부 구현예에서, 백신 조성물은 동물을 위한 것이다.

본 발명은 또한 본 발명에 따른 1개 이상의 큰 서열(들)을 선택하고 선택된 큰 서열(들)을 포함하는 하나 이상의 항원을 합성하는 것을 포함하는, 범-코로나바이러스 조성물의 제조 방법을 특징으로 한다. 본 발명은 또한 하나 이상의 보존된 큰 서열(들)을 선택하는 단계; 및 선택된 큰 서열(들)을 인코딩하는 항원 전달 시스템을 합성하는 단계를 포함한다.

본 발명은 또한 범-코로나바이러스 재조합 백신 조성물을 포함하고, 이 조성물은 1개 이상의 큰 서열을 포함하고, 1개 이상의 큰 서열 각각은 전체 스파이크 단백질 또는 이의 일부; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

일부 구현예에서, 하나 이상의 보존된 에피토프는 인간 및 동물 코로나바이러스 중에서 고도로 보존된다. 일부 구현예에서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.

본 발명은 또한 1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 1개 이상의 큰 서열 각각은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고, 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

일부 구현예에서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된다. 일부 구현예에서, 조성물은 2 내지 20개의 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 조성물은 2 내지 20개의 CD4+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다.

일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.

일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363-2371, ORF1ab3013-3021, ORF1ab3183-3191, ORF1ab5470-5478, ORF1ab6749-6757, ORF7b26-34, ORF8a73-81, ORF103-11, 및 ORF105-13)로부터 선택된다.

본 발명은 또한 1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 하며, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4+ T 세포 표적 에피토프; 및/또는 하나 이상의 보존된 코로나바이러스 CD8+ T 세포 표적 에피토프 중 하나 이상을 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래된다.

일부 구현예에서, 항원 전달 시스템은 아데노바이러스 기반 항원 전달 시스템이다. 일부 구현예에서, 아데노바이러스 기반 항원 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합이다. 일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩한다. 일부 구현예에서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩한다. 일부 구현예에서, 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된다.

일부 구현예에서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S2-10, S1220-1228, S1000-1008, S958-966, E20-28, ORF1ab1675-1683, ORF1ab2363-2371, ORF1ab3013-3021, ORF1ab3183-3191, ORF1ab5470-5478, ORF1ab6749-6757, ORF7b26-34, ORF8a73-81, ORF103-11, 및 ORF105-13)로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a1350-1365, ORF1ab5019-5033, ORF612-26, ORF1ab6088-6102, ORF1ab6420-6434, ORF1a1801-1815, S1-13, E26-40, E20-34, M176-190, N388-403, ORF7a3-17, ORF7a1-15, ORF7b8-22, ORF7a98-112, 및 ORF81-15)으로부터 선택된다. 일부 구현예에서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S287-317, S524-598, S601-640, S802-819, S888-909, S369-393, S440-501, S1133-1172, S329-363, 및 S13-37)로부터 선택된다.

일부 구현예에서, 부분 스파이크 단백질은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 전체 스파이크 단백질 또는 부분 스파이크 단백질은 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화된다.

본 발명은 또한 서열번호: 139-147 중 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물을 특징으로 한다.

본 발명은 또한 본 명세서의 임의의 단백질 서열에 대한 상응하는 핵산 서열을 포함한다. 본 발명은 또한 본 명세서의 임의의 핵산 서열에 대한 상응하는 단백질 서열을 포함한다.

본 명세서의 구현예는 전체 스파이크 단백질 또는 스파이크 단백질의 일부를 포함할 수 있다. 전체 스파이크 단백질 및 이의 일부는 야생형 또는 원래의 서열로 제한되지 않으며 본 명세서에 기재된 돌연변이, 예컨대 개선하는 안정성을 개선하기 위한 것을 포함하는 점 돌연변이, 결실 등과 같은 하나 이상의 변형 및/또는 돌연변이를 갖는 스파이크 단백질 또는 이의 일부를 포함할 수 있다.

본 발명의 구현예는 상호 배타적이지 않다면 자유롭게 조합될 수 있다.

본 명세서에 기술된 임의의 특징 또는 특징의 조합은 본 발명의 범위에 포함되며, 단 임의의 그러한 조합에 포함된 특징은 문맥, 본 명세서, 및 당업자의 지식으로부터 명백할 바와 같이 상호 모순되지 않는다. 본 발명의 추가적인 이점 및 양태는 다음의 상세한 설명 및 청구범위에서 명백하다.

본 발명의 특징 및 이점은 첨부 도면과 관련하여 제공된 다음의 상세한 설명을 고려함으로써 명백해질 것이다.
도 1은 큰 서열의 범-코로나바이러스 재조합 백신 조성물의 예의 개략도를 보여준다. 재조합 백신 조성물 내의 각각의 큰 서열은 에피토프를 포함할 수 있다. CD8+ T 세포 에피토프는 정사각형으로 표시되고 CD4+ T 세포 에피토프는 원으로 표시되며 B-세포 에피토프는 마름모꼴로 표시된다. 각 모양(정사각형, 원형 또는 마름모꼴)은 다양한 에피토프를 나타낼 수 있으며 단일 에피토프에 제한되지 않는다. 다중 에피토프 범-코로나바이러스 백신은 표시된 대로 큰 서열의 특정 조합으로 제한되지 않는다. 큰 서열 범-코로나바이러스 백신은 다양한 수의 큰 서열을 포함할 수 있다.
도 2a는 인간 및 동물로부터 단리된 베타-코로나바이러스 균주의 게놈 서열의 진화적 비교를 나타낸다. 계통발생적 분석은 SARS-CoV-2 strainsp (박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스 (적색)), 천산갑 (마니스 야바니카 (청색)), 사향 고양이 (파구마 라바타 (녹색)), 및 낙타 (카멜루스 드로메다리에스 (갈색)로부터 수득된 동물의 SARS 유사 코로나바이러스 게놈 서열 (SL-CoV) 서열과 함께 인간 (호모사피엔스 (흑색))로부터 수득됨) 사이에서 수행된다. 포함된 SARS-CoV/MERS-CoV 균주는 이전의 발병 (수득된 from 인간 (Urbani, MERS-CoV, OC43, NL63, 229E, HKU1-유전자형-B), 박쥐 (WIV16, WIV1, YNLF-31C, Rs672, 재조합 균주), 낙타 (카멜루스 드로메다리에스, (KT368891.1, MN514967.1, KF917527.1, NC_028752.1), 및 사향 (Civet007, A022, B039)로부터 수득됨)로부터 유래된다. 인간 SARS-CoV-2 게놈 서열은 6개 대륙에서 제시될 수 있다.
도 2b는 6개 대륙에서 보고된 인간-SARS-CoV-2 게놈 서열 및 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스), 및 천산갑 (마니스 야바니카))로부터 수득된 SARS-CoV-2 게놈 서열 간의 진화론적 분석을 나타낸 것이다.
도 3a는 폐, 심장, 신장, 장, 뇌 및 고환이 ACE2 수용체를 발현하고 SARS-CoV-2 바이러스에 의해 표적화됨을 나타낸다. SARS-CoV-2 바이러스는 스파이크 표면 단백질을 통해 안지오텐신 전환효소 2(ACE2) 수용체에 도킹한다.
도 3b는 본 발명에서 이용되는 시스템 생물학 분석 접근법을 보여준다.
도 4는 SARS-CoV-2, 보통 감기 CoV 균주, MERS, SARS-CoV-Urbani 및 SARS-CoV-2 우한(Wuhan) 균주 (쿼리 균주; hCoV-19/batYN01)를 갖는 동물 CoV에 대한 서열 상동성 분석을 보여준다. 5개의 단편 SARS-CoV-2 게놈은 고도로 보존된 고도로 보존된 (1bp- 1580bp (단편 1), 3547bp- 12830bp (단편 2), 17472bp- 21156bp (단편 3), 22584bp- 24682bp (단편 4), 및 26193bp- 27421bp (단편 5)인 것으로 밝혀졌다.
도 5는 ORF1a/b의 일부를 포함하는 단편 1(1bp-1580bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(1-1580bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 28개의 변이체/균주가 발견되었다.
도 6은 단편 2(3547bp- 12830bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(3547-12830 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 30개의 변이체/균주가 발견되었다.
도 7은 단편 3 (17472bp- 21156bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(17472- 21156 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 8은 스파이크 단백질을 포함하는 단편 4 (22584bp- 24682bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(22584- 24682 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 29개의 변이체/균주가 발견되었다.
도 9는 단편 5 (26193bp- 27421bp)에 대한 서열 상동성 분석을 보여준다. 쿼리 서열(26193- 27421 bp hCoV-19/batYN01)는 모든 SARS-CoV-2 VOCs, 인간 CoV 균주, 박쥐, 천산갑, 사향 고양이로부터의 CoV 균주에 대한 BLAST였다. 이 쿼리된 영역에 대해 상당한 상동성을 갖는 31개의 변이체/균주가 발견되었다.
도 10은 잠재적인 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 보존성을 스크리닝하기 위한 서열 상동성 분석을 보여준다. 81,963개의 SARS-CoV-2 균주(현재 6개 대륙 190개국에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1-유전자형 B, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 잠재적인 CD8+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 노란색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 본 명세서에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 11a는 HLA-A^*02:01 분자에 대한 고도로 보존된 SARS-CoV-2 유래 인간 CD8+ T 세포 에피토프의 도킹, 예를 들어 HLA-A^*02:01 분자의 홈에 대한 27개의 고친화성 CD8+ T 세포 결합제 펩티드의 도킹을 보여준다.
도 11b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 HLA-A^*02:01 분자에 대한 27개의 고친화성 CD8+ T 세포 에피토프 펩티드의 상호작용 유사성 점수의 요약을 보여준다. 흑색 컬럼은 상호작용 유사성 점수가 높은 CD8+ T 세포 에피토프 펩티드를 도시한다.
도 12a는 CD8+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-A^*02:01 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 27개의 SARS-CoV-2 유래 CD8+ T 세포 에피토프 각각 10μM으로 밤새 자극하였다. IFN-γ 생산 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 12b는 도 12a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다.
도 12c는 HLA-A^*02:01 양성 COVID-19 환자로부터의 PBMC가 CD107a 및 CD107b, 및 골지플러그(Golgi-plug) 및 골지스탑(Golgi-stop)에 특이적인 mAb의 존재 하에 추가로 5시간 동안 추가로 자극된 실험의 결과를 보여준다. 그 다음, 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-발현에 특이적인 사량체를 FACS에 의해 측정하였다. 4개의 스파이크 CD8+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD8+ T 세포, CD107a/b+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 평균 빈도.
도 13a는 HLA-A^*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD8+ T 에피토프의 면역원성을 시험하는 실험에 대한 면역화 및 면역학적 분석의 시각표을 보여준다. 8개 그룹의 연령 일치 HLA-A^*02:01 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD8+ T 세포 펩티드 에피토프와 PADRE CD4+ T 헬퍼 에피토프가 혼합된 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 13b는 비장 유래 CD8+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. 림프구는 낮은 전방 산란 (FSC) 및 낮은 측방 산란 (SSC) 게이트에 의해 확인되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 CD8 양성 세포는 CD8 및 CD3 마커의 발현에 의해 게이팅되었다.
도 13c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (10⁶개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 각 ELISpot 이미지의 상단에 있는 숫자는 100만 개의 비장세포당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수를 나타낸다.
도 13d는 FACS에 의해 결정된 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 27개의 CD8+ T 세포 펩티드의 총 풀 중 10 μM의 10개의 면역우성 CD8+ T 세포 펩티드와 1개의 아우성 CD8+ T 세포 펩티드에 의한 IFN-γ 및 TNF- 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD8+ T 세포, CD107+CD8+ T 세포, CD69+CD8+ T 세포 및 TNF-+CD8+ T 세포의 빈도를 나타낸다.
도 14는 SARS-CoV/SARS-CoV-2 게놈이 16개의 비구조적 단백질(NSP1-NSP16)을 인코딩하는 2개의 큰 비-구조적 유전자 ORF1a(녹색) 및 ORF1b(회색)를 인코딩함을 보여준다. 게놈은 수, 게놈 조직, 서열 및 기능 면에서 SARS-CoV/SARS-CoV-2에 고유한 적어도 6개의 보조 단백질(밝은 회색 음영)을 인코딩한다. 일반적인 SARS-CoV, SARS-CoV-2 및 SL-CoV 유래 인간 B (청색), CD4+ (녹색) 및 CD8+ (흑색) T 세포 에피토프가 표시된다. 이 연구에 이용된 구조적 및 비구조적 열린 해독틀은 SARS-CoV-2-Wuhan-Hu-1 균주 (NCBI 수탁 번호 MN908947.3, 서열번호: 1)로부터의 것이다. SARS-CoV-2-Wuhan-Hu-1 구조적 및 비-구조적 단백질의 아미노산 서열은 본 명세서에 기재된 바와 같은 상이한 계산 알고리즘을 사용하여 인간 B, CD4+ 및 CD8+ T 세포 에피토프에 대해 스크리닝되었다. 인간과 동물 코로나바이러스 간에 고도로 보존된 게놈 전체 확인된 SARS-CoV-2 인간 B 세포 에피토프 (청색), CD4+ T 세포 에피토프 (녹색), CD8+ T 세포 에피토프 (흑색)가 보여진다.
도 15는 HLA-DR 분자에 높은 친화도로 결합하는 고도로 보존된 잠재적인 SARS-CoV-2 유래 인간 CD4+ T 세포 에피토프의 확인을 보여준다: SARS-CoV-2-Wuhan-Hu-1 균주(MN908947.3)의 전체 게놈 서열로부터의 잠재적인 HLA-DR-restricted CD4+ T 세포 에피토프 총 9,594개 중에서, HLA-DRB1 분자에 높은 친화도로 결합하는 16개의 에피토프가 선택되었다. 16개의 CD4+ T 세포 에피토프의 보존성은 인간 및 동물 코로나바이러스 중에서 분석되었다. 81,963개의 SARS-CoV-2 균주(현재 6개에서 순환), 이전에 발병한 4가지 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 중에서 16 CD4+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 녹색으로 강조 표시된 에피토프 서열은 현재 순환 중인 81,963개의 SARS-CoV-2 균주 간에 높은 수준의 상동성 및 이전의 발병으로부터의 2개 이상의 인간 SARS-CoV 균주, 및 물질 및 방법에 기재된 바와 같은 박쥐, 사향 고양이, 천산갑 및 낙타로부터 단리된 SL-CoV 균주 중에서 적어도 50% 보존성을 제공한다. 호모사피엔스- 흑색, 박쥐 (라이놀러퍼스 아피니스, 라이놀러퍼스 말라야누스-적색), 천산갑 (마니스 야바니카-청색), 사향 고양이 (파구마 라바타-녹색), 및 낙타 (카멜루스 드로메다리에스-갈색).
도 16a는 HLA-DRB1 분자에 대한 고도로 보존된 SARS-CoV-2 CD4+ T 세포 에피토프의 분자 도킹을 보여준다. 인간 SARS-CoV-2 균주, 이전의 인간 SARS/MERS-CoV 및 박쥐 SL-CoV 사이에 보존된 16개의 CD4+ T 세포 에피토프의 HLA-DRB1 단백질 결정 구조 (PDB 수탁 번호: 4UQ3)의 홈으로의 분자 도킹은 GalaxyPepDock 서버를 사용하여 결정되었다. 16개의 CD4+ T 세포 에피토프는 무차별적으로 HLA-DRB1^*01:01, HLA-DRB1^*11:01, HLA-DRB1^*15:01, HLA-DRB1^*03:01 및 HLA-DRB1^*04:01 대립유전자로 제한되어 있다. CD4+ T 세포 펩타이드는 볼 및 스틱 구조로 표시되고 HLA-DRB1 단백질 결정 구조는 주형으로 표시된다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수(TM 점수) 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 HLA-DRB1 주형 구조의 아미노산에서 접촉 잔기에 정렬된 CD8+ T 세포 펩티드의 아미노산의 유사성을 보여준다.
도 16b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 CD4+ T 세포 특이적 에피토프의 상호작용 유사성 점수를 나타내는 히스토그램을 보여준다.
도 17a는 CD4+ T 세포가 COVID-19 환자 및 노출되지 않은 건강한 개체에서 검출된 고도로 보존된 SARS-CoV-2 에피토프에 특이적임을 보여주는 실험 설계를 보여준다: HLA-DRB1 양성 COVID-19 환자(n = 30) 및 대조군에 노출되지 않은 건강한 개체(n = 10)을 단리하고 16개의 SARS-CoV-2 유래 CD4+ T 세포 에피토프 각각 10μM으로 28시간 동안 자극하였다. IFN-- 세포의 수는 ELISpot 분석을 사용하여 정량화되었다.
도 17b는 도 17a로부터의 결과를 보여준다. 점선은 반응의 상대적 크기를 평가하기 위한 역치를 나타낸다: 평균 SFC가 25 내지 50이면 중간/중간 반답에 해당하는 반면, 강한 반응은 평균 SFC > 50에 대해 정의된다. HLA-DRB1 양성 COVID-19 환자의 PBMC
도 17c는 CD107a 및 CD107b에 특이적인 mAb, 및 골지-플러그 및 골지-스톱의 존재 하에 추가로 5시간 동안 추가로 자극한 결과를 보여준다. 그 다음, 2개의 스파이크 에피토프, CD107a/b 및 CD69 및 TNF-알파 발현에 특이적인 사량체를 FACS에 의해 측정하였다. 2개의 스파이크 CD4+ T 세포 에피토프 펩티드 그룹으로 프라이밍한 후 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포의 빈도를 보여주는 대표적인 FACS 플롯. 사량체+CD4+ T 세포, CD107a/b+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF-+CD4+ T 세포에 대한 평균 빈도가 표시된다.
도 18a는 HLA-A^*02:01/HLA-DRB1 이중 형질전환 마우스에서 게놈 전체에 걸쳐 확인된 인간 SARS-CoV-2 CD4+ T 에피토프의 면역원성을 시험하기 위한 면역화 및 면역학적 분석의 시각표을 보여준다. 4개 그룹의 연령 일치 HLA-DRB1 형질전환 마우스(n = 3)를 명반 및 CpG1826 보조제로 전달된 4개의 SARS-CoV-2 유래 인간 CD4+ T 세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 음성 대조군으로서, 마우스는 보조제만을 투여받았다(모의 면역화됨).
도 18b는 비장 유래 CD4+ T 세포를 특성화하기 위해 사용된 게이팅 전략을 보여준다. CD4 양성 세포는 CD4 및 CD3 발현 마커에 의해 게이팅되었다.
도 18c는 SARS-CoV-2 구조적 및 비-구조적 단백질에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드로 48시간 동안 자극된 비장세포 (10⁶개의 세포/웰)로부터의 IFN-γ 생산 세포 스팟의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)을 보여준다. 총 세포 100만 개당 IFN-γ 생성 스팟 형성 T 세포(SFC)의 수가 각 ELISpot 이미지의 상단에 제시된다.
도 18d는 FACS에 의해 결정된 SARS-CoV-2에서 유래한 16개의 CD4+ T 세포 펩티드의 총 풀 중 10 μM의 7개의 면역우성 CD4+ T 세포 펩티드와 1개의 아우성 CD4+ T 세포 펩티드에 의한 IFN-γ 및 TNF-α 생산, 및 그에 대한 CD107a/b 및 CD69 발현의 대표적인 FACS 플롯 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널)를 보여준다 숫자는 3마리의 면역화된 마우스에서 검출된 IFN-γ+CD4+ T 세포, CD107+CD4+ T 세포, CD69+CD4+ T 세포 및 TNF- α+CD4+ T 세포의 백분율을 나타낸다.
도 19는 인간, 박쥐, 사향 고양이, 천산갑 및 낙타 코로나바이러스 균주 사이에서 스파이크 유래 B 세포 에피토프의 보존을 보여준다: 인간, 박쥐, 사향고양이, 천산갑, 및 낙타에서 얻은 SARS 코로나바이러스(SARS-CoV)의 29개의 균주 중 ClustalW를 사용하여 다중 서열 정렬을 수행하였다. 이는 7개의 인간 SARS/MERS-CoV 균주 (SARS-CoV-2-Wuhan (MN908947.3), SARS-HCoV-Urbani (AY278741.1), CoV-HKU1-유전자형-B (AY884001), CoV-OC43 (KF923903), CoV-NL63 (NC005831), CoV-229E (KY983587), MERS (NC019843)); 8개의 박쥐 SARS-CoV 균주 (BAT-SL-CoV-WIV16 (KT444582), BAT-SL-CoV-WIV1 (KF367457.1), BAT-SL-CoV-YNLF31C (KP886808.1), BAT-SARS-CoV-RS672 (FJ588686.1), BAT-CoV-RATG13 (MN996532.1), BAT-CoV-YN01 (EPIISL412976), BAT-CoV-YN02 (EPIISL412977), BAT-CoV-19-ZXC21 (MG772934.1); 3개의 사향고양이 SARS-CoV 균주 (SARS-CoV-Civet007 (AY572034.1), SARS-CoV-A022 (AY686863.1), SARS-CoV-B039 (AY686864.1)); 9개의 천산갑 SARS-CoV 균주 (PCoV-GX-P2V(MT072864.1), PCoV-GX-P5E(MT040336.1), PCoV-GX-P5L (MT040335.1), PCoV-GX-P1E (MT040334.1), PCoV-GX-P4L (MT040333.1), PCoV-MP789 (MT084071.1), PCoV-GX-P3B (MT072865.1), PCoV-Guangdong-P2S (EPIISL410544), PCoV-Guangdong (EPIISL410721)); 4개의 낙타 SARS-CoV 균주 (낙타-CoV-HKU23 (KT368891.1), DcCoV-HKU23 (MN514967.1), MERS-CoV-Jeddah (KF917527.1), Riyadh/RY141 (NC028752.1)) 및 1 재조합 균주 (FJ211859.1))을 포함한다. 청색으로 강조 표시된 영역은 서열 상동성을 나타낸다. SARS 코로나바이러스의 2개 이상의 균주 중에서 50% 이상의 보존성을 나타내거나 수용체 결합 도메인(RBD) 특정 아미노산을 보유하는 B 세포 에피토프를 후보 에피토프로 선택하였다.
도 20a는 인간 ACE2 수용체에 대한 SARS-CoV-2 스파이크 당단백질 유래 B 세포 에피토프의 도킹, 예를 들어 SARS-CoV-2 스파이크 당단백질로부터 확인된 22개의 B-세포 에피토프와 ACE2 수용체의 분자 도킹을 보여준다. B 세포 에피토프 펩티드는 볼 및 스틱 구조로 표시되는 반면 ACE2 수용체 단백질은 주형으로 표시된다. S471-501 및 S369-393 펩티드 에피토프는 수용체 결합 도메인 영역 특이적 아미노산 잔기를 보유한다. 예측 정확도는 선형 회귀에 의해 얻은 단백질 구조적 유사성 점수 및 상호작용 유사성 점수(SInter)에 의해 측정된 주형-표적 유사성과 정확하게 예측된 결합 부위 잔기의 분율 간의 관계로 선형 모델에서 추정된다. SInter는 ACE2 주형 구조의 아미노산에서 접촉 잔기에 정렬된 B 세포 펩티드의 아미노산 유사성을 보여준다. 더 높은 SInter 점수는 ACE2 분자와 B-세포 펩타이드 간의 더 중요한 결합 친화도를 나타낸다.
도 20b는 단백질-펩티드 분자 도킹 분석으로부터 관찰된 22개의 B 세포 특이적 에피토프의 상호작용 유사성 점수의 요약을 보여준다. 상호작용 유사성 점수가 높은 B 세포 에피토프는 흑색으로 표시된다.
도 21a는 면역화된 B6 마우스 및 회복기 COVID-19 환자에서 IgG 항체가 SARS-CoV-2 스파이크 단백질 유래 B-세포 에피토프에 특이적임을 보여주기 위한 시험을 위한 면역화 및 면역학적 분석의 시각표을 보여준다. SARS-CoV-2 Spike 단백질에서 선택되고 B6 마우스에서 테스트된 총 22개의 SARS-CoV-2 유래 B 세포 에피토프 펩타이드가 항체 반응을 유도할 수 있었다. 4개 그룹의 연령 일치 B6 마우스(n = 3)를 명반 및 CpG1826 보조제에 에멀젼화된 4개 또는 5개의 SARS-CoV-2 유래 B-세포 펩티드 에피토프의 혼합물로 0일째와 14일째에 피하로 면역화하였다. 명반/CpG1826 보조제만 음성 대조군으로 사용하였다(모의 면역화됨).
도 21b는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, 도 21b는 게이팅 전략이 다음과 같다는 것을 보여준다: 림프구는 낮은 전방 산란(FSC) 및 낮은 측면 산란(SSC) 게이트에 의해 식별되었다. 전방 산란 면적(FSC-A) 대 전방 산란 높이(FSC-H)를 플로팅하여 단일항을 선택하였다. 그 다음 B 세포는 CD3(-) 및 B220(+) 세포의 발현에 의해 게이트되었고 혈장 B 세포에 대한 CD138 발현이 결정되었다.
도 21c는 면역화된 마우스의 비장에서 유세포 분석에 의해 결정된 IgG 생성 CD3(-)CD138(+)B220(+) 혈장 B 세포의 빈도를 보여준다. 예를 들어, FG 15C는 면역화된 마우스의 비장에서 검출된 혈장 B 세포의 대표적인 FACS 플롯(왼쪽 패널) 및 평균 빈도(오른쪽 패널)를 보여준다. 혈장 CD138(-)B220(+)B 세포의 백분율은 각 도트 플롯의 왼쪽 상단에 표시된다.
도 21d는 SARS-CoV-2 유래 B-세포 에피토프-특이적 IgG 반응이 2차 면역화 후 14일(즉, 28일째)에 ELISpot (IgG(+) 스팟의 수)에 의해 면역 혈청에서 정량화되었음을 보여준다. 마우스 Poly-S(면역스팟)를 사용한 시험관 내 B 세포 다클론 자극 4일 후 항-펩티드 특이적 IgG 생성 B 세포 스팟 (1x10⁶ 비장세포/웰)의 대표적인 ELISpot 이미지 (왼쪽 패널) 및 평균 빈도 (오른쪽 패널). 각 ELISpot 이미지의 상단/왼쪽은 50만 세포당 IgG 생성 B 세포의 수를 보여준다. ELISA 플레이트를 각각의 개별 면역화 펩티드로 코팅하였다.
도 21e는 모의 백신접종된 마우스로부터 측정된 배경을 뺀 후 펩티드-면역화된 B6 마우스에서 검출된 IgG의 수준에서 ELISA에 의해 측정된 B-세포 에피토프-특이적 IgG 농도(μg/mL)를 보여준다. 파선 수평선은 검출 한계를 나타낸다.
도 21f 및 도 21g는 노출되지 않은 건강한 개체(n=10)로부터 측정된 배경의 차감 후, 각각의 22명의 스파이크 펩티드 검출된 SARS-CoV-2 감염된 환자 (n=40)의 수준에서 ELISA에 의해 측정된 B-세포 에피토프 특이적 IgG 농도(μg/mL)를 보여준다. 흑색 막대와 회색 막대는 각각 높은 면역원성 B 세포 펩티드와 중간 수준의 면역원성 B 세포 펩티드를 보여준다. 파선 수평선은 감지 한계를 나타낸다.
도 22는 6개의 프롤린 돌연변이를 포함하는 돌연변이를 포함하는 전체 스파이크 단백질의 예를 보여준다. 6개의 프롤린 돌연변이는 단일점 돌연변이 F817P, A892P, A899P, A942P, K986P 및 V987P를 포함한다. 추가로, 스파이크 단백질은 프로테아제 내성을 위한 퓨린 절단 부위의 682-QQAQ-685 돌연변이를 포함한다. 일부 구현예에서, K986P 및 V987P 돌연변이는 관류 안정화를 허용한다. 도 22는 또한 하기 서열을 나타낸다: MFVFLVLLPLVSS(서열번호: 188), ATGTTCGTGTTCCTGGTGCTGCTGCCCCTGGTGAGCAGC(서열번호: 175), CAGCAGGCCCAG(서열번호: 189), 및 CCCCCC(서열번호: 190).
도 23은 본 명세서에 기재된 조성물의 큰 서열이 어떻게 배열될 수 있는지의 비제한적인 예를 보여준다.
도 24는 본 발명의 프로토타입 코로나바이러스 백신의 개략도를 보여준다. 본 발명은 도시된 바와 같은 프로토타입 코로나바이러스 백신에 제한되지 않는다.
도 25a는 인간에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 25b는 인간에서 "프라임/부스트(prime/boost)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 25c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 25d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 인간에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.
도 26a는 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김(prime/pull)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11)을 추가로 투여하는 것을 포함한다.
도 26b는 가축 (예를 들어 고양이 또는 개)에서 "프라임/부스트(prime/boostl)" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하기 위한 방법의 비제한적 예를 보여준다. 방법은 제1 전달 시스템을 사용하여 제1 조성물, 예를 들어, 제1 범-코로나바이러스 재조합 백신 조성물 용량을 투여하고 제2 전달 시스템을 사용하여 제2 조성물, 예를 들어, 제2 백신 조성물 용량을 추가로 투여하는 것을 포함한다. 일부 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다.
도 26c는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/유지" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다.
도 26d는 SARS-CoV-2로부터 보호하기 위해 폐 상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시키기 위해 가축 (예를 들어 고양이 또는 개)에서 "프라임/당김/부스트" 레지멘을 사용하여 본 명세서에 기재된 백신 조성물을 전달하는 방법의 비제한적 예를 보여준다. 방법은 범-코로나바이러스 재조합 백신 조성물을 투여하고 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인(예를 들어, CXCL11 또는 CXCL17)을 투여하는 것을 포함한다. 방법은 T-세포 유인 케모카인(예를 들어, IL-7, IL-5, 또는 IL-2)을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 추가로 포함한다.

용어

달리 설명되지 않는 한, 본원에 사용된 모든 기술적 및 과학적 용어는 통상적으로 개시된 발명이 속한 당해기술의 숙련가에에 의해 이해되는 것과 동일한 의미를 갖는다. 단수 용어 'a', 'an', 및 'the'는 맥락상 달리 명확하게 나타내지 않는 한, 복수의 지시대상을 포함한다. 이와 유사하게, 단어 '또는'은 맥락상 달리 명확하게 나타내지 않는 한, '및'을 포함하기 위한 것이다. 용어 '포함하는'은 제시된 정의된 요소 이외에도, 다른 요소가 존재할 수 있음을 의미한다다. '~을/를 포함하는'의 사용은 제한보다 포함을 나타낸다. 또 다른 방식으로 언급될 때, 용어 '~을/를 포함하는'은 주로 하기를 포함하지만, 반드시 하기만을 포함하지 않는'을 의미한다. 또한, 단어 '~을/를 포함하는', 예컨대 '~들을 포함하다' 및 '~을/를 포함하다'의 변화는 이에 상응하여 동일한 의미를 갖는다. 일 측면에서, 본원에 기재된 기술은, 본 발명에 필수적이나 필수적일 수도 또는 그렇지 않을 수도 있는 불특정 요소의 포함에도 개방된, 본원에 기재된 조성물, 방법, 및 이들의 각각의 구성요소(들)에 관한 것이었다.('~을/를 포함하는').

본 개시내용의 구현예의 실시 및/또는 시험을 위한 적합한 방법 및 물질이 아래에 기재되어 있다.　이와 같은 방법 및 물질은 단지 예시적인 것으로, 제한하는 것으로 의도되지 않는다.　본원에 기재된 것들과 유사하거나 동등한 다른 방법 및 물질이 사용될 수 있다.　예를 들어, 본 개시내용과 관련한 당해 기술에 잘 알려진 종래의 방법이 다양한 일반 참조 문헌 및 좀 더 구체적인 참조문헌, 예컨대, 예를 들어, Sambrook 등, Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989; Sambrook 등, Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001; Ausubel 등, Current Protocols in Molecular Biology, Greene Publishing Associates, 1992 (and Supplements to 2000); Ausubel 등, Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999; Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990; 및 Harlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999, Gene Expression Technology (Methods in Enzymology, Vol. 185, edited by D. Goeddel, 1991. Academic Press, San Diego, Calif.), "Guide to Protein Purification" in Methods in Enzymology (M. P. Deutshcer, ed., (1990) Academic Press, Inc.); PCR Protocols: A Guide to Methods and Applications (Innis, 등 1990. Academic Press, San Diego, Calif.), Culture of Animal Cells: A Manual of Basic Technique, 2^nd Ed. (R. I. Freshney. 1987. Liss, Inc. New York, N.Y.), Gene Transfer and Expression Protocols, pp. 109-128, ed. E. J. Murray, The Humana Press Inc., Clifton, N.J.), and the Ambion 1998 Catalog (Ambion, Austin, Tex.)에 기재되어 있는데, 그 개시내용은 전체적으로 본원에 참조로 편입되었다.

본원에 기재된 것들과 유사하거나 동등한 방법 및 물질이 개시된 기술을 실시하거나 또는 실험하기 위해 사용될 수 있지만, 적합한 방법 및 물질이 아래에 기재되어 있다.　상기 물질, 방법, 및 예들은 단지 예시적인 것으로, 제한하는 것으로 의도되지는 않는다.

본원에서 사용된 바와 같이, 용어 '면역원성 단백질, 폴리펩티드, 또는 펩티드' 또는 '항원'은 숙주에 일단 투여되면, 상기 단백질을 겨냥하는 체액성 및/또는 세포 유형의 면역 반응을 유발할 수 있다는 점에서, 면역학적으로 활성인 폴리펩티드 또는 다른 분자 (또는 폴리펩티드와 다른 분자의 조합물)를 지칭한다. 구현예에서, 단백질 단편은 실질적으로 전체 단백질과 동일한 면역학적 활성을 갖는다. 따라서, 본 개시내용에 따른 단백질 단편은 적어도 하나의 에피토프 또는 항원 결정인자를 포함하거나 본질적으로 이들로 이루어지거나 또는 이들로 이루어질 수 있다. 본원에서 사용된 바와 같이 '면역원성' 단백질 또는 폴리펩티드는단백질의 전장 서열, 이것의 유사체, 또는 이것의 면역원성 단편을 포함할 수 있다. '면역원성 단편'은 하나 이상의 에피토프를 포함하고, 따라서 상기에 기재된 면역학적 반응을 유도하는 단백질의 단편을 지칭한다.

합성 항원은 또한 정의, 예를 들어, 폴리에피토프, 측접 에피토프, 및 다른 재조합 또는 합성으로 유래된 항원 내에 포함된다. 본 개시내용의 목적에 대한 면역원성 단편은 분자의 적어도 약 1개 아미노산, 적어도 약 3개 아미노산, 적어도 약 5개 아미노산, 적어도 약 10-15개 아미노산, 또는 약 15-25개 아미노산 또는 그 이상의 아미노산을 특징으로 할 수 있다. 단편의 길이에 임계 상한치는 존재하지 않으며, 단백질 서열의 거의 전장을, 또는 서열의 전장을 또는 상기 단백질의 적어도 하나의 에피토프를 포함하는 융합 단백질을 포함할 수 있다.

본원에서 사용된 바와 같이, 용어 '에피토프'는 특이적 B 세포 및/또는 T 세포가 반응하는 항원 또는 합텐 상의 부위를 지칭한다. 용어는 또한 '항원 결정인자' 또는 '항원 결정인자 부위'와 상호교환적으로 사용된다. 동일한 에피토프를 인식하는 항체들이 또 다른 항체의 표적 항원 결합을 차단하는 한 항체의 능력을 보여주는 단순한 면역검정에서 확인될 수 있다.

본원에서 사용된 바와 같이, 용어 조성물 또는 백신에 대한 '면역학적 반응'은 숙주에서 관심 대상 조성물 또는 백신에 대한 세포 및/또는 항체-매개 면역 반응의 전개를 지칭한다. 통상적으로, '면역학적 반응'은 다음의 효과들 중 하나 이상을, 비제한적으로, 포함한다: 관심 대상의 조성물 또는 백신에 포함된 항원 또는 항원에 특이적으로 지향된 항체, B 세포, 헬퍼 T 세포, 및/또는 세포독성 T 세포의 생산. 숙주는 치료적 또는 보호 면역학적 반응 중 하나를 보임으로써 새로운 감염에 대한 저항이 향상되거나 및/또는 질환의 임상적 중증도가 감소될 것이다. 이러한 보호가 감염된 숙주에 의해 정상적으로 드러나는 증상의 감소 또는 결여, 감염된 숙주에서 더 빨라진 회복 시간 및/또는 낮아진 바이러스 역가에 의해 입증될 것이다.

본원에서 사용된 바와 같이, 용어 '변이체'는 실질적으로 유사한 서열을 지칭한다. 폴리뉴클레오티드의 경우, 변이체는 천연(native) 폴리뉴클레오티드 내의 하나 이상의 부위에서 하나 이상의 뉴클레오티드의 결실 및/또는 첨가 및/또는 변경을 포함하고, 및/또는 천연 폴리뉴클레오티드의 하나 이상의 부위에서 하나 이상의 뉴클레오티드의 치환을 포함한다. 본원에서 사용된 바와 같이, '천연' 폴리뉴클레오티드 또는 폴리펩티드는 각각 자연 발생 뉴클레오티드 서열 또는 아미노산 서열을 포함한다. 본 개시내용의 특정 폴리뉴클레오티드(예를 들어, 기준 폴리뉴클레오티드)의 변이체는 또한 변이체 폴리뉴클레오티드에 의해 인코딩된 폴리펩티드와 기준 폴리뉴클레오티드에 의해 인코딩된 폴리펩티드 사이의 서열 동일성 퍼센트의 비교에 의해 평가될 수 있다. '변이체' 단백질은 천연 단백질의 하나 이상의 부위에서 하나 이상의 아미노산의 결실 또는 첨가에 의해 및/또는 천연 단백질의 하나 이상의 부위의 하나 이상의 아미노산의 치환에 의해 천연 단백질에서 유래된 단백질을 의미하기 위한 것이다. 본 개시내용에 의해 포괄된 변이체 단백질은 생물학적으로 활성으로, 즉, 면역 반응을 유발하는 능력을 가진다.

본원에 언급된 HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 ACE2 형질전환 마우스를 고유한 HLA-DR/HLA-A*0201 이중 형질전환 마우스와 교차시킴으로써 유래된 인간 COVID-19 백신 후보의 전-임상 실험을 위한 새로운 민감한 동물 모델이다. ACE2 형질전환 마우스는 폐, 심장, 신장 및 장에서 인간 ACE2 수용체를 발현하는 hACE2 형질전환 마우스 모델이다(Jackson Laboratory, Bar Harbor, ME). HLA-DR/HLA-A*0201 이중 형질전환 마우스는 상응하는 마우스 MHC 분자(녹아웃됨) 대신에 인간 백혈구 항원 HLA-A*0201 클래스 I 및 HLA DR*0101 클래스 II를 발현하는 '인간화된' HLA 이중 형질전환 마우스이다. HLA-A*0201 일배체형은 인종 또는 민족과 무관하게 인간 집단에서 상당히 재현(> 50%)되기 때문에 선택되었다. HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 '인간화된' 형질전환 마우스 모델이고 세 가지 이점을 갖는다: (1) 인간 SARS-CoV2에 감염되기 쉽다; (2) 인간의COVID-19에서 보여지는 증상들과 유사한 증상을 보인다; 및 (3) 인간 에피토프에 대한 CD4⁺ T 세포 및 CD8⁺ T 세포 반응을 보인다. 본 발명의 새로운 HLA-DR/HLA-A*0201/hACE2 삼중 형질전환 마우스 모델은 본 발명의 인간 다중-에피토프 COVID-19 백신 후보의 안전성, 면역원성 및 보호 효능의 전-임상 실험에 사용될 수 있다.

본원에서 사용된 바와 같이, 용어 '치료하다' 또는 '치료' 또는 '치료하는'은 요법적 치료 및 예방적 또는 방지적 방안을 지칭하되, 객체는 발병을 방지 또는 지연시키는 것으로, 예컨대 장애의 발달을 둔화시키거나, 또는 병태, 질환 또는 장애, 예를 들어, 장기 또는 조직의 불충분한 또는 바람직하지 않은 기능을 특징으로 하는 임의의 장애의 적어도 하나의 역효과 또는 증상을 감소시키는 것이다. 치료는 일반적으로 용어가 본원에 정의된 바와 같이, 하나 이상의 증상 또는 임상 마커가 감소될 경우, '효과적'이다. 대안적으로, 치료는 질병의 진행이 감소 또는 중단되는 경우에, '효과적'이다. 즉, '치료'는 증상의 개선 또는 질병의 마커의 쇠퇴 뿐만 아니라, 또한 치료의 부재 시 예상되는 증상의 진행 또는 악화의 중단 또는 서행을 포함한다. 유익한 또는 원하는 임상 결과에는, 검출가능하든 검출가능하지 않든지 간에, 비제한적으로, 하나 이상의 증상(들)의 완화, 질환 정도의 약화, 질병의 안정화된(예를 들어, 악화되지 않음) 상태, 질병 진행의 지연 또는 늦춤, 질병 상태의 개선 또는 경감 및 차도(부분적 또는 전체적으로)가 포함된다. '치료'는 또한 치료를 받지 않은 경우에 예상되는 생존율과 비교하여 생존 연장을 의미한다. '치료'는 또한 질병의 개선, 그것의 합병증의 중증도의 축소, 질병의 뚜렷한 발현 방비, 질병의 재발 방지, 단지 질병의 악화 방지, 거기에 포함되는 염증 반응의 경감, 또는 이와 같은 이 궁극적으로 성공하지 못한 경우라도 상기 언급된 것 중 어느 하나에라도 영향을 미치는 치료적 노력을 포함한다.

본원에서 사용된 바와 같이, 용어 '담체' 또는 '약제학적으로 허용가능한 담체' 또는 '약제학적으로 허용가능한 운반체'는 조성물을 개체에 유입시키기 위한 임의의 적절한 또는 유용한 담체 또는 운반체를 지칭한다. 약제학적으로 허용가능한 담체 또는 운반체는 종래의 것일 수 있으나, 종래의 운반체에 제한되지 않는다. 예를 들어, E. W. Martin, Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, PA, 15th Edition (1975) and D. B. Troy, ed. Remington: The Science and Practice of Pharmacy, Lippincott Williams & Wilkins, Baltimore MD and Philadelphia, PA, 21^st Edition (2006)에 하나 이상의 치료 화합물 또는 분자의 약제학적 전달을 위해 적합한 조성물 및 제형이 기술되었다. 담체(예를 들어, 약제학적 담체, 약제학적 운반체, 약제학적 조성물, 약제학적 분자, 등)는 신체에 일반적으로 분자, 단백질, 세포 및/또는 약물 및/또는 다른 적절한 물질을 전달하는 것으로 알려진 물질이다. 일반적으로, 담체의 본질은 이용되는 특정 투여 방식 뿐만 아니라 전달되는 조성물의 본질에 따라 달라질 것이다. 생물학적-중성 담체 이외에, 투여되는 약제학적 조성물은 소량의 비독성 보조 물질, 예컨대 습윤제 또는 유화제, 보존제 및 pH 완충제 등을 함유할 수 있다. 약제학적 담체를 기술한 특허에는, 비제한적으로 하기가 포함된다: 미국 특허 번호 제6,667,371호; 미국 특허 번호 제6,613,355호; 미국 특허 번호 제6,596,296호; 미국 특허 번호 제6,413,536호; 미국 특허 번호 제5,968,543호; 미국 특허 번호 제4,079,038호; 미국 특허 번호 제4,093,709호; 미국 특허 번호 제4,131,648호; 미국 특허 번호 제4,138,344호; 미국 특허 번호 제4,180,646호; 미국 특허 번호 제 4,304,767호; 미국 특허 번호 제4,946,931호, 이들의 개시내용은 전체적으로 본원에 참조로 편입되었다. 담체는 예를 들어, 고체, 액체(예를 들어, 용액), 포말, 겔 등, 또는 이들의 조합일 수 있다. 일부 구현예에서, 담체는 생물학적 매트릭스(예를 들어, 생물학적 섬유, 등)를 포함한다. 일부 구현예에서, 담체는 합성 매트릭스(예를 들어, 합성 섬유 등)를 포함한다. 특정 구현예에서, 담체의 일부는 생물학적 매트릭스를 포함할 수 있고, 그것의 나머지는 합성 매트릭스를 포함할 수 있다.

본원에서 사용된 바와 같이 '코로나바이러스'는 관련된 바이러스 예컨대, 비제한적으로, 중증 급성 호흡기 증후군(SARS), 중동호흡기 증후군(MERS) 및 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2)의 그룹을 지칭한다. 모든 코로나바이러스는 포유동물에서 '경미한'에서 '치명적인'의 범위에 속하는 기도 감염을 유발한다. 코로나바이러스 균주의 몇 개의 비-제한적인 예가 본원에 기재되어 있다.

본원에서 사용된 바와 같이, '중증 급성 호흡기 증후군 코로나바이러스 2 (SARS-CoV2)'는 코로나바이러스 질환 19(COVID-19)를 유발하는 베타코로나바이러스이다.

'대상체'는 개인으로, 비제한적으로, 포유동물(예를 들어, 인간, 말, 돼지, 토끼, 개, 양, 염소, 비-인간 영장류, 소, 고양이, 기니아 피그, 또는 설치류), 어류, 조류, 파충류 또는 양서류를 포함한다. 상기 용어는 특정 연령 또는 성별을 나타내지 않는다. 따라서, 성체 및 태아 뿐 아니라 신생 대상체가, 수컷이든 암컷이든, 포함되는 것이다. '환자'는 질병 또는 장애로 고통받는 대상체이다. 용어 '환자'는 인간 및 수의과 대상체를 포함한다.

용어 '투여하는', 및 '투여'는 대상체에 약제학적 제제를 제공하는 방법을 지칭한다. 이러한 방법은 당업자에 잘 알려져있고, 비제한적으로, 경구로, 비경구로(예를 들어, 정맥내로 및 피하로), 근육내 주사로, 복강내 주사로, 척추강내로, 경피로, 체외로, 국소로 조성물을 투여하는 것을 포함한다.

조성물은 또한 국소 비강내 투여(비강내로)에 의해 또는 흡입제에 의한 투여에 의해 투여될 수 있다. 본원에서 사용된 바와 같이, '국소 비강내 투여'는 콧구멍 하나 또는 둘 모두를 통해 코 및 비강으로 조성물의 전달을 의미하고, 분무 기구(장치) 또는 액적 기구(장치)에 의한, 또는 조성물의 에어로졸화를 통한 전달을 포함할 수 있다. 흡입제에 의한 조성물의 투여는 분무 또는 액적 기구에 의한 전달을 통해 코 또는 입을 통해 이루어질 수 있다. 본원에서 사용된 바와 같이, '흡입기'는 약제학적으로 허용가능한 담체 중 백신 조성물을 포함하는 조성물을 대상체의 비강 및 상부 및/또는 하부 기도로 전달하기 위한 분무 장치 또는 액적 장치일 수 있다. 전달은 기관내 삽관을 통해 호흡계(예를 들어, 폐)의 임의의 부위에 직접적일 수 있다. 필요한 조성물의 정확한 양은 인종, 연령, 체중 및 대상체의 일반적인 상태, 치료 중인 장애의 중증도, 사용된 특정 조성물, 그것의 투여 방식 등에 따라, 대상체 별로, 달라질 것이다. 따라서, 모든 조성물에 대한 정확한 양을 명시하는 것은 가능하지 않다. 그러나, 적절한 양은 본원의 교시를 고려해 볼 때, 일상적인 실험만을 사용하는 당업자에 의해 결정될 수 있다.

조성물은 또한 협측 전달 또는 설하 전달에 의해 투여될 수 있다. 본원에서 사용된 바와 같이 '협측 전달'은 화합물이 뺨의 내부를 감싸는 점막을 통해 전달되는 투여 방법을 지칭할 수 있다. 일부 구현예에서, 협측 전달을 위해, 상기 백신 조성물은 환자의 잇몸과 뺨 사이에 놓인다. 본원에서 사용된 바와 같이 '설하 전달'은 화합물이 혀 아래 점막을 통해 전달되는 투여 방법을 지칭할 수 있다. 일부 구현예에서, 설하 전달을 위해, 상기 백신 조성물이 환자의 혀 아래에 투여된다.

조성물의 비경구 투여가 사용되는 경우, 일반적으로 주사로 특징지어 진다. 주사제는 종래의 형태, 액체 용액 또는 현탁액, 주사 이전에 액체 중 현탁액 용액에 적합한 고체 형태, 또는 에멀젼 중 하나로 제조될 수 있다. 가장 최근에 개정된 비경구 투여를 위한 접근법은 일정한 복용량이 유지되도록 서방형 또는 지속형 제제의 사용을 수반한다. 예를 들어, 미국 특허 번호 제3,610,795호를 참고할 수 있는데, 이것은 본원에 참조로 편입된다.

본 화합물, 조성물, 및/또는 방법이 개시되고 기재되기 전에, 본 발명이 특정 합성 방법 또는 특정 조성물이 물론 달라질 수 있으나, 이들에 제한되지 않음이 이해되어야 한다. 또한 본원에 사용된 용어가 특정 구현예를 기술하기 위한 것일뿐, 제한하는 것으로 의도되지 않음이 이해되어야 한다. 본 발명의 구현예들은 상호 배타적이지 않다면, 서로 자유롭게 조합될 수 있다.

범(Pan)-코로나바이러스 백신

본 발명은 선제적인 범-코로나바이러스 백신, 사용 방법, 및 백신의 생산 방법, 코로나바이러스 감염 예방 방법 등을 특징으로 한다. 본 발명은 또한 백신을 실험하는 방법, 예를 들어, 특정 동물 모델 및 임상 시험을 사용하는 방법을 제공한다. 본원의 백신 조성물은, 예를 들어, 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도함으로써, 코로나바이러스 질병 또는 감염에 대한 효율적이고 강력한 보호를 유도할 수 있다.

상기 백신 조성물, 예를 들어, 본원의 항원은 다중 보존 에피토프를 포함할 수도 있고, 신체가 감염을 예방하기 위해 면역 반응을 전개시킬 다수의 기회를 제공하는 데 일조하는 다중 큰 서열을 특징으로 한다. 또한, 본원의 백신은 과거, 현재, 및 향후 코로나바이러스 발발에 대항하여 효과적이도록 설계될 수 있다.

상기 백신 조성물은 다중 큰 서열을 포함한다. 특정 구현예에서, 큰 서열은 보존된 큰 서열, 예를 들어, 인간 코로나바이러스 및/또는 동물 코로나바이러스(예를 들어, 코로나바이러스 감염에 취약한 동물에서 단리된 코로나바이러스) 사이에서 상당히 보존된 서열이다.

본 발명은 B 세포, CD4+ T 세포, 및 CD8+ T 세포 에피토프를 포함하는 보존된 큰 서열의 식별을 기술한다. 예를 들어, 도 1은 다중 B 세포 에피토프, 다중 보존된 CD8⁺ T 세포 에피토프, 및 다중 CD4+ T 세포 에피토프를 포함하는 다중 보존된 큰 서열을 특징으로 하는 선제적 범-코로나바이러스 백신의 개발의 개략도를 보여준다. 큰 서열은 많은 코로나바이러스의 서열 분석에서 유래된다.

보존된 큰 서열을 결정하기 위해 사용된 코로나바이러스는, 본원에 기재된 바와 같이, 동물 CoV(예를 들어, 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 등) 뿐만 아니라 인간 SARS-CoV를 포함할 수도 있다. 예로서, 도 2a 및 도 2b는 인간 및 동물에서 단리된 베타-코로나바이러스 균주들 사이에서 게놈 서열의 진화론적 비교를 보여준다. 도 2a는 박쥐에서 수득된 동물의 SARS-유사 코로나바이러스 게놈 서열(SL-CoVs) 서열(라이노로푸스 아피니스, 라이노로푸스 말라이아누스 (적색)), 천산값(마니스 자바니카(청색), 사향 고양이(파구마 라르바타(녹색), 및 낙타 (카멜루스 드로메다리우스(갈색))와 함께, SARS-CoV-2 균주들(인간(호모사피엔스(검정)에서 수득됨) 사이에서 수행된 계통발생적 분석을 보여준다. 포함된 SARS-CoV/MERS-CoV 균주는 이전의 발발에서 유래된다(인간(Urbani, MERS-CoV, OC43, NL63, 229E, HKU1-유전자형-B), 박쥐(WIV16, WIV1, YNLF-31C, Rs672, 재조합 균주), 낙타(카멜루스 드로메다리우스, (KT368891.1, MN514967.1, KF917527.1, NC_028752.1) 및 사향 고양이 (사향 고양이007, A022, B039)에서 수득됨). 인간 SARS-CoV-2 게놈 서열이 여섯 개 대륙에서 제시된다. 도 2b는 여섯 개 대륙에서 보고된 인간-SARS-CoV-2 게놈 서열과 박쥐에서 수득된 SARS-CoV-2 게놈 서열(라이노로푸스 아피니스, 라이노로푸스 말라이아누스), 및 천산갑(마니스 자바니카)) 사이에 수행된 진화론적 분석을 보여준다.

추가로, 다른 코로나바이러스는 '우려대상 변이체' 또는 '관심대상 변이체'로 분류된 기준을 충족시키는 보존된 큰 서열(동물 CoV(예를 들어, 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 등)) 뿐만 아니라 인간 SARS-CoVs를 포함)을 결정하기 위해 사용될 수도 있다. 하기에 언급되는 기준 중 하나 이상을 충족시키는 것으로 보이는 코로나바이러스 변이체는 이들 특성의 검증 및 유효성을 기다리는 동안 '관심대상 변이체' 또는 '연구 중인 변이체'로 표지될 수 있다. 일부 구현예에서, 기준은 증가된 전파력, 증가된 이환율, 증가된 사망률, '장기적 COVID'의 증가된 위험, 진단 시험에 의한 검출의 회피 능력, 항바이러스 약물(이와 같은 약물이 이용가능한 경우)에 대한 줄어든 감수성, 치료적이든(예를 들어, 회복 중인 플라즈마 또는 단클론성 항체) 또는 실험실 실험에서든, 중화 항체에 대한 줄어든 감수성, 자연 항체 회피 능력(예를 들어, 재감염 유발), 백신접종된 개체들을 감염시키는 능력, 특정 질환, 예컨대 다발계통 염증성 증후군 또는 장기적 COVID의 증가된 위험 또는, 특정 인구통계적 또는 임상 그룹, 예컨대 소아 또는 면역저하된 개체들에 대한 증가된 친화도를 포함할 수 있다. 일단 검증되면, 관심 대상의 변이체는 감시 조직, 예컨대 CDC에 의해 '우려대상 변이체'로 재명명된다.

보존된 큰 서열은 코로나바이러스의 구조적(예를 들어, 스파이크 당단백질, 외피 단백질, 막 단백질, 핵단백질) 또는 비-구조적 단백질(예를 들어, ORF1a/b에 의해 인코딩된 임의의 16 NSP)에서 유래될 수 있다.

일부 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: SARS-CoV-2 인간 균주, 박쥐에서 단리된 SL-CoV, 천산갑에서 단리된 SL-CoV, 사향 고양이에서 단리된 SL-CoV, 및 낙타에서 단리된 MERS 균주. 예를 들어, 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 적어도 50,000 SARS-CoV-2 인간 균주, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 3개 SL-CoV 및 낙타에서 단리된 4개 MERS 균주. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 적어도 80,000개 SARS-CoV-2 인간 균주, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 3개 SL-CoV, 및 낙타에서 단리된 4개 MERS 균주. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: COVI-19 팬데믹 중 유행 중인 적어도 50,000개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 CoV, 박쥐에서 단리된 5개 SL-CoV, 천산갑에서 단리된 5개 SL-CoV, 사향 고양이에서 단리된 SL-CoV 및 낙타에서 단리된 4개의 MERS 균주. 특정 구현예에서, 큰 서열 각각은 현재 유행 중인 적어도 1개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 CoV, 박쥐에서 단리된 적어도 하나의 SL-CoV, 천산갑에서 단리된 적어도 하나의 SL-CoV, 사향 고양이에서 단리된 적어도 하나의 SL-CoV 및 낙타에서 단리된 적어도 하나의 MERS 균주 사이에서 상당히 보존된다. 특정 구현예에서, 큰 서열 각각은 현재 유행 중인 적어도 1,000개 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발하였던 적어도 2개의 CoV, 박쥐에서 단리된 적어도 2개의 SL-CoV, 천산갑에서 단리된 적어도 2개의 SL-CoV, 사향 고양이에서 단리된 적어도 2개의 SL-CoV 및 낙타에서 단리된 적어도 2개의 MERS 균주 사이에서 상당히 보존된다. 특정 구현예에서, 큰 서열 각각은 하기 중 하나 또는 그 조합 사이에서 상당히 보존된다: 현재 유행 중인 적어도 하나의 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유도했던 적어도 하나의 CoV, 박쥐에서 단리된 적어도 하나의 SL-CoV, 천산갑에서 단리된 적어도 하나의 SL-CoV, 사향 고양이에서 단리된 적어도 하나의 SL-CoV 및 낙타에서 단리된 적어도 하나의 MERS 균주. 본 발명은 보존된 큰 서열을 식별하기 위해 사용될 수 있는 상기 언급된 코로나바이러스 균주에 제한되지 않는다.

특정 구현예에서, 보존된 큰 서열 중 하나 이상이 현재 유행 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전의 인간 발발을 유발했던 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 및 코로나바이러스를 잘 받아들이는 다른 동물로 이루어진 군에서 선택되는 동물에서 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기을 유발하는 하나 이상의 코로나바이러스. 현재 유행 중인 SARS-CoV-2 인간 균주 및 변이체는 원래 SARS-CoV-2 균주(SARS-CoV-2 단리물 Wuhan-Hu-1) 및 몇 개의 SARS-CoV-2 변이체, 비제한적으로, 스페인 균주 B.1.177; 오스트레일리아 균주 B.1.160, 잉글랜드 균주 B.1.1.7; 남아프리카 균주 B.1.351; 브라질 균주 P.1; 캘리포니아 균주 B.1.427/B.1.429; 스코틀랜드 균주 B.1.258; 벨기에/네덜란드 균주 B.1.221; 노르웨이/프랑스 균주 B.1.367; 노르웨이/덴마크.UK 균주 B.1.1.277; 스웨덴 균주 B.1.1.302; 북미, 유럽, 아시아, 아프리카 및 오스트레일리아 균주 B.1.525; 및 뉴욕 균주 B.1.526을 포함할 수 있다. 본 발명은 언급된 SARS-CoV-2 변이체에 제한되지 않고, 향후 확인되는 변이체를 아우른다. 보통 감기를 유발하는 하나 이상의 코로나바이러스는, 비제한적으로, 균주 229E(알파 코로나바이러스), NL63(알파 코로나바이러스), OC43(베타 코로나바이러스), HKU1(베타 코로나바이러스)를 포함할 수 있다.

본원에서 사용된 바와 같이, 용어 '보존된'은 서열 정렬 및 분석에서 식별된 가장 고도로 보존된 큰 서열에 속하는 큰 서열을 지칭한다. 예를 들어, 보존된 큰 서열은 식별된 2개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 3개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 4개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 5개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 6개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 7개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 8개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 9개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 10개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 15개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 20개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 25개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 30개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 40개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 50개의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존 서열은 식별된 50%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 60%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 큰 보존 서열은 식별된 70%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 80%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 90% 가장고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 95%의 가장 고도로 보존된 서열일 수 있다. 일부 구현예에서, 보존된 큰 서열은 식별된 99%의 가장 고도로 보존된 서열일 수 있다. 본 발명은 언급된 역치에 제한되지 않는다.

도 3a는 본 발명에서 이용된 시스템 생물학 접근법의 예를 보여준다.

일부 구현예에서, 조성물은 1개 이상의 큰 서열을 포함한다. 일부 구현예에서, 1개 이상의 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프 중 적어도 하나를 포함한다.

다른 구현예에서, 백신 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 둘 이상이 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프; 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프 중 적어도 하나를 포함한다.

일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD8⁺ 표적 에피토프 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD8⁺ 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 CD4⁺ 표적 에피토프를 포함한다. 일부 구현예에서, 큰 서열은 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프를 포함한다.

일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 CD8⁺ 표적 에피토프를 포함한다. 일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 CD4⁺ 표적 에피토프를 포함한다. 일부 구현예에서, 백신 조성물은 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프를 포함한다.

본원에서 논의되는 바와 같이, 특정 구현예에서, 백신 조성물은 전체의 스파이크 단백질, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 적어도 스파이크 단백질의 일부분(예를 들어, 일부분은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함함), 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프는 큰 서열의 형태로 존재할 수 있다.

상기 큰 서열 각각은 링커에 의해 분리될 수 있다. 특정 구현예에서, 링커는 큰 서열들 사이에서 쪼깨짐을 시행하는 효소를 허용한다. 본 발명은 특정 링커 또는 특정 길이의 링커에 제한되지 않는다. 예로서, 특정 구현예에서, 1개 이상의 큰 서열은 2 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 링커 3 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 4 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 5 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 6 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 7 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 8 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 9 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 10 개의 아미노산 길이의 링커에 의해 분리될 수 있다. 특정 구현예에서, 1개 이상의 큰 서열은 2 내지 10 개의 아미노산 길이의 링커에 의해 분리될 수 있다.

링커는 당업자에게 잘 알려져 있다. 링커의 비-제한적인 예에는 AAY, KK, 및 GPGPG가 포함된다.

상기 큰 서열은 구조 단백질, 비-구조 단백질, 또는 이들의 조합에서 유래될 수 있다. 예를 들어, 구조 단백질은 스파이크 단백질(S), 외피 단백질(E), 막 단백질(M), 또는 핵단백질(N)을 포함할 수 있다.

일부 구현예에서, 큰 서열은 적어도 하나의 SARS-CoV-2 단백질에서 유래된다. SARS-CoV-2 단백질은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질, 및 ORF10 단백질을 포함할 수 있다. ORF1ab 단백질은 비구조 단백질(Nsp), 예컨대 Nsp1, Nsp2, Nsp3(파파인-유사 프로테아제), Nsp4, Nsp5(3C-유사 프로테아제), Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12(RNA 중합효소), Nsp13(5' RNA 트리포스파타제 효소), Nsp14(구아노신N7-메틸트랜스퍼라제), Nsp15(엔도리보뉴클레아제) 및 Nsp16(2'-O-리보스-메틸트랜스퍼라제)을 제공한다.

상기 SARS-CoV-2는 게놈 길이가 29,903 염기쌍(bps) ssRNA(서열번호: 1)이다. 일반적으로, 266-21555 bps 사이의 영역이 ORF1ab 폴리펩티드의 유전 암호를 지정하고; 21563-25384 bps 사이의 영역이 구조 단백질(스파이크 단백질 또는 표면 당단백질) 중 하나의 유전 암호를 지정하고; 25393-26220 bps 사이의 영역이 ORF3a 유전자의 유전 암호를 지정하고; 26245-26472 bps 사이의 영역이 외피 단백질의 유전 암호를 지정하고; 26523-27191 사이의 영역이 막 당단백질(또는 막 단백질)의 유전 암호를 지정하고; 27202-27387 bps 사이의 영역이 ORF6 유전자의 유전 암호를 지정하고; 27394-27759 bps 사이의 영역이 ORF7a 유전자의 유전 암호를 지정하고; 27894-28259 bps 사이의 영역이 ORF8 유전자의 유전 암호를 지정하고; 28274-29533 bps 사이의 영역이 뉴클레오캡시드 인단백질(또는 뉴클레오캡시드 단백질)의 유전 암호를 지정하고; 및 29558-29674 bps 사이의 영역이 ORF10 유전자의 유전 암호를 지정한다.

상기 큰 서열은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형에 제한되고, 클래스 1의 경우 HLA-0201에, 클래스 2의 경우 HLA-DR에 제한되지 않는 T-세포 에피토프를 포함할 수 있다. 보존된 큰 서열은 인간 HLA 클래스 1 및 2 일배체형에 제한될 수 있다. 일부 구현예에서, 보존된 에피토프는 고양이 및 개 MHC 클래스 1 및 2 일배체형에 제한된다.

큰 서열

상기 항원은 큰 서열, 예컨대 인간 및 동물 코로나바이러스 중에서 상당히 보존된 보존된 큰 서열을 포함할 수 있다. 본원에서 사용된 바와 같이, 용어 큰 서열은 적어도 25개 아미노산 또는 적어도 75개 뉴클레오티드를 갖는 서열을 지칭한다. 큰 서열은 에피토프, 예컨대 본원에 기재된 보존된 에피토프를 포함한다.

보존된 큰 서열을 식별하기 위해, 하기 뿐만 아니라 본원에 기재된 바와 같이 서열 정렬 및 분석이 수행되었다.

SARS-CoV-2 및 이전의 코로나바이러스 균주 사이의 서열 비교: 서열 상동성 분석이 수행되었고, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 단리물 Wuhan-Hu-1을, SARS-CoV-2 변이체, 보통 감기 코로나 바이러스 균주(HKU1 유전자형 B, CoV-OC43, CoV-NL63, 및 CoV-229E), SARS-CoV-Urbani, 박쥐(라이노로푸스 아피니스 및 R. 말라이아누스), 천산갑(마니스 자바니카), 사향 고양이 (파구마 라르바타), 및 낙타(카멜루스 드로메다리우스 및 C.박트리아누스)에서 유래된 MERS 및 코로나바이러스 균주의 서열을 가진 완전한 게놈과 비교하였다.

상기 인간 SARS-CoV-2 변이체 게놈 서열이 GISAID 데이터베이스에서 회수되었는데, 이것은 그것의 고도의 전파성 및 병원성으로 알려진 주요한 우려대상 변이체를 나타낸다. 본 연구에서 사용된 서열은 스페인의 20A.EU1(EPI_ISL_691726-hCoV-19-VOC-20A.EU1), 오스트레일리아의 20A.EU2(EPI_ISL_418799-hCoV-19-VOC-20A.EU2), 잉글랜드의 B.1.1.7(EPI_ISL_581117-hCoV-19-VOC-B.1.1.7), 남아프리카의 B.1.351(EPI_ISL_660615-hCoV-19-VOC-B.1.351), 브라질의 P.1(EPI_ISL_581117-hCoV-19-VOC-P.1), 캘리포니아의 CAL.20C(EPI_ISL_730092-hCoV-19-VOC-B.1.427/B.1.429), 스코틀랜드의 B.1.258(EPI_ISL_858559-hCoV-19-VOC-B.1.258), 벨기에/네덜란드의 B.1.221(EPI_ISL_734790-hCoV-19-VOC-B.1.221), 노르웨이/프랑스의 B.1.367(EPI_ISL_541518-hCoV-19-VOC-B.1.367), 네덜란드/덴마크/UK의 B.1.1.277(EPI_ISL_500783-hCoV-19-VOC-B.1.1.277), 스웨덴의 B.1.1.302(EPI_ISL_717929-hCoV-19-VOC-B.1.1.302)이다. 유사하게, HKU1 유전자형 B(AY884001), CoV-OC43(KF923903), CoV-NL63(NC_005831) 및 CoV-229E(KY983587), SARS-CoV-Urbani(AY278741.1), MERS(NC_019843).

본 분석에 사용된 박쥐 CoV 균주는 균주 RaTG13(MN996532.2), Rs672/2006(FJ588686.1), YNLF_31C(KP886808.1), WIV1(KF367457.1), WIV16(KT444582.1), ZXC21(MG772934.1), RmYN02(EPI_ISL_412977), 박쥐-RmYN01(EPI_ISL_412976), MERS-박쥐-CoV/P.khulii/이태리/206645-63/2011 (MG596803.1)을 포함한다. 더 나아가, 천산갑을 나타내는 5개 게놈 서열 (MT040333.1-PCoV_GX-P4L, MT040334.1-PCoV_GX-P1E, MT040335.1-PCoV_GX-P5L, MT040336.1-PCoV_GX-P5E, MT072864.1-PCoV_GX-P2V, MT121216.1-PCoV-MP789), 3개의 사향 고양이 특이적 게놈 서열(AY572034.1, AY686864.1, AY686863.1) 및 낙타에서 유래된 4개의 CoV 서열(NC_028752.1, KF917527.1, MN514967.1, KT368891.1)이 CoV 게놈의 상이한 구조적 및 비-구조 단백질에서 가장 보존된 영역을 평가하는 것을 목표로 하는 본 서열 상동성 분석에 포함되었다. 이들 서열은 국립 바이오 기술 정보 센터(NCBI) 또는 모든 인플루엔자 데이터를 공유하는 세계적인 계획(GISAID) 중 하나에서 수득되었다. 계통발생적 분석을 위해, SARS-CoV-2 전체-게놈 서열은 MEGAX를 사용하여 CLUSTAL W와 함께 정렬되었다. 모든 SARS-CoV-2 서열은 온라인 NCBI BLAST를 사용하여 기존 게놈과 비교되었다.

SARS-CoV-2 서열 보존의 결정: 각각의 Wuhan-Hu-1(GeneBank: NC_045512.2) 특이적 구조적(스파이크 당단백질 (YP_009724390.1), 막 단백질(YP_009724393.1), 외피 단백질(YP_009724392.1), 뉴클레오캡시드 인단백질(YP_009724397.2)) 및 비구조 단백질(ORF1a/b 다단백질(YP_009724389.1), ORF3a(YP_009724391.1), ORF6(YP_009724394.1), ORF7a(YP_009724395.1), ORF7b(YP_009725318.1), ORF8 (YP_009724396.1) 및 ORF10(YP_009725255.1)) 단백질 서열이, Wuhan-Hu-1 단백질 및 그것의 비교 표적 사이의 쌍별 동일성을 계산하기 위해 뉴클레오티드 BLAST(blastn) 알고리즘을 사용하여, SARSCoV 및 MERS-CoV의 공통 단백질 서열 및 가장 근접한 상대적 교차 종 CoV 균주의 단백질 서열에 대해 비교되었다.

추가적으로, 본 발명이 CoV 균주 전역의 매우 유사한 서열에 관심이 있으므로, 거대적모구가 수행되었다. 의문이 제기된 서열 각가에 대해, 질의 범위, E 값, 퍼센트 동일성이 결정되었다. 하나의 박쥐 CoV 균주 RmYN01에 대해 수득된 의문이 제기된 상동성은, 계통발생적으로 SARS-CoV-2와 덜 유사한 것으로 조기에 발견되었으나, SARS-CoV-Urbani와 유전적 유사성이 좀 더 있어서, CoV 균주 전체에 걸친 상동성 서열을 확인하기 윈한 표준으로 택해졌다. 전략은 상이한 CoV들 중에서 영역들이 유전적으로 얼마나 더 보존되었는지 파악하는 데 도움이 되었다. 이와 같은 서열은 SARS-CoV-2 게놈 서열을 상대로 비교한 경우, 질의 범위는 59%이고 퍼센트 동일성을 78.73%이다. 서열에는 더 나아가 다른 CoV들 사이에서도 서열 상동성을 보였던 5개의 매칭된 영역이 있다. 1bp-1580bp(단편) 사이에 걸쳐진 매칭된 영역 1이 nsp1(리더 단백질), nsp2, 및 nsp3이 있는 서열 상동성을 보인 반면, 3547bp-7096bp(단편 2) 사이에 걸쳐진 매칭된 영역 2는 ORF1a/b의 다중 서브유닛, 예컨대 3CLpro, nsp6, nsp7, nsp8, nsp9, nsp10, RNA 의존 RNA 중합효소, 헬리카제, nsp14, nsp15 및 nsp16이 있는 서열 상동성을 보였다. 흥미롭게도, 17472bp-21156bp (단편 3) 사이의 ORF1a/b의 비-주석 영역에서 펼쳐진 주요 영역 또한 서열 동일성을 보였다. 서열 동일성의 제4 구간이, 중요하게도 SARS-CoV-2에서 주요 수용체 결합 구역을 덮는, 스파이크 당단백질의 단면을 덮는 22584bp-24682bp(단편 4)를 통해, 펼쳐졌다. 상동성 서열의 마지막 세그먼트는 ORF3a, 외피 단백질, 막 단백질, ORF6, 및 ORF7a(26193bp-27421bp; 단편 5)에 특이적인 영역과 퍼센트 동일성을 보였다.

일부 구현예에서, SARS-CoV-2 Wuhan 균주의 5개 단편이 가장 고도로 보존되었음이 밝혀졌다(1bp-1580bp(단편 1), 3547bp-12830bp(단편 2), 17472bp-21156bp(단편 3), 22584bp-24682bp(단편 4) 및 26193bp-27421bp(단편 5). 다음으로, 각 단편에 또 한 차례의 서열 상동성 분석을 수행하였다.

일부 구현예에서, 백신 조성물은 하나의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 1개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 2개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 3개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 4개 이상의 큰 서열을 포함한다. 일부 구현예에서, 백신 조성물은 5개 이상의 큰 서열, 예를 들어, 5, 6, 7, 8개 등을 포함한다.

일부 구현예에서, 큰 서열은 SARS-CoV-2에 의해 발현된 전체 단백질 서열에서 유래된다. 다른 구현예에서, 큰 서열은 SARS-CoV-2에 의해 발현된 부분적인 단백질 서열에서 유래된다. 일부 구현예에서, 단백질의 큰 서열은 인간 클래스 1 및 클래스 2 HLA 일배체형의 집단(인종 및 민족과 무관하게)의 100%를 아우르는 큰 수의, 예를 들어, 3 내지 10개의 상이한 일배체형에 제한된 B 세포 에피토프 및 T-세포 에피토프를 포함함으로써, 이들은 클래스 1의 경우 HLA-0201 또는 클래스 2의 경우 HLA-DR1에만 제한되지 않는다.

이전에 논의된 바와 같이, 큰 서열은 인간 및 동물 코로나바이러스 사이에서 고도로 보존될 수 있다. 일부 구현예에서, 큰 서열은 하기 중 하나 또는 그 조합에서 유래된다: 현재 유행 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전의 인간 발발을 유발했던 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향 고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군에서 선택된 동물에서 단리된 하나 이상의 코로나바이러스; 및/또는 보통 감기를 유발하는 하나 이상의 코로나바이러스.

이전에 논의된 바와 같이, 현재 유행 중인 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P를 포함할 수 있다. 보통 감기를 유발하는 코로나바이러스는 하기에서 선택될 수 있다: 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스, 및 HKU1 베타 코로나바이러스.

상기 큰 서열(들)은 구조 단백질, 비-구조 단백질, 또는 이들의 조합에서 유래될 수 있다. 큰 서열(들)은 ORF1ab 단백질, 스파이크 당단백질(예를 들어, RBD), ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질, 및/또는 ORF10 단백질에서 선택될 수 있다. ORF1ab 단백질이 비구조 단백질(Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함함을 유의해야 한다.

일부 구현예에서, 큰 서열은 전 세계 대다수의 국가에서 유행 중인 150,000개 이상의 CoV 균주의 보존된 단편을 포함한다(표 1, 도 4). 일부 구현예에서, 단편 1은 염기쌍 1-1580을 포함한다. 일부 구현예에서, 단편 1은 주석이 달리지 않은 영역 뿐만 아니라 단백질 Nsp1, Nsp2, 및 Nsp3을 포함할 수 있다(도 5). 일부 구현예에서, 단편 2는 염기쌍 3547-12830을 포함한다. 일부 구현예에서, 단편 2는 주석이 달리지 않은 영역 뿐만 아니라 단백질 Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15, Nsp16을 포함할 수 있다(도 6). 일부 구현예에서, 단편 3은 염기쌍 17472-21156을 포함한다. 일부 구현예에서, 단편 3은 주석이 달리지 않은 영역을 포함한다(도 7). 일부 구현예에서, 단편 4는 염기쌍 22584-24682를 포함한다. 일부 구현예에서, 단편 4는 스파이크 당단백질을 포함한다(도 8). 일부 구현예에서, 단편 5는 염기쌍 26193-27421을 포함한다. 일부 구현예에서, 단편 5는 주석이 달리지 않은 영역 뿐만 아니라 단백질 ORF3a, 외피(E), 막(M), ORF6, ORF7a를 포함한다(도 9).

일부 구현예에서, 큰 서열은 언급된 보존된 단편에 제한되지 않는다.

특정 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부(예를 들어, RBD), 핵단백질 또는 그의 일부, 막 단백질 또는 그의 일부, 및/또는 ORF1a/b 또는 그의 일부를 포함한다(참고 표 9, 서열번호: 139). 특정 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부 (예를 들어, RBD), 핵단백질 또는 그의 일부, 및 ORF1a/b 또는 그의 일부를 포함한다. 추가 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부(예를 들어, RBD), 및 뉴클레오캡시드 단백질 또는 그의 일부를 포함한다(참고 표. 9, 서열번호: 140).

본원에서 논의되는 바와 같이, 특정 구현예에서, 백신 조성물은 전체의 스파이크 단백질, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 적어도 스파이크 단백질의 일부분(예를 들어, 일부분은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함함), 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프를 포함한다. 일부 구현예에서, 하나 이상의 코로나바이러스 CD4+ T 세포 표적 에피토프; 및 하나 이상의 코로나바이러스 CD8+ T 세포 표적 에피토프는 큰 서열의 형태로 존재한다.

일부 구현예에서, 큰 서열(들)은 전장 스파이크 당단백질에서 유래된다. 다른 구현예에서, 큰 서열(들)은 스파이크 당단백질의 일부분에서 유래된다. 일부 구현예에서, 스파이크 단백질의 막관통 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 그것의 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛의 중심 나선의 최상부에서 아미노산 위치 986 및 987에서의 프롤린 치환으로 안정화된다. 일부 구현예에서, 조성물은 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가는 다가 표시(multivalent display)에 의한 면역원성을 증가시킨다.

일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487 (예를 들어, ACE-2 상에서 Tyr 83 및 Gln-24와 상호작용 하는 Tyr-489 및 Asn-487 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Gln-493(예를 들어, ACE-2 상에서 Glu-35 및 Lys-31과 상호작용하는 Gln-493 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Tyr-505(예를 들어, ACE-2 상에서 Glu-37 및 Arg-393과 상호작용하는 Tyr-505 지원)를 포함한다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함한다.

일부 구현예에서, 큰 서열(들)을 포함하는 스파이크 단백질은 적어도 하나의 프롤린 치환을 포함한다. 일부 구현예에서, 큰 서열(들)을 포함하는 스파이크 단백질은 적어도 2개의 프롤린 치환을 포함한다. 예를 들어, 프롤린 치환은 위치 K986 및 V987에 존재할 수 있다.

서열의 비-제한적인 예가 표 2에 개시되었다.

이전에 논의된 바와 같이, 각각의 큰 서열은 링커에 의해 분리된다. 일부 구현예에서, 링커는 동일한 링커이다. 일부 구현예에서, 하나 이상의 링커는 상이하다. 예를 들어, 일부 구현예에서, 상이한 링커는 각각의 큰 서열 사이에 사용된다. 이전에 논의된 바와 같이, 링커의 비-제한적인 예에는 T2A, E2A, P2A 등이 포함된다.

이전에 논의된 바와 같이, 특정 구현예에서, 백신 전달 시스템은 담체, 예컨대 지질 나노입자, 폴리머, 펩티드 등 뿐만 아니라 아데노바이러스, 예컨대, 비제한적으로, Ad5, Ad26, Ad35 등을 포함한다.

CD8+ 에피토프

잠재적 CD8+ T 세포 에피토프를 식별하고 잠재적 CD8+ T 세포 에피토프의 보존성을 선별하기 위한 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다. 본 발명은 본원에 사용된 특이적 일배체형에 제한되지 않는다. 예를 들어, 당업자는 분자 도킹 연구를 위해 대안적인 분자(예를 들어, HLA 분자)를 선택할 수 있다.

도 10은 잠재적 CD8+ T 세포 에피토프의 보존성을 선별하기 위한 서열 상동성 분석, 예를 들어, 81,963 SARS-CoV-2 균주(현재 6대륙 190개 국가에서 유행 중), 이전의 발발을 유발했던 4개 주요 '보통 감기' 코로나바이러스 (예를 들어, hCoV-OC43, hCoV-229E, hCoV-HKU1-유전자형 B, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 중에서 잠재적 CD8+ T 세포 에피토프에 대한 서열 상동성의 비교를 보여준다. 황색으로 강조 표시된 에피토프 서열은 현재 유행 중인 81,963 SARS-CoV-2 균주들 사이에 고도의 상동성을 제시하고, 이전의 발발에서 유래된 2개 이상의 인간 SARS-CoV 균주 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 균주에서 적어도 50% 보존성을 제시한다.

상기 분석에서, 27 CD8+ T 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 11a 및 도 11b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 HLA-A*02:01 분자의 홈에 도킹을 보여준다.

도 12a, 도 12b, 및 도 12c는 본원에 개시된 몇 개의 가장 고도로 보존된 SARS-CoV-2 에피토프에 특이적인 CD8+ T 세포가 COVID-19 환자 및 미노출된 건강한 개체들에서 검출되었음을 보여준다. 도 13a, 도 13b, 도 13c 및 도 13d는 식별된 SARS-CoV-2 CD8+ T 세포 에피토프의 면역원성을 보여준다.

앞서 논의된 CD8⁺T 세포 표적 에피토프에는 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab_1675-1683,ORF1ab_2363-2371, ORF1ab_3013-3021, ORF1ab_3183-3191, ORF1ab_5470-5478, ORF1ab_6749-6757, ORF7b_26-34, ORF8a_73-81, ORF10_3-11 및 ORF10_5-13이 포함된다. 도 14는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab₁₆₇₅ _-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab_3183-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab₆₇₄₉ _-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, ORF10₅ _-13, 또는 이들의 조합에서 선택된 하나 이상의 CD8⁺ T 세포 에피토프를 포함할 수 있다. 하기의 표 3은 언급된 에피토프 영역에 대한 서열을 기술한다.

본 발명은 언급된 CD8⁺ T 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명 또한 언급된 CD8⁺ T 세포 에피토프의 변이체, 예를 들어 상기 언급된 CD8⁺ T 세포 에피토프가 하나의 아미노산에 의해 말단절단된 서열(예들이 하기 표 4에 보여짐)을 포함한다.

본 발명은 언급된 CD8⁺ T 세포 에피토프에 제한되지 않는다.

특정 구현예에서, 백신 조성물은 1-10개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-10개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 CD8⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 CD8⁺ T 세포 표적 에피토프를 포함한다.

CD4+ 에피토프

잠재적 CD4+ T 세포 에피토프를 식별하고 잠재적 CD4+ T 세포 에피토프의 보존성을 선별하기 위한 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다. 본 발명은 본원에 사용된 특이적 일배체형에 제한되지 않는다. 예를 들어, 당업자는 분자 도킹 연구를 위한 대안적인 분자(예를 들어, HLA 분자)를 선택할 수 있다.

도 15는 고친화도로 HLA-DR 분자와 결합되는 가장 고도로 보존된 잠재적 SARS-CoV-2 유래 인간 CD4+ T 세포 에피토프의 식별을 보여준다. SARS-CoV-2-Wuhan-Hu-1 균주(MN908947.3)의 전체의 게놈 서열에서 유래된 총 9,594개 잠재적 HLA-DR-제한 CD4+ T 세포 에피토프 중에서, 고친화도로 HLA-DRB1 분자와 결합되는 16개의 에피토프가 선택되었다. 16 CD4+ T 세포 에피토프의 보존성이 인간 및 동물 코로나바이러스 사이에서 분석되었다. 81,963개의 SARS-CoV-2 균주(현재 6대륙에서 유행 중) 중 16개의 CD4+ T 세포 에피토프, 이전의 발발을 유발했던 4개의 주요 '보통 감기' 코로나바이러스(즉 hCoV-OC43, hCoV-229E, hCoV-HKU1, 및 hCoV-NL63) 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리되었던 SL-CoV 사이의 서열 상동성의 비교가 나타나 있다. 초록색으로 강조 표시된 에피토프 서열은 현재 유행 중인 81,963개의 SARS-CoV-2 균주들 사이에 고도의 상동성을 제시하고, 이전의 발발에서 유래된 2개 이상의 인간 SARS-CoV 균주 및 박쥐, 사향 고양이, 천산갑 및 낙타에서 단리된 SL-CoV 균주에서 적어도 50% 보존성을 제시한다.

상기 분석에서, 16개의 CD4+ T 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 16a 및 도 16b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 HLA-A*02:01 분자의 홈으로의 도킹을 보여준다.

도 17a, 도 17b, 및 도 17c는 본원에 개시된 몇 개의 가장 고도로 보존된 SARS-CoV-2 에피토프에 특이적인 CD4+ T 세포가 COVID-19 환자 및 미노출된 건강한 개체들에서 검출되었음을 보여준다. 도 18a, 도 18b, 도 18c, 및 도 18d는 식별된 SARS-CoV-2 CD4+ T 세포 에피토프의 면역원성을 보여준다.

앞서 논의된 CD4⁺T 세포 표적 에피토프는 ORF1a_1350-1365, ORF1ab_5019-5033, ORF6_12-26, ORF1ab_6088-6102, ORF1ab_6420-6434, ORF1a_1801-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a_3-17, ORF7a_1-15, ORF7b_8-22, ORF7a_98-112 및 ORF8_1-15.를 포함한다. 도 14는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 ORF1a_1350-1365, ORF1ab_5019-5033, ORF6_12-26, ORF1ab_6088-6102, ORF1ab_6420-6434, ORF1a_1801-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a_3-17, ORF7a_1-15, ORF7b_8-22, ORF7a_98-112, ORF8_1-15, 또는 이들의 조합에서 선택된 하나 이상의 CD4⁺T 세포 표적 에피토프를 포함할 수 있다. 하기의 표 5는 상기 언급된 에피토프 영역에 대한 서열을 기술한다.

본 발명은 언급된 CD4⁺ T 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명은 또한 상기 언급된 CD4⁺ T 세포 에피토프의 변이체, 예를 들어, 상기 언급된 CD4⁺ T 세포 에피토프가 하나 이상의 아미노산에 의해 말단절단되거나, 또는 하나 이상의 아미노산에 의해 연장된 서열을 포함한다(하기 표 6에 예들이 보여짐).

본 발명은 언급된 CD4⁺ T 세포 에피토프에 제한되지 않는다.

특정 구현예에서, 백신 조성물은 1-10개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-10의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 CD4⁺ T 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 CD4⁺ T 세포 표적 에피토프를 포함한다.

B 세포 에피토프

잠재적 B 세포 에피토프를 식별하고 잠재적 B 세포 에피토프의 보존성을 선별하는 방법의 예들이 본원에 기재되어 있다. 본 발명은 개시된 특정 소프트웨어 시스템에 제한되지 않고, 이와 같은 방법을 위해 다른 소프트웨어 시스템이 당업자에게 접근가능하다.

도 19는 인간, 박쥐, 사향 고양이, 천산갑, 및 낙타 코로나바이러스 균주에서 스파이크 유래 B 세포 에피토프의 보존을 보여준다. 인간, 박쥐, 사향 고양이, 천산갑, 및 낙타에서 수득된 SARS 코로나바이러스(SARS-CoV)의 29개의 균주에서 ClustalW를 사용하여 다중 서열 정렬을 수행하였다. 이것은 7개의 인간 SARS/MERS-CoV 균주(SARS-CoV-2-Wuhan(MN908947.3), SARS-HCoV-Urbani(AY278741.1), CoV-HKU1-유전자형-BAY884001), CoV-OC43(KF923903), CoV-NL63(NC005831), CoV-229E(KY983587), MERS(NC019843)); 8개의 박쥐 SARS-CoV 균주(박쥐-SL-CoV-WIV16(KT444582), 박쥐-SL-CoV-WIV1(KF367457.1), 박쥐-SL-CoV-YNLF31C(KP886808.1), 박쥐-SARS-CoV-RS672(FJ588686.1), 박쥐-CoV-RATG13(MN996532.1), 박쥐-CoV-YN01(EPIISL412976), 박쥐-CoV-YN02(EPIISL412977), 박쥐-CoV-19-ZXC21(MG772934.1); 3개의 사향 고양이 SARS-CoV 균주(SARS-CoV-사향 고양이007(AY572034.1), SARS-CoV-A022 (AY686863.1), SARS-CoV-B039(AY686864.1)); 9개의 천산갑 SARS-CoV 균주(PCoV-GX-P2V(MT072864.1), PCoV-GX-P5E(MT040336.1), PCoV-GX-P5L(MT040335.1), PCoV-GX-P1E(MT040334.1), PCoV-GX-P4L(MT040333.1), PCoV-MP789(MT084071.1), PCoV-GX-P3B(MT072865.1), PCoV-Guangdong-P2S(EPIISL410544), PCoV-Guangdong(EPIISL410721)); 4개의 낙타 SARS-CoV 균주(낙타-CoV-HKU23 (KT368891.1), DcCoV-HKU23(MN514967.1), MERS-CoV-Jeddah(KF917527.1), Riyadh/RY141(NC028752.1)) 및 1개의 재조합 균주(FJ211859.1))를 포함한다. 청색으로 강조 표시된 영역은 서열 상동성을 나타낸다. SARS 코로나바이러스의 2개 이상의 균주에서 적어도 50% 보존성을 보였거나 고, 또는 수용체 결합 도메인(RBD) 특이적 아미노산을 소유한 B 세포 에피토프가 후보 에피토프로서 선택되었다.

상기 분석에서, 22개의 B 세포 에피토프가 가장 고도로 보존된 것으로 선택되었다. 도 20a 및 도 20b는 단백질-펩티드 분자 도킹 분석에 의해 결정된 상호작용 점수 뿐만 아니라 보존된 에피토프의 ACE2 수용체로의 도킹을 보여준다. 도 21a, 도 21b, 도 21c, 도 21d, 도 21e, 도 21f 및 도 21g는 식별된 SARS-CoV-2 B 세포 에피토프의 면역원성을 보여준다.

앞서 논의된 B 세포 표적 에피토프는 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, S_59-81 및 S_13-37을 포함한다. 도 2b는 에피토프의 게놈 전체 위치를 보여준다. 따라서, 특정 구현예에서, 백신 조성물은 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, S_59-81, 및 S_13-37에서 선택된 하나 이상의 B 세포 표적 에피토프를 포함할 수 있다. 일부 구현예에서, B 세포 에피토프는 전체 스파이크 단백질이다. 일부 구현예에서, B 세포 에피토프는 스파이크 단백질의 일부분이다. 하기 표 7은 언급된 에피토프 영역에 대한 서열을 기술한다.

본 발명은 언급된 B 세포 에피토프에 제한되지 않는다. 예를 들어, 본 발명은 또한 상기 언급된 B 세포 에피토프의 변이체, 예를 들어 상기 언급된 B 세포 에피토프가 하나 이상의 아미노산에 의해 말단절단된, 또는 하나 이상의 아미노산에 의해 연장된 서열을 포함한다(하기 표 8에 예들이 보여짐).

이전에 논의된 바와 같이, 일부 구현예에서, B 세포 에피토프는 전체 스파이크 단백질의 형태롤 존재한다. 일부 구현예에서, B 세포 에피토프는 스파이크 단백질의 일부분의 형태로 존재한다. 일부 구현예에서, 스파이크 단백질의 막관통 앵커는 온전한 S1-S2 절단 부위를 갖는다. 일부 구현예에서, 스파이크 단백질은 그것의 안정화된 형태로 존재한다. 일부 구현예에서, 스파이크 단백질은 S2 서브유닛의 중심 나선의 최상부에 있는 아미노산 위치 986 및 987에서의 프롤린 치환으로 안정화된다. 일부 구현예에서, 조성물은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함한다. 일부 구현예에서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래된 폴돈 삼량체화 도메인의 첨가에 의해 변형된다. 일부 구현예에서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 첨가가 다가 표시에 의해 면역원성을 증가시킨다. 도 22는 하나 이상의 돌연변이를 포함하는 스파이크 단백질의 비-제한적인 예를 보인다.

일부 구현예에서, 스파이크 단백질은 Tyr-489 및 Asn-487(예를 들어,ACE-2 상에서 Tyr 83 및 Gln-24와의 상호작용을 갖는 Tyr-489 및 Asn-487 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Gln-493(예를 들어, ACE-2 상에서 Glu-35 및 Lys-31와의 상호작용을 갖는 Gln-493 지원)을 포함한다. 일부 구현예에서, 스파이크 단백질은 Tyr-505(예를 들어, ACE-2 상에서 Glu-37 및 Arg-393과의 상호작용을 갖는 Tyr-505 지원)를 포함한다. 일부 구현예에서, 조성물은 S1-S2 절단 부위에 돌연변이 682-RRAR-685→ 682-QQAQ-685를 포함한다.

일부 구현예에서, 조성물은 적어도 하나의 프롤린 치환을 포함한다. 일부 구현예에서, 조성물은 적어도 2개의 프롤린 치환을 포함한다. 예를 들어, 프롤린 치환은 위치 K986 및 V987에 존재할 수 있다.

특정 구현예에서, 백신 조성물은 1-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-30개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 2-5개의 B 세포 표적 에피토프를포함한다. 특정 구현예에서, 백신 조성물은 5-10개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-15개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-25개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 5-30개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-20개의 B 세포 표적 에피토프를 포함한다. 특정 구현예에서, 백신 조성물은 10-30개의 B 세포 표적 에피토프를 포함한다.

특정 구현예의 경우, 선택된 에피토프는 결합 검정(예를 들어, HLA 분자에 결합에 대한)에서 특정 점수를 달성하는 것일 수 있다. 예를 들어, 일부 구현예에서, 선택된 에피토프는 ELISA 결합 검정(예를 들어, HLA-DR/펩티드 조합, HLA-A*0201/펩티드 조합 등에 대한 특이적인 ELISA 결합 검정)에서 IC₅₀점수가 250 이하이거나, 또는 상이한 결합 검정에서 250 이하의 IC₅₀ 점수의 등가물을 갖는다. 결합 검정은 당업자에 잘 알려져 있다.

큰 서열(들) 배열

상기 기재된 조성물의 큰 서열은 다양한 구성으로 배열될 수 있다(도 23 참고). 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1a/b 단백질 또는 그의 일부분이 있고, 이어서 핵단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1a/b 단백질 또는 그의 일부분이 있고, 이어서 핵단백질 또는 그의 일부분이 있고, 이어서 막(M) 또는 그의 일부분이 있도록 배열될 수 있다.

일부 구현예에서, 큰 서열은 ORF1a/b 단백질 또는 그의 일부분에 이어서 핵단백질(N) 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 ORF1a/b 단백질 또는 그의 일부분에 이어서 핵단백질(N) 또는 그의 일부분이 있고, 이어서 막(M) 또는 그의 일부가 있도록 배열될 수 있다.

일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 1 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어 단편 2 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 4 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 5 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 단편 1 또는 그의 일부분이 있고, 이어서 단편 5 또는 그의 일부분이 있도록 배열될 수 있다.

일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 뉴클레오캡시드 단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 ORF1ab 단백질 또는 그의 일부분이 있고, 이어서 ORF3 단백질 또는 그의 일부분이 있고, 이어서 외피 단백질 또는 그의 일부분이 있고, 이어서 막 단백질 또는 그의 일부분이 있고, 이어서 ORF6 단백질 또는 그의 일부분이 있고, 이어서 ORF7a 단백질 또는 그의 일부분이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 막 단백질 또는 그의 일부분이 있고, 이어서 외피 단백질 또는 그의 일부분이 있고, 이어서 Nsp3 단백질 또는 그의 일부분이 있고, 이어서 Nsp5 단백질 또는 그의 일부분이 있고, 이어서 Nsp12 단백질 또는 그의 일부분이 있도록 배열될 수 있다.

일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 하나의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 2개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 3개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 4개의 큰 서열이 있도록 배열될 수 있다. 일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 5개의 큰 서열이 있도록 배열될 수 있다.

일부 구현예에서, 큰 서열은 스파이크 당단백질(S) 또는 그의 일부분(예를 들어, RBD)에 이어서 하나의 큰 서열이 있도록 배열될 수 있다. 둘 모두는 프로모터에 의해 각각 구동되거나, 또는 둘 모두 단일 프로모터에 의해서 구동되지만, 도 x, y 및 z에 예시된 바와 같이 링커에 의해 분리된다.

백신 후보

이전에 논의된 바와 같이, 본 발명은 하기를 특징으로 하는 항원을 포함하는 백신 조성물을 제공한다: 1개 이상의 큰 서열, 2개 이상의 큰 서열, 3개 이상의 큰 서열, 4개 이상의 큰 서열, 또는 5개 이상의 큰 서열. 일부 구현예에서, 큰 서열은 적어도 하나의 B 세포 에피토프 및 적어도 하나의 CD4+ T 세포 에피토프, 적어도 하나의 B 세포 에피토프 및 적어도 하나의 CD8+ T 세포 에피토프, 적어도 하나의 CD4+ T 세포 에피토프 및 적어도 하나의 CD8+ T 세포 에피토프, 또는 적어도 하나의 B 세포 에피토프, 적어도 하나의 CD4+ T 세포 에피토프, 및 적어도 하나의 CD8+ T 세포 에피토프를 포함한다.

표 9 및 도 24는 본원에 기재된 백신 조성물의 예들을 보여준다. 본 발명은 표 9의 예들에 제한되지 않는다.

상기에 언급된 바와 같이, 본 발명은 표 9의 예들에 제한되지 않는다. 일부 구현예에서, 백신 후보는 본원에 기재되어 보여지는 바와 같이 다양한 조각들(예를 들어 프로모터, 단백질, 보조제)을 포함할 수 있다.

표 10은 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 단백질의 비-제한된 예들을 보여준다. 일부 구현예에서, 하기에 나열된 단백질은 복수의 조합으로 배열될 수 있다. 일부 구현예에서, 단백질들은 직접적으로 서로 연결될 수 있다. 다른 구현예에서, 단백질들은 링커를 통해 서로 연결된다.

표 10은 스파이크 단백질의 비-제한적인 예를 보여준다.

분자 보조제 및 T 세포 향상

특정 구현예에서, 백신 조성물은 분자 보조제 및/또는 하나 이상의 T 세포 향상 조성물을 포함한다. 보조제 및/또는 향상 조성물은 백신 조성물의 면역원성 및/또는 장기간 기억을 개선하는 데 일조할 수 있다. 분자 보조제의 비-제한적인 예는 CpG, 예컨대 CpG 폴리머, 및 플라젤린을 포함한다.

일부 구현예에서, 백신 조성물은 T 세포 유인 케모카인을 포함한다. T 세포 유인 케모카인은 순환계에서 적절한 조직, 예를 들어, 폐, 심장, 신장, 및 뇌로 T 세포를 끌어내는 데 일조한다. T 세포 유인 케모카인의 비-제한적인 예는 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 또는 이들의 조합을 포함한다.

일부 구현예에서, 백신 조성물은 T 세포 증식을 촉진하는 조성물을 포함한다. T 세포 증식을 촉진하는 조성물의 비-제한적인 예는 IL-7, IL-15, IL-2, 또는 이들의 조합을 포함한다.

일부 구현예에서, 백신 조성물은 폐에서 T 세포 귀소를 촉진하는 조성물을 포함한다. T 세포 귀소를 촉진하는 조성물의 비-제한적인 예는 CCL25, CCL28, CXCL14, CXCL17 또는 이들의 조합을 포함한다.

특정 구현예에서, 분자 보조제 및/또는 T 세포 유인 케모카인 및/또는 T 세포 증식을 촉진하는 조성물은 큰 서열의 별개의 항원 전달 시스템을 이용하여 전달된다.

표 11는 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 T-세포 향상의 비-제한적인 예를 보여준다.

바람직한 구현예에서, 본원에 기재된 T-세포 향상 조성물(예를 들어, CXCL9, CXCL10, IL-7, IL-2)은 백신 조성물의 별개의 전달 시스템으로 통합될 수 있다. 일부 구현예에서, 본원에 기재된 T-세포 향상 조성물(예를 들어 CXCL9, CXCL10, IL-7, IL-2)은 백신 조성물과 동일한 전달 시스템으로 통합될 수 있다.

특정 구현예에서, 백신 조성물은 태그를 포함한다. 예를 들어, 일부 구현예에서, 백신 조성물은 His 태그를 포함한다. 본 발명은 His 태그에 제한되지 않고, 다른 태그, 예컨대 당업자에게 알려진 것들, 예컨대 형광 태그(예를 들어, GFP, YFP, 등)을 포함한다.

항원 전달 시스템

본 발명은 또한 항원 전달 시스템의 형태인 백신 조성물을 특징으로 한다. 임의의 적절한 항원 전달 시스템이 본원에 기재된 항원의 전달을 위해 고려될 수 있다. 본 발명은 본원에 기재된 항원 전달 시스템에 제한되지 않는다.

특정 구현예에서, 항원 전달 시스템은 백신 조성물의 표적화된 전달을 위한 것으로, 예를 들어, 바이러스가 복제되는 신체의 조직에 표적화하기 위한 것이다.

특정 구현예에서, 항원 전달 시스템은 담체 예컨대 지질 나노입자, 폴리머, 펩티드 등 뿐만 아니라 아데노바이러스 예컨대, 비제한적으로, Ad5, Ad26, Ad35 등을 포함한다. 다른 구현예에서, 항원 전달 시스템은 수포성 구내염 바이러스(VSV) 벡터를 포함한다.

본 발명은 아데노바이러스 벡터계 항원 전달 시스템에 제한되지 않는다. 특정 구현예에서, 항원 전달 시스템은 아데노-연관된 바이러스 벡터계 항원 전달 시스템, 예컨대, 비제한적으로, 아데노-부속 바이러스 벡터 유형 9(AAV9 혈청형), AAV 유형 8(AAV8 혈청형) 등을 포함한다. 특정 구현예에서, 사용된 아데노-부속 바이러스 벡터는 국소적으로, 예를 들어, 폐, 뇌, 심장 및 신장, 예를 들어, ACE2 수용체를 발현하는 신체의 조직에 국소적이다(도 3A)). 예를 들어, AAV9는 신경친화성이 있다고 알려져 있는데, 이것이 백신 조성물이 뇌에서 발현되도록 도울 수 있을 것이다.

상기 항원 전달 시스템에서, 1개 이상의 큰 서열은 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 1개 이상의 큰 서열은 일반적인 프로모터에 작동가능하게 연결된다. 예를 들어, 특정 구현예에서, 1개 이상의 큰 서열은 CMV 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 1개 이상의 큰 서열은 CAG, EFIA, EFS, CBh, SFFV, MSCV, mPGK, hPGK, SV40, UBC, 또는 다른 적절한 프로모터에 작동가능하게 연결된다.

일부 구현예에서, 1개 이상의 큰 서열은 조직 특이적 프로모터(예를 들어, 폐-특이적 프로모터)에 작동가능하게 연결된다. 예를 들어, 항원은 SpB 프로모터 또는 CD144 프로모터에 작동가능하게 연결될 수 있다.

논의된 바와 같이, 특정 구현예에서, 백신 조성물은 분자 보조제를 포함한다. 특정 구현예에서, 분자 보조제는 예를 들어, 상기에 기재된 바와 같이 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, 분자 보조제는 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동가능하게 연결된다.

논의된 바와 같이, 특정 구현예에서, 백신 조성물은 T 세포 유인 케모카인을 포함한다. 특정 구현예에서, T 세포 유인 케모카인은 예를 들어, 상기에 기재된 바와 같이 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, T 세포 유인 케모카인은 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동가능하게 연결된다.

논의된 바와 같이, 특정 구현예에서, 백신 조성물은 T 세포 증식을 촉진하기 위한 조성물을 포함한다. 특정 구현예에서, T 세포 증식을 촉진하기 위한 조성물은 예를 들어, 상기에 기재된 바와 같이, 일반적인 프로모터에 작동가능하게 연결된다. 특정 구현예에서, T 세포 증식을 촉진하기 위한 조성물은 조직 특이적 프로모터, 예를 들어, 폐-특이적 프로모터, 예를 들어, SpB 또는 CD144에 작동 가능하게 연결된다.

표 12는 본원에 기재된 백신 조성물을 형성하기 위해 사용될 수 있는 프로모터의 비-제한적인 예들을 보여준다.

특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터(예를 들어, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물이 하나의 펩티드로 합성됨)에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, 항원, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동된다. 특정 구현예에서, 항원, T 세포 유인 케모카인, 및 T 세포 증식을 촉진하는 조성물은 상이한 프로모터에 의해 구동된다. 특정 구현예에서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동되고, 1개 이상의 큰 서열은 상이한 프로모터에 의해 구동된다.

일부 구현예에서, 항원 전달 시스템은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물 사이의 하나 이상의 링커를 포함한다. 일부 구현예에서, 링커는 에피토프들 중 하나 이상의 사이에서 사용된다. 링커는 별도 분자(예를 들어, 케모카인)의 절단을 허용할 수 있다. 예를 들어, 일부 구현예에서, 링커는 IL-7(또는 IL-2) 및 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 일부 구현예에서, 링커는 IL-15 및 CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 일부 구현예에서, 링커는 항원 또는 큰 서열과 또 다른 조성물, 예를 들어, IL-15, IL-7, CCL5, CXCL9, CXCL10, CXCL11, CCL25, CCL28, CXCL14, CXCL17 등 사이에 위치한다. 링커의 비-제한적인 예는 T2A, E2A, P2A 등이다(표 13 참고). 조성물은 각각의 열린 해독틀 사이의 상이한 링커를 특징으로 할 수도 있다.

본 발명은 본원의 임의의 백신 조성물 또는 그의 일부분, 예를 들어, 분자 보조제, T 세포 향상 등을 인코딩하는 mRNA 서열을 포함한다. 본 발명은 또한 본원의 임의의 백신 조성물 또는 그의 일부분을 인코딩하는 변형된 mRNA 서열을 포함한다. 본 발명은 또한 본원의 임의의 백신 조성물 또는 그의 일부분을 인코딩하는 DNA 서열을 포함한다.

특정 구현예에서, 본원의 백신 조성물의 핵산은 화학적으로 변형된다. 일부 구현예에서, 본원의 백신 조성물의 핵산은 비변형된다. 일부 구현예에서, 열린 해독틀에서 우라실의 전부 또는 일부분이 화학적 변형을 갖는다. 일부 구현예에서, 화학적 변형은 우라실의 5-위치에 있다. 일부 구현예에서, 화학적 변형은 N1-메틸 슈도우리딘이다. 일부 구현예에서, 열린 해독틀에서 우라실의 전부 또는 일부분은 우라실의 5-위치에 N1-메틸 슈도우리딘을 갖는다.

특정 구현예에서, 본원의 백신 조성물의 열린 해독틀은 하나의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 2개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 다섯개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서,본원의 백신 조성물의 열린 해독틀은 10개 이상의 항원 또는 에피토프를 인코딩한다. 일부 구현예에서, 본원의 백신 조성물의 열린 해독틀은 50개 이상의 항원 또는 에피토프를 인코딩한다.

방법

일부 구현예에서, 방법은 코로나바이러스 서열(예를 들어, SARS-CoV-2, 변이체, 보통 감기 코로나바이러스, 이전에 알려진 코로나바이러스 균주, 동물 코로나바이러스 등)에서 유래된 하나 이상의 보존된 큰 서열을 결정하는 단계를 포함한다. 방법은 적어도 하나의 큰 보존 서열을 선택하는 단계 및 선택된 큰 보존 서열(들)을 포함하는 항원(또는 항원들)을 합성하는 단계를 포함할 수 있다. 방법은 선택된 큰 보존 서열(들)을 포함하는 항원을 인코딩하는 뉴클레오티드 조성물(예를 들어, DNA, 변형된 DNA, mRNA, 변형된 mRNA, 항원 전달 시스템 등)을 합성하는 단계를 포함할 수 있다. 일부 구현예에서, 본 방법은 추가로 항원, 뉴클레오티드 조성물, 및/또는 항원 전달 시스템 및 약제학적 담체를 포함하는 백신 조성물을 형성하는 단계를 포함한다. 일부 구현예에서, 큰 서열은 본원에 기재된 하나 이상의 보존된 에피토프, 예를 들어, 하나 이상의 보존된 B-세포 표적 에피토프 및/또는 하나 이상의 보존된CD4+ T 세포 표적 에피토프 및/또는 하나 이상의 보존된CD8+ T 세포 표적 에피토프를 포함한다.

일부 구현예에서, 큰 서열의 각각은 하기 중 둘 또는 이들의 조합 사이에서 보존된다: 현재 유행 중인 적어도 2개의 SARS-CoV-2 인간 균주, 이전의 인간 발발을 유발했던 적어도 하나의 코로나바이러스, 박쥐에서 단리된 적어도 하나의 코로나바이러스, 천산갑에서 단리된 적어도 하나의 코로나바이러스, 사향 고양이에서 단리된 적어도 하나의 코로나바이러스, 밍크에서 단리된 적어도 하나의 코로나바이러스 균주 및 낙타 또는 코로나바이러스에 수용적인 임의의 다른 동물에서 단리된 적어도 하나의 코로나바이러스 균주.

이전에 논의된 바와 같이, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용될 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 예방적으로 코로나바이러스 감염을 막기 위해 사용될 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 대상체에서 면역 반응을 유발할 수 있다. 일부 구현예에서, 본원에 기재된 조성물, 예를 들어, 항원, 백신 조성물, 항원 전달 시스템, 케모카인, 보조제 등은 다중-에피토프 범-코로나바이러스 백신 조성물에 의해 유도된 면역 반응을 연장할 수 있고, 폐로의 T-세포 이동을 증가시킨다.

대상체에서 코로나바이러스 질병을 예방하는 방법은 본 발명에 따른 범-코로나바이러스 백신 조성물의 치료적 유효량를 대상체에 투여하는 단계를 포함할 수 있다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서의 바이러스 복제를 막는다. 일부 구현예에서, 조성물은 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 T 세포의 귀소 및 체류를 개선한다.

대상체에서 코로나바이러스 감염을 예방적으로 차단하기 위한 방법은 대상체에 본 발명에 따른 범-코로나바이러스 백신 조성물을 예방적 유효량만큼 투여하는 단계를 포함할 수 있다. 일부 구현예에서, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 기억 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서 바이러스 복제를 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, T 세포의 귀소 및 체류를 개선한다.

대상체에서 면역 반응을 유발하는 방법은 대상체에 본 발명에 따르는 백신 조성물을 투여하는 단계를 포함하되, 조성물은 대상체에서 면역 반응을 유도한다. 일부 구현예에서, 조성물은 기억 B 및 T 세포를 유도한다. 일부 구현예에서, 조성물은 상주하는 메모리 T 세포(Trm)를 유도한다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 바이러스 복제를 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 사이토카인 폭풍을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, 염증 또는 염증 반응을 막는다. 일부 구현예에서, 조성물은, 예를 들어, 폐, 뇌, 심장, 및 신장과 같이 바이러스가 정상적으로 복제되는 영역에서, T 세포의 귀소 및 체류를 개선한다.

본 발명의 백신 조성물에 의해 유도된 면역 반응을 연장시키고 특정 조직(예를 들어, 폐, 뇌, 심장, 신장 등)으로 T 세포 이동을 증가시키는 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물 및 본 발명에 따른 백신 조성물(예를 들어, 항원)을 공동발현하는 단계를 포함할 수 있다.

본 발명의 백신 조성물에 의해 유도된 폐에서 기억 T-세포의 체류를 연장하고 바이러스-특이적 조직 상주 기억 T-세포(T_RM 세포)를 증가시키는 방법은 T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 본 발명에 따른 백신 조성물(예를 들어, 항원)을 공동 발현하는 단계를 포함할 수 있다.

상기 백신 조성물은 예를 들어, 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로 (s.l.)를 통해 표준 수단을 통해, 투여될 수 있다.

특정 구현예에서, 방법은 대상체에 제2(예를 들어, 부스터) 용량을 투여하는 단계를 포함한다. 제2 용량은 동일한 백신 조성물이거나 또는 상이한 백신 조성물일 수 있다. 하나 이상의 백신 조성물의 추가 용량이 투여될 수 있다.

순차적인 백신 전달 방법론

일부 구현예에서, 본 발명은 백신을 전달하여 대상체에서 이종성 면역성을 유도하는 방법을 특징으로 한다(예를 들어, 프라임/부스트, 도 25b 및 도 26b 참고). 일부 구현예에서, 방법은 제1 전달 시스템을 사용하여 제1 범-코로나바이러스 백신 조성물 용량을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 제2 전달 시스템을 사용하여 제2 백신 조성물 용량을 투여하는 단계를 포함한다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 8일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 9일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 10일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 11일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 12일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 13일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 14일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 14 내지 30일 후에 투여된다. 일부 구현예에서, 제2 조성물은 제1 조성물을 투여하고 30 내지 60일 후에 투여된다. 다른 구현예에서, 제1 전달 시스템 및 제2 전달 시스템은 상이하다. 일부 구현예에서, 펩티드 백신 조성물은 제1 백신 조성물 용량을 투여하고 14일 후 투여된다. 일부 구현예에서, 펩티드 백신 조성물은 제1 백신 조성물 용량을 투여하고 30 또는 60일 후 투여된다.

일부 구현예에서, 제1 전달 시스템 또는 제2 전달 시스템은 mRNA, 변형된 mRNA 또는 펩티드 벡터를 포함한다. 다른 구현예에서, 펩티드 벡터는 아데노바이러스 또는 아데노-부속 바이러스 벡터를 포함한다.

일부 구현예에서, 본 발명은 백신을 전달하여 대상체에서 이종성 면역성을 유도하는 방법을 특징으로 한다(즉 프라임/풀(당김(pull)), 도 25a 및 도 26a 참고). 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30일 내지 60일 후 투여된다. 일부 구현예에서, T 세포-유인 케모카인 조성물은 최종 백신 조성물 용량이 투여되고 8일 내지 14일 후 투여된다. 일부 구현예에서, 세포-유인 케모카인 조성물은 최종 백신 조성물 용량이 투여되고 30일 또는 60일 후 투여된다.

본 발명은 또한 새로운 '프라임, 당김(pull) 및 부스트' 전략을 특징으로 한다. 다른 구현예에서, 본 발명은 폐-상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시켜 SARS-CoV-2를 상대로 보호하는 방법을 특징으로 한다(도 25d 및 도 26d). 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 다른 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 범-코로나바이러스 조성물을 투여하고 14일 후 투여된다. 다른 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30 내지 60일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 8일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 9일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 11일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 12일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 13일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 14일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 14 내지 30일 후 투여된다. 일부 구현예에서, 사이토카인은 T-세포 유인 케모카인을 투여하고 30 내지 60일 후 투여된다. 일부 구현예에서, 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 8 내지 14일 후 투여된다. 일부 구현예에서, 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 30 또는 60일 후 투여된다.

본 발명은 추가로 새로운 "프라임, 당김(pull), 및 유지(keep)" 전략을 특징으로 한다(도 25c 및 도 26c). 추가 구현예에서, 본 발명은 폐-상주 B-세포, CD4+ T 세포 및 CD8+ T 세포의 크기 및 유지를 증가시켜 SARS-CoV-2를 상대로 보호하는 방법을 특징으로 한다. 일부 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여하는 단계를 포함한다. 다른 구현예에서, 방법은 범-코로나바이러스 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계를 포함한다. 추가 구현예에서, 방법은 T-세포 유인 케모카인을 투여한 후 적어도 하나의 점막 케모카인을 투여하는 단계를 포함한다. 일부 구현예에서, T-세포 유인 케모카인은 범-코로나바이러스 조성물을 투여하고 14일 후 투여된다. 다른 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 8일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 9일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 10일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 11일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 12일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 13일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14일 후에 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 14 내지 30일 후 투여된다. 일부 구현예에서, T-세포 유인 케모카인은 백신 조성물이 투여되고 30 내지 60일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 8일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 9일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 10일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 11일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 12일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 13일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 14일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 14 내지 30일 후 투여된다. 일부 구현예에서, 점막 케모카인은 T-세포 유인 케모카인을 투여하고 30 내지 60일 후 투여된다. 일부 구현예에서, 점막 케모카인 조성물은 T 세포-유인 케모카인을 투여하고 8 내지 14일 후 투여된다. 일부 구현예에서, 점막 사이토카인 조성물은 T 세포-유인 케모카인을 투여하고 30 또는 60일 후 투여된다.

일부 구현예에서, 점막 케모카인은 CCL25, CCL28,CXCL14, CXCL17, 또는 이들의 조합을 포함할 수 있다. 일부 구현예에서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합을 포함할 수 있다. 일부 구현예에서, 사이토카인은 IL-15, IL-2, IL-7 또는 이들의 조합을 포함할 수 있다.

일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 60%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 70%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 80%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 90%를 초과한다. 일부 구현예에서, 본원의 백신 조성물의 효능(또는 유효성)은 95%를 초과한다.

백신 효능은 표준 분석(예를 들어, Weinberg 등, J Infect Dis. 2010 Jun. 1; 201(11):1607-10 참고)을 사용하여 평가될 수 있다. 예를 들어, 백신 효능은 이중 맹검, 램덤화된, 임상 제어된 시도에 의해 측정될 수 있다. 백신 효능은 백신미접종(ARU) 및 백신접종(ARV) 연구 코호트 사이의 질환 발병률(AR)에서 비례 감소로 표현될 수 있고, 다음의 식을 사용하여 백신접종 그룹 중 질병의 상대적 위험(RR)에서 계산될 수 있다: 효능=(ARU-ARV)/ARUХ100; 및 효능=(1-RR)Х100.

마찬가지로, 백신 유효성은 표준 분석을 사용하여 평가될 수 있다(참고, 예를 들어, Weinberg 등, J Infect Dis. 2010 Jun. 1; 201(11):1607-10). 백신 유효성은 백신(높은 백신 효능이 있는 것으로 이미 입증되었을 수도 있음)이 집단에서 질병을 얼마나 감소시키는지에 대한 평가이다. 이 수치는 제어된 임상 시험에서 보다 자연적인 현장 조건 하에서, 백신 자체 뿐만 아니라 백신접종 프로그램의 이점 및 역효과의 순 균형을 평가할 수 있다. 백신 유효성은 백신 효과(효능)에 비례하지만, 또한 입원, 외래 방문, 또는 비용의 '실제 상황' 결과에 영향을 미치는 다른 비-백신 관련 인자에 의해서만이 아니라, 집단의 표적 그룹이 얼마나 잘 면역화되는지에 의해 영향을 받는다. 예를 들어, 감염된 사례 및 적절한 통제의 세트 중 백신접종률이 비교되는 소급 사례 대조군 분석이 사용될 수 있다. 백신 유효성은 백신접종에도 불구하고 감염이 발생하는 가능성 비율(OR)을 사용하여, 발생률의 차이로 표현될 수 있다: 유효성=(1-OR)Х100.

일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 최대 1 년 동안 면역을 부여한다. 일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 최대 2 년 동안 면역을 부여한다. 일부 구현예에서, 백신은 코로나바이러스에 대해 대상체에 1년 넘게, 2년 넘게, 3년 넘게, 4년 넘게, 또는 5-10년 동안 면역을 부여한다.

일부 구현예에서, 대상체는 약 20세 내지 약 50세(예를 들어, 약 20, 25, 30, 35, 40, 45 또는 50세) 사이의 젊은 성체이다.

일부 구현예에서, 대상체는 약 60세, 약 70세, 또는 나이가 더 많은(예를 들어, 약 60, 65, 70, 75, 80, 85 또는 90세) 나이든 대상체이다.

일부 구현예에서, 대상체는 약 5세 이하이다. 예를 들어, 대상체는 약 1세부터 약 5세(예를 들어, 약 1, 2, 3, 5 또는 5세)의 나이이거나, 또는 약 6개월부터 약 1세(예를 들어, 약 6, 7, 8, 9, 10, 11 또는 12개월)의 나이일 수 있다. 일부 구현예에서, 대상체는 약 12개월 이하(예를 들어, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2 개월 또는 1개월)이다. 일부 구현예에서, 대상체는 약 6 개월 이하이다.

일부 구현예에서, 대상체는 만삭둥이였다(예를 들어, 약 37-42주). 일부 구현예에서, 대상체는 예를 들어, 임신 약 36주 차에 또는 조기에(예를 들어, 약 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26 또는 25주) 태어난 이른 둥이였다. 예를 들어, 대상체는 임신 약 32 주차에 또는 더 이른 시기에 태어났을 수도 있다. 일부 구현예에서, 대상체는 임신 약 32주 내지 약 36주 차에 태어난 이른 둥이였다. 이와 같은 대상체에서, 생후, 예를 들어, 약 6 개월 내지 약 5 년, 또는 그 후, 백신이 투여될 수 있다.

일부 구현예에서, 대상체는 백신 투여 시 임산부(예를 들어, 첫, 두 번째, 세 번째 삼개월)이다.

일부 구현예에서, 대상체는 만성 폐 질환(예를 들어, 만성적 폐쇄성 폐 질환(COPD) 또는 천식)을 갖고 있거나, 또는 그것의 위험에 처해 있다. COPD의 두 가지 형태에는 점액과 함께 장기간 기침을 수반하는 만성 기관지염과 시간 경과에 따라 폐 손상을 수반하는 폐기종이 포함된다. 따라서, 백신이 투여된 대상체는 만성 기관지염 또는 폐기종이 있을 수 있다.

일부 구현예에서, 대상체는 코로나바이러스에 노출된 바 있다. 일부 구현예에서, 대상체는 코로나바이러스에 감염되었다. 일부 구현예에서, 대상체는 코로나바이러스에 의한 감염 위험이 있다.

일부 구현예에서, 대상체는 면역이 저하되어 있다(손상된 면역계를 가짐, 예를 들어, 면역 장애 또는 자가면역 장애 있음).

약제학적 담체

특정 구현예에서, 백신 조성물은 추가로 약제학적 담체를 포함한다. 약제학적 담체는 당업자에게 잘 알려져 있다. 예를 들어, 특정 구현예에서, 약제학적 담체는 물, 알코올, 천연 또는 경화된 오일, 천연 또는 경화된 왁스, 탄산칼슘, 탄산나트륨, 인산칼슘, 카올린, 탈크, 락토스 및 이들의 조합으로 이루어진 군에서 선택된다. 일부 구현예에서, 약제학적 담체는 지질 나노입자, 아데노바이러스 벡터, 또는 아데노-부속 바이러스 벡터를 포함할 수 있다. 일부 구현예에서, 백신 조성물은 아데노-부속 바이러스 벡터계 항원 전달 시스템을 사용하여 제작된다.

또한 전술한 단락 중 어느 하나의, 나노입자에 제형화된(예를 들어, 지질 나노입자) 백신이 본원에 제공된다. 일부 구현예에서, 나노입자는 평균 직경이 50-200nm이다. 일부 구현예에서, 나노입자는 지질 나노입자이다. 일부 구현예에서, 지질 나노입자는 양이온성 지질, PEG-변형된 지질, 스테롤 및 비-양이온성 지질을 포함한다. 일부 구현예에서, 지질 나노입자는 약 20-60% 양이온성 지질, 0.5-15% PEG-변형된 지질, 25-55% 스테롤, 및 25% 비-양이온성 지질의 몰비를 포함한다. 일부 구현예에서, 양이온성 지질은 이온화가능 양이온성 지질이고, 비-양이온성 지질은 중성 지질이며, 스테롤를 콜레스테롤이다. 일부 구현예에서, 양이온성 지질은 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA), 디리놀레일-메틸-4-디메틸아미노부티레이트(DLin-MC3-DMA) 및 디((Z)-논-2-엔-1-일) 9-((4-(디메틸아미노)부타노일)옥시)헵타데칸디오에이트(L319)에서 선택된다.

본 발명의 바람직한 구현예가 보여지고 기재된 바 있으나, 첨부된 청구항의 범위를 벗어나지 않는 변형이 그것에 이루어질 수 있음이 당업자에게 용이하게 명백할 것이다. 따라서, 본 발명의 범위는 다음의 청구항에 의해서만 제한될 것이다. 일부 구현예에서, 본 특허 출원에 제시된 도면은 각도, 치수 비율을 비롯한 척도에 따라 그려졌다. 일부 구현예에서, 도면은 나타내기 위한 것일 뿐, 청구항은 도면의 치수에 의해 제한되지 않는다. 일부 구현예에서, 문구 '포함하는'을 사용하여 본원에 기재된 본 발명의 설명은 '본질적으로 ~으로 이루어진' 또는 '~으로 이루어진'으로 기재될 수 있는 구현예를 포함하고, 그로써, 문구 '본질적으로 ~으로 이루어진' 또는 '~으로 이루어진'을 사용하여 본 발명의 하나 이상의 구현예를 주장하기 위한 서면 설명 요건이 충족된다.

<110> Benmohamed, Lbachir <120> PAN-CORONAVIRUS VACCINE COMPOSITIONS <130> UCI 20.06B <160> 197 <170> PatentIn version 3.5 <210> 1 <211> 7096 <212> PRT <213> Unknown <220> <223> Severe acute respiratory syndrome coronavirus 2 <400> 1 Met Glu Ser Leu Val Pro Gly Phe Asn Glu Lys Thr His Val Gln Leu 1 5 10 15 Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly 20 25 30 Asp Ser Val Glu Glu Val Leu Ser Glu Ala Arg Gln His Leu Lys Asp 35 40 45 Gly Thr Cys Gly Leu Val Glu Val Glu Lys Gly Val Leu Pro Gln Leu 50 55 60 Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Arg Thr Ala Pro 65 70 75 80 His Gly His Val Met Val Glu Leu Val Ala Glu Leu Glu Gly Ile Gln 85 90 95 Tyr Gly Arg Ser Gly Glu Thr Leu Gly Val Leu Val Pro His Val Gly 100 105 110 Glu Ile Pro Val Ala Tyr Arg Lys Val Leu Leu Arg Lys Asn Gly Asn 115 120 125 Lys Gly Ala Gly Gly His Ser Tyr Gly Ala Asp Leu Lys Ser Phe Asp 130 135 140 Leu Gly Asp Glu Leu Gly Thr Asp Pro Tyr Glu Asp Phe Gln Glu Asn 145 150 155 160 Trp Asn Thr Lys His Ser Ser Gly Val Thr Arg Glu Leu Met Arg Glu 165 170 175 Leu Asn Gly Gly Ala Tyr Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly 180 185 190 Pro Asp Gly Tyr Pro Leu Glu Cys Ile Lys Asp Leu Leu Ala Arg Ala 195 200 205 Gly Lys Ala Ser Cys Thr Leu Ser Glu Gln Leu Asp Phe Ile Asp Thr 210 215 220 Lys Arg Gly Val Tyr Cys Cys Arg Glu His Glu His Glu Ile Ala Trp 225 230 235 240 Tyr Thr Glu Arg Ser Glu Lys Ser Tyr Glu Leu Gln Thr Pro Phe Glu 245 250 255 Ile Lys Leu Ala Lys Lys Phe Asp Thr Phe Asn Gly Glu Cys Pro Asn 260 265 270 Phe Val Phe Pro Leu Asn Ser Ile Ile Lys Thr Ile Gln Pro Arg Val 275 280 285 Glu Lys Lys Lys Leu Asp Gly Phe Met Gly Arg Ile Arg Ser Val Tyr 290 295 300 Pro Val Ala Ser Pro Asn Glu Cys Asn Gln Met Cys Leu Ser Thr Leu 305 310 315 320 Met Lys Cys Asp His Cys Gly Glu Thr Ser Trp Gln Thr Gly Asp Phe 325 330 335 Val Lys Ala Thr Cys Glu Phe Cys Gly Thr Glu Asn Leu Thr Lys Glu 340 345 350 Gly Ala Thr Thr Cys Gly Tyr Leu Pro Gln Asn Ala Val Val Lys Ile 355 360 365 Tyr Cys Pro Ala Cys His Asn Ser Glu Val Gly Pro Glu His Ser Leu 370 375 380 Ala Glu Tyr His Asn Glu Ser Gly Leu Lys Thr Ile Leu Arg Lys Gly 385 390 395 400 Gly Arg Thr Ile Ala Phe Gly Gly Cys Val Phe Ser Tyr Val Gly Cys 405 410 415 His Asn Lys Cys Ala Tyr Trp Val Pro Arg Ala Ser Ala Asn Ile Gly 420 425 430 Cys Asn His Thr Gly Val Val Gly Glu Gly Ser Glu Gly Leu Asn Asp 435 440 445 Asn Leu Leu Glu Ile Leu Gln Lys Glu Lys Val Asn Ile Asn Ile Val 450 455 460 Gly Asp Phe Lys Leu Asn Glu Glu Ile Ala Ile Ile Leu Ala Ser Phe 465 470 475 480 Ser Ala Ser Thr Ser Ala Phe Val Glu Thr Val Lys Gly Leu Asp Tyr 485 490 495 Lys Ala Phe Lys Gln Ile Val Glu Ser Cys Gly Asn Phe Lys Val Thr 500 505 510 Lys Gly Lys Ala Lys Lys Gly Ala Trp Asn Ile Gly Glu Gln Lys Ser 515 520 525 Ile Leu Ser Pro Leu Tyr Ala Phe Ala Ser Glu Ala Ala Arg Val Val 530 535 540 Arg Ser Ile Phe Ser Arg Thr Leu Glu Thr Ala Gln Asn Ser Val Arg 545 550 555 560 Val Leu Gln Lys Ala Ala Ile Thr Ile Leu Asp Gly Ile Ser Gln Tyr 565 570 575 Ser Leu Arg Leu Ile Asp Ala Met Met Phe Thr Ser Asp Leu Ala Thr 580 585 590 Asn Asn Leu Val Val Met Ala Tyr Ile Thr Gly Gly Val Val Gln Leu 595 600 605 Thr Ser Gln Trp Leu Thr Asn Ile Phe Gly Thr Val Tyr Glu Lys Leu 610 615 620 Lys Pro Val Leu Asp Trp Leu Glu Glu Lys Phe Lys Glu Gly Val Glu 625 630 635 640 Phe Leu Arg Asp Gly Trp Glu Ile Val Lys Phe Ile Ser Thr Cys Ala 645 650 655 Cys Glu Ile Val Gly Gly Gln Ile Val Thr Cys Ala Lys Glu Ile Lys 660 665 670 Glu Ser Val Gln Thr Phe Phe Lys Leu Val Asn Lys Phe Leu Ala Leu 675 680 685 Cys Ala Asp Ser Ile Ile Ile Gly Gly Ala Lys Leu Lys Ala Leu Asn 690 695 700 Leu Gly Glu Thr Phe Val Thr His Ser Lys Gly Leu Tyr Arg Lys Cys 705 710 715 720 Val Lys Ser Arg Glu Glu Thr Gly Leu Leu Met Pro Leu Lys Ala Pro 725 730 735 Lys Glu Ile Ile Phe Leu Glu Gly Glu Thr Leu Pro Thr Glu Val Leu 740 745 750 Thr Glu Glu Val Val Leu Lys Thr Gly Asp Leu Gln Pro Leu Glu Gln 755 760 765 Pro Thr Ser Glu Ala Val Glu Ala Pro Leu Val Gly Thr Pro Val Cys 770 775 780 Ile Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Thr Glu Lys Tyr Cys 785 790 795 800 Ala Leu Ala Pro Asn Met Met Val Thr Asn Asn Thr Phe Thr Leu Lys 805 810 815 Gly Gly Ala Pro Thr Lys Val Thr Phe Gly Asp Asp Thr Val Ile Glu 820 825 830 Val Gln Gly Tyr Lys Ser Val Asn Ile Thr Phe Glu Leu Asp Glu Arg 835 840 845 Ile Asp Lys Val Leu Asn Glu Lys Cys Ser Ala Tyr Thr Val Glu Leu 850 855 860 Gly Thr Glu Val Asn Glu Phe Ala Cys Val Val Ala Asp Ala Val Ile 865 870 875 880 Lys Thr Leu Gln Pro Val Ser Glu Leu Leu Thr Pro Leu Gly Ile Asp 885 890 895 Leu Asp Glu Trp Ser Met Ala Thr Tyr Tyr Leu Phe Asp Glu Ser Gly 900 905 910 Glu Phe Lys Leu Ala Ser His Met Tyr Cys Ser Phe Tyr Pro Pro Asp 915 920 925 Glu Asp Glu Glu Glu Gly Asp Cys Glu Glu Glu Glu Phe Glu Pro Ser 930 935 940 Thr Gln Tyr Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Lys Pro Leu 945 950 955 960 Glu Phe Gly Ala Thr Ser Ala Ala Leu Gln Pro Glu Glu Glu Gln Glu 965 970 975 Glu Asp Trp Leu Asp Asp Asp Ser Gln Gln Thr Val Gly Gln Gln Asp 980 985 990 Gly Ser Glu Asp Asn Gln Thr Thr Thr Ile Gln Thr Ile Val Glu Val 995 1000 1005 Gln Pro Gln Leu Glu Met Glu Leu Thr Pro Val Val Gln Thr Ile Glu 1010 1015 1020 Val Asn Ser Phe Ser Gly Tyr Leu Lys Leu Thr Asp Asn Val Tyr Ile 1025 1030 1035 1040 Lys Asn Ala Asp Ile Val Glu Glu Ala Lys Lys Val Lys Pro Thr Val 1045 1050 1055 Val Val Asn Ala Ala Asn Val Tyr Leu Lys His Gly Gly Gly Val Ala 1060 1065 1070 Gly Ala Leu Asn Lys Ala Thr Asn Asn Ala Met Gln Val Glu Ser Asp 1075 1080 1085 Asp Tyr Ile Ala Thr Asn Gly Pro Leu Lys Val Gly Gly Ser Cys Val 1090 1095 1100 Leu Ser Gly His Asn Leu Ala Lys His Cys Leu His Val Val Gly Pro 1105 1110 1115 1120 Asn Val Asn Lys Gly Glu Asp Ile Gln Leu Leu Lys Ser Ala Tyr Glu 1125 1130 1135 Asn Phe Asn Gln His Glu Val Leu Leu Ala Pro Leu Leu Ser Ala Gly 1140 1145 1150 Ile Phe Gly Ala Asp Pro Ile His Ser Leu Arg Val Cys Val Asp Thr 1155 1160 1165 Val Arg Thr Asn Val Tyr Leu Ala Val Phe Asp Lys Asn Leu Tyr Asp 1170 1175 1180 Lys Leu Val Ser Ser Phe Leu Glu Met Lys Ser Glu Lys Gln Val Glu 1185 1190 1195 1200 Gln Lys Ile Ala Glu Ile Pro Lys Glu Glu Val Lys Pro Phe Ile Thr 1205 1210 1215 Glu Ser Lys Pro Ser Val Glu Gln Arg Lys Gln Asp Asp Lys Lys Ile 1220 1225 1230 Lys Ala Cys Val Glu Glu Val Thr Thr Thr Leu Glu Glu Thr Lys Phe 1235 1240 1245 Leu Thr Glu Asn Leu Leu Leu Tyr Ile Asp Ile Asn Gly Asn Leu His 1250 1255 1260 Pro Asp Ser Ala Thr Leu Val Ser Asp Ile Asp Ile Thr Phe Leu Lys 1265 1270 1275 1280 Lys Asp Ala Pro Tyr Ile Val Gly Asp Val Val Gln Glu Gly Val Leu 1285 1290 1295 Thr Ala Val Val Ile Pro Thr Lys Lys Ala Gly Gly Thr Thr Glu Met 1300 1305 1310 Leu Ala Lys Ala Leu Arg Lys Val Pro Thr Asp Asn Tyr Ile Thr Thr 1315 1320 1325 Tyr Pro Gly Gln Gly Leu Asn Gly Tyr Thr Val Glu Glu Ala Lys Thr 1330 1335 1340 Val Leu Lys Lys Cys Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile 1345 1350 1355 1360 Ser Asn Glu Lys Gln Glu Ile Leu Gly Thr Val Ser Trp Asn Leu Arg 1365 1370 1375 Glu Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro Val Cys 1380 1385 1390 Val Glu Thr Lys Ala Ile Val Ser Thr Ile Gln Arg Lys Tyr Lys Gly 1395 1400 1405 Ile Lys Ile Gln Glu Gly Val Val Asp Tyr Gly Ala Arg Phe Tyr Phe 1410 1415 1420 Tyr Thr Ser Lys Thr Thr Val Ala Ser Leu Ile Asn Thr Leu Asn Asp 1425 1430 1435 1440 Leu Asn Glu Thr Leu Val Thr Met Pro Leu Gly Tyr Val Thr His Gly 1445 1450 1455 Leu Asn Leu Glu Glu Ala Ala Arg Tyr Met Arg Ser Leu Lys Val Pro 1460 1465 1470 Ala Thr Val Ser Val Ser Ser Pro Asp Ala Val Thr Ala Tyr Asn Gly 1475 1480 1485 Tyr Leu Thr Ser Ser Ser Lys Thr Pro Glu Glu His Phe Ile Glu Thr 1490 1495 1500 Ile Ser Leu Ala Gly Ser Tyr Lys Asp Trp Ser Tyr Ser Gly Gln Ser 1505 1510 1515 1520 Thr Gln Leu Gly Ile Glu Phe Leu Lys Arg Gly Asp Lys Ser Val Tyr 1525 1530 1535 Tyr Thr Ser Asn Pro Thr Thr Phe His Leu Asp Gly Glu Val Ile Thr 1540 1545 1550 Phe Asp Asn Leu Lys Thr Leu Leu Ser Leu Arg Glu Val Arg Thr Ile 1555 1560 1565 Lys Val Phe Thr Thr Val Asp Asn Ile Asn Leu His Thr Gln Val Val 1570 1575 1580 Asp Met Ser Met Thr Tyr Gly Gln Gln Phe Gly Pro Thr Tyr Leu Asp 1585 1590 1595 1600 Gly Ala Asp Val Thr Lys Ile Lys Pro His Asn Ser His Glu Gly Lys 1605 1610 1615 Thr Phe Tyr Val Leu Pro Asn Asp Asp Thr Leu Arg Val Glu Ala Phe 1620 1625 1630 Glu Tyr Tyr His Thr Thr Asp Pro Ser Phe Leu Gly Arg Tyr Met Ser 1635 1640 1645 Ala Leu Asn His Thr Lys Lys Trp Lys Tyr Pro Gln Val Asn Gly Leu 1650 1655 1660 Thr Ser Ile Lys Trp Ala Asp Asn Asn Cys Tyr Leu Ala Thr Ala Leu 1665 1670 1675 1680 Leu Thr Leu Gln Gln Ile Glu Leu Lys Phe Asn Pro Pro Ala Leu Gln 1685 1690 1695 Asp Ala Tyr Tyr Arg Ala Arg Ala Gly Glu Ala Ala Asn Phe Cys Ala 1700 1705 1710 Leu Ile Leu Ala Tyr Cys Asn Lys Thr Val Gly Glu Leu Gly Asp Val 1715 1720 1725 Arg Glu Thr Met Ser Tyr Leu Phe Gln His Ala Asn Leu Asp Ser Cys 1730 1735 1740 Lys Arg Val Leu Asn Val Val Cys Lys Thr Cys Gly Gln Gln Gln Thr 1745 1750 1755 1760 Thr Leu Lys Gly Val Glu Ala Val Met Tyr Met Gly Thr Leu Ser Tyr 1765 1770 1775 Glu Gln Phe Lys Lys Gly Val Gln Ile Pro Cys Thr Cys Gly Lys Gln 1780 1785 1790 Ala Thr Lys Tyr Leu Val Gln Gln Glu Ser Pro Phe Val Met Met Ser 1795 1800 1805 Ala Pro Pro Ala Gln Tyr Glu Leu Lys His Gly Thr Phe Thr Cys Ala 1810 1815 1820 Ser Glu Tyr Thr Gly Asn Tyr Gln Cys Gly His Tyr Lys His Ile Thr 1825 1830 1835 1840 Ser Lys Glu Thr Leu Tyr Cys Ile Asp Gly Ala Leu Leu Thr Lys Ser 1845 1850 1855 Ser Glu Tyr Lys Gly Pro Ile Thr Asp Val Phe Tyr Lys Glu Asn Ser 1860 1865 1870 Tyr Thr Thr Thr Ile Lys Pro Val Thr Tyr Lys Leu Asp Gly Val Val 1875 1880 1885 Cys Thr Glu Ile Asp Pro Lys Leu Asp Asn Tyr Tyr Lys Lys Asp Asn 1890 1895 1900 Ser Tyr Phe Thr Glu Gln Pro Ile Asp Leu Val Pro Asn Gln Pro Tyr 1905 1910 1915 1920 Pro Asn Ala Ser Phe Asp Asn Phe Lys Phe Val Cys Asp Asn Ile Lys 1925 1930 1935 Phe Ala Asp Asp Leu Asn Gln Leu Thr Gly Tyr Lys Lys Pro Ala Ser 1940 1945 1950 Arg Glu Leu Lys Val Thr Phe Phe Pro Asp Leu Asn Gly Asp Val Val 1955 1960 1965 Ala Ile Asp Tyr Lys His Tyr Thr Pro Ser Phe Lys Lys Gly Ala Lys 1970 1975 1980 Leu Leu His Lys Pro Ile Val Trp His Val Asn Asn Ala Thr Asn Lys 1985 1990 1995 2000 Ala Thr Tyr Lys Pro Asn Thr Trp Cys Ile Arg Cys Leu Trp Ser Thr 2005 2010 2015 Lys Pro Val Glu Thr Ser Asn Ser Phe Asp Val Leu Lys Ser Glu Asp 2020 2025 2030 Ala Gln Gly Met Asp Asn Leu Ala Cys Glu Asp Leu Lys Pro Val Ser 2035 2040 2045 Glu Glu Val Val Glu Asn Pro Thr Ile Gln Lys Asp Val Leu Glu Cys 2050 2055 2060 Asn Val Lys Thr Thr Glu Val Val Gly Asp Ile Ile Leu Lys Pro Ala 2065 2070 2075 2080 Asn Asn Ser Leu Lys Ile Thr Glu Glu Val Gly His Thr Asp Leu Met 2085 2090 2095 Ala Ala Tyr Val Asp Asn Ser Ser Leu Thr Ile Lys Lys Pro Asn Glu 2100 2105 2110 Leu Ser Arg Val Leu Gly Leu Lys Thr Leu Ala Thr His Gly Leu Ala 2115 2120 2125 Ala Val Asn Ser Val Pro Trp Asp Thr Ile Ala Asn Tyr Ala Lys Pro 2130 2135 2140 Phe Leu Asn Lys Val Val Ser Thr Thr Thr Asn Ile Val Thr Arg Cys 2145 2150 2155 2160 Leu Asn Arg Val Cys Thr Asn Tyr Met Pro Tyr Phe Phe Thr Leu Leu 2165 2170 2175 Leu Gln Leu Cys Thr Phe Thr Arg Ser Thr Asn Ser Arg Ile Lys Ala 2180 2185 2190 Ser Met Pro Thr Thr Ile Ala Lys Asn Thr Val Lys Ser Val Gly Lys 2195 2200 2205 Phe Cys Leu Glu Ala Ser Phe Asn Tyr Leu Lys Ser Pro Asn Phe Ser 2210 2215 2220 Lys Leu Ile Asn Ile Ile Ile Trp Phe Leu Leu Leu Ser Val Cys Leu 2225 2230 2235 2240 Gly Ser Leu Ile Tyr Ser Thr Ala Ala Leu Gly Val Leu Met Ser Asn 2245 2250 2255 Leu Gly Met Pro Ser Tyr Cys Thr Gly Tyr Arg Glu Gly Tyr Leu Asn 2260 2265 2270 Ser Thr Asn Val Thr Ile Ala Thr Tyr Cys Thr Gly Ser Ile Pro Cys 2275 2280 2285 Ser Val Cys Leu Ser Gly Leu Asp Ser Leu Asp Thr Tyr Pro Ser Leu 2290 2295 2300 Glu Thr Ile Gln Ile Thr Ile Ser Ser Phe Lys Trp Asp Leu Thr Ala 2305 2310 2315 2320 Phe Gly Leu Val Ala Glu Trp Phe Leu Ala Tyr Ile Leu Phe Thr Arg 2325 2330 2335 Phe Phe Tyr Val Leu Gly Leu Ala Ala Ile Met Gln Leu Phe Phe Ser 2340 2345 2350 Tyr Phe Ala Val His Phe Ile Ser Asn Ser Trp Leu Met Trp Leu Ile 2355 2360 2365 Ile Asn Leu Val Gln Met Ala Pro Ile Ser Ala Met Val Arg Met Tyr 2370 2375 2380 Ile Phe Phe Ala Ser Phe Tyr Tyr Val Trp Lys Ser Tyr Val His Val 2385 2390 2395 2400 Val Asp Gly Cys Asn Ser Ser Thr Cys Met Met Cys Tyr Lys Arg Asn 2405 2410 2415 Arg Ala Thr Arg Val Glu Cys Thr Thr Ile Val Asn Gly Val Arg Arg 2420 2425 2430 Ser Phe Tyr Val Tyr Ala Asn Gly Gly Lys Gly Phe Cys Lys Leu His 2435 2440 2445 Asn Trp Asn Cys Val Asn Cys Asp Thr Phe Cys Ala Gly Ser Thr Phe 2450 2455 2460 Ile Ser Asp Glu Val Ala Arg Asp Leu Ser Leu Gln Phe Lys Arg Pro 2465 2470 2475 2480 Ile Asn Pro Thr Asp Gln Ser Ser Tyr Ile Val Asp Ser Val Thr Val 2485 2490 2495 Lys Asn Gly Ser Ile His Leu Tyr Phe Asp Lys Ala Gly Gln Lys Thr 2500 2505 2510 Tyr Glu Arg His Ser Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg 2515 2520 2525 Ala Asn Asn Thr Lys Gly Ser Leu Pro Ile Asn Val Ile Val Phe Asp 2530 2535 2540 Gly Lys Ser Lys Cys Glu Glu Ser Ser Ala Lys Ser Ala Ser Val Tyr 2545 2550 2555 2560 Tyr Ser Gln Leu Met Cys Gln Pro Ile Leu Leu Leu Asp Gln Ala Leu 2565 2570 2575 Val Ser Asp Val Gly Asp Ser Ala Glu Val Ala Val Lys Met Phe Asp 2580 2585 2590 Ala Tyr Val Asn Thr Phe Ser Ser Thr Phe Asn Val Pro Met Glu Lys 2595 2600 2605 Leu Lys Thr Leu Val Ala Thr Ala Glu Ala Glu Leu Ala Lys Asn Val 2610 2615 2620 Ser Leu Asp Asn Val Leu Ser Thr Phe Ile Ser Ala Ala Arg Gln Gly 2625 2630 2635 2640 Phe Val Asp Ser Asp Val Glu Thr Lys Asp Val Val Glu Cys Leu Lys 2645 2650 2655 Leu Ser His Gln Ser Asp Ile Glu Val Thr Gly Asp Ser Cys Asn Asn 2660 2665 2670 Tyr Met Leu Thr Tyr Asn Lys Val Glu Asn Met Thr Pro Arg Asp Leu 2675 2680 2685 Gly Ala Cys Ile Asp Cys Ser Ala Arg His Ile Asn Ala Gln Val Ala 2690 2695 2700 Lys Ser His Asn Ile Ala Leu Ile Trp Asn Val Lys Asp Phe Met Ser 2705 2710 2715 2720 Leu Ser Glu Gln Leu Arg Lys Gln Ile Arg Ser Ala Ala Lys Lys Asn 2725 2730 2735 Asn Leu Pro Phe Lys Leu Thr Cys Ala Thr Thr Arg Gln Val Val Asn 2740 2745 2750 Val Val Thr Thr Lys Ile Ala Leu Lys Gly Gly Lys Ile Val Asn Asn 2755 2760 2765 Trp Leu Lys Gln Leu Ile Lys Val Thr Leu Val Phe Leu Phe Val Ala 2770 2775 2780 Ala Ile Phe Tyr Leu Ile Thr Pro Val His Val Met Ser Lys His Thr 2785 2790 2795 2800 Asp Phe Ser Ser Glu Ile Ile Gly Tyr Lys Ala Ile Asp Gly Gly Val 2805 2810 2815 Thr Arg Asp Ile Ala Ser Thr Asp Thr Cys Phe Ala Asn Lys His Ala 2820 2825 2830 Asp Phe Asp Thr Trp Phe Ser Gln Arg Gly Gly Ser Tyr Thr Asn Asp 2835 2840 2845 Lys Ala Cys Pro Leu Ile Ala Ala Val Ile Thr Arg Glu Val Gly Phe 2850 2855 2860 Val Val Pro Gly Leu Pro Gly Thr Ile Leu Arg Thr Thr Asn Gly Asp 2865 2870 2875 2880 Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala Val Gly Asn Ile Cys 2885 2890 2895 Tyr Thr Pro Ser Lys Leu Ile Glu Tyr Thr Asp Phe Ala Thr Ser Ala 2900 2905 2910 Cys Val Leu Ala Ala Glu Cys Thr Ile Phe Lys Asp Ala Ser Gly Lys 2915 2920 2925 Pro Val Pro Tyr Cys Tyr Asp Thr Asn Val Leu Glu Gly Ser Val Ala 2930 2935 2940 Tyr Glu Ser Leu Arg Pro Asp Thr Arg Tyr Val Leu Met Asp Gly Ser 2945 2950 2955 2960 Ile Ile Gln Phe Pro Asn Thr Tyr Leu Glu Gly Ser Val Arg Val Val 2965 2970 2975 Thr Thr Phe Asp Ser Glu Tyr Cys Arg His Gly Thr Cys Glu Arg Ser 2980 2985 2990 Glu Ala Gly Val Cys Val Ser Thr Ser Gly Arg Trp Val Leu Asn Asn 2995 3000 3005 Asp Tyr Tyr Arg Ser Leu Pro Gly Val Phe Cys Gly Val Asp Ala Val 3010 3015 3020 Asn Leu Leu Thr Asn Met Phe Thr Pro Leu Ile Gln Pro Ile Gly Ala 3025 3030 3035 3040 Leu Asp Ile Ser Ala Ser Ile Val Ala Gly Gly Ile Val Ala Ile Val 3045 3050 3055 Val Thr Cys Leu Ala Tyr Tyr Phe Met Arg Phe Arg Arg Ala Phe Gly 3060 3065 3070 Glu Tyr Ser His Val Val Ala Phe Asn Thr Leu Leu Phe Leu Met Ser 3075 3080 3085 Phe Thr Val Leu Cys Leu Thr Pro Val Tyr Ser Phe Leu Pro Gly Val 3090 3095 3100 Tyr Ser Val Ile Tyr Leu Tyr Leu Thr Phe Tyr Leu Thr Asn Asp Val 3105 3110 3115 3120 Ser Phe Leu Ala His Ile Gln Trp Met Val Met Phe Thr Pro Leu Val 3125 3130 3135 Pro Phe Trp Ile Thr Ile Ala Tyr Ile Ile Cys Ile Ser Thr Lys His 3140 3145 3150 Phe Tyr Trp Phe Phe Ser Asn Tyr Leu Lys Arg Arg Val Val Phe Asn 3155 3160 3165 Gly Val Ser Phe Ser Thr Phe Glu Glu Ala Ala Leu Cys Thr Phe Leu 3170 3175 3180 Leu Asn Lys Glu Met Tyr Leu Lys Leu Arg Ser Asp Val Leu Leu Pro 3185 3190 3195 3200 Leu Thr Gln Tyr Asn Arg Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr 3205 3210 3215 Phe Ser Gly Ala Met Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys 3220 3225 3230 His Leu Ala Lys Ala Leu Asn Asp Phe Ser Asn Ser Gly Ser Asp Val 3235 3240 3245 Leu Tyr Gln Pro Pro Gln Thr Ser Ile Thr Ser Ala Val Leu Gln Ser 3250 3255 3260 Gly Phe Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met 3265 3270 3275 3280 Val Gln Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp 3285 3290 3295 Asp Val Val Tyr Cys Pro Arg His Val Ile Cys Thr Ser Glu Asp Met 3300 3305 3310 Leu Asn Pro Asn Tyr Glu Asp Leu Leu Ile Arg Lys Ser Asn His Asn 3315 3320 3325 Phe Leu Val Gln Ala Gly Asn Val Gln Leu Arg Val Ile Gly His Ser 3330 3335 3340 Met Gln Asn Cys Val Leu Lys Leu Lys Val Asp Thr Ala Asn Pro Lys 3345 3350 3355 3360 Thr Pro Lys Tyr Lys Phe Val Arg Ile Gln Pro Gly Gln Thr Phe Ser 3365 3370 3375 Val Leu Ala Cys Tyr Asn Gly Ser Pro Ser Gly Val Tyr Gln Cys Ala 3380 3385 3390 Met Arg Pro Asn Phe Thr Ile Lys Gly Ser Phe Leu Asn Gly Ser Cys 3395 3400 3405 Gly Ser Val Gly Phe Asn Ile Asp Tyr Asp Cys Val Ser Phe Cys Tyr 3410 3415 3420 Met His His Met Glu Leu Pro Thr Gly Val His Ala Gly Thr Asp Leu 3425 3430 3435 3440 Glu Gly Asn Phe Tyr Gly Pro Phe Val Asp Arg Gln Thr Ala Gln Ala 3445 3450 3455 Ala Gly Thr Asp Thr Thr Ile Thr Val Asn Val Leu Ala Trp Leu Tyr 3460 3465 3470 Ala Ala Val Ile Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr 3475 3480 3485 Thr Leu Asn Asp Phe Asn Leu Val Ala Met Lys Tyr Asn Tyr Glu Pro 3490 3495 3500 Leu Thr Gln Asp His Val Asp Ile Leu Gly Pro Leu Ser Ala Gln Thr 3505 3510 3515 3520 Gly Ile Ala Val Leu Asp Met Cys Ala Ser Leu Lys Glu Leu Leu Gln 3525 3530 3535 Asn Gly Met Asn Gly Arg Thr Ile Leu Gly Ser Ala Leu Leu Glu Asp 3540 3545 3550 Glu Phe Thr Pro Phe Asp Val Val Arg Gln Cys Ser Gly Val Thr Phe 3555 3560 3565 Gln Ser Ala Val Lys Arg Thr Ile Lys Gly Thr His His Trp Leu Leu 3570 3575 3580 Leu Thr Ile Leu Thr Ser Leu Leu Val Leu Val Gln Ser Thr Gln Trp 3585 3590 3595 3600 Ser Leu Phe Phe Phe Leu Tyr Glu Asn Ala Phe Leu Pro Phe Ala Met 3605 3610 3615 Gly Ile Ile Ala Met Ser Ala Phe Ala Met Met Phe Val Lys His Lys 3620 3625 3630 His Ala Phe Leu Cys Leu Phe Leu Leu Pro Ser Leu Ala Thr Val Ala 3635 3640 3645 Tyr Phe Asn Met Val Tyr Met Pro Ala Ser Trp Val Met Arg Ile Met 3650 3655 3660 Thr Trp Leu Asp Met Val Asp Thr Ser Leu Ser Gly Phe Lys Leu Lys 3665 3670 3675 3680 Asp Cys Val Met Tyr Ala Ser Ala Val Val Leu Leu Ile Leu Met Thr 3685 3690 3695 Ala Arg Thr Val Tyr Asp Asp Gly Ala Arg Arg Val Trp Thr Leu Met 3700 3705 3710 Asn Val Leu Thr Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp 3715 3720 3725 Gln Ala Ile Ser Met Trp Ala Leu Ile Ile Ser Val Thr Ser Asn Tyr 3730 3735 3740 Ser Gly Val Val Thr Thr Val Met Phe Leu Ala Arg Gly Ile Val Phe 3745 3750 3755 3760 Met Cys Val Glu Tyr Cys Pro Ile Phe Phe Ile Thr Gly Asn Thr Leu 3765 3770 3775 Gln Cys Ile Met Leu Val Tyr Cys Phe Leu Gly Tyr Phe Cys Thr Cys 3780 3785 3790 Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu Thr Leu 3795 3800 3805 Gly Val Tyr Asp Tyr Leu Val Ser Thr Gln Glu Phe Arg Tyr Met Asn 3810 3815 3820 Ser Gln Gly Leu Leu Pro Pro Lys Asn Ser Ile Asp Ala Phe Lys Leu 3825 3830 3835 3840 Asn Ile Lys Leu Leu Gly Val Gly Gly Lys Pro Cys Ile Lys Val Ala 3845 3850 3855 Thr Val Gln Ser Lys Met Ser Asp Val Lys Cys Thr Ser Val Val Leu 3860 3865 3870 Leu Ser Val Leu Gln Gln Leu Arg Val Glu Ser Ser Ser Lys Leu Trp 3875 3880 3885 Ala Gln Cys Val Gln Leu His Asn Asp Ile Leu Leu Ala Lys Asp Thr 3890 3895 3900 Thr Glu Ala Phe Glu Lys Met Val Ser Leu Leu Ser Val Leu Leu Ser 3905 3910 3915 3920 Met Gln Gly Ala Val Asp Ile Asn Lys Leu Cys Glu Glu Met Leu Asp 3925 3930 3935 Asn Arg Ala Thr Leu Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu Pro 3940 3945 3950 Ser Tyr Ala Ala Phe Ala Thr Ala Gln Glu Ala Tyr Glu Gln Ala Val 3955 3960 3965 Ala Asn Gly Asp Ser Glu Val Val Leu Lys Lys Leu Lys Lys Ser Leu 3970 3975 3980 Asn Val Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala Met Gln Arg Lys 3985 3990 3995 4000 Leu Glu Lys Met Ala Asp Gln Ala Met Thr Gln Met Tyr Lys Gln Ala 4005 4010 4015 Arg Ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gln Thr Met 4020 4025 4030 Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn Asn Ile 4035 4040 4045 Ile Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn Ile Ile Pro Leu 4050 4055 4060 Thr Thr Ala Ala Lys Leu Met Val Val Ile Pro Asp Tyr Asn Thr Tyr 4065 4070 4075 4080 Lys Asn Thr Cys Asp Gly Thr Thr Phe Thr Tyr Ala Ser Ala Leu Trp 4085 4090 4095 Glu Ile Gln Gln Val Val Asp Ala Asp Ser Lys Ile Val Gln Leu Ser 4100 4105 4110 Glu Ile Ser Met Asp Asn Ser Pro Asn Leu Ala Trp Pro Leu Ile Val 4115 4120 4125 Thr Ala Leu Arg Ala Asn Ser Ala Val Lys Leu Gln Asn Asn Glu Leu 4130 4135 4140 Ser Pro Val Ala Leu Arg Gln Met Ser Cys Ala Ala Gly Thr Thr Gln 4145 4150 4155 4160 Thr Ala Cys Thr Asp Asp Asn Ala Leu Ala Tyr Tyr Asn Thr Thr Lys 4165 4170 4175 Gly Gly Arg Phe Val Leu Ala Leu Leu Ser Asp Leu Gln Asp Leu Lys 4180 4185 4190 Trp Ala Arg Phe Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu 4195 4200 4205 Leu Glu Pro Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys 4210 4215 4220 Val Lys Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn Leu Asn Arg Gly 4225 4230 4235 4240 Met Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gln Ala Gly Asn 4245 4250 4255 Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu Ser Phe Cys Ala Phe 4260 4265 4270 Ala Val Asp Ala Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser Gly Gly 4275 4280 4285 Gln Pro Ile Thr Asn Cys Val Lys Met Leu Cys Thr His Thr Gly Thr 4290 4295 4300 Gly Gln Ala Ile Thr Val Thr Pro Glu Ala Asn Met Asp Gln Glu Ser 4305 4310 4315 4320 Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg Cys His Ile Asp His 4325 4330 4335 Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys Gly Lys Tyr Val Gln Ile 4340 4345 4350 Pro Thr Thr Cys Ala Asn Asp Pro Val Gly Phe Thr Leu Lys Asn Thr 4355 4360 4365 Val Cys Thr Val Cys Gly Met Trp Lys Gly Tyr Gly Cys Ser Cys Asp 4370 4375 4380 Gln Leu Arg Glu Pro Met Leu Gln Ser Ala Asp Ala Gln Ser Phe Leu 4385 4390 4395 4400 Asn Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr 4405 4410 4415 Gly Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn Asp 4420 4425 4430 Lys Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe 4435 4440 4445 Gln Glu Lys Asp Glu Asp Asp Asn Leu Ile Asp Ser Tyr Phe Val Val 4450 4455 4460 Lys Arg His Thr Phe Ser Asn Tyr Gln His Glu Glu Thr Ile Tyr Asn 4465 4470 4475 4480 Leu Leu Lys Asp Cys Pro Ala Val Ala Lys His Asp Phe Phe Lys Phe 4485 4490 4495 Arg Ile Asp Gly Asp Met Val Pro His Ile Ser Arg Gln Arg Leu Thr 4500 4505 4510 Lys Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu 4515 4520 4525 Gly Asn Cys Asp Thr Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys 4530 4535 4540 Asp Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn 4545 4550 4555 4560 Pro Asp Ile Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln 4565 4570 4575 Ala Leu Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asn Ala Gly 4580 4585 4590 Ile Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp 4595 4600 4605 Tyr Asp Phe Gly Asp Phe Ile Gln Thr Thr Pro Gly Ser Gly Val Pro 4610 4615 4620 Val Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr Leu Thr 4625 4630 4635 4640 Arg Ala Leu Thr Ala Glu Ser His Val Asp Thr Asp Leu Thr Lys Pro 4645 4650 4655 Tyr Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu 4660 4665 4670 Lys Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr His Pro 4675 4680 4685 Asn Cys Val Asn Cys Leu Asp Asp Arg Cys Ile Leu His Cys Ala Asn 4690 4695 4700 Phe Asn Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro 4705 4710 4715 4720 Leu Val Arg Lys Ile Phe Val Asp Gly Val Pro Phe Val Val Ser Thr 4725 4730 4735 Gly Tyr His Phe Arg Glu Leu Gly Val Val His Asn Gln Asp Val Asn 4740 4745 4750 Leu His Ser Ser Arg Leu Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala 4755 4760 4765 Asp Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg 4770 4775 4780 Thr Thr Cys Phe Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln 4785 4790 4795 4800 Thr Val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val 4805 4810 4815 Ser Lys Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe 4820 4825 4830 Phe Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr 4835 4840 4845 Arg Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe Val 4850 4855 4860 Val Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys Ile 4865 4870 4875 4880 Asn Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser Ala Gly Phe 4885 4890 4895 Pro Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met Ser 4900 4905 4910 Tyr Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val Ile 4915 4920 4925 Pro Thr Ile Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn 4930 4935 4940 Arg Ala Arg Thr Val Ala Gly Val Ser Ile Cys Ser Thr Met Thr Asn 4945 4950 4955 4960 Arg Gln Phe His Gln Lys Leu Leu Lys Ser Ile Ala Ala Thr Arg Gly 4965 4970 4975 Ala Thr Val Val Ile Gly Thr Ser Lys Phe Tyr Gly Gly Trp His Asn 4980 4985 4990 Met Leu Lys Thr Val Tyr Ser Asp Val Glu Asn Pro His Leu Met Gly 4995 5000 5005 Trp Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile 5010 5015 5020 Met Ala Ser Leu Val Leu Ala Arg Lys His Thr Thr Cys Cys Ser Leu 5025 5030 5035 5040 Ser His Arg Phe Tyr Arg Leu Ala Asn Glu Cys Ala Gln Val Leu Ser 5045 5050 5055 Glu Met Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr 5060 5065 5070 Ser Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile 5075 5080 5085 Cys Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp Gly 5090 5095 5100 Asn Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg Leu Tyr 5105 5110 5115 5120 Glu Cys Leu Tyr Arg Asn Arg Asp Val Asp Thr Asp Phe Val Asn Glu 5125 5130 5135 Phe Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met Ile Leu Ser Asp 5140 5145 5150 Asp Ala Val Val Cys Phe Asn Ser Thr Tyr Ala Ser Gln Gly Leu Val 5155 5160 5165 Ala Ser Ile Lys Asn Phe Lys Ser Val Leu Tyr Tyr Gln Asn Asn Val 5170 5175 5180 Phe Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly 5185 5190 5195 5200 Pro His Glu Phe Cys Ser Gln His Thr Met Leu Val Lys Gln Gly Asp 5205 5210 5215 Asp Tyr Val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly Ala 5220 5225 5230 Gly Cys Phe Val Asp Asp Ile Val Lys Thr Asp Gly Thr Leu Met Ile 5235 5240 5245 Glu Arg Phe Val Ser Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His 5250 5255 5260 Pro Asn Gln Glu Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile 5265 5270 5275 5280 Arg Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser 5285 5290 5295 Val Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe 5300 5305 5310 Tyr Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala 5315 5320 5325 Cys Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys Ile 5330 5335 5340 Arg Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val Ile Ser 5345 5350 5355 5360 Thr Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala 5365 5370 5375 Pro Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly Met 5380 5385 5390 Ser Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile Ser Phe Pro Leu Cys 5395 5400 5405 Ala Asn Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys Val Gly Ser 5410 5415 5420 Asp Asn Val Thr Asp Phe Asn Ala Ile Ala Thr Cys Asp Trp Thr Asn 5425 5430 5435 5440 Ala Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr Glu Arg Leu Lys Leu 5445 5450 5455 Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe Lys Leu Ser 5460 5465 5470 Tyr Gly Ile Ala Thr Val Arg Glu Val Leu Ser Asp Arg Glu Leu His 5475 5480 5485 Leu Ser Trp Glu Val Gly Lys Pro Arg Pro Pro Leu Asn Arg Asn Tyr 5490 5495 5500 Val Phe Thr Gly Tyr Arg Val Thr Lys Asn Ser Lys Val Gln Ile Gly 5505 5510 5515 5520 Glu Tyr Thr Phe Glu Lys Gly Asp Tyr Gly Asp Ala Val Val Tyr Arg 5525 5530 5535 Gly Thr Thr Thr Tyr Lys Leu Asn Val Gly Asp Tyr Phe Val Leu Thr 5540 5545 5550 Ser His Thr Val Met Pro Leu Ser Ala Pro Thr Leu Val Pro Gln Glu 5555 5560 5565 His Tyr Val Arg Ile Thr Gly Leu Tyr Pro Thr Leu Asn Ile Ser Asp 5570 5575 5580 Glu Phe Ser Ser Asn Val Ala Asn Tyr Gln Lys Val Gly Met Gln Lys 5585 5590 5595 5600 Tyr Ser Thr Leu Gln Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala 5605 5610 5615 Ile Gly Leu Ala Leu Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr Ala 5620 5625 5630 Cys Ser His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr 5635 5640 5645 Leu Pro Ile Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg Ala Arg Val 5650 5655 5660 Glu Cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu Glu Gln Tyr Val 5665 5670 5675 5680 Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr Ala Asp Ile Val Val 5685 5690 5695 Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr Asp Leu Ser Val Val Asn 5700 5705 5710 Ala Arg Leu Arg Ala Lys His Tyr Val Tyr Ile Gly Asp Pro Ala Gln 5715 5720 5725 Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly Thr Leu Glu Pro Glu 5730 5735 5740 Tyr Phe Asn Ser Val Cys Arg Leu Met Lys Thr Ile Gly Pro Asp Met 5745 5750 5755 5760 Phe Leu Gly Thr Cys Arg Arg Cys Pro Ala Glu Ile Val Asp Thr Val 5765 5770 5775 Ser Ala Leu Val Tyr Asp Asn Lys Leu Lys Ala His Lys Asp Lys Ser 5780 5785 5790 Ala Gln Cys Phe Lys Met Phe Tyr Lys Gly Val Ile Thr His Asp Val 5795 5800 5805 Ser Ser Ala Ile Asn Arg Pro Gln Ile Gly Val Val Arg Glu Phe Leu 5810 5815 5820 Thr Arg Asn Pro Ala Trp Arg Lys Ala Val Phe Ile Ser Pro Tyr Asn 5825 5830 5835 5840 Ser Gln Asn Ala Val Ala Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr 5845 5850 5855 Val Asp Ser Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr Gln 5860 5865 5870 Thr Thr Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn Val Ala 5875 5880 5885 Ile Thr Arg Ala Lys Val Gly Ile Leu Cys Ile Met Ser Asp Arg Asp 5890 5895 5900 Leu Tyr Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile Pro Arg Arg Asn 5905 5910 5915 5920 Val Ala Thr Leu Gln Ala Glu Asn Val Thr Gly Leu Phe Lys Asp Cys 5925 5930 5935 Ser Lys Val Ile Thr Gly Leu His Pro Thr Gln Ala Pro Thr His Leu 5940 5945 5950 Ser Val Asp Thr Lys Phe Lys Thr Glu Gly Leu Cys Val Asp Ile Pro 5955 5960 5965 Gly Ile Pro Lys Asp Met Thr Tyr Arg Arg Leu Ile Ser Met Met Gly 5970 5975 5980 Phe Lys Met Asn Tyr Gln Val Asn Gly Tyr Pro Asn Met Phe Ile Thr 5985 5990 5995 6000 Arg Glu Glu Ala Ile Arg His Val Arg Ala Trp Ile Gly Phe Asp Val 6005 6010 6015 Glu Gly Cys His Ala Thr Arg Glu Ala Val Gly Thr Asn Leu Pro Leu 6020 6025 6030 Gln Leu Gly Phe Ser Thr Gly Val Asn Leu Val Ala Val Pro Thr Gly 6035 6040 6045 Tyr Val Asp Thr Pro Asn Asn Thr Asp Phe Ser Arg Val Ser Ala Lys 6050 6055 6060 Pro Pro Pro Gly Asp Gln Phe Lys His Leu Ile Pro Leu Met Tyr Lys 6065 6070 6075 6080 Gly Leu Pro Trp Asn Val Val Arg Ile Lys Ile Val Gln Met Leu Ser 6085 6090 6095 Asp Thr Leu Lys Asn Leu Ser Asp Arg Val Val Phe Val Leu Trp Ala 6100 6105 6110 His Gly Phe Glu Leu Thr Ser Met Lys Tyr Phe Val Lys Ile Gly Pro 6115 6120 6125 Glu Arg Thr Cys Cys Leu Cys Asp Arg Arg Ala Thr Cys Phe Ser Thr 6130 6135 6140 Ala Ser Asp Thr Tyr Ala Cys Trp His His Ser Ile Gly Phe Asp Tyr 6145 6150 6155 6160 Val Tyr Asn Pro Phe Met Ile Asp Val Gln Gln Trp Gly Phe Thr Gly 6165 6170 6175 Asn Leu Gln Ser Asn His Asp Leu Tyr Cys Gln Val His Gly Asn Ala 6180 6185 6190 His Val Ala Ser Cys Asp Ala Ile Met Thr Arg Cys Leu Ala Val His 6195 6200 6205 Glu Cys Phe Val Lys Arg Val Asp Trp Thr Ile Glu Tyr Pro Ile Ile 6210 6215 6220 Gly Asp Glu Leu Lys Ile Asn Ala Ala Cys Arg Lys Val Gln His Met 6225 6230 6235 6240 Val Val Lys Ala Ala Leu Leu Ala Asp Lys Phe Pro Val Leu His Asp 6245 6250 6255 Ile Gly Asn Pro Lys Ala Ile Lys Cys Val Pro Gln Ala Asp Val Glu 6260 6265 6270 Trp Lys Phe Tyr Asp Ala Gln Pro Cys Ser Asp Lys Ala Tyr Lys Ile 6275 6280 6285 Glu Glu Leu Phe Tyr Ser Tyr Ala Thr His Ser Asp Lys Phe Thr Asp 6290 6295 6300 Gly Val Cys Leu Phe Trp Asn Cys Asn Val Asp Arg Tyr Pro Ala Asn 6305 6310 6315 6320 Ser Ile Val Cys Arg Phe Asp Thr Arg Val Leu Ser Asn Leu Asn Leu 6325 6330 6335 Pro Gly Cys Asp Gly Gly Ser Leu Tyr Val Asn Lys His Ala Phe His 6340 6345 6350 Thr Pro Ala Phe Asp Lys Ser Ala Phe Val Asn Leu Lys Gln Leu Pro 6355 6360 6365 Phe Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly Lys Gln Val 6370 6375 6380 Val Ser Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala Thr Cys Ile Thr 6385 6390 6395 6400 Arg Cys Asn Leu Gly Gly Ala Val Cys Arg His His Ala Asn Glu Tyr 6405 6410 6415 Arg Leu Tyr Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser 6420 6425 6430 Leu Trp Val Tyr Lys Gln Phe Asp Thr Tyr Asn Leu Trp Asn Thr Phe 6435 6440 6445 Thr Arg Leu Gln Ser Leu Glu Asn Val Ala Phe Asn Val Val Asn Lys 6450 6455 6460 Gly His Phe Asp Gly Gln Gln Gly Glu Val Pro Val Ser Ile Ile Asn 6465 6470 6475 6480 Asn Thr Val Tyr Thr Lys Val Asp Gly Val Asp Val Glu Leu Phe Glu 6485 6490 6495 Asn Lys Thr Thr Leu Pro Val Asn Val Ala Phe Glu Leu Trp Ala Lys 6500 6505 6510 Arg Asn Ile Lys Pro Val Pro Glu Val Lys Ile Leu Asn Asn Leu Gly 6515 6520 6525 Val Asp Ile Ala Ala Asn Thr Val Ile Trp Asp Tyr Lys Arg Asp Ala 6530 6535 6540 Pro Ala His Ile Ser Thr Ile Gly Val Cys Ser Met Thr Asp Ile Ala 6545 6550 6555 6560 Lys Lys Pro Thr Glu Thr Ile Cys Ala Pro Leu Thr Val Phe Phe Asp 6565 6570 6575 Gly Arg Val Asp Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly 6580 6585 6590 Val Leu Ile Thr Glu Gly Ser Val Lys Gly Leu Gln Pro Ser Val Gly 6595 6600 6605 Pro Lys Gln Ala Ser Leu Asn Gly Val Thr Leu Ile Gly Glu Ala Val 6610 6615 6620 Lys Thr Gln Phe Asn Tyr Tyr Lys Lys Val Asp Gly Val Val Gln Gln 6625 6630 6635 6640 Leu Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asn Leu Gln Glu Phe Lys 6645 6650 6655 Pro Arg Ser Gln Met Glu Ile Asp Phe Leu Glu Leu Ala Met Asp Glu 6660 6665 6670 Phe Ile Glu Arg Tyr Lys Leu Glu Gly Tyr Ala Phe Glu His Ile Val 6675 6680 6685 Tyr Gly Asp Phe Ser His Ser Gln Leu Gly Gly Leu His Leu Leu Ile 6690 6695 6700 Gly Leu Ala Lys Arg Phe Lys Glu Ser Pro Phe Glu Leu Glu Asp Phe 6705 6710 6715 6720 Ile Pro Met Asp Ser Thr Val Lys Asn Tyr Phe Ile Thr Asp Ala Gln 6725 6730 6735 Thr Gly Ser Ser Lys Cys Val Cys Ser Val Ile Asp Leu Leu Leu Asp 6740 6745 6750 Asp Phe Val Glu Ile Ile Lys Ser Gln Asp Leu Ser Val Val Ser Lys 6755 6760 6765 Val Val Lys Val Thr Ile Asp Tyr Thr Glu Ile Ser Phe Met Leu Trp 6770 6775 6780 Cys Lys Asp Gly His Val Glu Thr Phe Tyr Pro Lys Leu Gln Ser Ser 6785 6790 6795 6800 Gln Ala Trp Gln Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gln 6805 6810 6815 Arg Met Leu Leu Glu Lys Cys Asp Leu Gln Asn Tyr Gly Asp Ser Ala 6820 6825 6830 Thr Leu Pro Lys Gly Ile Met Met Asn Val Ala Lys Tyr Thr Gln Leu 6835 6840 6845 Cys Gln Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg 6850 6855 6860 Val Ile His Phe Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly Thr 6865 6870 6875 6880 Ala Val Leu Arg Gln Trp Leu Pro Thr Gly Thr Leu Leu Val Asp Ser 6885 6890 6895 Asp Leu Asn Asp Phe Val Ser Asp Ala Asp Ser Thr Leu Ile Gly Asp 6900 6905 6910 Cys Ala Thr Val His Thr Ala Asn Lys Trp Asp Leu Ile Ile Ser Asp 6915 6920 6925 Met Tyr Asp Pro Lys Thr Lys Asn Val Thr Lys Glu Asn Asp Ser Lys 6930 6935 6940 Glu Gly Phe Phe Thr Tyr Ile Cys Gly Phe Ile Gln Gln Lys Leu Ala 6945 6950 6955 6960 Leu Gly Gly Ser Val Ala Ile Lys Ile Thr Glu His Ser Trp Asn Ala 6965 6970 6975 Asp Leu Tyr Lys Leu Met Gly His Phe Ala Trp Trp Thr Ala Phe Val 6980 6985 6990 Thr Asn Val Asn Ala Ser Ser Ser Glu Ala Phe Leu Ile Gly Cys Asn 6995 7000 7005 Tyr Leu Gly Lys Pro Arg Glu Gln Ile Asp Gly Tyr Val Met His Ala 7010 7015 7020 Asn Tyr Ile Phe Trp Arg Asn Thr Asn Pro Ile Gln Leu Ser Ser Tyr 7025 7030 7035 7040 Ser Leu Phe Asp Met Ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala 7045 7050 7055 Val Met Ser Leu Lys Glu Gly Gln Ile Asn Asp Met Ile Leu Ser Leu 7060 7065 7070 Leu Ser Lys Gly Arg Leu Ile Ile Arg Glu Asn Asn Arg Val Val Ile 7075 7080 7085 Ser Ser Asp Val Leu Val Asn Asn 7090 7095 <210> 2 <211> 9 <212> PRT <213> Homo sapiens <400> 2 Val Met Val Glu Leu Val Ala Glu Leu 1 5 <210> 3 <211> 9 <212> PRT <213> Homo sapiens <400> 3 Tyr Leu Ala Thr Ala Leu Leu Thr Leu 1 5 <210> 4 <211> 9 <212> PRT <213> Homo sapiens <400> 4 Cys Leu Glu Ala Ser Phe Asn Tyr Leu 1 5 <210> 5 <211> 9 <212> PRT <213> Homo sapiens <400> 5 Trp Leu Met Trp Leu Ile Ile Asn Leu 1 5 <210> 6 <211> 9 <212> PRT <213> Homo sapiens <400> 6 Ser Leu Pro Gly Val Phe Cys Gly Val 1 5 <210> 7 <211> 9 <212> PRT <213> Homo sapiens <400> 7 Phe Leu Leu Asn Lys Glu Met Tyr Leu 1 5 <210> 8 <211> 9 <212> PRT <213> Homo sapiens <400> 8 Ser Met Trp Ala Leu Ile Ile Ser Val 1 5 <210> 9 <211> 9 <212> PRT <213> Homo sapiens <400> 9 Tyr Leu Ala Ser Gly Gly Gln Pro Ile 1 5 <210> 10 <211> 9 <212> PRT <213> Homo sapiens <400> 10 Lys Leu Ser Tyr Gly Ile Ala Thr Val 1 5 <210> 11 <211> 9 <212> PRT <213> Homo sapiens <400> 11 Tyr Leu Asp Ala Tyr Asn Met Met Ile 1 5 <210> 12 <211> 9 <212> PRT <213> Homo sapiens <400> 12 Leu Leu Leu Asp Asp Phe Val Glu Ile 1 5 <210> 13 <211> 9 <212> PRT <213> Homo sapiens <400> 13 Phe Val Phe Leu Val Leu Leu Pro Leu 1 5 <210> 14 <211> 9 <212> PRT <213> Homo sapiens <400> 14 Ser Ile Ile Ala Tyr Thr Met Ser Leu 1 5 <210> 15 <211> 9 <212> PRT <213> Homo sapiens <400> 15 Ala Leu Asn Thr Leu Val Lys Gln Leu 1 5 <210> 16 <211> 9 <212> PRT <213> Homo sapiens <400> 16 Val Leu Asn Asp Ile Leu Ser Arg Leu 1 5 <210> 17 <211> 9 <212> PRT <213> Homo sapiens <400> 17 Arg Leu Gln Ser Leu Gln Thr Tyr Val 1 5 <210> 18 <211> 9 <212> PRT <213> Homo sapiens <400> 18 Phe Ile Ala Gly Leu Ile Ala Ile Val 1 5 <210> 19 <211> 9 <212> PRT <213> Homo sapiens <400> 19 Phe Leu Ala Phe Val Val Phe Leu Leu 1 5 <210> 20 <211> 9 <212> PRT <213> Homo sapiens <400> 20 Phe Leu Leu Val Thr Leu Ala Ile Leu 1 5 <210> 21 <211> 9 <212> PRT <213> Homo sapiens <400> 21 Phe Leu Leu Asn Lys Glu Met Tyr Leu 1 5 <210> 22 <211> 9 <212> PRT <213> Homo sapiens <400> 22 Ile Phe Leu Trp Leu Leu Trp Pro Val 1 5 <210> 23 <211> 9 <212> PRT <213> Homo sapiens <400> 23 Gly Leu Met Trp Leu Ser Tyr Phe Ile 1 5 <210> 24 <211> 9 <212> PRT <213> Homo sapiens <400> 24 His Leu Val Asp Phe Gln Val Thr Ile 1 5 <210> 25 <211> 9 <212> PRT <213> Homo sapiens <400> 25 Ile Ile Phe Trp Phe Ser Leu Glu Leu 1 5 <210> 26 <211> 9 <212> PRT <213> Homo sapiens <400> 26 Tyr Val Val Asp Asp Pro Cys Pro Ile 1 5 <210> 27 <211> 9 <212> PRT <213> Homo sapiens <400> 27 Tyr Ile Asp Ile Gly Asn Tyr Thr Val 1 5 <210> 28 <211> 9 <212> PRT <213> Homo sapiens <400> 28 Tyr Ile Asn Val Phe Ala Phe Pro Phe 1 5 <210> 29 <211> 9 <212> PRT <213> Homo sapiens <400> 29 Asn Val Phe Ala Phe Pro Phe Thr Ile 1 5 <210> 30 <211> 8 <212> PRT <213> Homo sapiens <400> 30 Val Met Val Glu Leu Val Ala Glu 1 5 <210> 31 <211> 8 <212> PRT <213> Homo sapiens <400> 31 Leu Ala Thr Ala Leu Leu Thr Leu 1 5 <210> 32 <211> 8 <212> PRT <213> Homo sapiens <400> 32 Cys Leu Glu Ala Ser Phe Asn Tyr 1 5 <210> 33 <211> 8 <212> PRT <213> Homo sapiens <400> 33 Leu Met Trp Leu Ile Ile Asn Leu 1 5 <210> 34 <211> 8 <212> PRT <213> Homo sapiens <400> 34 Ser Leu Pro Gly Val Phe Cys Gly 1 5 <210> 35 <211> 8 <212> PRT <213> Homo sapiens <400> 35 Leu Leu Asn Lys Glu Met Tyr Leu 1 5 <210> 36 <211> 8 <212> PRT <213> Homo sapiens <400> 36 Ser Met Trp Ala Leu Ile Ile Ser 1 5 <210> 37 <211> 8 <212> PRT <213> Homo sapiens <400> 37 Leu Ala Ser Gly Gly Gln Pro Ile 1 5 <210> 38 <211> 8 <212> PRT <213> Homo sapiens <400> 38 Lys Leu Ser Tyr Gly Ile Ala Thr 1 5 <210> 39 <211> 8 <212> PRT <213> Homo sapiens <400> 39 Leu Asp Ala Tyr Asn Met Met Ile 1 5 <210> 40 <211> 8 <212> PRT <213> Homo sapiens <400> 40 Leu Leu Leu Asp Asp Phe Val Glu 1 5 <210> 41 <211> 8 <212> PRT <213> Homo sapiens <400> 41 Val Phe Leu Val Leu Leu Pro Leu 1 5 <210> 42 <211> 8 <212> PRT <213> Homo sapiens <400> 42 Ser Ile Ile Ala Tyr Thr Met Ser 1 5 <210> 43 <211> 8 <212> PRT <213> Homo sapiens <400> 43 Leu Asn Thr Leu Val Lys Gln Leu 1 5 <210> 44 <211> 8 <212> PRT <213> Homo sapiens <400> 44 Val Leu Asn Asp Ile Leu Ser Arg 1 5 <210> 45 <211> 8 <212> PRT <213> Homo sapiens <400> 45 Leu Gln Ser Leu Gln Thr Tyr Val 1 5 <210> 46 <211> 8 <212> PRT <213> Homo sapiens <400> 46 Phe Ile Ala Gly Leu Ile Ala Ile 1 5 <210> 47 <211> 8 <212> PRT <213> Homo sapiens <400> 47 Leu Ala Phe Val Val Phe Leu Leu 1 5 <210> 48 <211> 8 <212> PRT <213> Homo sapiens <400> 48 Phe Leu Leu Val Thr Leu Ala Ile 1 5 <210> 49 <211> 8 <212> PRT <213> Homo sapiens <400> 49 Leu Leu Asn Lys Glu Met Tyr Leu 1 5 <210> 50 <211> 8 <212> PRT <213> Homo sapiens <400> 50 Ile Phe Leu Trp Leu Leu Trp Pro 1 5 <210> 51 <211> 8 <212> PRT <213> Homo sapiens <400> 51 Leu Met Trp Leu Ser Tyr Phe Ile 1 5 <210> 52 <211> 8 <212> PRT <213> Homo sapiens <400> 52 His Leu Val Asp Phe Gln Val Thr 1 5 <210> 53 <211> 8 <212> PRT <213> Homo sapiens <400> 53 Ile Phe Trp Phe Ser Leu Glu Leu 1 5 <210> 54 <211> 8 <212> PRT <213> Homo sapiens <400> 54 Tyr Val Val Asp Asp Pro Cys Pro 1 5 <210> 55 <211> 8 <212> PRT <213> Homo sapiens <400> 55 Ile Asp Ile Gly Asn Tyr Thr Val 1 5 <210> 56 <211> 8 <212> PRT <213> Homo sapiens <400> 56 Tyr Ile Asn Val Phe Ala Phe Pro 1 5 <210> 57 <211> 8 <212> PRT <213> Homo sapiens <400> 57 Val Phe Ala Phe Pro Phe Thr Ile 1 5 <210> 58 <211> 15 <212> PRT <213> Homo sapiens <400> 58 Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys 1 5 10 15 <210> 59 <211> 15 <212> PRT <213> Homo sapiens <400> 59 Glu Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu 1 5 10 15 <210> 60 <211> 15 <212> PRT <213> Homo sapiens <400> 60 Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg Lys 1 5 10 15 <210> 61 <211> 14 <212> PRT <213> Homo sapiens <400> 61 Arg Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn Leu 1 5 10 <210> 62 <211> 15 <212> PRT <213> Homo sapiens <400> 62 Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp 1 5 10 15 <210> 63 <211> 13 <212> PRT <213> Homo sapiens <400> 63 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser 1 5 10 <210> 64 <211> 15 <212> PRT <213> Homo sapiens <400> 64 Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile Leu 1 5 10 15 <210> 65 <211> 15 <212> PRT <213> Homo sapiens <400> 65 Phe Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu Cys 1 5 10 15 <210> 66 <211> 15 <212> PRT <213> Homo sapiens <400> 66 Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp 1 5 10 15 <210> 67 <211> 15 <212> PRT <213> Homo sapiens <400> 67 Ala Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser Ile 1 5 10 15 <210> 68 <211> 15 <212> PRT <213> Homo sapiens <400> 68 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys 1 5 10 15 <210> 69 <211> 14 <212> PRT <213> Homo sapiens <400> 69 Ile Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu Leu 1 5 10 <210> 70 <211> 15 <212> PRT <213> Homo sapiens <400> 70 Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 1 5 10 15 <210> 71 <211> 15 <212> PRT <213> Homo sapiens <400> 71 Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val Leu 1 5 10 15 <210> 72 <211> 15 <212> PRT <213> Homo sapiens <400> 72 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala 1 5 10 15 <210> 73 <211> 16 <212> PRT <213> Homo sapiens <400> 73 Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe 1 5 10 15 <210> 74 <211> 14 <212> PRT <213> Homo sapiens <400> 74 Lys Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu 1 5 10 <210> 75 <211> 14 <212> PRT <213> Homo sapiens <400> 75 Glu Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr 1 5 10 <210> 76 <211> 14 <212> PRT <213> Homo sapiens <400> 76 Pro Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg 1 5 10 <210> 77 <211> 13 <212> PRT <213> Homo sapiens <400> 77 Arg Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn 1 5 10 <210> 78 <211> 14 <212> PRT <213> Homo sapiens <400> 78 Leu Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu 1 5 10 <210> 79 <211> 12 <212> PRT <213> Homo sapiens <400> 79 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser 1 5 10 <210> 80 <211> 14 <212> PRT <213> Homo sapiens <400> 80 Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile 1 5 10 <210> 81 <211> 14 <212> PRT <213> Homo sapiens <400> 81 Phe Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu 1 5 10 <210> 82 <211> 14 <212> PRT <213> Homo sapiens <400> 82 Leu Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly 1 5 10 <210> 83 <211> 14 <212> PRT <213> Homo sapiens <400> 83 Ala Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser 1 5 10 <210> 84 <211> 14 <212> PRT <213> Homo sapiens <400> 84 Met Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr 1 5 10 <210> 85 <211> 13 <212> PRT <213> Homo sapiens <400> 85 Ile Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu 1 5 10 <210> 86 <211> 14 <212> PRT <213> Homo sapiens <400> 86 Ser Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr 1 5 10 <210> 87 <211> 14 <212> PRT <213> Homo sapiens <400> 87 Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val 1 5 10 <210> 88 <211> 14 <212> PRT <213> Homo sapiens <400> 88 Met Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala 1 5 10 <210> 89 <211> 15 <212> PRT <213> Homo sapiens <400> 89 Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp 1 5 10 15 <210> 90 <211> 14 <212> PRT <213> Homo sapiens <400> 90 Ser Ala Phe Tyr Ile Leu Pro Ser Ile Ile Ser Asn Glu Lys 1 5 10 <210> 91 <211> 14 <212> PRT <213> Homo sapiens <400> 91 Ser Pro Phe Val Met Met Ser Ala Pro Pro Ala Gln Tyr Glu 1 5 10 <210> 92 <211> 14 <212> PRT <213> Homo sapiens <400> 92 Asn Met Leu Arg Ile Met Ala Ser Leu Val Leu Ala Arg Lys 1 5 10 <210> 93 <211> 13 <212> PRT <213> Homo sapiens <400> 93 Ile Lys Val Gln Met Leu Ser Asp Thr Leu Lys Asn Leu 1 5 10 <210> 94 <211> 14 <212> PRT <213> Homo sapiens <400> 94 Asp Ala Tyr Asn Met Met Ile Ser Ala Gly Phe Ser Leu Trp 1 5 10 <210> 95 <211> 12 <212> PRT <213> Homo sapiens <400> 95 Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser 1 5 10 <210> 96 <211> 14 <212> PRT <213> Homo sapiens <400> 96 Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile Leu 1 5 10 <210> 97 <211> 14 <212> PRT <213> Homo sapiens <400> 97 Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg Leu Cys 1 5 10 <210> 98 <211> 14 <212> PRT <213> Homo sapiens <400> 98 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp 1 5 10 <210> 99 <211> 14 <212> PRT <213> Homo sapiens <400> 99 Glu Ile Leu Leu Ile Ile Met Arg Thr Phe Lys Val Ser Ile 1 5 10 <210> 100 <211> 14 <212> PRT <213> Homo sapiens <400> 100 Lys Ile Ile Leu Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys 1 5 10 <210> 101 <211> 13 <212> PRT <213> Homo sapiens <400> 101 Ile Phe Leu Ala Leu Ile Thr Leu Ala Thr Cys Glu Leu 1 5 10 <210> 102 <211> 14 <212> PRT <213> Homo sapiens <400> 102 Pro Ile Phe Leu Ile Val Ala Ala Ile Val Phe Ile Thr Leu 1 5 10 <210> 103 <211> 14 <212> PRT <213> Homo sapiens <400> 103 Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe Leu Val Leu 1 5 10 <210> 104 <211> 14 <212> PRT <213> Homo sapiens <400> 104 Lys Phe Leu Val Phe Leu Gly Ile Ile Thr Thr Val Ala Ala 1 5 10 <210> 105 <211> 15 <212> PRT <213> Homo sapiens <400> 105 Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp Leu Asp Asp Phe 1 5 10 15 <210> 106 <211> 25 <212> PRT <213> Homo sapiens <400> 106 Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr 1 5 10 15 Thr Asn Ser Phe Thr Arg Gly Val Tyr 20 25 <210> 107 <211> 23 <212> PRT <213> Homo sapiens <400> 107 Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn 1 5 10 15 Gly Thr Lys Arg Phe Asp Asn 20 <210> 108 <211> 31 <212> PRT <213> Homo sapiens <400> 108 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 1 5 10 15 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 20 25 30 <210> 109 <211> 40 <212> PRT <213> Homo sapiens <400> 109 Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn 1 5 10 15 Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr 20 25 30 Trp Arg Val Tyr Ser Thr Gly Ser 35 40 <210> 110 <211> 75 <212> PRT <213> Homo sapiens <400> 110 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val 1 5 10 15 Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser 20 25 30 Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp 35 40 45 Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile 50 55 60 Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile 65 70 75 <210> 111 <211> 62 <212> PRT <213> Homo sapiens <400> 111 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 1 5 10 15 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 20 25 30 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 35 40 45 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Glu 50 55 60 <210> 112 <211> 25 <212> PRT <213> Homo sapiens <400> 112 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 1 5 10 15 Thr Lys Leu Asn Asp Leu Cys Phe Thr 20 25 <210> 113 <211> 35 <212> PRT <213> Homo sapiens <400> 113 Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala 1 5 10 15 Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn 20 25 30 Cys Val Ala 35 <210> 114 <211> 40 <212> PRT <213> Homo sapiens <400> 114 Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe 1 5 10 15 Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val 20 25 30 Asp Leu Gly Asp Ile Ser Gly Ile 35 40 <210> 115 <211> 18 <212> PRT <213> Homo sapiens <400> 115 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 1 5 10 15 Ile Glu <210> 116 <211> 22 <212> PRT <213> Homo sapiens <400> 116 Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala 1 5 10 15 Tyr Arg Phe Asn Gly Ile 20 <210> 117 <211> 23 <212> PRT <213> Homo sapiens <400> 117 Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr 1 5 10 15 Thr Asn Ser Phe Thr Arg Gly 20 <210> 118 <211> 21 <212> PRT <213> Homo sapiens <400> 118 Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn 1 5 10 15 Gly Thr Lys Arg Phe 20 <210> 119 <211> 29 <212> PRT <213> Homo sapiens <400> 119 Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr 1 5 10 15 Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr 20 25 <210> 120 <211> 38 <212> PRT <213> Homo sapiens <400> 120 Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn 1 5 10 15 Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr 20 25 30 Trp Arg Val Tyr Ser Thr 35 <210> 121 <211> 73 <212> PRT <213> Homo sapiens <400> 121 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val 1 5 10 15 Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser 20 25 30 Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp 35 40 45 Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile 50 55 60 Thr Pro Cys Ser Phe Gly Gly Val Ser 65 70 <210> 122 <211> 60 <212> PRT <213> Homo sapiens <400> 122 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 1 5 10 15 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 20 25 30 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 35 40 45 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro 50 55 60 <210> 123 <211> 23 <212> PRT <213> Homo sapiens <400> 123 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 1 5 10 15 Thr Lys Leu Asn Asp Leu Cys 20 <210> 124 <211> 33 <212> PRT <213> Homo sapiens <400> 124 Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala 1 5 10 15 Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn 20 25 30 Cys <210> 125 <211> 38 <212> PRT <213> Homo sapiens <400> 125 Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe 1 5 10 15 Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val 20 25 30 Asp Leu Gly Asp Ile Ser 35 <210> 126 <211> 16 <212> PRT <213> Homo sapiens <400> 126 Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 1 5 10 15 <210> 127 <211> 20 <212> PRT <213> Homo sapiens <400> 127 Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala 1 5 10 15 Tyr Arg Phe Asn 20 <210> 128 <211> 23 <212> PRT <213> Homo sapiens <400> 128 Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn 1 5 10 15 Ser Phe Thr Arg Gly Val Tyr 20 <210> 129 <211> 21 <212> PRT <213> Homo sapiens <400> 129 Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr 1 5 10 15 Lys Arg Phe Asp Asn 20 <210> 130 <211> 29 <212> PRT <213> Homo sapiens <400> 130 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 1 5 10 15 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 20 25 <210> 131 <211> 38 <212> PRT <213> Homo sapiens <400> 131 Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr 1 5 10 15 Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg 20 25 30 Val Tyr Ser Thr Gly Ser 35 <210> 132 <211> 73 <212> PRT <213> Homo sapiens <400> 132 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 1 5 10 15 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 20 25 30 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 35 40 45 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 50 55 60 Cys Ser Phe Gly Gly Val Ser Val Ile 65 70 <210> 133 <211> 60 <212> PRT <213> Homo sapiens <400> 133 Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg 1 5 10 15 Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr 20 25 30 Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr 35 40 45 Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Glu 50 55 60 <210> 134 <211> 23 <212> PRT <213> Homo sapiens <400> 134 Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys 1 5 10 15 Leu Asn Asp Leu Cys Phe Thr 20 <210> 135 <211> 33 <212> PRT <213> Homo sapiens <400> 135 Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg 1 5 10 15 Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val 20 25 30 Ala <210> 136 <211> 38 <212> PRT <213> Homo sapiens <400> 136 Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu 1 5 10 15 Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu 20 25 30 Gly Asp Ile Ser Gly Ile 35 <210> 137 <211> 16 <212> PRT <213> Homo sapiens <400> 137 Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 1 5 10 15 <210> 138 <211> 20 <212> PRT <213> Homo sapiens <400> 138 Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg 1 5 10 15 Phe Asn Gly Ile 20 <210> 139 <211> 7235 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 1 <400> 139 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctatgagcga caacggcccc cagaaccaga 5700 ggaacgcccc caggatcacc ttcggcggcc ccagcgacag caccggcagc aaccagaacg 5760 gcgagaggag cggcgccagg agcaagcaga ggaggcccca gggcctgccc aacaacaccg 5820 ccagctggtt caccgccctg acccagcacg gcaaggagga cctgaagttc cccaggggcc 5880 agggcgtgcc catcaacacc aacagcagcc ccgacgacca gatcggctac tacaggaggg 5940 ccaccaggag gatcaggggc ggcgacggca agatgaagga cctgagcccc aggtggtact 6000 tctactacct gggcaccggc cccgaggccg gcctgcccta cggcgccaac aaggacggca 6060 tcatctgggt ggccaccgag ggcgccctga acacccccaa ggaccacatc ggcaccagga 6120 accccgccaa caacgccgcc atcgtgctgc agctgcccca gggcaccacc ctgcccaagg 6180 gcttctacgc cgagggcagc aggggcggca gccaggccag cagcaggagc agcagcagga 6240 gcaggaacag cagcaggaac agcacccccg gcagcagcag gggcaccagc cccgccagga 6300 tggccggcaa cggcggcgac gccgccctgg ccctgctgct gctggacagg ctgaaccagc 6360 tggagagcaa gatgagcggc aagggccagc agcagcaggg ccagaccgtg accaagaaga 6420 gcgccgccga ggccagcaag aagcccaggc agaagaggac cgccaccaag gcctacaacg 6480 tgacccaggc cttcggcagg aggggccccg agcagaccca gggcaacttc ggcgaccagg 6540 agctgatcag gcagggcacc gactacaagc actggcccca gatcgcccag ttcgccccca 6600 gcgccagcgc cttcttcggc atgagcagga tcggcatgga ggtgaccccc agcggcacct 6660 ggctgaccta caccggcgcc atcaagctgg acgacaagga ccccaacttc aaggaccagg 6720 tgatcctgct gaacaagcac atcgacgcct acaagacctt cccccccacc gagcccaaga 6780 aggacaagaa gaagaaggcc gacgagaccc aggccctgcc ccagaggcag aagaagcagc 6840 agaccgtgac cctgctgccc gccgccgacc tggacgactt cagcaagcag ctgcagcaga 6900 gcatgagcag cgccgacagc acccaggcct gactcgagct ggtactgcat gcacgcaatg 6960 ctagctgccc ctttcccgtc ctgggtaccc cgagtctccc ccgacctcgg gtcccaggta 7020 tgctcccacc tccacctgcc ccactcacca cctctgctag ttccagacac ctcccaagca 7080 cgcagcaatg cagctcaaaa cgcttagcct agccacaccc ccacgggaaa cagcagtgat 7140 taacctttag caataaacga aagtttaact aagctatact aaccccaggg ttggtcaatt 7200 tcgtgccagc cacaccctgg agctagcaaa aaaaa 7235 <210> 140 <211> 9663 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 2 <400> 140 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctcaaaccac tgaaacagcw cactcttgta 5700 atgttaaccg ctttaatgtg gctattacaa gagcaaaaat tggcattttg tgcataatgt 5760 ctgacagaga tctttatgac aagctgcaat tcacaagtct agaagtaccg cgtcgtaacg 5820 tggctacatt acaagcggaa aatgtaactg gactctttaa ggactgtagt aagatcataa 5880 ctggtcttca tcctacacaa gcacctacac accttagtgt tgatacaaaa ttcaagactg 5940 agggactatg tgttgacata ccaggcatwc cwaaggacat gacctatmgw agactcatct 6000 cyatgatggg tttcaaaatg aattaycaag ttaatggtta ccctaayatg ttyatcaccc 6060 gygargaagc catmmgmcay gtwcgtgcat ggattggctt tgatgtagag ggktgtcatg 6120 ctactaggga tgctgtcggt actaacctac ctctccagtt aggattttct acaggtgtta 6180 acttagtagc tgtaccaact ggctatgttg acactgaaaa caatacagaa ttcaccagag 6240 ttaatgcaaa acctccacca ggtgaccaat ttaaacatct tataccactt atgtacaaag 6300 gtttaccctg gaacatagtg cgtatcaaga tagtacaaat gctcagtgat acactgaaag 6360 gattatcrga cagagttgtg tttgtcctat gggcacatgg ctttgaactt acatcaatga 6420 agtactttgt caagattgga cctgaaagaa cgtgttgtct gtgtgacaaa cgtgcaactt 6480 gtttttctac ttcatcagac aattatgcct gctggaacca ttctgtgggt tttgactatg 6540 tctataatcc atttatgatt gatgtccagc agtggggttt tacaggtaac cttcagagta 6600 atcacgatca gcattgccaa gtgcatggca acgctcatgt ggctagttgt gatgctatca 6660 tgactagatg tttagcagtc catgagtgct ttgttaagcg cgttgactgg tctgttgagt 6720 acccaattat aggtgatgaa ctgaagatca atgccgcatg cagaaaagtg caacatatgg 6780 ttgtaaagtc tgcattgctt gctgacaaat tcccagttct tcatgacatt ggaaacccaa 6840 aggctatcaa atgtgtcccr caggctgaag tggattggaa gttctatgat gctcagccct 6900 gcagtgacaa agcttataaa ataaaagaac tcttctattc ttatgctaca catcatgata 6960 aattcattga tggtgtttgt ttattttgga attgtaacgt tgatcgttac cctgccaatg 7020 ctattgtrtg caggttcgac acgagagtct tgtcaaattt gaacttgcca ggttgtgatg 7080 gtggtagttt gtatgtaaat aagcatgcat tccacactcc agcttttgat aaaagtgcat 7140 ttactaattt aaagcaattg cctttctttt attactctga cagtccctgt gagtcacatg 7200 gcaagcaggt tgtttctgac attgattatg taccactcaa atctgctacr tgtataacac 7260 gatgcaattt gggrggtgct gtttgcagac atcatgcaaa tgagtaccga cagtacttgg 7320 atgcatacaa tatgatgatt tctgctggct ttagcctctg gatttacaaa cagtttgaca 7380 cttataacct gtggaacacc tttaccaggt tacagagttt agaaaatgtg gcttacaatg 7440 ttgttaacaa aggacacttc gatggacaag ctggtgaagc acctgtttcc gtcattaata 7500 atgttgttta cacaaaggta gatggtgttg atgtagagat ctttgaaaac aagacaacac 7560 ttcctgttaa tgttgcattt gagctttggg ctaagcgtaa cattaaacca gtgccagaga 7620 ttaagatact caataatttg ggtgtcgata tcgctgctaa tactgtaatc tgggactaca 7680 agagagaagc accagcacat atgtcaacaa taggtgtctg cacaatgact gacattgcca 7740 agaaacctac tgagagtgct tgttcctcgc ttactgtctt atttgatggt agagtggaag 7800 gacaggtaga cctttttaga aatgcccgta atggtgtttt aataacagaa ggttcagtta 7860 aaggtttaat accttcaaag ggaccagcac aagctagtgt caatggagtc acattaattg 7920 gagaatcagt aaaaacacag tttaattatt ttaagaaagt agatggcatc attcaacagt 7980 tgcctgaaac ctactttact cagagccgag acttagagga tttcaagccc agatcacaaa 8040 tggaaactga ctttcttgag ctcgctatgg atgaattcat acaacggtac aagcttgaag 8100 gctatgcctt cgaacatatc gtttatggag attttagtca tggacagctt ggtggacttc 8160 atctaatgat tggtctagct aagcgctcac aagattcacc acttaaatta gaggatttta 8220 tccctacgga cagtacagtg aaaaattatt tcataacaga tgcgcaaaca ggttcatcaa 8280 aatgcgtgtg ctctgttatt gatcttctgc ttgatgactt tgttgagata ataaagtcac 8340 aagatttatc agtggtttca aaggtggtca aagtcacaat tgactatgct gaaatttcat 8400 tcatgttatg gtgtaaggat ggacatgttg aaacctttta cccaaaatta caagcgagtc 8460 aggcgtggca accaggagtt gcaatgccta acttgtataa gatgcagaga atgcttcttg 8520 aaaaatgtga ccttcagaat tatggtgaaa atgctgtcat accaaargga ataatgatga 8580 atgtcgcaaa atatactcaa ctgtgtcaat atttaaatac actyacatta gcygtgccat 8640 ataatatgag agttatccat tttggtgctg gctcrgacaa aggagttgca cccggcacag 8700 ctgttctcag acagtggttg ccaattggca cactacttgt tgattcagat cttaacgact 8760 tcgtctctga cgctgattcc actctaattg gagactgtgc aaccgtacat acagctaaca 8820 aatgggatct cattattagc gatatgtatg atcctaaaac caaacacgtg acaaaggaaa 8880 atgattcaaa agaaggattt ttcacttacc tgtgtggatt tattaaacaa aaattagccc 8940 tgggaggctc tgtggctgta aagataactg agcattcttg gaatgcggat ctctacaagc 9000 tcatgggaca tttctcatgg tggacagctt ttgttacaaa tgttaatgca tcttcatcag 9060 aagcattttt aattggagtt aactatcttg gtaagccaaa agaacaaatt gatggttaca 9120 ccatgcatgc taactacatt ttctggagga atacaaaccc gattcaattg tcttcctatt 9180 cactttttga catgagtaag ttccctctta aattaagggg aacagctgtc atgtctttaa 9240 aggagaacca aatcaatgaa atgatttatt ctctacttga aaaaggcaga cttatcatta 9300 gggaaaacaa cagagttgtt gtctcaagtg atgttcttgt taataactaa acgaacatga 9360 ctcgagctgg tactgcatgc acgcaatgct agctgcccct ttcccgtcct gggtaccccg 9420 agtctccccc gacctcgggt cccaggtatg ctcccacctc cacctgcccc actcaccacc 9480 tctgctagtt ccagacacct cccaagcacg cagcaatgca gctcaaaacg cttagcctag 9540 ccacaccccc acgggaaaca gcagtgatta acctttagca ataaacgaaa gtttaactaa 9600 gctatactaa ccccagggtt ggtcaatttc gtgccagcca caccctggag ctagcaaaaa 9660 aaa 9663 <210> 141 <211> 7088 <212> DNA <213> Artificial Sequence <220> <223> Sythesized Vaccine Candidate 3 <400> 141 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctatgtacag cttcgtgagc gaggagaccg 5700 gcaccctgat cgtgaacagc gtgctgctgt tcctggcctt cgtggtgttc ctgctggtga 5760 ccctggccat cctgaccgcc ctgaggctgt gcgcctactg ctgcaacatc gtgaacgtga 5820 gcctggtgaa gcccagcttc tacgtgtaca gcagggtgaa gaacctgaac agcagcaggg 5880 tgcccgacct gctggtggga agcggagcca cgaacttctc tctgttaaag caagcaggag 5940 atgttgaaga aaaccccggg cctatggccg acagcaacgg caccatcacc gtggaggagc 6000 tgaagaagct gctggagcag tggaacctgg tgatcggctt cctgttcctg acctggatct 6060 gcctgctgca gttcgcctac gccaacagga acaggttcct gtacatcatc aagctgatct 6120 tcctgtggct gctgtggccc gtgaccctgg cctgcttcgt gctggccgcc gtgtacagga 6180 tcaactggat caccggcggc atcgccatcg ccatggcctg cctggtgggc ctgatgtggc 6240 tgagctactt catcgccagc ttcaggctgt tcgccaggac caggagcatg tggagcttca 6300 accccgagac caacatcctg ctgaacgtgc ccctgcacgg caccatcctg accaggcccc 6360 tgctggagag cgagctggtg atcggcgccg tgatcctgag gggccacctg aggatcgccg 6420 gccaccacct gggcaggtgc gacatcaagg acctgcccaa ggagatcacc gtggccacca 6480 gcaggaccct gagctactac aagctgggcg ccagccagag ggtggccggc gacagcggct 6540 tcgccgccta cagcaggtac aggatcggca actacaagct gaacaccgac cacagcagca 6600 gcagcgacaa catcgccctg ctggtgcagg gaagcggagc cacgaacttc tctctgttaa 6660 agcaagcagg agatgttgaa gaaaaccccg ggcctatgaa gatcatcctg ttcctggccc 6720 tgatcaccct ggccacctgc gagctgtacc actaccagga gtgcgtgagg ggcaccaccg 6780 tgtgactcga gctggtactg catgcacgca atgctagctg cccctttccc gtcctgggta 6840 ccccgagtct cccccgacct cgggtcccag gtatgctccc acctccacct gccccactca 6900 ccacctctgc tagttccaga cacctcccaa gcacgcagca atgcagctca aaacgcttag 6960 cctagccaca cccccacggg aaacagcagt gattaacctt tagcaataaa cgaaagttta 7020 actaagctat actaacccca gggttggtca atttcgtgcc agccacaccc tggagctagc 7080 aaaaaaaa 7088 <210> 142 <211> 6935 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 4 <400> 142 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctatggccga cagcaacggc accatcaccg 5700 tggaggagct gaagaagctg ctggagcagt ggaacctggt gatcggcttc ctgttcctga 5760 cctggatctg cctgctgcag ttcgcctacg ccaacaggaa caggttcctg tacatcatca 5820 agctgatctt cctgtggctg ctgtggcccg tgaccctggc ctgcttcgtg ctggccgccg 5880 tgtacaggat caactggatc accggcggca tcgccatcgc catggcctgc ctggtgggcc 5940 tgatgtggct gagctacttc atcgccagct tcaggctgtt cgccaggacc aggagcatgt 6000 ggagcttcaa ccccgagacc aacatcctgc tgaacgtgcc cctgcacggc accatcctga 6060 ccaggcccct gctggagagc gagctggtga tcggcgccgt gatcctgagg ggccacctga 6120 ggatcgccgg ccaccacctg ggcaggtgcg acatcaagga cctgcccaag gagatcaccg 6180 tggccaccag caggaccctg agctactaca agctgggcgc cagccagagg gtggccggcg 6240 acagcggctt cgccgcctac agcaggtaca ggatcggcaa ctacaagctg aacaccgacc 6300 acagcagcag cagcgacaac atcgccctgc tggtgcaggg aagcggagcc acgaacttct 6360 ctctgttaaa gcaagcagga gatgttgaag aaaaccccgg gcctatgtac agcttcgtga 6420 gcgaggagac cggcaccctg atcgtgaaca gcgtgctgct gttcctggcc ttcgtggtgt 6480 tcctgctggt gaccctggcc atcctgaccg ccctgaggct gtgcgcctac tgctgcaaca 6540 tcgtgaacgt gagcctggtg aagcccagct tctacgtgta cagcagggtg aagaacctga 6600 acagcagcag ggtgcccgac ctgctggtgt gactcgagct ggtactgcat gcacgcaatg 6660 ctagctgccc ctttcccgtc ctgggtaccc cgagtctccc ccgacctcgg gtcccaggta 6720 tgctcccacc tccacctgcc ccactcacca cctctgctag ttccagacac ctcccaagca 6780 cgcagcaatg cagctcaaaa cgcttagcct agccacaccc ccacgggaaa cagcagtgat 6840 taacctttag caataaacga aagtttaact aagctatact aaccccaggg ttggtcaatt 6900 tcgtgccagc cacaccctgg agctagcaaa aaaaa 6935 <210> 143 <211> 12110 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 5 <400> 143 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctgcccccac caaggtgacc ttcggcgacg 5700 acaccgtgat cgaggtgcag ggctacaaga gcgtgaacat caccttcgag ctggacgaga 5760 ggatcgacaa ggtgctgaac gagaagtgca gcgcctacac cgtggagctg ggcaccgagg 5820 tgaacgagtt cgcctgcgtg gtggccgacg ccgtgatcaa gaccctgcag cccgtgagcg 5880 agctgctgac ccccctgggc atcgacctgg acgagtggag catggccacc tactacctgt 5940 tcgacgagag cggcgagttc aagctggcca gccacatgta ctgcagcttc tacccccccg 6000 acgaggacga ggaggagggc gactgcgagg aggaggagtt cgagcccagc acccagtacg 6060 agtacggcac cgaggacgac taccagggca agcccctgga gttcggcgcc accagcgccg 6120 ccctgcagcc cgaggaggag caggaggagg actggctgga cgacgacagc cagcagaccg 6180 tgggccagca ggacggcagc gaggacaacc agaccaccac catccagacc atcgtggagg 6240 tgcagcccca gctggagatg gagctgaccc ccgtggtgca gaccatcgag gtgaacagct 6300 tcagcggcta cctgaagctg accgacaacg tgtacatcaa gaacgccgac atcgtggagg 6360 aggccaagaa ggtgaagccc accgtggtgg tgaacgccgc caacgtgtac ctgaagcacg 6420 gcggcggcgt ggccggcgcc ctgaacaagg ccaccaacaa cgccatgcag gtggagagcg 6480 acgactacat cgccaccaac ggccccctga aggtgggcgg cagctgcgtg ctgagcggcc 6540 acaacctggc caagcactgc ctgcacgtgg tgggccccaa cgtgaacaag ggcgaggaca 6600 tccagctgct gaagagcgcc tacgagaact tcaaccagca cgaggtgctg ctggcccccc 6660 tgctgagcgc cggcatcttc ggcgccgacc ccatccacag cctgagggtg tgcgtggaca 6720 ccgtgaggac caacgtgtac ctggccgtgt tcgacaagaa cctgtacgac aagctggtga 6780 gcagcttcct ggagatgaag agcgagaagc aggtggagca gaagatcgcc gagatcccca 6840 aggaggaggt gaagcccttc atcaccgaga gcaagcccag cgtggagcag aggaagcagg 6900 acgacaagaa gatcaaggcc tgcgtggagg aggtgaccac caccctggag gagaccaagt 6960 tcctgaccga gaacctgctg ctgtacatcg acatcaacgg caacctgcac cccgacagcg 7020 ccaccctggt gagcgacatc gacatcacct tcctgaagaa ggacgccccc tacatcgtgg 7080 gcgacgtggt gcaggagggc gtgctgaccg ccgtggtgat ccccaccaag aaggccggcg 7140 gcaccaccga gatgctggcc aaggccctga ggaaggtgcc caccgacaac tacatcacca 7200 cctaccccgg ccagggcctg aacggctaca ccgtggagga ggccaagacc gtgctgaaga 7260 agtgcaagag cgccttctac atcctgccca gcatcatcag caacgagaag caggagatcc 7320 tgggcaccgt gagctggaac ctgagggaga tgctggccca cgccgaggag accaggaagc 7380 tgatgcccgt gtgcgtggag accaaggcca tcgtgagcac catccagagg aagtacaagg 7440 gcatcaagat ccaggagggc gtggtggact acggcgccag gttctacttc tacaccagca 7500 agaccaccgt ggccagcctg atcaacaccc tgaacgacct gaacgagacc ctggtgacca 7560 tgcccctggg ctacgtgacc cacggcctga acctggagga ggccgccagg tacatgagga 7620 gcctgaaggt gcccgccacc gtgagcgtga gcagccccga cgccgtgacc gcctacaacg 7680 gctacctgac cagcagcagc aagacccccg aggagcactt catcgagacc atcagcctgg 7740 ccggcagcta caaggactgg agctacagcg gccagagcac ccagctgggc atcgagttcc 7800 tgaagagggg cgacaagagc gtgtactaca ccagcaaccc caccaccttc cacctggacg 7860 gcgaggtgat caccttcgac aacctgaaga ccctgctgag cctgagggag gtgaggacca 7920 tcaaggtgtt caccaccgtg gacaacatca acctgcacgg aagcggagcc acgaacttct 7980 ctctgttaaa gcaagcagga gatgttgaag aaaaccccgg gcctagcggc ttcaggaaga 8040 tggccttccc cagcggcaag gtggagggct gcatggtgca ggtgacctgc ggcaccacca 8100 ccctgaacgg cctgtggctg gacgacgtgg tgtactgccc caggcacgtg atctgcacca 8160 gcgaggacat gctgaacccc aactacgagg acctgctgat caggaagagc aaccacaact 8220 tcctggtgca ggccggcaac gtgcagctga gggtgatcgg ccacagcatg cagaactgcg 8280 tgctgaagct gaaggtggac accgccaacc ccaagacccc caagtacaag ttcgtgagga 8340 tccagcccgg ccagaccttc agcgtgctgg cctgctacaa cggcagcccc agcggcgtgt 8400 accagtgcgc catgaggccc aacttcacca tcaagggcag cttcctgaac ggcagctgcg 8460 gcagcgtggg cttcaacatc gactacgact gcgtgagctt ctgctacatg caccacatgg 8520 agctgcccac cggcgtgcac gccggcaccg acctggaggg caacttctac ggccccttcg 8580 tggacaggca gaccgcccag gccgccggca ccgacaccac catcaccgtg aacgtgctgg 8640 cctggctgta cgccgccgtg atcaacggcg acaggtggtt cctgaacagg ttcaccacca 8700 ccctgaacga cttcaacctg gtggccatga agtacaacta cgagcccctg acccaggacc 8760 acgtggacat cctgggcccc ctgagcgccc agaccggcat cgccgtgctg gacatgtgcg 8820 ccagcctgaa ggagctgctg cagaacggca tgaacggcag gaccatcctg ggcagcgccc 8880 tgctggagga cgagttcacc cccttcgacg tggtgaggca gtgcagcggc gtgaccttcc 8940 agggaagcgg agccacgaac ttctctctgt taaagcaagc aggagatgtt gaagaaaacc 9000 ccgggcctag cgccgacgcc cagagcttcc tgaacagggt gtgcggcgtg agcgccgcca 9060 ggctgacccc ctgcggcacc ggcaccagca ccgacgtggt gtacagggcc ttcgacatct 9120 acaacgacaa ggtggccggc ttcgccaagt tcctgaagac caactgctgc aggttccagg 9180 agaaggacga ggacgacaac ctgatcgaca gctacttcgt ggtgaagagg cacaccttca 9240 gcaactacca gcacgaggag accatctaca acctgctgaa ggactgcccc gccgtggcca 9300 agcacgactt cttcaagttc aggatcgacg gcgacatggt gccccacatc agcaggcaga 9360 ggctgaccaa gtacaccatg gccgacctgg tgtacgccct gaggcacttc gacgagggca 9420 actgcgacac cctgaaggag atcctggtga cctacaactg ctgcgacgac gactacttca 9480 acaagaagga ctggtacgac ttcgtggaga accccgacat cctgagggtg tacgccaacc 9540 tgggcgagag ggtgaggcag gccctgctga agaccgtgca gttctgcgac gccatgagga 9600 acgccggcat cgtgggcgtg ctgaccctgg acaaccagga cctgaacggc aactggtacg 9660 acttcggcga cttcatccag accacccccg gcagcggcgt gcccgtggtg gacagctact 9720 acagcctgct gatgcccatc ctgaccctga ccagggccct gaccgccgag agccacgtgg 9780 acaccgacct gaccaagccc tacatcaagt gggacctgct gaagtacgac ttcaccgagg 9840 agaggctgaa gctgttcgac aggtacttca agtactggga ccagacctac caccccaact 9900 gcgtgaactg cctggacgac aggtgcatcc tgcactgcgc caacttcaac gtgctgttca 9960 gcaccgtgtt cccccccacc agcttcggcc ccctggtgag gaagatcttc gtggacggcg 10020 tgcccttcgt ggtgagcacc ggctaccact tcagggagct gggcgtggtg cacaaccagg 10080 acgtgaacct gcacagcagc aggctgagct tcaaggagct gctggtgtac gccgccgacc 10140 ccgccatgca cgccgccagc ggcaacctgc tgctggacaa gaggaccacc tgcttcagcg 10200 tggccgccct gaccaacaac gtggccttcc agaccgtgaa gcccggcaac ttcaacaagg 10260 acttctacga cttcgccgtg agcaagggct tcttcaagga gggcagcagc gtggagctga 10320 agcacttctt cttcgcccag gacggcaacg ccgccatcag cgactacgac tactacaggt 10380 acaacctgcc caccatgtgc gacatcaggc agctgctgtt cgtggtggag gtggtggaca 10440 agtacttcga ctgctacgac ggcggctgca tcaacgccaa ccaggtgatc gtgaacaacc 10500 tggacaagag cgccggcttc cccttcaaca agtggggcaa ggccaggctg tactacgaca 10560 gcatgagcta cgaggaccag gacgccctgt tcgcctacac caagaggaac gtgatcccca 10620 ccatcaccca gatgaacctg aagtacgcca tcagcgccaa gaacagggcc aggaccgtgg 10680 ccggcgtgag catctgcagc accatgacca acaggcagtt ccaccagaag ctgctgaaga 10740 gcatcgccgc caccaggggc gccaccgtgg tgatcggcac cagcaagttc tacggcggct 10800 ggcacaacat gctgaagacc gtgtacagcg acgtggagaa cccccacctg atgggctggg 10860 actaccccaa gtgcgacagg gccatgccca acatgctgag gatcatggcc agcctggtgc 10920 tggccaggaa gcacaccacc tgctgcagcc tgagccacag gttctacagg ctggccaacg 10980 agtgcgccca ggtgctgagc gagatggtga tgtgcggcgg cagcctgtac gtgaagcccg 11040 gcggcaccag cagcggcgac gccaccaccg cctacgccaa cagcgtgttc aacatctgcc 11100 aggccgtgac cgccaacgtg aacgccctgc tgagcaccga cggcaacaag atcgccgaca 11160 agtacgtgag gaacctgcag cacaggctgt acgagtgcct gtacaggaac agggacgtgg 11220 acaccgactt cgtgaacgag ttctacgcct acctgaggaa gcacttcagc atgatgatcc 11280 tgagcgacga cgccgtggtg tgcttcaaca gcacctacgc cagccagggc ctggtggcca 11340 gcatcaagaa cttcaagagc gtgctgtact accagaacaa cgtgttcatg agcgaggcca 11400 agtgctggac cgagaccgac ctgaccaagg gcccccacga gttctgcagc cagcacacca 11460 tgctggtgaa gcagggcgac gactacgtgt acctgcccta ccccgacccc agcaggatcc 11520 tgggcgccgg ctgcttcgtg gacgacatcg tgaagaccga cggcaccctg atgatcgaga 11580 ggttcgtgag cctggccatc gacgcctacc ccctgaccaa gcaccccaac caggagtacg 11640 ccgacgtgtt ccacctgtac ctgcagtaca tcaggaagct gcacgacgag ctgaccggcc 11700 acatgctgga catgtacagc gtgatgctga ccaacgacaa caccagcagg tactgggagc 11760 ccgagttcta cgaggccatg tacacccccc acaccgtgct gcagtgactc gagctggtac 11820 tgcatgcacg caatgctagc tgcccctttc ccgtcctggg taccccgagt ctcccccgac 11880 ctcgggtccc aggtatgctc ccacctccac ctgccccact caccacctct gctagttcca 11940 gacacctccc aagcacgcag caatgcagct caaaacgctt agcctagcca cacccccacg 12000 ggaaacagca gtgattaacc tttagcaata aacgaaagtt taactaagct atactaaccc 12060 cagggttggt caatttcgtg ccagccacac cctggagcta gcaaaaaaaa 12110 <210> 144 <211> 8264 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 6 <400> 144 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctgcccccac caaggtgacc ttcggcgacg 5700 acaccgtgat cgaggtgcag ggctacaaga gcgtgaacat caccttcgag ctggacgaga 5760 ggatcgacaa ggtgctgaac gagaagtgca gcgcctacac cgtggagctg ggcaccgagg 5820 tgaacgagtt cgcctgcgtg gtggccgacg ccgtgatcaa gaccctgcag cccgtgagcg 5880 agctgctgac ccccctgggc atcgacctgg acgagtggag catggccacc tactacctgt 5940 tcgacgagag cggcgagttc aagctggcca gccacatgta ctgcagcttc tacccccccg 6000 acgaggacga ggaggagggc gactgcgagg aggaggagtt cgagcccagc acccagtacg 6060 agtacggcac cgaggacgac taccagggca agcccctgga gttcggcgcc accagcgccg 6120 ccctgcagcc cgaggaggag caggaggagg actggctgga cgacgacagc cagcagaccg 6180 tgggccagca ggacggcagc gaggacaacc agaccaccac catccagacc atcgtggagg 6240 tgcagcccca gctggagatg gagctgaccc ccgtggtgca gaccatcgag gtgaacagct 6300 tcagcggcta cctgaagctg accgacaacg tgtacatcaa gaacgccgac atcgtggagg 6360 aggccaagaa ggtgaagccc accgtggtgg tgaacgccgc caacgtgtac ctgaagcacg 6420 gcggcggcgt ggccggcgcc ctgaacaagg ccaccaacaa cgccatgcag gtggagagcg 6480 acgactacat cgccaccaac ggccccctga aggtgggcgg cagctgcgtg ctgagcggcc 6540 acaacctggc caagcactgc ctgcacgtgg tgggccccaa cgtgaacaag ggcgaggaca 6600 tccagctgct gaagagcgcc tacgagaact tcaaccagca cgaggtgctg ctggcccccc 6660 tgctgagcgc cggcatcttc ggcgccgacc ccatccacag cctgagggtg tgcgtggaca 6720 ccgtgaggac caacgtgtac ctggccgtgt tcgacaagaa cctgtacgac aagctggtga 6780 gcagcttcct ggagatgaag agcgagaagc aggtggagca gaagatcgcc gagatcccca 6840 aggaggaggt gaagcccttc atcaccgaga gcaagcccag cgtggagcag aggaagcagg 6900 acgacaagaa gatcaaggcc tgcgtggagg aggtgaccac caccctggag gagaccaagt 6960 tcctgaccga gaacctgctg ctgtacatcg acatcaacgg caacctgcac cccgacagcg 7020 ccaccctggt gagcgacatc gacatcacct tcctgaagaa ggacgccccc tacatcgtgg 7080 gcgacgtggt gcaggagggc gtgctgaccg ccgtggtgat ccccaccaag aaggccggcg 7140 gcaccaccga gatgctggcc aaggccctga ggaaggtgcc caccgacaac tacatcacca 7200 cctaccccgg ccagggcctg aacggctaca ccgtggagga ggccaagacc gtgctgaaga 7260 agtgcaagag cgccttctac atcctgccca gcatcatcag caacgagaag caggagatcc 7320 tgggcaccgt gagctggaac ctgagggaga tgctggccca cgccgaggag accaggaagc 7380 tgatgcccgt gtgcgtggag accaaggcca tcgtgagcac catccagagg aagtacaagg 7440 gcatcaagat ccaggagggc gtggtggact acggcgccag gttctacttc tacaccagca 7500 agaccaccgt ggccagcctg atcaacaccc tgaacgacct gaacgagacc ctggtgacca 7560 tgcccctggg ctacgtgacc cacggcctga acctggagga ggccgccagg tacatgagga 7620 gcctgaaggt gcccgccacc gtgagcgtga gcagccccga cgccgtgacc gcctacaacg 7680 gctacctgac cagcagcagc aagacccccg aggagcactt catcgagacc atcagcctgg 7740 ccggcagcta caaggactgg agctacagcg gccagagcac ccagctgggc atcgagttcc 7800 tgaagagggg cgacaagagc gtgtactaca ccagcaaccc caccaccttc cacctggacg 7860 gcgaggtgat caccttcgac aacctgaaga ccctgctgag cctgagggag gtgaggacca 7920 tcaaggtgtt caccaccgtg gacaacatca acctgcactg actcgagctg gtactgcatg 7980 cacgcaatgc tagctgcccc tttcccgtcc tgggtacccc gagtctcccc cgacctcggg 8040 tcccaggtat gctcccacct ccacctgccc cactcaccac ctctgctagt tccagacacc 8100 tcccaagcac gcagcaatgc agctcaaaac gcttagccta gccacacccc cacgggaaac 8160 agcagtgatt aacctttagc aataaacgaa agtttaacta agctatacta accccagggt 8220 tggtcaattt cgtgccagcc acaccctgga gctagcaaaa aaaa 8264 <210> 145 <211> 6896 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 7 <400> 145 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctagcggctt caggaagatg gccttcccca 5700 gcggcaaggt ggagggctgc atggtgcagg tgacctgcgg caccaccacc ctgaacggcc 5760 tgtggctgga cgacgtggtg tactgcccca ggcacgtgat ctgcaccagc gaggacatgc 5820 tgaaccccaa ctacgaggac ctgctgatca ggaagagcaa ccacaacttc ctggtgcagg 5880 ccggcaacgt gcagctgagg gtgatcggcc acagcatgca gaactgcgtg ctgaagctga 5940 aggtggacac cgccaacccc aagaccccca agtacaagtt cgtgaggatc cagcccggcc 6000 agaccttcag cgtgctggcc tgctacaacg gcagccccag cggcgtgtac cagtgcgcca 6060 tgaggcccaa cttcaccatc aagggcagct tcctgaacgg cagctgcggc agcgtgggct 6120 tcaacatcga ctacgactgc gtgagcttct gctacatgca ccacatggag ctgcccaccg 6180 gcgtgcacgc cggcaccgac ctggagggca acttctacgg ccccttcgtg gacaggcaga 6240 ccgcccaggc cgccggcacc gacaccacca tcaccgtgaa cgtgctggcc tggctgtacg 6300 ccgccgtgat caacggcgac aggtggttcc tgaacaggtt caccaccacc ctgaacgact 6360 tcaacctggt ggccatgaag tacaactacg agcccctgac ccaggaccac gtggacatcc 6420 tgggccccct gagcgcccag accggcatcg ccgtgctgga catgtgcgcc agcctgaagg 6480 agctgctgca gaacggcatg aacggcagga ccatcctggg cagcgccctg ctggaggacg 6540 agttcacccc cttcgacgtg gtgaggcagt gcagcggcgt gaccttccag tgactcgagc 6600 tggtactgca tgcacgcaat gctagctgcc cctttcccgt cctgggtacc ccgagtctcc 6660 cccgacctcg ggtcccaggt atgctcccac ctccacctgc cccactcacc acctctgcta 6720 gttccagaca cctcccaagc acgcagcaat gcagctcaaa acgcttagcc tagccacacc 6780 cccacgggaa acagcagtga ttaaccttta gcaataaacg aaagtttaac taagctatac 6840 taaccccagg gttggtcaat ttcgtgccag ccacaccctg gagctagcaa aaaaaa 6896 <210> 146 <211> 8774 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 8 <400> 146 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctagcgccga cgcccagagc ttcctgaaca 5700 gggtgtgcgg cgtgagcgcc gccaggctga ccccctgcgg caccggcacc agcaccgacg 5760 tggtgtacag ggccttcgac atctacaacg acaaggtggc cggcttcgcc aagttcctga 5820 agaccaactg ctgcaggttc caggagaagg acgaggacga caacctgatc gacagctact 5880 tcgtggtgaa gaggcacacc ttcagcaact accagcacga ggagaccatc tacaacctgc 5940 tgaaggactg ccccgccgtg gccaagcacg acttcttcaa gttcaggatc gacggcgaca 6000 tggtgcccca catcagcagg cagaggctga ccaagtacac catggccgac ctggtgtacg 6060 ccctgaggca cttcgacgag ggcaactgcg acaccctgaa ggagatcctg gtgacctaca 6120 actgctgcga cgacgactac ttcaacaaga aggactggta cgacttcgtg gagaaccccg 6180 acatcctgag ggtgtacgcc aacctgggcg agagggtgag gcaggccctg ctgaagaccg 6240 tgcagttctg cgacgccatg aggaacgccg gcatcgtggg cgtgctgacc ctggacaacc 6300 aggacctgaa cggcaactgg tacgacttcg gcgacttcat ccagaccacc cccggcagcg 6360 gcgtgcccgt ggtggacagc tactacagcc tgctgatgcc catcctgacc ctgaccaggg 6420 ccctgaccgc cgagagccac gtggacaccg acctgaccaa gccctacatc aagtgggacc 6480 tgctgaagta cgacttcacc gaggagaggc tgaagctgtt cgacaggtac ttcaagtact 6540 gggaccagac ctaccacccc aactgcgtga actgcctgga cgacaggtgc atcctgcact 6600 gcgccaactt caacgtgctg ttcagcaccg tgttcccccc caccagcttc ggccccctgg 6660 tgaggaagat cttcgtggac ggcgtgccct tcgtggtgag caccggctac cacttcaggg 6720 agctgggcgt ggtgcacaac caggacgtga acctgcacag cagcaggctg agcttcaagg 6780 agctgctggt gtacgccgcc gaccccgcca tgcacgccgc cagcggcaac ctgctgctgg 6840 acaagaggac cacctgcttc agcgtggccg ccctgaccaa caacgtggcc ttccagaccg 6900 tgaagcccgg caacttcaac aaggacttct acgacttcgc cgtgagcaag ggcttcttca 6960 aggagggcag cagcgtggag ctgaagcact tcttcttcgc ccaggacggc aacgccgcca 7020 tcagcgacta cgactactac aggtacaacc tgcccaccat gtgcgacatc aggcagctgc 7080 tgttcgtggt ggaggtggtg gacaagtact tcgactgcta cgacggcggc tgcatcaacg 7140 ccaaccaggt gatcgtgaac aacctggaca agagcgccgg cttccccttc aacaagtggg 7200 gcaaggccag gctgtactac gacagcatga gctacgagga ccaggacgcc ctgttcgcct 7260 acaccaagag gaacgtgatc cccaccatca cccagatgaa cctgaagtac gccatcagcg 7320 ccaagaacag ggccaggacc gtggccggcg tgagcatctg cagcaccatg accaacaggc 7380 agttccacca gaagctgctg aagagcatcg ccgccaccag gggcgccacc gtggtgatcg 7440 gcaccagcaa gttctacggc ggctggcaca acatgctgaa gaccgtgtac agcgacgtgg 7500 agaaccccca cctgatgggc tgggactacc ccaagtgcga cagggccatg cccaacatgc 7560 tgaggatcat ggccagcctg gtgctggcca ggaagcacac cacctgctgc agcctgagcc 7620 acaggttcta caggctggcc aacgagtgcg cccaggtgct gagcgagatg gtgatgtgcg 7680 gcggcagcct gtacgtgaag cccggcggca ccagcagcgg cgacgccacc accgcctacg 7740 ccaacagcgt gttcaacatc tgccaggccg tgaccgccaa cgtgaacgcc ctgctgagca 7800 ccgacggcaa caagatcgcc gacaagtacg tgaggaacct gcagcacagg ctgtacgagt 7860 gcctgtacag gaacagggac gtggacaccg acttcgtgaa cgagttctac gcctacctga 7920 ggaagcactt cagcatgatg atcctgagcg acgacgccgt ggtgtgcttc aacagcacct 7980 acgccagcca gggcctggtg gccagcatca agaacttcaa gagcgtgctg tactaccaga 8040 acaacgtgtt catgagcgag gccaagtgct ggaccgagac cgacctgacc aagggccccc 8100 acgagttctg cagccagcac accatgctgg tgaagcaggg cgacgactac gtgtacctgc 8160 cctaccccga ccccagcagg atcctgggcg ccggctgctt cgtggacgac atcgtgaaga 8220 ccgacggcac cctgatgatc gagaggttcg tgagcctggc catcgacgcc taccccctga 8280 ccaagcaccc caaccaggag tacgccgacg tgttccacct gtacctgcag tacatcagga 8340 agctgcacga cgagctgacc ggccacatgc tggacatgta cagcgtgatg ctgaccaacg 8400 acaacaccag caggtactgg gagcccgagt tctacgaggc catgtacacc ccccacaccg 8460 tgctgcagtg actcgagctg gtactgcatg cacgcaatgc tagctgcccc tttcccgtcc 8520 tgggtacccc gagtctcccc cgacctcggg tcccaggtat gctcccacct ccacctgccc 8580 cactcaccac ctctgctagt tccagacacc tcccaagcac gcagcaatgc agctcaaaac 8640 gcttagccta gccacacccc cacgggaaac agcagtgatt aacctttagc aataaacgaa 8700 agtttaacta agctatacta accccagggt tggtcaattt cgtgccagcc acaccctgga 8760 gctagcaaaa aaaa 8774 <210> 147 <211> 6812 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Vaccine Candidate 9 <400> 147 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttggagaata 1740 aactagtatt cttctggtcc ccacagactc agagagaacc cgccaccatg ttcgtgttcc 1800 tggtgctgct gcccctggtg agcagccagt gcgtgaacct gaccaccagg acccagctgc 1860 cccccgccta caccaacagc ttcaccaggg gcgtgtacta ccccgacaag gtgttcagga 1920 gcagcgtgct gcacagcacc caggacctgt tcctgccctt cttcagcaac gtgacctggt 1980 tccacgccat ccacgtgagc ggcaccaacg gcaccaagag gttcgacaac cccgtgctgc 2040 ccttcaacga cggcgtgtac ttcgccagca ccgagaagag caacatcatc aggggctgga 2100 tcttcggcac caccctggac agcaagaccc agagcctgct gatcgtgaac aacgccacca 2160 acgtggtgat caaggtgtgc gagttccagt tctgcaacga ccccttcctg ggcgtgtact 2220 accacaagaa caacaagagc tggatggaga gcgagttcag ggtgtacagc agcgccaaca 2280 actgcacctt cgagtacgtg agccagccct tcctgatgga cctggagggc aagcagggca 2340 acttcaagaa cctgagggag ttcgtgttca agaacatcga cggctacttc aagatctaca 2400 gcaagcacac ccccatcaac ctggtgaggg acctgcccca gggcttcagc gccctggagc 2460 ccctggtgga cctgcccatc ggcatcaaca tcaccaggtt ccagaccctg ctggccctgc 2520 acaggagcta cctgaccccc ggcgacagca gcagcggctg gaccgccggc gccgccgcct 2580 actacgtggg ctacctgcag cccaggacct tcctgctgaa gtacaacgag aacggcacca 2640 tcaccgacgc cgtggactgc gccctggacc ccctgagcga gaccaagtgc accctgaaga 2700 gcttcaccgt ggagaagggc atctaccaga ccagcaactt cagggtgcag cccaccgaga 2760 gcatcgtgag gttccccaac atcaccaacc tgtgcccctt cggcgaggtg ttcaacgcca 2820 ccaggttcgc cagcgtgtac gcctggaaca ggaagaggat cagcaactgc gtggccgact 2880 acagcgtgct gtacaacagc gccagcttca gcaccttcaa gtgctacggc gtgagcccca 2940 ccaagctgaa cgacctgtgc ttcaccaacg tgtacgccga cagcttcgtg atcaggggcg 3000 acgaggtgag gcagatcgcc cccggccaga ccggcaagat cgccgactac aactacaagc 3060 tgcccgacga cttcaccggc tgcgtgatcg cctggaacag caacaacctg gacagcaagg 3120 tgggcggcaa ctacaactac ctgtacaggc tgttcaggaa gagcaacctg aagcccttcg 3180 agagggacat cagcaccgag atctaccagg ccggcagcac cccctgcaac ggcgtggagg 3240 gcttcaactg ctacttcccc ctgcagagct acggcttcca gcccaccaac ggcgtgggct 3300 accagcccta cagggtggtg gtgctgagct tcgagctgct gcacgccccc gccaccgtgt 3360 gcggccccaa gaagagcacc aacctggtga agaacaagtg cgtgaacttc aacttcaacg 3420 gcctgaccgg caccggcgtg ctgaccgaga gcaacaagaa gttcctgccc ttccagcagt 3480 tcggcaggga catcgccgac accaccgacg ccgtgaggga cccccagacc ctggagatcc 3540 tggacatcac cccctgcagc ttcggcggcg tgagcgtgat cacccccggc accaacacca 3600 gcaaccaggt ggccgtgctg taccaggacg tgaactgcac cgaggtgccc gtggccatcc 3660 acgccgacca gctgaccccc acctggaggg tgtacagcac cggcagcaac gtgttccaga 3720 ccagggccgg ctgcctgatc ggcgccgagc acgtgaacaa cagctacgag tgcgacatcc 3780 ccatcggcgc cggcatctgc gccagctacc agacccagac caacagcccc ggcagcgcca 3840 gcagcgtggc cagccagagc atcatcgcct acaccatgag cctgggcgcc gagaacagcg 3900 tggcctacag caacaacagc atcgccatcc ccaccaactt caccatcagc gtgaccaccg 3960 agatcctgcc cgtgagcatg accaagacca gcgtggactg caccatgtac atctgcggcg 4020 acagcaccga gtgcagcaac ctgctgctgc agtacggcag cttctgcacc cagctgaaca 4080 gggccctgac cggcatcgcc gtggagcagg acaagaacac ccaggaggtg ttcgcccagg 4140 tgaagcagat ctacaagacc ccccccatca aggacttcgg cggcttcaac ttcagccaga 4200 tcctgcccga ccccagcaag cccagcaaga ggagccccat cgaggacctg ctgttcaaca 4260 aggtgaccct ggccgacgcc ggcttcatca agcagtacgg cgactgcctg ggcgacatcg 4320 ccgccaggga cctgatctgc gcccagaagt tcaacggcct gaccgtgctg ccccccctgc 4380 tgaccgacga gatgatcgcc cagtacacca gcgccctgct ggccggcacc atcaccagcg 4440 gctggacctt cggcgccggc cccgccctgc agatcccctt ccccatgcag atggcctaca 4500 ggttcaacgg catcggcgtg acccagaacg tgctgtacga gaaccagaag ctgatcgcca 4560 accagttcaa cagcgccatc ggcaagatcc aggacagcct gagcagcacc cccagcgccc 4620 tgggcaagct gcaggacgtg gtgaaccaga acgcccaggc cctgaacacc ctggtgaagc 4680 agctgagcag caacttcggc gccatcagca gcgtgctgaa cgacatcctg agcaggctgg 4740 acccccccga ggccgaggtg cagatcgaca ggctgatcac cggcaggctg cagagcctgc 4800 agacctacgt gacccagcag ctgatcaggg ccgccgagat cagggccagc gccaacctgg 4860 ccgccaccaa gatgagcgag tgcgtgctgg gccagagcaa gagggtggac ttctgcggca 4920 agggctacca cctgatgagc ttcccccaga gcgcccccca cggcgtggtg ttcctgcacg 4980 tgacctacgt gcccgcccag gagaagaact tcaccaccgc ccccgccatc tgccacgacg 5040 gcaaggccca cttccccagg gagggcgtgt tcgtgagcaa cggcacccac tggttcgtga 5100 cccagaggaa cttctacgag ccccagatca tcaccaccga caacaccttc gtgagcggca 5160 actgcgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg cagcccgagc 5220 tggacagctt caaggaggag ctggacaagt acttcaagaa ccacaccagc cccgacgtgg 5280 acctgggcga catcagcggc atcaacgcca gcgtggtgaa catccagaag gagatcgaca 5340 ggctgaacga ggtggccaag aacctgaacg agagcctgat cgacctgcag gagctgggca 5400 agtacgagca gtacatcaag tggccctggt acatctggct gggcttcatc gccggcctga 5460 tcgccatcgt gatggtgacc atcatgctgt gctgcatgac cagctgctgc agctgcctga 5520 agggctgctg cagctgcggc agctgctgca agttcgacga ggacgacagc gagcccgtgc 5580 tgaagggcgt gaagctgcac tacaccggaa gcggagccac gaacttctct ctgttaaagc 5640 aagcaggaga tgttgaagaa aaccccgggc ctatgaacag gaaggtgacc gccatcgccc 5700 tggccgccat catctgggcc accgccgccc agggcttcct gatgttcaag cagggcaggt 5760 gcctgtgcat cggccccggc atgaaggccg tgaagatggc cgagatcgag aaggccagcg 5820 tgatctaccc cagcaacggc tgcgacaagg tggaggtgat cgtgaccatg aaggcccaca 5880 agaggcagag gtgcctggac cccaggagca agcaggccag gctgatcatg caggccatcg 5940 agaagaagaa cttcctgagg aggcagaaca tgtgaggaag cggagccacg aacttctctc 6000 tgttaaagca agcaggagat gttgaagaaa accccgggcc tatgttccac gtgagcttca 6060 ggtacatctt cggcatcccc cccctgatcc tggtgctgct gcccgtgacc agcagcgagt 6120 gccacatcaa ggacaaggag ggcaaggcct acgagagcgt gctgatgatc agcatcgacg 6180 agctggacaa gatgaccggc accgacagca actgccccaa caacgagccc aacttcttca 6240 ggaagcacgt gtgcgacgac accaaggagg ccgccttcct gaacagggcc gccaggaagc 6300 tgaagcagtt cctgaagatg aacatcagcg aggagttcaa cgtgcacctg ctgaccgtga 6360 gccagggcac ccagaccctg gtgaactgca ccagcaagga ggagaagaac gtgaaggagc 6420 agaagaagaa cgacgcctgc ttcctgaaga ggctgctgag ggagatcaag acctgctgga 6480 acaagatcct gaagggcagc atctgatgac tcgagctggt actgcatgca cgcaatgcta 6540 gctgcccctt tcccgtcctg ggtaccccga gtctcccccg acctcgggtc ccaggtatgc 6600 tcccacctcc acctgcccca ctcaccacct ctgctagttc cagacacctc ccaagcacgc 6660 agcaatgcag ctcaaaacgc ttagcctagc cacaccccca cgggaaacag cagtgattaa 6720 cctttagcaa taaacgaaag tttaactaag ctatactaac cccagggttg gtcaatttcg 6780 tgccagccac accctggagc tagcaaaaaa aa 6812 <210> 148 <211> 3947 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Spike glycoprotein with 6 stabilizing mutations <400> 148 atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60 cggacccagc tgccaccagc ctacaccaac agcttcaccc ggggcgtcta ctaccccgac 120 aaggtgttcc ggagcagcgt cctgcacagc acccaggacc tgttcctgcc cttcttcagc 180 aacgtgacct ggttccacgc catccacgtg agcggcacca acggcaccaa gcggttcgac 240 aaccccgtgc tgcccttcaa cgacggcgtg tacttcgcca gcaccgagaa gagcaacatc 300 atccggggct ggatcttcgg caccaccctg gacagcaaga cccagagcct gctgatcgtg 360 aataacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa cgaccccttc 420 ctgggcgtgt actaccacaa gaacaacaag agctggatgg agagcgagtt ccgggtgtac 480 agcagcgcca acaactgcac cttcgagtac gtgagccagc ccttcctgat ggacctggag 540 ggcaagcagg gcaacttcaa gaacctgcgg gagttcgtgt tcaagaacat cgacggctac 600 ttcaagatct acagcaagca caccccaatc aacctggtgc gggatctgcc ccagggcttc 660 tcagccctgg agcccctggt ggacctgccc atcggcatca acatcacccg gttccagacc 720 ctgctggccc tgcaccggag ctacctgacc ccaggcgaca gcagcagcgg gtggacagca 780 ggcgcggctg cttactacgt gggctacctg cagccccgga ccttcctgct gaagtacaac 840 gagaacggca ccatcaccga cgccgtggac tgcgccctgg accctctgag cgagaccaag 900 tgcaccctga agagcttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960 cagcccaccg agagcatcgt gcggttcccc aacatcacca acctgtgccc cttcggcgag 1020 gtgttcaacg ccacccggtt cgccagcgtg tacgcctgga accggaagcg gatcagcaac 1080 tgcgtggccg actacagcgt gctgtacaac agcgccagct tcagcacctt caagtgctac 1140 ggcgtgagcc ccaccaagct gaacgacctg tgcttcacca acgtgtacgc cgacagcttc 1200 gtgatccgtg gcgacgaggt gcggcagatc gcacccggcc agacaggcaa gatcgccgac 1260 tacaactaca agctgcccga cgacttcacc ggctgcgtga tcgcctggaa cagcaacaac 1320 ctcgacagca aggtgggcgg caactacaac tacctgtacc ggctgttccg gaagagcaac 1380 ctgaagccct tcgagcggga catcagcacc gagatctacc aagccggctc caccccttgc 1440 aacggcgtgg agggcttcaa ctgctacttc cctctgcaga gctacggctt ccagcccacc 1500 aacggcgtgg gctaccagcc ctaccgggtg gtggtgctga gcttcgagct gctgcacgcc 1560 ccagccaccg tgtgtggccc caagaagagc accaacctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggccttac cggcaccggc gtgctgaccg agagcaacaa gaaattcctg 1680 ccctttcagc agttcggccg ggacatcgcc gacaccaccg acgctgtgcg ggatccccag 1740 accctggaga tcctggacat caccccttgc agcttcggcg gcgtgagcgt gatcacccca 1800 ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg caccgaggtg 1860 cccgtggcca tccacgccga ccagctgaca cccacctggc gggtctacag caccggcagc 1920 aacgtgttcc agacccgggc cggttgcctg atcggcgccg agcacgtgaa caacagctac 1980 gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagaccca gaccaattca 2040 cccggcagcg ccagcagcgt ggccagccag agcatcatcg cctacaccat gagcctgggc 2100 gccgagaaca gcgtggccta cagcaacaac agcatcgcca tccccaccaa cttcaccatc 2160 agcgtgacca ccgagattct gcccgtgagc atgaccaaga ccagcgtgga ctgcaccatg 2220 tacatctgcg gcgacagcac cgagtgcagc aacctgctgc tgcagtacgg cagcttctgc 2280 acccagctga accgggccct gaccggcatc gccgtggagc aggacaagaa cacccaggag 2340 gtgttcgccc aggtgaagca gatctacaag acccctccca tcaaggactt cggcggcttc 2400 aacttcagcc agatcctgcc cgaccccagc aagcccagca agcggagccc catcgaggac 2460 ctgctgttca acaaggtgac cctagccgac gccggcttca tcaagcagta cggcgactgc 2520 ctcggcgaca tagccgcccg ggacctgatc tgcgcccaga agttcaacgg cctgaccgtg 2580 ctgcctcccc tgctgaccga cgagatgatc gcccagtaca ccagcgccct gttagccgga 2640 accatcacca gcggctggac tttcggcgct ggccccgctc tgcagatccc cttccccatg 2700 cagatggcct accggttcaa cggcatcggc gtgacccaga acgtgctgta cgagaaccag 2760 aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc 2820 acccctagcg ccctgggcaa gctgcaggac gtggtgaacc agaacgccca ggccctgaac 2880 accctggtga agcagctgag cagcaacttc ggcgccatca gcagcgtgct gaacgacatc 2940 ctgagccggc tggaccctcc cgaggccgag gtgcagatcg accggctgat cactggccgg 3000 ctgcagagcc tgcagaccta cgtgacccag cagctgatcc gggccgccga gattcgggcc 3060 agcgccaacc tggccgccac caagatgagc gagtgcgtgc tgggccagag caagcgggtg 3120 gacttctgcg gcaagggcta ccacctgatg agctttcccc agagcgcacc ccacggagtg 3180 gtgttcctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac cgccccagcc 3240 atctgccacg acggcaaggc ccactttccc cgggagggcg tgttcgtgag caacggcacc 3300 cactggttcg tgacccagcg gaacttctac gagccccaga tcatcaccac cgacaacacc 3360 ttcgtgagcg gcaactgcga cgtggtgatc ggcatcgtga acaacaccgt gtacgatccc 3420 ctgcagcccg agctggacag cttcaaggag gagctggaca agtacttcaa gaatcacacc 3480 agccccgacg tggacctggg cgacatcagc ggcatcaacg ccagcgtggt gaacatccag 3540 aaggagatcg atcggctgaa cgaggtggcc aagaacctga acgagagcct gatcgacctg 3600 caggagctgg gcaagtacga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660 atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgcat gaccagctgc 3720 tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaggacgac 3780 agcgagcccg tgctgaaggg cgtgaagctg cactacacct gataataggc tggagcctcg 3840 gtggcctagc ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg 3900 tacccccgtg gtctttgaat aaagtctgag tgggcggcaa aaaaaaa 3947 <210> 149 <211> 3947 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Spike glycoprotein with one stabilizing mutations <400> 149 atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60 cggacccagc tgccaccagc ctacaccaac agcttcaccc ggggcgtcta ctaccccgac 120 aaggtgttcc ggagcagcgt cctgcacagc acccaggacc tgttcctgcc cttcttcagc 180 aacgtgacct ggttccacgc catccacgtg agcggcacca acggcaccaa gcggttcgac 240 aaccccgtgc tgcccttcaa cgacggcgtg tacttcgcca gcaccgagaa gagcaacatc 300 atccggggct ggatcttcgg caccaccctg gacagcaaga cccagagcct gctgatcgtg 360 aataacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa cgaccccttc 420 ctgggcgtgt actaccacaa gaacaacaag agctggatgg agagcgagtt ccgggtgtac 480 agcagcgcca acaactgcac cttcgagtac gtgagccagc ccttcctgat ggacctggag 540 ggcaagcagg gcaacttcaa gaacctgcgg gagttcgtgt tcaagaacat cgacggctac 600 ttcaagatct acagcaagca caccccaatc aacctggtgc gggatctgcc ccagggcttc 660 tcagccctgg agcccctggt ggacctgccc atcggcatca acatcacccg gttccagacc 720 ctgctggccc tgcaccggag ctacctgacc ccaggcgaca gcagcagcgg gtggacagca 780 ggcgcggctg cttactacgt gggctacctg cagccccgga ccttcctgct gaagtacaac 840 gagaacggca ccatcaccga cgccgtggac tgcgccctgg accctctgag cgagaccaag 900 tgcaccctga agagcttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960 cagcccaccg agagcatcgt gcggttcccc aacatcacca acctgtgccc cttcggcgag 1020 gtgttcaacg ccacccggtt cgccagcgtg tacgcctgga accggaagcg gatcagcaac 1080 tgcgtggccg actacagcgt gctgtacaac agcgccagct tcagcacctt caagtgctac 1140 ggcgtgagcc ccaccaagct gaacgacctg tgcttcacca acgtgtacgc cgacagcttc 1200 gtgatccgtg gcgacgaggt gcggcagatc gcacccggcc agacaggcaa gatcgccgac 1260 tacaactaca agctgcccga cgacttcacc ggctgcgtga tcgcctggaa cagcaacaac 1320 ctcgacagca aggtgggcgg caactacaac tacctgtacc ggctgttccg gaagagcaac 1380 ctgaagccct tcgagcggga catcagcacc gagatctacc aagccggctc caccccttgc 1440 aacggcgtgg agggcttcaa ctgctacttc cctctgcaga gctacggctt ccagcccacc 1500 aacggcgtgg gctaccagcc ctaccgggtg gtggtgctga gcttcgagct gctgcacgcc 1560 ccagccaccg tgtgtggccc caagaagagc accaacctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggccttac cggcaccggc gtgctgaccg agagcaacaa gaaattcctg 1680 ccctttcagc agttcggccg ggacatcgcc gacaccaccg acgctgtgcg ggatccccag 1740 accctggaga tcctggacat caccccttgc agcttcggcg gcgtgagcgt gatcacccca 1800 ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg caccgaggtg 1860 cccgtggcca tccacgccga ccagctgaca cccacctggc gggtctacag caccggcagc 1920 aacgtgttcc agacccgggc cggttgcctg atcggcgccg agcacgtgaa caacagctac 1980 gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagaccca gaccaattca 2040 cccggcagcg ccagcagcgt ggccagccag agcatcatcg cctacaccat gagcctgggc 2100 gccgagaaca gcgtggccta cagcaacaac agcatcgcca tccccaccaa cttcaccatc 2160 agcgtgacca ccgagattct gcccgtgagc atgaccaaga ccagcgtgga ctgcaccatg 2220 tacatctgcg gcgacagcac cgagtgcagc aacctgctgc tgcagtacgg cagcttctgc 2280 acccagctga accgggccct gaccggcatc gccgtggagc aggacaagaa cacccaggag 2340 gtgttcgccc aggtgaagca gatctacaag acccctccca tcaaggactt cggcggcttc 2400 aacttcagcc agatcctgcc cgaccccagc aagcccagca agcggagccc catcgaggac 2460 ctgctgttca acaaggtgac cctagccgac gccggcttca tcaagcagta cggcgactgc 2520 ctcggcgaca tagccgcccg ggacctgatc tgcgcccaga agttcaacgg cctgaccgtg 2580 ctgcctcccc tgctgaccga cgagatgatc gcccagtaca ccagcgccct gttagccgga 2640 accatcacca gcggctggac tttcggcgct ggccccgctc tgcagatccc cttccccatg 2700 cagatggcct accggttcaa cggcatcggc gtgacccaga acgtgctgta cgagaaccag 2760 aagctgatcg ccaaccagtt caacagcgcc atcggcaaga tccaggacag cctgagcagc 2820 acccctagcg ccctgggcaa gctgcaggac gtggtgaacc agaacgccca ggccctgaac 2880 accctggtga agcagctgag cagcaacttc ggcgccatca gcagcgtgct gaacgacatc 2940 ctgagccggc tggaccctcc cgaggccgag gtgcagatcg accggctgat cactggccgg 3000 ctgcagagcc tgcagaccta cgtgacccag cagctgatcc gggccgccga gattcgggcc 3060 agcgccaacc tggccgccac caagatgagc gagtgcgtgc tgggccagag caagcgggtg 3120 gacttctgcg gcaagggcta ccacctgatg agctttcccc agagcgcacc ccacggagtg 3180 gtgttcctgc acgtgaccta cgtgcccgcc caggagaaga acttcaccac cgccccagcc 3240 atctgccacg acggcaaggc ccactttccc cgggagggcg tgttcgtgag caacggcacc 3300 cactggttcg tgacccagcg gaacttctac gagccccaga tcatcaccac cgacaacacc 3360 ttcgtgagcg gcaactgcga cgtggtgatc ggcatcgtga acaacaccgt gtacgatccc 3420 ctgcagcccg agctggacag cttcaaggag gagctggaca agtacttcaa gaatcacacc 3480 agccccgacg tggacctggg cgacatcagc ggcatcaacg ccagcgtggt gaacatccag 3540 aaggagatcg atcggctgaa cgaggtggcc aagaacctga acgagagcct gatcgacctg 3600 caggagctgg gcaagtacga gcagtacatc aagtggccct ggtacatctg gctgggcttc 3660 atcgccggcc tgatcgccat cgtgatggtg accatcatgc tgtgctgcat gaccagctgc 3720 tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaggacgac 3780 agcgagcccg tgctgaaggg cgtgaagctg cactacacct gataataggc tggagcctcg 3840 gtggcctagc ttcttgcccc ttgggcctcc ccccagcccc tcctcccctt cctgcacccg 3900 tacccccgtg gtctttgaat aaagtctgag tgggcggcaa aaaaaaa 3947 <210> 150 <211> 1257 <212> DNA <213> Artificial Sequence <220> <223> Nucleocaspid protein from SARS-CoV-2 <400> 150 atgagcgaca acggccccca gaaccagagg aacgccccca ggatcacctt cggcggcccc 60 agcgacagca ccggcagcaa ccagaacggc gagaggagcg gcgccaggag caagcagagg 120 aggccccagg gcctgcccaa caacaccgcc agctggttca ccgccctgac ccagcacggc 180 aaggaggacc tgaagttccc caggggccag ggcgtgccca tcaacaccaa cagcagcccc 240 gacgaccaga tcggctacta caggagggcc accaggagga tcaggggcgg cgacggcaag 300 atgaaggacc tgagccccag gtggtacttc tactacctgg gcaccggccc cgaggccggc 360 ctgccctacg gcgccaacaa ggacggcatc atctgggtgg ccaccgaggg cgccctgaac 420 acccccaagg accacatcgg caccaggaac cccgccaaca acgccgccat cgtgctgcag 480 ctgccccagg gcaccaccct gcccaagggc ttctacgccg agggcagcag gggcggcagc 540 caggccagca gcaggagcag cagcaggagc aggaacagca gcaggaacag cacccccggc 600 agcagcaggg gcaccagccc cgccaggatg gccggcaacg gcggcgacgc cgccctggcc 660 ctgctgctgc tggacaggct gaaccagctg gagagcaaga tgagcggcaa gggccagcag 720 cagcagggcc agaccgtgac caagaagagc gccgccgagg ccagcaagaa gcccaggcag 780 aagaggaccg ccaccaaggc ctacaacgtg acccaggcct tcggcaggag gggccccgag 840 cagacccagg gcaacttcgg cgaccaggag ctgatcaggc agggcaccga ctacaagcac 900 tggccccaga tcgcccagtt cgcccccagc gccagcgcct tcttcggcat gagcaggatc 960 ggcatggagg tgacccccag cggcacctgg ctgacctaca ccggcgccat caagctggac 1020 gacaaggacc ccaacttcaa ggaccaggtg atcctgctga acaagcacat cgacgcctac 1080 aagaccttcc cccccaccga gcccaagaag gacaagaaga agaaggccga cgagacccag 1140 gccctgcccc agaggcagaa gaagcagcag accgtgaccc tgctgcccgc cgccgacctg 1200 gacgacttca gcaagcagct gcagcagagc atgagcagcg ccgacagcac ccaggcc 1257 <210> 151 <211> 3685 <212> DNA <213> Artificial Sequence <220> <223> ORF1ab protein (non-annotated) from SARS-CoV-2 <400> 151 caaaccactg aaacagcwca ctcttgtaat gttaaccgct ttaatgtggc tattacaaga 60 gcaaaaattg gcattttgtg cataatgtct gacagagatc tttatgacaa gctgcaattc 120 acaagtctag aagtaccgcg tcgtaacgtg gctacattac aagcggaaaa tgtaactgga 180 ctctttaagg actgtagtaa gatcataact ggtcttcatc ctacacaagc acctacacac 240 cttagtgttg atacaaaatt caagactgag ggactatgtg ttgacatacc aggcatwccw 300 aaggacatga cctatmgwag actcatctcy atgatgggtt tcaaaatgaa ttaycaagtt 360 aatggttacc ctaayatgtt yatcacccgy gargaagcca tmmgmcaygt wcgtgcatgg 420 attggctttg atgtagaggg ktgtcatgct actagggatg ctgtcggtac taacctacct 480 ctccagttag gattttctac aggtgttaac ttagtagctg taccaactgg ctatgttgac 540 actgaaaaca atacagaatt caccagagtt aatgcaaaac ctccaccagg tgaccaattt 600 aaacatctta taccacttat gtacaaaggt ttaccctgga acatagtgcg tatcaagata 660 gtacaaatgc tcagtgatac actgaaagga ttatcrgaca gagttgtgtt tgtcctatgg 720 gcacatggct ttgaacttac atcaatgaag tactttgtca agattggacc tgaaagaacg 780 tgttgtctgt gtgacaaacg tgcaacttgt ttttctactt catcagacaa ttatgcctgc 840 tggaaccatt ctgtgggttt tgactatgtc tataatccat ttatgattga tgtccagcag 900 tggggtttta caggtaacct tcagagtaat cacgatcagc attgccaagt gcatggcaac 960 gctcatgtgg ctagttgtga tgctatcatg actagatgtt tagcagtcca tgagtgcttt 1020 gttaagcgcg ttgactggtc tgttgagtac ccaattatag gtgatgaact gaagatcaat 1080 gccgcatgca gaaaagtgca acatatggtt gtaaagtctg cattgcttgc tgacaaattc 1140 ccagttcttc atgacattgg aaacccaaag gctatcaaat gtgtcccrca ggctgaagtg 1200 gattggaagt tctatgatgc tcagccctgc agtgacaaag cttataaaat aaaagaactc 1260 ttctattctt atgctacaca tcatgataaa ttcattgatg gtgtttgttt attttggaat 1320 tgtaacgttg atcgttaccc tgccaatgct attgtrtgca ggttcgacac gagagtcttg 1380 tcaaatttga acttgccagg ttgtgatggt ggtagtttgt atgtaaataa gcatgcattc 1440 cacactccag cttttgataa aagtgcattt actaatttaa agcaattgcc tttcttttat 1500 tactctgaca gtccctgtga gtcacatggc aagcaggttg tttctgacat tgattatgta 1560 ccactcaaat ctgctacrtg tataacacga tgcaatttgg grggtgctgt ttgcagacat 1620 catgcaaatg agtaccgaca gtacttggat gcatacaata tgatgatttc tgctggcttt 1680 agcctctgga tttacaaaca gtttgacact tataacctgt ggaacacctt taccaggtta 1740 cagagtttag aaaatgtggc ttacaatgtt gttaacaaag gacacttcga tggacaagct 1800 ggtgaagcac ctgtttccgt cattaataat gttgtttaca caaaggtaga tggtgttgat 1860 gtagagatct ttgaaaacaa gacaacactt cctgttaatg ttgcatttga gctttgggct 1920 aagcgtaaca ttaaaccagt gccagagatt aagatactca ataatttggg tgtcgatatc 1980 gctgctaata ctgtaatctg ggactacaag agagaagcac cagcacatat gtcaacaata 2040 ggtgtctgca caatgactga cattgccaag aaacctactg agagtgcttg ttcctcgctt 2100 actgtcttat ttgatggtag agtggaagga caggtagacc tttttagaaa tgcccgtaat 2160 ggtgttttaa taacagaagg ttcagttaaa ggtttaatac cttcaaaggg accagcacaa 2220 gctagtgtca atggagtcac attaattgga gaatcagtaa aaacacagtt taattatttt 2280 aagaaagtag atggcatcat tcaacagttg cctgaaacct actttactca gagccgagac 2340 ttagaggatt tcaagcccag atcacaaatg gaaactgact ttcttgagct cgctatggat 2400 gaattcatac aacggtacaa gcttgaaggc tatgccttcg aacatatcgt ttatggagat 2460 tttagtcatg gacagcttgg tggacttcat ctaatgattg gtctagctaa gcgctcacaa 2520 gattcaccac ttaaattaga ggattttatc cctacggaca gtacagtgaa aaattatttc 2580 ataacagatg cgcaaacagg ttcatcaaaa tgcgtgtgct ctgttattga tcttctgctt 2640 gatgactttg ttgagataat aaagtcacaa gatttatcag tggtttcaaa ggtggtcaaa 2700 gtcacaattg actatgctga aatttcattc atgttatggt gtaaggatgg acatgttgaa 2760 accttttacc caaaattaca agcgagtcag gcgtggcaac caggagttgc aatgcctaac 2820 ttgtataaga tgcagagaat gcttcttgaa aaatgtgacc ttcagaatta tggtgaaaat 2880 gctgtcatac caaarggaat aatgatgaat gtcgcaaaat atactcaact gtgtcaatat 2940 ttaaatacac tyacattagc ygtgccatat aatatgagag ttatccattt tggtgctggc 3000 tcrgacaaag gagttgcacc cggcacagct gttctcagac agtggttgcc aattggcaca 3060 ctacttgttg attcagatct taacgacttc gtctctgacg ctgattccac tctaattgga 3120 gactgtgcaa ccgtacatac agctaacaaa tgggatctca ttattagcga tatgtatgat 3180 cctaaaacca aacacgtgac aaaggaaaat gattcaaaag aaggattttt cacttacctg 3240 tgtggattta ttaaacaaaa attagccctg ggaggctctg tggctgtaaa gataactgag 3300 cattcttgga atgcggatct ctacaagctc atgggacatt tctcatggtg gacagctttt 3360 gttacaaatg ttaatgcatc ttcatcagaa gcatttttaa ttggagttaa ctatcttggt 3420 aagccaaaag aacaaattga tggttacacc atgcatgcta actacatttt ctggaggaat 3480 acaaacccga ttcaattgtc ttcctattca ctttttgaca tgagtaagtt ccctcttaaa 3540 ttaaggggaa cagctgtcat gtctttaaag gagaaccaaa tcaatgaaat gatttattct 3600 ctacttgaaa aaggcagact tatcattagg gaaaacaaca gagttgttgt ctcaagtgat 3660 gttcttgtta ataactaaac gaaca 3685 <210> 152 <211> 825 <212> DNA <213> Artificial Sequence <220> <223> ORF3a protein from SARS-CoV-2 <400> 152 atggacctgt tcatgaggat cttcaccatc ggcaccgtga ccctgaagca gggcgagatc 60 aaggacgcca cccccagcga cttcgtgagg gccaccgcca ccatccccat ccaggccagc 120 ctgcccttcg gctggctgat cgtgggcgtg gccctgctgg ccgtgttcca gagcgccagc 180 aagatcatca ccctgaagaa gaggtggcag ctggccctga gcaagggcgt gcacttcgtg 240 tgcaacctgc tgctgctgtt cgtgaccgtg tacagccacc tgctgctggt ggccgccggc 300 ctggaggccc ccttcctgta cctgtacgcc ctggtgtact tcctgcagag catcaacttc 360 gtgaggatca tcatgaggct gtggctgtgc tggaagtgca ggagcaagaa ccccctgctg 420 tacgacgcca actacttcct gtgctggcac accaactgct acgactactg catcccctac 480 aacagcgtga ccagcagcat cgtgatcacc agcggcgacg gcaccaccag ccccatcagc 540 gagcacgact accagatcgg cggctacacc gagaagtggg agagcggcgt gaaggactgc 600 gtggtgctgc acagctactt caccagcgac tactaccagc tgtacagcac ccagctgagc 660 accgacaccg gcgtggagca cgtgaccttc ttcatctaca acaagatcgt ggacgagccc 720 gaggagcacg tgcagatcca caccatcgac ggcagcagcg gcgtggtgaa ccccgtgatg 780 gagcccatct acgacgagcc caccaccacc accagcgtgc ccctg 825 <210> 153 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Envelope Protein from SARS-CoV-2 <400> 153 atgtacagct tcgtgagcga ggagaccggc accctgatcg tgaacagcgt gctgctgttc 60 ctggccttcg tggtgttcct gctggtgacc ctggccatcc tgaccgccct gaggctgtgc 120 gcctactgct gcaacatcgt gaacgtgagc ctggtgaagc ccagcttcta cgtgtacagc 180 agggtgaaga acctgaacag cagcagggtg cccgacctgc tggtg 225 <210> 154 <211> 666 <212> DNA <213> Artificial Sequence <220> <223> Membrane protein from SARS-CoV-2 <400> 154 atggccgaca gcaacggcac catcaccgtg gaggagctga agaagctgct ggagcagtgg 60 aacctggtga tcggcttcct gttcctgacc tggatctgcc tgctgcagtt cgcctacgcc 120 aacaggaaca ggttcctgta catcatcaag ctgatcttcc tgtggctgct gtggcccgtg 180 accctggcct gcttcgtgct ggccgccgtg tacaggatca actggatcac cggcggcatc 240 gccatcgcca tggcctgcct ggtgggcctg atgtggctga gctacttcat cgccagcttc 300 aggctgttcg ccaggaccag gagcatgtgg agcttcaacc ccgagaccaa catcctgctg 360 aacgtgcccc tgcacggcac catcctgacc aggcccctgc tggagagcga gctggtgatc 420 ggcgccgtga tcctgagggg ccacctgagg atcgccggcc accacctggg caggtgcgac 480 atcaaggacc tgcccaagga gatcaccgtg gccaccagca ggaccctgag ctactacaag 540 ctgggcgcca gccagagggt ggccggcgac agcggcttcg ccgcctacag caggtacagg 600 atcggcaact acaagctgaa caccgaccac agcagcagca gcgacaacat cgccctgctg 660 gtgcag 666 <210> 155 <211> 183 <212> DNA <213> Artificial Sequence <220> <223> ORF6 protein from SARS-CoV-2 <400> 155 atgttccacc tggtggactt ccaggtgacc atcgccgaga tcctgctgat catcatgagg 60 accttcaagg tgagcatctg gaacctggac tacatcatca acctgatcat caagaacctg 120 agcaagagcc tgaccgagaa caagtacagc cagctggacg aggagcagcc catggagatc 180 gac 183 <210> 156 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> ORF7a protein from SARS-CoV-2 <400> 156 atgaagatca tcctgttcct ggccctgatc accctggcca cctgcgagct gtaccactac 60 caggagtgcg tgaggggcac caccgtg 87 <210> 157 <211> 2286 <212> DNA <213> Artificial Sequence <220> <223> Nsp3 from SARS-CoV-2 <400> 157 gcccccacca aggtgacctt cggcgacgac accgtgatcg aggtgcaggg ctacaagagc 60 gtgaacatca ccttcgagct ggacgagagg atcgacaagg tgctgaacga gaagtgcagc 120 gcctacaccg tggagctggg caccgaggtg aacgagttcg cctgcgtggt ggccgacgcc 180 gtgatcaaga ccctgcagcc cgtgagcgag ctgctgaccc ccctgggcat cgacctggac 240 gagtggagca tggccaccta ctacctgttc gacgagagcg gcgagttcaa gctggccagc 300 cacatgtact gcagcttcta cccccccgac gaggacgagg aggagggcga ctgcgaggag 360 gaggagttcg agcccagcac ccagtacgag tacggcaccg aggacgacta ccagggcaag 420 cccctggagt tcggcgccac cagcgccgcc ctgcagcccg aggaggagca ggaggaggac 480 tggctggacg acgacagcca gcagaccgtg ggccagcagg acggcagcga ggacaaccag 540 accaccacca tccagaccat cgtggaggtg cagccccagc tggagatgga gctgaccccc 600 gtggtgcaga ccatcgaggt gaacagcttc agcggctacc tgaagctgac cgacaacgtg 660 tacatcaaga acgccgacat cgtggaggag gccaagaagg tgaagcccac cgtggtggtg 720 aacgccgcca acgtgtacct gaagcacggc ggcggcgtgg ccggcgccct gaacaaggcc 780 accaacaacg ccatgcaggt ggagagcgac gactacatcg ccaccaacgg ccccctgaag 840 gtgggcggca gctgcgtgct gagcggccac aacctggcca agcactgcct gcacgtggtg 900 ggccccaacg tgaacaaggg cgaggacatc cagctgctga agagcgccta cgagaacttc 960 aaccagcacg aggtgctgct ggcccccctg ctgagcgccg gcatcttcgg cgccgacccc 1020 atccacagcc tgagggtgtg cgtggacacc gtgaggacca acgtgtacct ggccgtgttc 1080 gacaagaacc tgtacgacaa gctggtgagc agcttcctgg agatgaagag cgagaagcag 1140 gtggagcaga agatcgccga gatccccaag gaggaggtga agcccttcat caccgagagc 1200 aagcccagcg tggagcagag gaagcaggac gacaagaaga tcaaggcctg cgtggaggag 1260 gtgaccacca ccctggagga gaccaagttc ctgaccgaga acctgctgct gtacatcgac 1320 atcaacggca acctgcaccc cgacagcgcc accctggtga gcgacatcga catcaccttc 1380 ctgaagaagg acgcccccta catcgtgggc gacgtggtgc aggagggcgt gctgaccgcc 1440 gtggtgatcc ccaccaagaa ggccggcggc accaccgaga tgctggccaa ggccctgagg 1500 aaggtgccca ccgacaacta catcaccacc taccccggcc agggcctgaa cggctacacc 1560 gtggaggagg ccaagaccgt gctgaagaag tgcaagagcg ccttctacat cctgcccagc 1620 atcatcagca acgagaagca ggagatcctg ggcaccgtga gctggaacct gagggagatg 1680 ctggcccacg ccgaggagac caggaagctg atgcccgtgt gcgtggagac caaggccatc 1740 gtgagcacca tccagaggaa gtacaagggc atcaagatcc aggagggcgt ggtggactac 1800 ggcgccaggt tctacttcta caccagcaag accaccgtgg ccagcctgat caacaccctg 1860 aacgacctga acgagaccct ggtgaccatg cccctgggct acgtgaccca cggcctgaac 1920 ctggaggagg ccgccaggta catgaggagc ctgaaggtgc ccgccaccgt gagcgtgagc 1980 agccccgacg ccgtgaccgc ctacaacggc tacctgacca gcagcagcaa gacccccgag 2040 gagcacttca tcgagaccat cagcctggcc ggcagctaca aggactggag ctacagcggc 2100 cagagcaccc agctgggcat cgagttcctg aagaggggcg acaagagcgt gtactacacc 2160 agcaacccca ccaccttcca cctggacggc gaggtgatca ccttcgacaa cctgaagacc 2220 ctgctgagcc tgagggaggt gaggaccatc aaggtgttca ccaccgtgga caacatcaac 2280 ctgcac 2286 <210> 158 <211> 918 <212> DNA <213> Artificial Sequence <220> <223> Nsp5 from SARS-CoV-2 <400> 158 agcggcttca ggaagatggc cttccccagc ggcaaggtgg agggctgcat ggtgcaggtg 60 acctgcggca ccaccaccct gaacggcctg tggctggacg acgtggtgta ctgccccagg 120 cacgtgatct gcaccagcga ggacatgctg aaccccaact acgaggacct gctgatcagg 180 aagagcaacc acaacttcct ggtgcaggcc ggcaacgtgc agctgagggt gatcggccac 240 agcatgcaga actgcgtgct gaagctgaag gtggacaccg ccaaccccaa gacccccaag 300 tacaagttcg tgaggatcca gcccggccag accttcagcg tgctggcctg ctacaacggc 360 agccccagcg gcgtgtacca gtgcgccatg aggcccaact tcaccatcaa gggcagcttc 420 ctgaacggca gctgcggcag cgtgggcttc aacatcgact acgactgcgt gagcttctgc 480 tacatgcacc acatggagct gcccaccggc gtgcacgccg gcaccgacct ggagggcaac 540 ttctacggcc ccttcgtgga caggcagacc gcccaggccg ccggcaccga caccaccatc 600 accgtgaacg tgctggcctg gctgtacgcc gccgtgatca acggcgacag gtggttcctg 660 aacaggttca ccaccaccct gaacgacttc aacctggtgg ccatgaagta caactacgag 720 cccctgaccc aggaccacgt ggacatcctg ggccccctga gcgcccagac cggcatcgcc 780 gtgctggaca tgtgcgccag cctgaaggag ctgctgcaga acggcatgaa cggcaggacc 840 atcctgggca gcgccctgct ggaggacgag ttcaccccct tcgacgtggt gaggcagtgc 900 agcggcgtga ccttccag 918 <210> 159 <211> 2796 <212> DNA <213> Artificial Sequence <220> <223> Nsp12 from SARS-CoV-2 <400> 159 agcgccgacg cccagagctt cctgaacagg gtgtgcggcg tgagcgccgc caggctgacc 60 ccctgcggca ccggcaccag caccgacgtg gtgtacaggg ccttcgacat ctacaacgac 120 aaggtggccg gcttcgccaa gttcctgaag accaactgct gcaggttcca ggagaaggac 180 gaggacgaca acctgatcga cagctacttc gtggtgaaga ggcacacctt cagcaactac 240 cagcacgagg agaccatcta caacctgctg aaggactgcc ccgccgtggc caagcacgac 300 ttcttcaagt tcaggatcga cggcgacatg gtgccccaca tcagcaggca gaggctgacc 360 aagtacacca tggccgacct ggtgtacgcc ctgaggcact tcgacgaggg caactgcgac 420 accctgaagg agatcctggt gacctacaac tgctgcgacg acgactactt caacaagaag 480 gactggtacg acttcgtgga gaaccccgac atcctgaggg tgtacgccaa cctgggcgag 540 agggtgaggc aggccctgct gaagaccgtg cagttctgcg acgccatgag gaacgccggc 600 atcgtgggcg tgctgaccct ggacaaccag gacctgaacg gcaactggta cgacttcggc 660 gacttcatcc agaccacccc cggcagcggc gtgcccgtgg tggacagcta ctacagcctg 720 ctgatgccca tcctgaccct gaccagggcc ctgaccgccg agagccacgt ggacaccgac 780 ctgaccaagc cctacatcaa gtgggacctg ctgaagtacg acttcaccga ggagaggctg 840 aagctgttcg acaggtactt caagtactgg gaccagacct accaccccaa ctgcgtgaac 900 tgcctggacg acaggtgcat cctgcactgc gccaacttca acgtgctgtt cagcaccgtg 960 ttccccccca ccagcttcgg ccccctggtg aggaagatct tcgtggacgg cgtgcccttc 1020 gtggtgagca ccggctacca cttcagggag ctgggcgtgg tgcacaacca ggacgtgaac 1080 ctgcacagca gcaggctgag cttcaaggag ctgctggtgt acgccgccga ccccgccatg 1140 cacgccgcca gcggcaacct gctgctggac aagaggacca cctgcttcag cgtggccgcc 1200 ctgaccaaca acgtggcctt ccagaccgtg aagcccggca acttcaacaa ggacttctac 1260 gacttcgccg tgagcaaggg cttcttcaag gagggcagca gcgtggagct gaagcacttc 1320 ttcttcgccc aggacggcaa cgccgccatc agcgactacg actactacag gtacaacctg 1380 cccaccatgt gcgacatcag gcagctgctg ttcgtggtgg aggtggtgga caagtacttc 1440 gactgctacg acggcggctg catcaacgcc aaccaggtga tcgtgaacaa cctggacaag 1500 agcgccggct tccccttcaa caagtggggc aaggccaggc tgtactacga cagcatgagc 1560 tacgaggacc aggacgccct gttcgcctac accaagagga acgtgatccc caccatcacc 1620 cagatgaacc tgaagtacgc catcagcgcc aagaacaggg ccaggaccgt ggccggcgtg 1680 agcatctgca gcaccatgac caacaggcag ttccaccaga agctgctgaa gagcatcgcc 1740 gccaccaggg gcgccaccgt ggtgatcggc accagcaagt tctacggcgg ctggcacaac 1800 atgctgaaga ccgtgtacag cgacgtggag aacccccacc tgatgggctg ggactacccc 1860 aagtgcgaca gggccatgcc caacatgctg aggatcatgg ccagcctggt gctggccagg 1920 aagcacacca cctgctgcag cctgagccac aggttctaca ggctggccaa cgagtgcgcc 1980 caggtgctga gcgagatggt gatgtgcggc ggcagcctgt acgtgaagcc cggcggcacc 2040 agcagcggcg acgccaccac cgcctacgcc aacagcgtgt tcaacatctg ccaggccgtg 2100 accgccaacg tgaacgccct gctgagcacc gacggcaaca agatcgccga caagtacgtg 2160 aggaacctgc agcacaggct gtacgagtgc ctgtacagga acagggacgt ggacaccgac 2220 ttcgtgaacg agttctacgc ctacctgagg aagcacttca gcatgatgat cctgagcgac 2280 gacgccgtgg tgtgcttcaa cagcacctac gccagccagg gcctggtggc cagcatcaag 2340 aacttcaaga gcgtgctgta ctaccagaac aacgtgttca tgagcgaggc caagtgctgg 2400 accgagaccg acctgaccaa gggcccccac gagttctgca gccagcacac catgctggtg 2460 aagcagggcg acgactacgt gtacctgccc taccccgacc ccagcaggat cctgggcgcc 2520 ggctgcttcg tggacgacat cgtgaagacc gacggcaccc tgatgatcga gaggttcgtg 2580 agcctggcca tcgacgccta ccccctgacc aagcacccca accaggagta cgccgacgtg 2640 ttccacctgt acctgcagta catcaggaag ctgcacgacg agctgaccgg ccacatgctg 2700 gacatgtaca gcgtgatgct gaccaacgac aacaccagca ggtactggga gcccgagttc 2760 tacgaggcca tgtacacccc ccacaccgtg ctgcag 2796 <210> 160 <211> 303 <212> DNA <213> Homo sapiens <400> 160 atgaacagga aggtgaccgc catcgccctg gccgccatca tctgggccac cgccgcccag 60 ggcttcctga tgttcaagca gggcaggtgc ctgtgcatcg gccccggcat gaaggccgtg 120 aagatggccg agatcgagaa ggccagcgtg atctacccca gcaacggctg cgacaaggtg 180 gaggtgatcg tgaccatgaa ggcccacaag aggcagaggt gcctggaccc caggagcaag 240 caggccaggc tgatcatgca ggccatcgag aagaagaact tcctgaggag gcagaacatg 300 tga 303 <210> 161 <211> 465 <212> DNA <213> Homo sapiens <400> 161 atgaaggtct ccgcggcagc cctcgctgtc atcctcattg ctactgccct ctgcgctcct 60 gcatctgcct ccccatattc ctcggacacc acaccctgct gctttgccta cattgcccgc 120 ccactgcccc gtgcccacat caaggagtat ttctacacca gtggcaagtg ctccaaccca 180 gcagtcgtcc acaggtcaag gatgccaaag agagagggac agcaagtctg gcaggatttc 240 ctgtatgact cccggctgaa caagggcaag ctttgtcacc cgaaagaacc gccaagtgtg 300 tgccaaccca gagaagaaat gggttcggga gtacatcaac tctttggaga tgagctagga 360 tggagagtcc ttgaacctga acttacacaa atttgcctgt ttctgcttgc tcttgtccta 420 gcttgggagg cttcccctca ctatcctacc ccacccgctc cttga 465 <210> 162 <211> 378 <212> DNA <213> Homo sapiens <400> 162 atgaagaaaa gtggtgttct tttcctcttg ggcatcatct tgctggttct gattggagtg 60 caaggaaccc cagtagtgag aaagggtcgc tgttcctgca tcagcaccaa ccaagggact 120 atccacctac aatccttgaa agaccttaaa caatttgccc caagcccttc ctgcgagaaa 180 attgaaatca ttgctacact gaagaatgga gttcaaacat gtctaaaccc agattcagca 240 gatgtgaagg aactgattaa aaagtgggag aaacaggtca gccaaaagaa aaagcaaaag 300 aatgggaaaa aacatcaaaa aaagaaagtt ctgaaagttc gaaaatctca acgttctcgt 360 caaaagaaga ctacataa 378 <210> 163 <211> 297 <212> DNA <213> Homo sapiens <400> 163 atgaatcaaa ctgccattct gatttgctgc cttatctttc tgactctaag tggcattcaa 60 ggagtacctc tctctagaac tgtacgctgt acctgcatca gcattagtaa tcaacctgtt 120 aatccaaggt ctttagaaaa acttgaaatt attcctgcaa gccaattttg tccacgtgtt 180 gagatcattg ctacaatgaa aaagaagggt gagaagagat gtctgaatcc agaatcgaag 240 gccatcaaga atttactgaa agcagttagc aaggaaaggt ctaaaagatc tccttaa 297 <210> 164 <211> 300 <212> DNA <213> Homo sapiens <400> 164 atgaggctcc tggcggccgc gctgctcctg ctgctgctgg cgctgtacac cgcgcgtgtg 60 gacgggtcca aatgcaagtg ctcccggaag ggacccaaga tccgctacag cgacgtgaag 120 aagctggaaa tgaagccaaa gtacccgcac tgcgaggaga agatggttat catcaccacc 180 aagagcgtgt ccaggtaccg aggtcaggag cactgcctgc accccaagct gcagagcacc 240 aagcgcttca tcaagtggta caacgcctgg aacgagaagc gcagggtcta cgaagaatag 300 300 <210> 165 <211> 360 <212> DNA <213> Homo sapiens <400> 165 atgaaagttc taatctcttc cctcctcctg ttgctgccac taatgctgat gtccatggtc 60 tctagcagcc tgaatccagg ggtcgccaga ggccacaggg accgaggcca ggcttctagg 120 agatggctcc aggaaggcgg ccaagaatgt gagtgcaaag attggttcct gagagccccg 180 agaagaaaat tcatgacagt gtctgggctg ccaaagaagc agtgcccctg tgatcatttc 240 aagggcaatg tgaagaaaac aagacaccaa aggcaccaca gaaagccaaa caagcattcc 300 agagcctgcc agcaatttct caaacaatgt cagctaagaa gctttgctct gcctttgtag 360 360 <210> 166 <211> 453 <212> DNA <213> Homo sapiens <400> 166 atgaacctgt ggctcctggc ctgcctggtg gccggcttcc tgggagcctg ggcccccgct 60 gtccacaccc aaggtgtctt tgaggactgc tgcctggcct accactaccc cattgggtgg 120 gctgtgctcc ggcgcgcctg gacttaccgg atccaggagg tgagcgggag ctgcaatctg 180 cctgctgcga tattctacct ccccaagaga cacaggaagg tgtgtgggaa ccccaaaagc 240 agggaggtgc agagagccat gaagctcctg gatgctcgaa ataaggtttt tgcaaagctc 300 caccacaaca cgcagacctt ccaagcaggc cctcatgctg taaagaagtt gagttctgga 360 aactccaagt tatcatcgtc caagtttagc aatcccatca gcagcagtaa gaggaatgtc 420 tccctcctga tatcagctaa ttcaggactg tga 453 <210> 167 <211> 384 <212> DNA <213> Homo sapiens <400> 167 atgcagcaga gaggactcgc catcgtggcc ttggctgtct gtgcggccct acatgcctca 60 gaagccatac ttcccattgc ctccagctgt tgcacggagg tttcacatca tatttccaga 120 aggctcctgg aaagagtgaa tatgtgtcgc atccagagag ctgatgggga ttgtgacttg 180 gctgctgtca tccttcatgt caagcgcaga agaatctgtg tcagcccgca caaccatact 240 gttaagcagt ggatgaaagt gcaagctgcc aagaaaaatg gtaaaggaaa tgtttgccac 300 aggaagaaac accatggcaa gaggaacagt aacagggcac atcaggggaa acacgaaaca 360 tacggccata aaactcctta ttag 384 <210> 168 <211> 465 <212> DNA <213> Homo sapiens <400> 168 atgttccacg tgagcttcag gtacatcttc ggcatccccc ccctgatcct ggtgctgctg 60 cccgtgacca gcagcgagtg ccacatcaag gacaaggagg gcaaggccta cgagagcgtg 120 ctgatgatca gcatcgacga gctggacaag atgaccggca ccgacagcaa ctgccccaac 180 aacgagccca acttcttcag gaagcacgtg tgcgacgaca ccaaggaggc cgccttcctg 240 aacagggccg ccaggaagct gaagcagttc ctgaagatga acatcagcga ggagttcaac 300 gtgcacctgc tgaccgtgag ccagggcacc cagaccctgg tgaactgcac cagcaaggag 360 gagaagaacg tgaaggagca gaagaagaac gacgcctgct tcctgaagag gctgctgagg 420 gagatcaaga cctgctggaa caagatcctg aagggcagca tctga 465 <210> 169 <211> 489 <212> DNA <213> Homo sapiens <400> 169 atgagaattt cgaaaccaca tttgagaagt atttccatcc agtgctactt gtgtttactt 60 ctaaacagtc attttctaac tgaagctggc attcatgtct tcattttggg ctgtttcagt 120 gcagggcttc ctaaaacaga agccaactgg gtgaatgtaa taagtgattt gaaaaaaatt 180 gaagatctta ttcaatctat gcatattgat gctactttat atacggaaag tgatgttcac 240 cccagttgca aagtaacagc aatgaagtgc tttctcttgg agttacaagt tatttcactt 300 gagtccggag atgcaagtat tcatgataca gtagaaaatc tgatcatcct agcaaacaac 360 agtttgtctt ctaatgggaa tgtaacagaa tctggatgca aagaatgtga ggaactggag 420 gaaaaaaata ttaaagaatt tttgcagagt tttgtacata ttgtccaaat gttcatcaac 480 acttcttga 489 <210> 170 <211> 462 <212> DNA <213> Homo sapiens <400> 170 atgtacagga tgcaactcct gtcttgcatt gcactaagtc ttgcacttgt cacaaacagt 60 gcacctactt caagttctac aaagaaaaca cagctacaac tggagcattt actgctggat 120 ttacagatga ttttgaatgg aattaataat tacaagaatc ccaaactcac caggatgctc 180 acatttaagt tttacatgcc caagaaggcc acagaactga aacatcttca gtgtctagaa 240 gaagaactca aacctctgga ggaagtgcta aatttagctc aaagcaaaaa ctttcactta 300 agacccaggg acttaatcag caatatcaac gtaatagttc tggaactaaa gggatctgaa 360 acaacattca tgtgtgaata tgctgatgag acagcaacca ttgtagaatt tctgaacaga 420 tggattacct tttgtcaaag catcatctca acactgactt ga 462 <210> 171 <211> 1733 <212> DNA <213> Artificial Sequence <220> <223> CAG promoter <400> 171 ctcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc actctcccca 420 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 480 cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc 540 ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt 600 ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc gcgcggcggg 660 cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc tcgcgccgcc 720 cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac ggcccttctc 780 ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg tggctgcgtg 840 aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg gggggtgcgt 900 gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc ggctgtgagc 960 gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg agcgcggccg 1020 ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc gtgcggggtg 1080 tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa ccccccctgc 1140 acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1200 gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1260 cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1320 gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1380 cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1440 ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1500 agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1560 cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1620 tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 1680 tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttg 1733 <210> 172 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> CMV Promoter <400> 172 tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60 cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120 gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180 atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240 aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300 catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360 catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420 atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480 ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540 acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatc 589 <210> 173 <211> 635 <212> DNA <213> Homo sapiens <400> 173 gtatagggct gtctgggagc cactccaggg ccacagaaat cttgtctctg actcagggta 60 ttttgttttc tgttttgtgt aaatgctctt ctgactaatg caaaccatgt gtccatagaa 120 ccagaagatt tttccagggg aaaaggtaag gaggtggtga gagtgtcctg ggtctgccct 180 tccagggctt gccctgggtt aagagccagg caggaagctc tcaagagcat tgctcaagag 240 tagagggggc ctgggaggcc cagggagggg atgggagggg aacacccagg ctgcccccaa 300 ccagatgccc tccaccctcc tcaacctccc tcccacggcc tggagaggtg ggaccaggta 360 tggaggcttg agagcccctg gttggaggaa gccacaagtc caggaacatg ggagtctggg 420 cagggggcaa aggaggcagg aacaggccat cagccaggac aggtggtaag gcaggcagga 480 gtgttcctgc tgggaaaagg tgggatcaag cacctggagg gctcttcaga gcaaagacaa 540 acactgaggt cgctgccact cctacagagc ccccacgccc cgcccagcta taaggggcca 600 tgcaccaagc agggtaccca ggctgcagag gtgcc 635 <210> 174 <211> 1559 <212> DNA <213> Homo sapiens <400> 174 catccatgcc catggcctca gatgccagcc ataagctgtt gggttccaaa cctcgactcc 60 aggctggact cacccctgtc tcccccacca gcctgacacc tccacctggg tatctaacga 120 gcatctcaaa ctcaacctgc ctgagacaga ggaatcacta tcccctcctc ctccaaaaat 180 atccttccat cacactcccc atcttgtgct ctgatttact aaacggccct gggccctctc 240 tttctcaggg tctctgcttg cccagctata taataaaaca agtttgggac ttcccaacca 300 ttcacccatg gaaaaacaga agcaactctt caaaggacag attcccagga tctgccctgg 360 gagattccaa atcagttgat ctggggtgag cccagtcctc tgtagttttt agaagctcct 420 cctatgtctc tcctggtcag cagaatcttg gcccctccct tccccccagc ctcttggttc 480 ttctgggctc tgatccagcc tcagcgtcac tgtcttccac gcccctcttt gattctcgtt 540 tatgtcaaaa gccttgtgag gatgaggctg tgattatccc cattttacag atgaggaaac 600 tgtggctcca ggatgacaca actggccaga ggtcacatca gaagcagagc tgggtcactt 660 gactccaccc aatatcccta aatgcaaaca tcccctacag accgaggctg gcaccttaga 720 gctggagtcc atgcccgctc tgaccaggag aagccaacct ggtcctccag agccaagagc 780 ttctgtccct ttcccatctc ctgaagcctc cctgtcacct ttaaagtcca ttcccacaaa 840 gacatcatgg gatcaccaca gaaaatcaag ctctggggct aggctgaccc cagctagatt 900 tttggctctt ttatacccca gctgggtgga caagcacctt aaacccgctg agcctcagct 960 tcccgggcta taaaatgggg gtgatgacac ctgcctgtag cattccaagg agggttaaat 1020 gtgatgctgc agccaagggt ccccacagcc aggctctttg caggtgctgg gttcagagtc 1080 ccagagctga ggccgggagt aggggttcaa gtggggtgcc ccaggcaggg tccagtgcca 1140 gccctctgtg gagacagcca tccggggccg aggcagccgc ccaccgcagg gcctgcctat 1200 ctgcagccag cccagccctc acaaaggaac aataacagga aaccatccca gggggaagtg 1260 ggccagggcc agctggaaaa cctgaagggg aggcagccag gcctccctcg ccagcggggt 1320 gtggctcccc tccaaagacg gtcggctgac aggctccaca gagctccact cacgctcagc 1380 cctggacgga caggcagtcc aacggaacag aaacatccct cagcccacag gcacggtgag 1440 tgggggctcc cacactcccc tccaccccaa acccgccacc ctgcgcccaa gatgggaggg 1500 tcctcagctt ccccatctgt agaatgggca tcgtcccact cccatgacag agaggctcc 1559 <210> 175 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> wild type native leader sequence from Spike protein from SARS-CoV-2 <400> 175 atgttcgtgt tcctggtgct gctgcccctg gtgagcagc 39 <210> 176 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> T2A Linker <400> 176 ggaagcggag agggcagggg aagtcttcta acatgcgggg acgtggagga aaatcccggc 60 ccc 63 <210> 177 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> E2A Linker <400> 177 ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60 ccaggtccc 69 <210> 178 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> P2A Linker <400> 178 ggaagcggag ccacgaactt ctctctgtta aagcaagcag gagatgttga agaaaacccc 60 gggcct 66 <210> 179 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Linker <400> 179 gccgcctac 9 <210> 180 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Linker <400> 180 ggccccggcc ccggc 15 <210> 181 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> 6-His Tag <400> 181 catcaccatc accatcac 18 <210> 182 <211> 1580 <212> DNA <213> Artificial Sequence <220> <223> Nsp1, Nsp2, and Nsp3 from SARS-CoV-2 <400> 182 gacgtgctag tacgtggctt cggggactct gtggaagagg ccctatcgga ggcacgtgaa 60 catcttaaaa gtggcacttg tggcatagta gagctggaaa aaggcgtatt gcctcagctt 120 gaacagccct atgtgttcat taaacgatct gacgcccagg gcactggtca tggccacaag 180 gtctgtgagc tagttgctga attggatggc gttcagttcg gtcgtagcgg tataacactg 240 ggagtactcg tgccacacgt tggcgagacc ccaattgcat accgcactgt tcttcttcgt 300 aagaatggta ataagggagc cggtggccat agctttggca tcgatctaaa gtcatatgac 360 ttaggtgacg agcttggcac tgatcccatt gaagattatg aacaaaactg gaacactaaa 420 catggcagtg gtgcccttcg tgaactcact cgtgagctca atggaggagt agttactcgc 480 tatgtcgaca acaatttctg tggcccagat ggctaccccc ttgaatgcat taaagacctt 540 ctcgctcgtg cgggcaagtc aatgtgcact ctttctgaac aacttgattt tatcgagtcg 600 aagagaggtg tctactgctg tcgtgaacat gagcatgaaa ttgcttggtt taccgaacgc 660 tctgaaaaga gctatgagca ccagacaccc ttcgagatca agagtgccaa gaaatttgac 720 actttcaaag gggaatgccc aaagtttgta tttcctctca attctagagt caaagtcatt 780 caaccacgtg ttgaaaagaa aaagactgaa ggtttcatgg ggcgtatacg ctctgtgtac 840 cctgttgcat cccctgggga ttgtaacgat atgcacttgt ctaccttgat gaaatgtaat 900 cattgtgatg aagtttcatg gcagacgtgc gactttctca aagccacttg tgaacaatgt 960 ggcactgaaa acttagtctg tgaaggaccc actacatgtg gatacctacc tactaatgct 1020 gtacttaaaa tgccttgtcc tgcttgtcaa gatccagaga ttggacctga gcatagtgtt 1080 gcagactatc acaaccactc aaacattgaa actcgactcc gcaagggagg taggactaaa 1140 tgttttggtg ggtgtgtgtt tgcctacgtt ggctgctata acaagcgtgc ctactgggtt 1200 cctcgtgcta gtgccgatat tggtgcaaac catactggca ttactggaga caatgtggag 1260 actttaaatg aagatctcct ggagatactg catcgtgaac gtgttaatgt taacattgtt 1320 ggcgattttc agttgaatga agaggttgct attattctag catctttctc tgcttctact 1380 agtgccttta ttgacactgt aaagggcctt gactacaaga ccttcaaagc cattgttgaa 1440 tcctgtggaa actacaaagt taccaaagga aaacctgtcc aaggagcttg gaacattggc 1500 cagcaaaaat ctattttgac accgctgtgt ggttttccat cacaggctgc cagtgtcatt 1560 agatcaatct tttctcgcac 1580 <210> 183 <211> 3550 <212> DNA <213> Artificial Sequence <220> <223> Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15, and Nsp16 from SARS-CoV-2 <400> 183 aaaattaagg cttgcatcga agaggtcact acaacactgg aagagactaa gtttcttacc 60 aataagttgc ttctttttgc tgatatcagc ggtaaacttt accaagattc tcagaatatg 120 cttagaggtg aggacgtgtc tttccttgag agagatgcgc cttacatggt aggtgatgtt 180 atcaatagtg gtgatattac ctgcgttgta ataccttcta agaaggctgg tggtactaca 240 gaaatgcttg caagagcatt gaagaaagtg ccarttgatg agtatataac cacataycct 300 ggwcaaggwt gtgctggtta tacacttgak gaagctarga ctgctcttaa raartgcaaa 360 tctgcaytkt aygtkttacc ttcagaatca cctaatgcta aggaagagat tctaggaacc 420 gtatcttgga atttgagaga aatgcttgct cacgctgaag agacaagaaa attaatgcct 480 atctgcatgg atgtcagagc cataatggcc accatccaac gcaagtacaa aggaattaaa 540 attcaagaag gcatcgttga ctatggtgtc cgattcttct tttatactag taaagagcct 600 gtagcttcta ttattacgaa gctgaactct ctaaatgagc cacttgtcac aatgccaatt 660 ggttatgtga cacatggttt taatcttgaa gaggctgcgc gctgtatgcg ttctcttaaa 720 gctcctgccg tagtgtcagt atcatcacca gatgcygtta ctacatataa tggatacctc 780 acttcgtcat caaagacatc tgaggagcac tttgtggaaa cagtttcttt ggctggctct 840 tacagagatt ggtcctattc aggacagcgt acagagttag gtgttgaatt tcttaagcgt 900 ggtgacaaaa ttgtgtacca cactttggag agccccgtca agttccatct tgacggtgag 960 gttcttccac ttgacaaatt aaagagtctc ttatccctac gggaggttaa gactataaaa 1020 gtgttcacaa ctgtggacaa tactaatctc cacacacatc ttgtggatat gtctatgaca 1080 tatggacagc agtttggtcc aacatatttg gatggtgctg atgttacaaa aattaaacct 1140 catgtaaatc atgagggtaa gactttcttt gtattaccta gtgatgacac actacgtagt 1200 gaagcttttg agtactacca cgctcttgat gagagtttcc ttggtagata catgtctgct 1260 ttaaaccaca caaagaaatg gaaattccct caagttggtg gtttgacttc cattaagtgg 1320 gctgataaca attgttattt gtctagtgtt ttattagcac ttcaacaaat tgaagttaaa 1380 tttaatgccc cagcactaca agaagcttac tatagagctc gtgctggtga tgctgctaat 1440 ttttgtgcac ttatactcgc ttacagtaat aaaactgttg gcgagctggg tgatgtcaga 1500 gaaactatgg cccatctttt acagcatgct aatttggaat ctgcaaagcg agttcttaat 1560 gtggtgtgta aacattgcgg ccagaaaact actaccttaa cgggtgtaga ggctgtgatg 1620 tacatgggta ctctgtctta tgataatctt aagacaggtg tttctgttcc atgtgtgtgt 1680 ggtcgtgacg ctacacaata tttagtacaa caagagtctt cttttgttat gatgtccgca 1740 ccacctgctg aatataaatt acagcaaggt acattcttat gtgcaaatga atacactggt 1800 aattatcagt gtggtcatta cactcatata actgctaagg agaccctcta tcgtattgat 1860 ggagctcacc ttacaaagat gtcagagtat aaagggccag tgactgatgt gttctacaag 1920 gaaacatctt acactacaac catcaagcct gtgtcatata aactcgatgg agttacttac 1980 acagagattg aaccaaaatt ggatgggtat tataaaaagg ataatgctta ctatacggag 2040 cagcctatag accttgtacc aactcaacca ctaccaaatg cgagttttga taatttcaaa 2100 ctcacatgtt ctaatataaa attcgctgat gatttaaatc aaatgacagg cttcacaaag 2160 ccagcttcac gagagctatc tgtcacattc tttccagact tgaatggcga tgtagtggct 2220 attgactata gacactactc agcgagtttc aagaaaggtg ctagattact gcataagcca 2280 attgtttggc atatcaatca ggctacaacc aagacaacgt tcagaccaaa cacttggtgt 2340 ttacgttgtc tttggagtac aaaaccagta gatacttcaa attcatttga agttctggca 2400 gtagaagaca cacaaggaat ggacaatctt gcttgtgaaa gtcaaagacc cacctctgaa 2460 gaagtagtgg aaaatcctac catacagaag gaagtcatag agtgtgacgt gaaaactacc 2520 gaagttgtag gcaatgtcat acttaaacca tcagatgaag gtgttaaagt aacacaagag 2580 ttagggcatg aggatcttat ggctgcctat gtggaaaata caagcattac cattaagaaa 2640 cctaatgagc tttcattagc cttaggttta aaaacaattg ccactcatgg tattgctgca 2700 attaacagtg ttccgtggag taaaattttg gcttatgtca gaccattcct aggacgaaca 2760 gcaatcacaa catcaaactg tgctaagaga ttagtacagc gtgtatttaa caactacatg 2820 ccctatgtgc ttacattatt gttccaattg tgtactttta ccaaaagtac aaattctaga 2880 attagagctt cactacctac gactattgct aaaaatagtg ttaagggtgt tgctaaatta 2940 tgtttggatg ctggcatcaa ttatgtaaag tcacccaaat tttctaaatt gttcactatt 3000 gcaatgtggc tattattgtt aagcatttgc ttaggttcac taatctatgt aactgcagct 3060 ttaggtgtat tattgtccaa ctttggagct ccttcctatt gtagtggcgt tagagaatcg 3120 tatctcaatt cctctaatgt tactactatg gacttctgtg aaggttcttt tccttgcagc 3180 gtttgtttaa gtggattaga ctcgcttgat tcctatccag ctcttgaaac catacaggta 3240 acgatttcat cgtataagct agacttgaca attttaggtc tggctgctga gtggtttttg 3300 gcatatatgt tgttcacaaa attcttttat ttattaggtc tttcagctat aatgcaggtg 3360 ttctttggct attttgctag tcatttcatc agcaattctt ggcttatgtg gtttatcatt 3420 agtatcgtac aaatggcacc cgtttccgca atggttagga tgtacatttt cgttgcttct 3480 ttctactaca tatggaagag ctatgttcat attatggatg gttgtacttc atctacttgc 3540 atgatgtgct 3550 <210> 184 <211> 2099 <212> DNA <213> Artificial Sequence <220> <223> spike glycoprotein from SARS-CoV-2 <400> 184 taccaagcta ctagagtagt ggtactttca tttgagcttc taaatgcacc tgccacagtg 60 tgtggaccaa aattgtccac atcactaatt aagaaccagt gtgtcaattt taatttcaat 120 ggactcaagg gtactggtgt gttgactgac tcgtccaaaa agtttcagtc ttttcaacaa 180 tttggaaggg atgcatctga ttttactgac tcagtacgcg accctcagac acttcaaata 240 cttgacattt caccatgttc atttggtggt gtgagtgtaa taacaccagg aacaaatgct 300 tcatctgaag tagccgttct ataccaagat gtaaactgca ctgatgttcc cacggccata 360 cgtgctgacc aactcacacc tgcttggcgt gtttactctg ctggagtaaa tgtgtttcaa 420 actcaggctg gctgtttaat aggagcggaa catgtcaatg cttcatatga gtgtgacatt 480 cccattggtg caggcatttg tgctagttac catacagctt cccttttacg taatacaggc 540 cagaaatcaa ttgtggccta tactatgtca cttggtgctg aaaactcaat tgcttatgct 600 aataactcaa ttgccatacc tacaaatttt tcaatcagtg tcacaactga agtgatgcct 660 gtttcaatgg ctaagacatc agtagattgt acaatgtaca tctgtggtga ctctcaggag 720 tgcagcaact tactacttca gtatggtagc ttttgcacac aattaaatcg tgccctttca 780 ggcattgctg ttgaacagga caaaaacact caagaggttt ttgcccaagt taaacaaatg 840 tataagacac cagccataaa agattttggt ggctttaatt tctcacaaat attgcctgac 900 ccttctaagc caacaaaaag atcatttatt gaggatttac tcttcaacaa agtgactctc 960 gctgatgctg gctttatgaa gcaatacggc gaatgcctag gcgatattag tgctagagat 1020 ctcatttgtg cgcagaagtt caatggactc actgtccttc cacctctact cacggatgaa 1080 atgattgctg cttacaccgc cgctcttgtc agcggtactg ctactgctgg ttggacattt 1140 ggtgcaggtg ctgctctaca aatacctttt gctatgcaaa tggcttatag gttcaatggc 1200 attggagtta ctcaaaatgt tctctatgag aaccagaagc agatcgctaa ccaatttaac 1260 aaggcgatca gtcaaattca agaatcactt actactactt caactgcatt gggcaagctg 1320 caagacgtcg tcaaccagaa tgctcaagca ttgaacacac ttgttaaaca actaagttct 1380 aactttggtg caatttcaag tgttttaaat gacattctgt ctcgactyga caaagttgag 1440 gctgaagtgc aaattgatag gttgattact ggcagattac aaagccttca gacctatgta 1500 acacaacaac taatcagagc tgctgaaatc agagcttctg ccaatcttgc tgccactaag 1560 atgtccgagt gtgttcttgg acaatcaaaa agagttgact tttgtggaaa aggctatcat 1620 cttatgtctt tccctcaagc agccccacat ggtgtcgtct tcttacatgt cacatacgtg 1680 ccatcgcaag aaagaaactt caccactgcc ccagcaatct gccatcaagg caaggcacac 1740 ttccctcgtg aaggtgtttt tgtatctaat ggcacttctt ggtttatcac acagaggaac 1800 ttcttttcac cacaaataat tacaacagac aatacatttg tctctggaaa ttgtgatgtc 1860 gttattggca tcatcaacaa tactgtttat gatcctctgc aacctgagct tgactcattt 1920 aaagaagagc tggacaagta cttcaaaaac cacacgtcac ctgatgtrga tcttggcgac 1980 atctcaggca ttaatgcttc agtcgtcaat attcaaaaag aaattgaccg cctcaatgag 2040 gttgccaaaa atctaaatga atcgctcatc gatcttcaag aacttggaaa atatgagca 2099 <210> 185 <211> 1229 <212> DNA <213> Artificial Sequence <220> <223> ORF3a, Envelope (E), Membrane (M), ORF6, and ORF7a from SARS-CoV-2 <400> 185 cagtaacact tgcttgcttt gtgcttgctg ctgtttacag aattaattgg gtgactggcg 60 gaattgcrat tgcaatggct tgtattgtag gcttgatgtg gcttagctac ttcrttgctt 120 ctttcaggct gtttgcgcgc acccgctcwa tgtggtcatt caacccagaa acyaacattc 180 ttctcaatgt gcctcttcgr ggracaatyt tgaccagacc gctcatggar agtgaacttg 240 tcattggtgc tgtgatcatt cgtggtcacc tgcgaatggc tggacactcy ctwgggcgct 300 gtgacattaa ggacctgcca aaagagatca ctgtggctac atcacgaacg ctttcttatt 360 acaaattagg agcttcgcag cgtgtaggca ctgactcagg ttttgctgca tacaaccgct 420 accgtattgg aaactacaaa ttaaatacag accacgccgg tagcaacgac aatattgctt 480 tgctagtaca gtaagtgaca acagatgttt catctagttg acttccaggt tacaatagcg 540 gagatattga ttatcattat gaggactttc aggattgcca tctggaatct tgatgtaata 600 ataagttcaa tagtgagaca attatttaag cctctaacta agaagaatta ttctgagtta 660 gatgatgaag aacytatgga gattgattat ccataaaacg aacatgaaaa ttatcctctt 720 cctgactttg atttcacttg cattttgtga gttatatcat tatcaggagt gtgttagagg 780 tacaactgta ctattaaaag aaccttgccc atcrggaacg tacgagggca attcaccatt 840 tcaccctctt gctgacaaca aatttgcact aacttgcatt agcacacatt ttgcttttgc 900 ttgtgctgac ggtactcgac atacctatca gcttcgtgca agatcagttt ctccaaaact 960 cttcatcagg caagaggaat ttcatcaaga gctctattca ccactttttc tcattgttgc 1020 cgctctagta tttataatac tttgcttcac cattaagaga aagaccgaat gagtgagctc 1080 actttaattg acttctattt gtgcttttta gcctttctgc tattccttgt tttaataatg 1140 ctcatcatat tttggttctc cttggagatt caagattctg aagagccatg tccaaaagtc 1200 taaacgaaca tgaaacttct cattgtttt 1229 <210> 186 <211> 292 <212> PRT <213> Artificial Sequence <220> <223> SARS-CoV-like Spike-S1-NTD <400> 186 Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr 1 5 10 15 Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg 20 25 30 Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser 35 40 45 Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr 50 55 60 Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe 65 70 75 80 Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr 85 90 95 Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr 100 105 110 Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe 115 120 125 Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu 130 135 140 Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser 145 150 155 160 Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn 165 170 175 Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr 180 185 190 Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe 195 200 205 Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr 210 215 220 Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly 225 230 235 240 Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly 245 250 255 Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr 260 265 270 Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys 275 280 285 Cys Thr Leu Lys 290 <210> 187 <211> 223 <212> PRT <213> Artificial Sequence <220> <223> SARS-CoV-2 Spike-S1-RBD <400> 187 Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn 1 5 10 15 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val 20 25 30 Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser 35 40 45 Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val 50 55 60 Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp 65 70 75 80 Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln 85 90 95 Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr 100 105 110 Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly 115 120 125 Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys 130 135 140 Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr 145 150 155 160 Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser 165 170 175 Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val 180 185 190 Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly 195 200 205 Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 210 215 220 <210> 188 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Wild Type Signal Sequence for the Spike protein from SARS-CoV-2 <400> 188 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser 1 5 10 <210> 189 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 682-QQAQ-685 mutation <400> 189 cagcaggccc ag 12 <210> 190 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> K986P and V987P Mutations <400> 190 cccccc 6 <210> 191 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> spike glycoprotein with 682-QQAQ-685 mutation in the S1-S2 from SARS-CoV-2 <400> 191 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr 580 585 590 Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr 595 600 605 Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 610 615 620 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 625 630 635 640 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 645 650 655 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 660 665 670 Thr Gly Ser Asn Val Phe Gln Ser Pro Gln Gln Ala Gln Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 192 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> spike glycoprotein with two proline substitutions (K986P, V987P) <400> 192 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 193 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> spike glycoprotein with four proline substitutions (F817P, A892P, A899P, A942P) <400> 193 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr 580 585 590 Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr 595 600 605 Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 610 615 620 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 625 630 635 640 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 645 650 655 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 660 665 670 Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 194 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> spike glycoprotein with six proline substitutions (F817P, A892P, A899P, A942P, K986P, V987P) <400> 194 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr 580 585 590 Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr 595 600 605 Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 610 615 620 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 625 630 635 640 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 645 650 655 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 660 665 670 Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 195 <211> 1273 <212> PRT <213> Artificial Sequence <220> <223> spike glycoprotein with six proline substitutions (F817P, A892P, A899P, A942P, K986P, V987P) and a 682-QQAQ-685 mutation <400> 195 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr 580 585 590 Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr 595 600 605 Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 610 615 620 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 625 630 635 640 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 645 650 655 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 660 665 670 Thr Gly Ser Asn Val Phe Gln Ser Pro Gln Gln Ala Gln Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 196 <211> 666 <212> PRT <213> Artificial Sequence <220> <223> CoV Spike S1-S2_S2 <400> 196 Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys 1 5 10 15 Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp 20 25 30 Ala Val Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn 35 40 45 Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr 50 55 60 Gln Thr Gln Thr Asn Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile 65 70 75 80 Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn 85 90 95 Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu 100 105 110 Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val 115 120 125 Tyr Ser Thr Gly Ser Asn Val Phe Gln Ser Pro Arg Arg Ala Arg Ser 130 135 140 Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu 145 150 155 160 Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe 165 170 175 Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr 180 185 190 Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser 195 200 205 Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala 210 215 220 Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe 225 230 235 240 Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 245 250 255 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 260 265 270 Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp 275 280 285 Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala 290 295 300 Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 305 310 315 320 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu 325 330 335 Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu 340 345 350 Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly 355 360 365 Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln 370 375 380 Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala 385 390 395 400 Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala 405 410 415 Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser 420 425 430 Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu 435 440 445 Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr 450 455 460 Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala 465 470 475 480 Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 485 490 495 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln 500 505 510 Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala 515 520 525 Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 530 535 540 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp 545 550 555 560 Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp 565 570 575 Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn 580 585 590 Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu 595 600 605 Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu 610 615 620 Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu 625 630 635 640 Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile 645 650 655 Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln 660 665 <210> 197 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Epitope Linker <400> 197 Gly Pro Gly Pro Gly 1 5

Claims

1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

2개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 2개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질; 및 하기 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함하는 스파이크 단백질의 적어도 일부; 및 다음 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질; 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 스파이크 단백질의 적어도 일부; 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

제1항 내지 제6항 중 어느 한 항에 있어서, 비-스파이크 단백질은 ORF1ab 단백질, ORF3a 단백질, 외피 단백질, 멤브레인 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 및 ORF10 단백질인, 조성물.

제1항 내지 제7항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.

제1항 내지 제8항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.

제1항 내지 제9항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래되는, 조성물.

제10항에 있어서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택되는, 조성물.

제10항에 있어서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스로부터 선택되는, 조성물.

제1항 내지 제12항 중 어느 한 항에 있어서, 보존된 에피토프는 염려 변이체 또는 관심 변이체로부터 선택되는, 조성물.

제1항 내지 제13항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 전체 단백질 서열로부터 유래된 것인, 조성물.

제1항 내지 제14항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2에 의해 발현되는 부분 단백질 서열로부터 유래된 것인, 조성물.

제1항 내지 제15항 중 어느 한 항에 있어서, 1개 이상의 큰 보존 서열은 전장 스파이크 당단백질로부터 유래된 것인, 조성물.

제1항 내지 제15항 중 어느 한 항에 있어서, 1개 이상의 큰 보존 서열은 부분 스파이크 당단백질로부터 유래된 것인, 조성물.

제16항 또는 제17항 중 어느 한 항에 있어서, 스파이크 단백질은 아미노산 위치 986 및 987에서 2개의 연속적인 프롤린 치환을 갖는 것인, 조성물.

제16항 내지 제18항 중 어느 한 항에 있어서, 스파이크 당단백질은 Tyr-83 및 Tyr-489, Gln-24 및 Asn-487을 포함하는 아미노산 위치에서 단일 아미노산 치환을 갖는 것인, 조성물.

제1항 내지 제19항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 막 단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함하는, 조성물.

제1항 내지 제19항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 스파이크 당단백질(S) 또는 이의 일부, 핵단백질 또는 이의 일부, 및 ORF1a/b 또는 이의 일부를 포함하는, 조성물.

제16항 내지 제19항 중 어느 한 항에 있어서, 스파이크 당단백질의 일부는 RBD인, 조성물.

제1항 내지 제22항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택되는, 조성물.

제23항에 있어서, ORF1ab 단백질은 비-구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함하는, 조성물.

제1항 내지 제24항 중 어느 한 항에 있어서, 큰 서열 중 1개 이상은 다수의 인간 클래스 1 및 클래스 2 HLA 일배체형으로 제한된 T-세포 에피토프를 포함하고 클래스 1에 대한 HLA-0201 또는 클래스 2에 대한 HLA-DR로 제한되는, 조성물.

제1항 내지 제25항 중 어느 한 항에 있어서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된 것인, 조성물.

제1항 내지 제26항 중 어느 한 항에 있어서, 큰 서열 중 1개 이상은 유래된 서열번호: 182-185, 서열번호: 148-159, 서열번호: 186-187, 및 서열번호: 191-196으로부터 선택된 단백질로부터 유래된 것인, 조성물.

제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.

제1항 내지 제28항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab_1675-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab₃₁₈₃ _-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab₆₇₄₉ _-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10₅ _-13으로부터 선택되는, 조성물.

제1항 내지 제29항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택되는, 조성물.

제1항 내지 제29항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택되는, 조성물.

제1항 내지 제31항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.

제1항 내지 제32항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a_1-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅으로부터 선택되는, 조성물.

제1항 내지 제33항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택되는, 조성물.

제1항 내지 제33항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 74-105으로부터 선택되는, 조성물.

제1항 내지 제35항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택되는, 조성물.

제1항 내지 제36항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13-37로부터 선택되는, 조성물.

제1항 내지 제37항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택되는, 조성물.

제1항 내지 제37항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택되는, 조성물.

제1항 내지 제39항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 큰 서열의 형태인, 조성물.

제40항에 있어서, 큰 서열은 전장 스파이크 당단백질인, 조성물.

제40항에 있어서, 큰 서열은 부분 스파이크 당단백질인, 조성물.

제1항 내지 제42항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.

제43항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.

제1항 내지 제44항 중 어느 한 항에 있어서, T 세포 유인 케모카인을 추가로 포함하는, 조성물.

제45항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 조성물.

제1항 내지 제46항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물을 추가로 포함하는, 조성물.

제47항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2 또는 IL-15인, 조성물.

제1항 내지 제49항 중 어느 한 항에 있어서, 분자 보조제를 추가로 포함하는, 조성물.

제50항에 있어서, 분자 보조제는 CpG인, 조성물.

제54항에 있어서, 분자 보조제는 CpG 중합체인, 조성물.

제50항에 있어서, 분자 보조제는 플라젤린인, 조성물.

제1항 내지 제52항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.

제53항에 있어서, 태그는 His 태그인, 조성물.

제1항 내지 제54항 중 어느 한 항에 있어서, 약제학적 담체를 추가로 포함하는, 조성물.

제1항 내지 제55항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 질환을 예방하기 위해 사용되는, 조성물.

제1항 내지 제56항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용되는, 조성물.

제1항 내지 제57항 중 어느 한 항에 있어서, 대상체에서 면역 반응을 유도하는, 조성물.

제1항 내지 제58항 중 어느 한 항에 있어서, 다중 에피토프 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는, 조성물.

제1항 내지 제59항 중 어느 한 항에 있어서, 스파이크 단백질의 막횡단 앵커는 온전한 S1-S2 절단 부위를 갖는, 조성물.

제1항 내지 제60항 중 어느 한 항에 있어서, 스파이크 단백질은 안정화된 형태인, 조성물.

제1항 내지 제61항 중 어느 한 항에 있어서, 스파이크 단백질은 S2 서브유닛의 중심 나선 상단의 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화되는, 조성물.

제1항 내지 제62항 중 어느 한 항에 있어서, 전장 스파이크 단백질을 포함하는, 재조합 백신 조성물.

제1항 내지 제62항 중 어느 한 항에 있어서, 전장 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는, 재조합 백신 조성물.

제1항 내지 제64항 중 어느 한 항에 있어서, 스파이크 단백질은 Tyr-489 및 Asn-487을 포함하는, 조성물.

제1항 내지 제65항 중 어느 한 항에 있어서, 스파이크 단백질은 Gln-493을 포함하는, 조성물.

제1항 내지 제66항 중 어느 한 항에 있어서, 스파이크 단백질은 Tyr-505를 포함하는, 조성물.

제1항 내지 제67항 중 어느 한 항에 있어서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열을 포함하는, 조성물.

제68항에 있어서, 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD) 서열은 T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가에 의해 변형되는, 조성물.

제69항에 있어서, T4 피브리틴 유래 폴돈 삼량체화 도메인의 부가는 다가 디스플레이에 의해 면역원성을 증가시키는, 조성물.

제1항 내지 제70항 중 어느 한 항에 있어서, 보존된 에피토프는 우려 변이체 및 관심 변이체로부터 선택되는, 조성물.

제1항 내지 제71항 중 어느 한 항에 있어서, S1-S2 절단 부위에 돌연변이 682-RRAR-685 → 682-QQAQ-685를 포함하는, 조성물.

제1항 내지 제72항 중 어느 한 항에 있어서, 적어도 1개의 프롤린 치환을 포함하는, 조성물.

제1항 내지 제72항 중 어느 한 항에 있어서, 적어도 2개의 프롤린 치환을 포함하는, 조성물.

제73항 또는 제74항에 있어서, 프롤린 치환은 위치 K986 및 V987에 있는 것인, 조성물.

제1항 내지 제75항 중 어느 한 항에 있어서, K986P 및 V987P 돌연변이를 포함하는, 조성물.

제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 195를 포함하는, 조성물.

제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 191 또는 서열번호: 192 중 하나를 포함하는, 조성물.

제1항 내지 제83항 중 어느 한 항에 있어서, 스파이크 단백질 또는 이의 일부는 서열번호: 186-187 및 서열번호: 191-196 중 하나를 포함하는, 조성물.

1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

2개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 2개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 전체 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하기 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
b) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템으로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)를 포함하는 항원 전달 시스템; 및 다음 중 하나 또는 둘 다를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질을 인코딩하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

범-코로나바이러스 재조합 백신 조성물로서, 스파이크 단백질의 적어도 일부를 인코딩하는 항원 전달 시스템로서, 스파이크 단백질의 일부는 삼량체화된 SARS-CoV-2 수용체 결합 도메인 (RBD)을 포함하는 항원 전달 시스템; 및 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프를 포함하고; 적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

제80항 내지 제85항 중 어느 한 항에 있어서, 2개 이상의 큰 서열을 포함하는, 조성물.

제80항 내지 제86항 중 어느 한 항에 있어서, 전달 시스템은 아데노바이러스 시스템인, 조성물.

제87항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 조성물.

제80항 내지 제88항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 일반 프로모터에 작동적으로 연결된 것인, 조성물.

제89항에 있어서, 일반 프로모터는 CMV 또는 CAG 프로모터인, 조성물.

제80항 내지 제88항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.

제91항에 있어서, 폐 특이적 프로모터는 SpB 또는 CD144인, 조성물.

제80항 내지 제92항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩하는, 조성물.

제93항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 조성물.

제93항 또는 제94항에 있어서, T 세포 유인 케모카인은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.

제93항 또는 제94항에 있어서, T 세포 유인 케모카인은 일반 프로모터에 작동적으로 연결된 것인, 조성물.

제80항 내지 제96항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩하는, 조성물.

제97항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2 또는 IL-15인, 조성물.

제97항 또는 제98항에 있어서, T 세포 증식을 촉진하는 조성물은 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.

제97항 또는 제98항에 있어서, T 세포 증식을 촉진하는 조성물은 일반 프로모터에 작동적으로 연결된 것인, 조성물.

제93항 내지 제100항 중 어느 한 항에 있어서, T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물은 동일한 프로모터에 의해 구동되는, 조성물.

제80항 내지 제101항 중 어느 한 항에 있어서, 백신은 T 세포 유인 케모카인 및 T 세포 증식을 촉진하는 조성물을 포함하는 펩티드를 추가로 인코딩하는, 조성물.

제102항에 있어서, 펩티드는 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.

제102항에 있어서, 펩티드는 일반 프로모터에 작동적으로 연결된 것인, 조성물.

제80항 내지 제104항 중 어느 한 항에 있어서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩하는, 조성물.

제105항에 있어서, 분자 보조제는 CpG인, 조성물.

제106항에 있어서, 분자 보조제는 CpG 중합체인, 조성물.

제105항에 있어서, 분자 보조제는 플라젤린인, 조성물.

제105항 내지 제108항 중 어느 한 항에 있어서, 분자 보조제는 프로모터에 작동적으로 연결된 것인, 조성물.

제109항에 있어서, 프로모터는 폐 특이적 프로모터 또는 일반 프로모터인, 조성물.

제80항 내지 제110항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.

제80항 내지 제111항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.

제80항 내지 제112항 중 어느 한 항에 있어서, 1개 이상의 큰 서열은 (a) 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체; (b) 이전 인간 발병을 일으킨 하나 이상의 코로나바이러스; (c) 박쥐, 천산갑, 사향고양이, 밍크, 낙타, 및 코로나바이러스에 수용적인 다른 동물로 이루어진 군으로부터 선택된 동물로부터 단리된 하나 이상의 코로나바이러스; 또는 (d) 보통 감기를 유발하는 하나 이상의 코로나바이러스 중 하나 이상으로부터 유래되는, 조성물.

제113항에 있어서, 현재 순환 중인 하나 이상의 SARS-CoV-2 인간 균주 또는 변이체는 균주 B.1.177; 균주 B.1.160, 균주 B.1.1.7; 균주 B.1.351; 균주 P.1; 균주 B.1.427/B.1.429; 균주 B.1.258; 균주 B.1.221; 균주 B.1.367; 균주 B.1.1.277; 균주 B.1.1.302; 균주 B.1.525; 균주 B.1.526, 균주 S:677H, 및 균주 S:677P로부터 선택되는, 조성물.

제113항에 있어서, 보통 감기를 유발하는 하나 이상의 코로나바이러스는 229E 알파 코로나바이러스, NL63 알파 코로나바이러스, OC43 베타 코로나바이러스 및 HKU1 베타 코로나바이러스로부터 선택되는, 조성물.

제80항 내지 제115항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.

제116항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.

제80항 내지 제117항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.

제118항에 있어서, 태그는 His 태그인, 조성물.

제80항 내지 제119항 중 어느 한 항에 있어서, 큰 서열은 구조적 단백질, 비-구조적 단백질, 또는 이들의 조합으로부터 유래된 것인, 조성물.

제80항 내지 제120항 중 어느 한 항에 있어서, 표적 에피토프는 ORF1ab 단백질, 스파이크 당단백질, ORF3a 단백질, 외피 단백질, 막 당단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 뉴클레오캡시드 단백질 ORF10, 및 단백질로 이루어진 군으로부터 선택된 SARS-CoV-2 단백질로부터 유래되는, 조성물.

제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 RBD인, 조성물.

제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 NTD인, 조성물.

제121항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 RBD 및 NTD 영역을 모두 포함하는, 조성물.

제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 항체를 중화 및 차단함으로써 인식되는, 조성물.

제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 항체의 중화 및 차단을 유도하는, 조성물.

제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 바이러스를 인식하고 중화시키는 항체의 중화 및 차단을 유도하는, 조성물.

제121항 내지 제124항 중 어느 한 항에 있어서, 스파이크 당단백질로부터 유래된 표적 에피토프는 스파이크 단백질을 인식하는 항체의 중화 및 차단을 유도하는, 조성물.

제121항에 있어서, ORF1ab 단백질은 비-구조적 단백질 (Nsp) 1, Nsp2, Nsp3, Nsp4, Nsp5, Nsp6, Nsp7, Nsp8, Nsp9, Nsp10, Nsp11, Nsp12, Nsp13, Nsp14, Nsp15 및 Nsp16을 포함하는, 조성물.

제80항 내지 제129항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, ORF1ab 단백질, ORF7a 단백질, ORF8a 단백질, ORF10 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.

제80항 내지 제130항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab_1675-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab₃₁₈₃ _-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab₆₇₄₉ _-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10₅ _-13으로부터 선택되는, 조성물.

제80항 내지 제131항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 2-29로부터 선택되는, 조성물.

제80항 내지 제131항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 30-57로부터 선택되는, 조성물.

제80항 내지 제133항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 스파이크 당단백질, 외피 단백질, 막 단백질, 뉴클레오캡시드 단백질, ORF1a 단백질, ORF1ab 단백질, ORF6 단백질, ORF7a 단백질, ORF7b 단백질, ORF8 단백질, 또는 이들의 조합으로부터 선택되는, 조성물.

제80항 내지 제134항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab_6088-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a_3-17, ORF7a₁ _-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅으로부터 선택되는, 조성물.

제80항 내지 제135항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-73으로부터 선택되는, 조성물.

제80항 내지 제135항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 74-105로부터 선택되는, 조성물.

제80항 내지 제136항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 스파이크 당단백질로부터 선택되는, 조성물.

제80항 내지 제137항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B 세포 표적 에피토프는 S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13-37로부터 선택되는, 조성물.

제80항 내지 제138항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 106-116으로부터 선택되는, 조성물.

제80항 내지 제138항 중 어느 한 항에 있어서, 하나 이상의 코로나바이러스 B 세포 표적 에피토프는 서열번호: 117-138로부터 선택되는, 조성물.

제80항 내지 제141항 중 어느 한 항에 있어서, 각각의 큰 서열은 링커에 의해 분리되는, 조성물.

제80항 내지 제141항 중 어느 한 항에 있어서, 큰 서열 중 2개 이상은 링커에 의해 분리되는, 조성물.

제142항 내지 제143항 중 어느 한 항에 있어서, 링커는 그 길이가 2 내지 10개의 아미노산인, 조성물.

제142항 내지 제144항 중 어느 한 항에 있어서, 링커는 T2A를 포함하는, 조성물.

제142항 내지 제144항 중 어느 한 항에 있어서, 링커는 T2A, E2A, 및 P2A로부터 선택되는, 조성물.

제80항 내지 제146항 중 어느 한 항에 있어서, 상이한 링커는 각각의 열린 해독틀 사이에 배치되는, 조성물.

제80항 내지 제147항 중 어느 한 항에 있어서, 재조합 백신 조성물은 태그를 포함하는, 조성물.

제148항에 있어서, 태그는 His 태그인, 조성물.

제80항 내지 제149항 중 어느 한 항에 있어서, 약제학적 담체를 추가로 포함하는, 조성물.

제80항 내지 제150항 중 어느 한 항에 있어서, 조성물은 대상체에서 코로나바이러스 질환을 예방하기 위해 사용되는, 조성물.

제80항 내지 제151항 중 어느 한 항에 있어서, 대상체에서 코로나바이러스 감염을 예방적으로 방지하기 위해 사용되는, 조성물.

제80항 내지 제152항 중 어느 한 항에 있어서, 조성물은 대상체에서 면역 반응을 유도하는, 조성물.

제80항 내지 제153항 중 어느 한 항에 있어서, 다중 에피토프 범-코로나바이러스 재조합 백신 조성물에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는, 조성물.

제80항 내지 제154항 중 어느 한 항에 있어서, 백신 작제물은 인간용인, 조성물.

제155항에 있어서, 재조합 백신 조성물은 인간 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함하는, 조성물.

제1항 내지 제154항 중 어느 한 항에 있어서, 백신 작제물은 동물용인, 조성물.

제60항에 있어서, 재조합 백신 조성물은 동물 CXCL-11 및 IL-7 또는 IL-2 또는 IL-15를 포함하는, 조성물.

제157항 또는 제158항에 있어서, 동물은 고양이 및 개인, 조성물.

제1항 내지 제159항 중 어느 한 항에 있어서, 백신으로서 사용하기 위한 것인, 조성물.

제1항 내지 제160항 중 어느 한 항에 있어서, 조성물은 코로나바이러스 감염 및 질환의 예방 및 치료를 위한 면역요법으로서 사용하기 위한 것인, 조성물.

제1항 내지 제161항 중 어느 한 항에 따른 rVSV-panCoV 재조합 백신 조성물.

제1항 내지 제161항 중 어느 한 항에 따른 rAdV-panCoV 재조합 백신 조성물.

서열번호: 139-147 중 어느 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물.

대상체에서 코로나바이러스 질환을 예방하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물의 치료적 유효량을 대상체에게 투여하는 것을 포함하며, 조성물은 대상체에서 면역 반응을 유도하는, 방법.

대상체에서 코로나바이러스 질환을 예방적으로 방지하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물의 예방적 유효량을 대상체에게 투여하는 것을 포함하는, 방법.

대상체에서 면역 반응을 유도하는 방법으로서, 대상체에게 제1항 내지 제164항 중 어느 한 항에 따른 조성물을 투여하는 것을 포함하는, 방법.

제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 바이러스 복제를 예방하는, 방법.

제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 사이토카인 폭풍을 예방하는, 방법.

제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 다른 구획에서 염증 또는 염증 반응을 예방하는, 방법.

제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 바이러스는 복제되는 폐, 뇌 및 기타 구획에서 T 세포의 귀소 및 체류를 개선하는, 방법

대상체에서 코로나바이러스 질환을 예방하는 방법으로서, 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하며, 조성물은 기억 B 및 T 세포를 유도하는, 방법.

제172항에 있어서, 조성물은 상주 기억 T 세포(Trm)를 유도하는, 방법.

범-코로나바이러스 백신에 의해 유도된 면역 반응을 연장하고 폐로의 T-세포 이동을 증가시키는 방법으로서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 동시 발현시키는 것을 포함하는, 방법.

범-코로나바이러스 백신에 의해 유도된 폐로의 기억 T 세포의 체류를 연장하고 바이러스 특이적 조직 상주 기억 T-세포(T_RM 세포)를 증가시키는 방법으로서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 백신을 동시 발현시키는 것을 포함하는, 방법.

제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 대상체에게 투여하는 것을 포함하는 방법으로서, 조성물은 코로나바이러스의 돌연변이 및 변이체의 발달을 예방하는, 방법.

제165항 내지 제176항 중 어느 한 항에 있어서, 백신은 정맥내 경로(i.v.), 비강내 경로(i.n.), 또는 설하 경로(s.l.)를 통해 투여되는, 방법.

제165항 내지 제177항 중 어느 한 항에 있어서, 재조합 백신 조성물은 코로나바이러스 질환 또는 감염에 대해 효율적이고 강력한 보호를 유도하는, 방법.

제165항 내지 제178항 중 어느 한 항에 있어서, 재조합 백신 조성물은 항체(Abs), CD4+ T 헬퍼(Th1) 세포, 및 CD8+ 세포독성 T-세포(CTL)의 생산을 유도하는, 방법.

제165항 내지 제179항 중 어느 한 항에 있어서, T-세포 유인 케모카인, T 세포 증식을 촉진하는 조성물, 및 범-코로나바이러스 백신 중 하나 이상이 프로모터에 작동적으로 연결되는, 방법.

제180항에 있어서, 프로모터는 폐 특이적 프로모터인, 방법.

제181항에 있어서, 폐 특이적 프로모터는 SP-B 또는 CD144인, 방법.

제180항에 있어서, 프로모터는 일반 프로모터인, 방법.

제183항에 있어서, 프로모터는 인간 사이토메갈로바이러스 즉시 초기 인핸서/프로모터(CMV)인, 방법.

제165항 내지 제185항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물은 IL-7, IL-2, 또는 IL-15인, 방법.

제165항 내지 제186항 중 어느 한 항에 있어서, T 세포 증식을 촉진하는 조성물은 장기간 면역을 촉진하는 데 도움이 되는, 방법.

제165항 내지 제187항 중 어느 한 항에 있어서, T 세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.

제165항 내지 제188항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 T-세포를 순환으로부터 폐로 끌어당기는 것을 돕는 것인, 방법.

방법으로서,
a. 제1 전달 시스템을 사용하여 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 백신 조성물의 제1 용량을 투여하는 단계; 및
b. 제2 전달 시스템을 사용하여 제2 용량을 투여하는 단계를 포함하고;
제1 및 제2 전달 시스템은 상이한 것인, 방법.

제189항에 있어서, 제1 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있는, 방법.

제189항 또는 제190항에 있어서, 제2 전달 시스템은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 포함할 수 있는, 방법.

제189항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.

제190항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.

제190항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.

제189항 내지 제194항 중 어느 한 항에 있어서, 제2 백신 용량은 제1 백신 용량 후 14일에 투여되는, 방법.

하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계.

제196항에 있어서, 재조합 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제196항 또는 제197항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제196항 내지 제198항 중 어느 한 항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.

제199항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.

제199항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.

제196항 내지 제201항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.

제196항 내지 제202항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.

하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 적어도 하나의 T-세포 유인 케모카인을 투여하는 단계; 및
c) T-세포 유인 케모카인을 투여한 후 적어도 하나의 사이토카인을 투여하는 단계.

제204항에 있어서, 재조합 백신 조성물은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제204항 내지 제205항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제204항 내지 제206항 중 어느 한 항에 있어서, 사이토카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제204항 내지 제207항 중 어느 한 항에 있어서, 펩티드 전달 시스템은 아데노바이러스 또는 아데노 연관 바이러스인, 방법.

제208항에 있어서, 아데노바이러스 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.

제208항에 있어서, 아데노 연관 전달 시스템은 AAV8 또는 AAV9인, 방법.

제204항 내지 제210항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.

제204항 내지 제211항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.

제204항 내지 제212항 중 어느 한 항에 있어서, 사이토카인은 T-세포 유인 케모카인의 투여 후 10일에 투여되는, 방법.

제16항에 있어서, 사이토카인은 IL-7, IL-15, 또는 이들의 조합인, 방법.

하기를 포함하는 방법:
a) 제1항 내지 제164항 중 어느 한 항에 따른 범-코로나바이러스 재조합 백신 조성물을 투여하는 단계; 및
b) 범-코로나바이러스 재조합 백신 조성물을 투여한 후 하나 이상의 T-세포 유인 케모카인을 투여하는 단계; 및
c) 하나 이상의 점막 케모카인을 투여하는 단계.

제215항에 있어서, 재조합 백신 조성물은 변형된 RNA, 아데노 연관 바이러스, 또는 아데노바이러스를 사용하여 투여되는, 방법.

제215항 내지 제216항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제215항 내지 제216항 중 어느 한 항에 있어서, 점막 케모카인은 RNA, 변형된 mRNA, 또는 펩티드 전달 시스템을 통해 투여되는, 방법.

제218항에 있어서, 아데노 연관 바이러스는 AAV8 또는 AAV9인, 방법.

제218항에 있어서, 아데노바이러스는 Ad26, Ad5, Ad35, 또는 이들의 조합인, 방법.

제215항 내지 제220항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 재조합 백신 조성물의 투여 후 14일에 투여되는, 방법.

제215항 내지 제221항 중 어느 한 항에 있어서, T-세포 유인 케모카인은 CCL5, CXCL9, CXCL10, CXCL11, 또는 이들의 조합인, 방법.

제215항 내지 제222항 중 어느 한 항에 있어서, 점막 케모카인은 T-세포 유인 케모카인의 투여 후 10일에 투여되는, 방법.

제215항 내지 제223항 중 어느 한 항에 있어서, 점막 케모카인은 CCL25, CCL28, CXCL14, 또는 CXCL17, 또는 이들의 조합인, 방법.

제215항 내지 제224항 중 어느 한 항에 있어서, 재조합 백신 조성물은 2회 용량을 통해 투여되는, 방법.

제215항 내지 제225항 중 어느 한 항에 있어서, 용량은 약 3주 간격인, 방법.

1개 이상의 큰 서열을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 1개 이상의 큰 서열 각각은 하기 중 적어도 하나를 포함하고:
a) 전체 스파이크 단백질 또는 이의 일부;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

제227항에 있어서, 하나 이상의 보존된 에피토프는 인간 및 동물 코로나바이러스 중에서 고도로 보존된 것인, 조성물.

제227항 내지 제228항 중 어느 한 항에 있어서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.

제227항 내지 제229항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD8⁺ T 세포 표적 에피토프를 포함하는, 조성물.

제227항 내지 제230항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD4⁺ T 세포 표적 에피토프를 포함하는, 조성물.

제227항 내지 제231항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a₁ _-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅)로부터 선택되는, 조성물.

제227항 내지 제232항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13- ₃₇)로부터 선택되는, 조성물.

제234항에 있어서, 하나 이상의 보존된 에피토프는 SARS-CoV-2 단백질 중 적어도 하나로부터 유래된 것인, 조성물.

제234항 내지 제235항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD8⁺ T 세포 표적 에피토프를 포함하는, 조성물.

제234항 내지 제236항 중 어느 한 항에 있어서, 조성물은 2 내지 20개의 CD4⁺ T 세포 표적 에피토프를 포함하는, 조성물.

제234항 내지 제237항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a₁ _-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅)로부터 선택되는, 조성물.

제234항 내지 제238항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13- ₃₇)로부터 선택되는, 조성물.

제234항 내지 제239항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab₁₆₇₅ _-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab₃₁₈₃ _-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab_6749-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10₅ _- ₁₃)으로부터 선택되는, 조성물.

1개 이상의 큰 서열을 인코딩하는 항원 전달 시스템을 포함하는 범-코로나바이러스 재조합 백신 조성물로서, 큰 서열은 하기 중 적어도 하나를 포함하고:
a) 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프;
b) 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프; 및/또는
c) 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프;
적어도 하나의 에피토프는 비-스파이크 단백질로부터 유래되는, 범-코로나바이러스 재조합 백신 조성물.

제241항에 있어서, 항원 전달 시스템은 아데노바이러스 기반 항원 전달 시스템인, 조성물.

제242항에 있어서, 아데노바이러스 기반 항원 전달 시스템은 Ad26, Ad5, Ad35, 또는 이들의 조합인, 조성물.

제241항 내지 제243항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 유인 케모카인을 추가로 인코딩하는, 조성물.

제241항 내지 제244항 중 어느 한 항에 있어서, 항원 전달 시스템은 T 세포 증식을 촉진하는 조성물을 추가로 인코딩하는, 조성물.

제241항 내지 제245항 중 어느 한 항에 있어서, 항원 전달 시스템은 분자 보조제를 추가로 인코딩하는, 조성물.

제241항 내지 제246항 중 어느 한 항에 있어서, 에피토프는 폐 특이적 프로모터에 작동적으로 연결된 것인, 조성물.

제241항 내지 제247항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 B-세포 표적 에피토프는 서열번호: 2-57 (S_2-10, S_1220-1228, S_1000-1008, S_958-966, E_20-28, ORF1ab₁₆₇₅ _-1683,ORF1ab₂₃₆₃ _-2371, ORF1ab₃₀₁₃ _-3021, ORF1ab₃₁₈₃ _-3191, ORF1ab₅₄₇₀ _-5478, ORF1ab_6749-6757, ORF7b₂₆ _-34, ORF8a₇₃ _-81, ORF10₃ _-11, 및 ORF10₅ _- ₁₃)으로부터 선택되는, 조성물.

제241항 내지 제248항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD4⁺ T 세포 표적 에피토프는 서열번호: 58-105 (ORF1a₁₃₅₀ _-1365, ORF1ab₅₀₁₉ _-5033, ORF6₁₂ _-26, ORF1ab₆₀₈₈ _-6102, ORF1ab₆₄₂₀ _-6434, ORF1a₁₈₀₁ _-1815, S_1-13, E_26-40, E_20-34, M_176-190, N_388-403, ORF7a₃ _-17, ORF7a₁ _-15, ORF7b₈ _-22, ORF7a₉₈ _-112, 및 ORF8₁ _- ₁₅)로부터 선택되는, 조성물.

제241항 내지 제249항 중 어느 한 항에 있어서, 하나 이상의 보존된 코로나바이러스 CD8⁺ T 세포 표적 에피토프는 서열번호: 106-138 (S_287-317, S_524-598, S_601-640, S_802-819, S_888-909, S_369-393, S_440-501, S_1133-1172, S_329-363, 및 S_13- ₃₇)로부터 선택되는, 조성물.

제241항 내지 제250항 중 어느 한 항에 있어서, 스파이크 단백질 또는 부분 스파이크 단백질을 포함하는, 조성물.

제251항에 있어서, 부분 스파이크 단백질은 삼량체화된 SARS-CoV-2 수용체 결합 도메인(RBD)을 포함하는, 조성물.

제251항 내지 제252항 중 어느 한 항에 있어서, 전체 스파이크 단백질 또는 부분 스파이크 단백질은 온전한 S1-S2 절단 부위를 갖는 것인, 조성물.

제251항 내지 제253항 중 어느 한 항에 있어서, 스파이크 단백질은 아미노산 위치 986 및 987에서 프롤린 치환으로 안정화되는, 조성물.

서열번호: 139-147 중 어느 하나를 포함하는 범-코로나바이러스 재조합 백신 조성물.