KR20230135598A

KR20230135598A - 안정한 코로나바이러스 단백질 및 그의 백신 조성물

Info

Publication number: KR20230135598A
Application number: KR1020237026138A
Authority: KR
Inventors: 다니엘 엘리스; 닐 킹; 제시 블룸; 타일러 스타; 앨리슨 그리니
Original assignee: 유니버시티 오브 워싱톤; 프레드 허친슨 캔서 센터
Priority date: 2020-12-31
Filing date: 2021-06-15
Publication date: 2023-09-25
Also published as: JP2024502823A; CO2023008898A2; BR112023013138A2; EP4271698A1; CA3201697A1; AU2021415906A1; WO2022146484A1; CL2023001930A1

Abstract

본원에서는 동일한 발현, 배양 또는 보관 조건 하에 상응하는 천연 또는 야생형 코로나바이러스 스파이크 단백질과 비교하여 증가된 발현 수준, 수율 및 안정성을 가지는 돌연변이된 코로나바이러스 "S" 스파이크 단백질 또는 그의 수용체 결합 도메인을 포함하는 조성물 및 방법이 제공된다. 이러한 돌연변이된 스파이크 단백질은 하나 이상의 코로나바이러스에 대한 단백질 기반의 백신 생성을 위해 사용될 수 있다.

Description

안정한 코로나바이러스 단백질 및 그의 백신 조성물

정부 지원

본 발명은 국립 보건원이 AI141707 하에 제공되는 정부 지원으로 이루어졌다. 정부는 본 발명에 대해 특정 권리를 갖는다.

관련 출원에 대한 상호 참조

본 출원은 35 U.S.C. § 119(e) 하에 2020년 12월 31일에 출원된 미국 가출원 제63/132,863호 및 2021년 5월 14일에 출원된 미국 가출원 제63/188,651호의 이익을 주장하며, 상기 문헌 각각의 내용은 본원에서 전체적으로 참고문헌으로 포함된다.

발명의 분야

본 발명의 분야는 단백질 기반 백신의 안정성을 개선하기 위한 방법 및 조성물에 관한 것이다.

코로나바이러스는 SARS-CoV-2 바이러스로 인해 유발된 2019/2020 판데믹은 전 세계적으로 수십만 명의 사망과 막대한 경제 침체를 일으켰으며 여전히 위협적인 중요 판데믹이다. SARS-CoV-2는 현재의 판데믹이 약화된 후에도 지속적인 전염병 유행 상태를 유지할 가능성이 있다. 따라서 SARS-CoV-2 또는 기타 미래에 출현하는 코로나바이러스에 대한 효과적인 백신이 매우 바람직하다.

요약

본원에 기재된 조성물 및 방법은 부분적으로는 (동일 또는 유사한 배양 조건 하에) 발현 단백질의 수율과 안정성을 모두 향상시키는, SARS-CoV-2 S "스파이크" 단백질 아미노산 서열에 있는 단일 또는 쌍을 이룬(paired) 아미노산 돌연변이의 발견에 기반한다. 이러한 향상된 스파이크 단백질(본원에서 "스파이크 단백질-유래 항원"이라고도 함) 안정성은 (동일 또는 유사한 보관 조건 하에) 야생형 또는 천연 단백질에 기반한 백신보다 더 긴 사용기한을 가지는 백신 생산을 가능하게 한다.

따라서, 본원에서는 한 측면에서 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고 서열번호 1의 상기 RBD에 대해 적어도 2개의 돌연변이를 추가로 포함하고 상기 적어도 2개의 돌연변이는 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 Blast-p(Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) "Basic local alignment search tool." J. Mol. Biol. 215:403-410)을 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 것인 비천연 발생 폴리펩타이드를 제공한다. 한 구현예에서, 이용된 Blast-p 프로그램은 미국 국립생물정보센터(NCBI, National Center for Biotechnology Information) 온라인 정렬 도구이다. 대안적으로, Blast-p 프로그램은 장치에 다운로드하여 로컬에서 이용할 수 있다. 당업자는 Blast-p 정렬 도구의 이용을 쉽게 이해할 것이지만, 의심의 여지를 피하기 위해 프로토콜 1 및 프로토콜 2가 온라인 및 다운로드된 정렬 도구를 위해 여기에 각각 제공된다.

프로토콜 1: 미국 국립생물정보센터(NCBI) 서버로부터 BLASTp 정렬 온라인과 함께 사용하기 위함.

1. 다음 설정을 사용하여 BLAST 정렬을 설정한다.

"둘 이상의 서열을 정렬하시오(Align two or more sequences)" 옵션을 이용한다.

관련 SARS-CoV-2 단백질에 대한 참조 변종 서열(즉, 서열번호 1)을 "쿼리 서열을 입력하시오(Enter Query Sequence)" 섹션에 입력한다.

임의의 상응하는 코로나바이러스 스파이크 단백질 서열을 "해당 서열에 입력하시오(Enter Subject Sequence)" 섹션에 입력한다.

알고리즘: blastp(단백질-단백질 BLAST)

기대 임계값(Expect threshold): 0.1

단어 크기(Word size): 6

쿼리 범위의 최대 일치항목(Max matches in a query range): 0

매트릭스(Matrix): BLOSUM62

갭 비용(Gap cost):

존재(Existence): 11

확대(Extension): 1

복잡도가 낮은 영역을 필터링합니까?: 아니요

마스크(Mask):

표만 검색합니까?: 아니요

소문자? : 아니요

2. "BLAST" 버튼을 클릭하여 분석을 실행한다.

3. 두 서열 간의 정렬을 나타내기 위해 "정렬" 탭을 클릭한다.

4. 관심 있는 각 서열 위치에 대해 "쿼리" 서열에 따른 번호를 확인한다. 그런 다음 "쿼리" 서열의 위치와 정렬된 "Sbjt" 서열에서의 상응하는 잔기 위치를 확인한다.

프로토콜 2: 로컬 컴퓨터 또는 서버에 다운로드된 단백질 BLASTp 정렬 도구와 함께 사용하기 위함.

1. 제조업체 지침을 이용하여 명령줄 실행을 위해 BLAST를 설치하거나 이미 설치된 컴퓨터 또는 서버를 확인한다.

2. SARS-CoV-2 단백질(즉, 서열번호 1)에 대해 원하는 하위유형별 참조 변종을 함유하는 파일을 FASTA 형식으로 생성시킨다. 아래 명령에서 이 파일을 "query.fasta"라고 명명한다.

3. 동일한 하위유형과는 상이한 코로나바이러스의 상응하는 단백질 서열을 함유하는 두 번째 파일을 FASTA 형식으로 생성시킨다. 아래 명령에서 이 파일을 "sbjct.fasta"라고 명명한다.

4. Terminal, iTerm2, Windows Console, Linux console 또는 기타 유사한 단말기 에뮬레이터와 같은 프로그램을 이용하여 다음 명령을 실행한다. 이렇게 하면 "results.txt"라는 이름의 파일이 생성된다.

blastp -query query.fasta -subject sbjct.fasta -matrix BLOSUM62 -evalue 0.1

word size 6 -gapopen 11 -gapextend 1 -out results.txt

5. results.txt를 열고 두 서열의 정렬을 보여주는 섹션을 본다. 관심 있는 각 서열 위치에 대해 "쿼리" 서열에 따른 번호를 확인한다. 그런 다음 "쿼리" 서열의 위치와 정렬된 "Sbjct" 서열에서의 상응하는 잔기 위치를 확인한다.

쿼리 서열과 참조 서열(예를 들어, 서열번호 1) 사이의 서열 동일성을 확인하기 위해 다른 단백질 정렬 도구도 사용될 수 있다는 것이 당업자에게 명백할 것이다. 쿼리 서열과 참조 서열이 유의한 서열 동일성을 공유하는 점을 고려할 때, 본원에 기재된 프로토콜을 사용하는 Blast-p와 동일한 결과를 생성하지 않더라도 다른 단백질 정렬 도구가 유사한 결과를 생성할 것으로 예상된다. 본원에 기재된 프로토콜은 이러한 목적을 위해 정확하고 효과적인 것으로 나타났고, 쿼리 서열에서 돌연변이될 아미노산 잔기의 확인에 있어 당업자를 돕기 위해 본원에 제공된다.

본원에 제공된 또 다른 측면은 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)으로, 서열번호 1의 상기 RBD에 대해 적어도 2개의 돌연변이를 추가로 포함하고 여기서 상기 적어도 2개의 돌연변이는 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M으로 이루어진 군으로부터 선택된 것인 제1 코로나바이러스 수용체 결합 도메인(RBD); 또는 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 또는 F338L/I358F/A363L/Y365M에 상응하는 적어도 2개의 돌연변이를 포함하는 제2 코로나바이러스 RBD로, 여기서 상응하는 부위는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인의 스파이크 단백질 서열과 서열번호 1의 서열 정렬에 의해 결정되는 것인 제2 코로나바이러스 RBD를 포함하는 비천연 발생 폴리펩타이드를 포함한다.

본원에서 제공된 또 다른 측면은 서열번호 1의 328-531 잔기와 90% 동일성을 포함하거나 Blast-p를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스의 수용체 결합 도메인의 상응하는 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고 서열번호 1의 상기 RBD에 대해 적어도 2개의 돌연변이 또는 제2 코로나바이러스에서 상응하는 잔기를 추가로 포함하고, 여기서 상기 적어도 2개의 돌연변이는 상기 적어도 2개의 돌연변이가 결여된 야생형 폴리펩타이드 안정성에 대하여 폴리펩타이드 안정성을 향상시키는 것인 비천연 발생 폴리펩타이드를 포함한다. 특정 구현예에서, 비천연 발생 코로나바이러스 수용체 결합 도메인 폴리펩타이드 안정성 및 그의 상응하는 야생형 폴리펩타이드 안정성은 동일 조건 하에서 평가된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 한 구현예에서, 적어도 2개의 돌연변이는 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 Blast-p를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스의 수용체 결합 도메인의 상응하는 잔기에 있다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 2개의 돌연변이가 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스의 상응하는 잔기에 있다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 수용체 결합 도메인 폴리펩타이드는 서열번호 1의 RBD 외부에 추가적인 아미노산 잔기를 추가로 포함한다. 이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 본원에 기재된 바와 같은 수용체 결합 도메인 폴리펩타이드는 코로나바이러스 스파이크 단백질 폴리펩타이드에 포함된다. 이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 수용체 결합 도메인 폴리펩타이드 또는 코로나바이러스 스파이크 단백질 폴리펩타이드는 예를 들어 융합 폴리펩타이드를 포함할 수 있다. 수용체 결합 도메인 폴리펩타이드 또는 코로나바이러스 스파이크 단백질 폴리펩타이드는 또한 예를 들어 분비를 위한 리더 서열을 포함할 수 있다. 다양한 구현예에서, 리더 서열 및/또는 아미노 말단 메티오닌이 존재할 수 있거나, 또는 대안적으로, 예를 들어 단백질분해 절단에 의해 제거될 수 있다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 수용체 결합 도메인(RBD)은 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 적어도 2개의 돌연변이는 야생형에 대한 수용체 결합 도메인의 유일한 돌연변이이다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 세포에서 발현될 때 RBD 폴리펩타이드의 발현은 상기 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드의 발현과 비교하여(즉, 동일 또는 유사한 발현 조건 또는 배양 조건 하에) 증가한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, RBD 폴리펩타이드는 코로나바이러스 항체에 결합하거나 코로나바이러스 동족 수용체를 결합시킨다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 항체는 SARS-CoV-2 항체를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드에 상응하는 코로나바이러스에 대한 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, ACE 수용체는 ACE2 수용체이다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 제2 코로나바이러스는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; HKUl 또는 그의 천연 발생 변이체로부터 선택되는 코로나바이러스의 서열을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 수용체 결합 도메인 폴리펩타이드는 서열번호 1에 대해 적어도 90% 서열 동일성을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, RBD는 제2 이종 폴리펩타이드에 융합된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, RBD는 나노입자, 나노구조 또는 이종 단백질 스캐폴드에 융합된다. 특정 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 I53-50 삼량체 "A" 성분을 포함한다. 다른 구현예에서, 이종 단백질 스캐폴드는 미국 특허 제10,351,603호의 표 1에 기재된 바와 같은 이종 단백질 스캐폴드를 포함하며, 상기 문헌의 내용은 전체가 참고문헌으로 포함된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드 및/또는 제2 폴리펩타이드는 항원성 폴리펩타이드이다.

본원에 제공된 또 다른 측면은 청구항 1의 폴리펩타이드를 포함하는 코로나바이러스 스파이크 단백질이다.

본원에 제공된 또 다른 측면은 본원에 기재된 바와 같은 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물이다. 한 구현예에서, 폴리펩타이드는 약제학적으로 허용가능한 담체와 혼합되어 있다. 한 구현예에서, 폴리펩타이드 및 약제학적으로 허용가능한 담체는 현탁액으로 제공된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 한 구현예에서, 약제학적 조성물은 아쥬반트를 추가로 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 조성물의 사용기한은 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드를 포함하는 조성물보다 더 길다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 조성물은 백신으로 제형화된다.

본원에서는 또 다른 측면에서 적어도 2개의 돌연변이를 포함하는 비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드가 또한 제공되고, 상기 적어도 2개의 돌연변이는 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 2개의 돌연변이는 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드 안정성에 대해 코로나바이러스 폴리펩타이드 안정성을 향상시킨다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이는 코로나바이러스 스파이크 단백질, 서브유닛 1의 리놀레산 결합 포켓에 있는 잔기의 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이는 서열번호 1의 328-531 잔기 내에 있거나 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 잔기의 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이가 335-345, 355-375 또는 378-395 잔기 사이에 있거나 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 서열번호 1의 잔기의 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이는 336, 338, 341, 342, 358, 361, 363, 365, 368, 374, 377, 387 또는 392 아미노산에 있는 서열번호 1의 잔기의 돌연변이 또는 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기의 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이는 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 잔기에 있거나 또는 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이는 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 또는 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기로부터 선택된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드는 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드가 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함하거나 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 수용체 결합 도메인 서열과 적어도 95% 동일성을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 적어도 2개의 돌연변이가 서열번호 1에 대한 스파이크 단백질, 서브유닛 1에 있는 유일한 돌연변이이다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드는 서열번호 1과 적어도 95% 동일성을 포함하거나 제2 코로나바이러스의 야생형 스파이크 단백질, 서브유닛 1 아미노산 서열과 적어도 95% 동일성을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 세포에서 발현될 때 코로나바이러스 폴리펩타이드의 발현은 동일 발현 조건 하에서 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드 발현과 비교하여 증가한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드는 코로나바이러스 항체에 결합하거나 동족 코로나바이러스 수용체를 결합시킨다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 동족 코로나바이러스 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; 또는 HKU1로부터 선택되는 코로나바이러스의 조작된(engineered) 돌연변이체 폴리펩타이드이다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드는 서열번호 1과 적어도 90%의 서열 동일성을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드는 제2 이종 폴리펩타이드에 융합된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드는 나노입자, 나노구조 또는 단백질 스캐폴드에 융합된다. 특정 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 I53-50 삼량체 "A" 성분을 포함한다. 다른 구현예에서, 이종 단백질 스캐폴드는 미국 특허 제10,351,603호의 표 1에 기재된 바와 같은 이종 단백질 스캐폴드를 포함하며, 상기 문헌의 내용은 전체적으로 참고문헌으로 포함된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드 또는 제2 이종 폴리펩타이드는 항원성 폴리펩타이드이다.

본원에는 또 다른 측면에서 본원에 기재된 바와 같은 코로나바이러스 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물(예를 들어, 혼합되어 있거나 현탁액을 형성함)이 또한 제공된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물은 아쥬반트를 추가로 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 조성물의 사용기한은 동일 또는 유사한 보관 조건 하에 보관될 때 적어도 1개의 캐비티 채움 돌연변이 및 적어도 제2 돌연변이가 결여된 야생형 코로나바이러스 폴리펩타이드를 포함하는 조성물보다 더 길다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 코로나바이러스 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물은 백신으로 제형화된다.

본원에 제공된 또 다른 측면은 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 수용체 결합 도메인, 또는 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 코로나바이러스 폴리펩타이드를 발현하는 세포에 관한 것이다.

본원에 제공된 또 다른 측면은 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 수용체 결합 도메인, 또는 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 코로나바이러스 폴리펩타이드를 암호화하는 핵산 서열에 관한 것이다.

본원에는 또 다른 측면에서, 대상체에게 코로나바이러스 백신접종을 하는 방법이 또한 제공되고, 상기 방법은 대상체에게 본원에 기재된 바와 같은 약제학적 또는 백신 조성물을 투여하는 것을 포함한다.

본원에 제공된 또 다른 측면은 백신 제조방법에 관한 것으로, 상기 방법은 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 수용체 결합 도메인 또는 본원에 기재된 바와 같은 적어도 2개의 돌연변이를 갖는 코로나바이러스 폴리펩타이드를 포함하는 조성물을 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함한다.

본원에 제공된 또 다른 측면은 서열번호 1의 코로나바이러스 폴리펩타이드에 대해 I358F, Y365F, Y365W, V367F 및 F392W로 이루어진 군으로부터 선택된 돌연변이를 포함하는 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고 이종 단백질 스캐폴드에 융합된 융합 폴리펩타이드 조성물에 관한 것이다. 한 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드를 포함한다. 또 다른 구현예에서, 서열번호 3의 폴리펩타이드에서 각각의 시스테인은 알라닌으로 돌연변이된다.

또 다른 구현예에서, 이종 단백질 스캐폴드는 미국 특허 제10,351,603호의 표 1에 기재된 바와 같은 이종 단백질 스캐폴드를 포함하며, 상기 문헌의 내용은 전체적으로 참고문헌으로 포함된다.

또 다른 구현예에서, 융합 폴리펩타이드 조성물은 약제학적으로 허용가능한 담체를 추가로 포함한다.

또 다른 구현예에서, 융합 폴리펩타이드 조성물은 아쥬반트를 추가로 포함한다.

또 다른 구현예에서, 본원에서는 융합 폴리펩타이드 조성물을 포함하는 백신 조성물이 제공된다.

또 다른 구현예에서, 본원에서는 융합 폴리펩타이드를 발현하는 세포가 제공된다.

또 다른 구현예에서, 본원에서는 융합 폴리펩타이드를 암호화하는 핵산을 포함하는 조성물이 제공된다.

또 다른 구현예에서, 본원에서는 대상체에게 코로나바이러스 백신접종을 하는 방법이 제공되며, 상기 방법은 대상체에게 본원에 기재된 바와 같은 융합 폴리펩타이드 조성물을 포함하는 조성물을 투여하는 것을 포함한다.

또 다른 구현예에서, 본원에서는 백신 제조방법이 본원에 제공되며, 상기 방법은 본원에 기재된 바와 같은 융합 폴리펩타이드 조성물 또는 이러한 융합 폴리펩타이드 조성물을 암호화하는 핵산을 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함한다.

본원에 제공된 또 다른 측면은 서열번호 1의 코로나바이러스 폴리펩타이드에 대해 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 돌연변이를 포함하는 코로나바이러스 수용체 결합 도메인(RBD)를 포함하는 폴리펩타이드에 관한 것이다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 한 구현예에서, 돌연변이는 I358F, Y365F, Y365W, V367F 및 F392W로 이루어진 군으로부터 선택된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 제2 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 제3 돌연변이를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 서열번호 4 또는 서열번호 5의 폴리펩타이드 서열을 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 이종 단백질 스캐폴드를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드 서열과 적어도 90%, 적어도 95% 또는 적어도 98% 동일성을 갖는다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드를 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 서열번호 6 또는 서열번호 7의 폴리펩타이드 서열을 포함한다.

본원에 제공된 또 다른 측면은 제59항 내지 제62항 중 어느 한 항의 폴리펩타이드로 이루어진 제1 성분 및 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 제2 성분을 포함하거나 이들로 이루어진 폴리펩타이드 복합체에 관한 것이다.

또한, 본원에서는 또 다른 측면에서 본원에 기재된 바와 같은 조성물 또는 폴리펩타이드 복합체를 포함하는 백신 조성물이 제공된다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 한 구현예에서, 조성물은 약제학적으로 허용가능한 담체를 추가로 포함한다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 백신 조성물은 아쥬반트를 추가로 포함한다.

본원에 제공된 또 다른 측면은 본원에 기재된 바와 같은 폴리펩타이드를 발현하는 세포에 관한 것이다.

본원에 제공된 또 다른 측면은 본원에 기재된 바와 같은 폴리펩타이드를 암호화하는 핵산에 관한 것이다.

본원에 제공된 또 다른 측면은 대상체에게 코로나바이러스 백신접종을 하는 방법에 관한 것으로, 상기 방법은 대상체에게 본원에 기재된 바와 같은 폴리펩타이드, 단백질 복합체 또는 백신 조성물을 투여하는 것을 포함한다.

본원에 제공된 또 다른 측면은 백신의 제조방법에 관한 것으로, 상기 방법은 본원에 기재된 바와 같은 폴리펩타이드를 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함한다.

본원에 제공된 또 다른 측면은 백신의 제조방법에 관한 것으로, 상기 방법은 본원에 기재된 폴리펩타이드로 이루어진 제1 성분; 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 제2 성분; 약제학적으로 허용가능한 담체; 및 선택적으로 아쥬반트를 조합하는 것을 포함한다.

따라서, 본원에서는 한 측면에서 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고 서열번호 1의 상기 RBD에 대해 적어도 1개의 돌연변이를 추가로 포함하고 상기 적어도 1개의 돌연변이는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택되거나 Blast-p (Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) "Basic local alignment search tool." J. Mol. Biol. 215:403-410)을 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 비천연 발생 폴리펩타이드를 제공하다. 한 구현예에서, 이용된 Blast-p 프로그램은 미국 국립생물정보센터(NCBI) 온라인 정렬 도구이다. 대안적으로, Blast-p 프로그램은 장치에 다운로드하여 로컬에서 사용할 수 있다.

이러한 측면 및 본원에 제공된 모든 다른 측면의 또 다른 구현예에서, 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L으로 이루어진 군으로부터 선택된 제3 돌연변이를 포함한다.

본원에 기재된 또 다른 측면은 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)으로, 서열번호 1의 상기 RED에 대해 적어도 2개의 돌연변이를 추가로 포함하고, 상기 적어도 2개의 돌연변이는 다음:

F338L/Y365W;

Y365W/L513M;

Y365W/F392W;

F338M/A363L/Y365F/F377V;

Y365F/F392W;

Y365F/V395I;

Y365F/F392W/V395I;

Y365W/L513I/F515L;

F338L/A363L/Y365M;

F338L/I358F/Y365W;

I358F/Y365W/L513M;

I358F/Y365W/F392W;

F338M/I358F/A363L/Y365F/F377V;

I358F/Y365F/F392W;

I358F/Y365F/V395I;

I358F/Y365F/F392W/V395I;

I358F/Y365W/L513I/F515L; 및

F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되는 것인 제1 코로나바이러스 수용체 결합 도메인(RBD); 또는

서열번호 1의

F338L/Y365W;

Y365W/L513M;

Y365W/F392W;

F338M/A363L/Y365F/F377V;

Y365F/F392W;

Y365F/V395I;

Y365F/F392W/V395I;

Y365W/L513I/F515L;

F338L/A363L/Y365M;

F338L/I358F/Y365W;

I358F/Y365W/L513M;

I358F/Y365W/F392W;

F338M/I358F/A363L/Y365F/F377V;

I358F/Y365F/F392W;

I358F/Y365F/V395I;

I358F/Y365F/F392W/V395I;

I358F/Y365W/L513I/F515L; 및

F338L/I358F/A363L/Y365M에 상응하는 적어도 2개의 돌연변이를 포함하되, 여기서 상응하는 부위는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인의 스파이크 단백질 서열과 서열번호 1의 서열 정렬에 의해 결정되는 것인 제2 코로나바이러스 RBD를 포함하는 폴리펩타이드에 관한 것이다.

도면의 간단한 설명
도 1a 내지 도 1b. 예시적인 비천연 발생 SARS-CoV-2 안정화된 수용체 결합 도메인은 하나 이상의 돌연변이를 가지며 출발 작제물(즉, 자연 또는 야생형 SARS-CoV-2 스파이크 단백질)과 비교하여 향상된 발현을 나타낸다. 도 1a I53-50A 삼량체 나노입자 성분에 유전적으로 융합된 설계된 재패킹 RBD("Rpk") 변이체를 발현시키기 위해 사용되는 상층액의 환원 및 비환원 SDS-PAGE 분석. 야생형 대조군은 RBD에 대한 돌연변이를 함유하지 않고 음성 대조군은 임의의 분비된 단백질을 암호화하지 않는 플라스미드를 이용한다. 단량체 및 산화된 이량체 종의 이동이 표시된다. 도 1b 모든 작제물에 포함된 돌연변이 목록. 진하게 표시된 돌연변이는 Starr 등 2020에서 단독 밸리데이션되었다.
도 2a 내지 2c. SARS-CoV-2 RBD에 대한 안정화 돌연변이의 위치를 보여주는 구조 모델. 도 2a PDB-ID 6VYB(왼쪽)에 기반한 SARS-CoV-2 스파이크 단백질의 표면 대표도이며, RBD를 상자로 강조 표시하고 대표적인 N-글리칸을 포함하여 투명한 표면을 나타내어 RBD을 확대(zoom-in)한 것이다. 도 2b 설계된 대부분의 돌연변이를 함유하는 SARS-CoV-2 수용체 결합 도메인의 영역을 확대한 것이다. 도 2c RBD를 안정화시키는, Rpk4 및 Rpk9 명칭의, 2가지 대표적인 설계된 돌연변이 세트의 구조 모델.
도 3. I53-50A 삼량체 성분에 유전적으로 융합된 안정화된 RBD를 발현하기 위해 사용되는 상층액에 대한 인간 ACE2 수용체 및 CR3022 항체 결합을 측정하는 생물층 간섭계(BLI). ACE2 및 CR3022는 상층액에 노출되기 전에 센서에 고정되었다. (i) 모든 설계, (ii) 야생형 RBD를 함유하는 작제물 및 (iii) 음성 대조군 혈청으로부터 얻은 데이터가 그래프에 나타난다. 도 1의 돌연변이된 SARS-CoV-2 스파이크 단백질 각각은 SARS-CoV-2 동족 수용체인 안지오텐신 전환 효소-2(ACE2) 수용체, 및 SARS-CoV-2 스파이크 단백질을 인식하는 CR3022 mAb 둘 모두에 대해 테스트했을 때 항원적으로 온전한 것으로 결정되었다. 상층액으로부터의 측정은 또한 이러한 돌연변이 각각이 출발 작제물보다 훨씬 더 높은 수준으로 발현됨을 확인시켜 준다.
도 4a 내지 도 4e. 단량체 형태 및 I53-50A 삼량체에 융합된 경우("-I53-50A"를 추가하여 지칭함)의 Rpk4 또는 Rpk9 돌연변이를 함유하는 안정화된 RBD의 생화학적, 생물물리학적 및 항원 특징 규명. 야생형 SARS-CoV-2 RBD와 유사한 항원성을 유지하면서 발현, 열 안정성 및 국소 구조적 배열이 모두 개선되었다. 도 4a 동일한 부피의 HEK293F 배양물로부터 발현 후 야생형 및 안정화된 RBD의 크기 배제 크로마토그래피(SEC)에 이어 IMAC 정제 및 농축. 단량체 RBD(왼쪽)는 Superdex 75 Increase 10/300 GL을 사용하여 정제된 반면, I53-50A 삼량체에 융합된 경우(오른쪽)는 Superdex 200 Increase 10/300 GL을 사용하여 정제되었다. 크롭(cropped) 겔은 동등하게 희석된 SEC 로딩 샘플을 보여준다. 도 4b 고유 트립토판 형광을 사용하는 nanoDSF로 모니터링한 야생형 및 안정화된 RBD 단량체(왼쪽) 및 I53-50A 삼량체에 융합된 경우(오른쪽)의 열 변성. 상단 패널은 온도 함수로서 각 형광 방출 스펙트럼의 무게중심 평균(BCM)을 보여주는 한편, 하단 패널은 용융 온도를 계산하기 위해 사용되는 평활 1차 도함수를 보여준다. 도 4c I53-50A 삼량체에 융합된 야생형 및 안정화된 RBD의 수소/중수소 교환 질량 분석법(HDX-MS). 구조 모델(상단, PDB 6W41)은 야생형 RBD-I53-50A 삼량체와 비교하여 Rpk4-I53-50A 및 Rpk9-I53-50A 삼량체 모두의 전시적(panoramic) 차이 흡수 결과를 보여주고, 음영은 1분에 측정된 돌연변이 삼량체에서 감소된 흡수 수준을 기반으로 결정한다. 상자는 잔기 392-399의 펩타이드 세그먼트를 강조 표시하며, 이 펩타이드에 대한 교환은 여러 시점, 즉, 3초, 15초, 1분, 30분 및 20시간(하단)에 나타난다. 각 포인트는 두 측정치의 평균이다. 표준 편차는 도시된 포인트보다 작지 않은 경우에 한해 나타냈다. 도 4d 동일한 농도의 야생형 및 안정화된 RBD 단량체와 혼합될 때 SYPRO Orange 형광이며, 신호가 클수록 더 높은 수준의 노출된 소수성을 나타낸다. 도 4e BLI에 의해 평가될 때 단량체 야생형 및 안정화된 RBD에 고정된 CV30 및 CR3022 단클론 항체의 결합 동역학. 2배 연속 희석(회색 음영)된 RBD의 5가지 농도로부터 얻은 실험 데이터는 피팅되었고(검은 선), 결합 방정식은 1:1 상호작용을 설명한다. 구조 모델(왼쪽)은 CV30 Fab(PDB 6XE1) 및 CR3022 Fab(PDB 6W41)에 결합된 SARS-CoV-2의 구조적 정렬에 의해 생성되었다.
도 5a 내지 도 5e. 조립된 I53-50 나노입자 상에 제공된 안정화된 RBD는 야생형 RBD와 비교하여 용액 안정성을 향상시킨다. 도 5a RBD 항원을 나타내는 I53-50 나노입자 면역원 조립체("-I53-50"을 추가하여 지칭함)의 개요. 도 5b 야생형 RBD-I53-50, Rpk4-I53-50 및 Rpk9-I53-50(축척 막대, 200nm)의 음성 염색 전자현미경(nsEM). 도 5c 내지 도 5e는 4가지 상이한 완충액에서 단회 동결/해동 주기의 전과 후에 야생형 RBD-I53-50, Rpk4-I53-50 및 Rpk9-I53-50에 대한 품질 관리 결과의 요약을 보여준다. 도 5c 가용성 응집체 존재에 대한 지표인 UV-Vis 스펙트럼에서 320 내지 280nm의 흡광도 비율. 도 5d 적절한 나노입자 조립체와 응집체 형성 둘 모두를 모니터링하는 동적 광산란(DLS) 측정. 도 5e 고정화된 hACE2-Fc 수용체(상단) 및 CR3022(하단)에 대한 I53-50 나노입자 면역원의 반응성 분율. 사전 동결 및 사후 동결 데이터는 각 나노 입자에 대한 각각의 CHAPS-함유 샘플에 대해 개별적으로 정규화되었다.
도 6a 내지 도 6c. 부모 야생형 RBD-L53-50 나노입자 면역원의 강력한 면역원성은 Rpk 돌연변이 추가에 의해 유지된다. 도 6a 암컷 BALB/c 마우스(그룹당 6마리)를 0주와 3주에 면역접종했다. 각 그룹은 AddaVax 아쥬반트를 갖는 등몰량의 RBD 항원을 투여받았고, 총 항원은 HexaPro-폴돈의 경우 투여당 5μg에 해당하고 다른 모든 면역원의 경우 투여당 0.88μg에 해당한다. 혈청 채취는 제2주 및 제5주에 수행했다. RBD-I53-50 면역원은 2가지 상이한 완충액 조건에서 제조되었고, 한 그룹은 부형제로서 CHAPS를 함유한다. 도 6b 연속 희석된 혈청의 ELISA 측정치로부터 AUC로 평가될 때 제2주 및 제5주에 HexaPro-폴돈에 대한 결합 역가. 각 원은 개별 마우스의 AUC 측정치를 나타내고 수평선은 각 그룹의 기하 평균을 보여준다. 그룹 4에 대해 제2주에 거의 0에 가까운 AUC를 가진 1마리의 마우스는 그래프에 표시되지 않았지만 기하 평균 계산에는 포함되었다. 도 6c 렌티바이러스 백본을 이용한 자가(D614G) 슈도바이러스 중화. 각 원은 개별 마우스에 대한 50% 억제(IC₅₀)에서 중화 항체 역가를 나타내고 수평선은 각 그룹의 기하 평균을 보여준다. 통계 분석은 Dunn 다중 비교와 함께 일측 비모수 Kruskal-Wallis 테스트를 사용하여 수행하였다. *, p < 0.05; **, p < 0.01; ***, p < 0.001.
도 7a 내지 도 7c. RBD 기반의 나노입자 면역원의 사용기한 안정성은 Rpk 돌연변이에 의해 개선된다. 도 7a 4주간의 DLS 측정 요약. 유체역학적 직경은 35 내지 40 ℃에서 야생형 RBD-I53-50을 제외한 모든 나노입자에 대해 일정하게 유지되었으며, 이는 28일 보관 후 응집 징후를 보여주었다. 도 7b BLI에 의한 고정된 hACE2-Fc 수용체(점선) 및 CR3022 mAb(실선)에 대한 결합을 각 시점에서 -80 ℃ 샘플에 대해 정규화함. 항원 무결성은 안정화된 나노입자 면역원에 대해 일정하게 유지된 반면, 35 내지 40℃에서 인큐베이션한 야생형 RBD-I53-50의 결합 신호는 60%(hACE2-Fc) 및 30%(CR3022)만큼 감소했다. 도 7c 4주 동안의 SDS-PAGE 및 nsEM 요약. SDS-PAGE에서 분해가 관찰되지 않았다. 부분 응집은 35 내지 40 ℃에서 보관된 WT 나노입자에 대해 28일에 nsEM에 의해서만 관찰되었다. 35 내지 40 ℃에서 보관 후 28일 동안의 전자현미경 사진이 나타나 있고, 상자는 응집체 경우를 나타낸다(축적 막대, 200nm). 모든 샘플은 TBS, 5% 글리세롤, 100mM L-아르기닌으로 제형화되었다.
도 8a 내지 도 8d. Rpk9 돌연변이는 HexaPro 돌연변이를 함유하는 전장 SARS-CoV-2 S 엑토도메인 내로 통합될 수 있다. 도 8a 동일한 부피의 HEK293F 배양물로부터의 발현 후 야생형(HexaPro-폴돈) 및 Rpk9(Rpk9-HexaPro-폴돈) 융합전-안정화된 S 엑토도메인의 SEC 정제에 이은 IMAC 정제 및 농축. S 엑토도메인은 Superose 6 Increase 10/300 GL을 이용하여 정제되었다. 도 8b HexaPro-폴돈 및 Rpk9-HexaPro-폴돈 정제 동안에 중간체 및 최종 생성물의 환원 및 비환원 SDS-PAGE. 도 8c 고유 트립토판 형광을 이용하는 nanoDSF로 모니터링한 HexaPro-폴돈 및 Rpk9-HexaPro-폴돈의 열 변성. 형광 방출 스펙트럼의 무게중심 평균(BCM)은 온도 함수로 그래프 작성했다. 도 8d HexaPro-폴돈 및 Rpk9-HexaPro-폴돈의 nsEM(축척 막대, 100nm).
도 9. B.1.351 변이체의 RBD에 추가되었을 때, Rpk9 돌연변이는 더 단순한 완충액 제형 중 적절한 SEC 용리 부피에서 RBD를 나타내는 I53-50 나노입자의 상대 회수율을 개선시켰으며, 이는 Rpk 돌연변이가 다른 변이체로부터의 RBD를 함유하는 면역원의 무결성을 개선시킴을 보여준다. 조립체 및 SEC는 Wuhan-1 RBD(Rpk 돌연변이 없음), Rpk9 돌연변이가 결여된 B.1.351 RBD 및 Rpk9 돌연변이가 있는 B.1.351 RBD를 나타내는 I53-50 나노입자에 대해 50mM Tris pH 7.4, 185mM NaCl, 100mM L-아르기닌, 0.75% CHAPS, 4.5% 글리세롤 또는 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤 중에서 수행하였다. Rpk9 돌연변이는 Rpk9 돌연변이가 결여된 등가 샘플과 비교하여 완충액 조건에서 수율 및 RBD 안정성의 기타 측정치를 증가시킨 반면, Rpk9 돌연변이가 있는 B.1.351 RBD를 나타내는 나노입자는 CHAPS 청정제없이 양호한 상대 수율 및 SEC 이동을 유지했다.
도 10 TBS, 5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌 중 나노입자에 대한 SDS-PAGE. 50mM Tris pH 7.4, 185mM NaCl, 4.5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플을 +/- 환원제(DTT), 동결 해동(F/T) 전후에 분석했다.
도 11 TBS, 5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌 중 나노입자에 대한 hACE2-Fc 결합. 50mM Tris pH 7.4, 185mM NaCl, 4.5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 항원의 hACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 바이오센서는 면역원(결합(association), x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 12 TBS, 5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 나노입자에 대한 CR3022 결합. 50mM Tris pH 7.4, 185mM NaCl, 4.5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022 IgG가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 13 TBS, 5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 나노입자에 대한 동적 광 산란. 50mM Tris pH 7.4, 185mM NaCl, 4.5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 각 샘플에 대한 유체역학적 직경(nm)은 정규화된 강도로 그래프 작성했다.
도 14 TBS, 5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 나노입자에 대한 UV-Vis. 50mM Tris pH 7.4, 185mM NaCl, 4.5% 글리세롤, 0.75% CHAPS, 100mM L-아르기닌에서 각 샘플에 대한 UV-Vis 스펙트럼(nm)은 정규화된 흡광도로 그래프 작성했다.
도 15 TBS, 5% 글리세롤, 100mM L-아르기닌에서 나노입자에 대한 SDS-PAGE. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤, 100mM L-아르기닌에서 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플을 +/- 환원제(DTT), 동결 해동(F/T) 전후에 분석했다.
도 16 TBS, 5% 글리세롤, 100mM L-아르기닌에서 나노입자에 대한 hACE2-Fc 결합. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤, 100mM L-아르기닌에서 항원의 hACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)와 함께 인큐베이션했다.
도 17 TBS, 5% 글리세롤, 100mM L-아르기닌에서 나노입자에 대한 CR3022 결합. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤, 100mM L-아르기닌에서 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022 IgG가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 18 TBS, 5% 글리세롤, 100mM L-아르기닌에서 나노입자에 대한 동적 광 산란. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤, 100mM L-아르기닌에서 각 샘플에 대한 유체역학적 직경(nm)은 정규화된 강도로 그래프 작성했다.
도 19 TBS, 5% 글리세롤, 100mM L-아르기닌의 나노입자에 대한 UV-Vis. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤, 100mM L-아르기닌에서 각 샘플에 대한 UV-Vis 스펙트럼(nm)은 정규화된 흡광도로 그래프 작성했다.
도 20 TBS, 5% 글리세롤에서 나노입자에 대한 SDS-PAGE. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤에서 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플을 +/- 환원제(DTT), 동결 해동(F/T) 전후로 분석했다.
도 21 TBS, 5% 글리세롤에서 나노입자에 대한 hACE2-Fc 결합. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤에서 항원의 ACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)와 함께 인큐베이션했다.
도 22 TBS, 5% 글리세롤에서 나노입자에 대한 CR3022 결합. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤에서 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022 IgG가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)와 함께 인큐베이션했다.
도 23 TBS, 5% 글리세롤에서 나노입자에 대한 동적 광 산란. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤에서 각 샘플에 대한 유체역학적 직경(nm)을 정규화된 강도로 그래프 작성했다.
도 24 TBS, 5% 글리세롤에서 나노입자에 대한 UV-Vis. 50mM Tris pH 8, 150mM NaCl, 5% 글리세롤에서 각 샘플에 대한 UV-Vis 스펙트럼(nm)은 정규화된 흡광도로 그래프 작성했다.
도 25 TBS에서 나노입자에 대한 SDS-PAGE. 50mM Tris pH 8, 150mM NaCl에서 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플을 +/- 환원제(DTT), 동결 해동(F/T) 전후에 분석했다.
도 26 TBS에서 나노입자에 대한 hACE2-Fc 결합. 50mM Tris pH 8, 150mM NaCl에서 항원의 H ACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)와 함께 인큐베이션했다.
도 27 TBS에서 나노입자에 대한 CR3022 결합. 50mM Tris pH 8, 150mM NaCl에서 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022 IgG가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 28 TBS에서 나노입자에 대한 동적 광산란. 50mM Tris pH 8, 150mM NaCl에서 각 샘플에 대한 유체역학적 직경(nm)을 정규화된 강도로 그래프 작성했다.
도 29 TBS에서 나노입자에 대한 UV-Vis. 50mM Tris pH 8, 150mM NaCl에서 각 샘플에 대한 UV-vis 스펙트럼(nm)을 정규화된 흡광도로 그래프 작성했다.
도 30 RBD-I53-50 나노입자에 대한 SDS-PAGE. 28일(D) 연구에 걸쳐 4개 온도에서 인큐베이션한 후 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플은 +/-환원제(DTT)로 분석했다.
도 31 RBD-I53-50 나노입자에 대한 hACE2-Fc 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 hACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)와 함께 인큐베이션했다.
도 32 RBD-I53-50 나노입자에 대한 CR3022 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 33 RBD-I53-50 나노입자에 대한 nsEM. 4개 온도에서 인큐베이션한 후 제1일 및 제28일(D)에 각 샘플에 대한 대표적인 음성 염색 전자현미경 사진. 축적 막대, 50nm.
도 34 RBD-I53-50 나노입자에 대한 동적 광산란. 28일(D) 기간에 걸쳐 각 샘플에 대한 유체역학적 직경(nm)을 정규화된 강도로 그래프 작성했다.
도 35 Rpk4-I53-50 나노입자에 대한 SDS-PAGE. 28일(D) 연구에 걸쳐 4개 온도에서 인큐베이션한 후 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플은 +/-환원제(DTT)로 분석했다.
도 36 Rpk4-I53-50 나노입자에 대한 hACE2-Fc 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 hACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 37 Rpk4-I53-50 나노입자에 대한 CR3022 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 38 Rpk4-I53-50 나노입자에 대한 nsEM. 4개 온도에서 인큐베이션한 후 제1일 및 제28일(D)에 각 샘플에 대한 대표적인 음성 염색 전자현미경 사진. 축적 막대, 50nm.
도 39 Rpk4-I53-50 나노입자에 대한 동적 광산란. 28일(D) 기간에 걸쳐 각 샘플에 대한 유체역학적 직경(nm)을 정규화된 강도로 그래프 작성했다.
도 40 Rpk9-I53-50 나노입자에 대한 SDS-PAGE. 28일(D) 연구에 걸쳐 4개 온도에서 인큐베이션한 후 샘플 무결성을 SDS-PAGE로 분석했다. 표준품의 분자량은 kDa로 표시했다. 각 샘플을 +/-환원제(DTT)로 분석했다.
도 41 Rpk9-I53-50 나노입자에 대한 hACE2-Fc 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 hACE2-Fc 결합을 생물층 간섭계(BLI)로 분석했다. hACE2-Fc가 로딩된 단백질 A 바이오센서는 면역원(결합, x = 590 내지 889초) 및 이후 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 42 Rpk9-I53-50 나노입자에 대한 CR3022 결합. 28일(D) 동안 4개 다른 온도에서 인큐베이션한 항원의 CR3022 IgG 결합을 생물층 간섭계(BLI)로 분석했다. CR3022가 로딩된 단백질 A 바이오센서를 면역원(결합, x = 590 내지 889초) 및 완충액(해리, x = 890 내지 1190초)과 함께 인큐베이션했다.
도 43 Rpk9-I53-50 나노입자에 대한 nsEM. 4개 온도에서 인큐베이션한 후 제1일 및 제28일(D)에 각 샘플에 대한 대표적인 음성 염색 전자현미경 사진. 축적 막대, 50nm.
도 44 Rpk9-I53-50 나노입자에 대한 동적 광산란. 28일(D) 기간에 걸쳐 각 샘플에 대한 유체역학적 직경(nm)은 정규화된 강도로 그래프 작성했다.

본원에는 동일한 발현, 배양 또는 보관 조건 하에서 천연 또는 야생형 코로나바이러스 스파이크 단백질(예를 들어, SARS-CoV-2 S 단백질)과 비교하여 발현 수준, 수율 및/또는 안정성을 증가시키는 적어도 1개, 2개 이상의 아미노산 돌연변이가 있는 코로나바이러스 "S" 스파이크 단백질을 포함하는 조성물 및 방법이 제공된다. 이러한 돌연변이된 스파이크 단백질은 인간을 감염시키는 것으로 알려진 다른 코로나바이러스인 SARS-CoV-2에 대한 단백질 기반 백신 또는 인간을 감염시키는 것으로 알려진 여러 코로나바이러스로부터 예방하는 범-코로나바이러스 백신을 생성하기 위해 사용될 수 있다.

한 구현예에서, S 단백질은 천연 또는 야생형 코로나바이러스 스파이크 단백질과 비교하여 특정 발현, 배양 또는 보관 조건 하에서 돌연변이 코로나바이러스 스파이크 단백질의 발현 수준, 수율 및/또는 안정성을 증가시키는 단일 돌연변이를 포함한다. 대안적인 구현예에서, S 단백질은 복수의 돌연변이(예를 들어, 2, 3, 4 또는 5개)를 포함한다.

정의

본원에서 사용되는 용어 "비천연 발생" 또는 "돌연변이체"는 적어도 1개 또는 적어도 2개의 아미노산 잔기 돌연변이를 포함하고 바람직하게는 상응하는 천연 또는 야생형 코로나바이러스 서열과 비교하여 향상된 안정성 및/또는 발현을 포함하는 코로나바이러스 폴리펩타이드(예를 들어, 안정화된 코로나바이러스 S 단백질 또는 RBD 폴리펩타이드)를 지칭한다. 일부 구현예에서, 본원에 기재된 돌연변이체 폴리펩타이드는 예를 들어 적어도 2개의 돌연변이를 제외하고는 천연 대응물과 "실질적으로 유사하다". 일부 구현예에서, 천연 대응물은 천연 발생 코로나바이러스 변이체를 함유할 수 있다.

의심의 여지를 없애기 위해 코로나바이러스 서열의 천연 발생 변이체(예를 들어, SARS-Cov-2 변이체: B.1.1.7; B.1.351; P.1; B.1.427; B.1.429; B.1.526; B.l.526.1; B.1.525; P.2; B.1.617; B.1.617.1; B.1.617.2 및 B.1.617.3)은 "비천연 발생" 또는 "돌연변이체" 코로나바이러스 서열로 간주되지 않지만, 해당 용어가 본원에서 사용될 때 참조 코로나바이러스 서열로 사용될 수 있다.

본원에서 사용되는 용어 "비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드"는 최소한 수용체 결합 도메인 서열(서열 번호 1의 328-531 잔기), 리놀레산 결합 포켓의 구조적 형성을 허용하는 잔기, 및 적어도 1개 또는 적어도 2개의 아미노산 돌연변이를 포함하는 폴리펩타이드를 지칭한다. 한 구현예에서, 적어도 2개의 돌연변이 중 1개는 해당 용어가 본원에서 사용될 때 "캐비티 채움 돌연변이"를 포함한다.

두 분자가 실질적으로 유사한 구조를 가지고(즉, 디폴트 매개변수로 설정된 Blast-p 정렬에 의해 결정될 때 아미노산 서열의 적어도 90%가 유사함) 적어도 1개의 관련 기능(예를 들어, 천연 코로나바이러스 대응물을 결합시키는 항체에 의한 폴리펩타이드 인식에 의해 결정되는 항원 활성)이 실질적으로 유사하다면 하나의 분자가 또 다른 분자와 "실질적으로 유사"하다고 한다. 즉, 돌연변이체 폴리펩타이드는 하나 이상의 아미노산 또는 핵산 결실, 추가, 치환 또는 측쇄 변형으로 인해 천연 발생 폴리펩타이드 또는 핵산과 다르지만, 천연 발생 분자의 하나 이상의 특이적 기능 또는 생물학적 활성을 유지한다. 아미노산 치환은 아미노산이 다른 천연-발생 또는 비-전통적인 아미노산 잔기로 대체되는 변경을 포함한다. 일부 치환은 "보존적"으로 분류될 수 있으며, 이 경우 폴리펩타이드에 함유된 아미노산 잔기가 극성, 측쇄 기능 또는 크기와 관련하여 유사한 특성을 가지는 또 다른 천연 발생 아미노산으로 대체된다. 또한 본원에 기재된 바와 같은 변이체에 포함되는 치환은 "비-보존적"일 수 있고, 이 경우 펩타이드에 존재하는 아미노산 잔기가 상이한 특성을 가지는 아미노산으로 치환(예를 들어, 하전되거나 소수성인 아미노산이 하전되지 않거나 친수성인 아미노산으로 치환)되거나 또는 대안적으로는 천연 발생 아미노산이 비-전통적 아미노산으로 치환된다. 또한 폴리펩타이드와 관련하여 사용되는 용어 "돌연변이체"는 참조 폴리펩타이드와 비교하여(예를 들어, 야생형 코로나바이러스 폴리펩타이드와 비교하여) 1차, 2차 또는 3차 구조의 변이이다. 또한 돌연변이체는 인간 단백질에서 정상적으로는 발생하지 않는 오르니틴의 삽입을 포함하지만 이에 국한되지 않는, 변이체의 기반이 되는 펩타이드 서열에서 정상적으로 발생하지 않는 아미노산 및 다른 분자의 삽입 및 치환을 포함하여 아미노산 삽입, 결실 또는 치환을 포함할 수도 있다.

본원에서 사용되는 용어 "에 상응하는" 또는 "상응하는 야생형 코로나바이러스"는 비천연 발생 코로나바이러스 폴리펩타이드(예를 들어, 스파이크 폴리펩타이드) 또는 RBD 폴리펩타이드 생산이 유래되는 야생형 코로나바이러스 폴리펩타이드 서열(또는 그의 천연 발생 변이체)을 지칭한다. 전형적으로, 야생형 코로나바이러스 서열(또는 그의 천연 발생 변이체)은 비천연 발생 코로나바이러스 폴리펩타이드와 동일한 변종에서 유래한다. 예를 들어, 본원에 기재된 바와 같은 돌연변이된 SARS-CoV-2 폴리펩타이드는 SARS-CoV-2 서열에 대한 야생형 코로나바이러스 폴리펩타이드 또는 그의 천연 발생 변이체(예를 들어, 남아프리카 변이체, 브라질 변이체, 로스앤젤레스 변이체 등)에 해당한다.

본원에서 사용되는 용어 "천연 발생 변이체"는 감염에 취약한 개체 집단에서 자발적으로 발생하는 코로나바이러스 서열을 지칭하다.

본원에서 사용되는 용어 "증가된 안정성" 또는 "향상된 안정성"은 동일한 조건 하에서 상응하는 천연 또는 야생형 코로나바이러스 단백질 서열(또는 그의 천연 발생 변이체)보다 더 느린 속도로 세포, 용액 또는 제형에서 분해되고 따라서 예를 들어 본원 실시예에 기재된 바와 같은 열 용융 검정법을 사용하여 평가할 때 상응하는 천연 또는 야생형 코로나바이러스 단백질 서열(또는 그의 천연 발생 변이체)보다 적어도 12시간 더 오래 지속되는 돌연변이된 코로나바이러스 단백질 서열을 지칭한다. 특정 예에서, 돌연변이된 코로나바이러스 단백질 서열은 상응하는 천연 또는 야생형 코로나바이러스 단백질 서열의 지속성과 비교하여 적어도 24시간, 36시간, 48시간, 72시간, 7일, 8일, 9일, 10일, 2주, 1개월, 2개월, 3개월, 4개월, 5개월, 6개월, 9개월, 1년, 2년 이상 동안 세포, 용액 또는 제형에서 지속된다. 일부 구현예에서, 더 높은 발현 수준은 또한 폴리펩타이드의 향상된 안정성을 나타내거나 그 결과일 수 있다.

본원에서 사용되는 용어 "증가된 수율" 또는 "향상된 수율"은 동일한 성장 및 단리 조건 하에서 동일한 세포 시스템으로부터 회수된 천연 또는 야생형 단백질(또는 그의 천연 발생 변이체)의 양과 비교하여, 단백질이 생성되는 세포 시스템으로부터 회수된 돌연변이된 코로나바이러스 단백질의 양이 적어도 10% 증가함을 지칭하다. 특정 구현예에서, "향상된 수율"은 동일한 성장 조건 하에서 동일한 세포 시스템으로부터 회수된 천연 또는 야생형 단백질의 양과 비교하여, 단백질이 생성되는 세포 시스템으로부터 회수된 돌연변이된 코로나바이러스 단백질이 적어도 20%, 적어도 30%, 적어도 50%, 적어도 75%, 적어도 90%, 적어도 1배, 적어도 2배, 적어도 5배, 적어도 10배, 적어도 100배 이상 증가함을 지칭한다.

본원에서 사용되는 용어 "캐비티 채움 돌연변이"는 성숙한 코로나바이러스 스파이크 단백질의 내부 캐비티를 "채울" 것으로 예상되는 아미노산에 의해 야생형 코로나바이러스 스파이크 단백질의 아미노산 잔기가 치환됨을 지칭한다. 예를 들어, 치환된 아미노산은 캐비티 내로 돌출하여 캐비티 크기를 입체적으로 감소시키고/시키거나 캐비티 또는 포켓 내의 동족 리간드 결합을 저해하는 적절한 크기 또는 전하를 가진다.

본원에서 사용되는 용어 "아쥬반트"는 백신 항원과 함께 투여될 때 백신 항원에 대한 면역 반응을 향상시키는 단백질 또는 화학물질을 지칭한다. 아쥬반트는 면역원 또는 항원에 화학적으로 커플링되지 않기 때문에 항원 모이어티 또는 운반체 단백질과는 구별된다. 아쥬반트는 당업계에 잘 알려져 있으며, 예를 들어 프로인드 완전 또는 프로인드 불완전 아쥬반트(Freund, Adv. Tuberc. Res. 7:130 (1956); Calbiochem, San Diego Calif.), 알루미늄 염, 특히 수산화알루미늄 또는 ALHYDROGEL™(미국 식품의약국에서 인체에 대한 사용을 허가함), 무라밀 디펩타이드(MDP) 및 그의 동족체, 예컨대 [Thrl]-MDP(Byers and Allison, Vaccine 5:223 (1987)), 모노포스포릴 지질 A(Johnson 등, Rev. Infect. Dis. 9:S512(1987)) 등을 포함한다.

본원에서 용어 "포함하는"은 제공된 정의된 구성요소 외에 다른 구성요소도 존재할 수 있음을 의미하다. "포함하는"의 사용은 제한이 아니라 포함을 나타낸다.

본원에서 사용되는 용어 "로 본질적으로 이루어지는"은 주어진 구현예에 필요한 구성요소를 지칭한다. 이 용어는 본 발명의 해당 구현예의 기본적이고 신규하거나 기능적인 특징(들)에 실질적으로 영향을 끼치지 않는 추가적인 구성요소가 존재하는것을 허용한다.

용어 "로 이루어지는"은 본원에 기재된 조성물, 방법 및 이들 각각의 성분이 구현예의 설명에 언급되지 않은 임의의 구성요소를 배제함을 지칭한다.

또한, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함하고 복수 용어는 단수를 포함한다.

작업 실시예 이외에서 또는 달리 지시된 경우를 제외하고, 본원에 사용된 성분의 양 또는 반응 조건을 표기하는 모든 숫자는 모든 경우에 용어 "약"으로 수식되는 것으로 이해해야 하다. 용어 "약"이 백분율과 관련하여 사용되는 경우에는 ±1%를 의미할 수 있다.

코로나바이러스

코로나바이러스는 열, 호흡기 문제 및 때로는 위장 증상을 유발할 수 있는 수백가지 바이러스 중 한 과이다. 코로나바이러스 질병 2019(COVID-19)를 유발하는 바이러스인 SARS-CoV-2는 인간을 감염시키는 것으로 알려진 이 과의 7가지 구성원 중 하나이며, 지난 30년 동안 동물에서 인간으로 확산된 세 번째 바이러스이다. 인간을 감염시키는 것으로 알려진 다른 코로나바이러스에는 알파코로나바이러스 229E 및 NL63, 및 베타코로나바이러스 OC43, HKU1, SARS-CoV(중증 급성 호흡기 증후군 또는 SARS를 유발하는 코로나바이러스) 및 MERS-CoV(중동 호흡기 증후군 또는 MERS을 유발하는 코로나바이러스)가 포함된다.

본원에 기재된 방법 및 조성물이 인간을 감염시키는 코로나바이러스와 관련하여 논의되지만, 본원에 기재된 방법 및 조성물은 또한 애완동물 또는 가축(예를 들어, 돼지, 소, 개 등)을 포함한 다른 포유류를 감염시키는 바이러스로부터 안정한 코로나바이러스 단백질을 발생시키기 위해 사용될 수 있다. 이러한 바이러스에는 돼지 전염성 위장염 바이러스, 돼지 호흡기 코로나바이러스, 돼지 유행성 설사 바이러스(PEDV), 돼지 혈구응집성 뇌척수염 바이러스, 돼지 델타코로나바이러스(PDCoV), 소 코로나바이러스(BCV), 고양이 코로나바이러스(FCoV), 개 코로나바이러스(CCoV), 조류 전염성 기관지염 바이러스(IBV) 및 칠면조 코로나바이러스(TCV)가 포함되지만 이에 국한되지 않는다. 또한, 본원에 기재된 코로나바이러스에는 현재 알려진 것과 나중에 발견되는 것이 포함된다. 진행 중이거나 미래의 전염병 또는 판데믹의 원인이 되는 코로나바이러스가 본원에서 구체적으로 고려된다.

본원에서 사용되는 용어 "코로나바이러스"는 포지티브-센스 단일가닥 RNA 게놈 및 나선 대칭을 가지는 외피 바이러스를 지칭하다. 코로나바이러스의 게놈 크기는 약 27 내지 32킬로베이스 범위이고, 이러한 크기는 임의의 알려진 RNA 바이러스 중 가장 긴 크기이다. 큰 스파이크(S) 당단백질은 바이러스 입자 밖으로 돌출되어, 전자 현미경으로 시각화할 때 코로나바이러스가 독특한 코로나와 같은 모양을 가지도록 한다. 코로나바이러스는 개, 고양이, 돼지, 쥣과, 소, 조류 및 인간을 포함한 다양한 종을 감염시킨다(Holmes, 등, 1996. Coronaviridae: the viruses and their replication, p. 1075-1094. In D. M. K. a. P. M. H. B. N. Fields (ed.), Fields Virology. Lippincott-Raven, Philadelphia, Pa.). 그러나 각 코로나바이러스 변종의 천연 숙주 범위는 좁고, 전형적으로 단일 종으로 이루어진다.

코로나바이러스는 전형적으로 스파이크-수용체 상호작용을 통해 표적 세포에 결합하고, 수용체 매개된 세포내이입 또는 원형질 막과의 융합에 의해 세포에 유입된다(Holmes, 등, 1996, 상동). 스파이크-수용체 상호작용은 그룹 1 및 그룹 2 코로나바이러스 둘 모두에 대해 입증된 바와 같이 강력한 종 특이성 결정인자이다. SARS-CoV 게놈은 단일가닥 (+)-센스 RNA를 함유한다. SARS 코로나바이러스 Urbani(GenBank 수탁번호 AY278741), SARS 코로나바이러스 Tor2(GenBank 수탁번호 AY274119), SARS 코로나바이러스 CUHK-W1(GenBank 수탁번호 AY278554), SARS-CoV Shanghai LY(GenBank 수탁번호 H012999; GenBank 수탁번호 AY322205); GenBank 수탁번호 AY322206), SARS-CoV Shanghai QXC(GenBank 수탁번호 AH013000; GenBank 수탁번호 AY322208; GenBank 수탁번호 AY322197; GenBank 수탁번호 AY322199) 및 SARS-CoV ZJ-HZ01(GenBank 수탁번호 AY322206), g│31416292│gb│AY278487.3│ SARS 코로나바이러스 BJ02,gi│30248028│gb│AY274119.3│ SARS 코로나바이러스 TOR2, gi│30698326│gb│AY291451.1│ SARS 코로나바이러스 TW1, gi│33115118│gb│AY323977.2│SARS 코로나바이러스 HSR 1, gi│35396382│gb│AY394850.1│ SARS 코로나바이러스 WHU, gi│33411459│dbj│AP006561.1│ SARS 코로나바이러스 TWY, gi│33411444│dbj│AP006560.1│ SARS 코로나바이러스 TWS, gi│33411429│dbj│AP006559.1│ SARS 코로나바이러스 TWK, gi│33411414│dbj│AP006558.1│ SARS 코로나바이러스 TWJ, gi│33411399│dbj│AP006557.1│ SARS 코로나바이러스 TWH, gi│30023963│gb│AY278491.2│ SARS 코로나바이러스 HKU-39849, gi│33578015│gb│AY310120.1│ SARS 코로나바이러스 FRA, gi│33518725│gb│AY362699.1│ SARS 코로나바이러스 TWC3, gi│33518724│gb│AY362698.1│ SARS 코로나바이러스 TWC2, gi│30027617│gb│AY278741.1│ SARS 코로나바이러스 Urbani, gi│31873092│gb│AY321118.1│SARS 코로나바이러스 TWC, gi│33304219│gb│AY351680.1│ SARS 코로나바이러스 ZMY 1, gi│31416305│gb│AY278490.3│ SARS 코로나바이러스 BJ03, gi│30910859│gb│AY297028.1│ SARS 코로나바이러스 ZJ01, gi│30421451│gb│AY282752.1│ SARS 코로나바이러스 CUHK-Su10, gi│34482146│gb│AY304495.1│ SARS 코로나바이러스 GZ50, gi│34482139│gb│AY304488.1│ SARS 코로나바이러스 SZ16, gi│34482137│gb│AY304486.1│ SARS 코로나바이러스 SZ3, gi│30027610│gb│AY278554.2│ SARS 코로나바이러스 CUHK-W1, gi│31416306│gb│AY279354.2│ SARS 코로나바이러스 BJ04, gi│37576845│gb│AY427439.1│ SARS 코로나바이러스 AS, gi│37361915│gb│AY283798.2│ SARS 코로나바이러스 Sin2774, gi│31416290│gb│AY278489.2│ SARS 코로나바이러스 GD01, gi│30468042│gb│AY283794.1│ SARS 코로나바이러스 Sin2500, gi│30468043│gb│AY283795.1│ SARS 코로나바이러스 Sin2677, gi│30468044│gb│AY283796.1│ SARS 코로나바이러스 Sin2679, gi│30468045│gb│AY283797.1│ SARS 코로나바이러스 Sin2748, gi│31982987│gb│AY286320.2│ SARS 코로나바이러스 단리물 ZJ-HZ01, gi│30275666│gb│AY278488.2│ SARS 코로나바이러스 BJ01를 포함한 여러 SARS 코로나바이러스 단리물의 전체 및 부분 게놈 서열이 보고되었다.

S(스파이크) 단백질은 비공유적으로 연결된 동종삼량체(올리고머)를 형성할 수 있으며, 이는 수용체 결합 및 바이러스 감염을 매개할 수 있다. S 단백질의 동종삼량체는 수용체 결합 도메인의 올바른 천연 구조형태를 제공하기 위해 그리고 중화 항체 반응을 유도하기 위해 필요할 수 있다. 또한, S 단백질의 세포내 처리는 유의한 번역 후 올리고당 변형과 연관된다. N-글리칸 모티프 분석에 의해 예상되는 번역 후 올리고당 변형(글리코실화)은 S 단백질이 이러한 변형을 위해 23개 부위 만큼을 가짐을 나타낸다. 또한, C-말단 시스테인 잔기는 단백질 절첩 및 천연(기능적) S 단백질 구조형태 보존에 참여할 수 있다. 일부 코로나바이러스의 S 단백질 (예를 들어, 그룹 II 및 III 바이러스의 일부 변종)은 골지체에서 트립신 유사 프로테아제에 의해 또는 세포 외부에 편재된 효소에 의해 S 단백질 중심 부근에서 단백질 가수분해 처리되어, N-말단 SI 및 C-말단 S2 폴리펩타이드를 함유하는 연결된 폴리펩타이드가 될 수 있다. 코로나바이러스의 유형 II 그룹 및 유형 I 바이러스의 일부 구성원은 이와 같이 처리되지 않을 수 있다.

진단: 대상체, 예를 들어 인간은 진단 테스트 결과에 기반하여 코로나바이러스에 감염된 것으로 진단된다. 대상체는 발열, 오한, 기침, 숨가쁨/호흡곤란, 피로, 근육/몸살, 두통, 새로운 미각 또는 후각 상실, 인후염, 울혈 또는 콧물, 메스꺼움, 구토 또는 설사와 같은 하나 이상의 발현 증상에 기반하여 코로나바이러스 감염(예를 들어, COVID-19, SARS, MERS 등)된 것으로 의심할 수 있다. 그러나, 특정 대상체는 무증상 감염(예를 들어, SARS-CoV-2 감염)될 수 있으므로 코로나바이러스 감염 대상체와 접촉했을 때에는 코로나바이러스 감염된 것으로 의심한다. 두 경우 모두에서 활성 코로나바이러스 감염은 대상체로부터 채취한 샘플에서 바이러스 항원과 바이러스 핵산 중 하나 이상을 검출하는 당업계에 알려진 방법을 사용하여 확인할 수 있다. 예를 들면 바이러스 RNA를 검출하기 위해 비인두 면봉 또는 가래로부터 역전사 중합효소 연쇄 반응(RT-PCR) 진단 검정법 사용을 포함한다. 다른 핵산 증폭 방법, 예를 들어 임의의 다수의 등온 증폭 방법도 사용될 수 있고, RT-PCR 민감도와 설사 동일하지는 않더라도 근접한 민감도를 가진다. 등온 증폭 방법은 증폭된 산물을 발생시키기 위해 열 순환기를 필요로 하지 않는 장점이 있으며, 결과를 보다 신속하게 매우 민감한 방식으로 제공할 수 있다. 또 다른 구현예에서, 활성 코로나바이러스 감염은 대상체로부터 얻은 생물학적 샘플에서 하나 이상의 코로나바이러스 폴리펩타이드(예를 들어 항원)를 검출함으로써 결정될 수 있다. 바이러스 항원에 대한 측방 유동 분석(lateral flow assay)은 정성적 진단 결과를 제공할 수 있고 때로는 정량적 진단 결과를 제공할 수 있다. 바이러스 폴리펩타이드는 또한 웨스턴 블롯과 같은 당업계에 알려진 다른 방법으로 검출될 수 있다.

코로나바이러스 항체 존재의 평가는 대상체가 과거에 코로나바이러스에 노출되었는지 여부를 결정하기 위해 사용되거나 또는 대안적으로는 백신 유효성(즉, 돌연변이된 스파이크 단백질이 면역 반응을 유발하는 능력)을 모니터링하는 수단으로 사용될 수 있다. 코로나바이러스 항체 존재의 평가 방법은 당업계에 알려져 있으며 본원에서는 자세히 논의하지 않는다.

대안적으로, 코로나바이러스 비리온의 존재 또는 생산은 예를 들어 전자현미경을 사용하여 직접적으로 또는 간접적으로 결정될 수 있다.

단백질 서열: 천연 또는 야생형 SARS-CoV-2 S 단백질, 서브유닛 1의 아미노산 서열은 다음과 같다:

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAA (서열번호 1).

명세서 전반에 걸쳐, 서열번호 1은 당업계에 공지된 정렬 프로그램(예를 들어, Blast-p)을 이용하여 다른 코로나바이러스 아미노산 서열이 정렬될 수 있는 기준이 되는 '기본' 또는 '참조' 서열로 이용된다. 다른(또는 제2) 코로나바이러스 서열의 스파이크 단백질 서열과 서열번호 1의 SARS-CoV-2 스파이크 단백질 서열의 정렬은 본원에 기재된 안정화를 달성하기 위해 주어진 아미노산 돌연변이 또는 돌연변이들이 도입되는 다른(또는 제2) 코로나바이러스의 해당 부위를 결정하기 위해 사용될 수 있다. 일 구현예에서, 상이한 코로나바이러스 서열은 Blast-p를 이용하여 서열번호 1에 대해 정렬된다(Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) "Basic local alignment search tool." J. Mol. Biol. 215:403-410). 한 구현예에서, 이용된 Blast-p 프로그램은 미국 국립생물정보센터(NCBI) 온라인 정렬 도구이다. 대안적으로, Blast-p 프로그램은 장치에 다운로드하여 로컬에서 사용할 수 있다. 당업자는 Blast-p 정렬 도구의 사용을 쉽게 이해할 것이지만, 의심의 여지를 피하기 위해 온라인 및 다운로드된 정렬 도구에 대한 프로토콜 1 및 프로토콜 2 각각이 여기에 제공된다.

1. 다음 설정을 사용하여 BLAST 정렬을 설정한다.

"둘 이상의 서열을 정렬하시오" 옵션을 이용한다.

관련 SARS-CoV-2 단백질에 대한 참조 변종 서열(즉, 서열번호 1)을 "쿼리 서열을 입력하시오" 섹션에 입력한다.

임의의 상응하는 코로나바이러스 스파이크 단백질 서열을 "해당 서열을 입력하시오" 섹션에 입력한다.

알고리즘: blastp(단백질-단백질 BLAST)

기대 임계값: 0.1

단어 크기: 6

쿼리 범위의 최대 일치항목: 0

매트릭스: BLOSUM62

갭 비용:

존재: 11

확대: 1

복잡도가 낮은 영역을 필터링합니까?: 아니요

마스크:

표만 검색합니까?: 아니요

소문자? : 아니요

2. "BLAST" 버튼을 클릭하여 분석을 실행한다.

3. 두 서열 간의 정렬을 표시하기 위해 "정렬" 탭을 클릭한다.

4. 관심 있는 각 서열 위치에 대해 "쿼리" 서열에 따른 번호를 확인한다. 그 다음, "쿼리" 서열의 위치와 정렬된 "Sbjt" 서열에서의 상응하는 잔기 위치를 확인한다.

1. 제조업체 지침을 사용하여 명령줄 실행을 위해 BLAST를 설치하거나 이미 설치된 컴퓨터 또는 서버를 확인한다.

2. SARS-CoV-2 단백질(즉, 서열번호 1)에 대해 원하는 하위유형별 참조 변종을 함유하는 파일을 FASTA 형식으로 생성한다. 아래 명령에서 이 파일을 "query.fasta"라고 명명한다.

3. 동일한 하위유형과는 상이한 코로나바이러스의 상응하는 단백질 서열을 함유하는 두 번째 파일을 FASTA 형식으로 생성한다. 아래 명령에서 이 파일을 "sbjct.fasta"라고 명명한다.

blastp -query query.fasta -subject sbjct.fasta -matrix BLOSUM62 -evalue 0.1 -

word size 6 -gapopen 11 -gapextend 1 -out results.txt

5. results.txt를 열고 두 서열의 정렬을 보여주는 섹션을 본다. 관심 있는 각 서열 위치에 대해 "쿼리" 서열에 따른 번호를 확인한다. 그 다음, "쿼리" 서열의 위치와 정렬된 "Sbjct" 서열에서 상응하는 잔기 위치를 확인한다.

쿼리 서열과 참조 서열(예를 들어, 서열번호 1) 사이의 서열 동일성을 확인하기 위해 다른 단백질 정렬 도구(예를 들어, Clustalw 또는 Clustal-omega)가 또한 사용될 수 있다는 것이 당업자에게 명백할 것이다. 쿼리 서열과 참조 서열이 유의한 서열 동일성을 공유하는 점을 고려할 때, 다른 단백질 정렬 도구가 본원에 기재된 프로토콜을 이용하는 Blast-p와 동일한 결과는 아니더라도 유사한 결과를 생성할 것으로 예상된다. 본원에 기재된 프로토콜은 이러한 목적에 정확하고 효과적인 것으로 나타났고, 쿼리 서열에서 돌연변이될 아미노산 잔기의 확인에 있어 당업자를 돕기 위해 본원에 제공된다.

수용체 결합 도메인(RBD) 폴리펩타이드

바이러스 표면의 "스파이크" 단백질은 코로나바이러스가 숙주 세포로 유입되는 것을 매개한다. SARS-CoV 및 SARS-CoV-2의 스파이크 단백질 각각에는 안지오텐신 전환 효소-2(ACE2)를 수용체로 특이적으로 인식하는 수용체 결합 도메인이 함유된다. 바이러스 흡수 및 기능에서 이 도메인의 중요성을 고려할 때, 수용체 결합 도메인은 인간을 감염시키는 것으로 알려진 코로나바이러스 중에서 상대적으로 잘 보존된다. SARS-CoV-2의 스파이크 단백질에 대한 수용체 결합 도메인의 서열은 다음과 같다:

RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKK (서열번호 2).

명세서 전반에 걸쳐, 서열번호 2는 당업계에 공지된 정렬 프로그램(예를 들어, Blast-p, ClustalW 등)을 이용하여 다른 코로나바이러스 RBD 서열이 정렬될 수 있는 기준이 되는 '기본' 또는 '참조' 수용체 결합 도메인 서열로 이용된다. 적어도 제2 코로나바이러스 RBD 서열과 서열번호 2의 정렬은 SARS-CoV-2에서 주어진 아미노산 돌연변이에 대한 제2 코로나바이러스 RBD 서열에서 상응하는 부위를 결정하기 위해 이용될 수 있다. 이러한 구현예에서 Blast-p는 본원에 기재된 프로토콜 1 또는 프로토콜 2를 이용하여 서열번호 2와 코로나바이러스 RBD 쿼리 서열을 정렬하기 위해 이용될 수 있다. 수용체 결합 도메인 폴리펩타이드는 서열번호 2(또는 상이한 코로나바이러스에 대한 등가물) 내에 적어도 2개의 돌연변이를 포함한다. 일부 구현예에서, 수용체 결합 도메인 폴리펩타이드는 추가 돌연변이를 포함할 수 있다. 이 추가 돌연변이는 RBD 영역에 있을 수도 있거나 RBD 영역 외부에서 발생할 수 있다. 전형적으로, 적어도 1개, 2개 이상의 아미노산 돌연변이는 주어진 코로나바이러스 서열의 천연 발생 변이체에서 발견되는 돌연변이를 함유하지 않는다. 예를 들어, SARS-CoV-2의 천연 발생 변이체에 존재하는 L452R 및 E484K는 본원에 기재된 바와 같은 적어도 1개, 2개 이상의 아미노산 돌연변이로 계산되지 않는다.

일부 구현예에서, 본원에 기재된 수용체 결합 도메인 폴리펩타이드는 1개 이상의 코로나바이러스에 대한 단백질 백신의 생성에 이용된다. 당업자가 이해하는 바와 같이 특히 백신 설정에 이용될 때, 돌연변이된 코로나바이러스 단백질은 동족 수용체에 대한 수용체 결합 특성을 반드시 보유할 필요는 없다; 따라서 적어도 1개의 아미노산 돌연변이 또는 적어도 2개의 아미노산 돌연변이는 RBD의 기능을 보유하도록 설계될 필요가 없다. 코로나바이러스 단백질 기능의 유지가 필요하지 않다는 점을 감안할 때, 서열번호 1 또는 서열번호 2와 적어도 90% 동일성을 갖는 코로나바이러스 단백질이 코로나바이러스 항원으로 작용하는 능력(즉, 대상체에서 코로나바이러스 결합 항체의 생산을 자극하거나 상응하는 야생형 코로나바이러스를 표적으로 하는 코로나바이러스 항체를 결합시킴)을 보유한다면 본원에서 구체적으로 고려된다(예를 들어, 서열번호 1 또는 2에 적어도 95%, 적어도 99% 동일성). 즉, 본원에 기재된 수용체 결합 도메인 폴리펩타이드는 "면역원성"이다. 즉, 수용체 결합 도메인 폴리펩타이드(선택적으로 적절한 지지체(예를 들어, 단백질, 지질 또는 폴리펩타이드)에 결합됨)에 의한 대상체 면역화는 RBD 폴리펩타이드를 표적으로 하는 (B 세포 유형 및/또는 T 세포 유형의) 면역 반응을 유도한다.

용어 "에피토프"는 항원과 같은 분자 내의 항원 결정인자, 즉 특히 MHC 분자와 관련하여 제공될 때 면역 시스템에 의해 인식되는, 예를 들어 T 세포 또는 B 세포에 의해 인식되는 분자의 일부 또는 단편을 지칭한다. 단백질 항원의 에피토프는 상기 단백질의 연속적 또는 불연속적 부분을 포함할 수 있고, 5 내지 100개, 5 내지 50개, 8 내지 30개, 10 내지 25개 아미노산 길이를 가질 수 있고, 예를 들어 에피토프는 바람직하게 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개 아미노산 길이를 가질 수 있다.

면역 반응을 일으키는 단백질 능력은 부분적으로는 그의 이차 구조 및 단백질이 절첩된 구조형태에 기인할 수 있다. 일부 구현예에서, 특정 구조형태가 항원 반응을 생성하기 위해 및/또는 단백질의 안정성을 증진시키기 위해 바람직하다. ACE2 수용체에 결합된 SARS-CoV-2의 이차 구조는 Shang 등 "Structural Basis of Receptor Recognition by SARS-CoV-2" Nature 581:221-224 (2020)에 기재되어 있고, 상기 문헌의 내용은 본원에 전체적으로 참고문헌으로 포함된다. SARS-CoV-2의 결정 구조에 대한 지식을 기반으로, 당업자는 주어진 수용체 결합 도메인 폴리펩타이드가 대상체에서 면역 반응을 유발할 형상 또는 이차 구조를 포함할 가능성이 있는지 여부를 결정하기 위해 교육받은 추론 또는 전산 소프트웨어를 이용할 수 있다.

특정 구현예에서, 적어도 2개의 아미노산이 코로나바이러스 수용체 결합 도메인에서 돌연변이되어, 상응하는 야생형 단백질과 비교하여 세포 시스템 내 단백질 수율을 향상시키고/시키거나 세포, 용액 또는 제형 내 코로나바이러스 단백질의 안정성을 향상시킨다. 다른 구현예에서, 적어도 1개의 아미노산이 코로나바이러스 수용체 결합 도메인에서 돌연변이되어, 상응하는 야생형 단백질과 비교하여 세포 시스템 내 단백질 수율을 향상시키고/시키거나 세포, 용액 또는 제형 내 코로나바이러스 단백질의 안정성을 향상시킨다.

일부 구현예에서, 적어도 2개의 돌연변이는 스파이크 단백질의 RBD 영역(서열번호 2 또는 서열번호 1의 328-531 잔기) 내에 도입된다. 일부 구현예에서, 적어도 1개의 아미노산 돌연변이는 스파이크 단백질의 RBD 영역 내에 도입된다.

특정 구현예에서, 적어도 2개의 돌연변이는 서열번호 1의 아미노산 잔기: 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 또는 338, 358, 363 및 365에 있거나 Blast-p를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있다.

특정 구현예에서, 적어도 1개의 아미노산 돌연변이는 아미노산 잔기: 338, 358, 363, 365, 367, 377, 392, 395; 498, 501, 502, 513 또는 515에 있다. 다른 구현예에서, 적어도 1개의 아미노산 돌연변이는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I L513M 또는 F515L이다.

특정 구현예에서, 적어도 2개의 돌연변이는 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 Blast-p를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스의 상응하는 잔기에 있다.

한 구현예에서, 수용체 결합 도메인 폴리펩타이드는 융합 단백질을 포함한다.

리놀레산 결합 포켓

SARS-CoV-2 "S"(스파이크) 단백질은 리놀레산 결합 포켓으로 최근 결정된 "포켓" 또는 "캐비티"를 포함하는 것으로 보여졌다(Toelzer 등 Science "Free fatty acid binding pocket in the locked structure of SARS-CoV-2 spike protein" (2020)). 리놀레산 결합 포켓 내 잔기는 인간을 감염시키는 7가지 모든 코로나바이러스에서 보존되어(Toelzer, 상동), 이 캐비티가 기능적으로 보존됨을 나타낸다. 또한 Toelzer 등은 SARS-CoV-2 S 단백질에 대한 리놀레산 결합이 S 단백질의 닫힌 구조형태를 안정화함을 나타낸다. 리놀레산 결합 포켓 또는 리놀레산 결합 포켓의 하위도메인 내의 돌연변이는 리놀레산 영향을 모방하고/하거나 S 단백질의 닫힌 구조형태를 안정화하기 위해 이용될 수 있는 것으로 본원에서 고려된다. 일부 구현예에서, 이 영역 내 아미노산 돌연변이는 '캐비티 채움' 돌연변이이다.

한 구현예에서, 본원에서 사용되는 용어인 "캐비티 채움 돌연변이"는 리놀레산 결합 포켓 내 부위를 채운다(예를 들어, 캐비티 내로 입체적으로 돌출됨). 천연 코로나바이러스 스파이크 단백질 내 캐비티는 당업계에 알려진 방법에 의해, 예를 들어 SARS-CoV-2의 스파이크 단백질의 결정 구조를 나타내는 육안 검사에 의해(예를 들어, Shang 등 "Structural Basis of Receptor Recognition by SARS-CoV-2" Nature 581:221-224 (2020) 참조) 또는 전산 단백질 설계 소프트웨어 이용에 의해(특히 예를 들어, BioLuminate™(BioLuminate, Schrodinger LLC, New York), Discovery Studio™(Discovery Studio Modeling Environment, Accelrys, San Diego), MOE™(Molecular Operating Environment, Chemical Computing Group Inc., Montreal) 및 Rosetta™(Rosetta, University of Washington, Seattle,)) 확인될 수 있다. 이러한 모델은 당업자가 주어진 코로나바이러스 스파이크 단백질의 안정성을 증진시킬 것으로 예상되는 캐비티 채움 돌연변이를 설계할 수 있게 한다.

캐비티 채움 돌연변이에서 대체될 아미노산은 작은 지방족(예: Gly, Ala 및 Val) 또는 작은 극성 아미노산(예: Ser 및 Thr)을 함유할 수 있으며, 이들은 입체적으로 더 크고 캐비티를 "채울" 수 있는 유사한 아미노산(예: 큰 지방족 아미노산(Ile, Leu 및 Met) 또는 큰 방향족 아미노산(His, Phe, Tyr 및 Trp))으로 대체된다. 다른 구현예에서, 하전된 아미노산이 하전되지 않은 아미노산을 대체하거나 하전되지 않은 아미노산으로 대체되어, 단백질 및 캐비티의 이차 구조를 변경시킬 수 있다. 대체를 위한 이러한 잔기는 또한 주어진 단백질 구조형태에 매립되지만 제2 구조형태에서 용매에 노출되는 아미노산을 함유할 수 있다.

특정 구현예에서, SARS-CoV-2 스파이크 단백질 내 적어도 2개의 돌연변이 중 적어도 1개는 리놀레산 결합 포켓에 관련된 잔기에 있다. 일부 구현예에서, 돌연변이가 리놀레산 결합 포켓을 "채우는" 것이 바람직하다(예를 들어, 유사한 전하 또는 소수성을 가지는 더 큰 아미노산을 사용함). 이러한 돌연변이는 상응하는 야생형 코로나바이러스와 비교할 때 단백질의 특정 구조형태를 안정화하고/하거나 단백질의 분해 속도를 감소시킬 수 있다. 참조 용이를 위해, 리놀레산 결합에 관련된 잔기는 본원에서 3개 하위도메인으로 구분된다. 이들 하위도메인은 단순히 리놀레산 결합에 관련된 여러 잔기의 가까운 근접성을 기반으로 한다.

비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드는 적어도 1개의 캐비티 채움 돌연변이 또는 리놀레산 결합 포켓 내 잔기의 돌연변이 및 본원에서 사용되는 용어인 폴리펩타이드의 안정성 및/또는 수율을 함께 향상시키는 적어도 1개의 추가 돌연변이를 포함할 수 있다.

일부 구현예에서, 캐비티 채움 돌연변이는 336, 338, 341, 342, 358, 361, 363, 365, 368, 374, 377, 387 또는 392 아미노산에서 서열번호 1의 잔기의 돌연변이를 포함하거나 Blast-p를 이용하여 제2 코로나바이러스(또는 그의 천연 발생 변이체)의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1(또는 그의 천연 발생 변이체)의 상응하는 잔기의 돌연변이를 포함한다. 다른 구현예에서, 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이는 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 잔기에 있거나 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있다.

일부 구현예에서, 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이는 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M으로 이루어진 군으로부터 선택되거나 또는 Blast-p(예를 들어, 본원에 기재된 바와 같은 프로토콜 1 또는 2)를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기로부터 선택된다.

본원에 기재된 바와 같은 캐비티 채움 돌연변이를 갖고 서열번호 1 또는 서열번호 2에 대해 적어도 90% 동일성을 추가로 갖는 코로나바이러스 스파이크 단백질이 코로나바이러스에 대한 항원으로 작용할 수 있는 능력(즉, 대상체에서 코로나바이러스 항체 생성을 자극함)을 보유한다면 본원에서 구체적으로 고려된다(예를 들어, 서열번호 1 또는 2와 적어도 95%, 적어도 99% 동일성). 즉, 본원에 기재된 비천연 발생 코로나바이러스 스파이크 단백질 폴리펩타이드는 "면역원성"이어서, 즉 폴리펩타이드(선택적으로 적절한 지지체(예: 단백질, 지질 또는 폴리펩타이드)에 결합된)에 의한 대상체 면역화는 폴리펩타이드를 표적으로 하는 (B 세포 유형 및/또는 T 세포 유형의) 면역 반응을 유도한다.

본원에 기재된 바와 같은 RBD 폴리펩타이드 또는 스파이크 폴리펩타이드는 코로나바이러스의 공지된 변이체로부터 1개 이상의 아미노산 치환을 가질 수 있다. 비제한적인 예로서, 폴리펩타이드는 L18F, T20N, P26S, 69-70 잔기 결실, D80A, D138Y, R190S, D215G, K417N, K417T, G446S, L452R, Y453F, T478I, E484K, S494P, N501Y, A570D, D614G, H655Y, P681H, A701V 및 T716L로 이루어진 군으로부터 선택되는, 서열번호 1에 대한 1, 2, 3, 4, 5, 6, 7 또는 모든 8개 위치를 포함할 수 있다. 폴리펩타이드는 하기 천연 발생 돌연변이 또는 돌연변이들의 조합 중 하나를 포함할 수 있다:

69-70 잔기 중 하나 또는 둘 모두, A570D, D614G, P681H 및/또는 T716L의 1, 2, 3, 4 또는 5개 결실을 선택적으로 더 포함하는 501Y(영국 변이체);

L18F, D80A, D215G, D614G 및/또는 A701V 중 1, 2, 3, 4 또는 5개를 선택적으로 더 포함하는 K417N/E484K/N501Y(남아프리카 변이체);

L18F, T20N, P26S, D138Y, R190S, D614G 및/또는 H655Y 중 1, 2, 3, 4 또는 5개를 선택적으로 더 포함하는 K417N 또는 T/E484K/N501Y(브라질 변이체); 또는

L452R (로스앤젤레스 변이체).

일부 구현예에서, 본원에 개시된 바와 같은 폴리펩타이드는 서열번호 4 또는 서열번호 5의 폴리펩타이드 서열을 포함한다.

RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADFSVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTYGVGYQPYRVVVLSFELLHAPATVCGPKK (서열번호 4)

RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADFSVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGNIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVKGFNCYFPLQSYGFQPTYGVGYQPYRVVVLSFELLHAPATVCGPKK (서열번호 5)

아미노산 돌연변이/치환

본원에서는 상응하는 천연 또는 야생형 코로나바이러스 S 단백질과 비교하여 돌연변이된 단백질의 향상된 안정성을 부여하는 적어도 2개의 아미노산 돌연변이 또는 치환을 갖는 돌연변이된 코로나바이러스 S 단백질 또는 그의 수용체 결합 도메인이 제공된다. 본 명세서에는 돌연변이된 SARS-CoV-2 S 단백질 또는 그의 수용체 결합 도메인이 예시되어 있지만, 본원에 기재된 방법 및 조성물은 인간을 감염시키는 코로나바이러스 및 다른 포유류(즉, 박쥐, 소, 돼지 등...)를 감염시키는 코로나바이러스 둘 모두를 포함하는 임의의 코로나바이러스 S 단백질에 적용될 수 있다. 당업자는 또 다른 코로나바이러스의 아미노산 서열을 SARS-CoV-2의 아미노산 서열(즉, 서열번호 1 또는 2)과 정렬시킴으로써 SARS-CoV-2에 대해 본 명세서에 약술된 잔기에 상응하는 잔기를 용이하게 확인할 수 있다.

정렬은 기능에 필요할 가능성이 높은 잔기, 상기 기능은 주어진 잔기 또는 잔기들과 수용체의 직접 접촉이 있는지 여부 또는 예컨대 다른 잔기가 이러한 접촉을 가능하도록 하는 구조형태 유지에 하는 잔기에 관한 지침을 제공할 수 있으며, 후자의 비제한적인 예는 리놀레산 결합 포켓 내부를 라이닝(line)하거나 스파이크 단백질의 주어진 구조형태를 유지하는 데 도움이 될 가능성이 높은 잔기를 포함한다. 예를 들어, 정렬이 2개의 동일하거나 유사한 아미노산을 상응하는 위치에서 보여주는 경우, 해당 부위는 기능적으로 중요할 가능성이 더 높다(즉, 리놀레산 결합 또는 수용체 결합). 변이체 아미노산 서열은 천연 또는 참조 서열, 예를 들어 서열번호 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 이상 동일할 수 있다. 천연 서열과 돌연변이 서열 간 상동성 정도(동일성 백분율)는 예를 들어 이러한 목적을 위해 흔히 사용되며 전세계 웹에서 무료로 이용할 수 있는 컴퓨터 프로그램을 사용하여 두 서열을 비교함으로써 결정될 수 있다. 변이체 아미노산 또는 DNA 서열은 이들이 유래된 서열(본원에서 "원래", "천연" 또는 "야생형" 서열이라고 함)과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 이상이 유사하다. 원래 서열과 돌연변이 서열 간 유사성 정도(유사성 백분율)는 예를 들어 유사성 매트릭스를 사용함으로써 결정할 수 있다. 유사성 매트릭스는 당업계에 잘 알려져 있으며, 유사성 매트릭스를 사용하여 두 서열을 비교하기 위한 많은 도구가 온라인에서 자유롭게 이용 가능하며, 예를 들어 디폴트 매개변수로 설정하거나 본원에 기재된 바와 같은 프로토콜 1 또는 프로토콜 2를 사용하는 BLASTp(http://blast.ncbi.nlm.nih.gov에서 전세계 웹에서 이용 가능함)이 있다.

캐비티 채움 돌연변이가 요망될 때, 주어진 아미노산은 유사한 물리화학적 특징을 갖는 잔기로 대체될 수 있으며, 예를 들어 1개의 지방족 잔기를 또 다른 잔기(또 다른 잔기로서 예를 들어, Ile, Val, Leu 또는 Ala)로 치환하거나 1개의 극성 잔기를 또 다른 잔기로(예를 들어, Lys와 Arg, Glu와 Asp, 또는 Gln과 Asn 사이에서) 치환할 수 있으며, 바람직하게는 더 작은 잔기가 캐비티를 입체적으로 "채우는" 더 큰 잔기로 치환되거나 전하가 변경되어 캐비티 크기 및/또는 구조의 변화를 유도한다. 이러한 다른 치환, 예를 들어 유사한 소수성 특징을 갖는 전체 영역의 치환은 잘 알려져 있고 기능을 보존할 수 있다. 원하는 아미노산 치환을 포함하는 폴리펩타이드는 (i) 천연 또는 참조 폴리펩타이드의 항원 활성이 실질적으로 유지되도록 원하는 구조형태가 유지되는지 또는 (ii) 단백질의 안정성이 향상되는지 확인하기 위해 본원에 기재된 검정법 중 임의의 하나로 테스트될 수 있다.

일부 구현예에서, 아미노산 치환은 보존적 아미노산 치환을 포함할 수 있다. 용어 "보존적 아미노산 치환"은 당업계에 잘 알려져 있으며, 유사한 특징(예를 들어, 유사한 전하 또는 소수성)을 갖는 아미노산으로 특정 아미노산을 치환하는 것과 관련된다. 본원에 기재된 바와 같은 보존적 돌연변이는 아미노산 잔기를, 예를 들어 유사한 전하 또는 소수성을 갖지만 (예를 들어, 캐비티 채움 기능을 제공하기 위해) 크기 또는 부피도가 다른 아미노산 잔기로 치환하는 것을 포함할 수 있다. 예시적인 보존적 아미노산 치환의 목록이 아래 표에 제공된다.

대안적으로, 예를 들어, 천연 코로나바이러스 S 단백질 이차 구조의 유연한 부분의 제거가 요망되는 경우 예를 들어 시스테인 잔기를 추가함으로써 비보존적 아미노산 치환이 바람직할 수 있다(또는 그 반대). "비보존적 치환"은 한 부류의 아미노산을 다른 부류의 아미노산으로 치환하는 것; 예를 들어 Ala를 Asp, Asn, Glu 또는 Gln으로 치환하는 것을 지칭한다. 비보존적 치환의 추가적인 비제한적 예는 이소류신, 발린, 류신, 알라닌, 메티오닌과 같은 비극성(소수성) 아미노산 잔기를 시스테인, 글루타민, 글루탐산 또는 리신과 같은 극성(친수성)잔기로 치환 및/또는 극성 잔기를 비극성 잔기로 치환을 포함한다.

당업자가 이해할 수 있는 바와 같이, 본원에 기재된 바와 같은 돌연변이 코로나바이러스 폴리펩타이드(예를 들어, RBD 폴리펩타이드 또는 안정화된 코로나바이러스 S 폴리펩타이드)는 임의의 원하는 구조형태의 보존적 아미노산 치환과 비보존적 아미노산 치환의 혼합을 가질 수 있다. 본원에 기재된 폴리펩타이드는 당업계에 알려져 있거나 실시예에 기재된 방법을 이용하여 항원 활성, 수용체 결합 도메인 활성 또는 구조형태에 대해 테스트될 수 있다.

시스테인 잔기는 단백질 이차 구조 또는 구조형태에 중요할 수 있다. 시스테인 잔기의 돌연변이는 돌연변이된 단백질의 이차 구조가 예를 들어 그의 동족 수용체(예를 들어, ACE2 수용체)에 대한 결합을 평가하거나, 결정학 또는 EM을 이용하여 이차 구조를 평가하거나 또는 천연 또는 야생형 단백질에 대한 항체에의 결합을 확인함으로써 결정될 때 기능적 및/또는 항원성이라면 본원에서 고려된다. 또한 폴리펩타이드의 적절한 구조형태의 유지에 관여하지 않는 시스테인 잔기도 예를 들어 세린으로 치환되어 분자의 산화 안정성을 개선하고 비정상적인 가교 결합을 방지할 수 있다. 역으로, 안정성을 개선하거나 올리고머화를 용이하게 하기 위해 시스테인 결합(들)이 폴리펩타이드에 첨가될 수 있다.

일부 구현예에서, 본원에 기재된 바와 같은 안정화된 코로나바이러스 S 단백질 또는 RBD 폴리펩타이드는 폴리펩타이드 및/또는 살아있는 유기체에 의해 생성된 단백질, 예를 들어, Ala (A), Val (V), Leu (L), Ile (I), Pro (P), Phe (F), Trp (W), Met (M), Gly (G), Ser (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q), Asp (D), Glu (E), Lys (K), Arg (R) 및 His (H)에서 흔히 발견되는 천연 발생 아미노산을 포함할 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 안정화된 코로나바이러스 S 단백질 또는 RBD 폴리펩타이드는 대안적인 아미노산을 포함할 수 있다. 대안적인 아미노산의 비제한적인 예는 D-아미노산; 베타-아미노산; 호모시스테인, 포스포세린, 포스포트레오닌, 포스포티로신, 히드록시프롤린, 감마-카복시글루타메이트; 히푸르산, 옥타히드로인돌-2-카복실산, 스타틴, l,2,3,4-테트라히드로이소퀴놀린-3-카복실산, 페니실라민(3-메르캅토-D-발린), 오르니틴, 시트룰린, 알파-메틸-알라닌, 파라-벤조일페닐알라닌, 파라-아미노 페닐알라닌, p-플루오로페닐알라닌, 페닐글리신, 프로파길글리신, 사르코신 및 tert-부틸글리신), 디아미노부티르산, 7-히드록시-테트라히드로이소퀴놀린 카복실산, 나프틸알라닌, 비페닐알라닌, 시클로헥실알라닌, 아미노이소부티르산, 노르발린, 노르류신, tert-류신, 테트라히드로이소퀴놀린 카복실산, 피페콜산, 페닐글리신, 호모페닐알라닌, 시클로헥실글리신, 데히드로류신, 2,2-디에틸글리신, 1-아미노-l-시클로펜탄카복실산, 1-아미노-1-시클로헥산카복실산, 아미노-벤조산, 아미노-나프토산, 감마-아미노부티르산, 디플루오로페닐알라닌, 니페코트산, 알파-아미노 부티르산, 티에닐-알라닌, t-부틸글리신, 트리플루오로발린; 헥사플루오로류신; 플루오르화 유사체; 아지드-변형된 아미노산; 알킨-변형된 아미노산; 시아노-변형된 아미노산; 및 그의 유도체를 포함한다.

일부 구현예에서, 폴리펩타이드, 예를 들어 돌연변이체 코로나바이러스 폴리펩타이드는 예를 들어 펩타이드를 함께 구성하는 아미노산 하나 이상에 모이어티를 첨가함으로써 변형될 수 있다. 변형 및/또는 모이어티의 비제한적 예에는 PEG화; 글리코실화; HES화; ELP화; 지질화; 아세틸화; 아미드화; 말단-캡핑 변형; 시아노기; 인산화; 알부민 컨쥬게이션 및 고리화일 수 있다. 주어진 용액(즉, 수성 용액)에서의 가용화를 개선시키는 변형 또는 모이어티가 본원에서 구체적으로 고려된다.

원래 아미노산 서열의 변경은 당업자에게 알려진 임의의 많은 기술에 의해 달성될 수 있다. 돌연변이는 예를 들어 천연 서열의 단편에 결찰을 허용하는 제한 부위 옆에 돌연변이체 서열을 함유하는 올리고뉴클레오티드를 합성함으로써 특정 유전자좌에 핵산 수준으로 도입될 수 있다. 결찰 후, 결과로 수득된 재작제된 서열은 원하는 아미노산 삽입, 치환 또는 결실을 가지는 유사체를 암호화한다. 대안적으로, 올리고뉴클레오티드를 표적으로 하는 부위-특이적 돌연변이유발 절차를 이용하여, 필요한 치환, 결실 또는 삽입에 따라 변경된 특정 코돈을 가지는 변경된 뉴클레오티드 서열을 제공할 수 있다. 이러한 변경을 만드는 기술은 Khudyakov 등 "Artificial DNA: Methods and Applications" CRC Press, 2002; Braman "In Vitro Mutagenesis Protocols" Springer, 2004; 및 Rapley "The Nucleic Acid Protocols Handbook" Springer 2000에 기재된 것을 포함하며, 이 문헌은 그 전체가 본원에 참고문헌으로 포함된다. 일부 구현예에서, 본원에 기재된 바와 같은 폴리펩타이드는 화학적으로 합성될 수 있고 돌연변이는 화학적 합성 과정의 일부로서 포함될 수 있다.

본원에 기재된 돌연변이된 스파이크 단백질 또는 RBC 폴리펩타이드는 재조합 방법 및 화학적 합성을 포함하는 잘 알려진 방법을 이용하여 합성될 수 있다. 폴리펩타이드를 암호화하는 핵산을 포함하는 벡터를 적합한 숙주 세포 내로 도입하여 폴리펩타이드를 생산하는 재조합 방법은 예를 들어 Sambrook 등, Molecular Cloning: A Laboratory Manual, 2d Ed, Vols 1 내지 8, Cold Spring Harbor, NY (1989); M.W. Pennington and B.M. Dunn, Methods in Molecular Biology: Peptide Synthesis Protocols, Vol 35, Humana Press, Totawa, NJ (1994)에 기재된 바와 같이 당업계에 잘 알려져 있으며, 이들 두 문헌의 내용은 본원에 참고문헌으로 포함된다. 펩타이드는 또한 당업계에 잘 알려진 방법을 사용하여 화학적으로 합성될 수 있다. 예를 들어, Merrifield 등, J. Am. Chem. Soc. 85:2149 (1964); Bodanszky, M., Principles of Peptide Synthesis, Springer-Verlag, New York, NY (1984); Kimmerlin, T. and Seebach, D. J. Pept. Res. 65:229-260 (2005); Nilsson 등, Annu. Rev. Biophys. Biomol. Struct. (2005) 34:91-118; W.C. Chan and P.D. White (Eds.) Fmoc Solid Phase Peptide Synthesis: A Practical Approach, Oxford University Press, Cary, NC (2000); N.L. Benoiton, Chemistry of Peptide Synthesis, CRC Press, Boca Raton, FL (2005); J. Jones, Amino Acid and Peptide Synthesis, 2nd Ed, Oxford University Press, Cary, NC (2002); 및 P. Lloyd-Williams, F. Albericio, and E. Giralt, Chemical Approaches to the synthesis of peptides and proteins, CRC Press, Boca Raton, FL (1997)를 참고하며, 이들 모든 문헌의 내용은 본원에 참고문헌으로 포함된다. 펩타이드 유도체는 또한 미국 특허 제4,612,302호; 제4,853,371호 및 제4,684,620호와 미국 특허출원 공개공보 제2009/0263843호에 기재된 바와 같이 제조할 수 있으며, 이들 모든 문헌의 내용은 본원에 참고문헌으로 포함된다.

RBD 폴리펩타이드 또는 돌연변이된 코로나바이러스 S 단백질의 생산 및 정제

본원에서 사용되는 용어인 RBD 폴리펩타이드 또는 돌연변이된 코로나바이러스 S 단백질은 예를 들어 용액 또는 고체상 펩타이드 합성 또는 Dugas 등(1981)에 기재된 바와 같이 통상적인 용액 방법을 통해 커플링된 단백질 단편으로 시작하는 용액 중 반합성(semi-synthesis)에 의해 화학적으로 생산될 수 있다. 그러나, 재조합 방법을 이용하여 본원에 기재된 폴리펩타이드를 합성하는 것이 일반적으로 바람직하다.

본원에 기재된 방법 및 조성물을 사용하여 유용한 폴리펩타이드를 복제 및 발현하기 위한 시스템은 재조합 기술에서 잘 알려져 있으므로 본원에서 상세히 기재하지 않는 다양한 미생물 및 세포를 포함한다. 여기에는 예를 들어 대장균, 바실러스, 스트렙토마이세스 및 사카로마이세스의 다양한 변종뿐만 아니라 포유류, 효모 및 곤충 세포가 포함된다. 본원에 기재된 바와 같은 폴리펩타이드는 필요에 따라 펩타이드 또는 융합 단백질로 생산될 수 있다. 펩타이드 및 폴리펩타이드를 생산하기 위해 적합한 벡터가 알려져 있으며, 사설 및 공공 실험실과 기탁소로부터 그리고 상업적 판매자로부터 입수할 수 있다. 그 다음, 유전자 산물을 발현할 수 있는 수용 세포(recipient cell)가 형질감염된다. 형질감염된 수용 세포는 재조합 유전자 산물의 발현을 허용하는 조건 하에서 배양되고, 배양물로부터 회수된다. 차이니즈 햄스터 난소 세포(CHO) 또는 COS-1 세포와 같은 숙주 포유동물 세포가 이용될 수 있다. 이들 숙주는 우두증(vaccinia) 또는 돈두(swinepox)와 같은 폭스바이러스 발현 벡터와 관련하여 이용될 수 있다. 합성 유전자를 숙주 세포로 운반하도록 조작될 수 있는 적합한 비병원성 바이러스 발현 벡터는 우두증, 아데노바이러스, 레트로바이러스 등과 같은 폭스바이러스 발현 벡터를 포함한다. 다수의 이러한 비병원성 바이러스 발현 벡터는 인간 유전자 요법을 위해 그리고 다른 백신 제제에 대한 운반체로서 흔히 사용되며 당업자가 알고 있고 선택가능하다. 다른 적합한 숙주 세포 및 형질전환, 배양, 증폭, 스크리닝 및 산물 생산 및 정제를 위한 방법의 선택은 공지 기술을 참조하여 당업자에 의해 수행될 수 있다.

일부 구현예에서, 본원에 기재된 바와 같은 합성된 돌연변이 폴리펩타이드를 단리 및/또는 정제하는 것이 바람직할 수 있다. 단백질 정제 기술은 당업자에게 잘 알려져 있으므로 본원에서는 상세히 기재되어 있지 않다. 이러한 기술은 하나의 수준에서 폴리펩타이드 및 비폴리펩타이드 분획에 대해 세포, 조직 또는 기관을 균질화 및 조분획화하는 것을 포함할 수 있다. 돌연변이체 코로나바이러스 스파이크 단백질 또는 수용체 결합 도메인 폴리펩타이드는 크로마토그래피 및 전기영동 기술을 이용하여 추가 정제하여, 부분 또는 완전 정제(또는 균질성까지 정제)를 달성할 수 있다. 순수 펩타이드 또는 폴리펩타이드의 제조에 특히 적합한 분석 방법은 이온 교환 크로마토그래피, 겔 배제 크로마토그래피, 폴리아크릴아미드 겔 전기영동, 친화성 크로마토그래피, 면역친화성 크로마토그래피 및 등전점 전기영동이다. 펩타이드/폴리펩타이드 정제의 특히 효율적인 방법은 고속 성능 액체 크로마토그래피(FPLC) 또는 심지어는 고성능 액체 크로마토그래피(HPLC)이다.

"정제된 폴리펩타이드"는 다른 성분으로부터 단리될 수 있는 조성물로, 돌연변이체 코로나바이러스 S 폴리펩타이드 또는 그의 수용체 결합 도메인이 재조합 단백질을 생산하는 유기체에 대해 어느 정도로 정제되거나 자연적으로 얻을 수 있는 상태로 정제된 조성물을 지칭한다. 따라서 단리된 또는 정제된 폴리펩타이드는 자연적으로 발생할 수 있는 환경이 없는 폴리펩타이드를 지칭한다. 한 구현예에서, "정제된"은 다양한 다른 성분을 제거하기 위해 분별되었고 천연 또는 야생형 코로나바이러스 S 단백질을 결합시키는 코로나바이러스 항체에 결합하는 능력을 실질적으로 보유하는 폴리펩타이드 조성물을 지칭한다. 용어 "실질적으로 정제된"이 이용되는 경우, 이러한 지칭은 코로나바이러스 폴리펩타이드가 조성물의 주요 성분을 형성하는 조성물, 예를 들어 조성물에 있는 단백질의 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 이상을 구성하는 조성물을 지칭한다.

본원에 기재된 폴리펩타이드가 가장 정제된 상태로 제공되어야 한다는 일반적인 요건은 없다. 실제로, 덜 정제된 산물이 특정 구현예에서 유용성을 가질 것으로 생각된다. 부분 정제는 더 적은 수의 정제 단계를 조합하여 이용하거나 동일한 일반 정제 계획의 다른 형태를 활용함으로써 수행할 수 있다. 예를 들어, HPLC 장치를 활용하여 수행된 양이온 교환 컬럼 크로마토그래피는 일반적으로 저압 크로마토그래피 시스템을 활용하는 동일한 기술보다 "수 배" 더 정제되도록 할 것으로 이해된다. 더 낮은 정도의 상대 정제를 발휘하는 방법은 단백질 산물의 총 회수율 또는 발현된 단백질 활성의 유지에 이점이 있을 수 있다.

주어진 폴리펩타이드의 정제 정도를 정량화하기 위한 다양한 방법이 당업자에게 알려져 있고, 예를 들어 활성 분획물의 비활성을 결정하거나 SDS/PAGE 분석에 의해 분획물 내 폴리펩타이드의 양을 평가하는 것을 포함한다.

코로나바이러스 융합 단백질 및 스캐폴드

일부 구현예에서, 본원에 기재된 수용체 결합 도메인 폴리펩타이드 또는 돌연변이된 코로나바이러스 S 단백질은 융합 단백질을 포함한다. 일부 구현예에서, 본원에 기재된 RBD 폴리펩타이드 또는 돌연변이된 코로나바이러스 S 단백질은 스캐폴드, 나노입자, 이종 단백질 스캐폴드 또는 중합체에 융합된다. 특정 구현예에서, 이종 단백질 스캐폴드는 서열번호 3의 I53-50 삼량체 "A" 성분을 포함한다. 다른 구현예에서, 이종 단백질 스캐폴드는 미국 특허 제10,351,603호의 표 1에 기재된 바와 같은 이종 단백질 스캐폴드를 포함하며, 상기 문헌의 내용은 전체적으로 참고문헌으로 포함된다.

일부 구현예에서, 본원에 기재된 돌연변이체 코로나바이러스 폴리펩타이드는 융합 단백질로서 제공된다. 이러한 융합 단백질은 예를 들어 면역 반응 결과를 향상시키기 위한 항원 모이어티를 포함할 수 있다. 이러한 항원 모이어티는 본원에 기재된 융합 단백질을 이용하여 백신접종될 개체에 대해 외래물인 운반체 단백질과 같은 외래 분자를 함유할 수 있다. 본원에 기재된 바와 같이 면역 반응을 활성화하고 융합 단백질에 접합될 수 있는 외래 단백질은 분자량 적어도 약 20,000달톤, 바람직하게는 적어도 약 40,000달톤, 보다 바람직하게는 적어도 약 60,000달톤을 가지는 단백질 또는 다른 분자를 함유한다. 이와 관련하여 유용한 운반체 단백질은 예를 들어 GST, 구멍삿갓조개(keyhole limpet) 유래 헤모시아닌, 혈청 알부민 또는 양이온화된 혈청 알부민, 티로글로불린, 오브알부민, 파상풍 톡소이드 또는 디프테리아 톡소이드와 같은 다양한 톡소이드 단백질, 면역글로불린, 열충격 단백질 등을 함유한다.

하나의 단백질(예를 들어, RBD 폴리펩타이드 또는 돌연변이된 코로나바이러스 S 단백질)을 또 다른 단백질(예를 들어, 운반체 또는 항원 모이어티)에 화학적으로 커플링시키는 방법은 당업계에 잘 알려져 있으며, 예를 들어 1-에틸-3-(3디메틸아미노프로필)카보디이미드 하이드로클로라이드와 같은 수용성 카보디이미드에 의한 접합, 예를 들어 NHS 에스테르 기 또는 설포-NHS 에스테르 유사체를 갖는 동종이작용성 가교제에 의한 접합, 예를 들어 NHS 에스테르 및 설포숙신이미딜-4-(N-말레이미도메틸)시클로헥산-1-카복실레이트와 같은 말레이미드 기를 가지는 헤테로이작용성 가교 링커에 의한 접합 및 글루타르알데히드와의 접합을 함유한다.

단백질 기반의 바이러스 유사 입자

본 개시내용은 단백질 기반의 바이러스 유사 입자(VLP)를 추가로 제공한다. pbVLP는 융합 단백질을 포함하는 수용체 결합 도메인 폴리펩타이드 또는 기재된 돌연변이된 코로나바이러스 S 단백질을 포함할 수 있으며, 여기서 융합 단백질은 본원에 기재된 바와 같은 "제1 성분"과 같은 다량체화 도메인을 포함한다.

본원에 기재된 방법 및 조성물과 함께 사용하기 위한 VLP는 RBD의 엑토도메인 또는 코로나바이러스 스파이크 단백질의 엑토도메인 또는 그의 항원성 단편을 나타내도록 적합화된 다량체 단백질 조립체를 포함할 수 있다. 본원에 기재된 방법 및 조성물과 함께 사용하기 위한 VLP는 적어도 제1 복수의 폴리펩타이드를 포함할 수 있다. 제1 복수의 폴리펩타이드("제1 성분"이라고 지칭하기도 함)는 적어도 1개의 아미노산 잔기의 치환에 의해 또는 1개 이상의 잔기의 N- 또는 C-말단에 추가에 의해 천연 발생 단백질 서열로부터 유래될 수 있다. 일부 경우에, 제1 성분은 전산 방법에 의해 결정된 단백질 서열을 포함한다. 이러한 제1 성분은 전체 VLP 코어를 형성할 수 있다. 또는 VLP가 2, 3, 4, 5, 6, 7개 이상의 복수의 폴리펩타이드를 포함하도록 VLP 코어는 1개 이상의 추가적인 폴리펩타이드("제2 성분" 또는 제3, 제4, 제5 성분 등으로도 지칭됨)를 포함할 수 있다. 일부 경우에, 제1 복수는 3회 회전 대칭에 의해 관련 삼량체를 형성하고 제2 복수는 5회 회전 대칭에 의해 관련 오량체를 형성한다. 이러한 경우에 VLP는 I53 대칭을 가지는 "20면체 입자"를 형성한다. 이와 함께, 각각의 복수의 폴리펩타이드의 구성원은 대칭 연산자에 의해 서로 관련되도록 이들 하나 이상의 복수의 폴리펩타이드가 배열될 수 있다. 표적 대칭 구조의 단백질 형성 블록을 대칭적으로 연결하는 것을 수반하는 자가-조립 단백질 물질을 설계하는 일반적인 전산 방법이 미국 특허 공보 US2015/0356240 A1에 개시되어 있고, 이 문헌의 내용은 본원에서 전체적으로 참고문헌으로 포함된다.

VLP의 "코어"는 VLP에 의해 나타내어지는 RBD 또는 코로나바이러스 S 단백질 엑토도메인 또는 그의 항원 단편의 여러 카피(copy)를 연결시키는 VLP의 중심부를 기재하기 위해 본원에서 이용된다. 한 구현예에서, 제1 성분은 RBD를 포함하는 제1 폴리펩타이드, 링커, 및 다량체화 도메인을 포함하는 제1 폴리펩타이드를 포함한다.

비제한적인 구현예가 도 6a에 나타나 있으며, 여기에 숙주 세포(예: 293F 세포)에서 재조합에 의해 선택적으로 발현되는 VLP 성분에 유전적으로 융합되는 RBD가, 동일하거나 다른 숙주 세포(예: 대장균 세포)에서 재조합에 의해 선택적으로 발현되는 오량체 단백질 조립체와 함께 도시되고, 이들 2개의 복수 폴리펩타이드가 20면체 코어 주위에 20개의 항원 삼량체를 나타내는 VLP 내로 자가 조립된다.

일부 경우에, VLP는 2개 이상의 다양한 코로나바이러스 변종 유래의 RBD 또는 스파이크 단백질을 나타내도록 조정된다. 비제한적 예에서, 동일한 VLP는 단백질 항원의 혼합된 집단 또는 상이한 코로나바이러스 변종으로부터 단백질 항원의 혼합된 이종삼량체를 나타낸다.

본원에 기재된 방법 및 조성물과 함께 사용하기 위한 VLP는 다양한 방식으로, 예컨대 유전자 융합으로 또는 본원에 개시된 다른 수단에 의해 항원성 단백질을 나타낸다. 본원에서 사용되는 "에 연결된" 또는 "에 부착된"은 2개의 폴리펩타이드가 결합되도록 당업계에 알려진 임의의 수단을 의미한다. 결합은 직접적이거나 간접적이고, 가역적이거나 비가역적이고, 약하거나 강하고, 공유이거나 비공유이고, 선택적이거나 비선택적일 수 있다.

일부 구현예에서, 부착은 VLP를 구성하는 복수의 폴리펩타이드 중 하나에 대해 항원의 N- 또는 C-말단 융합을 형성하는 유전자 조작에 의해 달성된다. 따라서 VLP는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 복수의 항원을 나타내는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 복수의 폴리펩타이드로 이루어지거나 이들로 본질적으로 이루어질 수 있으며, 복수의 항원 중 적어도 1개는 복수의 폴리펩타이드 중 적어도 1개에 유전적으로 융합된다. 일부 경우에, VLP는 자가-조립할 수 있고 이에 유전적으로 융합된 복수의 항원성 단백질을 포함하는 1개의 복수의 폴리펩타이드로 본질적으로 이루어진다. 일부 경우에 VLP는 복수의 항원을 포함하는 제1 복수 폴리펩타이드; 및 항원성 단백질을 VLP에 연결하는 1개의 복수 폴리펩타이드 및 VLP의 자가-조립을 조장하는 다른 복수의 폴리펩타이드인 2-성분 VLP 내로 공동-조립할 수 있는 제2 복수 폴리펩타이드로 본질적으로 이루어진다.

일부 구현예에서, 부착은 하나 이상의 복수의 폴리펩타이드와 하나 이상의 복수의 항원 단백질 사이에서 번역 후 공유 부착에 의해 달성된다. 일부 경우에, 화학적 가교결합이 이용되어, 항원을 VLP 폴리펩타이드에 비특이적으로 부착시킨다. 일부 경우에, 화학적 가교결합이 이용되어, 항원성 단백질을 VLP 폴리펩타이드에(예를 들어, 제1 폴리펩타이드에 또는 제2 폴리펩타이드에) 특이적으로 부착시킨다. 클릭 화학(Click chemistry) 및 기타 방법과 같은 다양한 특이적 및 비특이적 가교결합 화학반응이 당업계에 알려져 있다. 일반적으로, 2개 단백질을 연결하기 위해 사용되는 임의의 가교결합 화학반응은 현재 개시된 VLP와 함께 이용하기 위해 조정될 수 있다. 특히, 면역접합체 또는 항체 약물 접합체의 형성에 이용되는 화학물질이 이용될 수 있다. 일부 경우에, VLP는 절단 가능한 또는 절단 불가능한 링커를 이용하여 형성된다. 운반체에 대한 항원 접합을 위한 공정 및 방법은 예를 들어 미국 특허 공개 2008/0145373 A1에 제공되어 있고, 상기 문헌의 내용은 본원에서 전체적으로 참고문헌으로 포함된다.

본 개시내용의 VLP의 성분은 임의의 다양한 아미노산 서열을 가질 수 있다. 미국 특허 공개 US 2015/0356240 A1(그 내용은 전체적으로 본원에서 참고문헌으로 포함됨)은 단백질 조립체를 설계하기 위한 다양한 방법을 기재한다. 미국 특허 공개 US 2016/0122392 A1 및 국제 특허 공개 WO 2014/124301 A1에 기재된 바와 같이 폴리펩타이드는 20면체 입자와 같이 VLP를 형성하기 위해 쌍으로 자가-조립하는 능력을 가지도록 설계되었다. 설계에는 조립에 의해 VLP를 형성할 수 있는 폴리펩타이드 쌍의 각 구성원에 대한 적합한 계면 잔기의 설계가 수반된다. 이와 같이 형성된 VLP는 20면체 대칭을 가지는 것과 같이 VLP 내로 제1 조립체 및 제2 조립체를 배향시키는 대칭적으로 반복되는 비천연 비-공유 폴리펩타이드-폴리펩타이드 계면을 포함한다.

일부 구현예에서, RBD 또는 코로나바이러스 S 단백질 엑토도메인, 또는 그의 항원성 단편은 제1 다량체화 도메인과의 융합 단백질로서 발현된다. 일부 구현예에서, 제1 다량체화 도메인 및 RBD 또는 코로나바이러스 S 단백질 엑토도메인은 링커 서열에 의해 연결된다. 일부 구현예에서, 링커 서열은 폴돈을 포함하고, 여기서 폴돈 서열은 EKAAKAEEAARK(서열번호 8)이다.

본 개시내용의 단백질 기반의 VLP에 유용한 설계된 단백질 복합체의 비제한적 예에는 미국 특허 제9,630,994호; 국제 특허 공개 WO2018187325 A1; 미국 특허 공개 제2018/0137234호 A1; 미국 특허 공개 제2019/0155988호 A2에 개시된 것이 포함되며, 이들 각각은 본원에서 전체적으로 참고문헌으로 포함된다. 예시적인 서열에는 표 3에 제공된다.

표 3

일부 구현예에서, VLP는 서열번호 9-13 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 가지고 본원에 개시된 바와 같은 RBD 또는 코로나바이러스 스파이크 단백질을 포함하는 융합 단백질; 및 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 가지는 제2 성분을 포함한다.

일부 구현예에서, VLP는 서열번호 19와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 가지고 본원에 개시된 바와 같은 RBD 또는 코로나바이러스 스파이크 단백질을 포함하는 융합 단백질; 및 서열번호 20과 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 가지는 제2 성분을 포함한다.

일부 구현예에서, 본원에 개시된 바와 같은 폴리펩타이드는 서열번호 6 또는 서열번호 7의 폴리펩타이드 서열을 포함한다.

RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADFSVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTYGVGYQPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRANSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIVSPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGGVNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATE (서열번호 6)

RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADFSVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGNIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVKGFNCYFPLQSYGFQPTYGVGYQPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRANSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIVSPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGGVNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATE (서열번호 7)

단백질 안정성

대부분의 생물학적 산물은 열적, 광화학적 또는 산화적 분해와 같은 분해에 취약하다. 백신 및 인슐린과 같은 생물학적 산물은 전 세계적으로 유통되어야 하고 지역에 따라 주변 온도의 차이가 크기 때문에 사용기한이 긴 백신(또는 그 안의 안정화된 단백질)이 빠르게 분해되는 단백질/조성물보다 바람직하다. 또한 세포내 안정성이 증가하면 재조합 단백질의 수율이 커질 수 있다. 본원에 기재된 바와 같은 돌연변이된 코로나바이러스 스파이크 단백질 또는 이의 수용체 결합 도메인은 그의 야생형 대응물과 비교하여 증가된 안정성을 가진다. 이들 단백질의 안정성은 당업계에 알려진 하나 이상의 검정법을 사용하거나 실시예에 기재된 방법을 사용하여 결정될 수 있다. 예시적인 단백질 안정성 검정법에는 시차 주사 열량측정법, 펄스-추적법, 표백제 추적법(bleach chase method), 시클로헥사미드 추적법, 원편광 이색성 분광법 및 형광 기반 활성 검정법이 포함되지만 이에 국한되지 않는다.

주어진 조성물의 안정성은 본원에서 단리된 제제 또는 백신 제형에 적용될 때 조성물의 "사용기한"으로도 지칭되는 것으로, 조성물이 보관되는 조건 및 조성물의 제형(예를 들어, 화학물질 성분의 추가) 또는 조성물이 제공되는 물리적 상태(예를 들어, 동결건조, 건조, 냉동 등)에 따라 달라진다.

본원에서 사용되는 용어 "동결건조" 또는 "동결건조된"은 본원에 기재된 바와 같은 조성물을 보존하거나 조성물을 보관 및 수송하기에 더 편리하게 만들기 위해 사용되는 "동결건조"로 흔히 지칭되는 탈수 공정을 지칭한다. 동결건조는 조성물을 동결시킨 다음 주위압을 감소시켜, 조성물 내의 동결된 물이 고체상으로부터 기체상으로 직접 승화되도록 함으로써 이루어진다. 일부 구현예에서, 동결건조는 본원에 기재된 바와 같은 백신 조성물을 보존하기 위해 이용될 수 있으며, 이로써 백신 조성물을 냉장할 필요없이 휴대가능하고 실온 보관할 수 있게 한다.

본원에 기재된 돌연변이에 의해 제공되는 항원의 증가된 안정성에 부가하여, 백신 조성물의 사용기한을 증가시키는 것을 목적으로 하는 항산화제 또는 기타 제제의 첨가가 또한 본원에서 고려된다. 일부 구현예에서, 본원에 기재된 조성물은 실온 보관되고 냉장할 필요없는 것으로 고려된다.

보관 방법에 관계없이, 돌연변이된 코로나바이러스 스파이크 단백질 또는 그의 RBD는 상응하는 야생형 코로나바이러스 스파이크 단백질 또는 그의 RBD에 대한 단백질 안정성 및 조성물 사용기한을 능가하는 증가된 단백질 안정성 및 조성물 사용기한 둘 모두를 가진다.

본원에 기재된 돌연변이된 코로나바이러스 단백질 또는 펩타이드를 포함하는 제형은 정의된 온도에서 주어진 기간 동안 특징이 거의 변하지 않는다는 점에서 안정적이다. 일반적으로, 본원에 기재된 바와 같은 제형은 적어도 약 1개월 동안 안정적이다. 일부 구현예에서, 제형은 적어도 약 6주, 적어도 약 2개월, 적어도 약 4개월, 적어도 약 6개월, 적어도 약 8개월, 적어도 약 10개월, 적어도 약 12개월(1년), 적어도 약 14개월, 적어도 약 16개월, 적어도 약 18개월(1.5년), 적어도 약 20개월, 적어도 약 22개월, 적어도 약 24개월(2년), 적어도 약 26개월, 적어도 약 28개월, 적어도 약 30개월, 적어도 약 32개월, 적어도 약 34개월, 적어도 약 36개월(3년), 적어도 약 38개월, 적어도 약 40개월, 적어도 약 42개월, 적어도 약 44개월, 적어도 약 46개월 또는 적어도 약 48개월(4년) 동안 안정적이다.

제형이 안정적으로 있는 온도는 일반적으로 약 30℃ 미만이다. 일부 구현예에서, 제형의 안정성은 약 25℃, 약 20℃, 약 15℃, 약 10℃, 약 8℃, 약 5℃, 약 4℃ 또는 약 2℃ 미만의 온도에 관련된다. 따라서, 일부 구현예에서, 온도는 약 25℃ 내지 약 2℃, 약 20℃ 내지 약 2℃, 약 15℃ 내지 약 2℃, 약 10℃ 내지 약 2℃, 약 8℃ 내지 약 2℃, 또는 약 5℃ 내지 약 2℃ 범위이다. 다른 구현예에서, 온도는 약 25℃ 내지 약 5℃, 약 20℃ 내지 약 5℃, 약 15℃ 내지 약 5℃, 약 10℃ 내지 약 5℃, 또는 약 8℃ 내지 약 5℃ 범위이다. 또 다른 구현예에서, 온도는 약 25℃ 내지 약 8℃, 약 20℃ 내지 약 8℃, 약 15℃ 내지 약 8℃, 또는 약 10℃ 내지 약 8℃ 범위이다. 또 다른 구현예에서, 온도는 약 25℃ 내지 약 10℃, 약 20℃ 내지 약 10℃, 약 15℃ 내지 약 10℃ 범위, 약 25℃ 내지 약 15℃, 약 20℃ 내지 약 15℃ 또는 약 25℃ 내지 약 20℃ 범위이다. 일부 구현예에서, 조성물은 장기 보관을 위해 4℃ 또는 -20℃에서 보관될 수 있다.

백신 조성물

RBD 폴리펩타이드, 돌연변이된 코로나바이러스 S 단백질 또는 본원에 기재된 것과 동일한 것을 포함하는 융합 단백질은 백신 제형의 생산에 이용될 수 있다. 이러한 백신 제형은 인간을 개별적으로 감염시키는 것으로 알려진 7가지 코로나바이러스 각각으로부터 보호할 수 있거나, 인간을 감염시키는 것으로 알려진 7가지 코로나바이러스 중 적어도 2가지, 적어도 3가지, 적어도 4가지, 적어도 5가지 또는 적어도 6가지로부터 보호할 수 있다. 한 구현예에서, 본원에 기재된 바와 같은 백신 제형은 인간을 감염시키는 것으로 알려진 7가지 모든 코로나바이러스로부터 보호할 수 있다. 또한 본원에 기재된 백신 제형이 미래에 동물 종(예를 들어, 박쥐)으로부터 인간으로 전파될 것으로 예상되는 코로나바이러스로부터 보호할 수 있다는 것이 본원에서 구체적으로 고려된다. 다른 구현예에서, 본원에 기재된 백신 제형은 동물이 취약한 1가지 이상의 코로나바이러스로부터 동물을 보호할 수 있다. 본원에 기재된 돌연변이된 스파이크 단백질 폴리펩타이드를 암호화하는 RNA 및/또는 DNA 백신 제형이 또한 본원에서 구체적으로 고려된다.

일부 구현예에서, 본원에 기재된 코로나바이러스 항원에 대해 생성된 면역력은 오래(예를 들어, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 20년, 적어도 30년, 적어도 40년 또는 심지어는 대상체의 전체 수명 동안) 지속된다. 대안적으로, 일부 구현예에서, 본원에 기재된 바와 같은 백신 제형은 인플루엔자 백신을 사용한 면역화와 유사하게 표적 바이러스의 우세 변종 또는 예상되는 우세 변종에 맞추어 매년 투여되고, 마지막 투여로부터 적어도 3개월, 적어도 6개월, 적어도 8개월, 적어도 1년, 적어도 1.5년 또는 적어도 2년 동안 보호할 수 있다.

당업자는 1가지 이상의 코로나바이러스에 대한 지역사회 기반의 면역 또는 집단 면역을 부여하기 위해 코로나바이러스 백신 제형의 100% 효능이 요구되지 않음을 인지할 것이다. 따라서, 일부 구현예에서, 본원에 기재된 백신 제형은 백신접종된 개체 집단에서 적어도 40% 유효하고, 예를 들어 백신접종된 개체 집단에서 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99% 유효하다.

일부 구현예에서, 지역사회 전파를 감소시키고 코로나바이러스 감염 및 확산을 예방/억제하기 위한 노력의 일환으로, 본원에 기재된 백신은 건강한 어린이 및 개인에게 범용 백신으로 투여될 수 있다. 특히 어린이는 보다 경미한 증상을 가지는 경향이 있고 코로나바이러스 감염으로 반드시 진단되지는 않기 때문에 학교, 가족 및 지역사회 내에서 코로나바이러스 전파에 중요한 역할을 할 수 있다. 인플루엔자 백신에 대한 연구에 따르면 지역 사회 학생의 약 80%의 백신접종이 성인의 호흡기 질환과 노인의 과도한 사망을 감소시키는 것으로 나타났다(Reichert 등, 2001). 이 개념은 지역 사회 면역 또는 "집단 면역"으로 알려져 있고, 질병으로부터 지역 사회를 보호하는 중요한 역할을 하는 것으로 생각된다. 백신접종받은 사람은 특정 바이러스를 중화시키는 항체를 가지고 있기 때문에 다른 사람에게 바이러스를 전파시킬 가능성이 훨씬 적다. 이러한 개념은 코로나바이러스 감염에도 적용될 수 있다. 따라서, 백신접종받지 않은 사람(및 백신접종이 약화되었거나 백신이 완전히 효과적이지 않은 사람)도 그 주변에 백신접종을 받은 사람들이 병에 걸리지 않거나 바이러스를 전파시키지 않기 때문에 집단 면역에 의해 종종 보호될 수 있다. 집단 면역은 백신접종을 받은 사람의 비율이 증가할수록 더 효과적이다. 집단 면역을 달성하기 위해서는 지역 사회 사람의 약 60%(그러나 90 내지 95% 근접이 바람직함)가 백신에 의해 보호되어야 하는 것으로 생각된다. 면역력을 가지지 않은 사람들은 자신과 다른 사람들이 질병에 걸릴 가능성을 증가시킨다.

따라서, 또 다른 측면에서 본원에 기재된 백신 제형을 지역 사회 집단에 투여함으로써 면역손상된 개체 또는 백신접종을 받지 않은 개체 사이에서 코로나바이러스 감염 발병률을 감소시키기 위해 집단 또는 지역 사회에 대한 코로나바이러스 감염에 실질적인 보호 면역을 유도하는 방법이 본원에서 제공된다. 한 구현예에서, 대부분의 학령기 어린이는 본원에 기재된 바와 같은 백신을 투여함으로써 코로나바이러스 감염에 대해 면역력을 가지게 된다(예를 들어, 학령기 어린이의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%가 면역력을 가지게 된다). 또 다른 구현예에서, 지역 사회의 대부분의 건강한 개체(예를 들어, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 이상)는 본원에 기재된 바와 같은 백신을 투여함으로써 주어진 코로나바이러스 또는 코로나바이러스 그룹에 대한 면역력을 가지게 된다. 또 다른 구현예에서, 본원에 기재된 백신은 "동적 백신접종" 전략의 일부로 이용될 수 있다. 동적 백신접종은 새로운 또는 기존의 유행성 변종과 관련된 낮은 효능의 백신을 꾸준하게 생산하지만, 항원소변이로 인해 포유류를 완전하게 보호하지 못할 수 있다(Germann 등, 2006 참조). 미래의 판데믹 변종 동일성에 대한 불확실성 때문에 판데믹 변종을 잘 매칭시켜 비축하는 것은 거의 불가능하다. 그러나, 매칭이 불량하지만 유효 가능성이 있는 백신을 사용하는 백신접종은 판데믹 바이러스 확산을 둔화시키고/거나 코로나바이러스 판데믹 변종의 증상 중증도를 낮출 수 있다. 한 구현예에서, 본원에 기재된 바와 같은 백신은 2019/2020 COVID-19 판데믹의 원인이 되는 하나 이상의 SARS-CoV-2 변종에 대한 것이다.

본원에 기재된 백신 제형은 코로나바이러스 감염과 관련된 증상 중 적어도 1가지를 예방할 수 있거나 임의의 증상 발현을 완전히 예방할 수 있다. 코로나바이러스 감염의 흔한 증상에는 열, 오한, 기침, 숨가쁨/호흡곤란, 피로, 근육통/몸살, 두통, 새로운 미각 또는 후각 상실, 인후통, 울혈 또는 콧물, 메스꺼움, 구토 또는 설사가 포함되나 이에 국한되지 않다. 증상의 감소는 주관적으로 또는 객관적으로, 예를 들어, 삶의 질 평가, 코로나바이러스 감염 또는 추가 증상의 진행 둔화, 코로나바이러스 관련 질병 증상의 중증도 감소 또는 적절한 분석법(예: 항체 역가 및/또는 T 세포 활성화 검정법)을 포함하는 대상체 자가 평가, 의사 평가 또는 적합한 검정법 또는 측정의 수행에 의해 결정될 수 있다.

바람직하게, 본원에 기재된 백신 제형은 개체 지역사회 내에서 또는 두 명의 다른 개체 사이에서 백신접종을 받은 개체로부터 다른 개체로의 활성 코로나바이러스 전파를 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99% 또는 심지어 100%(즉, 백신접종받은 개체 및 두 명 이상의 개체 사이에 검출가능한 전파 없음) 낮춘다.

일부 구현예에서, 본원에 기재된 백신 제형은 하나 이상의 아쥬반트를 포함한다. 아쥬반트의 비제한적 예에는 완전 프로인트 아쥬반트(죽은 마이코박테리움 투베르쿨로시스를 함유하는 면역 반응의 비특이적 자극제), 불완전 프로인트 아쥬반트 및 수산화알루미늄 아쥬반트가 포함된다. 다른 아쥬반트는 GMCSP, BCG, 수산화알루미늄, thur-MDP 및 nor-MDP와 같은 MDP 화합물, CGP(MTP-PE), 지질 A 및 모노포스포릴 지질 A(MPL)를 포함한다. 2% 스쿠알렌/Tween 80 에멀젼 중 박테리아, MPL, 트레할로스 디미콜레이트(TDM) 및 세포벽 골격(CWS)으로부터 추출된 3가지 성분을 함유하는 RIBI도 고려된다. MF-59, Novasomes®, MHC 항원도 사용될 수 있다.

한 측면에서, 아쥬반트 효과는 인산염 완충 식염수 중 약 0.05 내지 약 0.1% 용액에 사용된 명반과 같은 제제를 사용함으로써 달성된다. 대안적으로, 본원에 기재된 바와 같은 백신은 약 0.25% 용액으로 사용되는 당의 합성 중합체(Carbopol®)와의 혼합물로서 만들어질 수 있다. 예를 들어 박테리아에서 얻은 특정 유기 분자인 일부 아쥬반트는 항원보다는 숙주에 작용한다. 예는 세균성 펩티도글리칸인 무라밀 디펩타이드(N-아세틸무라밀-L-알라닐-D-이소글루타민(MDP))이다. 다른 구현예에서, 헤모시아닌 및 헤모에리트린은 또한 본원에 기재된 바와 같은 백신 제형과 함께 사용될 수 있다. 구멍삿갓조개 유래 헤모시아닌(KLH)이 특정 구현예에서 사용될 수 있지만, 다른 연체동물 및 절지동물 헤모시아닌 및 헤모에리트린이 대안적인 구현예에서 이용될 수 있다.

다양한 다당류 아쥬반트가 또한 사용될 수 있다. 예를 들어, 마우스의 항체 반응에 대한 다양한 폐렴구균 다당류 아쥬반트의 효과가 기재되었다(Yin 등, 1989). 최적의 반응을 발생시키거나 그렇지 않으면 억제를 발생시키지 않는 용량이 지시된 대로 이용되어야 한다(Yin 등, 1989). 탈아세틸화 키틴을 포함하여 키틴 및 키토산과 같은 다당류 폴리아민 품종이 특히 바람직하다. 또 다른 구현예에서, 포스파티딜 콜린 및 포스파티딜 글리세롤로부터 형성된 인공 리포좀에 사용하기 위해 기재된 무라밀 디펩타이드의 친유성 이당류-트리펩타이드 유도체를 사용할 수 있다.

양친매성 및 표면 활성제, 예를 들어 QS21(Cambridge Biotech)과 같은 사포닌 및 유도체는 본원에 기재된 바와 같이 백신 제형에 사용하기 위한 또 다른 아쥬반트 그룹을 형성한다. 비이온성 블록 공중합체 계면활성제(Rabinovich 등, 1994)도 사용될 수 있다. 올리고뉴클레오타이드 아쥬반트(Yamamoto 등, 1988), Quil A 및 렌티넨은 특정 구현예에서 사용될 수 있는 다른 아쥬반트이다.

또한, 정제된 해독된 내독소는 척추동물에서 아쥬반트 반응을 생성하기 위해 단독으로 또는 다중 아쥬반트 제형으로 사용될 수 있다. 예를 들어, 해독된 내독소와 트레할로스 디미콜레이트의 조합 또는 해독된 내독소와 트레할로스 디미콜레이트와 내독성 당지질의 조합이 본원에서 고려된다. 대안적으로, 해독된 내독소와 세포벽 골격(CWS) 또는 CWS와 트레할로스 디미콜레이트의 조합 또는 해독된 내독소없이 오로지 CWS와 트레할로스 디미콜레이트의 조합이 또한 고려된다.

당업자는 본원에 기재된 바와 같은 백신에 접합되거나 백신과 혼합될 수 있는 다양한 종류의 아쥬반트를 알고 있고, 이들은 특히 알킬 리소인지질(ALP); BCG; 및 비오틴(비오티닐화 유도체 포함)을 포함한다. 사용을 위해 특히 고려되는 특정 아쥬반트는 그람 음성 박테리아 세포 유래의 테이코산이다. 이들은 리포테이코산(LTA), 리비톨 테이코산(RTA) 및 글리세롤 테이코산(GTA)을 함유한다. 합성 대응물의 활성 형태도 사용될 수 있다.

다양한 아쥬반트, 심지어 인간에게 흔히 사용되지 않는 아쥬반트가 다른 척추동물을 위한 백신에 사용될 것으로 예상된다.

백신 제형은 당업계에 잘 알려진 방법을 사용하여(예를 들어 리포좀(예를 들어 Garcon and Six, J. Immunol. 146:3697 (1991) 참조) 예를 들어 소 로타바이러스의 내부 캡시드 단백질(Redmond 등, Mol. Immunol. 28:269(1991)) 내로, Quil A와 같은 사포닌으로 구성된 면역 자극 분자(ISCOMS)(Morein 등, Nature 308:457(1984)); Morein 등, Immunological Adjuvants and Vaccines(G. Gregoriadis al. eds.) pp. 153-162, Plenum Press, NY (1987)) 내로 또는 예를 들어 락타이드-글리콜라이드 공중합체로 구성된 제어-방출 생분해성 마이크로스피어(O'Hagan 등, Immunology 73:239 (1991); O'Hagan 등, Vaccine 11: 149(1993)) 내로 미세캡슐화 또는 거대캡슐화되는 본원에 기재된 코로나바이러스 폴리펩타이드 또는 그의 융합 단백질을 포함할 수 있다.

또한 본원에 기재된 안정화된 코로나바이러스 폴리펩타이드 또는 그의 융합 단백질은 L-121과 같은 PLURONIC 블록-공중합체를 사용하여 제조되고 TWEEN 80과 같은 청정제를 사용하여 안정화된 스쿠알렌 또는 스쿠알란 에멀젼을 함유하는 지질 마이크로스피어의 표면에 흡착될 수 있다(Allison and Byers, Vaccines: New Approaches to Immunological Problems (R. Ellis ed.) pp. 431-449, Butterworth-Hinemann, Stoneman N.Y. (1992) 참조).

본원에 기재된 백신 제형은 본원에 기재된 바와 같은 안정화된 코로나바이러스 폴리펩타이드 또는 그의 융합 단백질을 "유효량" 또는 "치료적 유효량"으로 포함한다. 본원에 사용되는 문구 "유효량" 또는 "치료적 유효량"은 수령자에서 면역 반응을 발생(또는 발생에 기여)시키기에 충분히 높은 농도를 제공하기에 충분한 용량을 지칭한다. 임의의 특정 대상체에 대한 구체적인 유효 용량 수준은 치료되는 장애, 장애 중증도, 구체적인 화합물의 활성, 투여 경로, 투여된 제제(들)의 청소율, 치료 기간, 투여된 제제(들)과 병용하여 또는 동시에 사용되는 약물, 대상체의 연령, 체중, 성별, 식이 및 일반적인 건강 상태, 및 의학과 과학 분야에 잘 알려진 유사한 인자를 포함하는 다양한 인자에 따라 달라진다. "치료적 유효량"을 결정하기 위해 고려되는 다양한 일반 고려사항이 당업자에게 알려져 있고, 예를 들어 Gilman 등, eds., Goodman and Gilman's: The Pharmacological Bases of Therapeutics, 8th ed., Pergamon Press, 1990; 및 Remington's Pharmaceutical Sciences, 17th ed., Mack Publishing Co., Easton, Pa., 1990에 기재되어 있다.

또한 제형의 pH가 다양할 수 있다. 일반적으로 이는 약 pH 6.2 내지 약 pH 8.0이다. 일부 구현예에서, pH는 약 6.2, 약 6.4, 약 6.6, 약 6.8, 약 7.0, 약 7.2, 약 7.4, 약 7.6, 약 7.8 또는 약 8.0이다. 물론, pH는 값의 범위 내에 있을 수도 있다. 따라서, 일부 구현예에서 pH는 약 6.2 내지 약 8.0, 약 6.2 내지 7.8, 약 6.2 내지 7.6, 약 6.2 내지 7.4, 약 6.2 내지 7.2, 약 6.2 내지 7.0, 약 6.2 내지 6.8, 약 6.2 내지 약 6.6, 또는 약 6.2 내지 6.4이다. 다른 구현예에서, pH는 6.4 내지 약 8.0, 약 6.4 내지 7.8, 약 6.4 내지 7.6, 약 6.4 내지 7.4, 약 6.4 내지 7.2, 약 6.4 내지 7.0, 약 6.4 내지 6.8, 또는 약 6.4 내지 약 6.6이다. 또 다른 구현예에서, pH는 약 6.6 내지 약 8.0, 약 6.6 내지 7.8, 약 6.6 내지 7.6, 약 6.6 내지 7.4, 약 6.6 내지 7.2, 약 6.6 내지 7.0, 또는 약 6.6 내지 6.8이다. 또 다른 구현예에서, 이는 약 6.8 내지 약 8.0, 약 6.8 내지 7.8, 약 6.8 내지 7.6, 약 6.8 내지 7.4, 약 6.8 내지 7.2, 또는 약 6.8 내지 7.0이다. 또 다른 구현예에서, 이는 약 7.0 내지 약 8.0, 약 7.0 내지 7.8, 약 7.0 내지 7.6, 약 7.0 내지 7.4, 약 7.0 내지 7.2, 약 7.2 내지 8.0, 약 7.2 내지 7.8, 약 7.2 내지 약 7.6, 약 7.2 내지 7.4, 약 7.4 내지 약 8.0, 약 7.4 내지 약 7.6, 또는 약 7.6 내지 약 8.0이다.

일부 구현예에서, 제형은 염화나트륨, 인산나트륨 또는 이들의 조합과 같은 하나 이상의 염을 포함할 수 있다. 일반적으로, 각각의 염은 제형에 약 10mM 내지 약 200mM로 존재한다. 따라서, 일부 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 200mM, 약 20mM 내지 약 200mM, 약 25mM 내지 약 200mM, 약 30mM 내지 약 200mM, 약 40mM 내지 약 200mM, 약 50mM 내지 약 200mM, 약 75mM 내지 약 200mM, 약 100mM 내지 약 200mM, 약 125mM 내지 약 200mM, 약 150mM 내지 약 200mM , 또는 약 175mM 내지 약 200mM로 존재한다. 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 175mM, 약 20mM 내지 약 175mM, 약 25mM 내지 약 175mM, 약 30mM 내지 약 175mM, 약 40mM 내지 약 175mM, 약 50mM 내지 약 175mM, 약 75mM 내지 약 175mM, 약 100mM 내지 약 175mM, 약 125mM 내지 약 175mM, 또는 약 150mM 내지 약 175mM로 존재한다. 또 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 150mM, 약 20mM 내지 약 150mM, 약 25mM 내지 약 150mM, 약 30mM 내지 약 150mM, 약 40mM 내지 약 150mM, 약 50mM 내지 약 150mM, 약 75mM 내지 약 150mM, 약 100mM 내지 약 150mM, 또는 약 125mM 내지 약 150mM로 존재한다. 또 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 125mM, 약 20mM 내지 약 125mM, 약 25mM 내지 약 125mM, 약 30mM 내지 약 125mM, 약 40mM 내지 약 125mM, 약 50mM 내지 약 125mM, 약 75mM 내지 약 125mM, 또는 약 100mM 내지 약 125mM로 존재한다. 일부 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 100mM, 약 20mM 내지 약 100mM, 약 25mM 내지 약 100mM, 약 30mM 내지 약 100mM, 약 40mM 내지 약 100mM, 약 50mM 내지 약 100mM, 또는 약 75mM 내지 약 100mM로 존재한다. 또 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 75mM, 약 20mM 내지 약 75mM, 약 25mM 내지 약 75mM, 약 30mM 내지 약 75mM, 약 40mM 내지 약 75mM, 또는 약 50mM 내지 약 75mM로 존재한다. 또 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 50mM, 약 20mM 내지 약 50mM, 약 25mM 내지 약 50mM, 약 30mM 내지 약 50mM, 또는 약 40mM 내지 약 50mM로 존재한다. 다른 구현예에서, 존재하는 임의의 염은 약 10mM 내지 약 40mM, 약 20mM 내지 약 40mM, 약 25mM 내지 약 40mM, 약 30mM 내지 약 40mM, 약 10mM 내지 약 30mM, 약 20mM 내지 약 30mM, 약 25mM 내지 약 30mM, 약 10mM 내지 약 25mM, 약 20mM 내지 약 25mM, 또는 약 10mM 내지 약 20mM로 존재한다. 한 구현예에서, 염화나트륨은 제형에 약 100mM로 존재한다. 한 구현예에서, 인산나트륨은 제제에 약 25mM로 존재한다.

본원에 기재된 돌연변이된 코로나바이러스 단백질을 포함하는 제형은 비이온성 청정제와 같은 가용화제를 추가로 포함할 수 있다. 이러한 청정제에는 폴리소르베이트 80(Tween® 80), TritonX100 및 폴리소르베이트 20이 포함되지만 이에 국한되지 않는다.

백신 투여 및 효능

본원에 기재된 바와 같은 백신 제형은 임의의 적합한 희석제 또는 부형제를 포함하여 그 자체가 조성물을 투여받는 척추동물에 유해한 면역 반응 생성을 유도하지 않고 과도한 독성없이 투여될 수 있는 임의의 약제학적 제제를 포함하는 약제학적으로 허용가능한 담체를 추가로 포함할 수 있다. 본원에서 사용되는 용어 "약제학적으로 허용가능한"은 척추동물, 더욱 구체적으로는 인간에 사용하기 위해 미국 연방 또는 주정부의 규제 기관의 허가를 받거나 미국 약전, 유럽 약전 또는 기타 일반적으로 인정되는 약전에 등재되어 있음을 의미한다. 이들 조성물은 척추동물에서 보호 면역 반응을 유도하기 위한 백신 및/또는 항원성 조성물로서 유용할 수 있다.

약제학적으로 허용가능한 담체 또는 부형제는 식염수, 완충 식염수, 덱스트로스, 물, 글리세롤, 멸균 등장성 수성 완충액 및 이들의 조합을 포함하지만 이에 국한되지는 않는다. 약제학적으로 허용가능한 담체, 희석제 및 다른 부형제에 대한 철저한 검토가 Remington's Pharmaceutical Sciences(Mack Pub. Co. N.J. 현행 판)에 제공되어 있다. 제형은 투여 방식에 적합해야 하다. 바람직한 구현예에서, 제형는 인간에게 투여하기에 적합하고, 바람직하게는 무균, 비-미립자성 및/또는 비-발열성이다.

조성물은 필요에 따라 소량의 습윤제 또는 유화제 또는 pH 완충제를 함유할 수도 있다. 조성물은 재구성에 적합한 동결건조 분말과 같은 고체 형태, 액체 용액, 현탁액, 에멀젼, 정제, 알약, 캡슐, 지속 방출 제형 또는 분말일 수 있다. 경구 제형은 만니톨, 락토스, 전분, 마그네슘 스테아레이트, 소듐 사카린, 셀룰로스, 마그네슘 카보네이트 등의 약제학적 등급과 같은 표준 담체를 함유할 수 있다.

일반적으로, 본원에 기재된 코로나바이러스 백신은 하나 이상의 코로나바이러스 변종에 대한 면역 반응을 자극하기에 충분한 유효량 또는 양으로 투여된다. 바람직하게, 백신 제형의 투여는 적어도 1가지 코로나바이러스에 대하여 실질적인 면역력을 유도한다. 전형적으로, 용량은 예를 들어 연령, 신체 상태, 체중, 성별, 식이, 투여 시간 및 기타 임상적 요인에 기반하여 조정될 수 있다.

단회 투여에 의한 실질적인 면역 자극이 바람직하지만, 원하는 효과를 달성하기 위해 동일 경로나 다른 경로로 추가 용량이 투여될 수 있다. 예를 들어, 신생아와 유아의 경우 충분한 수준의 면역력을 유도하기 위해 다회 투여가 요구될 수 있다. 코로나바이러스 감염으로부터 충분한 수준의 보호를 유지하기 위해 필요에 따라 어린 시절 내내 일정 간격을 두고 계속 투여될 수 있다. 마찬가지로, 중증 질병이나 반복 감염에 특히 취약한 성인, 예를 들어 의료 종사자, 어린이집 종사자, 어린 자녀의 가족 구성원, 노인 및 심폐 기능이 손상된 개인의 경우, 보호 면역 반응을 확립 및/또는 유지하기 위해 다회의 면역화가 요구될 수 있다. 유도된 면역 수준은 예를 들어 분비 및 혈청 항체를 중화하는 양, 및 원하는 수준의 보호를 유도하고 유지하기 위해 필요에 따라 조정되는 용량 또는 반복 백신접종을 측정함으로써 모니터링될 수 있다.

예방용 백신 제형은 예를 들어, 바늘 및 주사기를 사용하는 피하 또는 근육내 주사, 또는 바늘이 없는 주사 장치에 의해 전신 투여될 수 있다. 대안적으로, 백신 제형은 점적, 큰 입자 에어로졸(약 10미크론 초과)에 의해 비강 내로 또는 분무에 의해 상기도 내로 투여된다. 이러한 전달 경로 중 어느 것이든 면역 반응을 초래할 수 있지만, 비강 내 투여는 코로나바이러스 유입 부위 중 하나에서 점막 면역을 유도하는 추가적인 이점을 제공할 수 있다.

본원에 기재된 바와 같은 백신 제형을 투여하는 비제한적 방법은 비경구 투여(예를 들어, 피내, 근육내, 정맥내 및 피하), 경막외 및 점막(예를 들어, 비강내 및 경구 또는 폐 경로 또는 좌제에 의해)을 포함하지만 이에 국한되지 않는다. 특정 구현예에서, 본원에 기재된 바와 같은 백신 조성물은 근육내, 정맥내, 피하, 경피 또는 피내로 투여된다. 조성물은 임의의 편리한 경로, 예를 들어 주입 또는 볼루스(bolus) 주사에 의해, 상피 또는 점막피부층(예를 들어, 구강 점막, 결장, 결막, 비인두, 구인두, 질, 요도, 방광 및 장 점막 등)을 통한 흡수에 의해 투여될 수 있고, 다른 생물학적 활성 제제와 함께 투여될 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 백신 조성물의 비강 내 또는 다른 점막 투여 경로는 다른 투여 경로보다 실질적으로 더 높은 항체 또는 다른 면역 반응을 유도할 수 있다. 또 다른 구현예에서, 본원에 기재된 바와 같은 백신 조성물의 비강 내 또는 다른 점막 투여 경로는 다른 코로나바이러스 변종에 대한 교차 보호를 유도하는 항체 또는 다른 면역 반응을 유도할 수 있다. 투여는 전신 또는 국소 투여일 수 있다. 일부 구현예에서, 백신 제형은 면역화 부위에서 면역 반응을 유도하기 위해 점막 조직을 표적화하는 방식으로 투여된다. 예를 들어, 장 관련 림프 조직(GALT)과 같은 점막 조직은 특정 점막 표적화 특성을 가지는 아쥬반트를 함유하는 조성물의 경구 투여를 이용함으로써 면역화를 위해 표적화될 수 있다. 비인두 림프 조직(NALT) 및 기관지 관련 림프 조직(BALT)과 같은 추가적인 점막 조직도 표적화될 수 있다.

본원에 기재된 바와 같은 백신 제형은 또한 투약 일정에 따라 투여될 수 있으며, 예를 들어 백신 조성물의 최초 투여 후 부스터 투여이다. 특정 구현예에서, 조성물의 2차 투여는 최초 투여 후 2주부터 1년까지, 바람직하게는 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 5개월부터 약 6개월까지의 임의의 시점에 투여된다. 추가로, 3차 투여는 2차 투여 후에 투여될 수 있고 최초 투여 후 약 3개월부터 약 2년까지, 또는 훨씬 더 오랜 기간, 바람직하게는 약 4개월, 약 5개월 또는 약 6개월, 또는 약 7개월 내지 약 1년까지 임의의 시점에 투여된다. 3차 투여는 2차 투여 후 대상체의 혈청 및/또는 소변 또는 점막 분비물에서 특이적 면역글로불린이 전혀 검출되지 않거나 낮은 수준으로 검출될 때 임의로 투여될 수 있다. 바람직한 구현예에서, 2차 투여는 1차 투여 후 약 1개월 시점에 투여되고 3차 투여는 1차 투여 후 약 6개월 시점에 투여된다. 또 다른 구현예에서, 2차 투여는 1차 투여 후 약 6개월 시점에 투여된다.

약제학적 제형의 용량은 예를 들어 예방적 또는 치료적 면역 반응을 유도하기 위한 유효 용량을 먼저 확인함으로써, 예를 들어, 바이러스 특이적 면역글로불린의 혈청 역가를 측정하거나 또는 혈청 샘플 또는 소변 샘플 또는 점막 분비물 중 항체의 억제비를 측정함으로써 당업자가 쉽게 결정할 수 있다. 상기 용량은 동물 연구로부터 결정될 수 있다. 코로나바이러스를 연구하기 위해 사용되는 동물의 비제한적 목록에는 기니피그, 시리아 햄스터, 친칠라, 고슴도치, 닭, 랫트, 마우스, 돼지, 소, 박쥐 및 흰족제비가 포함된다. 특히 박쥐는 코로나바이러스의 자연 숙주로 생각되고, 백신의 연구 또는 테스트에 특히 유용할 수 있다. 그러나, 유도된 면역 반응을 부분적으로 특징 규명하고/하거나 임의의 중화 항체가 생성되었는지 여부를 결정하기 위해 본원에 기재된 바와 같은 백신 제형을 임의의 상기 동물에 투여할 수 있다.

또한, 인간에 대한 임상 연구가 당업자에 의해 수행되어 인간에 대한 바람직한 유효 용량을 결정할 수 있다. 이러한 임상 연구는 통상적이며 당업계에 잘 알려져 있다. 또한 이용할 정확한 용량은 투여 경로에 따라 달라질 것이다. 유효 용량은 시험관 내 또는 동물 테스트 시스템에서 파생된 용량-반응 곡선으로부터 외삽될 수 있다.

면역 반응을 유도하거나 향상시키는 또 다른 방법은 면역자극, 면역강화 및/또는 전-염증 활성을 가지는 하나 이상의 사이토카인, 림포카인 또는 케모카인과 같은 하나 이상의 면역 자극제(예를 들어, 인터루킨(예: IL-1, IL-2, IL-3, IL-4, IL-12, IL-13); 성장 인자(예: 과립구-대식세포(GM)-콜로니 자극 인자(CSF)); 및 대식세포 염증 인자, Flt3 리간드, B7.1; B7.2 등과 같은 기타 면역자극 분자)를 포함하도록 본원에 기재된 바와 같은 백신 조성물을 제조함으로써 달성될 수 있다. 이러한 면역자극 분자는 코로나바이러스 백신 제형과 동일한 제형에서 투여될 수 있거나, 별도로 투여될 수 있다.

본원에 기재된 RBD 폴리펩타이드 또는 안정화된 코로나바이러스 스파이크 단백질은 척추동물에 투여될 때 척추동물(예를 들어, 인간)에서 실질적인 면역력을 유도할 수 있는 백신 제형에서 사용될 수 있다. 실질적인 면역력은 RBD 폴리펩타이드 또는 안정화된 코로나바이러스 스파이크 단백질에 대한 면역 반응의 결과이고, 상기 척추동물에서 코로나바이러스 감염으로부터 보호하거나 코로나바이러스 감염을 개선시키거나 코로나바이러스 바이러스 감염 증상을 적어도 감소시킨다. 일부 경우에, 백신접종을 받은 대상체가 이후에 감염되는 경우에는 무증상일 것이다. 그러나, 반응은 완전한 보호 반응이 아닐 수 있으며 부분 면역 반응도 본원에서 고려된다. 예를 들어, 부분적으로 보호된 대상체가 이후에 코로나바이러스에 감염되는 경우 면역력을 갖지 않은 척추동물과 비교하여 감소된 증상 중증도 또는 짧아진 증상 지속기간을 경험할 것이다. 예를 들어, SARS-CoV-2 안정화된 스파이크 단백질을 포함하는 제형으로 백신접종을 받은 대상체는 COVID-19를 치료하기 위해 장기간 입원 또는 인공호흡기 사용이 필요하지 않을 수 있다.

한 구현예에서, 본원에 기재된 바와 같은 RBD 폴리펩타이드 또는 안정화된 코로나바이러스 S 단백질을 포함하는 백신 제형의 적어도 1회 유효 용량을 투여하는 것을 포함하는, 대상체에서 1가지 이상의 코로나바이러스에 의한 감염 또는 그의 적어도 1가지의 증상에 대한 실질적인 면역력을 유도하는 방법이 본원에 제공된다. 또 다른 구현예에서, 실질적인 면역력의 상기 유도는 코로나바이러스-관련 질병 증상(예를 들어, SARS, COVID-19)의 지속기간을 감소시킨다.

한 구현예에서, 본원에 기재된 바와 같은 백신 제형은 1가지보다 많은 코로나바이러스 변종으로부터 보호하는 면역 반응을 유도할 수 있다. 특정 하위군에서 특정 변종으로부터 작제된 안정화된 코로나바이러스 S 단백질 또는 RBD 폴리펩타이드를 사용한 이러한 교차 보호는 상이한 변종 및/또는 하위군의 코로나바이러스에 대한 교차 보호를 유도할 수 있다.

키트

또한 본원에 기재된 바와 같은 백신 제형의 성분 중 하나 이상으로 채워진 하나 이상의 용기를 포함하는, 개인 또는 동물 백신접종용 키트가 본원에서 제공된다. 한 구현예에서, 키트는 2개 용기를 포함하는데, 하나는 안정화된 코로나바이러스 폴리펩타이드 또는 그의 융합 단백질을 함유하고 다른 하나는 아쥬반트를 함유한다. 이러한 용기(들)과 관련하여 의약품 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관이 규정한 형식의 안내서가 있을 수 있으며, 이 안내서는 인체 투여를 위한 제조, 사용 또는 판매 기관 허가를 반영한다.

백신 제형은 조성물의 양을 나타내는 완전 밀폐 용기, 예컨대 앰플 또는 봉지(sachette)에 포장된다. 한 구현예에서, 백신 조성물은 액체로 공급되고, 또 다른 구현예에서는 완전 밀폐 용기에서 무수 무균된 동결건조 분말 또는 무수 농축액으로 공급되고 예를 들어, 대상체에게 투여하기 위한 적절한 농도까지 물 또는 식염수로 재구성될 수 있다. 일부 구현예에서, 백신 조성물은 바람직하게는 약 1μg, 약 5μg, 약 10μg, 약 20μg, 약 25μg, 약 30μg, 약 50μg, 약 100μg, 약 125μg, 약 150μg 또는 약 200μg의 단위 용량으로 완전 밀폐 용기에 무수 무균의 동결건조 분말로 공급된다. 대안적으로, 백신 조성물의 단위 용량은 약 1μg 미만(예를 들어, 약 0.08μg, 약 0.04μg; 약 0.2μg, 약 0.4μg, 약 0.8μg, 약 0.5μg 이하, 약 0.25μg 이하 또는 약 0.1μg 이하), 또는 약 125μg 초과(예를 들어, 약 150μg 이상, 약 250μg 이상 또는 약 500μg 이상)이다. 이러한 용량은 전체 코로나바이러스 폴리펩타이드로 또는 HA의 μg로 측정될 수 있다. 백신 조성물은 동결건조 분말로부터 재구성된 후 약 12시간 이내, 바람직하게는 약 6시간 이내, 약 5시간 이내, 약 3시간 이내 또는 약 1시간 이내에 투여되어야 한다.

대안적인 구현예에서, 본원에 기재된 바와 같은 백신 조성물은 조성물의 양 및 농도를 나타내는 완전 밀폐 용기에서 액체 형태로 공급된다. 바람직하게, 백신 조성물의 액체 형태는 적어도 약 50μg/ml, 보다 바람직하게는 적어도 약 100μg/ml, 적어도 약 200μg/ml, 적어도 500μg/ml 또는 적어도 1mg/ml으로 완전 밀폐 용기에서 공급된다.

본 발명은 다음 번호가 매겨진 단락 중 어느 하나에 기재된 것일 수 있다:

1. 비천연 발생 폴리펩타이드로서, 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고, 서열번호 1의 RBD에 대해 적어도 2개의 돌연변이를 추가로 포함하고, 상기 적어도 2개의 돌연변이는 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 프로토콜 1 또는 프로토콜 2의 Blast-p을 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 비천연 발생 폴리펩타이드.

2. 비천연 발생 폴리펩타이드로서, 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고, 서열번호 1의 RED에 대해 적어도 2개의 돌연변이 또는 제2 코로나바이러스의 상응하는 잔기를 추가로 포함하고, 적어도 2개의 돌연변이는 상기 적어도 2개의 돌연변이가 결여된 야생형 폴리펩타이드의 안정성에 대하여 폴리펩타이드의 안정성을 향상시키는, 비천연 발생 폴리펩타이드.

3. 2.단락에 있어서, 적어도 2개의 돌연변이가 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는, 폴리펩타이드.

4. 2.단락 또는 3.단락에 있어서, 적어도 2개의 돌연변이가 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스의 상응하는 잔기에 있는, 폴리펩타이드.

5. 2.단락 내지 4.단락 중 어느 한 단락에 있어서, 서열번호 1의 상기 RBD 외부에 추가적인 아미노산 잔기를 추가로 포함하는 폴리펩타이드.

6. 2.단락 내지 5.단락 중 어느 한 단락에 있어서, 코로나바이러스 수용체 결합 도메인(RBD)이 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함하는, 폴리펩타이드.

7. 2.단락 내지 6.단락 중 어느 한 단락에 있어서, 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 적어도 2개의 돌연변이가 야생형에 대한 수용체 결합 도메인 내의 유일한 돌연변이인, 폴리펩타이드.

8. 2.단락 내지 7.단락 중 어느 한 단락에 있어서, 폴리펩타이드의 발현이 세포에서 발현될 때 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드의 발현과 비교하여 증가된, 폴리펩타이드.

9. 2.단락 내지 8.단락 중 어느 한 단락에 있어서, 폴리펩타이드가 코로나바이러스 항체에 결합하거나 코로나바이러스 동족 수용체를 결합시키는, 폴리펩타이드.

10. 9.단락에 있어서, 코로나바이러스 항체는 SARS-CoV-2 항체를 포함하는, 폴리펩타이드.

11. 9.단락 또는 10.단락에 있어서, 폴리펩타이드에 상응하는 코로나바이러스에 대한 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함하는, 폴리펩타이드.

12. 11.단락에 있어서, ACE 수용체는 ACE2 수용체인, 폴리펩타이드.

13. 2.단락 내지 12.단락 중 어느 한 단락에 있어서, 제2 코로나바이러스는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; 또는 HKUl로부터 선택되는 코로나바이러스의 서열을 포함하는, 폴리펩타이드.

14. 2.단락 내지 13.단락 중 어느 한 단락에 있어서, 폴리펩타이드는 서열번호 1과 적어도 90%의 서열 동일성을 포함하는, 폴리펩타이드.

15. 2.단락 내지 14.단락 중 어느 한 단락에 있어서, RBD는 제2 이종 폴리펩타이드에 융합된, 폴리펩타이드.

16. 15.단락에 있어서, RBD는 나노입자, 나노구조 또는 이종 단백질 스캐폴드에 융합된, 폴리펩타이드.

17. 2.단락 내지 16.단락 중 어느 한 단락에 있어서, RBD 폴리펩타이드 및/또는 제2 폴리펩타이드는 항원성 폴리펩타이드인, 폴리펩타이드.

18. 1.단락 내지 17.단락 중 어느 한 단락의 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.

19. 18.단락에 있어서, 아쥬반트를 추가로 포함하는, 조성물.

20. 18.단락 또는 19.단락에 있어서, 조성물의 사용기한은 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드를 포함하는 조성물보다 더 긴, 조성물.

21. 18.단락 내지 20.단락 중 어느 한 단락에 있어서, 조성물이 백신으로 제형화된, 조성물.

22. 적어도 2개의 돌연변이를 포함하는 비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드로서, 여기서 적어도 2개의 돌연변이는 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이를 포함하는, 비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드.

23. 22.단락에 있어서, 적어도 2개의 돌연변이가 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드의 안정성에 대해 코로나바이러스 폴리펩타이드의 안정성을 향상시킨, 코로나바이러스 폴리펩타이드.

24. 22.단락 또는 23.단락에 있어서, 적어도 1개의 캐비티 채움 돌연변이가 코로나바이러스 스파이크 단백질, 서브유닛 1의 리놀레산 결합 포켓에 있는 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.

25. 22.단락 내지 24.단락 중 어느 한 단락에 있어서, 적어도 1개의 캐비티 채움 돌연변이가 서열번호 1의 328-531 잔기 내의 잔기 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 잔기 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.

26. 22.단락 내지 25.단락 중 어느 한 항에 있어서, 적어도 1개의 캐비티 채움 돌연변이가 335-345; 355-375 또는 378-395 잔기 사이의 서열번호 1의 잔기 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 잔기 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.

27. 22.단락 내지 26.단락 중 어느 한 단락에 있어서, 적어도 1개의 캐비티 채움 돌연변이가 336, 338, 341, 342, 358, 361, 363, 365, 368, 374, 377, 387 또는 392 아미노산에 있는 서열번호 1의 잔기의 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.

28. 22.단락 내지 27.단락 중 어느 한 단락에 있어서, 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 잔기에 있거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는, 코로나바이러스 폴리펩타이드.

29. 22.단락 내지 28.단락 중 어느 한 단락에 있어서, 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 서열번호 1의 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로 이루어진 군으로부터 선택되거나 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기로부터 선택되는, 코로나바이러스 폴리펩타이드.

30. 22.단락 내지 29.단락 중 어느 한 단락에 있어서, 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드가 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함하거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 수용체 결합 도메인 서열과 적어도 95% 동일성을 포함하는 코로나바이러스 폴리펩타이드.

31. 22.단락 내지 30.단락 중 어느 한 단락에 있어서, 서열번호 1의 338 및 365; 365 및 513; 365 및 392; 338, 363, 365 및 377; 365 및 392; 365 및 395; 365, 392 및 395; 365, 513 및 515; 338, 363 및 365; 338, 358 및 365; 358, 365 및 513; 358, 365 및 392; 338, 358, 363, 365 및 377; 358, 365 및 392; 358, 365 및 395; 358, 365, 392 및 395; 358, 365, 513 및 515; 및/또는 338, 358, 363 및 365 아미노산에 있거나 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기가 서열번호 1에 대한 스파이크 단백질, 서브유닛 1의 유일한 돌연변이인, 코로나바이러스 스파이크 단백질.

32. 22.단락 내지 31.단락 중 어느 한 단락에 있어서, 코로나바이러스 폴리펩타이드는 서열번호 1과 적어도 95% 동일성을 포함하거나 제2 코로나바이러스의 야생형 스파이크 단백질, 서브유닛 1 아미노산 서열과 적어도 95% 동일성을 포함하는, 코로나바이러스 폴리펩타이드.

33. 22.단락 내지 32.단락 중 어느 한 단락에 있어서, 코로나바이러스 폴리펩타이드의 발현은 세포에서 발현될 때 동일한 발현 조건 하에서 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드의 발현과 비교하여 증가된, 코로나바이러스 폴리펩타이드.

34. 22.단락 내지 33.단락 중 어느 한 단락에 있어서, 코로나바이러스 폴리펩타이드는 코로나바이러스 항체에 결합하거나 동족 코로나바이러스 수용체를 결합시키는, 코로나바이러스 폴리펩타이드.

35. 34.단락에 있어서, 코로나바이러스 항체는 SARS-CoV-2 항체를 포함하는, 코로나바이러스 폴리펩타이드.

36. 35.단락에 있어서, 동족 코로나바이러스 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함하는, 코로나바이러스 폴리펩타이드.

37. 36.단락에 있어서, ACE 수용체는 ACE2 수용체인, 코로나바이러스 폴리펩타이드.

38. 22.단락 내지 37.단락 중 어느 한 항에 있어서, 코로나바이러스 폴리펩타이드는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; 또는 HKU1로부터 선택된 코로나바이러스의 조작된 돌연변이체 폴리펩타이드인, 코로나바이러스 폴리펩타이드.

39. 22.단락 내지 38.단락 중 어느 한 단락에 있어서, 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드는 서열번호 1과 적어도 90%의 서열 동일성을 포함하는, 코로나바이러스 폴리펩타이드.

40. 22.단락 내지 39.단락 중 어느 한 단락에 있어서, 코로나바이러스 폴리펩타이드는 제2 이종 폴리펩타이드에 융합된, 코로나바이러스 폴리펩타이드.

41. 22.단락 내지 40.단락 중 어느 한 단락에 있어서, 코로나바이러스 폴리펩타이드는 나노입자, 나노구조 또는 단백질 스캐폴드에 융합된, 코로나바이러스 폴리펩타이드.

42. 40.단락에 있어서, 코로나바이러스 폴리펩타이드 또는 제2 이종 폴리펩타이드는 항원성 폴리펩타이드인, 코로나바이러스 폴리펩타이드.

43. 22.단락 내지 42.단락 중 어느 한 단락의 코로나바이러스 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.

44. 43.단락에 있어서, 아쥬반트를 추가로 포함하는 조성물.

45. 43.단락 또는 44.단락에 있어서, 조성물의 사용기한은 동일한 저장 조건 하에 보관될 때 적어도 1개의 캐비티 채움 돌연변이 및 적어도 제2 돌연변이가 결여된 야생형 코로나바이러스 폴리펩타이드를 포함하는 조성물보다 긴, 조성물.

46. 43.단락 내지 45.단락 중 어느 한 단락에 있어서, 조성물은 백신으로 제형화된, 조성물.

47. 1.단락 내지 15.단락 중 어느 한 단락의 수용체 결합 도메인 또는 22,단락 내지 42.단락 중 어느 한 단락의 코로나바이러스 폴리펩타이드를 발현하는 세포.

48. 1.단락 내지 15.단락 중 어느 한 단락의 수용체 결합 도메인 또는 22.단락 내지 42.단락 중 어느 한 단락의 코로나바이러스 폴리펩타이드를 암호화하는 핵산 서열.

49. 대상체에게 코로나바이러스에 대한 백신접종을 하는 방법으로서, 상기 방법은 대상체에게 21.단락 또는 46.단락의 조성물을 투여하는 것을 포함하는, 방법.

50. 백신의 제조방법으로서, 1.단락 내지 15.단락 또는 22.단락 내지 42.단락 중 어느 한 단락의 조성물을 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함하는, 방법.

51. 1.단락 내지 25.단락 중 어느 한 단락의 폴리펩타이드를 포함하는 코로나바이러스 스파이크 단백질.

52. 프로토콜 1의 Blast-p 매개변수가 다음을 포함하는, 1.단락 내지 51.단락 중 어느 한 단락에 따른 방법 또는 조성물:

알고리즘: blastp(단백질-단백질 BLAST)

기대 임계값: 0.1

단어 크기: 6

쿼리 범위의 최대 일치항목: 0

매트릭스: BLOSUM62

갭 비용:

존재: 11

확대: 1

복잡도가 낮은 영역을 필터링합니까?: 아니요

마스크:

표만 검색합니까?: 아니요

소문자? : 아니요

53. 1.단락 내지 52.단락 중 어느 한 단락에 따른 방법 또는 조성물로서, 프로토콜 2의 Blast-p 매개변수가

blastp -query query.fasta -subject sbjct.fasta -matrix BLOSUM62 -evalue 0.1

word size 6 -gapopen 11 -gapextend 1 -out results.txt

을 포함하는, 방법 또는 조성물.

54. 서열번호 1의 코로나바이러스 폴리펩타이드에 대하여 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 돌연변이를 포함하는 코로나바이러스 수용체 결합 도메인(RBD)을 포함하는 폴리펩타이드 또는 그의 변이체.

55. 54.단락에 있어서, 돌연변이는 I358F, Y365F, Y365W, V367F 및 F392W로 이루어진 군으로부터 선택된, 폴리펩타이드.

56. 54.단락 또는 55.단락에 있어서, 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 제2 돌연변이를 포함하는, 폴리펩타이드.

57. 58.단락에 있어서, 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L5131, L513M 및 F515L로 이루어진 군으로부터 선택된 제3 돌연변이를 포함하는, 폴리펩타이드.

58. 57.단락에 있어서, 폴리펩타이드는 서열번호 4 또는 서열번호 5의 폴리펩타이드 서열을 포함하는, 폴리펩타이드.

59. 54.단락 내지 58.단락 중 어느 한 단락에 있어서, 폴리펩타이드는 이종 단백질 스캐폴드를 포함하는, 폴리펩타이드.

60. 58.단락에 있어서, 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드 서열과 적어도 90%, 적어도 95%, 또는 적어도 98% 동일성을 갖는, 폴리펩타이드.

61. 59.단락에 있어서, 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드를 포함하는, 폴리펩타이드.

62. 61.단락에 있어서, 폴리펩타이드는 서열번호 6 또는 서열번호 7의 폴리펩타이드 서열을 포함하는, 폴리펩타이드.

63. 59.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드로 이루어진 제1 성분 및 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 제2 성분을 포함하거나 이들로 이루어지는, 폴리펩타이드 복합체.

64. 54.단락 내지 62.단락 중 어느 한 단락의 조성물 또는 63.단락의 폴리펩타이드 복합체를 포함하는 백신 조성물.

65. 64.단락에 있어서, 약제학적으로 허용가능한 담체를 추가로 포함하는 백신 조성물.

66. 64.단락 또는 65.단락에 있어서, 아쥬반트를 추가로 포함하는 백신 조성물.

67. 54.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드를 발현하는 세포.

68. 54.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드를 암호화하는 핵산.

69. 대상체에게 코로나바이러스 백신접종을 하는 방법으로, 상기 방법은 대상체에게 54.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드, 63.단락의 단백질 복합체 또는 64.단락 내지 68.단락 중 어느 한 단락의 백신 조성물을 투여하는 것을 포함하는, 방법.

70. 백신 제조방법으로서, 상기 방법은 54.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드를 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함하는, 방법.

71. 백신 제조방법으로서, 상기 방법은 59.단락 내지 62.단락 중 어느 한 단락의 폴리펩타이드로 이루어진 제1 성분; 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 제2 성분; 약제학적으로 허용가능한 담체; 및 선택적으로 아쥬반트를 조합하는 것을 포함하는, 방법.

72. 비천연 발생 폴리펩타이드로서, 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)으로서, 서열번호 1의 RBD에 대해 적어도 1개의 돌연변이를 추가로 포함하고, 여기서 적어도 1개의 돌연변이는 서열번호 1의 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L5131, L513M 및 F515L로 이루어진 군으로부터 선택되는 것인, 제1 코로나바이러스 수용체 결합 도메인 또는 제2 코로나바이러스 참조 서열에서 상응하는 부위가 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인의 스파이크 단백질 서열과 서열번호 1의 서열 정렬에 의해 결정되는 것인 제2 코로나바이러스 참조 서열을 포함하는, 비천연 발생 폴리펩타이드.

73. 72.단락에 있어서, 폴리펩타이드는 F338L/Y365W; Y365W/L513M; Y365W/F392W; F338M/A363L/Y365F/F377V; Y365F/F392W; Y365F/V395I; Y365F/F392W/V395I; Y365W/L513I/F515L; F338L/A363L/Y365M; F338L/I358F/Y365W; I358F/Y365W/L513M; I358F/Y365W/F392W; F338M/I358F/A363L/Y365F/F377V; I358F/Y365F/F392W; I358F/Y365F/V395I; I358F/Y365F/F392W/V395I; I358F/Y365W/L513I/F515L; 및 F338L/I358F/A363L/Y365M로부터 선택되는 2개 이상의 돌연변이를 포함하는, 폴리펩타이드.

실시예

실시예 1

이상적인 단백질 기반의 코로나바이러스 백신은 매우 효과적인 동시에 확장 가능하게 제조될 수 있어야 하며, 후자의 특성은 백신 수율 및 안정성에 의해 크게 영향을 받는다. RNA 또는 DNA 면역화를 이용하는 유전자 백신은 또한 SARS-CoV-2에 대하여 더 자주 연구되고 있고 그 효능은 표적 항원의 발현 수준에 의해 영향을 받는다. 많은 코로나바이러스, 가장 특히는 SARS-CoV-2 및 관련 사르베코바이러스의 수용체 결합 도메인(RBD)은 강력하게 중화하는 많은 RBD 표적 항체의 단리로 인해 매우 가치 있는 도메인 기반의 백신 표적으로 간주된다. RBD는 여러 형태로 생산할 수 있기 때문에 수율 및 안정성 한계는 RBD 기반의 단백질 백신이 확장 가능하게 제조 및 유통되지 못하게 한다.

본원에서는 이러한 코로나바이러스 RBD를 함유하는 면역원의 수율과 안정성을 향상시키도록 설계된 코로나바이러스 수용체 결합 도메인(RBD) 폴리펩타이드의 예시적인 돌연변이를 제공하다. 수용체 결합 도메인을 함유하는 면역원은 천연(즉, 야생형) RBD 서열을 가지는 등가의 면역원과 비교하여 개선된 용액 안정성에 더하여 매우 개선된 발현 및/또는 수율을 입증하는 안정화 돌연변이를 설정하여 발생되었다. 당업자가 이해할 수 있는 바와 같이, 주어진 단백질의 증가된 발현은 부분적으로는 단백질의 개선된 안정성에 기인할 수 있다. 설계된 면역원은 SARS-CoV-2-표적 항체 및 ACE2 수용체에 의해 밸리데이션된 바와 같이 항원적으로 온전하다. 종합적으로, 이러한 돌연변이 세트는 다양한 코로나바이러스에 대한 백신을 확장 가능하게 제조하는 능력을 향상시켜, RBD를 표적으로 하는 유전자 백신 성능에 일조할 수도 있다.

염기 서열 및 돌연변이 번호 : SARS-CoV-2 서열(서열번호 1)은 다른 코로나바이러스에서 돌연변이 번호지정에 대한 근거로 명세서 전체에서 사용된다. SARS-CoV-2 서열의 수용체 결합 도메인은 이하에서 굵고 밑줄그어진 문구로 표시된다(서열번호 2): 다음 서열(또는 그의 수용체 결합 도메인; 서열번호 2)은 적어도 제2 코로나바이러스 서열과 함께 정렬될 수 있다.

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIV RFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKK STNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT (서열번호 1)

코로나바이러스 단백질의 수율과 안정성을 모두 향상시킬 수 있는 돌연변이의 예시 목록은 다음 목록에 제공된다(모든 아미노산 잔기의 번호는 전술한 "염기 서열"(서열번호 1)을 기반으로 한다:

1. F338L/Y365W,

2. Y365W/L513M,

3. Y365W/F392W,

4. F338M/A363L/Y365F/F377V,

5. Y365F/F392W,

6. Y365F/V395I,

7. Y365F/F392W/V395I,

8. Y365W/L513I/F515L,

9. F338L/A363L/Y365M,

10. F338L/I358F/Y365W,

11. I358F/Y365W/L513M,

12. I358F/Y365W/F392W,

13. F338M/I358F/A363L/Y365F/F377V,

14. I358F/Y365F/F392W,

15. I358F/Y365F/V395I,

16. I358F/Y365F/F392W/V395I,

17. I358F/Y365W/L513I/F515L,

18. F338L/I358F/A363L/Y365M,

19. I358F/Y365W 및

20. I358F/F392W.

재료 및 방법

발현 및 단백질 정제: 16개 잔기 링커를 가지는 I53-50 삼량체 "A" 성분에 유전적으로 융합된 돌연변이 수용체 결합 도메인을 암호화하는 유전자(서열번호 1의 천연 수용체 결합 도메인 328-531 잔기, 또는 변이체, 예를 들어 B.1.351 변이체로부터의 등가 서열)는 XbaI 및 AvrII 제한 부위를 사용하여 pCMV/R 벡터에서 복제되었다.

I53-50 삼량체 "A" 성분의 서열은 다음과 같다:

MKMEELFKKHKIVAVLRANSVEEAIEKAVAVFAGGVHLIEITFTVP

DADTVIKALSVLKEKGAIIGAGTVTSVEQCRKAVESGAEFIVSPHLD

EEISQFCKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQ

FVKAMKGPFPNVKFVPTGGVNLDNVCEWFKAGVLAVGVGSALVK

GTPDEVREKAKAFVEKIRGCTE (서열번호 3)

모든 서열에서는 "MGILPSPGMPALLSLVSLLSVLLMGCVAETGT" 분비 신호가 앞에 있고 C-말단에서 "GGSHHHHHHHH" 서열로 태그되어 정제가 가능하게 된다. 일부 구현예에서, I53-50 삼량체 성분의 N-말단 메티오닌은 나선형 서열 "EKAAKAEEAAR"로 대체되어, 항원 접근성을 개선시킨다. I53-50 삼량체 성분의 모든 시스테인은 알라닌으로 돌연변이되었다. 인간 ACE2 엑토도메인은 C-말단에서 트롬빈 절단 부위 및 인간 Fc 단편을 암호화하는 서열에 유전적으로 융합되었다. hACE2-Fc는 BM40 신호 펩타이드를 사용하여 GenScript에 의해 합성되고 복제되었다. CR3022 중쇄 및 경쇄를 암호화하는 유전자가 GenScript에서 배열되어 pCMV/R 내로 복제되었다.

모든 단백질은 150rpm으로 회전시키며 33℃, 70% 습도, 8% CO2에서 Expi293F 발현 배지(Life Technologies)를 사용하여 현탁액에서 성장한 Expi293F 세포에서 생산되었다. 세포 배양물은 PEI-MAX(Polyscience)를 사용하여 mL당 3.0백만 세포 밀도로 성장된 세포로 형질감염되었고 3일 동안 배양되었다. 상층액은 4000 rcf로 원심분리되고 최종 농도 0.0375%(Sigma Aldrich)가 되도록 PDADMAC를 첨가하고 4000 rcf에서 제2 스핀에 의해 투명층으로 분리되었다(clarified).

His 태그를 함유하는 단백질은 투명층으로 분리된 각각의 상층액에 1M Tris-HCl(pH 8.0)을 최종 농도가 45mM이 되도록 보충하고 5M NaCl을 최종 농도가 약 310mM이 되도록 보충하는 배치(batch) 결합 방법을 통해 투명층으로 분리된 상층액으로부터 정제되었다. 탈론 코발트 친화성 수지(Takara)를 처리된 상층액에 첨가하였고 부드럽게 진탕시키면서 15분 동안 인큐베이션하였다. 0.2μm 필터를 사용한 진공 여과를 이용하여 수지를 수집하고 중력 컬럼으로 옮겼다. 수지를 20mM Tris pH 8.0, 300mM NaCl로 세척하고, 단백질을 컬럼 부피 3배의 20mM Tris pH 8.0, 300mM NaCl, 300mM 이미다졸로 용출시켰다. 단일클론 항체 및 인간 ACE2-Fc를 발현하는 투명층으로 분리된 세포 상층액을 AKTA Avantl50 FPLC(Cytiva) 상에서 MabSelect PrismA 2.6×5cm 컬럼(Cytiva)을 사용하여 정제하였다. 결합된 항체를 컬럼 부피 5배의 20mM NaPO4, 150mM NaCl pH 7.2, 이어서 컬럼 부피 5배의 20mM NaPO4, 1M NaCl pH 7.4로 세척하였고 컬럼 부피 3배의 100mM 글리신으로 pH 3.0에서 용출시켰다. 용출액은 2M Trizma 염기로 50mM 최종 농도가 되도록 중화시켰다.

생물층 간섭계: 상층액 중 단백질 분비 수준을 측정하기 위해, 단백질 발현으로부터의 모든 상층액을 KB1(25mM Tris pH 8.0, 150mM NaCl, 0.5% 소 혈청 알부민 및 0.01% TWEEN-20)에 1:10으로 희석했다. 정제된 ACE2-Fc 또는 CR3022 항체를 KB1에 0.02mg/mL로 희석하고, 8채널 Octet 시스템(Pall /Sartorius)을 사용하여 300초 동안 AHC 팁(tip)(Pall /Sartorius) 상에 고정하였다. 60초 후 기준선을 KB1에서 수집하고, 센서를 희석된 ACE2-Fc 또는 CR3022 용액 각각에 300초 동안 노출시킨 후 KB1에서 300초 해리 단계를 수행했다. 친화도 측정을 위해, 모든 단백질 및 항체를 검정 96-웰 Greiner Bio-one 마이크로플레이트에서 0.5% 소 혈청 알부민 및 0.01% TWEEN-20(KB2)이 포함된 인산염 완충 식염수에 웰당 200μL로 희석하고, 기준선 및 해리 단계를 위해서는 완충액만 사용했다. 10ug/mL의 CV30 또는 CR3022 IgG를 예비-수화된 단백질 A 바이오센서(Pall /Sartorius) 상에 150초 동안 로딩한 후 60초 기준선이 이어졌다. 그런 다음 바이오센서를 결합 단계로 옮기되, 야생형 또는 안정화된 단량체 RBD의 5회 연속 2배 희석 중 하나를 120초 동안 수행하고, CV30에 사용되는 RBD 농도는 125μM, 62.5μM, 31.3μM, 15.6μM 및 7.8μM이고 CR3022에 사용되는 RBD 농도는 31.3μM, 15.6μM, 7.8μM, 3.9μM 및 2.0μM이었다. 결합 후, 바이오센서를 300초 해리를 위해 완충액으로 옮겼다. 결합 및 해리 단계로부터의 데이터는 기준선에서 차감되었고, 동역학 측정치는 1:1 결합 모델( 분석 소프트웨어, 버전 12.0)을 사용하여 RBD의 5회 연속 희석 모두에 걸쳐 전반적으로 계산되었다. 나노입자 면역원의 분별 항원성 측정을 위해, 단량체 RBD 및 RBD-I53-50 나노입자에 대한 hACE2-Fc(이량체화 수용체) 및 CR3022 IgG의 결합을 주위 온도에서 1000rpm으로 진탕하면서 분석하였다. 단백질 샘플을 Kinetics 완충액(Pall /Sartorius)에서 100nM까지 희석했다. 그 다음, 완충액, 항체, 수용체 및 면역원을 검정 96-웰 Greiner Bio-one 마이크로플레이트에 웰당 200μL로 도포했다. 단백질 A 바이오센서를 Kinetics 완충액에서 10분 동안 먼저 수화시킨 다음, 고정화 단계에서 Kinetics 완충액에서 10μg/mL까지 희석된 hACE2-Fc 또는 CR3022에 침지한다. 500초 후, 베이스라인에 도달하도록 팁을 Kinetics 완충액으로 90초 동안 옮겼다. 결합 단계는 로딩된 바이오센서를 면역원에 300초 동안 침지하여 수행했고, 후속의 해리 단계는 바이오센서를 Kinetics 완충액에 추가 300초 동안 다시 침지하여 수행했다. 분석 소프트웨어(버전 12.0)를 사용하여 그래프를 작성하기 전에 데이터에서 기준선을 차감했다.

열 용융물: RBD 기반의 샘플은 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤을 함유하는 완충액에서 제조하는 한편, HexaPro-폴돈 기반의 샘플은 50mM Tris pH 8.0, 150mM NaCl, 0.25% w/v L-히스티딘, 5% 글리세롤을 함유하는 완충액에서 제조했다. 비-평형 용융 온도는 분당 1 ℃의 열 램핑(thermal ramp)을 이용하여 20 내지 95℃에서 수집된 고유 트립토판 형광 방출 스펙트럼의 무게중심 평균을 기반으로 하는 UNcle™(UNchained Labs)을 이용하여 결정했다. 용융 온도는 용융 곡선의 1차 도함수의 최대점으로 정의되었으며, 1차 도함수는 2차 다항식 설정을 이용하여 4개의 인접 점으로 평활화한 후 GraphPad Prism 소프트웨어를 사용하여 계산했다.

SYPRO Orange 형광: 5000x SYPRO Orange Protein Gel Stain(Thermo Fisher)를 25mM Tris pH 8.0, 150mM NaCl, 5% 글리세롤 내에 희석하였고, 동일한 완충액에서 제조된 단량체 RBD에 더 첨가하되, RBD의 경우 1.0mg/mL의 최종 농도가 되도록 하고 SYPRO Orange의 경우 20x의 최종 농도가 되도록 하였다. 샘플은 UNcle Nano-DSF(UNChained Laboratories)에 로딩되었고 SYPRO Orange를 샘플에 첨가한 후 5분 후에 모든 샘플에 대해 형광 방출 스펙트럼을 수집했다.

시험관 내 나노입자 조립체: 정제된 개별 나노입자 성분의 총 단백질 농도는 UV/vis 분광광도계(Agilent Cary 8454)를 이용하여 280nm에서 흡광도를 측정하여 결정하고 흡광 계수를 계산했다. 조립 단계는 실온에서 다음 순서로 첨가하여 수행했다: 야생형 또는 안정화된 RBD-I53-50A 삼량체 융합 단백질, 이후 원하는 최종 농도를 달성하기 위해 필요한 만큼의 충분한 완충액, 및 마지막으로 I53-50B.4PT1 오량체 성분(50mM Tris pH 8, 500mM NaCl, 0.75% w/v CHAPS 중에서 RBD-I53-50A:I53-50B.4PTl의 몰비가 1.1:1이다. 충분량의 완충액은 50mM Tris pH 7.4, 185mM NaCl, 100mM L-아르기닌, 0.75% CHAPS, 4.5% 글리세롤을 함유하거나 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤을 함유함). 모든 RBD-I53-50 시험관 내 조립체는 조립되지 않은 잔류 성분을 제거하기 위한 후속 정제 전에 적어도 30분 동안 적당하게 흔들면서 2 내지 8℃에서 인큐베이션했다. Superose 6 Increase 10/300 GL 컬럼은 나노입자 생산을 위해 이용했다. 조립된 입자는 Superose 6 컬럼 상에서 약 11mL로 용출된다. 조립된 나노입자는 컬럼에 적용하기 직전에 그리고 SEC 분획물을 풀링(pooling)한 직후에 제균 여과(0.22μm)했다.

음성 염색 전자현미경: 샘플 3μL을 새 글로우(glow)-방전된 300메시 구리 그리드에 도포하기 전에 야생형 RBD-I53-50 나노입자 및 Rpk-I53-50 나노입자를 우선 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% v/v 글리세롤 중에서 75 μg/mL까지 희석했다. 샘플을 그리드 상에서 1분 동안 인큐베이션한 후에 그리드를 물방울 50μL에 침지하고 과량의 액체를 여과지(Whatman)로 닦아냈다. 그 다음, 그리드를 0.75% w/v 우라닐 포르메이트 염색 3 μL에 침지했다. 염색을 여과지로 닦아낸 다음 그리드를 또 다른 염색 6μL에 침지하고 약 90초 동안 인큐베이션했다. 마지막으로, 염색을 제거하고 그리드를 보관 또는 이미지화하기 전에 1분 동안 건조했다. 준비된 그리드는 57,000 x 배율의 Gatan 카메라를 이용하는 Talos 모델 L120C 투과 전자 현미경에서 이미지화했다.

동적 광산란: 동적 광산란(DLS)을 이용하여, UNcle(UNchained Laboratories) 상에서 RBD-I53-50 나노입자 샘플의 유체역학적 직경(Dh) 및 다분산도(%Pd)를 측정했다. 샘플을 8.8 μL 석영 모세관 카세트(UNi, UNchained Laboratories)에 도포하고, 레이저 자동 감쇠를 이용하여 5초마다 10회 포착하여 측정했다. RBD 나노입자 완충액에서 5% v/v 글리세롤로 인한 점도 증가는 Dh 측정에서 UNcle Client 소프트웨어에 의해 설명되었다.

수소/중수소 교환 질량분석기: RBD-I53-50A, Rpk4-I53-50A 및 Rpk9-I53-50A 삼량체 3mg 각각은 중수소화 완충액(pH^* 7.5, 85% D₂O, Cambridge Isotope Laboratories, Inc.)에서 22℃에서 3, 15, 60, 1800 및 72000초 동안 H/D 교환(HDX)되었다. 그 후, 교환된 샘플을 최종 pH 2.5가 되도록 얼음으로 냉각된 켄칭 완충액(200mM 트리스(2-클로로에틸) 포스페이트(TCEP), 8M 우레아, 0.2% 포름산(FA))과 1:1로 혼합되고 즉시 액체 질소에 급속 동결되었다. 모든 컬럼, 루프, 밸브 및 라인을 0℃로 유지한 로딩 시스템을 이용하여 Synapt G2-Si 질량 분석기 상에서 LC-MS로 샘플을 분석했다. 동결된 샘플을 얼음 위에서 해동하고, 고정화된 펩신 컬럼(2.1 x 50mm) 상에서 0.1% 트리플루오로아세트산(TFA)과 2% 아세토니트릴의 200mL/분 유속으로 로딩했다. 펩타이드는 18분에 걸쳐 B 3%부터 40%까지의 선형 구배로 Waters CSH C18 1×100mm 1.7μm 컬럼 상에서 분리되기 전에 Waters CHS C18 트랩 카트리지(2.1 x 5mm) 상에서 포획되었다(A: 98 % 물, 2% 아세토니트릴, 0.1% FA, 0.025% TFA, B: 100% 아세토니트릴, 0.1% FA, 유속 40mL/분). 교차오염(carryover)을 최소화하기 위해 샘플 실행 사이에 연속 세척을 수행했다. 사용된 모든 물 및 유기 용매는 특별히 언급되지 않는 한 MS 등급(Optima™, Fisher)이었다. 각 샘플 시리즈에 대해 완전 중수소화된 대조군은 펩신-분해된 중수소화되지 않은 샘플로부터 LC 용출액 수집, 스피드백(speedvac) 건조, 중수소화 완충액에서 85 ℃로 1시간 동안 인큐베이션하고, 다른 모든 HDX 샘플과 동일하게 켄칭하여 제조했다. 모든 샘플에 대해 일관된 라벨링 조건을 보장하기 위해 내부 교환 표준품(Pro-Pro-Pro-Ile[PPPI] 및 Pro-Pro-Pro-Phe[PPPF])이 각 샘플에 추가되었다. 펩타이드는 DriftScope™(Waters)를 사용하여 수동으로 밸리데이션되었고, 직교 체류 시간 및 드리프트 시간 좌표에 의해 확인되었다. 중수소 흡수 분석은 HX-Express v2로 수행했다. 피크는 펩타이드 m/z 값을 기반으로 하는 펩타이드 스펙트럼에서 확인되었고, 이항 피팅이 적용되었다. 중수소 흡수 수준은 완전 중수소화된 대조군에 대하여 정규화되었다.

마우스 면역화: 4주령의 암컷 BALB/c(스톡: 000651) 마우스를 메인주, 바 하버의 The Jackson Laboratory에서 구입하여 워싱턴주 시애틀의 워싱턴 대학(the University of Washington)의 비교 의학 시설(Comparative Medicine Facility)에서 관리하고 실험실 동물 관리 국제 인증 협회(AAALAC)에서 승인받았다. 투여군 당 생후 6주령 마우스 6마리에게 일차 면역주사로 백신접종하였고 3주 후에 마우스에 이차 면역주사로 부스터 접종했다. 접종 전에 면역원 현탁액을 AddaVax 아쥬반트(Invivogen, San Diego, CA)와 1:1 vol/vol로 부드럽게 혼합하여, 항원의 최종 농도가 0.009 또는 0.05mg/mL에 도달하도록 하였다. 이소플루란 마취 하에 주사 부위당 면역원 50 μL(총 100 μL)을 27-게이지 바늘(BD, San Diego, CA)을 이용하여 마우스의 각 뒷다리 비복근 근육에 근육내 주사하였다. 혈청을 얻기 위해 일차 및 부스터 면역주사 후 2주 후에 모든 마우스로부터 채혈하였다. 혈액은 턱밑정맥 천자를 통해 채취했고, 실온에서 30분 동안 1.5mL 플라스틱 에펜도르프 튜브에서 정치하여 응고되도록 하였다. 혈청은 10분 동안 2,000g로 원심분리하여 헤마토크릿으로부터 분리되었다. 단리된 혈청에 있는 보체 인자와 병원체는 56℃에서 60분 동안 인큐베이션하여 열-불활성화되었다. 혈청은 사용할 때까지 4℃ 또는 -80℃에서 보관했다. 모든 실험은 승인된 기관 동물 관리 및 사용 위원회 프로토콜에 따라 워싱턴주 시애틀의 워싱턴 대학에서 수행했다.

ELISA: 효소 면역흡착 검정법(ELISA)을 사용하여, 전달된 항원에 대한 마우스 혈청의 결합을 결정했다. 요약하면, Maxisorp(Nunc) ELISA 플레이트를 4℃에서 웰당 0.1M 중탄산나트륨 완충액, pH 9.4 중 관심 단백질 0.08μg/mL로 밤새 코팅했다. 그 다음, 실온에서 1시간 동안 0.05%(v/v) Tween 20(TBST)이 포함된 TBS 중 분유(BioRad)의 4%(w/v) 용액으로 플레이트를 차단했다. 혈청의 연속 희석물을 플레이트에 첨가하고, 세척 후, 과산화수소 커플링된 말 항-마우스 IgG 항체를 사용하여 항체 결합을 밝혀냈다. 그 다음, 플레이트를 TBST로 철저히 세척하고, 비색 기질(TMB, Thermo Fisher)을 첨가하고 450nm에서 흡광도를 판독했다. 곡선하 면적(AUC) 계산은 인접한 흡광도 측정 쌍과 기준선 사이에 생성된 사다리꼴 영역을 추가하여 생성되었다.

슈도바이러스(pseudovirus) 중화 검정법: 스파이크-슈도타이핑된 렌티바이러스 중화 검정법은 Addgene(#158762) 또는 BEI(NR-53765)에서 입수 가능하고 그 전체 서열이 www.addgene.org/158762Error! Hyperlink reference not valid.의 전세계 웹에서 입수 가능한 스파이크 HDM_Spikedelta21_D614G을 이용했다. 즉, 293T-ACE2 세포(BEI NR-52511)를 폴리-L-리신 코팅된 검정 벽의 투명 바닥 96-웰 플레이트(Greiner 655930)에서 웰당 50uL DIO 성장 배지(10% 열-불활성화 FBS, 2mM L-글루타민, 100U/mL 페니실린 및 100μg/mL 스트렙토마이신이 있는 DMEM) 중 1.25×10⁴ 세포로 시딩하였다. 다음날, 마우스 혈청 샘플을 56℃에서 30분 동안 열 불활성화한 다음 D10 성장 배지에서 연속 희석했다. 스파이크-슈도타이핑된 렌티바이러스를 1:50까지 희석하여, 웰당 약 200,000 RLU를 산출하고, 혈청 희석액과 함께 37℃로 1시간 동안 인큐베이션했다. 그 다음, 바이러스-혈청 혼합물 100μL를 세포에 첨가하고 약 52시간 후 Bright-Glo Luciferase Assay System(Promega, E2610)을 이용하여 루시퍼라제 활성을 측정했다. 중화 검정법의 각 배치에는 2017-2018년에 채취된 인간 혈청의 음성 대조군 샘플과 공지 중화 항체가 포함되어, 배치 간 일관성을 보장하였다. 각 웰에 대한 감염 분율은 플레이트의 동일한 행에 2개 "무혈청" 대조군 웰과 비교하여 계산하였다. "neutcurve" 패키지(전세계 웹에서 jbloomlab.github.io/neutcurve 버전 0.5.2에서 입수 가능함)를 이용하여, 하단이 0으로 고정되고 상단이 1로 고정된 Hill 곡선을 피팅하여 억제 농도 50%(IC₅₀), 및 각 혈청 샘플에 대한 단순 1/IC₅₀인 중화 역가 50%(NT50)를 계산했다.

정량화 및 통계 분석: GraphPad Prism 8에서 Dunn 사후 분석과 함께 비모수 Kruskal-Wallis 테스트를 사용하여 다중 그룹 비교를 수행했다. P 값이 0.05 미만일 때 차이가 유의한 것으로 간주되었다.

실시예 2

재료 및 방법

세포주

Expi293F 세포는 형질전환되어 현탁액에서 성장하도록 적응된 여성 인간 배아 신장 세포주인 HEK293F 세포주(Life Technologies)에서 유래된다. Expi293F 세포는 Expi293 Expression Medium(Life Technologies)에서 성장하고 36.5℃에서 8% CO₂와 함께 배양하고 150rpm에서 진탕했다. VeroE6은 아프리카 녹색 원숭이의 암컷 신장 상피 세포이다. HEK-ACE2 부착 세포주는 BEI Resources, NIAID, NIH: 인간 안지오텐신-전환 효소(Human Angiotensin-Converting Enzyme) 2를 발현하는 인간 배아 신장 세포(Human Embryonic Kidney Cells)(HEK293T), HEK293T-hACE2 세포주, NR-52511을 통해 얻었다. 모든 부착 세포는 DMEM + 10% FBS(Hyclone) + 1% 페니실린-스트렙토마이신을 사용하여 플라스크에서 8% CO₂와 함께 37℃에서 배양했다. Expi293F 이외의 세포주는 마이코플라스마 오염에 대해 테스트되지 않았으며 인증되지도 않았다.

마우스

암컷 BALB/c 마우스(4주령)는 메인 주, 바 하버의 Jackson Laboratory에서 구했다. 동물 절차는 워싱턴주, 시애틀에 있는 워싱턴 대학의 기관 동물 관리 및 사용 위원회의 승인 하에 수행되었다.

안정화 돌연변이의 설계

Rosetta에서의 모든 계산은 버전 v2020.22-dev61287을 사용하여 수행되었다. 모든 설계 궤적은 스파이크의 cryo-EM 구조에서 관찰된 닫힌 대칭 삼량체 구조형태(PDB 6VXX) 및 RBD의 결정 구조(PDB 6YZ5)와 관련된 RBD를 평가했다. PDB 항목 6VXX의 3회 대칭 축은 [0,0,1]로 정렬되었고, 단일 프로토머(protomer)는 .pdb 형식으로 보관되었다. PDB 6YZ5의 RBD 단량체는 PDB 6VXX의 프로토머와 구조적으로 중첩되었고 마찬가지로 보관되었다. 설계 프로토콜은 정렬된 프로토머와 맞춤형(custom) resfile를 입력치로 사용하는 RosettaScripts(58, 59)를 사용하여 작성되고, resfile은 설계 중에 샘플링되는 측쇄 아이덴티티 및 구조형태를 명령한다. 프로토콜은 resfile 입력치를 기반으로 하는 대칭 모델에 두 라운드의 설계를 적용하고 각 설계 단계 후에 측쇄 최소화가 적용된다. 프로토콜은 측쇄 최소화와 함께 백본 최소화가 동시에 수행될 수 있도록 하고, 백본 최소화를 허용하거나 허용하지 않으면서 궤적을 수행했다. 설계 및 최소화 단계 모두는 resfile에 나열된 모든 돌연변이 가능하거나 패킹 가능한(packable) 잔기의 10Å 이내의 잔기를 재패킹하거나 최소화하도록 허용했다. 잔기 위치는 스파이크 및 RBD 구조를 기반으로 위치 358, 365, 392 및 주변 잔기를 포함하도록 수동으로 선택했으며, 가능한 잔기 아이덴티티는 'PIKAA' 옵션을 사용하여 resfile의 각 위치에 대해 지정했다. Resfile 입력치는 I358F, Y365F, Y365W 및/또는 F392W의 여러 조합을 포함하는 동시에 주변 잔기에 대한 돌연변이를 제한하거나 허용하도록 다양화되었다. 추가적인 resfile 입력치는 유사하게 설정되었지만 358, 365 및 392 위치를 특정 아이덴티티로 제한하지 않았다. 설계 모델과 점수를 수동으로 검사하여, 구조적으로 유리한 것으로 보이는 상호 작용을 확인했다. 돌연변이는 천연적으로 용매에 노출되거나 수소 결합에 관여하는 극성 기를 매립한 경우에 폐기된다. 항원성에 대한 바람직하지 않은 변경을 방지하기 위해, 표면에 노출된 잔기에 대한 돌연변이는 자주 고려되지 않았다. 유리한 돌연변이 세트를 최적화된 resfile로부터 반복하여 재테스트하고, 수동으로 정제하여 여러 설계 세트를 완성했다.

플라스미드 작제

SARS-CoV-2 RBD에 대한 야생형 및 안정화된 서열은 16개의 글리신 및 세린 잔기의 링커를 이용하여 삼량체 I53-50A 나노입자 성분의 N 말단에 유전적으로 융합되었다. 각각의 I53-50A 융합 단백질은 또한 C-말단 옥타-히스티딘 태그를 보유하고, 단량체 서열은 Avi 및 옥타-히스티딘 태그 둘 모두를 포함한다. 모든 서열은 Xbal 및 AvrII 제한 부위 및 깁슨 조립체(Gibson assembly)를 사용하여 pCMV/R 내로 복제되었다. 모든 RBD-함유 성분에는 N-말단 뮤-포스파타제 신호 펩타이드가 함유되었다. hACE2-Fc는 BM40 신호 펩타이드를 사용하여 GenScript에 의해 합성 및 복제되었다. 면역화 연구에 사용되는 HexaPro-폴돈 작제물은 기재된 바와 같이 생산되었고(Hsieh 등 Science 369: 1501-05 (2020)) 옥타-히스티딘 태그를 가지는 pCMV/R 내에 위치한다. 발현 및 안정성 비교에 사용되는, Rpk9 돌연변이를 가지거나 가지지 않는 HexaPro-폴돈 작제물은 BM40 신호 펩타이드를 함유하였고 pCMV/R 내에 위치했다. 플라스미드는 Expi293F 세포 내로 일시적 형질감염을 위한 플라스미드를 얻기 위한 박테리아 배양물(NucleoBond Xtra Midi 키트)로부터 후속 DNA 추출을 위해 대장균(New England Biolabs)의 NEB 5α 균주 내로 형질전환되었다. 본 연구에 사용된 모든 신규 단백질의 아미노산 서열은 서열번호 21-47로 제공된다.

>RBD-I53-50A 삼량체 (16-GS 링커, Wuhan-Hu-1로부터 야생형 RBD를 사용함)

서열번호 21

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADY SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk1-I53-50A 삼량체; 서열번호 22

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk2-I53-50A 삼량체; 서열번호 23

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPLGEVFNATRFASVYAWNRKRISNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk3-I53-50A 삼량체; 서열번호 24

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVMSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk4-I53-50A; 서열번호 25

삼량체MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISN

CVADYSVLYNSASFSTFKCYGVSPTKLNDLCWTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTG

CVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk5-I53-50A 삼량체; 서열번호 26

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCWTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk6-I53-50A 삼량체; 서열번호 27

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPMGEVFNATRFASVYAWNRKRISNCVLDF SVLYNSASFSTVKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk7-I53-50A 삼량체; 서열번호 28

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCWTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk8-I53-50A 삼량체; 서열번호 29

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCFTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk9-I53-50A 삼량체; 서열번호 30

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk10-I53-50A 삼량체; 서열번호 31

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVISLELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk11-I53-50A 삼량체; 서열번호 32

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPLGEVFNATRFASVYAWNRKRISNCVLDM SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk12-I53-50A 삼량체; 서열번호 33

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRFSNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRANSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk13-I53-50A 삼량체; 서열번호 34

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPLGEVFNATRFASVYAWNRKRFSNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk14-I53-50A 삼량체; 서열번호 35

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRFSNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVMSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk15-I53-50A 삼량체; 서열번호 36

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRFSNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCFTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk16-I53-50A 삼량체; 서열번호 37

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRFSNCVADW SVLYNSASFSTFKCYGVSPTKLNDLCWTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIVSPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>Rpk17-I53-50A 삼량체; 서열번호 38

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRFSNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGGSGGSGSGGSGGSGSEKAAKAEEAARKMEELFKKHKIVAVLRA NSVEEAIEKAVAVFAGGVHLIEITFTVPDADTVIKALSVLKEKGAIIGAGTVTSVEQARKAVESGAEFIV SPHLDEEISQFAKEKGVFYMPGVMTPTELVKAMKLGHTILKLFPGEVVGPQFVKAMKGPFPNVKFVPTGG VNLDNVAEWFKAGVLAVGVGSALVKGTPDEVREKAKAFVEKIRGATEGGSHHHHHHHH

>RBD 단량체 (Avi 및 헥사-히스티딘 태그를 가짐); 서열번호 39

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADY SVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGLNDIFEAQKIEWHEHHHHHHHH

>Rpk4 단량체 (Avi 및 헥사-히스티딘 태그를 가짐); 서열번호 40

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADY SVLYNSASFSTFKCYGVSPTKLNDLCWTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGLNDIFEAQKIEWHEHHHHHHHH

>Rpk9 단량체 (Avi 및 헥사-히스티딘 태그를 가짐); 서열번호 41

MGILPSPGMPALLSLVSLLSVLLMGCVAETGTRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADF SVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIA WNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGY QPYRVVVLSFELLHAPATVCGPKKSTGLNDIFEAQKIEWHEHHHHHHHH

>I53-50B.4PT1 오량체; 서열번호 42 MNQHSHKDHETVRIAVVRARWHAEIVDACVSAFEAAMRDIGGDRFAVDVFDVPGAYEIPLHARTLAETGR YGAVLGTAFVVNGGIYRHEFVASAVINGMMNVQLNTGVPVLSAVLTPHNYDKSKAHTLLFLALFAVKGME AARACVEILAAREKIAAGSLEHHHHHH

>2OBX오량체; 서열번호 43 MNQHSHKDYETVRIAVVRARWHADIVDQCVSAFEAEMADIGGDRFAVDVFDVPGAYEIPLHARTLAETGR YGAVLGTAFVVNGGIYRHEFVASAVIDGMMNVQLSTGVPVLSAVLTPHNYHDSAEHHRFFFEHFTVKGKE AARACVEILAAREKIAAGSLEHHHHHH

>면역화를 위해 사용되는 Hexapro-폴돈(Wuhan-Hu-1); 서열번호 44

MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHV SGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPF LGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPI NLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYN ENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASV YAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIAD YNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYF PLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFL PFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLT PTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPGSASSVASQSIIAYTMSLG AENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGI AVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSPIEDLLFNKVTLADAGFIKQYGDC LGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGPALQIPFPMQMAYRFNGIG VTQNVLYENQKLIANQFNSAIGKIQDSLSSTPSALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDI LSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLM SFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNT FVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVA KNLNESLIDLQELGKYEQGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGRSLEVLFQGPGHHHHHHHHSAW SHPQFEKGGGSGGGGSGGSAWSHPQFEK

>Rpk9-Hexapro-폴돈과의 발현 및 안정성 비교를 위해 사용되는 Hexapro-폴돈(Wuhan-Hu-1); 서열번호 45

MARAWIFFLLCLAGRALAQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWF HAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQF CNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYS KHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTF LLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNAT RFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQT GKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEG FNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTES NKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIH ADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPGSASSVASQSIIAY TMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNR

ALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSPIEDLLFNKVTLADAGFIK QYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGPALQIPFPMQMAYR FNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTPSALGKLQDVVNQNAQALNTLVKQLSSNFGAISS VLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGK GYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQII TTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDR LNEVAKNLNESLIDLQELGKYEQGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGRSLEVLFQGPGHHHHHH

HH

>Rpk9-Hexapro-폴돈(Wuhan-Hu-1); 서열번호 46

MARAWIFFLLCLAGRALAQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWF HAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQF CNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYS KHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTF LLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNAT RFASVYAWNRKRISNCVADFSVLYNSASFSTFKCYGVSPTKLNDLCWTNIYADSFVIRGDEVRQIAPGQT GKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEG FNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTES NKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIH ADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPGSASSVASQSIIAY TMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNR ALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSPIEDLLFNKVTLADAGFIK QYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGPALQIPFPMQMAYR FNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTPSALGKLQDVVNQNAQALNTLVKQLSSNFGAISS VLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGK GYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQII TTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDR LNEVAKNLNESLIDLQELGKYEQGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGRSLEVLFQGPGHHHHHH

HH

>hACE2-FC; 서열번호 47 MARAWIFFLLCLAGRALASTIEEQAKTFLDKFNHEAEDLFYQSSLASWNYNTNITEENVQNMNNAGDKWS AFLKEQSTLAQMYPLQEIQNLTVKLQLQALQQNGSSVLSEDKSKRLNTILNTMSTIYSTGKVCNPDNPQE CLLLEPGLNEIMANSLDYNERLWAWESWRSEVGKQLRPLYEEYVVLKNEMARANHYEDYGDYWRGDYEVN GVDGYDYSRGQLIEDVEHTFEEIKPLYEHLHAYVRAKLMNAYPSYISPIGCLPAHLLGDMWGRFWTNLYS LTVPFGQKPNIDVTDAMVDQAWDAQRIFKEAEKFFVSVGLPNMTQGFWENSMLTDPGNVQKAVCHPTAWD LGKGDFRILMCTKVTMDDFLTAHHEMGHIQYDMAYAAQPFLLRNGANEGFHEAVGEIMSLSAATPKHLKS IGLLSPDFQEDNETEINFLLKQALTIVGTLPFTYMLEKWRWMVFKGEIPKDQWMKKWWEMKREIVGVVEPVPHDETYCDPASLFHVSNDYSFIRYYTRTLYQFQFQEALCQAAKHEGPLHKCDISNSTEAGQKLFNMLRL GKSEPWTLALENVVGAKNMNVRPLLNYFEPLFTWLKDQNKNSFVGWSTDWSPYADPLVPRGSGGGGDPEP KSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNA KTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDE LTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQG

일시적인 형질감염

SARS-CoV-2 S 및 ACE2-Fc 단백질을 150rpm에서 회전하며 33℃, 70% 습도, 8% CO₂에서 Expi293F 발현 매질(Life Technologies)을 사용하여 현탁액 중에서 성장한 Expi293F 세포에서 생산하였다. PEI-MAX(Polyscience)를 사용하여 mL당 세포 3.0백만 세포 밀도까지 성장한 세포에 의해 배양물을 형질 감염시키고 3일동안 배양하였다. 상층액을 원심분리(4000rcf에서 5분), 최종 농도 0.0375%까지 PDADMAC 용액 첨가(Sigma Aldrich, #409014) 및 제2 원심분리 단계(4000rcf에서 5분)에 의해 상층액을 투명층으로 분리하였다.

CV30 및 CR3022 중쇄 및 경쇄를 암호화하는 유전자는 GenScript로부터 정렬되어, pCMV/R 내로 복제되었다. 항체는 PEI MAX(Polyscience) 형질감염 시약을 사용하여 Expi293F 세포에서 중쇄 및 경쇄 플라스미드 둘 모두의 일시적 공동-형질감염에 의해 발현되었다. 세포 상층액을 수확하고 전술한 바와 같이 3일 또는 6일 후에 투명층으로 분리하였다.

당단백질의 정제

His 태그를 함유하는 단백질은 투명층으로 분리된 각각의 상층액에 1M Tris-HCl, pH 8.0을 최종 농도 45mM이 되도록 보충하고 5M NaCl을 최종 농도가 313mM이 되도록 보충하는 배치 결합 방법을 통해, 투명층으로 분리된 상층액으로부터 정제되었다. 탈론 코발트 친화성 수지(Takara)를 처리된 상층액에 첨가하고, 부드럽게 흔들면서 15분 동안 인큐베이션하였다. 수지는 0.45μm 필터가 있는 진공 여과를 이용하여 수집하고, 중력 컬럼으로 옮겼다. 수지를 컬럼 부피 10배의 20mM Tris pH 8.0, 300mM NaCl로 세척하고, 결합된 단백질을 컬럼 부피 3배의 20mM Tris pH 8.0, 300mM NaCl, 300mM 이미다졸로 용출시켰다. 그 다음, 배치 결합 프로세스를 동일한 상층액 샘플에 대해 반복하였고, 첫 번째 용출액과 두 번째 용출액을 합쳤다. SDS-PAGE를 이용하여 순도를 평가했다. RBD 기반의 작제물 수율을 정량하기 위해, 비교 가능한 세포 배양 조건 및 부피로부터 IMAC 용출액을 100mM L-아르기닌 및 5% 글리세롤로 보충하였고 1.5mL로 농축했다. 이후, 농축된 샘플을 1mL 루프에 로딩하였고, 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤로 예비-평형화된 Superdex 75 Increase 10/300 GL 컬럼(단량체 RBD의 경우) 또는 Superdex 200 Increase 10/300 GL 컬럼(I53-50A 삼량체에 대한 RBD 융합의 경우)에 적용했다. Rpk9 돌연변이가 있거나 없는 HexaPro-폴돈 작제물 수율을 정량하기 위해, 비교 가능한 세포 배양 조건 및 부피로부터 IMAC 용출액을 5% 글리세롤로 보충하였고 1.5mL까지 농축했고, 이후, 1mL 루프에 로딩하였고, 50mM Tris pH 8.0, 150mM NaCl, 0.25% w/v L-히스티딘, 5% 글리세롤로 예비-평형화된 Superose 6 Increase 10/300 GL 컬럼에 적용했다. 면역화 연구를 위한 HexaPro-폴돈을 IMAC로 정제하였고, 실온에서 4시간 동안 50mM Tris pH 8.0, 150mM NaCl, 0.25% w/v L-히스티딘, 5% 글리세롤에 대해 3회 투석했다.

열 변성(nanoDSF)

RBD 기반의 샘플은 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤을 함유한 완충액에서 제조되는 한편, HexaPro-폴돈 기반의 샘플은 50mM Tris pH 8.0, 150mM NaCl, 0.25% w/v L-히스티딘, 5% 글리세롤을 함유한 완충액에서 제조되었다. 비-평형 용융 온도는 분당 1 ℃ 열 램핑을 이용하여 20 내지 95℃에서 수집된 고유 트립토판 형광 방출 스펙트럼의 무게중심 평균을 기반으로 UNcle™(UNchained Labs)를 사용하여 결정되었다. 용융 온도는 용융 곡선의 1차 도함수의 최대점으로 정의되었으며, 1차 도함수는 2차 다항식 설정을 이용하여 4개 인접 점으로 평활화한 후 GraphPad Prism 소프트웨어를 이용하여 계산되었다.

SYPRO Orange 형광

5000×SYPRO™ Orange Protein Gel Stain(Thermo Fisher)을 25mM Tris pH 8.0, 150mM NaCl, 5% 글리세롤 내로 혼합 희석하고, 동일한 완충액에서 제조된 단량체 RBD에 더 첨가하여, RBD의 경우 최종 농도가 1.0mg/mL가 되도록 하고 SYPRO™ Orange의 경우 20×가 되도록 하였다. 샘플을 UNcle™ Nano-DSF(UNChained Laboratories) 내로 로딩하였고 SYPRO™ Orange를 샘플에 첨가한 후 5분 후에 모든 샘플에 대해 형광 방출 스펙트럼을 수집했다.

I53-50B.4PT1의 미생물 단백질 발현 및 정제

RBD-I53-50A, I53-50B.4PT1(서열번호 17)에 대한 상보적 오량체 나노입자 성분을 미국 특허 공보 제2016/0122392호에 기재된 바와 같이 생산하였고, 상기 문헌의 내용은 전체적으로 참고문헌으로 본원에 포함되며, 동일한 프로토콜이 2OBX 비-조립 대조군 오량체의 정제를 위해 사용되었다.

시험관 내 나노입자 조립체

정제된 개별 나노입자 성분의 총 단백질 농도는 UV/vis 분광광도계(Agilent Cary 8454) 및 계산된 흡광 계수를 이용하여 280nm에서 흡광도를 측정함으로써 결정했다. 조립체 단계는 다음 순서로 첨가하여 실온에서 수행했다: 야생형 또는 안정화된 RBD-I53-50A 삼량체 융합 단백질, 이어서 원하는 최종 농도를 달성하기 위해 필요한 충분량의 완충액 및 마지막으로 I53-50B.4PT1 오량체 성분(서열번호 17)(50mM Tris pH 8, 500mM NaCl, 0.75% w/v CHAPS 중에서 RBD-I53-50A:I53-50B.4PTl의 몰비는 1.1:1. 충분량의 완충액은 50mM Tris pH 7.4, 185mM NaCl, 100mM L-아르기닌, 0.75% CHAPS, 4.5% 글리세롤(용액 안정성 연구를 위함) 또는 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% 글리세롤을 함유함. 모든 RBD-I53-50 시험관 내 조립체는 조립되지 않은 잔류 성분을 제거하기 위해 SEC에 의한 후속 정제 전에 적어도 30분 동안 완만하게 흔들면서 2 내지 8℃에서 인큐베이션하였다. Superose™ 6 Increase 10/300 GL 컬럼은 나노입자 생산을 위해 사용되었다. 조립된 입자는 Superose™ 6 컬럼 상에서 약 11mL에서 용출된다. 조립된 나노입자는 컬럼 적용 직전에 그리고 SEC 분획물의 풀링 직후에 제균 여과(0.22μm)되었다.

단량체 RBD의 동역학 분석을 위한 생체층 간섭계

역학 측정은 25℃에서 1000rpm으로 진탕하면서 Octet™ Red 96 System(Pall /Sartorius®)을 이용하여 수행했다. 모든 단백질 및 항체를 검정 96-웰 Greiner Bio-one 마이크로플레이트에서 0.5% 소 혈청 알부민 및 0.01% TWEEN-20이 포함된 인산염 완충 식염수(PBS)에 웰당 200μL로 희석하였고, 기준선과 해리 단계를 위해서는 완충액을 단독으로 사용하였다. 10ug/mL의 CV30 또는 CR3022 IgG를 예비-수화된 단백질 A 바이오센서(Pall /Sartorius®) 상에 150초 동안 로딩한 후 60초 기준선이 이어졌다. 이 때, 바이오센서를 결합 단계로 옮기되, 야생형 또는 안정화된 단량체 RBD의 5회 연속 2배 희석 중 하나를 120초 동안 수행하고, CV30에 사용되는 RBD 농도는 125μM, 62.5μM, 31.3μM, 15.6μM 및 7.8μM이고 CR3022에 사용되는 RBD 농도는 31.3μM, 15.6μM, 7.8μM, 3.9μM 및 2.0μM이었다. 결합 후, 바이오센서를 300초 해리를 위해 완충액으로 옮겼다. 결합 및 해리 단계로부터의 데이터는 기준선에서 차감되었고, 동역학 측정치는 1:1 결합 모델(® 분석 소프트웨어, 버전 12.0)을 사용하여 RBD의 5회 연속 희석 전부에 걸쳐 전반적으로 계산되었다.

RBD 나노입자의 분별 항원성에 대한 생체층 간섭계

단량체 RBD 및 RBD-I53-50 나노입자에 대한 hACE2-Fc(이량체 수용체) 및 CR3022 IgG 결합은 주위 온도에서 1000rpm으로 진탕하면서 Octet™ Red 96 시스템을 이용하여 실시간 안정성 연구를 위해 분석되었다. 단백질 샘플을 Kinetics 완충액(Pall /Sartorius®)에서 100nM까지 희석했다. 그 다음, 완충액, 항체, 수용체 및 면역원을 검정 96-웰 Greiner Bio-one 마이크로플레이트에 웰당 200μL로 도포했다. 먼저, 단백질 A 바이오센서를 Kinetics 완충액에서 10분 동안 수화시킨 다음, 고정화 단계에서 Kinetics 완충액에 10μg/mL까지 희석된 hACE2-Fc 또는 CR3022 내로 침지했다. 500초 후, 기준선에 도달하도록 팁을 Kinetics 완충액으로 90초 동안 옮겼다. 결합 단계는 로딩된 바이오센서를 면역원에 300초 동안 침지하여 수행하였고, 후속적인 해리 단계는 추가 300초 동안 바이오센서를 Kinetics 완충액에 다시 침지하여 수행했다. ® 분석 소프트웨어(버전 12.0)를 이용하여 그래프를 작성하기 전에 데이터에서 기준선을 차감했다.

음성 염색 전자현미경

먼저, 샘플 3μL을 새 글로우-방전된 300메시 구리 그리드에 도포하기 전에 야생형 RBD-I53-50 나노입자 및 Rpk-I53-50 나노입자를 50mM Tris pH 8, 150mM NaCl, 100mM L-아르기닌, 5% v/v 글리세롤 중에서 75μg/mL까지 희석했다. 샘플을 그리드 상에서 1분 동안 인큐베이션한 후에 그리드를 물방울 50μL에 침지하고 과량의 액체를 여과지로 닦아냈다. 그 다음, 그리드를 0.75% w/v 우라닐 포르메이트 염색 3 μL에 침지했다. 염색을 여과지로 닦아낸 다음, 그리드를 또 다른 염색 6μL에 침지하고 약 90초 동안 인큐베이션했다. 마지막으로, 염색을 제거하고, 그리드를 보관 또는 이미지화하기 전에 1분 동안 건조하였다. 준비된 그리드는 57,000× 배율의 Gatan^TM 카메라를 사용하는 Talos^TM 모델 L120C 투과 전자 현미경에서 이미지화했다.

동적 광산란

동적 광산란(DLS)을 사용하여 UNcle^TM(UNchained Laboratories) 상에서 RBD-I53-50 나노입자 샘플의 유체역학적 직경(Dh) 및 다분산도(%Pd)를 측정했다. 샘플을 8.8μL 석영 모세관 카세트(UNi^TM, UNchained Laboratories)에 도포했고, 레이저 자동 감쇠를 이용하여 5초마다 10회 포착하여 측정했다. RBD 나노입자 완충액에서 5% v/v 글리세롤로 인해 증가된 점도는 Dh 측정에서 UNcle^TM Client 소프트웨어에 의해 설명되었다.

내독소 측정

단백질 샘플의 내독소 수준을 EndoSafe™ Nexgen-MCS 시스템(Charles River)을 이용하여 측정했다. 샘플을 내독소가 없는 LAL 시약수에 1:50 또는 1:100으로 희석하였고, EndoSafe™ LAL 시약 카트리지 웰에 도포했다. Charles River EndoScan™-V 소프트웨어를 이용하여 내독소 함량을 분석하였고 희석 계수를 자동으로 역계산하였다. 내독소 값은 EU/mL로 보고했고 UV-Vis 측정치에 기반하여 EU/mg로 변환했다. 면역화에 적합한 샘플에 대한 임계값은 <100 EU/mg이었다.

UV-Vis

자외선-가시광선 분광광도계(UV-Vis) 측정은 Agilent Technologies Cary 8454를 이용하여 수행하였다. 샘플은 10mm, 50μL 석영 셀(Starna Cells, Inc.)에 적용하였고 흡광도는 180 내지 1000nm에서 측정했다. 측정 및 단일 참조 파장 기준선 차감에서 얻은 280nm에서의 순 흡광도는 계산된 흡광 계수 및 분자량과 함께 이용되어 단백질 농도를 얻었다. 320/280nm에서의 흡광도 비율을 이용하여, 실시간 안정성 연구 샘플에서 상대적 응집 수준을 결정했다. 샘플을 각각의 블랭크 완충액으로 희석하여, 0.1과 1.0 사이의 흡광도를 얻었다. UV/vis 기기에서 생성된 모든 데이터는 845x UV/가시광선 시스템 소프트웨어에서 처리했다.

수소/중수소 교환 질량분석기

RBD-I53-50A, Rpk4-I53-50A 및 Rpk9-I53-50A 삼량체 3mg은 중수소화 완충액(pH^* 7.5, 85% D₂O, Cambridge Isotope Laboratories, Inc.)에서 22℃에서 각각 3, 15, 60, 1800 및 72000초 동안 H/D 교환(HDX)되었다. 그 후, 교환된 샘플을 최종 pH 2.5가 되도록 얼음으로 급냉된 켄칭 완충액(200mM 트리스(2-클로로에틸) 포스페이트(TCEP), 8M 우레아, 0.2% 포름산(FA))과 1:1로 혼합되고 즉시 액체 질소 질소에서 급속 동결되었다. 0℃에서 모든 컬럼, 루프, 밸브 및 라인을 유지하는 맞춤형 로딩 시스템을 이용하여 Synapt^TM G2-Si 질량 분석기 상에서 LC-MS로 샘플을 분석했다. 동결된 샘플을 얼음 위에서 해동하고, 맞춤형 패킹 고정화된 펩신 컬럼(2.1×50mm) 상에 0.1% 트리플루오로아세트산(TFA)과 2% 아세토니트릴의 200mL/분 유속으로 로딩했다. 펩타이드는 Waters CSH C18 트랩 카트리지(2.1×5mm) 상에 포획된 후 18분에 걸쳐 3%부터 40% B까지의 선형 구배로 Waters CSH C18 1×100mm 1.7μm 컬럼 상에서 분리되었다(A: 98 % 물, 2% 아세토니트릴, 0.1% FA, 0.025% TFA, B: 100% 아세토니트릴, 0.1% FA, 유속 40mL/분). 교차오염을 최소화하기 위해 샘플 실행 사이에 일련의 세척을 실시하였다. 사용된 모든 물과 유기 용매는, 특별히 언급되지 않는 한, MS 등급(Optima™, Fisher)이었다. 각 샘플 시리즈에 대해 완전 중수소화된 대조군은 펩신-분해된 중수소화되지 않은 샘플로부터의 LC 용출액 수집, 스피드백(speedvac) 건조, 중수소화 완충액에서 85 ℃로 1시간 동안 인큐베이션하고, 다른 모든 HDX 샘플과 동일하게 켄칭하여 제조되었다. 모든 샘플에 대해 일관된 라벨링 조건을 보장하기 위해 내부 교환 표준품(Pro-Pro-Pro-Ile[PPPI] 및 Pro-Pro-Pro-Phe[PPPF])이 각 샘플에서 추가되었다.

펩타이드 참조 목록은 돌연변이를 포함하는 신규 펩타이드를 첨가하면서 야생형 RBD 펩타이드로부터 업데이트되었다. 이러한 펩타이드는 DriftScope™를 사용하여 수동으로 밸리데이션되었고, 직교 체류 시간 및 드리프트 시간 좌표에 의해 확인되었다. 중수소 흡수 분석은 HX-Express v2로 수행했다. 피크는 펩타이드 m/z 값을 기반으로 펩타이드 스펙트럼으로부터 확인되었고, 이항 피팅이 적용되었다. 중수소 흡수 수준은 완전 중수소화된 대조군에 대하여 정규화되었다.

마우스 면역화

4주령의 암컷 BALB/c(스톡: 000651) 마우스를 구입하였다. 투여군당 생후 6주령 마우스 6마리에게 일차 면역주사로 백신접종하였고 3주 후에 마우스에 이차 예방주사로 부스터 접종했다. 접종 전에 면역원 현탁액을 AddaVax™ 아쥬반트와 1:1 vol/vol로 부드럽게 혼합하여, 항원 최종 농도 0.009 또는 0.05mg/mL에 도달하도록 하였다. 이소플루란 마취 하에 주사 부위당 면역원 50 μL(총 100 μL)을 27-게이지 바늘을 사용하여 마우스 각 뒷다리의 비복근 근육에 근육내 주사하였다. 혈청을 얻기 위해 일차 및 부스터 면역화 후 2주 후에 모든 마우스로부터 채혈하였다. 혈액은 턱밑정맥 천자를 통해 채취하였고, 실온에서 30분 동안 1.5 mL 플라스틱 에펜도르프 튜브에서 정치하여 응고되도록 하였다. 혈청은 10분 동안 2,000g에서 원심분리를 통해 헤마토크릿으로부터 분리되었다. 단리된 혈청의 보체 인자와 병원체는 56℃에서 60분 동안 인큐베이션을 통해 열-불활성화되었다. 혈청은 사용할 때까지 4℃ 또는 -80℃에서 보관했다.

ELISA

효소 면역흡착 검정법(ELISA)을 이용하여, 전달된 항원에 대한 마우스 혈청 결합을 결정했다. 요약하면, Maxisorp™(Nunc®) ELISA 플레이트를 웰당 0.1M 중탄산나트륨 완충액, pH 9.4 중 관심 단백질 0.08μg/mL로 4℃에서 밤새 코팅했다. 그 다음, 실온에서 1시간 동안 0.05%(v/v) Tween 20(TBST)이 포함된 TBS 중 분유의 4%(w/v) 용액으로 플레이트를 차단했다. 혈청의 연속 희석물을 플레이트에 첨가하고, 세척 후, 과산화효소 커플링된 말 항-마우스 IgG 항체를 사용하여 항체 결합을 밝혀냈다. 그 다음, 플레이트를 TBST로 철저히 세척하고, 비색 기질(TMB, Thermo Fisher)을 첨가하고 흡광도를 450nm에서 판독했다. 곡선하 면적(AUC) 계산은 인접한 흡광도 측정치 쌍과 기준선 사이에 생성된 사다리꼴 영역을 추가하여 발생되었다. 중간점 역가 계산(EC₅₀)은 Python의 SciPy 라이브러리를 사용하여 피팅된 4점 로지스틱 방정식을 기반으로 생성되었으며, 여기서 EC₅₀은 곡선이 최대치의 50%에 도달한 혈청 희석액이었다.

렌티바이러스 기반의 슈도바이러스 중화 검정법

스파이크-슈도타이핑된 렌티바이러스 중화 검정법은 실질적으로 (67)에 기재된 바와 같이 수행하였다. 프로토콜은 스파이크-슈도타이핑된 렌티바이러스 역가를 증가시키는 21개 아미노산 세포질 꼬리 절단이 있는 SARS-CoV-2 스파이크와, 현재 인간 SARS-CoV-2에서 우세한 D614G 돌연변이를 사용하도록 이 연구를 위해 변경되었다. 이 스파이크를 암호화하는 플라스미드 HDM_Spikedelta21_D614G는 Addgene(#158762) 또는 BEI(NR-53765)에서 입수할 수 있고, 전체 서열이 addgene.org/158762에서 전세계 웹에서 이용할 수 있다.

즉, 293T-ACE2 세포(BEI NR-52511)를 폴리-L-리신 코팅된 검정 벽의 투명 바닥 96-웰 플레이트(Greiner 655930)에서 웰당 50 uL DIO 성장 배지(10% 열-불활성화된 FBS, 2mM L-글루타민, 100U/mL 페니실린 및 100μg/mL 스트렙토마이신이 있는 DMEM) 중에 1.25×10⁴ 세포로 시딩하였다. 다음날, 마우스 혈청 샘플을 56℃에서 30분 동안 열 불활성화한 다음, D10 성장 배지에서 연속 희석했다. 스파이크-슈도타이핑된 렌티바이러스를 1:50까지 희석하여, 웰당 약 200,000RLU를 생산하고, 혈청 희석액과 함께 37℃로 1시간 동안 인큐베이션했다. 그 다음, 바이러스-혈청 혼합물 100μL를 세포에 첨가하고, 약 52시간 후 Bright-Glo^TM Luciferase Assay System(Promega®, E2610)을 사용하여 루시퍼라제 활성을 측정했다. 중화 검정법의 각 배치에는 2017-2018년에 채취된 인간 혈청의 음성 대조군 샘플과 공지 중화 항체가 포함되어, 배치 간 일관성을 보장하였다. 각 웰에 대한 감염 분율은 플레이트의 동일 행에 있는 2개 "무혈청" 대조군 웰과 비교하여 계산하였다. "neutcurve" 패키지(전세계 웹에서 jbloomlab.github.io/neutcurve 버전 0.5.2에서 입수 가능함)를 사용하여, 하단이 0으로 고정되고 상단이 1로 고정된 Hill 곡선을 피팅하여 억제 농도 50%(IC₅₀), 및 각 혈청 샘플에 대한 단순 1/IC₅₀인 중화 역가 50%(NT50)를 계산했다. 모든 중화 검정 데이터는 github.com/jbloomlab/RBD_nanoparticle_vaccine에서 전세계 웹에서 입수 가능하다.

MLV 기반의 슈도바이러스 중화 검정법

MLV 기반 SARS-CoV-2 S 슈도타이핑은 기재된 바와 같이 제조하였다(AC Walls 등 Cell 181, 281-292.e6 (2020); AC Walls 등 Cell 183, 1367-1382.e17 (2020); AC Walls 등 Elicitation of broadly protective sarbecovirus immunity by receptor-binding domain nanoparticle vaccines, dx.doi.org/10.1101/2021.03.15.435528; JK Millet & GR Whittaker. Bio Protoc 6 (2016)). 요약하면, HEK293T 세포는 제조업체 지침에 따라 SARS-CoV-2 S-암호화 플라스미드, MLV Gag-Pol 패키징 작제물, 및 루시퍼라제 리포터를 암호화하는 MLV 전달 벡터와 함께 Lipofectamine™ 2000(Life Technologies)을 사용하여 공동 형질감염시켰다. 세포를 Opti-MEM으로 3회 세척하였고, 형질주입 매질과 함께 37℃에서 5시간 동안 인큐베이션했다. 10% FBS를 포함하는 DMEM을 60시간 동안 첨가하였다. 상층액을 2,500g에서 회전시켜 수확하고, 0.45μm 필터를 통해 여과하고, 100kDa 막으로 10분 동안 2,500g에서 농축한 다음, 분취하고 -80℃에서 보관하였다.

중화 검정법을 위해, HEK-hACE2 세포를 37℃ 인큐베이터(ThermoFisher)에서 10% FBS(Hyclone) 및 1% PenStrep가 포함된 DMEM 중에서 8% CO₂와 함께 배양하였다. 감염되기 1일 이상 전에, 폴리-리신(Sigma) 40 μL을 96-웰 플레이트에 놓고, 5분 동안 회전시키면서 인큐베이션하였다. 폴리-리신을 제거하고, 플레이트를 5분 동안 건조시킨 다음, 물로 1×세척한 다음, 세포 HEK-hACE2 세포를 도말하였다. 다음날, 세포가 80% 컨플루언스에 있는 것으로 확인되었다. 절반 영역 96-웰 플레이트에서 혈청을 1:3으로 연속 희석하여 DMEM에서 최종 부피 22μL가 되도록 하였다. 이어서 슈도바이러스 22 μL를 연속 희석액에 첨가하고, 실온에서 30 내지 60분 동안 인큐베이션하였다. 혼합물을 세포에 첨가하고, 2시간 후 20% FBS 및 2% PenStrep이 보충된 DMEM 44μL를 첨가하고, 세포를 48시간 동안 인큐베이션하였다. 48시간 후 One-Glo-EX™ 기질(Promega) 40μL/웰을 세포에 첨가하고, 암실에서 5 내지 10분 동안 인큐베이션한 후에 BioTek™ 플레이트 판독기에서 판독했다. log(억제제) 대 정규화된 반응의 비선형 회귀를 이용하여, 곡선 피팅으로부터 IC₅₀ 값을 결정했다.

정량화 및 통계 분석

다수 그룹 비교는 GraphPad Prism 8에서 Dunn의 사후 분석과 함께 비모수 Kruskal-Wallis 테스트를 사용하여 수행했다. P 값이 0.05 미만일 때 차이가 유의한 것으로 간주되었다. 통계 방법 및 P 값 범위는 도면과 도면 범례에서 찾을 수 있다.

결과

SARS-CoV-2 S RBD의 5개 돌연변이인 I358F, Y365F, Y365W, V367F 및 F392W가 안정화된 RBD 항원 설계를 위한 출발점으로 간주되었다. 융합전 S 엑토도메인 삼량체의 cryo-EM 구조(PDB ID 6VXX)를 이용하여, PyMol™ 및 Rosetta™에서 5개의 돌연변이를 분석했다. V367F 돌연변이만이 용매에 노출된 것으로 밝혀졌고, 따라서 항원성을 불리하게 변경하는 위험을 피하기 위해 안정화된 RBD 설계에 포함되는 것으로 간주되지 않았다. 다른 4개의 돌연변이는 최근 확인된 리놀레산(LA) 결합 포켓 근처 또는 내부에 있는 것으로 관찰되었으며, Y365는 이 상호작용에 대한 핵심 게이팅 잔기로 확인되었다(도 2a 내지 도 2b). LA 결합 포켓 내 여러 돌연변이에 대한 DMS에 의해 관찰된 발현 및 안정성 개선은 RBD의 이 영역이 구조적으로 최적이 아님을 나타낸다.

다음으로, 이러한 돌연변이의 조합이 RBD의 이러한 특성 및 기타 특성을 추가로 개선할 수 있는지 여부를 조사했다. 전산 프로토콜은 I358F, Y365F, Y365W 및/또는 F392W 중 하나 이상을 모델화하는 한편, 근처 잔기가 돌연변이되도록 하는 Rosetta™에서 개발되었다(도 2c). LA 결합 포켓 내에서 이들 4개의 밸리데이션된 돌연변이 중 임의의 것을 강제로 포함하지 않는 설계 궤적이 또한 수행되어, 동일한 영역에서 신규한 안정화 돌연변이 세트를 설계할 수 있도록 하는 Rosetta™를 대신했다. 모든 설계 궤적은 완전한 S 엑토도메인(PDB ID 6VXX) 및 LA 결합 포켓을 둘러싼 영역에서 미묘하게 차별화되는 백본 구조형태를 보여주는 RBD 단량체 결정 구조(PDB ID 6YZ5) 둘 모두에서 수행되었다. 캐비티를 채우고/거나 매립된 극성 기를 제거하는 돌연변이를 가진 17개의 리패킹된 설계("Rpk"로 약칭됨)가 실험 분석을 위해 선택되었으며, DMS-확인된 개별 돌연변이 중 일부도 비교를 위해 포함되었다(표 1).

표 1: 각각의 안정화된 RBD 설계에 함유된 돌연변이. 돌연변이는 보고된 DMS-확인된 돌연변이 또는 Rosetta에 의해 확인된 돌연변이로 구분된다.

설계는 20면체 I53-50 나노입자에 통합될 수 있는 I53-50A 나노입자 삼량체에 대한 Wuhan-Hu-1 RBD의 유전적 융합과 관련하여 스크리닝되어, RBD의 60 카피를 나타내는 백신 후보물로 평가될 수 있었다. 따라서, 안정화된 RBD 아미노산 서열은 항원에 C-말단 융합된 I53-50A 서열 및 16-잔기 유연한 Gly-Ser 링커에 의해 결합된 2개 도메인을 가지며 포유류 발현을 위한 벡터 내로 복제되었다.

안정화된 설계는 I53-50A 삼량체 및 음성 대조군 플라스미드에 융합된 야생형 RBD("RBD")와 함께 HEK293F 세포로부터 분비되었다. 세포 배양물 상층액의 환원 SDS-PAGE는 야생형과 비교하여 모든 설계에 대해 증가된 발현을 보여주었다(도 1a). 또한, 비환원 SDS-PAGE는 각 설계에 의해 형성된 이황화-연결된 이량체의 양에서 현저한 차이를 보여주었다(도 1a). F392W 돌연변이를 포함하는 설계는 눈에 띄게 낮은 수준의 이황화-연결된 이량체를 생성시켰다. F392W가 LA 결합 포켓 캐비티를 부분적으로 채우는 것 이외에, C391과 C525 사이의 이황화물에 대한 이 돌연변이의 근접성은 이러한 시스테인을 포함하는 표적외 분자간 이황화물 형성을 선호하지 않음을 나타낸다.

두 가지 설계는 보다 자세한 분석을 위해 다음 단량체 및 삼량체로서 선택했다: F392W만을 특징으로 하는 Rpk4, 및 매립된 측쇄 하이드록실 기를 제거하기 위한 DMS-확인된 Y365F 및 생성된 캐비티를 소수성 패킹으로 다시 채우기 위한 Rosetta-확인된 V395I에 F392W를 결합시킨 Rpk9(데이터는 표시되지 않음). HEK293F 세포의 규모-확장된 발현 및 고정화된 금속 친화성 크로마토그래피(IMAC) 및 크기 배제 크로마토그래피(SEC)에 의한 정제는 단량체 및 I53-50A 삼량체에 대한 융합체로서 Rpk4 및 Rpk9에 대한 증가된 수율을 확인했으며, Rpk9는 I53-50A 삼량체에 대한 분명한 이점을 보여주었다(도 4a 및 도 10a). 모든 작제물은 낮은 수준의 표적외 이황화물-연결된 이량체 형성을 특징으로 하여, 안정화된 RBD 설계에 F392W를 포함시키는 중요성을 강조한다. 용용 온도(T_m)는 나노 시차 주사 형광 측정법(nanoDSF)에 의해 단량체와 삼량체 모두에 대해 측정되었고, 고유 트립토판 형광을 모니터링하여 해당 야생형 대응물과 비교하여 Rpk4 단백질에 대한 1.9 내지 2.4℃ 증가 및 Rpk9 단백질에 대한 3.8 내지 5.3℃ 증가를 보여주었다(도 4b). 모든 단량체 RBD는 원편광 이색성에 의해 구별할 수 없었고 95℃에서 변성 후 재절첩되는 것으로 나타났다(도 10b). 더욱이, I53-50A 삼량체에 융합된 안정화된 RBD의 수소/중수소-교환 질량 분석법(HDX-MS)은 야생형 RBD와 비교하여 LA 결합 포켓에서 2개의 별개 펩타이드 세그먼트에서 감소된 중수소 흡수를 보여주었고(도 4c, 도 11), 이는 안정화된 설계에서 개선된 국소 배열을 나타낸다. ACE2 결합 모티프 내의 것을 포함하여 LA 결합 포켓으로부터 원위에 있는 펩타이드 세그먼트는 야생형과 비교하여 보존된 구조적 배열을 보여주었다. 구조적 배열을 추가로 평가하기 위해, 3가지 단량체 RBD 모두를 별도로 SYPRO Orange 염료와 혼합하여, 소수성 기의 노출을 측정했다(도 4d). Rpk9와 함께 Rpk4 둘 모두는 야생형 RBD와 비교하여 감소된 신호를 보였고, Rpk9는 최소한의 형광을 생성하여, 안정화된 RBD에서 LA 결합 포켓의 개선된 국소적 배열이 소수성 노출을 감소시키는 결과를 초래한다. HDX-MS 데이터와 일관되게, 안정화 돌연변이 세트는 항원 부위 Ia를 인식하는 항체 CV30(Hurlbut 등 Nature Communications 11:5413 (2020))의 결합으로 평가될 때 ACE2 결합 모티프의 항원성에 영향을 미치지 않았다(도 4e). 부위 IIc에 대항하고 LA 결합 포켓에 더 근접하게 있는 비-중화 항체 CR3022에 대한 친화도(Yuan 등 Science 386:630-644 (2020))는 약간 감소했다(<3.5배). 요약하면, 안정화 돌연변이의 두 세트 모두는 항원의 발현, 열 안정성 및 구조적 배열을 향상시키는 한편 항원성에 최소한의 영향을 끼쳤고, Rpk9는 단량체 RBD 및 I53-50A 삼량체에 대한 유전적 융합 둘 모두에 대한 모든 범주에서 우수한 개선을 보여준다.

안정화 돌연변이는 단리된 RBD를 염두에 두고 설계되었지만, 이러한 돌연변이는 전체 S 엑토도메인과 관련하여서도 평가되었다. T4 피브리틴 폴돈에 융합된 융합전-안정화된 HexaPro 항원의 총 수율을 Rpk9 돌연변이(Rpk9-HexaPro-폴돈)로 측정하고, 야생형 버전(HexaPro-폴돈)과 비교했다. 용어 "HexaPro"는 4개의 유익한 프롤린 치환(F817P, A892P, A899P, A942P)뿐만 아니라 S-2P에서 2개의 프롤린 치환(986 및 987에서의 프롤린)이 있는 스파이크 단백질을 지칭한다. Hsieh 등 Science 369: 1501-05 (2020)을 참조하고; Rpk9 돌연변이에서 적당한 수율 증가가 관찰되었지만, 약간 더 이른 SEC 용출 부피가 관찰되었으며, 이는 S 엑토도메인과 관련한 안정성 감소를 나타낼 수 있다. Rpk9-HexaPro-폴돈은 HexaPro-폴돈과 유사한 nanoDSF 프로파일을 보여주었지만, 60℃ 초과에서 발생하는 고유 형광의 변화는 Rpk9-HexaPro-폴돈에서 약간 가속화되었다(도 8c). 음성 염색 전자현미경(nsEM)은 전형적인 융합전 스파이크 모폴로지가 돌연변이에서 우세하게 유지되었음을 보여주었다(도 8d). 이러한 데이터는 LA 결합 포켓에 대한 돌연변이를 융합전 스파이크 삼량체에 통합하는 것이 가능하더라도 Rpk9 돌연변이의 안정화 효과가 단리된 RBD에 고유한 것으로 나타남을 보여준다.

다음으로, RBD-안정화 돌연변이가 글리세롤, L-아르기닌 및 청정제 3-[(3-콜아미도프로필)디메틸암모니오]-1-프로판설포네이트(CHAPS)와 같은 부형제가 없는 보다 단순한 완충액에서 나노입자 안정성을 향상시키는지 여부를 조사하였고, 상기 완충액은 다르게는 나노입자 면역원의 제제를 안정화시키기 위해 사용될 수 있었다. 야생형 및 안정화된 RBD-I53-50A 삼량체는 상보적인 I53-50B.4PT1 오량체 성분(서열번호 17)의 첨가에 의해 나노입자(RBD-I53-50, Rpk4-I53-50 및 Rpk9-I53-50) 내로 조립되었다(도 5a). 과잉 잔류 성분은 글리세롤, L-아르기닌 및 CHAPS가 있는 Tris-완충식염수(TBS)를 포함하는 이동상을 이용하여 SEC에 의해 제거되었고, 고도의 단분산성 나노입자의 형성은 음성 염색 전자현미경(nsEM)에 의해 확인되었다(도 5b). 이어서, 정제된 나노입자를 더 적은 부형제를 갖는 완충 용액으로 투석하여, 단회 동결/해동 주기의 전과 후에 용액 안정성을 평가하였다(도 5c 내지 5e). 글리세롤 및 L-아르기닌이 보충된 TBS에서, 야생형 RBD-I53-50은 Rpk4-I53-50 및 Rpk9-I53-50에 대해 관찰되지 않은 UV-Vis 분광법(도 5c) 및 동적 광 산란(DLS)(도 5d)에서 응집 징후가 약하게 나타났다. 용액 안정성의 차이는 글리세롤만 있는 TBS로 투석한 후에 더욱 대조적이었다: Rpk4-I53-50 및 Rpk9-I53-50 둘 모두는 RBD-I53-50보다 응집에 더 저항성이 있는 동시에 고정된 인간 ACE2(hACE2-Fc) 및 CR3022에 대한 결합을 더 잘 유지했다(도 5e). TBS 단독으로의 투석은 모든 샘플의응집 및 항원성 상실에 대한 명확한 증거를 보여주었고, Rpk9-I53-50이 RBD-I53-50 및 Rpk4-I53-50보다 약간 더 우수한 항원성을 유지하였다. 안정화된 RBD에 대해 관찰된 개선된 용액 안정성은 향상된 열 안정성 및 구조적 배열과 일관된 것으로 나타났고, 백신 제조와 매우 관련이 있는 제형 안정성의 감지하기 어렵지만 중요한 개선을 제공한다.

그 다음에, 안정화된 RBD의 면역원성을 마우스의 면역화 연구에서 평가하였다. 야생형 및 안정화된 RBD를 포함하는 면역원은 두 형식으로 제조되었다: 각 항원을 나타내는 I53-50 나노입자, 및 I53-50A에 대한 삼량체 융합이 나노입자 조립을 유도하는 소수성 계면이 없는 약간 변형된 오량체 스캐폴드와 혼합된 거의 등가의 단백질의 비조합 대조군("2OBX"; 서열번호 43; 도 6a). 삼량체 및 나노입자 형식의 다양한 RBD의 면역원성 평가가 가능한 것 이외에, 이 비교는 나노입자 조립체의 효과를 직접적으로 제어한다. 모든 나노입자 면역원은 글리세롤 및 L-아르기닌이 보충된 Tris-완충식염수(TBS)에서 제조된 한편, 야생형 RBD-I53-50 나노입자는 다른 면역원성 연구와 직접 비교할 수 있도록 CHAPS를 추가로 포함하는 완충액에서도 제조되었다. HexaPro-폴돈(야생형 RBD를 특징으로 함)이 비교군으로 포함되었다. 암컷 BALB/c 마우스를 각 면역원으로 2회 면역화하되 3주 휴약 기간을 가졌고, 각 면역화 후 2주 시점에 혈청을 채취하였다(도 6a). 모든 용량은 등몰량의 RBD로 투여되었고 AddaVax 아쥬반트를 포함했다.

결합 역가를 효소 면역흡착 검정법(ELISA)을 사용하여 HexaPro-폴돈에 대하여 측정했고, 곡선하 면적(AUC)(도 6b) 및 중간점 역가(도 12a)를 측정하여 분석했다. 모든 나노입자 군으로부터의 혈청은 HexaPro-폴돈보다 약간 높고 비조립 대조군보다 현저하게 높은 일차 접종 후 항원-특이적 항체 수준을 보여주었다. 결합 신호는 이차 면역화 후 모든 그룹에서 증가했으며, 그들 사이의 구분이 덜 명확했다. 렌티바이러스 백본을 이용한 슈도바이러스 중화는 1차 접종 후 유사한 경향을 보여주었고, 모든 나노입자 군은 비조립 대조군보다 유의하게 더 높은 중화 활성을 나타냈고 HexaPro-폴돈보다 거의 2자리 넘게 큰(two orders of magnitude more) 강력한 중화를 가졌다(도 6c). 이차 면역 후 모든 그룹에서 중화가 크게 증가했으며, 나노입자와 HexaPro-폴돈이 가장 높은 수준의 중화 활성을 보였다. 각 시점에서 다양한 나노입자 군 사이에 또는 다양한 비조립 대조군 사이에 유의한 중화 활성 차이가 없었다. 쥣과 백혈병 바이러스(MLV) 백본을 이용하는 상이한 슈도바이러스 검정법에서 유사한 결과가 수득되었다(도 12b). 이들 데이터는 안정화된 RBD가 삼량체 또는 미립자 형태로 제공될 때 야생형 RBD와 유사하게 면역원성이고, 나노입자 제공이 특히 단회 면역화 후에 RBD 면역원성을 유의하게 향상시켰음을 확립한다.

SARS-CoV-2 백신의 사용기한 안정성 개선은 제조 및 유통을 단순화함으로써 전세계 백신접종 노력을 직접적으로 향상시킬 수 있는 가능성을 가진다. 2개의 안정화된 RBD 나노입자 면역원의 안정성은 -80℃, 2 내지 8℃, 22 내지 27℃ 및 35 내지 40℃에서 28일 보관에 걸쳐 DLS(도 7a), BLI(도 7b), SDS-PAGE 및 nsEM(도 7c)에 대해 야생형 RBD-I53-50과 비교했다. 기준선으로부터의 유의한 편차가 연구 과정 동안 -80℃, 2 내지 8℃ 또는 22 내지 27℃에서 임의의 면역원에 대해 관찰되지 않았다. 그러나, 35 내지 40℃에서 28일 동안 야생형 RBD-I53-50 보관에서 응집이 발생되어 DLS 및 nsEM으로 검출할 수 있었고 항원성이 유의하게 감소했다. 이와 대조적으로, 입자 안정성과 항원성 둘 모두는 35 내지 40℃에서 28일 보관 후에 Rpk4-I53-50 및 Rpk9-I53-50에 대해 유지되었다. 이러한 결과는 RBD에서 확인된 안정화 돌연변이가 강력한 면역원성을 손상시키지 않으면서 RBD 기반의 나노입자 면역원의 제조 가능성과 안정성을 향상시킬 수 있음을 확립한다.

구조 기반의 단백질 설계는 잠재적인 설계 공간을 특히 가치 있는 영역 및 돌연변이로 좁히는 실험 정보에 의해 크게 용이해질 수 있다. 여기에서, 바이러스 당단백질 안정화 안내에 있어서 DMS 데이터의 유용성은 SARS-CoV-2 S RBD의 LA 결합 포켓을 구조적으로 최적이 아닌 영역으로 특징 규명함으로써 그리고 잠재적인 안정화 돌연변이의 아이덴티티를 제공함으로써 입증되었다. 이러한 데이터에 따라 안내될 때, Rosetta™의 구조 모델화는 추가 안정화 돌연변이뿐만 아니라 유망한 돌연변이 조합을 확인하였다. 실험적으로 스크리닝된 모든 설계는 야생형 RBD 발현에 대한 개선에서 성공적이었고, 이는 순수하게 구조에 기반한 다수의 설계 실험과 비교하여 대단히 높은 효율성을 가진다.

발명자들은 RBD 변이체의 이러한 철저한 생화학적 및 생물물리학적 특징 규명으로 인해 발현을 향상시키고 표적외 이황화물을 최소화하고 국소 구조적 배열을 개선하고 열, 용액 및 사용기한 안정성을 증가시키는 동시에 I53-50 나노입자 상에 나타내어지는 야생형 RBD의 강력한 면역원성을 유지하는 설계를 선택할 수 있게 된다. 상세하게 연구된 두 돌연변이 중에서 Rpk4(F392W)는 단일 아미노산 변화만을 특징으로 하기 때문에 더 보존적이었지만, 특히 발현 및 열 안정성을 개선한 추가적인 돌연변이를 포함하는 Rpk9(Y365F, F392W, V395I)과 비교하여 감소된 안정화되었다. 이론에 얽매이려는 것은 아니지만, 본 발명자들은 HDX-MS 및 SYPRO Orange 형광에 의해 나타나는 바와 같이 Rpk4- 및 Rpk9-I53-50의 개선된 용액 특성이 국소 구조적 배열의 개선 및 감소된 소수성 표면적 노출로부터 유래할 가능성이 가장 높다고 추측한다. 보다 일반적으로, 이러한 결과는 다른 RBD 항원이 LA 결합 포켓의 열린 상태와 닫힌 상태 사이의 전이와 같은 S 엑토도메인 또는 단리된 RBD의 기존 구조에서 관찰되지 않는 동적 구조형태를 채택할 가능성을 높인다.

야생형 RBD-I53-50 나노입자와 비교하여 유사하게 강력한 Rpk4- 및 Rpk9-I53-50 면역원성은 RBD에 대한 중화 반응의 주요 초점인 ACE2 결합 모티프의 천연 유사 항원성, 및 안정화 돌연변이가 항원 표면 상에 노출되지 않는다는 사실과 일관된다. 이러한 면역원성 데이터는 또한 고역가 RBD 나노입자 면역원이 특히 단회 면역화 후에 삼량체 RBD 형태보다 훨씬 더 면역원성임을 분명하게 입증한다. 삼량체 스파이크(HexaPro-폴돈)는 삼량체 RBD보다 더 높은 중화 활성 수준을 유도했다. 이 결과는 올리고머 상태를 유지하면서 스파이크 관련으로부터 RBD를 제거하는 것이 RBD에 대한 항체 반응 개선을 위해 본질적으로 유리하지 않음을 입증하고, RBD 기반의 백신에서 나노입자 제공의 중요성을 강조한다.

관찰된 제조가능성, 안정성 및 용액 특성의 개선은 SARS-CoV-2에 대한 단백질 기반의 백신의 제조 및 유통에 유의한 영향을 미칠 수 있었다. SARS-CoV-2 백신은 항원 드리프트에 대한 반응으로 이미 업데이트되고 있으므로, 이러한 개선은 백신 생산의 규모와 속도 최대화 및 새로운 SARS-CoV-2 변종에서 파생된 항원의 안정성 또는 용액 특성의 예기치 않은 변화에 대한 완충에 중요할 수 있다. 또한 변성에 대한 저항성 및 다양한 온도에서 사용기한 안정성을 개선하면 콜드 체인 인프라가 부족한 저개발 지역에서 신뢰 가능한 유통에 특히 영향을 미칠 수 있다. 마지막으로, SARS-CoV-2 출현 이전의 융합전-안정화 "2P" 돌연변이에 대한 지식이 판데믹 대응 노력에 중요한 것으로 입증되었으므로 RBD에 대한 안정화 돌연변이를 사용하여 백신 제조가능성을 신뢰 가능하게 개선하려는 능력은 인간에게 대한 교차 위협이 되는, 동물원성감염증 보유체에서 순환하는 다른 코로나바이러스에 대한 백신 설계를 최적화하기 위한 중요한 도구일 수 있다.

SEQUENCE LISTING <110> UNIVERSITY OF WASHINGTON FRED HUTCHINSON CANCER RESEARCH CENTER <120> STABLE CORONAVIRUS PROTEINS AND VACCINE COMPOSITIONS THEREOF <130> 034186-098380WOPT <140> PCT/US2021/037341 <141> 2021-06-15 <150> 63/188,651 <151> 2021-05-14 <150> 63/132,863 <151> 2020-12-31 <160> 61 <170> PatentIn version 3.5 <210> 1 <211> 1016 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 1 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala 1010 1015 <210> 2 <211> 202 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 2 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 195 200 <210> 3 <211> 205 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Met Lys Met Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu 1 5 10 15 Arg Ala Asn Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe 20 25 30 Ala Gly Gly Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala 35 40 45 Asp Thr Val Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile 50 55 60 Ile Gly Ala Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val 65 70 75 80 Glu Ser Gly Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile 85 90 95 Ser Gln Phe Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met 100 105 110 Thr Pro Thr Glu Leu Val Lys Ala Met Lys Leu Gly His Thr Ile Leu 115 120 125 Lys Leu Phe Pro Gly Glu Val Val Gly Pro Gln Phe Val Lys Ala Met 130 135 140 Lys Gly Pro Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Asn 145 150 155 160 Leu Asp Asn Val Cys Glu Trp Phe Lys Ala Gly Val Leu Ala Val Gly 165 170 175 Val Gly Ser Ala Leu Val Lys Gly Thr Pro Asp Glu Val Arg Glu Lys 180 185 190 Ala Lys Ala Phe Val Glu Lys Ile Arg Gly Cys Thr Glu 195 200 205 <210> 4 <211> 21 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 4 Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn 1 5 10 15 Ser Ala Ser Phe Ser 20 <210> 5 <211> 19 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 5 Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe 1 5 10 15 Thr Asn Val <210> 6 <211> 435 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 195 200 205 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 210 215 220 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 225 230 235 240 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 245 250 255 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 260 265 270 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 275 280 285 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 290 295 300 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 305 310 315 320 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 325 330 335 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 340 345 350 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 355 360 365 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 370 375 380 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 385 390 395 400 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 405 410 415 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 420 425 430 Ala Thr Glu 435 <210> 7 <211> 435 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 7 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 195 200 205 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 210 215 220 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 225 230 235 240 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 245 250 255 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 260 265 270 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 275 280 285 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 290 295 300 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 305 310 315 320 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 325 330 335 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 340 345 350 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 355 360 365 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 370 375 380 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 385 390 395 400 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 405 410 415 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 420 425 430 Ala Thr Glu 435 <210> 8 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Glu Lys Ala Ala Lys Ala Glu Glu Ala Ala Arg Lys 1 5 10 <210> 9 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 9 Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu Arg Ala Asn 1 5 10 15 Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe Ala Gly Gly 20 25 30 Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala Asp Thr Val 35 40 45 Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile Ile Gly Ala 50 55 60 Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val Glu Ser Gly 65 70 75 80 Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile Ser Gln Phe 85 90 95 Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met Thr Pro Thr 100 105 110 Glu Leu Val Lys Ala Met Lys Leu Gly His Thr Ile Leu Lys Leu Phe 115 120 125 Pro Gly Glu Val Val Gly Pro Gln Phe Val Lys Ala Met Lys Gly Pro 130 135 140 Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Asn Leu Asp Asn 145 150 155 160 Val Cys Glu Trp Phe Lys Ala Gly Val Leu Ala Val Gly Val Gly Ser 165 170 175 Ala Leu Val Lys Gly Thr Pro Asp Glu Val Arg Glu Lys Ala Lys Ala 180 185 190 Phe Val Glu Lys Ile Arg Gly Cys Thr Glu 195 200 <210> 10 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu Arg Ala Asn 1 5 10 15 Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe Ala Gly Gly 20 25 30 Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala Asp Thr Val 35 40 45 Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile Ile Gly Ala 50 55 60 Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val Glu Ser Gly 65 70 75 80 Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile Ser Gln Phe 85 90 95 Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met Thr Pro Thr 100 105 110 Glu Leu Val Lys Ala Met Lys Leu Gly His Asp Ile Leu Lys Leu Phe 115 120 125 Pro Gly Glu Val Val Gly Pro Gln Phe Val Lys Ala Met Lys Gly Pro 130 135 140 Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Asn Leu Asp Asn 145 150 155 160 Val Cys Glu Trp Phe Lys Ala Gly Val Leu Ala Val Gly Val Gly Asp 165 170 175 Ala Leu Val Lys Gly Asp Pro Asp Glu Val Arg Glu Lys Ala Lys Lys 180 185 190 Phe Val Glu Lys Ile Arg Gly Cys Thr Glu 195 200 <210> 11 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 11 Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu Arg Ala Asn 1 5 10 15 Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe Ala Gly Gly 20 25 30 Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala Asp Thr Val 35 40 45 Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile Ile Gly Ala 50 55 60 Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val Glu Ser Gly 65 70 75 80 Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile Ser Gln Phe 85 90 95 Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met Thr Pro Thr 100 105 110 Glu Leu Val Lys Ala Met Lys Leu Gly His Asp Ile Leu Lys Leu Phe 115 120 125 Pro Gly Glu Val Val Gly Pro Glu Phe Val Glu Ala Met Lys Gly Pro 130 135 140 Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Asp Leu Asp Asp 145 150 155 160 Val Cys Glu Trp Phe Asp Ala Gly Val Leu Ala Val Gly Val Gly Asp 165 170 175 Ala Leu Val Glu Gly Asp Pro Asp Glu Val Arg Glu Asp Ala Lys Glu 180 185 190 Phe Val Glu Glu Ile Arg Gly Cys Thr Glu 195 200 <210> 12 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu Arg Ala Asn 1 5 10 15 Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe Ala Gly Gly 20 25 30 Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala Asp Thr Val 35 40 45 Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile Ile Gly Ala 50 55 60 Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val Glu Ser Gly 65 70 75 80 Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile Ser Gln Phe 85 90 95 Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met Thr Pro Thr 100 105 110 Glu Leu Val Lys Ala Met Lys Leu Gly His Asp Ile Leu Lys Leu Phe 115 120 125 Pro Gly Glu Val Val Gly Pro Gln Phe Val Lys Ala Met Lys Gly Pro 130 135 140 Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Asn Leu Asp Asn 145 150 155 160 Val Cys Lys Trp Phe Lys Ala Gly Val Leu Ala Val Gly Val Gly Lys 165 170 175 Ala Leu Val Lys Gly Lys Pro Asp Glu Val Arg Glu Lys Ala Lys Lys 180 185 190 Phe Val Lys Lys Ile Arg Gly Cys Thr Glu 195 200 <210> 13 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (123)..(123) <223> T or D <220> <221> MOD_RES <222> (136)..(136) <223> Q or E <220> <221> MOD_RES <222> (139)..(139) <223> K or E <220> <221> MOD_RES <222> (157)..(157) <223> N or D <220> <221> MOD_RES <222> (160)..(160) <223> N or D <220> <221> MOD_RES <222> (163)..(163) <223> E or K <220> <221> MOD_RES <222> (166)..(166) <223> K or D <220> <221> MOD_RES <222> (176)..(176) <223> S, K, or D <220> <221> MOD_RES <222> (180)..(180) <223> K or E <220> <221> MOD_RES <222> (182)..(182) <223> T, D, or K <220> <221> MOD_RES <222> (189)..(189) <223> K or D <220> <221> MOD_RES <222> (192)..(192) <223> A, E, or K <220> <221> MOD_RES <222> (195)..(195) <223> E or K <220> <221> MOD_RES <222> (196)..(196) <223> K or E <400> 13 Glu Glu Leu Phe Lys Lys His Lys Ile Val Ala Val Leu Arg Ala Asn 1 5 10 15 Ser Val Glu Glu Ala Ile Glu Lys Ala Val Ala Val Phe Ala Gly Gly 20 25 30 Val His Leu Ile Glu Ile Thr Phe Thr Val Pro Asp Ala Asp Thr Val 35 40 45 Ile Lys Ala Leu Ser Val Leu Lys Glu Lys Gly Ala Ile Ile Gly Ala 50 55 60 Gly Thr Val Thr Ser Val Glu Gln Cys Arg Lys Ala Val Glu Ser Gly 65 70 75 80 Ala Glu Phe Ile Val Ser Pro His Leu Asp Glu Glu Ile Ser Gln Phe 85 90 95 Cys Lys Glu Lys Gly Val Phe Tyr Met Pro Gly Val Met Thr Pro Thr 100 105 110 Glu Leu Val Lys Ala Met Lys Leu Gly His Xaa Ile Leu Lys Leu Phe 115 120 125 Pro Gly Glu Val Val Gly Pro Xaa Phe Val Xaa Ala Met Lys Gly Pro 130 135 140 Phe Pro Asn Val Lys Phe Val Pro Thr Gly Gly Val Xaa Leu Asp Xaa 145 150 155 160 Val Cys Xaa Trp Phe Xaa Ala Gly Val Leu Ala Val Gly Val Gly Xaa 165 170 175 Ala Leu Val Xaa Gly Xaa Pro Asp Glu Val Arg Glu Xaa Ala Lys Xaa 180 185 190 Phe Val Xaa Xaa Ile Arg Gly Cys Thr Glu 195 200 <210> 14 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Asn Gln His Ser His Lys Asp Tyr Glu Thr Val Arg Ile Ala Val Val 1 5 10 15 Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala Phe 20 25 30 Glu Ala Ala Met Ala Asp Ile Gly Gly Asp Arg Phe Ala Val Asp Val 35 40 45 Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr Leu 50 55 60 Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val Val 65 70 75 80 Asn Gly Gly Ile Tyr Arg His Glu Phe Val Ala Ser Ala Val Ile Asp 85 90 95 Gly Met Met Asn Val Gln Leu Ser Thr Gly Val Pro Val Leu Ser Ala 100 105 110 Val Leu Thr Pro His Arg Tyr Arg Asp Ser Asp Ala His Thr Leu Leu 115 120 125 Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala Cys 130 135 140 Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala 145 150 155 <210> 15 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 15 Asn Gln His Ser His Lys Asp His Glu Thr Val Arg Ile Ala Val Val 1 5 10 15 Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala Phe 20 25 30 Glu Ala Ala Met Arg Asp Ile Gly Gly Asp Arg Phe Ala Val Asp Val 35 40 45 Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr Leu 50 55 60 Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val Val 65 70 75 80 Asn Gly Gly Ile Tyr Arg His Glu Phe Val Ala Ser Ala Val Ile Asp 85 90 95 Gly Met Met Asn Val Gln Leu Asp Thr Gly Val Pro Val Leu Ser Ala 100 105 110 Val Leu Thr Pro His Arg Tyr Arg Asp Ser Asp Ala His Thr Leu Leu 115 120 125 Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala Cys 130 135 140 Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala 145 150 155 <210> 16 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Asn Gln His Ser His Lys Asp His Glu Thr Val Arg Ile Ala Val Val 1 5 10 15 Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala Phe 20 25 30 Glu Ala Ala Met Arg Asp Ile Gly Gly Asp Arg Phe Ala Val Asp Val 35 40 45 Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr Leu 50 55 60 Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val Val 65 70 75 80 Asp Gly Gly Ile Tyr Asp His Glu Phe Val Ala Ser Ala Val Ile Asp 85 90 95 Gly Met Met Asn Val Gln Leu Asp Thr Gly Val Pro Val Leu Ser Ala 100 105 110 Val Leu Thr Pro His Glu Tyr Glu Asp Ser Asp Ala Asp Thr Leu Leu 115 120 125 Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala Cys 130 135 140 Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala 145 150 155 <210> 17 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 17 Asn Gln His Ser His Lys Asp His Glu Thr Val Arg Ile Ala Val Val 1 5 10 15 Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala Phe 20 25 30 Glu Ala Ala Met Arg Asp Ile Gly Gly Asp Arg Phe Ala Val Asp Val 35 40 45 Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr Leu 50 55 60 Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val Val 65 70 75 80 Asn Gly Gly Ile Tyr Arg His Glu Phe Val Ala Ser Ala Val Ile Asn 85 90 95 Gly Met Met Asn Val Gln Leu Asn Thr Gly Val Pro Val Leu Ser Ala 100 105 110 Val Leu Thr Pro His Asn Tyr Asp Lys Ser Lys Ala His Thr Leu Leu 115 120 125 Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala Cys 130 135 140 Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala 145 150 155 <210> 18 <211> 156 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (8)..(8) <223> Y or H <220> <221> MOD_RES <222> (37)..(37) <223> A or R <220> <221> MOD_RES <222> (81)..(81) <223> N or D <220> <221> MOD_RES <222> (86)..(86) <223> R or D <220> <221> MOD_RES <222> (96)..(96) <223> D or N <220> <221> MOD_RES <222> (104)..(104) <223> S, D, or N <220> <221> MOD_RES <222> (118)..(118) <223> R, E, or N <220> <221> MOD_RES <222> (120)..(120) <223> R, D, or E <220> <221> MOD_RES <222> (121)..(121) <223> D or K <220> <221> MOD_RES <222> (123)..(123) <223> D or K <220> <221> MOD_RES <222> (125)..(125) <223> H or D <400> 18 Asn Gln His Ser His Lys Asp Xaa Glu Thr Val Arg Ile Ala Val Val 1 5 10 15 Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala Phe 20 25 30 Glu Ala Ala Met Xaa Asp Ile Gly Gly Asp Arg Phe Ala Val Asp Val 35 40 45 Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr Leu 50 55 60 Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val Val 65 70 75 80 Xaa Gly Gly Ile Tyr Xaa His Glu Phe Val Ala Ser Ala Val Ile Xaa 85 90 95 Gly Met Met Asn Val Gln Leu Xaa Thr Gly Val Pro Val Leu Ser Ala 100 105 110 Val Leu Thr Pro His Xaa Tyr Xaa Xaa Ser Xaa Ala Xaa Thr Leu Leu 115 120 125 Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala Cys 130 135 140 Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala 145 150 155 <210> 19 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 19 Glu Glu Ala Glu Leu Ala Tyr Leu Leu Gly Glu Leu Ala Tyr Lys Leu 1 5 10 15 Gly Glu Tyr Arg Ile Ala Ile Arg Ala Tyr Arg Ile Ala Leu Lys Arg 20 25 30 Asp Pro Asn Asn Ala Glu Ala Trp Tyr Asn Leu Gly Asn Ala Tyr Tyr 35 40 45 Lys Gln Gly Arg Tyr Arg Glu Ala Ile Glu Tyr Tyr Gln Lys Ala Leu 50 55 60 Glu Leu Asp Pro Asn Asn Ala Glu Ala Trp Tyr Asn Leu Gly Asn Ala 65 70 75 80 Tyr Tyr Glu Arg Gly Glu Tyr Glu Glu Ala Ile Glu Tyr Tyr Arg Lys 85 90 95 Ala Leu Arg Leu Asp Pro Asn Asn Ala Asp Ala Met Gln Asn Leu Leu 100 105 110 Asn Ala Lys Met Arg Glu Glu 115 <210> 20 <211> 153 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 20 Lys Tyr Asp Gly Ser Lys Leu Arg Ile Gly Ile Leu His Ala Arg Trp 1 5 10 15 Asn Ala Glu Ile Ile Leu Ala Leu Val Leu Gly Ala Leu Lys Arg Leu 20 25 30 Gln Glu Phe Gly Val Lys Arg Glu Asn Ile Ile Ile Glu Thr Val Pro 35 40 45 Gly Ser Phe Glu Leu Pro Tyr Gly Ser Lys Leu Phe Val Glu Lys Gln 50 55 60 Lys Arg Leu Gly Lys Pro Leu Asp Ala Ile Ile Pro Ile Gly Val Leu 65 70 75 80 Ile Lys Gly Ser Thr Met His Phe Glu Tyr Ile Cys Asp Ser Thr Thr 85 90 95 His Gln Leu Met Lys Leu Asn Phe Glu Leu Gly Ile Pro Val Ile Phe 100 105 110 Gly Val Leu Thr Cys Leu Thr Asp Glu Gln Ala Glu Ala Arg Ala Gly 115 120 125 Leu Ile Glu Gly Lys Met His Asn His Gly Glu Asp Trp Gly Ala Ala 130 135 140 Ala Val Glu Met Ala Thr Lys Phe Asn 145 150 <210> 21 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 21 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 22 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 22 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 23 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 23 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Leu Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 24 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Met Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 25 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 26 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 27 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 27 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Met Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Leu Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Val Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 28 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 29 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 29 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 30 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 31 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 31 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Ile Ser Leu Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 32 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Leu Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Leu Asp Met Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 33 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 34 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Leu Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 35 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Met Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 36 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 37 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Trp Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 38 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Phe Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Gly Ser Gly 225 230 235 240 Gly Ser Gly Ser Gly Gly Ser Gly Gly Ser Gly Ser Glu Lys Ala Ala 245 250 255 Lys Ala Glu Glu Ala Ala Arg Lys Met Glu Glu Leu Phe Lys Lys His 260 265 270 Lys Ile Val Ala Val Leu Arg Ala Asn Ser Val Glu Glu Ala Ile Glu 275 280 285 Lys Ala Val Ala Val Phe Ala Gly Gly Val His Leu Ile Glu Ile Thr 290 295 300 Phe Thr Val Pro Asp Ala Asp Thr Val Ile Lys Ala Leu Ser Val Leu 305 310 315 320 Lys Glu Lys Gly Ala Ile Ile Gly Ala Gly Thr Val Thr Ser Val Glu 325 330 335 Gln Ala Arg Lys Ala Val Glu Ser Gly Ala Glu Phe Ile Val Ser Pro 340 345 350 His Leu Asp Glu Glu Ile Ser Gln Phe Ala Lys Glu Lys Gly Val Phe 355 360 365 Tyr Met Pro Gly Val Met Thr Pro Thr Glu Leu Val Lys Ala Met Lys 370 375 380 Leu Gly His Thr Ile Leu Lys Leu Phe Pro Gly Glu Val Val Gly Pro 385 390 395 400 Gln Phe Val Lys Ala Met Lys Gly Pro Phe Pro Asn Val Lys Phe Val 405 410 415 Pro Thr Gly Gly Val Asn Leu Asp Asn Val Ala Glu Trp Phe Lys Ala 420 425 430 Gly Val Leu Ala Val Gly Val Gly Ser Ala Leu Val Lys Gly Thr Pro 435 440 445 Asp Glu Val Arg Glu Lys Ala Lys Ala Phe Val Glu Lys Ile Arg Gly 450 455 460 Ala Thr Glu Gly Gly Ser His His His His His His His His 465 470 475 <210> 39 <211> 259 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 39 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Leu Asn Asp 225 230 235 240 Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu His His His His His 245 250 255 His His His <210> 40 <211> 259 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Leu Asn Asp 225 230 235 240 Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu His His His His His 245 250 255 His His His <210> 41 <211> 259 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 35 40 45 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 50 55 60 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 65 70 75 80 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 85 90 95 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 100 105 110 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 115 120 125 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 130 135 140 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 145 150 155 160 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 165 170 175 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 180 185 190 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 195 200 205 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 210 215 220 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Leu Asn Asp 225 230 235 240 Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu His His His His His 245 250 255 His His His <210> 42 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Met Asn Gln His Ser His Lys Asp His Glu Thr Val Arg Ile Ala Val 1 5 10 15 Val Arg Ala Arg Trp His Ala Glu Ile Val Asp Ala Cys Val Ser Ala 20 25 30 Phe Glu Ala Ala Met Arg Asp Ile Gly Gly Asp Arg Phe Ala Val Asp 35 40 45 Val Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr 50 55 60 Leu Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val 65 70 75 80 Val Asn Gly Gly Ile Tyr Arg His Glu Phe Val Ala Ser Ala Val Ile 85 90 95 Asn Gly Met Met Asn Val Gln Leu Asn Thr Gly Val Pro Val Leu Ser 100 105 110 Ala Val Leu Thr Pro His Asn Tyr Asp Lys Ser Lys Ala His Thr Leu 115 120 125 Leu Phe Leu Ala Leu Phe Ala Val Lys Gly Met Glu Ala Ala Arg Ala 130 135 140 Cys Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala Gly Ser Leu 145 150 155 160 Glu His His His His His His 165 <210> 43 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Met Asn Gln His Ser His Lys Asp Tyr Glu Thr Val Arg Ile Ala Val 1 5 10 15 Val Arg Ala Arg Trp His Ala Asp Ile Val Asp Gln Cys Val Ser Ala 20 25 30 Phe Glu Ala Glu Met Ala Asp Ile Gly Gly Asp Arg Phe Ala Val Asp 35 40 45 Val Phe Asp Val Pro Gly Ala Tyr Glu Ile Pro Leu His Ala Arg Thr 50 55 60 Leu Ala Glu Thr Gly Arg Tyr Gly Ala Val Leu Gly Thr Ala Phe Val 65 70 75 80 Val Asn Gly Gly Ile Tyr Arg His Glu Phe Val Ala Ser Ala Val Ile 85 90 95 Asp Gly Met Met Asn Val Gln Leu Ser Thr Gly Val Pro Val Leu Ser 100 105 110 Ala Val Leu Thr Pro His Asn Tyr His Asp Ser Ala Glu His His Arg 115 120 125 Phe Phe Phe Glu His Phe Thr Val Lys Gly Lys Glu Ala Ala Arg Ala 130 135 140 Cys Val Glu Ile Leu Ala Ala Arg Glu Lys Ile Ala Ala Gly Ser Leu 145 150 155 160 Glu His His His His His His 165 <210> 44 <211> 1288 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 44 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Ser Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile 885 890 895 Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg 1205 1210 1215 Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu 1220 1225 1230 Ser Thr Phe Leu Gly Arg Ser Leu Glu Val Leu Phe Gln Gly Pro 1235 1240 1245 Gly His His His His His His His His Ser Ala Trp Ser His Pro 1250 1255 1260 Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 1265 1270 1275 Ser Ala Trp Ser His Pro Gln Phe Glu Lys 1280 1285 <210> 45 <211> 1262 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Met Ala Arg Ala Trp Ile Phe Phe Leu Leu Cys Leu Ala Gly Arg Ala 1 5 10 15 Leu Ala Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala 20 25 30 Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe 35 40 45 Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe 50 55 60 Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly 65 70 75 80 Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr 85 90 95 Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly 100 105 110 Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala 115 120 125 Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro 130 135 140 Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser 145 150 155 160 Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val 165 170 175 Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys 180 185 190 Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile 195 200 205 Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly 210 215 220 Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile 225 230 235 240 Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro 245 250 255 Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val 260 265 270 Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly 275 280 285 Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr 290 295 300 Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr 305 310 315 320 Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 325 330 335 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 340 345 350 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 355 360 365 Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 370 375 380 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val 385 390 395 400 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 405 410 415 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 420 425 430 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 435 440 445 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 450 455 460 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 465 470 475 480 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 485 490 495 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 500 505 510 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 515 520 525 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val 530 535 540 Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser 545 550 555 560 Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp 565 570 575 Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile 580 585 590 Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn 595 600 605 Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu 610 615 620 Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val 625 630 635 640 Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile 645 650 655 Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly 660 665 670 Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser 675 680 685 Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 690 695 700 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 705 710 715 720 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 725 730 735 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 740 745 750 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 755 760 765 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 770 775 780 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 785 790 795 800 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 805 810 815 Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 820 825 830 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 835 840 845 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 850 855 860 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 865 870 875 880 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 885 890 895 Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn 900 905 910 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 915 920 925 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 930 935 940 Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 945 950 955 960 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 965 970 975 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 980 985 990 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 995 1000 1005 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile 1010 1015 1020 Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val 1025 1030 1035 Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His 1040 1045 1050 Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu 1055 1060 1065 His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala 1070 1075 1080 Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly 1085 1090 1095 Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn 1100 1105 1110 Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser 1115 1120 1125 Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr 1130 1135 1140 Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp 1145 1150 1155 Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1160 1165 1170 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 1175 1180 1185 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile 1190 1195 1200 Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Gly Ser Gly Tyr Ile 1205 1210 1215 Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly 1220 1225 1230 Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Arg Ser Leu Glu Val 1235 1240 1245 Leu Phe Gln Gly Pro Gly His His His His His His His His 1250 1255 1260 <210> 46 <211> 1262 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Met Ala Arg Ala Trp Ile Phe Phe Leu Leu Cys Leu Ala Gly Arg Ala 1 5 10 15 Leu Ala Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala 20 25 30 Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe 35 40 45 Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe 50 55 60 Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly 65 70 75 80 Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr 85 90 95 Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly 100 105 110 Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala 115 120 125 Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro 130 135 140 Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser 145 150 155 160 Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val 165 170 175 Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys 180 185 190 Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile 195 200 205 Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly 210 215 220 Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile 225 230 235 240 Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro 245 250 255 Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val 260 265 270 Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly 275 280 285 Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr 290 295 300 Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr 305 310 315 320 Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn 325 330 335 Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe 340 345 350 Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala 355 360 365 Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys 370 375 380 Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Trp Thr Asn Ile 385 390 395 400 Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala 405 410 415 Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp 420 425 430 Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser 435 440 445 Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser 450 455 460 Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala 465 470 475 480 Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro 485 490 495 Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro 500 505 510 Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr 515 520 525 Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val 530 535 540 Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser 545 550 555 560 Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp 565 570 575 Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile 580 585 590 Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn 595 600 605 Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu 610 615 620 Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val 625 630 635 640 Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile 645 650 655 Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly 660 665 670 Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser 675 680 685 Ala Ser Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 690 695 700 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro 705 710 715 720 Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met 725 730 735 Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr 740 745 750 Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu 755 760 765 Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln 770 775 780 Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys 785 790 795 800 Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys 805 810 815 Pro Ser Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr 820 825 830 Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 835 840 845 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 850 855 860 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser 865 870 875 880 Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 885 890 895 Pro Ala Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn 900 905 910 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile 915 920 925 Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 930 935 940 Ser Thr Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn 945 950 955 960 Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly 965 970 975 Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro 980 985 990 Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser 995 1000 1005 Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile 1010 1015 1020 Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val 1025 1030 1035 Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His 1040 1045 1050 Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu 1055 1060 1065 His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala 1070 1075 1080 Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly 1085 1090 1095 Val Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn 1100 1105 1110 Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser 1115 1120 1125 Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr 1130 1135 1140 Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp 1145 1150 1155 Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1160 1165 1170 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 1175 1180 1185 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile 1190 1195 1200 Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Gly Ser Gly Tyr Ile 1205 1210 1215 Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly 1220 1225 1230 Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Arg Ser Leu Glu Val 1235 1240 1245 Leu Phe Gln Gly Pro Gly His His His His His His His His 1250 1255 1260 <210> 47 <211> 833 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Met Ala Arg Ala Trp Ile Phe Phe Leu Leu Cys Leu Ala Gly Arg Ala 1 5 10 15 Leu Ala Ser Thr Ile Glu Glu Gln Ala Lys Thr Phe Leu Asp Lys Phe 20 25 30 Asn His Glu Ala Glu Asp Leu Phe Tyr Gln Ser Ser Leu Ala Ser Trp 35 40 45 Asn Tyr Asn Thr Asn Ile Thr Glu Glu Asn Val Gln Asn Met Asn Asn 50 55 60 Ala Gly Asp Lys Trp Ser Ala Phe Leu Lys Glu Gln Ser Thr Leu Ala 65 70 75 80 Gln Met Tyr Pro Leu Gln Glu Ile Gln Asn Leu Thr Val Lys Leu Gln 85 90 95 Leu Gln Ala Leu Gln Gln Asn Gly Ser Ser Val Leu Ser Glu Asp Lys 100 105 110 Ser Lys Arg Leu Asn Thr Ile Leu Asn Thr Met Ser Thr Ile Tyr Ser 115 120 125 Thr Gly Lys Val Cys Asn Pro Asp Asn Pro Gln Glu Cys Leu Leu Leu 130 135 140 Glu Pro Gly Leu Asn Glu Ile Met Ala Asn Ser Leu Asp Tyr Asn Glu 145 150 155 160 Arg Leu Trp Ala Trp Glu Ser Trp Arg Ser Glu Val Gly Lys Gln Leu 165 170 175 Arg Pro Leu Tyr Glu Glu Tyr Val Val Leu Lys Asn Glu Met Ala Arg 180 185 190 Ala Asn His Tyr Glu Asp Tyr Gly Asp Tyr Trp Arg Gly Asp Tyr Glu 195 200 205 Val Asn Gly Val Asp Gly Tyr Asp Tyr Ser Arg Gly Gln Leu Ile Glu 210 215 220 Asp Val Glu His Thr Phe Glu Glu Ile Lys Pro Leu Tyr Glu His Leu 225 230 235 240 His Ala Tyr Val Arg Ala Lys Leu Met Asn Ala Tyr Pro Ser Tyr Ile 245 250 255 Ser Pro Ile Gly Cys Leu Pro Ala His Leu Leu Gly Asp Met Trp Gly 260 265 270 Arg Phe Trp Thr Asn Leu Tyr Ser Leu Thr Val Pro Phe Gly Gln Lys 275 280 285 Pro Asn Ile Asp Val Thr Asp Ala Met Val Asp Gln Ala Trp Asp Ala 290 295 300 Gln Arg Ile Phe Lys Glu Ala Glu Lys Phe Phe Val Ser Val Gly Leu 305 310 315 320 Pro Asn Met Thr Gln Gly Phe Trp Glu Asn Ser Met Leu Thr Asp Pro 325 330 335 Gly Asn Val Gln Lys Ala Val Cys His Pro Thr Ala Trp Asp Leu Gly 340 345 350 Lys Gly Asp Phe Arg Ile Leu Met Cys Thr Lys Val Thr Met Asp Asp 355 360 365 Phe Leu Thr Ala His His Glu Met Gly His Ile Gln Tyr Asp Met Ala 370 375 380 Tyr Ala Ala Gln Pro Phe Leu Leu Arg Asn Gly Ala Asn Glu Gly Phe 385 390 395 400 His Glu Ala Val Gly Glu Ile Met Ser Leu Ser Ala Ala Thr Pro Lys 405 410 415 His Leu Lys Ser Ile Gly Leu Leu Ser Pro Asp Phe Gln Glu Asp Asn 420 425 430 Glu Thr Glu Ile Asn Phe Leu Leu Lys Gln Ala Leu Thr Ile Val Gly 435 440 445 Thr Leu Pro Phe Thr Tyr Met Leu Glu Lys Trp Arg Trp Met Val Phe 450 455 460 Lys Gly Glu Ile Pro Lys Asp Gln Trp Met Lys Lys Trp Trp Glu Met 465 470 475 480 Lys Arg Glu Ile Val Gly Val Val Glu Pro Val Pro His Asp Glu Thr 485 490 495 Tyr Cys Asp Pro Ala Ser Leu Phe His Val Ser Asn Asp Tyr Ser Phe 500 505 510 Ile Arg Tyr Tyr Thr Arg Thr Leu Tyr Gln Phe Gln Phe Gln Glu Ala 515 520 525 Leu Cys Gln Ala Ala Lys His Glu Gly Pro Leu His Lys Cys Asp Ile 530 535 540 Ser Asn Ser Thr Glu Ala Gly Gln Lys Leu Phe Asn Met Leu Arg Leu 545 550 555 560 Gly Lys Ser Glu Pro Trp Thr Leu Ala Leu Glu Asn Val Val Gly Ala 565 570 575 Lys Asn Met Asn Val Arg Pro Leu Leu Asn Tyr Phe Glu Pro Leu Phe 580 585 590 Thr Trp Leu Lys Asp Gln Asn Lys Asn Ser Phe Val Gly Trp Ser Thr 595 600 605 Asp Trp Ser Pro Tyr Ala Asp Pro Leu Val Pro Arg Gly Ser Gly Gly 610 615 620 Gly Gly Asp Pro Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro 625 630 635 640 Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe 645 650 655 Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val 660 665 670 Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe 675 680 685 Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro 690 695 700 Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr 705 710 715 720 Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val 725 730 735 Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala 740 745 750 Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg 755 760 765 Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly 770 775 780 Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro 785 790 795 800 Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser 805 810 815 Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln 820 825 830 Gly <210> 48 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Met Gly Ile Leu Pro Ser Pro Gly Met Pro Ala Leu Leu Ser Leu Val 1 5 10 15 Ser Leu Leu Ser Val Leu Leu Met Gly Cys Val Ala Glu Thr Gly Thr 20 25 30 <210> 49 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Gly Gly Ser His His His His His His His His 1 5 10 <210> 50 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 50 Glu Lys Ala Ala Lys Ala Glu Glu Ala Ala Arg 1 5 10 <210> 51 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 51 Pro Pro Pro Ile 1 <210> 52 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 52 Pro Pro Pro Phe 1 <210> 53 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 8xHis tag <400> 53 His His His His His His His His 1 5 <210> 54 <211> 1273 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 54 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 55 <211> 11 <212> PRT <213> Severe acute respiratory syndrome coronavirus 2 <400> 55 Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr 1 5 10 <210> 56 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 56 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 195 200 <210> 57 <211> 202 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 57 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Phe Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Trp Thr Asn Ile Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 195 200 <210> 58 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 58 Phe Thr Asn Val Tyr Ala Asp Ser 1 5 <210> 59 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 59 Trp Thr Asn Val Tyr Ala Asp Ser 1 5 <210> 60 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Trp Thr Asn Ile Tyr Ala Asp Ser 1 5 <210> 61 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 61 His His His His His His 1 5

Claims

비천연 발생 폴리펩타이드로서, 서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고, 서열번호 1의 RBD에 대해 적어도 2개의 돌연변이를 추가로 포함하고, 상기 적어도 2개의 돌연변이는 다음으로 이루어진 군으로부터 선택되거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는, 비천연 발생 폴리펩타이드:
F338L/Y365W;
Y365W/L513M;
Y365W/F392W;
F338M/A363L/Y365F/F377V;
Y365F/F392W;
Y365F/V395I;
Y365F/F392W/V395I;
Y365W/L513I/F515L;
F338L/A363L/Y365M;
F338L/I358F/Y365W;
I358F/Y365W/L513M;
I358F/Y365W/F392W;
F338M/I358F/A363L/Y365F/F377V;
I358F/Y365F/F392W;
I358F/Y365F/V395I;
I358F/Y365F/F392W/V395I;
I358F/Y365W/L513I/F515L; 및
F338L/I358F/A363L/Y365M.
비천연 발생 폴리펩타이드로서,
서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)을 포함하고,
서열번호 1의 RBD에 대해 적어도 2개의 돌연변이 또는 제2 코로나바이러스의 상응하는 잔기를 추가로 포함하고,
상기 적어도 2개의 돌연변이는 상기 적어도 2개의 돌연변이가 결여된 야생형 폴리펩타이드 안정성에 대하여 폴리펩타이드 안정성을 향상시키는,
비천연 발생 폴리펩타이드.
제2항에 있어서, 상기 적어도 2개의 돌연변이가 서열번호 1의 다음 아미노산에 있거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 수용체 결합의 상응하는 잔기에 있는, 폴리펩타이드:
338 및 365;
365 및 513;
365 및 392;
338, 363, 365 및 377;
365 및 392;
365 및 395;
365, 392 및 395;
365, 513 및 515;
338, 363 및 365;
338, 358 및 365;
358, 365 및 513;
358, 365 및 392;
338, 358, 363, 365 및 377;
358, 365 및 392;
358, 365 및 395;
358, 365, 392 및 395;
358, 365, 513 및 515; 및/또는
338, 358, 363 및 365.
제2항 또는 제3항에 있어서, 상기 적어도 2개의 돌연변이가 서열번호 1의 다음으로 이루어진 군으로부터 선택되거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인 서열과 서열번호 1을 서열 정렬에 의해 결정시, 제2 코로나바이러스의 상응하는 잔기에 있는, 폴리펩타이드:
F338L/Y365W;
Y365W/L513M;
Y365W/F392W;
F338M/A363L/Y365F/F377V;
Y365F/F392W;
Y365F/V395I;
Y365F/F392W/V395I;
Y365W/L513I/F515L;
F338L/A363L/Y365M;
F338L/I358F/Y365W;
I358F/Y365W/L513M;
I358F/Y365W/F392W;
F338M/I358F/A363L/Y365F/F377V;
I358F/Y365F/F392W;
I358F/Y365F/V395I;
I358F/Y365F/F392W/V395I;
I358F/Y365W/L513I/F515L; 및
F338L/I358F/A363L/Y365M.
제2항 내지 제4항 중 어느 한 항에 있어서, 서열번호 1의 상기 RBD 외부에 추가적인 아미노산 잔기를 추가로 포함하는, 폴리펩타이드.
제2항 내지 제5항 중 어느 한 항에 있어서, 상기 코로나바이러스 수용체 결합 도메인(RBD)이 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함하는, 폴리펩타이드.
제2항 내지 제6항 중 어느 한 항에 있어서, 서열번호 1의 다음 아미노산에 있거나, 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 적어도 2개의 돌연변이가 야생형에 대하여 수용체 결합 도메인 내의 유일한 돌연변이인, 폴리펩타이드:
338 및 365;
365 및 513;
365 및 392;
338, 363, 365 및 377;
365 및 392;
365 및 395;
365, 392 및 395;
365, 513 및 515;
338, 363 및 365;
338, 358 및 365;
358, 365 및 513;
358, 365 및 392;
338, 358, 363, 365 및 377;
358, 365 및 392;
358, 365 및 395;
358, 365, 392 및 395;
358, 365, 513 및 515; 및/또는
338, 358, 363 및 365.
제2항 내지 제7항 중 어느 한 항에 있어서, 상기 RBD 폴리펩타이드의 발현이 세포에서 발현될 때 상기 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드의 발현과 비교하여 증가된, 폴리펩타이드.
제2항 내지 제8항 중 어느 한 항에 있어서, 상기 RBD 폴리펩타이드가 코로나바이러스 항체에 결합하거나 코로나바이러스 동족 수용체를 결합시키는, 폴리펩타이드.
제9항에 있어서, 상기 코로나바이러스 항체는 SARS-CoV-2 항체를 포함하는, 폴리펩타이드.
제9항에 있어서, 상기 폴리펩타이드에 상응하는 코로나바이러스 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함하는, 폴리펩타이드.
제11항에 있어서, 상기 ACE 수용체는 ACE2 수용체인, 폴리펩타이드.
제2항 내지 제12항 중 어느 한 항에 있어서, 상기 제2 코로나바이러스는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; 또는 HKUl로부터 선택되는 코로나바이러스 서열을 포함하는, 폴리펩타이드.
제2항 내지 제13항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 서열번호 1과 적어도 90%의 서열 동일성을 포함하는, 폴리펩타이드.
제2항 내지 제14항 중 어느 한 항에 있어서, 상기 RBD는 제2 이종 폴리펩타이드에 융합된, 폴리펩타이드.
제15항에 있어서, 상기 RBD는 나노입자, 나노구조 또는 이종 단백질 스캐폴드에 융합된, 폴리펩타이드.
제2항 내지 제16항 중 어느 한 항에 있어서, 상기 RBD 폴리펩타이드 및/또는 제2 폴리펩타이드는 항원성 폴리펩타이드인, 폴리펩타이드.
제1항 내지 제17항 중 어느 한 항의 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
제18항에 있어서, 아쥬반트를 추가로 포함하는, 조성물.
제18항 또는 제19항에 있어서, 상기 조성물의 사용기한은 상기 적어도 2개의 돌연변이가 결여된 야생형 RBD 폴리펩타이드를 포함하는 조성물보다 긴, 조성물.
제18항 내지 제20항 중 어느 한 항에 있어서, 상기 조성물은 백신으로 제형화된, 조성물.
적어도 2개의 돌연변이를 포함하고, 상기 적어도 2개의 돌연변이는 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이를 포함하는, 비천연 발생 코로나바이러스 스파이크 단백질 서브유닛 1 폴리펩타이드.
제22항에 있어서, 상기 적어도 2개의 돌연변이가 상기 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드 안정성에 대하여 코로나바이러스 폴리펩타이드 안정성을 향상시킨, 코로나바이러스 폴리펩타이드.
제22항 또는 제23항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이가 코로나바이러스 스파이크 단백질, 서브유닛 1의 리놀레산 결합 포켓 내 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제24항 중 어느 한 항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이가 서열번호 1의 328-531 잔기 내에 있는 잔기의 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제25항 중 어느 한 항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이가 335-345; 355-375, 또는 378-395 잔기 사이에 있는 서열번호 1의 잔기의 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제26항 중 어느 한 항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이가 336, 338, 341, 342, 358, 361, 363, 365, 368, 374, 377, 387 또는 392 아미노산에 있는 서열번호 1의 잔기의 돌연변이, 또는 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기의 돌연변이를 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제27항 중 어느 한 항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 서열번호 1의 다음 잔기에 있거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기에 있는, 코로나바이러스 폴리펩타이드:
338 및 365;
365 및 513;
365 및 392;
338, 363, 365 및 377;
365 및 392;
365 및 395;
365, 392 및 395;
365, 513 및 515;
338, 363 및 365;
338, 358 및 365;
358, 365 및 513;
358, 365 및 392;
338, 358, 363, 365 및 377;
358, 365 및 392;
358, 365 및 395;
358, 365, 392 및 395;
358, 365, 513 및 515; 및/또는
338, 358, 363 및 365.
제22항 내지 제28항 중 어느 한 항에 있어서, 상기 적어도 1개의 캐비티 채움 돌연변이 및 상기 적어도 1개의 제2 돌연변이가 서열번호 1의 다음으로 이루어진 군으로부터 선택되거나, 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 상응하는 잔기로부터 선택되는, 코로나바이러스 폴리펩타이드:
F338L/Y365W;
Y365W/L513M;
Y365W/F392W;
F338M/A363L/Y365F/F377V;
Y365F/F392W;
Y365F/V395I;
Y365F/F392W/V395I;
Y365W/L513I/F515L;
F338L/A363L/Y365M;
F338L/I358F/Y365W;
I358F/Y365W/L513M;
I358F/Y365W/F392W;
F338M/I358F/A363L/Y365F/F377V;
I358F/Y365F/F392W;
I358F/Y365F/V395I;
I358F/Y365F/F392W/V395I;
I358F/Y365W/L513I/F515L; 및
F338L/I358F/A363L/Y365M.
제22항 내지 제29항 중 어느 한 항에 있어서, 상기 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드가 서열번호 1의 328-531 잔기와 적어도 95% 동일성을 포함하거나 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 서열과 서열번호 1을, 서열 정렬에 의해 결정시, 제2 코로나바이러스 스파이크 단백질, 서브유닛 1의 수용체 결합 도메인 서열과 적어도 95% 동일성을 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제30항 중 어느 한 항에 있어서, 서열번호 1의 다음 아미노산에 있거나 제2 코로나바이러스 수용체 결합 도메인의 상응하는 잔기에 있는 적어도 2개의 돌연변이가 서열번호 1에 대하여 스파이크 단백질, 서브유닛 1의 유일한 돌연변이인, 코로나바이러스 스파이크 단백질:
338 및 365;
365 및 513;
365 및 392;
338, 363, 365 및 377;
365 및 392;
365 및 395;
365, 392 및 395;
365, 513 및 515;
338, 363 및 365;
338, 358 및 365;
358, 365 및 513;
358, 365 및 392;
338, 358, 363, 365 및 377;
358, 365 및 392;
358, 365 및 395;
358, 365, 392 및 395;
358, 365, 513 및 515; 및/또는
338, 358, 363 및 365.
제22항 내지 제31항 중 어느 한 항에 있어서, 상기 코로나바이러스 폴리펩타이드는 서열번호 1 또는 제2 코로나바이러스의 야생형 스파이크 단백질, 서브유닛 1 아미노산 서열과 적어도 95% 동일성을 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제31항 중 어느 한 항에 있어서, 코로나바이러스 폴리펩타이드의 발현은 세포에서 발현될 때 동일한 발현 조건 하에서 상기 적어도 1개의 캐비티 채움 돌연변이 및 적어도 1개의 제2 돌연변이가 결여된 야생형 폴리펩타이드의 발현과 비교하여 증가된, 코로나바이러스 폴리펩타이드.
제22항 내지 제33항 중 어느 한 항에 있어서, 상기 코로나바이러스 폴리펩타이드는 코로나바이러스 항체에 결합하거나 동족 코로나바이러스 수용체를 결합시키는, 코로나바이러스 폴리펩타이드.
제34항에 있어서, 상기 코로나바이러스 항체는 SARS-CoV-2 항체를 포함하는, 코로나바이러스 폴리펩타이드.
제35항에 있어서, 상기 동족 코로나바이러스 수용체는 안지오텐신 전환 효소(ACE) 수용체를 포함하는, 코로나바이러스 폴리펩타이드.
제36항에 있어서, 상기 ACE 수용체는 ACE2 수용체인, 코로나바이러스 폴리펩타이드.
제22항 내지 제37항 중 어느 한 항에 있어서, 상기 코로나바이러스 폴리펩타이드는 중증 급성 호흡기 증후군 관련 코로나바이러스 2(SARS-CoV-2), 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS-CoV); 중동 호흡기 증후군(MERS); 229E; NL63; OC43; 또는 HKU1로부터 선택된 코로나바이러스의 조작된 돌연변이체 폴리펩타이드인, 코로나바이러스 폴리펩타이드.
제22항 내지 제38항 중 어느 한 항에 있어서, 상기 코로나바이러스 스파이크 단백질, 서브유닛 1 폴리펩타이드는 서열번호 1과 적어도 90% 서열 동일성을 포함하는, 코로나바이러스 폴리펩타이드.
제22항 내지 제39항 중 어느 한 항에 있어서, 상기 코로나바이러스 폴리펩타이드는 제2 이종 폴리펩타이드에 융합된, 코로나바이러스 폴리펩타이드.
제22항 내지 제40항 중 어느 한 항에 있어서, 상기 코로나바이러스 폴리펩타이드는 나노입자, 나노구조 또는 단백질 스캐폴드에 융합된, 코로나바이러스 폴리펩타이드.
제40항에 있어서, 상기 코로나바이러스 폴리펩타이드 또는 제2 이종 폴리펩타이드는 항원성 폴리펩타이드인, 코로나바이러스 폴리펩타이드.
제22항 내지 제42항 중 어느 한 항의 코로나바이러스 폴리펩타이드 및 약제학적으로 허용가능한 담체를 포함하는 조성물.
제43항에 있어서, 아쥬반트를 추가로 포함하는, 조성물.
제43항 또는 제44항에 있어서, 상기 조성물의 사용기한은 동일한 저장 조건 하에 보관될 때 상기 적어도 1개의 캐비티 채움 돌연변이 및 적어도 제2 돌연변이가 결여된 야생형 코로나바이러스 폴리펩타이드를 포함하는 조성물보다 긴, 조성물.
제43항 내지 제45항 중 어느 한 항에 있어서, 상기 조성물은 백신으로 제형화된, 조성물.
제1항 내지 제15항 중 어느 한 항의 수용체 결합 도메인 또는 제22항 내지 제42항 중 어느 한 항의 코로나바이러스 폴리펩타이드를 발현하는 세포.
제1항 내지 제15항 중 어느 한 항의 수용체 결합 도메인 또는 제22항 내지 제42항 중 어느 한 항의 코로나바이러스 폴리펩타이드를 암호화하는 핵산 서열.
대상체에게 코로나바이러스에 대한 백신접종을 하는 방법으로서, 상기 대상체에게 제21항 또는 제46항의 조성물을 투여하는 것을 포함하는, 방법.
백신의 제조방법으로서, 제1항 내지 제15항 또는 제22항 내지 제42항 중 어느 한 항의 조성물을 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함하는, 방법.
제1항 내지 제25항 중 어느 한 항의 폴리펩타이드를 포함하는 코로나바이러스 스파이크 단백질.
프로토콜 1의 Blast-p 매개변수가 다음을 포함하는, 제1항 내지 제51항 중 어느 한 항에 따른 방법 또는 조성물:
알고리즘: blastp(단백질-단백질 BLAST)
기대 임계값: 0.1
단어 크기: 6
쿼리 범위의 최대 일치항목: 0
매트릭스: BLOSUM62
갭 비용:
존재 11
확대 1
복잡도가 낮은 영역을 필터링합니까?: 아니요
마스크:
표만 검색합니까?: 아니요
소문자? : 아니요.
제1항 내지 제52항 중 어느 한 항에 따른 방법 또는 조성물로서, 프로토콜 2의 Blast-p 매개변수가
blastp -query query.fasta -subject sbjct.fasta -matrix BLOSUM62 -evalue 0.1 -
word size 6 -gapopen 11 -gapextend 1 -out results.txt
을 포함하는, 방법 또는 조성물.
서열번호 1의 코로나바이러스 폴리펩타이드에 대하여 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 돌연변이를 포함하는 코로나바이러스 수용체 결합 도메인(RBD)을 포함하는 폴리펩타이드 또는 그의 변이체.
제54항에 있어서, 상기 돌연변이는 I358F, Y365F, Y365W, V367F 및 F392W로 이루어진 군으로부터 선택된, 폴리펩타이드.
제54항 또는 제55항에 있어서, 상기 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L513I, L513M 및 F515L로 이루어진 군으로부터 선택된 제2 돌연변이를 포함하는, 폴리펩타이드.
제54항 내지 제56항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L5131, L513M 및 F515L로 이루어진 군으로부터 선택된 제3 돌연변이를 포함하는, 폴리펩타이드.
제57항에 있어서, 상기 폴리펩타이드는 서열번호 4 또는 서열번호 5의 폴리펩타이드 서열을 포함하는, 폴리펩타이드.
제54항 내지 제58항 중 어느 한 항에 있어서, 상기 폴리펩타이드는 이종 단백질 스캐폴드를 포함하는, 폴리펩타이드.
제59항에 있어서, 상기 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드 서열과 적어도 90%, 적어도 95% 또는 적어도 98% 동일성을 가지는, 폴리펩타이드.
제59항에 있어서, 상기 이종 단백질 스캐폴드는 서열번호 3의 폴리펩타이드를 포함하는, 폴리펩타이드.
제61항에 있어서, 상기 폴리펩타이드는 서열번호 6 또는 서열번호 7의 폴리펩타이드 서열을 포함하는, 폴리펩타이드.
제59항 내지 제62항 중 어느 한 항의 폴리펩타이드로 이루어진 제1 성분 및 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 가지는 제2 성분을 포함하거나 이들로 이루어지는, 폴리펩타이드 복합체.
제54항 내지 제62항 중 어느 한 항의 조성물 또는 제63항의 폴리펩타이드 복합체를 포함하는 백신 조성물.
제64항에 있어서, 약제학적으로 허용가능한 담체를 추가로 포함하는, 백신 조성물.
제64항 또는 제65항에 있어서, 아쥬반트를 추가로 포함하는, 백신 조성물.
제54항 내지 제62항 중 어느 한 항의 폴리펩타이드를 발현하는 세포.
제54항 내지 제62항 중 어느 한 항의 폴리펩타이드를 암호화하는 핵산.
대상체에게 코로나바이러스 백신접종을 하는 방법으로서, 상기 방법은 상기 대상체에게 제54항 내지 제62항 중 어느 한 항의 폴리펩타이드, 제63항의 단백질 복합체 또는 제64항 내지 제68항 중 어느 한 항의 백신 조성물을 투여하는 것을 포함하는, 방법.
백신 제조방법으로서, 상기 방법은 제54항 내지 제62항 중 어느 한 항의 폴리펩타이드를 아쥬반트 및 약제학적으로 허용가능한 담체와 조합하는 것을 포함하는, 방법.
백신의 제조방법으로서, 상기 방법은 제59항 내지 제62항 중 어느 한 항의 폴리펩타이드로 이루어진 제1 성분; 서열번호 13-18 중 어느 하나와 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 가지는 제2 성분; 약제학적으로 허용가능한 담체; 및 선택적으로 아쥬반트를 조합하는 것을 포함하는, 백신의 제조방법.
비천연 발생 폴리펩타이드로서,
서열번호 1의 328-531 잔기와 적어도 90% 동일성을 포함하는 제1 코로나바이러스 수용체 결합 도메인(RBD)으로서, 서열번호 1의 상기 RBD에 대해 적어도 1개의 돌연변이를 추가로 포함하고, 상기 적어도 1개의 돌연변이는 서열번호 1의 I358F, Y365F, Y365W, V367F, F392W, G502D, N501F, N501T, Q498Y, F338L, F338M, A363L, Y365M, F377V, V395I, L5131, L513M 및 F515L로 이루어진 군으로부터 선택되는 것인, 제1 코로나바이러스 수용체 결합 도메인 또는 제2 코로나바이러스 참조 서열에서 상응하는 부위가 프로토콜 1 또는 프로토콜 2의 Blast-p 매개변수를 이용하여 제2 코로나바이러스 수용체 결합 도메인의 스파이크 단백질 서열과 서열번호 1의 서열 정렬에 의해 결정되는 것인 제2 코로나바이러스 참조 서열
을 포함하는, 비천연 발생 폴리펩타이드.
제72항에 있어서, 상기 폴리펩타이드는 다음으로부터 선택되는 2개 이상의 돌연변이를 포함하는, 폴리펩타이드:
F338L/Y365W;
Y365W/L513M;
Y365W/F392W;
F338M/A363L/Y365F/F377V;
Y365F/F392W;
Y365F/V395I;
Y365F/F392W/V395I;
Y365W/L513I/F515L;
F338L/A363L/Y365M;
F338L/I358F/Y365W;
I358F/Y365W/L513M;
I358F/Y365W/F392W;
F338M/I358F/A363L/Y365F/F377V;
I358F/Y365F/F392W;
I358F/Y365F/V395I;
I358F/Y365F/F392W/V395I;
I358F/Y365W/L513I/F515L; 및
F338L/I358F/A363L/Y365M.