KR20230015310A

KR20230015310A - 2019-ncov (sars-cov-2) 백신

Info

Publication number: KR20230015310A
Application number: KR1020227032226A
Authority: KR
Inventors: 고라브 굽타; 라인하르트 글루에크
Original assignee: 백스바이오 리미티드
Priority date: 2020-02-17
Filing date: 2021-02-17
Publication date: 2023-01-31
Also published as: AU2021223894A1; CA3168153A1; GB2594683A; EP4106808A1; CN116056764A; IL295708A; MX2022010027A; BR112022016346A2; US20240108715A1; TW202140519A; CO2022013121A2; JP2023514348A; WO2021165667A1; GB202002166D0; AR121361A1

Abstract

본 발명은 2019-nCoV 감염의 치료 또는 예방을 위한 코로나바이러스 2019-nCoV 스파이크 단백질, 상기 스파이크 단백질을 코딩하는 폴리뉴클레오티드, 항체 및 백신에 관한 것이다. 한 실시양태는 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 단리된 폴리뉴클레오티드를 지칭하며, 여기서 상기 폴리뉴클레오티드는 재조합 발현에 대해 최적화된다. 특정한 실시양태에서, 폴리뉴클레오티드는 (a) 에스케리키아 콜라이; (b) 효모, 바람직하게는 코마가타엘라 또는 사카로미세스; 및/또는 (c) 포유동물 세포, 바람직하게는 인간 세포로부터 선택되는 숙주 세포에서의 발현에 대해 최적화된다.

Description

2019-NCOV (SARS-COV-2) 백신

본 발명은 2019-nCoV 감염의 치료 또는 예방을 위한 코로나바이러스 2019-nCoV 스파이크 단백질, 상기 스파이크 단백질을 코딩하는 폴리뉴클레오티드, 항체 및 백신에 관한 것이다.

2019년 12월 8일 이후 중국 후베이성 우한에서 미지 병인의 폐렴의 여러 사례가 보고되었다. 대부분의 환자들은 살아있는 동물도 판매하는 현지 화난 해산물 도매 시장에서 일하거나 그 주변에서 살았다. 이 폐렴의 초기 단계에서, 중증 급성 호흡기 감염 증상이 발생하였고, 일부 환자는 급성 호흡 곤란 증후군 (ARDS), 급성 호흡 부전 및 다른 심각한 합병증이 급속하게 발생하였다. 2020년 1월 7일에, 신규 코로나바이러스가 중국 질병 통제 예방 센터 (CDC)에 의해 환자의 인후 면봉 샘플로부터 확인되었고, 후속적으로 WHO에 의해 2019-nCoV로 명명되었고, 현재 SARS-CoV-2로 지정되었다.

코로나바이러스는 다양한 동물에서 다계통 감염 및 주로 인간에서 기도 감염, 예컨대 중증 급성 호흡기 증후군 (SARS) 및 중동 호흡기 증후군 (MERS)을 유발할 수 있다. 대부분의 환자는 경도 증상 및 양호한 예후를 갖는다.

지금까지, 2019-nCoV를 갖는 소수의 환자가 중증 폐렴, 폐 부종, ARDS 또는 다발성 기관 부전이 발생하였고, 사망하였다. 2019-nCoV 치료의 모든 비용은 중국에서 의료 보험에 포함된다. 현재, 2019-nCoV에 의해 유발되는 폐렴의 역학 및 임상적 특징에 관한 정보는 부족하고, 백신은 이용가능하지 않다. 따라서, 2019-nCoV 감염을 예방 및 치료하기 위해 백신에서 사용될 수 있는 항원의 개발이 지속적으로 필요하다. 추가로, 저렴하게 소정의 규모로 생산될 수 있는 항원을 제공할 필요가 있다.

본 발명은 2019-nCoV 항원, 특히 2019-nCoV의 스파이크 단백질로부터의 항원을 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터, 상기 항원을 코딩하는 벡터, 및 항원에 대해 생성된 결합 화합물 (특히 항체 및 항체-유사 분자 (압타머 및 펩티드 포함))을, 2019-nCoV에 의한 감염의 예방 또는 치료에서의 그의 사용 (단독으로 또는 조합하여)과 함께 제공함으로써 상기 요구 중 하나 이상을 해결한다. 항원을 코딩하는 폴리뉴클레오티드는 관심 숙주 세포에서의 발현에 대해 최적화된다. 항원에 대해 생성된 항체 및 항체-유사 분자는 항원에 결합할 (예를 들어, 특이적으로 결합할) 수 있다.

현재까지, 2019-nCoV에 대한 백신은 개발되지 않았다. 본 발명자들은 2019-nCoV 스파이크 단백질을 코딩하며, 통상적으로 사용되는 발현 시스템에서의 발현에 대해 최적화된 폴리뉴클레오티드를 개발하였다. 이러한 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질의 발현 수준 및 지속기간 증가를 제공하여, 이를 상기 항원의 대규모 생산에 유리하게 만든다. 또한, 본 발명자들이 고안한 폴리뉴클레오티드는 천연 스파이크 단백질의 입체형태를 보유하는 형태의 스파이크 단백질 아미노산 서열을 코딩한다. 따라서, 본 발명에 따라 생성된 스파이크 단백질은 특히 중화 항체의 생성을 통해 면역보호 반응을 일으킬 수 있다.

따라서, 본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하며, 재조합 발현에 대해 최적화된 단리된 폴리뉴클레오티드를 제공한다.

상기 폴리뉴클레오티드는 에스케리키아 콜라이(Escherichia coli); 효모, 바람직하게는 코마가타엘라(Komagataella) 또는 사카로미세스(Saccharomyces); 및/또는 포유동물 세포, 바람직하게는 인간 세포로부터 선택되는 숙주 세포에서의 발현에 대해 최적화될 수 있다. 최적화는 내부 TATA-박스; chi-부위; 리보솜 진입 부위; 서열의 AT-풍부 및/또는 GC-풍부 스트레치; RNA 불안정성 모티프; 반복 서열 및/또는 RNA 2차 구조; 잠재 스플라이스 공여자 부위; 잠재 스플라이스 수용 부위; 및/또는 (a) 내지 (i)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 시스-작용성 서열 모티프를 생략함으로써 일어날 수 있다. 상기 폴리뉴클레오티드는 숙주 세포 게놈 내로 통합될 수 있다. 상기 폴리뉴클레오티드는 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.93의 코돈 적응 지수 (CAI)를 가질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 2 내지 8, 13, 14, 26, 27, 28, 30 또는 32 중의 어느 하나에 대해 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 전형적으로 (i) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나; (ii) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하고/거나; (iii) 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진, 스파이크 단백질 또는 그의 단편을 코딩한다.

본 발명은 프로모터에 작동가능하게 연결된 본 발명의 폴리뉴클레오티드를 포함하는 발현 구축물을 추가로 제공한다.

본 발명은, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 백신 조성물을 추가로 제공한다. 상기 백신은 전형적으로 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체를 생성한다.

본 발명은 또한, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드를 제공한다. 상기 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 신호 펩티드를 추가로 코딩할 수 있다. 신호 펩티드는 인간 세포로부터의 분비를 지시할 수 있다. 본 발명의 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 하나 이상의 추가의 항원 또는 그의 단편, 바람직하게는 2019-nCoV로부터의 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현할 수 있다. 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편은 융합 단백질로서; 또는 조합하여 사용하기 위한 개별 바이러스 벡터, RNA 백신 또는 DNA 플라스미드에서 발현될 수 있다. 상기 바이러스 벡터, RNA 백신 또는 DNA 플라스미드는 본 발명의 하나 이상의 폴리뉴클레오티드 또는 발현 구축물을 포함할 수 있다.

본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 융합 단백질을 또한 제공한다. 상기 VLP 또는 융합 단백질은 B형 간염 표면 항원 (HBSAg), 또는 상기 HBSAg와 공통 항원 교차-반응성을 갖는 그의 단편; HPV 18 L1 단백질, 또는 상기 HPV 18 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; E형 간염 P239 단백질 (HEV), 또는 상기 E형 간염 P239 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; 및/또는 HPV 16 L1 단백질, 또는 상기 HPV 16 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 추가로 포함할 수 있다. 융합 단백질은 서열식별번호: 3, 5, 6, 8, 26, 27, 29, 30 또는 32 중 어느 하나와 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있고/거나; 융합 단백질은 서열식별번호: 9, 10, 11, 12, 28, 31 또는 33 중 어느 하나와 적어도 90% 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.

본 발명은 또한, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스-유사 입자를 제공한다. 바람직하게는, VLP는 본 발명의 융합 단백질을 포함하거나 또는 그로 이루어진다.

본 발명은 또한 본원에서와 같은 2091-nCoV 스파이크 단백질 항원 또는 그의 단편에 특이적으로 결합하는 항체 또는 그의 결합 단편을 제공한다. 상기 항체 또는 그의 결합 단편은 모노클로날 또는 폴리클로날 항체일 수 있다. 상기 항체 또는 그의 결합 단편은 Fab, F(ab')2, Fv, scFv, Fd 또는 dAb일 수 있다.

본 발명은 본원에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적으로 결합하는 올리고뉴클레오티드 압타머를 추가로 제공한다.

본 발명은 본 발명의 바이러스 벡터, 및/또는 RNA 백신 및/또는 DNA 플라스미드를 포함하는 백신 조성물을 제공한다.

본 발명은 또한 2019-nCoV 감염의 치료 및/또는 예방에 사용하기 위한 본 발명의 폴리뉴클레오티드, 및/또는 본 발명의 발현 구축물, 및/또는 본 발명의 백신 조성물, 및/또는 본 발명의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드 및/또는 본 발명의 바이러스-유사 입자, 및/또는 본 발명의 융합 단백질, 및/또는 본 발명의 항체 및/또는 본 발명의 압타머를 제공한다.

본 발명은 또한 2019-nCoV 감염의 예방 및/또는 치료를 위한 의약의 제조에서의 본 발명의 폴리뉴클레오티드, 및/또는 본 발명의 발현 구축물, 및/또는 본 발명의 백신 조성물, 및/또는 본 발명의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드 및/또는 본 발명의 바이러스-유사 입자, 및/또는 본 발명의 융합 단백질, 및/또는 본 발명의 항체 및/또는 본 발명의 압타머의 용도를 제공한다.

본 발명은 숙주 세포에서 본 발명의 폴리뉴클레오티드를 발현시키는 단계, 및 임의로 스파이크 단백질 또는 단편을 정제하는 단계를 포함하는, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터 스파이크 단백질 또는 그의 단편을 생산하는 방법을 또한 제공한다. 상기 방법은 상기 스파이크 단백질 또는 그의 단편을 제약상 허용되는 담체 또는 희석제와 함께 제제화하는 것을 추가로 포함할 수 있다.

도 1: 코로나바이러스의 구조 및 구조 단백질의 기능의 개략도.
도 2: 2019-nCoV 스파이크 단백질, 및 본 발명에 따라 생성된 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 투여 후 제0일 및 제14일에 항체 역가를 기록한 ELISA로부터의 표로 만든 결과.
도 3: 40시간 후 (원심 여과에 의한 농축 후) 배양 배지로 방출된 분비 단백질 HBSAg(EAAAK)₃RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = HBSAg 항체. 우측 블롯 = 2019-nCoV 항체. 양쪽 블롯에 대해, 레인 M = 마커; 레인 1 = HEV-GGGS-RBD #10B; 레인 2 = HBSAg-EAAK-RBD #2A (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 750 μg/ml); 레인 3 = HBSAg-EAAAK-RBD #2B (293F 분비형, 브래드포드 검정에 의한 총 단백질 함량 = 500 μg/ml); 레인 4 = CoV-s #17 (293F 표면 결합 HisTag)
도 4: HEK 세포에서 생산된 HBSAg(EAAAK)₃RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스(Addavax)™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 5: 이. 콜라이에 의해 생산된 분비 단백질 HEV-(GGGGS)₃-RBD를 나타낸 웨스턴 블롯. 좌측 블롯 = #10A. 중간 블롯 = #10B. 우측 블롯 = #10C. 모든 블롯에 대해, 항-HEV mAB를 1:4000의 희석물로 사용하였다.
도 6: 이. 콜라이에서 생산된 HEV-GGGGS-RBD가 단독으로, 또는 수산화알루미늄 또는 아다박스™ 아주반트와 함께 접종된 마우스에서의 제14일 (A) 및 제42일 (B)의 역가를 도시한 그래프.
도 7: HEK 293 세포에서 발현된 재조합 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질 융합 단백질 (HBSAg-(EAAAK)_3-CoV-s) 클론 D8-SA01-01-01 (4x) 및 클론 D8-SA01-02-01 (5X)의 웨스턴 블롯.

본원에서 달리 정의되지 않는 한, 본 발명과 관련하여 사용된 과학 및 기술 용어는 관련 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 의미를 가질 것이다. 용어의 의미 및 범위는 명확해야 하지만; 임의의 잠재적 모호성이 있는 경우에 본원에 제공된 정의가 임의의 사전적 또는 외인적 정의보다 우선한다. 본 발명은 본원에 기재된 특정한 방법론, 프로토콜 및 시약 등으로 제한되지 않으며, 그 자체가 다양할 수 있는 것으로 이해되어야 한다. 본원에 사용된 용어는 특정한 실시양태만을 기재하기 위한 목적이며, 청구범위에 의해서만 규정되는 본 발명의 범주를 제한하는 것으로 의도되지 않는다. 추가로, 문맥상 달리 요구되지 않는 한, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다. 본 출원에서, "또는"의 사용은 달리 언급되지 않는 한 "및/또는"을 의미한다. 또한, 용어 "포함하는" 뿐만 아니라 다른 형태, 예컨대 "포함하다" 및 "포함되다"의 사용은 제한적이지 않다.

본 개시내용의 실시양태의 기재는 완전하거나 본 개시내용이 개시된 정확한 형태로 제한되도록 의도하지 않는다. 본 개시내용의 구체적 실시양태 및 그에 대한 실시예가 예시적 목적을 위해 본원에 기재되지만, 관련 기술분야의 통상의 기술자가 인지하는 바와 같이, 본 개시내용의 범주 내에서 다양한 등가의 변형이 가능하다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되지만, 대안적 실시양태는 기능을 상이한 순서로 수행할 수 있거나, 또는 기능이 실질적으로 동시에 수행될 수 있다. 본원에 제공된 개시내용의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본원에 기재된 다양한 실시양태는 조합하여 추가의 실시양태를 제공할 수 있다. 본 개시내용의 측면은, 필요한 경우, 상기 참고문헌 및 출원의 조성물, 기능 및 개념을 사용하여 본 개시내용의 추가 실시양태를 제공하도록 변형될 수 있다. 또한, 생물학적 기능적 동등성 고려사항으로 인해, 종류 또는 양에 있어서 생물학적 또는 화학적 작용에 영향을 미치지 않으면서 단백질 구조에서 일부 변화가 이루어질 수 있다. 이들 및 다른 변화는 상세한 설명에 비추어 본 개시내용에 대해 이루어질 수 있다. 이러한 모든 변형은 첨부된 청구범위의 범주 내에 포함되는 것으로 의도된다.

본원에 논의된 간행물은 본 출원의 출원일 이전의 그의 개시내용에 대해서만 제공된다. 본원에서의 어떠한 것도 이러한 간행물이 본원에 첨부된 청구범위에 대한 선행 기술을 구성한다는 것을 인정하는 것으로 해석되지 않아야 한다.

코로나바이러스

코로나바이러스 (CoV)는 니도비랄레스(Nidovirales) 목의 코로나비리다에(Coronaviridae) 과 중 코로나비리나에(Coronavirinae) 아과에 속한다. 4가지 속이 있다: 알파코로나바이러스, 베타코로나바이러스, 감마코로나바이러스 및 델타코로나바이러스. 알파코로나바이러스 및 베타코로나바이러스는 포유동물의 종을 감염시키고, 감마코로나바이러스는 조류의 종을 감염시키고, 델타코로나바이러스는 포유동물 및 조류의 종 둘 다를 감염시킨다.

CoV는 큰 외피보유 단일 양성-센스 RNA 바이러스이다. RNA 바이러스의 돌연변이율은 DNA 바이러스보다 크며, 이는 생존을 위한 보다 효율적인 적응 프로세스를 시사한다.

CoV는 모든 RNA 바이러스 중에서 가장 큰 게놈을 가지며, 전형적으로 27 내지 32 kb 범위이다. CoV 게놈은 적어도 4종의 주요 구조 단백질: 스파이크 (S), 막 (M), 외피 (E), 뉴클레오캡시드 (N) 단백질, 및 복제 과정을 보조하고 세포 내로의 진입을 용이하게 하는 다른 보조 단백질을 코딩한다. 도 1은 코로나바이러스의 구조 및 구조 단백질의 기능을 요약한다. 간략하게, CoV 게놈은, 뉴클레오캡시드에 의해 형성되고 외피에 의해 추가로 둘러싸인 나선형 캡시드 내부에 패킹된다. 적어도 3종의 구조 단백질: 바이러스 조립에 수반되는 막 및 외피 단백질, 및 숙주 세포 내로의 바이러스 진입을 매개하는 스파이크 단백질이 바이러스 외피와 연관된다. 일부 코로나바이러스는 또한 외피-연관 헤마글루티닌-에스테라제 단백질 (HE)을 코딩한다. 스파이크 단백질은 바이러스 표면으로부터 큰 돌출부를 형성하여 코로나바이러스에 크라운을 갖는 외관을 제공하고, 이로부터 "코로나바이러스"라는 명칭이 유래되었다. 스파이크 단백질은 바이러스 진입을 매개할 뿐만 아니라 바이러스 숙주 범위 및 조직 향성 및 숙주 면역 반응의 주요 유도인자의 중요한 결정인자이다.

2019-nCoV (공식적으로 중증 급성 호흡기 증후군 코로나바이러스 2, SARS-CoV-2로 명명되고, 두 용어는 본원에서 상호교환가능하게 사용됨)는 코로나바이러스 질환 2019 (COVID-19)의 병원체이고, 인간 사이에서 전염성이다. 2019-nCoV는 동물에서 기원한 것으로 여겨지며, SARS-CoV (79.5%) 및 박쥐 코로나바이러스 (96%)에 대한 2019-nCoV의 유전적 유사성을 고려할 때 박쥐가 공급원일 가능성이 있다. CoV에 관한 본원의 임의의 개시내용은 또한 직접적으로 및 제한 없이 2019-nCoV에 적용된다.

CoV 스파이크 단백질은 3개의 도메인을 포함한다: (i) 대형 엑토도메인; (ii) 막횡단 도메인 (단일 통과로 바이러스 외피를 통과함); 및 (iii) 짧은 세포내 꼬리. 엑토도메인은 3개의 수용체-결합 서브유닛 (3 x S1), 및 3개의 막-융합 서브유닛 (3 x S2)으로 제조된 삼량체 줄기로 이루어진다. 바이러스 진입 동안, S1은 바이러스 부착을 위해 숙주 세포 표면 상의 수용체에 결합하고, S2는 숙주 및 바이러스 막을 융합시켜 바이러스 게놈이 숙주 세포에 진입하게 한다. 수용체 결합 및 막 융합은 코로나바이러스 감염 사이클에서 초기 및 결정적인 단계이다. 상이한 CoV에 의해 표적화된 수용체에서 유의한 차이가 있다.

2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 감염에 대한 백신용 항원으로서의 치료 잠재력을 갖는다.

따라서, 본원에 기재된 바와 같이, 본 발명은 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 바람직하게는, 본 발명은 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 보다 바람직하게는, 본 발명은 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편에 관한 것이다. 2019-nCoV로부터의 스파이크 단백질은 서열식별번호: 1, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하거나 또는 그로 이루어질 수 있다.

본 발명에 따르면, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV 스파이크 단백질에 존재하는 하나 이상의 입체형태적 에피토프를 유지한다. 따라서, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 면역보호 효과를 일으킬 수 있다. 전형적으로, 상기 면역보호 효과는 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편의 하나 이상의 입체형태적 에피토프에 특이적으로 결합하는 중화 항체 (nAb)의 생성을 포함한다. CoV 스파이크 단백질의 입체형태적 에피토프는 CoV 스파이크 단백질의 3차 구조에서 발견되는 특이적인 3차원 구조를 갖는다. 상기 하나 이상의 입체형태적 에피토프는 전형적으로 스파이크 단백질의 엑토도메인 내에 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV 스파이크 단백질에 존재하는 모든 입체형태적 에피토프를 보유한다.

일부 바람직한 실시양태에서, 본 발명은 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)인 2019-nCoV 스파이크 단백질의 면역원성 단편에 관한 것이다. 이러한 RBD는 숙주 세포에 대한 2019-nCoV 결합을 담당하고, 따라서 2019-nCoV 입자의 숙주 세포 내로의 진입을 용이하게 한다. RBD는 본원에 기재된 바와 같은 서열식별번호: 1의 아미노산 잔기 319 내지 529에 상응하고, 서열식별번호: 15로 지칭된다. RBD는 2019-nCoV 바이러스 (진뱅크 수탁 번호 MN908947, 그의 버전 3 (MN908947.3), 2020년 1월 17일에 기탁됨)의 게놈에서 위치 955 내지 1597에 상응하는 염기에 의해 코딩된다. 따라서, 본원에 기재된 바와 같이, 본 발명은 서열식별번호: 15와 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 바람직하게는, 본 발명은 서열식별번호: 15와 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 보다 바람직하게는, 본 발명은 서열식별번호: 15와 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV 스파이크 단백질의 RBD에 관한 것이다. 2019-nCoV 스파이크 단백질의 RBD는 서열식별번호: 15를 포함하거나 또는 그로 이루어질 수 있다. 2019-nCoV 스파이크 단백질에 관한 (예를 들어, 폴리뉴클레오티드, 바이러스 벡터, DNA 플라스미드, RNA 백신, 바이러스-유사 입자 (VLP), 융합 단백질, 항체, 조성물 및 제약 조성물, 제제 및 치료 적응증에 관한) 본원의 임의의 및 모든 개시내용은 2019-nCoV 스파이크 단백질의 RBD에 동등하게 유보 없이 적용된다. 본원에서 RBD에 대한 언급은 2019-nCoV 스파이크 단백질의 RBD를 지칭한다.

CoV는 큰 외피보유 단일 양성-센스 RNA 바이러스이다. RNA 바이러스의 돌연변이율은 DNA 바이러스보다 크며, 이는 생존을 위한 보다 효율적인 적응 프로세스를 시사한다. 따라서, 항원 소변이가 또한 2019-nCoV의 특징이 되거나, 2019-nCoV가 범유행성이 진정되면 집단에서 풍토병이 될 위험성이 있다. 실제로, 지금까지의 연구는 2019-nCoV의 스파이크 단백질의 수용체 결합 도메인 (RBD) 내의 돌연변이, 특히 G476S 및 V483A/G, 뿐만 아니라 S1/S2 부위 부근의 보편적인 D614G 돌연변이를 이미 확인하였으며 (Saha et al., ChemRxiv^TM http://doi.org/10.26434/chemrxiv.12320567.v1), 증거는 2019-nCoV 비리온에 의한 세포 진입을 증진시키고 또한 숙주 세포 향성을 확장시킬 수 있음을 시사한다. 2019-nCoV 스파이크 단백질에서 보고된 다른 돌연변이는 S943 (특히 S943P), L5 (특히 L5F), L8 (특히 L8F), V367 (특히 V367F), H49 (특히 H49Y), Y145 (특히 Y145H/del), Q239 (특히 Q239K), A831 (특히 A831V), D839 (특히 D839Y/N/E), 및 P1263 (특히 P1263L), 또는 그의 임의의 조합을 포함한다 (Korber et al., BioRxiv™ https://doi.org/10.1101/2020.04.29.069054).

따라서, 본 발명은 유리하게는 발생 시 돌연변이된 스파이크 단백질을 갖는 균주에 대해 증진된 면역을 제공하기 위해 필요한 경우 2019-nCoV 백신 항원이 변형되도록 한다. 비제한적 예로서, 본 발명에 따른 임의의 2019-nCoV 스파이크 단백질 또는 그의 단편은 (i) D614, (ii) V483, (iii) G476, (iv) K417, (v), E484, (vi) N501, (vii) A570, 및 (viii) P681, 또는 (i) 내지 (viii)의 임의의 조합 (임의의 2개, 임의의 3개, 임의의 4개, 임의의 5개, 임의의 6개, 임의의 7개 또는 모든 8개 포함)에서 (특히 치환에 의해) 변형될 수 있다. 대안적으로 또는 추가로, 2019-nCoV 스파이크 단백질 또는 그의 단편은 아미노산 잔기 69, 70 및/또는 144 중 하나 이상에서의 결실을 비롯한 결실 돌연변이를 포함할 수 있다. 본원에 기재된 바와 같이, 돌연변이/변형의 위치는 전형적으로 본 발명의 서열식별번호: 1에서의 아미노산의 넘버링에 상응한다.

위치 D614에서의 변형, 특히 D614G 치환이 바람직하다. 특히, 본 발명에 따른 임의의 2019-nCoV 스파이크 단백질 또는 그의 단편은 다음 치환 (i) G476S, (ii) V483A/G, (iii) D614G, (iv) K417N/T, (v), E484K, (vi) N501Y, (vii) A570D, 및 (viii) P681H, 또는 (i) 내지 (viii)의 임의의 조합 (임의의 2개, 임의의 3개, 임의의 4개, 임의의 5개, 임의의 6개, 임의의 7개 또는 8개 모두 포함)을 포함할 수 있다.

본 발명은 또한 변이체 2019-nCoV로부터의 2019-nCoV 스파이크 단백질 또는 그의 단편에 관한 것이다. 특히, 본 발명은 B.1.1.7 균주 (201/501Y.V1로도 알려져 있으며, 영국에서 처음 검출되었음); B.1.351 균주 (20H/501.V2로도 알려져 있으며, 남아프리카에서 처음 검출되었음) 및/또는 P1 균주 (20J/501Y.V3으로도 알려져 있으며, 일본 및 브라질에서 처음 검출되었음) 유래의 2019-nCoV 스파이크 단백질 또는 그의 단편에 관한 것일 수 있다. B.1.1.7 균주의 핵심 돌연변이는 잔기 69/70 및 144Y의 결실, 뿐만 아니라 N501Y, A570D, D614G 및 P681H 치환을 포함한다. B.1.351 균주의 핵심 돌연변이는 K417N, E484K, N501Y 및 D614G 치환을 포함한다. P.1 균주의 핵심 돌연변이는 E484K, K417N.T, N501Y 및 D614G를 포함한다.

폴리뉴클레오티드, 스파이크 단백질 및 그의 단편, VLP, 융합 단백질 및 DNA/RNA 백신과 관련한 본원의 모든 개시내용은 명시적으로 언급되지 않는 한 2019-nCoV의 다양한 변이체 및 균주에 동등하게 적용된다.

폴리뉴클레오티드

본 발명은 본 발명의 단백질 또는 면역원성 단편을 코딩하거나 발현하는 (용어 "코딩하다" 및 "발현하다"는 본원에서 상호교환가능하게 사용됨) 폴리뉴클레오티드를 제공한다. 용어 폴리뉴클레오티드는 DNA 및 RNA 서열 둘 다를 포괄한다. 본원에서, 용어 "핵산", "핵산 분자" 및 "폴리뉴클레오티드"는 상호교환가능하게 사용된다.

본 발명은 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 단리된 폴리뉴클레오티드를 제공한다. 예를 들어, 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질의 RBD를 코딩할 수 있고, 바람직하게는 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다. RBD를 코딩하는 예시적인 폴리뉴클레오티드가 서열식별번호: 13, 및 서열식별번호: 14의 코돈-최적화된 서열에 제시된다.

본 발명은 상기 기재된 바와 같은 2019-nCoV로부터의 변이체 스파이크 단백질, 또는 상기 변이체 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하는 폴리뉴클레오티드를 또한 포괄한다. 상기 변이체 스파이크 단백질은 전형적으로 서열식별번호: 1과 적어도 90% 동일성을 갖는다.

본 발명의 폴리뉴클레오티드는 본 발명의 단백질 또는 면역원성 단편 (VLP 또는 융합 단백질의 형태 포함)의 재조합 발현을 위해, 또는 DNA/RNA 백신으로서 사용될 수 있다.

본 발명자들은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩하는 개선된 폴리뉴클레오티드를 최초로 제공한다. 특히, 본 발명자들은 재조합 발현에 대해 최적화된 폴리뉴클레오티드를 설계하였다. 본 발명의 폴리뉴클레오티드는 1종 이상의 특정한 세포 유형, 예를 들어 진핵 세포 (예를 들어, 포유동물 세포, 효모 세포, 곤충 세포 또는 식물 세포) 또는 원핵 세포 (박테리아 세포)에서의 발현에 대해 최적화될 수 있다. 전형적으로, 폴리뉴클레오티드는 박테리아 세포, 효모 세포 또는 포유동물 세포에서의 발현에 대해 최적화된다. 바람직하게는, 상기 폴리뉴클레오티드는 에스케리키아 콜라이 (예를 들어, BL21(DE3), RV308(DE3), HMS174(DE3) 또는 K12 균주), 코마가타엘라 (공식적으로 피키아(Pichia), 특히 코마가타엘라 파스토리스(Komagataella pastoris) 또는 코마가타엘라 파피이(Komagataella phaffii)로서 배정됨), 사카로미세스 (특히 사카로미세스 세레비지아에(Saccharomyces cerevisiae)) 또는 인간 세포 (바람직하게는 293 F 세포, HEK 293 세포, HEK 293T 세포 또는 HeLa 세포)에서의 발현에 대해 최적화된다. 다른 관심 세포 유형/발현 시스템은 피키아 안구스타(Pichia angusta), 한세눌라 폴리모르파(Hansenula polymorpha), 차이니즈 햄스터 난소 (CHO) 세포 및/또는 곤충 세포 바큘로바이러스-기반 발현 시스템을 포함한다.

본원에 사용된 용어 "최적화된"은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 발현에 대한 최적화에 관한 것이고, 숙주 세포/유기체 내의 폴리뉴클레오티드로부터 2019-nCoV 스파이크 단백질의 발현의 수준 및/또는 지속기간을 증가시키거나, 또는 다르게는 본 발명의 폴리뉴클레오티드로부터 2019-nCoV 스파이크 단백질 또는 그의 단편을 발현할 때 이점을 제공하는 폴리뉴클레오티드에 대한 코돈 최적화 및/또는 다른 변형 둘 다를 포함한다 (핵산 서열 및 다른 변형 둘 다의 면에서).

용어 "코돈 최적화된"은 염기 폴리뉴클레오티드 서열 내의 적어도 하나의 코돈을 폴리뉴클레오티드가 발현될 숙주 유기체 또는 세포에 의해 우선적으로 사용되는 코돈으로 대체하는 것을 지칭한다. 전형적으로, 숙주 유기체에서 가장 빈번하게 사용되는 코돈이 코돈-최적화된 폴리뉴클레오티드 서열에 사용된다. 코돈 최적화 방법은 관련 기술분야에 널리 공지되어 있다.

비-제한적 예로서, 폴리뉴클레오티드 최적화의 또 다른 형태는 RNA 구조를 최소화하는 변형인데, 이는 원핵생물에서 발현되는 유전자 내의 RBS 및/또는 개시 코돈을 수반하거나 또는 다르게는 폐쇄시키는 구조가 발현을 손상시킬 수 있기 때문이다. 최적화는 또한 번역 속도를 증가시킴으로써 또는 효율적인 "자기" 또는 샤페론-보조 단백질 폴딩을 허용할 필요성과 번역 속도의 균형을 유지함으로써 번역을 최적화하는 폴리뉴클레오티드에 대한 변형을 포괄하며, 여기서 전략적으로 배치된 보다 느린 코돈 또는 코돈 실행 (예를 들어, 단백질 도메인 경계에서)이 높은 전체 번역 속도를 유지하면서 폴딩 효율을 최대화할 수 있다. 최적화는 또한 폴리뉴클레오티드의 핵산 서열 내의 유해 모티프의 제거를 포괄할 수 있다. 비제한적 예로서, 이. 콜라이에서 T7 프로모터의 제어 하에 유전자를 발현시키는 것은 부류 I 및 II 전사 종결 부위 둘 다를 피하는 것이 바람직하다. 코딩 서열 내의 샤인-달가노-유사 서열은 원핵 숙주에서 부정확한 하류 개시 또는 번역 휴지를 유발할 수 있다. 진핵 숙주/세포에서의 발현을 위해, 잠재적 스플라이스 신호, 폴리아데닐화 신호 및 mRNA 프로세싱 및 안정성에 영향을 미치는 다른 모티프가 제거될 수 있다. 다른 부류의 유해 모티프는 리보솜 프레임시프트 및 휴지를 촉진하는 서열을 포함한다. 관심 숙주 세포에서의 발현을 최적화하기 위해 본 발명의 폴리뉴클레오티드에 임의의 조합의 변형이 이루어질 수 있다.

전형적으로, 박테리아 세포, 특히 이. 콜라이에서의 발현에 대해 최적화된 본 발명의 폴리뉴클레오티드는 클로닝된 N-말단 및/또는 C-말단 결실된 아미노산을 포함한다. 바람직하게는 약 1 내지 20개, 보다 바람직하게는 약 1 내지 15개, 가장 바람직하게는 약 5 내지 10개의 클로닝된 N-말단 및/또는 C-말단 결실된 아미노산이 포함된다.

관련 기술분야의 통상의 기술자는 수많은 상이한 폴리뉴클레오티드가 유전자 코드의 축중성의 결과로서 동일한 폴리펩티드를 코딩할 수 있음을 이해할 것이다. 또한, 관련 기술분야의 통상의 기술자는 폴리펩티드가 발현될 임의의 특정한 숙주 유기체의 코돈 사용빈도를 반영하기 위해 상용 기술을 사용하여 핵산 분자에 의해 코딩되는 폴리펩티드 서열에 영향을 미치지 않는 뉴클레오티드 치환을 수행할 수 있는 것으로 이해된다. 따라서, 달리 명시되지 않는 한, "본 발명의 단백질 또는 면역원성 단편을 코딩하는 폴리뉴클레오티드"는 서로의 축중성 버전이고 동일한 아미노산 서열을 코딩하는 모든 폴리뉴클레오티드 서열을 포함한다.

본 발명의 폴리뉴클레오티드는 전형적으로 관심 숙주 세포의 게놈 내로 통합될 수 있도록 설계된다. 원하는 숙주 세포에 따라 통합을 용이하게 하기 위해 상이한 최적화 전략이 사용될 수 있다.

전형적으로, 본 발명의 폴리뉴클레오티드는 하나 이상의 시스-작용성 서열 모티프 (시스-작용성 요소 또는 시스-작용성 조절 요소로도 상호교환가능하게 지칭됨)의 제거 또는 생략에 의해 최적화된다. 시스-작용성 서열 모티프는 유전자 발현에 필요한 유전자의 구조적 부분 부근의 서열이다. 상기 하나 이상의 시스-작용성 서열 모티프는 (a) 내부 TATA-박스; (b) Chi-부위; (c) 리보솜 진입 부위; (d) 서열의 AT-풍부 및/또는 GC-풍부 스트레치; (e) RNA 불안정성 모티프; (f) 반복 서열 및/또는 RNA 2차 구조; (g) 잠재 스플라이스 공여자 부위; (h) 잠재 스플라이스 수용 부위; 및/또는 (i) (a) 내지 (i)의 임의의 조합으로부터 독립적으로 선택될 수 있다. 이들 시스-작용성 서열 모티프는 관련 기술분야에 공지되어 있다. 비제한적 예로서, 높은 GC 함량 (예를 들어, 약 70% 초과, 바람직하게는 약 80% 초과) 및/또는 낮은 GB 함량 (예를 들어, 약 40% 미만, 바람직하게는 약 30% 미만)의 영역은 생략된다. 바람직하게는, 하나 이상의 다른 시스-작용성 서열 모티프의 제거 또는 생략과 조합하여 높은 및 낮은 GC 함량의 영역 둘 다가 생략된다.

본 발명의 폴리뉴클레오티드는 또한 본원에 기재된 바와 같이 "코돈 최적화"될 수 있다. 코돈 최적화는 바람직하게는 본원에 기재된 바와 같은 하나 이상의 시스-작용성 서열 모티프의 제거 또는 생략에 추가하여 발생한다.

본 발명의 폴리뉴클레오티드의 평균 GC 함량 또한 상기 폴리뉴클레오티드의 발현을 최적화하도록 변형될 수 있다. 예를 들어, 폴리뉴클레오티드의 평균 GC 함량은 약 40% 내지 약 60%, 바람직하게는 약 40% 내지 약 57%, 보다 바람직하게는 약 45% 내지 약 56% 정도일 수 있다.

본 발명의 폴리뉴클레오티드는 전형적으로 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.91, 적어도 약 0.92, 적어도 약 0.93, 적어도 약 0.94, 적어도 약 0.95, 적어도 약 0.96, 적어도 약 0.97, 적어도 약 0.98, 적어도 약 0.99, 또는 약 1.0 이하까지의 코돈 적응 지수 (CAI)를 갖는다.

최적화 변형의 결과로서, 본 발명의 폴리뉴클레오티드는 코딩된 2019-nCoV 스파이크 단백질 또는 그의 단편의 발현을 상응하는 비-최적화 폴리뉴클레오티드 서열과 비교하여 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과만큼 증가시킬 수 있다. 바람직하게는, 발현 수준은 상응하는 비-최적화된 폴리뉴클레오티드와 비교하여 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과, 보다 바람직하게는 적어도 70%, 적어도 80%, 적어도 90%, 적어도 100% 또는 그 초과만큼 증가된다.

본 발명의 폴리뉴클레오티드는 숙주 세포에서 적어도 1주, 적어도 2주, 적어도 3주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월 또는 그 초과, 바람직하게는 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월 또는 그 초과 동안 발현될 수 있다.

본 발명자들은 2019-nCoV 스파이크 단백질, 및 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 그의 합리적으로 설계된 최적화된 폴리뉴클레오티드를 사용하여 다양한 발현 시스템/숙주 세포에서 높은 수준으로 발현될 수 있음을 입증하였다. 또한, 본 발명은 놀랍게도 2019-nCoV 스파이크 단백질, 및 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 마우스에서 강한 항체 반응을 생성할 수 있다는 것을 입증하였고, 이는 그의 잠재적 치료 유용성을 나타낸다. 본 발명자들은 하기 실시예에 기재된 바와 같이 최적화된 폴리뉴클레오티드 및 융합 단백질을 설계하고 생성함으로써 그의 최적화 방법론을 예시하였다.

따라서, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 또한, 본원에 기재된 바와 같은 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것 또는 그의 임의의 변이체에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 결실될 수 있다. 따라서, 본 발명은, 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 어느 하나를 포함하거나 또는 그로 이루어지지만, 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 결여된 폴리뉴클레오티드를 제공한다. 대안적으로, 본원에 기재된 바와 같은 서열식별번호: 2, 3, 4, 5, 6, 7, 8, 13, 14, 26, 27, 29, 30, 또는 32 중 임의의 것 또는 그의 임의의 변이체에서 확인된 5' 클로닝 부위, 3' 클로닝 부위, 또는 5' 및 3' 클로닝 부위가 독립적으로 또 다른 적절한 클로닝 부위로 대체될 수 있다. 적합한 대안적 클로닝 부위는 관련 기술분야에 널리 공지되어 있다.

본 발명은 특히 2019-nCoV 스파이크 단백질의 RBD를 코딩하는 폴리뉴클레오티드를 제공한다. 따라서, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 13, 또는 서열식별번호: 14의 코돈-최적화된 서열에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 13의 핵산 서열, 또는 서열식별번호: 14의 코돈-최적화된 서열을 포함하거나 또는 그로 이루어질 수 있다.

본 발명의 폴리뉴클레오티드는 전형적으로 (a) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나; (b) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩한다.

본 발명의 폴리뉴클레오티드는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 보다 바람직하게는, 본 발명의 폴리뉴클레오티드는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 본 발명의 폴리뉴클레오티드는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현할 수 있다.

본 발명의 폴리뉴클레오티드는 2019-nCoV 스파이크 단백질 또는 그의 단편의 발현을 용이하게 하기 위해 발현 구축물 내에 포함될 수 있다. 따라서, 본 발명은 본 발명의 폴리뉴클레오티드를 포함하는 발현 구축물을 추가로 제공한다. 전형적으로, 이러한 발현 구축물에서 본 발명의 폴리뉴클레오티드는 적합한 프로모터에 작동가능하게 연결된다. 폴리뉴클레오티드는 적합한 종결인자 서열에 연결될 수 있다. 폴리뉴클레오티드는 프로모터 및 종결인자 둘 다에 연결될 수 있다. 적합한 프로모터 및 종결인자 서열은 관련 기술분야에 널리 공지되어 있다.

프로모터의 선택은 폴리뉴클레오티드의 궁극적인 발현이 어디에서 일어날 것인지에 좌우될 것이다. 일반적으로, 구성적 프로모터가 바람직하지만, 유도성 프로모터가 마찬가지로 사용될 수 있다. 이러한 방식으로 생성된 구축물은 벡터의 적어도 한 부분, 특히 조절 요소를 포함한다. 벡터는 바람직하게는 주어진 숙주 세포에서 핵산을 발현할 수 있다. 임의의 적절한 숙주 세포, 예컨대 포유동물, 박테리아, 곤충, 효모 및/또는 식물 숙주 세포가 사용될 수 있다. 또한, 무세포 발현 시스템이 사용될 수 있다. 이러한 발현 시스템 및 숙주 세포는 관련 기술분야에서 표준이다.

본 발명의 폴리뉴클레오티드에 의해 코딩 또는 발현되는 (두 용어는 본원에서 상호교환가능하게 사용됨) 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 전형적으로 천연 2019-nCoV 스파이크 단백질과 동일한 그의 수용체에 대한 결합 친화도를 보유한다. 본 발명의 문맥에서, 이는 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 그 초과임을 의미할 수 있다. 바람직하게는, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 90%, 적어도 95%, 적어도 99% 또는 그 초과이다.

일부 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 전장 단백질의 결합 친화도보다 크다. 예를 들어, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 적어도 100%, 적어도 110%, 적어도 120% 또는 적어도 150% 또는 그 초과의 결합 친화도를 가질 수 있다.

다른 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 2019-nCoV 스파이크 단백질 수용체에 대한 결합 친화도가 천연 2019-nCoV 스파이크 단백질의 결합 친화도보다 작을 수 있다. 예를 들어, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질의 결합 친화도의 80% 미만, 70% 미만, 60% 미만, 50% 미만 또는 그 미만의 결합 친화도를 가질 수 있다.

본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 그의 수용체에 대한 결합 친화도는 해리 상수 (K_d)로 정량화될 수 있다. K_d는 임의의 적절한 기술을 사용하여 결정될 수 있지만, SPR이 본 발명의 문맥에서 일반적으로 바람직하다.

본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 전형적으로 200개 초과의 아미노산 길이이다. 본 발명의 2019-nCoV 스파이크 단백질 단편은 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개, 적어도 600개, 적어도 700개, 적어도 800개, 적어도 900개, 적어도 1000개, 적어도 1100개, 또는 그 초과의 아미노산 잔기 길이를 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 단편은 2019-nCoV 스파이크 단백질과 공통 항원 교차-반응성을 갖는다. 일부 바람직한 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.

본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은, 예를 들어 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 생성 및/또는 분비를 보조하기 위해 리더 서열을 추가적으로 포함할 수 있다. 관련 기술분야에 공지된 통상적인 리더 서열을 포함한 임의의 적합한 리더 서열이 사용될 수 있다. 적합한 리더 서열은 곤충 세포로부터의 분비를 보조하기 위해 관련 기술분야에서 통상적으로 사용되는 Bip 리더 서열, 및 바이러스 및 DNA 기반 백신, 및 포유동물 세포 발현 플랫폼으로부터의 분비를 보조하기 위한 단백질 백신에 상용적으로 사용되는 인간 조직 플라스미노겐 활성화제 리더 서열 (tPA)을 포함한다.

본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은, 예를 들어 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 재조합 생성 및/또는 정제를 돕기 위해 N- 또는 C-말단 태그를 추가로 포함할 수 있다. 관련 기술분야에 공지된 통상적인 태그를 포함한 임의의 N- 또는 C-말단 태그가 사용될 수 있다. 적합한 태그 서열은 C-말단 헥사-히스티딘 태그 및 "C-태그" (C-말단의 4개의 아미노산 EPEA)를 포함하며, 이는 이종 발현 시스템, 예를 들어 곤충 세포, 포유동물 세포, 박테리아 또는 효모로부터의 정제를 보조하기 위해 관련 기술분야에서 통상적으로 사용된다. 다른 실시양태에서, 본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 정제 태그를 사용할 필요 없이 이종 발현 시스템으로부터 정제된다.

본 발명의 폴리뉴클레오티드에 의해 발현되는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 본원에서 정의되는 바와 같은 리더 서열 및/또는 태그를 포함할 수 있다.

바이러스 벡터, DNA 플라스미드 및 RNA 백신

본 발명은 또한 (a) 본 발명의 폴리뉴클레오티드를 포함하고/거나; (b) 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 코딩하는 벡터를 제공한다. 벡터(들)는 백신 조성물 또는 제제의 형태로 존재할 수 있다.

본 발명의 벡터는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 바람직하게는, 본 발명의 벡터는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 보다 바람직하게는, 본 발명의 벡터는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현한다. 본 발명의 벡터는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 벡터에 의해 발현되는 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.

본 발명의 벡터는 신호 펩티드를 추가로 포함하는 본원에 정의된 바와 같은 스파이크 단백질 또는 그의 면역원성 단편을 발현할 수 있다. 전형적으로, 상기 신호 펩티드는 관심 숙주 세포, 예컨대 인간 세포, 이. 콜라이 세포 또는 효모 세포로부터 2019-nCoV 스파이크 단백질 또는 그의 단편의 분비를 지시한다.

본 발명의 벡터는 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현할 수 있다. 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편은 융합 단백질로서 발현될 수 있다. 대안적으로, 2019-nCoV 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편을 발현하는 개별 벡터가 사용될 수 있다. 이러한 경우, 상기 개별 벡터는 순차적으로 또는 동시에 조합하여 사용될 수 있다. 하나 이상의 추가의 항원은 2019-nCoV와 동일한 항원 또는 상이한 항원, 또는 그의 단편일 수 있다. 보다 바람직하게는, 상기 하나 이상의 추가의 항원은 2019-nCoV와 상이한 항원, 예컨대 2019-CoV 막 단백질 또는 외피 단백질로부터의 항원이다.

본 발명의 벡터(들)는 본원에 정의된 바와 같은 임의의 폴리뉴클레오티드 또는 발현 구축물, 또는 그의 임의의 조합을 포함할 수 있다.

벡터(들)는 바이러스 벡터일 수 있다. 이러한 바이러스 벡터는 아데노바이러스 (인간 혈청형, 예컨대 AdHu5, 원숭이 혈청형, 예컨대 ChAd63, ChAdOX1 또는 ChAdOX2, 또는 또 다른 형태), 아데노-관련 바이러스 (AAV), 또는 폭스바이러스 벡터 (예컨대, 변형된 백시니아 안카라 (MVA)), 또는 아데노 연관 바이러스 (AAV)일 수 있다. ChAdOX1 및 ChAdOX2는 WO2012/172277 (그 전문이 본원에 참조로 포함됨)에 개시되어 있다. ChAdOX2는 BAC-유래 및 E4 변형된 AdC68-기반 바이러스 벡터이다. 바람직하게는, 상기 바이러스 벡터는 AAV 벡터 아데노바이러스이다.

바이러스 벡터는 통상적으로 비-복제 또는 복제 손상 벡터이며, 이는 통상적인 수단에 의해 - 예를 들어, DNA 합성 및/또는 바이러스 역가를 측정하는 것을 통해 측정 시, 바이러스 벡터가 정상 세포 (예를 들어, 정상 인간 세포)에서 임의의 유의한 정도로 복제할 수 없다는 것을 의미한다. 비-복제 또는 복제 손상 벡터는 자연적으로 (즉, 자연으로부터 그 자체로 단리됨) 또는 인공적으로 (예를 들어, 시험관내 육종에 의해 또는 유전자 조작에 의해) 그렇게 될 수 있다. 일반적으로, 복제-손상 바이러스 벡터가 성장할 수 있는 적어도 하나의 세포-유형이 있을 것이다 - 예를 들어, 변형된 백시니아 앙카라 (MVA)는 CEF 세포에서 성장할 수 있다. 비제한적 예로서, 벡터는 인간 또는 원숭이 아데노바이러스 또는 폭스바이러스 벡터로부터 선택될 수 있다.

전형적으로, 바이러스 벡터는 동물 대상체, 전형적으로 포유동물 대상체, 예컨대 인간 또는 다른 영장류에서 유의한 감염을 유발할 수 없다.

벡터(들)는 DNA 벡터, 예컨대 DNA 플라스미드일 수 있다. 벡터(들)는 RNA 벡터, 예컨대 mRNA 벡터 또는 자가-증폭 RNA 벡터일 수 있다. 본 발명의 DNA 및/또는 RNA 벡터(들)는 진핵 및/또는 원핵 세포, 특히 본원에 기재된 임의의 숙주 세포 유형에서, 또는 치료될 대상체에서 발현될 수 있다.

전형적으로, DNA 및/또는 RNA 벡터(들)는 인간, 이. 콜라이 또는 효모 세포에서 발현될 수 있다.

본 발명은 파지 벡터, 예컨대 문헌 [Hajitou et al., Cell 2006; 125(2) pp. 385-398] (본원에 참조로 포함됨)에 기재된 바와 같은 AAV/파지 하이브리드 벡터일 수 있다.

본 발명의 핵산 분자는 관련 기술분야에 공지된 임의의 적합한 프로세스를 사용하여 제조될 수 있다. 따라서, 핵산 분자는 화학적 합성 기술을 사용하여 제조될 수 있다. 대안적으로, 본 발명의 핵산 분자는 분자 생물학 기술을 사용하여 제조될 수 있다.

본 발명의 벡터(들)는 인 실리코로 설계된 후, 통상적인 폴리뉴클레오티드 합성 기술에 의해 합성될 수 있다.

바이러스-유사 입자

바이러스-유사 입자 (VLP)는 바이러스와 유사하지만 바이러스 핵산을 함유하지 않는 입자이고, 따라서 비-감염성이다. 이들은 통상적으로, VLP를 형성하기 위해 자기-조립될 수 있는 하나 이상의 바이러스 캡시드 또는 외피 단백질을 함유한다. VLP는 매우 다양한 바이러스 패밀리의 성분으로부터 생성되었다 (문헌 [Noad and Roy (2003), Trends in Microbiology, 11:438-444; Grgacic et al., (2006), Methods, 40:60-65]). 일부 VLP, 예를 들어 엔게릭스(Engerix)-B (B형 간염용), 서바릭스(Cervarix) 및 가르다실(Gardasil) (인간 유두종 바이러스용)은 치료 백신으로서 승인되었다.

따라서, 본 발명은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 포함하는 VLP를 제공한다. 본 발명의 VLP는 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 본 발명의 VLP는 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 VLP 내에 포함된 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.

관련 기술분야의 통상의 기술자는 VLP가 바이러스 구조 단백질의 개별 발현을 통해 합성될 수 있으며, 이어서 바이러스-유사 구조로 자기-조립될 수 있음을 이해할 것이다. 상이한 바이러스로부터의 구조적 캡시드 단백질의 조합을 사용하여 재조합 VLP를 생성할 수 있다. 또한, 항원 또는 그의 면역원성 단편은 VLP의 표면에 융합될 수 있다. 비제한적 예로서, 본 발명의 항원 또는 그의 면역원성 단편은 스파이캐처-스파이태그(SpyCatcher-SpyTag) 시스템 (브룬, 비스워스, 하워스(Brune, Biswas, Howarth)에 의해 기재된 바와 같음)을 사용하여 VLP에 커플링될 수 있다.

본 발명의 VLP는 하나 이상의 추가의 단백질 항원을 포함할 수 있다. 하나 이상의 추가의 항원은 2019-nCoV와 동일한 항원 또는 상이한 항원, 또는 그의 단편일 수 있다. 보다 바람직하게는, 상기 하나 이상의 추가의 항원은 2019-nCoV와 상이한 항원, 예컨대 2019-CoV 막 단백질 또는 외피 단백질로부터의 항원이다.

본 발명의 VLP는 본원에 기재된 바와 같은 융합 단백질을 포함할 수 있다. 본 발명의 VLP는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편과 B형 간염 표면 항원 (HBSAg), 인간 유두종바이러스 (HPV) 18 L1 단백질, HPV 16 L1 단백질 및/또는 E형 간염 P239, 바람직하게는 B형 간염 표면 항원의 융합 단백질을 포함할 수 있다. 이들 다른 바이러스 단백질이 융합 단백질로 이전에 기재되었지만, 지금까지 2019-nCoV 스파이크 단백질 크기의 단백질을 포함하는 융합 단백질이 성공적으로 생성되었다는 보고는 없다. 또한, 이러한 융합 단백질에 대한 발현 시스템의 선택과 관련하여 공지된 제한이 있다. 본 발명자들은 놀랍게도 2019-nCoV 스파이크 단백질을 포함하는 VLP/융합 단백질이 이. 콜라이, 효모 및 인간 세포에서 재조합적으로 생산될 수 있고, 이들 VLP/융합 단백질이 동물 모델에서 (면역보호) 항체 반응을 도출할 수 있다는 것을 입증하였다.

따라서, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.

본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.

본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 VLP는 서열식별번호: 9, 10, 11 또는 12 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.

본 발명의 VLP는 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 VLP는 서열식별번호: 28, 31, 또는 33 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.

VLP의 사용은 2019-nCoV 스파이크 단백질 또는 면역원성 단편에 의해 유도된 면역보호 반응의 효능을 증가시킬 수 있고/있거나 본원에 정의된 바와 같은 면역보호 반응의 지속기간을 증가시킬 수 있다.

융합 단백질

본 발명은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 포함하는 융합 단백질을 추가로 제공한다. 본 발명의 융합 단백질은 전형적으로 서열식별번호: 1과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 1과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 1과 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함한다. 본 발명의 융합 단백질은 서열식별번호: 1을 포함하거나 또는 그로 이루어진 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함할 수 있다. 일부 바람직한 실시양태에서, 본 발명의 융합 단백질에 포함된 2019-nCoV 스파이크 단백질의 면역원성 단편은 본원에서 정의된 바와 같은 2019-nCoV 스파이크 단백질의 RBD이고, 바람직하게는 여기서 상기 RBD는 서열식별번호: 15와 적어도 90% 동일성을 갖는다.

본 발명의 융합 단백질은 전형적으로 비-2019-nCoV 도메인 또는 요소, 전형적으로 비-2019-nCoV 단백질, 폴리펩티드 또는 펩티드 도메인 또는 요소를 또한 포함한다. 본 발명의 융합 단백질은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 및 B형 간염 표면 항원 (HBSAg); 인간 유두종바이러스 (HPV) 18 L1 단백질; HPV 16 L1 단백질; 및/또는 E형 간염 P239 (HEV) 중 하나 이상, 바람직하게는 B형 간염 표면 항원을 포함할 수 있다. VLP와 관련하여 상기 기재된 바와 같이, 본 발명자들은 놀랍게도 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질이 이. 콜라이, 효모 및 인간 세포에서 재조합적으로 생산될 수 있고, 이들 융합 단백질이 동물 모델에서 (면역보호) 항체 반응을 도출할 수 있다는 것을 입증하였다.

본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 3, 5, 6 또는 8 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 VLP는 서열식별번호: 3, 5, 6 또는 8 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.

본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다. 본 발명의 융합 단백질은 서열식별번호: 26, 27, 29, 30, 또는 32 중 어느 하나의 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩될 수 있다.

본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중의 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 융합 단백질은 서열식별번호: 9, 10, 11 또는 12 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.

본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 보다 바람직하게는, 본 발명의 융합 단백질은 서열식별번호: 28, 31 또는 33 중 어느 하나에 대해 적어도 98%, 적어도 99% 또는 그 초과의 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다. 본 발명의 융합 단백질은 서열식별번호: 28, 31, 또는 33 중 어느 하나의 아미노산 서열을 포함하거나 또는 그로 이루어질 수 있다.

본 발명의 융합 단백질은 링커 (본원에서 링커 펩티드, 스페이서 또는 스페이서 펩티드로도 상호교환가능하게 지칭됨)를 포함할 수 있다. 링커는 본 발명의 융합 단백질의 2개 이상의 기능적 도메인을 연결하는 데 사용될 수 있다. 전형적으로, 링커가 존재하는 경우, 이는 융합 단백질의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 도메인을 융합 단백질의 비-2019-nCoV 스파이크 단백질 도메인에 연결하는 데 사용된다. 융합 단백질에서의 링커의 사용은 관련 기술분야에서 상용적이고, 생성된 융합 단백질이 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 목적하는 기능적 특성 및 비-2019-nCoV 스파이크 단백질 도메인의 목적하는 기능 특성을 보유하는 한, 임의의 통상적인 링커 단백질이 본 발명의 융합 단백질에 사용될 수 있다.

링커는 약 30개 이하의 아미노산, 예컨대 약 5-30개 아미노산, 약 5-25개 아미노산, 약 5-20개 아미노산, 약 10-20개 아미노산, 약 5-15개 아미노산 또는 약 10-15개 아미노산 길이의 짧은 펩티드일 수 있다. 일부 실시양태에서, 링커는 약 10개, 약 11개, 약 12개, 약 13개, 약 14개, 약 15개, 약 16개, 약 17개, 약 18개, 약 19개 또는 약 20개 아미노산 길이이다.

일부 실시양태에서, 강성 링커가 본 발명의 융합 단백질에 사용될 수 있다. 강성 링커는 융합 단백질의 상이한 도메인/부분 사이에 고정된 거리를 유지하고 그의 독립적인 기능을 유지하는 것이 필요한 경우에 통상적으로 사용된다. 강성 링커는 또한 융합 단백질 도메인의 공간적 분리가 융합 단백질의 안정성 또는 생물활성을 보존하는 데 중요한 경우에 사용될 수 있다. A(EAAAK)_nA (n = 2-5) (서열식별번호: 16)의 서열을 갖는 실험적 강성 링커는 Glu^--Lys⁺ 염 가교에 의해 안정화된 α-나선 입체형태를 나타냈다. 링커의 길이는 도메인 사이의 최적 거리를 달성하기 위해 카피수를 변화시킴으로써 조정될 수 있다. 나선형 링커는 또한 융합 단백질 폴딩 및 안정성을 개선시킬 수 있다.

강성 링커의 비제한적인 예는 EAAAKEAAAKEAAAK ((EAAAK)₃으로 또한 지칭됨, 서열식별번호: 18)이고, 이는 핵산 서열 (서열식별번호: 17)에 의해 코딩될 수 있다. 기능적 도메인 사이의 거리를 제어하는 링커의 길이 및 구조는 융합 단백질의 안정성에 영향을 미친다. 본 발명의 RBD 융합 단백질의 안정성 및 활성은 전형적으로 본원의 실시예에 제시된 바와 같이 (EAAAK)₃ 링커 삽입 후에 유의하게 개선된다. 링커, 특히 (EAAAK)₃의 사용은 또한 본 발명의 재조합 융합 단백질의 수율을 증진시킬 수 있다.

따라서, 강성 링커, 특히 (EAAAK)₃ (서열식별번호: 18)은 바람직하게는 포유동물 세포, 예컨대 HEK 293 세포에서의 본 발명의 융합 단백질의 발현에 사용될 수 있다.

일부 실시양태에서, 가요성 링커가 본 발명의 융합 단백질에 사용될 수 있다. 가요성 링커는 연결된 도메인이 특정 정도의 이동 또는 상호작용을 필요로 하는 경우에 통상적으로 사용된다. 가요성 링커는 통상적으로 소형 아미노산 잔기, 예컨대 글리신, 트레오닌, 아르기닌, 세린, 아스파라긴, 글루타민, 알라닌, 아스파르트산, 프롤린, 글루탐산, 리신, 류신 및/또는 발린, 특히 글리신, 세린, 알라닌, 류신 및/또는 발린을 포함하거나 또는 그로 이루어진다. 글리신, 세린 및/또는 알라닌을 포함하거나 또는 그로 이루어진 가요성 링커가 바람직하고, 글리신 및 세린이 특히 바람직하다. 따라서, 가장 통상적으로 사용되는 가요성 링커는 주로 Gly 및 Ser 잔기의 스트레치로 이루어진 서열 ("GS" 링커)을 가지며, (Gly-Gly-Gly-Gly-Ser)_n (서열식별번호: 19)의 서열을 포함한다. GS 링커의 비제한적 예는 GS5 또는 (GGGGS)₁ (서열식별번호: 20); GS10 또는 (GGGGS)₂ (서열식별번호: 21); GS15 또는 (GGGGS)₃ (서열식별번호: 23); GS20 또는 (GGGGS)₄ (서열식별번호: 24); 및 GS25 또는 (GGGGS)₅ (서열식별번호: 25)를 포함한다. 바람직하게는, (서열식별번호: 22)에 의해 코딩될 수 있는 GS15가 사용될 수 있다. 가요성 링커는 바람직하게는 박테리아 세포, 예컨대 이. 콜라이 세포에서의 본 발명의 융합 단백질의 발현에 사용될 수 있다.

임의의 적절한 링커, 예컨대 본원에 기재된 예시적인 링커는 본 발명의 임의의 융합 단백질 (임의의 2019-nCoV 스파이크 단백질 또는 면역원성 단편 도메인 및 임의의 비-219-nCoV 스파이크 단백질 도메인을 포함함)과 함께 사용될 수 있다. 비제한적인 예로서, 본 발명의 융합 단백질은 HBSAg-(EAAAK)₃-RBD (서열식별번호: 28), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 서열식별번호: 26 또는 27, 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다. 추가의 비제한적인 예로서, 본 발명의 융합 단백질은 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질 (서열식별번호: 33), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 서열식별번호: 32, 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다. 추가의 비제한적 예로서, 본 발명의 융합 단백질은 HEV-GS15-RBD (서열식별번호: 31), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체를 포함하거나 또는 그로 이루어질 수 있으며, 이는 (서열식별번호: 29 또는 30), 또는 그에 대해 적어도 90% 서열 동일성을 갖는 변이체에 의해 코딩될 수 있다.

본 발명의 융합 단백질은 바람직하게는 VLP의 형태를 취할 수 있다. 이론에 얽매이지는 않지만, 이는 HBSAg, HPV 18 L1 단백질, HPB 16 L1 단백질 및 E형 간염 P239 단백질이 재조합적으로 발현되는 경우에 VLP를 자발적으로 형성하는 것으로 공지되어 있고, 이러한 구조는 HBSAg, HPV 18 L1 단백질, HPB 16 L1 단백질 및/또는 E형 간염 P239 단백질이 본 발명의 2019-nCoV 스파이크 단백질 (또는 그의 면역원성 단편)과 조합된 융합 단백질 형태로 존재하는 경우에 유지되기 때문이다.

항체

본원에 기재된 바와 같이, 본 발명의 폴리뉴클레오티드에 의해 코딩되는 2019-nCoV 스파이크 단백질 또는 그의 단편은 천연 2019-nCoV에서 발견되는 하나 이상의 입체형태적 에피토프에 특이적으로 결합하는 항체의 생성을 도출한다. 상기 항체는 전형적으로 하기 논의된 바와 같은 중화 항체 (nAb)이다. 이들 nAb는 2019-nCoV에 대한 면역보호 효과를 매개할 수 있다.

본원에 사용된 용어 "항체"는 4개의 폴리펩티드 쇄, 즉 2개의 중쇄 (H) 및 2개의 경쇄 (L)로 구성된 임의의 이뮤노글로불린 (Ig) 분자, 또는 Ig 분자의 본질적인 에피토프 결합 특색을 보유하는 그의 임의의 기능적 단편, 돌연변이체, 변이체 또는 유도체를 광범위하게 지칭한다. 이러한 돌연변이체, 변이체 또는 유도체 항체 실체는 관련 기술분야에 공지되어 있으며, 그의 비제한적 실시양태가 하기 논의된다.

전장 항체에서, 각각의 중쇄는 중쇄 가변 영역 (본원에서 VH로 약칭됨) 및 중쇄 불변 영역으로 구성된다. 중쇄 불변 영역은 3개의 도메인 CH1, CH2 및 CH3으로 구성된다. 각각의 경쇄는 경쇄 가변 영역 (본원에서 VL로 약칭됨) 및 경쇄 불변 영역으로 구성된다. 경쇄 불변 영역은 1개의 도메인 CL로 구성된다. VH 및 VL 영역은 프레임워크 영역 (FR)으로 명명된 더욱 보존된 영역이 산재되어 있는, 상보성 결정 영역 (CDR)으로 명명된 초가변성 영역으로 추가로 세분될 수 있다. 각각의 VH 및 VL은 3개의 CDR 및 4개의 FR로 구성되며, 아미노-말단에서 카르복시-말단으로 다음 순서: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4로 배열되어 있다. 항체는 폴리클로날 (pAb) 또는 모노클로날 (mAb)일 수 있다. 치료적으로 사용될 때 (즉, 수동 면역을 제공하기 위해), mAb의 투여가 바람직하다.

본 발명에 따르면, 항체는 임의의 유형 (예를 들어, IgG, IgE, IgM, IgD, IgA 및 IgY), 부류 (예를 들어, IgG1, IgG2, IgG3, IgG4, IgA1 및 IgA2) 또는 하위부류의 것일 수 있고, 임의의 종 (예를 들어, 마우스, 인간, 닭, 래트, 토끼, 양, 상어 및 낙타류)으로부터의 것일 수 있다.

본원에 사용된 용어 항체의 "항원-결합 단편" (또는 간단히 "결합 단편")은 항원에 특이적으로 결합하는 능력을 보유하는 항체의 하나 이상의 단편을 지칭한다. 항체의 항원-결합 기능은 전장 항체의 하나 이상의 단편에 의해 수행될 수 있는 것으로 밝혀졌다. 단일 쇄 항체가 또한 포함된다. 이러한 항원-결합 단편은 또한 2종 이상의 상이한 항원에 특이적으로 결합하는 이중특이적, 이중 특이적 또는 다중-특이적일 수 있다. 따라서, 용어 항체의 "항원-결합 단편" 내에 포괄되는 결합 단편의 예는 Fab, Fv, scFv, dAb, Fd, Fab' 또는 F(ab')₂, 탠덤 scFv 및 디아바디를 포함한다.

또한, 링커 폴리펩티드 또는 이뮤노글로불린 불변 도메인에 연결된 본 발명의 하나 이상의 항원 결합 단편을 포함하는 폴리펩티드로서 정의되는 항체 구축물이 포함된다. 링커 폴리펩티드는 펩티드 결합에 의해 연결된 2개 이상의 아미노산 잔기를 포함하고, 1개 이상의 항원 결합 부분을 연결하는 데 사용된다.

본원에 사용된 용어 "항체"는 인간 배선 이뮤노글로불린 서열로부터 유래된 가변 및 불변 영역을 갖지만, 예를 들어 CDR 및 특히 CDR3에서 인간 배선 이뮤노글로불린 서열에 의해 코딩되지 않은 아미노산 잔기 (예를 들어, 시험관내 무작위 또는 부위-특이적 돌연변이유발에 의해 또는 생체내 체세포 돌연변이에 의해 도입된 돌연변이)를 포함할 수 있는 항체로서 정의되는 인간 항체일 수 있다. 재조합 인간 항체가 또한 포함된다.

본 발명의 항체는 하나의 종으로부터의 중쇄 및 경쇄 가변 영역 서열 및 또 다른 종으로부터의 불변 영역 서열을 포함하는 항체로 정의되는 "키메라 항체"일 수 있다. 본 발명은, 예를 들어 인간 불변 영역에 연결된 뮤린 중쇄 및 경쇄 가변 영역을 갖는 키메라 항체를 포괄한다.

본 발명의 항체는 하나의 종으로부터의 중쇄 및 경쇄 가변 영역 서열을 포함하지만 VH 및/또는 VL의 CDR 영역 중 하나 이상의 서열이 또 다른 종의 CDR 서열로 대체된 항체, 예컨대 뮤린 CDR 중 하나 이상 (예를 들어, CDR3 또는 3개의 CDR 모두)이 인간 CDR 서열로 대체된 뮤린 중쇄 및 경쇄 가변 영역을 갖는 항체로서 정의되는 "CDR-그라프트된 항체"일 수 있다.

본 발명의 항체는 비-인간 종 (예를 들어, 마우스)으로부터의 중쇄 및 경쇄 가변 영역 서열을 포함하지만, VH 및/또는 VL 서열의 적어도 일부분이 더욱 "인간-유사"하도록, 즉 인간 배선 가변 서열에 더욱 유사하도록 변경된 항체로 정의되는 "인간화 항체"일 수 있다. 인간화 항체의 한 유형은 인간 CDR 서열이 상응하는 비-인간 CDR 서열을 대체하기 위해 비-인간 VH 및 VL 서열 내로 도입된 CDR-그라프트된 항체이다.

용어 "카바트 넘버링", "카바트 정의 및 "카바트 표지"는 본원에서 상호교환가능하게 사용된다. 관련 기술분야에 인지된 이들 용어는 항체 또는 그의 항원 결합 부분의 중쇄 및 경쇄 가변 영역 내의 다른 아미노산 잔기보다 더 가변적인 (즉, 초가변적인) 아미노산 잔기를 넘버링하는 시스템을 지칭한다 (문헌 [Kabat et al. (1971) Ann. NY Acad, Sci. 190:382-391 and Kabat, E.A., et al. (1991) Sequences of Proteins of Immunological Interest, Fifth Edition, U.S. Department of Health and Human Services, NIH Publication No. 91-3242]).

본 발명의 항체는 특정한 생성 또는 생산 방법으로 제한되지 않는다. 따라서, 본 발명은 항체를 분비하는 하이브리도마로부터 제조된 항체, 뿐만 아니라 항체를 코딩하는 폴리뉴클레오티드 또는 폴리뉴클레오티드들로 형질전환 또는 형질감염된 재조합적으로 생성된 세포로부터 생산된 항체를 제공한다. 이러한 하이브리도마, 재조합적으로 생성된 세포, 및 폴리뉴클레오티드는 본 발명의 일부를 형성한다.

본 발명의 항체 또는 그의 항원-결합 단편은 본원에 기재된 바와 같은 2019-nCoV 스파이크 단백질, 또는 2019-nCoV 스파이크 단백질의 특정한 에피토프 (바람직하게는 입체형태적 에피토프)에 대해 선택적이거나 특이적이다. 구체적으로, 항체는 임의의 다른 분자, 특히 임의의 다른 단백질에 대한 유의한 교차-반응성 없이 관심 분자, 이 경우 2019-nCoV 스파이크 단백질 또는 그의 단편에 결합하는 것으로 이해될 것이다. 예를 들어, 본 발명의 특정한 2019-nCoV 스파이크 단백질 에피토프에 특이적인 본 발명의 결합 화합물 또는 항체는 다른 2019-nCoV 스파이크 단백질 에피토프와 유의한 교차-반응성을 나타내지 않을 것이다. 또 다른 예로서, 2019-nCoV 스파이크 단백질에 특이적인 본 발명의 결합 화합물 또는 항체는 2019-nCoV 막 단백질과 유의한 교차-반응성을 나타내지 않을 것이다. 교차-반응성은 임의의 적합한 방법에 의해 평가될 수 있다. 2019-nCoV 스파이크 단백질 에피토프에 대한 결합 화합물 (예를 들어, 항체)과 또 다른 2019-nCoV 스파이크 단백질 에피토프 또는 2019-nCoV 스파이크 단백질 이외의 단백질의 교차-반응성은 결합 화합물 (예를 들어, 항체)이 2019-nCoV 스파이크 단백질 에피토프에 결합하는 것만큼 강하게 다른 분자에 대해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 100% 결합하는 경우에 유의한 것으로 간주될 수 있다. 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적인 결합 화합물 (예를 들어, 항체)은 2019-nCoV 스파이크 단백질 에피토프에 결합하는 강도의 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25% 또는 20% 미만으로 또 다른 분자, 예컨대 2019-nCoV 막 단백질에 결합할 수 있다. 바람직하게는, 결합 화합물 (예를 들어, 항체)은 2019-nCoV 스파이크 단백질 에피토프에 결합하는 강도의 20% 미만, 15% 미만, 10% 미만 또는 5% 미만, 2% 미만 또는 1% 미만으로 다른 분자에 결합한다. 결합 친화도는 임의의 적합한 방식으로, 예를 들어 K_D에 의해 정량화될 수 있다.

2019-nCoV 스파이크 단백질에 대한 본 발명의 2019-nCoV 스파이크 단백질 항체 (바람직하게는 중화)의 결합 친화도는 해리 상수 (K_D)로 정량화될 수 있다. K_D는 임의의 적절한 기술을 사용하여 결정될 수 있지만, SPR이 본 발명의 문맥에서 일반적으로 바람직하다. 본 발명의 2019-nCoV 스파이크 단백질 항체는 1 μM 미만, 100 nM 미만, 50 nM 미만, 25 nM 미만, 10 nM 미만, 1 nM 미만, 900 pM 미만, 800 pM 미만, 700 pM 미만, 600 pM 미만, 500 pM 미만, 400 pM 미만, 300 pM 미만, 200 pM 미만, 100 pM 미만, 50 pM 미만, 25 pM 미만, 10 pM 미만, 5 pM 미만, 또는 그 미만의 K_D로 2019-nCoV 스파이크 단백질에 결합할 수 있다. 전형적으로, 본 발명의 2019-nCoV 스파이크 단백질 항체는 50 nM 미만, 10 nM 미만 또는 1 nM 미만의 K_D로 2019-nCoV 스파이크 단백질에 결합한다.

본 발명의 에피토프/항원에 결합하는 추가의 항체는 본 발명의 항체의 변이체를 생산함으로써 생성될 수 있다. 이러한 변이체는 본 발명의 항체의 CDR과 높은 수준의 동일성을 공유하는 CDR을 가질 수 있고, 예를 들어 각각 독립적으로 변이체 항체가 유래된 본 발명의 항체와 1 또는 2개의 아미노산이 상이할 수 있는 CDR을 가질 수 있으며, 여기서 변이체는 본 발명의 항체의 결합 및 기능적 특성을 보유한다. 추가로, 상기 항체는 프레임워크 영역에 하나 이상의 변이 (예를 들어, 보존적 아미노산 치환)를 가질 수 있다. 본 발명의 항체의 아미노산 서열에서의 변이는 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 및 최대 99% 서열 동일성을 유지해야 한다. 본 발명의 항체, 특히 본원에 예시된 특이적 항체와 적어도 90% 서열 동일성을 갖는 변이체가 구체적으로 고려된다. 변이는 프레임워크 영역으로 제한되거나 제한되지 않을 수 있고, CDR에 존재하지 않을 수 있다.

용어 "중화 항체"는 그 자체로 (임의의 다른 2019-nCoV 스파이크 단백질 항체 또는 또 다른 2019-nCoV 단백질에 대한 다른 항체의 부재 하에) 그가 결합하는 스파이크 단백질의 기능에 영향을 미치는 능력을 갖는 항체를 의미하는 것으로 본원에 정의된다. 특히, 중화 항체는 스파이크 단백질의 생물학적 활성을 중화 또는 억제함으로써 세포를 감염시켜 스파이크 단백질을 발현하는 2019-nCoV 바이러스 입자의 능력을 감소시킨다.

이러한 중화 활성은 임의의 적절한 기술을 사용하여 정량화될 수 있고, 임의의 적절한 단위로 측정될 수 있다. 본 개시내용은 본 발명의 중화 항체 (및 본원에 기재된 바와 같은 다른 결합 화합물)에 동등하게 적용된다. 예를 들어, 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편의 유효성은 그의 반수 최대 유효 농도 (EC50), 자극된 항체 역가 (항체 단위, AU) 및/또는 AU와 관련한 EC50으로 주어질 수 있다. 이들 중 후자는 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 의해 자극된 항체 반응의 품질의 지표를 제공한다. 임의의 적절한 기술을 사용하여 EC50, AU 또는 EC50/AU를 결정할 수 있다. 통상의 기술은 관련 기술분야에 공지되어 있다.

생성된 항체의 양은 임의의 적절한 방법을 사용하여 정량화될 수 있으며, 표준 기술이 관련 기술분야에 공지되어 있다. 예를 들어, 생성된 항체의 양은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 의해 유도된 혈청 IgG 반응과 관련하여 ELISA에 의해 측정될 수 있다. 생성된 항체의 양은 임의 항체 단위 (AU)로 주어질 수 있다.

본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 대한 면역 반응 (또는 면역원성), 특히 항체 반응은 생성된 항체의 양과 관련한 반수-최대 유효 농도, 즉 EC50/AU로 주어질 수 있다. 이는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편에 대해 생성된 면역 반응의 품질의 지표를 제공한다. 예를 들어, 낮은 EC50 (즉, 유효 반응)이지만 높은 수의 생성된 항체 단위는 낮은 수의 항체 단위와 함께 낮은 EC50보다 덜 효과적이다 (더 높은 EC50/AU를 제공함). 따라서, 이 값은 중화 항체 활성 (EC50으로서 측정됨)을 생성된 항-2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 IgG 항체의 총량의 비율 (ELISA에 의해 측정됨, AU)로서 나타냄으로써 항체 반응의 품질을 나타낸다. 따라서, 보다 효과적인 백신은 보다 적은 항체 (보다 낮은 AU)로 EC50을 유도한다.

전형적으로, 본 발명의 중화 2019-nCoV 스파이크 단백질 항체는 2019-nCoV 입자의 감염성을 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90% 또는 그 초과만큼 감소시킨다.

본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편은 천연 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편 또는 비-최적화된 폴리뉴클레오티드에 의해 생성된 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편과 비교하여 개선된 면역 반응, 특히 개선된 항체 반응을 유발할 수 있다.

결합 화합물과 관련된 본원의 임의의 및 모든 개시내용은 바람직하게는 본원에 기재된 바와 같은 항체에 관한 것이다.

대안적으로, 다른 결합 화합물, 예컨대 2019-nCoV 스파이크 단백질 또는 그의 단편, 특히 상기 2019-nCoV 스파이크 단백질 또는 단편 내의 에피토프에 대한 DNA 올리고뉴클레오티드 압타머, RNA 올리고뉴클레오티드 압타머, 및 다른 조작된 생체중합체가 또한 본원에 기재된 항체 및 그의 조합의 활성을 복제할 수 있다. 상기 대안적 결합 화합물은 본 발명의 단백질 또는 그의 면역원성 단편에 특이적으로 결합할 수 있다.

올리고뉴클레오티드 압타머는 널리 확립된 방법을 사용하여 확인 또는 합성될 수 있다. 압타머는 치료 용도에 적합해지도록 추가로 최적화될 수 있으며, 예를 들어 이는 모노클로날 항체에 접합되어 그의 약동학을 변형시키고/거나 Fc-의존성 면역 기능을 동원할 수 있다.

조성물 및 치료 적응증

본원에 기재된 바와 같이, 본 발명자들은 본 발명의 폴리뉴클레오티드에 의해 발현된 2019-nCoV 스파이크 단백질로의 면역화가 강건한 항체 반응을 생성할 수 있음을 입증하였다.

따라서, 본 발명은 백신으로 사용하기 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물을 제공한다.

본 발명은 또한 상기 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물을 포함하는 백신 조성물을 제공한다. 백신 조성물은 임의로 제약상 허용되는 부형제, 희석제, 담체, 추진제, 염 및/또는 첨가제를 포함할 수 있다.

일부 실시양태에서, 백신 조성물은 본 발명에 따른 2종 이상의 상이한 단백질 또는 면역원성 단편, 및/또는 본 발명에 따른 2종 이상의 상이한 폴리뉴클레오티드 분자를 포함한다. 비제한적 예로서, 백신 조성물은 2019-nCoV 스파이크 단백질을 코딩하는 폴리뉴클레오티드 및 2019-nCoV 막 단백질을 코딩하는 폴리뉴클레오티드를 포함할 수 있다.

본 발명은 또한 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물 (상기 기재된 바와 같음)을 사용하여 대상체에서 면역 반응을 자극하거나 유도하는 방법을 제공한다.

상기 대상체에서 면역 반응을 자극하거나 유도하는 방법은 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 또는 결합 화합물 (상기 기재된 바와 같음)을 대상체에게 투여하는 것을 포함할 수 있다.

치료 용도 및 방법과 관련하여, "대상체"는 2019-nCoV에 대한 면역보호 반응의 자극 또는 유도로부터 이익을 얻을 임의의 동물 대상체이다. 전형적인 동물 대상체는 포유동물, 예컨대 영장류, 예를 들어 인간이다.

따라서, 본 발명은 2019-nCoV 감염을 치료 또는 예방하는 방법을 제공한다. 상기 방법은 전형적으로 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물을 그를 필요로 하는 대상체에게 투여하는 것을 포함한다.

본 발명은 또한 2019-nCoV 감염의 예방 또는 치료에 사용하기 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물을 제공한다.

본 발명은 또한 2019-nCoV 감염의 예방 또는 치료를 위한 의약의 제조를 위한, 본 발명의 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물의 용도를 제공한다.

본원에 사용된 용어 "치료" 또는 "치료하는"은 치료적 또는 방지적/예방적 조치를 포괄하고, 2019-nCoV 감염의 감염후 요법 및 호전을 포함한다.

본원에 사용된 용어 "예방하는"은 2019-nCoV에 의한 감염의 개시를 예방하고/거나 2019-nCoV에 의한 감염의 중증도 또는 강도를 감소시키는 것을 포함한다. 용어 "예방하는"은 2019-nCoV에 의한 감염에 대한 보호 면역을 유도하거나 제공하는 것을 포함한다. 2019-nCoV에 의한 감염에 대한 면역은 임의의 적절한 기술을 사용하여 정량화될 수 있으며, 그의 예는 관련 기술분야에 공지되어 있다.

본원에 정의된 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 2019-nCoV에 의한 감염을 치료 또는 예방하기 위해 이미 2019-nCoV 감염, 2019-nCoV에 의한 감염과 연관된 상태 또는 증상을 갖는 대상체 (전형적으로 포유동물 대상체, 예컨대 인간 또는 다른 영장류)에게 투여될 수 있다. 예를 들어, 대상체는 2019-nCoV와 접촉한 것으로 의심될 수 있거나, 또는 2019-nCoV와 접촉한 것으로 알려졌지만, 아직 노출의 증상을 나타내지 않는다.

이미 2019-nCoV 감염을 앓고 있거나, 또는 2019-nCoV 감염과 연관된 증상을 보이고 있는 대상체 (예를 들어, 포유동물, 예컨대, 인간 또는 다른 영장류)에게 투여되었을 때, 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 1종 이상의 증상을 치유하거나, 지연시키거나, 그의 중증도를 감소시키거나, 또는 호전시킬 수 있고/거나, 이러한 치료의 부재 하에서 예상되는 것 이상으로 대상체의 생존을 연장시킬 수 있다.

대안적으로, 본원에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편을 발현하는 폴리뉴클레오티드, 발현 구축물, 바이러스 벡터, DNA 플라스미드 또는 RNA 백신, 또는 2019-nCoV 스파이크 단백질 또는 그의 면역원성 단편, 백신 조성물 또는 결합 화합물은 궁극적으로 2019-nCoV로 감염될 수 있는 대상체 (예를 들어, 포유동물, 예컨대 인간 또는 다른 영장류)에게 투여되어, 상기 2019-nCoV 감염의 1종 이상의 증상을 예방하거나, 치유하거나, 지연시키거나, 그의 중증도를 감소시키거나, 또는 호전시키거나, 또는 이러한 치료의 부재 하에 예상되는 것 이상으로 대상체의 생존을 연장시키거나, 또는 대상체가 2019-nCoV 감염을 전파하는 것을 예방하는 데 도움이 될 수 있다.

본 발명의 치료 및 예방 요법은 상이한 연령의 다양한 상이한 대상체에게 적용가능하다. 인간과 관련하여, 요법은 소아 (예를 들어, 영아, 5세 미만의 소아, 더 큰 소아 또는 10대) 및 성인에게 적용가능하다. 다른 동물 대상체 (예를 들어, 포유동물, 예컨대 영장류)와 관련하여, 요법은 미성숙 대상체 및 성숙/성인 대상체에게 적용가능하다. 본원에 사용된 용어 "예방하는"은 2019-nCoV 감염의 개시를 예방하고/거나 2019-nCoV 감염의 중증도 또는 강도를 감소시키는 것을 포함한다. 용어 "예방하는"은 2019-nCoV 감염에 대한 보호 면역을 유도하거나 제공하는 것을 포함한다. 2019-nCoV 감염에 대한 면역은 임의의 적절한 기술을 사용하여 정량화될 수 있으며, 그의 예는 관련 기술분야에 공지되어 있다.

본원에 사용된 "백신"은 동물 대상체, 예컨대 포유동물 (예를 들어, 인간 또는 다른 영장류)에게 투여될 때 2019-nCoV 감염에 대한 보호성 면역 반응을 자극하는 제제이다. 면역 반응은 체액성 및/또는 세포-매개 면역 반응일 수 있다. 본 발명의 백신은, 예를 들어 2019-nCoV 감염의 영향으로부터 대상체를 보호하기 위해 사용될 수 있다.

제약 조성물 및 제제

용어 "백신"은 본원에서 용어 "치료/예방 조성물", "제제" 또는 "의약"과 상호교환가능하게 사용된다.

본 발명의 백신 (상기 정의된 바와 같음)은 제약상 허용되는 담체에 추가하여 조합되거나 투여될 수 있다. 대안적으로 또는 추가로, 본 발명의 백신은 염, 부형제, 희석제, 아주반트, 면역조절제 및/또는 항미생물 화합물 중 하나 이상과 추가로 조합할 수 있다.

제약상 허용되는 염은 무기산, 예컨대 염산 또는 인산, 또는 유기산, 예컨대 아세트산, 옥살산, 타르타르산, 말레산 등으로 형성된 산 부가염을 포함한다. 유리 카르복실 기로 형성된 염은 또한 무기 염기, 예컨대 예를 들어 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘 또는 수산화제2철, 및 유기 염기, 예컨대 이소프로필아민, 트리메틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인 등으로부터 유래될 수 있다.

면역원성 조성물, 치료 제제, 의약 및 예방 제제 (예를 들어, 백신)의 투여는 일반적으로 통상적인 경로, 예를 들어 정맥내, 피하, 복강내 또는 점막 경로에 의한 것이다. 투여는 비경구 주사, 예를 들어 피하, 피내 또는 근육내 주사에 의한 것일 수 있다. 중화 항체를 포함하는 제제는 정맥내, 근육내, 피내 또는 피하 투여에 특히 적합할 수 있다.

따라서, 본 발명의 면역원성 조성물, 치료 제제, 의약 및 예방 제제 (예를 들어, 백신)는 전형적으로 액체 용액 또는 현탁액으로 주사제로서 제조된다. 주사 전에 액체 중에 용해 또는 현탁시키기에 적합한 고체 형태가 대안적으로 제조될 수 있다. 제제는 또한 유화되거나, 또는 펩티드를 리포솜 또는 마이크로캡슐 내에 캡슐화할 수 있다.

활성 면역원성 성분 (예컨대, 2019-nCoV 스파이크 단백질, 그의 단편, 상기 스파이크 단백질을 코딩하는 핵산, 발현 벡터, 바이러스 벡터, DNA 플라스미드, RNA 백신, 융합 단백질 및 백신 조성물)은 종종 제약상 허용되고 활성 성분과 상용성인 담체, 희석제, 부형제 또는 유사물과 혼합된다. 적합한 부형제는, 예를 들어 물, 염수, 덱스트로스, 글리세롤, 에탄올 등 및 그의 조합이다. 또한, 원하는 경우, 백신은 소량의 보조 물질, 예컨대 습윤제 또는 유화제, pH 완충제, 및/또는 백신의 유효성을 증진시키는 아주반트를 함유할 수 있다.

일반적으로, 담체, 희석제, 부형제 또는 유사물은 제약상 허용되는 담체이다. 제약상 허용되는 담체의 비제한적 예는 물, 염수 및 포스페이트-완충 염수를 포함한다. 그러나, 일부 실시양태에서, 조성물은 동결건조 형태이고, 이 경우에 안정화제, 예컨대 BSA를 포함할 수 있다. 일부 실시양태에서, 장기간 저장을 용이하게 하기 위해 조성물을 보존제, 예컨대 티오메르살 또는 아지드화나트륨과 함께 제제화하는 것이 바람직할 수 있다.

효과적일 수 있는 추가의 아주반트의 예는 완전 프로인트 아주반트 (CFA), 불완전 프로인트 아주반트 (IFA), 사포닌, 사포닌의 정제된 추출물 분획, 예컨대 퀼 A, 사포닌의 유도체, 예컨대 QS-21, 사포닌을 기재로 하는 지질 입자, 예컨대 이스콤/이스코매트릭스(ISCOM/ISCOMATRIX), 이. 콜라이 열 불안정성 독소 (LT) 돌연변이체, 예컨대 LTK63 및/또는 LTK72, 수산화알루미늄, N-아세틸-뮤라밀-L-트레오닐-D-이소글루타민 (thr-MDP), N-아세틸-노르-뮤라밀-L-알라닐-D-이소글루타민 (CGP 11637, 노르-MDP로 지칭됨), N-아세틸뮤라밀-L-알라닐-D-이소글루타미닐-L-알라닌-2-(1'-2'-디팔미토일-sn-글리세로-3-히드록시포스포릴 옥시)-에틸아민 (CGP 19835A, MTP-PE로 지칭됨), 및 박테리아로부터 추출된 3종의 성분을 함유하는 RIBI, GLA-SE (GLA는 합성 지질 A 유도체이고, GLA-SE에서 스쿠알렌 오일을 사용하여 수중유 에멀젼으로서 제제화됨), 2% 스쿠알렌/트윈 80 에멀젼 중 모노포스포릴 지질 A, 트레할로스 디미콜레이트 및 세포벽 골격 (MPL+TDM+CWS), 노파르티스(Novartis)에 의해 개발된 MF59 제제, 및 GSK 바이올로지칼스(GSK Biologicals) (벨기에 릭센사르트)에 의해 개발된 AS02, AS01, AS03 및 AS04 아주반트 제제를 포함하나 이에 제한되지는 않는다. 바람직한 아주반트는 수산화알루미늄 및 인산알루미늄 겔; 수산화알루미늄 및 모노포스포릴 지질 A (MPL); 및 5% 스쿠알렌 (MF59)을 포함한다. 다른 바람직한 아주반트는 명반 또는 수산화알루미늄 및/또는 인산알루미늄, GLA-SE 및/또는 스쿠알렌-기재 아주반트, 예컨대 MF59 또는 아다박스™, 또는 그의 임의의 조합을 포함한다. 바람직하게는 수산화알루미늄 및/또는 인산알루미늄, GLA-SE 및 아다박스™의 조합이 사용된다.

완충제의 예는 숙신산나트륨 (pH 6.5), 및 포스페이트 완충 염수 (PBS; pH 6.5 및 7.5)를 포함하나 이에 제한되지는 않는다.

다른 투여 방식에 적합한 추가의 제제는 좌제, 및 일부 경우에, 경구 제제 또는 에어로졸로서의 분배에 적합한 제제를 포함한다. 좌제의 경우, 전통적인 결합제 및 담체는, 예를 들어 폴리알킬렌 글리콜 또는 트리글리세리드를 포함할 수 있고; 이러한 좌제는 활성 성분을 0.5% 내지 10%, 바람직하게는 1%-2%의 범위로 함유하는 혼합물로부터 형성될 수 있다.

경구 제제는, 예를 들어 제약 등급의 만니톨, 락토스, 전분, 스테아르산마그네슘, 사카린나트륨, 셀룰로스, 탄산마그네슘 등과 같은 통상적으로 사용되는 부형제를 포함한다. 이들 조성물은 용액, 현탁액, 정제, 환제, 캡슐, 지속 방출 제제 또는 분말의 형태를 취한다.

정의

본원에 사용된 용어 "할 수 있는"은 동사와 함께 사용되는 경우, 상응하는 동사의 작용을 포괄하거나 의미한다. 예를 들어, "상호작용할 수 있는"은 또한 상호작용하는 것을 의미하고, "절단할 수 있는"은 또한 절단하는 것을 의미하고, "결합할 수 있는"은 또한 결합하는 것을 의미하고, "특이적으로 표적화할 수 있는..."은 또한 특이적으로 표적화하는 것을 의미한다.

단백질과 관련하여 사용될 때, 용어 "변이체"는 아미노산 (예를 들어, 비천연 아미노산)의 하나 이상의 유사체, 또는 치환된 연결을 함유하는 단백질의 펩티드 또는 펩티드 단편을 의미한다.

단백질과 관련하여 사용될 때, 용어 "유도체"는 해당 단백질 및 추가의 펩티드 서열을 포함하는 단백질을 의미한다. 추가의 펩티드 서열은 바람직하게는 원래의 단백질의 기본 폴딩 및 이에 따른 입체형태적 구조를 방해하지 않아야 한다. 2개 이상의 펩티드 (또는 단편, 또는 변이체)는 함께 연결되어 유도체를 형성할 수 있다. 대안적으로, 펩티드 (또는 단편, 또는 변이체)는 비관련 분자 (예를 들어, 제2, 비관련 펩티드)에 연결될 수 있다. 유도체는 화학적으로 합성될 수 있지만, 전형적으로 재조합 핵산 방법에 의해 제조될 것이다. 추가의 성분, 예컨대 지질, 및/또는 폴리사카라이드, 및/또는 폴리펩티드 성분이 포함될 수 있다.

본 명세서에서 2019-nCoV 폴리뉴클레오티드 및/또는 단백질에 대한 언급은 그의 단편 및 변이체를 포함한다. 변이체 2019-nCoV 스파이크 단백질은 천연 스파이크 단백질의 하나 이상의 입체형태적 에피토프 및 중화 항체의 생성 및/또는 면역보호 반응을 도출하는 능력을 보유한다. 본 발명의 변이체 2019-nCoV 스파이크 단백질 폴리뉴클레오티드는 이러한 스파이크 단백질을 코딩한다. 예로서, 변이체는 참조 서열 (예를 들어, 본 발명의 2019-nCoV 폴리뉴클레오티드 및/또는 단백질, 특히 2019-nCoV 폴리뉴클레오티드 및/또는 단백질을 규정하는 본 명세서에 제시된 임의의 서열식별번호)과 적어도 80%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 가장 바람직하게는 적어도 97 또는 적어도 99% 아미노산 서열 상동성을 가질 수 있다. 따라서, 변이체는 폴리뉴클레오티드의 하나 이상의 유사체 (예를 들어, 비천연 핵산), 또는 치환된 연결을 포함할 수 있다. 또한, 예로서, 2019-nCoV 폴리뉴클레오티드 및/또는 단백질과 관련하여 사용될 때, 단편이라는 용어는 참조 2019-nCoV 폴리뉴클레오티드 및/또는 단백질의 적어도 10개, 바람직하게는 적어도 15개, 보다 바람직하게는 적어도 20개의 핵산 잔기를 갖는 폴리뉴클레오티드를 의미한다. 용어 단편은 또한 상기 언급된 변이체에 관한 것이다. 따라서, 예로서, 본 발명의 2019-nCoV 폴리뉴클레오티드 및/또는 단백질의 단편은 적어도 10, 20 또는 30개의 핵산을 갖는 핵산 서열을 포함할 수 있으며, 여기서 폴리뉴클레오티드 서열은 참조 2019-nCoV 폴리뉴클레오티드 및/또는 단백질 서열의 (인접한) 핵산의 상응하는 핵산 서열에 비해 적어도 80% 서열 상동성을 갖는다. 단편 및 변이체의 이들 정의는 또한 본 발명의 다른 폴리뉴클레오티드에도 적용된다. 펩티드 서열과 관련하여, 용어 단편은 참조 단백질의 적어도 10개, 바람직하게는 적어도 15개, 보다 바람직하게는 적어도 20개의 아미노산 잔기를 갖는 펩티드를 의미한다. 용어 단편은 또한 상기 언급된 변이체에 관한 것이다. 따라서, 예로서, 단편은 적어도 10, 20 또는 30개의 아미노산을 갖는 아미노산 서열을 포함할 수 있으며, 여기서 아미노산 서열은 참조 서열의 (인접한) 아미노산의 상응하는 아미노산 서열에 비해 적어도 80% 서열 상동성을 갖는다.

본원에서 예시된 일부 폴리뉴클레오티드는 추가의 모티프, 특히 제한 효소 부위, KOZAC 서열 및/또는 단백질 분비를 유도하는 모티프 (예를 들어, tga taa)를 포함한다. 관련 기술분야의 통상의 기술자는 이들 추가의 서열이 생략될 수 있음을 이해할 것이다. 따라서, 본 발명은 명시된 모티프를 포함하는 예시된 핵산 서열, 뿐만 아니라 이들 모티프 중 하나 이상이 결여된 핵산 서열을 포괄한다.

용어 "감소시키다", "감소된", "감소" 또는 "억제하다"는 모두 본원에서 통계적으로 유의한 양만큼의 감소를 의미하는 것으로 사용된다. 용어 "감소시키다", "감소" 또는 "감소시키다" 또는 "억제하다"는 전형적으로 참조 수준 (예를 들어, 소정의 치료 부재)과 비교하여 적어도 10%만큼의 감소를 의미하고, 예를 들어 적어도 약 10%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 그 초과만큼의 감소를 포함할 수 있다. 본원에 사용된 "감소" 또는 "억제"는 참조 수준과 비교하여 완전한 억제 또는 감소를 포괄하지 않는다. "완전한 억제"는 참조 수준과 비교하여 100% 억제이다. 감소는 바람직하게는 소정의 장애를 갖지 않는 개체에 대해 정상 범위 내로서 허용되는 수준까지의 감소일 수 있다.

용어 "증가된", "증가시키다", "증진시키다" 또는 "활성화시키다"는 모두 본원에서 통계적으로 유의한 양만큼의 증가를 의미하는 것으로 사용된다. 용어 "증가된", "증가시키다", "증진시키다" 또는 "활성화시키다"는 참조 수준과 비교하여 적어도 10%의 증가, 예를 들어 참조 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 100%까지의 증가 또는 10-100% 사이의 임의의 증가, 또는 참조 수준과 비교하여 적어도 약 2배, 또는 적어도 약 3배, 또는 적어도 약 4배, 또는 적어도 약 5배 또는 적어도 약 10배 증가, 또는 2배 내지 10배 또는 그 초과의 임의의 증가를 의미할 수 있다. 마커 또는 증상과 관련하여, "증가"는 이러한 수준의 통계적으로 유의한 증가이다.

본원에 사용된 "대상체"는 인간 또는 동물을 의미한다. 통상적으로 동물은 척추동물, 예컨대 영장류, 설치류, 가축 또는 사냥 동물이다. 영장류는 침팬지, 시노몰구스 원숭이, 거미 원숭이 및 마카크, 예를 들어 레서스를 포함한다. 설치류는 마우스, 래트, 우드척, 페릿, 토끼 및 햄스터를 포함한다. 가축 및 사냥 동물은 소, 말, 돼지, 사슴, 들소, 버팔로, 고양이 종, 예를 들어 집고양이, 개 종, 예를 들어 개, 여우, 늑대, 조류 종, 예를 들어 닭, 에뮤, 타조, 및 어류, 예를 들어 송어, 어류 및 연어를 포함한다. 바람직하게는, 대상체는 포유동물, 예를 들어 영장류, 예를 들어 인간이다. 용어 "개체", "환자" 및 "대상체"는 본원에서 상호교환가능하게 사용된다.

바람직하게는, 대상체는 포유동물이다. 포유동물은 인간, 비-인간 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있으나, 이들 예로 제한되지는 않는다. 인간 이외의 포유동물은 통증의 동물 모델을 나타내는 대상체로서 유리하게 사용될 수 있다. 대상체는 남성 또는 여성, 성인 또는 소아일 수 있다.

대상체는 치료를 필요로 하는 상태 또는 이러한 상태와 관련된 1종 이상의 합병증을 앓고 있거나 갖는 것으로 이전에 진단 또는 확인되었고, 임의로 본원에 정의된 바와 같은 상태 또는 상기 상태와 관련된 1종 이상의 합병증에 대해 이미 치료를 받는 대상체일 수 있다. 대안적으로, 대상체는 또한 본원에 정의된 바와 같은 상태 또는 상기 상태와 관련된 1종 이상의 합병증을 갖는 것으로 이전에 진단되지 않은 대상체일 수 있다. 예를 들어, 대상체는 상태 또는 상기 상태와 관련된 1종 이상의 합병증에 대한 하나 이상의 위험 인자를 나타내는 대상체 또는 위험 인자를 나타내지 않는 대상체일 수 있다.

특정한 상태에 대한 치료를 "필요로 하는 대상체"는 그 상태를 갖거나, 그 상태를 갖는 것으로 진단되거나, 또는 그 상태가 발생할 위험이 있는 대상체일 수 있다.

본원에 사용된 용어 "단백질" 및 "폴리펩티드"는 인접한 잔기의 알파-아미노 및 카르복실 기 사이의 펩티드 결합에 의해 서로 연결된 일련의 아미노산 잔기를 지정하기 위해 본원에서 상호교환가능하게 사용된다. 용어 "단백질" 및 "폴리펩티드"는 그의 크기 또는 기능에 상관없이, 변형된 아미노산 (예를 들어, 인산화, 당화, 글리코실화 등) 및 아미노산 유사체를 비롯한 아미노산의 중합체를 지칭한다. "단백질" 및 "폴리펩티드"는 종종 비교적 큰 폴리펩티드와 관련하여 사용되는 반면에, 용어 "펩티드"는 종종 작은 폴리펩티드와 관련하여 사용되지만, 관련 기술분야에서의 이들 용어의 용법은 중복된다. 용어 "단백질" 및 "폴리펩티드"는 유전자 산물 및 그의 단편을 지칭하는 경우에 본원에서 상호교환가능하게 사용된다. 따라서, 예시적인 폴리펩티드 또는 단백질은 유전자 산물, 자연 발생 단백질, 상동체, 오르토로그, 파라로그, 단편 및 상기의 다른 등가물, 변이체, 단편 및 유사체를 포함한다.

폴리펩티드, 예를 들어 융합 폴리펩티드 또는 그의 부분 (예를 들어, 도메인)은 본원에 기재된 서열의 변이체일 수 있다. 바람직하게는, 변이체는 보존적 치환 변이체이다. 본원에서 지칭되는 "변이체"는 천연 또는 참조 폴리펩티드와 실질적으로 상동이지만, 하나 또는 복수의 결실, 삽입 또는 치환으로 인해 천연 또는 참조 폴리펩티드의 것과 상이한 아미노산 서열을 갖는 폴리펩티드이다. 폴리펩티드-코딩 DNA 서열은 천연 또는 참조 DNA 서열에 비해 뉴클레오티드의 하나 이상의 부가, 결실 또는 치환을 포함하지만, 참조 단백질에 비해 관련 생물학적 활성을 보유하는 변이체 단백질 또는 그의 단편, 예를 들어 야생형 참조 단백질의 적어도 50%를 코딩하는 서열을 포함한다. 아미노산 서열에 관하여, 관련 기술분야의 통상의 기술자는 코딩된 서열에서 단일 아미노산 또는 작은 백분율 (즉, 5% 이하, 예를 들어 4% 이하, 또는 3% 이하, 또는 1% 이하)의 아미노산을 변경시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별 치환, 결실 또는 부가가, 변경이 화학적으로 유사한 아미노산으로의 아미노산의 치환을 발생시키는 경우에 "보존적으로 변형된 변이체"라는 것을 인식할 것이다. 일부 변화는 관련 활성을 잠재적으로 개선시켜, 변이체가 보존적이든 아니든 야생형 활성의 100% 초과, 예를 들어 110%, 125%, 150%, 175%, 200%, 500%, 1000% 또는 그 초과를 갖도록 할 수 있는 것으로 고려된다.

소정의 아미노산은 유사한 생리화학적 특징을 갖는 잔기에 의해 대체될 수 있으며, 예를 들어 하나의 지방족 잔기를 또 다른 것으로 치환하거나 (예컨대, 서로 Ile, Val, Leu 또는 Ala), 또는 하나의 극성 잔기를 또 다른 것으로 치환한다 (예컨대, Lys와 Arg; Glu와 Asp; 또는 Gln과 Asn). 다른 이러한 보존적 치환, 예를 들어 유사한 소수성 특징을 갖는 전체 영역의 치환이 공지되어 있다. 보존적 아미노산 치환을 포함하는 폴리펩티드는 천연 또는 참조 폴리펩티드의 목적 활성이 보유됨을 확인하기 위해 본원에 기재된 검정 중 어느 하나에서 시험될 수 있다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표가 관련 기술분야에 널리 공지되어 있다. 이러한 보존적으로 변형된 변이체는 본 개시내용과 일치하는 다형성 변이체, 종간 상동체 및 대립유전자에 부가적이고 이를 배제하지 않는다. 전형적으로 서로에 대한 보존적 치환은 1) 알라닌 (A), 글리신 (G); 2) 아스파르트산 (D), 글루탐산 (E); 3) 아스파라긴 (N), 글루타민 (Q); 4) 아르기닌 (R), 리신 (K); 5)이소류신 (I), 류신 (L), 메티오닌 (M), 발린 (V); 6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W); 7) 세린 (S), 트레오닌 (T); 및 8) 시스테인 (C), 메티오닌 (M)을 포함한다 (예를 들어, 문헌 [Creighton, Proteins (1984)] 참조).

폴리펩티드의 적절한 입체형태를 유지하는 데 수반되지 않는 임의의 시스테인 잔기는 또한 일반적으로 세린으로 치환되어, 분자의 산화 안정성을 개선시키고 이상 가교를 방지할 수 있다. 반대로, 시스테인 결합(들)이 폴리펩티드에 부가되어 그의 안정성을 개선시키거나 또는 올리고머화를 용이하게 할 수 있다.

본원에 기재된 바와 같은 폴리펩티드는 적어도 1개의 펩티드 결합 대체를 포함할 수 있다. 단일 펩티드 결합 또는 다중 펩티드 결합, 예를 들어 2개의 결합, 3개의 결합, 4개의 결합, 5개의 결합, 또는 6개 이상의 결합, 또는 모든 펩티드 결합이 대체될 수 있다. 본원에 기재된 바와 같은 단리된 펩티드는 1가지 유형의 펩티드 결합 대체 또는 다중 유형의 펩티드 결합 대체, 예를 들어 2가지 유형, 3가지 유형, 4가지 유형, 5가지 유형 또는 그 초과의 유형의 펩티드 결합 대체를 포함할 수 있다. 펩티드 결합 대체의 비제한적 예는 우레아, 티오우레아, 카르바메이트, 술포닐 우레아, 트리플루오로에틸아민, 오르토-(아미노알킬)-페닐아세트산, 파라-(아미노알킬)-페닐아세트산, 메타-(아미노알킬)-페닐아세트산, 티오아미드, 테트라졸, 보론산 에스테르, 올레핀계 기 및 그의 유도체를 포함한다.

본원에 기재된 바와 같은 폴리펩티드는 살아있는 유기체에 의해 생산된 폴리펩티드 및/또는 단백질에서 통상적으로 발견되는 자연 발생 아미노산, 예를 들어 Ala (A), Val (V), Leu (L), Ile (I), Pro (P), Phe (F), Trp (W), Met (M), Gly (G), Ser (S), Thr (T), Cys (C), Tyr (Y), Asn (N), Gln (Q), Asp (D), Glu (E), Lys (K), Arg (R), 및 His (H)를 포함할 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 대안적 아미노산을 포함할 수 있다. 대안적 아미노산의 비제한적 예는 D 아미노산, 베타-아미노산, 호모시스테인, 포스포세린, 포스포트레오닌, 포스포티로신, 히드록시프롤린, 감마-카르복시글루타메이트; 히푸르산, 옥타히드로인돌-2-카르복실산, 스타틴, 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산, 페니실라민 (3-메르캅토-D-발린), 오르니틴, 시트룰린, 알파-메틸-알라닌, 파라-벤조일페닐알라닌, 파라아미노페닐알라닌, p-플루오로페닐알라닌, 페닐글리신, 프로파르길글리신, 사르코신 및 tert-부틸글리신), 디아미노부티르산, 7-히드록시-테트라히드로이소퀴놀린 카르복실산, 나프틸알라닌, 비페닐알라닌, 시클로헥실알라닌, 아미노-이소부티르산, 노르발린, 노르류신, tert-류신, 테트라히드로이소퀴놀린 카르복실산, 피페콜산, 페닐글리신, 호모페닐알라닌, 시클로헥실글리신, 데히드로류신, 2,2-디에틸글리신, l-아미노-1-시클로펜탄카르복실산, l-아미노-1-시클로헥산카르복실산, 아미노-벤조산, 아미노-나프토산, 감마-아미노부티르산, 디플루오로페닐알라닌, 니페코트산, 알파아미노 부티르산, 티에닐-알라닌, t-부틸글리신, 트리플루오로발린; 헥사플루오로류신; 플루오린화 유사체; 아지드-변형된 아미노산; 알킨-변형된 아미노산; 시아노-변형된 아미노산; 및 그의 유도체를 포함한다.

폴리펩티드는, 예를 들어 펩티드를 구성하는 아미노산 중 하나 이상에 모이어티를 부가함으로써 변형될 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 1개 이상의 모이어티 분자, 예를 들어 펩티드당 1개 이상의 모이어티 분자, 펩티드당 2개 이상의 모이어티 분자, 펩티드당 5개 이상의 모이어티 분자, 펩티드당 10개 이상의 모이어티 분자 또는 펩티드당 1개 이상의 모이어티 분자를 포함할 수 있다. 본원에 기재된 바와 같은 폴리펩티드는 1가지 이상의 유형의 변형 및/또는 모이어티, 예를 들어 1가지 유형의 변형, 2가지 유형의 변형, 3가지 유형의 변형 또는 더 많은 유형의 변형을 포함할 수 있다. 변형 및/또는 모이어티의 비제한적 예는 PEG화; 글리코실화; HES화; ELP화; 지질화; 아세틸화; 아미드화; 말단-캡핑 변형; 시아노 기; 인산화; 알부민 및 고리화를 포함한다.

원래의 아미노산 서열의 변경은 관련 기술분야의 통상의 기술자에게 공지된 다수의 기술 중 임의의 것에 의해 달성될 수 있다. 아미노산 치환은, 예를 들어 변화될 아미노산을 코딩하는 뉴클레오티드 서열에 코돈 변화를 함유하는 올리고뉴클레오티드를 합성함으로써 특정한 위치에 도입될 수 있고, 이는 원래 서열의 단편에 대한 라이게이션을 허용하는 제한 부위에 의해 플랭킹된다. 라이게이션 후, 생성된 재구성된 서열은 목적하는 아미노산 삽입, 치환 또는 결실을 갖는 유사체를 코딩한다. 대안적으로, 올리고뉴클레오티드-지정 부위-특이적 돌연변이유발 절차를 이용하여, 요구되는 치환, 결실 또는 삽입에 따라 변경된 특정한 코돈을 갖는 변경된 뉴클레오티드 서열을 제공할 수 있다. 이러한 변경을 만드는 기술은 문헌 [Walder et al. (Gene 42:133, 1986); Bauer et al. (Gene 37:73, 1985); Craik (BioTechniques, January 1985, 12-19); Smith et al. (Genetic Engineering: Principles and Methods, Plenum Press, 1981)]; 및 미국 특허 번호 4,518,584 및 4,737,462 (그 전문이 본원에 참조로 포함됨)에 의해 개시된 것들을 포함한다. 본원에 기재된 바와 같은 폴리펩티드는 화학적으로 합성될 수 있고, 돌연변이는 화학적 합성 과정의 일부로서 혼입될 수 있다.

본원에 사용된 용어 "폴리뉴클레오티드", "핵산" 및 "핵산 서열"은 리보핵산, 데옥시리보핵산 또는 그의 유사체의 단위를 포함하는 임의의 분자, 바람직하게는 중합체 분자를 지칭한다. 핵산은 단일-가닥 또는 이중-가닥일 수 있다. 단일-가닥 핵산은 변성된 이중-가닥 DNA의 하나의 핵산 가닥일 수 있다. 대안적으로, 이는 임의의 이중-가닥 DNA로부터 유래되지 않은 단일-가닥 핵산일 수 있다. 한 측면에서, 핵산은 DNA일 수 있다. 또 다른 측면에서, 핵산은 RNA일 수 있다. 핵산 분자는 게놈 DNA 또는 cDNA를 비롯한 DNA이다. 다른 적합한 핵산 분자는 mRNA를 비롯한 RNA이다.

본원에 사용된 용어 "포함하는" 또는 "포함하다"는 방법 또는 조성물에 필수적이지만 필수적이든 그렇지 않든 비명시된 요소의 포함에 대해서도 개방되어 있는 조성물, 방법, 및 그의 각각의 성분(들)과 관련하여 사용된다.

용어 "~로 이루어진"은 본 발명의 상기 설명에서 언급되지 않은 임의의 요소를 배제한 본원에 기재된 바와 같은 조성물, 방법, 및 그의 각각의 성분을 지칭한다.

본원에 사용된 용어 "~로 본질적으로 이루어진"은 주어진 발명에 요구되는 요소를 지칭한다. 상기 용어는 본 발명의 기본적이고 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 요소의 존재를 허용한다.

서열 상동성

전역 방법, 국부 방법 및 하이브리드 방법, 예컨대 예를 들어 분절 접근 방법을 포함하나 이에 제한되지는 않는 임의의 다양한 서열 정렬 방법이 퍼센트 동일성을 결정하는 데 사용될 수 있다. 퍼센트 동일성을 결정하기 위한 프로토콜은 관련 기술분야의 통상의 기술자의 범주 내에 속하는 상용 절차이다. 전역 방법은 분자의 시작부터 끝까지 서열을 정렬하고, 개별 잔기 쌍의 점수를 합산하고 갭 페널티를 부과함으로써 최선의 정렬을 결정한다. 비제한적 방법은, 예를 들어 CLUSTAL W (예를 들어, 문헌 [Julie D. Thompson et al., CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position-Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994)] 참조); 및 반복 정밀화 (예를 들어, 문헌 [Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein. Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. Mol. Biol. 823-838 (1996)] 참조)를 포함한다. 국부 방법은 모든 입력 서열에 의해 공유되는 하나 이상의 보존된 모티프를 확인함으로써 서열을 정렬한다. 비제한적 방법은, 예를 들어 매치-박스(Match-box) (예를 들어, 문헌 [Eric Depiereux and Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501 -509 (1992)] 참조); 깁스(Gibbs) 샘플링 (예를 들어, 문헌 [C. E. Lawrence et al., Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262(5131 ) Science 208-214 (1993)] 참조); 얼라인-M(Align-M) (예를 들어, 문헌 [Ivo Van Walle et al., Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics: 1428-1435 (2004)] 참조)을 포함한다.

따라서, 퍼센트 서열 동일성은 통상적인 방법에 의해 결정된다. 예를 들어, 문헌 [Altschul et al., Bull. Math. Bio. 48: 603-16, 1986 and Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915-19, 1992]을 참조한다. 간략하게, 갭 개방 페널티 10, 갭 연장 페널티 1, 및 하기 제시된 바와 같은 문헌 [Henikoff and Henikoff] (상기 문헌)의 "블로섬(blosum) 62" 점수화 매트릭스 (아미노산은 표준 1-문자 코드로 나타냄)을 사용하여 정렬 점수가 최적화되도록 2개의 아미노산 서열을 정렬한다.

서열 동일성을 결정하기 위한 정렬 점수

BLOSUM62 표

이어서, 퍼센트 동일성을 다음과 같이 계산한다:

실질적으로 상동성인 폴리펩티드는 하나 이상의 아미노산 치환, 결실 또는 부가를 갖는 것을 특징으로 한다. 이들 변화는 바람직하게는 부차적인 성질의 것, 즉 보존적 아미노산 치환 (하기 참조) 및 폴리펩티드의 폴딩 또는 활성에 유의하게 영향을 미치지 않는 다른 치환; 소형 결실, 전형적으로 1 내지 약 30개의 아미노산의 결실; 및 소형 아미노- 또는 카르복실-말단 연장, 예컨대 아미노-말단 메티오닌 잔기, 약 20-25개 이하의 잔기의 소형 링커 펩티드, 또는 친화성 태그이다.

보존적 아미노산 치환

염기성: 아르기닌

리신

히스티딘

산성: 글루탐산

아스파르트산

극성: 글루타민

아스파라긴

소수성: 류신

이소류신

발린

방향족: 페닐알라닌

트립토판

티로신

소형: 글리신

알라닌

세린

트레오닌

메티오닌

20개의 표준 아미노산에 추가로, 비-표준 아미노산 (예컨대, 4-히드록시프롤린, 6-N-메틸 리신, 2-아미노이소부티르산, 이소발린 및 -메틸 세린)이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다. 제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 및 비천연 아미노산이 클로스트리디움 폴리펩티드 아미노산 잔기를 치환할 수 있다. 본 발명의 폴리펩티드는 또한 비-자연 발생 아미노산 잔기를 포함할 수 있다.

비-자연 발생 아미노산은 비제한적으로 트랜스-3-메틸프롤린, 2,4-메타노-프롤린, 시스-4-히드록시프롤린, 트랜스-4-히드록시-프롤린, N-메틸글리신, 알로트레오닌, 메틸-트레오닌, 히드록시-에틸시스테인, 히드록시에틸호모-시스테인, 니트로글루타민, 호모글루타민, 피페콜산, tert-류신, 노르발린, 2-아자페닐알라닌, 3-아자페닐-알라닌, 4-아자페닐-알라닌, 및 4-플루오로페닐알라닌을 포함한다. 비-자연 발생 아미노산 잔기를 단백질 내로 혼입하기 위한 여러 방법이 관련 기술분야에 공지되어 있다. 예를 들어, 화학적으로 아미노아실화된 억제인자 tRNA를 사용하여 넌센스 돌연변이가 억제되는 시험관내 시스템이 사용될 수 있다. 아미노산을 합성하고 tRNA를 아미노아실화시키는 방법이 관련 기술분야에 공지되어 있다. 넌센스 돌연변이를 함유하는 플라스미드의 전사 및 번역은 이. 콜라이 S30 추출물 및 상업적으로 입수가능한 효소 및 다른 시약을 포함하는 무세포 시스템에서 수행된다. 단백질은 크로마토그래피에 의해 정제된다. 예를 들어, 문헌 [Robertson et al., J. Am. Chem. Soc. 113:2722, 1991; Ellman et al., Methods Enzymol. 202:301, 1991; Chung et al., Science 259:806-9, 1993; and Chung et al., Proc. Natl. Acad. Sci. USA 90: 10145-9, 1993]을 참조한다. 제2 방법에서는, 돌연변이된 mRNA 및 화학적으로 아미노아실화된 억제인자 tRNA의 미세주사에 의해 크세노푸스 난모세포에서 번역이 수행된다 (문헌 [Turcatti et al., J. Biol. Chem. 271:19991-8, 1996]). 제3 방법에서는, 이. 콜라이 세포가 대체될 천연 아미노산 (예를 들어, 페닐알라닌)의 부재 하에 및 목적하는 비-자연 발생 아미노산(들) (예를 들어, 2-아자페닐알라닌, 3-아자페닐알라닌, 4-아자페닐알라닌 또는 4-플루오로페닐알라닌)의 존재 하에 배양된다. 비-자연 발생 아미노산이 그의 천연 대응물을 대신하여 폴리펩티드 내로 혼입된다. 문헌 [Koide et al., Biochem. 33:7470-6, 1994]을 참조한다. 자연 발생 아미노산 잔기가 시험관내 화학적 변형에 의해 비-자연 발생 종으로 전환될 수 있다. 화학적 변형을 부위-지정 돌연변이유발과 조합하여 치환 범위를 추가로 확장시킬 수 있다 (문헌 [Wynn and Richards, Protein Sci. 2:395-403, 1993]).

제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 비-자연 발생 아미노산, 및 비천연 아미노산이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다.

본 발명의 폴리펩티드 내의 필수 아미노산은 관련 기술분야에 공지된 절차, 예컨대 부위-지정 돌연변이유발 또는 알라닌 스캐닝 돌연변이유발에 따라 확인될 수 있다 (문헌 [Cunningham and Wells, Science 244: 1081-5, 1989]). 생물학적 상호작용의 부위는 또한, 추정 접촉 부위 아미노산의 돌연변이와 함께 핵 자기 공명, 결정학, 전자 회절 또는 광친화성 표지화와 같은 기술에 의해 결정된 바와 같은, 구조의 물리적 분석에 의해 결정될 수 있다. 예를 들어, 문헌 [de Vos et al., Science 255:306-12, 1992; Smith et al., J. Mol. Biol. 224:899-904, 1992; Wlodaver et al., FEBS Lett. 309:59-64, 1992]을 참조한다. 필수 아미노산의 정체는 또한 본 발명의 폴리펩티드의 관련 성분 (예를 들어, 전위 또는 프로테아제 성분)과의 상동성의 분석으로부터 추론될 수 있다.

다중 아미노산 치환은 공지된 돌연변이유발 및 스크리닝 방법, 예컨대 문헌 [Reidhaar-Olson and Sauer (Science 241 :53-7, 1988) or Bowie and Sauer (Proc. Natl. Acad. Sci. USA 86:2152-6, 1989)]에 개시된 것들을 사용하여 이루어지고 시험될 수 있다. 간략하게, 이들 저자는 폴리펩티드 내의 2개 이상의 위치를 동시에 무작위화하고, 기능적 폴리펩티드에 대해 선택한 후, 돌연변이유발된 폴리펩티드를 서열분석하여 각각의 위치에서 허용되는 치환의 스펙트럼을 결정하는 방법을 개시한다. 사용될 수 있는 다른 방법은 파지 디스플레이 (예를 들어, 문헌 [Lowman et al., Biochem. 30: 10832-7, 1991]; 란더(Ladner) 등, 미국 특허 번호 5,223,409; 휴스(Huse), WIPO 공개공보 WO 92/06204) 및 영역-지정 돌연변이유발 (문헌 [Derbyshire et al., Gene 46:145, 1986; Ner et al., DNA 7:127, 1988])을 포함한다.

하기 실시예는 본 발명을 예시한다.

실시예

2019-nCoV 감염에 대해 보호하기 위한 중화 항체 반응을 유도하기 위해, 2019-nCoV 스파이크 단백질 (S)을 코딩하는 핵산을 이. 콜라이, 효모 및 인간 세포를 비롯한 다양한 발현 시스템에서의 발현을 위해 변형시켰다.

이. 콜라이 시스템에서는 N 및 C 말단 결실된 아미노산 (5-10)을 클로닝하여 코로나바이러스의 천연 입체형태로 S 단백질을 발현 및 재폴딩시키는 한편, 다른 것 (효모 및 인간 세포)은 전체 단백질로서 발현 및 재폴딩시켰다. 코로나바이러스로부터의 S 단백질을 또한 E형 간염 (P239)의 바이러스 유사 입자 및 인간 유두종 바이러스 유사 입자 (18L1)와의 융합 단백질로서 조합하여 발현시켜 면역보호 반응의 효능 및 수명을 증가시켰다.

실시예 1: 이. 콜라이 기반 2019-nCoV 스파이크 단백질 발현

코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-CoV-S, 진뱅크: MN908947.3)을 코돈 최적화를 위해 진아트(Geneart)를 사용하여 이. 콜라이에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 2의 핵산 서열을 설계하기 위한 SacI 및 NotI 단일 클로닝 부위를 함유하였다.

코돈 사용빈도를 에스케리키아 콜라이 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량을 조정하여 (평균 GC 함량 45%) mRNA 반감기를 연장시켰다. 코돈 사용빈도를 이. 콜라이의 편향에 적합화시켜 0.96의 CAI (코돈 적응 지수) 값을 생성하였다. 이. 콜라이에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 2: E형 간염 바이러스-유사 입자 내 2019-nCoV 스파이크 단백질

코로나바이러스 S 단백질의 핵산 서열을 이. 콜라이에서의 발현에 대해 최적화하고, 이를 사용하여 S 단백질을 포함하는 E형 간염 바이러스-유사 입자 (Wuhan-Hu-1-HEV-CoV-S)를 생성하였다.

유전자 합성물을 서열식별번호: 3의 핵산 서열을 설계하기 위한 SacI 및 NotI 단일 클로닝 부위와 함께 진아트에 의해 이. 콜라이에서의 발현에 대해 코돈 최적화하였다.

코돈 사용빈도를 에스케리키아 콜라이 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (46%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 이. 콜라이의 편향에 적합화시켜 0.96의 CAI 값을 생성하였다. 이. 콜라이에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 3: 코마가타엘라 파스토리스 기반 2019-nCoV 스파이크 단백질 발현

코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1 CoV-S)을 코돈 최적화를 위해 진아트를 사용하여 케이. 파스토리스에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 4의 핵산 서열을 설계하기 위한 BstBI-NotI 단일 클로닝 부위를 함유하였다.

코돈 사용빈도를 케이. 파스토리스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (48%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 케이. 파스토리스의 편향에 적합화시켜 0.84의 CAI 값을 생성하였다. 케이. 파스토리스에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 4: 케이. 파스토리스에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현

HPV 18 L1과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HPV18 L1-CoV-S)을 케이. 파스토리스에서의 발현에 대해 최적화하였다. BstBI 및 NotI는 서열식별번호: 5의 핵산 서열을 설계하기 위한 단일 클로닝 부위이다.

실시예 5: 케이. 파스토리스에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현

HPV 16 L1과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HPV16 L1-CoV-S)을 케이. 파스토리스에서의 발현에 대해 최적화하였다. BstBI 및 NotI는 서열식별번호: 6의 핵산 서열을 설계하기 위한 단일 클로닝 부위이다.

코돈 사용빈도를 케이. 파스토리스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (48%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 케이. 파스토리스의 편향에 적합화시켜 0.84의 CAI 값을 생성하였다. 피키아 파스토리스에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 6: 인간 293 F 세포에서의 2019-nCoV 스파이크 단백질의 발현

코로나바이러스 S 단백질 (293 F 세포의 외부 표면에 발현 및 결합된 Wuhan-Hu-1 CoV-S 표면 결합 단백질)의 핵산 서열을 코돈 최적화를 위해 진아트를 사용하여 인간 293 F 세포에서의 발현에 대해 최적화하였고, 이는 서열식별번호: 7의 핵산 서열을 설계하기 위한 NheI-NotI 단일 클로닝 부위를 함유하였다.

코돈 사용빈도를 호모 사피엔스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (56%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 호모 사피엔스의 편향에 적합화시켜 0.94의 CAI 값을 생성하였다. 인간 세포에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 7: 293 F 세포에서의 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현

B형 간염 표면 항원과의 융합 단백질로서 코로나바이러스 S 단백질의 핵산 서열 (Wuhan-Hu-1-HBSAg-CoV-S)을 293 F 세포에서의 발현에 대해 최적화하였다. 서열은 서열식별번호: 8의 핵산 서열을 설계하기 위한 NheI-NotI 단일 클로닝 부위를 함유한다.

코돈 사용빈도를 호모 사피엔스 유전자의 코돈 편향에 적합화시켰다. 또한, 가능한 경우에 매우 높은 (>80%) 또는 매우 낮은 (<30%) GC 함량의 영역을 피하였다. 발현에 부정적으로 영향을 미칠 수 있는 음성 시스-작용성 부위 (예컨대, 스플라이스 부위, TATA-박스 등)는 가능한 한 제거하였다. GC 함량 (56%)을 조정하여 mRNA 반감기를 연장시켰다. 코돈 사용빈도를 호모 사피엔스의 편향에 적합화시켜 0.94의 CAI* (코돈 적응 지수) 값을 생성하였다. 인간 세포에서 높고 안정한 발현 속도를 허용하는 최적화된 유전자가 설계되었다.

실시예 8: 수산화알루미늄 및 인산알루미늄 겔을 사용한 2019-nCoV 스파이크 단백질의 아주반트화

실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 0.5 mg의 수산화알루미늄 및 인산알루미늄 겔에 흡착시켰다.

실시예 9: 모노포스포릴 지질 및 수산화알루미늄을 사용한 2019-nCoV 스파이크 단백질의 아주반트화

실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 모노포스포릴 지질 (MPL) 및 수산화알루미늄에서 혼합하였다.

실시예 10: MF59를 사용한 2019-nCoV 스파이크 단백질의 아주반트화

실시예 1, 3 및 6의 2019-nCoV 스파이크 단백질 및 그의 융합 단백질을 아주반트화를 위해 MF59 (5% 스쿠알렌)에서 혼합하였다.

실시예 11: 2019-nCoV 스파이크 단백질로 면역화된 마우스에서의 항체 반응의 생성

아주반트 없이 실시예 2, 4, 5 및 7의 2019-CoV 스파이크 단백질 및 그의 융합 단백질을 포함하는 제제 및 실시예 1, 3 및 6의 아주반트화된 제제의 면역원성을 BALB/c 마우스 (군 당 5마리의 마우스)에서 시험하였다. 제0일 및 제7일에 투여당 2 μg 항원으로 백신접종을 수행하였다. 제0일 및 제14일에 혈청 샘플을 간접 ELISA에 의해 혈청 음성 (제0일) 및 S 단백질에 대한 항체 반응 (제14일)에 대해 시험하였다. 제14일에 모든 제제는 높은 항체 역가를 유도하였지만, 아주반트화된 것은 최대 반응을 유도하였다 (도 2).

실시예 12: HEK 세포 (293F)에서의 HBSAg-(EAAAK)₃-RBD 융합 단백질의 발현

서열식별번호: 28의 HBSAg-(EAAAK)₃-RBD 융합 단백질을 서열식별번호: 27의 코돈-최적화된 핵산 서열을 사용하여 HEK 세포에서 발현시켰다. 간략하게, HBSAg-(EAAAK)₃-RBD 유전자를 인간 세포 (293F) 발현에 대해 최적화하고, Nhe-NotI를 사용하여 pcDNA3.1(+) 내로 클로닝하고, 클론 선택 후 현탁 배양물 중 293F 세포 내로 형질감염시켰다. 분비된 HBSAg-(EAAAK)₃-RBD 융합 단백질을 40시간 후에 수거하였다.

2019-nCoV 스파이크 단백질에 대한 폴리클로날 항체 (1:250) 및 HBSAg에 대한 마우스 모노클로날 항체 (1:1,000)를 사용한 웨스턴 블롯팅은 2개의 개별 배양물 - #2A 및 #2B에서 HEK 세포에 의한 융합 단백질의 강한 분비를 입증하였다 (도 3).

실시예 13: HEK 세포에서 HBSAg-(EAAAK)₃-RBD 융합체로 면역화된 마우스에서의 항체 반응의 생성

실시예 12로부터의 HBSAg-(EAAAK)₃-RBD (#2A)를 4000 rpm x 40분으로 회전하는 3K 아미콘 15 ml 원심분리 필터 장치를 통해 농축시켰다.

이어서, Balb/c 마우스를 (i) 50 μg/용량 (100 μl); 또는 (ii) 1:1 v/v 비의 수산화알루미늄 또는 아다박스™와 함께 50 μg/용량 (70 μl) (투여된 총 부피 = 140 μl)을 사용하여 면역화시켰다. 마우스를 제0일에 백신으로 프라이밍한 후, 제7일에 제1 부스팅, 제14일에 제2 부스팅 (분석을 위해 채혈) 및 제28일에 제3 부스팅하였다. 분석을 위한 최종 채혈을 제42일에 수행하였다. 실험군을 하기 표 1에 나타냈다.

표 1: HBSAg-(EAAAK)₃-RBD로 면역화된 마우스에 대한 실험군

ELISA를 사용하여 제14일 및 제42일에 항체 역가를 평가하였다. 도 4에 도시된 바와 같이, HBSAg-(EAAAK)₃-RBD의 VLP는 제14일 및 제42일에 유의한 IgG 역가를 달성할 수 있었고, 보다 높은 역가는 제42일에 관찰되었다. 아주반트 (수산화알루미늄 또는 아다박스™)와 함께 투여는 또한 도 4에 도시된 바와 같이 역가를 추가로 증가시켰다.

중화 검정은 또한 HBSAg-(EAAAK)₃-RBD (단독으로 또는 수산화알루미늄 또는 아다박스™와 함께)의 VLP로 면역화된 마우스를 사용하여 수행하였다. 결과를 하기 표 2에 나타냈다. 평균 중화 역가는 1:1,200-1:2,700이었다. 달성된 최고 역가는 1:5,120이었고, 최저는 1:640이었다.

표 2: HBSAg-EAAAK₃-RBD를 사용한 중화 검정의 결과

실시예 14: 이. 콜라이에서의 HEV-(GGGGS)_3-RBD 융합체의 발현

서열식별번호: 31의 HEV-(GGGGS)₃-RBD 융합 단백질을 이. 콜라이에서의 발현에 대해 코돈-최적화된 서열식별번호: 30의 핵산 서열을 사용하여 이. 콜라이에서 발현시켰다. 상기 핵산 서열을 SacI-NotI를 사용하여 pET26(+) 내로 클로닝하였다. 양성 클론을 선택하고 (#10), BL21에서 발현시켰다. 3종의 상이한 양성 콜로니 (#10A, #10B 및 #10C)를 단백질 발현에 대해 스크리닝하고, #10A, #10B 및 #10C 모두에 대해 IPTG 유도 (6시간)를 사용하여 HEV-RBD 발현을 평가하였다. HEV에 대한 항체를 사용하는 웨스턴 블롯팅을 이용하여 #10A, #10B 및 #10C 모두에서 융합 단백질 발현을 확인하였다 (도 5). 클론 #10B를 추가 조사를 위해 선택하고, 결합 완충제로서 pH 7.2의 50 mM 포스페이트 완충제를 사용하는 음이온 교환 크로마토그래피를 사용하여 정제하였다 (데이터는 제시되지 않음).

실시예 15: 이. 콜라이에서 생산된 HEV-(GGGGS)₃-RBD 융합 단백질로 면역화된 마우스에서의 항체 반응의 생성

Balb/c 마우스를 실시예 14로부터의 HEV-(GGGGS)₃-RBD (#10B)를 50 μg/용량으로 사용하여 1:1 v/v 비의 수산화알루미늄 또는 아다박스™ (투여된 총 부피= 100 μl)와 함께 면역화시켰다. 마우스를 제0일에 백신으로 프라이밍한 후, 제7일에 제1 부스팅, 제14일에 제2 부스팅 (분석을 위해 채혈) 및 제28일에 제3 부스팅하였다. 분석을 위한 최종 채혈을 제42일에 수행하였다. 실험군을 하기 표 3에 나타냈다.

표 3: HEV-(GGGGS)₃-RBD로 면역화된 마우스에 대한 실험군

ELISA를 사용하여 제14일 및 제42일에 항체 역가를 평가하였다. HEV-(GGGGS)₃-RBD의 VLP는 제14일 및 제42일에 유의한 중화 역가를 달성할 수 있었고, 보다 높은 역가는 제42일에 관찰되었다. 아주반트 (수산화알루미늄 또는 아다박스(™))와 함께 투여는 도 6에 도시된 바와 같이 역가를 추가로 증가시켰다.

실시예 16: HEK 293 세포에서 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질을 포함하는 융합 단백질의 발현

서열식별번호: 33의 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질 융합 단백질 (HBSAg-(EAAAK)_3-CoV-s)을 서열식별번호: 32의 코돈-최적화된 핵산 서열을 사용하여 HEK 세포에서 발현시켰다. 간략하게, HBSAg-(EAAAK)_3-CoV-s를 인간 세포 (293F) 발현에 대해 최적화하고, 클론 선택 후 현탁 배양물 중 293F 세포 내로 형질감염시켰다. 분비된 HBSAg-(EAAAK)_3-CoV-s를 40시간 후에 수거하였다.

정제된 재조합 단백질 HBSAg-Co-V-s의 2종의 상이한 클론인 D8-SA01-01-01 (4x) 및 D8-SA01-02-01 (5x)을 1:250 희석으로 사용된 토끼 COVID-19 스파이크 단백질 폴리클로날 항체 (마이 바이오소스(My Biosource), MBS434243)를 사용하여 웨스턴 블롯에 의해 분석하였다. 도 7에 도시된 바와 같이, 두 클론은 모두 예상된 크기의 예리하고 고도로 발현된 밴드를 생성하였고, 이는 융합 단백질의 강한 발현을 나타낸다.

서열 정보

서열식별번호: 1 - 2019-nCoV 스파이크 단백질 아미노산 서열

스파이크 단백질의 RDB 도메인 (잔기 319 내지 529)은 밑줄표시됨.

서열식별번호: 2 - 2019-nCoV 스파이크 단백질 핵산 서열 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 1에 기재됨

5' SacI 단일 클로닝 부위는 단일-밑줄표시됨

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

ATG 개시 코돈은 볼드체 및 이탤릭체임

서열식별번호: 2의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함

서열식별번호: 3 - 융합 단백질 HEV-2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 2에 기재됨

5' SacI 단일 클로닝 부위는 단일-밑줄표시됨

HEV (p239 단편) 서열은 대문자로 나타냄

2019-nCoV 스파이크 단백질 코딩 서열은 소문자로 나타냄

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

서열식별번호: 4 - 2019-nCoV 스파이크 단백질 핵산 서열 - 코마가타엘라 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 3에 기재됨

5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

5' BstBI 바로 다음은 ACG 코돈임 (코딩 서열이 ACG 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.

서열식별번호: 4의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함

서열식별번호: 5 - 융합 단백질 HPV18L1/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 4에 기재됨

5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨

HPV18L1 서열은 소문자로 나타냄

2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

서열식별번호: 6 - 융합 단백질 HPV16L1/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 케이. 파스토리스에서의 발현에 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 5에 기재됨

5' BstBI 단일 클로닝 부위는 단일-밑줄표시됨

HPV16L1 서열은 소문자로 나타냄

2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

서열식별번호: 7 - 2019-nCoV 스파이크 단백질 핵산 서열 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 6에 기재됨

5' NheI 단일 클로닝 부위는 단일-밑줄표시됨

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

5' NheI 바로 다음은 GAC 코돈임 (코딩 서열이 GAC 바로 다음인 ATG 개시 코돈과 인-프레임일 필요가 있음). 이들 2개의 코돈은 볼드체로 이탤릭체로 나타냄.

서열식별번호: 7의 핵산 서열을 번역하여 서열식별번호: 1의 천연 2019-nCoV 스파이크 단백질을 제공함

서열식별번호: 8- 융합 단백질 HBSAg/2019-nCoV 스파이크 단백질을 코딩하는 핵산 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 7에 기재됨

5' NheI 단일 클로닝 부위는 단일-밑줄표시됨

HSBAg 서열은 소문자로 나타냄

2019-nCoV 스파이크 단백질 코딩 서열은 대문자로 나타냄

3' NotI 단일 클로닝 부위는 파선-밑줄표시됨

서열식별번호: 9 - 서열식별번호: 3에 상응하는 아미노산 서열

(융합 단백질 HEV-2019-nCoV 스파이크 단백질 - 이. 콜라이에서의 발현에 대해 최적화되고, SacI 및 NotI 단일 클로닝 부위를 함유함. 실시예 2에 기재됨)

서열식별번호: 10 - 서열식별번호: 5에 상응하는 아미노산 서열

(융합 단백질 HPV18L1/2019-nCoV 스파이크 단백질 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 4에 기재됨)

서열식별번호: 11 - 서열식별번호: 6에 상응하는 아미노산 서열

(융합 단백질 HPV16L1/2019-nCoV 스파이크 단백질 - 케이. 파스토리스에서의 발현에 대해 최적화되고, BstB1 및 NotI 단일 클로닝 부위를 함유함. 실시예 5에 기재됨)

서열식별번호: 12 - 서열식별번호: 8에 상응하는 아미노산 서열

(융합 단백질 HBSAg/2019-nCoV 스파이크 단백질 - 인간 (293F)에서의 발현에 대해 최적화되고, NheI 및 NotI 단일 클로닝 부위를 함유함. 실시예 7에 기재됨)

서열식별번호: 13 - RBD 2019-nCoV 스파이크 단백질 핵산 서열

개시 ATG (볼드체) 앞에 부가된 KOZAC 서열 (gcc acc, 밑줄표시됨).

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨) - 상기 tga taa 서열은 단백질 합성을 방해하여 세포외 배지로의 분비를 용이하게 하는 "2개의 정지 코돈" 모티프임 (또한 하기 기재된 바와 같은 다른 서열에 포함됨).

고유한 제한 부위는 각각 5' 말단에 NheI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)

서열식별번호: 14 - RBD 2019-nCoV 스파이크 단백질 핵산 서열 - 293F (HEK) 세포 발현에 대해 인간 코돈 최적화됨.

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)

서열식별번호: 15 - 서열식별번호: 13 및 14에 상응하는 RBD 2019-nCoV 스파이크 단백질 아미노산 서열

서열식별번호: 16 - 강성 EAAAK 링커 컨센서스 아미노산 서열

A(EAAAK)_nA (n = 2-5)

서열식별번호: 17 - 강성 (EAAAK)₃ 링커 핵산 서열

GAA GCC GCC GCT AAA GAG GCC GCT GCC AAA GAA GCT GCT GCT AAG

서열식별번호: 18 - 강성 (EAAAK)₃ 링커 아미노산 서열

EAAAKEAAAKEAAAK

서열식별번호: 19 - 가요성 GS_n 링커 컨센서스 아미노산 서열

(Gly-Gly-Gly-Gly-Ser)_n(n=1-6)

서열식별번호: 20 - 가요성 GS5 ((GGGGS)₁) 링커 아미노산 서열

GGGGS

서열식별번호: 21 - 가요성 GS10 ((GGGGS)₂) 링커 아미노산 서열

GGGGSGGGGS

서열식별번호: 22 - 가요성 GS15 링커 핵산 서열

GGT GGT GGT GGT AGC GGT GGT GGC GGT TCA GGT GGC GGT GGT TCA

서열식별번호: 23 - 가요성 GS15 ((GGGGS)₃) 링커 아미노산 서열

GGGGSGGGGSGGGGS

서열식별번호: 24 - 가요성 GS20 ((GGGGS)₄) 링커 아미노산 서열

GGGGSGGGGSGGGGSGGGGS

서열식별번호: 25 - 가요성 GS25 ((GGGGS)₅) 링커 아미노산 서열

GGGGSGGGGSGGGGSGGGGSGGGGS

서열식별번호: 26 - HBSAg-(EAAAK)₃-RBD 핵산 서열

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)

볼드체 및 점선 밑줄표시된 서열은 (EAAAK)₃ 링커에 상응함.

서열식별번호: 27 - 293f (HEK) 세포 발현에 대해 인간 코돈 최적화된 HBSAg-(EAAAK)₃-RBD 핵산 서열

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)

볼드체 및 점선 밑줄표시된 서열은 (EAAAK)₃ 링커에 상응함.

서열식별번호: 28 - 서열식별번호: 26 및 27에 상응하는 HBSAg-(EAAAK)₃-RBD 아미노산 서열

(EAAAK)₃ 링커는 밑줄표시됨.

서열식별번호: 29 - HEV-GS15-RBD 핵산 서열

개시 ATG (볼드체)

고유한 제한 부위는 각각 5' 말단에 SacI 및 3' 말단에 NotI가 부가됨 (파선 밑줄표시됨)

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)

볼드체 및 점선 밑줄표시된 서열은 GS15 링커에 상응함.

서열식별번호: 30 - 이. 콜라이 발현에 대해 최적화된 HEV-GS15-RBD 핵산 서열

개시 ATG (볼드체)

NotI 앞에 부가된 분비형 tga taa (이중 밑줄표시됨)

볼드체 및 점선 밑줄표시된 서열은 GS15 링커에 상응함.

서열식별번호: 31 - 서열식별번호: 29 및 30에 상응하는 HEV-GS15-RBD 아미노산 서열

GS15 링커는 밑줄표시됨

서열식별번호: 32 - 293f (HEK) 세포 발현에 대해 인간 코돈 최적화된 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질 핵산 서열

볼드체 및 점선 밑줄표시된 서열은 (EAAAK)₃ 링커에 상응함.

서열식별번호: 33 - 서열식별번호: 32에 상응하는 HBSAg-(EAAAK)₃-전장 2019-nCoV 스파이크 단백질 아미노산 서열

(EAAAK)₃ 링커는 밑줄표시됨

SEQUENCE LISTING <110> Vaxbio Ltd. <120> VACCINE <130> P66542WO <150> GB 2002166.3 <151> 2020-02-17 <160> 33 <170> PatentIn version 3.5 <210> 1 <211> 1273 <212> PRT <213> SARS-CoV-2 <400> 1 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1010 1015 1020 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1025 1030 1035 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1040 1045 1050 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1055 1060 1065 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1070 1075 1080 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1085 1090 1095 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1100 1105 1110 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1115 1120 1125 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1130 1135 1140 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1145 1150 1155 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1160 1165 1170 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1175 1180 1185 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1190 1195 1200 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1205 1210 1215 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1220 1225 1230 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1250 1255 1260 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 2 <211> 3839 <212> DNA <213> Artificial Sequence <220> <223> SARS-CoV2 spike protein nucleic acid - optimised for E. coli expression <400> 2 gagctcatgt ttgtttttct ggttctgctg ccgctggtta gcagccagtg tgttaatctg 60 accacacgta cccagctgcc tccggcatat accaatagct ttacccgtgg tgtttattat 120 ccggacaaag tttttcgtag cagcgttctg catagcaccc aggacctgtt tctgccgttt 180 tttagcaatg ttacctggtt tcatgccatt catgttagcg gcaccaatgg caccaaacgt 240 tttgataatc cggtgctgcc gtttaatgat ggtgtgtatt ttgcaagcac cgaaaaaagc 300 aacattattc gcggttggat ttttggtaca accctggata gcaaaaccca gagcctgctg 360 attgttaata atgccaccaa tgtggtgatc aaagtgtgcg aatttcagtt ttgcaatgat 420 ccgtttctgg gcgtgtatta ccacaaaaat aacaagagct ggatggaaag cgaatttcgt 480 gtttatagca gcgccaataa ttgcaccttt gaatatgtta gccagccgtt tctgatggat 540 ctggaaggta aacagggtaa ctttaaaaac ctgcgcgagt tcgtgttcaa aaacatcgat 600 ggttacttca aaatctatag caaacacacc ccgattaatc tggttcgtga tctgccgcag 660 ggttttagcg cactggaacc gctggttgat ctgccaattg gtattaacat tacccgtttt 720 cagaccctgc tggcactgca tcgtagctat ctgacaccgg gtgatagcag cagcggttgg 780 accgcaggcg cagcagcata ttatgttggt tatctgcagc ctcgtacctt tctgctgaaa 840 tataacgaaa atggcacaat taccgatgcc gttgattgtg ccctggatcc gctgagcgaa 900 accaaatgta ccctgaaaag ctttaccgtt gagaaaggta tttatcagac cagcaatttt 960 cgtgtgcagc cgaccgaaag cattgttcgt tttccgaata tcaccaatct gtgtccgttt 1020 ggcgaagttt ttaatgcaac ccgttttgcc agcgtttatg catggaatcg taaacgtatt 1080 agcaattgcg ttgccgatta tagcgttctg tataatagcg caagcttcag cacctttaaa 1140 tgctatggtg ttagcccgac caaactgaat gatctgtgtt ttaccaatgt gtatgccgat 1200 agctttgtga ttcgtggtga tgaagttcgt cagattgcac cgggtcagac cggtaaaatt 1260 gcagattata actataaact gccggatgat tttacgggtt gtgttattgc ctggaatagc 1320 aataatctgg acagcaaagt tggtggcaac tataactatc tgtatcgcct gtttcgtaag 1380 agcaatctga aaccgtttga acgtgatatt agcaccgaga tttatcaggc aggtagcacc 1440 ccgtgtaatg gtgttgaagg ttttaattgc tattttccgc tgcagagcta tggttttcag 1500 ccgacaaatg gtgtgggtta tcagccgtat cgtgttgttg ttctgtcatt tgaactgctg 1560 catgcaccgg caaccgtttg tggtccgaaa aaaagtacca atctggtgaa aaataagtgc 1620 gtgaacttta actttaatgg tctgaccggc accggtgttc tgaccgaaag taacaaaaaa 1680 ttcctgccgt ttcagcagtt tggccgtgat attgcagata ccaccgatgc agttcgcgat 1740 ccgcagacac tggaaattct ggatattacc ccgtgcagct ttggtggtgt ttcagttatt 1800 acaccgggta caaataccag caatcaggtt gcagttctgt atcaggatgt taattgtacc 1860 gaagttccgg ttgcaattca tgcagatcag ctgaccccga cctggcgtgt gtatagcacc 1920 ggtagcaatg tgtttcagac acgtgcaggt tgtctgattg gtgcagaaca tgtgaataat 1980 agctatgaat gcgatattcc gattggtgcg ggtatttgtg ccagctatca gacccagacc 2040 aatagtccgc gtcgtgcacg tagcgttgca agccagagca ttattgccta taccatgagc 2100 ctgggtgcag aaaatagcgt tgcctatagt aataacagca ttgccattcc gaccaacttt 2160 accattagcg ttaccaccga aattctgccg gttagcatga ccaaaaccag cgttgattgc 2220 accatgtata tttgtggtga tagtaccgaa tgtagcaatc tgctgctgca gtatggtagc 2280 ttttgcaccc agctgaatcg tgcactgacc ggtattgcag ttgaacagga taaaaacacg 2340 caagaagttt ttgcacaggt caagcagatc tataaaaccc ctccgattaa agattttggc 2400 ggtttcaatt ttagccagat cctgccggat ccgagcaaac cgagtaaacg tagctttatt 2460 gaagatctgc tgttcaacaa agtgaccctg gcagatgcag gttttatcaa acagtatggt 2520 gattgcctgg gcgatattgc cgcacgtgat ctgatttgtg cacagaaatt taacggcctg 2580 accgttctgc ctccgctgct gaccgatgaa atgattgcac agtataccag cgcactgctg 2640 gcaggcacca ttaccagtgg ttggaccttt ggtgccggtg ccgcactgca gattccgttt 2700 gcaatgcaga tggcatatcg ttttaatggt attggtgtta cccagaacgt gctgtatgaa 2760 aaccagaaac tgattgccaa ccagtttaat agcgccattg gcaaaattca ggatagcctg 2820 agcagcaccg caagtgcact gggtaaactg caggacgttg ttaatcagaa tgcacaggca 2880 ctgaataccc tggttaaaca gctgagcagt aattttggtg caatttcaag cgtgctgaac 2940 gatattctga gccgtctgga taaagttgaa gcagaagttc agattgatcg tctgattacc 3000 ggtcgtctgc aaagcctgca gacctatgtg acccagcagc tgattcgcgc agcagaaatt 3060 cgtgcaagcg caaatctggc agccaccaaa atgagcgaat gtgttctggg tcagagcaaa 3120 cgtgttgatt tttgcggcaa aggttatcac ctgatgagct ttccgcagag cgcaccgcat 3180 ggtgttgtgt ttctgcatgt tacctatgtt ccggcacaag aaaaaaactt tacaaccgct 3240 ccggcaattt gccatgatgg taaagcacat tttccgcgtg aaggtgtttt tgttagtaat 3300 ggcacccatt ggtttgttac acagcgcaac ttttatgaac cgcagattat tacaaccgac 3360 aacacctttg ttagcggtaa ctgtgatgtt gtgattggca ttgtgaataa caccgtttat 3420 gatccactgc agccggaact ggatagcttt aaagaagaac tggacaaata tttcaaaaac 3480 cacaccagtc cggatgttga tctgggtgat atttcaggta ttaatgccag cgtggtgaac 3540 atccagaaag aaattgatcg cctgaatgaa gtggccaaaa atctgaatga aagcctgatt 3600 gatctgcaag aactggggaa atatgagcag tatatcaaat ggccgtggta tatttggctg 3660 ggttttattg caggcctgat tgcaattgtt atggtgacca ttatgctgtg ttgtatgacc 3720 agctgttgta gctgtctgaa aggttgttgc agctgcggta gctgttgcaa atttgatgaa 3780 gatgatagcg aaccggtgct gaaaggtgtt aaactgcatt atacctaatg agcggccgc 3839 <210> 3 <211> 4556 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding for fusion protein HEV-SARS-CoV-2 spike protein- optimised for expression in E. coli <400> 3 gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgttagg tggtctgccg 60 accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120 aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180 attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240 aatcagcatg aacaggatcg tccgacaccg agtccggcac cgagccgtcc gtttagcgtt 300 ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360 tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420 accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480 ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540 ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600 gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660 accaccagtt taggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720 agcgcatttg tttttctggt tctgctgccg ctggttagca gccagtgtgt taatctgacc 780 acacgtaccc agctgcctcc ggcatatacc aatagcttta cccgtggtgt ttattatccg 840 gacaaagttt ttcgtagcag cgttctgcat agcacccagg acctgtttct gccgtttttt 900 agcaatgtta cctggtttca tgccattcat gttagcggca ccaatggcac caaacgtttt 960 gataatccgg tgctgccgtt taatgatggt gtgtattttg caagcaccga aaaaagcaac 1020 attattcgcg gttggatttt tggtacaacc ctggatagca aaacccagag cctgctgatt 1080 gttaataatg ccaccaatgt ggtgatcaaa gtgtgcgaat ttcagttttg caatgatccg 1140 tttctgggcg tgtattacca caaaaataac aagagctgga tggaaagcga atttcgtgtt 1200 tatagcagcg ccaataattg cacctttgaa tatgttagcc agccgtttct gatggatctg 1260 gaaggtaaac agggtaactt taaaaacctg cgcgagttcg tgttcaaaaa catcgatggt 1320 tacttcaaaa tctatagcaa acacaccccg attaatctgg ttcgtgatct gccgcagggt 1380 tttagcgcac tggaaccgct ggttgatctg ccaattggta ttaacattac ccgttttcag 1440 accctgctgg cactgcatcg tagctatctg acaccgggtg atagcagcag cggttggacc 1500 gcaggcgcag cagcatatta tgttggttat ctgcagcctc gtacctttct gctgaaatat 1560 aacgaaaatg gcacaattac cgatgccgtt gattgtgccc tggatccgct gagcgaaacc 1620 aaatgtaccc tgaaaagctt taccgttgag aaaggtattt atcagaccag caattttcgt 1680 gtgcagccga ccgaaagcat tgttcgtttt ccgaatatca ccaatctgtg tccgtttggc 1740 gaagttttta atgcaacccg ttttgccagc gtttatgcat ggaatcgtaa acgtattagc 1800 aattgcgttg ccgattatag cgttctgtat aatagcgcaa gcttcagcac ctttaaatgc 1860 tatggtgtta gcccgaccaa actgaatgat ctgtgtttta ccaatgtgta tgccgatagc 1920 tttgtgattc gtggtgatga agttcgtcag attgcaccgg gtcagaccgg taaaattgca 1980 gattataact ataaactgcc ggatgatttt acgggttgtg ttattgcctg gaatagcaat 2040 aatctggaca gcaaagttgg tggcaactat aactatctgt atcgcctgtt tcgtaagagc 2100 aatctgaaac cgtttgaacg tgatattagc accgagattt atcaggcagg tagcaccccg 2160 tgtaatggtg ttgaaggttt taattgctat tttccgctgc agagctatgg ttttcagccg 2220 acaaatggtg tgggttatca gccgtatcgt gttgttgttc tgtcatttga actgctgcat 2280 gcaccggcaa ccgtttgtgg tccgaaaaaa agtaccaatc tggtgaaaaa taagtgcgtg 2340 aactttaact ttaatggtct gaccggcacc ggtgttctga ccgaaagtaa caaaaaattc 2400 ctgccgtttc agcagtttgg ccgtgatatt gcagatacca ccgatgcagt tcgcgatccg 2460 cagacactgg aaattctgga tattaccccg tgcagctttg gtggtgtttc agttattaca 2520 ccgggtacaa ataccagcaa tcaggttgca gttctgtatc aggatgttaa ttgtaccgaa 2580 gttccggttg caattcatgc agatcagctg accccgacct ggcgtgtgta tagcaccggt 2640 agcaatgtgt ttcagacacg tgcaggttgt ctgattggtg cagaacatgt gaataatagc 2700 tatgaatgcg atattccgat tggtgcgggt atttgtgcca gctatcagac ccagaccaat 2760 agtccgcgtc gtgcacgtag cgttgcaagc cagagcatta ttgcctatac catgagcctg 2820 ggtgcagaaa atagcgttgc ctatagtaat aacagcattg ccattccgac caactttacc 2880 attagcgtta ccaccgaaat tctgccggtt agcatgacca aaaccagcgt tgattgcacc 2940 atgtatattt gtggtgatag taccgaatgt agcaatctgc tgctgcagta tggtagcttt 3000 tgcacccagc tgaatcgtgc actgaccggt attgcagttg aacaggataa aaacacgcaa 3060 gaagtttttg cacaggtcaa gcagatctat aaaacccctc cgattaaaga ttttggcggt 3120 ttcaatttta gccagatcct gccggatccg agcaaaccga gtaaacgtag ctttattgaa 3180 gatctgctgt tcaacaaagt gaccctggca gatgcaggtt ttatcaaaca gtatggtgat 3240 tgcctgggcg atattgccgc acgtgatctg atttgtgcac agaaatttaa cggcctgacc 3300 gttctgcctc cgctgctgac cgatgaaatg attgcacagt ataccagcgc actgctggca 3360 ggcaccatta ccagtggttg gacctttggt gccggtgccg cactgcagat tccgtttgca 3420 atgcagatgg catatcgttt taatggtatt ggtgttaccc agaacgtgct gtatgaaaac 3480 cagaaactga ttgccaacca gtttaatagc gccattggca aaattcagga tagcctgagc 3540 agcaccgcaa gtgcactggg taaactgcag gacgttgtta atcagaatgc acaggcactg 3600 aataccctgg ttaaacagct gagcagtaat tttggtgcaa tttcaagcgt gctgaacgat 3660 attctgagcc gtctggataa agttgaagca gaagttcaga ttgatcgtct gattaccggt 3720 cgtctgcaaa gcctgcagac ctatgtgacc cagcagctga ttcgcgcagc agaaattcgt 3780 gcaagcgcaa atctggcagc caccaaaatg agcgaatgtg ttctgggtca gagcaaacgt 3840 gttgattttt gcggcaaagg ttatcacctg atgagctttc cgcagagcgc accgcatggt 3900 gttgtgtttc tgcatgttac ctatgttccg gcacaagaaa aaaactttac aaccgctccg 3960 gcaatttgcc atgatggtaa agcacatttt ccgcgtgaag gtgtttttgt tagtaatggc 4020 acccattggt ttgttacaca gcgcaacttt tatgaaccgc agattattac aaccgacaac 4080 acctttgtta gcggtaactg tgatgttgtg attggcattg tgaataacac cgtttatgat 4140 ccactgcagc cggaactgga tagctttaaa gaagaactgg acaaatattt caaaaaccac 4200 accagtccgg atgttgatct gggtgatatt tcaggtatta atgccagcgt ggtgaacatc 4260 cagaaagaaa ttgatcgcct gaatgaagtg gccaaaaatc tgaatgaaag cctgattgat 4320 ctgcaagaac tggggaaata tgagcagtat atcaaatggc cgtggtatat ttggctgggt 4380 tttattgcag gcctgattgc aattgttatg gtgaccatta tgctgtgttg tatgaccagc 4440 tgttgtagct gtctgaaagg ttgttgcagc tgcggtagct gttgcaaatt tgatgaagat 4500 gatagcgaac cggtgctgaa aggtgttaaa ctgcattata cctaatgagc ggccgc 4556 <210> 4 <211> 3839 <212> DNA <213> Artificial Sequence <220> <223> SARS-CoV-2 spike protein nucleic acid sequence - optimised for expression in Komagataella pastoris <400> 4 ttcgaaacga tgttcgtgtt cttggtcctg ttgccattgg tttcttccca gtgtgttaac 60 ctgaccacta gaactcaatt gcctccagcc tacaccaatt ccttcaccag aggtgtttac 120 tacccagaca aggtgttcag atcttccgtc ttgcactcca ctcaggactt gttcttgcca 180 ttcttctcca acgttacctg gttccacgct attcacgttt ccggaactaa cggtactaag 240 agattcgaca acccagtcct gccattcaac gatggtgtct acttcgcttc taccgagaag 300 tccaacatca tcagaggttg gatcttcggt actaccctgg actctaagac tcagtccttg 360 ctgatcgtta acaacgccac caacgttgtc atcaaggttt gcgagttcca gttctgcaac 420 gacccattct tgggtgtgta ctaccacaag aacaacaagt cttggatgga atccgagttc 480 agagtttact cctccgccaa caactgtacc ttcgagtacg tttcccagcc attcttgatg 540 gacttggagg gtaagcaggg taacttcaag aacctgagag agttcgtttt caagaacatc 600 gacggttact tcaagatcta ctccaagcac accccaatca acctggttag agatttgcca 660 caaggtttct ccgctttgga gcctttggtt gacttgccaa tcggtatcaa catcaccaga 720 ttccagacct tgttggcctt gcacagatcc tacttgactc caggtgattc ttcttccggt 780 tggactgctg gtgctgctgc ttactatgtt ggttacttgc agccaagaac cttcctgctg 840 aagtacaacg agaacggaac tatcactgac gctgttgact gtgctttgga cccattgtct 900 gagactaagt gcaccttgaa gtccttcacc gttgagaagg gtatctacca gacctccaac 960 ttcagagttc agccaactga gtccatcgtc agattcccaa acatcactaa cttgtgccca 1020 ttcggtgagg tgttcaacgc tactagattc gcttctgttt acgcctggaa cagaaagaga 1080 atctccaact gcgttgctga ctactccgtc ttgtacaact ctgcttcatt ctccaccttc 1140 aagtgctacg gtgtttcccc aactaagttg aacgacctgt gtttcactaa cgtctacgcc 1200 gactccttcg ttattagagg tgacgaggtt agacagatcg ctccaggtca aactggtaag 1260 atcgctgact acaactacaa gctgccagac gacttcaccg gttgtgttat tgcttggaac 1320 tccaacaacc tggactccaa ggttggtggt aactacaatt acctgtaccg tctgttcaga 1380 aagtccaact tgaagccatt cgagagagac atctccaccg agatctacca agctggttct 1440 actccatgta acggtgtcga gggtttcaac tgctacttcc cattgcaatc ctacggtttc 1500 caacctacca acggtgttgg ataccagcca tacagagttg tcgttttgtc cttcgagttg 1560 ttgcacgctc cagctactgt ttgtggtcca aagaagtcca ccaacttggt caagaacaaa 1620 tgcgtcaact ttaacttcaa cggcctgacc ggtactggtg ttttgactga atccaacaag 1680 aagttcctgc ctttccagca gttcggtaga gacattgctg acactactga cgccgttaga 1740 gatccacaga ctttggagat cttggacatc accccatgtt ccttcggtgg tgtttccgtt 1800 attacccctg gaactaacac ctccaatcag gtcgctgtct tgtaccagga cgttaactgt 1860 actgaggttc cagttgctat ccacgctgac caattgactc caacttggag agtctactcc 1920 accggttcca acgttttcca aactagagcc ggttgtttga tcggtgctga acacgtcaac 1980 aactcctacg agtgtgacat tccaattggt gctggtatct gtgcctccta ccaaactcaa 2040 actaactccc caagaagggc tagatccgtt gcttcccaat ccattatcgc ttacaccatg 2100 tctttgggtg ccgagaactc tgttgcctac tctaacaact ctatcgctat ccctaccaac 2160 ttcaccatct ccgttaccac tgagatcttg ccagtctcca tgaccaagac ttccgttgac 2220 tgtaccatgt acatctgtgg tgactccact gagtgttcca acttgttgct gcaatacggt 2280 tccttctgca cccagttgaa cagagctttg actggtattg ctgtcgagca agacaagaac 2340 actcaagagg ttttcgccca ggtgaagcag atctacaaga ctccacctat taaggacttc 2400 ggtggcttca acttctccca gattttgcca gatccatcta agccctccaa gagatccttc 2460 attgaggacc tgctgttcaa caaggttact ttggctgacg ccggtttcat caagcagtac 2520 ggtgattgct tgggtgacat tgcagctaga gacttgatct gtgcccagaa gttcaacggt 2580 ttgaccgttt tgccaccttt gttgaccgac gagatgatcg ctcagtacac ttctgctttg 2640 ttggccggta ctatcacttc tggttggaca tttggagctg gtgccgcatt gcaaattcca 2700 ttcgctatgc aaatggccta cagattcaac ggtatcggtg ttacccagaa cgtcctgtac 2760 gagaaccaga agcttatcgc caaccagttc aactccgcta tcggtaagat tcaggactcc 2820 ttgtcctcta ctgcttctgc cttgggaaag ttgcaggatg ttgttaacca gaatgcccag 2880 gctttgaaca ccctggttaa gcaactgtcc tctaacttcg gtgctatctc ctccgttttg 2940 aacgacatct tgtcccgttt ggacaaggtt gaggctgagg ttcagatcga cagattgatc 3000 actggtagat tgcagtccct gcagacttac gttactcagc agttgattag agctgccgag 3060 attagagcct ctgctaactt ggctgctact aagatgtccg agtgtgtttt gggtcagtcc 3120 aagagagttg acttctgcgg taagggttac cacctgatgt ctttcccaca atctgctcca 3180 cacggtgtcg ttttcttgca cgttacttac gttccagctc aagagaagaa cttcactact 3240 gctccagcca tttgtcacga tggtaaggct cactttcctc gtgagggtgt tttcgtttcc 3300 aacggtactc actggttcgt cacccagaga aacttttacg agccacagat catcaccacc 3360 gacaacactt tcgtttctgg taactgtgac gtcgtcatcg gtatcgtgaa caacactgtc 3420 tacgatccat tgcagccaga attggactcc ttcaaagagg aactggacaa gtactttaag 3480 aaccacactt ccccagacgt tgacctgggt gatatttccg gtattaacgc ctccgttgtc 3540 aacatccaaa aagagatcga ccgtttgaac gaggtcgcca agaacttgaa cgagtccttg 3600 attgacttgc aagagctggg caagtacgag cagtacatta agtggccatg gtacatttgg 3660 ctgggtttca ttgctggttt gatcgccatc gttatggtca ccatcatgtt gtgctgtatg 3720 acctcctgtt gctcctgttt gaagggttgt tgttcctgcg gttcctgttg taagttcgac 3780 gaagatgact ccgagccagt cttgaagggt gttaagttgc actacactta agcggccgc 3839 <210> 5 <211> 5357 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding for fusion protein HPV18L1/SARS-CoV-2 spike protein- optimised for expression in K. pastoris <400> 5 ttcgaaacga tggctctttg gagaccatcc gacaacactg tttacttgcc accaccatcc 60 gttgctagag ttgttaacac tgacgactac gttactagaa cttccatctt ctaccacgct 120 ggttcttcca gattgttgac tgttggtaac ccatacttca gagttccagc tggaggtggt 180 aacaagcaag acatcccaaa ggtttccgct taccagtaca gagttttcag agttcagttg 240 ccagacccaa acaagtttgg attgccagac acttccatct acaacccaga gactcagaga 300 cttgtttggg cttgtgctgg tgttgaaatc ggtagaggac agccattggg tgttggtttg 360 tctggtcacc cattctacaa caagttggac gacactgaat cttctcacgc tgctacttct 420 aacgtttccg aggatgttag agacaacgtt tccgttgact acaagcagac tcagttgtgt 480 atcttgggtt gtgctccagc tattggtgaa cattgggcta agggtactgc ttgtaagtcc 540 agaccattgt ctcagggaga ttgtccacca ttggagttga agaacactgt tttggaggac 600 ggtgatatgg ttgatactgg ttacggtgct atggacttct ctactttgca ggacactaag 660 tgtgaagttc cattggacat ctgtcagtcc atctgtaagt acccagacta cttgcaaatg 720 tccgctgatc catacggtga ctctatgttc ttctgtttga gaagagagca gttgttcgct 780 agacacttct ggaacagagc tggtactatg ggtgacactg ttccacaatc cttgtacatc 840 aagggtactg gaatgagagc ttctcctggt tcttgtgttt actctccatc tccatccggt 900 tccattgtta cttccgactc ccagttgttc aacaagccat actggttgca taaggctcaa 960 ggtcacaaca acggtgtttg ttggcacaac cagttgttcg ttactgttgt tgacactact 1020 agatccacta acttgactat ctgtgcttcc actcaatctc cagttccagg acaatacgac 1080 gctactaagt tcaagcagta ctccagacac gttgaagagt acgacttgca gttcatcttc 1140 cagttgtgta ctatcacttt gactgctgat gttatgtcct acatccactc tatgaactcc 1200 tccattttgg aggattggaa cttcggtgtt ccaccaccac caactacttc attggttgac 1260 acttacagat tcgttcagtc cgttgctatc acttgtcaaa aggacgctgc tccagctgaa 1320 aacaaggacc catacgacaa gttgaagttc tggaacgttg acttgaaaga gaagttctcc 1380 ttggacttgg accaataccc attgggtaga aagtttttgg ttcaggctgg attgagaaga 1440 aagccaacta tcggtccaag aaagagatca gctccatccg ctactacttc atccaagcca 1500 gctaagagag ttagagttag agctagaaag ttcgtgttct tggtcctgtt gccattggtt 1560 tcttcccagt gtgttaacct gaccactaga actcaattgc ctccagccta caccaattcc 1620 ttcaccagag gtgtttacta cccagacaag gtgttcagat cttccgtctt gcactccact 1680 caggacttgt tcttgccatt cttctccaac gttacctggt tccacgctat tcacgtttcc 1740 ggaactaacg gtactaagag attcgacaac ccagtcctgc cattcaacga tggtgtctac 1800 ttcgcttcta ccgagaagtc caacatcatc agaggttgga tcttcggtac taccctggac 1860 tctaagactc agtccttgct gatcgttaac aacgccacca acgttgtcat caaggtttgc 1920 gagttccagt tctgcaacga cccattcttg ggtgtgtact accacaagaa caacaagtct 1980 tggatggaat ccgagttcag agtttactcc tccgccaaca actgtacctt cgagtacgtt 2040 tcccagccat tcttgatgga cttggagggt aagcagggta acttcaagaa cctgagagag 2100 ttcgttttca agaacatcga cggttacttc aagatctact ccaagcacac cccaatcaac 2160 ctggttagag atttgccaca aggtttctcc gctttggagc ctttggttga cttgccaatc 2220 ggtatcaaca tcaccagatt ccagaccttg ttggccttgc acagatccta cttgactcca 2280 ggtgattctt cttccggttg gactgctggt gctgctgctt actatgttgg ttacttgcag 2340 ccaagaacct tcctgctgaa gtacaacgag aacggaacta tcactgacgc tgttgactgt 2400 gctttggacc cattgtctga gactaagtgc accttgaagt ccttcaccgt tgagaagggt 2460 atctaccaga cctccaactt cagagttcag ccaactgagt ccatcgtcag attcccaaac 2520 atcactaact tgtgcccatt cggtgaggtg ttcaacgcta ctagattcgc ttctgtttac 2580 gcctggaaca gaaagagaat ctccaactgc gttgctgact actccgtctt gtacaactct 2640 gcttcattct ccaccttcaa gtgctacggt gtttccccaa ctaagttgaa cgacctgtgt 2700 ttcactaacg tctacgccga ctccttcgtt attagaggtg acgaggttag acagatcgct 2760 ccaggtcaaa ctggtaagat cgctgactac aactacaagc tgccagacga cttcaccggt 2820 tgtgttattg cttggaactc caacaacctg gactccaagg ttggtggtaa ctacaattac 2880 ctgtaccgtc tgttcagaaa gtccaacttg aagccattcg agagagacat ctccaccgag 2940 atctaccaag ctggttctac tccatgtaac ggtgtcgagg gtttcaactg ctacttccca 3000 ttgcaatcct acggtttcca acctaccaac ggtgttggat accagccata cagagttgtc 3060 gttttgtcct tcgagttgtt gcacgctcca gctactgttt gtggtccaaa gaagtccacc 3120 aacttggtca agaacaaatg cgtcaacttt aacttcaacg gcctgaccgg tactggtgtt 3180 ttgactgaat ccaacaagaa gttcctgcct ttccagcagt tcggtagaga cattgctgac 3240 actactgacg ccgttagaga tccacagact ttggagatct tggacatcac cccatgttcc 3300 ttcggtggtg tttccgttat tacccctgga actaacacct ccaatcaggt cgctgtcttg 3360 taccaggacg ttaactgtac tgaggttcca gttgctatcc acgctgacca attgactcca 3420 acttggagag tctactccac cggttccaac gttttccaaa ctagagccgg ttgtttgatc 3480 ggtgctgaac acgtcaacaa ctcctacgag tgtgacattc caattggtgc tggtatctgt 3540 gcctcctacc aaactcaaac taactcccca agaagggcta gatccgttgc ttcccaatcc 3600 attatcgctt acaccatgtc tttgggtgcc gagaactctg ttgcctactc taacaactct 3660 atcgctatcc ctaccaactt caccatctcc gttaccactg agatcttgcc agtctccatg 3720 accaagactt ccgttgactg taccatgtac atctgtggtg actccactga gtgttccaac 3780 ttgttgctgc aatacggttc cttctgcacc cagttgaaca gagctttgac tggtattgct 3840 gtcgagcaag acaagaacac tcaagaggtt ttcgcccagg tgaagcagat ctacaagact 3900 ccacctatta aggacttcgg tggcttcaac ttctcccaga ttttgccaga tccatctaag 3960 ccctccaaga gatccttcat tgaggacctg ctgttcaaca aggttacttt ggctgacgcc 4020 ggtttcatca agcagtacgg tgattgcttg ggtgacattg cagctagaga cttgatctgt 4080 gcccagaagt tcaacggttt gaccgttttg ccacctttgt tgaccgacga gatgatcgct 4140 cagtacactt ctgctttgtt ggccggtact atcacttctg gttggacatt tggagctggt 4200 gccgcattgc aaattccatt cgctatgcaa atggcctaca gattcaacgg tatcggtgtt 4260 acccagaacg tcctgtacga gaaccagaag cttatcgcca accagttcaa ctccgctatc 4320 ggtaagattc aggactcctt gtcctctact gcttctgcct tgggaaagtt gcaggatgtt 4380 gttaaccaga atgcccaggc tttgaacacc ctggttaagc aactgtcctc taacttcggt 4440 gctatctcct ccgttttgaa cgacatcttg tcccgtttgg acaaggttga ggctgaggtt 4500 cagatcgaca gattgatcac tggtagattg cagtccctgc agacttacgt tactcagcag 4560 ttgattagag ctgccgagat tagagcctct gctaacttgg ctgctactaa gatgtccgag 4620 tgtgttttgg gtcagtccaa gagagttgac ttctgcggta agggttacca cctgatgtct 4680 ttcccacaat ctgctccaca cggtgtcgtt ttcttgcacg ttacttacgt tccagctcaa 4740 gagaagaact tcactactgc tccagccatt tgtcacgatg gtaaggctca ctttcctcgt 4800 gagggtgttt tcgtttccaa cggtactcac tggttcgtca cccagagaaa cttttacgag 4860 ccacagatca tcaccaccga caacactttc gtttctggta actgtgacgt cgtcatcggt 4920 atcgtgaaca acactgtcta cgatccattg cagccagaat tggactcctt caaagaggaa 4980 ctggacaagt actttaagaa ccacacttcc ccagacgttg acctgggtga tatttccggt 5040 attaacgcct ccgttgtcaa catccaaaaa gagatcgacc gtttgaacga ggtcgccaag 5100 aacttgaacg agtccttgat tgacttgcaa gagctgggca agtacgagca gtacattaag 5160 tggccatggt acatttggct gggtttcatt gctggtttga tcgccatcgt tatggtcacc 5220 atcatgttgt gctgtatgac ctcctgttgc tcctgtttga agggttgttg ttcctgcggt 5280 tcctgttgta agttcgacga agatgactcc gagccagtct tgaagggtgt taagttgcac 5340 tacacttaag cggccgc 5357 <210> 6 <211> 5351 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding for fusion protein HPV16L1/SARS-CoV-2 spike protein - optimised for expression in K. pastoris <400> 6 ttcgaaacga tgtctttgtg gttgccatct gaagctactg tttacttgcc accagttcca 60 gtttctaaag ttgtttccac tgacgaatac gttgctagaa ctaacatcta ctaccacgct 120 ggtacttcta gattgttggc tgttggtcat ccatacttcc caattaagaa gccaaacaac 180 aacaagattt tggttccaaa ggtttccgga ttgcaataca gagttttcag aatccatttg 240 ccagatccaa acaagtttgg tttcccagat acttctttct acaacccaga cactcaaaga 300 cttgtttggg cttgtgttgg tgttgaagtt ggtagaggtc aaccattggg tgttggtatt 360 tctggtcacc cattgttgaa caagttggac gatactgaaa acgcttctgc ttacgctgct 420 aacgctggtg ttgataacag agaatgtatt tctatggact acaagcaaac tcaattgtgt 480 ttgattggtt gtaagccacc aattggtgaa cattggggaa agggttctcc atgtactaat 540 gttgctgtta accctggtga ttgtccacca ttggaattga ttaacactgt tattcaagac 600 ggtgatatgg ttgatactgg tttcggtgct atggatttca ctactttgca agctaacaag 660 tctgaagttc cattggacat ttgtacttcc atctgtaagt acccagacta cattaagatg 720 gtttctgaac catacggtga ttctttgttc ttctacttga gaagagaaca aatgtttgtt 780 agacacttgt tcaacagagc tggtgctgtt ggtgaaaacg ttccagatga cttgtacatt 840 aagggttctg gttctactgc taacttggct tcttctaact actttccaac tccatctggt 900 tctatggtta cttctgacgc tcaaattttc aacaagccat actggttgca aagagcacaa 960 ggtcataaca acggtatttg ttggggtaac caattgttcg ttactgttgt tgacactact 1020 agatccacta acatgtcctt gtgtgctgct atttctactt ctgaaactac ttacaagaac 1080 actaacttca aagagtactt gagacacgga gaagaatacg acttgcaatt cattttccaa 1140 ttgtgtaaga ttactttgac tgctgacgtt atgacttaca ttcactctat gaactctact 1200 attttggaag attggaactt cggattgcaa ccaccaccag gtggtacttt ggaagatact 1260 tacagattcg ttacttctca agctattgct tgtcaaaagc atactccacc tgctccaaaa 1320 gaagatccat tgaagaagta cactttctgg gaagttaact tgaaagaaaa gttctctgct 1380 gatttggatc aattcccatt gggtagaaag tttttgttgc aagctggatt gaaggctaaa 1440 ccaaagttca ctttgggaaa gagaaaggct actccaacta cttcttctac ttctactact 1500 gctaagagaa agaagagaaa attgttcgtg ttcttggtcc tgttgccatt ggtttcttcc 1560 cagtgtgtta acctgaccac tagaactcaa ttgcctccag cctacaccaa ttccttcacc 1620 agaggtgttt actacccaga caaggtgttc agatcttccg tcttgcactc cactcaggac 1680 ttgttcttgc cattcttctc caacgttacc tggttccacg ctattcacgt ttccggaact 1740 aacggtacta agagattcga caacccagtc ctgccattca acgatggtgt ctacttcgct 1800 tctaccgaga agtccaacat catcagaggt tggatcttcg gtactaccct ggactctaag 1860 actcagtcct tgctgatcgt taacaacgcc accaacgttg tcatcaaggt ttgcgagttc 1920 cagttctgca acgacccatt cttgggtgtg tactaccaca agaacaacaa gtcttggatg 1980 gaatccgagt tcagagttta ctcctccgcc aacaactgta ccttcgagta cgtttcccag 2040 ccattcttga tggacttgga gggtaagcag ggtaacttca agaacctgag agagttcgtt 2100 ttcaagaaca tcgacggtta cttcaagatc tactccaagc acaccccaat caacctggtt 2160 agagatttgc cacaaggttt ctccgctttg gagcctttgg ttgacttgcc aatcggtatc 2220 aacatcacca gattccagac cttgttggcc ttgcacagat cctacttgac tccaggtgat 2280 tcttcttccg gttggactgc tggtgctgct gcttactatg ttggttactt gcagccaaga 2340 accttcctgc tgaagtacaa cgagaacgga actatcactg acgctgttga ctgtgctttg 2400 gacccattgt ctgagactaa gtgcaccttg aagtccttca ccgttgagaa gggtatctac 2460 cagacctcca acttcagagt tcagccaact gagtccatcg tcagattccc aaacatcact 2520 aacttgtgcc cattcggtga ggtgttcaac gctactagat tcgcttctgt ttacgcctgg 2580 aacagaaaga gaatctccaa ctgcgttgct gactactccg tcttgtacaa ctctgcttca 2640 ttctccacct tcaagtgcta cggtgtttcc ccaactaagt tgaacgacct gtgtttcact 2700 aacgtctacg ccgactcctt cgttattaga ggtgacgagg ttagacagat cgctccaggt 2760 caaactggta agatcgctga ctacaactac aagctgccag acgacttcac cggttgtgtt 2820 attgcttgga actccaacaa cctggactcc aaggttggtg gtaactacaa ttacctgtac 2880 cgtctgttca gaaagtccaa cttgaagcca ttcgagagag acatctccac cgagatctac 2940 caagctggtt ctactccatg taacggtgtc gagggtttca actgctactt cccattgcaa 3000 tcctacggtt tccaacctac caacggtgtt ggataccagc catacagagt tgtcgttttg 3060 tccttcgagt tgttgcacgc tccagctact gtttgtggtc caaagaagtc caccaacttg 3120 gtcaagaaca aatgcgtcaa ctttaacttc aacggcctga ccggtactgg tgttttgact 3180 gaatccaaca agaagttcct gcctttccag cagttcggta gagacattgc tgacactact 3240 gacgccgtta gagatccaca gactttggag atcttggaca tcaccccatg ttccttcggt 3300 ggtgtttccg ttattacccc tggaactaac acctccaatc aggtcgctgt cttgtaccag 3360 gacgttaact gtactgaggt tccagttgct atccacgctg accaattgac tccaacttgg 3420 agagtctact ccaccggttc caacgttttc caaactagag ccggttgttt gatcggtgct 3480 gaacacgtca acaactccta cgagtgtgac attccaattg gtgctggtat ctgtgcctcc 3540 taccaaactc aaactaactc cccaagaagg gctagatccg ttgcttccca atccattatc 3600 gcttacacca tgtctttggg tgccgagaac tctgttgcct actctaacaa ctctatcgct 3660 atccctacca acttcaccat ctccgttacc actgagatct tgccagtctc catgaccaag 3720 acttccgttg actgtaccat gtacatctgt ggtgactcca ctgagtgttc caacttgttg 3780 ctgcaatacg gttccttctg cacccagttg aacagagctt tgactggtat tgctgtcgag 3840 caagacaaga acactcaaga ggttttcgcc caggtgaagc agatctacaa gactccacct 3900 attaaggact tcggtggctt caacttctcc cagattttgc cagatccatc taagccctcc 3960 aagagatcct tcattgagga cctgctgttc aacaaggtta ctttggctga cgccggtttc 4020 atcaagcagt acggtgattg cttgggtgac attgcagcta gagacttgat ctgtgcccag 4080 aagttcaacg gtttgaccgt tttgccacct ttgttgaccg acgagatgat cgctcagtac 4140 acttctgctt tgttggccgg tactatcact tctggttgga catttggagc tggtgccgca 4200 ttgcaaattc cattcgctat gcaaatggcc tacagattca acggtatcgg tgttacccag 4260 aacgtcctgt acgagaacca gaagcttatc gccaaccagt tcaactccgc tatcggtaag 4320 attcaggact ccttgtcctc tactgcttct gccttgggaa agttgcagga tgttgttaac 4380 cagaatgccc aggctttgaa caccctggtt aagcaactgt cctctaactt cggtgctatc 4440 tcctccgttt tgaacgacat cttgtcccgt ttggacaagg ttgaggctga ggttcagatc 4500 gacagattga tcactggtag attgcagtcc ctgcagactt acgttactca gcagttgatt 4560 agagctgccg agattagagc ctctgctaac ttggctgcta ctaagatgtc cgagtgtgtt 4620 ttgggtcagt ccaagagagt tgacttctgc ggtaagggtt accacctgat gtctttccca 4680 caatctgctc cacacggtgt cgttttcttg cacgttactt acgttccagc tcaagagaag 4740 aacttcacta ctgctccagc catttgtcac gatggtaagg ctcactttcc tcgtgagggt 4800 gttttcgttt ccaacggtac tcactggttc gtcacccaga gaaactttta cgagccacag 4860 atcatcacca ccgacaacac tttcgtttct ggtaactgtg acgtcgtcat cggtatcgtg 4920 aacaacactg tctacgatcc attgcagcca gaattggact ccttcaaaga ggaactggac 4980 aagtacttta agaaccacac ttccccagac gttgacctgg gtgatatttc cggtattaac 5040 gcctccgttg tcaacatcca aaaagagatc gaccgtttga acgaggtcgc caagaacttg 5100 aacgagtcct tgattgactt gcaagagctg ggcaagtacg agcagtacat taagtggcca 5160 tggtacattt ggctgggttt cattgctggt ttgatcgcca tcgttatggt caccatcatg 5220 ttgtgctgta tgacctcctg ttgctcctgt ttgaagggtt gttgttcctg cggttcctgt 5280 tgtaagttcg acgaagatga ctccgagcca gtcttgaagg gtgttaagtt gcactacact 5340 taagcggccg c 5351 <210> 7 <211> 3836 <212> DNA <213> Artificial Sequence <220> <223> SARS-CoV-2 spike protein nucleic acid sequence - optimised for expression in humans <400> 7 gctagcgaca tgttcgtgtt tctggtgctg ctgcctctgg tgtccagcca gtgtgtgaac 60 ctgaccacca gaacacagct gcctccagcc tacaccaata gcttcaccag gggcgtgtac 120 taccccgaca aggtgttcag atctagcgtg ctgcacagca cccaggacct gtttctgccc 180 ttcttcagca acgtgacctg gttccacgcc atccacgtgt ccggcaccaa tggcaccaag 240 agattcgaca accccgtgct gcccttcaac gatggggtgt actttgccag caccgagaag 300 tccaacatca tcagaggctg gatcttcggc accacactgg acagcaagac ccagagcctg 360 ctgatcgtga acaacgccac caacgtggtc atcaaagtgt gcgagttcca gttctgcaac 420 gacccattcc tgggagtcta ctaccacaag aacaacaaga gctggatgga aagcgagttc 480 cgggtgtaca gcagcgccaa caactgcacc ttcgagtacg tgtcccagcc tttcctgatg 540 gacctggaag gcaagcaggg caacttcaag aacctgcgcg agttcgtgtt caagaacatc 600 gacggctact tcaagatcta cagcaagcac acccctatca acctcgtgcg ggatctgcct 660 cagggctttt ctgctctgga acctctggtg gacctgccta tcggcatcaa catcacccgg 720 tttcagaccc tgctggccct gcacagatct tacctgacac ctggcgatag cagctctgga 780 tggacagctg gcgccgctgc ctattatgtg ggctacctgc agcctcggac cttcctgctg 840 aagtacaacg agaacggcac catcaccgac gccgtggatt gtgctctgga tcccctgagc 900 gagacaaagt gcaccctgaa gtccttcacc gtggaaaagg gcatctacca gaccagcaac 960 ttcagagtgc agcccaccga gagcatcgtg cggttcccca atatcaccaa tctgtgcccc 1020 ttcggcgagg tgttcaatgc cacaagattt gccagcgtgt acgcctggaa ccggaagaga 1080 atcagcaact gcgtggccga ctacagcgtg ctgtacaata gcgccagctt cagcaccttc 1140 aagtgctacg gcgtgtcccc taccaagctg aacgacctgt gcttcaccaa tgtgtacgcc 1200 gacagcttcg tgatcagagg cgacgaagtt cggcagatcg ctcctggaca gacaggcaag 1260 atcgccgatt acaactacaa gctgcccgac gacttcaccg gctgcgtgat cgcctggaat 1320 agcaacaacc tggactccaa agtcggcggc aactacaact acctgtaccg gctgttccgg 1380 aagtccaatc tgaagccctt cgagcgggac atctccaccg aaatctatca ggccggcagc 1440 accccttgta acggcgtgga aggcttcaac tgctacttcc cactgcagtc ctacggcttt 1500 cagcctacca atggcgtggg ctatcagccc tatagagtgg tggtgctgag cttcgaactg 1560 ctgcatgccc ctgctaccgt gtgcggccct aagaagtcta ccaacctggt caagaacaaa 1620 tgcgtgaact tcaacttcaa cggcctgacc ggcacaggcg tgctgacaga gagcaacaag 1680 aagttcctgc ctttccagca gtttggccgg gatatcgccg ataccacaga cgccgttaga 1740 gatccccaga cactggaaat cctggacatc accccatgca gctttggcgg agtgtctgtg 1800 atcacccctg gcaccaatac cagcaatcag gtggccgtgc tgtatcagga cgtgaactgt 1860 acagaggtgc ccgtggccat tcacgccgat caactgacac ccacttggag agtgtactcc 1920 accggctcca acgtgttcca gactagagcc ggatgtctga tcggagccga gcacgtgaac 1980 aatagctacg agtgcgacat ccccatcggc gctggcatct gtgccagcta ccagacacag 2040 acaaatagcc ccagacgggc cagaagcgtg gcctctcaga gcatcattgc ctacacaatg 2100 agcctgggcg ccgagaattc tgtggcctac agcaacaact ctatcgctat ccccaccaac 2160 ttcaccatca gcgtgaccac cgagatcctg cctgtgtcca tgaccaagac cagcgtggac 2220 tgcaccatgt acatctgcgg cgattccacc gagtgcagca acctgctgct gcagtacggc 2280 agcttctgca cccagctgaa tagagccctg acagggatcg ccgtggaaca ggacaagaac 2340 acccaagagg tgttcgccca agtgaagcag atctacaaga cccctcctat caaggacttc 2400 ggcggcttca atttcagcca gattctgccc gatcctagca agcccagcaa gcggagcttt 2460 atcgaggacc tgctgttcaa caaagtgaca ctggccgacg ccggcttcat caagcagtat 2520 ggcgattgcc tgggcgacat tgccgccaga gatctgattt gcgcccagaa gtttaacgga 2580 ctgacagtgc tgcctcctct gctgaccgat gagatgatcg cccagtacac atctgctctg 2640 ctggccggca caatcaccag cggatggaca tttggagctg gcgcagccct gcagatcccc 2700 tttgctatgc agatggccta ccggttcaac ggcatcggag tgacccagaa tgtgctgtac 2760 gagaaccaga agctgatcgc caaccagttc aacagcgcca tcggcaagat ccaggatagc 2820 ctgtctagca cagccagcgc tctgggcaaa ctgcaggacg tggtcaatca gaacgctcag 2880 gccctgaaca ccctcgtgaa gcagctgagc agcaatttcg gcgccatcag ctccgtgctg 2940 aacgatatcc tgagccggct ggataaggtg gaagccgagg tgcagatcga cagactgatc 3000 acaggcagac tgcagagcct ccagacatac gtgacccagc agctgatcag agccgccgag 3060 attagagcct ctgccaatct ggccgccacc aagatgtctg agtgtgtgct gggccagagc 3120 aagagagtgg atttctgcgg caagggctac cacctgatga gctttccaca gtctgctcct 3180 cacggcgtgg tgtttctgca cgtgacctat gtgcccgctc aagagaagaa cttcacaaca 3240 gcccctgcca tctgccacga cggaaaggcc cattttccta gagaaggcgt gttcgtgtcc 3300 aacggcaccc attggttcgt gacacagcgg aacttctacg agccccagat catcaccacc 3360 gacaacacct tcgtgtctgg caactgtgac gtcgtgatcg gcattgtgaa caacaccgtg 3420 tacgaccctc tgcagcccga gctggacagc ttcaaagagg aactggacaa gtactttaag 3480 aaccacacaa gccccgacgt ggacctgggc gatattagcg gcatcaatgc ctccgtggtc 3540 aacatccaga aagagatcga ccggctgaac gaggtggcca agaatctgaa cgagagcctg 3600 atcgacctgc aagaactggg gaagtacgag cagtacatca agtggccctg gtacatctgg 3660 ctgggcttta tcgccggact gattgccatc gtgatggtca caatcatgct gtgctgcatg 3720 accagctgct gtagctgcct gaagggctgt tgcagctgtg gcagctgctg caagttcgac 3780 gaggatgata gcgagcctgt gctgaagggc gtgaaactgc actacaccgc ggccgc 3836 <210> 8 <211> 4232 <212> DNA <213> Artificial Sequence <220> <223> nucleic acid encoding for fusion protein HBSAg/SARS-CoV-2 spike protein- optimised for expression in humans <400> 8 gctagcgaca tgaactttct gggcggtacg acagtatgcc ttggacaaaa ttcacaatct 60 ccgacgtcta atcactcccc tacaagttgt ccaccgactt gccccggcta taggtggatg 120 tgtctcagac gattcataat ctttctcttc attcttcttc tgtgcctgat attcttgctg 180 gtccttctgg attaccaggg aatgcttccc gtgtgtcctc tgattcctgg ttcatccact 240 acatctacgg gtccctgtag aacatgcacc acacctgcac agggcacctc catgtatccg 300 tcatgctgct gcacgaaacc atcagatggt aactgcacgt gcataccgat cccctcatca 360 tgggcgtttg ggaaatttct gtgggagtgg gcctcagccc ggttttcctt cgtgtttctg 420 gtgctgctgc ctctggtgtc cagccagtgt gtgaacctga ccaccagaac acagctgcct 480 ccagcctaca ccaatagctt caccaggggc gtgtactacc ccgacaaggt gttcagatct 540 agcgtgctgc acagcaccca ggacctgttt ctgcccttct tcagcaacgt gacctggttc 600 cacgccatcc acgtgtccgg caccaatggc accaagagat tcgacaaccc cgtgctgccc 660 ttcaacgatg gggtgtactt tgccagcacc gagaagtcca acatcatcag aggctggatc 720 ttcggcacca cactggacag caagacccag agcctgctga tcgtgaacaa cgccaccaac 780 gtggtcatca aagtgtgcga gttccagttc tgcaacgacc cattcctggg agtctactac 840 cacaagaaca acaagagctg gatggaaagc gagttccggg tgtacagcag cgccaacaac 900 tgcaccttcg agtacgtgtc ccagcctttc ctgatggacc tggaaggcaa gcagggcaac 960 ttcaagaacc tgcgcgagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 1020 aagcacaccc ctatcaacct cgtgcgggat ctgcctcagg gcttttctgc tctggaacct 1080 ctggtggacc tgcctatcgg catcaacatc acccggtttc agaccctgct ggccctgcac 1140 agatcttacc tgacacctgg cgatagcagc tctggatgga cagctggcgc cgctgcctat 1200 tatgtgggct acctgcagcc tcggaccttc ctgctgaagt acaacgagaa cggcaccatc 1260 accgacgccg tggattgtgc tctggatccc ctgagcgaga caaagtgcac cctgaagtcc 1320 ttcaccgtgg aaaagggcat ctaccagacc agcaacttca gagtgcagcc caccgagagc 1380 atcgtgcggt tccccaatat caccaatctg tgccccttcg gcgaggtgtt caatgccaca 1440 agatttgcca gcgtgtacgc ctggaaccgg aagagaatca gcaactgcgt ggccgactac 1500 agcgtgctgt acaatagcgc cagcttcagc accttcaagt gctacggcgt gtcccctacc 1560 aagctgaacg acctgtgctt caccaatgtg tacgccgaca gcttcgtgat cagaggcgac 1620 gaagttcggc agatcgctcc tggacagaca ggcaagatcg ccgattacaa ctacaagctg 1680 cccgacgact tcaccggctg cgtgatcgcc tggaatagca acaacctgga ctccaaagtc 1740 ggcggcaact acaactacct gtaccggctg ttccggaagt ccaatctgaa gcccttcgag 1800 cgggacatct ccaccgaaat ctatcaggcc ggcagcaccc cttgtaacgg cgtggaaggc 1860 ttcaactgct acttcccact gcagtcctac ggctttcagc ctaccaatgg cgtgggctat 1920 cagccctata gagtggtggt gctgagcttc gaactgctgc atgcccctgc taccgtgtgc 1980 ggccctaaga agtctaccaa cctggtcaag aacaaatgcg tgaacttcaa cttcaacggc 2040 ctgaccggca caggcgtgct gacagagagc aacaagaagt tcctgccttt ccagcagttt 2100 ggccgggata tcgccgatac cacagacgcc gttagagatc cccagacact ggaaatcctg 2160 gacatcaccc catgcagctt tggcggagtg tctgtgatca cccctggcac caataccagc 2220 aatcaggtgg ccgtgctgta tcaggacgtg aactgtacag aggtgcccgt ggccattcac 2280 gccgatcaac tgacacccac ttggagagtg tactccaccg gctccaacgt gttccagact 2340 agagccggat gtctgatcgg agccgagcac gtgaacaata gctacgagtg cgacatcccc 2400 atcggcgctg gcatctgtgc cagctaccag acacagacaa atagccccag acgggccaga 2460 agcgtggcct ctcagagcat cattgcctac acaatgagcc tgggcgccga gaattctgtg 2520 gcctacagca acaactctat cgctatcccc accaacttca ccatcagcgt gaccaccgag 2580 atcctgcctg tgtccatgac caagaccagc gtggactgca ccatgtacat ctgcggcgat 2640 tccaccgagt gcagcaacct gctgctgcag tacggcagct tctgcaccca gctgaataga 2700 gccctgacag ggatcgccgt ggaacaggac aagaacaccc aagaggtgtt cgcccaagtg 2760 aagcagatct acaagacccc tcctatcaag gacttcggcg gcttcaattt cagccagatt 2820 ctgcccgatc ctagcaagcc cagcaagcgg agctttatcg aggacctgct gttcaacaaa 2880 gtgacactgg ccgacgccgg cttcatcaag cagtatggcg attgcctggg cgacattgcc 2940 gccagagatc tgatttgcgc ccagaagttt aacggactga cagtgctgcc tcctctgctg 3000 accgatgaga tgatcgccca gtacacatct gctctgctgg ccggcacaat caccagcgga 3060 tggacatttg gagctggcgc agccctgcag atcccctttg ctatgcagat ggcctaccgg 3120 ttcaacggca tcggagtgac ccagaatgtg ctgtacgaga accagaagct gatcgccaac 3180 cagttcaaca gcgccatcgg caagatccag gatagcctgt ctagcacagc cagcgctctg 3240 ggcaaactgc aggacgtggt caatcagaac gctcaggccc tgaacaccct cgtgaagcag 3300 ctgagcagca atttcggcgc catcagctcc gtgctgaacg atatcctgag ccggctggat 3360 aaggtggaag ccgaggtgca gatcgacaga ctgatcacag gcagactgca gagcctccag 3420 acatacgtga cccagcagct gatcagagcc gccgagatta gagcctctgc caatctggcc 3480 gccaccaaga tgtctgagtg tgtgctgggc cagagcaaga gagtggattt ctgcggcaag 3540 ggctaccacc tgatgagctt tccacagtct gctcctcacg gcgtggtgtt tctgcacgtg 3600 acctatgtgc ccgctcaaga gaagaacttc acaacagccc ctgccatctg ccacgacgga 3660 aaggcccatt ttcctagaga aggcgtgttc gtgtccaacg gcacccattg gttcgtgaca 3720 cagcggaact tctacgagcc ccagatcatc accaccgaca acaccttcgt gtctggcaac 3780 tgtgacgtcg tgatcggcat tgtgaacaac accgtgtacg accctctgca gcccgagctg 3840 gacagcttca aagaggaact ggacaagtac tttaagaacc acacaagccc cgacgtggac 3900 ctgggcgata ttagcggcat caatgcctcc gtggtcaaca tccagaaaga gatcgaccgg 3960 ctgaacgagg tggccaagaa tctgaacgag agcctgatcg acctgcaaga actggggaag 4020 tacgagcagt acatcaagtg gccctggtac atctggctgg gctttatcgc cggactgatt 4080 gccatcgtga tggtcacaat catgctgtgc tgcatgacca gctgctgtag ctgcctgaag 4140 ggctgttgca gctgtggcag ctgctgcaag ttcgacgagg atgatagcga gcctgtgctg 4200 aagggcgtga aactgcacta caccgcggcc gc 4232 <210> 9 <211> 1512 <212> PRT <213> Artificial Sequence <220> <223> fusion protein HEV-SARS-CoV-2 spike protein <400> 9 Met Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu Gly Gly 1 5 10 15 Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe Tyr Ser 20 25 30 Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu Tyr Thr 35 40 45 Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro His Asp 50 55 60 Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp Asn Gln 65 70 75 80 His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg Pro Phe 85 90 95 Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr Ala Ala 100 105 110 Glu Tyr Asp Gln Ser Thr Tyr Gly Ser Ser Thr Gly Pro Val Tyr Val 115 120 125 Ser Asp Ser Val Thr Leu Val Asn Val Ala Thr Gly Ala Gln Ala Val 130 135 140 Ala Arg Ser Leu Asp Trp Thr Lys Val Thr Leu Asp Gly Arg Pro Leu 145 150 155 160 Ser Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro Leu Arg 165 170 175 Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly Tyr Pro 180 185 190 Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Leu Leu Val Glu Asn Ala 195 200 205 Ala Gly His Arg Val Ala Ile Ser Thr Tyr Thr Thr Ser Leu Gly Ala 210 215 220 Gly Pro Val Ser Ile Ser Ala Val Ala Val Leu Ala Pro His Ser Ala 225 230 235 240 Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn 245 250 255 Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr 260 265 270 Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His 275 280 285 Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe 290 295 300 His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn 305 310 315 320 Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys 325 330 335 Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys 340 345 350 Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys 355 360 365 Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr 370 375 380 His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser 385 390 395 400 Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met 405 410 415 Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val 420 425 430 Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro 435 440 445 Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro 450 455 460 Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu 465 470 475 480 Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly 485 490 495 Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg 500 505 510 Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val 515 520 525 Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser 530 535 540 Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln 545 550 555 560 Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro 565 570 575 Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp 580 585 590 Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr 595 600 605 Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr 610 615 620 Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val 625 630 635 640 Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys 645 650 655 Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val 660 665 670 Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr 675 680 685 Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu 690 695 700 Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn 705 710 715 720 Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe 725 730 735 Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu 740 745 750 Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys 755 760 765 Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly 770 775 780 Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro 785 790 795 800 Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg 805 810 815 Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly 820 825 830 Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala 835 840 845 Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His 850 855 860 Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn 865 870 875 880 Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn 885 890 895 Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser 900 905 910 Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser 915 920 925 Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val 930 935 940 Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser 945 950 955 960 Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp 965 970 975 Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu 980 985 990 Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly 995 1000 1005 Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 1010 1015 1020 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly 1025 1030 1035 Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys 1040 1045 1050 Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 1055 1060 1065 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile 1070 1075 1080 Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr 1085 1090 1095 Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr 1100 1105 1110 Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly 1115 1120 1125 Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr 1130 1135 1140 Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn 1145 1150 1155 Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile 1160 1165 1170 Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln 1175 1180 1185 Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys 1190 1195 1200 Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp 1205 1210 1215 Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp 1220 1225 1230 Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr 1235 1240 1245 Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1250 1255 1260 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 1265 1270 1275 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln 1280 1285 1290 Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1295 1300 1305 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp 1310 1315 1320 Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly 1325 1330 1335 Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile 1340 1345 1350 Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val 1355 1360 1365 Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu 1370 1375 1380 Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His 1385 1390 1395 Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala 1400 1405 1410 Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val 1415 1420 1425 Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly 1430 1435 1440 Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly 1445 1450 1455 Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu 1460 1465 1470 Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser 1475 1480 1485 Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1490 1495 1500 Leu Lys Gly Val Lys Leu His Tyr Thr 1505 1510 <210> 10 <211> 1779 <212> PRT <213> Artificial Sequence <220> <223> fusion protein HPV18L1/SARS-CoV-2 spike protein <400> 10 Met Ala Leu Trp Arg Pro Ser Asp Asn Thr Val Tyr Leu Pro Pro Pro 1 5 10 15 Ser Val Ala Arg Val Val Asn Thr Asp Asp Tyr Val Thr Arg Thr Ser 20 25 30 Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu Thr Val Gly Asn Pro 35 40 45 Tyr Phe Arg Val Pro Ala Gly Gly Gly Asn Lys Gln Asp Ile Pro Lys 50 55 60 Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg Val Gln Leu Pro Asp Pro 65 70 75 80 Asn Lys Phe Gly Leu Pro Asp Thr Ser Ile Tyr Asn Pro Glu Thr Gln 85 90 95 Arg Leu Val Trp Ala Cys Ala Gly Val Glu Ile Gly Arg Gly Gln Pro 100 105 110 Leu Gly Val Gly Leu Ser Gly His Pro Phe Tyr Asn Lys Leu Asp Asp 115 120 125 Thr Glu Ser Ser His Ala Ala Thr Ser Asn Val Ser Glu Asp Val Arg 130 135 140 Asp Asn Val Ser Val Asp Tyr Lys Gln Thr Gln Leu Cys Ile Leu Gly 145 150 155 160 Cys Ala Pro Ala Ile Gly Glu His Trp Ala Lys Gly Thr Ala Cys Lys 165 170 175 Ser Arg Pro Leu Ser Gln Gly Asp Cys Pro Pro Leu Glu Leu Lys Asn 180 185 190 Thr Val Leu Glu Asp Gly Asp Met Val Asp Thr Gly Tyr Gly Ala Met 195 200 205 Asp Phe Ser Thr Leu Gln Asp Thr Lys Cys Glu Val Pro Leu Asp Ile 210 215 220 Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr Leu Gln Met Ser Ala Asp 225 230 235 240 Pro Tyr Gly Asp Ser Met Phe Phe Cys Leu Arg Arg Glu Gln Leu Phe 245 250 255 Ala Arg His Phe Trp Asn Arg Ala Gly Thr Met Gly Asp Thr Val Pro 260 265 270 Gln Ser Leu Tyr Ile Lys Gly Thr Gly Met Arg Ala Ser Pro Gly Ser 275 280 285 Cys Val Tyr Ser Pro Ser Pro Ser Gly Ser Ile Val Thr Ser Asp Ser 290 295 300 Gln Leu Phe Asn Lys Pro Tyr Trp Leu His Lys Ala Gln Gly His Asn 305 310 315 320 Asn Gly Val Cys Trp His Asn Gln Leu Phe Val Thr Val Val Asp Thr 325 330 335 Thr Arg Ser Thr Asn Leu Thr Ile Cys Ala Ser Thr Gln Ser Pro Val 340 345 350 Pro Gly Gln Tyr Asp Ala Thr Lys Phe Lys Gln Tyr Ser Arg His Val 355 360 365 Glu Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu 370 375 380 Thr Ala Asp Val Met Ser Tyr Ile His Ser Met Asn Ser Ser Ile Leu 385 390 395 400 Glu Asp Trp Asn Phe Gly Val Pro Pro Pro Pro Thr Thr Ser Leu Val 405 410 415 Asp Thr Tyr Arg Phe Val Gln Ser Val Ala Ile Thr Cys Gln Lys Asp 420 425 430 Ala Ala Pro Ala Glu Asn Lys Asp Pro Tyr Asp Lys Leu Lys Phe Trp 435 440 445 Asn Val Asp Leu Lys Glu Lys Phe Ser Leu Asp Leu Asp Gln Tyr Pro 450 455 460 Leu Gly Arg Lys Phe Leu Val Gln Ala Gly Leu Arg Arg Lys Pro Thr 465 470 475 480 Ile Gly Pro Arg Lys Arg Ser Ala Pro Ser Ala Thr Thr Ser Ser Lys 485 490 495 Pro Ala Lys Arg Val Arg Val Arg Ala Arg Lys Phe Val Phe Leu Val 500 505 510 Leu Leu Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr 515 520 525 Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr 530 535 540 Pro Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu 545 550 555 560 Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val 565 570 575 Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe 580 585 590 Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg 595 600 605 Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu 610 615 620 Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln 625 630 635 640 Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys 645 650 655 Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys 660 665 670 Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys 675 680 685 Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp 690 695 700 Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg 705 710 715 720 Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro 725 730 735 Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg 740 745 750 Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala 755 760 765 Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys 770 775 780 Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp 785 790 795 800 Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys 805 810 815 Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile 820 825 830 Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe 835 840 845 Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile 850 855 860 Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe 865 870 875 880 Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu 885 890 895 Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu 900 905 910 Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn 915 920 925 Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser 930 935 940 Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg 945 950 955 960 Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr 965 970 975 Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe 980 985 990 Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly 995 1000 1005 Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu 1010 1015 1020 Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn 1025 1030 1035 Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr 1040 1045 1050 Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe 1055 1060 1065 Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg 1070 1075 1080 Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 1085 1090 1095 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln 1100 1105 1110 Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val 1115 1120 1125 Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 1130 1135 1140 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly 1145 1150 1155 Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly 1160 1165 1170 Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg 1175 1180 1185 Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met 1190 1195 1200 Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile 1205 1210 1215 Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu 1220 1225 1230 Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile 1235 1240 1245 Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly 1250 1255 1260 Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val 1265 1270 1275 Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln 1280 1285 1290 Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe 1295 1300 1305 Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe 1310 1315 1320 Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 1325 1330 1335 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg 1340 1345 1350 Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro 1355 1360 1365 Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 1370 1375 1380 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala 1385 1390 1395 Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn 1400 1405 1410 Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu 1415 1420 1425 Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser 1430 1435 1440 Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val 1445 1450 1455 Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser 1460 1465 1470 Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser 1475 1480 1485 Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile 1490 1495 1500 Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu 1505 1510 1515 Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr 1520 1525 1530 Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe 1535 1540 1545 Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro 1550 1555 1560 His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1565 1570 1575 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala 1580 1585 1590 His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp 1595 1600 1605 Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1610 1615 1620 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile 1625 1630 1635 Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser 1640 1645 1650 Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro 1655 1660 1665 Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val 1670 1675 1680 Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn 1685 1690 1695 Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu 1700 1705 1710 Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala 1715 1720 1725 Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met 1730 1735 1740 Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser 1745 1750 1755 Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly 1760 1765 1770 Val Lys Leu His Tyr Thr 1775 <210> 11 <211> 1777 <212> PRT <213> Artificial Sequence <220> <223> fusion protein HPV16L1/SARS-CoV-2 spike protein <400> 11 Met Ser Leu Trp Leu Pro Ser Glu Ala Thr Val Tyr Leu Pro Pro Val 1 5 10 15 Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr Val Ala Arg Thr Asn 20 25 30 Ile Tyr Tyr His Ala Gly Thr Ser Arg Leu Leu Ala Val Gly His Pro 35 40 45 Tyr Phe Pro Ile Lys Lys Pro Asn Asn Asn Lys Ile Leu Val Pro Lys 50 55 60 Val Ser Gly Leu Gln Tyr Arg Val Phe Arg Ile His Leu Pro Asp Pro 65 70 75 80 Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln 85 90 95 Arg Leu Val Trp Ala Cys Val Gly Val Glu Val Gly Arg Gly Gln Pro 100 105 110 Leu Gly Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Leu Asp Asp 115 120 125 Thr Glu Asn Ala Ser Ala Tyr Ala Ala Asn Ala Gly Val Asp Asn Arg 130 135 140 Glu Cys Ile Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Ile Gly 145 150 155 160 Cys Lys Pro Pro Ile Gly Glu His Trp Gly Lys Gly Ser Pro Cys Thr 165 170 175 Asn Val Ala Val Asn Pro Gly Asp Cys Pro Pro Leu Glu Leu Ile Asn 180 185 190 Thr Val Ile Gln Asp Gly Asp Met Val Asp Thr Gly Phe Gly Ala Met 195 200 205 Asp Phe Thr Thr Leu Gln Ala Asn Lys Ser Glu Val Pro Leu Asp Ile 210 215 220 Cys Thr Ser Ile Cys Lys Tyr Pro Asp Tyr Ile Lys Met Val Ser Glu 225 230 235 240 Pro Tyr Gly Asp Ser Leu Phe Phe Tyr Leu Arg Arg Glu Gln Met Phe 245 250 255 Val Arg His Leu Phe Asn Arg Ala Gly Ala Val Gly Glu Asn Val Pro 260 265 270 Asp Asp Leu Tyr Ile Lys Gly Ser Gly Ser Thr Ala Asn Leu Ala Ser 275 280 285 Ser Asn Tyr Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Asp Ala 290 295 300 Gln Ile Phe Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn 305 310 315 320 Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe Val Thr Val Val Asp Thr 325 330 335 Thr Arg Ser Thr Asn Met Ser Leu Cys Ala Ala Ile Ser Thr Ser Glu 340 345 350 Thr Thr Tyr Lys Asn Thr Asn Phe Lys Glu Tyr Leu Arg His Gly Glu 355 360 365 Glu Tyr Asp Leu Gln Phe Ile Phe Gln Leu Cys Lys Ile Thr Leu Thr 370 375 380 Ala Asp Val Met Thr Tyr Ile His Ser Met Asn Ser Thr Ile Leu Glu 385 390 395 400 Asp Trp Asn Phe Gly Leu Gln Pro Pro Pro Gly Gly Thr Leu Glu Asp 405 410 415 Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile Ala Cys Gln Lys His Thr 420 425 430 Pro Pro Ala Pro Lys Glu Asp Pro Leu Lys Lys Tyr Thr Phe Trp Glu 435 440 445 Val Asn Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu 450 455 460 Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Phe 465 470 475 480 Thr Leu Gly Lys Arg Lys Ala Thr Pro Thr Thr Ser Ser Thr Ser Thr 485 490 495 Thr Ala Lys Arg Lys Lys Arg Lys Leu Phe Val Phe Leu Val Leu Leu 500 505 510 Pro Leu Val Ser Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu 515 520 525 Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp 530 535 540 Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu 545 550 555 560 Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly 565 570 575 Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp 580 585 590 Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp 595 600 605 Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val 610 615 620 Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys 625 630 635 640 Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp 645 650 655 Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe 660 665 670 Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly 675 680 685 Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr 690 695 700 Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu 705 710 715 720 Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly 725 730 735 Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr 740 745 750 Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala 755 760 765 Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn 770 775 780 Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu 785 790 795 800 Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile 805 810 815 Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg 820 825 830 Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala 835 840 845 Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn 850 855 860 Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr 865 870 875 880 Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe 885 890 895 Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg 900 905 910 Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys 915 920 925 Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn 930 935 940 Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe 945 950 955 960 Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile 965 970 975 Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys 980 985 990 Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly 995 1000 1005 Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 1010 1015 1020 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val 1025 1030 1035 Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr 1040 1045 1050 Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln 1055 1060 1065 Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro 1070 1075 1080 Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly 1085 1090 1095 Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala 1100 1105 1110 Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 1115 1120 1125 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly 1130 1135 1140 Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu 1145 1150 1155 His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 1160 1165 1170 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala 1175 1180 1185 Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu 1190 1195 1200 Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile 1205 1210 1215 Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val 1220 1225 1230 Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly 1235 1240 1245 Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe 1250 1255 1260 Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln 1265 1270 1275 Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr 1280 1285 1290 Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln 1295 1300 1305 Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu 1310 1315 1320 Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile 1325 1330 1335 Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu 1340 1345 1350 Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 1355 1360 1365 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala 1370 1375 1380 Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu 1385 1390 1395 Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 1400 1405 1410 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala 1415 1420 1425 Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser 1430 1435 1440 Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln 1445 1450 1455 Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn 1460 1465 1470 Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu 1475 1480 1485 Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly 1490 1495 1500 Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg 1505 1510 1515 Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met 1520 1525 1530 Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly 1535 1540 1545 Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly 1550 1555 1560 Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn 1565 1570 1575 Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His Phe 1580 1585 1590 Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1595 1600 1605 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 1610 1615 1620 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn 1625 1630 1635 Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys 1640 1645 1650 Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val 1655 1660 1665 Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile 1670 1675 1680 Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn 1685 1690 1695 Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr 1700 1705 1710 Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu 1715 1720 1725 Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys Met Thr Ser 1730 1735 1740 Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly Ser Cys Cys 1745 1750 1755 Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys 1760 1765 1770 Leu His Tyr Thr 1775 <210> 12 <211> 1407 <212> PRT <213> Artificial Sequence <220> <223> fusion protein HBSAg/SARS-CoV-2 spike protein <400> 12 Met Asn Phe Leu Gly Gly Thr Thr Val Cys Leu Gly Gln Asn Ser Gln 1 5 10 15 Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys Pro 20 25 30 Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile 35 40 45 Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly 50 55 60 Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr 65 70 75 80 Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Tyr 85 90 95 Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile 100 105 110 Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala 115 120 125 Ser Ala Arg Phe Ser Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser 130 135 140 Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr 145 150 155 160 Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg 165 170 175 Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser 180 185 190 Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr 195 200 205 Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe 210 215 220 Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr 225 230 235 240 Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr 245 250 255 Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe 260 265 270 Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu 275 280 285 Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser 290 295 300 Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn 305 310 315 320 Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr 325 330 335 Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe 340 345 350 Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr 355 360 365 Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly 370 375 380 Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly 385 390 395 400 Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr 405 410 415 Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys 420 425 430 Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser 435 440 445 Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile 450 455 460 Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala 465 470 475 480 Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp 485 490 495 Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr 500 505 510 Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr 515 520 525 Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro 530 535 540 Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp 545 550 555 560 Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys 565 570 575 Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn 580 585 590 Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly 595 600 605 Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu 610 615 620 Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr 625 630 635 640 Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val 645 650 655 Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn 660 665 670 Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn 675 680 685 Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr 690 695 700 Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr 705 710 715 720 Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr 725 730 735 Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val 740 745 750 Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr 755 760 765 Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly 770 775 780 Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala 785 790 795 800 Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala 805 810 815 Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly 820 825 830 Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr 835 840 845 Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr 850 855 860 Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu 865 870 875 880 Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn 885 890 895 Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu 900 905 910 Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp 915 920 925 Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro 930 935 940 Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu 945 950 955 960 Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile 965 970 975 Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val 980 985 990 Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala 995 1000 1005 Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly 1010 1015 1020 Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe 1025 1030 1035 Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys 1040 1045 1050 Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp 1055 1060 1065 Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val 1070 1075 1080 Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu 1085 1090 1095 Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu 1100 1105 1110 Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu 1115 1120 1125 Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln 1130 1135 1140 Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala 1145 1150 1155 Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 1160 1165 1170 Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1175 1180 1185 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1190 1195 1200 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys 1205 1210 1215 Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1220 1225 1230 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr 1235 1240 1245 Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly 1250 1255 1260 Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp 1265 1270 1275 Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 1280 1285 1290 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val 1295 1300 1305 Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys 1310 1315 1320 Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr 1325 1330 1335 Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile 1340 1345 1350 Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys 1355 1360 1365 Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly 1370 1375 1380 Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys 1385 1390 1395 Gly Val Lys Leu His Tyr Thr Ala Ala 1400 1405 <210> 13 <211> 665 <212> DNA <213> Artificial Sequence <220> <223> RBD SARS-CoV-2 spike protein nucleic acid <400> 13 gctagcgacg ccaccatgag agtccaacca acagaatcta ttgttagatt tcctaatatt 60 acaaacttgt gcccttttgg tgaagttttt aacgccacca gatttgcatc tgtttatgct 120 tggaacagga agagaatcag caactgtgtt gctgattatt ctgtcctata taattccgca 180 tcattttcca cttttaagtg ttatggagtg tctcctacta aattaaatga tctctgcttt 240 actaatgtct atgcagattc atttgtaatt agaggtgatg aagtcagaca aatcgctcca 300 gggcaaactg gaaagattgc tgattataat tataaattac cagatgattt tacaggctgc 360 gttatagctt ggaattctaa caatcttgat tctaaggttg gtggtaatta taattacctg 420 tatagattgt ttaggaagtc taatctcaaa ccttttgaga gagatatttc aactgaaatc 480 tatcaggccg gtagcacacc ttgtaatggt gttgaaggtt ttaattgtta ctttccttta 540 caatcatatg gtttccaacc cactaatggt gttggttacc aaccatacag agtagtagta 600 ctttcttttg aacttctaca tgcaccagca actgtttgtg gacctaaaaa gtgataagcg 660 gccgc 665 <210> 14 <211> 665 <212> DNA <213> Artificial Sequence <220> <223> RBD SARS-CoV-2 spike protein nucleic acid sequence - human codon optimized <400> 14 gctagcgacg ccaccatgag agtgcagcct acagagtcta tcgtgcggtt ccccaacatc 60 accaatctgt gccctttcgg cgaggtgttc aacgccacaa gatttgccag cgtgtacgcc 120 tggaaccgga agagaatcag caactgcgtg gccgactaca gcgtgctgta caatagcgcc 180 agcttcagca ccttcaagtg ctacggcgtg tcccctacca agctgaacga cctgtgcttc 240 accaatgtgt acgccgacag cttcgtgatc agaggcgacg aagttcggca gatcgctcct 300 ggacagacag gcaagatcgc cgattacaac tacaagctgc ccgacgactt caccggctgc 360 gtgatcgcct ggaatagcaa caacctggac agcaaagtcg gcggcaacta caactacctg 420 taccggctgt tccggaagtc caacctgaag cctttcgagc gggacatcag caccgagatc 480 tatcaggccg gcagcacccc ttgtaatggc gtggaaggct tcaactgcta cttcccactg 540 cagtcctacg gcttccagcc tacaaacggc gtgggctacc agccttatag agtggtggtg 600 ctgagcttcg aactgctgca tgcccctgct acagtgtgcg gccccaagaa gtgataagcg 660 gccgc 665 <210> 15 <211> 212 <212> PRT <213> SARS-CoV-2 <400> 15 Met Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 1 5 10 15 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 20 25 30 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 35 40 45 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 50 55 60 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 65 70 75 80 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 85 90 95 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 100 105 110 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 115 120 125 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 130 135 140 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 145 150 155 160 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 165 170 175 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 180 185 190 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 195 200 205 Gly Pro Lys Lys 210 <210> 16 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> EAAAK linker consensus sequence <400> 16 Ala Glu Ala Ala Ala Lys Ala 1 5 <210> 17 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> (EAAAK)3 linker <400> 17 gaagccgccg ctaaagaggc cgctgccaaa gaagctgctg ctaag 45 <210> 18 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> (EAAAK)3 linker <400> 18 Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys 1 5 10 15 <210> 19 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> GS linker consensus sequence <400> 19 Gly Gly Gly Gly Ser 1 5 <210> 20 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> GS5 linker <400> 20 Gly Gly Gly Gly Ser 1 5 <210> 21 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> GS10 linker <400> 21 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 <210> 22 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> GS15 linker <400> 22 ggtggtggtg gtagcggtgg tggcggttca ggtggcggtg gttca 45 <210> 23 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> GS15 linker <400> 23 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser 1 5 10 15 <210> 24 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> GS20 linker <400> 24 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser 20 <210> 25 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> GS25 linker <400> 25 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser 20 25 <210> 26 <211> 1427 <212> DNA <213> Artificial Sequence <220> <223> HBSAg-(EAAAK)3-RBD <400> 26 gctagcgacg ccaccatgat tgcactgacc ctgtttaatc tggcagatac cctgttaggt 60 ggtctgccga ccgaactgat tagcagtgcc ggtggtcagc tgttttatag ccgtccggtt 120 gttagcgcaa atggtgaacc gaccgttaaa ctgtatacca gcgttgaaaa tgcacagcag 180 gataaaggta ttgcaattcc gcatgatatt gatctgggtg aaagccgtgt tgtgattcag 240 gattatgata atcagcatga acaggatcgt ccgacaccga gtccggcacc gagccgtccg 300 tttagcgttc tgcgtgcaaa tgatgttctg tggctgagcc tgaccgcagc agaatatgat 360 cagagcacct atggtagcag caccggtccg gtttatgtta gcgatagcgt taccctggtt 420 aatgttgcaa ccggtgcaca ggcagttgca cgtagcctgg attggaccaa agtgaccctg 480 gatggtcgtc cgctgagcac cattcagcag tatagcaaaa ccttttttgt tctgccgctg 540 cgtggtaaac tgagcttttg ggaagcaggc accaccaaag caggttatcc gtataactat 600 aataccaccg caagcgatca gctgctggtt gaaaacgcag caggtcatcg tgttgcaatt 660 agcacctata ccaccagttt aggtgcaggt ccggttagca ttagcgcagt tgcagttctg 720 gcaccgcatt cagccgaagc agccgctaaa gaagcagccg ctaaagaagc agccgctaaa 780 agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt gtgccctttt 840 ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag gaagagaatc 900 agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc cacttttaag 960 tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt ctatgcagat 1020 tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac tggaaagatt 1080 gctgattata attataaatt accagatgat tttacaggct gcgttatagc ttggaattct 1140 aacaatcttg attctaaggt tggtggtaat tataattacc tgtatagatt gtttaggaag 1200 tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc cggtagcaca 1260 ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata tggtttccaa 1320 cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt tgaacttcta 1380 catgcaccag caactgtttg tggacctaaa aagtgataag cggccgc 1427 <210> 27 <211> 1106 <212> DNA <213> Artificial Sequence <220> <223> HBSAg-(EAAAK)3-RBD nucleic acid sequence human codon optimised <400> 27 gctagcgacg ccaccatgaa ttttctcggc ggcacaacag tgtgcctggg ccagaatagc 60 cagtctccta ccagcaatca cagccccacc agctgtcctc caacctgtcc tggctacaga 120 tggatgtgcc tgcggcggtt catcatcttt ctgttcatcc tgctgctgtg cctgatcttc 180 ctgctggtgc tgctggatta ccagggaatg ctgcctgtgt gtcctctgat ccctggcagc 240 agcacaacaa gcacaggccc ttgcagaacc tgcacaacac cagctcaggg caccagcatg 300 taccctagct gctgttgtac caagcctagc gacggcaact gcacatgcat ccccattcct 360 agcagctggg ccttcggcaa gtttctgtgg gaatgggcca gcgccagatt ttccgaagcc 420 gccgctaaag aggccgctgc caaagaagct gctgctaaga gagtgcagcc caccgagtct 480 atcgtgcggt tccccaacat caccaatctg tgccctttcg gcgaggtgtt caacgccaca 540 agatttgcca gcgtgtacgc ctggaaccgg aagagaatca gcaactgcgt ggccgactac 600 agcgtgctgt acaatagcgc cagcttcagc accttcaagt gctacggcgt gtcccctacc 660 aagctgaacg acctgtgctt caccaatgtg tacgccgaca gcttcgtgat cagaggcgac 720 gaagttcggc agatcgctcc tggacagaca ggcaagatcg ccgattacaa ctacaagctg 780 cccgacgact tcaccggctg cgtgatcgcc tggaatagca acaacctgga cagcaaagtc 840 ggcggcaact acaactacct gtaccggctg ttccggaagt ccaacctgaa gcctttcgag 900 cgggacatca gcaccgaaat ctaccaggcc ggcagcaccc cttgtaatgg cgtggaaggc 960 ttcaactgct acttcccact gcagtcctac ggcttccagc ctacaaacgg cgtgggctac 1020 cagccttata gagtggtggt gctgagcttc gaactgctgc atgcccctgc tacagtgtgc 1080 ggccccaaga agtgataagc ggccgc 1106 <210> 28 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> HBSAg-(EAAAK)3-RBD <400> 28 Met Asn Phe Leu Gly Gly Thr Thr Val Cys Leu Gly Gln Asn Ser Gln 1 5 10 15 Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys Pro 20 25 30 Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile 35 40 45 Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly 50 55 60 Met Leu Pro Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr 65 70 75 80 Gly Pro Cys Arg Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Tyr 85 90 95 Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile 100 105 110 Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala 115 120 125 Ser Ala Arg Phe Ser Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu 130 135 140 Ala Ala Ala Lys Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro 145 150 155 160 Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg 165 170 175 Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val 180 185 190 Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys 195 200 205 Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn 210 215 220 Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile 225 230 235 240 Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro 245 250 255 Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp 260 265 270 Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys 275 280 285 Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln 290 295 300 Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe 305 310 315 320 Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln 325 330 335 Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala 340 345 350 Thr Val Cys Gly Pro Lys Lys 355 <210> 29 <211> 1418 <212> DNA <213> Artificial Sequence <220> <223> HEV-GS15-RBD <400> 29 gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgctggg tggtctgccg 60 accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120 aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180 attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240 aatcagcatg aacaggatcg tccgaccccg agtccggcac cgagccgtcc gtttagcgtt 300 ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360 tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420 accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480 ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540 ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600 gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660 accaccagtc tgggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720 agcgcaggtg gaggaggttc tggaggcggt ggaagtggtg gcggaggtag cagagtccaa 780 ccaacagaat ctattgttag atttcctaat attacaaact tgtgcccttt tggtgaagtt 840 tttaacgcca ccagatttgc atctgtttat gcttggaaca ggaagagaat cagcaactgt 900 gttgctgatt attctgtcct atataattcc gcatcatttt ccacttttaa gtgttatgga 960 gtgtctccta ctaaattaaa tgatctctgc tttactaatg tctatgcaga ttcatttgta 1020 attagaggtg atgaagtcag acaaatcgct ccagggcaaa ctggaaagat tgctgattat 1080 aattataaat taccagatga ttttacaggc tgcgttatag cttggaattc taacaatctt 1140 gattctaagg ttggtggtaa ttataattac ctgtatagat tgtttaggaa gtctaatctc 1200 aaaccttttg agagagatat ttcaactgaa atctatcagg ccggtagcac accttgtaat 1260 ggtgttgaag gttttaattg ttactttcct ttacaatcat atggtttcca acccactaat 1320 ggtgttggtt accaaccata cagagtagta gtactttctt ttgaacttct acatgcacca 1380 gcaactgttt gtggacctaa aaagtgataa gcggccgc 1418 <210> 30 <211> 1418 <212> DNA <213> Artificial Sequence <220> <223> HEV-GS15-RBD nucleic acid sequence optimized for E.coli expression <400> 30 gagctcatga ttgcactgac cctgtttaat ctggcagata ccctgttagg tggtctgccg 60 accgaactga ttagcagtgc cggtggtcag ctgttttata gccgtccggt tgttagcgca 120 aatggtgaac cgaccgttaa actgtatacc agcgttgaaa atgcacagca ggataaaggt 180 attgcaattc cgcatgatat tgatctgggt gaaagccgtg ttgtgattca ggattatgat 240 aatcagcatg aacaggatcg tccgacaccg agtccggcac cgagccgtcc gtttagcgtt 300 ctgcgtgcaa atgatgttct gtggctgagc ctgaccgcag cagaatatga tcagagcacc 360 tatggtagca gcaccggtcc ggtttatgtt agcgatagcg ttaccctggt taatgttgca 420 accggtgcac aggcagttgc acgtagcctg gattggacca aagtgaccct ggatggtcgt 480 ccgctgagca ccattcagca gtatagcaaa accttttttg ttctgccgct gcgtggtaaa 540 ctgagctttt gggaagcagg caccaccaaa gcaggttatc cgtataacta taataccacc 600 gcaagcgatc agctgctggt tgaaaacgca gcaggtcatc gtgttgcaat tagcacctat 660 accaccagtt taggtgcagg tccggttagc attagcgcag ttgcagttct ggcaccgcat 720 tcagccggtg gtggtggtag cggtggtggc ggttcaggtg gcggtggttc acgtgttcag 780 ccgacagaaa gcattgttcg ttttccgaat atcaccaatc tgtgtccgtt tggcgaagtt 840 tttaatgcaa cccgttttgc aagcgtttat gcctggaatc gtaaacgtat tagcaattgc 900 gttgccgatt atagcgtgct gtataatagc gcaagcttta gcacctttaa atgctatggt 960 gttagcccga ccaaactgaa tgatctgtgt tttaccaatg tgtatgccga tagctttgtg 1020 attcgtggtg atgaagttcg tcagattgca ccgggtcaga ccggtaaaat tgcagattat 1080 aactacaaac tgccggatga ttttacgggt tgtgttattg catggaatag caataacctg 1140 gatagcaaag ttggtggcaa ctataactat ctgtatcgcc tgtttcgtaa gagcaatctg 1200 aaaccgtttg aacgtgatat tagcaccgaa atttatcagg caggtagcac cccgtgcaat 1260 ggtgttgaag gttttaattg ttattttccg ctgcagagct atggttttca gcctaccaat 1320 ggtgtgggtt atcagccgta tcgtgttgtt gttctgtcat ttgaactgct gcatgcaccg 1380 gcaaccgttt gtggtccgaa aaaatgataa gcggccgc 1418 <210> 31 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> HEV-GS15-RBD <400> 31 Met Ile Ala Leu Thr Leu Phe Asn Leu Ala Asp Thr Leu Leu Gly Gly 1 5 10 15 Leu Pro Thr Glu Leu Ile Ser Ser Ala Gly Gly Gln Leu Phe Tyr Ser 20 25 30 Arg Pro Val Val Ser Ala Asn Gly Glu Pro Thr Val Lys Leu Tyr Thr 35 40 45 Ser Val Glu Asn Ala Gln Gln Asp Lys Gly Ile Ala Ile Pro His Asp 50 55 60 Ile Asp Leu Gly Glu Ser Arg Val Val Ile Gln Asp Tyr Asp Asn Gln 65 70 75 80 His Glu Gln Asp Arg Pro Thr Pro Ser Pro Ala Pro Ser Arg Pro Phe 85 90 95 Ser Val Leu Arg Ala Asn Asp Val Leu Trp Leu Ser Leu Thr Ala Ala 100 105 110 Glu Tyr Asp Gln Ser Thr Tyr Gly Ser Ser Thr Gly Pro Val Tyr Val 115 120 125 Ser Asp Ser Val Thr Leu Val Asn Val Ala Thr Gly Ala Gln Ala Val 130 135 140 Ala Arg Ser Leu Asp Trp Thr Lys Val Thr Leu Asp Gly Arg Pro Leu 145 150 155 160 Ser Thr Ile Gln Gln Tyr Ser Lys Thr Phe Phe Val Leu Pro Leu Arg 165 170 175 Gly Lys Leu Ser Phe Trp Glu Ala Gly Thr Thr Lys Ala Gly Tyr Pro 180 185 190 Tyr Asn Tyr Asn Thr Thr Ala Ser Asp Gln Leu Leu Val Glu Asn Ala 195 200 205 Ala Gly His Arg Val Ala Ile Ser Thr Tyr Thr Thr Ser Leu Gly Ala 210 215 220 Gly Pro Val Ser Ile Ser Ala Val Ala Val Leu Ala Pro His Ser Ala 225 230 235 240 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg 245 250 255 Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu 260 265 270 Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr 275 280 285 Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val 290 295 300 Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser 305 310 315 320 Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser 325 330 335 Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr 340 345 350 Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly 355 360 365 Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly 370 375 380 Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro 385 390 395 400 Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro 405 410 415 Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr 420 425 430 Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val 435 440 445 Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro 450 455 460 Lys Lys 465 <210> 32 <211> 4566 <212> DNA <213> Artificial Sequence <220> <223> HBSAg-(EAAAK)3-full-length SARS-CoV-2 spike protein nucleic acid sequence human codon optimised <400> 32 aagcttgccg ccaccatgga gaacatcaca tcaggattcc taggacccct gctcgtgtta 60 caggcggggt ttttcttgtt gacaagaatc ctcacaatac cacagagtct agactcgtgg 120 tggacttctc tcaattttct agggggatca cccgtgtgtc tgggccaaaa ttcgcagtcc 180 ccaacctcca atcactcacc aacctcttgt cctccaattt gtcctggcta tcgctggatg 240 tgtctgcggc gttttatcat attcctcttc atcctgctgc tatgcctcat cttcttgttg 300 gttcttctgg actaccaggg tatgttgccc gtttgtcctc taattccagg atcaacaact 360 accaacacgg gaccatgcaa gacctgcacg actcctgctc aaggaaactc tatgtttccc 420 tcttgttgct gtacaaaacc taccgacgga aactgcactt gtattcccat cccatcatcc 480 tgggctttcg caaaatacct atgggagtgg gcctcagtcc gtttctcctg gctcagttta 540 ctagtgccat ttgttcagtg gttcgtaggg ctttccccca ctgtttggct ttccgctata 600 tggatgatgt ggtattgggg gccaagtctg tacagcatcg tgagtccctt tatacctcta 660 ttaccaattt tcttttgtct ttgggtatac attgaggctg ccgcaaagga agccgcagct 720 aaagaggcag ctgccaagtt cgtgttcctg gttctgctgc ccctggtgtc tagccagtgc 780 gtgaacctga ccaccagaac acagctgcct ccagcctaca ccaacagctt caccagaggc 840 gtgtactacc ccgacaaggt gttccggtcc tccgtgctgc attctaccca ggacctgttc 900 ctgcctttct tctccaacgt gacctggttc cacgccatcc atgtgtctgg caccaacggc 960 accaagagat tcgacaaccc cgtgctgcct ttcaacgacg gggtgtactt tgcctccacc 1020 gagaagtcca acatcatcag aggctggatc ttcggcacaa ccctggacag caagacccag 1080 agcctgctga tcgtgaacaa cgccaccaac gtggtcatca aagtgtgcga gttccagttc 1140 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcctg gatggaatcc 1200 gagttccggg tgtactcctc cgccaacaac tgcaccttcg aatacgtgtc ccagcctttc 1260 ctgatggacc tggaaggcaa gcagggcaac ttcaagaacc tgcgcgagtt cgtgttcaag 1320 aacatcgacg gctacttcaa gatctactcc aagcacaccc ctatcaacct cgtgcgggat 1380 ctgcctcagg gcttctctgc tctggaaccc ctggtggatc tgcccatcgg catcaacatc 1440 acccggtttc agaccctgct ggccctgcac cggtcttatt tgacccctgg cgactcctct 1500 tctggctgga ctgctggcgc cgctgcttac tatgtgggct acctgcagcc tcggaccttt 1560 ctgctgaagt acaacgagaa tggcaccatc accgacgccg tggactgtgc tctggatcct 1620 ctgtccgaga caaagtgcac cctgaagtcc ttcaccgtgg aaaagggcat ctaccagacc 1680 tccaacttcc gggtgcagcc caccgagtct atcgtgcggt tccctaacat caccaacctg 1740 tgtcctttcg gcgaggtgtt caatgccacc agattcgcct ctgtgtacgc ctggaaccgg 1800 aagcggatct ctaactgcgt ggccgactac agcgtgctgt acaactccgc ctccttcagc 1860 accttcaagt gctacggcgt gtcccctaca aagctgaacg acctgtgctt cacaaacgtg 1920 tacgccgaca gcttcgtgat ccggggagat gaagtgcggc agatcgctcc tggacagacc 1980 ggcaagatcg ccgattacaa ctacaagctg cccgacgact tcaccggctg tgtgatcgct 2040 tggaactcca acaacctgga ctccaaagtc ggcggcaact acaactacct gtaccggctg 2100 ttccggaagt ctaacctgaa gcctttcgag cgggacatca gcaccgagat ctaccaggct 2160 ggcagcaccc cttgtaacgg cgtggaaggc ttcaactgct acttcccact gcagtcctac 2220 ggctttcagc ctaccaatgg cgtgggctat cagccctaca gagtggtggt gctgtccttc 2280 gagctgctgc atgctcctgc taccgtgtgc ggccctaaga aatctaccaa cctggtcaag 2340 aacaaatgcg tgaacttcaa cttcaacggc ctgaccggca ccggcgtgct gacagagtcc 2400 aacaagaagt tcctgccatt ccagcagttc ggccgggata tcgccgatac cacagatgcc 2460 gtcagggacc ctcagacact ggaaatcctg gacatcaccc cttgctcctt cggcggagtg 2520 tctgtgatca ccccaggcac caacacctct aaccaggtgg ccgtgctgta tcaggacgtg 2580 aactgtaccg aggtgcccgt ggctatccat gccgatcagc tgacccctac atggcgcgtg 2640 tactccaccg gctctaacgt gttccagaca agagctggct gtctgatcgg cgctgagcac 2700 gtgaacaatt cctacgagtg cgacatcccc atcggagccg gaatctgcgc ctcttatcag 2760 acccagacca actctcccag acgggccaga tctgtggcca gccagtctat cattgcttac 2820 accatgagcc tgggcgccga gaactctgtg gcctacagca acaactctat cgctatcccc 2880 accaacttca ccatctccgt gaccacagag atcctgccag tgtccatgac caagaccagc 2940 gtggactgca ccatgtacat ctgcggcgac tctaccgagt gctccaacct gctgctccag 3000 tacggctcct tctgcaccca gctgaataga gccctgaccg gaatcgccgt ggaacaggac 3060 aagaacaccc aagaggtgtt cgcccaagtg aagcagatct acaagacccc tcctatcaag 3120 gacttcggcg gcttcaattt ctcccagatt ctgcccgatc ctagcaagcc ctccaagcgg 3180 tctttcatcg aggacctgct gttcaacaaa gtgacactgg ccgacgccgg cttcatcaag 3240 cagtacggcg actgtctggg cgacattgcc gctagggatc tgatctgcgc ccagaagttt 3300 aacggactga cagtgctgcc tcctctgctg accgatgaga tgatcgccca gtacacctcc 3360 gcactgctgg ctggcacaat cacctctgga tggacatttg gcgctggcgc tgctctgcaa 3420 atcccattcg ctatgcaaat ggcctaccgg ttcaacggca tcggcgtgac ccagaatgtg 3480 ctgtacgaga accagaagct gatcgccaac cagttcaaca gcgccatcgg aaagatccag 3540 gacagcctgt ccagcaccgc ttctgccctg ggaaagctgc aggatgtggt caaccagaac 3600 gctcaggccc tgaacaccct cgtgaagcag ctgtctagca acttcggcgc catctcctct 3660 gtgctgaacg atatcctgag ccggctggac aaggtggaag ccgaggtgca gatcgacaga 3720 ctgatcaccg gacggctgca gtccctgcag acctatgtta cccagcagct gatccgggct 3780 gccgagatta gagcctctgc caatctggcc gcaaccaaga tgtctgagtg tgtgctggga 3840 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgagctt ccctcagtct 3900 gctcctcacg gcgtggtgtt tctgcacgtg acctacgtgc ccgctcaaga gaagaacttt 3960 accaccgctc ctgccatctg ccacgacggc aaggctcact ttcctagaga aggcgtgttc 4020 gtgtctaacg gcacccattg gttcgtgaca cagcggaact tctacgagcc ccagatcatc 4080 accaccgaca acaccttcgt gtccggcaac tgcgacgtcg tgatcggaat tgtgaacaat 4140 accgtgtacg accctctgca gcccgagctg gactccttca aagaggaact ggacaagtac 4200 tttaagaacc acacaagccc cgacgtggac ctgggagaca tctctggcat caacgcctcc 4260 gtggtcaaca tccagaaaga gatcgaccgg ctgaacgagg tggccaagaa tctgaacgag 4320 tccctgatcg acctgcaaga actggggaag tacgagcagt acatcaagtg gccctggtac 4380 atctggctgg gctttatcgc tggcctgatc gctatcgtga tggtcacaat catgctgtgc 4440 tgtatgacct cctgttgctc ctgcctgaag ggctgctgct cttgcggctc ttgctgcaag 4500 ttcgacgagg acgactctga gcccgtgctg aaaggcgtga agctgcacta tacctgatga 4560 ctcgag 4566 <210> 33 <211> 1513 <212> PRT <213> Artificial Sequence <220> <223> HBSAg-(EAAAK)3-full-length SARS-CoV-2 spike protein <400> 33 Met Glu Asn Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln 1 5 10 15 Ala Gly Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu 20 25 30 Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ser Pro Val Cys 35 40 45 Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser 50 55 60 Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe 65 70 75 80 Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val 85 90 95 Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly 100 105 110 Ser Thr Thr Thr Asn Thr Gly Pro Cys Lys Thr Cys Thr Thr Pro Ala 115 120 125 Gln Gly Asn Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Thr Asp 130 135 140 Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Lys 145 150 155 160 Tyr Leu Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu 165 170 175 Val Pro Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu 180 185 190 Ser Ala Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Ser Ile 195 200 205 Val Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val 210 215 220 Tyr Ile Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala 225 230 235 240 Lys Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 245 250 255 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 260 265 270 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 275 280 285 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 290 295 300 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 305 310 315 320 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 325 330 335 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 340 345 350 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 355 360 365 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 370 375 380 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 385 390 395 400 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 405 410 415 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 420 425 430 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 435 440 445 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 450 455 460 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 465 470 475 480 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 485 490 495 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 500 505 510 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 515 520 525 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 530 535 540 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 545 550 555 560 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 565 570 575 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 580 585 590 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 595 600 605 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 610 615 620 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 625 630 635 640 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 645 650 655 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 660 665 670 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 675 680 685 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 690 695 700 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 705 710 715 720 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 725 730 735 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 740 745 750 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 755 760 765 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 770 775 780 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 785 790 795 800 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 805 810 815 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 820 825 830 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 835 840 845 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 850 855 860 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 865 870 875 880 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 885 890 895 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 900 905 910 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 915 920 925 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 930 935 940 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 945 950 955 960 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 965 970 975 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 980 985 990 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 995 1000 1005 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala 1010 1015 1020 Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly 1025 1030 1035 Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 1040 1045 1050 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu 1055 1060 1065 Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp 1070 1075 1080 Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu 1085 1090 1095 Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr 1100 1105 1110 Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe 1115 1120 1125 Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala 1130 1135 1140 Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu 1145 1150 1155 Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys 1160 1165 1170 Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu 1175 1180 1185 Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val 1190 1195 1200 Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn 1205 1210 1215 Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile 1220 1225 1230 Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 1235 1240 1245 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 1250 1255 1260 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys 1265 1270 1275 Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1280 1285 1290 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val 1295 1300 1305 Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His 1310 1315 1320 Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn 1325 1330 1335 Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 1340 1345 1350 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val 1355 1360 1365 Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro 1370 1375 1380 Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn 1385 1390 1395 His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn 1400 1405 1410 Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu 1415 1420 1425 Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu 1430 1435 1440 Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu 1445 1450 1455 Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met 1460 1465 1470 Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1475 1480 1485 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro 1490 1495 1500 Val Leu Lys Gly Val Lys Leu His Tyr Thr 1505 1510

Claims

서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 코딩하며, 재조합 발현에 대해 최적화된 단리된 폴리뉴클레오티드.
제1항에 있어서,
(a) 에스케리키아 콜라이;
(b) 효모, 바람직하게는 코마가타엘라 또는 사카로미세스; 및/또는
(c) 포유동물 세포, 바람직하게는 인간 세포
로부터 선택되는 숙주 세포에서의 발현에 대해 최적화된 폴리뉴클레오티드.
제1항 또는 제2항에 있어서, 하나 이상의 시스-작용성 서열 모티프가 생략되고, 상기 하나 이상의 시스-작용성 서열 모티프가 독립적으로
(a) 내부 TATA-박스;
(b) chi-부위;
(c) 리보솜 진입 부위;
(d) 서열의 AT-풍부 및/또는 GC-풍부 스트레치;
(e) RNA 불안정성 모티프;
(f) 반복 서열 및/또는 RNA 2차 구조;
(g) 잠재 스플라이스 공여자 부위;
(h) 잠재 스플라이스 수용 부위; 및/또는
(i) (a) 내지 (i)의 임의의 조합
으로부터 선택되는 것인 폴리뉴클레오티드.
제1항 내지 제3항 중 어느 한 항에 있어서, 숙주 세포 게놈 내로 통합되는 폴리뉴클레오티드.
제1항 내지 제4항 중 어느 한 항에 있어서, 적어도 약 0.80, 바람직하게는 적어도 약 0.9, 보다 바람직하게는 적어도 약 0.93의 코돈 적응 지수 (CAI)를 갖는 폴리뉴클레오티드.
제1항 내지 제5항 중 어느 한 항에 있어서,
(a) 서열식별번호: 2에 대해 적어도 90% 동일성;
(b) 서열식별번호: 3에 대해 적어도 90% 동일성;
(c) 서열식별번호: 4에 대해 적어도 90% 동일성;
(d) 서열식별번호: 5에 대해 적어도 90% 동일성;
(e) 서열식별번호: 6에 대해 적어도 90% 동일성;
(f) 서열식별번호: 7에 대해 적어도 90% 동일성;
(g) 서열식별번호: 8에 대해 적어도 90% 동일성
(h) 서열식별번호: 13에 대해 적어도 90% 동일성
(i) 서열식별번호: 14에 대해 적어도 90% 서열 동일성,
(j) 서열식별번호: 26에 대해 적어도 90% 동일성
(k) 서열식별번호: 27에 대해 적어도 90% 동일성,
(l) 서열식별번호: 29에 대해 적어도 90% 동일성;
(m) 서열식별번호: 30에 대해 적어도 90% 동일성; 또는
(n) 서열식별번호: 32에 대해 적어도 90% 동일성
을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드.
제1항 내지 제6항 중 어느 한 항에 있어서, 코딩된 스파이크 단백질 또는 그의 단편이
(a) 천연 2019-nCoV 스파이크 단백질에 존재하는 입체형태적 에피토프를 보유하고/거나;
(b) 핵산 또는 코딩된 스파이크 단백질 또는 그의 단편이 대상체에게 투여될 때 스파이크 단백질 또는 그의 단편에 특이적인 중화 항체의 생성을 유발하고/거나;
(c) 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것
인 폴리뉴클레오티드.
프로모터에 작동가능하게 연결된, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 구축물.
서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 백신 조성물.
제9항에 있어서, 대상체에게 투여되었을 때 스파이크 단백질 또는 그의 단편에 대해 특이적인 중화 항체의 생성을 유발하는 조성물.
서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 발현하며, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
제11항에 있어서, 신호 펩티드를 추가로 포함하는, 스파이크 단백질 또는 그의 단편을 발현하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
제12항에 있어서, 신호 펩티드가 인간 세포로부터의 분비를 지시하는 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
제11항 내지 제13항 중 어느 한 항에 있어서, 하나 이상의 추가의 항원 또는 그의 단편, 바람직하게는 2019-nCoV로부터의 하나 이상의 추가의 항원 또는 그의 단편을 추가로 발현하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
제14항에 있어서, 스파이크 단백질 또는 그의 단편 및 하나 이상의 추가의 항원 또는 그의 단편이
(a) 융합 단백질로서; 또는
(b) 조합하여 사용하기 위한 개별 바이러스 벡터, RNA 백신 또는 DNA 플라스미드에서
발현되는 것인 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
제11항 내지 제15항 중 어느 한 항에 있어서, 제1항 내지 제7항 중 어느 한 항에 정의된 바와 같은 하나 이상의 폴리뉴클레오티드 또는 제8항의 발현 구축물을 포함하는 바이러스 벡터, RNA 백신 또는 DNA 플라스미드.
서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하고, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 융합 단백질.
제17항에 있어서,
(a) B형 간염 표면 항원, 또는 상기 B형 간염 표면 항원과 공통 항원 교차-반응성을 갖는 그의 단편;
(b) HPV 18 L1 단백질, 또는 상기 HPV 18 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편;
(c) E형 간염 P239 단백질, 또는 상기 E형 간염 P239 단백질과 공통 항원 교차-반응성을 갖는 그의 단편; 및/또는
(d) HPV 16 L1 단백질, 또는 상기 HPV 16 L1 단백질과 공통 항원 교차-반응성을 갖는 그의 단편
을 추가로 포함하는 융합 단백질이며;
임의로:
(i) 융합 단백질이 서열식별번호: 3, 5, 6, 8, 26, 27, 29, 30, 또는 32 중 어느 하나와 적어도 90% 동일성을 갖는 핵산 서열을 포함하거나 또는 그로 이루어진 폴리뉴클레오티드에 의해 코딩되고/거나;
(ii) 융합 단백질이 서열식별번호: 9, 10, 11, 12, 28, 31 또는 33 중 어느 하나와 적어도 90% 동일성을 갖는 아미노산 서열을 포함하거나 또는 그로 이루어진 것인
융합 단백질.
서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질, 또는 상기 스파이크 단백질과 공통 항원 교차-반응성을 갖는 그의 단편을 포함하며, 여기서 임의로 상기 단편은 바람직하게는 서열식별번호: 15와 적어도 90% 동일성을 갖는 2019-nCoV 스파이크 단백질의 수용체-결합 도메인 (RBD)을 포함하거나 또는 그로 이루어진 것인 바이러스-유사 입자 (VLP)이며;
여기서 임의로 상기 VLP는 제17항 또는 제18항에 정의된 바와 같은 융합 단백질을 포함하거나 또는 그로 이루어진 것인
바이러스-유사 입자 (VLP).
제1항에 정의된 바와 같은 2091-nCoV 스파이크 단백질 항원 또는 그의 단편에 특이적으로 결합하는 항체 또는 그의 결합 단편.
제20항에 있어서, 모노클로날 또는 폴리클로날 항체인 항체 또는 그의 결합 단편.
제20항 또는 제21항에 있어서, Fab, F(ab')2, Fv, scFv, Fd 또는 dAb인 항체 또는 그의 결합 단편.
제1항에 정의된 바와 같은 2019-nCoV 스파이크 단백질 또는 그의 단편에 특이적으로 결합하는 올리고뉴클레오티드 압타머.
제11항 내지 제16항 중 어느 한 항의 바이러스 벡터, 및/또는 RNA 백신 및/또는 DNA 플라스미드를 포함하는 백신 조성물.
2019-nCoV 감염의 치료 및/또는 예방에 사용하기 위한, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드, 및/또는 제8항의 발현 구축물, 및/또는 제9항, 제10항 및/또는 제24항 중 어느 한 항의 백신 조성물, 및/또는 제11항 내지 제16항 중 어느 한 항의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드, 및/또는 제19항의 바이러스-유사 입자, 및/또는 제17항 또는 제18항의 융합 단백질, 및/또는 제20항 내지 제22항 중 어느 한 항의 항체 및/또는 제23항의 압타머.
2019-nCoV 감염의 예방 및/또는 치료를 위한 의약의 제조에서의, 제1항 내지 제7항 중 어느 한 항의 폴리뉴클레오티드, 및/또는 제8항의 발현 구축물, 및/또는 제9항, 제10항 및/또는 제24항 중 어느 한 항의 백신 조성물, 및/또는 제11항 내지 제16항 중 어느 한 항의 바이러스 벡터 및/또는 RNA 백신 및/또는 DNA 플라스미드, 및/또는 제19항의 바이러스-유사 입자, 및/또는 제17항 또는 제18항의 융합 단백질, 및/또는 제20항 내지 제22항 중 어느 한 항의 항체, 및/또는 제23항의 압타머의 용도.
제1항 내지 제7항 중 어느 한 항에 정의된 바와 같은 폴리뉴클레오티드를 숙주 세포에서 발현시키는 단계, 및 임의로 스파이크 단백질 또는 단편을 정제하는 단계를 포함하는, 서열식별번호: 1과 적어도 90% 동일성을 갖는 2019-nCoV로부터의 스파이크 단백질 또는 그의 단편을 생산하는 방법.
제27항에 있어서, 상기 스파이크 단백질 또는 그의 단편을 제약상 허용되는 담체 또는 희석제와 함께 제제화하는 것을 추가로 포함하는 방법.