KR102647829B1

KR102647829B1 - 삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법

Info

Publication number: KR102647829B1
Application number: KR1020210052660A
Authority: KR
Inventors: 황인환; 시지엔 송; 엠디 레자울 이슬람 칸; 하이핑 디아오; 손은주; 최보화; 최장훈; 장은영; 이영재
Original assignee: 포항공과대학교 산학협력단; 대한민국(질병관리청장); 주식회사 바이오앱
Priority date: 2020-04-22
Filing date: 2021-04-22
Publication date: 2024-03-14
Also published as: WO2021215857A1; JP2023526770A; EP4141120A1; CN115867662A; KR20210130664A; EP4141120A4; US20230203101A1

Abstract

본 발명은 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질을 대량 생산하는 방법에 관한 것으로서, 자세하게는 면역원성 증진 및 효과적인 항원 전달을 위한 목적으로 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 발현하는 재조합 유전자를 디자인하는 방법 및 식물에서의 상기 재조합 스파이크 (Spike) 재조합 단백질을 대량 생산하는 방법에 관한 것이다.

Description

삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 {Production method for trimeric spike protein of Corona-19 virus in plants and its use for vaccination}

본 발명은 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질을 대량 생산하는 방법에 관한 것으로서, 자세하게는 면역원성 증진 및 효과적인 항원 전달을 위한 목적으로 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 발현하는 재조합 유전자를 디자인하는 방법 및 식물에서의 상기 재조합 스파이크(Spike) 재조합 단백질을 대량 생산하는 방법에 관한 것이다. 그리고 식물에서 생산된 삼량체 스파이크 단백질(trimeric spike protein)을 이용하여 COVID-19에 대해서 효과적인 백신물질을 제공하는 것이다.

최근에 식물에서 재조합 단백질을 저비용을 생산할 수 있는 가능성들이 제안되었으며, 이로 인하여 다양한 시도들이 진행되고 있다 (Schillberg et al., 2003; Holtz et al., 2015; Marusic et al., 2016). 특히 다양한 의료용 단백질의 생산 가능성 등을 확인하는 연구들이 진행되고 있다. 식물에서 재조합 단백질을 생산하는 경우에 다양한 장점들이 있을 수 있는데 그 중에 하나는 대장균 등 미생물에 존재하는 내독소와 같은 독소가 거의 존재하지 않는 다는 것과 인체에 감염할 수 있는 병원체들이 없다는 것이다. 또한 프리온과 같은 유해한 단백질도 없는 것으로 알려져 있어서 동물 세포나 미생물에 비해서 안전한 재조합 단백질을 생산할 수 있다는 것이다. 또한 제조 단가에서도 동물세포보다는 대단히 저렴하며, 식물을 재배하는 방법에 따라서 대규모 생산에 있어서는 대장균 등과 같은 미생물보다 더 경제적이다. 이러한 가능성을 실현하기 위해서는 몇 가지의 필수적인 기술들의 개발이 필요하다. 그 중에 가장 중요한 첫 번째 기술이 식물에서 유전자의 고발현을 유도할 수 있는 발현 벡터의 개발이다 (Staub et al, 2000; Regnard et al., 2010). 식물에서는 다양한 방법을 통해서 유전자의 발현을 유도할 수 있다. 재조합 유전자를 식물체의 게놈에 integration 시키는 방법, 엽록체의 게놈에 integration 시키는 방법, 아그로박테리움 (Agrobacterium)을 이용하여 일과성 있게 유전자를 발현시키는 방법 등 다양한 방법들이 가능하다 (Arzola et al., 2011; Werner et al., 2011). Nuclear genome이나 엽록체 genome에 재조합 유전자를 integration 시키는 방법은 기본적으로 형질전환체를 확보하는 과정을 통해서 식물에서 단백질을 생산하게 된다. 반면에 Agrobacterium을 식물 조직에 침투시켜 유전자의 일과성 발현을 유도하여 단백질을 생산하는 경우에는 형질 전환체의 제조 과정이 포함되지 않으므로 단백질 생산기간이 짧으며, 대체로 형질 전환체를 통한 단백질 생산에 비해서 단백질 생산 수준이 현저하게 높은 장점이 있다 (Arzola et al., 2011). 또한 식물이 가지고 있는 다른 유전자의 발현 억제 기작을 유전자 침묵 억제 인자를 co-infiltration하여 억제할 수 있으므로 단백질의 발현 수준을 더욱 높게 유도할 수 있다 (Garabagi et al., 2011). 그러나 일과성 발현을 하고자 할 때마다 목적 유전자를 포함하는 바이너리 벡터를 도입한 아그로박테리움 배양과 p38 유전자 침묵 억제 인자를 발현하는 바이너리 벡터를 도입한 아그로박테리움 배양을 따로 만들어서 이를 적절한 비율로 섞어서 co-infiltration 하는 과정을 수행하여야 하는 단점이 있다. 특히 두 종류의 아그로박테리움을 배양하는 경우에는 시간 및 경제적인 면에서 한계가 있다.

코로나 바이러스는 아데노바이러스, 리노바이러스와 함께 사람에게 감기를 일으키는 3대 바이러스 중 하나로, 사람과 다양한 감염될 수 있는 유전자 크기 27~32kb의 RNA 바이러스이다. 전자 현미경으로 봤을 때, 바이러스 입자 표면이 돌기처럼 튀어나와 있는데 이 모양이 마치 왕관처럼 생겼다고 해서 라틴어로 왕관을 뜻하는 “corona”에서 파생돼 명명됐다. 주로 추운 겨울철에 발생하는 성인 감기의 10 ~ 30를 차지하며, 두통이나 인후통, 기침을 동반한 코감기를 주 증상으로 한다. 코로나 바이러스는 1930년대 닭에서 처음으로 발견된 이후 개, 돼지, 조류 등의 동물에서 발견되었고, 1960년대에는 사람에서도 발견되었다. 코로나 바이러스는 동물과 사람 모두에게 발견되었고, 인간 활동 영역이 광범위해지면서 동물 사이에서만 유행하던 바이러스가 생존을 위해 유전자 변이를 일으켜 사람에게로 넘어오기도 한다. 예컨대 사스(박쥐와 사향 고양이), 메르스 (박쥐와 낙타), 코로나바이러스감염증-19(박쥐로 추정)가 이에 해당된다. 지금까지 발견된 코로나바이러스는 알파(Alpha)·베타(Beta)·감마(Gamma)·델타(Delta) 등 4속(屬)으로 분류된다. 여기서 알파는 다시 1a형과 1b형으로 나뉘고 베타는 2a, 2b, 2c, 2d형으로 나뉜다. 이 중 알파와 베타는 사람과 동물에게 감염되며, 감마와 델타는 동물에게 감염된다. 현재까지 확인된 인체 전염 코로나바이러스는 총 7종으로, HCoV 229E·HCoV NL63·HCoV OC43·HCoV HKU1·SARS-CoV·MERS-CoV·SARS-CoV-2가 이에 해당한다. 이 가운데 4종(229E, OC43, NL63, HKU1)은 감기와 비슷한 가벼운 증상만 일으킨다. 하지만 사스(SARS-CoV·중증급성호흡기증후군)와 메르스(MERS-CoV·중동호흡기증후군), 코로나바이러스감염증-19(SARS-CoV-2,severe acute respiratory syndrome coronavirus 2)는 중증 폐렴 등 심각한 호흡기 질환을 일으킬 수 있으며, 많은 사망자를 발생시킨다.

코로나-19 바이러스(COVID-19)은 2019년 12월 중국 우한에서 처음 발생한 이후 중국 전역과 전 세계로 확산된, 새로운 유형의 코로나바이러스(SARS-CoV-2)이다. 코로나-19 바이러스는 대단히 높은 전파율을 보여서 전염성이 특히 높다. 코로나-19 바이러스에 감염되면 약 2~14일(추정)의 잠복기를 거친 뒤 발열(37.5도) 및 기침이나 호흡곤란 등 호흡기 증상, 폐렴이 주증상으로 나타나지만 무증상 감염 사례도 드물지 않게 나오고 있다. 코로나-19 바이러스(COVID-19)의 스파이크 (S) 단백질은 대단히 커다란 ecto-domain 영역, 단일 막 관통(transmembrane domain; TMD) 및 짧은 세포질 꼬리 포함하는 타입 1의 막 당단백질(glycoprotein)이다. 상기 스파이크 단백질은 다른 코로나바이러스의 스파이크 (spike; S) 단백질과 마찬가지로 바이러스의 표면에 삼량체로 존재하며, 바이러스의 숙주세포 침입에 필요한 수용체 결합 영역 (receptor binding domain)과 세포 침입 시 바이러스 막과 세포 소기관막 사이의 융합을 유도하는 fusion peptide를 가지고 있으며, 자연 숙주에서 상기 스파이크 단백질에 대한 중화된 항체를 유도하는 등의 역할을 하는 것으로 알려져 있다. 상기 코로나 스파이크 단백질은 바이러스막의 표면에 삼량체로 존재한다. 따라서 삼량체형의 스파이크 단백질이 항원으로 작용할 것으로 생각되고 중화항체의 유도에도 삼량체가 중요할 것으로 생각된다. 비슷하게 인플루엔자 바이러스의 경우에도 HA 단백질이 바이러스의 표면에 삼량체로 존재하며 이 삼량체의 형성이 항원성이 높은 것으로 알려져 있다.

재조합 단백질은 안전성에서는 우수하지만 생 바이러스 (live virus)에 비해서는 면역원성이 낮고 생산단가가 높은 점이 단점이다. 따라서 이 안전성이 탁월한 재조합 단백질을 이용하여 효율적인 예방을 위해서는 다양한 면역반응을 유도할 수 있으며, 높은 면역반응을 유도할 수 있는 고면역원성의 재조합 단백질 백신을 제작하는 것이 필수적이며, 또한 효과적인 전달이 가능하도록 제작된 재조합 단백질이 필요하다.

코로나-19 바이러스의 재조합 스파이크 단백질을 이용하여 백신을 개발하고자 하였다. Spike protein은 COVID-19이 infection 하는 동안 S1과 S2의 두개의 subunit으로 processing이 일어나며 infection에 필요한 receptor에 binding 하는 domain은 S1에 존재하며, S2는 fusion peptide를 가지게 된다. 따라서 항원으로서 S1, S2, 또는 full length를 사용하였을 때 방어적인 면역효과에 있어서 어떤 효과를 줄지 예측하는 것은 쉽지 않다. S1은 RBD를 가지고 있으므로 RBD에 결합하는 항체를 유도할 수 있을 것이며 이러한 항체의 결합을 통해서 receptor에 결합을 방해하여 virus의 infection을 막을 수 있을 것이다. 반면에 S1은 가장 많은 mutation이 도입되는 부분을 포함하고 있으므로 다양한 변종을 커버할 수는 없을 가능성도 존재한다. 반면에 S2의 경우에는 유도되는 항체들이 virus가 receptor에 결합하는 것을 막을 수는 없을 것이지만 fusion step을 방해하는 항체를 생성할 수도 있을 것으로 예측할 수 있다. Full length의 경우에는 두 부분을 다 포함하므로 Receptor에 바이러스의 결합을 방해하는 항체와 fusion 과정을 방해하는 항체를 유도할 수도 있을 것이다. 하지만 항원으로 사용되는 단백질의 생산에 있어서 S1과 S2에 비교해 더 어려울 수도 있다.

이러한 다양한 고려를 바탕으로 스파이크 단백질(spike protein)을 식물에서 항원으로 생산하기 위해서 재조합 유전자를 구축하고자 하였다. 재조합 단백질의 대량 생산을 위해서 TMD와 cytosolic domain을 제외한 full length ecto-domain을 이용하여 재조합 단백질을 만들고자 하였으며, 특히 스파이크 단백질이 바이러스의 표면에 존재하는 형태인 ecto-domain만을 이용하여 삼량체를 만들어 항원성을 높이고자 하였다. 이를 위하여 코로나-19 바이러스의 스파이크 (Spike; (s))에서 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기를 포함하는 fragment (SfΔ(TMD-CT)이라 명명함)를 이용 하였다. 또한 코로나 바이러스의 스파이크 단백질에서 leader sequence가 없는 N-말단부터 16번째 아미노산에서 서브도메인 2(sub-domain 2; SD2)의 681번째 아미노산까지를 포함하는 S1 subunit (S1s라 명명); spike protein 중에서 돌연변이가 잘 일어나지 않는다고 알려진 S2 subunit의 C-terminal region에 존재하는 TMD와 cytosolic tail domain이 없는 fragment (682번째 아미노산에서 to 1213 번째 아미노산까지를 포함하는 부위로, 총 532 개의 잔기, [S2sΔ(TMD-CT)]로 명명함)를 이용하여 식물에서 발현 시스템을 구축하고자 하였다. 식물에서 생산된 이들 두 종류의 재조합 단백질을 만들고, 이들을 항원물질로 활용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장(full length)은 바이러스의 표면에 존재할 때 삼량체(trimer)를 형성하지만 스파이크 단백질을 코딩하는 유전자 중 TMD 및 cytosolic region이 없는 엑토-도메인이나 TMD와 cytosolic domain이 없는 S2를 코딩하는 부분을 이용하여 재조합 단백질을 만들면 상기 재조합 단백질들은 삼량체를 잘 형성하지 않을 것으로 추정하였다. 백신 목적으로 사용하기 위해서 이들 두 종류의 재조합 단백질을 식물에서 삼량체(trimer)의 형태로 생산하는 기술을 개발하고자 하였다. 이렇게 제작된 재조합 스파이크 단백질을 발현할 수 있는 벡터를 식물에서 고발현하도록 하는 바이너리 벡터(binary vector)를 구축하였다.

또한 본 발명은 식물세포에 만들어진 이들 단백질을 순수 분리정제하여 백신 조성을 제공하는 것을 목적으로 한다. 식물세포에 만들어진 단백질의 수율을 높이기 위해서는 적절한 buffer 조성이 중요하다. 이들 단백질은 size가 크고 heavily glycosylated protein이므로 solubilization을 위하여 다양한 buffer 조성을 비교 분석하여 최적의 buffer 조성을 확보하여야 한다. 그리고 단백질의 분리정제는 C-terminal에 존재하는 His tag를 이용하여 Ni²⁺-NTA affinity column chromatography 및 size exclusion gel filtration column chromatography를 통해서 순수 분리 정제하고자 하였다.

그리고 이렇게 생산된 Spike protein의 trimeric 형태의 다양한 단백질을 이용하여 mouse와 hamster에 면역주사를 통해서 항체유도의 정도를 확인할 수 있으며 이렇게 유도된 항체들이 어느 정도의 방어능 (PRNT50)을 갖는지를 확인할 수 있다. 또한 hamster의 경우에는 COVID-19에 대해서 어느 정도 감수성을 가지고 있으므로 실제로 COVID-19의 공격접종을 통해서 바이러스의 증식에 대한 억제의 정도를 확인할 수 있다. 이러한 과정을 통해서 최적의 백신후보물질을 선발할 수 있다.

본 발명은 상기의 문제를 해결하기 위해 안착된 것으로, 본 발명의 목적은 (i) 코로나 바이러스의 full length 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 단백질 (SfΔ(TMD-CT); 또는 코로나 바이러스의 스파이크 단백질에서 leader sequence를 제외한 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1 subunit 단백질 (S1s); 또는 코로나 바이러스의 스파이크 단백질의 S2 subunit에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지가 결여된 단백질 S2sΔ(TMD-CT);을 코딩하는 유전자 및 (ii) mouse Coronin 1 (mCor1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자; 분리정제를 위해서 5개의 His residue를 코딩하는 유전자; 그리고 식물의 소포체에 축적되도록 하는 ER retention motif인 HDEL을 코딩하나는 유전자;를 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질 SfΔ(TMD-CT):mCor1:Hisx5:HDEL (S_full-t로 명명), S1:mCor1:Hisx5:HDEL (S1s-t으로 명명) 또는 S2Δ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t로 명명)단백질을 생산하기 위한 재조합 벡터를 제공하는 것이다. 그리고 대조군으로서 mCor를 갖지 않는 SfΔ(TMD-CT):Hisx5:HDEL (S_full-m으로 명명), S1:Hisx5:HDEL (S1s-m으로 명명) 또는 S2Δ(TMD-CT):Hisx5:HDEL (S2s-m으로 명명)단백질을 생산하기 위한 재조합 벡터를 제공하는 것이다.

본 발명의 다른 목적은 하기의 단계를 포함하는 식물에서 삼량체를 형성하는 코로나바이러스의 재조합 스파이크 단백질을 생산하는 방법을 제공하는 것이다:

(a) 상기 서술한 재조합 벡터를 제작하는 단계;

(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;

(c) 상기 형질 전환 생물을 배양하는 단계;

(d) 상기 배양물을 식물에 침윤하는 단계; 및

(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계.

본 발명의 다른 목적의 하나는 spike protein 유래의 재조합 단백질인 SfΔ(TMD-CT):mCor1:Hisx5:HDEL (S_full-t로 명명), S1s:mCor1:Hisx5:HDEL (S1s-t으로 명명) 또는 S2sΔ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t로 명명)을 식물세포에서 발현 후 식물추출물로부터 고효율로 분리정제하기 위한 조건을 제공하는 것이다.

본 발명의 다른 목적은 이들 여러 spike 유래의 재조합 단백질들 중 두 종류 SfΔ(TMD-CT):mCor1:Hisx5:HDEL과 S2sΔ(TMD-CT):mCor1:Hisx5:HDEL를 이용하여 COVID-19를 효과적으로 방어하는 백신조성물을 제공하는 것이다.

본 발명은 (i) 코로나 바이러스의 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 단백질 SfΔ(TMD-CT); 또는 코로나 바이러스의 스파이크 단백질의 S1 subunit을 포함하는 단백질 (S1s); 또는 코로나 바이러스의 스파이크 단백질의 S2 subunit에서 TMD 및 C-말단까지 결여된 단백질 S2sΔ(TMD-CT);을 포함하는 유전자, 및 (ii) Coronin 1 (mCor1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자; 분리정제를 위해서 5개의 His residue를 코딩하는 유전자; 그리고 식물의 소포체에 축적되도록 하는 ER retention motif인 HDEL을 코딩하나는 유전자;를 포함하는 삼량체를 형성하는 COVID-19 바이러스의 재조합 스파이크 단백질 S_full-t 또는 S2s-t를 생산하기 위한 재조합 벡터를 제공하는 것이다.

상기 코로나 바이러스는 사스(SARS-Corona Virus), 메르스(MERS-Corona Virus) 및 코로나-19(SARS-Corona Virus-2)로 이루어진 군으로부터 선택되는 어느 하나일 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질은 서열번호 2의 아미노산 서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 S1 subunit의 16번째 아미노산에서 681번째 아미노산까지를 포함하는 단백질 (S1s)은 서열번호 4의 아미노산 서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 S1 subunit의 16번째 아미노산에서 681 번째 아미노산까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 S2 subunit의 682번째 아미노산에서 1213번째 아미노산까지를 포함하는 단백질은 서열번호 6의 아미노산 서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 S2 subunit의 682번째 아미노산에서 1213번째 아미노산까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함할 수 있다.

상기 Coronin 1 (mCor1)의 삼량체 모티브(trimeric motif) 부위의 단백질은 서열번호 8의 아미노산 서열을 포함할 수 있다.

상기 Coronin 1 (mCor1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 7의 염기서열을 포함할 수 있다.

상기 5'-UTR의 코딩하는 유전자는 서열번호 14의 염기서열을 포함할 수 있다.

본 발명은 또한 상기 재조합 벡터에 Hisx5 tag의 단백질을 코딩하는 유전자를 추가로 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.

본 발명은 또한 상기 재조합 벡터에 HDEL motif의 단백질을 코딩하는 유전자를 추가로 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.

상기 HDEL motif의 단백질은 서열번호 13의 아미노산 서열을 포함할 수 있다.

상기 HDEL motif 도메인의 단백질을 코딩하는 유전자는 서열번호 12의 염기서열을 포함할 수 있다.

상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함할 수 있다.

본 발명은 또한 상기 재조합 벡터로 형질 전환된 형질 전환 생물을 제공할 수 있다.

상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물일 수 있다.

본 발명은 하기의 단계를 포함하는 식물에서 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법을 제공할 수 있다:

(a) 상기 서술한 재조합 벡터를 제작하는 단계;

(c) 상기 형질 전환 생물을 배양하는 단계;

(d) 상기 배양물을 식물에 침윤하는 단계; 및

본 발명은 식물 추출물로부터 S_full-t와 S2s-t단백질 등을 Ni²⁺-NTA affinity column chromatography와 size exclusion column chromatography를 이용하여 분리 정제하는 과정을 통해서 백신후보물질의 생산방법을 제공할 수 있다.

본 발명의 다른 목적은 이들 두 종류의 spike protein인 S_full-t과 S2s-t을 이용하여 COVID-19를 효과적으로 방어하는 백신조성물을 제공하는 것이다. 이들 단백질을 adjuvant와 함께, 또는 adjuvant 없이 단독으로 백신조성물을 제공할 수 있으며, 단백질의 양은 1 microgram에서부터 30 microgram에 이를 수 있다.

본 발명의 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질은 코로나-19 바이러스의 스파이크 단백질의 막관통 도메인에서 C-말단까지 결여된 스파이크 단백질의 엑토-도메인(ecto-domain; 16 번째 아미노산에서 1213번째 아미노산 까지, 총 1198 개의 잔기)으로 구성된 Se 단백질, 또는 코로나 바이러스의 스파이크 단백질에서 S1 subunit의 16 번째 아미노산에서 681 번째 아미노산 까지를 포함하는 단백질 (총 666개의 잔기), 또는 코로나 바이러스의 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 S2 subunit의 682 번째 아미노산에서 1213 번째 아미노산까지를 포함하는 단백질 (총 532개의 잔기);을 코딩하는 유전자, 마우스의 Coronin 1의 삼량체 모티프 (trimeric motif)를 가져서 삼량체를 형성하여 면역성이 증가하며, C-terminal 말단에 HDEL을 포함하여 식물의 소포체에서 단백질의 축적이 되도록 되어 있어서 식물에서 다량으로 제조 할 수 있고, His tag domain을 C-말단 부위에 포함하여 단백질의 분리정제를 쉽게 하도록 되어 있는 재조합 단백질을 구성한다.

이렇게 식물에서 생산된 COVID-19의 S protein의 S_full-t, 또는 S2s-t 재조합 단백질로 구성된 백신조성물을 포함한다. 이 백신 조성물은 식물생산 단백질로만 이루어질 수도 있고 alum과 같은 adjuvant를 포함할 수도 있다.

도 1은 본 발명에서 사용한 여러 재조합 벡터의 구성을 나타낸 도면이다.
도 2는 His tag, HDEL을 갖는 SfΔ(TMD-CT), S1s와 S2sΔ(TMD-CT) 단백질과 이들 3 종류의 단백질이 추가적으로 mCor1을 단백질을 발현하는 N. benthamiana의 총 추출물을 SDS/PAGE로 분리한 후 anti-His antibody를 이용하여 western blot 분석 및 Coomassie brillant blue로 염색한 결과를 나타낸 것이다.
도 3은 N. benthamiana extract로부터 Ni²⁺-NTA 친화 컬럼 크로마토그래피를 이용하여 S_full-t과 S2s-t을 순수 분리정제하고 이를 SDS/PAGE로 전개한 후 anti-His antibody를 이용하여 Western blot으로 분석한 후 membrane을 다시 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 4는 N. benthamiana extract로부터 Ni²⁺-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 S_full-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 5는 N. benthamiana extract로부터 Ni²⁺-NTA 친화 컬럼 크로마토그래피를 이용하여 분리된 S_full-t과 S_full-m을 순수 분리정제하고 이들을 size exclusion column chromatography로 fractionation한 후 이들 fraction을 anti-His antibody를 이용하여 western blot 분석을 한 결과와 분리 정제된 S_full-t을 negative staining을 한 후 이 단백질을 전자현미경을 이용하여 단백질의 morphology를 확인한 결과 trimer를 형성한다는 것을 확인한 결과이다.
도 6은 N. benthamiana extract로부터 Ni²⁺-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 S2s-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 7은 COVID-19 식물백신 후보물질의 실험동물 (마우스, Balb/c)에서의 면역원성 평가한 결과를 나타낸 것이다. 이를 위해서 체액성 면역반응 분석 (도 7B), 중화항체 유도 분석 (도 7C, D) 및 세포매개면역반응 분석 (도 7E)을 수행한 후 그 결과를 나타내었다.
도 8은 COVID-19 식물백신 후보물질의 실험동물 (TG마우스)에서의 보호효능 평가를 수행한 실험으로 각 면역항원은 근육 내 경로로 2주 간격으로 총 2회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시한 결과를 나타내었으며 (도 8A), 식물백신 면역에 따른 항체유도 분석 (도 8B), 식물백신 면역에 따른 햄스터 공격접종에 따른 생존율 및 조직역가 분석 (도 8 C, D, E)한 결과를 나타내었다.

이하 본 발명을 자세히 설명한다.

코로나-19 바이러스의 막 단백질로서 세포에 침투에 중요하다고 알려진 스파이크 단백질은 코로나-19 바이러스의 감염을 예방할 수 있는 백신 후보군(candidate)으로 생각된다. 본 발명에서는 이 스파이크 단백질에 기반은 다양한 재조합 단백질을 만들고 이들을 활용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장(full length)은 바이러스의 표면에 존재할 때 삼량체(trimer)를 형성하지만 스파이크 유전자 중 전체 또는 일부분의 엑토-도메인만을 코딩하는 부분을 이용하여 재조합 단백질을 만들면 상기 재조합 단백질은 삼량체를 잘 형성하지 않을 것으로 추정하였다. 따라서 이들 재조합 단백질들을 이용하여 백신으로 활용하기 위해서는 이 단백질이 바이러스의 표면에 존재할 때와 같이 삼량체(trimer)를 형성하는 것이 중요하다고 생각하였으며, 이들이 soluble form으로 존재할 때도 삼량체를 유지하도록 하는 기술을 개발하고자 하였다. 본 발명에서는 스파이크 단백질의 ecto-domain의 전체 [SfΔ(TMD-CT)], S1s, 또는 TMD와 C-말단이 없는 S2 부위 [S2sΔ(TMD-CT)]의 재조합 단백질을 식물에서 발현 및 생산할 때 삼량체(trimer)를 형성하도록 유도하는 기술을 개발하고자 하였다. 이에 대량 생산할 수 있는 코로나-19 바이러스의 스파이크 막 관통 도메인부터 C-말단까지 결여된 스파이크 단백질의 엑토-도메인(Se; 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기), N-말단에서부터 SD2 도메인까지를 포함하는 부위 (S1s; 16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2 subunit에서 TMD와 C-말단이 없는 부위 (S2sΔ(TMD-CT); 682번째 아미노산에서 1213번째 아미노산까지, 총 532 개의 잔기)를 삼량체 구조를 형성하는 마우스의 Coronin 1의 삼량체 모티프 (trimeric motif)에 fusion하고 추가적으로 Hisx5와 HDEL을 코딩하는 부위에 연결하는 construct를 구축하였다. 이들 재조합 단백질에 대한 대조군으로 mCor1이 없는 construct를 구축하였다. 상기의 다양한 스파이크 단백질을 부분들을 포함하는 재조합 유전자들을 식물에서 고발현할 수 있는 바이너리 벡터(binary vector)를 구축하였다.

본 발명은 (i) 코로나 바이러스의 스파이크 단백질에있어서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지의 아미노산 서열이 결여된 단백질 (SfΔ(TMD-CT)); 또는 코로나 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1 subunit 단백질(S1s); 또는 코로나 바이러스 스파이크 단백질의 S2 서브 유닛(subunit)에서 막 관통 도메인 (trans-membrane domain)와 C- 말단까지의 아미노산 서열이 결여된 단백질, (S2sΔ(TMD-CT));을 코딩하는 유전자; 및 (ii) Coronin 1 (mCor 1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자;를 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.

코로나-19 바이러스의 재조합 스파이크 단백질을 이용하여 백신을 개발하기 위해서 막 관통 도메인에서 C-말단까지를 없앤 스파이크 단백질의 엑토-도메인 (S의 full length ecto-domain; 16 번째 아미노산에서 1213번째 아미노산 까지, 총 1198 개의 잔기), 또는 N-말단에서부터 서브 도메인 2 (sub domain 2; SD2)까지를 포함하는 부위 (16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2의 ectodomain (682 번째 아미노산에서 1213번째 아미노산까지, 총 532 개의 잔기)를 이용하여 재조합 단백질을 만들고 이를 이용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장은 바이러스 표면에 존재할 때 삼량체를 형성하지만 스파이크 단백질을 코딩하는 유전자 중 전체 또는 일부분의 ecto-domain 부분을 이용하여 발현시켜 재조합 단백질을 발현하면, 삼량체를 잘 형성하지 않을 것으로 예상하였고, 상기 삼량체의 미형성으로 인하여 면역원성이 낮을 것으로 예상되었다. 따라서 본 발명에서는 원래 스파이크 전장 단백질이 바이러스에 표면에 존재하는 것과 같은 삼량체 형태의 스파이크 단백질의 전체, 또는 N-말단에서 SD2 도메인까지의 S1c 엑토 도메인, 또는 S2의 ectodomain의 재조합 단백질을 만들고자 하였다. 이를 위해서 본 발명에서는 코로나-19 (COVID-19)를 선택하여 마우스의 Coronin1 (mCor1)의 122번째 아미노산부터 153번째 아미노산까지의 32개의 잔기를 12개의 아미노산 잔기를 갖는 링커를 이용하여 융합하여 컨스트럭을 구축하였다.

이어서 재조합 단백질의 분리 정제를 위해서 5개의 His 잔기를 갖는 His tag를 융합하고 마지막으로 ER에 축적하기 위해 HDEL 모티프를 융합하여 컨스트럭을 완성하였다 (SfΔ(TMD-CT):mCor1:Hisx5:HDEL, S1s:mCor1:Hisx5:HDEL, S2sΔ(TMD-CT):mCor1:Hisx5:HDEL, 도 1). 그리고 위의 3 종류의 스파이크 재조합 단백질에서 mCor1이 없는 construct들을 구축하여 대조군으로 사용하였다.

상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 1의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1s 단백질은 서열번호 4의 아미노산 서열을 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1s 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 3의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.

상기 코로나-19 바이러스의 스파이크 단백질에서 S2 단백질은 서열번호 x의 아미노산 서열을 포함할 수 있다.

상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질은 서열번호 6의 아미노산 서열을 포함할 수 있다.

상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함할 수 있으며. 구체적으로 상기 유전자는 서열 번호 5의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %”는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.

상기 재조합 유전자들을 식물체 발현 벡터인 pTEX1에 도입하여 식물 발현 벡터를 만들었다. COVID-19의 스파이크 유전자로부터 6종류의 ecto-domain의 재조합 단백질 유전자들 구축하고 (도 1), 이들을 식물 (Nicotiana benthamiana)에 도입하여 재조합 단백질의 발현을 유도하였다. 이들 유전자를 도입한 N. benthamiana의 잎 추출물에서의 단백질의 발현을 확인하기 위해서 anti-His antibody를 이용하여 western blot 분석을 하였다. 도 2와 같이 S_full이 약 180kD 위치에서 확인되었다. 스파이크 단백질의 N-glycosylation을 형성하기 때문에 계산상의 단백질 위치보다 크게 나왔다고 판단하였다. S1과 S2는 각각 100kD과 75kD 위치에서 나왔으며, 이들 두 단백질 역시 계산상의 크기보다 더 크게 나왔으므로 이 역시 N-glycosylation이 되는 것으로 판단되었다 (도 2).

그리고 이들 두 종류의 단백질을 순수 분리하기 위해서 N. benthamiana의 총 추출물을 만들고 이로부터 Ni²⁺-NTA 친화 컬럼 크로마토그래피를 이용하여 순수 분리 정제 한 후 이를 SDS/PAGE를 통해서 분리 정제하고 Coomassie brillian로 염색하였다. 이를 통해서 두 종류의 스파이크 단백질의 재조합 단백질을 순수 분리 정제할 수 있음을 확인하였다 (도 3).

상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함할 수 있으며, 바람직하게는 Mac 프로모터 (Mac promoter)일 수 있으며, 더 바람직하게는 MacT 프로모터 (MacT promoter)일 수 있다.

상기 Mac T 프로모터는 Mac 프로모터 염기서열의 3’말단 염기인 A를 T로 치환한 프로모터일 수 있으며, 상기 Mac T 프로모터는 서열 번호 17의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 17의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.

상기 재조합 벡터는 RD29B-t 종결 부위를 추가로 포함할 수 있으며, 상기 RD29B-t 종결 부위는 서열 번호 18의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 18의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %”는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.

재조합 단백질의 유전자의 N-말단과 C-말단에 각각 BiP의 signal sequence와 ER retention signal인 HDEL를 포함으로써, ER(소포체)에 고농도로 축적을 유도하는 효과를 가질 수 있다. 상기 재조합 벡터는 BiP(chaperone binding protein) 및 HDEL(His-Asp-Glu-Leu) 펩타이드로 이루어진 군으로부터 선택되는 어느 하나를 추가로 포함할 수 있고, 상기 BiP(chaperone binding protein)는 서열 번호 12의 염기서열을 포함할 수 있고, HDEL(His-Asp-Glu-Leu)는 서열 번호 10의 염기서열을 포함할 수 있다.

상기 재조합은 세포가 이종의 핵산을 복제하거나, 상기 핵산을 발현하거나 또는 펩티드, 이종의 펩티드 또는 이종의 핵산에 의해 암호화된 단백질을 발현하는 세포를 지칭하는 것이다. 재조합 세포는 상기 세포의 천연 형태에서는 발견되지 않는 유전자 또는 유전자 절편을 센스 또는 안티센스 형태 중 하나로 발현할 수 있다. 또한 재조합 세포는 천연 상태의 세포에서 발견되는 유전자를 발현할 수 있으며, 그러나 상기 유전자는 변형된 것으로서 인위적인 수단에 의해 세포 내 재도입된 것이다.

용어 "재조합 발현 벡터"는 세균 플라스미드, 파아지, 효모 플라스미드, 식물 세포 바이러스, 포유동물 세포 바이러스 또는 다른 벡터를 의미한다. 대체로, 임의의 플라스미드 및 벡터는 숙주 내에서 복제 및 안정화할 수 있다면 사용될 수 있다. 상기 발현 벡터의 중요한 특성은 복제 원점, 프로모터, 마커 유전자 및 번역 조절 요소(translation control element)를 가지는 것이다. 상기 재조합 발현 벡터 및 적당한 전사/번역 조절 신호를 포함하는 발현 벡터는 당업자에 주지된 방법에 의해 구축될 수 있다. 상기 방법은 시험관내 재조합 DNA 기술, DNA 합성 기술 및 생체 내 재조합 기술 등을 포함한다.

본 발명의 재조합 벡터의 바람직한 예는 적당한 숙주에 존재할 때 그 자체의 일부, 소위 T-영역을 식물 세포로 전이시킬 수 있는 Ti-플라스미드 벡터이다. 다른 유형의 Ti-플라스미드 벡터는 현재 식물 세포, 또는 잡종 DNA를 식물의 게놈 내에 적당하게 삽입시키는 새로운 식물이 생산될 수 있는 원형질체로 잡종 DNA 서열을 전이시키는데 이용되고 있다. Ti-플라스미드 벡터의 특히 바람직한 형태는 EP 0120 516 B1호 및 미국 특허 제4,940,838호에 청구된 바와 같은 소위 바이너리(binary) 벡터이다. 본 발명에 따른 DNA를 식물 숙주에 도입시키는데 이용될 수 있는 다른 적합한 벡터는 이중 가닥 식물 바이러스(예를 들면, CaMV) 및 단일 가닥 바이러스, 게미니 바이러스 등으로부터 유래될 수 있는 것과 같은 바이러스 벡터, 예를 들면 비완전성 식물 바이러스벡터로부터 선택될 수 있다. 그러한 벡터의 사용은 특히 식물 숙주를 적당하게 형질 전환하는 것이 어려울 때 유리할 수 있다.

상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물일 수 있으며, 그 예로서, 효모(Saccharomyce cerevisiae), 대장균 등의 곰팡이, 곤충세포, 사람세포 (예컨대, CHO 세포주 (Chinese hamster ovary), W138, BHK, COS-7, 293, HepG2, 3T3, RIN 및 MDCK 세포주) 및 식물세포 등이 이용 될 수 있으며, 바람직하게는 아그로박테리움(Agrobacterium)될 수 있다. 곤충세포, 사람세포 등의 경우에는 삼량체를 형성하는 재조합 스파이크 단백질을 코딩하는 유전자를 를 이들 각 종류의 동물 세포의 발현에 필요한 발현 벡터를 사용하여 발현할 수 있다.

본 발명의 벡터를 숙주세포 내로 운반하는 방법은, 숙주 세포가 원핵 세포인 경우, CaCl2 방법, 하나한 방법 (Hanahan, D., J. Mol. Biol., 166:557-580(1983)) 및 전기천공 방법 등에 의해 실시될 수 있다. 또한, 숙주세포가 진핵세포인 경우에는, 미세주입법, 칼슘포스페이트 침전법, 전기천공법, 리포좀-매개 형질감염법, DEAE-덱스트란 처리법, 및 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 주입할 수 있다.

a) 상기 서술한 재조합 벡터를 제작하는 단계;

(c) 상기 형질 전환 생물을 배양하는 단계;

(d) 상기 배양물을 식물에 침윤하는 단계; 및

상기 식물에 침유하는 방법은 화학 전지법, 진공 또는 주사기 침윤 방법이 있고 가장 바람직하게는 주사기 침윤 방법일 수 있으나, 이에 제한되는 것이 아니다.

상기 식물은 벼, 밀, 보리, 옥수수, 콩, 감자, 밀, 팥, 귀리, 수수를 포함하는 식량작물류; 애기장대, 배추, 무, 고추, 딸기, 토마토, 수박, 오이, 양배추, 참외, 호박, 파, 양파, 당근을 포함하는 채소작물류; 인삼, 담배, 목화, 참깨, 사탕수수, 사탕무, 들깨, 땅콩, 유채를 포함하는 특용작물류; 사과나무, 배 나무, 대추나무, 복숭아, 포도, 감귤, 감, 자두, 살구, 바나나를 포함하는 과수류; 장미, 카네이션, 국화, 백합, 튤립을 포함하는 화훼류로부터 선택되는 것일 수 있다.

이렇게 식물에서 생산한 COVID-19 바이러스의 스파이크 단백질들을 C-말단의 His tag를 이용하여 Ni2+-NTA affinity column chromatography으로 분리 정제할 수 있다. 그리고 이렇게 분리된 단백질은 순도를 높이기 위해서 다시 size exclusion gel chromatography를 이용하여 추가적으로 분리할 수 있다.

본 발명의 또 하나의 목적은 이들 식물 생산 코로나-19의 스파이크 단백질을 이용하여 백신조성물을 제공하는 것이다. 스파이크 단백질의 삼량체의 S_full-t나 S2s-t를 alum과 함께 또는 alum 없이 백신조성물을 구성할 수 있다.

이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.

<실시예 1> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 코딩하는 유전자의 설계

코로나-19 바이러스 표면 단백질 유래 spike (S)를 ER lumen에 수용성 형태(soluble form)로 발현하도록 유도하기 위해 막 관통 도메인(TMD)에서 C-terminus까지를 없앤 스파크 단백질의 엑토-도메인 (ecto-domain; 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기, SfΔ(TMD-CT)), N-말단에서부터 SD2 도메인까지를 포함하는 S1 subunit 부위 (16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2의 ectodomain 부위 (682번째 아미노산부터 1213번째 아미노산까지, 총 562개의 잔기)를 확보하였다. 상기 코로나-19 바이러스의 스파크 유전자의 5'-말단에 애기장대 단백질인 BiP로부터 확보한 ER 표적화 신호를 융합하여 ER 타겟팅 되도록 하였다. 그리고 이렇게 만들어진 재조합 스파이크 단백질의 삼량체 형성을 유도하기 위해, 마우스 mCoronin1이라는 단백질로부터 동종 삼량체의 형성을 유도하는 모티프를 linker를 통해서 이들 스파이크 단백질의 C-말단에 fusion 하였으며, Hisx5 태그 및 ER retention motif인 HDEL을 스파이크 단백질의 정제 및 ER에서의 고축적을 위해서 mCor1의 C-말단에 순차적으로 융합하여 컨스트럭을 구축하였다. 발현을 위해서 macT를 사용하였으며 Rd29b의 말단을 전사종결자로 사용하였다. 상기 전사 종결자는 이전 연구결과 높은 전사효율을 보이는 것으로 확인되었다. 실험에 사용되는 염기 서열은 하기 표 1과 같다 (도 1).

그리고 이들 construct를 pTEX에 도입하여 최종적인 식물발현 vector 9 종을 구축하였다.

	서열(5‘-3)
SfΔ(TMD-CT) 염기서열	gttaaccttaccaccagaactcagttacccccagcatacactaattctttcacacgtggtgtttactaccctgacaaagttttcagaagcagcgttttacacagcactcaggatttattcctacctttcttttccaacgtgacctggttccatgctatacatgtatctgggaccaatggtaccaagaggtttgataacccggtcctaccatttaatgatggagtctattttgcctccactgagaagtctaatataataagaggctggatttttggaactactcttgattcgaagacccagagtctacttattgttaataacgctacaaatgttgttatcaaagtatgtgaatttcaattctgtaatgatccattcttgggtgtttactaccacaaaaacaacaaaagttggatggaaagtgagtttcgggtttatagcagtgcgaataattgcacttttgagtacgtctcccaaccttttcttatggaccttgaaggaaagcagggaaatttcaagaatcttcgcgaatttgtgtttaagaatatcgatggttatttcaagatatattctaagcacacgcctattaatttagtgcgagatctccctcagggtttttcggcgctggaaccattggtagatttgccgataggaatcaatatcactaggttccagactttacttgctctgcatagaagttacttgacccctggagatagctcatcaggttggacagctggtgcggcagcttattacgtggggtatcttcagcctaggacgttcctattaaaatataatgaaaatggaaccattacagatgctgtagactgtgcacttgaccctctctcagaaacaaagtgtacgttgaaatccttcacggtagaaaaagggatctaccaaacgtctaacttcagagtccagccaacagaatctattgtgagatttcccaatattacaaacttgtgccctttcggagaagtttttaacgccaccaggtttgcatcggtttatgcttggaacaggaaaagaatcagcaactgtgttgctgattatagtgtcctatataactccgcatccttttccactttcaagtgttacggagtttctcctactaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaatcagaggtgatgaggtcagacaaatcgctccagggcagactggaaagattgctgattataattataagcttcctgatgattttacaggctgcgttatagcatggaattctaataatcttgactctaaggtggggggaaattataattacctgtatagactgtttaggaagagcaatctcaagcctttcgagagagacatttcaactgagatctaccaggcgggaagcactccgtgtaatggtgttgagggttttaattgttactttcctttacagtcatacggtttccaacccacgaatggggttggttaccaaccgtaccgagtagtagtactttctttcgagcttctacatgccccagcaactgtttgtggacctaagaagtctactaatttggttaaaaataagtgtgtcaattttaatttcaatggacttacgggcacaggagttcttactgagtctaacaagaagtttctgcctttccagcagttcggcagagatattgctgacactactgatgctgtgcgtgatccacagacacttgaaattcttgacattacaccatgttcttttggtggcgtgagtgttataactcccggaacaaatacctccaaccaggtggctgttctgtatcaggacgtgaactgtacagaagtccctgttgcaattcatgcagatcagcttactcctacctggcgtgtttattctacgggttccaatgtttttcaaacacgtgcaggctgcttgataggggctgaacatgtcaacaactcatatgaatgcgacatacccataggtgcaggtatatgcgctagttatcagactcagaccaattctccgcggcgggcacgaagtgtagctagtcaatccatcattgcctacactatgtcacttggtgcagaaaattcagttgcttactctaataactctattgccatacccacaaattttactattagtgttaccacagaaattctaccagtgtctatgaccaagacatcagttgactgtacaatgtatatttgcggggattcaactgagtgctcgaatctgttgttgcaatacggcagtttttgtacccaattgaaccgggctctgactggaatagctgtggaacaagataaaaacacccaagaagtttttgcacaagtcaaacaaatttataaaacaccaccaattaaagatttcggtggtttcaacttctcacaaatactgccagatccgagcaaaccaagcaagaggtcattcattgaagacctacttttcaacaaagtgacacttgcagatgctggcttcattaaacagtatggtgattgcttgggggatattgctgctagagacctcatttgtgcacaaaagtttaacgggctgacagtgttgccacctttgttgacagatgagatgattgctcagtacacttctgcactgctcgctggtacaatcacatctgggtggacctttggtgcaggtgctgccttacaaataccatttgctatgcagatggcttataggttcaatggtatcggagttacacagaacgttctctatgagaaccaaaaattgattgccaaccaattcaatagtgccattggcaagattcaggactcactttcaagcacagcgagtgcacttggaaagttgcaagatgtggtcaaccagaatgcacaagctttaaacacgcttgtgaaacaactcagctccaactttggggcaatttcaagtgttttgaatgatatcctttcacgtcttgataaagtggaagccgaggtgcaaattgacaggttgatcacaggccgacttcaaagtttgcagacttatgtgactcaacaattaattagggcagcagaaatccgcgcttcggctaatctggcggctactaaaatgtcagagtgtgtacttggacaatctaaacgagttgatttttgcggaaagggctatcatctcatgtccttccctcagtcagcgcctcacggtgtagtgttcttgcacgtgacttacgttcctgcacaagaaaagaatttcacaactgctccggccatttgtcatgatggaaaagcccactttccgcgtgaaggtgtctttgtttcgaatggcacacactggtttgtaacccaaaggaatttttatgagccacaaatcattacgacggacaacacttttgtgtctggtaattgtgatgttgtaatcggaatcgtcaacaacaccgtttacgatcctttgcagcctgagttagattctttcaaagaggagctggataagtatttcaagaatcatacatcacccgatgttgatctcggtgatatctctggaattaatgcttcagttgtgaacattcaaaaggagattgaccgcctcaatgaggttgccaagaatttgaatgaatcgctcatcgatctccaagaacttggaaagtatgagcagtatatcaagtggcca	서열번호 1
SfΔ(TMD-CT) 아미노산 서열	vnlttrtqlppaytnsftrgvyypdkvfrssvlhstqdlflpffsnvtwfhaihvsgtngtkrfdnpvlpfndgvyfasteksniirgwifgttldsktqsllivnnatnvvikvcefqfcndpflgvyyhknnkswmesefrvyssannctfeyvsqpflmdlegkqgnfknlrefvfknidgyfkiyskhtpinlvrdlpqgfsaleplvdlpiginitrfqtllalhrsyltpgdsssgwtagaaayyvgylqprtfllkynengtitdavdcaldplsetkctlksftvekgiyqtsnfrvqptesivrfpnitnlcpfgevfnatrfasvyawnrkrisncvadysvlynsasfstfkcygvsptklndlcftnvyadsfvirgdevrqiapgqtgkiadynyklpddftgcviawnsnnldskvggnynylyrlfrksnlkpferdisteiyqagstpcngvegfncyfplqsygfqptngvgyqpyrvvvlsfellhapatvcgpkkstnlvknkcvnfnfngltgtgvltesnkkflpfqqfgrdiadttdavrdpqtleilditpcsfggvsvitpgtntsnqvavlyqdvnctevpvaihadqltptwrvystgsnvfqtragcligaehvnnsyecdipigagicasyqtqtnsprrarsvasqsiiaytmslgaensvaysnnsiaiptnftisvtteilpvsmtktsvdctmyicgdstecsnlllqygsfctqlnraltgiaveqdkntqevfaqvkqiyktppikdfggfnfsqilpdpskpskrsfiedllfnkvtladagfikqygdclgdiaardlicaqkfngltvlpplltdemiaqytsallagtitsgwtfgagaalqipfamqmayrfngigvtqnvlyenqklianqfnsaigkiqdslsstasalgklqdvvnqnaqalntlvkqlssnfgaissvlndilsrldkveaevqidrlitgrlqslqtyvtqqliraaeirasanlaatkmsecvlgqskrvdfcgkgyhlmsfpqsaphgvvflhvtyvpaqeknfttapaichdgkahfpregvfvsngthwfvtqrnfyepqiittdntfvsgncdvvigivnntvydplqpeldsfkeeldkyfknhtspdvdlgdisginasvvniqkeidrlnevaknlneslidlqelgkyeqyikwp	서열번호 2
S1s 염기서열	gttaaccttaccaccagaactcagttacccccagcatacactaattctttcacacgtggtgtttactaccctgacaaagttttcagaagcagcgttttacacagcactcaggatttattcctacctttcttttccaacgtgacctggttccatgctatacatgtatctgggaccaatggtaccaagaggtttgataacccggtcctaccatttaatgatggagtctattttgcctccactgagaagtctaatataataagaggctggatttttggaactactcttgattcgaagacccagagtctacttattgttaataacgctacaaatgttgttatcaaagtatgtgaatttcaattctgtaatgatccattcttgggtgtttactaccacaaaaacaacaaaagttggatggaaagtgagtttcgggtttatagcagtgcgaataattgcacttttgagtacgtctcccaaccttttcttatggaccttgaaggaaagcagggaaatttcaagaatcttcgcgaatttgtgtttaagaatatcgatggttatttcaagatatattctaagcacacgcctattaatttagtgcgagatctccctcagggtttttcggcgctggaaccattggtagatttgccgataggaatcaatatcactaggttccagactttacttgctctgcatagaagttacttgacccctggagatagctcatcaggttggacagctggtgcggcagcttattacgtggggtatcttcagcctaggacgttcctattaaaatataatgaaaatggaaccattacagatgctgtagactgtgcacttgaccctctctcagaaacaaagtgtacgttgaaatccttcacggtagaaaaagggatctaccaaacgtctaacttcagagtccagccaacagaatctattgtgagatttcccaatattacaaacttgtgccctttcggagaagtttttaacgccaccaggtttgcatcggtttatgcttggaacaggaaaagaatcagcaactgtgttgctgattatagtgtcctatataactccgcatccttttccactttcaagtgttacggagtttctcctactaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaatcagaggtgatgaggtcagacaaatcgctccagggcagactggaaagattgctgattataattataagcttcctgatgattttacaggctgcgttatagcatggaattctaataatcttgactctaaggtggggggaaattataattacctgtatagactgtttaggaagagcaatctcaagcctttcgagagagacatttcaactgagatctaccaggcgggaagcactccgtgtaatggtgttgagggttttaattgttactttcctttacagtcatacggtttccaacccacgaatggggttggttaccaaccgtaccgagtagtagtactttctttcgagcttctacatgccccagcaactgtttgtggacctaagaagtctactaatttggttaaaaataagtgtgtcaattttaatttcaatggacttacgggcacaggagttcttactgagtctaacaagaagtttctgcctttccagcagttcggcagagatattgctgacactactgatgctgtgcgtgatccacagacacttgaaattcttgacattacaccatgttcttttggtggcgtgagtgttataactcccggaacaaatacctccaaccaggtggctgttctgtatcaggacgtgaactgtacagaagtccctgttgcaattcatgcagatcagcttactcctacctggcgtgtttattctacgggttccaatgtttttcaaacacgtgcaggctgcttgataggggctgaacatgtcaacaactcatatgaatgcgacatacccataggtgcaggtatatgcgctagttatcagactcagaccaattctccg	서열번호 3
S1s protein 아미노산 서열	vnlttrtqlppaytnsftrgvyypdkvfrssvlhstqdlflpffsnvtwfhaihvsgtngtkrfdnpvlpfndgvyfasteksniirgwifgttldsktqsllivnnatnvvikvcefqfcndpflgvyyhknnkswmesefrvyssannctfeyvsqpflmdlegkqgnfknlrefvfknidgyfkiyskhtpinlvrdlpqgfsaleplvdlpiginitrfqtllalhrsyltpgdsssgwtagaaayyvgylqprtfllkynengtitdavdcaldplsetkctlksftvekgiyqtsnfrvqptesivrfpnitnlcpfgevfnatrfasvyawnrkrisncvadysvlynsasfstfkcygvsptklndlcftnvyadsfvirgdevrqiapgqtgkiadynyklpddftgcviawnsnnldskvggnynylyrlfrksnlkpferdisteiyqagstpcngvegfncyfplqsygfqptngvgyqpyrvvvlsfellhapatvcgpkkstnlvknkcvnfnfngltgtgvltesnkkflpfqqfgrdiadttdavrdpqtleilditpcsfggvsvitpgtntsnqvavlyqdvnctevpvaihadqltptwrvystgsnvfqtragcligaehvnnsyecdipigagicasyqtqtnsp	서열번호 4
S2sΔ (TMD-CT) 염기서열	cggcgggcacgaagtgtagctagtcaatccatcattgcctacactatgtcacttggtgcagaaaattcagttgcttactctaataactctattgccatacccacaaattttactattagtgttaccacagaaattctaccagtgtctatgaccaagacatcagttgactgtacaatgtatatttgcggggattcaactgagtgctcgaatctgttgttgcaatacggcagtttttgtacccaattgaaccgggctctgactggaatagctgtggaacaagataaaaacacccaagaagtttttgcacaagtcaaacaaatttataaaacaccaccaattaaagatttcggtggtttcaacttctcacaaatactgccagatccgagcaaaccaagcaagaggtcattcattgaagacctacttttcaacaaagtgacacttgcagatgctggcttcattaaacagtatggtgattgcttgggggatattgctgctagagacctcatttgtgcacaaaagtttaacgggctgacagtgttgccacctttgttgacagatgagatgattgctcagtacacttctgcactgctcgctggtacaatcacatctgggtggacctttggtgcaggtgctgccttacaaataccatttgctatgcagatggcttataggttcaatggtatcggagttacacagaacgttctctatgagaaccaaaaattgattgccaaccaattcaatagtgccattggcaagattcaggactcactttcaagcacagcgagtgcacttggaaagttgcaagatgtggtcaaccagaatgcacaagctttaaacacgcttgtgaaacaactcagctccaactttggggcaatttcaagtgttttgaatgatatcctttcacgtcttgataaagtggaagccgaggtgcaaattgacaggttgatcacaggccgacttcaaagtttgcagacttatgtgactcaacaattaattagggcagcagaaatccgcgcttcggctaatctggcggctactaaaatgtcagagtgtgtacttggacaatctaaacgagttgatttttgcggaaagggctatcatctcatgtccttccctcagtcagcgcctcacggtgtagtgttcttgcacgtgacttacgttcctgcacaagaaaagaatttcacaactgctccggccatttgtcatgatggaaaagcccactttccgcgtgaaggtgtctttgtttcgaatggcacacactggtttgtaacccaaaggaatttttatgagccacaaatcattacgacggacaacacttttgtgtctggtaattgtgatgttgtaatcggaatcgtcaacaacaccgtttacgatcctttgcagcctgagttagattctttcaaagaggagctggataagtatttcaagaatcatacatcacccgatgttgatctcggtgatatctctggaattaatgcttcagttgtgaacattcaaaaggagattgaccgcctcaatgaggttgccaagaatttgaatgaatcgctcatcgatctccaagaacttggaaagtatgagcagtatatcaagtggcca	서열번호 5
S2sΔ (TMD-CT) protein 아미노산 서열	RRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWP	서열번호 6
mCOr1 염기서열	gtgtctaggcttgaggaagatgttagaaatctcaacgcaattgtccagaaacttcaggaaaggttggataggctggaggaaactgttcaagctaag	서열번호 7
mCor1 아미노산 서열	vsrleedvrnlnaivqklqerldrleetvqak	서열번호 8
Linker 염기 서열	ggaggttcaggaggttcaggaggttcaggaggttca	서열번호 9
Linker 아미노산 서열	ggsggsggsggs	서열번호 10
BiP 염기 서열	atggctcgct cgtttggagc taacagtacc gttgtgttgg cgatcatctt cttcggtgag tgattttccg atcttcttct ccgatttaga tctcctctac attgttgctt aatctcagaa ccttttttcg ttgttcctgg atctgaatgt gtttgtttgc aatttcacga tcttaaaagg ttagatctcg attggtattg acgattggaa tctttacgat ttcaggatgt ttatttgcgt tgtcctctgc aatagaagag gctacgaagt ta	서열번호 11
HDEL 염기 서열	cacgatgagctc	서열번호 12
HDEL 아미노산 서열	His-Asp-Glu-Leu	서열번호 13
5'UTR 염기서열	aattattacatcaaaacaaaaa	서열번호 14
MacT nucleotide sequence	agagatctcctttgccccagagatcacaatggacgacttcctctatctctacgatctagtcaggaagttcgacggagaaggtgacgataccatgttcaccactgataatgagaagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttacgcagcaggtctcatcaagacgatctacccgagcaataatctccaggagatcaaataccttcccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagagaaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgcttcacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatcaaaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggcgaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatggtggagcacgacacgcttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgacgcaagacgtgacgtaagtatctgagctagtttttatttttctactaatttggtcgtttatttcggcgtgtaggacatggcaaccgggcctgaatttcgcgggtattctgtttctattccaactttttcttgatccgcagccattaacgacttttgaatagatacgctgacacgccaagcctcgctagtcaaaagtgtaccaaacaacgctttacagcaagaacggaatgcgcgtgacgctcgcggtgacgccatttcgccttttcagaaatggataaatagccttgcttcctattatatcttcccaaattaccaatacattacactagcatctgaatttcataaccaatctcgatacaccaaatcgt	서열번호 15
RD29B terminator 염기 서열	aattttactcaaaatgttttggttgctatggtagggactatggggttttcggattccggtggaagtgagtggggaggcagtggcggaggtaagggagttcaagattctggaactgaagatttggggttttgcttttgaatgtttgcgtttttgtatgatgcctctgtttgtgaactttgatgtattttatctttgtgtgaaaaagagattgggttaataaaatatttgcttttttggataagaaactcttttagcggcccattaataaaggttacaaatgcaaaatcatgttagcgtcagatatttaattattcgaagatgattgtgatagatttaaaattatcctagtcaaaaagaaagagtaggttgagcagaaacagtgacatctgttgtttgtaccatacaaattagtttagattattggttaacatgttaaatggctatgcatgtgacatttagaccttatcggaattaatttgtagaattattaattaagatgttgattagttcaaacaaaaat	서열번호 16

<실시예 2> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 코딩하는 유전자의 발현 및 확인

도 1에 표시된 6 종류의 construct [SfΔ(TMD-CT):mCor1:Hisx5:HDEL (S_full-t), SfΔ(TMD-CT):Hisx5:HDEL (S_full-m), S1s:mCor1:Hisx5:HDEL (S1s-t), S1s:Hisx5:HDEL (S1s-m), S2sΔ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t), S2sΔ(TMD-CT):Hisx5:HEDL (S2s-m)]들을 vacuum infiltration 방법을 사용하여 4-5주령 Nicotiana benthamiana 식물 잎에서 일과성 발현을 통하여 발현을 유도하였다. 침윤된 잎을 침윤 후 5 일 (dpi)에 수확하고, 액체 질소에서 완전히 분쇄하고 3 부피의 완충액에 용해시켰다. 침윤된 잎 추출물로부터의 총 가용성 단백질을 SDS-PAGE로 전개한 후 이를 western blot 분석을 수행하였다. 스파이크 (S) 재조합 단백질들은 anti-His antibody에 의해서 S_full-t과 S_full-m이 약 180 kD 위치에서 확인되었고, S1s-t와 S1s-m은 100 kD 위치에서 확인되었다. 그리고 S2s-t과 S2s-m은 75 kD 위치에서 확인되었다. mCor를 갖지 않는 construct와 mCor1을 갖는 단백질의 위치를 비교하면 mCor1을 갖는 것이 없는 것보다 보다 약간 작게 나온 것으로부터 이들의 차이는 mCor1에 의한 것으로 알 수 있다. 또한 이들 6 종의 재조합 단백질 모두 계산상의 크기보다 더 크게 나왔으므로, 이는 N-glycosylation 때문에 그러한 것으로 판단되었다 (도 2). 그리고 같은 멤브레인을 쿠마시 브릴리언트 블루로 염색하여 밴드를 확인하였을 때 여기에서도 관찰되었다. 이들 재조합 단백질의 발현 수준을 밴드 강도로부터 판단하건대 침윤된 잎에서 20 - 50μg/g 생 중량 (fresh weight) 정도인 것으로 추정되었다.

<실시예 3> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파크 단백질의 분리 정제

두 종류의 코로나-19 바이러스 S protein의 재조합 단백질인 S_full-t과 S2s-t을 N. benthamiana에서 발현 시키고 이들을 Ni²⁺-NTA affinity column으로 분리 정제하고 이들을 SDS/PAGE를 통해서 전개한 후 anti-His antibody를 이용하여 western blot을 수행하여 분리정제를 확인하였다. 그리고 이어서 membrane을 Coomassie brilliant blue로 염색하였다. 이를 통해서 두 종류의 스파크 단백질 유래의 재조합 단백질을 순수 분리 정제할 수 있음을 확인하였다 (도 3).

<실시예 4> 삼량체를 형성하는 S_full-t의 재조합 단백질의 size exclusion column chromatography를 통한 분리 정제

Ni²⁺-NTA affinity column으로 분리 정제한 S_full-t의 재조합 단백질을 농축하여 이들 다시 size exclusion column chromatography를 이용하여 분리 정제하였다. Column에서 확보한 fraction을 7번부터 20번까지를 SDS/PAGE를 통해서 전개하고 이를 anti-His antibody를 이용하여 Western blot을 수행하여 Se의 재조합 단백질의 위치와 elution된 양을 확인하였다. 그리고 이후 membrane을 Coomassie brilliant blue로 염색하여 다른 단백질 band의 contamination을 확인하였다 (도 4).

<실시예 5> 코비드-19 바이러스의 SfΔ(TMD-CT)의 mCor1이 있는 것과 없는 것의 재조합 단백질의 size exclusion column을 통한 fractionation에서의 차이 확인 및 mCor1에 의한 S_full-t 재조합 단백질의 삼량체 형성

S_full-t과 S_full-m 각각을 발현하는 N. benthamiana 잎 추출물로부터 Ni²⁺-NTA affinity column으로 단백질을 분리 정제한 후 (도 5A, B), 이들 단백질을 size exclusion column chromatography를 이용하여 fractionation 한 후 (도 6C), 이들 fraction을 SDS/PAGE를 이용하여 정제한 후 이를 anti-His antibody를 이용하여 Western blotting하여 분석하였다 (도 5D). 분리된 S_full-t 단백질을 negative staining 한 후 전자현미경을 이용하여 단백질의 형태를 관찰하여 삼량체의 형성을 확인하였다 (도 5E).

<실시예 6> 삼량체를 형성하는 S2e의 재조합 단백질의 size exclusion column chromatography를 통한 분리 정제

Ni²⁺-NTA affinity column으로 분리 정제한 S2s-t의 재조합 단백질을 농축하여 이들 다시 size exclusion column chromatography를 이용하여 분리 정제하였다. Column에서 확보한 fraction을 7번부터 20번까지를 SDS/PAGE를 통해서 전개하고 이를 anti-His antibody를 이용하여 Western blot을 수행하여 S2s-t의 재조합 단백질의 위치와 elution된 양을 확인하였다 (도 6).

<실시예 7> 코로나19 식물백신 후보물질의 실험동물에서의 면역원성 평가

(1) COVID-19 식물백신 후보물질의 실험동물 (마우스, Balb/c)에서의 면역원성 평가

제작된 식물백신의 면역원성을 평가하기 위한 동물실험은 6주령의 암컷 마우스(Balb/c)를 사용하였으며, 실험군당 5마리씩, 면역은 네 가지의 용량(1, 5, 15, 30㎍)으로 실시하였다. 각 면역항원 (S_full-t)은 근육 내 경로로 2주 간격으로 총 3회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역, 3차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시하였다. 이때 음성대조군은 PBS를 면역하였다.

1) 체액성 면역반응 분석

제작된 식물백신 면역원성 평가는 혈청 내에서 항원 특이적인 항체가 생성되는지를 ELISA를 통해 확인하였다. 총2회 또는 3회 마우스 면역 후 충분한 IgG 역가가 나타남을 확인하였으며, 본 백신에 의해 S항원의 서브도메인인 S1 그리고 S2 특이 항체가 모두 생성되는 것을 확인하였고, 특히 S2에 대한 역가가 높게 생성됨을 확인할 수 있었다. 또한, 면역보조제(수산화알루미늄)를 동시에 면역한 그룹이 동시 투여하지 않은 그룹에 비해 IgG 역가와 중화항체 역가가 다소 높게 나타남이 확인되었다.

2) 중화항체 유도 분석

제작된 식물백신으로 면역된 마우스의 혈액에서 혈청을 분리한 후, 일반적으로 바이러스 중화항체를 측정하는 방법 중 “gold standard” 로 알려진 Plaque reduction neutralization test (PRNT)법을 이용하여, SARS-CoV-2에 대한 항체의 중화능을 확인하였다. 중화항체 역가를 분석하기 위해 국가병원체자원은행(National Culture Collection for Pathogens)으로부터 분양받은 SARS-CoV-2 바이러스(BetaCoV/Korea/KCDC03/2020)를 이용하여, 바이러스에 마우스 혈청(항체)을 처리한 뒤 감염률의 변화를 확인하였다. 또한 최근 보고된 영국 변이주 (B.1.1.7), 남아공 변이주 (B.1.351)에 대한 교체 반응 분석도 실시하였다.

중화항체 유도는, IgG 생성결과와 유사하게 면역항원 단독으로 주입한 집단보다, 면역보조제를 동시에 면역한 집단에서 더 높은 중화 항체 역가를 보였으며, 낮은 농도로 면역한 혈청에서 보다, 높은 농도로 면역한 후 채취한 혈청에서 더 높은 중화항체가를 나타냄을 확인하였다. 또한, 음성대조군인 PBS 그룹에서는 중화 항체가 유도되지 않는 것을 확인할 수 있었다(도 7C). 또한 최근 문제가 되고있는 영국 그리고 남아공 변이주에 대해서도 교차반응이 나타남을 확인 하였음(도 7D).

3) 세포매개면역반응 분석

식물백신 면역에 따른 세포매개면역반응은 ELISPOT 시험법을 통해 분석하였다. ELISPOST 분석은 상용 IFN-γ ELISPOT kit을 사용하였다. 세포매개면역반응은, 대조군 (PBS 그룹)에 비해, 식물백신으로 면역한 그룹에서 IFN-γ를 분비하는 비장세포의 수가 증가하였고, 항원양과는 유의하게 비례하지 않음을 확인할 수 있었다. 그리고 면역보조제에 따른 증가효과는 나타나지 않았다. 결론적으로, 식물백신 면역에 의해 체액성 면역과 더불어 세포성 면역반응이 함께 유도되는 것을 확인 할 수 있었다(도 7E).

<실시예 8> COVID-19 식물백신 후보물질의 실험동물 (TG마우스)에서의 보호효능 평가

본 발명에 따라 제조된 식물백신의 보호효능을 평가하기 위한 동물실험은 SARS-CoV-2 사람 수용체 ACE2가 발현되는 6주령 형질전환 마우스(B6.Cg-Tg(K18-ACE2)2Primn/J)를 사용하였으며, 실험군당 14마리씩(대조군 12마리), 면역은 두 가지의 용량(15, 30㎍)으로 실시하였다. 각 면역항원은 근육 내 경로로 2주 간격으로 총 2회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시하였다. 이때 음성대조군은 PBS를 면역하였다. 바이러스 공격접종은 최초 면역 28일 후 2 x 10⁴pfu/mouse의 농도로 비강 감염을 실시한 후 생존율과 조직 역가를 측정하였다(도 8A).

1) 식물백신 면역에 따른 항체유도 분석

제작된 식물백신으로 면역된 마우스의 혈액에서 혈청을 분리한 후, 혈청 내에서 항원 특이적인 항체가 생성되는지를 ELISA를 통해 확인하였다. 총 2회 면역 후 충분한 IgG 역가가 나타남을 확인하였으며, 본 백신에 의해 S항원의 서브도메인인 S1 그리고 S2 특이 항체가 모두 생성되는 것을 확인하였고 면역보조제(수산화알루미늄)를 동시에 면역한 그룹이 동시 투여하지 않은 그룹에 비해 IgG 역가가 높게 나타나는 것을 확인되었다(도 8B).

2) 식물백신 면역에 따른 햄스터 공격접종에 따른 생존율 및 조직역가 분석

최초 면역 28일 후, 면역원성이 확인된 형질전환 마우스 에서의 SARS-CoV-2에 감염에 대한 보호능을 확인하기 위하여 바이러스를 비강내로 감염하고, 감염 후 14일간 체중, 체온 측정 및 임상증상을 관찰하였다(도 8C). 감염 후, 2주간 체중변화를 측정한 결과, 식물백신으로 면역한 햄스터에서 음성 대조군인 PBS 그룹에 비해 적은 체중감소를 보였다. 식물백신 면역그룹의 생존율 분석결과 15와 30㎍ 면역그룹은 100% 생존하였고 15와 30㎍과 면역보조제 동시 투여 집단은 80%의 생존율을 보였다. 그리고 대조군(PBS) 면역집단의 생존율은 3마리중 1마리 생존(33%)로 확인 되었다 (그림 8D). 바이러스 공격접종에 따른 폐 조직 내에서 바이러스 증식 양상 및 조직병리 소견을 확인하기 위해 감염 후 3, 5, 7일에 부검을 진행하였고, 부검한 폐조직내 바이러스 역가를 측정하였다. 식물백신 면역그룹에서 대조군에 비해 투여 용량에 비례하여 바이러스 증식 억제가 확인되었고 7일차에 30㎍과 면역보조제 동시 투여 집단에서는 바이러스가 검출되지 않았다 (도 8E).

<110> POSTECH ACADEMY-INDUSTRY FOUNDATION Korea Disease Control and Prevention Agency BioApplications Inc. <120> Production method for trimeric spike protein of Corona-19 virus in plants and its use for vaccination <130> 1067332 <150> KR 10-2020-0048980 <151> 2020-04-22 <160> 16 <170> KoPatentIn 3.0 <210> 1 <211> 3594 <212> DNA <213> Artificial Sequence <220> <223> Sf delta (TMD-CT) <400> 1 gttaacctta ccaccagaac tcagttaccc ccagcataca ctaattcttt cacacgtggt 60 gtttactacc ctgacaaagt tttcagaagc agcgttttac acagcactca ggatttattc 120 ctacctttct tttccaacgt gacctggttc catgctatac atgtatctgg gaccaatggt 180 accaagaggt ttgataaccc ggtcctacca tttaatgatg gagtctattt tgcctccact 240 gagaagtcta atataataag aggctggatt tttggaacta ctcttgattc gaagacccag 300 agtctactta ttgttaataa cgctacaaat gttgttatca aagtatgtga atttcaattc 360 tgtaatgatc cattcttggg tgtttactac cacaaaaaca acaaaagttg gatggaaagt 420 gagtttcggg tttatagcag tgcgaataat tgcacttttg agtacgtctc ccaacctttt 480 cttatggacc ttgaaggaaa gcagggaaat ttcaagaatc ttcgcgaatt tgtgtttaag 540 aatatcgatg gttatttcaa gatatattct aagcacacgc ctattaattt agtgcgagat 600 ctccctcagg gtttttcggc gctggaacca ttggtagatt tgccgatagg aatcaatatc 660 actaggttcc agactttact tgctctgcat agaagttact tgacccctgg agatagctca 720 tcaggttgga cagctggtgc ggcagcttat tacgtggggt atcttcagcc taggacgttc 780 ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 840 ctctcagaaa caaagtgtac gttgaaatcc ttcacggtag aaaaagggat ctaccaaacg 900 tctaacttca gagtccagcc aacagaatct attgtgagat ttcccaatat tacaaacttg 960 tgccctttcg gagaagtttt taacgccacc aggtttgcat cggtttatgc ttggaacagg 1020 aaaagaatca gcaactgtgt tgctgattat agtgtcctat ataactccgc atccttttcc 1080 actttcaagt gttacggagt ttctcctact aaattaaatg atctctgctt tactaatgtc 1140 tatgcagatt catttgtaat cagaggtgat gaggtcagac aaatcgctcc agggcagact 1200 ggaaagattg ctgattataa ttataagctt cctgatgatt ttacaggctg cgttatagca 1260 tggaattcta ataatcttga ctctaaggtg gggggaaatt ataattacct gtatagactg 1320 tttaggaaga gcaatctcaa gcctttcgag agagacattt caactgagat ctaccaggcg 1380 ggaagcactc cgtgtaatgg tgttgagggt tttaattgtt actttccttt acagtcatac 1440 ggtttccaac ccacgaatgg ggttggttac caaccgtacc gagtagtagt actttctttc 1500 gagcttctac atgccccagc aactgtttgt ggacctaaga agtctactaa tttggttaaa 1560 aataagtgtg tcaattttaa tttcaatgga cttacgggca caggagttct tactgagtct 1620 aacaagaagt ttctgccttt ccagcagttc ggcagagata ttgctgacac tactgatgct 1680 gtgcgtgatc cacagacact tgaaattctt gacattacac catgttcttt tggtggcgtg 1740 agtgttataa ctcccggaac aaatacctcc aaccaggtgg ctgttctgta tcaggacgtg 1800 aactgtacag aagtccctgt tgcaattcat gcagatcagc ttactcctac ctggcgtgtt 1860 tattctacgg gttccaatgt ttttcaaaca cgtgcaggct gcttgatagg ggctgaacat 1920 gtcaacaact catatgaatg cgacataccc ataggtgcag gtatatgcgc tagttatcag 1980 actcagacca attctccgcg gcgggcacga agtgtagcta gtcaatccat cattgcctac 2040 actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2100 acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160 gttgactgta caatgtatat ttgcggggat tcaactgagt gctcgaatct gttgttgcaa 2220 tacggcagtt tttgtaccca attgaaccgg gctctgactg gaatagctgt ggaacaagat 2280 aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt ataaaacacc accaattaaa 2340 gatttcggtg gtttcaactt ctcacaaata ctgccagatc cgagcaaacc aagcaagagg 2400 tcattcattg aagacctact tttcaacaaa gtgacacttg cagatgctgg cttcattaaa 2460 cagtatggtg attgcttggg ggatattgct gctagagacc tcatttgtgc acaaaagttt 2520 aacgggctga cagtgttgcc acctttgttg acagatgaga tgattgctca gtacacttct 2580 gcactgctcg ctggtacaat cacatctggg tggacctttg gtgcaggtgc tgccttacaa 2640 ataccatttg ctatgcagat ggcttatagg ttcaatggta tcggagttac acagaacgtt 2700 ctctatgaga accaaaaatt gattgccaac caattcaata gtgccattgg caagattcag 2760 gactcacttt caagcacagc gagtgcactt ggaaagttgc aagatgtggt caaccagaat 2820 gcacaagctt taaacacgct tgtgaaacaa ctcagctcca actttggggc aatttcaagt 2880 gttttgaatg atatcctttc acgtcttgat aaagtggaag ccgaggtgca aattgacagg 2940 ttgatcacag gccgacttca aagtttgcag acttatgtga ctcaacaatt aattagggca 3000 gcagaaatcc gcgcttcggc taatctggcg gctactaaaa tgtcagagtg tgtacttgga 3060 caatctaaac gagttgattt ttgcggaaag ggctatcatc tcatgtcctt ccctcagtca 3120 gcgcctcacg gtgtagtgtt cttgcacgtg acttacgttc ctgcacaaga aaagaatttc 3180 acaactgctc cggccatttg tcatgatgga aaagcccact ttccgcgtga aggtgtcttt 3240 gtttcgaatg gcacacactg gtttgtaacc caaaggaatt tttatgagcc acaaatcatt 3300 acgacggaca acacttttgt gtctggtaat tgtgatgttg taatcggaat cgtcaacaac 3360 accgtttacg atcctttgca gcctgagtta gattctttca aagaggagct ggataagtat 3420 ttcaagaatc atacatcacc cgatgttgat ctcggtgata tctctggaat taatgcttca 3480 gttgtgaaca ttcaaaagga gattgaccgc ctcaatgagg ttgccaagaa tttgaatgaa 3540 tcgctcatcg atctccaaga acttggaaag tatgagcagt atatcaagtg gcca 3594 <210> 2 <211> 1198 <212> PRT <213> Artificial Sequence <220> <223> Sf delta (TMD-CT) <400> 2 Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser 1 5 10 15 Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val 20 25 30 Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr 35 40 45 Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe 50 55 60 Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr 65 70 75 80 Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp 85 90 95 Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val 100 105 110 Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val 115 120 125 Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val 130 135 140 Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe 145 150 155 160 Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu 165 170 175 Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His 180 185 190 Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu 195 200 205 Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln 210 215 220 Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser 225 230 235 240 Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln 245 250 255 Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp 260 265 270 Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu 275 280 285 Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg 290 295 300 Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu 305 310 315 320 Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr 325 330 335 Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val 340 345 350 Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser 355 360 365 Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser 370 375 380 Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr 385 390 395 400 Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly 405 410 415 Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly 420 425 430 Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro 435 440 445 Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro 450 455 460 Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr 465 470 475 480 Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val 485 490 495 Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro 500 505 510 Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe 515 520 525 Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe 530 535 540 Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala 545 550 555 560 Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser 565 570 575 Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln 580 585 590 Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala 595 600 605 Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly 610 615 620 Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His 625 630 635 640 Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys 645 650 655 Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val 660 665 670 Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn 675 680 685 Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr 690 695 700 Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser 705 710 715 720 Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn 725 730 735 Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu 740 745 750 Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala 755 760 765 Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly 770 775 780 Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg 785 790 795 800 Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala 805 810 815 Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg 820 825 830 Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro 835 840 845 Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala 850 855 860 Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln 865 870 875 880 Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val 885 890 895 Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe 900 905 910 Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser 915 920 925 Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu 930 935 940 Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser 945 950 955 960 Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val 965 970 975 Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr 980 985 990 Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn 995 1000 1005 Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg 1010 1015 1020 Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser 1025 1030 1035 1040 Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln 1045 1050 1055 Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala 1060 1065 1070 His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe 1075 1080 1085 Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn 1090 1095 1100 Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn 1105 1110 1115 1120 Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu 1125 1130 1135 Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly 1140 1145 1150 Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile 1155 1160 1165 Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp 1170 1175 1180 Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro 1185 1190 1195 <210> 3 <211> 1998 <212> DNA <213> Artificial Sequence <220> <223> S1s <400> 3 gttaacctta ccaccagaac tcagttaccc ccagcataca ctaattcttt cacacgtggt 60 gtttactacc ctgacaaagt tttcagaagc agcgttttac acagcactca ggatttattc 120 ctacctttct tttccaacgt gacctggttc catgctatac atgtatctgg gaccaatggt 180 accaagaggt ttgataaccc ggtcctacca tttaatgatg gagtctattt tgcctccact 240 gagaagtcta atataataag aggctggatt tttggaacta ctcttgattc gaagacccag 300 agtctactta ttgttaataa cgctacaaat gttgttatca aagtatgtga atttcaattc 360 tgtaatgatc cattcttggg tgtttactac cacaaaaaca acaaaagttg gatggaaagt 420 gagtttcggg tttatagcag tgcgaataat tgcacttttg agtacgtctc ccaacctttt 480 cttatggacc ttgaaggaaa gcagggaaat ttcaagaatc ttcgcgaatt tgtgtttaag 540 aatatcgatg gttatttcaa gatatattct aagcacacgc ctattaattt agtgcgagat 600 ctccctcagg gtttttcggc gctggaacca ttggtagatt tgccgatagg aatcaatatc 660 actaggttcc agactttact tgctctgcat agaagttact tgacccctgg agatagctca 720 tcaggttgga cagctggtgc ggcagcttat tacgtggggt atcttcagcc taggacgttc 780 ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 840 ctctcagaaa caaagtgtac gttgaaatcc ttcacggtag aaaaagggat ctaccaaacg 900 tctaacttca gagtccagcc aacagaatct attgtgagat ttcccaatat tacaaacttg 960 tgccctttcg gagaagtttt taacgccacc aggtttgcat cggtttatgc ttggaacagg 1020 aaaagaatca gcaactgtgt tgctgattat agtgtcctat ataactccgc atccttttcc 1080 actttcaagt gttacggagt ttctcctact aaattaaatg atctctgctt tactaatgtc 1140 tatgcagatt catttgtaat cagaggtgat gaggtcagac aaatcgctcc agggcagact 1200 ggaaagattg ctgattataa ttataagctt cctgatgatt ttacaggctg cgttatagca 1260 tggaattcta ataatcttga ctctaaggtg gggggaaatt ataattacct gtatagactg 1320 tttaggaaga gcaatctcaa gcctttcgag agagacattt caactgagat ctaccaggcg 1380 ggaagcactc cgtgtaatgg tgttgagggt tttaattgtt actttccttt acagtcatac 1440 ggtttccaac ccacgaatgg ggttggttac caaccgtacc gagtagtagt actttctttc 1500 gagcttctac atgccccagc aactgtttgt ggacctaaga agtctactaa tttggttaaa 1560 aataagtgtg tcaattttaa tttcaatgga cttacgggca caggagttct tactgagtct 1620 aacaagaagt ttctgccttt ccagcagttc ggcagagata ttgctgacac tactgatgct 1680 gtgcgtgatc cacagacact tgaaattctt gacattacac catgttcttt tggtggcgtg 1740 agtgttataa ctcccggaac aaatacctcc aaccaggtgg ctgttctgta tcaggacgtg 1800 aactgtacag aagtccctgt tgcaattcat gcagatcagc ttactcctac ctggcgtgtt 1860 tattctacgg gttccaatgt ttttcaaaca cgtgcaggct gcttgatagg ggctgaacat 1920 gtcaacaact catatgaatg cgacataccc ataggtgcag gtatatgcgc tagttatcag 1980 actcagacca attctccg 1998 <210> 4 <211> 666 <212> PRT <213> Artificial Sequence <220> <223> S1s protein <400> 4 Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser 1 5 10 15 Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val 20 25 30 Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr 35 40 45 Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe 50 55 60 Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr 65 70 75 80 Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp 85 90 95 Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val 100 105 110 Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val 115 120 125 Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val 130 135 140 Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe 145 150 155 160 Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu 165 170 175 Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His 180 185 190 Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu 195 200 205 Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln 210 215 220 Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser 225 230 235 240 Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln 245 250 255 Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp 260 265 270 Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu 275 280 285 Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg 290 295 300 Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu 305 310 315 320 Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr 325 330 335 Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val 340 345 350 Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser 355 360 365 Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser 370 375 380 Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr 385 390 395 400 Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly 405 410 415 Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly 420 425 430 Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro 435 440 445 Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro 450 455 460 Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr 465 470 475 480 Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val 485 490 495 Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro 500 505 510 Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe 515 520 525 Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe 530 535 540 Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala 545 550 555 560 Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser 565 570 575 Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln 580 585 590 Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala 595 600 605 Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly 610 615 620 Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His 625 630 635 640 Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys 645 650 655 Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro 660 665 <210> 5 <211> 1596 <212> DNA <213> Artificial Sequence <220> <223> S2s delta (TMD-CT) <400> 5 cggcgggcac gaagtgtagc tagtcaatcc atcattgcct acactatgtc acttggtgca 60 gaaaattcag ttgcttactc taataactct attgccatac ccacaaattt tactattagt 120 gttaccacag aaattctacc agtgtctatg accaagacat cagttgactg tacaatgtat 180 atttgcgggg attcaactga gtgctcgaat ctgttgttgc aatacggcag tttttgtacc 240 caattgaacc gggctctgac tggaatagct gtggaacaag ataaaaacac ccaagaagtt 300 tttgcacaag tcaaacaaat ttataaaaca ccaccaatta aagatttcgg tggtttcaac 360 ttctcacaaa tactgccaga tccgagcaaa ccaagcaaga ggtcattcat tgaagaccta 420 cttttcaaca aagtgacact tgcagatgct ggcttcatta aacagtatgg tgattgcttg 480 ggggatattg ctgctagaga cctcatttgt gcacaaaagt ttaacgggct gacagtgttg 540 ccacctttgt tgacagatga gatgattgct cagtacactt ctgcactgct cgctggtaca 600 atcacatctg ggtggacctt tggtgcaggt gctgccttac aaataccatt tgctatgcag 660 atggcttata ggttcaatgg tatcggagtt acacagaacg ttctctatga gaaccaaaaa 720 ttgattgcca accaattcaa tagtgccatt ggcaagattc aggactcact ttcaagcaca 780 gcgagtgcac ttggaaagtt gcaagatgtg gtcaaccaga atgcacaagc tttaaacacg 840 cttgtgaaac aactcagctc caactttggg gcaatttcaa gtgttttgaa tgatatcctt 900 tcacgtcttg ataaagtgga agccgaggtg caaattgaca ggttgatcac aggccgactt 960 caaagtttgc agacttatgt gactcaacaa ttaattaggg cagcagaaat ccgcgcttcg 1020 gctaatctgg cggctactaa aatgtcagag tgtgtacttg gacaatctaa acgagttgat 1080 ttttgcggaa agggctatca tctcatgtcc ttccctcagt cagcgcctca cggtgtagtg 1140 ttcttgcacg tgacttacgt tcctgcacaa gaaaagaatt tcacaactgc tccggccatt 1200 tgtcatgatg gaaaagccca ctttccgcgt gaaggtgtct ttgtttcgaa tggcacacac 1260 tggtttgtaa cccaaaggaa tttttatgag ccacaaatca ttacgacgga caacactttt 1320 gtgtctggta attgtgatgt tgtaatcgga atcgtcaaca acaccgttta cgatcctttg 1380 cagcctgagt tagattcttt caaagaggag ctggataagt atttcaagaa tcatacatca 1440 cccgatgttg atctcggtga tatctctgga attaatgctt cagttgtgaa cattcaaaag 1500 gagattgacc gcctcaatga ggttgccaag aatttgaatg aatcgctcat cgatctccaa 1560 gaacttggaa agtatgagca gtatatcaag tggcca 1596 <210> 6 <211> 532 <212> PRT <213> Artificial Sequence <220> <223> S2s delta (TMD-CT) <400> 6 Arg Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met 1 5 10 15 Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala 20 25 30 Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val 35 40 45 Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp 50 55 60 Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr 65 70 75 80 Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn 85 90 95 Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro 100 105 110 Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro 115 120 125 Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys 130 135 140 Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu 145 150 155 160 Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly 165 170 175 Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr 180 185 190 Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly 195 200 205 Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg 210 215 220 Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys 225 230 235 240 Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser 245 250 255 Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn 260 265 270 Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn 275 280 285 Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp 290 295 300 Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu 305 310 315 320 Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu 325 330 335 Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val 340 345 350 Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu 355 360 365 Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val 370 375 380 Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile 385 390 395 400 Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser 405 410 415 Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln 420 425 430 Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val 435 440 445 Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu 450 455 460 Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser 465 470 475 480 Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val 485 490 495 Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu 500 505 510 Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr 515 520 525 Ile Lys Trp Pro 530 <210> 7 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> mCOr1 <400> 7 gtgtctaggc ttgaggaaga tgttagaaat ctcaacgcaa ttgtccagaa acttcaggaa 60 aggttggata ggctggagga aactgttcaa gctaag 96 <210> 8 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> mCor1 <400> 8 Val Ser Arg Leu Glu Glu Asp Val Arg Asn Leu Asn Ala Ile Val Gln 1 5 10 15 Lys Leu Gln Glu Arg Leu Asp Arg Leu Glu Glu Thr Val Gln Ala Lys 20 25 30 <210> 9 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Linker <400> 9 ggaggttcag gaggttcagg aggttcagga ggttca 36 <210> 10 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 10 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser 1 5 10 <210> 11 <211> 272 <212> DNA <213> Artificial Sequence <220> <223> BiP <400> 11 atggctcgct cgtttggagc taacagtacc gttgtgttgg cgatcatctt cttcggtgag 60 tgattttccg atcttcttct ccgatttaga tctcctctac attgttgctt aatctcagaa 120 ccttttttcg ttgttcctgg atctgaatgt gtttgtttgc aatttcacga tcttaaaagg 180 ttagatctcg attggtattg acgattggaa tctttacgat ttcaggatgt ttatttgcgt 240 tgtcctctgc aatagaagag gctacgaagt ta 272 <210> 12 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> HDEL <400> 12 cacgatgagc tc 12 <210> 13 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> HDEL <400> 13 His Asp Glu Leu 1 <210> 14 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 5'UTR <400> 14 aattattaca tcaaaacaaa aa 22 <210> 15 <211> 1220 <212> DNA <213> Artificial Sequence <220> <223> MacT <400> 15 agagatctcc tttgccccag agatcacaat ggacgacttc ctctatctct acgatctagt 60 caggaagttc gacggagaag gtgacgatac catgttcacc actgataatg agaagattag 120 ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 180 tctcatcaag acgatctacc cgagcaataa tctccaggag atcaaatacc ttcccaagaa 240 ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 300 atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 360 aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 420 ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 480 catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 540 cgacacgctt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 600 tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 660 ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 720 cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 780 cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 840 ggattgatgt gacgcaagac gtgacgtaag tatctgagct agtttttatt tttctactaa 900 tttggtcgtt tatttcggcg tgtaggacat ggcaaccggg cctgaatttc gcgggtattc 960 tgtttctatt ccaacttttt cttgatccgc agccattaac gacttttgaa tagatacgct 1020 gacacgccaa gcctcgctag tcaaaagtgt accaaacaac gctttacagc aagaacggaa 1080 tgcgcgtgac gctcgcggtg acgccatttc gccttttcag aaatggataa atagccttgc 1140 ttcctattat atcttcccaa attaccaata cattacacta gcatctgaat ttcataacca 1200 atctcgatac accaaatcgt 1220 <210> 16 <211> 520 <212> DNA <213> Artificial Sequence <220> <223> RD29B terminator <400> 16 aattttactc aaaatgtttt ggttgctatg gtagggacta tggggttttc ggattccggt 60 ggaagtgagt ggggaggcag tggcggaggt aagggagttc aagattctgg aactgaagat 120 ttggggtttt gcttttgaat gtttgcgttt ttgtatgatg cctctgtttg tgaactttga 180 tgtattttat ctttgtgtga aaaagagatt gggttaataa aatatttgct tttttggata 240 agaaactctt ttagcggccc attaataaag gttacaaatg caaaatcatg ttagcgtcag 300 atatttaatt attcgaagat gattgtgata gatttaaaat tatcctagtc aaaaagaaag 360 agtaggttga gcagaaacag tgacatctgt tgtttgtacc atacaaatta gtttagatta 420 ttggttaaca tgttaaatgg ctatgcatgt gacatttaga ccttatcgga attaatttgt 480 agaattatta attaagatgt tgattagttc aaacaaaaat 520

Claims

(i) 코로나 바이러스의 스파이크 단백질에 있어서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지의 아미노산 서열이 결여된 것으로, 서열번호 2의 아미노산 서열로 이루어진 단백질을 코딩하는 유전자; 및
(ii) Coronin 1 (mCor 1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자;를 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
제1 항에 있어서, 상기 코로나 바이러스는 사스(SARS-Corona Virus), 메르스(MERS-Corona Virus) 및 코로나-19(SARS-Corona Virus-2)로 이루어진 군으로부터 선택되는 어느 하나인, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
삭제
제2 항에 있어서, 상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지의 아미노산 서열이 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
삭제
제2 항에 있어서, 상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD 2)까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
삭제
제1 항에 있어서, 상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
제1 항에 있어서,
상기 벡터는 바이너리 벡터인, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
제1 항에 있어서, 상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
제1 항의 재조합 벡터로 형질 전환된 형질 전환 생물.
제11 항에 있어서, 상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물인, 형질 전환체.
(a) 제1 항의 재조합 벡터를 제작하는 단계;
(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;
(c) 상기 형질 전환 생물을 배양하는 단계;
(d) 상기 배양물을 식물에 침윤하는 단계; 및
(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계를 포함하는,
식물에서 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법.
제13 항의 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법에 따라 제조된 재조합 단백질.