KR20220113641A

KR20220113641A - 신규 핵산 분자

Info

Publication number: KR20220113641A
Application number: KR1020220015857A
Authority: KR
Inventors: 김경진; 양주성; 최강현; 이윤채
Original assignee: 에스티팜 주식회사
Priority date: 2021-02-05
Filing date: 2022-02-07
Publication date: 2022-08-16
Also published as: KR102553857B1; JP2024507733A; EP4306641A1; CN117120617A; WO2022169339A1

Abstract

본 발명은 시그널 펩타이드를 인코딩하는 핵산 및 항원을 인코딩하는 핵산을 포함하는 바이러스 감염증 또는 암의 예방 또는 치료용 핵산 분자에 관한 것이다. 또한, 본 발명은 상기 핵산 분자를 포함하는 바이러스 감염증 또는 암의 예방 또는 치료용 백신 조성물에 관한 것이다.
본 발명에 따른 핵산 분자는 세포 내 단백질 발현율 및 세포 외부로의 단백질 분비능이 우수하다. 또한, 생체 내 투여되는 경우, 개체에서 항원 특이적 중화 항체 유도 등의 체액성 면역력을 획득하게 하고, 바이러스의 사멸에 직접 관여하는 면역 세포의 양을 증가시키는 등의 세포성 면역력을 획득하게 하므로, 바이러스 감염증 또는 암의 예방 및 치료를 위한 백신으로서 유용하게 활용될 수 있다.

Description

신규 핵산 분자{NOVEL NUCLEIC ACID MOLECULE}

본 발명은 시그널 펩타이드를 인코딩하는 핵산 및 항원을 인코딩하는 핵산을 포함하는 바이러스 감염증 또는 암의 예방 또는 치료용 핵산 분자에 관한 것이다. 또한, 본 발명은 상기 핵산 분자를 포함하는 바이러스 감염증 또는 암의 예방 또는 치료용 백신 조성물에 관한 것이다.

현재 백신은 다양한 방법으로 개발되어 제조되고 있으며, 구체적인 종류로는 병원체를 약독화된 상태로 주입하는 약독화/생백신(attenuated vaccine), 병원체 자체가 아니라 질병을 일으키는 원인 물질(독소)을 비활성화시켜서 만든 톡소이드 백신(toxoid vaccine), 항원으로 인식되는 항원결정부위에 해당하는 부분만을 따로 추출해서 만든 아단위 백신(subunit vaccine), 유전자 정보를 이용하여 에피토프만을 따로 생산하여 만든 재조합 백신(recombinant vaccine) 등이 있다.

상술한 백신 중에서도, 재조합 백신은 에피토프 외에 다른 성분은 포함되지 않으므로 안전성이 높다는 장점이 있으며, 특히 mRNA로 이루어진 핵산 백신은 생산 속도가 빠르고 비용이 적게 들며, 세포 매개 면역(cell-mediated immunity) 및 체액 면역(humoral immunity) 모두에 대해 면역 반응을 유도할 수 있다는 점에서 많은 이점이 있다. 또한, 항원의 다양한 구성성분 중 면역 반응을 유도하는 특정 에피토프만을 선별하여 사용하는 등 백신의 구성을 다양하게 디자인할 수 있는바, 바이러스 감염증, 암 등 다양한 질병의 예방 또는 치료에 유용하게 활용되고 있다.

일 예로, 바이러스 감염증으로는 감기, 인플루엔자, 수두, 구순 포진 등 비교적 가벼운 증세를 보이는 것부터, 광견병, 에볼라, 마버그, 크리미안콩고출혈열 바이러스병, AIDS, 조류 인플루엔자, SARS, COVID-19, 암 등 심각한 부작용 및 후유증을 야기하는 중증질환을 들 수 있다. 이에, 감염 후 발현된 증상을 완화시키고 치료하는 것보다 증상의 발현을 예방하는 것이 주요 이슈임에 따라, 바이러스 감염증을 예방하기 위한 백신의 개발이 활발히 이루어지고 있다.

또한, 암 백신과 관련해서는, 바이러스 감염으로 인해 발병하는 암 뿐만 아니라, 세포의 돌연변이로 인해 발병하는 암에 대해서도 예방, 치료 등의 용도로써 암 백신이 연구 및 개발되고 있다. 암세포는 정상세포에는 존재하지 않는 종양-특이적 항원이 존재하는데, 암 백신은 이러한 종양-특이적 항원을 통해 암세포 특이적 면역반응을 유도함으로써 암세포가 과다 증식되기 전에 사멸시킨다. 일부 암 백신은 환자 맞춤형으로 제작되기도 하는데, 환자의 암세포 유전자를 분석함으로써 암을 유발한 돌연변이 유전자를 찾아내고 이에 의해 코딩되는 신항원 에피토프(neoantigen epitope)들로 변역되는 mRNA를 백신으로 제조하여 투여하는 경우, 해당 환자에서만 강력한 면역반응을 유도할 수 있어 맞춤형 정밀의약으로 개발이 가능하다는 장점이 있다.

다만, mRNA 백신 등의 핵산 백신은 작용 기전의 특성상 단백질로의 발현 효율이 매우 중요하며, 단백질의 발현 정도에 따라 백신의 효능이 결정되는바, 다양한 질병을 타겟으로 할 뿐만 아니라 단백질 발현능 또한 향상된 물질의 개발이 요구되고 있다.

본 발명은 시그널 펩타이드를 인코딩하는 핵산 및 항원을 인코딩하는 핵산을 포함하는 바이러스 감염증 또는 암의 예방 또는 치료용 핵산 분자, 및 상기 핵산 분자를 포함하는 백신 조성물을 제공하는 것을 목적으로 한다.

본 발명에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 발명에서 개시된 다양한 요소들의 모든 조합이 본 발명의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 발명의 범주가 제한된다고 볼 수 없다.

또한, 본 명세서에서 특별히 정의되지 않은 용어들에 대해서는 본 발명이 속하는 기술 분야에서 통상적으로 사용되는 의미를 갖는 것으로 이해되어야 할 것이다. 또한, 문맥상 특별히 정의하지 않은 경우라면, 단수는 복수를 포함하며, 복수는 단수를 포함한다.

본 발명의 하나의 양태는 시그널 펩타이드를 인코딩하는 핵산 및 항원을 인코딩하는 핵산을 포함하는, 바이러스 감염증 또는 암의 예방 또는 치료용 핵산 분자를 제공한다.

용어, "시그널 펩타이드"는 단백질 합성 초기에 단백질의 N-말단에 존재하는 펩타이드를 의미하며, 신호 서열(signal sequence), 타겟팅 서열(targeting signal), 위치화 신호(localization signal), 위치화 서열(localization sequence), 리더 서열(leader sequence) 또는 리더 펩타이드(leader peptide) 등으로도 불린다. 본 발명에 따른 시그널 펩타이드는 핵산 분자의 단백질 발현 및 분비를 증가시키는 역할을 수행할 수 있다. 이때, 본 명세서에서 상기 '단백질 발현' 또는 '단백질 발현율'은 '단백질 번역', '단백질 번역율', '항원 발현', '항원 발현율' 등과 동일한 의미로 혼용되어 사용될 수 있다.

구체적으로, 상기 시그널 펩타이드는 IgE(Immunoglobulin E), 알부민(albumin), 인터페론 감마(IFN-γ), 인자 IX(factor IX) 및 뮤신-유사 단백질 1(mucin-like protein 1, MLP1)으로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 것일 수 있으나, 이에 제한되는 것은 아니다.

또한, 상기 시그널 펩타이드는 IgE로부터 유래된 서열번호 1, 알부민으로부터 유래된 서열번호 5, IFN-γ로부터 유래된 서열번호 9, 인자 IX로부터 유래된 서열번호 13, 및 MLP1으로부터 유래된 서열번호 17로 표시되는 펩타이드로 이루어진 그룹에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.

또한, 상기 시그널 펩타이드를 인코딩하는 핵산은 서열번호 2 내지 4, 6 내지 8, 10 내지 12, 14 내지 16, 및 18 내지 20으로 이루어진 그룹에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.

용어, "항원"은 특이적 항체 생산, 사이토카인 분비 등의 면역 반응을 유발하는 단백질을 의미하며, 상기 항원은 코로나바이러스, 종양바이러스(oncovirus), 종양-특이적 항원(tumor-specific antigen), 종양-연관 항원(tumor-associated antigen) 및 신항원 에피토프(neoantigen epitope)로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 것일 수 있다.

상기 코로나바이러스의 구체적인 예로, 알파코로나바이러스속(α-CoV, alphaCoV, alphacoronavirus), 베타코로나바이러스속(β-CoV, betaCoV, betacoronavirus), 감마코로나바이러스속(γ-CoV, gammaCoV, gammacoronavirus) 또는 델타코로나바이러스속(δ-CoV, deltaCoV, deltacoronavirus)에 속하는 것일 수 있으며, 더욱 구체적으로 HCoV-229E, HCoV-NL63, Bat-SARS-like(SL)-ZC45, Bat-SL ZXC21, SARS-CoV, MERS-CoV, HCoV-OC43, HKU-1, MHV-A59 또는 SARS-CoV-2일 수 있으나, 이에 제한되는 것은 아니다.

더욱 구체적으로, 상기 항원은 코로나바이러스 유래의 스파이크 단백질(spike protein) 및 막 단백질(membrane protein)로 이루어진 그룹에서 선택된 하나 이상일 수 있다.

더욱 구체적으로, 상기 항원은 코로나바이러스 유래의 스파이크 단백질(spike protein) 및 막 단백질(membrane protein)로 이루어진 그룹에서 선택된 하나 이상일 수 있다. 본 발명에 따른 코로나바이러스의 스파이크 단백질은 면역 반응을 유도하며 중화 항체 생성능을 증가시키는 역할을 수행할 수 있으며, 상기 막 단백질은 CD4+ Th 세포의 기능을 향상시키는 등의 면역 반응을 유도하여 바이러스에 감염된 세포를 사멸시키는 역할을 수행할 수 있다.

상기 종양바이러스는 종양(암)의 원인이 되는 바이러스를 의미하며, 구체적인 예로, HBV(Hepatitis B virus), HCV(Hepatitis C virus), HTLV(Human T-lymphotropic virus), HPV(Human papillomaviruses), HHV-8(Kaposi's sarcoma-associated herpesvirus), MCV(Merkel cell polyomavirus) 또는 EBV(Epstein-Barr virus)일 수 있으나, 이에 제한되는 것은 아니다.

또한, 상기 '종양-특이적 항원', '종양-연관 항원' 및 '신항원 에피토프'는 정상세포에는 존재하지 않고, 암세포에만 특이적으로 존재하는 항원 또는 에피토프를 의미한다. 구체적인 예로, 해독틀 변이(mutational frameshift), 스플라이스 변이(splice variant), 유전자 융합(gene fusion), 내인성 레트로엘리먼트(endogenous retroelement) 등 암세포 특이적인 돌연변이에 의해 유발된 돌연변이 유전자, 또는 상기 돌연변이 유전자로부터 발현된 mRNA 또는 단백질일 수 있다.

또한, 상기 항원은 서열번호 21 및 26로 이루어진 그룹에서 선택된 하나 이상의 아미노산 서열일 수 있고; 상기 항원을 인코딩하는 핵산은 서열번호 22 내지 25, 및 27 내지 30으로 이루어진 그룹에서 선택된 하나 이상의 핵산 서열일 수 있으나, 이에 제한되는 것은 아니다.

본 발명에 따른 핵산 분자는 Th 세포 에피토프를 인코딩하는 핵산을 포함할 수 있다.

용어, "Th 세포 에피토프"는 Th 세포에 의해 인식되어 Th 세포에 의한 면역 반응을 유도하는 펩타이드를 의미하며, 상기 'Th 세포(T helper cell)'는 CD4+ 세포, CD4+ T 세포, 보조 T 림프구, 도움 T 세포 등으로도 불리는 면역세포를 의미한다. 본 발명에 따른 Th 세포 에피토프는 Th 세포에 의한 면역 반응을 유도하여 중화 항체 생성능을 증가시키는 역할을 수행할 수 있으며, 구체적으로 IFN-γ, TNF-α, IL-2, IL-10, IL-4, IL-5, IL-6, IL-9, IL-10, IL-13 등의 다양한 사이토카인을 분비하고, 이에 따라 B 세포의 항체 생성, 세포독성 T 세포의 활성화, 기억 T 세포의 활성화, 대식세포를 비롯한 식세포의 항박테리아 활동 촉진 등의 면역 반응을 수행할 수 있다.

구체적으로, 상기 Th 세포 에피토프는 파상풍 톡소이드(Tetanus toxoid), 디프테리아 톡소이드(DTH toxoid) 및 백일해 톡소이드(Purtussis toxoid)로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 펩타이드일 수 있다. 상기 톡소이드는 독성은 제거되었으나 면역 반응을 유도하는 면역원성이 남아있는 물질을 의미하며, '파상풍 톡소이드(Tetanus toxoid)'는 파상풍균인 클로스트리듐 테타니(Clostridium tetani)가 생산하는 신경 독소인 테타노스파즈민(tetanospasmin)에서 유래된 것, '디프테리아 톡소이드(DTH Toxoid)'는 코리네박테리움 디프테리아(Corynebacterium diphtheria)가 생산하는 외독소에서 유래된 것, '백일해 톡소이드(Pertussis toxoid)'는 백일해균인 보더텔라 퍼투시스(Bordetella pertussis)가 생산하는 펩티도글리칸 조각에서 유래된 것일 수 있다. 또한, 상기 Th 세포 에피토프는 대식세포 혹은 수지상세포와 같은 항원제시세포의 MHC Class II에 의해 제시되고 Th 세포의 T 세포 수용체(T cell receptor)에 의해 감지되어 자극 시그널을 전달하는 펩타이드 서열로 구성된 에피토프를 포함할 수 있다.

또한, 상기 Th 세포 에피토프는 절단 부위(cleavage site)를 인코딩하는 핵산을 추가로 포함할 수 있고, 또한 상기 항원과 Th 세포 에피토프 사이에 절단 부위를 인코딩하는 핵산서열을 추가로 포함할 수 있다. 상기 용어, '절단 부위(cleavage site)'는 단백질 분해효소에 의해 절단되는 펩타이드를 의미한다. 본 발명에서는 상기 핵산 분자로부터 발현된 단백질이 효소에 의해 인식된 부위가 절단될 수 있도록 하는 역할을 수행하며, 이를 통해 핵산 분자에 연결된 각 시그널 펩타이드, 항원 및/또는 Th 세포 에피토프가 본 발명에 따른 역할을 수행할 수 있게 한다. 상기 절단 부위는 세포 내 존재하는 내인성 효소에 의해 절단될 수 있고, 구체적으로 퓨린 프로테아제(furine protease) 또는 구제역바이러스(FMDV) 2A 자가 절단부위에 의해 절단될 수 있으나, 이에 제한되는 것은 아니다.

또한, 상기 Th 세포 에피토프는 서열번호 44의 아미노산 서열일 수 있고; 상기 Th 세포 에피토프를 인코딩하는 핵산은 서열번호 45 및 46으로 이루어진 그룹에서 선택된 하나 이상의 핵산 서열일 수 있으나, 이에 제한되는 것은 아니다.

용어, "바이러스 감염증"(viral infection)은 바이러스가 인체의 기관이나 조직에서 증식한 결과로 생기는 질병을 의미한다.

구체적으로, 상기 바이러스 감염증은 코로나바이러스 감염증일 수 있다. 상기 코로나바이러스 감염증의 구체적인 예로, 중증 급성 호흡기 증후군(Severe Acute Respiratory Syndrome, SARS), 중동 호흡기 증후군(Middle East Respiratory Syndrome, MERS) 및 코로나바이러스감염증-19(Coronavirus disease-2019, COVID-19)로 이루어진 그룹에서 선택된 하나 이상일 수 있으나, 코로나바이러스 감염에 의한 질병인 한, 이에 제한되는 것은 아니다.

또한, 상기 바이러스 감염증은 암일 수 있다. 상기 암의 구체적인 예로, 고형암종 및 혈액암종으로 이루어진 그룹에서 선택된 하나 이상일 수 있으며, 상기 고형암종으로는 간암(Hepatocarcinoma), 자궁경부암(cervical cancer), 항문암(anal cancer), 음경암(penis cancer), 외음암(vulva cancer), 질암(vaginal cancer), 구인두암(oropharyngeal cancer), 카포시 육종(Kaposi's sarcoma), 비인두암(nasopharyngeal carcinoma), 위암(stomach cancer), 다발성 캐슬만병(multicentric Castleman's disease), 원발성 삼출액 림프종(primary effusion lymphoma) 또는 머켈세포암(Merkel cell carcinoma) 등일 수 있고, 상기 혈액암종으로는 T 세포 백혈병(T-cell leukemia), 원발성 삼출액 림프종(primary effusion lymphoma), 버킷 림프종(Burkitt's lymphoma), 호치킨 림프종(Hodgkin's lymphoma) 또는 이식 후 림프증식성 질환(post-transplant lymphoproliferative disease) 등 일 수 있으나, 종양바이러스 감염에 의한 것인 한, 이에 제한되는 것은 아니다.

또한, 본 발명에 따른 핵산 분자가 예방할 수 있는 암에는 구체적인 예로, 고형암종 및 혈액암종으로 이루어진 그룹에서 선택된 하나 이상일 수 있으며, 상기 고형암종으로는 위암, 폐암, 간암, 대장암, 결장암, 신장암, 소장암, 췌장암, 뇌종양, 골암, 피부암, 표피암종, 편평세포암종, 유방암, 경화성선증, 두경부암, 식도암, 인두암, 갑상선암, 부갑상선암, 신경 모세포종, 흑색종, 육종, 전립선암, 자궁암, 자궁경부암, 난소암, 질암, 외음암, 요도암, 방광암, 음경암, 고환암, 섬유선종 또는 이들의 전이암 등일 수 있고, 상기 혈액암종으로는 혈액암, 혈관육종, 백혈병, 림프종, 또는 이들의 전이암 등일 수 있으나, 이에 제한되는 것은 아니다.

또한, 본 발명에 따른 핵산 분자는 백신 제조용 핵산 분자일 수 있으며, 바이러스 감염증 또는 암의 예방 또는 치료용 백신의 제조용 핵산 분자일 수 있다.

용어, "예방"은 본 발명에 따른 핵산 분자에 의해 바이러스 감염증 또는 암이 억제 또는 지연되는 모든 행위를 의미한다.

용어, "치료"는 본 발명에 따른 핵산 분자에 의해 바이러스 감염증 또는 암의 증상이 호전되거나 완치되는 모든 행위를 의미한다.

용어, "핵산 분자"는 DNA 및 RNA 분자를 포괄적으로 포함하는 의미를 가지며, 상기 핵산 분자에서 기본 구성 단위인 뉴클레오티드는 자연의 뉴클레오티드뿐만 아니라, 당 또는 염기 부위가 변형된 유사체(analogue)도 포함한다. 본 발명의 핵산 분자의 서열은 변이될 수 있으며, 상기 변이는 하나 이상의 뉴클레오티드의 추가, 결실, 비보존적 치환 또는 변형을 포함한다.

또한, 핵산 서열 및 아미노산 서열을 포함한, 본 발명에서 이용되는 모든 서열은 생물학적으로 균등 활성을 갖는 변이를 고려한다면, 서열목록에 기재된 서열과 실질적인 동일성(substantial identity)을 나타내는 서열도 포함하는 것으로 해석된다. 상기 용어, '실질적인 동일성'은 본 발명의 서열과 임의의 다른 서열을 최대한 대응되도록 얼라인(align)하고, 당업계에서 통상적으로 이용되는 알고리즘을 이용하여 얼라인된 서열을 분석한 경우에, 최소 60%의 상동성, 더욱 구체적으로 70%의 상동성, 더더욱 구체적으로 80%의 상동성, 가장 구체적으로 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 상동성을 나타내는 서열을 의미한다.

따라서, 본 발명의 서열번호 1 내지 59로 표시되는 서열과 높은 상동성을 갖는 서열, 예를 들면 그 상동성이 70% 이상, 구체적으로 80% 이상, 더욱 구체적으로 90% 이상의 높은 상동성을 갖는 서열도 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

상기 핵산 분자는 본 발명에 따른 시그널 펩타이드, 항원 및/또는 Th 세포 에피토프를 다음과 같은 구조로 포함할 수 있다: 5'-[시그널 펩타이드]-[항원]-3' 또는 5'-[시그널 펩타이드]-[항원]-[Th 세포 에피토프]-3'.

이때, 상기 시그널 펩타이드, 항원 및/또는 Th 세포 에피토프는 상술한 순서에 제한되는 것은 아니며, 본 발명에 따른 역할을 수행할 수 있는 한, 그 순서에는 제한이 없다.

또한, 상기 시그널 펩타이드, 항원 및/또는 Th 세포 에피토프는 상기 핵산 분자에 단수 또는 복수로 포함될 수 있으며, 단백질의 발현율이 감소되지 않는 한, 그 수에는 제한이 없다.

또한, 상기 핵산 분자는 상기 시그널 펩타이드, 항원 및/또는 Th 세포 에피토프 이외에, 단백질로의 발현을 위한 일반적인 핵산 서열, 구체적인 예로, 7-메틸구아노신(7-methylguanosine)을 포함하는 5'-CAP, Kozak 서열, 개시 코돈, 종결 코돈, 아데노신(adenosine)을 포함하는 3'-폴리 A 테일(3'-Poly A tail) 등을 포함할 수 있다.

본 발명의 다른 하나의 양태는 상기 핵산 분자를 포함하는, 바이러스 감염증 또는 암의 예방 또는 치료용 백신 조성물을 제공한다.

이때, 상기 "핵산 분자", "바이러스 감염증" 및 "암"에 대한 설명은 전술한 바와 같다.

용어, "예방"은 본 발명에 따른 백신 조성물의 투여에 의해 바이러스 감염증 또는 암이 억제 또는 지연되는 모든 행위를 의미한다.

용어, "치료"는 본 발명에 따른 백신 조성물의 투여에 의해 바이러스 감염증 또는 암의 증상이 호전되거나 완치되는 모든 행위를 의미한다.

용어, "백신"은 개체에 면역을 주는 항원을 함유한 생물학적인 제제로서, 감염증의 예방을 위하여 개체에 주사하거나 경구 투여함으로써 개체의 생체에 면역이 생기게 하는 면역원 또는 항원성 물질을 말한다. 상기 백신은 RNA 백신일 수 있고, 구체적으로 mRNA 백신일 수 있다. 용어 "mRNA 백신"은 항원의 유전자 중 일부를 인공적으로 복제한 후 이를 투여함으로써 면역 반응을 야기하는 백신을 의미한다. 이러한 mRNA 백신은 기존 단백질 백신에 비해서 다양한 장점을 갖는데, 우선 순수한 표적 항원의 유전정보만으로 합성 제작이 가능하기 때문에 위험한 병원체를 직접 취급할 필요가 없으며, 독성 유발에 필요한 유전자들 중 일부만을 사용하므로 투여되더라도 별다른 독성을 나타낼 염려가 없고, mRNA만으로 구성되는 단순함 때문에 갑자기 발생하는 감염병 또는 다양한 돌연변이에 대한 백신을 신속하게 개발할 수 있다는 등의 다양한 장점들을 가지고 있다.

구체적으로, 본 발명에 따른 바이러스 감염증 또는 암의 예방 또는 치료용 백신 조성물은 코로나바이러스 감염증 및/또는 암의 예방 또는 치료용으로 사용될 수 있고, 코로나바이러스, 종양바이러스, 종양-특이적 항원, 종양-연관 항원 및/또는 신항원 에피토프에 대한 면역능을 갖는 것일 수 있다. 상기 코로나바이러스의 구체적인 예로 알파코로나바이러스속, 베타코로나바이러스속, 감마코로나바이러스속 또는 델타코로나바이러스속, 더욱 구체적인 예로 HCoV-229E, HCoV-NL63, Bat-SARS-like(SL)-ZC45, Bat-SL ZXC21, SARS-CoV, MERS-CoV, HCoV-OC43, HKU-1, MHV-A59 또는 SARS-CoV-2 등일 수 있으며, 상기 종양바이러스의 구체적인 예로 HBV, HCV, HTLV, HPV, HHV-8, MCV 또는 EBV 등일 수 있으나, 이에 제한되는 것은 아니다.

또한, 상기 백신 조성물에 포함되는 상기 핵산 분자는 전달체에 담지되거나 연결된 것일 수 있고, 상기 전달체는 리포좀 기반 전달체, 지질 기반 전달체, 폴리머 기반 전달체 및 지질-폴리머 하이브리드 나노입자로 이루어진 그룹에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다. 상기 전달체의 구체적인 예로, 리포좀(liposome), 파이토좀(phytosome), 에토좀(ethosome), 지질 나노입자(lipid nanoparticle), 지질-유사 나노입자(lipid-like nanoparticle), 지질 에멀젼(lipid emulsion), 리포플렉스(lipoplex), 지질 미셸(lipid micelle) 등의 리포좀 기반 전달체 또는 지질 기반 전달체; 폴리머좀(polymersome), 폴리머성 나노입자(polymeric nanoparticle), 덴드리머(dendrimer), 나노스피어(nanophere), 폴리플렉스(polyplex), 폴리머성 미셸(polymeric micelle) 등의 폴리머 기반 전달체; 또는 지질-폴리머 하이브리드 나노입자(lipid-polymer hybrid nanoparticle), 양이온성 나노에멀젼(cationic nanoemulsion), 음이온성 나노에멀젼(anionic nanoemulsion), 리포폴리플렉스(lipopolyplex) 등의 지질-폴리머 하이브리드 나노입자일 수 있으나, 이에 제한되는 것은 아니다.

본 발명의 백신 조성물은 약학적으로 허용 가능한 담체를 포함할 수 있다. 상기 용어, '약학적으로 허용 가능한 담체'는 임의의 모든 용매, 분산 매질, 코팅제, 항원보강제, 안정제, 부형제, 희석제, 보존제, 항균제 및 항진균제, 등장성 작용제, 흡착지연제 등을 포함한다. 상기 담체의 구체적인 예로 락토즈, 덱스트로스, 슈크로스, 솔비톨, 만니톨, 자일리톨, 말티톨, 전분, 글리세린, 전분, 아카시아 고무, 알지네이트, 젤라틴, 칼슘포스페이트, 칼슘실리케이트, 셀룰로즈, 메틸 셀룰로즈, 미정질 셀룰로즈, 폴리비닐 피롤리돈, 물, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 탈크, 마그네슘 스테아레이트 및 광물유를 들 수 있으나, 이에 제한되는 것은 아니다.

또한, 본 발명의 백신용 조성물은 각각 통상의 방법에 따라 산제, 과립제, 정제, 캡슐제, 현탁액, 에멀젼, 시럽, 에어로졸 등의 경구형 제형 및 멸균 주사용액의 형태로 제형화하여 사용될 수 있다. 제제화할 경우에는 보통 사용되는 충진제, 증량제, 결합제, 습윤제, 붕해제, 계면활성제 등의 희석제 또는 부형제를 사용하여 조제할 수 있다.

상기 백신 조성물은 다양한 형태로 개체에 투여될 수 있다. 상기 "투여"는 피하투여, 근육내투여, 피내투여, 복막내투여, 정맥투여, 비강투여, 경피투여, 비경구투여 및 경구투여 등으로 수행될 수 있으나, 이에 제한되는 것은 아니다.

상기 백신 조성물은 면역 반응을 개선 또는 강화시키기 위하여 하나 이상의 보조제 등을 포함할 수 있다. 적절한 보조제에는 이중 가닥 RNA(dsRNA)의 합성 유사체, 비메칠화된 시티딘- 구아니딘형의 올리고핵산, 펩티드, 알루미늄 하이드록시드, 알루미늄 포스페이트, 알루미늄 옥시드 및 Marcol 52 같은 미네랄 오일 또는 식물성 오일, 및 하나 이상의 유화제로 구성된 조성물 또는 리졸세시틴, 다가 양이온, 다가 음이온 같은 표면 활성물질 등이 포함된다.

본 발명의 또 다른 하나의 양태는 상기 백신 조성물을 이를 필요로 하는 개체에 투여하는 단계를 포함하는, 개체에서 바이러스 감염증 또는 암에 대한 면역 반응을 생성하는 방법을 제공한다.

이때, 상기 "백신 조성물", "바이러스 감염증", "암" 및 "투여"에 대한 설명은 전술한 바와 같다.

용어, "개체"는 바이러스에 감염될 가능성이 있거나 감염된 개체, 또는 암이 발병될 가능성이 있거나 발병된 개체를 모두 포함하며, 인간, 임의의 비인간 동물, 어류 또는 식물류 등을 제한 없이 포함할 수 있다. 상기 비인간 동물은 척추동물, 예컨대 영장류, 개, 소, 말, 돼지, 설치류, 예컨대 마우스, 래트, 햄스터, 기니피그 등일 수 있다. 본 명세서에서, 상기 "개체"는 "대상체" 또는 "환자"와 상호교환적으로 사용될 수 있다.

용어, "면역 반응"은 항원의 도입에 대한 반응으로의 개체 면역계가 활성화되는 것을 의미한다. 이때, 상기 면역 반응은 세포 매개 면역(cell-mediated immunity) 또는 체액 면역(humoral immunity), 또는 둘 모두의 형태일 수 있다.

상기 면역 반응 생성 방법에서, 본 발명의 백신 조성물은 유효량의 유효 성분, 즉 본 발명에 따른 핵산 분자를 약학적으로 허용가능한 담체 및 보조제와 함께 포함할 수 있다. 용어, "유효량"은 상기 백신 조성물이 투여되는 개체에서 바이러스 감염증 또는 암에 대해 특이적 면역 반응을 유도하기에 충분한 양임을 의미한다. 상기 유효량은 당 분야의 숙련자에 의해 쉽게 결정될 수 있고, 예를 들면 동물에서의 통상적인 실험을 통해 결정될 수 있다.

본 발명의 또 다른 하나의 양태는 상기 백신 조성물을 이를 필요로 하는 개체에 투여하는 단계를 포함하는, 개체에서 바이러스 감염증 또는 암을 예방 또는 치료하는 방법을 제공한다.

이때, 상기 "백신 조성물", "바이러스 감염증", "암", "개체", "투여", "예방" 및 "치료"에 대한 설명은 전술한 바와 같다.

본 발명에 따른 핵산 분자는 세포 내 단백질 발현율 및 세포 외부로의 단백질 분비능이 우수하다. 또한, 생체 내 투여되는 경우, 개체에서 항원 특이적 중화 항체 유도 등의 체액성 면역력을 획득하게 하고, 바이러스의 사멸에 직접 관여하는 면역 세포의 양을 증가시키는 등의 세포성 면역력을 획득하게 하므로, 바이러스 감염증 또는 암의 예방 및 치료를 위한 백신으로서 유용하게 활용될 수 있다.

도 1은 각 시그널 펩타이드와 항원 단백질로서 SARS-CoV-2 바이러스 스파이크 단백질(이하, '스파이크 단백질'로 명명함)이 융합된, mRNA 핵산 분자의 전기영동 결과를 보여주는 이미지이다. "ssRNA ladder"는 mRNA의 크기를 측정하기 위한 사이즈 마커이고, "No SP"는 시그널 펩타이드가 포함되지 않고 스파이크 단백질만 포함된 핵산 분자에 관한 결과, "Albumin SP"는 알부민 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "IFN-γ SP"는 IFN-γ 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Factor IX SP"는 Factor IX 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Mucin like protein SP"는 MLP1 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과이다.
도 2는 각 시그널 펩타이드와 항원 단백질로서 SARS-CoV-2 바이러스 막 단백질(이하, '막 단백질'로 명명함)이 융합된, mRNA 핵산 분자의 전기영동 결과를 보여주는 이미지이다. "ssRNA ladder"는 mRNA의 크기를 측정하기 위한 사이즈 마커이고, "No SP"는 시그널 펩타이드가 포함되지 않고 막 단백질만 포함된 핵산 분자에 관한 결과, "Albumin"은 알부민 유래 시그널 펩타이드 및 막 단백질이 포함된 핵산 분자에 관한 결과, "IFN-γ"는 IFN-γ 유래 시그널 펩타이드 및 막 단백질이 포함된 핵산 분자에 관한 결과, "Factor IX"는 Factor IX 유래 시그널 펩타이드 및 막 단백질이 포함된 핵산 분자에 관한 결과, "MLP"는 MLP1 유래 시그널 펩타이드 및 막 단백질이 포함된 핵산 분자에 관한 결과이다. 또한, "Wild SP"는 각 시그널 펩타이드를 야생형 코돈으로 최적화한 결과, "Yeast opti. SP"는 각 시그널 펩타이드를 효모 코돈으로 최적화한 결과이다.
도 3은 각 시그널 펩타이드와 항원 단백질로서 SARS-CoV-2 바이러스 스파이크 단백질(이하, '스파이크 단백질'로 명명함), Th 세포 에피토프가 융합된, mRNA 핵산 분자의 전기영동 결과를 보여주는 이미지이다. "ssRNA ladder"는 mRNA의 크기를 측정하기 위한 사이즈 마커이고, "No SP"는 시그널 펩타이드가 포함되지 않고 스파이크 단백질만 포함된 핵산 분자에 관한 결과, "Albumin SP"는 알부민 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "IFN-γ SP"는 IFN-γ 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Factor IX SP"는 Factor IX 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Mucin like protein SP"는 MLP1 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과이다.
도 4는 세포에서 발현되는 SARS-CoV-2 바이러스 스파이크 단백질(이하, '스파이크 단백질'로 명명함)의 양을 보여주는 이미지로서, 각 핵산 분자로 형질감염된 세포 용해물에 포함되어 있는 단백질의 양에 관한 것이다. "Negative control"은 핵산 분자로 형질감염되지 않은 세포(음성 대조군)에 관한 결과, "No SP"는 시그널 펩타이드가 포함되지 않고 스파이크 단백질만 포함된 핵산 분자에 관한 결과, "IgE"는 IgE 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Albumin SP"는 알부민 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "IFN-γ SP"는 IFN-γ 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Factor IX SP"는 Factor IX 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Mucin like protein SP"는 MLP1 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과이다.
도 5a는 세포에서 발현되는 SARS-CoV-2 바이러스 스파이크 단백질(이하, '스파이크 단백질'로 명명함)의 양을 보여주는 이미지이다. "media"는 각 핵산 분자로 형질감염된 세포 배양 배지에 포함되어 있는 단백질의 양에 관한 것이고, "lysate"는 각 핵산 분자로 형질감염된 세포 용해물에 포함되어 있는 단백질의 양에 관한 것이다. "Negative control"은 핵산 분자로 형질감염되지 않은 세포(음성 대조군)에 관한 결과, "No SP"는 시그널 펩타이드가 포함되지 않고 스파이크 단백질만 포함된 핵산 분자에 관한 결과, "Albumin SP"는 알부민 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "IFN-γ SP"는 IFN-γ 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Factor IX SP"는 Factor IX 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과, "Mucin like protein SP"는 MLP1 유래 시그널 펩타이드 및 스파이크 단백질이 포함된 핵산 분자에 관한 결과이다.
도 5b는 상기 도 5a에 따른 세포에서 발현되는, 로딩컨트롤로 사용된 α/β-tubulin 단백질의 양을 보여주는 이미지이다.
도 5c는 세포에서 발현되는 SARS-CoV-2 바이러스 스파이크 단백질(이하, '스파이크 단백질'로 명명함)의 양을 보여주는 이미지이다. "media"는 각 핵산 분자로 형질감염된 세포 배양 배지에 포함되어 있는 단백질의 양에 관한 것이고, "lysate"는 각 핵산 분자로 형질감염된 세포 용해물에 포함되어 있는 단백질의 양에 관한 것이다. "Negative control"은 핵산 분자로 형질감염되지 않은 세포(음성 대조군)에 관한 결과, "No SP"는 시그널 펩타이드가 포함되지 않고 스파이크 단백질 및 Th 세포 에피토프만 포함된 핵산 분자에 관한 결과, "Albumin SP"는 알부민 유래 시그널 펩타이드, 스파이크 단백질 및 Th 세포 에피토프가 포함된 핵산 분자에 관한 결과, "IFN-γ SP"는 IFN-γ 유래 시그널 펩타이드, 스파이크 단백질 및 Th 세포 에피토프가 포함된 핵산 분자에 관한 결과, "Factor IX SP"는 Factor IX 유래 시그널 펩타이드, 스파이크 단백질 및 Th 세포 에피토프가 포함된 핵산 분자에 관한 결과, "Mucin like protein SP"는 MLP1 유래 시그널 펩타이드, 스파이크 단백질 및 Th 세포 에피토프가 포함된 핵산 분자에 관한 결과이다.
도 5d는 상기 도 5c에 따른 세포에서 발현되는, 로딩컨트롤로 사용된 α/β-tubulin 단백질의 양을 보여주는 이미지이다.
도 6a는 세포 내에서 발현되는 SARS-CoV-2 바이러스 스파이크 단백질의 양을 보여주는 이미지로서, IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자로 형질감염된 세포에 대한 결과이다("STP2104"). "S0"은 SARS-CoV-2 바이러스 스파이크 전체 단백질을 의미하고, "S1"은 SARS-CoV-2 바이러스 스파이크 단백질의 서브유닛1을 의미한다. "α/β-tubulin"은 로딩 컨트롤로 사용하였다.
도 6b는 세포의 배양액에서 검출되는 SARS-CoV-2 바이러스 스파이크 단백질의 양을 보여주는 그래프로서, IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자로 형질감염된 세포에 대한 결과이다. 상기 핵산 분자는 0.1 또는 0.05 g/L의 농도로 사용하였다.
도 7은 마우스에서 형성된 SARS-CoV-2 바이러스 스파이크 단백질 특이적 결합항체의 양을 보여주는 그래프로서, 2차(부스트) 접종한 후 3주차에 측정한 결과이다. 각 항체의 양은 종말점 역가(endpoint titer)로 나타내었다. "Ag1+LNP1"은 IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자에 관한 결과, "Ag2+LNP1"은 MLP1 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자에 관한 결과, "Ag3+LNP1"은 IgE 유래 시그널 펩타이드, SARS-CoV-2 바이러스 스파이크 전체 단백질 및 Th 세포 에피토프를 포함하는 핵산 분자에 관한 결과이다. 또한, "RBD specific total IgG"는 SARS-CoV-2 바이러스 스파이크 단백질 중 RBD (receptor binding domain) 도메인에 특이적인 항체의 양에 관한 결과이고, "S1 specific total IgG"는 SARS-CoV-2 바이러스 스파이크 단백질 중 서브유닛1(S1)에 특이적인 항체의 양에 관한 결과이다.
도 8은 마우스에서 형성된 SARS-CoV-2 바이러스 스파이크 단백질 특이적 중화항체의 양을 보여주는 그래프로서, PRNT (Plaque reduction neutralization test) 50 값을 Log 값으로 변환하여 나타내었다. "Ag1+LNP1"은 IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자에 관한 결과, "Ag2+LNP1"은 MLP1 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자에 관한 결과, "Ag3+LNP1"은 IgE 유래 시그널 펩타이드, SARS-CoV-2 바이러스 스파이크 전체 단백질 및 Th 세포 에피토프를 포함하는 핵산 분자에 관한 결과, "Mock"은 PBS (Phosphate Buffered saline)에 관한 결과이다.
도 9a는 마우스에서 형성된 SARS-CoV-2 바이러스 스파이크 단백질 특이적 결합항체(IgG1 및 IgG2a isotype)의 양을 보여주는 그래프로서, IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스에 관한 결과이다. 1차(프라임) 접종한 후 4주차에 측정한 결과로서, 각 항체의 양은 광학 밀도(O.D.)로 나타내었다. "RBD protein"은 SARS-CoV-2 바이러스 스파이크 단백질 중 RBD (receptor binding domain) 도메인에 특이적인 IgG1 및 IgG2a 항체의 양은 면역 접종량에 따라서 증가함을 시사하는 결과, "S protein"은 SARS-CoV-2 바이러스 스파이크 전체 단백질에 특이적인 IgG1 및 IgG2a 항체의 양은 면역 접종량에 따라서 증가함을 시사하는 결과이다. 본 mRNA 백신의 면역주사에 의한 생체 내 IgG1/IgG2a 항체 비율의 증가는 Th2 type 체액성 면역반응이 우세하게 유도됨을 의미한다.
도 9b는 마우스에서 형성된 SARS-CoV-2 바이러스 스파이크 단백질 특이적 결합항체(IgG1 및 IgG2a isotype)의 양을 보여주는 그래프로서, IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스에 관한 결과이다. 2차(부스트) 접종한 후 3주차에 측정한 결과로서, 각 항체의 양은 광학 밀도(O.D.)로 나타내었다. "RBD protein"은 SARS-CoV-2 바이러스 스파이크 단백질 중 RBD (receptor binding domain) 도메인에 특이적인 IgG1 및 IgG2a 항체의 양은 면역 접종량에 따라서 증가함을 시사하는 결과, "S protein"은 SARS-CoV-2 바이러스 스파이크 전체 단백질에 특이적인 IgG1 및 IgG2a 항체의 양은 면역 접종량에 따라서 증가함을 시사하는 결과이다. 본 mRNA 백신의 면역주사에 의한 생체 내 IgG1/IgG2a 항체 비율의 증가는 Th2 type 체액성 면역반응이 우세하게 유도됨을 의미한다.
도 10은 마우스에서 형성된 배 중심(Germinal Center; GC) B 세포의 양을 보여주는 그래프로서, IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스에 관한 결과이다. 체액성면역반응은 기억 B 세포와 수명이 긴 형질 세포를 생성하기 위해 배 중심(GC)에서 B 세포와 CD4+ T 세포(여포 보조 T 세포(follicular helper T cells; T_FH 세포)의 특수 집단 간의 상호작용을 필요로 한다. GC B 세포와 T_FH 세포 사이의 분자 누화(crosstalk)는 각 세포 유형의 생존, 증식 및 분화에 영향을 미친다.
도 11은 마우스에서 형성된 CD4⁺ 중추 기억 T 세포(CD4⁺ 세포 중 CD44^high+ 및 CD62L⁺ 세포)의 양을 보여주는 그래프이다. IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스로부터 비장세포를 분리하여 스파이크 전체 아미노산 서열에 대해 15 mer 길이의 펩타이드를 9 mer 중복되도록 합성한 후 5개의 그룹으로 peptide pool을 구성하고(peptide 1 내지 5) 그 중에서 peptide pool 2로 비장세포를 시험관에서 자극한 flow cytometry 분석에 관한 결과이다.
도 12는 마우스에서 형성된 CD8⁺ 중추 기억 T 세포(CD8⁺ 세포 중 CD44^high+ 및 CD62L⁺ 세포)의 양을 보여주는 그래프이다. IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스로부터 비장세포를 분리하여 전술한 바와 같은 SARS-CoV-2 바이러스 스파이크 단백질 유래 peptide pool 2로 자극하여 얻은 결과이다.
도 13은 마우스에서 형성된 CD8⁺ 효과(effector) 기억 T 세포(CD8⁺ 세포 중 CD44^high+ 및 CD62L^- 세포)의 양을 보여주는 그래프이다. IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스로부터 비장세포를 분리하여 전술한 바와 같은 SARS-CoV-2 바이러스 스파이크 단백질 유래 peptide pool 2로 자극하여 얻은 결과이다.
도 14는 마우스에서 형성된 IFN-γ 분비 세포의 수를 ELISpot으로 분석한 결과를 보여주는 그래프이다. IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스 비장으로부터 분리된 비장세포에서 IFN-γ를 분비하는 세포의 수에 관한 결과이다. "NC"는 음성대조군(Negative Control)으로 펩타이드로 자극하지 않고 얻은 결과, "PP2"는 전술한 바와 같은 SARS-CoV-2 바이러스 스파이크 단백질 유래 peptide pool 2로 자극하여 얻은 결과이다.
도 15는 마우스에서 형성된 IFN-γ 분비 세포의 IFN-γ 염색 정도를 활성도로 보여주는 그래프이다. IgE 유래 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 전체 단백질을 포함하는 핵산 분자가 1, 5 또는 10 ㎍으로 투여된 마우스로부터 비장세포를 분리하여 전술한 바와 같은 SARS-CoV-2 바이러스 스파이크 단백질 유래 peptide pool 2로 자극하여 얻은 결과이다.

본 발명에 대해서는 하기의 실시예에 기초하여 보다 상세하게 설명될 것이나, 이는 본 발명의 권리범위를 제한하려는 것이 아니다. 또한, 당해 기술분야에서 통상의 지식을 가진 자라면 본 발명의 취지를 해하지 않는 범위 내에서 본 발명에 대해 다양한 변형 및 수정을 가할 수 있을 것이다.

실시예 1. 백신용 핵산 분자의 제조

바이러스 감염증 또는 암의 예방에 사용될 수 있는 백신 후보물질을 개발하기 위하여, 세포면역원성 및 중화항체 생성 유도능이 우수하고, 특히 단백질로의 발현율이 유의적으로 증가된 핵산 분자를 제조하였다.

구체적으로, 본 발명에 따른 핵산 분자가 생체 내로 투여되는 경우, 항원 단백질로의 발현율이 증가되어 면역 반응을 야기하는 세포면역원성이 증가되고, 이에 따라 인체 내 중화항체가 짧은 시간 내에 많은 양으로 생성될 수 있으며, 나아가 Th 세포에 의한 면역 반응이 효율적으로 유도되어 사이토카인 분비능이 증가됨으로써, 바이러스 감염증 또는 암에 대해 극대화된 예방 및/또는 치료 효능을 나타낸다.

상기 목적을 달성하기 위하여, 핵산 분자에는 시그널 펩타이드(signal peptide), Th 세포 에피토프(T helper cell epitope) 등을 포함시켰고, 예방 및/또는 치료 효능 유도를 목적으로 하는 특정 항원을 포함시켰다. 상기 펩타이드, 단백질 등의 염기 서열 및 아미노산 서열은 GenBank에서 확보하였고, 상기 GenBank에서 확보한 야생형 서열에 대하여 인간 또는 효모의 코돈으로 최적화를 수행함으로써 항원 단백질 발현 효율이 증진된 핵산 분자를 제조하였다. 코돈 최적화는 단백질을 코딩하는 유전자가 잘 발현될 수 있도록 각 개체가 선호하는 코돈이 되도록 변경하여 최적화를 시켜주는 것으로, GC 함량, 반복된 염기서열, 전사 효율, 발현량, 단백질 접힘, mRNA 이차 구조 등 다수의 요인들을 고려하여 수행된다. 상기 요인들 간의 상호 연관성이 코돈 최적화 결과에 있어서 다양하게 영향을 미치므로, 목적하는 수준의 발현량을 나타낼 수 있는 mRNA 서열을 제작하는 것은 경우의 수가 많고 매우 어렵다.

또한, 상기 핵산 분자의 GC 함량과 mRNA 2차 구조의 자유 에너지를 계산하여 단백질 발현량 등을 예측하였는데, 상기 mRNA 2차 구조의 자유 에너지가 증가하면 구조의 안정성이 낮아져 구조가 쉽게 붕괴되는바, 리보솜에 의한 인식 효율이 증가됨에 따라 단백질 발현율이 증가될 수 있다.

이때, 상기 시그널 펩타이드, 항원, Th 세포 에피토프 등은 다음과 같이 구성하여 핵산 분자를 디자인하였다: 5'-[시그널 펩타이드]-[항원]-3' 또는 5'-[시그널 펩타이드]-[항원]-[Th 세포 에피토프]-3'.

실시예 1-1. 시그널 펩타이드 제작

단백질 발현율이 우수한 백신용 핵산 분자를 제조하기 위하여, 먼저 시그널 펩타이드(signal peptide, SP)를 제작하였다.

구체적으로, 인간 유래의 IgE(Immunoglobulin E), 알부민(albumin), 인터페론 감마(IFN-γ), 인자 IX(factor IX, F IX), 뮤신-유사 단백질 1(mucin-like protein 1, MLP1) 등 서로 다른 5종류의 단백질에서 유래한 시그널 펩타이드를 확보하였다. 이들 시그널 펩타이드의 서열을 다양하게 변이시켰으며, 그 중에서 항원 단백질의 발현율이 우수한 서열을 선별하였다. 그 결과는 하기 표 1에 나타내었다. 예를 들어, 서열번호 3의 핵산 서열은 IgE 유래의 시그널 펩타이드를 인간에 대해 코돈 최적화시킨 형태이다.

SP 종류	SP 코돈	서열	서열번호
IgE	야생형 (아미노산)	MDWTWILFLV AAATRVHS	서열번호 1
	야생형 (핵산)	ATGGACTGGACCTGGATCCTCTTCTTGGTGGCAGCAGCCACGCGAGTCCACTCC	서열번호 2
	인간	ATGGACTGGACCTGGATCCTGTTCCTGGTGGCCGCCGCTACAAGAGTGCACAGC	서열번호 3
	효모	ATGGACTGGACTTGGATCTTGTTCTTGGTTGCTGCTGCCACCAGAGTCCACTCT	서열번호 4
알부민	야생형 (아미노산)	MKWVTFISLL FLFSSAYS	서열번호 5
	야생형 (핵산)	ATGAAGTGGGTAACCTTTATTTCCCTTCTTTTTCTCTTTAGCTCGGCTTATTCC	서열번호 6
	인간	ATGAAGTGGGTGACCTTCATCAGCCTGCTGTTCCTGTTTTCTTCCGCCTACAGC	서열번호 7
	효모	ATGAAGTGGGTTACTTTCATCTCTTTGTTGTTTTTATTCTCCTCTGCTTACTCC	서열번호 8
IFN-γ	야생형 (아미노산)	MKYTSYILAF QLCIVLGSLG CYC	서열번호 9
	야생형 (핵산)	ATGAAATATACAAGTTATATCTTGGCTTTTCAGCTCTGCATCGTTTTGGGTTCTCTTGGCTGTTACTGC	서열번호 10
	인간	ATGAAGTACACCAGCTACATCCTGGCCTTCCAGCTGTGCATCGTGCTGGGCTCTCTGGGCTGTTACTGC	서열번호 11
	효모	ATGAAGTACACTTCTTACATTTTGGCTTTCCAATTGTGTATCGTTTTGGGTTCCTTAGGTTGTTACTGT	서열번호 12
F IX	야생형 (아미노산)	MQRVNMIMAE SPGLITICLL GYLLSAEC	서열번호 13
	야생형 (핵산)	ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTAGGATATCTACTCAGTGCTGAATGT	서열번호 14
	인간	ATGCAGAGAGTGAACATGATCATGGCCGAGTCTCCTGGCCTGATCACCATCTGCCTGCTGGGCTACCTGCTGAGCGCCGAATGT	서열번호 15
	효모	ATGCAAAGAGTTAACATGATTATGGCTGAATCTCCAGGTTTGATCACTATCTGTTTGTTGGGTTACTTGTTATCCGCCGAATGT	서열번호 16
MLP1	야생형 (아미노산)	MVYKTLFALC ILTAGWRVQS	서열번호 17
	야생형 (핵산)	ATGGTCTACAAGACTCTCTTCGCTCTTTGCATCTTAACTGCAGGATGGAGGGTACAGAGT	서열번호 18
	인간	ATGGTGTACAAGACCCTGTTCGCCCTGTGCATCCTGACCGCCGGCTGGAGGGTGCAGAGC	서열번호 19
	효모	ATGGTATATAAAACTTTATTTGCTTTATGTATTTTAACTGCTGGTTGGCGTGTACAATCT	서열번호 20

실시예 1-2. 항원 제작

실시예 1-2-1. 'SARS-CoV-2' 스파이크 단백질 제작

바이러스 감염증 또는 암의 예방에 사용될 수 있는 백신 후보물질을 개발하기 위하여, 하나의 예시로 COVID-19를 야기하는 바이러스인 'SARS-CoV-2'의 항원을 사용하였다.

구체적으로, 숙주 세포의 수용체 인식, 세포막 융합, 중화항체 유도 등 감염 및 병원성에 중심적인 역할을 수행한다고 알려져 있는 스파이크 단백질(Spike protein, S)을 사용하였다. 이후, 상기 실시예 1-1에 따른 방법으로 코돈 최적화를 수행하였고, 그 결과는 하기 표 2에 나타내었다. 예를 들어, 서열번호 23의 핵산 서열은 SARS-CoV-2의 스파이크 단백질 항원을 인간에 대해 코돈 최적화시킨 형태이고, 서열번호 25의 핵산 서열은 SARS-CoV-2의 스파이크 단백질 항원을 인간에 대해 코돈 최적화시킨 것과 효모에 대해 코돈 최적화시킨 것을 모두 갖는 형태이다.

항원 종류	항원 코돈	서열번호
SARS-CoV-2 스파이크단백질	야생형 (아미노산)	서열번호 21
	야생형 (핵산)	서열번호 22
	인간	서열번호 23
	효모	서열번호 24
	효모의 코돈 250nt 및 인간의 코돈 3569nt	서열번호 25

결과적으로, 효모 코돈과 인간 코돈을 모두 갖는 형태가 인간 세포에서 바이러스 항원의 발현율이 높고, 목적하는 감염증 예방 효과 또한 우수한 정도로 나타냄을 확인하였다.

따라서, 이후의 백신용 핵산 분자의 제조에 사용할 항원으로는 효모 코돈과 인간 코돈을 모두 갖는 형태인 서열번호 25의 핵산을 사용하였다.

실시예 1-2-2. 'SARS-CoV-2' 막 단백질 제작

구체적으로, 코로나바이러스의 다양한 변이체 간에 유전자를 비교하였을 때 잘 보존된(conserved) 유전자인 막 단백질(Membrane protein, M)을 사용하였다. 이후, 상기 실시예 1-1에 따른 방법으로 코돈 최적화를 수행하였고, 그 결과는 하기 표 3에 나타내었다. 예를 들어, 서열번호 28의 핵산 서열은 SARS-CoV-2의 막 단백질 항원을 인간에 대해 코돈 최적화시킨 형태이고, 서열번호 30의 핵산 서열은 SARS-CoV-2의 막 단백질 항원을 인간에 대해 코돈 최적화시킨 것과 효모에 대해 코돈 최적화시킨 것을 모두 갖는 형태이다.

항원 종류	항원 코돈	서열번호
SARS-CoV-2 막 단백질	야생형 (아미노산)	서열번호 26
	야생형 (핵산)	서열번호 27
	인간	서열번호 28
	효모	서열번호 29
	효모의 코돈 250nt 및 인간의 코돈 419nt	서열번호 30

결과적으로, 효모 코돈과 인간 코돈을 모두 갖는 형태가 인간 세포에서 항원의 발현율이 높고, 목적하는 감염증 예방 효과 또한 우수한 정도로 나타냄을 확인하였다.

따라서, 이후의 백신용 핵산 분자의 제조에 사용할 항원으로는 효모 코돈과 인간 코돈을 모두 갖는 형태인 서열번호 30의 핵산을 사용하였다.

실시예 1-3. 시그널 펩타이드 및 항원의 융합

실시예 1-3-1. 항원으로서 'SARS-CoV-2' 스파이크 단백질 이용

단백질 발현 효율이 증가된 핵산 분자를 제조하기 위하여, 먼저 상기 실시예1-1을 통해 확보한 5종의 시그널 펩타이드와 상기 실시예 1-2-1을 통해 확보한 SARS-CoV-2 바이러스의 스파이크 단백질을 융합시킨 핵산 분자를 제조하였다.

구체적으로, 상기 스파이크 단백질은 효모 코돈 및 인간 코돈을 모두 갖는 형태를 사용하였고, 이는 하기 표 4에 정리하였다.

SP 종류	SP 코돈	SARS-CoV-2 스파이크 단백질	서열번호
IgE	효모	효모의 코돈 250nt 및 인간의 코돈 3569nt	서열번호 31
알부민	효모		서열번호 32
IFN-γ	효모		서열번호 33
F IX	효모		서열번호 34
MLP1	효모		서열번호 35

이후, 상기 핵산 분자를 mRNA로 합성하기 위하여, 10X T7 RNA polymerase buffer(다인바이오, 카탈로그 # DYP1647), 2 mM ATP, 2 mM UTP, 2 mM CTP, 2 mM GTP, 3.2 mM Cleancap AG(트라이링크, 카탈로그 # N-7113-10), 5% DMSO(시그마 알드리치 카탈로그 # 472301-500ML), 10 mg/L 항원 (SARS-CoV-2 스파이크 단백질) DNA 전사 주형, 800 U/mL 재조합 RNase 저해 단백질(타카라 카탈로그 # 2316A), 2 U/mL 이스트 무기 피로포스파타아제(써모 싸이언티픽 카탈로그 # EF0221), 2500 U/mL T7 RNA 폴리머라제(다인바이오 카탈로그 # dy1670)을 혼합하였다. 상기 전사반응 혼합물을 37℃에서 2시간 동안 인큐베이션하였다. mRNA의 합성 여부는 론자 GelStarTM Nucleic Acid gel Stain(카탈로그 #5 0535)을 첨가한 1% 아가로스 겔을 이용하여 전기영동을 진행하여 확인하였다. 한편, 합성한 상기 mRNA를 AKTA(싸이티바, AKTA avant)에서 Oligo(dT) 컬럼(비아 세퍼레이션, 카탈로그 # 311.1219-2)을 사용하여 정제하였고, 이후의 in vitro 또는 in vivo 실험에 사용하였다.

그 결과, 도 1에서 볼 수 있듯이, 각 시그널 펩타이드와 항원 단백질이 융합된 핵산 분자 모두는 약 4,119 nt의 크기에서 밴드를 나타냄을 확인하였다. 이는 각 시그널 펩타이드와 항원 단백질을 모두 포함하는 크기이므로, 본 실시예에서 합성한 백신용 mRNA 핵산 분자는 잘 제조되었으며, 무결성(integrity)이 확보되었음을 확인하였다.

실시예 1-3-2. 항원으로서 'SARS-CoV-2' 막 단백질 이용

단백질 발현 효율이 증가된 핵산 분자를 제조하기 위하여, 먼저 상기 실시예 1-1을 통해 확보한 4종의 시그널 펩타이드와 상기 실시예 1-2-2를 통해 확보한 SARS-CoV-2 바이러스의 막 단백질을 융합시킨 핵산 분자를 제조하였고, 이는 하기 표 5에 정리하였다.

SP 종류	SP 코돈	SARS-CoV-2 막 단백질	서열번호
알부민	야생형	효모의 코돈 250nt 및 인간의 코돈 419nt	서열번호 36
알부민	효모		서열번호 37
IFN-γ	야생형		서열번호 38
IFN-γ	효모		서열번호 39
F IX	야생형		서열번호 40
F IX	효모		서열번호 41
MLP1	야생형		서열번호 42
MLP1	효모		서열번호 43

이후, 상기 실시예 1-3-1에 따른 방법으로, 상기 핵산 분자를 mRNA로 합성한 후 이의 합성 여부를 확인하였으며, 또한 합성된 mRNA를 정제하였다.

그 결과, 도 2에서 볼 수 있듯이, 각 시그널 펩타이드와 항원 단백질이 융합된 핵산 분자 모두는 약 1,107 nt의 크기에서 밴드를 나타냄을 확인하였다. 이는 각 시그널 펩타이드와 항원 단백질을 모두 포함하는 크기이므로, 본 실시예에서 합성한 백신용 mRNA 핵산 분자는 잘 제조되었으며, 무결성(integrity)이 확보되었음을 확인하였다.

실시예 1-4. Th 세포 에피토프 제작

세포면역원성 및 이에 따른 면역반응 유도능이 증가된 백신용 핵산 분자를 제조하기 위하여, 먼저 Th 세포 에피토프를 제작하였다.

구체적으로, Th 세포 에피토프는 하나의 예시로 파상풍 톡소이드에서 유래된 Th 세포 에피토프(Tetanus Toxoid Th cell epitope, TTTh)를 사용하였다. 또한, 상기 TTTh는 서로 다른 서열을 갖는 절단 부위(Cleavage site, CS)로 연결되도록 하였다. 상기 절단 부위를 포함하는 Th 세포 에피토프는 종결코돈을 포함시켜 다음과 같이 디자인하여 ORF의 C-말단에 위치하도록 구성하였다: 5'-[CS1]-[TTTh1]-[CS2]-[TTTh2]-[종결 코돈]-3'. 상기 구성에 대응되는 구체적인 아미노산 서열은 다음과 같다: 5'-[RQKR]-[IDKISDVSTIVPYIGPALNI]-[PKKR]-[NNFTVSFWLRVPKVSASHLE]-5'. 이후, 상기 실시예 1-1에 따른 방법으로 코돈 최적화를 수행하였고, 이는 하기 표 6에 정리하였다. 예를 들어, 서열번호 46의 핵산 서열은 TTTh를 인간에 대해 코돈 최적화시킨 형태이다.

Th 세포 에피토프	Th 세포 에피토프 코돈	서열	서열번호
	야생형 (아미노산)	RQKRIDKISD VSTIVPYIGP ALNIPKKRNN FTVSFWLRVP KVSASHLE	서열번호 44
	야생형 (핵산)	CGCCAGAAACGCATTGATAAAATTAGCGATGTGAGCACCATTGTGCCGTATATTGGCCCGGCGCTGAACATTCCGAAAAAACGCAACAACTTTACCGTGAGCTTTTGGCTGCGCGTGCCGAAAGTGAGCGCGAGCCATCTGGAATGA	서열번호 45
	인간	AGACAGAAAAGAATCGATAAGATCAGCGACGTGTCTACAATCGTGCCATACATCGGCCCTGCCCTGAATATCCCCAAGAAGCGGAACAACTTCACCGTCAGCTTCTGGCTGAGAGTGCCTAAGGTGTCCGCCAGCCACCTGGAGTGA	서열번호 46

결과적으로, 인간의 코돈을 갖는 형태가 인간 세포에서 Th 세포 에피토프 발현율이 높고, 목적하는 백신 효과 또한 우수한 정도로 나타냄을 확인하였다.

실시예 1-5. 시그널 펩타이드, 항원 및 Th 세포 에피토프의 융합

실시예 1-5-1. 항원으로서 'SARS-CoV-2' 스파이크 단백질 이용

상기 실시예 1-1 내지 1-3 등을 통해, 단백질 발현율이 높은 것으로 입증된 시그널 펩타이드는 효모의 코돈을 갖는 형태였으며, 단백질 발현율이 높은 것으로 입증된 항원 'SARS-CoV-2' 스파이크 단백질은 효모 및 인간의 코돈을 모두 갖는 형태임을 확인하였다. 이와 같이 확인된 시그널 펩타이드 서열 및 항원 서열에 Th 세포 에피토프 서열을 융합하여 핵산 분자를 제조하였다. 그 서열은 하기 표 7에 정리하였다.

SP 종류	SP 코돈	항원	Th 세포 에피토프	서열번호
IgE	효모 코돈	SARS-CoV-2 스파이크 단백질 (효모의 코돈 250nt 및 인간 의 코돈 3569nt)	인간 코돈	서열번호 47
알부민				서열번호 48
IFN-γ				서열번호 49
F IX				서열번호 50
MLP1				서열번호 51

이후, 상기 실시예 1-3-1에 따른 방법으로, 상기 핵산 분자를 mRNA로 합성하고, mRNA의 합성 여부를 확인하고, 또한 합성된 mRNA를 정제하였다.

그 결과, 도 3에서 볼 수 있듯이, 각 시그널 펩타이드와 항원 단백질이 융합된 핵산 분자 모두는 약 4,119 nt의 크기에서 밴드를 나타냄을 확인하였다. 이는 각 시그널 펩타이드, 항원 단백질 및 Th 세포 에피토프를 모두 포함하는 크기이므로, 본 실시예에서 합성한 백신용 mRNA 핵산 분자는 잘 제조되었으며, 무결성(integrity)이 확보되었음을 확인하였다.

실시예 1-5-2. 항원으로서 'SARS-CoV-2' 막 단백질 이용

상기 실시예 1-1 내지 1-3 등을 통해, 단백질 발현율이 높은 것으로 입증된 시그널 펩타이드는 야생형의 코돈을 갖거나 효모의 코돈을 갖는 형태였으며, 단백질 발현율이 높은 것으로 입증된 항원 'SARS-CoV-2' 막 단백질은 효모 및 인간의 코돈을 모두 갖는 형태임을 확인하였다. 이와 같이 확인된 시그널 펩타이드 서열 및 항원 서열에 Th 세포 에피토프 서열을 융합하여 핵산 분자를 제조하였다. 그 서열은 하기 표 8에 정리하였다.

SP 종류	SP 코돈	항원	Th 세포 에피토프	서열번호
알부민	야생형	SARS-CoV-2 막 단백질 (효모의 코돈 250nt 및 인간의 코돈 419nt)	인간 코돈	서열번호 52
알부민	효모			서열번호 53
IFN-γ	야생형			서열번호 54
IFN-γ	효모			서열번호 55
F IX	야생형			서열번호 56
F IX	효모			서열번호 57
MLP1	야생형			서열번호 58
MLP1	효모			서열번호 59

실시예 2. 시그널 펩타이드를 포함하는 백신용 핵산 분자의 효과

실시예 2-1. 백신용 핵산 분자의 단백질 발현량 분석

상기 실시예 1에서 제조한 핵산 분자의 효능을 확인하기 위하여, in vitro에서 단백질 발현율을 분석하였다. 통상적으로 in vitro에서 고발현 특성을 나타내는 경우, in vivo에서 고면역원성을 나타내며, 이에 따라 백신의 효능이 증가된다고 알려져 있다. 상기 실시예 1에서 제조한 핵산 분자 중에서도, 실시예 1-3-1 또는 1-5-1에서 제조한 핵산 분자에 대한 효과를 확인하였다. 이때, 항원으로는 효모 코돈 및 인간 코돈을 모두 갖는 SARS-CoV-2 바이러스 스파이크 전체 단백질(서열번호 21)을 사용하였고, 시그널 펩타이드로는 모두 효모 코돈으로 최적화된 것으로서, IgE 유래(서열번호 4), 알부민 유래(서열번호 8), 인터페론 감마 유래(서열번호 12), 인자 IX 유래(서열번호 16) 또는 MLP1 유래(서열번호 20)의 것을 사용하였고, Th 세포 에피토프로는 인간 코돈으로 최적화된 것(서열번호 46)을 사용하여 제조하였다.

구체적으로, HEK-293T (ATCC, 카탈로그 번호 CRL-1586) 세포를 10% FBS 및 1% Pen/Strep이 포함된 DMEM 배지로 배양하였고, 4 × 10⁵세포/웰의 HEK-293T 세포에 상기 실시예에 따라 제조한 핵산 분자를 약 0.1 또는 0.05 g/L의 농도로 형질감염시켰다. 이때, 상기 핵산 분자는 전달체로서 지질 나노입자(LNP)에 담지한 형태인 mRNA-LNP로 제제화하여 사용하였다. 형질감염이 완료된 후, 상기 핵산 분자의 세포 내 단백질 발현 및 이에 따른 세포 밖으로의 단백질 분비 정도를 당업계에 알려진 방법에 따라 웨스턴블롯 및 ELISA를 통해 분석하였다. 웨스턴블롯은 상기 형질감염된 세포의 용해물(lysate)에 대하여 1차 항체로서 SARS-CoV-2 스파이크 RBD 다클론항체(E-AB-V1006, Elabscience)를 사용하고, 2차 항체로는 HRP-접합 이차 항체(goat anti-rabbit IgG; ABclonal)를 사용하여 수행하였다. ELISA는 상기 형질감염된 세포의 배양 배지(media)에 대하여 SARS-CoV-2 스파이크 S1 단백질 ELISA 키트(RK04154, ABclonal)를 사용하여 수행하였다.

한편, 항원으로 사용한 SARS-CoV-2의 스파이크 단백질은 서브유닛1(S1) 및 서브유닛 2(S2)로 구성되어 있으며, 세포 감염에 주요 역할을 수행한다고 알려진 RBD (receptor binding domain)는 S1에 위치하고 있다. 웨스턴블롯에 사용한 1차 항체가 스파이크 단백질의 RBD 도메인을 타겟하는 것인바, 스파이크 전체 단백질(S0, 190 kDa)이 탐지되거나, 또는 스파이크 단백질 중에서도 RBD 도메인이 위치한 서브유닛1(S1, 120 kDa)이 탐지되는지를 확인함으로써 SARS-CoV-2의 스파이크 단백질의 발현 및 분비량을 분석하였다.

그 결과, 도 4에서 볼 수 있듯이, 본 발명에 따른 SARS-CoV-2 바이러스 스파이크 단백질을 포함하고, IgE, 알부민, IFN-γ, 인자 IX 또는 MLP1 유래 시그널 펩타이드를 포함하는 핵산 분자는 세포 내에서 단백질로의 발현이 잘 이루어짐을 확인하였다.

또한, 도 5a 및 5b에서 볼 수 있듯이, 본 발명에 따른 SARS-CoV-2 바이러스 스파이크 단백질을 포함하고, 알부민, IFN-γ, 인자 IX 또는 MLP1 유래 시그널 펩타이드를 포함하는 핵산 분자는 세포 내에서 단백질로의 발현이 잘 이루어지며, 세포 내에서 발현된 단백질이 세포 밖으로 원활히 분비됨을 확인하였다.

또한, 도 5c 및 5d에서 볼 수 있듯이, 본 발명에 따른 SARS-CoV-2 바이러스 스파이크 단백질을 포함하고, 알부민, IFN-γ, 인자 IX 또는 MLP1 유래 시그널 펩타이드를 포함하며, Th 세포 에피토프를 포함하는 핵산 분자는 세포 내에서 단백질로의 발현이 잘 이루어짐을 확인하였고, 세포 내에서 발현된 단백질이 세포 밖으로 원활히 분비됨을 확인하였다.

특히, 상기 시그널 펩타이드를 포함하는 핵산 분자의 경우, 배양 배지에 포함되어 있는 단백질의 양이 세포 용해물에 포함되어 있는 단백질 양보다 많음을 확인하였다. 또한, 상기 시그널 펩타이드를 포함하는 핵산 분자와 이를 포함하지 않는 핵산 분자와의 단백질 발현양을 비교할 때, 배양 배지에서는 시그널 펩타이드를 포함하는 핵산 분자의 단백질 양이 더 많았고, 세포 용해물에서는 시그널 펩타이드를 포함하지 않는 핵산 분자의 단백질 양이 더 많음을 확인하였다. 이를 통해 상기 시그널 펩타이드에 의해 스파이크 단백질의 세포 외 분비가 촉진될 수 있음을 확인하였다.

또한, 도 6a에서 볼 수 있듯이, 본 발명에 따른 SARS-CoV-2 바이러스 스파이크 단백질 및 IgE 유래 시그널 펩타이드를 포함하는 핵산 분자는 세포 내에서도 발현이 잘 이루어짐을 확인하였다.

또한, 도 6b에서 볼 수 있듯이, 본 발명에 따른 SARS-CoV-2 바이러스 스파이크 단백질을 포함하는 핵산 분자는 세포 내에서 발현이 잘 이루어짐에 따라, 상당한 양의 단백질이 세포 밖으로 분비됨을 스파이크 단백질 ELISA를 통해 확인하였다. 서로 다른 농도의 mRNA-LNP stock 시료에 대하여, 0.1 g/L 시료로 형질감염된 세포에서는 약 6.32 ng/mL의 단백질이 발현 및 분비되었고, 0.05 g/L 시료로 형질감염된 세포에서는 약 7.71 ng/mL의 단백질이 발현 및 분비됨으로써 유사한 양의 스파이크 항원 단백질 양임을 확인하였다.

상기 결과는, mRNA-LNP 제제로 구성되고, 각 시그널 펩타이드 및 SARS-CoV-2 바이러스 스파이크 단백질을 항원으로 포함하는 본 발명에 따른 핵산 분자는 세포 내에서 높은 효율로 단백질로 발현되며, 특히 발현된 단백질이 세포 밖으로 분비될 수 있으므로, 이와 같이 분비된 항원 단백질은 생체 내 존재하는 다른 면역 세포를 자극하여 세포성 또는 체액성 면역반응을 유도할 수 있다는 점을 보여준다. 따라서, 본 발명에 따른 핵산 분자는 생체 내 투여 시 목적하는 백신 기능을 발휘할 수 있다.

실시예 2-2. 백신용 핵산 분자의 체액성 면역 증강 효과

상기 실시예 1에서 제조한 핵산 분자의 면역효능을 확인하기 위하여, 상기 핵산 분자가 생체 내 투여되는 경우에 항원에 대한 체액성 면역 반응을 야기하여 실제 바이러스 감염증에 대한 예방 효과를 나타내는지 확인하였다. 상기 실시예 1에서 제조한 핵산 분자 중에서도, 실시예 1-3-1 또는 실시예 1-5-1에서 제조한 핵산 분자에 대한 효과를 확인하였다. 이때, 항원으로는 효모 코돈 및 인간 코돈을 모두 갖는 SARS-CoV-2 바이러스 스파이크 전체 단백질(서열번호 21)을 사용하였고, 시그널 펩타이드로는 효모 코돈으로 최적화된 것으로서, IgE 유래(서열번호 4) 또는 MLP1 유래(서열번호 20)의 것을 사용하였고, Th 세포 에피토프로는 인간 코돈으로 최적화된 것(서열번호 46)을 사용하여 제조하였다.

구체적으로, 상기 핵산 분자를 mRNA-LNP로 제제화하였고, 이를 6주령 암컷 BALB/c 마우스(6마리)에 4주 간격으로 2회(1차: 프라임, 2차: 부스트)에 걸쳐 허벅지 상부에 근육 주사한 후 3주차에 희생시켰다. 이때, 상기 핵산 분자는 1, 5 또는 10 ㎍/개체의 농도로 주사하였다. 대조군으로는 PBS를 주사하였다.

이후, 상기 면역화된 마우스의 혈청에서 항원으로서 SARS-CoV-2 바이러스 스파이크 단백질에 대한 특이적 결합항체 또는 중화항체의 수준을 ELISA 또는 PRNT (Plaque Reduction Neutralizing Test) 어세이를 통해 측정하였다. ELISA를 위한 1차 항체로는 항-마우스 IgG1-(Invitrogen, Carlsbad, CA, USA) 항체 또는 항-마우스 IgG2a-(Novus, Centennial, CO, USA) 항체를 사용하였다.

또한, 상기 면역화된 마우스에서 비장세포를 분리하였고, 상기 비장세포에 SARS-CoV-2 바이러스 스파이크 단백질 유래 펩타이드를 2 mg/ml의 농도로 처리하여 24시간 동안 배양하였다. 배양이 완료된 후 각 특이적 항체로 면역염색하여 유세포분석을 수행하였다.

그 결과, 도 7 내지 9b에서 볼 수 있듯이, 상기 핵산 분자의 접종 후에는 마우스에서 RBD 또는 스파이크 전체 단백질에 대한 결합항체가 높은 수준으로 생성됨을 확인하였다. 또한, 생성되는 결합항체 및 중화항체의 양은 상기 핵산 분자에 대하여 농도 의존적으로 증가함을 확인하였고(도 7 내지 9b), 1차 접종에 비하여 2차 접종 후 생성되는 중화항체의 양은 약 2배 이상 증가함을 확인하였다(도 9a 및 도 9b).

또한, 도 10에서 볼 수 있듯이, 상기 핵산 분자가 10 ㎍/개체의 농도로 마우스에 접종되는 경우, 배중심(germinal center, GC)에 존재하는 B 세포(GC B 세포, GL7⁺ CD19⁺ 세포)의 수가 접종되지 않은 마우스에 비하여 유의적으로 증가함을 확인하였다. 배중심 (GC)에서는 기억 B 세포 및 수명이 긴 형질 세포(plasma cell)를 생성하기 위하여, 여포 보조 T 세포(T_FH 세포)라고 불리는 CD4+ T 세포와 B 세포가 상호작용한다. 이러한 GC B 세포와 T_FH 세포 사이의 상호작용은 각 세포 유형의 생존, 증식 및 분화에 영향을 미친다.

상기 결과는, mRNA-LNP 제제로 구성된 상기 핵산 분자는 SARS-CoV-2 바이러스 스파이크 단백질에 대한 체액성 면역 반응을 효율적으로 유도할 수 있으며, 이에 따라 SARS-CoV-2 바이러스 감염증에 대한 예방, 개선 또는 치료에 유용하게 활용될 수 있음을 시사한다.

실시예 2-3. 백신용 핵산 분자의 세포성 면역 증강 효과

실시예 2-3-1. T 세포 증가

상기 실시예 1에서 제조한 핵산 분자의 면역효능을 확인하기 위하여, 상기 핵산 분자가 생체 내 투여되는 경우에 항원에 대한 세포성 면역 반응을 야기하여 실제 바이러스 감염증에 대한 예방 효과를 나타내는지 확인하였다. 세포성 면역반응의 일종으로서, 효과 기억 T 세포 및 중추 기억 T 세포 등의 T 세포의 생성을 증가시킬 수 있는지 확인하였다. 효과기 기억 T 세포는 병원체 진입 부위에서 즉각적이지만 지속되지는 않는 방어를 제공하며, 중추 기억 T 세포는 2차 림프 기관에서 증식하여 새로운 효과기 세포를 생성함으로써 면역 반응을 유지한다.

또한, 상기 실시예 1에서 제조한 핵산 분자 중에서도, 실시예 1-3-1에서 제조한 핵산 분자에 대한 효과를 확인하였다. 이때, 항원으로는 효모 코돈 및 인간 코돈을 모두 갖는 SARS-CoV-2 바이러스 스파이크 전체 단백질(서열번호 21)을 사용하였고, 시그널 펩타이드로는 효모 코돈으로 최적화된 것으로서, IgE 유래(서열번호 4)의 것을 사용하여 제조한 핵산 분자에 대한 효과를 확인하였다.

구체적으로, 상기 실시예 2-2 및 2-3에 따른 방법으로, mRNA-LNP 제제로 구성된 본 발명에 따른 핵산 분자를 마우스에 주사하였고, 상기 면역화된 마우스에서 비장세포를 분리한 후 SARS-CoV-2 바이러스 스파이크 단백질 유래 펩타이드(peptide pool 2)를 2 mg/ml의 농도로 처리한 후 유세포분석을 수행하였다. CD4⁺ 중추 기억 T 세포(CD4⁺ 세포 중 CD44^high+ 및 CD62L⁺ 세포), CD8⁺ 중추 기억 T 세포(CD8⁺ 세포 중 CD44^high+ 및 CD62L⁺ 세포), CD8⁺ 효과기(effector) 기억 T 세포(CD8⁺ 세포 중 CD44^high+ 및 CD62L^- 세포)의 비율을 분석하였다.

그 결과, 도 11 내지 13에서 볼 수 있듯이, 상기 핵산 분자가 마우스에 접종되는 경우, CD4⁺ 중추 기억 T 세포, CD8⁺ 중추 기억 T 세포 및 CD8⁺ 작용 기억 T 세포 등의 세포성 면역에 기여하는 세포 집단의 비율이 접종되지 않은 마우스에 비하여 유의적으로 증가함을 확인하였다.

상기 결과는, mRNA-LNP 제제로 구성된 상기 핵산 분자는 SARS-CoV-2 바이러스 스파이크 단백질에 대한 세포성 면역 반응을 효율적으로 유도할 수 있으며, 이에 따라 SARS-CoV-2 바이러스 감염증에 대한 예방, 개선 또는 치료에 유용하게 활용될 수 있음을 시사한다.

실시예 2-3-2. IFN-γ 분비 세포 증가

상기 실시예 1에서 제조한 핵산 분자의 효능을 확인하기 위하여, 세포성 면역반응의 일종으로서, IFN-γ 분비 세포의 생성을 증가시킬 수 있는지 확인하였다. IFN-γ는 선천성 항바이러스 반응을 담당하는 중요한 구성요소이며, 주로 NK 세포 또는 선천성 림프구 타입 1 세포에 의해 생성된다. 이러한 면역세포에 의한 IFN-γ 생성이 이루어지지 않는 경우, 생체 내에서 바이러스 복제가 증가하게 된다.

또한, 상기 실시예 1에서 제조한 핵산 분자 중에서도, 실시예 1-3-1 또는 실시예 1-5-1에서 제조한 핵산 분자에 대한 효과를 확인하였다. 이때, 항원으로는 효모 코돈 및 인간 코돈을 모두 갖는 SARS-CoV-2 바이러스 스파이크 전체 단백질(서열번호 21)을 사용하였고, 시그널 펩타이드로는 효모 코돈으로 최적화된 것으로서, IgE 유래(서열번호 4) 또는 MLP1 유래(서열번호 20)의 것을 사용하였고, Th 세포 에피토프로는 인간 코돈으로 최적화된 것(서열번호 46)을 사용하여 제조하였다.

구체적으로, 상기 실시예 2-2에 따라 면역화된 마우스에서 비장세포를 분리하였고, 상기 비장세포에 SARS-CoV-2 바이러스 스파이크 단백질 유래 펩타이드(peptide pool 2)를 2 mg/ml의 농도로 처리하여 48시간 동안 배양하였다. 배양이 완료된 후 IFN-γ 분비 세포를 ELISpot basic 키트(Mabtech, Nacka Strand, Sweden)를 사용하여 검출하였다.

그 결과, 도 14 및 15에서 볼 수 있듯이, 상기 핵산 분자가 마우스에 접종되는 경우, IFN-γ 분비 세포의 수는 접종되지 않은 마우스에 비하여 현저히 증가함을 확인하였다(도 14). 또한, 상기 세포에 의한 IFN-γ의 활성도 약 3000배 이상 현저히 증가함을 확인하였다(도 15).

실시예 2-3-3. 플라크 감소 중화 역가(PRNT) 분석

상기 실시예 1에서 제조한 핵산 분자의 효능을 확인하기 위하여, 세포성 면역반응의 일종으로서, 기억 T세포에 의한 중화 항체의 생성을 증가시킬 수 있는지 확인하였다. 플라크 감소 중화 역가(PRNT) 분석은 바이러스에 대한 바이러스 중화 및 보호 항체를 측정하고, 백신의 면역원성을 평가하는데 있어 널리 인정되는 접근 방식이다.

구체적으로, 상기 실시예 2-2에 따라 면역화된 마우스에서 분리한 혈청에 SARS-CoV-2 바이러스 (NCCP 43326, S-type)를 4.5x10² PFU/ml의 농도로 첨가하여 1시간 동안 배양하였다. 이후, 상기 혈청-바이러스 배양물을 Vero E6 세포(ATCC, 카탈로그 번호 CRL-1586)에 첨가하여 1시간 동안 배양함으로써 상기 세포를 바이러스에 감염시켰고, 당업계에 알려진 방법에 따라 PRNT를 분석 어세이를 수행하였다. PRNT 역가는 Karber 방법을 사용하여 계산하였고, 중화 용량 ND₅₀으로 표시하였다(log₁₀ND₅₀ = m - Δ(∑- 0.5), 여기서 m은 최고 희석의 log₁₀을 나타내고, Δ는 희석 계수의 log₁₀을 나타내고, ∑는 바이러스-혈청 접종물/바이러스 통제에 의해 생성된 플라크의 평균 수를 나타냄).

그 결과, 상기 표 9에서 볼 수 있듯이, 상기 핵산 분자가 마우스에 접종되는 경우, 1차 접종 후에는 중화 항체의 생성양이 대조군과 유사한 수준이었으나, 2차 접종 후에는 중화 항체 생성양이 현저하게 증가함을 확인하였다. 이러한 효과는 개체 당 5 또는 10 ㎍이 투여된 경우 특히 우수함을 확인하였다.

상기 결과는, mRNA-LNP 제제로 구성된 상기 핵산 분자는 SARS-CoV-2 바이러스 스파이크 단백질에 대한 중화 항체를 효율적으로 생성할 수 있으며, 이에 따라 SARS-CoV-2 바이러스 감염증에 대한 예방, 개선 또는 치료에 유용하게 활용될 수 있음을 시사한다.

<110> ST Pharm Co., Ltd. <120> NOVEL NUCLEIC ACID MOLECULE <130> DP22240KR <150> KR 10-2021-0017115 <151> 2021-02-05 <160> 59 <170> KoPatentIn 3.0 <210> 1 <211> 18 <212> PRT <213> Homo sapiens <400> 1 Met Asp Trp Thr Trp Ile Leu Phe Leu Val Ala Ala Ala Thr Arg Val 1 5 10 15 His Ser <210> 2 <211> 54 <212> RNA <213> Homo sapiens <400> 2 atggactgga cctggatcct cttcttggtg gcagcagcca cgcgagtcca ctcc 54 <210> 3 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> IgE SP <400> 3 atggactgga cctggatcct gttcctggtg gccgccgcta caagagtgca cagc 54 <210> 4 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> IgE SP <400> 4 atggactgga cttggatctt gttcttggtt gctgctgcca ccagagtcca ctct 54 <210> 5 <211> 18 <212> PRT <213> Homo sapiens <400> 5 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 6 <211> 54 <212> RNA <213> Homo sapiens <400> 6 atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttcc 54 <210> 7 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> albumin SP <400> 7 atgaagtggg tgaccttcat cagcctgctg ttcctgtttt cttccgccta cagc 54 <210> 8 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> albumin SP <400> 8 atgaagtggg ttactttcat ctctttgttg tttttattct cctctgctta ctcc 54 <210> 9 <211> 23 <212> PRT <213> Homo sapiens <400> 9 Met Lys Tyr Thr Ser Tyr Ile Leu Ala Phe Gln Leu Cys Ile Val Leu 1 5 10 15 Gly Ser Leu Gly Cys Tyr Cys 20 <210> 10 <211> 69 <212> RNA <213> Homo sapiens <400> 10 atgaaatata caagttatat cttggctttt cagctctgca tcgttttggg ttctcttggc 60 tgttactgc 69 <210> 11 <211> 69 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP <400> 11 atgaagtaca ccagctacat cctggccttc cagctgtgca tcgtgctggg ctctctgggc 60 tgttactgc 69 <210> 12 <211> 69 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP <400> 12 atgaagtaca cttcttacat tttggctttc caattgtgta tcgttttggg ttccttaggt 60 tgttactgt 69 <210> 13 <211> 28 <212> PRT <213> Homo sapiens <400> 13 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys 20 25 <210> 14 <211> 84 <212> RNA <213> Homo sapiens <400> 14 atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60 ggatatctac tcagtgctga atgt 84 <210> 15 <211> 84 <212> RNA <213> Artificial Sequence <220> <223> F IX <400> 15 atgcagagag tgaacatgat catggccgag tctcctggcc tgatcaccat ctgcctgctg 60 ggctacctgc tgagcgccga atgt 84 <210> 16 <211> 84 <212> RNA <213> Artificial Sequence <220> <223> F IX <400> 16 atgcaaagag ttaacatgat tatggctgaa tctccaggtt tgatcactat ctgtttgttg 60 ggttacttgt tatccgccga atgt 84 <210> 17 <211> 20 <212> PRT <213> Homo sapiens <400> 17 Met Val Tyr Lys Thr Leu Phe Ala Leu Cys Ile Leu Thr Ala Gly Trp 1 5 10 15 Arg Val Gln Ser 20 <210> 18 <211> 60 <212> RNA <213> Homo sapiens <400> 18 atggtctaca agactctctt cgctctttgc atcttaactg caggatggag ggtacagagt 60 60 <210> 19 <211> 60 <212> RNA <213> Artificial Sequence <220> <223> MLP1 <400> 19 atggtgtaca agaccctgtt cgccctgtgc atcctgaccg ccggctggag ggtgcagagc 60 60 <210> 20 <211> 60 <212> RNA <213> Artificial Sequence <220> <223> MLP1 <400> 20 atggtatata aaactttatt tgctttatgt attttaactg ctggttggcg tgtacaatct 60 60 <210> 21 <211> 1273 <212> PRT <213> Unknown <220> <223> SARS-CoV-2 <400> 21 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu 1140 1145 1150 Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp 1155 1160 1165 Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp 1170 1175 1180 Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu 1185 1190 1195 1200 Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile 1205 1210 1215 Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile 1220 1225 1230 Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys 1235 1240 1245 Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val 1250 1255 1260 Leu Lys Gly Val Lys Leu His Tyr Thr 1265 1270 <210> 22 <211> 3822 <212> RNA <213> Unknown <220> <223> SARS-CoV-2 <400> 22 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc attcaaggag gagttagata aatattttaa gaatcataca 3480 tcaccagatg ttgatttagg tgacatctct ggcattaatg cttcagttgt aaacattcaa 3540 aaagaaattg accgcctcaa tgaggttgcc aagaatttaa atgaatctct catcgatctc 3600 caagaacttg gaaagtatga gcagtatata aaatggccat ggtacatttg gctaggtttt 3660 atagctggct tgattgccat agtaatggtg acaattatgc tttgctgtat gaccagttgc 3720 tgtagttgtc tcaagggctg ttgttcttgt ggatcctgct gcaaatttga tgaagacgac 3780 tctgagccag tgctcaaagg agtcaaatta cattacacat aa 3822 <210> 23 <211> 3822 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 S <400> 23 atgttcgtgt tcttggtgct gctgcctctg gtctccagcc agtgcgtgaa tctgaccacc 60 agaacccaac tgcctcctgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120 aaggtgttcc ggagtagcgt gctgcacagc acgcaggacc tgttcctgcc atttttctct 180 aatgtgacct ggtttcacgc catccacgtg tccggcacaa acggcacaaa gcggttcgac 240 aaccccgtgc tgccattcaa cgatggcgtg tacttcgcct ctacagaaaa gtccaatatc 300 attaggggct ggatcttcgg aacaacgctg gactcaaaga cccagagcct gctgatcgtc 360 aataacgcca caaatgtggt cattaaagtg tgcgaattcc agttctgcaa cgaccccttc 420 ctgggcgtct actatcataa gaacaacaag tcttggatgg aaagcgagtt ccgggtgtac 480 agcagcgcta acaactgcac cttcgagtac gtttcccaac ctttcctgat ggacctggaa 540 ggcaagcagg gcaatttcaa gaacctgaga gaattcgtgt tcaagaacat cgacggctac 600 ttcaagatct acagcaagca cacccccatc aacctggtac gagatctgcc ccagggcttc 660 tctgccctcg agcccctcgt ggacctgccc attggaatca acatcacgcg gttccagacc 720 ctgctcgccc tgcatagaag ctacctcact cccggcgatt ctagcagcgg ctggacagcc 780 ggcgctgccg cttactacgt gggctacctg cagcctagaa catttctact gaagtataac 840 gagaacggga caatcacaga cgccgtggac tgcgctctgg atcctctgag cgaaaccaag 900 tgcaccctga aaagcttcac cgtcgagaag ggaatctacc agacctccaa cttccgggtg 960 cagccaaccg agagcatcgt gagattccct aacatcacta acctgtgtcc ttttggagaa 1020 gtgttcaacg ccacccggtt cgccagcgtt tatgcctgga accgcaagag aatctctaac 1080 tgtgtggccg actacagcgt gctgtacaat tctgccagct tcagcacctt caagtgctac 1140 ggcgtgagtc ccaccaaact gaacgacctg tgcttcacta acgtgtacgc cgatagcttt 1200 gtgatcagag gagacgaggt gagacagatt gctcctggcc agaccggcaa aatcgccgat 1260 tacaactaca agctacctga cgacttcacc ggctgcgtga tcgcctggaa ttctaacaac 1320 ctggactcca aggtgggcgg caactacaac tacctgtaca gactgtttcg gaagtccaac 1380 ctgaaaccat tcgagagaga tatcagcaca gagatctacc aagcgggctc gacaccttgc 1440 aacggagtgg agggcttcaa ctgttacttt cctctgcagt cttatggctt ccaacctaca 1500 aatggcgtcg gatatcagcc ctacagagtg gtggtgcttt ctttcgagct gctgcacgcc 1560 ccagctaccg tgtgtggtcc taagaagtcg acaaatctgg tgaagaataa gtgcgtgaat 1620 tttaacttta acggcctgac cggcaccggc gtgctgaccg aatctaacaa gaaattcctg 1680 cctttccagc agttcggtag agatatcgcc gacaccaccg atgccgtgcg ggaccctcaa 1740 acactggaaa tcctggacat aacaccttgc agcttcggcg gagtcagcgt gatcacacct 1800 ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg cacagaagtg 1860 cctgtggcga tccacgctga tcagctgaca cctacatggc gggtgtactc aacaggaagc 1920 aacgtgtttc agacccgggc cggctgtctg atcggcgctg aacacgttaa caacagctac 1980 gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagactca gacaaatagc 2040 cctaggagag caagatccgt ggccagccag agcatcatcg cctatacaat gagcctgggc 2100 gccgagaatt ctgtcgccta cagcaacaac agcatcgcca tccccactaa tttcaccatc 2160 tccgtcacca cagaaatcct gcctgtgagc atgaccaaga ccagcgtgga ttgcacaatg 2220 tacatttgcg gcgacagcac cgagtgttcc aacctgctgc tgcagtacgg cagcttctgc 2280 acccagctga acagagcact gacaggcatc gccgtggagc aagacaagaa cacccaggag 2340 gtgttcgccc aggtgaagca gatctacaag acccctccta tcaaagactt cggtggcttc 2400 aacttcagcc agatcctgcc tgatccgagc aagcctagca aaagatcatt tatcgaagac 2460 ctgctgttta acaaggtgac cctggccgac gccggattca tcaagcagta cggcgactgc 2520 ctgggcgaca tcgccgccag agatctgatc tgtgcccaga agtttaatgg cctgaccgtg 2580 ctgccacctc tgctgaccga cgagatgatc gcccaatata ccagcgccct gctggctgga 2640 acaatcacaa gcggctggac cttcggagcc ggagccgctc ttcagattcc tttcgccatg 2700 cagatggcct acagattcaa cggcatcggc gtgacccaga acgtgctgta tgagaaccag 2760 aaactgatcg ctaatcaatt taacagcgcc atcggcaaga ttcaggactc cctgagctca 2820 acagcctctg ccctgggcaa gctgcaggat gtggtgaacc agaacgccca ggccctgaac 2880 acactggtga aacagctgtc aagcaacttc ggcgccatct catccgtact gaacgacatc 2940 ctgtctagac tcgataaggt ggaggccgaa gtgcagatcg acagactgat caccggccgg 3000 ctgcagagcc tgcagacgta cgtgacccaa cagctgatca gggccgccga gatccgggcc 3060 tcggctaatt tggccgccac caaaatgagc gaatgcgtgc tgggccagtc taagagggtc 3120 gacttctgtg gcaagggcta ccacctgatg agcttccccc agagcgctcc ccacggcgtg 3180 gtgttcctgc acgtgaccta cgttccagcc caggagaaga actttacaac cgcccctgcc 3240 atctgccacg acggcaaggc ccacttccct agagagggag tctttgtgag caatggcacc 3300 cactggttcg ttacccagag aaacttctac gagccccaga tcatcaccac agacaacacc 3360 ttcgtgagcg gaaactgtga cgtggtgatc ggcatcgtga acaacaccgt gtacgacccc 3420 ctgcaacccg agctggacag cttcaaggaa gagctggaca aatactttaa gaaccacacc 3480 tcacctgacg tggacctggg agatatcagc ggcataaatg cctccgtggt gaacatccag 3540 aaggaaatcg atagactcaa tgaggtggct aagaacctga acgaaagcct gatcgacctc 3600 caagagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatttg gctgggcttt 3660 atcgccggcc tcatcgctat cgtgatggtg accatcatgc tgtgctgcat gacctcctgc 3720 tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaagatgat 3780 tctgaaccag tgctgaaagg cgtgaaactg cactacacct ga 3822 <210> 24 <211> 3822 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 S <400> 24 atgttcgtgt tcctcgtctt gctacctttg gtttcttctc aatgtgttaa tttgactacc 60 agaacccaat taccaccagc ttacaccaat tcttttacca gaggtgtcta ttacccagac 120 aaggtcttca gatcttctgt attgcactct actcaagact tgttcttacc attcttctcc 180 aacgttacct ggtttcacgc tatccatgtt agtggtacca acggtaccaa gagattcgac 240 aacccagttt tacctttcaa cgatggtgtt tactttgctt caaccgaaaa gtctaacatc 300 atcagaggtt ggattttcgg taccactttg gattcaaaaa ctcaatcttt gttgattgtt 360 aacaatgcca ctaatgttgt tatcaaggtt tgtgaattcc aattttgtaa cgacccattc 420 ttgggtgtct actaccacaa gaacaacaag tcttggatgg agtctgaatt cagagtttac 480 tcttctgcta acaactgtac tttcgaatac gtttctcaac catttttgat ggacttggaa 540 ggtaaacaag gtaacttcaa aaacttgaga gaattcgtct tcaaaaacat tgacggttac 600 ttcaagatct actctaagca caccccaatc aacctagtaa gagatttgcc acaaggtttc 660 tccgccctag aaccattggt tgatttgcca attggtatta acatcaccag attccaaacc 720 ttgttggctt tgcacagatc ctacttgact ccaggtgatt cttcttccgg ttggaccgct 780 ggtgccgctg catactacgt cggttacttg caaccaagaa ctttcttgtt gaagtacaac 840 gaaaatggta ctatcactga tgctgtcgat tgcgctttgg acccattgtc tgaaaccaag 900 tgtactttga agtcttttac tgttgaaaag ggtatctacc aaacttctaa cttcagagtc 960 caaccaaccg aatctatcgt ccgattccca aacattacta acttatgtcc attcggtgaa 1020 gttttcaacg ctaccagatt cgcttccgtc tacgcttgga acagaaagag aatctcgaat 1080 tgtgttgccg actactccgt tttgtacaac tccgcttcct tttccacctt caagtgttac 1140 ggtgtttctc caactaagct aaacgatttg tgtttcacca acgtctacgc cgactccttc 1200 gttattagag gtgacgaggt cagacaaatt gctccaggtc aaaccgggaa aatcgctgat 1260 tacaactaca aattaccaga tgacttcact ggttgtgtca tcgcttggaa ctccaacaac 1320 ttggattcta aagttggtgg taattataac tatttataca gattattcag aaagtcaaac 1380 ttgaaaccat ttgaaagaga catctccact gaaatttatc aagctggttc tactccatgt 1440 aacggtgtcg aaggtttcaa ctgttatttc ccattgcaat cctacggttt ccagccaaca 1500 aacggtgtcg gttaccaacc gtacagagtc gttgtccttt cctttgaatt gttgcacgct 1560 cctgccactg tctgtggtcc aaagaagtcc accaacttgg tcaaaaacaa gtgtgtgaac 1620 ttcaacttta acggtttgac tggaacaggt gttttgactg aatccaacaa gaagttcttg 1680 cctttccaac aatttggtag agacattgcc gatactactg atgccgtcag agaccctcaa 1740 actttggaaa tcttggatat aactccatgc tccttcggtg gagtctctgt cataactcca 1800 ggtaccaaca cctcgaacca agttgctgtt ttgtaccaag atgtcaactg tactgaagtt 1860 ccggtcgcca tccatgctga tcaattgaca ccaacttggc gtgtttactc taccggctct 1920 aacgtctttc aaaccagagc tggttgtttg attggtgctg aacacgttaa caactcttat 1980 gaatgtgata ttccaatcgg tgccggtatc tgtgcttcct accaaacgca aaccaactct 2040 ccacgtagag ctcgtagtgt tgcatcacaa tctattatcg cctacactat gtctcttggt 2100 gctgaaaatt ctgttgccta cagtaacaac tctatcgcca tcccaaccaa ctttaccatc 2160 tccgttacta ccgaaattct gccagtctcc atgaccaaga cttccgttga ttgcaccatg 2220 tacatatgtg gtgactccac tgaatgttcc aacttgttgt tgcaatacgg ttccttctgt 2280 actcaattaa acagagcatt gaccggtatc gctgtcgaac aagataaaaa cacccaagaa 2340 gtgttcgctc aagttaagca aatctacaag accccaccaa tcaaggactt cggaggtttc 2400 aacttctctc aaatcttgcc agacccatct aagccatcca agcgttcttt cattgaagac 2460 ttgttgttca acaaggttac cttggctgat gcaggtttca tcaagcaata cggtgactgt 2520 ttgggtgaca tcgctgccag ggatctgatc tgtgcccaaa agttcaacgg tttaactgtt 2580 ttgccacctt tattaaccga tgaaatgatt gctcaataca cctcggcttt gttggctggt 2640 accatcacgt ctggttggac tttcggtgct ggtgctgctc ttcaaatccc ttttgctatg 2700 caaatggctt acagatttaa cggtattggt gttacgcaaa acgttttgta cgaaaaccaa 2760 aagttgatcg ctaaccaatt caactctgct attggtaaga tccaagactc cttgagttcg 2820 accgcgtctg ctttgggtaa gttgcaagat gttgttaacc aaaacgccca agctctcaac 2880 actttggtca agcaactttc ttccaacttc ggtgctatct cttctgttct gaacgacatt 2940 ttgtccagac tagataaggt tgaagctgaa gttcaaatcg acagattgat caccggtaga 3000 ttgcaaagcc tacaaactta cgtaacccaa caattaataa gagctgccga aattcgtgct 3060 tctgccaact tggctgctac caagatgtcc gaatgtgttt tgggtcaatc taagcgtgtc 3120 gatttctgtg gtaaaggtta ccatttgatg tctttcccac aatccgctcc acacggtgtt 3180 gtcttcttgc atgttaccta cgtcccagct caagaaaaga acttcactac tgctccagct 3240 atctgtcacg atggtaaggc tcacttccca agagaaggtg ttttcgtttc taatgggact 3300 cactggttcg ttactcaaag aaacttctac gaaccacaaa ttattactac tgacaacact 3360 tttgtttccg gtaactgtga cgtcgtgatt ggtattgtca acaataccgt ctacgatcct 3420 ctacagccag aattggattc atttaaggaa gaattggaca agtacttcaa gaatcacact 3480 tctccagacg tcgacttggg tgacatttct ggtatcaacg cttctgttgt caacattcaa 3540 aaggaaatcg acagattgaa cgaagtcgct aagaacttga acgaatcatt aattgacttg 3600 caagaattag gtaagtacga acaatacatt aaatggccat ggtatatctg gttgggtttt 3660 atcgctggtc taattgccat tgttatggtt actattatgt tatgttgtat gacttcttgc 3720 tgctcttgtt tgaaggggtg ttgtagctgc ggttcttgtt gtaagttcga tgaagacgac 3780 tctgaaccag ttttaaaggg tgtcaagctc cactacactt ga 3822 <210> 25 <211> 3822 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 S <400> 25 atgttcgtgt tcctcgtctt gctacctttg gtttcttctc aatgtgttaa tttgactacc 60 agaacccaat taccaccagc ttacaccaat tcttttacca gaggcgtgta ctaccccgac 120 aaggtgttcc ggagtagcgt gctgcacagc acgcaggacc tgttcctgcc atttttctct 180 aatgtgacct ggtttcacgc catccacgtg tccggcacaa acggcacaaa gcggttcgac 240 aaccccgtgc tgccattcaa cgatggcgtg tacttcgcct ctacagaaaa gtccaatatc 300 attaggggct ggatcttcgg aacaacgctg gactcaaaga cccagagcct gctgatcgtc 360 aataacgcca caaatgtggt cattaaagtg tgcgaattcc agttctgcaa cgaccccttc 420 ctgggcgtct actatcataa gaacaacaag tcttggatgg aaagcgagtt ccgggtgtac 480 agcagcgcta acaactgcac cttcgagtac gtttcccaac ctttcctgat ggacctggaa 540 ggcaagcagg gcaatttcaa gaacctgaga gaattcgtgt tcaagaacat cgacggctac 600 ttcaagatct acagcaagca cacccccatc aacctggtac gagatctgcc ccagggcttc 660 tctgccctcg agcccctcgt ggacctgccc attggaatca acatcacgcg gttccagacc 720 ctgctcgccc tgcatagaag ctacctcact cccggcgatt ctagcagcgg ctggacagcc 780 ggcgctgccg cttactacgt gggctacctg cagcctagaa catttctact gaagtataac 840 gagaacggga caatcacaga cgccgtggac tgcgctctgg atcctctgag cgaaaccaag 900 tgcaccctga aaagcttcac cgtcgagaag ggaatctacc agacctccaa cttccgggtg 960 cagccaaccg agagcatcgt gagattccct aacatcacta acctgtgtcc ttttggagaa 1020 gtgttcaacg ccacccggtt cgccagcgtt tatgcctgga accgcaagag aatctctaac 1080 tgtgtggccg actacagcgt gctgtacaat tctgccagct tcagcacctt caagtgctac 1140 ggcgtgagtc ccaccaaact gaacgacctg tgcttcacta acgtgtacgc cgatagcttt 1200 gtgatcagag gagacgaggt gagacagatt gctcctggcc agaccggcaa aatcgccgat 1260 tacaactaca agctacctga cgacttcacc ggctgcgtga tcgcctggaa ttctaacaac 1320 ctggactcca aggtgggcgg caactacaac tacctgtaca gactgtttcg gaagtccaac 1380 ctgaaaccat tcgagagaga tatcagcaca gagatctacc aagcgggctc gacaccttgc 1440 aacggagtgg agggcttcaa ctgttacttt cctctgcagt cttatggctt ccaacctaca 1500 aatggcgtcg gatatcagcc ctacagagtg gtggtgcttt ctttcgagct gctgcacgcc 1560 ccagctaccg tgtgtggtcc taagaagtcg acaaatctgg tgaagaataa gtgcgtgaat 1620 tttaacttta acggcctgac cggcaccggc gtgctgaccg aatctaacaa gaaattcctg 1680 cctttccagc agttcggtag agatatcgcc gacaccaccg atgccgtgcg ggaccctcaa 1740 acactggaaa tcctggacat aacaccttgc agcttcggcg gagtcagcgt gatcacacct 1800 ggcaccaaca ccagcaacca ggtggccgtg ctgtaccagg acgtgaactg cacagaagtg 1860 cctgtggcga tccacgctga tcagctgaca cctacatggc gggtgtactc aacaggaagc 1920 aacgtgtttc agacacgggc cggctgtctg atcggcgctg aacacgttaa caacagctac 1980 gagtgcgaca tccccatcgg cgccggcatc tgtgccagct accagactca gacaaatagc 2040 cctaggagag caagatccgt ggccagccag agcatcatcg cctatacaat gagcctgggc 2100 gccgagaatt ctgtcgccta cagcaacaac agcatcgcca tccccactaa tttcaccatc 2160 tccgtcacca cagaaatcct gcctgtgagc atgaccaaga ccagcgtgga ttgcacaatg 2220 tacatttgcg gcgacagcac cgagtgttcc aacctgctgc tgcagtacgg cagcttctgc 2280 acccagctga acagagcact gacaggcatc gccgtggagc aagacaagaa cacccaggag 2340 gtgttcgccc aggtgaagca gatctacaag acccctccta tcaaagactt cggtggcttc 2400 aacttcagcc agatcctgcc tgatccgagc aagcctagca aaagatcatt tatcgaagac 2460 ctgctgttta acaaggtgac cctggccgac gccggattca tcaagcagta cggcgactgc 2520 ctgggcgaca tcgccgccag agatctgatc tgtgcccaga agtttaatgg cctgaccgtg 2580 ctgccacctc tgctgaccga cgagatgatc gcccaatata ccagcgccct gctggctgga 2640 acaatcacaa gcggctggac cttcggagcc ggagccgctc ttcagattcc tttcgccatg 2700 cagatggcct acagattcaa cggcatcggc gtgacccaga acgtgctgta tgagaaccag 2760 aaactgatcg ctaatcaatt taacagcgcc atcggcaaga ttcaggactc cctgagctca 2820 acagcctctg ccctgggcaa gctgcaggat gtggtgaacc agaacgccca ggccctgaac 2880 acactggtga aacagctgtc aagcaacttc ggcgccatct catccgtact gaacgacatc 2940 ctgtctagac tcgatccacc agaggccgaa gtgcagatcg acagactgat caccggccgg 3000 ctgcagagcc tgcagacgta cgtgacccaa cagctgatca gggccgccga gatccgggcc 3060 tcggctaatt tggccgccac caaaatgagc gaatgcgtgc tgggccagtc taagagggtc 3120 gacttctgtg gcaagggcta ccacctgatg agcttccccc agagcgctcc ccacggcgtg 3180 gtgttcctgc acgtgaccta cgttccagcc caggagaaga actttacaac cgcccctgcc 3240 atctgccacg acggcaaggc ccacttccct agagagggag tctttgtgag caatggcacc 3300 cactggttcg ttacccagag aaacttctac gagccccaga tcatcaccac agacaacacc 3360 ttcgtgagcg gaaactgtga cgtggtgatc ggcatcgtga acaacaccgt gtacgacccc 3420 ctgcaacccg agctggacag cttcaaggaa gagctggaca aatactttaa gaaccacacc 3480 tcacctgacg tggacctggg agatatcagc ggcataaatg cctccgtggt gaacatccag 3540 aaggaaatcg atagactcaa tgaggtggct aagaacctga acgaaagcct gatcgacctc 3600 caagagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatttg gctgggcttt 3660 atcgccggcc tcatcgctat cgtgatggtg accatcatgc tgtgctgcat gacctcctgc 3720 tgcagctgcc tgaagggctg ttgcagctgc ggcagctgct gcaagttcga cgaagatgat 3780 tctgaaccag tgctgaaagg cgtgaaactg cactacacct ga 3822 <210> 26 <211> 222 <212> PRT <213> Unknown <220> <223> SARS-CoV-2 <400> 26 Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu 1 5 10 15 Leu Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Thr Trp Ile 20 25 30 Cys Leu Leu Gln Phe Ala Tyr Ala Asn Arg Asn Arg Phe Leu Tyr Ile 35 40 45 Ile Lys Leu Ile Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys 50 55 60 Phe Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Ile Thr Gly Gly Ile 65 70 75 80 Ala Ile Ala Met Ala Cys Leu Val Gly Leu Met Trp Leu Ser Tyr Phe 85 90 95 Ile Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe 100 105 110 Asn Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu His Gly Thr Ile 115 120 125 Leu Thr Arg Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile 130 135 140 Leu Arg Gly His Leu Arg Ile Ala Gly His His Leu Gly Arg Cys Asp 145 150 155 160 Ile Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu 165 170 175 Ser Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Ala Gly Asp Ser Gly 180 185 190 Phe Ala Ala Tyr Ser Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr 195 200 205 Asp His Ser Ser Ser Ser Asp Asn Ile Ala Leu Leu Val Gln 210 215 220 <210> 27 <211> 669 <212> RNA <213> Unknown <220> <223> SARS-CoV-2 <400> 27 atggcagatt ccaacggtac tattaccgtt gaagagctta aaaagctcct tgaacaatgg 60 aacctagtaa taggtttcct attccttaca tggatttgtc ttctacaatt tgcctatgcc 120 aacaggaata ggtttttgta tataattaag ttaattttcc tctggctgtt atggccagta 180 actttagctt gttttgtgct tgctgctgtt tacagaataa attggatcac cggtggaatt 240 gctatcgcaa tggcttgtct tgtaggcttg atgtggctca gctacttcat tgcttctttc 300 agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc cagaaactaa cattcttctc 360 aacgtgccac tccatggcac tattctgacc agaccgcttc tagaaagtga actcgtaatc 420 ggagctgtga tccttcgtgg acatcttcgt attgctggac accatctagg acgctgtgac 480 atcaaggacc tgcctaaaga aatcactgtt gctacatcac gaacgctttc ttattacaaa 540 ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg ctgcatacag tcgctacagg 600 attggcaact ataaattaaa cacagaccat tccagtagca gtgacaatat tgctttgctt 660 gtacagtaa 669 <210> 28 <211> 669 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 M <400> 28 atggctgata gcaacggcac catcacagtc gaggaactga aaaagctgct ggaacagtgg 60 aacctggtga ttggattcct gttcctgacc tggatctgcc tgctccagtt cgcctacgcc 120 aaccggaaca gattcctgta catcatcaag ctgatcttcc tgtggctgct gtggcctgtg 180 accctggcct gcttcgtgct ggctgctgtg tacagaatca actggatcac cggaggcatc 240 gccatcgcca tggcctgtct ggtgggcctg atgtggctga gctacttcat cgcctctttt 300 agactgtttg ccagaacccg gagcatgtgg tccttcaacc ccgagacaaa catcctgctg 360 aatgtgcccc tgcacggcac aatcctgaca agacctctgc ttgagagcga gctggtgatc 420 ggcgccgtga tcctgagggg ccatctgcgg attgccggac accacctggg cagatgcgac 480 atcaaggacc tgcctaagga aatcaccgtg gctacaagcc gcaccctgtc ctactacaaa 540 ctcggcgcca gccaaagagt ggccggcgac agcggcttcg ccgcctatag cagataccgg 600 atcggcaact acaagctgaa caccgaccac tctagcagct ctgataatat cgccctgctg 660 gttcagtga 669 <210> 29 <211> 669 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 M <400> 29 atggctgatt ccaacggtac catcaccgtt gaagaattga agaagttgct ggaacaatgg 60 aacttggtca ttggtttttt attcttgact tggatctgtt tgttgcaatt cgcttacgct 120 aacagaaacc gtttcctcta cattatcaag ttgatcttcc tatggttatt gtggccagtc 180 actttggctt gtttcgtttt ggccgcagtt tacagaatca actggattac aggtggtatt 240 gctattgcta tggcctgttt ggttggtttg atgtggttgt cttacttcat cgcttccttc 300 agattatttg ctagaaccag atccatgtgg tctttcaacc cagaaaccaa catcttgttg 360 aatgttccat tgcacggtac tatcttaacc agacctttat tggaatctga attagttatc 420 ggtgctgtca ttttgcgtgg tcacttgaga attgctggtc atcacttggg tagatgcgat 480 atcaaggatt tgccaaagga aatcactgtt gctaccagca gaactttgtc ctactacaag 540 ttgggcgctt ctcaaagagt cgccggtgac tctggtttcg ccgcctattc aagataccgt 600 attggtaact acaaattgaa cactgaccac tcttcttcct ctgacaacat tgctttgttg 660 gtccaatga 669 <210> 30 <211> 669 <212> RNA <213> Artificial Sequence <220> <223> SARS-CoV-2 M <400> 30 atggctgatt ccaacggtac catcaccgtt gaagaattga agaagttgct ggaacaatgg 60 aacttggtca ttggtttttt attcttgact tggatctgtt tgttgcaatt cgcttacgct 120 aacagaaacc gtttcctcta cattatcaag ttgatcttcc tatggttatt gtggccagtc 180 actttggctt gtttcgtttt ggccgcagtt tacagaatca actggattac aggtggtatt 240 gctattgcta tggcctgtct ggtgggcctg atgtggctga gctacttcat cgcctctttt 300 agactgtttg ccagaacccg gagcatgtgg tccttcaacc ccgagacaaa catcctgctg 360 aatgtgcccc tgcacggcac aatcctgaca agacctctgc ttgagagcga gctggtgatc 420 ggcgccgtga tcctgagggg ccatctgcgg attgccggac accacctggg cagatgcgac 480 atcaaggacc tgcctaagga aatcaccgtg gctacaagcc gcaccctgtc ctactacaaa 540 ctcggcgcca gccaaagagt ggccggcgac agcggcttcg ccgcctatag cagataccgg 600 atcggcaact acaagctgaa caccgaccac tctagcagct ctgataatat cgccctgctg 660 gttcagtga 669 <210> 31 <211> 3873 <212> RNA <213> Artificial Sequence <220> <223> IgE SP - SARS-CoV-2 S <400> 31 atggactgga cttggatctt gttcttggtt gctgctgcca ccagagtcca ctctttcgtg 60 ttcctcgtct tgctaccttt ggtttcttct caatgtgtta atttgactac cagaacccaa 120 ttaccaccag cttacaccaa ttcttttacc agaggcgtgt actaccccga caaggtgttc 180 cggagtagcg tgctgcacag cacgcaggac ctgttcctgc catttttctc taatgtgacc 240 tggtttcacg ccatccacgt gtccggcaca aacggcacaa agcggttcga caaccccgtg 300 ctgccattca acgatggcgt gtacttcgcc tctacagaaa agtccaatat cattaggggc 360 tggatcttcg gaacaacgct ggactcaaag acccagagcc tgctgatcgt caataacgcc 420 acaaatgtgg tcattaaagt gtgcgaattc cagttctgca acgacccctt cctgggcgtc 480 tactatcata agaacaacaa gtcttggatg gaaagcgagt tccgggtgta cagcagcgct 540 aacaactgca ccttcgagta cgtttcccaa cctttcctga tggacctgga aggcaagcag 600 ggcaatttca agaacctgag agaattcgtg ttcaagaaca tcgacggcta cttcaagatc 660 tacagcaagc acacccccat caacctggta cgagatctgc cccagggctt ctctgccctc 720 gagcccctcg tggacctgcc cattggaatc aacatcacgc ggttccagac cctgctcgcc 780 ctgcatagaa gctacctcac tcccggcgat tctagcagcg gctggacagc cggcgctgcc 840 gcttactacg tgggctacct gcagcctaga acatttctac tgaagtataa cgagaacggg 900 acaatcacag acgccgtgga ctgcgctctg gatcctctga gcgaaaccaa gtgcaccctg 960 aaaagcttca ccgtcgagaa gggaatctac cagacctcca acttccgggt gcagccaacc 1020 gagagcatcg tgagattccc taacatcact aacctgtgtc cttttggaga agtgttcaac 1080 gccacccggt tcgccagcgt ttatgcctgg aaccgcaaga gaatctctaa ctgtgtggcc 1140 gactacagcg tgctgtacaa ttctgccagc ttcagcacct tcaagtgcta cggcgtgagt 1200 cccaccaaac tgaacgacct gtgcttcact aacgtgtacg ccgatagctt tgtgatcaga 1260 ggagacgagg tgagacagat tgctcctggc cagaccggca aaatcgccga ttacaactac 1320 aagctacctg acgacttcac cggctgcgtg atcgcctgga attctaacaa cctggactcc 1380 aaggtgggcg gcaactacaa ctacctgtac agactgtttc ggaagtccaa cctgaaacca 1440 ttcgagagag atatcagcac agagatctac caagcgggct cgacaccttg caacggagtg 1500 gagggcttca actgttactt tcctctgcag tcttatggct tccaacctac aaatggcgtc 1560 ggatatcagc cctacagagt ggtggtgctt tctttcgagc tgctgcacgc cccagctacc 1620 gtgtgtggtc ctaagaagtc gacaaatctg gtgaagaata agtgcgtgaa ttttaacttt 1680 aacggcctga ccggcaccgg cgtgctgacc gaatctaaca agaaattcct gcctttccag 1740 cagttcggta gagatatcgc cgacaccacc gatgccgtgc gggaccctca aacactggaa 1800 atcctggaca taacaccttg cagcttcggc ggagtcagcg tgatcacacc tggcaccaac 1860 accagcaacc aggtggccgt gctgtaccag gacgtgaact gcacagaagt gcctgtggcg 1920 atccacgctg atcagctgac acctacatgg cgggtgtact caacaggaag caacgtgttt 1980 cagacccggg ccggctgtct gatcggcgct gaacacgtta acaacagcta cgagtgcgac 2040 atccccatcg gcgccggcat ctgtgccagc taccagactc agacaaatag ccctaggaga 2100 gcaagatccg tggccagcca gagcatcatc gcctatacaa tgagcctggg cgccgagaat 2160 tctgtcgcct acagcaacaa cagcatcgcc atccccacta atttcaccat ctccgtcacc 2220 acagaaatcc tgcctgtgag catgaccaag accagcgtgg attgcacaat gtacatttgc 2280 ggcgacagca ccgagtgttc caacctgctg ctgcagtacg gcagcttctg cacccagctg 2340 aacagagcac tgacaggcat cgccgtggag caagacaaga acacccagga ggtgttcgcc 2400 caggtgaagc agatctacaa gacccctcct atcaaagact tcggtggctt caacttcagc 2460 cagatcctgc ctgatccgag caagcctagc aaaagatcat ttatcgaaga cctgctgttt 2520 aacaaggtga ccctggccga cgccggattc atcaagcagt acggcgactg cctgggcgac 2580 atcgccgcca gagatctgat ctgtgcccag aagtttaatg gcctgaccgt gctgccacct 2640 ctgctgaccg acgagatgat cgcccaatat accagcgccc tgctggctgg aacaatcaca 2700 agcggctgga ccttcggagc cggagccgct cttcagattc ctttcgccat gcagatggcc 2760 tacagattca acggcatcgg cgtgacccag aacgtgctgt atgagaacca gaaactgatc 2820 gctaatcaat ttaacagcgc catcggcaag attcaggact ccctgagctc aacagcctct 2880 gccctgggca agctgcagga tgtggtgaac cagaacgccc aggccctgaa cacactggtg 2940 aaacagctgt caagcaactt cggcgccatc tcatccgtac tgaacgacat cctgtctaga 3000 ctcgatccac cagaggccga agtgcagatc gacagactga tcaccggccg gctgcagagc 3060 ctgcagacgt acgtgaccca acagctgatc agggccgccg agatccgggc ctcggctaat 3120 ttggccgcca ccaaaatgag cgaatgcgtg ctgggccagt ctaagagggt cgacttctgt 3180 ggcaagggct accacctgat gagcttcccc cagagcgctc cccacggcgt ggtgttcctg 3240 cacgtgacct acgttccagc ccaggagaag aactttacaa ccgcccctgc catctgccac 3300 gacggcaagg cccacttccc tagagaggga gtctttgtga gcaatggcac ccactggttc 3360 gttacccaga gaaacttcta cgagccccag atcatcacca cagacaacac cttcgtgagc 3420 ggaaactgtg acgtggtgat cggcatcgtg aacaacaccg tgtacgaccc cctgcaaccc 3480 gagctggaca gcttcaagga agagctggac aaatacttta agaaccacac ctcacctgac 3540 gtggacctgg gagatatcag cggcataaat gcctccgtgg tgaacatcca gaaggaaatc 3600 gatagactca atgaggtggc taagaacctg aacgaaagcc tgatcgacct ccaagagctg 3660 ggcaaatacg agcagtacat caagtggcct tggtacattt ggctgggctt tatcgccggc 3720 ctcatcgcta tcgtgatggt gaccatcatg ctgtgctgca tgacctcctg ctgcagctgc 3780 ctgaagggct gttgcagctg cggcagctgc tgcaagttcg acgaagatga ttctgaacca 3840 gtgctgaaag gcgtgaaact gcactacacc tga 3873 <210> 32 <211> 4059 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 S <400> 32 atgaagtggg ttactttcat ctctttgttg tttttattct cctctgctta ctccttcgtg 60 ttcctcgtct tgctaccttt ggtttcttct caatgtgtta atttgactac cagaacccaa 120 ttaccaccag cttacaccaa ttcttttacc agaggcgtgt actaccccga caaggtgttc 180 cggagtagcg tgctgcacag cacgcaggac ctgttcctgc catttttctc taatgtgacc 240 tggtttcacg ccatccacgt gtccggcaca aacggcacaa agcggttcga caaccccgtg 300 ctgccattca acgatggcgt gtacttcgcc tctacagaaa agtccaatat cattaggggc 360 tggatcttcg gaacaacgct ggactcaaag acccagagga ttcttgacat tacaccatgt 420 tcttttggtg gtgtcagtgt tataacacca ggaacaaata cttctaacca ggttgctgtt 480 ctttatcagg atgttaactg cacagaagtc cctgttgcta ttcatgcaga tcaacttact 540 cctacttggc gtgtttattc tacaggttct aatgtttttc aaaccctgct gatcgtcaat 600 aacgccacaa atgtggtcat taaagtgtgc gaattccagt tctgcaacga ccccttcctg 660 ggcgtctact atcataagaa caacaagtct tggatggaaa gcgagttccg ggtgtacagc 720 agcgctaaca actgcacctt cgagtacgtt tcccaacctt tcctgatgga cctggaaggc 780 aagcagggca atttcaagaa cctgagagaa ttcgtgttca agaacatcga cggctacttc 840 aagatctaca gcaagcacac ccccatcaac ctggtacgag atctgcccca gggcttctct 900 gccctcgagc ccctcgtgga cctgcccatt ggaatcaaca tcacgcggtt ccagaccctg 960 ctcgccctgc atagaagcta cctcactccc ggcgattcta gcagcggctg gacagccggc 1020 gctgccgctt actacgtggg ctacctgcag cctagaacat ttctactgaa gtataacgag 1080 aacgggacaa tcacagacgc cgtggactgc gctctggatc ctctgagcga aaccaagtgc 1140 accctgaaaa gcttcaccgt cgagaaggga atctaccaga cctccaactt ccgggtgcag 1200 ccaaccgaga gcatcgtgag attccctaac atcactaacc tgtgtccttt tggagaagtg 1260 ttcaacgcca cccggttcgc cagcgtttat gcctggaacc gcaagagaat ctctaactgt 1320 gtggccgact acagcgtgct gtacaattct gccagcttca gcaccttcaa gtgctacggc 1380 gtgagtccca ccaaactgaa cgacctgtgc ttcactaacg tgtacgccga tagctttgtg 1440 atcagaggag acgaggtgag acagattgct cctggccaga ccggcaaaat cgccgattac 1500 aactacaagc tacctgacga cttcaccggc tgcgtgatcg cctggaattc taacaacctg 1560 gactccaagg tgggcggcaa ctacaactac ctgtacagac tgtttcggaa gtccaacctg 1620 aaaccattcg agagagatat cagcacagag atctaccaag cgggctcgac accttgcaac 1680 ggagtggagg gcttcaactg ttactttcct ctgcagtctt atggcttcca acctacaaat 1740 ggcgtcggat atcagcccta cagagtggtg gtgctttctt tcgagctgct gcacgcccca 1800 gctaccgtgt gtggtcctaa gaagtcgaca aatctggtga agaataagtg cgtgaatttt 1860 aactttaacg gcctgaccgg caccggcgtg ctgaccgaat ctaacaagaa attcctgcct 1920 ttccagcagt tcggtagaga tatcgccgac accaccgatg ccgtgcggga ccctcaaaca 1980 ctggaaatcc tggacataac accttgcagc ttcggcggag tcagcgtgat cacacctggc 2040 accaacacca gcaaccaggt ggccgtgctg taccaggacg tgaactgcac agaagtgcct 2100 gtggcgatcc acgctgatca gctgacacct acatggcggg tgtactcaac aggaagcaac 2160 gtgtttcaga cacgggccgg ctgtctgatc ggcgctgaac acgttaacaa cagctacgag 2220 tgcgacatcc ccatcggcgc cggcatctgt gccagctacc agactcagac aaatagccct 2280 aggagagcaa gatccgtggc cagccagagc atcatcgcct atacaatgag cctgggcgcc 2340 gagaattctg tcgcctacag caacaacagc atcgccatcc ccactaattt caccatctcc 2400 gtcaccacag aaatcctgcc tgtgagcatg accaagacca gcgtggattg cacaatgtac 2460 atttgcggcg acagcaccga gtgttccaac ctgctgctgc agtacggcag cttctgcacc 2520 cagctgaaca gagcactgac aggcatcgcc gtggagcaag acaagaacac ccaggaggtg 2580 ttcgcccagg tgaagcagat ctacaagacc cctcctatca aagacttcgg tggcttcaac 2640 ttcagccaga tcctgcctga tccgagcaag cctagcaaaa gatcatttat cgaagacctg 2700 ctgtttaaca aggtgaccct ggccgacgcc ggattcatca agcagtacgg cgactgcctg 2760 ggcgacatcg ccgccagaga tctgatctgt gcccagaagt ttaatggcct gaccgtgctg 2820 ccacctctgc tgaccgacga gatgatcgcc caatatacca gcgccctgct ggctggaaca 2880 atcacaagcg gctggacctt cggagccgga gccgctcttc agattccttt cgccatgcag 2940 atggcctaca gattcaacgg catcggcgtg acccagaacg tgctgtatga gaaccagaaa 3000 ctgatcgcta atcaatttaa cagcgccatc ggcaagattc aggactccct gagctcaaca 3060 gcctctgccc tgggcaagct gcaggatgtg gtgaaccaga acgcccaggc cctgaacaca 3120 ctggtgaaac agctgtcaag caacttcggc gccatctcat ccgtactgaa cgacatcctg 3180 tctagactcg atccaccaga ggccgaagtg cagatcgaca gactgatcac cggccggctg 3240 cagagcctgc agacgtacgt gacccaacag ctgatcaggg ccgccgagat ccgggcctcg 3300 gctaatttgg ccgccaccaa aatgagcgaa tgcgtgctgg gccagtctaa gagggtcgac 3360 ttctgtggca agggctacca cctgatgagc ttcccccaga gcgctcccca cggcgtggtg 3420 ttcctgcacg tgacctacgt tccagcccag gagaagaact ttacaaccgc ccctgccatc 3480 tgccacgacg gcaaggccca cttccctaga gagggagtct ttgtgagcaa tggcacccac 3540 tggttcgtta cccagagaaa cttctacgag ccccagatca tcaccacaga caacaccttc 3600 gtgagcggaa actgtgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg 3660 caacccgagc tggacagctt caaggaagag ctggacaaat actttaagaa ccacacctca 3720 cctgacgtgg acctgggaga tatcagcggc ataaatgcct ccgtggtgaa catccagaag 3780 gaaatcgata gactcaatga ggtggctaag aacctgaacg aaagcctgat cgacctccaa 3840 gagctgggca aatacgagca gtacatcaag tggccttggt acatttggct gggctttatc 3900 gccggcctca tcgctatcgt gatggtgacc atcatgctgt gctgcatgac ctcctgctgc 3960 agctgcctga agggctgttg cagctgcggc agctgctgca agttcgacga agatgattct 4020 gaaccagtgc tgaaaggcgt gaaactgcac tacacctga 4059 <210> 33 <211> 3888 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 S <400> 33 atgaagtaca cttcttacat tttggctttc caattgtgta tcgttttggg ttccttaggt 60 tgttactgtt tcgtgttcct cgtcttgcta cctttggttt cttctcaatg tgttaatttg 120 actaccagaa cccaattacc accagcttac accaattctt ttaccagagg cgtgtactac 180 cccgacaagg tgttccggag tagcgtgctg cacagcacgc aggacctgtt cctgccattt 240 ttctctaatg tgacctggtt tcacgccatc cacgtgtccg gcacaaacgg cacaaagcgg 300 ttcgacaacc ccgtgctgcc attcaacgat ggcgtgtact tcgcctctac agaaaagtcc 360 aatatcatta ggggctggat cttcggaaca acgctggact caaagaccca gagcctgctg 420 atcgtcaata acgccacaaa tgtggtcatt aaagtgtgcg aattccagtt ctgcaacgac 480 cccttcctgg gcgtctacta tcataagaac aacaagtctt ggatggaaag cgagttccgg 540 gtgtacagca gcgctaacaa ctgcaccttc gagtacgttt cccaaccttt cctgatggac 600 ctggaaggca agcagggcaa tttcaagaac ctgagagaat tcgtgttcaa gaacatcgac 660 ggctacttca agatctacag caagcacacc cccatcaacc tggtacgaga tctgccccag 720 ggcttctctg ccctcgagcc cctcgtggac ctgcccattg gaatcaacat cacgcggttc 780 cagaccctgc tcgccctgca tagaagctac ctcactcccg gcgattctag cagcggctgg 840 acagccggcg ctgccgctta ctacgtgggc tacctgcagc ctagaacatt tctactgaag 900 tataacgaga acgggacaat cacagacgcc gtggactgcg ctctggatcc tctgagcgaa 960 accaagtgca ccctgaaaag cttcaccgtc gagaagggaa tctaccagac ctccaacttc 1020 cgggtgcagc caaccgagag catcgtgaga ttccctaaca tcactaacct gtgtcctttt 1080 ggagaagtgt tcaacgccac ccggttcgcc agcgtttatg cctggaaccg caagagaatc 1140 tctaactgtg tggccgacta cagcgtgctg tacaattctg ccagcttcag caccttcaag 1200 tgctacggcg tgagtcccac caaactgaac gacctgtgct tcactaacgt gtacgccgat 1260 agctttgtga tcagaggaga cgaggtgaga cagattgctc ctggccagac cggcaaaatc 1320 gccgattaca actacaagct acctgacgac ttcaccggct gcgtgatcgc ctggaattct 1380 aacaacctgg actccaaggt gggcggcaac tacaactacc tgtacagact gtttcggaag 1440 tccaacctga aaccattcga gagagatatc agcacagaga tctaccaagc gggctcgaca 1500 ccttgcaacg gagtggaggg cttcaactgt tactttcctc tgcagtctta tggcttccaa 1560 cctacaaatg gcgtcggata tcagccctac agagtggtgg tgctttcttt cgagctgctg 1620 cacgccccag ctaccgtgtg tggtcctaag aagtcgacaa atctggtgaa gaataagtgc 1680 gtgaatttta actttaacgg cctgaccggc accggcgtgc tgaccgaatc taacaagaaa 1740 ttcctgcctt tccagcagtt cggtagagat atcgccgaca ccaccgatgc cgtgcgggac 1800 cctcaaacac tggaaatcct ggacataaca ccttgcagct tcggcggagt cagcgtgatc 1860 acacctggca ccaacaccag caaccaggtg gccgtgctgt accaggacgt gaactgcaca 1920 gaagtgcctg tggcgatcca cgctgatcag ctgacaccta catggcgggt gtactcaaca 1980 ggaagcaacg tgtttcagac acgggccggc tgtctgatcg gcgctgaaca cgttaacaac 2040 agctacgagt gcgacatccc catcggcgcc ggcatctgtg ccagctacca gactcagaca 2100 aatagcccta ggagagcaag atccgtggcc agccagagca tcatcgccta tacaatgagc 2160 ctgggcgccg agaattctgt cgcctacagc aacaacagca tcgccatccc cactaatttc 2220 accatctccg tcaccacaga aatcctgcct gtgagcatga ccaagaccag cgtggattgc 2280 acaatgtaca tttgcggcga cagcaccgag tgttccaacc tgctgctgca gtacggcagc 2340 ttctgcaccc agctgaacag agcactgaca ggcatcgccg tggagcaaga caagaacacc 2400 caggaggtgt tcgcccaggt gaagcagatc tacaagaccc ctcctatcaa agacttcggt 2460 ggcttcaact tcagccagat cctgcctgat ccgagcaagc ctagcaaaag atcatttatc 2520 gaagacctgc tgtttaacaa ggtgaccctg gccgacgccg gattcatcaa gcagtacggc 2580 gactgcctgg gcgacatcgc cgccagagat ctgatctgtg cccagaagtt taatggcctg 2640 accgtgctgc cacctctgct gaccgacgag atgatcgccc aatataccag cgccctgctg 2700 gctggaacaa tcacaagcgg ctggaccttc ggagccggag ccgctcttca gattcctttc 2760 gccatgcaga tggcctacag attcaacggc atcggcgtga cccagaacgt gctgtatgag 2820 aaccagaaac tgatcgctaa tcaatttaac agcgccatcg gcaagattca ggactccctg 2880 agctcaacag cctctgccct gggcaagctg caggatgtgg tgaaccagaa cgcccaggcc 2940 ctgaacacac tggtgaaaca gctgtcaagc aacttcggcg ccatctcatc cgtactgaac 3000 gacatcctgt ctagactcga tccaccagag gccgaagtgc agatcgacag actgatcacc 3060 ggccggctgc agagcctgca gacgtacgtg acccaacagc tgatcagggc cgccgagatc 3120 cgggcctcgg ctaatttggc cgccaccaaa atgagcgaat gcgtgctggg ccagtctaag 3180 agggtcgact tctgtggcaa gggctaccac ctgatgagct tcccccagag cgctccccac 3240 ggcgtggtgt tcctgcacgt gacctacgtt ccagcccagg agaagaactt tacaaccgcc 3300 cctgccatct gccacgacgg caaggcccac ttccctagag agggagtctt tgtgagcaat 3360 ggcacccact ggttcgttac ccagagaaac ttctacgagc cccagatcat caccacagac 3420 aacaccttcg tgagcggaaa ctgtgacgtg gtgatcggca tcgtgaacaa caccgtgtac 3480 gaccccctgc aacccgagct ggacagcttc aaggaagagc tggacaaata ctttaagaac 3540 cacacctcac ctgacgtgga cctgggagat atcagcggca taaatgcctc cgtggtgaac 3600 atccagaagg aaatcgatag actcaatgag gtggctaaga acctgaacga aagcctgatc 3660 gacctccaag agctgggcaa atacgagcag tacatcaagt ggccttggta catttggctg 3720 ggctttatcg ccggcctcat cgctatcgtg atggtgacca tcatgctgtg ctgcatgacc 3780 tcctgctgca gctgcctgaa gggctgttgc agctgcggca gctgctgcaa gttcgacgaa 3840 gatgattctg aaccagtgct gaaaggcgtg aaactgcact acacctga 3888 <210> 34 <211> 3903 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 S <400> 34 atgcaaagag ttaacatgat tatggctgaa tctccaggtt tgatcactat ctgtttgttg 60 ggttacttgt tatccgccga atgtttcgtg ttcctcgtct tgctaccttt ggtttcttct 120 caatgtgtta atttgactac cagaacccaa ttaccaccag cttacaccaa ttcttttacc 180 agaggcgtgt actaccccga caaggtgttc cggagtagcg tgctgcacag cacgcaggac 240 ctgttcctgc catttttctc taatgtgacc tggtttcacg ccatccacgt gtccggcaca 300 aacggcacaa agcggttcga caaccccgtg ctgccattca acgatggcgt gtacttcgcc 360 tctacagaaa agtccaatat cattaggggc tggatcttcg gaacaacgct ggactcaaag 420 acccagagcc tgctgatcgt caataacgcc acaaatgtgg tcattaaagt gtgcgaattc 480 cagttctgca acgacccctt cctgggcgtc tactatcata agaacaacaa gtcttggatg 540 gaaagcgagt tccgggtgta cagcagcgct aacaactgca ccttcgagta cgtttcccaa 600 cctttcctga tggacctgga aggcaagcag ggcaatttca agaacctgag agaattcgtg 660 ttcaagaaca tcgacggcta cttcaagatc tacagcaagc acacccccat caacctggta 720 cgagatctgc cccagggctt ctctgccctc gagcccctcg tggacctgcc cattggaatc 780 aacatcacgc ggttccagac cctgctcgcc ctgcatagaa gctacctcac tcccggcgat 840 tctagcagcg gctggacagc cggcgctgcc gcttactacg tgggctacct gcagcctaga 900 acatttctac tgaagtataa cgagaacggg acaatcacag acgccgtgga ctgcgctctg 960 gatcctctga gcgaaaccaa gtgcaccctg aaaagcttca ccgtcgagaa gggaatctac 1020 cagacctcca acttccgggt gcagccaacc gagagcatcg tgagattccc taacatcact 1080 aacctgtgtc cttttggaga agtgttcaac gccacccggt tcgccagcgt ttatgcctgg 1140 aaccgcaaga gaatctctaa ctgtgtggcc gactacagcg tgctgtacaa ttctgccagc 1200 ttcagcacct tcaagtgcta cggcgtgagt cccaccaaac tgaacgacct gtgcttcact 1260 aacgtgtacg ccgatagctt tgtgatcaga ggagacgagg tgagacagat tgctcctggc 1320 cagaccggca aaatcgccga ttacaactac aagctacctg acgacttcac cggctgcgtg 1380 atcgcctgga attctaacaa cctggactcc aaggtgggcg gcaactacaa ctacctgtac 1440 agactgtttc ggaagtccaa cctgaaacca ttcgagagag atatcagcac agagatctac 1500 caagcgggct cgacaccttg caacggagtg gagggcttca actgttactt tcctctgcag 1560 tcttatggct tccaacctac aaatggcgtc ggatatcagc cctacagagt ggtggtgctt 1620 tctttcgagc tgctgcacgc cccagctacc gtgtgtggtc ctaagaagtc gacaaatctg 1680 gtgaagaata agtgcgtgaa ttttaacttt aacggcctga ccggcaccgg cgtgctgacc 1740 gaatctaaca agaaattcct gcctttccag cagttcggta gagatatcgc cgacaccacc 1800 gatgccgtgc gggaccctca aacactggaa atcctggaca taacaccttg cagcttcggc 1860 ggagtcagcg tgatcacacc tggcaccaac accagcaacc aggtggccgt gctgtaccag 1920 gacgtgaact gcacagaagt gcctgtggcg atccacgctg atcagctgac acctacatgg 1980 cgggtgtact caacaggaag caacgtgttt cagacacggg ccggctgtct gatcggcgct 2040 gaacacgtta acaacagcta cgagtgcgac atccccatcg gcgccggcat ctgtgccagc 2100 taccagactc agacaaatag ccctaggaga gcaagatccg tggccagcca gagcatcatc 2160 gcctatacaa tgagcctggg cgccgagaat tctgtcgcct acagcaacaa cagcatcgcc 2220 atccccacta atttcaccat ctccgtcacc acagaaatcc tgcctgtgag catgaccaag 2280 accagcgtgg attgcacaat gtacatttgc ggcgacagca ccgagtgttc caacctgctg 2340 ctgcagtacg gcagcttctg cacccagctg aacagagcac tgacaggcat cgccgtggag 2400 caagacaaga acacccagga ggtgttcgcc caggtgaagc agatctacaa gacccctcct 2460 atcaaagact tcggtggctt caacttcagc cagatcctgc ctgatccgag caagcctagc 2520 aaaagatcat ttatcgaaga cctgctgttt aacaaggtga ccctggccga cgccggattc 2580 atcaagcagt acggcgactg cctgggcgac atcgccgcca gagatctgat ctgtgcccag 2640 aagtttaatg gcctgaccgt gctgccacct ctgctgaccg acgagatgat cgcccaatat 2700 accagcgccc tgctggctgg aacaatcaca agcggctgga ccttcggagc cggagccgct 2760 cttcagattc ctttcgccat gcagatggcc tacagattca acggcatcgg cgtgacccag 2820 aacgtgctgt atgagaacca gaaactgatc gctaatcaat ttaacagcgc catcggcaag 2880 attcaggact ccctgagctc aacagcctct gccctgggca agctgcagga tgtggtgaac 2940 cagaacgccc aggccctgaa cacactggtg aaacagctgt caagcaactt cggcgccatc 3000 tcatccgtac tgaacgacat cctgtctaga ctcgatccac cagaggccga agtgcagatc 3060 gacagactga tcaccggccg gctgcagagc ctgcagacgt acgtgaccca acagctgatc 3120 agggccgccg agatccgggc ctcggctaat ttggccgcca ccaaaatgag cgaatgcgtg 3180 ctgggccagt ctaagagggt cgacttctgt ggcaagggct accacctgat gagcttcccc 3240 cagagcgctc cccacggcgt ggtgttcctg cacgtgacct acgttccagc ccaggagaag 3300 aactttacaa ccgcccctgc catctgccac gacggcaagg cccacttccc tagagaggga 3360 gtctttgtga gcaatggcac ccactggttc gttacccaga gaaacttcta cgagccccag 3420 atcatcacca cagacaacac cttcgtgagc ggaaactgtg acgtggtgat cggcatcgtg 3480 aacaacaccg tgtacgaccc cctgcaaccc gagctggaca gcttcaagga agagctggac 3540 aaatacttta agaaccacac ctcacctgac gtggacctgg gagatatcag cggcataaat 3600 gcctccgtgg tgaacatcca gaaggaaatc gatagactca atgaggtggc taagaacctg 3660 aacgaaagcc tgatcgacct ccaagagctg ggcaaatacg agcagtacat caagtggcct 3720 tggtacattt ggctgggctt tatcgccggc ctcatcgcta tcgtgatggt gaccatcatg 3780 ctgtgctgca tgacctcctg ctgcagctgc ctgaagggct gttgcagctg cggcagctgc 3840 tgcaagttcg acgaagatga ttctgaacca gtgctgaaag gcgtgaaact gcactacacc 3900 tga 3903 <210> 35 <211> 3879 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 S <400> 35 atggtatata aaactttatt tgctttatgt attttaactg ctggttggcg tgtacaatct 60 ttcgtgttcc tcgtcttgct acctttggtt tcttctcaat gtgttaattt gactaccaga 120 acccaattac caccagctta caccaattct tttaccagag gcgtgtacta ccccgacaag 180 gtgttccgga gtagcgtgct gcacagcacg caggacctgt tcctgccatt tttctctaat 240 gtgacctggt ttcacgccat ccacgtgtcc ggcacaaacg gcacaaagcg gttcgacaac 300 cccgtgctgc cattcaacga tggcgtgtac ttcgcctcta cagaaaagtc caatatcatt 360 aggggctgga tcttcggaac aacgctggac tcaaagaccc agagcctgct gatcgtcaat 420 aacgccacaa atgtggtcat taaagtgtgc gaattccagt tctgcaacga ccccttcctg 480 ggcgtctact atcataagaa caacaagtct tggatggaaa gcgagttccg ggtgtacagc 540 agcgctaaca actgcacctt cgagtacgtt tcccaacctt tcctgatgga cctggaaggc 600 aagcagggca atttcaagaa cctgagagaa ttcgtgttca agaacatcga cggctacttc 660 aagatctaca gcaagcacac ccccatcaac ctggtacgag atctgcccca gggcttctct 720 gccctcgagc ccctcgtgga cctgcccatt ggaatcaaca tcacgcggtt ccagaccctg 780 ctcgccctgc atagaagcta cctcactccc ggcgattcta gcagcggctg gacagccggc 840 gctgccgctt actacgtggg ctacctgcag cctagaacat ttctactgaa gtataacgag 900 aacgggacaa tcacagacgc cgtggactgc gctctggatc ctctgagcga aaccaagtgc 960 accctgaaaa gcttcaccgt cgagaaggga atctaccaga cctccaactt ccgggtgcag 1020 ccaaccgaga gcatcgtgag attccctaac atcactaacc tgtgtccttt tggagaagtg 1080 ttcaacgcca cccggttcgc cagcgtttat gcctggaacc gcaagagaat ctctaactgt 1140 gtggccgact acagcgtgct gtacaattct gccagcttca gcaccttcaa gtgctacggc 1200 gtgagtccca ccaaactgaa cgacctgtgc ttcactaacg tgtacgccga tagctttgtg 1260 atcagaggag acgaggtgag acagattgct cctggccaga ccggcaaaat cgccgattac 1320 aactacaagc tacctgacga cttcaccggc tgcgtgatcg cctggaattc taacaacctg 1380 gactccaagg tgggcggcaa ctacaactac ctgtacagac tgtttcggaa gtccaacctg 1440 aaaccattcg agagagatat cagcacagag atctaccaag cgggctcgac accttgcaac 1500 ggagtggagg gcttcaactg ttactttcct ctgcagtctt atggcttcca acctacaaat 1560 ggcgtcggat atcagcccta cagagtggtg gtgctttctt tcgagctgct gcacgcccca 1620 gctaccgtgt gtggtcctaa gaagtcgaca aatctggtga agaataagtg cgtgaatttt 1680 aactttaacg gcctgaccgg caccggcgtg ctgaccgaat ctaacaagaa attcctgcct 1740 ttccagcagt tcggtagaga tatcgccgac accaccgatg ccgtgcggga ccctcaaaca 1800 ctggaaatcc tggacataac accttgcagc ttcggcggag tcagcgtgat cacacctggc 1860 accaacacca gcaaccaggt ggccgtgctg taccaggacg tgaactgcac agaagtgcct 1920 gtggcgatcc acgctgatca gctgacacct acatggcggg tgtactcaac aggaagcaac 1980 gtgtttcaga cacgggccgg ctgtctgatc ggcgctgaac acgttaacaa cagctacgag 2040 tgcgacatcc ccatcggcgc cggcatctgt gccagctacc agactcagac aaatagccct 2100 aggagagcaa gatccgtggc cagccagagc atcatcgcct atacaatgag cctgggcgcc 2160 gagaattctg tcgcctacag caacaacagc atcgccatcc ccactaattt caccatctcc 2220 gtcaccacag aaatcctgcc tgtgagcatg accaagacca gcgtggattg cacaatgtac 2280 atttgcggcg acagcaccga gtgttccaac ctgctgctgc agtacggcag cttctgcacc 2340 cagctgaaca gagcactgac aggcatcgcc gtggagcaag acaagaacac ccaggaggtg 2400 ttcgcccagg tgaagcagat ctacaagacc cctcctatca aagacttcgg tggcttcaac 2460 ttcagccaga tcctgcctga tccgagcaag cctagcaaaa gatcatttat cgaagacctg 2520 ctgtttaaca aggtgaccct ggccgacgcc ggattcatca agcagtacgg cgactgcctg 2580 ggcgacatcg ccgccagaga tctgatctgt gcccagaagt ttaatggcct gaccgtgctg 2640 ccacctctgc tgaccgacga gatgatcgcc caatatacca gcgccctgct ggctggaaca 2700 atcacaagcg gctggacctt cggagccgga gccgctcttc agattccttt cgccatgcag 2760 atggcctaca gattcaacgg catcggcgtg acccagaacg tgctgtatga gaaccagaaa 2820 ctgatcgcta atcaatttaa cagcgccatc ggcaagattc aggactccct gagctcaaca 2880 gcctctgccc tgggcaagct gcaggatgtg gtgaaccaga acgcccaggc cctgaacaca 2940 ctggtgaaac agctgtcaag caacttcggc gccatctcat ccgtactgaa cgacatcctg 3000 tctagactcg atccaccaga ggccgaagtg cagatcgaca gactgatcac cggccggctg 3060 cagagcctgc agacgtacgt gacccaacag ctgatcaggg ccgccgagat ccgggcctcg 3120 gctaatttgg ccgccaccaa aatgagcgaa tgcgtgctgg gccagtctaa gagggtcgac 3180 ttctgtggca agggctacca cctgatgagc ttcccccaga gcgctcccca cggcgtggtg 3240 ttcctgcacg tgacctacgt tccagcccag gagaagaact ttacaaccgc ccctgccatc 3300 tgccacgacg gcaaggccca cttccctaga gagggagtct ttgtgagcaa tggcacccac 3360 tggttcgtta cccagagaaa cttctacgag ccccagatca tcaccacaga caacaccttc 3420 gtgagcggaa actgtgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg 3480 caacccgagc tggacagctt caaggaagag ctggacaaat actttaagaa ccacacctca 3540 cctgacgtgg acctgggaga tatcagcggc ataaatgcct ccgtggtgaa catccagaag 3600 gaaatcgata gactcaatga ggtggctaag aacctgaacg aaagcctgat cgacctccaa 3660 gagctgggca aatacgagca gtacatcaag tggccttggt acatttggct gggctttatc 3720 gccggcctca tcgctatcgt gatggtgacc atcatgctgt gctgcatgac ctcctgctgc 3780 agctgcctga agggctgttg cagctgcggc agctgctgca agttcgacga agatgattct 3840 gaaccagtgc tgaaaggcgt gaaactgcac tacacctga 3879 <210> 36 <211> 720 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 M <400> 36 atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccgctgat 60 tccaacggta ccatcaccgt tgaagaattg aagaagttgc tggaacaatg gaacttggtc 120 attggttttt tattcttgac ttggatctgt ttgttgcaat tcgcttacgc taacagaaac 180 cgtttcctct acattatcaa gttgatcttc ctatggttat tgtggccagt cactttggct 240 tgtttcgttt tggccgcagt ttacagaatc aactggatta caggtggtat tgctattgct 300 atggcctgtc tggtgggcct gatgtggctg agctacttca tcgcctcttt tagactgttt 360 gccagaaccc ggagcatgtg gtccttcaac cccgagacaa acatcctgct gaatgtgccc 420 ctgcacggca caatcctgac aagacctctg cttgagagcg agctggtgat cggcgccgtg 480 atcctgaggg gccatctgcg gattgccgga caccacctgg gcagatgcga catcaaggac 540 ctgcctaagg aaatcaccgt ggctacaagc cgcaccctgt cctactacaa actcggcgcc 600 agccaaagag tggccggcga cagcggcttc gccgcctata gcagataccg gatcggcaac 660 tacaagctga acaccgacca ctctagcagc tctgataata tcgccctgct ggttcagtga 720 720 <210> 37 <211> 720 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 M <400> 37 atgaagtggg ttactttcat ctctttgttg tttttattct cctctgctta ctccgctgat 60 tccaacggta ccatcaccgt tgaagaattg aagaagttgc tggaacaatg gaacttggtc 120 attggttttt tattcttgac ttggatctgt ttgttgcaat tcgcttacgc taacagaaac 180 cgtttcctct acattatcaa gttgatcttc ctatggttat tgtggccagt cactttggct 240 tgtttcgttt tggccgcagt ttacagaatc aactggatta caggtggtat tgctattgct 300 atggcctgtc tggtgggcct gatgtggctg agctacttca tcgcctcttt tagactgttt 360 gccagaaccc ggagcatgtg gtccttcaac cccgagacaa acatcctgct gaatgtgccc 420 ctgcacggca caatcctgac aagacctctg cttgagagcg agctggtgat cggcgccgtg 480 atcctgaggg gccatctgcg gattgccgga caccacctgg gcagatgcga catcaaggac 540 ctgcctaagg aaatcaccgt ggctacaagc cgcaccctgt cctactacaa actcggcgcc 600 agccaaagag tggccggcga cagcggcttc gccgcctata gcagataccg gatcggcaac 660 tacaagctga acaccgacca ctctagcagc tctgataata tcgccctgct ggttcagtga 720 720 <210> 38 <211> 735 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 M <400> 38 atgaaatata caagttatat cttggctttt cagctctgca tcgttttggg ttctcttggc 60 tgttactgcg ctgattccaa cggtaccatc accgttgaag aattgaagaa gttgctggaa 120 caatggaact tggtcattgg ttttttattc ttgacttgga tctgtttgtt gcaattcgct 180 tacgctaaca gaaaccgttt cctctacatt atcaagttga tcttcctatg gttattgtgg 240 ccagtcactt tggcttgttt cgttttggcc gcagtttaca gaatcaactg gattacaggt 300 ggtattgcta ttgctatggc ctgtctggtg ggcctgatgt ggctgagcta cttcatcgcc 360 tcttttagac tgtttgccag aacccggagc atgtggtcct tcaaccccga gacaaacatc 420 ctgctgaatg tgcccctgca cggcacaatc ctgacaagac ctctgcttga gagcgagctg 480 gtgatcggcg ccgtgatcct gaggggccat ctgcggattg ccggacacca cctgggcaga 540 tgcgacatca aggacctgcc taaggaaatc accgtggcta caagccgcac cctgtcctac 600 tacaaactcg gcgccagcca aagagtggcc ggcgacagcg gcttcgccgc ctatagcaga 660 taccggatcg gcaactacaa gctgaacacc gaccactcta gcagctctga taatatcgcc 720 ctgctggttc agtga 735 <210> 39 <211> 735 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 M <400> 39 atgaagtaca cttcttacat tttggctttc caattgtgta tcgttttggg ttccttaggt 60 tgttactgtg ctgattccaa cggtaccatc accgttgaag aattgaagaa gttgctggaa 120 caatggaact tggtcattgg ttttttattc ttgacttgga tctgtttgtt gcaattcgct 180 tacgctaaca gaaaccgttt cctctacatt atcaagttga tcttcctatg gttattgtgg 240 ccagtcactt tggcttgttt cgttttggcc gcagtttaca gaatcaactg gattacaggt 300 ggtattgcta ttgctatggc ctgtctggtg ggcctgatgt ggctgagcta cttcatcgcc 360 tcttttagac tgtttgccag aacccggagc atgtggtcct tcaaccccga gacaaacatc 420 ctgctgaatg tgcccctgca cggcacaatc ctgacaagac ctctgcttga gagcgagctg 480 gtgatcggcg ccgtgatcct gaggggccat ctgcggattg ccggacacca cctgggcaga 540 tgcgacatca aggacctgcc taaggaaatc accgtggcta caagccgcac cctgtcctac 600 tacaaactcg gcgccagcca aagagtggcc ggcgacagcg gcttcgccgc ctatagcaga 660 taccggatcg gcaactacaa gctgaacacc gaccactcta gcagctctga taatatcgcc 720 ctgctggttc agtga 735 <210> 40 <211> 750 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 M <400> 40 atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60 ggatatctac tcagtgctga atgtgctgat tccaacggta ccatcaccgt tgaagaattg 120 aagaagttgc tggaacaatg gaacttggtc attggttttt tattcttgac ttggatctgt 180 ttgttgcaat tcgcttacgc taacagaaac cgtttcctct acattatcaa gttgatcttc 240 ctatggttat tgtggccagt cactttggct tgtttcgttt tggccgcagt ttacagaatc 300 aactggatta caggtggtat tgctattgct atggcctgtc tggtgggcct gatgtggctg 360 agctacttca tcgcctcttt tagactgttt gccagaaccc ggagcatgtg gtccttcaac 420 cccgagacaa acatcctgct gaatgtgccc ctgcacggca caatcctgac aagacctctg 480 cttgagagcg agctggtgat cggcgccgtg atcctgaggg gccatctgcg gattgccgga 540 caccacctgg gcagatgcga catcaaggac ctgcctaagg aaatcaccgt ggctacaagc 600 cgcaccctgt cctactacaa actcggcgcc agccaaagag tggccggcga cagcggcttc 660 gccgcctata gcagataccg gatcggcaac tacaagctga acaccgacca ctctagcagc 720 tctgataata tcgccctgct ggttcagtga 750 <210> 41 <211> 750 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 M <400> 41 atgcaaagag ttaacatgat tatggctgaa tctccaggtt tgatcactat ctgtttgttg 60 ggttacttgt tatccgccga atgtgctgat tccaacggta ccatcaccgt tgaagaattg 120 aagaagttgc tggaacaatg gaacttggtc attggttttt tattcttgac ttggatctgt 180 ttgttgcaat tcgcttacgc taacagaaac cgtttcctct acattatcaa gttgatcttc 240 ctatggttat tgtggccagt cactttggct tgtttcgttt tggccgcagt ttacagaatc 300 aactggatta caggtggtat tgctattgct atggcctgtc tggtgggcct gatgtggctg 360 agctacttca tcgcctcttt tagactgttt gccagaaccc ggagcatgtg gtccttcaac 420 cccgagacaa acatcctgct gaatgtgccc ctgcacggca caatcctgac aagacctctg 480 cttgagagcg agctggtgat cggcgccgtg atcctgaggg gccatctgcg gattgccgga 540 caccacctgg gcagatgcga catcaaggac ctgcctaagg aaatcaccgt ggctacaagc 600 cgcaccctgt cctactacaa actcggcgcc agccaaagag tggccggcga cagcggcttc 660 gccgcctata gcagataccg gatcggcaac tacaagctga acaccgacca ctctagcagc 720 tctgataata tcgccctgct ggttcagtga 750 <210> 42 <211> 726 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 M <400> 42 atggtctaca agactctctt cgctctttgc atcttaactg caggatggag ggtacagagt 60 gctgattcca acggtaccat caccgttgaa gaattgaaga agttgctgga acaatggaac 120 ttggtcattg gttttttatt cttgacttgg atctgtttgt tgcaattcgc ttacgctaac 180 agaaaccgtt tcctctacat tatcaagttg atcttcctat ggttattgtg gccagtcact 240 ttggcttgtt tcgttttggc cgcagtttac agaatcaact ggattacagg tggtattgct 300 attgctatgg cctgtctggt gggcctgatg tggctgagct acttcatcgc ctcttttaga 360 ctgtttgcca gaacccggag catgtggtcc ttcaaccccg agacaaacat cctgctgaat 420 gtgcccctgc acggcacaat cctgacaaga cctctgcttg agagcgagct ggtgatcggc 480 gccgtgatcc tgaggggcca tctgcggatt gccggacacc acctgggcag atgcgacatc 540 aaggacctgc ctaaggaaat caccgtggct acaagccgca ccctgtccta ctacaaactc 600 ggcgccagcc aaagagtggc cggcgacagc ggcttcgccg cctatagcag ataccggatc 660 ggcaactaca agctgaacac cgaccactct agcagctctg ataatatcgc cctgctggtt 720 cagtga 726 <210> 43 <211> 726 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 M <400> 43 atggtatata aaactttatt tgctttatgt attttaactg ctggttggcg tgtacaatct 60 gctgattcca acggtaccat caccgttgaa gaattgaaga agttgctgga acaatggaac 120 ttggtcattg gttttttatt cttgacttgg atctgtttgt tgcaattcgc ttacgctaac 180 agaaaccgtt tcctctacat tatcaagttg atcttcctat ggttattgtg gccagtcact 240 ttggcttgtt tcgttttggc cgcagtttac agaatcaact ggattacagg tggtattgct 300 attgctatgg cctgtctggt gggcctgatg tggctgagct acttcatcgc ctcttttaga 360 ctgtttgcca gaacccggag catgtggtcc ttcaaccccg agacaaacat cctgctgaat 420 gtgcccctgc acggcacaat cctgacaaga cctctgcttg agagcgagct ggtgatcggc 480 gccgtgatcc tgaggggcca tctgcggatt gccggacacc acctgggcag atgcgacatc 540 aaggacctgc ctaaggaaat caccgtggct acaagccgca ccctgtccta ctacaaactc 600 ggcgccagcc aaagagtggc cggcgacagc ggcttcgccg cctatagcag ataccggatc 660 ggcaactaca agctgaacac cgaccactct agcagctctg ataatatcgc cctgctggtt 720 cagtga 726 <210> 44 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> TTTh <400> 44 Arg Gln Lys Arg Ile Asp Lys Ile Ser Asp Val Ser Thr Ile Val Pro 1 5 10 15 Tyr Ile Gly Pro Ala Leu Asn Ile Pro Lys Lys Arg Asn Asn Phe Thr 20 25 30 Val Ser Phe Trp Leu Arg Val Pro Lys Val Ser Ala Ser His Leu Glu 35 40 45 <210> 45 <211> 147 <212> RNA <213> Artificial Sequence <220> <223> TTTh <400> 45 cgccagaaac gcattgataa aattagcgat gtgagcacca ttgtgccgta tattggcccg 60 gcgctgaaca ttccgaaaaa acgcaacaac tttaccgtga gcttttggct gcgcgtgccg 120 aaagtgagcg cgagccatct ggaatga 147 <210> 46 <211> 147 <212> RNA <213> Artificial Sequence <220> <223> TTTh <400> 46 agacagaaaa gaatcgataa gatcagcgac gtgtctacaa tcgtgccata catcggccct 60 gccctgaata tccccaagaa gcggaacaac ttcaccgtca gcttctggct gagagtgcct 120 aaggtgtccg ccagccacct ggagtga 147 <210> 47 <211> 4017 <212> RNA <213> Artificial Sequence <220> <223> IgE SP - SARS-CoV-2 S - TTTh <400> 47 atggactgga cttggatctt gttcttggtt gctgctgcca ccagagtcca ctctttcgtg 60 ttcctcgtct tgctaccttt ggtttcttct caatgtgtta atttgactac cagaacccaa 120 ttaccaccag cttacaccaa ttcttttacc agaggcgtgt actaccccga caaggtgttc 180 cggagtagcg tgctgcacag cacgcaggac ctgttcctgc catttttctc taatgtgacc 240 tggtttcacg ccatccacgt gtccggcaca aacggcacaa agcggttcga caaccccgtg 300 ctgccattca acgatggcgt gtacttcgcc tctacagaaa agtccaatat cattaggggc 360 tggatcttcg gaacaacgct ggactcaaag acccagagcc tgctgatcgt caataacgcc 420 acaaatgtgg tcattaaagt gtgcgaattc cagttctgca acgacccctt cctgggcgtc 480 tactatcata agaacaacaa gtcttggatg gaaagcgagt tccgggtgta cagcagcgct 540 aacaactgca ccttcgagta cgtttcccaa cctttcctga tggacctgga aggcaagcag 600 ggcaatttca agaacctgag agaattcgtg ttcaagaaca tcgacggcta cttcaagatc 660 tacagcaagc acacccccat caacctggta cgagatctgc cccagggctt ctctgccctc 720 gagcccctcg tggacctgcc cattggaatc aacatcacgc ggttccagac cctgctcgcc 780 ctgcatagaa gctacctcac tcccggcgat tctagcagcg gctggacagc cggcgctgcc 840 gcttactacg tgggctacct gcagcctaga acatttctac tgaagtataa cgagaacggg 900 acaatcacag acgccgtgga ctgcgctctg gatcctctga gcgaaaccaa gtgcaccctg 960 aaaagcttca ccgtcgagaa gggaatctac cagacctcca acttccgggt gcagccaacc 1020 gagagcatcg tgagattccc taacatcact aacctgtgtc cttttggaga agtgttcaac 1080 gccacccggt tcgccagcgt ttatgcctgg aaccgcaaga gaatctctaa ctgtgtggcc 1140 gactacagcg tgctgtacaa ttctgccagc ttcagcacct tcaagtgcta cggcgtgagt 1200 cccaccaaac tgaacgacct gtgcttcact aacgtgtacg ccgatagctt tgtgatcaga 1260 ggagacgagg tgagacagat tgctcctggc cagaccggca aaatcgccga ttacaactac 1320 aagctacctg acgacttcac cggctgcgtg atcgcctgga attctaacaa cctggactcc 1380 aaggtgggcg gcaactacaa ctacctgtac agactgtttc ggaagtccaa cctgaaacca 1440 ttcgagagag atatcagcac agagatctac caagcgggct cgacaccttg caacggagtg 1500 gagggcttca actgttactt tcctctgcag tcttatggct tccaacctac aaatggcgtc 1560 ggatatcagc cctacagagt ggtggtgctt tctttcgagc tgctgcacgc cccagctacc 1620 gtgtgtggtc ctaagaagtc gacaaatctg gtgaagaata agtgcgtgaa ttttaacttt 1680 aacggcctga ccggcaccgg cgtgctgacc gaatctaaca agaaattcct gcctttccag 1740 cagttcggta gagatatcgc cgacaccacc gatgccgtgc gggaccctca aacactggaa 1800 atcctggaca taacaccttg cagcttcggc ggagtcagcg tgatcacacc tggcaccaac 1860 accagcaacc aggtggccgt gctgtaccag gacgtgaact gcacagaagt gcctgtggcg 1920 atccacgctg atcagctgac acctacatgg cgggtgtact caacaggaag caacgtgttt 1980 cagacacggg ccggctgtct gatcggcgct gaacacgtta acaacagcta cgagtgcgac 2040 atccccatcg gcgccggcat ctgtgccagc taccagactc agacaaatag ccctaggaga 2100 gcaagatccg tggccagcca gagcatcatc gcctatacaa tgagcctggg cgccgagaat 2160 tctgtcgcct acagcaacaa cagcatcgcc atccccacta atttcaccat ctccgtcacc 2220 acagaaatcc tgcctgtgag catgaccaag accagcgtgg attgcacaat gtacatttgc 2280 ggcgacagca ccgagtgttc caacctgctg ctgcagtacg gcagcttctg cacccagctg 2340 aacagagcac tgacaggcat cgccgtggag caagacaaga acacccagga ggtgttcgcc 2400 caggtgaagc agatctacaa gacccctcct atcaaagact tcggtggctt caacttcagc 2460 cagatcctgc ctgatccgag caagcctagc aaaagatcat ttatcgaaga cctgctgttt 2520 aacaaggtga ccctggccga cgccggattc atcaagcagt acggcgactg cctgggcgac 2580 atcgccgcca gagatctgat ctgtgcccag aagtttaatg gcctgaccgt gctgccacct 2640 ctgctgaccg acgagatgat cgcccaatat accagcgccc tgctggctgg aacaatcaca 2700 agcggctgga ccttcggagc cggagccgct cttcagattc ctttcgccat gcagatggcc 2760 tacagattca acggcatcgg cgtgacccag aacgtgctgt atgagaacca gaaactgatc 2820 gctaatcaat ttaacagcgc catcggcaag attcaggact ccctgagctc aacagcctct 2880 gccctgggca agctgcagga tgtggtgaac cagaacgccc aggccctgaa cacactggtg 2940 aaacagctgt caagcaactt cggcgccatc tcatccgtac tgaacgacat cctgtctaga 3000 ctcgatccac cagaggccga agtgcagatc gacagactga tcaccggccg gctgcagagc 3060 ctgcagacgt acgtgaccca acagctgatc agggccgccg agatccgggc ctcggctaat 3120 ttggccgcca ccaaaatgag cgaatgcgtg ctgggccagt ctaagagggt cgacttctgt 3180 ggcaagggct accacctgat gagcttcccc cagagcgctc cccacggcgt ggtgttcctg 3240 cacgtgacct acgttccagc ccaggagaag aactttacaa ccgcccctgc catctgccac 3300 gacggcaagg cccacttccc tagagaggga gtctttgtga gcaatggcac ccactggttc 3360 gttacccaga gaaacttcta cgagccccag atcatcacca cagacaacac cttcgtgagc 3420 ggaaactgtg acgtggtgat cggcatcgtg aacaacaccg tgtacgaccc cctgcaaccc 3480 gagctggaca gcttcaagga agagctggac aaatacttta agaaccacac ctcacctgac 3540 gtggacctgg gagatatcag cggcataaat gcctccgtgg tgaacatcca gaaggaaatc 3600 gatagactca atgaggtggc taagaacctg aacgaaagcc tgatcgacct ccaagagctg 3660 ggcaaatacg agcagtacat caagtggcct tggtacattt ggctgggctt tatcgccggc 3720 ctcatcgcta tcgtgatggt gaccatcatg ctgtgctgca tgacctcctg ctgcagctgc 3780 ctgaagggct gttgcagctg cggcagctgc tgcaagttcg acgaagatga ttctgaacca 3840 gtgctgaaag gcgtgaaact gcactacacc agacagaaaa gaatcgataa gatcagcgac 3900 gtgtctacaa tcgtgccata catcggccct gccctgaata tccccaagaa gcggaacaac 3960 ttcaccgtca gcttctggct gagagtgcct aaggtgtccg ccagccacct ggagtga 4017 <210> 48 <211> 4017 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 S - TTTh <400> 48 atgaagtggg ttactttcat ctctttgttg tttttattct cctctgctta ctccttcgtg 60 ttcctcgtct tgctaccttt ggtttcttct caatgtgtta atttgactac cagaacccaa 120 ttaccaccag cttacaccaa ttcttttacc agaggcgtgt actaccccga caaggtgttc 180 cggagtagcg tgctgcacag cacgcaggac ctgttcctgc catttttctc taatgtgacc 240 tggtttcacg ccatccacgt gtccggcaca aacggcacaa agcggttcga caaccccgtg 300 ctgccattca acgatggcgt gtacttcgcc tctacagaaa agtccaatat cattaggggc 360 tggatcttcg gaacaacgct ggactcaaag acccagagcc tgctgatcgt caataacgcc 420 acaaatgtgg tcattaaagt gtgcgaattc cagttctgca acgacccctt cctgggcgtc 480 tactatcata agaacaacaa gtcttggatg gaaagcgagt tccgggtgta cagcagcgct 540 aacaactgca ccttcgagta cgtttcccaa cctttcctga tggacctgga aggcaagcag 600 ggcaatttca agaacctgag agaattcgtg ttcaagaaca tcgacggcta cttcaagatc 660 tacagcaagc acacccccat caacctggta cgagatctgc cccagggctt ctctgccctc 720 gagcccctcg tggacctgcc cattggaatc aacatcacgc ggttccagac cctgctcgcc 780 ctgcatagaa gctacctcac tcccggcgat tctagcagcg gctggacagc cggcgctgcc 840 gcttactacg tgggctacct gcagcctaga acatttctac tgaagtataa cgagaacggg 900 acaatcacag acgccgtgga ctgcgctctg gatcctctga gcgaaaccaa gtgcaccctg 960 aaaagcttca ccgtcgagaa gggaatctac cagacctcca acttccgggt gcagccaacc 1020 gagagcatcg tgagattccc taacatcact aacctgtgtc cttttggaga agtgttcaac 1080 gccacccggt tcgccagcgt ttatgcctgg aaccgcaaga gaatctctaa ctgtgtggcc 1140 gactacagcg tgctgtacaa ttctgccagc ttcagcacct tcaagtgcta cggcgtgagt 1200 cccaccaaac tgaacgacct gtgcttcact aacgtgtacg ccgatagctt tgtgatcaga 1260 ggagacgagg tgagacagat tgctcctggc cagaccggca aaatcgccga ttacaactac 1320 aagctacctg acgacttcac cggctgcgtg atcgcctgga attctaacaa cctggactcc 1380 aaggtgggcg gcaactacaa ctacctgtac agactgtttc ggaagtccaa cctgaaacca 1440 ttcgagagag atatcagcac agagatctac caagcgggct cgacaccttg caacggagtg 1500 gagggcttca actgttactt tcctctgcag tcttatggct tccaacctac aaatggcgtc 1560 ggatatcagc cctacagagt ggtggtgctt tctttcgagc tgctgcacgc cccagctacc 1620 gtgtgtggtc ctaagaagtc gacaaatctg gtgaagaata agtgcgtgaa ttttaacttt 1680 aacggcctga ccggcaccgg cgtgctgacc gaatctaaca agaaattcct gcctttccag 1740 cagttcggta gagatatcgc cgacaccacc gatgccgtgc gggaccctca aacactggaa 1800 atcctggaca taacaccttg cagcttcggc ggagtcagcg tgatcacacc tggcaccaac 1860 accagcaacc aggtggccgt gctgtaccag gacgtgaact gcacagaagt gcctgtggcg 1920 atccacgctg atcagctgac acctacatgg cgggtgtact caacaggaag caacgtgttt 1980 cagacacggg ccggctgtct gatcggcgct gaacacgtta acaacagcta cgagtgcgac 2040 atccccatcg gcgccggcat ctgtgccagc taccagactc agacaaatag ccctaggaga 2100 gcaagatccg tggccagcca gagcatcatc gcctatacaa tgagcctggg cgccgagaat 2160 tctgtcgcct acagcaacaa cagcatcgcc atccccacta atttcaccat ctccgtcacc 2220 acagaaatcc tgcctgtgag catgaccaag accagcgtgg attgcacaat gtacatttgc 2280 ggcgacagca ccgagtgttc caacctgctg ctgcagtacg gcagcttctg cacccagctg 2340 aacagagcac tgacaggcat cgccgtggag caagacaaga acacccagga ggtgttcgcc 2400 caggtgaagc agatctacaa gacccctcct atcaaagact tcggtggctt caacttcagc 2460 cagatcctgc ctgatccgag caagcctagc aaaagatcat ttatcgaaga cctgctgttt 2520 aacaaggtga ccctggccga cgccggattc atcaagcagt acggcgactg cctgggcgac 2580 atcgccgcca gagatctgat ctgtgcccag aagtttaatg gcctgaccgt gctgccacct 2640 ctgctgaccg acgagatgat cgcccaatat accagcgccc tgctggctgg aacaatcaca 2700 agcggctgga ccttcggagc cggagccgct cttcagattc ctttcgccat gcagatggcc 2760 tacagattca acggcatcgg cgtgacccag aacgtgctgt atgagaacca gaaactgatc 2820 gctaatcaat ttaacagcgc catcggcaag attcaggact ccctgagctc aacagcctct 2880 gccctgggca agctgcagga tgtggtgaac cagaacgccc aggccctgaa cacactggtg 2940 aaacagctgt caagcaactt cggcgccatc tcatccgtac tgaacgacat cctgtctaga 3000 ctcgatccac cagaggccga agtgcagatc gacagactga tcaccggccg gctgcagagc 3060 ctgcagacgt acgtgaccca acagctgatc agggccgccg agatccgggc ctcggctaat 3120 ttggccgcca ccaaaatgag cgaatgcgtg ctgggccagt ctaagagggt cgacttctgt 3180 ggcaagggct accacctgat gagcttcccc cagagcgctc cccacggcgt ggtgttcctg 3240 cacgtgacct acgttccagc ccaggagaag aactttacaa ccgcccctgc catctgccac 3300 gacggcaagg cccacttccc tagagaggga gtctttgtga gcaatggcac ccactggttc 3360 gttacccaga gaaacttcta cgagccccag atcatcacca cagacaacac cttcgtgagc 3420 ggaaactgtg acgtggtgat cggcatcgtg aacaacaccg tgtacgaccc cctgcaaccc 3480 gagctggaca gcttcaagga agagctggac aaatacttta agaaccacac ctcacctgac 3540 gtggacctgg gagatatcag cggcataaat gcctccgtgg tgaacatcca gaaggaaatc 3600 gatagactca atgaggtggc taagaacctg aacgaaagcc tgatcgacct ccaagagctg 3660 ggcaaatacg agcagtacat caagtggcct tggtacattt ggctgggctt tatcgccggc 3720 ctcatcgcta tcgtgatggt gaccatcatg ctgtgctgca tgacctcctg ctgcagctgc 3780 ctgaagggct gttgcagctg cggcagctgc tgcaagttcg acgaagatga ttctgaacca 3840 gtgctgaaag gcgtgaaact gcactacacc agacagaaaa gaatcgataa gatcagcgac 3900 gtgtctacaa tcgtgccata catcggccct gccctgaata tccccaagaa gcggaacaac 3960 ttcaccgtca gcttctggct gagagtgcct aaggtgtccg ccagccacct ggagtga 4017 <210> 49 <211> 4032 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 S - TTTh <400> 49 atgaagtaca cttcttacat tttggctttc caattgtgta tcgttttggg ttccttaggt 60 tgttactgtt tcgtgttcct cgtcttgcta cctttggttt cttctcaatg tgttaatttg 120 actaccagaa cccaattacc accagcttac accaattctt ttaccagagg cgtgtactac 180 cccgacaagg tgttccggag tagcgtgctg cacagcacgc aggacctgtt cctgccattt 240 ttctctaatg tgacctggtt tcacgccatc cacgtgtccg gcacaaacgg cacaaagcgg 300 ttcgacaacc ccgtgctgcc attcaacgat ggcgtgtact tcgcctctac agaaaagtcc 360 aatatcatta ggggctggat cttcggaaca acgctggact caaagaccca gagcctgctg 420 atcgtcaata acgccacaaa tgtggtcatt aaagtgtgcg aattccagtt ctgcaacgac 480 cccttcctgg gcgtctacta tcataagaac aacaagtctt ggatggaaag cgagttccgg 540 gtgtacagca gcgctaacaa ctgcaccttc gagtacgttt cccaaccttt cctgatggac 600 ctggaaggca agcagggcaa tttcaagaac ctgagagaat tcgtgttcaa gaacatcgac 660 ggctacttca agatctacag caagcacacc cccatcaacc tggtacgaga tctgccccag 720 ggcttctctg ccctcgagcc cctcgtggac ctgcccattg gaatcaacat cacgcggttc 780 cagaccctgc tcgccctgca tagaagctac ctcactcccg gcgattctag cagcggctgg 840 acagccggcg ctgccgctta ctacgtgggc tacctgcagc ctagaacatt tctactgaag 900 tataacgaga acgggacaat cacagacgcc gtggactgcg ctctggatcc tctgagcgaa 960 accaagtgca ccctgaaaag cttcaccgtc gagaagggaa tctaccagac ctccaacttc 1020 cgggtgcagc caaccgagag catcgtgaga ttccctaaca tcactaacct gtgtcctttt 1080 ggagaagtgt tcaacgccac ccggttcgcc agcgtttatg cctggaaccg caagagaatc 1140 tctaactgtg tggccgacta cagcgtgctg tacaattctg ccagcttcag caccttcaag 1200 tgctacggcg tgagtcccac caaactgaac gacctgtgct tcactaacgt gtacgccgat 1260 agctttgtga tcagaggaga cgaggtgaga cagattgctc ctggccagac cggcaaaatc 1320 gccgattaca actacaagct acctgacgac ttcaccggct gcgtgatcgc ctggaattct 1380 aacaacctgg actccaaggt gggcggcaac tacaactacc tgtacagact gtttcggaag 1440 tccaacctga aaccattcga gagagatatc agcacagaga tctaccaagc gggctcgaca 1500 ccttgcaacg gagtggaggg cttcaactgt tactttcctc tgcagtctta tggcttccaa 1560 cctacaaatg gcgtcggata tcagccctac agagtggtgg tgctttcttt cgagctgctg 1620 cacgccccag ctaccgtgtg tggtcctaag aagtcgacaa atctggtgaa gaataagtgc 1680 gtgaatttta actttaacgg cctgaccggc accggcgtgc tgaccgaatc taacaagaaa 1740 ttcctgcctt tccagcagtt cggtagagat atcgccgaca ccaccgatgc cgtgcgggac 1800 cctcaaacac tggaaatcct ggacataaca ccttgcagct tcggcggagt cagcgtgatc 1860 acacctggca ccaacaccag caaccaggtg gccgtgctgt accaggacgt gaactgcaca 1920 gaagtgcctg tggcgatcca cgctgatcag ctgacaccta catggcgggt gtactcaaca 1980 ggaagcaacg tgtttcagac acgggccggc tgtctgatcg gcgctgaaca cgttaacaac 2040 agctacgagt gcgacatccc catcggcgcc ggcatctgtg ccagctacca gactcagaca 2100 aatagcccta ggagagcaag atccgtggcc agccagagca tcatcgccta tacaatgagc 2160 ctgggcgccg agaattctgt cgcctacagc aacaacagca tcgccatccc cactaatttc 2220 accatctccg tcaccacaga aatcctgcct gtgagcatga ccaagaccag cgtggattgc 2280 acaatgtaca tttgcggcga cagcaccgag tgttccaacc tgctgctgca gtacggcagc 2340 ttctgcaccc agctgaacag agcactgaca ggcatcgccg tggagcaaga caagaacacc 2400 caggaggtgt tcgcccaggt gaagcagatc tacaagaccc ctcctatcaa agacttcggt 2460 ggcttcaact tcagccagat cctgcctgat ccgagcaagc ctagcaaaag atcatttatc 2520 gaagacctgc tgtttaacaa ggtgaccctg gccgacgccg gattcatcaa gcagtacggc 2580 gactgcctgg gcgacatcgc cgccagagat ctgatctgtg cccagaagtt taatggcctg 2640 accgtgctgc cacctctgct gaccgacgag atgatcgccc aatataccag cgccctgctg 2700 gctggaacaa tcacaagcgg ctggaccttc ggagccggag ccgctcttca gattcctttc 2760 gccatgcaga tggcctacag attcaacggc atcggcgtga cccagaacgt gctgtatgag 2820 aaccagaaac tgatcgctaa tcaatttaac agcgccatcg gcaagattca ggactccctg 2880 agctcaacag cctctgccct gggcaagctg caggatgtgg tgaaccagaa cgcccaggcc 2940 ctgaacacac tggtgaaaca gctgtcaagc aacttcggcg ccatctcatc cgtactgaac 3000 gacatcctgt ctagactcga tccaccagag gccgaagtgc agatcgacag actgatcacc 3060 ggccggctgc agagcctgca gacgtacgtg acccaacagc tgatcagggc cgccgagatc 3120 cgggcctcgg ctaatttggc cgccaccaaa atgagcgaat gcgtgctggg ccagtctaag 3180 agggtcgact tctgtggcaa gggctaccac ctgatgagct tcccccagag cgctccccac 3240 ggcgtggtgt tcctgcacgt gacctacgtt ccagcccagg agaagaactt tacaaccgcc 3300 cctgccatct gccacgacgg caaggcccac ttccctagag agggagtctt tgtgagcaat 3360 ggcacccact ggttcgttac ccagagaaac ttctacgagc cccagatcat caccacagac 3420 aacaccttcg tgagcggaaa ctgtgacgtg gtgatcggca tcgtgaacaa caccgtgtac 3480 gaccccctgc aacccgagct ggacagcttc aaggaagagc tggacaaata ctttaagaac 3540 cacacctcac ctgacgtgga cctgggagat atcagcggca taaatgcctc cgtggtgaac 3600 atccagaagg aaatcgatag actcaatgag gtggctaaga acctgaacga aagcctgatc 3660 gacctccaag agctgggcaa atacgagcag tacatcaagt ggccttggta catttggctg 3720 ggctttatcg ccggcctcat cgctatcgtg atggtgacca tcatgctgtg ctgcatgacc 3780 tcctgctgca gctgcctgaa gggctgttgc agctgcggca gctgctgcaa gttcgacgaa 3840 gatgattctg aaccagtgct gaaaggcgtg aaactgcact acaccagaca gaaaagaatc 3900 gataagatca gcgacgtgtc tacaatcgtg ccatacatcg gccctgccct gaatatcccc 3960 aagaagcgga acaacttcac cgtcagcttc tggctgagag tgcctaaggt gtccgccagc 4020 cacctggagt ga 4032 <210> 50 <211> 4047 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 S - TTTh <400> 50 atgcaaagag ttaacatgat tatggctgaa tctccaggtt tgatcactat ctgtttgttg 60 ggttacttgt tatccgccga atgtttcgtg ttcctcgtct tgctaccttt ggtttcttct 120 caatgtgtta atttgactac cagaacccaa ttaccaccag cttacaccaa ttcttttacc 180 agaggcgtgt actaccccga caaggtgttc cggagtagcg tgctgcacag cacgcaggac 240 ctgttcctgc catttttctc taatgtgacc tggtttcacg ccatccacgt gtccggcaca 300 aacggcacaa agcggttcga caaccccgtg ctgccattca acgatggcgt gtacttcgcc 360 tctacagaaa agtccaatat cattaggggc tggatcttcg gaacaacgct ggactcaaag 420 acccagagcc tgctgatcgt caataacgcc acaaatgtgg tcattaaagt gtgcgaattc 480 cagttctgca acgacccctt cctgggcgtc tactatcata agaacaacaa gtcttggatg 540 gaaagcgagt tccgggtgta cagcagcgct aacaactgca ccttcgagta cgtttcccaa 600 cctttcctga tggacctgga aggcaagcag ggcaatttca agaacctgag agaattcgtg 660 ttcaagaaca tcgacggcta cttcaagatc tacagcaagc acacccccat caacctggta 720 cgagatctgc cccagggctt ctctgccctc gagcccctcg tggacctgcc cattggaatc 780 aacatcacgc ggttccagac cctgctcgcc ctgcatagaa gctacctcac tcccggcgat 840 tctagcagcg gctggacagc cggcgctgcc gcttactacg tgggctacct gcagcctaga 900 acatttctac tgaagtataa cgagaacggg acaatcacag acgccgtgga ctgcgctctg 960 gatcctctga gcgaaaccaa gtgcaccctg aaaagcttca ccgtcgagaa gggaatctac 1020 cagacctcca acttccgggt gcagccaacc gagagcatcg tgagattccc taacatcact 1080 aacctgtgtc cttttggaga agtgttcaac gccacccggt tcgccagcgt ttatgcctgg 1140 aaccgcaaga gaatctctaa ctgtgtggcc gactacagcg tgctgtacaa ttctgccagc 1200 ttcagcacct tcaagtgcta cggcgtgagt cccaccaaac tgaacgacct gtgcttcact 1260 aacgtgtacg ccgatagctt tgtgatcaga ggagacgagg tgagacagat tgctcctggc 1320 cagaccggca aaatcgccga ttacaactac aagctacctg acgacttcac cggctgcgtg 1380 atcgcctgga attctaacaa cctggactcc aaggtgggcg gcaactacaa ctacctgtac 1440 agactgtttc ggaagtccaa cctgaaacca ttcgagagag atatcagcac agagatctac 1500 caagcgggct cgacaccttg caacggagtg gagggcttca actgttactt tcctctgcag 1560 tcttatggct tccaacctac aaatggcgtc ggatatcagc cctacagagt ggtggtgctt 1620 tctttcgagc tgctgcacgc cccagctacc gtgtgtggtc ctaagaagtc gacaaatctg 1680 gtgaagaata agtgcgtgaa ttttaacttt aacggcctga ccggcaccgg cgtgctgacc 1740 gaatctaaca agaaattcct gcctttccag cagttcggta gagatatcgc cgacaccacc 1800 gatgccgtgc gggaccctca aacactggaa atcctggaca taacaccttg cagcttcggc 1860 ggagtcagcg tgatcacacc tggcaccaac accagcaacc aggtggccgt gctgtaccag 1920 gacgtgaact gcacagaagt gcctgtggcg atccacgctg atcagctgac acctacatgg 1980 cgggtgtact caacaggaag caacgtgttt cagacacggg ccggctgtct gatcggcgct 2040 gaacacgtta acaacagcta cgagtgcgac atccccatcg gcgccggcat ctgtgccagc 2100 taccagactc agacaaatag ccctaggaga gcaagatccg tggccagcca gagcatcatc 2160 gcctatacaa tgagcctggg cgccgagaat tctgtcgcct acagcaacaa cagcatcgcc 2220 atccccacta atttcaccat ctccgtcacc acagaaatcc tgcctgtgag catgaccaag 2280 accagcgtgg attgcacaat gtacatttgc ggcgacagca ccgagtgttc caacctgctg 2340 ctgcagtacg gcagcttctg cacccagctg aacagagcac tgacaggcat cgccgtggag 2400 caagacaaga acacccagga ggtgttcgcc caggtgaagc agatctacaa gacccctcct 2460 atcaaagact tcggtggctt caacttcagc cagatcctgc ctgatccgag caagcctagc 2520 aaaagatcat ttatcgaaga cctgctgttt aacaaggtga ccctggccga cgccggattc 2580 atcaagcagt acggcgactg cctgggcgac atcgccgcca gagatctgat ctgtgcccag 2640 aagtttaatg gcctgaccgt gctgccacct ctgctgaccg acgagatgat cgcccaatat 2700 accagcgccc tgctggctgg aacaatcaca agcggctgga ccttcggagc cggagccgct 2760 cttcagattc ctttcgccat gcagatggcc tacagattca acggcatcgg cgtgacccag 2820 aacgtgctgt atgagaacca gaaactgatc gctaatcaat ttaacagcgc catcggcaag 2880 attcaggact ccctgagctc aacagcctct gccctgggca agctgcagga tgtggtgaac 2940 cagaacgccc aggccctgaa cacactggtg aaacagctgt caagcaactt cggcgccatc 3000 tcatccgtac tgaacgacat cctgtctaga ctcgatccac cagaggccga agtgcagatc 3060 gacagactga tcaccggccg gctgcagagc ctgcagacgt acgtgaccca acagctgatc 3120 agggccgccg agatccgggc ctcggctaat ttggccgcca ccaaaatgag cgaatgcgtg 3180 ctgggccagt ctaagagggt cgacttctgt ggcaagggct accacctgat gagcttcccc 3240 cagagcgctc cccacggcgt ggtgttcctg cacgtgacct acgttccagc ccaggagaag 3300 aactttacaa ccgcccctgc catctgccac gacggcaagg cccacttccc tagagaggga 3360 gtctttgtga gcaatggcac ccactggttc gttacccaga gaaacttcta cgagccccag 3420 atcatcacca cagacaacac cttcgtgagc ggaaactgtg acgtggtgat cggcatcgtg 3480 aacaacaccg tgtacgaccc cctgcaaccc gagctggaca gcttcaagga agagctggac 3540 aaatacttta agaaccacac ctcacctgac gtggacctgg gagatatcag cggcataaat 3600 gcctccgtgg tgaacatcca gaaggaaatc gatagactca atgaggtggc taagaacctg 3660 aacgaaagcc tgatcgacct ccaagagctg ggcaaatacg agcagtacat caagtggcct 3720 tggtacattt ggctgggctt tatcgccggc ctcatcgcta tcgtgatggt gaccatcatg 3780 ctgtgctgca tgacctcctg ctgcagctgc ctgaagggct gttgcagctg cggcagctgc 3840 tgcaagttcg acgaagatga ttctgaacca gtgctgaaag gcgtgaaact gcactacacc 3900 agacagaaaa gaatcgataa gatcagcgac gtgtctacaa tcgtgccata catcggccct 3960 gccctgaata tccccaagaa gcggaacaac ttcaccgtca gcttctggct gagagtgcct 4020 aaggtgtccg ccagccacct ggagtga 4047 <210> 51 <211> 4023 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 S - TTTh <400> 51 atggtatata aaactttatt tgctttatgt attttaactg ctggttggcg tgtacaatct 60 ttcgtgttcc tcgtcttgct acctttggtt tcttctcaat gtgttaattt gactaccaga 120 acccaattac caccagctta caccaattct tttaccagag gcgtgtacta ccccgacaag 180 gtgttccgga gtagcgtgct gcacagcacg caggacctgt tcctgccatt tttctctaat 240 gtgacctggt ttcacgccat ccacgtgtcc ggcacaaacg gcacaaagcg gttcgacaac 300 cccgtgctgc cattcaacga tggcgtgtac ttcgcctcta cagaaaagtc caatatcatt 360 aggggctgga tcttcggaac aacgctggac tcaaagaccc agagcctgct gatcgtcaat 420 aacgccacaa atgtggtcat taaagtgtgc gaattccagt tctgcaacga ccccttcctg 480 ggcgtctact atcataagaa caacaagtct tggatggaaa gcgagttccg ggtgtacagc 540 agcgctaaca actgcacctt cgagtacgtt tcccaacctt tcctgatgga cctggaaggc 600 aagcagggca atttcaagaa cctgagagaa ttcgtgttca agaacatcga cggctacttc 660 aagatctaca gcaagcacac ccccatcaac ctggtacgag atctgcccca gggcttctct 720 gccctcgagc ccctcgtgga cctgcccatt ggaatcaaca tcacgcggtt ccagaccctg 780 ctcgccctgc atagaagcta cctcactccc ggcgattcta gcagcggctg gacagccggc 840 gctgccgctt actacgtggg ctacctgcag cctagaacat ttctactgaa gtataacgag 900 aacgggacaa tcacagacgc cgtggactgc gctctggatc ctctgagcga aaccaagtgc 960 accctgaaaa gcttcaccgt cgagaaggga atctaccaga cctccaactt ccgggtgcag 1020 ccaaccgaga gcatcgtgag attccctaac atcactaacc tgtgtccttt tggagaagtg 1080 ttcaacgcca cccggttcgc cagcgtttat gcctggaacc gcaagagaat ctctaactgt 1140 gtggccgact acagcgtgct gtacaattct gccagcttca gcaccttcaa gtgctacggc 1200 gtgagtccca ccaaactgaa cgacctgtgc ttcactaacg tgtacgccga tagctttgtg 1260 atcagaggag acgaggtgag acagattgct cctggccaga ccggcaaaat cgccgattac 1320 aactacaagc tacctgacga cttcaccggc tgcgtgatcg cctggaattc taacaacctg 1380 gactccaagg tgggcggcaa ctacaactac ctgtacagac tgtttcggaa gtccaacctg 1440 aaaccattcg agagagatat cagcacagag atctaccaag cgggctcgac accttgcaac 1500 ggagtggagg gcttcaactg ttactttcct ctgcagtctt atggcttcca acctacaaat 1560 ggcgtcggat atcagcccta cagagtggtg gtgctttctt tcgagctgct gcacgcccca 1620 gctaccgtgt gtggtcctaa gaagtcgaca aatctggtga agaataagtg cgtgaatttt 1680 aactttaacg gcctgaccgg caccggcgtg ctgaccgaat ctaacaagaa attcctgcct 1740 ttccagcagt tcggtagaga tatcgccgac accaccgatg ccgtgcggga ccctcaaaca 1800 ctggaaatcc tggacataac accttgcagc ttcggcggag tcagcgtgat cacacctggc 1860 accaacacca gcaaccaggt ggccgtgctg taccaggacg tgaactgcac agaagtgcct 1920 gtggcgatcc acgctgatca gctgacacct acatggcggg tgtactcaac aggaagcaac 1980 gtgtttcaga cacgggccgg ctgtctgatc ggcgctgaac acgttaacaa cagctacgag 2040 tgcgacatcc ccatcggcgc cggcatctgt gccagctacc agactcagac aaatagccct 2100 aggagagcaa gatccgtggc cagccagagc atcatcgcct atacaatgag cctgggcgcc 2160 gagaattctg tcgcctacag caacaacagc atcgccatcc ccactaattt caccatctcc 2220 gtcaccacag aaatcctgcc tgtgagcatg accaagacca gcgtggattg cacaatgtac 2280 atttgcggcg acagcaccga gtgttccaac ctgctgctgc agtacggcag cttctgcacc 2340 cagctgaaca gagcactgac aggcatcgcc gtggagcaag acaagaacac ccaggaggtg 2400 ttcgcccagg tgaagcagat ctacaagacc cctcctatca aagacttcgg tggcttcaac 2460 ttcagccaga tcctgcctga tccgagcaag cctagcaaaa gatcatttat cgaagacctg 2520 ctgtttaaca aggtgaccct ggccgacgcc ggattcatca agcagtacgg cgactgcctg 2580 ggcgacatcg ccgccagaga tctgatctgt gcccagaagt ttaatggcct gaccgtgctg 2640 ccacctctgc tgaccgacga gatgatcgcc caatatacca gcgccctgct ggctggaaca 2700 atcacaagcg gctggacctt cggagccgga gccgctcttc agattccttt cgccatgcag 2760 atggcctaca gattcaacgg catcggcgtg acccagaacg tgctgtatga gaaccagaaa 2820 ctgatcgcta atcaatttaa cagcgccatc ggcaagattc aggactccct gagctcaaca 2880 gcctctgccc tgggcaagct gcaggatgtg gtgaaccaga acgcccaggc cctgaacaca 2940 ctggtgaaac agctgtcaag caacttcggc gccatctcat ccgtactgaa cgacatcctg 3000 tctagactcg atccaccaga ggccgaagtg cagatcgaca gactgatcac cggccggctg 3060 cagagcctgc agacgtacgt gacccaacag ctgatcaggg ccgccgagat ccgggcctcg 3120 gctaatttgg ccgccaccaa aatgagcgaa tgcgtgctgg gccagtctaa gagggtcgac 3180 ttctgtggca agggctacca cctgatgagc ttcccccaga gcgctcccca cggcgtggtg 3240 ttcctgcacg tgacctacgt tccagcccag gagaagaact ttacaaccgc ccctgccatc 3300 tgccacgacg gcaaggccca cttccctaga gagggagtct ttgtgagcaa tggcacccac 3360 tggttcgtta cccagagaaa cttctacgag ccccagatca tcaccacaga caacaccttc 3420 gtgagcggaa actgtgacgt ggtgatcggc atcgtgaaca acaccgtgta cgaccccctg 3480 caacccgagc tggacagctt caaggaagag ctggacaaat actttaagaa ccacacctca 3540 cctgacgtgg acctgggaga tatcagcggc ataaatgcct ccgtggtgaa catccagaag 3600 gaaatcgata gactcaatga ggtggctaag aacctgaacg aaagcctgat cgacctccaa 3660 gagctgggca aatacgagca gtacatcaag tggccttggt acatttggct gggctttatc 3720 gccggcctca tcgctatcgt gatggtgacc atcatgctgt gctgcatgac ctcctgctgc 3780 agctgcctga agggctgttg cagctgcggc agctgctgca agttcgacga agatgattct 3840 gaaccagtgc tgaaaggcgt gaaactgcac tacaccagac agaaaagaat cgataagatc 3900 agcgacgtgt ctacaatcgt gccatacatc ggccctgccc tgaatatccc caagaagcgg 3960 aacaacttca ccgtcagctt ctggctgaga gtgcctaagg tgtccgccag ccacctggag 4020 tga 4023 <210> 52 <211> 864 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 M - TTTh <400> 52 atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccgctgat 60 tccaacggta ccatcaccgt tgaagaattg aagaagttgc tggaacaatg gaacttggtc 120 attggttttt tattcttgac ttggatctgt ttgttgcaat tcgcttacgc taacagaaac 180 cgtttcctct acattatcaa gttgatcttc ctatggttat tgtggccagt cactttggct 240 tgtttcgttt tggccgcagt ttacagaatc aactggatta caggtggtat tgctattgct 300 atggcctgtc tggtgggcct gatgtggctg agctacttca tcgcctcttt tagactgttt 360 gccagaaccc ggagcatgtg gtccttcaac cccgagacaa acatcctgct gaatgtgccc 420 ctgcacggca caatcctgac aagacctctg cttgagagcg agctggtgat cggcgccgtg 480 atcctgaggg gccatctgcg gattgccgga caccacctgg gcagatgcga catcaaggac 540 ctgcctaagg aaatcaccgt ggctacaagc cgcaccctgt cctactacaa actcggcgcc 600 agccaaagag tggccggcga cagcggcttc gccgcctata gcagataccg gatcggcaac 660 tacaagctga acaccgacca ctctagcagc tctgataata tcgccctgct ggttcagaga 720 cagaaaagaa tcgataagat cagcgacgtg tctacaatcg tgccatacat cggccctgcc 780 ctgaatatcc ccaagaagcg gaacaacttc accgtcagct tctggctgag agtgcctaag 840 gtgtccgcca gccacctgga gtga 864 <210> 53 <211> 864 <212> RNA <213> Artificial Sequence <220> <223> albumin SP - SARS-CoV-2 M - TTTh <400> 53 atgaagtggg ttactttcat ctctttgttg tttttattct cctctgctta ctccgctgat 60 tccaacggta ccatcaccgt tgaagaattg aagaagttgc tggaacaatg gaacttggtc 120 attggttttt tattcttgac ttggatctgt ttgttgcaat tcgcttacgc taacagaaac 180 cgtttcctct acattatcaa gttgatcttc ctatggttat tgtggccagt cactttggct 240 tgtttcgttt tggccgcagt ttacagaatc aactggatta caggtggtat tgctattgct 300 atggcctgtc tggtgggcct gatgtggctg agctacttca tcgcctcttt tagactgttt 360 gccagaaccc ggagcatgtg gtccttcaac cccgagacaa acatcctgct gaatgtgccc 420 ctgcacggca caatcctgac aagacctctg cttgagagcg agctggtgat cggcgccgtg 480 atcctgaggg gccatctgcg gattgccgga caccacctgg gcagatgcga catcaaggac 540 ctgcctaagg aaatcaccgt ggctacaagc cgcaccctgt cctactacaa actcggcgcc 600 agccaaagag tggccggcga cagcggcttc gccgcctata gcagataccg gatcggcaac 660 tacaagctga acaccgacca ctctagcagc tctgataata tcgccctgct ggttcagaga 720 cagaaaagaa tcgataagat cagcgacgtg tctacaatcg tgccatacat cggccctgcc 780 ctgaatatcc ccaagaagcg gaacaacttc accgtcagct tctggctgag agtgcctaag 840 gtgtccgcca gccacctgga gtga 864 <210> 54 <211> 879 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 M - TTTh <400> 54 atgaaatata caagttatat cttggctttt cagctctgca tcgttttggg ttctcttggc 60 tgttactgcg ctgattccaa cggtaccatc accgttgaag aattgaagaa gttgctggaa 120 caatggaact tggtcattgg ttttttattc ttgacttgga tctgtttgtt gcaattcgct 180 tacgctaaca gaaaccgttt cctctacatt atcaagttga tcttcctatg gttattgtgg 240 ccagtcactt tggcttgttt cgttttggcc gcagtttaca gaatcaactg gattacaggt 300 ggtattgcta ttgctatggc ctgtctggtg ggcctgatgt ggctgagcta cttcatcgcc 360 tcttttagac tgtttgccag aacccggagc atgtggtcct tcaaccccga gacaaacatc 420 ctgctgaatg tgcccctgca cggcacaatc ctgacaagac ctctgcttga gagcgagctg 480 gtgatcggcg ccgtgatcct gaggggccat ctgcggattg ccggacacca cctgggcaga 540 tgcgacatca aggacctgcc taaggaaatc accgtggcta caagccgcac cctgtcctac 600 tacaaactcg gcgccagcca aagagtggcc ggcgacagcg gcttcgccgc ctatagcaga 660 taccggatcg gcaactacaa gctgaacacc gaccactcta gcagctctga taatatcgcc 720 ctgctggttc agagacagaa aagaatcgat aagatcagcg acgtgtctac aatcgtgcca 780 tacatcggcc ctgccctgaa tatccccaag aagcggaaca acttcaccgt cagcttctgg 840 ctgagagtgc ctaaggtgtc cgccagccac ctggagtga 879 <210> 55 <211> 879 <212> RNA <213> Artificial Sequence <220> <223> IFN-r SP - SARS-CoV-2 M - TTTh <400> 55 atgaagtaca cttcttacat tttggctttc caattgtgta tcgttttggg ttccttaggt 60 tgttactgtg ctgattccaa cggtaccatc accgttgaag aattgaagaa gttgctggaa 120 caatggaact tggtcattgg ttttttattc ttgacttgga tctgtttgtt gcaattcgct 180 tacgctaaca gaaaccgttt cctctacatt atcaagttga tcttcctatg gttattgtgg 240 ccagtcactt tggcttgttt cgttttggcc gcagtttaca gaatcaactg gattacaggt 300 ggtattgcta ttgctatggc ctgtctggtg ggcctgatgt ggctgagcta cttcatcgcc 360 tcttttagac tgtttgccag aacccggagc atgtggtcct tcaaccccga gacaaacatc 420 ctgctgaatg tgcccctgca cggcacaatc ctgacaagac ctctgcttga gagcgagctg 480 gtgatcggcg ccgtgatcct gaggggccat ctgcggattg ccggacacca cctgggcaga 540 tgcgacatca aggacctgcc taaggaaatc accgtggcta caagccgcac cctgtcctac 600 tacaaactcg gcgccagcca aagagtggcc ggcgacagcg gcttcgccgc ctatagcaga 660 taccggatcg gcaactacaa gctgaacacc gaccactcta gcagctctga taatatcgcc 720 ctgctggttc agagacagaa aagaatcgat aagatcagcg acgtgtctac aatcgtgcca 780 tacatcggcc ctgccctgaa tatccccaag aagcggaaca acttcaccgt cagcttctgg 840 ctgagagtgc ctaaggtgtc cgccagccac ctggagtga 879 <210> 56 <211> 894 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 M - TTTh <400> 56 atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60 ggatatctac tcagtgctga atgtgctgat tccaacggta ccatcaccgt tgaagaattg 120 aagaagttgc tggaacaatg gaacttggtc attggttttt tattcttgac ttggatctgt 180 ttgttgcaat tcgcttacgc taacagaaac cgtttcctct acattatcaa gttgatcttc 240 ctatggttat tgtggccagt cactttggct tgtttcgttt tggccgcagt ttacagaatc 300 aactggatta caggtggtat tgctattgct atggcctgtc tggtgggcct gatgtggctg 360 agctacttca tcgcctcttt tagactgttt gccagaaccc ggagcatgtg gtccttcaac 420 cccgagacaa acatcctgct gaatgtgccc ctgcacggca caatcctgac aagacctctg 480 cttgagagcg agctggtgat cggcgccgtg atcctgaggg gccatctgcg gattgccgga 540 caccacctgg gcagatgcga catcaaggac ctgcctaagg aaatcaccgt ggctacaagc 600 cgcaccctgt cctactacaa actcggcgcc agccaaagag tggccggcga cagcggcttc 660 gccgcctata gcagataccg gatcggcaac tacaagctga acaccgacca ctctagcagc 720 tctgataata tcgccctgct ggttcagaga cagaaaagaa tcgataagat cagcgacgtg 780 tctacaatcg tgccatacat cggccctgcc ctgaatatcc ccaagaagcg gaacaacttc 840 accgtcagct tctggctgag agtgcctaag gtgtccgcca gccacctgga gtga 894 <210> 57 <211> 894 <212> RNA <213> Artificial Sequence <220> <223> F IX SP - SARS-CoV-2 M - TTTh <400> 57 atgcaaagag ttaacatgat tatggctgaa tctccaggtt tgatcactat ctgtttgttg 60 ggttacttgt tatccgccga atgtgctgat tccaacggta ccatcaccgt tgaagaattg 120 aagaagttgc tggaacaatg gaacttggtc attggttttt tattcttgac ttggatctgt 180 ttgttgcaat tcgcttacgc taacagaaac cgtttcctct acattatcaa gttgatcttc 240 ctatggttat tgtggccagt cactttggct tgtttcgttt tggccgcagt ttacagaatc 300 aactggatta caggtggtat tgctattgct atggcctgtc tggtgggcct gatgtggctg 360 agctacttca tcgcctcttt tagactgttt gccagaaccc ggagcatgtg gtccttcaac 420 cccgagacaa acatcctgct gaatgtgccc ctgcacggca caatcctgac aagacctctg 480 cttgagagcg agctggtgat cggcgccgtg atcctgaggg gccatctgcg gattgccgga 540 caccacctgg gcagatgcga catcaaggac ctgcctaagg aaatcaccgt ggctacaagc 600 cgcaccctgt cctactacaa actcggcgcc agccaaagag tggccggcga cagcggcttc 660 gccgcctata gcagataccg gatcggcaac tacaagctga acaccgacca ctctagcagc 720 tctgataata tcgccctgct ggttcagaga cagaaaagaa tcgataagat cagcgacgtg 780 tctacaatcg tgccatacat cggccctgcc ctgaatatcc ccaagaagcg gaacaacttc 840 accgtcagct tctggctgag agtgcctaag gtgtccgcca gccacctgga gtga 894 <210> 58 <211> 870 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 M - TTTh <400> 58 atggtctaca agactctctt cgctctttgc atcttaactg caggatggag ggtacagagt 60 gctgattcca acggtaccat caccgttgaa gaattgaaga agttgctgga acaatggaac 120 ttggtcattg gttttttatt cttgacttgg atctgtttgt tgcaattcgc ttacgctaac 180 agaaaccgtt tcctctacat tatcaagttg atcttcctat ggttattgtg gccagtcact 240 ttggcttgtt tcgttttggc cgcagtttac agaatcaact ggattacagg tggtattgct 300 attgctatgg cctgtctggt gggcctgatg tggctgagct acttcatcgc ctcttttaga 360 ctgtttgcca gaacccggag catgtggtcc ttcaaccccg agacaaacat cctgctgaat 420 gtgcccctgc acggcacaat cctgacaaga cctctgcttg agagcgagct ggtgatcggc 480 gccgtgatcc tgaggggcca tctgcggatt gccggacacc acctgggcag atgcgacatc 540 aaggacctgc ctaaggaaat caccgtggct acaagccgca ccctgtccta ctacaaactc 600 ggcgccagcc aaagagtggc cggcgacagc ggcttcgccg cctatagcag ataccggatc 660 ggcaactaca agctgaacac cgaccactct agcagctctg ataatatcgc cctgctggtt 720 cagagacaga aaagaatcga taagatcagc gacgtgtcta caatcgtgcc atacatcggc 780 cctgccctga atatccccaa gaagcggaac aacttcaccg tcagcttctg gctgagagtg 840 cctaaggtgt ccgccagcca cctggagtga 870 <210> 59 <211> 870 <212> RNA <213> Artificial Sequence <220> <223> MLP1 SP - SARS-CoV-2 M - TTTh <400> 59 atggtatata aaactttatt tgctttatgt attttaactg ctggttggcg tgtacaatct 60 gctgattcca acggtaccat caccgttgaa gaattgaaga agttgctgga acaatggaac 120 ttggtcattg gttttttatt cttgacttgg atctgtttgt tgcaattcgc ttacgctaac 180 agaaaccgtt tcctctacat tatcaagttg atcttcctat ggttattgtg gccagtcact 240 ttggcttgtt tcgttttggc cgcagtttac agaatcaact ggattacagg tggtattgct 300 attgctatgg cctgtctggt gggcctgatg tggctgagct acttcatcgc ctcttttaga 360 ctgtttgcca gaacccggag catgtggtcc ttcaaccccg agacaaacat cctgctgaat 420 gtgcccctgc acggcacaat cctgacaaga cctctgcttg agagcgagct ggtgatcggc 480 gccgtgatcc tgaggggcca tctgcggatt gccggacacc acctgggcag atgcgacatc 540 aaggacctgc ctaaggaaat caccgtggct acaagccgca ccctgtccta ctacaaactc 600 ggcgccagcc aaagagtggc cggcgacagc ggcttcgccg cctatagcag ataccggatc 660 ggcaactaca agctgaacac cgaccactct agcagctctg ataatatcgc cctgctggtt 720 cagagacaga aaagaatcga taagatcagc gacgtgtcta caatcgtgcc atacatcggc 780 cctgccctga atatccccaa gaagcggaac aacttcaccg tcagcttctg gctgagagtg 840 cctaaggtgt ccgccagcca cctggagtga 870

Claims

IgE(Immunoglobulin E), 알부민(albumin), 인터페론 감마(IFN-γ), 인자 IX(factor IX) 및 뮤신-유사 단백질 1(mucin-like protein 1)으로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 시그널 펩타이드를 인코딩하는 핵산; 및 항원을 인코딩하는 핵산을 포함하는, 바이러스 감염증 또는 암의 예방 또는 치료용 핵산 분자.
제1항에 있어서,
상기 시그널 펩타이드를 인코딩하는 핵산은 서열번호 2 내지 4, 6 내지 8, 10 내지 12, 14 내지 16, 및 18 내지 20으로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제1항에 있어서,
상기 항원은 코로나바이러스, 종양바이러스(oncovirus), 종양-특이적 항원(cancer tumor-specific antigen), 종양-연관 항원(tumor-associated antigen) 및 신항원 에피토프(neoantigen epitope)로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 것인, 핵산 분자.
제1항에 있어서,
상기 항원은 코로나바이러스 유래의 스파이크 단백질 및 막 단백질로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제1항에 있어서,
상기 항원을 인코딩하는 핵산은 서열번호 22 내지 25, 및 27 내지 30으로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제1항에 있어서,
상기 핵산 분자는 Th 세포 에피토프를 인코딩하는 핵산을 포함하는, 핵산 분자.
제6항에 있어서,
상기 Th 세포 에피토프는 파상풍 톡소이드(Tetanus toxoid), 디프테리아 톡소이드(DTH toxoid) 및 백일해 톡소이드(Purtussis toxoid)로 이루어진 그룹에서 선택된 하나 이상으로부터 유래된 것인, 핵산 분자.
제6항에 있어서,
상기 Th 세포 에피토프를 인코딩하는 핵산은 서열번호 45 및 46으로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제1항에 있어서,
상기 바이러스 감염증은 코로나바이러스 감염증인, 핵산 분자.
제9항에 있어서,
상기 코로나바이러스 감염증은 중증 급성 호흡기 증후군(Severe Acute Respiratory Syndrome, SARS), 중동 호흡기 증후군(Middle East Respiratory Syndrome, MERS) 및 코로나바이러스감염증-19(Coronavirus disease-2019, COVID-19)으로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제1항에 있어서,
상기 암은 고형암종 및 혈액암종으로 이루어진 그룹에서 선택된 하나 이상인, 핵산 분자.
제11항에 있어서,
상기 암은 위암, 폐암, 간암, 대장암, 결장암, 신장암, 소장암, 췌장암, 뇌종양, 골암, 피부암, 표피암종, 편평세포암종, 유방암, 경화성선증, 두경부암, 식도암, 인두암, 갑상선암, 부갑상선암, 신경 모세포종, 흑색종, 육종, 전립선암, 자궁암, 자궁경부암, 난소암, 질암, 외음암, 요도암, 방광암, 음경암, 고환암, 혈액암, 혈관육종, 백혈병, 림프종, 섬유선종, 및 이들의 전이암으로 이루어진 군으로부터 선택되는 하나 이상인, 핵산 분자.
제1항의 핵산 분자를 포함하는, 바이러스 감염증 또는 암의 예방 또는 치료용 백신 조성물.
제13항에 있어서,
상기 핵산 분자는 전달체에 담지 또는 연결된 것인, 백신 조성물.
제14항에 있어서,
상기 전달체는 리포좀 기반 전달체, 지질 기반 전달체, 폴리머 기반 전달체 및 지질-폴리머 하이브리드 나노입자로 이루어진 그룹에서 선택된 하나 이상인, 백신 조성물.
제15항에 있어서,
상기 전달체는 리포좀(liposome), 파이토좀(phytosome), 에토좀(ethosome), 지질 나노입자(lipid nanoparticle), 지질-유사 나노입자(lipid-like nanoparticle), 지질 에멀젼(lipid emulsion), 리포플렉스(lipoplex), 지질 미셸(lipid micelle), 폴리머좀(polymersome), 폴리머성 나노입자(polymeric nanoparticle), 덴드리머(dendrimer), 나노스피어(nanophere), 폴리플렉스(polyplex), 폴리머성 미셸(polymeric micelle), 지질-폴리머 하이브리드 나노입자(lipid-polymer hybrid nanoparticle), 양이온성 나노에멀젼(cationic nanoemulsion), 음이온성 나노에멀젼(anionic nanoemulsion) 및 리포폴리플렉스(lipopolyplex)로 이루어진 그룹에서 선택된 하나 이상인, 백신 조성물.