KR20220040423A - 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 - Google Patents

재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 Download PDF

Info

Publication number
KR20220040423A
KR20220040423A KR1020210125995A KR20210125995A KR20220040423A KR 20220040423 A KR20220040423 A KR 20220040423A KR 1020210125995 A KR1020210125995 A KR 1020210125995A KR 20210125995 A KR20210125995 A KR 20210125995A KR 20220040423 A KR20220040423 A KR 20220040423A
Authority
KR
South Korea
Prior art keywords
ser
thr
leu
val
gly
Prior art date
Application number
KR1020210125995A
Other languages
English (en)
Inventor
서기원
권태우
김은솜
김치용
이윤재
홍승혜
Original Assignee
에스케이바이오사이언스(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이바이오사이언스(주) filed Critical 에스케이바이오사이언스(주)
Publication of KR20220040423A publication Critical patent/KR20220040423A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Communicable Diseases (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Oncology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pulmonology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질 및 이를 포함하는 사스-코로나바이러스-2 감염 예방 또는 치료용 약학 조성물을 제공한다.

Description

재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 {Vaccine composition for preventing or treating infection of SARS-CoV-2 comprising a recombinant protein}
본 발명은 사스-코로나바이러스-2 (SARS-CoV-2) 감염증 예방 또는 치료용 백신 조성물에 관한 것으로, 더욱 구체적으로 사스-코로나바이러스-2 (SARS-CoV-2)로부터 유래된 폴리펩타이드를 포함하는 재조합 단백질을 이용한 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물에 관한 것이다.
사스-코로나바이러스-2 (SARS-CoV-2)는 중증 급성 호흡기 증후군 코로나바이러스 2 (Severe Acute Respiratory Syndrome Coronavirus 2) 또는 코비드 19 (COVID19)로 불리며, 한국에서는 코로나 19로 명명된다. 사스-코로나바이러스-2 는 2019년 12월 12일 우한 화난수산시장에서 처음 발견된 바이러스로, RNA 바이러스이며, 인간대 인간 (Human-to-human) 감염이 확인되었다. SARS-CoV-2는 ACE2 (Angiotensin Converting Enzyme2) 수용체를 통해 숙주세포의 표면에 강하게 부착하는 것으로 알려져 있으며, SARS-CoV-2의 스파이크단백질의 RBD(Receptor-Binding Domain)는 ACE2 수용체와 결합하는데 이용되는 것으로 알려져 있다.
사스-코로나바이러스-2는 생물안전 3등급 연구시설 (BSL-3 facility)에서 취급이 필요한 바이러스이며, 바이러스의 재생산지수(R0)를 1.4~3.9로 추정하고 있다. 이는 환자 1명이 최소 1.4명에서 최대 3.9명에게 바이러스를 옮길 수 있다는 것을 의미하여, 즉, 사스-코로나바이러스-2에 의한 감염병 통제가 상당히 어려운 것으로 추정하고 있으며, 2020년 3월 31일 기준으로 전세계 감염자 785,867명, 사망자 37,827명 정도로 집계되었다.
상기 바이러스 감염 후 2~14일간 발열, 호흡곤란, 신장 및 간 손상, 기침, 폐렴 등의 증상이 관찰되며, 아직까지 치료제는 개발되지 못하고 있는 상태이다.
치료제가 개발되지 못한 상황에서 감염을 예방하고, 지역사회에의 확산을 방지하기 위해 백신에 대한 연구가 절실하다. 해당 유행바이러스는 보통 고위험 병원체이기 때문에 불활화 및 생백신의 경우는 백신물질의 생산 및 인체투여에서 위험성 높다. 특히, 생백신의 경우 약독화 과정과 안전성 입증까지 매우 오랜 기간이 걸린다. 본 발명의 발명자들은 범용성, 안전성, 효력, 상용화의 측면에서 현재 대유행 신종감염병에 적용 가능한 재조합단백질 백신에 대해 연구하고 본 발명을 완성하게 되었다.
한편 재조합 단백질을 이용한 단백질 백신의 경우 발현 컨스트럭트로부터 수득하는 단백질의 수율이 낮아지는 문제가 종종 발생되었고, 이에 단백질 수율을 개선하고, 재조합 단백질의 구조를 안정화시켜 항체생성율을 증가시킨 새로운 형태의 재조합 단백질 백신 연구가 필요하게 되었다.
따라서 본 발명이 해결하고자 하는 과제는 본 발명은 상기와 같은 문제를 해결하기 위하여 사스-코로나바이러스-2의 감염증 예방 또는 치료를 위한 새로운 항원, 상기 항원을 포함하는 백신 조성물 또는 이의 제조 방법을 제공하고자 한다. 본 발명은 재조합 단백질 백신, 이를 이용한 사스-코로나바이러스-2의 감염증을 예방 또는 치료하는 방법 또는 상기 재조합 단백질 백신의 사스-코로나바이러스-2 감염증 예방 또는 치료 용도를 제공하고자 한다.
TM(transmembrane domain)이 제거된 S 단백질을 얻기 위한 발현 컨스트럭트는 단백질 수율이 향상된다는 이점이 있으나, 스파이크 단백질과 유사한 trimer 형성이 되지 않는 문제로 RBD 항원의 노출이 불완전하여 면역원성 유도에 효과적이지 않을 수 있기에 이러한 문제를 해결하고자 하였다. 서열번호 1의 펩타이드의 안정화 및 삼량체화를 형성하기 위해 외인성 폴리펩타이드 (바람직하게 도메인 (foldon)-P2)를 결합하여 항체 생성율 및/또는 세포성 면역 반응성을 향상시키고자 한다.
상기 과제를 해결하기 위해, 본 발명의 일 양태는 사스-코로나바이러스-2 (SARS-CoV-2) 감염증 예방 또는 치료용 재조합 항원 단백질, 상기 항원 단백질 발현용 컨스트럭트, 및 상기 재조합 항원 단백질을 포함하는 백신 조성물을 제공한다.
본 발명은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편 또는 유사체에 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질을 제공할 수 있다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 상기 사스-코로나바이러스-2 (COVID-19) 감염 예방용 조성물, 사스-코로나바이러스-2에 대한 면역원 생성을 위한 조성물, 사스-코로나바이러스-2에 대한 항체 생성용 조성물, 또는 백신 조성물을 위해 제공될 수 있다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 상기 사스-코로나바이러스-2 (COVID-19) 감염 예방용도, 사스-코로나바이러스-2에 대한 면역원 생성을 위한 용도, 사스-코로나바이러스-2에 대한 항체 생성용도, 또는 백신 용도를 위해 제공될 수 있다.
상기 외인성 폴리펩타이드는 '폴돈 도메인', 'P2 도메인', 또는 '폴돈 도메인과 P2 도메인이 연결된 도메인(즉, 폴돈-링커- P2 도메인)'으로 이루어진 군에서 선택된 어느 하나를 포함할 수 있다. 구체적으로 일 양태는 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드, 및 상기 폴리펩타이드의 C 말단에 선택적으로 폴돈 도메인 아미노산 서열; P2 도메인 아미노산 서열; 또는 폴돈 도메인 아미노산 서열과 P2 도메인 아미노산 서열이 함께 연결된, 사스-코로나바이러스-2 감염증 예방 또는 치료용 재조합 항원 단백질을 제공할 수 있다.
일 구현예에서 상기 재조합 항원 단백질은 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드(이하, '폴리펩타이드' 또는 '서열번호 1의 폴리펩타이드'로 칭한다)일 수 있다. 다른 구현예에서, 상기 재조합 항원 단백질은 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드의 C 말단에 폴돈 도메인 아미노산 서열이 연결될 수 있고, P2 도메인 아미노산 서열이 연결될 수 있고, 또는 폴돈 도메인 아미노산 서열과 P2 도메인 아미노산 서열이 함께 연결되어 제공될 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 4, 서열번호 5, 또는 서열번호 6으로 표시되는 아미노산 서열을 가질 수 있다.
상기 '연결되다'는 용어의 의미는 직접적으로 아미노산 서열이 이어지는 경우뿐만 아니라, 링커에 의해 이어지는 경우도 포함되며, 바람직하게 상기 폴돈 도메인 및 상기 P2 도메인은 링커에 의해 연결될 수 있다. 상기 '함께 연결되다'는 의미는 상기 폴돈 도메인의 C 말단에 P2 도메인이 링커로 연결되어 제공된다는 의미를 포함한다.
상기 '폴돈 도메인(foldon domain)'은 당업자에게 공지된 임의의 폴돈 서열을 가질 수 있다. 바람직하게 박테리오파지 T4 피브리틴의 폴돈(foldon)이 포함될 수 있으며, 서열번호 3의 아미노산 서열로 표현된다. 바이러스 표면의 스파이크 단백질은 trimer를 형성하고 있지만 TM(transmembrane domain)이 제거된 S-ectodomain은 안정적으로 trimer를 형성하지 못 하고 monomer나 dimer로 존재하기도 한다. 상기 폴돈 도메인은 S-ectodomain 항원이 안정적으로 trimer를 형성하도록 유도하여 바이러스 표면의 S와 유사한 구조를 이루도록 도우며, 항원 크기를 증가시키고 이로 인한 항원성을 증가시킬 수 있다.
상기 'P2 도메인' 은 T cell epitope의 하나로, Tetanus Toxoid Epitope P2 도메인을 의미한다. 본 원에서 서열번호 2의 아미노산 서열로 표현된다. 상기 P2 도메인이 결합되어 더 향상된 면역 증강 효과를 나타낼 수 있다.
상기 '링커'는 서열번호 1의 폴리펩타이드와 상기 도메인들을 연결시켜주거나, 상기 도메인들간의 연결이 가능하게 하며, 상기 링커는 적어도 4개의 아미노산 잔기로 이루어질 수 있으며, 예를 들어 16개 아미노산 이하 길이이며 바람직하게는 6개 이하 아미노산으로 이루어질 수 있다. 링커에 사용되는 아미노산은 G(Gly, 글리세린), S(Ser, 세린), 및 A(Ala, 알라닌) 중 하나 이상이며 바람직하게는 Gly-Ser-Gly-Ser-Gly (GSGSG), Gly-Ser-Ser-Gly (GSSG), Gly-Ser-Gly-Gly-Ser (GSGGS), Gly-Ser-Gly-Ser (GSGS), 및 Gly-Ser-Gly-Ser-Ser-Gly (GSGSSG)로 이루어진 군에서 선택된 어느 하나 이상의 펩타이드 링커일 수 있고, 바람직하게 본 발명의 목적상 GSGSG 또는 GSGGS 펩타이드 링커일 수 있다. 상기 링커로 연결될 때 안정적인 구조를 형성할 수 있다.
본원 명세서 내에 기재된 '기능적 단편'은 상기 재조합 단백질 항원이 갖는 기능을 나타내면서도 상기 재조합 단백질 항원 또는 이를 코딩하는 (폴리)뉴클레오티드 서열과 서열 상동성이 적어도 75%, 80%, 90%, 95%, 또는 99% 이상인 단백질, 또는 (폴리)뉴클레오티드를 의미하는 것으로 이해될 수 있다. '유사체'는 본 발명의 폴리펩타이드 또는 (폴리)뉴클레오티드가 갖는 기능 또는 효과와 유사하면서 상기 재조합 단백질 항원 또는 이를 코딩하는 (폴리)뉴클레오티드 서열과 서열 상동성이 적어도 75%, 80%, 90%, 95%, 또는 99% 이상인 단백질, 또는 (폴리)뉴클레오티드를 의미하는 것으로 이해될 수 있다.
상기 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드는 도 1을 기준으로, 사스-코로나바이러스-2의 스파이크 단백질 (spike protein)의 전장 아미노산 서열에서 heptad repeat 2 (HR2) 이하의 영역이 절단되어 얻어질 수 있으며, 특히 야생형 COVID-19의 S 단백질을 이루는 아미노산 서열의 1147 이후 부분을 제거하여 얻을 수 있다. HR2 이하의 영역이 절단됨으로 인해, 상기 폴리펩타이드는 S 단백질의 transmembrane domain (TM) 및 cytoplasmic domain (CP)이 함께 상실된다. 본 발명의 발명자들은 서열번호 1로 표시되는 상기 폴리펩타이드를 암호화하는 서열은 단백질 발현 시스템에서 우수한 발현 수율을 갖는다는 것을 확인하게 되었다. 이를 통해 항원 수득율을 증가시킬 수 있다. SP(시그널 펩타이드)는 발현 시스템의 분비과정에서 떨어지는 특성상 면역원성 조성물 또는 백신에서 제외될 수 있다.
본 발명의 일 양태는 상기 폴리펩타이드가 갖는 적어도 하나의 아미노산에 변이가 일어난 재조합 항원 단백질을 포함한다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드를 포함하는 폴리펩타이드 또는 단백질에 적어도 하나 이상의 아미노산이 치환된 변이를 가질 수 있다. 상기 변이는 아미노산의 치환, 결실, 부가 등이 포함되나, 바람직하게 치환을 포함한다. 상기 서열번호 1의 폴리펩타이드가 갖는 아미노산 서열이 치환됨으로 인해 항원 수득율을 증가시킬 수 있다. 상기 치환이라 함은 원래 가지고 있던 아미노산 서열이 다른 아미노산 서열로 대체되는 것을 의미하는 것으로 이해될 수 있다. 적어도 하나의 아미노산이 치환될 수 있으며, 바람직하게 1개 내지 11개의 아미노산이 치환될 수 있고, 예를 들어, 2개 내지 10개의 아미노산이 다른 아미노산으로 치환될 수 있으며, 또 다른 예는 9개, 8개, 7개, 6개, 5개, 4개, 3개 또는 2개의 아미노산이 치환될 수 있다.
바람직하게 상기 변이는 상기 서열번호 1의 폴리펩타이드의 C 말단에 폴돈 도메인이 연결된 재조합 항원 단백질(서열번호 5, SK-S-trimer) 또는 서열번호 1의 폴리펩타이드의 C 말단에 폴돈 도메인과 P2 도메인이 함께 연결된 재조합 항원 단백질(서열번호 6, SK-S-trimer-P2)에서 추가로 더 치환 변이가 일어나 얻어질 수 있다.
일 구현예에서 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, iii) 카텝신(Cathepsin) L 절단 부위 변이, 및 iv) S2 서브유닛 변이로 이루어진 군에서 선택된 어느 하나 이상의 변이를 포함할 수 있다.
i) 2 프롤린 변이
본 발명의 일 양태에서 상기 i) 2 프롤린 변이는 서열번호 1의 폴리펩타이드의 973번 위치의 아미노산 라이신(K)이 프롤린(P)으로 치환되고, 974번 위치의 아미노산 발린(V)이 프롤린(P)으로 치환된 변이를 가질 수 있으며, 이는 각각 K973P 및 V974P로 표현될 수 있다. 이는 서열번호 1을 기준으로 973번째 아미노산이 K에서 P로, 974번째 아미노산이 V에서 P로 치환되었음을 의미한다. 구체적으로 상기 서열번호 1의 폴리펩타이드의 973번 위치의 라이신(K) 아미노산이 프롤린(P) 아미노산으로 치환되고, 974번 위치의 발린(V) 아미노산이 프롤린(P) 아미노산으로 치환된 변이를 가질 수 있다. 상기와 같은 치환으로 항원이 prefusion 형태로 안정화될 수 있고, 항원 수득율을 향상시키고, 이는 중화항체가 유도 능력을 향상시킬 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 7 (SK- S-Trimer-2proline) 및 서열번호 8(SK-S-Trimer-P2-2proline) 로 표현된 아미노산 서열을 가질 수 있다.
ii) 퓨린 (furin) 절단 부위 변이
상기 ii) 퓨린 (furin) 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 669-672에 대응하는 아미노산 RRAR이 GSAG 또는 HHAH로 치환된 변이로 이해될 수 있다. 상기 퓨린 절단 부위는 숙주세포에 존재하는 퓨린 단백질 또는 퓨린 유사 단백질 분해효소 (이하, 퓨린)에 의해 인식 및 절단이 일어나는 스파이크 단백질의 부위를 의미하며, 바람직하게 스파이크 단백질의 669-672번 위치의 아미노산 서열 RRAR이 여기에 해당한다. 상기 퓨린 절단 부위에 아미노산의 치환이 일어나는 경우 단백질 수율이 증가되고, 단백질의 안정성을 향상시킬 수 있다. 바람직하게 상기 아미노산 서열은 669-672번 위치의 아미노산 서열 RRAR은 GSAG으로 또는 HHAH으로 치환된 형태를 포함한다. 바람직하게 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 퓨린(furin) 절단 부위의 아미노산 치환은 i) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 세린(S) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되거나(즉, R669G, R670S, 또는 R672G), 또는 ii) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환(즉, R669H, R670H, 또는 R672H)된 형태를 포함한다. 상기와 같은 위치에서 상기와 같은 서열로 변이를 유발하여 단백질 안정성을 향상시키고, 중화 항체가 유도능 증가로 면역 반응을 증가시킬 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 9 (SK-S-trimer-P2(GSAG)-2proline) 또는 서열번호 11 (SK-S-trimer-P2-(HHAH)-2proline) 로 표현된 아미노산 서열을 갖는다.
iii) 카텝신(Cathepsin) L 절단 부위 변이
상기 iii) 카텝신(Cathepsin) L 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 681-682에 대응하는 아미노산 AY가 GS로 치환될 수 있다. 구체적으로 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 카텝신(Cathepsin) L 절단 부위의 아미노산 치환은 상기 서열번호 1의 아미노산 서열의 681번 위치의 알라닌(A) 아미노산이 글리신(G) 아미노산으로 치환되고, 682번 위치의 티로신(Y) 아미노산이 세린(S) 아미노산으로 치환된, 재조합 항원 단백질을 포함한다.
상기 카텝신(Cathepsin) L 절단 부위는 스파이크 단백질에서 숙주세포에 존재하는 카텝신 L 단백질에 의해 인식 또는 절단이 일어나는 부위를 의미하며, 바람직하게 스파이크 단백질의 681번 및 682번 위치의 아미노산 서열 알라닌(A) 및 티로신(Y)에서 변이를 유발할 수 있다. 상기 카텝신(Cathepsin) L 절단 부위에서 아미노산의 치환이 일어나는 경우 단백질 수율이 증가되고, 단백질의 안정성을 향상시킬 수 있다. 바람직하게 상기 아미노산 서열은 681-682번 위치의 아미노산 서열 알라닌(A) 및/또는 티로신(Y)은 각각 글리신(G) 및/또는 세린(S)으로 치환된 형태를 포함한다. 상기 글리신(G) 및/또는 세린(S)로의 치환은 주변 구조에 미치는 영향이 적고, 안정적인 스파이크 단백질 구조를 유지할 수 있다. 바람직하게 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 카텝신(Cathepsin) L 절단 부위의 아미노산 치환은 상기 서열번호 1의 아미노산 서열의 681번 위치의 알라닌(A) 아미노산이 글리신(G) 아미노산으로 치환되고, 682번 위치의 티로신(Y) 아미노산이 세린(S) 아미노산으로 치환된 형태를 포함한다(즉, A681G, Y682S). 상기와 같은 위치에서 상기와 같은 서열로 변이를 유발하여 단백질 안정성을 향상시키고 수율을 증가시킨다. 바람직하게 상기 재조합 항원 단백질은 서열번호 10 (SK-S-trimer-P2(GSAG/Ca)-2proline)으로 표현된 아미노산 서열을 갖는다.
iv) S2 서브유닛 변이
상기 S2 서브유닛 변이는 S 단백질의 S2 서브유닛을 형성하는 아미노산 중 적어도 4개의 아미노산이 치환된 것으로, F804P, A879P, A886P, 및 A929P 변이를 포함할 수 있다. 상기 서열번호 1의 아미노산 서열의 4개의 아미노산이 더 치환되어, 서열번호 1 기준으로 804, 879, 886, 및 929 위치에 존재하는 아미노산이 각각 페닐알라닌(F)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로 더 치환될 수 있다. 이러한 아미노산의 치환으로 더욱 더 항원 수득율이 증가될 수 있고, 단백질 안정성이 향상된다. 바람직하게, 본 발명의 일 실시예는 i) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 세린(S) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 여기에 추가로 상기 서열번호 1의 아미노산 서열의 4개의 아미노산이 더 치환되어, 804, 879, 886, 및 929 위치의 아미노산이 각각 페닐알라닌(F)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로 치환된 재조합 항원 단백질을 포함한다. 상기 재조합 항원 단백질은 서열번호 12로 표현되는 아미노산 서열을 갖는다.
다른 실시양태에서 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 퓨린(furin) 절단 부위, 카텝신(Cathepsin) L 절단 부위 또는 이들 모두에 아미노산 치환이 발생될 수 있다. 바람직하게 상기 변이는 예를 들어, 서열번호 7을 기준으로 폴리펩타이드의 퓨린(furin) 절단 부위(cleavage site), 및/또는 카텝신(Cathepsin) L 절단 부위에 해당하는 아미노산 서열이 새로운 아미노산으로 치환되어 얻어질 수 있다.
본 발명의 발명자들은 SARS-CoV-2의 스파이크 단백질의 RBD 영역만으로는 달성하기 어려운, 바이러스 표면 스파이크 단백질과 유사한 3차, 4차 구조 형성, 항원 단백질의 prefusion 형태 구조안정화, 항원 크기 증가, 면역원성 증가, 중화항체가 유도능 증가 등이 달성됨을 확인하고 본 발명을 완성하게 되었다.
본 명세서에서 사용된 용어 "재조합 항원 단백질"은 SARS-CoV-2 감염증 예방 또는 치료를 위한 항원으로서, 구체적으로, SARS-CoV-2의 스파이크 단백질의 특정 위치에서 선별된, 특정 구간의 아미노산 서열을 포함하는 단백질을 의미한다. 상기 재조합 항원 단백질은 SARS-CoV-2의 스파이크 단백질의 일부 영역의 절단, 외래 유전자와의 결합 등을 통해 인위적으로 만들어진 단백질을 의미한다.
본 발명은 상기 정의한 재조합 단백질 항원을 암호화하는 뉴클레오타이드 서열을 제공하며, 상기 재조합 단백질 항원 발현을 위한 항원 발현용 컨스트럭트를 제공한다. (a) 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 적어도 1종 이상의 외인성 폴리펩타이드가 연결된 재조합 사스-코로나바이러스-2 항원 단백질을 코딩하는 뉴클레오타이드 서열; 또는 서열번호 4 내지 12로 이루어진 재조합 항원 단백질을 코딩하는 뉴클레오타이드 서열, 및 (b) 상기 재조합 사스-코로나바이러스-2 항원 단백질을 세포로부터 분비시키기 위한 시그널 서열을 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트를 제공할 수 있다. 본 발명의 일 구현예는 사스-코로나바이러스-2 감염증 예방 또는 치료용 재조합 항원 단백질 생산을 위한 발현 컨스트럭트를 제공한다. 바람직하게 서열번호 4 내지 12로 표현되는 아미노산 서열 중에서 선택된 어느 하나 이상의 서열을 갖는 재조합 항원 단백질을 발현하기 위한, 발현용 컨스트럭트를 제공한다. 바람직하게 상기 발현 컨스트럭트는 서열번호 13 내지 서열번호 32로 이루어진 군에서 선택된 어느 하나의 뉴클레오타이드 서열을 갖는다. 상기 뉴클레오타이드 서열을 갖는 발현 컨스트럭트는 단백질 수득율이 높고, 안정적인 구조를 갖는 단백질을 생산할 수 있다. 바람직하게 서열번호 13 내지 서열번호 22 중에서 선택된 어느 하나의 서열을 갖는 뉴클레오타이드는 중국 햄스터의 난소세포(Chinese Hamster ovary cell, CHO) 포유동물 발현 시스템을 통해, 서열번호 23 내지 서열번호 32 중에서 선택된 어느 하나의 서열을 갖는 뉴클레오타이드는 배큘로바이러스 발현 시스템(BEVS)을 통해 본 발명의 재조합 항원 단백질을 얻을 수 있다.
본 명세서에서 용어 "발현 컨스트럭트(expression construct)"는 세포내에서 단백질 발현을 위한 최소의 엘리먼트(elemnet)만을 포함하는 핵산분자를 의미하는 것으로 이해된다.
상기 발현 컨스트럭트는 상기 항원 단백질의 분비를 돕는 시그널 서열을 코딩하는 뉴클레오티드 서열과 연결되어 제공될 수 있다.
본원에 사용된 용어 "시그널 펩타이드" 또는 "시그널 서열"은 본원에서 호환적으로 사용되고 숙주 세포에서 단백질을 분비 경로로 지시하는, 새로 합성된 폴리펩타이드 사슬의 N-말단에 존재하는 짧은 펩타이드 (일반적으로 5-30개 아미노산 길이를 갖지만, 이에 제한되지 않는다.)를 의미한다. 상기 시그널 서열은 자체의 시그널 펩타이드 또는 본원에서 언급된 시그널 펩타이드는 단백질 분비 과정에서 제거된다. 상기 '자체 시그널 서열'은 SARS-CoV-2의 스파이크 단백질이 갖는 시그널 서열을 의미한다. 상기 '이종 유래의 시그널 펩타이드 또는 시그널 서열'이라 함은 SARS-CoV-2의 스파이크 단백질이 갖는 시그널 서열이 아닌, 외부에서 도입되거나, 새로 합성된 시그널 서열을 의미한다. 바람직한 이종 유래의 시그널 서열은 Honeybee melittin signal peptide, murine phosphatase signal peptide, 및/또는 인간 알부민 시그널 펩타이드이며, 바람직하게 본 발명의 목적상 인간 알부민 시그널 펩타이드를 사용할 수 있다. 바람직하게 상기 뉴클레오타이드 서열은 DNA 서열이다.
본 발명의 재조합 항원 단백질을 적합한 발현 벡터를 사용하여, 원핵 또는 진핵 발현 시스템에서 클로닝 및 발현에 의해 제조할 수 있다. 당해 분야에 공지된 임의의 방법을 사용할 수 있다. 바람직하게 본 발명의 목적 및 단백질 발현율 등을 고려하여, BEVS, CHO 또는 E.coli 발현시스템을 사용할 수 있으며, 바람직하게 BEVS 및/또는 CHO 발현 시스템을 사용할 수 있다. 벡터는 임의의 적절한 유형일 수 있고, 비제한적으로 파아지, 바이러스, 플라스미드, 파지미드(phagemid), 코스미드(cosmid), 백미드(bacmid) 등을 포함할 수 있다. 예를 들어 본 발명의 항원을 암호화하는 DNA 분자를 당해 분야에 널리 공지된 기법에 의해 적합하게 제작된 발현 벡터에 삽입한다.
본 발명의 일 구현예에 따른 발현 컨스트럭트는 배큘로바이러스 발현 시스템(BEVS)을 이용한다.
배큘로바이러스 발현 시스템은 업계에서 이미 재조합 단백질 생산을 위해 널리 사용되고 있는 것을 제한없이 사용할 수 있다. 예를 들어, pBAC4x-1(Novagen)과 같은 상업적으로 유용한 배큘로바이러스 벡터가 사용될 수 있다. 본 발명에서 사용하는 적당한 배큘로바이러스 프로모터는 문헌에 잘 알려져 있다. 배큘로바이러스 프로모터는 폴리헤드린(polyhedrin), p10 프로모터 등 일반적으로 사용되는 프로모터가 사용될 수 있다. 상기 항원 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 발현 컨스트럭트가 포함된 배큘로바이러스 벡터를 대장균에 형질전환하여 얻어진 재조합 백미드 (Bacmid), 및 이를 게놈으로 포함하는 재조합 배큘로바이러스도 제공된다. 상기 재조합 백미드를 포함하거나, 상기 재조합 배큘로바이러스로 형질감염된 숙주세포도 본 발명의 범위에 포함된다.
본 발명의 항원 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 DNA 분자들은 전사 및 번역 조절 신호를 갖는 벡터에 삽입시킬 수 있다. 상기 도입된 DNA에 의해 안정하게 형질전환된 세포를, 또한 상기 발현 벡터를 함유하는 숙주 세포의 선택을 허용하는 하나 이상의 마커를 도입시킴으로써 선택할 수 있다. 상기 마커는 예를 들어 항생제 내성, 결핍 영양소 합성 유전자 등을 제공할 수 있다. 일단 상기 구조물을 함유하는 벡터 또는 DNA 서열을 발현을 위해 제조하였으면, 상기 DNA 구조물을 다양한 적합한 수단들 중 어느 하나, 즉 형질전환, 형질감염, 접합, 원형질체 융합, 일렉트로포레이션, 칼슘 포스페이트-침전, 직접 미세주입 등에 의해 적합한 숙주 세포에 도입시킬 수 있다.
바람직한 숙주 세포는 진핵 숙주 세포로, 예를 들어, 곤충 세포로 Baculovirus 발현시스템을 이용하는 Sf9, Sf21과 같은 Spodopterafrugiperda (Sf) 세포, 하이 파이브 세포와 같은 Trichoplusia ni 세포 및 Drosophila S2 세포들을 포함할 수 있고, 포유류 세포로 중국 햄스터 난소(CHO) 세포를 포함할 수 있다. 적당한 숙주 세포주는 임의의 중국 햄스터 난소 (CHO) 세포주일 수 있다. '숙주세포'라는 용어는 배양액에서 성장할 수 있고 목적하는 단백질 재조합 산물 단백질을 발현할 수 있는 세포를 지칭한다. 적당한 세포주로는, 예컨대, CHO K1, CHO pro3-, CHO DG44, CHO P12 등을 포함할 수 있으며, 이에 제한되지 않는다.
상기 숙주 세포를 통해 우수한 발현율의 재조합 항원 단백질을 얻을 수 있다. 비제한적인 예로 본 발명의 목적을 저해하지 않는 범위 내에서 상기 진핵 숙주 세포의 예로 효모, 조류, 식물, 꼬마선충(또는 선충) 등을 포함할 수 있고, 원핵 숙주 세포들은, 예를 들어, 대장균(E. coli, B. subtilis), 살모넬라티피균(Salmonella typhi) 및 마이코박테리아와 같은 박테리아 세포를 포함할 수 있다. 벡터의 도입 후, 상기 숙주 세포를 일반배지 또는 선택성 배지(벡터 함유 세포의 성장을 위해 선택한다)에서 증식시킨다. 상기 클로닝된 유전자 서열(들)의 발현 결과 목적하는 단백질이 생산된다. 상기 재조합 항원 단백질의 정제를 상기 목적으로 공지된 방법들 중 어느 하나, 즉 추출, 침전, 크로마토그래피, 전기영동 등을 수반하는 임의의 통상적인 과정에 의해 수행할 수 있다.
본 발명의 또 다른 태양은 상기 재조합 항원 단백질의 제조 방법을 제공하며, 상기 방법은 본 발명의 뉴클레오타이드 서열을 함유하는 벡터로 형질전환시킨 숙주 세포를 배양하고 목적하는 생성물을 단리함을 포함할 수 있다.
본 발명의 다른 구현예는 사스-코로나바이러스-2 감염증 예방 또는 치료를 위한, 상기 재조합 단백질 항원의 새로운 용도를 제공하며, 상기 항원을 개체에 투여하여 사스-코로나바이러스-2 감염을 예방 또는 치료하는 사스-코로나바이러스-2 감염증 예방 방법을 제공한다.
본 발명의 또 다른 구현 예에서는 본 발명에 따른 상기 재조합 항원 단백질을 유효성분으로 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물을 제공한다. 상기 '사스-코로나바이러스-2 감염증'이라 함은 사스-코로나바이러스-2 자체의 감염뿐만 아니라, 상기 바이러스의 감염으로부터 발생되는 여러가지 병증 (예를 들어, 호흡기 질환, 폐렴 등)을 넓게 포함하는 개념으로 이해될 수 있다. 본 발명에서 상기 백신은 당업계에서 잘 알려진 통상적인 방법으로 제조될 수 있고, 당업계에서 백신 제조 시 사용할 수 있는 여러 첨가물을 선택적으로 더 포함할 수 있다. 본 발명에 따른 백신 조성물은 상기 재조합 항원 단백질 및 약학적으로 허용가능한 담체를 포함할 수 있다. 이에 제한되는 것은 아니지만 예를 들면, 제제시에 통상적으로 이용되는 것으로서, 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 전분, 아카시아 고무, 인산 칼슘, 알기네이트, 젤라틴, 규산 칼슘, 미세결정성 셀룰로스, 폴리비닐피롤리돈, 셀룰로스, 물, 시럽, 메틸 셀룰로스, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 활석, 스테아르산 마그네슘 및 미네랄 오일 등을 포함하나, 이에 한정되는 것은 아니다. 본 발명의 약제학적 조성물은 상기 성분들 이외에 TWEEN™, 폴리에틸렌 글리콜 (PEG) 등과 같은 비-이온성 계면 활성제, 아스코르브 산을 포함하는 항산화제, 윤활제, 습윤제, 감미제, 향미제, 유화제, 현탁제, 보존제 등을 추가로 포함하여 사용될 수 있다. 본 발명에서 상기 백신은, 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있는 방법에 따라, 약제학적으로 허용되는 담체 및/또는 부형제를 이용하여 제제화함으로써 단위 용량 형태로 제조되거나 또는 다용량 용기 내에 내입시켜 제조될 수 있다. 이때 제형은 오일 또는 수성 매질중의 용액, 현탁액 또는 유화액 형태이거나 엑스제, 분말제, 과립제, 정제 또는 캅셀제 형태일 수도 있으며, 분산제 또는 안정화제를 추가적으로 포함할 수 있다. 본 발명에서 상기 백신의 적합한 투여량은 제제화 방법, 투여 방식, 환자의 연령, 체중, 성, 병적 상태, 음식, 투여 시간, 투여 경로, 배설 속도 및 반응 감응성과 같은 요인들에 의해 다양하게 처방될 수 있다. 한편, 본 발명에 따른 백신의 투여량은 바람직하게는 도즈 당 1 ~ 100 ug 일 수 있다. 본 발명의 일 구체 예에서는 상기 재조합 항원 단백질을 유효성분으로 포함하는 백신은 정맥내주사, 근육 내주사, 피하내주사, 경피전달 또는 기도흡입으로 체내에 투여될 수 있으나, 이에 제한되는 것은 아니다.
상기 백신 조성물은 면역 반응 효과를 향상시키기 위해, 면역학적 애쥬반트를 더 포함할 수 있으며, 상기 면역학적 애쥬반트와 함께 또는 면역학적 애쥬반트없이 사스-코로나바이러스-2의 nucleocapsid (N) 단백질을 더 포함할 수 있다.
상기 면역학적 애쥬반트는 예를 들어 스쿠알렌(MF59, AddavaxTM), 리포솜, TLR agonist, MPL(monophosphoryl lipid A)(AS04), 마그네슘 하이드록사이드, 마그네슘 카보네이트 하이드독사이드 펜타하이드데이트, 티타듐다이독사이드, 칼슘 카보네이트, 바륨 옥사이드, 바륨 하이이드록사이드, 바륨 퍼옥사이드, 바륨 설페이트, 칼슘 설페이트, 칼슘 파이로포스페이트, 마그네슘 카보네이트, 마그네슘 옥사이드, 알루미늄 하이드록사이드, 알루미늄 포스페이트 및 수화된 알루미늄 포타슘 설페이트(Alum)로부터 선택된 어느 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 '사스-코로나바이러스-2의 nucleocapsid (N) 단백질'은 서열번호 33의 인위적으로 만들어진 사스-코로나바이러스-2의 nucleocapsid (N) 단백질이다. N 단백질은 세포성 면역을 유도할 수 있으며, 본 발명의 일 구현예에 따라 얻어진 재조합된 항원 단백질과 함께 사용하여 증가된 보호면역원성을 유도할 수 있다. 상기 서열번호 33의 단백질의 N 단백질 발현을 위한 컨스트럭트는 상기 N 단백질의 N-말단에 인간 알부민 시그널 펩타이드(서열번호 34)를 발현할 수 있는 뉴클레오타이드 서열이 융합되어 제공될 수 있다. 바람직하게 BEV 발현 시스템에서 최적화된 뉴클레오타이드 서열은 서열번호 35로, CHO 발현 시스템에서 최적화된 뉴클레오타이드 서열은 서열번호 36으로 표현된다.
서열번호 비고 구분
1 SK-S-ecto 펩타이드
2 P2 펩타이드
3 폴돈 펩타이드
4 SK-S-ecto-P2 재조합 항원 단백질 펩타이드
5 SK-S-trimer 재조합 항원 단백질 펩타이드
6 SK-S-trimer-P2 재조합 항원 단백질 펩타이드
7 SK- S-Trimer-2proline 재조합 항원 단백질 펩타이드
8 SK-S-Trimer-P2-2proline 재조합 항원 단백질 펩타이드
9 SK-S-trimer-P2(GSAG)-2proline 재조합 항원 단백질 펩타이드
10 SK-S-trimer-P2(GSAG/Ca)-2proline 재조합 항원 단백질 펩타이드
11 SK-S-trimer-P2-(HHAH)-2proline 재조합 항원 단백질 펩타이드
12 SK-S-trimer-P2(GSAG)6proline 재조합 항원 단백질 펩타이드
13 SK-S-ecto의 CHO 코돈최적화 뉴클레오타이드
14 SK-S-ecto-P2 의CHO 코돈최적화 뉴클레오타이드
15 SK-S-trimer 의 CHO 코돈최적화 뉴클레오타이드
16 SK-S-trimer-P2 의 CHO 코돈최적화 뉴클레오타이드
17 SK- S-Trimer-2proline 의 CHO 코돈최적화 뉴클레오타이드
18 SK-S-Trimer-P2-2proline 의 CHO 코돈최적화 뉴클레오타이드
19 SK-S-trimer-P2(GSAG)-2proline 의 CHO 코돈최적화 뉴클레오타이드
20 SK-S-trimer-P2(GSAG/Ca)-2proline 의 CHO 코돈최적화 뉴클레오타이드
21 SK-S-trimer-P2-(HHAH)-2proline 의 CHO 코돈최적화 뉴클레오타이드
22 SK-S-trimer-P2(GSAG)-6proline 의 CHO 코돈최적화 뉴클레오타이드
23 SK-S-ecto 의 BEV 코돈최적화 뉴클레오타이드
24 SK-S-ecto-P2 의 BEV 코돈최적화 뉴클레오타이드
25 SK-S-trimer 의 BEV 코돈최적화 뉴클레오타이드
26 SK-S-trimer-P2 의 BEV 코돈최적화 뉴클레오타이드
27 SK- S-Trimer-2proline 의 BEV 코돈최적화 뉴클레오타이드
28 SK-S-Trimer-P2-2proline 의 BEV 코돈최적화 뉴클레오타이드
29 SK-S-trimer-P2(GSAG)-2proline 의BEV 코돈최적화 뉴클레오타이드
30 SK-S-trimer-P2(GSAG/Ca)-2proline 의 BEV 코돈최적화 뉴클레오타이드
31 SK-S-trimer-P2-(HHAH)-2proline 의 BEV 코돈최적화 뉴클레오타이드
32 SK-S-trimer-P2(GSAG)6proline 의 BEV 코돈최적화 뉴클레오타이드
33 N 단백질 펩타이드
34 Human albumin SP (1-18) 펩타이드
35 N 단백질의 BEV 코돈최적화 뉴클레오타이드
36 N 단백질의 CHO 코돈최적화 뉴클레오타이드
37 SK-RBD-P2 재조합 항원 단백질 펩타이드
38 SK-RBD 재조합 항원 단백질 펩타이드
39 SP+ SK-S-ecto 재조합 항원 단백질 펩타이드
본 발명의 일 구현예에 따른 재조합 단백질 및/또는 재조합 바이러스 백신은 안전성이 높다. 본 발명의 일 구현예에 따른 백신은 우수한 면역원성을 가지며, 백신으로 우수한 효능을 갖는다.
본 발명의 백신은 중화항체가가 높다.
본 발명의 백신은 세포성 면역의 유도 효과가 우수하다.
본 발명은 사스-코로나바이러스-2 감염에 대한 예방 및 치료효과가 우수하다.
본 발명의 재조합 항원 단백질은 안정적인 형태의 3차원 스파이크 단백질 구조 (바람직하게 바이러스 표면 스파이크 단백질 구조(ectodomain 부분을 포함), 더 바람직하게 prefusion 형태 스파이크 단백질 삼량체 구조)를 유지할 수 있다.
본 발명의 재조합된 항원을 이용해 높은 항체 생성율을 가질 수 있다.
본 발명은 안전한 사스-코로나바이러스-2 감염증 예방용 조성물, 바람직하게 백신 조성물을 제공할 수 있다. 본 발명은 재조합 항원 단백질은 사스-코로나바이러스-2 감염 예방, 사스-코로나바이러스-2 감염에 대한 항체 생성, 또는 사스-코로나바이러스-2 감염 세포의 사멸에 사용하기 위한 백신 조성물로 제공될 수 있다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 전술한 발명의 내용과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 SARS-CoV2 spike full-length protein 도메인 구조의 schematic diagram을 나타낸다.
도 2 및 3은 본 발명의 일 양태에 따른 재조합 단백질을 예시적으로 도식화한 그림이다.
도 4는 자극원에 따른 IFN-gamma 분비 T세포의 증가 정도를 확인한 결과이다.
이하, 본 발명의 이해를 돕기 위하여 실시예 등을 들어 상세하게 설명하기로 한다. 그러나, 본 발명에 따른 실시예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예들에 한정되는 것으로 해석되어서는 안 된다. 본 발명의 실시예들은 본 발명이 속한 분야에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해 제공되는 것이다.
1. 사스-코로나바이러스-2의 Spike protein을 이용한 항원 발현용 컨스트럭트 제조
(1) 서열번호 1의 폴리펩타이드에 P2 도메인과 폴돈 도메인 연결하여 제작
백신 제조에 사용하는 항원 단백질을 제작하기 위해 Genbank # MN908947 Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1의 서열을 참고하여 S 유전자, N 유전자 서열을 준비하였다.
도 1은 SARS-CoV2 spike full-length protein 도메인 구조의 schematic diagram을 나타낸다. 이를 이용하여 항원 발현용 컨스트럭트를 제조하였다.
사스-코로나바이러스-2 항원 단백질 발현을 위해 여러 시리즈의 발현 컨스트럭트를 고안하였다. 고안된 발현 컨스트럭트를 통해 얻어진 재조합 단백질을 도 2 및 3에 상세히 도시하였다. P2는 Tetanus P2 domain을, foldon은 T4 피브리틴의 폴돈 단백질 발현 도메인을 의미한다. 여기서 P2 도메인과 폴돈 단백질 발현 도메인은 각각 GSGSG 펩타이드 Linker로 연결되게 하였다.
제작된 재조합 단백질의 적절한 분비 또는 이동을 위해, 상기 재조합 단백질 발현을 위한 컨스트럭트의 upstream에 시그널 펩타이드를 코딩하는 뉴클레오타이드 서열을 작동가능하게 연결하였다. Baculo 발현 시스템을 통해 발현할 때는 S-ecto, 및 S-ecto-P2로 칭하는 발현 컨스트럭트는 자체 시그널 펩타이드를 사용하고, 그 외 construct는 서열번호 3의 시그널 펩타이드를 코딩하는 뉴클레오타이드 서열로 교체하여 사용하였다. CHO 발현 시스템을 통해 발현할 때는 S 단백질의 자체 SP 서열이 발현될 수 있도록 하였다.
(2) 2개의 프롤린 뮤턴트 제작
폴돈 도메인을 부착하거나, 폴돈 도메인에 P2 도메인이 연결된 재조합 항원 단백질을 기준으로, 2개의 프롤린 아미노산을 도입하였다. 구체적으로 서열번호 7 및 8과 같이 K973P 및 V974P을 도입하였다. 이를 통해 단백질이 prefusion 형태로 안정화된 재조합 항원 단백질을 얻을 수 있었다.
(3) cleavage site 변이
Furin cleavage site 및 Cathepsin L cleavage site에 변이를 도입하여 SK-S-trimer-P2(GSAG/Ca)-2proline재조합 단백질을 제작하였다. 이를 서열번호 10으로 나타냈다.
상기 재조합 단백질은 발현 및 정제 과정 중 proteolytic degradation에 저항성을 가졌으며, S1, S2 2개의 서브유닛으로 분리되지 않고 단일 폴리펩타이드로 발현 정제되어 단백질 수율이 증가하고 안정적인 구조를 나타냈다.
(4) 추가 변이
서열번호 9를 기준으로 F804P, A879P, A886P, A929P 변이를 도입하였고, 우수한 단백질 안정성 및 수득율을 얻을 수 있었다.
각 컨스트럭트들이 발현될 때 periplasmic region 혹은 배양 배지로 재조합 단백질이 secretion 될 수 있도록 각 발현 시스템에 원래 가지고 있는 signal peptide 혹은 이종의 signal peptide를 코딩하는 유전자를 유지, 치환 혹은 첨가하였다. Spike 단백질은 N-terminal 1~13 aa이 자체 signal peptide이며, 배큘로바이러스 시스템, CHO cell 발현 시스템, mammalian cell 발현 시스템에서 원래의 시그널 펩타이드가 그대로 발현될 수 있게 하였다. N 단백질은 원래 시그널 펩타이드가 달려있지 않은 단백질이기 때문에 human albumin signal peptide 암호화 뉴클레오티드 서열을 N 말단에 첨가하였다.
2. 기타 단백질을 이용한 항원 제조
사스-코로나-2 바이러스의 N 단백질 유전자를 기초로 서열번호 33의 N 단백질 항원을 제조하였다.
3. 코돈 최적화
재조합 단백질을 암호화하는 DNA 서열은 진스크립트 (GenScript)에서 곤충 세포, 및 Chinese Hamster Ovary(CHO) cell에 최적화된 코돈으로 각각 합성되었다.
각 발현시스템에 코돈-최적화된 서열은 다음과 같다. 하기 서열은 폴리뉴클레오티드 서열이다.
상기 재조합 항원 단백질 발현용 컨스트럭트는 서열번호 13 내지 32로 표현되는 뉴클레오타이드 서열로 나타냈다.
상기 폴돈 도메인은 항원이 trimer를 형성하도록 유도하여 항원 크기를 증가시키고 이로 인한 항원성을 증가시킬 수 있다.
4. 재조합 단백질 백신 제조
Baculo, 및 CHO를 이용하여 하기와 같은 과정으로 백신의 효과를 확인하였다.
1.1 재조합단백질의 생산
1.1.1 배큘로바이러스 발현시스템을 이용한 재조합단백질 생산
1.1.1.1 사스-코로나바이러스-2의 항원유전자를 발현시키기 위하여 각 유전자를 합성하였다. 도 2 및 3의 단백질 발현용 컨스트럭트, 및 N 단백질 발현용 컨스트럭트를 각각 준비하였다. 전이 벡터 pFastBac1 (Invitrogen)에 상기 준비된 컨스트럭트 유전자를 삽입하여 클로닝하고, 유전자서열을 분석하였다.
1.1.1.2 제조된 플라스미드를 bacmid 제조용 E.coli에 형질전환 (Transformation)하여 재조합백미드 (Recombinant bacmid)를 제조하고 유전자서열을 분석하였다.
1.1.1.3 재조합백미드를 단층으로 배양된 Sf9 세포에 접종하여 형질감염 (Transfection)하고 재조합배큘로바이러스를 제조하여 플라그시험법으로 정량하였다.
1.1.1.4 배양된 곤충세포에 재조합배큘로바이러스를 감염시켜 생산된 재조합단백질을 수거하였다.
1.1.1.5 재조합단백질 정제
수거된 재조합단백질을 필터를 이용하여 여과하고, 적절한 크로마토그라피법 (Ion Exchange, Size Exclusion 등)을 이용하여 재조합단백질을 정제하였다.
1.1.2 CHO세포 발현시스템을 이용한 재조합단백질 생산
1.1.2.1 사스-코로나바이러스-2의 항원유전자를 발현시키기 위하여 각 유전자를 합성하였다. 발현벡터에 합성된 유전자를 삽입하여 클로닝하고, 유전자서열을 분석하였다.
1.1.2.2 단백질생산용 CHO 세포(CHO K-1 세포주)에 재조합플라스미드를 형질전환하였다.
1.1.2.3 항생제를 이용하여 재조합단백질을 발현하는 형질전환세포를 동정하였다.
1.1.2.4 동정된 형질전환 CHO세포를 대량배양하고 재조합 단백질을 수거하였다.
1.1.2.5 재조합단백질 정제
수거된 재조합단백질을 필터를 이용하여 여과하고, 적절한 크로마토그라피법 (Ion Exchange, Size Exclusion 등)을 이용하여 재조합단백질을 정제하였다.
1.1.5 재조합단백질 확인 및 정량
1.1.5.1 SDS-PAGE 및 Western blot법을 이용하여 재조합단백질의 발현 여부를 확인하였다.
1.1.5.2 기본적인 총단백질 정량법 (Lowry법, BCA법 등)을 이용하여 재조합단백질을 정량하였다.
5. 재조합 항원 단백질의 평가
A. 동물실험
1.2.1 면역원성 시험 (Immunogenicity Test)
1.2.1.1 동물 모델에 정제된 재조합단백질을 면역증강제 (예/Aluminum hydroxide) 와 조합하여 2~3주 간격으로 2~3회 접종하였다.
1.2.1.2 체중 및 체온 변화를 측정하여 안전성 확인
1.2.1.3 최종 접종 2~3주 후, 전혈하여 분리된 혈청과 비장세포를 얻었다.
1.2.2 방어능 시험 (Protection Test)
1.2.2.1 동물 모델에 정제된 재조합단백질을 면역증강제 (예/Aluminum hydroxide) 와 조합하여 2~3주 간격으로 2~3회 접종하였다.
1.2.2.2 최종 접종 2~3주 후, 치사량의 야생형 사스-코로나바이러스-2 바이러스를 감염하였다.
1.2.2.3 감염 후 1주일 간, 비강, 기도, 장기 등에서의 바이러스 shedding을 평가하였다.
1.2.2.4 감염 후 2주일 간, 체중 및 체온 변화, 사망률 등을 평가하였다.
B. 면역원성 평가
1.3.1 IgG ELISA
1.3.1.1 코팅용 항원 (RBD, S1, S2, N 등)을 96웰-플레이트에 코팅하고, 블로킹버퍼로 플레이트를 블로킹함. 검체 (혈청)를 플레이트에 반응시켰다. IgG 검출항체를 플레이트에 반응시켰다. 기질버퍼를 첨가하여 발색시키고, 흡광도를 측정하였다.
1.3.2 슈도바이러스 제조
1.3.2.1 발현용벡터에 사스-코로나바이러스-2의 S 단백질 유전자를 클로닝하였다. 전이벡터에 reporter유전자를 클로닝하였다. 두 유전자를 슈도바이러스 생산용 세포에 형질전환 (Transfection)하여 reporter단백질을 발현하는 슈도바이러스를 제조하였다.
1.3.3 중화항체가 평가
1.3.3.1 계대 희석된 검체 (혈청)를 슈도바이러스와 반응시킴. 반응한 슈도바이러스를 96웰-플레이트에 배양된 감염용 세포 (Vero E6 등)에 감염하여 배양하였다. 4~6시간 뒤 PBS로 세척하고 새로운 배지로 교체하였다. 24~72시간 배양하여 reporter 단백질 발현량을 비교하여 중화항체가를 평가하였다.
1.3.4 세포성면역 평가
1.3.4.1 96웰-플레이트에 항 인터페론-감마 항체 (anti-IFN-γ antibody)에 코팅하였다. 블로킹버퍼로 플레이트를 블로킹하고, 비장세포와 촉진제항원 (Stimulate)을 넣고 24~36시간을 배양하였다. 인터페론-감마 검출 항체를 반응시키고, 기질을 첨가하여 반응시킴. ELISPOT 리더를 이용하여 면역세포를 평가하였다.
1.3.4.2 면역특성 분석을 위하여, 면역세포 특이 항체와 사이토카인 항체를 분리한 비장세포와 2시간 반응시켰다. 유동세포분석법을 통해 T 세포 분포 및 싸이토카인 발현율을 측정하였다.
C. 백신용 항원의 항원성 평가
CR3022와의 결합력을 평가하기 위해 BioLayer Interferometry (BLI)를 사용하였다. CR3022는 Recombinant SARS-CoV-2 Spike Glycoprotein S1에 대한 Human monoclonal antibody이다. (Abcam사의 CAT#: ab273073)
BLI는 항체와 항원 간에 association과 dissociation을 통해 친화성 상수 Kd값 (Kdis/Kon)을 측정하며 이 값이 작을수록 친화력이 높다. 코로나19 S-특이 항체를 ProA sensor chip (ForteBio)에 Octet K2를 이용해 immobilize 하였다. Sensor chip을 100nM 부터 2-fold로 희석된 항원 시료에 dipping 하여 association을 측정하고 Kinetic buffer만 포함하는 well에 dipping 하여 dissociation을 측정하였다. Octet Data Analysis software(11.0)를 이용하여 결과 값에서 reference를 뺀 데이터를 1:1 binding model에 fitting 하여 분석하였다.
이를 통해 합성 서열 및 정보, 단백질 발현 확인, 단백질 분리 정제, 재조합 단백질 백신 후보물질을 확보할 수 있었다.
이를 통해 코로나감염증을 예방할 수 있게 충분한 항체 및 보호면역을 유도할 수 있다.
6. 결과
(1) BALB/c를 이용한 SK-RBD-P2 (서열번호 37), SK-RBD-P2 (서열번호 37)+ N(서열번호 33), SK-S-Trimer-P2 (서열번호 6)+ N(서열번호 33)의 면역원성 비교 실험 결과
6주령 female 마우스를 이용하여 SK-RBD-P2, SK-RBD-P2 + N, S-Trimer-P2 + N 항원을 2주간격으로 2회 IM 면역 후 채혈하여 혈청을 분리하고 면역원성을 분석하였다. 분석결과 모든 면역그룹(G2~G4)에서 RBD 단백질 특이 항체가 형성됨을 확인하였다. N 단백질 특이 항체는 면역그룹(G3, G4) 두 그룹에서 4주차에 높은 IgG titer를 보이며 우수한 면역원성을 증명했다(표 2).
SK-RBD-P2, SK-RBD-P2 + N, S-Trimer-P2 + N을 면역한 마우스의 총항체가 및 중화항체가 분석(BALB/c 마우스)
No. 항원 항원량
(ug/dose)
개체수 Adjuvant Total IgG titer PBNA 50
2 w 4 w 2 w 4 w
RBD-specific N-specific
1 Vehicle 1 0 5 Alum. H 25 25 233 190 ND
2 SK-RBD-P2 10 5
Alum. H
52 12564 109 67 ND
3 SK-RBD-P2 + N 10+1 5 Alum. H 25 5423 1321 152911 ND
4 S-Trimer-P2 + N 10+1 5 Alum. H 25 730 291 3949 40
(2) BALB/c를 이용한 S-Trimer-P2 와 N 조합에 따른 면역원성 비교 실험 결과
6주령 female 마우스를 이용하여 S-Trimer-P2 항원을 N 항원과 함께 2주간격으로 2회 IM 면역 후 채혈하여 혈청을 분리하고 면역원성을 분석하였다. 4, 6, 8주차 샘플을 분석한 결과 주차에 따른 면역원성이 증가하는 양상을 보였고, N 단백질이 첨가되지 않은 그룹에 비해 함께 투여된 그룹에서 높은 항체가를 보였다(표 3).
S-Trimer-P2 단독 또는 N을 함께 면역한 마우스의 총항체가 분석(BALB/c 마우스)
No. 항원 항원량
(ug/dose)
개체수 Adjuvant Total IgG titer
4w 6w 8w
1 Vehicle 0 5 - 25 25 25
2 S-Trimer-P2 10 5 Alum. H 894 1045 17147
3 S-Trimer-P2+N 10+1 5 Alum. H 1964 2113 19056
(3) SK-RBD-P2(서열번호 37), SK-RBD-P2 + N, S-Trimer-P2 + N의 세포성 면역원성 분석 (Balb/c 마우스)
마우스의 세포성 면역원성 유도를 확인하기 위하여 면역이 완료된 마우스의 비장을 분리하여 ELISPot을 진행하였다. 분석한 결과 vehicle을 제외한 면역그룹 에서 면역한 항원 및 N-peptide, p2 peptide 자극에 특이적으로 반응하는 IFN-gamma 분비 T세포의 증가를 확인하였다. 결과를 도 4에 나타냈다. 이러한 결과를 통해 알 수 있듯이, 본 발명의 항원들은 세포성 면역 반응에 탁월한 효과를 나타내었다.
(4) SK-RBD (서열번호 38), S-Trimer-P2, N을 각각 면역한 형질전환 랫드의 총항체가 및 중화항체가 분석
표 4의 RBD 면역 그룹(G2, G3)의 혈청 분석 결과, Vehicle 그룹(G1) 대비 Day 14, 28, 43에서 RBD 특이적인 IgG 항체가 증가하였고, Day 57에는 감소하는 추세를 보였다. S-Trimer-P2 의 경우, Vehicle 그룹(G1) 대비 Day43까지 S-Trimer-P2 특이 항체가 증가하는 양상을 보였고, 이후 항체가는 감소하였다. N이 함께 면역된 그룹(G3, G5)의 혈청에서 N 특이적 항체 생성을 분석한 결과, Day 43까지 Vehicle그룹 대비 227~2106배 정도 항체가 증가하다가 이 후에는 saturation 양상을 보였다.
항원 Group No. Group No. IgG Titer
Day 0 Day 14 Day 28 Day 43 Day 57
SK RBD (서열번호 38) G1 Vehicle 25 25 29 25 25
G2 SK-RBD (서열번호 38) 25 52 6373 166915 77863
G3 SK-RBD (서열번호 38)+ N 25 83 4663 169083 74617
S-Trimer-P2 G1 Vehicle 25 25 33 38 37
G4 S-Trimer-P2 25 1094 39042 116311 99781
G5 S-Trimer-P2 + N 25 1887 53134 146681 110747
N G1 Vehicle 25 25 25 25 32
G2 SK-RBD (서열번호 38) 25 25 25 25 25
G3 SK-RBD (서열번호 38)+ N 25 245 12611 52646 41609
G4 S-Trimer-P2 25 25 36 179 242
G5 S-Trimer-P2 + N 25 85 1604 5683 5128
G2보다 G4 실험군에서, 외부 항원의 종류에 상관없이 총항체가 생성율이 높게 나타났고, 또한 N 단백질에 의한 항체 생성율도 G4가 더 높게 확인되었다.
<110> SK bioscience Co., Ltd. <120> Vaccine composition for preventing or treating infection of SARS-CoV-2 comprising a recombinant protein <130> P21-161 <150> KR 10-2020-0123308 <151> 2020-09-23 <160> 39 <170> KoPatentIn 3.0 <210> 1 <211> 1134 <212> PRT <213> Artificial Sequence <220> <223> SK-S-ecto <400> 1 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser 1125 1130 <210> 2 <211> 15 <212> PRT <213> Unknown <220> <223> P2 Domain <400> 2 Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu 1 5 10 15 <210> 3 <211> 27 <212> PRT <213> Unknown <220> <223> foldon Domain <400> 3 Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys 1 5 10 15 Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 20 25 <210> 4 <211> 1154 <212> PRT <213> Artificial Sequence <220> <223> SK-S-ecto-P2 <400> 4 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1140 1145 1150 Glu Leu <210> 5 <211> 1166 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer <400> 5 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 1155 1160 1165 <210> 6 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer-P2 <400> 6 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 7 <211> 1165 <212> PRT <213> Artificial Sequence <220> <223> SK- S-Trimer-2proline <400> 7 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Ser Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val 1140 1145 1150 Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu 1155 1160 1165 <210> 8 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK- S-Trimer-P2-2proline <400> 8 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 9 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer-P2(GSAG)-2proline <400> 9 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 10 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer-P2(GSAG/Ca)-2proline <400> 10 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Gly Ser Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 11 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer-P2-(HHAH)-2proline <400> 11 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro His His Ala His 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala 865 870 875 880 Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 12 <211> 1186 <212> PRT <213> Artificial Sequence <220> <223> SK-S-trimer-P2(GSAG)-6proline <400> 12 Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr 1 5 10 15 Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser 20 25 30 Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn 35 40 45 Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys 50 55 60 Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala 65 70 75 80 Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr 85 90 95 Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn 100 105 110 Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu 115 120 125 Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe 130 135 140 Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln 145 150 155 160 Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu 165 170 175 Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser 180 185 190 Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser 195 200 205 Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg 210 215 220 Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp 225 230 235 240 Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr 245 250 255 Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile 260 265 270 Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys 275 280 285 Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn 290 295 300 Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr 305 310 315 320 Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser 325 330 335 Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr 340 345 350 Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly 355 360 365 Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala 370 375 380 Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly 385 390 395 400 Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe 405 410 415 Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val 420 425 430 Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu 435 440 445 Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser 450 455 460 Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln 465 470 475 480 Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg 485 490 495 Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys 500 505 510 Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe 515 520 525 Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys 530 535 540 Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr 545 550 555 560 Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro 565 570 575 Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser 580 585 590 Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro 595 600 605 Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser 610 615 620 Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala 625 630 635 640 Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly 645 650 655 Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly 660 665 670 Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala 675 680 685 Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn 690 695 700 Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys 705 710 715 720 Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys 725 730 735 Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg 740 745 750 Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val 755 760 765 Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe 770 775 780 Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser 785 790 795 800 Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala 805 810 815 Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala 820 825 830 Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu 835 840 845 Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu 850 855 860 Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala 865 870 875 880 Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile 885 890 895 Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn 900 905 910 Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr 915 920 925 Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln 930 935 940 Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile 945 950 955 960 Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala 965 970 975 Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln 980 985 990 Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser 995 1000 1005 Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser 1010 1015 1020 Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro 1025 1030 1035 1040 Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro 1045 1050 1055 Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly 1060 1065 1070 Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His 1075 1080 1085 Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr 1090 1095 1100 Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val 1105 1110 1115 1120 Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser 1125 1130 1135 Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr 1140 1145 1150 Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser 1155 1160 1165 Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr 1170 1175 1180 Glu Leu 1185 <210> 13 <211> 3444 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-ecto for the CHO expression system <400> 13 atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60 agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120 aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180 aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240 aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300 ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360 aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420 ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480 tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540 ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600 tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660 tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720 ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780 ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840 gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900 tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960 caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020 gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080 tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140 ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200 gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260 tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320 cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380 ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440 aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500 aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560 ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620 ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680 cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740 acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800 ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860 cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920 aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980 gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040 cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100 gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160 agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220 tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280 acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340 gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400 aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460 ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520 cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580 ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640 acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700 caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760 aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820 acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880 acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940 ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000 cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060 tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120 gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180 gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240 atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300 cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360 tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420 ttgcaacctg aattagactc atga 3444 <210> 14 <211> 3504 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-ecto-P2 for the CHO expression system <400> 14 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctcccagt acatcaaggc caactccaag 3480 ttcatcggca tcaccgagct gtaa 3504 <210> 15 <211> 3540 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer for the CHO expression system <400> 15 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctgtga 3540 3540 <210> 16 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2 for the CHO expression system <400> 16 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 17 <211> 3537 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK- S-Trimer-2proline for the CHO expression system <400> 17 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctg 3537 <210> 18 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK- S-Trimer-P2-2proline for the CHO expression system <400> 18 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 19 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-2proline for the CHO expression system <400> 19 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaggctccg ccggctctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 20 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG/Ca)-2proline for the CHO expression system <400> 20 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaggctccg ccggctctgt ggcttcccag agcatcatcg gctccaccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 21 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2-(HHAH)-2proline for the CHO expression system <400> 21 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccacaccacg cccactctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 22 <211> 3600 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-6proline for the CHO expression system <400> 22 atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60 agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120 aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180 aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240 aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300 atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360 aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420 ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480 agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540 ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600 ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660 tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720 ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780 ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840 gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900 tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960 cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020 gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080 tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140 ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200 gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260 tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320 ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380 ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440 aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500 aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560 cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620 ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680 ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740 accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800 ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860 cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920 aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980 gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040 ccaggctccg ccggctctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100 gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160 tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220 tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280 acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340 gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400 aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtctcc tatcgaggat 2460 ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520 ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580 ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640 accatcacat ccggatggac cttcggcgct ggacctgccc tccagatccc ttttcccatg 2700 cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760 aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820 acaccctccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880 accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940 ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000 ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060 tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120 gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180 gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240 atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300 cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360 tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420 ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480 gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540 agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600 3600 <210> 23 <211> 3459 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-ecto for the BEV expression system <400> 23 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactcctaa 3459 <210> 24 <211> 3519 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-ecto-P2 for the BEV expression system <400> 24 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggat ctggttcagg ccagtacatc 3480 aaggctaact ccaagttcat cggtatcacc gaactgtaa 3519 <210> 25 <211> 3519 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer for the BEV expression system <400> 25 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggat ctggttcagg ccagtacatc 3480 aaggctaact ccaagttcat cggtatcacc gaactgtaa 3519 <210> 26 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2 for the BEV expression system <400> 26 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgt 60 gttaatctta caaccagaac tcaattaccc cctgcataca ctaattcttt cacacgtggt 120 gtttattacc ctgacaaagt tttcagatcc tcagttttac attcaactca ggacttgttc 180 ttacctttct tttccaatgt tacttggttc catgctatac atgtctctgg gaccaatggt 240 actaagaggt ttgataaccc tgtcctacca tttaatgatg gtgtttattt tgcttccact 300 gagaagtcta acataataag aggctggatt tttggtacta ctttagattc gaagacccag 360 tccctactta ttgttaataa cgctactaat gttgttatta aagtctgtga atttcaattt 420 tgtaatgatc catttttggg tgtttattac cacaaaaaca acaaaagttg gatggaaagt 480 gagttcagag tttattctag tgcgaataat tgcacttttg aatatgtctc tcagcctttt 540 cttatggacc ttgaaggaaa acagggtaat ttcaaaaatc ttagggaatt tgtgtttaag 600 aatattgatg gttattttaa aatatattct aagcacacgc ctattaattt agtgcgtgat 660 ctccctcagg gtttttcggc tttagaacca ttggtagatt tgccaatagg tattaacatc 720 actaggtttc aaactttact tgctttacat agaagttatt tgactcctgg tgattcttct 780 tcaggttgga cagctggtgc tgcagcttat tatgtgggtt atcttcaacc taggactttt 840 ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 900 ctctcagaaa caaagtgtac gttgaaatcc ttcactgtag aaaaaggaat ctatcaaact 960 tctaacttta gagtccaacc aacagaatct attgttagat ttcctaatat tacaaacttg 1020 tgcccttttg gtgaagtttt taacgccacc agatttgcat ctgtttatgc ttggaacagg 1080 aagagaatca gcaactgtgt tgctgattat tctgtcctat ataattccgc atcattttcc 1140 acttttaagt gttatggagt gtctcctact aaattaaatg atctctgctt tactaatgtc 1200 tatgcagatt catttgtaat tagaggtgat gaagtcagac aaatcgctcc agggcaaact 1260 ggaaagattg ctgattataa ttataaatta ccagatgatt ttacaggctg cgttatagct 1320 tggaattcta acaatcttga ttctaaggtt ggtggtaatt ataattacct gtatagattg 1380 tttaggaagt ctaatctcaa accttttgag agagatattt caactgaaat ctatcaggcc 1440 ggtagcacac cttgtaatgg tgttgaaggt tttaattgtt actttccttt acaatcatat 1500 ggtttccaac ccactaatgg tgttggttac caaccataca gagtagtagt actttctttt 1560 gaacttctac atgcaccagc aactgtttgt ggacctaaaa agtctactaa tttggttaaa 1620 aacaaatgtg tcaatttcaa cttcaatggt ttaacaggca caggtgttct tactgagtct 1680 aacaaaaagt ttctgccttt ccaacaattt ggcagagaca ttgctgacac tactgatgct 1740 gtccgtgatc cacagacact tgagattctt gacattacac catgttcttt tggtggtgtc 1800 agtgttataa caccaggaac aaatacttct aaccaggttg ctgttcttta tcaggatgtt 1860 aactgcacag aagtccctgt tgctattcat gcagatcaac ttactcctac ttggcgtgtt 1920 tattctacag gttctaatgt ttttcaaaca cgtgcaggct gtttaatagg ggctgaacat 1980 gtcaacaact catatgagtg tgacataccc attggtgcag gtatatgcgc tagttatcag 2040 actcagacta attctcctcg gcgggcacgt agtgtagcta gtcaatccat cattgcctac 2100 actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2160 acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2220 gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2280 tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2340 aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2400 gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2460 tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2520 caatatggtg attgccttgg tgatattgct gctagagacc tcatttgtgc acaaaagttt 2580 aacggcctta ctgttttgcc acctttgctc acagatgaaa tgattgctca atacacttct 2640 gcactgttag cgggtacaat cacttctggt tggacctttg gtgcaggtgc tgcattacaa 2700 ataccatttg ctatgcaaat ggcttatagg tttaatggta ttggagttac acagaatgtt 2760 ctctatgaga accaaaaatt gattgccaac caatttaata gtgctattgg caaaattcaa 2820 gactcacttt cttccacagc aagtgcactt ggaaaacttc aagatgtggt caaccaaaat 2880 gcacaagctt taaacacgct tgttaaacaa cttagctcca attttggtgc aatttcaagt 2940 gttttaaatg atatcctttc acgtcttgac aaagttgagg ctgaagtgca aattgatagg 3000 ttgatcacag gcagacttca aagtttgcag acatatgtga ctcaacaatt aattagagct 3060 gcagaaatca gagcttctgc taatcttgct gctactaaaa tgtcagagtg tgtacttgga 3120 caatcaaaaa gagttgattt ttgtggaaag ggctatcatc ttatgtcctt ccctcagtca 3180 gcacctcatg gtgtagtctt cttgcatgtg acttatgtcc ctgcacaaga aaagaacttc 3240 acaactgctc ctgccatttg tcatgatgga aaagcacact ttcctcgtga aggtgtcttt 3300 gtttcaaatg gcacacactg gtttgtaaca caaaggaatt tttatgaacc acaaatcatt 3360 actacagaca acacatttgt gtctggtaac tgtgatgttg taataggaat tgtcaacaac 3420 acagtttatg atcctttgca acctgaatta gactcaggta gcggaggtag cggatatatt 3480 cctgaggctc cccgcgacgg acaggcttac gtccgcaagg atggtgaatg ggtgctgctc 3540 tccaccttcc tcggcagcgg aagcggacag tatatcaagg ctaactccaa gttcattggc 3600 atcaccgagt tgtaa 3615 <210> 27 <211> 3555 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK- S-Trimer-2proline for the BEV expression system <400> 27 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac ccaccagagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480 cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540 tcaactttcc tgtaa 3555 <210> 28 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-Trimer-P2-2proline for the BEV expression system <400> 28 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac ccaccagagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480 cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540 tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600 atcaccgaac tgtaa 3615 <210> 29 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-2proline for the BEV expression system <400> 29 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcacccgg cagtgctggt tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480 cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540 tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600 atcaccgaac tgtaa 3615 <210> 30 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG/Ca)-2proline for the BEV expression system <400> 30 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcacccgg cagtgctggt tccgtggcct ctcagtcaat catcggttcc 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480 cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540 tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600 atcaccgaac tgtaa 3615 <210> 31 <211> 3615 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2-(HHAH)-2proline for the BEV expression system <400> 31 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60 gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120 gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180 ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240 actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300 gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360 tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420 tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480 gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540 ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600 aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660 ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720 accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780 tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840 ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900 ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960 agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020 tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080 aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140 accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200 tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260 ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320 tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380 ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440 ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500 ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560 gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620 aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680 aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740 gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800 tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860 aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920 tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980 gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040 acccagacta actcacccca ccatgctcat tccgtggcct ctcagtcaat catcgcttac 2100 accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160 accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220 gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280 tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340 aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400 gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460 tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520 cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580 aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640 gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700 atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760 ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820 gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880 gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940 gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000 ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060 gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120 cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180 gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240 accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300 gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360 accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420 accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480 cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540 tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600 atcaccgaac tgtaa 3615 <210> 32 <211> 3455 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-6proline for the BEV expression system <400> 32 atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctagtgcg 60 tgaacctgac cactcgtacc cagctgcctc ccgcctacac caactcattc actaggggtg 120 tgtactaccc agacaaggtg ttccgctcct ccgtgctgca ctcaactcag gacctgttcc 180 tgcctttctt ctccaacgtc acctggttcc acgccatcca cgtgtccgga accaacggta 240 ctaagaggtt cgacaaccca gtgctgcctt tcaacgacgg tgtctacttc gcttcaaccg 300 agaagtccaa catcatcaga ggctggatct tcggaaccac tctggacagc aagactcagt 360 ctctgctgat cgtcaacaac gccaccaacg tggtcatcaa ggtgtgcgag ttccagttct 420 gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagtcatgg atggagtccg 480 agttccgcgt ctactccagc gctaacaact gcactttcga gtacgtgagc cagccattcc 540 tgatggacct ggaaggcaag cagggaaact tcaagaacct gcgcgagttc gtgttcaaga 600 acatcgacgg atacttcaag atttacagca agcacacccc catcaacctg gtccgtgacc 660 tgccacaggg tttctctgct ctggagcccc tggtggacct gccaatcggc atcaacatca 720 ccaggttcca gactctgctg gctctgcacc gctcctacct gactcccggt gactcttcat 780 ccggttggac cgccggcgct gccgcttact acgtgggtta cctgcaacca cgcaccttcc 840 tgctgaagta caacgaaaac ggaaccatca ctgacgccgt ggactgcgct ctggacccac 900 tgagcgaaac caagtgcact ctgaagtctt tcaccgtgga gaagggcatc taccagacta 960 gcaacttccg cgtgcagcct accgaatcta tcgtccgttt cccaaacatc actaacctgt 1020 gccctttcgg agaggtgttc aacgccaccc gtttcgcttc cgtgtacgcc tggaacagga 1080 agagaatcag caactgcgtc gctgactact ctgtgctgta caactcagcc tccttcagca 1140 ccttcaagtg ctacggcgtg tcacccacta agctgaacga cctgtgcttc accaacgtct 1200 acgccgactc cttcgtgatc aggggagacg aggtcagaca gatcgctcca ggtcaaactg 1260 gcaagatcgc cgactacaac tacaagctgc ctgacgactt caccggctgc gtcatcgctt 1320 ggaacagcaa caacctggac tctaaagtgg gtggcaacta caactacctg taccgcctgt 1380 tccgtaagtc aaacctgaag cccttcgagc gcgacatctc aactgaaatc taccaggctg 1440 gttccacccc atgcaacgga gtcgagggtt tcaactgcta cttccctctg caatcctacg 1500 gtttccagcc cactaacgga gtgggttacc agccataccg tgtggtcgtg ctgagcttcg 1560 aactgctgca cgcccctgct actgtgtgcg gtcccaagaa gtctaccaac ctggtcaaga 1620 acaagtgcgt gaacttcaac ttcaacggcc tgaccggcac tggagtcctg accgagagca 1680 acaagaagtt cctgcctttc cagcagttcg gacgcgacat cgctgacacc actgacgccg 1740 tgcgtgaccc tcagaccctg gaaatcctgg acatcactcc ctgctcattc ggaggtgtct 1800 ccgtgatcac ccctggcacc aacacttcta accaggtcgc tgtgctgtac caggacgtca 1860 actgcaccga ggtcccagtg gccatccacg ctgaccagct gacccctact tggagggtgt 1920 actccaccgg tagcaacgtg ttccagacta gagctggatg cctgatcggt gccgagcacg 1980 tgaacaacag ctacgaatgc gacatcccta tcggtgctgg catctgcgcc tcttaccaga 2040 cccagactaa ctcacccggc agtgctggtt ccgtggcctc tcagtcaatc atcgcttaca 2100 ccatgagcct gggcgctgaa aactctgtgg cctactctaa caactcaatc gccatcccta 2160 ccaacttcac tatcagcgtg accactgaga tcctgcccgt cagcatgacc aagacttctg 2220 tggactgcac tatgtacatc tgcggagaca gcaccgaatg ctctaacctg ctgctgcaat 2280 acggctcttt ctgcacccag ctgaaccgcg ctctgactgg aatcgccgtg gagcaggaca 2340 agaacactca ggaagtgttc gctcaggtga agcaaatcta caagacccca cctatcaagg 2400 acttcggcgg attcaacttc tcccagatcc tgcctgaccc ctccaagcca agcaagaggt 2460 ctcccatcga ggacctgctg ttcaacaagg tcaccctggc cgacgctgga ttcatcaagc 2520 agtacggcga ctgcctggga gacatcgctg ctcgcgacct gatctgcgct cagaagttca 2580 acggtctgac cgtgctgccc ccactgctga ctgacgaaat gatcgcccag tacacttcag 2640 ccctgctggc tggcaccatc acttccggat ggaccttcgg agctggtcct gctctgcaaa 2700 tccctttccc tatgcagatg gcctaccgct tcaacggcat cggagtcacc cagaacgtgc 2760 tgtacgagaa ccagaagctg atcgctaacc agttcaactc agccatcgga aagatccagg 2820 actcactgtc ctccacccct tccgctctgg gcaagctgca agacgtcgtg aaccagaacg 2880 cccaggctct gaacaccctg gtcaagcagc tgtcatccaa cttcggtgct atcagctctg 2940 tgctgaacga catcctgtcc aggctggacc cacctgaggc cgaagtgcag atcgaccgcc 3000 tgatcactgg tcgcctgcaa tccctgcaaa cctacgtgac tcagcagctg atcagggccg 3060 ctgaaatcag agcctccgct aacctggccg ctaccaagat gtcagagtgc gtcctgggac 3120 agtccaagag agtggacttc tgcggcaagg gctaccacct gatgtcattc ccacagtccg 3180 ctcctcacgg cgtcgtgttc ctgcacgtca cctacgtgcc cgcccaggaa aagaacttca 3240 ccactgcccc agctatctgc cacgacggca aggctcactt ccctcgcgaa ggcgtgttcg 3300 tgagcaacgg aacccactgg ttcgtcactc agcgtaactt ctacgagccc cagatcatca 3360 ccactgacaa cactttcgtg tctggtaact gcgacgtcgt gatcggcatc gtcaacaaca 3420 ccgtgtacga ccccctgcaa ccagaactgg actcc 3455 <210> 33 <211> 436 <212> PRT <213> Unknown <220> <223> N protein of SARS-CoV-2 <400> 33 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile 20 25 30 Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu 35 40 45 Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn 50 55 60 Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp 65 70 75 80 Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser 85 90 95 Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg 100 105 110 Gly Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr 115 120 125 Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys 130 135 140 Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys 145 150 155 160 Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu 165 170 175 Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly 180 185 190 Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg 195 200 205 Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro 210 215 220 Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu 225 230 235 240 Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln 245 250 255 Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser 260 265 270 Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr 275 280 285 Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly 290 295 300 Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln 305 310 315 320 Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg 325 330 335 Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly 340 345 350 Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile 355 360 365 Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu 370 375 380 Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro 385 390 395 400 Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp 405 410 415 Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp 420 425 430 Ser Thr Gln Ala 435 <210> 34 <211> 18 <212> PRT <213> Homo sapiens <400> 34 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser <210> 35 <211> 1311 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of N protein for the BEV expression system <400> 35 atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttcctctgat 60 aatggacccc aaaatcagcg aaatgcaccc cgcattacgt ttggtggacc ctcagattca 120 actggcagta accagaatgg agaacgcagt ggggcgcgat caaaacaacg tcggccccaa 180 ggtttaccca ataatactgc gtcttggttc accgctctca ctcaacatgg caaggaagac 240 cttaaattcc ctcgaggaca aggcgttcca attaacacca atagcagtcc agatgaccaa 300 attggctact accgaagagc taccagacga attcgtggtg gtgacggtaa aatgaaagat 360 ctcagtccaa gatggtattt ctactaccta ggaactgggc cagaagctgg acttccctat 420 ggtgctaaca aagacggcat catatgggtt gcaactgagg gagccttgaa tacaccaaaa 480 gatcacattg gcacccgcaa tcctgctaac aatgctgcaa tcgtgctaca acttcctcaa 540 ggaacaacat tgccaaaagg cttctacgca gaagggagca gaggcggcag tcaagcctct 600 tctcgttcct catcacgtag tcgcaacagt tcaagaaatt caactccagg cagcagtagg 660 ggaacttctc ctgctagaat ggctggcaat ggcggtgatg ctgctcttgc tttgctgctg 720 cttgacagat tgaaccagct tgagagcaaa atgtctggta aaggccaaca acaacaaggc 780 caaactgtca ctaagaaatc tgctgctgag gcttctaaga agcctcggca aaaacgtact 840 gccactaaag catacaatgt aacacaagct ttcggcagac gtggtccaga acaaacccaa 900 ggaaattttg gggaccagga actaatcaga caaggaactg attacaaaca ttggccgcaa 960 attgcacaat ttgcccccag cgcttcagcg ttcttcggaa tgtcgcgcat tggcatggaa 1020 gtcacacctt cgggaacgtg gttgacctac acaggtgcca tcaaattgga tgacaaagat 1080 ccaaatttca aagatcaagt cattttgctg aataagcata ttgacgcata caaaacattc 1140 ccaccaacag agcctaaaaa ggacaaaaag aagaaggctg atgaaactca agccttaccg 1200 cagagacaga agaaacagca aactgtgact cttcttcctg ctgcagattt ggatgatttc 1260 tccaaacaat tgcaacaatc catgagcagt gctgactcaa ctcaggccta a 1311 <210> 36 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> a codon optimized sequence of N protein for the CHO expression system <400> 36 atgaagtggg tcactttcat cagcctgttg tttctgttca gctccgccta ctctaagtgg 60 gtaaccttta tttcccttct ttttctcttt agctcggctt attcctctga taatggaccc 120 caaaatcagc gaaatgcacc ccgcattacg tttggtggac cctcagattc aactggcagt 180 aaccagaatg gagaacgcag tggggcgcga tcaaaacaac gtcggcccca aggtttaccc 240 aataatactg cgtcttggtt caccgctctc actcaacatg gcaaggaaga ccttaaattc 300 cctcgaggac aaggcgttcc aattaacacc aatagcagtc cagatgacca aattggctac 360 taccgaagag ctaccagacg aattcgtggt ggtgacggta aaatgaaaga tctcagtcca 420 agatggtatt tctactacct aggaactggg ccagaagctg gacttcccta tggtgctaac 480 aaagacggca tcatatgggt tgcaactgag ggagccttga atacaccaaa agatcacatt 540 ggcacccgca atcctgctaa caatgctgca atcgtgctac aacttcctca aggaacaaca 600 ttgccaaaag gcttctacgc agaagggagc agaggcggca gtcaagcctc ttctcgttcc 660 tcatcacgta gtcgcaacag ttcaagaaat tcaactccag gcagcagtag gggaacttct 720 cctgctagaa tggctggcaa tggcggtgat gctgctcttg ctttgctgct gcttgacaga 780 ttgaaccagc ttgagagcaa aatgtctggt aaaggccaac aacaacaagg ccaaactgtc 840 actaagaaat ctgctgctga ggcttctaag aagcctcggc aaaaacgtac tgccactaaa 900 gcatacaatg taacacaagc tttcggcaga cgtggtccag aacaaaccca aggaaatttt 960 ggggaccagg aactaatcag acaaggaact gattacaaac attggccgca aattgcacaa 1020 tttgccccca gcgcttcagc gttcttcgga atgtcgcgca ttggcatgga agtcacacct 1080 tcgggaacgt ggttgaccta cacaggtgcc atcaaattgg atgacaaaga tccaaatttc 1140 aaagatcaag tcattttgct gaataagcat attgacgcat acaaaacatt cccaccaaca 1200 gagcctaaaa aggacaaaaa gaagaaggct gatgaaactc aagccttacc gcagagacag 1260 aagaaacagc aaactgtgac tcttcttcct gctgcagatt tggatgattt ctccaaacaa 1320 ttgcaacaat ccatgagcag tgctgactca actcaggcct aa 1362 <210> 37 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> SK RBD-P2 <400> 37 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Ser Gly Ser 195 200 205 Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu 210 215 220 <210> 38 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> SK-RBD <400> 38 Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn 1 5 10 15 Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser 20 25 30 Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser 35 40 45 Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys 50 55 60 Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val 65 70 75 80 Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr 85 90 95 Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn 100 105 110 Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu 115 120 125 Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu 130 135 140 Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn 145 150 155 160 Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val 165 170 175 Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His 180 185 190 Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr 195 200 <210> 39 <211> 1147 <212> PRT <213> Artificial Sequence <220> <223> SP+ SK-S-ecto <400> 39 Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val 1 5 10 15 Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe 20 25 30 Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu 35 40 45 His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp 50 55 60 Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp 65 70 75 80 Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu 85 90 95 Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser 100 105 110 Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile 115 120 125 Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr 130 135 140 Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr 145 150 155 160 Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu 165 170 175 Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe 180 185 190 Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr 195 200 205 Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu 210 215 220 Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr 225 230 235 240 Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser 245 250 255 Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro 260 265 270 Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala 275 280 285 Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys 290 295 300 Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val 305 310 315 320 Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys 325 330 335 Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala 340 345 350 Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu 355 360 365 Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro 370 375 380 Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe 385 390 395 400 Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly 405 410 415 Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys 420 425 430 Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn 435 440 445 Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe 450 455 460 Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys 465 470 475 480 Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly 485 490 495 Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val 500 505 510 Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys 515 520 525 Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn 530 535 540 Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu 545 550 555 560 Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val 565 570 575 Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe 580 585 590 Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val 595 600 605 Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile 610 615 620 His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser 625 630 635 640 Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val 645 650 655 Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala 660 665 670 Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala 675 680 685 Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser 690 695 700 Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile 705 710 715 720 Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val 725 730 735 Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu 740 745 750 Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr 755 760 765 Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln 770 775 780 Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe 785 790 795 800 Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser 805 810 815 Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly 820 825 830 Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp 835 840 845 Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu 850 855 860 Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly 865 870 875 880 Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile 885 890 895 Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr 900 905 910 Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn 915 920 925 Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala 930 935 940 Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn 945 950 955 960 Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val 965 970 975 Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln 980 985 990 Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val 995 1000 1005 Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu 1010 1015 1020 Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val 1025 1030 1035 1040 Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala 1045 1050 1055 Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu 1060 1065 1070 Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His 1075 1080 1085 Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val 1090 1095 1100 Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr 1105 1110 1115 1120 Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr 1125 1130 1135 Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser 1140 1145

Claims (27)

  1. 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드, 또는 이의 기능적 단편에
    i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질.
  2. 제1항에 있어서, 상기 외인성 폴리펩타이드는 폴돈 도메인과 P2 도메인이 연결된 도메인인 것을 특징으로 하는 재조합 사스-코로나바이러스-2 항원 단백질.
  3. 제1항에 있어서, 상기 연결은 적어도 4개의 아미노산 잔기로 이루어진 링커에 의해 이루어지는, 재조합 사스-코로나바이러스-2 항원 단백질.
  4. 제1항에 있어서, 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드에 적어도 하나 이상의 아미노산이 치환된 변이를 갖는, 재조합 사스-코로나바이러스-2 항원 단백질.
  5. 제4항에 있어서, 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, iii) 카텝신(Cathepsin) L 절단 부위 변이, 및 iv) S2 서브유닛 변이로 이루어진 군에서 선택된 어느 하나 이상의 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질.
  6. 제5항에 있어서, 상기 i) 2 프롤린 변이는 서열번호 1의 폴리펩타이드의 973번 위치의 아미노산 라이신(K)이 프롤린(P)으로 치환되고, 974번 위치의 아미노산 발린(V)이 프롤린(P)으로 치환된 변이를 갖는, 재조합 사스-코로나바이러스-2 항원 단백질.
  7. 제5항에 있어서, 상기 ii) 퓨린 (furin) 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 669-672에 대응하는 아미노산 RRAR이 GSAG 또는 HHAH로 치환된 재조합 사스-코로나바이러스-2 항원 단백질.
  8. 제5항에 있어서, 상기 iii) 카텝신(Cathepsin) L 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 681-682에 대응한은 아미노산 AY가 GS로 치환된 재조합 사스-코로나바이러스-2 항원 단백질.
  9. 제5항에 있어서, 상기 iv) S2 서브유닛 변이는 S 단백질의 S2 서브유닛을 형성하는 아미노산 중 적어도 4개의 아미노산이 치환된 것으로, F804P, A879P, A886P, 및 A929P 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질.
  10. 제5항에 있어서, 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, 및 iii) 카텝신(Cathepsin) L 절단 부위 변이를 포함하거나, 또는
    i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, 및 iv) S2 서브유닛 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질.
  11. 제1항 내지 제10항 중 어느 하나의 항에 있어서, 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 4 내지 12로 이루어진 군에서 선택된 적어도 하나 이상의 서열을 갖는 펩타이드를 포함하는 사스-코로나바이러스-2 백신에 사용을 위한 재조합 사스-코로나바이러스-2 항원 단백질.
  12. 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질을 발현하기 위한 발현 컨스트럭트로,
    (a) 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된 재조합 사스-코로나바이러스-2 항원 단백질을 또는 이의 기능적 단편을 코딩하는 뉴클레오타이드 서열; 및
    (b) 상기 재조합 사스-코로나바이러스-2 항원 단백질을 세포로부터 분비시키기 위한 시그널 서열을 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트.
  13. 제12항에 있어서, 상기 발현 컨스트럭트는 서열번호 13 내지 32로 이루어진 군에서 선택된 어느 하나의 뉴클레오타이드 서열로 이루어진 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트.
  14. 제12항의 컨스트럭트를 포함하는 재조합 벡터.
  15. 제14항에 있어서, 상기 재조합 벡터는
    ii) 서열번호 13 내지 22로 이루어진 군에서 선택된 어느 하나의 서열로 표현되는 폴리뉴클레오티드로 이루어진 발현 컨스트럭트를 포함하는 동물세포의 형질감염을 위한 재조합 벡터인, 재조합 벡터.
  16. 제15항의 재조합 벡터를 포함하는 숙주 세포이며, 상기 숙주 세포는 중국 햄스터 난소 (CHO) 세포인 숙주 세포.
  17. 제14항에 있어서, 상기 재조합 벡터는
    i) 서열번호 23 내지 32로 이루어진 군에서 선택된 어느 하나의 서열로 표현되는 폴리뉴클레오티드로 이루어진 발현 컨스트럭트를 포함하는 배큘로바이러스 (baculovirus) 재조합 벡터인 재조합 벡터.
  18. 제17항에 따른 배큘로바이러스 (baculovirus) 재조합 벡터를 대장균에 형질전환하여 얻어진 재조합 백미드 (Bacmid).
  19. 제18항에 따른 재조합 백미드를 게놈으로 포함하는 재조합 배큘로바이러스.
  20. 제18항에 따른 재조합 백미드를 포함하거나, 제19항에 따른 재조합 배큘로바이러스로 형질감염된 숙주세포.
  21. 제20항에 있어서, 상기 숙주세포는 Sf21 또는 Sf9을 포함하는 곤충세포인 것을 특징으로 하는, 숙주세포.
  22. 제14항에 따른 재조합 벡터를 포함하는 숙주 세포를 배양하고 목적하는 생성물을 단리함을 포함하는, 재조합 항원 단백질의 제조 방법.
  23. 제22항의 방법으로 제조된, 서열번호 4 내지 12로 이루어진 군에서 선택된 어느 하나의 서열로 이루어진 재조합 항원 단백질.
  24. 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질 또는 이의 기능적 단편을 포함하는 재조합 항원 단백질, 및
    약학적으로 허용가능한 담체를 포함하는, 사스-코로나바이러스-2 감염증 예방 또는 치료용 약학 조성물.
  25. 제24항에 있어서, 상기 조성물은
    서열번호 33의 사스-코로나바이러스-2의 nucleocapsid (N) protein, 면역학적 애쥬반트 또는 이들의 혼합물을 더 포함하는, 사스-코로나바이러스-2 감염증 예방 또는 치료용 약학 조성물.
  26. 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질을 포함하는 재조합 항원 단백질, 및
    약학적으로 허용가능한 담체를 포함하는 조성물을 유효량 개체에 투여하여 개체의 체내에 사스-코로나바이러스-2에 대한 중화항체 생성 또는 IFN-γ 분비 T세포를 증가시키기 위한 약학 조성물.
  27. 제26항에 있어서, 상기 약학 조성물은 사스-코로나바이러스-2의 감염 예방을 위한 백신 조성물인 약학 조성물.
KR1020210125995A 2020-09-23 2021-09-23 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 KR20220040423A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20200123308 2020-09-23
KR1020200123308 2020-09-23

Publications (1)

Publication Number Publication Date
KR20220040423A true KR20220040423A (ko) 2022-03-30

Family

ID=80845765

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210125995A KR20220040423A (ko) 2020-09-23 2021-09-23 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물

Country Status (2)

Country Link
KR (1) KR20220040423A (ko)
WO (1) WO2022065889A1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018081318A1 (en) * 2016-10-25 2018-05-03 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Prefusion coronavirus spike proteins and their use

Also Published As

Publication number Publication date
WO2022065889A1 (ko) 2022-03-31

Similar Documents

Publication Publication Date Title
KR102482994B1 (ko) 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
AU2014230822B2 (en) Heat-stable Respiratory Syncytial Virus prefusion F protein oligomers and their use in immunological compositions
KR20230049084A (ko) Sars-cov-2 및 인플루엔자 조합 백신
Drew et al. Humoral immune responses to DNA vaccines expressing secreted, membrane bound and non-secreted forms of the: Taenia ovis 45W antigen
KR20180131584A (ko) 안정화된 용해성 융합-전 rsv f 단백질
JPH03502687A (ja) レスピラトリイ・シンシチアル・ウイルス:ワクチンおよび診断法
TW202140519A (zh) 疫苗
CN115246874A (zh) 一种重组新型冠状病毒s-rbd三聚体蛋白、其制备方法和应用
WO2023138334A1 (zh) 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用
US20230265128A1 (en) Stabilised viral fusion proteins
TW202206598A (zh) 對抗SARS-CoV-2之疫苗及其製品
CN108503696B (zh) 一种酵母细胞表达的寨卡病毒亚单位疫苗
KR102514122B1 (ko) 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
WO2023138333A1 (zh) 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用
RU2178807C2 (ru) ВЫДЕЛЕННАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ДНК, ВЕКТОР, СПОСОБ ПОЛУЧЕНИЯ ГОМОГЕННОГО БЕЛКА gp350, ГОМОГЕННЫЙ БЕЛОК gp350, ФАРМАЦЕВТИЧЕСКАЯ КОМПОЗИЦИЯ ДЛЯ ЛЕЧЕНИЯ ЕВV-СВЯЗАННОГО ЗАБОЛЕВАНИЯ ИЛИ СОСТОЯНИЯ
CN116568324A (zh) 融合蛋白和疫苗
KR20220040423A (ko) 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
KR20230022206A (ko) 코로나바이러스 질환에 대응하는 재조합적 변형된 우두증 바이러스 앙카라 (mva) 백신
KR20210122196A (ko) 신규 코로나바이러스 예방 및 치료용 백신 조성물
JP6902804B2 (ja) B型肝炎ウイルス様粒子をアジュバントとして含むワクチン組成物
KR20220039078A (ko) 사스-코로나바이러스-2의 변형된 스파이크 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
KR20220058090A (ko) D614g 변이형 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물
KR102039059B1 (ko) 일본 뇌염 바이러스 피막 단백질의 돌출 도메인을 포함하는 단백질, 이의 동형이량체, 및 이의 용도
KR20230075625A (ko) 스트렙토코커스 수이스의 면역원성 재조합 단백질 및 이를 포함하는 면역원성 조성물
KR20230004330A (ko) 중화항체 형성능 증진용 펩타이드 및 이를 포함하는 백신 조성물