KR20220040423A - 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 - Google Patents
재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 Download PDFInfo
- Publication number
- KR20220040423A KR20220040423A KR1020210125995A KR20210125995A KR20220040423A KR 20220040423 A KR20220040423 A KR 20220040423A KR 1020210125995 A KR1020210125995 A KR 1020210125995A KR 20210125995 A KR20210125995 A KR 20210125995A KR 20220040423 A KR20220040423 A KR 20220040423A
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- thr
- leu
- val
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/14011—Baculoviridae
- C12N2710/14041—Use of virus, viral particle or viral elements as a vector
- C12N2710/14043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Communicable Diseases (AREA)
- Physics & Mathematics (AREA)
- Animal Behavior & Ethology (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pulmonology (AREA)
- Immunology (AREA)
- Mycology (AREA)
- Epidemiology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질 및 이를 포함하는 사스-코로나바이러스-2 감염 예방 또는 치료용 약학 조성물을 제공한다.
Description
본 발명은 사스-코로나바이러스-2 (SARS-CoV-2) 감염증 예방 또는 치료용 백신 조성물에 관한 것으로, 더욱 구체적으로 사스-코로나바이러스-2 (SARS-CoV-2)로부터 유래된 폴리펩타이드를 포함하는 재조합 단백질을 이용한 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물에 관한 것이다.
사스-코로나바이러스-2 (SARS-CoV-2)는 중증 급성 호흡기 증후군 코로나바이러스 2 (Severe Acute Respiratory Syndrome Coronavirus 2) 또는 코비드 19 (COVID19)로 불리며, 한국에서는 코로나 19로 명명된다. 사스-코로나바이러스-2 는 2019년 12월 12일 우한 화난수산시장에서 처음 발견된 바이러스로, RNA 바이러스이며, 인간대 인간 (Human-to-human) 감염이 확인되었다. SARS-CoV-2는 ACE2 (Angiotensin Converting Enzyme2) 수용체를 통해 숙주세포의 표면에 강하게 부착하는 것으로 알려져 있으며, SARS-CoV-2의 스파이크단백질의 RBD(Receptor-Binding Domain)는 ACE2 수용체와 결합하는데 이용되는 것으로 알려져 있다.
사스-코로나바이러스-2는 생물안전 3등급 연구시설 (BSL-3 facility)에서 취급이 필요한 바이러스이며, 바이러스의 재생산지수(R0)를 1.4~3.9로 추정하고 있다. 이는 환자 1명이 최소 1.4명에서 최대 3.9명에게 바이러스를 옮길 수 있다는 것을 의미하여, 즉, 사스-코로나바이러스-2에 의한 감염병 통제가 상당히 어려운 것으로 추정하고 있으며, 2020년 3월 31일 기준으로 전세계 감염자 785,867명, 사망자 37,827명 정도로 집계되었다.
상기 바이러스 감염 후 2~14일간 발열, 호흡곤란, 신장 및 간 손상, 기침, 폐렴 등의 증상이 관찰되며, 아직까지 치료제는 개발되지 못하고 있는 상태이다.
치료제가 개발되지 못한 상황에서 감염을 예방하고, 지역사회에의 확산을 방지하기 위해 백신에 대한 연구가 절실하다. 해당 유행바이러스는 보통 고위험 병원체이기 때문에 불활화 및 생백신의 경우는 백신물질의 생산 및 인체투여에서 위험성 높다. 특히, 생백신의 경우 약독화 과정과 안전성 입증까지 매우 오랜 기간이 걸린다. 본 발명의 발명자들은 범용성, 안전성, 효력, 상용화의 측면에서 현재 대유행 신종감염병에 적용 가능한 재조합단백질 백신에 대해 연구하고 본 발명을 완성하게 되었다.
한편 재조합 단백질을 이용한 단백질 백신의 경우 발현 컨스트럭트로부터 수득하는 단백질의 수율이 낮아지는 문제가 종종 발생되었고, 이에 단백질 수율을 개선하고, 재조합 단백질의 구조를 안정화시켜 항체생성율을 증가시킨 새로운 형태의 재조합 단백질 백신 연구가 필요하게 되었다.
따라서 본 발명이 해결하고자 하는 과제는 본 발명은 상기와 같은 문제를 해결하기 위하여 사스-코로나바이러스-2의 감염증 예방 또는 치료를 위한 새로운 항원, 상기 항원을 포함하는 백신 조성물 또는 이의 제조 방법을 제공하고자 한다. 본 발명은 재조합 단백질 백신, 이를 이용한 사스-코로나바이러스-2의 감염증을 예방 또는 치료하는 방법 또는 상기 재조합 단백질 백신의 사스-코로나바이러스-2 감염증 예방 또는 치료 용도를 제공하고자 한다.
TM(transmembrane domain)이 제거된 S 단백질을 얻기 위한 발현 컨스트럭트는 단백질 수율이 향상된다는 이점이 있으나, 스파이크 단백질과 유사한 trimer 형성이 되지 않는 문제로 RBD 항원의 노출이 불완전하여 면역원성 유도에 효과적이지 않을 수 있기에 이러한 문제를 해결하고자 하였다. 서열번호 1의 펩타이드의 안정화 및 삼량체화를 형성하기 위해 외인성 폴리펩타이드 (바람직하게 도메인 (foldon)-P2)를 결합하여 항체 생성율 및/또는 세포성 면역 반응성을 향상시키고자 한다.
상기 과제를 해결하기 위해, 본 발명의 일 양태는 사스-코로나바이러스-2 (SARS-CoV-2) 감염증 예방 또는 치료용 재조합 항원 단백질, 상기 항원 단백질 발현용 컨스트럭트, 및 상기 재조합 항원 단백질을 포함하는 백신 조성물을 제공한다.
본 발명은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편 또는 유사체에 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질을 제공할 수 있다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 상기 사스-코로나바이러스-2 (COVID-19) 감염 예방용 조성물, 사스-코로나바이러스-2에 대한 면역원 생성을 위한 조성물, 사스-코로나바이러스-2에 대한 항체 생성용 조성물, 또는 백신 조성물을 위해 제공될 수 있다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 상기 사스-코로나바이러스-2 (COVID-19) 감염 예방용도, 사스-코로나바이러스-2에 대한 면역원 생성을 위한 용도, 사스-코로나바이러스-2에 대한 항체 생성용도, 또는 백신 용도를 위해 제공될 수 있다.
상기 외인성 폴리펩타이드는 '폴돈 도메인', 'P2 도메인', 또는 '폴돈 도메인과 P2 도메인이 연결된 도메인(즉, 폴돈-링커- P2 도메인)'으로 이루어진 군에서 선택된 어느 하나를 포함할 수 있다. 구체적으로 일 양태는 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드, 및 상기 폴리펩타이드의 C 말단에 선택적으로 폴돈 도메인 아미노산 서열; P2 도메인 아미노산 서열; 또는 폴돈 도메인 아미노산 서열과 P2 도메인 아미노산 서열이 함께 연결된, 사스-코로나바이러스-2 감염증 예방 또는 치료용 재조합 항원 단백질을 제공할 수 있다.
일 구현예에서 상기 재조합 항원 단백질은 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드(이하, '폴리펩타이드' 또는 '서열번호 1의 폴리펩타이드'로 칭한다)일 수 있다. 다른 구현예에서, 상기 재조합 항원 단백질은 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드의 C 말단에 폴돈 도메인 아미노산 서열이 연결될 수 있고, P2 도메인 아미노산 서열이 연결될 수 있고, 또는 폴돈 도메인 아미노산 서열과 P2 도메인 아미노산 서열이 함께 연결되어 제공될 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 4, 서열번호 5, 또는 서열번호 6으로 표시되는 아미노산 서열을 가질 수 있다.
상기 '연결되다'는 용어의 의미는 직접적으로 아미노산 서열이 이어지는 경우뿐만 아니라, 링커에 의해 이어지는 경우도 포함되며, 바람직하게 상기 폴돈 도메인 및 상기 P2 도메인은 링커에 의해 연결될 수 있다. 상기 '함께 연결되다'는 의미는 상기 폴돈 도메인의 C 말단에 P2 도메인이 링커로 연결되어 제공된다는 의미를 포함한다.
상기 '폴돈 도메인(foldon domain)'은 당업자에게 공지된 임의의 폴돈 서열을 가질 수 있다. 바람직하게 박테리오파지 T4 피브리틴의 폴돈(foldon)이 포함될 수 있으며, 서열번호 3의 아미노산 서열로 표현된다. 바이러스 표면의 스파이크 단백질은 trimer를 형성하고 있지만 TM(transmembrane domain)이 제거된 S-ectodomain은 안정적으로 trimer를 형성하지 못 하고 monomer나 dimer로 존재하기도 한다. 상기 폴돈 도메인은 S-ectodomain 항원이 안정적으로 trimer를 형성하도록 유도하여 바이러스 표면의 S와 유사한 구조를 이루도록 도우며, 항원 크기를 증가시키고 이로 인한 항원성을 증가시킬 수 있다.
상기 'P2 도메인' 은 T cell epitope의 하나로, Tetanus Toxoid Epitope P2 도메인을 의미한다. 본 원에서 서열번호 2의 아미노산 서열로 표현된다. 상기 P2 도메인이 결합되어 더 향상된 면역 증강 효과를 나타낼 수 있다.
상기 '링커'는 서열번호 1의 폴리펩타이드와 상기 도메인들을 연결시켜주거나, 상기 도메인들간의 연결이 가능하게 하며, 상기 링커는 적어도 4개의 아미노산 잔기로 이루어질 수 있으며, 예를 들어 16개 아미노산 이하 길이이며 바람직하게는 6개 이하 아미노산으로 이루어질 수 있다. 링커에 사용되는 아미노산은 G(Gly, 글리세린), S(Ser, 세린), 및 A(Ala, 알라닌) 중 하나 이상이며 바람직하게는 Gly-Ser-Gly-Ser-Gly (GSGSG), Gly-Ser-Ser-Gly (GSSG), Gly-Ser-Gly-Gly-Ser (GSGGS), Gly-Ser-Gly-Ser (GSGS), 및 Gly-Ser-Gly-Ser-Ser-Gly (GSGSSG)로 이루어진 군에서 선택된 어느 하나 이상의 펩타이드 링커일 수 있고, 바람직하게 본 발명의 목적상 GSGSG 또는 GSGGS 펩타이드 링커일 수 있다. 상기 링커로 연결될 때 안정적인 구조를 형성할 수 있다.
본원 명세서 내에 기재된 '기능적 단편'은 상기 재조합 단백질 항원이 갖는 기능을 나타내면서도 상기 재조합 단백질 항원 또는 이를 코딩하는 (폴리)뉴클레오티드 서열과 서열 상동성이 적어도 75%, 80%, 90%, 95%, 또는 99% 이상인 단백질, 또는 (폴리)뉴클레오티드를 의미하는 것으로 이해될 수 있다. '유사체'는 본 발명의 폴리펩타이드 또는 (폴리)뉴클레오티드가 갖는 기능 또는 효과와 유사하면서 상기 재조합 단백질 항원 또는 이를 코딩하는 (폴리)뉴클레오티드 서열과 서열 상동성이 적어도 75%, 80%, 90%, 95%, 또는 99% 이상인 단백질, 또는 (폴리)뉴클레오티드를 의미하는 것으로 이해될 수 있다.
상기 서열번호 1로 표시되는 아미노산 서열을 갖는 사스-코로나바이러스-2의 스파이크 단백질 (spike protein) 유래 폴리펩타이드는 도 1을 기준으로, 사스-코로나바이러스-2의 스파이크 단백질 (spike protein)의 전장 아미노산 서열에서 heptad repeat 2 (HR2) 이하의 영역이 절단되어 얻어질 수 있으며, 특히 야생형 COVID-19의 S 단백질을 이루는 아미노산 서열의 1147 이후 부분을 제거하여 얻을 수 있다. HR2 이하의 영역이 절단됨으로 인해, 상기 폴리펩타이드는 S 단백질의 transmembrane domain (TM) 및 cytoplasmic domain (CP)이 함께 상실된다. 본 발명의 발명자들은 서열번호 1로 표시되는 상기 폴리펩타이드를 암호화하는 서열은 단백질 발현 시스템에서 우수한 발현 수율을 갖는다는 것을 확인하게 되었다. 이를 통해 항원 수득율을 증가시킬 수 있다. SP(시그널 펩타이드)는 발현 시스템의 분비과정에서 떨어지는 특성상 면역원성 조성물 또는 백신에서 제외될 수 있다.
본 발명의 일 양태는 상기 폴리펩타이드가 갖는 적어도 하나의 아미노산에 변이가 일어난 재조합 항원 단백질을 포함한다. 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드를 포함하는 폴리펩타이드 또는 단백질에 적어도 하나 이상의 아미노산이 치환된 변이를 가질 수 있다. 상기 변이는 아미노산의 치환, 결실, 부가 등이 포함되나, 바람직하게 치환을 포함한다. 상기 서열번호 1의 폴리펩타이드가 갖는 아미노산 서열이 치환됨으로 인해 항원 수득율을 증가시킬 수 있다. 상기 치환이라 함은 원래 가지고 있던 아미노산 서열이 다른 아미노산 서열로 대체되는 것을 의미하는 것으로 이해될 수 있다. 적어도 하나의 아미노산이 치환될 수 있으며, 바람직하게 1개 내지 11개의 아미노산이 치환될 수 있고, 예를 들어, 2개 내지 10개의 아미노산이 다른 아미노산으로 치환될 수 있으며, 또 다른 예는 9개, 8개, 7개, 6개, 5개, 4개, 3개 또는 2개의 아미노산이 치환될 수 있다.
바람직하게 상기 변이는 상기 서열번호 1의 폴리펩타이드의 C 말단에 폴돈 도메인이 연결된 재조합 항원 단백질(서열번호 5, SK-S-trimer) 또는 서열번호 1의 폴리펩타이드의 C 말단에 폴돈 도메인과 P2 도메인이 함께 연결된 재조합 항원 단백질(서열번호 6, SK-S-trimer-P2)에서 추가로 더 치환 변이가 일어나 얻어질 수 있다.
일 구현예에서 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, iii) 카텝신(Cathepsin) L 절단 부위 변이, 및 iv) S2 서브유닛 변이로 이루어진 군에서 선택된 어느 하나 이상의 변이를 포함할 수 있다.
i) 2 프롤린 변이
본 발명의 일 양태에서 상기 i) 2 프롤린 변이는 서열번호 1의 폴리펩타이드의 973번 위치의 아미노산 라이신(K)이 프롤린(P)으로 치환되고, 974번 위치의 아미노산 발린(V)이 프롤린(P)으로 치환된 변이를 가질 수 있으며, 이는 각각 K973P 및 V974P로 표현될 수 있다. 이는 서열번호 1을 기준으로 973번째 아미노산이 K에서 P로, 974번째 아미노산이 V에서 P로 치환되었음을 의미한다. 구체적으로 상기 서열번호 1의 폴리펩타이드의 973번 위치의 라이신(K) 아미노산이 프롤린(P) 아미노산으로 치환되고, 974번 위치의 발린(V) 아미노산이 프롤린(P) 아미노산으로 치환된 변이를 가질 수 있다. 상기와 같은 치환으로 항원이 prefusion 형태로 안정화될 수 있고, 항원 수득율을 향상시키고, 이는 중화항체가 유도 능력을 향상시킬 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 7 (SK- S-Trimer-2proline) 및 서열번호 8(SK-S-Trimer-P2-2proline) 로 표현된 아미노산 서열을 가질 수 있다.
ii) 퓨린 (furin) 절단 부위 변이
상기 ii) 퓨린 (furin) 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 669-672에 대응하는 아미노산 RRAR이 GSAG 또는 HHAH로 치환된 변이로 이해될 수 있다. 상기 퓨린 절단 부위는 숙주세포에 존재하는 퓨린 단백질 또는 퓨린 유사 단백질 분해효소 (이하, 퓨린)에 의해 인식 및 절단이 일어나는 스파이크 단백질의 부위를 의미하며, 바람직하게 스파이크 단백질의 669-672번 위치의 아미노산 서열 RRAR이 여기에 해당한다. 상기 퓨린 절단 부위에 아미노산의 치환이 일어나는 경우 단백질 수율이 증가되고, 단백질의 안정성을 향상시킬 수 있다. 바람직하게 상기 아미노산 서열은 669-672번 위치의 아미노산 서열 RRAR은 GSAG으로 또는 HHAH으로 치환된 형태를 포함한다. 바람직하게 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 퓨린(furin) 절단 부위의 아미노산 치환은 i) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 세린(S) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되거나(즉, R669G, R670S, 또는 R672G), 또는 ii) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 히스티딘(H) 아미노산으로 치환(즉, R669H, R670H, 또는 R672H)된 형태를 포함한다. 상기와 같은 위치에서 상기와 같은 서열로 변이를 유발하여 단백질 안정성을 향상시키고, 중화 항체가 유도능 증가로 면역 반응을 증가시킬 수 있다. 바람직하게 상기 재조합 항원 단백질은 서열번호 9 (SK-S-trimer-P2(GSAG)-2proline) 또는 서열번호 11 (SK-S-trimer-P2-(HHAH)-2proline) 로 표현된 아미노산 서열을 갖는다.
iii) 카텝신(Cathepsin) L 절단 부위 변이
상기 iii) 카텝신(Cathepsin) L 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 681-682에 대응하는 아미노산 AY가 GS로 치환될 수 있다. 구체적으로 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 카텝신(Cathepsin) L 절단 부위의 아미노산 치환은 상기 서열번호 1의 아미노산 서열의 681번 위치의 알라닌(A) 아미노산이 글리신(G) 아미노산으로 치환되고, 682번 위치의 티로신(Y) 아미노산이 세린(S) 아미노산으로 치환된, 재조합 항원 단백질을 포함한다.
상기 카텝신(Cathepsin) L 절단 부위는 스파이크 단백질에서 숙주세포에 존재하는 카텝신 L 단백질에 의해 인식 또는 절단이 일어나는 부위를 의미하며, 바람직하게 스파이크 단백질의 681번 및 682번 위치의 아미노산 서열 알라닌(A) 및 티로신(Y)에서 변이를 유발할 수 있다. 상기 카텝신(Cathepsin) L 절단 부위에서 아미노산의 치환이 일어나는 경우 단백질 수율이 증가되고, 단백질의 안정성을 향상시킬 수 있다. 바람직하게 상기 아미노산 서열은 681-682번 위치의 아미노산 서열 알라닌(A) 및/또는 티로신(Y)은 각각 글리신(G) 및/또는 세린(S)으로 치환된 형태를 포함한다. 상기 글리신(G) 및/또는 세린(S)로의 치환은 주변 구조에 미치는 영향이 적고, 안정적인 스파이크 단백질 구조를 유지할 수 있다. 바람직하게 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 카텝신(Cathepsin) L 절단 부위의 아미노산 치환은 상기 서열번호 1의 아미노산 서열의 681번 위치의 알라닌(A) 아미노산이 글리신(G) 아미노산으로 치환되고, 682번 위치의 티로신(Y) 아미노산이 세린(S) 아미노산으로 치환된 형태를 포함한다(즉, A681G, Y682S). 상기와 같은 위치에서 상기와 같은 서열로 변이를 유발하여 단백질 안정성을 향상시키고 수율을 증가시킨다. 바람직하게 상기 재조합 항원 단백질은 서열번호 10 (SK-S-trimer-P2(GSAG/Ca)-2proline)으로 표현된 아미노산 서열을 갖는다.
iv) S2 서브유닛 변이
상기 S2 서브유닛 변이는 S 단백질의 S2 서브유닛을 형성하는 아미노산 중 적어도 4개의 아미노산이 치환된 것으로, F804P, A879P, A886P, 및 A929P 변이를 포함할 수 있다. 상기 서열번호 1의 아미노산 서열의 4개의 아미노산이 더 치환되어, 서열번호 1 기준으로 804, 879, 886, 및 929 위치에 존재하는 아미노산이 각각 페닐알라닌(F)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로 더 치환될 수 있다. 이러한 아미노산의 치환으로 더욱 더 항원 수득율이 증가될 수 있고, 단백질 안정성이 향상된다. 바람직하게, 본 발명의 일 실시예는 i) 상기 서열번호 1의 아미노산 서열의 669번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 670번 위치의 아르기닌(R) 아미노산이 세린(S) 아미노산으로 치환되고, 672번 위치의 아르기닌(R) 아미노산이 글리신(G) 아미노산으로 치환되고, 여기에 추가로 상기 서열번호 1의 아미노산 서열의 4개의 아미노산이 더 치환되어, 804, 879, 886, 및 929 위치의 아미노산이 각각 페닐알라닌(F)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로, 알라닌(A)에서 프롤린(P)으로 치환된 재조합 항원 단백질을 포함한다. 상기 재조합 항원 단백질은 서열번호 12로 표현되는 아미노산 서열을 갖는다.
다른 실시양태에서 상기 서열번호 1의 아미노산 서열로 표현된 폴리펩타이드의 퓨린(furin) 절단 부위, 카텝신(Cathepsin) L 절단 부위 또는 이들 모두에 아미노산 치환이 발생될 수 있다. 바람직하게 상기 변이는 예를 들어, 서열번호 7을 기준으로 폴리펩타이드의 퓨린(furin) 절단 부위(cleavage site), 및/또는 카텝신(Cathepsin) L 절단 부위에 해당하는 아미노산 서열이 새로운 아미노산으로 치환되어 얻어질 수 있다.
본 발명의 발명자들은 SARS-CoV-2의 스파이크 단백질의 RBD 영역만으로는 달성하기 어려운, 바이러스 표면 스파이크 단백질과 유사한 3차, 4차 구조 형성, 항원 단백질의 prefusion 형태 구조안정화, 항원 크기 증가, 면역원성 증가, 중화항체가 유도능 증가 등이 달성됨을 확인하고 본 발명을 완성하게 되었다.
본 명세서에서 사용된 용어 "재조합 항원 단백질"은 SARS-CoV-2 감염증 예방 또는 치료를 위한 항원으로서, 구체적으로, SARS-CoV-2의 스파이크 단백질의 특정 위치에서 선별된, 특정 구간의 아미노산 서열을 포함하는 단백질을 의미한다. 상기 재조합 항원 단백질은 SARS-CoV-2의 스파이크 단백질의 일부 영역의 절단, 외래 유전자와의 결합 등을 통해 인위적으로 만들어진 단백질을 의미한다.
본 발명은 상기 정의한 재조합 단백질 항원을 암호화하는 뉴클레오타이드 서열을 제공하며, 상기 재조합 단백질 항원 발현을 위한 항원 발현용 컨스트럭트를 제공한다. (a) 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 적어도 1종 이상의 외인성 폴리펩타이드가 연결된 재조합 사스-코로나바이러스-2 항원 단백질을 코딩하는 뉴클레오타이드 서열; 또는 서열번호 4 내지 12로 이루어진 재조합 항원 단백질을 코딩하는 뉴클레오타이드 서열, 및 (b) 상기 재조합 사스-코로나바이러스-2 항원 단백질을 세포로부터 분비시키기 위한 시그널 서열을 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트를 제공할 수 있다. 본 발명의 일 구현예는 사스-코로나바이러스-2 감염증 예방 또는 치료용 재조합 항원 단백질 생산을 위한 발현 컨스트럭트를 제공한다. 바람직하게 서열번호 4 내지 12로 표현되는 아미노산 서열 중에서 선택된 어느 하나 이상의 서열을 갖는 재조합 항원 단백질을 발현하기 위한, 발현용 컨스트럭트를 제공한다. 바람직하게 상기 발현 컨스트럭트는 서열번호 13 내지 서열번호 32로 이루어진 군에서 선택된 어느 하나의 뉴클레오타이드 서열을 갖는다. 상기 뉴클레오타이드 서열을 갖는 발현 컨스트럭트는 단백질 수득율이 높고, 안정적인 구조를 갖는 단백질을 생산할 수 있다. 바람직하게 서열번호 13 내지 서열번호 22 중에서 선택된 어느 하나의 서열을 갖는 뉴클레오타이드는 중국 햄스터의 난소세포(Chinese Hamster ovary cell, CHO) 포유동물 발현 시스템을 통해, 서열번호 23 내지 서열번호 32 중에서 선택된 어느 하나의 서열을 갖는 뉴클레오타이드는 배큘로바이러스 발현 시스템(BEVS)을 통해 본 발명의 재조합 항원 단백질을 얻을 수 있다.
본 명세서에서 용어 "발현 컨스트럭트(expression construct)"는 세포내에서 단백질 발현을 위한 최소의 엘리먼트(elemnet)만을 포함하는 핵산분자를 의미하는 것으로 이해된다.
상기 발현 컨스트럭트는 상기 항원 단백질의 분비를 돕는 시그널 서열을 코딩하는 뉴클레오티드 서열과 연결되어 제공될 수 있다.
본원에 사용된 용어 "시그널 펩타이드" 또는 "시그널 서열"은 본원에서 호환적으로 사용되고 숙주 세포에서 단백질을 분비 경로로 지시하는, 새로 합성된 폴리펩타이드 사슬의 N-말단에 존재하는 짧은 펩타이드 (일반적으로 5-30개 아미노산 길이를 갖지만, 이에 제한되지 않는다.)를 의미한다. 상기 시그널 서열은 자체의 시그널 펩타이드 또는 본원에서 언급된 시그널 펩타이드는 단백질 분비 과정에서 제거된다. 상기 '자체 시그널 서열'은 SARS-CoV-2의 스파이크 단백질이 갖는 시그널 서열을 의미한다. 상기 '이종 유래의 시그널 펩타이드 또는 시그널 서열'이라 함은 SARS-CoV-2의 스파이크 단백질이 갖는 시그널 서열이 아닌, 외부에서 도입되거나, 새로 합성된 시그널 서열을 의미한다. 바람직한 이종 유래의 시그널 서열은 Honeybee melittin signal peptide, murine phosphatase signal peptide, 및/또는 인간 알부민 시그널 펩타이드이며, 바람직하게 본 발명의 목적상 인간 알부민 시그널 펩타이드를 사용할 수 있다. 바람직하게 상기 뉴클레오타이드 서열은 DNA 서열이다.
본 발명의 재조합 항원 단백질을 적합한 발현 벡터를 사용하여, 원핵 또는 진핵 발현 시스템에서 클로닝 및 발현에 의해 제조할 수 있다. 당해 분야에 공지된 임의의 방법을 사용할 수 있다. 바람직하게 본 발명의 목적 및 단백질 발현율 등을 고려하여, BEVS, CHO 또는 E.coli 발현시스템을 사용할 수 있으며, 바람직하게 BEVS 및/또는 CHO 발현 시스템을 사용할 수 있다. 벡터는 임의의 적절한 유형일 수 있고, 비제한적으로 파아지, 바이러스, 플라스미드, 파지미드(phagemid), 코스미드(cosmid), 백미드(bacmid) 등을 포함할 수 있다. 예를 들어 본 발명의 항원을 암호화하는 DNA 분자를 당해 분야에 널리 공지된 기법에 의해 적합하게 제작된 발현 벡터에 삽입한다.
본 발명의 일 구현예에 따른 발현 컨스트럭트는 배큘로바이러스 발현 시스템(BEVS)을 이용한다.
배큘로바이러스 발현 시스템은 업계에서 이미 재조합 단백질 생산을 위해 널리 사용되고 있는 것을 제한없이 사용할 수 있다. 예를 들어, pBAC4x-1(Novagen)과 같은 상업적으로 유용한 배큘로바이러스 벡터가 사용될 수 있다. 본 발명에서 사용하는 적당한 배큘로바이러스 프로모터는 문헌에 잘 알려져 있다. 배큘로바이러스 프로모터는 폴리헤드린(polyhedrin), p10 프로모터 등 일반적으로 사용되는 프로모터가 사용될 수 있다. 상기 항원 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 발현 컨스트럭트가 포함된 배큘로바이러스 벡터를 대장균에 형질전환하여 얻어진 재조합 백미드 (Bacmid), 및 이를 게놈으로 포함하는 재조합 배큘로바이러스도 제공된다. 상기 재조합 백미드를 포함하거나, 상기 재조합 배큘로바이러스로 형질감염된 숙주세포도 본 발명의 범위에 포함된다.
본 발명의 항원 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 DNA 분자들은 전사 및 번역 조절 신호를 갖는 벡터에 삽입시킬 수 있다. 상기 도입된 DNA에 의해 안정하게 형질전환된 세포를, 또한 상기 발현 벡터를 함유하는 숙주 세포의 선택을 허용하는 하나 이상의 마커를 도입시킴으로써 선택할 수 있다. 상기 마커는 예를 들어 항생제 내성, 결핍 영양소 합성 유전자 등을 제공할 수 있다. 일단 상기 구조물을 함유하는 벡터 또는 DNA 서열을 발현을 위해 제조하였으면, 상기 DNA 구조물을 다양한 적합한 수단들 중 어느 하나, 즉 형질전환, 형질감염, 접합, 원형질체 융합, 일렉트로포레이션, 칼슘 포스페이트-침전, 직접 미세주입 등에 의해 적합한 숙주 세포에 도입시킬 수 있다.
바람직한 숙주 세포는 진핵 숙주 세포로, 예를 들어, 곤충 세포로 Baculovirus 발현시스템을 이용하는 Sf9, Sf21과 같은 Spodopterafrugiperda (Sf) 세포, 하이 파이브 세포와 같은 Trichoplusia ni 세포 및 Drosophila S2 세포들을 포함할 수 있고, 포유류 세포로 중국 햄스터 난소(CHO) 세포를 포함할 수 있다. 적당한 숙주 세포주는 임의의 중국 햄스터 난소 (CHO) 세포주일 수 있다. '숙주세포'라는 용어는 배양액에서 성장할 수 있고 목적하는 단백질 재조합 산물 단백질을 발현할 수 있는 세포를 지칭한다. 적당한 세포주로는, 예컨대, CHO K1, CHO pro3-, CHO DG44, CHO P12 등을 포함할 수 있으며, 이에 제한되지 않는다.
상기 숙주 세포를 통해 우수한 발현율의 재조합 항원 단백질을 얻을 수 있다. 비제한적인 예로 본 발명의 목적을 저해하지 않는 범위 내에서 상기 진핵 숙주 세포의 예로 효모, 조류, 식물, 꼬마선충(또는 선충) 등을 포함할 수 있고, 원핵 숙주 세포들은, 예를 들어, 대장균(E. coli, B. subtilis), 살모넬라티피균(Salmonella typhi) 및 마이코박테리아와 같은 박테리아 세포를 포함할 수 있다. 벡터의 도입 후, 상기 숙주 세포를 일반배지 또는 선택성 배지(벡터 함유 세포의 성장을 위해 선택한다)에서 증식시킨다. 상기 클로닝된 유전자 서열(들)의 발현 결과 목적하는 단백질이 생산된다. 상기 재조합 항원 단백질의 정제를 상기 목적으로 공지된 방법들 중 어느 하나, 즉 추출, 침전, 크로마토그래피, 전기영동 등을 수반하는 임의의 통상적인 과정에 의해 수행할 수 있다.
본 발명의 또 다른 태양은 상기 재조합 항원 단백질의 제조 방법을 제공하며, 상기 방법은 본 발명의 뉴클레오타이드 서열을 함유하는 벡터로 형질전환시킨 숙주 세포를 배양하고 목적하는 생성물을 단리함을 포함할 수 있다.
본 발명의 다른 구현예는 사스-코로나바이러스-2 감염증 예방 또는 치료를 위한, 상기 재조합 단백질 항원의 새로운 용도를 제공하며, 상기 항원을 개체에 투여하여 사스-코로나바이러스-2 감염을 예방 또는 치료하는 사스-코로나바이러스-2 감염증 예방 방법을 제공한다.
본 발명의 또 다른 구현 예에서는 본 발명에 따른 상기 재조합 항원 단백질을 유효성분으로 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물을 제공한다. 상기 '사스-코로나바이러스-2 감염증'이라 함은 사스-코로나바이러스-2 자체의 감염뿐만 아니라, 상기 바이러스의 감염으로부터 발생되는 여러가지 병증 (예를 들어, 호흡기 질환, 폐렴 등)을 넓게 포함하는 개념으로 이해될 수 있다. 본 발명에서 상기 백신은 당업계에서 잘 알려진 통상적인 방법으로 제조될 수 있고, 당업계에서 백신 제조 시 사용할 수 있는 여러 첨가물을 선택적으로 더 포함할 수 있다. 본 발명에 따른 백신 조성물은 상기 재조합 항원 단백질 및 약학적으로 허용가능한 담체를 포함할 수 있다. 이에 제한되는 것은 아니지만 예를 들면, 제제시에 통상적으로 이용되는 것으로서, 락토스, 덱스트로스, 수크로스, 솔비톨, 만니톨, 전분, 아카시아 고무, 인산 칼슘, 알기네이트, 젤라틴, 규산 칼슘, 미세결정성 셀룰로스, 폴리비닐피롤리돈, 셀룰로스, 물, 시럽, 메틸 셀룰로스, 메틸히드록시벤조에이트, 프로필히드록시벤조에이트, 활석, 스테아르산 마그네슘 및 미네랄 오일 등을 포함하나, 이에 한정되는 것은 아니다. 본 발명의 약제학적 조성물은 상기 성분들 이외에 TWEEN™, 폴리에틸렌 글리콜 (PEG) 등과 같은 비-이온성 계면 활성제, 아스코르브 산을 포함하는 항산화제, 윤활제, 습윤제, 감미제, 향미제, 유화제, 현탁제, 보존제 등을 추가로 포함하여 사용될 수 있다. 본 발명에서 상기 백신은, 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있는 방법에 따라, 약제학적으로 허용되는 담체 및/또는 부형제를 이용하여 제제화함으로써 단위 용량 형태로 제조되거나 또는 다용량 용기 내에 내입시켜 제조될 수 있다. 이때 제형은 오일 또는 수성 매질중의 용액, 현탁액 또는 유화액 형태이거나 엑스제, 분말제, 과립제, 정제 또는 캅셀제 형태일 수도 있으며, 분산제 또는 안정화제를 추가적으로 포함할 수 있다. 본 발명에서 상기 백신의 적합한 투여량은 제제화 방법, 투여 방식, 환자의 연령, 체중, 성, 병적 상태, 음식, 투여 시간, 투여 경로, 배설 속도 및 반응 감응성과 같은 요인들에 의해 다양하게 처방될 수 있다. 한편, 본 발명에 따른 백신의 투여량은 바람직하게는 도즈 당 1 ~ 100 ug 일 수 있다. 본 발명의 일 구체 예에서는 상기 재조합 항원 단백질을 유효성분으로 포함하는 백신은 정맥내주사, 근육 내주사, 피하내주사, 경피전달 또는 기도흡입으로 체내에 투여될 수 있으나, 이에 제한되는 것은 아니다.
상기 백신 조성물은 면역 반응 효과를 향상시키기 위해, 면역학적 애쥬반트를 더 포함할 수 있으며, 상기 면역학적 애쥬반트와 함께 또는 면역학적 애쥬반트없이 사스-코로나바이러스-2의 nucleocapsid (N) 단백질을 더 포함할 수 있다.
상기 면역학적 애쥬반트는 예를 들어 스쿠알렌(MF59, AddavaxTM), 리포솜, TLR agonist, MPL(monophosphoryl lipid A)(AS04), 마그네슘 하이드록사이드, 마그네슘 카보네이트 하이드독사이드 펜타하이드데이트, 티타듐다이독사이드, 칼슘 카보네이트, 바륨 옥사이드, 바륨 하이이드록사이드, 바륨 퍼옥사이드, 바륨 설페이트, 칼슘 설페이트, 칼슘 파이로포스페이트, 마그네슘 카보네이트, 마그네슘 옥사이드, 알루미늄 하이드록사이드, 알루미늄 포스페이트 및 수화된 알루미늄 포타슘 설페이트(Alum)로부터 선택된 어느 하나 이상일 수 있으나, 이에 제한되는 것은 아니다.
상기 '사스-코로나바이러스-2의 nucleocapsid (N) 단백질'은 서열번호 33의 인위적으로 만들어진 사스-코로나바이러스-2의 nucleocapsid (N) 단백질이다. N 단백질은 세포성 면역을 유도할 수 있으며, 본 발명의 일 구현예에 따라 얻어진 재조합된 항원 단백질과 함께 사용하여 증가된 보호면역원성을 유도할 수 있다. 상기 서열번호 33의 단백질의 N 단백질 발현을 위한 컨스트럭트는 상기 N 단백질의 N-말단에 인간 알부민 시그널 펩타이드(서열번호 34)를 발현할 수 있는 뉴클레오타이드 서열이 융합되어 제공될 수 있다. 바람직하게 BEV 발현 시스템에서 최적화된 뉴클레오타이드 서열은 서열번호 35로, CHO 발현 시스템에서 최적화된 뉴클레오타이드 서열은 서열번호 36으로 표현된다.
서열번호 | 비고 | 구분 |
1 | SK-S-ecto | 펩타이드 |
2 | P2 | 펩타이드 |
3 | 폴돈 | 펩타이드 |
4 | SK-S-ecto-P2 재조합 항원 단백질 | 펩타이드 |
5 | SK-S-trimer 재조합 항원 단백질 | 펩타이드 |
6 | SK-S-trimer-P2 재조합 항원 단백질 | 펩타이드 |
7 | SK- S-Trimer-2proline 재조합 항원 단백질 | 펩타이드 |
8 | SK-S-Trimer-P2-2proline 재조합 항원 단백질 | 펩타이드 |
9 | SK-S-trimer-P2(GSAG)-2proline 재조합 항원 단백질 | 펩타이드 |
10 | SK-S-trimer-P2(GSAG/Ca)-2proline 재조합 항원 단백질 | 펩타이드 |
11 | SK-S-trimer-P2-(HHAH)-2proline 재조합 항원 단백질 | 펩타이드 |
12 | SK-S-trimer-P2(GSAG)6proline 재조합 항원 단백질 | 펩타이드 |
13 | SK-S-ecto의 CHO 코돈최적화 | 뉴클레오타이드 |
14 | SK-S-ecto-P2 의CHO 코돈최적화 | 뉴클레오타이드 |
15 | SK-S-trimer 의 CHO 코돈최적화 | 뉴클레오타이드 |
16 | SK-S-trimer-P2 의 CHO 코돈최적화 | 뉴클레오타이드 |
17 | SK- S-Trimer-2proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
18 | SK-S-Trimer-P2-2proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
19 | SK-S-trimer-P2(GSAG)-2proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
20 | SK-S-trimer-P2(GSAG/Ca)-2proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
21 | SK-S-trimer-P2-(HHAH)-2proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
22 | SK-S-trimer-P2(GSAG)-6proline 의 CHO 코돈최적화 | 뉴클레오타이드 |
23 | SK-S-ecto 의 BEV 코돈최적화 | 뉴클레오타이드 |
24 | SK-S-ecto-P2 의 BEV 코돈최적화 | 뉴클레오타이드 |
25 | SK-S-trimer 의 BEV 코돈최적화 | 뉴클레오타이드 |
26 | SK-S-trimer-P2 의 BEV 코돈최적화 | 뉴클레오타이드 |
27 | SK- S-Trimer-2proline 의 BEV 코돈최적화 | 뉴클레오타이드 |
28 | SK-S-Trimer-P2-2proline 의 BEV 코돈최적화 | 뉴클레오타이드 |
29 | SK-S-trimer-P2(GSAG)-2proline 의BEV 코돈최적화 | 뉴클레오타이드 |
30 | SK-S-trimer-P2(GSAG/Ca)-2proline 의 BEV 코돈최적화 | 뉴클레오타이드 |
31 | SK-S-trimer-P2-(HHAH)-2proline 의 BEV 코돈최적화 | 뉴클레오타이드 |
32 | SK-S-trimer-P2(GSAG)6proline 의 BEV 코돈최적화 | 뉴클레오타이드 |
33 | N 단백질 | 펩타이드 |
34 | Human albumin SP (1-18) | 펩타이드 |
35 | N 단백질의 BEV 코돈최적화 | 뉴클레오타이드 |
36 | N 단백질의 CHO 코돈최적화 | 뉴클레오타이드 |
37 | SK-RBD-P2 재조합 항원 단백질 | 펩타이드 |
38 | SK-RBD 재조합 항원 단백질 | 펩타이드 |
39 | SP+ SK-S-ecto 재조합 항원 단백질 | 펩타이드 |
본 발명의 일 구현예에 따른 재조합 단백질 및/또는 재조합 바이러스 백신은 안전성이 높다. 본 발명의 일 구현예에 따른 백신은 우수한 면역원성을 가지며, 백신으로 우수한 효능을 갖는다.
본 발명의 백신은 중화항체가가 높다.
본 발명의 백신은 세포성 면역의 유도 효과가 우수하다.
본 발명은 사스-코로나바이러스-2 감염에 대한 예방 및 치료효과가 우수하다.
본 발명의 재조합 항원 단백질은 안정적인 형태의 3차원 스파이크 단백질 구조 (바람직하게 바이러스 표면 스파이크 단백질 구조(ectodomain 부분을 포함), 더 바람직하게 prefusion 형태 스파이크 단백질 삼량체 구조)를 유지할 수 있다.
본 발명의 재조합된 항원을 이용해 높은 항체 생성율을 가질 수 있다.
본 발명은 안전한 사스-코로나바이러스-2 감염증 예방용 조성물, 바람직하게 백신 조성물을 제공할 수 있다. 본 발명은 재조합 항원 단백질은 사스-코로나바이러스-2 감염 예방, 사스-코로나바이러스-2 감염에 대한 항체 생성, 또는 사스-코로나바이러스-2 감염 세포의 사멸에 사용하기 위한 백신 조성물로 제공될 수 있다.
본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 전술한 발명의 내용과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 SARS-CoV2 spike full-length protein 도메인 구조의 schematic diagram을 나타낸다.
도 2 및 3은 본 발명의 일 양태에 따른 재조합 단백질을 예시적으로 도식화한 그림이다.
도 4는 자극원에 따른 IFN-gamma 분비 T세포의 증가 정도를 확인한 결과이다.
도 1은 SARS-CoV2 spike full-length protein 도메인 구조의 schematic diagram을 나타낸다.
도 2 및 3은 본 발명의 일 양태에 따른 재조합 단백질을 예시적으로 도식화한 그림이다.
도 4는 자극원에 따른 IFN-gamma 분비 T세포의 증가 정도를 확인한 결과이다.
이하, 본 발명의 이해를 돕기 위하여 실시예 등을 들어 상세하게 설명하기로 한다. 그러나, 본 발명에 따른 실시예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예들에 한정되는 것으로 해석되어서는 안 된다. 본 발명의 실시예들은 본 발명이 속한 분야에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해 제공되는 것이다.
1. 사스-코로나바이러스-2의 Spike protein을 이용한 항원 발현용 컨스트럭트 제조
(1) 서열번호 1의 폴리펩타이드에 P2 도메인과 폴돈 도메인 연결하여 제작
백신 제조에 사용하는 항원 단백질을 제작하기 위해 Genbank # MN908947 Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1의 서열을 참고하여 S 유전자, N 유전자 서열을 준비하였다.
도 1은 SARS-CoV2 spike full-length protein 도메인 구조의 schematic diagram을 나타낸다. 이를 이용하여 항원 발현용 컨스트럭트를 제조하였다.
사스-코로나바이러스-2 항원 단백질 발현을 위해 여러 시리즈의 발현 컨스트럭트를 고안하였다. 고안된 발현 컨스트럭트를 통해 얻어진 재조합 단백질을 도 2 및 3에 상세히 도시하였다. P2는 Tetanus P2 domain을, foldon은 T4 피브리틴의 폴돈 단백질 발현 도메인을 의미한다. 여기서 P2 도메인과 폴돈 단백질 발현 도메인은 각각 GSGSG 펩타이드 Linker로 연결되게 하였다.
제작된 재조합 단백질의 적절한 분비 또는 이동을 위해, 상기 재조합 단백질 발현을 위한 컨스트럭트의 upstream에 시그널 펩타이드를 코딩하는 뉴클레오타이드 서열을 작동가능하게 연결하였다. Baculo 발현 시스템을 통해 발현할 때는 S-ecto, 및 S-ecto-P2로 칭하는 발현 컨스트럭트는 자체 시그널 펩타이드를 사용하고, 그 외 construct는 서열번호 3의 시그널 펩타이드를 코딩하는 뉴클레오타이드 서열로 교체하여 사용하였다. CHO 발현 시스템을 통해 발현할 때는 S 단백질의 자체 SP 서열이 발현될 수 있도록 하였다.
(2) 2개의 프롤린 뮤턴트 제작
폴돈 도메인을 부착하거나, 폴돈 도메인에 P2 도메인이 연결된 재조합 항원 단백질을 기준으로, 2개의 프롤린 아미노산을 도입하였다. 구체적으로 서열번호 7 및 8과 같이 K973P 및 V974P을 도입하였다. 이를 통해 단백질이 prefusion 형태로 안정화된 재조합 항원 단백질을 얻을 수 있었다.
(3) cleavage site 변이
Furin cleavage site 및 Cathepsin L cleavage site에 변이를 도입하여 SK-S-trimer-P2(GSAG/Ca)-2proline재조합 단백질을 제작하였다. 이를 서열번호 10으로 나타냈다.
상기 재조합 단백질은 발현 및 정제 과정 중 proteolytic degradation에 저항성을 가졌으며, S1, S2 2개의 서브유닛으로 분리되지 않고 단일 폴리펩타이드로 발현 정제되어 단백질 수율이 증가하고 안정적인 구조를 나타냈다.
(4) 추가 변이
서열번호 9를 기준으로 F804P, A879P, A886P, A929P 변이를 도입하였고, 우수한 단백질 안정성 및 수득율을 얻을 수 있었다.
각 컨스트럭트들이 발현될 때 periplasmic region 혹은 배양 배지로 재조합 단백질이 secretion 될 수 있도록 각 발현 시스템에 원래 가지고 있는 signal peptide 혹은 이종의 signal peptide를 코딩하는 유전자를 유지, 치환 혹은 첨가하였다. Spike 단백질은 N-terminal 1~13 aa이 자체 signal peptide이며, 배큘로바이러스 시스템, CHO cell 발현 시스템, mammalian cell 발현 시스템에서 원래의 시그널 펩타이드가 그대로 발현될 수 있게 하였다. N 단백질은 원래 시그널 펩타이드가 달려있지 않은 단백질이기 때문에 human albumin signal peptide 암호화 뉴클레오티드 서열을 N 말단에 첨가하였다.
2. 기타 단백질을 이용한 항원 제조
사스-코로나-2 바이러스의 N 단백질 유전자를 기초로 서열번호 33의 N 단백질 항원을 제조하였다.
3. 코돈 최적화
재조합 단백질을 암호화하는 DNA 서열은 진스크립트 (GenScript)에서 곤충 세포, 및 Chinese Hamster Ovary(CHO) cell에 최적화된 코돈으로 각각 합성되었다.
각 발현시스템에 코돈-최적화된 서열은 다음과 같다. 하기 서열은 폴리뉴클레오티드 서열이다.
상기 재조합 항원 단백질 발현용 컨스트럭트는 서열번호 13 내지 32로 표현되는 뉴클레오타이드 서열로 나타냈다.
상기 폴돈 도메인은 항원이 trimer를 형성하도록 유도하여 항원 크기를 증가시키고 이로 인한 항원성을 증가시킬 수 있다.
4. 재조합 단백질 백신 제조
Baculo, 및 CHO를 이용하여 하기와 같은 과정으로 백신의 효과를 확인하였다.
1.1
재조합단백질의 생산
1.1.1
배큘로바이러스 발현시스템을 이용한 재조합단백질 생산
1.1.1.1
사스-코로나바이러스-2의 항원유전자를 발현시키기 위하여 각 유전자를 합성하였다. 도 2 및 3의 단백질 발현용 컨스트럭트, 및 N 단백질 발현용 컨스트럭트를 각각 준비하였다. 전이 벡터 pFastBac1 (Invitrogen)에 상기 준비된 컨스트럭트 유전자를 삽입하여 클로닝하고, 유전자서열을 분석하였다.
1.1.1.2
제조된 플라스미드를 bacmid 제조용 E.coli에 형질전환 (Transformation)하여 재조합백미드 (Recombinant bacmid)를 제조하고 유전자서열을 분석하였다.
1.1.1.3
재조합백미드를 단층으로 배양된 Sf9 세포에 접종하여 형질감염 (Transfection)하고 재조합배큘로바이러스를 제조하여 플라그시험법으로 정량하였다.
1.1.1.4
배양된 곤충세포에 재조합배큘로바이러스를 감염시켜 생산된 재조합단백질을 수거하였다.
1.1.1.5
재조합단백질 정제
수거된 재조합단백질을 필터를 이용하여 여과하고, 적절한 크로마토그라피법 (Ion Exchange, Size Exclusion 등)을 이용하여 재조합단백질을 정제하였다.
1.1.2
CHO세포 발현시스템을 이용한 재조합단백질 생산
1.1.2.1
사스-코로나바이러스-2의 항원유전자를 발현시키기 위하여 각 유전자를 합성하였다. 발현벡터에 합성된 유전자를 삽입하여 클로닝하고, 유전자서열을 분석하였다.
1.1.2.2
단백질생산용 CHO 세포(CHO K-1 세포주)에 재조합플라스미드를 형질전환하였다.
1.1.2.3
항생제를 이용하여 재조합단백질을 발현하는 형질전환세포를 동정하였다.
1.1.2.4
동정된 형질전환 CHO세포를 대량배양하고 재조합 단백질을 수거하였다.
1.1.2.5
재조합단백질 정제
수거된 재조합단백질을 필터를 이용하여 여과하고, 적절한 크로마토그라피법 (Ion Exchange, Size Exclusion 등)을 이용하여 재조합단백질을 정제하였다.
1.1.5
재조합단백질 확인 및 정량
1.1.5.1
SDS-PAGE 및 Western blot법을 이용하여 재조합단백질의 발현 여부를 확인하였다.
1.1.5.2
기본적인 총단백질 정량법 (Lowry법, BCA법 등)을 이용하여 재조합단백질을 정량하였다.
5. 재조합 항원 단백질의 평가
A. 동물실험
1.2.1
면역원성 시험 (Immunogenicity Test)
1.2.1.1
동물 모델에 정제된 재조합단백질을 면역증강제 (예/Aluminum hydroxide) 와 조합하여 2~3주 간격으로 2~3회 접종하였다.
1.2.1.2
체중 및 체온 변화를 측정하여 안전성 확인
1.2.1.3
최종 접종 2~3주 후, 전혈하여 분리된 혈청과 비장세포를 얻었다.
1.2.2
방어능 시험 (Protection Test)
1.2.2.1
동물 모델에 정제된 재조합단백질을 면역증강제 (예/Aluminum hydroxide) 와 조합하여 2~3주 간격으로 2~3회 접종하였다.
1.2.2.2
최종 접종 2~3주 후, 치사량의 야생형 사스-코로나바이러스-2 바이러스를 감염하였다.
1.2.2.3
감염 후 1주일 간, 비강, 기도, 장기 등에서의 바이러스 shedding을 평가하였다.
1.2.2.4
감염 후 2주일 간, 체중 및 체온 변화, 사망률 등을 평가하였다.
B.
면역원성 평가
1.3.1
IgG ELISA
1.3.1.1
코팅용 항원 (RBD, S1, S2, N 등)을 96웰-플레이트에 코팅하고, 블로킹버퍼로 플레이트를 블로킹함. 검체 (혈청)를 플레이트에 반응시켰다. IgG 검출항체를 플레이트에 반응시켰다. 기질버퍼를 첨가하여 발색시키고, 흡광도를 측정하였다.
1.3.2
슈도바이러스 제조
1.3.2.1
발현용벡터에 사스-코로나바이러스-2의 S 단백질 유전자를 클로닝하였다. 전이벡터에 reporter유전자를 클로닝하였다. 두 유전자를 슈도바이러스 생산용 세포에 형질전환 (Transfection)하여 reporter단백질을 발현하는 슈도바이러스를 제조하였다.
1.3.3
중화항체가 평가
1.3.3.1
계대 희석된 검체 (혈청)를 슈도바이러스와 반응시킴. 반응한 슈도바이러스를 96웰-플레이트에 배양된 감염용 세포 (Vero E6 등)에 감염하여 배양하였다. 4~6시간 뒤 PBS로 세척하고 새로운 배지로 교체하였다. 24~72시간 배양하여 reporter 단백질 발현량을 비교하여 중화항체가를 평가하였다.
1.3.4
세포성면역 평가
1.3.4.1
96웰-플레이트에 항 인터페론-감마 항체 (anti-IFN-γ antibody)에 코팅하였다. 블로킹버퍼로 플레이트를 블로킹하고, 비장세포와 촉진제항원 (Stimulate)을 넣고 24~36시간을 배양하였다. 인터페론-감마 검출 항체를 반응시키고, 기질을 첨가하여 반응시킴. ELISPOT 리더를 이용하여 면역세포를 평가하였다.
1.3.4.2
면역특성 분석을 위하여, 면역세포 특이 항체와 사이토카인 항체를 분리한 비장세포와 2시간 반응시켰다. 유동세포분석법을 통해 T 세포 분포 및 싸이토카인 발현율을 측정하였다.
C. 백신용 항원의 항원성 평가
CR3022와의 결합력을 평가하기 위해 BioLayer Interferometry (BLI)를 사용하였다. CR3022는 Recombinant SARS-CoV-2 Spike Glycoprotein S1에 대한 Human monoclonal antibody이다. (Abcam사의 CAT#: ab273073)
BLI는 항체와 항원 간에 association과 dissociation을 통해 친화성 상수 Kd값 (Kdis/Kon)을 측정하며 이 값이 작을수록 친화력이 높다. 코로나19 S-특이 항체를 ProA sensor chip (ForteBio)에 Octet K2를 이용해 immobilize 하였다. Sensor chip을 100nM 부터 2-fold로 희석된 항원 시료에 dipping 하여 association을 측정하고 Kinetic buffer만 포함하는 well에 dipping 하여 dissociation을 측정하였다. Octet Data Analysis software(11.0)를 이용하여 결과 값에서 reference를 뺀 데이터를 1:1 binding model에 fitting 하여 분석하였다.
이를 통해 합성 서열 및 정보, 단백질 발현 확인, 단백질 분리 정제, 재조합 단백질 백신 후보물질을 확보할 수 있었다.
이를 통해 코로나감염증을 예방할 수 있게 충분한 항체 및 보호면역을 유도할 수 있다.
6. 결과
(1) BALB/c를 이용한 SK-RBD-P2 (서열번호 37), SK-RBD-P2 (서열번호 37)+ N(서열번호 33), SK-S-Trimer-P2 (서열번호 6)+ N(서열번호 33)의 면역원성 비교 실험 결과
6주령 female 마우스를 이용하여 SK-RBD-P2, SK-RBD-P2 + N, S-Trimer-P2 + N 항원을 2주간격으로 2회 IM 면역 후 채혈하여 혈청을 분리하고 면역원성을 분석하였다. 분석결과 모든 면역그룹(G2~G4)에서 RBD 단백질 특이 항체가 형성됨을 확인하였다. N 단백질 특이 항체는 면역그룹(G3, G4) 두 그룹에서 4주차에 높은 IgG titer를 보이며 우수한 면역원성을 증명했다(표 2).
No. | 항원 |
항원량
(ug/dose) |
개체수 | Adjuvant | Total IgG titer | PBNA 50 | |||
2 w | 4 w | 2 w | 4 w | ||||||
RBD-specific | N-specific | ||||||||
1 | Vehicle 1 | 0 | 5 | Alum. H | 25 | 25 | 233 | 190 | ND |
2 | SK-RBD-P2 | 10 | 5 | Alum. H |
52 | 12564 | 109 | 67 | ND |
3 | SK-RBD-P2 + N | 10+1 | 5 | Alum. H | 25 | 5423 | 1321 | 152911 | ND |
4 | S-Trimer-P2 + N | 10+1 | 5 | Alum. H | 25 | 730 | 291 | 3949 | 40 |
(2) BALB/c를 이용한 S-Trimer-P2 와 N 조합에 따른 면역원성 비교 실험 결과
6주령 female 마우스를 이용하여 S-Trimer-P2 항원을 N 항원과 함께 2주간격으로 2회 IM 면역 후 채혈하여 혈청을 분리하고 면역원성을 분석하였다. 4, 6, 8주차 샘플을 분석한 결과 주차에 따른 면역원성이 증가하는 양상을 보였고, N 단백질이 첨가되지 않은 그룹에 비해 함께 투여된 그룹에서 높은 항체가를 보였다(표 3).
No. | 항원 |
항원량
(ug/dose) |
개체수 | Adjuvant | Total IgG titer | ||
4w | 6w | 8w | |||||
1 | Vehicle | 0 | 5 | - | 25 | 25 | 25 |
2 | S-Trimer-P2 | 10 | 5 | Alum. H | 894 | 1045 | 17147 |
3 | S-Trimer-P2+N | 10+1 | 5 | Alum. H | 1964 | 2113 | 19056 |
(3) SK-RBD-P2(서열번호 37), SK-RBD-P2 + N, S-Trimer-P2 + N의 세포성 면역원성 분석 (Balb/c 마우스)
마우스의 세포성 면역원성 유도를 확인하기 위하여 면역이 완료된 마우스의 비장을 분리하여 ELISPot을 진행하였다. 분석한 결과 vehicle을 제외한 면역그룹 에서 면역한 항원 및 N-peptide, p2 peptide 자극에 특이적으로 반응하는 IFN-gamma 분비 T세포의 증가를 확인하였다. 결과를 도 4에 나타냈다. 이러한 결과를 통해 알 수 있듯이, 본 발명의 항원들은 세포성 면역 반응에 탁월한 효과를 나타내었다.
(4) SK-RBD (서열번호 38), S-Trimer-P2, N을 각각 면역한 형질전환 랫드의 총항체가 및 중화항체가 분석
표 4의 RBD 면역 그룹(G2, G3)의 혈청 분석 결과, Vehicle 그룹(G1) 대비 Day 14, 28, 43에서 RBD 특이적인 IgG 항체가 증가하였고, Day 57에는 감소하는 추세를 보였다. S-Trimer-P2 의 경우, Vehicle 그룹(G1) 대비 Day43까지 S-Trimer-P2 특이 항체가 증가하는 양상을 보였고, 이후 항체가는 감소하였다. N이 함께 면역된 그룹(G3, G5)의 혈청에서 N 특이적 항체 생성을 분석한 결과, Day 43까지 Vehicle그룹 대비 227~2106배 정도 항체가 증가하다가 이 후에는 saturation 양상을 보였다.
항원 | Group No. | Group No. | IgG Titer | ||||
Day 0 | Day 14 | Day 28 | Day 43 | Day 57 | |||
SK RBD (서열번호 38) | G1 | Vehicle | 25 | 25 | 29 | 25 | 25 |
G2 | SK-RBD (서열번호 38) | 25 | 52 | 6373 | 166915 | 77863 | |
G3 | SK-RBD (서열번호 38)+ N | 25 | 83 | 4663 | 169083 | 74617 | |
S-Trimer-P2 | G1 | Vehicle | 25 | 25 | 33 | 38 | 37 |
G4 | S-Trimer-P2 | 25 | 1094 | 39042 | 116311 | 99781 | |
G5 | S-Trimer-P2 + N | 25 | 1887 | 53134 | 146681 | 110747 | |
N | G1 | Vehicle | 25 | 25 | 25 | 25 | 32 |
G2 | SK-RBD (서열번호 38) | 25 | 25 | 25 | 25 | 25 | |
G3 | SK-RBD (서열번호 38)+ N | 25 | 245 | 12611 | 52646 | 41609 | |
G4 | S-Trimer-P2 | 25 | 25 | 36 | 179 | 242 | |
G5 | S-Trimer-P2 + N | 25 | 85 | 1604 | 5683 | 5128 |
G2보다 G4 실험군에서, 외부 항원의 종류에 상관없이 총항체가 생성율이 높게 나타났고, 또한 N 단백질에 의한 항체 생성율도 G4가 더 높게 확인되었다.
<110> SK bioscience Co., Ltd.
<120> Vaccine composition for preventing or treating infection of
SARS-CoV-2 comprising a recombinant protein
<130> P21-161
<150> KR 10-2020-0123308
<151> 2020-09-23
<160> 39
<170> KoPatentIn 3.0
<210> 1
<211> 1134
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-ecto
<400> 1
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
1125 1130
<210> 2
<211> 15
<212> PRT
<213> Unknown
<220>
<223> P2 Domain
<400> 2
Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu
1 5 10 15
<210> 3
<211> 27
<212> PRT
<213> Unknown
<220>
<223> foldon Domain
<400> 3
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1 5 10 15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25
<210> 4
<211> 1154
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-ecto-P2
<400> 4
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1140 1145 1150
Glu Leu
<210> 5
<211> 1166
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer
<400> 5
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
1155 1160 1165
<210> 6
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer-P2
<400> 6
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 7
<211> 1165
<212> PRT
<213> Artificial Sequence
<220>
<223> SK- S-Trimer-2proline
<400> 7
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Ser Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
1140 1145 1150
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
1155 1160 1165
<210> 8
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK- S-Trimer-P2-2proline
<400> 8
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 9
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer-P2(GSAG)-2proline
<400> 9
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 10
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer-P2(GSAG/Ca)-2proline
<400> 10
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Gly Ser Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 11
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer-P2-(HHAH)-2proline
<400> 11
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro His His Ala His
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala
865 870 875 880
Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 12
<211> 1186
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-S-trimer-P2(GSAG)-6proline
<400> 12
Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr
1 5 10 15
Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser
20 25 30
Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn
35 40 45
Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys
50 55 60
Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala
65 70 75 80
Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr
85 90 95
Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn
100 105 110
Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu
115 120 125
Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe
130 135 140
Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln
145 150 155 160
Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu
165 170 175
Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser
180 185 190
Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser
195 200 205
Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg
210 215 220
Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp
225 230 235 240
Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr
245 250 255
Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys
275 280 285
Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser
325 330 335
Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val
420 425 430
Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu
435 440 445
Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser
450 455 460
Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln
465 470 475 480
Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg
485 490 495
Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys
500 505 510
Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe
515 520 525
Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys
530 535 540
Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr
545 550 555 560
Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro
565 570 575
Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser
580 585 590
Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro
595 600 605
Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
610 615 620
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala
625 630 635 640
Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly
645 650 655
Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Gly Ser Ala Gly
660 665 670
Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala
675 680 685
Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn
690 695 700
Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys
705 710 715 720
Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys
725 730 735
Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg
740 745 750
Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val
755 760 765
Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe
770 775 780
Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
785 790 795 800
Lys Arg Ser Pro Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala
805 810 815
Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala
820 825 830
Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu
835 840 845
Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
850 855 860
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala
865 870 875 880
Leu Gln Ile Pro Phe Pro Met Gln Met Ala Tyr Arg Phe Asn Gly Ile
885 890 895
Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn
900 905 910
Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr
915 920 925
Pro Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln
930 935 940
Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile
945 950 955 960
Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala
965 970 975
Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln
980 985 990
Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser
995 1000 1005
Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1025 1030 1035 1040
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro
1045 1050 1055
Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly
1060 1065 1070
Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1075 1080 1085
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1090 1095 1100
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val
1105 1110 1115 1120
Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Gly Ser
1125 1130 1135
Gly Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1140 1145 1150
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly Ser
1155 1160 1165
Gly Ser Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr
1170 1175 1180
Glu Leu
1185
<210> 13
<211> 3444
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-ecto for the CHO expression
system
<400> 13
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtgatctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacttgctt tacatagaag ttatttgact cctggtgatt cttcttcagg ttggacagct 780
ggtgctgcag cttattatgt gggttatctt caacctagga cttttctatt aaaatataat 840
gaaaatggaa ccattacaga tgctgtagac tgtgcacttg accctctctc agaaacaaag 900
tgtacgttga aatccttcac tgtagaaaaa ggaatctatc aaacttctaa ctttagagtc 960
caaccaacag aatctattgt tagatttcct aatattacaa acttgtgccc ttttggtgaa 1020
gtttttaacg ccaccagatt tgcatctgtt tatgcttgga acaggaagag aatcagcaac 1080
tgtgttgctg attattctgt cctatataat tccgcatcat tttccacttt taagtgttat 1140
ggagtgtctc ctactaaatt aaatgatctc tgctttacta atgtctatgc agattcattt 1200
gtaattagag gtgatgaagt cagacaaatc gctccagggc aaactggaaa gattgctgat 1260
tataattata aattaccaga tgattttaca ggctgcgtta tagcttggaa ttctaacaat 1320
cttgattcta aggttggtgg taattataat tacctgtata gattgtttag gaagtctaat 1380
ctcaaacctt ttgagagaga tatttcaact gaaatctatc aggccggtag cacaccttgt 1440
aatggtgttg aaggttttaa ttgttacttt cctttacaat catatggttt ccaacccact 1500
aatggtgttg gttaccaacc atacagagta gtagtacttt cttttgaact tctacatgca 1560
ccagcaactg tttgtggacc taaaaagtct actaatttgg ttaaaaacaa atgtgtcaat 1620
ttcaacttca atggtttaac aggcacaggt gttcttactg agtctaacaa aaagtttctg 1680
cctttccaac aatttggcag agacattgct gacactactg atgctgtccg tgatccacag 1740
acacttgaga ttcttgacat tacaccatgt tcttttggtg gtgtcagtgt tataacacca 1800
ggaacaaata cttctaacca ggttgctgtt ctttatcagg atgttaactg cacagaagtc 1860
cctgttgcta ttcatgcaga tcaacttact cctacttggc gtgtttattc tacaggttct 1920
aatgtttttc aaacacgtgc aggctgttta ataggggctg aacatgtcaa caactcatat 1980
gagtgtgaca tacccattgg tgcaggtata tgcgctagtt atcagactca gactaattct 2040
cctcggcggg cacgtagtgt agctagtcaa tccatcattg cctacactat gtcacttggt 2100
gcagaaaatt cagttgctta ctctaataac tctattgcca tacccacaaa ttttactatt 2160
agtgttacca cagaaattct accagtgtct atgaccaaga catcagtaga ttgtacaatg 2220
tacatttgtg gtgattcaac tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt 2280
acacaattaa accgtgcttt aactggaata gctgttgaac aagacaaaaa cacccaagaa 2340
gtttttgcac aagtcaaaca aatttacaaa acaccaccaa ttaaagattt tggtggtttt 2400
aatttttcac aaatattacc agatccatca aaaccaagca agaggtcatt tattgaagat 2460
ctacttttca acaaagtgac acttgcagat gctggcttca tcaaacaata tggtgattgc 2520
cttggtgata ttgctgctag agacctcatt tgtgcacaaa agtttaacgg ccttactgtt 2580
ttgccacctt tgctcacaga tgaaatgatt gctcaataca cttctgcact gttagcgggt 2640
acaatcactt ctggttggac ctttggtgca ggtgctgcat tacaaatacc atttgctatg 2700
caaatggctt ataggtttaa tggtattgga gttacacaga atgttctcta tgagaaccaa 2760
aaattgattg ccaaccaatt taatagtgct attggcaaaa ttcaagactc actttcttcc 2820
acagcaagtg cacttggaaa acttcaagat gtggtcaacc aaaatgcaca agctttaaac 2880
acgcttgtta aacaacttag ctccaatttt ggtgcaattt caagtgtttt aaatgatatc 2940
ctttcacgtc ttgacaaagt tgaggctgaa gtgcaaattg ataggttgat cacaggcaga 3000
cttcaaagtt tgcagacata tgtgactcaa caattaatta gagctgcaga aatcagagct 3060
tctgctaatc ttgctgctac taaaatgtca gagtgtgtac ttggacaatc aaaaagagtt 3120
gatttttgtg gaaagggcta tcatcttatg tccttccctc agtcagcacc tcatggtgta 3180
gtcttcttgc atgtgactta tgtccctgca caagaaaaga acttcacaac tgctcctgcc 3240
atttgtcatg atggaaaagc acactttcct cgtgaaggtg tctttgtttc aaatggcaca 3300
cactggtttg taacacaaag gaatttttat gaaccacaaa tcattactac agacaacaca 3360
tttgtgtctg gtaactgtga tgttgtaata ggaattgtca acaacacagt ttatgatcct 3420
ttgcaacctg aattagactc atga 3444
<210> 14
<211> 3504
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-ecto-P2 for the CHO expression
system
<400> 14
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctcccagt acatcaaggc caactccaag 3480
ttcatcggca tcaccgagct gtaa 3504
<210> 15
<211> 3540
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer for the CHO expression
system
<400> 15
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctgtga 3540
3540
<210> 16
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2 for the CHO
expression system
<400> 16
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacaaggt ggaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 17
<211> 3537
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK- S-Trimer-2proline for the CHO
expression system
<400> 17
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctg 3537
<210> 18
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK- S-Trimer-P2-2proline for the
CHO expression system
<400> 18
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaaggcggg ccaggtctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 19
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-2proline for
the CHO expression system
<400> 19
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaggctccg ccggctctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 20
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG/Ca)-2proline
for the CHO expression system
<400> 20
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaggctccg ccggctctgt ggcttcccag agcatcatcg gctccaccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 21
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2-(HHAH)-2proline for
the CHO expression system
<400> 21
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccacaccacg cccactctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtcttt tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggagccgccc tccagatccc ttttgccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acagcttccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 22
<211> 3600
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-6proline for
the CHO expression system
<400> 22
atgttcgtgt ttctggtgct gctgccactg gtgtccagcc agtgcgtgaa cctgaccaca 60
agaacccagc tgccccctgc ctataccaat agcttcacaa ggggcgtgta ctatcccgat 120
aaggtgttca ggtcctccgt gctgcacagc acacaggacc tgtttctgcc tttcttttct 180
aacgtgacct ggttccacgc tatccacgtg tccggcacca atggcacaaa gaggttcgat 240
aatccagtgc tgccctttaa cgacggcgtg tacttcgcct ccaccgagaa gagcaacatc 300
atccggggct ggatctttgg caccacactg gattctaaga cacagtccct gctgatcgtg 360
aacaatgcta ccaacgtggt catcaaggtg tgcgagttcc agttttgtaa tgacccattc 420
ctgggcgtgt actatcataa gaacaataag agctggatgg agtctgagtt tcgcgtgtat 480
agctctgcca acaattgtac atttgagtac gtgagccagc ccttcctgat ggatctggag 540
ggcaagcagg gcaatttcaa gaacctgaga gagttcgtgt ttaagaatat cgacggctac 600
ttcaaaatct actctaagca caccccaatc aacctggtgc gcgatctgcc acagggcttc 660
tccgccctgg agccactggt ggacctgccc atcggcatca acatcaccag gtttcagaca 720
ctgctggccc tgcatcggtc ttacctgaca ccaggcgatt ccagctctgg atggaccgct 780
ggcgccgctg cctactatgt gggctacctc cagcccagaa ccttcctgct gaagtacaac 840
gagaatggca ccatcacaga cgctgtggat tgcgccctgg accccctgtc tgagacaaag 900
tgtacactga agtcctttac cgtggagaag ggcatctatc agacatccaa tttcagagtg 960
cagcctaccg agagcatcgt gcgctttccc aatatcacaa acctgtgccc ttttggcgag 1020
gtgttcaacg ctacccgctt cgcctccgtg tacgcttgga atagaaagcg catcagcaac 1080
tgcgtggccg attattctgt gctgtacaac tccgcctcct tctccacctt caagtgctat 1140
ggcgtgagcc ccacaaagct gaatgacctg tgctttacca acgtgtacgc tgattctttc 1200
gtgatcagag gcgacgaggt gcgccagatc gcccctggcc agacaggcaa gatcgctgat 1260
tacaattata agctgcctga cgatttcacc ggctgcgtga tcgcctggaa cagcaacaat 1320
ctggactcta aagtgggcgg caactacaat tatctgtaca ggctgtttcg gaagtccaat 1380
ctgaagccat tcgagagaga catcagcaca gaaatctacc aggctggctc taccccctgc 1440
aatggcgtgg agggctttaa ctgttatttc cctctccaga gctacggctt ccagccaacc 1500
aacggcgtgg gctatcagcc ctaccgcgtg gtggtgctgt cctttgagct gctgcacgct 1560
cctgctacag tgtgcggccc aaagaagagc accaatctgg tgaagaacaa gtgcgtgaac 1620
ttcaacttca acggcctgac cggcacaggc gtgctgaccg agtccaacaa gaagttcctg 1680
ccttttcagc agttcggcag agacatcgcc gataccacag acgctgtgcg cgatcctcag 1740
accctggaga tcctggacat cacaccatgc tccttcggcg gcgtgagcgt gatcacacca 1800
ggcaccaata caagcaacca ggtggccgtg ctgtatcagg atgtgaattg taccgaggtg 1860
cccgtggcta tccacgctga ccagctgacc cctacatgga gggtgtactc taccggctcc 1920
aacgtgtttc agacacgggc cggatgtctg atcggagctg agcatgtgaa caattcctat 1980
gagtgcgaca tccctatcgg cgccggcatc tgtgcctcct accagaccca gacaaacagc 2040
ccaggctccg ccggctctgt ggcttcccag agcatcatcg cctataccat gtccctgggc 2100
gccgagaata gcgtggctta cagcaacaat tctatcgcta tccctaccaa cttcacaatc 2160
tctgtgacca cagagatcct gccagtgtct atgaccaaga catccgtgga ttgcacaatg 2220
tatatctgtg gcgactccac cgagtgcagc aacctgctgc tccagtacgg ctccttttgt 2280
acccagctga atagagccct gacaggcatc gctgtggagc aggacaagaa cacacaggag 2340
gtgttcgccc aggtgaagca aatctacaag accccaccca tcaaggattt tggcggcttc 2400
aatttttccc agatcctgcc cgacccttcc aagcccagca agaggtctcc tatcgaggat 2460
ctgctgttca acaaggtgac cctggctgac gccggcttca tcaagcagta tggcgattgc 2520
ctgggcgaca tcgctgccag ggacctgatc tgcgcccaga agtttaatgg cctgaccgtg 2580
ctgcctccac tgctgacaga cgagatgatc gctcagtaca catctgctct gctggccggc 2640
accatcacat ccggatggac cttcggcgct ggacctgccc tccagatccc ttttcccatg 2700
cagatggctt atcggttcaa cggcatcggc gtgacccaga atgtgctgta cgagaaccag 2760
aagctgatcg ccaatcagtt taactctgct atcggcaaga tccaggattc tctgtccagc 2820
acaccctccg ccctgggcaa gctccaggac gtggtgaatc agaacgctca ggccctgaat 2880
accctggtga agcagctgtc ctccaacttc ggcgccatca gctctgtgct gaatgacatc 2940
ctgtccaggc tggacccccc cgaggctgag gtgcagatcg acaggctgat caccggcagg 3000
ctccagtccc tccagaccta cgtgacacag cagctgatca gagctgccga gatccgcgct 3060
tccgccaacc tggctgccac caagatgtcc gagtgcgtgc tgggacagag caagagggtg 3120
gatttttgtg gcaagggcta tcacctgatg tctttcccac agtccgcccc tcacggcgtg 3180
gtgtttctgc atgtgaccta cgtgccagct caggagaaga acttcaccac agctccagcc 3240
atctgccacg acggcaaggc tcattttcct agagagggcg tgttcgtgag caacggcacc 3300
cattggtttg tgacacagcg caatttctat gagccacaga tcatcaccac agataataca 3360
tttgtgagcg gcaactgtga cgtggtcatc ggcatcgtga acaataccgt gtacgatcct 3420
ctccagccag agctggactc tggaagcggt ggctccggct acatccccga ggccccccgc 3480
gacggccagg cctacgtgcg caaggacggc gagtgggtgc tgctgtccac cttcctggga 3540
agcggtggct cccagtacat caaggccaac tccaagttca tcggcatcac cgagctgtaa 3600
3600
<210> 23
<211> 3459
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-ecto for the BEV expression
system
<400> 23
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactcctaa 3459
<210> 24
<211> 3519
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-ecto-P2 for the BEV expression
system
<400> 24
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggat ctggttcagg ccagtacatc 3480
aaggctaact ccaagttcat cggtatcacc gaactgtaa 3519
<210> 25
<211> 3519
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer for the BEV expression
system
<400> 25
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac aaggtcgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggat ctggttcagg ccagtacatc 3480
aaggctaact ccaagttcat cggtatcacc gaactgtaa 3519
<210> 26
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2 for the BEV
expression system
<400> 26
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgt 60
gttaatctta caaccagaac tcaattaccc cctgcataca ctaattcttt cacacgtggt 120
gtttattacc ctgacaaagt tttcagatcc tcagttttac attcaactca ggacttgttc 180
ttacctttct tttccaatgt tacttggttc catgctatac atgtctctgg gaccaatggt 240
actaagaggt ttgataaccc tgtcctacca tttaatgatg gtgtttattt tgcttccact 300
gagaagtcta acataataag aggctggatt tttggtacta ctttagattc gaagacccag 360
tccctactta ttgttaataa cgctactaat gttgttatta aagtctgtga atttcaattt 420
tgtaatgatc catttttggg tgtttattac cacaaaaaca acaaaagttg gatggaaagt 480
gagttcagag tttattctag tgcgaataat tgcacttttg aatatgtctc tcagcctttt 540
cttatggacc ttgaaggaaa acagggtaat ttcaaaaatc ttagggaatt tgtgtttaag 600
aatattgatg gttattttaa aatatattct aagcacacgc ctattaattt agtgcgtgat 660
ctccctcagg gtttttcggc tttagaacca ttggtagatt tgccaatagg tattaacatc 720
actaggtttc aaactttact tgctttacat agaagttatt tgactcctgg tgattcttct 780
tcaggttgga cagctggtgc tgcagcttat tatgtgggtt atcttcaacc taggactttt 840
ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 900
ctctcagaaa caaagtgtac gttgaaatcc ttcactgtag aaaaaggaat ctatcaaact 960
tctaacttta gagtccaacc aacagaatct attgttagat ttcctaatat tacaaacttg 1020
tgcccttttg gtgaagtttt taacgccacc agatttgcat ctgtttatgc ttggaacagg 1080
aagagaatca gcaactgtgt tgctgattat tctgtcctat ataattccgc atcattttcc 1140
acttttaagt gttatggagt gtctcctact aaattaaatg atctctgctt tactaatgtc 1200
tatgcagatt catttgtaat tagaggtgat gaagtcagac aaatcgctcc agggcaaact 1260
ggaaagattg ctgattataa ttataaatta ccagatgatt ttacaggctg cgttatagct 1320
tggaattcta acaatcttga ttctaaggtt ggtggtaatt ataattacct gtatagattg 1380
tttaggaagt ctaatctcaa accttttgag agagatattt caactgaaat ctatcaggcc 1440
ggtagcacac cttgtaatgg tgttgaaggt tttaattgtt actttccttt acaatcatat 1500
ggtttccaac ccactaatgg tgttggttac caaccataca gagtagtagt actttctttt 1560
gaacttctac atgcaccagc aactgtttgt ggacctaaaa agtctactaa tttggttaaa 1620
aacaaatgtg tcaatttcaa cttcaatggt ttaacaggca caggtgttct tactgagtct 1680
aacaaaaagt ttctgccttt ccaacaattt ggcagagaca ttgctgacac tactgatgct 1740
gtccgtgatc cacagacact tgagattctt gacattacac catgttcttt tggtggtgtc 1800
agtgttataa caccaggaac aaatacttct aaccaggttg ctgttcttta tcaggatgtt 1860
aactgcacag aagtccctgt tgctattcat gcagatcaac ttactcctac ttggcgtgtt 1920
tattctacag gttctaatgt ttttcaaaca cgtgcaggct gtttaatagg ggctgaacat 1980
gtcaacaact catatgagtg tgacataccc attggtgcag gtatatgcgc tagttatcag 2040
actcagacta attctcctcg gcgggcacgt agtgtagcta gtcaatccat cattgcctac 2100
actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2160
acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2220
gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2280
tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2340
aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2400
gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2460
tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2520
caatatggtg attgccttgg tgatattgct gctagagacc tcatttgtgc acaaaagttt 2580
aacggcctta ctgttttgcc acctttgctc acagatgaaa tgattgctca atacacttct 2640
gcactgttag cgggtacaat cacttctggt tggacctttg gtgcaggtgc tgcattacaa 2700
ataccatttg ctatgcaaat ggcttatagg tttaatggta ttggagttac acagaatgtt 2760
ctctatgaga accaaaaatt gattgccaac caatttaata gtgctattgg caaaattcaa 2820
gactcacttt cttccacagc aagtgcactt ggaaaacttc aagatgtggt caaccaaaat 2880
gcacaagctt taaacacgct tgttaaacaa cttagctcca attttggtgc aatttcaagt 2940
gttttaaatg atatcctttc acgtcttgac aaagttgagg ctgaagtgca aattgatagg 3000
ttgatcacag gcagacttca aagtttgcag acatatgtga ctcaacaatt aattagagct 3060
gcagaaatca gagcttctgc taatcttgct gctactaaaa tgtcagagtg tgtacttgga 3120
caatcaaaaa gagttgattt ttgtggaaag ggctatcatc ttatgtcctt ccctcagtca 3180
gcacctcatg gtgtagtctt cttgcatgtg acttatgtcc ctgcacaaga aaagaacttc 3240
acaactgctc ctgccatttg tcatgatgga aaagcacact ttcctcgtga aggtgtcttt 3300
gtttcaaatg gcacacactg gtttgtaaca caaaggaatt tttatgaacc acaaatcatt 3360
actacagaca acacatttgt gtctggtaac tgtgatgttg taataggaat tgtcaacaac 3420
acagtttatg atcctttgca acctgaatta gactcaggta gcggaggtag cggatatatt 3480
cctgaggctc cccgcgacgg acaggcttac gtccgcaagg atggtgaatg ggtgctgctc 3540
tccaccttcc tcggcagcgg aagcggacag tatatcaagg ctaactccaa gttcattggc 3600
atcaccgagt tgtaa 3615
<210> 27
<211> 3555
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK- S-Trimer-2proline for the BEV
expression system
<400> 27
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac ccaccagagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480
cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540
tcaactttcc tgtaa 3555
<210> 28
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-Trimer-P2-2proline for the BEV
expression system
<400> 28
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcaccccg ccgtgctagg tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac ccaccagagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480
cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540
tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600
atcaccgaac tgtaa 3615
<210> 29
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-2proline for
the BEV expression system
<400> 29
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcacccgg cagtgctggt tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480
cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540
tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600
atcaccgaac tgtaa 3615
<210> 30
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG/Ca)-2proline
for the BEV expression system
<400> 30
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcacccgg cagtgctggt tccgtggcct ctcagtcaat catcggttcc 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480
cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540
tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600
atcaccgaac tgtaa 3615
<210> 31
<211> 3615
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2-(HHAH)-2proline for
the BEV expression system
<400> 31
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctcagtgc 60
gtgaacctga ccactcgtac ccagctgcct cccgcctaca ccaactcatt cactaggggt 120
gtgtactacc cagacaaggt gttccgctcc tccgtgctgc actcaactca ggacctgttc 180
ctgcctttct tctccaacgt cacctggttc cacgccatcc acgtgtccgg aaccaacggt 240
actaagaggt tcgacaaccc agtgctgcct ttcaacgacg gtgtctactt cgcttcaacc 300
gagaagtcca acatcatcag aggctggatc ttcggaacca ctctggacag caagactcag 360
tctctgctga tcgtcaacaa cgccaccaac gtggtcatca aggtgtgcga gttccagttc 420
tgcaacgacc ccttcctggg cgtctactac cacaagaaca acaagtcatg gatggagtcc 480
gagttccgcg tctactccag cgctaacaac tgcactttcg agtacgtgag ccagccattc 540
ctgatggacc tggaaggcaa gcagggaaac ttcaagaacc tgcgcgagtt cgtgttcaag 600
aacatcgacg gatacttcaa gatttacagc aagcacaccc ccatcaacct ggtccgtgac 660
ctgccacagg gtttctctgc tctggagccc ctggtggacc tgccaatcgg catcaacatc 720
accaggttcc agactctgct ggctctgcac cgctcctacc tgactcccgg tgactcttca 780
tccggttgga ccgccggcgc tgccgcttac tacgtgggtt acctgcaacc acgcaccttc 840
ctgctgaagt acaacgaaaa cggaaccatc actgacgccg tggactgcgc tctggaccca 900
ctgagcgaaa ccaagtgcac tctgaagtct ttcaccgtgg agaagggcat ctaccagact 960
agcaacttcc gcgtgcagcc taccgaatct atcgtccgtt tcccaaacat cactaacctg 1020
tgccctttcg gagaggtgtt caacgccacc cgtttcgctt ccgtgtacgc ctggaacagg 1080
aagagaatca gcaactgcgt cgctgactac tctgtgctgt acaactcagc ctccttcagc 1140
accttcaagt gctacggcgt gtcacccact aagctgaacg acctgtgctt caccaacgtc 1200
tacgccgact ccttcgtgat caggggagac gaggtcagac agatcgctcc aggtcaaact 1260
ggcaagatcg ccgactacaa ctacaagctg cctgacgact tcaccggctg cgtcatcgct 1320
tggaacagca acaacctgga ctctaaagtg ggtggcaact acaactacct gtaccgcctg 1380
ttccgtaagt caaacctgaa gcccttcgag cgcgacatct caactgaaat ctaccaggct 1440
ggttccaccc catgcaacgg agtcgagggt ttcaactgct acttccctct gcaatcctac 1500
ggtttccagc ccactaacgg agtgggttac cagccatacc gtgtggtcgt gctgagcttc 1560
gaactgctgc acgcccctgc tactgtgtgc ggtcccaaga agtctaccaa cctggtcaag 1620
aacaagtgcg tgaacttcaa cttcaacggc ctgaccggca ctggagtcct gaccgagagc 1680
aacaagaagt tcctgccttt ccagcagttc ggacgcgaca tcgctgacac cactgacgcc 1740
gtgcgtgacc ctcagaccct ggaaatcctg gacatcactc cctgctcatt cggaggtgtc 1800
tccgtgatca cccctggcac caacacttct aaccaggtcg ctgtgctgta ccaggacgtc 1860
aactgcaccg aggtcccagt ggccatccac gctgaccagc tgacccctac ttggagggtg 1920
tactccaccg gtagcaacgt gttccagact agagctggat gcctgatcgg tgccgagcac 1980
gtgaacaaca gctacgaatg cgacatccct atcggtgctg gcatctgcgc ctcttaccag 2040
acccagacta actcacccca ccatgctcat tccgtggcct ctcagtcaat catcgcttac 2100
accatgagcc tgggcgctga aaactctgtg gcctactcta acaactcaat cgccatccct 2160
accaacttca ctatcagcgt gaccactgag atcctgcccg tcagcatgac caagacttct 2220
gtggactgca ctatgtacat ctgcggagac agcaccgaat gctctaacct gctgctgcaa 2280
tacggctctt tctgcaccca gctgaaccgc gctctgactg gaatcgccgt ggagcaggac 2340
aagaacactc aggaagtgtt cgctcaggtg aagcaaatct acaagacccc acctatcaag 2400
gacttcggcg gattcaactt ctcccagatc ctgcctgacc cctccaagcc aagcaagagg 2460
tctttcatcg aggacctgct gttcaacaag gtcaccctgg ccgacgctgg attcatcaag 2520
cagtacggcg actgcctggg agacatcgct gctcgcgacc tgatctgcgc tcagaagttc 2580
aacggtctga ccgtgctgcc cccactgctg actgacgaaa tgatcgccca gtacacttca 2640
gccctgctgg ctggcaccat cacttccgga tggaccttcg gagctggtgc tgctctgcaa 2700
atccctttcg ctatgcagat ggcctaccgc ttcaacggca tcggagtcac ccagaacgtg 2760
ctgtacgaga accagaagct gatcgctaac cagttcaact cagccatcgg aaagatccag 2820
gactcactgt cctccaccgc ctccgctctg ggcaagctgc aagacgtcgt gaaccagaac 2880
gcccaggctc tgaacaccct ggtcaagcag ctgtcatcca acttcggtgc tatcagctct 2940
gtgctgaacg acatcctgtc caggctggac ccacctgagg ccgaagtgca gatcgaccgc 3000
ctgatcactg gtcgcctgca atccctgcaa acctacgtga ctcagcagct gatcagggcc 3060
gctgaaatca gagcctccgc taacctggcc gctaccaaga tgtcagagtg cgtcctggga 3120
cagtccaaga gagtggactt ctgcggcaag ggctaccacc tgatgtcatt cccacagtcc 3180
gctcctcacg gcgtcgtgtt cctgcacgtc acctacgtgc ccgcccagga aaagaacttc 3240
accactgccc cagctatctg ccacgacggc aaggctcact tccctcgcga aggcgtgttc 3300
gtgagcaacg gaacccactg gttcgtcact cagcgtaact tctacgagcc ccagatcatc 3360
accactgaca acactttcgt gtctggtaac tgcgacgtcg tgatcggcat cgtcaacaac 3420
accgtgtacg accccctgca accagaactg gactccggaa gcggtggctc cggttacatc 3480
cctgaagctc cccgcgacgg acaggcctac gtccgtaagg acggagagtg ggtgctgctg 3540
tcaactttcc tgggatctgg ttcaggccag tacatcaagg ctaactccaa gttcatcggt 3600
atcaccgaac tgtaa 3615
<210> 32
<211> 3455
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of SK-S-trimer-P2(GSAG)-6proline for
the BEV expression system
<400> 32
atgaagtggg tcactttcat cagcctgctg ttcctgttct ccagcgctta ctctagtgcg 60
tgaacctgac cactcgtacc cagctgcctc ccgcctacac caactcattc actaggggtg 120
tgtactaccc agacaaggtg ttccgctcct ccgtgctgca ctcaactcag gacctgttcc 180
tgcctttctt ctccaacgtc acctggttcc acgccatcca cgtgtccgga accaacggta 240
ctaagaggtt cgacaaccca gtgctgcctt tcaacgacgg tgtctacttc gcttcaaccg 300
agaagtccaa catcatcaga ggctggatct tcggaaccac tctggacagc aagactcagt 360
ctctgctgat cgtcaacaac gccaccaacg tggtcatcaa ggtgtgcgag ttccagttct 420
gcaacgaccc cttcctgggc gtctactacc acaagaacaa caagtcatgg atggagtccg 480
agttccgcgt ctactccagc gctaacaact gcactttcga gtacgtgagc cagccattcc 540
tgatggacct ggaaggcaag cagggaaact tcaagaacct gcgcgagttc gtgttcaaga 600
acatcgacgg atacttcaag atttacagca agcacacccc catcaacctg gtccgtgacc 660
tgccacaggg tttctctgct ctggagcccc tggtggacct gccaatcggc atcaacatca 720
ccaggttcca gactctgctg gctctgcacc gctcctacct gactcccggt gactcttcat 780
ccggttggac cgccggcgct gccgcttact acgtgggtta cctgcaacca cgcaccttcc 840
tgctgaagta caacgaaaac ggaaccatca ctgacgccgt ggactgcgct ctggacccac 900
tgagcgaaac caagtgcact ctgaagtctt tcaccgtgga gaagggcatc taccagacta 960
gcaacttccg cgtgcagcct accgaatcta tcgtccgttt cccaaacatc actaacctgt 1020
gccctttcgg agaggtgttc aacgccaccc gtttcgcttc cgtgtacgcc tggaacagga 1080
agagaatcag caactgcgtc gctgactact ctgtgctgta caactcagcc tccttcagca 1140
ccttcaagtg ctacggcgtg tcacccacta agctgaacga cctgtgcttc accaacgtct 1200
acgccgactc cttcgtgatc aggggagacg aggtcagaca gatcgctcca ggtcaaactg 1260
gcaagatcgc cgactacaac tacaagctgc ctgacgactt caccggctgc gtcatcgctt 1320
ggaacagcaa caacctggac tctaaagtgg gtggcaacta caactacctg taccgcctgt 1380
tccgtaagtc aaacctgaag cccttcgagc gcgacatctc aactgaaatc taccaggctg 1440
gttccacccc atgcaacgga gtcgagggtt tcaactgcta cttccctctg caatcctacg 1500
gtttccagcc cactaacgga gtgggttacc agccataccg tgtggtcgtg ctgagcttcg 1560
aactgctgca cgcccctgct actgtgtgcg gtcccaagaa gtctaccaac ctggtcaaga 1620
acaagtgcgt gaacttcaac ttcaacggcc tgaccggcac tggagtcctg accgagagca 1680
acaagaagtt cctgcctttc cagcagttcg gacgcgacat cgctgacacc actgacgccg 1740
tgcgtgaccc tcagaccctg gaaatcctgg acatcactcc ctgctcattc ggaggtgtct 1800
ccgtgatcac ccctggcacc aacacttcta accaggtcgc tgtgctgtac caggacgtca 1860
actgcaccga ggtcccagtg gccatccacg ctgaccagct gacccctact tggagggtgt 1920
actccaccgg tagcaacgtg ttccagacta gagctggatg cctgatcggt gccgagcacg 1980
tgaacaacag ctacgaatgc gacatcccta tcggtgctgg catctgcgcc tcttaccaga 2040
cccagactaa ctcacccggc agtgctggtt ccgtggcctc tcagtcaatc atcgcttaca 2100
ccatgagcct gggcgctgaa aactctgtgg cctactctaa caactcaatc gccatcccta 2160
ccaacttcac tatcagcgtg accactgaga tcctgcccgt cagcatgacc aagacttctg 2220
tggactgcac tatgtacatc tgcggagaca gcaccgaatg ctctaacctg ctgctgcaat 2280
acggctcttt ctgcacccag ctgaaccgcg ctctgactgg aatcgccgtg gagcaggaca 2340
agaacactca ggaagtgttc gctcaggtga agcaaatcta caagacccca cctatcaagg 2400
acttcggcgg attcaacttc tcccagatcc tgcctgaccc ctccaagcca agcaagaggt 2460
ctcccatcga ggacctgctg ttcaacaagg tcaccctggc cgacgctgga ttcatcaagc 2520
agtacggcga ctgcctggga gacatcgctg ctcgcgacct gatctgcgct cagaagttca 2580
acggtctgac cgtgctgccc ccactgctga ctgacgaaat gatcgcccag tacacttcag 2640
ccctgctggc tggcaccatc acttccggat ggaccttcgg agctggtcct gctctgcaaa 2700
tccctttccc tatgcagatg gcctaccgct tcaacggcat cggagtcacc cagaacgtgc 2760
tgtacgagaa ccagaagctg atcgctaacc agttcaactc agccatcgga aagatccagg 2820
actcactgtc ctccacccct tccgctctgg gcaagctgca agacgtcgtg aaccagaacg 2880
cccaggctct gaacaccctg gtcaagcagc tgtcatccaa cttcggtgct atcagctctg 2940
tgctgaacga catcctgtcc aggctggacc cacctgaggc cgaagtgcag atcgaccgcc 3000
tgatcactgg tcgcctgcaa tccctgcaaa cctacgtgac tcagcagctg atcagggccg 3060
ctgaaatcag agcctccgct aacctggccg ctaccaagat gtcagagtgc gtcctgggac 3120
agtccaagag agtggacttc tgcggcaagg gctaccacct gatgtcattc ccacagtccg 3180
ctcctcacgg cgtcgtgttc ctgcacgtca cctacgtgcc cgcccaggaa aagaacttca 3240
ccactgcccc agctatctgc cacgacggca aggctcactt ccctcgcgaa ggcgtgttcg 3300
tgagcaacgg aacccactgg ttcgtcactc agcgtaactt ctacgagccc cagatcatca 3360
ccactgacaa cactttcgtg tctggtaact gcgacgtcgt gatcggcatc gtcaacaaca 3420
ccgtgtacga ccccctgcaa ccagaactgg actcc 3455
<210> 33
<211> 436
<212> PRT
<213> Unknown
<220>
<223> N protein of SARS-CoV-2
<400> 33
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Ser Asp Asn Gly Pro Gln Asn Gln Arg Asn Ala Pro Arg Ile
20 25 30
Thr Phe Gly Gly Pro Ser Asp Ser Thr Gly Ser Asn Gln Asn Gly Glu
35 40 45
Arg Ser Gly Ala Arg Ser Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn
50 55 60
Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Asp
65 70 75 80
Leu Lys Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Ser
85 90 95
Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Ile Arg
100 105 110
Gly Gly Asp Gly Lys Met Lys Asp Leu Ser Pro Arg Trp Tyr Phe Tyr
115 120 125
Tyr Leu Gly Thr Gly Pro Glu Ala Gly Leu Pro Tyr Gly Ala Asn Lys
130 135 140
Asp Gly Ile Ile Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys
145 150 155 160
Asp His Ile Gly Thr Arg Asn Pro Ala Asn Asn Ala Ala Ile Val Leu
165 170 175
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly
180 185 190
Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg
195 200 205
Asn Ser Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Thr Ser Pro
210 215 220
Ala Arg Met Ala Gly Asn Gly Gly Asp Ala Ala Leu Ala Leu Leu Leu
225 230 235 240
Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Met Ser Gly Lys Gly Gln
245 250 255
Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser
260 265 270
Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Ala Tyr Asn Val Thr
275 280 285
Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly
290 295 300
Asp Gln Glu Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln
305 310 315 320
Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg
325 330 335
Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr Thr Gly
340 345 350
Ala Ile Lys Leu Asp Asp Lys Asp Pro Asn Phe Lys Asp Gln Val Ile
355 360 365
Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu
370 375 380
Pro Lys Lys Asp Lys Lys Lys Lys Ala Asp Glu Thr Gln Ala Leu Pro
385 390 395 400
Gln Arg Gln Lys Lys Gln Gln Thr Val Thr Leu Leu Pro Ala Ala Asp
405 410 415
Leu Asp Asp Phe Ser Lys Gln Leu Gln Gln Ser Met Ser Ser Ala Asp
420 425 430
Ser Thr Gln Ala
435
<210> 34
<211> 18
<212> PRT
<213> Homo sapiens
<400> 34
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser
<210> 35
<211> 1311
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of N protein for the BEV expression
system
<400> 35
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttcctctgat 60
aatggacccc aaaatcagcg aaatgcaccc cgcattacgt ttggtggacc ctcagattca 120
actggcagta accagaatgg agaacgcagt ggggcgcgat caaaacaacg tcggccccaa 180
ggtttaccca ataatactgc gtcttggttc accgctctca ctcaacatgg caaggaagac 240
cttaaattcc ctcgaggaca aggcgttcca attaacacca atagcagtcc agatgaccaa 300
attggctact accgaagagc taccagacga attcgtggtg gtgacggtaa aatgaaagat 360
ctcagtccaa gatggtattt ctactaccta ggaactgggc cagaagctgg acttccctat 420
ggtgctaaca aagacggcat catatgggtt gcaactgagg gagccttgaa tacaccaaaa 480
gatcacattg gcacccgcaa tcctgctaac aatgctgcaa tcgtgctaca acttcctcaa 540
ggaacaacat tgccaaaagg cttctacgca gaagggagca gaggcggcag tcaagcctct 600
tctcgttcct catcacgtag tcgcaacagt tcaagaaatt caactccagg cagcagtagg 660
ggaacttctc ctgctagaat ggctggcaat ggcggtgatg ctgctcttgc tttgctgctg 720
cttgacagat tgaaccagct tgagagcaaa atgtctggta aaggccaaca acaacaaggc 780
caaactgtca ctaagaaatc tgctgctgag gcttctaaga agcctcggca aaaacgtact 840
gccactaaag catacaatgt aacacaagct ttcggcagac gtggtccaga acaaacccaa 900
ggaaattttg gggaccagga actaatcaga caaggaactg attacaaaca ttggccgcaa 960
attgcacaat ttgcccccag cgcttcagcg ttcttcggaa tgtcgcgcat tggcatggaa 1020
gtcacacctt cgggaacgtg gttgacctac acaggtgcca tcaaattgga tgacaaagat 1080
ccaaatttca aagatcaagt cattttgctg aataagcata ttgacgcata caaaacattc 1140
ccaccaacag agcctaaaaa ggacaaaaag aagaaggctg atgaaactca agccttaccg 1200
cagagacaga agaaacagca aactgtgact cttcttcctg ctgcagattt ggatgatttc 1260
tccaaacaat tgcaacaatc catgagcagt gctgactcaa ctcaggccta a 1311
<210> 36
<211> 1362
<212> DNA
<213> Artificial Sequence
<220>
<223> a codon optimized sequence of N protein for the CHO expression
system
<400> 36
atgaagtggg tcactttcat cagcctgttg tttctgttca gctccgccta ctctaagtgg 60
gtaaccttta tttcccttct ttttctcttt agctcggctt attcctctga taatggaccc 120
caaaatcagc gaaatgcacc ccgcattacg tttggtggac cctcagattc aactggcagt 180
aaccagaatg gagaacgcag tggggcgcga tcaaaacaac gtcggcccca aggtttaccc 240
aataatactg cgtcttggtt caccgctctc actcaacatg gcaaggaaga ccttaaattc 300
cctcgaggac aaggcgttcc aattaacacc aatagcagtc cagatgacca aattggctac 360
taccgaagag ctaccagacg aattcgtggt ggtgacggta aaatgaaaga tctcagtcca 420
agatggtatt tctactacct aggaactggg ccagaagctg gacttcccta tggtgctaac 480
aaagacggca tcatatgggt tgcaactgag ggagccttga atacaccaaa agatcacatt 540
ggcacccgca atcctgctaa caatgctgca atcgtgctac aacttcctca aggaacaaca 600
ttgccaaaag gcttctacgc agaagggagc agaggcggca gtcaagcctc ttctcgttcc 660
tcatcacgta gtcgcaacag ttcaagaaat tcaactccag gcagcagtag gggaacttct 720
cctgctagaa tggctggcaa tggcggtgat gctgctcttg ctttgctgct gcttgacaga 780
ttgaaccagc ttgagagcaa aatgtctggt aaaggccaac aacaacaagg ccaaactgtc 840
actaagaaat ctgctgctga ggcttctaag aagcctcggc aaaaacgtac tgccactaaa 900
gcatacaatg taacacaagc tttcggcaga cgtggtccag aacaaaccca aggaaatttt 960
ggggaccagg aactaatcag acaaggaact gattacaaac attggccgca aattgcacaa 1020
tttgccccca gcgcttcagc gttcttcgga atgtcgcgca ttggcatgga agtcacacct 1080
tcgggaacgt ggttgaccta cacaggtgcc atcaaattgg atgacaaaga tccaaatttc 1140
aaagatcaag tcattttgct gaataagcat attgacgcat acaaaacatt cccaccaaca 1200
gagcctaaaa aggacaaaaa gaagaaggct gatgaaactc aagccttacc gcagagacag 1260
aagaaacagc aaactgtgac tcttcttcct gctgcagatt tggatgattt ctccaaacaa 1320
ttgcaacaat ccatgagcag tgctgactca actcaggcct aa 1362
<210> 37
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<223> SK RBD-P2
<400> 37
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
1 5 10 15
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
20 25 30
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
35 40 45
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
50 55 60
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
65 70 75 80
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
85 90 95
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
100 105 110
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
115 120 125
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
130 135 140
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
145 150 155 160
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
165 170 175
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
180 185 190
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Gly Ser Gly Ser
195 200 205
Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu
210 215 220
<210> 38
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> SK-RBD
<400> 38
Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn
1 5 10 15
Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser
20 25 30
Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser
35 40 45
Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys
50 55 60
Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val
65 70 75 80
Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr
85 90 95
Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn
100 105 110
Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu
115 120 125
Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu
130 135 140
Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
145 150 155 160
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val
165 170 175
Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His
180 185 190
Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
195 200
<210> 39
<211> 1147
<212> PRT
<213> Artificial Sequence
<220>
<223> SP+ SK-S-ecto
<400> 39
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu
1010 1015 1020
Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val
1025 1030 1035 1040
Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1045 1050 1055
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1060 1065 1070
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala His
1075 1080 1085
Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe Val
1090 1095 1100
Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr
1105 1110 1115 1120
Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr
1125 1130 1135
Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
1140 1145
Claims (27)
- 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드, 또는 이의 기능적 단편에
i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된, 재조합 사스-코로나바이러스-2 항원 단백질. - 제1항에 있어서, 상기 외인성 폴리펩타이드는 폴돈 도메인과 P2 도메인이 연결된 도메인인 것을 특징으로 하는 재조합 사스-코로나바이러스-2 항원 단백질.
- 제1항에 있어서, 상기 연결은 적어도 4개의 아미노산 잔기로 이루어진 링커에 의해 이루어지는, 재조합 사스-코로나바이러스-2 항원 단백질.
- 제1항에 있어서, 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드에 적어도 하나 이상의 아미노산이 치환된 변이를 갖는, 재조합 사스-코로나바이러스-2 항원 단백질.
- 제4항에 있어서, 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, iii) 카텝신(Cathepsin) L 절단 부위 변이, 및 iv) S2 서브유닛 변이로 이루어진 군에서 선택된 어느 하나 이상의 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질.
- 제5항에 있어서, 상기 i) 2 프롤린 변이는 서열번호 1의 폴리펩타이드의 973번 위치의 아미노산 라이신(K)이 프롤린(P)으로 치환되고, 974번 위치의 아미노산 발린(V)이 프롤린(P)으로 치환된 변이를 갖는, 재조합 사스-코로나바이러스-2 항원 단백질.
- 제5항에 있어서, 상기 ii) 퓨린 (furin) 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 669-672에 대응하는 아미노산 RRAR이 GSAG 또는 HHAH로 치환된 재조합 사스-코로나바이러스-2 항원 단백질.
- 제5항에 있어서, 상기 iii) 카텝신(Cathepsin) L 절단 부위 변이는 서열번호 1의 폴리펩타이드의 위치 681-682에 대응한은 아미노산 AY가 GS로 치환된 재조합 사스-코로나바이러스-2 항원 단백질.
- 제5항에 있어서, 상기 iv) S2 서브유닛 변이는 S 단백질의 S2 서브유닛을 형성하는 아미노산 중 적어도 4개의 아미노산이 치환된 것으로, F804P, A879P, A886P, 및 A929P 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질.
- 제5항에 있어서, 상기 변이는 i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, 및 iii) 카텝신(Cathepsin) L 절단 부위 변이를 포함하거나, 또는
i) 2 프롤린 변이, ii) 퓨린 (furin) 절단 부위 변이, 및 iv) S2 서브유닛 변이를 포함하는 재조합 사스-코로나바이러스-2 항원 단백질. - 제1항 내지 제10항 중 어느 하나의 항에 있어서, 상기 재조합 사스-코로나바이러스-2 항원 단백질은 서열번호 4 내지 12로 이루어진 군에서 선택된 적어도 하나 이상의 서열을 갖는 펩타이드를 포함하는 사스-코로나바이러스-2 백신에 사용을 위한 재조합 사스-코로나바이러스-2 항원 단백질.
- 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질을 발현하기 위한 발현 컨스트럭트로,
(a) 서열번호 1의 아미노산 서열로 이루어진 폴리펩타이드 또는 이의 기능적 단편에 i) 폴돈 도메인, ii) P2 도메인, 또는 iii) 폴돈 도메인과 P2 도메인이 연결된 도메인으로 이루어진 군에서 선택된 적어도 1종 이상의 외인성 폴리펩타이드가 연결된 재조합 사스-코로나바이러스-2 항원 단백질을 또는 이의 기능적 단편을 코딩하는 뉴클레오타이드 서열; 및
(b) 상기 재조합 사스-코로나바이러스-2 항원 단백질을 세포로부터 분비시키기 위한 시그널 서열을 코딩하는 뉴클레오타이드 서열을 포함하는 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트. - 제12항에 있어서, 상기 발현 컨스트럭트는 서열번호 13 내지 32로 이루어진 군에서 선택된 어느 하나의 뉴클레오타이드 서열로 이루어진 재조합 사스-코로나바이러스-2 항원 단백질 발현용 컨스트럭트.
- 제12항의 컨스트럭트를 포함하는 재조합 벡터.
- 제14항에 있어서, 상기 재조합 벡터는
ii) 서열번호 13 내지 22로 이루어진 군에서 선택된 어느 하나의 서열로 표현되는 폴리뉴클레오티드로 이루어진 발현 컨스트럭트를 포함하는 동물세포의 형질감염을 위한 재조합 벡터인, 재조합 벡터. - 제15항의 재조합 벡터를 포함하는 숙주 세포이며, 상기 숙주 세포는 중국 햄스터 난소 (CHO) 세포인 숙주 세포.
- 제14항에 있어서, 상기 재조합 벡터는
i) 서열번호 23 내지 32로 이루어진 군에서 선택된 어느 하나의 서열로 표현되는 폴리뉴클레오티드로 이루어진 발현 컨스트럭트를 포함하는 배큘로바이러스 (baculovirus) 재조합 벡터인 재조합 벡터. - 제17항에 따른 배큘로바이러스 (baculovirus) 재조합 벡터를 대장균에 형질전환하여 얻어진 재조합 백미드 (Bacmid).
- 제18항에 따른 재조합 백미드를 게놈으로 포함하는 재조합 배큘로바이러스.
- 제18항에 따른 재조합 백미드를 포함하거나, 제19항에 따른 재조합 배큘로바이러스로 형질감염된 숙주세포.
- 제20항에 있어서, 상기 숙주세포는 Sf21 또는 Sf9을 포함하는 곤충세포인 것을 특징으로 하는, 숙주세포.
- 제14항에 따른 재조합 벡터를 포함하는 숙주 세포를 배양하고 목적하는 생성물을 단리함을 포함하는, 재조합 항원 단백질의 제조 방법.
- 제22항의 방법으로 제조된, 서열번호 4 내지 12로 이루어진 군에서 선택된 어느 하나의 서열로 이루어진 재조합 항원 단백질.
- 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질 또는 이의 기능적 단편을 포함하는 재조합 항원 단백질, 및
약학적으로 허용가능한 담체를 포함하는, 사스-코로나바이러스-2 감염증 예방 또는 치료용 약학 조성물. - 제24항에 있어서, 상기 조성물은
서열번호 33의 사스-코로나바이러스-2의 nucleocapsid (N) protein, 면역학적 애쥬반트 또는 이들의 혼합물을 더 포함하는, 사스-코로나바이러스-2 감염증 예방 또는 치료용 약학 조성물. - 제1항 내지 제10항 중 어느 하나의 항에 따른 재조합 사스-코로나바이러스-2 항원 단백질을 포함하는 재조합 항원 단백질, 및
약학적으로 허용가능한 담체를 포함하는 조성물을 유효량 개체에 투여하여 개체의 체내에 사스-코로나바이러스-2에 대한 중화항체 생성 또는 IFN-γ 분비 T세포를 증가시키기 위한 약학 조성물. - 제26항에 있어서, 상기 약학 조성물은 사스-코로나바이러스-2의 감염 예방을 위한 백신 조성물인 약학 조성물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20200123308 | 2020-09-23 | ||
KR1020200123308 | 2020-09-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220040423A true KR20220040423A (ko) | 2022-03-30 |
Family
ID=80845765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210125995A KR20220040423A (ko) | 2020-09-23 | 2021-09-23 | 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20220040423A (ko) |
WO (1) | WO2022065889A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018081318A1 (en) * | 2016-10-25 | 2018-05-03 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Prefusion coronavirus spike proteins and their use |
-
2021
- 2021-09-23 KR KR1020210125995A patent/KR20220040423A/ko unknown
- 2021-09-23 WO PCT/KR2021/012981 patent/WO2022065889A1/ko active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022065889A1 (ko) | 2022-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102482994B1 (ko) | 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
AU2014230822B2 (en) | Heat-stable Respiratory Syncytial Virus prefusion F protein oligomers and their use in immunological compositions | |
KR20230049084A (ko) | Sars-cov-2 및 인플루엔자 조합 백신 | |
Drew et al. | Humoral immune responses to DNA vaccines expressing secreted, membrane bound and non-secreted forms of the: Taenia ovis 45W antigen | |
KR20180131584A (ko) | 안정화된 용해성 융합-전 rsv f 단백질 | |
JPH03502687A (ja) | レスピラトリイ・シンシチアル・ウイルス:ワクチンおよび診断法 | |
TW202140519A (zh) | 疫苗 | |
CN115246874A (zh) | 一种重组新型冠状病毒s-rbd三聚体蛋白、其制备方法和应用 | |
WO2023138334A1 (zh) | 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用 | |
US20230265128A1 (en) | Stabilised viral fusion proteins | |
TW202206598A (zh) | 對抗SARS-CoV-2之疫苗及其製品 | |
CN108503696B (zh) | 一种酵母细胞表达的寨卡病毒亚单位疫苗 | |
KR102514122B1 (ko) | 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
WO2023138333A1 (zh) | 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用 | |
RU2178807C2 (ru) | ВЫДЕЛЕННАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ ДНК, ВЕКТОР, СПОСОБ ПОЛУЧЕНИЯ ГОМОГЕННОГО БЕЛКА gp350, ГОМОГЕННЫЙ БЕЛОК gp350, ФАРМАЦЕВТИЧЕСКАЯ КОМПОЗИЦИЯ ДЛЯ ЛЕЧЕНИЯ ЕВV-СВЯЗАННОГО ЗАБОЛЕВАНИЯ ИЛИ СОСТОЯНИЯ | |
CN116568324A (zh) | 融合蛋白和疫苗 | |
KR20220040423A (ko) | 재조합 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
KR20230022206A (ko) | 코로나바이러스 질환에 대응하는 재조합적 변형된 우두증 바이러스 앙카라 (mva) 백신 | |
KR20210122196A (ko) | 신규 코로나바이러스 예방 및 치료용 백신 조성물 | |
JP6902804B2 (ja) | B型肝炎ウイルス様粒子をアジュバントとして含むワクチン組成物 | |
KR20220039078A (ko) | 사스-코로나바이러스-2의 변형된 스파이크 단백질을 포함하는 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
KR20220058090A (ko) | D614g 변이형 사스-코로나바이러스-2 감염증 예방 또는 치료용 백신 조성물 | |
KR102039059B1 (ko) | 일본 뇌염 바이러스 피막 단백질의 돌출 도메인을 포함하는 단백질, 이의 동형이량체, 및 이의 용도 | |
KR20230075625A (ko) | 스트렙토코커스 수이스의 면역원성 재조합 단백질 및 이를 포함하는 면역원성 조성물 | |
KR20230004330A (ko) | 중화항체 형성능 증진용 펩타이드 및 이를 포함하는 백신 조성물 |