CN113388041A - 具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用 - Google Patents

具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用 Download PDF

Info

Publication number
CN113388041A
CN113388041A CN202110268273.4A CN202110268273A CN113388041A CN 113388041 A CN113388041 A CN 113388041A CN 202110268273 A CN202110268273 A CN 202110268273A CN 113388041 A CN113388041 A CN 113388041A
Authority
CN
China
Prior art keywords
ser
leu
val
gly
thr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110268273.4A
Other languages
English (en)
Other versions
CN113388041B (zh
Inventor
顾颖
郑清炳
李婷婷
俞海
薛文辉
陈婷婷
李少伟
夏宁邵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Xiamen Innovax Biotech Co Ltd
Original Assignee
Xiamen University
Xiamen Innovax Biotech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University, Xiamen Innovax Biotech Co Ltd filed Critical Xiamen University
Publication of CN113388041A publication Critical patent/CN113388041A/zh
Application granted granted Critical
Publication of CN113388041B publication Critical patent/CN113388041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses
    • G01N2333/165Coronaviridae, e.g. avian infectious bronchitis virus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Food Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Mycology (AREA)
  • Biotechnology (AREA)
  • Epidemiology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了具有融合前早期构象的SARS‑CoV‑2S三聚体蛋白,及其制备方法。本发明还涉及呈现该种构象的冠状病毒S蛋白在诊断、预防和治疗新型冠状病毒感染和导致疾病的用途。

Description

具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用
技术领域
本发明涉及病毒学领域。具体而言,本发明提供了具有融合前早期构象的SARS-CoV-2 S三聚体蛋白,及其制备方法。本发明还涉及呈现该种构象的冠状病毒S蛋白在诊断、预防和治疗新型冠状病毒感染和导致疾病的用途。
背景技术
冠状病毒,英文简写CoV,全称Coronavirus:Corona(冕、冠)+Virus(病毒)=冠状病毒。“冠状病毒”因在电子显微镜下呈现的标志性冠状结构而得名,该结构为S糖蛋白在病毒包膜表面形成的刺突。
冠状病毒颗粒呈圆形或椭圆形,亦为多形性,直径50~200nm,属于尺寸较大的病毒。冠状病毒是包膜病毒,病毒衣壳外面包裹着脂质包膜,其上排列较宽的刺突(S蛋白),形状如太阳光环。S蛋白位于病毒表面,形成棒状结构,作为病毒的主要抗原蛋白之一,介导受体结合和细胞融合的主要抗原。负责识别宿主细胞表面的受体,可刺激机体产生中和抗体。
已知冠状病毒中,有7种可引发人类疾病,包括:HCoV-229E、HCoV-OC43、HCoV-NL63、HCoV-HKU1、SARS-CoV、MERS-CoV和SARS-CoV-2。其中,前4种为局部流行性疾病,主要引起轻度自限性疾病,而SARS-CoV和MERS-CoV可引发重症。2002年和2012年发现的SARS-CoV和MERS-CoV属于β-冠状病毒,并由于其对人类的高威胁性被列入WHO高威胁清单。SARS-CoV-2(sever acute respiratory syndrome coronaviruses 2,严重急性呼吸综合征冠状病毒2)是第七个能够引发人类疾病的离散冠状病毒种属,表征为β-冠状病毒。冠状病毒引发的高患病率对人类健康构成持续威胁。
SARS-CoV-2基因组全长约29,800个碱基对(base pair,bp),基因组一般含有13个基因,编码14个蛋白,主要包括多聚蛋白(polyprotein)、刺突蛋白(spike protein,S)、基质蛋白(matrix protein,M)、囊膜蛋白(envelop protein,E)和衣壳蛋白(nucelocapsidprotein,N)及其他此类病毒特有蛋白。其中主要的膜蛋白S,含S1和S2两个亚基,S1上含有N端结构域NTD,受体结合域RBD,及两个连接功能域SD1和SD2。
冠状病毒属于囊膜病毒,囊膜病毒通过与靶细胞膜的融合入侵宿主细胞。其中,冠状病毒属于I类囊膜病毒,包含HIV、流感病毒、埃博拉病毒等。I类囊膜病毒的病毒膜融合由病毒表面主要糖蛋白介导,冠状病毒S糖蛋白前体具有蛋白酶切割位点,成熟后会被宿主切割成S1和S2两个亚基,S1/S2裂解位点位于残基660-675的灵活环中,该残基在预融合S1-S2三聚体峰中完全暴露。要成功感染SARS-CoV,需要宿主细胞蛋白酶切割S1/S2位点。冠状病毒成熟过程中,该类病毒在膜融合前后会发生显著构象变化,融合前构象为prefusion,S1和S2维持完整的三聚体构象,融合后的构象为postfusion,S1蛋白与受体结合,触发一系列构象变化,且在蛋白水解酶和细胞内吞泡的酸性条件下,导致S2构象延长,S2高度疏水的N端融合肽FP锚定在宿主细胞上。S2三聚体重折叠成高度稳定的构象,诱导六螺旋束的形成,完成膜融合。
特别的,在β冠状病毒中,在融合前构象中,S蛋白中的S1也会经历特殊的构象变化,该构象变化为β冠状病毒所特有,其他型目前还没有发现。
目前已证实,新型冠状病毒的受体与SARS-CoV一样都是血管紧张素转化酶2(ACE2)。基于利用冷冻透射电子显微镜单颗粒分析(cryo-EM,single particle analysis,SPA)解析的SARS-CoV的S糖蛋白与其宿主细胞受体ACE2的复合结构,早期研究表明,SARS-CoV病毒与受体结合前,三聚体S糖蛋白中的受体结合域RBD为“向下”构象,当病毒与受体结合时,其中一个RBD采用突出的“向上”构象与ACE2结合,从而诱导其他两个RBD也与受体结合。同时在MERS-CoV S糖蛋白中也有类似的观察,显示RBD“向上”突出。最新利用冷冻电镜解析的新型冠状病毒SARS-CoV-2的S蛋白结构也有一个RBD“向上”的构象变化。由于S三聚体糖蛋白是冠状病毒与细胞受体结合介导病毒入胞和感染并致病的重要蛋白,因此成为诊断、预防和治疗病毒感染和致病的主要靶标,然而,S蛋白的变构现象及其呈现多种的不同构象与机体产生的免疫反应相关,给研究带了极大的挑战,截至目前鉴定的S三聚体蛋白呈现为融合前(prefusion)和融合后(postfusion)两种构象,融合前构象呈现为亚稳态(metastable)构象,在受体刺激或其他条件作用下自发变构成为融合后构象,病毒S变成融合后构象时已经处于感染入胞状态,因此,针对融合前构象S蛋白开发疫苗或药物将具有更好的病毒中和作用和抑制病毒复制效果,而使得稳定S蛋白融合前构象及其表位研究成为冠状病毒的研究重点。
发明内容
本申请的发明人经过大量实验和反复摸索,出人意料地获得了具有早期融合前构象的SARS-CoV-2的S三聚体,该构象区别于已知的融合前构象,并且对SARS-CoV-2的诊断、预防及治疗具有更好的效果,由此完成了本发明。
因此,在第一方面,本发明提供了一种融合蛋白,其包含严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白或其变体序列、以及三聚化结构域序列;
其中,所述S蛋白变体与野生型S蛋白(例如SEQ ID NO:1所示的S蛋白)相比具有一个或几个氨基酸的置换、缺失或添加(例如1个,2个,3个,4个,5个,6个,7个,8个,9个或10个氨基酸的置换、缺失或添加),或者与野生型S蛋白相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性,并且所述S蛋白变体具有野生型S蛋白的免疫学活性(例如,在受试者中诱导针对SARS-CoV-2的特异性免疫应答如中和抗体应答的活性)。
在本发明中,术语“三聚化结构域”是指,能够使本文所述的融合蛋白的若干拷贝三聚化(即形成生物分子复合物)的任何多肽或蛋白质。在某些实施方案中,所述三聚化结构域是同源三聚化结构域,其将相同的融合蛋白聚集并形成三聚体。在某些实施方案中,所述三聚化结构域序列包含如SEQ ID NO:3所示的序列。
在某些实施方案中,所述S蛋白变体相比于野生型S蛋白具有更优的构象稳定性,其不易转变为融合后构象。
在某些实施方案中,所述S蛋白变体在其S1结构域和S2结构域之间不包含弗林蛋白酶识别位点。在某些实施方案中,所述S蛋白变体不包含弗林蛋白酶识别位点。
在某些实施方案中,所述S蛋白变体在相应于如下位置的氨基酸位置中的一处或多处(例如1处,2处或3处或4处)包含氨基酸置换,所述如下位置参考野生型S蛋白所示的氨基酸位置:668、669、671。
在某些实施方案中,与野生型S蛋白相比,所述S蛋白变体包含选自下列的1个或几个(例如1个,2个或3个)氨基酸置换:在相应于野生型S蛋白的位置668的位置上的氨基酸置换为A,在相应于野生型S蛋白的位置669的位置上的氨基酸置换为G,在相应于野生型S蛋白的位置671的位置上的氨基酸置换为G。
在某些实施方案中,与野生型S蛋白相比,所述S蛋白变体在与野生型S蛋白的第668-671位相对应的位置上的氨基酸残基被置换为AGAG。
在某些实施方案中,与野生型S蛋白相比,所述S蛋白变体在与野生型S蛋白的第972位和/或第973位相对应的位置上包含氨基酸置换。具体地,所述氨基酸置换为:所述S蛋白变体在与野生型S蛋白的第972位相对应的位置上的氨基酸被置换为P,和/或所述S蛋白变体在与野生型S蛋白的第973位相对应的位置上的氨基酸被置换为P。
在某些实施方案中,所述S蛋白变体包含:在相应于野生型S蛋白的位置972的位置上的氨基酸置换为P,和/或在相应于野生型S蛋白的位置973的位置上的氨基酸置换为P。
在某些实施方案中,所述S蛋白包含如SEQ ID NO:1所示的氨基酸序列。
在某些实施方案中,所述S蛋白变体包含如SEQ ID NO:2所示的氨基酸序列。
在某些实施方案中,所述融合蛋白从N端至C端包含所述S蛋白或其变体序列和三聚化结构域序列。
在某些实施方案中,所述融合蛋白在所述S蛋白或其变体序列和三聚化结构域序列之间进一步包含蛋白酶识别位点序列。
在某些实施方案中,所述蛋白酶是凝血酶。
在某些实施方案中,所述蛋白酶识别位点序列包含如SEQ ID NO:4或5所示的序列。
在某些实施方案中,所述融合蛋白包含选自下列的氨基酸序列:
(1)由SEQ ID NO:6所示序列的第1位至第1238位氨基酸残基构成的氨基酸序列;
(2)由SEQ ID NO:8所示序列的第1位至第1238位氨基酸残基构成的氨基酸序列。
在某些实施方案中,所述融合蛋白进一步包含载体蛋白序列。
在某些实施方案中,所述载体蛋白序列位于所述S蛋白或其变体序列的N端。在某些实施方案中,所述载体蛋白位于所述三聚化结构域序列的C端。
在某些实施方案中,所述载体蛋白选自CRMA(例如SEQ ID NO:10所示的CRMA)、CRM389(例如SEQ ID NO:11所示的CRM389)或CRM197(例如SEQ ID NO:12所示的CRM197)。
在某些实施方案中,所述载体蛋白序列与其相邻结构域之间任选地通过肽接头连接。在某些实施方案中,所述肽接头是(GmS)n,其中m选自1-4的整数(例如1,2,3,4),n选自1-3的整数(例如1,2,3)。
在某些实施方案中,所述融合蛋白包含选自下列的氨基酸序列:
(1)由SEQ ID NO:13所示序列的第1位至第1443位氨基酸残基构成的氨基酸序列;
(2)由SEQ ID NO:14所示序列的第1位至第1443位氨基酸残基构成的氨基酸序列;
(3)由SEQ ID NO:15所示序列的第1位至第1642位氨基酸残基构成的氨基酸序列;
(4)由SEQ ID NO:16所示序列的第1位至第1642位氨基酸残基构成的氨基酸序列;
(5)由SEQ ID NO:17所示序列的第1位至第1788位氨基酸残基构成的氨基酸序列;
(6)由SEQ ID NO:18所示序列的第1位至第1788位氨基酸残基构成的氨基酸序列。
在某些实施方案中,所述融合蛋白包含标签序列。在某些实施方案中,所述标签序列是纯化标签,例如多组氨酸标签、myc标签或HA标签。在某些实施方案中,所述标签序列位于所述融合蛋白的N端或C端。在某些实施方案中,所述标签序列与其相邻结构域之间任选地通过肽接头或酶切位点序列连接。在某些实施方案中,所述融合蛋白包含SEQ ID NOs:13-18任一项所示的序列。
在第二方面,本发明提供了一种多聚体,其包含第一方面所述的融合蛋白。
在某些实施方案中,所述多聚体是同源多聚体。
在某些实施方案中,所述多聚体是三聚体。
在某些实施方案中,所述多聚体是由相同的融合蛋白所形成的三聚体。
在第三方面,本发明提供了一种分离的核酸分子,其包含编码第一方面所述的融合蛋白的核苷酸序列。
在第四方面,本发明提供了一种载体,其包含如上所述的分离的核酸分子。在某些实施方案中,所述载体是例如质粒,粘粒,噬菌体等。优选地,所述载体是杆状病毒表达载体。
在第五方面,本发明提供了一种宿主细胞,其包含如上所述的分离的核酸分子或载体。此类宿主细胞包括但不限于,原核细胞例如大肠杆菌细胞,以及真核细胞例如酵母细胞,昆虫细胞,植物细胞和动物细胞(如哺乳动物细胞,例如小鼠细胞、人细胞等)。优选地,所述宿主细胞是昆虫细胞。
在第六方面,本发明提供了制备第一方面所述的融合蛋白或第二方面所述的多聚体的方法,其包括,培养第五方面的宿主细胞,和从细胞培养物中回收所述融合蛋白。在某些实施方案中,所述融合蛋白以三聚体形式存在。在某些实施方案中,所述宿主细胞是昆虫细胞。
在第七方面,本发明提供了制备严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白三聚体的方法,其包括:在杆状病毒昆虫表达系统中表达第一方面所述的融合蛋白,从而产生所述S蛋白三聚体。
在某些实施方案中,所述杆状病毒昆虫表达系统中的昆虫宿主细胞选自sf9或sf21。
在某些实施方案中,所述杆状病毒昆虫表达系统中的杆状病毒表达载体选自pAcgp67(A-C),pFastbac,pEx/bac。
在某些实施方案中,所述方法包括以下步骤:
(1)将包含编码第一方面所述的融合蛋白的核苷酸序列的杆状病毒表达载体引入昆虫宿主细胞中;
(2)培养所述昆虫宿主细胞;
(3)从细胞培养物(例如培养上清)中回收S蛋白三聚体。
在某些实施方案中,所述方法还包括:对所产生的S蛋白三聚体进行纯化。优选地,通过亲和层析和/或分子筛对S蛋白三聚体进行纯化。
在某些实施方案中,所述纯化包括:将所述细胞培养上清交换缓冲液到PBS或TB缓冲液;将交换缓冲液的细胞培养上清通过Ni亲和层析纯化,洗脱杂蛋白。
在第八方面,本发明提供了一种严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白三聚体,其具备早期融合前构象,所述早期融合前构象包含以下特征中的1项、2项或3项:
(1)NTD结构域质量中心与S2结构域质量中心的连线,和RBD结构域质量中心与S2结构域质量中心的连线的夹角为约81.4°;
(2)NTD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure BDA0002973147980000071
(3)RBD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure BDA0002973147980000072
在某些实施方案中,上述构象特征通过冷冻电镜三维结构重建测定。
在某些实施方案中,所述S蛋白三聚体是由第一方面所述的融合蛋白所形成的三聚体。在某些实施方案中,所述三聚体是由相同的融合蛋白形成的同源三聚体。
在某些实施方案中,所述S蛋白三聚体通过第七方面所述的方法制备。
在第九方面,本发明提供了一种药物组合物,其包含本发明的融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、或S蛋白三聚体,以及药学上可接受的载体和/或赋形剂。
在某些实施方案中,所述药物组合物是免疫原性组合物或疫苗。在某些实施方案中,所述药学上可接受的载体和/或赋形剂是佐剂。
在某些实施方案中,所述融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、或S蛋白三聚体以预防和/或治疗预防SARS-CoV-2感染或由SARS-CoV-2感染所致的疾病COVID-19的有效量存在。
在另一方面,本发明提供了本发明的融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、S蛋白三聚体、或药物组合物,在制备用于在受试者中诱导针对SARS-CoV-2的特异性免疫应答和/或用于在受试者中预防和/或治疗SARS-CoV-2感染的药剂中的应用。
在另一方面,本发明提供了本发明的融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、S蛋白三聚体、或药物组合物,在制备用于在受试者中预防和/或治疗由SARS-CoV-2感染所致的疾病COVID-19的药剂中的应用。
在某些实施方案中,所述药剂为疫苗。
在某些实施方案中,所述受试者是人。
在另一方面,本发明提供了用于在受试者中诱导针对SARS-CoV-2的特异性免疫应答或用于在受试者中预防和/或治疗SARS-CoV-2感染的方法,其包括向有此需要的受试者施用免疫学有效量的本发明的多聚体、S蛋白三聚体或药物组合物。
在另一方面,本发明提供了一种试剂盒,其包含本发明的融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、或S蛋白三聚体。
在某些实施方案中,所述试剂盒包含捕获试剂,所述捕获试剂选自本发明的融合蛋白、多聚体、或S蛋白三聚体。在某些实施方案中,所述试剂盒还包含使用本发明的融合蛋白、多聚体、或S蛋白三聚体作为捕获试剂来检测样品中的对SARS-CoV-2特异性的抗体的说明书,或者使用本发明的融合蛋白、多聚体、或S蛋白三聚体作为捕获试剂来测定来自受试者的样品中对SARS-CoV-2特异性的抗体的水平,从而确定所述受试者是否患有SARS-CoV-2感染的说明书。
在某些实施方案中,所述受试者是人。
在某些实施方案中,所述捕获试剂连接于固相载体表面。在本文中,所述的固相载体包括由聚合物材料(例如聚氯乙烯、聚苯乙烯、聚丙酰胺或纤维素)制成或包被的凹孔平板、试管、珠粒(例如乳胶颗粒)或薄膜(例如硝酸纤维素膜),或由功能基团(例如氨基、羧基、生物素或亲和素)预包被的磁珠。在某些实施方案中,所述固相载体选自磁珠或微量滴定板(例如微孔板或酶标板)。
在某些实施方案中,所述试剂盒还包含检测试剂,所述检测试剂可以测定“捕获试剂/对SARS-CoV-2特异性的抗体”免疫复合物的形成。
在某些实施方案中,所述检测试剂选自带有可检测的标记的二级抗体。
在某些实施方案中,所述可检测的标记选自酶(例如辣根过氧化物酶或碱性磷酸酶)、化学发光试剂(例如吖啶酯类化合物)、荧光染料或生物素。
在某些实施方案中,所述二级抗体对待测抗体所来自的物种(例如人)的抗体是特异的。在某些实施方案中,所述二级抗体是抗-免疫球蛋白抗体。在某些实施方案中,所述抗-免疫球蛋白抗体选自抗IgG抗体、抗IgM抗体或抗IgA抗体;优选地,所述抗-免疫球蛋白抗体是抗IgG抗体。
在另一方面,本发明提供了本发明的融合蛋白、多聚体、分离的核酸分子、载体、宿主细胞、或S蛋白三聚体,在制备用于测定来自受试者的样品中的对SARS-CoV-2特异性的抗体的存在或其水平和/或用于确定受试者是否患有SARS-CoV-2感染的试剂盒中的用途。
在某些实施方案中,所述样品是血液样品,例如全血、血浆或血清。
在某些实施方案中,所述受试者是人。
在另一个方面,本发明提供了测定来自受试者的样品中的对SARS-CoV-2特异性的抗体的存在或其水平的方法,所述方法包括在允许抗原-抗体复合物形成的条件下,使所述样品与本发明的融合蛋白、多聚体、或S蛋白三聚体接触,并且检测抗原-抗体复合物的形成。在某些实施方案中,所述对SARS-CoV-2特异性的抗体可以是IgG,IgM,IgA,或总抗体。所述总抗体是指所述样品中对SARS-CoV-2特异性的所有抗体,而不限于其中的任何一类,因此包括IgM、IgG、IgA等。
在某些实施方案中,所述方法包括以下步骤:
(1)将所述样品与捕获试剂接触,以获得抗原-抗体免疫复合物;所述捕获试剂选自本发明的融合蛋白、多聚体或S蛋白三聚体;
(2)测定步骤(1)获得的抗原-抗体免疫复合物的形成或其量。
在某些实施方案中,在步骤(2)中,通过免疫学检测来测定所述免疫复合物的形成或其量。
在某些实施方案中,所述免疫学检测选自酶免疫测定法(例如ELISA)、化学发光免疫分析法、荧光免疫分析法或放射免疫测定法。
在某些实施方案中,所述捕获试剂连接与固相载体表面。
在某些实施方案中,在步骤(2)中,使用检测试剂来检测所述免疫复合物的量,所述检测试剂选自带有可检测的标记的二级抗体,例如抗-免疫球蛋白抗体,例如抗IgG抗体、抗IgM抗体或抗IgA抗体。
在另一个方面,本发明提供了确定受试者是否患有SARS-CoV-2感染的方法,所述方法包括:
(i)通过上一方面所述的方法来测定来自所述受试者的样品中对SARS-CoV-2特异性的抗体的水平;和,
(ii)将所述水平与参考值比较,以判断所述受试者是否患有SARS-CoV-2感染。
术语定义
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的病毒学、生物化学、核酸化学、免疫学等实验室操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文中所使用的,术语“S蛋白”也称为刺突蛋白,其是冠状病毒的主要结构蛋白之一。SARS-CoV-2的S蛋白的序列是本领域技术人员已知的,例如可参见NCBI数据库中如下序列:NC_045512.2。
如本文中所使用的,术语“S蛋白三聚体”、“S三聚体蛋白”、“S三聚体”可互换使用,其是指由三个S蛋白单体自组装所形成的三聚体。对于SARS-CoV-2,S蛋白三聚体在膜融合前后会发生显著构象变化,融合前构象为prefusion,融合后的构象为postfusion。在本发明中,意外发现了不同于已报道的融合前构象的一种前前构象,将其命名为“早期融合前构象”或“融合前早期构象”,该构象的S三聚体蛋白的NTD和RBD结构域与融合前S蛋白具有明显构象差异。通过冷冻电镜三维结构重建测定,所述早期融合前构象可以包含以下特征中的1项、2项或3项:(1)NTD结构域质量中心与S2结构域质量中心的连线,和RBD结构域质量中心与S2结构域质量中心的连线的夹角为约81.4°;(2)NTD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure BDA0002973147980000111
(3)RBD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure BDA0002973147980000112
此外,本领域人员知晓,对于蛋白质不同构象的区分,除了通过结构解析方法,如冷冻电镜三维结构重建、X-射线晶体学或核磁共振波谱法进行测定,通过对两种空间结构的几何测量进行定量区分,也可以通过免疫筛选特异识别本发明的融合前早期构象而不识别其他构象的单克隆抗体,再通过单克隆抗体与S蛋白进行反应的免疫分析方法进行判断是否具有本发明构象的蛋白。
如本文中所使用的,术语“杆状病毒昆虫表达系统”是指以昆虫细胞为宿主细胞、以杆状病毒表达载体为表达载体的重组蛋白表达系统。该表达系统是本领域技术人员熟知的,杆状病毒表达载体(例如pAcgp67(A-C),pFastbac,pEx/bac等)、昆虫宿主细胞(例如sf9或sf21等)均市售可得。
如本文中所使用的,术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如酵母细胞或曲霉菌等的真菌细胞,如S2果蝇细胞或Sf9等的昆虫细胞,或者如纤维原细胞,CHO细胞,COS细胞,NSO细胞,HeLa细胞,BHK细胞,HEK 293细胞或人细胞等的动物细胞。
如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如Align程序(DNAstar,Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来实现。还可使用已整合入ALIGN程序(版本2.0)的E.Meyers和W.Miller(Comput.ApplBiosci.,4:11-17(1988))的算法,使用PAM120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入GCG软件包(可在www.gcg.com上获得)的GAP程序中的Needleman和Wunsch(JMoIBiol.48:444-453(1970))算法,使用Blossum 62矩阵或PAM250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。
本文涉及的二十个常规氨基酸的编写遵循常规用法。参见例如,Immunology-ASynthesis(2nd Edition,E.S.Golub and D.R.Gren,Eds.,Sinauer Associates,Sunderland,Mass.(1991)),其以引用的方式并入本文中。在本发明中,术语“多肽”和“蛋白质”具有相同的含义且可互换使用。并且在本发明中,氨基酸通常用本领域公知的单字母和三字母缩写来表示。例如,丙氨酸可用A或Ala表示。
如本文中所使用的,术语“药学上可接受的载体和/或赋形剂”是指,在药理学和/或生理学上与受试者和活性成分相容的载体和/或赋形剂,其是本领域公知的(参见例如Remington's Pharmaceutical Sciences.Edited by Gennaro AR,19thed.Pennsylvania:Mack Publishing Company,1995),并且包括但不限于:pH调节剂,表面活性剂,离子强度增强剂,维持渗透压的试剂,延迟吸收的试剂,稀释剂,佐剂,防腐剂,稳定剂等。例如,pH调节剂包括但不限于磷酸盐缓冲液。表面活性剂包括但不限于阳离子,阴离子或者非离子型表面活性剂,例如Tween-80。离子强度增强剂包括但不限于氯化钠。维持渗透压的试剂包括但不限于糖、NaCl及其类似物。延迟吸收的试剂包括但不限于单硬脂酸盐和明胶。稀释剂包括但不限于水,水性缓冲液(如缓冲盐水),醇和多元醇(如甘油)等。佐剂包括但不限于铝佐剂(例如氢氧化铝),弗氏佐剂(例如完全弗氏佐剂)等。防腐剂包括但不限于各种抗细菌试剂和抗真菌试剂,例如硫柳汞,2-苯氧乙醇,对羟苯甲酸酯,三氯叔丁醇,苯酚,山梨酸等。稳定剂具有本领域技术人员通常理解的含义,其能够稳定药物中的活性成分的期望活性(例如对PSD-95泛素化的抑制活性),包括但不限于谷氨酸钠,明胶,SPGA,糖类(如山梨醇,甘露醇,淀粉,蔗糖,乳糖,葡聚糖,或葡萄糖),氨基酸(如谷氨酸,甘氨酸),蛋白质(如干燥乳清,白蛋白或酪蛋白)或其降解产物(如乳白蛋白水解物)等。
如本文中所使用的,术语,术语“色谱层析“包括但不限于:离子交换色谱(例如阳离子交换色谱)、疏水相互作用色谱、吸附层析法(例如羟基磷灰石色谱)、凝胶过滤(凝胶排阻)层析、亲和层析法。
如本文中所使用的,术语“载体蛋白”是指这样的蛋白,其可以充当抗原性蛋白的载体,即,其可以在特定位置处(例如蛋白内部,N端或C端)插入抗原性蛋白,以便该抗原性蛋白能够呈现出来,从而该抗原性蛋白能够被抗体或免疫系统识别。此类载体蛋白是本领域技术人员熟知的,包括例如,CRMA蛋白、CRM389蛋白、CRM197蛋白等待。任选地,可以在抗原性蛋白与载体蛋白之间使用连接体(例如柔性或刚性连接体),以促进二者各自的折叠。
如本文中所使用的,术语“免疫学测定”是指,利用抗原-抗体之间的特异性相互作用/结合亲和力来进行的测定,其一般可用于检测特定抗原或者抗体在样品中的存在或水平。此类免疫学检测是本领域技术人员公知的,包括但不限于,酶免疫测定法(EIA)、化学发光免疫分析法(CLIA)、放射免疫测定法(RIA)、荧光免疫测定法(FIA)、Western印迹法、免疫比浊法、表面等离子共振法等。在某些实施方式中,所述免疫学检测为酶免疫测定法(EIA),例如ELISA检测法、Elispot检测法或CLEIA检测法。关于免疫学检测的详细描述,可参见例如,Fundamental Immunology,Ch.7Paul,W.,ed.,第2版,Raven Press,N.Y.(1989)。
如本文中所使用的,术语“可检测的标记”可以是可通过荧光、光谱、光化学、生物化学、免疫学、电学、光学或化学手段检测的任何物质。特别优选的是,此类标记能够适用于免疫学检测(例如,酶联免疫测定法、放射免疫测定法、荧光免疫测定法、化学发光免疫测定法等)。这类标记是本领域熟知的,包括但不限于,酶(例如,辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷酶、脲酶、葡萄糖氧化酶,等)、放射性核素(例如,3H、125I、35S、14C或32P)、荧光染料(例如,异硫氰酸荧光素(FITC)、荧光素、异硫氰酸四甲基罗丹明(TRITC)、藻红蛋白(PE)、德克萨斯红、罗丹明、量子点或花菁染料衍生物(例如Cy7、Alexa 750))、发光物质(例如化学发光物质,如吖啶酯类化合物)、磁珠(例如,
Figure BDA0002973147980000141
)、测热标记物例如胶体金或有色玻璃或塑料(例如,聚苯乙烯、聚丙烯、乳胶,等)珠、以及用于结合上述标记物修饰的亲和素(例如,链霉亲和素)的生物素。本发明中涵盖的标记物可通过本领域已知的方法检测。例如,放射性标记可使用摄影胶片或闪烁计算器检测,荧光标记物可使用光检测器检测,以检测发射的光。酶标记物一般通过给酶提供底物及检测通过酶对底物的作用产生的反应产物来检测,及测热标记物通过简单可视化着色标记物来检测。在某些实施方案中,可通过不同长度的接头将如上所述的可检测的标记连接至检测试剂,以降低潜在的位阻。
如本文中所使用的,术语“约”是指本领域的普通技术人员认为的在所修饰的数值的可接受的标准误差内,例如所修饰的数值的±10%、±9%、±8%、±7%、±6%、±5%、±4%、±3%、±2%、±1%、±0.5%、±0.1%、±0.05%或±0.01%以内。
如本文中所使用的,术语“和/或”,例如“A和/或B”应理解为是指“A和B”或“A或B”,并且应被理解为对两种含义或任一含义提供明确的支持。具体地,“在相应于野生型S蛋白的位置972的位置上的氨基酸置换为P,和/或在相应于野生型S蛋白的位置973的位置上的氨基酸置换为P”,应理解为“在相应于野生型S蛋白的位置972的位置上的氨基酸置换为P,或在相应于野生型S蛋白的位置973的位置上的氨基酸置换为P”,或“在相应于野生型S蛋白的位置972的位置上的氨基酸置换为P,并且在相应于野生型S蛋白的位置973的位置上的氨基酸置换为P”。
如本文中所使用的,术语“有效量”是指能够有效实现预期目的的量。例如,预防疾病(例如SARS-CoV-2感染,或由SARS-CoV-2感染所致的疾病COVID-19)有效量是指,能够有效预防,阻止,或延迟疾病(例如SARS-CoV-2感染,或由SARS-CoV-2感染所致的疾病COVID-19)的发生的量。测定这样的有效量在本领域技术人员的能力范围之内。治疗疾病(例如SARS-CoV-2感染,或由SARS-CoV-2感染所致的疾病COVID-19)有效量是指,能够实现所需治疗效果的量,例如实现减轻与待治疗疾病相关的症状的量。
发明的有益效果
冠状病毒S蛋白的变构现象及其呈现多种的不同构象与机体产生的免疫反应相关,对于针对SARS-CoV-2的亚单位疫苗开发策略至关重要。本发明出人意料地获得了呈现早期融合前构象的SARS-CoV-2的S三聚体,该构象区别于已报道的融合前构象,与病人恢复期血清具有良好的反应活性,在小鼠和非人灵长类动物中显示出较高的免疫原性,可作为诊断试剂的检测抗原和疫苗的免疫原,同时,早期融合前构象的结构信息为治疗性药物设计和筛选提供了重要依据,显示了其在SARS-CoV-2诊断、预防和治疗的应用前景和价值。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
图1显示了在本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的SDS聚丙烯酰胺凝胶电泳结果。M:分子量Marker;1:S-WT三聚体蛋白。结果显示,S-WT三聚体蛋白经过亲和层析一步纯化后,纯度约为60%左右。
图2显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的过Superdex 200(高效液相色谱分子筛)纯化并通过SDS聚丙烯酰胺凝胶电泳显示纯度结果。M:分子量Marker;1:S-WT三聚体蛋白过柱前;2:S-WT三聚体蛋白的洗脱峰1。结果显示经过分子筛色谱纯化的S-WT三聚体蛋白纯度达到90%以上。
图3显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白的过Superdex 200(高效液相色谱分子筛)纯化并通过SDS聚丙烯酰胺凝胶电泳显示纯度结果。Marker:分子量Marker;S-2P:S-2P三聚体蛋白过柱前;纯化峰1:S-2P三聚体蛋白洗脱峰1。结果显示经过分子筛色谱纯化的S-2P三聚体蛋白纯度达到90%以上。
图4显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的高效体积排阻色谱(HPSEC)的结果,融合前构象S三聚体蛋白类病毒颗粒的保留体积为5.3mL。
图5显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白的高效体积排阻色谱(HPSEC)的结果,融合前构象S三聚体蛋白类病毒颗粒的保留体积为5.3mL。
图6显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的分析超离的结果,结果显示该蛋白沉降系数约为15.2S,分子量约为577kDa,为三聚体。
图7显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白的分析超离的结果,结果显示该蛋白沉降系数约为14.1S,分子量约为544kDa,为三聚体。
图8显示了本发明实施例的融合前早期构象的S-WT三聚体蛋白的差示扫描量热法(DSC)获得的熔解温度Tm值,约为45.5°和64.5°。
图9显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白的差示扫描量热法(DSC)获得的熔解温度Tm值,约为64.1°。
图10显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT和S-2P三聚体蛋白与恢复期人血清的反应,其中A-F为SARS-CoV-2诊断阳性血清,G和H为健康人血清对照。结果显示恢复期血清对融合前早期构象的S-WT和S-2P三聚体蛋白具有良好的反应活性。
图11显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的冷冻电镜结构,以及其与现有技术中的融合前构象的结构比较,其中A显示本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的侧向视野和顶部视野下的的冻电镜结构照片,B为现有技术中的融合前构象的SARS-CoV-2的S蛋白三聚体的冻电镜结构照片。结果显示本发明实施的融合前早期构象的SARS-CoV-2的S三聚体蛋白呈三倍对称结构,最大高度约为
Figure BDA0002973147980000171
最大宽度约为
Figure BDA0002973147980000172
图12显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT体蛋白与现有技术中的融合前构象的SARS-CoV-2的S蛋白在结构上的差异。A显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白(蓝色)与现有技术中的融合前构象的SARS-CoV-2的S三聚体蛋白在结构上的差异(灰白色),前者蛋白结构在高度上比后者低约
Figure BDA0002973147980000173
B显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT单体蛋白与现有技术中的融合前构象的SARS-CoV-2的S单体蛋白在结构上的差异,其中现有技术中的融合前构象的S单体蛋白中NTD结构域和RBD结构域分别标记为绿色和淡紫色,本发明实施例的融合前早期构象的S单体蛋白的NTD结构域(红色)和RBD结构域分别标记为红色和黄色,结果显示融合前早期构象中S单体蛋白的NTD结构域和RBD结构域较融合前构象明显不同。
图13显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT单体蛋白的构象信息(A),和现有技术中的融合前构象的SARS-CoV-2的S单体蛋白的构象信息(B)。结果显示,本发明实施例的SARS-CoV-2的S单体蛋白融合前早期构象以及S蛋白的NTD和RBD结构域与现有技术中的S蛋白融合前构象相比具有构象差异,其中NTD结构域质量中心及S2结构域质量中心的连线,和RBD结构域质量中心及及S2结构域质量中心的连线的夹角约为81.4°。NTD结构域质量中心与S2结构域质量中心的垂直距离约为
Figure BDA0002973147980000181
RBD结构域质量中心与S2结构域质量中心的垂直距离约为
Figure BDA0002973147980000182
图14显示本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的构象与已报道的代表性融合前构象的SARS-CoV-2的S三聚体蛋白的结构差异。结果显示,本发明实施例的融合前早期构象的S-WT三聚体蛋白结构(A)矮于6种列举的冠状病毒融合前构象的S三聚体蛋白:SARS-CoV-2(B)、SARS-CoV(C)、MERS-CoV(D)、HCoV-NL63(E)、IBV(F)及PdCoV(G)。
图15显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT和S-2P三聚体蛋白免疫小鼠的结果。结果显示,S1组的中和滴度低于RBD和S-WT组(高达1.5log)。S-WT三聚体蛋白在两种佐剂下都能产生3.5log的中和抗体滴度(图5(E,F)),表明S-WT三聚体蛋白在两种佐剂中都能产生高免疫原性的中和抗体。低剂量(10μg和1μg)SARS-CV-2的S蛋白的RBD以及本发明实施例的S-WT三聚体蛋白、S-2P三聚体蛋白结合铝佐剂的免疫原性实验的结果表明,所有动物在第2周均出现IgG血清转换,而S-WT和S-SP的滴度随时间增加而增加,RBD滴度维持在较低水平(<2.5log;图15(G))。在第5周,所有小鼠都显示出高的IgG抗体滴度(高达4.5log)。S-WT和S-2P在第3周时的中和滴度则呈剂量依赖性。在第5周、10μg S-WT、S-2P或RBD诱导的中和滴度(约为3.5log)相当,而1μg S-2P诱导的中和滴度显著高于S-WT和RBD(约为1log,图15(H))。这表明三聚体稳定的本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白可以在较低的免疫剂量下提供较高的免疫原性。
图16显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白免疫猴子的结果。结果显示,两只实验猴对SARS-CoV-2 s型特异性IgG和中和抗体均产生了类似的动力学反应。IgG抗体在第2周(第3周)发生血清转换,在第2周(第3周)后一周达到约3.5log,滴度值维持到第5周。第三次接种后,IgG抗体最高达到3.8log(第7周),并在第8周维持水平(图16(A))。中和性抗体反应在第2周可检测到,在第7周达到峰值,平均ID50=29,798(图16(B,D)),与IgG的趋势一致(图16(A))。第8周时平均中和滴度略有下降,至ID50=13856,第三次免疫后公猴的中和滴度明显高于母猴(图16(C,D))。在对照组的猴子身上既没有检测到IgG也没有检测到中和抗体。对COVID-19恢复期的人类血清(n=18)的中和滴度检测的平均结果是ID50=706,表明本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白在猴子中的中和抗体滴定高于恢复期血清的40倍。
序列信息
本发明涉及的部分序列的信息提供于下面的表1中。
表1:序列的描述
Figure BDA0002973147980000191
Figure BDA0002973147980000201
Figure BDA0002973147980000211
Figure BDA0002973147980000221
Figure BDA0002973147980000231
Figure BDA0002973147980000241
Figure BDA0002973147980000251
Figure BDA0002973147980000261
Figure BDA0002973147980000271
Figure BDA0002973147980000281
Figure BDA0002973147980000291
Figure BDA0002973147980000301
具体实施方式
现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。除非特别指明,本发明中所使用的分子生物学实验方法和免疫检测法,基本上参照J.Sambrook等人,分子克隆:实验室手册,第2版,冷泉港实验室出版社,1989,以及F.M.Ausubel等人,精编分子生物学实验指南,第3版,John Wiley&Sons,Inc.,1995中所述的方法进行;限制性内切酶的使用依照产品制造商推荐的条件。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。
实施例1:融合前早期构象的野生型和突变型S三聚体蛋白的制备
本实施例制备单体序列为SEQ ID NO:6和8的野生型和突变型S三聚体蛋白。
用做模板S三聚体蛋白片段的制备
送生工公司合成编码SEQ ID NO:1所示的野生型S蛋白的核苷酸序列。
早期融合前构象的S三聚体蛋白表达载体的构建
以前一步骤所获得3.6kb大小的编码SEQ ID NO:1所示的野生型S蛋白的核苷酸序列作为PCR反应的模板,以pAc-S-F:5'-GCCTTTGCGGCGGATCTTGGATCCTGTGTTAATCTTACAACCAGA-3'为正向引物,pAc-S-R1:5'-CGTCCTTACGCACGTAAGCCTGACCGTCACGGGGAGCCTCGGGGATGTAACCGGAACCGGGGGAACCGCTTCCACGAGGGACCAATGGCCATTTTATATACTGCTCA-3'为反向引物,通过PCR反应来获得中间片段。
再以中间片段为模板,以pAc-S-F为正向引物,pAc-S-R2:5'-AAGGATCAGATCTGCAGCGGCCGCTTAATGGTGGTGGTGGTGGTGATGGTGATGATGGCCCAGGAAGGTGGACAGCAGCACCCACTCACCGTCCTTACGCACGTAAGC-3'为反向引物,再次进行PCR反应,引入凝血酶酶切位点(即,SEQ ID NO:4所示的凝血酶识别序列-1)、三聚化结构域序列(SEQ ID NO:3)和纯化标签10×His的基因序列,酶切位点为BamHI和NotI。
上述PCR反应在PCR热循环仪(Biometra T3)上按照如下条件进行:
Figure BDA0002973147980000311
通过上述PCR反应扩增得到3.8kb左右大小特异的DNA片段,将该PCR产物与商售的pAcgp67B载体(BD公司生产)利用Gibson反应液(NEB公司)连接装配,得到pAc-S质粒。经BamHI/NotI酶切鉴定,所得pAc-S质粒中插入的目的片段的核苷酸序列为SEQ ID NO:7所示的核苷酸序列,其编码的氨基酸序列为SEQ ID NO:6所示的氨基酸序列(所对应的蛋白命名为S-WT,其为融合前早期构象的野生型S三聚体蛋白)。取1μL的pAc-S质粒(0.15mg/ml)转化40μL的氯化钙法制备的感受态大肠杆菌ER2566(购自新英格兰生物实验室公司),涂布于卡那霉素(终浓度25mg/mL,下同)抗性的固体LB培养基,37℃静置培养10-12小时至单菌落清晰可辨。挑取单个菌落,挑取单菌落至含4mL卡那霉素抗性的液体LB培养基之试管,37℃220转/分振荡培养10小时,从中取1mL菌液于-70℃冻干保存。采用试剂盒(购自TianGEN,DP214)提取回收pAc-S质粒。
采用相同的方法,制备获得插入了SEQ ID NO:9所示的核苷酸序列(其编码的氨基酸序列为SEQ ID NO:8所示的氨基酸序列,该氨基酸所对应的蛋白命名为S-2P,其为融合前早期构象的突变型S三聚体蛋白)的质粒。所用引物包括:
pAc-S0-F:
5'-CAGACTAATTCTCCTGCAGGCGCAGGAAGTGTAGCTAGTCAATCC-3'
pAc-S0-R:
5'-GGATTGACTAGCTACACTTCCTGCGCCTGCAGGAGAATTAGTCTG-3'
S-2P-F:
5'-ATCCTTTCACGTCTTGACCCACCGGAGGCTGAAGTGCAAATTGA-3'
S-2P-R:
5'-TCAATTTGCACTTCAGCCTCCGGTGGGTCAAGACGTGAAAGGAT-3'。
S三聚体蛋白的大量表达
昆虫细胞的转染
(1)确定sf9细胞(购自Invitrogen,11496-015)或sf21细胞(购自Invitrogen,11497-013)处于对数增长期(1.5-2.5×106/mL),生存率维持在90%以上。在24孔板中加入200μL培养基ESF 921(购自Expression systems,96-001-01)含2%FBS),0.1μgBaculovirus DNA(购自Expression systems,91-002)和1ug pAc-S质粒,混合均匀。在50μLESF921培养基(购自Expression systems,96-001-01)中加入1μL转染试剂(购自Expression systems,95-055-075),混合均匀。将上述两者合成一管,混合均匀,在室温中静置30min。静置过程中清洗细胞(时间快到前进行):待细胞完全贴壁后,用枪吸走培养基,再加入300μL ESF921培养基,动作迅速,以免使细胞失水,轻轻摇摆后,去掉培养基,再加入300μL ESF921培养基。时间到后,将约100μL的上述混合物滴加到每孔细胞中,均匀滴加。然后置于27℃孵育6h,弃去上清,补加500μL完全培养基(50%CCM3+50%TNM-FH(SIGMA-ALDRICH,T1032)+10%FBS)。
(2)收集步骤(1)中所得细胞上清,500g离心5min,去除细胞残骸和碎片,将上清于4℃避光存放,此为P1病毒种液。
(3)杆状病毒的扩增
确定sf9细胞或sf21细胞处于对数增长期(1.5-2.5×106/mL),生存率维持在90%以上。在10cm板上铺8-10mL密度为6×105/mL个细胞。静置15min使细胞贴壁。加入P1病毒液约600μL,均匀滴入。置于27℃孵育3-4d。观察细胞病变现象。收集细胞上清,1000rpm离心5min,去除细胞残骸和碎片,并用0.22um滤膜过滤。将上清于4℃避光存放,此为P2病毒种液。P2病毒滴度约为106-107pfu/mL。P3可依照此方法在250mL摇瓶中按体积放大扩增病毒。
昆虫细胞蛋白表达操作
1L摇瓶中加入250mL ESF921培养基培养的密度为2×106/mL,生存率90%以上的H5细胞(购自Invitrogen,B855-02)。按相应MOI加入病毒量,用封口膜封住瓶口,置于27℃摇床中120rpm培养。每天取出摇瓶中细胞观察并计数,记录相关数据。合适的MOI能保证第一天细胞70%以上病变。第二天细胞全部病变,且生存率80%左右。第三天细胞出现破裂,生存率降低至30-50%。此时可考虑收集细胞。采用10000rpm,离心10min来收集细胞,然后分离上清并进行纯化,得到单体序列为SEQ ID NO:6的野生型S三聚体蛋白S-WT,以及单体序列为SEQ ID NO:8的突变型S三聚体蛋白S-2P。
S三聚体蛋白纯化
利用AKTA系统进行Ni亲和层析纯化;
仪器系统:AKTA Pure型制备型液相色谱仪;
纯化介质:Ni Sepharose 6Fast Flow亲和介质;缓冲液:分为A泵、B泵缓冲液,一般A泵为1×PBS缓冲液(160g/L NaCL,8.1mmol/LNa2HPO4,1.5mmol/L KH2PO4,2.7mmol/LKCL,pH7.4),B泵为1×PBS+250mmol/L咪唑缓冲液;
系统流速:5mL/min;检测波长:UV@280nm
洗脱条件:用50mM咪唑缓冲液(250mmol/L咪唑缓冲液经1×PBS缓冲液稀释获得)洗脱杂蛋白,接着用1×PBS清洗,再用250mM咪唑缓冲液洗脱目的蛋白(S三聚体蛋白);
收集250mM咪唑洗脱的产物,获得纯化的样品10mL。取洗脱产物各50μL,加入6XLoading Buffer 30μL混匀,于80℃水浴10min后取10μl于10%SDS-聚丙烯酰胺凝胶中以120V电压电泳120min。随后以考马斯亮兰染色显示电泳条带,本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的SDS聚丙烯酰胺凝胶电泳结果见图1,其中M:分子量Marker;1:S-WT三聚体蛋白。由电泳结果可知,S-WT三聚体蛋白浓度约为0.2mg/ml,SDS-PAGE考染纯度约为60%左右。
实施例2:S三聚体蛋白的分子筛色谱纯化
仪器系统:GE Healthcare(原Amershan Pharmacia)公司生产的AKTA explorer100型制备型液相色谱系统。
层析介质:Superdex 200。
柱体积:5.5cm×60cm。
缓冲液:20mM磷酸缓冲液pH7.4
流速:1mL/min
检测器波长:280nm。
样品为实施例2中250mM洗脱的样品。
洗脱程序为:收集穿透峰,每个峰都收集,S三聚体蛋白在第一个穿透峰中。
收集Supedex 200穿透的产物,获得纯化的样品5mL。取洗脱产物各50μL,加入6XLoading Buffer 30μL混匀,于80℃水浴10min后取10μl于10%SDS-聚丙烯酰胺凝胶中以120V电压电泳120min。随后以考马斯亮兰染色显示电泳条带,电泳结果见图2和图3,结果显示本发明实施例的SARS-CoV-2的野生型S-WT三聚体蛋白和突变型S-2P三聚体蛋白的纯度均达到90%以上。
实施例3:S三聚体蛋白的高效体积排阻色谱(HPSEC)分析
仪器:Waters。系统流速:G3000PWXL为0.5mL/min。波长190~600nm,柱波长为280nm和254nm。
缓冲液:PBS
操作流程:预先平衡层析柱30~60min至280nm吸收值无明显的变化,将检测器的吸收值归零。编辑层析运行方法,样品先离心,将待分析样品注入100μL样品环中,设置自动上样,运行30min,观察S三聚体的保留体积约为5.3mL。
结果如图4和图5所示,本发明实施例的融合前构象的SARS-CoV-2的野生型S-WT三聚体蛋白和突变型S-2P三聚体蛋白类病毒颗粒的保留体积均为5.3mL。
实施例4:分析超离法计算样品沉降系数
所使用的仪器为Beckman XL-A分析型超速离心机,其配有光学检测系统及An-60Ti转头。
按照操作说明安装样品池,对照池加入400μL的样品缓冲液(与样品统一缓冲液),样品池加入380μL的样品(OD280为0.8左右),配平样品池,重量差在0.1g以内。
将样品池放入An-60Ti转头中,在将转头置于Beckman XL-A型分析超速离心机腔内,装上光路检测器。
参数设定:温度(20℃)、Rmin(6.0cm)、Rmax(7.2cm)、波长(280nm)、步进速度(0.003cm)、扫描模式(continuous)、数据间隔(30sec)和数据的数目(150scans)。设置离心转速为30000rpm。
实验结束后使用SENDTERP软件计算缓冲液的密度和粘度,以及已知蛋白的偏微比容。使用Origin版的Nonlin和SEDFIT软件进行沉降系数的分析,预设球蛋白的摩擦比f/f0=1.2,根据样品蛋白分子量和基本性质设定分析范围,计算分辨率设为100,一般要求RMSD值不大于0.01且残基图波动在0.05以内。结果见图6和图7。
图6和图7显示了本发明实施例的融合前早期构象的SARS-CoV-2的野生型S-WT三聚体蛋白和突变型S-2P三聚体蛋白的分析超离的结果,结果显示S-WT蛋白沉降系数约为15.2S,分子量约为577kDa,为三聚体,S-2P蛋白沉降系数为14.1S,分子量约为554kDa,为三聚体。
实施例5:差式量热扫描法(DSC)检测
所使用的仪器为差示扫描量热仪(VP-Capillary DSC),购自METTLER TOLEDO。
(1)用酸性或弱碱性洗液对上样槽清洗1次,再用去离子水清洗3次;
(2)将样品及其对应缓冲液各吸取500μL于EP管中,离心除气泡;
(3)分别吸取350μL缓冲液于样品槽及对照槽中,润洗3次,再各自加入350μL缓冲液,加样过程动作要轻以免产生气泡;
(4)启动DSC软件和仪器,设置扫描循环次数,当扫描循环中DP值稳定在±0.2之间时即可让其循环扫描,基线平衡不少于3次;
(5)当最后一次循环扫描结束,温度降至30℃-10℃之间时将样品槽中的缓冲液吸出,迅速加入待测蛋白样品,并继续扫描测试;
(6)扫描完成后,电脑会自然生成图表,将样品测试曲线扣除缓冲液曲线后即可获得S蛋白样品的Tm值和曲线。
图8和图9显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的差示扫描量热法(DSC)获得的熔解温度Tm值,约为45.5°和64.5°;S-2P三聚体蛋白的溶解温度Tm约为64.1°,为单峰,稳定性高于S-WT三聚体蛋白。
实施例6:恢复期血清检测反应活性
Western Blot检测(WB)
将等量的蛋白质样品与载入缓冲液混合,煮沸10分钟,按照实验室标准方案载入SDS-PAGE凝胶用于western blotting(BioRad),蛋白在BioRad迷你protean Tetra系统80V下电泳70分钟,凝胶在室温下用考马斯亮蓝R-250(Bio-Rad)染色30分钟。分离的蛋白质使用反式印迹涡轮转移系统(Bio-Rad)转移到硝化纤维素膜上,封闭后,与人血清(1:500稀释)孵育1小时。清洗5次,每次清洗5分钟,以去除未结合的抗体,用碱性磷酸酶结合的山羊抗小鼠二抗或山羊抗人IgG二抗(Invitrogen)孵育膜。再次清洗膜,然后使用化学发光底物试剂盒检测。
ELISA检测
(1)将S-WT或S-2P三聚体蛋白稀释至1μg/mL包被96孔板,每孔100μL,室温静置2h;
(2)洗板1次,用牛血清蛋白稀释液(ED,200μL/孔)室温封闭2h;
(3)洗板1次,将ED将血清稀释100倍加入首孔,2倍系列稀释11个梯度,双孔重复,室温放置1h;
(4)洗板5次,将二抗GAH-HRP(1:5000)加入96孔板,100μL/孔,室温放置1h;
(5)洗板5次,室温显色10min,终止,酶标仪450nm波长处检测;使用GraphPadPrism 5(GraphPad,USA)软件进行数据分析。结果如图10所示。
图10显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT和S-2P三聚体蛋白与恢复期人血清的WB和ELISA反应,其中A-F为SARS-CoV-2诊断阳性血清,G和H为健康人血清对照。结果显示恢复期血清对融合前早期构象的S-WT和S-2P三聚体蛋白具有良好的反应活性。
实施例7:冷冻电镜结构解析及分析
冷冻样品制备
(1)在冷冻样品制样前,先对铜网(R2/2,200目,ThermoFisher Scientific)进行辉光放电亲水处理:
(2)将FEI Mark IV Vitrobot(ThermoFisher Scientific)制样仪内腔设置为低温(6-8℃)、高湿度(100%)的环境;
(3)将制样泡沫盒装满液氮,待中间铜碗冷却后,缓慢注入气态乙烷,通过低温加压使其变成液态;
(4)将2.5-3μL纯化的SARS-CoV-2的S-WT三聚体蛋白样品滴加至已处理的铜网中,吸附5s,滤纸吸水6s后将铜网迅速浸入液态乙烷内,使铜网上样品的水冷冻成一层略高于样品的玻璃态的薄冰层;
(5)将制备好的样品(铜网)保存于液氮中备用。
低温电镜观察病毒样颗粒及数据收集
(1)在液氮的环境中,用镊子将铜网放置于冷冻样品杆的探头上,并快速转移至电镜的样品室;
(2)待电镜(ThermoFisher Scientific,FEI Tecnai F30)腔室真空压力稳定后,随机选取数个视野观察,确认样品的制备质量;
(3)利用FEI的EPU软件自动收集样品数据,在低放大倍数下,寻找并选取颗粒平均分布的样品区域,设置不同水平的欠焦值(-1.5至-3.0μm),接着在放大倍数为93,000×和电子剂量为
Figure BDA0002973147980000381
的条件下进行拍照;
(4)利用FEI Falcon-3电子直接检测器采集movie形式的冷冻电镜数据。
冷冻电镜单颗粒重构
(1)将采集到的数字化图像进行图片筛选,剔除漂移、像散和污染严重的低质量图片;
(2)利用MotionCor2软件对收集的movie形式的电镜图片进行漂移校正;
(3)将高质量的校正后图片用衬度传递函数(contrast transfer function,CTF)校正;
(4)运用EMAN2软件中的Particle Boxer程序挑选图片中的每一个完整的颗粒,确定颗粒在图片中的坐标位置;
(5)运用CryoSPARC v2软件对挑取的蛋白颗粒投影进行reference-free 2Dclassification、3D classification、初始模型构建、3D refine的归类和分析等,最终获得蛋白的三维结构密度图;
三维结构的分析
运用Chimera软件显示本发明实施例的SARS-CoV-2的S-WT蛋白结构进行分析及作图,结果如下:
图11显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的冷冻电镜结构,以及其与现有技术中的融合前构象的SARS-CoV-2的S蛋白三聚体结构比较。A显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的侧向视野和顶部视野下的的冻电镜结构照片。B显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白(灰色)与现有技术中的融合前构象的SARS-CoV-2的S单体蛋白的结构(彩色)比较。结果显示本发明实施的融合前早期构象的SARS-CoV-2的S三聚体蛋白呈三倍对称结构,最大高度约为
Figure BDA0002973147980000391
最大宽度约为
Figure BDA0002973147980000392
图12显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT体蛋白与现有技术中的融合前构象的SARS-CoV-2的S蛋白在结构上的差异。A显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白(蓝色)与现有技术中的融合前构象的SARS-CoV-2的S三聚体蛋白在结构上的差异(灰白色),前者蛋白结构在高度上比后者低约
Figure BDA0002973147980000393
B显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT单体蛋白与现有技术中的融合前构象的SARS-CoV-2的S单体蛋白在结构上的差异,其中现有技术中的融合前构象的S单体蛋白中NTD结构域和RBD结构域分别标记为绿色和淡紫色,本发明实施例的融合前早期构象的S单体蛋白的NTD结构域(红色)和RBD结构域分别标记为红色和黄色,结果显示融合前早期构象中S单体蛋白的NTD结构域和RBD结构域较融合前构象明显不同。
图13显示了本发明实施例的融合前早期构象的SARS-CoV-2的S-WT单体蛋白的构象信息(左),和现有技术中的融合前构象的SARS-CoV-2的S单体蛋白的构象信息(右)。结果显示,本发明实施例的SARS-CoV-2的S单体蛋白融合前早期构象以及S蛋白的NTD和RBD结构域与现有技术中的S蛋白融合前构象相比具有构象差异,其中NTD结构域质量中心及S2结构域质量中心的连线,和RBD结构域质量中心及及S2结构域质量中心的连线的夹角约为81.4°。NTD结构域质量中心与S2结构域质量中心的垂直距离约为
Figure BDA0002973147980000401
RBD结构域质量中心与S2结构域质量中心的垂直距离约为
Figure BDA0002973147980000402
图14显示本发明实施例的融合前早期构象的SARS-CoV-2的S-WT三聚体蛋白的构象与已报道的代表性融合前构象的S三聚体蛋白的结构差异,本发明实施例的融合前早期构象的S-WT三聚体蛋白(A)结构矮于6种列举的冠状病毒融合前构象的SARS-CoV-2的S三聚体蛋白:SARS-CoV-2(B)、SARS-CoV(C)、MERS-CoV(D)、HCoV-NL63(E)、IBV(F)及PdCoV(G)。
实施例8:免疫原性评价
本实验方案经厦门大学实验动物管理伦理委员会批准。所有操作都严格按照动物伦理准则和批准的规程进行。
选用6周龄的Balb/C小鼠,将其分为三组,每组5只,每组分别使用SARS-CV-2的S蛋白的RBD(免疫剂量为100μg)、S1(免疫剂量为35μg)以及S-WT三聚体蛋白(免疫剂量为35μg)并结合铝或50%弗氏完全佐剂(Sigma-Aldrich)进行免疫,分别于0周、1周和4周肌肉注射(150μL)小鼠的左或右后肢。分别于第0周、1周、2周、3周、4周和5周采集眼球静脉血,其中第0周、1周和4周在注射前采血。血液样本13000g离心10分钟,得到血清样本在-20℃保存。用终点酶联免疫吸附法和水泡性口炎病毒(VSV)假病毒中和法分别测定抗原特异性IgG和中和抗体滴度,结果如图15所示。
结果显示,S1组的中和滴度低于RBD和S-WT组(高达1.5log)。S-WT在两种佐剂下都能产生3.5log的中和抗体滴度(图15(E,F)),表明S-WT在两种佐剂中都能产生高免疫原性的中和抗体。
此外,我们比较了低剂量(10μg和1μg)SARS-CV-2的S蛋白的RBD以及本发明实施例的S-WT三聚体蛋白、S-2P三聚体蛋白结合铝佐剂的免疫原性,免疫方案同上。结果如图15所示。三针免疫后结果表明,所有动物在第2周均出现IgG血清转换,而S-WT和S-SP的滴度随时间增加而增加,RBD滴度维持在较低水平(<2.5log;图15(G))。在第5周,所有小鼠都显示出高的IgG抗体滴度(高达4.5log)。S-WT和S-2P在第3周时的中和滴度则呈剂量依赖性。在第5周,10μg S-WT、S-2P或RBD诱导的中和滴度(约为3.5log)相当,而1μg S-2P诱导的中和滴度显著高于S-WT和RBD(约为1log,图15(H))。这表明本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白可以在较低的免疫剂量下提供较高的免疫原性。
为评估本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白在非人类灵长类动物中的免疫原性,将未检出抗SARS-CoV-2感染中和抗体的2只食蟹猴(MacacaFascicularis)采用肌肉注射S-2P三聚体蛋白(20μg/dose,铝佐剂)3次(0、2、6周)。每只猴分别采集免疫前血清,免疫后每隔1周采集血清样本,结果如图16所示。
结果显示,两只实验猴对SARS-CoV-2 s型特异性IgG和中和抗体均产生了类似的动力学反应。IgG抗体在第2周(第3周)发生血清转换,在第2周(第3周)后一周达到约3.5log,滴度值维持到第5周。第三次接种后,IgG抗体最高达到3.8log(第7周),并在第8周维持水平(图16(A))。中和性抗体反应在第2周可检测到,在第7周达到峰值,平均ID50=29,798(图16(B,D)),与IgG的趋势一致(图16(A))。第8周时平均中和滴度略有下降,至ID50=13856,第三次免疫后公猴的中和滴度明显高于母猴(图16(C,D))。在对照组的猴子身上既没有检测到IgG也没有检测到中和抗体。对COVID-19恢复期的人类血清(n=18)的中和滴度检测的平均结果是ID50=706,表明本发明实施例的融合前早期构象的SARS-CoV-2的S-2P三聚体蛋白在猴子中的中和抗体滴定高于恢复期血清的40倍。
实施例9:其他具有融合前早期构象的S三聚体蛋白的制备及性能评价
除实施例1获得的S三聚体蛋白(SEQ ID NO:6和SEQ ID NO:8)之外,发明人还通过相同的方法制备获得了下表中所列的多种具有融合前早期构象的S三聚体蛋白,并通过实施例2-8所述的方法对其进行性能评价。这些具有融合前早期构象的S三聚体蛋白与病人恢复期血清具有良好的反应活性,可作为诊断试剂的检测抗原和疫苗的免疫原,显示了其在SARS-CoV-2诊断、预防和治疗的应用前景和价值。
表2:S三聚体蛋白单体所包含的组分
Figure BDA0002973147980000421
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。
SEQUENCE LISTING
<110> 厦门大学
厦门万泰沧海生物技术有限公司
<120> 具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用
<130> IDC210072
<150> CN202010171146.8
<151> 2020-03-12
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 1199
<212> PRT
<213> Artificial Sequence
<220>
<223> SARS-CoV-2野生型S蛋白氨基酸序列
<400> 1
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
1190 1195
<210> 2
<211> 1199
<212> PRT
<213> Artificial Sequence
<220>
<223> SARS-CoV-2突变型S蛋白氨基酸序列
<400> 2
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Gly Ala Gly Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
1190 1195
<210> 3
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> 三聚化结构域序列
<400> 3
Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln
1 5 10 15
Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25 30
Gly
<210> 4
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> 凝血酶识别序列-1
<400> 4
Leu Val Pro Arg Gly Ser
1 5
<210> 5
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> 凝血酶识别序列-2
<400> 5
Ser Gly Arg Leu Val Pro Arg
1 5
<210> 6
<211> 1248
<212> PRT
<213> Artificial Sequence
<220>
<223> 融合前早期构象的野生型S三聚体蛋白的氨基酸序列,S-WT
<400> 6
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg
1190 1195 1200
Gly Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
1220 1225 1230
Ser Thr Phe Leu Gly His His His His His His His His His His
1235 1240 1245
<210> 7
<211> 3747
<212> DNA
<213> Artificial Sequence
<220>
<223> 融合前早期构象的野生型S三聚体蛋白的核苷酸序列
<400> 7
tgtgttaatc ttacaaccag aactcaatta ccccctgcat acactaattc tttcacacgt 60
ggtgtttatt accctgacaa agttttcaga tcctcagttt tacattcaac tcaggacttg 120
ttcttacctt tcttttccaa tgttacttgg ttccatgcta tacatgtctc tgggaccaat 180
ggtactaaga ggtttgataa ccctgtccta ccatttaatg atggtgttta ttttgcttcc 240
actgagaagt ctaacataat aagaggctgg atttttggta ctactttaga ttcgaagacc 300
cagtccctac ttattgttaa taacgctact aatgttgtta ttaaagtctg tgaatttcaa 360
ttttgtaatg atccattttt gggtgtttat taccacaaaa acaacaaaag ttggatggaa 420
agtgagttca gagtttattc tagtgcgaat aattgcactt ttgaatatgt ctctcagcct 480
tttcttatgg accttgaagg aaaacagggt aatttcaaaa atcttaggga atttgtgttt 540
aagaatattg atggttattt taaaatatat tctaagcaca cgcctattaa tttagtgcgt 600
gatctccctc agggtttttc ggctttagaa ccattggtag atttgccaat aggtattaac 660
atcactaggt ttcaaacttt acttgcttta catagaagtt atttgactcc tggtgattct 720
tcttcaggtt ggacagctgg tgctgcagct tattatgtgg gttatcttca acctaggact 780
tttctattaa aatataatga aaatggaacc attacagatg ctgtagactg tgcacttgac 840
cctctctcag aaacaaagtg tacgttgaaa tccttcactg tagaaaaagg aatctatcaa 900
acttctaact ttagagtcca accaacagaa tctattgtta gatttcctaa tattacaaac 960
ttgtgccctt ttggtgaagt ttttaacgcc accagatttg catctgttta tgcttggaac 1020
aggaagagaa tcagcaactg tgttgctgat tattctgtcc tatataattc cgcatcattt 1080
tccactttta agtgttatgg agtgtctcct actaaattaa atgatctctg ctttactaat 1140
gtctatgcag attcatttgt aattagaggt gatgaagtca gacaaatcgc tccagggcaa 1200
actggaaaga ttgctgatta taattataaa ttaccagatg attttacagg ctgcgttata 1260
gcttggaatt ctaacaatct tgattctaag gttggtggta attataatta cctgtataga 1320
ttgtttagga agtctaatct caaacctttt gagagagata tttcaactga aatctatcag 1380
gccggtagca caccttgtaa tggtgttgaa ggttttaatt gttactttcc tttacaatca 1440
tatggtttcc aacccactaa tggtgttggt taccaaccat acagagtagt agtactttct 1500
tttgaacttc tacatgcacc agcaactgtt tgtggaccta aaaagtctac taatttggtt 1560
aaaaacaaat gtgtcaattt caacttcaat ggtttaacag gcacaggtgt tcttactgag 1620
tctaacaaaa agtttctgcc tttccaacaa tttggcagag acattgctga cactactgat 1680
gctgtccgtg atccacagac acttgagatt cttgacatta caccatgttc ttttggtggt 1740
gtcagtgtta taacaccagg aacaaatact tctaaccagg ttgctgttct ttatcaggat 1800
gttaactgca cagaagtccc tgttgctatt catgcagatc aacttactcc tacttggcgt 1860
gtttattcta caggttctaa tgtttttcaa acacgtgcag gctgtttaat aggggctgaa 1920
catgtcaaca actcatatga gtgtgacata cccattggtg caggtatatg cgctagttat 1980
cagactcaga ctaattctcc tcggcgggca cgtagtgtag ctagtcaatc catcattgcc 2040
tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100
cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160
tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220
caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280
gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340
aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400
aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460
aaacaatatg gtgattgcct tggtgatatt gctgctagag acctcatttg tgcacaaaag 2520
tttaacggcc ttactgtttt gccacctttg ctcacagatg aaatgattgc tcaatacact 2580
tctgcactgt tagcgggtac aatcacttct ggttggacct ttggtgcagg tgctgcatta 2640
caaataccat ttgctatgca aatggcttat aggtttaatg gtattggagt tacacagaat 2700
gttctctatg agaaccaaaa attgattgcc aaccaattta atagtgctat tggcaaaatt 2760
caagactcac tttcttccac agcaagtgca cttggaaaac ttcaagatgt ggtcaaccaa 2820
aatgcacaag ctttaaacac gcttgttaaa caacttagct ccaattttgg tgcaatttca 2880
agtgttttaa atgatatcct ttcacgtctt gacaaagttg aggctgaagt gcaaattgat 2940
aggttgatca caggcagact tcaaagtttg cagacatatg tgactcaaca attaattaga 3000
gctgcagaaa tcagagcttc tgctaatctt gctgctacta aaatgtcaga gtgtgtactt 3060
ggacaatcaa aaagagttga tttttgtgga aagggctatc atcttatgtc cttccctcag 3120
tcagcacctc atggtgtagt cttcttgcat gtgacttatg tccctgcaca agaaaagaac 3180
ttcacaactg ctcctgccat ttgtcatgat ggaaaagcac actttcctcg tgaaggtgtc 3240
tttgtttcaa atggcacaca ctggtttgta acacaaagga atttttatga accacaaatc 3300
attactacag acaacacatt tgtgtctggt aactgtgatg ttgtaatagg aattgtcaac 3360
aacacagttt atgatccttt gcaacctgaa ttagactcat tcaaggagga gttagataaa 3420
tattttaaga atcatacatc accagatgtt gatttaggtg acatctctgg cattaatgct 3480
tcagttgtaa acattcaaaa agaaattgac cgcctcaatg aggttgccaa gaatttaaat 3540
gaatctctca tcgatctcca agaacttgga aagtatgagc agtatataaa atggccattg 3600
gtccctcgtg gaagcggttc ccccggttcc ggttacatcc ccgaggctcc ccgtgacggt 3660
caggcttacg tgcgtaagga cggtgagtgg gtgctgctgt ccaccttcct gggccatcat 3720
caccatcacc accaccacca ccattaa 3747
<210> 8
<211> 1248
<212> PRT
<213> Artificial Sequence
<220>
<223> 融合前早期构象的突变型S三聚体蛋白的氨基酸序列,S-2P
<400> 8
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Ala Gly Ala Gly Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Pro Pro Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg
1190 1195 1200
Gly Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
1220 1225 1230
Ser Thr Phe Leu Gly His His His His His His His His His His
1235 1240 1245
<210> 9
<211> 3747
<212> DNA
<213> Artificial Sequence
<220>
<223> 融合前早期构象的突变型S三聚体蛋白的核苷酸序列
<400> 9
tgtgttaatc ttacaaccag aactcaatta ccccctgcat acactaattc tttcacacgt 60
ggtgtttatt accctgacaa agttttcaga tcctcagttt tacattcaac tcaggacttg 120
ttcttacctt tcttttccaa tgttacttgg ttccatgcta tacatgtctc tgggaccaat 180
ggtactaaga ggtttgataa ccctgtccta ccatttaatg atggtgttta ttttgcttcc 240
actgagaagt ctaacataat aagaggctgg atttttggta ctactttaga ttcgaagacc 300
cagtccctac ttattgttaa taacgctact aatgttgtta ttaaagtctg tgaatttcaa 360
ttttgtaatg atccattttt gggtgtttat taccacaaaa acaacaaaag ttggatggaa 420
agtgagttca gagtttattc tagtgcgaat aattgcactt ttgaatatgt ctctcagcct 480
tttcttatgg accttgaagg aaaacagggt aatttcaaaa atcttaggga atttgtgttt 540
aagaatattg atggttattt taaaatatat tctaagcaca cgcctattaa tttagtgcgt 600
gatctccctc agggtttttc ggctttagaa ccattggtag atttgccaat aggtattaac 660
atcactaggt ttcaaacttt acttgcttta catagaagtt atttgactcc tggtgattct 720
tcttcaggtt ggacagctgg tgctgcagct tattatgtgg gttatcttca acctaggact 780
tttctattaa aatataatga aaatggaacc attacagatg ctgtagactg tgcacttgac 840
cctctctcag aaacaaagtg tacgttgaaa tccttcactg tagaaaaagg aatctatcaa 900
acttctaact ttagagtcca accaacagaa tctattgtta gatttcctaa tattacaaac 960
ttgtgccctt ttggtgaagt ttttaacgcc accagatttg catctgttta tgcttggaac 1020
aggaagagaa tcagcaactg tgttgctgat tattctgtcc tatataattc cgcatcattt 1080
tccactttta agtgttatgg agtgtctcct actaaattaa atgatctctg ctttactaat 1140
gtctatgcag attcatttgt aattagaggt gatgaagtca gacaaatcgc tccagggcaa 1200
actggaaaga ttgctgatta taattataaa ttaccagatg attttacagg ctgcgttata 1260
gcttggaatt ctaacaatct tgattctaag gttggtggta attataatta cctgtataga 1320
ttgtttagga agtctaatct caaacctttt gagagagata tttcaactga aatctatcag 1380
gccggtagca caccttgtaa tggtgttgaa ggttttaatt gttactttcc tttacaatca 1440
tatggtttcc aacccactaa tggtgttggt taccaaccat acagagtagt agtactttct 1500
tttgaacttc tacatgcacc agcaactgtt tgtggaccta aaaagtctac taatttggtt 1560
aaaaacaaat gtgtcaattt caacttcaat ggtttaacag gcacaggtgt tcttactgag 1620
tctaacaaaa agtttctgcc tttccaacaa tttggcagag acattgctga cactactgat 1680
gctgtccgtg atccacagac acttgagatt cttgacatta caccatgttc ttttggtggt 1740
gtcagtgtta taacaccagg aacaaatact tctaaccagg ttgctgttct ttatcaggat 1800
gttaactgca cagaagtccc tgttgctatt catgcagatc aacttactcc tacttggcgt 1860
gtttattcta caggttctaa tgtttttcaa acacgtgcag gctgtttaat aggggctgaa 1920
catgtcaaca actcatatga gtgtgacata cccattggtg caggtatatg cgctagttat 1980
cagactcaga ctaattctcc tgcaggcgca ggaagtgtag ctagtcaatc catcattgcc 2040
tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100
cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160
tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220
caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280
gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340
aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400
aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460
aaacaatatg gtgattgcct tggtgatatt gctgctagag acctcatttg tgcacaaaag 2520
tttaacggcc ttactgtttt gccacctttg ctcacagatg aaatgattgc tcaatacact 2580
tctgcactgt tagcgggtac aatcacttct ggttggacct ttggtgcagg tgctgcatta 2640
caaataccat ttgctatgca aatggcttat aggtttaatg gtattggagt tacacagaat 2700
gttctctatg agaaccaaaa attgattgcc aaccaattta atagtgctat tggcaaaatt 2760
caagactcac tttcttccac agcaagtgca cttggaaaac ttcaagatgt ggtcaaccaa 2820
aatgcacaag ctttaaacac gcttgttaaa caacttagct ccaattttgg tgcaatttca 2880
agtgttttaa atgatatcct ttcacgtctt gacccaccgg aggctgaagt gcaaattgat 2940
aggttgatca caggcagact tcaaagtttg cagacatatg tgactcaaca attaattaga 3000
gctgcagaaa tcagagcttc tgctaatctt gctgctacta aaatgtcaga gtgtgtactt 3060
ggacaatcaa aaagagttga tttttgtgga aagggctatc atcttatgtc cttccctcag 3120
tcagcacctc atggtgtagt cttcttgcat gtgacttatg tccctgcaca agaaaagaac 3180
ttcacaactg ctcctgccat ttgtcatgat ggaaaagcac actttcctcg tgaaggtgtc 3240
tttgtttcaa atggcacaca ctggtttgta acacaaagga atttttatga accacaaatc 3300
attactacag acaacacatt tgtgtctggt aactgtgatg ttgtaatagg aattgtcaac 3360
aacacagttt atgatccttt gcaacctgaa ttagactcat tcaaggagga gttagataaa 3420
tattttaaga atcatacatc accagatgtt gatttaggtg acatctctgg cattaatgct 3480
tcagttgtaa acattcaaaa agaaattgac cgcctcaatg aggttgccaa gaatttaaat 3540
gaatctctca tcgatctcca agaacttgga aagtatgagc agtatataaa atggccattg 3600
gtccctcgtg gaagcggttc ccccggttcc ggttacatcc ccgaggctcc ccgtgacggt 3660
caggcttacg tgcgtaagga cggtgagtgg gtgctgctgt ccaccttcct gggccatcat 3720
caccatcacc accaccacca ccattaa 3747
<210> 10
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<223> CRMA
<400> 10
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg
180 185 190
<210> 11
<211> 389
<212> PRT
<213> Artificial Sequence
<220>
<223> CRM389
<400> 11
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe
385
<210> 12
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> CRM197
<400> 12
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
385 390 395 400
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His
405 410 415
Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val
420 425 430
Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr
435 440 445
His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile
450 455 460
Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly
465 470 475 480
Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser
485 490 495
Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu
500 505 510
Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser
515 520 525
Leu Phe Phe Glu Ile Lys Ser
530 535
<210> 13
<211> 1453
<212> PRT
<213> Artificial Sequence
<220>
<223> CRMA-S(N端融合)氨基酸序列
<400> 13
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Gly Gly
180 185 190
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Cys Val Asn
195 200 205
Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr
210 215 220
Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu His
225 230 235 240
Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe
245 250 255
His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn
260 265 270
Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys
275 280 285
Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys
290 295 300
Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys
305 310 315 320
Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr
325 330 335
His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser
340 345 350
Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met
355 360 365
Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val
370 375 380
Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro
385 390 395 400
Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro
405 410 415
Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu
420 425 430
Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly
435 440 445
Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg
450 455 460
Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val
465 470 475 480
Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser
485 490 495
Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln
500 505 510
Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro
515 520 525
Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp
530 535 540
Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr
545 550 555 560
Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr
565 570 575
Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val
580 585 590
Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys
595 600 605
Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val
610 615 620
Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr
625 630 635 640
Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu
645 650 655
Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn
660 665 670
Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe
675 680 685
Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu
690 695 700
Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys
705 710 715 720
Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly
725 730 735
Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro
740 745 750
Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg
755 760 765
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly
770 775 780
Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala
785 790 795 800
Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His
805 810 815
Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn
820 825 830
Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn
835 840 845
Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser
850 855 860
Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser
865 870 875 880
Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val
885 890 895
Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser
900 905 910
Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp
915 920 925
Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
930 935 940
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly
945 950 955 960
Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val
965 970 975
Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn
980 985 990
Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
995 1000 1005
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
1010 1015 1020
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
1025 1030 1035
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
1040 1045 1050
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
1055 1060 1065
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
1070 1075 1080
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
1085 1090 1095
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu
1100 1105 1110
Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser
1115 1120 1125
Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val
1130 1135 1140
Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
1145 1150 1155
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
1160 1165 1170
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile
1175 1180 1185
Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu
1190 1195 1200
Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1205 1210 1215
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
1220 1225 1230
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro
1235 1240 1245
His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1250 1255 1260
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
1265 1270 1275
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
1280 1285 1290
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1295 1300 1305
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
1310 1315 1320
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
1325 1330 1335
Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro
1340 1345 1350
Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val
1355 1360 1365
Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn
1370 1375 1380
Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1385 1390 1395
Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg Gly Ser Gly Ser Pro
1400 1405 1410
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1415 1420 1425
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly
1430 1435 1440
His His His His His His His His His His
1445 1450
<210> 14
<211> 1453
<212> PRT
<213> Artificial Sequence
<220>
<223> S-CRMA(C端融合)氨基酸序列
<400> 14
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg
1190 1195 1200
Gly Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
1220 1225 1230
Ser Thr Phe Leu Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1235 1240 1245
Gly Gly Gly Gly Ser Gly Ala Asp Asp Val Val Asp Ser Ser Lys
1250 1255 1260
Ser Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr Lys Pro
1265 1270 1275
Gly Tyr Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys Ser
1280 1285 1290
Gly Thr Gln Gly Asn Tyr Asp Asp Asp Trp Lys Glu Phe Tyr Ser
1295 1300 1305
Thr Asp Asn Lys Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu
1310 1315 1320
Asn Pro Leu Ser Gly Lys Ala Gly Gly Val Val Lys Val Thr Tyr
1325 1330 1335
Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val Asp Asn Ala Glu
1340 1345 1350
Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu Pro Leu Met
1355 1360 1365
Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly Asp Gly
1370 1375 1380
Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser Ser
1385 1390 1395
Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
1400 1405 1410
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln
1415 1420 1425
Asp Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg
1430 1435 1440
His His His His His His His His His His
1445 1450
<210> 15
<211> 1652
<212> PRT
<213> Artificial Sequence
<220>
<223> CRM389-S(N端融合)氨基酸序列
<400> 15
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
385 390 395 400
Gly Gly Gly Ser Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro
405 410 415
Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val
420 425 430
Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe
435 440 445
Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn
450 455 460
Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val
465 470 475 480
Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe
485 490 495
Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn
500 505 510
Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp
515 520 525
Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu
530 535 540
Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr
545 550 555 560
Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe
565 570 575
Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys
580 585 590
Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln
595 600 605
Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn
610 615 620
Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr
625 630 635 640
Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr
645 650 655
Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn
660 665 670
Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu
675 680 685
Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln
690 695 700
Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro
705 710 715 720
Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg
725 730 735
Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val
740 745 750
Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys
755 760 765
Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn
770 775 780
Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile
785 790 795 800
Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro
805 810 815
Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp
820 825 830
Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys
835 840 845
Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln
850 855 860
Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe
865 870 875 880
Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln
885 890 895
Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala
900 905 910
Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys
915 920 925
Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu
930 935 940
Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala
945 950 955 960
Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp
965 970 975
Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr
980 985 990
Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr
995 1000 1005
Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp
1010 1015 1020
Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly
1025 1030 1035
Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp
1040 1045 1050
Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr
1055 1060 1065
Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile
1070 1075 1080
Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser
1085 1090 1095
Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
1100 1105 1110
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys
1115 1120 1125
Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu
1130 1135 1140
Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
1145 1150 1155
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
1160 1165 1170
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
1175 1180 1185
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser
1190 1195 1200
Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
1205 1210 1215
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp
1220 1225 1230
Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
1235 1240 1245
Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr
1250 1255 1260
Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe
1265 1270 1275
Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
1280 1285 1290
Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
1295 1300 1305
Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys
1310 1315 1320
Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu
1325 1330 1335
Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val
1340 1345 1350
Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
1355 1360 1365
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile
1370 1375 1380
Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
1385 1390 1395
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1400 1405 1410
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1415 1420 1425
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1430 1435 1440
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1445 1450 1455
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1460 1465 1470
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1475 1480 1485
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1490 1495 1500
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1505 1510 1515
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1520 1525 1530
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1535 1540 1545
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1550 1555 1560
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1565 1570 1575
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1580 1585 1590
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg Gly
1595 1600 1605
Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp
1610 1615 1620
Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser
1625 1630 1635
Thr Phe Leu Gly His His His His His His His His His His
1640 1645 1650
<210> 16
<211> 1652
<212> PRT
<213> Artificial Sequence
<220>
<223> S-CRM389(C端融合)氨基酸序列
<400> 16
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg
1190 1195 1200
Gly Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
1220 1225 1230
Ser Thr Phe Leu Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1235 1240 1245
Gly Gly Gly Gly Ser Gly Ala Asp Asp Val Val Asp Ser Ser Lys
1250 1255 1260
Ser Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr Lys Pro
1265 1270 1275
Gly Tyr Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys Ser
1280 1285 1290
Gly Thr Gln Gly Asn Tyr Asp Asp Asp Trp Lys Glu Phe Tyr Ser
1295 1300 1305
Thr Asp Asn Lys Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu
1310 1315 1320
Asn Pro Leu Ser Gly Lys Ala Gly Gly Val Val Lys Val Thr Tyr
1325 1330 1335
Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val Asp Asn Ala Glu
1340 1345 1350
Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu Pro Leu Met
1355 1360 1365
Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly Asp Gly
1370 1375 1380
Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser Ser
1385 1390 1395
Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
1400 1405 1410
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln
1415 1420 1425
Asp Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg
1430 1435 1440
Val Arg Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp
1445 1450 1455
Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu
1460 1465 1470
Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn
1475 1480 1485
Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe
1490 1495 1500
His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr
1505 1510 1515
Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala
1520 1525 1530
Trp Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp
1535 1540 1545
Asn Leu Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile
1550 1555 1560
Gly Ser Val Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr
1565 1570 1575
Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val
1580 1585 1590
Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp Ile Gly Phe
1595 1600 1605
Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe Gln Val
1610 1615 1620
Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His Lys
1625 1630 1635
Thr Gln Pro Phe His His His His His His His His His His
1640 1645 1650
<210> 17
<211> 1798
<212> PRT
<213> Artificial Sequence
<220>
<223> CRM197-S(N端融合)氨基酸序列
<400> 17
Gly Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1 5 10 15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
20 25 30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
35 40 45
Asp Trp Lys Glu Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
50 55 60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65 70 75 80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
85 90 95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
100 105 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
115 120 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
130 135 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145 150 155 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
165 170 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg Val Arg
180 185 190
Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp Trp Asp Val
195 200 205
Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu Lys Glu His Gly
210 215 220
Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn Lys Thr Val Ser Glu
225 230 235 240
Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe His Gln Thr Ala Leu Glu
245 250 255
His Pro Glu Leu Ser Glu Leu Lys Thr Val Thr Gly Thr Asn Pro Val
260 265 270
Phe Ala Gly Ala Asn Tyr Ala Ala Trp Ala Val Asn Val Ala Gln Val
275 280 285
Ile Asp Ser Glu Thr Ala Asp Asn Leu Glu Lys Thr Thr Ala Ala Leu
290 295 300
Ser Ile Leu Pro Gly Ile Gly Ser Val Met Gly Ile Ala Asp Gly Ala
305 310 315 320
Val His His Asn Thr Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser
325 330 335
Ser Leu Met Val Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp
340 345 350
Ile Gly Phe Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe
355 360 365
Gln Val Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His
370 375 380
Lys Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
385 390 395 400
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly His
405 410 415
Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala Gly Val
420 425 430
Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys Ser Lys Thr
435 440 445
His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg Cys Arg Ala Ile
450 455 460
Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser Pro Val Tyr Val Gly
465 470 475 480
Asn Gly Val His Ala Asn Leu His Val Ala Phe His Arg Ser Ser Ser
485 490 495
Glu Lys Ile His Ser Asn Glu Ile Ser Ser Asp Ser Ile Gly Val Leu
500 505 510
Gly Tyr Gln Lys Thr Val Asp His Thr Lys Val Asn Ser Lys Leu Ser
515 520 525
Leu Phe Phe Glu Ile Lys Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
530 535 540
Ser Gly Gly Gly Gly Ser Cys Val Asn Leu Thr Thr Arg Thr Gln Leu
545 550 555 560
Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp
565 570 575
Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu
580 585 590
Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly
595 600 605
Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp
610 615 620
Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp
625 630 635 640
Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val
645 650 655
Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys
660 665 670
Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp
675 680 685
Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe
690 695 700
Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly
705 710 715 720
Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr
725 730 735
Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu
740 745 750
Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly
755 760 765
Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr
770 775 780
Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala
785 790 795 800
Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn
805 810 815
Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu
820 825 830
Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile
835 840 845
Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg
850 855 860
Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala
865 870 875 880
Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn
885 890 895
Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr
900 905 910
Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe
915 920 925
Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg
930 935 940
Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys
945 950 955 960
Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn
965 970 975
Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe
980 985 990
Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile
995 1000 1005
Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn
1010 1015 1020
Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
1025 1030 1035
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu
1040 1045 1050
Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn
1055 1060 1065
Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
1070 1075 1080
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe
1085 1090 1095
Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg
1100 1105 1110
Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
1115 1120 1125
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
1130 1135 1140
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
1145 1150 1155
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser
1160 1165 1170
Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
1175 1180 1185
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly
1190 1195 1200
Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg
1205 1210 1215
Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met
1220 1225 1230
Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile
1235 1240 1245
Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu
1250 1255 1260
Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile
1265 1270 1275
Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly
1280 1285 1290
Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val
1295 1300 1305
Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
1310 1315 1320
Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe
1325 1330 1335
Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe
1340 1345 1350
Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
1355 1360 1365
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
1370 1375 1380
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
1385 1390 1395
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu
1400 1405 1410
Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
1415 1420 1425
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn
1430 1435 1440
Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu
1445 1450 1455
Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser
1460 1465 1470
Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val
1475 1480 1485
Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser
1490 1495 1500
Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
1505 1510 1515
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile
1520 1525 1530
Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu
1535 1540 1545
Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr
1550 1555 1560
Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
1565 1570 1575
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro
1580 1585 1590
His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln Glu
1595 1600 1605
Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
1610 1615 1620
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp
1625 1630 1635
Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr
1640 1645 1650
Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
1655 1660 1665
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser
1670 1675 1680
Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro
1685 1690 1695
Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val
1700 1705 1710
Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn
1715 1720 1725
Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu
1730 1735 1740
Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg Gly Ser Gly Ser Pro
1745 1750 1755
Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr
1760 1765 1770
Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu Gly
1775 1780 1785
His His His His His His His His His His
1790 1795
<210> 18
<211> 1798
<212> PRT
<213> Artificial Sequence
<220>
<223> S-CRM197(C端融合)氨基酸序列
<400> 18
Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn
1 5 10 15
Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser
20 25 30
Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val
35 40 45
Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg
50 55 60
Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser
65 70 75 80
Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu
85 90 95
Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val
100 105 110
Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly
115 120 125
Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg
130 135 140
Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro
145 150 155 160
Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg
165 170 175
Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys
180 185 190
His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala
195 200 205
Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe
210 215 220
Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser
225 230 235 240
Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu
245 250 255
Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr
260 265 270
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
275 280 285
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe
290 295 300
Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn
305 310 315 320
Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val
325 330 335
Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser
340 345 350
Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val
355 360 365
Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp
370 375 380
Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln
385 390 395 400
Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr
405 410 415
Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly
420 425 430
Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys
435 440 445
Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr
450 455 460
Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser
465 470 475 480
Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys
530 535 540
Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp
545 550 555 560
Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn
580 585 590
Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr
610 615 620
Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser
660 665 670
Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu
675 680 685
Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe
690 695 700
Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr
705 710 715 720
Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser
725 730 735
Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala
740 745 750
Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe
755 760 765
Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly
770 775 780
Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys
785 790 795 800
Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp
805 810 815
Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala
820 825 830
Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro
835 840 845
Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu
850 855 860
Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu
865 870 875 880
Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly
885 890 895
Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln
900 905 910
Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala
915 920 925
Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala
930 935 940
Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser
945 950 955 960
Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu
965 970 975
Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr
980 985 990
Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala
995 1000 1005
Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser
1010 1015 1020
Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr
1040 1045 1050
Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys
1055 1060 1065
His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1070 1075 1080
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro
1085 1090 1095
Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp
1100 1105 1110
Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1115 1120 1125
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys
1130 1135 1140
Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile
1145 1150 1155
Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn
1160 1165 1170
Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
1175 1180 1185
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Leu Val Pro Arg
1190 1195 1200
Gly Ser Gly Ser Pro Gly Ser Gly Tyr Ile Pro Glu Ala Pro Arg
1205 1210 1215
Asp Gly Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu
1220 1225 1230
Ser Thr Phe Leu Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1235 1240 1245
Gly Gly Gly Gly Ser Gly Ala Asp Asp Val Val Asp Ser Ser Lys
1250 1255 1260
Ser Phe Val Met Glu Asn Phe Ser Ser Tyr His Gly Thr Lys Pro
1265 1270 1275
Gly Tyr Val Asp Ser Ile Gln Lys Gly Ile Gln Lys Pro Lys Ser
1280 1285 1290
Gly Thr Gln Gly Asn Tyr Asp Asp Asp Trp Lys Glu Phe Tyr Ser
1295 1300 1305
Thr Asp Asn Lys Tyr Asp Ala Ala Gly Tyr Ser Val Asp Asn Glu
1310 1315 1320
Asn Pro Leu Ser Gly Lys Ala Gly Gly Val Val Lys Val Thr Tyr
1325 1330 1335
Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val Asp Asn Ala Glu
1340 1345 1350
Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu Pro Leu Met
1355 1360 1365
Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly Asp Gly
1370 1375 1380
Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser Ser
1385 1390 1395
Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
1400 1405 1410
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln
1415 1420 1425
Asp Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Gly Asn Arg
1430 1435 1440
Val Arg Arg Ser Val Gly Ser Ser Leu Ser Cys Ile Asn Leu Asp
1445 1450 1455
Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile Glu Ser Leu
1460 1465 1470
Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser Pro Asn
1475 1480 1485
Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu Phe
1490 1495 1500
His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr
1505 1510 1515
Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala
1520 1525 1530
Trp Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp
1535 1540 1545
Asn Leu Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile
1550 1555 1560
Gly Ser Val Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr
1565 1570 1575
Glu Glu Ile Val Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val
1580 1585 1590
Ala Gln Ala Ile Pro Leu Val Gly Glu Leu Val Asp Ile Gly Phe
1595 1600 1605
Ala Ala Tyr Asn Phe Val Glu Ser Ile Ile Asn Leu Phe Gln Val
1610 1615 1620
Val His Asn Ser Tyr Asn Arg Pro Ala Tyr Ser Pro Gly His Lys
1625 1630 1635
Thr Gln Pro Phe Leu His Asp Gly Tyr Ala Val Ser Trp Asn Thr
1640 1645 1650
Val Glu Asp Ser Ile Ile Arg Thr Gly Phe Gln Gly Glu Ser Gly
1655 1660 1665
His Asp Ile Lys Ile Thr Ala Glu Asn Thr Pro Leu Pro Ile Ala
1670 1675 1680
Gly Val Leu Leu Pro Thr Ile Pro Gly Lys Leu Asp Val Asn Lys
1685 1690 1695
Ser Lys Thr His Ile Ser Val Asn Gly Arg Lys Ile Arg Met Arg
1700 1705 1710
Cys Arg Ala Ile Asp Gly Asp Val Thr Phe Cys Arg Pro Lys Ser
1715 1720 1725
Pro Val Tyr Val Gly Asn Gly Val His Ala Asn Leu His Val Ala
1730 1735 1740
Phe His Arg Ser Ser Ser Glu Lys Ile His Ser Asn Glu Ile Ser
1745 1750 1755
Ser Asp Ser Ile Gly Val Leu Gly Tyr Gln Lys Thr Val Asp His
1760 1765 1770
Thr Lys Val Asn Ser Lys Leu Ser Leu Phe Phe Glu Ile Lys Ser
1775 1780 1785
His His His His His His His His His His
1790 1795

Claims (23)

1.融合蛋白,其包含严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白或其变体序列、以及三聚化结构域序列;
其中,所述S蛋白变体与野生型S蛋白(例如SEQ ID NO:1所示的S蛋白)相比具有一个或几个氨基酸的置换、缺失或添加(例如1个,2个,3个,4个,5个,6个,7个,8个,9个或10个氨基酸的置换、缺失或添加),或者与野生型S蛋白相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性,并且所述S蛋白变体具有野生型S蛋白的免疫学活性(例如,在受试者中诱导针对SARS-CoV-2的特异性免疫应答如中和抗体应答的活性)。
2.权利要求1所述的融合蛋白,其中,所述三聚化结构域序列包含如SEQ ID NO:3所示的序列。
3.权利要求1或2所述的融合蛋白,其中,所述S蛋白变体在其S1结构域和S2结构域之间不包含弗林蛋白酶识别位点;
优选地,与野生型S蛋白相比,所述S蛋白变体在相应于如下位置的氨基酸位置中的一处或多处(例如1处,2处或3处)包含氨基酸置换,所述如下位置参考野生型S蛋白所示的氨基酸位置:668、669、671;
优选地,所述S蛋白变体包含选自下列的1个或几个(例如1个,2个或3个)氨基酸置换:在相应于野生型S蛋白的位置668的位置上的氨基酸置换为A,在相应于野生型S蛋白的位置669的位置上的氨基酸置换为G,在相应于野生型S蛋白的位置671的位置上的氨基酸置换为G;
优选地,与野生型S蛋白相比,所述S蛋白变体在与野生型S蛋白的第668-671位相对应的位置上的氨基酸残基被置换为AGAG。
4.权利要求1-3任一项所述的融合蛋白,其中与野生型S蛋白相比,所述S蛋白变体在与野生型S蛋白的第972位和/或第973位相对应的位置上包含氨基酸置换;
优选地,所述S蛋白变体包含:在相应于野生型S蛋白的位置972的位置上的氨基酸置换为P,和/或在相应于野生型S蛋白的位置973的位置上的氨基酸置换为P。
5.权利要求1-4任一项所述的融合蛋白,其中,所述S蛋白包含如SEQ ID NO:1所示的氨基酸序列;
优选地,所述S蛋白变体包含如SEQ ID NO:2所示的氨基酸序列。
6.权利要求1-5任一项所述的融合蛋白,其中,所述融合蛋白从N端至C端包含所述S蛋白或其变体的序列和三聚化结构域序列。
7.权利要求1-6任一项所述的融合蛋白,其中,所述融合蛋白在所述S蛋白或其变体序列和三聚化结构域序列之间进一步包含蛋白酶识别位点序列;
优选地,所述蛋白酶是凝血酶;
优选地,所述蛋白酶识别位点序列包含如SEQ ID NO:4或5所示的序列。
8.权利要求1-7任一项所述的融合蛋白,其中,所述融合蛋白包含选自下列的氨基酸序列:
(1)由SEQ ID NO:6所示序列的第1位至第1238位氨基酸残基构成的氨基酸序列;
(2)由SEQ ID NO:8所示序列的第1位至第1238位氨基酸残基构成的氨基酸序列。
9.权利要求1-8任一项所述的融合蛋白,其中,所述融合蛋白进一步包含载体蛋白序列;
优选地,所述载体蛋白序列位于所述S蛋白或其变体序列的N端,或者所述三聚化结构域序列的C端;
优选地,所述载体蛋白选自CRMA(例如SEQ ID NO:10所示的CRMA)、CRM389(例如SEQ IDNO:11所示的CRM389)或CRM197(例如SEQ ID NO:12所示的CRM197);
优选地,所述载体蛋白序列与其相邻结构域之间任选地通过肽接头连接;
优选地,所述肽接头是(GmS)n,其中m选自1-4的整数(例如1,2,3,4),n选自1-3的整数(例如1,2,3);
优选地,所述融合蛋白包含选自下列的氨基酸序列:
(1)由SEQ ID NO:13所示序列的第1位至第1443位氨基酸残基构成的氨基酸序列;
(2)由SEQ ID NO:14所示序列的第1位至第1443位氨基酸残基构成的氨基酸序列;
(3)由SEQ ID NO:15所示序列的第1位至第1642位氨基酸残基构成的氨基酸序列;
(4)由SEQ ID NO:16所示序列的第1位至第1642位氨基酸残基构成的氨基酸序列;
(5)由SEQ ID NO:17所示序列的第1位至第1788位氨基酸残基构成的氨基酸序列;
(6)由SEQ ID NO:18所示序列的第1位至第1788位氨基酸残基构成的氨基酸序列。
10.权利要求1-9任一项所述的融合蛋白,其中,所述融合蛋白包含标签序列(例如所述标签序列是纯化标签,例如多组氨酸标签、myc标签或HA标签);
优选地,所述标签序列位于所述融合蛋白的N端或C端;
优选地,所述标签序列与其相邻结构域之间任选地通过肽接头或酶切位点序列连接;
优选地,所述融合蛋白包含SEQ ID NOs:13-18任一项所示的序列。
11.多聚体,其包含权利要求1-10任一项所述的融合蛋白;
优选地,所述多聚体是同源多聚体;
优选地,所述多聚体是三聚体;
优选地,所述多聚体是由相同的所述融合蛋白所形成的三聚体。
12.分离的核酸分子,其包含编码权利要求1-10任一项所述的融合蛋白的核苷酸序列。
13.载体,其包含权利要求12所述的分离的核酸分子;
优选地,所述载体是杆状病毒表达载体。
14.宿主细胞,其包含权利要求12所述的分离的核酸分子或权利要求13所述的载体;
优选地,所述宿主细胞是昆虫细胞。
15.制备权利要求1-10任一项所述的融合蛋白或权利要求11所述的多聚体的方法,其包括,培养权利要求14的宿主细胞,和从细胞培养物中回收所述融合蛋白;
优选地,所述融合蛋白以三聚体形式存在;
优选地,所述宿主细胞是昆虫细胞。
16.制备严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白三聚体的方法,其包括:在杆状病毒昆虫表达系统中表达权利要求1-10任一项所述的融合蛋白,从而产生所述S蛋白三聚体;
优选地,所述杆状病毒昆虫表达系统中的昆虫宿主细胞选自sf9或sf21;
优选地,所述杆状病毒昆虫表达系统中的杆状病毒表达载体选自pAcgp67(A-C),pFastbac,pEx/bac;
优选地,所述方法包括以下步骤:
(1)将包含编码权利要求1-10任一项所述的融合蛋白的核苷酸序列的杆状病毒表达载体引入昆虫宿主细胞中;
(2)培养所述昆虫宿主细胞;
(3)从细胞培养物中回收S蛋白三聚体。
17.权利要求16所述的方法,其中,所述方法还包括:对所产生的S蛋白三聚体进行纯化;优选地,通过亲和层析和/或分子筛对S蛋白三聚体进行纯化。
18.严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的S蛋白三聚体,其具备早期融合前构象,所述早期融合前构象包含以下特征中的1项、2项或3项:
(1)NTD结构域质量中心与S2结构域质量中心的连线,和RBD结构域质量中心与S2结构域质量中心的连线的夹角为约81.4°;
(2)NTD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure FDA0002973147970000051
(3)RBD结构域质量中心与S2结构域质量中心的垂直距离为约
Figure FDA0002973147970000052
优选地,所述S蛋白三聚体是由权利要求1-10任一项所述的融合蛋白所形成的三聚体;优选地,所述三聚体是由相同的所述融合蛋白形成的同源三聚体;
优选地,所述S蛋白三聚体通过权利要求16或17所述的方法制备。
19.药物组合物,其包含权利要求1-10任一项所述的融合蛋白、权利要求11所述的多聚体、权利要求12所述的分离的核酸分子、权利要求13所述的载体、权利要求14所述的宿主细胞、或权利要求18所述的S蛋白三聚体,以及药学上可接受的载体和/或赋形剂;
优选地,所述药物组合物是免疫原性组合物或疫苗;优选地,所述药学上可接受的载体和/或赋形剂是佐剂。
20.权利要求1-10任一项所述的融合蛋白、权利要求11所述的多聚体、权利要求12所述的分离的核酸分子、权利要求13所述的载体、权利要求14所述的宿主细胞、权利要求18所述的S蛋白三聚体、或权利要求19所述的药物组合物,在制备用于在受试者中诱导针对SARS-CoV-2的特异性免疫应答和/或用于在受试者中预防和/或治疗SARS-CoV-2感染和/或用于在受试者中预防和/或治疗由SARS-CoV-2感染所致的疾病COVID-19的药剂中的应用;
优选地,所述药剂为疫苗;
优选地,所述受试者是人。
21.用于在受试者中诱导针对SARS-CoV-2的特异性免疫应答或用于在受试者中预防和/或治疗SARS-CoV-2感染的方法,其包括向有此需要的受试者施用免疫学有效量的权利要求11所述的多聚体、权利要求18所述的S蛋白三聚体或权利要求19所述的药物组合物。
22.试剂盒,其包含权利要求1-10任一项所述的融合蛋白、权利要求11所述的多聚体、权利要求12所述的分离的核酸分子、权利要求13所述的载体、权利要求14所述的宿主细胞、或权利要求18所述的S蛋白三聚体;
优选地,所述试剂盒还包含带有可检测的标记的二级抗体;
优选地,所述可检测的标记选自酶(例如辣根过氧化物酶或碱性磷酸酶)、化学发光试剂(例如吖啶酯类化合物)、荧光染料或生物素;
优选地,所述二级抗体对待测抗体所来自的物种(例如人)的抗体是特异的;
优选地,所述二级抗体是抗-免疫球蛋白抗体;
优选地,所述抗-免疫球蛋白抗体选自抗IgG抗体、抗IgM抗体或抗IgA抗体;
优选地,所述融合蛋白、多聚体、或S蛋白三聚体连接于固相载体表面。
23.权利要求1-10任一项所述的融合蛋白、权利要求11所述的多聚体、权利要求12所述的分离的核酸分子、权利要求13所述的载体、权利要求14所述的宿主细胞、或权利要求18所述的S蛋白三聚体,在制备用于测定来自受试者的样品中的对SARS-CoV-2特异性的抗体的存在或其水平和/或用于确定受试者是否患有SARS-CoV-2感染的试剂盒中的用途;
优选地,所述样品是血液样品,例如全血、血浆或血清;
优选地,所述受试者是人。
CN202110268273.4A 2020-03-12 2021-03-12 具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用 Active CN113388041B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020101711468 2020-03-12
CN202010171146 2020-03-12

Publications (2)

Publication Number Publication Date
CN113388041A true CN113388041A (zh) 2021-09-14
CN113388041B CN113388041B (zh) 2024-02-06

Family

ID=77617502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110268273.4A Active CN113388041B (zh) 2020-03-12 2021-03-12 具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用

Country Status (1)

Country Link
CN (1) CN113388041B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113150085A (zh) * 2021-04-27 2021-07-23 成都威斯克生物医药有限公司 抗SARS-CoV-2感染的组合物
CN115073565A (zh) * 2022-06-13 2022-09-20 华素生物科技(北京)有限公司 重组新型冠状病毒s蛋白三聚体及其制备方法与应用
CN115819523A (zh) * 2022-10-05 2023-03-21 复旦大学 靶向新冠病毒s蛋白受体结合域的三价蛋白的优化设计方法
WO2023087555A1 (zh) * 2021-11-16 2023-05-25 浙江普康生物技术股份有限公司 一种具有广谱中和活性的新型冠状病毒重组蛋白及其制备方法
CN116162173A (zh) * 2022-10-28 2023-05-26 安徽农业大学 一种GnRH6-CRM197重组蛋白去势疫苗及制备方法
WO2023160654A1 (zh) * 2022-02-25 2023-08-31 神州细胞工程有限公司 一种可诱导广谱中和活性重组多组分新冠病毒三聚体蛋白疫苗的制备及应用
WO2023165435A1 (zh) * 2022-03-01 2023-09-07 上海泽润生物科技有限公司 重组刺突蛋白及其制备方法和用途
WO2023179514A1 (zh) * 2022-03-24 2023-09-28 四川三叶草生物制药有限公司 冠状病毒疫苗组合物、方法及其使用
WO2023179513A1 (zh) * 2022-03-24 2023-09-28 四川三叶草生物制药有限公司 冠状病毒疫苗组合物、方法及其使用
WO2024032468A1 (zh) * 2022-08-08 2024-02-15 神州细胞工程有限公司 一种可诱导广谱中和活性重组五组分新冠病毒三聚体蛋白疫苗的制备及应用
WO2024055429A1 (zh) * 2022-09-16 2024-03-21 广东珩达生物医药科技有限公司 新型冠状病毒抗原多肽及其重组腺相关病毒和制备疫苗的应用
CN116162173B (zh) * 2022-10-28 2024-06-04 安徽农业大学 一种GnRH6-CRM197重组蛋白去势疫苗及制备方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000041678A (ja) * 1998-07-28 2000-02-15 Denki Kagaku Kogyo Kk 可溶性融合蛋白質とそれをコードする遺伝子、並びにその融合蛋白質の製造方法、及びその利用
CN1603346A (zh) * 2003-09-29 2005-04-06 厦门大学 蛋白质,含有其的产品及其在诊断、治疗和/或预防sars相关疾病中的用途
RU2007103343A (ru) * 2004-06-30 2008-08-10 АйДи БАЙОМЕДИКАЛ КОРПОРЕЙШН ОФ КВЕБЕК (CA) Вакцинная композиция и способы лечения коронавирусной инфекции
CN1749277A (zh) * 2004-09-14 2006-03-22 北京迪威华宇生物技术有限公司 热休克蛋白65-人sars冠状病毒表位抗原重组融合蛋白(hsp65-sars/3cl161-264)
EP2072527A1 (en) * 2007-12-21 2009-06-24 Altonabiotec AG Fusion polypeptides comprising a SHBG dimerization component and uses thereof
WO2018074884A1 (ko) * 2016-10-20 2018-04-26 연세대학교 원주산학협력단 재조합 단백질 및 그의 용도

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113150085A (zh) * 2021-04-27 2021-07-23 成都威斯克生物医药有限公司 抗SARS-CoV-2感染的组合物
WO2023087555A1 (zh) * 2021-11-16 2023-05-25 浙江普康生物技术股份有限公司 一种具有广谱中和活性的新型冠状病毒重组蛋白及其制备方法
WO2023160654A1 (zh) * 2022-02-25 2023-08-31 神州细胞工程有限公司 一种可诱导广谱中和活性重组多组分新冠病毒三聚体蛋白疫苗的制备及应用
WO2023165435A1 (zh) * 2022-03-01 2023-09-07 上海泽润生物科技有限公司 重组刺突蛋白及其制备方法和用途
WO2023179513A1 (zh) * 2022-03-24 2023-09-28 四川三叶草生物制药有限公司 冠状病毒疫苗组合物、方法及其使用
WO2023179514A1 (zh) * 2022-03-24 2023-09-28 四川三叶草生物制药有限公司 冠状病毒疫苗组合物、方法及其使用
CN115073565B (zh) * 2022-06-13 2023-02-21 华素生物科技(北京)有限公司 重组新型冠状病毒s蛋白三聚体及其制备方法与应用
CN115073565A (zh) * 2022-06-13 2022-09-20 华素生物科技(北京)有限公司 重组新型冠状病毒s蛋白三聚体及其制备方法与应用
WO2024032468A1 (zh) * 2022-08-08 2024-02-15 神州细胞工程有限公司 一种可诱导广谱中和活性重组五组分新冠病毒三聚体蛋白疫苗的制备及应用
WO2024055429A1 (zh) * 2022-09-16 2024-03-21 广东珩达生物医药科技有限公司 新型冠状病毒抗原多肽及其重组腺相关病毒和制备疫苗的应用
CN115819523A (zh) * 2022-10-05 2023-03-21 复旦大学 靶向新冠病毒s蛋白受体结合域的三价蛋白的优化设计方法
CN115819523B (zh) * 2022-10-05 2023-12-05 复旦大学 靶向新冠病毒s蛋白受体结合域的三价蛋白的优化设计方法
CN116162173A (zh) * 2022-10-28 2023-05-26 安徽农业大学 一种GnRH6-CRM197重组蛋白去势疫苗及制备方法
CN116162173B (zh) * 2022-10-28 2024-06-04 安徽农业大学 一种GnRH6-CRM197重组蛋白去势疫苗及制备方法

Also Published As

Publication number Publication date
CN113388041B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
CN113388041B (zh) 具有融合前早期构象的SARS-CoV-2 S三聚体蛋白及其应用
CN111991556B (zh) SARS-CoV-2 RBD共轭纳米颗粒疫苗
CN113861278B (zh) 一种产生广谱交叉中和活性的重组新型冠状病毒rbd三聚体蛋白疫苗、其制备方法和应用
CN112707968B (zh) 一种用于检测新冠病毒中和抗体的重组的受体结合蛋白、重组的受体蛋白
CN111671890B (zh) 一种新型冠状病毒疫苗及其应用
KR101675185B1 (ko) 디자이너(designer) 펩티드-기반 pcv2 백신
US20210283240A1 (en) Recombinant metapneumovirus f proteins and their use
EP3024483B1 (en) Conformationally stabilized rsv pre-fusion f proteins
Petrovan et al. Development and characterization of monoclonal antibodies against p30 protein of African swine fever virus
CN105669838B (zh) 来自水痘-带状疱疹病毒gE蛋白的中和表位及针对其的抗体
CN112724209B (zh) 可形成纳米颗粒的冠状病毒重组蛋白及其载体和应用
WO2022184027A1 (zh) 一种新型冠状病毒多价抗原、其制备方法和应用
SK7602001A3 (en) Hbv core antigen particles with multiple immunogenic components attached via peptide ligands
JP2020532953A (ja) コンフォメーションが安定化されたrsv融合前fタンパク質
CN105669859B (zh) 人乳头瘤病毒18型单克隆抗体及其应用
CN114437185B (zh) 冠状病毒三聚体亚单位疫苗及其应用
EA022788B1 (ru) Новые терапевтические и диагностические средства
JP5187883B2 (ja) 抗原ペプチドおよびその利用
CN113717283A (zh) 一种抗乙型肝炎病毒e抗原的单克隆抗体及其应用
CN114276422A (zh) 新型冠状病毒s蛋白多肽抗原及其应用
CN113292659B (zh) 重组蛋白和猪流行性腹泻疫苗组合物
US10040829B2 (en) Methods for producing peptides including HERV-W envelope motifs and for producing antibodies specific for the peptides
CN117320745A (zh) Sars-cov-2亚单位疫苗
JP4945730B2 (ja) 粘膜指向性ヒトパピローマウイルス群の感染予防ワクチン抗原
EP4046653A1 (en) Immunogenic polypeptides and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant