CN113234170A - 新型冠状病毒突变株s蛋白及其亚单位疫苗 - Google Patents

新型冠状病毒突变株s蛋白及其亚单位疫苗 Download PDF

Info

Publication number
CN113234170A
CN113234170A CN202110395097.0A CN202110395097A CN113234170A CN 113234170 A CN113234170 A CN 113234170A CN 202110395097 A CN202110395097 A CN 202110395097A CN 113234170 A CN113234170 A CN 113234170A
Authority
CN
China
Prior art keywords
protein
leu
val
thr
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110395097.0A
Other languages
English (en)
Inventor
徐可
蓝柯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202110395097.0A priority Critical patent/CN113234170A/zh
Publication of CN113234170A publication Critical patent/CN113234170A/zh
Priority to CN202111181856.XA priority patent/CN113929786B/zh
Priority to PCT/CN2022/086181 priority patent/WO2022218272A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Virology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Reproductive Health (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供了一种新型冠状病毒突变株S蛋白及其亚单位疫苗,所述新型冠状病毒突变株S蛋白的S1/S2两个亚基之间的furin裂解位点682‑RRAR‑685替换为柔性的蛋白linker;所述linker为(GGCAGCGCCAGC)或者(GGCGGCGGCAGC)n或(GGCGGCGGCGGCAGC)n或者(GGC)n;或者linker为GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数;所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQ ID NO:2所示或者如SEQID NO:4所示。该S蛋白具有作为应对SARS‑CoV‑2突变株的疫苗抗原的巨大潜力。

Description

新型冠状病毒突变株S蛋白及其亚单位疫苗
技术领域
本发明属于生物技术领域,涉及一种新型冠状病毒突变株S蛋白及其亚单位疫苗。
背景技术
目前正在全球大流行的SARS-CoV-2是具有包膜结构的单股正链RNA病毒,极易发生突变。近期出现的SARS-CoV-2突变株由于突变位点在刺突蛋白(S蛋白)上,尤其是位于关键受体结合域(RBD),可能会加强其与受体ACE2的结合能力,增加病毒的传播力或致病性;同时突变可能会改变抗原的关键表位,使得已筛选的中和抗体亲和力下降,发生免疫逃逸,降低疫苗和中和抗体的保护效果。目前,根据GISAID数据库公布的新冠病毒谱系信息,全球共出现700余种突变,其中传播能力较强,分布广泛的突变株共有6种,即:英国B.1.1.7突变株、南非B.1.351突变株、巴西P.1突变株、美国B.1.2突变株、意大利B.1突变株、尼日利亚B.1.525突变株。
英国B.1.1.7突变株,其S蛋白上的定义突变有9个。研究表明,接种Moderna mRNA疫苗,Novavax重组蛋白疫苗的血清对带有B.1.1.7的假病毒的中和能力与非突变相比无显著差异。Novavax重组蛋白疫苗的三期临床数据显示,对新冠病毒的保护效力为90%,而对B.1.1.7突变的保护效力为85%。综上,这些疫苗对B.1.1.7突变株的保护效力可能不变。
南非B.1.351突变株,其S蛋白上的定义突变有10个。研究表明,其E484K突变能够显著提高活病毒及假病毒抵抗单克隆中和抗体和疫苗血清能力。此外,Moderna的数据显示疫苗血清针对南非突变株的中和作用下降了7倍以上,辉瑞的数据同样显示其中和作用显著下降[4]。Novavax重组蛋白疫苗三期临床试验结果显示,对B.1.351的有效性低于50%。综上,南非突变株以及具有南非突变株相似特征的突变株的出现及流行对现有的抗疫策略提出了巨大挑战。
巴西P.1突变株,其S蛋白上的定义突变有11个,具有与英国,南非突变株相似的特征,包括E484K,N501Y突变,因此可以合理推测其可能存在免疫逃逸。其余广泛流行的突变株包括美国B.1.2突变株,意大利B.1突变株,尼日利亚B.1.525突变株等,开发具有广谱应对现有及未来可能出现的SARS-CoV-2突变株策略迫在眉睫。因此,面对已经出现和未来可能出现的突变株,我们需要开发新型,广谱的通用策略来应对。
基于流感病毒研究经验,我们采取共识序列策略,多种计算方法并行,结合突变株对疫苗和中和抗体的抵抗效果,得到一株具有广谱应对新冠病毒突变株的共识序列,并以此序列作为蓝本,开发针对突变株的S蛋白亚单位疫苗,是目前解决突变株逃逸现有SARS-CoV-2疫苗的最佳选择。
与SARS-CoV-2类似,流感病毒因其血凝素蛋白(HA)及神经氨酸酶(NA)的高突变率,使得现有流感疫苗需要每年更新。越来越多的证据表明,一种亚型流感病毒可能诱导针对其他亚型的交叉反应性免疫反应。因此,理想的情况下,一种共识序列通用疫苗可以预防多种甲型流感病毒亚型或某一亚型内的所有病毒株。前期实验数据表明,一种针对H1N1亚型设计的共识序列CH1所产生的DNA疫苗,能够引起机体对异源H1N1病毒的广泛反应性T细胞和B细胞反应。因此,将共识序列策略应用于防控新冠病毒突变株,具有极大可行性和应用。
因此,亟需开发一种新的有效的针对新型冠状病毒突变株的疫苗。
发明内容
为了解决所述技术问题,本发明提供了一种新型冠状病毒突变株S蛋白及其亚单位疫苗,S1/S2切割位点RRAR经突变以失去被弗林样蛋白酶切割的能力,以保留完整的S蛋白抗原性。
在本发明的第一方面,提供了一种新型冠状病毒突变株S蛋白,所述新型冠状病毒突变株S蛋白的S1/S2两个亚基之间的furin裂解位点682-RRAR-685替换为柔性的蛋白linker;所述linker为(GGCAGCGCCAGC)或者(GGCGGCGGCAGC)n或者(GGCGGCGGCGGCAGC)n或者(GGC)n,其中1≤n≤3,且n为整数;或者所述linker为GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数;
所述新型冠状病毒突变株包括含有共识序列S6突变株和含有共识序列S15突变株;
所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQ ID NO:2所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQ ID NO:4所示。
进一步地,所述新型冠状病毒突变株S蛋白还包括分别在如SEQ ID NO:2所示氨基酸序列和SEQ ID NO:4所示氨基酸序列的基础上进行如下修饰1-修饰3中的至少一种:
修饰1、将原始信号肽替换为tPA信号肽、CD5信号肽和IgG信号肽中的一种;
修饰2、将C端结构域删除SEQ ID NO:5所示跨膜结构域;
修饰3、所述新型冠状病毒突变株S蛋白跨膜区替换为SEQ ID NO:6所示的T4噬菌体fibritin三聚体基序或SEQ ID NO:7所示的GCN4多聚体形成基序。
进一步地,所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQ ID NO:1所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQ ID NO:3所示。
在本发明的第二方面,提供了一种核酸分子,所述核酸分子的核苷酸序列如SEQID NO:1所示或者SEQ ID NO:3所示。
在本发明的第三方面,提供了一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒突变株S蛋白。
进一步地,所述重组表达载体的表达区的核苷酸序列如SEQ ID NO:1所示或者SEQID NO:3所示。
在本发明的第四方面,提供了一种工程化细胞,所述工程化细胞包含所述的重组表达载体。
在本发明的第五方面,提供了一种新型冠状病毒突变株S蛋白的制备方法,所述方法包括:
获得所述的重组表达载体;
将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组S蛋白的细胞株;
将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒突变株S蛋白。
在本发明的第六方面,提供了一种新型冠状病毒突变株亚单位疫苗,所述新型冠状病毒突变株亚单位疫苗包含所述的重组S蛋白以及药学上接受的佐剂。
进一步,所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、MPL TM、IL-12、氢氧化铝联合CpG ODN复合佐剂、ISA51VG、ISA720VG、MF59、QS21、AS03佐剂中的至少一种。
本发明实施例中的一个或多个技术方案,至少具有如下技术效果或优点:
本发明提供的新型冠状病毒突变株S蛋白及其亚单位疫苗,本发明通过四种策略,我们得到了具有6个典型突变(69-HV-70缺失,Y144位缺失,E484K,N501Y,D614G,P681H)的S蛋白共识序列(S6)以及具有15个特征突变(69-HV-70缺失,Y144缺失,242-LAL-244缺失,并且含有A222V、K417N、L452R、E484K、N501Y、A570D、D614G、Q677H、P681H、T716I、S982A、D1118H)的S蛋白共识序列(S15)。此外,为了使携带上述突变的序列克隆到真核细胞表达载体后高效表达,我们使用了JAVA Codon Adapation软件对S表达基因的密码子进行了哺乳动物偏好的密码子优化。同时将原始株中S蛋白Furin切割位点由RRAR突变为GSAS或者GS组合、(GGGS)n或者(GGGGS)n或者(G)n(其中1≤n≤3,且n为整数),保持S蛋白的完整性。再次,我们将S蛋白共识序列(S6和S15)C端中的跨膜膜结构域突变为T4噬菌体次要纤维蛋白(Fibritin)的三聚体折叠结构域或GCN4多聚体形成基序,增强三聚体的形成。最后获得了SEQ.NO.1和SEQ.NO.3的序列的核酸分子,将其克隆到哺乳动物细胞表达载体后,转染哺乳动物细胞,可以表达氨基酸序列为SEQ.NO.2及SEQ.NO.4的重组S蛋白。该S蛋白具有目前SARS-CoV-2流行突变株的S蛋白重要的突变类型,因此该重组蛋白具有作为应对SARS-CoV-2突变株的疫苗抗原的巨大潜力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为截至2021-3-7日迅速传播的重要病原株的频率分析;
图2为NCBI数据库(截至2021年2月28日)S蛋白序列系统发育树;
图3为四种策略计算S蛋白特征突变所占比例;
图4为S蛋白序列功能区及策略四示意图;
图5为共识序列在S蛋白系统发育树中的位置;
图6为共识序列S6模式图,含有HV69-70缺失、Y144位缺失、E484K、N501Y、D614G、P681H,共6个突变位点;
图7为共识序列S15模式图,含有69-HV-70缺失、Y144缺失、242-LAL-244缺失、A222V、K417N、L452R、E484K、N501Y、A570D、D614G、Q677H、P681H、T716I、S982A、D1118H,共15个突变位点。
具体实施方式
下文将结合具体实施方式和实施例,具体阐述本发明,本发明的优点和各种效果将由此更加清楚地呈现。本领域技术人员应理解,这些具体实施方式和实施例是用于说明本发明,而非限制本发明。
在整个说明书中,除非另有特别说明,本文使用的术语应理解为如本领域中通常所使用的含义。因此,除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域技术人员的一般理解相同的含义。若存在矛盾,本说明书优先。
除非另有特别说明,本发明中用到的各种原材料、试剂、仪器和设备等,均可通过市场购买得到或者可通过现有方法制备得到。
本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:
本申请人针对这些突变株,我们采取了四种不同的策略,通过软件预测比较突变株的共识序列。我们得到了具有6个典型突变(69-HV-70缺失,Y144位缺失,E484K,N501Y,D614G,P681H)的S蛋白共识序列(S6)以及具有15个特征突变(69-HV-70缺失,Y144缺失,242-LAL-244缺失,并且含有A222V、K417N、L452R、E484K、N501Y、A570D、D614G、Q677H、P681H、T716I、S982A、D1118H)的S蛋白共识序列(S15)。
根据本发明实施例一种典型的实施方式,提供一种新型冠状病毒突变株S蛋白,所述新型冠状病毒突变株S蛋白的S1/S2两个亚基之间的furin裂解位点682-RRAR-685替换为柔性的蛋白linker;所述linker为(GGCAGCGCCAGC)或者(GGCGGCGGCAGC)n或者(GGCGGCGGCGGCAGC)n或者(GGC)n,其中1≤n≤3,且n为整数;或者所述linker为GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数;如果linker为(G)n,n可适当长些,1≤n≤10,且n为整数;
所述新型冠状病毒突变株包括含有共识序列S6突变株和含有共识序列S15突变株;
所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQ ID NO:2所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQ ID NO:4所示。
本申请的核心在于(1)获得含有共识序列S6和含有共识序列S15,一种共识序列通用疫苗可以预防多种新冠病毒突变株。(2)将S1/S2切割位点RRAR经突变以失去被弗林样蛋白酶切割的能力,以保留完整的S蛋白抗原性,本发明的免疫原S蛋白多肽具有稳定的融合前构象,将S1/S2两个亚基之间的Furin裂解位点682-RRAR-685替换为柔性的蛋白linker,如以G(Gly)甘氨酸和S(Ser)丝氨酸构成的GSAS、GS组合、(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数通过n来调整linker的长度和效果;或者所述linker为(GGCAGCGCCAGC)或者(GGCGGCGGCAGC)n或者(GGCGGCGGCGGCAGC)n或者(GGC)n,其中1≤n≤3,且n为整数;
在本发明实施例中,所述linker具有较好的保护剪切的效果,能更好地保持不被剪切的S蛋白形式。
其次,我们将S蛋白共识序列(S6和S15)C端中的跨膜膜结构域突变为T4噬菌体次要纤维蛋白(Fibritin)的三聚体折叠结构域或GCN4多聚体形成基序,增强三聚体的形成。
作为一种可选的实施方式,述新型冠状病毒突变株S蛋白还包括分别在如SEQ IDNO:2所示氨基酸序列和SEQ ID NO:4所示氨基酸序列的基础上进行如下修饰1-修饰3中的至少一种:
修饰1、将原始信号肽替换为tPA信号肽、CD5信号肽和IgG信号肽中的一种;该序列采用分泌性信号肽以保证S蛋白可以在哺乳动物细胞的培养上清中分泌表达,选用tPA信号肽以及S蛋白天然信号肽以及IgG信号肽以及CD5信号肽,最优的选择tPA信号肽。
修饰2、将C端结构域删除SEQ ID NO:5所示跨膜结构域。目的在于促进所述重组S蛋白的分泌表达;
修饰3、所述新型冠状病毒突变株S蛋白跨膜区替换为SEQ ID NO:6所示的T4噬菌体fibritin三聚体基序或SEQ ID NO:7所示的GCN4多聚体形成基序。
以上修饰1-修饰3中的一种或多种,其中任何一种排列组合的方案,均在本发明的保护范围之内。
再次,为了在真核细胞中高效表达,我们使用了JAVA Codon Adapation软件对S表达基因的密码子进行了哺乳动物偏好的密码子优化,在一些实施方案中,本申请选用了JAVA Codon Adapation软件对S表达基因的密码子进行了优化,获得了在哺乳动物细胞中表达效率比天然S基因更高的表达效率。所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQ ID NO:1所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQ ID NO:3所示。
根据本发明实施例另一种典型的实施方式,提供一种核酸分子,所述核酸分子的核苷酸序列如SEQ ID NO:1所示或者SEQ ID NO:3所示。含有所述核酸分子的生物材料也在本发明的保护范围之内,所述生物材料包括重组DNA、质粒载体、噬菌体载体、病毒载体和工程菌中的一种。
根据本发明实施例另一种典型的实施方式,提供一种重组表达载体,所述重组表达载体能够表达所述的新型冠状病毒突变株S蛋白。
根据本发明实施例另一种典型的实施方式,提供一种工程化细胞,所述工程化细胞包含所述的重组表达载体。所述工程化细胞可选用悬浮细胞,包括CHO系列和293、293FT等人用疫苗哺乳动物细胞株都在本发明的保护范围之内,具体地,本发明实施例使用CHO-K1细胞,通过将上述S基因转染该细胞并获得稳定表达细胞株,高效表达重组的S蛋白。
根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒突变株S蛋白的制备方法,所述方法包括:
获得所述的重组表达载体;
将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组S蛋白的细胞株;
将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒突变株S蛋白。
根据本发明实施例另一种典型的实施方式,提供一种新型冠状病毒突变株亚单位疫苗,所述新型冠状病毒突变株亚单位疫苗包含所述的重组S蛋白以及药学上接受的佐剂。
所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、MPL TM、IL-12、氢氧化铝联合CpG ODN复合佐剂、ISA51VG、ISA720VG、MF59、QS21、AS03佐剂中的至少一种。在其他实施方式中,所述佐剂也可选用其他形式的佐剂。
所述新型冠状病毒突变株亚单位疫苗可以制备成滴鼻剂、喷雾剂和肌肉注射剂。
下面将结合实施例及实验数据对本申请的效果进行详细说明。
实施例一、共识序列的预测
由于SARS-CoV-2的高突变性,尤其是突变位点在S蛋白上关键受体结合域(RBD),可能会加强其与受体ACE2的结合能力,增加病毒的传播力或致病性;同时突变可能会改变抗原的关键表位,使得已筛选的中和抗体亲和力下降,或降低疫苗和中和抗体的保护效果,目前SARS-CoV-2已经演化出多种类型的突变(图1)。针对这些突变株,我们采取了四种不同的策略,通过软件预测比较突变株的共识序列。
1、策略一:
我们从NCBI数据库(截至2021年2月28日)下载了2674个(已去重)新冠病毒S蛋白序列,并使用MEGA 7.0软件通过邻接法构建了这些S蛋白的系统发育树(图2)。可将S蛋白序列分为5个Clade,其中Clade 1包含2539条序列,含有巴西P.1突变株,美国B.1.2突变株等序列。Clade 2-3共包含56条序列,含有英国B.1.1.7,南非B.1.351,尼日利亚B.1.525突变株等,Clade 4-5包含80条序列,包含具有其余特征的突变株。因此,此数据库较完整且具有可信度。Clade 1中2539条序列亲缘关系较近且占数据库95%权重,我们采用计算1(Clade1共识序列)+136条序列(Clade 2-5)同时序列的方式,得到含69-70缺失,614G特征的共识序列。通过snapgene软件评估其余特征突变占总数据库的比例,记录于图3c1列。
2、策略二:
我们从NCBI数据库下载了1453个(2021年3月1日-3月15日,已去重)新冠病毒S蛋白序列,并使用snapgene软件通过Clustal Omega比对,计算特征突变占总数据库的比例(图3c2列)。此策略优势在于可评估近期新出现的重要突变病原株频率,一定程度上代表未来发展趋势。
3、策略三:
我们从GISAID数据库下载了11万余条(截至2021年3月12日,已去重)新冠病毒S蛋白序列,由于现有商业化,临床使用的中和抗体的抗原表位主要位于S蛋白的N端区域(NTD)以及RBD区域,因此我们使用Mega 7.0比对后删除534-1273号氨基酸后经去重得到3419条S蛋白(NTD+RBD)序列,并使用snapgene软件通过Clustal Omega比对,计算特征突变占总数据库的比例(图3c3列)。此策略优势在于集中发生在NTD及RBD的突变,一定程度上反应突变位点对疫苗及抗体的潜在影响力。
4、策略四:
我们从GISAID数据库下载了11万余条(截至2021年3月12日,已去重)新冠病毒S蛋白序列,将S蛋白根据功能区域分为4个部分,包括NTD,RBD,S1/S2 cleavage domain以及S2区域(图4)。分别使用snapgene软件通过Clustal Omega比对,计算特征突变占总数据库的比例(图3c4列)。经去重后,NTD区域包含4817条序列,RBD区域包含1312条序列,S1/S2cleavage domain区域包含1294条序列,S2区域包含5513条序列。此策略优势在于进一步集中突变的频率,稀释了其余位置存在的连锁突变或协同突变带来的影响,主要反应了该S蛋白位点发生突变的频率。
综上,通过四种策略,我们得到了各突变株特征突变所占比例(图3),其中多种方法均占较大比例的突变位点,包括HV69-70缺失,Y144位缺失,N501Y,D614G,P681H共5个特征,结合假病毒中和实验结果,E484K具有显著抵抗中和抗体,疫苗血清的能力,因此将其纳入共识序列范围。此外,如A222V,L452R,A570D,Q677H,T716I,S982A,D1118H突变,在两种策略中具有较高比例,同时结合假病毒中和实验结果,242-244缺失,K417N具有抵抗中和抗体的能力,因此将其纳入S15共识序列范围。根据抗原表位预测软件(包括IMED预测,IEDB预测,BepiPred-2.0服务器)结果,位于S2的突变位点并不位于高分抗原表位区,因此将其排除于S6,但保存于S15。综上,我们得到了具有6个特征突变(HV69-70缺失,Y144位缺失,E484K,N501Y,D614G,P681H)的S蛋白共识序列(S6),以及具有15个特征突变的S15。我们将此序列带入S蛋白系统发育树,发现其位于Clade 3中(图5),共识序列S6与SARS-CoV-2/human/USA/FL-CDC-STM-000008237/2021序列(GenBank:MW596211.1)具有99.76%的相似度,S15位于Clade 5中(图5),S15与SARS-CoV-2-Spike protein(PDB:7LWS_A)序列具有99.03%的相似度。共识序列与B.1.1.7谱系更为相似,结合了多株突变株的特征,因此具有广谱应对新冠病毒突变株的能力。
5、共识序列(S6&S15)的序列
通过四种策略,我们得到了具有6个典型突变(69-HV-70缺失,Y144位缺失,E484K,N501Y,D614G,P681H)的S蛋白共识序列(S6)以及具有15个特征突变(69-HV-70缺失,Y144缺失,242-LAL-244缺失,并且含有A222V、K417N、L452R、E484K、N501Y、A570D、D614G、Q677H、P681H、T716I、S982A、D1118H)的S蛋白共识序列(S15)。实施例二、重组S蛋白载体构建与表达优化
1、哺乳动物细胞上清表达的S蛋白基因的构建
本发明的S蛋白表达基因的构建示意图见图6和图7。
图6:共识序列S6模式图。该序列包含缺失69-70以及144位氨基酸,并且含有E484K、N501Y、D614G、P681H突变。同时为保持重组S蛋白完整性,将Furin剪切位点突变为GSAS、GS组合、或者(GGGS)n或者(GGGGS)n或者(G)n,随n数值变化,S1与S2连接的linker长度也变化。为保证重组S蛋白以天然三聚体形式分泌表达,将C端跨膜结构域替换为T4噬菌体Fibritin三聚体基序或GCN4多聚体形成基序。
图7:共识序列S15模式图。该序列包含缺失69-70,144以及242-244位氨基酸,并且含有A222V、K417N、L452R、E484K、N501Y、A570D、D614G、Q677H、P681H、T716I、S982A、D1118H突变。同时为保持重组S蛋白完整性,将Furin剪切位点突变为GSAS、GS组合、(GGGS)n或者(GGGGS)n或者(G)n,随n数值变化,S1与S2连接的linker长度也变化。为保证重组S蛋白以天然三聚体形式分泌表达,将C端跨膜结构域替换为T4噬菌体Fibritin三聚体基序。
此外,为了使携带上述突变的序列克隆到真核细胞表达载体后高效表达,我们使用了JAVA Codon Adapation软件对S表达基因的密码子进行了哺乳动物偏好的密码子优化。同时将原始株中S蛋白Furin切割位点由RRAR突变为GSAS或者GS组合、(GGGS)n或者(GGGGS)n或者(G)n(其中1≤n≤3,且n为整数),保持S蛋白的完整性。
再次,我们将S蛋白共识序列(S6和S15)C端中的跨膜膜结构域突变为T4噬菌体次要纤维蛋白(Fibritin)的三聚体折叠结构域或GCN4多聚体形成基序,增强三聚体的形成。
我们通过委托金斯瑞生物科技股份有限公司合成了SEQ.NO.1和SEQ.NO.3的序列,将其克隆到哺乳动物细胞表达载体如pC-GS(由promega公司的pC-neo载体改造,加入GS表达标签)后,转染哺乳动物细胞,可以表达氨基酸序列为SEQ.NO.2及SEQ.NO.4的重组S蛋白。该S蛋白具有目前SARS-CoV-2流行突变株的S蛋白重要的突变类型,因此该重组蛋白具有作为应对SARS-CoV-2突变株的疫苗抗原的巨大潜力。
所述S基因的核苷酸序列如SEQ ID NO:8所示或者SEQ ID NO:10所示或者SEQ IDNO:12所示。
2、分泌表达重组S蛋白的CHO-K1细胞株构建
将上述(1)中构建的S基因(所述S基因的核苷酸序列如SEQ ID NO:1所示或者SEQID NO:3所示)克隆至到哺乳动物细胞表达载体如pC-GS(由promega公司的pC-neo载体改造,加入GS表达标签)后,获得S基因表达质粒;
将上述S基因表达质粒通过电转仪(Biorad公司)电穿孔方式转染至CHO-K1细胞(武汉大学中国典型培养物保藏中心)中。电穿孔转染操作方案:取1×107个细胞到800LCHO-CD1无血清培养基(上海培源生物科技股份有限公司)中重悬,加入40μg质粒混匀,转移上述培养液至电转杯(Biorad公司)中,设置电转程序为电压300V,电容960μF,电阻∞,指数脉冲。电击完毕,取出培养液至CHO-CD1培养基,调整细胞浓度为5×105个/mL。电转后每天检测细胞密度以及存活率,当细胞浓度开始稳定增长至1×106个/mL时,证明细胞株完成建系。通过有限稀释法进行筛选,挑选克隆株分别扩大培养,进一步筛选优势细胞株。优势株扩大培养后,接种细胞进行细胞生长周期检测。
将上述S基因表达质粒转染哺乳动物细胞,可以表达氨基酸序列为SEQ.NO.2及SEQ.NO.4的重组S蛋白。该S蛋白具有目前SARS-CoV-2流行突变株的S蛋白重要的突变类型,因此该重组蛋白具有作为应对SARS-CoV-2突变株的疫苗抗原的巨大潜力。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
序列表
<110> 武汉大学
<120> 新型冠状病毒突变株S蛋白及其亚单位疫苗
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3688
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> modified_base
<222> (2035)..(2035)
<223> r=(ggcagcgccagc)或者(ggcggcggcagc)n或者(ggcggcggcggcagc)n或者(ggc)n,其中1≤n≤3,且n为整数
<400> 1
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60
cgcacccagc tgccccccgc ctacaccaac agcttcaccc gcggcgtgta ctaccccgac 120
aaggtgttcc gcagcagcgt gctgcacagc acccaggacc tgttcctgcc cttcttcagc 180
aacgtgacct ggttccacgc catcagcggc accaacggca ccaagcgctt cgacaacccc 240
gtgctgccct tcaacgacgg cgtgtacttc gccagcaccg agaagagcaa catcatccgc 300
ggctggatct tcggcaccac cctggacagc aagacccaga gcctgctgat cgtgaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag ttccagttct gcaacgaccc cttcctgggc 420
gtgtaccaca agaacaacaa gagctggatg gagagcgagt tccgcgtgta cagcagcgcc 480
aacaactgca ccttcgagta cgtgagccag cccttcctga tggacctgga gggcaagcag 540
ggcaacttca agaacctgcg cgagttcgtg ttcaagaaca tcgacggcta cttcaagatc 600
tacagcaagc acacccccat caacctggtg cgcgacctgc cccagggctt cagcgccctg 660
gagcccctgg tggacctgcc catcggcatc aacatcaccc gcttccagac cctgctggcc 720
ctgcaccgca gctacctgac ccccggcgac agcagcagcg gctggaccgc cggcgccgcc 780
gcctactacg tgggctacct gcagccccgc accttcctgc tgaagtacaa cgagaacggc 840
accatcaccg acgccgtgga ctgcgccctg gaccccctga gcgagaccaa gtgcaccctg 900
aagagcttca ccgtggagaa gggcatctac cagaccagca acttccgcgt gcagcccacc 960
gagagcatcg tgcgcttccc caacatcacc aacctgtgcc ccttcggcga ggtgttcaac 1020
gccacccgct tcgccagcgt gtacgcctgg aaccgcaagc gcatcagcaa ctgcgtggcc 1080
gactacagcg tgctgtacaa cagcgccagc ttcagcacct tcaagtgcta cggcgtgagc 1140
cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatccgc 1200
ggcgacgagg tgcgccagat cgcccccggc cagaccggca agatcgccga ctacaactac 1260
aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaacaa cctggacagc 1320
aaggtgggcg gcaactacaa ctacctgtac cgcctgttcc gcaagagcaa cctgaagccc 1380
ttcgagcgcg acatcagcac cgagatctac caggccggca gcaccccctg caacggcgtg 1440
aagggcttca actgctactt ccccctgcag agctacggct tccagcccac ctacggcgtg 1500
ggctaccagc cctaccgcgt ggtggtgctg agcttcgagc tgctgcacgc ccccgccacc 1560
gtgtgcggcc ccaagaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620
aacggcctga ccggcaccgg cgtgctgacc gagagcaaca agaagttcct gcccttccag 1680
cagttcggcc gcgacatcgc cgacaccacc gacgccgtgc gcgaccccca gaccctggag 1740
atcctggaca tcaccccctg cagcttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800
accagcaacc aggtggccgt gctgtaccag ggcgtgaact gcaccgaggt gcccgtggcc 1860
atccacgccg accagctgac ccccacctgg cgcgtgtaca gcaccggcag caacgtgttc 1920
cagacccgcg ccggctgcct gatcggcgcc gagcacgtga acaacagcta cgagtgcgac 1980
atccccatcg gcgccggcat ctgcgccagc taccagaccc agaccaacag ccacragcgt 2040
ggccagccag agcatcatcg cctacaccat gagcctgggc gccgagaaca gcgtggccta 2100
cagcaacaac agcatcgcca tccccaccaa cttcaccatc agcgtgacca ccgagatcct 2160
gcccgtgagc atgaccaaga ccagcgtgga ctgcaccatg tacatctgcg gcgacagcac 2220
cgagtgcagc aacctgctgc tgcagtacgg cagcttctgc acccagctga accgcgccct 2280
gaccggcatc gccgtggagc aggacaagaa cacccaggag gtgttcgccc aggtgaagca 2340
gatctacaag acccccccca tcaaggactt cggcggcttc aacttcagcc agatcctgcc 2400
cgaccccagc aagcccagca agcgcagctt catcgaggac ctgctgttca acaaggtgac 2460
cctggccgac gccggcttca tcaagcagta cggcgactgc ctgggcgaca tcgccgcccg 2520
cgacctgatc tgcgcccaga agttcaacgg cctgaccgtg ctgccccccc tgctgaccga 2580
cgagatgatc gcccagtaca ccagcgccct gctggccggc accatcacca gcggctggac 2640
cttcggcgcc ggcgccgccc tgcagatccc cttcgccatg cagatggcct accgcttcaa 2700
cggcatcggc gtgacccaga acgtgctgta cgagaaccag aagctgatcg ccaaccagtt 2760
caacagcgcc atcggcaaga tccaggacag cctgagcagc accgccagcg ccctgggcaa 2820
gctgcaggac gtggtgaacc agaacgccca ggccctgaac accctggtga agcagctgag 2880
cagcaacttc ggcgccatca gcagcgtgct gaacgacatc ctgagccgcc tggacaaggt 2940
ggaggccgag gtgcagatcg accgcctgat caccggccgc ctgcagagcc tgcagaccta 3000
cgtgacccag cagctgatcc gcgccgccga gatccgcgcc agcgccaacc tggccgccac 3060
caagatgagc gagtgcgtgc tgggccagag caagcgcgtg gacttctgcg gcaagggcta 3120
ccacctgatg agcttccccc agagcgcccc ccacggcgtg gtgttcctgc acgtgaccta 3180
cgtgcccgcc caggagaaga acttcaccac cgcccccgcc atctgccacg acggcaaggc 3240
ccacttcccc cgcgagggcg tgttcgtgag caacggcacc cactggttcg tgacccagcg 3300
caacttctac gagccccaga tcatcaccac cgacaacacc ttcgtgagcg gcaactgcga 3360
cgtggtgatc ggcatcgtga acaacaccgt gtacgacccc ctgcagcccg agctggacag 3420
cttcaaggag gagctggaca agtacttcaa gaaccacacc agccccgacg tggacctggg 3480
cgacatcagc ggcatcaacg ccagcgtggt gaacatccag aaggagatcg accgcctgaa 3540
cgaggtggcc aagaacctga acgagagcct gatcgacctg caggagctgg gcaagtacga 3600
gcagggctac atccccgagg ccccccgcga cggccaggcc tacgtgcgca aggacggcga 3660
gtgggtgctg ctgagcacct tcctgtga 3688
<210> 2
<211> 1229
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> UNSURE
<222> (679)..(679)
<223> Xaa=GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数
<220>
<221> UNSURE
<222> (679)..(679)
<223> The 'Xaa' at location 679 stands for Gln, Arg, Pro, or Leu.
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser
355 360 365
Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val
465 470 475 480
Lys Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro
485 490 495
Thr Tyr Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Asn Ser His Xaa Ser Val Ala Ser Gln Ser Ile Ile Ala
675 680 685
Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn
690 695 700
Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile
705 710 715 720
Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile
725 730 735
Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser
740 745 750
Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln
755 760 765
Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys
770 775 780
Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu
785 790 795 800
Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu
805 810 815
Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly
820 825 830
Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys
835 840 845
Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile
850 855 860
Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp
865 870 875 880
Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met
885 890 895
Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
900 905 910
Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile
915 920 925
Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp
930 935 940
Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu
945 950 955 960
Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
965 970 975
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr
980 985 990
Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
995 1000 1005
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser
1010 1015 1020
Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
1025 1030 1035 1040
Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe
1045 1050 1055
Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala
1060 1065 1070
Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1075 1080 1085
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
1090 1095 1100
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys
1105 1110 1115 1120
Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1125 1130 1135
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1140 1145 1150
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala
1155 1160 1165
Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
1170 1175 1180
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1185 1190 1195 1200
Glu Gln Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val
1205 1210 1215
Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
1220 1225
<210> 3
<211> 3679
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> modified_base
<222> (2026)..(2026)
<223> r=(ggcagcgccagc)或者(ggcggcggcagc)n或者(ggcggcggcggcagc)n或者(ggc)n,其中1≤n≤3,且n为整数
<400> 3
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc agtgcgtgaa cctgaccacc 60
cgcacccagc tgccccccgc ctacaccaac agcttcaccc gcggcgtgta ctaccccgac 120
aaggtgttcc gcagcagcgt gctgcacagc acccaggacc tgttcctgcc cttcttcagc 180
aacgtgacct ggttccacgc catcagcggc accaacggca ccaagcgctt cgacaacccc 240
gtgctgccct tcaacgacgg cgtgtacttc gccagcaccg agaagagcaa catcatccgc 300
ggctggatct tcggcaccac cctggacagc aagacccaga gcctgctgat cgtgaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag ttccagttct gcaacgaccc cttcctgggc 420
gtgtaccaca agaacaacaa gagctggatg gagagcgagt tccgcgtgta cagcagcgcc 480
aacaactgca ccttcgagta cgtgagccag cccttcctga tggacctgga gggcaagcag 540
ggcaacttca agaacctgcg cgagttcgtg ttcaagaaca tcgacggcta cttcaagatc 600
tacagcaagc acacccccat caacctggtg cgcgacctgc cccagggctt cagcgtgctg 660
gagcccctgg tggacctgcc catcggcatc aacatcaccc gcttccagac cctgcaccgc 720
agctacctga cccccggcga cagcagcagc ggctggaccg ccggcgccgc cgcctactac 780
gtgggctacc tgcagccccg caccttcctg ctgaagtaca acgagaacgg caccatcacc 840
gacgccgtgg actgcgccct ggaccccctg agcgagacca agtgcaccct gaagagcttc 900
accgtggaga agggcatcta ccagaccagc aacttccgcg tgcagcccac cgagagcatc 960
gtgcgcttcc ccaacatcac caacctgtgc cccttcggcg aggtgttcaa cgccacccgc 1020
ttcgccagcg tgtacgcctg gaaccgcaag cgcatcagca actgcgtggc cgactacagc 1080
gtgctgtaca acagcgccag cttcagcacc ttcaagtgct acggcgtgag ccccaccaag 1140
ctgaacgacc tgtgcttcac caacgtgtac gccgacagct tcgtgatccg cggcgacgag 1200
gtgcgccaga tcgcccccgg ccagaccggc aacatcgccg actacaacta caagctgccc 1260
gacgacttca ccggctgcgt gatcgcctgg aacagcaaca acctggacag caaggtgggc 1320
ggcaactaca actaccgcta ccgcctgttc cgcaagagca acctgaagcc cttcgagcgc 1380
gacatcagca ccgagatcta ccaggccggc agcaccccct gcaacggcgt gaagggcttc 1440
aactgctact tccccctgca gagctacggc ttccagccca cctacggcgt gggctaccag 1500
ccctaccgcg tggtggtgct gagcttcgag ctgctgcacg cccccgccac cgtgtgcggc 1560
cccaagaaga gcaccaacct ggtgaagaac aagtgcgtga acttcaactt caacggcctg 1620
accggcaccg gcgtgctgac cgagagcaac aagaagttcc tgcccttcca gcagttcggc 1680
cgcgacatcg acgacaccac cgacgccgtg cgcgaccccc agaccctgga gatcctggac 1740
atcaccccct gcagcttcgg cggcgtgagc gtgatcaccc ccggcaccaa caccagcaac 1800
caggtggccg tgctgtacca gggcgtgaac tgcaccgagg tgcccgtggc catccacgcc 1860
gaccagctga cccccacctg gcgcgtgtac agcaccggca gcaacgtgtt ccagacccgc 1920
gccggctgcc tgatcggcgc cgagcacgtg aacaacagct acgagtgcga catccccatc 1980
ggcgccggca tctgcgccag ctaccagacc cacaccaaca gccacragcg tggccagcca 2040
gagcatcatc gcctacacca tgagcctggg cgccgagaac agcgtggcct acagcaacaa 2100
cagcatcgcc atccccatca acttcaccat cagcgtgacc accgagatcc tgcccgtgag 2160
catgaccaag accagcgtgg actgcaccat gtacatctgc ggcgacagca ccgagtgcag 2220
caacctgctg ctgcagtacg gcagcttctg cacccagctg aaccgcgccc tgaccggcat 2280
cgccgtggag caggacaaga acacccagga ggtgttcgcc caggtgaagc agatctacaa 2340
gacccccccc atcaaggact tcggcggctt caacttcagc cagatcctgc ccgaccccag 2400
caagcccagc aagcgcagct tcatcgagga cctgctgttc aacaaggtga ccctggccga 2460
cgccggcttc atcaagcagt acggcgactg cctgggcgac atcgccgccc gcgacctgat 2520
ctgcgcccag aagttcaacg gcctgaccgt gctgcccccc ctgctgaccg acgagatgat 2580
cgcccagtac accagcgccc tgctggccgg caccatcacc agcggctgga ccttcggcgc 2640
cggcgccgcc ctgcagatcc ccttcgccat gcagatggcc taccgcttca acggcatcgg 2700
cgtgacccag aacgtgctgt acgagaacca gaagctgatc gccaaccagt tcaacagcgc 2760
catcggcaag atccaggaca gcctgagcag caccgccagc gccctgggca agctgcagga 2820
cgtggtgaac cagaacgccc aggccctgaa caccctggtg aagcagctga gcagcaactt 2880
cggcgccatc agcagcgtgc tgaacgacat cctggcccgc ctggacaagg tggaggccga 2940
ggtgcagatc gaccgcctga tcaccggccg cctgcagagc ctgcagacct acgtgaccca 3000
gcagctgatc cgcgccgccg agatccgcgc cagcgccaac ctggccgcca ccaagatgag 3060
cgagtgcgtg ctgggccaga gcaagcgcgt ggacttctgc ggcaagggct accacctgat 3120
gagcttcccc cagagcgccc cccacggcgt ggtgttcctg cacgtgacct acgtgcccgc 3180
ccaggagaag aacttcacca ccgcccccgc catctgccac gacggcaagg cccacttccc 3240
ccgcgagggc gtgttcgtga gcaacggcac ccactggttc gtgacccagc gcaacttcta 3300
cgagccccag atcatcacca cccacaacac cttcgtgagc ggcaactgcg acgtggtgat 3360
cggcatcgtg aacaacaccg tgtacgaccc cctgcagccc gagctggaca gcttcaagga 3420
ggagctggac aagtacttca agaaccacac cagccccgac gtggacctgg gcgacatcag 3480
cggcatcaac gccagcgtgg tgaacatcca gaaggagatc gaccgcctga acgaggtggc 3540
caagaacctg aacgagagcc tgatcgacct gcaggagctg ggcaagtacg agcagggcta 3600
catccccgag gccccccgcg acggccaggc ctacgtgcgc aaggacggcg agtgggtgct 3660
gctgagcacc ttcctgtga 3679
<210> 4
<211> 1226
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> UNSURE
<222> (676)..(676)
<223> Xaa=GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数
<220>
<221> UNSURE
<222> (676)..(676)
<223> The 'Xaa' at location 676 stands for Gln, Arg, Pro, or Leu.
<400> 4
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr His Lys
130 135 140
Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala
145 150 155 160
Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu
165 170 175
Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys
180 185 190
Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn
195 200 205
Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Val Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu His Arg
225 230 235 240
Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala
245 250 255
Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys
260 265 270
Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp
275 280 285
Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys
290 295 300
Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile
305 310 315 320
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
325 330 335
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
340 345 350
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
355 360 365
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
370 375 380
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
385 390 395 400
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala Asp Tyr Asn
405 410 415
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
420 425 430
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Arg Tyr Arg
435 440 445
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
450 455 460
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Lys Gly Phe
465 470 475 480
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Tyr Gly
485 490 495
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
500 505 510
His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val
515 520 525
Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly
530 535 540
Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly
545 550 555 560
Arg Asp Ile Asp Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu
565 570 575
Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile
580 585 590
Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Gly
595 600 605
Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr
610 615 620
Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg
625 630 635 640
Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys
645 650 655
Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr His Thr
660 665 670
Asn Ser His Xaa Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met
675 680 685
Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala
690 695 700
Ile Pro Ile Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val
705 710 715 720
Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp
725 730 735
Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr
740 745 750
Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn
755 760 765
Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro
770 775 780
Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro
785 790 795 800
Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys
805 810 815
Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu
820 825 830
Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly
835 840 845
Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr
850 855 860
Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly
865 870 875 880
Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg
885 890 895
Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys
900 905 910
Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser
915 920 925
Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn
930 935 940
Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn
945 950 955 960
Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ala Arg Leu Asp
965 970 975
Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu
980 985 990
Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu
995 1000 1005
Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val
1010 1015 1020
Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
1025 1030 1035 1040
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
1045 1050 1055
Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile
1060 1065 1070
Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
1075 1080 1085
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1090 1095 1100
Ile Ile Thr Thr His Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val
1105 1110 1115 1120
Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu
1125 1130 1135
Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1140 1145 1150
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val
1155 1160 1165
Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu
1170 1175 1180
Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Gly
1185 1190 1195 1200
Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys Asp
1205 1210 1215
Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
1220 1225
<210> 5
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Pro Trp Tyr Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val
1 5 10 15
Met Val Thr Ile Met Leu Cys Cys Met
20 25
<210> 6
<211> 27
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1 5 10 15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25
<210> 7
<211> 31
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Lys Gln Ile Glu Asp Lys Ile Glu Glu Ile Leu Ser Lys Ile Tyr
1 5 10 15
His Ile Glu Asn Glu Ile Ala Arg Ile Lys Lys Leu Ile Gly Glu
20 25 30

Claims (10)

1.一种新型冠状病毒突变株S蛋白,其特征在于,所述新型冠状病毒突变株S蛋白的S1/S2两个亚基之间的furin裂解位点682-RRAR-685替换为柔性的蛋白linker;所述linker为(GGCAGCGCCAGC)或者(GGCGGCGGCAGC)n或者(GGCGGCGGCGGCAGC)n或者(GGC)n,其中1≤n≤3,且n为整数;或者所述linker为GSAS或者(GGGS)n或者(GGGGS)n或者(G)n,其中1≤n≤3,且n为整数;
所述新型冠状病毒突变株包括含有共识序列S6突变株和含有共识序列S15突变株;
所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQID NO:2所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的氨基酸序列如SEQID NO:4所示。
2.根据权利要求1所述的一种新型冠状病毒突变株S蛋白,其特征在于,所述新型冠状病毒突变株S蛋白还包括分别在如SEQ ID NO:2所示氨基酸序列和SEQ ID NO:4所示氨基酸序列的基础上进行如下修饰1-修饰3中的至少一种:
修饰1、将原始信号肽替换为tPA信号肽、CD5信号肽和IgG信号肽中的一种;
修饰2、将C端结构域删除SEQ ID NO:5所示跨膜结构域;
修饰3、所述新型冠状病毒突变株S蛋白跨膜区替换为SEQ ID NO:6所示的T4噬菌体fibritin三聚体基序或SEQ ID NO:7所示的GCN4多聚体形成基序。
3.根据权利要求1所述的一种新型冠状病毒突变株S蛋白,其特征在于,所述含有共识序列S6突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQ ID NO:1所示;
所述含有共识序列S15突变株中,所述新型冠状病毒突变株S蛋白的核苷酸序列如SEQID NO:3所示。
4.一种核酸分子,其特征在于,所述核酸分子的核苷酸序列如SEQ ID NO:1所示或者SEQ ID NO:3所示。
5.一种重组表达载体,其特征在于,所述重组表达载体能够表达权利要求1-3任一所述的新型冠状病毒突变株S蛋白。
6.根据权利要求5所述的重组表达载体,其特征在于,所述重组表达载体的表达区的核苷酸序列如SEQ ID NO:1所示或者SEQ ID NO:3所示。
7.一种工程化细胞,其特征在于,所述工程化细胞包含权利要求5-6任一所述的重组表达载体。
8.一种新型冠状病毒突变株S蛋白的制备方法,其特征在于,所述方法包括:
获得权利要求5-6任一所述的重组表达载体;
将所述重组表达载体转染至细胞中,并通过细胞群的谷氨酰胺抗性筛选以及单克隆筛选,获得稳定表达重组S蛋白的细胞株;
将所述细胞株进行分泌表达和纯化,获得纯化的重组新型冠状病毒突变株S蛋白。
9.一种新型冠状病毒突变株亚单位疫苗,其特征在于,所述新型冠状病毒突变株亚单位疫苗包含权利要求1-4所述的重组S蛋白以及药学上接受的佐剂。
10.根据权利要求9所述的一种新型冠状病毒突变株亚单位疫苗,其特征在于,所述佐剂包括氢氧化铝、卵磷脂、弗氏佐剂、MPL TM、IL-12、氢氧化铝联合CpG ODN复合佐剂、ISA51VG、ISA720VG、MF59、QS21、AS03佐剂中的至少一种。
CN202110395097.0A 2021-04-13 2021-04-13 新型冠状病毒突变株s蛋白及其亚单位疫苗 Pending CN113234170A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110395097.0A CN113234170A (zh) 2021-04-13 2021-04-13 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN202111181856.XA CN113929786B (zh) 2021-04-13 2021-10-11 新型冠状病毒突变株s蛋白及其亚单位疫苗
PCT/CN2022/086181 WO2022218272A1 (zh) 2021-04-13 2022-04-11 新型冠状病毒突变株s蛋白及其亚单位疫苗

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110395097.0A CN113234170A (zh) 2021-04-13 2021-04-13 新型冠状病毒突变株s蛋白及其亚单位疫苗

Publications (1)

Publication Number Publication Date
CN113234170A true CN113234170A (zh) 2021-08-10

Family

ID=77128008

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110395097.0A Pending CN113234170A (zh) 2021-04-13 2021-04-13 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN202111181856.XA Active CN113929786B (zh) 2021-04-13 2021-10-11 新型冠状病毒突变株s蛋白及其亚单位疫苗

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202111181856.XA Active CN113929786B (zh) 2021-04-13 2021-10-11 新型冠状病毒突变株s蛋白及其亚单位疫苗

Country Status (2)

Country Link
CN (2) CN113234170A (zh)
WO (1) WO2022218272A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113527522A (zh) * 2021-09-13 2021-10-22 深圳市瑞吉生物科技有限公司 一种新冠病毒三聚体重组蛋白、DNA、mRNA及应用和mRNA疫苗
CN113563483A (zh) * 2021-08-09 2021-10-29 广州明药科技有限公司 噬菌体展示新冠病毒衣壳蛋白及应用
CN113603793A (zh) * 2021-08-31 2021-11-05 南华大学 一种新型冠状病毒的重组s蛋白、重组质粒、重组菌及制备外泌体药物或外泌体疫苗的应用
CN113773372A (zh) * 2021-08-15 2021-12-10 北京科兴中维生物技术有限公司 重组蛋白及其制备方法和应用
CN113832168A (zh) * 2021-08-15 2021-12-24 北京科兴中维生物技术有限公司 mRNA疫苗及其制备方法和应用
CN113929786A (zh) * 2021-04-13 2022-01-14 武汉大学 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN113957097A (zh) * 2021-09-27 2022-01-21 中国食品药品检定研究院 一种对新冠变异株广谱中和保护的免疫原及其制备方法和应用
CN114729373A (zh) * 2022-01-27 2022-07-08 深圳市瑞吉生物科技有限公司 一种新型冠状病毒mRNA疫苗及其制备方法与应用
US11389528B2 (en) 2020-06-10 2022-07-19 Sichuan Clover Biopharmaceuticals, Inc Coronavirus vaccine compositions, methods, and uses thereof
WO2023020623A1 (zh) * 2021-08-20 2023-02-23 百奥泰生物制药股份有限公司 用于预防或治疗冠状病毒感染的融合蛋白、Spike蛋白纳米颗粒及其应用
WO2023064708A1 (en) * 2021-10-12 2023-04-20 Wang Chang Yi Vaccine compositions against sars-cov-2 variants of concern to prevent infection and treat long-haul covid
WO2023142283A1 (zh) * 2022-01-27 2023-08-03 深圳市瑞吉生物科技有限公司 一种新型冠状病毒mRNA疫苗及其制备方法与应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114717205A (zh) * 2022-03-29 2022-07-08 中国人民解放军军事科学院军事医学研究院 一种冠状病毒RBDdm变异体及其应用
CN114807179B (zh) * 2022-06-01 2022-10-21 广州达博生物制品有限公司 一种新型冠状病毒肺炎疫苗的构建与应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111217917B (zh) * 2020-02-26 2020-10-23 康希诺生物股份公司 一种新型冠状病毒SARS-CoV-2疫苗及其制备方法
CN111671890B (zh) * 2020-05-14 2022-08-05 苏州大学 一种新型冠状病毒疫苗及其应用
GB202014851D0 (en) * 2020-09-21 2020-11-04 Iontas Ltd SARS-COV-2 antibodies
CN112409496B (zh) * 2020-11-26 2021-07-13 焦顺昌 一种跨膜表达新型冠状病毒抗原s2的融合蛋白、重组载体、重组树突状细胞及其应用
CN112375784B (zh) * 2021-01-07 2021-04-16 北京百普赛斯生物科技股份有限公司 制备重组新型冠状病毒Spike蛋白的方法
CN113234170A (zh) * 2021-04-13 2021-08-10 武汉大学 新型冠状病毒突变株s蛋白及其亚单位疫苗

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11389528B2 (en) 2020-06-10 2022-07-19 Sichuan Clover Biopharmaceuticals, Inc Coronavirus vaccine compositions, methods, and uses thereof
WO2022218272A1 (zh) * 2021-04-13 2022-10-20 武汉大学 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN113929786B (zh) * 2021-04-13 2022-08-05 武汉大学 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN113929786A (zh) * 2021-04-13 2022-01-14 武汉大学 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN113563483A (zh) * 2021-08-09 2021-10-29 广州明药科技有限公司 噬菌体展示新冠病毒衣壳蛋白及应用
CN113563483B (zh) * 2021-08-09 2024-02-02 广州明药科技有限公司 噬菌体展示新冠病毒衣壳蛋白及应用
CN113832168A (zh) * 2021-08-15 2021-12-24 北京科兴中维生物技术有限公司 mRNA疫苗及其制备方法和应用
CN113773372A (zh) * 2021-08-15 2021-12-10 北京科兴中维生物技术有限公司 重组蛋白及其制备方法和应用
WO2023020623A1 (zh) * 2021-08-20 2023-02-23 百奥泰生物制药股份有限公司 用于预防或治疗冠状病毒感染的融合蛋白、Spike蛋白纳米颗粒及其应用
CN113603793A (zh) * 2021-08-31 2021-11-05 南华大学 一种新型冠状病毒的重组s蛋白、重组质粒、重组菌及制备外泌体药物或外泌体疫苗的应用
CN113527522A (zh) * 2021-09-13 2021-10-22 深圳市瑞吉生物科技有限公司 一种新冠病毒三聚体重组蛋白、DNA、mRNA及应用和mRNA疫苗
CN113957097A (zh) * 2021-09-27 2022-01-21 中国食品药品检定研究院 一种对新冠变异株广谱中和保护的免疫原及其制备方法和应用
CN113957097B (zh) * 2021-09-27 2023-11-28 中国食品药品检定研究院 一种对新冠变异株广谱中和保护的免疫原及其制备方法和应用
WO2023064708A1 (en) * 2021-10-12 2023-04-20 Wang Chang Yi Vaccine compositions against sars-cov-2 variants of concern to prevent infection and treat long-haul covid
CN114729373A (zh) * 2022-01-27 2022-07-08 深圳市瑞吉生物科技有限公司 一种新型冠状病毒mRNA疫苗及其制备方法与应用
WO2023142283A1 (zh) * 2022-01-27 2023-08-03 深圳市瑞吉生物科技有限公司 一种新型冠状病毒mRNA疫苗及其制备方法与应用
US11931410B1 (en) 2022-01-27 2024-03-19 Shenzhen Rhegen Biotechnology Co., Ltd. SARS-CoV-2 mRNA vaccine and preparation method and use thereof

Also Published As

Publication number Publication date
CN113929786A (zh) 2022-01-14
CN113929786B (zh) 2022-08-05
WO2022218272A1 (zh) 2022-10-20

Similar Documents

Publication Publication Date Title
CN113929786B (zh) 新型冠状病毒突变株s蛋白及其亚单位疫苗
CN112358533B (zh) 重组刺突蛋白及其制备方法和用途
CN113185613B (zh) 新型冠状病毒s蛋白及其亚单位疫苗
Stuible et al. Rapid, high-yield production of full-length SARS-CoV-2 spike ectodomain by transient gene expression in CHO cells
Gallagher et al. Cell receptor-independent infection by a neurotropic murine coronavirus
CN111234036B (zh) 非洲猪瘟病毒p72融合蛋白及其制备方法和应用
CN108611359B (zh) 猪圆环病毒3型病毒样颗粒的制备方法及其应用
KR20200053518A (ko) Rsv에 대한 면역의 안전한 유도를 위한 방법
JPH02177889A (ja) E.Coliからの異種蛋白質の排泄
KR20230009445A (ko) 안정화된 코로나바이러스 스파이크 단백질 융합 단백질
CN111808176B (zh) 牛疱疹病毒抗原组合物及其应用
WO2022134487A1 (zh) 新型冠状病毒重组蛋白亚单位疫苗
Sellhorn et al. Improving the expression of recombinant soluble HIV Envelope glycoproteins using pseudo-stable transient transfection
Gleiter et al. Changing the surface of a virus shell fusion of an enzyme to polyoma VP1
CN111187781B (zh) 一种优化后的猪圆环病毒3型衣壳蛋白基因及其在制备病毒样颗粒中的应用
CN114560915A (zh) 一种改造的高滴度SARS-CoV-2假病毒
CN115073565B (zh) 重组新型冠状病毒s蛋白三聚体及其制备方法与应用
CN104292338A (zh) 含sars病毒n抗原的重组蛋白及展示n蛋白的杆状病毒
CN104293740A (zh) 表面展示sars双价抗原的重组杆状病毒及其制备方法和应用
CN111094323A (zh) 修饰的巨细胞病毒蛋白和稳定的复合物
EP1680444A1 (en) New soluble and stabilized trimeric form of gp41 polypeptides
CN103214561B (zh) 人丙型肝炎病毒核心抗原及其制备方法和应用
Brudenell et al. Efficient overexpression and purification of severe acute respiratory syndrome coronavirus 2 nucleocapsid proteins in Escherichia coli
CN116785422B (zh) 含有新型冠状病毒联合抗原的麻疹减毒疫苗及其拯救方法
CN111778279B (zh) 一种HTLV-1 Env介导的细胞-细胞融合模型、制备方法及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210810