CN112979829B - 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用 - Google Patents

融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用 Download PDF

Info

Publication number
CN112979829B
CN112979829B CN202110471959.3A CN202110471959A CN112979829B CN 112979829 B CN112979829 B CN 112979829B CN 202110471959 A CN202110471959 A CN 202110471959A CN 112979829 B CN112979829 B CN 112979829B
Authority
CN
China
Prior art keywords
thr
leu
ala
val
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110471959.3A
Other languages
English (en)
Other versions
CN112979829A (zh
Inventor
齐海龙
曲春枫
赵宏
陈立功
孙忠杰
谢皇帆
刘德芳
王晓芳
王旭东
姚艳玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuowei Biotechnology Wuxi Co ltd
Original Assignee
Nuowei Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuowei Technology Beijing Co ltd filed Critical Nuowei Technology Beijing Co ltd
Priority to CN202110471959.3A priority Critical patent/CN112979829B/zh
Publication of CN112979829A publication Critical patent/CN112979829A/zh
Application granted granted Critical
Publication of CN112979829B publication Critical patent/CN112979829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/521Chemokines
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/385Haptens or antigens, bound to carriers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Communicable Diseases (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Toxicology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及生物技术领域,尤其涉及融合蛋白及其在制备靶向新冠病毒SARS‑COV‑2的疫苗中的应用。本发明通过将SARS‑COV‑2的全长S蛋白或者S\M\N蛋白的B细胞抗原表位与cDC1细胞特异性表达的XCR1受体的配体XCL1融合表达,提高了S蛋白或者S\M\N蛋白进入次级淋巴结的效率以及被DC细胞,B细胞吞噬、加工、呈递的效率,改善了诱导特异性抗体反应的效果。经由实验验证,本发明的核酸疫苗表达的蛋白可以有效归巢到次级淋巴结、诱导高滴度中和抗体以及特异性T细胞反应。

Description

融合蛋白及其在制备靶向新冠病毒SARS-COV-2的疫苗中的 应用
技术领域
本发明涉及生物技术领域,尤其涉及融合蛋白及其在制备靶向新冠病毒SARS-COV-2的疫苗中的应用。
背景技术
2019年末爆发的冠状病毒疾病(COVID-19)由严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)所引起,主要经呼吸道飞沫或是密切接触传播,目前已在全世界216个国家和地区传播,造成大量人员死亡,严重损伤社会经济和人类公共健康,是本世纪全人类所面临的最大危机。这一病毒从未在人群中流行,不存在人群免疫屏障,所以全年龄段人群普遍易感。目前,还未发现针对SARS-CoV-2抗病毒特效药物,虽然临床疫苗已经紧急批准做预防之用,但新冠病毒的变异毒株还在持续出现,这些变异毒株导致目前的中和抗体以及疫苗的保护力逐渐减弱,全世界的流行以及康复后的二次感染急需安全有效且能够快速更新的针对SARS-CoV-2以及其变异毒株的疫苗。
冠状病毒(Coronaviridae)是一类单股正链RNA病毒,基因组大小为27~32kb。在所有已知的RNA病毒(例如流感病毒、脊髓灰质炎病毒、HIV等)中,冠状病毒的基因组是最大的。因病毒囊膜上含有刺突(spike)状的包膜蛋白S,在电镜结构中类似于皇冠上镶嵌的珍珠,病毒由此而得名。按照系统发育的不同,冠状病毒可以被分成α/β/γ/δ四个属,每个属有不同的毒株,α/β属冠状病毒感染哺乳动物,而γ/δ属冠状病毒感染鸟类。
最新序列研究分析表明,从临床病人分离的SARS-CoV-2和蝙蝠来源的冠状病毒RaTG13有96%的一致性,和SARS冠状病毒也有79.3%的同一性。冠状基因组结构较为保守,包含11个功能性开放阅读框,依次为ORF1a、ORF1b、S、ORF3、ORF4a、ORF4b、ORF5、E、M、ORF8b和N。其中ORF1a和ORF1b分别编码在所有冠状病毒中均保守的两种复制酶PL2pro和3CLpro。ORF3、4a、4b、5和8b分别编码了病毒的5种附属蛋白。ORFs S、E、M和N编码了的4种主要结构蛋白—刺突蛋白(Spike Protein,S)、包膜蛋白(EnvelopeProtein ,E)、膜蛋白(MembraneProtein,M)和核衣壳蛋白(Nucleocapsid Protein,N)。其中,E蛋白为在病毒表面形成离子通道的一种跨膜蛋白,与病毒毒力相关。N蛋白是病毒基因组RNA复制复合物的主要组成部分,并与M蛋白的C端结构域结合。M蛋白是构成冠状病毒粒子形状的蛋白,参与病毒组分在病毒粒子中的整合。S蛋白突出于病毒粒子表面,为I型跨膜糖蛋白,与病毒颗粒吸附和膜融合相关,根据2006年非典型肺炎的相关研究报道,S蛋白是诱导机体产生中和抗体的主要免疫原,S蛋白在之后成为中东呼吸综合症病毒MERS疫苗和基因工程药物开发的重要靶点。鉴于以往工作经验,S蛋白成为针对SARS-COV-2的首选抗原。然而大量的相关病毒防御研究也揭示,针对核衣壳蛋白的抗体也可以保护机体免于病毒的攻击,例如一些针对核衣壳蛋白的乙肝疫苗。
另外,抗原蛋 白经抗原提呈细胞摄取后会经蛋白酶体或者溶酶体降解成可以结合MHCII或者MHCI的多肽序列,称之为抗原表位。与全长蛋白相比,直接选择抗原表位理论上可以增强被呈递的可能性。例如,在肿瘤疫苗的研发中就经历了从使用全肿瘤细胞到单个肿瘤过表达蛋白以及生物信息学手段预测多个抗原表位的历程。初始的B细胞仅存在于淋巴结等次级淋巴组织中,淋巴结等次级淋巴组织是免疫应答发生的重要场所。外源性抗原只有被专职抗原提呈细胞摄取、加工,才能有效地提呈至细胞表面,活化初始B细胞。尽管已发现树突状细胞(DC)是强大的抗原提呈细胞,但不同亚群DC具有不同的诱导抗原特异免疫应答能力。近年来,大量研究认为,在小鼠体内,CD8α+DC是主要将抗原提呈给Th1型CD4 T细胞,Th1型CD4 T细胞可以分泌IFNr促进B细胞分泌IgG2型抗体,这类抗体是主要的中和抗体组成部分,而其他群DC细胞提呈抗原给Th2型CD4 T细胞,主要分泌IL-10介导免疫抑制性IgG1产生。故而在抗病毒的抗原递送过程中,将抗原递送次级淋巴结可以一方面给CD8α+DC细胞摄取促进辅助性Th1型CD4 T发育,一方面直接被B细胞吞噬开启免疫,二者结合可以高效的产生针对病毒的中和型抗体。在人体内也存在一群与之类似的细胞,即CD141+DC(又称为BDCA3+DC)。然而,这些细胞也主要存在于次级淋巴组织,难以直接从外周组织中摄取抗原物质。位于外周组织中的少量抗原即使通过引流淋巴管进入局部引流淋巴结内,由于淋巴结解剖结构的致密性,也难以与位于淋巴结内部的副皮质区内的CD8α+DC细胞接触而被摄取。因此,目前尚缺乏如何将病毒蛋白免疫原主动传送到CD8α+DC细胞的方式而诱导出针对抗原的T和B细胞免疫。
预防SARS-CoV-2大面积流行,最有效方法是接种疫苗形成对病毒的免疫。而由于SARS-COV-2对于人类而言是全新的病毒,人类机体对SARS-COV-2的保护性免疫应答过程仍不清楚,故而无法判断哪一种疫苗类型会取得最好的保护效果。行之有效的策略为多种疫苗平台多种免疫方法同时平行开发,以便尽快获得安全有效的疫苗,终止此次疫情的继续流行。
发明内容
有鉴于此,本发明要解决的技术问题在于提供融合蛋白及其在制备靶向新冠病毒SARS-COV-2的疫苗中的应用,以期可以高效、长效的对新冠病毒起到免疫作用。
本发明提供的融合蛋白包括:XCL1趋化因子和新型冠状病毒SARS-COV-2抗原;
所述XCL1趋化因子为XCL1趋化因子或XCL1趋化因子信号肽;
所述新型冠状病毒SARS-COV-2抗原包括(I)~(IV)中至少一种:
(I)新型冠状病毒SARS-COV-2刺突蛋白,
(II)如SEQ ID NO:1所示新型冠状病毒SARS-COV-2刺突蛋白抗原表位,
(III)如SEQ ID NO:2所示新型冠状病毒SARS-COV-2包膜蛋白抗原表位,
(IV)如SEQ ID NO:3所示新型冠状病毒SARS-COV-2核衣壳蛋白抗原表位。
一些实施例中,本发明提供的融合蛋白由N端至C端:
包括如SEQ ID NO:7所示XCL1趋化因子蛋白和SEQ ID NO:18所示新型冠状病毒SARS-COV-2刺突蛋白;
或包括:如SEQ ID NO:7所示XCL1趋化因子蛋白、如SEQ ID NO:1所示新型冠状病毒SARS-COV-2刺突蛋白抗原表位、如SEQ ID NO:2所示新型冠状病毒SARS-COV-2包膜蛋白抗原表位、如SEQ ID NO:3所示新型冠状病毒SARS-COV-2核衣壳蛋白抗原表位。
本发明所述新型冠状病毒SARS-COV-2刺突蛋白(S蛋白)的抗原表位,具有SEQ IDNO:1和2所示的氨基酸序列。
编码新型冠状病毒SARS-COV-2刺突蛋白(S蛋白)的抗原表位的核酸包括(I)~(IV)中至少一种:
(I)、具有如SEQ ID NO:4所示核苷酸序列的核酸;
(II)、在(I)所述的片段中取代、缺失或添加一个或多个核苷酸的核酸;
(III)、与如(I)所述的核酸具有至少70%同源性且编码SEQ ID NO:1所示刺突蛋白抗原表位的核酸;
(IV)、与(I)~(III)中任一项部分互补或完全互补的核酸。
一些实施例中,本发明提供的SARS-COV-2病毒S蛋白的抗原表位的氨基酸序列如SEQ ID NO:1所示,编码该抗原表位的核酸的序列如SEQ ID NO:4所示。
本发明所述的新型冠状病毒SARS-COV-2包膜蛋白(M蛋白)的抗原表位,其具有SEQID NO:2所示的氨基酸序列。
编码新型冠状病毒SARS-COV-2包膜蛋白(M蛋白)抗原表位的核酸包括①~④中至少一种:
①、具有如SEQ ID NO:5所示核苷酸序列的核酸;
②、在①所述的片段中取代、缺失或添加一个或多个核苷酸的核酸;
③、与如①所述的核酸具有至少70%同源性且编码SEQ ID NO:2所示包膜蛋白抗原表位的核酸;
④、与①~③中任一项部分互补或完全互补的核酸。
一些实施例中,本发明提供的SARS-COV-2病毒S蛋白的抗原表位的氨基酸序列如SEQ ID NO:2所示,编码该抗原表位的核酸的序列如SEQ ID NO:5所示。
本发明所述的新型冠状病毒SARS-COV-2核衣壳蛋白(N蛋白)的抗原表位,其具有SEQ ID NO:3所示的氨基酸序列。
编码新型冠状病毒SARS-COV-2核衣壳蛋白(N蛋白)的抗原表位的核酸包括(i)~(iv)中至少一种:
(i)、具有如SEQ ID NO:6所示核苷酸序列的核酸;
(ii)、在(i)所述的片段中取代、缺失或添加一个或多个核苷酸的核酸;
(iii)、与如(i)所述的核酸具有至少70%同源性且编码SEQ ID NO:3所示核衣壳蛋白抗原表位的核酸;
(iv)、与(i)~( iii)中任一项部分互补或完全互补的核酸。
一些实施例中,本发明提供的SARS-COV-2病毒S蛋白的抗原表位的氨基酸序列如SEQ ID NO:3所示,编码该抗原表位的核酸的序列如SEQ ID NO:6所示。
本发明所述的融合蛋白中,XCL1趋化因子蛋白和刺突蛋白抗原表位之间还包括linker序列,所述linker序列的氨基酸序列如SEQ ID NO:21。
本发明所述融合蛋白中,刺突蛋白抗原表位与包膜蛋白抗原表位之间包括连接氨基酸,其序列为AAY;所述包膜蛋白抗原表位与核衣壳蛋白抗原表位之间包括连接氨基酸,其序列为AAY。
本发明还提供了编码本发明所述融合蛋白的核酸。
本发明中,编码本发明所述融合蛋白的核酸包括(一)~(四)中至少一种:
(一)、具有如SEQ ID NO:9所示核苷酸序列的核酸;
(二)、在(一)所述的片段中取代、缺失或添加一个或多个核苷酸的核酸;
(三)、与如(一)所述的核酸具有至少70%同源性且编码本发明所述融合蛋白的核酸;
(四)、与(一)~(三)中任一项部分互补或完全互补的核酸。
具体实施例中,融合蛋白包括S蛋白抗原表位、M蛋白抗原表位、N蛋白抗原表位,记为S\M\N,其氨基酸序列如SEQ ID No.19所示。为了保证S\M\N能够被分泌到细胞外,在其N端加入XCL1趋化因子的信号肽,其氨基酸序列如SEQ ID No.12所示,编码该融合蛋白的核酸序列如SEQ ID No.13所示。
另一些具体实施例中,所述融合蛋白包括XCL1趋化因子(含有信号肽和蛋白序列)、linker和S\M\N,记为XCL1-S\M\N,其氨基酸序列如SEQ ID No.8所示,编码该融合蛋白的核酸序列如SEQ ID No.9所示。
一些实施例中,所述融合蛋白的氨基酸序列如SEQ ID NO:8所示。编码该融合蛋白的核酸序列如SEQ ID NO:9所示。
另一些实施例中,所述融合蛋白的氨基酸序列如SEQ ID NO:10所示。编码该融合蛋白的核酸序列如SEQ ID NO:11所示。
另一些实施例中,所述融合蛋白的氨基酸序列如SEQ ID NO:12所示。编码该融合蛋白的核酸序列如SEQ ID NO:13所示。
另一些实施例中,所述融合蛋白的氨基酸序列如SEQ ID NO:14所示。编码该融合蛋白的核酸序列如SEQ ID NO:15所示。
本发明还提供了重组载体,其包括骨架载体和本发明所述的核酸。
本发明中,所述骨架载体上包括CMV增强子、CMV启动子、poly(A)加尾信号和抗性标签。
一些实施例中,所述骨架载体选自pVAX1、pcDNA3.1或pCMV-Tag-2B。
本发明还提供了转化或转染所述重组载体的重组宿主。
本发明所述重组宿主中,宿主细胞为细菌或哺乳动物细胞。
一些实施例中,所述细菌为大肠杆菌;所述哺乳动物细胞HEK293T细胞。
本发明所述融合蛋白的制备方法包括,培养所述重组宿主,获得含有所述融合蛋白的培养物。
本发明所述的融合蛋白、核酸、重组载体、重组宿主和/或所述制备方法制得的融合蛋白,在制备防治新型冠状病毒SARS-COV-2感染的疫苗中的应用。
本发明还提供了一种疫苗,其包括本发明所述的融合蛋白、核酸、重组载体、重组宿主和/或所述制备方法制得的融合蛋白。
本发明还提供了一种防治新型冠状病毒SARS-COV-2感染的方法,其为给予所述的疫苗。
本发明通过将SARS-COV-2的全长S蛋白或者S\M\N蛋白的B细胞抗原表位与cDC1细胞特异性表达的XCR1受体的配体XCL1融合表达,提高了S蛋白或者S\M\N蛋白进入次级淋巴结的效率以及被DC细胞,B细胞吞噬、加工、呈递的效率,改善了诱导特异性抗体反应的效果。经由实验验证,本发明的核酸疫苗表达的蛋白可以有效归巢到次级淋巴结、诱导高滴度中和抗体以及特异性T细胞反应。
附图说明
图1A示CMV启动子之后接XCL1序列之后连接SARS-COV-2 S蛋白用于核酸疫苗编码序列;
图1B示CMV启动子之后接XCL1序列之后连接S\M\N蛋白BCR表位串联序列用于核酸疫苗编码序列;
图1C示CMV启动子之后接XCL1分泌信号肽序列之后连接SARS-COV-2 S蛋白用于核酸疫苗编码序列;
图1D示示CMV启动子之后接XCL1分泌信号肽序列之后连接S\M\N蛋白BCR表位串联序列用于核酸疫苗编码序列;
图2A示XCL1-S融合蛋白的三维结构预测结果图;
图2B示XCL1-S\M\N表位融合蛋白空间结构图;
图3示检测编码融合蛋白的核酸在HEK293T细胞内的表达情况;将载由编码融合蛋白核酸的质粒载体转染HEK292T细胞48小时后,利用蛋白免疫印迹技术(Westernblot)检测C端带有Flag标签的融合蛋白编码核苷酸的表达情况;其中,3A泳道从左至右依次示空载体、S\M\NBCR表位串联序列、XCL1- S\M\N融合蛋白的表达情况,图3B泳道从左至右依次示XCL1- S融合蛋白、S蛋白全长、空载体的表达情况;
图4示融合蛋白可以有效地结合MHCII+CD11c+CD8a+抗原交叉呈递DC细胞;将带有Flag标签的HEK293T细胞纯化的蛋白与CD11C磁珠富集的脾细胞孵育,利用Flag荧光抗体检测融合蛋白与MHCII+CD11c+CD8a+抗原交叉呈递DC细胞的结合情况;其中,4A示融合蛋白结合DC细胞流式分析图;4B示4A中融合蛋白结合DC细胞比例统计分析图;
图5示Westernblot检测经基因枪皮下注射后和对照未注射组(CM)相比在注射部位的表皮(SKIN),皮下肌肉(M)以及远端淋巴结(LN)均可以有效地表达;
图6示编码XCL1-S/XCL1-S\M\N表位串联后的融合基因免疫小鼠后,小鼠血清抗体产生情况;其中,6A示Elisa检测S\M\N以及XCL1-S\M\N免疫后小鼠血清抗体随时间变化曲线图;6B示Elisa检测S以及XCL1-S免疫后小鼠血清抗体随时间变化曲线图;
图7示编码XCL1-S, XCL1-S\M\N, S, S\M\N表位串联后的融合基因免疫小鼠后,小鼠血清抗体中和SARS-COV-2病毒实验图。
具体实施方式
本发明提供了融合蛋白及其在制备靶向新冠病毒SARS-COV-2的疫苗中的应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明的方法及应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
抗原表位(antigenic epitope),又称“抗原决定簇”或“抗原决定族位点”。抗原表位的大小与相应抗体的抗原结合部位相适合。一个抗原表位的特异性由组成它的所有残基共同决定,但其中有些残基在与抗体结合时比其它残基起更大作用,这些残基被称为免疫显性基团。
本发明所述的编码蛋白的核酸可以是DNA、RNA、cDNA或PNA。在本发明实施例中,所述核酸为DNA形式。所述DNA形式包括cDNA、基因组DNA或人工合成的DNA。所述DNA可以是单链的或是双链的。核酸可以包括具有不同功能的核苷酸序列,如编码区和非编码区如调控序列(例如启动子或转录终止子)。核酸在拓扑学上可以是线性或环状的。核酸可以是例如载体(如表达或克隆载体)的一部分,或一个片段。所述核酸可直接从天然来源获得,或者可由重组、酶法或化学技术辅助制备。
本发明中提供了新型冠状病毒SARS-COV-2的刺突蛋白、包膜蛋白、核衣壳蛋白的抗原表位。本发明中,所述S蛋白、刺突蛋白、SARS-COV-2 S蛋白、SARS-COV-2刺突蛋白具有相同的意义,在本文中可以互换使用。所述M蛋白、包膜蛋白、SARS-COV-2 M蛋白或包膜蛋白具有相同的意义,在本文中可以互换使用。所述N蛋白、核衣壳蛋白、SARS-COV-2 N蛋白或SARS-COV-2核衣壳蛋白具有相同的意义,在本文中可以互换使用。在本发明中,SARS-COV-2的刺突蛋白的抗原表位也被称为SARS-COV-2的S蛋白的抗原表位或S蛋白的抗原表位或S表位;SARS-COV-2的包膜蛋白的抗原表位也被称为SARS-COV-2的M蛋白的抗原表位或M蛋白的抗原表位或M表位;SARS-COV-2的核衣壳蛋白的抗原表位也被称为SARS-COV-2的N蛋白的抗原表位或N蛋白的抗原表位或N表位。
本发明中,所述的连接肽或linker是指在融合蛋白中连接两个蛋白片段的连接物,一些实施例中,抗原表位之间的连接通过三肽AAY来实现。而抗原表位与趋化因子蛋白之间通过(GGGGS)n来连接。
本发明中,所述融合蛋白是指通过DNA重组技术得到的基因重组后的表达产物。
一些实施例中,本发明提供的融合蛋白中,包括SARS-COV-2 S蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位,记为S\M,本发明对其中S表位、M表位连接顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括SARS-COV-2 S蛋白的抗原表位和SARS-COV-2 N蛋白的抗原表位,记为S\N,对其中S表位、N连接表位顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括SARS-COV-2 N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位,记为N\M,对其中N表位、M表位连接顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括SARS-COV-2 S蛋白的抗原表位、SARS-COV-2 N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位,记为S\M\N。本发明中,对融合蛋白中S表位、M表位、N表位连接顺序不做限定。在本发明实施例中,由N端至C端,融合蛋白中依次包括S表位、M表位、N表位,其中S表位与M表位之间以连接肽AAY进行连接,M表位与S表位之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽和SARS-COV-2 S蛋白全长;记为XCL1 signal-S全长,对其中XCL1信号肽、S蛋白连接顺序不做限定,二者之间以linker进行连接,所述linker的氨基酸序列为GGGGGSGGGGG。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽和SARS-COV-2 S蛋白的抗原表位;记为XCL1 signal-S表位,对其中XCL1信号肽、S表位连接顺序不做限定,二者之间以linker进行连接,所述linker的氨基酸序列为GGGGGSGGGGG。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽和SARS-COV-2 M蛋白的抗原表位;记为XCL1 signal-M表位,对其中XCL1信号肽、M表位连接顺序不做限定,二者之间以linker进行连接,所述linker的氨基酸序列为GGGGGSGGGGG。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽和SARS-COV-2 N蛋白的抗原表位;记为XCL1 signal-N表位,对其中XCL1信号肽、N表位连接顺序不做限定,二者之间以linker进行连接,所述linker的氨基酸序列为GGGGGSGGGGG。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽、SARS-COV-2 S蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位;记为XCL1 signal-S\M,对其中XCL1信号肽、S表位、M表位连接顺序不做限定。一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽、SARS-COV-2 S蛋白的抗原表位和SARS-COV-2 N蛋白的抗原表位,记为XCL1 signal-S\N,对其中XCL1信号肽、S表位、N表位连接顺序不做限定。一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽、SARS-COV-2 N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位,记为XCL1 signal-N\M,对其中XCL1信号肽、M表位、N表位连接顺序不做限定。一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子信号肽、SARS-COV-2 S蛋白的抗原表位、SARS-COV-2 N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位,记为XCL1 signal-S\M\N,对其中XCL1信号肽、S表位、N表位、M表位连接顺序不做限定。一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。一些具体实施例中,XCL1 signal-S\M\N的序列中,由N端至C端依次为XCL1signal-linker-S表位-AAY-M表位-AAY-N表位,其氨基酸序列如SEQ ID No.12所示,在具体实施例中,编码该融合蛋白的核酸序列如SEQ ID NO:13所示。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白和SARS-COV-2 S蛋白全长;记为XCL1 -S蛋白,对其中XCL1蛋白、S蛋白连接顺序不做限定,二者之间以linker进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白和SARS-COV-2 S蛋白的抗原表位;记为XCL1-S表位,对其中XCL1蛋白、S表位连接顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白和SARS-COV-2 M蛋白的抗原表位;记为XCL1-M表位,对其中XCL1蛋白、M表位连接顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白和SARS-COV-2 N蛋白的抗原表位;记为XCL1-N表位,对其中XCL1蛋白、N表位连接顺序不做限定,二者之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白、SARS-COV-2S蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位;记为XCL1-S\M,对其中XCL1蛋白、S表位、M表位的连接顺序不做限定,一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白、SARS-COV-2S蛋白的抗原表位和SARS-COV-2 N蛋白的抗原表位;记为XCL1-S\N,对其中XCL1蛋白、S表位、N表位的连接顺序不做限定,一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白、SARS-COV-2N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位;记为XCL1-M\N,对其中XCL1蛋白、N表位、M表位的连接顺序不做限定,一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。
另一些实施例中,本发明提供的融合蛋白中,包括XCL1趋化因子蛋白、SARS-COV-2S蛋白的抗原表位、SARS-COV-2 N蛋白的抗原表位和SARS-COV-2 M蛋白的抗原表位;记为XCL1-S\M\N,对其中XCL1蛋白、S表位、N表位、M表位的连接顺序不做限定,一些实施例中,XCL1信号肽与表位片段之间以linker进行连接,而表位片段之间以连接肽AAY进行连接。一些具体实施例中,XCL1 -S\N\M的序列中,由N端至C端依次为XCL1蛋白-linker-S表位-AAY-M表位-AAY-N表位,其氨基酸序列如SEQ ID No.8所示,在具体实施例中,编码该融合蛋白的核酸序列如SEQ ID NO:9所示。
在本发明中,对表达融合蛋白的核酸序列进行了优化,这些优化包括但不限于:密码子使用偏好性,消除不利于表达的二级结构(如发夹结构),改变GC含量,CpG二核苷酸含量,mRNA的二级结构,隐蔽剪接位点,早期多聚腺苷化位点,内部核糖体进入位点和结合位点,负CpG岛,RNA不稳定区,重复序列(直接重复、反向重复等)和可能影响克隆的限制性位点。
在本发明实施例中,涉及的片段的氨基酸序列和编码的核酸片段如表1:
表1片段的氨基酸序列和编码的核酸片段
SEQ ID No.1 S表位的氨基酸序列
SEQ ID No.2 M表位的氨基酸序列
SEQ ID No.3 N表位的氨基酸序列
SEQ ID No.4 编码S表位的核酸
SEQ ID No.5 编码M表位的核酸
SEQ ID No.6 编码N表位的核酸
SEQ ID No.7 XCL1蛋白全长氨基酸序列
SEQ ID No.8 融合蛋白XCL1-S\M\N 的氨基酸序列
SEQ ID No.9 编码融合蛋白XCL1-S\M\N的核酸序列
SEQ ID No.10 融合蛋白XCL1 signal–S蛋白的氨基酸序列
SEQ ID No.11 编码融合蛋白XCL1 signal–S蛋白的核酸序列
SEQ ID No.12 融合蛋白XCL1 signal–S\M\N蛋白的氨基酸序列
SEQ ID No.13 编码融合蛋白XCL1 signal–S\M\N蛋白的核酸序列
SEQ ID No.14 融合蛋白XCL1–S蛋白的氨基酸序列
SEQ ID No.15 编码融合蛋白XCL1–S蛋白的核酸序列
SEQ ID No.16 XCL1蛋白信号肽的氨基酸序列
SEQ ID No.17 骨架载体的核酸序列
SEQ ID No.18 S蛋白的氨基酸序列
SEQ ID No.19 融合蛋白S\M\N的氨基酸序列
SEQ ID No.20 编码Linker的核酸序列
SEQ ID No.21 Linker的氨基酸序列
本发明中还提供了融合蛋白的转录单元,所述转录单元是指启动子开始至终止子结束的 DNA序列。启动子和终止子两侧或之间还可包括调控片段,所述调控片段可以包括与核酸序列可操作地连接的启动子、增强子、转录终止信号、多腺苷酸化序列、复制起点、核酸限制性位点、和同源重组位点,例如启动子的增强子,poly(A)信号等。本发明提供的转录单元中,包括CMV启动子、CMV增强子和编码融合蛋白的核酸片段。
本发明所述重组载体,是指重组的核酸载体,是一种重组DNA分子,其包含期望的编码序列和对可操作连接的编码基因在具体宿主生物内的表达所必不可少的合适的核酸序列。对原核细胞中的表达必需的核酸序列包括启动子,任选包括操纵基因序列,核糖体结合位点及可能的其它序列。已知原核细胞利用启动子,增强子以及终止和多腺苷酸化信号。一经转化进入合适的宿主,载体可以独立于宿主基因组进行复制和发挥作用,或者,在一些情况下,自己整合进入基因组。在本说明书中,“质粒”和“载体”有时可以交换通用,因为质粒是当前最普遍使用的载体形式。然而,本发明意图包括表达载体的这样的其它形式,其发挥等价作用,其在本领域是已知的或将变为已知的,包括但不限于:质粒,噬菌体颗粒,病毒载体和/或仅为潜在的基因组插入物。
本发明所述的宿主细胞,一般为含有核酸载体和/或目标基因的原核或真核宿主。用使用重组DNA技术构建的载体转化或转染宿主细胞。这样的转化宿主细胞有能力复制编码蛋白质的载体或表达期望蛋白质。
本发明实施例中,所述融合蛋白的制备方法采用诱导重组宿主表达的方式,所述培养物可以为培养获得的菌体、细胞体、培养液、或者有上述培养物中经提取和/或纯化获得的物质。
本发明所述疫苗的不仅具有预防新型冠状病毒SARS-COV-2感染的作用,还能够具有阻断S蛋白介导的新冠病毒颗粒进入细胞的作用。该疫苗可制备成为多种剂型,例如注射剂、口服制剂等,在本发明实施例中,其可以制备成配合基因枪使用的制剂。本发明中,所述注射剂、口服制剂或者配合基因枪使用的制剂中,可以包括疫苗中可接受的辅料。例如稀释剂、pH调节剂、渗透压调节剂、稳定剂、乳化剂、润湿剂或冻干保护剂等。
本发明所述的防治新型冠状病毒SARS-COV-2感染的方法,其为给予所述的疫苗。该方法包括治疗新型冠状病毒SARS-COV-2感染和/或预防新型冠状病毒SARS-COV-2感染。其给予方式包括注射、口服或基因枪。
本发明采用的试材皆为普通市售品,皆可于市场购得。下面结合实施例,进一步阐述本发明:
实施例1 融合蛋白疫苗抗原的设计方案以及哺乳动物细胞表达质粒的构建与制备
(1)融合基因哺乳动物细胞表达载体的构建:
根据SARS-COV-2 S蛋白(氨基酸SEQ ID No.18)和S\M\N蛋白BCR表位串联序列(氨基酸SEQ ID No.19)和人XCL1 (氨基酸SEQ ID No.7)蛋白的氨基酸序列构建融合蛋白XCL1-S(氨基酸SEQ ID No.14,核酸SEQ ID No.15)和XCL1-S\M\N(氨基酸SEQ ID No.8,核酸SEQ ID No.9),为了促进表达融合蛋白的核酸在体内翻译出的融合蛋白可以有效的分泌到细胞外并趋化MHC-II+CD11c+CD8a+抗原交叉呈递DC细胞,我们保留了XCL1蛋白的分泌信号肽(氨基酸SEQ ID No.16)并且去除了全长S蛋白的细胞膜锚定部分。最终得到的融合蛋白的氨基酸序列(SEQ ID No.8和SEQ ID No.14)。对于单独S蛋白和S\M\N蛋白BCR表位串联序列蛋白则将XCL1蛋白的分泌信号肽加到去除自身信号肽的蛋白N端(SEQ ID No.10和SEQID No.12,编码的核酸分别为SEQ ID No.11和SEQ ID No.13),以保证单独S蛋白和S\M\N蛋白BCR表位串联序列表达载体表达出的S蛋白和S\M\N蛋白蛋白也能同样的被分泌到细胞外。我们将氨基酸序列对应的核苷酸序列进行哺乳动物细胞表达偏好的密码子优化,由擎科公司进行合成,并连接到pVAX1表达载体上(SEQ ID No.17)。
(2)融合基因哺乳动物细胞表达载体的扩增
细菌的转化,取-80℃冻存的感受态细菌置于冰上融化, 待接近完全融化时加入100 ng 质粒,轻柔混匀,冰上放置 30 mins。将感受态置于 42℃水浴锅中热激 60 s, 取出后立即置于冰上放置 2 mins。向管内加入 500 µL 不含抗生素的 LB 培养基, 37℃摇床内振荡培养 1 h。将细菌 4000 rpm 室温离心 2 mins,弃去部分上清(约 450 µL)后重悬细菌,取适量细菌悬液涂于含有相应抗生素的培养皿上。培养皿正面朝下放置, 37℃培养箱培养过夜。待克隆大小适宜后(约 16 h)用枪尖将克隆挑至加好抗生素的 LB 培养基中,37℃摇床中振荡培养至浑浊。取 15 mL 培养至合适浓度的细菌菌液, 4000 rpm 室温离心 5mins,弃掉上清。按照北京天根公司的《质粒小提试剂盒》货号(DP103)说明书提取细菌 DNA。首先加入 250 µL 含 RNA酶的细胞重悬液 P1 充分重悬细菌沉淀,并将沉淀转移至 1.5 mL EP 管中。加入 250 µL 碱性细胞裂解液 P2,轻柔颠倒混匀至液体澄清。加入350 µL 中和液 P3,颠倒混合均匀至出现絮状沉淀物。混悬液 12000 rpm室温离心 10mins。将 DNA 吸附柱放入回收管中,加入 500 µL 平衡液活化吸附膜, 12000 rpm 离心 1min 后弃掉液体。将离心获得的上清转移至 DNA 吸附柱中, 12000 rpm 离心 1 min 后弃去液体。向吸附柱内加入 600 µL 清洗液, 12000 rpm 离心 1min 后弃去液体,重复洗涤一次。 12000 rpm 空离回收管 2 mins。将收集管更换为新的 1.5 mL EP 管,室温放置 5mins 晾干吸附柱。加入 70 µL 65℃预热的洗脱缓冲液或者高压过的纯净水, 室温放置 5mins 充分溶解 DNA, 12000 rpm 室温离心 3 mins,收集液体。弃掉吸附柱后对管内质粒进行浓度测定并标记质粒名称、浓度、提取日期。
实施例2 融合蛋白三维结构预测
根据融合蛋白的核苷酸序列,我们利用http://raptorx.uchicago.edu/网站对XCL1以及S蛋白和S\M\N蛋白BCR表位串联序列融合蛋白的三维结构进行预测。XCL1属于趋化因子,其趋化功能的正常发挥需要保有完整的空间结构。为了确保XCL1与S蛋白和S\M\N蛋白BCR表位串联序列融合后,XCL1仍然保留有自身的空间结构,我们对融合后的氨基酸序列在http://raptorx.uchicago.edu/网站上进行三维结构预测,结果如图2A、图2B显示,XCL1与S蛋白和S\M\N蛋白BCR表位串联序列融合后,二者仍然各自保有原来的空间结构,并不影响XCL1的趋化功能发挥。
实施例3 编码XCL1-S蛋白和S\M\N蛋白BCR表位串联序列融合蛋白的哺乳动物细胞表达载体表达效果检测
转染前24小时,在6孔细胞培养板内接种1×106个HEK293T细胞,待细胞密度长到70%-80%时开始转染试验。转染时提前在37℃水浴锅中预热细胞培养基、无血清的 Opti-MEM 培养基。转染时将 5 微克 空载体(Vector),单独S蛋白和S\M\N蛋白BCR表位串联序列表达载体,XCL1-S蛋白和S\M\N蛋白BCR表位串联序列野生型和突变型融合基因质粒和20μLPEI转染试剂先后加入到 200 μL无血清的 Opti-MEM 中,混合均匀后, 室温下静置10分钟。将需要转染的细胞更换新鲜培养基,轻柔加入上述转染体系,轻轻摇匀。将细胞放回细胞培养箱中培养 6 小时后换液。转 48小时后收取细胞用Western Blot检测XCL1-S蛋白和S\M\N蛋白BCR表位串联序列融合基因质粒HEK293T细胞中的表达效果。
为了方便检测融合基因的表达效果我们在融合蛋白的C端连接一个DDDDK5个氨基酸组成的Flag标签,以便利用Flag标签抗体检测融合蛋白的表达。收集细胞,加入60μL的含有 PMSF 或 Cocktail 蛋白酶抑制剂的 0.5% NP40 裂解缓冲液。充分重悬细胞, 4℃旋转裂解细胞 30 分钟。12000 rpm, 4℃离心裂解液 10 分钟,收集上清至新的 1.5 mL EP 管中,弃掉沉淀。根据样品实际体积加入 5×SDS-PAGE 蛋白上样缓冲液,混合均匀后将样品放在 100℃空气浴中加热 10分钟,立即进行 Western blot,利用Flag标签抗体(Sigma,F3165)进行检测,结果如图3中3A、3B显示。其中,空载体(Vector)无蛋白表达,单独S蛋白和S\M\N蛋白BCR表位串联序列表达载体,XCL1-S蛋白和S\M\N蛋白BCR表位串联序列融合基因质粒均能有效表达并且表达量相当。
实施例4 XCL1-S蛋白和S\M\N蛋白BCR表位串联序列融合蛋白结合MHC-II+CD11c+CD8a+抗原交叉呈递DC细胞能力检测
获得可表达融合蛋白的质粒后,本发明首先对从293T中获得的蛋白是否可以有效地结合MHCII+CD11c+CD8a+抗原交叉呈递DC细胞进行了验证。
(1)分离纯化CD11c+DC细胞
以小鼠全脾作为CD11c+DC细胞来源,先取小鼠脾利用70um孔径细胞筛网在1640培养基中磨碎成单细胞,200g离心10分钟后,弃上清,利用R&D公司红细胞裂解液(货号WL2000)对脾细胞进行裂红处理。具体为先将裂解液A用蒸馏水稀释10倍配成工作液,每个脾加入2mL工作液重悬,室温放置10min,期间将中和液B用蒸馏水稀释10倍配成工作液。十分钟后将10mL中和液B加入裂解液中中和后200g离心10min。细胞团用含1%灭活FBS的PBS缓冲液洗涤一次并计数。取总数1×108次方个细胞重悬于400μL含1%灭活FBS的PBS缓冲液中,加入100μLCD11c磁珠(Miltenyi Biotec:130-108-338),4℃避光放置20min。这期间利用1%灭活FBS的PBS缓冲液平衡吸附磁珠的柱子。20min后将细胞以及磁珠混合液一并转入磁珠吸附柱子,并将柱子放于磁力架上,待细胞完全进入柱子中,用1%灭活FBS的PBS缓冲液洗涤三次每次3mL。之后将柱子从磁力架取下放于15mL离心管上方加入5mL1%灭活FBS的PBS缓冲液并快速推动将CD11c阳性DC细胞洗脱,计数并用200g离心10min。将最终获得的CD11c阳性DC细胞用无血清1640重悬为1×106cells/mL。铺于24孔板中,每孔1mL。将细胞分为BSA蛋白对照组,S或者S\M\N蛋白对照组以及XCL1-S或者S\M\N野生型蛋白实验组,每组加入293T细胞蛋白总量为500μg混匀后放于37℃二氧化碳培养箱培养40分钟后,收集细胞500g离心,并用1%灭活FBS的PBS缓冲液反复洗涤两次。并进行流式染色:MHC-II APC,Flag-dye light488,CD8α-Percp/Cy5 .5。利用BD LSRII仪器中速收集细胞,并分析不同组之间MHC-II+Flag-dye light 488+CD8α+细胞比例。每组重复3次。
(2)结果显示,未融合XCL1的S或者S\M\N蛋白与BSA对照蛋白结合的MHC-II+CD11c+CD8a+数目以及比例类似,而融合了XCL1的S或者S\M\N蛋白更强的结合到MHC-II+CD11c+CD8a+抗原交叉呈递DC细胞上,结合能力高于对照组20倍以上,如图4中4A,4B所示。
实施例5 融合基因在小鼠体内表达蛋白的刺激淋巴组织定位检测
鉴于融合基因在哺乳动物细胞可以正常表达,融合蛋白也可以有效地结合MHC-II+CD11c+CD8a+抗原交叉呈递DC细胞。我们提取单独S或者S\M\N和XCL1-S或者S\M\N质粒,利用Wealtec公司的基因枪(GDS-80)对小鼠进行免疫质粒注射。并在注射后两天左右检测蛋白表达情况。
小鼠经麻醉处死后,用眼科剪刀剪取基因枪注射部位的皮肤,以及皮肤下方的肌肉组织,并同时取下注射部位对侧的腹股沟淋巴结,加入适量的RIPA裂解液,利用玻璃组织匀浆器将各组织磨碎,放于4℃旋转裂解30min。 12000rpm离心后,取上清测定蛋白浓度。之后用Westernblot检测XCL1-S蛋白和S\M\N蛋白在各组织中的分布。结果如图5所示,XCL1-S蛋白和S\M\N蛋白经基因枪注射后在注射部位有较好的表达水平,并且可以有效地进入到次级淋巴结中。
实施例6 融合蛋白质粒免疫后小鼠血清中针对S蛋白和S\M\N蛋白的抗体检测
确定融合蛋白质粒小鼠注射可以有效表达并进入次级淋巴结后。将C57B6(购自为通利华)周龄雄性小鼠,分为注射单独S蛋白和S\M\N蛋白和XCL1-S蛋白和S\M\N蛋白质粒的5组,每组10只,利用脱毛膏进行小鼠右侧靠近腹股沟淋巴结处脱毛处理。之后利用基因枪在脱毛处注射质粒,每只50μg,每周一次,共注射四次,分别在第一次注射前,第二次注射后以及第四次注射后的一周进行内眦采血,12000rpm离心20min获得血清冻存于-80℃保存。在最后一次采血后利用ELISA检测各组小鼠血清中针对S蛋白和S\M\N蛋白的抗体情况。结果如图中6A、6B所示,免疫注射XCL1-S蛋白和S\M\N蛋白质粒均能有效地在血清中诱导出针对S蛋白和S\M\N蛋白的抗体。说明融合基因免疫的效果显著有效。
实施例7:融合蛋白质粒免疫后小鼠血清中针对新冠活病毒的中和能力检测
抗体中和实验:取小鼠免疫血清20uL,和相同体积的新冠病毒液37℃ 混合1小时,然后加入12孔板培养的Vero细胞,感染2小时后,去感染细胞培养液,换新鲜细胞培养液并37℃培养。3天之后,通过细胞病变效应CPE确定血清中和能力。通过实验,我们发现XCL1-S蛋白和S\M\N蛋白来源的血清, 能够极大地降低病毒感染的效率, 在抗体中和后,病毒感染细胞的能力显著降低,说明血清中的S特异性抗体能阻断S蛋白介导的新冠病毒颗粒进入细胞,如图7所示。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
序列表
<110> 诺未科技(北京)有限公司
<120> 融合蛋白及其在制备靶向新冠病毒SARS-COV-2的疫苗中的应用
<130> MP2029672
<160> 21
<170> SIPOSequenceListing 1.0
<210> 1
<211> 198
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
1 5 10 15
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Ala
20 25 30
Ala Tyr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys
35 40 45
Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr
50 55 60
Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile
65 70 75 80
Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu
85 90 95
Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Ala Ala Tyr
100 105 110
Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn
115 120 125
Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr
130 135 140
Trp Arg Val Tyr Ser Thr Gly Ser Ala Ala Tyr Phe Ser Gln Ile Leu
145 150 155 160
Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Ala Ala Tyr
165 170 175
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
180 185 190
Tyr Arg Phe Asn Gly Ile
195
<210> 2
<211> 47
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu
1 5 10 15
Leu Glu Gln Trp Asn Leu Val Ile Ala Ala Tyr Pro Leu Leu Glu Ser
20 25 30
Glu Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile
35 40 45
<210> 3
<211> 94
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu
1 5 10 15
Thr Gln His Gly Lys Ala Ala Tyr Asn Asn Asn Ala Ala Thr Val Leu
20 25 30
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Ala Ala Tyr Asn
35 40 45
Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys
50 55 60
Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln
65 70 75 80
Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp Met
85 90
<210> 4
<211> 594
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gacgctgtgg actgcgccct ggaccctctg agcgaaacca agtgcactct gaagagcttt 60
accgtggaga aaggcattta ccagacaagc aacgccgcct atgtgtgcgg acctaaaaag 120
agcaccaacc tggtgaagaa caagtgcgtg aacttcaact tcaacggcct gaccggcacc 180
ggcgtgctga cagagagcaa caaaaagttc ctgcctttcc agcagtttgg cagggacatc 240
gcagacacca ccgacgccgt gagggaccct cagaccctgg agatcctgga cattacacct 300
tgcagcttcg gcggcgtgag cgtgatcgcc gcctacggaa ccaacaccag caaccaggtg 360
gccgtgctgt atcaggacgt gaactgcaca gaagtgcctg tggccatcca cgccgaccag 420
ctgaccccta cctggagggt gtacagcacc ggcagcgccg cctacttcag ccagattctg 480
cctgacccca gcaaacctag caaaagaagc ttcatcgaag ccgcctactt tggagccggc 540
gccgccctgc agatcccttt cgcaatgcag atggcctacc ggttcaacgg catc 594
<210> 5
<211> 141
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atggccgact ccaacggcac catcaccgtg gaggagctga agaagctgct ggagcagtgg 60
aacctggtga tcgccgctta ccccctgctg gagtctgagc tggtgatcgg agccgtgatc 120
ctgagaggcc acctgagaat c 141
<210> 6
<211> 282
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aggcctcagg gcctgcctaa taacaccgcc tcctggttca ccgccctgac ccagcacggg 60
aaggccgctt ataacaataa tgctgccacc gtgctgcagc tgccccaggg aaccaccctg 120
cctaaaggct tcgccgcata caacaagcac atcgacgcct acaaaacctt cccccctacc 180
gagcccaaga aagacaagaa gaaaaagacc gacgaagccc agcctctgcc ccagcggcag 240
aaaaagcagc ccaccgtgac cctgctgccc gccgctgata tg 282
<210> 7
<211> 114
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val Gly Thr Glu Val Leu Glu Glu Ser Ser Cys
20 25 30
Val Asn Leu Gln Thr Gln Arg Leu Pro Val Gln Lys Ile Lys Thr Tyr
35 40 45
Ile Ile Trp Glu Gly Ala Met Arg Ala Val Ile Phe Val Thr Lys Arg
50 55 60
Gly Leu Lys Ile Cys Ala Asp Pro Glu Ala Lys Trp Val Lys Ala Ala
65 70 75 80
Ile Lys Thr Val Asp Gly Arg Ala Ser Thr Arg Lys Asn Met Ala Glu
85 90 95
Thr Val Pro Thr Gly Ala Gln Arg Ser Thr Ser Thr Ala Ile Thr Leu
100 105 110
Thr Gly
<210> 8
<211> 470
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val Gly Thr Glu Val Leu Glu Glu Ser Ser Cys
20 25 30
Val Asn Leu Gln Thr Gln Arg Leu Pro Val Gln Lys Ile Lys Thr Tyr
35 40 45
Ile Ile Trp Glu Gly Ala Met Arg Ala Val Ile Phe Val Thr Lys Arg
50 55 60
Gly Leu Lys Ile Cys Ala Asp Pro Glu Ala Lys Trp Val Lys Ala Ala
65 70 75 80
Ile Lys Thr Val Asp Gly Arg Ala Ser Thr Arg Lys Asn Met Ala Glu
85 90 95
Thr Val Pro Thr Gly Ala Gln Arg Ser Thr Ser Thr Ala Ile Thr Leu
100 105 110
Thr Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Asp Ala Val
115 120 125
Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser
130 135 140
Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Ala Ala Tyr Val
145 150 155 160
Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn
165 170 175
Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn
180 185 190
Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr
195 200 205
Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr
210 215 220
Pro Cys Ser Phe Gly Gly Val Ser Val Ile Ala Ala Tyr Gly Thr Asn
225 230 235 240
Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu
245 250 255
Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val
260 265 270
Tyr Ser Thr Gly Ser Ala Ala Tyr Phe Ser Gln Ile Leu Pro Asp Pro
275 280 285
Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Ala Ala Tyr Phe Gly Ala
290 295 300
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
305 310 315 320
Asn Gly Ile Ala Ala Tyr Met Ala Asp Ser Asn Gly Thr Ile Thr Val
325 330 335
Glu Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu Val Ile Ala Ala
340 345 350
Tyr Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val Ile Leu Arg
355 360 365
Gly His Leu Arg Ile Ala Ala Tyr Arg Pro Gln Gly Leu Pro Asn Asn
370 375 380
Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Ala Ala Tyr
385 390 395 400
Asn Asn Asn Ala Ala Thr Val Leu Gln Leu Pro Gln Gly Thr Thr Leu
405 410 415
Pro Lys Gly Phe Ala Ala Tyr Asn Lys His Ile Asp Ala Tyr Lys Thr
420 425 430
Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu
435 440 445
Ala Gln Pro Leu Pro Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu
450 455 460
Leu Pro Ala Ala Asp Met
465 470
<210> 9
<211> 1410
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atgagacttc tcctcctgac tttcctggga gtctgctgcc tcaccccatg ggttgtggaa 60
ggtgtgggga ctgaagtcct agaagagagt agctgtgtga acttacaaac ccagcggctg 120
ccagttcaaa aaatcaagac ctatatcatc tgggaggggg ccatgagagc tgtaattttt 180
gtcaccaaac gaggactaaa aatttgtgct gatccagaag ccaaatgggt gaaagcagcg 240
atcaagactg tggatggcag ggccagtacc agaaagaaca tggctgaaac tgttcccaca 300
ggagcccaga ggtccaccag cacagcgata accctgactg ggggcggagg cggaggatca 360
gggggagggg gaggagacgc tgtggactgc gccctggacc ctctgagcga aaccaagtgc 420
actctgaaga gctttaccgt ggagaaaggc atttaccaga caagcaacgc cgcctatgtg 480
tgcggaccta aaaagagcac caacctggtg aagaacaagt gcgtgaactt caacttcaac 540
ggcctgaccg gcaccggcgt gctgacagag agcaacaaaa agttcctgcc tttccagcag 600
tttggcaggg acatcgcaga caccaccgac gccgtgaggg accctcagac cctggagatc 660
ctggacatta caccttgcag cttcggcggc gtgagcgtga tcgccgccta cggaaccaac 720
accagcaacc aggtggccgt gctgtatcag gacgtgaact gcacagaagt gcctgtggcc 780
atccacgccg accagctgac ccctacctgg agggtgtaca gcaccggcag cgccgcctac 840
ttcagccaga ttctgcctga ccccagcaaa cctagcaaaa gaagcttcat cgaagccgcc 900
tactttggag ccggcgccgc cctgcagatc cctttcgcaa tgcagatggc ctaccggttc 960
aacggcatcg ccgcctatat ggccgactcc aacggcacca tcaccgtgga ggagctgaag 1020
aagctgctgg agcagtggaa cctggtgatc gccgcttacc ccctgctgga gtctgagctg 1080
gtgatcggag ccgtgatcct gagaggccac ctgagaatcg ccgcttatag gcctcagggc 1140
ctgcctaata acaccgcctc ctggttcacc gccctgaccc agcacgggaa ggccgcttat 1200
aacaataatg ctgccaccgt gctgcagctg ccccagggaa ccaccctgcc taaaggcttc 1260
gccgcataca acaagcacat cgacgcctac aaaaccttcc cccctaccga gcccaagaaa 1320
gacaagaaga aaaagaccga cgaagcccag cctctgcccc agcggcagaa aaagcagccc 1380
accgtgaccc tgctgcccgc cgctgatatg 1410
<210> 10
<211> 1223
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val Ser Gln Cys Val Asn Leu Thr Thr Arg Thr
20 25 30
Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr
35 40 45
Pro Asp Lys Val Phe Arg Ser Ser Val Leu His Ser Thr Gln Asp Leu
50 55 60
Phe Leu Pro Phe Phe Ser Asn Val Thr Trp Phe His Ala Ile His Val
65 70 75 80
Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro Val Leu Pro Phe
85 90 95
Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg
100 105 110
Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu
115 120 125
Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val Cys Glu Phe Gln
130 135 140
Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr Tyr His Lys Asn Asn Lys
145 150 155 160
Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys
165 170 175
Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly Lys
180 185 190
Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile Asp
195 200 205
Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Asn Leu Val Arg
210 215 220
Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val Asp Leu Pro
225 230 235 240
Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala Leu His Arg
245 250 255
Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala
260 265 270
Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys
275 280 285
Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ala Leu Asp
290 295 300
Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys
305 310 315 320
Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr Glu Ser Ile
325 330 335
Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val Phe
340 345 350
Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile
355 360 365
Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe
370 375 380
Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu Asn Asp Leu
385 390 395 400
Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg Gly Asp Glu
405 410 415
Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn
420 425 430
Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala Trp Asn Ser
435 440 445
Asn Asn Leu Asp Ser Lys Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg
450 455 460
Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr
465 470 475 480
Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys Asn Gly Val Glu Gly Phe
485 490 495
Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly
500 505 510
Val Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
515 520 525
His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val
530 535 540
Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly
545 550 555 560
Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly
565 570 575
Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu
580 585 590
Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile
595 600 605
Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp
610 615 620
Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr
625 630 635 640
Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe Gln Thr Arg
645 650 655
Ala Gly Cys Leu Ile Gly Ala Glu His Val Asn Asn Ser Tyr Glu Cys
660 665 670
Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr
675 680 685
Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala
690 695 700
Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn
705 710 715 720
Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile
725 730 735
Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile
740 745 750
Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser
755 760 765
Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln
770 775 780
Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys
785 790 795 800
Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu
805 810 815
Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu
820 825 830
Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly
835 840 845
Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys
850 855 860
Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile
865 870 875 880
Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp
885 890 895
Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met
900 905 910
Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
915 920 925
Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile
930 935 940
Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp
945 950 955 960
Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu
965 970 975
Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
980 985 990
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr
995 1000 1005
Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
1010 1015 1020
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser
1025 1030 1035 1040
Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
1045 1050 1055
Tyr His Leu Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe
1060 1065 1070
Leu His Val Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala
1075 1080 1085
Pro Ala Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val
1090 1095 1100
Phe Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
1105 1110 1115 1120
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys
1125 1130 1135
Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln
1140 1145 1150
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1155 1160 1165
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala
1170 1175 1180
Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
1185 1190 1195 1200
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1205 1210 1215
Glu Gln Tyr Ile Lys Trp Pro
1220
<210> 11
<211> 3669
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
atgagacttc tcctcctgac tttcctggga gtctgctgcc tcaccccatg ggttgtggaa 60
ggtgtgtccc agtgcgtgaa cctgaccacc cggacccagc tgccccctgc atacaccaac 120
agcttcacca ggggcgtgta ctaccccgac aaggtgttca ggagttctgt gctgcacagc 180
acccaggacc tgtttctgcc tttcttcagc aacgtgacct ggttccacgc catccacgtg 240
tccggcacaa acggcaccaa gagatttgac aatcctgtgc tgcctttcaa cgacggcgtg 300
tattttgcct ccaccgagaa gagcaacatc attcgcggct ggatcttcgg caccaccctg 360
gacagcaaga cacagagcct gctgatcgtg aacaatgcca ccaacgtggt gattaaggtg 420
tgtgagttcc agttctgcaa cgaccccttc ctgggagtgt actaccacaa aaacaataag 480
agctggatgg agagcgaatt tagggtgtac agcagtgcca acaattgcac cttcgagtac 540
gtgtcccagc ctttcctgat ggacctggag ggcaagcagg gcaacttcaa aaacctgagg 600
gagttcgtgt tcaagaacat cgacgggtac ttcaaaatct acagcaaaca cacacccatt 660
aacctggtgc gggacctgcc tcagggcttt agcgcactgg agcctctggt ggatctgcct 720
atcggcatca acatcaccag gtttcagacc ctgctggccc tgcacagaag ctacctgacc 780
cctggcgact cctcctccgg ctggaccgca ggagccgctg catactacgt gggctacctg 840
caaccccgca ccttcctgct gaagtacaac gagaacggca caatcaccga cgccgtggac 900
tgcgccctgg accctctgag cgaaaccaag tgcaccctga agagcttcac cgtggaaaaa 960
ggcatttacc agacctccaa cttcagagtg cagcctaccg aaagcattgt gcggtttcct 1020
aacatcacca acctgtgccc tttcggcgag gtgttcaacg ccaccagatt tgccagcgtg 1080
tacgcctgga acaggaaaag gatctctaac tgcgtggccg actacagcgt gctgtacaac 1140
tccgcatcct tcagcacctt caaatgctat ggcgtgtccc ctacaaagct gaacgatctg 1200
tgtttcacca acgtgtacgc tgactccttt gtgattaggg gcgacgaggt gaggcagatc 1260
gcccctggcc agacaggcaa gattgctgac tataactaca agctgcctga cgacttcacc 1320
ggctgcgtga tcgcctggaa ctccaacaat ctggacagta aggtgggggg aaactacaac 1380
tacctgtaca ggctgttcag gaagagcaac ctgaagccat tcgaaaggga cattagcaca 1440
gagatttacc aggctggcag caccccctgc aacggagtgg agggattcaa ctgctacttc 1500
cccctgcaat cctacggctt ccagcccacc aacggcgtgg gataccagcc ttacagggtg 1560
gtggtgctgt ccttcgagct gctgcacgca cctgccacag tgtgcggccc taagaagtcc 1620
accaacctgg tgaagaacaa atgcgtgaac ttcaatttca acggactgac cggcaccggg 1680
gtgctgaccg agagcaacaa aaagttcctg cctttccagc agttcggccg cgacatcgcc 1740
gacaccaccg acgcagtgag ggaccctcag accctggaaa ttctggacat caccccttgc 1800
tccttcggag gcgtgagcgt gatcaccccc ggcaccaaca ccagcaacca ggtggccgtg 1860
ctgtaccagg acgtgaactg caccgaagtg cctgtggcca ttcacgcaga ccagctgacc 1920
cctacatgga gggtgtatag caccggcagt aacgtgttcc agacaagggc cggatgtctg 1980
atcggcgccg agcacgtgaa caactcttac gagtgcgaca tccctattgg cgccggcatc 2040
tgcgcttcct atcagaccca gacaaacagc cctaggaggg ccagatccgt ggccagccag 2100
agtatcatcg cctacaccat gtccctggga gctgagaact ccgtggccta tagtaacaac 2160
tccatcgcca tccccaccaa cttcaccatc agcgtgacca ccgaaatcct gcccgtgtcc 2220
atgaccaaga ccagcgtgga ctgcaccatg tacatctgcg gcgacagcac cgaatgcagc 2280
aacctgctgc tgcaatacgg cagcttctgc acccagctga accgcgccct gactggcatc 2340
gccgtggagc aggacaagaa cacccaggag gtgttcgcac aggtgaagca gatctacaaa 2400
acccctccta tcaaggactt cggcggcttc aactttagcc agatcctgcc tgacccttct 2460
aagccttcca aaagatcctt tatcgaggat ctgctgttca ataaagtgac cctggcagac 2520
gccggcttca tcaagcagta cggcgactgc ctgggggaca tcgccgccag agacctgatc 2580
tgcgcccaga agttcaacgg gctgacagtg ctgccccccc tgctgaccga cgaaatgatc 2640
gctcagtaca ccagcgccct gctggccggc acaatcacat ccggatggac cttcggggcc 2700
ggcgccgctc tgcaaatccc cttcgccatg cagatggcct acagattcaa cggaatcgga 2760
gtgacccaga acgtgctgta cgagaaccag aaactgatcg ccaaccagtt caacagcgct 2820
atcggaaaaa tccaggactc tctgagcagc accgccagcg cactgggaaa gctgcaagac 2880
gtggtgaacc agaacgccca ggccctgaac accctggtga aacagctgag cagcaatttc 2940
ggagccatca gctccgtgct gaacgacatc ctgagcagac tggacaaggt ggaggcagag 3000
gtgcagatcg acaggctgat taccggcagg ctgcaaagcc tgcaaacata cgtgacccag 3060
cagctgatca gggctgccga gatcagggct tccgccaatc tggccgccac caagatgagt 3120
gagtgcgtgc tgggccagag caagagagtg gacttctgcg gcaaagggta tcacctgatg 3180
tccttccccc agtctgcccc ccacggcgtg gtgttcctgc atgtgaccta cgtgccagct 3240
caggagaaaa acttcacaac agcccctgcc atctgtcacg acggcaaggc ccacttccct 3300
agggaaggag tgttcgtgag caacggcacc cactggttcg tgacccagag aaacttttac 3360
gagcctcaga tcatcaccac cgacaacacc ttcgtgagcg gaaactgtga cgtggtgatc 3420
ggcatcgtga acaacaccgt gtatgaccct ctgcaacctg aactggacag cttcaaggaa 3480
gaactggaca agtacttcaa gaaccacacc tctccagacg tggatctggg cgacatcagt 3540
ggcattaacg ccagcgtggt gaacatccag aaagaaatcg acaggctgaa cgaagtggcc 3600
aaaaacctga acgagagcct gatcgacctg caagagctgg gaaagtatga acagtacatc 3660
aagtggcct 3669
<210> 12
<211> 367
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 12
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val Asp Ala Val Asp Cys Ala Leu Asp Pro Leu
20 25 30
Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile
35 40 45
Tyr Gln Thr Ser Asn Ala Ala Tyr Val Cys Gly Pro Lys Lys Ser Thr
50 55 60
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Thr
65 70 75 80
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
85 90 95
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
100 105 110
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
115 120 125
Ser Val Ile Ala Ala Tyr Gly Thr Asn Thr Ser Asn Gln Val Ala Val
130 135 140
Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala
145 150 155 160
Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Ala Ala
165 170 175
Tyr Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
180 185 190
Phe Ile Glu Ala Ala Tyr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro
195 200 205
Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Ala Ala Tyr Met
210 215 220
Ala Asp Ser Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Lys Leu Leu
225 230 235 240
Glu Gln Trp Asn Leu Val Ile Ala Ala Tyr Pro Leu Leu Glu Ser Glu
245 250 255
Leu Val Ile Gly Ala Val Ile Leu Arg Gly His Leu Arg Ile Ala Ala
260 265 270
Tyr Arg Pro Gln Gly Leu Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala
275 280 285
Leu Thr Gln His Gly Lys Ala Ala Tyr Asn Asn Asn Ala Ala Thr Val
290 295 300
Leu Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Ala Ala Tyr
305 310 315 320
Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys
325 330 335
Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro Gln Arg
340 345 350
Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp Met
355 360 365
<210> 13
<211> 1101
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atgagacttc tcctcctgac tttcctggga gtctgctgcc tcaccccatg ggttgtggaa 60
ggtgtggacg ctgtggactg cgccctggac cctctgagcg aaaccaagtg cactctgaag 120
agctttaccg tggagaaagg catttaccag acaagcaacg ccgcctatgt gtgcggacct 180
aaaaagagca ccaacctggt gaagaacaag tgcgtgaact tcaacttcaa cggcctgacc 240
ggcaccggcg tgctgacaga gagcaacaaa aagttcctgc ctttccagca gtttggcagg 300
gacatcgcag acaccaccga cgccgtgagg gaccctcaga ccctggagat cctggacatt 360
acaccttgca gcttcggcgg cgtgagcgtg atcgccgcct acggaaccaa caccagcaac 420
caggtggccg tgctgtatca ggacgtgaac tgcacagaag tgcctgtggc catccacgcc 480
gaccagctga cccctacctg gagggtgtac agcaccggca gcgccgccta cttcagccag 540
attctgcctg accccagcaa acctagcaaa agaagcttca tcgaagccgc ctactttgga 600
gccggcgccg ccctgcagat ccctttcgca atgcagatgg cctaccggtt caacggcatc 660
gccgcctata tggccgactc caacggcacc atcaccgtgg aggagctgaa gaagctgctg 720
gagcagtgga acctggtgat cgccgcttac cccctgctgg agtctgagct ggtgatcgga 780
gccgtgatcc tgagaggcca cctgagaatc gccgcttata ggcctcaggg cctgcctaat 840
aacaccgcct cctggttcac cgccctgacc cagcacggga aggccgctta taacaataat 900
gctgccaccg tgctgcagct gccccaggga accaccctgc ctaaaggctt cgccgcatac 960
aacaagcaca tcgacgccta caaaaccttc ccccctaccg agcccaagaa agacaagaag 1020
aaaaagaccg acgaagccca gcctctgccc cagcggcaga aaaagcagcc caccgtgacc 1080
ctgctgcccg ccgctgatat g 1101
<210> 14
<211> 1326
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 14
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val Gly Thr Glu Val Leu Glu Glu Ser Ser Cys
20 25 30
Val Asn Leu Gln Thr Gln Arg Leu Pro Val Gln Lys Ile Lys Thr Tyr
35 40 45
Ile Ile Trp Glu Gly Ala Met Arg Ala Val Ile Phe Val Thr Lys Arg
50 55 60
Gly Leu Lys Ile Cys Ala Asp Pro Glu Ala Lys Trp Val Lys Ala Ala
65 70 75 80
Ile Lys Thr Val Asp Gly Arg Ala Ser Thr Arg Lys Asn Met Ala Glu
85 90 95
Thr Val Pro Thr Gly Ala Gln Arg Ser Thr Ser Thr Ala Ile Thr Leu
100 105 110
Thr Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Gln Cys
115 120 125
Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser
130 135 140
Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val
145 150 155 160
Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr
165 170 175
Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe
180 185 190
Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr
195 200 205
Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp
210 215 220
Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val
225 230 235 240
Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val
245 250 255
Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val
260 265 270
Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe
275 280 285
Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu
290 295 300
Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His
305 310 315 320
Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu
325 330 335
Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln
340 345 350
Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser
355 360 365
Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln
370 375 380
Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp
385 390 395 400
Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu
405 410 415
Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg
420 425 430
Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu
435 440 445
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
450 455 460
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
465 470 475 480
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
485 490 495
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
500 505 510
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
515 520 525
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
530 535 540
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
545 550 555 560
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
565 570 575
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
580 585 590
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
595 600 605
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
610 615 620
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
625 630 635 640
Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe
645 650 655
Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe
660 665 670
Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala
675 680 685
Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser
690 695 700
Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
705 710 715 720
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala
725 730 735
Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
740 745 750
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His
755 760 765
Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys
770 775 780
Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val
785 790 795 800
Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn
805 810 815
Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr
820 825 830
Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser
835 840 845
Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn
850 855 860
Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu
865 870 875 880
Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
885 890 895
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
900 905 910
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg
915 920 925
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
930 935 940
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
945 950 955 960
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro
965 970 975
Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
980 985 990
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln
995 1000 1005
Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val
1010 1015 1020
Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe
1025 1030 1035 1040
Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser
1045 1050 1055
Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu
1060 1065 1070
Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser
1075 1080 1085
Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val
1090 1095 1100
Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr
1105 1110 1115 1120
Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1125 1130 1135
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
1140 1145 1150
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
1155 1160 1165
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1170 1175 1180
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
1185 1190 1195 1200
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
1205 1210 1215
Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
1220 1225 1230
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn
1235 1240 1245
Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
1250 1255 1260
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
1265 1270 1275 1280
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
1285 1290 1295
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1300 1305 1310
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
1315 1320 1325
<210> 15
<211> 3978
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
atgagacttc tcctcctgac tttcctggga gtctgctgcc tcaccccatg ggttgtggaa 60
ggtgtgggga ctgaagtcct agaagagagt agctgtgtga acttacaaac ccagcggctg 120
ccagttcaaa aaatcaagac ctatatcatc tgggaggggg ccatgagagc tgtaattttt 180
gtcaccaaac gaggactaaa aatttgtgct gatccagaag ccaaatgggt gaaagcagcg 240
atcaagactg tggatggcag ggccagtacc agaaagaaca tggctgaaac tgttcccaca 300
ggagcccaga ggtccaccag cacagcgata accctgactg ggggaggtgg aggaggtagt 360
ggcggaggag gtggttccca gtgcgtgaac ctgaccaccc ggacccagct gccccctgca 420
tacaccaaca gcttcaccag gggcgtgtac taccccgaca aggtgttcag gagttctgtg 480
ctgcacagca cccaggacct gtttctgcct ttcttcagca acgtgacctg gttccacgcc 540
atccacgtgt ccggcacaaa cggcaccaag agatttgaca atcctgtgct gcctttcaac 600
gacggcgtgt attttgcctc caccgagaag agcaacatca ttcgcggctg gatcttcggc 660
accaccctgg acagcaagac acagagcctg ctgatcgtga acaatgccac caacgtggtg 720
attaaggtgt gtgagttcca gttctgcaac gaccccttcc tgggagtgta ctaccacaaa 780
aacaataaga gctggatgga gagcgaattt agggtgtaca gcagtgccaa caattgcacc 840
ttcgagtacg tgtcccagcc tttcctgatg gacctggagg gcaagcaggg caacttcaaa 900
aacctgaggg agttcgtgtt caagaacatc gacgggtact tcaaaatcta cagcaaacac 960
acacccatta acctggtgcg ggacctgcct cagggcttta gcgcactgga gcctctggtg 1020
gatctgccta tcggcatcaa catcaccagg tttcagaccc tgctggccct gcacagaagc 1080
tacctgaccc ctggcgactc ctcctccggc tggaccgcag gagccgctgc atactacgtg 1140
ggctacctgc aaccccgcac cttcctgctg aagtacaacg agaacggcac aatcaccgac 1200
gccgtggact gcgccctgga ccctctgagc gaaaccaagt gcaccctgaa gagcttcacc 1260
gtggaaaaag gcatttacca gacctccaac ttcagagtgc agcctaccga aagcattgtg 1320
cggtttccta acatcaccaa cctgtgccct ttcggcgagg tgttcaacgc caccagattt 1380
gccagcgtgt acgcctggaa caggaaaagg atctctaact gcgtggccga ctacagcgtg 1440
ctgtacaact ccgcatcctt cagcaccttc aaatgctatg gcgtgtcccc tacaaagctg 1500
aacgatctgt gtttcaccaa cgtgtacgct gactcctttg tgattagggg cgacgaggtg 1560
aggcagatcg cccctggcca gacaggcaag attgctgact ataactacaa gctgcctgac 1620
gacttcaccg gctgcgtgat cgcctggaac tccaacaatc tggacagtaa ggtgggggga 1680
aactacaact acctgtacag gctgttcagg aagagcaacc tgaagccatt cgaaagggac 1740
attagcacag agatttacca ggctggcagc accccctgca acggagtgga gggattcaac 1800
tgctacttcc ccctgcaatc ctacggcttc cagcccacca acggcgtggg ataccagcct 1860
tacagggtgg tggtgctgtc cttcgagctg ctgcacgcac ctgccacagt gtgcggccct 1920
aagaagtcca ccaacctggt gaagaacaaa tgcgtgaact tcaatttcaa cggactgacc 1980
ggcaccgggg tgctgaccga gagcaacaaa aagttcctgc ctttccagca gttcggccgc 2040
gacatcgccg acaccaccga cgcagtgagg gaccctcaga ccctggaaat tctggacatc 2100
accccttgct ccttcggagg cgtgagcgtg atcacccccg gcaccaacac cagcaaccag 2160
gtggccgtgc tgtaccagga cgtgaactgc accgaagtgc ctgtggccat tcacgcagac 2220
cagctgaccc ctacatggag ggtgtatagc accggcagta acgtgttcca gacaagggcc 2280
ggatgtctga tcggcgccga gcacgtgaac aactcttacg agtgcgacat ccctattggc 2340
gccggcatct gcgcttccta tcagacccag acaaacagcc ctaggagggc cagatccgtg 2400
gccagccaga gtatcatcgc ctacaccatg tccctgggag ctgagaactc cgtggcctat 2460
agtaacaact ccatcgccat ccccaccaac ttcaccatca gcgtgaccac cgaaatcctg 2520
cccgtgtcca tgaccaagac cagcgtggac tgcaccatgt acatctgcgg cgacagcacc 2580
gaatgcagca acctgctgct gcaatacggc agcttctgca cccagctgaa ccgcgccctg 2640
actggcatcg ccgtggagca ggacaagaac acccaggagg tgttcgcaca ggtgaagcag 2700
atctacaaaa cccctcctat caaggacttc ggcggcttca actttagcca gatcctgcct 2760
gacccttcta agccttccaa aagatccttt atcgaggatc tgctgttcaa taaagtgacc 2820
ctggcagacg ccggcttcat caagcagtac ggcgactgcc tgggggacat cgccgccaga 2880
gacctgatct gcgcccagaa gttcaacggg ctgacagtgc tgccccccct gctgaccgac 2940
gaaatgatcg ctcagtacac cagcgccctg ctggccggca caatcacatc cggatggacc 3000
ttcggggccg gcgccgctct gcaaatcccc ttcgccatgc agatggccta cagattcaac 3060
ggaatcggag tgacccagaa cgtgctgtac gagaaccaga aactgatcgc caaccagttc 3120
aacagcgcta tcggaaaaat ccaggactct ctgagcagca ccgccagcgc actgggaaag 3180
ctgcaagacg tggtgaacca gaacgcccag gccctgaaca ccctggtgaa acagctgagc 3240
agcaatttcg gagccatcag ctccgtgctg aacgacatcc tgagcagact ggacaaggtg 3300
gaggcagagg tgcagatcga caggctgatt accggcaggc tgcaaagcct gcaaacatac 3360
gtgacccagc agctgatcag ggctgccgag atcagggctt ccgccaatct ggccgccacc 3420
aagatgagtg agtgcgtgct gggccagagc aagagagtgg acttctgcgg caaagggtat 3480
cacctgatgt ccttccccca gtctgccccc cacggcgtgg tgttcctgca tgtgacctac 3540
gtgccagctc aggagaaaaa cttcacaaca gcccctgcca tctgtcacga cggcaaggcc 3600
cacttcccta gggaaggagt gttcgtgagc aacggcaccc actggttcgt gacccagaga 3660
aacttttacg agcctcagat catcaccacc gacaacacct tcgtgagcgg aaactgtgac 3720
gtggtgatcg gcatcgtgaa caacaccgtg tatgaccctc tgcaacctga actggacagc 3780
ttcaaggaag aactggacaa gtacttcaag aaccacacct ctccagacgt ggatctgggc 3840
gacatcagtg gcattaacgc cagcgtggtg aacatccaga aagaaatcga caggctgaac 3900
gaagtggcca aaaacctgaa cgagagcctg atcgacctgc aagagctggg aaagtatgaa 3960
cagtacatca agtggcct 3978
<210> 16
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Met Arg Leu Leu Leu Leu Thr Phe Leu Gly Val Cys Cys Leu Thr Pro
1 5 10 15
Trp Val Val Glu Gly Val
20
<210> 17
<211> 2999
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gactcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
ctatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagcttggt 720
accgagctcg gatccactag tccagtgtgg tggaattctg cagatatcca gcacagtggc 780
ggccgctcga gtctagaggg cccgtttaaa cccgctgatc agcctcgact gtgccttcta 840
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 900
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 960
attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 1020
gcaggcatgc tggggatgcg gtgggctcta tggcttctac tgggcggttt tatggacagc 1080
aagcgaaccg gaattgccag ctggggcgcc ctctggtaag gttgggaagc cctgcaaagt 1140
aaactggatg gctttctcgc cgccaaggat ctgatggcgc aggggatcaa gctctgatca 1200
agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg caggttctcc 1260
ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa tcggctgctc 1320
tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg tcaagaccga 1380
cctgtccggt gccctgaatg aactgcaaga cgaggcagcg cggctatcgt ggctggccac 1440
gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa gggactggct 1500
gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc ctgccgagaa 1560
agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg ctacctgccc 1620
attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg aagccggtct 1680
tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg aactgttcgc 1740
caggctcaag gcgagcatgc ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg 1800
cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact gtggccggct 1860
gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg ctgaagagct 1920
tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc ccgattcgca 1980
gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga attattaacg cttacaattt 2040
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tacaggtggc 2100
acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 2160
atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatagca cgtgctaaaa 2220
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 2280
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 2340
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 2400
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 2460
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 2520
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 2580
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2640
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2700
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2760
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2820
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2880
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 2940
agcaacgcgg cctttttacg gttcctgggc ttttgctggc cttttgctca catgttctt 2999
<210> 18
<211> 1151
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 18
Ser Gln Cys Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr
1 5 10 15
Thr Asn Ser Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg
20 25 30
Ser Ser Val Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser
35 40 45
Asn Val Thr Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr
50 55 60
Lys Arg Phe Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe
65 70 75 80
Ala Ser Thr Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr
85 90 95
Thr Leu Asp Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr
100 105 110
Asn Val Val Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe
115 120 125
Leu Gly Val Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu
130 135 140
Phe Arg Val Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser
145 150 155 160
Gln Pro Phe Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn
165 170 175
Leu Arg Glu Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr
180 185 190
Ser Lys His Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe
195 200 205
Ser Ala Leu Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr
210 215 220
Arg Phe Gln Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly
225 230 235 240
Asp Ser Ser Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly
245 250 255
Tyr Leu Gln Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr
260 265 270
Ile Thr Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys
275 280 285
Cys Thr Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser
290 295 300
Asn Phe Arg Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile
305 310 315 320
Thr Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala
325 330 335
Ser Val Tyr Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp
340 345 350
Tyr Ser Val Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr
355 360 365
Gly Val Ser Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr
370 375 380
Ala Asp Ser Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro
385 390 395 400
Gly Gln Thr Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp
405 410 415
Phe Thr Gly Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys
420 425 430
Val Gly Gly Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn
435 440 445
Leu Lys Pro Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly
450 455 460
Ser Thr Pro Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu
465 470 475 480
Gln Ser Tyr Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr
485 490 495
Arg Val Val Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val
500 505 510
Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn
515 520 525
Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn
530 535 540
Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr
545 550 555 560
Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr
565 570 575
Pro Cys Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr
580 585 590
Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val
595 600 605
Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr
610 615 620
Ser Thr Gly Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly
625 630 635 640
Ala Glu His Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala
645 650 655
Gly Ile Cys Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala
660 665 670
Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
675 680 685
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
690 695 700
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
705 710 715 720
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
725 730 735
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
740 745 750
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
755 760 765
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
770 775 780
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
785 790 795 800
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
805 810 815
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
820 825 830
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
835 840 845
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
850 855 860
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala
865 870 875 880
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
885 890 895
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
900 905 910
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
915 920 925
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
930 935 940
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala
945 950 955 960
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
965 970 975
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
980 985 990
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
995 1000 1005
Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln
1010 1015 1020
Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe
1025 1030 1035 1040
Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1045 1050 1055
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp
1060 1065 1070
Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr
1075 1080 1085
His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1090 1095 1100
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile
1105 1110 1115 1120
Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe
1125 1130 1135
Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp
1140 1145 1150
<210> 19
<211> 345
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 19
Asp Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr
1 5 10 15
Leu Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Ala
20 25 30
Ala Tyr Val Cys Gly Pro Lys Lys Ser Thr Asn Leu Val Lys Asn Lys
35 40 45
Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr
50 55 60
Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile
65 70 75 80
Ala Asp Thr Thr Asp Ala Val Arg Asp Pro Gln Thr Leu Glu Ile Leu
85 90 95
Asp Ile Thr Pro Cys Ser Phe Gly Gly Val Ser Val Ile Ala Ala Tyr
100 105 110
Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu Tyr Gln Asp Val Asn
115 120 125
Cys Thr Glu Val Pro Val Ala Ile His Ala Asp Gln Leu Thr Pro Thr
130 135 140
Trp Arg Val Tyr Ser Thr Gly Ser Ala Ala Tyr Phe Ser Gln Ile Leu
145 150 155 160
Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Ala Ala Tyr
165 170 175
Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala
180 185 190
Tyr Arg Phe Asn Gly Ile Ala Ala Tyr Met Ala Asp Ser Asn Gly Thr
195 200 205
Ile Thr Val Glu Glu Leu Lys Lys Leu Leu Glu Gln Trp Asn Leu Val
210 215 220
Ile Ala Ala Tyr Pro Leu Leu Glu Ser Glu Leu Val Ile Gly Ala Val
225 230 235 240
Ile Leu Arg Gly His Leu Arg Ile Ala Ala Tyr Arg Pro Gln Gly Leu
245 250 255
Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys
260 265 270
Ala Ala Tyr Asn Asn Asn Ala Ala Thr Val Leu Gln Leu Pro Gln Gly
275 280 285
Thr Thr Leu Pro Lys Gly Phe Ala Ala Tyr Asn Lys His Ile Asp Ala
290 295 300
Tyr Lys Thr Phe Pro Pro Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys
305 310 315 320
Thr Asp Glu Ala Gln Pro Leu Pro Gln Arg Gln Lys Lys Gln Pro Thr
325 330 335
Val Thr Leu Leu Pro Ala Ala Asp Met
340 345
<210> 20
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ggcggaggcg gaggatcagg gggaggggga gga 33
<210> 21
<211> 11
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 21
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10

Claims (13)

1.融合蛋白,由N端至C端包括如SEQ ID NO:7所示XCL1趋化因子蛋白和SEQ ID NO:18所示新型冠状病毒SARS-COV-2刺突蛋白。
2.根据权利要求1所述的融合蛋白,其特征在于,氨基酸序列如SEQ ID NO:14所示。
3.编码权利要求1或2所述融合蛋白的核酸。
4.根据权利要求3所述的核酸,其特征在于,其核酸序列为SEQ ID No.15所示。
5.重组载体,其包括骨架载体和权利要求3或4所述的核酸。
6.根据权利要求5所述的重组载体,其特征在于,所述骨架载体上包括CMV增强子、CMV启动子、poly(A)加尾信号和抗性标签。
7.根据权利要求6所述的重组载体,其特征在于,所述骨架载体选自pVAX1、pcDNA3.1或pCMV-Tag-2B。
8.转化或转染权利要求5~7任一项所述重组载体的重组宿主。
9.根据权利要求8所述的重组宿主,其特征在于,其宿主细胞为细菌或哺乳动物细胞。
10.根据权利要求9所述的重组宿主,其特征在于,所述细菌为大肠杆菌;所述哺乳动物细胞HEK293T细胞。
11.权利要求1或2所述融合蛋白的制备方法,其特征在于,培养权利要求8~10任一项所述重组宿主,获得含有所述融合蛋白的培养物。
12.权利要求1或2所述的融合蛋白、权利要求3或4所述的核酸、权利要求5~7任一项所述的重组载体、权利要求8~10任一项所述的重组宿主和/或权利要求11所述制备方法制得的融合蛋白,在制备防治新型冠状病毒SARS-COV-2感染的疫苗中的应用。
13.一种疫苗,其特征在于,其包括:权利要求1或2所述的融合蛋白、权利要求3或4所述的核酸、权利要求5~7任一项所述的重组载体、权利要求8~10任一项所述的重组宿主和/或权利要求11所述制备方法制得的融合蛋白。
CN202110471959.3A 2021-04-29 2021-04-29 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用 Active CN112979829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110471959.3A CN112979829B (zh) 2021-04-29 2021-04-29 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110471959.3A CN112979829B (zh) 2021-04-29 2021-04-29 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用

Publications (2)

Publication Number Publication Date
CN112979829A CN112979829A (zh) 2021-06-18
CN112979829B true CN112979829B (zh) 2021-08-13

Family

ID=76336572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110471959.3A Active CN112979829B (zh) 2021-04-29 2021-04-29 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用

Country Status (1)

Country Link
CN (1) CN112979829B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113249408B (zh) * 2021-06-23 2021-11-02 深圳湾实验室 一种靶向激活体液免疫和细胞免疫的核酸疫苗载体构建及应用
CN113621076A (zh) * 2021-08-31 2021-11-09 南华大学 一种针对新冠病毒变异毒株Delta的融合蛋白、喷鼻式疫苗及其制备方法和应用
CN113755421B (zh) * 2021-09-28 2024-04-12 梦芊细胞因子有限公司 一种用于covid-19的口服性疫苗及抗体加强剂
CN114605506B (zh) * 2022-04-08 2024-05-07 湖南大学 冠状病毒m蛋白胞外域多肽及其应用
CN114807179B (zh) * 2022-06-01 2022-10-21 广州达博生物制品有限公司 一种新型冠状病毒肺炎疫苗的构建与应用
CN115779079A (zh) * 2022-10-01 2023-03-14 中国人民解放军军事科学院军事医学研究院 一种可增强与佐剂协同免疫效力的电荷调控型抗原蛋白
CN115975053A (zh) * 2022-12-07 2023-04-18 南开大学 靶向新型冠状病毒的疫苗
CN116574195B (zh) * 2023-07-07 2023-09-29 北京市疾病预防控制中心 一种新型冠状病毒抗体及其在无传播风险口腔液检测中的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111440244B (zh) * 2020-04-09 2021-03-16 诺未科技(北京)有限公司 靶向vegfr2的转移性癌疫苗
CN112266411B (zh) * 2020-09-25 2022-06-24 北京诺思兰德生物技术股份有限公司 一种新型冠状病毒疫苗及其应用

Also Published As

Publication number Publication date
CN112979829A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN112979829B (zh) 融合蛋白及其在制备靶向新冠病毒sars-cov-2的疫苗中的应用
AU2017297610B2 (en) Compositions and methods for alphavirus vaccination
JP2022024088A (ja) ヒトサイトメガロウイルスワクチン
JP2023116608A (ja) 水痘帯状疱疹ウイルス(vzv)のための核酸ワクチン
KR101255419B1 (ko) 인플루엔자 바이러스의 다중 아형에 대한 신규 백신
US20200237915A1 (en) Cytomegalovirus Vectors Eliciting T Cells Restricted By Major Histocompatibility Complex E Molecules
KR20180118244A (ko) 인플루엔자 핵산 분자 및 이로부터 생산된 백신
KR20210093862A (ko) 유전자 요법 벡터를 제작하기 위한 조성물 및 방법
US11672874B2 (en) Methods and compositions for genomic integration
KR102476552B1 (ko) 관용원성 dna 백신
WO2021042944A1 (zh) 肌肉靶向的微环dna基因治疗
KR20150127586A (ko) 인플루엔자 핵산 분자 및 이로부터 제조된 백신
WO2023227124A1 (zh) 一种构建mRNA体外转录模板的骨架
CN113151196A (zh) 重组痘苗病毒、痘苗病毒载体疫苗及其应用与制备方法
KR20220041144A (ko) 아프리카 돼지 열병 백신
JP7387623B2 (ja) 標的タンパク質を安定して発現できる組換えウイルス
CN112469732A (zh) 使用胰岛素样生长因子1-加密脱氧核糖核酸构建体及肝细胞生长因子-加密脱氧核糖核酸构建体的神经病变治疗
KR20220038755A (ko) 한타바이러스 항원성 조성물
CN114344456B (zh) 非洲猪瘟病毒多基因串联dna疫苗及应用
CN114134165B (zh) 一种新型hpv治疗性核酸疫苗
CN113302202A (zh) 利用表达胰岛素样生长因子1异构体的脱氧核糖核酸构建体的神经病变的治疗
CA2962100A1 (en) Virus-based expression vectors and uses thereof
WO2004096288A2 (es) Método para la obtencion de minicírculos replicativos de adn para transferencia génica o como inmunomoduladores.
CN116904489B (zh) 一种鸭坦布苏病毒核酸疫苗及应用
US20220257747A1 (en) Methods and compositions of astrovirus replicons

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Qi Hailong

Inventor after: Qu Chunfeng

Inventor after: Zhao Hong

Inventor after: Sun Zhongjie

Inventor after: Xie Huangfan

Inventor after: Liu Defang

Inventor after: Wang Xiaofang

Inventor after: Wang Xudong

Inventor after: Yao Yanling

Inventor before: Qi Hailong

Inventor before: Yao Yanling

Inventor before: Qu Chunfeng

Inventor before: Zhao Hong

Inventor before: Chen Ligong

Inventor before: Sun Zhongjie

Inventor before: Xie Huangfan

Inventor before: Liu Defang

Inventor before: Wang Xiaofang

Inventor before: Wang Xudong

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20240509

Address after: 214000 Office Building A169, No. 29 Chengnan Road, Xinwu District, Wuxi City, Jiangsu Province

Patentee after: Nuowei Biotechnology (Wuxi) Co.,Ltd.

Country or region after: China

Address before: Room 1002, Block A, Shiyun Haoting, 33 Guangqu Road, Chaoyang District, Beijing

Patentee before: NEWISH TECHNOLOGY (BEIJING) Co.,Ltd.

Country or region before: China