CN113470745A - SARS-CoV2潜在突变位点的筛选方法及其应用 - Google Patents

SARS-CoV2潜在突变位点的筛选方法及其应用 Download PDF

Info

Publication number
CN113470745A
CN113470745A CN202110978578.4A CN202110978578A CN113470745A CN 113470745 A CN113470745 A CN 113470745A CN 202110978578 A CN202110978578 A CN 202110978578A CN 113470745 A CN113470745 A CN 113470745A
Authority
CN
China
Prior art keywords
sars
mutation
cov2
screening
epitope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110978578.4A
Other languages
English (en)
Other versions
CN113470745B (zh
Inventor
张玉基
周秩建
王琼
王鹏
张用科
范文越
徐达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Liding Medical Technology Co Ltd
Original Assignee
Nanjing Liding Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Liding Medical Technology Co Ltd filed Critical Nanjing Liding Medical Technology Co Ltd
Priority to CN202110978578.4A priority Critical patent/CN113470745B/zh
Publication of CN113470745A publication Critical patent/CN113470745A/zh
Application granted granted Critical
Publication of CN113470745B publication Critical patent/CN113470745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6878Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids in eptitope analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20051Methods of production or purification of viral material
    • C12N2770/20052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20061Methods of inactivation or attenuation
    • C12N2770/20062Methods of inactivation or attenuation by genetic engineering
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/005Assays involving biological materials from specific organisms or of a specific nature from viruses
    • G01N2333/08RNA viruses
    • G01N2333/165Coronaviridae, e.g. avian infectious bronchitis virus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2469/00Immunoassays for the detection of microorganisms
    • G01N2469/20Detection of antibodies in sample from host which are directed against antigens from microorganisms

Abstract

本发明涉及生物信息学和生物医药技术领域,尤其是SARS‑CoV2潜在突变位点的筛选方法,包括:1)下载得到SARS‑CoV2的基因序列,对下载的序列进行快速注释文件和序列比对,从全基因组序列中提取出所有编码基因的序列;2)计算出每个位点的突变频率,筛选出高频率的突变热点,再结合毒株的采样时间和地理分布信息,筛选出在种群中具有显著选择优势的突变位点;3)下载已有的编码基因对应蛋白质的三级结构信息;4)根据预测的B细胞和T细胞表位,筛选位于免疫表位上或其附近的突变位点,评估其对宿主免疫反应的可能影响,鉴定出SARS‑CoV‑2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点。

Description

SARS-CoV2潜在突变位点的筛选方法及其应用
技术领域
本发明涉及生物信息学和生物医药技术领域,具体领域为一种SARS-CoV2潜在突变位点的筛选方法及其应用。
背景技术
冠状病毒在分类上属于套式病毒目(Nidovirales)、冠状病毒亚目(Cornidovirineae),冠状病毒科(Coronaviridae),是一种有包膜的单股正义不分节段的RNA病毒。冠状病毒颗粒是呈球状,直径大约为120 nm,基因组约26-32 kb,是已知基因组中最大的RNA病毒。冠状病毒根据系统发育分为四个属:α-CoV、β-CoV、γ-CoV和δ-CoV。新型冠状病毒(SARS-CoV-2)导致新型肺炎,常引起发热、咳嗽、呼吸困难、肌痛和疲劳等症状,对卫生和经济造成了巨大影响。新型冠状病毒主要通过唾液、飞沫、接触等传播,目前主要通过控制传染源,切断传播途径以及接种疫苗来进行有效防控。但新型冠状病毒变异速度很快,急需更加安全有效的疫苗问世,目前市面上很多疫苗对南非突变株不能产生很好的中和效果,由于变异速度很快而导致前期开发疫苗未能提前预测,从而导致疫苗的有效性和适用性严重不足,冠状病毒突变位点的预测分析及对应假病毒制备到中和试验评估疫苗的广谱性是非常必要的。
CN202010733451.1公开了一种病毒适应人类宿主的突变位点的预测方法及其应用,包括:1)将来自动物体的病毒基因组序列与人类miRNA数据库进行比对,利用miRanda算法找出病毒基因组上与人类miRNA互补的靶序列,且靶序列与相应miRNA杂交的最小自由能≤-25kcal/mol,形成靶序列集合I;2)将分离自人体的病毒变体基因组序列与人类miRNA数据库进行比对,利用miRanda算法找出病毒变体基因组上与人类miRNA互补的靶序列,且靶序列与相应miRNA杂交的最小自由能≤-25kcal/mol,形成靶序列集合II;3)从只存在于靶序列集合I而不存在于靶序列集合II中的差异靶序列中筛选得到病毒适应人类宿主的突变位点。
上述预测方法所用软件功能十分有限,它们不适合大规模数据集的突变分析。而且虽然上述预测算法可以输出核苷酸序列中的突变位点,但是无法鉴定引起氨基酸改变的非同义替换位点,更重要的是,其预测方法无法实现特定病毒的变异监测。
假病毒SARS-CoV2膜蛋白Spike参与到带有报告基因的缺损型病毒基因组的包装中,由于被包裹的核酸不具有复制形成病毒的全部核酸序列的能力,所以假病毒nCoV-S只有一轮的感染力,操作比较安全。该假病毒颗粒表面表达SARS-CoV-2的刺突蛋白(Spike蛋白),因此能与靶细胞过表达的ACE2结合,高度模拟SARS-CoV-2通过 Spike结合ACE2 对目的细胞的入侵过程。同时,假病毒携带便于检测的荧光素酶(LUC)报告基因,能够评估病毒感染水平。此系统经过优化的一步层析纯化工艺得到的高纯度假病毒,是研究SARS-CoV-2的得力工具。
假病毒体系有多种,主要包括以慢病毒载体构建的假病毒,以病毒蛋白自组装形成的假病毒,以及以病毒基因改造、插入报告基因所形成的假病毒。慢病毒载体是以是HIV1为基础发展起来的,包含了包装、转染、稳定整合所需要的遗传信息,可提供所有转录并包装到重组假病毒所需要的全部辅助蛋白,利用表达载体和包装质粒同时共转染细胞,在细胞中进行病毒包装,包装好的病毒颗粒分泌到细胞外培养基中。
发明内容
本发明的目的在于提供一种SARS-CoV2潜在突变位点的筛选方法。
本发明的另一目的是基于上述筛选方法得到的结果提供了SARS-CoV2突变株假病毒nCoV-S及其制备方法。
为实现上述目的,本发明提供如下技术方案:
一种SARS-CoV2潜在突变位点的筛选方法,包括以下步骤:
(1)在GISAID数据库中下载得到SARS-CoV2的基因序列,对下载的序列进行快速注释文件和序列比对,从全基因组序列中提取出所有编码基因的序列;
(2)计算出每个位点的突变频率,筛选出高频率的突变热点,再结合毒株的采样时间和地理分布信息,筛选出在种群中具有显著选择优势的突变位点;
(3)从PBD数据库下载已有的编码基因对应蛋白质的三级结构信息;
(4)根据预测的B细胞和T细胞表位,筛选位于免疫表位上或其附近的突变位点,评估其对宿主免疫反应的可能影响,从而鉴定出SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点。
其中,所述步骤(2)中,高频率的突变热点是指单突变频次>100,多突变频次>5。
其中,所述步骤(4)中,对于B细胞表位预测,调用IEDB中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位,使用默认阈值0.5;对于超过6 个但小于25个氨基酸的线性表位肽,再调用VaxiJen2.0在线服务器进行抗原评估,仅考虑使用VaxiJen预测得分超过0.5的表位肽;如果表位肽的长度超过25,则只考虑VaxiJen评分超过0.5的子片段序列。
对于T细胞表位预测,分别预测MHC-I和MHC-Ⅱ结合表位;
调用NetMHCpan4.1方法基于8个最常见的人类HLAI类等位基因,即HLA-A01:01,HLA-A02:01,HLA-A03:01,HLA-A11:01,HLA-A24:02,HLA-B07:02, HLA-B08:01, HLA-B40:01,预测MHC-I结合表位,并且只考虑了评分超过0.85且VaxiJen 得分超过0.5的表位;
MHC-Ⅱ的表位预测,基于常见的7个人类等位基因,即DRB103:01,DRB107:01,DRB115:01,DRB301:01,DRB302:02,DRB401:01和DRB5*01:01,以及IEDB推荐的2.22算法,表位肽的长度设置为15; MHC-Ⅱ的表位预测仅考虑adjusted rank 值低于1且VaxiJen评分超过0.5的结合表位。
一种SARS-CoV2突变株假病毒nCoV-S的制备方法,包括以下步骤:
(1)根据前述的筛选方法得到SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点,基于所述关键变异位点制备单点突变体或多点突变体;
(2)共转染;
(3)诱导表达假病毒颗粒。
本发明制备的SARS-CoV2突变株假病毒nCoV-S可用于研究病毒与宿主细胞的相互关系、鉴定病毒受体、测定中和抗体的效价及抗病毒药物筛选。
与现有技术相比,本发明的有益效果是:
(1)本发明的筛选方法适合大规模数据集的突变分析;可以鉴定引起氨基酸改变的非同义替换位点;能揭示病毒基因组的差异。更重要的是,可以实现特定病毒的变异监测。
(2)通过本发明方法制备的假病毒包装效率得到显著提高,稳定性好,可以长时间保存,纯度高,含有高纯度的RNA而不含有DNA,适合大规模的生产和应用。
(3)通过本发明筛选方法得到的结果,进一步制备得到的SARS-CoV-2假病毒系统的假病毒nCoV-S是复制缺陷型,只能感染一次靶细胞,缺乏复制能力,不能产生子代病毒,避免了继发感染的危险。基于此假病毒进行研究的过程中,准确评价病毒感染后体内中和抗体反应不仅对确诊具有重要价值,而且对研究免疫保护相关性也有较为重要的价值。
附图说明
图1为实施例2的PCR产物鉴定结果;
图2为实施例2的测序对比结果;
图3为实施例3单点突变体SARS2-S-D614G的PCR产物鉴定结果;
图4为实施例3单点突变体SARS2-S-D614G的测序对比结果;
图5为实施例3 多点突变体SARS2-S-D614G+D1084Y的PCR产物鉴定结果;
图6为实施例3多点突变体SARS2-S-D614G+D1084Y的测序对比结果;
图7为假病毒包装过程示意图;
图8为实施例4的假病毒感染试验荧光素酶活性值结果;
图9为实施例4的假病毒中和抗体检测的荧光素酶活性值结果;
图10为科兴疫苗免疫后18例样本的中和抗体的测试评估结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1 SARS-CoV2潜在突变位点的筛选方法
(1)对于特定的一种新型冠状病毒SARS-CoV2,新冠全基因组测序数据上传在GISAID数据库 (https://www.gisaid.org/),可从GISAID数据库免费下载。用BioAide软件对下载序列进行快速注释文件和序列比对,从全基因组序列中提取出所有编码基因的序列。
序列比对:先将未对齐的病毒全基因组序列直接拖拽到输入框,或者通过文件按钮加载文件路径;
然后选择序列类型为核苷酸(Nucleotide),输出格式为fasta格式,并选择比对策略为自动模式(auto);
最后根据电脑的配置,选择使用的线程数量,再点击运行(Start)按钮,完成病毒序列集全基因组的比对。
提取出的编码基因的序列如SEQ ID NO:1-54所示:
NSP1:atggagagcc,acccgtgaactcatgcgtgagcttaacggaggg
NSP2:gcatacactcgctatgtcgataacaacttctgtggccctgatgg,aatatgatggtaacaaacaataccttcacactcaaaggcggt
NSP3:gcaccaacaaaggttacttttggtgatgacactgtgatagaagtgcaaggttacaagagtgt,actagacaagttgttaatgttgtaacaacaaagatagcacttaagggtggt
NSP4:aaaattgttaataattggttgaagcagttaattaaagttacac,accaccacaaacctctatcacctcagctgttttgcag
NSP5:agtggttttagaaaaatggcattcccatctggtaaagt,atgttgttagacaatgctcaggtgttactttccaa
NSP6:agtgcagtgaaaagaacaatcaagggtacacacca,gtggcaaaccttgtatcaaagtagccactgtacag
NSP7:tctaaaatgtcagatgtaaagtgcacatca,aagaaatgctggacaacagggcaaccttacaa
NSP8:gctatagcctcagagtttagttcccttccatcata,cagctttaagggccaattctgctgtcaaattacag
NSP9:aataatgagcttagtcctgttgcactacgacagat,tacttggtagtttagctgccacagtacgtctacaa
NSP10:gctggtaatgcaacagaagtgcctgccaattcaactgt,tgtagttgtgatcaactccgcgaacccatgcttcag
NSP12:tcagctgatgcacaatcgtttttaaacgggt,atgaggctatgtacacaccgcatacagtcttacag
NSP13:gctgttggggcttgtgttctttgcaattcacagactt,aagtcttgaaattccacgtaggaatgtggcaactttacaa
NSP14:gctgaaaatgtaacaggactctttaaagattgtagtaagg,cttataacctctggaacacttttacaagacttcag
NSP15:agtttagaaaatgtggcttttaatgttgtaaataa,atggccatgtagaaacattttacccaaaattacaa
NSP16:tctagtcaagcgtggcaaccgggtgttgctatgcc,cagagttgttatttctagtgatgttcttgttaacaac
S:atgtttgtttttcttgttttattgccactagtctctagt,gccagtgctcaaaggagtcaaattacattacacataa
ORF3a:atggatttgtttatgagaatcttcacaattggaactgtaa,tgaaccgacgacgactactagcgtgcctttgtaa
E:atgtactcattcgtttcggaagagacaggtacgttaa,atctgaattcttctagagttcctgatcttctggtctaa
M:atggcagattccaacggtactattaccgttgaaga,gaccattccagtagcagtgacaatattgctttgcttgtacagtaa
ORF6:atgtttcatctcgttgactttcaggttactatagcagaga,attctcaattagatgaagagcaaccaatggagattgattaa
ORF7a:atgaaaattattcttttcttggcactgataacactcgctac,cactttgcttcacactcaaaagaaagacagaatga
ORF7b:atgattgaactttcattaattgacttctatttgtg,gcaagatcataatgaaacttgtcacgcctaa
ORF8:atgaaatttcttgttttcttaggaatcatcacaactg,tcatgacgttcgtgttgttttagatttcatctaa
N:atgtctgataatggaccccaaaatcagcgaaatgcaccc,caatccatgagcagtgctgactcaactcaggcctaa
ORF9b:atggaccccaaaatcagcgaaatgcaccccgcattacgttt,cgaagagctaccagacgaattcgtggtggtgacggtaaaatga
ORF9c:atgctgcaatcgtgctacaacttcctcaaggaacaac,gctgctcttgctttgctgctgcttgacagattga
ORF10:atgggctatataaacgttttcgcttttccgttt,cacaagtagatgtagttaactttaatctcacatag
(2)通过软件先计算出每个位点的突变频率(突变频率:所有样本中突变点出现的个数。规定:单突变频次>100,多突变频次>5),筛选出高频率的突变热点,再结合毒株的采样时间和地理分布信息,筛选出在种群中具有显著选择优势的突变位点。
先查看alignment文件是否符合密码子比对原则,再剔除相对于Wuhan/Hu-1的插入位点,保证同一基因的不同alignment文件的长度统一,再对alignment文件进行合并。
使用BioAider软件进行突变分析,参数设置,选择数据类型为“Codon”,突变频率分组为下表1:
表1
Figure 767967DEST_PATH_IMAGE001
结果如下表2:
表2 各编码基因整体变异情况
Figure 709247DEST_PATH_IMAGE002
(3)从PBD数据库(https://www1.rcsb.org/)下载已有的编码基因对应蛋白质的三级结构信息。
(4)根据预测的B细胞和T细胞表位,筛选位于免疫表位上或其附近的突变位点,评估其对宿主免疫反应的可能影响,如引起免疫逃避或增强宿主免疫反应,从而鉴定出SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点,如表3所示。
高频率突变位点在免疫表位上的定位:根据IEDB数据库(http://www.iedb.org/)里提供的B细胞和T细胞免疫表位信息,将鉴定出的频率突变位点与数据库中的信息进行比较,筛选出位于免疫表位上的突变位点。
对于B细胞表位预测,调用IEDB(http://www.iedb.org/)中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位,使用默认阈值0.5。对于超过6 个但小于25个氨基酸的线性表位肽,再调用VaxiJen2.0在线服务器进行抗原评估,仅考虑使用VaxiJen预测得分超过0.5的表位肽。如果表位肽的长度超过25,则只考虑VaxiJen评分超过0.5的子片段序列。
对于T细胞表位预测,分别预测MHC-I(CD8 T细胞)和MHC-Ⅱ(CD4 T细胞)结合表位。调用NetMHCpan4.1方法基于8个最常见的人类HLAI类等位基因(HLA-A01:01,HLA-A02:01,HLA-A03:01,HLA-A11:01,HLA-A24:02,HLA-B07:02, HLA-B08:01, HLA-B40:01)预测MHC-I结合表位,并且只考虑了评分超过0.85且VaxiJen 得分超过0.5的表位。MHC-Ⅱ的表位预测,基于常见的7个人类等位基因(包括DRB103:01,DRB107:01,DRB115:01,DRB301:01,DRB302:02,DRB401:01和DRB5*01:01)和IEDB推荐的2.22算法,表位肽的长度设置为15。类似地,MHC-Ⅱ的表位预测仅考虑adjusted rank 值低于1且VaxiJen评分超过0.5的结合表位。
表3
Figure 446259DEST_PATH_IMAGE003
实施例2 单点突变实例:S-S477N
试验材料:pcDNA3.1-SARS2-S-HA(稀释至10 ng/µL),KOD高保真酶KOD –Plus-Neo(Code:KOD-401),Dpni酶(NEB R0176S)
引物设计:
表4
Figure 969644DEST_PATH_IMAGE004
点突变引物设计原则:
1.突变体引物长度35-40bp。以要突变的氨基酸为中心,正反引物有15-20bp的重叠区域。
2.突变体引物的GC含量40-60%之间,特别是3’端。
PCR扩增体系如表5所示:
表5
Figure 337172DEST_PATH_IMAGE005
混匀后轻微离心。
PCR扩增程序如表6所示:
表6
Figure 578797DEST_PATH_IMAGE006
PCR产物鉴定:
配制1%的琼脂糖胶,点5µL PCR产物进行观察。DNA marker 5000,目的条带大小约9kb。结果:条带大小符合(如图1)。
Dpni酶消化:鉴定结果SARS2-S-S477N-F-1和平行SARS2-S-S477N-F-2都有条带,选取SARS2-S-S477N-F-1,将PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h,去除模板(消化甲基化的模板质粒)。
转化:取10 µL消化后的产物加入到50 µL Top10感受态细胞中,进行转化操作。(氨苄抗性的板子)。长出菌落,无需做菌落PCR,每个突变板子挑6个单菌落置于2 mL EP管中(400µL含氨苄的LB培养基),小摇浑浊后送擎科生物技术公司测序。
根据突变位点,先选择离突变位点最近的W1F0825-P099-H05引物进行测序,测序突变成功,再进行全序列测通,结果显示SARS2-S-S477N成功突变。
测序对比结果如图2所示。
表7
Figure 853921DEST_PATH_IMAGE007
挑菌提取质粒:序列测通完全正确的质粒,将其菌液大摇提取无内毒素的质粒,用于后续假病毒的包装(质粒总量>200µg,浓度>500ng/µL)。提取试剂盒为Omega。
实施例3 多点突变实例:SARS2-S-D614G+D1084Y
先做单点突变体SARS2-S-D614G;再此基础上累加突变位点D1084Y。
试验材料:pcDNA3.1-SARS2-S-HA(稀释至10 ng/µL),KOD高保真酶KOD –Plus-Neo (Code:KOD-401),Dpni酶(NEB R0176S)
引物设计:
表8
Figure 185807DEST_PATH_IMAGE008
PCR扩增体系如表9所示:
表9
Figure 520974DEST_PATH_IMAGE009
混匀后轻微离心。
PCR扩增程序如表10所示:
表10
Figure 249895DEST_PATH_IMAGE010
PCR产物鉴定:
配制0.8%的琼脂糖胶,点5µL PCR产物进行观察。DNA marker 5000,目的条带大小约9kb。结果如图3。
Dpni酶消化:鉴定结果SARS2-S-D614G-1有条带,则将PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h,去除模板(消化甲基化的模板质粒)。转化:取10 µL消化后的产物加入到50 µL Top10感受态细胞中,进行转化操作(氨苄抗性的板子)。长出菌落,无需做菌落PCR,每个突变板子挑3-6个单菌落置于2 mL EP管中(400µL含氨苄的LB培养基),小摇浑浊后送擎科测序。
根据突变位点,先选择离突变位点最近的引物CMV-F进行测序,测序成功,后再进行全序列测通,结果显示突变成功。
表11
Figure 266393DEST_PATH_IMAGE011
挑菌提取质粒:序列测通完全正确的质粒,将其菌液大摇提取无内毒素的质粒,以此为模板继续累加突变位点。
测序对比结果如图4所示。
试验材料:pcDNA3.1-SARS2-S--D614G-HA(稀释至10 ng/µL),KOD高保真酶KOD –Plus- Neo(Code:KOD-401),Dpni酶(NEB R0176S)
引物设计:
表12
Figure 764370DEST_PATH_IMAGE012
点突变引物设计原则:
1.突变体引物长度35-40bp。以要突变的氨基酸为中心,正反引物有15-20bp的重叠区域。
2.突变体引物的GC含量40-60%之间,特别是3’端。
PCR扩增体系如表13所示:
表13
Figure 536017DEST_PATH_IMAGE013
混匀后轻微离心。
PCR扩增程序如表14所示:
表14
Figure 673606DEST_PATH_IMAGE014
PCR产物鉴定
配制0.8%的琼脂糖胶,用5µL PCR产物进行观察。DNA marker 15000,目的条带大小约9kb。结果如图5。
Dpni酶消化:鉴定结果SARS2-S-D614G+D1084Y-1和SARS2-S-D614G+D1084Y-2都有条带,则将SARS2-S-D614G+D1084Y-1 PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h,去除模板(消化甲基化的模板质粒)。转化:取10 µL消化后的产物加入到50 µLTop10感受态细胞中,进行转化操作(氨苄抗性的板子)。长出菌落,无需做菌P,每个突变板子挑3个单菌落置于2 mL EP管中(400µL含氨苄的LB培养基),小摇浑浊后送擎科测序。
根据突变位点,先选择离突变位点最近的引物BGH进行测序,测序突变成功后,进行序列测通。
表15
Figure 556112DEST_PATH_IMAGE015
测序结果如图6所示。
挑菌提取质粒:序列测通完全正确的质粒,将其菌液大摇提取无内毒素的质粒,用于后续假病毒的包装(质粒总量>200µg,浓度>500ng/µL)。提取试剂盒为Omega。
在其他有益实施例中,可以依据实施例1的筛选结果,选择其中任意的突变位点,并按照实施例2或实施例3的方法得到单点突变体或者多点突变体。虽然制备的突变体略有不同,但实验方法步骤基本一致,唯一需要注意将退火温度控制在55℃-68℃即可。
实施例4
采用实施例2-3的方法,制备单点突变体和多点突变体:SARA-CoV2-D164G;SARA-CoV2-D164G+A222V;SARA-CoV2-D164G+S477N;SARA-CoV2-D164G+N501Y;SARA-CoV2-D164G+S673T;SARA-CoV2-D164G+Q677H;SARA-CoV2-D164G+P479S+F1121L;SARA-CoV2-D164G+S225F+K1073N;SARA-CoV2-D164G+A522S+E780Q;SARA-CoV2-D164G+S477N+L822F+T632N。
一、假病毒nCoV-S的制备
1、共转染
将前述方法制备的质粒,采用阳离子脂质体法转染。转染时所用质粒的重量比为:包装质粒pNL-HIV-Luc :重组质粒pc DNA3.1-S为1:1-1:4
按照所用质粒的总重量:转染试剂Lipofectamine3000为1μg:1.5μl,共转染293T细胞。
2、收取假病毒nCoV-S
培养宿主293T细胞48h,离心收集上清(离心条件为:4℃、 8000g、10min),使用无菌0.45μm滤器过滤上清,即得nCoV-S假病毒上清液。假病毒包装过程见图7。使用病毒浓缩试剂(病毒浓缩试剂的配制如下:取NaCl 8.766g、PEG8000 50g溶解在200ml Milli-Q纯水中),按假病毒上清液:病毒浓缩试剂的体积比4:1混合,4℃过夜;然后离心(离心条件为:4℃,7000g,30min)弃上清,按病毒上清液原体积的1/100~1/50加入DMEM重悬,获得浓缩后的病毒液,分装后于-70℃保存。
二、假病毒nCoV-S的鉴定
1.假病毒感染试验
(1)复苏HeLa-ACE2稳定细胞,传细胞于96孔板。细胞数1.5-2×104
(2)18-24h后,细胞密度70%左右进行假病毒感染实验。
(3)吸出原有培养基,用PBS洗细胞两次。
(4)选取包装好的假病毒(SARA-CoV2;SARA-CoV2-D164G;SARA-CoV2-D164G+A222V;SARA-CoV2-D164G+S477N;SARA-CoV2-D164G+N501Y;SARA-CoV2-D164G+S673T;SARA-CoV2-D164G+Q677H;SARA-CoV2-D164G+P479S+F1121L;SARA-CoV2-D164G+S225F+K1073N;SARA-CoV2-D164G+A522S+E780Q;SARA-CoV2-D164G+S477N+L822F+T632N)100 µL的假病毒,感染8 h后吸出假病毒上清,换10% FBS的细胞培养基。
(5)荧光素酶裂解液裂解细胞。假病毒感染48 h后,96孔板每孔用PBS洗两遍,加入50 µL1× cell lysis buffer 裂解细胞,置于摇床上快速裂解15 min。(若暂时不测,可直接加入cell lysis buffer后置于-80度保存)
(6)测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀,于酶标仪上设置10 s读值。
结果如图8所示。
2. 假病毒中和抗体检测
(1)从10倍开始连续三倍稀释血清,将稀释好的抗体加入96孔板的各孔中。
(2)加入100 µL的假病毒,37℃培养1 h。
(3)用含有10 % FBS的细胞培养基将Hela细胞稀释至密度为2×105 /mL。
(4)每孔加入稀释好的Hela细胞100 µL。
(5)荧光素酶裂解液裂解细胞。假病毒感染72 h后,96孔板每孔用PBS洗三遍,加入50 µL 1×cell lysis buffer 裂解细胞,置于摇床上快速裂解15 min。(若暂时不测,可直接加入cell lysis buffer后置于-80 ℃保存)
(6)测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀,于酶标仪上设置10 s读值。结果如图9所示。
本发明用HIV慢病毒载体包装新型冠状病毒,假病毒nCoV-S侵染细胞后Luciferase发光值达106RLU,可以满足抗体或血清的中和检测筛选,结果准确可靠。
实施例5
本发明制备的假病毒nCoV-S在进行SARS-CoV-2疫苗研发时,可用于判断疫苗是否具有免疫效果,免疫机体后能否产生足够的中和抗体。
以下是对科兴疫苗免疫后18例样本进行的中和抗体的测试评估。
将(第二次免疫后13天)志愿者的血液样本采集至肝素采血管,混合均匀,每管约5ml;样本处理:在天平上称重确定样品体积,1 g = 1 ml。样品配平后,4度,5000 rpm离心20min。取上层血清样,同一志愿者编号的血清混合至15 ml离心管中,4度,5000 rpm,离心10min。血清编号、分装、冻存。
(1)将血清按(10、100、200、400、800、1600、3200、6400)倍稀释血清,将稀释好的抗体加入96孔板的各孔中。
(2)加入100 µL的假病毒,37℃培养1 h。
(3)用含有10 % FBS的细胞培养基将Hela细胞稀释至密度为2×105 /mL。
(4)每孔加入稀释好的Hela细胞100 µL。
(5)荧光素酶裂解液裂解细胞。假病毒感染72 h后,96孔板每孔用PBS洗三遍,加入50 µL 1×cell lysis buffer 裂解细胞,置于摇床上快速裂解15 min。(若暂时不测,可直接加入cell lysis buffer后置于-80 ℃保存)
(6)测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀,于酶标仪上设置10 s读值。测出结果如图10所示:其中18例阳性样本均有中和抗体产生。且与Genscript测试结果相吻合。
对于SARS-CoV-2而言,存在操作危险性高、周期长、实验条件要求比较苛刻和对实验室要求严格等难题。而本发明SARS-CoV-2假病毒系统的假病毒nCoV-S是复制缺陷型,只能感染一次靶细胞,缺乏复制能力,不能产生子代病毒,避免了继发感染的危险。在对病毒进行研究的过程中,准确评价病毒感染后体内中和抗体反应不仅对确诊具有重要价值,而且对研究免疫保护相关性较为重要。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
序列表
<110> 南京立顶医疗科技有限公司
<120> SARS-CoV2潜在突变位点的筛选方法及其应用
<160> 60
<170> SIPOSequenceListing 1.0
<210> 1
<211> 10
<212> DNA
<213> NSP1-1(Artificial Sequence)
<400> 1
atggagagcc 10
<210> 2
<211> 33
<212> DNA
<213> NSP1-2(Artificial Sequence)
<400> 2
acccgtgaac tcatgcgtga gcttaacgga ggg 33
<210> 3
<211> 44
<212> DNA
<213> NSP2-1(Artificial Sequence)
<400> 3
gcatacactc gctatgtcga taacaacttc tgtggccctg atgg 44
<210> 4
<211> 42
<212> DNA
<213> NSP2-2(Artificial Sequence)
<400> 4
aatatgatgg taacaaacaa taccttcaca ctcaaaggcg gt 42
<210> 5
<211> 62
<212> DNA
<213> NSP3-1(Artificial Sequence)
<400> 5
gcaccaacaa aggttacttt tggtgatgac actgtgatag aagtgcaagg ttacaagagt 60
gt 62
<210> 6
<211> 51
<212> DNA
<213> NSP3-2(Artificial Sequence)
<400> 6
actagacaag ttgttaatgt tgtaacaaca aagatagcac ttaagggtgg t 51
<210> 7
<211> 43
<212> DNA
<213> NSP4-1(Artificial Sequence)
<400> 7
aaaattgtta ataattggtt gaagcagtta attaaagtta cac 43
<210> 8
<211> 37
<212> DNA
<213> NSP4-2(Artificial Sequence)
<400> 8
accaccacaa acctctatca cctcagctgt tttgcag 37
<210> 9
<211> 38
<212> DNA
<213> NSP5-1(Artificial Sequence)
<400> 9
agtggtttta gaaaaatggc attcccatct ggtaaagt 38
<210> 10
<211> 35
<212> DNA
<213> NSP5-2(Artificial Sequence)
<400> 10
atgttgttag acaatgctca ggtgttactt tccaa 35
<210> 11
<211> 35
<212> DNA
<213> NSP6-1(Artificial Sequence)
<400> 11
agtgcagtga aaagaacaat caagggtaca cacca 35
<210> 12
<211> 35
<212> DNA
<213> NSP6-2(Artificial Sequence)
<400> 12
gtggcaaacc ttgtatcaaa gtagccactg tacag 35
<210> 13
<211> 30
<212> DNA
<213> NSP7-1(Artificial Sequence)
<400> 13
tctaaaatgt cagatgtaaa gtgcacatca 30
<210> 14
<211> 32
<212> DNA
<213> NSP7-2(Artificial Sequence)
<400> 14
aagaaatgct ggacaacagg gcaaccttac aa 32
<210> 15
<211> 35
<212> DNA
<213> NSP8-1(Artificial Sequence)
<400> 15
gctatagcct cagagtttag ttcccttcca tcata 35
<210> 16
<211> 35
<212> DNA
<213> NSP8-2(Artificial Sequence)
<400> 16
cagctttaag ggccaattct gctgtcaaat tacag 35
<210> 17
<211> 35
<212> DNA
<213> NSP9-1(Artificial Sequence)
<400> 17
aataatgagc ttagtcctgt tgcactacga cagat 35
<210> 18
<211> 35
<212> DNA
<213> NSP9-2(Artificial Sequence)
<400> 18
tacttggtag tttagctgcc acagtacgtc tacaa 35
<210> 19
<211> 38
<212> DNA
<213> NSP10-1(Artificial Sequence)
<400> 19
gctggtaatg caacagaagt gcctgccaat tcaactgt 38
<210> 20
<211> 36
<212> DNA
<213> NSP10-2(Artificial Sequence)
<400> 20
tgtagttgtg atcaactccg cgaacccatg cttcag 36
<210> 21
<211> 31
<212> DNA
<213> NSP12-1(Artificial Sequence)
<400> 21
tcagctgatg cacaatcgtt tttaaacggg t 31
<210> 22
<211> 35
<212> DNA
<213> NSP12-2(Artificial Sequence)
<400> 22
atgaggctat gtacacaccg catacagtct tacag 35
<210> 23
<211> 37
<212> DNA
<213> NSP13-1(Artificial Sequence)
<400> 23
gctgttgggg cttgtgttct ttgcaattca cagactt 37
<210> 24
<211> 40
<212> DNA
<213> NSP13-2(Artificial Sequence)
<400> 24
aagtcttgaa attccacgta ggaatgtggc aactttacaa 40
<210> 25
<211> 40
<212> DNA
<213> NSP14-1(Artificial Sequence)
<400> 25
gctgaaaatg taacaggact ctttaaagat tgtagtaagg 40
<210> 26
<211> 35
<212> DNA
<213> NSP14-2(Artificial Sequence)
<400> 26
cttataacct ctggaacact tttacaagac ttcag 35
<210> 27
<211> 35
<212> DNA
<213> NSP15-1(Artificial Sequence)
<400> 27
agtttagaaa atgtggcttt taatgttgta aataa 35
<210> 28
<211> 35
<212> DNA
<213> NSP15-2(Artificial Sequence)
<400> 28
atggccatgt agaaacattt tacccaaaat tacaa 35
<210> 29
<211> 35
<212> DNA
<213> NSP16-1(Artificial Sequence)
<400> 29
tctagtcaag cgtggcaacc gggtgttgct atgcc 35
<210> 30
<211> 37
<212> DNA
<213> NSP16-2(Artificial Sequence)
<400> 30
cagagttgtt atttctagtg atgttcttgt taacaac 37
<210> 31
<211> 39
<212> DNA
<213> S-1(Artificial Sequence)
<400> 31
atgtttgttt ttcttgtttt attgccacta gtctctagt 39
<210> 32
<211> 37
<212> DNA
<213> S-2(Artificial Sequence)
<400> 32
gccagtgctc aaaggagtca aattacatta cacataa 37
<210> 33
<211> 40
<212> DNA
<213> ORF3a-1(Artificial Sequence)
<400> 33
atggatttgt ttatgagaat cttcacaatt ggaactgtaa 40
<210> 34
<211> 34
<212> DNA
<213> ORF3a-2(Artificial Sequence)
<400> 34
tgaaccgacg acgactacta gcgtgccttt gtaa 34
<210> 35
<211> 37
<212> DNA
<213> E-1(Artificial Sequence)
<400> 35
atgtactcat tcgtttcgga agagacaggt acgttaa 37
<210> 36
<211> 38
<212> DNA
<213> E-2(Artificial Sequence)
<400> 36
atctgaattc ttctagagtt cctgatcttc tggtctaa 38
<210> 37
<211> 35
<212> DNA
<213> M-1(Artificial Sequence)
<400> 37
atggcagatt ccaacggtac tattaccgtt gaaga 35
<210> 38
<211> 45
<212> DNA
<213> M-2(Artificial Sequence)
<400> 38
gaccattcca gtagcagtga caatattgct ttgcttgtac agtaa 45
<210> 39
<211> 40
<212> DNA
<213> ORF6-1(Artificial Sequence)
<400> 39
atgtttcatc tcgttgactt tcaggttact atagcagaga 40
<210> 40
<211> 41
<212> DNA
<213> ORF6-2(Artificial Sequence)
<400> 40
attctcaatt agatgaagag caaccaatgg agattgatta a 41
<210> 41
<211> 41
<212> DNA
<213> ORF7a-1(Artificial Sequence)
<400> 41
atgaaaatta ttcttttctt ggcactgata acactcgcta c 41
<210> 42
<211> 35
<212> DNA
<213> ORF7a-2(Artificial Sequence)
<400> 42
cactttgctt cacactcaaa agaaagacag aatga 35
<210> 43
<211> 35
<212> DNA
<213> ORF7b-1(Artificial Sequence)
<400> 43
atgattgaac tttcattaat tgacttctat ttgtg 35
<210> 44
<211> 31
<212> DNA
<213> ORF7b-2(Artificial Sequence)
<400> 44
gcaagatcat aatgaaactt gtcacgccta a 31
<210> 45
<211> 37
<212> DNA
<213> ORF8-1(Artificial Sequence)
<400> 45
atgaaatttc ttgttttctt aggaatcatc acaactg 37
<210> 46
<211> 34
<212> DNA
<213> ORF8-2(Artificial Sequence)
<400> 46
tcatgacgtt cgtgttgttt tagatttcat ctaa 34
<210> 47
<211> 39
<212> DNA
<213> N-1(Artificial Sequence)
<400> 47
atgtctgata atggacccca aaatcagcga aatgcaccc 39
<210> 48
<211> 36
<212> DNA
<213> N-2(Artificial Sequence)
<400> 48
caatccatga gcagtgctga ctcaactcag gcctaa 36
<210> 49
<211> 41
<212> DNA
<213> ORF9b-1(Artificial Sequence)
<400> 49
atggacccca aaatcagcga aatgcacccc gcattacgtt t 41
<210> 50
<211> 43
<212> DNA
<213> ORF9b-2(Artificial Sequence)
<400> 50
cgaagagcta ccagacgaat tcgtggtggt gacggtaaaa tga 43
<210> 51
<211> 37
<212> DNA
<213> ORF9c-1(Artificial Sequence)
<400> 51
atgctgcaat cgtgctacaa cttcctcaag gaacaac 37
<210> 52
<211> 34
<212> DNA
<213> ORF9c-2(Artificial Sequence)
<400> 52
gctgctcttg ctttgctgct gcttgacaga ttga 34
<210> 53
<211> 33
<212> DNA
<213> ORF10-1(Artificial Sequence)
<400> 53
atgggctata taaacgtttt cgcttttccg ttt 33
<210> 54
<211> 35
<212> DNA
<213> ORF10-2(Artificial Sequence)
<400> 54
cacaagtaga tgtagttaac tttaatctca catag 35
<210> 55
<211> 44
<212> DNA
<213> SARS2-S-S477N-F(Artificial Sequence)
<400> 55
accaggccgg gaacaccccc tgtaatggag tggagggttt caac 44
<210> 56
<211> 43
<212> DNA
<213> SARS2-S-S477N-R(Artificial Sequence)
<400> 56
attacagggg gtgttcccgg cctggtagat ctctgtggag ata 43
<210> 57
<211> 33
<212> DNA
<213> SARS2-S-D614G-F(Artificial Sequence)
<400> 57
gtgctgtatc agggcgtgaa ctgcacagag gtg 33
<210> 58
<211> 36
<212> DNA
<213> SARS2-S-D614G-R(Artificial Sequence)
<400> 58
cagttcacgc cctgatacag cacagccacc tggttg 36
<210> 59
<211> 36
<212> DNA
<213> SARS2-S-D614G+D1084Y-F(Artificial Sequence)
<400> 59
atctgtcact acggaaaggc acacttccca agagag 36
<210> 60
<211> 37
<212> DNA
<213> SARS2-S-D614G+D1084Y-R(Artificial Sequence)
<400> 60
ctttccgtag tgacagatgg cgggtgcagt ggtgaag 37

Claims (7)

1.一种SARS-CoV2潜在突变位点的筛选方法,其特征在于,包括以下步骤:
(1)在GISAID数据库中下载得到SARS-CoV2的基因序列,对下载的序列进行快速注释文件和序列比对,从全基因组序列中提取出所有编码基因的序列;
(2)计算出每个位点的突变频率,筛选出高频率的突变热点,再结合毒株的采样时间和地理分布信息,筛选出在种群中具有显著选择优势的突变位点;
(3)从PBD数据库下载已有的编码基因对应蛋白质的三级结构信息;
(4)根据预测的B细胞和T细胞表位,筛选位于免疫表位上或其附近的突变位点,评估其对宿主免疫反应的可能影响,从而鉴定出SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点。
2.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法,其特征在于:所述步骤(2)中,高频率的突变热点是指单突变频次>100,多突变频次>5。
3.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法,其特征在于:所述步骤(4)中,对于B细胞表位预测,调用IEDB中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位,使用默认阈值>0.5;对于超过6个但小于25个氨基酸的线性表位肽,再调用VaxiJen2.0在线服务器进行抗原评估,仅考虑使用VaxiJen预测得分超过0.5的表位肽;如果表位肽的长度超过25,则只考虑VaxiJen评分超过0.5的子片段序列。
4.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法,其特征在于:所述步骤(4)中,对于T细胞表位预测,分别预测MHC-I和MHC-Ⅱ结合表位;
调用NetMHCpan4.1方法基于8个最常见的人类HLAI类等位基因,即HLA-A01:01,HLA-A02:01,HLA-A03:01,HLA-A11:01,HLA-A24:02,HLA-B07:02, HLA-B08:01, HLA-B40:01,预测MHC-I结合表位,并且只考虑了评分超过0.85且VaxiJen 得分超过0.5的表位;
MHC-Ⅱ的表位预测,基于常见的7个人类等位基因,即DRB103:01,DRB107:01,DRB115:01,DRB301:01,DRB302:02,DRB401:01和DRB5*01:01,以及IEDB推荐的2.22算法,表位肽的长度设置为15; MHC-Ⅱ的表位预测仅考虑adjusted rank 值低于1且VaxiJen评分超过0.5的结合表位。
5.一种SARS-CoV2突变株假病毒nCoV-S的制备方法,其特征在于,包括以下步骤:
(1)根据权利要求1-4任一所述的筛选方法得到SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点,基于所述关键变异位点制备单点突变体或多点突变体;
(2)共转染;
(3)诱导表达假病毒颗粒。
6.根据权利要求5所述制备方法制得的SARS-CoV2突变株假病毒nCoV-S。
7.权利要求6所述的SARS-CoV2突变株假病毒nCoV-S在研究病毒与宿主细胞的相互关系、鉴定病毒受体、测定中和抗体的效价及抗病毒药物筛选中的应用。
CN202110978578.4A 2021-08-25 2021-08-25 SARS-CoV-2潜在突变位点的筛选方法及其应用 Active CN113470745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110978578.4A CN113470745B (zh) 2021-08-25 2021-08-25 SARS-CoV-2潜在突变位点的筛选方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110978578.4A CN113470745B (zh) 2021-08-25 2021-08-25 SARS-CoV-2潜在突变位点的筛选方法及其应用

Publications (2)

Publication Number Publication Date
CN113470745A true CN113470745A (zh) 2021-10-01
CN113470745B CN113470745B (zh) 2023-09-08

Family

ID=77867206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110978578.4A Active CN113470745B (zh) 2021-08-25 2021-08-25 SARS-CoV-2潜在突变位点的筛选方法及其应用

Country Status (1)

Country Link
CN (1) CN113470745B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113981152A (zh) * 2021-12-28 2022-01-28 深圳联合医学科技有限公司 检测SARS-CoV-2变异株的组合物、试剂盒、方法及其用途
CN114464246A (zh) * 2022-01-19 2022-05-10 华中科技大学同济医学院附属协和医院 基于CovMutt框架检测与遗传性增加相关的突变的方法
CN115798578A (zh) * 2022-12-06 2023-03-14 中国人民解放军军事科学院军事医学研究院 一种分析与检测病毒新流行变异株的装置及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2454766A1 (en) * 2001-08-03 2003-02-20 University Of Wales College Of Medicine A screening method for variations in human myh associated with a predisposition towards colorectal cancer
WO2008151031A1 (en) * 2007-05-30 2008-12-11 The Trustees Of Columbia University In The City Of New York Detecting mutated gene sequences by mutant-enriched sequencing
CN109584966A (zh) * 2019-01-08 2019-04-05 杭州纽安津生物科技有限公司 一种肿瘤通用疫苗的设计方法及其在胰腺癌的应用
CN111663009A (zh) * 2020-05-27 2020-09-15 中国科学院北京基因组研究所(国家生物信息中心) 病毒适应人类宿主的突变位点的预测方法及其应用
CN112397144A (zh) * 2020-10-29 2021-02-23 无锡臻和生物科技有限公司 检测基因突变及表达量的方法及装置
WO2021160850A1 (en) * 2020-02-13 2021-08-19 Institut Pasteur Measles-vectored covid-19 immunogenic compositions and vaccines

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2454766A1 (en) * 2001-08-03 2003-02-20 University Of Wales College Of Medicine A screening method for variations in human myh associated with a predisposition towards colorectal cancer
WO2008151031A1 (en) * 2007-05-30 2008-12-11 The Trustees Of Columbia University In The City Of New York Detecting mutated gene sequences by mutant-enriched sequencing
CN109584966A (zh) * 2019-01-08 2019-04-05 杭州纽安津生物科技有限公司 一种肿瘤通用疫苗的设计方法及其在胰腺癌的应用
WO2021160850A1 (en) * 2020-02-13 2021-08-19 Institut Pasteur Measles-vectored covid-19 immunogenic compositions and vaccines
CN111663009A (zh) * 2020-05-27 2020-09-15 中国科学院北京基因组研究所(国家生物信息中心) 病毒适应人类宿主的突变位点的预测方法及其应用
CN112397144A (zh) * 2020-10-29 2021-02-23 无锡臻和生物科技有限公司 检测基因突变及表达量的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANANYA SEN GUPTA等: "Spatiotemporal Tracking of SARS-CoV-2 Variants using informative subtype markers and association graphs", 2020 54TH ASILOMAR CONFERENCE ON SIGNALS, SYSTEMS, AND COMPUTERS, pages 516 - 519 *
杜荣松等: "广州地区丙型肝炎病毒主要基因型E1蛋白胞外域序列分析", 中国病原生物学杂志, no. 11, pages 1241 - 1256 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113981152A (zh) * 2021-12-28 2022-01-28 深圳联合医学科技有限公司 检测SARS-CoV-2变异株的组合物、试剂盒、方法及其用途
CN113981152B (zh) * 2021-12-28 2022-03-25 深圳联合医学科技有限公司 检测SARS-CoV-2变异株的组合物、试剂盒、方法及其用途
CN114464246A (zh) * 2022-01-19 2022-05-10 华中科技大学同济医学院附属协和医院 基于CovMutt框架检测与遗传性增加相关的突变的方法
CN115798578A (zh) * 2022-12-06 2023-03-14 中国人民解放军军事科学院军事医学研究院 一种分析与检测病毒新流行变异株的装置及方法

Also Published As

Publication number Publication date
CN113470745B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
CN113470745B (zh) SARS-CoV-2潜在突变位点的筛选方法及其应用
CN111218459B (zh) 一种以人复制缺陷腺病毒为载体的重组新型冠状病毒疫苗
Andersson et al. A defined subgenomic fragment of in vitro synthesized Moloney sarcoma virus DNA can induce cell transformation upon transfection
Park et al. Cloning and further sequence analysis of the ORF3 gene of wild-and attenuated-type porcine epidemic diarrhea viruses
Arbour et al. Persistent infection of human oligodendrocytic and neuroglial cell lines by human coronavirus 229E
Park et al. Sequence analysis of the partial spike glycoprotein gene of porcine epidemic diarrhea viruses isolated in Korea
Ohshima et al. Evidence for recombination between feline panleukopenia virus and canine parvovirus type 2
Robles-Sikisaka et al. Evidence of recombination and positive selection in cetacean papillomaviruses
Jiang et al. Sapporo-like human caliciviruses are genetically and antigenically diverse
Murakami et al. Variations in the viral genome and biological properties of bovine leukemia virus wild-type strains
CN110468155B (zh) 一种用于拯救猪肠道甲型冠状病毒的系统、方法及应用
Meng et al. RNA polymerase I-driven reverse genetics system for enterovirus 71 and its implications for vaccine production
Moorad et al. Whole-genome sequencing of Kaposi sarcoma-associated herpesvirus (KSHV/HHV8) reveals evidence for two African Lineages
CN111334528B (zh) 水貂肠炎细小病毒全基因组感染性克隆及其构建方法和应用
CN114058619A (zh) Riplet敲除细胞系的构建及作为小核糖核酸病毒科病毒疫苗生产细胞系的应用
Verschoor et al. Molecular characterization of the first polyomavirus from a New World primate: squirrel monkey polyomavirus
Rector et al. Genetic characterization of the first chiropteran papillomavirus, isolated from a basosquamous carcinoma in an Egyptian fruit bat: the Rousettus aegyptiacus papillomavirus type 1
McFarlane et al. Sequence analysis of the gene coding for the S1 glycoprotein of infectious bronchitis virus (IBV) strains from New Zealand
Kulonen et al. Differentiation of two rabies strains in Estonia with reference to recent Finnish isolates
CN117265014A (zh) 病毒s蛋白突变体的构建方法及应用
Zhang et al. Rapid detection of pigeon Megrivirus using TaqMan real-time PCR technology
CN113584080A (zh) 一种Nluc标记的重组猪δ冠状病毒感染性克隆质粒的构建及其应用
US9938507B2 (en) Methods of propagating rhinovirus C in previously unsusceptible cell lines
Sokhandan-Bashir et al. Degenerate primers facilitate the detection and identification of potyviruses from the northwest region of Iran
McClenahan et al. Expression and self-assembly of virus-like particles from two genotypes of marine vesiviruses and development of an ELISA for the detection of antibodies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant