CN113470745A

CN113470745A - SARS-CoV2潜在突变位点的筛选方法及其应用

Info

Publication number: CN113470745A
Application number: CN202110978578.4A
Authority: CN
Inventors: 张玉基; 周秩建; 王琼; 王鹏; 张用科; 范文越; 徐达
Original assignee: Nanjing Liding Medical Technology Co Ltd
Current assignee: Nanjing Liding Medical Technology Co Ltd
Priority date: 2021-08-25
Filing date: 2021-08-25
Publication date: 2021-10-01
Anticipated expiration: 2041-08-25
Also published as: CN113470745B

Abstract

本发明涉及生物信息学和生物医药技术领域，尤其是SARS‑CoV2潜在突变位点的筛选方法，包括：1）下载得到SARS‑CoV2的基因序列，对下载的序列进行快速注释文件和序列比对，从全基因组序列中提取出所有编码基因的序列；2）计算出每个位点的突变频率，筛选出高频率的突变热点，再结合毒株的采样时间和地理分布信息，筛选出在种群中具有显著选择优势的突变位点；3）下载已有的编码基因对应蛋白质的三级结构信息；4）根据预测的B细胞和T细胞表位，筛选位于免疫表位上或其附近的突变位点，评估其对宿主免疫反应的可能影响，鉴定出SARS‑CoV‑2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点。

Description

SARS-CoV2潜在突变位点的筛选方法及其应用

技术领域

本发明涉及生物信息学和生物医药技术领域，具体领域为一种SARS-CoV2潜在突变位点的筛选方法及其应用。

背景技术

冠状病毒在分类上属于套式病毒目（Nidovirales）、冠状病毒亚目(Cornidovirineae)，冠状病毒科(Coronaviridae)，是一种有包膜的单股正义不分节段的RNA病毒。冠状病毒颗粒是呈球状，直径大约为120 nm，基因组约26-32 kb，是已知基因组中最大的RNA病毒。冠状病毒根据系统发育分为四个属：α-CoV、β-CoV、γ-CoV和δ-CoV。新型冠状病毒(SARS-CoV-2)导致新型肺炎，常引起发热、咳嗽、呼吸困难、肌痛和疲劳等症状，对卫生和经济造成了巨大影响。新型冠状病毒主要通过唾液、飞沫、接触等传播，目前主要通过控制传染源，切断传播途径以及接种疫苗来进行有效防控。但新型冠状病毒变异速度很快，急需更加安全有效的疫苗问世，目前市面上很多疫苗对南非突变株不能产生很好的中和效果，由于变异速度很快而导致前期开发疫苗未能提前预测，从而导致疫苗的有效性和适用性严重不足，冠状病毒突变位点的预测分析及对应假病毒制备到中和试验评估疫苗的广谱性是非常必要的。

CN202010733451.1公开了一种病毒适应人类宿主的突变位点的预测方法及其应用，包括：1)将来自动物体的病毒基因组序列与人类miRNA数据库进行比对，利用miRanda算法找出病毒基因组上与人类miRNA互补的靶序列，且靶序列与相应miRNA杂交的最小自由能≤-25kcal/mol，形成靶序列集合I；2)将分离自人体的病毒变体基因组序列与人类miRNA数据库进行比对，利用miRanda算法找出病毒变体基因组上与人类miRNA互补的靶序列，且靶序列与相应miRNA杂交的最小自由能≤-25kcal/mol，形成靶序列集合II；3)从只存在于靶序列集合I而不存在于靶序列集合II中的差异靶序列中筛选得到病毒适应人类宿主的突变位点。

上述预测方法所用软件功能十分有限，它们不适合大规模数据集的突变分析。而且虽然上述预测算法可以输出核苷酸序列中的突变位点，但是无法鉴定引起氨基酸改变的非同义替换位点，更重要的是，其预测方法无法实现特定病毒的变异监测。

假病毒SARS-CoV2膜蛋白Spike参与到带有报告基因的缺损型病毒基因组的包装中，由于被包裹的核酸不具有复制形成病毒的全部核酸序列的能力，所以假病毒nCoV-S只有一轮的感染力，操作比较安全。该假病毒颗粒表面表达SARS-CoV-2的刺突蛋白（Spike蛋白），因此能与靶细胞过表达的ACE2结合，高度模拟SARS-CoV-2通过 Spike结合ACE2 对目的细胞的入侵过程。同时，假病毒携带便于检测的荧光素酶（LUC）报告基因，能够评估病毒感染水平。此系统经过优化的一步层析纯化工艺得到的高纯度假病毒，是研究SARS-CoV-2的得力工具。

假病毒体系有多种，主要包括以慢病毒载体构建的假病毒，以病毒蛋白自组装形成的假病毒，以及以病毒基因改造、插入报告基因所形成的假病毒。慢病毒载体是以是HIV1为基础发展起来的，包含了包装、转染、稳定整合所需要的遗传信息，可提供所有转录并包装到重组假病毒所需要的全部辅助蛋白，利用表达载体和包装质粒同时共转染细胞，在细胞中进行病毒包装，包装好的病毒颗粒分泌到细胞外培养基中。

发明内容

本发明的目的在于提供一种SARS-CoV2潜在突变位点的筛选方法。

本发明的另一目的是基于上述筛选方法得到的结果提供了SARS-CoV2突变株假病毒nCoV-S及其制备方法。

为实现上述目的，本发明提供如下技术方案：

一种SARS-CoV2潜在突变位点的筛选方法，包括以下步骤：

（1）在GISAID数据库中下载得到SARS-CoV2的基因序列，对下载的序列进行快速注释文件和序列比对，从全基因组序列中提取出所有编码基因的序列；

（2）计算出每个位点的突变频率，筛选出高频率的突变热点，再结合毒株的采样时间和地理分布信息，筛选出在种群中具有显著选择优势的突变位点；

（3）从PBD数据库下载已有的编码基因对应蛋白质的三级结构信息；

（4）根据预测的B细胞和T细胞表位，筛选位于免疫表位上或其附近的突变位点，评估其对宿主免疫反应的可能影响，从而鉴定出SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点。

其中，所述步骤（2）中，高频率的突变热点是指单突变频次＞100，多突变频次＞5。

其中，所述步骤（4）中，对于B细胞表位预测，调用IEDB中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位，使用默认阈值0.5；对于超过6 个但小于25个氨基酸的线性表位肽，再调用VaxiJen2.0在线服务器进行抗原评估，仅考虑使用VaxiJen预测得分超过0.5的表位肽；如果表位肽的长度超过25，则只考虑VaxiJen评分超过0.5的子片段序列。

对于T细胞表位预测，分别预测MHC-I和MHC-Ⅱ结合表位；

调用NetMHCpan4.1方法基于8个最常见的人类HLAI类等位基因，即HLA-A01:01，HLA-A02:01，HLA-A03:01，HLA-A11:01，HLA-A24:02，HLA-B07:02, HLA-B08:01, HLA-B40:01，预测MHC-I结合表位，并且只考虑了评分超过0.85且VaxiJen 得分超过0.5的表位；

MHC-Ⅱ的表位预测，基于常见的7个人类等位基因，即DRB103:01，DRB107:01，DRB115:01，DRB301:01，DRB302:02，DRB401:01和DRB5*01:01，以及IEDB推荐的2.22算法，表位肽的长度设置为15； MHC-Ⅱ的表位预测仅考虑adjusted rank 值低于1且VaxiJen评分超过0.5的结合表位。

一种SARS-CoV2突变株假病毒nCoV-S的制备方法，包括以下步骤：

（1）根据前述的筛选方法得到SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点，基于所述关键变异位点制备单点突变体或多点突变体；

（2）共转染；

（3）诱导表达假病毒颗粒。

本发明制备的SARS-CoV2突变株假病毒nCoV-S可用于研究病毒与宿主细胞的相互关系、鉴定病毒受体、测定中和抗体的效价及抗病毒药物筛选。

与现有技术相比，本发明的有益效果是：

（1）本发明的筛选方法适合大规模数据集的突变分析；可以鉴定引起氨基酸改变的非同义替换位点；能揭示病毒基因组的差异。更重要的是，可以实现特定病毒的变异监测。

（2）通过本发明方法制备的假病毒包装效率得到显著提高，稳定性好，可以长时间保存，纯度高，含有高纯度的RNA而不含有DNA，适合大规模的生产和应用。

（3）通过本发明筛选方法得到的结果，进一步制备得到的SARS-CoV-2假病毒系统的假病毒nCoV-S是复制缺陷型，只能感染一次靶细胞，缺乏复制能力，不能产生子代病毒，避免了继发感染的危险。基于此假病毒进行研究的过程中，准确评价病毒感染后体内中和抗体反应不仅对确诊具有重要价值，而且对研究免疫保护相关性也有较为重要的价值。

附图说明

图1为实施例2的PCR产物鉴定结果；

图2为实施例2的测序对比结果；

图3为实施例3单点突变体SARS2-S-D614G的PCR产物鉴定结果；

图4为实施例3单点突变体SARS2-S-D614G的测序对比结果；

图5为实施例3 多点突变体SARS2-S-D614G+D1084Y的PCR产物鉴定结果；

图6为实施例3多点突变体SARS2-S-D614G+D1084Y的测序对比结果；

图7为假病毒包装过程示意图；

图8为实施例4的假病毒感染试验荧光素酶活性值结果；

图9为实施例4的假病毒中和抗体检测的荧光素酶活性值结果；

图10为科兴疫苗免疫后18例样本的中和抗体的测试评估结果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1 SARS-CoV2潜在突变位点的筛选方法

（1）对于特定的一种新型冠状病毒SARS-CoV2，新冠全基因组测序数据上传在GISAID数据库 (https://www.gisaid.org/)，可从GISAID数据库免费下载。用BioAide软件对下载序列进行快速注释文件和序列比对，从全基因组序列中提取出所有编码基因的序列。

序列比对：先将未对齐的病毒全基因组序列直接拖拽到输入框，或者通过文件按钮加载文件路径；

然后选择序列类型为核苷酸（Nucleotide），输出格式为fasta格式，并选择比对策略为自动模式（auto）；

最后根据电脑的配置，选择使用的线程数量，再点击运行（Start）按钮，完成病毒序列集全基因组的比对。

提取出的编码基因的序列如SEQ ID NO：1-54所示：

NSP1：atggagagcc，acccgtgaactcatgcgtgagcttaacggaggg

NSP2：gcatacactcgctatgtcgataacaacttctgtggccctgatgg，aatatgatggtaacaaacaataccttcacactcaaaggcggt

NSP3：gcaccaacaaaggttacttttggtgatgacactgtgatagaagtgcaaggttacaagagtgt，actagacaagttgttaatgttgtaacaacaaagatagcacttaagggtggt

NSP4：aaaattgttaataattggttgaagcagttaattaaagttacac，accaccacaaacctctatcacctcagctgttttgcag

NSP5：agtggttttagaaaaatggcattcccatctggtaaagt，atgttgttagacaatgctcaggtgttactttccaa

NSP6：agtgcagtgaaaagaacaatcaagggtacacacca，gtggcaaaccttgtatcaaagtagccactgtacag

NSP7：tctaaaatgtcagatgtaaagtgcacatca，aagaaatgctggacaacagggcaaccttacaa

NSP8：gctatagcctcagagtttagttcccttccatcata，cagctttaagggccaattctgctgtcaaattacag

NSP9：aataatgagcttagtcctgttgcactacgacagat，tacttggtagtttagctgccacagtacgtctacaa

NSP10：gctggtaatgcaacagaagtgcctgccaattcaactgt，tgtagttgtgatcaactccgcgaacccatgcttcag

NSP12：tcagctgatgcacaatcgtttttaaacgggt，atgaggctatgtacacaccgcatacagtcttacag

NSP13：gctgttggggcttgtgttctttgcaattcacagactt，aagtcttgaaattccacgtaggaatgtggcaactttacaa

NSP14：gctgaaaatgtaacaggactctttaaagattgtagtaagg，cttataacctctggaacacttttacaagacttcag

NSP15：agtttagaaaatgtggcttttaatgttgtaaataa，atggccatgtagaaacattttacccaaaattacaa

NSP16：tctagtcaagcgtggcaaccgggtgttgctatgcc，cagagttgttatttctagtgatgttcttgttaacaac

S：atgtttgtttttcttgttttattgccactagtctctagt，gccagtgctcaaaggagtcaaattacattacacataa

ORF3a：atggatttgtttatgagaatcttcacaattggaactgtaa，tgaaccgacgacgactactagcgtgcctttgtaa

E：atgtactcattcgtttcggaagagacaggtacgttaa，atctgaattcttctagagttcctgatcttctggtctaa

M：atggcagattccaacggtactattaccgttgaaga，gaccattccagtagcagtgacaatattgctttgcttgtacagtaa

ORF6：atgtttcatctcgttgactttcaggttactatagcagaga，attctcaattagatgaagagcaaccaatggagattgattaa

ORF7a：atgaaaattattcttttcttggcactgataacactcgctac，cactttgcttcacactcaaaagaaagacagaatga

ORF7b：atgattgaactttcattaattgacttctatttgtg，gcaagatcataatgaaacttgtcacgcctaa

ORF8：atgaaatttcttgttttcttaggaatcatcacaactg，tcatgacgttcgtgttgttttagatttcatctaa

N：atgtctgataatggaccccaaaatcagcgaaatgcaccc，caatccatgagcagtgctgactcaactcaggcctaa

ORF9b：atggaccccaaaatcagcgaaatgcaccccgcattacgttt，cgaagagctaccagacgaattcgtggtggtgacggtaaaatga

ORF9c：atgctgcaatcgtgctacaacttcctcaaggaacaac，gctgctcttgctttgctgctgcttgacagattga

ORF10：atgggctatataaacgttttcgcttttccgttt，cacaagtagatgtagttaactttaatctcacatag

（2）通过软件先计算出每个位点的突变频率（突变频率：所有样本中突变点出现的个数。规定：单突变频次＞100，多突变频次＞5），筛选出高频率的突变热点，再结合毒株的采样时间和地理分布信息，筛选出在种群中具有显著选择优势的突变位点。

先查看alignment文件是否符合密码子比对原则，再剔除相对于Wuhan/Hu-1的插入位点，保证同一基因的不同alignment文件的长度统一，再对alignment文件进行合并。

使用BioAider软件进行突变分析，参数设置，选择数据类型为“Codon”，突变频率分组为下表1：

表1

结果如下表2：

表2 各编码基因整体变异情况

（3）从PBD数据库（https://www1.rcsb.org/）下载已有的编码基因对应蛋白质的三级结构信息。

（4）根据预测的B细胞和T细胞表位，筛选位于免疫表位上或其附近的突变位点，评估其对宿主免疫反应的可能影响，如引起免疫逃避或增强宿主免疫反应，从而鉴定出SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点，如表3所示。

高频率突变位点在免疫表位上的定位：根据IEDB数据库（http://www.iedb.org/）里提供的B细胞和T细胞免疫表位信息，将鉴定出的频率突变位点与数据库中的信息进行比较，筛选出位于免疫表位上的突变位点。

对于B细胞表位预测，调用IEDB（http://www.iedb.org/）中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位，使用默认阈值0.5。对于超过6 个但小于25个氨基酸的线性表位肽，再调用VaxiJen2.0在线服务器进行抗原评估，仅考虑使用VaxiJen预测得分超过0.5的表位肽。如果表位肽的长度超过25，则只考虑VaxiJen评分超过0.5的子片段序列。

对于T细胞表位预测，分别预测MHC-I（CD8 T细胞）和MHC-Ⅱ（CD4 T细胞）结合表位。调用NetMHCpan4.1方法基于8个最常见的人类HLAI类等位基因（HLA-A01:01，HLA-A02:01，HLA-A03:01，HLA-A11:01，HLA-A24:02，HLA-B07:02, HLA-B08:01, HLA-B40:01)预测MHC-I结合表位，并且只考虑了评分超过0.85且VaxiJen 得分超过0.5的表位。MHC-Ⅱ的表位预测，基于常见的7个人类等位基因（包括DRB103:01，DRB107:01，DRB115:01，DRB301:01，DRB302:02，DRB401:01和DRB5*01:01)和IEDB推荐的2.22算法，表位肽的长度设置为15。类似地，MHC-Ⅱ的表位预测仅考虑adjusted rank 值低于1且VaxiJen评分超过0.5的结合表位。

表3

实施例2 单点突变实例：S-S477N

试验材料：pcDNA3.1-SARS2-S-HA（稀释至10 ng/µL），KOD高保真酶KOD –Plus-Neo(Code:KOD-401)，Dpni酶（NEB R0176S）

引物设计：

表4

点突变引物设计原则：

1.突变体引物长度35-40bp。以要突变的氨基酸为中心，正反引物有15-20bp的重叠区域。

2.突变体引物的GC含量40-60%之间，特别是3’端。

PCR扩增体系如表5所示：

表5

混匀后轻微离心。

PCR扩增程序如表6所示：

表6

PCR产物鉴定：

配制1%的琼脂糖胶，点5µL PCR产物进行观察。DNA marker 5000，目的条带大小约9kb。结果：条带大小符合（如图1）。

Dpni酶消化：鉴定结果SARS2-S-S477N-F-1和平行SARS2-S-S477N-F-2都有条带，选取SARS2-S-S477N-F-1，将PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h，去除模板(消化甲基化的模板质粒)。

转化：取10 µL消化后的产物加入到50 µL Top10感受态细胞中，进行转化操作。（氨苄抗性的板子）。长出菌落，无需做菌落PCR，每个突变板子挑6个单菌落置于2 mL EP管中（400µL含氨苄的LB培养基），小摇浑浊后送擎科生物技术公司测序。

根据突变位点，先选择离突变位点最近的W1F0825-P099-H05引物进行测序，测序突变成功，再进行全序列测通，结果显示SARS2-S-S477N成功突变。

测序对比结果如图2所示。

表7

挑菌提取质粒：序列测通完全正确的质粒，将其菌液大摇提取无内毒素的质粒，用于后续假病毒的包装（质粒总量>200µg，浓度>500ng/µL)。提取试剂盒为Omega。

实施例3 多点突变实例：SARS2-S-D614G+D1084Y

先做单点突变体SARS2-S-D614G；再此基础上累加突变位点D1084Y。

试验材料：pcDNA3.1-SARS2-S-HA（稀释至10 ng/µL），KOD高保真酶KOD –Plus-Neo (Code:KOD-401)，Dpni酶（NEB R0176S）

引物设计：

表8

PCR扩增体系如表9所示：

表9

混匀后轻微离心。

PCR扩增程序如表10所示：

表10

PCR产物鉴定：

配制0.8%的琼脂糖胶，点5µL PCR产物进行观察。DNA marker 5000，目的条带大小约9kb。结果如图3。

Dpni酶消化：鉴定结果SARS2-S-D614G-1有条带，则将PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h，去除模板（消化甲基化的模板质粒）。转化：取10 µL消化后的产物加入到50 µL Top10感受态细胞中，进行转化操作（氨苄抗性的板子）。长出菌落，无需做菌落PCR，每个突变板子挑3-6个单菌落置于2 mL EP管中（400µL含氨苄的LB培养基），小摇浑浊后送擎科测序。

根据突变位点，先选择离突变位点最近的引物CMV-F进行测序，测序成功，后再进行全序列测通，结果显示突变成功。

表11

挑菌提取质粒：序列测通完全正确的质粒，将其菌液大摇提取无内毒素的质粒，以此为模板继续累加突变位点。

测序对比结果如图4所示。

试验材料：pcDNA3.1-SARS2-S--D614G-HA（稀释至10 ng/µL），KOD高保真酶KOD –Plus- Neo(Code:KOD-401)，Dpni酶（NEB R0176S）

引物设计：

表12

点突变引物设计原则：

2.突变体引物的GC含量40-60%之间，特别是3’端。

PCR扩增体系如表13所示：

表13

混匀后轻微离心。

PCR扩增程序如表14所示：

表14

PCR产物鉴定

配制0.8%的琼脂糖胶，用5µL PCR产物进行观察。DNA marker 15000，目的条带大小约9kb。结果如图5。

Dpni酶消化：鉴定结果SARS2-S-D614G+D1084Y-1和SARS2-S-D614G+D1084Y-2都有条带，则将SARS2-S-D614G+D1084Y-1 PCR产物剩下的15 µL加入Dpni酶0.4 µL混匀置于37度消化2h，去除模板（消化甲基化的模板质粒）。转化：取10 µL消化后的产物加入到50 µLTop10感受态细胞中，进行转化操作（氨苄抗性的板子）。长出菌落，无需做菌P，每个突变板子挑3个单菌落置于2 mL EP管中（400µL含氨苄的LB培养基），小摇浑浊后送擎科测序。

根据突变位点，先选择离突变位点最近的引物BGH进行测序，测序突变成功后，进行序列测通。

表15

测序结果如图6所示。

在其他有益实施例中，可以依据实施例1的筛选结果，选择其中任意的突变位点，并按照实施例2或实施例3的方法得到单点突变体或者多点突变体。虽然制备的突变体略有不同，但实验方法步骤基本一致，唯一需要注意将退火温度控制在55℃-68℃即可。

实施例4

采用实施例2-3的方法，制备单点突变体和多点突变体：SARA-CoV2-D164G；SARA-CoV2-D164G+A222V；SARA-CoV2-D164G+S477N；SARA-CoV2-D164G+N501Y；SARA-CoV2-D164G+S673T；SARA-CoV2-D164G+Q677H；SARA-CoV2-D164G+P479S+F1121L；SARA-CoV2-D164G+S225F+K1073N；SARA-CoV2-D164G+A522S+E780Q；SARA-CoV2-D164G+S477N+L822F+T632N。

一、假病毒nCoV-S的制备

1、共转染

将前述方法制备的质粒，采用阳离子脂质体法转染。转染时所用质粒的重量比为：包装质粒pNL-HIV-Luc ：重组质粒pc DNA3.1-S为1：1-1：4

按照所用质粒的总重量：转染试剂Lipofectamine3000为1μg：1.5μl，共转染293T细胞。

2、收取假病毒nCoV-S

培养宿主293T细胞48h，离心收集上清(离心条件为：4℃、 8000g、10min)，使用无菌0.45μm滤器过滤上清，即得nCoV-S假病毒上清液。假病毒包装过程见图7。使用病毒浓缩试剂（病毒浓缩试剂的配制如下：取NaCl 8.766g、PEG8000 50g溶解在200ml Milli-Q纯水中），按假病毒上清液：病毒浓缩试剂的体积比4：1混合，4℃过夜；然后离心（离心条件为：4℃，7000g，30min）弃上清，按病毒上清液原体积的1/100～1/50加入DMEM重悬，获得浓缩后的病毒液，分装后于-70℃保存。

二、假病毒nCoV-S的鉴定

1.假病毒感染试验

（1）复苏HeLa-ACE2稳定细胞，传细胞于96孔板。细胞数1.5-2×10⁴。

（2）18-24h后，细胞密度70%左右进行假病毒感染实验。

（3）吸出原有培养基，用PBS洗细胞两次。

（4）选取包装好的假病毒（SARA-CoV2；SARA-CoV2-D164G；SARA-CoV2-D164G+A222V；SARA-CoV2-D164G+S477N；SARA-CoV2-D164G+N501Y；SARA-CoV2-D164G+S673T；SARA-CoV2-D164G+Q677H；SARA-CoV2-D164G+P479S+F1121L；SARA-CoV2-D164G+S225F+K1073N；SARA-CoV2-D164G+A522S+E780Q；SARA-CoV2-D164G+S477N+L822F+T632N）100 µL的假病毒，感染8 h后吸出假病毒上清，换10% FBS的细胞培养基。

（5）荧光素酶裂解液裂解细胞。假病毒感染48 h后，96孔板每孔用PBS洗两遍，加入50 µL1× cell lysis buffer 裂解细胞，置于摇床上快速裂解15 min。（若暂时不测，可直接加入cell lysis buffer后置于-80度保存）

（6）测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀，于酶标仪上设置10 s读值。

结果如图8所示。

2. 假病毒中和抗体检测

（1）从10倍开始连续三倍稀释血清，将稀释好的抗体加入96孔板的各孔中。

（2）加入100 µL的假病毒，37℃培养1 h。

（3）用含有10 % FBS的细胞培养基将Hela细胞稀释至密度为2×10⁵ /mL。

（4）每孔加入稀释好的Hela细胞100 µL。

（5）荧光素酶裂解液裂解细胞。假病毒感染72 h后，96孔板每孔用PBS洗三遍，加入50 µL 1×cell lysis buffer 裂解细胞，置于摇床上快速裂解15 min。（若暂时不测，可直接加入cell lysis buffer后置于-80 ℃保存）

（6）测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀，于酶标仪上设置10 s读值。结果如图9所示。

本发明用HIV慢病毒载体包装新型冠状病毒，假病毒nCoV-S侵染细胞后Luciferase发光值达10⁶RLU，可以满足抗体或血清的中和检测筛选，结果准确可靠。

实施例5

本发明制备的假病毒nCoV-S在进行SARS-CoV-2疫苗研发时，可用于判断疫苗是否具有免疫效果，免疫机体后能否产生足够的中和抗体。

以下是对科兴疫苗免疫后18例样本进行的中和抗体的测试评估。

将（第二次免疫后13天）志愿者的血液样本采集至肝素采血管，混合均匀，每管约5ml；样本处理：在天平上称重确定样品体积，1 g = 1 ml。样品配平后，4度，5000 rpm离心20min。取上层血清样，同一志愿者编号的血清混合至15 ml离心管中，4度，5000 rpm，离心10min。血清编号、分装、冻存。

（1）将血清按（10、100、200、400、800、1600、3200、6400）倍稀释血清，将稀释好的抗体加入96孔板的各孔中。

（2）加入100 µL的假病毒，37℃培养1 h。

（4）每孔加入稀释好的Hela细胞100 µL。

（6）测荧光素酶活性值。样品20 µL+ Luciferase Assay Reagent 20 µL混匀，于酶标仪上设置10 s读值。测出结果如图10所示：其中18例阳性样本均有中和抗体产生。且与Genscript测试结果相吻合。

对于SARS-CoV-2而言，存在操作危险性高、周期长、实验条件要求比较苛刻和对实验室要求严格等难题。而本发明SARS-CoV-2假病毒系统的假病毒nCoV-S是复制缺陷型，只能感染一次靶细胞，缺乏复制能力，不能产生子代病毒，避免了继发感染的危险。在对病毒进行研究的过程中，准确评价病毒感染后体内中和抗体反应不仅对确诊具有重要价值，而且对研究免疫保护相关性较为重要。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

序列表

<110> 南京立顶医疗科技有限公司

<120> SARS-CoV2潜在突变位点的筛选方法及其应用

<160> 60

<170> SIPOSequenceListing 1.0

<210> 1

<211> 10

<212> DNA

<213> NSP1-1(Artificial Sequence)

<400> 1

atggagagcc 10

<210> 2

<211> 33

<212> DNA

<213> NSP1-2(Artificial Sequence)

<400> 2

acccgtgaac tcatgcgtga gcttaacgga ggg 33

<210> 3

<211> 44

<212> DNA

<213> NSP2-1(Artificial Sequence)

<400> 3

gcatacactc gctatgtcga taacaacttc tgtggccctg atgg 44

<210> 4

<211> 42

<212> DNA

<213> NSP2-2(Artificial Sequence)

<400> 4

aatatgatgg taacaaacaa taccttcaca ctcaaaggcg gt 42

<210> 5

<211> 62

<212> DNA

<213> NSP3-1(Artificial Sequence)

<400> 5

gcaccaacaa aggttacttt tggtgatgac actgtgatag aagtgcaagg ttacaagagt 60

gt 62

<210> 6

<211> 51

<212> DNA

<213> NSP3-2(Artificial Sequence)

<400> 6

actagacaag ttgttaatgt tgtaacaaca aagatagcac ttaagggtgg t 51

<210> 7

<211> 43

<212> DNA

<213> NSP4-1(Artificial Sequence)

<400> 7

aaaattgtta ataattggtt gaagcagtta attaaagtta cac 43

<210> 8

<211> 37

<212> DNA

<213> NSP4-2(Artificial Sequence)

<400> 8

accaccacaa acctctatca cctcagctgt tttgcag 37

<210> 9

<211> 38

<212> DNA

<213> NSP5-1(Artificial Sequence)

<400> 9

agtggtttta gaaaaatggc attcccatct ggtaaagt 38

<210> 10

<211> 35

<212> DNA

<213> NSP5-2(Artificial Sequence)

<400> 10

atgttgttag acaatgctca ggtgttactt tccaa 35

<210> 11

<211> 35

<212> DNA

<213> NSP6-1(Artificial Sequence)

<400> 11

agtgcagtga aaagaacaat caagggtaca cacca 35

<210> 12

<211> 35

<212> DNA

<213> NSP6-2(Artificial Sequence)

<400> 12

gtggcaaacc ttgtatcaaa gtagccactg tacag 35

<210> 13

<211> 30

<212> DNA

<213> NSP7-1(Artificial Sequence)

<400> 13

tctaaaatgt cagatgtaaa gtgcacatca 30

<210> 14

<211> 32

<212> DNA

<213> NSP7-2(Artificial Sequence)

<400> 14

aagaaatgct ggacaacagg gcaaccttac aa 32

<210> 15

<211> 35

<212> DNA

<213> NSP8-1(Artificial Sequence)

<400> 15

gctatagcct cagagtttag ttcccttcca tcata 35

<210> 16

<211> 35

<212> DNA

<213> NSP8-2(Artificial Sequence)

<400> 16

cagctttaag ggccaattct gctgtcaaat tacag 35

<210> 17

<211> 35

<212> DNA

<213> NSP9-1(Artificial Sequence)

<400> 17

aataatgagc ttagtcctgt tgcactacga cagat 35

<210> 18

<211> 35

<212> DNA

<213> NSP9-2(Artificial Sequence)

<400> 18

tacttggtag tttagctgcc acagtacgtc tacaa 35

<210> 19

<211> 38

<212> DNA

<213> NSP10-1(Artificial Sequence)

<400> 19

gctggtaatg caacagaagt gcctgccaat tcaactgt 38

<210> 20

<211> 36

<212> DNA

<213> NSP10-2(Artificial Sequence)

<400> 20

tgtagttgtg atcaactccg cgaacccatg cttcag 36

<210> 21

<211> 31

<212> DNA

<213> NSP12-1(Artificial Sequence)

<400> 21

tcagctgatg cacaatcgtt tttaaacggg t 31

<210> 22

<211> 35

<212> DNA

<213> NSP12-2(Artificial Sequence)

<400> 22

atgaggctat gtacacaccg catacagtct tacag 35

<210> 23

<211> 37

<212> DNA

<213> NSP13-1(Artificial Sequence)

<400> 23

gctgttgggg cttgtgttct ttgcaattca cagactt 37

<210> 24

<211> 40

<212> DNA

<213> NSP13-2(Artificial Sequence)

<400> 24

aagtcttgaa attccacgta ggaatgtggc aactttacaa 40

<210> 25

<211> 40

<212> DNA

<213> NSP14-1(Artificial Sequence)

<400> 25

gctgaaaatg taacaggact ctttaaagat tgtagtaagg 40

<210> 26

<211> 35

<212> DNA

<213> NSP14-2(Artificial Sequence)

<400> 26

cttataacct ctggaacact tttacaagac ttcag 35

<210> 27

<211> 35

<212> DNA

<213> NSP15-1(Artificial Sequence)

<400> 27

agtttagaaa atgtggcttt taatgttgta aataa 35

<210> 28

<211> 35

<212> DNA

<213> NSP15-2(Artificial Sequence)

<400> 28

atggccatgt agaaacattt tacccaaaat tacaa 35

<210> 29

<211> 35

<212> DNA

<213> NSP16-1(Artificial Sequence)

<400> 29

tctagtcaag cgtggcaacc gggtgttgct atgcc 35

<210> 30

<211> 37

<212> DNA

<213> NSP16-2(Artificial Sequence)

<400> 30

cagagttgtt atttctagtg atgttcttgt taacaac 37

<210> 31

<211> 39

<212> DNA

<213> S-1(Artificial Sequence)

<400> 31

atgtttgttt ttcttgtttt attgccacta gtctctagt 39

<210> 32

<211> 37

<212> DNA

<213> S-2(Artificial Sequence)

<400> 32

gccagtgctc aaaggagtca aattacatta cacataa 37

<210> 33

<211> 40

<212> DNA

<213> ORF3a-1(Artificial Sequence)

<400> 33

atggatttgt ttatgagaat cttcacaatt ggaactgtaa 40

<210> 34

<211> 34

<212> DNA

<213> ORF3a-2(Artificial Sequence)

<400> 34

tgaaccgacg acgactacta gcgtgccttt gtaa 34

<210> 35

<211> 37

<212> DNA

<213> E-1(Artificial Sequence)

<400> 35

atgtactcat tcgtttcgga agagacaggt acgttaa 37

<210> 36

<211> 38

<212> DNA

<213> E-2(Artificial Sequence)

<400> 36

atctgaattc ttctagagtt cctgatcttc tggtctaa 38

<210> 37

<211> 35

<212> DNA

<213> M-1(Artificial Sequence)

<400> 37

atggcagatt ccaacggtac tattaccgtt gaaga 35

<210> 38

<211> 45

<212> DNA

<213> M-2(Artificial Sequence)

<400> 38

gaccattcca gtagcagtga caatattgct ttgcttgtac agtaa 45

<210> 39

<211> 40

<212> DNA

<213> ORF6-1(Artificial Sequence)

<400> 39

atgtttcatc tcgttgactt tcaggttact atagcagaga 40

<210> 40

<211> 41

<212> DNA

<213> ORF6-2(Artificial Sequence)

<400> 40

attctcaatt agatgaagag caaccaatgg agattgatta a 41

<210> 41

<211> 41

<212> DNA

<213> ORF7a-1(Artificial Sequence)

<400> 41

atgaaaatta ttcttttctt ggcactgata acactcgcta c 41

<210> 42

<211> 35

<212> DNA

<213> ORF7a-2(Artificial Sequence)

<400> 42

cactttgctt cacactcaaa agaaagacag aatga 35

<210> 43

<211> 35

<212> DNA

<213> ORF7b-1(Artificial Sequence)

<400> 43

atgattgaac tttcattaat tgacttctat ttgtg 35

<210> 44

<211> 31

<212> DNA

<213> ORF7b-2(Artificial Sequence)

<400> 44

gcaagatcat aatgaaactt gtcacgccta a 31

<210> 45

<211> 37

<212> DNA

<213> ORF8-1(Artificial Sequence)

<400> 45

atgaaatttc ttgttttctt aggaatcatc acaactg 37

<210> 46

<211> 34

<212> DNA

<213> ORF8-2(Artificial Sequence)

<400> 46

tcatgacgtt cgtgttgttt tagatttcat ctaa 34

<210> 47

<211> 39

<212> DNA

<213> N-1(Artificial Sequence)

<400> 47

atgtctgata atggacccca aaatcagcga aatgcaccc 39

<210> 48

<211> 36

<212> DNA

<213> N-2(Artificial Sequence)

<400> 48

caatccatga gcagtgctga ctcaactcag gcctaa 36

<210> 49

<211> 41

<212> DNA

<213> ORF9b-1(Artificial Sequence)

<400> 49

atggacccca aaatcagcga aatgcacccc gcattacgtt t 41

<210> 50

<211> 43

<212> DNA

<213> ORF9b-2(Artificial Sequence)

<400> 50

cgaagagcta ccagacgaat tcgtggtggt gacggtaaaa tga 43

<210> 51

<211> 37

<212> DNA

<213> ORF9c-1(Artificial Sequence)

<400> 51

atgctgcaat cgtgctacaa cttcctcaag gaacaac 37

<210> 52

<211> 34

<212> DNA

<213> ORF9c-2(Artificial Sequence)

<400> 52

gctgctcttg ctttgctgct gcttgacaga ttga 34

<210> 53

<211> 33

<212> DNA

<213> ORF10-1(Artificial Sequence)

<400> 53

atgggctata taaacgtttt cgcttttccg ttt 33

<210> 54

<211> 35

<212> DNA

<213> ORF10-2(Artificial Sequence)

<400> 54

cacaagtaga tgtagttaac tttaatctca catag 35

<210> 55

<211> 44

<212> DNA

<213> SARS2-S-S477N-F(Artificial Sequence)

<400> 55

accaggccgg gaacaccccc tgtaatggag tggagggttt caac 44

<210> 56

<211> 43

<212> DNA

<213> SARS2-S-S477N-R(Artificial Sequence)

<400> 56

attacagggg gtgttcccgg cctggtagat ctctgtggag ata 43

<210> 57

<211> 33

<212> DNA

<213> SARS2-S-D614G-F(Artificial Sequence)

<400> 57

gtgctgtatc agggcgtgaa ctgcacagag gtg 33

<210> 58

<211> 36

<212> DNA

<213> SARS2-S-D614G-R(Artificial Sequence)

<400> 58

cagttcacgc cctgatacag cacagccacc tggttg 36

<210> 59

<211> 36

<212> DNA

<213> SARS2-S-D614G+D1084Y-F(Artificial Sequence)

<400> 59

atctgtcact acggaaaggc acacttccca agagag 36

<210> 60

<211> 37

<212> DNA

<213> SARS2-S-D614G+D1084Y-R(Artificial Sequence)

<400> 60

ctttccgtag tgacagatgg cgggtgcagt ggtgaag 37

Claims

1.一种SARS-CoV2潜在突变位点的筛选方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法，其特征在于：所述步骤（2）中，高频率的突变热点是指单突变频次＞100，多突变频次＞5。

3.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法，其特征在于：所述步骤（4）中，对于B细胞表位预测，调用IEDB中的BepiPred 2.0程序来预测SARS-CoV-2 S蛋白的线性B细胞表位，使用默认阈值＞0.5；对于超过6个但小于25个氨基酸的线性表位肽，再调用VaxiJen2.0在线服务器进行抗原评估，仅考虑使用VaxiJen预测得分超过0.5的表位肽；如果表位肽的长度超过25，则只考虑VaxiJen评分超过0.5的子片段序列。

4.根据权利要求1所述的SARS-CoV2潜在突变位点的筛选方法，其特征在于：所述步骤（4）中，对于T细胞表位预测，分别预测MHC-I和MHC-Ⅱ结合表位；

5.一种SARS-CoV2突变株假病毒nCoV-S的制备方法，其特征在于，包括以下步骤：

（1）根据权利要求1-4任一所述的筛选方法得到SARS-CoV-2在流行传播中基因组上潜在的可能和病毒感染及宿主适应相关的关键变异位点，基于所述关键变异位点制备单点突变体或多点突变体；

（2）共转染；

（3）诱导表达假病毒颗粒。

6.根据权利要求5所述制备方法制得的SARS-CoV2突变株假病毒nCoV-S。

7.权利要求6所述的SARS-CoV2突变株假病毒nCoV-S在研究病毒与宿主细胞的相互关系、鉴定病毒受体、测定中和抗体的效价及抗病毒药物筛选中的应用。