CN115819523B

CN115819523B - 靶向新冠病毒s蛋白受体结合域的三价蛋白的优化设计方法

Info

Publication number: CN115819523B
Application number: CN202211218440.5A
Authority: CN
Inventors: 黄强; 秦琴; 姜欣怡; 杜文豪; 朱海霞
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2022-10-05
Filing date: 2022-10-05
Publication date: 2023-12-05
Anticipated expiration: 2042-10-05
Also published as: CN115819523A

Abstract

本发明属于蛋白质工程技术领域，具体为一种靶向新冠病毒S蛋白受体结合域的三价蛋白的优化设计方法。本发明采用竞争性结合RBD的抗新冠病毒小蛋白miniACE2作为单价药效蛋白，选择天然存在且低免疫原性的T4噬菌体纤维蛋白C‑末端foldon结构域作为三聚化支架；基于S蛋白的结构信息设计长度和柔性不同的接头序列，构建出多个候选三价重组蛋白，通过分子动力学模拟探究其结构特性如构象稳定性、构象异质性以及自组装效率，最后用实验方法验证其相关理化性质及功能。经实验验证，本发明设计得到的三价蛋白MP‑5ff具有很高的S蛋白结合亲和性和极佳的构象稳定性和自组装效率，是潜在的抗新冠病毒蛋白药物。

Description

靶向新冠病毒S蛋白受体结合域的三价蛋白的优化设计方法

技术领域

本发明属于蛋白质工程技术领域，具体涉及靶向新冠病毒S(Spike)蛋白受体结合域(S-RBD)的三价蛋白的优化设计方法。

背景技术

新冠病毒SARS-CoV-2表面的刺突蛋白(Spike protein，S蛋白)以同源三聚体的形式存在¹。S蛋白通过其受体结合结构域(Receptor binding domain,RBD)与宿主细胞表面的受体蛋白—

血管紧张素转换酶2(Angiotensin-converting enzyme 2，ACE2)结合引发构象重排，促进病毒包膜与宿主细胞膜的融合，从而感染细胞²。基于此机理，科学家们通过多种方法例如设计ACE2变体、中和抗体、乃至从头设计小蛋白拮抗剂等来阻碍S蛋白与受体ACE2的结合，防止病毒入侵人体³。但是，上述策略均可能存在给药浓度过高、药物半衰期短、活性低以及病毒逃逸等潜在问题。

由于天然存在大量多价结合的疾病生物学靶点，越来越多的研究致力于引入多价药物设计策略来克服上述困难^4–6。研究表明，与单价药物相比，多价药物具有提高药物与靶标的亲和性、延长药物在体内的半衰期、减少给药剂量，节约生产成本等优势^7–9。基于Spike蛋白本身作为同源三聚体的天然结构基础，将靶向S-RBD的蛋白药物三价化有望为新冠药物开发赋予新的希望。然而，在设计三价蛋白药物的过程中，需要选择合适的三聚化支架(scaffold)以及接头序列(linker)，统称为三聚化单元。优良的三聚化支架需要具备自组装效率高、结构稳定、低免疫原性等要求。而连接抗新冠药物蛋白与三聚化支架的linker必须具有适宜的长度、形状以及空间取向以保证其两侧结构域的正确折叠，既不影响药物蛋白与靶标的结合，也不影响三聚化支架的组装效率。在缺乏相关理论指导的情况下，研究者们大多采用不断的实验试错或基于经验的手段筛选优良的三聚化单元，该过程往往存在随机性和盲目性，设计出的三价蛋白在生产工艺开发时，就可能会因纯度低、稳定性差等问题而无法继续推进，进而耗费大量人力物力资源进行实验筛选，研发成本变高。

随着生命科学理论与计算方法的飞速发展，计算机辅助药物设计为药物研发开启了全新时代，利用计算结构生物学方法在药物蛋白设计初期进行计算分析，预测其理化性质及结构特征，就可以减少盲目性、节省成本、提高药物开发效率。因此，利用计算方法有效进行靶向新冠病毒S-RBD的三价蛋白优化设计是十分有必要且有意义的。

发明内容

本发明的第一个目的是提供一种靶向新冠病毒S-RBD的三价蛋白优化设计方法，为多价药物的理性设计提供有效指导。

本发明的第二个目的是利用本发明方法获得靶向新冠S-RBD的高稳定性且高效自组装的候选三价蛋白药物，记为MP-5ff。

本发明提出的靶向新冠S-RBD的三价蛋白优化设计方法，采用竞争性结合RBD的抗新冠病毒小蛋白miniACE2(在原文献¹⁰中名为LCB3)作为单价药效蛋白，选择天然存在且低免疫原性的T4噬菌体纤维蛋白C-末端Foldon结构域作为三聚化支架。为了构建能够从几何尺度上匹配S-RBD靶点的三价蛋白，本发明基于S蛋白的结构信息设计长度和柔性不同的接头序列，构建出多个候选三价重组蛋白，通过分子动力学模拟方法探究其结构特性如构象稳定性、构象异质性以及自组装效率等，最后用实验方法验证其相关理化性质及功能，流程如图1所示。

本发明提出的靶向新冠S-RBD的三价蛋白优化设计方法，具体步骤如下。

第一步：根据靶标Spike蛋白的结构信息确定几何匹配的三聚化单元

在选取miniACE2作为单价药效蛋白以及foldon作为三聚化支架后，需要选择合适的接头序列(linker)将二者连接起来。linker的选择将直接决定整个三价蛋白结构的紧实度以及3个miniACE2的空间分布，进而影响其靶向S蛋白上3个RBD的几何匹配程度。基于S-RBD存在多种构象状态，选取PDB库中处于不同构象状态下的S蛋白结构并计算其RBD的间隔距离，发现3个RBD平均间隔距离约在范围内。根据前人研究，本发明选择能够在体内稳定表达的代表性柔性linker(GGGGS)_n和代表性刚性linker(EAAAK)_n，确定linker长度为n＝3或5，构建以foldon为三聚化支架、不同长度的(GGGGS)_n或(EAAAK)_n为linker的候选三价重组蛋白。

第二步：构建候选三价蛋白3D结构模型并进行全原子分子动力学模拟

为探究候选三价蛋白的结构特征及相关动力学行为，对其进行全原子分子动力学模拟。首先，需要构建候选三价蛋白的初始结构模型。从PDB数据库中获取miniACE2以及foldon三聚化支架的3D结构后用UCSFChimera软件对其进行预处理，通过在线服务器Swiss-Model进行模型构建，最后用SAVES服务器进行模型质量评估。

接着，使用GROMACS(Ver.2021)程序¹¹进行经典分子动力学模拟，采用AMBER 99SB-ILDN力场¹²以及SPC水模型¹³。将三价蛋白体系放置在立方体水盒子中间，其表面距离盒子边界不小于1.0nm，盒子的xyz三个维度均采用周期性边界条件。加入反离子Na⁺或Cl^-使体系呈电中性并将离子浓度设置为150mM，使得模拟环境更接近生理状态。系统中长程静电力作用采用Particle-Mesh-Ewald(PME)算法处理¹⁴，而短程作用力和范德华力的截断值(cut-off)设置为1.4nm。蛋白质分子涉及的氢键使用LINCS算法进行约束¹⁵。采用V-rescale温度耦合方法¹⁶调整体系温度为300K，用Berendsen压力耦合¹⁷控制体系压强为1个标准大气压。模拟过程主要包括以下三步：首先进行能量最小化以消除体系中不合理的原子接触，采用最速下降法直至所有原子受到的最大力小于1000kJ·mol^-1·nm^-1。接着依次在等体积等温(NVT)以及等温等压(NPT)条件下进行0.1ns的位置约束模拟使体系达到预平衡。最后在NPT系综中进行时长为300ns的成品模拟，步长为2fs。每个候选三价蛋白运行3支平行模拟，每支模拟时间为300ns，后续的模拟分析结果均是基于对3支模拟轨迹求平均得到的。

第三步：分析候选三价蛋白的构象稳定性

为了检查模拟轨迹的收敛性以及候选三价蛋白在模拟过程中的构象稳定性，以初始结构为参考，计算每支轨迹中三价蛋白的氨基酸骨架原子随时间变化的均方根偏差(RMSD)值，并对每个蛋白3支平行轨迹的结果求平均。RMSD值可用来衡量模拟过程中蛋白结构相对于参考结构的偏离程度，其波动幅度可以反映结构的稳定程度。接着，为了进一步探究分子内部的局部构象柔性，计算三价蛋白中每个氨基酸骨架原子在模拟时间内的均方根涨落(RMSF)值。该值可用于表征蛋白质各个氨基酸在整个模拟过程中的柔性和运动剧烈程度。

第四步：计算模拟轨迹中miniACE2的空间分布情况

在第一步中，为了获得能够在几何尺度上匹配S-RBD的三价蛋白，本发明设计了不同长度和柔性的linker用来连接三聚化支架和miniACE2。理想情况下，三价蛋白的3个miniACE2之间的分隔距离应该与S蛋白上3个RBD的分隔句距离在相似范围内。而3个miniACE2的分隔距离是由linker的长度、取向、柔性以及其与三聚化支架的衔接情况共同决定的。为了定量比较每个候选三价蛋白中3个miniACE2的分隔情况，计算3个miniACE2质心的间隔距离，得到的数值记为CoMdistance，用该数值表征每个三价蛋白中3个miniACE2的空间分布情况。

第五步：绘制自由能形貌图评估三价蛋白的构象异质性

为了更直观地展示候选三价蛋白在模拟过程中呈现的构象分布，评估其构象异质性及稳定性，本发明构建了自由能形貌图。抽取每支平行轨迹的最后200ns，并将其用'gmxtrjcat'工具连接起来，得到600ns总轨迹。选取三价蛋白氨基酸骨架原子相对初始结构的RMSD值以及上述CoMdistance作为反应坐标，将轨迹投射到这两个反应坐标构成的二维平面上，计算出各种构象出现的概率密度P(x)，就可以通过Bolzmann关系计算出某种概率密度下的吉布斯自由能G(x)。在自由能形貌图中，颜色越深的区域代表该处构象的概率密度越大，相对自由能越低，结构越稳定。若呈现单一能量阱，表明其构象分布集中，构象均一且稳定；若呈现多个能量阱，表明其可能具有多种优势构象。

第六步：计算亚基间结合自由能评估三价蛋白自组装效率

为了探究候选三价蛋白的自组装效率，本发明根据分子动力学模拟得到的稳定轨迹，取每一支轨迹的最后50ns，用MM-PB(GB)SA方法¹⁸计算其亚基之间的结合自由能，以此来表征其自组装为三聚体的效率。结合自由能数值越低，表明其结合亲和力越强。接着，针对高组装效率的候选蛋白，对其进行残基能量分解以探究各残基对结合自由能的贡献程度，从而进一步了解其相互作用模式。

第七步：候选三价蛋白的表达与实验验证

为了验证计算结果，在大肠杆菌中表达候选三价蛋白，用镍柱亲和层析对其进行纯化。然后将蛋白在AKTAavant层析系统上进行凝胶过滤层析，从而判断其三聚情况。之后，收集吸收光谱图上主峰位置对应的蛋白样品，并进行非变性凝胶电泳(Native-PAGE)以表征其不同构象状态及聚集形态。为了验证候选三价蛋白与S蛋白的结合亲和力，使用生物膜层干涉(BLI)技术进行检测，通过计算拟合得到候选三价蛋白与S蛋白的解离平衡常数K_D值。最后，采用假病毒中和实验进一步验证其抗新冠病毒的功能。

计算结果和实验结果显示，在构建的4个候选三价蛋白中，MP-5ff具有极佳的自组装效率和构象稳定性，不仅能够有效中和新冠病毒，且具有阻碍免疫逃逸的潜力。

可见，本发明提出的靶向新冠S-RBD的三价蛋白优化设计方法为多价药物设计提供了一定理论指导与新思路，且本发明提供的三价蛋白MP-5ff在新冠药物领域具有潜在的应用价值。

所述MP-5ff的氨基酸序列和核苷酸序列分别如SEQ ID NO.1、SEQ ID NO.2所示：

SEQ ID NO.1：

NDDELHMLMTDLVYEALHFAKDEEIKKRVFQLFELADKAYKNNDRQKLEKVVEELKE LLERLLSGGGGSGGGGSGGGGSGGGGSGGGGSGYIPEAPRDGQAYVRKDGEWVLLSTFL

SEQ ID NO.2：

AATGACGATGAACTGCACATGCTGATGACCGATCTGGTGTATGAAGCGCTGCATTTTGCGAAAGATGAAGAAATTAAAAAACGCGTGTTTCAGCTGTTTGAACTGGCGGATAAAGCGTATAAAAACAACGATCGTCAGAAACTGGAAAAAGTGGTGGAAGAACTGAAGGAATTACTGGAACGCTTATTAAGCGGTGGCGGTGGTAGCGGCGGCGGTGGCAGTGGCGGTGGTGGTAGCGGCGGCGGTGGCAGTGGCGGTGGCGGTAGCGGCTATATTCCGGAAGCGCCGCGCGATGGCCAAGCGTATGTGCGCAAAGATGGCGAATGGGTGCTGCTGAGCACCTTTCTG。

本发明还提供一种表达载体，其含有上述多核苷酸序列。

本发明还提供一种宿主细胞，可以用于转化上述表达载体。

附图说明

图1为靶向新冠S-RBD的三价蛋白优化设计流程图。

图2为PDB库中部分S蛋白的PDBID以及计算得到的RBD间隔距离。

图3为候选三价蛋白构建的示意图。

图4为候选三价蛋白在模拟过程中RMSD随时间变化图。

图5为MP-5ff和MP-5rf在模拟过程中每个氨基酸的RMSF值。

图6为模拟过程中CoMdistance随时间的变化图。

图7为根据模拟轨迹得到的自由能形貌图。

图8为候选三价蛋白亚基间结合自由能计算结果图。

图9为MP-5ff与foldon的残基能量分解图。

图10为凝胶过滤层析紫外吸收峰图。

图11为Native-PAGE电泳结果图。

图12为BLI检测结果图。

图13为假病毒中和检测结果图。

具体实施方式

下面通过具体实施例进一步描述本发明。

下述实施例中所用的实验方法，如无特定说明，均为常规方法。

下述实施例中所用的材料、试剂等，如无特定说明，均为从商业途径获得。

一、靶向新冠S-RBD的三价蛋白计算设计

在选取miniACE2作为单价药效蛋白以及foldon作为三聚化支架后，为了构建能够从几何尺度上匹配新冠S-RBD靶点的自组装三价重组蛋白，需要合理选择接头序列，linker的选择将直接决定整个三价蛋白结构的紧实度以及3个miniACE2的空间分布，进而影响其靶向S蛋白上3个RBD的几何匹配程度。由于S-RBD存在多种构象状态(open state,closedstate)，不同构象状态下3个RBD的几何特征也有所差异，因此所选linker的组成和长度也需要有一定的浮动性。本发明选取PDB库中处于不同构象状态下的S蛋白结构并计算其RBD的间隔距离，如图2。具体来讲，首先，求出每个结构文件中3个RBD整体的质心位置以及各自的质心位置，再计算出每个RBD的质心与整体质心之间的距离，最后对其求平均。结果显示，3个RBD平均间隔距离约在范围内。根据前人研究，(GGGGS)_n以及(EAAAK)_n是被广泛使用且能够在体内稳定表达的两种最常见的接头序列¹⁹，Li等人通过FRET实验显示(GGGGS)₅对于两个荧光蛋白CFP和YFP的实际间隔距离约为/>而(EAAAK)₅约为/> linker过长会导致其对蛋白酶敏感易降解，过短会导致其间隔的蛋白距离过近影响各自折叠²¹。因此，本发明基于最常用的代表性柔性linker(GGGGS)_n和代表性刚性linker(EAAAK)_n，确定linker长度为n＝3或5，构建以foldon为三聚化支架、不同长度的(GGGGS)_n或(EAAAK)_n为linker的候选三价重组蛋白，如图3。共有4个蛋白：miniACE2-(GGGGS)₃-foldon，miniACE2-(GGGGS)₅-foldon，miniACE2-(EAAAK)₃-foldon，miniACE2-(EAAAK)₅-foldon；为描述方便，4个蛋白依次简称为：MP-3ff、MP-5ff、MP-3rf、MP-5rf。其中MP表示MultivalentProtein,数字表示linker基本单元(GGGGS)或(EAAAK)的重复拷贝数，数字后的第一个字母f表示柔性linker，r表示刚性linker；最后一个字母f则代表三聚化支架foldon。

为了探究候选三价蛋白的结构特征及相关动力学行为，对候选三价蛋白进行全原子分子动力学模拟。首先，需要构建候选三价蛋白的初始结构模型。从ProteinDataBank(PDB)数据库中获得miniACE2以及foldon三聚化支架的3D结构(PDB ID分别为7JZN和1RFO)，用UCSFChimera软件对其进行预处理，补全缺失原子，并输出模版文件，通过在线服务器Swiss-Model进行模型构建。最后用SAVES服务器进行模型质量评估，主要用到其中PROCHECK模块²²和ERRAT模块²³。PROCHECK模块是以PDB库中高分辨率的晶体结构参数作为参考，输出模型的立体化学参数。通过计算蛋白质主链上每个残基的二面角phi和psi绘制拉氏图(Ramachandranplot)，并以此表示蛋白中允许和不允许的构象，位于不允许区的氨基酸数应小于氨基酸总数的5％。而ERRAT模块计算0.35nm范围之内不同的原子类型对之间形成的非键相互作用的数目，通过定义函数计算出ERRAT值，该值越高表示模型越佳，得分高于80则认为是高质量模型。经评估，本研究所构建的候选三价模型均是合理可靠的。

接着，使用GROMACS(Ver.2021)程序进行经典分子动力学模拟，采用AMBER 99SB-ILDN力场以及SPC水模型。将三价蛋白体系放置在立方体水盒子中间，其表面距离盒子边界不小于1.0nm，盒子的xyz三个维度均采用周期性边界条件。加入反离子Na⁺或Cl^-使体系呈电中性并将离子浓度设置为150mM，使得模拟环境更接近生理状态。系统中长程静电力作用采用Particle-Mesh-Ewald(PME)算法处理，而短程作用力和范德华力的截断值(cut-off)设置为1.4nm。蛋白质分子涉及的氢键使用LINCS算法进行约束。采用V-rescale温度耦合方法调整体系温度为300K，用Berendsen压力耦合控制体系压强为1个标准大气压。模拟过程主要包括以下三步：首先进行能量最小化以消除体系中不合理的原子接触，采用最速下降法直至所有原子受到的最大力小于1000kJ·mol^-1·nm^-1。接着依次在等体积等温(NVT)以及等温等压(NPT)条件下进行0.1ns的位置约束模拟使体系达到预平衡。最后在NPT系综中进行时长为300ns的成品模拟，步长为2fs。每个候选三价蛋白运行3支平行模拟，每支模拟时间为300ns,后续的模拟分析结果均是基于对3支模拟轨迹求平均得到的。

第三步：分析候选三价蛋白的构象稳定性

为了检查模拟轨迹的收敛性以及候选三价蛋白在模拟过程中的构象稳定性，以初始结构为参考，计算每支轨迹中三价蛋白的氨基酸骨架原子随时间变化的均方根偏差(RootMeanSquare Deviation,RMSD)值，并对每个蛋白3支平行轨迹的结果求平均，如图4。RMSD值可用来衡量模拟过程中蛋白结构相对于参考结构的偏离程度，其波动幅度可以反映结构的稳定程度。如图4可见，四个候选三价蛋白中，MP-5ff的模拟轨迹在50ns后就能达到平稳波动且其RMSD值稳定维持在1.5nm左右，该值明显小于其他3个蛋白，可见MP-5ff整体结构稳定性最佳。而MP-3rf和MP-3ff则在100ns后才达到了较为平缓的波动，其RMSD值分别约为2.1nm及1.8nm左右。MP-5rf的RMSD值则明显表现出了比其他3个蛋白更大的波动幅度，说明其结构不稳定或经历了较大的构象变化。因此，通过分析RMSD可知，MP-5ff和MP-5rf分别为构象稳定性最佳和最差的候选三价蛋白。

接着，为了进一步探究MP-5rf和MP-5ff分子内部的局部构象柔性，计算三价蛋白中每个氨基酸骨架原子在模拟时间内的均方根涨落(Root Mean Square Fluctuation,RMSF)值，见图5。该值可用于表征蛋白质各个氨基酸在整个模拟过程中的柔性和运动剧烈程度。如图5可见，MP-5rf中每个残基都呈现出比MP-5ff更大的波动，这也解释了为何其RMSD值更大且波动范围也更大。值得注意的是，对于foldon结构域(即在氨基酸序列第90-116处)，MP-5ff保持稳定，而MP-5rf波动显著，这也导致MP-5rf整体构象稳定性差。由于foldon结构域是驱动这些候选三价蛋白自组装的主要结构基础，因此该区域的原子波动大可能导致foldon结构域中残基之间相互作用变弱，进而影响其自组装效率，这也在后续分析与实验中得到证实。

第四步：计算模拟轨迹中miniACE2的空间分布情况

在第一步中，为了获得能够在几何尺度上匹配S-RBD的三价蛋白，本发明设计了不同长度和柔性的linker用来连接三聚化支架和miniACE2。理想情况下，三价蛋白的3个miniACE2之间的分隔距离应该与S蛋白上3个RBD的分隔距离在相似范围内。而3个miniACE2的实际分隔距离是由linker的长度、取向、柔性以及其与三聚化支架的衔接情况共同决定的。为了定量比较每个候选三价蛋白中3个miniACE2的分隔情况，对每支轨迹，首先计算出3个miniACE2各自的质心位置，再计算其整体质心位置，最后再求出整体质心位置到3个miniACE2质心位置的距离，并对其求平均，得到的数值记为CoMdistance，如图6，用该数值表征每个三价蛋白中3个miniACE2的分隔程度。同时，我们也计算了Baker课题组利用冷冻电镜解析的miniACE2与S蛋白3个RBD结合构象(PDB:7JZN)下的CoMdistance，范围约在之内。结果显示，所构建的4个候选三价蛋白中miniACE2分隔距离各异，其中MP-5ff、MP-5rf、MP-3rf的CoMdistance稳定后均在/>范围内，说明其能够在空间上匹配S-RBD。

第五步：绘制自由能形貌图评估三价蛋白的构象异质性

为了更直观地展示候选三价蛋白在模拟过程中呈现的构象分布，评估其构象异质性及稳定性，本发明构建了自由能形貌图，见图7。自由能形貌图(Free Energy Landscape，FEL)表示分子在模拟过程中所经历的所有可能构象到相应能量的映射。具体来讲，为了同时保证采样的充分性以及轨迹的稳定性，对每个三价蛋白，抽取每支平行轨迹的最后200ns，并将其用'gmx trjcat'工具连接起来，得到600ns总轨迹。选取三价蛋白氨基酸骨架原子相对初始结构的RMSD值以及上述CoMdistance作为反应坐标，将轨迹投射到这两个反应坐标构成的二维平面上，计算出各种构象出现的概率密度P(x)，就可以通过Bolzmann关系计算出某种概率密度下的吉布斯自由能G(x)：

G(x)＝-k_BT·ln[P(x)]+const， (1)

式中，k_B是玻尔兹曼常数，T代表温度，const为常数项。因此，在自由能形貌图中，颜色越深的区域代表该处构象的概率密度越大，相对自由能越低，结构越稳定。如图7所示，MP-3ff、MP-3rf、MP-5rf都具有多个能量势阱，表示其可能具有多种优势构象，即更大的构象异质性，这也表明其构象稳定性更差。相反，MP-5ff具有单一能量阱，表明其构象分布集中，构象均一且稳定。

第六步：计算亚基间结合自由能评估三价蛋白自组装效率

为了探究候选三价蛋白的自组装效率，根据分子动力学模拟得到的稳定轨迹，取每一支轨迹的最后50ns，用MM-PB(GB)SA(Molecular Mechanics/Poisson-Boltzmann(Generalized Born)Surface Area)方法计算亚基之间的结合自由能ΔG_bind。该方法的基本假设是一个体系在溶剂中的结合自由能来源于三部分，即溶剂化自由能ΔG_solv、分子气相能ΔE_MM以及熵的贡献-TΔS，如下式(2)：

ΔG_bind＝ΔG_solv+ΔE_MM-TΔS， (2)

其中，溶剂化能又分为极性溶剂化能和非极性溶剂化能，对于前者，主要有两种计算方法：Poisson-Boltzmann(PB)和GeneralizedBorn(GB)方程。由于PB模型耗费大量时间且本研究只需要求出相对值用以比较不同候选三价蛋白亚基间结合能，因此采用PB的近似解—GB模型进行计算。对每个三价蛋白，计算其A亚基与BC亚基、B亚基与AC亚基，C亚基与AB亚基的结合能并对其求平均，以此来表征其自组装为三聚体的效率。如图8，在这4个候选三价蛋白中，MP-5ff亚基间结合自由能最低，为-201.3kcal·mol^-1，表明其亚基间结合亲和力强，有利于其自组装形成稳定的三价蛋白。而MP-5rf则呈现出最高的结合自由能数值，为-157.4kcal·mol^-1，这表明，与另外三个候选三价蛋白相比，MP-5rf的亚基间相互作用更弱，不利于其自组装为稳定的三价形式，组装效率差。而MP-3ff和MP-3rf的数值则介于二者之间。根据计算结果，MP-5ff是自组装效率最高的候选三价蛋白。

为了从分子层面探究MP-5ff高组装能力的成因，本发明以最稳定的一只轨迹为例，列出了MP-5ff亚基间结合自由能各分量的平均值，见下表：

表中各能量单位均为kcal/mol，其中ΔG_vdw表示真空中范德华作用能，ΔG_elec表示真空中静电作用能，ΔG_polar表示极性溶剂化能，ΔG_nonpolar表示非极性溶剂化能，ΔG_bind表示结合自由能。

可见，结合能分量ΔG_vdw为-264.53kcal·mol^-1，表明范德华力对维持三聚体的稳定性起主导作用，且ΔG_polar、ΔG_nonpolar均为负值，表明溶剂环境有利于亚基间的相互作用，且极性部分贡献更为显著。而ΔG_elec为217.62kcal·mol^-1，表明真空环境下蛋白亚基间存在静电作用，会减弱亚基间的亲和作用，不利于三价形式的稳定。

为了进一步了解MP-5ff亚基间相互作用模式，对其进行残基能量分解以探究各残基对结合自由能的贡献程度。同时，对未连接任何linker或蛋白的独立foldon支架进行300ns的分子动力学模拟，将其作为对照，同样计算其亚基间结合自由能后对其进行能量分解。如图9可见，MP-5ff的(GGGGS)₅柔性接头序列对其亚基间高结合能力具有贡献，尤其是Ser69、Gly71、Gly76、Gly77、Gly81、Gly82、Gly83、Ser84。其中，亚基间的Gly主要参与范德华相互作用，而Ser则是通过形成氢键来维持稳定。同时，柔性linker之间的相互作用也使得foldon结构域的稳定性进一步增强，其中Tyr91、Ile92、Pro93、Glu94、Arg97、Arg104是对foldon自组装发挥关键作用的氨基酸，图9中可见，MP-5ff中这几个残基的能量低于单独foldon支架中的，表明在MP-5ff中这几个残基参与的相互作用得到进一步增强。

因此，MP-5ff高稳定性及高组装能力的成因不仅源自其foldon结构域本身的强相互作用，且其每个亚基linker区域之间的相互作用也为维持其整体构象稳定性具有重要贡献，而这也进一步增加了foldon结构域的稳定性，从而保证了其高组装能力。

二、候选三价蛋白的表达及实验验证

1、质粒构建与转化

本发明所用质粒均由苏州金唯智生物科技有限公司提供。将质粒转化至Rosetta(DE3)感受态细胞后，平板培养过夜，挑取单克隆送至上海杰李生物技术有限公司进行测序。测序成功后将菌种保存到-80℃的冰箱。

2、蛋白表达与纯化

(1)蛋白表达：从-80℃取出保种的相应蛋白的Rosetta菌10μL，加到10mL LB(Kana+Cm)，37℃，200rpm摇20h左右；取4mL菌液于400mL LB(Kana+Cm)，分别加入400μL的Kana和Cm，继续摇4-6h左右，直至OD为0.6-0.8左右；每瓶加入200μL IPTG，于20℃，200rpm诱导表达12h；离心机预冷到4℃，用50mL离心管收集菌体，5000rpm离心5min，直至菌液全部离心为菌体沉淀，保存于-80℃；

(2)重悬菌体：加裂解液重悬菌体(每1g菌需要5mL裂解液，对应50μL PMSF)；

(3)超声破碎：3s on，5s off，5min，破3次，每破碎一次冰浴5min；

(4)离心：4℃，12000rpm，离心30min后吸出全部上清，过滤膜；

(5)使用重力柱进行镍柱亲和层析：将Ni填料分装至1.5ml EP管并离心，吸掉上清后加入无菌抽滤水重悬，再离心；吸掉上清后加入平衡液重悬；向重力柱中加入5ml平衡液冲洗，以排除滤网气泡，打开水阀，使其自然留下，直至柱中留存0.5ml左右平衡液，关闭水阀；沿壁加入填料悬液1.5ml后立即沿壁加入5ml平衡液使其充满剩余的柱体积，打开水阀，使其自然沉降；待液面接近柱床前，加入平衡液5ml使其自然流出至填料表面上方；加入上清液样品，使其自然流出至填料表面上方，收集流穿液；加入10ml平衡液，使其自然流出至填料表面上方，收集淋洗液；加入80mM咪唑洗脱液5ml，使其自然流干，收集洗脱液；加入300mM咪唑洗脱液5ml，使其自然流干，收集洗脱液并测浓度；

(6)脱盐：在AKTAavant层析系统上使用HiTrapDesalting脱盐柱对上述300mM咪唑洗脱液进行脱盐处理，将缓冲液置换为PBS溶液；

(7)酶切并进行反挂柱：在脱盐后的目的蛋白溶液中加入TEV酶，20℃酶切4h；用上述装填好Ni填料的重力柱进行反挂柱实验，进行预平衡后，将酶切后的蛋白溶液体系加入，收集流穿液并将其浓缩至500μL。

3、分子筛实验以及Native-PAGE

(1)分子筛实验(凝胶过滤层析)：将浓缩后的蛋白样品12000rpm离心5min后吸取上清作为分子筛上样样品。在AKTAavant层析系统上，接上Superdex 200Increase 10/300GL预装柱，系统流速设置为0.5mL/min，通过1mL注射器将200μL样品注射到200μL上样环，使用96孔板进行样品收集。结束后，用Evaluation模块分析并导出A280曲线数据。以官方给出的标准蛋白出峰位置为参考。如图10所示，候选三价蛋白的三聚峰均在14-15mL体积处，其中MP-3rf、MP-5ff、MP-3ff在三聚峰位置均具有完整的峰形，表明其具有较好的自组装效率。而MP-5rf出现了两个连续的峰形，推测可能为三聚体的不同构象形式或者存在大于三价形式的峰，表明其三价形式稳定性欠佳，自组装效率较差。以上实验结果与计算结果相符。

(2)Native-PAGE：接着，将分子筛主峰收集到的蛋白样品进行非变性聚丙烯酰胺凝胶电泳(Native-PAGE)。在Native-PAGE中，电泳迁移率不仅和蛋白质的等电点有关，还和蛋白质的分子量以及分子形状有关。因此，对于同一种蛋白的同种寡聚形式，其不同构象是造成条带分离的主要原因。如图11所示，MP-3ff、MP-3rf、MP-5rf呈现出多个条带，其可能原因是这三个蛋白发生降解，或者是具有多种三聚化优势构象，无论是哪种原因，都表明其构象不稳定，均一性差。且MP-5rf在55-70kD处出现了明显条带，表明其可能具有高于三价的组装形式，无法维持稳定的三价形态。相反，MP-5ff具有单一的三聚化蛋白条带，表明其构象均一且稳定。以上实验结果符合上述计算结果。

4、BLI检测

基于上述计算结果以及实验结果，MP-5ff是本发明计算设计出的靶向S-RBD的候选三价蛋白中结构最稳定且自组装效率最高的。为了验证MP-5ff与S蛋白的结合亲和力，采用生物膜层干涉技术(Bio-Layer Interferometry,BLI)进行检测，实验委托上海近岸科技有限公司完成。检测所用仪器为Octet RED 96e，所用传感器为AR2G传感器，所用S蛋白购于上海近岸科技有限公司，货号为DRA49(武汉株，记为WT)。作为对照，同时也检测了miniACE2与S蛋白的结合亲和力。具体来讲，DRA49以浓度25nM减半稀释6个梯度，将固化MP-5ff的AR2G传感器捕获DRA49，结合时间220s，解离时间500s；DRA49以浓度50nM减半稀释5个梯度，将固化miniACE2的AR2G传感器捕获DRA49，结合时间300s，解离时间500s。

另外，为了检验MP-5ff是否具有中和S蛋白突变株的潜力，我们用BLI技术检测了当下传染性最强的Omicron变异株与MP-5ff以及miniACE2的结合亲和力。同样，使用AR2G传感器分别固化MP-5ff以及miniACE2，突变体S蛋白以浓度50nM减半稀释4个梯度，将固化MP-5ff的AR2G传感器捕获突变体S蛋白，结合时间400s，解离时间500s。突变体S蛋白以浓度250nM减半稀释5个梯度，将固化miniACE2的AR2G传感器分别捕获突变体S蛋白，结合时间300s，解离时间500s。

根据干涉光的信号变化，拟合得出亲和性数据。以上结合方式均属于慢结合慢解离，采用1:1结合的拟合方式，最终得到的亲和性以及动力学数据如图12。结果显示，对于野生型S蛋白(DRA49)，本发明经过计算设计出的高稳定性蛋白MP-5ff具有与miniACE2相当的K_D值(即结合亲和力)，并且其结合速率更快，单位时间内解离百分比也更少。而对于Omicron变异株，MP-5ff与其结合的K_D值达到了2.17nM，miniACE2则显示无结合信号。可见，MP-5ff能够结合OmicronS蛋白，这表明其可能具有阻碍免疫逃逸的潜力。

5、假病毒中和实验

新冠病毒的假病毒中和实验委托北京百普赛斯生物科技股份有限公司完成。所用假病毒毒株为SARS-CoV-2Spike(WT)Fluc-GFP Pseudovirus，货号CMO-PAN001-C01。实验过程为：

(1)将89％ DMEM培养基、10％胎牛血清和1％青霉素-链霉素混合以制备完整的DMEM培养基；

(2)向培养基中加入HEK293/人ACE2过表达稳定细胞系，并置于CO₂培养箱中(37℃，5％ CO₂)培养；

(3)在96孔板上准备一系列的样品稀释液：MP-5ff和miniACE2均为共8个浓度梯度(10000ng/mL 5倍稀释8个梯度)；

(4)将病毒与蛋白样品进行孵育：将样品(每孔80μL)添加到96孔白色平底板中；在室温下解冻假病毒；用DMEM完全培养基将假病毒稀释100倍后，添加到96孔板中(每孔20μL)；对于细胞对照组，添加完整的DMEM培养基(每孔20μL)；轻轻混合均匀后，将96孔板置于CO₂培养箱中(37℃，5％ CO₂)孵育1h；

(5)用DEME完全培养基将HEK293细胞重悬(5×10⁵cells per mL)，并取100μL细胞悬液加入96孔板中；轻轻混合均匀后，将96孔板置于CO₂培养箱中(37℃，5％ CO₂)培养48h；

(6)取出96孔板，每孔弃去100μL培养基，将板平衡至室温10分钟；加入100μL检测试剂(britelite plus Reporter Gene Assay System)并用迷你摇床充分混合2分钟；最后用发光计(酶标仪)读取板的发光值；检测时间为0.1s/孔。

假病毒中和实验结果如图13所示，miniACE2中和新冠病毒的IC50值为221pM，而MP-5ff的IC50值则只有90pM。表明MP-5ff能够有效中和新冠病毒，且中和能力强于miniACE2。

以上实验结果表明，本发明提出的靶向S-RBD的三价蛋白优化设计合理且十分有效。

参考文选

1.Walls,A.C.et al.Structure,Function,and Antigenicity of the SARS-CoV-2Spike Glycoprotein.Cell181,281-292.e6(2020).

2.Zamorano Cuervo,N.&Grandvaux,N.ACE2:Evidence of role as entryreceptor for SARS-CoV-2 and implications in comorbidities.eLife9,e61390(2020).

3.Pomplun,S.Targeting the SARS-CoV-2-spike protein:from antibodies tominiproteins and peptides.RSC Med.Chem.12,197–202(2021).

4.Mammen,M.,Choi,S.-K.&Whitesides,G.M.Polyvalent Interactions inBiological Systems:Implications for Design and Use of Multivalent Ligands andInhibitors.Angew.Chem.-Int.Edit.37,2754–2794(1998).

5.Arsiwala,A.,Castro,A.,Frey,S.,Stathos,M.&Kane,R.S.DesigningMultivalent Ligands to Control Biological Interactions:From Vaccines andCellular Effectors to Targeted Drug Delivery.Chem.-Asian J.14,244–255(2019).

6.Cuesta,A.M.,Sainz-Pastor,N.,Bonet,J.,Oliva,B.&Alvarez-Vallina,L.Multivalent antibodies:when design surpasses evolution.TrendsBiotechnol.28,355–362(2010).

7.Zupancic,J.M.et al.Engineered Multivalent Nanobodies Potently andBroadly Neutralize SARS-CoV-2 Variants.Adv.Ther.4,2100099(2021).

8.N.et al.The coming of age of engineered multivalentantibodies.Drug Discov.Today20,588–594(2015).

9.Cui,X.et al.Trivalent soluble TNF Receptor,a potent TNF-αantagonistfor the treatment collagen-induced arthritis.Sci Rep.8,7327(2018).

10.Cao,L.et al.De novo design of picomolar SARS-CoV-2 miniproteininhibitors.Science370,426–431(2020).

11.Abraham,M.J.et al.GROMACS:High performance molecular simulationsthrough multi-level parallelism from laptops to supercomputers.SoftwareX1-2,19–25(2015).

12.Lindorff-Larsen,K.et al.Improved side-chain torsion potentials forthe Amber ff99SB protein force field.Proteins78,1950–1958(2010).

13.Berendsen,H.J.C.,Postma,J.P.M.,van Gunsteren,W.F.&Hermans,J.Interaction Models for Water in Relation to ProteinHydration.Intermolecular Forces:Proceedings of the Fourteenth JerusalemSymposium on Quantum Chemistry and Biochemistry Held in Jerusalem,Israel,April 13–16,1981(ed.Pullman,B.)331–342(Springer Netherlands,1981).doi:10.1007/978-94-015-7658-1_21.

14.Darden,T.,York,D.&Pedersen,L.Particle mesh Ewald:An N·log(N)method for Ewald sums in large systems.J.Chem.Phys.98,10089–10092(1993).

15.Hess,B.,Bekker,H.,Berendsen,H.J.C.&Fraaije,J.G.E.M.LINCS:A linearconstraint solver for molecular simulations.J.Comput.Chem.18,1463–1472(1997).

16.Bussi,G.,Donadio,D.&Parrinello,M.Canonical sampling throughvelocity rescaling.J.Chem.Phys.126,014101(2007).

17.Berendsen,H.J.C.,Postma,J.P.M.,van Gunsteren,W.F.,DiNola,A.&Haak,J.R.Molecular dynamics with coupling to an external bath.J.Chem.Phys.81,3684–3690(1984).

18.Genheden,S.&Ryde,U.The MM/PBSA and MM/GBSA methods to estimateligand-binding affinities.Expert Opin.Drug Discov,10,449–461(2015).

19.Chen,X.,Zaro,J.L.&Shen,W.-C.Fusion protein linkers:Property,designand functionality.Adv.Drug Deliv.Rev.65,1357–1369(2013).

20.Li,G.et al.Construction of a linker library with widelycontrollable flexibility for fusion protein design.Appl.Microbiol.Biotechnol.100,215–225(2016).

21.Shamriz,S.,Ofoghi,H.&Moazami,N.Effect of linker length andresidues on the structure and stability of a fusion protein with malariavaccine application.Comput.Biol.Med.76,24–29(2016).

22.Laskowski,R.A.,MacArthur,M.W.,Moss,D.S.&Thornton,J.M.PROCHECK:aprogram to check the stereochemical quality of protein structures.J.Appl.Crystallogr.26,283–291(1993).

23.Colovos,C.&Yeates,T.O.Verification of protein structures:patternsof nonbonded atomic interactions.Protein Sci.2,1511–1519(1993)。

Claims

1. 一种靶向新冠S-RBD的三价蛋白MP-5ff，其氨基酸序列如SEQ ID NO.1所示，核苷酸序列如SEQ ID NO.2所示。

2.一种如权利要求1所述的靶向新冠S-RBD的三价蛋白MP-5ff的制备方法，其特征在于：具体步骤为：

在大肠杆菌中表达所述三价蛋白MP-5ff，用镍柱亲和层析对其进行纯化；然后将蛋白在AKTAavant层析系统上进行凝胶过滤层析，从而判断其三聚情况；之后，收集吸收光谱图上主峰位置对应的蛋白样品，并进行非变性凝胶电泳Native-PAGE 以表征其构象状态及聚集形态；为了验证所述三价蛋白MP-5ff与S蛋白的结合亲和力，使用生物膜层干涉 BLI 技术进行检测，通过计算拟合得到其与S蛋白的K_D值；最后，采用假病毒中和实验进一步验证其抗新冠病毒的功能。

3.一种表达载体，其含有编码如权利要求1所述的三价蛋白MP-5ff的多核苷酸序列。

4.一种宿主细胞，用于转化如权利要求3所述的表达载体。

5.一种如权利要求1所述的三价蛋白MP-5ff或者如权利要求3所述的表达载体在制备抗新冠病毒蛋白药物中的应用。