CN115515972A

CN115515972A - 血管紧张素转换酶2(ace2)的从头蛋白诱饵

Info

Publication number: CN115515972A
Application number: CN202180029294.9A
Authority: CN
Inventors: T·林斯基; D·A·席尔瓦·曼扎诺; N·科迪纳·卡斯蒂略; J·尼尔森; M·J·沃克
Original assignee: Neil Lukin Therapeutics
Current assignee: Neil Lukin Therapeutics
Priority date: 2020-04-07
Filing date: 2021-04-06
Publication date: 2022-12-23
Also published as: JP2023521706A; EP4132964A2; WO2021207207A3; AU2021251760A1; CA3173628A1; KR20220164736A; WO2021207207A2

Abstract

本文提供了ACE2的从头蛋白诱饵及其用途。在一些实施方案中，提供了使用ACE2蛋白诱饵治疗冠状病毒感染的方法。

Description

血管紧张素转换酶2(ACE2)的从头蛋白诱饵

相关申请的交叉引用

本申请要求2020年4月7日提交的美国临时申请第63/006,463号；2020年5月21日提交的美国临时申请第63/028,401号；2020年6月13日提交的美国临时申请第62/705,150号；2020年7月22日提交的美国临时申请第63/055,051号；2020年8月3日提交的美国临时申请第63/060,489号；2020年10月20日提交的美国临时申请第63/094,179号；和2021年2月3日提交的美国临时申请第63/145,352号的优先权的权益；出于任何目的，它们中的每一个都通过引用以其全文并入本文。

技术领域

本发明涉及ACE2的从头蛋白诱饵。

背景技术

病毒经常利用细胞表面相关蛋白进入并且感染宿主细胞。中和抗体可通过与病毒表面结合，阻止其与一种或多种靶细胞表面蛋白的相互作用和/或预防感染所需的病毒相关构象变化，从而抑制这种过程。因此，疫苗接种已成为对抗许多病毒性疾病的广泛有用的工具。基于RNA的病毒是这种策略的常见例外。中和抗体以与病毒与其细胞靶点相互作用的方式完全不同的方式与病毒蛋白结合。因此，具有高突变率的RNA病毒通常利用这种结构差异，通过重塑其受体结合蛋白的形状来逃避中和抗体，同时保持与其一种或多种靶受体的相互作用，从而逃避免疫系统。

冠状病毒是大型有包膜的正链RNA病毒。基因组被包装在由核衣壳蛋白形成的螺旋衣壳内，并且进一步被病毒包膜包围。至少三种结构蛋白与病毒包膜相关，包括包膜锚定刺突蛋白。冠状病毒识别多种受体，并且通过刺突蛋白结合介导冠状病毒通过那些受体进入宿主细胞。据信冠状病毒通过两步过程进入宿主细胞。首先，刺突蛋白通过其S1亚基与宿主细胞表面的受体结合，然后通过其S2亚基融合病毒和宿主膜。病毒吸附步骤和膜融合过程均通过刺突蛋白识别宿主受体介导。甲型冠状病毒HCoV-NL63和乙型冠状病毒SARS-CoV均识别受体锌肽酶血管紧张素转换酶2(ACE2)。最近，发现ACE2也是2019-nCov的功能受体，2019-nCov是一种新型SARS样冠状病毒，也称为SARS-CoV-2。

SARS-CoV-2是一种导致冠状病毒病2019(COVID-19)的高度传染性病毒。自出现以来，SARS-CoV-2已导致数百万例COVID19病例，并且已成为全球大流行病。虽然大多数受试者无症状或患有轻度疾病，但许多受试者将发展为伴有呼吸困难或缺氧的严重疾病或伴有需要正压通气的呼吸衰竭、休克或多器官衰竭症状的危重疾病。需要鉴定能够预防病毒(如冠状病毒)侵入宿主细胞的剂。本发明满足这个和其他需要。

附图说明

图1–图1是显示从头设计的ACE2蛋白诱饵抑制病毒进入细胞的示意图。SARS-CoV和SARS-CoV-2病毒首先通过刺突蛋白的RBD域与人细胞表面上的ACE2受体结合进入细胞(左)。从头设计的ACE2诱饵以与天然ACE2相同的方式与RBD域结合，但与ACE2不同，它没有生物学功能。诱饵有效地隔离病毒与天然ACE2受体结合，并且预防病毒进入细胞，同时保持天然ACE2功能水平完整(右)。

图2A至图2F–图2A至图2F通过酵母表面展示证明从头ACE2蛋白诱饵CTC-445与SARS-CoV-2刺突/RBD蛋白结合。图2A至图2B显示阳性对照(ACE-2)，并且图2C至图2D显示阴性对照(人IL-21R)。图2E至图2F显示CTC-445。

图3A至图3D–图3A至图3D证明，对照人ACE2(3A-3B)和从头蛋白诱饵CTC-445(3C-3D)与SARS-CoV-2刺突/RBD蛋白结合，并且与可溶性ACE2竞争结合刺突/RBD蛋白。

图4–图4显示纯化的ACE2蛋白诱饵CTC-445通过Octet生物层干涉法(BLI)结合测定的结合动力学。

图5A至图5H–图5A至图5H显示选择纯化的ACE2蛋白诱饵通过Octet BLI结合测定的结合动力学。

图6A至图6H–图6A至图6H显示选择纯化的ACE2蛋白诱饵通过Octet BLI结合测定的结合动力学。

图7A至图7H–图7A至图7H显示选择纯化的ACE2蛋白诱饵CTC-445变体通过OctetBLI结合测定的结合动力学。

图8A至图8C–ACE2蛋白诱饵CTC-445(A)、CTC-445.2(B)和CTC-445.2d(C)在222nm处的圆二色吸收。插图显示测试品在20℃、加热至95℃-99℃(虚线)和将加热样品冷却至20℃后的远紫外波长光谱。8B和8C的Y轴与8A的Y轴相同。

图9A至图9C–图9A至图9C显示ACE2蛋白诱饵CTC-445、CTC-445.2和CTC-445.2d在重复加热和冷却循环后的热回收。数据显示，即使在重复热变性后，设计的蛋白质也会重新折叠。

图10A至图10C–图10A至图10C显示纯化的ACE2蛋白诱饵CTC-445(A)、CTC 445.2(B)和CTC-445.2d(C)通过Octet BLI结合测定的结合动力学。

图11–图11提供了选择ACE2蛋白诱饵的效力对比其分子量的图。通过ELISA测量IC₅₀。

图12A至图12B–图12A显示使用携带荧光素酶报告基因并且在其表面表达SARS-CoV-2刺突蛋白的非复制性VSV假病毒进行的中和测定。用ACE2蛋白诱饵CTC-445.2和CTC-445.2d对过表达ACE2的HEK 293T细胞进行病毒中和。在与细胞孵育之前，将测试蛋白用假病毒预孵育。使用从20μM(CTC-445.2)或10μM(CTC-445.2d)开始的3倍连续稀释液对样品一式两份进行测试。平行进行细胞活力测定(12B)。

图13–图13显示鼻内给药后ACE2蛋白诱饵CTC-445.2d在小鼠肺(顶部)和血浆(底部)中的生物利用度。使用中尺度发现(Meso Scale Discovery)平台对肺溶解物和血浆中的蛋白质浓度进行定量。

图14–图14显示通过从Mca-APK(DNP)底物酶促释放游离荧光团测量的ACE2功能活性。使用DX600肽作为阳性对照显示ACE2抑制。

图15A至图15B–图15显示ACE2蛋白诱饵CTC-445.2(A)和CTC-445.2d(B)与SARS-CoV-1通过Octet BLI结合测定的结合动力学。

图16A至图16E–图16A至图16E显示ACE2蛋白诱饵CTC-445.2与SARS-CoV-2RBD突变体通过Octet结合测定的结合动力学。

图17–图17提供了与SARS-CoV-2刺突蛋白RBD复合的设计的ACE2蛋白诱饵CTC-445(表面呈现)。卡通呈现右侧的图显示设计的序列的偏置正向折叠模拟。使用Rosetta对设计的序列进行从头算结构预测。图中的每个点代表一个独立的折叠轨迹，所述轨迹是通过蒙特卡罗(Monte Carlo)插入来自解析蛋白质结构的片段计算的。通过在每个残基位置使用与设计的结构具有最低RMSD(9-聚体和3-聚体)的小片段子集，折叠模拟偏向于设计的构象。红色(或黑色表示B&W)点是使用Rosetta's vall结构数据库中的5个片段计算的轨迹，每个氨基酸位置的设计具有最低的RMSD。棕色(或灰色)点是使用设计模型本身的片段加上8个最低RMSD 3聚体和9聚体计算的轨迹。漏斗形能量图景表明设计的结构是全局能量最小值，并且相对于替代构象具有相当大的能隙。

图18A至图18B–图18A至图18B显示ACE2蛋白诱饵CTC-640与已知结构的非冗余数据库的结构对齐。在重新布线和反向模式下，使用MICAN进行结构对齐，要对齐的Cα原子之间的最大距离为10.0A。每个灰色点代表数据库中具有不同结构的CTC-640的结构对齐。每个黑色点代表CTC-640与ACE2的不同结构的结构对齐。对于这两个图，丢弃了<50个总残基的结构对齐。A)使用TMalign进行结构对齐，所述TMalign基于多肽链中二级结构元件的顺序对齐结构。基于结构对齐的残基计算序列同一性。尽管CTC-640模拟了ACE2结合表面，但它在线性结构或序列上与数据库中的任何蛋白质(包括ACE2)都没有很好地对齐。B)使用MICAN在重新布线/反向模式下进行结构对齐，这允许二级结构的反向方向、替代对齐和非顺序对齐。对于CTC-640观察到的最高序列同一性是与ACE2，其中H1+H2+H3与ACE2中的对应物正确比对，比对的残基的序列同一性为33.7％。

图19A至图19C–图19A至图19C显示ACE2蛋白诱饵CTC-708(CTC-445.2t)通过Octet结合测定与SARS-CoV-2(19A)、SARS-CoV-1(19B)结合的动力学和竞争测定的结果

图20A至图20C–图20A至图20C提供了ACE2蛋白诱饵CTC445.2的深度突变扫描结果，并且使用logomaker[参考：https://www.biorxiv.org/content/10.1101/635029v1]绘制为序列标识图。字母根据它们的概率进行缩放，并且从最高概率(顶部)到最低概率(底部)排序。CTC445.2的原始序列以黑色阴影显示。残基1-54示于20A，残基55-107示于20B，残基108-160示于图20C。

图21A至图21C-图21A显示使用携带荧光素酶报告基因并且在其表面表达SARS-CoV-2(GenBank：QHD43416.1)刺突蛋的非复制性VSV假病毒确定的过度表达hACE2的工程化HEK293T细胞中用ACE2蛋白诱饵CTC445.2d和CTC445.3d中和SARS-CoV-2感染。图21B显示使用表达VSVg而不是刺突蛋白的对照假病毒的中和测定。图21C显示用ACE2蛋白诱饵CTC-445.2d和CTC-445.3d孵育的工程化HEK293T细胞的细胞活力。

发明内容

诸位发明人已经构建了可以准确概括某些冠状病毒靶向的天然结合表面的从头蛋白。特别地，诸位发明人已经构建了呈现被冠状病毒特别是使用ACE2介导进入宿主细胞的冠状病毒识别的结合表面的从头蛋白。通过与冠状病毒结合，这些从头蛋白可以充当宿主ACE2蛋白诱饵，并且在某些方面预防病毒与其受体ACE2结合。因此，本文尤其提供了与SARS-CoV和SARS-CoV-2的冠状病毒刺突蛋白结合的从头蛋白、ACE2蛋白诱饵。本发明的蛋白质尤其用于抑制或中和病毒的活性。在一些实施方案中，所述蛋白质可用于阻断所述病毒与其宿主细胞受体的结合并且用于预防所述冠状病毒进入宿主细胞。在一些实施方案中，所述蛋白质通过抑制所述病毒的细胞间传播而发挥作用。在某些实施方案中，所述蛋白质可用于预防、治疗或改善受试者中冠状病毒感染的至少一种症状。在某些实施方案中，可以向患有冠状病毒感染或有患冠状病毒感染风险的受试者预防性地或治疗性地施用所述蛋白质。

在第一方面，本发明提供从头蛋白，即ACE2蛋白诱饵，其与冠状病毒刺突蛋白特异性结合，特别是来自那些使用ACE2作为其受体以促进病毒进入靶细胞的冠状病毒(例如，SARS-CoV和SARS-CoV-2)的刺突蛋白。还提供了从头蛋白，即ACE2蛋白诱饵，其阻断(例如，部分或完全)冠状病毒刺突蛋白与其天然受体结合，特别是阻断冠状病毒刺突蛋白与ACE2结合。在一些实施方案中，本发明提供了从头蛋白，即ACE2蛋白诱饵，其阻断冠状病毒与其天然人、骆驼或蝙蝠ACE2受体的结合。

本发明的从头蛋白是非天然存在的并且由肽域组成，所述从头蛋白包含至少两个α螺旋域H1和H2以及任选的β发夹域H3。这三个域与所述冠状病毒刺突蛋白交界。本发明的示例性从头蛋白还包含至少一个结构域，所述至少一个结构域促进所述H1和H2α螺旋和H3β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现。在一些方面，本发明的示例性从头蛋白包含至少两个结构域，所述至少两个结构域促进所述H1和H2α螺旋和H3β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现。所述H1和H2α螺旋域和任选的β发夹包含与所述冠状病毒刺突蛋白相互作用/充当结合位点的氨基酸残基。

本发明的从头蛋白与冠状病毒刺突蛋白受体结合域中的氨基酸残基相互作用。不希望受理论束缚，对于SARS-CoV，RBD(受体结合域)上的预期结合残基是：442、443、461、462、463、470、471、472、473、475、476、479、481、482、483、486、487、488、489和491，并且对于SARS-CoV-2，预期的结合残基是：455、456、475、476、477、486、487、489、490、493、496、497、498、500、501、502、504和505。

在相关方面，本发明不仅提供了包含肽域H1、H2和H3的蛋白质，还提供了肽域本身。

在第二方面，本发明提供了编码本发明的从头蛋白和肽域的核酸分子。例如，本发明提供了编码本文所述的任何蛋白质和肽域的核酸分子。

在相关方面，本发明提供了能够表达本发明的蛋白质的重组表达载体。例如，本发明包括包含上述任何核酸分子的重组表达载体。本发明的范围还包括已引入此类载体的宿主细胞，以及通过在允许产生蛋白质的条件下培养所述宿主细胞并且回收如此产生的蛋白质来产生蛋白质的方法。

在第三方面，本发明提供了一种药物组合物，所述药物组合物包含治疗有效量的本发明的从头ACE2蛋白诱饵和药学上可接受的载体。在一个相关方面，本发明的特征在于一种组合物，所述组合物是本发明的从头蛋白和第二治疗剂的组合。在一个实施方案中，所述第二治疗剂是有利地与本发明的从头蛋白组合的任何剂。示例性剂包括但不限于抑制病毒活性包括宿主细胞感染性的其他剂。

在第四方面，本发明提供了用于治疗与冠状病毒相关的疾病或障碍的治疗方法，所述冠状病毒使用ACE2作为其受体以促进病毒进入靶细胞。所述方法包括，例如，使用本发明的从头ACE2蛋白诱饵治疗受试者中病毒感染，其中所述治疗方法包括向有需要的受试者施用治疗有效量的包含所述ACE2蛋白诱饵的药物组合物。治疗的障碍是通过抑制SARS-CoV或SARS-CoV-2冠状病毒活性或任何其他使用所述ACE2受体进入其靶细胞的冠状病毒的活性而得到改进、改善、抑制或预防的任何疾病或病症。在某些实施方案中，本发明提供了预防、治疗或改善冠状病毒感染的至少一种症状的方法，所述方法包括向有需要的受试者施用治疗有效量的本发明的蛋白质。在一些实施方案中，本发明提供了通过施用本发明的蛋白质来改善或降低受试者中冠状病毒感染的至少一种症状或指征的严重性的方法，其中至少一种症状或指征选自由以下各项组成的组：肺部炎症、肺泡损伤、发烧、咳嗽、呼吸急促、腹泻、心力衰竭、心律失常、多器官功能障碍、肺炎、感染性休克和/或死亡。在某些实施方案中，本发明提供了降低受试者中病毒载量的方法，所述方法包括向所述受试者施用与来自SARS-CoV或SARS-CoV-2的冠状病毒刺突蛋白或来自通过使用所述ACE2受体进入其靶细胞并且阻断刺突蛋白与其宿主细胞受体的结合的冠状病毒的另一种冠状病毒刺突蛋白结合的有效量的本发明的ACE2蛋白诱饵。在一些实施方案中，可以向患有冠状病毒感染或有患冠状病毒感染风险的受试者预防性地或治疗性地施用所述从头蛋白。有风险的受试者包括但不限于免疫功能低下的人、老年人(65岁以上)、医护人员、与一个或多个确诊或疑似冠状病毒感染者密切接触的成人或儿童和患有基础疾病如肺部疾病或感染、心脏病或糖尿病的人。在某些实施方案中，向有需要的受试者组合施用本发明的从头蛋白与第二治疗剂。所述第二治疗剂可以例如选自由抗炎药(如皮质类固醇和非甾体抗炎药)、抗感染药或抗病毒药组成的组。在某些实施方案中，所述第二治疗剂可以是有助于抵消或降低与本发明的从头蛋白相关的一个或多个任何可能的副作用(如果发生一个或多个此类副作用的话)的剂。例如，在一些方面，第二治疗剂是治疗细胞因子释放综合征(例如，细胞因子风暴)的治疗剂。可以例如皮下、静脉内、皮内、腹膜内、口服或肌内施用其从头蛋白。在一些方面，所述从头蛋白被吸入。

本发明还包括使用本发明的所述核酸治疗受试者中病毒感染的方法。所述方法包括向有需要的受试者施用治疗有效量的编码本发明的ACE2蛋白诱饵的核酸。

本发明还包括本发明的蛋白质或核酸在制备用于治疗将从阻断冠状病毒结合和/或活性中受益的疾病或障碍的药物中的用途。

在第五方面，本发明提供了检测生物样品中冠状病毒刺突蛋白的方法。所述方法包括使所述生物样品与本发明的ACE2蛋白诱饵接触以及检测所述生物样品中冠状病毒刺突蛋白的步骤。

通过对随后的详细说明的回顾，其他实施方案将变得明显。

定义

术语“SARS-CoV”是指2002年在中国出现的严重急性呼吸系统综合症冠状病毒。它通过病毒刺突蛋白与人宿主细胞受体ACE2结合。术语“SARS-CoV-S”，也称为“S蛋白”，是指SARS冠状病毒的刺突蛋白(S1和S2)。所述SARS-CoV冠状病毒刺突蛋白介导受体识别和膜融合。在病毒感染期间，S蛋白被切割成两个亚单位，S1和S2。受体结合域存在于S1亚基中，它直接与ACE2的肽酶域(PD)结合。S2负责膜融合。当S1与ACE2结合时，S2被宿主蛋白酶切割。S2的这种切割被认为是病毒感染的关键。示例性SARS-CoV-S蛋白在本文中作为SEQ ID NO:2提供。信号肽是氨基酸1-13，S1刺突蛋白是氨基酸14-667，S2刺突蛋白是氨基酸668-1255。术语SARS-CoV-S和SARS-CoV刺突蛋白包括分离自不同SARS-CoV分离株的SARS-CoV刺突蛋白的蛋白质变体。SARS-CoV分离株包括，例如，分离株BJ01、分离株BJ02、分离株BJ03、分离株BJ04、分离株GZ50、分离株CUHK-W1、分离株HKU-36871、分离株GD01、分离株GD03、分离株Shanghai LY、分离株Frankfurt 1、分离株FRA、分离株SZ23、分离株SZ3和分离株Tor2。

术语“COVID-19”或“2019-nCov”或“SARS-CoV-2”是指于2020年3月11日被世界卫生组织标记为大流行病的一种新型SARS样冠状病毒。与SARS-CoV一样，它通过病毒刺突蛋白与人宿主细胞受体ACE2结合。术语“SARS-CoV-2-S”，也称为“S蛋白”，是指SARS-CoV-2冠状病毒的刺突蛋白。示例性SARS-CoV-2S蛋白在本文中作为SEQ ID NO:3提供。术语SARS-CoV-2-S和SARS-CoV-2刺突蛋白包括分离自不同SARS-CoV-2分离株的SARS-CoV-2刺突蛋白的蛋白质变体。如本文所用，术语“冠状病毒ACE2-结合刺突蛋白”或“ACE2-结合刺突蛋白”是指使用ACE2介导其进入宿主细胞的冠状病毒刺突蛋白。

“ACE2”是指血管紧张素转换酶2，它充当选择冠状病毒的受体。人ACE2蛋白的全长在本文中作为SEQ ID NO:1提供。信号肽是氨基酸残基1-17；胞外PD域是氨基酸残基18-740；跨膜区段是残基741-761；并且胞内域是残基762-805。

ACE2的主要生理作用是血管紧张素的成熟，然而，它也被劫持为一些冠状病毒的细胞受体。本发明的ACE2蛋白质诱饵被设计为充当人ACE2诱饵，然而，在一些实施方案中，它们可以充当来自其他哺乳动物物种的ACE2蛋白诱饵。

如本文所用，术语“冠状病毒感染”或“SARS-CoV感染”或“SARS-CoV-2感染”是指使用ACE2受体进入宿主细胞的冠状病毒感染，并且特别是SARS或COVID-19冠状病毒。严重急性呼吸道疾病与SARS和COVID-19冠状病毒感染相关。广泛的额外并发症与COVID-19冠状病毒相关，包括血栓事件和神经系统疾病。感染症状包括发烧、咳嗽、呼吸急促、肺炎、腹泻等胃肠道症状、器官衰竭(肾衰竭、心力衰竭和肾功能不全)、感染性休克和严重情况下的死亡。

如本文所用，术语“重组”是指通过作为重组DNA技术(其包括，例如，DNA剪接和转基因表达)的本领域已知的技术或方法产生、表达、分离或获得的本发明的蛋白质。

术语“特异性结合”或“与......特异性结合”等是指第一部分对第二部分的亲和力大于对其他部分的亲和力。然而，特异性结合不需要专一结合。在一些实施方案中，第一部分特异性结合第二部分并且所得复合物在生理条件下相对稳定。在一些实施方案中，特异性结合的特征在于平衡解离常数为约650nM或更小，或者在一些实施方案中，为100nM或更小(例如，更小的K_D表示更紧密的结合)。用于确定两个部分是否特异性结合的方法在本领域中是众所周知的并且包括例如平衡透析、表面等离子体共振等。如本文所述，已鉴定出与冠状病毒刺突蛋白特异性结合的蛋白质，特别是与冠状病毒ACE2结合刺突蛋白特异性结合的蛋白质。

短语“治疗有效量”是指产生所施用的所需效果的量。确切的量将取决于治疗的目的并且将由本领域技术人员使用已知技术确定(参见，例如，Lloyd(1999)The Art,Scienceand Technology of Pharmaceutical Compounding)。

如本文所用，术语“受试者”是指需要改善、预防和/或治疗疾病或障碍如病毒感染的动物，优选哺乳动物，更优选人。所述术语包括患有或有患冠状病毒感染风险的人受试者。

如本文所用，术语“治疗(treat、treating或treatment)”是指由于向有需要的受试者施用治疗剂如本发明的蛋白质而降低或改善冠状病毒感染的至少一种症状或指征的严重性。所述术语包括抑制疾病进展或感染恶化。所述治疗剂可以治疗剂量施用于所述受试者。

术语“预防(prevent、preventing或prevention)”是指抑制冠状病毒感染症状的出现。在一些实施方案中，预防包括抑制冠状病毒感染和/或抑制冠状病毒感染从受试者传播到另一个个体。

如本文所用，术语“抗病毒药物”是指用于治疗、预防或改善受试者中病毒感染的任何抗感染药物或疗法。术语“抗病毒药物”包括但不限于利巴韦林、瑞德西韦、奥司他韦、扎那米韦、干扰素-α2b、镇痛剂和皮质类固醇。在本发明的上下文中，所述病毒感染包括由人冠状病毒(包括SARS-CoV和SARS-CoV-2)导致的感染。

如本文所用，关于多肽序列的术语“同一性”是指两个分子之间的氨基酸序列同一性。当两个分子中的一个氨基酸位置被相同的氨基酸占据时，则所述分子在该位置上是同一的。两个多肽之间的同一性是相同位置数量的直接函数。一般来说，序列是对齐的，以便获得最高阶匹配(必要时包括空缺)。可以使用公开的技术和广泛可用的计算机程序来计算同一性，如GCG程序包(Devereux等人,Nucleic Acids Res.12:387,1984)、BLASTP、FASTA(Atschul等人,J.Molecular Biol.215:403,1990)等。能够测量序列同一性，例如，使用序列分析软件，如威斯康星大学生物技术中心(1710University Avenue,Madison,WI53705)的遗传学计算机组的序列分析软件包，使用其默认参数。在确定本发明的同一性时，考虑结合界面残基与冠状病毒刺突蛋白的定位也很重要。如果添加或删除氨基酸，则应以不会显著干扰蛋白质向其结合配偶体或二级结构呈递的方式进行。除非另有说明，否则百分比同一性是在参考序列的长度上确定的。

在一些方面，相对于参考肽域的氨基酸取代能够是例如保守氨基酸取代。如本文所用，“保守氨基酸取代”是指给定氨基酸能够被具有相似物理化学特征的氨基酸取代，例如，用一个脂肪族残基取代另一个(如，将Ile、Val、Leu或Ala相互取代)，或用一个极性残基取代另一个(例如在Lys与Arg之间；Glu与Asp之间；或Gln与Asn之间)。其他此类保守取代，例如，具有相似疏水性特征的整个区域的取代，是已知的。可以在本文所述的任何一种测定中测试包含保守氨基酸取代的多肽，以确认保留了所需的活性。能够根据氨基酸侧链性质的相似性对其进行分组。或者，能够根据共同的侧链特性将天然存在的残基分成几组。非保守取代将需要用这些类别之一的成员替换另一个类别的成员。具体的保守取代包括，例如；Ala到Gly或Ser；Arg到Lys；Asn到Gln或H；Asp到Glu；Cys到Ser；Gln到Asn；Glu到Asp；Gly到Ala或Pro；His到Asn或Gln；Ile到Leu或Val；Leu到Ile或Val；Lys到Arg、Gln或Glu；Met到Leu、Tyr或Ile；Phe到Met、Leu或Tyr；Ser到Thr；Thr到Ser；Trp到Tyr；Tyr到Trp；和/或Phe到Val、Ile或Leu。常见的疏水基团是甘氨酸(Gly)、丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)和苯丙氨酸(Phe)。

如本文所用，天然氨基酸残基缩写如下：丙氨酸(Ala；A)、天冬酰胺(Asn；N)、天冬氨酸(Asp；D)、精氨酸(Arg；R)、半胱氨酸(Cys；C)、谷氨酸(Glu；E)、谷氨酰胺(Gln；Q)、甘氨酸(Gly；G)、组氨酸(His；H)、异亮氨酸(Ile；I)、亮氨酸(Leu；L)、赖氨酸(Lys；K)、甲硫氨酸(Met；M)、苯丙氨酸(Phe；F)、脯氨酸(Pro；P)、丝氨酸(Ser；S)、苏氨酸(Thr；T)、色氨酸(Trp；W)、酪氨酸(Tyr；Y)和缬氨酸(Val；V)。如本文所用，“任何氨基酸”通常是指20种天然氨基酸。然而，本领域技术人员将理解，一种或多种(例如，1个至10个、1个至5个、1个至3个或1个或2个)非天然氨基酸能够用于代替天然氨基酸。如本文所用，术语“非天然氨基酸”是指蛋白质中天然存在的20种氨基酸以外的氨基酸。非天然氨基酸是本领域已知的。

如本文所用，术语“多肽”、“蛋白质”或“肽”是指任何氨基酸残基链，无论其长度或翻译后修饰(例如，糖基化或磷酸化)。

“可操作地连接”意指核苷酸序列以允许核苷酸序列表达的方式(例如，当载体被引入宿主细胞中时，在体外转录/翻译系统中或在宿主细胞中)连接至一个或多个调节序列。“调控序列”包括启动子、增强子和其他表达控制元件(例如，多腺苷酸化信号)。可以将本发明的表达构建体引入宿主细胞，从而产生本文公开的蛋白质。

术语“宿主细胞”和“重组宿主细胞”在本文中互换使用。应理解，此类术语不仅意指特定受试者细胞，而且意指此类细胞的后代细胞。在接续传代中由于突变或环境影响而可能发生某些修饰，因此此类后代可能实际上并不等同于亲代细胞，但其仍包括在本文所用术语的范围内。

如本文所用，术语“转化”和“转染”是指用于将外源核酸(例如，DNA)引入宿主细胞的多种本领域公认的技术，包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、粒子枪或电穿孔。

如本文所用，短语“药学上可接受的载体”包括但不限于与医药施用相容的盐水、溶剂、分散介质、包衣、抗细菌和抗真菌剂、等张剂和吸收延迟剂等。补充活性化合物(例如，抗生素)还能够并入组合物中。

概述

诸位发明人在本文中描述了从头ACE2蛋白诱饵，所述从头ACE2蛋白诱饵与冠状病毒上的刺突蛋白特异性结合并且调节刺突蛋白与其先天受体的相互作用。特别地，所述从头ACE2蛋白诱饵与那些使用ACE2作为其受体的冠状病毒上的刺突蛋白结合以促进病毒进入靶细胞。值得注意的是，尽管本发明的从头ACE2蛋白诱饵包含与冠状病毒刺突蛋白相互作用和结合所必需的域，但它们通常不包含与天然ACE2的其他酶活性相关的域，包括例如ACE2的催化域(例如，金属蛋白酶催化域)。本发明的示例性从头ACE2蛋白诱饵不催化血管紧张素(即任何形式的血管紧张素，包括血管紧张素I和II)的切割。在一些实施方案中，本文提供的ACE2蛋白诱饵与人ACE2(SEQ ID NO:1)具有不超过60％、55％、50％、45％、40％或35％的序列同一性。关于与ACE2的同一性，在查询的长度上，以ACE2蛋白诱饵作为查询，ACE2作为参考，计算百分比同一性。

在一些实施方案中，本发明的蛋白质诱饵以700nM或更小的K_d、600nM或更小的K_d、500nM或更小的K_d、400nM或更小的K_d、300nM或更小的K_d、200nM或更小的K_d、100nM或更小的K_d、50nM或更小的K_d、优选约20nM或更小、或甚至15nM、10nM或5nM或更小与刺突蛋白(例如，来自SARS-CoV-2的刺突蛋白)结合。确定K_d的方法是本领域已知的并且在实施例中进行了描述。在某些实施方案中，本发明的从头蛋白诱饵是阻断蛋白，因为它们可以与所述冠状病毒刺突蛋白(例如，来自SARS-CoV-2)结合并且阻断所述刺突蛋白与其天然受体(即，ACE2)的相互作用。如本文所用，阻断蛋白可以完全阻断所述刺突蛋白与其天然受体的相互作用或可以部分阻断所述刺突蛋白与其天然受体的相互作用。在某些实施方案中，所述从头蛋白诱饵以100nM或更小的IC₅₀抑制所述刺突蛋白与其天然受体(即，ACE2)的相互作用。在一些实施方案中，所述从头蛋白以50nM、40nM、30nM、20nM、10nM或5nM或更小的IC₅₀抑制所述刺突蛋白与其天然受体(即ACE2)的相互作用。在一些实施方案中，本发明的阻断蛋白阻断所述冠状病毒刺突蛋白与其受体的结合和/或抑制或中和或降低宿主细胞的病毒感染性。在一些实施方案中，所述阻断蛋白可用于治疗患有冠状病毒感染(例如，COVID-19冠状病毒感染)的受试者。在一些实施方案中，当向有需要的受试者施用本发明的所述从头蛋白诱饵时，降低了所述受试者中冠状病毒如SARS-CoV-2的感染。它们可用于减少受试者中病毒载量。本发明的蛋白质诱饵可单独使用或与本领域已知的用于治疗病毒感染的其他治疗部分或方式一起作为辅助疗法。如本文所述，可以使用本领域技术人员已知的任何标准方法(包括结合测定或活性测定)测量本发明的从头蛋白结合和抑制/中和SARS-CoV或SARS-CoV-2的活性的能力。例如，在实施例中说明了用于测量结合和抑制和/或阻断活性的体外测定。

本发明的从头蛋白诱饵可不包含额外标记或部分，或者它们可包含标记(例如，N-末端或C-末端标记或部分)。在一个实施方案中，所述标记或部分是生物素。在结合测定中，标记(如果有的话)的位置可确定肽相对于肽结合的表面的方向。例如，如果表面涂有抗生物素蛋白，则含有N-末端生物素的肽将被定向，使得所述肽的C-末端部分远离所述表面。所述标记可以是例如酶、放射性核素、荧光染料或MRI可检测标记。此类标记的蛋白质可用于诊断测定，所述诊断测定包括成像测定。在一些方面，对于不含色氨酸的ACE-2蛋白诱饵，标记可以是允许通过280nm处的吸光度检测蛋白质的C末端肽(例如，GSGWGSG，SEQ ID NO:248)。

ACE2蛋白诱饵的结构和序列特征

本文提供了本发明的从头蛋白，本文称为ACE2蛋白诱饵。这些蛋白诱饵本质上是非天然存在的蛋白质，并且包含与所述冠状病毒刺突蛋白交界的至少两个α螺旋域，并且优选地包含促进所述α螺旋的蛋白质折叠和结合感受态呈现的至少一个结构域。在一些实施方案中，所述从头蛋白还包含任选的β发夹域。α-螺旋域与所述冠状病毒刺突蛋白交界，并且任选的β-发夹域与所述冠状病毒刺突蛋白的结合位点相互作用/充当所述冠状病毒刺突蛋白的结合位点。这些域，在本文中称为H1、H2和H3，包含参与与所述冠状病毒刺突蛋白结合相互作用的氨基酸残基和不参与与所述冠状病毒刺突蛋白结合相互作用的氨基酸残基。通常，对于H1和H2域，不参与与所述冠状病毒ACE2结合刺突蛋白结合相互作用的氨基酸残基所处的位置与位于该位置的氨基酸的同一性非常混乱。许多这些残留物也位于溶剂暴露位置。在一些实施方案中，当替换暴露于溶剂的位置的氨基酸时，特别希望使用亲水性氨基酸，尽管非亲水性氨基酸也是可接受的。

本领域技术人员将理解，本发明的从头蛋白，即ACE2蛋白诱饵，被设计为使得结合域在结构上与天然ACE2蛋白中的相应结合位点对齐，而支持结构域在结构上或顺序上不与ACE2中的任何其他二级结构对齐。在一些方面，本发明的从头蛋白在结构上与天然ACE2结合基序在例如2.75A RMSD(均方根偏差)内对齐，并且包含一个或多个在结构上或顺序上不与ACE2中的任何其他二级结构元件对齐的二级结构元件。确定RMSD的方法是本领域已知的，例如使用MICAN蛋白质结构对齐算法。MICAN通过忽略二级结构元件之间的连接性来确定蛋白质对之间的最佳结构对齐。

在一些方面，本发明的从头蛋白包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中

H1包含氨基酸序列

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)；

H2包含氨基酸序列

NX₁₄X₁₅NX₁₆X₁₇X₁₈KX₁₉X₂₀X₂₁FX₂₂X₂₃EQX₂₄X₂₅LX₂₆X₂₇MY(SEQ ID NO:5)；和

H3在存在时包含氨基酸序列

X₂₈X₂₉X₃₀X₃₁X₃₂X₃₃KGDX₃₄RX₃₅X₃₆(SEQ ID NO:6)，其中X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂、X₁₃、X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆、X₂₇、X₂₈、X₂₉、X₃₀、X₃₁、X₃₂、X₃₃、X₃₄、X₃₅和X₃₆各自独立地选自任何氨基酸。

此类从头蛋白还包含一个或多个结构域，所述一个或多个结构域促进H1、H2和H3的蛋白质折叠和结合感受态呈现。在本发明的一些实施方案中，所述ACE2蛋白诱饵的冠状病毒结合氨基酸残基与所述ACE2蛋白的冠状病毒结合氨基酸残基相同。例如，在一些此类实施方案中，H1、H2和H3的结合残基与所述天然ACE2蛋白中相同结构位置的氨基酸相同。此外，在一些示例性实施方案中，H1的所有、或除了一到六个、或一到五个、或一到四个、或一到三个暴露于溶剂的氨基酸和H2的所有、或除了一到六个之外的所有、或一到五个、或一到四个、或一到三个暴露于溶剂的氨基酸，无论它们是否参与结合，都与所述天然ACE2蛋白中相同结构位置的氨基酸相同。通过呈现与病毒在蛋白ACE2中靶向的表面几乎相同的表面，病毒突变以避免与本发明的ACE2蛋白诱饵结合的能力被最小化。在SEQ ID NO:4中，第1位、第5位、第6位、第9位、第10位、第12位、第13位、第16位、第17位、第19位、第20位、第23位、第24位和第27位的氨基酸残基大部分暴露于溶剂，和/或参与与冠状病毒ACE2结合刺突蛋白的结合；在SEQ ID NO:176中，第3位、第4位、第7位、第8位、第10位、第11位、第14位、第15位、第17位、第18位、第21位、第22位和第25位的氨基酸残基大部分暴露于溶剂和/或参与与冠状病毒ACE2结合刺突蛋白的结合；在SEQ ID NO:5中，第1位、第4位、第8位、第12位、第15位、第16位、第19位、第22位和第23位的氨基酸残基大部分暴露于溶剂和/或参与与冠状病毒ACE2结合刺突蛋白的结合；并且在SEQ ID NO:6中，第7位、第8位和第9位的氨基酸残基大部分暴露于溶剂和/或参与与冠状病毒ACE2结合刺突蛋白的结合。在一些方面，当进行氨基酸取代时，这些残基没有被取代。在其他方面，可能需要修饰这些残基。例如，可以对这些残基进行修饰，以产生一种与ACE2结合的蛋白质，其亲和力高于天然冠状病毒刺突蛋白。例如，这种蛋白质可以用于诊断目的。在一些方面，在SEQ ID NO:4的第1位、第5位、第6位、第9位、第10位、第12位、第13位、第16位、第17位、第19位、第20位、第23位、第24位和第27位的残基中不超过4个、不超过3个、不超过2个或不超过1个被取代，或者在SEQ ID NO:176的第3位、第4位、第7位、第8位、第10位、第11位、第14位、第15位、第17位、第18位、第21位、第22位和第25位的残基中不超过4个、不超过3个、不超过2个或不超过1个被取代；SEQ ID NO:5的第1位、第4位、第8位、第12位、第15位、第16位、第19位、第22位和第23位的残基中不超过3个、不超过2个或不超过1个被取代；并且SEQ ID NO:6的第7位、第8位、第9位或第11位的残基中不超过1个被取代或者SEQ ID NO:6的第7位、第8位或第9位的残基中不超过1个被取代。在一些此类方面，此类取代是用选自D、E、G、K、N、P、Q、R、S或T的氨基酸。在一些此类方面，取代是用保守氨基酸。在其他方面，在SEQ ID NO:4中进行一个或多个以下取代：S1I；E5D；E5Q；E5V；D12V、D12E；Q24K；和Q24L。在其他方面，在SEQ ID NO:176中进行一个或多个以下取代：E3D；E3Q；E3V；D10V、D10E；Q22K；和Q22L。除了一些例外，在SEQ ID NO:4、176、5和6中标识为X(带有下标数字)的残基不暴露于溶剂和/或不直接参与与冠状病毒ACE2结合刺突蛋白的结合。这些残基通常可能与ACE2中的相应氨基酸不同。本发明包括其中由X(带有下标数字)代表的氨基酸中不超过一半或不超过8个与由SEQ ID NO:1代表的天然ACE2中相应位置的氨基酸相同的那些蛋白质。在一些方面，H1中以X(带有下标数字)代表的氨基酸中不超过4个、3个或2个；H2中以X(下标数字)代表的氨基酸中不超过4个、3个或2个；和/或H3中由X(带下标数字)代表的氨基酸中不超过5个、4个、3个或2个与天然ACE2中相应位置的氨基酸相同。ACE2中H1的示例性对应序列是ST IEEQAKTFLD KFNHEAEDLF YQSSL(SEQ ID NO:7)；ACE2中H2的示例性对应序列是NMNNAGDKWS AFLKEQSTLA QMY(SEQ ID NO:8)；ACE2中H3的示例性对应序列是TAWD LGKGDFRIL(SEQ ID NO:9)。

Α螺旋域H1

本发明的从头蛋白(即，ACE2蛋白诱饵)能够包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中：

H1包含氨基酸序列：

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)；其中X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂、X₁₃各自独立地选自任何氨基酸。

本发明包括本发明的从头蛋白，其中H1包含氨基酸序列：

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)；其中：

X₁是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、E、F、G、I、L、M、N、Q、R、S、T、V或Y)的氨基酸；

X₂是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选V、A、D、H、I、N、P、T或W)的氨基酸；

X₃是选自A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选R、L、C、H、I、K、M、S、T或Y)的氨基酸；

X₄是选自C、I、L、M、T或V(优选L、I、T或V)的氨基酸；

X₅是选自A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、K、C、E、I、L、N、R、V或Y)的氨基酸；

X₆是选自A、C、G、L、M、S、T或V(优选A、C、S或T)的氨基酸；

X₇是选自A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T或V(优选A、C、E、F、I、L、N、Q、S、T或V)的氨基酸；

X₈是选自A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y(优选F、D、E、H、L、M、N、Q或W)的氨基酸；

X₉是选自A、C、D、F、G、H、I、L、M、N、Q、S、T、V、W或Y(优选M、A、C、F、G、L、S、T或V)的氨基酸；

X₁₀是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选R、A、C、E、F、G、H、I、M、P、Q、T、V、W或Y)的氨基酸；

X₁₁是选自N、C、F、G、H、L、M、W或Y(优选F、N、W或Y)的氨基酸；

X₁₂是选自A、C、F、G、H、I、L、M、N、Q、S、T、V、W或Y(优选A、C、S或T)的氨基酸；并且

X₁₃是选自A、C、D、E、F、G、H、I、L、M、N、Q、S、T或V(优选A、C、F、G、L、M、N、S、T或V)的氨基酸。

本发明包括本发明的从头蛋白，其中H1包含氨基酸序列：

X₁是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₂、X₆、X₉、X₁₁、X₁₂和X₁₃各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₅、X₇、X₈和X₁₀各自独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₃是选自A、C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸或者是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

并且

X₄是选自A、F、I、L、M、P、V、D、E、G、K、N、P、Q、R、S或T的氨基酸。本发明的从头ACE2蛋白诱饵包含上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包含在X₂的氨基酸列表中，组氨酸包含在X₈的氨基酸列表中，并且天冬酰胺包含在X₁₁的氨基酸列表中。本发明的从头ACE2蛋白诱饵包括上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包括在X₂的氨基酸列表中，天冬酰胺从X₃的氨基酸取代列表中去除，X₄是选自I、L、M、P、V或T的氨基酸；天冬氨酸从X₅的氨基酸取代列表中去除，X₆是选自A、L、M或V的氨基酸；脯氨酸从X₇的氨基酸取代列表中去除，组氨酸包含在X₈的氨基酸列表中并且赖氨酸和脯氨酸去除，脯氨酸从X₉的氨基酸列表中去除，天冬酰胺包含在X₁₁的氨基酸列表中并且丙氨酸、异亮氨酸、脯氨酸和缬氨酸去除，并且脯氨酸从X₁₂和X₁₃的氨基酸取代列表中去除。

本发明包括本发明的从头ACE2蛋白诱饵，其中

(i)X₄是选自A、F、I、L、M、P或V(优选I、L、M或V)的氨基酸；X₁、X₂、X₃、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(ii)X₄是选自A、F、I、L、M、P或V(优选I、L、M或V)的氨基酸；并且X₅是选自D、E、G、K、N、P、Q、R、S或T(优选E、G、K、N、P、Q、R、S或T)的氨基酸；并且X₁、X₂、X₃、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(iii)X₁是选自R或S或F的氨基酸序列；并且X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(iv)X₃是选自R、L、A、F、I、M、P或V的氨基酸序列；并且X₁、X₂、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(v)X₃是选自R、L、C或S的氨基酸；并且X₁、X₂、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(vi)X₇是选自A或T的氨基酸序列；并且X₁、X₂、X₃、X₄、X₅、X₆、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(vii)X₁₀是选自R、S或L的氨基酸或选自R或S的氨基酸；并且X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(viii)X₁是选自R或S或F的氨基酸；X₃是选自R或L的年氨基酸；X₇是选自A或T的氨基酸；并且X₁₀是选自R、S或L的氨基酸；并且X₂、X₄、X₅、X₆、X₈、X₉、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(ix)X₅是选自D、E、G、K、N、P、Q、R、S或T(优选E、G、K、N、P、Q、R、S或T)的氨基酸；并且X₁、X₂、X₃、X₄、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(x)X₅是赖氨酸；并且X₁、X₂、X₃、X₄、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(xi)X₉是选自M或L的氨基酸；并且X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；

(xii)X₁是丝氨酸；X₃是L；并且X₂、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述；或者

(xiii)X₈是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、W或Y(优选A、D、E、F、G、I、L、M、N、Q、R，S、T、W或Y)的氨基酸，或者X₈是选自F、D、G、K、N、P、Q、R、S或T(优选F、D、G、N、Q、N、R、R或T)的氨基酸，或者X₈是苯丙氨酸或者X₈是苯丙氨酸或者组氨酸；并且X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₉、X₁₀、X₁₁、X₁₂和X₁₃如本文提供的任何实施方案中所述。

本发明的从头蛋白能够包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中：

H1包含氨基酸序列：

X₁和X₅各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₂、X₄、X₆、X₉、X₁₁、X₁₂、和X₁₃各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₃、X₇和X₁₀各自独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；并且

X₈是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、W或Y(更优选F、D、E、G、K、N、P、Q、R、S或T)的氨基酸。本发明的从头蛋白包含上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包含在X₂的氨基酸列表中，组氨酸包含在X₈的氨基酸列表中，并且天冬酰胺包含在X₁₁的氨基酸列表中。本发明的从头蛋白包含上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包含在X₂的氨基酸列表中，天冬氨从X₃的氨基酸取代列表中去除，X₄是选自I、L、M、P或V的氨基酸；天冬氨酸从X₅的氨基酸取代基列表中去除，X₆是选自A、L、M或V的氨基酸；脯氨酸从X₇的氨基酸取代列表中去除，组氨酸包含在X₈的氨基酸列表中并且赖氨酸和脯氨酸去除；脯氨酸从X₉的氨基酸列表中去除，天冬酰胺包含在X₁₁的氨基酸列表中并且丙氨酸、异亮氨酸、脯氨酸和缬氨酸去除，并且脯氨酸从X₁₂和X₁₃的氨基酸取代列表中去除。

本发明的从头蛋白能够包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中H1包含氨基酸序列

X₁是选自R或S的氨基酸；

X₃是选自R或L的氨基酸；

X₇是选自A或T的氨基酸；

X₁₀是选自R或S或L(优选R或S)的氨基酸；

X₂、X₄、X₆、X₉、X₁₁、X₁₂和X₁₃各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₅是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；并且

X₈是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、W或Y(优选F、D、E、G、K、N、P、Q、R、S或T)的氨基酸。本发明的从头蛋白包含上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包含在X₂的氨基酸列表中，组氨酸包含在X₈的氨基酸列表中，并且天冬酰胺包含在X₁₁的氨基酸列表中。本发明的从头蛋白包含上述那些，其中苯丙氨酸包含在X₁的氨基酸列表中，天冬酰胺包含在X₂的氨基酸列表中，天冬氨从X₃的氨基酸取代列表中去除，X₄是选自I、L、M、P或V的氨基酸；天冬氨酸从X₅的氨基酸取代基列表中去除，X₆是选自A、L、M或V的氨基酸；脯氨酸从X₇的氨基酸取代列表中去除，组氨酸包含在X₈的氨基酸列表中并且赖氨酸和脯氨酸去除；脯氨酸从X₉的氨基酸列表中去除，天冬酰胺包含在X₁₁的氨基酸列表中并且丙氨酸、异亮氨酸、脯氨酸和缬氨酸去除，并且脯氨酸从X₁₂和X₁₃的氨基酸取代列表中去除。

X₁是选自R或S的氨基酸；X₂是V；X₃是选自R或L的氨基酸；X₄是亮氨酸；X₅是赖氨酸；X₆是丙氨酸；X₇是选自A或T的氨基酸；X₈是苯丙氨酸；X₉是甲硫氨酸；X₁₀是选自R或S或L(优选R或S)的氨基酸；X₁₁是苯丙氨酸；X₁₂是A；并且X₁₃是A。

X₁是选自R或S的氨基酸；X₂是缬氨酸；X₃是选自R或L或C或S的氨基酸；X₄是亮氨酸；X₅是赖氨酸；X₆是丙氨酸；X₇是选自A或T的氨基酸；X₈是苯丙氨酸；X₉是M或L；X₁₀是选自R或S或L(优选R或S)的氨基酸；X₁₁是苯丙氨酸；X₁₂是丙氨酸；并且X₁₃是丙氨酸。

X₁是选自R或S或F的氨基酸；X₂是选自N或V的氨基酸；X₃是选自R或L或C或S的氨基酸；X₄是亮氨酸；X₅是赖氨酸；X₆是丙氨酸；X₇是选自A或T的氨基酸；X₈是选自F或H的氨基酸；X₉是选自M或L的氨基酸；X₁₀是选自R或S或L(优选R或S)的氨基酸；X₁₁是选自F或N的氨基酸；X₁₂是丙氨酸；并且X₁₃是丙氨酸。

H1包含氨基酸序列：

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)；其中(i)X₈不是缬氨酸或(ii)X₈不是选自V、A、I、L、M或P的氨基酸，或(iii)X₈是苯丙氨酸；并且X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₉、X₁₀、X₁₁、X₁₂、和X₁₃如本文于本文提供的任何实施方案中所述。

本发明的从头蛋白能够包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中H1包含氨基酸序列：

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L

X₃₇X₃₈X₃₉X₄₀X₄₁X₄₂ X₄₃X₄₄X₄₅X₄₆(SEQ ID NO:10)；

其中X₁-X₁₃如本文针对H1的任何实施方案中所提供；并且X₃₇、X₃₈、X₄₁、X₄₂、X₄₅和X₄₆各自独立地选自任何氨基酸。在一些方面，X₁-X₁₃如本文针对H1的任何实施方案中所提供；并且

X₃₇、X₃₈、X₄₁、X₄₂、X₄₅和X₄₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₄₀和X₄₄各自独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₃₉是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、I、L、M、P或V)的氨基酸；

X₄₃是选自D、E、G、K、N、P、Q、R、S或T的氨基酸。本发明的从头蛋白包含上述那些，其中异亮氨酸从X₃₇的氨基酸列表中去除，脯氨酸从X₃₈的氨基酸列表中去除；X₃₉是选自F、I、L、M、V、W或Y的氨基酸；组氨酸包含在X₄₀的氨基酸列表中并且脯氨酸去除，脯氨酸从X₄₁的氨基酸列表中去除；并且T和Y包含在X₄₂的氨基酸列表中。在一些此类方面，X₄₂是选自A或V的氨基酸。

本发明还包括那些ACE2蛋白诱饵，其中X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂、X₁₃如本文的任何实施方案中所述，并且SEQ ID NO:4的第1位、第5位、第6位、第9位、第10位、第12位、第13位、第16位、第17位、第19位、第20位、第23位、第24位和第27位的氨基酸中的一个或多个(优选不超过1个至3个)被取代(或SEQ ID NO:176中的等效位置)。例如，在一些方面，进行以下取代中的一个或多个：S1I；E5D；E5Q；E5V；D12V、D12E；Q24L；和Q24K。在一些方面，在SEQ ID NO:4中进行以下取代之一：S1I；E5D；E5Q；E5V；D12V、D12E；Q24L；和Q24K(或SEQ ID NO:176中的等效位置)。在一些方面，在SEQ ID NO:4中进行以下一个或多个取代：T9F、D12I、D12N、E17I、Y23H(或SEQ ID NO:176中的等效位置)。

在一些实施方案中，本发明的从头蛋白包含本文所述的那些，条件是X₄不是选自D、E、G、H、K、N、P、Q、R、S、W或Y的氨基酸；X₆不是选自D、E、F、H、K、P、Q、R、W或Y的氨基酸；X₇不是P；X₈不是脯氨酸；X₉不是选自K、P或R的氨基酸；X₁₁不是选自D、E、K、P、R、T或V的氨基酸；X₁₂不是选自K、P或R的氨基酸；X₁₃不是选自P或W的氨基酸；X₃₈不是选自H、K、P或R的氨基酸；X₃₉不是选自D、E、G、K或P的氨基酸；和/或X₄₁不是脯氨酸。

本发明的ACE2蛋白诱饵包含那些，其中H1包含与SEQ ID NO:11-17、177-183、198或199所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

SRVLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:11)

SSVREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:12)f44

SRVREQLKTFADKTFHEMEDRFYQAAL(SEQ ID NO:13)

SRVREQLKTFADKAFHEMEDSFYQAAL(SEQ ID NO:14)

SSVLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:15)

SSVLEQLKTFADKTFHEMEDSFYQAAL(SEQ ID NO:16)

SRVREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:17)

VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:177)

VREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:178)

VREQLKTFADKTFHEMEDRFYQAAL(SEQ ID NO:179)

VREQLKTFADKAFHEMEDSFYQAAL(SEQ ID NO:180)

VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:181)

VLEQLKTFADKTFHEMEDSFYQAAL(SEQ ID NO:182)

VREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:183)

SSVLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:198)

VLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:199)。

本发明的ACE2蛋白诱饵包含那些，其中H1包含与SEQ ID NO:15所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列(SSVLEQLKTFADKAFHEMEDRFYQAAL)(SEQ ID NO:15)

其中第1位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第2位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y；

其中第3位的氨基酸是V或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、W或Y；

其中第4位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、M、P、Q、R、S、T、V、W或Y

其中第5位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y

其中第6位的氨基酸是Q或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、S、T、V或W；

其中第7位的氨基酸是L或被取代时则是C、I、M、T或V；

其中第8位的氨基酸是K或被取代时则是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；

其中第9位的氨基酸是T或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、V、W或Y；

其中第10位的氨基酸是F或被取代时则是A、C、H、V、W或Y；

其中第11位的氨基酸是A或被取代时则是C、G、L、M、S、T或V；

其中第12位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；

其中第13位的氨基酸是K或被取代时则是A、C、F、H、I、L、M、N、Q、R、S、V、W或Y；

其中第14位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、Q、S、T或V；

其中第15位的氨基酸是F或被取代时则是A、C、D、E、G、H、I、L、M、N、Q、R、S、T、V、W或Y；

其中第16位的氨基酸是H或被取代时则是A、C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第17位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第18位的氨基酸是M或被取代时则是A、C、D、F、G、H、I、L、N、Q、S、T、V、W或Y；

其中第19位的氨基酸是E或被取代时则是D、M、N、P、Q、T或V；

其中第20位的氨基酸是D或被取代时则是E、F、G、H、L、N或Q；

其中第21位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y；

其中第22位的氨基酸是F或被取代时则是C、G、H、L、M、N、W或Y；

其中第23位的氨基酸是Y或被取代时则是H、D或F；

其中第24位的氨基酸是Q或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、R、S、T、V、W或Y；

其中第25位的氨基酸是A或被取代时则是C、F、G、H、I、L、M、N、Q、S、T、V、W或Y；

其中第26位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、L、M、N、Q、S、T或V；并且

其中第27位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、M、N、Q、R、S、T、V、W或Y。还包含那些ACE-2蛋白诱饵，其中第1位和第2位的氨基酸不存在。在一些特别优选实施方案中，在第1位、第5位、第6位、第9位、第10位、第12位、第13位、第16位、第17位、第19位、第20位、第23位、第24位和第27位的氨基酸中不超过3个、2个或1个被取代。

在一些方面，H1在C末端包含额外氨基酸(例如，在C末端的额外11个氨基酸)。在本文的H1(包括与SEQ ID NO:11-17、177-183、198或199所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列的H1)的任何实施方案中，氨基酸序列AVFEAAEAAAG(SEQ ID NO:18)、AVWEAAEAAAG(SEQ ID NO:19)、AVFEAVEAAAG(SEQ ID NO:249)或AVWEAVEAAAG(SEQ ID NO:250)能够任选地存在于C末端。

因此，在一些方面，H1包含与SEQ ID NO.240-243或251-254所示的序列具有至少70％、80％、90％、95％或100％同一性的序列：

SSVLEQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ ID NO:240)，VLEQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ ID NO:241)；

SSVLEQLKTFADKAFHEMEDLFYQAALAVFEAAEAAAG(SEQ ID NO:242)；

VLEQLKTFADKAFHEMEDLFYQAALAVFEAAEAAAG(SEQ ID NO:243)；

SSVLEQLKTFADKAFHEMEDRFYQAALAVFEAVEAAAG(SEQ ID NO:251)，VLEQLKTFADKAFHEMEDRFYQAALAVFEAVEAAAG(SEQ ID NO:252)；

SSVLEQLKTFADKAFHEMEDLFYQAALAVFEAVEAAAG(SEQ ID NO:253)；或

VLEQLKTFADKAFHEMEDLFYQAALAVFEAVEAAAG(SEQ ID NO:254)。

Α螺旋域H2

本发明的从头蛋白能够包含两个Α螺旋域H1和H2以及任选的Β发夹域H3，其中H2包含氨基酸序列：

NX₁₄X₁₅NX₁₆X₁₇X₁₈KX₁₉X₂₀X₂₁FX₂₂X₂₃EQX₂₄X₂₅LX₂₆X₂₇MY(SEQ ID NO:5)

其中X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆、X₂₇各自独立地选自任何氨基酸。

本发明包括本发明的从头蛋白，其中H2包含氨基酸序列：

其中X₁₄是选自A、C、D、G、H、I、L、M、N、P、R、S、T、V或W(优选A、C、G、P、T或V)的氨基酸；

其中X₁₅是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、E、F、G、I、L、M、N、Q、R、S、T、V或Y)的氨基酸；

其中X₁₆是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、E、H、I、L、M、N、Q、R、S、V、W或Y)的氨基酸；

其中X₁₇是选自A、C、D、E、G、I、L、M、N、P、Q、S、T、V、W或Y(优选A、C、G、I或S)的氨基酸；

其中X₁₈是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选A、C、F、G、H、I、K、L、M、N、Q、R、S、T、V或Y)的氨基酸；

其中X₁₉是选自A、C、D、G、I、L、Q、S、T、V或W(优选A、L、T或V)的氨基酸；

其中X₂₀是选自A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、K、Q、R、S、T、V、W或Y)的氨基酸；

其中X₂₁是选自A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、E、F、G、H、I、K、L、M、N、R、S、T、V或W)的氨基酸；

其中X₂₂是选自A、C、D、F、G、I、L、M、N、S、T、V、W或Y(优选A、C、F、G、I、L、S或T)的氨基酸；

X₂₃是选自A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选A、C、D、E、G、H、I、L、M、N、R、S、T、V或Y)的氨基酸；

其中X₂₄是选自A、C、E、F、G、I、L、M、Q、S、T、V或W(优选A、I或S)的氨基酸

其中X₂₅是选自A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选K、D、G、H、I、Q或R)的氨基酸；

其中X₂₆是选自A、C、F、G、I、L、S、T、V或Y(优选A或I)的氨基酸；

其中X₂₇是选自A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y(优选D、C、F、I、S或T)的氨基酸。

本发明包括本发明的从头蛋白，其中H2包含氨基酸序列：

其中X₁₅、X₁₈、X₂₁、X₂₃、X₂₅、和X₂₇各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₁₄、X₁₆、X₁₇、X₁₉、X₂₂、X₂₄和X₂₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；并且

X₂₀是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸。从头蛋白质包含上述那些，其中苯丙氨酸从X₁₄和X₁₇的氨基酸列表中去除，酪氨酸包含在X₁₈的氨基酸列表中，谷氨酸和脯氨酸从X₁₉的氨基酸列表中去除，脯氨酸从X₂₀、X₂₂、X₂₃、X₂₄和X₂₅的氨基酸列表中去除，蛋氨酸包含在X₂₁的氨基酸列表中，组氨酸包含在X₂₃的氨基酸列表中_，蛋氨酸和脯氨酸从X₂₆的氨基酸列表中去除，并且异亮氨酸包含在X₂₇的氨基酸列表中，并且赖氨酸和脯氨酸去除。

本发明包括本发明的从头蛋白，其中H2包含氨基酸序列：

X₁₄、X₁₇、X₂₂、X₂₄、和X₂₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₁₆是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₁₉是选自A、F、I、L、M、P、E、T或V的氨基酸；并且

X₂₀是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸。从头蛋白质包含上述那些，其中苯丙氨酸从X₁₄和X₁₇的氨基酸列表中去除，酪氨酸包含在X₁₈的氨基酸列表中，谷氨酸和脯氨酸从X₁₉的氨基酸列表中去除，脯氨酸从X₂₀、X₂₂、X₂₃、X₂₄和X₂₅的氨基酸列表中去除，蛋氨酸包含在X₂₁的氨基酸列表中，组氨酸包含在X₂₃的氨基酸列表中，蛋氨酸和脯氨酸从X₂₆的氨基酸列表中去除，并且异亮氨酸包含在X₂₇的氨基酸列表中，并且赖氨酸和脯氨酸去除。

本发明包括本发明的从头蛋白，其中H2包含氨基酸序列：

X₁₄、X₁₇、X₁₉、X₂₂、X₂₄和X₂₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₁₆是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、I、L、M、P、E或V)的氨基酸，并且

其中

X₁₄是A或V

X₁₆是A或E(或者X₁₆是A或E或N)

X₂₀是K或Q

X₁₅、X₁₈、X₂₁、X₂₃、X₂₅和X₂₇各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；以及

X₁₇、X₁₉、X₂₂、X₂₄和X₂₆各自独立地为选自A、F、I、L、M、P或V的氨基酸。本发明的从头蛋白包含上述那些，其中对于X₁₇，酪氨酸包含在X₁₈的氨基酸列表中，脯氨酸从X₁₉的氨基酸列表中去除，脯氨酸从X₂₂、X₂₃、X₂₄和X₂₅的氨基酸列表中去除，蛋氨酸包含在X₂₁的氨基酸列表中，组氨酸包含在X₂₃的氨基酸列表中，蛋氨酸和脯氨酸从X₂₆的氨基酸列表中去除，苏氨酸包含在X₂₇的氨基酸列表中并且赖氨酸和脯氨酸去除。

其中：

X₁₄是A或V；X₁₅是E；X₁₆是A或E；X₁₇是A；X₁₈是R；X₁₉是A；X₂₀是K或Q；

X₂₁是E；X₂₂是A；X₂₃是E X₂₄是A；X₂₅是K；X₂₆是A；X₂₇是D。

其中X₁₄、X₁₇、X₁₉、X₂₂、X₂₄和X₂₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₁₅是E；

X₁₆是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、I、L、M、P、E或V)的氨基酸；

X₁₈是R

X₂₀是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W、或

Y的氨基酸；

X₂₁是E；

X₂₃是E；

X₂₅是K；并且

X₂₇是D。本发明的从头蛋白包含上述那些，其中苯丙氨酸从X₁₄和X₁₇的氨基酸列表中去除，脯氨酸从X₂₀、X₂₂和X₂₄的氨基酸列表中去除，并且蛋氨酸和脯氨酸从X₂₆的氨基酸列表中去除。

在一些此类方面，X₁₄是选自A或V的氨基酸；X₁₆是选自A或E的氨基酸；并且X₂₀是选自K或Q的氨基酸。

其中

X₁₄是选自A或V的氨基酸

X₁₆是选自A或E的氨基酸

X₂₀是选自K或Q的氨基酸

X₁₅、X₁₇、X₁₈、X₁₉、X₂₁、X₂₂、X₂₃、X₂₄、X₂₆ X₂₅、X₂₆和X₂₇能够如本文的任何实施方案中所提供。

其中

(i)X₁₅是E并且X₁₄、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；

(ii)X₁₈是R并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；

(iii)X₂₁是E并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；

(iv)X₂₃是E并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₄、X₂₅、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；

(v)X₂₅是K并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；

(vi)X₂₆是A并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅和X₂₇如本文针对H2的任何实施方案中所提供；

(vii)X₂₇是D并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅和X₂₆如本文针对H2的任何实施方案中所提供；

(viii)X₁₆是A并且X₁₄、X₁₅、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆和X₂₇如本文针对H2的任何实施方案中所提供；或者

(ix)以下至少一项、二项、三项、四项、五项或六项是正确的：X₁₅是E；X₁₈是R；X₂₁是E；X₂₃是E；X₂₅是K；X₂₇是D。

X₄₇X₄₈X₄₉X₅₀X₅₁NX₁₄X₁₅NX₁₆X₁₇X₁₈KX₁₉X₂₀X₂₁FX₂₂X₂₃EQX₂₄X₂₅LX₂₆X₂₇MYX₅₂ X₅₃X₅₄X₅₅X₅₆(SEQ ID NO:20)

其中X₁₄-X₂₇如本文针对H2的任何实施方案中所提供；并且X₄₇、X₄₈、X₄₉、X₅₀、X₅₁、X₅₂、X₅₃、X₅₄、X₅₅和X₅₆各自独立地选自任何氨基酸。在一些方面，X₁₄-X₂₇如本文针对H2的任何实施方案中所提供；并且

X₄₉、X₅₂和X₅₅各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₅₀是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₅₄是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、I、L、M、P或V)的氨基酸；

并且

X₄₇、X₄₈、X₅₁、X₅₃和X₅₆各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸。

本发明的从头蛋白包含上述那些，其中半胱氨酸和谷氨酰胺包含在X₄₇的氨基酸列表中并且赖氨酸去除，苯丙氨酸和酪氨酸包含在X₄₈的氨基酸列表中，组氨酸包含在X₅₂和X₅₄的氨基酸列表中，并且天冬氨酸从X₅₆的氨基酸列表中去除。

本发明包括ACE2蛋白诱饵，其中X₁₄-X₂₇如本文针对H2的任何实施方案中所提供；

并且

X₄₈、X₅₁、X₅₃和X₅₆各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；并且X₄₇是G。本发明的从头蛋白包含上述那些，其中半胱氨酸和谷氨酰胺包含在X₄₇的氨基酸列表中并且赖氨酸去除，苯丙氨酸和酪氨酸包含在X₄₈的氨基酸列表中，组氨酸包含在X₅₂和X₅₄的氨基酸列表中，并且天冬氨酸从X₅₆的氨基酸列表中去除。

本发明中包括ACE2蛋白诱饵，其中X₁₄-X₂₇如本文针对H2的任何实施方案中所提供；

X₅₄是L；并且X₄₈、X₅₁、X₅₃和X₅₆各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；并且X₄₇是G。本发明的从头蛋白包含上述那些，其中苯丙氨酸和酪氨酸包含在X₄₈的氨基酸列表中，组氨酸包含在X₅₂的氨基酸列表中，并且天冬氨酸从X₅₆的氨基酸列表中去除。

在一些方面，X₄₇是G或E；X₄₈是D；X₄₉是A；X₅₀是A；X₅₁是R。在一些此类方面，X₄₇是G。在其他此类方面，X₄₇是E。

在一些方面，X₅₂是A；X₅₃是E；X₅₄是L或F或N；X₅₅是A；X₅₆是K。在一些此类方面，X₅₄是L。在其他此类方面，X₅₄是F。在又其他方面，X₅₄是N。

本发明还包括那些ACE2蛋白诱饵，其中SEQ ID NO:5的第1位、第4位、第8位、第12位、第15位、第16位、第19位、第22位和第23位的一个或多个(优选不超过1个至3个)氨基酸被取代，并且X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆、X₂₇如本文提供的任何实施方案中所述。例如，在一些方面，以下取代为E15G。在一些方面，进行以下取代中的一个或多个：Q16N、Q16Y、L19Y或M22H。

本发明的从头蛋白包含那些，其中X₄不是选自K或R的氨基酸；X₂₂不是选自E、K、Q或R的氨基酸；X₂₃不是选自P的氨基酸；X₂₄不是选自D或P的氨基酸；X₂₆不是选自D、E、H、K、P、Q或R的氨基酸；X₉不是K、P或R；并且X₂₇不是P。

本发明的从头蛋白包含那些，其中H2包含与如下所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

NAENAARKAKEFAEEQAKLADMY(SEQ ID NO:21)

NVENEARKAQEFAEEQAKLADMY(SEQ ID NO:22)

本发明的ACE2蛋白诱饵包含那些，其中H2包含与SEQ ID NO:21所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列

其中第1位的氨基酸是N或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y；

其中第2位的氨基酸是A或被取代时则是C、D、G、H、I、L、M、N、P、R、S、T、V或W；

其中第3位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第4位的氨基酸是N或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y

其中第5位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y

其中第6位的氨基酸是A或被取代时则是C、D、E、G、I、L、M、N、P、Q、S、T、V、W或Y；

其中第7位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、Y或W；

其中第8位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；

其中第9位的氨基酸是A或被取代时则是C、D、G、I、L、Q、S、T、V或W；

其中第10位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V或W；

其中第11位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第12位的氨基酸是F或被取代时则是A、C、D、E、G、I、K、L、M、P、Q、R、S、T、V、W或Y；

其中第13位的氨基酸是A或被取代时则是C、D、F、G、I、L、M、N、S、T、V、W或Y；

其中第14位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y；

其中第15位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；

其中第16位的氨基酸是Q或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、R、S、T、Y或V；

其中第17位的氨基酸是A或被取代时则是C、E、F、G、I、L、M、Q、S、T、V或W；

其中第18位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y；

其中第19位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、Y或W；

其中第20位的氨基酸是A或被取代时则是C、F、G、I、L、S、T、V或Y；

其中第21位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y；

其中第22位的氨基酸是M或被取代时则是A、C、D、E、F、G、H、I、K、L、N、Q、R、S、T、V、W或Y；并且

其中第23位的氨基酸是Y或被取代时则是D、F、H、I、L、M或V。

还包含那些ACE-2蛋白诱饵，其中在第1位、第4位、第8位、第12位、第15位、第16位、第19位、第22位和第23位的氨基酸中不超过3个、2个或1个被取代。

在一些方面，H2在N末端包含额外氨基酸(例如，在N末端至少5个额外氨基酸)。在一些方面，氨基酸序列EDAAR(SEQ ID NO:23)或GDAAR(SEQ ID NO:24)存在于N末端。因此，在一些方面，H1包含与序列

GDAAR NAENAARKAKEFAEEQAKLADMY AELAK(SEQ ID NO:244)具有至少70％、80％、90％、95％或100％同一性的序列。

在一些方面，H2在C末端包含额外氨基酸(例如，在C末端至少5个额外氨基酸)。在一些方面，氨基酸序列AELAK(SEQ ID NO:25)或AEFAK(SEQ ID NO:26)或AENAK(SEQ ID NO:27)存在于N末端。

在一些方面，氨基酸序列AELAK(SEQ ID NO:25)存在于C末端并且氨基酸序列GDAAR(SEQ ID NO:24)存在于N末端。

Β域H3

本发明的从头蛋白能够包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中H3在存在时包含氨基酸序列：

X₂₈X₂₉X₃₀X₃₁X₃₂X₃₃KGDX₃₄RX₃₅X₃₆(SEQ ID NO:6)；其中

X₂₈、X₂₉、X₃₀、X₃₁、X₃₂、X₃₃、X₃₄、X₃₅和X₃₆各自独立地选自任何氨基酸。

本发明包括本发明的从头蛋白，其中H3包含氨基酸序列：

其中：

X₂₈是选自A、C、D、E、G、I、L、M、P、Q、R、S、T、V或W(优选A、G、I、L、M、Q、T、V或W)的氨基酸；

X₂₉是选自A、C、D、E、G、L、M、P、R、S、T、V或W(优选E、L、M、P、S、T、V或W)的氨基酸；

X₃₀是选自C、F、I、L、M、T、V或W(优选I、F或V)的氨基酸；

X₃₁是选自A、C、D、E、G、I、K、L、M、N、S、T或V(优选D、M或N)的氨基酸；

X₃₂是选自F、I、L、M或V(优选L、M或F)的氨基酸；

X₃₃是选自D、G或L的氨基酸；

X₃₄是选自A、C、E、F、G、I、K、L、Q、R、S、T、V、W或Y(优选F、A、E、I、K、L、Q、R、S或V)的氨基酸；

X₃₅是选自A、C、D、E、G、H、K、L、M、P、R、S、T、V、W或Y(优选E、D、G、L、M、P、S、V或W)的氨基酸；并且

X₃₆是选组A、C、D、F、G、H、I、L、M、N、P、Q、R、S、T、V或W(优选I、C、F、M、P、Q、S、T、V或W)的氨基酸。

本发明包括本发明的从头蛋白，其中H3在存在时包含氨基酸序列：

X₃₁是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₃₅是选自D、E、G、K、N、P、Q、R、S、V或T的氨基酸

X₂₉是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、E、G、K、N、P、Q、R、S、T或V)的氨基酸

X₃₃是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选G、A、F、I、L、M、P或V)的氨基酸；

X₃₀、X₃₂和X₃₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₂₈是选自A、F、I、L、M、P、T或V的氨基酸；

并且

X₃₄是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y并且任选C(优选F、D、E、G、K、N、P、Q、R、S、Y或T)的氨基酸。本发明的从头蛋白包含上述那些，其中谷氨酰胺包含在X₂₈的氨基酸列表中_，丙氨酸和脯氨酸从X₃₀的氨基酸列表中去除，脯氨酸、谷氨酰胺和精氨酸从X₃₁的氨基酸列表中去除，丙氨酸和脯氨酸从X₃₂的氨基酸列表中去除，X₃₃是选自D、G或L的氨基酸；并且天冬氨酸和脯氨酸从X₃₄的氨基酸列表中去除。

X₃₁和X₃₅各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₂₈、X₃₀、X₃₂和X₃₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；并且

X₃₄是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y并且任选C(优选F、D、E、G、K、N、P、Q、R、S、Y或T)的氨基酸。本发明的从头蛋白包含上述那些，其中谷氨酰胺包含在X₂₈的氨基酸列表中，丙氨酸和脯氨酸从X₃₀的氨基酸列表中去除，脯氨酸、谷氨酰胺和精氨酸从X₃₁的氨基酸列表中去除，丙氨酸和脯氨酸从X₃₂的氨基酸列表中去除，X₃₃是选自D、G或L的氨基酸；并且天冬氨酸和脯氨酸从X₃₄的氨基酸列表中去除。

X₃₅是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₂₈是A或V；

X₂₉是E或V；

X₃₁是D

X₃₂是M或L；

X₃₃是G；

X₃₀和X₃₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；并且

X₃₄是选自F、Y、K或C的氨基酸。本发明的从头蛋白包含上述那些，其中丙氨酸和脯氨酸从X₃₀的氨基酸列表中去除。

X₂₈是A或V；

X₂₉是E或V；

X₃₀是I；

X₃₁是D

X₃₂是M或L；

X₃₃是G；

X₃₄是选自F、Y、K或C的氨基酸；

X₃₅是E；并且

X₃₆是I。

X₂₈是A或V或T；

X₂₉是E或V；

X₃₀是I；

X₃₁是D

X₃₂是M或L或I；

X₃₃是G；

X₃₄是选自F、Y、K、I或C的氨基酸；

X₃₅是E或V；并且

X₃₆是I。

X₅₇X₂₈X₂₉X₃₀X₃₁X₃₂X₃₃KGDX₃₄RX₃₅X₃₆X₅₈；(SEQ ID NO:28)

其中X₂₈-X₃₆如本文针对H3的任何实施方案中所提供；

X₅₇是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；并且

X₅₈是选自D、E、G、K、N、P、Q、R、S、C或T的氨基酸。本发明的从头蛋白包含上述那些，其中半胱氨酸包含在X₂₈的氨基酸列表中并且氨基酸D、K、M、N、P、Q和Y从X₂₈的氨基酸列表中去除，并且氨基酸A、C、F、H、I、L、M、V或W包含在X₅₈的氨基酸列表中。本发明还包含那些ACE2蛋白诱饵，其中X₂₈、X₂₉、X₃₀、X₃₁、X₃₂、X₃₃、X₃₄、X₃₅和X₃₆如本文的任何实施方案中所述并且SEQID NO:6的第7位和/或第8位的氨基酸被取代。例如，在一些方面，进行以下一个或多个取代：K7M或G8R。

本发明的蛋白质包含那些，其中H3包含与SEQ ID NO:29-34或200所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列。

AEIDLGKGDFREI(SEQ ID NO:29)

AEIDLGKGDCREI(SEQ ID NO:30)

VVIDLGKGDFREI(SEQ ID NO:31)

VVIDLGKGDCREI(SEQ ID NO:32)

AEIDMGKGDCREI(SEQ ID NO:33)

AEIDMGKGDFREI(SEQ ID NO:34)

VEIDLGKGDFREI(SEQ ID NO:200)。

本发明的ACE2蛋白诱饵包含那些，其中H3包含与SEQ ID NO:29所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列

其中第1位的氨基酸是A或如果被取代则是C、D、E、G、I、L、M、P、Q、R、S、T、V或W；

其中第2位的氨基酸是E或如果被取代则是A、C、D、G、L、M、P、R、S、T、V或W；

其中第3位的氨基酸是I或被取代时则是C、F、L、M、T、V或W；

其中第4位的氨基酸是D或被取代时则是A、C、E、G、I、K、L、M、N、S、T或V；

其中第5位的氨基酸是L或被取代时则是F、I、M或V；

其中第6位的氨基酸是G或被取代时则是D或L；

其中第7位的氨基酸是K或被取代时则是I、M、N、Q、R或T；

其中第8位的氨基酸是G或被取代时则是D、E、M、R或S；

其中第9位的氨基酸是D或被取代时则是E、K或T；

其中第10位的氨基酸是F或被取代时则是A、C、E、G、I、K、L、Q、R、S、T、V、W或Y；

其中第11位的氨基酸是R或被取代时则是K、M、Q或S；

其中第12位的氨基酸是E或被取代时则是A、C、D、G、H、K、L、M、P、R、S、T、V、W或Y；

并且其中第13位的氨基酸是I或被取代时则是A、C、D、F、G、H、L、M、N、P、Q、R、S、T、V或W。

还包含那些ACE-2蛋白诱饵，其中第7位、第8位、第9位和第11位的氨基酸中不超过3个、2个或1个被取代，其中编号根据SEQ ID NO:29。

本发明还包含ACE2蛋白诱饵，所述ACE2蛋白诱饵包含H3域，其中第X₃₄位的氨基酸不是半胱氨酸。本发明还包含ACE2蛋白诱饵，所述ACE2蛋白诱饵包含H3域的，其中如果X₃₄是半胱氨酸，则X₃₂是亮氨酸。本发明还包含ACE2蛋白诱饵，所述ACE2蛋白诱饵包含H3域，其中第X₃₄位的氨基酸选自D、E、G、K、N、P、Q、R、S或T。本发明中还包含ACE2蛋白诱饵，所述ACE2蛋白诱饵含有H3域，其中第X₃₄位的氨基酸是选自F、Y、K或C的氨基酸。

在一些方面，H3在N末端包含至少一个额外氨基酸，优选地是不会对与所述冠状病毒刺突蛋白的结合产生负面影响的氨基酸。在一些方面，所述氨基酸选自D、E、G、K、N、P、Q、R、S、Y或T。在一些方面，所述氨基酸选自A、C、E、F、G、I、L、R、S、T、V或W。在其他方面，所述氨基酸选自S、P、T或Y或选自L、S、P、T或Y。在一些方面，所述氨基酸是S或P(优选S)。因此，在一些方面，H3包含与序列SAEIDLGKGDFREIR(SEQ ID NO:245)或SVEIDLGKGDFREIR(SEQ ID NO:246)具有至少70％、80％、90％、95％或100％同一性的序列

在一些方面，H3在C末端包含至少一个额外氨基酸，优选地是不会对与所述冠状病毒刺突蛋白的结合产生负面影响的氨基酸。在一些方面，所述氨基酸选自L、D、E、G、K、N、P、Q、R、S或T或A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V或W。在一些方面，所述氨基酸是R。

本领域技术人员将理解本文所述的任何H1、H2和任选的H3域可以组合用于本发明。

本发明的从头蛋白包含至少一个结构域，所述至少一个结构域促进所述α螺旋和β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现。优选的结构域为从头蛋白提供疏水核并且用于以适合结合的方式稳定结合基序的相对位置和方向。支撑结构可以通过可用的方法(例如Rosetta片段组装、参数生成等)以计算方式生成和放置，或者从现有结构中提取(参见，例如，本文中的实施例)。与H1、H2和H3区不同，这些结构域基本上不映射到所述ACE2蛋白的结构域(即，不与ACE2中的其他二级结构元件在结构上或顺序上对齐)。使用本发明的教导，除了本领域的技术人员，熟练的从业者可以使用蛋白质设计原理来创建用于本发明的结构域。

促进H1、H2和存在时的H3的蛋白质折叠和结合感受态呈现的结构域能够包含以下针对D1和D2示出的氨基酸序列：

D1–

X_AX_AX_BX_BX_CX_BX_BX_BX_AX_BX_BX_AX_CX_BX_CX_AX_BX_CX_AX_CX_CX_AX_AX_BX_CX_AX_A(SEQ ID NO:35)。

D2–

X_AX_CX_CX_AX_BX_BX_AX_CX_BX_BX_AX_BX_BX_AX_CX_BX_BX_AX_BX_BX_DX_AX_BX_BX_AX_CX_BX_BX_AX_C(SEQ ID NO:36)

其中每个X_A独立地为选自D、E、G、K、N、P、Q、R、S、C和T的氨基酸；每个X_B独立地为选自A、F、I、L、M、C和P(优选A、F、I、L、M和P)的氨基酸，每个X_C独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W、Y或C的氨基酸；并且每个X_D独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W、Y或C的氨基酸。在一些实施方案中，X_D是选自A、F、I、L、M、P或V的氨基酸。在其他实施方案中，X_D是选自由D、E、G、K、N、P、Q、R、S、T或C的氨基酸。

在一些实施方案中，D1包含以下所示的氨基酸序列：

X_AX_AAAX_AALAX_AA AX_AAMKX_AALX_AI IX_AX_AIAX_AX_A(SEQ ID NO:37)；其中每个X_A独立地为选自D、E、G、K、N、P、Q、R、S、C或T的氨基酸。

在一些实施方案中，D1包含与以下所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、95％或100％同一的氨基酸序列：

REAAEALAEAARAMKEALEIIREIAEK(SEQ ID NO:38)

REAAEALAEAARAMKEALEILREIAEK(SEQ ID NO:222)。

本发明的ACE2蛋白诱饵包含那些，其中至少一个结构域(例如，D1)包含与SEQ IDNO:38所示的氨基酸序列具有至少50％、60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列

其中第1位的氨基酸是R或被取代时则是A、C、E、F、G、I、K、L、M、P、S、T、V或W(优选C、E、F、G、K、L、M、P、S、T或W)；

其中第2位的氨基酸是E或被取代时则是A、C、D、F、G、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、G、K、M、V、W或Y)；

其中第3位的氨基酸是A或被取代时则是C、E、G、K、L、M、P、Q、R、S、T、V、W或Y(优选C、K、P、Q或V)；

其中第4位的氨基酸是A或被取代时则是D、E、G、I、K、L、M、N、P、R、S、T、V或W(优选E、N、T、V或W)；

其中第5位的氨基酸是E或被取代时则是C、D、G、K、L、Q、R、S、T、V、W或Y(优选C、D、Q、S、V、W或Y)；

其中第6位的氨基酸是A或被取代时则是C、D、E、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、K、P、R、V或Y)；

其中第7位的氨基酸是L或被取代时则是A、C、F、I、M、Q、S、T或V(优选T)；

其中第8位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、Q、L、M、R、S、T、V或W(优选D、E、G、H、I、L、Q、R、S、V或W)；

其中第9位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、R、S、V、W或Y(优选A、D、H、L、M、N、R、S或V)；

其中第10位的氨基酸是A或被取代时则是C、G、L、M、Q、S、T、V或W(优选C、G、M或S)；

其中第11位的氨基酸是A或被取代时则是C、D、G、L、M、N、Q、R、S、T或V(优选C、G、M、S、T或V)；

其中第12位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、K、M、N、P、Q、S、T、V、W或Y)；

其中第13位的氨基酸是A或被取代时则是C、D、E、F、G、H、K、L、M、P、Q、R、S、T、V、W或Y(优选D、E、K、M、R、S或V)；

其中第14位的氨基酸是M或被取代时则是A、C、D、E、G、H、I、K、L、Q、R、S、T、V、W或Y(优选A、C、D、E、G、K、R、S、T、V或Y)；

其中第15位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选E、G、H、M、R、S或Y)；

其中第16位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、G、K、L、M、Q、T、V或W)；

其中第17位的氨基酸是A或被取代时则是C、G、P、S、T或V(优选C、G或T)；

其中第18位的氨基酸是L或被取代时则是C、F、H、I、K、M、N、Q、R、T、V、W或Y(优选C、F、H或V)；

其中第19位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、F、G、L、Q、R、S、T、V或Y)；

其中第20位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、K、L、M、N、Q、R、S、T、V、W或Y(优选C、E、G、L、Q、R、S、T、V或Y)；

其中第21位的氨基酸是I或被取代时则是A、C、D、E、F、G、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、F、L、M、N、S、T、V或Y)；

其中第22位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、Y或W(优选A、C、D、E、F、G、I、L、M、Q、S、T、V或Y)；

其中第23位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、F、H、I、M、N、P、T或W)；

其中第24位的氨基酸是I或被取代时则是A、C、E、F、G、H、K、L、M、N、P、Q、R、S、T、V或Y(优选C、S、T或V)；

其中第25位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、G、H、I、M、N、S、V或Y)；

其中第26位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、Q、R、S、T、V、W或Y(优选C、F、I、L、S、T或Y)；并且

其中第27位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、F、G、H、M、N、S或Y)。

在一些实施方案中，D2包含SEQ ID NO:39或40所示的氨基酸序列：

X_AAX_AX_AAAX_AX_A IAX_AAIX_AX_AAAX_A AIAX_AAAX_AIAA X_AA(SEQ ID NO:39)

X_AAX_AX_AAAX_AX_A VAX_AAIX_AX_AAAX_A AIVX_AAAX_AIAA X_AA(SEQ ID NO:40)；其中每个X_A独立地为选自D、E、G、K、N、P、Q、R、S、C或T的氨基酸。

在一些实施方案中，D2包含以下所示的氨基酸序列：

RASEAAKRX₅₉AX₆₀AIRKAAD AIX₆₁X₆₂AAKIAA RA(SEQ ID NO:41)，其中X₅₉是I或V，X₆₀是K或R或C，X₆₁是A或V或C，X₆₂是E或C。

在一些实施方案中，D2包含与SEQ ID NO:42-46所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、95％或100％同一的氨基酸序列：

RASEAAKR IAKAIRKAAD AIAEAAKIAA RA(SEQ ID NO:42)；

RASEAAKR IACAIRKAAD AIAEAAKIAA RA(SEQ ID NO:43)；

RASEAAKR IAKAIRKAAD AIACAAKIAA RA(SEQ ID NO:44)；

RASEAAKR VARAIRKAAD AIVEAAKIAA RA(SEQ ID NO:45)；

RASEAAKR VACAIRKAAD AIVEAAKIAA RA(SEQ ID NO:46)。

本发明的ACE2蛋白诱饵包含那些，其中至少一个结构域(例如，D2)包含与SEQ IDNO:42所示的氨基酸序列具有至少50％、60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列

其中第1位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、H、K、L、N、Q、S或Y)；

其中第2位的氨基酸是A或如果被取代则是C、G、I、L、M、N、P、Q、S、T、V或Y(优选C、M、Q、T或V)；

其中第3位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y(优选C、E、F、G、I、L、M、Q或R)；

其中第4位的氨基酸是E或被取代时则是A、C、D、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、I、N、S或W)；

其中第5位的氨基酸是A或被取代时则是C、D、E、F、G、I、K、L、M、N、Q、R、S、T、V、W或Y(优选D、E、I、M或Y)；

其中第6位的氨基酸是A或被取代时则是C、F、G、S或T(优选C或S)；

其中第7位的氨基酸是K或被取代时则是A、C、D、E、G、H、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、R、S、T、V、W或Y)；

其中第8位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、Q、S、T、V或Y)；

其中第9位的氨基酸是I或被取代时则是A、C、F、G、K、L、M、Q、S、T、V、W或Y(优选A、C、F、G、L、M、S、T、W或Y)；

其中第10位的氨基酸是A或被取代时则是D、G、T或V(优选D、G或V)；

其中第11位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、L、M、Q、R、S、V、W或Y)；

其中第12位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选E、G、I、S或T)；

其中第13位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、L、M、N、Q、S、T、V或Y(优选A、C、D、F、G、L、M、N、Q、S、T或V)；

其中第14位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选F、H、K、I、N、V或W)；

其中第15位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y)；

其中第16位的氨基酸是A或被取代时则是C、F、G、M、P、S、T、V或Y(优选G、T或Y)；

其中第17位的氨基酸是A或被取代时则是C、D、E、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选G、T或V)；

其中第18位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、G、I、L、N、R、T、W或Y)；

其中第19位的氨基酸是A或被取代时则是C、D、E、F、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选G、K，M、Q、S或T)；

其中第20位的氨基酸是I或被取代时则是A、C、F、G、H、L、M、Q、T、V、W或Y(优选G、L、M、T、V或Y)；

其中第21位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选D、E，G、I、K、M、N、Q、S、T、V、W或Y)；

其中第22位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、G、K、M、P、S、R、V、W或Y)；

其中第23位的氨基酸是A或被取代时则是C、G、N、S、T或V(优选G、S或T)；

其中第24位的氨基酸是A或被取代时则是C、D、E、G、K、M、N、S、T或V(优选C、G或T)；

其中第25位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、I、L、P、Q、R、S、V、W或Y)；

其中第26位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、K、I、M、P、Q、R、S或V)；

其中第27位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选F、G、M、N、S、T或V)；

其中第28位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选C、D、E、G、H、Q、S、T、V或Y)；

其中第29位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、G、H、I、K、L、M、N、P、S、T、V、W或Y)；

其中第30位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、G、H，K、N，P、Q、R、S、T或V)。

本领域技术人员将理解本文所述的D1和D2域能够与本文所述的H1、H2和H3域中的任一个组合。

本发明的从头蛋白任选地包含所述域之间的氨基酸接头。所述氨基酸接头可以是被认为适合预期用途的任何长度。所述接头可以是，例如，1至100个氨基酸长度，如1-100、1-90、1-80、1-70、1-60、1-50、1-40、1-30、1-20、1-10或1-5个氨基酸长度。与氨基酸残基允许的可变性和域顺序的灵活性一样，接头的灵活性源于使用从头蛋白设计来构建本发明的蛋白质。在这些蛋白质中，对蛋白质折叠的大部分贡献来自二级结构元件之间的相互作用，而不是来自接头。至少出于这个原因，所述接头通常可以在从头设计的蛋白质中进行修饰，而不会影响蛋白质折叠。在一些实施方案中，所述接头导致所述域之间的可变环区。

本发明的示例性ACE2蛋白诱饵是CTC-445并且如SEQ ID NO:47所示。

SAEIDMGKGDFREIRASEDAREAAEALAEAARAMKEALEIIREIAEKLRDSSRASEAAKRIAKAIRKAADAIAEAAKIAARAAKDEDAARNAENAARKAKEFAEEQAKLADMYAEFAKNGDKSRVREQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ ID NO:47)

ACE2蛋白诱饵CTC-445包含促进H1、H2和H3的蛋白质折叠和结合感受态呈现的一个H1、H2和H3域以及两个结构域。在CTC-445中，所述域的顺序是H3-D1-D2-H2-H1。H3来自氨基酸1-15；D1来自氨基酸21-47；D2来自氨基酸53-82；H2来自氨基酸86-118；并且H1来自氨基酸123-160。所述ACE2蛋白诱饵还包含将各个域连接在一起的四个接头。第一接头来自氨基酸16-20，第二接头来自氨基酸48-52，第三接头来自氨基酸83-85并且第四接头来自氨基酸119-122。编号根据SEQ ID NO:47。除了本文提供的实施例和本领域技术人员之外，本文提供的关于H1、H2、H3、D1和D2域的教导可用于制备作为CTC-445变体的ACE2蛋白诱饵。在一些实施方案中，示例性变体是那些引入了在优化蛋白质稳定性和/或折叠中起作用的氨基酸取代的变体。通常，这些取代不在结合界面，而是在蛋白质的其他位置。尽管这些取代不在结合界面上，但除了改进活性外，它们还可以改进结合亲和力。测试蛋白质以改进结合、稳定性和/或蛋白质折叠的方法是本领域已知的并且在本文中进行了描述。CTC-445已被证明与SARS-COV-2刺突蛋白特异性结合，但仅与SARS-CoV-1刺突蛋白弱结合。在一些实施方案中，与CTC-445相比，作为CTC-445变体的ACE2蛋白诱饵能够以比CTC-445更高的亲和力结合SARS-COV-2刺突蛋白和SARS-COV-1刺突蛋白。与CTC-445具有同一性的示例性ACE2蛋白诱饵包含SEQ ID NO:48-68、184-188、104-172和224-239示出的那些。本发明还包括那些ACE2蛋白诱饵，所述ACE2蛋白诱饵包含与SEQ ID NO:47-68、184-188、104-172、224-239、255-257或265所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列。除了本文提供的实施例和本领域技术人员之外，本文提供的关于H1、H2、H3、D1和D2域的教导可用于制造此类ACE2蛋白诱饵的变体。

表1

在一些实施方案中，如果不是A，SEQ ID NO:47-68、184-187和104-172中任一个的第88位的氨基酸残基选自F、I、L、M、P或V。在一些实施方案中，如果不是F，SEQ ID NO:47-68中任一个的第137位的氨基酸残基是D、E、G、K、N、P、Q、R、S或T。在一些实施方案中，如果SEQID NO:47-68、184-187和104-172中任一个的第11位的氨基酸残基是半胱氨酸，则第6位的氨基酸残基是L和/或第126位的氨基酸残基是L和/或第124位的氨基酸残基是S。在一些实施方案中，所述ACE2蛋白诱饵不具有CTC-625或CTC-626的氨基酸序列。在一些实施方案中，所述ACE2蛋白诱饵不具有C TC-625(即，S1P_F11Y_R42S_E46S_A88N_F116N_R124S_F137V_R143L)或CTC-626(即，S1P_M6L_F11Y_R42S_E46S_A88N_F116N_R124S_F137V_R143L-F152W)所示的氨基酸取代。

本发明的示例性从头蛋白包含含有与SEQ ID NO:47-68、184-187或104-172所示氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中

a.第2位的氨基酸残基是V；或者

b.第3位的氨基酸残基是V；或者

c.第6位的氨基酸残基是L；或者

d.第11位的氨基酸残基是F或C；或者

e.第41位的氨基酸残基是L；或者

f.第61位的氨基酸残基是V；或者

g.第63位的氨基酸残基是R或C；或者

h.第73位的氨基酸残基是V；或者

i.第74位的氨基酸残基是E或C；或者

j.第84位的氨基酸残基是T；或者

k.第86位的氨基酸残基是G；或者

l.第92位的氨基酸残基是V；或者

m.第95位的氨基酸残基是E；或者

n.第100位的氨基酸残基是Q；或者

o.第116位的氨基酸残基是L；或者

p.第124位的氨基酸残基是S；或者

q.第126位的氨基酸残基是L；或者

r.第136位的氨基酸残基是T；或者

s.第143位的氨基酸残基是S或L；或者

t.上述(a)-(s)的任何组合。

本发明的示例性从头蛋白包含含有与SEQ ID NO:47-68、184-187、104-172、255-256或224-239所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中第8位、第9位或第10位的氨基酸中不超过1个被取代；第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位或第113位的氨基酸中不超过3个、不超过2个或不超过1个被取代；第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过4个、不超过3个和/或不超过2个或不超过1个被取代。

本发明的示例性从头蛋白包含含有与SEQ ID NO:47-68、184-187、104-172、255-256或224-239所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过4个、3个、2个或1个被取代。

本发明的示例性从头蛋白包含含有与SEQ ID NO:47-68、184-187、104-172、255-256或224-239所示氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中

a.第8位的氨基酸残基是K；

b.第9位的氨基酸残基是G；

c.第10位的氨基酸残基是D

d.第91位的氨基酸残基是N

e.第94位的氨基酸残基是N

f.第98位的氨基酸残基是K

g.第102位的氨基酸残基是F

h.第105位的氨基酸残基是E

i.第106位的氨基酸残基是Q

j.第109位的氨基酸残基是L

k.第112位的氨基酸残基是M

l.第113位的氨基酸残基是Y

m.第123位的氨基酸残基是S

n.第127位的氨基酸残基是E

o.第128位的氨基酸残基是Q

p.第131位的氨基酸残基是T

q.第132位的氨基酸残基是F

r.第134位的氨基酸残基是D

s.第138位的氨基酸残基是H

t.第139位的氨基酸残基是E

u.第141位的氨基酸残基是E

v.第142位的氨基酸残基是D

w.第145位的氨基酸残基是Y

x.第146位的氨基酸残基是Q；并且

y.第149位的氨基酸残基是L

如本文所教导的，示例性蛋白诱饵的接头中可以存在大量可变性。本文提供了从头蛋白，所述从头蛋白包含含有与SEQ ID NO:69-90、258-260、266或189-193所示氨基酸序列至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中X_L是氨基酸接头。在一些此类方面，每个从头蛋白中的第一和第二X_L接头来自0个-5个氨基酸，每个从头蛋白中的第三X_L接头来自0个-3个氨基酸，并且每个从头蛋白质中的第四X_L接头来自0个-4个氨基酸。

表2

在一些实施方案中，如果不是A，SEQ ID NO:69-90、258-259或189-192中任一个的第88位的氨基酸残基选自F、I、L、M、P或V；其中第88位是指具有固定接头长度的SEQ ID NO:47。在一些实施方案中，如果不是F，SEQ ID NO:69-90或189-192中任一个的第137位氨基酸残基是D、E、G、K、N、P、Q、R、S或T。在一些实施方案中，如果SEQ ID NO:69-90、258-259或189-192中任一个的第11位的氨基酸残基是半胱氨酸，则第6位的氨基酸残基是L和/或第126位的氨基酸残基是L和/或第124位的氨基酸残基是S。上述提到的第88位、第137位、第11位、第124位和第126位是指SEQ ID NO:69-90、258-259或189-192中的位置分别对应于SEQ IDNO:47中的第88位、第137位、第11位、第124位和第126位，而不是SEQ ID NO:69-90或189-193中的实际位置，这可能由于接头X_L的非固定长度而有所不同。因此，提及“SEQ ID NO:69-90或189-192中任一个的第88位”是指SEQ ID NO:69-90、258-259或189-193的任一个中对应于SEQ ID NO:47中第88位的位置。

本发明的示例性从头蛋白包含含有与SEQ ID NO:69-90、258-259或189-192所示氨基酸序列至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中

a.第2位的氨基酸残基是V；或者

b.第3位的氨基酸残基是V；或者

c.第6位的氨基酸残基是L；或者

d.第11位的氨基酸残基是F或C；或者

e.第41位的氨基酸残基是L；或者

f.第61位的氨基酸残基是V；或者

g.第63位的氨基酸残基是R或C；或者

h.第73位的氨基酸残基是V；或者

i.第74位的氨基酸残基是E或C；或者

j.第86位的氨基酸残基是G；或者

k.第92位的氨基酸残基是V；或者

l.第95位的氨基酸残基是E；或者

m.第100位的氨基酸残基是Q；或者

n.第116位的氨基酸残基是L；或者

o.第124位的氨基酸残基是S；或者

p.第126位的氨基酸残基是L；或者

q.第136位的氨基酸残基是T；或者

r.第143位的氨基酸残基是S或L；或者

如上所述，由于接头X_L的非固定长度，上述(a)-(r)-的任何组合，其中标注的位置根据SEQ ID NO:47的编号。而不是SEQ ID NO:69-90或189-192的编号。

本发明的示例性从头蛋白包含含有与SEQ ID NO:69-90、258-259或189-192所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中第8位、第9位或第10位的氨基酸中不超过1个被取代；第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位或第113位的氨基酸中不超过3个、不超过2个或不超过1个被取代；第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过3个、不超过2个或不超过1个被取代。如上所述，由于接头X_L的非固定长度，标注的位置根据SEQ ID NO:47的编号，而不是SEQ ID NO:69-90、258-259或189-192的编号。

本发明的示例性从头蛋白包含含有与SEQ ID NO:69-90、258-259或189-192所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过4个、3个、2个或1个被取代。如上所述，由于接头X_L的非固定长度，标注的位置根据SEQ ID NO:47的编号，而不是SEQ ID NO:69-90、258-259或189-192的编号。

本发明的示例性从头蛋白包含含有与SEQ ID NO:69-90、258-259或189-192所示氨基酸序列至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列的那些，其中：

a.第8位的氨基酸残基是K；

b.第9位的氨基酸残基是G；

c.第10位的氨基酸残基是D

d.第91位的氨基酸残基是N

e.第94位的氨基酸残基是N

f.第98位的氨基酸残基是K

g.第102位的氨基酸残基是F

h.第105位的氨基酸残基是E

i.第106位的氨基酸残基是Q

j.第109位的氨基酸残基是L

k.第112位的氨基酸残基是M

l.第113位的氨基酸残基是Y

m.第123位的氨基酸残基是S

n.第127位的氨基酸残基是E

o.第128位的氨基酸残基是Q

p.第131位的氨基酸残基是T

q.第132位的氨基酸残基是F

r.第134位的氨基酸残基是D

s.第138位的氨基酸残基是H

t.第139位的氨基酸残基是E

u.第141位的氨基酸残基是E

v.第142位的氨基酸残基是D

w.第145位的氨基酸残基是Y

x.第146位的氨基酸残基是Q；并且

y.第149位的氨基酸残基是L；如上所述，由于接头X_L的非固定长度，其中标注的位置根据SEQ ID NO:47的编号，而不SEQ ID NO:69-90或189-192的编号。

本发明包括ACE2蛋白诱饵，所述ACE2蛋白诱饵包含与SEQ ID NO:47所示的氨基酸序列至少50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列，前提是存在以下取代：(i)M6L_R126L；(ii)F116L_R124S；(iii)M6L_F116L_R124S_R126L；(iv)M6L_E86G_F116L_R124S_R126L；(v)A2V_E3V_M6L_I61V_K63R_A73V_K84T_E86G_A92V_A95E_K100Q_F116L_R124S_R126L_A136T_R143S；(vi)M6L_F11C_R126L；(vii)M6L_K63C_R126L；(viii)M6L_E74C_R126L；(ix)F11C_F116L_R124S；(x)K63C_F116L_R124S；(xi)E74C_F116L_R124S；(xii)M6L_F11C_F116L_R124S_R126L；(xiii)M6L_K63C_F116L_R124S_R126L；(xiv)M6L_E74C_F116L_R124S_R126L；(xv)A2V_E3V_M6L_F11C_I61V_K63R_A73V_K84T_E86G_A92V_A95E_K100Q_F116L_R124S_R126L_A136T_R143S；(xvi)A2V_E3V_M6L_I61V_K63C_A73V_K84T_E86G_A92V_A95E_K100Q_F116L_R124S_R126L_A136T_R143S；(xvii)A2V_E3V_M6L_I61V_K63R_A73V_E74C_K84T_E86G_A92V_A95E_K100Q_F116L_R124S_R126L_A136T_R143S；(xviii)M6L_F11C_E86G_F116L_R124S_R126L；(xix)M6L_K63C_E86G_F116L_R124S_R126L；(xx)M6L_E74C_E86G_F116L_R124S_R126L；(xxi)A2V_M6L_E86G_F116L_R124S_R126L；(xxii)A2V_M6L_E86G_F116L_R124S_R126L_R143L；(xxiii)M6L_I41L_E86G_F116L_R124S_R126L_R143L；或(xxiv)A2V_M6L_I41L_E86G_F116L_R124S_R126L_R143L。

在本发明的一些优选实施方案中，当所述ACE2蛋白诱饵包含与以下至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一的序列：(i)CTC 637的氨基酸序列：存在以下氨基酸：6L和126L；(ii)CTC-638；存在以下氨基酸：116L和124S；(iii)CTC-639；存在以下氨基酸：6L、116L、124S和126L；(iv)CTC-640；存在以下氨基酸：6L、86G、116L、124S和126L；(v)CTC-641；存在以下氨基酸：2V、3V、6L、61V、63R、73V、84T、86G、92V、95E、100Q、116L、124S、126L、136T和143S；(vi)CTC-642；存在以下氨基酸：6L、11C和126L；(vii)CTC-643；存在以下氨基酸：6L、63C和126L；(viii)CTC-644；存在以下氨基酸：6L、74C和126L；(ix)CTC-645；存在以下氨基酸：11C、116L和124S；(x)CTC-646；存在以下氨基酸：63C、116L和124S；(xi)CTC-647；存在以下氨基酸：74C、116L和124S；(xii)CTC-648；存在以下氨基酸：6L、11C、116L、124S和126L；(xiii)CTC-649；存在以下氨基酸：6L、63C、116L、124S和126L；(xiv)CTC-650；存在以下氨基酸：6L、74C、116L、124S和126L；(xv)CTC-651；存在以下氨基酸：2V、3V、6L、11C、61V、63R、73V、84T、86G、92V、95E、100Q、116L、124S、126L、136T和143S；(xvi)CTC-652；存在以下氨基酸：2V、3V、6L、61V、63C、73V、84T、86G、92V、95E、100Q、116L、124S、126L、136T和143S；(xvii)CTC-653；存在以下氨基酸：2V、3V、6L、61V、63R、73V、74C、84T、86G、92V、95E、100Q、116L、124S、126L、136T和143S；(xviii)CTC-656：存在以下氨基酸：1P、11K、42S、46S、81H、88N、116N、124S、137V和143L；(xix)CTC-693：存在以下氨基酸：6L、11C、86G、116L、124S和126L；(xx)CTC-694：存在以下氨基酸：6L、63C、86G、116L、124S和126L；(xxi)CTC-695：存在以下氨基酸：6L、74C、86G、116L、124S和126L；(xxii)CTC-699；存在以下氨基酸：2V、6L、86G、116L、124S和126L；(xxiii)CTC-700；存在以下氨基酸：2V、6L、86G、116L、124S、126L、143L；(xxiv)CTC-701；存在以下氨基酸：6L、41L、86G、116L、124S、126L和143L；(xxv)CTC-702；存在以下氨基酸：2V、6L、41L、86G、116L、124S、126L和R143。

本发明包括本发明的从头蛋白，所述从头蛋白包含诱饵单元，所述诱饵单元包含与SEQ ID NO:50(CTC-640)所示的氨基酸序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一的氨基酸序列，其中

其中第1位的氨基酸是S或被取代时则是A、C、E、F、G、I、L、R、S、T、V或W(优选C、E、G、I或L)；

其中第2位的氨基酸是A或被取代时则是C、D、E、G、I、L、M、P、Q、R、S、T、V或W(优选G、I、L、M、Q、T、V或W)；

其中第3位的氨基酸是E或被取代时则是A、C、D、G、L、M、P、R、S、T、V或W(优选L、M、P、S、T、V或W)；

其中第4位的氨基酸是I或被取代时则是C、F、L、M、T、V或W(优选F或V)；

其中第5位的氨基酸是D或被取代时则是A、C、E、G、I、K、L、M、N、S、T或V(优选M或N)；

其中第6位的氨基酸是L或被取代时则是F、I、M或V(优选M或F)；

其中第7位的氨基酸是G或被取代时则是D或L；

其中第8位的氨基酸是K或被取代时则是I、M、N、Q、R或T(优选M)；

其中第9位的氨基酸是G或被取代时则是D、E、M、R或S(优选R)；

其中第10位的氨基酸是D或被取代时则是E、K或T(优选未被取代)；

其中第11位的氨基酸是F或被取代时则是A、C、E、G、I、K、L、Q、R、S、T、V、W或Y(优选A、E、I、K、L、Q、R、S或V)；

其中第12位的氨基酸是R或被取代时则是K、M、Q或S(优选未被取代)；

其中第13位的氨基酸是E或被取代时则是A、C、D、G、H、K、L、M、P、R、S、T、V、W或Y(优选D、G、L、M、P、S、V或W)；

其中14位的氨基酸是I或被取代时则是A、C、D、F、G、H、L、M、N、P、Q、R、S、T、V、W(优选I、C、F、M、P、Q、S、T、V或W)；

其中第15位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W(优选C、D、E、F、H、K、L、Q、S、V、W)；

其中第16位的氨基酸是A或被取代时则是A、D、E、F、G、L、M、R、S、T、V、W(优选E、F、G、L、M、S、T、V、W)；

其中第17位的氨基酸是S或被取代时则是A、C、D、E、G、K、L、M、P、Q、R、S、T、V、W(优选A、C、D、E、G、L、P、T、V、W)；

其中第18位的氨基酸是E或被取代时则是A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y(优选C、G、I、L、M、N、P、R、S、T、V)；

其中第19位的氨基酸是D或被取代时则是A、C、D、E、G、I、K、L、M、N、P、R、S、T、V、W、Y(优选C、E、G、M、P、R、V、W)；

其中第20位的氨基酸是A或被取代时则是A、C、E、G、I、L、P、Q、R、S、T、V、W(优选L、R、S、T、V、W)；

其中第21位的氨基酸是R或被取代时则是A、C、E、F、G、I、K、L、M、P、S、T、V或W(优选C、E、F、G、K、L、M、P、S、T或W)；

其中第22位的氨基酸是E或被取代时则是A、C、D、F、G、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、G、K、M、V、W或Y)；

其中第23位的氨基酸是A或被取代时则是C、E、G、K、L、M、P、Q、R、S、T、V、W或Y(优选C、K、P、Q或V)；

其中第24位的氨基酸是A或被取代时则是D、E、G、I、K、L、M、N、P、R、S、T、V或W(优选E、N、T、V或W)；

其中第25位的氨基酸是E或被取代时则是C、D、G、K、L、Q、R、S、T、V、W或Y(优选C、D、Q、S、V、W或Y)；

其中第26位的氨基酸是A或被取代时则是C、D、E、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、K、P、R、V或Y)；

其中第27位的氨基酸是L或被取代时则是A、C、F、I、M、Q、S、T或V(优选T)；

其中第28位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、Q、L、M、R、S、T、V或W(优选D、E、G、H、I、L、Q、R、S、V或W)；

其中第29位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、R、S、V、W或Y(优选A、D、H、L、M、N、R、S或V)；

其中第30位的氨基酸是A或被取代时则是C、G、L、M、Q、S、T、V或W(优选C、G、M或S)；

其中第31位的氨基酸是A或被取代时则是C、D、G、L、M、N、Q、R、S、T或V(优选C、G、M、S、T或V)；

其中第32位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、K、M、N、P、Q、S、T、V、W或Y)；

其中第33位的氨基酸是A或被取代时则是C、D、E、F、G、H、K、L、M、P、Q、R、S、T、V、W或Y(优选D、E、K、M、R、S或V)；

其中第34位的氨基酸是M或被取代时则是A、C、D、E、G、H、I、K、L、Q、R、S、T、V、W或Y(优选A、C、D、E、G、K、R、S、T、V或Y)；

其中第35位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选E、G、H、M、R、S或Y)；

其中第36位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、G、K、L、M、Q、T、V或W)；

其中第37位的氨基酸是A或被取代时则是C、G、P、S、T或V(优选C、G或T)；

其中第38位的氨基酸是L或被取代时则是C、F、H、I、K、M、N、Q、R、T、V、W或Y(优选C、F、H或V)；

其中第39位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、F、G、L、Q、R、S、T、V或Y)；

其中第40位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、K、L、M、N、Q、R、S、T、V、W或Y(优选C、E、G、L、Q、R、S、T、V或Y)；

其中第41位的氨基酸是I或被取代时则是A、C、D、E、F、G、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、F、L、M、N、S、T、V或Y)；

其中第42位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、Y或W(优选A、C、D、E、F、G、I、L、M、Q、S、T、V或Y)；

其中第43位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、F、H、I、M、N、P、T或W)；

其中第44位的氨基酸是I或被取代时则是A、C、E、F、G、H、K、L、M、N、P、Q、R、S、T、V或Y(优选C、S、T或V)；

其中第45位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、G、H、I、M、N、S、V或Y)；

其中第46位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、Q、R、S、T、V、W或Y(优选C、F、I、L、S、T或Y)；

其中第47位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、F、G、H、M、N、S或Y)；

其中第48位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W、Y(优选C、D、F、G、H、I、P、Q、S、T、W、Y)；

其中第49位的氨基酸是R或被取代时则是A、C、D、E、F、G、I、K、L、M、P、Q、R、S、T、V、W、Y(优选A、D、K、M、Q、S、T、V、Y)；

其中第50位的氨基酸是D或被取代时则是A、C、D、E、F、G、K、L、M、N、Q、R、S、T、V、W(优选C、E、M、T、V)；

其中第51位的氨基酸是S或被取代时则是A、C、D、E、F、G、I、K、L、M、P、Q、R、S、T、V、W、Y(优选A、D、E、F、K、M、P、T、V、Y)；

其中第52位的氨基酸是S或被取代时则是A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y(优选A、E、M、Q)；

其中第53位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、H、K、L、N、Q、S或Y)；

其中第54位的氨基酸是A或被取代时则是C、G、I、L、M、N、P、Q、S、T、V或Y(优选C、M、Q、T或V)；

其中第55位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y(优选C、E、F、G、I、L、M、Q或R)；

其中56位的氨基酸是E或被取代时则是A、C、D、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、I、N、S或W)；

其中第57位的氨基酸是A或被取代时则是C、D、E、F、G、I、K、L、M、N、Q、R、S、T、V、W或Y(优选D、E，I、M或Y)；

其中第58位的氨基酸是A或被取代时则是C、F、G、S或T(优选C或S)；

其中第59位的氨基酸是K或被取代时则是A、C、D、E、G、H、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、R、S、T、V、W或Y)；

其中第60位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、Q、S、T、V或Y)；

其中第61位的氨基酸是I或被取代时则是A、C、F、G、K、L、M、Q、S、T、V、W或Y(优选A、C、F、G、L、M、S、T、W或Y)；

其中第62位的氨基酸是A或被取代时则是D、G、T或V(优选D、G或V)；

其中第63位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、L、M、Q、R、S、V、W或Y)；

其中第64位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选E、G、I、S或T)；

其中第65位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、L、M、N、Q、S、T、V或Y(优选A、C、D、F、G、L、M、N、Q、S、T或V)；

其中第66位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选F、H、K、I、N、V或W)；

其中第67位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y)；

其中第68位的氨基酸是A或被取代时则是C、F、G、M、P、S、T、V或Y(优选G、T或Y)；

其中第69位的氨基酸是A或被取代时则是C、D、E、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选G、T或V)；

其中第70位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、G、I、L、N、R、T、W或Y)；

其中第71位的氨基酸是A或被取代时则是C、D、E、F、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选G、K，M、Q、S或T)；

其中第72位的氨基酸是I或被取代时则是A、C、F、G、H、L、M、Q、T、V、W或Y(优选G、L、M、T、V或Y)；

其中第73位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选D、E，G、I、K、M、N、Q、S、T、V、W或Y)；

其中第74位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、G、K、M、P、S、R、V、W或Y)；

其中第75位的氨基酸是A或被取代时则是C、G、N、S、T或V(优选G、S或T)；

其中第76位的氨基酸是A或被取代时则是C、D、E、G、K、M、N、S、T或V(优选C、G或T)；

其中第77位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、I、L、P、Q、R、S、V、W或Y)；

其中第78位的氨基酸是I或被取代时则是A、C、D、E、F、G、H、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、K、I、M、P、Q、R、S或V)；

其中第79位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选F、G、M、N、S、T或V)；

其中第80位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选C、D、E、G、H、Q、S、T、V或Y)；

其中第81位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、G、H、I、K、L、M、N、P、S、T、V、W或Y)；

其中第82位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、G、H、K、N、P、Q、R、S、T或V)；

其中第83位的氨基酸是A或被取代时则是C、D、E、G、K、L、Q、R、S、T、V、W或Y(优选C、E、L、S、T或Y)；

其中第84位的氨基酸是K或被取代时则是A、C、D、E、F、G、L、M、N、P、Q、R、S、T、V或W(优选E、F，G、M、N、S或W)；

其中第85位的氨基酸是D或被取代时则是A、C、E、G、H、L、M、N、P、Q、R、S、T、V、W或Y(优选C、L、M、N、Q、S、T、V或W)；

其中第86位的氨基酸是G或被取代时则是A、C、D、E、I、L、M、N、P、Q、R、S、T、V或W(优选C、D、E、I、M、N、P、Q、R、S或T)；

其中第87位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选E、F、G、H、I、M、P、Q、R、S、V、W或Y)；

其中第88位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、E、H、L、L、N、R、T、W或Y)；

其中第89位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选E、F、G、L、N、P、Q、S、T、V或W)；

其中第90位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、H、K、N、P、Q、T、V、W或Y)；

其中第91位的氨基酸是N或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、D、E、G、K、L、M、P、Q、R、S、T、V或W)；

其中第92位的氨基酸是A或被取代时则是C、D、G、H、I、L、M、N、P、R、S、T、V或W(优选C、G、P、T或V)；

其中第93位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、F、I、K、L、M、N、Q、R、S、T或V)；

其中第94位的氨基酸为N或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选D、F、G、I、L、M、Q、S、T、V或W)

其中第95位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、E、H、I、L、M、N、Q、R、S、V、W或Y)

其中第96位的氨基酸是A或被取代时则是C、D、E、G、I、L、M、N、P、Q、S、T、V、W或Y(优选C、G、I或S)；

其中第97位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、Y或W(优选A、C、F、G、H、I、K、L、M、N、Q、S、T、V或Y)；

其中98位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、G、I、I、P、Q、T、V)；

其中第99位的氨基酸是A或被取代时则是C、D、G、I、L、Q、S、T、V或W(优选L、T或V)；

其中第100位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V或W(优选A、C、D、E、F、G、H、I、Q、R、S、T、V、W或Y)；

其中第101位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、F、G、H、I、K、L、M、N、R、S、T、V或W)；

其中第102位的氨基酸是F或被取代时则是A、C、D、E、G、I、K、L、M、P、Q、R、S、T、V、W或Y(C、G、I、K、P、V、Y)；

其中第103位的氨基酸是A或被取代时则是C、D、F、G、I、L、M、N、S、T、V、W或Y(优选C、F、G、I、L、S或T)；

其中第104位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选A、C、D、G、G、H、I、L、M、N、R、S、T、V或Y)；

其中第105位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、F、G、H、K、I、M、Q、R、S)；

其中第106位的氨基酸是Q或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、R、S、T、Y或V(优选C、D、I、K、N、R、T、Y)；

其中第107位的氨基酸是A或被取代时则是C、E、F、G、I、L、M、Q、S、T、V或W(优选I或S)；

其中第108位的氨基酸为K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y(优选为D、G、H、I、Q或R)；

其中第109位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、M、N、Q、R、S、T、V、Y或W(优选A、C，D、F、G、H、I、K、M、N、Q、R、S、T、V、W、Y)；

其中第110位的氨基酸是A或被取代时则是C、F、G、I、L、S、T、V或Y(优选为I)；

其中第111位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y(优选C、F、I、S或T)；

其中第112位的氨基酸是M或被取代时则是A、C、D、E、F、G、H、I、K、L、N、Q、R、S、T、V、W或Y(优选A、D、E、F、H、I、K、L、Q、R、S、T、V、Y)；

其中第113位的氨基酸是Y或被取代时则是D、F、H、I、L、M或V(优选F)；

其中第114位的氨基酸是A或被取代时则是C、D、E、F、G、H、K、L、M、N、P、Q、R、S、T、V或W(优选C、D、G、H、N、R、S或V)；

其中第115位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、G、L、N、T、W或V)；

其中第116位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G，H、I、M、N、Q、S、T、V或Y)；

其中第117位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选C、D、F、G、I、N、P或T)；

其中第118位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、L、M、N、R、S、T、V或Y)；

其中第119位的氨基酸是N或被取代时则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、D、F、G、H、I、K、M、Q、R、S、T或Y)；

其中第120位的氨基酸是G或被取代时则是A、C、D、E、F、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、D、N或Q)；

其中第121位的氨基酸是D或被取代时则是A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选E、F或N)；

其中第122位的氨基酸是K或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V或W)；

其中第123位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y(优选A、C、D、E、G、H、I、K、L、M、N、P、R、T、V或W)；

其中第124位的氨基酸是S或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y(优选A、C、E、F、G、I、L、M、N、Q、R、T、V或Y)；

其中第125位的氨基酸是V或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、W或Y(优选A、D、H、I、N、P、T或W)；

其中第126位的氨基酸为L或被取代时则是A、C、D、E、F、G、H、I、K、M、P、Q、R、S、T、V、W或Y(优选R、C、H、I、K、M、S、T或Y)

其中第127位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、F、G、H、M、P、Q、R、T、V、W或Y)

其中第128位的氨基酸为Q或被取代时则是A、C、D、E、F、G、H、I、L、M、N、P、S、T、V或W(优选N或P)；

其中第129位的氨基酸是L或被取代时则是C、I、M、T或V(优选I、T或V)；

其中第130位的氨基酸是K或被取代时则是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、E、I、I、N、R、V或Y)；

其中第131位的氨基酸是T或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、V、W或Y(优选A、C、F、H、I、K、L、M、Q、R、S、V、W或Y)；

其中第132位的氨基酸是F或被取代时则是A、C、H、V、W或Y(优选W)；

其中第133位的氨基酸是A或被取代时是C、G、L、M、S、T或V，优选C、S或T)；

其中第134位的氨基酸是D或被取代时是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、E、H、I、L、N、Q、R、S、T、V、Y)；

其中135位的氨基酸是K或被取代时则是A、C、F、H、I、L、M、N、Q、R、S、V、W或Y(优选A、H、M、N、R、S、V、W或Y)；

其中136位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、Q、S、T或V(优选C、E、F、I、L、N、Q、S、T或V)；

其中第137位的氨基酸是F或被取代时则是A、C、D、E、G、H、I、L、M、N、Q、R、S、T、V、W或Y(优选为D、C、H、L、M、N、Q或W)；

其中第138位的氨基酸是H或被取代时则是A、C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、G、I、K、M、P、Q、R、S或Y)；

其中第139位的氨基酸是E或者被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、G、I、L、N、Q、S、T、V)；

其中第140位的氨基酸是M或被取代时则是A、C、D、F、G、H、I、L、N、Q、S、T、V、W或Y(优选A、C、F、G、L、S、T或V)；

其中第141位的氨基酸是E或被取代时则是D、M、N、P、Q、T或V(优选D、N或T)；

其中第142位的氨基酸是D或被取代时则是E、F、G、H、L、N或Q(优选E)；

其中第143位的氨基酸是R或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、E、F、G、H、I、M、P、K、T、V、W或Y)；

其中第144位的氨基酸是F或被取代时则是C、G、H、L、M、N、W或Y(优选N、W、或Y)；

其中第145位的氨基酸是Y或被取代时则是H、D或F(优选H)；

其中第146位的氨基酸是Q或被取代时则是A、C、D、E、F、G、H、I、K、L、M、N、P、R、S、T、V、W或Y(优选A、C、D、F、G、H、I、K、M、S或V)；

其中第147位的氨基酸是A或被取代时则是C、F、G、H、I、L、M、N、Q、S、T、V、W或Y(优选C、S或T)；

其中第148位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、L、M、N、Q、S、T或V(优选C、F、G、L、M、N、S、T或V)；

其中第149位的氨基酸是L或被取代时则是A、C、D、E、F、G、H、I、K、M、N、Q、R、S、T、V、W或Y(优选C、F、I、K、R、T或V)

其中第150位的氨基酸是A或被取代时则是A、C、D、E、F、G、H、K、L、M、N、P、Q、R、S、T、V、W或Y(优选K、M、N、S或T)；

其中第151位的氨基酸是V或被取代时则是A、C、D、F、G、I、L、M、N、Q、S或T(优选A、I、I或T)；

其中第152位的氨基酸是F或被取代时则是C、H、I、L、M、V、W或Y(优选H或W)；

其中第153位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选D、G、H、I、K、M、N、Q、S或T)；

其中第154位的氨基酸是A或被取代时则是C、E、F、G、I、L、M、N、Q、R、S、T、V、W或Y(优选C、L、Q或V)；

其中第155位的氨基酸是A或被取代时则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选C、D、E、G、H、I、L、M、P、Q、S、T、V、W或Y)；

其中第156位的氨基酸是E或被取代时则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、H、D、I、M、M、P、Q、R、S或T)；

其中第157位的氨基酸是A或被取代时则是E、S或V；

其中第158位的氨基酸是A或被取代时则是E、G、S、T或V(优选V)；

其中第159位的氨基酸是A或被取代时则是E、G、S、T或V(优选S或T)；并且其中第160位的氨基酸是G或被取代时则是E、R或V(优选R)。在一些优选实施方案中，在第8位、第9位、第10位、第12位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第135位、第138位、第139位、第141位、第142位、第145位、第146位和第140位的氨基酸中不超过6个、5个、4个、3个、2个或1个被取代。

在一些示例性实施方案中，在所述蛋白质诱饵的N末端添加氨基酸残基以增加稳定性。例如，在示例性实施方案中，将PG序列(即脯氨酸-甘氨酸)添加到N末端。SEQ IDNO.47-90、104-172、184-193、224-239、255-260和265-266以及SEQ ID NO.91-95、194-197、223和261-263(如下文提供)示出的任何氨基酸序列能够在例如PG序列或MPG序列之前。

所述ACE2蛋白诱饵可包含一个、两个、三个、四个或多个诱饵单元。在一些实施方案中，所述ACE2蛋白诱饵可包含一个、两个、三个或四个诱饵单元。在一些实施方案中，诱饵单元包含(i)至少两个α螺旋域H1和H2，(ii)任选的β发夹域H3，和(iii)至少一个结构域。在一些实施方案中，诱饵单元包含(i)两个α螺旋域H1和H2，(ii)一个β发夹域H3，和(iii)两个结构域。在示例性实施方案中，所述H1、H2、H3和结构域如本文所述。非限制性示例性诱饵单元在SEQ ID NO:47-90、104-172、184-193、224-239和255-260中提供。在一些方面，ACE2蛋白诱饵是多价的(例如二价、三价、四价)，这意味着它包含至少两个诱饵单元。在一些实施方案中，所述ACE2蛋白诱饵包含两个、三个、四个或多个氨基酸序列，所述氨基酸序列独立地选自SEQ ID NO:47-90、104-172、184-193、224-239、255-260或265-266。在一些实施方案中，所述ACE2蛋白诱饵包含相同诱饵单元的多个拷贝。在一些实施方案中，所述ACE2蛋白诱饵包含2个至4个拷贝的相同或不同诱饵单元。

在一些方面，将第一诱饵单元的C末端连接到第二诱饵单元的N末端。连接可以通过化学或酶促交联(例如双马来酰亚胺)。两个或更多个诱饵单元可以在翻译融合物中直接彼此邻接，或者可以通过适合预期目的的多肽接头连接。示例性此类接头包括但不限于WO2016178905、WO2018153865和WO2018170179中公开的那些。在其他实施方案中，适合的接头包括但不限于肽接头，如例如GGGGG(SEQ ID NO:96)、GSGGG(SEQ ID NO:97)、GGGGGG(SEQID NO:98)、GGSGGG(SEQ ID NO:99)、GGSGGSGGGSGGSGSG(SEQ ID NO:100)、GSGGSGGGSGGSGSG(SEQ ID NO:101)、GGSGGSGGGSGGSGGGGSGGSGGGSGGGGS(SEQ ID NO:102)、GGGGSGGSGSGGSGGGS(SEQ ID NO:175)、[GGGGX]_n(SEQ ID NO:103)，其中X是Q、E或S，并且n是2-5，以及GGGSGGSGSGGSGGGS(SEQ ID NO:264)。在一些实施方案中，诱饵单元之间的氨基酸接头是1-100个、1-80个、1-60个、1-50个、1-40个、1-30个或1-20个氨基酸长度。

在一些方面，两个或更多个ACE2蛋白诱饵不同。本文提供的任何ACE2蛋白诱饵都可以连接在一起用于本发明。

示例性ACE2蛋白诱饵包含含有CTC-640、CTC-693、CTC-694、CTC-695、CTC-702、CTC-705或CTC-726中的一种或多种的那些。在一些方面，ACE2蛋白诱饵包含(i)CTC-640和/或CTC-693；(ii)CTC-640和/或CTC-694；(iii)CTC-640和/或CTC-694。在一些方面，本发明的ACE2蛋白诱饵包含CTC-640的多价、连续复制形式；多价ACE2蛋白诱饵，其中每个单独的诱饵单元包含与CTC-640所示氨基酸序列具有至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％或99％同一性的序列；CTC-702的多价、连续复制版本；多价ACE2蛋白诱饵，其中每个单独的诱饵单元包含与CTC-702所示氨基酸序列具有至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％或99％同一性的序列；CTC-705的多价、连续复制版本；多价ACE2蛋白诱饵，其中每个单独的诱饵单元包含与CTC-705所示氨基酸序列具有至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％或99％同一性的序列；CTC-726的多价、连续复制版本；或多价ACE2蛋白诱饵，其中每个单独的诱饵单元包含与CTC-726所示的氨基酸序列具有至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％或99％同一性的序列。

技术人员将理解，除了接头之外，在融合在一起以产生多价ACE2蛋白诱饵(例如，二价、三价、四价等)之前，可以将额外氨基酸残基添加到每个单独诱饵单元的N末端或C末端。此外，所述多价ACE2蛋白诱饵能够被环化。用于环化蛋白质的方法是本领域已知的，参见，例如，Wood等人,Journal of Biological Chemistry,289:21；14512-14519,2014。

示例性多价ACE2蛋白诱饵包含含有与SEQ ID NO:91-95、194-197、223或261-263所示氨基酸序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一的序列的那些：

表3

域顺序

由于本发明的蛋白质是从头合成的蛋白质，因此在氨基酸残基和域(例如H1、H2、H3、D1和D2)的排序中都允许有很大的可变性。所述域可以通过氨基酸接头以不同的顺序连接在一起，并且仍然可以正确折叠并呈递以与所述冠状病毒刺突蛋白结合。如上所述，CTC-445和本文提供的许多CTC-445变体中的域顺序是H3-D1-D2-H2-H1。然而，本领域技术人员将理解，所述域能够重新排序并且仍然产生活性蛋白质。在一些实施方案中，对域进行重新排序称为环状排列，并且转移诱饵单元的氨基酸序列以产生新的N末端和C末端。在一些此类方面，重新排序导致域的新顺序是H1-H3-D1-D2-H2。本文所述的所有具有H3-D1-D2-H2-H1域顺序的CTC-445变体都能够环状排列以产生H1-H3-D1-D2-H2的新域顺序。由于H1域的移位，在H1与H3域之间添加了一个氨基酸接头，在H1与H3域之间产生了一个可变环区。CTC-705是CTC-640的环状排列版本。CTC-726和CTC-786是CTC-702的两个环状排列版本，它们在域H1与H3之间的接头方面有所不同。以这种方式环状排列CTC-640和CTC-726重新定位ACE2蛋白诱饵的末端以允许多价亚基的不同方向。域的额外排序包括，例如，H2-H1-H3-D1-D2、D2-H2-H1-H3-D1和D1-D2-H2-H1-H3。

ACE2蛋白诱饵的示例性生物学特征

通常，本发明的蛋白质通过与冠状病毒刺突蛋白结合而发挥作用，特别是来自冠状病毒的冠状病毒刺突蛋白，所述冠状病毒刺突蛋白通过作为其受体的ACE2(即冠状病毒ACE2结合刺突蛋白)进入宿主细胞。在某些实施方案中，本发明的从头蛋白与刺突蛋白SARS-COV-2的受体结合域(RBD)中的一个或多个氨基酸结合。例如，本发明包含结合SARS-CoV-2刺突蛋白的从头蛋白，其K_d小于100nM、小于50nm、小于20nM，如通过生物层干涉法或酵母展示所测量的，例如，使用实施例中定义的测定格式。在某些实施方案中，从头蛋白结合SARS-CoV-S的K_d小于约20nM、小于约15nM、小于约5nM，如通过生物层干涉法或酵母展示，例如使用如本文定义的测定形式，或基本上相似的测定。

本发明还包括本发明的从头ACE2蛋白诱饵，如使用本领域已知的测定法测定的，所述从头ACE2蛋白诱饵阻断超过50％、超过60％、超过70％、超过80％或超过90％的SARS-CoV-2-S与ACE2结合。

本发明还包括中和或抑制冠状病毒(例如SARS-CoV-2)对其宿主细胞的感染性的从头蛋白。在某些实施方案中，所述蛋白质中和了SARS-CoV-2样假颗粒的传染性。在一些实施方案中，在优化的病毒样假颗粒(VLP)中和测定中，蛋白质抑制人宿主细胞的超过50％、超过60％、超过70％、超过80％或超过90％的SARS-CoV-2结合，例如，如实施例中所示，或基本相似的测定。

本发明包括与SARS-CoV-2刺突蛋白的受体结合域或域片段结合的从头ACE2蛋白诱饵。

本发明的ACE2蛋白诱饵可具有一种或多种上述生物学特征或其任何组合。

本发明的蛋白质的其他生物学特性对于本领域普通技术人员而言，通过回顾包括本文提供的实施例在内的本公开将是显而易见的。

核酸、表达载体、宿主细胞

另一方面，本发明提供编码本发明的蛋白质或肽的核酸，包括分离的核酸。分离的核酸序列可包含RNA或DNA。此类分离的核酸序列可包含用于促进所编码蛋白质的表达和/或纯化的额外序列，包括但不限于polyA序列、修饰的Kozak序列和编码表位标签、输出信号和分泌信号、核定位信号和质膜定位信号的序列。基于本文的教导，本领域技术人员将清楚什么核酸序列将编码本发明的多肽。

在另一个方面，本发明提供了重组表达载体，其包含与合适的对照序列可操作地连接的本发明任何方面的分离的核酸。“重组表达载体”包括将核酸编码区或基因可操作地连接到能够影响基因产物表达的任何对照序列的载体。与本发明的所述核酸序列可操作地连接的“对照序列”是能够影响所述核酸分子表达的核酸序列。所述对照序列不需要与所述核酸序列邻接，只要它们发挥指导其表达的作用。因此，例如，在启动子序列和所述核酸序列之间能够存在插入的未翻译但已转录的序列，并且所述启动子序列仍能够被认为与编码序列“可操作地连接”。其他此类对照序列包括但不限于多腺苷酸化信号、终止信号和核糖体结合位点。此类表达载体包括但不限于基于质粒和病毒的表达载体。用于驱动所公开的核酸序列在哺乳动物系统中表达的对照序列可以是组成型的(由多种启动子中的任一种驱动，包括但不限于CMV、SV40、RSV、肌动蛋白、EF)或诱导型的(由许多诱导型启动子中的任何一种驱动，包括但不限于四环素、蜕皮激素、类固醇响应性)。表达载体必须在宿主生物体中作为附加体或通过整合到宿主染色体DNA中是可复制的。在各种实施方案中，表达载体可以包含质粒、基于病毒的载体(包括但不限于逆转录病毒载体或溶瘤病毒)或任何其他适合的表达载体。在一些实施方案中，表达载体可以在本公开的方法中施用以在体内表达蛋白质以获得治疗益处。本发明的核酸可以施用于受试者以治疗本文所述的疾病。

在另一方面，本公开提供了包含本文公开的重组表达载体的宿主细胞，其中宿主细胞可以是原核的或真核的。可使用包括但不限于细菌转化、磷酸钙共沉淀、电穿孔或脂质体介导、DEAE-葡聚糖介导、多阳离子介导或病毒介导的转染的技术，瞬时或稳定地改造细胞以并入本发明的表达载体。(参见，例如，Molecular Cloning:A Laboratory Manual(Sambrook等人,1989,Cold Spring Harbor Laboratory Press)；Culture of AnimalCells:A Manual of Basic Technique,第2版(R.I.Freshney.1987.Liss,Inc.New York,NY))。生产根据本发明的蛋白质的方法是本发明的额外部分。所述方法包括以下步骤：(a)在有助于蛋白质表达的条件下培养根据本发明该方面的宿主，和(b)任选地回收表达的蛋白质。表达的蛋白质可以从无细胞提取物中回收，但优选从培养基中回收。

在另一方面，本公开提供选择性结合本公开蛋白质的抗体。所述抗体可以是多克隆抗体、单克隆抗体、人源化抗体及其片段，并且可以使用本领域技术人员已知的技术制备。如本文所用，“选择性结合”意指抗体优先结合本公开的蛋白质，而不是一种或多种其他生物分子、结构、细胞、组织等，如本领域技术人员所熟知的。

融合蛋白和缀合物

本发明的示例性蛋白质可以制备为融合或嵌合多肽，其包含本发明的从头ACE2蛋白诱饵和异源多肽。示例性异源多肽可以增加所得嵌合多肽的体内循环半衰期，因此可以进一步增强本发明蛋白质的特性。在各种实施方案中，增加循环半衰期的多肽可以是血清白蛋白，如人血清白蛋白或缺乏IgG重链可变区的IgG亚类抗体的Fc区。示例性Fc区能够包括突变(例如，抑制补体固定和/或Fc受体结合的突变)，或者它可以是裂解的，即能够结合补体或通过另一种机制裂解细胞，如抗体依赖性补体裂解。“Fc区”可以是天然存在的或合成的多肽，其与通过用木瓜蛋白酶消化IgG产生的IgG C末端域同源。融合蛋白可以包括整个Fc区，或保留延长嵌合多肽循环半衰期能力的更小部分，它是嵌合多肽的一部分。此外，全长或片段化Fc区可以是野生型或野生型分子的变体。也就是说，它们可以包含可能影响或可能不影响多肽功能的突变。例如，它们可以具有效应子功能或可以被修饰以使与效应子功能相关的一种或多种活动减少或完全消除。“效应子功能”是指由抗体的Fc区引起的那些生物活性，其随抗体同种型而发生变化。效应子功能的实例包括C1q结合和补体依赖性细胞毒性(CDC)、Fc受体结合、抗体依赖性细胞介导的细胞毒性(ADCC)、抗体依赖性细胞吞噬(ADCP)、细胞因子分泌、抗原呈递细胞的免疫复合物介导的抗原摄取、细胞表面受体的下调和B细胞活化。

在一些示例性实施方案中，本发明的从头蛋白包含IgG1、IgG2、IgG3或IgG4 Fc区。在一些示例性实施方案中，所述从头蛋白包含变体IgG1、IgG2、IgG3或IgG4 Fc区。在一些方面，变体Fc区缺乏效应子功能。在一些方面，本发明的从头蛋白融合至Fc区(例如，天然或变体IgG1、IgG2、IgG3或IgG4 Fc区)的C末端。在一些方面，本发明的两种从头蛋白融合至Fc区(例如，在N末端和C末端)。

在其他实施方案中，本发明的蛋白质可以与其他类型的稳定化化合物连接以促进增加的体内半衰期，包括但不限于连接一个或多个聚乙二醇链(PEG化)。

在这方面，从头蛋白能够具有能够与单独的蛋白质相比增加循环半衰期的水溶性聚合物(例如，PEG)的化学缀合的氨基酸取代。“PEG”是聚(乙二醇)分子，它是乙二醇的水溶性聚合物。可以获得不同大小的PEG，并且还可以以化学活化形式在商业上获得，所述化学活化形式衍生有化学反应基团以能够与蛋白质共价缀合。生产各种分子量的线性PEG，如重均分子量为5,000道尔顿、10,000道尔顿、20,000道尔顿、30,000道尔顿和40,000道尔顿的PEG聚合物。还开发了支链PEG聚合物。常用的活化PEG聚合物是由N-羟基丁二酰亚胺基团(用于与主要氨苄如赖氨酸残基和蛋白质N末端缀合)、醛基(用于与N末端缀合)和马来酰亚胺或碘乙酰胺基团(用于与硫醇如半胱氨酸残基偶联)衍生的那些。设计用于与PEG缀合的部分的方法是本领域已知的。例如，添加含有聚乙二醇(“PEG”)的部分可以包括将连接到马来酰亚胺基团的PEG基团(例如，“PEG-MAL”)连接到蛋白质的半胱氨酸残基上。PEG-MAL的适合的实施例包括例如甲氧基PEG-MAL 5kD；甲氧基PEG-MAL 20kD；甲氧基(PEG)2-MAL 40kD；甲氧基PEG(MAL)2 5kD；甲氧基PEG(MAL)2 20kD；甲氧基PEG(MAL)240kD；或其任何组合。

关于本发明的从头蛋白，可以用半胱氨酸代替结合不需要的氨基酸以允许连接所需的部分。在一些实施方案中，所述ACE2蛋白诱饵包含0个-4个半胱氨酸氨基酸，或者在一些实施方案中，包含0个或1个半胱氨酸氨基酸。在一些此类方面，如PEG分子的水溶性聚合物与一个或多个(优选一个)半胱氨酸残基连接。连接可以例如通过马来酰亚胺基团。用于与稳定性部分缀合的半胱氨酸残基的优选位置远离结合位点，因此稳定性部分不会干扰与ACE2冠状病毒刺突蛋白的结合(例如，在促进所述α螺旋和β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现的结构域中)。半胱氨酸残基可以出于与稳定性部分缀合以外的原因而添加，例如，可以放置两个或更多个半胱氨酸残基以允许形成二硫键。在一些方面，二硫键可以为所述ACE2蛋白诱饵提供额外稳定性。在此类实施方案中，所述添加的半胱氨酸残基不需要远离结合位点，并且在一些方面可以在所述ACE2蛋白诱饵的N末端和C末端。因此，本发明包含含有一个或多个二硫键的ACE2蛋白诱饵。

在一些示例性实施方案中，PEG基团与存在于ACE-2蛋白诱饵中任何一种的半胱氨酸残基连接。例如，本文提供了ACE2蛋白诱饵，所述ACE2蛋白诱饵与以下具有至少60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95％、97％、99％或100％同一性：(i)CTC-648的氨基酸序列，其中第11位的半胱氨酸残基存在并且与PEG基团连接；(ii)CTC-649的氨基酸序列，其中第63位的半胱氨酸残基存在并且与PEG基团连接；(iii)CTC-650的氨基酸序列，其中第74位的半胱氨酸残基存在并且与PEG基团连接；(iv)CTC-651的氨基酸序列，其中第11位的半胱氨酸残基存在并且与PEG基团连接；(v)CTC-652的氨基酸序列，其中第63位的半胱氨酸残基存在并且与PEG基团连接；(vi)CTC-653的氨基酸序列，其中第74位的半胱氨酸残基存在并且与PEG基团连接；(vii)CTC-642或CTC-645的氨基酸序列，其中第11位的半胱氨酸残基存在并且与PEG基团连接；(ix)CTC-643或CTC-646的氨基酸序列，其中第63位的半胱氨酸残基存在并且与PEG基团连接；(x)CTC-647的氨基酸序列，其中第74位的半胱氨酸残基存在并且与PEG基团连接；(xi)CTC-693的氨基酸序列，其中第11位的半胱氨酸残基存在并且与PEG基团连接；CTC-694的氨基酸序列，其中第63位的半胱氨酸残基存在并且与PEG基团连接；或CTC-695的氨基酸序列，其中第74位的半胱氨酸残基存在并且与PEG基团连接。例如，可以通过本领域已知的任何方法进行连接，包括马来酰亚胺基团。

包含本发明的从头蛋白和异源多肽的嵌合多肽能够包含那些包含靶向域的嵌合多肽。所述靶向域能够指导所述从头蛋白的细胞定位。

当靶向域是多肽时，所述靶向域能够是与一个或多个所关注靶点结合的任何适合的多肽，并且能够与本发明的多肽连接或结合。在非限制性实施方案中，所述靶向域可以包括但不限于scFv、F(ab)、F(ab')₂、B细胞受体(BCR)、DARPin、亲和体、单体、纳米抗体、双抗体、抗体(包括单特异性或双特异性抗体)；一种细胞靶向寡肽，包括但不限于RGD整合素结合肽、从头设计的结合剂、适体、bicycle肽、芋螺毒素、小分子(如叶酸)和与细胞表面结合的病毒。所述靶向域可以与所述蛋白质共价或非共价结合。

在另一个实施方案中，当存在时，所述靶向域是与所述蛋白质的翻译融合物。在该实施方案中，所述蛋白质和所述靶向域可以在所述翻译融合物中直接彼此邻接，或者可以通过适合于预期目的的多肽接头连接。示例性此类接头包括但不限于WO2016178905、WO2018153865和WO2018170179中公开的那些。制备融合蛋白和缀合物的方法是本领域已知的并且在本文中没有详细讨论。

治疗方法

本发明的从头ACE2蛋白诱饵用于治疗和/或预防与冠状病毒相关的疾病或障碍或病症和/或用于改善与该疾病、障碍或病症相关的至少一种症状，所述冠状病毒使用ACE2作为其受体，例如，SARS-CoV或SARS-CoV-2。在一个实施方案中，本发明的蛋白质可以治疗剂量施用于患有SARS-CoV或SARS-CoV-2感染的患者。

在某些实施方案中，本发明的蛋白质可用于治疗患有由SARS-CoV或SARS-CoV-2导致的严重和急性呼吸道感染的受试者。在一些实施方案中，本发明的蛋白质用于降低病毒滴度或降低宿主中的病毒载量。在一个实施方案中，本发明的蛋白质用于预防或减少患有SARS-CoV或SARS-CoV-2或另一种使用ACE2作为其进入宿主细胞的冠状病毒的受试者的肺部炎症。在一个实施方案中，本发明的蛋白质用于预防或减少患有SARS-CoV或SARS-CoV-2或另一种使用ACE2作为其进入宿主细胞的冠状病毒的受试者的间质、细支气管周围或血管周围炎症、肺泡损伤和胸膜变化。

可以施用本发明的一种或多种蛋白质以减轻或预防或降低疾病或障碍的一种或多种症状或病症的严重性。所述蛋白质可用于改善或减轻SARS-CoV或SARS-CoV-2或另一种使用ACE2作为其进入宿主细胞的冠状病毒感染的至少一种症状的严重性，包括但不限于发烧、咳嗽、呼吸急促、肺炎、腹泻、器官衰竭(例如，肾衰竭、心力衰竭和肾功能障碍)、感染性休克和死亡。

本文还考虑将本发明的蛋白质预防性地用于有发生冠状病毒感染风险的受试者。在一些方面，所述受试者是免疫功能低下的个体、老年人(65岁以上)、医护人员、与骆驼或蝙蝠有职业或娱乐接触的人、与冠状病毒患者密切接触的家庭成员、与确诊或疑似冠状病毒感染者接触的成人或儿童和患有基础疾病(例如，肺部感染、心脏病或糖尿病风险增加)的患者。

在本发明的另一个实施方案中，本发明的从头蛋白用于制备用于治疗患有冠状病毒感染的患者的药物组合物或药物。在本发明的另一个实施方案中，本发明的蛋白质与任何其他剂或本领域技术人员已知的可用于治疗或改善冠状病毒感染的任何其他疗法一起用作辅助疗法。

所述从头蛋白可以与其他疗法如可以有利地与本发明的蛋白质组合的任何额外治疗剂组合。在一些实施方案中，本发明的蛋白质可以与第二治疗剂组合以降低冠状病毒感染患者的病毒载量，或改善所述感染的一种或多种症状。

所述从头ACE2蛋白诱饵可以是任何形式，以允许将它们施用于患者。例如，它们可以是固体或液体的形式。能够通过任何方便的途径施用所述从头蛋白，例如通过输注或团注，通过上皮或粘膜皮肤内层(例如，口腔粘膜、直肠和肠粘膜等)吸收。施用能够是全身的或局部的。典型的施用途径包括但不限于口服、局部、肠胃外、舌下、直肠、阴道、眼部、肿瘤内和鼻内。肠胃外施用包括皮下注射、静脉内、肌肉内、胸骨内注射或输注技术。在一些方面，所述从头蛋白是肠外施用的。在又一方面，所述从头蛋白是静脉或皮下施用的。在一些方面，需要局部施用，因为它可以避免可能与全身暴露相关的毒性。在一些方面，所述从头蛋白是局部施用的。在一些方面，将从头蛋白向呼吸道局部施用，例如，通过吸入。吸入能够是，例如，通过气溶胶吸入器或可吸入粉末。

本发明的蛋白质可以与抗炎药(例如，皮质类固醇和非甾体抗炎药)、抗感染药或抗病毒药组合使用。在一些方面，本发明的蛋白质可以与药物组合使用以治疗细胞因子释放综合征(例如，细胞因子风暴)。

本文还考虑将本发明的核酸用于受试者用于治疗和/或预防与冠状病毒相关的疾病或障碍或病症和/或用于改善与该疾病、障碍或病症相关的至少一种症状，所述冠状病毒使用ACE2作为其受体，例如，SARS-CoV或SARS-CoV-2。在一个实施方案中，本发明的核酸可以治疗剂量施用于患有SARS-CoV或SARS-CoV-2感染的患者

药物组合物

可以配制药物组合物以使所述从头ACE2蛋白诱饵在向患者施用组合物时具有生物可利用性。所述从头蛋白能够采用溶液、悬浮液、乳剂、微粒、片剂、丸剂、小丸、胶囊、含有液体的胶囊、散剂、缓释制剂、栓剂、乳剂、气溶胶、喷雾剂、悬浮液或适用于使用的任何其它形式的形式。适合的药物载体的其他实例描述于E.W.Martin的“Remington'sPharmaceutical Sciences”。对本领域普通技术人员来说显而易见的是，药物组合物中一种或多种活性成分的最佳剂量将取决于多种因素。相关因素包括但不限于动物(例如人)的类型、ACE2蛋白诱饵的特定形式、施用方式和所用的组合物。

所述药学上可接受的载体或媒介物可以是颗粒状的，使得所述组合物是例如片剂或粉末形式。所述一种或多种载体可以是液体，组合物例如是口服糖浆或可注射液体。此外，所述一种或多种载体可以是气态的或颗粒状的，以提供可用于例如吸入施用的气溶胶组合物。

当意欲用于口服施用时，从头蛋白优选为固体或液体形式，其中半固体、半液体、悬浮液和凝胶形式包括在本文认为的固体或液体形式内。作为用于口服施用的固体组合物，所述组合物可以配制成散剂、颗粒剂、压制片剂、丸剂、胶囊剂、口香糖、威化饼等形式。这种固体组合物通常包含一种或多种惰性稀释剂。此外，可以存在以下一种或多种：粘合剂，如羧甲基纤维素、乙基纤维素、微晶纤维素或明胶；赋形剂如淀粉、乳糖或糊精，崩解剂如海藻酸、海藻酸钠、Primogel、玉米淀粉等；润滑剂如硬脂酸镁或Sterotex等；助流剂如胶体二氧化硅；甜味剂如蔗糖或糖精，调味剂如薄荷、水杨酸甲酯或橙调味剂，以及着色剂。

当组合物为胶囊形式时，例如明胶胶囊，除了上述类型的材料之外，它还可以包含液体载体，如聚乙二醇、环糊精或脂肪油。所述组合物可以是液体形式，例如，酏剂、糖浆、溶液、乳剂或悬浮液。所述液体可用于口服施用或通过注射递送。当用于口服施用时，组合物能够包含甜味剂、防腐剂、染料/着色剂和增味剂中的一种或多种。在用于注射施用的组合物中，还能够包含表面活性剂、防腐剂、润湿剂、分散剂、助悬剂、缓冲剂、稳定剂和等渗剂中的一种或多种。还考虑了延迟释放胶囊，包括具有肠溶衣的那些。

所述液体组合物，无论它们是溶液、悬浮液还是其他类似形式，还能够包括以下一种或多种：无菌稀释剂，例如注射用水、盐水溶液，优选生理盐水、林格氏溶液(Ringer'ssolution)、等渗氯化钠、不挥发油如作为能够用作溶剂或悬浮介质的合成甘油单酯或甘油二酯、聚乙二醇、甘油、环糊精、丙二醇或其他溶剂；抗菌剂如苯甲醇或对羟基苯甲酸甲酯；抗氧化剂如抗坏血酸或硫酸氢钠；螯合剂如乙二胺四乙酸；缓冲剂如醋酸盐、柠檬酸盐或磷酸盐，和用于调节张力的剂如氯化钠或葡萄糖。肠胃外组合物可以封装在安瓿、一次性注射器或由玻璃、塑料或其他材料制成的多剂量小瓶中。生理盐水是一种示例性佐剂。可注射组合物优选是无菌的。

在另一方面，本公开提供药物组合物，所述药物组合物包含本公开的一种或多种蛋白质和药学上可接受的载体。术语“载体”是指稀释剂、佐剂或赋形剂，与本发明的从头蛋白一起施用。除了本公开的多肽之外，例如，所述药物组合物可包含(a)冻干保护剂；(b)表面活性剂；(c)填充剂；(d)张力调节剂；(e)稳定剂；(f)防腐剂和/或(g)缓冲剂。

在一些实施方案中，所述药物组合物中的缓冲剂是Tris缓冲液、组氨酸缓冲液、磷酸盐缓冲液、柠檬酸盐缓冲液或乙酸盐缓冲液。所述药物组合物还可包含冻干保护剂，例如蔗糖、山梨糖醇或海藻糖。在某些实施方案中，所述药物组合物包含防腐剂，例如苯扎氯铵、苄索铵、氯己定、苯酚、间甲酚、苯甲醇、对羟基苯甲酸甲酯、对羟基苯甲酸丙酯、氯丁醇、邻甲酚、对甲酚、氯甲酚、硝酸苯汞、硫柳汞、苯甲酸及其各种混合物。在其他实施方案中，所述药物组合物包含填充剂，如甘氨酸。在又其他实施方案中，所述药物组合物包含表面活性剂，例如，聚山梨醇酯-20、聚山梨醇酯-40、聚山梨醇酯-60、聚山梨醇酯-65、聚山梨醇酯-80、聚山梨醇酯-85、泊洛沙姆-188、失水山梨醇单月桂酸酯、失水山梨醇单棕榈酸酯、失水山梨醇单硬脂酸酯、失水山梨醇单油酸酯、失水山梨醇三月桂酸酯、失水山梨醇三硬脂酸酯、失水山梨醇三油酸酯或其组合。所述药物组合物还可包含张力调节剂，例如，使制剂与人血基本上等渗或等渗的化合物。示例性张力调节剂包括蔗糖、山梨醇、甘氨酸、甲硫氨酸、甘露醇、葡萄糖、肌醇、氯化钠、精氨酸和精氨酸盐酸盐。在其他实施方案中，所述药物组合物额外包含稳定剂，例如，当与所关注蛋白质组合时基本上预防或降低冻干或液体形式的所关注蛋白质的化学和/或物理不稳定性的分子。示例性稳定剂包括蔗糖、山梨醇、甘氨酸、肌醇、氯化钠、蛋氨酸、精氨酸和精氨酸盐酸盐。

蛋白质可以是所述药物组合物中唯一的活性剂，或者所述组合物还可包含一种或多种适用于预期用途的其他活性剂。

为了治疗疾病，提供治疗有效量的所述蛋白质。这是指有效治疗疾病或具有所需效果的蛋白质的量。从细胞培养测定和动物研究中获得的数据能够用于配制用于人的剂量范围。临床医生可以调整剂量方案以提供最佳的所需响应(例如，治疗或预防响应)。所述组合物能有每天一次或多次至每周一次或多次施用一次；包括每隔一天一次。本领域技术人员将理解某些因素可能影响有效治疗受试者所需的剂量和时间，包括但不限于疾病或障碍的严重性、先前的治疗、受试者的一般健康和/或年龄，以及其他存在的疾病。此外，用治疗有效量的多肽对受试者的治疗可以包括单一治疗，或者可以包括一系列治疗。

从头ACE2蛋白诱饵的示例性剂量范围可以是例如0.1μg/kg-100mg/kg体重；或者，它可以是0.5μg/kg至50mg/kg；1μg/kg至25mg/kg，或5μg/kg至10mg/kg体重。在一些实施方案中，推荐剂量可以低于0.1mcg/kg，特别是如果局部施用。在其他实施方案中，推荐剂量可以基于重量/m²(即体表面积)，以及/或者可以以固定剂量(例如，.05mg-100mg)施用。在一些方面，所述固定剂量将是1mg、3mg、10mg或20mg剂量。多肽可以单次推注递送，或者可以由主治医师确定多于一次(例如，2次、3次、4次、5次或多次)施用。

在一些实施方案中，所述施用将通过鼻内喷雾，并且给药将是固定剂量。在一些方面，所述固定剂量将是0.5mg、1mg、2mg、3mg、10mg或20mg剂量。在一些实施方案中，给药将是每天一次或每天两次，持续连续天数。

提供以下实施例以描述本文提供的本发明的某些实施方案并且不应被解释为限制性的。

ACE2蛋白–SEQ ID NO:1

ACE2 H1基序-ST IEEQAKTFLD KFNHEAEDLF YQSSL

ACE2 H2基序-NMNNAGDKWS AFLKEQSTLA QMY

ACE2β发夹基序-DLGK

1-17＝信号肽；18-805＝ACE2；18-708＝处理过的ACE2

SARS-CoV冠状病毒刺突蛋白–SEQ ID NO:2

信号肽AA 1-13

刺突S1-14-667

刺突S2-668-1255(S2引物为798-1255)

SARS-CoV-2-冠状病毒刺突蛋白-GenBank：QHD43416.1–SEQ ID NO:3

实施例

实施例1–从头ACE2蛋白诱饵CTC-445及其变体的设计。

CTC-445的计算设计ACE2模拟物的计算设计分四个阶段进行：从ACE2中选择结构基序以进行模拟，设计多肽骨架以支持这些结构基序，设计序列以支持生成的骨架，以及过滤设计以减少要进行实验测试的设计集。

选择ACE2结构基序来模拟获得结构基序，并使用以下一种或多种结构进行计算设计和分析：1)与嵌合SARS-CoV+SARS-CoV-2RBD结合的ACE2的晶体结构(PDB ID：6vw1)；2)与SARS-CoV-2RBD结合的ACE2的cryo-EM结构(PDB ID:6m17)；或3)与SARS-CoV RBD结合的ACE2的cryo-EM结构(PDB ID:6cs2)。从结构中识别并提取了两个来自ACE2的RBD结合螺旋；一个(“H1”)跨越残基19-53；并且另一个(“H2”)跨越残基55-84。在一些设计中，跨越残基346-360的β发夹基序也包括在要模拟的基序集中。这些结构基序被用作骨架设计的起点。从这些基序中，选择了待在最终序列设计中保留的一组残基：19、23、24、27、28、30、31、34、35、37、38、41、42、45、61、64、68、72、75、76、79、82、83、352、353、354、355和357。由于这些结构基序本身并没有得到ACE2的其他二级结构元件的良好支持，因此从头二级结构被放置在结合基序上。这些新的二级结构为设计的蛋白质提供了疏水核并且用于以能够结合的方式稳定结合基序的相对位置和取向。支撑结构通过可用方法(如Rosetta组合碎片组装、参数生成等)计算生成和放置，或从现有结构中提取和复制。当支持二级结构参数化生成或从现有结构中提取时，螺旋的初始位置和取向通过目视检查(使用pymol)确定，并通过蒙特卡罗搜索(montecarlo search)细化以识别最佳位置。

理想片段数据库构建用于从头模拟物骨架设计的高度理想片段数据库是通过Rosetta应用程序“kcenters_clustering_of_fragments”使用来自RCSB蛋白质数据的非冗余(公开可用)蛋白质结构的广泛数据库构建的，其由7-聚体数据库的7062个PDB组成。

支持ACE2 RBD结合基序的骨架的计算设计

由此产生的不连贯的结构基序被用作先前描述的基于PyRosetta的模拟方案的输入(Silva等人.,De novo design of potent and selective mimics of IL-2 and IL- 15,Nature 2019,565:186)。首先，通过识别重复phi和psi角(omega固定为180°)的参数方程来重建核心元件(即起始基序和支持二级结构)，这导致二级结构概括每个靶螺旋尽可能接近，每3个残基允许phi和psi角上的“间距”，以允许螺旋具有曲率的可能性。通过使用这些参数方程，算法可以改变每个核心元件的长度，最多可达+/-12个氨基酸(与输入的结构基序相比)。然后将核心元件的所有长度变化与来自高度理想环的集群数据库的环成对重新连接(7个氨基酸的片段大小；参见上述“理想片段数据库构建”)。为了连接成对的二级结构元件，模拟构建协议旨在以所有可能的组合成对地重新连接理想元件。对于每一对二级结构元件，环数据库被过滤以识别可以连接这对二级结构元件的环。环的末端与核心元件的末端重叠，并且要求与核心元件末端的距离<1.2A RMSD，每个单独的环末端需要与相应的单独核心元件末端的距离<1.5A RMSD。现在通过一个环连接，核心元件通过笛卡尔(cartesian)约束骨架最小化而最小化。在最小化之后，验证所述溶液包含非常理想的片段(即，构成两个连接元件的每个重叠片段也包含在数据库中)并且没有骨架与靶(上下文)结合配偶体发生冲突。然后使用相同的片段数据库对成功的成对连接的核心元件进行分析，以确定每个位置处最可能的氨基酸(该信息被编码为每个设计上的元数据)。接下来，将连接的二级结构对的溶液以组合方式组合起来(通过使用图论连接组分)以产生完全连接的骨架。由于溶液的数量随着每对元件呈指数增长，因此在每个片段组合步骤中，我们对设计进行排序以支持那些在二级结构核心元件对之间具有较短互连(即有效地具有较短的环)的设计，并且仅保留顶部溶液。完全连接的骨架溶液按层(界面、核心、非核心表面、表面)进行谱分析，以限制可能的氨基酸的同一性，使其与层兼容。最后，将所有关于热点、兼容的内置片段氨基酸和层的信息结合起来。

计算序列设计将充分谱分析的蛋白质骨架传递给RosettaScripts，以进行灵活的骨架设计和过滤。用于序列设计的Rosetta能量函数是“β”。使用骨架设计期间确定的层谱进行序列设计，在每个环位置仅允许最常见的60％累积氨基酸分数。对于每个骨架，至少设计了9条序列。选择了一个ACE2蛋白诱饵CTC-445向前推进。

酵母展示筛选 EB100酵母用编码要展示的蛋白质的基因与线性化的pETcon3载体一起转化。通过NdeI和XhoI(New England Biolabs)过度消化100倍将载体线性化，然后通过凝胶提取(Qiagen)进行纯化。这些基因在5'和3'末端两处都包含与载体重叠的60个碱基，因此同源重组会将基因置于AGA2基因和载体上Myc标签之间的框架中。如前所述，酵母在SDCAA培养基中培养过夜至饱和，然后在SGCAA培养基中诱导(Boder和Wittrup,“YeastSurface Display for Screening Combinatorial Polypeptide Libraries.”NatureBiotechnology 1997 15(6):553-557.)。诱导12h-16h后，将细胞在冷冻展示缓冲液(50mMNaPO4 pH 7.4,150mM NaCl,1％BSA)中洗涤，并用200nM的2019-nCoV Spike/RBD蛋白-Fc标签受体(Sino Biological；残基Arg319-Phe541)孵育，同时在4℃搅动。大约30分钟后，将细胞在冷冻缓冲液中再次洗涤，然后在冰上用FITC缀合的抗Myc抗体(每3x10⁶细胞1μl)和PE抗人IgG Fc(每3x10⁶细胞5μl)孵育5分钟。然后洗涤酵母并通过流式细胞术(guavaeasyCyte^TM HT System)计数或通过荧光激活细胞分选(FACS)(Sony SH800)分选。

变体设计对于CTC-613-636，基于对设计模型的目测检查和与人ACE2的结构对齐，选择了一组CTC-445突变和突变组合。对于CTC-637到CTC-653，基于CTC-445在200pM与SARS-CoV-2结合的蛋白酶稳定序列通过酵母展示的易错PCR DNA文库进行鉴定。从选择的序列库中，鉴定出一组突变，并且将这些突变合理地组合成一组CTC-445变体。

重组蛋白表达合成蛋白序列(IDT)并克隆到pET-29b(+)大肠杆菌质粒表达载体(有和没有C末端6-His标签)。为了帮助进行蛋白质定量，每个构建体的表达序列都包含C末端GSGWGSG序列。将含有两个ACE2蛋白诱饵克隆、一个不表达阴性对照和一个阳性对照蛋白的基因的质粒转化到化学感受态大肠杆菌Lemo21细胞(NEB)中。然后在37℃下用1mM异丙基β-d-硫代吡喃半乳糖苷(IPTG)诱导蛋白质表达。表达4h后，收集样品并在SDS-PAGE凝胶上与PageRuler Plus Prestained Protein Ladder一起运行。CTC-445以预期的分子量运行。(数据未显示)

变体的氨基酸序列与CTC-445的相同，除了注明的一种或多种取代。选择具有半胱氨酸残基的变体被PEG化。简而言之，在咪唑缓冲液中纯化蛋白质，并将缓冲液与Centripep(10K MWCO)交换到pH 7.4的PBS中。以10x摩尔过量将TCEP添加到1mg样品中。在37摄氏度孵育30分钟。将马来酰亚胺-PEG(20K接头和40K支链)溶解在PBS中并以10x倍过量添加到样品中并孵育12小时。去除未反应的马来酰亚胺并通过SEC纯化。

表4

●这些蛋白质中的大多数在蛋白质的N末端(和每个诱饵单元)包含一个PG基序，并且它们可能包含也可能不包含HIS标签和/或允许通过280nm下的吸光度检测蛋白质的标记(例如，GSGWGSG，SEQ ID NO:248)

实施例2-CTC-445与SARS-CoV-2刺突蛋白的结合和竞争测定：酵母展示

如实施例1所述转化和诱导EB100酵母。诱导12h-16h后，将表达人ACE2(“数据1”)或Neoleukin CTC-445(“数据2”)的细胞在冷冻展示缓冲液(50mM NaPO4 pH 7.4，150mMNaCl，1％BSA)中洗涤，并用0-80nM 2019nCoV刺突/RBD蛋白-mFc标签受体(SinoBiological；残基Arg319-Phe541)孵育，同时在4℃下搅动。大约30分钟后，细胞在冷冻缓冲液中再次洗涤，然后在冰上用FITC缀合的抗Myc抗体(每3x10⁶细胞1μl)和PE抗小鼠IgG Fc(每3x10⁶细胞5μl)孵育5分钟。然后洗涤酵母并通过流式细胞术(guava easyCyte^TM HTSystem)计数。接下来，将表达人ACE2的细胞和测试ACE2蛋白诱饵(“数据5”)用9nM 2019-nCoV刺突/RBD蛋白-Fc标签受体和0-750nM可溶性人ACE2孵育。图2A至图2F显示阳性、阴性对照和CTC-445通过酵母展示与SARS-CoV-2刺突蛋白结合，并且图3A至图3D显示对照人ACE2和从头蛋白CTC-445能够结合至2019-nCoV刺突/RBD蛋白并与可溶性ACE2竞争结合。

实施例3-从头ACE2蛋白诱饵的表征

CTC-445个变体通过生物层干涉法(0-5)表征了表达水平(0-5)、溶解度(0-5)和结合亲和力。聚集倾向指示在尺寸排阻色谱期间是否存在大分子量聚集体或低聚物，并且通过经由分析尺寸排阻色谱比较单体和低聚物物质的峰面积来测量非单体蛋白的分数。

具有多角度光散射的尺寸排阻色谱法(SEC-MALS)。SEC-MALS测定使用与在线静态光散射仪(MiniDawn，Wyatt Technology)和差分折射率(Optilab rEX，Wyatt Technology)和紫外检测系统耦合的具有Superdex 75 10/300尺寸排阻柱(GE Healthcare)的1260infinity II LC HPLC系统(Agilent Technologies)进行。蛋白质样品在PBS缓冲液中制备，浓度范围为2mg/mL至4mg/mL，并用0.22μm注射器过滤器过滤；注入100μL样品并以0.5mL/min的流速运行。使用软件ASTRA 7(Wyatt Technologies)分析数据。SEC-MALS证明CTC-445变体CTC-632、633、634、642、643和644大多是聚集的或寡聚的，而CTC-635、636、637、639、640、641,643、644、646、648、649、650、651、652和653大多是单体(数据未显示)。数据如下表所示。

生物层干涉仪。纯化的ACE2蛋白诱饵的Octet结合测定。在Octet RED96(ForteBio)中收集结合数据，并使用仪器的集成软件使用1:1结合模型进行处理。在结合缓冲液(10mM HEPES，pH 7.4，150mM NaCl，3mM EDTA，0.05％表面活性剂P20，0.5％脱脂奶粉)中，将SARS-CoV-2刺突蛋白(仅RBD域，mFc标签，Sino Biological)固定在2μg ml^-1的蛋白A传感器(ProtA，ForteBio)上。仅在结合缓冲液中进行基线测量后，通过将生物传感器浸入含有确定浓度的设计蛋白质(2.4nM-200nM)的孔中(缔合)然后将传感器浸回基线孔中(解离)来监测结合动力学。在下表5中，值一(1)表示与CTC-445类似的结合；大于1的值表示比CTC-445更紧密的结合；小于1的值表示比CTC-445更弱的结合；4或更大的值表示非常紧密的结合。N.D.的符号表示在结合筛选上进行测试，但所述测定未按预期工作并导致不确定的结果。据信所述蛋白质可能已经聚集。图4、图5A至图5H、图6A至图6H和图7A至图7H显示CTC-445和选定CTC-445变体与SARS-CoV-2刺突蛋白的结合(通过Octet)。

表5

实施例4–从头蛋白诱饵CTC-445、CTC-445.2和CTC-445.2d的结合动力学和稳定性

使用圆二色性测量CTC-445和选定变体的热稳定性。远紫外圆二色性测量使用CHIRASCAN光谱仪V100(应用光物理学)在0.1mm光程比色皿中的PBS缓冲液(pH 7.4)中进行，蛋白质浓度为0.2mg ml^-1(除非文中另有说明)。从20℃到95℃获得温度熔体，并在222nm处监测吸收信号(每min 0.5℃的步骤，逐步平衡30s)。在20℃、95℃和再次在20℃下重新折叠后(大约5min)收集波长扫描(195nm–250nm)。通过将热熔体拟合到以下等式计算熔融温度(T_m)值：

其中f_D是蛋白质处于未折叠状态的分数，ΔH_vH是与展开过程相关的焓变，yN和mN代表天然状态的信号及其与温度的依赖性，yD和mD代表展开状态的信号并与温度有关，并且R是气体常数。在20℃至95℃的温度范围内，CTC-445、CTC-445.2或CTC-445.2d的热诱导熔融与C末端凝血酶位点和6x His标签融合，随后是208nm下的其圆二色性信号(加热速率2℃/min)。图8显示CTC-445(8A)、CTC-445.2(8B)和CTC-445.2d(8C)的结果。插图显示CTC-445.2在20℃下、加热至95℃-99℃(虚线)之后和冷却加热样品至20℃后的远紫外光谱。观察到冷却后椭圆度光谱完全恢复(完全可逆性)。

连续热升温蛋白质稳定性。为了测试CTC-445、CTC-445.2、CTC-445.2d和hACE2(Sino Biological)的展开可逆性(热恢复)，进行了系列热升温测定；为此，使用了UNCLE平台(Unchained Labs)。将8.8μL的0.5mg/mL CTC-445、CTC-445.2和CTC-445.2d加载到毛细管比色皿中，并在反复升高和降低温度的同时测量每个样品的荧光光谱(～300nm-400nm)。温度梯度按以下顺序执行：20℃至35℃、20℃至50℃、20℃至65℃、20℃至80℃、20℃至95℃、20℃至80℃、20℃至65℃、20℃至50℃和20℃至35℃。所有样品均在PBS缓冲液pH 7.4中。使用UNCLE分析程序(Unchained Labs)计算每个荧光光谱的重心平均值(BCM)。在三种蛋白质的重复加热和冷却循环之前和之后观察到相同的BCM值(图9A至图9C)。

图10显示了CTC-445、CTC-445.2(左)和CTC-445.2d(右)对固定化SARS-CoV-2SRBD的Octet结合测定。生物素化和His标记的SARS-CoV-2S RBD被固定在Anti-Penta-HIS(HIS1K，ForteBio)上，并用不同浓度的ACE2诱饵孵育。通过将生物传感器浸入含有限定浓度(4.7nM-300nM)的CTC-445、CTC-445.2、CTC-445.2d(缔合)的孔中，然后将传感器浸入基线孔中(解离)，监测结合动力学。对于CTC-445和CTC-445.2，结果使用1:1结合模型进行全局拟合(K_d＝646nM和25nM，k_on＝8.6x10⁴和4.5x10⁵M^-1s^-1，k_off＝5.5x10^-2和1.1x10^-2s^-1)。对于CTC-445.2d，使用2:1结合模型(K_d≤7.0nM，k_on＝3.0x10⁵M^-1s^-1，k_off＝≤2.0x10^-3s^-1)。插图显示了每个浓度下归一化响应的稳态结合。

实施例5-CTC-445抑制SARS-CoV-2刺突蛋白RBD与人ACE2的结合

SARS-CoV2 S蛋白RBD以0.5μg/mL(100μL/孔)包被在平坦、透明底部、高结合聚苯乙烯96孔板(Thermo，目录号15041)中，在4℃下过夜。第二天，用0.05％Tween-PBS洗涤测定板3X，并在37℃下用2％BSA/0.05％Tween-PBS封闭1-1.5小时。在封闭孵育期间，每个测试品的三倍7点连续稀释液从CTC-445的20μM(最终2X)和阳性对照抑制剂(Acro)的360nM(最终2X)开始制备。对于所有测试品，为最后浓度制备十倍稀释而不是三倍。此外，生物素-hACE2的剂量响应是通过从0.3μg/mL(3.44nM)开始对生物素-hACE2进行两倍连续稀释来制备的。从0.3μg/mL生物素-hACE2中制备出0.06μg/mL(最终2X)的恒定浓度，用于测试品的抑制作用。封闭后，洗涤测定板(3X)，并将每个测试品稀释液以50μL/孔添加到板中，然后添加50μL/孔的生物素-hACE2(最终0.03μg/mL)。在37℃下用生物素-hACE2孵育测试品1小时。之后，洗涤板(3X)，随后在37℃下将0.1μg/mL(100μL/孔)链霉亲和素-HRP孵育1小时。在添加100μL//孔TMB(abCam，目录号171524)之前，最后一次洗涤板(3X)。将TMB孵育7分钟，并通过加入50μL/孔1M HCl终止反应。在450nm处从4个点测量每个孔中的平均吸光度。IC₅₀结果在下表6中示出：

表6

测试品	IC<sub>50</sub>(nM)
		CTC-445(低聚物)	543
CTC-445(原料20μM)	1724
		CTC-445(原料40μM)	863
SARS-CoV-2抑制剂	5.9

实施例6-选择CTC-445变体抑制SARS-CoV-2刺突蛋白RBD结合至人ACE2

SARS-CoV2 S蛋白RBD以0.5ug/mL(100ul/孔)包被在平坦、透明底部、高结合聚苯乙烯96孔板(Thermo，目录号15041)中，在4℃下过夜。第二天，用0.05％Tween-PBS洗涤测定板3X，并在37℃下用2％BSA/0.05％Tween-PBS封闭1-1.5小时。制备每种测试品的三倍6点系列稀释液，对于下表7所示的CTC-445变体，从4uM(最终2X)开始，并且对于阳性对照抑制剂(Acro)，从360nM(最终2X)开始。对于所有测试品，为最后两个浓度制备十倍稀释而不是三倍。此外，生物素-hACE2的剂量响应是通过从0.1μg/mL(1.15nM)开始对生物素-hACE2进行三倍连续稀释来制备的。从0.1μg/mL生物素-hACE2中制备出0.066μg/mL(最终2X)的恒定浓度，用于测试品的抑制作用。封闭后，洗涤测定板(3X)，并将每个测试品稀释液以30ul/孔(在两个孔中)添加到板中，然后添加30ul/孔的生物素-hACE2(最终0.033μg/mL)。在37℃下用生物素-hACE2孵育测试品1小时。之后，洗涤板(3X)，随后在37℃下将0.1μg/mL(100ul/孔)链霉亲和素-HRP孵育1小时。在加入100ul/孔TMB(abCam，目录号171524)之前，最后一次洗涤板(3X)。将TMB孵育7分钟，并用加入50ul/孔1M HCl或等效物终止反应。在450nm处从4个点测量每个孔的平均吸光度。IC₅₀结果在下表7中示出：

表7

测试品	IC<sub>50</sub>(nM)
		CTC640(原料75uM)	21.66
CTC641(原料88uM)	79.17
		CTC644(原料39uM)	20.29
CTC648(原料62uM)	13.61
		CTC650(原料27uM)	11.59
CTC651(原料46uM)	208.26
		CTC652(原料78uM)	83.65
CTC653(原料78uM)	46.37
		CTC651，PEG 20k(原料8.8uM)	515.61
CTC651，PEG 40k(原料4.8uM)	1000.52
		CTC644，PEG 20k(原料20uM)	159.83
SARS-CoV-2抑制剂(Acro，原料1.8uM)	3.13

实施例7-选定PEG化和非PEG化CTC-445变体抑制SARS-CoV-2刺突蛋白RBD结合至人ACE2

SARS-CoV2 S蛋白RBD以0.5μg/mL(100ul/孔)包被在平坦、透明底部、高结合聚苯乙烯96孔板(Thermo，目录号15041)中，在4℃下过夜。第二天，用0.05％Tween-PBS洗涤测定板3X，并在37℃下用2％BSA/0.05％Tween-PBS封闭1-1.5小时。制备每种测试品的四倍6点系列稀释液，对于表8中所示的选定CTC变体，从4uM(最终2X)开始，并且对于阳性对照抑制剂(Acro)，从360nM(最终2X)开始。对于所有测试品，为最后两个浓度制备十倍稀释而不是三倍。此外，生物素-hACE2的剂量响应是通过从0.1μg/mL(1.15nM)开始对生物素-hACE2进行三倍连续稀释来制备的。从0.1μg/mL生物素-hACE2中制备出0.066μg/mL(最终2X)的恒定浓度，用于测试品的抑制作用。封闭后，洗涤测定板(3X)，并将每个测试品稀释液以30ul/孔(在两个孔中)添加到板中，然后添加30ul/孔生物素-hACE2(最终0.033μg/mL)。在37℃下用生物素-hACE2孵育测试品进行1小时。之后，洗涤板(3X)，随后在37℃下将0.1μg/mL(100ul/孔)链霉亲和素-HRP孵育1小时。在加入100ul/孔TMB(abCam，目录号171524)之前，最后一次洗涤板(3X)。将TMB孵育7分钟，并用加入50ul/孔1M HCl或等效物终止反应。在450nm处从4个点测量每个孔的平均吸光度。(注意：CTC654和CTC655的起始浓度在进行实验后校正；起始浓度>6uM而不是2uM)。IC₅₀结果在下表8中示出：

表8

测试品	PEG(k)	原料浓度(uM)	IC<sub>50</sub>(nM)
				CTC-654	-	66.6	约0.7
CTC-655	-	58.3	0.8
				SARS-CoV-2抑制剂	-	1.8	3.6
CTC-650	40	43	7.0
				CTC-639	-	51	8.0
CTC-640	-	75	10.4
				CTC-649	20	78	16.5
CTC-650	20	44	17.0
				CTC-649	-	80	17.1
CTC-649	40	55	22.9
				hACE2	-	3	34.0
CTC-648	20	78	56.6
				CTC-644	20	33	79.1
CTC-644	40	33	85.0
				CTC-652	20	78	86.6
CTC-653	20	60	122.5
				CTC-651	20	39	129.3
CTC-648	40	45	138.1
				CTC-651	40	18	165.4
CTC-653	40	27	198.4
				CTC-652	40	45	220.1
阴性对照Neo-2/15	-	30	ND

实施例8-选定CTC-445变体抑制SARS-CoV-2刺突蛋白RBD(和SARS-CoV-1刺突蛋白RBD)结合至人ACE2

SARS-CoV2 S蛋白受体结合域(RBD)(Acro Biosystems，目录号EP-105)或SARS-CoV-1S蛋白RBD(Acro Biosystems，目录号SPD-S52H6)以0.5μg/mL(100ul/孔)包被在平坦、透明底部、高结合聚苯乙烯96孔板(ThermoFisher，目录号15041)中在4℃下过夜。第二天，用0.05％Tween-PBS洗涤每个测定板3X，并在37℃下用2％BSA/0.05％Tween-PBS封闭1-1.5小时。第二天，每个测试品的12点连续稀释液制备成浓度比最终浓度高2倍。对于测试品，从4μM开始进行3倍连续稀释。对于人ACE2(SinoBiological，目录号10108-H08B)，从0.8μM开始进行3倍连续稀释。此外，生物素-hACE2的剂量响应是通过从0.174μg/mL(2nM)开始进行两倍连续稀释来制备的。从0.174μg/mL生物素-hACE2中制备出0.07μg/mL(0.8nM，最终2X)的恒定浓度，用于测试品的抑制作用。封闭后，洗涤每个测定板(3X)，并将每个测试品稀释液以50μL/孔(每个浓度单次重复孔)添加到板中，然后添加50μL/孔的生物素-hACE2(最终0.035μg/mL)。测试品与0.4nM生物素-hACE2的孵育在37℃下进行1小时。之后，洗涤每个测定板(3X)，随后在37℃下将0.1μg/mL(100μL/孔)链霉亲和素-HRP孵育1小时。最后，在加入100μL/孔TMB(abCam，目录号171524)之前，对每个板进行洗涤(3X)。将TMB孵育7-8分钟，并用加入50μL/孔TMB终止液(abCam，目录号ab171529)终止反应。在450nm处从4个点测量每个孔的平均吸光度。

如表9所示，所有测试的构建体均抑制SARS-CoV-2刺突蛋白结合至人ACE2。CTC654还抑制SARS-CoV-1刺突蛋白结合至人ACE2。

表9：测试品对刺突蛋白与ACE2结合的抑制作用

ND＝在该测定中不可检测

实施例9-CTC-445变体抑制SARS-CoV-2刺突蛋白RBD结合至人ACE2

基本上如上所述，测定了额外CTC-445变体对SARS-Cov-2刺突蛋白与人ACE2结合的抑制作用。如表10A所示，测试的构建体抑制SARS-Cov-2刺突蛋白与人ACE2结合，其IC₅₀小于30nM并且在大多数情况下小于15nM。CTC-708也参见图19C。

表10A：抑制刺突蛋白与ACE2的结合

如下测定了附加蛋白诱饵对SARS-Cov-2刺突蛋白与人ACE2结合的抑制作用：

SARS-CoV-2S蛋白(D614G)、His标签、Super stable(Acro Biosystems，目录号SPD-C52H3)以0.5μg/mL(50ul/孔)包被在平底白底高结合聚苯乙烯96孔板(LumiNuncMaxiSorp Thermo Scientific，目录号437796)中在4℃下过夜。第二天，用0.05％Tween-PBS洗涤每个测定板4X，并在21℃下在设定为600rpm的摇床上用2％BSA/0.05％Tween-PBS封闭1-1.5小时。以比最终浓度高2倍的浓度制备各测试品的十二点系列稀释液。对于测试品，从220nM开始至0.107nM结束进行两倍连续稀释。此外，生物素-hACE2的剂量响应是通过以600ng/mL(68.81nM，2X最终)开始并以0.585ng/mL结束(6.71pM)进行两倍连续稀释来制备的。从600ng/mL生物素-hACE2中制备出80ng/mL(0.92nM，最终2X)的恒定浓度，用于每个测试品稀释液的抑制作用。将每个测试品稀释液以90μL/孔添加到U型底聚苯乙烯板中，然后添加90μL/孔的生物素-hACE2(最终0.46nM)并充分混合。将生物素-hACE2剂量响应与等体积的测定缓冲液混合。封闭后，洗涤(4X)每个测定板，并将测试品稀释液以50μL/孔添加到板中，一式两份。将测试品与0.46nM生物素-hACE2的孵育在21℃下在设定为600rpm的摇床上进行1小时。之后，洗涤每个测定板(4X)，随后在21℃下将以1:1000稀释度制备的链霉亲和素-HRP(R&D Systems，DY998)孵育1小时。最后，在加入70μL/孔LuminataForte ELISAHRP化学发光底物与等体积的鲁米诺和过氧化物溶液(EMD Millipore，目录号ELLUF0100)预混之前，清洗每个板(4X)。将底物在设定为600rpm的摇床上孵育20-30分钟。在TecanInfinite M1000微孔读板仪上从4个点在450nm下测量每个孔中的平均发光。每个测试品的半数最大抑制浓度(IC₅₀)使用GraphPad Prism软件中的具有1/Y²加权的四参数逻辑(4PL)回归模型来确定。

表10B：

样品	原料浓度(μM)	IC<sub>50</sub>(nM)
			CTC-726	5.0	22.08
CTC-837	5.0	0.60
			环化CTC-847	5.0	0.61
环化CTC-837	5.0	0.81

如本文所述，表达和纯化蛋白诱饵并通过Octet测试其结合。结果示于表10C：

表10C

为了确定包含CTC-726的序列复制版本的二价ACE-2蛋白诱饵中的ACE2蛋白诱饵单元之间的最佳氨基酸接头长度，使用10个氨基酸、20个氨基酸、30个氨基酸、50个氨基酸和60个氨基酸的GS接头连接2个诱饵单元。IC50的如上所述测定。如本文所述，表达和纯化蛋白诱饵，并通过Octet测试其结合，并确定其具有约1nM的估计Kd。

表10D

样品	原料浓度mg/ml	IC<sub>50</sub>(nM)
			10个氨基酸接头	1.190	0.62
20个氨基酸接头	1.210	0.75
			30个氨基酸接头	1.270	2.09
50个氨基酸接头	0.960	3.66
			60个氨基酸接头	1.260	4.60

实施例10-CTC-445变体的效力相对于分子量.

在0.033nM生物素化可溶性hACE2存在下，通过ELISA测量CTC-445变体与SARS-CoV-2S/RBD结合的IC50值。通过用链霉亲和素-HRP处理和测量450nm处的吸光度来量化与RBD结合的hACE2。SARS-CoV2 S蛋白RBD(Acro，目录号EP-105)以0.5μg/mL(100μL/孔)包被在平坦、透明底部、高结合聚苯乙烯96孔板(Thermo，目录号15041)中，在4℃下过夜。第二天，用0.05％Tween-PBS洗涤每个测定板3X，并在37℃下用2％BSA/0.05％Tween-PBS封闭1-1.5小时。第二天，从2μM(最终2X)开始制备每个测试品的11点四倍系列稀释液。此外，生物素-hACE2的剂量响应是通过从0.174μg/mL(2nM)开始进行两倍连续稀释来制备的。从0.174μg/mL生物素-hACE2中制备出0.07μg/mL(0.8nM，最终2X)的恒定浓度，用于测试品的抑制作用。封闭后，洗涤每个测定板(3X)，并将每个测试品稀释液以50μL/孔(每个浓度单重复孔)的浓度添加到板中，然后添加50μL/孔的生物素-hACE2(最终0.035μg/mL)。测试品与0.4nM生物素-hACE2的孵育在37℃下进行1小时。之后，洗涤每个测定板(3X)，随后在37℃下将0.1μg/mL(100μL/孔)链霉亲和素-HRP孵育1小时。最后，在加入100μl/孔TMB(abCam，目录号171524)之前，对每个板进行洗涤(3X)。将TMB孵育7-8分钟，并用加入50μL/孔TMB终止液(abCam，目录号ab171529)终止反应。在450nm处从4个点测量每个孔中的平均吸光度。结果在图11中示出。

实施例11-VSV-luc假病毒中和

使用具有萤火虫荧光素酶基因并表达来自Wuhan-1 SARS-CoV-2分离株(GenBank：QHD43416.1)的刺突蛋白的非复制性VSV假病毒测定中和活性。用SARS-CoV-2/VSV-Luc(在假病毒表面上表达SARS-CoV-2刺突蛋白的完整胞外域)或VSVg/VSV-Luc(表达VSVg)进行中和测定。在潮霉素(100μg/mL)存在下，前一天将三万个293T-ACE2细胞接种在白板中。中和测定当天，将25μL含有假病毒的培养基与25μL测试品的系列稀释液在不同的板中混合，然后在37℃下孵育1h。在含有5％热灭活胎牛血清(DMEM5)的DMEM培养基中进行假病毒和测试品稀释。在60m孵育后，将测试品/假病毒混合物添加到293T-ACE2细胞中。允许感染24h。使用Britelite报告基因测定(Perkin Elmer)在24h监测萤火虫荧光素酶活性。

使用连续3倍稀释液对测试品进行一式两份评价。对照包括用缺乏刺突蛋白的VSV假病毒(NoEnv/VSV-Luc)感染的细胞、用携带VSVg的假病毒(VSVg/VSV-Luc)感染的细胞或未感染的细胞(“模拟感染”)。将假病毒感染的细胞用测试品或单独的媒介物(DMEM5)孵育。一些孔包括用假病毒激发的细胞，将这些细胞用从COVID-19(COV+)恢复的恢复期患者的血浆稀释液或用对照血浆(COV-)孵育。在从COV+采集血液之前，该患者已通过RT-PCR确认感染了SARS-CoV-2，并且还通过侧流抗体测试评价了其针对SARS-CoV-2刺突(S)的IgG的存在。COV-血浆来源于S抗体的PCR阴性和IgG阴性。

从所有值中减去模拟感染细胞中的平均RLU值(“模拟减去值”)。获得了媒介物存在下感染样品的平均RLU值。对于每个数据点，一旦减去模拟，该值除以仅存在媒介物的感染细胞中的平均值，然后乘以100以获得归一化为仅具有媒介物的样品的感染性百分比值。从产生的重复值中获得每个浓度的平均感染百分比以及重复的标准偏差。

用GraphPad Prism测定50％抑制浓度(IC50)。IC50定义为相对发光单位(RLU)与在没有测试项的情况下感染假病毒的细胞中的值相比减少50％的测试项的浓度。平行进行细胞活力测定(右)。使用CTC-445.2和CTC-445.2d(图12A至图12B)以及CTC-445.2d和CTC-445.3d(图21A至图21C)进行测定。CTC 445.2、CTC-445.2d和CTC-445.3d中和了表达SARS-CoV-2的VSV假病毒。在表达VSVg的HEK293T细胞中没有观察到用CTC-445.2d和CTC-445.3d抑制假病毒感染，这证明了对SARS-CoV-2的RBD的特异性，没有明显的HEK293细胞活力损失。

实施例12-从头诱饵的药代动力学

用异氟醚麻醉八周龄的Balb/c小鼠(Charles River)，并鼻内注射30μL CTC-445.2d。在指定的时间点处死小鼠并分离全血和肺。将全血离心，并在冷冻前通过移液到单独的管中将血浆与细胞分离。通过使用Precellys组织匀浆器(Bertin)机械破坏组织，然后用含有蛋白酶/磷酸酶抑制剂混合物(ThermoFisher)的T-PER组织裂解缓冲液(ThermoFisher)裂解，来制备肺裂解物。通过离心清除裂解物并冷冻用于分析。标准96孔MSD(L15XA)板预涂有50μL 0.5μg/mL SARS-CoV-2S蛋白RBD无标签(Sino,40592-VNAH)在4℃下过夜并密封。在PBS中制备捕获试剂的稀释液。第二天，用0.05％Tween-PBS清洗(6X)测定板，并且在室温下用150μL/孔MSD Blocker A(5％蛋白质-PBS溶液)封闭至少2小时。对于所有孵育期，进行板摇动。在封闭孵育期间，通过在未经处理的肺裂解物或未经处理的血浆中以10,000ng/mL对CTC-445.2d进行4倍连续稀释来制备标准曲线。在添加到测定板之前，将每个样品和标准品稀释5倍(MRD＝5)到测定稀释缓冲液(0.5％MSD Blocker A)中。此外，将样品在单独的孔中稀释10倍。封闭后，洗涤测定板(6X)并添加50μL/孔的每个样品或标准稀释液。将测定板在室温下再孵育1小时，同时摇动板，然后洗涤(6X)。对于检测，使用1步检测方法。通过1步检测，在以50μL/孔加入检测板前，将兔抗His mAb(RevMab,31-1048-00)和SULFOTAG山羊抗兔IgG(H+L)pAb(MSD,R32AB)以1μg/mL预混合1小时。最后一次洗涤后，添加150μL/孔的MSD Gold Read Buffer并在MSD Quickplex SQ120上测量发光。基于标准曲线将发光转换为浓度。图13显示鼻内施用后CTC-445.2d在小鼠肺(顶部)和血浆(底部)中的生物利用度。使用中尺度发现平台(Meso Scale Discovery platform)定量肺裂解物和血液血浆中的蛋白质浓度。结果表明，全功能CTC-445.2d在肺中的持久性超过24小时。尽管使用鼻内施用途径，但在血液中检测到CTC-445.2d，这增加了鼻内递送也可能允许某种程度的全身暴露于蛋白质的可能性。

实施例13ACE2功能测定.

使用ACE2抑制剂筛选试剂盒(Promocell，Heidelberg，Germany)进行ACE2酶促活性的抑制。将50μL ACE2酶溶液添加到96孔白壁板(Corning,New York)的每个孔中。测试样品在提供的最高浓度测定缓冲液中稀释至20μM，并进行8点1至4连续稀释。将DX600用作ACE2抑制剂阳性对照。将10μL稀释样品添加到ACE2酶溶液中，并且在室温下孵育15分钟。然后将40μL ACE2底物混合物添加到每个孔中。15分钟后，在具有320nm激发和420个发射滤光片的Infinite M1000读段仪(Tecan

，Switzerland)中测量荧光。使用阴性对照对荧光值进行归一化。图14显示如通过从Mca-APK(DNP)底物酶促释放游离荧光团测量的ACE2功能活性。使用DX600肽作为阳性对照显示ACE2抑制。该测定表明从头设计的蛋白质不会显著影响ACE2的功能活性。

实施例14SARS-1结合.

如本文所述，通过Octet测量CTC-445.2和CTC-445.2d与SARS-CoV-1RBD的结合动力学。CTC-445.2(左)和CTC-445.2d(右)与固定至Anti-Penta_HIS传感器的SARS-CoV-1SRBD一起孵育，并用不同浓度的CTC-445.2(123-10000nM；左)和CTC-445.2d(82-6667nM；右)孵育。如上所述，对于CTC-445.2(K_d＝3864nM，k_on＝1.0x10⁵ M^-1s^-1，koff＝3.9x10^-1 s^-1)和CTC-445.2d SARS-CoV-1S RBD(K_d＝1280nM,k_on＝3.7x10⁵M^-1s^-1,koff＝4.7x10^-1 s^-1)，结果是全局拟合的。请参见图15和表11。

表11

*ND-该值在本次测定中无法确定

实施例15–CTC-445.2与SARS-CoV-2RBD突变体结合的动力学.

通过Anti-Penta-His传感器固定五个SARS-CoV-2RBD突变体，并且在溶液中滴定CTC-445.2。对于每个RBD突变体，数据全局拟合为1:1模型。图16表明CTC-445.2与突变体结合。

实施例16–细胞保护测定

将PBS中的测试化合物在含有50μg/mL庆大霉素和2％FBS的MEM溶液中以八种浓度制备。测试材料CTC-640和CTC-641使用50μM的高测试浓度和七个连续三倍稀释液进行了评价。CTC-655使用10μM的高测试浓度和七次连续三倍稀释进行评价。使用20μM的高测试浓度和七次连续三倍稀释对其余测试品进行评价。将一百微升的每种浓度加入一式三份的孔中以获得功效，并加入一式两份的孔中以获得细胞毒性。将每种稀释液添加到96孔板的5个孔中，其中含有80％-100％融合的Vero76细胞(每孔3x104个细胞)，并在37℃/5％CO2下孵育2小时。制备SARS-CoV-2病毒(毒株USA-WA1/2020)以实现尽可能低的感染复数(MOI；0.002)，这将在四天时产生>80％的细胞病变效应(CPE)。每个稀释度的三个孔被病毒感染，并且两个孔保持未感染作为毒性对照。在未经处理的病毒对照孔在感染四天后达到最大细胞病变效应(CPE)后，用中性红色染料将板染色约2小时，然后去除上清液染料，并在50:50Sorensen柠檬酸盐缓冲液/乙醇中提取掺入的染料，然后在分光光度计上读取。OD值根据细胞和病毒对照进行归一化，然后通过回归分析计算EC50(50％有效浓度)和TC50(50％毒性浓度)。结果示于表12。

表12

化合物	EC<sub>50</sub>(μM)	TC<sub>50</sub>(μM)	治疗指数
				CTC-640	0.47	>50.0	>106
CTC-641	0.61	>50.0	>82.0
				CTC-654	<0.009	>20.0	>2222
CTC-655	<0.005	>10.0	>2000
				CTC-702	0.06	>20.0	>333
CTC-694-20KPEG	0.43	>20.0	>46.5
				阳性对照(ug/ml)	1.04	>10	>9.62

实施例17–融合蛋白

将CTC-702融合到IgG1 Fc域的C末端。如本文所述，表达和纯化融合蛋白并且通过Octet测试其结合。使用1:1结合模型(Kd＝0.54nM)全局拟合结果。融合显示出与CTC-654和CTC-725相当的结合和IC50。

融合蛋白的序列如SEQ ID NO:247所示：

MGWSCIILFLVATATGVHSEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKGGSGGGSGPGSVEIDLGKGDFREIRASEDAREAAEALAEAARAMKEALEILREIAEKLRDSSRASEAAKRIAKAIRKAADAIAEAAKIAARAAKDGDAARNAENAARKAKEFAEEQAKLADMYAELAKNGDKSSVLEQLKTFADKAFHEMEDLFYQAALAVFEAAEAAAG(SEQ ID NO:247)。

接下来，将CTC-702融合到一个IgG1 Fc域的C末端和另一个的N末端。如本文所述，表达和纯化融合蛋白并且通过Octet测试其结合。融合显示出与非融合蛋白诱饵相当的结合。

实施例18–使用易错PCR和酵母展示FACS优化CTC-445

根据标准方案，使用GeneMorph II随机诱变试剂盒(Agilent)对编码CTC-445的基因进行易错PCR(epPCR)。使用10ng和1ng的CTC-445编码基因作为初始靶DNA进行两个单独的PCR反应，以获得更高和更低的错误率池。三十个循环的扩增用于PCR，退火温度为55℃。将两种PCR的产物合并并通过乙醇沉淀进行纯化。12μg CTC-445epPCR DNA与4μg线性化pETcon3载体(用NdeI和XhoI限制性内切酶消化并通过凝胶提取纯化)通过电穿孔转化到条件酿酒酵母菌株EBY100细胞中，使用之前描述的方案(Benatuil,L.,Perez,J.M.,Belk,J.&Hsieh,C.-M.An improved yeast transformation method for the generation of verylarge human antibody libraries.Protein Eng.Des.Sel.PEDS 23,155–159(2010))。所述基因在5'和3'末端两处都包含与载体重叠的60个碱基，使得同源重组将基因置于载体上NdeI和XhoI位点之间的框架中。转化效率是2x10⁶个转化子。使用荧光激活细胞分选(FACS)对CTC-445epPCR文库进行了几轮细胞分选，以识别改进与SARS-CoV-2结合并改进对蛋白酶稳定性的突变。酵母在C-Trp-Ura选择性培养基中生长，然后在SGCAA培养基中诱导12h-18h。将细胞用稀释在PBSF(50mM NaPO4,150mM NaCl,pH 7.4)中的不同浓度SARS-CoV-2RBDmFc孵育，每轮分选时RBD浓度降低：200nM(第1轮，108个细胞分选)、10nM(第2轮，107个细胞分选)、1nM(第3轮，106个细胞分选)、100pM(第4轮，106个细胞分选)和10pM和1pM(第5轮，106个细胞分选)。该孵育在冰上进行30分钟，然后用冷冻的PBSF洗涤。在第4轮和第5轮分选时，在此阶段添加了用于改进koff的额外选择，其中细胞在1ml PBSF缓冲液中在37℃下孵育1小时。用冷冻的PBSF缓冲液再次洗涤细胞。最后，将细胞用FITC缀合的鸡抗cMyc抗体(ICL)和藻红蛋白缀合的山羊抗mFc抗体(Jackson ImmunoResearch)以每3×106个细胞1μl在冰上孵育10分钟，并且再次用冷冻的PBSF缓冲液洗涤。使用Sony SH800仪器进行分类，在每轮中通过其PE/FITC荧光比选择显示亚群的前5％。从第2轮开始，在TBS缓冲液(25mMTris-HCl,150mM NaCl,pH8.0)中使用胰蛋白酶(12.5μg/mL)和糜蛋白酶(5μg/mL)的混合物在室温下对细胞进行预处理5分钟，然后初步标记。通过加入大量过量的冰冷TBSF 1％(25mM Tris-HCl,150mM NaCl,1％w/v BSA,pH 8.0)并且用1％TBSF再洗涤细胞四次来停止该反应。从第1轮开始，将选定的细胞铺在SDCAA琼脂板上，并从每轮中挑选约20个菌落，通过PCR扩增，并通过Sanger测序(Genewiz)进行测序，以识别在每轮FACS中选择的突变。(Chao,G.等人Isolating and engineering human antibodies using yeast surfacedisplay.Nat.Protoc.1,755-768(2006))。鉴定为CTC-445.01至CTC-445.68的序列使用易错PCR和酵母展示FACS进行鉴定。熟练的技术人员可以使用该结果来识别ACE2蛋白诱饵的替代物，这些替代物不会显著干扰与冠状病毒刺突蛋白的结合。

实施例19–使用综合人蛋白质组结合测定评估的CTC445.2d的结合特异性.

用Alexa-647化学标记的1μg/mL(＝30nM)的CTC445.2d用于蛋白质-蛋白质相互作用测定。将带有包含21,218种蛋白质和蛋白质同种型(包括S蛋白RBD)的条形码的HuProt^TM阵列(CDI Laboratories,Baltimore,MD)用蛋白质样品孵育1小时。探测后，清洗阵列并拍摄图像用于数据收集。CDI软件用于根据Z评分量化每个单独样品与阵列上特定蛋白质的结合概况。Z评分是使用给定蛋白质的重复点的平均Z评分计算的(每种蛋白质在HuProt^TM阵列上一式两份印刷)。给定阵列上每个点的Z评分根据公式Z＝[F635-F635(avg)]/F635(std)计算，其中F635是检测通道中给定蛋白质的2个重复点的平均前景信号强度(635nm)；B635是检测通道中给定蛋白质的2个重复点的平均背景信号强度；并且F635(avg)和F635(std)分别是阵列上所有点的F635值的平均值和标准偏差。S评分是给定蛋白质的Z评分与排在它之后的蛋白质的Z评分之差。如果从下一个命中开始，最高命中的S评分>3，则认为测试蛋白对该命中具有高度特异性。

表13显示了Z评分>10的所有命中。CTC445.2d表现出与SARS-CoV-2RBD的特异性结合，荧光值为65,535，转化为最高Z评分为88.6。与下一个最高结合基因QDPR的S评分为27.6，表明与SARS-CoV-2的预期靶RBD具有高度特异性结合。通过生物层干涉法测试了CTC-445.2d与固定的SARS-CoV-2RBD-his、QDPR-his和CLEC10A-his的结合。在任何测试浓度的CTC-445.2d(10μM、5μM和1μM)下均未检测到与QDPR和CLEC10A的结合(数据未显示)。

表13

实施例20-结合选择后突变的位置概率

针对结合几种不同浓度的SARS-CoV-2RBD蛋白(6.25pM、3.125pM和1.5625pM)，通过酵母展示对CTC445.2的饱和诱变文库进行深度突变扫描。深度测序用于计算每个突变的富集值，并对三个浓度的值进行平均。然后将富集值转换为每个位置处的每个突变的位置概率评分，并使用logomaker[参考:https://www.biorxiv.org/content/10.1101/635029v1]绘制为序列标识图。字母根据它们的概率进行缩放，并且从最高概率(顶部)到最低概率(底部)排序。CTC445.2的原始序列以黑色阴影显示。熟练的技术人员可以使用该结果来指导在ACE2蛋白诱饵的不同位置选择优选和非优选替代。参见图20A至图20C

实施例21–从头ACE2蛋白诱饵的示例性临床试验设计

从头ACE2蛋白诱饵的临床设计旨在确定所述从头ACE2蛋白诱饵的安全性概况、推荐剂量和时间表以及临床活性。施用途径是通过吸入雾化的从头ACE2蛋白诱饵对呼吸道(包括鼻咽和肺)进行局部施用，和/或静脉内全身施用。在一项研究中，患者群体是因SARS-CoV-2导致临床发病率或死亡率高的COVID-19患者，例如住院和因缺氧需要补氧的患者。所述试验可能会避免招募需要正压通气的患者。所述试验分两部分进行。第一部分是剂量递增研究，旨在调查从头ACE2蛋白诱饵在住院缺氧COVID-19患者中的安全性，并确定推荐的第2部分剂量和时间表(RP2DS)。第二部分是一项队列扩展研究，旨在探索在RP2DS施用时，从头ACE2蛋白诱饵在住院缺氧COVID-19患者中的临床活性。终点包括例如存活率、对正压通气的要求、恢复和/或出院的时间以及临床安全性概况。或者，患者群体可能是有感染冠状病毒风险的个体，并且施用可能是预防性的。在另一项研究中，患者群体是有暴露于SARS-CoV-2风险或最近暴露于SARS-CoV-2的健康受试者。

实施例22：讨论

自成为全球大流行病以来，SARS-CoV-2已导致数百万COVID-19病例。对预防和治疗该疾病的有效策略的需求仍未实现且紧迫。正在进行多种努力以使用各种方法开发预防剂和治疗剂。一个挑战是，正义单链RNA(+ssRNA)病毒(8-10)的高突变率通常会导致病毒逃逸，这可能会损害许多正在开发的SARS-CoV-2疗法的功效。在受感染人群中，SARS-CoV-2的刺突(S)蛋白已经发生了几种突变。受体结合域(RBD)的深度测序研究表明，简单的突变可以使病毒逃脱已知的中和抗体。因此，迫切需要开发对SARS-CoV-2突变逃逸更具抵抗力的新疗法。

对抗病毒的传统方法(例如疫苗接种和单克隆抗体)最终依赖于分子与病原体的相互作用，其方式与病原体与其细胞靶点的相互作用方式完全不同。病毒可以利用这种结构差异来逃避中和，改变其蛋白质的形状以预防被中和分子(例如，抗体)识别，同时保持病毒适应性。为了应对这些挑战，本发明人开发了一种计算蛋白质设计策略，所述策略能够快速准确地设计超稳定的从头蛋白“诱饵”，所述“诱饵”复制并稳定病毒附着的蛋白质受体界面以感染细胞。诱饵可以实现与原始蛋白质受体相似甚至更高的亲和力，因为它们有助于稳定结合界面。因此，在足够高的浓度下，诱饵可用于通过竞争病毒与细胞的相互作用来中和病毒。

SARS-CoV-2以两步过程侵入宿主细胞。首先，它的S蛋白RBD通过与膜相关蛋白hACE2结合而附着在细胞上，从而触发内吞作用。随后，病毒通过蛋白酶切割介导的融合肽逃离内体。该过程类似于β-冠状病毒HCoV-NL63和SARS-CoV-1，它们也靶向针对hACE2以进入细胞。原则上，抑制病毒与hACE2的相互作用应该预防感染。设计策略应用于工程化、验证和优化从头hACE2诱饵以中和SARS-CoV-2。

对大约35,000个从头ACE2诱饵的合理计算模型进行了工程化。通过使用酵母展示，196个排名靠前的设计分别进行了结合测试。开箱即用的其中一种设计CTC-445通过酵母展示显示出对SARS-CoV-2RBD的强/纳摩尔和特异性结合。在溶液中，CTC-445是一种160个氨基酸的蛋白质，其包含18个天然氨基酸(不含半胱氨酸或色氨酸残基)并且展现出对SARS-CoV-2的结合亲和力(K_D～357nM)比hACE2(K_D＝31nM，IC_{50@ACE2[0.4nM]}＝10.9nM)弱，并且对SARS-CoV-1的交叉反应性较弱(K_d≈55μM)。因此，CTC-445是SARS-CoV-2RBD与hACE2结合的弱竞争者(IC_{50@ACE2[0.4nM]}＝1.7μM，图1I)。CTC-445的低结合亲和力和效力可能是其折叠状态不稳定的结果(ΔG_NI～-2.7kcal mol^-1，T_m～75.3℃)。单轮定向进化和随后五个最常观察到的稳定和亲和力改进突变(没有一个在结合界面中)的合理组合导致从头蛋白诱饵CTC-445.2。CTC-445.2主要是单体，热力学超稳定(ΔG_NI～-5.0kcal mol^-1，T_m～93℃)，对SARS-CoV-2的RBD表现出低纳摩尔亲和力(K_D～21.0nM)，具有改进的与SARS-CoV-1的交叉反应性(K_D～7.1μM)，并且可有效竞争hACE2与SARS-CoV-2RBD的结合(IC_{50@ACE2[0.4nM]}～10.4nM)。CTC-445.2的序列与hACE2没有显著的同一性(无论是在线性序列对齐还是结构序列比对方面，分别是ClustalW～22％，MICAN～34％，图S9)。CTC-445.2的连续复制(即亲和力增加)导致具有有利生化特性的更高效力分子。例如，CTC-445.2d(图2A)是CTC-445.2的二价版本，对SARS-CoV-2RBD(K_D～3.5nM)和SARS-CoV-1RBD(K_D～587nM)的结合亲和力改进了约10倍，并且其与hACE2竞争结合SARS-CoV-2RBD(IC_{50@ACE2[0.4nM]}～700pM)的能力也有类似的增加。同样，三价版本的CTC-445.2导致甚至更高(皮摩尔)的结合亲和力和竞争效力(K_D＝270pM，IC_{50@ACE@[0.4nM]}～110pM)。在包含超过21,000种人蛋白质的交叉反应结合测定中，证实CTC-445.2d以高选择性与SARS-CoV-2RBD结合。

在表达SARS-CoV-2刺突蛋白的VSV假病毒系统中，从头诱饵特异性保护过表达hACE2的HEK 293T细胞免受感染。为了将CTC-445.2d的活性定义为局部递送的治疗剂以可能保护气道免受感染，通过吸入鼻内液滴将高剂量(100μg)的CTC-445.2d递送给Balb/c小鼠。在肺中观察到完全功能的CTC-445.2d持续超过24小时。在血液中也检测到CTC-445.2d，增加了吸入治疗可能导致某种程度的全身暴露的可能性。

按照设计，SARS-CoV-2RBD与CTC-445.2的结合界面密切反映了靶hACE2界面。CTC-445.2的深度突变扫描结果与预期一致，设计核心和结合界面中的突变通常不是优选的，而表面/暴露残基的突变大多无关。

对SARS-CoV-2RBD结合界面进行深度突变扫描，以比较每个突变对与hACE2或CTC-445.2结合的影响。分析的约1700个SARS-CoV-2RBD突变的影响表明，与hACE2和CTC-445.2的结合之间存在很强的相关性，突出了诱饵对突变逃逸的内在弹性，因为它精确地概括了SARS-CoV-2靶向的hACE2界面。值得注意的是，在低靶浓度(100pM)下，对于许多RBD突变，CTC-445.2比ACE2具有更大的结合优势，这可能是由于其更高的稳定性和更小的尺寸。

优化的从头蛋白诱饵的高和特异性结合亲和力转化为对SARS-CoV-2病毒感染的有效和特异性体外中和。在体外，从头诱饵的存在显示出对哺乳动物细胞活力或hACE2的酶促活性没有影响。如实施例所示，从头诱饵能够完全中和细胞感染体外系统中的病毒感染。

产生诱饵的从头蛋白设计方法与传统疗法正交，并有可能更好地克服突变病毒逃避的问题。重新利用的天然蛋白质通常对作为治疗剂的开发提出重大挑战，如可能使制造、运输和储存复杂化的低稳定性；残留/不良生物活性；以及引发自身免疫响应的风险。相比之下，从头蛋白诱饵很容易制造(即在传统的细菌系统中)，并且它们的热力学超稳定性可以使得能够简化运输和储存，可能不需要冷链。此外，从头诱饵对病毒逃逸的恢复能力被认为是所描述的设计策略的一个独特特征。

Claims

1.一种包含诱饵单元的ACE2蛋白诱饵，所述诱饵单元包含(i)至少两个α螺旋域H1和H2，(ii)任选的β发夹域H3，和(iii)至少一个结构域；其中所述ACE2蛋白诱饵与冠状病毒ACE2结合刺突蛋白特异性结合，所述至少两个α螺旋域和任选的β发夹域与所述冠状病毒ACE2结合刺突蛋白交界，并且所述至少一个结构域促进所述α螺旋和β发夹域的蛋白质折叠和结合感受态呈现。

2.一种包含诱饵单元的ACE2蛋白诱饵，所述诱饵单元包含两个α螺旋域H1和H2以及任选的β发夹域H3，其中

(a)H1包含氨基酸序列

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)

(b)H2包含氨基酸序列

(c)H3在存在时包含氨基酸序列

X₂₈X₂₉X₃₀X₃₁X₃₂X₃₃KGDX₃₄RX₃₅X₃₆(SEQ ID NO:6)

其中：

(i)H1、H2和存在时的H3可在所述蛋白质中呈任何顺序；

(ii)氨基酸接头可以存在于H1、H2和存在时的H3中的任两个之间；

(iii)X₁、X₂、X₃、X₄、X₅、X₆、X₇、X₈、X₉、X₁₀、X₁₁、X₁₂、X₁₃、X₁₄、X₁₅、X₁₆、X₁₇、X₁₈、X₁₉、X₂₀、X₂₁、X₂₂、X₂₃、X₂₄、X₂₅、X₂₆、X₂₇、X₂₈、X₂₉、X₃₀、X₃₁、X₃₂、X₃₃、X₃₄、X₃₅和X₃₆各自独立地选自任何氨基酸；并且

(iv)所述ACE2蛋白诱饵与冠状病毒ACE2结合刺突蛋白特异性结合。

3.如权利要求2所述的ACE2结合蛋白诱饵，其中所述诱饵单元还包含促进H1、H2和存在时的H3的蛋白质折叠和结合感受态呈现的一个或多个结构域，其中所述一个或多个结构域和H1、H2和存在时的H3可在所述蛋白质中呈任何顺序，并且氨基酸接头可以存在于所述一个或多个结构域中的任一个与H1、H2和存在时的H3之间。

4.如权利要求2或权利要求3所述的ACE2蛋白诱饵，其中以X_数代表的所述氨基酸中不超过一半是SEQ ID NO:1代表的天然ACE2中相应位置处的相同的氨基酸。

5.如权利要求2或权利要求3所述的ACE2蛋白诱饵，其中以X_数代表的所述氨基酸中不超过8个是天然ACE2中相应位置处的相同氨基酸。

6.如权利要求2或权利要求3所述的ACE2蛋白诱饵，其中H1中以X_数代表的氨基酸中不超过4个、3个或2个；H2中以X_数代表的氨基酸中不超过4个、3个或2个；并且存在时的H3中不超过5个、4个、3个或2个氨基酸是天然ACE2中相应位置处的相同氨基酸。

7.如权利要求1-6中任一项所述的ACE2蛋白诱饵，其中H1包含氨基酸序列：

其中；

X₁是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₃是选自A、C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

并且

X₄是选自A、F、I、L、M、P、V、D、E、G、K、N、P、Q、R、S或T的氨基酸。

8.如权利要求1-7中任一项所述的ACE2蛋白诱饵，其中H1包含氨基酸序列：

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)或X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)；其中

X₁是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₃、X₅、X₇、X₈和X₁₀各自独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；并且

9.如权利要求2-8中任一项所述的ACE2蛋白诱饵，其中

X₄是选自A、F、I、L、M、P或V的氨基酸。

10.如权利要求2-9中任一项所述的ACE2蛋白诱饵，其中

X₅是选自D、E、G、K、N、P、Q、R、S或T(优选K)的氨基酸。

11.如权利要求2-10中任一项所述的ACE2蛋白诱饵，其中

X₁是选自R或S的氨基酸。

12.如权利要求2-11中任一项所述的ACE2蛋白诱饵，其中

X₃是选自R、L、A、F、I、M、P或V的氨基酸。

13.如权利要求12所述的ACE2蛋白诱饵，其中

X₃是选自R或L的氨基酸。

14.如权利要求2-13中任一项所述的ACE2蛋白诱饵，其中

X₇是选自A或T的氨基酸。

15.如权利要求2-14中任一项所述的ACE2蛋白诱饵，其中

X₁₀是选自R、S或L的氨基酸。

16.如权利要求2-10中任一项所述的ACE2蛋白诱饵，其中

X₁是选自R或S的氨基酸；

X₃是选自R或L的氨基酸；

X₇是选自A或T的氨基酸；并且

X₁₀是选自R、S或L的氨基酸。

17.如权利要求2至16中任一项所述的ACE2蛋白诱饵，其中

X₁₀是选自R或S的氨基酸。

18.如权利要求2至17中任一项所述的ACE2蛋白诱饵，其中

X₈是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸。

19.如权利要求18所述的ACE2蛋白诱饵，其中

X₈是选自F、D、E、G、K、N、P、Q、R、S或T的氨基酸。

20.如权利要求19所述的ACE2蛋白诱饵，其中

X₈是F。

21.如权利要求8所述的ACE2蛋白诱饵，其中

X₁是选自R或S的氨基酸；X₂是V；X₃是选自R或L的氨基酸；X₄是L；X₅是K；X₆是A；X₇是选自A或T的氨基酸；X₈是F；

X₉是M；X₁₀是选自R或S或L的氨基酸；X₁₁是F

X₁₂是A；并且X₁₃是A。

22.如权利要求2至21中任一项所述的ACE2蛋白诱饵，其中X₁是S。

23.如权利要求2至22中任一项所述的ACE2蛋白诱饵，其中X₃是L。

24.如权利要求2至23中任一项所述的ACE2蛋白诱饵，其中X₁是S并且X₃是L。

25.如权利要求2-24中任一项所述的ACE2蛋白诱饵，其中H1包含SEQ ID NO:10所示的氨基酸序列

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃LX₃₇X₃₈X₃₉X₄₀X₄₁X₄₂X₄₃X₄₄X₄₅X₄₆(SEQ ID NO:10)

其中X₃₇、X₃₈、X₃₉、X₄₁、X₄₂、X₄₅和X₄₆各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₄₀和X₄₄各自独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；并且

X₄₃是选自D、E、G、K、N、P、Q、R、S或T的氨基酸。

26.如权利要求1至25中任一项所述的ACE2蛋白诱饵，其中H1包含与SEQ ID NO:11-17、177-183、198或199所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

SRVLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:11)

SSVREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:12)

SRVREQLKTFADKTFHEMEDRFYQAAL(SEQ ID NO:13)

SRVREQLKTFADKAFHEMEDSFYQAAL(SEQ ID NO:14)

SSVLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:15)

SSVLEQLKTFADKTFHEMEDSFYQAAL(SEQ ID NO:16)

SRVREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:17)

VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:177)

VREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:178)

VREQLKTFADKTFHEMEDRFYQAAL(SEQ ID NO:179)

VREQLKTFADKAFHEMEDSFYQAAL(SEQ ID NO:180)

VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:181)

VLEQLKTFADKTFHEMEDSFYQAAL(SEQ ID NO:182)

VREQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:183)

SSVLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:198)

VLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:199)。

27.如权利要求26所述的ACE2蛋白诱饵，其中SEQ ID NO:11-17或198的第1位、第5位、第6位、第9位、第10位、第12位、第13位、第16位、第17位、第19位、第20位、第23位、第24位和第27位的氨基酸或SEQ ID NO:177-183或199的第3位、第4位、第7位、第8位、第10位、第11位、第14位、第15位、第17位、第18位、第21位、第22位和第25位的氨基酸未改变。

28.如权利要求1-6中任一项所述的ACE2蛋白诱饵，其中H1包含与SEQ ID NO:15所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列(SSVLEQLKTFADKAFHEMEDRF YQAAL)(SEQ ID NO:15)

其中第1位的氨基酸是S或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y；其中第2位的氨基酸是S或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y；其中第3位的氨基酸是V或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、W或Y；其中第4位的氨基酸是L或如果被取代则是A、C、D、E、F、G、H、I、K、M、P、Q、R、S、T、V、W或Y；其中第5位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第6位的氨基酸是Q或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、S、T、V或W；其中第7位的氨基酸是L或如果被取代则是C、I、M、T或V；其中第8位的氨基酸是K或如果被取代则是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；其中第9位的氨基酸是T或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、V、W或Y；其中第10位的氨基酸是F或如果被取代则是A、C、H、V、W或Y；其中第11位的氨基酸是A或如果被取代则是C、G、L、M、S、T或V；其中第12位的氨基酸是D或如果被取代则是A、C、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；其中第13位的氨基酸是K或如果被取代则是A、C、F、H、I、L、M、N、Q、R、S、V、W或Y；其中第14位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、Q、S、T或V；其中第15位的氨基酸是F或如果被取代则是A、C、D、E、G、H、I、L、M、N、Q、R、S、T、V、W或Y；其中第16位的氨基酸是H或如果被取代则是A、C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第17位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第18位的氨基酸是M或如果被取代则是A、C、D、F、G、H、I、L、N、Q、S、T、V、W或Y；其中第19位的氨基酸是E或如果被取代则是D、M、N、P、Q、T或V；其中第20位的氨基酸是D或如果被取代则是E、F、G、H、L、N或Q；其中第21位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y；其中第22位的氨基酸是F或如果被取代则是C、G、H、L、M、N、W或Y；其中第23位的氨基酸是Y或如果被取代则是H、D或F；其中第24位的氨基酸是Q或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、R、S、T、V、W或Y；其中第25位的氨基酸是A或如果被取代则是C、F、G、H、I、L、M、N、Q、S、T、V、W或Y；其中第26位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、L、M、N、Q、S、T或V；并且其中第27位的氨基酸是L或如果被取代则是A、C、D、E、F、G、H、I、K、M、N、Q、R、S、T、V、W或Y，其中位置编号是根据SEQ ID NO:15。

29.如权利要求1-28中任一项所述的ACE2蛋白诱饵，其中H2包含氨基酸序列

X₁₆是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸，

X₁₉是选自A、F、I、L、M、P、E、T或V的氨基酸，并且

X₂₀是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸。

30.如权利要求1-28中任一项所述的ACE2蛋白诱饵，其中H2包含氨基酸序列

X₁₆是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸，并且

31.如权利要求2-30中任一项所述的ACE2蛋白诱饵，其中

X₁₆是选自A、F、I、L、M、P、E或V。

32.如权利要求2-31中任一项所述的ACE2蛋白诱饵，其中

X₁₅是E；X₁₈是R；X₂₁是E；X₂₃是E；X₂₅是K；并且X₂₇是D。

33.如权利要求2-32中任一项所述的ACE2蛋白诱饵，其中

X₁₄是A或V；X₁₆是A或E；并且X₂₀是K或Q。

34.如权利要求33所述的ACE2蛋白诱饵，其中

X₁₄是A或V；X₁₅是E；X₁₆是A或E；X₁₇是A；X₁₈是R；X₁₉是A；X₂₀是K或Q；X₂₁是E；X₂₂是A；X₂₃是E；X₂₄是A；X₂₅是K；X₂₆是A；并且X₂₇是D。

35.如权利要求2-34中任一项所述的ACE2蛋白诱饵，其中H2在其N末端还包含SEQ IDNO:173所示的氨基酸序列

X₄₇X₄₈X₄₉X₅₀X₅₁(SEQ ID NO:173)

并且在其C末端还包含SEQ ID NO:174所示的氨基酸序列

X₅₂X₅₃X₅₄X₅₅X₅₆(SEQ ID NO:174)

其中X₄₉、X₅₂和X₅₅各自独立地为选自A、F、I、L、M、P或V的氨基酸；

X₅₄是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

并且

36.如权利要求35所述的ACE2蛋白诱饵，其中X₄₇是G或E；X₄₈是D；X₄₉是A；X₅₀是G或A；并且X₅₁是R。

37.如权利要求35所述的ACE2蛋白诱饵，其中X₄₇是G或E。

38.如权利要求35-37中任一项所述的ACE2蛋白诱饵，其中X₄₇是G。

39.如权利要求35-38中任一项所述的ACE2蛋白诱饵，其中X₅₄是A、F、I、L、M、P或V。

40.如权利要求35-38所述的ACE2蛋白诱饵，其中X₅₂是A；X₅₃是E；X₅₄是L或F或N；X₅₅是A；并且X₅₆是K。

41.如权利要求35-39中任一项所述的ACE2蛋白诱饵，其中X₅₄是F或L。

42.如权利要求41所述的ACE2蛋白诱饵，其中X₅₄是L。

43.如权利要求1至42中任一项所述的ACE2蛋白诱饵，其中H2包含与SEQ ID NO 21-22所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

NAENAARKAKEFAEEQAKLADMY(SEQ ID NO:21)

NVENEARKAQEFAEEQAKLADMY(SEQ ID NO:22)。

44.如权利要求43所述的ACE2蛋白诱饵，其中SEQ ID NO:21或22的第1位、第4位、第8位、第12位、第15位、第16位、第19位、第22位和第23位的氨基酸未改变。

45.如权利要求1-28中任一项所述的ACE2蛋白诱饵，其中H2包含氨基酸序列

其中：

X₁₅、X₁₈、X₂₁、X₂₃、X₂₅和X₂₇各自独立地为选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

46.如权利要求1-28中任一项所述的ACE2蛋白诱饵，其中H2包含与SEQ ID NO:21所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

其中第1位的氨基酸是N或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y；其中第2位的氨基酸是A或如果被取代则是C、D、G、H、I、L、M、N、P、R、S、T、V或W；其中第3位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第4位的氨基酸是N或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y；其中第5位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第6位的氨基酸是A或如果被取代则是C、D、E、G、I、L、M、N、P、Q、S、T、V、W或Y；其中第7位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、Y或W；其中第8位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y；其中第9位的氨基酸是A或如果被取代则是C、D、G、I、L、Q、S、T、V或W；其中第10位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V或W；其中第11位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第12位的氨基酸是F或如果被取代则是A、C、D、E、G、I、K、L、M、P、Q、R、S、T、V、W或Y；其中第13位的氨基酸是A或如果被取代则是C、D、F、G、I、L、M、N、S、T、V、W或Y；其中第14位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y；其中第15位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y；其中第16位的氨基酸是Q或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、R、S、T、Y或V；其中第17位的氨基酸是A或如果被取代则是C、E、F、G、I、L、M、Q、S、T、V或W；其中第18位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y；其中第19位的氨基酸是L或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、Y或W；其中第20位的氨基酸是A或如果被取代则是C、F、G、I、L、S、T、V或Y；其中第21位的氨基酸是D或如果被取代则是A、C、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y；其中第22位的氨基酸是M或如果被取代则是A、C、D、E、F、G、H、I、K、L、N、Q、R、S、T、V、W或Y；并且其中第23位的氨基酸是Y或如果被取代则是D、F、H、I、L、M或V；其中位置编号是根据SEQ ID NO:21。

47.如权利要求1-46中任一项所述的ACE2蛋白诱饵，其中H3存在。

48.如权利要求47所述的ACE2蛋白诱饵，其中H3包含氨基酸序列

X₂₈X₂₉X₃₀X₃₁X₃₂X₃₃KGDX₃₄RX₃₅X₃₆(SEQ ID NO:6)，其中：

X₃₁是选自D、E、G、K、N、P、Q、R、S或T的氨基酸；

X₃₅是选自D、E、G、K、N、P、Q、R、S、V或T的氨基酸；

X₂₉是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₃₃是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；

X₂₈是选自A、F、I、L、M、P、T或V的氨基酸；

并且

X₃₄是选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸并且任选是C。

49.如权利要求47所述的ACE2蛋白诱饵，其中H3包含氨基酸序列

50.如权利要求47-49中任一项所述的ACE2蛋白诱饵，其中X₃₄是F、D、E、G、K、N、P、Q、R、S、Y、C或T。

51.如权利要求47-50中任一项所述的ACE2蛋白诱饵，其中X₃₃是G、A、F、I、L、M、P或V。

52.如权利要求47-51中任一项所述的ACE2蛋白诱饵，其中X₂₉是D、E、G、K、N、P、Q、R、S、T或V。

53.如权利要求47至52中任一项所述的ACE2蛋白诱饵，其中

X₂₈是A或V；X₂₉是E或V；X₃₁是D；X₃₂是M或L；X₃₃是G；并且X₃₄是选自F、Y、K或C的氨基酸。

54.如权利要求47至53中任一项所述的ACE2蛋白诱饵，其中

X₃₀是I；X₃₅是E；并且X₃₆是I。

55.如权利要求47至54中任一项所述的ACE2蛋白诱饵，其中

X₃₂是L。

56.如权利要求47至55中任一项所述的ACE2蛋白诱饵，其中

X₃₁是D。

57.如权利要求47-56中任一项所述的ACE2蛋白诱饵，其中H3在其N末端还包含选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y的氨基酸；并且H3在其C末端还包含选自D、E、G、K、N、P、Q、R、S、C或T的氨基酸。

58.如权利要求47至57中任一项所述的ACE2蛋白诱饵，其中X₃₄不是C或其中如果X₃₄是C，则X₃是L和/或X₃₂是L。

59.如权利要求1至58中任一项所述的ACE2蛋白诱饵，其中H3包含与SEQ ID NO 29-34或200所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

AEIDLGKGDFREI(SEQ ID NO:29)

AEIDLGKGDCREI(SEQ ID NO:30)

VVIDLGKGDFREI(SEQ ID NO:31)

VVIDLGKGDCREI(SEQ ID NO:32)

AEIDMGKGDCREI(SEQ ID NO:33)

AEIDMGKGDFREI(SEQ ID NO:34)

VEIDLGKGDFREI(SEQ ID NO:200)。

60.如权利要求47所述的ACE2蛋白诱饵，其中H3包含与SEQ ID NO:29所示的氨基酸序列具有至少70％、80％、90％、95％或100％同一性的氨基酸序列：

其中第1位的氨基酸是A或如果被取代则是C、D、E、G、I、L、M、P、Q、R、S、T、V或W；其中第2位的氨基酸是E或如果被取代则是A、C、D、G、L、M、P、R、S、T、V或W；其中第3位的氨基酸是I或如果被取代则是C、F、L、M、T、V或W；其中第4位的氨基酸是D或如果被取代则是A、C、E、G、I、K、L、M、N、S、T或V；其中第5位的氨基酸是L或如果被取代则是F、I、M或V；其中第6位的氨基酸是G或如果被取代则是D或L；其中第7位的氨基酸是K或如果被取代则是I、M、N、Q、R或T；其中第8位的氨基酸是G或如果被取代则是D、E、M、R或S；其中第9位的氨基酸是D或如果被取代则是E、K或T；其中第10位的氨基酸是F或如果被取代则是A、C、E、G、I、K、L、Q、R、S、T、V、W或Y；其中第11位的氨基酸是R或如果被取代则是K、M、Q或S；其中第12位的氨基酸是E或如果被取代则是A、C、D、G、H、K、L、M、P、R、S、T、V、W或Y；并且其中第13位的氨基酸是I或如果被取代则是A、C、D、F、G、H、L、M、N、P、Q、R、S、T、V或W；其中位置编号是根据SEQ ID NO:29。

61.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含两个或更多个结构域，所述两个或更多个结构域促进所述α螺旋和β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现。

62.如权利要求61所述的ACE2蛋白诱饵，其中促进所述α螺旋和β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现的所述两个或更多个结构域独立地包含选自由以下各项组成的组的氨基酸序列：

D1-X_AX_AX_BX_BX_CX_BX_BX_BX_AX_BX_BX_AX_CX_BX_CX_AX_BX_CX_AX_CX_CX_AX_AX_BX_CX_AX_A(SEQ ID NO:35)和

D2-X_AX_CX_CX_AX_BX_BX_AX_CX_BX_BX_AX_BX_BX_AX_CX_BX_BX_AX_BX_BX_DX_AX_BX_BX_AX_CX_BX_BX_AX_C(SEQ ID NO:36)

其中每个X_A是选自D、E、G、K、N、P、Q、R、S、C或T的氨基酸序列；每个X_B独立地为选自A、F、I、L、M或P的氨基酸序列，每个X_C独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W、Y或C的氨基酸序列；并且每个X_D独立地为选自A、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W、Y或C(优选A、F、I、L、M、P或V)的氨基酸序列。

63.如权利要求62所述的ACE2蛋白诱饵，其中所述诱饵单元包含至少两个结构域，所述至少两个结构域促进所述α螺旋和β发夹域对所述冠状病毒刺突蛋白的蛋白质折叠和结合感受态呈现，其中第一结构域包含SEQ ID NO:35的序列，并且第二结构域包含SEQ ID NO:36的序列。

64.如权利要求1-63中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含由D1代表的结构域，并且D1包含与如SEQ ID NO:38所示的氨基酸序列至少60％、70％、80％、85％、90％、95％或100％同一的氨基酸序列：

REAAEALAEAARAMKEALEIIREIAEK(SEQ ID NO:38)。

65.如权利要求1-63中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含由D1代表的结构域，并且D1包含与如SEQ ID NO:222所示的氨基酸序列至少60％、70％、80％、85％、90％、95％或100％同一的氨基酸序列：

REAAEALAEAARAMKEALEILREIAEK(SEQ ID NO:222)。

66.如权利要求1-65中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含由D2代表的结构域，并且D2包含与SEQ ID NO:41-46所示的氨基酸序列至少60％、70％、80％、85％、90％、95％或100％同一的氨基酸序列：

RASEAAKRX₅₉AX₆₀AIRKAADAIX₆₁X₆₂AAKIAARA(SEQ ID NO:41)，其中X₅₉是I或V，X₆₀是K或R或C，X₆₁是A或V或C，并且X₆₂是E或C；

RASEAAKR IAKAIRKAADAIAEAAKIAARA(SEQ ID NO:42)；

RASEAAKR IACAIRKAADAIAEAAKIAARA(SEQ ID NO:43)；

RASEAAKR IAKAIRKAAD AIACAAKIAA RA(SEQ ID NO:44)；

RASEAAKR VARAIRKAAD AIVEAAKIAA RA(SEQ ID NO:45)；

RASEAAKR VACAIRKAAD AIVEAAKIAA RA(SEQ ID NO:46)。

67.如权利要求61所述的ACE2蛋白诱饵，其中至少一个结构域(例如，D1)包含与SEQ IDNO:38所示的氨基酸序列具有至少50％、60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列，

其中第1位的氨基酸是R或如果被取代则是A、C、E、F、G、I、K、L、M、P、S、T、V或W(优选C、E、F、G、K、L、M、P、S、T或W)；其中第2位的氨基酸是E或如果被取代则是A、C、D、F、G、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、G、K、M、V、W或Y)；其中第3位的氨基酸是A或如果被取代则是C、E、G、K、L、M、P、Q、R、S、T、V、W或Y(优选C、K、P、Q或V)；其中第4位的氨基酸是A或如果被取代则是D、E、G、I、K、L、M、N、P、R、S、T、V或W(优选E、N、T、V或W)；其中第5位的氨基酸是E或如果被取代则是C、D、G、K、L、Q、R、S、T、V、W或Y(优选C、D、Q、S、V、W或Y)；其中第6位的氨基酸是A或如果被取代则是C、D、E、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、K、P、R、V或Y)；其中第7位的氨基酸是L或如果被取代则是A、C、F、I、M、Q、S、T或V(优选T)；其中第8位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、Q、L、M、R、S、T、V或W(优选D、E、G、H、I、L、Q、R、S、V或W)；其中第9位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、R、S、V、W或Y(优选A、D、H、L、M、N、R、S或V)；其中第10位的氨基酸是A或如果被取代则是C、G、L、M、Q、S、T、V或W(优选C、G、M或S)；其中第11位的氨基酸是A或如果被取代则是C、D、G、L、M、N、Q、R、S、T或V(优选C、G、M、S、T或V)；其中第12位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、K、M、N、P、Q、S、T、V、W或Y)；其中第13位的氨基酸是A或如果被取代则是C、D、E、F、G、H、K、L、M、P、Q、R、S、T、V、W或Y(优选D、E、K、M、R、S或V)；其中第14位的氨基酸是M或如果被取代则是A、C、D、E、G、H、I、K、L、Q、R、S、T、V、W或Y(优选A、C、D、E、G、K、R、S、T、V或Y)；其中第15位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选E、G、H、M、R、S或Y)；其中第16位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、G、K、L、M、Q、T、V或W)；其中第17位的氨基酸是A或如果被取代则是C、G、P、S、T或V(优选C、G或T)；其中第18位的氨基酸是L或如果被取代则是C、F、H、I、K、M、N、Q、R、T、V、W或Y(优选C、F、H或V)；其中第19位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、P、Q、R、S、T、V、W或Y(优选A、C、F、G、L、Q、R、S、T、V或Y)；其中第20位的氨基酸是I或如果被取代则是A、C、D、E、F、G、H、K、L、M、N、Q、R、S、T、V、W或Y(优选C、E、G、L、Q、R、S、T、V或Y)；其中第21位的氨基酸是I或如果被取代则是A、C、D、E、F、G、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、F、L、M、N、S、T、V或Y)；其中第22位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、Y或W(优选A、C、D、E、F、G、I、L、M、Q、S、T、V或Y)；其中第23位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D，F、H、I、M、N、P、T或W)；其中第24位的氨基酸是I或如果被取代则是A、C、E、F、G、H、K、L、M、N、P、Q、R、S、T、V或Y(优选C、S、T或V)；其中第25位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选D、G、H、I、M、N、S、V或Y)；其中第26位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、Q、R、S、T、V、W或Y(优选C、F、I、L、S、T或Y)；并且其中第27位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、F、G、H、M、N、S或Y)；并且至少一个结构域(例如，D2)包含与SEQ ID NO:42所示的氨基酸序列具有至少50％、60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列

其中第1位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、E、H、K、L、N、Q、S或Y)；其中第2位的氨基酸是A或如果被取代则是C、G、I、L、M、N、P、Q、S、T、V或Y(优选C、M、Q、T或V)；其中第3位的氨基酸是S或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、T、V、W或Y(优选C、E、F、G、I、L、M、Q或R)；其中第4位的氨基酸是E或如果被取代则是A、C、D、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、I、N、S或W)；其中第5位的氨基酸是A或如果被取代则是C、D、E、F、G、I、K、L、M、N、Q、R、S、T、V、W或Y(优选D、E、I、M或Y)；其中第6位的氨基酸是A或如果被取代则是C、F、G、S或T(优选C或S)；其中第7位的氨基酸是K或如果被取代则是A、C、D、E、G、H、L、M、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、R、S、T、V、W或Y)；其中第8位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选A、C、D、E、G、H、L、M、Q、S、T、V或Y)；其中第9位的氨基酸是I或如果被取代则是A、C、F、G、K、L、M、Q、S、T、V、W或Y(优选A、C、F、G、L、M、S、T、W或Y)；其中第10位的氨基酸是A或如果被取代则是D、G、T或V(优选D、G或V)；其中第11位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、L、M、Q、R、S、V、W或Y)；其中第12位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选E、G、I、S或T)；其中第13位的氨基酸是I或如果被取代则是A、C、D、E、F、G、H、L、M、N、Q、S、T、V或Y(优选A、C、D、F、G、L、M、N、Q、S、T或V)；其中第14位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、Q、S、T、V、W或Y(优选F、H、K、L、N、V或W)；其中第15位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、F、G、H、I、L、M、N、Q、R、S、T、V、W或Y)；其中第16位的氨基酸是A或如果被取代则是C、F、G、M、P、S、T、V或Y(优选G、T或Y)；其中第17位的氨基酸是A或如果被取代则是C、D、E、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y(优选G、T或V)；其中第18位的氨基酸是D或如果被取代则是A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、F、G、I、L、N、R、S、T、W或Y)；其中第19位的氨基酸是A或如果被取代则是C、D、E、F、G、K、L、M、N、P、Q、R、S、T、V、W或Y(优选G、K、M、Q、S或T)；其中第20位的氨基酸是I或如果被取代则是A、C、F、G、H、L、M、Q、T、V、W或Y(优选G、L、M、T、V或Y)；其中第21位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选D、E、G、I、K、M、N、Q、S、T、V、W或Y)；其中第22位的氨基酸是E或如果被取代则是A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选A、D、G、K、M、P、S、T、V、W或Y)；其中第23位的氨基酸是A或如果被取代则是C、G、N、S、T或V(优选G、S或T)；其中第24位的氨基酸是A或如果被取代则是C、D、E、G、K、M、N、S、T或V(优选C、G或T)；其中第25位的氨基酸是K或如果被取代则是A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选A、C、D、E、G、I、L、P、Q、R、S、V、W或Y)；其中第26位的氨基酸是I或如果被取代则是A、C、D、E、F、G、H、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、E、K、L、M、P、Q、R、S或V)；其中第27位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、V、W或Y(优选F、G、M、N、S、T或V)；其中第28位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、Y或W(优选C、D、E、G、H、Q、S、T、V或Y)；其中第29位的氨基酸是R或如果被取代则是A、C、D、E、F、G、H、I、K、L、M、N、P、Q、S、T、V、W或Y(优选A、C、D、G、H、I、K、L、M、N、P、S、T、V、W或Y)；并且其中第30位的氨基酸是A或如果被取代则是C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y(优选C、D、G、H、K、N、P、Q、R、S、T或V)；其中位置编号是根据SEQ ID NO:38。

68.如权利要求1至67中任一项所述的ACE2蛋白诱饵，其中H1包含氨基酸序列

SX₁X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:4)。

69.如权利要求1至67中任一项所述的ACE2蛋白诱饵，其中H1包含氨基酸序列

X₂X₃EQX₄X₅TFX₆DKX₇X₈HEX₉EDX₁₀X₁₁YQX₁₂X₁₃L(SEQ ID NO:176)。

70.如权利要求68所述的ACE2蛋白诱饵，其中在SEQ ID NO:4中进行一个或多个以下取代：S1I；E5D；E5Q；E5V；D12V、D12E；Q24K；和Q24L；其中标注的位置根据SEQ ID NO:4的编号。

71.如权利要求69所述的ACE2蛋白诱饵，其中在SEQ ID NO:176中进行一个或多个以下取代：E3D；E3Q；E3V；D10V、D10E；Q22K；和Q22L；其中标注的位置根据SEQ ID NO:176的编号。

72.如权利要求1至71中任一项所述的ACE2蛋白诱饵，其中在SEQ ID NO:5中进行以下取代：E15G；其中标注的位置根据SEQ ID NO:4的编号。

73.如权利要求1-72中任一项所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含与VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:177)或VLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:199)具有至少80％同一性的氨基酸序列；

H2域，所述H2域包含与NAENAARKAKEFAEEQAKLADMY(SEQ ID NO:21)具有至少80％同一性的氨基酸序列；和

H3域，所述H3域包含与AEIDLGKGDFREI(SEQ ID NO:29)或VEIDLGKGDFREI(SEQ ID NO:200)具有至少80％同一性的氨基酸序列。

74.如权利要求73所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含与VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:177)或VLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:199)具有至少90％同一性的氨基酸序列；

75.如权利要求73所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含氨基酸序列VLEQLKTFADKAFHEMEDRFYQAAL(SEQ ID NO:177)或VLEQLKTFADKAFHEMEDLFYQAAL(SEQ ID NO:199)；

H2域，所述H2域包含氨基酸序列NAENAARKAKEFAEEQAKLADMY(SEQ ID NO:21)；和

H3域，所述H3域包含氨基酸序列AEIDLGKGDFREI(SEQ ID NO:29)或VEIDLGKGDFREI(SEQID NO:200)。

76.如权利要求1-72中任一项所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含与VLEQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ ID NO:241)或VLEQLKTFADKAFHEMEDLFYQAAL AVFEAAEAAAG(SEQ ID NO:243)具有至少80％同一性的氨基酸序列；

H2域，所述H2域包含与GDAARNAENAARKAKEFAEEQAKLADMYAELAK(SEQ ID NO:244)具有至少80％同一性的氨基酸序列；和

H3域，所述H3域包含与SAEIDLGKGDFREIR(SEQ ID NO:245)或SVEIDLGKGDFREIR(SEQ IDNO:246)具有至少80％同一性的氨基酸序列。

77.如权利要求76所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含与VLEQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ ID NO:241)或VLEQLKTFADKAFHEMEDLFYQAAL AVFEAAEAAAG(SEQ ID NO:243)具有至少90％同一性的氨基酸序列；

H2域，所述H2域包含与GDAARNAENAARKAKEFAEEQAKLADMYAELAK(SEQ ID NO:44)具有至少90％同一性的氨基酸序列；和

H3域，所述H3域包含与SAEIDLGKGDFREIR(SEQ ID NO:245)或SVEIDLGKGDFREIR(SEQ IDNO:246)具有至少90％同一性的氨基酸序列。

78.如权利要求76所述的ACE2蛋白诱饵，其包含

H1域，所述H1域包含氨基酸序列VLEQLKTFADKAFHEMEDRFYQAALAVFEAAEAAAG(SEQ IDNO:241)或VLEQLKTFADKAFHEMEDLFYQAAL AVFEAAEAAAG(SEQ ID NO:243)；

H2域，所述H2域包含氨基酸序列GDAARNAENAARKAKEFAEEQAKLADMYAELAK(SEQ ID NO:44)；和

H3域，所述H3域包含氨基酸序列SAEIDLGKGDFREIR(SEQ ID NO:245)或SVEIDLGKGDFREIR(SEQ ID NO:246)。

79.如权利要求73-78中任一项所述的ACE2蛋白诱饵，其包含由D1代表的结构域，其中所述D1域包含与

REAAEALAEAARAMKEALEIIREIAEK(SEQ ID NO:38)或REAAEALAEAARAMKEALEILREIAEK(SEQ ID NO:222)具有至少60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列。

80.如权利要求73-79中任一项所述的ACE2蛋白诱饵，其包含由D2代表的结构域，其中D2包含与

RASEAAKR IAKAIRKAADAIAEAAKIAARA(SEQ ID NO:42)具有至少60％、70％、80％、85％、90％、95％或100％同一性的氨基酸序列。

81.如权利要求1-80中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元中的所述两个α螺旋域H1和H2以及β发夹域H3的顺序为H3、H2和H1。

82.如权利要求1-80中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元中的所述两个α螺旋域H1和H2以及β发夹域H3的顺序为H1、H3和H2。

83.如权利要求1-82中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元在所述域之间包含至少一个接头(X_L)，其中所述至少一个接头(X_L)或每个接头(X_L)包含1-100、1-90、1-80、1-70、1-60、1-50、1-40、1-30、1-20、1-10或1-5个氨基酸。

84.如权利要求83所述的ACE2蛋白诱饵，其中每个接头(X_L)包含1-20、1-10或1-5个氨基酸。

85.如权利要求83或权利要求84所述的ACE2蛋白诱饵，其中所述诱饵单元中的α螺旋域H1和H2以及β发夹域H3的顺序为H3、H2和H1，并且所述诱饵单元包含H3与H2之间的第一接头以及H2与H1之间的第二接头；或者顺序为H1、H3和H2，并且所述诱饵单元包含H1与H3之间的第一接头以及H3与H2之间的第二接头。

86.如权利要求1-85中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含与SEQ IDNO:47-90、104-172、184-193、224-239、255-260或265-266所示的氨基酸序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一的氨基酸序列；其中每个X_L独立地为氨基酸接头。

87.如权利要求86所述的ACE2蛋白诱饵，其中第88位的氨基酸选自A、F、I、L、M、P或V，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

88.如权利要求86或权利要求87所述的ACE2蛋白诱饵，其中第137位的氨基酸选自F、D、E、G、K、N、P、Q、R、S或T，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

89.如权利要求86-88中任一项所述的ACE2蛋白诱饵，其中如果第11位的氨基酸是半胱氨酸，则第6位的氨基酸是L和/或第126位的氨基酸是L和/或第124位的氨基酸是S；其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

90.如权利要求86-89中任一项所述的ACE2蛋白诱饵，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过4个被取代，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

91.如权利要求86-89中任一项所述的ACE2蛋白诱饵，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过3个被取代，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

92.如权利要求86-89中任一项所述的ACE2蛋白诱饵，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过2个被取代，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

93.如权利要求86-89中任一项所述的ACE2蛋白诱饵，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸中不超过1个被取代，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

94.如权利要求86-89中任一项所述的ACE2蛋白诱饵，其中第8位、第9位、第10位、第91位、第94位、第98位、第102位、第105位、第106位、第109位、第112位、第113位、第123位、第127位、第128位、第131位、第132位、第134位、第138位、第139位、第141位、第142位、第145位、第146位或第149位的氨基酸均未被取代，其中位置编号是根据SEQ ID NO:47-90、104-172、184-187、189-192或224-239中的任一个。

95.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵由100-800个氨基酸、100-500个氨基酸、或100-400个氨基酸、或100-350个氨基酸、或100-300个氨基酸、或100-250个氨基酸、或100-200个氨基酸、或150-500个氨基酸、或150-400个氨基酸、或150-350个氨基酸、或150-300个氨基酸、或150-250个氨基酸、或150-200个氨基酸组成。

96.如权利要求1-94中任一项所述的ACE2蛋白诱饵，其中每个诱饵单元由100-800个氨基酸、100-500个氨基酸、或100-400个氨基酸、或100-350个氨基酸、或100-300个氨基酸、或100-250个氨基酸、或100-200个氨基酸、或150-500个氨基酸、或150-400个氨基酸、或150-350个氨基酸、或150-300个氨基酸、或150-250个氨基酸、或150-200个氨基酸组成。

97.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵与ACE2(SEQ ID NO:1)具有不超过60％、55％、50％、45％、40％或35％序列同一性。

98.如权利要求1-96中任一项所述的ACE2蛋白诱饵，其中每个诱饵单元与ACE2(SEQ IDNO:1)具有不超过60％、55％、50％、45％、40％或35％序列同一性。

99.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述冠状病毒是SARS-CoV-2。

100.如前述权利要求中任一项所述的ACE2蛋白诱饵，所述ACE2蛋白诱饵阻断超过50％、超过60％、超过70％、超过80％或超过90％冠状病毒与人ACE2结合。

101.如前述权利要求中任一项所述的ACE2蛋白诱饵，所述ACE2蛋白诱饵抑制或预防冠状病毒进入宿主细胞。

102.如前述权利要求中任一项所述的ACE2蛋白诱饵，所述ACE2蛋白诱饵降低宿主细胞的冠状病毒病毒感染性。

103.如前述权利要求中任一项所述的ACE2蛋白诱饵，如在生物层干涉法中测定的，所述ACE2蛋白诱饵对于所述冠状病毒刺突蛋白具有小于约20nm或小于约15nM的Kd。

104.如前述权利要求中任一项所述的ACE2蛋白诱饵，如在生物层干涉法中测定的，所述ACE2蛋白诱饵对于所述冠状病毒刺突蛋白具有小于约5nM的Kd。

105.如前述权利要求中任一项所述的ACE2蛋白诱饵，所述ACE2蛋白诱饵以50nM、40nM、30nM、20nM、10nM或5nM或更小的IC₅₀抑制所述刺突蛋白与ACE2的相互作用。

106.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含0-4个半胱氨酸氨基酸或0-2个半胱氨酸氨基酸。

107.如权利要求1至105中任一项所述的ACE2蛋白诱饵，其中1-4个氨基酸被半胱氨酸取代。

108.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述诱饵单元包含至少一个半胱氨酸氨基酸。

109.如权利要求106-108中任一项所述的ACE2蛋白诱饵，其中所述半胱氨酸氨基酸被烷基化。

110.如权利要求106-109中任一项所述的ACE2蛋白诱饵，其中所述半胱氨酸位于促进H1、H2和H3的蛋白质折叠和结合感受态呈现的一个或多个结构域中。

111.如前述权利要求中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵与稳定化合物连接。

112.如权利要求111所述的ACE2蛋白诱饵，其中所述稳定化化合物是抗体的Fc区。

113.如权利要求112所述的ACE2蛋白，其中所述Fc区是与所述ACE2蛋白诱饵的翻译融合物。

114.如权利要求1-113中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵在所述ACE2蛋白诱饵的半胱氨酸处与稳定化合物连接。

115.如权利要求107或权利要求114所述的ACE2蛋白诱饵，其中所述稳定化合物是PEG分子。

116.如权利要求115所述的ACE2蛋白诱饵，其中所述PEG分子在所述蛋白质的半胱氨酸处与所述ACE2蛋白质诱饵连接。

117.如权利要求116所述的ACE2蛋白质诱饵，其中所述PEG分子通过马来酰化物基团在所述蛋白质的半胱氨酸处与所述ACE2蛋白质诱饵连接。

118.如权利要求1至117中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含一个、两个、三个、四个或多个诱饵单元。

119.如权利要求118所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含两个或更多个诱饵单元，并且第一诱饵单元的C末端与第二诱饵单元的N末端连接。

120.如权利要求118或119所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含两个或更多个诱饵单元，并且所述两个或更多个诱饵单元不同。

121.如权利要求118或119所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含两个或更多个诱饵单元，并且所述两个或更多个诱饵单元相同。

122.如权利要求118-121中任一项所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含两个或更多个诱饵单元，并且所述ACE2蛋白诱饵包含与SEQ ID NO:91-95、194-197、223或261-263所示的氨基酸序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一的氨基酸序列。

123.如权利要求122所述的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵是环化的。

124.一种药物组合物，所述药物组合物包含如前述权利要求中任一项所述的ACE2蛋白诱饵和药学上可接受的载体或稀释剂。

125.一种分离的多核苷酸，所述分离的多核苷酸包含编码如权利要求1-123中任一项所示的ACE2蛋白诱饵的多核苷酸序列。

126.一种载体，所述载体包含如权利要求125所述的多核苷酸。

127.一种分离的宿主细胞，所述分离的宿主细胞包含如权利要求126所述的载体。

128.一种分离的宿主细胞，所述分离的宿主细胞表达如权利要求1-123中任一项所述的ACE2蛋白诱饵。

129.一种产生ACE2蛋白诱饵的方法，所述方法包括在适合表达所述ACE2蛋白诱饵的条件下孵育如权利要求127或128所述的宿主细胞。

130.如权利要求129所述的方法，所述方法还包括分离所述ACE2蛋白诱饵。

131.一种预防冠状病毒感染的方法，所述方法包括向有需要的受试者施用如权利要求1-123中任一项所述的ACE2蛋白诱饵或如权利要求124所述的药物组合物。

132.一种预防、治疗或改善冠状病毒感染的至少一种症状的方法，所述方法包括向有需要的受试者施用如权利要求1-123中任一项所述的ACE2蛋白诱饵或如权利要求124所述的药物组合物。

133.一种预防、治疗或改善冠状病毒感染的至少一种症状的方法，所述方法包括施用编码如权利要求1-123中任一项所述的ACE2蛋白诱饵的核酸。

134.如权利要求132或133所述的方法，其中所述至少一种症状或适应症选自由肺部炎症、肺泡损伤、病毒载量、发热、咳嗽、呼吸急促、肺炎、腹泻、器官衰竭和感染性休克组成的组。

135.如权利要求131-134中任一项所述的方法，其中向所述有需要的受试者预防性或治疗性地施用所述药物组合物或ACE2蛋白诱饵或编码ACE2蛋白诱饵的核酸。

136.如权利要求131-134中任一项所述的方法，其中所述药物组合物或ACE2蛋白诱饵或编码ACE2蛋白质诱饵的核酸与第二治疗剂组合施用。

137.如权利要求136所述的方法，其中所述第二治疗剂选自由抗炎药(如皮质类固醇和非甾体抗炎药)、抗病毒药、抗生素、膳食补充剂(如抗氧化剂)和治疗冠状病毒感染的任何其他姑息疗法组成的组。

138.如权利要求136或137所述的方法，其中所述第二治疗剂是用于治疗细胞因子释放综合征的药物。

139.如权利要求123、124、131、132或134-138中任一项所述的方法，其中所述药物组合物或所述ACE2蛋白诱饵是全身施用的。

140.如权利要求123、124、131、132或134-138中任一项所述的方法，其中所述药物组合物或所述ACE2蛋白诱饵是局部施用的。

141.如权利要求140所述的方法，其中所述药物组合物或所述ACE2蛋白诱饵通过吸入施用至肺。

142.如权利要求131-141中任一项所述的方法，其中所述感染是由SARS-CoV-2导致的。

143.一种检测生物样品中冠状病毒刺突蛋白SARS-CoV-2-S的方法，所述方法包括使所述生物样品与如权利要求1-122中任一项所述的ACE2蛋白诱饵接触以及检测所述生物样品中的冠状病毒刺突蛋白的步骤。

144.一种与冠状病毒ACE2结合刺突蛋白SARS-CoV-2-S特异性结合的ACE2蛋白诱饵，其中所述ACE2蛋白诱饵包含与SEQ ID NO:47-95、104-172、184-197、223-239、255-263或264-265所示的氨基酸序列至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％同一的氨基酸序列；其中每个X_L独立地为氨基酸接头。