CN117098768A

CN117098768A - 生物反应性化合物及其使用方法

Info

Publication number: CN117098768A
Application number: CN202280022559.7A
Authority: CN
Inventors: L·王; J·刘
Original assignee: University of California
Current assignee: University of California
Priority date: 2021-03-01
Filing date: 2022-03-01
Publication date: 2023-11-21

Abstract

本文尤其提供生物反应性非天然氨基酸、含有该非天然氨基酸的化合物及其使用方法。

Description

生物反应性化合物及其使用方法

相关应用

本申请要求2021年6月24日提交的美国申请号63/214,432和2021年3月1日提交的美国申请号63/155,222的优先权，这些美国申请的公开内容以引用方式全文并入本文。

就联邦资助的研究和开发中的发明权利的声明

本发明是在国立卫生研究院授予的合同号R01 GM118384的政府支持下完成的。政府享有本发明的某些权利。

对″序列表″、表格或作为ASCII文件提交的计算机程序列表附录的引用

写入创建于2022年2月28日、字节数为55，165、机器格式为IBM-PC、采用MSWindows操作系统的文件048536-709001WO_SL_ST25.txt中的序列表据此以引用方式并入。

背景技术

将新的化学键引入蛋白质提供了用于操纵蛋白质结构和功能的创新途径。含有不同潜在生物反应性官能团的非天然氨基酸(Uaas)最近已经通过遗传密码扩增引入蛋白质中。这提供了一种精巧的工具，该工具不仅用以研究细胞蛋白质相互作用，而且创建了新颖的基于蛋白的治疗剂。通过潜在芳基氟硫酸酯基团的SuFEx点击化学在帮助模块化有机合成、化学生物学和药物开发方面已经显示出价值。如美国公布号2021/0002325中所述，本发明人将氟代硫酸酯-L-酪氨酸(FSY)掺入蛋白质中以用于蛋白质交联和产生共价蛋白质药物。

本领域尤其需要可用于蛋白质鉴定、药物靶标发现或生物治疗剂的新的和其他非天然氨基酸。本文尤其提供在本领域中这些和其他需求的解决方案。

发明内容

本文提供了具有式(A)的结构的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

本文提供了具有式(B)的结构的生物分子：

其中：(i)X包含至少一个氨基酸，并且Y是OH；(ii)Y包含至少一个氨基酸并且X是H；或者(iii)X和Y各自包含至少一个氨基酸。

本文提供了具有式(C)的结构的生物分子：

其中R¹是生物分子。在方面中，R¹是肽基部分、核酸部分、碳水化合物部分或小分子。在方面中，R¹是肽基部分。

本文提供了生物分子缀合物，其包含通过生物缀合物接头与第二生物分子部分缀合的第一生物分子部分，其中生物缀合物接头具有式(D)的结构：

本文提供了具有式(E)的结构的生物分子缀合物：

其中R¹是第一生物分子部分；R²是第二生物分子部分；并且L¹、L²和X¹如本文所定义。

本文提供了包含FSK的生物分子，其中FSK具有具有式(F)的结构的侧链：

在方面中，生物分子是蛋白质。在方面中，蛋白质是抗体、抗体变体(例如，抗原结合片段、单结构域抗体、单链可变片段、亲和体)或膜受体。

本文中更详细地描述本公开的这些和其他实施方案和方面。

附图说明

图1A至图1C示出FSK到蛋白质中的位点特异性掺入。图1A：通过遗传密码扩增将FSK掺入蛋白质的示意图。图1B：纯化的泛素(6FSK)的SDS-PAGE。图1C：完整泛素(6FSK)的质谱。理论分子量：9589.9Da；观察值：9590.1Da。

图2A至图2F示出遗传编码的FSK使得蛋白质能够以长距离交联。图2A：FSY和FSK的化学结构，以及通过SuFEx化学与邻近的亲核残基(例如，Lys、Tyr、His)反应的氟代硫酸芳基酯的示意图。图2B：从Cα到F原子测量的FSY和FSK在它们的能量最小化状态下的反应距离：9.0埃(FSY)和13.8埃(FSK)。图2C：ecGST的晶体结构(PDB代码：1A0F)，以黄色虚线示出Glu65与相邻亲核残基之间的距离。图2D：由掺入在ecGST的位点65处的FSK或FSY诱导的ecGST二聚交联的蛋白质印迹分析。图2E：sjGST的晶体结构(PDB代码：1Y6E)，示出Lys 44和Ala97的Cαs之间的距离。图2F：由FSK或FSY诱导的sjGST二聚交联的蛋白质印迹分析。*表示与大肠杆菌(E.coli)中的sjGST相互作用的其他蛋白质。

图3A至图3B示出泛素中FSK介导的分子内共价交联。图3A：泛素的结构(PDB代码：1AAR)，示出用于FSK掺入至靶Lys29的Glu18。图3B：Ub(18FSK)的ESI-MS。9587.9Da的峰值对应于完整的Ub(18FSK)(计算的MW：9587.9Da)。9568.6Da的峰值对应于经由FSK18与Lys29反应并失去HF的分子内交联的Ub(计算的MW：9567.9)。峰值9506.8Da对应于失去SO₂F的Ub(18FSK)(计算的MW：9506.9)，这可能是由于FSK的杂质。从胰蛋白酶消化的Ub(18FSK)鉴定的交联肽的串联质谱(未示出)显示FSK与Lys29反应，如所设计的那样。

图4A至图4F示出FSK使得7D12纳米抗体能够共价靶向EGFR受体。图4A：与EGFR(PDB代码：4KRL)复合的纳米抗体7D12的结构，示出用于FSK掺入到EGFR的靶His359的7D12的Arg30和Ser31。图4B：7D12(31FSK)的ESI-MS分析。计算的MW：14673.1Da(形成1对二硫键)；测量的MW：14673.2Da。图4C：纳米抗体7D12与EGFR的体外共价交联的SDS-PAGE分析。图4D：纳米抗体7D12与EGFR的体外共价交联的蛋白质印迹分析。仅7D12(31FSK)共价交联EGFR。图4E：与在A431细胞表面上表达的天然EGFR交联的纳米抗体7D12的蛋白质印迹分析。以指定的时间间隔将7D12和7D12(31FSK)与A431细胞一起温育，并用抗His抗体对细胞裂解物进行免疫印迹法以检测纳米抗体7D12。图4F：7D12(Tyrl09)和EGFR(Lys443)之间距离的示意图，其中Lys443示出为PDB结构4KRL中位点诱变后的状态。

图5A至图5C示出将FSK遗传掺入蛋白质中以用于哺乳动物细胞中的蛋白质交联。图5A：在不同条件下HeLa-EGFP(182TAG)报告细胞的荧光显微图像。细胞用或不用pNEU-FSKRS转染，并且用或不用1mM FSK生长。顶部：明视野；底部：GFP荧光通道。图5B：在HeLa细胞中将FSK掺入EGFP的蛋白质印迹分析。裂解来自(a)的样品并使用抗GFP抗体检测。GAPDH表达水平用作参考。图5C：哺乳动物细胞中FSK介导的ecGST交联的蛋白质印迹分析。将pNEU-FSKRS与pCDNA3.1-ecGST(WT)、ecGST(86TAG)或ecGST(86TAG/92A)共转染到HEK293T细胞中。使用抗His抗体检测ecGST的二聚交联。GAPDH用作参考。

图6A至图6B示出如实施例中所述用于克隆的引物。

图7比较了在18℃下诱导24小时的FSKRS突变体的FSK掺入效率。

图8比较了在30℃下诱导6小时的FSKRS突变体的FSK掺入效率。

图9示出通过蛋白质印迹检测到的FSK到EGFP(182TAG)中的掺入。将FSKRS共转化到pBAD-EGFP(182TAG)中，用或不用1mM FSK诱导蛋白表达。通过使用抗his抗体进行蛋白质印迹来检测FSK到EGFP中的成功掺入。

图10示出FSK到sfGFP(2TAG)和sfGFP(151TAG)中的掺入。将pEVOL FSKRS与pBAD-sfGFP(2TAG)和pBAD-sfGFP(151TAG)分别共转化到DH10b细胞中。用或不用1mM FSK诱导蛋白质表达。通过读板机(485nm激发波长，528nm发射波长)检测FSK到EGFP中的成功掺入。该图表示在600nm光密度下对细菌生长进行标准化后的值。

图11比较了近距离邻近的FSY和FSK介导的GST交联。将pEVOL-FSYRS和pEVOL-FSKRS分别与ecGST 103TAG/107Ala、GST 103TAG/107His、GST 103TAG/107Lys、GST103TAG/107Tyr共表达，并在1mM FSK或FSY存在的情况下于37℃下诱导6小时。WT GST用作阴性对照。通过使用抗His抗体的蛋白质印迹检测GST二聚体交联。

图12A至图12B比较了FSY和FSK介导的大肠杆菌GST在第86位处的交联。图12A是在Val86处的FSY/FSK交联的示意图。图12B示出与ecGST WT或pBAD-GST(86TAG)共表达的pEVOL-FSYRS和pEVOL-FSKRS在1mM FSK或FSY的存在下于37℃下6小时的结果。WT GST用作阴性对照。通过使用抗His抗体的蛋白质印迹检测GST二聚体交联。

图13比较了FSK和FSY在介导Trx和CysH交联中的交联效率。

图14示出在表达期间存在和不存在1mM FSK的情况下7D12(30FSK)和7D12(31FSK)的纯化。

图15示出利用7D12(30FSK)、7D12(30FSY)、7D12(109FSK)和7D12(109FSY)在体外与EGFR交联。

图16示出利用Trx(59FSK)、Trx(62FSK)、Trx(59FSY)、Trx(62FSY)在体内与未知底物交联。

图17是使用FSK或FSY通过在活细胞中遗传编码的化学交联来鉴定Trx底物蛋白的示意图。

图18示出氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)的合成方案。

图19示出在培养基中不存在FSK的情况下或在培养基中在存在1mM FSK的情况下使用不同FSKRS将FSK掺入sfGFP(151TAG)中(其中+表示培养基中存在1mM FSK)。细胞在37℃下生长并诱导5.5小时。测量sfGFP荧光强度并将其标准化至细胞光密度。NThis意指Hisx6附加在N-末端处；CThis意指Hisx6附加在C-末端处。

图20示出在培养基中不存在和存在1mM FSK的情况下使用不同FSKRS将FSK掺入sfGFP(151TAG)中。细胞在18℃下生长并诱导24小时，随后进行荧光强度测量和OD标准化。

图21A至图21B示出纳米抗体7D12与EGFR的体外共价交联的蛋白质印迹分析，其中纳米抗体7D12在109、113和116位(图21A)处含有FSY或者在1、109或113位(图21B)处含有FSY。将纳米抗体7D12与500nm EGFR在15ul PBS中于37℃下温育20小时。纳米抗体7D12如SEQ ID NO：88所示。

图22A至图22B示出纳米抗体7D12与EGFR的体外共价交联的SDS Page分析(图22A)和蛋白质印迹分析(图22B)，其中纳米抗体7D12在109位处含有FSY。将2μM纯化的纳米抗体7D12与500nm EGFR在15ul PBS中于37℃下温育20小时。

图23是纳米抗体7D12 WT或在109位处含有FSY的纳米抗体7D12与A431细胞系的共价交联的蛋白质印迹分析。

图24A至图24B示出纳米抗体7D12与EGFR的体外共价交联的SDSPage分析(图24A)和蛋白质印迹分析(图24B)，其中纳米抗体7D12在30位或31位处含有FSK，或者其中纳米抗体7D12在109位处含有FSY。将2μM纯化的纳米抗体7D12与500nm EGFR在15ul PBS中于37℃下温育20小时。

图25A至图25B示出纳米抗体7D12与EGFR的体外共价交联的SDS Page分析(图25A)和蛋白质印迹分析(图25B)，其中纳米抗体7D12在31位处含有FSK，或者其中纳米抗体7D12在109位处含有FSY。将2μM纯化的纳米抗体7D12与500nm EGFR在15ul PBS中于37℃下温育20小时。

具体实施方式

定义

本文所使用的缩写具有它们在化学领域和生物学领域内的常规含义。本文所阐述的化学结构和式是根据化学领域中已知的化学价的标准规则构建的。

当通过从左到右书写的取代基的常规化学式说明取代基时，所述取代基同等地涵盖由从右到左书写结构所产生的化学上一致的取代基，例如，-CH₂O-等同于-OCH₂-。

除非另外说明，否则术语″烷基″单独或作为另一取代基的一部分意指可以是完全饱和、单不饱和或多不饱和并且可以包括单价、二价和多价自由基的直链(即，非支链)或支链碳链(或碳)或它们的组合。烷基可以包含指定数量的碳(例如，C₁-C₁₀意指一个碳到十个碳)。烷基是未环化的链。饱和烃基的实例包括但不限于如以下的基团：甲基、乙基、正丙基、异丙基、正丁基、叔丁基、异丁基、仲丁基、甲基、例如正戊基、正己基、正庚基、正辛基等的同源物和异构体。不饱和烷基为具有一个或多个双键或三键的烷基。不饱和烷基的实例包括但不限于乙烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2，4-戊二烯基、3-(1，4-戊二烯基)、乙炔基、1-和3-丙炔基、3-丁炔基以及更高的同源物和异构体。烷氧基是通过氧连接子(-O-)与分子的其余部分连接的烷基。烷基部分可以是烯基部分。烷基部分可以是炔基部分。烷基部分可以是完全饱和的。烯基可以包括多于一个双键和/或除一个或多个双键外的一个或多个三键。炔基可以包含多于一个三键和/或除一个或多个三键外的一个或多个双键。

除非另外说明，否则术语″亚烷基″单独或作为另一取代基的一部分意指衍生自烷基的二价自由基，例如但不限于-CH₂CH₂CH₂CH₂-。通常，烷基(或亚烷基)将具有1到24个碳原子，其中具有10个或更少碳原子的那些基团在本文中是优选的。″低级烷基″或″低级亚烷基″是通常具有八个或更少碳原子的短链烷基或亚烷基。除非另外说明，否则术语″亚烯基″本身或作为另一取代基的一部分，意指衍生自烯烃的二价基团。

除非另外说明，否则术语″杂烷基″单独或与另一术语组合意指包括至少一个碳原子和至少一个杂原子(例如，O、N、P、Si和S)的稳定直链或支链或它们的组合，并且其中氮和硫原子可任选地被氧化，并且氮杂原子可任选地被季铵化。杂原子可位于杂烷基的任何内部位置处或位于烷基连接到分子其余部分的位置处。杂烷基是未环化的链。示例包括但不限于：-CH₂-CH₂-O-CH₃、-CH₂-CH₂-NH-CH₃、-CH₂-CH₂-N(CH₃)-CH₃、-CH₂-S-CH₂-CH₃、-CH₂-CH₂、-S(O)-CH₃、-CH₂-CH₂-S(O)₂-CH₃、-CH＝CH-O-CH₃、-Si(CH₃)₃、-CH₂-CH＝N-OCH₃、-CH＝CH-N(CH₃)-CH₃、-O-CH₃、-O-CH-₂-CH₃和-CN。多达两个或三个杂原子可以是连续的，例如-CH₂-NH-OCH₃和-CH₂-O-Si(CH₃)₃。杂烷基部分可包含一个杂原子。杂烷基部分可包含两个任选的不同杂原子。杂烷基部分可包含三个任选的不同杂原子。杂烷基部分可包含四个任选的不同杂原子。杂烷基部分可包含五个任选的不同杂原子。杂烷基部分可包含多达8个任选的不同杂原子。除非另外说明，否则术语″杂烯基″本身或与另一术语组合意指包含至少一个双键的杂烷基。杂烯基可以任选地包括多于一个双键和/或除一个或多个双键外的一个或多个三键。除非另有说明，否则术语″杂炔基″本身或与另一个术语组合，意指包含至少一个三键的杂烷基。杂炔基可以任选地包含多于一个三键和/或除一个或多个三键外的一个或多个双键。

类似地，除非另外说明，否则术语″亚杂烷基″本身或作为另一个取代基的一部分，意指衍生自杂烷基的二价基团，如但不限于通过-CH₂-CH₂-S-CH₂-CH₂-和-CH₂-S-CH₂-CH₂-NH-CH₂-所例示的。对于亚杂烷基，杂原子还可占据链末端中的任一个或两个(例如亚烷基氧基、亚烷基二氧基、亚烷基氨基、亚烷基二氨基等)。仍进一步地，对于亚烷基和亚杂烷基连接基团，连接基团的式书写的方向并不暗示连接基团的朝向。例如，式-C(O)₂R′-表示-C(O)₂R′-和-R′C(O)₂-两者。如上文所描述的，如本文所使用的杂烷基包含通过杂原子与分子的其余部分连接的那些基团，如-C(O)R′、-C(O)NR′、-NR′R″、-OR′、-SR′和/或-SO₂R′。应当理解，在在叙述如-NR′R″等特定杂烷基之后叙述″杂烷基″的情况下，术语杂烷基和-NR′R″不是冗余的或相互排斥的。相反，叙述特定的杂烷基是为了增加清晰度。因此，术语″杂烷基″在本文中不应被解释为排除特定杂烷基，例如-NR′R″等。

除非另外说明，否则术语″环烷基″和″杂环烷基″单独或与其他术语组合分别意指″烷基″和″杂烷基″的环状形式。环烷基和杂环烷基不是芳香族的。另外，对于杂环烷基，杂原子可以占据杂环与分子的其余部分连接的位置。环烷基的实例包括但不限于环丙基、环丁基、环戊基、环己基、1-环己烯基、3-环己烯基、环庚基等。杂环烷基的实例包括但不限于1-(1，2，5，6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2-哌嗪基等。″亚环烷基″和″亚杂环烷基″单独或作为另一个取代基的一部分，意指分别衍生自环烷基和杂环烷基的二价基团。

在实施方案中，术语″环烷基″意指单环、双环或多环环烷基环系。在多个方面，单环环系是含有3至8个碳原子的环烃基团，其中此类基团可以是饱和的或不饱和的，但不是芳香族的。在多个方面，环烷基是完全饱和的。单环环烷基的实例包含环丙基、环丁基、环戊基、环戊烯基、环己基、环己烯基、环庚基和环辛基。双环环烷基环系统是桥接的单环或稠合的双环。在方面中，桥接的单环含有单环环烷基环，其中单环的两个非相邻碳原子通过一个与三个之间的另外的碳原子的亚烷基桥连接(即，形式为(CH₂)_w的桥联基团，其中w为1、2或3)。双环环系统的代表性实例包括但不限于双环[3.1.1]庚烷、双环[2.2.1]庚烷、双环[2.2.2]辛烷、双环[3.2.2]壬烷、双环[3.3.1]壬烷和双环[4.2.1]壬烷。在多个方面，稠合的双环环烷基环系含有与苯基、单环环烷基、单环环烯基、单环杂环基或单环杂芳基中的任一种稠合的单环环烷基环。在多个方面，桥接的或稠合的双环环烷基通过单环环烷基环内含有的任何碳原子与母体分子部分附接。在多个方面，环烷基任选地用独立地是氧代基或硫代基的一个或两个基团取代。在多个方面，稠合的双环环烷基是与苯环、5元或6元单环环烷基、5元或6元单环环烯基、5元或6元单环杂环基或5元或6元单环杂芳基中的任一种稠合的5元或6元单环环烷基环，其中稠合的双环环烷基任选地被独立地是氧代基或硫代基的一个或两个基团取代。在方面中，多环环烷基环系是与以下项稠合的单环环烷基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、双环芳基、单环或双环杂芳基、单环或双环环烷基、单环或双环环烯基和单环或双环杂环基组成的组的两个其他环系。在多个方面，多环环烷基通过基础环内含有的任何碳原子与母体分子部分附接。在方面中，多环环烷基环系是与以下项稠合的单环环烷基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、单环杂芳基、单环环烷基、单环环烯基和单环杂环基组成的组的两个其他环系。多环环烷基基团的实例包括但不限于十四氢菲基(tetradecahydrophenanthrenyl)、全氢吩噻嗪-1-基和全氢吩噁嗪-1-基。

在实施方案中，环烷基是环烯基。术语″环烯基″根据其普通一般的含义使用。在多个方面，环烯基是单环、双环或多环环烯基环系。在方面中，单环环烯基环系是含有3个到8个碳原子的环烃基，其中此类基团是不饱和的(即，含有至少一个环形碳碳双键)，但不是芳香族的。单环环烯基环系统的实例包含环戊烯基和环己烯基。在多个方面，双环环烯基环是桥接的单环或稠合的双环。在方面中，桥接的单环含有单环环烯基环，其中单环的两个非相邻碳原子通过一个与三个之间的另外的碳原子的亚烷基桥连接(即，形式为(CH₂)_w的桥联基团，其中w为1、2或3)。双环环烯基的代表性实例包括但不限于降冰片烯基(norbornenyl)和双环[2.2.2]辛2烯基。在多个方面，稠合的双环环烯基环系含有与苯基、单环环烷基、单环环烯基、单环杂环基或单环杂芳基中的任一种稠合的单环环烯基环。在多个方面，桥接的或稠合的双环环烯基通过单环环烯基环内含有的任何碳原子与母体分子部分附接。在多个方面，环烯基任选地用独立地是氧代基或硫代基的一个或两个基团取代。在方面中，多环环烯基环含有与以下项稠合的单环环烯基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、双环芳基、单环或双环杂芳基、单环或双环环烷基、单环或双环环烯基和单环或双环杂环基组成的组的两个环系。在多个方面，多环环烯基通过基础环内含有的任何碳原子与母体分子部分附接。在方面中，多环环烯基环含有与以下项稠合的单环环烯基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、单环杂芳基、单环环烷基、单环环烯基和单环杂环基组成的组的两个环系。

在实施方案中，杂环烷基是杂环基。如本文所使用，术语″杂环基″意指单环、双环或多环杂环。杂环基单环杂环是含有独立地选自由O、N和S组成的组的至少一个杂原子的3元、4元、5元、6元或7元环，其中环是饱的和或不饱和的，但不是芳香族的。3或4元环含有选自由O、N和S组成的基团的1个杂原子。5元环可以含有零个或一个双键以及选自由O、N和S组成的基团的一个、两个或三个杂原子。6或7元环含有零个、一个或两个双键以及选自由O、N和S组成的基团的一个、两个或三个杂原子。杂环基单环杂环通过杂环基单环杂环内含有的任何碳原子或任何氮源自连接到母体分子部分。杂环基单环杂环的代表性实例包含但不限于氮杂环丁烷基、氮杂环庚烷基、氮丙啶基、二氮杂环庚烷基、1，3-二氧杂环己基、1，3-二氧杂戊烷基、1，3-二硫代戊基、1，3-二噻烷基、咪唑啉基、咪唑烷基、异噻唑啉基、异噻唑烷基、异噁唑基、异噁唑烷基、吗啉基、噁二唑啉基、噁二唑烷基、噁唑啉基、噁唑烷基、哌嗪基、哌啶基、吡喃基、吡唑啉基、噻唑烷基、吡咯啉基、吡咯烷基、四氢呋喃基、四氢噻吩基、噻二唑啉基、噻二唑啉烷基、噻唑啉基、噻唑烷基、硫代吗啉基、1，1-二氧化硫代吗啉基(硫代吗啉砜)、硫代吡喃基和三噻烷基。杂环基双环杂环是与苯基、单环环烷基、单环环烯基、单环杂环或单环杂芳基中的任一种稠合的单环杂环。杂环基双环杂环通过双环环系的单环杂环部分内含有的任何碳原子或任何氮原子与母体分子部分连接。双环杂环基的代表性实例包括但不限于2，3-二氢苯并呋喃-2-基、2，3-二氢苯并呋喃-3-基、吲哚-1-基、吲哚-2-基、吲哚-3-基、2，3-二氢苯并噻吩-2-基、十氢喹啉基、十氢异喹啉基、八氢-1H-吲哚基和八氢苯并呋喃基。在多个方面，杂环基任选地被独立地是氧代基或硫代基的一个或两个基团取代。在某些方面，双环杂环基是与苯环、5元或6元单环烷基、5元或6元单环环烯基、5元或6元单环杂环基或5元或6元单环杂芳基稠合的5元或6元单环杂环，其中双环杂环基任选地被独立地是氧代基或硫代基的一个或两个基团取代。多环杂环基环系是与以下项稠合的单环杂环基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、双环芳基、单环或双环杂芳基、单环或双环环烷基、单环或双环环烯基和单环或双环杂环基组成的组的两个其他环系。多环杂环基通过基础环内含有的任何碳原子或氮原子与母体分子部分连接。在方面中，多环杂环基环系统是与以下项稠合的单环杂环基环(基环)：(i)选自由双环芳基、双环杂芳基、双环环烷基、双环环烯基和双环杂环基组成的组的一个环系；或者(ii)独立地选自由苯基、单环杂芳基、单环环烷基、单环环烯基和单环杂环基组成的组的两个其他环系。多环杂环基基团的实例包括但不限于10H-吩噻嗪-10-基、9，10-二氢吖啶-9-基、9，10-二氢吖啶-10-基、10H-吩噁嗪-10-基、10，11-二氢-5H-二苯并[b，f]氮杂卓-5-基、1，2，3，4-四氢吡啶并[4，3-g]异喹啉-2-基、12H-苯并[b]吩噁嗪-12-基和十二氢-1H-咔唑-9-基。

除非另外说明，否则术语″卤基″或″卤素″单独或作为另一取代基的一部分意指氟、氯、溴或碘原子。另外地，如″卤代烷基″等术语意指包括单卤代烷基和多卤代烷基。例如，术语″卤(C₁-C₄)烷基″包括但不限于氟甲基、二氟甲基、三氟甲基、2，2，2-三氟乙基、4-氯丁基、3-溴丙基等。

除非另外说明，否则术语″酰基″意指-C(O)R，其中R是取代或未取代的烷基、取代或未取代的环烷基、取代或未取代的杂烷基、取代或未取代的杂环烷基、取代或未取代的芳基或者取代或未取代的杂芳基。

除非另外说明，否则术语″芳基″意指多不饱和的芳香族烃取代基，其可以是稠合在一起(即，稠环芳基)或共价连接的单环或多环(优选地1至3个环)。稠环芳基是指稠合在一起的多个环，其中稠环中的至少一个是芳基环。术语″杂芳基″是指含有至少一个杂原子(例如N、O或S)的芳基(或环)，其中氮原子和硫原子任选地被氧化，并且氮原子任选地被季铵化。因此，术语″杂芳基″包括稠环杂芳基(即，稠合在一起的多个环，其中稠环中的至少一个是杂芳环)。5，6-稠环亚杂芳基是指稠合在一起的两个环，其中一个环具有5元并且另一个环具有6元，并且其中至少一个环是杂芳基环。同样，6，6-稠环亚杂芳基是指稠合在一起的两个环，其中一个环具有6个成员并且另一个环具有6个成员，并且其中至少一个环是杂芳基环。并且6，5-稠环亚杂芳基是指稠合在一起的两个环，其中一个环具有6个成员并且另一个环具有5个成员，并且其中至少一个环是杂芳基环。杂芳基可以通过碳或杂原子与分子的其余部分附接。芳基和杂芳基的非限制性示例包括苯基、萘基、吡咯基、吡唑基、哒嗪基、三嗪基、嘧啶基、咪唑基、吡嗪基、嘌呤基、噁唑基、异噁唑基、噻唑基、呋喃基、噻吩基、吡啶基、嘧啶基、苯并噻唑基、苯并噁唑基、苯并咪唑基、苯并呋喃、异苯并呋喃基、吲哚基、异吲哚基、苯并噻吩基、异喹啉基、喹喔啉基、喹啉基、1-萘基、2-萘基、4-联苯基、1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉基、3-喹啉基和6-喹啉基。以上所指出的芳基和杂芳基环系中的每一个的取代基选自下文所描述的可接受的取代基组。单独或作为另一取代基的一部分，″亚芳基″和″亚杂芳基″意指分别衍生于芳基和杂芳基的二价基团。杂芳基取代基可以是与环杂原子氮键合的-O-。

稠环杂环烷基-芳基是与杂环烷基稠合的芳基。稠环杂环烷基-杂芳基为与杂环烷基稠合的杂芳基。稠环杂环烷基-环烷基为与环烷基稠合的杂环烷基。稠环杂环烷基一杂环烷基为与另一个杂环烷基稠合的杂环烷基。稠环杂环烷基-芳基、稠环杂环烷基-杂芳基、稠环杂环烷基-环烷基或稠环杂环烷基-杂环烷基可各自独立地未取代或被一个或多个本文所描述的取代基取代。

螺环是其中相邻环通过单个原子附接的两个或更多个环。螺环内的单个环可以相同或不同。螺环中的单个环可以是取代的或未取代的，并且可以具有与螺环集合中的其他单个环不同的取代基。螺环内的单个环的可能取代基是当不是螺环的一部分时的同一环的可能取代基(例如，环烷基环或杂环烷基环的取代基)。螺环可以是被取代或未被取代的环烷基、被取代或未被取代的亚环烷基、被取代或未被取代的杂环烷基或被取代或未被取代的亚杂环烷基，且螺环基团内的个别环可以是紧接着的前一列表中的任一个，包含具有一种类型的所有环(例如，被取代的亚杂环烷基的所有环，其中各环可以是相同或不同的被取代的亚杂环烷基)。当提及螺环系统时，杂环螺环意指其中至少一个环是杂环并且其中每个环可以是不同的环的螺环。当提及螺环环系时，被取代的螺环意指至少一个环是被取代的并且每个取代基可以任选地是不同的。

符号或″-″表示化学部分与分子或化学式的其余部分的附接点。

术语″氧代″意指与碳原子双键合的氧。

如本文所用，术语″烷基磺酰基″意指具有式-S(O₂)-R′的部分，其中R′是如以上所定义的经取代或未取代的烷基。R′可具有指定数量的碳(例如，″C₁-C₄烷基磺酰基″)。

术语″烷基亚芳基″是与亚烷基部分(在本文中也称为亚烷基接头)共价键合的亚芳基部分。在多个方面，亚烷基芳基具有式：

烷基亚芳基部分可以在亚烷基部分或亚芳基接头(例如，在碳2、3、4或6)上用以下取代(例如，用取代基取代)：卤素、氧代、-N₃、-CF₃、-CCl₃、-CBr₃、-CI₃、-CN、-CHO、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₂CH₃、-SO₃H、-OSO₃H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC(O)NHNH₂、取代或未取代的C₁-C₅烷基或取代或未取代的2至5元杂烷基)。在方面中，烷基亚芳基部分是未取代的。

以上术语(例如，″烷基″、″杂烷基″、″环烷基″、″杂环烷基″″芳基″和″杂芳基″)中的每一者包括所示自由基的取代和未取代形式。下文提供了针对每种类型的基团的优选取代基。

烷基和杂烷基(包括通常被称作亚烷基、烯基、亚杂烷基、杂烯基、炔基、环烷基、杂环烷基、环烯基和杂环烯基的那些基团)的取代基可以是选自但不限于以下的多种基团中的一个或多个：-OR′、＝O、＝NR′、＝N-OR′、-NR′R″、-SR′、-卤素、-SiR′R″R″′、-OC(O)R′、-C(O)R′、-CO₂R′、-CONR′R″、-OC(O)NR′R″、-NR″C(O)R′、-NR′-C(O)NR″R″′、-NR″C(O)₂R′、-NR-C(NR′R″R″′)＝NR″″、-NR-C(NR′R″)＝NR″′、-S(O)R′、-S(O)₂R′、-S(O)₂NR′R″′、-NRSO₂R′、-NR′NR″R″′、-ONR′R″、-NR′C(O)NR″NR″′R″″、-CN、-NO₂、-NR′SO₂R″、-NR′C(O)R″、-NR′C(O)-OR″、-NR′OR″，数量在零到(2m′+1)的范围内，其中m′是此类基团中的碳原子的总数。R、R′、R″、R″′和R″″各自优选地独立地指代氢、取代的或未取代的杂烷基、取代的或未取代的环烷基、取代的或未取代的杂环烷基、取代的或未取代的芳基(例如，用1-3个卤素取代的芳基)、取代的或未取代的杂芳基、取代的或未取代的烷基、烷氧基或硫代烷氧基或芳烷基。当本文所述的化合物包含多于一个R基团时，例如，如当存在多于一个这些基团时独立地选择各R′基团、R″基团、R″′基团和R″″基团那样，独立地选择R基团中的每一个。当R′和R″与相同氮原子连接时，其可与所述氮原子组合以形成4元、5元、6元或7元环。举例来说，-NR′R″包括但不限于1-吡咯烷基和4-吗啉基。根据以上对取代基的讨论，本领域技术人员将理解术语″烷基″旨在包含含有与除氢基团以外的基团结合的碳原子的基团，如卤代烷基(例如，-CF₃和-CH₂CF₃)和酰基(例如，-C(O)CH₃、-C(O)CF₃、-C(O)CH₂OCH₃等)。

类似于针对烷基自由基描述的取代基，芳基和杂芳基基团的取代基是不同的，并且选自例如：-OR′、-NR′R″、-SR′、-卤素、-SiR′R″R″′、-OC(O)R′、-C(O)R′、-CO₂R′、-CONR′R″、-OC(O)NR′R″、-NR″C(O)R′、-NR′-C(O)NR″R″″、-NR″C(O)₂R′、-NR-C(NR′R″R″′)＝NR″″、-NR-C(NR′R″)＝NR″′、-S(O)R′、-S(O)₂R′、-S(O)₂NR′R″、-NRSO₂R′、-NR′NR″R″′、-ONR′R″、-NR′C(O)NR″NR″′R″″、-CN、-NO₂、-R′、-N₃、-CH(Ph)₂、氟(C₁-C₄)烷氧基和氟(C₁-C₄)烷基、-NR′SO₂R″、-NR′C(O)R″、-NR′C(O)-OR″、-NR′OR″，其数量在零至芳香族环系上开放化合价的总数的范围内；并且其中R′、R″、R″′和R″″优选独立地选自氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基和取代或未取代的杂芳基。当本文所述的化合物包含多于一个R基团时，例如，如当存在多于一个这些基团时独立地选择各R′基团、R″基团、R″′基团和R″″基团那样，独立地选择R基团中的每一个。

环(例如，环烷基、杂环烷基、芳基、杂芳基、亚环烷基、亚杂环烷基、亚芳基或亚杂芳基)的取代基可以被描绘为环上的而非环的特定原子上的取代基(通常被称为浮动取代基)。在此情况下，取代基可以与环原子中的任何环原子(遵循化学价规则)连接，并且在稠环或螺环的情况下，被描绘为与稠环或螺环的一个成员缔合的取代基(单环上的浮动取代基)可以是稠环或螺环中的任一个上的取代基(多个环上的浮动取代基)。当取代基与环而非特定原子连接(浮动取代基)并且取代基的下标是大于一的整数时，多个取代基可以位于同一原子、同一环、不同原子、不同稠环、不同螺环上，并且每个取代基可以任选地不同。在环与分子的其余部分的连接点不限于单个原子(浮动取代基)的情况下，连接点可以是环的任何原子，并且在稠环或螺环的情况下，可以是稠环或螺环中的任一个的任何原子(在遵循化学价规则的情况下)。在环、稠环或螺环含有一个或多个环杂原子并且所述环、稠环或螺环被示出为具有又一个浮动取代基(包含但不限于与分子的其余部分的连接点)的情况下，浮动取代基可以与杂原子连接。在环杂原子被示出为与具有浮动取代基的结构或式中的一个或多个氢键合(例如，具有与环原子相连的两个键和与氢相连的第三个键的环氮)的情况下，当杂原子与浮动取代基键合时，取代基将被理解为在遵循化学价规则的同时替换氢。

两个或更多个取代基可以任选地连接以形成芳基、杂芳基、环烷基或杂环烷基。这种所谓的环形成取代基通常(尽管不是必须的)与环状基础结构连接。在一个实施方案中，环形成取代基与基础结构的邻近成员连接。例如，与环状基础结构的相邻成员连接的两个环形成取代基产生稠环结构。在另一个实施方案中，环形成取代基与基础结构的单个成员连接。例如，与环状基础结构的单个成员连接的两个环形成取代基产生螺环结构。在又另一个实施方案中，成环取代基附接至基础结构的非邻近成员。

芳基或杂芳基环的相邻原子上的取代基中的两个取代基可以任选地形成式-T-C(O)-(CRR′)_q-U-的环，其中T和U独立地为-NR-、-O-、-CRR′-或单键，并且q为0到3的整数。替代地，芳基或杂芳基环的相邻原子上的取代基中的两个可任选地被式-A-(CH₂)_r-B-的取代基取代，其中A和B独立地为-CRR′-、-O-、-NR-、-S-、-S(O)-、-S(O)₂-、-S(O)₂NR′-或单键，并且r为1到4的整数。如此形成的新环的单键之一可以任选地被双键替代。替代地，芳基或杂芳基环的相邻原子上的取代基中的两个取代基可以任选地用式-(CRR′)_s-X′-(C″R″R″′)_d-的取代基替代，其中s和d独立地是0至3的整数，并且X′是-O-、-NR′-、-S-、-S(O)-、-S(O)₂-或-S(O)₂NR′-。取代基R、R′、R″和R″′优选地独立地选自氢、取代的或未取代的烷基、取代的或未取代的杂烷基、取代的或未取代的环烷基、取代的或未取代的杂环烷基、取代的或未取代的芳基和取代的或未取代的杂芳基。

如本文所用，术语″杂原子″或″环杂原子″意在包括氧(O)、氮(N)、硫(S)、磷(P)和硅(Si)。

如本文所用，″取代基基团″是指选自以下部分的基团：(A)氧代、卤素、-CCl₃、-CBr₃、-CF₃、-CI₃、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC(O)NHNH₂、-NHC(O)NH₂、-NHSO₂H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl₃、-OCF₃、-OCBr₃、-OCI₃、-OCHCl₂、-OCHBr₂、-OCHI₂、-OCHF₂、未取代的烷基(例如，C₁-C₈烷基、C₁-C₆烷基或C₁-C₄烷基)、未取代的杂烷基(例如，2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未取代的环烷基(例如，C₃-C₈环烷基，C₃-C₆环烷基或C₅-C₆环烷基)、未取代的杂环烷基(例如，3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未取代的芳基(例如，C₆-C₁₀芳基、C₁₀芳基或苯基)、或未取代的杂芳基(例如，5至10元杂芳基、5至9元杂芳基或5至6元杂芳基)，以及(B)被至少一个选自以下的取代基取代的烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基：(i)氧代、卤素、-CCl₃、-CBr₃、-CF₃、-CI₃、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC(O)NHNH₂、-NHC(O)NH₂、-NHSO₂H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl₃、-OCF₃、-OCBr₃、-OCI₃、-OCHCl₂、-OCHBr₂、-OCHI₂、-OCHF₂、未取代的烷基(例如，C₁-C₈烷基，C₁-C₆烷基或C₁-C₄烷基)、未取代的杂烷基(例如，2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未取代的环烷基(例如，C₃-C₈环烷基、C₃-C₆环烷基或C₅-C₆环烷基)、未取代的杂环烷基(例如，3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未取代的芳基(例如，C₆-C₁₀芳基、C₁₀芳基或苯基)、或未取代的杂芳基(例如，5至10元杂芳基、5至9元杂芳基或5至6元杂芳基)，以及(ii)被至少一个选自以下的取代基取代的烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基：(a)氧代、卤素、-CCl₃、-CBr₃、-CF₃、-CI₃、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC(O)NHNH₂、-NHC(O)NH₂、-NHSO₂H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl₃、-OCF₃、-OCBr₃、-OCI₃、-OCHCl₂、-OCHBr₂、-OCHI₂、-OCHF₂、未取代的烷基(例如，C₁-C₈烷基，C₁-C₆烷基或C₁-C₄烷基)、未取代的杂烷基(例如，2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未取代的环烷基(例如，C₃-C₈环烷基、C₃-C₆环烷基或C₅-C₆环烷基)、未取代的杂环烷基(例如，3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未取代的芳基(例如，C₆-C₁₀芳基、C₁₀芳基或苯基)、或未取代的杂芳基(例如，5至10元杂芳基、5至9元杂芳基或5至6元杂芳基)，以及(b)被至少一个选自以下的取代基取代的烷基、杂烷基、环烷基、杂环烷基、芳基、杂芳基：氧代、卤素、-CCl₃、-CBr₃、-CF₃、-CI₃、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC(O)NHNH₂、-NHC(O)NH₂、-NHSO₂H、-NHC(O)H、-NHC(O)OH、-NHOH、-OCCl₃、-OCF₃、-OCBr₃、-OCI₃、-OCHCl₂、-OCHBr₂、-OCHI₂、-OCHF₂、未取代的烷基(例如，C₁-C₈烷基，C₁-C₆烷基或C₁-C₄烷基)、未取代的杂烷基(例如，2至8元杂烷基、2至6元杂烷基或2至4元杂烷基)、未取代的环烷基(例如，C₃-C₈环烷基、C₃-C₆环烷基或C₅-C₆环烷基)、未取代的杂环烷基(例如，3至8元杂环烷基、3至6元杂环烷基或5至6元杂环烷基)、未取代的芳基(例如，C₆-C₁₀芳基、C₁₀芳基或苯基)、或未取代的杂芳基(例如，5至10元杂芳基、5至9元杂芳基或5至6元杂芳基)。

如本文所用，″大小受限的取代基″或″大小受限的取代基″意指选自上文针对″取代基″描述的所有取代基的基团，其中每个取代或未取代的烷基是取代或未取代的C₁-C₂₀烷基，每个取代或未取代的杂烷基是取代或未取代的2至20元杂烷基，每个取代或未取代的环烷基是取代或未取代的C₃-C₈环烷基，每个取代或未取代的杂环烷基是取代或未取代的3至8元杂环烷基，每个取代或未取代的芳基是取代或未取代的C₆-C₁₀芳基，并且每个取代或未取代的杂芳基是取代或未取代的5至10元杂芳基。

如本文所用，″低级取代基″意指选自上文针对″取代基″所描述的所有取代基的基团，其中每个取代或未取代的烷基是取代或未取代的C₁-C₈烷基，每个取代或未取代的杂烷基是取代或未取代的2至8元杂烷基，每个取代或未取代的环烷基是取代或未取代的C₃-C₇环烷基，每个取代或未取代的杂环烷基是取代或未取代的3至7元杂环烷基，每个取代或未取代的芳基是取代或未取代的C₆-C₁₀芳基，并且每个取代或未取代的杂芳基是取代或未取代的5至9元杂芳基。

在实施方案中，本文化合物中所述的每个取代的基团被至少一个取代基取代。更具体地说，在各方面，本文化合物中所述的每一被取代的烷基、被取代的杂烷基、被取代的环烷基、被取代的杂环烷基、被取代的芳基、被取代的杂芳基、被取代的亚烷基、被取代的亚杂烷基、被取代的亚环烷基、被取代的亚杂环烷基、被取代的亚芳基和/或被取代的亚杂芳基，被至少一个取代基取代。在多个方面，这些基团中的至少一个或全部被至少一个尺寸受限的取代基取代。在多个方面，这些基团中的至少一个或全部被至少一个低级取代基取代。

在本文化合物的实施方案中，每个取代或未取代的烷基可以是取代或未取代的C₁-C₂₀烷基，每个取代或未取代的杂烷基是取代或未取代的2至20元杂烷基，每个取代或未取代的环烷基是取代或未取代的C₃-C₈环烷基，每个取代或未取代的杂环烷基是取代或未取代的3至8元杂环烷基，每个取代或未取代的芳基是取代或未取代的C₆-C₁₀芳基，和/或每个取代或未取代的杂芳基是取代或未取代的5至10元杂芳基。在本文化合物的方面中，每一被取代或未被取代的亚烷基是被取代或未被取代的C₁-C₂₀亚烷基，每一被取代或未被取代的亚杂烷基是被取代或未被取代的2到20元亚杂烷基，每一被取代或未被取代的亚环烷基是被取代或未被取代的C₃-C₈亚环烷基，每一被取代或未被取代的亚杂环烷基是被取代或未被取代的3到8元亚杂环烷基，每一被取代或未被取代的亚芳基是被取代或未被取代的C₆-C₁₀亚芳基，和/或每一被取代或未被取代的亚杂芳基是被取代或未被取代的5到10元亚杂芳基。

在实施方案中，每个经取代或未经取代的烷基可以是经取代或未经取代的C₁-C₈烷基，每个经取代或未经取代的杂烷基是经取代或未经取代的2元到8元杂烷基，每个经取代或未经取代的环烷基是经取代或未经取代的C₃-C₇环烷基，每个经取代或未经取代的杂环烷基是经取代或未经取代的3元到7元杂环烷基，每个经取代或未经取代的芳基是经取代或未经取代的C₆-C₁₀芳基和/或每个经取代或未经取代的杂芳基是经取代或未经取代的5元到9元杂芳基。在方面中，每个取代的或未取代的亚烷基是取代的或未取代的C₁-C₈亚烷基，每个取代的或未取代的亚杂烷基是取代的或未取代的2至8元亚杂烷基，每个取代的或未取代的亚环烷基是取代的或未取代的C₃-C₇亚环烷基，每个取代的或未取代的亚杂环烷基是取代的或未取代的3至7元亚杂环烷基，每个取代的或未取代的亚芳基是取代的或未取代的C₆-C₁₀亚芳基，和/或每个取代的或未取代的亚杂芳基是取代的或未取代的5至9元亚杂芳基。

在实施方案中，经取代或未取代的部分(例如，经取代或未取代的烷基、经取代或未取代的杂烷基、经取代或未取代的环烷基、经取代或未取代的杂环烷基、经取代或未取代的芳基、经取代或未取代的杂芳基、经取代或未取代的亚烷基、经取代或未取代的亚杂烷基、经取代或未取代的亚环烷基、经取代或未取代的亚杂环烷基、经取代或未取代的亚芳基和/或经取代或未取代的亚杂芳基)是未取代的(例如，分别为未取代的烷基、未取代的杂烷基、未取代的环烷基、未取代的杂环烷基、未取代的芳基、未取代的杂芳基、未取代的亚烷基、未取代的亚杂烷基、未取代的亚环烷基、未取代的亚杂环烷基、未取代的亚芳基和/或未取代的亚杂烷基)。在各方面，被取代或未被取代的部分(例如，被取代或未被取代的烷基、被取代或未被取代的杂烷基、被取代或未被取代的环烷基、被取代或未被取代的杂环烷基、被取代或未被取代的芳基、被取代或未被取代的杂芳基、被取代或未被取代的亚烷基、被取代或未被取代的亚杂烷基、被取代或未被取代的亚环烷基、被取代或未被取代的亚杂环烷基、被取代或未被取代的亚芳基和/或被取代或未被取代的亚杂芳基)是被取代的(例如，分别是被取代的烷基、被取代的杂烷基、被取代的环烷基、被取代的杂环烷基、被取代的芳基、被取代的杂芳基、被取代的亚烷基、被取代的亚杂烷基、被取代的亚环烷基、被取代的亚杂环烷基、被取代的亚芳基和/或被取代的亚杂芳基)。

在实施方案中，经取代的部分(例如，经取代的烷基、经取代的杂烷基、经取代的环烷基、经取代的杂环烷基、经取代的芳基、经取代的杂芳基、经取代的亚烷基、经取代的亚杂烷基、经取代的亚环烷基、经取代的亚杂环烷基、经取代的亚芳基和/或经取代的亚杂芳基)被至少一个取代基取代，其中如果经取代的部分被多个取代基取代，则每个取代基可以任选地不同。在多个方面，如果经取代的部分被多个取代基取代，则每个取代基是不同的。

在实施方案中，取代的部分(例如，取代的烷基、取代的杂烷基、取代的环烷基、取代的杂环烷基、取代的芳基、取代的杂芳基、取代的亚烷基、取代的亚杂烷基、取代的亚环烷基、取代的亚杂环烷基、取代的亚芳基和/或取代的亚杂芳基)被至少一个大小受限的取代基取代，其中如果取代的部分被多个大小受限的取代基取代，则每个大小受限的取代基可以任选地不同。在多个方面，如果经取代的部分被多个大小受限的取代基取代，则每个大小限制的取代基是不同的。

在实施方案中，取代的部分(例如，取代的烷基、取代的杂烷基、取代的环烷基、取代的杂环烷基、取代的芳基、取代的杂芳基、取代的亚烷基、取代的亚杂烷基、取代的亚环烷基、取代的亚杂环烷基、取代的亚芳基和/或取代的亚杂芳基)被至少一个低级取代基取代，其中如果取代的部分被多个低级取代基取代，则每个低级取代基可以任选地不同。在多个方面，如果经取代的部分被多个低级取代基取代，则每个低级取代基是不同的。

在实施方案中，取代的部分(例如，取代的烷基、取代的杂烷基、取代的环烷基、取代的杂环烷基、取代的芳基、取代的杂芳基、取代的亚烷基、取代的亚杂烷基、取代的亚环烷基、取代的亚杂环烷基、取代的亚芳基和/或取代的亚杂芳基)被至少一个取代基、大小受限的取代基或低级取代基取代；其中如果取代的部分被选自取代基、大小受限的取代基或低级取代基的多个基团取代；则每个取代基、大小受限的取代基和/或低级取代基可任选地不同。在方面中，如果取代的部分被选自取代基、大小受限的取代基或低级取代基的多个基团取代；则每个取代基、大小受限的取代基和/或低级取代基不同。

本公开的某些化合物具有不对称碳原子(光学或手性中心)或双键；在绝对立体化学方面可定义为氨基酸的(R)-或(S)-或者定义为(D)-或(L)-的对映异构体、外消旋体、非对映异构体、互变异构体、几何异构体、立体异构形式，并且各个异构体包括在本公开的范围内。本公开的化合物不包括本领域中已知的太不稳定而无法进行合成和/或分离的化合物。本公开旨在包括呈外消旋形式和光学纯形式的化合物。光学活性(R)-和(S)-或(D)-和(L)-异构体可以使用手性合成子或手性试剂来制备，或使用常规技术来解析。当本文所述的化合物含有烯烃键或几何不对称的其他中心时，并且除非另外指明，否则意图是这些化合物包含E几何异构体和Z几何异构体两者。

如本文所用，术语″异构体″是指具有相同数量和种类的原子因此具有相同分子量但结构排列或原子构型不同的化合物。

如本文所用的术语″互变异构体″是指以平衡状态存在并且容易由一种异构形式转化为另一种异构形式的两种或更多种结构异构体中的一种。

对于本领域的技术人员将显而易见的是，本公开的某些化合物可以互变异构形式存在，所述化合物的所有此类互变异构形式均在本公开的范围内。

除非另外说明，否则本文所描绘的结构还意在包括该结构的所有立体化学形式；即，每个不对称中心的R和3构型。因此，本发明化合物的单一立体化学异构体以及对映体混合物和非对映体混合物均处于本公开的范围内。

除非另外说明，否则本文描绘的结构还旨在包含仅在一或多个同位素富集的原子是否存在方面不同的化合物。例如，具有除了由氘或氚替换氢或由¹³C-富集的或¹⁴C-富集的碳替换碳之外的本发明结构的化合物处于本公开的范围内。

本公开的化合物还可以在构成这种化合物的一个或多个原子上含有非天然比例的原子同位素。例如，化合物可以用例如氚(³H)、碘-125(¹²⁵I)或碳-14(¹⁴C)等放射性同位素进行放射性标记。本公开的化合物的所有同位素变化(不论是放射性的还是非放射性的)均涵盖在本公开的范围内。

应注意，在整个申请中，替代方案书写在Markush基团中，例如含有多于一个可能氨基酸的每个氨基酸位置中。特别设想了，马库什组的每个成员应单独考虑，由此包括另一个实施方案，并且马库什组不应被理解为单一单位。

″类似物″是根据其在化学和生物学内的普通一般含义使用的，并且是指例如在一个原子被不同元素的原子替换中，或在特定官能团存在的情况下，或一个官能团被另一个官能团替换中，或参考化合物的一个或多个手性中心的绝对立体化学中，与另一化合物(即，所谓的″参考″化合物)在结构上类似但在组成上不同的化合物。因此，类似物是与参考化合物在功能和外观上类似或相当，但在结构或来源上不类似或不相当的化合物。

如本文中所使用的术语″一个/种″意指一个或多个。另外，如本文所用，短语″被......取代″意指指定基团可以被所指名的取代基中的任何或全部取代基中的一个或多个取代。例如，在如烷基或杂芳基等基团″被未经取代的C₁-C₂₀烷基或未经取代的2元至20元杂烷基取代″的情况下，该基团可以含有一个或多个未经取代的C₁-C₂₀烷基，和/或一个或多个经取代的2元至20元杂烷基。

在某一部分被R取代基取代的情况下，该基团可被称为″R-取代的″。当某一部分是R-取代的时，该部分被至少一个R取代基取代，并且每个R取代基任选地不同。当在化学种类(例如式(I))的描述中存在特定R基团时，可以使用罗马字母符号来区分该特定R基团的每种外观。例如，在存在多个R¹³取代基的情况下，每个R¹³取代基可以被区分为R^13A、R^13B、R^13C、R^13D等，其中R^13A、R^13B、R^13C、R^13D等中的每一个均在R¹³的定义范围内定义并且任选地不同。

″可检测剂″或″可检测部分″是可通过适当手段例如光谱、光化学、生物化学、免疫化学、化学、磁共振成像或其他物理手段检测的组分。例如，有用的可检测剂包括¹⁸F、²²P、³³P、⁴⁵Ti、⁴⁷Sc、⁵²Fe、⁵⁹Fe、⁶²Cu、⁶⁴Cu、⁶⁷Cu、⁶⁷Ga、⁶⁸Ga、⁷⁷As、⁸⁶Y、⁹⁰Y、⁸⁹Sr、⁸⁹Zr、⁹⁴Tc、⁹⁴Tc、^99mTc、⁹⁹Mo、¹⁰⁵Pd、¹⁰⁵Rh、¹¹¹Ag、¹¹¹In、¹²³I、¹²⁴I、¹²⁵I、¹³¹I、¹⁴²pr、¹⁴³Pr、¹⁴⁹Pm、¹⁵³Sm、^154-1581Gd、¹⁶¹Tb、¹⁶⁶Dy、¹⁶⁶Ho、¹⁶⁹Er、¹⁷⁵Lu、¹⁷⁷Lu、¹⁸⁶Re、¹⁸⁸Re、¹⁸⁹Re、¹⁹⁴Ir、¹⁹⁸Au、¹⁹⁹Au、²¹¹At、²¹¹Pb、²¹²Bi、²¹²Pb、²¹³Bi、²²³Ra、²²⁵Ac、Cr、V、Mn、Fe、Co、Ni、Cu、La、Ce、Pr、Nd、Pm、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu、³²P、荧光团(例如，荧光染料)、电子致密试剂、酶(例如，如ELISA中常用的)、生物素、洋地黄毒苷、顺磁分子、顺磁纳米颗粒、超小型超顺磁氧化铁(″USPIO″)纳米颗粒、USPIO纳米颗粒聚集体、超顺磁铁氧化物(″SPIO″)纳米颗粒、SPIO纳米颗粒聚集体、单晶氧化铁纳米颗粒、单晶体氧化铁、纳米颗粒造影剂、脂质体或含有钆螯合物(″Gd-螯合物″)分子的其他递送载体、钆、放射性同位素、放射性核素(例如，碳-11、氮-13、氧-15、氟-18、铷-82)、氟脱氧葡萄糖(例如，氟-18标记的)、任何发射γ射线的放射性核素、发射正电子的放射性核素、放射性标记的葡萄糖、放射性标记的水、放射性标记的氨、生物胶体、微气泡(例如，包括微泡壳，包括白蛋白、半乳糖、脂质和/或聚合物；微气泡气芯，包括空气、重气体、全氟碳、氮气、八氟丙烷、全氟丙烷脂质微球、全氟醚等)、碘化造影剂(例如，碘海醇、碘克沙醇、碘佛醇、碘帕醇、碘普兰、碘普罗胺、泛影酸盐、甲泛影酸、碘克酸)、硫酸钡、二氧化钍、金、金纳米颗粒、金纳米颗粒聚集体、荧光团、双光子荧光团或半抗原和蛋白质或者可以例如通过将放射性标记掺入与靶标肽特异性反应的肽或抗体而被检测到的其他实体。可检测部分是单价可检测剂或能够与另一种组合物形成键的可检测剂。

可用作根据本公开的实施方案的成像和/或标记剂的放射性物质(例如，放射性同位素)包含但不限于¹⁸F、³²P、³³P、⁴⁵Ti、⁴⁷Sc、⁵²Fe、⁵⁹Fe、⁶²Cu、⁶⁴Cu、⁶⁷Cu、⁶⁷Ga、⁶⁸Ga、⁷⁷As、⁸⁶Y、⁹⁰Y、⁸⁹Sr、⁸⁹Zr、⁹⁴Tc、⁹⁴Tc、^99mTc、⁹⁹Mo、¹⁰⁵Pd、¹⁰⁵Rh、¹¹¹Ag、¹¹¹In、¹²³I、¹²⁴I、¹²⁵I、¹³¹I、¹⁴²Pr、¹⁴³Pr、¹⁴⁹Pm、¹⁵³Sm、^154-1581Gd、¹⁶¹Tb、¹⁶⁶Dy、¹⁶⁶Ho、¹⁶⁹Er、¹⁷⁵Lu、¹⁷⁷Lu、¹⁸⁶Re、¹⁸⁸Re、¹⁸⁹Re、¹⁹⁴Ir、¹⁹⁸Au、¹⁹⁹Au、²¹¹At、²¹¹Pb、²¹²Bi、²¹²Pb、²¹³Bi、²²³Ra和²²⁵Ac。可用作根据本公开的实施方案的另外的成像剂的顺磁性离子包含但不限于过渡金属和镧系金属(例如，原子序数为21-29、42、43、44或57-71的金属)的离子。

对本公开化合物的描述受本领域技术人员已知的化学键合原理的限制。因此，在基团可以被多个取代基中的一个或多个取代的情况下，选择此类取代以便符合化学键合原理并且得到并非固有地不稳定和/或如本领域普通技术人员已知的将可能在环境条件下(如水性、中性和几种已知的生理条件下)不稳定的化合物。例如，杂环烷基或杂芳基，按照本领域技术人员已知的化学键合原理，通过环杂原子与分子的其余部分连接，由此避免固有地不稳定的化合物。

本领域普通技术人员将理解，当化合物或化合物属(例如，本文所述的属)的变量(例如，部分或接头)通过具有所有填充的化合价的独立化合物的名称或分子式描述时，变量的一个或多个未填充化合价将由使用该变量的上下文决定。举例来说，当本文所描述的化合物的变量通过单键连接(例如，键结)到化合物的其余部分时，所述变量应被理解为表示独立化合物的单价形式(即，由于未填充的化合价而能够形成单键)(例如，在一个实施方案中，如果变量被命名为″甲烷″，但是已知所述变量通过单键连接至化合物的其余部分，则本领域普通技术人员将理解，所述变量实际上是甲烷的单价形式，即甲基或-CH₃)。同样，对于连接子变量(例如，如本文所描述的L¹、L²或L³)，本领域普通技术人员将理解，所述变量是独立化合物的二价形式(例如，在实施方案中，如果变量被指定为″PEG"或″聚乙二醇″，但所述变量通过两个单独的键连接至化合物的其余部分，则本领域普通技术人员将理解，所述变量是PEG的二价形式(即，能够通过两个未填充的化合价形成两个键)，而不是独立化合物PEG)。

″核酸″是指单链、双链或多链形式的核苷酸(例如，脱氧核糖核苷酸或核糖核苷酸)以及它们的聚合物，或者它们的互补物。术语″多核苷酸″、″寡核苷酸″等在通常和习惯意义上是指核苷酸的线性序列。术语″核苷酸″在通常和习惯意义上是指多核苷酸的单个单元，即，单体。核苷酸可以是核糖核苷酸、脱氧核糖核苷酸或其修饰形式。本文所设想的多核苷酸的示例包含单链和双链DNA、单链和双链RNA以及具有单链和双链DNA和RNA的混合物的杂合分子。核酸的实例，例如本文所涵盖的多核苷酸包括任何类型的RNA(例如mRNA、siRNA、miRNA和向导RNA)以及任何类型的DNA、基因组DNA、质粒DNA和小环DNA，和其任何片段。在多核苷酸的情况下，术语″双链体″在通常和惯用意义上是指双链。核酸可以是直链或支链。例如，核酸可以是线性核苷酸链或核酸可以是分支的，例如由此使核酸包含一个或多个核苷酸的臂或分支。任选地，支链核酸重复分支以形成更高级结构，如树状物等。

核酸，包含例如具有硫代磷酸酯主链的核酸，可以包含一个或多个反应性部分。如本文所使用的，术语反应性部分包含能够通过共价、非共价或其它相互作用与另一分子(例如，核酸或多肽)反应的任何基团。举例来说，核酸可以包含通过共价、非共价或其它相互作用与蛋白质或多肽上的氨基酸反应的氨基酸反应性部分。

所述术语还涵盖含有已知核苷酸类似物或经过修饰的主链残基或连接的核酸，所述核酸是合成的、天然存在的和非天然存在的，所述核酸具有与参考核酸类似的结合性质并且所述核酸以与参考核苷酸类似的方式代谢。此类类似物的示例包括但不限于磷酸二酯衍生物，所述磷酸二酯衍生物包括例如氨基磷酸酯、二氨基磷酸酯、硫代磷酸酯(也被称为硫代磷酸酯，其具有置换磷酸酯中氧的双键硫)、二硫代磷酸酯、膦酰羧酸、膦酰羧酸酯、膦酰乙酸、膦酰甲酸、甲基膦酸酯、硼膦酸酯或O-甲基氨基磷酸酯连键(参见Eckstein，Oligonucleotides and Analogues：A Practical Approach，Oxford University Press)，以及如在5-甲基胞苷或假尿苷中对核苷酸碱基的修饰；以及肽核酸骨架和连键。其他类似物核酸包括具有以下项的类似物核酸：正主链；非离子主链、修饰的糖和非核糖主链(例如，本领域已知的磷酰二胺吗啉代寡核苷酸或锁核酸(LNA))，包括美国专利号5,235,033和5,034,506以及ASC Symposium Series 580，第6章和第7章，Carbohydrate Modificationsin Antisense Research，Sanghui&Cook编辑中所述的主链。含一个或多个碳环糖的核酸也包括在核酸的一个定义中。出于多种原因，可以进行核糖-磷酸骨架的修饰，例如，增加此类分子在生理环境中，或作为生物芯片上的探针的稳定性和半衰期。可以制备天然存在的核酸和类似物的混合物；另选地，可制备不同核酸类似物的混合物以及天然存在的核酸和类似物的混合物。在各方面中，DNA中的核苷酸间键联是磷酸二酯、磷酸二酯衍生物或两者的组合。

核酸可以包含非特异性序列。如本文中所使用的，术语″非特异性序列″是指含有未被设计成与任何其他核酸序列互补或与任何其他核酸序列仅部分互补的一系列残基的核酸序列。举例来说，非特异性核酸序列是当与细胞或有机体接触时不起抑制性核酸作用的核酸残基的序列。

多核苷酸通常由四个核苷酸碱基的特定序列组成：腺嘌呤(A)；胞嘧啶(C)；鸟嘌呤(G)；以及胸腺嘧啶(T)(当多核苷酸是RNA时，尿嘧啶(U)代表胸腺嘧啶(T))。因此，术语″多核苷酸序列″是多核苷酸分子的字母表示；另选地，该术语可应用于多核苷酸分子本身。这一字母表示形式可以输入到具有中央处理单元的计算机中的数据库中，并用于生物信息学应用，诸如功能基因组学和同源性搜索。多核苷酸可任选地包括一个或多个非标准核苷酸、核苷酸类似物和/或修饰的核苷酸。

如本文所用，术语″补体″是指能够与互补核苷酸或核苷酸序列进行碱基配对的核苷酸(例如，RNA或DNA)或核苷酸序列。如本文所描述的和本领域公知的，腺苷的互补(匹配)核苷酸是胸苷，并且鸟嘌呤的互补(匹配)核苷酸是胞嘧啶。因此，补体可包括与第二核酸序列的对应互补核苷酸碱基配对的核苷酸序列。补体的核苷酸可与第二核酸序列的核苷酸部分或完全地匹配。当补体的核苷酸与第二核酸序列的每个核苷酸完全匹配时，补体与第二核酸序列的每个核苷酸形成碱基对。当补体的核苷酸与第二核酸序列的核苷酸部分匹配时，仅补体的一些核苷酸与第二核酸序列的核苷酸形成碱基对。互补序列的实例包括编码和非编码序列，其中非编码序列含有编码序列的互补核苷酸，由此形成编码序列的补体。互补序列的另一个实例是有义序列和反义序列，其中有义序列含有反义序列的互补核苷酸，由此形成反义序列的补体。

如本文所述，序列的互补可以是部分的，其中仅一些核酸根据碱基配对匹配，或是完全的，其中所有核酸根据碱基配对匹配。因此，彼此互补的两个序列可具有指定百分比的相同核苷酸(即，在指定区域内具有约60％同一性，优选地65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性)。

术语″氨基酸″是指天然存在的和合成的氨基酸，以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些氨基酸，以及之后经修饰的那些氨基酸，例如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指基本化学结构与天然存在的氨基酸(即，与氢、羧基、氨基以及R基团结合的α碳)相同的化合物，例如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这种类似物具有被修饰的R基团(例如，正亮氨酸)或被修饰的肽主链，但基本化学结构保持与天然存在的氨基酸相同。氨基酸模拟物是指结构不同于氨基酸的一般化学结构但以与天然存在的氨基酸类似的方式起作用的化合物。术语″非天然存在的氨基酸″和″非天然氨基酸″是指自然界中未发现的氨基酸类似物、合成氨基酸和氨基酸模拟物。

氨基酸在本文中可以通过它们通常已知的三个字母符号或通过IUPAC-IUB生化命名委员会推荐的单字母符号来指代。核苷酸可以通过其普遍接受的单字母代码来表示。

术语″氨基酸侧链″是指氨基酸上含有的功能性取代基。例如，氨基酸侧链可以是天然存在的氨基酸的侧链。天然存在的氨基酸是由遗传密码编码的氨基酸(例如丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸)、以及之后被修饰的氨基酸，例如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。在各方面，氨基酸侧链可以是非天然氨基酸侧链。在各方面，氨基酸侧链是H、

在实施方案中，非天然氨基酸侧链为

术语″非天然氨基酸侧链″或″Uaa″是指具有与天然存在的氨基酸相同的基本化学结构的化合物的功能性取代基，即，与氢、羧基、氨基和R基团结合的α碳，例如，高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍、烯丙基丙氨酸、2-氨基丁酸。非天然氨基酸是天然存在的或化学合成的非蛋白质氨基酸。这种类似物具有被修饰的R基团(例如，正亮氨酸)或被修饰的肽主链，但基本化学结构保持与天然存在的氨基酸相同。非限制性示例包括外-顺-3-氨基双环[2.2.1]庚-5-烯-2-甲酸盐酸、顺-2-氨基环庚烷甲酸盐酸盐、顺-6-氨基-3-环己烯-1-甲酸盐酸盐、顺-2-氨基-2-甲基环己烷甲酸盐酸盐、顺-2-氨基-2-甲基环戊烷甲酸盐酸盐、2-(Boc-氨基甲基)苯甲酸、2-(Boc-氨基)辛二酸、Boc-4，5-脱氢-Leu-OH(二环己基铵盐)、Boc-4-(Fmoc-氨基)-L-苯丙氨酸、Boc-β-Homopyr-OH、Boc-(2-茚满基)-Gly-OH、4-Boc-3-吗啉乙酸、4-Boc-3-吗啉乙酸、Boc-五氟-D-苯丙氨酸、Boc-五氟-L-苯丙氨酸、Boc-Phe(2-Br)-OH、Boc-Phe(4-Br)-OH、Boc-D-Phe(4-Br)-OH、Boc-D-Phe(3-Cl)-OH、Boc-Phe(4-NH2)-OH、Boc-Phe(3-NO2)-OH、Boc-Phe(3，5-F2)-OH、2-(4-Boc-哌嗪代)-2-(3，4-二甲氧基苯基)乙酸purum、2-(4-Boc-哌嗪代)-2-(2-氟苯基)乙酸purum、2-(4-Boc-哌嗪)-2-(3-氟苯基)乙酸purum、2-(4-Boc-哌嗪代)-2-(4-氟苯基)乙酸purum、2-(4-Boc-哌嗪代)-2-(4-甲氧基苯基)乙酸purum、2-(4-Boc-哌嗪代)-2-苯乙酸purum、2-(4-Boc-哌嗪代)-2-(3-吡啶基)乙酸pumm、2-(4-Boc-哌嗪代)-2-[4-(三氟甲基)苯基]乙酸purum、Boc-β-(2-喹啉基)-Ala-OH、N-Boc-1，2，3，6-四氢-2-吡啶甲酸、Boc-β-(4-噻唑基)-Ala-OH、Boc-β-(2-噻吩基)-D-Ala-OH、Fmoc-N-(4-Boc-氨基丁基)-Gly-OH、Fmoc-N-(2-Boc-氨基乙基)-Gly-OH、Fmoc-N-(2，4-二甲氧基苯甲基)-Gly-OH、Fmoc-(2-茚满基)-Gly-OH、Fmoc-五氟-L-苯丙氨酸、Fmoc-Pen(Trt)-OH、Fmoc-Phe(2-Br)-OH、Fmoc-Phe(4-Br)-OH、Fmoc-Phe(3，5-F2)-OH、Fmoc-β-(4-噻唑基)-Ala-OH、Fmoc-β-(2-噻吩基)-Ala-OH、4-(羟甲基)-D-苯丙氨酸。在实施方案中，非天然氨基酸是具有下式的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

″保守修饰的变体″适用于氨基酸和核酸序列。关于特定的核酸序列，″保守修饰的变体″是指编码相同或基本相同的氨基酸序列的那些核酸。由于遗传密码的简并性，许多核酸序列将编码任何给定的蛋白质。例如，密码子GCA、GCC、GCG和GCU均对氨基酸丙氨酸进行编码。因此，在由密码子指定丙氨酸的每个位置，可以将密码子改变为所描述的任何相应密码子，而不会改变编码的多肽。此类核酸变异是″沉默变异″，其是保守修饰的变异的一种。本文中编码多肽的每个核酸序列也描述了核酸的每种可能的沉默变异。技术人员将认识到，核酸中的每个密码子(除通常为甲硫氨酸的唯一密码子的AUG和通常为色氨酸的唯一密码子TGG外)均可以进行修饰以得到功能上相同的分子。因此，编码多肽的核酸的每种沉默变异均隐含在每个描述的序列中。

关于氨基酸序列，本领域技术人员将认识到，改变、添加或缺失编码序列中的单个氨基酸或一小部分氨基酸的核酸、肽、多肽或蛋白质序列的单个取代、缺失或添加是″保守修饰的变体″，其中改变导致氨基酸被化学上相似的氨基酸取代。提供功能上类似的氨基酸的保守取代表在本领域中是众所周知的。此类保守修饰的变体是本公开的多晶型变体、种间同源物和等位基因的补充，并且不排除所述多晶型变体、种间同源物和等位基因。

以下八个组中的每个都包含彼此保守取代的氨基酸：(1)丙氨酸(A)、甘氨酸(G)；(2)天冬氨酸(D)、谷氨酸(E)；(3)天冬酰胺(N)、谷氨酰胺(Q)；(4)精氨酸(R)、赖氨酸(K)；(5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V)；(6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)；(7)丝氨酸(S)、苏氨酸(T)；(8)半胱氨酸(C)、甲硫氨酸(M)。(参见例如Creighton，Proteins(1984))。

术语″多肽″、″肽″和″蛋白质″在本文中可互换地使用以指代氨基酸残基的聚合物，其中所述聚合物在实施方案中可以与不由氨基酸组成的部分缀合。该术语适用于其中一个或多个氨基酸残基是对应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物，以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。″融合蛋白″是指编码重组表达为单个部分的两个或更多个单独蛋白质序列的嵌合蛋白质。

氨基酸或核苷酸碱基的″位置″通过数字表示，该数字在参考序列中根据其相对于N端(或5′端)的位置来顺序识别每个氨基酸(或核苷酸碱基)。由于在确定最佳比对时必须考虑缺失、插入、截短、融合等，故通常测试序列中的通过仅从N-末端进行计数而确定的氨基酸残基的编号不一定与其在参考序列中的对应位置的编号相同。例如，在其中变体相对于比对的参考序列具有缺失的情况下，变体中将不存在与参考序列中的缺失位点处的位置相对应的氨基酸。在比对的参考序列中有插入的情况下，该插入将不对应于参考序列中的编号的氨基酸位置。在截短或融合的情况下，参考序列或比对序列中可能存在不对应于相应序列中任何氨基酸的氨基酸段。

当在给定氨基酸或多核苷酸序列的编号的上下文中使用时，术语″参考...编号″或″对应于″是指当将给定氨基酸或多核苷酸序列与参考序列进行比较时，给定参考序列的残基的编号。

当蛋白质中的氨基酸残基在蛋白质中与给定残基占据相同的基本结构位置时，它″对应″于给定残基。例如，当选定的残基占据与SEQ ID NO：1的PylRS蛋白质中的Tyr126相同的必要空间或其他结构关系时，选定蛋白质中的该选定的残基对应于SEQ ID NO：1的PylRS蛋白质的Tyr126。在将所选蛋白质与PylRS蛋白进行最大同源性比对的一些实施方案中，所比对的所选蛋白质中与Tyr126比对的位置称为对应于Tyr126。代替一级序列比对，也可以使用三维结构比对，例如，其中将所选蛋白质的结构与PylRS蛋白进行最大对应性比对，并且比较整体结构。在这种情况下，在结构模型中占据与Tyr126相同的基本位置的氨基酸被认为对应于Tyr126残基。

通过在比较窗中比较两个最佳比对的序列来确定″序列同一性的百分比″，其中对于两个序列的最佳比对，与参考序列(其不包含添加或缺失)相比，比较窗中的多核苷酸或多肽序列的部分可以包括添加或缺失(即缺口)。百分比通过以下计算：确定两个序列中出现相同核酸碱基或氨基酸残基的位置数以得到匹配的位置数，将匹配的位置数除以比较窗口中的总位置数并且将结果乘以100以得到序列同一性百分比。

在两个或更多个核酸或多肽序列的上下文中，术语″相同″或″同一性″百分比是指如使用利用以下描述的默认参数的BLAST或BLAST 2.0序列比较算法或通过手动比对和视觉检查测量的相同的或具有指定百分比的氨基酸残基的两个或更多个序列或相同的核苷酸(即，当在比较窗口或指定区域之上针对最大对应性进行比较和比对时，在指定区域之上的约60％同一性，优选地65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的同一性)(例如，ncbi.nlm.nih.gov/BLAST/等)。此类序列然后被称为″基本上相同的″。该定义也指或可适用于测试序列的互补序列。所述定义还包括具有缺失和/或添加的序列，以及具有取代的序列。如下所述，优选的算法可以解释空位等。在实施方案中，在长度为至少约25个氨基酸或核苷酸的区域上，或更优选地在长度为50-100个氨基酸或核苷酸的区域上存在同一性。

根据其在通常已知的含义使用术语″抗体″。抗体例如以完整的免疫球蛋白形式存在或以各种肽酶消化产生的许多充分表征的片段形式存在。因此，例如，胃蛋白酶消化铰链区中二硫键下方的抗体以产生F(ab)′₂，其为Fab的二聚体，本身是通过二硫键与V_H-C_H1连接的轻链。F(ab)′₂可以在温和的条件下还原以破坏铰链区中的二硫键，从而将F(ab)′₂二聚体转化为Fab′单体。Fab′单体基本上为具有铰链区的一部分的Fab(参见FundamentalImmunology(Pauled.，3d ed.1993))。尽管就完整抗体的消化而言定义了各种抗体片段，但是本领域技术人员将理解，可以化学方式或通过使用重组DNA方法从头合成此类片段。因此，如本文所使用的术语抗体还包括通过修饰完整抗体产生的抗体片段，或使用重组DNA方法从头合成的抗体片段(例如，单链Fv)或使用噬菌体展示文库识别的抗体片段(例如，McCafferty等人，Nature 348：552-554(1990))。

抗体是具有复杂内部结构的大的复杂蛋白质。天然抗体分子包括两对相同的多肽链，每对具有一条轻链和一条重链。每条轻链和重链继而由两个区域组成：与靶抗原结合的可变(″V″)区，和与免疫系统的其他组分相互作用的恒定(″C″)区。轻链和重链可变区在三维空间中结合在一起以形成结合抗原(例如，细胞表面上的受体)的可变区。在每个轻链或重链可变区内，有三个称之为互补性决定区(″CDR″)的短链段(平均长度为10个氨基酸)。抗体可变域中的六个CDRs(三个来自轻链，且三个来自重链)在3维空间中折叠在一起，以形成对接在靶抗原上的实际抗体结合位点。CDR的位置和长度已由Kabat等人，Sequences ofProteins of Immunological Interest，U.S.Department of Health and HumanServices，1987精确定义。CDRs中未包含的可变区部分称为框架(″FR″)，它形成了CDRs的环境。

示例性的免疫球蛋白(抗体)结构单元包含四聚体。每个四聚体由两对相同的多肽链组成，每对多肽链有一个″轻″(约25kd)链和一个″重″链(约50-70kd)。每条链的N末端限定了约100至110个或更多个氨基酸的可变区，其主要负责抗原识别。术语可变轻链(VL)和可变重链(VH)分别指代这些轻链和重链。Fc(即，片段可结晶区域)是免疫球蛋白的″基部″或″尾部″，并且通常由两条重链组成，该两条重链根据抗体的种类提供两个或三个恒定结构域。通过与特定蛋白质结合，Fc区域可确保每种抗体针对给定的抗原产生适当的免疫应答。Fc区域还与各种细胞受体(比如Fc受体)和其他免疫分子(诸如补体蛋白)结合。

如本文提供的″抗体变体″是指能够结合受体蛋白质或抗原并包括抗体或其片段的一个或多个结构域的多肽。抗体变体的非限制性示例包括单结构域抗体(纳米抗体)、亲和体(比单克隆抗体小(例如，约6kDA)并且能够以高亲和力结合受体蛋白质或抗原并模仿单克隆抗体)、抗原特异性片段(Fab)、Fab二聚体(单特异性Fab₂、双特异性Fab₂)、三特异性Fab₃、单价IgG、单链可变片段(scFv)、双特异性双抗体、三特异性三抗体、scFv-Fc、小抗体、IgNAR、V-NAR、hcIgG、VhH或肽抗体的多肽。如本文提供的″肽体″是指(通过共价或非共价接头)附接至抗体的Fc结构域的肽部分。本领域已知的抗体变体的其他非限制性实例包括由软骨鱼或骆驼科动物产生的抗体。骆驼科动物的抗体及其可变区及它们的产生、分离和使用方法的一般描述可在参考文献WO 97/49805和WO 97/49805中找到，通过引用将其整体并入本文中，并用于所有目的。同样，软骨鱼的抗体及其可变区及它们的产生、分离和使用的方法可在WO2005/118629中找到，通过引用将其整体并入本文中，并用于所有目的。

″单结构域抗体″或″纳米抗体″是指具有单个单体可变抗体结构域的抗体片段。像完整抗体一样，它能够选择性结合特定抗原。在实施方案中，单结构域抗体是人或人源化单结构域抗体。

单链可变片段(scFv)通常是利用10至约25个氨基酸的短连接肽连接的免疫球蛋白的重链(VH)和轻链(VL)的可变区的融合蛋白。所述接头通常可富含甘氨酸以提高柔韧性，以及丝氨酸或苏氨酸以提高溶解度。接头可以将VH的N-末端与VL的C-末端相连，反之亦然。

如本文提供的术语″抗原″是指能够结合本文提供的抗体结合结构域的分子。如本文提供的″抗原结合结构域″是与抗原(表位)结合的抗体区域。如上所述，抗原结合结构域可包括每条重链和轻链的一个恒定域和一个可变域(分别为VL、VH、CL和CH1)。在实施方案中，抗原结合结构域包括轻链可变结构域和重链可变结构域。在实施方案中，抗原结合结构域包括轻链可变结构域，而不包括重链可变结构域和/或重链恒定结构域。互补位或抗原结合位点形成于抗原结合结构域的N-末端。抗原结合结构域的两个可变结构域可与抗原的表位结合。

抗体，例如，以完整的免疫球蛋白形式存在或以各种肽酶消化产生的许多充分表征的片段形式存在。因此，例如，胃蛋白酶消化铰链区中二硫键下方的抗体以产生F(ab)’2，其为Fab的二聚体，本身是通过二硫键与VH-CH1连接的轻链。F(ab)’2可以在温和条件下还原以破坏铰链区中的二硫键，从而将F(ab)’2二聚体转化为Fab’单体。Fab’单体基本上为具有铰链区的一部分的Fab(参见Fundamental Immunology(Pauled.，3d ed.1993))。尽管就完整抗体的消化而言定义了各种抗体片段，但是本领域技术人员将理解，可以化学方式或通过使用重组DNA方法从头合成此类片段。因此，如本文所使用的术语抗体还包括通过修饰完整抗体产生的抗体片段，或使用重组DNA方法从头合成的抗体片段(例如，单链Fv)或使用噬菌体展示文库识别的抗体片段(参见例如，McCafferty等人，Nature 348：552-554(1990))。

抗体的表位是其抗原结合的抗原区域。如果两种抗体中的每种竞争性地抑制(阻断)另一种抗体与抗原的结合，则两种抗体会结合到相同或重叠的表位上。也就是说，如在竞争性结合测定中测定的，1x、5x、10x、20x或100x过量的一种抗体将另一种抗体的结合抑制至少30％，但优选为50％、75％、90％或甚至99％(参见例如，Junghans等人，CancerRes.50：1495，1990)。可选地，如果抗原中基本上所有减少或消除一种抗体的结合的氨基酸突变都减少或消除了另一种抗体的结合，则两种抗体具有相同的表位。如果减少或消除一种抗体的结合的一些氨基酸突变减少或消除了另一种抗体的结合，则两种抗体具有重叠的表位。

抗体，例如重组、单克隆或多克隆抗体，可通过本领域已知的许多技术制备(参见例如Kohler&Milstein，Nature 256：495-497(1975)；Kozbor等人，Immunology Today 4：72(1983)；Cole等人，Monoclonal Antibodies and Cancer Therapy中第77-96页，AlanR.Liss，Inc.(1985)；Coligan，Current Protocols in Immunology(1991)；Harlow&Lane，Antibodies，A Laboratory Manual(1988)；以及Goding，Monoclonal Antibodies：Principles and Practice(第2版，1986))。编码所关注的抗体的重链和轻链的基因可以从细胞中克隆，例如，编码单克隆抗体的基因可以从杂交瘤中克隆，并且用于产生重组单克隆抗体。编码单克隆抗体重链和轻链的基因文库也可以从杂交瘤或浆细胞中制备。重链和轻链基因产物的随机组合产生大量具有不同抗原特异性的抗体(参见，例如，Kuby，Immunology(第3版，1997))。用于产生单链抗体或重组抗体的技术(美国专利4,946,778、美国专利号4,816,567)可适于产生针对多肽的抗体。同样，转基因小鼠或其他生物(诸如其他哺乳动物)也可用于表达人源化或人抗体(参见例如美国专利号5,545,807；5,545,806；5,569,825；5,625,126；5,633,425；5,661,016，Marks等人，Bio/Technology 10：779-783(1992)；Lonberg等人，Nature 368：856-859(1994)；Morrison，Nature 368：812-13(1994)；Fishwild等人，Nature Biotechnology 14：845-51(1996)；Neuberger，NatureBiotechnology 14：826(1996)；以及Lonberg&Huszar，Intern.Rev.Immunol.)13：65-93(1995))。任选地，噬菌体展示技术可以用于鉴定特异性结合所选抗原的抗体和异源Fab片段(参见例如，McCafferty等人，Nature 348：552-554(1990)；Marks等人，Biotechnology10：779-783(1992))。还可以将抗体制备成双特异性的，即，能够识别两种不同的抗原(参见例如，WO 93/08829，Traunecker等人，EMBO J.10：3655-3659(1991)；以及Suresh等人，Methods in Enzymology 121：210(1986))。抗体也可以是异源缀合物，例如两种共价连接的抗体或免疫毒素(参见例如，美国专利号4,676,980，WO 91/00360；WO 92/200373；以及EP03089)。

用于使非人抗体人源化或灵长化的方法是本领域众所周知的(例如，美国专利号4,816,567；5,530,101；5,859,205；5,585,089；5,693,761；5,693,762；5,777,085；6,180,370；6,210,671；以及6,329,511；WO 87/02671；欧洲专利申请0173494；Jones等人，(1986)Nature 321：522；以及Verhoyen等人，(1988)Science 239：1534)。人源化的抗体在例如Winter和Milstein(1991)Nature 349：293中有进一步的描述。通常，人源化的抗体具有从非人来源引入其中的一个或多个氨基酸残基。这些非人氨基酸残基通常被称为输入残基，其通常取自输入可变域。人源化基本上可以按照Winter及其同事的方法进行(参见例如，Morrison等人，PNAS USA，81：6851-6855(1984)，Jones等人，Nature 321：522-525(1986)；Riechmann等人，Nature 332：323-327(1988)；Morrison和Oi，Adv.Immunol.，44：65-92(1988)，Verhoeyen等人，Science 239：1534-1536(1988)以及Presta，Curr.Op.Struct.Biol.2：593-596(1992)，Padlan，Molec.Immun.，28：489-498(1991)；Padlan，Molec.31(3)：169-217(1994))，通过用啮齿动物CDR或CDR序列置换人抗体的对应序列来执行。因此，这样的人源化抗体是嵌合抗体(第4,816,567号美国专利)，其中大幅少于完整的人可变域已被来自非人物种的相应序列取代。在实践中，人源化抗体通常是人抗体，其中一些CDR残基和可能的一些FR残基被来自啮齿动物抗体中类似位点的残基取代。例如，可以合成地或通过组合适当的cDNA和基因组DNA区段来产生包含编码人源化免疫球蛋白框架区的第一序列和编码所需免疫球蛋白互补性决定区的第二序列集的多核苷酸。可以根据众所周知的方法从各种人细胞中分离人恒定区DNA序列。

″嵌合抗体″是这样的抗体分子，其中(a)恒定区或其一部分被改变、替换或交换，使得抗原结合位点(可变区)连接至不同或改变的类别、效应子功能和/或种类，或赋予嵌合抗体新特性的完全不同的分子，例如酶、毒素、激素、生长因子、药物等的恒定区；或(b)可变区或其一部分被具有不同或改变的抗原特异性的可变区改变、替换或交换。在实施方案中，本文所述的抗体包括人源化和/或嵌合单克隆抗体。

当涉及蛋白质或肽时，短语″特异性(或选择性地)结合″抗体或抗原或″与......特异性(或选择性地)起免疫反应″，是指确定了蛋白质的存在，通常是在蛋白质的异质群体和其他生物制剂中的存在的结合反应。因此，在指定免疫测定条件下，指定抗体与特定蛋白质的结合是背景的至少两倍，并且更通常是背景的10至100倍以上。在此类条件下与抗体的特异性结合需要选择对特定蛋白质具有特异性的抗体。例如，可以选择多克隆抗体以仅获得与所选抗原而不与其他蛋白质发生特异性免疫反应的抗体的子集。这一选择可通过减去与其他分子交叉反应的抗体来实现。可使用多种免疫测定形式来选择与特定蛋白质发生特异性免疫反应的抗体。例如，常规地使用固相ELISA免疫测定来选择与蛋白质特异性免疫反应的抗体(参见例如，Harlow和Lane，Using Antibodies，A Laboratory Manual(1998)，以描述可以用于确定特异性免疫反应性的免疫测定方式和条件)。

″受体蛋白质″或″膜受体″是指嵌入细胞质膜中的受体(蛋白质)。在实施方案中，受体蛋白质位于细胞的细胞外结构域、细胞的跨膜结构域或细胞的细胞内结构域。在实施方案中，受体蛋白质是细胞表面受体。在实施方案中，受体蛋白质在细胞外结构域中。在实施方案中，受体蛋白质在跨膜结构域中。在实施方案中，受体蛋白质是离子通道连接受体、酶连接受体或G蛋白偶联受体。在实施方案中，受体蛋白质是激素受体。

如本文所用，术语″生物分子″是指大分子，例如蛋白质、碳水化合物、脂质和核酸，以及小分子，例如一级和二级代谢产物。在方面中，″生物分子″是指蛋白质。在方面中，″生物分子″是指核酸。在方面中，″生物分子″是指碳水化合物。在实施方案中，蛋白质是单结构域抗体。在实施方案中，蛋白质是膜受体。

术语″生物分子部分″是指形成生物分子的肽基部分、碳水化合物部分、脂质部分或核酸部分。

如本文所用，术语″肽基部分″是指可以形成生物分子或生物分子缀合物的一部分的蛋白质、蛋白质片段或肽。在方面中，肽基部分形成生物分子(例如蛋白质)的一部分。在方面中，肽基部分形成生物分子(例如蛋白质)缀合物的一部分。肽基部分也可以被另外的化学部分(例如，另外的R取代基)取代。在方面中，肽基部分形成单结构域抗体的一部分。在方面中，肽基部分形成膜受体的一部分。

如本文所用，术语″氨基酸部分″是指单价氨基酸，使得该氨基酸可连接至另一化合物或部分，诸如本文所述的式(B)的化合物。

如本文所用，术语″碳水化合物部分″是指碳水化合物，例如，多羟基醛、酮、醇、酸、其简单衍生物及其具有缩醛类型的键的聚合物，其可以形成生物分子或生物分子缀合物的一部分。在方面中，碳水化合物部分形成生物分子的一部分。在方面中，碳水化合物部分形成生物分子缀合物的一部分。碳水化合物部分也可以被另外的化学部分(例如，另外的R取代基)取代。

如本文所用，术语″核酸部分″是指核酸，例如DNA和RNA，其可以形成生物分子或生物分子缀合物的一部分。在方面中，核酸部分形成生物分子的一部分。在方面中，核酸部分形成生物分子缀合物的一部分。核酸部分也可以被另外的化学部分(例如，另外的R取代基)取代。

″小分子″是天然或合成性质的分子量为10,000道尔顿或更小的低分子量有机化合物。与小分子的附接可通过结构与小分子之间的任何共价键发生，包括但不限于烷基基团、羰基、酰胺、硫化物、醚、酯、芳烃、杂芳烃、缩酮、肟、亚胺、烯胺、烯烃、炔烃或其他基团。

″小分子部分″是指可形成生物分子的一部分或可含有一个或多个由式(F)表示的FSK氨基酸侧链的小分子。在实施方案中，小分子部分是单价小分子。

术语″吡咯赖氨酰-tRNA合成酶″是指具有吡咯赖氨酰-tRNA合成酶活性的酶(包括同系物、同工型及其功能片段)。吡咯赖氨酰-tRNA合成酶是一种氨酰其-tRNA合成酶(aaRS)，它催化将α-氨基酸吡咯赖氨酸连接至同源tRNA(tRNA^pyl)所必需的反应，从而允许在琥珀终止密码子(例如，TAG)的蛋白质生成过程中引入吡咯赖氨酸。所述术语包括吡咯赖氨酰-tRNA合成酶的任何重组型或天然存在的形式或其变体、同系物、或同工型，其维持吡咯赖氨酰-tRNA合成酶活性(例如，与野生型吡咯赖氨酰-tRNA合成酶相比至少30％、40％、50％、60％、70％、80％、90％、95％或100％的活性内)。在方面中，与天然存在的吡咯赖氨酰-tRNA合成酶相比，变体、同系物或同工型在整个序列或一部分序列(例如50、100、150或200个连续氨基酸部分)上具有至少90％、95％、96％、97％、98％、99％或100％氨基酸序列一致性。在方面中，吡咯赖氨酰-tRNA合成酶包含SEQ ID NO：1所示的序列。在方面中，吡咯赖氨酰-tRNA合成酶是SEQ ID NO：1所示的序列。

术语″突变体吡咯赖氨酰-tRNA合成酶″或″突变体PylRS″或″变体吡咯赖氨酰-tRNA合成酶″或″变体PylRS″是指具有与野生型氨基酸序列不同的氨基酸序列的任何吡咯赖氨酰-tRNA合成酶。在实施方案中，变体PylRS是指具有与如SEQ ID NO：1所示的Methanomethylophilus alvus吡咯赖氨酰-tRNA合成酶的野生型氨基酸序列不同的氨基酸序列的任何吡咯赖氨酰-tRNA合成酶。在方面中，″突变体吡咯赖氨酰-tRNA合成酶″是指催化氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)与tRNA^pyl的附接的任何吡咯赖氨酰-tRNA合成酶。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括在选自由以下组成的组的一个或多个残基处具有突变的SEQ ID NO：1：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸和229位处的赖氨酸。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有以下五个突变的SEQ ID NO：1：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；以及(v)Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有以下六个突变的SEQ ID NO：1：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有突变，以下六个突变的SEQ ID NO：1：Y126G；M129A；V168F；H227T；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有以下六个突变的SEQ ID NO：1：Y126G；M129A；V168F；H227S；Y228P；以及L229V。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有以下六个突变的SEQ ID NO：1：Y126G；M129A；V168F；H227I；以及Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括具有以下六个突变的SEQ ID NO：1：Y126G；M129A；V168F；H227S；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：2所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶是SEQ ID NO：2所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：2所示的序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶还在N-末端和/或C-末端处包含六个组氨酸残基。在方面中，突变体吡咯赖氨酰-tRNA合成酶还在N-末端处包含六个组氨酸残基。在方面中，突变体吡咯赖氨酰-tRNA合成酶还在C-末端处包含六个组氨酸残基。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：86所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶是SEQ ID NO：86所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：86所示的序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：87所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶是SEQ ID NO：87所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：87所示的序列编码。在方面中，″突变体吡咯赖氨酰-tRNA合成酶″被称为″吡咯赖氨酰-tRNA合成酶″，并且基于与野生型SEQ ID NO：1的比较，技术人员会容易地认识到吡咯赖氨酰-tRNA合成酶是否是突变的。

在实施方案中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且在选自由以下组成的组的一个或多个残基处具有突变：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸和229位处的赖氨酸。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有以下五个突变：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；以及(v)Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有以下六个突变：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有突变，以下六个突变：Y126G；M129A；V168F；H227T；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQID NO：1，其在C-末端处具有6个组氨酸残基；并且具有突变，以下六个突变：Y126G；M129A；V168F；H227T；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ IDNO：1，其在N-末端(在M残基之后)具有6个组氨酸残基；并且具有突变，以下六个突变：Y126G；M129A；V168F；H227T；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229V。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端处具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229V。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在N-末端(在M残基之后)具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229V。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227I；以及Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端处具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227I；以及Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在N-末端(在M残基之后)具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227I；以及Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端和/或N-末端(例如，在M残基之后)具有1至10个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在C-末端处具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：1，其在N-末端(在M残基之后)具有6个组氨酸残基；并且具有以下六个突变：Y126G；M129A；V168F；H227S；Y228P；以及L229I。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：86所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶是SEQ ID NO：86所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：86所示的序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶包括SEQ ID NO：87所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶是SEQ ID NO：87所示的序列。在方面中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：87所示的序列编码。

术语″tRNA^Pyl"是指包含约50至约100个核苷酸的单链RNA分子，它们通过链内碱基配对折叠以形成带有特定氨基酸(例如，吡咯赖氨酸、FSK)的特有四叶苜蓿叶形结构，并使其在蛋白质合成过程中与mRNA上的其相应密码子(即，与tRNA的反密码子互补)匹配。tRNA^Pyl的缩写″Pyl"代表吡咯赖氨酸。在实施方案中，反密码子包含CUA、TTA或TCA。在实施方案中，反密码子包含CUA。在实施方案中，反密码子包含TTA。在实施方案中，反密码子包含TCA。在实施方案中，反密码子包含至少一种非经典碱基。反密码子CUA与琥珀终止密码子互补。在方面中，tRNA^Pyl连接至FSK。在方面中，tRNA^Pyl是指包含约50至约100个核苷酸的单链RNA分子。在方面中，tRNA^Pyl是指包含约60至约90个核苷酸的单链RNA分子。在方面中，tRNA^Pyl是指包含约65至约85个核苷酸的单链RNA分子。在方面中，tRNA^Pyl是指包含约70至约90个核苷酸的单链RNA分子。在方面中，tRNA^Pyl是指包含约60至约80个核苷酸的单链RNA分子。

如本文所用，术语″底物结合位点″是指位于酶活性位点中的残基，其与底物形成临时的键或相互作用。在方面中，吡咯赖氨酰-tRNA合成酶的底物结合位点是指位于吡咯赖氨酰-tRNA合成酶的活性位点中的残基，其与氨基酸底物形成临时的键或相互作用。在方面中，吡咯赖氨酰-tRNA合成酶的底物结合位点包括以下残基中的一者或多者：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸和229位处的赖氨酸，如SEQ ID NO：1的氨基酸序列所示。

术语″质粒″、″载体″或″表达载体″是指编码基因和/或基因表达所必需的调节元件的核酸分子。来自质粒的基因表达可以顺式发生或反式发生。如果基因以顺式表达，则该基因和调控元件由同一质粒编码。反式表达是指其中基因和调节元件由单独的质粒编码的情况。

术语″复合物″是指包括两种或更多种组分的组合物，其中所述组分结合在一起以形成功能单元。在方面中，本文所述的复合物包括本文所述的突变体吡咯赖氨酰-tRNA合成酶和氨基酸底物(例如，FSK)。在方面中，本文所述的复合物包括本文所述的突变体吡咯赖氨酰-tRNA合成酶和tRNA(例如，tRNA^Pyl)。在方面中，本文描述的复合物包括本文描述的突变体吡咯赖氨酰-tRNA合成酶、氨基酸底物(例如FSK)和tRNA(例如tRNA^Pyl)。在方面中，本文所述的复合物包括选自本文所述的突变体吡咯赖氨酰-tRNA合成酶、氨基酸底物(例如FSK)、含有FSK的多肽和tRNA(例如tRNA^Pyl)的至少两种组分。

术语″转染″或″转导″可以互换使用并且被定义为将核酸分子或蛋白质引入细胞的过程。使用非病毒或基于病毒的方法将核酸引入细胞。核酸分子可以是编码完整蛋白质或其功能部分的基因序列。非病毒转染方法包括不使用病毒DNA或病毒颗粒作为将核酸分子引入细胞的递送系统的任何合适的转染方法。示例性非病毒转染方法包含磷酸钙转染、脂质粒转染、核转染、声穿孔、通过热激转染、磁转染和电穿孔。在方面中，按照本领域众所周知的标准程序，使用电穿孔将核酸分子引入细胞中。对于基于病毒的转染方法，任何有用的病毒载体均可用于本文所述的方法。病毒载体的实例包括但不限于逆转录病毒的、腺病毒的、慢病毒的和腺相关的病毒载体。在方面中，按照本领域众所周知的标准程序，使用逆转录病毒载体将核酸分子引入细胞。术语″转染″或″转导″还指从外部环境将蛋白质引入细胞。通常，蛋白的转导或转染依赖于能够穿过细胞膜的肽或蛋白与相关蛋白质的附接。参见例如，Ford等人，(2001)Gene Therapy 8：1-4以及Prochiantz(2007)Nat.Methods 4：119-20。

当将术语″分离的″应用于核酸或蛋白质时，是指该核酸或蛋白质基本上不含在天然状态下与其缔合的其他细胞成分。它可以例如处于均质状态并且可以处于干燥状态或水溶液中。纯度和均质性通常使用分析化学技术，如聚丙烯酰胺凝胶电泳或高效液相色谱法确定。制剂中存在的主要蛋白质基本上得以纯化。

″接触″根据其普通一般含义使用，并且是指使至少两个不同的物种(例如，包含生物分子、生物分子部分或细胞的化学化合物)变得足够接近以进行反应、相互作用或物理触摸的过程。然而，应当理解，所得的反应产物可以由所添加的试剂之间的反应或由来自所添加的试剂中的一种或多种的可以在反应混合物中产生的中间体来直接产生。

术语″接触″可以包含允许两种物种反应、相互作用或物理触摸，其中所述两种物种可以是如本文所描述的生物分子和/或生物分子部分。在方面中，接触包括允许两个如本文所述的生物分子部分相互作用，其中所述生物分子部分共价键合以形成缀合物。

如本文所用，术语″生物缀合物反应性部分″和″生物缀合物反应性基团″是指由于生物缀合物反应性基团的原子或分子之间的缔合能够形成生物缀合物(例如，共价接头)的部分或基团。缔合可以是直接的或间接的。例如，本文提供的第一生物缀合物反应性基团(例如，-NH2、-COOH、-N-羟基琥珀酰亚胺或-马来酰亚胺)与第二生物缀合物反应性基团(例如，巯基、含硫氨基酸、胺、含有氨基酸的胺侧链或羧酸盐)之间的缀合可以例如通过共价键或接头(例如第二接头的第一接头)直接进行，或例如通过非共价键(例如静电相互作用(例如离子键、氢键、卤素键)、范德华(van der Waals)相互作用(例如，偶极-偶极、偶极诱导的偶极、伦敦分散)、环堆积(π效应)、疏水相互作用等)间接进行。在方面中，生物缀合物或生物缀合物接头是使用生物缀合物化学(即两个生物缀合物反应性基团的缔合)形成的，包含但不限于亲核取代(例如，胺和醇与酰基卤、活性酯的反应)，亲电取代(例如，烯胺反应)以及碳-碳和碳-杂原子多重键的加成(例如，迈克尔反应、狄尔斯-阿尔德加成)。这些和其他有用的反应在例如以下文献中讨论：March，Advanced Organic Chemistry，第3版，JohnWiley&Sons，New York，1985；Hermanson，Bioconjugate Techniques，Academic Press，SanDiego，1996；以及Feeney等人，Modification of Proteins；Advances in ChemistrySeries，第198卷，American Chemical Society，Washington，D.C.，1982。在方面中，第一生物缀合物反应性基团(例如，马来酰亚胺部分)共价连接到第二生物缀合物反应性基团(例如巯基)。在方面中，第一生物缀合物反应性基团(例如，卤代乙酰基部分)共价连接到第二生物缀合物反应性基团(例如巯基)。在方面中，第一生物缀合物反应性基团(例如，吡啶基部分)共价连接到第二生物缀合物反应性基团(例如巯基)。在方面中，第一生物缀合物反应性基团(例如，N-羟基琥珀酰亚胺部分)共价连接到第二生物缀合物反应性基团(例如胺)。在方面中，第一生物缀合物反应性基团(例如，马来酰亚胺部分)共价连接到第二生物缀合物反应性基团(例如巯基)。在方面中，第一生物缀合物反应性基团(例如，-磺基-N-羟基琥珀酰亚胺部分)共价连接到第二生物缀合物反应性基团(例如胺)。

用于本文的生物缀合物化学的有用的生物缀合物反应性部分包括例如：(a)羧基基团及其各种衍生物，包括但不限于N-羟基琥珀酰亚胺酯、N-羟基苯并三氮唑酯、酸性卤化物、酰基咪唑、硫代酯、对硝基苯基酯、烷基酯、烯基酯、炔基酯和芳香酯；(b)可以转化为酯、醚、醛等的羟基基团；(c)卤代烷基基团，其中卤化物随后可以被亲核基团(诸如胺、羧酸根阴离子、硫醇阴离子、碳负离子或烷氧化物离子)取代，从而导致新的基团在卤素原子的位置处共价附接；(d)能够参与狄尔斯-阿尔德反应的亲双烯体基团，诸如马来酰亚胺基或马来酰亚胺基团；(e)醛或酮基团，使得可以经由形成羰基衍生物(诸如亚胺、腙、半卡巴腙或肟)或经由诸如格氏加成或烷基锂加成等机理进行后续衍生化；(f)随后与胺反应例如以形成磺酰胺的磺酰卤基团；(g)可以转化为二硫化物、与酰基卤反应或与金属诸如金键合或与马来酰亚胺反应的硫醇基团；(h)胺或巯基(例如，存在于半胱氨酸中)，所述胺基或巯基可以被例如酰化、烷基化或氧化；(i)烯烃，所述烯烃可以经历例如环加成、酰化、迈克尔加成等；(j)环氧化物，所述环氧化物可以与例如胺和羟基化合物反应；(k)亚磷酰胺和可用于核酸合成的其他标准官能团；(l)金属氧化硅键合；(m)金属键合至反应性磷基团(例如，膦)以形成例如磷酸二酯键；(n)使用铜催化的环加成点击化学法与炔烃偶联的叠氮化物；(o)生物素缀合物可以与抗生物素蛋白或链霉亲和素反应形成抗生物素蛋白-生物素复合物或链霉亲和素-生物素复合物。

可以选择生物缀合物反应性基团，使得其不参与或不干扰本文所描述的缀合物的化学稳定性。替代地，可以通过存在保护基团来保护反应性官能团不参与交联反应。在方面中，生物缀合物包括衍生自如马来酰亚胺等不饱和键与巯基的反应的分子实体。

术语″体外翻译系统″是指在无细胞提取物中提供蛋白质的体外合成的系统，其可以提供基因产物的鉴定(例如，蛋白质组学)、通过截短的基因产物的合成的突变的定位、蛋白质折叠研究以及将修饰的或非天然的氨基酸掺入蛋白质中。在实施方案中，体外翻译系统是指提供将修饰的或非天然氨基酸(例如，FSK)掺入到蛋白质中的系统。示例性体外翻译系统是New England BioLabs，Inc.的体外蛋白合成试剂盒。体外翻译系统的示例性组分包括氨基酸、麦胚提取物、用于蛋白质合成的细胞组分(例如，tRNA、核糖体、起始因子、延伸因子、终止因子)、盐(例如，Mg²⁺、K⁺)等。在实施方案中，体外翻译系统是兔网织红细胞系统或麦胚提取系统。

术语″氟硫酸酯-L-酪氨酸″和″FSY″是指具有以下结构的非天然氨基酸：

或其立体异构体：/>

FSY包含下式的氨基酸侧链：

术语″氟磺酰氧基苯甲酰基-L-赖氨酸″和″FSK″是指具有式(A)的结构的非天然氨基酸：

包括其立体异构体：

FSK包含式(F)的氨基酸侧链：

术语″FSK生物分子″是指包含FSK非天然氨基酸和/或其氨基酸侧链的生物分子。

术语″生物分子缀合物″或″FSK生物分子缀合物″是指包含具有式(D)的结构的生物缀合物接头(″FSK生物缀合物接头″)的任何生物分子：

术语″FSK蛋白质″是指包含FSK非天然氨基酸和/或其氨基酸侧链的蛋白质。

术语″蛋白质缀合物″或″FSK蛋白质缀合物″是指包含具有式(D)的结构的生物缀合物接头的任何蛋白质：

术语″硫氟交换反应″或″SuFEx″是指一类点击化学，如例如Dong等人，AngewandteChemie，53(36)：9340-9448(2014)；Wang等人，J.Am.Chem.Soc.，140(15)：4995-4999(2018)中详细描述的；以及如本文示例中所述。术语″附近实现的″SuFEx是指当反应性物种彼此接近时，即在空间上足够近以发生SuFEx反应时发生的硫氟交换反应。附近可以发生在单个生物分子(例如蛋白质)内或两个不同生物分子(例如蛋白质)之间。技术人员可以容易地确定反应性种类是否足够接近以使反应发生(例如，FSK与赖氨酸、组氨酸或酪氨酸之间的硫氟交换反应以形成生物缀合物，即式(A)、(B)、(C)的部分或式(I)、(II)或(III)的蛋白质)。

术语″分子间接头″是指两个不同生物分子之间的连接基团。例如，当式(E)、(I)、(II)或(III)的化合物具有分子间接头时，则R¹的肽基部分是第一蛋白质，而R²的肽基部分是第二蛋白质，使得第一蛋白质和第二蛋白质经由式(E)、(I)、(II)或(III)的部分共价键合。在方面中，第一蛋白质和第二蛋白质是不同的蛋白质，例如，在两种不同的蛋白质之间提供分子间接头，诸如单结构域抗体和膜受体。

术语″分子内接头″是指单个生物分子内的连接基团。例如，当式(E)、(I)、(II)或(III)的化合物具有分子内接头时，则R¹的肽基部分和R²的肽基部分在相同蛋白质中。在方面中，第一蛋白质和第二蛋白质是相同的蛋白质，即，在单个蛋白内提供分子间接头。

生物分子和生物分子缀合物

本文提供了通过潜在生物反应性非天然氨基酸与天然存在的氨基酸的相互作用形成的生物分子和生物分子缀合物。一种潜在的生物反应性非天然氨基酸，氟磺酰氧基苯甲酰基-L-赖氨酸(FSK或N6-(4-((氟磺酰基)氧基)苯甲酰基)-L-赖氨酸)通过经历点击化学反应(例如，硫氟交换反应(SuFEx))促进与近侧靶氨基酸残基(例如，赖氨酸、组氨酸、酪氨酸)形成共价键。例如，FSK可以插入或替换天然存在的蛋白质中的氨基酸，从而赋予蛋白质与在蛋白质本身上的附近定位的靶氨基酸残基(例如赖氨酸、组氨酸、酪氨酸)或与其之天然相互作用的蛋白质形成共价键的能力。至少部分由于其对细胞无毒，FSK可用于在体外和体内条件下促进蛋白质之间或之内的共价键的形成。这样，潜在的生物反应性非天然氨基酸FSK可用于共价连接生物分子(例如蛋白质、碳水化合物、核酸)以形成生物分子缀合物。在一些方面，潜在的生物反应性非天然氨基酸FSK可用于共价连接单个生物分子(例如蛋白质)内的生物分子部分(例如肽基部分)。在各方面中，潜在的生物反应性非天然氨基酸FSK可用于共价连接不同生物分子中的生物分子部分(例如肽基部分)(例如共价连接两种蛋白质)。在方面中，潜在的生物反应性非天然氨基酸FSK可用于将单结构域抗体共价连接至膜受体。

如本文所示，与以前描述的生物反应性非天然氨基酸相比，FSK作为潜在的生物反应性非天然氨基酸已显示出优异的化学官能度(即，优异的性质)。例如，FSK在细胞内部是稳定、无毒且无反应性的，但是当置于靶标残基附近时，它在细胞条件下会变得具有反应性。在生理条件下，FSK能够通过蛋白质内部和蛋白质之间的附近实现的SuFEx反应，以高的选择性与赖氨酸、组氨酸和酪氨酸特异性发生反应。

本文提供了包含一种或多种潜在的生物反应性非天然氨基酸的生物分子。在方面中，生物分子是蛋白质、核酸或碳水化合物。在方面中，生物分子是蛋白质。在方面中，FSK和赖氨酸、组氨酸或酪氨酸在蛋白质的α链。在方面中，FSK和赖氨酸、组氨酸或酪氨酸在蛋白质的β链。在方面中，抗体是单结构域抗体。在方面中，蛋白质是膜受体。在方面中，潜在的生物反应性非天然氨基酸是具有式(A)的结构的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

在方面中，生物分子是包含FSK非天然氨基酸的蛋白质。在方面中，蛋白质包含至少一种FSK。在实施方案中，蛋白质包含一种FSK。在方面中，蛋白质包含两种或更多种FSK。在方面中，蛋白质包含两种FSK。在方面中，蛋白质包含三种FSK。在方面中，生物分子是包含由式(F)表示的FSK氨基酸侧链的蛋白质：

在方面中，蛋白质包含接近赖氨酸、组氨酸、酪氨酸或其两种或更多种的组合的FSK。在方面中，蛋白质包含在赖氨酸附近的FSK。在方面中，蛋白质包含在组氨酸附近的FSK。在方面中，蛋白质包含在酪氨酸附近的FSK。在方面中，蛋白质是抗体或抗体变体。在方面中，蛋白质是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。

″在附近″是指FSK和赖氨酸、组氨酸或酪氨酸彼此足够接近以成功发生SuFEx反应。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至50个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至45个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至40个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至35个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至30个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至25个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至20个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至15个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至10个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至9个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至8个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至7个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至6个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至5个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至4个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至3个氨基酸内。在方面中，″在附近″是指FSK在赖氨酸、组氨酸或酪氨酸的1至2个氨基酸内。在方面中，″在附近″是指FSK与赖氨酸、组氨酸或酪氨酸相邻。

在方面中，第一生物分子部分和第二生物分子部分各自独立地是肽基部分。在方面中，生物分子缀合物是蛋白质缀合物。在方面中，生物分子缀合物是蛋白质缀合物，其中生物缀合物接头是分子内接头。在方面中，蛋白质缀合物包含多个分子内接头。在方面中，生物分子缀合物是蛋白质缀合物，其中生物缀合物接头是分子间接头。在方面中，蛋白质缀合物包含多个分子间接头。在方面中，蛋白质缀合物包含分子内接头和分子间接头。

在实施方案中，生物分子缀合物具有式(E)的结构：

另选地描述为具有下式：

R¹-L¹-A-X¹-L²-R²；

其中A是式(D)的生物缀合物接头；R¹是第一生物分子部分；R²是第二生物缀合物部分；L¹是键或第一共价接头；L²是第二共价接头的键；并且X¹是-NR⁵-、-O-、-S-，或者

其中环A是取代或未取代的亚杂芳基或取代或未取代的亚杂环烷基，并且其中A中的氮附接到所述生物缀合物接头。R5是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

L¹是键、-S(O)₂-、-NR^3A-、-O-、-S-、-C(O)-、-C(O)NR^3A-、-NR^3AC(O)-、-NR^3AC(O)NR^3B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。R^3A和R^3B独立地是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

L²是键、-S(O)₂-、-NR^4A-、-O-、-S-、-C(O)-、-C(O)NR^4A-、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、取代或未取代的亚杂芳基、或者取代或未取代的烷基亚芳基。在实施方案中，L²是键、-S(O)₂-、-NR^4A、-O-、-S-、-C(O)-、-C(O)NR^4A、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、取代或未取代的亚杂芳基。R^4A和R^4B独立地是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

X¹是-NR⁵-、-O-、-S-，或者其中环A是取代或未取代的亚杂芳基或取代或未取代的亚杂环烷基。在方面中，X¹是-NR⁵。在方面中，X¹是-O-。在方面中，X¹是-S-。在方面中，X¹是/>其中环A是取代或未取代的亚杂芳基或取代或未取代的亚杂环烷基。在实施方案中，环A是被取代或未被取代的杂芳基。在实施方案中，环A是被取代或未被取代的亚杂环烷基。在方面中，环A为未取代的亚杂芳基。在方面中，环A为未取代的亚杂环烷基。在实施方案中，环A是取代的亚杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)。在实施方案中，环A为未取代的亚杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)。在实施方案中，环A为经取代或未取代的亚杂芳基(例如，5至10元、5至9元或5至6元)。在实施方案中，环A为经取代的亚杂芳基(例如，5至10元、5至9元或5至6元)。在实施方案中，环A是未取代的亚杂芳基(例如，5至10元、5至9元或5至6元)。在实施方案中，X¹是键。

在实施方案中，R⁵是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。在方面中，R⁵是氢。

在实施方案中，R⁵是氢、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的芳基或取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂芳基。

在实施方案中，R⁵是氢、取代或未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、取代或未取代的(例如2至20元、2至10元、2至5元)杂烷基、取代或未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、取代或未取代的(例如3至8元、3至6元、3至5元)杂环烷基、取代或未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或取代或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R⁵是氢、未取代的(例如，C₁-C₂₀、C₁-C_1o、C₁-C₅)烷基、未取代的(例如2至20元、2至10元、2至5元)杂烷基、未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、未取代的(例如3至8元、3至6元、3至5元)杂环烷基、未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，L¹是键、-S(O)₂-、-NR^3A-、-O-、-S-、-C(O)-、-C(O)NR^3A-、-NR^3AC(O)-、-NR^3AC(O)NR^3B-、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，L¹是键、-S(O)₂-、-NR^3A-、-O-、-S-、-C(O)-、-C(O)NR^3A-、-NR^3AC(O)-、-NR^3AC(O)NR^3B-、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。在方面中，L¹是键、被取代或未被取代的亚烷基或被取代或未被取代的亚杂烷基。在方面中，L¹是键、未被取代的亚烷基或未被取代的亚杂烷基。在方面中，L¹是未被取代的亚烷基。在方面中，L¹是未被取代的亚杂烷基。在方面中，L¹是键。

在实施方案中，L¹是-O-、-S-、R³²取代或未取代的C₁-C₂亚烷基(例如，C₁或C₂)或R³²取代或未取代的2元亚杂烷基。在方面中，L¹是被R³²取代或未被取代的亚烷基(例如，C₁-C₈亚烷基、C₁-C₆亚烷基或C₁-C₄亚烷基)、被R³²取代或未被取代的亚杂烷基(例如，2到8元亚杂烷基、2到6元亚杂烷基或2到4元亚杂烷基)、被R³²取代或未被取代的亚环烷基(例如，C₃-C₈亚环烷基、C₃-C₆亚环烷基或C₅-C₆亚环烷基)、被R³²取代或未被取代的亚杂环烷基(例如，3到8元亚杂环烷基、3到6元亚杂环烷基或5到6元亚杂环烷基)、被R³²取代或未被取代的亚芳基(例如，C₆-C₁₀亚芳基、C₁₀亚芳基、或亚苯基)或被R³²取代或未被取代的亚杂芳基(例如，5到10元亚杂芳基、5到9元亚杂芳基或5到6元亚杂芳基)。在方面中，L¹独立地为-O-、-S-、未取代的C₁-C₂亚烷基(例如C₁或C₂)或未取代的2元亚杂烷基。在方面中，L¹独立地是未取代的亚甲基。在方面中，L¹独立地是未取代的亚乙基。在方面中，L¹是取代的2元亚杂烷基。在方面中，L¹是取代的3元亚杂烷基。在方面中，L¹是取代的4元亚杂烷基。在方面中，L¹是未取代的2元亚杂烷基。在方面中，L¹是未取代的3元亚杂烷基。在方面中，L¹是未取代的4元亚杂烷基。

R³²独立地为氧代、卤素、-CX³² ₃、-CHX³² ₂、-CH₂X³²、-OCX³² ₃、-OCH₂X³²、-OCHX³² ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、R³³-取代或未取代的烷基(例如，C₁-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、R³³-取代或未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、R³³-取代或未取代的环烷基(例如，C₃-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、R³³-取代或未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、R³³-取代或未取代的芳基(例如，C₆-C₁₀或苯基)或R³³-取代或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。在方面中，R³²独立地为氧代、卤素、-CX³² ₃、-CHX³² ₂、-CH₂X³²、-OCX³² ₃、-OCH₂X³²、-OCHX³² ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C₁-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C₃-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C₆-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³²独立地为-F、-Cl、-Br或-I。

在实施方案中，R³²独立地为未取代的甲基。在方面中，R³²独立地为未取代的乙基。

R³³独立地为氧代、卤素、-CX³³ ₃、-CHX³³ ₂、-CH₂X³³、-OCX³³ ₃、-OCH₂X³³、-OCHX³³ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、R³⁴-取代或未取代的烷基(例如，C₁-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、R³⁴-取代或未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、R³⁴-取代或未取代的环烷基(例如，C₃-C₈、C₃-C₆、C₄-C₆或C5-C₆)、R³⁴-取代或未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、R³⁴-取代或未取代的芳基(例如，C₆-C₁₀或苯基)或R³⁴-取代或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。在方面中，R³³独立地为氧代、卤素、-CX³³ ₃、-CHX³³ ₂、-CH₂X³³、-OCX³³ ₃、-OCH₂X³³、-OCHX³³ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C1-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C3-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C6-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³³独立地为-F、-Cl、-Br或-I。

在实施方案中，R³³独立地为未取代的甲基。在方面中，R³³独立地是未取代的乙基。

R³⁴独立地为氧代、卤素、-CX³⁴ ₃、-CHX³⁴ ₂、-CH₂X³⁴、-OCX³⁴ ₃、-OCH₂X³⁴、-OCHX³⁴ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C1-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C3-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C6-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³⁴独立地为-F、-Cl、-Br或-I。

在实施方案中，R³⁴独立地为未取代的甲基。在方面中，R³⁴独立地为未取代的乙基。

在实施方案中，R^3A是氢、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，R^3A是氢、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的芳基或取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂芳基。

在实施方案中，R^3A是氢、取代或未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、取代或未取代的(例如2至20元、2至10元、2至5元)杂烷基、取代或未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、取代或未取代的(例如3至8元、3至6元、3至5元)杂环烷基、取代或未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或取代或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^3A是氢、未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、未取代的(例如2至20元、2至10元、2至5元)杂烷基、未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、未取代的(例如3至8元、3至6元、3至5元)杂环烷基、未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^3B是氢、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，R^3B是氢、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的芳基或取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂芳基。

在实施方案中，R^3B是氢、取代或未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、取代或未取代的(例如2至20元、2至10元、2至5元)杂烷基、取代或未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、取代或未取代的(例如3至8元、3至6元、3至5元)杂环烷基、取代或未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或取代或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^3B是氢、未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、未取代的(例如2至20元、2至10元、2至5元)杂烷基、未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、未取代的(例如3至8元、3至6元、3至5元)杂环烷基、未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，L²是键、-S(O)₂-、-NR^4A-、-O-、-S-、-C(O)-、-C(O)NR^4A-、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、取代或未取代的亚杂芳基、或者取代或未取代的烷基亚芳基。在实施方案中，L²是键、-S(O)₂-、-NR^4A-、-O-、-S-、-C(O)-、-C(O)NR^4A-、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，L²是键、取代或未取代的亚烷基、取代或未取代的亚杂烷基、或取代或未取代的烷基亚芳基。在实施方案中，L²是键、取代或未取代的亚烷基或取代或未取代的亚杂烷基。在方面中，L²是键、未取代的亚烷基或未取代的亚杂烷基。在方面中，L²是未取代的亚烷基。在方面中，L²是未取代的亚杂烷基。在方面中，L²是键。在方面中，L²是键或取代或未取代的烷基亚芳基。在方面中，L²是键或未取代的烷基亚芳基。在方面中，L²是未取代的烷基亚芳基。在方面中，L²是亚苄基。

在实施方案中，L²是-O-、-S-、R³⁵取代或未取代的C₁-C₂亚烷基(例如，C₁或C₂)或R³⁵取代或未取代的2元亚杂烷基。在方面中，L²是被R³⁵取代或未被取代的亚烷基(例如，C₁-C₈亚烷基、C₁-C₆亚烷基或C₁-C₄亚烷基)、被R³⁵取代或未被取代的亚杂烷基(例如，2到8元亚杂烷基、2到6元亚杂烷基或2到4元亚杂烷基)、被R³⁵取代或未被取代的亚环烷基(例如，C₃-C₈亚环烷基、C₃-C₆亚环烷基或C₅-C₆亚环烷基)、被R³⁵取代或未被取代的亚杂环烷基(例如，3到8元亚杂环烷基、3到6元亚杂环烷基或5到6元亚杂环烷基)、被R³⁵取代或未被取代的亚芳基(例如，C₆-C₁₀亚芳基、C₁₀亚芳基、或亚苯基)或被R³⁵取代或未被取代的亚杂芳基(例如，5到10元亚杂芳基、5到9元亚杂芳基或5到6元亚杂芳基)。在方面中，L²是-O-、-S-、未取代的C₁-C₂亚烷基(例如，C₁或C₂)或未取代的2元亚杂烷基。在方面中，L²是未被取代的亚甲基。在方面中，L²是未被取代的亚乙基。在方面中，L²是取代的2元亚杂烷基。在方面中，L²是取代的3元亚杂烷基。在方面中，L²是取代的4元亚杂烷基。在方面中，L²是未取代的2元亚杂烷基。在方面中，L²是未取代的3元亚杂烷基。在方面中，L²是未取代的4元亚杂烷基。

R³⁵独立地为氧代、卤素、-CX³⁵ ₃、-CHX³⁵ ₂、-CH₂X³⁵、-OCX³⁵ ₃、-OCH₂X³⁵、-OCHX³⁵ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、R³⁶-取代或未取代的烷基(例如，C₁-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、R³⁶-取代或未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、R³⁶-取代或未取代的环烷基(例如，C₃-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、R³⁶-取代或未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、R³⁶-取代或未取代的芳基(例如，C₆-C₁₀或苯基)或R³⁶-取代或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。在方面中，R³⁵独立地为氧代、卤素、-CX³⁵ ₃、-CHX³⁵ ₂、-CH₂X³⁵、-OCX³⁵ ₃、-OCH₂X³⁵、-OCHX³⁵ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C1-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C3-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C6-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³⁵独立地为-F、-Cl、-Br或-I。

在实施方案中，R³⁵独立地为未取代的甲基。在方面中，R³⁵独立地为未取代的乙基。

R³⁶独立地为氧代、卤素、-CX³⁶ ₃、-CHX³⁶ ₂、-CH₂X³⁶、-OCX³⁶ ₃、-OCH₂X³⁶、-OCHX³⁶ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、R³⁷-取代或未取代的烷基(例如，C₁-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、R³⁷-取代或未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、R³⁷-取代或未取代的环烷基(例如，C₃-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、R³⁷-取代或未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、R³⁷-取代或未取代的芳基(例如，C₆-C₁₀或苯基)或R³⁷-取代或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。在方面中，R³⁶独立地为氧代、卤素、-CX³⁶ ₃、-CHX³⁶ ₂、-CH₂X³⁶、-OCX³⁶ ₃、-OCH₂X³⁶、-OCHX³⁶ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C1-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C3-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C6-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³⁶独立地为-F、-Cl、-Br或-I。

在实施方案中，R³⁶独立地为未取代的甲基。在方面中，R³⁶独立地为未取代的乙基。

R³⁷独立地为氧代、卤素、-CX³⁷ ₃、-CHX³⁷ ₂、-CH₂X³⁷、-OCX³⁷ ₃、-OCH₂X³⁷、-OCHX³⁷ ₂、-CN、-OH、-NH₂、-COOH、-CONH₂、-NO₂、-SH、-SO₃H、-SO₄H、-SO₂NH₂、-NHNH₂、-ONH₂、-NHC＝(O)NHNH₂、-NHC＝(O)NH₂、-NHSO₂H、-NHC＝(O)H、-NHC(O)-OH、-NHOH、-N₃、未取代的烷基(例如，C1-C₈、C₁-C₆、C₁-C₄或C₁-C₂)、未取代的杂烷基(例如，2至8元、2至6元、4至6元、2至3元或4至5元)、未取代的环烷基(例如，C3-C₈、C₃-C₆、C₄-C₆或C₅-C₆)、未取代的杂环烷基(例如，3至8元、3至6元、4至6元、4至5元或5至6元)、未取代的芳基(例如，C6-C₁₀或苯基)或未取代的杂芳基(例如，5至10元、5至9元或5至6元)。X³⁷独立地为-F、-Cl、-Br或-I。

在实施方案中，R³⁷独立地为未取代的甲基。在方面中，R³⁷独立地为未取代的乙基。

在实施方案中，R^4A是氢、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，R^4A是氢、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的芳基或取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂芳基。

在实施方案中，R^4A是氢、取代或未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、取代或未取代的(例如2至20元、2至10元、2至5元)杂烷基、取代或未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、取代或未取代的(例如3至8元、3至6元、3至5元)杂环烷基、取代或未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或取代或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^4A是氢、未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、未取代的(例如2至20元、2至10元、2至5元)杂烷基、未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、未取代的(例如3至8元、3至6元、3至5元)杂环烷基、未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^4B是氢、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基。

在实施方案中，R^4B是氢、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂环烷基、取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的芳基或取代(例如，被取代基、大小限制的取代基或低级取代基取代)或未取代的杂芳基。

在实施方案中，R^4B是氢、取代或未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、取代或未取代的(例如2至20元、2至10元、2至5元)杂烷基、取代或未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、取代或未取代的(例如3至8元、3至6元、3至5元)杂环烷基、取代或未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或取代或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，R^4B是氢、未取代的(例如，C₁-C₂₀、C₁-C₁₀、C₁-C₅)烷基、未取代的(例如2至20元、2至10元、2至5元)杂烷基、未取代的(例如，C₃-C₈、C₃-C₆、C₃-C₅)环烷基、未取代的(例如3至8元、3至6元、3至5元)杂环烷基、未取代的(例如，C₆-C₁₀、C₆-C₈、C₆-C₅)芳基或未取代的(例如5至10元、5至8元、5至6元)杂芳基。

在实施方案中，X¹是亚咪唑基、-NH-或-O-。在方面中，X¹是亚咪唑基(即，二价咪唑)。在方面中，X¹是-NH-。在方面中，X¹是-O-。

在实施方案中，第一生物分子部分是肽基部分。在方面中，第二生物分子部分是肽基部分。在方面中，第一生物分子部分是肽基部分，并且第二生物分子部分是肽基部分。在方面中，第一生物分子部分和第二生物分子部分中的肽基部分在同一蛋白质中。在方面中，第一生物分子部分和第二生物分子部分中的肽基部分在不同的蛋白质中。在实施方案中，不同蛋白质是单结构域抗体和膜受体。在实施方案中，不同蛋白质是抗体和膜受体。在实施方案中，不同蛋白质是抗原结合片段和膜受体。在实施方案中，不同蛋白质是亲和体和膜受体。在实施方案中，不同蛋白质是单链可变片段和膜受体。

在实施方案中，-L¹-R¹是肽基部分。在实施方案中，-L²-R²是肽基部分。在方面中，-L¹-R¹和-L²-R²的肽基部分在相同蛋白质中。在方面中，-L¹-R¹和-L²-R²的肽基部分在不同蛋白质中。在多个方面，L¹是键。在方面中，L²是键。在方面中，L¹和L²是键。在实施方案中，不同蛋白质是单结构域抗体和膜受体。在实施方案中，不同蛋白质是抗体和膜受体。在实施方案中，不同蛋白质是单链可变片段和膜受体。在实施方案中，不同蛋白质是亲和体和膜受体。在实施方案中，不同蛋白质是抗原结合片段和膜受体。

在实施方案中，第一生物分子部分是核酸部分或碳水化合物部分。在实施方案中，第一生物分子部分是核酸部分。在实施方案中，第一生物分子部分是碳水化合物部分。在实施方案中，第二生物分子部分是核酸部分或碳水化合物部分。在实施方案中，第二生物分子部分是核酸部分。在实施方案中，第二生物分子部分是碳水化合物部分。

在实施方案中，-L¹-R¹是核酸部分或碳水化合物部分。在方面中，-L¹-R¹是核酸部分。在方面中，-L¹-R¹是碳水化合物部分。在方面中，-L²-R²是核酸部分或碳水化合物部分。在方面中，-L²-R²是核酸部分。在方面中，-L²-R²是碳水化合物部分。在多个方面，L¹是键。在方面中，L²是键。在方面中，L¹和L²是键。

在实施方案中，第一生物分子部分选自由小分子部分、肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，第二生物分子部分选自由小分子部分、肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，第一生物分子部分与第二生物分子部分相同。在方面中，第一生物分子部分与第二生物分子部分不同。在方面中，第一生物分子部分和第二生物分子部分在同一生物分子内。在方面中，第一生物分子部分和第二生物分子部分在不同的生物分子中。在方面中，第一生物分子部分是小分子部分，并且第二生物分子部分是肽基部分。在方面中，第一生物分子部分是肽基部分，并且第二生物分子部分是小分子部分。

在实施方案中，第一生物分子部分选自由肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，第二生物分子部分选自肽基部分、核酸部分和碳水化合物部分。在方面中，第一生物分子部分与第二生物分子部分相同。在方面中，第一生物分子部分与第二生物分子部分不同。在方面中，第一生物分子部分和第二生物分子部分在同一生物分子内。在方面中，第一生物分子部分和第二生物分子部分在不同的生物分子中。在方面中，第一生物分子部分和第二生物分子部分各自独立地是肽基部分。

在实施方案中，-L¹-R¹选自由小分子部分、肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，-L²-R²选自由小分子部分、肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，-L¹-R¹是小分子部分。在方面中，-L²-R²是小分子部分。在多个方面，L¹是键。在方面中，L²是键。在方面中，L¹和L²是键。

在实施方案中，-L¹-R¹选自由肽基部分、核酸部分和碳水化合物部分组成的组。在方面中，-L²-R²选自肽基部分、核酸部分和碳水化合物部分。在方面中，-L¹-R¹是与-L²-R²相同。在方面中，-L¹-R¹是与-L²-R²不同。在方面中，-L¹-R¹和-L²-R²各自独立地为肽基部分。在多个方面，L¹是键。在方面中，L²是键。在方面中，L¹和L²是键。

在方面中，本公开提供了一种蛋白质，其包含式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合：

在方面中，蛋白质包含式(IV)的部分。在方面中，蛋白质包含式(V)的部分。在方面中，蛋白质包含式(VI)的部分。在方面中，蛋白质包含式(IV)的部分和式(V)的部分。在方面中，蛋白质包含式(IV)的部分和式(VI)的部分。在方面中，蛋白质包含式(V)的部分和式(VI)的部分。在方面中，蛋白质包含式(IV)的部分、式(V)的部分和式(VI)的部分。在方面中，式(IV)、(V)、(VI)的部分或其组合形成分子内共价键。在方面中，式(IV)的部分形成分子内共价键。在方面中，式(V)的部分形成分子内共价键。在方面中，式(VI)的部分形成分子内共价键。在方面中，式(IV)和(V)的部分形成分子内共价键。在方面中，式(IV)和(VI)的部分形成分子内共价键。在方面中，式(V)和(VI)的部分形成分子内共价键。在方面中，式(IV)、(V)和(VI)的部分形成分子内共价键。在方面中，式(IV)、(V)、(VI)的部分或其组合形成分子间共价键。在方面中，式(IV)的部分形成分子间共价键。在方面中，式(V)的部分形成分子间共价键。在方面中，式(VI)的部分形成分子间共价键。在方面中，式(IV)和(V)的部分形成分子间共价键。在方面中，式(IV)和(VI)的部分形成分子间共价键。在方面中，式(V)和(VI)的部分形成分子间共价键。在方面中，式(IV)、(V)和(VI)的部分形成分子间共价键。

在方面中，本公开提供式(I)、式(II)或式(III)的蛋白质：

其中R¹和R²各自独立地是连接在一起的肽基部分，即，式(I)、(II)和(III)的蛋白质包含分子内共价键。在方面中，该蛋白质是式(I)。在方面中，该蛋白质是式(II)。在方面中，该蛋白质是式(III)。在方面中，R¹的肽基部分和R²的肽基部分包含蛋白质α链。在方面中，R¹的肽基部分和R²的肽基部分包含蛋白质β链。在方面中，R¹的肽基部分包含蛋白质α链并且R²的肽基部分包含蛋白质β链。在方面中，R¹的肽基部分包含蛋白质β链并且R²的肽基部分包含蛋白质α链。

在方面中，本公开提供式(I)、式(II)或式(III)的蛋白质：

其中R¹是第一蛋白质的肽基部分，R²是第二蛋白质的肽基部分，即两个蛋白质之间存在分子间共价键。在方面中，分子间键在两个不同蛋白质之间。在方面中，分子间键在两个相同蛋白之间(例如，两个具有相同氨基酸序列的蛋白在分子间键合)。在方面中，第一蛋白质经由式(IV)的部分共价键合至第二蛋白质以形成式(I)的分子间键合的蛋白质。在方面中，第一蛋白质经由式(V)的部分共价键合至第二蛋白质以形成式(II)的分子间键合的蛋白质。在方面中，第一蛋白质经由式(VI)的部分共价键合至第二蛋白质以形成式(III)的分子间键合的蛋白质。在方面中，第一蛋白质经由式(IV)的部分和式(IV)的部分共价键合至第二蛋白质。在方面中，第一蛋白质经由式(IV)的部分和式(VI)的部分共价键合至第二蛋白质。在方面中，第一蛋白质经由式(V)的部分和式(VI)的部分共价键合至第二蛋白质。在方面中，第一蛋白质经由式(IV)的部分、式(V)的部分和式(VI)的部分共价键合至第二蛋白质。在方面中，第一蛋白质是激素，第二蛋白质是激素的受体。在方面中，第一蛋白质是抗体或抗体变体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是抗体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是抗体变体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是抗体结合片段，并且第二蛋白质是膜受体。在方面中，第一蛋白质是单链可变片段，并且第二蛋白质是膜受体。在方面中，第一蛋白质是单结构域抗体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是亲和体，并且第二蛋白质是膜受体。在方面中，第一蛋白质是单结构域抗体，并且第二蛋白质是激素受体。在方面中，肽基部分R¹和R²包含蛋白质α链。在方面中，肽基部分R¹和R²包含蛋白质β链。在方面中，肽基部分R¹包含蛋白质α链并且肽基部分R²包含蛋白质β链。在方面中，肽基部分R¹包含蛋白质β链并且肽基部分R²包含蛋白质α链。在方面中，R¹是抗体或抗体变体，并且R²是膜受体。在方面中，R¹是抗体，并且R²是膜受体。在方面中，R¹是抗体变体，并且R²是膜受体。在方面中，R¹是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体，并且R²是膜受体。在方面中，R¹是抗原结合片段，并且R²是膜受体。在方面中，R¹是单链可变片段，并且R²是膜受体。在方面中，R¹是单结构域抗体，并且R²是膜受体。在方面中，R¹是亲和体，并且R²是膜受体。在方面中，R¹是膜受体，并且R²是抗体或抗体变体。在方面中，R¹是膜受体，并且R²是抗体。在方面中，R¹是膜受体，并且R²是抗体变体。在方面中，R¹是膜受体，并且R²是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。在方面中，R¹是膜受体，并且R²是抗原结合片段。在方面中，R¹是膜受体，并且R²是单链可变片段。在方面中，R¹是膜受体，并且R²是单结构域抗体。在方面中，R¹是膜受体，并且R²是亲和体。

在方面中，蛋白质缀合物可包含三种或更多种不同和/或单独的蛋白质。例如，第一蛋白经由式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合与第二蛋白共价键合；并且第二蛋白质经由式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合与第三蛋白共价键合。作为另一个示例，第一蛋白经由式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合与第二蛋白共价键合；并且第一蛋白也通过式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合与第三蛋白共价键合。在这些方面的每一个中，第一蛋白质、第二蛋白质和第三蛋白质各自可任选地还包含式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合，其中R¹和R²的肽基部分分别在第一蛋白质、第二蛋白质或第三蛋白质内形成分子内键。

在实施方案中，本公开提供了包含非天然氨基酸的小分子部分、膜受体、抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。其中非天然氨基酸具有式(F)的侧链：

在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的膜受体。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的小分子部分。在实施方案中，本公开提供包含式(F)的非天然氨基酸侧链的抗体。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的抗原结合片段、单链可变片段。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的单链可变片段。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的单结构域抗体。在实施方案中，本公开提供了包含式(F)的非天然氨基酸侧链的亲和体。

在实施方案中，本文所述的生物分子和蛋白质包含膜受体。在实施方案中，膜受体是程序性细胞死亡蛋白质1(PD-1)受体、程序性死亡配体1(PD-L1)受体、5-羟色胺受体、乙酰胆碱受体、腺苷受体、腺苷A2A受体、腺苷A2B受体、血管紧张素受体、爱帕琳肽受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素受体、趋化因子受体、胆囊收缩素受体、A类孤儿受体、多巴胺受体、内皮素受体、表皮生长因子受体(EGFR)、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、生长素释放肽受体、糖蛋白激素受体、促性腺激素释放激素受体、G蛋白偶联受体、G蛋白偶联雌激素受体、组胺受体、羟基羧酸受体、亲吻素受体、白三烯受体、溶血磷脂受体、溶血磷脂S1P受体、黑色素浓集激素受体、黑皮质素受体、褪黑激素受体、胃动素受体、神经介素U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片受体、视蛋白受体、食欲素受体、氧代戊二酸受体、P2Y受体、血小板活化因子受体、促动素原受体、催乳素释放肽受体、前列腺素样受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、微量胺受体、尾加压素受体、加压素受体或其两种或多种的组合。

在实施方案中，膜受体是PD-1受体或PD-L1受体。在实施方案中，膜受体是PD-1受体。在实施方案中，膜受体是PD-L1受体。

在实施方案中，膜受体是在癌细胞上表达的受体。在实施方案中，膜受体是相对于对照在癌细胞上过表达的受体。

在实施方案中，膜受体是G蛋白偶联受体。在实施方案中，膜受体是受体酪氨酸激酶。在实施方案中，受体蛋白质是ErbB受体。在实施方案中，膜受体是表皮生长因子受体(EGFR)。在实施方案中，膜受体是表皮生长因子受体1(HERl)。在实施方案中，膜受体是表皮生长因子受体2(HER2)。在实施方案中，膜受体是表皮生长因子受体3(HER3)。在实施方案中，膜受体是表皮生长因子受体4(HER4)。

在实施方案中，膜受体是EGFR。在实施方案中，膜受体是在癌细胞上表达的EGFR。在实施方案中，膜受体是相对于对照在癌细胞上过表达的EGFR。

本文提供了用FSK或FSY修饰的纳米抗体7D12。纳米抗体7D12如SEQ ID NO：88所示，其中CDR1如SEQ ID NO：95所示，CDR2如SEQ ID NO：96所示，并且CDR3如SEQ ID NO：97所示。

SEQ ID NO：88

SEQ ID NO：95＝RTSRSYGMG

SEQ ID NO：96＝GISWRGDS

SEQ ID NO：97＝AAGSAWYGTLYEYDY

本文提供了纳米抗体7D12，其中纳米抗体中的至少一个氨基酸是FSK。在实施方案中，纳米抗体包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ IDNO：97所示的CDR3；其中对应于30位或31位的位置处的氨基酸是FSK。在实施方案中，纳米抗体包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3；其中对应于30位的位置处的氨基酸是FSK(即，其中30位对应于SEQ ID NO：95中的4位)。在实施方案中，纳米抗体包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3；其中对应于31位的位置处的氨基酸是FSK(即，其中31位对应于SEQ ID NO：95中的5位)。在实施方案中，纳米抗体包含如SEQ ID NO：98所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。在实施方案中，纳米抗体包含如SEQ ID NO：99所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。在序列中，X^FSK是FSK。

SEQ ID NO：98＝RTSX^FSKSYGMG

SEQ ID NO：99＝RTSRX^FSKYGMG

在实施方案中，纳米抗体7D12具有SEQ ID NO：35或SEQ ID NO：88中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSK。在实施方案中，纳米抗体7D12具有SEQID NO：35中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSK。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSK。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于30位或31位的位置处的氨基酸是FSK。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于30位的位置处的氨基酸是FSK(即，SEQ ID NO：89)。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于31位的位置处的氨基酸是FSK(即，SEQ ID NO：90)。

在实施方案中，纳米抗体包含SEQ ID NO：89。在实施方案中，纳米抗体如SEQ IDNO：89所示。在实施方案中，纳米抗体与SEQ ID NO：89具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：89具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：89中30位的位置处含有FSK。在实施方案中，当纳米抗体与SEQ ID NO：89具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：89内的CDR1、CDR2和CDR3具有100％的序列同一性。在SEQ ID NO：89中，X^FSK是FSK。

SEQ ID NO：89

在实施方案中，纳米抗体包含SEQ ID NO：90。在实施方案中，纳米抗体如SEQ IDNO：90所示。在实施方案中，纳米抗体与SEQ ID NO：90具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：90具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：90中31位的位置处含有FSK。在实施方案中，当纳米抗体与SEQ ID NO：90具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：90内的CDR1、CDR2和CDR3具有100％的序列同一性。在SEQ ID NO：90中，X^FSK是FSK。

SEO ID NO：90

本文提供了纳米抗体7D12，其中纳米抗体中的至少一个氨基酸是FSY。在实施方案中，纳米抗体7D12包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQID NO：97所示的CDR3；其中对应于109位或113位的位置处的氨基酸是FSY。在实施方案中，纳米抗体7D12包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ IDNO：97所示的CDR3；其中对应于109位的位置处的氨基酸是FSY(即，其中109位对应于SEQ IDNO：97中的11位)。在实施方案中，纳米抗体7D12包含如SEQ ID NO：95所示的CDR1、如SEQ IDNO：96所示的CDR2以及如SEQ ID NO：100所示的CDR3。在实施方案中，纳米抗体7D12包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：101所示的CDR3。在序列中，X^FSY是FSY。

SEQ ID NO：100＝AAGSAWYGTLX^FSYEYDY

SEQ ID NO：101＝AAGSAWYGTLYEYDX^FSY

在实施方案中，纳米抗体7D12具有SEQ ID NO：35或SEQ ID NO：88中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSY。在实施方案中，纳米抗体7D12具有SEQID NO：35中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSY。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中氨基酸序列中的至少一个氨基酸是FSY。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于1位、109位、113位或116位的位置处的氨基酸是FSY。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于1位的位置处的氨基酸是FSY(即，SEQ IDNO：91)。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于109位的位置处的氨基酸是FSY(即，SEQ ID NO：92)。在实施方案中，纳米抗体7D12具有SEQID NO：88中所示的氨基酸序列，其中对应于113位的位置处的氨基酸是FSY(即，SEQ ID NO：93)。在实施方案中，纳米抗体7D12具有SEQ ID NO：88中所示的氨基酸序列，其中对应于116位的位置处的氨基酸是FSY(即，SEQ ID NO：94)。

在实施方案中，纳米抗体包含SEQ ID NO：91。在实施方案中，纳米抗体如SEQ IDNO：91所示。在实施方案中，纳米抗体与SEQ ID NO：91具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：91具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：91中1位的位置处含有FSY。在实施方案中，当纳米抗体与SEQ ID NO：91具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：91内的CDR1、CDR2和CDR3具有100％的序列同一性，并且纳米抗体在对应于SEQ ID NO：91中的1位的位置处具有FSY。在SEQ ID NO：91中，X^FSY是FSY。

SEQ ID NO：91

在实施方案中，纳米抗体包含SEQ ID NO：92。在实施方案中，纳米抗体如SEQ IDNO：92所示。在实施方案中，纳米抗体与SEQ ID NO：92具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：92具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：92中109位的位置处含有FSY。在实施方案中，当纳米抗体与SEQ ID NO：92具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：92内的CDR1、CDR2和CDR3具有100％的序列同一性。在SEQ ID NO：92中，X^FSY是FSY。

SEQ ID NO：92

在实施方案中，纳米抗体包含SEQ ID NO：93。在实施方案中，纳米抗体如SEQ IDNO：93所示。在实施方案中，纳米抗体与SEQ ID NO：93具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：93具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：93中113位的位置处含有FSY。在实施方案中，当纳米抗体与SEQ ID NO：93具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：93内的CDR1、CDR2和CDR3具有100％的序列同一性。在SEQ ID NO：93中，X^FSY是FSY。

SEQ ID NO：93

在实施方案中，纳米抗体包含SEQ ID NO：94。在实施方案中，纳米抗体如SEQ IDNO：94所示。在实施方案中，纳米抗体与SEQ ID NO：94具有至少85％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少90％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少92％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少94％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少95％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少96％的序列同一性。在实施方案中，纳米抗体与SEQ ID NO：94具有至少98％的序列同一性。在序列同一性小于100％的实施方案中，纳米抗体必须在对应于SEQ ID NO：94中116位的位置处含有FSY。在实施方案中，当纳米抗体与SEQ ID NO：94具有小于100％的序列同一性时，则纳米抗体与SEQ ID NO：94内的CDR1、CDR2和CDR3具有100％的序列同一性，并且纳米抗体在对应于SEQ ID NO：94中的116位的位置处具有FSY。在SEQ ID NO：94中，X^FSY是FSY。

SEQ ID NO：94

在实施方案中，本公开提供了包含纳米抗体7D12和药学上可接受的赋形剂的药物组合物，其中氨基酸序列中的至少一个氨基酸是FSK(包括如本文所述的实施方案)。在实施方案中，药物组合物包含SEQ ID NO：89(包括其实施方案)和药学上可接受的载体。在实施方案中，药物组合物包含SEQ ID NO：90(包括其实施方案)和药学上可接受的赋形剂。在实施方案中，药物组合物包含纳米抗体和药学上可接受的赋形剂，该纳米抗体包含如SEQ IDNO：98所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。在实施方案中，药物组合物包含纳米抗体和药学上可接受的赋形剂，该纳米抗体包含如SEQ ID NO：99所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。

在实施方案中，本公开提供了包含纳米抗体7D12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSK(包括如本文所述的实施方案)，其经由FSK的氨基酸侧链与EGFR蛋白质中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSK(包括如本文所述的实施方案)，其经由FSK的氨基酸侧链与EGFR蛋白质中的赖氨酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSK(包括如本文所述的实施方案)，其经由FSK的氨基酸侧链与EGFR蛋白质中的组氨酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D 12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSK(包括如本文所述的实施方案)，其经由FSK的氨基酸侧链与EGFR蛋白质中的酪氨酸共价键合。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：89(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的赖氨酸氨基酸共价键合的SEQ IDNO：89(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：89(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的酪氨酸氨基酸共价键合的SEQ ID NO：89(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：90(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的赖氨酸氨基酸共价键合的SEQ ID NO：90(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：90(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSK与EGFR中的酪氨酸氨基酸共价键合的SEQ IDNO：90(包括其实施方案)。

在实施方案中，本公开提供了包含纳米抗体7D 12和药学上可接受的载体的药物组合物，其中氨基酸序列中的至少一个氨基酸是FSY(包括如本文所述的实施方案)。在实施方案中，药物组合物包含SEQ ID NO：91(包括其实施方案)和药学上可接受的载体。在实施方案中，药物组合物包含SEQ ID NO：92(包括其实施方案)和药学上可接受的载体。在实施方案中，药物组合物包含SEQ ID NO：93(包括其实施方案)和药学上可接受的载体。在实施方案中，药物组合物包含SEQ ID NO：94(包括其实施方案)和药学上可接受的载体。在实施方案中，药物组合物包含纳米抗体和药学上可接受的赋形剂，该纳米抗体包含如SEQ IDNO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：100所示的CDR3。在实施方案中，药物组合物包含纳米抗体和药学上可接受的赋形剂，该纳米抗体包含如SEQ IDNO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：101所示的CDR3。

在实施方案中，本公开提供了包含纳米抗体7D 12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSY(包括如本文所述的实施方案)，其经由FSY的氨基酸侧链与EGFR蛋白质中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D 12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSY(包括如本文所述的实施方案)，其经由FSY的氨基酸侧链与EGFR蛋白质中的赖氨酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D 12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSY(包括如本文所述的实施方案)，其经由FSY的氨基酸侧链与EGFR蛋白质中的组氨酸共价键合。在实施方案中，本公开提供了包含纳米抗体7D 12的生物分子缀合物，其中氨基酸序列中的至少一个氨基酸是FSY(包括如本文所述的实施方案)，其经由FSY的氨基酸侧链与EGFR蛋白质中的酪氨酸共价键合。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：91(包括其实施方案)。在实施方案中，生物分子缀合物包含经由F SY与EGFR中的赖氨酸氨基酸共价键合的SEQ IDNO：91(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：91(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的酪氨酸氨基酸共价键合的SEQ ID NO：91(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：92(包括其实施方案)。在实施方案中，生物分子缀合物包含经由F SY与EGFR中的赖氨酸氨基酸共价键合的SEQ ID NO：92(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：92(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的酪氨酸氨基酸共价键合的SEQ IDNO：92(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：93(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸氨基酸共价键合的SEQ ID NO：93(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：93(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的酪氨酸氨基酸共价键合的SEQ ID NO：93(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸、组氨酸或酪氨酸氨基酸共价键合的SEQ ID NO：94(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的赖氨酸氨基酸共价键合的SEQ ID NO：94(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的组氨酸氨基酸共价键合的SEQ ID NO：94(包括其实施方案)。在实施方案中，生物分子缀合物包含经由FSY与EGFR中的酪氨酸氨基酸共价键合的SEQ ID NO：94(包括其实施方案)。

吡咯赖氨酰-tRNA合成酶

如本文所述，可以将非天然氨基酸(例如，FSK)插入或替换生物分子(例如，蛋白质)中的天然存在的氨基酸。为了将非天然氨基酸插入或替换生物分子(例如蛋白质)中的氨基酸，它必须能够在蛋白质生成过程中被掺入。因此，非天然氨基酸必须存在于转移RNA分子(tRNA)上，以便可以用于翻译。氨基酸的装载通过氨酰基-tRNA合成酶进行，其是有助于将合适的氨基酸附接到tRNA分子上的酶。但是，非天然氨基酸与tRNA的附接可能不一定通过天然存在氨酰基-tRNA合成酶来完成。工程化的氨酰基-tRNA合成酶(例如，突变体吡咯赖氨酰-tRNA合成酶(PylRS))可能有助于将非天然氨基酸连接到tRNA。产生了PylRS突变体文库。与先前描述的PylRS突变体文库相比，本文产生的PylRS突变体文库是使用新的小智能诱变方法构建的，该方法允许同时突变更多数量的氨基酸残基(例如，10个氨基酸残基)。在总共选择和筛选的克隆中，鉴定出能够附接FSK的四个PylRS突变体，并且一个PylRS在附接FSK方面特别有效。

本公开提供了突变体吡咯赖氨酰-tRNA合成酶，包括在突变体吡咯赖氨酰-tRNA合成酶的底物结合位点内的至少5个氨基酸残基取代。在方面中，突变体吡咯赖氨酰-tRNA合成酶在SEQ ID NO：1的氨基酸序列中包含至少5个氨基酸残基取代。在方面中，至少5个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸以及228位处的酪氨酸，如SEQ ID NO：1的氨基酸序列所示。在方面中，在SEQ ID NO：1的氨基酸序列中，至少5个氨基酸取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；以及(v)Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶在SEQID NO：1的氨基酸序列中包含至少6个氨基酸残基取代。在方面中，至少6个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸，如SEQ ID NO：1的氨基酸序列所示。在方面中，在SEQ ID NO：1的氨基酸序列中，至少6个氨基酸残基取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。

在实施方案中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：2的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由包含SEQ ID NO：2的序列的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由与SEQ ID NO：2具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：2具有至少80％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：2具有至少85％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：2具有至少90％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：2具有至少95％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：2具有至少98％的同一性。SEQ ID NO：2另选地称为FSKRS。

在实施方案中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：86的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由包含SEQ ID NO：86的序列的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由与SEQ ID NO：86具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：86具有至少80％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：86具有至少85％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQID NO：86具有至少90％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：86具有至少95％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：86具有至少98％的同一性。在方面中，当吡咯赖氨酰-tRNA合成酶与SEQ ID NO：86具有小于100％的序列同一性时，N-末端处的前七个氨基酸总是MH6。SEQ ID NO：86另选地称为F SKRSNThis。

在实施方案中，突变体吡咯赖氨酰-tRNA合成酶由SEQ ID NO：87的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由包含SEQ ID NO：87的序列的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶由与SEQ ID NO：87具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的同一性的核酸序列编码。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：87具有至少80％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：87具有至少85％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQID NO：87具有至少90％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：87具有至少95％的同一性。在方面中，突变体吡咯赖氨酰-tRNA合成酶具有的氨基酸序列与SEQ ID NO：87具有至少98％的同一性。在方面中，当吡咯赖氨酰-tRNA合成酶与SEQ ID NO：87具有小于100％的序列同一性时，C-末端处的后六个氨基酸总是组氨酸。SEQ ID NO：87另选地称为FSKRSCThis。

载体

预期可以使用本领域公知的方法将本文提供的组合物(例如，突变体吡咯赖氨酰-tRNA合成酶，tRNA^Pyl)递送至细胞。因此，在一方面，提供了一种载体，其包含编码如本文所述的突变体吡咯赖氨酰-tRNA合成酶的核酸序列，包括其实施方案。在方面中，载体包含编码突变体吡咯赖氨酰-tRNA合成酶的核酸序列，所述合成酶包括在突变体吡咯赖氨酰-tRNA合成酶的底物结合位点内的至少5个氨基酸残基取代。在方面中，载体还包括编码tRNA^Pyl的核酸序列。在方面中，载体包含编码突变体吡咯赖氨酰-tRNA合成酶的核酸序列，该成酶包括在突变体吡咯赖氨酰-tRNA合成酶的底物结合位点内的至少5个氨基酸残基取代。在方面中，载体包含编码突变体吡咯赖氨酰-tRNA合成酶的核酸序列，该合成酶在SEQ ID NO：1的氨基酸序列中包含至少5个氨基酸残基取代。在方面中，至少5个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸以及228位处的酪氨酸，如SEQ ID NO：1的氨基酸序列所示。在方面中，在SEQ ID NO：1的氨基酸序列中，至少5个氨基酸取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；以及(v)Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶在SEQ ID NO：1的氨基酸序列中包含至少6个氨基酸残基取代。在方面中，至少5个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸，如SEQ ID NO：1的氨基酸序列所示。在方面中，在SEQ IDNO：1的氨基酸序列中，至少6个氨基酸残基取代是：(i)Y126G；(ii)M129A；(iii)V1 68F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。在方面中，载体包含编码SEQID NO：2的氨基酸序列的核酸序列。在方面中，载体包含编码SEQ ID NO：86的氨基酸序列的核酸序列。在方面中，载体包含编码SEQ ID NO：87的氨基酸序列的核酸序列。在方面中，载体还包括编码tRNA^Pyl的核酸序列。

在实施方案中，编码tRNA^Pyl的核酸序列是：

GGGGGACGGTCCGGCGACCAGCGGGTCTCTAAAACCTAGCCAGCGGGGTTCGACGCCCCGGTCTCTCGCCA(SEQ ID NO：3)。在方面中，编码tRNA^Pyl的核酸序列包含SEQ ID NO：3所示的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少80％的序列同一性的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少85％的序列同一性的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少90％的序列同一性的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少95％的序列同一性的序列。在方面中，编码tRNA^Pyl的核酸序列具有与SEQ ID NO：3具有至少98％的序列同一性的序列。

如本文所用，术语″载体″是指能够转运已与其连接的另一核酸的核酸分子。载体的一种类型是″质粒″，其是指线性或环状双链DNA环，其中可以连接其他DNA区段。载体的另一种类型是病毒载体，其中可以将另外的DNA区段连接到病毒基因组中。某些载体能够在引入它们的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在导入宿主细胞后被整合到宿主细胞的基因组中，从而与宿主基因组一起复制。在实施方案中，本公开提供包含编码本文所述吡咯赖氨酰-tRNA合成酶的核酸序列(例如，SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：86或SEQ ID NO：87，包括其实施方案和方面)的细胞基因组。在实施方案中，本公开提供了包含编码本文所述吡咯赖氨酰-tRNA合成酶的核酸序列(例如，SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：86或SEQ ID NO：87，包括其实施方案和方面)和编码tRNA^Pyl的核酸(例如，SEQ ID NO：3，包括其实施方案和方面)的细胞基因组。此外，某些载体能够指导与其可操作连接的基因的表达。此类载体在本文中称为“表达载体”。通常，在重组DNA技术中有用的表达载体通常是质粒的形式。术语“质粒”和“载体”可以互换使用，因为质粒是最常用的载体形式。然而，本公开意图包括具有等效功能的此类其他形式的表达载体，诸如病毒载体(例如，复制缺陷型逆转录病毒、腺病毒和腺伴随病毒)。另外，一些病毒载体能够特异性或非特异性靶向特定细胞类型。可以使用的示例性载体包括但不限于pEvol载体、pMP载体、pET载体、pTak载体、pBad载体。

复合物

在一方面，提供了一种复合物，其包含如本文所述的突变体吡咯赖氨酰-tRNA合成酶，包括其实施方案；以及式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

在方面中，复合物包括突变体吡咯赖氨酰-tRNA合成酶，包括在突变体吡咯赖氨酰-tRNA合成酶的底物结合位点内的至少5个氨基酸残基取代。在方面中，复合物包含编码突变体吡咯赖氨酰-tRNA合成酶的核酸序列，该合成酶在SEQ ID NO:1的氨基酸序列中包含至少5个氨基酸残基取代。在方面中，至少5个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸以及228位处的酪氨酸，如SEQ ID NO:1的氨基酸序列所示。在方面中，在SEQ ID NO:1的氨基酸序列中，至少5个氨基酸取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；以及(v)Y228P。在方面中，突变体吡咯赖氨酰-tRNA合成酶在SEQ ID NO:1的氨基酸序列中包含至少6个氨基酸残基取代。在方面中，至少6个氨基酸残基取代发生在以下残基处：126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸，如SEQ ID NO：1的氨基酸序列所示。在方面中，在SEQ ID NO：1的氨基酸序列中，至少6个氨基酸残基取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。在方面中，复合物包含编码SEQ ID NO：2的氨基酸序列的核酸序列。在方面中，复合物包含编码SEQ ID NO：86的氨基酸序列的核酸序列。在方面中，复合物包含编码SEQ ID NO：87的氨基酸序列的核酸序列。

在实施方案中，复合物包含如本文所述的突变体吡咯赖氨酰-tRNA合成酶，包括其实施方案；氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)；以及如本文所述的tRNA^Pyl，包括其实施方案。在方面中，tRNA^Pyl包含由SEQ ID NO：3编码的氨基酸序列。在方面中，tRNA^Pyl与由SEQ IDNO：3编码的氨基酸序列具有至少80％的序列同一性。在方面中，tRNA^Pyl与由SEQ ID NO：3编码的氨基酸序列具有至少85％的序列同一性。在方面中，tRNA^Pyl与由SEQ ID NO：3编码的氨基酸序列具有至少90％的序列同一性。在方面中，tRNA^Pyl与由SEQ ID NO：3编码的氨基酸序列具有至少95％的序列同一性。

组合物

本公开提供了本文提供的组合物，包括其实施方案和方面。在实施方案中，组合物包含具有式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

在实施方案中，组合物还包含体外翻译系统的组分、如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，组合物包含如本文所述的变体吡咯赖氨酰-tRNA合成酶，包括其实施方案和方面。在实施方案中，组合物包含FSK、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，组合物包含如本文所述的tRNA^Pyl，包括其实施方案和方面。在实施方案中，细胞还包含FSK、如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，组合物包含具有式(A)的FSK和选自由以下组成的组的一种或多种化合物：tRNA(例如，如本文所述)、辅因子(例如，起始因子、延伸因子、终止因子)、能量再生系统(例如，真核系统的磷酸肌酸和/或磷酸肌酸激酶，以及细菌系统的丙酮酸磷酸烯醇和/或丙酮酸激酶)、肽、盐(例如，镁盐、钾盐)、蛋白质和核糖体(例如，70S核糖体、80S核糖体)。在实施方案中，组合物包含具有式(A)的FSK和选自由以下组成的组的化合物：tRNA、辅因子、能量再生系统、盐、蛋白质、核糖体以及其两种或更多种的组合。在实施方案中，组合物包含具有式(A)的FSK和选自由以下组成的组的化合物：辅因子、能量再生系统、盐、核糖体以及其两种或更多种的组合。在实施方案中，组合物包含具有式(A)的FSK和选自由以下组成的组的化合物：tRNA、起始因子、延伸因子、终止因子、磷酸肌酸、磷酸肌酸激酶、镁盐、钾盐、80S核糖体以及其两种或更多种的组合。在实施方案中，组合物包含具有式(A)的FSK和选自由以下组成的组的化合物：tRNA、起始因子、延伸因子、终止因子、丙酮酸磷酸烯醇、丙酮酸激酶、镁盐、钾盐、70S核糖体以及其两种或更多种的组合。

体外翻译系统

在实施方案中，本公开提供了体外翻译系统，其包含如本文所述的生物分子，例如式(B)、式(C)、式(D)、式(E)、式(I)、式(II)、式(III)的生物分子，包括其实施方案和方面。在实施方案中，体外翻译系统是麦胚提取物体外翻译系统或兔网织红细胞裂解物体外翻译系统。在实施方案中，体外翻译系统是麦胚提取物体外翻译系统。在实施方案中，体外翻译系统是兔网织红细胞裂解物体外翻译系统。

细胞组合物

本公开内容提供了包含本文提供的组合物和复合物的细胞，包括其实施方案和方面。在实施方案中，细胞包含具有式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)：

在实施方案中，细胞还包含如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，细胞包含如本文所述的变体吡咯赖氨酰-tRNA合成酶，包括其实施方案和方面。在实施方案中，细胞还包含FSK、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，细胞包含如本文所述的tRNA^Pyl，包括其实施方案和方面。在实施方案中，细胞还包含FSK、如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)或其两种或更多种的组合。

在方面中，细胞包含如本文所述的载体，包括其实施方案和方面。在方面中，细胞还包含FSK、如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的复合物(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，细胞包含如本文所述的复合物，包括其实施方案和方面。在方面中，细胞还包含FSK、如本文所述的变体吡咯赖氨酰-tRNA合成酶(包括其实施方案和方面)、如本文所述的tRNA^Pyl(包括其实施方案和方面)、如本文所述的载体(包括其实施方案和方面)或其两种或更多种的组合。

在实施方案中，FSK在细胞内部被生物合成，从而产生包含FSK的细胞。在方面中，FSK包含在细胞外部的培养基中并渗透到细胞中，从而产生包含FSK的细胞。在方面中，细胞包含FSK生物分子。在方面中，细胞包含FSK蛋白。在方面中，细胞包含在细胞内部合成的FSK生物分子。在方面中，细胞包含在细胞内部合成的FSK蛋白。在方面中，细胞包含FSK生物分子，该FSY生物分子在细胞外部合成并渗透到细胞中。在方面中，细胞包含FSK蛋白，该FSY蛋白在细胞外部合成并渗透到细胞中。

在实施方案中，细胞包含本文所述的生物分子缀合物。在方面中，细胞包括生物分子缀合物，其包含通过生物缀合物接头与第二生物分子部分缀合的第一生物分子部分，其中所述生物缀合物接头具有下式：

在方面中，细胞包含式R¹-L¹-A-X¹-L²-R²的生物分子缀合物，其中取代基如本文所定义。在方面中，第一和第二生物分子部分各自独立地是肽基部分、核酸部分或碳水化合物部分。在方面中，第一和第二生物分子部分各自是相同蛋白质内的肽基部分。在方面中，第一生物分子部分和第二生物分子部分各自是不同蛋白质内(例如，在单结构域抗体内以及在膜受体内)的肽基部分。

在实施方案中，细胞包含蛋白质，该蛋白质包含式(IV)的部分、式(V)的部分、式(VI)的部分：

在方面中，式(A)、(B)或(C)的部分在蛋白质内形成分子内共价键。在方面中，式(A)、(B)或(C)的部分在两个蛋白质之间形成分子间共价键。

在实施方案中，细胞包含式(I)、式(II)或式(III)的蛋白质：

其中R¹和R²各自独立地是肽基部分。在方面中，R¹和R²结合在一起，使得式(I)、(II)和(III)的蛋白质包含分子内键。在方面中，R¹和R²是两种不同蛋白质中的肽基部分，使得式(I)、(II)和(III)的蛋白质在两种蛋白质之间包含分子间键。在实施方案中，R¹是单结构域抗体中的肽基部分，并且R²是膜受体中的肽基部分。在实施方案中，R¹是膜受体中的肽基部分，并且R²是单结构域抗体中的肽基部分。

细胞可以是任何原核或真核细胞。在方面中，细胞是原核的。在方面中，细胞为真核的。在方面中，细胞是细菌细胞、真菌细胞、植物细胞、古细菌细胞或动物细胞。在方面中，动物细胞是昆虫细胞或哺乳动物细胞。在方面中，细胞是细菌细胞。在方面中，细胞是真菌细胞。在方面中，细胞是植物细胞。在方面中，细胞是古细菌细胞。在方面中，细胞是动物细胞。在方面中，细胞是昆虫细胞。在方面中，细胞是哺乳动物细胞。在方面中，细胞是人类细胞。例如，本文所述的任何组合物可在细菌细胞如大肠杆菌，昆虫细胞，酵母或哺乳动物细胞(如Hela细胞、中国仓鼠卵巢细胞(CHO)或COS细胞)中表达。在方面中，细胞是早熟的哺乳动物细胞，即多能干细胞。在方面中，细胞源自其他人组织。其他合适的细胞是本领域技术人员已知的。

形成生物分子或生物分子缀合物的方法

本文提供的组合物可用于形成生物分子或生物分子缀合物。因此，在一方面，提供了通过使生物分子、突变体吡咯赖氨酰-tRNA合成酶、tRNA^Pyl和具有式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)接触而形成FSK生物分子的方法：

从而产生FSK生物分子，即包含FSK的非天然氨基酸的生物分子。通过该方法产生的生物分子将包含式(F)的非天然氨基酸侧链：

在生产生物分子的方法中使用的突变体吡咯赖氨酰-tRNA合成酶是本文所述的任一种。用于生产生物分子的方法中的tRNA^Pyl是本文所述的任一种。在方面中，生物分子是蛋白质。在方面中，生物分子是核酸。在方面中，生物分子是碳水化合物。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，本公开提供了用于通过使蛋白质、突变体吡咯赖氨酰-tRNA合成酶、tRNA^Pyl和具有式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)接触来产生FSK蛋白质的方法：

从而产生FSK蛋白质，即包含FSK的非天然氨基酸的蛋白质。通过该方法产生的蛋白质将包含式(F)的非天然氨基酸侧链：

在生产蛋白的方法中使用的突变体吡咯赖氨酰-tRNA合成酶是本文所述的任一种。用于生产蛋白的方法中的tRNA^Pyl是本文所述的任一种。在方面中，FSK蛋白质进一步包含赖氨酸、组氨酸、酪氨酸或其两种或更多种。在方面中，FSK蛋白质包含接近赖氨酸、组氨酸、酪氨酸或其两种或更多种的FSK。在方面中，FSK蛋白质包含在赖氨酸附近的FSK。在方面中，FSK蛋白质包含在组氨酸附近的FSK。在方面中，FSK蛋白质包含在酪氨酸附近的FSK。本文描述了术语″附近的″。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，本公开提供了用于通过使包含FSK的第一生物分子部分与第二生物分子部分接触来形成生物分子缀合物的方法，其中第二生物分子部分与第一生物分子部分中的FSK反应，从而形成生物分子缀合物。在方面中，包含FSK的第一生物分子部分是式(B)的化合物：

其中X和Y如本文所定义。在方面中，包含FSK的第一生物分子部分是式(C)的化合物：

其中R¹如本文所定义。在方面中，包含FSK的第一生物分子部分是具有式(F)氨基酸侧链的生物分子：

在方面中，第二生物分子部分包含与第一生物分子中的F SK反应的赖氨酸、组氨酸或酪氨酸。在方面中，形成生物分子缀合物的反应通过附近实现的点击化学(例如，在第一生物分子部分上的FSK与第二生物分子部分上的赖氨酸、组氨酸或酪氨酸之间)发生。在方面中，形成生物分子缀合物的反应通过硫氟交换反应(例如，在第一生物分子部分上的FSK与第二生物分子部分上的赖氨酸、组氨酸或酪氨酸之间)发生。在方面中，形成生物分子缀合物的反应通过附近实现的硫氟交换反应(例如，在第一生物分子部分上的F SK与第二生物分子部分上的赖氨酸、组氨酸或酪氨酸之间)发生。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，本公开提供了包含一个或多个分子内共价键的蛋白质(例如，蛋白质缀合物)。在方面中，FSK和附近的赖氨酸、组氨酸或酪氨酸进行反应以形成分子内共价键，从而产生式(IV)的部分、式(V)的部分、或式(VI)的部分或其两种或更多种的组合：

/>

FSK和与之接近的赖氨酸、组氨酸或酪氨酸可以在蛋白质的α链和/或蛋白质的β链上。在方面中，通过点击化学完成在FSK与赖氨酸、组氨酸或酪氨酸之间形成分子内共价键的反应。在方面中，通过附近实现的点击化学完成在FSK与赖氨酸、组氨酸或酪氨酸之间形成分子内共价键的反应。在方面中，通过硫氟交换反应完成在FSK与赖氨酸、组氨酸或酪氨酸之间形成分子内共价键的反应。在方面中，通过附近实现的硫氟交换反应完成在FSK与赖氨酸、组氨酸或酪氨酸之间形成分子内共价键的反应。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，本公开提供式(I)、(II)或(III)的蛋白质缀合物，其中R¹和R²各自独立地为肽基部分：

在方面中，R¹和R²连接在一起以形成分子内缀合的蛋白质。在方面中，R¹和R²不连接在一起。在方面中，形成蛋白质缀合物的反应通过点击化学完成。在方面中，形成蛋白质缀合物的反应通过附近实现的点击化学完成。在方面中，形成蛋白质缀合物的反应通过硫氟交换反应完成。在方面中，形成蛋白质缀合物的反应通过附近实现的硫氟交换反应完成。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，可以通过本文所述的方法和组合物将两种或更多种蛋白质共价连接。在方面中，FSK是第一蛋白质中的非天然氨基酸，而赖氨酸、组氨酸或酪氨酸是第二蛋白质中的氨基酸，其中第一蛋白质和第二蛋白质是不同的。第一蛋白质中的FSK与第二蛋白质中的赖氨酸、组氨酸或酪氨酸发生反应，从而在第一蛋白质和第二蛋白质之间形成分子间共价键。连接两种蛋白质的分子间共价键由式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合表示：

FSK和赖氨酸、组氨酸或酪氨酸可以在它们各自蛋白质的α链上和/或它们各自蛋白质的β链上。在方面中，通过点击化学完成在第一蛋白质中的FSK与第二蛋白质中的赖氨酸、组氨酸或酪氨酸之间形成分子间共价键的反应。在方面中，通过附近实现的点击化学完成在第一蛋白质中的FSK与第二蛋白质中的赖氨酸、组氨酸或酪氨酸之间形成分子间共价键的反应。在方面中，通过硫氟交换完成在第一蛋白质中的FSK与第二蛋白质中的赖氨酸、组氨酸或酪氨酸之间形成分子间共价键的反应。在方面中，通过附近实现的硫氟交换完成在第一蛋白质中的FSK与第二蛋白质中的赖氨酸、组氨酸或酪氨酸之间形成分子间共价键的反应。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

在实施方案中，本公开提供生物分子缀合物，其包含通过生物缀合物接头与第二生物分子部分缀合的第一生物分子部分，其中生物缀合物接头具有式(D)：

在方面中，生物分子缀合物具有式(E)：

或者生物分子缀合物具有式R¹-L¹-A-X¹-L²-R²，其中取代基如本文所定义。在方面中，形成生物分子缀合物的反应通过点击化学完成。在方面中，形成生物分子缀合物的反应通过附近实现的点击化学完成。在方面中，形成生物分子缀合物的反应通过硫氟交换反应完成。在方面中，形成生物分子缀合物的反应通过附近实现的硫氟交换反应完成。在方面中，该反应在体外进行。在方面中，该反应在体内进行。在方面中，该反应在一种或多种活细胞中进行。在方面中，该反应在一种或多种活细菌细胞中进行。在方面中，该反应在一种或多种活的哺乳动物细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组的一种或多种细胞中进行。在方面中，反应在选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞、昆虫细胞和哺乳动物细胞组成的组的一种或多种细胞中进行。

结合靶标的方法

本文提供了具有式(C)的结构的生物分子：

其中R¹是小分子部分、氨基酸部分或肽基部分。在实施方案中，R¹是小分子部分。在实施方案中，R¹是氨基酸部分或肽基部分。在实施方案中，R¹是氨基酸部分。在实施方案中，R¹是肽基部分。在实施方案中，R¹是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。在实施方案中，R¹是抗体。在实施方案中，R¹是抗原结合片段。在实施方案中，R¹是单链可变片段。在实施方案中，R¹是单结构域抗体。在实施方案中，R¹是亲和体。在实施方案中，R¹能够与靶标结合。在实施方案中，R¹能够与细胞表面上的靶标结合。在实施方案中，细胞表面上的靶标是受体。在实施方案中，受体是膜受体或激素受体。

在实施方案中，靶标是选自由以下组成的组的受体：乙酰胆碱受体、腺苷受体、血管紧张素受体、爱帕琳肽受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素受体、趋化因子受体、胆囊收缩素受体、A类孤儿受体、多巴胺受体、内皮素受体、表皮生长因子受体(EGFR)、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、生长素释放肽受体、糖蛋白激素受体、促性腺激素释放激素受体、G蛋白偶联雌激素受体、组胺受体、羟基羧酸受体、亲吻素受体、白三烯受体、溶血磷脂受体、溶血磷脂S1P受体、黑色素浓集激素受体、黑皮质素受体、褪黑激素受体、胃动素受体、神经介素U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片受体、视蛋白受体、食欲素受体、氧代戊二酸受体、P2Y受体、血小板活化因子受体、促动素原受体、催乳素释放肽受体、前列腺素样受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、微量胺受体、尾加压素受体以及加压素受体。在实施方案中，靶标是PD-1或PD-L1。在实施方案中，靶标是PD-1。在实施方案中，靶标是PD-L1。在实施方案中，靶标是蛋白质、核酸或碳水化合物。在实施方案中，靶标是蛋白质。在实施方案中，靶标是核酸。在实施方案中，靶标是碳水化合物。

本文提供了结合细胞上的靶标的方法，包括使细胞与式(B)的生物分子或式(C)的生物分子接触，其中生物分子能够特异性结合细胞表面上的靶标，由此生物分子与靶标形成共价键。在实施方案中，该方法包括使细胞与式(B)的生物分子接触，其中生物分子能够特异性结合细胞表面上的靶标，由此生物分子与靶标形成共价键。在实施方案中，该方法包括使细胞与式(C)的生物分子接触，其中生物分子能够特异性结合细胞表面上的靶标，由此生物分子与靶标形成共价键。在实施方案中，通过硫氟交换反应形成共价键。在实施方案中，通过附近实现的硫氟交换反应形成共价键。在实施方案中，生物分子和靶标通过具有式(D)的结构的生物缀合物接头共价连接。

″靶标″是指能够与R¹共价或非共价结合的任何化合物(例如，蛋白质)。在实施方案中，″靶标″包括但不限于小分子、肽、蛋白质、酶、抗体、抗原、脂质、代谢物、激素、碳水化合物、核酸、细胞、受体、病毒或能够与R¹共价或非共价结合的任何其他部分。在实施方案中，R¹及其氨基酸侧链(即，式(F))均可结合靶标。不希望受本发明的任何理论的束缚，并且仅出于示例性目的，对于附近诱导的偶联，R¹可以首先通过非共价结合、随后通过FSK氨基酸侧链共价结合来接合靶标。

实施方案1至57

实施方案1.一种生物分子缀合物，其包含通过生物缀合物接头与第二生物分子部分缀合的第一生物分子部分，其中该生物缀合物接头具有下式：

实施方案2.根据实施方案1所述的生物分子缀合物，其中该生物分子缀合物具有式：R¹-L¹-A-X¹-L²-R²；其中：A是生物缀合物接头；R¹是第一生物分子部分；R²是第二生物分子部分；L¹是键或第一共价接头；L²是键或第二共价接头；并且X¹是-NR⁵-、-O-、-S-或其中环A是取代或未取代的亚杂芳基或取代或未取代的亚杂环烷基，并且其中A中的氮附接到生物缀合物接头；并且R⁵是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基；其中R¹和R²任选地连接在一起以形成分子内缀合的生物分子缀合物。

实施方案3.根据实施方案2所述的生物分子缀合物，其中L¹是键、-S(O)₂-、-NR^3A-、-O-、-S-、-C(O)-、-C(O)NR^3A-、-NR^3AC(O)-、-NR^3AC(O)NR^3B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基或取代或未取代的亚杂芳基；L²是键、-S(O)₂-、-NR^4A-、-O-、-S-、-C(o)-、-C(O)NR^4A-、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、或取代或未取代的亚杂芳基；并且R^3A、R^3B、R^4A和R^4B独立地是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

实施方案4.实施方案2或3所述的生物分子缀合物，其中X¹为-NH-、-O-或亚咪唑基。

实施方案5.根据实施方案1至4中任一项所述的生物分子缀合物，其中该第一生物分子部分是肽基部分、核酸部分或碳水化合物部分。

实施方案6.根据实施方案5所述的生物分子缀合物，其中该第一生物分子部分是肽基部分；并且其中该肽基部分经由赖氨酸、组氨酸或酪氨酸与该生物缀合物接头共价键合。

实施方案7.根据实施方案1至4中任一项所述的生物分子缀合物，其中该第二生物分子部分是肽基部分、核酸部分或碳水化合物部分。

实施方案8.根据实施方案7所述的生物分子缀合物，其中该第二生物分子部分是肽基部分；并且其中该肽基部分经由赖氨酸、组氨酸或酪氨酸与该生物缀合物接头共价键合。

实施方案9.根据实施方案2至4中任一项所述的生物分子缀合物，其中-L¹-R¹是肽基部分、核酸部分或碳水化合物部分。

实施方案10.根据实施方案2至4中任一项所述的生物分子缀合物，其中-L²-R²是肽基部分、核酸部分或碳水化合物部分。

实施方案11.根据实施方案5至10中任一项所述的生物分子，其中该肽基部分包含单结构域抗体或膜受体。

实施方案12.根据实施方案1至4中任一项所述的生物分子，其中R¹中的该肽基部分包含单结构域抗体，并且R²中的该肽基部分包含膜受体；或者其中R¹中的该肽基部分包含膜受体并且R²中的该肽基部分包含单结构域抗体。

实施方案13.根据实施方案1至11中任一项所述的生物分子缀合物，其中该生物缀合物接头是分子间接头。

实施方案14.根据实施方案1至11中任一项所述的生物分子缀合物，其中该生物缀合物接头是分子内接头。

实施方案15.式(I)、式(II)或式(III)的蛋白质：

其中R¹和R²各自独立地为肽基部分；并且其中R¹和R²任选地连接在一起以形成分子内缀合的蛋白质。

实施方案16.根据实施方案15所述的蛋白质，其中该蛋白质具有式(I)。

实施方案17.根据实施方案15所述的蛋白质，其中该蛋白质具有式(II)。

实施方案18.实施方案15所述的蛋白质，其中该蛋白质具有式(III)。

实施方案19.根据实施方案15至18中任一项所述的蛋白质，其中R¹和R²各自独立地包含蛋白质α链或蛋白质β链。

实施方案20.根据实施方案15至19中任一项所述的蛋白质，其中R¹和R²不连接在一起。

实施方案21.根据实施方案15至20中任一项所述的蛋白质，其中R¹的该肽基部分包含单结构域抗体，并且R²的该肽基部分包含膜受体。

实施方案22.根据实施方案15至20中任一项所述的蛋白质，其中R¹的该肽基部分包含膜受体并且R²的肽基部分包含单结构域抗体。

实施方案23.根据实施方案15至19中任一项所述的蛋白质，其中R¹和R²连接在一起以形成分子内缀合的蛋白质。

实施方案24.一种吡咯赖氨酰-tRNA合成酶，其在具有SEQ ID NO：1的氨基酸序列的吡咯赖氨酰-tRNA合成酶的底物结合位点内包括至少6个氨基酸残基取代；其中该底物结合位点包含126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸的残基，如SEQ ID NO：1的氨基酸序列所示。

实施方案25.根据实施方案24所述的吡咯赖氨酰-tRNA合成酶，其中SEQ ID NO：1的该氨基酸序列中的该至少6个氨基酸残基的取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229I、L229V或L229I。

实施方案26.根据实施方案24所述的吡咯赖氨酰-tRNA合成酶，包含SEQ ID NO：2的氨基酸序列。

实施方案27.一种载体，其包含编码根据实施方案24至26中任一项所述的吡咯赖氨酰-tRNA合成酶的核酸序列。

实施方案28.根据实施方案27所述的载体，其还包含编码tRNA^Pyl的核酸。

实施方案29.一种复合物，其包含实施方案24至26中任一项所述的吡咯赖氨酰-tRNA合成酶和具有下式的氟磺酰氧基苯甲酰基-L-赖氨酸：

实施方案30.根据实施方案29所述的复合物，其还包含tRNA^Pyl。

实施方案31.一种细胞，其包含根据实施方案1至14中任一项所述的生物分子缀合物。

实施方案32.一种细胞，其包含根据实施方案15至23中任一项所述的蛋白质。

实施方案33.一种细胞，其包含根据实施方案24至26中任一项所述的吡咯赖氨酰-tRNA合成酶。

实施方案34.一种细胞，其包含根据实施方案27或28所述的载体。

实施方案35.一种细胞，其包含根据实施方案29或30所述的复合物。

实施方案36.一种细胞，其包含下式的氟磺酰氧基苯甲酰基-L-赖氨酸：

实施方案37.根据实施方案36所述的细胞，其还包含吡咯赖氨酰-tRNA合成酶，该吡咯赖氨酰-tRNA合成酶在具有SEQ ID NO：1的氨基酸序列的吡咯赖氨酰-tRNA合成酶的底物结合位点内包括至少6个氨基酸残基取代；其中该底物结合位点包含126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸的残基，如SEQ ID NO：1的氨基酸序列所示。

实施方案38.根据实施方案37所述的细胞，其中SEQ ID NO：1的该氨基酸序列中的该至少6个氨基酸残基的取代是：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229V或L229I。

实施方案39.根据实施方案37所述的细胞，其中该吡咯赖氨酰-tRNA合成酶包含SEQ ID NO：2的氨基酸序列。

实施方案40.根据实施方案36至39中任一项所述的细胞，其还包含tRNA^Pyl。

实施方案41.根据实施方案31至40中任一项所述的细胞，其中该细胞是细菌细胞或哺乳动物细胞。

实施方案42.一种形成根据实施方案13所述的生物分子缀合物的方法，该方法包括使氟磺酰氧基苯甲酰基-L-赖氨酸生物分子内的氟磺酰氧基苯甲酰基-L-赖氨酸部分与包含第二生物分子部分的化合物接触，其中该第二生物分子与该氟磺酰氧基苯甲酰基-L-赖氨酸部分反应；从而形成具有分子间接头的所述生物分子缀合物。

实施方案43.一种形成根据实施方案14所述的生物分子缀合物的方法，该方法包括使氟磺酰氧基苯甲酰基-L-赖氨酸生物分子内的氟磺酰氧基苯甲酰基-L-赖氨酸部分与该氟磺酰氧基苯甲酰基-L-赖氨酸生物分子中的第二生物分子部分接触，其中该第二生物分子与该氟磺酰氧基苯甲酰基-L-赖氨酸部分反应；从而形成具有分子内接头的所述生物分子缀合物。

实施方案44.根据实施方案42或43所述的方法，其中接触在细胞内进行。

实施方案45.根据实施方案42至44中任一项所述的方法，其还包括以下步骤：在接触之前：使生物分子、根据实施方案24至26中任一项所述的吡咯赖氨酰-tRNA合成酶、tRNA^Pyl以及具有下式的氟磺酰氧基苯甲酰基-L-赖氨酸接触：

以形成氟磺酰氧基苯甲酰基-L-赖氨酸生物分子。

实施方案46.一种形成根据实施方案20至22中任一项所述的蛋白质的方法，该方法包括使氟磺酰氧基苯甲酰基-L-赖氨酸蛋白质中的氟磺酰氧基苯甲酰基-L-赖氨酸与第二蛋白质中的赖氨酸、组氨酸或酪氨酸接触；从而形成分子间缀合物蛋白质。

实施方案47.一种形成根据实施方案23所述的蛋白质的方法，该方法包括使氟磺酰氧基苯甲酰基-L-赖氨酸蛋白质与包含赖氨酸、组氨酸或酪氨酸的第二蛋白质接触；从而形成分子内缀合的蛋白质。

实施方案48.根据实施方案46或47所述的方法，其还包括产生该氟磺酰氧基苯甲酰基-L-赖氨酸蛋白质，该方法包括使蛋白质、根据实施方案24至26中任一项所述的吡咯赖氨酰-tRNA合成酶、tRNA^Pyl以及具有下式的氟磺酰氧基苯甲酰基-L-赖氨酸接触：

由此产生该氟磺酰氧基苯甲酰基-L-赖氨酸蛋白质。

实施方案49.根据实施方案48所述的方法，其中接触包括硫氟交换反应。

实施方案50.实施方案48所述的方法，其中接触包括附近实现的硫氟交换反应。

实施方案51.根据实施方案46至50中任一项所述的方法，其中接触在细胞内进行。

实施方案52.一种包含非天然氨基酸的蛋白质；其中该非天然氨基酸具有下式的侧链：

实施方案53.根据实施方案52所述的蛋白质，其中该蛋白质是单结构域抗体。

实施方案54.根据实施方案52所述的蛋白质，其中该蛋白质是膜受体。

实施方案55.根据实施方案52至54中任一项所述的蛋白质，其中该非天然氨基酸邻近赖氨酸、组氨酸或酪氨酸。

实施方案56.一种蛋白质，其包含式(IV)的部分、式(V)的部分、式(VI)的部分或其两种或更多种的组合：

实施方案57.一种细胞，其包含根据实施方案52至56中任一项所述的蛋白质。

为了进一步扩展蛋白质的遗传编码的SuFEx点击化学的范围，本发明人设计了一种新的潜在生物反应性Uaa氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)并且进化出一种新的合成酶以在大肠杆菌和哺乳动物细胞中对其进行遗传编码。作为带有芳基氟硫酸酯的赖氨酸衍生物，FSK提供了更大的反应距离，并且比FSY更灵活。本发明人证明FSK可用于产生共价键以连接在分子内和分子间FSY不能到达的长距离中分离的蛋白质位点，并且可兼容用于体外和细胞中。FSK与FSY互补，使得能够通过SuFEx化学将共价键引入更宽范围的蛋白位点以用于一般应用。

实施例

以下实施例旨在进一步说明本公开的某些实施方案和方面。这些实施例无意于限制本公开或权利要求的实质或范围。

实施例1

蛋白质侧链只能通过半胱氨酸自发形成共价键。通过在蛋白质中添加新的共价键，打破了这种天然屏障，该共价键是在遗传编码的潜在生物反应性非天然氨基酸(Uaa)和附近的天然残基之间通过附近实现的反应性而形成。(参考文献：1、2)。含有卤素、丙烯酰胺、乙烯砜、氨基甲酸芳基酯、氟代硫酸酯或醌甲基化物的生物反应性uaa的集合已经被遗传编码以靶向Cys、Lys、His、Tyr和其他亲核残基。(参考文献：3-8)。这些新的共价键已经被工程化到蛋白质中以增强光学、热和各种蛋白质性质，以及光调节蛋白质结构和功能。(参考文献：1、3、9-11)。共价键也可在蛋白质之间形成，其已被用于捕获微弱和瞬时的蛋白质相互作用以用于鉴定。(参考文献：12、13)。

在生物反应性官能团中，氟代硫酸酯由于其优异的生物相容性、接近依赖性反应性和多靶向能力而特别令人感兴趣。(参考文献：14-17)。它是优秀的潜在基团，其不与非相互作用蛋白质随机反应，但仅当它们紧邻定位时才与亲核残基(包括His、Lys、Tyr)有效反应。(参考文献7)。本发明人最近遗传编码了氟代硫酸酯-L-酪氨酸(FSY)并证明其不仅用于蛋白质交联而且用于产生用于体内癌症的共价蛋白药物。(参考文献7、18)。然而，作为酪氨酸衍生物，FSY具有相对刚性的侧链和有限的反应半径，其将不能与空间上更远定位的靶标残基交联。为了使使用氟代硫酸酯产生蛋白质共价键的能力最大化，本发明人在此设计并遗传编码了氟磺酰氧基苯甲酰基-L-赖氨酸(FSK)，其带有长脂族侧链，从而提供了比FSY更大的灵活性和更长的反应距离。据表明，FSK实现在蛋白质内和之间的共价键合，其中，FSH变短，并证明了FSK在体外和细胞中的多种应用中的多用途。

FSK的设计及其到蛋白质中的遗传掺入

为了提供氟代硫酸酯的灵活性和长反应半径，通过将芳基氟代硫酸酯基团附接到Lys主链上设计了FSK，该芳基氟代硫酸酯基团对于生物相容性和SuFEx反应性是关键的(图1A)。然后使用先前描述的定向进化策略工程化正交合成酶以特异性地掺入FSK。(参考文献：19)。在几轮进化后，鉴定了四个命中，其可以有效地将FSK掺入增强型绿色荧光蛋白质(EGFP)中，从而使细胞呈现绿色荧光。其中，命中1(SEQ ID NO：2)在18℃和30℃下以最高抑制效率将FSK掺入EGFP中，并且因此被命名为FSKRS(图7至图8)。EGFP(182TAG)表达的蛋白质印迹分析还显示FSKRS仅掺入FSK而没有天然氨基酸(图9)。本发明人还测试了FSK在位点2和位点151处掺入超折叠GFP(sfGFP)。与没有FSK的对照样品相比，在两个位置处，当将FSK添加到生长培养基中时检测到强sfGFP荧光(图10)，从而证实了FSKRS对Uaa的特异性。为了进一步评估掺入保真度，本发明人将FSK掺入到6位处的小蛋白泛素中，并用ESI-MS测量纯化蛋白质的完整质量。测量的分子量9590.1Da与理论值(9589.9Da)很好地匹配，并且没有鉴定对应于天然氨基酸错误掺入的其他峰值，表明通过FSKRS的FSK掺入的高保真度(图1B)。

FSK使得能够在细胞中的FSY不能到达的距离处进行蛋白质间交联。

本发明人研究了当FSY和FSK被掺入蛋白质中并通过SuFEx反应与附近的靶向天然残基反应时，FSY和FSK的反应距离偏好(图2A)。在能量最小化状态下，Cα和F原子之间的距离对于FSY为并且对于FSK为/>(图2B)。使用这些长度作为指导，本发明人测试了它们在大肠杆菌谷胱甘肽转移酶(ecGST)(同源二聚体蛋白质)上的蛋白质间交联能力。FSY或FSK首先在二聚体界面处掺入到ecGST的位点103，在该位点附近，其他单体的His106和Lys107是潜在的靶标残基。基于ecGST晶体结构，残基103的Cα距His106的δ-N原子/>并且距Lys107的ε-N原子/>(参考文献20)。当掺入FSY时，发现强的ecGST二聚交联，但当掺入FSK时，没有检测到明显的二聚交联(图12)，表明FSK不适于在二聚体界面的有限空间中定位得太近的靶标残基。

本发明人接下来测试了FSK与对于FSY来说太远的靶标残基交联的能力。本发明人选择在ecGST的位点65处掺入FSY或FSK，在其周围存在多个亲核残基(Lys93、Tyr100、Lys132、Tyr135)，与α碳的距离从跨越到/>(图2C)。该距离应当有利于FSK反应，但是对于FSY来说太远。实际上，在将FSY或FSK掺入位点65后，发现FSK诱导了显著的ecGST二聚交联，而不是FSY(图2D)。本发明人还将FSK或FSY掺入ecGST的86位中，对于该位置，Tyr92和Tyr72分别远离/>和/>定位(图13A)。获得了类似的结果：FSK将ecGST交联成二聚体，而在相同位置处掺入的FSY没有诱导明显的交联(图13B)。

除了使同源二聚体ecGST交联之外，还比较了FSY和FSK对于异源蛋白相互作用复合物的交联能力。大肠杆菌硫氧还蛋白(TrX)与3’-磷酸腺苷-5’-磷酸硫酸酯(PAPS)还原酶相互作用。本发明人以前发现在大肠杆菌Trx的位点60掺入FSY不能有效地使Trx与PAPS还原酶交联。(参考文献：7)。检查与PAPS复合的Trx的结构显示，最接近的可能的靶标残基是PAPS的His242，其远离Trx的残基60的Cα(参考文献：21)。因此，本发明人测试了在相同位点处掺入FSK是否会由于FSK的长柔性臂而改善交联效率。令人愉快的是，虽然对于FSY仅可检测到微弱的交联，但FSK实现Trx和PAPS还原酶之间在蛋白质印迹上的稳健交联(图14)。

接下来询问FSK可以与什么亲核天然残基反应。本发明人使用sjGST蛋白质的残基对Ala97和Lys44测试了其残基特异性，其在Ala97的Cα与Lys44的Nε之间具有的距离。(参考文献：22)。本发明人通过将Lys44突变成His、Tyr、Ala、Ser或Thr并将FSK掺入97位而产生了一系列突变体(图2E)。蛋白质印迹分析显示FSK与His、Tyr、Lys残基交联形成稳定的sjGST二聚体(图2F)。如先前报道的，FSY也与His、Tyr和Lys形成稳定的交联。(参考文献：7)。FSY和FSK的一致反应性是预期的，因为它们都被设计成包含相同的氟代硫酸芳基酯基团。此外，还在位点97处将FSY掺入这些突变体中，但没有观察到任何明显的二聚sjGST交联(图2F)，这进一步证实了FSK和FSY之间的距离差异。总体来看，FSK具有与FSY相同的多靶向反应特异性，并且使得能够在FSY无法到达的距离处进行蛋白质交联。

FSK使得能够在分子内共价键合蛋白质。

在肽或蛋白质中遗传引入分子内交联是为了工程化特性(诸如热稳定性和细胞渗透性)而固定或桥接蛋白质残基的创新方式。当前方法主要依赖于两个Cys残基之间的二硫键形成或用卤素或安装在生物反应性Uaa上的Michael受体靶向Cys的硫醇基团。这极大地限制了对于交联肽或蛋白质可以产生的构象和构型的数量。由于FSK与蛋白质中比Cys更丰富的多个亲核残基反应并且具有有利的更长的反应臂，推断FSK将扩展用于遗传编码的蛋白质分子内交联的交联模式的多样性。作为概念的证明，研究了FSK在模型蛋白质泛素上的分子内交联能力。本发明人将FSK掺入泛素(Ub)的18位以接近Lys29(图3A)。(参考文献：23)。完整蛋白质的质谱分析显示质量损失为20Da的主峰(强度为75％)，表明分子内交联的成功形成(图3B)。为了确定是否如从Ub的晶体结构所预测的那样在FSK和Lys29之间发生交联，进一步用胰蛋白酶消化交联的Ub(18FSK)并用串联质谱以高分辨率进行分析。通过串联质谱(未示出)鉴定交联肽，并且交联肽的一系列b和y离子明确地证明FSK18与Ub中的Lys29反应。除了这种交联的肽之外，还鉴定掺入FSK的肽(串联质谱结果未示出)，其不与其他肽随机反应，表明FSK在产生分子内蛋白质交联中的高特异性。

FSK和FSY使得能够用纳米抗体在不同位点处共价靶向EGFR受体。

用各种蛋白质粘结剂(诸如抗体和纳米抗体)共价靶向细胞上和体内的天然受体的能力将提供用于成像、诊断和治疗的强有力的途径。EGFR是各种癌症的有价值的标志物，因此旨在用纳米抗体共价靶向该EGFR。(参考文献：24)。由于FSK和FSY具有不同的反应距离，应该能够通过将FSK或FSY掺入纳米抗体中来靶向EGFR的不同位点。基于与E²⁵复合的纳米抗体7D12的晶体结构，预测将FSK掺入纳米抗体7D12的位点30或31将潜在地与EGFR的His359交联，因为从两个位点的Cα到His359的δ-N原子的距离分别为和/>(图4A)。类似地，将FSY掺入纳米抗体7D12的位点109应当靶向EGFR的Lys443，其具有从残基109的Cα到Lys443的ε-N原子的/>的距离(图4F)。该距离对于FSK效果不太好。

为了测试这些预测，将FSK掺入到大肠杆菌中的7D12中并分离出高纯度的7D12(30FSK)和7D12(31FSK)(图14)。仅当在表达期间在生长培养基中添加FSK时获得全长7D12纳米抗体，并且纯化的纳米抗体的质谱分析证实仅掺入了FSK(图4B)。接下来通过将7D12(30FSK)或7D12(31FSK)与EGFR一起温育来评估体外交联。温育样品的SDS-PAGE分析显示，在与7D12(31FSK)温育后，EGFR凝胶带几乎完全上移，但与7D12(30FSK)或7D12(WT)温育后没有上移(图4C)。在蛋白质印迹中证实该上移带是EGFR与纳米抗体7D12(31FSK)的共价交联(图4D)。这些结果表明纳米抗体7D12(31FSK)高效地与EGFR交联。相比之下，在具有短交联距离的位点109处，在SDS-PAGE和蛋白质印迹分析中，EGFR被7D12(109FSY)交联，但未被7D12(109FSK)交联(图15)。此外，还评估了7D12(31FSK)与癌细胞表面上表达的天然EGFR受体交联的能力。将人表皮样癌细胞系A431与7D12(31FSK)或7D12(WT)一起温育。细胞裂解物的蛋白质印迹分析表明7D12(WT)不能与细胞交联，而7D12(31FSK)与EGFR共价交联，交联效率随时间从1小时到8小时增加(图4E)。这些结果证明FSK和FSY可以彼此互补以在不同的反应距离处构建有效的交联，从而允许纳米抗体与EGFR受体的不可逆结合，这将允许创建以共价模式工作的新颖的基于蛋白质的诊断和治疗。

FSK在哺乳动物细胞中的掺入和交联

为了使得能够在哺乳动物细胞中应用FSK，在人HeLa细胞中测试了FSK掺入和体内交联。将表达FSKRS和tRNA^Pyl的质粒pNEU-FSKRS转染到HeLa-EGFP(182TAG)报告细胞中。(参考文献：26)。基因组整合的EGFP基因的182TAG密码子的抑制将产生全长EGFP，从而使细胞呈现绿色荧光。仅当向细胞培养物中添加FSK时，使用共聚焦显微镜从细胞中观察到强EGFP荧光(图5A)。使用抗EGFP抗体对细胞裂解物进行的蛋白质印迹分析也显示全长EGFP仅在用FSK饲养的细胞中产生(图5B)，表明FSK掺入EGFP中。

本发明人接下来探索了哺乳动物细胞环境中蛋白质交联的FSK。将质粒pNEU-FSKRS与表达GST(WT)、GST(86TAG)或GST(86TAG/92A)的质粒pCDNA 3.1共转染到HEK293T细胞中，并且细胞在存在1mM FSK的情况下生长。用蛋白质印迹分析细胞裂解物以检测GST二聚交联。如图5C所示，将FSK掺入GST的位点86成功地导致GST二聚交联，这在阴性对照GST(WT)和GST(86TAG/92A)中没有观察到。这些结果表明，FSK可使用进化的FSKRS掺入哺乳动物系统中的蛋白质中，并进一步用于细胞中的蛋白质交联。

通过FSY或FSK介导的化学交联鉴定大肠杆菌中的Trx相互作用组

以前，仅将卤代烷Uaa掺入酶的活性位点中以探测其含有保守半胱氨酸的底物蛋白质。由于FSK和FSY对Lys、His和Tyr具有多靶向能力，推断它们可用于捕获更宽范围的缺乏Cys但在相互作用界面处具有Lys、His或Tyr的相互作用蛋白质。另外，FSY和FSK可以掺入在结合界面的周边处，而不是在活性位点中或结合界面内部，以最小化对蛋白质相互作用的潜在干扰。为了进一步研究FSK和FSY在复合蛋白质环境中的反应距离偏好，探索它们在通过遗传编码的化学交联(GECX)鉴定活细胞中酶的未知底物中的应用(图17A)。具体地，将FSK或FSY掺入大肠杆菌细胞中硫氧还蛋白(TrX)的位点59或位点62中。这两个位点远离Trx活性位点并且可能位于Trx及其底物的结合界面的周边处。当掺入位点62中时，与WTTrx相比，FSK和FSY均有效地与潜在的底物蛋白质交联(图16)。将这些交联蛋白拉下，用胰蛋白酶消化，并且用串联质谱分析。使用OpenUaa软件分析交联蛋白质，从Trx(FSK)样品和Trx(FSY)样品鉴定了Trx的12种底物蛋白质。在这些底物蛋白质中，AHPC、TPX、SDHA、HPTG、CH10是先前报道的众所周知的Trx底物。(参考文献27)。通过使用FSK或FSY，存在Trx的几种重叠底物，诸如DNAK、APHC和TPX。然而，对于相同的底物蛋白质AHPC和DNAK，FSK和FSY显示出不同的残基偏好。除了这些重叠的底物蛋白质之外，FSK和FSY各自具有其自身独特的9种不同底物(表1至表2)。这些结果证明了FSY和FSK在复合蛋白质环境中鉴定底物的独特且互补的价值。

表1(FSK)和表2(FSY)鉴定了通过FSK或FSY交联的Trx的底物蛋白质及其肽，其中粗体下划线是交联残基，并且SEQ ID NO：18中下划线的小写字母是通过IAM烷基化的Cys。

表1-TrX的FSK介导的交联底物

/>

表2-TrX的FSY介导的交联底物

讨论

总之，开发了一种新的含氟代硫酸酯的潜在生物反应性Uaa，FSK，用于以大的分离共价键合蛋白质残基。在先前开发的多靶向生物反应性Uaa FSY由于FSY的较短反应半径而不能产生共价交联的情况下，FSK通过其较长且灵活的侧链实现有效的共价键。这种扩展将允许显著更宽范围的蛋白质位点被共价连接。除了蛋白间交联之外，FSK还可用于分子内交联，这将极大地扩展蛋白质交联模式的多样性以促进新颖蛋白质特性的工程化。此外，成功地将FSK掺入纳米抗体中并将它们转化为EGFR的共价粘结剂，该粘结剂不可逆地在体外和在癌细胞表面上结合EGFR，这可以为癌症成像和治疗提供新颖的途径。最后，证明了FSK可被掺入蛋白质中并在细菌和哺乳动物细胞中产生共价蛋白质交联。尽管对His、Lys和Tyr共享相同的多靶向能力，但FSK用更长且更柔性的侧链补充FSY。它们一起能够提供强大的潜在生物反应性系统，以通过SuFEx化学产生用于几乎所有蛋白质和蛋白质-蛋白质相互作用的共价键。因此，预期FSK将在基础生物研究以及蛋白质工程化中找到很大的应用。

实验程序

试剂和分子生物学

通过Integrated DNA Technologie(IDT)合成和纯化引物，并通过GENEWIZ对质粒测序。所有分子生物学试剂均得自New England Biolabs或Vazyme。从ProteinTech Group获得His-HRP抗体、GFP单克隆抗体、GAPDH-HRP抗体。如前所述使用pBAD-泛素(6TAG)和pBAD-ecGST WT和ecGST突变体。(Liu等人，Journal of the American Chemical Society2019，141(24)，9458-9462)。使用ecGST HindIII-pCDNA和ecGST XhoI-pCDNA引物将ecGSTWT和ecGST(86TAG)、ecGST(86TAG/92A)、ecGST(86TAG/92A/72A)克隆到pCDNA 3.1中。用于克隆的引物示于图6中。

FSKRS氨基酸序列如SEQ ID NO：2所示。

SEQ ID NO：2

MTVKYTDAQIQRLREYGNGT YEQKVFEDLA SRDAAFSKEM SVASTDNEKK IKGMIANPSRHGLTQLMNDI ADALVAEGFI EVRTPIFISK DALARMTITE DKPLFKQVFW IDEKRALRPM LAPNLGSVARDLRDHTDGPV KIFEMGSCFR KESHSGMHLE EFTMLNLFDM GPRGDATEVL KNYISVVMKA AGLPDYDLVQEESDVYKETIDVEINGQEVC SAAVGPTPID AAHDVHEPWS GAGFGLERLL TIREKYSTVK KGGASISYLNGAKIN

sfGFP(2TAG)。使用引物sfGFP2TAG For和sfGFP2TAG Rev来构建pBAD-sfGFP(2TAG)(SEQ ID NO：28，其中粗体下划线：在第二位处的琥珀密码子TAG)。

SEQ ID NO：28

ecGST(86TAG)。使用引物ecGST NdeI至GST86TAG-Rev通过重叠PCR构建pBAD-ecGST(86TAG)。(SEQ ID NO：29，其中粗体下划线：第86位处的琥珀密码子TAG)

SEQ ID NO：29

ecGST(65TAG)。用引物ecGST65TAG-For和ecGST65TAG-Rev通过定点诱变构建pBAD-ecGST(65TAG)(SEQ ID NO：30，其中粗体下划线：在第65位处的琥珀密码子TAG)

SEQ ID NO：30

ecGST(86TAG/92A)。用引物ecGST86TAG92A-For和ecGST86TAG92A-Rev通过定点诱变构建pBAD-ecGST(86TAG/92A)(SEQ ID NO：31，其中粗体下划线：在第86位处的琥珀密码子TAG。粗体斜体：92A)

SEQ ID NO：31

ecGST(86TAG/92A/72A)。用引物ecGST86TAG92A72A-For和ecGST86TAG92A72A-Rev通过定点诱变构建pBAD-ecGST(86TAG/92A/72A)(SEQ ID NO：32，其中粗体下划线：在第86位处的琥珀密码子TAG。粗体斜体：72/92A)

SEQ ID NO：32

sjGST WT。用引物HR-sjGST NdeI和HR-sjGST HindIII克隆pBAD-sjGST WT。(SEQID NO：33)

SEQ ID NO：33

MTSMSPILGYWKIKGLVQPTRLLLEYLEEKYEEHLYERDEGDKWRNKKFELGLEFPNLPYYIDGDVKLTQSMAIIRYIADKHNMLGGCPKERAEISMLEGAVLDIRYGVSRIAYSKDFETLKVDFLSKLPEMLKMFEDRLCHKTYLNGDHVTHPDFMLYDALDVVLYMDPMCLDAFPKLVCFKKRIEAIPQIDKYLKSSKYIAWPLQGWQATFGGGDHPPKSDLVPRGSHHHHHH

sjGST(97TAG)和sjGST(97TAG/44突变体)。pBAD-sjGST(97TAG)和pBAD-sjGST(97TAG/44A)由引物HR-sjGST NdeI、sjGST sjGST97TAG-For、sjGST97TAG-Rev、HR-sjGSTHindIII reV、sjGST44A-For和sjGST44A-Rev构建。并且引物集44S-For、44S-Rev、44T-For、44T-Rev、44Y-For、44Y-Rev、44H-For、44H-Rev用于制备pBAD-sjGST(97TAG/44S)、pBAD-sjGST(97TAG/44T)、pBAD-sjGST(97TAG/44Y)和pBAD-sjGST(97TAG/44H)。(SEQ ID NO：34，其中粗体下划线：第97位处的琥珀密码子TAG。粗体斜体：配对的Lys 44及其到A、S、T、H、Y的突变。)

SEQ ID NO：34

7D12 WT。使用引物7D12 NdeI和7D12 HindIII将7D12 WT克隆到pBAD质粒。(SEQID NO：35)

SEQ ID NO：35

7D12(30TAG)。用引物7D12 30TAG-For和7D12 30TAG-Rev通过定点诱变构建pBAD-7D12(30TAG)(SEQ ID NO：36，其中粗体下划线：在第30位处的琥珀密码子TAG。

SEQ ID NO：36

7D12(31TAG)。用引物7D1231TAG-For和7D1231TAG-Rev通过定点诱变构建pBAD-7D12(31TAG)(SEQ ID NO：37，其中粗体下划线：在第31位处的琥珀密码子TAG。)

SEQ ID NO：37

文库构建和FSKRS突变体选择

为了筛选用于掺入FSK的有效合成酶，使用引物MaPylRS NdeI至MaPylRS PstI来随机化Methanomethylophilus alvus PylRS-tRNA合成酶的活性位点(SEQ ID NO：1)并建立用于FSK筛选的文库。用于FSK掺入的正交合成酶的选择遵循如前所述的程序。(参见：Liu等人，Journal of the American Chemical Society 2018，140(28)，8807-8816；Liu等人，Angewandte Chemie(Internationaled.in English)2018，57(39)，12702-12706)。用引物HRpEVOL-For和HRpEVOL-Rev将候选命中重新克隆到pEVOL质粒，随后研究到pBAD-EGFP(182TAG)中的掺入效率。通过读取相对于600nm处的OD标准化的绿色荧光(在485nm处激发，在528nm处发射)来比较命中的掺入效率。鉴定了四个候选命中，如下表3所示。

SEQ ID NO：1

表3

编号	SEQ ID NO：1中的氨基酸突变
		1	Y126G/M129A/V168F/H227T/Y228P/L229I
2	Y126G/M129A/V168F/H227S/Y228P/L229V
		3	Y126G/M129A/V168F/H227I/Y228P
4	Y126G/M129A/V168F/H227S/Y228P/L229I

将FSK掺入EGFP(182TAG)、sfGFP(151TAG)、sfGFP(2TAG)中

将pBAD-sfGFP(2TAG)、pBAD-sfGFP(151TAG)或pBAD-EGFP(182TAG)与pEVOL-FSKRS共转化到DH10b中，并铺板于补充有50μg/mL卡那霉素和34μg/mL氯霉素的LB琼脂板上。挑取单个菌落并接种到1mL 2xYT(5g/L NaCl、16g/L胰蛋白胨、10g/L酵母提取物)中。使细胞在37℃、220rpm下生长至OD 0.5，同时良好通气过夜。第二天早晨，将细胞在补充有相关抗生素、0.2％阿拉伯糖、有或没有1mM FSK的新鲜2XYT中稀释10倍。然后将细胞在30℃下诱导6小时或在18℃下诱导过夜。如上所述，通过读板机检查荧光。

FSK一般掺入到蛋白质中以用于表达和纯化

为了将FSK掺入泛素(6TAG)、泛素(18TAG)、7D12(30TAG)和7D12(31TAG)，转化程序与上述相同。转化后，挑取单个菌落并使其在37℃、220rpm下生长过夜。第二天早晨，将细胞培养物稀释100倍，并且然后在30mL至100mL规模中再生长至OD 0.5，具有良好的通气和相关抗生素选择。然后向培养基中添加0.2％阿拉伯糖，具有或不具有1mM FSK，并且表达在18℃、220rpm下进行18小时、18℃、或30℃下进行6小时。IMAC色谱法用于蛋白质纯化。并且如Liu等人，Journal of the American Chemical Society 2019，141(24)，9458-9462所述进行该程序。

利用FSK和FSY进入ecGST、sjGST和它们的突变体以在大肠杆菌中进行蛋白质交联。

用于探测ecGST或sjGST及其突变体在活大肠杆菌细菌细胞中的交联。将pBAD-ecGST WT、pBAD-ecGST(86TAG)、pBAD-ecGST(65TAG)、pBAD-ecGST(86TAG/92A)、pBAD-ecGST(86TAG/92A/72A)或sjGST WT、sjGST(97TAG)、sjGST(97TAG/44A、S、T、H或Y)与pEVOL-FSYRS或pEVOL-FSKRS共转化到DH10b细胞中。当细胞生长至OD约0.5时，分别向细胞中加入FSY或FSK以及0.2％的阿拉伯糖以用于诱导。细胞在37℃下生长6小时用于蛋白质表达，然后通过用台式离心机离心收获，并用含有100mM DTT的2xSDS负载染料处理，并在95℃下煮沸5分钟。通过使用抗his抗体的蛋白质印迹监测由于交联导致的GST的二聚化。

将FSY或FSK掺入7D12

将pBAD-7D12(xxxTAG，XXX指示掺入位点)与pEVOL-FSYRS(用于FSY掺入)或pEVOL-FSKRS(用于FSK掺入)共转化到DH10b中，并且铺板在补充有50μg/mL卡那霉素和34μg/mL氯霉素的LB琼脂平板上。转化后，挑取单个菌落并使其在37℃、220rpm下生长过夜。第二天早晨，将细胞培养物稀释100倍，并且然后在30mL至100mL规模中再生长至OD 0.5，具有良好的通气和相关抗生素选择。然后向培养基中添加0.2％阿拉伯糖，具有或不具有1mM FSY或FSK，并且表达在30℃下进行12小时。用Ni-NTA亲和力色谱法进行蛋白质纯化。

7D12和EGFR的体外交联

为了探索7D12和EGFR的体外交联，将纯化的2μM 7D12 WT、7D12(30FSK)或7D12(31FSK)分别与500nm重组人EGFR蛋白(Abcam，目录号ab155726)在15μL 1xPBS，pH 7.4中温育。在37℃下温育16小时后，用最终1xSDS负载染料处理样品，并在95℃下煮沸5分钟。通过用1∶10000抗his抗体进行考马斯蓝SDS-PAGE或蛋白质印迹来研究交联。

在7D12和EGFR的细胞交联中

为了使7D12与过表达EGFR的A431哺乳动物细胞直接交联，将A431细胞接种在24孔板中(2×10⁶个细胞/孔)，并在37℃下培养过夜。用1个μM 7D12和7D12(31TAG)处理细胞1、2、4、8和12小时。用胰蛋白酶消化后，通过以300g离心5分钟收集细胞，并通过添加100μLRIPA缓冲液与1X蛋白酶抑制剂混合物进行裂解。样品在SDS-PAGE上分离，并用1∶10000抗his抗体进行蛋白质印迹检测。使用抗GAPDH抗体作为参考蛋白质。

将FSK遗传掺入Hela GFP(182TAG)

当细胞群达到80％汇合时，在2mL RPMI 1640培养基中用3μL聚乙烯亚胺(PEI)将质粒pNEU-FSKRS(1μg)转染到Hela-GFP 182(TAG)细胞中。空白Hela-GFP 182(TAG)细胞组用作阴性对照。转染后，用或不用1mM FSK处理细胞6小时，再培养48小时。将细胞用1XPBS洗涤一次并进行显微镜成像，之后将收获细胞并使用抗GFP抗体进行蛋白质印迹。使用抗GAPDH抗体作为参考蛋白质。

哺乳动物细胞中FSK到ecGST突变体中的遗传掺入

用于探测哺乳动物细胞中的蛋白质交联。当细胞群体达到80％汇合时，将质粒pNEU-FSKRS(1.5μg)分别与1μg pCDNA 3.1ecGST WT、1.5μg ecGST(86TAG)、1.5μg ecGST(86TAG/92A)和1.5μg ecGST(86TAG/92A/72A)共转染到在2mL DMEM培养基中具有9L聚乙烯亚胺(PEI)的HEK(293T)细胞中。转染后，用或不用1mM FSK处理细胞6小时，再培养48小时。收获细胞并使用抗His抗体进行蛋白质印迹。使用抗GAPDH抗体作为参考蛋白质。

质谱

如前所述进行质谱测量。(Liu等人，Journal of the American ChemicalSociety 2017，139(9)，3430-3437)。简单地说，对于电喷雾离子化质谱，使用QTOF Ultima(Waters)质谱仪获得完整蛋白质的质谱，在正电喷雾离子化(+ESI)模式下操作，连接到LC-20AD(Shimadzu)液相色谱单元。通过在Waters Xbridge BEH C4柱(3.5μm、2.1mm×50mm)上的反相色谱法，使用30％-71.4％的乙腈梯度，用0.1％甲酸将蛋白质样品与小分子分离。每次分析在室温下以0.2mL/min的恒定流速进行25分钟。以1秒/扫描的速率从m/z350至2500获得数据。另选地，在Waters ACQUITY UPLC蛋白质BEH C4反相柱(/>1.7μm、2.1mm×150mm)上通过Xevo G2-S QTOF获得光谱。使用含0.1％甲酸的5％-95％乙腈梯度，运行时间为5分钟，室温下恒定流速为0.5mL/分钟。以1秒/扫描的速率从m/z 350至2000获得谱。使用MassLynx中的最大熵对谱进行去卷积。对于串联质谱，使用与Ultimate 3000LC系统接合的Q Exactive Orbitrap进行肽的分析和测序。Q Exactive Orbirap的数据采集如下：通过自动进样器将10μL胰蛋白酶消化的蛋白质加载到Ace UltraCore super C18反相柱(/>2.5μm、75mm×2.1mm)上。使用含0.1％甲酸的5％-95％乙腈梯度，运行时间为45分钟，室温下恒定流速为0.2mL/分钟。使用依赖于数据的前10种方法获得MS数据，该方法使用28、3035eV的分级标准化碰撞能量，从HCD分段的全谱扫描中动态选择最丰富的前体离子。在Q Exactive上以70,000的分辨率在m/z 200下获得全谱扫描。使用UCSF MS-ISOTOPE(http：//prospector.ucsf.edu)或enviPat Web 2.1(Loos等人，Analytical chemistry2015，87(11)，5738-5744)计算肽的同位素模式的理论模式。

实施例2

氟代硫酸芳基酯的合成是基于使用[4-(乙酰氨基)苯基]亚氨基二磺酰二氟(AISF)试剂合成氟化硫(IV)的最新方法。氟磺酰氧基苯甲酰基-L-赖氨酸(5，FSK)的合成方案示于图18中。

合成4-((氟磺酰基)氧基)苯甲酸(2)。向200mL圆底烧瓶中添加4-羟基苯甲酸(1，1.38g，10mmol)和[4-(乙酰氨基)苯基]-亚氨基二磺酰二氟(AISF)试剂(3.78g，12mmol，1.2当量)。将混合物溶解在50mL无水四氢呋喃中，并在搅拌下逐滴添加1，8-二氮杂双环[5.4.0]十一碳-7-烯(3.35mL，22mmol，2.2当量)。然后将溶液在室温下搅拌20分钟。然后用50mL乙酸乙酯稀释反应物，并用1M HCl(100mL×2)和盐水(100mL×1)洗涤。有机级分用无水硫酸钠干燥并在真空下浓缩。然后通过柱色谱法使用MeOH∶CH₂Cl₂(1∶100)纯化粗产物。分离出产物4-((氟磺酰基)氧基)苯甲酸作为白色固体(2，1.72g，7.8mmol，78％)。

合成氟磺酰氧基苯甲酰基-L-赖氨酸(5，FSK)。在氩气下在0℃下向搅拌的4-((氟磺酰基)氧基)苯甲酸(2，0.22g，1mmol)的干燥CH₂Cl₂(15mL)溶液中逐滴添加草酰氯(0.21ml，2.5mmol，2.5当量)。然后添加二甲基甲酰胺(0.1mL)作为催化剂。然后将反应混合物在室温下搅拌5小时。然后在真空下浓缩溶液，得到黄色油。将粗4-(氯羰基)苯基氟代磺酸酯(3，约1mmol)重新溶解在干燥CH₂Cl₂(10mL)中，并冷却至0℃。然后添加(4，0.34g，1mmol，1当量)，之后逐滴添加Et₃N(0.15mL，1.1mmol，1.1当量)。将反应混合物在室温下搅拌过夜。用20mL H₂O淬灭反应，并用1M HCl(20mL×2)洗涤。合并水相，并且用乙酸乙酯(20mL×2)萃取。合并有机级分，并且用无水硫酸钠干燥并在真空下浓缩。然后通过柱色谱法使用MeOH∶CH₂Cl₂(1∶100)纯化粗产物。分离出产物N-Boc-FSK-^tBu作为黄色油(0.25g，0.50mmol，50％)。

将N-Boc-FSK-^tBu(0.25g，0.50mmol)添加到闪烁瓶中并溶解在二恶烷中的4M HCl(10mL)中。将反应搅拌过夜。滤出所得固体并用冷乙醚(10mL×2)洗涤，从而得到产物FSK-HCl作为白色固体(5，158mg，0.41mmol，81％)¹H NMR(400MHz，D₂O)：δ(ppm)7.89(d，J＝8.8Hz，2H)，7.59(d，J＝8.8Hz，2H)，3.99(t，J＝6.0，1H)，3.43(t，J＝6.8Hz，2H)，2.03-1.94(m，2H)，1.72-1.66(m，2H)，1.55-1.49(m，2H)。¹³C NMR(100MHz，D₂O)：δ(ppm)173.5、169.9、152.4、135.2、130.2、121.9、53.9、40.1、30.2、28.5、22.3。HR-ESI(+)m/z：对于C₁₃H₁₇FN₂NaO₆S[M+Na]+计算，371.0684；实测值371.0690。

实施例3

在FSKRS(SEQ ID NO：2)的C-末端处添加Hisx6标签使FSK掺入效率增加约96％。在FSKRS的N-末端处添加Hisx6标签不会增加FSK掺入效率。当细胞在37℃下培养时，该增加是稳健的。结果示于图19中，其中从左至右的FL/OD为5410(FSKRS)、33563(FSKRS+)、7546(FSKRSNThis)、31379(FSKRSNThis+)、4746(FSKRSCThis)和65735(FSKRSCThis+)；其中FSKRS是SEQ ID NO：2，FSKRS-NThis是SEQ ID NO：86，并且FSKRS-CThis是SEQ ID NO：87。

当在18℃下测试FSK掺入时，在存在1mM FSK的情况下，与FSKRS相比，FSKRS-CTHisx6的sfGFP荧光强度的增加不显著，如图20所示。参考图20，FSKRS的+UAA的FL/OD为71685，并且FSKRS的-UAA为3274；FSKRS-CThis的+UAA的FL/OD为76214，并且FSKRS-CThis的-UAA为2602；并且FSKRS-NThis的+UAA的FL/OD为53687，并且FSKRS-NThis的-UAA为4055。

FSKRS-CTHisx6的+FSK与-FSK的荧光强度比(29.3倍)高于FSKRS(21.9倍)，这主要是由于在没有FSK的情况下FSKRS-CTHisx6的背景较低。对于FSKRS-NTHisx6，+FSK与-FSK的荧光强度比为13.2倍。在37℃和18℃下结果的比较表明，附加在FSKRS的C-末端处的Hisx6标签增强了合成酶的热稳定性。因此，Hisx6标签对FSK掺入效率的增加效果在约18℃至约37℃的温度下将是有效的。在实施方案中，温度为约25℃至约30℃。

用FSYRS进行的将FSY掺入sfGFP(151TAG)的类似实验没有显示这种作用，表明Hisx6对FSKRS的作用可能是独特的。其他标签可以对FSKRS具有类似的效果。

总之，在FSKRS的C-末端处附加Hisx6标签增加了37℃下的FSK掺入效率。

SEQ ID NO：86(FSKRS-NTHis6)

MHHHHHHTVKYTDAQIQRLREYGNGTYEQKVFEDLASRDAAFSKEMSVASTDNEKKIKGMIANPSRHGLTQLMNDIADALVAEGFIEVRTPIFISKDALARMTITEDKPLFKQVFWIDEKRALRPMLAPNLGSVARDLRDHTDGPVKIFEMGSCFRKESHSGMHLEEFTMLNLFDMGPRGDATEVLKNYISVVMKAAGLPDYDLVQEESDVYKETIDVEINGQEVCSAAVGPTPIDAAHDVHEPWSGAGFGLERLLTIREKYSTVKKGGASISYLNGAKIN*

SEQ ID NO：87(FSKRS-CTHis6)

MTVKYTDAQIQRLREYGNGTYEQKVFEDLASRDAAFSKEMSVASTDNEKKIKGMIANPSRHGLTQLMNDIADALVAEGFIEVRTPIFISKDALARMTITEDKPLFKQVFWIDEKRALRPMLAPNLGSVARDLRDHTDGPVKIFEMGSCFRKESHSGMHLEEFTMLNLFDMGPRGDATEVLKNYISVVMKAAGLPDYDLVQEESDVYKETIDVEINGQEVCSAAVGPTPIDAAHDVHEPWSGAGFGLERLLTIREKYSTVKKGGASISYLNGAKINHHHHHH*

参考文献：(1)Xiang，Z.；Ren，H.；Hu，Y.S.；Coin，I.；Wei，J.；Cang，H.；Wang，L.Adding an Unnatural Covalent Bond to Proteins Through Proximity-EnhancedBioreactivity.Nat.Methods 2013，10(9)，885-888.(2)Wang，L.Genetically EncodingNew BioreactiVity.N.Biotechnol.2017，38(Pt A)，16-25.(3)Xiang，Z.；Lacey，V.K.；Ren，H.；Xu，J.；Burban，D.J.；Jennings，P.A.；Wang，L.Proximity-Enabled ProteinCrosslinking Through Genetically Encoding Haloalkane Unnatural AminoAcids.Angew.Chem.Int.Ed.，Engl.2014，53(8)，2190-2193.(4)Furman，J.L.；Kang，M.；Choi，S.；Cao，Y.；Wold，E.D.；Sun，S.B.；Smider，V.V.；Schultz，P.G.；Kim，C.H.AGenetically Encoded Aza-Michael Acceptor for Covalent Cross-Linking ofProtein-Receptor Complexes.J.Am.Chem.Soc.2014，136(23)，8411-8417.(5)Kobayashi，T.；Hoppmann，C.；Yang，B.；Wang，L.Using Protein-Confined Proximity to DetermineChemical Reactivity.J.Am.Chem.Soc.2016，138(45)，14832-14835.(6)Xuan，W.；Shao，S.；Schultz，P.G.Protein Crosslinking by Genetically Encoded Noncanonical AminoAcids with Reactive Aryl Carbamate Side Chains.Angew.Chem.Int.Ed.，Engl.2017，56(18)，5096-5100.(7)Wang，N.；Yang，B.；Fu，C.；Zhu，H.；Zheng，F.；Kobayashi，T.；Liu，J.；Li，S.；Ma，C.；Wang，P.G.；Wang，Q.；Wang，L.Genetically Encoding Fluorosulfate-L-TyroSine to React with Lysine，Histidine，and Tyrosine via SuFEx in Proteins inVivo.J.Am.Chem.Soc.2018，140(15)，4995-4999.(8)Liu，J.；Li，S.；Aslam，N.A.；Zheng，F.；Yang，B.；Cheng，R.；Wang，N.；Rozovsky，S.；Wang，P.G.；Wang，Q.；Wang，L.GeneticallyEncoding Photocaged Quinone Methide to Multitarget Protein ResiduesCovalently in Vivo.J.Am.Chem.Soc.2019，141(24)，9458-9462.(9)Xuan，W.；Collins，D.；Koh，M.；Shao，S.；Yao，A.；Xiao，H.；Garner，P.；Schultz，P.G.Site-SpecificIncorporation of a Thioester Containing Amino Acid Into Proteins.ACSChem.Biol.2018,13(3),578–581.(10)Hoppmann,C.；Lacey,V.K.；Louie,G.V.；Wei,J.；Noel,J.P.；Wang,L.Genetically EncodingPhotoswitchable Click Amino Acids inEscherichia Coli and Mammalian Cells.Angew.Chem.Int.Ed.，Engl.2014,53(15),3932–3936.(11)Hoppmann,C.；Maslennikov,I.；Choe,S.；Wang,L.In Situ Formation ofan Azo Bridge onProteins Controllable by Visible Light.J.Am.Chem.Soc.2015,137(35),11218–11221.(12)Coin,I.；Katritch,V.；Sun,T.；Xiang,Z.；Siu,F.Y.；Beyermann,M.；Stevens,R.C.；Wang,L.Genetically Encoded Chemical Probes in Cells RevealtheBinding Path of Urocortin-I to CRF Class B GPCR.Cell 2013,155(6),1258–1269.(13)Yang,B.；Tang,S.；Ma,C.；Li,S.T.；Shao,G.C.；Dang,B.；DeGrado,W.F.；Dong,M.Q.；Wang,P.G.；Ding,S.；Wang,L.Spontaneous and SpecificChemical Cross-Linking inLive Cells to Capture and Identify Protein Interactions.Nat.Commun.2017,8(1),2240.(14)Dong,J.；Krasnova,L.；Finn,M.G.；Sharpless,K.B.Sulfur(VI)FluorideExchange(SuFEx):Another Good Reactionfor Click Chemistry.Angew.Chem.Int.Ed.，Engl.2014,53(36),9430–9448.(15)Chen,W.；Dong,J.；Plate,L.；Mortenson,D.E.；Brighty,G.J.；Li,S.；Liu,Y.；Galmozzi,A.；Lee,P.S.；Hulce,J.J.；Cravatt,B.F.；Saez,E.；Powers,E.T.；Wilson,I.A.；Sharpless,K.B.；Kelly,J.W.ArylfluorosulfatesInactivate Intracellular LipidBinding Protein(S)Through Chemoselective SuFExReaction with a Binding SiteTyr Residue.J.Am.Chem.Soc.2016,138(23),7353–7364.(16)Jones,L.H.Emerging Utility of Fluorosulfate Chemical Probes.ACS MedicinalChemistryLetters 2018,9(7),584–586.(17)Zheng,Q.；Woehl,J.L.；Kitamura,S.；Santos-Martins,D.；Smedley,C.J.；Li,G.；Forli,S.；Moses,J.E.；Wolan,D.W.；Sharpless,K.B.SuFEx-Enabled,Agnostic Discovery of Covalent Inhibitors ofHumanNeutrophil Elastase.Proc.Natl.Acad.Sci.U.S.A.2019,116(38),18808–18814.(18)Li,Q.；Chen,Q.；Klauser,P.C.；Li,M.；Zheng,F.；Wang,N.；Li,X.；Zhang,Q.；Fu,X.；Wang,Q.；Xu,Y.；Wang,L.Developing Covalent Protein Drugsvia Proximity-EnabledReactive Therapeutics.Cell 2020,182(1),85–97.e16.(19)Liu,J.；Zheng,F.；Cheng,R.；Li,S.；Rozovsky,S.；Wang,Q.；Wang,L.Site-Specific Incorporation ofSelenocysteine Using an Expanded Genetic Code and Palladium-Mediated ChemicalDeprotection.J.Am.Chem.Soc.2018，140(28)，8807-8816.(20)Nishida，M.；Harada，S.；Noguchi，S.；SatoW，Y.；Inoue，H.；Takahashi，K.Three-Dimensional Structure ofEscherichia Coli Glutathione S-Transferase Complexed with GlutathioneSulfonate：Catalytic Roles of Cys 10and His106.J.Mol.Biol.1998，281(1)，135-147.(21)Chartron，J.；Shiau，C.；Stout，C.D.；Carroll，K.S.3′-Phosphoadenosine-5′-Phosphosulfate Reductase in Complex with Thioredoxin：a Structural Snapshot inthe Catalytic Cycle.Biochemistry 2007，46，3942-3951.(22)Rufer，A.C.；Thiebach，L.；Baer，K.；Klein，H.W.；Hennig，M.X-Ray Structure of Glutathione S-TransferaseFrom Schistosoma Japonicumin a New Crystal Form Reveals Flexibility of theSubstrate-Binding Site.Acta Crystallogr Sect F Struct Biol Cryst Commun 2005，61(Pt 3)，263-265.(23)Cook，W.J.；Jeffrey，L.C.；Carson，M.；Chen，Z.；Pickart，C.M.Structure of a Diubiquitin Conjugate and a Model for Interaction withUbiquitin Conjugating Enzyme(E2).J.Biol.Chem.1992，267(23)，16467-16471.(24)Chen，X.H.；Xiang，Z.；Hu，Y.S.；Lacey，V.K.；Cang，H.；Wang，L.Genetically Encoding anElectrophilic Amino Acid for Protein Stapling and Covalent Binding to NativeReceptors.ACS Chem.Biol.2014，9(9)，1956-1961.(25)Schmitz，K.R.；Bagchi，A.；Roovers，R.C.；van Bergen en Henegouwen，P.M.P.；Ferguson，K.M.StructuralEvaluation of EGFR Inhibition Mechanisms for Nanobodies/VHH Domains.Structure2013，21(7)，1214-1224.(26)Wang，W.；Takimoto，J.K.；Louie，G.V.；Baiga，T.J.；Noel，J.P.；Lee，K.-F.；Slesinger，P.A.；Wang，L.Genetically Encoding Unnatural AminoAcids for Cellular and Neuronal Studies.Nat.Neurosci.2007，10(8)，1063-1072.(27)Lu et al，Free.Radic.Biol.Med.66，75-87(2014)。

应当理解，本文描述的示例和实施方案仅用于说明目的，并且鉴于其的各种修改或改变将被建议给本领域技术人员，并且将被包括在本申请的精神和范围以及所附权利要求书的范围之内。本文引用的所有出版物、专利和专利申请出于所有目的通过引用以其全文并入本文。

Claims

1.一种化合物，其具有式(A)的结构：

2.一种组合物，其包含根据权利要求1所述的化合物。

3.一种细胞，其包含根据权利要求1所述的化合物。

4.一种生物分子，其具有式(B)的结构：

其中：

(i)X包含至少一个氨基酸并且Y是OH；

(ii)Y包含至少一个氨基酸并且X是H；或者

(iii)X和Y各自包含至少一个氨基酸。

5.一种生物分子，其具有式(C)的结构：

其中R¹是小分子部分、氨基酸部分或肽基部分。

6.根据权利要求5所述的生物分子，其中R¹是小分子部分。

7.根据权利要求5所述的生物分子，其中R¹是氨基酸部分或肽基部分。

8.根据权利要求5所述的生物分子，其中R¹是所述肽基部分，并且所述肽基部分是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。

9.根据权利要求5至8中任一项所述的生物分子，其中R¹能够与靶标结合。

10.根据权利要求9所述的生物分子，其中R¹能够与细胞的表面上的靶标结合。

11.根据权利要求10所述的生物分子，其中所述细胞的所述表面上的所述靶标是受体。

12.根据权利要求10所述的生物分子，其中所述受体是膜受体或激素受体。

13.根据权利要求9所述的生物分子，其中所述靶标是选自由以下组成的组的受体：乙酰胆碱受体、腺苷受体、血管紧张素受体、爱帕琳肽受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素受体、趋化因子受体、胆囊收缩素受体、A类孤儿受体、多巴胺受体、内皮素受体、表皮生长因子受体(EGFR)、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、生长素释放肽受体、糖蛋白激素受体、促性腺激素释放激素受体、G蛋白偶联雌激素受体、组胺受体、羟基羧酸受体、亲吻素受体、白三烯受体、溶血磷脂受体、溶血磷脂S1P受体、黑色素浓集激素受体、黑皮质素受体、褪黑激素受体、胃动素受体、神经介素U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片受体、视蛋白受体、食欲素受体、氧代戊二酸受体、P2Y受体、血小板活化因子受体、促动素原受体、催乳素释放肽受体、前列腺素样受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、微量胺受体、尾加压素受体以及加压素受体。

14.根据权利要求9所述的生物分子，其中所述靶标是PD-1或PD-L1。

15.根据权利要求9所述的生物分子，其中所述靶标是蛋白质、核酸或碳水化合物。

16.一种细胞，其包含根据权利要求4至15中任一项所述的生物分子。

17.根据权利要求16所述的细胞，其中所述细胞是细菌细胞、真菌细胞、植物细胞、古细菌细胞或动物细胞。

18.一种体外翻译系统，其包含根据权利要求4至15中任一项所述的生物分子。

19.一种生物分子缀合物，其包含通过生物缀合物接头与第二生物分子部分缀合的第一生物分子部分，其中所述生物缀合物接头具有式(D)的结构：

20.根据权利要求19所述的生物分子缀合物，其中所述生物分子缀合物具有式(E)的结构：

其中：

R¹是第一生物分子部分；

R²是第二生物分子部分；

L¹是键或第一共价接头；

L²是键或第二共价接头；并且

X¹是-NR⁵-、-O-、-S-、或

其中环A是取代或未取代的亚杂芳基或取代或未取代的亚杂环烷基，并且其中A中的氮附接到所述生物缀合物接头；并且

R⁵是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

21.根据权利要求20所述的生物分子缀合物，其中：

L¹是键、-S(O)₂-、-NR^3A-、-O-、-S-、-C(O)-、-C(O)NR^3A-、-NR^3AC(O)-、-NR^3AC(O)NR^3B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、或取代或未取代的亚杂芳基；

L²是键、-S(O)₂-、-NR^4A-、-O-、-S-、-C(O)-、-C(O)NR^4A-、-NR^4AC(O)-、-NR^4AC(O)NR^4B、-C(O)O-、-OC(O)-、取代或未取代的亚烷基、取代或未取代的亚杂烷基、取代或未取代的亚环烷基、取代或未取代的亚杂环烷基、取代或未取代的亚芳基、取代或未取代的亚杂芳基、或者取代或未取代的烷基亚芳基；并且

R^3A、R^3B、R^4A和R^4B独立地是氢、取代或未取代的烷基、取代或未取代的杂烷基、取代或未取代的环烷基、取代或未取代的杂环烷基、取代或未取代的芳基或取代或未取代的杂芳基。

22.根据权利要求20或21所述的生物分子缀合物，其中X¹是-NH-、-O-或亚咪唑基。

23.根据权利要求20至22中任一项所述的生物分子缀合物，其中R¹包含肽基部分、核酸部分、碳水化合物部分或小分子部分。

24.根据权利要求20至22中任一项所述的生物分子缀合物，其中R²包含肽基部分、核酸部分、碳水化合物部分或小分子部分。

25.根据权利要求24所述的生物分子缀合物，其中R²包含肽基部分；并且其中R²通过赖氨酸、组氨酸或酪氨酸与L²共价键合。

26.根据权利要求20、23、24或25所述的生物分子缀合物，其包含式(I)、式(II)或式(III)的结构：

27.根据权利要求20至26中任一项所述的生物分子缀合物，其中R¹包含至少一个氨基酸。

28.根据权利要求20至27中任一项所述的生物分子缀合物，其中R²包含至少一个氨基酸。

29.根据权利要求20至28中任一项所述的生物分子缀合物，其中R¹包含抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。

30.根据权利要求20至29中任一项所述的生物分子缀合物，其中R²包含受体。

31.根据权利要求30所述的生物分子缀合物，其中所述受体是膜受体或激素受体。

32.根据权利要求30所述的生物分子缀合物，其中所述受体是乙酰胆碱受体、腺苷受体、血管紧张素受体、爱帕琳肽受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素受体、趋化因子受体、胆囊收缩素受体、A类孤儿受体、多巴胺受体、内皮素受体、表皮生长因子受体(EGFR)、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、生长素释放肽受体、糖蛋白激素受体、促性腺激素释放激素受体、G蛋白偶联雌激素受体、组胺受体、羟基羧酸受体、亲吻素受体、白三烯受体、溶血磷脂受体、溶血磷脂S1P受体、黑色素浓集激素受体、黑皮质素受体、褪黑激素受体、胃动素受体、神经介素U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片受体、视蛋白受体、食欲素受体、氧代戊二酸受体、P2Y受体、血小板活化因子受体、促动素原受体、催乳素释放肽受体、前列腺素样受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、微量胺受体、尾加压素受体或加压素受体。

33.根据权利要求30所述的生物分子缀合物，其中所述受体是PD-1或PD-L1。

34.根据权利要求30所述的生物分子缀合物，其中所述受体是表皮生长因子受体，并且R¹是能够结合所述表皮生长因子受体的部分。

35.根据权利要求34所述的生物分子缀合物，其中R¹包含肽基部分或小分子部分。

36.根据权利要求34所述的生物分子缀合物，其中R¹包含抗体、抗原结合片段、单结构域抗体、单链可变片段或亲和体。

37.根据权利要求33所述的生物分子缀合物，其中R²是PD-1并且R¹是能够结合PD-1的部分。

38.根据权利要求37所述的生物分子缀合物，其中R¹包含抗体、抗原结合片段、单链可变片段、单结构域抗体、或亲和体、小分子、PD-L1蛋白质、或PD-L1蛋白质的片段。

39.根据权利要求33所述的生物分子缀合物，其中R²是PD-L1并且R¹是能够结合PD-L1的部分。

40.根据权利要求39所述的生物分子缀合物，其中R¹包含抗体、抗原结合片段、单结构域抗体、亲和体、小分子、PD-1蛋白质、或PD-1蛋白质的片段。

41.一种细胞，其包含根据权利要求19至40中任一项所述的生物分子缀合物。

42.根据权利要求41所述的细胞，其中R²是所述细胞的所述表面上的蛋白质。

43.根据权利要求41或42所述的细胞，其中所述细胞选自由细菌细胞、真菌细胞、植物细胞、古细菌细胞和动物细胞组成的组。

44.根据权利要求43所述的细胞，其中所述动物细胞是人类细胞。

45.一种结合细胞上的靶标的方法，所述方法包括使所述细胞与根据权利要求4至15中任一项所述的生物分子接触，其中所述生物分子能够与所述细胞的所述表面上的所述靶标特异性结合，由此所述生物分子与所述靶标形成共价键。

46.根据权利要求45所述的方法，其中所述共价键通过硫氟交换反应形成。

47.根据权利要求46所述的方法，其中所述共价键通过附近实现的硫氟交换反应形成。

48.根据权利要求45所述的方法，其中所述生物分子和所述靶标通过具有式(D)的所述结构的生物缀合物接头共价连接：

49.一种变体吡咯赖氨酰-tRNA合成酶，其在具有SEQ ID NO：1的氨基酸序列的吡咯赖氨酰-tRNA合成酶的底物结合位点内包括至少一个或多个氨基酸残基取代；其中所述底物结合位点包含126位处的酪氨酸、129位处的甲硫氨酸、168位处的缬氨酸、227位处的组氨酸、228位处的酪氨酸以及229位处的赖氨酸的残基，如SEQ ID NO：1的氨基酸序列所示。

50.根据权利要求49的所述变体吡咯赖氨酰-tRNA合成酶，其中SEQ ID NO：1的所述氨基酸序列中的所述取代选自由以下组成的组：(i)Y126G；(ii)M129A；(iii)V168F；(iv)H227T、H227S或H227I；(v)Y228P；以及(vi)L229I、L229V或L229I。

51.根据权利要求49或50所述的变体吡咯赖氨酰-tRNA合成酶，在所述吡咯赖氨酰-tRNA合成酶的所述底物结合位点内包含1、2、3、4、5或6个氨基酸残基取代。

52.根据权利要求49或50所述的变体吡咯赖氨酰-tRNA合成酶，在所述吡咯赖氨酰-tRNA合成酶的所述底物结合位点内包含多于6个氨基酸残基取代。

53.根据权利要求49所述的吡咯赖氨酰-tRNA合成酶，其包含SEQ ID NO：2的氨基酸序列。

54.一种载体，其包含编码根据权利要求49至53中任一项所述的吡咯赖氨酰-tRNA合成酶的核酸序列。

55.根据权利要求54所述的载体，其还包含编码tRNA^Pyl的核酸序列。

56.一种细胞的基因组，其包含编码根据权利要求49至55中任一项所述的吡咯赖氨酰-tRNA合成酶的核酸序列。

57.根据权利要求56所述的基因组，其还包含编码tRNA^Pyl的核酸。

58.一种复合物，其包含根据权利要求49至53中任一项所述的吡咯赖氨酰-tRNA合成酶和式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸：

59.根据权利要求58所述的复合物，其还包含tRNA^Pyl。

60.根据权利要求59所述的复合物，其中所述tRNA^Pyl具有如SEQ ID NO：3所示的序列。

61.根据权利要求59所述的复合物，其中所述tRNA^Pyl包含反密码子，其中所述反密码子包含CUA、TTA或TCA。

62.根据权利要求59所述的复合物，其中所述tRNA^Pyl包含反密码子，其中所述反密码子包含至少一个非经典碱基。

63.一种复合物，其包含tRNA^Pyl和式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸：

64.根据权利要求63所述的复合物，其中所述tRNA^Pyl具有如SEQ ID NO：3所示的序列。

65.根据权利要求63所述的复合物，其中所述tRNA^Pyl包含反密码子，其中所述反密码子包含CUA、TTA或TCA。

66.根据权利要求63所述的复合物，其中所述tRNA^Pyl包含反密码子，其中所述反密码子包含至少一个非经典碱基。

67.一种细胞，其包含根据权利要求49至53中任一项所述的吡咯赖氨酰-tRNA合成酶、根据权利要求54或54所述的载体、根据权利要求55或57所述的基因组、根据权利要求58至66中任一项所述的复合物或其两种或更多种的组合。

68.根据权利要求67所述的细胞，其中所述细胞是细菌细胞、真菌细胞、植物细胞、古细菌细胞或动物细胞。

69.一种细胞质提取物，其从根据权利要求68所述的细胞获得。

70.一种形成根据权利要求19至40中任一项所述的生物分子缀合物的方法，所述方法包括使第一生物分子部分与第二生物分子部分接触；其中所述第一生物分子部分包含氟磺酰氧基苯甲酰基-L-赖氨酸；并且其中所述第二生物分子部分与所述氟磺酰氧基苯甲酰基-L-赖氨酸反应；从而形成所述生物分子缀合物。

71.根据权利要求70所述的方法，其中所述第一生物分子部分和所述第二生物分子部分包含在单个生物分子内，并且其中所述生物缀合物接头是分子内接头。

72.根据权利要求70所述的方法，其中第一生物分子部分和所述第二生物分子部分包含在单独的生物分子内，并且其中所述生物缀合物接头是分子间接头。

73.根据权利要求70至72中任一项所述的方法，其中所述接触在细胞内进行。

74.根据权利要求70至72中任一项所述的方法，其中所述接触在细胞的表面处进行。

75.根据权利要求70至72中任一项所述的方法，其中所述接触在溶液中进行。

76.根据权利要求70至72中任一项所述的方法，其中所述接触在体外进行。

77.根据权利要求70至72中任一项所述的方法，其中所述接触在体内进行。

78.根据权利要求19至26中任一项所述的生物分子缀合物，其中所述第一生物分子部分和所述第二生物分子部分包含在单个生物分子内，并且其中所述生物缀合物接头是分子内接头。

79.根据权利要求19至26中任一项所述的生物分子缀合物，其中所述第一生物分子部分和所述第二生物分子部分包含在单独的生物分子内，并且其中所述生物缀合物接头是分子间接头。

80.根据权利要求70至79中任一项所述的方法，其还包括在使所述第一生物分子部分与所述第二生物分子部分接触的步骤之前，使所述第一生物分子部分与吡咯赖氨酰-tRNA合成酶、tRNA^Pyl和式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸接触的步骤：

81.根据权利要求70至80中任一项所述的方法，其中所述第二生物分子部分是肽基部分，其包含与所述氟磺酰氧基苯甲酰基-L-赖氨酸反应的至少一个赖氨酸、组氨酸或酪氨酸。

82.一种生产包含氟磺酰氧基苯甲酰基-L-赖氨酸的蛋白质的方法，所述方法包括使核酸与吡咯赖氨酰-tRNA合成酶、tRNA^Pyl和式(A)的氟磺酰氧基苯甲酰基-L-赖氨酸接触：

其中所述核酸编码蛋白质，并且其中所述核酸包含由tRNA^Pyl识别的至少一个密码子，从而产生包含所述氟磺酰氧基苯甲酰基-L-赖氨酸的所述蛋白质。

83.根据权利要求82所述的方法，其中所述接触步骤是在体外。

84.根据权利要求82所述的方法，其中所述接触步骤是在细胞中。

85.根据权利要求84所述的方法，其中所述细胞是细菌细胞、真菌细胞、植物细胞、古细菌细胞或动物细胞。

86.一种蛋白质，其包含至少一种氟磺酰氧基苯甲酰基-L-赖氨酸。

87.根据权利要求86所述的蛋白质，其中所述蛋白包含一种氟磺酰氧基苯甲酰基-L-赖氨酸。

88.根据权利要求86或87所述的蛋白质，其中所述蛋白质是抗体、抗原结合片段、单链可变片段、单结构域抗体或亲和体。

89.根据权利要求86或87所述的蛋白质，其中所述蛋白质是膜受体。

90.根据权利要求86至89中任一项所述的蛋白质，其中所述蛋白质包含式(IV)的部分、式(V、)的部分或式(VI)的部分：

91.一种细胞，其包含根据权利要求86至90中任一项所述的蛋白质。

92.一种纳米抗体，其包含如SEQ ID NO：98所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。

93.一种纳米抗体，其包含如SEQ ID NO：99所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：97所示的CDR3。

94.一种纳米抗体，其包含如SEQ ID NO：95所示的CDR1、如SEQ ID NO：96所示的CDR2以及如SEQ ID NO：100所示的CDR3。

95.一种纳米抗体，其包含如SEQ ID NO：95所示的CDR1、如SEQ IDNO：96所示的CDR2以及如SEQ ID NO：101所示的CDR3。

96.一种纳米抗体，其包含SEQ ID NO：90的氨基酸序列。

97.一种纳米抗体，其包含SEQ ID NO：92的氨基酸序列。

98.一种纳米抗体，其包含SEQ ID NO：93的氨基酸序列。

99.一种纳米抗体，其包含SEQ ID NO：94的氨基酸序列。

100.一种药物组合物，其包含根据权利要求92至99中任一项所述的纳米抗体和药学上可接受的赋形剂。