CN108410827A

CN108410827A - 整合包含bcn基团的氨基酸到多肽中的方法

Info

Publication number: CN108410827A
Application number: CN201810228028.9A
Authority: CN
Inventors: 贾森·钦; 凯瑟琳·郎
Original assignee: Medical Research Council
Current assignee: United Kingdom Research and Innovation
Priority date: 2012-05-18
Filing date: 2013-05-15
Publication date: 2018-08-17
Anticipated expiration: 2033-05-15
Also published as: US20200271658A1; JP6343604B2; US20150148525A1; US11732001B2; HK1208704A1; CN108410827B; WO2013171485A1; CA2873793C; EP2852664A1; EP2852664B1; BR112014028588A2; BR112014028588B1; BR112014028588A8; IN2014DN09922A; CA2873793A1; JP2015523965A; CN104718285A; US20230340013A1

Abstract

本发明涉及整合包含BCN基团的氨基酸到多肽中的方法。具体而言，本发明涉及包含具有双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)基团的氨基酸的多肽，尤其是当所述BCN基团作为赖氨酸的残基存在。本发明还涉及制备包含BCN基团的多肽的方法，所述方法包括将包括BCN基团的氨基酸遗传整合到多肽。本发明还涉及包括双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)的氨基酸，特别地，氨基酸是双环[6.1.0]壬‑4‑炔‑9‑基甲醇(BCN)赖氨酸。此外，本发明涉及包含突变Y271M、L274G和C313A的PylRS tRNA合成酶。

Description

整合包含BCN基团的氨基酸到多肽中的方法

本申请是申请号为201380037290.0，申请日为2013年5月15日，发明名称为“利用编码包含BCN基团的氨基酸的正交密码子和正交PylRS合成酶将包含BCN基团的氨基酸整合到多肽中的方法”的中国专利申请的分案申请。

技术领域

本发明涉及经(延伸的)遗传密码的生物正交基团的位点特异性整合。特别地，本发明涉及经在遗传整合的氨基酸基团如亲二烯体和化学基团如四嗪之间的加速的反电子需求 Diels-Alder反应，将化学基团整合到多肽中。

背景技术

经遗传编码延伸的生物正交基团的位点特异性整合为具有任意探针的位点特异的标记蛋白提供了强大的通用策略。然而，可被遗传编码的生物正交官能团的缓慢反应性限制了这一策略的利用。

对于化学生物学家而言，具有不同探针的蛋白的快速且位点特异性标记仍是个很大的挑战；酶介导的标记方法可以是快速的，但在研究中，却使用了将扰动引入到蛋白中的蛋白或肽的融合，并可能限制了可标记的位点，而许多可遗传编码组分的“生物正交”反应太慢以至于在用于研究许多生物过程的时间尺度上影响了蛋白的定量的和位点特异性得标记。

迫切需要在不同背景下的具有用户定义的探针的位点特异性标记蛋白的通用方法。

包含降冰片烯和反式环辛烯的有张力(strained)的烯烃和四嗪之间的反电子需求 Diels-Alder反应已成为一类重要的快速生物正交反应^1-4。据报道，某些这些反应的速度非常快^3,4。

最近，已报道了使用这些反应的特异性标记蛋白的三种方法：

-一种在两步法中接受反式环辛烯底物的硫辛酸连接酶变体已被用于标记带有13个氨基酸硫辛酸连接酶标签的蛋白⁵。

-一种四嗪已在特异性位点上经遗传编码延伸引入在大肠杆菌中表达的的蛋白，并与有张力的反式环辛烯二乙酰荧光素进行衍生⁶。

-已证示了有张力的烯烃(包含降冰片烯的氨基酸)的整合，其是通过遗传编码延伸和体外、大肠杆菌中和哺乳动物细胞中的用四嗪荧光基团的位点特异性荧光标记⁷。最近还报道了包含降冰片烯的氨基酸的整合^8,9。

已报道了包含反式环辛烯的氨基酸(TCO)(2)的低效整合，其在固定的细胞中具有一些荧光标记的检测⁹。

最近在有机溶剂中的模型反应进行的工作表明BCN(最初描述于与叠氮化物进行的张力促进的反应中)¹⁰和四嗪之间的反应可以非常快速地进行¹¹。然而，与简单的用叠氮化物、硝酮^12-16和四嗪^9,17进行的环辛炔的非常慢的反应不同，此反应还未在水性介质中进行探索或还未探索作为化学选择性路径以标记大分子。

本发明意图克服与现有技术相关的问题。

发明内容

在本领域中存在一些将四嗪化合物附着到多肽上的技术。然而，这些技术的反应速率很慢。此外，这些技术使得产生多种化学物质作为反应产物。这可能导致一些问题，如染料基团间可变的分子距离，其可能使荧光共振能量转移(FRET)分析产生问题。这对治疗性分子的生产也可能是不利的，因为产物的异质性是本领域中的一个缺点。

本发明人已提供了一种具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的新的氨基酸。这显著地增加了反应速度，这是有利的。此外，这允许进行单产物加成反应。这导致了均一的产物，这是一个优势。这也在产物中消除了异构体变体(空间异构体)，这在一系列如本文所表明的应用中提供了技术优势。此外，BCN加成反应的产物不是差向异构的，而来自(例如)降冰片烯和/或TCO反应的产物会产生差向异构体。因此，本发明的一个优势在于其还避免了差向异构体的问题。

因此，在一个方面中，本发明提供了包括具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸的多肽。这具有在加入(例如)四嗪化合物后提供单反应产物的优势。可替代的技术如降冰片烯加成或TCO加成得到的产物是包含不同的异构体如区域或立体异构体的混合物。这一优势的一个原因在于分子的BCN部分具有镜面对称，使得产物是相同的，而对于TCO/降冰片烯而言，分子的那一部分是手性的，使得可以附着到双键的“顶面”或“底面”，导致在产物中存在不同的异构体。

因此，当用于将其它的基团如四嗪化合物附着到多肽上时，本发明的优点在于提供了产物的均一性。

适当地，所述BCN基团作为赖氨酸的残基存在。

在另一个方面中，本发明涉及一种生产包含BCN基团的多肽的方法，所述方法包括将包含BCN基团的氨基酸遗传整合到多肽中。

适当地，生产所述多肽包括：

(i)提供编码多肽的核酸，该核酸包含编码具有BCN基团的氨基酸的正交密码子；

(ⅱ)在能够识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸，并将具有BCN基团的氨基酸整合到多肽链上。

适当地，所述包含BCN基团的氨基酸是BCN赖氨酸。

适当地，所述正交密码子包括琥珀密码子(TAG)，所述tRNA包括MbtRNA_CUA。适当地，所述具有BCN基团的氨基酸包括双环[6.1.0]壬-4-炔-9-基甲醇(BCN)赖氨酸。适当地，所述tRNA合成酶包含具有突变Y271M、L274G和C313A的PylRS合成酶(BCNRS)。

适当地，所述具有BCN基团的氨基酸所整合的位置对应于野生型多肽中的赖氨酸残基的位置。其优势在于，使包含BCN的多肽与作为其来源的野生型多肽之间保持最接近的可能的结构关系。

在另一个方面中，本发明涉及一种如上所述的多肽，其包括单个BCN基团。因此，适当地，多肽包含单个BCN基团。这优势在于，可保持可能作用于BCN基团的任何其它化学修饰的特异性。例如，当在目标多肽中仅存在单个BCN基团时，有助于避免如下可能的问题，即部分修饰(如其中仅多肽中的部分BCN基团随后被修饰)或在相同多肽上的可替代的BCN基团之间变化的反应微环境(其可导致在多肽的不同位置的不同的BCN 基团之间的不平等的反应性)。

BCN基团整合的关键优势在于其允许一系列非常有用的其它化合物如标记能够容易地且特异性地附着到BCN基团上。

在另一个方面中，本发明涉及一种如上所述的多肽，其中所述BCN基团连接到四嗪基团上。

在另一个方面中，本发明涉及一种如上所述的多肽，其中所述四嗪基团进一步连接到荧光团上。

适当地，所述荧光团包括荧光素、四甲罗丹明(TAMRA)或硼吡咯甲烷(BODIPY)。

在另一个方面中，本发明涉及一种包含BCN基团的新的非天然氨基酸。

在另一个方面中，本发明涉及一种包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)的氨基酸。

在另一个方面中，本发明涉及一种氨基酸，其是双环[6.1.0]壬-4-炔-9-基甲醇(BCN) 赖氨酸。

适当地，如上所述的BCN赖氨酸具有如下结构：

在另一个方面中，本发明涉及一种生产包含四嗪基团的多肽的方法，所述方法包括：提供如上所述的多肽，将所述多肽与四嗪化合物相接触，并孵育以允许通过反电子需求Diels-Alder环加成反应，将四嗪连接到BCN基团上。

适当地，四嗪选自图1的6至17。

适当地，反应的准一级速率常数至少为80M^-1s^-1。

适当地，四嗪选自图1的6、7、8和9且反应的准一级速率常数至少为80M^-1s^-1。

这种化学反应具有反应速度的优势。

适当地，允许所述反应进行10分钟或更少。

适当地，允许所述反应进行1分钟或更少。

适当地，允许所述反应进行30秒或更少。

值得注意的是，某些反应环境可能会影响反应时间。最适当地，最短时间如30秒或更少可应用于体外反应。

在体内或在真核生物培养条件如组织培养基或其它适合真核细胞的介质中的反应可能需要反应超过30秒以达到最大标记。熟练的操作者可以基于本文所提供的指导通过试错法来确定最佳反应时间。

适当地，所述四嗪化合物是选自图1的11和17的四嗪化合物。

在另一个方面中，本发明涉及一种包含突变Y271M、L274G和C313A的PylRS tRNA合成酶。

适当地，所述PylRS tRNA合成酶的序列对应于包含突变Y271M、L274G和C313A 的MbPylRS tRNA合成酶的序列。

在另一个方面中，本发明涉及本发明的PylRS tRNA合成酶将包含双环[6.1.0]壬-4- 炔-9-基甲醇(BCN)的氨基酸整合到多肽中的用途。

在另一个方面中，本发明涉及一种将包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)的氨基酸整合到多肽中的方法，其包含使用本发明的PylRS tRNA合成酶以整合所述氨基酸。

在另一个方面中，本发明涉及一种如上所述的均质的重组多肽。适当地，所述多肽由如上所述的方法进行制备。

还公开的是根据如本文所述的方法生产的多肽。并且作为这些新方法的产物，这样的多肽具有包括BCN的技术特征。

突变具有本领域中的正常含义，并且可以是指所涉及的残基、基序或结构域的取代、截短或缺失。可以在多肽水平上产生突变，例如通过合成具有突变序列的多肽，或者可以在核苷酸水平上产生突变，例如通过制备编码突变序列的核酸，该核酸随后可被翻译以产生突变多肽。其中，没有氨基酸被指定为给定突变位点的替换氨基酸，适当地，使用所述位点的随机化。作为缺省突变，可以使用丙氨酸(A)。适当地，在特定位点使用的突变如本文所列。

适当地，片段的长度至少为10个氨基酸，适当地至少为25个氨基酸，适当地至少为50个氨基酸，适当地至少为100个氨基酸，适当地至少为200个氨基酸，适当地至少为250个氨基酸，适当地至少为300个氨基酸，适当地至少为313个氨基酸，或适当地为目标多肽的大部分。

在此，我们证明了双环[6.1.0]壬-4-炔-9-基甲醇(BCN)和四嗪之间的荧光反应。这些反应的速率快于许多“生物正交”反应的速率3-7个数量级。我们描述了氨酰-tRNA合成酶/tRNA对和其用于将包含BCN的氨基酸，1，和包含反式环辛烯的氨基酸2(其与四嗪的反应也非常迅速)有效地位点特异性整合到大肠杆菌和哺乳动物细胞中表达的蛋白的用途。我们证明了在第一可测量的时间点(几秒钟或几分钟后)在体外、大肠杆菌中和活哺乳动物细胞中包含1和2的蛋白的位点特异性荧光标记。此外，我们证明了对于蛋白质组的四嗪标记的特异性，以及对于现有的“生物正交”反应，这一方法的优势(其组分可被编码)。开发的方法可在动物中用于位点特异性蛋白标记，并且发现其可用于标记和成像研究。

一种包含具有亲二烯体基团的氨基酸的多肽，其特征在于所述亲二烯体基团包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团。

我们描述了双环壬炔和反式环辛烯的遗传编码，其通过荧光Diels-Alder反应在体外和在活哺乳动物细胞中用于位点特异性蛋白标记。

本发明的方法可以在体内或体外实施。

在一个实施方式中，适当地，本发明的方法不用于人体或动物体。适当地，本发明的方法是体外方法。适当地，方法不需要人体或动物体的存在。适当地，方法不是人体或动物体的诊断、治疗或手术方法。

亲二烯体/反式-环辛烯(TCO)方面

在一个宽的方面中，本发明涉及包含具有能够与四嗪基团反应的亲二烯体基团的氨基酸的多肽。

适当地，所述亲二烯体基团作为赖氨酸的残基存在。

在一个实施方式中，本发明涉及一种生产含有亲二烯体基团的多肽的方法，所述方法包括将含有亲二烯体基团的氨基酸遗传整合到多肽中。

适当地，生产此多肽包含：

(i)提供编码多肽的核酸，该核酸包含编码具有亲二烯体基团的氨基酸的正交密码子；

(ⅱ)在能够识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸，并将具有亲二烯体基团的氨基酸整合到多肽链上。适当地，所述含有亲二烯体基团的氨基酸是亲二烯体赖氨酸。

适当地，所述正交密码子包括琥珀密码子(TAG)，所述tRNA包含MbtRNA_CUA，所述具有亲二烯体基团的氨基酸包括含有反式-环辛烯-4-醇(TCO)的氨基酸，以及所述tRNA 合成酶包含具有突变Y271A、L274M和C313A(TCORS)的PylRS合成酶。

适当地，所述PylRS tRNA合成酶的序列对应于含有突变Y271A、L274M和 C313A(TCORS)的MbPylRS tRNA合成酶的序列。在另一个方面中，本发明涉及本发明的 PylRStRNA合成酶用于将含有反式-环辛烯-4-醇(TCO)的氨基酸整合到多肽中的用途。

在另一个方面中，本发明涉及一种将含有反式-环辛烯-4-醇(TCO)的氨基酸整合到多肽中的方法，其包含使用本发明的PylRS tRNA合成酶以整合该氨基酸。

除非上下文另有说明，本文所讨论的将四嗪化合物连接到非天然氨基酸相关的方面，同样也用于TCO氨基酸，因为它们作用于BCN氨基酸。

我们报道了非常快速的荧光的BCN与一系列四嗪在室温水性条件下的反应。BCN-四嗪反应的速率常数高于降冰片烯与相同的四嗪的反应500至1000倍。TCO-四嗪反应的速率常数高于BCN与相同的四嗪的反应10-15倍。有张力的烯烃和四嗪之间的反应可能会导致非对映体和区域异构体以及来自二氢哒嗪异构化的异构体的混合物^3,4。

相反地，BCN四嗪反应导致形成单一的产物。这可能是应用中的一种优势，其中同质在探针附着的取向中可能是重要的，这包括单分子光谱和FRET法。

我们描述了氨酰-tRNA合成酶/tRNA对及其引导1和2高效地位点特异性地整合到大肠杆菌和哺乳动物细胞中的蛋白的用途。

我们已证实，蛋白的特异性定量标记使用编码的氨基酸1和2可以在数秒钟内完成，而此过程使用编码的降冰片烯时需要数十分钟至数小时⁷，使用利用铜催化的点击化学并使用炔烃探针的编码的叠氮化物时需要数十小时²¹。虽然我们未观察到整合到哺乳动物细胞表面上的EGFR中的叠氮化物与环辛炔的标记⁷，以及EGFR中编码的降冰片烯的标记仅允许与四嗪在2小时后标记⁷，但使用纳摩尔浓度的四嗪-染料缀合物在所测量的第一时间点(2min)观察到了整合1和2的EGFR的强且饱和的标记。这些实验证明，在小分子实验中所表征的快速的BCN-四嗪和TCO-四嗪连接在不同环境的蛋白标记中转化为实质性进步。虽然我们已证明了这种方法在体外、在大肠杆菌中和在活哺乳动物细胞中的优势，使用PylRS/tRNA_CUA对²⁹在线虫(C.elegans)中整合非天然氨基酸的能力表明，可能将如本文所述的标记方法拓展用于在动物中进行位点特异性蛋白标记。

遗传整合和多肽生产

在根据本发明的方法中，所述遗传整合优选使用正交的或延伸的遗传密码，其中一个或多个特异的正交密码子被分配以编码具有BCN基团的特异的氨基酸残基，使得其可以通过使用正交tRNA合成酶/tRNA对进行遗传整合。原则上，正交tRNA合成酶/tRNA 对可以是任何能够使tRNA携带包含BCN基团的氨基酸且能够将含有BCN基团的氨基酸整合到响应正交密码子的多肽链中的对。

正交密码子可能是正交密码子琥珀、赭石、蛋白石或四联体密码子。简单地，密码子必须对应于用于携带含有BCN基团的氨基酸的正交tRNA。优选正交密码子是琥珀密码子。

值得注意的是，本文所示的具体实施例使用了琥珀密码子和相应的tRNA/tRNA合成酶。如上所述，这些是可以变化的。或者，为了使用其它密码子而不引起使用或选择能够与含有BCN基团的氨基酸作用的可替代的tRNA/tRNA合成酶对的麻烦，tRNA的反密码子区域可以简单地与所需的所选密码子的反密码子区域交换。反密码子区域不涉及tRNA 的携带或整合功能，也不涉及tRNA合成酶的识别，因此这样的交换完全在熟练的操作者的范围内。

因此，如果需要，可以使用可替代的正交tRNA合成酶/tRNA对。

优选地，正交合成酶/tRNA对是巴氏甲烷八叠球菌(Methanosarcina barkeri)MS吡咯赖氨酸tRNA合成酶(MbPylRS)和其同源琥珀抑制子tRNA(MbtRNA_CUA)。

巴氏甲烷八叠球菌PylT基因编码MbtRNA_CUAtRNA。

巴氏甲烷八叠球菌PylS基因编码MbPylRS tRNA合成酶蛋白。当特定的氨基酸残基使用数字编号指代时，编号采用MbPylRS(巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶) 氨基酸序列作为参考序列(即由公开可获得的登录号为Q46E77的野生型巴氏甲烷八叠球菌PylS基因所编码)：

此处标注的所述序列在下文称为SEQ ID NO.1。

如果需要，本领域技术人员可以通过突变以适应MbPylRS tRNA合成酶蛋白，以优化所使用的BCN氨基酸。突变的需要取决于所使用的BCN氨基酸。一个实例是，当BCN 氨基酸不被MbPylRS tRNA合成酶蛋白处理时，可能需要突变MbPylRS tRNA合成酶。

可以通过将突变引入到MbPylRS tRNA合成酶上来进行此类突变，例如在MbPylRStRNA合成酶的如下的一个或多个位置上：M241、A267、Y271、L274和C313。

一个实例是，当所述具有BCN基团的氨基酸包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN) 赖氨酸。适当地，所述tRNA合成酶包含PylRS合成酶，如具有突变Y271M、L274G和C313A(BCNRS)的MbPylRS。

一个实例是，当所述具有亲二烯体基团的氨基酸包含含有反式-环辛烯-4-醇(TCO)的氨基酸。合适地，所述tRNA合成酶包含PylRS合成酶，如具有突变Y271A、L274M和C313A(TCORS)的MbPylRS。

tRNA合成酶

本发明的tRNA合成酶可以变化。虽然具体的tRNA合成酶的序列可能已经用于实施例中，本发明并不意图仅限于这些实施例。

原则上，可以在本发明中使用任何提供相同的tRNA携带(氨酰化)功能的tRNA合成酶。

例如，tRNA合成酶可以来自任何合适的物种，如来自阿克雅(archea)，如来自巴氏甲烷八叠球菌MS(Methanosarcina barkeri MS)；巴氏甲烷八叠球菌属Fusaro(Methanosarcina barkeri str.Fusaro)；马氏甲烷八叠球菌Go1(Methanosarcina mazeiGo1)；嗜乙酸甲烷八叠球菌C2A(Methanosarcina acetivorans C2A)；嗜热甲烷八叠球菌(Methanosarcina thermophila)或布氏甲烷八叠球菌(Methanococcoides burtonii)。或者tRNA 合成酶可以来自细菌，如来自哥本哈根脱亚硫酸菌DCB-2(Desulfitobacteriumhafniense DCB-2)；哥本哈根脱亚硫酸菌Y51(Desulfitobacterium hafniense Y51)；哥本哈根脱亚硫酸菌PCP1(Desulfitobacterium hafniense PCP1)；醋酸氧化脱硫肠状菌DSM771(Desulfotomaculum acetoxidans DSM 771)。

来自这些生物体的示例性序列是公开可获得的序列。提供如下实例作为吡咯赖氨酸 tRNA合成酶的示例性序列：

>巴氏甲烷八叠球菌MS/1-419/

巴氏甲烷八叠球菌MS

版本Q6WRH6.1GI:74501411

MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTLYNYLRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESY YNGISTNL

>巴氏甲烷八叠球菌F/1-419/

巴氏甲烷八叠球菌属Fusaro

版本YP_304395.1GI:73668380

MDKKPLDVLISATGLWMSRTGTLHKIKHYEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTEGKTSVKVKVVSAPKVKKAMPKSVSRAPKPLENPVSAKASTDTSRSVPSPAKSTPNSPVPTSAPAPSLTRSQLDRVEALLSPEDKISLNIAKPFRELESELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRDFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTLYNYLRKLDRILPDPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLESLIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVPLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYN GISTNL

>马氏甲烷八叠球菌/1-454

马氏甲烷八叠球菌Go1

版本NP_633469.1GI:21227547

MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL

>嗜乙酸甲烷八叠球菌/1-443

嗜乙酸甲烷八叠球菌C2A

版本NP_615128.2GI:161484944

MDKKPLDTLISATGLWMSRTGMIHKIKHHEVSRSKIYIEMACGERLVVNNSRSSRTARALRHHKYRKTCRHCRVSDEDINNFLTKTSEEKTTVKVKVVSAPRVRKAMPKSVARAPKPLEATAQVPLSGSKPAPATPVSAPAQAPAPSTGSASATSASAQRMANSAAAPAAPVPTSAPALTKGQLDRLEGLLSPKDEISLDSEKPFRELESELLSRRKKDLKRIYAEERENYLGKLEREITKFFVDRGFLEIKSPILIPAEYVERMGINSDTELSKQVFRIDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLEAIITEFLNHLGIDFEIIGDSCMVYGNTLDVMHDDLELSSAVVGPVPLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRAARSESYYNGISTNL

>嗜热甲烷八叠球菌/1-478

嗜热甲烷八叠球菌，版本DQ017250.1GI:67773308

MDKKPLNTLISATGLWMSRTGKLHKIRHHEVSKRKIYIEMECGERLVVNNSRSCRAARALRHHKYRKICKHCRVSDEDLNKFLTRTNEDKSNAKVTVVSAPKIRKVMPKSVARTPKPLENTAPVQTLPSESQPAPTTPISASTTAPASTSTTAPAPASTTAPAPASTTAPASASTTISTSAMPASTSAQGTTKFNYISGGFPRPIPVQASAPALTKSQIDRLQGLLSPKDEISLDSGTPFRKLESELLSRRRKDLKQIYAEEREHYLGKLEREITKFFVDRGFLEIKSPILIPMEYIERMGIDNDKELSKQIFRVDNNFCLRPMLAPNLYNYLRKLNRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLEAIIKDFLDYLGIDFEIVGDSCMVYGDTLDVMHGDLELSSAVVGPVPMDRDWGINKPWIGAGFGLERLLKVMHNFKNIKRASRSESYYNGIST NL

>布氏甲烷八叠球菌/1-416

布氏甲烷八叠球菌DSM 6242,版本YP_566710.1GI:91774018

MEKQLLDVLVELNGVWLSRSGLLHGIRNFEITTKHIHIETDCGARFTVRNSRSSRSARSLRHNKYRKPCKRCRPADEQIDRFVKKTFKEKRQTVSVFSSPKKHVPKKPKVAVIKSFSISTPSPKEASVSNSIPTPSISVVKDEVKVPEVKYTPSQIERLKTLMSPDDKIPIQDELPEFKVLEKELIQRRRDDLKKMYEEDREDRLGKLERDITEFFVDRGFLEIKSPIMIPFEYIERMGIDKDDHLNKQIFRVDESMCLRPMLAPCLYNYLRKLDKVLPDPIRIFEIGPCYRKESDGSSHLEEFTMVNFCQMGSGCTRENMEALIDEFLEHLGIEYEIEADNCMVYGDTIDIMHGDLELSSAVVGPIPLDREWGVNKPWMGAGFGLERLLKVRHNYTNIRRASRSELYYNGINT NL

>哥本哈根脱亚硫酸菌_DCB-2/1-279

哥本哈根脱亚硫酸菌DCB-2

版本YP_002461289.1GI:219670854

MSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEGLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNIN

>哥本哈根脱亚硫酸菌_Y51/1-312

哥本哈根脱亚硫酸菌Y51

版本YP_521192.1GI:89897705

MDRIDHTDSKFVQAGETPVLPATFMFLTRRDPPLSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEGLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNIN

>哥本哈根脱亚硫酸菌PCP1/1-288

哥本哈根脱亚硫酸菌

版本AY692340.1GI:53771772

MFLTRRDPPLSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEKLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIFDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNI N

>醋酸氧化脱硫肠状菌/1-277

醋酸氧化脱硫肠状菌DSM 771

版本YP_003189614.1GI:258513392

MSFLWTVSQQKRLSELNASEEEKNMSFSSTSDREAAYKRVEMRLINESKQRLNKLRHETRPAICALENRLAAALRGAGFVQVATPVILSKKLLGKMTITDEHALFSQVFWIEENKCLRPMLAPNLYYILKDLLRLWEKPVRIFEIGSCFRKESQGSNHLNEFTMLNLVEWGLPEEQRQKRISELAKLVMDETGIDEYHLEHAESVVYGETVDVMHRDIELGSGALGPHFLDGRWGVVGPWVGIGFGLERLLMVEQGGQNVRSMGKSLTYLDGVRLNI

在通过突变tRNA合成酶已经提供了特定的tRNA携带(氨酰化)功能时，简单地使用另一种如选自上述中一种的野生型tRNA序列可能是不恰当的。这种情况下，重要的是保持同样的tRNA携带(氨酰化)功能。这可以通过把示范的tRNA合成酶中的突变转移到如选自上述中一种的备用的tRNA合成酶骨架上来实现。

通过这种方式，能将所选择的突变转移到相应的tRNA合成酶序列上，如来自示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌序列以外的其它生物体的相应的pylS序列。

通过与已知的tRNA合成酶如示范的巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌的序列比对，可选择目标tRNA合成酶蛋白/骨架。

现通过参照pylS(吡咯赖氨酸tRNA合成酶)序列来阐述该问题，但所述原理同样适用于感兴趣的特定tRNA合成酶。

例如，图6提供了所有PylS序列的比对。这些序列可能出现低的整体百分比序列同一性。因此，重要的是例如通过将所述序列和已知tRNA合成酶进行序列比对(而不是简单地用低的序列同一性评分)对序列进行研究，以确保所用的序列的确是tRNA合成酶。

因此，适当地，当考虑序列同一性时，它被适当地认为是跨越如图6所示的tRNA 合成酶。适当地，百分比同一性可以如图6所定义。图7显示tRNA合成酶之间序列同一性的图。适当地，百分比同一性可以如图7所定义。

关注催化区域可能是有用的。图8比对的仅仅是催化区域。这样做的目的是提供由其可以定义高百分比同一性的tRNA催化区域，以捕获/鉴别适合接受所引入的突变的骨架，从而产生相同的tRNA携带(氨酰化)功能，例如新的或非天然的氨基酸识别。

因此，适当地，当考虑序列同一性时，适当地，它被认为是跨越如图8所示的催化区域。适当地，百分比同一性可以如图8所定义。图9显示了催化区域之间序列同一性的图。适当地，百分比同一性可以如图9所定义。

通过定点突变(mutagenesis)编码tRNA合成酶骨架的核苷酸序列，可以将突变“转移”或“植入”到可选的tRNA合成酶骨架上。该技术在本领域里是众所熟知的。实质上，选择骨架pylS序列(例如用上面所讨论的活性位点比对)且将所选择的突变转移到 (即安置在)相应的/同源位置。

当使用数字地址指代特定的氨基酸残基时，除非明显另外指明，否则编号使用MbPylRS(巴氏甲烷八叠球菌吡咯赖氨酸-tRNA合成酶)的氨基酸序列作为参考序列(即由公开可获得的登录号为Q46E77的野生型巴氏甲烷八叠球菌PylS基因所编码)：

入本领域广泛理解地使用该序列来定位目标残基。这并不总是一个严格的计数练习——必须注意环境或对齐。例如，如果目标蛋白的长度稍有不同，该序列中对应于(例如)L266的正确残基的定位可能需要将序列对齐，并挑出相当或相应的残基，而不是简单地取用目标序列的第266位残基。这完全在本领域技术人员的能力范围内。

本文所用的突变表示法是本领域的标准表示法。例如，L266M是指与野生型序列的第266位的L对应的氨基酸被替换为M。

其它tRNA骨架之间突变的植入现可参照示范性的巴氏甲烷八叠球菌和马氏甲烷八叠球菌的序列进行描述，但相同的原则可平等地用于植入到其它骨架或从其它骨架植入。

例如，Mb AcKRS是用于AcK的整合的工程化的合成酶。

亲本蛋白/骨架：巴氏甲烷八叠球菌PylS

突变：L266V、L270I、Y271F、L274A、C317F

Mb PCKRS：用于PCK的整合的工程化的合成酶。

亲本蛋白/骨架：巴氏甲烷八叠球菌PylS

突变：M241F、A267S、Y271C、L274M

通过把这些突变植入至马氏甲烷八叠球菌PylS中能得到具有相同底物特异性的合成酶。在图10中可以看出两个合成酶的序列同源性。因此，可以通过将来自Mb骨架的突变植入至Mm tRNA骨架上而产生下列合成酶：

Mm AcKRS：引入突变L301V、L305I、Y306F、L309A、C348F至马氏甲烷八叠球菌PylS；

Mm PCKRS：引入突变M276F、A302S、Y306C、L309M至马氏甲烷八叠球菌PylS。

下面给出这些植入突变的示范性合成酶的全长序列。

>Mb_PylS/1-419

>Mb_AcKRS/1-419

MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSGEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMVAPTIFNYARKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFFQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYY NGISTNL

>Mb_PCKRS/1-419

MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRSCRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKAMPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLDRVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDITKFFVDRGFLEIKSPILIPAEYVERFGINNDTELSKQIFRVDKNLCLRPMLSPTLCNYMRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENLEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESY YNGISTNL

>Mm_PylS/1-454

>Mm_AcKRS/1-454

MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERMGIDNDTELSKQIFRVDKNFCLRPMVAPNIFNYARKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFFQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL

>Mm_PCKRS/1-454

MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSSRTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKKAMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTGATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPFRELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYIERFGIDNDTELSKQIFRVDKNFCLRPMLSPNLCNYMRKLDRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCMVYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDFKNIKRAARSESYYNGISTNL

同样的原则同样适用于其它突变和/或其它骨架。

可有利地对用这种方式产生的具有植入的多肽进行测试，以确保保留了期望的功能/ 底物特异性。

可以将编码用于上述方法的目标多肽的多核苷酸整合到重组的可复制载体中。该载体可用于在可相容的宿主细胞中复制该核酸。因此，在进一步的实施方式中，本发明提供了通过将本发明的多核苷酸引入到可复制载体、将该载体引入到可相容的宿主细胞并在使载体复制的条件下培养上述宿主细胞来生产本发明的多核苷酸的方法。所述载体可从宿主细胞中回收。适当地，宿主细胞包括如大肠杆菌的细菌。

优选地，本发明的多核苷酸在载体中与控制序列有效地连接，所述控制序列能够使宿主细胞表达编码序列，即所述载体为表达载体。术语“有效地连接”指的是所描述的组分处于允许其以预期的方式发挥作用的关系中。“有效地连接”到编码序列的调节序列以在与控制序列相容的条件下实现编码序列的表达的方式连接。

本发明的载体可被转化或转染到所描述的合适的宿主细胞中，以表达本发明的蛋白。该方法包括在使载体表达编码所述蛋白的编码序列的条件下培养转化有上述表达载体的宿主细胞，和任选地回收所表达的蛋白质。

载体可以是，例如提供有复制起点、任选的用于表达所述多核苷酸的启动子和任选的所述启动子的调节子的质粒或病毒载体。载体可包含一个或多个选择性标记基因，例如细菌质粒情况下的氨苄青霉素抗性基因。可以使用载体以例如转染或转化宿主细胞。

有效地连接到编码本发明的蛋白的序列上的控制序列包括启动子/增强子和其它表达调控信号。可选择这些控制序列以使其与经设计使表达载体用于其中的宿主细胞相容。术语启动子在本领域中是熟知的，包括在大小和复杂度上从最小启动子到包括上游元件和增强子的启动子的范围内的核酸区域。

本发明的另一个方面是一种方法，如一种体外方法，其将含有BCN的氨基酸遗传地且位点特异性地整合至所选择的蛋白质中，适当地，在真核细胞中。所述方法中的遗传整合的一个优势是其避免了一旦形成就要将含有BCN氨基酸的蛋白递送到细胞中的需要，这是因为在本实施方式中，所述蛋白可以直接在靶细胞中合成。方法包括如下步骤：

i)在编码蛋白的核苷酸序列的所期望的位点用正交密码子如琥珀密码子引入或替代一个特定的密码子

ⅱ)在细胞中引入正交tRNA合成酶/tRNA对的表达系统，如吡咯赖氨酰(pyrollysyl)-tRNA合成酶/tRNA对

ⅲ)使具有根据本发明的含有BCN的氨基酸的细胞在培养基中生长。

步骤(i)在蛋白的遗传序列的所期望的位点上用正交密码子如琥珀密码子承担或替代特定的密码子。这可以简单地通过引入具有编码蛋白的核苷酸序列的构建体(如质粒)来完成，其中将期望将含有BCN的氨基酸引入/替换的位点进行变化以包含正交密码子如琥珀密码子。这完全在本领域技术人员的能力之内且下述给出了此类的实施例。

步骤(ii)需要一个正交表达系统以在所期望的位置(如琥珀密码子)特异性整合含有 BCN的氨基酸。因此，需要特异的正交tRNA合成酶如正交吡咯赖氨酰-tRNA合成酶和特异的相应的正交tRNA对，其一起能够使所述tRNA携带含有BCN的氨基酸。本文提供了此类的实施例。

蛋白表达与纯化

包含本发明的多核苷酸的宿主细胞可以用于表达本发明的蛋白质。可以在合适的允许表达本发明的蛋白的条件下培养宿主细胞。本发明的蛋白表达可以是组成型的，这使得其不断地产生，或者是可诱导的，这需要刺激以启动表达。在诱导表达的情况下，可以在需要时启动蛋白的生产，例如向培养基添加诱导物质如地塞米松或IPTG。

可以通过各种本领域已知的技术从宿主细胞中提取本发明的蛋白质，包括酶、化学和/或渗透裂解和物理破坏。

可以通过本领域已知的标准技术如制备性色谱、亲和纯化或任何其它合适的技术来纯化本发明的蛋白质。

定义

术语“包括”(包含、含有)应被理解为具有本领域常规的含义，即包括规定的特征或一组特征，但该术语不排除还存在任何其它的规定的特征或一组特征。

附图说明

图1示出了本研究所使用的非天然氨基酸1至5和四嗪衍生物(6-17)的结构式。TAMRA-X、硼荧TMR-X、硼荧-FL和CFDA是荧光团的通用名称；它们的结构式示于补充附图S4)。

图2示出了BCN-四嗪反应的动力学和光谱特征。a)反应的停流动力学；插图示出了四嗪7与5-降冰片烯-2-醇(Nor)的缀合物，标注了不同的时间尺度；条件：C₇＝0.05mM、 C_BCN＝C_Nor＝5mM于MeOH/H₂O(55/45)中，25℃。b)7和BCN的反应的二级速率常数k。 c)11与BCN的荧光反应。

图3示出了在大肠杆菌中使用BCNRS/tRNA_CUA或TCORS/tRNA_CUA对的非天然氨基酸的高效、遗传编码的整合。a)sfGFP-His₆的氨基酸依赖的过表达在150位上具有琥珀密码子。用抗His₆抗体检测裂解物中的所表达的蛋白。b)用考马斯亮蓝染色的凝胶显示了纯化的蛋白。c-e)氨基酸整合的质谱：sfGFP-1-His₆，实际：28017.54Da，计算：28017.62 Da；sfGFP-2-His₆，实际：27993.36Da，计算：27992.82Da；如本文所述，在3存在下所产生的sfGFP-His₆，实际：28019.34Da，计算：28019.63Da。所有质谱中较小的灰色峰表示131Da的损失，其对应于N-末端甲硫氨酸的蛋白水解裂解。

图4示出了重组蛋白与四嗪-荧光团的快速且特异的标记。a)具有1、2和4的sfGFP与四嗪-染料缀合物11(10eq)的特异性标记，如由SDS-PAGE和凝胶内荧光所表示的。对于在仅3存在的情况下所产生的sfGFP-His₆，可以见到非常弱的亚化学计量标记。b)通过 ESI-MS证明了sfGFP-1与11的定量标记(生物缀合之前(蓝色谱，实际：28018.1±2Da，计算：28017.6Da)和生物缀合之后(红色谱，实际28824.2±2Da，计算：28823.2Da))。 c)通过ESI-MS证明了sfGFP-2与11的定量标记(生物缀合之前(蓝色谱，实际：27993.2 ±2Da，计算：27992.8Da)和生物缀合之后(红色谱，实际28799.4±2Da，计算：28799.1 Da))。d)通过MS可以检测sfGFP-His₆(在3存在的情况下表达的)与11未标记。e)含有位点特异性整合的氨基酸1和2的蛋白质的非常快速标记。sfGFP-1(左)和sfGFP-2(中)在其用于装载凝胶的数秒钟内与11定量标记，而在相同条件下，完全标记sfGFP-4需要1h(右)。

图5示出了在哺乳动物细胞中将1和2位点特异性整合到蛋白质中，以及11的细胞表面和细胞内哺乳动物蛋白质的快速且特异性的标记。a)Western印迹证实了全长mCherry(TAG)eGFP-HA的表达依赖于1或2的存在，并且tRNA_CUA、BCNRS、TCORS 是FLAG标记的。b)活哺乳动物细胞中的细胞表面蛋白的特异和超快速标记。在128位具有1、2或5的EGFR-GFP显示为转染细胞的膜上的绿色荧光(左组)。用11(400nM)处理细胞导致包含1或2的EGFR的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。加入11后2分钟对细胞进行成像。c)活哺乳动物细胞中核蛋白的特异且快速标记。Jun-1-mCherry显示为转染细胞的细胞核中的红色荧光(左组)。用可渗透细胞的四嗪染料17(200nM)处理细胞导致jun-1-mCherry的选择性标记(中组)。右组示出了合并的红色和绿色荧光。未观察到具有jun-5-mCherry的细胞的标记。

图6示出了PylS序列的比对。

图7示出了PylS序列的序列同一性。

图8示出了PylS序列的催化结构域的比对(从350至480；从图6的比对编号)。

图9示出了PylS序列的催化结构域的序列同一性。

图10示出了基于巴氏甲烷八叠球菌PylS或马氏甲烷八叠球菌PylS的具有植入的突变的合成酶的比对。红色星号表示突变位置。

图11示出了方案1。我们在体外、在大肠杆菌中和在哺乳动物细胞中证明了非天然氨基酸1和2的合成、遗传编码和荧光标记。

图12(补充附图S1)示出了LC/MS迹线(254nm)，其显示了在MeOH中，相应的四嗪(6、7、9和8)与2当量的BCN(外/内混合物～4/1)的反应中，哒嗪产物(6-BCN、7-BCN、 9-BCN、8-BCN)的形成。所有质量以道尔顿形式给出。在室温下孵育反应10至30分钟后获得HPLC迹线。转换成哒嗪产物的总体产率为>98％。

图13(补充附图S2)示出了使用停流装置通过UV-光谱测定各个四嗪与BCN的反应的速率常数k。(a)BCN加成(100eq＝5mM)产生的化合物6在320nm处的UV吸光度的响应；将数据拟合至单指数方程，测量K'值(左组)；每个测量进行三至五次，并将所观察到的速率K'的平均值对BCN的浓度作图，以从曲线的斜率中获得速率常数k。对所有四个四嗪，进行完整测量组，一式两份(中组和右组)，值的平均值报告于补充表1中。，四嗪7、 9和8的(b-d)如(a)一样。条件：C_四嗪＝0.05mM于9/1的H₂O/MeOH中，C_BCN＝0.5至5mM 于MeOH中，导致最终在55/45的MeOH/H₂O混合物中。所有实验于25℃记录。

图14(补充附图S3)示出了使用停流设备通过UV-光谱测定四嗪6和7与TCO的反应中的速率常数K。(a)TCO加成(100eq＝5mM)产生的化合物6在320nm处的UV吸光度的响应；通过将数据拟合到两个单指数方程之和中，测定快速单指数方程的k'值(左组)；每个测量进行三至五次，并将所观察到的速率K'对TCO的浓度作图，以从曲线的斜率获得速率常数k。对两个四嗪，进行完整测量组，至少一式两份(中组和右组)，值的平均值报告于补充表1中。四嗪7(b)如(a)一样。条件：C_四嗪＝0.05mM于9/1的H₂O/MeOH中， C_TCO＝0.5至5mM于MeOH中，导致最终在55/45的MeOH/H₂O混合物中。所有实验于 25℃记录。

图15(补充附图S4)示出了在本研究中所使用的各种四嗪荧光团的结构式。可以在参考文献2中找到这些四嗪-荧光团的合成和特征化的细节。

图16(补充附图S5)示出了在与9-羟甲基双环[6.1.0]壬炔(BCN)的反应中“开启”的四嗪-荧光团的荧光。将水中的2mM相应的四嗪-荧光团溶液(2mM于DMSO中)与300当量的BCN反应。在添加BCN之前和之后30min记录发射光谱。激发波长：TAMRA-染料和硼荧-TMR-X：550nm；硼荧-FL：490nm。

图17(补充附图S6)示出了在150位具有琥珀密码子的sfGFP-His₆的氨基酸依赖性表达。使用抗-His₆抗体检测裂解物中表达的蛋白。使用氨基酸1的纯化的外型或内型非对映体表明外型形式优选通过BCNRS/tRNA_CUA整合至sfGFP中。

图18(补充附图S7)示出了sfGFP-1与各种四嗪的标记反应的LC-MS特征。黑色峰表示在标记前sfGFP-1的实际质量，彩色峰是sfGFP-1与6、7、9和8反应后的实际质量。所有的质量以道尔顿形式给出。与所有四嗪的标记是特异性的且定量的。反应条件：向～ 10μM的sfGFP-1溶液(于20mM Tris-HCl、100mM NaCl、2mM EDTA中，pH7.4)添加 10当量的相应的四嗪(于甲醇中的1mM储备液)，并将反应混合物在室温下孵育10至30 分钟。

图19(补充附图S8)示出了LC-MS显示了sfGFP-1与四嗪荧光团缀合物12、16、13 和14的特异性和定量标记。红峰表示在标记前sfGFP-1的实际质量，彩色峰是sfGFP-1 与12(a)、16(b)、13(c)和14(d)反应之后的实际质量。以道尔顿形式给出预期和实际的质量值。与所有的四嗪-荧光团的标记是特异性且定量的。反应条件：向～10μM的sfGFP-1 溶液(于20mM Tris-HCl、100mM NaCl、2mM EDTA中，pH7.4)添加10当量的相应的四嗪染料(于DMSO中的2mM储备液)，并将反应混合物在室温下孵育10至30分钟。

图20(补充附图S9)示出了在sfGFP对大肠杆菌蛋白质组中的标记1和2的特异性。考马斯亮蓝染色的凝胶示出了在指定浓度的非天然氨基酸1、2、3(外型和内型非对映体)和5存在的情况下产生sfGFP的大肠杆菌中的蛋白质。在凝胶中，荧光凝胶示出了与四嗪-染料缀合物11的特异性标记。虽然氨基酸1、2和3-外型以相似水平进行整合(从考马斯染色凝胶和Western印迹来判断)，我们观察到在3-外型和3-内型存在的情况下仅产生非常弱的亚化学计量的sfGFP的标记。这些观察与在3的反式烯烃至其顺式异构体的片段的体内转化相一致。

图21(补充附图S10)示出了在sfGFP对大肠杆菌蛋白质组中的标记1的特异性。泳道1-5：考马斯亮蓝染色凝胶示出了在指定浓度的非天然氨基酸1和5存在的情况下产生sfGFP的大肠杆菌中的蛋白质。泳道6-10：使用抗-His6抗体检测裂解物中的表达的蛋白。泳道11-15：指定荧光团11标记的蛋白的荧光图像。

图22(补充附图S11)示出了2分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记，且具有EGFR-5-GFP的细胞未被11 标记。

图23(补充附图S12)示出了5分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记，且具有EGFR-5-GFP的细胞未被11 标记。

图24(补充附图S13)示出了10分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有1的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有1的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后10分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记，且具有EGFR-5-GFP的细胞未被11标记。

图25(补充附图S14)示出了与包含氨基酸1的EGFR-GFP的超快速的标记相比，使具有EGFR-4-GFP的细胞特异性标记上四嗪-荧光团缀合物11²花费了2小时。

在128位具有4的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(200nM) 处理细胞导致含有4的EGFR-GFP的标记(中组)。右组示出了合并的绿色和红色荧光图像， DIC＝微分干涉对比。在添加11之后2小时对细胞进行成像。

图26(补充附图S15)示出了2分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有2的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后2分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记，且具有EGFR-5-GFP的细胞未被11 标记。

图27(补充附图S16)示出了5分钟的EGFR-GFP与四嗪-荧光团缀合物11的特异性且超快速的标记。在128位具有2的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM)处理细胞导致含有2的EGFR-GFP的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后5分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记，且具有EGFR-5-GFP的细胞未被11 标记。

图28(补充附图S17)示出了30和60分钟的在哺乳动物细胞中3的位点特异性整合和EGFR-GFP与四嗪-荧光团缀合物11的标记。a)Western印迹表明，全长mCherry(TAG)eGFP-HA的表达依赖于3或5和tRNA_CUA的存在。BCNRS和PylRS被FLAG标记。B 和C)在128位存在3的EGFR-GFP在转染细胞的膜上显示为绿色荧光(左组)。用11(400nM) 处理细胞导致微弱但可测量到的含有3的EGFR-GFP的标记(中组)。这一观察与在哺乳动物细胞中的3的片段的反式烯键到其顺式的异构化相一致。右组示出了合并的绿色和红色荧光图像，DIC＝微分干涉对比。在添加11之后30或60分钟对细胞进行成像。在相同的未表达EGFR-GFP的样品中未观察到细胞标记。

图29(补充附图S18)示出了在活哺乳动物细胞中核蛋白的特异性且超快速的标记。 Jun-1-mCherry在转染细胞的核内显示为红色荧光(左组)。用可渗透细胞的四嗪染料17(200 nM)处理细胞导致jun-1-mCherry的选择性标记(中组)。右组示出了合并的绿色和红色荧光图像。DIC＝微分干涉对比。在添加11之后15分钟对细胞进行成像。在相同的未表达jun-mCherry的样品中未观察到细胞标记，且具有jun-5-mCherry的细胞未被11标记。

具体实施方式

本发明现通过实施例的方式进行描述。这些实施例旨在是说明性的，并不旨在限制所附的权利要求。

实施例

我们开发了四嗪和BCN之间的快速的且荧光的反应，并在大肠杆菌和哺乳动物细胞中证明了含有氨基酸1和2的BCN和反式环辛烯的遗传编码。我们示出了蛋白的在大肠杆菌和在活哺乳动物细胞中与四嗪探针的特异性和快速标记，并明确地证明了相对于以前报道的生物正交标记策略，此方法的优势(图11-方案1)。

实施例1：化学与加成反应

测量了各种亲二烯体(BCN、TCO(反式-环辛烯-4-醇)和sTCO(双环[6.1.0]壬-4-烯-9- 基甲醇))与四嗪的反应的速率常数^3-5、9、11。然而，在许多情况下，研究人员已经使用了不同的四嗪、溶剂系统或测量方法，这使定量比较各种亲二烯体与目标四嗪的反应性变得具有挑战。我们最初的实验确认了，各种亲二烯体与四嗪6(图1)的反应的速率太快以至于不能在准一级条件下通过手工混合研究。因此，我们转向停流技术以直接确定这些反应的准一级速率常数。通过归结在甲醇/水(55/45)混合物中与10至100倍过量的BCN反应时在320nm的吸光度的指数衰减，我们确定了BCN与6和7的反应的速率常数分别是437 M^-1s^-1(+/-13)和1245M^-1s^-1(+/-45)。LC-MS和NMR证实了预期产物的形成(补充信息和补充附图1)。在相同条件下，我们确定了TCO与6和7的速率常数分别是5235M^-1s^-1(+/-258) 和17248M^-1s^-1(+/-3132)。这些数据证明了BCN和6之间的反应比5-降冰片烯-2-醇和6 之间的反应快约1000倍⁷，而TCO速率比BCN速率快约10-15倍。sTCO速率太快而难以由停流技术进行精确地测量，并且我们估计其比TCO速率快至少50倍。在BCN与四嗪8和9的反应中观察到了相似的速率加速(图1、图2a和2b、补充表1和补充附图S2 和S3)。

补充表1：使用停流装置在25℃于准一级条件下所测量的各种四嗪(6、7、9和8)与BCN和TCO的反应的速率常数k，与在21℃相同的四嗪与5-降冰片烯-2-醇的反应的速率常数相比较²。数值通过至少两个独立的测量来确定。溶剂体系：55/45甲醇/水。BCN 与四嗪的环加成反应比5-降冰片烯-2-醇的反应快500至1000倍，TCO和四嗪之间的反应比BCN和四嗪之间的反应快10至15倍。

数个四嗪荧光团缀合物，包括11、13、14和16(附图1，补充附图S4)相对于游离荧光团而言是基本上猝灭的，观察到荧光团的发射能量转移到邻近的四嗪发色团具有510 和530nm之间的最大吸光度^7、18。我们发现，BCN与四嗪荧光团缀合物11、13、14和 16的反应导致荧光的5-10倍的增加，这表明哒嗪产物的形成有效地减轻了荧光猝灭(图 2c和补充附图S5)。BCN和这些四嗪之间的荧光反应，像有张力的烯烃和这些四嗪之间的反应一样^7、18，利于成像实验，这是因为其最大化了标记信号，而最小化了游离四嗪荧光团所产生的荧光。

实施例2：氨基酸设计

接着，我们的目的是设计、合成和遗传编码具有BCN、TCO和sTCO的氨基酸以用于在体外和在细胞中将位点特异性蛋白标记不同的探针。来自包括巴氏甲烷八叠球菌(Mb) 和马氏甲烷八叠球菌(Mm)的甲烷八叠球菌属的吡咯赖氨酰-tRNA合成酶(PylRS)/ tRNA_CUA对和其演化衍生物用于指导越来越多的响应琥珀密码子的结构多样的非天然氨基酸的位点特异性整合^19-26。PylRS/tRNA_CUA对正在成为可能的最通用的系统，以用于将非天然氨基酸整合到蛋白质中，由于其在一系列宿主中是正交的，允许演化自大肠杆菌的合成酶在越来越多的细胞和组织中用于遗传密码延伸，这包括：大肠杆菌、鼠伤寒沙门氏菌、酵母、人类细胞和线虫^7、27-31。我们设计了非天然氨基酸1、2和3(附图1)，目的是用PylRS/tRNA_CUA对或演化衍生物将它们整合到蛋白中。氨基酸的合成如补充信息中所述。

实施例3：遗传整合到多肽和tRNA合成酶

我们筛选了MbPylRS/tRNA_CUA对以及一组MbPylRS的突变体，其是先前在我们实验室中生产的并用于将不同的非天然氨基酸位点特异性地整合到蛋白质中，其能指导1、 2和3通过响应在150位引入的琥珀密码子整合入C末端六聚组氨酸-(His₆)标签的超折叠绿色荧光蛋白(sfGFP)。MbPylRS/tRNA_CUA对没有指导任何所测试的非天然氨基酸的整合，如通过抗C末端His₆标签的Western印迹来判断。然而，包含MbPylRS突变体、在酶活性位点包含三个氨基酸取代Y271M、L274G、C313A³²(我们命名为BCN-tRNA合成酶， BCNRS)的细胞，编码MbtRNA_CUA和在150位具有琥珀密码子的 sfGFP-His₆(psfGFP150TAGPylT-His₆)的质粒引起全长sfGFP-His₆的氨基酸依赖性合成，如通过抗-His₆的Western印迹和考马斯染色所判断的(图3a)。使用1及其内型异构体的额外的蛋白表达实验证明了通过BCNRS/tRNA_CUA优选外型整合到蛋白中(补充附图S6)。我们发现了另外的合成酶突变体，其具有突变Y271A、L274M和C313A³²，我们将其命名为TCO-tRNA合成酶，TCORS。TCORS/tRNA_CUA对在2存在的情况下引起来自 psfGFP150TAGPylT-His₆的sfGFP的氨基酸依赖性合成。最后，我们发现BCNRS/tRNA_CUA对和TCORS/tRNA_CUA对在3存在的情况下都引起来自psfGFP150TAGPylT-His₆的sfGFP 的氨基酸依赖性合成。对于每个氨基酸，在His-标签和凝胶过滤纯化后以良好收率分离了sfGFP(每L培养基6-12mg，图3b)。这相当于其它良好整合的非天然氨基酸(包括5)所得到的产率。在各个非天然氨基酸存在的情况下psfGFP150TAGPylT-His₆所产生的sfGFP 的电喷雾电离质谱(ESI-MS)与它们的位点特异性整合相一致(图3c-3e)。

实施例4：位点特异性整合

为了证明四嗪-染料-探针与具有位点特异性整合的1的重组蛋白有效地且特异性地反应，我们在室温下用10当量的四嗪荧光团缀合物11标记纯化的sfGFP-1-His₆ 1小时。SDS-PAGE和ESI-MS分析证实了含有1的sfGFP的定量标记(图4a和4b)。对照实验表明，在与用于标记sfGFP-1的相同条件下sfGFP-4被标记，且没有检测到与sfGFP-5的非特异性标记。ESI-MS证明sfGFP-1可有效地和特异性地与一系列四嗪6、7、8和9衍生化(补充附图S7)，与四嗪荧光团缀合物12、13、14和16衍生化(补充附图S8)。我们还证明了纯化的sfGFP-2-His₆可以与四嗪荧光团11进行定量标记(图4a和4c)。有趣的是，我们观察到仅有非常微弱的sfGFP-His₆的标记，其纯化自表达TCORS/tRNA_CUA和psfGFP150TAGPylT-His₆的细胞，并在3存在的情况下生长(图4a和4d)且在纯化前存在此蛋白的亚化学计量的标记(补充附图S9)。由于在3存在的情况下所表达的sfGFP具有与3 的整合相对应的质量，这些观察与3中的反式烯烃部分体内转化与其无反应性的顺式异构体相一致。已知此异构化发生于硫醇存在的情况下⁴。

实施例5：反应的特异性和选择性

为了进一步证明，BCN和各种四嗪基染料之间的反应不仅高效和特异性而且在细胞环境中具有高度选择性，我们在表达sfGFP-1-His₆的大肠杆菌中进行反应(补充附图S10)。在诱导蛋白表达后4小时收集表达不同水平的sfGFP-1的细胞(通过调整添加至细胞的1 的浓度来控制)，用PBS洗涤并在室温下与四嗪染料11孵育30分钟。加入过量的BCN 以猝灭未反应的四嗪染料之后，将细胞裂解并分析反应混合物。凝胶内荧光证明了具有1 的重组sfGFP与四嗪缀合的TAMRA染料11的特异性标记。虽然裂解物中的许多蛋白质的丰度与sfGFP-1相当，我们仅观察到极少的背景标记，这表明此反应对于大肠杆菌蛋白质组是特异性的。

实施例6：标记的速度

为了研究在小分子中观察到的BCN-四嗪环和TCO-四嗪环加成反应的速度是否转化为异常快速的蛋白标记，我们比较了具有1、2或4的纯化的sfGFP与10当量的四嗪-荧光团缀合物11的标记。作为时间函数的标记反应的凝胶内荧光成像(图4e)表明了在约1 小时内sfGFP-4的反应得以完成。相比之下，sfGFP-1和sfGFP-2的标记在用于测量第一时间点的几秒钟内完成，这表明BCN-四嗪和TCO-四嗪反应的速率加素转换成了快速得多蛋白标记。

实施例7：应用于哺乳动物细胞

为了证明哺乳动物细胞中的氨基酸1和2的整合，我们通过植入突变创建了BCNRS和TCORS的哺乳动物优化版本，以允许1或2整合进哺乳动物优化的MbPylRS中。通过Western印迹，我们证明了通过使用BCNRS/tRNA_CUA对或TCORS/tRNA_CUA，1和2 均可以在哺乳动物细胞中高效地遗传编码进蛋白(图5a)。

为了研究快速BCN-四嗪连接是否提供了在哺乳动物细胞中的位点特异性标记蛋白的优势，我们在含有BCNRS/tRNA_CUA对的HEK-293细胞中、在1存在(0.5mM)的情况下表达了在128位具有琥珀密码子的表皮生长因子受体(EGFR)-绿色荧光蛋白(GFP)融合体 (EGFR(128TAG)GFP)。在1存在的情况下产生了全长的EGFR-1-GFP，这导致在细胞膜上产生了明亮的绿色荧光。为了将EGFR的128位上的1(其在受体的胞外结构域中)与四嗪荧光团缀合物相标记，我们将细胞与11(400nM)孵育，改变培养基并将TAMRA标记所产生的红色荧光和全长EGFR-GFP表达所产生的绿色荧光进行成像。TAMRA荧光与细胞表面的EGFR-GFP荧光很好地共定位。在我们可测量的第一时间点，2分钟内观察到具有EGFR-1-GFP的细胞的清晰的标记；其它时间点证明，标记在2分钟内达到饱和(图 5b和补充附图S11-S14)；用四嗪荧光团12得到了类似的结果。将2整合进EGFR-GFP 融合体产生与四嗪荧光团11的相似地快速且有效的标记(图5b和补充附图S15-S16)。相比之下，在相同条件下，经过2小时，我们才观察到具有EGFR-4-GFP的细胞的特异性标记(补充附图S14)⁷。在对照实验中，我们观察到具有EGFR-5-GFP的细胞无标记且未表达EGFR-GFP的细胞未检测到非特异性标记。我们观察到，在BCNRS/tRNA_CUA对和3 存在的情况下HEK293细胞中所表达的EGFR-GFP(来自EGFR(128TAG)GFP)的微弱但可测量的标记(补充附图S17)。这些观察与哺乳动物细胞中的3的片段的异构化相一致，并与我们在大肠杆菌中的观察相一致。

为了证明在哺乳动物细胞中胞内蛋白的快速标记，我们从在JunB(jun)和mCherry之间的接头上具有琥珀密码子的基因中表达了具有C-末端mCherry融合的转录因子，jun。在氨基酸1和BCNKRS/tRNA_CUA对存在的情况下，在HEK细胞中产生了jun-1-mCherry 蛋白，与所预期的一样，其定位于细胞的细胞核(图5c和补充附图S18)。与可渗透细胞的二乙酰荧光素四嗪缀合物(200nM)的标记产生了绿色荧光，其与在第一时间点所分析的 mCherry信号很好地共定位(15min标记，随后洗涤90min)。在相同样品中的未转染细胞中或表达jun-5-mCherry的对照细胞中没有观察到特异性标记，这进一步证实了胞内标记的特异性。

补充实施例

蛋白质的表达和纯化

为了表达整合有非天然氨基酸1的sfGFP，我们用pBKBCNRS(其编码MbBCNRS) 和psfGFP150TAGPylT-His₆(其编码MbtRNA_CUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化大肠杆菌DH10B细胞。在37℃于1ml的S.O.B培养基(补充有0.2％的葡萄糖)恢复细胞1小时，之后在100ml含有氨苄青霉素(100μg/mL)和四环素(25μg/mL)的LB中孵育(16h、37℃、230r.p.m)。使用20mL这种过夜培养物接种1L 补充有氨苄青霉素(50μg/mL)和四环素(12μg/mL)的LB，并在37℃孵育。在OD₆₀₀＝0.4 至0.5时，添加在H₂O中的1的溶液使得最终浓度为2mM。30min之后，通过加入终浓度为0.2％的阿拉伯糖诱导蛋白表达。诱导3h后，离心收集细胞并在-80℃中冷冻备用。将细胞在冰上解冻并悬浮于30ml的裂解缓冲液(10mM Tris-HCl、20mM咪唑、200mM NaCl，pH 8，1mM苯甲基磺酰氟、1mg/mL溶菌酶、100μg/mL DNaseA、Roche蛋白酶抑制剂)中。于4℃超声提取蛋白。通过离心将提取物澄清(20min、21.000g、4℃)，将600 μL的Ni²⁺-NTA珠(Qiagen)加入到提取物中并将混合物在4℃搅拌孵育1小时。通过离心 (10min、1000g)收集珠。将珠重悬于30mL洗涤缓冲液(20mM Tris-HCl、30mM咪唑、300 mM NaCl，pH 8)并于1000g离心，重复三次。随后，将珠重悬于10mL的洗涤缓冲液中，并转移到柱中。用3mL补充有200mM咪唑的洗涤缓冲液洗脱蛋白并通过尺寸排阻色谱法采用HiLoad 16/60Superdex75制备级柱(GE Life Sciences)以1mL/min的流速(缓冲液： 20mM Tris-HCl、100mM NaCl、2mM EDTA，pH 7.4)进一步进行纯化。将含有蛋白质的级分收集并用Amicon Ultra-15 3kDa MWCO离心过滤装置(Millipore)浓缩。通过4-12％的SDS-PAGE分析纯化的蛋白质并通过质谱确认其质量(见补充信息)。用相同的方式制备具有整合的2和3的SfGFP：sfGFP-2、sfGFP-3，预期用pBKTCORS(其编码MbTCORS) 和psfGFP150TAGPylT-His₆(其编码MbtRNA_CUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化细胞。用相同的方式制备具有整合的4和5的SfGFP： sfGFP-4、sfGFP-5，预期用pBKPylRS(其编码MbPylRS)和psfGFP150TAGPylT-His₆(其编码MbtRNA_CUA和在150位具有琥珀密码子的C-末端六聚组氨酸标记的sfGFP基因)转化细胞。纯化蛋白的产量达到6-12mg/L。

蛋白质谱

通过使用Agilent 1200LC-MS系统，用6130四极谱仪进行ESI-MS。溶剂体系由作为缓冲液A的H₂O中的0.2％甲酸和作为缓冲液B的乙腈(MeCN)中的0.2％甲酸组成。使用Phenomenex Jupiter C4柱(150x 2mm、5μm)对蛋白进行LC-ESI-MS，并且根据214 和280nm的蛋白UV吸光度，在正模式中分析样品。用MS Chemstation软件(Agilent Technologies)通过反褶积计算总蛋白质量。

此外，在具有电喷雾电离的LCT飞行时间质谱仪(ESI，Micromass)上确定蛋白总质量。蛋白质重缓冲于20mM的碳酸氢铵中并与包含1％甲酸的乙腈1:1混合。或者用C4 Ziptip(Millipore)制备样品并直接灌注于包含1％甲酸的50％乙腈水溶液中。以10μL min^-1的速度注射样品并用马心肌红蛋白在正离子模式下进行校准。将30个扫描进行平均，并用MassLynx版本4.1(Micromass)通过最大熵反褶积获得分子质量。使用 ProtParam(http://us.expasy.org/tools/protparam.html)计算野生型蛋白质的理论质量，并手工校正包含非天然氨基酸的蛋白质的理论质量。

经四嗪-BCN或四嗪-TCO环加成的蛋白标记

用不同的四嗪体外标记纯化的蛋白质

向40μL纯化的重组蛋白(～10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA，pH7.4)添加4μL的1mM的溶于MeOH的四嗪化合物6、7、8或9溶液(～10或20当量)。室温孵育30分钟后，通过LC-ESI-MS分析溶液。(补充附图S9)

用四嗪和四嗪-染料缀合物体外标记纯化的蛋白质：

将具有位点特异性整合的1或2的纯化的重组sfGFP：sfGFP-1或sfGFP-2(～10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA，pH7.4)分别与10当量的四嗪-染料缀合物11、 12、13、14、15或16(2mM于DMSO中)进行孵育。室温下孵育溶液，并在30分钟至3 小时后取等分试样，通过SDS PAGE分析，用C4-ZIPTIP脱盐后通过ESI-MS进行分析。用考马斯亮蓝染色SDSPAGE凝胶或用Typhoon成像仪扫描SDS PAGE凝胶以将凝胶内荧光可视化(图4和补充附图S8)。

作为时间函数的四嗪-染料缀合物体外标记纯化的蛋白质：

将2nmol纯化的sfGFP-1、sfGFP-2或sfGFP-4(10μM于20mM Tris-HCl、100mM NaCl、2mM EDTA，pH 7.4中)与20nmol的四嗪-染料缀合物11(10μL于DMSO中的2 mM的溶液)孵育。在不同的时间点(0、30s、1min、2min、5min、10min、30min、1h、 2h、3h)从溶液中取出8μL的等分试样并用700倍过量的BCN或TCO猝灭并投入液氮中。将样品与补充有5％β-巯基乙醇的NuPAGE LDS样品缓冲液混合，加热10min至 90℃，并通过4-12％的SDS PAGE进行分析。通过用Typhoon Trio磷光成像仪(GE Life Sciences)扫描荧光带对标记的蛋白的量进行定量。使用橡皮筋(rubber band)背景减法用 ImageQuant^TM TL软件(GE Life Sciences)对带进行定量。凝胶内荧光显示了sfGFP-4与10 当量的四嗪荧光团11的标记在1h内完成(图4e)，而sfGFP-1和sfGFP-2的标记在用于测量第一时间点的数秒钟内完成。

用四嗪-染料缀合物标记整个大肠杆菌蛋白质组：

将含有psfGFP150TAGPylT-His₆和pBKBCNRS或者psfGFP150TAGPylT-His₆和pBKPylRS的大肠杆菌DH10B细胞接种于含有氨苄青霉素(对于pBKBCNRS，100μg/mL) 或卡那霉素(对于pBKPylRS，50μg/mL)和四环素(25μg/mL)的LB中。在37℃以250rpm 将细胞振摇孵育过夜。将2mL过夜培养物接种到100mL的补充有氨苄青霉素(50μg/mL) 和四环素(12μg/mL)或者卡那霉素(25μg/mL)和四环素(12μg/mL)的LB中，在37℃孵育。当OD₆₀₀＝0.5时，移出3ml培养物等分试样并补充不同浓度(1mM、2mM和5mM)的1 和1mM的5。37℃振摇孵育30min后，通过加入30μL的20％阿拉伯糖诱导蛋白表达。表达3.5h后，离心(16000g，5min)1mL的细胞悬浮液收集细胞。将细胞重悬浮于PBS 缓冲液中，再次离心，弃去上清液。此过程重复多于两次。最后，将洗涤的细胞沉淀物悬浮于100μL的PBS中，并在室温下与3μL的四嗪-染料缀合物11(2mM于DMSO中) 孵育30分钟。添加200倍过量的BCN以猝灭未反应的四嗪染料之后，将细胞重悬浮于 100μL补充有5％β-巯基乙醇的NuPAGE LDS样品缓冲液中，于90℃加热10min并 16000g离心10min。通过4-12％SDS-PAGE分析粗细胞裂解物以评估蛋白质水平。用考马斯亮蓝染色或用Typhoon成像仪扫描凝胶，以使荧光带显色(补充附图S9和S10)。用抗六聚组氨酸标签的抗体进行Western印迹(Cell Signaling Technology，His标签27E8鼠mAb#2366)。

停流确定小分子环加成的动力学速率常数

在准一级条件下、用甲醇/水混合物中10至100倍过量的BCN或TCO，之后用停流装置随时间在320、300或280nm处四嗪的UV吸光度的指数衰减来测量不同的四嗪的速率常数k(Applied Photophysics，补充附图S2和S3和补充表1)。制备各个四嗪(0.1mM于 9/1水/甲醇中)以及BCN和TCO(1至10mM于甲醇中)的储备液。测量前，四嗪以及BCN 和TCO溶液均在停流装置的注射器中恒温化。通过停流装置混合等体积的制备的储备液，使得最终浓度为0.05mM的四嗪和0.5至5mM的BCN或TCO，对应于10至100当量的BCN或TCO。使用下列仪器参数记录光谱：对于6和7，波长为320nm；对于8，波长为300nm；对于9，波长为280nm；每秒500至5000个数据点)。所有测量均在25℃进行。BCN-四嗪反应的数据拟合到单指数方程，并且TCO-四嗪反应的数据拟合到两个单指数方程之和。每个测量进行三至五次，将所观察到的速率K'的平均(如果是TCO-四嗪反应，则是第一指数方程)与BCN或TCO的浓度作图，以从图的斜率中获得速率常数k。对于所有4个四嗪，一式两份进行完整的测量组，值的平均值示于补充表1中。使用 Kaleidagraph软件(Synergy Software,Reading,UK)处理所有数据。

克隆哺乳动物细胞的应用

使用酶AflII和EcoRV(NEB)酶切质粒pMmPylS-mCherry-TAG-EGFP-HA^1,2和pMmPylRS-EGFR-(128TAG)-GFP-HA²以去除野生型MmPylRS。用相同的侧翼位点、通过GeneArt制备突变合成酶MbBCNRS和MbTCORS的合成的基因。合成的MbBCNRS和 MbTCORS也用AflII和EcoRV消化并克隆以代替野生型合成酶(MmPylS)。通过使用快速连接试剂盒(Roche)，构建了载体pMbBCNRS-mCherry-TAG-EGFP-HA、 pMbBCNRS-EGFR(128TAG)-GFP-HA和pMbTCORS-EGFR(128TAG)-GFP-HA。通过交换 MmPylRS与MbBCNRS，从pCMV-cJun-TAG-mCherry-MmPylRS质粒构建 pCMV-cJun-TAG-mCherry-MbBCNRS质粒(由Fiona Townsley构建)。按同样方法构建 pMbBCNRS-mCherry-TAG-EGFP-HA质粒。

HEK293细胞中的氨基酸1、2和3的整合

将HEK293细胞铺于聚赖氨酸包被的μ盘(Ibidi)。在10％的胎牛血清(FBS)Dulbecco 改进的Eagle培养基(DMEM)中生长至接近汇合时，使用lipofectamine 2000(Life Technologies)用2μg的pMbBCNRS-EGFR(128TAG)-GFP-HA和2μg的 p4CMVE-U6-PylT(其包含四个拷贝的野生型吡咯赖氨酰tRNA)^1,2转染细胞。转染后，将细胞留于10％FBSDMEM中，37℃和5％的CO₂条件下生长过夜。对于Western印迹，将细胞铺于24孔板并生长至接近汇合。使用lipofectamine 2000用 pMbBCNRS-mCherry-TAG-EGFP-HA或pMmPylRS-mCherry-TAG-EGFP-HA或 pTCORS-mCherry-TAG-EGFP-HA构建体和p4CMVE-U6-PylT质粒转染细胞。在存在或不存在0.5mM的1、1mM的2或1mM的5的条件下生长16小时后，使用RIPA缓冲液 (Sigma)将细胞在冰上裂解。离心裂解物并将上清液加到4x LDS样品缓冲液(Lifetechnologies)中。样品通过SDS-PAGE进行分析，并转移至硝酸纤维素膜上，并使用原代大鼠抗-HA(罗氏)和小鼠抗-FLAG(Ab frontier)进行印迹，二抗分别是抗-大鼠(Santa CruzBiotech)和抗-小鼠(Cell Signaling)。

哺乳动物细胞表面蛋白的标记

将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后，用2μg的 pMbBCNRS-EGFR(128TAG)-GFP-HA或pMbTCORS-EGFR(128TAG)-GFP-HA和 p4CMVE-U6-PylT转染细胞。在存在0.5mM的1(0.5％DMSO)、1mM的2或1mM的3 的情况下于37℃和5％CO₂下在含有0.1％FBS的DMEM中生长8-16小时后，在含有0.1％ FBS的DMEM中洗涤细胞，然后在含有0.1％FBS的DMEM中孵育过夜。次日，将细胞洗涤一次以上之后，加入400nM的四嗪-染料缀合物11孵育2-60分钟。将培养基更换两次，然后将细胞成像。在具有平复消色差透镜63X油浸物镜的Zeiss 780激光扫描显微镜下进行成像；扫描缩放：1x或2x；扫描分辨率：512×512；扫描速度：9；平均：16×。 EGFP在488nm激发并在493至554nm成像；TAMRA分别在561nm和566-685nm激发和检测。

同样处理对照组，但用pMmPylRS-EGFR(128TAG)-GFP-HA代替 pMbBCNRS-EGFR(128TAG)-GFP-HA转染细胞。在存在1mM的5的情况下并且在不存在或存在0.5％的DMSO(例如是氨基酸1的情况下)的情况下过夜培养细胞。

哺乳动物细胞核蛋白的标记

将细胞铺于聚赖氨酸包被的μ盘并在生长至接近汇合后，用2μg的 pCMV-cJun-TAG-mCherry和p4CMVE-U6-PylT分别转染细胞。在存在0.5mM的1(0.5％ DMSO)的情况下于37℃和5％CO₂下在含有0.1％FBS的DMEM中生长约16小时后，在含有0.1％FBS的DMEM中洗涤细胞，然后在含有0.1％FBS的DMEM中孵育过夜。次日，用两种培养基交替重复洗涤细胞，然后在2小时内孵育30分钟。加入200nM的四嗪-染料缀合物11孵育15分钟，然后再次重复洗涤细胞90分钟。对细胞表面的标记进行成像。

化学合成：

通用方法：

在Bruker Ultrashield^TM 400Plus光谱仪(¹H：400MHz，¹³C：101MHz，³¹P：162MHz)上记录NMR谱。以ppm报告化学位移(δ)并参考残余的未氘化的溶剂峰：CDCl₃(7.26 ppm)、d₆-DMSO(2.50ppm)用于¹H-NMR谱，CDCl₃(77.0ppm)、d₆-DMSO(39.5ppm)用于¹³C-NMR谱。¹³C-和³¹P-NMR共振是质子去偶的。对于偶合常数(J)的测量精确到0.1Hz 并如观察所示。分裂模式指定如下：s，单峰；d，双峰；t，三重峰；q，四重峰；quin，五重峰；sext，六重峰；m，多重峰。在硅胶60F-254板上进行分析型薄层色谱(TLC)。通过UV光(254nm)和/或通过高锰酸钾染色将斑点可视化。在硅胶60(230-400目或70-230 目)上进行快速柱色谱。使用具有6130四极谱仪的Agilent 1200LC-MS系统进行ESI-MS。溶剂体系由作为缓冲液A的H₂O中的0.2％甲酸和作为缓冲液B的乙腈(MeCN)中的0.2％甲酸组成。使用Phenomenex Jupiter C18柱(150×2mm，5μm)进行小分子LC-MS。使用可变波长并在正离子和负离子模式获得MS。使用具有来自Phenomenex C18柱(250×30 mm，5μm)的自动化馏分收集的Varian PrepStar/ProStarHPLC系统进行制备性的HPLC 纯化。通过191nm的UV吸光度鉴定化合物。所有溶剂和化学试剂购自商业供应商，并且无需进一步纯化即可使用。双环[6.1.0]壬-4-炔-9-基甲醇(BCN，外/内混合物～4/1)购自 SynAffix，荷兰。非水反应在惰性氩气气氛下在烘箱干燥的玻璃器皿中进行，除非另有说明。所有实验用水是蒸馏的。盐水是指饱和氯化钠水溶液。

根据文献步骤³合成外-双环[6.1.0]壬-4-炔-9-基甲醇(exo-BCN，S18)。

于0℃将N,N'-二琥珀酰亚胺碳酸酯(1.38g，5.37mmol)加入到于MeCN(10mL)中的exo-BCN-OH S18(538mg，3.58mmol)和三乙胺(2.0mL，14.3mmol)的搅拌溶液中。将溶液加热至室温并搅拌3小时并减压浓缩。将粗的油状物通过硅胶色谱(用己烷中的60％的 EtOAc洗脱)的短垫(shord pad)进行纯化，得到exo-BCN-琥珀酰亚胺碳酸酯，其直接使用而不需要进一步纯化。DMF(4mL)中的exo-BCN-OSu(1.25g，4.29mmol)经插管加入到DMF(10mL)中的Fmoc-Lys-OH.HCl(2.61g，6.45mmol)和DIPEA(1.49mL，8.58mmol)的搅拌溶液中。室温搅拌溶液14小时，用Et₂O(100mL)稀释并用H₂O洗涤(3×100mL)。将有机相经硫酸钠干燥、过滤并减压浓缩。将粗的油状物通过硅胶色谱(0-5％MeOH于DCM 中(0.1％AcOH))进行纯化，得到exo-Fmoc-BCNK-OH S19，其为白色固体(1.65g，85％超过2个步骤)。δ_H(400MHz,d₆-DMSO)12.67-12.31(1H,br s),7.90(2H,d,J 7.5),7.73(2H,d, J 7.4),7.63(1H,d,J 7.8),7.42(2H,t,J 7.4),7.34(2H,t,J 7.4),7.10(1H,t,J 5.7),4.31-4.19 (3H,m),3.95-3.87(1H,m),3.84(1H,d,J 6.4),3.45-3.25(br s,1H),3.01-2.91(2H,m), 2.52-2.50(1H,m),2.33-2.15(4H,m),2.11-2.02(2H,m),1.75-1.54(2H,m),1.46-1.23(6H,m), 0.70-0.58(2H,m)；δ_C(101MHz,d₆-DMSO)174.4,156.9,156.6,144.30,144.27,141.2,128.1, 127.5,125.7,120.6,99.4,68.1,66.1,54.3,47.1,33.3,30.9,29.5,23.9,23.4,22.7,21.3；LRMS (ESI⁺):m/z 543(100％[M–H]^–)。

将聚合物结合的哌嗪(1.28g，1.28mmol，200-400目，标记程度：1.0-2.0mmol/g装载，与二乙烯基苯2％交联)添加到DCM(10mL)中的exo-Fmoc-BCNK-OH S19(174mg，0.32mmol)的搅拌溶液中。所得到的混合物室温搅拌4小时，过滤并用CHCl₃/MeOH(3:1，3x50 mL)洗涤试剂。减压蒸发滤液并溶解于H₂O(100mL)中，并用EtOAc洗涤(3×100mL)。减压蒸发水相并冷冻干燥，得到exo-H-BCNK-OH 1，其为白色固体(101mg，98％)。对于所有使用哺乳动物细胞的后续标记实验而言，exo-H-BCNK-OH 1进一步通过反相HPLC 进行纯化(0:1的H₂O：MeCN至9：1的H₂O：MeCN梯度)。δ_H(400MHz,d₆-DMSO/D₂O (1:1))4.14-3.76(m,3H),3.56-3.29(m,2H),3.18-2.81(m,3H),2.31-1.98(m,5H),1.71-1.52 (m,4H),1.51-1.29(m,4H),1.29-1.08(m,3H),0.95-0.66(m,2H)；δ_C(101MHz, d₆-DMSO/D₂O(1:1))169.4,165.9,101.3,76.0,55.8,31.8,30.1,29.9,25.2,23.2,22.1,21.0, 18.7；LRMS(ESI⁺):m/z 323(100％[M+H]⁺)。根据文献步骤³合成内-双环[6.1.0]壬-4-炔 -9-基甲醇(内-BCN)并以与1类似的方式加工成相应的氨基酸。

在配备有磁力搅拌棒的玻璃小瓶(Ltd.)中填入化合物6(39.2mg，0.096mmol) 并用气密铝/橡胶隔片密封。在真空中干燥小瓶中的内容物并用氩气吹扫(×3)。将MeOH(1 mL)加入到小瓶中，然后加入exo-双环[6.1.0]壬-4-炔-9-基甲醇(exo-BCN，S18)溶液(20.2mg 溶于1ml的MeOH中，0.1344mmol)。室温搅拌混合物。2分钟内，反应混合物脱色，再搅拌内容物1分钟。然后将混合物减压蒸发，并通过硅胶色谱(5％MeOH溶于DCM)进行纯化，得到哒嗪S20，其为淡黄色半固体(49mg，96％)。δ_H(400MHz,CDCl₃)9.16(1H,br s),8.77-8.71(1H,m),8.67(1H,app.d,J 2.1),8.01(1H,br s),7.97(1H,d,J 7.8),7.89(1H,ddd, J 7.8,7.6,1.7),7.75(1H,app.d,J 8.4),7.40(1H,ddd,J 7.4,4.9,1.1),5.93(1H,br s),4.02(2H, d,J 5.0),3.49-3.31(2H,m),3.12-2.88(4H,m),2.68-2.49(2H,m),1.88-1.60(1H,br s), 1.60-1.50(1H,m),1.48(9H,s),0.92-0.72(4H,m)；δ_C(101MHz,CDCl₃)169.0,159.2,159.0, 156.9,156.8,155.7,152.1,148.9,143.0,140.9,137.0,134.4,128.0,125.1,124.9,123.5,80.7, 66.4,45.7,30.7,29.9,29.6,29.5,28.5(3x CH₃(^tBu)),28.0,27.8,21.7；LRMS(ESI⁺):m/z 531(100％[M+H]⁺)。

于室温将市售的溶于H₂O(10mL)的4-(氨基甲基)苄腈盐酸盐S21(2.11g，12.50mmol)加入到在H₂O(10mL)中的NaOH(1.50g，37.50mmol)和二叔丁基二碳酸酯(3.00g，13.75mmol)的搅拌溶液中。将混合物搅拌16小时，在此之后，形成白色沉淀。过滤混合物并用H₂O(50mL)洗涤，并在真空下干燥所得到的固体，得到叔丁基氨基甲酸酯S22，其为白色固体(2.78g，96％)。δ_H(400MHz,CDCl₃)7.62(2H,d,J 8.2),7.39(2H,d,J 8.2), 5.00(1H,brs),4.37(2H,d,J 5.8),1.46(9H,s)；δ_C(101MHz,CDCl₃)155.9,144.7,132.4, 127.8,118.9,111.1,80.1,44.2,28.4；LRMS(ESI⁺):m/z 233(100％[M+H]⁺)。

通过改进文献步骤⁴合成四嗪10。于室温将肼一水化物(1.024mL，21.10mmol)加入到溶于1,4-二恶烷(0.5mL)中的叔丁基氨基甲酸酯S22(98mg，0.44mmol)、乙酸甲脒(439mg，4.22mmol)和Zn(OTf)₂(77mg，0.22mmol)的搅拌悬浮液中。将反应加热至60℃并搅拌16小时。将反应冷却至室温并用EtOAc(10mL)稀释。用1M HCl(10mL)洗涤反应，并用EtOAc(2×5mL)萃取水相。经硫酸钠干燥有机相，将其过滤并减压蒸发。将所得到的粗残留物溶于DCM和乙酸(1：1，5mL)的混合物中，并缓慢添加NaNO₂(584mg，8.44mmol)，历时15分钟，在此期间，反应变成亮红色。用活性空气净化吹扫含氮烟雾，然后用DCM(25 mL)稀释反应。用碳酸氢钠(sat.，aq.，25mL)洗涤反应混合物并用DCM(2×10mL)萃取水相。经硫酸钠干燥有机相，过滤并减压蒸发。用硅胶色谱(溶于己烷的20％EtOAc)纯化所得到的残留物，得到四嗪10，其为粉色固体(85mg，70％)。δ_H(400MHz,CDCl₃)10.21(1H, s),8.60(2H,d,J 8.2),7.53(2H,d,J 8.2),4.97(1H,br s),4.45(2H,d,J 6.0),1.49(9H,s)；δ_C (101MHz,CDCl₃)149.4,142.6,141.1,132.1,120.8,119.2,118.8,51.8,39.0；LRMS(ESI⁺): m/z 188(100％[(M–Boc)+2H]⁺)。将溶于二恶烷的4M HCl(2mL，8.0mmol)加入到溶于 DCM(4mL)中的四嗪10(75mg，0.26mmol)的搅拌溶液中。1小时后，反应完成，并减压去除溶剂，得到伯胺盐酸盐S23，其为粉红色固体(61mg，100％)。δ_H(40₀MHz,d₆-DMSO) 10.64(1H,s),8.54(2H,d,J8.4),7.79(2H,d,J 8.4),4.18(2H,d,J 5.5)；δ_C(101MHz, d₆-DMSO)165.2,158.2,138.9,131.9,129.8,127.9,41.8；LRMS₍ESI⁺):m/z 188(100％ [M+H]⁺)。

通过先前所述的光化学步骤^5,6或通过如下所述的非光化学步骤制备E-5-羟基环辛烯和E-exo-双环[6.1.0]壬-4-烯-9-基甲醇。

于0℃逐滴地将二异丁基氢化铝(溶于环己烷的1.0M溶液，89mL，89mmol)加入到溶于DCM(300mL)中的市售9-氧杂双环[6.1.0]壬-4-烯S24(1₀g，80.53mmol)的搅拌溶液中。于0℃搅拌溶液30分钟，温热至室温并搅拌16h。此后，将反应冷却至0℃，缓慢加入异丙醇(50mL)，随后加入HCl(1M，aq.，100mL)。用DCM(3×200mL)萃取水相。将组合的有机物用盐水洗涤，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的 10-20％EtOAc)纯化粗物质，得到环辛烯-4-醇S25，其为无色油状物(8.42g，83％)。光谱数据符合文献⁷。

于0℃将叔丁基(氯)二甲基硅烷(13.3g，88.0mmol)添加至溶于DCM(30mL)的环辛烯 -4-醇S25(5.6g，44.0mmol)、咪唑(7.5g，0.11mol)和DMAP(1晶体)的搅拌溶液中。将溶液温热至室温并搅拌90分钟，在此期间形成白色沉淀。将反应冷却至0℃，用DCM(100 mL)稀释并添加碳酸氢钠(sat.，aq.，100mL)。分离各相并用DCM(3×100mL)萃取水相。将组合的有机物用盐水(200mL)洗涤，经硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的10-2₀％DCM)纯化粗物质，得到甲硅烷基醚S26，其为无色油状物(10.55g， quant.)。_H(400MHz,CDCl₃ ⁾5.71-5.63(1H,m),5.⁶0-5.52(1H,m),3.80(1H,app td,J 8.6, 4.2),2.34(1H,dtd,J13.8,8.2,3.8),2.25-2.15(1H,m),2.13-2.05(1H,m),2.02-1.93(1H,m), 1.87-1.52(5H,m),1.47-1.35(1H,m),0.88(9H,s),0.04(3H,s),0.03(3H,s)；_C(101MHz, CDCl₃)130.4,129.4,73.1,38.0,36.5,26.1,25.8,25.1,22.7,18.4,–3.4；LRMS(ESI⁺):m/z 241(11％[M+H]⁺)。

于0℃逐滴地将过乙酸(乙酸中的39％，10.3mL，52.7mmol)加入到溶于DCM(80mL)的甲硅烷基醚S26(10.6g，43.9mmol)和碳酸钠(7.0g，65.8mmol)的搅拌溶液中。将混合物温热至室温并搅拌14小时。将反应冷却至0℃，用DCM(50mL)稀释并添加硫代硫酸钠(sat.，aq.，100mL)。将混合物在室温下搅拌10min，然后用NaOH(2M，aq.)将其碱化至pH 12。分离各相并用H₂O(100mL)、盐水(100mL)洗涤有机相，经硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的80％-90％DCM)纯化粗物质，得到环氧化物 S27/S28，其为非对映体的不可分混合物(2.3：1，通过¹H-NMR测定)且其为无色油状物(10.2 g，91％)。主要非对映体：δ_H(400MHz,CDCl₃)3.90(1H,app sext,J 4.2),2.90(2H,ddd,J 16.7, 8.3,4.4),2.21-2.09(1H,m),1.85-1.60(6H,m),1.50-1.38(2H,m),1.34-1.23(1H,m),0.88(9H, s),0.04(3H,s),0.03(3H,s)；δ_C(101MHz,CDCl₃)171.9,55.5,55.4,36.3,34.3,27.7,26.0, 25.8,22.6,18.3,–3.4；LRMS(ESI⁺):m/z 257(8％[M+H]⁺)。

于-78℃逐滴地将正丁基锂(溶于己烷的2.5M，14.8mL，37.0mmol)加入到(15分钟内)THF(80mL)中的环氧化物S27/S28(7.9g，30.8mmol)和二苯基膦(6.43mL，37.0mmol) 的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时，温热至室温并搅拌14小时。将反应混合物用THF(80mL)稀释，并冷却至0℃。加入乙酸(5.54mL，92.4mmol)，接着加入过氧化氢(溶于H₂O中的30％溶液，7.68mL，67.7mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.，aq.，100mL)并搅拌混合物10分钟。用EtOAc(3×200mL) 萃取水相。将组合的有机物用盐水洗涤(3×200mL)，用硫酸钠干燥，过滤并减压浓缩，得到氧化膦S29/S30/S31/S32，其为4种非对映体的混合物，其不经进一步纯化即可使用。δ_P(162MHz,CDCl₃)45.2,44.8,44.4,43.8；LRMS(ESI⁺):m/z 459(100％[M+H]⁺)。

于0℃将氢化钠(溶于矿物油中的60％分散，2.46g，61.5mmol)加入到溶于DMF(100mL)中的粗的羟基氧化膦S29/S30/S31/S32的搅拌溶液中。将所得到的混合物温热至室温，包裹在锡箔中并搅拌2小时。将反应冷却至0℃，用Et₂O(200mL)稀释并加入H₂O(200mL)。分离各相并用盐水(2×200mL)洗涤组合的有机物，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-15％DCM)纯化粗的混合物，得到反式环辛烯S33/S34，其为非对映体的可分混合物，具有专一的E-选择性，其为无色油状物(2.78g，1.2：1dr，38％超过3个步骤)。S33：δ_H(400MHz,CDCl₃)5.64(1H,ddd,J 16.0,10.8,3.6),5.45(1H,ddd,J 15.9, 11.1,3.2),4.01(1H,app dd,J 10.2,5.4),2.41(1H,qd,J 11.5,4.4),2.26-2.19(1H,m), 2.09-1.94(3H,m),1.92-1.73(2H,m),1.71-1.63(1H,m),1.54(1H,tdd,J 14.0,4.7,1.1), 1.30-1.08(1H,m),0.94(9H,s),0.03(3H,s),0.01(3H,s)；δ_C(101MHz,CDCl₃)135.9,131.5, 67.6,44.0,35.2,34.8,29.7,27.7,26.2,18.4,–4.7,–4.8；LRMS(ESI⁺):m/z 241(8％[M+H]⁺).S34:δ_H(400MHz,CDCl₃)5.55(1H,ddd,J 15.9,11.0,3.6),5.36(1H,ddd,J 16.1,10.8,3.4),3.42-3.37(1H,m),2.36-2.28(2H,m),2.22(1H,app qd,J 11.2,6.3),2.02-1.87(4H,m),1.73 (1H,dd,J 14.9,6.2),1.67-1.45(2H,m),0.87(9H,s),0.03(6H,s)；δ_C(101MHz,CDCl₃)135.5,132.5,78.6,44.9,42.0,34.6,33.0,31.3,26.1,18.3,–4.4,–4.5；LRMS(ESI⁺):m/z241 (12％[M+H]⁺)。对于所有进一步的实验而言，使用反式-环辛烯S34，其中C4-氧取代占据了赤道轴位置。

于室温将氟化四丁基铵(溶于THF中的1M溶液，23.8mL，23.8mmol)和氟化铯(1.08g，7.14mmol)加入到溶于MeCN(5mL)中的甲硅烷基醚S34(573mg，2.38mmol)的搅拌溶液中。将所得到的混合物包裹在锡箔中，并在室温下搅拌36小时。此后，将反应冷却至 0℃，用DCM(100mL)稀释并加入H₂O(100mL)。分离各相，用盐水(2×100mL)洗涤有机相，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷中的20％EtOAc)纯化粗物质，得到仲醇S35，其为无色油状物(289mg，96％)δ_H(400MHz,CDCl₃)5.60(1H,ddd,J 16.0, 10.7,4.2),5.41(1H,ddd,J 16.0,11.1,3.7),3.52-3.45(2H,m),2.40-2.25(3H,m),2.03-1.90 (4H,m),1.75-1.53(3H,m),1.25-1.18(1H,m)；δ_C(101MHz,CDCl₃)135.1,132.8,77.7,44.6, 41.1,34.3,32.6,32.1；LRMS(ESI⁺):m/z 127(14％[M+H]⁺)。

于0℃将琥珀酸胺碳酸盐(succimidyl carbonate)S36(200mg，0.75mmol)加入到溶于DMF(7.5mL)中的Fmoc-Lys-OH.HCl(303mg，0.75mmol)和DIPEA(0.19g，1.50mmol) 的搅拌溶液中。将溶液温热至室温，包裹在锡箔中并搅拌12小时。此后，减压浓缩溶液，并通过硅胶色谱(溶于DCM的0-10％MeOH)进行纯化，得到Fmoc-TCOK-OH S37/S38，其为黄色油状物，其仍含有DMF(350mg，81％)。δ_H(400MHz,CDCl₃)7.75-7.69(2H,m), 7.63-7.52(2H,m),7.41-7.33(2H,m),7.32-7.25(2H,m),5.82-5.34(3H,m),5.27(1H,br s), 4.90-4.50(1H,m),4.47-4.01(5H,m),3.32-3.30(1H,m),2.39-1.08(17H,m)；δ_C(100MHz, CDCl₃)174.3,156.3,155.9,143.8,143.6,141.1,135.0,134.8,132.8,132.6,127.5,126.9,125.0, 119.8,80.3,66.8,53.4,47.0,41.0,40.4,38.5,34.1,32.5,32.3,32.1,30.8,29.3,22.3；ESI-MS(m/z):[M+Na]+，C₃₀H₃₆N₂O₆Na计算值543.2471，实际值543.2466。

将哌啶(1mL)加入到溶于DCM(4mL)的Fmoc-TCOK-OH S37/S38(0.269g，0.517mmol)的搅拌溶液中。将混合物包裹在锡箔中并在室温下搅拌30分钟。将反应混合物减压浓缩，通过硅胶色谱(溶于DCM的30-50％MeOH)纯化粗物质，得到H-TCOK-OH 1，其为象牙色固体。δ_H(400MHz,d₄-MeOD)5.63-5.56(1H,m),5.50-5.43(1H,m),4.31-4.25 (1H,m),3.60-3.53(1H,m),3.11-3.03(2H,m),2.37-2.26(3H,m),2.02-1.36(13H,m)；δ_C (100MHz,d₄-MeOD)174.3,159.0,136.3,133.9,81.8,56.0,42.4,41.4,39.8,35.4,33.7,32.3, 32.1,30.9,23.6；ESI-MS(m/z):[M–H]^–C₁₅H₂₅N₂O₄计算值297.1814，实际值297.1811。

根据文献步骤⁵合成exo-双环[6.1.0]壬-4-烯-9-基甲醇S18。

于0℃将叔丁基(氯)二苯基硅烷(7.45g，27.1mmol)加入到溶于DCM(35mL)的exo-双环[6.1.0]壬-4-烯-9-基甲醇S18(2.75g，18.1mmol)、咪唑(2.15g，31.6mmol)和DMAP(2.21 g，18.1mmol)的搅拌溶液中。将溶液温热至室温并搅拌24小时，在此期间形成白色沉淀。将反应冷却至0℃，用DCM(100mL)稀释并加入碳酸氢钠(sat.，aq.，100mL)。分离各相并用DCM(3×100mL)萃取水相。将组合的有机物用盐水(200mL)洗涤，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的20％DCM)纯化粗物质，得到甲硅烷基醚S39，其为无色油状物(6.85g，97％)，δ_H(400MHz,CDCl₃)7.79-7.64(4H,m),7.50-7.32(6H,m), 5.63(2H,dm,J11.5),3.59(2H,d,J 6.2),2.40-2.21(2H,m),2.18-1.96(4H,m),1.45-1.33(2H, m),1.07(9H,s),0.72-0.56(3H,m)；δ_C(101MHz,CDCl₃)135.7,134.3,130.2,129.5,127.6, 67.9,29.1,28.6,27.2,26.9,22.0,19.3；LRMS(ESI⁺):m/z 408(10％,[M+NH₄]⁺)。

于0℃将过乙酸(3.38mL，溶于乙酸的39％，19.9mmol)加入到溶于DCM(65mL)的甲硅烷基醚S39(6.49g，16.6mmol)和无水碳酸钠(2.64g，24.9mmol)的搅拌溶液中。将混合物温热至室温并搅拌24小时。然后将反应冷却至0℃，用DCM(100mL)稀释并加入硫代硫酸钠(sat.，aq.，150mL)。将混合物在室温下搅拌30分钟，然后用NaOH(2M，aq.) 将其碱化至pH12。分离各相并用H₂O(200mL)、盐水(200mL)洗涤有机相，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(100％DCM)纯化粗物质，得到环氧化物S40和S41，其为非对映体的不可分混合物(1：1通过¹H NMR光谱)，并且其为无色油状物(5.97g， 88％)。δ_H(400MHz,CDCl₃)7.72-7.63(8H,m),7.47-7.34(12H,m),3.57(2H,d,J 5.6),3.54 (2H,d,J 5.9),3.03-3.10(2H,m),3.02-2.91(2H,m),2.36-2.24(2H,m),2.21-2.08(2H,m), 2.06-1.85(6H,m),1.35-1.12(4H,m),1.06(9H,s),1.05(9H,s),0.92-0.80(2H,m),0.78-0.47 (6H,m)；δ_C(101MHz,CDCl₃)135.65,135.63,134.2,134.1,129.6(2×CH),127.6(2×CH), 67.4,67.0,56.91,56.85,29.7,27.7,26.9(2×3CH₃),26.6,26.5,23.31,23.25,21.7,20.4,19.2 (2×2C)；LRMS(ESI⁺):m/z407(9％,[M+H]⁺)。

于-78℃逐滴地将正丁基锂(溶于己烷中的2.5M，5.92mL，14.8mmol)加入到(15分钟内)溶于THF(50mL)的环氧化物S40/S41(5.47g，13.5mmol)和二苯基膦(2.57mL，14.80mmol)的搅拌溶液中。将所得到的混合物在-78℃搅拌1小时，温热至室温，并再搅拌14 小时。将反应混合物用THF(80mL)稀释并冷却至0℃。加入乙酸(1.54mL，26.9mmol)，接着加入过氧化氢(溶于H₂O中的30％溶液，3.05mL，26.9mmol)。将反应混合物温热至室温并搅拌4小时。加入硫代硫酸钠(sat.，aq.，100mL)并将混合物搅拌10分钟。用EtOAc(3 ×200mL)萃取水相。将组合的有机物用盐水(3×200mL)洗涤，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的40-100％EtOAc)纯化粗的混合物，得到氧化膦 S42/S43/S44/S45，其为两个非对映异构体的51：18的混合物(5.61g，69％超过2个步骤)，其各自是区域异构体的1：1混合物(S42/S45和S43/S44)。主要非对映体：δ_H(400MHz, CDCl₃)7.82-7.68(4H,m),7.68-7.58(4H,m),7.52-7.32(12H,m),4.58-4.45(1H,m),4.16(1H, d,J 5.3),3.54(2H,d,J6.0),2.47(1H,ddd,J 12.0,11.7,4.3),2.21-2.07(1H,m),2.05-1.85(2H, m),1.78-1.55(3H,m),1.22-1.05(1H,m),1.03(9H,s),0.91-0.75(1H,m),0.62-0.35(3H,m)；δ_P(162MHz,CDCl₃)39.7；LRMS(ESI⁺):m/z 609[100％,(M+H)⁺]。次要非对映体：δ_H(400 MHz,CDCl₃)7.87-7.77(2H,m),7.74-7.60(6H,m),7.52-7.30(12H,m),4.26(1H,d,J 4.0), 3.89-3.78(1H,m),3.63(1H,dd,J 10.7,5.8),3.54(1H,dd,J 10.7,6.2),3.26-3.10(1H,m), 2.22-2.12(1H,m),2.00-1.78(3H,m),1.70-1.62(1H,m),1.42-1.28(1H,m),1.04(9H,s), 1.04-0.92(2H,m),0.79-0.65(1H,m),0.55-0.41(1H,m),0.27-0.12(1H,m)；δ_P(162MHz, CDCl₃)39.6；LRMS(ESI⁺):m/z 609[100％,(M+H)⁺]。

于0℃将氢化钠(溶于矿物油中的60％分散体系，0.46g，11.5mmol)加入到溶于无水 DMF(60mL)的羟基氧化膦S42/S43/S44/S45(4.68g，7.69mol)的搅拌溶液中。将所得到的混合物温热至室温，包裹在锡箔中并搅拌2小时。将反应混合物冷却至0℃，用Et₂O(200 mL)和H₂O(200mL)稀释，分离各相并用己烷(150mL)萃取水相。将组合的有机物用盐水 (sat.，aq.，5×250mL)洗涤，用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的1-20％DCM)纯化粗的混合物，得到反式环辛烯S46，其为单一的非对映体，并具有专一的E-选择性(2.08g，69％)；δ_H(400MHz,CDCl₃)7.72-7.62(4H,m),7.46-7.34(6H,m), 5.83(1H,ddd,J16.1,9.2,6.2),5.11(1H,ddd,J 16.1,10.6,3.3),3.59(2H,d,J 5.7),2.28-2.40 (1H,m),2.12-2.27(3H,m),1.80-1.95(2H,m),1.04(9H,s),0.74-0.90(1H,m),0.46-0.60(1H, dm,J14.0),0.31-0.42(2H,m),0.18-0.29(1H,m)；δ_C(101MHz,CDCl₃)138.6,135.8,134.4,131.3,129.6,127.7,68.1,39.0,34.1,32.9,28.2,27.9,27.0,21.6,20.5,19.4。

于室温将氟化四丁基铵(溶于THF中的1M溶液，10.0mL，10.0mmol)添加到溶于 THF(5mL)中的甲硅烷基醚S46(0.78g，2mmol)的搅拌溶液中，包裹在锡箔中并搅拌45 分钟。此后，将反应混合物减压浓缩，用DCM(100mL)稀释并用盐水(100mL)洗涤。分离各相并用盐水(2×100mL)洗涤有机相。将组合的有机物用硫酸钠干燥，过滤并减压浓缩。通过硅胶色谱(溶于己烷的20％EtOAc)纯化粗物质，得到伯醇S47，其为无色油状物(0.29 g，96％)；δ_H(400MHz,d₄-MeOD)5.87(1H,ddd,J 16.5,9.3,6.2),5.13(1H,dddd,J 16.5,10.4, 3.9,0.8),3.39-3.47(2H,dd,J 6.2,1.5),2.34-2.44(1H,m),2.12-2.33(3H,m),1.82-1.98(2H,m),0.90(1H,dtd,J 12.5,12.5,7.1),0.55-0.70(1H,m),0.41-0.55(1H,m),0.27-0.41(2H,m)；δ_C(101MHz,d₄-MeOD)139.3,132.2,67.5,39.9,34.8,33.8,29.2,28.7,23.0,21.9；MS-CI(NH₃):m/z[M-OH]C₁₀H₁₅，计算值135.1174；实际值135.1173。

于0℃将pNO₂-苯基碳酸酯S48(250mg，0.79mmol)加入到溶于DMF(3mL)中的 Fmoc-Lys-OH.HCl(478mg，1.18mmol)和DIPEA(0.27mL，1.58mmol)的搅拌溶液中。将溶液温热至室温，包裹在锡箔中并搅拌16小时。此后将溶液减压浓缩，并通过硅胶色谱(溶于DCM的0-5％MeOH)纯化，得到Fmoc-exo-sTCOK S49，其为白色泡沫(373mg，87％)。δ_H(400MHz,d₆-DMSO)13.09-12.06(1H,br s),7.90(2H,d,J 7.5),7.73(2H,d,J 7.5), 7.66-7.56(1H,m),7.43(2H,t,J 7.4),7.34(2H,J 7.4),7.08(1H,t,J 5.4),5.84-5.72(1H,m), 5.13-5.01(1H,m),4.31-4.19(3H,m),3.93-3.79(3H,m),3.00-2.90(2H,m),2.31-2.07(4H,m), 1.91-1.78(2H,m),1.75-1.49(2H,m),1.45-1.22(4H,m),0.91-0.75(1H,m),0.62-0.45(2H,m), 0.43-0.32(2H,m)；δ_C(101MHz,d₆-DMSO)173.9,156.4,156.1,143.8,140.7,137.9,131.0, 127.6,127.0,125.2,120.1,79.1,67.9,65.6,53.8,46.6,38.1,33.4,31.9,30.4,29.0,27.2,24.3, 22.8,21.2,20.2；LRMS(ESI⁺):m/z 545(100％[M–H]^–)。

将氢氧化锂一水合物(94mg，0.75mmol)加入到溶于THF：H₂O(3：1，8mL)的 exo-sTCOK S49的搅拌溶液中。将溶液包裹在锡箔中，室温搅拌4小时，并加入EtOAc(100 mL)和H₂O(100mL)。通过添加AcOH，将水相小心地酸化至pH4，并用EtOAc(4×100mL) 萃取水相，减压蒸发水相并冷冻干燥，得到exo-sTCOK 3，其为白色固体。对于所有使用哺乳动物细胞的后续标记实验而言，通过反相HPLC进一步纯化exo-H-bcnK-OH 1(0：1 的H₂O：MeCN至9：1的H₂O：MeCN梯度)。δ_H(400MHz,d₆-DMSO)7.21-7.09(1H,br m), 5.85-5.72(1H,m),5.14-5.02(1H,m),3.80(2H,d,J 2.6),3.14-3.05(1H,m),2.98-2.86(2H,m), 2.31-2.08(4H,m),1.92-1.78(2H,m),1.73-1.65(1H,m),1.55-1.44(1H,m),1.41-1.25(4H,m), 0.90-0.62(1H,m),0.65-0.45(2H,m),0.43-0.32(2H,m)；δ_C(101MHz,d₆-DMSO)175.5, 156.3,137.9,131.1,67.8,54.5,38.1,33.4,32.1,32.0,29.2,27.2,24.7,24.3,22.5,21.2,20.2； LRMS(ESI⁺):m/z 325(100％[M+H]⁺)。

补充实施例的参考文献

1.Gautier,A.et al.Genetically encoded photocontrol of proteinlocalization in mammalian cells.J Am Chem Soc132,4086-8(2010).

2.Lang,K.et al.Genetically encoded norbornene directs site-specificcellular protein labelling via a rapid bioorthogonal reaction.Naturechemistry4,298-304(2012).

3.Dommerholt,J.et al.Readily Accessible Bicyclononynes forBioorthogonal Labeling and Three-Dimensional Imaging of LivingCells.Angewandte Chemie-International Edition49,9422-9425(2010).

4.Yang,J.,Karver,M.R.,Li,W.,Sahu,S.&Devaraj,N.K.Metal-catalyzed one-pot synthesis of tetrazines directly from aliphatic nitriles andhydrazine.Angewandte Chemie51, 5222-5(2012).

5.Taylor,M.T.,Blackman,M.L.,Dmitrenko,O.&Fox,J.M.Design and synthesisof highly reactive dienophiles for the tetrazine-trans-cycloocteneligation.Journal of the American Chemical Society133,9646-9(2011).

6.Royzen,M.,Yap,G.P.&Fox,J.M.A photochemical synthesis offunctionalized trans-cyclooctenes driven by metal complexation.Journal of theAmerican Chemical Society130,3760-1(2008).

7.Zhang,K.,Lackey,M.A.,Cui,J.&Tew,G.N.Gels based on cyclic polymers.Journal of the American Chemical Society133,4140-8(2011).

正文的参考文献:

(1)Devaraj,N.K.；Weissleder,R.；Hilderbrand,S.A.Bioconjug Chem2008,19,2297.

(2)Devaraj,N.K.；Weissleder,R.Acc Chem Res2011.

(3)Blackman,M.L.；Royzen,M.；Fox,J.M.J Am Chem Soc2008,130,13518.

(4)Taylor,M.T.；Blackman,M.L.；Dmitrenko,O.；Fox,J.M.Journal of theAmerican Chemical Society2011,133,9646.

(5)Liu,D.S.；Tangpeerachaikul,A.；Selvaraj,R.；Taylor,M.T.；Fox,J.M.；Ting, A.Y.Journal of the American Chemical Society2012,134,792.

(6)Seitchik,J.L.；Peeler,J.C.；Taylor,M.T.；Blackman,M.L.；Rhoads,T.W.；Cooley,R.B.；Refakis,C.；Fox,J.M.；Mehl,R.A.Journal of the American ChemicalSociety2012,134,2898.

(7)Lang,K.；Davis,L.；Torres-Kolbus,J.；Chou,C.；Deiters,A.；Chin,J.W.Nature chemistry2012,4,298.

(8)Kaya,E.；Vrabel,M.；Deiml,C.；Prill,S.；Fluxa,V.S.；Carell,T.AngewandteChemie2012,51,4466.

(9)Plass,T.；Milles,S.；Koehler,C.；Szymanski,J.；Mueller,R.；Wiessler,M.；Schultz,C.；Lemke,E.A.Angew Chem Int Edit2012,51,4166.

(10)Dommerholt,J.；Schmidt,S.；Temming,R.；Hendriks,L.J.A.；Rutjes,F.P.J.T.；van Hest,J.C.M.；Lefeber,D.J.；Friedl,P.；van Delft,F.L.Angew Chem IntEdit2010,49,9422.

(11)Chen,W.X.；Wang,D.Z.；Dai,C.F.；Hamelberg,D.；Wang,B.H.ChemCommun2012,48,1736.

(12)McKay,C.S.；Blake,J.A.；Cheng,J.；Danielson,D.C.；Pezacki,J.P.ChemCommun2011,47,10040.

(13)McKay,C.S.；Chigrinova,M.；Blake,J.A.；Pezacki,J.P.Organic&biomolecular chemistry2012.

(14)Ning,X.；Temming,R.P.；Dommerholt,J.；Guo,J.；Ania,D.B.；Debets, M.F.；Wolfert,M.A.；Boons,G.J.；van Delft,F.L.Angewandte Chemie2010,49,3065.

(15)Agard,N.J.；Prescher,J.A.；Bertozzi,C.R.Journal of the AmericanChemical Society2004,126,15046.

(16)Sletten,E.M.；Bertozzi,C.R.Accounts of chemical research2011,44,666.

(17)Karver,M.R.；Weissleder,R.；Hilderbrand,S.A.Angewandte Chemie2012,51, 920.

(18)Devaraj,N.K.；Hilderbrand,S.；Upadhyay,R.；Mazitschek,R.；Weissleder,R.Angew Chem Int Ed Engl2010,49,2869.

(19)Fekner,T.；Li,X.；Lee,M.M.；Chan,M.K.Angew Chem Int Ed Engl2009,48,1633.

(20)Nguyen,D.P.；Garcia Alai,M.M.；Kapadnis,P.B.；Neumann,H.；Chin,J.W. JAm Chem Soc2009,131,14194.

(21)Nguyen,D.P.；Lusic,H.；Neumann,H.；Kapadnis,P.B.；Deiters,A.；Chin,J.W.J Am Chem Soc2009,131,8720.

(22)Nguyen,D.P.；Elliott,T.；Holt,M.；Muir,T.W.；Chin,J.W.J Am ChemSoc2011,133,11418.

(23)Neumann,H.；Peak-Chew,S.Y.；Chin,J.W.Nat Chem Biol2008,4,232.

(24)Polycarpo,C.R.；Herring,S.；Berube,A.；Wood,J.L.；Soll,D.；Ambrogelly,A.FEBS Lett2006,580,6695.

(25)Li,X.；Fekner,T.；Ottesen,J.J.；Chan,M.K.Angew Chem Int Ed Engl2009,48, 9184.

(26)Wang,Y.S.；Fang,X.；Wallace,A.L.；Wu,B.；Liu,W.R.Journal of theAmerican Chemical Society2012,134,2950.

(27)Mukai,T.；Kobayashi,T.；Hino,N.；Yanagisawa,T.；Sakamoto,K.；Yokoyama,S.Biochem Biophys Res Commun2008,371,818.

(28)Hancock,S.M.；Uprety,R.；Deiters,A.；Chin,J.W.J Am Chem Soc2010,132,14819.

(29)Greiss,S.；Chin,J.W.J Am Chem Soc2011.

(30)Lin,S.X.；Zhang,Z.R.；Xu,H.；Li,L.；Chen,S.；Li,J.；Hao,Z.Y.；Chen,P.R.Journal of the American Chemical Society2011,133,20581.

(31)Gautier,A.；Nguyen,D.P.；Lusic,H.；An,W.；Deiters,A.；Chin,J.W.J AmChem Soc2010,132,4086.

(32)Virdee,S.；Kapadnis,P.B.；Elliott,T.；Lang,K.；Madrzak,J.；Nguyen,D.P.；Riechmann,L.；Chin,J.W.Journal of the American Chemical Society2011,133,10708.

上述说明书中所提及的所有出版物通过引用并入本文。本发明的所述方面和实施方式的各种改进和变型对本领域技术人员而言是显而易见的，并不脱离本发明的范围。尽管本发明已经结合具体的优选实施方式进行了描述，但应当理解，如权利要求所保护的本发明不应限制于这样的具体实施方式。事实上，用于实施本发明的所述方式的各种改进对本领域技术人员而言是显而易见的，其均在下述权利要求的范围之内。

序列表

<110> 医药研究委员会

<120>整合包含BCN基团的氨基酸到多肽中的方法

<130> P3889WO

<140> PCT/GB2013/051249

<141> 2013-05-15

<160> 18

<170> SIPOSequenceListing 1.0

<210> 1

<211> 419

<212> PRT

<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)

<400> 1

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr

115 120 125

Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn

260 265 270

Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 2

<211> 419

<212> PRT

<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)

<400> 2

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr

115 120 125

Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn

260 265 270

Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 3

<211> 419

<212> PRT

<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)

<400> 3

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr

115 120 125

Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn

260 265 270

Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 4

<211> 454

<212> PRT

<213> 马氏甲烷八叠球菌(Methanosarcina mazeii)

<400> 4

Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn

65 70 75 80

Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val

100 105 110

Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln

115 120 125

Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu

130 135 140

Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser

145 150 155 160

Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile

165 170 175

Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys

180 185 190

Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile

195 200 205

Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu

210 215 220

Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu

225 230 235 240

Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp

245 250 255

Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr

260 265 270

Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile

275 280 285

Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn

290 295 300

Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile

305 310 315 320

Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys

325 330 335

Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser

340 345 350

Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn

355 360 365

His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr

370 375 380

Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala

385 390 395 400

Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro

405 410 415

Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His

420 425 430

Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn

435 440 445

Gly Ile Ser Thr Asn Leu

450

<210> 5

<211> 443

<212> PRT

<213> 嗜乙酸甲烷八叠球菌(Methanosarcina acetivorans)

<400> 5

Met Asp Lys Lys Pro Leu Asp Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Met Ile His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Glu Arg Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Arg His Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Lys Thr Ser Glu Glu Lys Thr Thr Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Arg Val Arg Lys Ala Met Pro Lys Ser Val Ala

100 105 110

Arg Ala Pro Lys Pro Leu Glu Ala Thr Ala Gln Val Pro Leu Ser Gly

115 120 125

Ser Lys Pro Ala Pro Ala Thr Pro Val Ser Ala Pro Ala Gln Ala Pro

130 135 140

Ala Pro Ser Thr Gly Ser Ala Ser Ala Thr Ser Ala Ser Ala Gln Arg

145 150 155 160

Met Ala Asn Ser Ala Ala Ala Pro Ala Ala Pro Val Pro Thr Ser Ala

165 170 175

Pro Ala Leu Thr Lys Gly Gln Leu Asp Arg Leu Glu Gly Leu Leu Ser

180 185 190

Pro Lys Asp Glu Ile Ser Leu Asp Ser Glu Lys Pro Phe Arg Glu Leu

195 200 205

Glu Ser Glu Leu Leu Ser Arg Arg Lys Lys Asp Leu Lys Arg Ile Tyr

210 215 220

Ala Glu Glu Arg Glu Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr

225 230 235 240

Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu

245 250 255

Ile Pro Ala Glu Tyr Val Glu Arg Met Gly Ile Asn Ser Asp Thr Glu

260 265 270

Leu Ser Lys Gln Val Phe Arg Ile Asp Lys Asn Phe Cys Leu Arg Pro

275 280 285

Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala

290 295 300

Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys

305 310 315 320

Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe

325 330 335

Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu Ala Ile Ile

340 345 350

Thr Glu Phe Leu Asn His Leu Gly Ile Asp Phe Glu Ile Ile Gly Asp

355 360 365

Ser Cys Met Val Tyr Gly Asn Thr Leu Asp Val Met His Asp Asp Leu

370 375 380

Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Leu Asp Arg Glu Trp

385 390 395 400

Gly Ile Asp Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu

405 410 415

Leu Lys Val Met His Gly Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser

420 425 430

Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu

435 440

<210> 6

<211> 478

<212> PRT

<213> 嗜热甲烷八叠球菌(Methanosarcina thermophila)

<400> 6

Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Lys Leu His Lys Ile Arg His His Glu Val Ser

20 25 30

Lys Arg Lys Ile Tyr Ile Glu Met Glu Cys Gly Glu Arg Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Ala Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Ile Cys Lys His Cys Arg Val Ser Asp Glu Asp Leu Asn

65 70 75 80

Lys Phe Leu Thr Arg Thr Asn Glu Asp Lys Ser Asn Ala Lys Val Thr

85 90 95

Val Val Ser Ala Pro Lys Ile Arg Lys Val Met Pro Lys Ser Val Ala

100 105 110

Arg Thr Pro Lys Pro Leu Glu Asn Thr Ala Pro Val Gln Thr Leu Pro

115 120 125

Ser Glu Ser Gln Pro Ala Pro Thr Thr Pro Ile Ser Ala Ser Thr Thr

130 135 140

Ala Pro Ala Ser Thr Ser Thr Thr Ala Pro Ala Pro Ala Ser Thr Thr

145 150 155 160

Ala Pro Ala Pro Ala Ser Thr Thr Ala Pro Ala Ser Ala Ser Thr Thr

165 170 175

Ile Ser Thr Ser Ala Met Pro Ala Ser Thr Ser Ala Gln Gly Thr Thr

180 185 190

Lys Phe Asn Tyr Ile Ser Gly Gly Phe Pro Arg Pro Ile Pro Val Gln

195 200 205

Ala Ser Ala Pro Ala Leu Thr Lys Ser Gln Ile Asp Arg Leu Gln Gly

210 215 220

Leu Leu Ser Pro Lys Asp Glu Ile Ser Leu Asp Ser Gly Thr Pro Phe

225 230 235 240

Arg Lys Leu Glu Ser Glu Leu Leu Ser Arg Arg Arg Lys Asp Leu Lys

245 250 255

Gln Ile Tyr Ala Glu Glu Arg Glu His Tyr Leu Gly Lys Leu Glu Arg

260 265 270

Glu Ile Thr Lys Phe Phe Val Asp Arg Gly Phe Leu Glu Ile Lys Ser

275 280 285

Pro Ile Leu Ile Pro Met Glu Tyr Ile Glu Arg Met Gly Ile Asp Asn

290 295 300

Asp Lys Glu Leu Ser Lys Gln Ile Phe Arg Val Asp Asn Asn Phe Cys

305 310 315 320

Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Asn Tyr Leu Arg Lys Leu

325 330 335

Asn Arg Ala Leu Pro Asp Pro Ile Lys Ile Phe Glu Ile Gly Pro Cys

340 345 350

Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu Glu Glu Phe Thr Met

355 360 365

Leu Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn Leu Glu

370 375 380

Ala Ile Ile Lys Asp Phe Leu Asp Tyr Leu Gly Ile Asp Phe Glu Ile

385 390 395 400

Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr Leu Asp Val Met His

405 410 415

Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Val Pro Met Asp

420 425 430

Arg Asp Trp Gly Ile Asn Lys Pro Trp Ile Gly Ala Gly Phe Gly Leu

435 440 445

Glu Arg Leu Leu Lys Val Met His Asn Phe Lys Asn Ile Lys Arg Ala

450 455 460

Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser Thr Asn Leu

465 470 475

<210> 7

<211> 416

<212> PRT

<213> 布氏甲烷八叠球菌(Methanococcoides burtonii)

<400> 7

Met Glu Lys Gln Leu Leu Asp Val Leu Val Glu Leu Asn Gly Val Trp

1 5 10 15

Leu Ser Arg Ser Gly Leu Leu His Gly Ile Arg Asn Phe Glu Ile Thr

20 25 30

Thr Lys His Ile His Ile Glu Thr Asp Cys Gly Ala Arg Phe Thr Val

35 40 45

Arg Asn Ser Arg Ser Ser Arg Ser Ala Arg Ser Leu Arg His Asn Lys

50 55 60

Tyr Arg Lys Pro Cys Lys Arg Cys Arg Pro Ala Asp Glu Gln Ile Asp

65 70 75 80

Arg Phe Val Lys Lys Thr Phe Lys Glu Lys Arg Gln Thr Val Ser Val

85 90 95

Phe Ser Ser Pro Lys Lys His Val Pro Lys Lys Pro Lys Val Ala Val

100 105 110

Ile Lys Ser Phe Ser Ile Ser Thr Pro Ser Pro Lys Glu Ala Ser Val

115 120 125

Ser Asn Ser Ile Pro Thr Pro Ser Ile Ser Val Val Lys Asp Glu Val

130 135 140

Lys Val Pro Glu Val Lys Tyr Thr Pro Ser Gln Ile Glu Arg Leu Lys

145 150 155 160

Thr Leu Met Ser Pro Asp Asp Lys Ile Pro Ile Gln Asp Glu Leu Pro

165 170 175

Glu Phe Lys Val Leu Glu Lys Glu Leu Ile Gln Arg Arg Arg Asp Asp

180 185 190

Leu Lys Lys Met Tyr Glu Glu Asp Arg Glu Asp Arg Leu Gly Lys Leu

195 200 205

Glu Arg Asp Ile Thr Glu Phe Phe Val Asp Arg Gly Phe Leu Glu Ile

210 215 220

Lys Ser Pro Ile Met Ile Pro Phe Glu Tyr Ile Glu Arg Met Gly Ile

225 230 235 240

Asp Lys Asp Asp His Leu Asn Lys Gln Ile Phe Arg Val Asp Glu Ser

245 250 255

Met Cys Leu Arg Pro Met Leu Ala Pro Cys Leu Tyr Asn Tyr Leu Arg

260 265 270

Lys Leu Asp Lys Val Leu Pro Asp Pro Ile Arg Ile Phe Glu Ile Gly

275 280 285

Pro Cys Tyr Arg Lys Glu Ser Asp Gly Ser Ser His Leu Glu Glu Phe

290 295 300

Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr Arg Glu Asn

305 310 315 320

Met Glu Ala Leu Ile Asp Glu Phe Leu Glu His Leu Gly Ile Glu Tyr

325 330 335

Glu Ile Glu Ala Asp Asn Cys Met Val Tyr Gly Asp Thr Ile Asp Ile

340 345 350

Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly Pro Ile Pro

355 360 365

Leu Asp Arg Glu Trp Gly Val Asn Lys Pro Trp Met Gly Ala Gly Phe

370 375 380

Gly Leu Glu Arg Leu Leu Lys Val Arg His Asn Tyr Thr Asn Ile Arg

385 390 395 400

Arg Ala Ser Arg Ser Glu Leu Tyr Tyr Asn Gly Ile Asn Thr Asn Leu

405 410 415

<210> 8

<211> 279

<212> PRT

<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)

<400> 8

Met Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu Leu

1 5 10 15

Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu Ser

20 25 30

Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln Gly

35 40 45

Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala Leu

50 55 60

Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly Phe

65 70 75 80

Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala Lys

85 90 95

Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp Leu

100 105 110

Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Thr

115 120 125

Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile Phe

130 135 140

Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His Leu

145 150 155 160

Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu Glu

165 170 175

Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu Ala

180 185 190

Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val Tyr

195 200 205

Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser Gly

210 215 220

Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp Pro

225 230 235 240

Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg Glu

245 250 255

Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu Asp

260 265 270

Gly Val Arg Leu Asn Ile Asn

275

<210> 9

<211> 312

<212> PRT

<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)

<400> 9

Met Asp Arg Ile Asp His Thr Asp Ser Lys Phe Val Gln Ala Gly Glu

1 5 10 15

Thr Pro Val Leu Pro Ala Thr Phe Met Phe Leu Thr Arg Arg Asp Pro

20 25 30

Pro Leu Ser Ser Phe Trp Thr Lys Val Gln Tyr Gln Arg Leu Lys Glu

35 40 45

Leu Asn Ala Ser Gly Glu Gln Leu Glu Met Gly Phe Ser Asp Ala Leu

50 55 60

Ser Arg Asp Arg Ala Phe Gln Gly Ile Glu His Gln Leu Met Ser Gln

65 70 75 80

Gly Lys Arg His Leu Glu Gln Leu Arg Thr Val Lys His Arg Pro Ala

85 90 95

Leu Leu Glu Leu Glu Glu Gly Leu Ala Lys Ala Leu His Gln Gln Gly

100 105 110

Phe Val Gln Val Val Thr Pro Thr Ile Ile Thr Lys Ser Ala Leu Ala

115 120 125

Lys Met Thr Ile Gly Glu Asp His Pro Leu Phe Ser Gln Val Phe Trp

130 135 140

Leu Asp Gly Lys Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr

145 150 155 160

Thr Leu Trp Arg Glu Leu Glu Arg Leu Trp Asp Lys Pro Ile Arg Ile

165 170 175

Phe Glu Ile Gly Thr Cys Tyr Arg Lys Glu Ser Gln Gly Ala Gln His

180 185 190

Leu Asn Glu Phe Thr Met Leu Asn Leu Thr Glu Leu Gly Thr Pro Leu

195 200 205

Glu Glu Arg His Gln Arg Leu Glu Asp Met Ala Arg Trp Val Leu Glu

210 215 220

Ala Ala Gly Ile Arg Glu Phe Glu Leu Val Thr Glu Ser Ser Val Val

225 230 235 240

Tyr Gly Asp Thr Val Asp Val Met Lys Gly Asp Leu Glu Leu Ala Ser

245 250 255

Gly Ala Met Gly Pro His Phe Leu Asp Glu Lys Trp Glu Ile Val Asp

260 265 270

Pro Trp Val Gly Leu Gly Phe Gly Leu Glu Arg Leu Leu Met Ile Arg

275 280 285

Glu Gly Thr Gln His Val Gln Ser Met Ala Arg Ser Leu Ser Tyr Leu

290 295 300

Asp Gly Val Arg Leu Asn Ile Asn

305 310

<210> 10

<211> 288

<212> PRT

<213> 哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)

<400> 10

Met Phe Leu Thr Arg Arg Asp Pro Pro Leu Ser Ser Phe Trp Thr Lys

1 5 10 15

Val Gln Tyr Gln Arg Leu Lys Glu Leu Asn Ala Ser Gly Glu Gln Leu

20 25 30

Glu Met Gly Phe Ser Asp Ala Leu Ser Arg Asp Arg Ala Phe Gln Gly

35 40 45

Ile Glu His Gln Leu Met Ser Gln Gly Lys Arg His Leu Glu Gln Leu

50 55 60

Arg Thr Val Lys His Arg Pro Ala Leu Leu Glu Leu Glu Glu Lys Leu

65 70 75 80

Ala Lys Ala Leu His Gln Gln Gly Phe Val Gln Val Val Thr Pro Thr

85 90 95

Ile Ile Thr Lys Ser Ala Leu Ala Lys Met Thr Ile Gly Glu Asp His

100 105 110

Pro Leu Phe Ser Gln Val Phe Trp Leu Asp Gly Lys Lys Cys Leu Arg

115 120 125

Pro Met Leu Ala Pro Asn Leu Tyr Thr Leu Trp Arg Glu Leu Glu Arg

130 135 140

Leu Trp Asp Lys Pro Ile Arg Ile Phe Glu Ile Gly Thr Cys Tyr Arg

145 150 155 160

Lys Glu Ser Gln Gly Ala Gln His Leu Asn Glu Phe Thr Met Leu Asn

165 170 175

Leu Thr Glu Leu Gly Thr Pro Leu Glu Glu Arg His Gln Arg Leu Glu

180 185 190

Asp Met Ala Arg Trp Val Leu Glu Ala Ala Gly Ile Arg Glu Phe Glu

195 200 205

Leu Val Thr Glu Ser Ser Val Val Tyr Gly Asp Thr Val Asp Val Met

210 215 220

Lys Gly Asp Leu Glu Leu Ala Ser Gly Ala Met Gly Pro His Phe Leu

225 230 235 240

Asp Glu Lys Trp Glu Ile Phe Asp Pro Trp Val Gly Leu Gly Phe Gly

245 250 255

Leu Glu Arg Leu Leu Met Ile Arg Glu Gly Thr Gln His Val Gln Ser

260 265 270

Met Ala Arg Ser Leu Ser Tyr Leu Asp Gly Val Arg Leu Asn Ile Asn

275 280 285

<210> 11

<211> 277

<212> PRT

<213> 醋酸氧化脱硫肠状菌(Desulfotomaculum acetoxidans)

<400> 11

Met Ser Phe Leu Trp Thr Val Ser Gln Gln Lys Arg Leu Ser Glu Leu

1 5 10 15

Asn Ala Ser Glu Glu Glu Lys Asn Met Ser Phe Ser Ser Thr Ser Asp

20 25 30

Arg Glu Ala Ala Tyr Lys Arg Val Glu Met Arg Leu Ile Asn Glu Ser

35 40 45

Lys Gln Arg Leu Asn Lys Leu Arg His Glu Thr Arg Pro Ala Ile Cys

50 55 60

Ala Leu Glu Asn Arg Leu Ala Ala Ala Leu Arg Gly Ala Gly Phe Val

65 70 75 80

Gln Val Ala Thr Pro Val Ile Leu Ser Lys Lys Leu Leu Gly Lys Met

85 90 95

Thr Ile Thr Asp Glu His Ala Leu Phe Ser Gln Val Phe Trp Ile Glu

100 105 110

Glu Asn Lys Cys Leu Arg Pro Met Leu Ala Pro Asn Leu Tyr Tyr Ile

115 120 125

Leu Lys Asp Leu Leu Arg Leu Trp Glu Lys Pro Val Arg Ile Phe Glu

130 135 140

Ile Gly Ser Cys Phe Arg Lys Glu Ser Gln Gly Ser Asn His Leu Asn

145 150 155 160

Glu Phe Thr Met Leu Asn Leu Val Glu Trp Gly Leu Pro Glu Glu Gln

165 170 175

Arg Gln Lys Arg Ile Ser Glu Leu Ala Lys Leu Val Met Asp Glu Thr

180 185 190

Gly Ile Asp Glu Tyr His Leu Glu His Ala Glu Ser Val Val Tyr Gly

195 200 205

Glu Thr Val Asp Val Met His Arg Asp Ile Glu Leu Gly Ser Gly Ala

210 215 220

Leu Gly Pro His Phe Leu Asp Gly Arg Trp Gly Val Val Gly Pro Trp

225 230 235 240

Val Gly Ile Gly Phe Gly Leu Glu Arg Leu Leu Met Val Glu Gln Gly

245 250 255

Gly Gln Asn Val Arg Ser Met Gly Lys Ser Leu Thr Tyr Leu Asp Gly

260 265 270

Val Arg Leu Asn Ile

275

<210> 12

<211> 419

<212> PRT

<213> 巴氏甲烷八叠球菌(Methanosarcina barkeri)

<400> 12

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His Tyr Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Gly Lys Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Pro Val Ser Ala Lys Ala Ser Thr

115 120 125

Asp Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Pro Val Pro Thr Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Ile Ala Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Asp Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn

260 265 270

Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Asp Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ser Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 13

<211> 419

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> MbPylS

<400> 13

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr

115 120 125

Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ala Pro Thr Leu Tyr Asn

260 265 270

Tyr Leu Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 14

<211> 419

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Mb_AckRS

<400> 14

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Gly Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr

115 120 125

Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Met Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Val Ala Pro Thr Ile Phe Asn

260 265 270

Tyr Ala Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Phe Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 15

<211> 419

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> MbPCKRS

<400> 15

Met Asp Lys Lys Pro Leu Asp Val Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Leu His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Cys Arg Thr Ala Arg Ala Phe Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Ile Asn

65 70 75 80

Asn Phe Leu Thr Arg Ser Thr Glu Ser Lys Asn Ser Val Lys Val Arg

85 90 95

Val Val Ser Ala Pro Lys Val Lys Lys Ala Met Pro Lys Ser Val Ser

100 105 110

Arg Ala Pro Lys Pro Leu Glu Asn Ser Val Ser Ala Lys Ala Ser Thr

115 120 125

Asn Thr Ser Arg Ser Val Pro Ser Pro Ala Lys Ser Thr Pro Asn Ser

130 135 140

Ser Val Pro Ala Ser Ala Pro Ala Pro Ser Leu Thr Arg Ser Gln Leu

145 150 155 160

Asp Arg Val Glu Ala Leu Leu Ser Pro Glu Asp Lys Ile Ser Leu Asn

165 170 175

Met Ala Lys Pro Phe Arg Glu Leu Glu Pro Glu Leu Val Thr Arg Arg

180 185 190

Lys Asn Asp Phe Gln Arg Leu Tyr Thr Asn Asp Arg Glu Asp Tyr Leu

195 200 205

Gly Lys Leu Glu Arg Asp Ile Thr Lys Phe Phe Val Asp Arg Gly Phe

210 215 220

Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Ala Glu Tyr Val Glu Arg

225 230 235 240

Phe Gly Ile Asn Asn Asp Thr Glu Leu Ser Lys Gln Ile Phe Arg Val

245 250 255

Asp Lys Asn Leu Cys Leu Arg Pro Met Leu Ser Pro Thr Leu Cys Asn

260 265 270

Tyr Met Arg Lys Leu Asp Arg Ile Leu Pro Gly Pro Ile Lys Ile Phe

275 280 285

Glu Val Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys Glu His Leu

290 295 300

Glu Glu Phe Thr Met Val Asn Phe Cys Gln Met Gly Ser Gly Cys Thr

305 310 315 320

Arg Glu Asn Leu Glu Ala Leu Ile Lys Glu Phe Leu Asp Tyr Leu Glu

325 330 335

Ile Asp Phe Glu Ile Val Gly Asp Ser Cys Met Val Tyr Gly Asp Thr

340 345 350

Leu Asp Ile Met His Gly Asp Leu Glu Leu Ser Ser Ala Val Val Gly

355 360 365

Pro Val Ser Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro Trp Ile Gly

370 375 380

Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Met His Gly Phe Lys

385 390 395 400

Asn Ile Lys Arg Ala Ser Arg Ser Glu Ser Tyr Tyr Asn Gly Ile Ser

405 410 415

Thr Asn Leu

<210> 16

<211> 454

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> MmPylS

<400> 16

Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn

65 70 75 80

Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val

100 105 110

Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln

115 120 125

Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu

130 135 140

Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser

145 150 155 160

Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile

165 170 175

Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys

180 185 190

Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile

195 200 205

Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu

210 215 220

Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu

225 230 235 240

Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp

245 250 255

Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr

260 265 270

Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile

275 280 285

Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ala Pro Asn

290 295 300

Leu Tyr Asn Tyr Leu Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile

305 310 315 320

Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys

325 330 335

Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser

340 345 350

Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn

355 360 365

His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr

370 375 380

Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala

385 390 395 400

Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro

405 410 415

Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His

420 425 430

Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn

435 440 445

Gly Ile Ser Thr Asn Leu

450

<210> 17

<211> 454

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> Mm_AcKRS

<400> 17

Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn

65 70 75 80

Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val

100 105 110

Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln

115 120 125

Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu

130 135 140

Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser

145 150 155 160

Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile

165 170 175

Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys

180 185 190

Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile

195 200 205

Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu

210 215 220

Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu

225 230 235 240

Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp

245 250 255

Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr

260 265 270

Ile Glu Arg Met Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile

275 280 285

Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Val Ala Pro Asn

290 295 300

Ile Phe Asn Tyr Ala Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile

305 310 315 320

Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys

325 330 335

Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Phe Gln Met Gly Ser

340 345 350

Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn

355 360 365

His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr

370 375 380

Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala

385 390 395 400

Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro

405 410 415

Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His

420 425 430

Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn

435 440 445

Gly Ile Ser Thr Asn Leu

450

<210> 18

<211> 454

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> MmPCKRS

<400> 18

Met Asp Lys Lys Pro Leu Asn Thr Leu Ile Ser Ala Thr Gly Leu Trp

1 5 10 15

Met Ser Arg Thr Gly Thr Ile His Lys Ile Lys His His Glu Val Ser

20 25 30

Arg Ser Lys Ile Tyr Ile Glu Met Ala Cys Gly Asp His Leu Val Val

35 40 45

Asn Asn Ser Arg Ser Ser Arg Thr Ala Arg Ala Leu Arg His His Lys

50 55 60

Tyr Arg Lys Thr Cys Lys Arg Cys Arg Val Ser Asp Glu Asp Leu Asn

65 70 75 80

Lys Phe Leu Thr Lys Ala Asn Glu Asp Gln Thr Ser Val Lys Val Lys

85 90 95

Val Val Ser Ala Pro Thr Arg Thr Lys Lys Ala Met Pro Lys Ser Val

100 105 110

Ala Arg Ala Pro Lys Pro Leu Glu Asn Thr Glu Ala Ala Gln Ala Gln

115 120 125

Pro Ser Gly Ser Lys Phe Ser Pro Ala Ile Pro Val Ser Thr Gln Glu

130 135 140

Ser Val Ser Val Pro Ala Ser Val Ser Thr Ser Ile Ser Ser Ile Ser

145 150 155 160

Thr Gly Ala Thr Ala Ser Ala Leu Val Lys Gly Asn Thr Asn Pro Ile

165 170 175

Thr Ser Met Ser Ala Pro Val Gln Ala Ser Ala Pro Ala Leu Thr Lys

180 185 190

Ser Gln Thr Asp Arg Leu Glu Val Leu Leu Asn Pro Lys Asp Glu Ile

195 200 205

Ser Leu Asn Ser Gly Lys Pro Phe Arg Glu Leu Glu Ser Glu Leu Leu

210 215 220

Ser Arg Arg Lys Lys Asp Leu Gln Gln Ile Tyr Ala Glu Glu Arg Glu

225 230 235 240

Asn Tyr Leu Gly Lys Leu Glu Arg Glu Ile Thr Arg Phe Phe Val Asp

245 250 255

Arg Gly Phe Leu Glu Ile Lys Ser Pro Ile Leu Ile Pro Leu Glu Tyr

260 265 270

Ile Glu Arg Phe Gly Ile Asp Asn Asp Thr Glu Leu Ser Lys Gln Ile

275 280 285

Phe Arg Val Asp Lys Asn Phe Cys Leu Arg Pro Met Leu Ser Pro Asn

290 295 300

Leu Cys Asn Tyr Met Arg Lys Leu Asp Arg Ala Leu Pro Asp Pro Ile

305 310 315 320

Lys Ile Phe Glu Ile Gly Pro Cys Tyr Arg Lys Glu Ser Asp Gly Lys

325 330 335

Glu His Leu Glu Glu Phe Thr Met Leu Asn Phe Cys Gln Met Gly Ser

340 345 350

Gly Cys Thr Arg Glu Asn Leu Glu Ser Ile Ile Thr Asp Phe Leu Asn

355 360 365

His Leu Gly Ile Asp Phe Lys Ile Val Gly Asp Ser Cys Met Val Tyr

370 375 380

Gly Asp Thr Leu Asp Val Met His Gly Asp Leu Glu Leu Ser Ser Ala

385 390 395 400

Val Val Gly Pro Ile Pro Leu Asp Arg Glu Trp Gly Ile Asp Lys Pro

405 410 415

Trp Ile Gly Ala Gly Phe Gly Leu Glu Arg Leu Leu Lys Val Lys His

420 425 430

Asp Phe Lys Asn Ile Lys Arg Ala Ala Arg Ser Glu Ser Tyr Tyr Asn

435 440 445

Gly Ile Ser Thr Asn Leu

450

Claims

1.一种均质的重组多肽，其包含遗传整合的具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸，其中所述BCN基团作为赖氨酸的残基存在，并且其中所述BCN基团连接到四嗪基团上。

2.一种制备包含BCN基团的多肽的方法，所述方法包括将包含BCN基团的氨基酸遗传整合到多肽中，其中制备多肽包括：

(ⅱ)在识别所述正交密码子的正交tRNA合成酶/tRNA对存在的情况下翻译所述核酸，并将所述具有BCN基团的氨基酸整合到多肽链上，

其中所述tRNA合成酶包括具有突变Y271M、L274G和C313A(BCNRS)的PylRS合成酶，且其中所述包含BCN基团的氨基酸是BCN赖氨酸。

3.如权利要求2所述的方法，其中所述正交密码子包括琥珀密码子(TAG)，所述tRNA包括MbtRNA_CUA，所述具有BCN基团的氨基酸包含双环[6.1.0]壬-4-炔-9-基甲醇(BCN)赖氨酸和所述tRNA合成酶包含具有突变Y271M、L274G和C313A(BCNRS)的PylRS合成酶。

4.如权利要求1所述的均质的重组多肽或如权利要求2或3所述的方法，其中所述具有BCN基团的氨基酸整合于对应于野生型多肽上的赖氨酸残基的位置上。

5.如权利要求1所述的均质的重组多肽，其中所述四嗪基团进一步连接到荧光团上。

6.如权利要求5所述的多肽，其中所述荧光团包括荧光素、四甲基罗丹明(TAMRA)或硼吡咯甲烷(BODIPY)。

7.一种制备包括四嗪基团的多肽的方法，所述方法包括提供包含遗传整合的具有双环[6.1.0]壬-4-炔-9-基甲醇(BCN)基团的氨基酸的均质的重组多肽，将所述多肽与四嗪化合物接触，并孵育以允许通过反电子需求Diels-Alder环加成反应将四嗪连接到BCN基团上。

8.如权利要求7所述的方法，其中四嗪选自图1的6至17。

9.如权利要求7所述的方法，其中四嗪选自图1的6、7、8和9，并且反应的准一级速率常数为至少80M^-1s^-1。

10.如权利要求7至9任一项所述的方法，其中所述四嗪化合物是选自由图1的11和17组成的组的四嗪化合物。