CN101151366A

CN101151366A - 将炔基氨基酸体内掺入真细菌的蛋白

Info

Publication number: CN101151366A
Application number: CNA2005800363610A
Authority: CN
Inventors: A·戴特斯; P·舒尔茨
Original assignee: Scripps Research Institute
Current assignee: Scripps Research Institute
Priority date: 2004-09-21
Filing date: 2005-09-20
Publication date: 2008-03-26
Anticipated expiration: 2025-09-20
Also published as: US7718410B2; MX2007003142A; AU2005286722B2; EP2770053B1; AU2005286722A1; EP2770053A1; JP5823941B2; IL218090A; JP2008513039A; CN101151366B; EP1794323A2; JP2013009682A; IL182035A0; WO2006034332A3; ES2519444T3; EP1794323B1; PL1794323T3; BRPI0515547A; US20080220472A1; IL218089A0

Abstract

本发明涉及tRNA和氨酰－tRNA合成酶的正交配对，其能将炔基氨基酸(例如对炔丙基氧苯丙氨酸)掺入真细菌宿主中(例如大肠杆菌)产生的蛋白质。本发明提供新型正交合成酶、该新型合成酶的鉴定和制备方法、含炔基氨基酸的蛋白质的制备方法、以及细胞翻译系统。

Description

将炔基氨基酸体内掺入真细菌的蛋白

相关申请的交叉参考

本申请要求2004年9月21日提交的美国临时专利申请系列号60/612,220；2004年11月24日提交的美国临时专利申请系列号60/630,876和2004年12月7日提交的美国临时专利申请系列号60/634,151的优先权，这些申请的内容出于所有目的全文纳入本文作为参考。

由联邦政府资助的研究和开发所作出发明的权利声明

本发明在国家卫生研究院基金号GM62159的政府支持下作出。政府可对本发明享有某些权利。

发明领域

本发明属于翻译生物化学(translation biochemistry)领域。本发明涉及制备和使用能将炔基氨基酸掺入蛋白质的正交tRNA、正交氨酰tRNA合成酶及正交tRNA/正交氨酰tRNA合成酶配对的组合物和方法。本发明也涉及利用这种配对及相关组合物在细胞内产生蛋白质的方法。

发明背景

能利用非肽分子，例如光谱探针、催化辅助物质或聚合物位点特异性地化学修饰蛋白质或使蛋白质共价交联于另一蛋白质或任何其它部分是研究和操作蛋白质的化学和生物学特性的有力手段。常规方法包括将蛋白质上的亲核表面残基，例如赖氨酸、组氨酸或半胱氨酸的侧链与外源性分子，例如醛、α-卤代羧酰胺和N-羟基琥珀酰亚胺的亲电基团生物缀合(bioconjugation)(Lemineux，G.A.；Bertozzi，C.R.，TIBTECH，1996，16，506)。

不幸的是，利用蛋白质中天然产生的亲核靶标靶向修饰的问题在于，这些反应的选择性中等并且蛋白质中存在大量亲核氨基酸，从而形成标记蛋白质的异质混合物。此外，亲核靶向修饰反应往往需要非生理条件，这样就不可能进行体内修饰方案和/或可导致蛋白质生物学活性丧失。

本领域需要有特异性并靶向蛋白质修饰的新靶标和新方案。不幸的是，从细菌到人，每种已知的生物均编码相同的20种常见氨基酸(罕见的例外是硒代半胱氨酸)(参见，例如A.Bock等，(1991)，Molecular Microbiology，5：515-20)和吡咯赖氨酸(参见，例如G.Srinivasan等，(2002)，Science，296：1459-62)。此特征限制了利用天然产生的氨基酸开发用于靶向蛋白质修饰的新化学物质。

克服此局限性的方案之一是扩大遗传密码并将具有不同化学特性的氨基酸加入生物学物质中。利用真细菌大肠杆菌(E.coli)和其它生物的体内蛋白质生物合成机器，用“正交”tRNA和相应的新型“正交”氨酰-tRNA合成酶将非天然氨基酸加入蛋白质证明此方案是可行的(例如，Wang等，(2001)，Science，292：498-500；Chin等，(2002)，Journal of the American Chemical Society，124：9026-9027；Chin和Schultz，(2002)，ChemBioChem，11：1135-1137；Chin等，(2002)，PNAS United States of America，99：11020-11024；Wang和Schultz，(2002)，Chem. Comm.，1-10)。也可参见名为“制备正交tRNA氨酰-tRNA合成酶配对的方法与组合物”(METHODS AND COMPOSITIONS FOR THE PRODUCTION OFORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS)的国际公布WO 2002/086075；名为“非天然氨基酸的体内掺入”(IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)的WO 2002/085923；名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETICCODE)的WO 2004/094593；2004年7月7日提交的WO 2005/019415；2004年7月7日提交的WO 2005/007870与2004年7月7日提交的WO 2005/007624。

本领域需要新方法来实现高度特异性与靶向的蛋白质修饰。本领域需要开发能将非天然氨基酸体内掺入大肠杆菌蛋白质的正交翻译组分，其中所述非天然氨基酸可以掺入确定位置，所述非天然氨基酸具有不同的化学特性从而能用作特异性修饰的靶标以排除与蛋白质的其它部分发生交叉反应或副反应。本领域的此需要特别适用于大肠杆菌，因为真细菌蛋白质表达系统可为科学研究或治疗应用生产大量重组蛋白。阅读下文后可明白本发明满足了这些和其它需要。

发明概述

本发明提供制备正交组分的组合物与方法，所述正交组分在体内或体外响应于选择者密码子(selector codon)，例如，琥珀终止密码子、四碱基或多碱基密码子等，将炔基氨基酸掺入到延伸中的多肽链。本发明提供正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和它们的配对。这些配对可用于细胞或非细胞系统中将炔基氨基酸掺入延伸中的多肽链。发现含有炔基氨基酸的多肽尤其可用于缀合反应，其中炔基部分在[3+2]环加成反应中易于并且特异性地和叠氮基部分反应从而形成三唑键。如本文所述，由于炔基对于体内系统是外来的，而叠氮基团基本上可加入任何化学化合物，所以能位点特异地掺入炔基氨基酸的系统是位点特异性修饰的重要工具。

一方面，真细菌细胞含有正交氨酰-tRNA合成酶(O-RS)，该O-RS用非天然氨基酸优先氨酰化正交tRNA(O-tRNA)，所述非天然氨基酸是炔基氨基酸。在一些实施方案中，所述真细菌细胞是大肠杆菌细胞。在一些方面，O-RS衍生自詹氏甲烷球菌(Methanococcus jannaschii)氨酰-tRNA合成酶，例如詹氏甲烷球菌酪氨酰-tRNA合成酶。在一些实施方案中，用于获得O-RS的酪氨酰-tRNA合成酶是具有SEQ ID NO：2所示氨基酸序列的野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。

在一些实施方案中，衍生自SEQ ID NO：2所示野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的O-RS在共有位置的组合含有突变，例如：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸。

在一些实施方案中，O-RS的氨基酸序列含有SEQ ID NO：4、6、8、10、12、14、16、18所示序列之一或其保守性变体。含有O-RS的细胞通常含有能编码O-RS，例如任何上述O-RS种类的核酸。编码O-RS的核酸可含有，例如SEQ ID NO：5、7、9、11、13、15、17或19所示核苷酸序列。

在一些实施方案中，细胞所用的O-tRNA是琥珀抑制型tRNA。例如，所述O-tRNA是或含有SEQ ID NO：1所示多核苷酸序列。

在一些实施方案中，作为O-RS底物的炔基氨基酸是对炔丙基氧苯丙氨酸(para-propargyloxyphenylalanine)(pPRO-Phe)。细胞系统也包含具有至少一个选择者密码子的核酸，其中O-tRNA识别所述选择者密码子。含有正交组分的细胞还可含有炔基氨基酸，例如pPRO-Phe。

在一些实施方案中，细胞含有第二正交配对(即，第二O-tRNA与第二O-RS)，其中所述第二配对对不同于第一非天然氨基酸的非天然氨基酸特异，所述第二O-tRNA识别的选择者密码子不同于第一O-tRNA所识别的选择者密码子。

在一些方面，含有正交组分的细胞包含翻译系统，其中除O-RS和O-tRNA外，所述系统还包含具有至少一个选择者密码子的、编码感兴趣多肽的核酸与炔基氨基酸，其中所述O-tRNA识别所述选择者密码子，所述O-RS能使所述O-tRNA带有炔基氨基酸。

在一些方面，本发明提供多肽，例如本文所述的O-RS多肽。这些多肽可衍生自SEQ ID NO：2所示的詹氏甲烷球菌酪氨酰氨酰-tRNA合成酶，它们具有以下氨基酸共有序列：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸，

并且这些多肽具有能用炔基氨基酸优先氨酰化正交tRNA(O-tRNA)的氨酰-tRNA合成酶活性。在一些实施方案中，本发明多肽选自SEQ ID NO：4、6、8、10、12、14、16、18或其保守性变体。任何这样的本发明O-RS多肽是能用炔基氨基酸优先氨酰化真细菌细胞内的正交tRNA(O-tRNA)的氨酰-tRNA合成酶。本发明也提供编码上述本发明的任何O-RS多肽的多核苷酸。

在一些实施方案中，本发明的多核苷酸(编码本发明的O-RS)选自SEQ IDNOS：5、7、9、11、13、15、17和19。编码本发明O-RS的任何本发明多核苷酸可掺入载体，例如表达载体。本发明载体可用于细胞中。

在一些方面，本发明提供在真细菌细胞中制备含有非天然炔基氨基酸的蛋白质的方法。所述方法能安排将炔基氨基酸插入蛋白质中任何所需的特定位置。所述方法具有以下步骤：

(a)提供真细菌细胞，其含有：

(i)正交氨酰-tRNA合成酶(O-RS)；

(ii)正交tRNA(O-tRNA)，其中所述O-RS用炔基氨基酸优先氨酰化所述O-tRNA；

(iii)编码蛋白质的核酸，其中所述核酸含有至少一个被所述O-tRNA识别的选择者密码子；和

(iv)炔基氨基酸；和，

(b)培养细胞；

(c)在所述蛋白质的翻译期间将炔基氨基酸掺入所述核酸编码的蛋白质的特定位置，其中蛋白质的所述特定位置对应于所述核酸中选择者密码子的位置，从而产生在所述特定位置含有炔基氨基酸的蛋白质。这些方法通常利用大肠杆菌细胞。

这些方法所用的O-RS通常衍生自詹氏甲烷球菌氨酰-tRNA合成酶，例如詹氏甲烷球菌酪氨酰-tRNA合成酶。在一些实施方案中，詹氏甲烷球菌酪氨酰-tRNA合成酶是SEQ ID NO：2所示的合成酶。在一些实施方案中，O-RS衍生自SEQ ID NO：2所示的詹氏甲烷球菌酪氨酰-tRNA合成酶，其中所述O-RS具有的氨基酸序列具有以下突变：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸。

在一些实施方案中，本发明所用的O-RS具有选自SEQ ID NO：4、6、8、10、12、14、16、18的氨基酸序列或其保守性变体。在本发明方法中，细胞可含有编码任意这些O-RS多肽的多核苷酸。例如，可利用含有SEQ ID NO：5、7、9、11、13、15、17或19所示核苷酸序列的多核苷酸。

在这些方法的一些实施方案中，O-tRNA是琥珀抑制型tRNA，选择者密码子是琥珀终止密码子(TAG)。在一些实施方案中，O-tRNA包含SEQ ID NO：1所示的多核苷酸序列或由其编码。可采用这些方法来产生具有炔基氨基酸(对炔丙基氧苯丙氨酸(pPRO-Phe))的蛋白质。本发明方法所产生的蛋白质含有的氨基酸序列可与野生型治疗性蛋白质、诊断性蛋白质、工业酶或其一部分的氨基酸序列至少75％相同。这些蛋白质可任选与药学上可接受的运载体结合。

在一些实施方案中，可在炔基氨基酸的位置修饰本发明方法所产生的蛋白质，例如通过[3+2]环加成反应以形成三唑键。

定义

在详细描述本发明前，应该知道本发明并不限于具体的生物系统，这些系统当然可以不同。还应知道本文所用术语只是为了描述具体实施方案，并不是对本发明的限制。除非另有明确指出，本说明书和附属权利要求书中所用的单数形式“一个”、“一种”和“该”也包括复数对象。因此，例如“一个细胞”包括两个或多个细胞的组合；“一个多核苷酸”实际上包括该多核苷酸的多份拷贝。

除了此处和说明书下文定义的，本文所用的所有技术和科学术语都与本发明所属领域普通技术人员常规理解的意义相同。

正交：本文所用的术语“正交”指与某细胞或翻译系统的内源性相应分子相比，某分子(例如，正交tRNA(O-tRNA)和/或正交氨酰基tRNA合成酶(O-tRNA))与该细胞内源性组分起作用的效率降低，或不能与该细胞的内源性组分起作用。就tRNA和氨酰-tRNA合成酶而言，正交指与和内源性tRNA合成酶起作用的内源性tRNA相比，正交tRNA不能与内源性tRNA合成酶起作用或起作用的效率降低；或者与和内源性tRNA起作用的内源性tRNA合成酶相比，正交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低，所述效率降低例如，20％以下的效率，10％以下的效率，5％以下的效率，或1％以下的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如，与内源性RS氨酰化内源性tRNA相比，细胞的任何内源性RS氨酰化细胞中正交tRNA的效率降低或者甚至降为0。在另一例子中，与内源性RS氨酰化内源性tRNA相比，正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者降为0。可将能与第一正交分子起作用的第二正交分子引入细胞。例如，正交tRNA/RS配对包括引入的互补组份，它们在细胞中共同起作用的效率与对照(如对应的tRNA/RS内源性配对或活性正交配对(如酪氨酰正交tRNA/RS配对)相当(例如是45％效率、50％效率、60％效率、70％效率、75％效率、80％效率、90％效率、95％效率或99％效率，或更高)。

正交酪氨酰-tRNA：本文所用的术语正交酪氨酰-tRNA(酪氨酰-O-tRNA)是与感兴趣翻译系统正交的tRNA，其中所述tRNA是：(1)与天然产生的酪氨酰-tRNA相同或基本类似；(2)通过天然或人工诱变衍生自天然产生的酪氨酰tRNA；(3)由考虑了(1)或(2)的野生型或突变型酪氨酰tRNA序列的方法所产生；(4)与野生型或突变型酪氨酰tRNA同源；(5)与称为表4中酪氨酰tRNA合成酶底物的任何示例性tRNA同源；或(6)称为表4中酪氨酰tRNA合成酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可携带氨基酸，或处于非负载状态。也应知道“酪氨酰-O-tRNA”任选被关联(cognate)合成酶加载(氨酰化)除酪氨酸以外的氨基酸，例如非天然氨基酸对炔丙基氧苯丙氨酸。应该理解，实际上本发明酪氨酰-O-tRNA可有利地用于在翻译期间响应于选择者密码子而将基本上任何氨基酸(无论天然或人工的)掺入延伸中的多肽内。

正交酪氨酰氨基酸合成酶：本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-O-tRNA的合成酶。酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸，无论是天然的还是人工的，并且不限于本文所述的氨基酸。该合成酶任选与天然的酪氨酰氨基酸合成酶相同或同源，或者与表4中称为O-RS的合成酶相同或同源。例如，所述O-RS可以是表4的酪氨酰-O-RS的保守变体，和/或与表4中O-RS的序列至少有50％、60％、70％、80％、90％、95％、98％、99％或以上相同。

关联物(cognate)：术语“关联物”指共同起作用的组分，例如正交tRNA和正交氨酰-tRNA合成酶。这些组分也可互称为“互补的”。

优先氨酰化：对于正交翻译系统而言，当某表达系统中O-RS使O-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时，该O-RS“优先氨酰化”关联O-tRNA。即，当翻译系统中存在大致相等摩尔比的O-tRNA与任何给定的内源性tRNA时，O-RS使O-tRNA带上氨基酸的频率高于它使内源性tRNA带上氨基酸的频率。当翻译系统中存在等摩尔浓度的O-tRNA与内源性tRNA时，通过O-RS带上氨基酸的O-tRNA与通过O-RS带上氨基酸的内源性tRNA的相对比例优选较高，最好导致O-RS仅使或几乎仅使O-tRNA带上氨基酸。当存在等摩尔浓度的O-tRNA与O-RS时，通过O-RS带上氨基酸的O-tRNA与通过O-RS带上氨基酸的内源性tRNA的相对比例大于1∶1，优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

当(a)与内源性tRNA相比，O-RS优先氨酰化O-tRNA，和(b)与O-RS用任何天然氨基酸氨酰化O-tRNA相比，氨酰化对非天然氨基酸特异时，O-RS“用非天然氨基酸优先氨酰化O-tRNA”。即，当包含O-RS和O-tRNA的翻译系统中存在等摩尔量的非天然和天然氨基酸时，O-RS将非天然氨基酸加载到O-tRNA上的频率高于加载天然氨基酸的频率。带有非天然氨基酸的O-tRNA与带有天然氨基酸的O-tRNA的相对比例优选较高。O-RS最好使O-tRNA仅仅，或者几乎仅仅带上非天然氨基酸。当翻译系统中存在等摩尔浓度的天然和非天然氨基酸时，使O-tRNA带上非天然氨基酸与使O-tRNA带上天然氨基酸的相对比例大于1∶1，优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

选择者密码子：术语“选择者密码子”指翻译过程中为O-tRNA所识别而不为内源性tRNA所识别的密码子。O-tRNA反密码子环识别mRNA上的选择者密码子并在多肽的此位置掺入其氨基酸，例如非天然氨基酸(如炔基氨基酸)。选择者密码子可包括，例如无义密码子，如终止密码子(如，琥珀、赭石和乳白密码子)；四碱基或四碱基以上密码子；罕用密码子；衍生白天然或非天然碱基对的密码子，等等。

抑制型tRNA：抑制型tRNA是例如通过提供响应选择者密码子而将氨基酸掺入多肽链的机制来改变给定的翻译系统中信使RNA(mRNA)阅读的tRNA。例如，抑制型tRNA可读通如终止密码子(如，琥珀、赭石和乳白密码子)、四碱基密码子、罕用密码子等。

抑制活性：本文所用的术语“抑制活性”总体上指tRNA(例如，抑制型tRNA)能翻译读通在其它情况中可导致翻译终止或错译(例如，移码)的密码子(例如，作为选择者密码子的琥珀密码子或四个或以上碱基的密码子)的能力。抑制型tRNA的抑制活性可表达为与第二抑制型tRNA，或与对照系统，例如缺乏O-RS的对照系统相比，观察到的翻译读通活性的百分比。

本发明提供了能定量测定抑制活性的各种方法。具体O-tRNA和O-RS对感兴趣的选择者密码子(例如，琥珀密码子)的抑制百分比是指，在感兴趣的翻译系统中，在编码表达测试标记的核酸中含有选择者密码子的给定表达测试标记(例如，LacZ)的活性与阳性对照构建物相比的百分比，所述感兴趣的翻译系统包含O-RS和O-tRNA，所述阳性对照没有O-tRNA、O-RS和选择者密码子。因此，例如，如果在给定翻译系统中观察到不含选择者密码子的活性阳性对照标记构建物的活性为X(其单位与具体的标记试验相关)，则含有选择者密码子的测试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境条件下(除了测试标记构建物在也含有O-tRNA和O-RS的翻译系统中表达外)，该测试标记构建物显示的X百分比。表达该测试标记的翻译系统一般也包含被O-RS和O-tRNA所识别的氨基酸。可任选通过将测试标记与“背景”或“阴性”对照标记构建物比较来校正抑制百分比的测量值，所述“背景”或“阴性”对照标记构建物含有与测试标记相同的选择者密码子，但其所在的系统不含O-tRNA、O-RS和/或被O-tRNA和/或O-RS所识别的相关氨基酸。该阴性对照可用于标准化抑制百分比测定值以消除感兴趣的翻译系统中标记的背景信号的影响。

可通过本领域已知的许多试验来测定抑制效率。例如，可采用β-半乳糖苷酶报道试验，如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)连同含有本发明的O-tRNA的质粒引入合适生物(例如，可利用正交组分的生物)的细胞。也可引入关联合成酶(为多肽或表达时能编码该关联合成酶的多核苷酸)。细胞在培养基中生长至所需密度，例如至OD₆₀₀约为0.5，进行β-半乳糖苷酶试验，例如用BetaFluor^TMβ-半乳糖苷酶试验试剂盒(Novagen)。可将抑制百分比计算为样品相对于可比较对照，例如，与衍生的lacZ构建物的观察值的活性百分比，该衍生的lacZ构建物在所需位置具有相应的有义密码子而非选择者密码子。

翻译系统：术语“翻译系统”指将氨基酸掺入延伸中的多肽链(蛋白质)的各组分。翻译系统的组分可包括，例如核糖体、tRNA、合成酶、mRNA等。本发明的O-tRNA和/或O-RS可加入体外或体内翻译系统或是其一部分，例如存在于非真核细胞，如细菌(如大肠杆菌)中，或存在于真核细胞中，如酵母菌、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。

非天然氨基酸：本文所用的术语“非天然氨基酸”指不在20种常见天然氨基酸和硒代半胱氨酸或吡咯赖氨酸之列的任何氨基酸，修饰的氨基酸和/或氨基酸类似物，例如炔基氨基酸。

衍生自：本文所用的术语“衍生自”分离自特定分子或生物，或是用特定分子或生物的信息制得的某组份。例如，衍生自第二多肽的多肽含有与该第二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例，可通过，例如天然产生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍生多肽的诱变可以是有意定向或有意随机的。诱变多肽以产生衍生自第一(多肽)的不同多肽可以是随机事件(例如，聚合酶失真所致)，鉴定衍生的多肽可以是偶然发现的。诱变多肽通常需要处理编码该多肽的多核苷酸。

阳性选择或筛选标记：本文所用的术语“阳性选择或筛选标记”指当存在该标记时(例如被表达或激活等)可鉴定出具有特征，例如具有阳性选择标记的细胞，从而区别于不具有该特征的细胞。

阴性选择或筛选标记：本文所用的术语“阴性选择或筛选标记”指当存在该标记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如，与确实具有该特性或特征的细胞相比)。

报道分子：本文所用的术语“报道分子”是指可用于鉴定和/或选择感兴趣系统的靶组分的组分。例如，报道分子可以包括蛋白质，如能赋予抗生素抗性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光筛选标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如萤火虫萤光素酶蛋白)、亲和力筛选标记，或者正或负可选择标记基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、ura3、leu2、lys2等。

真核生物：本文所用的术语“真核生物”指属于真核生物界(Kingdom Eucarya)的生物。真核生物通常因其以下特征而区别于原核生物：典型的多细胞组织(但不都是多细胞，例如酵母)，存在膜限制的核与其它膜限制的细胞器，线性遗传物质(即，线性染色体)，不存在操纵子，存在内含子、信使(RNA)加帽和poly-A mRNA，以及其它生物化学特征，如不同的核糖体结构。真核生物包括，例如动物(如哺乳动物、昆虫、爬行动物、鸟等)，纤毛虫，植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动物等。

原核生物：本文所用的术语“原核生物”指属于原核生物界(也称为原核生物(Procarya))的生物。原核生物通常因其以下特征而区别于真核生物：单细胞组织，通过出芽或分裂的无性生殖，缺乏膜限制的核与其它膜限制的细胞器，环状染色体，存在操纵子，不存在内含子、信使(RNA)加帽和poly-A mRNA，以及其它生物化学特征，如不同的核糖体结构。原核生物包括真细菌和古细菌(Archaea)(有时称为“古细菌(Archaebacteria)”)亚界。在原核生物界有时将蓝细菌(蓝绿藻)与支原体分为不同类别。

细菌：本文所用的术语“细菌”和“真细菌”指不同于古细菌的原核生物。类似地，古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准区分真细菌和古细菌。例如，可采用核糖体RNA序列、RNA聚合酶结构的差异，存在或不存在内含子，抗生素敏感性，存在或不存在细胞壁肽聚糖和其它细胞壁组分，膜脂质的分枝与不分枝结构，存在/不存在组蛋白和组蛋白样蛋白将某生物指定为真细菌或古细菌。

真细菌的例子包括大肠杆菌(Escherichia coli)、嗜热栖热菌(Thermusthermophilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)等)。古细菌的例子包括詹氏甲烷球菌(Methanococcus jannaschii)(Mj)、梅氏甲烷八叠球菌(Methanosarcinamazei)(Mm)、嗜热碱甲烷杆菌(Methanobacteriurn thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、甲烷嗜热菌(Methanopyrus kandleri)、盐细菌(Halobacterium)(例如沃氏富盐菌(Haloferax volcanii)和盐细菌种NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcus furiosus)(Pf)、Pyrococcus horikoshii(Ph)、好氧火球菌(Pyrobaculum aerophilum)、Pyrococcusabyssi、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、Sulfolobus tokodaii、Aeuropyrumpernix(Ap)、嗜酸热原体(Thermoplasma acidophilum)和火山热原体(Thermoplasmavolcanium)。

保守性变体：就翻译组分而言，本文所用的术语“保守性变体”指在功能上类似于和该保守性变体相似的基本组分，例如O-tRNA或O-RS，但与参比O-tRNA或O-RS相比，序列中有变异的某翻译组份，例如保守性变体O-tRNA或保守性变体O-RS。例如，O-RS可用非天然氨基酸，例如炔基氨基酸，如对炔丙基氧苯丙氨酸来氨酰化互补O-tRNA或保守性变体O-tRNA，虽然O-tRNA和保守性变体O-tRNA不具有相同的序列。保守性变体在序列中可具有例如一处变异、两处变异、三处变异、四处变异或五处或更多处变异，只要该保守性变体与相应的O-tRNA或O-RS互补。

选择或筛选试剂：本文所用的术语“选择或筛选试剂”指当其存在时可从某群体中选择或筛选某些组分的试剂。例如，选择或筛选试剂可以是但不限于，如营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可依例如浓度、强度等而不同。

响应于：本文所用的术语“响应于”指本发明的O-tRNA识别选择者密码子并介导与该tRNA偶联的炔基氨基酸掺入延伸中的多肽链的过程。

编码：本文所用的术语“编码”指用多聚大分子或序列链中的信息来指导不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用的该术语应用广泛，可用于各种领域。一方面，术语“编码”描述了半保留DNA复制的过程，其中双链DNA分子的一条链用作模板通过依赖DNA的DNA合成酶来编码新合成的互补姊妹链。

在另一方面，术语“编码”指用一种分子的信息来指导产生化学性质不同于该第一分子的第二种分子的任何过程。例如，DNA分子可编码RNA分子(例如，通过依赖DNA的RNA聚合酶参与的转录过程)。RNA分子也可编码多肽，例如翻译过程。当术语“编码”用于描述翻译过程时，其含义也延伸至编码氨基酸的三联密码子。在一些方面，RNA分子可编码DNA分子，例如通过依赖RNA的DNA合成酶参与的逆转录过程。在另一方面，DNA分子可编码多肽，应理解该情况用“编码”同时包括转录和翻译过程。

炔：本文所用的术语“炔”(有时也称为“乙炔”)指具有以下通式的在两个碳原子之间含有三键的化学结构(如图1B所示)：

其中R是任何原子或结构。当用作取代基时，该炔部分称为“炔基”。炔基碳原子是sp²杂化，形成只与两个其它原子结合的键；这些键之一是单价，而另一键是三键。例如，炔基氨基酸是在两个碳中心之间含有三键的氨基酸。由于自然界中氨基酸上不存在炔基取代基，任何炔基氨基酸都是非天然氨基酸。

叠氮基：本文所用的术语“叠氮基”指具有以下通式的化学基团-N₃：

R-N＝N⁺＝N^-

该叠氮基通常与碳原子相连。

例如，叠氮基染料是具有叠氮取代基的染料分子(参见，例如图6A和6B中的叠氮基染料2和3)。术语“叠氮化物”指含有叠氮基团的化合物(例如，苄基叠氮、叠氮钠等)。

附图简述

图1提供了非天然氨基酸对炔丙基氧苯丙氨酸(按照IUPAC命名法也称为2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸)的化学结构(1)。图1B给出了室温下在有铜存在时叠氮(化物)与炔发生[3+2]环加成反应从而可逆地形成三唑的通用化学反应。

图2提供了野生型詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)的核苷酸与氨基酸序列。对炔丙基氧苯丙氨酸(pPRO-Phe)tRNA合成酶中定向诱变所靶向的氨基酸位置或其它突变的氨基酸位置(与相应的三联密码子)加框表示。

图3提供的表格描述了编码野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的多核苷酸诱变后鉴定与分离的8种对炔丙基氧苯丙氨酸(pPRO-Phe)tRNA合成酶。显示了野生型詹氏甲烷球菌酪氨酰-tRNA合成酶与对炔丙基氧苯丙氨酸tRNA合成酶(pPRO-PheRS)的所示密码子编码的氨基酸。也显示了突变位置的密码子。如图2所示，按照野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的氨基酸编号给突变体的氨基酸位置编号。

图4是纯化的Ser4→pPRO-Phe4突变型肌红蛋白的Gelcode^蓝(PierceBiotechnology，Inc.)-染色的SDS-PAGE凝胶(电泳图谱)。泳道1含有在有对炔丙基氧苯丙氨酸(pPRO-Phe)存在时在基本培养基中培养的大肠杆菌表达的蛋白质；泳道2含有在没有pPRO-Phe存在时产生的蛋白质样品。下图显示了利用抗-His6抗体检测肌红蛋白C-末端的六组氨酸标签的同一样品物质的western印迹。

图5提供了含有炔基非天然氨基酸(以Y^*表示)的胰蛋白酶消化肽段HGVTVLTALGY^*ILK的串联质谱图，显示了它们预计的离子质量。箭头表示观察到的肽的b和y离子系列。

图6A和6B提供了叠氮基功能化染料的化学结构(分别是2和3)。图6A中的染料2含有丹磺酰荧光团，图6B的染料3含有荧光素荧光团。

图7A给出了在工程改造的琥珀密码子(4ATG)处含有炔基氨基酸的突变型肌红蛋白与叠氮基功能化染料(如图6A和6B所示)间发生[3+2]环加成反应从而可逆地形成三唑的通用化学反应。图7B提供了分辨的(resolved)标记肌红蛋白在UV照射下的荧光凝胶成像，其中[3+2]环加成反应共价连接于染料2或染料3。

图8A和8B提供炔基非天然氨基酸的结构和名称。图8A提供了可从非天然前体化学合成的炔基非天然氨基酸。图8B提供了可能能够从现存的天然产生氨基酸底物合成的炔基非天然氨基酸。

发明详述

极其需要能在生理条件下以高度选择性方式修饰蛋白质的化学反应(Lemineux和Bertozzi，(1996)，TIBTECH，16：506)。本领域目前用于蛋白质选择性修饰的大多数反应包括在亲核和亲电配对(partners)之间形成共价键，所述配对靶向蛋白质氨基酸链中天然产生的亲核残基，例如α-卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情况中，选择性取决于蛋白质中亲核残基的数量与可接近性。不幸的是，天然产生的蛋白质往往含有位置不佳(例如，不可接近)的反应位点或多个反应靶标(例如，赖氨酸、组氨酸和半胱氨酸残基)，导致修饰反应选择性差，使得通过亲核/亲电试剂进行高度靶向的蛋白质修饰非常困难。此外，修饰位点通常局限于天然产生的赖氨酸、组氨酸或半胱氨酸的亲核侧链。难于或不可能在其它位点修饰。

此问题的解决方法之一是利用正交翻译组分将具有新反应性的非天然氨基酸以按计划的、位点特异性生物合成方式掺入蛋白质(Wang和Schultz，(2002)，Chem.Commun.，1：1；van Maarseveen和Back，(2003)，Angew.Chem.，115：6106)。在此，我们报道了选择性修饰蛋白质的高度有效的新方法，所述方法包括响应于琥珀无义密码子TAG将含炔基的非天然氨基酸遗传掺入细菌(例如，大肠杆菌)所产生的蛋白质。然后可特异性且区域选择性地(regioselectively)修饰这些炔基氨基酸侧链。由于炔基独特的反应化学性质，可以极高的选择性修饰这些蛋白质。

为在细菌表达系统所产生的蛋白质的独特位点(例如，所需位点)选择性地引入炔基官能团，我们开发了在遗传编码炔基氨基酸对炔丙基氧苯丙氨酸(pPRO-Phe；见图1A)的真细菌中起作用的正交tRNA/氨酰-tRNA合成酶配对。简言之，我们鉴定出在大肠杆菌细胞中使琥珀抑制型tRNA选择性带上对炔丙基氧苯丙氨酸(pPRO-Phe)的詹氏甲烷球菌酪氨酰-tRNA合成酶的新突变体。可用这些开发的tRNA-合成酶将炔基位点特异地掺入蛋白质。

靶向蛋白质修饰

在本文，我们报道了选择性修饰蛋白质的高度有效的新方法，所述方法包括响应于琥珀无义密码子TAG将含炔基的非天然氨基酸遗传掺入细菌(例如，大肠杆菌)所产生的蛋白质。本文所述的新组合物和方法利用正交tRNA/氨酰-tRNA合成酶系统，该正交系统利用衍生自詹氏甲烷球菌的组分，这些组分用于真细菌宿主系统来产生感兴趣的蛋白质。通过工程改造编码感兴趣蛋白质的多核苷酸使之含有能发出掺入炔基氨基酸信号的选择者密码子，从而可使炔基氨基酸掺入蛋白质安排发生在任何所需位置。

然后可通过Huisgen[3+2]环加成反应用叠氮基衍生物特异性且区域选择性地修饰感兴趣蛋白质上的这些炔基氨基酸侧链(参见，图1B)(Padwa，刊于《综合有机合成》(Comprehensive Organic Svnthesis)；[Trost，B.M.编]，Pergamon：牛津，1991，第四卷，第1069-1109页；Huisgen，刊于《1，3-两级环加成化学》(1，3-Dipolar Cycloaddition Chemistry)，[Padwa，A.编]，Wiley：纽约，1984，第1-176页)。由于此方法涉及环加成而不是亲核取代，因此可以极高选择性地修饰蛋白质。此反应的优点在于，通过向反应混合物中加入催化量的Cu(I)盐，该反应能在室温、水性条件下进行同时具有优秀的区域选择性(1，4＞1，5)(Tornoe等，(2002)，J.Org.Chem.，67：3057-3064；Rostovtsev等，(2002)，Angew.Chem.，Int.Ed.，41：2596-2599)。

炔基反应性靶标的优点是对体内系统是完全外来的，其反应化学性质具有高度选择性(例如，对含叠氮基的部分具有高度反应性)，可采用允许涉及蛋白质并保留蛋白质生物学活性的、在体外和体内进行的缀合反应的较温和的反应条件来缀合。为阐述(但不是限制)本发明，将炔基部分掺入肌红蛋白模型蛋白，然后通过形成稳定三唑键的[3+2]环加成反应(见图1B)使蛋白与叠氮基荧光染料(见图6A和6B)生物缀合。

虽然本发明利用两种叠氮基荧光染料来说明炔基氨基酸与叠氮基部分之间的[3+2]环加成(见实施例4)，但不应理解为本发明只限于利用这两种叠氮基染料，或者任何染料或标记物，或者实际上任何单一类型的可缀合材料。本发明的含叠氮基部分实际上可以是作为叠氮基衍生物的任何分子。这种分子包括但不限于：染料、荧光团、交联剂、糖衍生物、聚合物(例如，聚乙二醇衍生物)、光交联剂、细胞毒性化合物、亲和标记物、生物素衍生物、树脂、珠、第二蛋白或多肽(或更多)、多核苷酸(例如，DNA、RNA等)、金属螯合剂、辅因子、脂肪酸、碳水化合物等。这些叠氮基分子可与具有炔基的非天然氨基酸，例如对炔丙基氧苯丙氨酸(见图1A)缀合。

本发明详述了图6A和6B所示叠氮基染料的合成。分别见实施例6和7。然而，本领域技术人员熟知感兴趣的任何具体分子的叠氮基衍生物的合成。例如，有许多教材和方案描述了如何合成叠氮基化合物。综合参考可见：Patai，Saul，刊于《官能团化学》(The Chemistry of Functional Groups)中的“叠氮基化学”(Thechemistry of the azido group)，London，New York，Interscience Publishers，1971。

在另一方面，本发明提供利用含炔基多肽的缀合反应所用的聚乙二醇叠氮基衍生物(叠氮基-PEG)来产生PEG化多肽的组合物与方法。叠氮基聚乙二醇的通用结构是：

N₃-CH₂-(CH₂-O-CH₂)_n-CH₂OR

其中R是H或CH₃，n是介于例如50-10,000，75-5,000，100-2,000，100-1,000等之间的整数。在本发明的各种实施方案中，叠氮基聚乙二醇的分子量是，例如约5,000-约100,000Da(即，约5kDa-约100kDa)，约20,000-50,000Da，约20,000-约10,000Da(如20,000Da)等。本领域技术人员熟知合成叠氮基聚乙二醇的技术。例如，含有亲电基团(如，溴或N-羟基琥珀酰亚胺酯)的聚乙二醇分子可与含有叠氮基的亲核分子(如，叠氮钠或3-叠氮基丙胺)反应产生叠氮基聚乙二醇。

当经三唑键与含炔基蛋白质生物缀合时，叠氮基-PEG可用于本发明。用聚乙二醇衍生蛋白质治疗剂(PEG化)常可改善蛋白质的药代动力学和药效学特性，从而提高效力并尽可能降低给药频率。例如，Deiters等，“位点特异性PEG化含非天然氨基酸的蛋白质”(Site-specific PEGylation of proteins containing unnaturalamino acids)，Bioorganic & Medicinal Chemistry Letters，14：5743-5745，(2004)讨论和说明了PEG化蛋白质治疗剂的各种优点。

此外，考虑了与产生含有非天然炔基氨基酸的多肽有关的其它优点，所述氨基酸也具有酯键。例如，利用具有酯键的炔基氨基酸产生的PEG化多肽能通过酯键的体内或体外皂化缓慢释放多肽。利用聚合支持物(叠氮基树脂)取代叠氮基-PEG分子也能进行蛋白质亲和纯化。三唑共价键可允许有强烈洗涤步骤，利用酯炔基氨基酸可通过碱处理释放蛋白质。这种亲和纯化方案明显不再需要感兴趣蛋白质上存在用于纯化的人工标签(例如，六组氨酸)或表位。取决于所用的非天然氨基酸，切割步骤后亲和树脂可释放基本上野生型(天然)的多肽。

可合成含有酯键的非天然炔基氨基酸并将其掺入蛋白质，例如3-[(丙-2-炔基氧)羰基]-2-氨基丙酸和4-[(丙-2-炔基氧)羰基]-2-氨基丁酸(见图8B)。经[3+2]环加成生物缀合后，可在体内或体外皂化切割酯键；应用之一可以是，例如缓慢释放PEG化蛋白质的肽部分。

在一些方面，本发明多肽包括含炔基的多肽，此外也包括那些多肽的缀合形式。例如，在一些方面，本发明包括含有三唑键与共价偶联的荧光叠氮基染料(如，见图6A、6B和7A)的多肽。在此方面，所述多肽先前含有炔基，所述染料先前含有叠氮基，二者经[3+2]环加成缀合而形成三唑键。在另一实施方案中，本发明含炔基的蛋白质含有叠氮基聚乙二醇(见化学结构6)。

正交tRNA/氨酰-tRNA合成酶技术

理解正交tRNA和正交氨酰-tRNA合成酶配对相关的活性有助于理解本发明的新组合物和方法。正交tRNA和氨酰-tRNA合成酶技术的讨论可见，例如国际公布WO 2002/085923，WO 2002/086075，WO 204/09459，WO 2005/019415，WO2005/007870和WO 2005/007624。

为向遗传密码中加入额外的反应性非天然氨基酸，例如炔基氨基酸，需要能在宿主翻译系统机器中有效地发挥功能但与所述翻译系统是“正交”的、含有氨酰-tRNA合成酶与合适的tRNA的新正交配对，与所述翻译系统“正交”意味着它发挥作用不依赖于该翻译系统的内源性合成酶和tRNA。正交配对的所需特征包括能解码或识别不由任何内源性tRNA解码的仅一种特定密码子(例如选择者密码子)的tRNA，和只能利用一种特定非天然氨基酸优先氨酰化其关联tRNA(或“使之负载”)的氨酰-tRNA合成酶。内源性合成酶通常不氨酰化O-tRNA。例如，在大肠杆菌中，正交配对包括不与任何内源性tRNA(例如，大肠杆菌中有40种)交叉反应的氨酰-tRNA合成酶和不被任何内源性合成酶(例如，大肠杆菌中有21种)氨酰化的正交tRNA。

本文所述发明提供在真细菌，例如大肠杆菌中遗传编码和将炔基氨基酸掺入蛋白质的正交配对，其中所述正交组分不与宿主细胞的翻译系统的内源性大肠杆菌组分交叉反应，但能识别所需的非天然氨基酸并响应于琥珀无义密码子TAG将其掺入蛋白质。本发明提供的正交组分包括衍生自詹氏甲烷球菌酪氨酰-tRNA合成酶的正交氨酰-tRNA合成酶和突变型酪氨酰tRNA_CUA琥珀抑制物。在此系统中，突变型氨酰-tRNA合成酶用pPRO-Phe而不是常见的20种氨基酸来氨酰化抑制型tRNA。

本发明提供鉴定和产生可用于将炔基氨基酸掺入蛋白质的其它正交tRNA-氨酰tRNA合成酶配对(例如O-tRNA/O-RS对)的组合物和方法。本发明的O-tRNA能介导将炔基氨基酸掺入含有例如在体内能被O-tRNA识别的选择者密码子的多核苷酸所编码的蛋白质中。O-tRNA的反密码子环识别mRNA上的选择者密码子并在多肽的此位点掺入其氨基酸，例如炔基氨基酸。本发明的正交氨酰tRNA合成酶只用一种特定的炔基氨基酸优先氨酰化其O-tRNA(或使之负载)。

例如，如本文所述，可响应于选择者密码子，例如TAG密码子将炔基氨基酸对炔丙基氧苯丙氨酸(pPRO-Phe；见图1A，结构1)选择性且有效地掺入真细菌(大肠杆菌)的蛋白质，所述氨基酸可被靶向以进行高度选择性的修饰。掺入蛋白质后，在细胞内可化学靶向pPRO-Phe，例如可用含有叠氮基的染料靶向修饰。染料分子上的叠氮基能与炔基氨基酸反应，并能以高度选择性方式靶向该蛋白进行染料标记。

能将炔基氨基酸位点特异地掺入蛋白质有助于研究蛋白质以及能工程改造蛋白质使之具有新特性。例如，表达含炔基的蛋白质有助于通过特异性标记研究蛋白质，改变酶的催化功能，使蛋白与其它蛋白、小分子和生物分子交联等。

正交tRNA/正交氨酰-tRNA合成酶及其配对

适用于制备包含一个或多个非天然氨基酸的蛋白质的翻译系统描述于，例如名为“产生正交tRNA-氨酰基-tRNA合成酶配对物的方法与组合物”(Methods andcomposition for the-production of orthogonal tRNA-aminoacyl-tRNA synthetase pairs)的国际公布号WO 2002/086075和名为“非天然氨基酸的体内掺入”(In vivoincorporation of unnatural amino acids)的WO 2002/085923；名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的国际公布号WO2004/094593；2004年7月7日提交的WO 2005/019415；2004年7月7日提交的WO 2005/007870与2004年7月7日提交的WO 2005/007624。这些申请的每篇均全文纳入本文作为参考。这种翻译系统通常包括含有正交tRNA(O-tRNA)、正交氨酰tRNA-合成酶(O-RS)和非天然氨基酸(在本发明中是炔基氨基酸)的细胞(可以是非真核细胞，例如大肠杆菌；或真核细胞，例如酵母菌)，其中O-RS用炔基氨基酸氨酰化O-tRNA。本发明的正交配对包括O-tRNA(例如抑制型tRNA、移码tRNA等)和O-RS。本发明还提供单独的各组分。

总体上，当正交配对识别选择者密码子并响应该选择者密码子加载氨基酸时，称该正交配对“抑制”了该选择者密码子。即，不为翻译系统(例如细胞的)的内源性机制所识别的选择者密码子未被正常翻译，从而阻断多肽合成，否则多肽就可以从核酸上翻译出来。与含有或由本文序列表所示多核苷酸序列编码的O-tRNA的抑制效率相比，本发明O-tRNA能识别选择者密码子，在有关联合成酶存在时，其响应选择者密码子而具有至少约，例如45％、50％、60％、75％、80％或90％或更高的抑制效率。O-RS用感兴趣的非天然氨基酸例如炔基氨基酸氨酰化O-tRNA。细胞利用O-tRNA/O-RS配对(例如)通过含有编码感兴趣多肽的多核苷酸的核酸将非天然氨基酸掺入延伸中的多肽链，其中所述多核苷酸含有所述O-tRNA能识别的选择者密码子。在某些所需方面，细胞可包含额外的O-tRNA/O-RS配对，其中所述额外的O-RS将不同的非天然氨基酸加载于所述额外的O-tRNA上。例如，其中的一个O-tRNA能识别四碱基密码子，另一个能识别终止密码子。或者，多个不同的终止密码子或多个不同的四碱基密码子能特异性识别不同的选择者密码子。

在本发明的某些实施方案中，细胞，例如大肠杆菌细胞包含正交tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、炔基氨基酸和含有编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸含有O-tRNA可识别的选择者密码子。翻译系统也可以是无细胞的系统，例如联用本文所述O-tRNA/O-RS配对和非天然氨基酸以及各种商业可购得的“体外”转录/翻译系统。

在一个实施方案中，O-RS和O-tRNA联用的抑制效率比缺乏O-RS的O-tRNA的抑制效率高约例如5倍、10倍、15倍、20倍或25倍或更高。一方面，O-RS和O-tRNA联用的抑制效率至少是本文序列表所列正交合成酶配对的抑制效率的约例如35％、40％、45％、50％、60％、75％、80％或90％或更高。

应注意，本发明任选在细胞或其它翻译系统中包含多对O-tRNA/O-RS配对，从而可掺入多种非天然氨基酸，例如炔基氨基酸和另一非天然氨基酸。例如，细胞还可额外包含一对不同的O-tRNA/O-RS配对和第二种非天然氨基酸，其中该额外的O-tRNA识别第二选择者密码子，该额外的O-RS用第二非天然氨基酸优先氨酰化O-tRNA。例如，包含O-tRNA/O-RS配对(其中，O-tRNA识别例如琥珀选择密码子)的细胞还可含有第二正交配对，例如亮氨酰、赖氨酰、谷氨酰(RNA/RS配对)等，其中所述第二O-tRNA识别不同的选择密码子，如乳白密码子、四碱基密码子等。不同的正交配对宜衍生自不同来源，这有助于识别不同的选择者密码子。

O-tRNA和/或O-RS可以是天然产生的或可以，例如通过产生各种生物的tRNA文库和/或RS文库和/或通过采用各种可用的突变方法来突变天然产生的tRNA和/或RS来获得。例如，产生正交tRNA/氨酰-tRNA合成酶配对的方案之一包括将例如除宿主细胞以外来源或多种来源的异源(对宿主细胞而言)tRNA/合成酶配对递送入宿主细胞。候选异源合成酶的特性包括例如不加载任何宿主细胞tRNA，候选异源tRNA的特性包括例如不被任何宿主细胞合成酶氨酰化。此外，异源tRNA对所有宿主细胞合成酶是正交的。

产生正交配对的第二方案包括产生突变体文库，从中筛选和/或选择O-tRNA或O-RS。也可联用这些方案。

正交tRNA(O-tRNA)

本发明正交tRNA(O-tRNA)宜，例如在体外或体内，介导将非天然氨基酸例如炔基氨基酸掺入由含有O-tRNA能识别的选择密码子的多核苷酸所编码的蛋白质。在某些实施方案中，与含有或由本文序列表的O-tRNA序列中所示多核苷酸序列编码的O-tRNA相比，在关联合成酶存在下，本发明O-tRNA响应选择者密码子具有至少约例如45％、50％、60％、75％、80％或90％或更高的抑制效率。

可通过本领域已知的任何试验测定抑制效率。例如，可采用β-半乳糖苷酶报道试验，如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)连同含有本发明O-tRNA的质粒引入合适生物(例如可用正交组分的生物)的细胞。还可引入关联合成酶(以多肽或表达时能编码该关联合成酶的多核苷酸的形式)。使细胞在培养基中生长至所需密度，例如至OD₆₀₀约为0.5，(例如)用BetaFluor^TMβ-半乳糖苷酶试验试剂盒(Novagen)进行β-半乳糖苷酶试验。可将抑制百分比计算为样品活性相对于可比较对照(例如，衍生的lacZ构建物的观测值)的百分比，该衍生的lacZ构建物在所需位置具有相应的有义密码子而非选择密码子。

本发明O-tRNA的例子见本文的序列表。示范性O-tRNA和O-RS分子的序列也可参见本文的表、实施例和附图。也可参见本文中名为“核酸和多肽序列及变体”的章节。在RNA分子(例如O-RS mRNA或O-tRNA分子)中，与给定的序列(或对编码DNA而言反之亦然)或其互补序列相比，胸腺嘧啶(T)被尿嘧啶(U)取代。还可存在对碱基的其它修饰。

本发明也包括对应于本文具体O-tRNA的O-tRNA保守性变体。例如，O-tRNA保守性变体包括：功能与具体(例如本文序列表中的)O-tRNA相似，由于合适的自身互补性而保留了tRNA的L-形结构但不具有与例如本文序列表、附图或实施例所示那些(序列)相同的序列(并且，最好也不是野生型tRNA分子)的那些分子。也可参见本文中名为“核酸和多肽序列及变体”的章节。

含有O-tRNA的组合物还可包含正交氨酰-tRNA合成酶(O-RS)，其中所述O-RS用非天然氨基酸例如炔基氨基酸优先氨酰化O-tRNA。在某些实施方案中，含有O-tRNA的组合物还可包含(例如体外或体内)翻译系统。细胞中也可存在含有编码感兴趣多肽的多核苷酸的核酸或这些的一个或多个的组合，所述多核苷酸含有O-tRNA能识别的选择者密码子。也可参见本文中名为“正交氨酰-tRNA合成酶”的章节。

产生正交tRNA(O-tRNA)的方法也是本发明的特征。用该方法产生的O-tRNA也是本发明的特征。在本发明的某些实施方案中，可通过构建突变体文库来产生O-tRNA。突变体tRNA文库可用本领域已知的各种诱变技术构建。例如，突变体tRNA可通过位点特异性突变、随机位点突变、同源重组、DNA改组或其它递归诱变(recursive mutagenesis)方法、嵌合体构建、或者联用这些技术来产生。

也可将其他的突变引入特定位置，例如tRNA的所需环或区域中的非保守位置、保守位置、随机位置或者二者的组合位置，如反密码子环、接纳茎、D臂或环、可变环、TPC臂或环、tRNA分子的其他区域或其组合。tRNA分子中的突变通常包括使突变型tRNA文库内各成员的反密码子环突变以使其能识别选择者密码子。该方法还可包括将一个额外的序列(CCA)加到O-tRNA的末端。与起始材料(例如多种tRNA序列)相比，O-tRNA通常提高了对所需生物的正交性，同时保留其对所需RS的亲和力。

本发明方法任选包括分析tRNA和/或氨酰-tRNA合成酶序列的相似性(和/或所推断的同源性)以确定显示与特定生物正交的潜在候选O-tRNA、O-RS和/或其配对。可利用本领域已知和本文所述的计算机程序进行这种分析，例如可用BLAST和pileup程序。在一个实施例中，为了筛选用于大肠杆菌的可能的正交翻译组分，可选择不显示与真细菌生物有接近的序列同源性的合成酶和/或tRNA。

通常可通过，例如负选择第一物种的细胞群来获得O-tRNA，所述细胞含有多种潜在O-tRNA的成员。负选择可去除含有可被细胞内源性氨酰-tRNA合成酶(RS)氨酰化的潜在O-tRNA文库成员的细胞。这样就可以得到与第一物种细胞正交的tRNA库。

某些实施方案在负选择中将选择者密码子引入编码负选择标记(例如能赋予抗生素抗性的酶如β内酰胺酶；能得到可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶(CAT)，所述产物例如是毒性产物，如芽孢杆菌RNA酶)的多核苷酸的非必须位置(例如，仍能产生功能性芽孢杆菌RNA酶)等。还任选在有选择性试剂(比如抗生素，如氨苄青霉素)存在的培养基中培养细胞群来进行筛选/选择。在一个实施方案中，选择性试剂的浓度不同。

例如，为测定抑制型tRNA的活性，可利用以选择者密码子的体内抑制为基础的选择系统，例如将无义或移码突变引入编码负性选择标记的多核苷酸(如编码β半乳糖苷酶的基因(bla))中。例如，构建在某位置(如，A184)含有选择者密码子的多核苷酸变体，如bla变体。用这些多核苷酸转化细胞，如细菌。以不能被内源性大肠杆菌合成酶有效加载的正交tRNA为例，抗生素抗性，例如氨苄青霉素抗性应约为或小于未用质粒转化的细菌。如果tRNA不是正交的，或者能加载tRNA的异源合成酶在此系统内共表达，应可观察到更高水平的抗生素(如氨苄青霉素)抗性。选出那些不能在抗生素浓度约等于未用质粒转化的细胞的LB琼脂平板上生长的细胞，如细菌。

以毒性产物(如RNA酶或芽孢杆菌RNA酶)为例，当多种候选tRNA的成员被内源性宿主(如大肠杆菌)合成酶氨酰化时(即不与宿主如大肠杆菌合成酶正交)，选择者密码子被抑制，所产生的毒性多核苷酸产物可导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞可存活。

然后，在一个实施方案中，对与所需生物正交的tRNA库进行正选择，其中将选择者密码子置于正选择标记中(例如抗药性基因(如β内酰胺酶基因)编码的标记)。在含有编码或包含与细胞正交的tRNA库某成员的多核苷酸、编码正选择标记的多核苷酸和编码关联RS的多核苷酸的细胞内进行正选择。在某些实施方案中，第二群细胞含有不能通过负选择除去的细胞。该多核苷酸在胞内表达，细胞在有选择试剂(如氨苄青霉素)的培养基内生长。然后选择能被共表达的关联合成酶氨酰化以及响应此选择者密码子而掺入氨基酸的tRNA。与含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比，这些细胞通常显示抑制效率升高。含有非功能性的tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞对该抗生素敏感。因此在两次选择中能保留下的tRNA是：(i)不是内源性宿主(如大肠杆菌)合成酶的底物；(ii)能被感兴趣合成酶氨酰化；以及(iii)能在翻译过程中发挥作用。

因此，取决于所筛选的环境，同一标记可以是正或负标记。即，如果为了筛选该标记，则它是正标记，但如果为了抵御该标记而筛选则它是负标记。

上述方法中，筛选，如正选择、负选择或者正负选择的严格性任选包括改变选择的严格性。例如，由于芽孢杆菌RNA酶是毒性极高的蛋白质，可通过将不同数目的选择者密码子引入到芽孢杆菌RNA酶基因内和/或通过使用可诱导启动子来控制负选择的严格性。在另一个实施例中，选择或筛选试剂的浓度(如氨苄青霉素的浓度)可以不同。在本发明的一个方面，因为在前几轮中所需活性较低，严格性可不同。因此，前几轮适用较低的严格性标准，而后几轮选择适用更严谨的标准。在某些实施方案中，负选择、正选择或者正负选择可重复多次。也可以使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方案中，正选择标记和负选择标记可以相同。

其他类型的选择/筛选方法也可用于本发明以制备正交的翻译组分，如O-tRNA、O-RS和能响应选择者密码子而加载非天然氨基酸如炔基氨基酸的O-tRNA/O-RS对。例如，负选择标记、正选择标记或正负选择标记可包括发荧光或在合适反应物存在下能催化发光反应的标记。在另一个实施方案中，标记的产物可通过荧光激活细胞分选(FACS)或发光检测。标记任选可包括亲和选择标记。也参见Francisco，J.A.等，(1993)，“在外表面表达功能性抗体片段的大肠杆菌的制备与荧光激活细胞分选”(Production and，florescence-activated cell sorting ofEscherichia coli expressing a functional antibody fragement on the external surface)，Proc Natl Acad Sci USA.，90：10444-8。

制备重组正交tRNA的其它方法见名为“制备正交tRNA-氨酰-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITIONS FOR THEPRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASEPAIRS)的国际专利公布WO 2002/086075；名为题为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO 2004/094593；与2004年7月7日提交的WO 2005/019415。也参见Forster等，(2003)，“通过翻译从头设计的遗传密码来编程肽模拟合成酶”(Programming peptidomimeticsynthetases by translating genetic codes designed de novo)，PNAS，100(11)：6353-6357；和Feng等，(2003)，“通过单氨基酸改变扩大tRNA合成酶的tRNA识别”(Expanding tRNA recognition of a tRNA synthetase by a single amino acidchange)，PNAS，100(10)：5676-5681。

正交氨酰-tRNA合成酶(O-RS)

本发明O-RS在体外或体内用非天然氨基酸例如炔基氨基酸(如对炔丙基氧苯丙氨酸)优先氨酰化O-tRNA。可通过含有O-RS的多肽和/或编码O-RS或其一部分的多核苷酸将本发明的O-RS提供给翻译系统，例如细胞。例如，一例O-RS含有本文序列表和实施例所示的氨基酸序列或其保守性变体。在另一实施例中，编码含有本文序列表或实施例中序列的氨基酸(序列)的多核苷酸序列或其互补多核苷酸序列编码O-RS或其一部分。也可参见本文中名为“核酸和多肽序列及变体”的章节。

鉴定可与O-tRNA联用的正交氨酰-tRNA合成酶(O-RS)的方法也是本发明的特征。例如，该方法包括选择(如正选择)第一物种的细胞群，其中所述细胞各自含有：1)多种氨酰-tRNA合成酶(RS)的成员之一(例如，所述多种RS可包括突变型RS、衍生自第一物种之外物种的RS，或二者)；2)正交tRNA(O-tRNA)(例如，一个或多个物种的)；以及3)编码选择(例如正选择)标记并含有至少一个选择者密码子的多核苷酸。与缺乏所述多种RS的成员或成员数目少的细胞相比，那些显示抑制效率升高的细胞被选择或筛选出来。可用本领域已知和本文所述方法测定抑制效率。抑制效率升高的细胞包含能氨酰化O-tRNA的活性RS。将第一物种的第一组tRNA被活性RS氨酰化的水平(体外或体内)与第二物种的第二组tRNA被活性RS氨酰化的水平作比较。通过可检测底物(例如，标记的氨基酸或非天然氨基酸，如，标记的对炔丙基氧苯丙氨酸)测定氨酰化水平。通常选择与第一组tRNA相比更有效地氨酰化第二组tRNA的活性RS，从而获得能与O-tRNA联用的有效(优化)的正交氨酰-tRNA合成酶。采用这种方法鉴定的O-RS也是本发明的特征。

可用许多试验来测定氨酰化。这些试验可在体外或体内进行。例如，体外氨酰化试验可见例如Hoben和Soll，(1985)，Methods Enzymol.，113：55-59。也可联用报道物质和正交翻译组分并检测细胞中的报道物质来测定氨酰化，所述细胞表达含有至少一个选择者密码子并编码蛋白质的多核苷酸。也参见名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS)的WO 2002/085923和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO 2004/094593。

还可进一步改变所鉴定的O-RS底物特异性，这可使O-tRNA只带上所需的非天然氨基酸，例如炔基氨基酸，而不是常见20种氨基酸中的任一种。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA-合成酶的方法包括，例如通过组合合成酶不同的结构域而在合成酶的活性位点、在合成酶的编辑机理位点、在不同的位点使之突变等，并应用选择方法。也可以采用先正选择再负选择的方案。在正选择中，抑制引入阳性标记非重要位置的选择者密码子使得细胞在正选择压力下存活。在同时有天然和非天然氨基酸存在时，如此存活的细胞编码使正交抑制型tRNA带有天然或非天然氨基酸的活性合成酶。在负选择中，抑制引入阴性标记的非重要位置的选择者密码子使合成酶失去天然氨基酸特异性。正和负选择的存活细胞编码只用非天然氨基酸氨酰化(加载)正交抑制型tRNA的合成酶。然后通过例如DNA改组或其它递归诱变方法进一步诱变这些合成酶。

可采用本领域已知的各种诱变技术产生突变型O-RS文库。例如，可用位点特异性突变、随机点突变、同源重组、DNA改组或其它递归诱变方法，嵌合构建或它们的组合来产生突变型RS。例如，可从两种或更多种其它如较小、多样性较低的“亚文库”来产生突变型RS文库。本发明也包括RS的嵌合文库。应注意，可以构建多种生物(例如微生物，如真细菌和古细菌)的tRNA合成酶文库，例如具有天然多样性的文库(参见，例如授予Short等的美国专利号6,238,884；授予Schallenberger等的美国专利号5,756,316；授予Petersen等的美国专利号5,783,431；授予Thompson等的美国专利号5,824,485；授予Short等的美国专利号5,958,672)，并任选构建和筛选正交配对。

一旦合成酶经过正和负选择/筛选方法后，就可进一步诱变这些合成酶。例如可分离编码O-RS的核酸；从该核酸制备编码突变的O-RS的一组多核苷酸(例如通过随机诱变、位点特异性诱变、重组或它们的任何组合)；和可重复各步骤或各步骤的组合直至获得用非天然氨基酸例如炔基氨基酸优先氨酰化O-tRNA的突变O-RS。在本发明的一方面，这些步骤可进行多次，例如至少两次。

本发明方法也可采用其它水平的选择/筛选严格性来产生O-tRNA、O-RS或其配对。可改变O-RS产生方法中一个或两个步骤的选择或筛选严格性。这包括，例如，改变选择/筛选试剂的用量等。也可额外进行几轮正和/或负选择。选择或筛选也可包括以下一种或多种改变：氨基酸渗透性、翻译效率、翻译保真度(translational fidelity)等。一种或多种改变通常是以用正交tRNA-tRNA合成酶配对来产生蛋白质的生物中一种或多种基因突变为基础。

产生O-RS并改变合成酶底物特异性的其它通用细节见名为“产生正交tRNA-氨酰基tRNA合成酶配对物的方法和组合物”(METHODS ANDCOMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNAAMINOACYL-tRNA SYNTHETASE PAIRS)的WO 2002/086075和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO 2004/094593。

来源和宿主生物

本发明正交翻译组分(O-tRNA和O-RS)可衍生自任何生物(或生物的组合)从而可用于任何其它物种的宿主翻译系统，只要所述O-tRNA/O-RS组分与宿主系统以正交方式工作。所述O-tRNA和所述O-RS无需衍生自同一生物。在一方面，正交组分衍生自用于真细菌宿主系统的古菌(即，古细菌)基因。

例如，正交O-tRNA可衍生自古菌生物，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、Pyrococcus horikoshii、Aeuropyrum pernix、海沼甲烷球菌、Methanopyrus kandleri、梅氏甲烷八叠球菌(Mm)、Pyrobaculum aerophilum、Pyrococcusa adyssi、硫磺矿硫化叶菌(Ss)、Sulfolobus tokodaii、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等；而正交O-RS可衍生自以下生物(或生物的组合)，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、Pyrococcus horikoshii、Aeuropyrum pernix、海沼甲烷球菌、Methanopyrus kandleri、梅氏甲烷八叠球菌、Pyrobaculum aerophilum、Pyrococcusabyssi、硫磺矿硫化叶菌、Sulfolobus tokodaii、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等。在一个实施方案中，真核生物来源，例如植物、藻类、原生动物、真菌、酵母菌、动物(例如哺乳动物、昆虫、节肢动物等)等也可用作O-tRNA和O-RS的来源。

O-tRNA/O-RS配对的各组分可衍生自同一生物或不同生物。在一个实施方案中，O-tRNA/O-RS配对可来自同一生物。或者，O-tRNA/O-RS配对的O-tRNA和O-RS可来自不同生物。

O-tRNA、O-RS或O-tRNA/O-RS配对可在体外或体内选择或筛选和/或可用于细胞，例如真细菌细胞中来产生含有炔基氨基酸的多肽。所述真细菌细胞例如但不限于大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等。含本发明翻译组分的真细菌细胞的组合物也是本发明特征之一。

为在一种生物中筛选O-tRNA和/或O-RS用于另一种生物，也可参见2004年4月16日提交的名为“扩展真核生物遗传密码”(EXPANDING THEEUKARYOTIC GENETIC CODE)的国际申请公布号WO 2004/094593。

选择者密码子

本发明的选择者密码子扩大了蛋白质生物合成机理的遗传密码子框架。例如，选择者密码子包括，独特的三碱基密码子、无义密码子(如终止密码子(如琥珀密码子(UAG)或乳白密码子(UGA)))、非天然密码子、至少四碱基的密码子、罕用密码子等。可将许多选择者密码子引入所需基因，例如一个以上、两个以上、三个以上等。通过用不同的选择者密码子，可采用多对正交tRNA/合成酶配对，从而能利用这些不同的选择者密码子同时位点特异性地掺入多种不同的非天然氨基酸，例如含有至少一个炔基氨基酸。

在一个实施方案中，这些方法包括，例如在体内即细胞中，用作为终止密码子的选择者密码子掺入炔基氨基酸。例如，制备能识别终止密码子的O-tRNA，该O-tRNA被O-RS用炔基氨基酸氨酰化。天然产生的宿主的氨酰-tRNA合成酶不识别该O-tRNA。可采用常规的定点诱变将终止密码子引入编码感兴趣多肽的多核苷酸中感兴趣的位点。参见，例如Sayers，J.R.等，(1988)，“硫代磷酸酯寡核苷酸定向诱变中的5’，3’核酸外切酶”(5′，3′Exonuclease inphosphorothioate-based oligonucleotide-directed mutagenesis)，Nucleic AcidsRes，791-802。当例如在体内联用O-RS、O-tRNA和编码感兴趣多肽的核酸时，可响应选择密码子而掺入炔基氨基酸，从而获得在特定位点含有炔基氨基酸的多肽。在本发明的一个实施方案中，用作选择者密码子的终止密码子是琥珀密码子UAG和/或乳白密码子UGA。在一实施例中，UAG和UGA都用作选择者密码子的遗传密码可编码22个氨基酸，同时保留作为最丰富的终止信号的赭石无义密码子，UAA。

体内掺入炔基氨基酸不会对宿主细胞有显著影响。例如，在非真核细胞，如大肠杆菌中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)与释放因子1(RF1)(其可结合UAG密码子，而引起延伸中的肽链从核糖体释放)之间的竞争，因此可通过提高O-tRNA(如抑制型tRNA)的表达水平，或利用RF1缺陷型菌株来调节抑制效率。在真核细胞中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)和真核释放因子(如eRF)(其可结合终止密码子从而引起延伸中的肽链从核糖体释放)之间的竞争，因此可通过提高O-tRNA(如抑制型tRNA)的表达水平来调节抑制效率。此外，也可存在其它化合物，例如还原剂，如二硫苏糖醇(DTT)。

炔基氨基酸也可以由罕有密码子编码。例如，当体外蛋白合成反应中的精氨酸浓度下降时，证实罕有的精氨酸密码子AGG可通过用丙氨酸酰化的合成tRNA有效地将丙氨酸掺入多肽链中。见Ma等，Biochemistry，32：7939(1993)。在这种情况中，合成的tRNA可与大肠杆菌中作为次要成分存在的天然产生的tRNAArg竞争。此外，某些生物不能利用所有的三联密码子。藤黄微球菌(Micrococcus luteus)的未指定密码子AGA可用于在体外将氨基酸插入转录/翻译提取物中。见Kowal和Oliver，Nucl.Acid.Res.，25：4685(1997)。可在体内利用这些罕有密码子产生本发明的各组分。

选择者密码子也可包括延伸密码子，例如四个或四个以上碱基的密码子，如四个、五个、六个或更多碱基的密码子。四碱基密码子的例子包括，例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子包括，例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明方法可包括使用基于移码抑制的延伸密码予。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸例如炔基氨基酸插入同一蛋白质。在其它实施方案中，反密码子环可解码例如至少一种四碱基密码子、至少一种五碱基密码子或至少一种六碱基密码子或更多。由于有256种可能的四碱基密码子，所以同一细胞中可用四个或四个以上碱基的密码子编码多种非天然氨基酸。也可参见，Anderson等，(2002)，“密码子和反密码子大小极限的研究”(Exploring the Limits of Codonand Anticodon Size)，Chemistry and Biology，9：237-244和Magliery，(2001)，“扩增遗传密码：在大肠杆菌中选择有效的四碱基密码子抑制剂并用文库方法鉴定“变化的”四碱基密码子”(Expanding the Genetic Code：Selection of EfficientSuppressors of Four-base Codons and Identification of″Shifty″Four-base Codonswith a Library Approach in Escherichia coli)，J.Mol.Biol.，307：755-769。

例如，已采用体外生物合成方法利用四碱基密码子将非天然氨基酸掺入蛋白质。参见，例如Ma等，(1993)，Biochemistry，32：7939和Hohsaka等，(1999)，J.Am.Chem.Soc.，121：34。利用CGGG和AGGU及两种化学酰化的移码抑制型tRNA在体外将2-萘基丙氨酸和赖氨酸的NBD衍生物掺入链霉亲和素。参见，例如Hohsaka等，(1999)，J.Am.Chem.Soc.，121：12194。在体内研究中，Moore等检测了含NCUA反密码子的tRNA^Leu衍生物抑制UAGN密码子(N可以是U、A、G或C)的能力，发现含UCUA反密码子的tRNALeu解码四联UAGA的效率为13到26％，而在0或-1读框中几乎不解码。参见Moore等，(2000)，J.Mol.Biol.，298：195。在一个实施方案中，本发明可利用基于罕用密码子或无义密码子的延伸密码子，它们能降低在其它非期望位点的错义连读(missensereadthrough)和移码抑制。

对于给定系统，选择者密码子也可包括天然三联密码子中内源性系统不用(或很少用)的那个密码子。例如，这包括缺乏能识别天然三碱基密码子的tRNA的系统，和/或所述三碱基密码子是罕用密码子的系统。

选择者密码子可以包含非天然碱基对。这些非天然碱基对进一步扩大了现有的遗传字符集(genetic alphabet)。一种额外的碱基对可将三联密码子的数目从64增加至125。第三碱基对的性质包括：稳定和选择性的碱基配对，通过聚合酶以有效的酶促方式高保真地掺入DNA，新生非天然碱基对合成后引物继续有效延伸。对适用于这些方法和组合物的非天然碱基对的描述于：例如Hirao等，(2002)，“将氨基酸类似物掺入蛋白质的非天然碱基对”(An unnatural base pairfor incorporating amino acid analogues into protein)，Nature Biotechnology，20：177-182。也可参见Wu，Y.等，(2002)，J.Am.Chem.Soc.，124：14626-14630。下文列出了其它的相关出版物。

对于体内使用，非天然核苷是膜可渗透的，并可磷酸化形成相应的磷酸三酯。此外，增加的遗传信息稳定且不为细胞酶所破坏。Benner与他人以前的工作利用了不同于经典Watson-Crick配对的氢键模式，其中最值得注意的例子是异-C：异-G配对(iso-C：iso-G pair)。参见，例如Switzer等，(1989)，J.Am.Chem.Soc.，111：8322；Piccirilli等，(1990)，Nature，343：33；Kool，(2000)，Curr.Opin.Chem.Biol.，4：602。这些碱基通常上与天然碱基有一定程度的错配，因而不能酶促复制。Kool等证实，碱基间的疏水包装相互作用可替代氢键来驱动碱基对形成。参见Kool，(2000)，Curr.Opin.Chem.Biol.，4：602；Guckian和Kool，(1998)，Angew.Chem.hit.Ed.Engl.，36：2825。在致力于开发符合以上所有要求的非天然碱基对的过程中，Schultz、Romesberg等已系统地合成并研究了一系列非天然疏水碱基。发现PICS:PICS自身配对比天然碱基对更稳定，可用大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地掺入DNA。参见，例如McMinn等，(1999)，J.Am.Chem.Soc.，121：11586；和Ogawa等，(2000)，J.Am.Chem.Soc.，122：3274。就生物学功能而言，KF能以足够的效率和选择性合成3MN:3MN自身配对。参见，例如Ogawa等，(2000)，J.Am.Chem.Soc.，122：8803。然而，这两种碱基均起到阻止进一步复制的链终止子的作用。近来开发了可用于复制PICS自身配对的突变型DNA聚合酶。此外，7AI自身配对可复制。参见，例如Tae等，(2001)，J.Am.Chem.Soc.，123：7439。已开发了与Cu(II)结合后可形成稳定配对的金属碱基(metallobase)对Dipis：Py。参见，Meggers等，(2000)，J.Am.Chem.Soc.，122：10714。因为延伸密码子和非天然密码子在本质上与天然密码子正交，所以本发明方法可利用该特性产生它们的正交tRNA。

也可采用翻译绕行系统将炔基氨基酸掺入所需多肽。在一翻译绕行系统中，将大序列插入基因，但该大序列不翻译成蛋白质。该序列包含用作诱导核糖体跳过该序列并继续翻译该插入物下游序列的指示结构。

非天然氨基酸

本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种遗传编码的α-氨基酸以外的任何氨基酸、修饰的氨基酸或氨基酸类似物：丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸。α-氨基酸的通用结构如式I所示：

非天然氨基酸一般具有任何式I所示结构，其中R基团是除20种天然氨基酸中所用以外的任何取代基。20种天然氨基酸的结构可参见，例如《生物化学》(Biochemistry)，L.Stryer编，第三版，1988，Freeman and Company，纽约。注意，本发明的非天然氨基酸可以是除以上20种α-氨基酸以外的天然产生的化合物。

由于本发明的非天然氨基酸与天然氨基酸通常区别在侧链，所以非天然氨基酸与其它氨基酸(例如天然或非天然的)形成酰胺键的方式与天然蛋白质中酰胺键的形成方式相同。然而，非天然氨基酸的侧链不同于天然氨基酸的侧链。

本文特别感兴趣的是含有反应性炔基的非天然氨基酸，例如含有能与叠氮基特异且区域选择性地反应的炔基部分的非天然氨基酸。例如，在炔基氨基酸中，式I中的R包括任何含炔的结构。例如，对炔丙基氧苯丙氨酸(缩写为pPRO-Phe；参见图1A)是本发明可用的所需非天然炔基氨基酸。本发明不限于联用pPRO-Phe与正交翻译组分。例如，(本发明)考虑了各种其它炔基氨基酸(参见图8A和8B)，包括但不限于，如：

2-氨基-4-戊炔酸

2-氨基-3-(4-乙炔基苯基)丙酸

2-氨基-3-[4-(丙-2-炔基)苯基]丙酸

2-氨基-3-(丙-2-炔基氧)丙酸

2-氨基-3-(丙-2-炔基硫)丙酸

3-[(丙-2-炔基氧)羰基]-2-氨基丙酸

4-[(丙-2-炔基氧)羰基]-2-氨基丁酸

在其他的非天然氨基酸中，例如式I中的R可任选含有烷基-、芳基-、酰基-、肼、氰基-、卤代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦酰基、膦、烯酮、亚胺、酯、羟胺、胺等，或上述基团的任何组合。感兴趣的其它非天然氨基酸包括但不限于：含光可活化交联剂的氨基酸、自旋-标记氨基酸、荧光氨基酸、金属结合氨基酸、含金属的氨基酸、放射性氨基酸、含有新官能团的氨基酸、能与其它分子共价或非共价结合的氨基酸、光陷入(photocaged)和/或可光促异构(photoisomerizable)的氨基酸、含生物素或生物素类似物的氨基酸、含酮基氨基酸、糖基化氨基酸、侧链连有糖部分的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学方法可裂解或光可切割的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如聚醚或长链烃，如超过约5个、约10个碳原子等)、含碳连接糖的氨基酸、含氨基硫代酸的氨基酸以及含一个或多个毒性结构部分的氨基酸。

本发明另一方面提供具有下式IV所示通式的炔基氨基酸：

具有此结构的炔基氨基酸通常可以是任何结构，其中R₁是20种天然氨基酸之一所用的取代基，R₂是炔基取代基。因此，此类炔基氨基酸可视作天然氨基酸衍生物。

如上所述，本发明不限于利用非天然氨基酸对炔丙基氧苯丙氨酸(pPRO-Phe)。实际上可用于真细菌中本发明正交翻译系统的任何炔基氨基酸属于本发明的范围。已知各种其它炔基氨基酸，例如图8所示的炔基氨基酸。由于一些所述炔基氨基酸结构极其类似于pPRO-Phe，考虑可利用本文提供的正交tRNA和氨酰-tRNA合成酶组分(例如SEQ ID NO：1所示的O-tRNA和SEQ IDNO：4、6、8、10、12、14、16、18所示的O-RS或其保守变体)将一些所述氨基酸掺入真细菌的蛋白质。因此，本发明也提供掺入除pPRO-Phe以外的其它炔基氨基酸的方法。无论表4所提供的正交组分(见实施例9)是否能掺入除pPRO-Phe以外的炔基氨基酸，本文内容为构建能掺入所述其它炔基氨基酸的正交tRNA组分提供了充足的指导，此外那些正交组分也属于本发明的范围。

除了含有新侧链，例如炔基的非天然氨基酸以外，非天然炔基氨基酸也可任选含有修饰的骨架结构，例如式II和III所示结构：

其中，Z一般包括OH、NH₂、SH、NH-R′或S-R′；X和Y可以相同或不同，一般包括S或O；R和R′任选相同或不同，一般选自式I所示非天然氨基酸中上述R基团的同一取代基清单以及氢。例如，本发明的非天然氨基酸任选在式II和III所示氨基或羧基中可包含取代。此类非天然氨基酸包括但不限于：例如具有对应于20种常见天然氨基酸的侧链或非天然炔基侧链的α-羟酸、α-硫代酸、α-氨基硫代羧酸酯。此外，在α-碳处的取代任选包括L、D或α-α-双取代的氨基酸，例如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它结构替代物包括环状氨基酸，例如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物，β和γ氨基酸，如取代的β-丙氨酸和γ-氨基丁酸。

例如，许多非天然氨基酸(包括一些炔基氨基酸)以天然氨基酸，例如酪氨酸、丝氨酸、半胱氨酸、天冬氨酸、谷氨酸等为基础。例如，炔基氨基酸：

2-氨基-3-(丙-2-炔基氧)丙酸；

2-氨基-3-(丙-2-炔基硫)丙酸；

3-[(丙-2-炔基氧)羰基]-2-氨基丙酸；和

4-[(丙-2-炔基氧)羰基]-2-氨基丁酸

均可衍生自天然氨基酸。

酪氨酸类似物包括对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸，其中该取代的酪氨酸含有炔基、乙酰基、苯甲酰基、氨基、肼、羟胺、巯基、羧基、异丙基、甲基、C₆-C₂₀直链或支链烃、饱和或不饱和的烃、O-甲基、聚醚基团、硝基等。此外，也考虑多取代的芳环。本发明的谷氨酰胺类似物包括但不限于：α-羟基衍生物、γ-取代的衍生物、环形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的例子包括但不限于：对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸，其中所述取代基含有炔基、羟基、甲氧基、甲基、烯丙基、醛基、硝基、巯基或酮基等。非天然氨基酸的具体例子包括但不限于：对炔丙基氧苯丙氨酸、3，4-二羟基-L-苯丙氨酸(DHP)、3，4，6-三羟基-L-苯丙氨酸、3，4，5-三羟基-L-苯丙氨酸、4-硝基-苯丙氨酸、对乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巯基-酪氨酸、3-O-乙酰基-GlcNAcβ-丝氨酸、L-多巴(Dopa)、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘-苯丙氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸和异丙基-L-苯丙氨酸等。本文提供了各种非天然氨基酸的结构，例如见图1A、8A和8B。也参见名为“扩展真核生物遗传密码”(EXPANDINGTHE EUKARYOTIC GENETIC CODE)的公开的国际申请WO 2004/094593。

非天然氨基酸的化学合成

上述许多非天然氨基酸可商业购自，例如Sigma(USA)或Aldrich(密尔沃基，威斯康星，美国)。无法商业购得的化合物可根据各种出版物提供的或用本领域技术人员已知的方法合成。就有机合成技术而言，可参见例如《有机化学》(Organic Chemistry)，Fessendon和Fessendon，(1982，第二版，Willard Grant Press，Boston Mass.)；《高等有机化学》(Advanced Organic Chemistry)，March，(第三版，1985，Wiley and Sons，纽约)；和《高级有机化学》(Advanced OrganicChemistry)，Carey和Sundberg，(第三版，A和B部分，1990，Plenum Press，纽约)。其它描述非天然氨基酸合成的出版物包括，例如名为“非天然氨基酸的体内掺入”(In vivo incorporation of Unnatural Amino Acids)的WO 2002/085923；Matsoukas等，(1995)，J.Med.Chem.，38：4660-4669；King，F.E.和Kidd，D.A.A.，(1949)，“从邻苯二甲酰化中间体合成谷氨酰胺和谷氨酸的γ-二肽的新方法”(ANew Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from PhthylatedIntermediates)，J.Chem.Soc.，3315-3319；Friedman，O.M.和Chatterrji，R.，(1959)，“合成谷氨酰胺衍生物作为抗肿瘤药物的模型底物”(Synthesis ofDerivatives of Glutamine as Model Substrates for Anti-Tumor Agents)，J.Am.Chem.Soc.，81：3750-3752；Craig，J.C.等，(1988)，“7-氯-4[[4-(二乙氨基)-1-甲基丁基]氨基]喹啉(氯喹)的对映异构体的绝对构型”(Absolute Configuration ofthe Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine))，J.Org.Chem.，53：1167-1170；Azoulay，M.，Vilmont，M.和Frappier，F.，(1991)，“作为潜在抗疟疾药物的谷氨酰胺类似物”(Glutamine analogues as PotentialAntimalarials)，Eur.J.Med.Chem.，26：201-5；Koskinen，A.M.P.和Rapoport，H.，(1989)，“合成作为构象限制的氨基酸类似物的4-取代脯氨酸”(Synthesis of4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues)，J.Org.Chem.，54：1859-1866；Christie，B.D.和Rapoport，H.，(1985)，“从L-天冬酰胺合成光学纯的哌啶酯。应用于通过氨基酸脱羧和亚胺离子环化来全合成(+)-Apovincamine”(Synthesis of Optically Pure Pipecolates fromL-Asparagine.Application to the Total Synthesis of(+)-Apovincamine throughAmino Acid Decarbonylation and Iminium Ion Cyclization)，J.Org.Chem.，1989：1859-1866；Barton等，(1987)，“采用基团化学方法合成a-氨基酸及衍生物：合成L-和D-a-氨基-己二酸、L-a-氨基庚二酸与合适的不饱和衍生物”(Synthesisof Novel a-Amino-Acids and Derivatives Using Radical Chemistry：Synthesis of L-and D-a-Amino-Adipic Acids，L-a-aminopimelic Acid and Appropriate UnsaturatedDerivatives)，Tetrahedron Lett.，43：4297-4308；Subasinghe等，(1992)，“使君子氨酸类似物：合成β-杂环2-氨基丙酸衍生物和它们在新的使君子氨酸敏化位点的活性”(Quisqualic acid analogues：synthesis of beta-heterocyclic2-aminopropanoic acid derivatives and their activity at a novelquisqualate-sensitized site)，J.Med.Chem.，35：4602-7。也可参见2003年12月22日提交，名为“蛋白质阵列”(Protein Arrays)的国际公布号WO 2004/058946。

非天然氨基酸的细胞摄取

细胞摄取非天然氨基酸通常是设计和选择非天然氨基酸，例如用于掺入蛋白质中应考虑的问题之一。例如，α-氨基酸的高电荷密度提示这些化合物不可能透过细胞。天然氨基酸通过蛋白质转运系统的收集(在于)摄取入细胞，这些系统往往显示不同程度的氨基酸特异性。可进行快速筛选来评估哪种非天然氨基酸(如果有的话)将被细胞所摄取。参见，例如2003年12月22日提交的名为“蛋白质阵列”(Protein Arrays)的国际申请号PCT/US03/41346中的毒性试验；Liu，D.R.和Schultz，P.G.，(1999)，“含扩增遗传密码的生物演化的进展”(Progress toward the evolution of an organism with an expanded genetic code)，PNAS United States，96：4780-4785。虽然不难采用各种试验分析摄取情况，设计符合细胞摄取途径的非天然氨基酸的另一种方法是提供生物合成途径在体内产生氨基酸。

非天然氨基酸的生物合成

细胞中已有许多产生氨基酸和其它化合物的生物合成途径。尽管自然界中，例如细胞中，可能不存在特定非天然氨基酸的生物合成方法，本发明提供了这种方法。例如，通过加入新的酶或修饰现有的宿主细胞途径可以在宿主细胞中任选形成非天然氨基酸的生物合成途径。其它新的酶任选是天然产生的酶或人工获得的酶。例如，生物合成对氨基苯丙氨酸(如WO 2002/085923中的实施例所示，同上)依赖加入其它生物的已知酶的混合物。可通过用含这些酶的基因的质粒转染细胞而将这些基因引入细胞。当这些基因在细胞中表达时，它们提供了合成所需化合物的酶途径。可任选加入的酶的例子见以下实施例。其它酶序列见例如Genbank。也可以相同方式将人工开发的酶加入细胞。可以此方式操控细胞机理和资源用以产生非天然氨基酸。

实际上，可采用各种方法产生新的酶从而在体内或体外用于生物合成途径，改进现有途径，或产生非天然氨基酸。开发酶和其它生物合成途径组分的许多可用方法适用于本发明来产生非天然氨基酸(或者，实际上，用于开发合成酶使之具有新的底物特异性或其它感兴趣的活性)。例如，可以采用DNA改组来开发新的酶和/或这些酶途径从而在体外或体内产生非天然氨基酸(或产生新的酶)。参见，例如Stemmer，(1994)，“通过DNA改组在体外快速进化蛋白质”(Rapid evolution of a protein in vitro by DNA shuffling)，Nature，370(4)：389-391；Stemmer，(1994)，“通过随机断裂和装配的DNA改组：分子进化的体外重组”(DNA shuffling by random fragmentation and reassembly：In vitrorecombination for molecular evolution)，Proc.Natl.Acad.Sci.USA.，91：10747-10751。相关的方法改组关联的(例如同源性)基因家族从而快速开具有所需特性的酶。这种“家族基因改组”方法的例子见Crameri等，(1998)，“不同种类基因家族的DNA改组加速了定向进化”(DNA shuffling of a family of genesfrom diverse species accelerates directed evolution)，Nature，391(6664)：288-291。也可采用称为“产生杂交酶的递增截短”(ITCHY)的DNA重组方法来产生新的酶(无论是生物合成途径组分或合成酶)，例如Ostermeier等，(1999)，“不依赖DNA同源性的杂交酶的组合方法”(A combinatorial approach to hybrid enzymesindependent of DNA homology)，Nature Biotech，17：1205中所述。该方法也可用于产生酶或可用作一种或多种体外或体内重组方法底物的其它途径变体的文库。也可参见，Ostermeier等，(1999)，“采用递增截短的组合蛋白质工程”(Combinatorial Protein Engineering by Incremental Truncation)，Proc.Natl.Acad.Sci.USA，96：3562-67；Ostermeier等，(1999)，“作为工程改造新生物催化剂的方法的递增截短”(Incremental Truncation as a Strategy in the Engineering ofNovel Biocatalysts)，Biological and Medicinal Chemistry，7：2139-44。另一种方法采用指数集合诱变(exponential ensemble mutagenesis)来产生酶或其它途径变体的文库，从中选择催化与产生非天然氨基酸(或新合成酶)有关的生物合成反应的能力。在该方法中，平行地随机选取(randomized)感兴趣序列中的小基团残基来鉴定在各个不同位置上可导致功能性蛋白质的氨基酸。适用于本发明来产生新酶进而产生非天然氨基酸(或新的合成酶)的此类方法的例子见Delegrave和Youvan，(1993)，Biotechnology_Research，11：1548-1552。在另一方法中，可采用用掺杂或简并寡核苷酸的随机或半随机诱变来工程改造酶和/或途径成分，例如通过用如Arkin和Youvan，(1992)，“优化核苷酸混合物来编码用于半随机诱变的特定氨基酸亚组”(Optimizing nucleotide mixtures to encodespecific subsets of amino acids for semi-random mutagenesis)，Biotechnology10：297-300；或Reidhaar-Olson等，(1991)，“用寡核苷酸盒随机诱变蛋白质序列”(Random mutagenesis of protein sequences using oligonucleotide cassettes)，Methods Enzymol.，208：564-86所述的通用诱变方法。可采用用多核苷酸重装配和位点饱和诱变的另一种方法(常称为“非随机”诱变)来产生酶和/或途径组分，然后筛选它们行使一种或多种合成酶或生物合成途径功能(例如为在体内产生非天然氨基酸)的能力。参见，例如Short，“遗传疫苗和酶的非随机产生”(Non-Stochastic Generation of Genetic Vaccines and Enzymes)，WO 00/46344。

这种突变方法的替代方法包括重组生物的整个基因组并在得到的后代中选择特定的途径功能(常称为“全基因组改组”)。该方法可应用于本发明，例如通过基因组重组并选择能够产生非天然氨基酸(或其中间体)的生物(大肠杆菌或其它细胞)。例如，以下出版物所指导的方法可应用于途径设计从而改进细胞的现有和/或开发相比的新途径进而在体内产生非天然氨基酸。(参见)Patnaik等，(2002)，“乳酸杆菌基因组改组来提高酸耐受性”(Genome shuffling oflactobacillus for improved acid tolerance)，Nature B iotechnology，20(7)：707-712；和Zhang等，(2002)，“基因组改组导致细菌表型快速改善”(Genome shufflingleads to rapid phenotypic improvement in bacteria)，Nature，415：644-646。

也有许多其它用于生物和代谢途径工程改造(例如为产生所需化合物)的技术，它们也可用于产生非天然氨基酸。指导可用的路径工程改造方法的出版物的例子包括：Nakamura和White，(2003)，“微生物生产1，3丙二醇的代谢工程”(Metabolic engineering for the microbial production of 1，3 propanediol)，Curr.Opin.Biotechnol.，14(5)：454-9；Berry等，(2002)，“应用代谢工程来提高BiotechIndigo的生产和用途”(Application of Metabolic Engineering to improve both theproduction and use of Biotech Indigo)，J.Industrial Microbiology andBiotechnology，28：127-133；Banta等，(2002)，“优化人工代谢途径：工程改造用于维生素C生物合成的棒状杆菌2，5-二酮基-D-葡糖酸还原酶的辅助因子特异性”(Optimizing an artificial metabolic pathway：Engineering the cofactorspecificity of Corynebacterium 2，5-diketo-D-gluconic acid reductase for use invitamin C biosynthesis)，Biochemistry，41(20)：6226-36；Selivonova等，(2001)，“微生物中新特性的快速进化”(Rapid Evolution of Novel Traits inMicroorganisms)，Applied and Environmental Microbiology，67：3645，和许多其它出版物。

无论采用什么方法，用本发明工程改造的生物合成途径产生的非天然氨基酸的浓度应足够有效地生物合成蛋白质，例如天然细胞内的含量，但应不能达到显著影响其它细胞氨基酸或耗尽细胞资源的程度。此方式在体内所产生的一般浓度为约10mM到约0.05mM。一旦细胞被工程改造从而产生了特定途径所需的酶和非天然氨基酸，可任选采用体内选择为核糖体蛋白质合成和细胞生长而进一步优化非天然氨基酸的产生。

用于掺入对炔丙基氧苯丙氨酸(Ppro-Phe)的正交组分

本发明提供响应选择者密码子，例如琥珀终止密码子、无义密码子、四碱基或四碱基以上密码子等(例如)在体内将炔基氨基酸(例如对炔丙基氧苯丙氨酸(Ppro-Phe))掺入延伸中的多肽链的组合物和方法。例如，本发明提供正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)和它们的配对。可用这些配对将pPRO-Phe掺入延伸中的多肽链。

本发明的组合物包括正交氨酰-tRNA合成酶(O-RS)，其中所述O-RS用pPRO-Phe优先氨酰化O-tRNA。在某些实施方案中，O-RS含有包含SEQ ID NO：4、6、8、10、12、14、16或18或其保守变体的氨基酸序列。在本发明的某些实施方案中，与任何内源性tRNA相比，所述O-RS用炔基氨基酸(例如pPRO-Phe)优先氨酰化O-tRNA，其中所述O-RS偏好O-tRNA，其中带有pPRO-Phe的O-tRNA与带有pPRO-Phe的内源性tRNA的比例大于1∶1，更优选所述O-RS只加载或几乎只加载O-tRNA。

含有O-RS的组合物还可任选含有正交tRNA(O-tRNA)，所述O-tRNA能识别选择者密码子。与包含本文序列表(例如，SEQ ID NO：1)和实施例所列的多核苷酸序列或由其编码的O-tRNA相比，在有关联合成酶存在下，本发明O-tRNA响应于选择者密码子而产生的抑制效率一般至少为45％、50％、60％、75％、80％、90％或更高。在一个实施方案中，联用O-RS与O-tRNA所产生的抑制效率至少比缺少O-RS的O-tRNA所产生的抑制效率高例如5倍、10倍、15倍、20倍、25倍或更高。一方面，联用O-RS与O-tRNA所产生的抑制效率至少是衍生自詹氏甲烷球菌的正交酪氨酰-tRNA合成酶配对所产生的抑制效率的45％。

包含O-tRNA的组合物还可以包含细胞(例如真细菌细胞，如大肠杆菌等)和/或翻译系统。

本发明也提供包含翻译系统的细胞(例如真细菌细胞)，其中所述翻译系统包括正交-tRNA(O-tRNA)；正交氨酰-tRNA合成酶(O-RS)和炔基氨基酸，例如对炔丙基氧苯丙氨酸(Ppro-Phe)。通常，与任何内源性tRNA相比，所述O-RS用炔基氨基酸(例如pPRO-Phe)优先氨酰化O-tRNA，其中所述O-RS偏好O-tRNA，其中带有pPRO-Phe的O-tRNA与带有pPRO-Phe的内源性tRNA的比例大于1∶1，更优选所述O-RS只加载或几乎只加载O-tRNA。O-tRNA识别第一选择者密码子，O-RS用pPRO-Phe优先氨酰化O-tRNA。在一个实施方案中，O-tRNA含有SEQ ID NO.：1所示序列或其互补多核苷酸序列，或者由其编码。在一个实施方案中，O-RS含有SEQ ID NO：4、6、8、10、12、14、16或18中任一所示的氨基酸序列或其保守变体。

本发明细胞还可任选包含其它不同的O-tRNA/O-RS配对和第二种非天然氨基酸，例如，其中所述O-tRNA识别第二选择者密码子，所述O-RS用第二种非天然氨基酸优先氨酰化相应的O-tRNA，其中所述第二氨基酸不同于pPRO-Phe。本发明细胞任选包含含有编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸含有O-tRNA能识别的选择者密码子。

在某些实施方案中，本发明细胞是真细菌细胞，例如大肠杆菌，所述细胞中含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、炔基氨基酸(例如pPRO-Phe)和含有编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸含有O-tRNA能识别的选择者密码子。在某些实施方案中，O-RS优先氨酰化O-tRNA的效率高于O-RS氨酰化任何内源性tRNA的效率。

在本发明的某些实施方案中，本发明O-tRNA含有本文序列表(例如，SEQID NO：1)或实施例所示多核苷酸序列或其互补多核苷酸序列，或者由其编码。在本发明的某些实施方案中，O-RS含有序列表所示的氨基酸序列或其保守变体。在一个实施方案中，O-RS或其部分由编码本文序列表或实施例所示氨基酸序列的多核苷酸序列或其互补多核苷酸序列编码。

本发明O-tRNA和/或O-RS可衍生自各种生物(例如，真核和/或非真核生物)。

多核苷酸也是本发明的特征。本发明多核苷酸包括含有编码本文序列表所示多肽的核苷酸序列和/或与该多核苷酸序列互补的多核苷酸序列的人工(如人造和非天然产生的)多核苷酸。本发明多核苷酸也包括在高度严格条件下能与上述多核苷酸在基本上核酸的全长上杂交的核酸。本发明多核苷酸也包括与天然产生的tRNA或相应的编码核酸具有至少75％、80％、90％、95％、98％或更高相同性的多核苷酸(但是本发明多核苷酸不是天然产生的tRNA或相应的编码核酸)，其中所述tRNA能识别选择者密码子，如四碱基密码子。本发明多核苷酸也包括与上述任何多核苷酸序列有，例如至少80％、至少90％、至少95％、至少98％或更高相同性的人工多核苷酸序列，和/或含上述序列的保守变体的多核苷酸。

含本发明多核苷酸的载体也是本发明的特征。例如，本发明载体可以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明载体的细胞也是本发明的特征。

产生O-tRNA/O-RS配对的组分的方法也是本发明的特征。采用这些方法产生的组分也是本发明的特征。例如，至少产生一个与细胞正交的tRNA(O-tRNA)的方法包括：产生突变型tRNA文库；使所述突变型tRNA文库各成员的反密码子环突变使之能识别选择者密码子，从而形成潜在的O-tRNA文库；负选择第一物种的第一细胞群，其中所述细胞含有潜在O-tRNA文库的成员。负选择除去含有可被细胞内源性氨酰-tRNA合成酶(RS)氨酰化的潜在O-tRNA文库成员的细胞。藉此形成一个与第一物种的细胞正交的tRNA库，从而至少获得一个O-tRNA。也提供了采用本发明方法产生的O-tRNA。

在某些实施方案中，所述方法还包括正选择第一物种的第二细胞群，其中所述细胞含有与第一物种的细胞正交的tRNA库成员、关联氨酰-tRNA合成酶和正选择标记。采用正选择来选择或筛选出含有能被关联氨酰-tRNA合成酶氨酰化并且在正选择标记存在下可出现所需反应的tRNA库成员的细胞，从而获得O-tRNA。在某些实施方案中，第二细胞群含有未被负选择除去的细胞。

本发明也提供了用炔基氨基酸加载O-tRNA的正交-氨酰-tRNA合成酶的鉴定方法。例如，所述方法包括选择第一物种的细胞群，其中所述细胞各含有1)多种氨酰-tRNA合成酶(RS)的成员(如所述多种RS可包括突变型RS、衍生自第一物种以外物种的RS或者同时包括二者)；2)正交-tRNA(O-tRNA)(例如，(衍生)自一个或多个物种)；和3)编码正选择标记并包含至少一个选择者密码子的多核苷酸。

选择或筛选细胞(如宿主细胞)中显示与缺乏多种RS的成员或成员含量较低的细胞相比抑制效率升高的那些细胞。这些所选择/筛选的细胞含有能氨酰化O-tRNA的活性RS。采用这种方法鉴定的正交氨酰-tRNA合成酶也是本发明的特征。

在细胞(例如真细菌细胞，如大肠杆菌细胞等)中产生在特定位置具有对炔丙基氧苯丙氨酸(pPRO-Phe)的蛋白质的方法也是本发明的特征。例如，一种方法包括：在适当培养基内培养含有核酸的细胞，所述核酸含有至少一个选择者密码子并编码蛋白；提供pPR；和，利用所述至少一个选择者密码子在核酸翻译过程中将pPR掺入蛋白质的特定位置，从而产生所述蛋白质。细胞还含有：能在细胞内起作用并能识别选择者密码子的正交-tRNA(O-tRNA)；以及用pPRO-Phe优先氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用这种方法产生的蛋白质也是本发明的特征。

本发明也提供了包含蛋白质的组合物，所述蛋白质含有例如pPRO-Phe。在某些实施方案中，蛋白质含有的氨基酸序列与已知蛋白，如治疗性蛋白、诊断性蛋白、工业用酶的氨基酸序列或其一部分至少有75％的相同性。组合物任选包含药学上可接受的载体。

核酸和多肽序列及其变体

如上下文所述，本发明提供编码例如O-tRNA和O-RS的多核苷酸序列和多肽，例如O-RS的氨基酸序列，以及包含所述序列的组合物、系统和方法。本文也公开了所述序列的例子，如O-tRNA和O-RS的氨基酸和核苷酸序列(见表4，例如SEQ ID NO：5、7、9、11、13、15、17和19)。但是，本领域技术人员应知道本发明不局限于本文例如实施例和序列表中公开的序列。本领域技术人员应知道本发明提供了具有本文所述功能，例如编码O-tRNA或O-RS的许多相关序列。

实施例1描述了能用pPRO-Phe氨酰化O-tRNA的O-RS的构建和分析。此实施例描述了分离出的8种O-RS(参见，图3和实施例9)。如在这些氨基酸序列中所见到的，在此8种突变型O-RS中观察到氨基酸取代的部分共有趋势。在多个克隆中，结合袋(binding pocket)中发现以下氨基酸中至少两个：Ala32、Pro107/Gln107、Ala158、Ile159和Ala162/Pro162(参见，SEQ ID NO：21)。Tyr32→Ala32和Asp158→Ala158的突变可导致Tyr32、Asp158和天然底物酪氨酸之间的氢键丧失，从而不利于其结合。预计存在小的和主要是疏水的侧链促进pPRO-Phe结合。这些共有趋势可用于设计其它O-RS，预计这些O-RS能在正交系统中与真细菌宿主系统的SEQ ID NO：1所示O-tRNA起作用从而掺入pPRO-Phe。这些共有趋势表示如下：

表1

氨基酸位置	野生型詹氏甲烷球菌酪氨酰-tRNA合成酶氨基酸(SEQ ID NO：2)	正交pPRO-PheRS共有序列(SEQ ID NO：21)
氨基酸位置	野生型詹氏甲烷球菌酪氨酰-tRNA合成酶氨基酸(SEQ ID NO：2)	正交pPRO-PheRS共有序列(SEQ ID NO：21)	32	Tyr	Ala
107	Glu	Pro or Gln	32	Tyr	Ala
107	Glu	Pro or Gln	110	Leu	Leu
158	Asp	Ala	110	Leu	Leu
158	Asp	Ala	159	Ile	Ile
162	Leu	Ala or Pro	159	Ile	Ile

因此，根据这些共有趋势，可以合理地设计经实验鉴定的8种pPRO-PheRS(即，pPRO-PheRS-1到pPRO-PheRS-8)未代表的至少4种其它正交pPRO-Phe合成酶(pPRO-PheRS-con1到pPRO-PheRS-con4)。所述正交pPRO-Phe合成酶如下所示：

表2

		氨基酸位置
		氨基酸位置						SEQ ID NO：	詹氏甲烷球菌酪氨酰-tRNA合成酶种类	32	107	110	158	159	162
2	野生型	Tyr	Glu	Leu	Asp	Ile	Leu	SEQ ID NO：	詹氏甲烷球菌酪氨酰-tRNA合成酶种类	32	107	110	158	159	162
2	野生型	Tyr	Glu	Leu	Asp	Ile	Leu	21	pPRO-PheRS-共有	Ala	Pro/Gln	Leu	Ala	Ile	Ala/Pro
22	pPRO-PheRS-con1	Ala	Pro	Leu	Ala	Ile	Ala	21	pPRO-PheRS-共有	Ala	Pro/Gln	Leu	Ala	Ile	Ala/Pro
22	pPRO-PheRS-con1	Ala	Pro	Leu	Ala	Ile	Ala	23	pPRO-PheRS-con2	Ala	Pro	Leu	Ala	Ile	Pro
24	pPRO-PheRS-con3	Ala	Gln	Leu	Ala	Ile	Ala	23	pPRO-PheRS-con2	Ala	Pro	Leu	Ala	Ile	Pro
24	pPRO-PheRS-con3	Ala	Gln	Leu	Ala	Ile	Ala	25	pPRO-PheRS-con4	Ala	Gln	Leu	Ala	Ile	Pro

本发明提供了多肽(O-RS)和多核苷酸，例如O-tRNA、编码O-RS或其一部分的多核苷酸，用于分离氨酰-tRNA合成酶克隆的寡核苷酸等。本发明多核苷酸包括那些编码本发明感兴趣蛋白或多肽并含有一个或多个选择者密码子的多核苷酸。此外，本发明多核苷酸还包括，例如含有SEQ ID NO：5、7、9、11、13、15、17或19所示核苷酸序列的多核苷酸；与(所示)多核苷酸序列互补的多核苷酸或编码其多核苷酸序列的多核苷酸。本发明多核苷酸也包括编码包含SEQ ID NO：4、6、8、10、12、14、16或18的氨基酸序列的任何多核苷酸。本发明多核苷酸也包括编码本发明多肽的多核苷酸。类似地，在高严格条件下，可与上述多核苷酸在基本上全长核酸序列上杂交的人工核酸也是本发明多核苷酸。在一个实施方案中，组合物包含本发明多肽和各种赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明也提供了可与本发明多肽发生特异性免疫反应的抗体或抗血清。人工多核苷酸是人造的、不是天然产生的多核苷酸。

本发明多核苷酸也包括人工多核苷酸，这种多核苷酸与天然产生的tRNA至少有75％、80％、90％、95％、98％或更高的相同性(但不是天然产生的tRNA)。多核苷酸也包括与天然产生的tRNA有，例如至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性(但不是100％相同)的人工多核苷酸。

在某些实施方案中，载体(如质粒、粘粒、噬菌体、病毒等)含有本发明多核苷酸。在一个实施方案中，载体是表达载体。在另一实施方案中，表达载体包含与本发明一个或多个多核苷酸操作性相连的启动子。在另一实施方案中，细胞包含含有本发明多核苷酸的载体。

本领域技术人员还应知道本发明还包括所公开序列的许多变体。例如，能得到功能相同序列的所公开序列的保守变体也属于本发明。可认为核酸多核苷酸序列的变体属于本发明，其中所述变体可与至少一个公开序列杂交。通过例如标准序列比较技术测定的本文所公开序列的独特亚序列也属于本发明。

保守性变异

由于遗传密码的简并性，“沉默取代”(即，核酸序列中的取代不导致所编码多肽改变)是编码氨基酸序列的每条核酸序列所蕴含的特征。类似地，也不难鉴定氨基酸序列中有一个或少数氨基酸被具有高度相似特性的不同氨基酸取代的“保守性氨基酸取代”，因为它与具体公开的构建物高度相似。各公开序列的这种保守性变异是本发明的特征之一。

具体核酸序列的“保守性变异”指编码相同或基本相同的氨基酸序列的那些核酸，或者，如果是不编码氨基酸序列的核酸，则指基本上相同的序列。技术人员知道改变、加入或删除被编码序列中一个氨基酸或少部分氨基酸(一般低于5％、更常见低于4％、2％或1％)的各种取代、缺失或插入是“保守性修饰变异”，这些改变导致氨基酸的缺失、插入或被化学性质相似的氨基酸所取代。因此，本发明所列举多肽序列的“保守性变异”包括用同一保守性取代组的氨基酸取代该多肽序列的少部分(通常低于5％，更常见是低于2％或1％)的氨基酸。最后，插入不改变某核酸分子所编码活性的序列，例如插入无功能序列是基础核酸的保守性变异。

本领域熟知提供功能类似的氨基酸的保守性取代表，其中一个氨基酸残基被另一个具有相似化学特性(例如芳族侧链或带正电荷的侧链)的氨基酸残基取代，因此基本上不改变该多肽分子的功能特性。以下例举多组化学特性相似的天然氨基酸，其中，各组内的取代即“保守性取代”。

表3

非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链
非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链	甘氨酸丙氨酸缬氨酸亮氨酸异亮氨酸脯氨酸	丝氨酸苏氨酸半胱氨酸甲硫氨酸精氨酸谷氨酰胺	苯丙氨酸酪氨酸色氨酸	赖氨酸精氨酸组氨酸	天冬氨酸谷氨酸

核酸杂交

可采用比较杂交来鉴定本发明核酸，包括本发明核酸的保守性变异，该比较杂交方法是区别出本发明核酸的优选方法。此外，能在高度、超高度和超超高度严格条件下与SEQ ID NO：5、7、9、11、13、15、17和19所代表的核酸杂交的靶核酸是本发明特征之一。这种核酸的例子包括与某给定的核酸序列相比含有一个或少许沉默或保守性核酸取代的核酸。

当测试核酸与探针的杂交程度至少是与完美匹配的互补靶(核酸)杂交程度的50％时，可称测试核酸与探针核酸特异性杂交，即信噪比至少是该探针与靶核酸在完美匹配的探针与完美匹配的互补靶核酸结合的条件下杂交的信噪比的1/2；此该条件下，完美匹配的探针与完美匹配的互补靶核酸结合的信噪比至少是与任何不匹配靶核酸杂交所观察到的信噪比的5-10倍。

当核酸结合(一般在溶液中)时，称其“杂交”。核酸因各种已充分特征鉴定的理化力，例如氢键、溶剂排斥、碱基堆积等而杂交。核酸杂交的广泛指南见Tijssen，(1993)，《生物化学与分子生物学的实验室技术》(LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization with NucleicAcid Probes)，第一部分第二章，“杂交原理概述与核酸探针试验方法”(Overview of principles of hybridization and the strategy of nucleic acid probeassays)，(Elsevier，纽约)；以及《最新分子生物学方法》(Current Protocols in Molecular Biology)，Ausubel等编，“最新方法”(Current Protocols)，GreenePublishing Associates，Inc.和John Wiley & Sons的合资企业，(2004年增补)(“Ausubel”)；Hames和Higgins，(1995)，《基因探针1》(Gene Probes 1)，IRL出版社，牛津大学出版社，牛津，英格兰，(Hames和Higgins 1)；Hames和Higgins，(1995)，《基因探针2》(Gene Probes 2)，IRL出版社，牛津大学出版社，牛津，英格兰，(Hames和Higgins 2)提供了合成、标记、检测和定量测定DNA及RNA，包括寡核苷酸的细节。

在Southern或northern印迹滤膜上具有100个以上互补残基的互补核酸杂交的严格杂交条件的例子是：含1mg肝素的50％福尔马林，42℃杂交过夜。严格洗涤条件的例子是65℃，用0.2×SSC洗涤15分钟(SSC缓冲液的描述可参见Sambrook，同上)。通常先进行低严格洗涤除去背景信号，再进行高严格洗涤。示例性低严格洗涤是40℃，用2×SSC洗涤15分钟。具体杂交试验中信噪比是无关探针观察到的信噪比的5倍(或更高)通常表示检测到特异性杂交。

核酸杂交实验(例如，Southern和northern杂交)的“严格杂交洗涤条件”取决于序列，并随不同的环境参数而不同。核酸杂交的广泛介绍见Tijssen，(1993)，同上；Hames和Higgins，1和2。不难凭经验确定适合任何测试核酸的严格杂交和洗涤条件。例如，在确定严格杂交和洗涤条件时，可逐渐提升杂交和洗涤条件(例如，通过升高杂交或洗涤中的温度、降低杂交或洗涤中的盐浓度、增加杂交或洗涤中的洗涤剂浓度和/或增加杂交或洗涤中的有机溶剂如福尔马林的浓度)直至符合一组选定标准。例如，在高度严格杂交和洗涤条件中，逐渐提升杂交和洗涤条件直至探针与完美匹配的互补靶(核酸)结合的信噪比至少是探针与不匹配靶(核酸)杂交信噪比的5倍。

选择的“非常严格”的条件等于具体探针的热解链温度(T_m)。T_m是50％的测试序列与完美匹配的探针杂交的温度(在限定的离子强度和pH下)。为本发明的目的，“高度严格”的杂交和洗涤条件一般选择为在限定的离子强度和pH时比具体序列的T_m约低5℃。

“超高严格”的杂交和洗涤条件指，增加杂技和洗涤条件的严格性直至探针与完美匹配的互补靶(核酸)结合的信噪比至少是探针与不匹配靶(核酸)杂交观察到的信噪比的10倍。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超高度严格条件下与探针结合。

类似地，可通过逐渐提升相关杂交试验的杂交和/或洗涤条件来确定甚至更高的严格性水平。例如，提升杂交和洗涤的条件直至探针与完美匹配的互补靶核酸结合的信噪比至少比探针与任何不匹配靶核酸杂交信噪比高10、20、50、100或500倍或更高的严格性。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超超高度严格条件下与探针结合。

如果在严格条件下不彼此杂交的核酸所编码的多肽基本相同，则它们基本仍相同。例如，当利用遗传密码所允许的最大密码简并性产生核酸的拷贝时就会发生这种情况。

独特亚序列

一方面，本发明提供了含有选自本文所述O-tRNA和O-RS序列的核酸的独特亚序列的核酸。与对应于任何已知O-tRNA或O-RS核酸序列的核酸相比，所述独特亚序列是独特的。可采用，例如设置默认参数的BLAST进行核酸比对。任何独特亚序列可用作，例如探针来鉴定本发明核酸。

类似地，本发明包括含有选自本文所述O-RS序列的多肽的独特亚序列的多肽。与对应于任何已知多肽序列的多肽相比，本文的独特亚序列是独特的。

本发明也提供能在严格条件下与独特的编码寡核苷酸杂交的靶核酸，所述寡核苷酸编码选自O-RS序列的多肽的独特亚序列，其中与任何对照多肽(例如，本发明合成酶(例如)通过突变所衍生自的亲本序列)相应的多肽相比，所述独特亚序列是独特的。可通过上述方法测定独特序列。

序列比较、相同性和同源性

描述两个或多个核酸或多肽序列关系的术语“相同的”或“百分相同性”指当用下文所述序列比较算法(或技术人员可用的其它算法)或通过目测观察来比较和比对两个或多个序列或亚序列的最大相应性时，这两个或多个序列或亚序列相同，或者有特定百分比的氨基酸残基或核苷酸相同。

描述两个或多个核酸或多肽(例如，编码O-tRNA或O-RS的DNA，O-RS的氨基酸序列)关系的术语“基本相同”指当利用序列比较算法或通过目测观察来比较和比对两个或多个序列或亚序列的最大相应性时，这两个或多个序列或亚序列至少有约60％、约80％、约90-95％、约98％、约99％或更多的核苷酸或氨基酸残基相同。这种“基本相同的”序列通常认为是“同源的”，而不考虑其实际祖先。优选在至少长约50个残基的序列区域，更优选在至少约100个残基的区域存在“基本相同性”，待比较两条序列最好有至少约150个残基或者在全长上基本相同。

当蛋白质和/或蛋白质序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列时，它们是“同源的”。类似地，当核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列时，它们是“同源的”。例如，可通过各种可用的诱变方法来修饰任何天然产生的核酸使之含有一个或多个选择者密码子。当该诱变的核酸表达时，它编码的多肽含有一个或多个非天然氨基酸，例如炔基氨基酸。当然，该突变方法还可改变一个或多个标准密码子，从而也改变了所得突变型蛋白质中一个或多个标准氨基酸。通常可从两种或多种核酸或蛋白质(或其序列)间的序列相似性推断同源性。用于确认同源性的序列间精确的相似性百分比依所述的核酸与蛋白质而不同，但常规将低至25％的序列相似性用来确认同源性。也可用更高水平的序列相似性，例如30％、40％、50％、60％、70％、80％、90％、95％或99％或更高来确认同源性。本文描述了测定序列相似性百分比的方法(例如，采用参数默认的BLASTP和BLASTN)，这些方法众所周知。

为比较序列并测定同源性，通常将一条序列用作与测试序列比较的参比序列。当采用序列比较算法时，将测试序列与参比序列输入计算机，如果需要可设计亚序列坐标，并设计序列算法程序参数。然后根据所设计的程序参数，序列比较算法可计算测试序列相比于参比序列的序列相同性百分比。

可用以下方法进行比较的最佳序列比对，例如Smith和Waterman，(1981)，Adv.Appl.Math.，2：482的局部同源性算法；Needleman和Wunsch，J.，(1970)，Mol.Biol.，48：443的同源性比对算法；Pearson和Lipman，(1988)，Proc.Nat’l. Acad.Sci.USA，85：2444的相似性检索方法；计算机执行这些算法(Wisconsin遗传软件包中的GAP，BESTFIT，FASTA和TFASTA，Genetics Computer Group，575 Science Dr.，Madison，WI)；或者目测(一般可参见《最新分子生物学方法》(Current Protocols in Molecular Biology)，Ausubel等编，“最新方法”(Current Protocols)，Greene Publishing Associates，Inc.和John Wiley&Sons的合资企业，2004年增补)。

适用于测定序列相同性和序列相似性百分比的算法的一个例子是Altschul等，J.Mol.Biol.，215：403-410，(1990)所述的BLAST算法。进行BLAST分析的软件由国家生物技术信息中心(在万维网ncbi.nlm.nih.gov/)对公众开放。该算法包括：首先通过在查询序列中鉴定长为W的短字串来鉴定高评分序列配对(HSP)，这些字串与数据库中相同长度的字串比对时符合或满足某些正值阈值评分T。T称为邻近字串评分阈值(Altschul等，同上)。这些原始邻近字串作为启动检索的种子来找寻含有它们的较长HSP。然后使这些字串选中(hit)沿着各条序列双向延伸，以致累积比对评分增加。以核苷酸序列为例，用参数M(一对匹配残基的奖励评分；恒大于0)和N(错配残基的罚分；恒小于0)计算累积评分。对于氨基酸序列，则用评分矩阵来计算累积评分。当出现以下情况时任一方向的字串选中延伸停止：累积比对评分从其达到的最高值下降X；因一个或多个负评分残基比对的累积导致累积评分降至0或0以下；或者到达各序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程序(用于核苷酸序列)默认11为字长(W)、10为期望值(E)、100为截断值、M＝5、N＝-4，并进行双链比较。对于氨基酸序列，BLAST程序默认3为字长(W)、10为期望值(E)并采用BLOSUM62评分矩阵(参见Henikoff和Henikoff，(1989)，Proc.Natl. Acad.Sci.USA，89：10915)。

除了计算序列相同性百分比之外，BLAST算法也可对两条序列间的相似性进行统计学分析(参见，例如Karlin和Altschul，Proc.Nat’l.Acad.Sci.USA，90：5873-5787，(1993))。BLAST算法提供的相似性量度之一是最小总概率(P(N))，其指示两条核苷酸或氨基酸序列之间发生随机匹配的概率。例如，如果比较测试核酸与参比核酸的最小总概率小于约0.1，更优选小于约0.01，最优选小于约0.001，则可认为该核酸与参比核酸相似。

诱变与其它分子生物学技术

可采用分子生物学技术操作本发明和用于本发明的多核苷酸和多肽。描述分子生物学的通用教材包括Berger和Kimmel，《分子克隆技术指南，酶学方法，第152卷》(Guide to Molecular Cloning Techniques，Methods in Enzymologyvolume 152)，Academic Press，Inc.，San Diego，CA(“Berger”)；Sambrook等《分子克隆-实验室手册》(Molecular Cloning-A Laboratory Manual)，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001(“Sambrook”)和《最新分子生物学方法》(Current Protocols in Molecular Biology)，F.M.Ausubel等编；“最新方法”(Current Protocols)，Greene Publishing Associates，Inc.和John Wiley& Sons的合资企业，(2004年增补)(“Ausubel”)。这些教材描述了诱变、载体的应用、启动子和许多其它相关课题，例如产生含有选择者密码子的基因从而产生含有炔基氨基酸(如pPRO-Phe)的蛋白质，以及产生正交tRNA、正交合成酶及其配对的课题。

本发明可利用各种类型的诱变来(例如)使tRNA分子突变、产生tRNA文库、产生合成酶的文库和/或在感兴趣蛋白质或多肽中插入编码炔基氨基酸的选择者密码子。它们包括但不限于：定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、利用含有尿嘧啶的模板诱变、寡核苷酸指导的诱变、硫代磷酸酯修饰的DNA诱变、利用缺口双螺旋DNA的诱变等，或者是它们的任何组合。其它合适的方法包括点错配修复、利用修复缺陷宿主株的诱变、限制性选择和限制性纯化、缺失诱变、总基因合成诱变、双链断裂修复等。本发明也包括，例如涉及嵌合构建物的诱变。在一个实施方案中，可用天然产生分子或改变或突变的天然产生分子的已知信息，例如序列，序列比较、物理特性、晶体结构等来指导诱变。

可利用本发明多核苷酸或含有本发明多核苷酸的构建物，例如本发明载体(例如可以是克隆载体或表达载体)来遗传改造(例如转化、转导或转染)宿主细胞。例如，可将正交tRNA、正交tRNA合成酶和待衍生蛋白质的编码区操作性连接于可在所需宿主细胞中起作用的基因表达控制元件。典型的载体含有转录和翻译终止子、转录和翻译起始序列和用于调节具体靶核酸表达的启动子。这些载体可任选地包含遗传表达盒，所述表达盒含有至少一个独立的终止子序列，允许该表达盒在真核细胞或原核细胞或二者中复制的序列(例如，穿梭载体)，和适用于原核与真核系统的选择标记。载体适用于在原核细胞、真核细胞或二者中复制和/或整合。参见Giliman和Smith，(1979)，Gene，8：81；Roberts等，(1987)，Nature，328：731；Schneider，B.等，(1995)，Protein Expr.Purif.，6435：10；Ausubel，Sambrook，Berger(均同上)。例如，载体可以是质粒、细菌、病毒、裸多核苷酸或缀合的多核苷酸形式。可通过标准方法将载体导入细胞和/或微生物，包括电穿孔(From等，(1985)，Proc.Natl.Acad.Sci.USA，82，5824)，病毒载体感染，利用在小珠或颗粒的基质内或其表面上含有核酸的小颗粒的高速弹丸穿透(Klein等，(1987)，Nature，327：70-73)等。

ATCC提供了大量可用于克隆的细菌和细菌噬菌体，例如ATCC出版的《ATCC细菌和细菌噬菌体目录》(The ATCC Catalogue of Bacteria andBacteriophage)，(1996)，Gherna等编。其它测序、克隆的基本方法和分子生物学的其它方面及对其潜在理论的考虑也可见Sambrook(同上)，Ausubel(同上)和Watson等，(1992)，《重组DNA》(Recombinant DNA)，第二版，ScientificAmerican Books，NY。此外，可以向各种商业来源定制的或标准定购基本上任何核酸(和实际上任何标记的核酸，无论标准或非标准的)，例如MidlandCertified Reagent Company(Midland，TX mcrc.com)、The Great American GeneCompany(Ramona，CA，从万维网genco.com处可得)、ExpressGen Inc.(Chicago，IL，从万维网expressgen.com处可得)、Operon Technologies Inc.(Alameda，CA)和许多其它公司。

工程改造的宿主细胞可在为例如筛选步骤、激活启动子或选择转化子的活性而适当改进的常规营养培养基中培养。这些细胞任选培养成转基因生物。其它可用的参考文献，例如用于细胞分离和培养(例如，用于随后核酸分离或蛋白质表达和/或纯化)的文献，包括Freshney，(1994)，《动物细胞培养，基本技术手册》(Culture of Animal Cells，a Manual of Basic Technique)，第三版，Wiley-Liss，纽约及其所引用的参考文献；Payne等，(1992)，《液体系统中的植物细胞与组织培养》(Plant Cell and Tissue Culture in Liquid Systems)，JohnWiley and Sons，Inc.，纽约，NY；Gamborg和Phillips编，(1995)，《植物细胞、组织和器官培养》(Plant Cell，Tissue and Organ Culture)；FundamentalMethods Springer Lab Manual，Springer-Verlag(Berlin Heidelberg New York)；Atlas和Parks编，《微生物培养基手册》(The Handbook of MicrobiologicalMedia)，(1993)，CRC Press，Boca Raton，FL。

感兴趣的蛋白质与多肽

炔基氨基酸的一个显著优点是(但不限于)含有炔基氨基酸的蛋白质可用于交联或缀合蛋白质与各种小分子、生物分子或其它蛋白质等。含有至少一个炔基氨基酸的感兴趣蛋白或多肽是本发明的特征之一。本发明也包括用本发明组合物和方法制备的至少含有一个炔基氨基酸的多肽或蛋白质。蛋白质也可和赋形剂(如药学上可接受的赋形剂)一起存在。本发明蛋白可任选在单个氨基酸位置或多个氨基酸位置含有翻译后修饰(除了对炔基氨基酸残基可能的亚序列修饰外)，或者所述蛋白质可具有多个不同类型的修饰。

在细胞内产生特定位置上有炔基氨基酸的蛋白质的方法也是本发明的特征之一。例如，一种方法包括：在适宜的培养基内培养细胞，所述细胞含有的核酸至少包含一个选择者密码子并能编码蛋白质；提供炔基氨基酸；其中所述细胞还包含：能在细胞内起作用并识别选择者密码子的正交-tRNA(O-tRNA)；和用炔基氨基酸优先氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用这种方法产生的蛋白也是本法发明的特征之一。

在某些实施方案中，与表达系统中任何内源性tRNA相比，O-RS对氨酰化关联O-tRNA有偏好。O-RS所加载的O-tRNA与内源性tRNA的相对比例大于1∶1，更优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1，98∶1，99∶1，100∶1，500∶1，1,000∶1，5,000∶1或更高。

本发明也提供含有蛋白的组合物，所述蛋白含有炔基氨基酸。在某些实施方案中，蛋白质含有的氨基酸序列与治疗性蛋白、诊断性蛋白、工业用酶或其片段的序列至少有75％相同。

本发明组合物和利用本发明方法产生的组合物任选存在于细胞中。然后，宿主系统的翻译机制可利用本发明O-tRNA/O-RS配对或其单独的组分将炔基氨基酸掺入蛋白质。2004年4月16日提交的名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的国际公布号WO2004/094593和名为“非天然氨基酸的体内掺入”(In vivo incorporation ofunnatural amino acids)的WO 2002/085923描述了该方法，该两篇文献纳入本文作为参考。例如，当O-tRNA/O-RS配对引入宿主(如大肠杆菌)细胞时，该配对响应选择者密码子在体内将炔基氨基酸(例如对炔丙基氧苯丙氨酸)掺入蛋白质。加入系统的对炔丙基氧苯丙氨酸是可外源性加入生长培养基中的合成氨基酸，例如酪氨酸或苯丙氨酸的衍生物。本发明组合物可任选存在于体外翻译系统或体内系统中。

本发明细胞能合成大量有用的含非天然氨基酸的蛋白质。在一方面，该组合物任选包含，例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含炔基氨基酸的蛋白质，或体内蛋白质制备方法所能实现的的产量(详见本文所述重组蛋白质制备和纯化)。在另一方面，组合物中包含在例如细胞裂解液、缓冲液、药学缓冲液或其它液体混悬液中(例如，体积为约1nL-约100L)的蛋白质浓度任选是，例如每升至少10微克蛋白质、每升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质。在细胞中制备大量(例如，大于采用其它方法如体外翻译通常可能得到的量)包含至少一个炔基氨基酸的蛋白质是本发明特征之一。

掺入炔基氨基酸可改变蛋白质结构和/或功能，如改变大小、酸性、亲核性、氢键、疏水性、蛋白酶靶位的易接近性、对某部分的靶向(如用于蛋白阵列)等。含有炔基氨基酸的蛋白质的催化或物理特性可得到改善，或者获得全新的催化或物理特性。例如，可通过将炔基氨基酸掺入蛋白质来任选改进以下特性：毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如血清半衰期)、与其它分子相互作用的能力(共价或非共价的)等。包含至少含有一个炔基氨基酸的蛋白质的组合物可用作，例如新型治疗剂、诊断剂、催化酶、工业用酶、结合蛋白(如抗体)以及用于例如研究蛋白质结构和功能。参见Dougherty，(2000)，“作为蛋白质结构和功能探针的非天然氨基酸”Unnatural Amino Acids as Probes of Protein Structure and Function)，Current Opinion in Chemical Biology，4：645-652。

在本发明的一方面，组合物包含至少一种含有至少一个，例如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或更多非天然氨基酸，如含炔基氨基酸和/或其它非天然氨基酸的蛋白质。所述非天然氨基酸可以相同或不同，例如蛋白质中可以在1、2、3、4、5、6、7、8、9或10个或更多不同的位点上含有1、2、3、4、5、6、7、8、9或10个或更多不同的非天然氨基酸。在另一方面，组合物包含的蛋白质中至少一个但少于全部的具体氨基酸被炔基氨基酸取代。对于含有一个以上非天然氨基酸的给定蛋白质，所述非天然氨基酸可以相同或不同(例如，蛋白质可包含两种或两种以上不同类型的非天然氨基酸，或者可包含两个相同的非天然氨基酸)。对于含有两个以上非天然氨基酸的蛋白质，所述非天然氨基酸可以相同、不同或是多个同一类型的非天然氨基酸与至少一个不同的非天然氨基酸的组合。

采用本文组合物和方法可制备基本上任何含炔基氨基酸的蛋白质(或其一部分)(与任何相应的编码核酸，例如含有一个或更多选择者密码子的核酸)。未鉴定成百上千的已知蛋白质，可修饰它们中的任一种使之含有一个或多个非天然氨基酸，例如通过改进任何可用的突变方法从而在相关翻译系统中包含一个或多个合适的选择者密码子。已知蛋白质的共有序列库包括GenBank EMBL、DDBJ和NCBI。通过检索internet不难鉴定其它库。

这些蛋白质通常与任何可用的蛋白质(例如，治疗性蛋白、诊断性蛋白、工业用酶或其一部分等)有，例如至少60％、至少70％、至少75％、至少80％、至少90％、至少95％或至少99％或更高相同性，同时这些蛋白质含有一个或多个非天然氨基酸。可经修饰包含一个或多个炔基氨基酸的治疗性、诊断性和其它蛋白质的例子见，但不限于2004年4月16日提交的名为“扩展真核生物遗传密码”(Expanding the Eukaryotic Genetic Code)的国际公布号WO 2004/094593和名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS.)的WO 2002/085923。可经修饰包含一个或多个炔基氨基酸的治疗性、诊断性和其它蛋白质的例子包括但不限于：例如α-1抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolytic factor)、抗体(详见下文)、载脂蛋白、脱辅蛋白、心房利钠因子、心房利钠多肽、心房肽(Atrial peptides)、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋白-1α、单核细胞炎性蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配体、C-kit配体、胶原、集落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(如，上皮嗜中性活化肽-78(epithelial NeutrophilActivating Peptide-78)、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)、表皮生长因子(EGF)、促红细胞生成素(“EPO”)、剥落性毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、血纤蛋白原、纤连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、Hedgehog蛋白(如Sonic，Indian，Desert)、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如，IFN-α、IFN-β、IFN-γ)、白介素(如，IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质形成细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、萤光素酶、神经营养因子(Neurturin)、嗜中性白细胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲状腺激素、PD-ECSF、PDGF、肽激素(如，人生长激素)、多效营养因子、A蛋白、G蛋白、热源性外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、促生长素抑制剂、促生长素、链激酶、超抗原，即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克综合征毒素(TSST-1)、胸腺素α1、组织纤溶酶原激活物、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶和许多其它蛋白。

可采用本文所述能在体内掺入炔基氨基酸的组合物和方法制备的一类蛋白质包括转录调节剂或其一部分。示例性转录调节剂包括调节细胞生长、分化、调控等的基因和转录调节剂蛋白。转录调节剂存在于原核生物、病毒和真核生物(包括真菌、酵母菌)、昆虫和动物(包括哺乳动物)中，提供了广泛的治疗靶点。应该理解表达和转录激活物通过许多机理调控转录，例如通过与受体结合、刺激信号转导级联反应、调控转录因子表达、与启动子和增强子结合、与结合启动子和增强子的蛋白质结合、DNA解链、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。

本发明的一类蛋白质(例如，含有一个或多个炔基氨基酸的蛋白质)包括生物学活性蛋白，例如细胞因子，炎性分子，生长因子，它们的受体和癌症基因产物，如白介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44；信号转导分子和相应的癌基因产物，例如Mos、Ras、Raf和Met；转录激活物和抑制剂，例如p53、Tat、Fos、Myc、Jun、Myb、Rel和类固醇激素受体，例如雌激素、孕酮、睾酮、醛甾酮的那些受体，LDL受体配体和皮质酮。

本发明也提供含有至少一个炔基氨基酸的酶(例如工业用酶)。酶的例子包括但不限于：酰胺酶、氨基酸消旋酶、酰基转移酶、脱卤酶、双加氧酶、二芳基丙烷过氧化物酶(diarylpropane peroxidases)、差向异构酶、环氧化物水解酶、酯酶、异构酶、激酶、葡糖异构酶、糖苷酶、糖基转移酶、卤素过氧化物酶(haloperoxidases)、单加氧酶(例如p450)、脂酶、木质素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、转氨酶和核酶。

许多这些蛋白质可购得(参见，例如Sigma BioSciences 2004目录和价目表)，相应的蛋白质序列和基因及其许多变体通常是熟知的(参见，例如Genbank)。可根据本发明通过插入一个以上炔基氨基酸来修饰任何这些蛋白，从而(例如)有助于改变这些蛋白质的一种或多种感兴趣的治疗、诊断或酶活性。治疗相关特性包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(例如，通过在非天然氨基酸如炔基氨基酸上掺入报告基团(如标记物或标记结合位点))、LD₅₀或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性的例子包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶特性的例子包括保存半衰期、稳定性、酶活性、生产能力等。

也可采用本发明方法和组合物修饰各种其它蛋白质使之包含一个或多个炔基氨基酸。例如，本发明可包括用炔基氨基酸取代一种或多种疫苗蛋白质中的一个或多个天然氨基酸，例如以下来源的蛋白质：感染性真菌，如曲霉(Aspergillus)、假丝酵母(Candida)种；细菌，特别是用作病原性细菌模型的大肠杆菌，以及医学上重要的细菌，如葡萄球菌属(Staphylococci)(如，金黄色葡萄球菌)或链球菌属(Streptococci)(如，肺炎链球菌)；原生动物，如孢子纲(如，疟原虫(Plasmodia))、根足虫(rhizopods)(如，内变形虫(Entamoeba))和鞭毛虫类(锥虫(Trypanosoma)、利什曼原虫(Leishmania)、毛滴虫(Trichomonas)、贾第虫(Giardia)等)；病毒，如(+)RNA病毒(例子包括痘病毒，如痘苗病毒(vaccinia)；小RNA病毒，如脊髓灰质炎病毒(polio)；披膜病毒，如风疹病毒(rubella)；热病毒(Flaviviruses)，如HCV；和冠状病毒)、(-)RNA病毒(如弹状病毒，如VSV；副粘病毒，如RSV；正粘病毒，如流感病毒；布尼亚病毒和嵌沙样病毒)、dsDNA病毒(如呼肠孤病毒)、RNA到DNA的病毒，即逆转录病毒，如HIV和HTLV和某些DNA到RNA的病毒，如乙肝病毒。

农业相关的蛋白也是炔基氨基酸修饰的合适靶位，例如抗虫蛋白(如Cry蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生长酶(如核酮糖1，5-二磷酸羧化酶/加氧酶，“RUBISCO”)、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。

在某些实施方案中，本发明方法和/或组合物中感兴趣的蛋白质或多肽(或其一部分)由核酸编码。所述核酸通常含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、十个或更多选择者密码子。

可采用本领域技术人员熟知和本文在“诱变与其它分子生物学技术”中所述的方法诱变编码感兴趣蛋白质或多肽的基因，使之含有(例如)一个或多个选择者密码子来掺入炔基氨基酸。例如，可诱变感兴趣蛋白质的核酸，使之含有一个或多个选择者密码子来插入一个或多个含炔基氨基酸。本发明包括任何蛋白质的这种变体(例如突变体)形式，例如掺入至少一个炔基氨基酸。类似地，本发明也包括相应的核酸，即任何具有一个或多个编码一个或多个炔基氨基酸的选择者密码子的核酸。

为制备包含炔基氨基酸的蛋白质，可利用适合于通过正交tRNA/RS配对在体内掺入炔基氨基酸的宿主细胞和生物。可用一个或多个表达正交tRNA、正交tRNA合成酶的载体和编码待衍生蛋白质的载体来遗传改造(例如转化、转导或转染)宿主细胞。各组分可以位于同一载体或各位于不同载体，或者可以两个组分位于一个载体而第三组分位于第二载体。载体可以是例如质粒、细菌、病毒、裸多核苷酸或缀合多核苷酸的形式。

通过免疫反应性确定多肽

因为本发明多肽提供了多种新的多肽序列(例如，以在本文翻译系统中合成的蛋白质为例，多肽含有炔基氨基酸；或者，以新合成酶为例，则是标准氨基酸的新序列)，这些多肽也提供了可在例如免疫学测定中识别的新结构特征。产生能与本发明多肽特异性结合的抗血清以及能耐与这种血清结合的多肽是本发明的特征之一。本文所用的术语“抗体”包括但不限于：基本上由一个或多个免疫球蛋白基因编码的多肽，或其能特异性结合并识别分析物(抗原)的片段。例子包括多克隆、单克隆、嵌合型和单链抗体等。本文所用的术语“抗体”也包括免疫球蛋白片段，包括Fab片段和由表达文库(包括噬菌体文库)产生的片段。抗体的结构与术语可参见，例如Paul，(1999)，《基础免疫学》(Fundamental Immunology)，第四版，RavenPress，纽约。

为产生用于免疫学测定的抗血清，可根据本文所述产生并纯化一种或多种免疫原性多肽。例如，可在重组细胞中产生重组蛋白。采用标准小鼠免疫方案，用免疫原性蛋白和标准佐剂(如弗氏佐剂)来免疫小鼠的近交品系(所述测定中选用此类小鼠是因其实际遗传相同性而使实验结果重现性较高)(用于测定特异性免疫反应性的抗体产生、免疫学测定形式和条件的标准说明可参见，例如Harlow和Lane，(1988)，《抗体，实验室手册》(Antibodies，A Laboratory Manual)，Cold SpringHarbor Publications，纽约)。蛋白质、抗体、抗血清等的其它细节可见名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的国际公布号WO 2004/094593；名为“非天然氨基酸的体内掺入”(IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)的WO 2002/085923；名为“糖蛋白合成”(GLYCOPROTEIN SYNTHESIS)的WO 2004/035605和名为“蛋白质阵列”(PROTEIN ARRAYS)的WO 2004/058946。

O-tRNA、O-RS和O-tRNA/O-RS配对的应用

本发明组合物与本发明方法制备的组合物可任选包含在细胞中。然后，宿主系统的翻译工具可利用本发明O-tRNA/O-RS配对或单独组分将炔基氨基酸掺入蛋白质。Schultz等人名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS)的国际公布号WO 2002/085923描述了该方法，该文献纳入本文作为参考。例如，当将O-tRNA/O-RS配对引入宿主例如大肠杆菌时，该配对可响应于选择者密码子，例如琥珀无义密码子将可外源性加入生长培养基的炔基氨基酸体内掺入蛋白质，例如肌红蛋白测试蛋白或治疗性蛋白。本发明组合物可任选处于体外翻译系统或细胞体内系统中。含有炔基氨基酸的蛋白质可用于各种领域。最值得注意的是，掺入蛋白质的炔基部分可用作各种修饰的靶位，例如与其它蛋白质、小分子，如标记物或染料和/或生物分子交联。利用这些修饰，掺入炔基氨基酸可改善治疗性蛋白质，可用于改变或改善酶的催化功能。在一些方面，在蛋白质中掺入炔基氨基酸以及随后的修饰有助于研究蛋白质的结构、与其他蛋白质的相互作用等。

试剂盒

试剂盒也是本发明的特征。例如，本发明提供了用于在细胞内产生含至少一个炔基氨基酸的蛋白质的试剂盒，其中所述试剂盒包括容器，其含有编码O-tRNA的多核苷酸序列、和/或O-tRNA、和/或编码O-RS的多核苷酸序列、和/或O-RS。在一个实施方案中，试剂盒还包含炔基氨基酸，例如对炔丙基氧苯丙氨酸。在另一个实施方案中，试剂盒还包括关于制备蛋白的使用说明书。

实施例

提供以下实施例是为了说明，而不是为了限制本发明。本领域技术人员应知道可对各种非关键性参数做出修改而不脱离本发明范围。

实施例1

设计开发正交tRNA/合成酶配对以在大肠杆菌中将炔基氨基酸掺入蛋白质

通过设计正交tRNA-合成酶配对的特异性，我们能选择性且有效地在原核生物和真核生物中响应于无义和移码密码子将许多非天然氨基酸掺入蛋白质(Anderson等，(2004)，Proc.Natl.Acad.Sci.U.S.A.，101：7566；Alfonta等，(2003)，J.Am.Chem.Soc.，125：14662；Wang等，(2003)，Proc.Natl.Acad.Sci.U.S.A.，100：56；Chin等，(2003)，Science，301：964；Chin等，(2002)，Proc.Natl.Acad.Sci.，99：11020；和Wang等，(2001)，Science，292：498)。本发明提供利用大肠杆菌翻译机制将含有反应性炔基部分的氨基酸生物合成性掺入蛋白质的组合物和方法。利用大肠杆菌翻译组分的生物合成可在体内(例如，在大肠杆菌细胞中)或在体外利用粗制细胞提取物或纯化的翻译组分进行。掺入蛋白质的炔基可方便且特异性地与含叠氮基的部分缀合，从而产生蛋白质修饰/操作的有用靶位。

炔基和叠氮基(图1B所示)的化学性质与蛋白质中所有内源性官能团的化学性质完全正交。其独特的反应活性的例子是通过[3+2]环加成反应可逆地形成三唑(参见图1B；和Padwa，刊于《综合有机合成》(Comprehensive OrganicSynthesis)；[Trost，B.M.编]，Pergamon：牛津，1991，第四卷，第1069-1109页；Huisgen，刊于《1，3-两级环加成化学》(1，3-Dipolar Cycloaddition Chemistry)，[Padwa，A.编]，Wiley：纽约，1984，第1页)。当室温，有铜(CuI)存在下在水性介质中进行时(对于修饰生物学样品足够温和的条件)，此反应以完全区域选择性的方式进行(Rostovtsev et al.(2002)Angew.Chem.Int.Ed.，41：2596)，可用于选择性地修饰引入了炔基和叠氮基官能团的蛋白质(Deiters等，(2003)，J.Am.Chem.Soc.，125：11782；Wang等，(2003)，J.Am.Chem.Soc.，125：3192；Link和Tirrell，(2003)，J.Am.Chem.Soc.，125：11164)。

本文所述发明提供衍生自詹氏甲烷球菌组分的正交tRNA/tRNA-合成酶配对，其能在大肠杆菌宿主系统中选择性掺入炔基氨基酸对炔丙基氧苯丙氨酸(缩写为pPRO-Phe；根据IUPAC命名法也称为2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸；结构如图1A所示，化学结构指定为名称1)。本项研究证实利用本文提供的新型正交tRNA和tRNA合成酶试剂能将pPRO-Phe选择性地掺入大肠杆菌所表达的蛋白质。

本文中，我们报道了对衍生自詹氏甲烷球菌酪氨酰tRNA/tRNA-合成酶配对(MjTyrRS/tRNA_CUA)的正交tRNA/tRNA-合成酶配对的设计，其中所述正交配对对任何常见的(即，天然产生的)氨基酸没有亲和力或亲和力非常低。所衍生的正交tRNA合成酶选择性地将pPRO-Phe加载于琥珀抑制型tRNA_CUA，该氨酰化的抑制型tRNA(即，“加载的”tRNA)可响应于转录物中遇到的TAG琥珀终止密码子(选择者密码子)而用作内源性大肠杆菌翻译机器的底物进而掺入pPRO-Phe。此tRNA/合成酶配对的正交性(Steer和Schimmel，(1999)，Biol.Chem.，274：35601)可确保tRNA或合成酶均不与内源性大肠杆菌tRNA或合成酶交叉反应并且确保只响应于琥珀无义密码子TAG而递送非天然氨基酸。

通过诱变野生型詹氏甲烷球菌酪氨酰tRNA合成酶得到约有10⁷个不同詹氏甲烷球菌酪氨酰tRNA合成酶的文库。为制备MjTyrRS文库，首先将要靶向突变的5个位置转化为丙氨酸密码子。MjTyrRS基因在质粒pBK-JYRS的大肠杆菌GlnRS启动子和终止子的控制下表达，所述质粒是具有卡那霉素抗性的pBR322衍生质粒。通过定点诱变用Ala取代残基Tyr³²、Glu¹⁰⁷、Asp¹⁵⁸、Ile¹⁵⁹和Leu¹⁶²，从而得到质粒pBK-JYA5。在突变位点具有NNK(N＝A+T+G+C和K＝G+T)的8种寡核苷酸用于Ala₅ MjTyrRS突变体(pBK-JYA5)的PCR扩增并连接回用Nde I-Pst I消化的pBK-JYA5进而得到MjTyrRS文库。将连接的载体转化入大肠杆菌DH10B感受态细胞从而得到1.6×10⁹个菌落形成单位的文库。

野生型詹氏甲烷球菌酪氨酰tRNA-合成酶分子的多核苷酸和氨基酸序列如图2所示，也分别可见SEQ ID NO：3和2。根据嗜热脂肪芽孢杆菌的同源性酪氨酰tRNA合成酶的晶体结构(可知)诱变由随机化的5个活性位点残基(Tyr32、Glu107、Asp158、Ile159和Leu162)构成。

诱变后，合成酶库经多轮正和负选择。正选择以氯霉素乙酰转移酶(CAT)基因中允许(permissive)位点处(Asp112)琥珀终止密码子的抑制为基础。当携带MjTyrRS突变体文库、突变型CAT基因和共表达的Mj琥珀抑制型tRNA_CUA的大肠杆菌细胞在存在pPRO-Phe(1mM)和氯霉素(80μg/mL)的基本培养基中生长时，只有含能用内源性氨基酸或pPRO-Phe氨酰化tRNA_CUA的突变型合成酶的细胞能存活。然后将合成酶文库基因转化入含有编码毒性蛋白质芽孢杆菌RNA酶的突变基因的细胞，所述基因在允许位点(Gln2、Asp44、Gly65)具有3个琥珀突变。携带芽孢杆菌RNA酶报道(基因)的载体也含有抑制型tRNA。这些细胞缺少pPRO-Phe时的生长选择出能接受内源性氨基酸作为底物的合成酶。三轮选择后，对96个克隆对存在或不存在pPRO-Phe的生长速率依赖性进行了筛选，鉴定并测序了8个候选克隆。图3显示了在这些分离的克隆中观察到的氨基酸取代。SEQ ID NO：4-19也提供了这8个克隆的多核苷酸与氨基酸序列。

在8个突变型O-RS克隆中观察到氨基酸取代的共有趋势。在大多数克隆的结合袋中发现以下氨基酸占优势：Ala32、Pro107/Gln107、Ala158、Ile159和Ala162/Pro162。Tyr32→Ala32和Asp158→Ala158突变可导致Tyr32、Asp158和天然底物酪氨酸之间的氢键丧失，因此不利于结合。预计小的和大多数疏水性侧链的存在可促进pPRO-Phe结合。在这些克隆之一(pPRO-PheRS-1)中也观察到另外的Leu110→Phe110突变。

选择合成酶pPRO-PheRS-1进行进一步特征鉴定。分别在有和没有pPRO-Phe存在下，此合成酶赋予大肠杆菌IC₅₀值分别为110和5μg/mL的氯霉素抗性。有和没有pPRO-Phe时氯霉素抗性的巨大差异提示pPRO-PheRS-1在体内对非天然氨基酸pRPO-Phe基本上特异。

实施例2

在大肠杆菌中将炔基氨基酸位点特异地掺入蛋白质

利用突变型琥珀抑制型tRNA_CUA和pPRO-PheRS-1正交配对在大肠杆菌中选择性地将pPRO-Phe掺入鲸精子肌红蛋白，该蛋白是153-残基的含亚铁血红素的单体蛋白，其是许多结构、机理和蛋白质折叠研究的焦点(Reedy和Gibney，(2004)，Chem.Rev.，104：617，及其引用的参考文献；Uzawa等，(2004)，Proc.Natl.Acad.Sci.U.S.A.，101：1171，及其引用的参考文献；Wright和Baldwin，刊于《分子生物学的新领域：蛋白质折叠机理》(Frontiers in Molecular Biology：Mechanisms of Protein Folding)，[Pain，R.编]，牛津大学出版社，伦敦，2000，第309页)。

为制备炔基修饰的肌红蛋白，将肌红蛋白开放读框的第四个密码子(Ser4)突变为TAG(琥珀终止密码子)并将C-末端6×His(六组氨酸)标签加入开放读框。为表达突变型蛋白，将质粒pBAD/JYAMB-4TAG(其编码突变型鲸精子肌红蛋白基因，其具有阿拉伯糖启动子和rrnB终止子；在1pp启动子和rrnC终止子上的酪氨酰tRNA_CUA；和四环素抗性标记)与pBK载体(编码突变型合成酶和卡那霉素抗性基因)共同转化入DH10B大肠杆菌。在补加了四环素(25mg/L)和卡那霉素(30mg/L)的Luria-Bertani培养基(5mL)中扩增细胞，用磷酸缓冲液洗涤，接种入500ml含有合适的抗生素、pPRO-Phe(1mM)和阿拉伯糖(0.002％)的液体甘油基本培养基中(补加了0.3mM亮氨酸)。细胞生长至饱和，然后离心收集。采用Ni-亲和层析纯化蛋白质，纯化后得到2mg/L的收率，通过SDS-PAGE/Gelcode^蓝染色(Pierce Biotechnology，Inc.)估计均质性为90％。得到突变型肌红蛋白的总产率约1mg。

如图4泳道1所示，通过Gelcode^蓝染色和利用抗-His6抗体的Western印迹使如此制备的蛋白质显影。在没有pPRO-Phe存在下，染色或Western印迹后(利用抗-His6抗体)未观察到肌红蛋白，表明所开发的合成酶的高度选择性(参见，图4，泳道2)。

实施例3

通过质谱确认在大肠杆菌中炔基氨基酸掺入蛋白质

为进一步证实掺入突变型肌红蛋白的琥珀终止密码子位点的氨基酸身份，对肌红蛋白的胰蛋白酶消化物进行液相色谱/串联质谱(检测)。此实验中的突变型肌红蛋白在74位含有工程改造的琥珀终止密码子。在此位置的pPRO-Phe掺入(pPRO-Phe74)被检测为74突变。利用肌红蛋白-74TAG突变体替代上述Ser4→TAG(琥珀终止密码子)，因为对于LC MS/MS分析而言该突变体具有改善的性能。

真细菌表达后，采用镍亲和柱纯化肌红蛋白74TAG。通过SDS-PAGE凝胶的Gelcode^蓝染色显影蛋白质条带。从聚丙烯酰胺凝胶上切下对应于突变型肌红蛋白的凝胶条带，切成1.5-mm的立方体，并基本上如上所述进行胰蛋白酶水解(Shevchenko等，(1996)，Anal.Chem.，68：850-858)。

采用装配有LCQ离子捕获质谱仪的纳米流(nanoflow)反相HPLC/μESI/MS分析含有非天然氨基酸的胰蛋白酶(水解的)肽。利用装配有Nanospray HPLC(Agilent 1100系列)的Finnigan LCQ Deca离子捕获质谱仪(Thermo Finnigan)进行液相层析串联质谱(LC-MS/MS)分析。

离子捕获质谱仪将含有非天然氨基酸(以Y^*表示)的肽HGVTVLTALGY^*ILK(SEQ ID NO：X)的单电荷和双电荷离子分离并破碎。此分析的结果见图5。可清楚地指定碎片离子质量，从而证实pPRO-Phe的位点特异性掺入。LC MS/MS运作未提示在此位置掺入了任何天然氨基酸，从而证实所开发合成酶的高度选择性。

实施例4

通过[3+2]环加成衍生含有炔基氨基酸的蛋白质

采用[3+2]环加成反应可有效地靶向修饰含有炔基官能团的蛋白质。本实施例描述了用两个不同的含叠氮基染料分子衍生炔基肌红蛋白。如实施例1所述，本实施例所用的突变型肌红蛋白在第四密码子处掺入了pPRO-Phe(Ser4→pPRO-Phe4)。

如实施例2所述在大肠杆菌中制备Ser4→pPRO-Phe4肌红蛋白，然后用分别含有丹磺酰基和荧光素荧光团的叠氮基功能化染料2或3(如图6A和6B所示；也参见Deiters等，(2003)，J.Am.Chem.Soc.，125：11782；Wang等，(2003)，J.Am.Chem.Soc.，125：3192；Link和Tirrell，(2003)，J.Am.Chem.Soc.，125：11164)衍生。[3+2]环加成衍生反应如图7A所示。

对于环加成反应，向0.1M磷酸缓冲液(pH＝8)配制的45μL纯化突变型肌红蛋白(～0.5mg/mL)中加入1μL CuSO₄(H₂O配制的50mM储备液；在最终反应体积中是1mM)、2μL染料2或3(50mM，EtOH配制)、2μL三(1-苄基-1H-[1，2，3]三唑-4-基甲基)胺(DMSO配制的50mM)和1mg铜丝或1μL三(羧基乙基)膦(H₂O配制的100mM)(作为还原剂)。室温8小时或4℃过夜后，加入450μL H₂O，混合物经透析膜(10kDa截断值)离心。通过离心用2×500μL磷酸缓冲液洗涤上清液后，将溶液调节至50μL体积。

利用铜丝或三(羧乙基)膦(2mM)作为还原剂通常得到类似的标记效率。配体三(1-苄基-1H-[1，2，3]三唑-4-基甲基)胺存在或不存在对这些反应的结果没有显著影响，这与以前的观察结果(Wang等，(2003)，J.Am.Chem.Soc.，125：3192)相反。然后通过SDS-PAGE和凝胶内成像分析20μL的荧光标记蛋白样品(Blake，(2001)，Curr.Opin.Pharmacol.，1：533；Wouters等，(2001)，Trends inCell Biology，11：203；Zacharias等，(2000)，Curr.Opin.Neurobiol.，10：416)。利用鹰眼密度计(Eagle Eye densitometer)(Stratagene)对丹磺酰基染料2(λ_ex＝337nm，λ_em＝506nm)修饰的突变型肌红蛋白进行360±30nm凝胶内成像。利用Storm Phosphorimager(Molecular Dynamics)在450±30nm处观察荧光素染料3(λ_ex＝495nm，λ_em＝516nm)的连接情况。此荧光成像的结果见图7B。染料2和3均有效地标记突变型肌红蛋白。通过比较用3标记的肌红蛋白的A₂₈₀/A₄₉₅值(参见Wang等，(2003)，J.Am.Chem.Soc.，125：3192)测定到标记效率约75％。野生型肌红蛋白与2或3之间未观察到有反应，证实此生物缀合的选择性(结果未显示)。

本(实施例)的内容证实炔基氨基酸，例如对炔丙基氧苯丙氨酸能有效且选择性地掺入生物，例如大肠杆菌的蛋白质。然后这些氨基酸可在蛋白质内化学靶向以进行缀合，例如通过利用叠氮基部分的[3+2]环加成，此外，该靶向修饰是高度特异性和区域选择性的。能将炔基氨基酸位点特异性地掺入蛋白质为需要蛋白质缀合或修饰的任何蛋白质研究提供了重要工具。

实施例5

合成非天然炔基氨基酸对炔丙基氧苯丙氨酸

从可商业购得的N-Boc-酪氨酸经三步(参见Deiters等，(2003)，J.Am.Chem.Soc.，125：11782；Wang等，(2003)，J.Am.Chem.Soc.，125：3192；Link和Tirrell，(2003)，J.Am.Chem.Soc.，125：11164)合成非天然氨基酸对炔丙基氧苯丙氨酸(缩写为pPRO-Phe；参见图1A，化合物1)，总产率为81％。

步骤1

将N-叔丁氧基羰基-酪氨酸(2g，7mmol，1当量)和K₂CO₃(3g，21mmol，3当量)悬浮在无水DMF(15mL)中。缓慢加入炔丙基溴(2.1mL，21mmol，3当量，80％甲苯溶液)，反应混合物在室温搅拌18小时。加入水(75mL)和Et₂O(50mL)，分层，用Et₂O(2×50mL)萃取水相。干燥(MgSO₄)合并的有机层，减压除去溶剂。得到如下所示并命名的黄色油状产物(4)(2.3g，91％)，其无需进一步纯化即可用于下一步。

2-叔丁氧基羰基氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸炔丙酯(化合物4)

步骤2

0℃将乙酰氯(7mL)小心地加入甲醇(60mL)中得到无水HCl的5MMeOH溶液。加入上一步的产物(化合物4；2g，5.6mmol)，反应(体系)搅拌4小时同时使之回暖至室温。减压除去挥发性物质后得到淡黄色固体(化合物5，结果和名称如下所示，1.6g，98％)，其直接用于下一步。

2-氨基-3-[4-(丙-2-炔基氧)苯基]-丙酸炔丙酯(化合物5)

步骤3

将上一步的炔丙酯(1.6g，5.5mmol)(5)溶解于2N NaOH(14mL)和MeOH(10mL)的水性混合物中。室温搅拌1.5小时后，加入浓盐酸将pH调节至7。加入水(20mL)，混合物在4℃维持过夜。滤去沉淀物，用冰冷的H₂O洗涤，真空干燥得到白色固体状的1.23g(90％)pPRO-Phe(1)。¹H NMR(400MHz，D₂O；D₂O配制的钾盐)δ7.20(d，J＝8.8Hz，2H)，6.99(d，J＝8.8Hz，2H)，4.75(s，2H)，3.50(dd，J＝5.6，7.2Hz，1H)，2.95(dd，J＝5.6，13.6Hz，1H)，2.82(dd，J＝7.2，13.6Hz，1H)；¹³C NMR(100MHz，D₂O)δ181.3，164.9，155.6，131.4，130.7，115.3，57.3，56.1，39.3；HRMS(CI)m/z 220.0969[C₁₂H₁₃NO₃(M+1)为220.0968]。

对炔丙基氧苯丙氨酸(化合物1)

实施例6

合成叠氮基染料2

按照以下方案合成叠氮基染料2(参见图6A；化合物2)。0℃，将3-叠氮基丙胺(371mg，3.71mmol，3当量)(按照Carboni等，(1993)，Org.Chem.，58：3736-3741合成)加入丹磺酰氯(500mg，1.85mmol，1当量)和三乙胺(258μL，1.85mmol，1当量)的CH₂Cl₂(10mL)溶液中。搅拌1小时后，反应混合物回暖至室温，再搅拌1小时。真空除去挥发性物质，硅胶层析(Et₂O/己烷＝1∶1)纯化粗产物得到黄色油状的2(548mg，89％)。1H NMR(400MHz，CDCl₃)δ8.55(d，J＝8.4Hz，1H)，8.29(d，J＝8.8Hz，1H)，8.23(dd，J＝1.2，7.2Hz，1H)，7.56-7.49(comp，2H)，7.18(d，J＝7.6Hz，1H)，5.24(br s，1H)，3.21(t，J＝6.4Hz，2H)，2.95(dt，J＝6.4Hz，2H)，2.89(s，6H)，1.62(quin，J＝6.4Hz，2H)；¹³C NMR(100MHz，CDCl₃)δ134.3，130.4，129.7，129.4，128.4，123.3，118.8，115.3，48.6，45.4，40.6，28.7(¹³C NMR光谱中未观察到季碳原子的所有信号)；HRMS(CI)m/z 334.1336[C₁₅H₂₀N₅O₂S(M+1)为334.1332]。

叠氮基染料2(化合物2)

实施例7

合成叠氮基染料3

按照以下方案合成叠氮基染料3(参见图6B；化合物3)。在室温将EDCI(83mg，0.43mmol，1当量)加入荧光胺(fluoresceinamine)(150mg，0.43mmol，1当量)和4-(3-叠氮基丙基氨基甲酰基)-丁酸(92mg，0.43，1当量)的吡啶(2mL)溶液。(通过使3-叠氮基丙胺与谷氨酸酐反应来合成4-(3-叠氮基丙基氨基甲酰基)-丁酸)。搅拌悬浮液过夜，将反应混合物倒入H₂O(15mL)中。通过加入浓盐酸酸化(pH＜2)。搅拌1小时后，滤出沉淀物，用1N HCl(3×3mL)洗涤，用少量EtOAc溶解。加入己烷沉淀得到橙色晶体状的3，收集并真空干燥(200mg，86％)。¹H NMR(400MHz，CD₃OD)δ8.65(s，1H)，8.15(d，J＝8.4Hz，1H)，7.61-7.51(comp，2H)，7.40(d，J＝8.4Hz，1H)，7.35(br s，2H)，7.22-7.14(comp，2H)，6.85-6.56(comp，3H)，3.40-3.24(comp，4H)，2.54(t，J＝7.2Hz，2H)，2.39-2.30(comp，2H)，2.10-1.99(comp，2H)，1.82-1.72(comp，2H)；¹³C NMR(100MHz，CD₃OD)δ175.7，174.4，172.4，167.9，160.8，143.0，134.3，132.9，131.8，129.6，124.4，123.3，121.1，118.5 103.5，50.2，38.0，37.2，36.2，29.8，22.9；4 HRMS(CI)m/z 544.1835[C₂₈H₂₅N₅O₇(M+1)为544.1827]。

叠氮基染料3(化合物3)

实施例8

用于在大肠杆菌中掺入炔基氨基酸的示范性O-RS和O-tRNA

示范性O-tRNA含有SEQ ID NO.：1(参见实施例9，表4)。示例性O-RS含有SEQ ID NOS：4、6、8、10、12、14、16和18所示的氨基酸序列(参见图3和实施例9，表4)。

编码O-RS或其部分的示例性多核苷酸包括编码含有SEQ ID NOS：4、6、8、10、12、14、16和18的氨基酸序列的多核苷酸。例如，SEQ ID NOS：5、7、9、11、13、15、17和19所示多核苷酸编码示范性O-RS。

应知道本文所述实施例和实施方案只是为了说明目的，鉴于这些实施例和实施方案，本领域技术人员可作出各种改进或改变，这些改进或改变应属于本申请的精神和范围以及附加的权利要求的范围内。

虽然为澄清和理解的目的描述了以上发明的一些细节，但本领域技术人员应该明白通过阅读本文内容可在形式和细节中作出各种改进而不脱离本发明的实际范围。例如，可以各种组合使用所有上述技术和设备。如同各份出版物、专利、专利申请和/或其它文件单独表明出于所有目的纳入参考一样，本申请引用的所有出版物、专利、专利申请和/或其它文件出于所有目的全文纳入参考。

实施例9

核苷酸和氨基酸序列

本实施例分别提供各种多核苷酸和多肽的核苷酸和氨基酸序列。表4所提供的序列表示只是提供实例，不应理解为本发明以任何方式局限于表4所提供的序列。

表4

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	1	mutRNACUA_CUA ^Tyr	CCGGCGGUAGUUCAGCAGGGCAGAACGGCGGACUCUAAAUCCGCAUGGCGCUGGUUCAAAUCCGGCCCGCCGGACCA
2	野生型詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)氨基酸序列	MDEFEMIKRNTSEIISEEELREVLKKDEKSAYIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSEFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNDIHYLGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL	1	mutRNACUA_CUA ^Tyr

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	3	野生型詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTACATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGAATTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGATATTCATTATTTAGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	4	pPRO-PheRS-1；具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-1的氨基酸序列(衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶)：Tyr32→Ala32Glu107→Pro107Leu110→Phe110Asp158→Ala158Leu162→Ala162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSPFQFDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYAGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	5	pPRO-PheRS-1核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCGATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCCGTTCCAGTTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGCAATTCATTATGCTGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	6	pPRO-PheRS-2；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-2的氨基酸序列：Tyr32→Ala32Glu107→Lys107Asp158→Ala158Leu162→Ala162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGS KFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYAGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	7	pPRO-PheRS-2核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCGATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTAAGTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGCAATTCATTATGCCGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	8	pPRO-PheRS-3；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-3的氨基酸序列：Tyr32→Ala32Glu107→Arg107Asp158→Ala158Leu162→Pro162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSRFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	9	pPRO-PheRS-3核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCGATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCGGTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGCAATTCATTATCCGGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	10	pPRO-PheRS-4；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-4的氨基酸序列：Tyr32→His32Glu107→Ala107Asp158→Ala158Leu162→Pro162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAHIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSAFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	11	pPRO-PheRS-4核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTCATATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTGCTTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGCAATTCATTATCCTGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	12	pPRO-PheRS-5；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-5的氨基酸序列：Tyr32→Ser32Glu107→Gln107Asp158→Ala158Leu162→Ala162	MDEFEMIKRNTSEIISEEELREVLKKDEKSASIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSQFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYAGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	13	pPRO-PheRS-5核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTTCGATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCAGTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATGCAATTCATTATGCCGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	14	pPRO-PheRS-6；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-6的氨基酸序列：Tyr32→Thr32Glu107→Ser107Asp158→Leu158Ile159→His159Leu162→Pro162	MDEFEMIKRNTSEIISEEELREVLKKDEKSATIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSSFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNLHHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	15	pPRO-PheRS-6核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTACGATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTTCGTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATCTTCATCATTATCCGGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	16	pPRO-PheRS-7；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-7的氨基酸序列：Tyr32→Ala32Glu107→Gln107Asp158→Pro158Ile159→Gly159Leu162→Thr162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSQFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNPGHYTGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	17	pPRO-PheRS-7核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCTATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCAGTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATCCGGGGCATTATACGGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	18	pPRO-PheRS-8；衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，具有以下氨基酸改变的对炔丙基氧苯丙氨酸氨酰-tRNA合成酶分离物-8的氨基酸序列：Tyr32→Ala32Glu107→Pro107Asp158→Ser158Ile159→Leu159Leu162→His162	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSPFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNSLHYHGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	19	pPRO-PheRS-8核苷酸序列	ATGGACGAATTTGAAATGATAAAGAGAAACACATCTGAAATTATCAGCGAGGAAGAGTTAAGAGAGGTTTTAAAAAAAGATGAAAAATCTGCTGCTATAGGTTTTGAACCAAGTGGTAAAATACATTTAGGGCATTATCTCCAAATAAAAAAGATGATTGATTTACAAAATGCTGGATTTGATATAATTATATTGTTGGCTGATTTACACGCCTATTTAAACCAGAAAGGAGAGTTGGATGAGATTAGAAAAATAGGAGATTATAACAAAAAAGTTTTTGAAGCAATGGGGTTAAAGGCAAAATATGTTTATGGAAGTCCTTTCCAGCTTGATAAGGATTATACACTGAATGTCTATAGATTGGCTTTAAAAACTACCTTAAAAAGAGCAAGAAGGAGTATGGAACTTATAGCAAGAGAGGATGAAAATCCAAAGGTTGCTGAAGTTATCTATCCAATAATGCAGGTTAATTCTCTGCATTATCATGGCGTTGATGTTGCAGTTGGAGGGATGGAGCAGAGAAAAATACACATGTTAGCAAGGGAGCTTTTACCAAAAAAGGTTGTTTGTATTCACAACCCTGTCTTAACGGGTTTGGATGGAGAAGGAAAGATGAGTTCTTCAAAAGGGAATTTTATAGCTGTTGATGACTCTCCAGAAGAGATTAGGGCTAAGATAAAGAAAGCATACTGCCCAGCTGGAGTTGTTGAAGGAAATCCAATAATGGAGATAGCTAAATACTTCCTTGAATATCCTTTAACCATAAAAAGGCCAGAAAAATTTGGTGGAGATTTGACAGTTAATAGCTATGAGGAGTTAGAGAGTTTATTTAAAAATAAGGAATTGCATCCAATGGATTTAAAAAATGCTGTAGCTGAAGAACTTATAAAGATTTTAGAGCCAATTAGAAAGAGATTA

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	20	质谱分析所用的突变型肌红蛋白(74-TAG)胰蛋白酶消化肽	HGVTVLTALGY*ILK
21	pPRO-PheRS-共有序列；对炔丙基氧苯丙氨酸氨酰-tRNA合成酶的氨基酸共有序列	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGS[P/Q]FQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHY[A/P]GVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL	20	质谱分析所用的突变型肌红蛋白(74-TAG)胰蛋白酶消化肽	HGVTVLTALGY*ILK
21	pPRO-PheRS-共有序列；对炔丙基氧苯丙氨酸氨酰-tRNA合成酶的氨基酸共有序列		22	pPRO-PheRS-con1	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSPFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYAGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	23	pPRO-PheRS-con2	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSPFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL
24	pPRO-PheRS-con3	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSQFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYAGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL	23	pPRO-PheRS-con2

SEQ ID NO：	描述	序列
SEQ ID NO：	描述	序列	25	pPRO-PheRS-con4	MDEFEMIKRNTSEIISEEELREVLKKDEKSAAIGFEPSGKIHLGHYLQIKKMIDLQNAGFDIIILLADLHAYLNQKGELDEIRKIGDYNKKVFEAMGLKAKYVYGSQFQLDKDYTLNVYRLALKTTLKRARRSMELIAREDENPKVAEVIYPIMQVNAIHYPGVDVAVGGMEQRKIHMLARELLPKKVVCIHNPVLTGLDGEGKMSSSKGNFIAVDDSPEEIRAKIKKAYCPAGVVEGNPIMEIAKYFLEYPLTIKRPEKFGGDLTVNSYEELESLFKNKELHPMDLKNAVAEELIKILEPIRKRL

Claims

1.一种含有在细胞中起作用的第一正交氨酰-tRNA合成酶(O-RS)的真细菌细胞，其中所述O-RS用第一非天然氨基酸优先氨酰化第一正交tRNA(O-tRNA)，所述第一非天然氨基酸是炔基氨基酸。

2.如权利要求1所述的细胞，其特征在于，所述真细菌细胞是大肠杆菌细胞。

3.如权利要求1所述的细胞，其特征在于，所述O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。

4.如权利要求1所述的细胞，其特征在于，所述O-RS衍生自詹氏甲烷球菌酪氨酰-tRNA合成酶。

5.如权利要求1所述的细胞，其特征在于，所述O-RS衍生自具有SEQ ID NO：2所示氨基酸序列的野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。

6.如权利要求1所述的细胞，其特征在于，所述O-RS衍生自具有SEQ ID NO：2所示氨基酸序列的野生型詹氏甲烷球菌酪氨酰-tRNA合成酶，其中所述O-RS具有的氨基酸序列中包含：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸。

7.如权利要求1所述的细胞，其特征在于，所述O-RS含有选自SEQ ID NO：4、6、8、10、12、14、16、18及其保守性变体的氨基酸序列。

8.如权利要求1所述的细胞，其特征在于，所述细胞包含编码所述O-RS的多核苷酸，其中所述O-RS含有选自SEQ ID NO：4、6、8、10、12、14、16、18及其保守性变体的氨基酸序列。

9.如权利要求8所述的细胞，其特征在于，所述多核苷酸选自SEQ ID NO：5、7、9、11、13、15、17或19所示核苷酸序列。

10.如权利要求1所述的细胞，其特征在于，所述O-tRNA是琥珀抑制型tRNA。

11.如权利要求1所述的细胞，其特征在于，所述O-tRNA包含SEQ ID NO：1所示多核苷酸序列或由其编码。

12.如权利要求1所述的细胞，其特征在于，所述炔基氨基酸是对炔丙基氧苯丙氨酸。

13.如权利要求1所述的细胞，其特征在于，包含的核酸含有至少一个选择者密码子，其中所述第一O-tRNA识别所述选择者密码子。

14.如权利要求13所述的细胞，其特征在于，包含第二O-RS和第二O-tRNA，其中所述第二O-RS用第二非天然氨基酸优先氨酰化所述第二tRNA，其中所述第二非天然氨基酸不同于所述第一非天然氨基酸，其中所述第二O-tRNA识别的选择者密码子不同于所述第一O-tRNA所识别的选择者密码子。

15.如权利要求1所述的细胞，其特征在于，包含所述炔基氨基酸。

16.如权利要求15所述的细胞，其特征在于，所述炔基氨基酸是对炔丙基氧苯丙氨酸。

17.如权利要求1所述的细胞，其特征在于，包含翻译系统。

18.如权利要求17所述的细胞，其特征在于，所述翻译系统包含：

(a)所述O-RS；

(b)所述O-tRNA；

(c)编码感兴趣多肽的核酸，所述核酸含有至少一个选择者密码子，其中所述O-tRNA识别所述选择者密码子；

(d)炔基氨基酸，其中所述O-RS能用所述炔基氨基酸加载所述O-tRNA。

19.一种衍生自SEQ ID NO：2所示詹氏甲烷球菌酪氨酰-tRNA合成酶的多肽，其中所述衍生的多肽具有的氨基酸序列中包含：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸；

其中所述多肽是能用炔基氨基酸优先氨酰化正交tRNA(O-tRNA)的氨酰-tRNA合成酶。

20.一种含有SEQ ID NO：4、6、8、10、12、14、16、18所示氨基酸序列或其保守性变体的多肽。

21.如权利要求20所述的多肽，其特征在于，所述多肽是能用炔基氨基酸优先氨酰化真细菌细胞内的正交tRNA(O-tRNA)的氨酰-tRNA合成酶。

22.一种编码如权利要求19、20或21所述多肽的多核苷酸。

23.如权利要求22所述的多核苷酸，其特征在于，所述多核苷酸选自SEQID NO：5、7、9、11、13、15、17和19。

24.一种含有如权利要求22所述多核苷酸的载体。

25.如权利要求24所述的载体，其特征在于，所述载体是表达载体。

26.一种含有如权利要求24所述载体的细胞。

27.一种在真细菌细胞中制备含非天然炔基氨基酸的蛋白质的方法，其中所述炔基氨基酸位于特定位置，该方法包括：

(a)提供真细菌，其含有：

(i)正交氨酰-tRNA合成酶(O-RS)；

(ii)正交tRNA(O-tRNA)，其中所述O-RS用所述炔基氨基酸优先氨酰化所述O-tRNA；

(iii)编码所述蛋白质的核酸，其中所述核酸含有至少一个被O-tRNA识别的选择者密码子；和

(iv)炔基氨基酸；和，

(b)培养所述细胞；

(c)在蛋白质的翻译期间将所述炔基氨基酸掺入所述核酸编码的蛋白质的所述特定位置，其中所述蛋白质的所述特定位置对应于所述核酸中选择者密码子的位置，从而产生在所述特定位置含有所述炔基氨基酸的所述蛋白质。

28.如权利要求27所述的方法，其特征在于，所述真细菌细胞是大肠杆菌细胞。

29.如权利要求27所述的方法，其特征在于，所述O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。

30.如权利要求27所述的方法，其特征在于，所述O-RS衍生自詹氏甲烷球菌酪氨酰-tRNA合成酶。

31.如权利要求27所述的方法，其特征在于，所述O-RS衍生自SEQ ID NO：2所示詹氏甲烷球菌酪氨酰-tRNA合成酶。

32.如权利要求27所述的方法，其特征在于，所述O-RS衍生自SEQ ID NO：2所示詹氏甲烷球菌酪氨酰-tRNA合成酶，其中所述O-RS具有的氨基酸序列中包含：

(a)氨基酸32位的丙氨酸；

(b)氨基酸107位的脯氨酸或谷氨酰胺；

(c)氨基酸158位的丙氨酸；和

(d)氨基酸162位的丙氨酸或脯氨酸。

33.如权利要求27所述的方法，其特征在于，所述O-RS含有选自SEQ ID NO：4、6、8、10、12、14、16、18及其保守性变体的氨基酸序列。

34.如权利要求27所述的方法，其特征在于，所述细胞包含编码所述O-RS的多核苷酸，其中所述O-RS含有选自SEQ ID NO：4、6、8、10、12、14、16、18及其保守性变体的氨基酸序列。

35.如权利要求34所述的方法，其特征在于，所述多核苷酸选自SEQ ID NO：5、7、9、11、13、15、17或19所示核苷酸序列。

36.如权利要求27所述的方法，其特征在于，所述O-tRNA是琥珀抑制型tRNA，所述选择者密码子是琥珀终止密码子(TAG)。

37.如权利要求27所述的方法，其特征在于，所述O-tRNA包含SEQ ID NO：1所示多核苷酸序列或由其编码。

38.如权利要求27所述的方法，其特征在于，所述炔基氨基酸是对炔丙基氧苯丙氨酸。

39.如权利要求27所述的方法，其特征在于，所述蛋白质包含的氨基酸序列与野生型治疗性蛋白质、诊断性蛋白质、工业用酶或其一部分至少有75％相同。

40.如权利要求39所述的方法，其特征在于，所述蛋白质与药学上可接受的运载体结合。

41.如权利要求27所述的方法，其特征在于，在所述特定位置修饰所述蛋白质。

42.如权利要求41所述的方法，其特征在于，所述蛋白质在所述特定位置包含三唑键。