CN101405401A

CN101405401A - 含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达

Info

Publication number: CN101405401A
Application number: CNA2007800092529A
Authority: CN
Inventors: 王江云; P·G·舒尔茨
Original assignee: Scripps Research Institute
Current assignee: Scripps Research Institute
Priority date: 2006-03-16
Filing date: 2007-03-13
Publication date: 2009-04-08
Anticipated expiration: 2027-03-13
Also published as: RU2008135114A; JP2009529877A; WO2007109035A3; EP1994165B1; CA2638772A1; US20070238152A1; US20090209000A1; AU2007227592A1; BRPI0709603A2; JP5249194B2; IL193722A0; US8394605B2; EP1994165A2; US8217145B2; MX2008011669A; EP1994165A4; CN101405401B; WO2007109035A2; KR20080113226A; RU2464315C2

Abstract

本发明涉及tRNA和氨酰基－tRNA合成酶的正交配对，所述配对能将非天然氨基酸苯基硒代半胱氨酸掺入真细菌细胞，例如大肠杆菌中产生的蛋白质中。本发明提供，例如但不限于：新型正交氨酰基－tRNA合成酶、编码该新型合成酶分子的多核苷酸、鉴定和制备该新型合成酶的方法、产生含非天然氨基酸苯基硒代半胱氨酸的蛋白质和翻译系统的方法。本发明还包括通过靶向修饰蛋白质中的苯基硒代半胱氨酸而产生经修饰蛋白质(例如，脂化蛋白质)的方法。

Description

含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达

相关申请的交叉引用

本申请要求以下申请的优先权：2006年3月16日提交的美国临时申请序列号60/783,272；2006年11月28日提交的美国临时申请序列号60/861,456；两篇申请的内容通过引用全文纳入本文。

联邦资助研发下所作发明的权利的声明

本发明在政府的国家卫生研究院(National Institutes of Health)基金号GM62159的支持下作出。政府对本发明享有一定权利。

发明领域

本发明涉及翻译生物化学(translation biochemistry)领域。本发明涉及制备和利用将非天然氨基酸掺入蛋白质的正交tRNA、正交氨酰基-tRNA合成酶及其配对的组合物和方法。

发明背景

在历史上，对蛋白质结构和功能的研究依赖于利用天然氨基酸的反应活性基团的可用特性和反应化学特性。不幸的是，从细菌到人类的每种已知生物编码相同的二十种常见氨基酸。这20种氨基酸包含的官能团数目出乎意料地少：氮碱基、羧酸和酰胺、醇基团和巯基。R-基团的这种有限选择性约束了对蛋白质结构和功能的研究，即天然氨基酸的化学特性限制了这些研究。例如，数量有限的天然反应活性R-基团限制了制备高度靶向的蛋白质修饰而排除蛋白质中其它氨基酸的能力。

涉及蛋白质的化学选择性连接反应对于各种目的至关重要，包括但不限于：研究蛋白质-蛋白质相互作用和细胞信号传导以及产生新型蛋白治疗剂。本领域目前使用的大多数选择性蛋白质修饰反应涉及在亲核和亲电子反应伴侣之间形成靶向蛋白质氨基酸侧链中天然亲核残基的共价键，例如，α-卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情况中，选择性由蛋白质中亲核残基的数目和可接近性决定。不幸的是，天然蛋白质通常含有定位不佳的(例如，不可接近的)反应位点或多个反应靶点(例如，赖氨酸、组氨酸和半胱氨酸残基)，从而导致修饰反应的选择性不佳、难以利用亲核/亲电子试剂进行高度靶向的蛋白质修饰。此外，修饰位点通常局限于赖氨酸、组氨酸或半胱氨酸的天然亲核侧链。难以或不可能在其它位点进行修饰。

本领域需要为修饰和研究蛋白质结构和功能而将非天然氨基酸掺入蛋白质的新方案，其中所述非天然氨基酸具有新型反应化学特性或其它特性，例如，未在天然氨基酸中发现的生物学特性。本领域急需开发能以高度选择性方式修饰蛋白质而且能在生理条件下修饰蛋白质的蛋白质修饰反应新方案。本领域需要产生蛋白质修饰的新方法，其中所述修饰是高度特异性的，例如没有天然氨基酸发生交叉反应或副反应的修饰。高度特异性蛋白质修饰方案的新型化学方法可应用于蛋白质结构和功能研究以及制备治疗性蛋白质的各领域。

蛋白质脂化

蛋白质脂化是参与蛋白质定位、正确胞内蛋白质运输和蛋白质-蛋白质相互作用的关键翻译后修饰。蛋白质脂化常是正确的生物学活性所需。该特征对于开发一些治疗性蛋白质而言至关重要。脂化对于研究蛋白质-蛋白质相互作用和细胞信号传导也至关重要。不幸的是，利用天然未脂化形式的蛋白质进行体外化学选择性连接以产生脂化蛋白质极其困难，一般仅限于修饰独特的表面暴露半胱氨酸残基。

许多细胞蛋白质的生物学活性需要与细胞膜结合，这取决于半胱氨酸通过脂质残基，例如法尼基、肉豆蔻酰基和棕榈酰基部分的翻译后修饰(Chernomordik和Kozlov(2003)，Annual Review of Biochemistry 72：175-207)。例如，许多G-蛋白偶联受体是棕榈酰化的。Ras蛋白是法尼基化和棕榈酰化的(Chernomordik和Kozlov(2003)，Annual Review of Biochemistry 72：175-207)。虽然蛋白质法尼基化是稳定而不可逆的修饰，但棕榈酰化是可逆的，从而能动态调节蛋白质功能和特异性靶向细胞膜(Rocks等，(2005)，Science 307(5716)：1746-1752)。此外，γ-羧基谷氨酸是凝血连锁中钙依赖性膜附着至关重要的必需修饰(Davie等，(1991)，Biochemistry 30(43)：10363-10370)。

正交翻译系统

克服遗传密码有限的局限性的一种方法是扩大遗传密码并将具有新型反应特性的氨基酸加入生物库(biological repertoire)中。现已开发了在原核和真核生物内将各种非天然氨基酸体内位点特异性地掺入蛋白质的通用方法。这些方法依赖于在体内多肽翻译期间识别合适的选择者密码子而将所需非天然氨基酸插入规定位置的正交蛋白质翻译组分。这些方法利用识别选择者密码子的正交tRNA(O-tRNA)，进而相应的特异性正交氨酰基-tRNA合成酶(O-RS)用非天然氨基酸加载该O-tRNA。这些组分不与宿主生物中任何内源性tRNA、RS、氨基酸或密码子交叉反应(即，它必须是正交的)。利用这种正交tRNA-RS配对能遗传学编码大量结构上有差异的氨基酸。

适于制备含一个或多个非天然氨基酸的蛋白质的正交翻译系统的实施是本领域公知的，例如产生正交翻译系统的通用方法。例如，参见国际公开号WO 2002/086075，名为“产生正交tRNA-氨酰基-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITION FOR THE PRODUCTION OFORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS)；WO2002/085923，名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS)；WO 2004/094593，名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)；WO2005/019415，2004年7月7日提交；WO 2005/007870，2004年7月7日提交；WO 2005/007624，2004年7月7日提交和WO 2006/110182，2005年10月27日提交，名为“用于体内掺入非天然氨基酸的正交翻译组分”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)。这些申请各自通过引用全文纳入本文。掺入非天然氨基酸的正交翻译系统及其产生和使用方法的其它讨论还可参见Wang和Schultz，“扩展遗传密码”(Expanding theGenetic Code)，Chem.Commun.(Camb.)1：1-11(2002)；Wang和Schultz，“扩展遗传密码”(Expanding the Genetic Code)，Angewandte Chemie Int.Ed，44(1)：34-66(2005)；Xie和Schultz，“扩展遗传密码”(An Expanding GeneticCode)，Methods 36(3)：227-238(2005)；Xie和Schultz，“扩展的遗传密码”(An Expanding Genetic Code)，Methods 36(3)：227-238(2005)；Xie和Schultz，“将氨基酸加入遗传库”(Adding Amino Acids to the Genetic Repertoire)，Curr.Opinion in Chemical Biology 9(6)：548-554(2005)；Wang等，“扩展遗传密码子”(Expanding the Genetic Code)，Annu.Rev.Biophys.Biomol.Struct.，35：225-249(2006)；Xie和Schultz，“蛋白质的化学工具盒-扩展的遗传密码”(A Chemical Toolkit for Proteins-an Expanded Genetic Code)，Nat.Rev.Mol.Cell Biol.，7(10)：775-782(2006)。

本领域需要开发将非天然氨基酸掺入蛋白质的正交翻译组分，其中所述非天然氨基酸可掺入规定的位置，而所述非天然氨基酸具有的新化学特性能将该氨基酸作为特异性修饰(例如，脂化)的靶标从而能排除与蛋白质中其它位点的交叉反应或副反应。阅读下文后可明白本文所述发明满足了这些和其它需求。

发明概述

本发明提供在体内(例如在宿主细胞内)对选择者密码子(selector codon)如琥珀终止密码子起反应而将非天然氨基酸苯基硒代半胱氨酸(phenylselenocysteine)掺入延伸中的多肽链的组合物和方法。这些组合物包含不与宿主细胞翻译机制相互作用的正交-tRNA(O-tRNA)和正交氨酰基-tRNA合成酶(O-RS)配对。即，宿主细胞内源性氨酰基-tRNA合成酶不会用氨基酸(天然或非天然)加载O-tRNA。类似地，本发明提供的O-RS不以显著水平或者某些情况下不以可检测水平地用氨基酸(天然或非天然)加载内源性tRNA。这些新组合物能够产生含有翻译掺入的非天然氨基酸的大量蛋白质。苯基硒代半胱氨酸非天然氨基酸的化学特性还允许靶向修饰该残基，从而能产生所需偶联物，例如但不限于脂质偶联物。这些特异性修饰的蛋白质可用作治疗剂或用于生物医学研究。

在一些方面，本发明提供翻译系统。这些系统包含第一正交氨酰-tRNA合成酶(O-RS)、第一正交tRNA(O-tRNA)和第一非天然氨基酸，即苯基硒代半胱氨酸，其中所述第一O-RS用所述第一非天然氨基酸，苯基硒代半胱氨酸优先氨酰化所述第一O-tRNA。在一些方面，O-RS用所述苯基硒代半胱氨酸优先氨酰化O-tRNA的效率至少为含有相同O-tRNA、苯基硒代半胱氨酸和含有SEQ ID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到的效率的50％。

该翻译系统可使用衍生自各种来源的组分。在一个实施方式中，用于该系统的O-RS可包含SEQ ID NO：4、6或8所示氨基酸序列及该序列的保守变体。在一些实施方式中，O-tRNA是琥珀抑制型tRNA。在一些实施方式中，O-tRNA包含SEQ ID NO：1所示(多核苷酸序列)或由其编码。

在一些方面，翻译系统还包含编码感兴趣蛋白质的核酸，其中所述核酸具有O-tRNA识别的至少一个选择者密码子。

在一些方面，翻译系统包含利用第二非天然氨基酸的第二正交对(即第二O-RS和第二O-tRNA)，现在该系统能在多肽的不同所选位置掺入至少两个不同的非天然氨基酸。在这种双重系统中，第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸优先氨酰化第二O-tRNA，而第二O-tRNA识别不同于第一O-tRNA识别的选择者密码子的选择者密码子。

在一些实施方式中，翻译系统位于宿主细胞中(包括该宿主细胞)。所用的宿主细胞不作具体限定，只要O-RS和O-tRNA在它们的宿主细胞环境中保留它们的正交性即可。所述宿主细胞可以是真细菌细胞如大肠杆菌。所述宿主细胞可含有一种或多种编码包括O-RS或O-tRNA在内的翻译系统组分的多核苷酸。在一些实施方式中，编码O-RS的多核苷酸包含SEQ IDNO：5、7或9所示核苷酸序列。

本发明还提供产生在所选位置含有一个或多个非天然氨基酸的蛋白质的方法。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤：(i)第一非天然氨基酸，即苯基硒代半胱氨酸；(ii)第一正交氨酰基-tRNA合成酶(O-RS)；(iii)第一正交tRNA(O-tRNA)，其中所述O-RS用所述非天然氨基酸优先氨酰化所述O-tRNA；和(iv)编码蛋白质的核酸，其中所述核酸含有O-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述非天然氨基酸掺入所述蛋白质的所选位置，从而产生在所选位置含有所述非天然氨基酸的蛋白质。在这些方法的一些方面，所述O-RS用苯基硒代半胱氨酸优先氨酰化所述O-tRNA的效率至少为含有相同O-tRNA、苯基硒代半胱氨酸和含有SEQ ID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到效率的50％。在一些方面，翻译系统包含编码O-RS的核酸。

可利用各种试剂广泛实施这些方法。在一些实施方式中，提供编码O-RS的多核苷酸。在一些实施方式中，所述O-RS含有SEQ ID NO：4、6或8所示氨基酸序列或及其保守变体。这些方法所用的翻译系统包含编码O-RS的核酸，例如SEQ ID NO：5、7或9所示的核酸。

在这些方法的一些实施方式中，提供翻译系统的步骤包括通过定点诱变使野生型氨酰基-tRNA合成酶的氨基酸结合口袋发生突变，选择用所述非天然氨基酸优先氨酰化所述O-tRNA的所得O-RS。所述选择步骤包括定点诱变后从得到的氨酰基-tRNA合成酶分子库进行所述O-RS的正选择和负选择。在一些实施方式中，提供步骤提供编码O-tRNA的多核苷酸，例如，O-tRNA是琥珀抑制型tRNA，或者O-tRNA包含SEQ ID NO：1所示多核苷酸序列或由其编码。在这些方法中，提供步骤还包括提供含有翻译系统所用的琥珀选择者密码子的核酸。

还可改进这些方法以在蛋白质中掺入一个以上非天然氨基酸。在那些方法中，联用第二正交翻译系统与第一翻译系统，其中第二系统具有不同的氨基酸和选择者密码子特异性。例如，提供步骤可包括提供第二O-RS和第二O-tRNA，其中第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸优先氨酰化第二O-tRNA，且第二O-tRNA识别核酸中不同于第一O-tRNA识别的选择者密码子的选择者密码子。

还可在宿主细胞内实施产生含非天然氨基酸的蛋白质的方法。在这些情况中，提供的宿主细胞含有非天然氨基酸、O-RS、O-tRNA和含至少一个选择者密码子的核酸，而培养该宿主细胞可导致非天然氨基酸的掺入。在一些实施方式中，提供步骤包括提供真细菌宿主细胞(例如，大肠杆菌)。在一些实施方式中，提供步骤包括提供含有编码O-RS的多核苷酸的宿主细胞。例如，编码O-RS的多核苷酸可包含SEQ ID NO：5、7或9所示的核苷酸序列。

在这些方法的一些改进形式中，所述流程还包括将苯基硒代半胱氨酸掺入多肽后对其进行修饰。例如，所述苯基硒代半胱氨酸可在某些条件下反应从而导致在所选位置转化成脱氢丙氨酸。该反应可以通过氧化消除进行。可通过使苯基硒代半胱氨酸与过氧化氢接触进行该反应。

本发明还提供产生脂化蛋白质的方法，其中所述脂质偶联于指定的所选位置。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤：(i)苯基硒代半胱氨酸非天然氨基酸；(ii)正交氨酰基-tRNA合成酶(O-RS)；(iii)正交tRNA(O-tRNA)，其中所述O-RS用所述苯基硒代半胱氨酸优先氨酰化所述O-tRNA；和(iv)编码蛋白质的核酸，其中所述核酸含有O-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述苯基硒代半胱氨酸掺入所述蛋白质的所选位置。然后该苯基硒代半胱氨酸经反应而在所选位置产生脱氢丙氨酸，其自身进而与脂质反应以产生脂化氨基酸部分，从而产生在蛋白质的所选位置含有脂质的蛋白质。

在这些方法的一些方面，通过氧化消除或与过氧化氢接触使得苯基硒代半胱氨酸反应。在一些方面，与脱氢丙氨酸反应的偶联脂质可以是硫代棕榈酸、法尼基硫醇(farnesylmercaptan)或1-十六烷硫醇(hexadecanethiol)。如此形成的脂化氨基酸是棕榈酰基半胱氨酸、法尼基半胱氨酸和S-十六烷基半胱氨酸(hexadecylcysteine)。一般通过迈克尔加成反应进行脱氢丙氨酸的修饰。

本发明还提供产生在所选位置具有脱氢丙氨酸的蛋白质的方法。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤：(i)苯基硒代半胱氨酸非天然氨基酸；(ii)正交氨酰基-tRNA合成酶(O-RS)；(iii)正交tRNA(O-tRNA)，其中所述O-RS用所述苯基硒代半胱氨酸优先氨酰化所述O-tRNA；和(iv)编码蛋白质的核酸，其中所述核酸含有O-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述苯基硒代半胱氨酸掺入所述蛋白质的所选位置。然后该苯基硒代半胱氨酸经反应而在所选位置产生脱氢丙氨酸。在这些方法的一些方面，通过氧化消除或与过氧化氢接触使得苯基硒代半胱氨酸反应。

本发明还提供各种包含核酸和蛋白质的各种组合物。除了组合物含有所述核酸或蛋白质外，对该组合物的性质不作具体限制。本发明组合物可含有任何数量的任何性质的其它组分。

例如，本发明提供含有O-RS多肽的组合物，其中所述多肽含有SEQ IDNO：4、6或8所示氨基酸序列或其保守变体。在一些方面，所述保守变体多肽用非天然氨基酸氨酰化关联(cognate)正交tRNA(O-tRNA)的效率至少为含有该O-tRNA、该非天然氨基酸和含有SEQ ID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到的效率的50％。本发明还提供编码上述任何多肽的多核苷酸。在一些实施方式中，这些多核苷酸可含有SEQ ID NO：5、7或9所示核苷酸序列。在一些实施方式中，多肽在细胞中。

本发明还提供含有SEQ ID NO：5、7或9所示核苷酸序列的多核苷酸组合物。在一些实施方式中，本发明提供含有所述多核苷酸的载体，如表达载体。在一些实施方式中，本发明提供含有上述载体的细胞。

定义

在详细描述本发明前，应该知道本发明不局限于具体的生物系统，本发明当然可以有各种变化。还应知道本文所用的术语只是为了描述具体的实施方式，而非限制性的。除非另有明确指出，本说明书和随附的权利要求书中使用的单数形式“一个”、“一种”和“该”也包括复数对象。因此，例如述及“一个细胞”包括两个或多个细胞的组合；“一个多核苷酸”实际上包括该多核苷酸的多份拷贝。

除了此处和说明书以下其余部分所定义的，本文所用的所有技术和科学术语都与本发明所属领域普通技术人员常规理解的意义相同。

正交：本文所用的术语“正交”指与某细胞或翻译系统的内源性相应分子相比，某分子(例如，正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))与该细胞内源性组分起作用的效率降低，或不能与该细胞的内源性组分起作用。就tRNA和氨酰-tRNA合成酶而言，正交指与和内源性tRNA合成酶起作用的内源性tRNA相比，正交tRNA不能与内源性tRNA合成酶起作用或起作用的效率降低；或者与和内源性tRNA起作用的内源性tRNA合成酶相比，正交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低，所述效率降低例如，小于20％的效率，小于10％的效率，小于5％的效率，或小于1％的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如，与内源性RS氨酰化内源性tRNA相比，细胞的任何内源性RS氨酰化细胞中正交tRNA的效率降低或者甚至为0。在另一例子中，与内源性RS氨酰化内源性tRNA相比，正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者降为0。可将能与第一正交分子起作用的第二正交分子引入细胞。例如，正交tRNA/RS配对包括引入的互补组份，与对照，例如相应的tRNA/RS内源性配对或活性正交配对(如酪氨酰正交tRNA/RS配对)相比，它们在细胞中共同起作用的效率是，例如45％效率、50％效率、60％效率、70％效率、75％效率、80％效率、90％效率、95％效率或99％效率，或更高。

正交酪氨酰-tRNA：本文所用的正交酪氨酰-tRNA(酪氨酰-O-tRNA)是与感兴趣翻译系统正交的tRNA，其中所述tRNA是：(1)与天然酪氨酰-tRNA相同或基本类似；(2)通过天然或人工诱变衍生自天然酪氨酰tRNA；(3)由考虑了(1)或(2)的野生型或突变型酪氨酰tRNA序列的任何方法产生；(4)与野生型或突变型酪氨酰tRNA同源；(5)与图2中称为酪氨酰tRNA合成酶底物的任何示例性tRNA同源；或(6)图2中称为酪氨酰tRNA合成酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可加载有氨基酸，或处于非负载状态。还应知道“酪氨酰-O-tRNA”任选被关联(cognate)合成酶分别加载(氨酰化)除酪氨酸以外的氨基酸，例如非天然氨基酸。应该知道，实际上优选利用本发明酪氨酰-O-tRNA在翻译期间对选择者密码子起反应而基本上可将任何氨基酸(无论天然或人工的)掺入延伸的多肽内。

正交酪氨酰氨基酸合成酶：本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-O-tRNA的合成酶。酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸，无论是天然的还是人工的，并且不限于本文所述的。该合成酶任选与天然酪氨酰氨基酸合成酶相同或同源，或者与图2中称为O-RS的合成酶相同或同源。例如，所述O-RS可以是图2的酪氨酰-O-RS的保守变体，和/或与图2中O-RS的序列至少有50％、60％、70％、80％、90％、95％、98％、99％或以上相同。

关联(cognate)：术语“关联”指共同起作用的组分，例如正交tRNA和正交氨酰基-tRNA合成酶。这些组分也可互称为“互补的”。

优先氨酰化：对于本文所用正交翻译系统而言，当某表达系统中O-RS使O-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时，该O-RS“优先氨酰化”关联O-tRNA。即，当翻译系统中存在摩尔比大致相等的O-tRNA与任何给定的内源性tRNA时，O-RS使O-tRNA带上氨基酸的频率高于它使内源性tRNA带上氨基酸的频率。当翻译系统中存在等摩尔浓度的O-tRNA与内源性tRNA时，由O-RS加载的O-tRNA与由O-RS加载的内源性tRNA的相对比例优选较高，最好导致O-RS仅加载或几乎仅加载O-tRNA。当存在等摩尔浓度的O-tRNA与O-RS时，由O-RS加载的O-tRNA与由O-RS加载的内源性tRNA的相对比例大于1∶1，优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

当(a)与内源性tRNA相比，O-RS优先氨酰化O-tRNA，和(b)与O-RS用任何天然氨基酸氨酰化O-tRNA相比，氨酰化对非天然氨基酸特异时，O-RS“用非天然氨基酸优先氨酰化O-tRNA”。即，当包含O-RS和O-tRNA的翻译系统中存在等摩尔量的非天然和天然氨基酸时，O-RS用非天然氨基酸加载O-tRNA的频率高于加载天然氨基酸的频率。加载有非天然氨基酸的O-tRNA与加载有天然氨基酸的O-tRNA的相对比例优选较高。O-RS最好使O-tRNA仅仅加载，或者几乎仅仅加载有非天然氨基酸。当翻译系统中存在等摩尔浓度的天然和非天然氨基酸时，使O-tRNA带上非天然氨基酸与使O-tRNA带上天然氨基酸的相对比例大于1∶1，优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

选择者密码子：术语“选择者密码子”指翻译过程中为O-tRNA所识别而不为内源性tRNA所识别的密码子。O-tRNA反密码子环识别mRNA上的选择者密码子并在多肽的此位置掺入其氨基酸，例如非天然氨基酸。选择者密码子可包括，例如无义密码子，如终止密码子(如，琥珀、赭石和乳白密码子)；四碱基或四碱基以上密码子；罕用密码子；衍生自天然或非天然碱基对的密码子，等等。

抑制型tRNA：抑制型tRNA是在多肽翻译期间通常对终止密码子起反应而掺入氨基酸(即，“连读”)来改变给定的翻译系统中信使RNA(mRNA)阅读的tRNA。在一些方面，本发明的选择者密码子是抑制型密码子，例如，终止密码子(如，琥珀、赭石和乳白密码子)、四碱基密码子、罕用密码子等。

抑制活性：本文所用的术语“抑制活性”总体上指tRNA(例如，抑制型tRNA)能翻译连读在其它情况中可导致翻译终止或错译(例如，移码)的密码子(例如，作为选择者密码子的琥珀密码子或四个或以上个碱基的密码子)的能力。抑制型tRNA的抑制活性可表示为与第二抑制型tRNA，或与对照系统，例如缺乏O-RS的对照系统相比，观察到的翻译连读活性的百分比。

本发明提供定量测定抑制活性的各种方法。具体O-tRNA和O-RS对感兴趣选择者密码子(例如，琥珀密码子)的抑制百分比指，在感兴趣的翻译系统中，在编码表达测试标记的核酸中含有选择者密码子的给定表达测试标记(例如，LacZ)的活性与阳性对照构建物相比的百分比，所述感兴趣的翻译系统包含O-RS和O-tRNA，所述阳性对照没有O-tRNA、O-RS和选择者密码子。因此，例如，如果在给定翻译系统中观察到不含选择者密码子的活性阳性对照标记构建物的活性为X(其单位与所述标记试验相关)，则含有选择者密码子的测试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境条件下(除了该测试标记构建物在也含有O-tRNA和O-RS的翻译系统中表达外)，该测试标记构建物显示的X百分比。表达该测试标记的翻译系统一般也包含O-RS和O-tRNA识别的氨基酸。可任选通过将测试标记与“背景”或“阴性”对照标记构建物比较来校正抑制百分比的测量值，所述“背景”或“阴性”对照标记构建物含有与测试标记相同的选择者密码子，但其所在的系统不含O-tRNA、O-RS和/或O-tRNA和/或O-RS识别的相关氨基酸。该阴性对照可用于标准化抑制百分比测定值以补偿感兴趣的翻译系统中标记的背景信号的影响。

可通过本领域已知的许多试验测定抑制效率。例如，可采用β-半乳糖苷酶报道试验，如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)连同含有本发明的O-tRNA的质粒引入合适生物(例如，可利用正交组分的生物)的细胞。还可引入关联合成酶(可以是多肽或表达时能编码该关联合成酶的多核苷酸)。细胞在培养基中生长至所需密度，例如至OD₆₀₀约为0.5，进行β-半乳糖苷酶试验，例如用诺瓦金公司(Novagen)的BetaFluor^TM β-半乳糖苷酶试验试剂盒。可将抑制百分比计算为样品相对于可比较对照，例如，衍生的lacZ构建物的观察值的活性百分比，该衍生的lacZ构建物在所需位置具有相应的有义密码子而非选择者密码子。

翻译系统：术语“翻译系统”指将氨基酸掺入延伸中的多肽链(蛋白质)的各组分。翻译系统的组分可包括，例如核糖体、tRNA、合成酶、mRNA等。本发明的O-tRNA和/或O-RS可加入体外或体内翻译系统或是其一部分，例如存在于非真核细胞，如细菌(如大肠杆菌)中，或存在于真核细胞中，如酵母菌、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。

非天然氨基酸：本文所用的术语“非天然氨基酸”指不在20种常见天然氨基酸之列的任何氨基酸，修饰的氨基酸和/或氨基酸类似物。例如，本发明可使用非天然氨基酸苯基硒代半胱氨酸(参见图1，结构1)。

衍生自：本文所用的术语“衍生自”指分离自特定分子或生物，或是用特定分子或生物的信息制得的某组份。例如，衍生自第二多肽的多肽含有与该第二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例，可通过，例如天然产生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍生多肽的诱变可以是有意定向或有意随机的，或混用两种方法。诱变多肽以产生衍生自第一(多肽)的不同多肽可以是随机的(例如，聚合酶失真所致)，看通过合适的筛选方法，例如本文所述的方法鉴定衍生的多肽。诱变多肽通常需要对编码该多肽的多核苷酸进行操作。

正选择或筛选标记：本文所用的术语“正选择或筛选标记”指当存在该标记时(例如被表达或激活等)可从不具有特征的细胞中鉴定出具有特征的细胞，例如具有正选择标记的细胞。

负选择或筛选标记：本文所用的术语“负选择或筛选标记”指当存在该标记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如，与确实具有该特性或特征的细胞相比)。

报道分子：本文所用的术语“报道分子”是指可用于鉴定和/或选择感兴趣系统的靶组分的组分。例如，报道分子可以包括蛋白质，如能赋予抗生素抗性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光筛选标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如萤火虫萤光素酶蛋白)、亲和力筛选标记，或者可选择的正或负标记基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、ura3、leu2、lys2等。

真核生物：本文所用的术语“真核生物”指属于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而区别于原核生物：典型的多细胞组织(但不都是多细胞，例如酵母)，存在膜限制的核与其它膜限制的细胞器，线形遗传物质(即，线形染色体)，不存在操纵子，存在内含子、信使(RNA)加帽和poly-A mRNA，以及其它生物化学特征，如不同的核糖体结构。真核生物包括，例如动物(如哺乳动物、昆虫、爬行动物、鸟等)，纤毛虫，植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动物等。

原核生物：本文所用的术语“原核生物”指属于原核生物界(也称为原核生物(Procarya))的生物。原核生物通常因其以下特征而区别于真核生物：单细胞组织，通过出芽或分裂的无性生殖，缺乏膜限制的核与其它膜限制的细胞器，环状染色体，存在操纵子，不存在内含子、信使(RNA)加帽和poly-A mRNA，以及其它生物化学特征，如不同的核糖体结构。原核生物包括真细菌和古细菌(Archaea)(有时称为“古细菌(Archaebacteria)”)亚界。在原核生物界有时将蓝细菌(蓝绿藻)与支原体分为不同类别。

细菌：本文所用的术语“细菌”和“真细菌”指不同于古细菌的原核生物。类似地，古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准区分真细菌和古细菌。例如，可采用核糖体RNA序列、RNA聚合酶结构的差异，存在或不存在内含子，抗生素敏感性，存在或不存在细胞壁肽聚糖和其它细胞壁组分，膜脂质的分枝与不分枝结构，存在/不存在组蛋白和组蛋白样蛋白而将某生物指定为真细菌或古细菌。

真细菌的例子包括大肠杆菌(Escherichia coli)、嗜热栖热菌(Thermusthermophilus)、枯草芽孢杆菌(Bacillus subtilis)和嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)等)。古细菌的例子包括詹氏甲烷球菌(Methanococcusjannaschii)(Mj)、梅氏甲烷八叠球菌(Methanosarcina mazei)(Mm)、嗜热碱甲烷杆菌(Methanobacteriurn thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、甲烷嗜热菌(Methanopyrus kandleri)、盐细菌(Halobacterium)(例如沃氏富盐菌(Haloferax volcanii)和盐细菌种NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcus furiosus)(Pf)、极端嗜热古菌(Pyrococcus horikoshii)(Ph)、好氧火球菌(Pyrobaculum aerophilum)、Pyrococcus abyssi、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、Sulfolobustokodaii、嗜热泉生古细菌(Aeuropyrum pernix)(Ap)、嗜酸热原体(Thermoplasmaacidophilum)和火山热原体(Thermoplasma volcanium)。

保守性变体：就翻译组分而言，本文所用的术语“保守性变体”指在功能上类似于和该保守性变体相似的基本组分，例如O-tRNA或O-RS，但与参比O-tRNA或O-RS相比，序列中有变异的某翻译组份，例如保守性变体O-tRNA或保守性变体O-RS。例如，O-RS或该O-RS的保守性变体可用苯基硒代半胱氨酸非天然氨基酸氨酰化关联O-tRNA。在该例子中，所述O-RS及保守性变体O-RS的氨基酸序列不相同。所述保守性变体在序列中可具有例如一处变异、两处变异、三处变异、四处变异或五处或更多处变异，只要该保守性变体仍与关联的相应O-tRNA或O-RS互补(例如，与之起作用)。

在一些实施方式中，保守性变体O-RS与衍生其的O-RS相比，含有一个或多个保守性氨基酸取代。在一些实施方式中，保守性变体O-RS与衍生其的O-RS相比，含有一个或多个保守性氨基酸取代，此外还保留了O-RS的生物学活性；例如，保守性变体O-RS保留了衍生其的亲本O-RS分子至少10％，或者至少20％，至少30％，或至少40％的生物学活性。在一些优选实施方式中，所述保守性变体O-RS保留了衍生其的亲本O-RS分子至少50％的生物学活性。保守性变体O-RS的保守性氨基酸取代可出现在该O-RS的任何结构域内，包括氨基酸结合口袋。

选择或筛选试剂：本文所用的术语“选择或筛选试剂”指当其存在时可从某群体中选择/筛选某些组分的试剂。例如，选择或筛选试剂可以是但不限于，如营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可根据例如浓度、强度等而不同。

起反应：本文所用的术语“起反应”指本发明的O-tRNA识别选择者密码子并介导与该tRNA偶联的非天然氨基酸掺入延伸中的多肽链的过程。

编码：本文所用的术语“编码”指用多聚大分子或序列链中的信息来指导不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用的该术语应用广泛，可用于各领域。在一些方面，术语“编码”描述了半保留DNA复制的过程，其中双链DNA分子的一条链用作模板通过依赖DNA的DNA合成酶来编码新合成的互补姊妹链。

在另一方面，术语“编码”指用一种分子的信息来指导产生化学性质不同于该第一分子的第二种分子的任何过程。例如，DNA分子可编码RNA分子(例如，通过依赖DNA的RNA聚合酶参与的转录过程)。RNA分子也可编码多肽，例如翻译过程。当术语“编码”用于描述翻译过程时，其含义也延伸至编码氨基酸的三联密码子。在一些方面，RNA分子可编码DNA分子，例如通过依赖RNA的DNA合成酶参与的逆转录过程。在另一方面，DNA分子可编码多肽，应该知道该情况用“编码”同时包括转录和翻译过程。

附图简述

图1提供非天然氨基酸苯基硒代半胱氨酸的化学结构(结构1)以及可从苯基硒代半胱氨酸衍生的结构。这些结构包括脱氢丙氨酸(2)、棕榈酰基半胱氨酸(3)、法尼基半胱氨酸(4)、S-十六烷基半胱氨酸(5)和γ-羧基谷氨酸(6)。

图2提供本发明可用的各种核苷酸好氨基酸序列。

发明详述

本发明提供因20种天然氨基酸而受限的使用翻译系统固有局限性的解决方案。所述解决方案包括涉及利用正交翻译系统将非天然氨基酸苯基硒代半胱氨酸(图1，结构1)编程性、位点特异性生物合成掺入蛋白质的组合物和方法。通过工程改造编码感兴趣蛋白质的多核苷酸序列，使之含有选择者密码子从而将苯基硒代半胱氨酸编程性掺入蛋白质的任何所需位置，而所述选择者密码子能发出将非天然氨基酸掺入延伸中的多肽链的信号。

本发明提供包含新型氨酰基-tRNA合成酶(O-RS)的新组合物，所述合成酶能用苯基硒代半胱氨酸加载合适的关联抑制型O-tRNA(例如，SEQ IDNO：1所示的O-tRNA)。这些O-RS是能在细菌宿主细胞中用非天然氨基酸苯基硒代半胱氨酸选择性加载O-tRNA的詹氏甲烷球菌(Methanococcusjannaschii)酪氨酰-tRNA合成酶新型突变体。这些正交组分最优选不与宿主细胞(例如，大肠杆菌细胞)翻译机制的内源性宿主组分交叉反应。

本发明O-RS可包括SEQ ID NO：4、6或8所示O-RS。本发明提供编码这些O-RS多肽的多核苷酸。本文还描述了开发能在真细菌中起作用而对选择者密码子起反应起作用，从而位点特异性地掺入苯基硒代半胱氨酸非天然氨基酸的新型O-tRNA/O-RS配对的方法。

本发明还提供对选择者密码子(例如，琥珀无义密码子，TAG)起反应而高度有效且位点特异性地将苯基硒代半胱氨酸(图1，结构1)掺入蛋白质(优选体内)的方法。这些新方法和组合物可用于，例如细菌宿主系统中。

在一些情况中，在将苯基硒代半胱氨酸非天然氨基酸掺入多肽后，可对其进行特异性且区域选择性的修饰，如本文所述。由于苯基硒代基团的反应化学特性，可以极高选择性地修饰其所掺入的蛋白质。在一些情况中，苯基硒代半胱氨酸非天然氨基酸反应基团的优点是其对于体内系统完全是外来的，从而能提高反应选择性。在一些方面，可采用能在体外和体内进行涉及蛋白质的偶连反应并保留宿主细胞活力和/或蛋白质生物学活性的相对温和反应条件进行修饰反应。

在一些方面，掺入的苯基硒代半胱氨酸部分经修饰，然后，例如通过偶连反应再次修饰该修饰产物。

最终偶连于蛋白质中所选位置(对应于编码蛋白质的开放读框中的选择者密码子)的材料的性质不作具体限定，其可以使任何所需的实体，例如脂质、染料、荧光团、交联剂、糖衍生物、聚合物(例如，聚乙二醇的衍生物)、光交联剂、细胞毒性化合物、亲和力标记、生物素衍生物、树脂、小珠、第二蛋白质或多肽(或更多的)、一种或多种多核苷酸(例如，DNA、RNA等)、金属螯合剂、辅助因子、脂肪酸、碳水化合物等。

在一些方面，为演示(但不限于)本发明，本文内容描述了掺入模型蛋白质，例如肌红蛋白、人生长激素好GFP中的苯基硒代半胱氨酸非天然氨基酸部分。不是要将苯基硒代半胱氨酸非天然氨基酸的掺入局限于任何特定蛋白质。应该知道，可利用本发明的指导将苯基硒代半胱氨酸非天然氨基酸掺入感兴趣的任何所需蛋白质。产生包含一个好多个苯基硒代半胱氨酸非天然氨基酸(单独或与其它不同的非天然氨基酸组合)的蛋白质对于各种目的，例如用于治疗性蛋白质和研究目的是有利的。

苯基硒代半胱氨酸的修饰

在一些方面，本发明提供在将苯基硒代半胱氨酸氨基酸残基掺入多肽后对其进行修饰的方法。一种这样的修饰，例如氧化切割可有利地将苯基硒代半胱氨酸氨基酸残基转化成α，β-不饱和氨基酸脱氢丙氨酸(参见图1，结构2)。该脱氢丙氨酸非天然氨基酸也具有反应性，随后可对其进行修饰。

本发明不应局限于苯基硒代半胱氨酸转化成脱氢丙氨酸的任何具体机制(例如，氧化消除)或特定反应条件(例如，与过氧化氢接触)。本领域普通技术人员应该知道可等效用于本发明将苯基硒代半胱氨酸残基转化成脱氢丙氨酸的各种其它合适的机制和反应条件。

脱氢丙氨酸的修饰

在一些方面，本发明提供进一步修饰多肽中脱氢丙氨酸非天然氨基酸残基的方法。所述脱氢丙氨酸残基具有反应性，可在高度特异性修饰反应中作为靶标。这些方法尤其可用于形成脂质偶连物以产生脂化蛋白质。

如本文所述，非天然氨基酸脱氢丙氨酸的迈克尔加成反应可产生具有编程性、位点特异性翻译后修饰的蛋白质。例如，脱氢丙氨酸与巯基-脂质反应可产生脂化蛋白质。例如，与硫代棕榈酸反应可产生棕榈酰基半胱氨酸(参见图1，结构3)、与法尼基硫醇反应可产生法尼基半胱氨酸(参见图1，结构4)、而与丙二酸(盐或酯)反应可产生γ-羧基谷氨酸(参见图1，结构6)。此外，与1-十六烷基硫醇反应看产生S-十六烷基半胱氨酸(参见图1，结构5)。

虽然本说明书提供了这些实例，但应该知道本发明不限于修饰(偶连)脱氢丙氨酸的任何具体机制(例如，迈克尔加成途径)或特定试剂(巯基-脂质)。本领域普通技术人员知道其它各种合适的机制、反应条件好试剂可等效地用于本发明来修饰脱氢丙氨酸残基。实际上，修饰脱氢丙氨酸残基不限于脂质偶连，采用该偶连机制可将任何所需部分偶连于脱氢丙氨酸的位置。

正交tRNA/氨酰基-tRNA合成酶技术

理解与正交tRNA和正交氨酰-tRNA合成酶配对有关的活性有助于理解本发明的新型组合物和方法。为在遗传密码中加入额外的非天然氨基酸，需要含有氨酰基-tRNA合成酶和适当tRNA的新正交配对，它们可在宿主翻译机制中有效起作用，但对于所述翻译系统是“正交”的，这意味着它可不依赖于翻译系统的内源性合成酶和tRNA而起作用。正交配对的所需特征包括能解码或识别不由任何内源性tRNA解码的仅一种特定密码子(例如选择者密码子)的tRNA，和只能用一种特定非天然氨基酸优先氨酰化其关联tRNA(或“使之负载”)的氨酰基-tRNA合成酶。内源性合成酶通常不氨酰化O-tRNA。例如，在大肠杆菌宿主系统中，正交配对包括不与任何内源性tRNA(例如，大肠杆菌中有40种)交叉反应的氨酰基-tRNA合成酶和不被任何内源性合成酶(例如，大肠杆菌中有21种)氨酰化的正交tRNA。

本领域已知适于制备含有一个或多个非天然氨基酸的蛋白质的正交翻译系统，例如制备正交翻译系统的通用方法。例如，可参见国际公开号WO2002/086075，名为“产生正交tRNA-氨酰基-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITIONS FOR THE PRODUCTION OFORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS)；WO2002/085923，名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS)；WO 2004/094593，名为“扩展真核遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)；2004年7月7日提交的WO 2005/019415；2004年7月7日提交的WO 2005/007870；2004年7月7日提交的WO 2005/007624；和2005年10月27日提交的WO 2006/110182，名为“用于体内掺入非天然氨基酸的正交翻译组分”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)。这些出版物各自通过引用全文纳入本文。掺入非天然氨基酸的正交翻译系统和它们的产生及使用方法的讨论还可参见Wang和Schultz，“扩展遗传密码”(Expanding theGenetic Code)，Angewandte Chemie Int.Ed.，44(1)：34-66(2005)；Xie和Schultz，“扩展的遗传密码”(An Expanding Genetic Code)，Methods36(3)：227-238(2005)；Xie和Schultz，“将氨基酸加入遗传库”(AddingAmino Acids to the Genetic Repertoire)，Curr.Opinion in Chemical Biology9(6)：548-554；Wang等，“扩展遗传密码”(Expanding the Genetic Code)，Annu.Rev.Biophys.Biomol.Struct.，35：225-249(2006)；Ryu和Schultz，“在大肠杆菌中有效掺入非天然氨基酸”(Efficient Incorporation of UnnaturalAmino Acids into Proteins in Escherichia coli)，Nat.Methods(4)：263-265(2006)；这些文献的内容通过引用全文纳入本文。

正交翻译系统

正交翻译系统一般包括含有正交tRNA(O-tRNA)、正交氨酰基tRNA合成酶(O-RS)和非天然氨基酸的细胞(可以是原核细胞，例如大肠杆菌)，其中所述O-RS用非天然氨基酸氨酰化所述O-tRNA。本发明的正交配对可以包括O-tRNA，例如抑制型tRNA、移码tRNA等和关联O-RS。本发明的正交系统通常包含处于宿主细胞环境中或无宿主细胞的O-tRNA/O-RS配对。除多组分系统外，本发明还提供各种新型组分，例如，新型正交氨酰基-tRNA合成酶多肽(例如，SEQ ID NO：4、6或8)和编码那些多肽的多核苷酸(例如，SEQ ID NO：5、7或9)。

当正交配对识别选择者密码子并对该选择者密码子起反应而加载氨基酸时，通常称该正交配对“抑制”该选择者密码子。即，翻译系统的(即，细胞的)内源性机制不识别的选择者密码子通常不被加载，从而阻断了多肽产生，否则可自核酸翻译该多肽。在正交配对系统中，O-RS用特定的非天然氨基酸氨酰化O-tRNA。加载的O-tRNA识别选择者密码子并抑制选择者密码子所致的翻译阻断。

在一些方面，与包含本文序列表所示多核苷酸序列或由其编码的O-tRNA的抑制效率相比，本发明的O-tRNA识别选择者密码子并在有关联合成酶存在下对选择者密码子起反应而具有至少约，例如，45％、50％、60％、75％、80％或90％或更高的抑制效率。

在一些实施方式中，联用O-RS和O-tRNA的抑制效率是缺乏O-RS的O-tRNA的抑制效率的约，例如5倍、10倍、15倍、20倍或25倍或更高。在一些方面，联用O-RS和O-tRNA的抑制效率是本文序列表所示正交合成酶配对的抑制效率的至少约，例如35％、40％、45％、50％、60％、75％、80％或90％或更高。

宿主细胞利用O-tRNA/O-RS配对将非天然氨基酸掺入延伸中的多肽链，例如经由包含编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸包含所述O-tRNA识别的选择者密码子。在某些优选方面，细胞可包含一种或多种其它O-tRNA/O-RS配对，其中所述其它O-RS用不同的非天然氨基酸加载所述其它O-tRNA。例如，O-tRNA之一可识别四碱基密码子，其它O-tRNA可识别终止密码子。或者，多个不同的终止密码子或多个不同的四碱基密码子可用于同一编码核酸。

应注意，在一些实施方式中，细胞或其它翻译系统中可存在多个O-tRNA/O-RS配对，从而能将多个非天然氨基酸掺入多肽。例如，细胞还可包含额外的不同O-tRNA/O-RS配对和第二非天然氨基酸，其中该额外的O-tRNA识别第二选择者密码子，该额外的O-RS用该第二非天然氨基酸优先氨酰化该额外的O-RS。例如，包含O-tRNA/O-RS配对的细胞(其中所述O-tRNA识别，例如琥珀选择者密码子)还可包含第二正交配对，其中该第二O-tRNA识别不同的选择者密码子，例如乳白密码子、四碱基密码子等。不同的正交配对优选衍生自不同来源，从而有助于识别不同的选择者密码子。

在某些实施方式中，系统包含例如大肠杆菌细胞等细胞，这些细胞含有正交tRNA(O-tRNA)、正交氨酰基tRNA合成酶(O-RS)、非天然氨基酸和包含编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸包含所述O-tRNA识别的选择者密码子。翻译系统还可以是无细胞系统，例如与本文所述O-tRNA/O-RS配对和非天然氨基酸组合的各种市售可得“体外”转录/翻译系统。

O-tRNA和/或O-RS可以是天然产生的，或者可以是，例如天然tRNA和/或RS经突变衍生，例如，通过产生各种生物的tRNA文库和/或RS文库和/或采用各种可用的突变方案。例如，产生正交tRNA/氨酰基-tRNA合成酶配对的一种方案包括将，例如除宿主细胞外来源的异源(对宿主细胞而言)tRNA/合成酶配对输入宿主细胞。候选异源合成酶的特性包括，例如不加载任何宿主细胞tRNA，候选异源tRNA的特性包括，例如不被任何宿主细胞合成酶所氨酰化。此外，异源tRNA对于所有宿主细胞合成酶是正交的。产生正交配对的第二种方案包括产生用于筛选和/或选择O-tRNA或O-RS的突变体文库。也可联用这些方案。

正交tRNA(O-tRNA)

本发明的正交tRNA(O-tRNA)优选在例如体内或体外介导将非天然氨基酸掺入蛋白质内，所述蛋白质由含选择者密码子的多核苷酸编码，而这种选择者密码子可被O-tRNA识别。在某些实施方式中，与包含本文序列表中O-tRNA序列所示多核苷酸序列或由其编码的O-tRNA相比，本发明的O-tRNA在相关合成酶存在下，对选择者密码子起反应而具有至少45％、50％、60％、75％、80％、90％或更高的抑制效率。

可通过本领域已知的多种试验测定抑制效率。例如，可采用β半乳糖苷酶报道分子试验，例如，将衍生的lacZ质粒(该构建物含有选择者密码子和lacZ核酸序列)和含有本发明O-tRNA的质粒一起导入合适生物(如可利用正交组分的生物)的细胞内。还可导入关联合成酶(或者多肽或表达时可编码关联合成酶的多核苷酸)。将细胞在培养基内培养到所需密度，如OD₆₀₀约0.5时，采用例如诺瓦金公司(Novagen)的BetaFluor^TM β-半乳糖苷酶检测试剂盒进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较对照(如衍生的lacZ构建物的观察值)的活性百分数，所述构建物在所需位置上含有有义密码子而不是选择者密码子。

本发明O-tRNA的例子见本文序列表，例如参见图2和SEQ ID NO：1。本文内容还提供了设计其它等价O-tRNA的指导。在RNA分子(例如O-RSmRNA或O-tRNA分子)中，与给定序列(或对编码DNA而言反之亦然)或其互补序列相比，胸腺嘧啶(T)被尿嘧啶(U)取代。还可存在碱基的其它修饰以大量产生功能等价分子。

本发明还包括对应于本文具体O-tRNA的O-tRNA保守性变体。例如，O-tRNA保守性变体包括功能与具体(例如本文序列表中的)O-tRNA相似的，和因合适的自身互补性而保留了tRNA的L-形结构但不具有与例如序列表或图2所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些分子。

含O-tRNA的组合物还可包含正交氨酰基-tRNA合成酶(O-RS)，其中所述O-RS用非天然氨基酸优先氨酰化O-tRNA。在某些实施方式中，含有O-tRNA的组合物还可包含(例如体外或体内)翻译系统。细胞中也可存在含有编码感兴趣多肽的多核苷酸的核酸或这些物质中一个或多个的组合，其中所述多核苷酸含有O-tRNA能识别的选择者密码子。

产生正交tRNA(O-tRNA)的方法也是本发明的特征之一。在本发明的某些实施方式中，可通过构建突变体文库来产生O-tRNA。突变体tRNA文库可用本领域已知的各种诱变技术构建。例如，可通过位点特异性突变、随机位点突变、同源重组、DNA改组或其它递归诱变(recursive mutagenesis)方法、嵌合体构建、或者这些技术的任何组合产生突变体tRNA，例如SEQID NO：1所示O-tRNA。

也可将其它突变引入特定位置，例如tRNA的所需环或区域中一个或多个非保守位置、保守位置、一个或多个随机位置或者二者的组合位置，如反密码子环、接纳茎、D臂或环、可变环、TPC臂或环、tRNA分子的其它区域或其组合。tRNA中的突变通常包括使突变型tRNA文库内各成员的反密码子环突变以使其能识别选择者密码子。该方法还可包括给O-tRNA加上额外序列。与起始材料(例如多种tRNA序列)相比，O-tRNA通常提高了对所需生物的正交性，同时保留其对所需RS的亲和力。

这些方法任选包括分析tRNA和/或氨酰基-tRNA合成酶序列的相似性(和/或所推断的同源性)以确定显示与特定生物正交的潜在候选O-tRNA、O-RS和/或其配对。可利用本领域已知和本文所述的计算机程序进行这种分析，例如可用BLAST和pileup程序。在一个实施例中，为筛选用于大肠杆菌的可能的正交翻译组分，可选择与真细菌生物不显示接近的序列相似性的合成酶和/或tRNA。

通常可通过，例如负选择第一物种的细胞群以获得O-tRNA，其中所述细胞含有多种潜在O-tRNA的某成员。负选择可去除含有被细胞内源性氨酰基-tRNA合成酶(RS)氨酰化的潜在O-tRNA文库某成员的细胞。这样就可以得到第一物种细胞的正交tRNA库。

某些实施方式在负选择中将选择者密码子引入编码负选择标记(例如能赋予抗生素抗性的酶如β内酰胺酶；能得到可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶(CAT)，所述产物例如是毒性产物，如芽孢杆菌RNA酶)的多核苷酸的非必须位置(例如，仍能产生功能性芽孢杆菌RNA酶)等。还任选在有选择性试剂(比如抗生素，如氨苄青霉素)存在下培养细胞群来进行筛选/选择。在一个实施方式中，选择性试剂的浓度不同。

例如，为检测抑制型tRNA的活性，可利用基于选择者密码子的体内抑制的选择系统，例如将无义(如终止)或移码突变引入编码负选择标记的多核苷酸(如编码β半乳糖苷酶的基因(bla))中。例如，构建在某位置(如，A184)含有选择者密码子的多核苷酸变体，如bla变体。用这些多核苷酸转化细胞，如细菌。以不能被内源性大肠杆菌合成酶有效加载的正交tRNA为例，抗生素抗性，例如氨苄青霉素抗性应约为或小于未用质粒转化的细菌。如果tRNA不是正交的，或者能加载tRNA的异源合成酶在此系统内共同表达，应可观察到更高水平的抗生素(如氨苄青霉素)抗性。选出那些在抗生素浓度与未用质粒转化的细胞大致相等的LB琼脂平板上不能生长的细胞，如细菌。

以毒性产物(如核糖核酸酶或芽孢杆菌RNA酶)为例，当多种潜在的tRNA成员被内源性宿主(如大肠杆菌)合成酶(即与宿主如大肠杆菌合成酶不是正交的)氨酰化时，选择者密码子被抑制，所产生的毒性多核苷酸产物导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞可存活。

然后，在一个实施方式中，对与所需生物正交的tRNA库进行正选择，其中将选择者密码子置于正选择标记中(例如抗药性基因(如β内酰胺酶基因)编码的标记)。对以下细胞进行正选择：含有编码与该细胞正交的tRNA库某成员的多核苷酸或包含该成员的多核苷酸、含有编码正选择标记的多核苷酸和含有编码关联RS的多核苷酸。在某些实施方式中，第二群细胞含有不能通过负选择除去的细胞。该多核苷酸在胞内表达，细胞在有选择试剂(如氨苄青霉素)存在下生长。然后选择能被共同表达的关联合成酶氨酰化以及对此选择者密码子起反应而插入氨基酸的tRNA。与一种或多种含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比，这些细胞通常显示抑制效率升高。含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞对该抗生素敏感。因此在两次选择中能保留下的tRNA是：(i)不是内源性宿主(如大肠杆菌)合成酶的底物；(ii)能被感兴趣的合成酶氨酰化；以及(iii)能在翻译过程中起作用。

因此，取决于筛选所处的环境，同一标记可以是正或负标记。即，如果为了筛选该标记，则它是正标记，但如果为了抵御该标记则它是负标记。

上述方法中，筛选，如正选择、负选择或者正负选择的严格性任选包括改变选择的严格性。例如，由于芽孢杆菌RNA酶是毒性极高的蛋白质，可通过将不同数目的选择者密码子引入到芽孢杆菌RNA酶基因内和/或使用可诱导启动子来控制负选择的严格性。在另一实施例中，选择或筛选试剂的浓度(如氨苄青霉素的浓度)可以不同。在本发明的一些方面，因为在前几轮中所需活性较低，严格性可以不同。因此，前几轮适用较低的严格性标准，而后几轮选择适用更严谨的标准。在某些实施方式中，负选择、正选择或者正负选择可重复多次。也可使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方式中，正选择标记和负选择标记可以相同。

其他类型的选择/筛选方法也可用于本发明以制备正交翻译组分，如O-tRNA、O-RS和能对选择者密码子起反应而加载非天然氨基酸的O-tRNA/O-RS配对。例如，负选择标记、正选择标记或正负选择标记可包括发荧光的或在合适反应物存在下能催化发光反应的标记。在另一实施方式中，可通过荧光激活细胞分选(FACS)或发光检测标记的产物。标记任选可包括亲和筛选标记。也参见Francisco，J.A.等，(1993)，“在外表面表达功能性抗体片段的大肠杆菌的制备与荧光激活细胞分选”(Production and fluorescence-activatedcell sorting of Escherichia coli expressing a functional antibody fragement on theexternal surface)，Proc Natl Acad Sci USA.，90：10444-8。

制备重组正交tRNA的其它方法可见，例如名为“制备正交tRNA-氨酰-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITIONSFOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNASYNTHETASE PAIRS)的国际专利公布WO 2002/086075；名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO2004/094593；与2004年7月7日提交的WO 2005/019415。也参见Forster等，(2003)，“通过翻译从头设计的遗传密码来编程肽模拟合成酶”(Programming peptidomimetic synthetases by translating genetic codesdesigned de novo)，PNAS，100(11)：6353-6357；和Feng等，(2003)，“通过单氨基酸改变扩大tRNA合成酶的tRNA识别”(Expanding tRNArecognition of a tRNA synthetase by a single amino acid change)，PNAS，100(10)：5676-5681。

正交氨酰基-tRNA合成酶(O-RS)

本发明的O-RS在体外或体内能用非天然氨基酸优先氨酰化O-tRNA。可通过含O-RS的多肽和/或编码O-RS或其部分的多核苷酸将本发明的O-RS提供给翻译系统(如细胞)。例如，示例性O-RS包含SEQ ID NO：4、6或8所示氨基酸序列或其保守变体。在另一实施例中，O-RS或其部分是由多核苷酸序列或其互补多核苷酸序列编码，该多核苷酸序列编码含有本文序列表和实施例所示的氨基酸序列。可参见，例如SEQ ID NO：5、7或9所示多核苷酸。

鉴定可与O-tRNA一起应用的正交氨酰基-tRNA合成酶(O-RS)的方法也是本发明的特征之一。例如，该方法包括选择(如正选择)第一物种的细胞群，其中所述细胞各自含有：1)多种氨酰基-tRNA合成酶(RS)的成员之一(例如，所述多种RS可包括突变型RS、衍生自第一物种之外物种的RS，或二者)；2)正交tRNA(O-tRNA)(例如，一个或多个物种的)；以及3)编码选择(例如正选择)标记并含有至少一个选择者密码子的多核苷酸。与缺乏所述多种RS的成员或成员数目少的细胞相比，选择或筛选出显示抑制效率提高的那些细胞。可用本领域已知和本文所述的方法测定抑制效率。抑制效率提高的细胞包含能氨酰化O-tRNA的活性RS。将第一物种的第一组tRNA被活性RS氨酰化的水平(体外或体内)与第二物种的第二组tRNA被活性RS氨酰化的水平作比较。通过可检测物质(例如，标记的非天然氨基酸)测定氨酰化水平。通常选择与第一组tRNA相比更有效地氨酰化第二组tRNA的活性RS，从而获得能与O-tRNA联用的有效(优化)正交氨酰基-tRNA合成酶。采用这种方法鉴定的O-RS也是本发明的特征之一。

可用许多试验来测定氨酰化。这些试验可在体外或体内进行。例如，体外氨酰化试验可见例如Hoben和Soll，(1985)，Methods Enzymol.，113：55-59。也可联用报道分子和正交翻译组分并检测细胞中的报道分子来测定氨酰化，所述细胞表达含有至少一个选择者密码子并编码某蛋白质的多核苷酸。也参见名为“非天然氨基酸的体内掺入”(IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS)的WO 2002/085923和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO2004/094593。

还可进一步改造所鉴定的O-RS以改变该合成酶的底物特异性，从而使得O-tRNA只加载上所需的非天然氨基酸，而不是任何常见的20种氨基酸。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA-合成酶的方法包括，例如通过组合合成酶不同的结构域而使合成酶在其活性位点、在其编辑机理位点、在不同位点发生突变等，并应用选择方法。也可以采用先正选择再负选择的方案。在正选择中，抑制引入阳性标记的一个或多个非重要位置的选择者密码子使得细胞在正选择压力下存活。在同时有天然和非天然氨基酸存在时，如此存活的细胞编码使正交抑制型tRNA带有天然或非天然氨基酸的活性合成酶。在负选择中，抑制引入阴性标记的一个或多个非重要位置的选择者密码子使合成酶失去天然氨基酸特异性。经正、负选择而存活的细胞编码只用非天然氨基酸氨酰化(加载)正交抑制型tRNA的合成酶。然后通过例如DNA改组或其它递归诱变方法进一步诱变这些合成酶。

可采用本领域已知的各种诱变技术产生突变型O-RS文库。例如，可用位点特异性突变、随机点突变、同源重组、DNA改组或其它递归诱变方法，嵌合构建或它们的组合来制备突变型RS。例如，可从两种或更多种其它如较小、多样性较低的“亚文库”来制备突变型RS文库。本发明也包括RS的嵌合文库。应注意，可以构建各种生物(例如微生物，如真细菌或古细菌)的tRNA合成酶文库，例如具有天然多样性的文库(参见，例如授予Short等的美国专利号6,238,884；授予Schallenberger等的美国专利号5,756,316；授予Petersen等的美国专利号5,783,431；授予Thompson等的美国专利号5,824,485；授予Short等的美国专利号5,958,672)，并任选构建和筛选正交配对。

一旦合成酶经历正和负选择/筛选方法，就可进一步诱变这些合成酶。例如可分离编码O-RS的核酸；从该核酸制备编码突变O-RS的一组多核苷酸(例如通过随机诱变、位点特异性诱变、重组或它们的任何组合)；可重复各步骤或各步骤的组合直至获得用非天然氨基酸优先氨酰化O-tRNA的突变O-RS。在本发明的一些方面，这些步骤可进行多次，例如至少两次。

本发明方法也可采用其它水平的选择/筛选严格性来产生O-tRNA、O-RS或其配对。可改变O-RS产生方法中一个或两个步骤的选择或筛选严格性。这包括，例如，改变选择/筛选试剂的用量等。也可额外进行几轮正和/或负选择。选择或筛选也可包括以下一种或多种改变：氨基酸渗透性、翻译效率、翻译保真度(translational fidelity)等。一种或多种改变通常依据用正交tRNA-tRNA合成酶配对来产生蛋白质的生物中一种或多种基因突变。

产生O-RS并改变合成酶底物特异性的其它常规细节见名为“产生正交tRNA-氨酰基tRNA合成酶配对的方法和组合物”(METHODS ANDCOMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNAAMINOACYL-tRNA SYNTHETASE PAIRS)的WO 2002/086075和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的WO 2004/094593。也可参见Wang和Schultz，“扩展遗传密码”(Expandingthe Genetic Code)，Angewandte Chemie Int.Ed.，44(1)：34-66(2005)，其内容以引用方式全文纳入。

来源和宿主生物

本发明可用的正交翻译组分(O-tRNA和O-RS)可衍生自任何生物(或生物的组合)从而可用于任何其它物种的宿主翻译系统，只要所述O-tRNA/O-RS组分与宿主系统能以正交方式起作用。某正交配对中的O-tRNA和O-RS无需衍生自同一生物。在一些方面，正交组分衍生自用于真细菌宿主系统的古菌(即，古细菌)基因。

例如，正交O-tRNA可衍生自古菌生物，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜高热菌(Methanopyrus kandleri)、梅氏甲烷八叠球菌(Mm)、耐超高温热棒菌(Pyrobaculum aerophilum)、Pyrococcus abyssi、硫磺矿硫化叶菌(Ss)、超嗜热古菌(Sulfolobus tokodaii)、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌(Bacillus subtilis)、嗜热脂肪芽孢杆菌等；而正交O-RS可衍生自以下生物(或生物的组合)，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜高热菌、梅氏甲烷八叠球菌、耐超高温热棒菌、Pyrococcus abyssi、硫磺矿硫化叶菌、超嗜热古菌、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。在一个实施方式中，真核生物来源，例如植物、藻类、原生动物、真菌、酵母菌、动物(例如哺乳动物、昆虫、节肢动物等)等也可用作O-tRNA和O-RS的来源。

O-tRNA/O-RS配对的各组分可衍生自同一生物或不同生物。在一个实施方式中，O-tRNA/O-RS配对可来自同一生物。或者，O-tRNA/O-RS配对的O-tRNA和O-RS可来自不同生物。

O-tRNA、O-RS或O-tRNA/O-RS配对可在体内或体外选择或筛选和/或可用于细胞，例如真细菌细胞，从而产生含有非天然氨基酸的多肽。所述真细菌细胞例如但不限于大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。含本发明翻译组分的真细菌细胞组合物也是本发明特征之一。

为在一种生物中筛选O-tRNA和/或O-RS以用于另一种生物，也可参见2004年4月16日提交的名为“扩展真核生物遗传密码”(EXPANDINGTHE EUKARYOTIC GENETIC CODE)的国际申请公布号WO 2004/094593。

虽然正交翻译系统(例如，含有O-RS、O-tRNA和非天然氨基酸)可利用培养的宿主细胞产生含非天然氨基酸的蛋白质，但并非要求本发明的正交翻译系统需要完整的、有活力的宿主细胞。例如，在有细胞提取物存在下，正交翻译系统可利用无细胞系统。实际上，使用无细胞的体外转录/翻译系统产生蛋白质是公认的技术。利用本文所述的正交翻译系统组分，使这些体外系统适用于产生含非天然氨基酸的蛋白质也属于本发明的范围。

选择者密码子

本发明的选择者密码子扩大了蛋白质生物合成机理的遗传密码子框架。例如，选择者密码子包括，独特的三碱基密码子、无义密码子(如终止密码子(如琥珀密码子(UAG)或乳白密码子(UGA)))、非天然密码子、至少四碱基的密码子、罕用密码子等。可将许多选择者密码子引入所需基因，例如一个以上、两个以上、三个以上等。利用不同的选择者密码子，可采用多对正交tRNA/合成酶配对，从而能利用这些不同的选择者密码子同时位点特异性地掺入多个不同的非天然氨基酸，例如包含至少一个非天然氨基酸。

在一个实施方式中，这些方法包括利用作为终止密码子的选择者密码子，在体内即细胞中掺入非天然氨基酸。例如，制备能识别终止密码子的O-tRNA，并由O-RS用非天然氨基酸氨酰化该O-tRNA。宿主的天然氨酰基-tRNA合成酶不识别该O-tRNA。可采用常规的定点诱变将终止密码子引入编码感兴趣多肽的多核苷酸中感兴趣的位点。可参见，例如Sayers，J.R.等，(1988)，“硫代磷酸酯寡核苷酸定向诱变中的5’，3’核酸外切酶”(5′，3′Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis)，Nucleic Acids Res，791-802。当例如在体内联用O-RS、O-tRNA和编码感兴趣多肽的核酸时，可对终止密码子起反应而掺入非天然氨基酸，从而获得在特定位点含有非天然氨基酸的多肽。在本发明的一个实施方式中，用作选择者密码子的终止密码子是琥珀密码子UAG和/或乳白密码子UGA。在一实施例中，UAG和UGA都用作选择者密码子的遗传密码可编码22个氨基酸，同时保留赭石无义密码子，UAA，其是最丰富的终止信号。

体内掺入非天然氨基酸不会对宿主细胞有显著干扰。例如，在非真核细胞，如大肠杆菌中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)与释放因子1(RF1)(其可结合UAG密码子，进而引起延伸中的肽链从核糖体释放)之间的竞争，因此通过，例如提高O-tRNA(如抑制型tRNA)的表达水平，或利用RF1缺陷型菌株可以调节抑制效率。在真核细胞中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)和真核释放因子(如eRF)(其可结合终止密码子，进而引起延伸中的肽链从核糖体释放)之间的竞争，因此通过，例如提高O-tRNA(如抑制型tRNA)的表达水平可以调节抑制效率。此外，也可存在其它化合物，例如还原剂，如二硫苏糖醇(DTT)。

非天然氨基酸也可由罕用密码子编码。例如，当体外蛋白合成反应中的精氨酸浓度下降时，证实罕用的精氨酸密码子AGG可利用丙氨酸酰化的合成tRNA而有效插入ala。可参见Ma等，Biochemistry，32：7939(1993)。在此情况中，合成tRNA可与大肠杆菌中作为次要成分存在的天然tRNAArg竞争。此外，一些生物不能利用所有的三联密码子。藤黄微球菌(Micrococcusluteus)的未指定密码子AGA可用于在体外将氨基酸插入转录/翻译提取物中。可参见，例如Kowal和Oliver，Nucl.Acid.Res.，25：4685(1997)。体内利用这些罕用密码子可以产生本发明的各组分。

选择者密码子也可包括延伸密码子，例如四个或四个以上碱基的密码子，如四个、五个、六个或更多碱基的密码子。四碱基密码子的例子包括，例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子包括，例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明方法可包括使用基于移码抑制的延伸密码子。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质。在其它实施方式中，反密码子环可解码例如至少一种四碱基密码子、至少一种五碱基密码子或至少一种六碱基密码子或更多。由于可能的四碱基密码子有256种，所以同一细胞中可用四个或四个以上碱基的密码子编码多种非天然氨基酸。也可参见，Anderson等，(2002)，“密码子和反密码子大小极限的研究”(Exploring the Limits of Codon and Anticodon Size)，Chemistry and Biology，9：237-244和Magliery，(2001)，“扩增遗传密码：在大肠杆菌中选择有效的四碱基密码子抑制剂并用文库方法鉴定“变化的”四碱基密码子”(Expanding the Genetic Code：Selection of Efficient Suppressors of Four-baseCodons and Identification of″Shifty″Four-base Codons with a LibraryApproach in Escherichia coli)，J.Mol.Biol.，307：755-769。

例如，已采用体外生物合成方法利用四碱基密码子将非天然氨基酸掺入蛋白质。参见，例如Ma等，(1993)，Biochemistry，32：7939和Hohsaka等，(1999)，J.Am.Chem.Soc.，121：34。联用CGGG和AGGU及两种化学酰化的移码抑制型tRNA在体外将2-萘基丙氨酸和赖氨酸的NBD衍生物掺入链霉亲和素。可参见，例如Hohsaka等，(1999)，J.Am.Chem.Soc.，121：12194。在体内研究中，Moore等检测了含NCUA反密码子的tRNA^Leu衍生物抑制UAGN密码子(N可以是U、A、G或C)的能力，发现含UCUA反密码子的tRNA^Leu解码四联UAGA的效率为13到26％，而在0或-1读框中几乎不解码。可参见Moore等，(2000)，J.Mol.Biol.，298：195。在一个实施方式中，本发明可利用基于罕用密码子或无义密码子的延伸密码子，它们能降低在其它不期望位点的错义连读(missense readthrough)和移码抑制。四碱基密码子已在各种正交系统中用作选择者密码子。可参见，例如，WO 2005/019415；WO 2005/007870和WO 2005/07624。也可参见Wang和Schultz，“扩展遗传密码”(Expanding the Genetic Code)，Angewandte ChemieInt.Ed.，44(1)：34-66(2005)，其内容通过引用的方式全文纳入。虽然以下例子利用琥珀选择者密码子，但通过改进本文的实例使之包含四碱基O-tRNA和经修饰的合成酶，从而能包含与之前描述的各非天然氨基酸O-RS相似的突变，四碱基或更多碱基的密码子也可使用。

对于给定系统，选择者密码子还可包括天然三碱基密码子中内源性系统不用(或很少用)的那个天然碱基密码子。例如，这包括缺乏能识别该天然三碱基密码子的tRNA的系统，和/或该三碱基密码子是罕用密码子的系统。

选择者密码子任选包含非天然碱基对。这些非天然碱基对进一步扩大了现有的遗传字符集(genetic alphabet)。一种额外的碱基对可将三联密码子的数目从64增加至125。第三碱基对的特性包括：稳定和选择性的碱基配对，利用聚合酶高保真地有效酶促掺入DNA，新生非天然碱基对合成后引物继续有效延伸。适用于这些方法和组合物的非天然碱基对的描述包括：例如Hirao等，(2002)，“将氨基酸类似物掺入蛋白质的非天然碱基对”(Anunnatural base pair for incorporating amino acid analogues into protein)，Nature Biotechnology，20：177-182。也可参见Wu，Y.等，(2002)，J.Am.Chem.Soc.，124：14626-14630。下文列出了其它的相关出版物。

对于体内使用，非天然核苷是膜可渗透的，并可磷酸化形成相应的磷酸三酯。此外，增加的遗传信息稳定且不为细胞酶所破坏。Benner与他人先前的工作利用了不同于经典Watson-Crick配对的氢键模式，其中最值得注意的例子是异-C：异-G配对(iso-C：iso-G pair)。参见，例如Switzer等，(1989)，J.Am.Chem.Soc.，111：8322；Piccirilli等，(1990)，Nature，343：33；Kool，(2000)，Curr.Opin.Chem.Biol.，4：602。这些碱基通常与天然碱基有一定程度的错配，因而不能酶促复制。Kool和同事证明，碱基间的疏水包装相互作用(hydrophobic packing interaction)可替代氢键以驱动碱基对形成。参见Kool，(2000)，Curr.Opin.Chem.Biol.，4：602；Guckian和Kool，(1998)，Angew.Chem.hit.Ed.Engl.，36：2825。在致力于开发符合以上所有要求的非天然碱基对的过程中，Schultz、Romesberg和同事已系统地合成并研究了一系列非天然疏水碱基。发现PICS:PICS自身配对比天然碱基对更稳定，并可用大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地掺入DNA。可参见，例如McMinn等，(1999)，J.Am.Chem.Soc.，121：11586；和Ogawa等，(2000)，J.Am.Chem.Soc.，122：3274。就生物学功能而言，KF合成3MN:3MN自身配对的效率和选择性足够。可参见，例如Ogawa等，(2000)，J.Am.Chem.Soc.，122：8803。然而，这两种碱基均起到进一步复制的链终止子的作用。近来开发了可用于复制PICS自身配对的突变型DNA聚合酶。此外，可复制7AI自身配对。可参见，例如Tae等，(2001)，J.Am.Chem.Soc.，123：7439。还已开发了与Cu(II)结合后可形成稳定配对的金属碱基(metallobase)对Dipis：Py。可参见，Meggers等，(2000)，J.Am.Chem.Soc.，122：10714。因为延伸密码子和非天然密码子在本质上与天然密码子正交，所以本发明方法可利用该特性产生它们的正交tRNA。

还可利用一种翻译旁路系统将非天然氨基酸掺入所需多肽。在翻译旁路系统中，可将一个大序列插入基因，但该序列不翻译成蛋白质。该序列含有可作为提示的结构，从而能诱导核糖体跳过该序列然后恢复该插入序列的下游翻译。

非天然氨基酸

本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种遗传编码的α-氨基酸以外的任何氨基酸、修饰的氨基酸或氨基酸类似物：丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α-氨基酸的通用结构如式I所示：

非天然氨基酸一般具有式I所示的任何结构，其中R基团是除20种天然氨基酸中所用以外的任何取代基。20种天然氨基酸的结构可参见，例如《生物化学》(Biochemistry)，L.Stryer编，第三版，1988，福里曼公司(Freemanand Company)，纽约。注意，本发明的非天然氨基酸可以是除以上20种α-氨基酸以外的天然化合物。

由于本发明的非天然氨基酸与天然氨基酸通常区别在侧链，所以非天然氨基酸与其它氨基酸(例如天然或非天然的)形成酰胺键的方式与天然蛋白质中酰胺键的形成方式相同。然而，非天然氨基酸的侧链不同于天然氨基酸的侧链。

本文特别感兴趣的是非天然氨基酸苯基硒代半胱氨酸(参见图1，结构1)。除了苯基硒代半胱氨酸非天然氨基酸外，可将其它非天然氨基酸同时掺入感兴趣的多肽，例如联用合适的第二O-RS/O-tRNA配对与本发明提供的正交配对。已知许多这样的非天然氨基酸和合适的正交配对。参见本文内容和本文引用的参考文献。例如，参见Wang和Schultz，“扩展遗传密码”(Expanding the Genetic Code)，Angewandte Chemie Int.Ed.，44(1)：34-66(2005)；Xie和Schultz，“扩展遗传密码”(An Expanding Genetic Code)，Methods 36(3)：227-238(2005)；Xie和Schultz，“将氨基酸加入遗传库”(Adding Amino Acids to the Genetic Repertoire)，Curr.Opinion in ChemicalBiology 9(6)：548-554(2005)；和Wang等，“扩展遗传密码”(Expanding theGenetic Code)，Annu.Rev.Biophys.Biomol.Struct.，35：225-249(2006)；这些文献各自的内容全文纳入本文作为参考。

虽然本文所述实施例中主要感兴趣的是图1，结构1所示苯基硒代半胱氨酸，但并非要将本发明严格限制于该结构。实际上，不难制备各种易于获得且结构相关的类似物，这些类似物保留图1，结构1所示苯基硒代半胱氨酸的主要特性，而且本发明的氨酰基-tRNA合成酶(例如，SEQ ID NO：4、6和8所示的O-RS)还特异性识别这些类似物。这些相关的氨基酸类似物属于本发明的范围。

在其它非天然氨基酸中，例如式I中的R可任选含有烷基-、芳基-、酰基-、肼、氰基-、卤代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦酰基、膦、烯酮、亚胺、酯、羟胺、胺等，或上述基团的任何组合。感兴趣的其它非天然氨基酸包括但不限于：含光可活化交联剂的氨基酸、自旋-标记的氨基酸、荧光氨基酸、金属结合氨基酸、含金属的氨基酸、放射性氨基酸、含有新官能团的氨基酸、能与其它分子共价或非共价相互作用的氨基酸、光锁定(photocaged)和/或光致异构(photoisomerizable)的氨基酸、含生物素或生物素类似物的氨基酸、含酮基的氨基酸、糖基化的氨基酸、与氨基酸侧链相连的糖部分、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学方法可切割或光可切割的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如聚醚或长链烃，如超过约5个、约10个碳原子等)、含碳连接糖的氨基酸、含氨基硫代酸的氨基酸以及含一个或多个毒性部分的氨基酸。

本发明另一方面提供具有式IV所示通用结构的非天然氨基酸：

具有此结构的非天然氨基酸一般可以是任何结构，其中R₁是20种天然氨基酸之一(例如，酪氨酸或苯丙氨酸)所用的取代基，R₂是取代基。因此，此类非天然氨基酸可视作天然氨基酸衍生物。

除了含有图1，结构1所示苯基硒代半胱氨酸结构的非天然氨基酸外，非天然氨基酸还任选可含有经修饰的骨架结构，例如式II和III所示的结构：

其中，Z一般包含OH、NH₂、SH、NH-R′或S-R′；X和Y可以相同或不同，一般包含S或O，R和R′可任选相同或不同，通常选自与上述式I所示非天然氨基酸的R基团相同的组成以及氢。例如，本发明的非天然氨基酸还任选在式II和III所示氨基或羧基中包含取代。该类型的非天然氨基酸包括但不限于：例如含有20种常见氨基酸的相应侧链或非天然侧链的α-羟酸、α-硫代酸、α-氨基硫代羧酸。另外，α碳上的取代还任选包括L，D或α-α-双取代氨基酸，如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它替代结构包括环形氨基酸，如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物，β和γ氨基酸，如取代的β丙氨酸和γ-氨基丁酸。

在一些方面，本发明使用L-构型的非天然氨基酸。然而，本发明并非仅限于使用L-构型的非天然氨基酸。还包括这些非天然氨基酸的D-对映体也可用于本发明。

本发明所用的非天然氨基酸不严格局限于图1，结构1所示的苯基硒代半胱氨酸非天然氨基酸。本领域技术人员知道不难获得天然氨基酸的各种非天然类似物。例如，但不限于不难制备衍生自酪氨酸的非天然(氨基酸)。酪氨酸类似物包括对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸，其中该取代的酪氨酸含有炔基、乙酰基、苯甲酰基、氨基、肼、羟胺、巯基、羧基、异丙基、甲基、C₆-C₂₀直链或支链烃、饱和或不饱和的烃、O-甲基、聚醚基团、硝基等。此外，也包括多取代的芳环。本发明的谷氨酰胺类似物包括但不限于：α-羟基衍生物、γ-取代的衍生物、环形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的例子包括但不限于：对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸，其中所述取代基含有炔基、羟基、甲氧基、甲基、烯丙基、醛基、硝基、巯基或酮基等。非天然氨基酸的具体例子包括但不限于：苯基硒代半胱氨酸、磺基酪氨酸、对-乙基硫代羰基-L-苯丙氨酸、对-(3-氧代丁酰基)-L-苯丙氨酸、1，5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羟基-香豆素氨基酸、硝基苄基-丝氨酸、O-(2-硝基苄基)-L-酪氨酸、对-羧甲基-L-苯丙氨酸、对-氰基-L-苯丙氨酸、间-氰基-L-苯丙氨酸、联苯基丙氨酸、3-氨基-L-酪氨酸、联吡啶基丙氨酸、对-(2-氨基-1-羟乙基)-L-苯丙氨酸、对-异丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和对-硝基-L-苯丙氨酸。还包括对-炔丙氧基苯丙氨酸、3，4-二羟基-L-苯丙氨酸(DHP)、3，4，6-三羟基-L-苯丙氨酸、3，4，5-三羟基-L-苯丙氨酸、4-硝基-苯丙氨酸、对-乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巯基-酪氨酸、三-O-乙酰基-GlcNAc β-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰丝氨酸、膦酰酪氨酸、对-碘代-苯丙氨酸、对-溴代苯丙氨酸、对-氨基-L-苯丙氨酸以及异丙基-L-苯丙氨酸等。本文引用的参考文献披露了各种非天然氨基酸的结构。还可参见公布的国际申请WO 2004/094593，名为“扩展真核细胞遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)；和WO2006/110182，名为“体内掺入非天然氨基酸的正交翻译组分”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)，2005年10月27日提交。

非天然氨基酸的化学合成

上述许多非天然氨基酸可以从，例如美国的西格玛公司(Sigma)或美国威斯康星州密尔沃基市的阿尔得里奇公司(Aldrich)等购得。那些不能商品化购得的非天然氨基酸可任选如各种出版物所述或采用本领域技术人员已知的标准方法合成。有机合成技术可参见，例如Fessendon和Fessendon，《有机化学》(Organic Chemistry)，(1982，第二版，杰拉德格兰特出版社(Willard Grant Press)，波士顿，马萨诸塞州)；March，《高级有机化学》(Advanced Organic Chemistry)(第三版，1985，威立父子公司(Wiley andSons)，纽约)；以及Carey和Sundberg的《高级有机化学》(Advanced Organic Chemistry)(第三版，A和B部分，1990，普莱纳姆出版社(Plenum Press)，纽约)。其它描述非天然氨基酸合成的出版物包括：名为“非天然氨基酸的体内掺入”的国际专利申请WO 2002/085923；Matsoukas等，(1995)J.Med. Chem.，38，4660-4669；King和Kidd，(1949)“从邻苯二甲酰化中间体合成谷氨酰胺和γ-二肽的新方法”(A New Synthesis of Glutamine and ofγ-Dipeptides of Glutamic Acid from Phthylated Intermediates).J.Chem.Soc.，3315-3319；Friedman和Chatterrji，(1959)“合成谷氨酰胺衍生物作为抗肿瘤药物的模拟底物”(Synthesis of Derivatives of Glutamine as ModelSubstrates for Anti-tumor Agents).J.Am.Chem.Soc.81，3750-3752；Craig等，(1988)“7-氯-4[[4-(二乙基氨基)-1-甲基丁基]氨基]喹啉(氯喹)对映体的绝对构型”(Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine)).J.Org.Chem.53，1167-1170；Azoulay等，(1991)“谷氨酰胺类似物作为潜在的抗疟药”(Glutamine analogues as Potential Antimalarials)，Eur.J.Med.Chem.26，201-5；Koskinen和Rapoport(1989)“合成4-取代的脯氨酸作为构象约束的氨基酸类似物”(Synthesis of 4-Substituted Prolines as Conformationally ConstrainedAmino Acid Analogues).J.Org.Chem.54，1859-1866；Christie和Rapoport，(1985)“从L-天冬酰胺合成光学纯的哌啶酸酯，应用于通过氨基酸脱羰基和亚氨鎓离子环化总合成(+)-阿扑长春胺”(Synthesis of Optically PurePipecolates from L-Asparagine.Application to the Total Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium IonCyclization).J.Org.Chem.1989：1859-1866；Barton等，(1987)“采用自由基化学方法合成新的α-氨基酸和衍生物：合成L-和D-α氨基酸、L-α-氨基庚二酸以及合适的不饱和衍生物”(Synthesis of Novel α-Amino-Acids andDerivatives Using Radical Chemistry：Synthesis of L-and D-α-Amino-AdipicAcids，L-α-aminopimelic Acid and Appropriate Unsaturated Derivatives).Tetrahedron Lett.43：4297-4308；以及Subasinghe等，(1992)“使君子氨酸类似物：β-杂环2-氨基丙酸衍生物的合成及其在使君子氨酸敏化部位的活性”(Quisqualic acid analogues：synthesis of beta-heterocyclic2-aminopropanoic acid derivatives and their activity at a novelquisqualate-sensitized site).J.Med.Chem.35：4602-7。还可参见2003年12月22日提交的名为“Protein Arrays(蛋白质阵列)”的国际专利申请WO2004/058946。

非天然氨基酸的细胞摄取

细胞摄取非天然氨基酸通常是设计和选择非天然氨基酸，例如用于掺入蛋白质中应考虑的问题之一。例如，α-氨基酸的高电荷密度提示这些化合物不可能透过细胞。天然氨基酸通过蛋白质转运系统的收集(作用)摄取入细胞，这些系统往往显示程度不同的氨基酸特异性。可进行快速筛选来评估细胞将摄取哪种非天然氨基酸(如果有的话)。可参见，例如2003年12月22日提交的名为“蛋白质阵列”(Protein Arrays)的国际公布WO 2004/058946中的毒性试验；Liu和Schultz，(1999)，“含扩增遗传密码的生物演化的进展”(Progress toward the evolution of an organism with an expanded geneticcode)，PNAS United States，96：4780-4785。虽然不难采用各种试验分析摄取情况，但设计适合于细胞摄取途径的非天然氨基酸的另一种方法是提供生物合成途径，从而能在体内产生氨基酸。

非天然氨基酸的生物合成

细胞中已有许多产生氨基酸和其它化合物的生物合成途径。虽然自然界中，例如细胞中，可能不存在特定非天然氨基酸的生物合成方法，但本发明提供了这种方法。例如，通过加入新的酶或修饰现有的宿主细胞途径可以在宿主细胞中任选产生非天然氨基酸的生物合成途径。其它新的酶任选是天然产生的酶或人工开发的酶。例如，生物合成对氨基苯丙氨酸(如WO 2002/085923中的实施例所示)依赖加入其它生物的已知酶的混合物。可通过用含这些酶的基因的质粒转染细胞而将这些基因引入细胞。当这些基因在细胞中表达时，它们提供了合成所需化合物的酶途径。可任选加入的酶类型的例子见以下实施例。其它酶序列见例如Genbank。也可以相同方式将人工开发的酶任选加入细胞。可以此方式操控细胞机理和资源用以产生非天然氨基酸。

实际上，可采用各种方法产生新的酶从而在体内或体外用于生物合成途径，改进现有途径，或产生非天然氨基酸。开发酶和其它生物合成途径组分的许多现有方法适用于本发明，从而能产生非天然氨基酸(或者，实际上，用于开发合成酶使之具有新的底物特异性或其它感兴趣的活性)。例如，可以任选采用DNA改组来开发新的酶和/或这些酶的途径，从而能在体外或体内产生非天然氨基酸(或产生新的合成酶)。可参见，例如Stemmer，(1994)，“通过DNA改组在体外快速进化蛋白质”(Rapid evolution of aprotein in vitro by DNA shuffling)，Nature，370(4)：389-391；Stemmer，(1994)，“通过随机断裂和装配的DNA改组：分子进化的体外重组”(DNA shufflingby random fragmentation and reassembly：In vitro recombination formolecular evolution)，Proc.Natl.Acad.Sci.USA.，91：10747-10751。相关方法改组关联的(例如同源的)基因家族，从而能快速开具有所需特性的酶。这种“家族基因改组”方法的例子见Crameri等，(1998)，“不同种类基因家族的DNA改组加速了定向进化”(DNA shuffling of a family of genes fromdiverse species accelerates directed evolution)，Nature，391(6664)：288-291。也可采用称为“产生杂交酶的递增截短”(ITCHY)的DNA重组方法来产生新的酶(无论是生物合成途径组分或合成酶)，例如Ostermeier等，(1999)，“不依赖DNA同源性的杂交酶的组合方法”(A combinatorial approach tohybrid enzymes independent of DNA homology)，Nature Biotech，17：1205中所述。该方法也可用于产生用作一种或多种体外或体内重组方法底物的酶或其它途径变体的文库。也可参见，Ostermeier等，(1999)，“采用递增截短的组合蛋白质工程”(Combinatorial Protein Engineering by IncrementalTruncation)，Proc.Natl.Acad.Sci.USA，96：3562-67；Ostermeier等，(1999)，“作为工程改造新生物催化剂的方法的递增截短”(Incremental Truncationas a Strategy in the Engineering of Novel Biocatalysts)，Biological andMedicinal Chemistry，7：2139-44。另一种方法采用指数集合诱变(exponentialensemble mutagenesis)来产生酶或其它途径变体的文库，从而能，例如选择催化与产生非天然氨基酸(或新合成酶)有关的生物合成反应的能力。在该方法中，平行地随机选取(randomized)感兴趣序列中的小基团残基，从而能在各不同位置鉴定可产生功能性蛋白质的氨基酸。适用于本发明来产生新酶进而产生非天然氨基酸(或新的合成酶)的此类方法的例子见Delegrave和Youvan，(1993)，Biotechnology_Research，11：1548-1552。在另一方法中，利用掺杂或简并寡核苷酸的随机或半随机诱变可用于工程改造酶和/或途径成分，例如采用如以下文献所述的通用诱变方法：Arkin和Youvan，(1992)，“优化核苷酸混合物来编码用于半随机诱变的特定氨基酸亚组”(Optimizing nucleotide mixtures to encode specific subsets of amino acids forsemi-random mutagenesis)，Biotechnology 10：297-300；或Reidhaar-Olson等，(1991)，“用寡核苷酸盒随机诱变蛋白质序列”(Random mutagenesis ofprotein sequences using oligonucleotide cassettes)，Methods Enzymol.，208：564-86。利用多核苷酸重装配和位点饱和诱变的另一种方法(常称为“非随机”诱变)可用于产生酶和/或途径组分，然后筛选它们行使一种或多种合成酶或生物合成途径功能(例如为在体内产生非天然氨基酸)的能力。可参见，例如Short，“遗传疫苗和酶的非随机产生”(Non-Stochastic Generation ofGenetic Vaccines and Enzymes)，WO 00/46344。

这种突变方法的替代方法包括重组生物的整个基因组并选择得到的后代的特定途径功能(常称为“全基因组改组”)。该方法可应用于本发明，例如通过基因组重组并选择能够产生非天然氨基酸(或其中间体)的生物(大肠杆菌或其它细胞)。例如，以下出版物所指导的方法可应用于途径设计，从而能改进细胞中的现有途径和/或开发新途径进而在体内产生非天然氨基酸：Patnaik等，(2002)，“乳酸杆菌基因组改组来提高酸耐受性”(Genomeshuffling of lactobacillus for improved acid tolerance)，Nature Biotechnology，20(7)：707-712；和Zhang等，(2002)，“基因组改组导致细菌表型快速改善”(Genome shuffling leads to rapid phenotypic improvement in bacteria)，Nature，415：644-646。

许多其它技术可用于生物和代谢途径工程改造(例如为产生所需化合物)，它们也可用于产生非天然氨基酸。指导有用的路径工程改造方法的出版物包括：Nakamura和White，(2003)，“微生物生产1，3丙二醇的代谢工程”(Metabolic engineering for the microbial production of 1，3propanediol)，Curr.Opin.Biotechnol.，14(5)：454-9；Berry等，(2002)，“应用代谢工程来提高Biotech Indigo的生产和用途”(Application of Metabolic Engineeringto improve both the production and use of Biotech Indigo)，J.IndustrialMicrobiology and Biotechnology，28：127-133；Banta等，(2002)，“优化人工代谢途径：工程改造用于维生素C生物合成的棒状杆菌2，5-二酮基-D-葡糖酸还原酶的辅助因子特异性”(Optimizing an artificial metabolic pathway：Engineering the cofactor specificity of Corynebacterium 2，5-diketo-D-gluconicacid reductase for use in vitamin C biosynthesis)，Biochemistry，41(20)：6226-36；Selivonova等，(2001)，“微生物中新特性的快速进化”(RapidEvolution of Novel Traits in Microorganisms)，Applied and EnvironmentalMicrobiology，67：3645，和许多其它出版物。

无论采用什么方法，用本发明工程改造的生物合成途径产生的非天然氨基酸的浓度，应能足够有效地生物合成蛋白质，例如天然细胞含量，但不应达到显著影响其它细胞氨基酸的浓度或耗尽细胞资源的程度。以此方式在体内所产生的浓度一般为约10mM到约0.05mM。一旦细胞被工程改造从而产生了特定途径所需的酶和非天然氨基酸，为了核糖体蛋白质合成和细胞生长，可任选采用体内选择以进一步优化非天然氨基酸的产生。

掺入非天然氨基酸的正交组分

本发明提供制备正交组分从而能在体内对选择者密码子，如琥珀终止密码子、无义密码子、四碱基或多碱基密码子等起反应而将非天然氨基酸苯基硒代半胱氨酸(参见图1，结构1)掺入延伸的多肽链中的方法和组合物。例如，本发明提供了正交-tRNA(O-tRNA)、正交氨酰基-tRNA合成酶(O-RS)及其配对。这些配对可用于将非天然氨基酸掺入到延伸的多肽链中。

本发明的组合物包含正交氨酰基-tRNA合成酶(O-RS)，所述O-RS用苯基硒代半胱氨酸优先氨酰化O-tRNA。在某些实施方式中，O-RS包含含有SEQ ID NO：4、6或的氨基酸序列及其保守变体。在本发明的某些实施方式中，O-RS用特定的非天然氨基酸优先氨酰化O-tRNA胜过任何内源性tRNA，其中O-RS对O-tRNA有偏好(bias)，其中加载有非天然氨基酸的O-tRNA与加载有相同非天然氨基酸的内源性tRNA的比例大于1∶1，更优选O-RS排他性地或者几乎排他性地加载O-tRNA。

含O-RS的组合物还可任选含有正交tRNA(O-tRNA)，该O-tRNA识别选择者密码子。与包含本文序列表(例如，SEQ ID NO：1)和实施例所列的多核苷酸序列或由其编码的O-tRNA的抑制效率相比，在关联合成酶存在下，本发明O-tRNA对选择者密码子起反应而通常具有至少约，例如45％、50％、60％、75％、80％、90％或更高的抑制效率。在一个实施方式中，O-RS结合O-tRNA的抑制效率至少比不含O-RS的O-tRNA的抑制效率高，例如5倍、10倍、15倍、20倍、25倍或更高。在一些方面，O-RS结合O-tRNA的抑制效率至少是衍生自詹氏甲烷球菌的正交酪氨酰-tRNA合成酶的抑制效率的45％。

包含O-tRNA的组合物还可任选包含细胞(例如真细菌细胞如大肠杆菌细胞等，或真核细胞如酵母细胞)和/或翻译系统。

本发明还提供包含翻译系统的细胞(如真细菌细胞或酵母细胞)，所述翻译系统包含正交-tRNA(O-tRNA)；正交氨酰基-tRNA合成酶(O-RS)和苯基硒代半胱氨酸非天然氨基酸。一般来说，O-RS用非天然氨基酸优先氨酰化O-tRNA胜过内源性tRNA，该O-RS对O-tRNA有偏好，加载有非天然氨基酸的O-tRNA与加载有相同非天然氨基酸的内源性tRNA的比例大于1∶1，更优选该O-RS排他性地或者几乎排他性地加载O-tRNA。O-tRNA识别第一选择者密码子，O-RS能用非天然氨基酸优先氨酰化O-tRNA。在一个实施方式中，O-tRNA含有SEQ ID NO：1所示多核苷酸序列或其互补多核苷酸序列，或者由其编码。在一个实施方式中，该O-RS含有SEQ ID NO：4、6、8或10所示氨基酸序列和其保守变体。

本发明的细胞还可任选包含其它不同的O-tRNA/O-RS配对和第二非天然氨基酸，例如，此O-tRNA识别第二选择者密码子，此O-RS用第二非天然氨基酸优先氨酰化相应的O-tRNA，其中所述第二氨基酸不同于第一非天然氨基酸。本发明的细胞可任选包含含有编码感兴趣多肽的多核苷酸的核酸，所述多核苷酸含有O-tRNA能识别的选择者密码子。

在某些实施方式中，本发明的细胞是真细菌细胞(如大肠杆菌)，所述细胞含有正交-tRNA(O-tRNA)、正交氨酰基-tRNA合成酶(O-RS)、非天然氨基酸和含有编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸含有O-tRNA能识别的选择者密码子。在本发明的某些实施方式中，O-RS用非天然氨基酸优先氨酰化O-tRNA，其效率高于该O-RS氨酰化任何内源性tRNA的效率。

在本发明的某些实施方式中，本发明的O-tRNA含有本文序列表(例如，SEQ ID NO：1)或实施例中所示的多核苷酸序列或其互补多核苷酸序列，或由这些序列编码。在本发明的某些实施方式中，O-RS含有序列表中所示氨基酸序列或其保守变体。在一个实施方式中，O-RS或其部分由编码本文序列表和实施例所示氨基酸序列的多核苷酸序列或其互补的多核苷酸序列编码。

本发明的O-tRNA和/或O-RS可衍生自各种生物(如真核和/或非真核生物)。

多核苷酸也是本发明的特征。本发明的多核苷酸(例如，SEQ ID NO：5、7或9)包括人工的(如人造的和非天然产生的)多核苷酸，所述多核苷酸序列其中含有编码本文序列表所示多肽的核苷酸序列，和/或与该多核苷酸序列互补。本发明的多核苷酸还可包括在高度严谨条件下能与上述多核苷酸在基本上核酸全长上杂交的核酸。本发明的多核苷酸还包括与天然tRNA或相应编码核酸的序列具有，例如至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性的多核苷酸(但是本发明的多核苷酸不是天然tRNA或相应的编码核酸)，所述tRNA识别选择者密码子，如四碱基密码子。与上述任何多核苷酸序列有，例如至少80％、至少90％、至少95％、至少98％或更高相同性的人工多核苷酸，和/或含上述序列的保守变体的多核苷酸也包括在本发明的多核苷酸内。

含本发明多核苷酸的载体也是本发明的特征。例如，本发明的载体可以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明载体的细胞也是本发明的特征。

O-tRNA/O-RS配对组分的制备方法也是本发明的特征。用这些方法制备的组分也是本发明的特征。例如，产生至少一种细胞的正交tRNA(O-tRNA)的方法包括制备突变体tRNA库；使突变体tRNA库中各成员的反密码子环突变从而其能识别选择者密码子，藉此提供潜在的O-tRNA库，并对第一物种的第一细胞群进行负选择，所述细胞含有潜在O-tRNA库的成员。负选择可去除含潜在O-tRNA库成员的细胞，该潜在O-tRNA可被细胞的内源性氨酰基-tRNA合成酶(RS)氨酰化。由此提供与第一物种的细胞正交的tRNA库，从而至少提供一种O-tRNA。还提供用本发明方法产生的O-tRNA。

在某些实施方式中，这些方法还包括正选择第一物种的第二细胞群，其中所述细胞含有与第一物种的细胞正交的tRNA库的成员、关联氨酰基-tRNA合成酶和阳性选择标记。采用正选择可选择或筛选出含有能被关联氨酰基-tRNA合成酶氨酰化而且在阳性选择标记存在下可显示所需反应的tRNA库成员的那些细胞，藉此提供O-tRNA。在某些实施方式中，第二细胞群含有未被负选择去除的细胞。

还提供能用非天然氨基酸加载O-tRNA的正交-氨酰基-tRNA合成酶的鉴定方法。例如，该方法包括选择第一物种的细胞群，其中所述细胞各自含有1)多种氨酰基-tRNA合成酶(RS)的成员(例如，所述多种RS可包括突变型RS、衍生自第一物种以外的物种的RS、或者同时包括二者)；2)正交-tRNA(O-tRNA)(如衍生自一个或多个物种)；以及3)编码阳性选择标记并且包含至少一个选择者密码子的多核苷酸。

与不含多种RS的成员或所含成员数目较少的细胞相比，选择或筛选细胞(如宿主细胞)中显示抑制效率提高的那些细胞。这些选择/筛选的细胞含有能氨酰化O-tRNA的活性RS。用这些方法鉴定到的正交氨酰基-tRNA合成酶也是本发明的特征。

在细胞(例如真细菌细胞如大肠杆菌细胞等，或酵母细胞)内产生所选位置含有非天然氨基酸的蛋白质的方法也是本发明的特征。例如，一种方法是在适当的培养基内培养细胞，其中所述细胞含有核酸，而该核酸含有至少一个选择者密码子并编码一种蛋白，提供非天然氨基酸，在含至少一个选择者密码子的核酸的翻译过程中将非天然氨基酸掺入蛋白质的特定位置，从而产生该蛋白质。细胞还含有：在细胞内起作用并识别选择者密码子的正交-tRNA(O-tRNA)；以及用非天然氨基酸优先氨酰化O-tRNA的正交氨酰基-tRNA合成酶(O-RS)。用这种方法产生的蛋白质也是本发明的特征。

本发明还提供了含有蛋白质的组合物，其中所述蛋白质包含苯基硒代半胱氨酸。在某些实施方式中，蛋白质包含的氨基酸序列与已知蛋白，如人生长激素、治疗蛋白、诊断蛋白、工业用酶或其一部分的氨基酸序列有至少75％相同性。组合物任选包含药学上可接受的载体。

核酸和多肽序列及变体

如本文所述，本发明提供编码例如O-tRNA和O-RS的多核苷酸序列，多肽氨基酸序列，例如O-RS，以及例如包含所述多核苷酸或多肽序列的组合物、系统和方法。本文披露了所述序列的例子，如O-tRNA和O-RS的氨基酸和核苷酸序列(见图2)。然而，本领域技术人员应知道本发明并不限于本文，例如实施例和序列表中专门引述的那些序列。本领域技术人员应知道本发明还包括具有本文所述功能的许多相关序列，如编码本文所披露O-RS的保守变体的多核苷酸和多肽。

实施例1描述了能用苯基硒代半胱氨酸氨酰化关联O-tRNA的正交合成酶种类(O-RS)的构建和分析。该实施例描述能掺入非天然氨基酸苯基硒代半胱氨酸的O-RS种类的构建和分析。

本发明提供了多肽(O-RS)和多核苷酸，如O-tRNA、编码O-RS或其诸部分的多核苷酸，用于分离氨酰基-tRNA合成酶克隆的寡核苷酸等。本发明的多核苷酸包括编码本发明的感兴趣蛋白或多肽并含有一个或多个选择者密码子的那些多核苷酸。另外，本发明多核苷酸包括，例如含有SEQ IDNO：5、7或9所示核苷酸序列的多核苷酸；与它们互补的多核苷酸或编码其中一种多核苷酸序列的多核苷酸。本发明的多核苷酸还包括编码含有SEQ ID NO：4、6或8的O-RS氨基酸序列的任何多核苷酸。类似地，在高严谨条件下，可与上述多核苷酸在基本上全长核酸序列上杂交(并且不是天然多核苷酸序列)的人工核酸也是本发明多核苷酸。在一个实施方式中，组合物包含本发明的多肽和赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明还提供可与本发明的多肽发生特异性免疫反应的抗体或抗血清。人工多核苷酸是人造而不是天然产生的多核苷酸。

本发明的多核苷酸还包括人工的多核苷酸，即与天然tRNA具有至少75％、至少80％、至少90％、至少95％、至少98％或更高的相同性(但不是天然tRNA)。多核苷酸还包括与天然tRNA具有至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性(但不是100％相同)的人工多核苷酸。

在某些实施方式中，载体(如质粒、粘粒、噬菌体、病毒等)含有本发明的多核苷酸。在一个实施方式中，所述载体是表达载体。在另一个实施方式中，所述表达载体包含与本发明的一种或多种多核苷酸操作性相连的启动子。在另一个实施方式中，细胞包含含有本发明多核苷酸的载体。

本领域技术人员还知道本发明包括所披露序列的多种变体。例如，产生功能相同序列的所披露序列的保守变体也属于本发明。据认为核酸多核苷酸序列的变体也属于本发明，所述变体与至少一种所披露序列杂交。本文披露序列的独特亚序列，例如可通过标准序列比较技术测定的独特亚序列也属于本发明。

保守性变异

由于遗传密码的简并性，“沉默取代”(即，核酸序列中的取代不导致所编码多肽改变)是编码氨基酸序列的每条核酸序列所隐含的特征。类似地，也不难鉴定氨基酸序列中有一个或少数氨基酸被具有高度相似特性的不同氨基酸取代的“保守性氨基酸取代”，因为它与披露的构建物高度相似。披露的各序列的这种保守性变异是本发明的特征之一。

具体核酸序列的“保守性变异”指编码相同或基本相同的氨基酸序列的那些核酸，或者，如果核酸不编码氨基酸序列，则指基本上相同的序列。技术人员知道改变、加入或删除所编码序列中一个氨基酸或少部分氨基酸(一般低于5％、更常见低于4％、2％或1％)的各种取代、缺失或插入是“保守性修饰变异”，这些改变导致氨基酸的缺失、插入或被化学性质相似的氨基酸所取代。因此，本发明所列举多肽序列的“保守性变异”包括用同一保守性取代组的氨基酸取代该多肽序列的少部分(通常低于5％，更常见是低于2％或1％)的氨基酸。最后，加入不改变某核酸分子所编码活性的序列，例如加入无功能序列是基础核酸的保守性变异。

本领域熟知提供功能类似的氨基酸的保守性取代表，其中一个氨基酸残基被另一个具有相似化学特性(例如芳族侧链或带正电荷的侧链)的氨基酸残基取代，因此基本上不改变该多肽分子的功能特性。以下例举多组化学特性相似的天然氨基酸，其中，各组内的取代即“保守性取代”。

保守性氨基酸取代

非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链
非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链	甘氨酸丙氨酸缬氨酸亮氨酸异亮氨酸脯氨酸	丝氨酸苏氨酸半胱氨酸甲硫氨酸精氨酸谷氨酰胺	苯丙氨酸酪氨酸色氨酸	赖氨酸精氨酸组氨酸	天冬氨酸谷氨酸

核酸杂交

可采用比较杂交来鉴定本发明的核酸，包括本发明核酸的保守性变体，该比较杂交方法是区别本发明核酸的优选方法。此外，在高度、超高度和超超高度严谨性条件下能与SEQ ID NO：5、7、9或11所示核酸杂交的靶核酸是本发明的特征。这种核酸的例子包括与某给定的核酸序列相比，含有一个或少许沉默或保守性核酸取代的核酸。

当测试核酸与探针的杂交程度是与完美匹配的互补靶标杂交程度的至少50％，即信噪比至少是该探针与靶标在完美匹配的探针与完美匹配的互补靶标结合的条件下杂交的信噪比的一半高时，可称该测试核酸与探针核酸特异性杂交；此条件下，完美匹配的探针与完美匹配的互补靶核酸结合的信噪比至少是与任何不匹配靶核酸杂交所观察到的信噪比的约5-10倍。

当核酸结合(一般在溶液中)时，称其“杂交”。核酸因各种已充分表征的理化力，例如氢键、溶剂排斥、碱基堆积等而杂交。核酸杂交的广泛指南见Tijssen，(1993)，《生物化学与分子生物学的实验室技术》(LaboratoryTechniques in Biochemistry and Molecular Biology--Hybridization withNucleic Acid Probes)，第一部分第二章，“杂交原理概述与核酸探针试验方法”(Overview of principles of hybridization and the strategy of nucleic acidprobe assays)，(艾尔赛弗公司(Elsevier)，纽约)；以及《最新分子生物学方法》(Current Protocols in Molecular Biology)，Ausubel等编，“最新方法”(Current Protocols)，格林出版合伙公司(Greene Publishing Associates，Inc.)和约翰威立父子公司(John Wiley & Sons)的合资企业，(2004年增补)(“Ausubel”)；Hames和Higgins，(1995)，《基因探针1》(Gene Probes 1)和《基因探针2》(Gene Probes 2)，IRL出版社，牛津大学出版社，牛津，英格兰提供了合成、标记、检测和定量测定DNA及RNA，包括寡核苷酸的细节。

在Southern或northern印迹滤膜上具有100个以上互补残基的互补核酸杂交的严谨性杂交条件的例子是：含1mg肝素的50％福尔马林，42℃杂交过夜。严谨性洗涤条件的例子是65℃，用0.2×SSC洗涤15分钟(SSC缓冲液的描述可参见Sambrook等；Sambrook等，《分子克隆-实验室手册》(Molecular Cloning-A Laboratory Manual)，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001)。通常先进行低严谨性洗涤除去背景信号，再进行高严谨性洗涤。示例性低严谨性洗涤是40℃，用2×SSC洗涤15分钟。具体杂交试验中信噪比是无关探针观察到的信噪比的5倍(或更高)通常表示检测到特异性杂交。

核酸杂交实验(例如，Southern和northern杂交)的“严谨性杂交洗涤条件”取决于序列，并随不同的环境参数而不同。核酸杂交的广泛指南见Tijssen，(1993)，《生物化学与分子生物学的实验室技术》，第一部分第二章，“杂交原理概述与核酸探针试验方法”，(艾尔赛弗公司，纽约)；Hames和Higgins，(1995)，《基因探针1》和《基因探针2》，IRL出版社，牛津大学出版社，牛津。不难凭经验确定适合任何测试核酸的严谨性杂交和洗涤条件。例如，在确定杂交和洗涤条件时，可逐渐提升杂交和洗涤条件(例如，通过升高杂交或洗涤的温度、降低杂交或洗涤中的盐浓度、增加杂交或洗涤中的洗涤剂浓度和/或增加杂交或洗涤中的有机溶剂如福尔马林的浓度)直至符合选定的标准。例如，在高度严谨性杂交和洗涤条件中，逐渐提升杂交和洗涤条件直至探针与完美匹配的互补靶标结合的信噪比至少是该探针与不匹配靶标杂交所观察到的信噪比的5倍。

选择的“非常严谨”的条件等于具体探针的热解链温度(T_m)。T_m是50％的测试序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH下)。为本发明的目的，“高度严谨”的杂交和洗涤条件一般选择为在规定的离子强度和pH下比具体序列的T_m约低5℃。

“超高严谨”的杂交和洗涤条件指，增加杂交和洗涤条件的严谨性直至探针与完美匹配的互补靶核酸结合的信噪比至少是该探针与任何不匹配靶核酸杂交时观察到的信噪比的10倍。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超高严谨性条件下与探针结合。

类似地，可通过逐渐提升相关杂交试验的杂交和/或洗涤条件来确定甚至更高的严谨性水平。例如，提升杂交和洗涤的条件的严谨性直至探针与完美匹配的互补靶核酸结合的信噪比至少是与任何不匹配靶核酸杂交信噪比的10、20、50、100或500倍或更高。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超超高度严谨性条件下与探针结合。

如果在严谨性条件下彼此不杂交的核酸所编码的多肽基本相同，则它们仍基本相同。例如，当利用遗传密码所允许的最大密码简并性产生核酸的拷贝时会发生这种情况。

独特亚序列

在一些方面，本发明提供含有选自本文披露的O-tRNA和O-RS序列的核酸中独特亚序列的核酸。与对应于任何已知O-tRNA或O-RS核酸序列的核酸相比，所述独特亚序列是独特的。可采用，例如设置默认参数的BLAST进行核酸比对。任何独特亚序列可用作，例如探针来鉴定本发明核酸或相关核酸。

类似地，本发明包括含有选自本文披露的O-RS序列的多肽中独特亚序列的多肽。与对应于任何已知多肽序列的多肽相比，本文的独特亚序列是独特的。

本发明还提供能在严谨性条件下与独特的编码寡核苷酸杂交的靶核酸，所述寡核苷酸编码选自O-RS序列的多肽中的独特亚序列，其中与对应于任何对照多肽(例如，通过突变获得本发明合成酶的亲代序列)的多肽相比，所述独特亚序列是独特的。可如上所述测定独特序列。

序列比较、相同性和同源性

对于两个或多个核酸或多肽序列，术语“相同的”或“相同性百分比”指当用下文所述序列比较算法(或技术人员可用的其它算法)或通过目测观察来比较和比对最大相应性时，这两个或多个序列或亚序列相同，或者有特定百分比的氨基酸残基或核苷酸相同。

对于两个核酸或多肽(例如，编码O-tRNA或O-RS的DNA，O-RS的氨基酸序列)，术语“基本相同”指当利用序列比较算法或通过目测观察来比较和比对最大相应性时，两个或多个序列或亚序列至少有约60％、约80％、约90-95％、约98％、约99％或更多的核苷酸或氨基酸残基相同。这种“基本相同”的序列通常认为是“同源的”，而不论实际祖先。优选在至少长约50个残基的序列区域，更优选在至少约100个残基的区域存在“基本相同性”，待比较两条序列最好在至少约150个残基或者在全长上基本相同。

当蛋白质和/或蛋白质序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列时，它们是“同源的”。类似地，当核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列时，它们是“同源的”。例如，可通过任何可用的诱变方法来修饰任何天然核酸使之含有一个或多个选择者密码子。当该诱变的核酸表达时，它编码的多肽含有一个或多个非天然氨基酸。当然，该突变方法还可改变一个或多个标准密码子，从而也改变了所得突变型蛋白质中的一个或多个标准氨基酸。通常可从两种或多种核酸或蛋白质(或其序列)间的序列相似性推断同源性。序列间精确的相似性百分比可用于确认同源性，其根据所述的核酸与蛋白质而有所不同，但常规将低至25％的序列相似性用于确认同源性。还可用更高水平的序列相似性，例如30％、40％、50％、60％、70％、80％、90％、95％或99％或更高来确认同源性。本文描述了测定序列相似性百分比的方法(例如，采用参数默认的BLASTP和BLASTN)，这些方法众所周知。

对于序列比较和同源性测定，通常将一条序列用作参比序列与测试序列相比较。当采用序列比较算法时，将测试序列与参比序列输入计算机，如果需要可指定亚序列坐标，并指定序列算法程序参数。然后根据所指定的程序参数，序列比较算法可计算测试序列相比于参比序列的序列相同性百分比。

可用以下方法进行比较序列的最佳比对，例如Smith和Waterman，Adv. Appl.Math.，2：482，(1981)的局部同源性算法；Needleman和Wunsch，J.，Mol.Biol.，48：443，(1970)的同源性比对算法；Pearson和Lipman，Proc.Nat’l. Acad.Sci.USA，85：2444，(1988)的相似性检索方法；计算机执行这些算法(威斯康星遗传软件包中的GAP，BESTFIT，FASTA和TFASTA，遗传学计算机组(Genetics Computer Group)，575 Science Dr.，麦迪逊，威斯康星州)；或者目测(一般可参见《最新分子生物学方法》(Current Protocols in Molecular Biology)，Ausubel等编，“最新方法”(Current Protocols)，格林出版合伙公司和约翰威立父子公司的合资企业，2004年增补)。

适用于测定序列相同性和序列相似性百分比的算法的一个例子是Altschul等，J.Mol.Biol.，215：403-410，(1990)所述的BLAST算法。进行BLAST分析的软件由国家生物技术信息中心对公众开放(参见NCBI网址)。该算法包括：首先通过在查询序列中鉴定长为W的短字串来鉴定高评分序列配对(HSP)，这些字串与数据库中相同长度的字串比对时符合或满足某些正值阈值评分T。T称为邻近字串评分阈值(Altschul等，(1990)，J.Mol.Biol.，215：403-410)。这些原始邻近字串选中(hit)作为启动检索的种子来找寻含有它们的较长HSP。然后使这些字串选中沿着各条序列双向延伸，以致累积比对评分增加。对于核苷酸序列，用参数M(一对匹配残基的奖励评分；恒大于0)和N(错配残基的罚分；恒小于0)计算累积评分。对于氨基酸序列，则用评分矩阵来计算累积评分。当出现以下情况时终止各方向的字串选中延伸：累积比对评分从其达到的最高值下降X；因一个或多个负评分残基比对的累积导致累积评分降至0或0以下；或者到达各序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程序(用于核苷酸序列)默认11为字长(W)、10为期望值(E)、100为截断值、M＝5、N＝-4，并进行双链比较。对于氨基酸序列，BLAST程序默认3为字长(W)、10为期望值(E)并采用BLOSUM62评分矩阵(参见Henikoff和Henikoff，(1989)，Proc.Natl.Acad.Sci.USA，89：10915)。

除了计算序列相同性百分比外，BLAST算法也可对两条序列间的相似性进行统计学分析(参见，例如Karlin和Altschul，Proc.Nat’l.Acad.Sci. USA，90：5873-5787，(1993))。BLAST算法提供的相似性量度之一是最小总概率(P(N))，其指示两条核苷酸或氨基酸序列之间发生随机匹配的概率。例如，如果在测试核酸与参比核酸的比较中最小总概率小于约0.1，更优选小于约0.01，最优选小于约0.001，则可认为该核酸与参比核酸相似。

诱变与其它分子生物学技术

可采用分子生物学技术操作本发明和用于本发明的多核苷酸和多肽。描述分子生物学的通用教材包括Berger和Kimmel，《分子克隆技术指南，酶学方法，第152卷》(Guide to Molecular Cloning Techniques，Methods inEnzymology volume 152)，(1987)，学术出版社公司(Academic Press，Inc.)，圣迭戈，加利福尼亚州；Sambrook等，《分子克隆-实验室手册》(MolecularCloning-A Laboratory Manual)，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001和《最新分子生物学方法》(Current Protocols in MolecularBiology)，F.M.Ausubel等编；“最新方法”(Current Protocols)，格林出版合伙公司和约翰威立父子公司的合资企业，(2004年增补)。这些教材描述了诱变、载体的应用、启动子和许多其它相关课题，例如产生含有选择者密码子的基因从而产生含非天然氨基酸的蛋白质，以及产生正交tRNA、正交合成酶及其配对的课题。

本发明可各种类型的诱变，例如以使tRNA分子突变、产生tRNA文库、产生合成酶文库和/或在感兴趣蛋白质或多肽中插入编码非天然氨基酸的选择者密码子。它们包括但不限于：定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、利用含尿嘧啶的模板诱变、寡核苷酸指导的诱变、硫代磷酸酯修饰的DNA诱变、利用缺口双螺旋DNA的诱变等，或者是它们的任何组合。其它合适的方法包括点错配修复、利用修复缺陷宿主株的诱变、限制性选择和限制性纯化、缺失诱变、总基因合成诱变、双链断裂修复等。本发明也包括，例如涉及嵌合构建物的诱变。在一个实施方式中，可用天然分子或经改变或突变的天然分子的已知信息，例如序列，序列比较、物理特性、晶体结构等来指导诱变。

可利用本发明多核苷酸或含有本发明多核苷酸的构建物，例如本发明的载体(例如可以是克隆载体或表达载体)来遗传改造(例如转化、转导或转染)宿主细胞。例如，可将正交tRNA、正交tRNA合成酶和待衍生蛋白质的编码区操作性连接于可在所需宿主细胞中起作用的基因表达控制元件。典型的载体含有转录和翻译终止子、转录和翻译起始序列和用于调节具体靶核酸表达的启动子。这些载体可任选地包含遗传表达盒，所述表达盒含有至少一个独立的终止子序列，允许该表达盒在真核细胞或原核细胞或二者中复制的序列(例如，穿梭载体)，和适用于原核与真核系统的选择标记。载体适用于在原核细胞、真核细胞或优选二者中复制和/或整合。参见Giliman和Smith，Gene，8：81，(1979)；Roberts等，Nature，328：731，(1987)；Schneider，B.等，Protein Expr.Purif.，6435：10，(1995)；《最新分子生物学方法》，Ausubel等编；“最新方法”(Current Protocols)，格林出版合伙公司和约翰威立父子公司的合资企业，(2004年增补)；Sambrook等，《分子克隆-实验室手册》，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001；Berger和Kimmel，《分子克隆技术指南，酶学方法，第152卷》，(1987)，学术出版社公司，圣迭戈，加利福尼亚州。例如，载体可以是质粒、细菌、病毒、裸多核苷酸或缀合的多核苷酸形式。可通过标准方法将载体导入细胞和/或微生物，包括电穿孔(From等，Proc.Natl.Acad.Sci.USA，82，5824，(1985))，病毒载体感染，利用在小珠或颗粒的基质内或其表面上含有核酸的小颗粒的高速弹丸穿透(Klein等，Nature，327：70-73，(1987))等。

开发了能在大肠杆菌中对琥珀终止密码子(UAG)起反应而将非天然氨基酸位点特异性掺入蛋白质的高效且通用的单质粒系统。在该新系统中，詹氏甲烷球菌抑制型tRNAtyr(CUA)和酪氨酰-tRNA合成酶配对由与大多数大肠杆菌表达载体相容的单个质粒编码。构建在proK启动子和终止子控制下的单顺反子tRNA操纵子能优化二级结构和tRNA加工。引入突变形式的合成酶glnS启动子显著提高了抑制效率和保真度。利用tRNA基因的多拷贝以及该合成酶上的特定突变(D286R)也可提高抑制效率(Kobayashi等，“用于遗传密码扩展的酪氨酰-tRNA合成酶的正交tRNA特异性的结构基础”(Structural basis for orthogonal tRNA specificities of tyrosyl-tRNAsynthetases for genetic code expansion)，Nat.Struct.Biol.，10(6)：425-432[2003])。几种不同非天然氨基酸的掺入高效且精确也证明该优化系统的通用性，所述非天然氨基酸在研究蛋白质功能和结构中的独特用途已得到证实。

ATCC提供了可用于克隆的细菌和细菌噬菌体目录，例如ATCC出版的《ATCC细菌和细菌噬菌体目录》(The ATCC Catalogue of Bacteria andBacteriophage)，(1996)，Gherna等编。测序、克隆的其它基本方法和分子生物学的其它方面及潜在理论思考也可参见Sambrook等，《分子克隆-实验室手册》，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001；《最新分子生物学方法》，Ausubel等编；“最新方法”(Current Protocols)，格林出版合伙公司和约翰威立父子公司的合资企业，(2004年增补)；和Watson等，(1992)，《重组DNA》(Recombinant DNA)，第二版，科学美国书籍公司(Scientific American Books)，纽约。此外，可以向各种商业来源定制或标准定购基本上任何核酸(和实际上任何标记的核酸，无论标准或非标准的)，例如得克萨斯州米德兰市的米德兰检定试剂公司(Midland CertifiedReagent Company)、加利福尼亚州雷蒙纳市的大美国基因公司(The GreatAmerican Gene Company，Ramona，CA)、伊利诺斯州芝加哥市的表达基因公司(ExpressGen Inc.)、加利福尼亚州阿拉米达市的操纵子技术公司(OperonTechnologies Inc.)和许多其它公司。

可利用为例如筛选步骤、激活启动子或选择转化子的活性而作适当改进的常规营养培养基培养工程改造的宿主细胞。这些细胞任选培养成转基因生物。其它可用的参考文献，例如细胞分离和培养(例如，用于随后核酸分离)的文献包括：Freshney，(1994)，《动物细胞培养，基本技术手册》(Culture of Animal Cells，a Manual of Basic Technique)，第三版，威立利斯公司(Wiley-Liss)，纽约及其所引用的参考文献；Payne等，(1992)，《液体系统中的植物细胞与组织培养》(Plant Cell and Tissue Culture in LiquidSystems)，约翰威立父子公司，纽约，纽约州；Gamborg和Phillips编，(1995)，《植物细胞、组织和器官培养》(Plant Cell，Tissue and Organ Culture)；《基本方法斯普林格实验室手册》(Fundamental Methods Springer Lab Manual)，S-V公司(Springer-Verlag)(伯林海德尔堡纽约)；Atlas和Parks编，《微生物培养基手册》(The Handbook of Microbiological Media)，(1993)，CRC出版社(CRC Press)，伯克莱屯，佛罗里达州。

感兴趣的蛋白质与多肽

在细胞中产生在特定位置含非天然氨基酸的蛋白质的方法也是本发明特征之一。例如，一种方法包括用适当的培养基培养细胞，其中所述细胞含有包含至少一个选择者密码子并编码蛋白质的核酸；提供非天然氨基酸；其中所述细胞还包含：在细胞内具有功能并识别选择者密码子的正交-tRNA(O-tRNA)；和用非天然氨基酸优先氨酰化O-tRNA的正交氨酰基-tRNA合成酶(O-RS)。该方法所产生的蛋白质也是本发明特征之一。

在某些实施方式中，与表达系统中任何内源性tRNA相比，O-RS偏向于氨酰化关联的O-tRNA。当O-tRNA和O-RS以等摩尔浓度存在时，O-RS所加载的O-tRNA与内源性tRNA的相对比例大于1∶1，优选至少约2∶1，更优选5∶1，更优选10∶1，更优选20∶1，更优选50∶1，更优选75∶1，更优选95∶1，98∶1，99∶1，100∶1，500∶1，1,000∶1，5,000∶1或更高。

本发明还提供包含蛋白质的组合物，所述蛋白质含有非天然氨基酸。在某些实施方式中，所述蛋白质含有的氨基酸序列与治疗性蛋白、诊断性蛋白、工业用酶或其部分的序列至少有75％相同。

本发明的组合物和通过本发明方法制备的组合物任选处于细胞中。然后可将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中，从而将非天然氨基酸掺入蛋白质。2004年4月6日提交的，名为“扩展真核遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的国际公布号WO 2004/094593和名为“非天然氨基酸的体内掺入”(IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)的国际公布号WO2002/085923描述了该方法，这两篇文献纳入本文以供参考。例如，当O-tRNA/O-RS配对引入宿主，例如大肠杆菌细胞时，该配对对选择者密码子起反应将非天然氨基酸，例如苯基硒代半胱氨酸在体内掺入蛋白质。加入系统的非天然氨基酸可以是合成氨基酸，例如可以外源性加入生长培养基的苯丙氨酸或酪氨酸衍生物。本发明的组合物任选为体外翻译系统，或体内系统。

本发明的细胞能大量合成包含非天然氨基酸的蛋白质。在一些方面，组合物任选包含，例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含非天然氨基酸的蛋白质，或者体内蛋白质产生方法所能达到的含量(本文提供重组蛋白质制备和纯化的细节)。在另一方面，组合物中包含在例如细胞裂解液、缓冲液、药学缓冲液或其它液体混悬液中(例如，体积为约1nL-约100L)的蛋白质浓度任选是，例如每升至少10微克蛋白质、每升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质。在细胞中制备大量(例如，大于采用其它方法如体外翻译通常可能得到的量)包含至少一个非天然氨基酸的蛋白质是本发明特征之一。

掺入非天然氨基酸可改变蛋白质结构和/或功能，如改变大小、酸性、亲核性、氢键、疏水性、蛋白酶靶位的易接近性、对某部分的靶向(如用于蛋白阵列)、掺入标记物或反应基团等。含有非天然氨基酸的蛋白质的催化或物理特性可得到改善，甚至获得全新的催化或物理特性。例如，可通过将非天然氨基酸掺入蛋白质来任选改进以下特性：毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如血清半衰期)、与其它分子的反应能力(共价或非共价的)等。包含至少含有一个非天然氨基酸的蛋白质的组合物可用作，例如新型治疗剂、诊断剂、催化酶、工业用酶、结合蛋白(如抗体)以及用于例如研究蛋白质结构和功能。参见例如Dougherty，(2000)，“作为蛋白质结构和功能探针的非天然氨基酸”Unnatural Amino Acids as Probes of Protein Structure and Function)，Current Opinion in Chemical Biology，4：645-652。

在本发明的一些方面，组合物包含至少一种含有至少一个，例如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或更多非天然氨基酸的蛋白质。所述非天然氨基酸可以相同或不同，例如蛋白质中可以在1、2、3、4、5、6、7、8、9或10个或更多不同的位点上含有1、2、3、4、5、6、7、8、9或10个或更多不同的非天然氨基酸。在另一方面，组合物包含蛋白质，该蛋白质中至少一个(但不是全部)具体氨基酸是非天然氨基酸。对于给定的含多个非天然氨基酸的蛋白质，所述非天然氨基酸可以相同或不同(如蛋白质可包含两个或多个不同类型的非天然氨基酸，或者可包含两个相同的非天然氨基酸)。对于含两个以上非天然氨基酸的给定蛋白质，所述非天然氨基酸可以相同，不同，或是多个同一类型的非天然氨基酸与至少一个不同的非天然氨基酸的组合。

利用本文组合物和方法可制备基本上任何含非天然氨基酸的蛋白质(或其一部分)(与任何相应的编码核酸，例如含有一个或更多选择者密码子的核酸)。未试图鉴定成百上千的已知蛋白质，可修饰它们中的任一种使之含有一个或多个非天然氨基酸，例如通过改进任何可用的突变方法从而使相关翻译系统中包含一个或多个合适的选择者密码子。已知蛋白质的共有序列库包括GenBankEMBL、DDBJ和NCBI。通过检索互联网不难鉴定其它库。

这些蛋白质通常与任何可用的蛋白质(例如，治疗性蛋白、诊断性蛋白、工业用酶或其一部分等)有，例如至少60％、至少70％、至少75％、至少80％、至少90％、至少95％或至少99％或更高的相同性，同时这些蛋白质含有一个或多个非天然氨基酸。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的例子参见但不限于2004年4月16日提交的名为“扩展真核生物遗传密码”(Expanding the Eukaryotic Genetic Code)的国际公布号WO2004/094593和名为“非天然氨基酸的体内掺入”(IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS.)的WO 2002/085923。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的例子包括但不限于：例如水蛭素、人生长激素、RAS、α-1抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolytic factor)、抗体(抗体的其它细节见下文)、载脂蛋白、脱辅蛋白、心房利钠因子、心房利钠多肽、心房肽(Atrial peptides)、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋白-1α、单核细胞炎性蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配体、C-kit配体、胶原、集落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(如，上皮嗜中性活化肽-78(epithelial Neutrophil Activating Peptide-78)、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-16、MCP-1)、表皮生长因子(EGF)、促红细胞生成素(“EPO”)、剥落性毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、血纤蛋白原、纤连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、Hedgehog蛋白(如Sonic，Indian，Desert)、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如，IFN-α、IFN-β、IFN-γ)、白介素(如，IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质形成细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、萤光素酶、神经营养因子(Neurturin)、嗜中性白细胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲状腺激素、PD-ECSF、PDGF、肽激素(如，人生长激素)、多效营养因子、A蛋白、G蛋白、热源性外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、促生长素抑制剂、促生长素、链激酶、超抗原，即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克综合征毒素(TSST-1)、胸腺素α1、组织纤溶酶原激活物、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶和许多其它蛋白。

可采用本文所述能在体内掺入非天然氨基酸的组合物和方法制备的一类蛋白质包括转录调节剂或其一部分。示例性转录调节剂包括调节细胞生长、分化、调控等的基因和转录调节剂蛋白。转录调节剂存在于原核生物、病毒和真核生物(包括真菌、植物、酵母菌)、昆虫和动物(包括哺乳动物)中，提供了广泛的治疗靶点。应该理解表达和转录激活物通过许多机理调控转录，例如通过与受体结合、刺激信号转导级联反应、调控转录因子表达、与启动子和增强子结合、与结合启动子和增强子的蛋白质结合、DNA解链、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。

本发明的一类蛋白质(例如，含有一个或多个非天然氨基酸的蛋白质)包括生物学活性蛋白，例如细胞因子，炎性分子，生长因子，它们的受体和癌基因产物，如白介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44；信号转导分子和相应的癌基因产物，例如Mos、Ras、Raf和Met；转录激活物和抑制剂，例如p53、Tat、Fos、Myc、Jun、Myb、Rel和类固醇激素受体，例如雌激素、孕酮、睾酮、醛甾酮的那些受体，LDL受体配体和皮质酮。

本发明也提供含有至少一个非天然氨基酸的酶(例如工业用酶)或其一部分。酶的例子包括但不限于：酰胺酶、氨基酸消旋酶、酰基转移酶、脱卤酶、双加氧酶、二芳基丙烷过氧化物酶(diarylpropane peroxidases)、差向异构酶、环氧化物水解酶、酯酶、异构酶、激酶、葡糖异构酶、糖苷酶、糖基转移酶、卤素过氧化物酶(haloperoxidases)、单加氧酶(例如p450)、脂酶、木质素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、转氨酶和核酶。

许多这些蛋白质可商品化购得(参见，例如西格玛生物科学公司(SigmaBioSciences))，相应的蛋白质序列和基因及其许多变体通常是熟知的(参见，例如Genbank)。可根据本发明通过插入一个或多个非天然氨基酸来修饰任何这些蛋白，从而(例如)改变这些蛋白质一种或多种感兴趣的治疗、诊断或酶活性。治疗相关特性包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(例如，通过在非天然氨基酸中加入报道基团(如标记物或标记结合位点))、LD₅₀或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性的例子包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶特性的例子包括保存半衰期、稳定性、酶活性、生产能力等。

也可采用本发明方法和组合物修饰各种其它蛋白质使之包含一个或多个非天然氨基酸。例如，本发明可包括用非天然氨基酸取代一种或多种疫苗蛋白质中的一个或多个天然氨基酸，例如以下来源的蛋白质：感染性真菌，如曲霉(Aspergillus)、假丝酵母(Candida)种；细菌，特别是用作病原性细菌模型的大肠杆菌，以及医学上重要的细菌，如葡萄球菌属(Staphylococci)(如，金黄色葡萄球菌)或链球菌属(Streptococci)(如，肺炎链球菌)；原生动物，如孢子纲(如，疟原虫(Plasmodia))、根足虫(rhizopods)(如，内变形虫(Entamoeba))和鞭毛虫类(锥虫(Trypanosoma)、利什曼原虫(Leishmania)、毛滴虫(Trichomonas)、贾第虫(Giardia)等)；病毒，如(+)RNA病毒(例子包括痘病毒，如痘苗病毒(vaccinia)；小RNA病毒，如脊髓灰质炎病毒(polio)；披膜病毒，如风疹病毒(rubella)；黄病毒(Flaviviruses)，如HCV；和冠状病毒)、(-)RNA病毒(如弹状病毒，如VSV；副粘病毒，如RSV；正粘病毒，如流感病毒；布尼亚病毒和嵌沙样病毒)、dsDNA病毒(如呼肠孤病毒)、RNA到DNA的病毒，即逆转录病毒，如HIV和HTLV和某些DNA到RNA的病毒，如乙肝病毒。

农业相关的蛋白也是非天然氨基酸修饰的合适靶位，例如抗虫蛋白(如Cry蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生长酶(如核酮糖1，5-二磷酸羧化酶/加氧酶，“RUBISCO”)、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。

在某些实施方式中，本发明方法和/或组合物中的感兴趣多肽或蛋白质(或其一部分)由核酸编码。所述核酸通常含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、十个或更多个选择者密码子。

可采用本领域技术人员熟知和本文在“诱变与其它分子生物学技术”中所述的方法诱变编码感兴趣蛋白质或多肽的基因，从而使之含有(例如)一个或多个选择者密码子来掺入非天然氨基酸。例如，可诱变感兴趣蛋白质的核酸，使之含有一个或多个选择者密码子以插入一个或多个非天然氨基酸。本发明包括任何蛋白质的这种变体(例如突变体)形式，例如含有至少一个非天然氨基酸。类似地，本发明也包括相应的核酸，即具有编码一个或多个非天然氨基酸的一个或多个选择者密码子的任何核酸。

为制备含有非天然氨基酸的蛋白质，可利用适合通过正交tRNA/RS配对在体内掺入非天然氨基酸的宿主细胞和生物。可用表达正交tRNA、正交tRNA合成酶的一个或多个载体和编码待衍生蛋白质的载体来遗传改造(例如转化、转导或转染)宿主细胞。各组分可以位于同一载体或各自位于不同载体，或者可以两个组分位于一个载体而第三组分位于第二载体。载体可以是例如质粒、细菌、病毒、裸多核苷酸或偶联多核苷酸的形式。

通过免疫反应性测定多肽

因为本发明多肽提供了各种新的多肽序列(例如，以在本文翻译系统中合成的蛋白质为例，多肽含有非天然氨基酸；或者，以新的合成酶为例，则是标准氨基酸的新序列)，这些多肽也提供了可在例如免疫学测定中识别的新结构特征。产生能与本发明多肽特异性结合的抗血清以及能与这种血清结合的多肽是本发明的特征之一。本文所用的术语“抗体”包括但不限于：基本上由一个或多个免疫球蛋白基因编码的多肽，或其能特异性结合并识别分析物(抗原)的片段。例子包括多克隆、单克隆、嵌合型和单链抗体等。本文所用的术语“抗体”也包括免疫球蛋白片段，包括Fab片段和由表达文库(包括噬菌体文库)产生的片段。抗体的结构与术语可参见，例如Paul，《基础免疫学》(FundamentalImmunology)，第四版，1999，雷文出版社(Raven Press)，纽约。

为产生用于免疫学测定的抗血清，可如本文所述产生并纯化一种或多种免疫原性多肽。例如，可在重组细胞中产生重组蛋白。采用标准小鼠免疫方案(用于测定特异性免疫反应性的抗体产生、免疫测定形式和条件的标准说明可参见，例如Harlow和Lane，(1988)，《抗体，实验室手册》(Antibodies，ALaboratory Manual)，冷泉港出版社，纽约)，用免疫原性蛋白和标准佐剂(如弗氏佐剂)免疫小鼠的近交品系(此类小鼠因其实际遗传相同性使得实验结果重现性较高而选用)。蛋白质、抗体、抗血清等的其它细节可见名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的国际公布号WO 2004/094593；名为“非天然氨基酸的体内掺入”(IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)的WO 2002/085923；名为“糖蛋白合成”(GLYCOPROTEIN SYNTHESIS)的WO 2004/035605和名为“蛋白质阵列”(PROTEIN ARRAYS)的WO 2004/058946。

O-tRNA和O-RS以及O-tRNA/O-RS配对的应用

本发明的组合物和用本发明方法制备的组合物任选存在于细胞内。然后可将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中，从而将非天然氨基酸掺入蛋白质。Schultz等人的名为“非天然氨基酸的体内掺入”的国际公布号WO 2002/085923描述了该方法，该篇文献纳入本文以供参考。例如，当O-tRNA/O-RS配对引入宿主，例如大肠杆菌细胞或酵母时，该配对对选择者密码子，例如琥珀无义密码子起反应而将可外源性加入生长培养基的非天然氨基酸在体内掺入蛋白质，例如肌红蛋白或治疗蛋白中。本发明的组合物可以任选处于体外翻译系统，或体内细胞系统中。含非天然氨基酸的蛋白质的应用范围广泛。例如掺入蛋白质的非天然部分可作为广泛修饰的靶标，如与其它蛋白质、与小分子如标记物或染料和/或生物分子交联。通过这些修饰，掺入非天然氨基酸可产生改进的治疗蛋白，可用于改变或促进酶的催化功能。在一些方面，蛋白质中掺入非天然氨基酸和随后进行修饰有助于研究蛋白质的结构、与其它蛋白质的相互作用，等等。

试剂盒

试剂盒也是本发明特征之一。例如，提供用于在细胞中产生含至少一个非天然氨基酸的蛋白质的试剂盒，所述试剂盒中装有至少一个容器，而该容器含有编码O-tRNA的多核苷酸序列、和/或O-tRNA、和/或编码O-RS的多核苷酸序列、和/或O-RS。在一个实施方式中，所述试剂盒还包含非天然氨基酸苯基硒代半胱氨酸。在另一实施方式中，所述试剂盒还包含制备蛋白质和/或宿主细胞的使用说明材料。

实施例

提供以下实施例只是为了说明，并非要限制本发明。技术人员应该知道可以改变各种非关键性参数而不会脱离本发明的范围。应该知道，本文所述的实施例和实施方式只是为说明目的，本领域技术人员借鉴这些实施例和实施方式可以作出各种改进而仍属于本申请的构思和权限以及随附权利要求书的范围内。

实施例

遗传选择对苯基硒代半胱氨酸具有特异性的突变型合成酶

苯基硒代半胱氨酸的反应活性化学

硒是有机合成和生物学中的基本元素。现已证明可以在温和条件下氧化苯基硒代部分，而硒氧化物(selenoxide)的自发共消除(spontaneous synelimination)可形成烯烃。该方案已广泛用于全合成。

将含硒的非天然氨基酸掺入蛋白质可产生用于高度选择性翻译后修饰蛋白质的有吸引力靶标，例如能产生选择性脂化的蛋白质。一种这样的非天然硒代氨基酸是苯基硒代半胱氨酸(CAS注册号71128-82-0)，也称为苯基硒化物(phenylselenide)或Se-苯基-L-硒代半胱氨酸。该结构见图1，结构1。该非天然氨基酸可以购自，例如西格玛-阿尔德里奇公司(

Co.，Inc.)目录号50827。

氧化切割苯基硒代半胱氨酸氨基酸残基获得α，β-不饱和氨基酸脱氢丙氨酸(参见图1，结构2)。许多天然肽中可发现脱氢丙氨酸(Chatterjee等，(2005)，Chemical Reviews 105(2)：633-683)。含有未保护的半胱氨酸残基的脱氢肽经历分子内立体选择性偶联加成(stereoselective conjugate addition)，从而产生环状羊毛硫氨酸(Chatterjee等，(2005)，Chemical Reviews 105(2)：633-683)。羊毛硫氨酸是见于羊毛硫抗生素(一类翻译后修饰的抗生素)中的结构(Chatterjee等，(2005)，Chemical Reviews 105(2)：633-683)。

非天然氨基酸脱氢丙氨酸(参见图1，结构2)的迈克尔加成反应可产生含翻译后修饰的蛋白质，例如与硫代-脂质反应从而产生脂化蛋白质。更具体地说，与硫代棕榈酸反应产生棕榈酰半胱氨酸(参见图1，结构3)，与法尼基硫醇反应获得法尼基半胱氨酸(参见图1，结构4)，与丙二酸反应产生γ-羧基谷氨酸(参见图1，结构6)。此外，与1-十六烷基硫醇反应看产生S-十六烷基半胱氨酸(参见图1，结构5)。虽然S-十六烷基半胱氨酸不是天然的翻译后修饰，但蛋白质中存在该残基可获得所需特性，例如可获得人血清白蛋白结合(特性)，和较高的体内蛋白质稳定性。

通过靶向修饰苯基硒代半胱氨酸残基来脂化多肽可获得所需特性，例如膜定位、改善体内稳定性(即，改善半衰期)和脂质溶解性。此外，一些蛋白质的脂化形式是生物学活性形式。

产生含苯基硒代半胱氨酸的蛋白质

能将非天然氨基酸系统地加入大肠杆菌、酵母菌和哺乳动物细胞的遗传密码的方法已见诸描述。这些方法依据无义抑制型tRNA和氨酰基-tRNA合成酶(RS)配对的开发，所述配对具有正交特性，该特性定义为对独特密码子起反应而能选择性掺入给定氨基酸，但不与内源性宿主tRNA、氨酰基-tRNA合成酶或氨基酸交叉反应。

本发明提供的组合物和方法通过制备能直接将非天然氨基酸苯基硒代半胱氨酸经遗传编程翻译掺入延伸中的多肽链的正交试剂而在体内产生含该非天然氨基酸的多肽。此外，利用这些正交系统能产生大量含非天然氨基酸的多肽(即，多肽量远大于采用其它合成方法所可能的)。含苯基硒代半胱氨酸的多肽可用于靶向修饰反应，例如但不限于按照本发明的指导产生人工脂化多肽。这种修饰的蛋白质具有各种应用，包括但不限于改善治疗剂。

为产生唯一插入苯基硒代半胱氨酸(图1，结构1)的正交tRNA/aaRS配对，利用詹氏甲烷球菌酪氨酰-tRNA合成酶(MjTyrRS)的活性位点突变体文库，该合成酶专门加载大肠杆菌合成酶不识别的经工程改造詹氏甲烷球菌无义抑制型(MjtRNA^TyrCUA)。将Wang等((2006)，Annual Review of Biophysics andBiomolecular Structure 35：225-249)所述的合成酶文库pBK-lib5用于筛选，进行一系列正和负选择。在正选择中，有苯基硒代半胱氨酸存在下，细胞存活取决于抑制氯霉素乙酰基转移酶(CAT)基因中的琥珀突变，在负选择中，没有苯基硒代半胱氨酸存在下，细胞存活取决于编码毒性芽孢杆菌RNA酶蛋白的基因中琥珀突变的不充分抑制。只有对琥珀密码子起反应而独特地掺入苯基硒代半胱氨酸，克隆才能经多轮正和负选择而存活下来。

这些选择后，鉴定在氯霉素存在时允许含CAT基因的细胞在只有苯基硒代半胱氨酸存在时存活的候选克隆，CAT基因在允许位点含有琥珀突变选择者密码子。没有苯基硒代半胱氨酸存在时，相同的细胞在有氯霉素存在下不生长，这与具有较低或没有内源性氨基酸掺入背景存活的有效的苯基硒代半胱氨酸掺入相一致。

候选突变体合成酶克隆测序显示有三种不同的合成酶分离物，各能在正交翻译系统中起作用。

克隆1(PhSeRS-SD)：Y32W、L65E、H70G、D158Q、L162S

克隆2(PhSeRS-K4)：Y32W、L65H、H70G、F108N、Q109S、D158S、L162E

克隆3(PhSeRS-K5)：Y32W、L65H、A67G、H70G、F108K、Q109S、D158E、L162E

下表进一步总结了这些克隆。

詹氏甲烷球菌酪氨酰-tRNA合成酶氨基酸序列野生型和突变型

	32	65	67	70	108	109	158	162	SEQ IDNO：
	32	65	67	70	108	109	158	162	SEQ IDNO：	野生型	Tyr	Leu	Ala	His	Phe	Gln	Asp	Leu	2
突变型克隆1(SD)	Trp	Glu	Ala	Gly	Phe	Gln	Gln	Ser	4	野生型	Tyr	Leu	Ala	His	Phe	Gln	Asp	Leu	2
突变型克隆1(SD)	Trp	Glu	Ala	Gly	Phe	Gln	Gln	Ser	4	突变型克隆2(K4)	Trp	His	Ala	Gly	Asn	Ser	Ser	Glu	6
突变型克隆3(K5)	Trp	His	Gly	Gly	Lys	Ser	Glu	Glu	8	突变型克隆2(K4)	Trp	His	Ala	Gly	Asn	Ser	Ser	Glu	6

在这些分离的突变型合成酶中，克隆2合成酶(PhSeRS-K4)的活性和特异性最高。这些克隆以及相应的野生型种类的完整核苷酸和氨基酸序列见图2。

正交合成酶验证

利用本文所述的突变型合成酶，含4位琥珀选择者密码子(TAG4)的肌红蛋白模型蛋白的表达产量是1.5-2mg/L，没有苯基硒代半胱氨酸存在时无背景表达。含苯基硒代半胱氨酸的该模型蛋白经进一步翻译后修饰产生γ-羧基谷氨酸(图1，结构6)，其用高分辨质谱确认。

利用本文所述的突变型合成酶和体内正交生产系统还表达了两种含苯基硒代半胱氨酸的额外模型蛋白质，产量是3-5mg/L。制备含苯基硒代半胱氨酸的人生长激素(hGH)。产生苯基硒代半胱氨酸形式后，修饰该蛋白质以产生含S-十六烷基半胱氨酸的hGH。目前正在检验小鼠中经修饰hGH的人血清白蛋白结合特性和体内半衰期。

本文所述的正交试剂还用于产生含苯基硒代半胱氨酸的绿色荧光蛋白(GFP)。或者，随后还可修饰该形式的蛋白质以产生S-十六烷基半胱氨酸、法尼基半胱氨酸和棕榈酰半胱氨酸形式的GFP。目前正在检验这些脂化形式GFP的膜靶向特性。

因此，本发明提供遗传编程制造含非天然氨基酸苯基硒代半胱氨酸(参见图1，结构1)的蛋白质的组合物和方法。然后用过氧化氢进行氧化消除从而在所需位置产生脱氢丙氨酸(参见图1，结构2)。然后在各种二级修饰反应中以该脱氢丙氨酸部分为靶标。

＊＊＊

虽然出于清晰和理解的目的描述了本发明的一些细节，但本领域技术人员在阅读本文后应知道可对形式和细节作出各种改变而不脱离本发明的真正范围。如同每一篇单独出版物、专利、专利申请和/或其它文献单独表明出于所有目的纳入本文以供参考的程度一样，本申请引用的所有出版物、专利、专利申请和/或其它文件出于所有目的全文纳入本文以供参考。

Claims

1.一种翻译系统，所述系统包含：

(a)第一非天然氨基酸，其为苯基硒代半胱氨酸；

(b)第一正交氨酰基-tRNA合成酶(O-RS)；和

(c)第一正交tRNA(O-tRNA)；

其中所述第一O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一O-tRNA。

2.如权利要求1所述的翻译系统，其特征在于，所述第一O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一O-tRNA的效率是另一翻译系统的观察效率的至少50％，后一翻译系统含有所述O-tRNA、所述苯基硒代半胱氨酸和含SEQ ID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶。

3.如权利要求1所述的翻译系统，其特征在于，所述第一O-RS含有的氨基酸序列选自SEQ ID NO：4、6、8所示氨基酸和它们的保守性变体构成的组。

4.如权利要求1所述的翻译系统，其特征在于，所述第一O-tRNA是琥珀抑制型tRNA。

5.如权利要求1所述的翻译系统，其特征在于，所述第一O-tRNA包含SEQ ID NO：1所示多核苷酸序列或由其编码。

6.如权利要求1所述的翻译系统，其特征在于，所述系统还包含编码感兴趣蛋白质的核酸，所述核酸含有至少一种选择者密码子，其中所述第一O-tRNA识别所述选择者密码子。

7.如权利要求6所述的翻译系统，其特征在于，所述系统还包含第二O-RS和第二O-tRNA，其中所述第二O-RS用不同于所述第一非天然氨基酸的第二非天然氨基酸优先氨酰化所述第二O-tRNA，其中所述第二O-tRNA识别与所述第一O-tRNA识别之选择者密码子不同的选择者密码子。

8.如权利要求1所述的翻译系统，其特征在于，所述系统包含含有所述第一非天然氨基酸、所述第一O-RS和所述第一O-tRNA的宿主细胞。

9.如权利要求8所述的翻译系统，其特征在于，所述宿主细胞是真细菌细胞。

10.如权利要求9所述的翻译系统，其特征在于，所述真细菌细胞是大肠杆菌细胞。

11.如权利要求8所述的翻译系统，其特征在于，所述宿主细胞包含编码所述第一O-RS的多核苷酸。

12.如权利要求11所述的翻译系统，其特征在于，所述多核苷酸包含SEQID NO：5、7或9所示的核苷酸序列。

13.如权利要求8所述的翻译系统，其特征在于，所述宿主细胞包含编码所述第一O-tRNA的多核苷酸。

14.一种在翻译系统中产生在所选位置含非天然氨基酸的蛋白质的方法，所述方法包括：

(a)提供翻译系统，该系统包含：

(i)第一非天然氨基酸，其为苯基硒代半胱氨酸；

(ii)第一正交氨酰基-tRNA合成酶(O-RS)；

(iii)第一正交tRNA(O-tRNA)；其中所述第一O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一O-tRNA；和

(iv)编码所述蛋白质的核酸，其中所述核酸包含所述第一O-tRNA识别的至少一个选择者密码子；和

(b)在所述蛋白质的翻译期间对所述选择者密码子起反应而将所述非天然氨基酸掺入所述蛋白质的所述所选位置，从而产生在所选位置含所述非天然氨基酸的所述蛋白质。

15.如权利要求14所述的方法，其特征在于，所述第一O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一O-tRNA的效率是另一翻译系统的观察效率的至少50％，后一翻译系统含有所述O-tRNA、所述苯基硒代半胱氨酸和含SEQID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶。

16.如权利要求14所述的方法，其特征在于，所述翻译系统包含编码所述O-RS的多核苷酸。

17.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供含以下氨基酸序列的O-RS：SEQ ID NO：4、6、8所示氨基酸和它们的保守性变体。

18.如权利要求14所述的方法，其特征在于，所述提供第一正交氨酰基-tRNA合成酶包括通过定点诱变使野生型氨酰基-tRNA合成酶的氨基酸结合口袋突变，选择用所述非天然氨基酸优先氨酰化所述O-tRNA的得到的O-RS，从而提供所述第一正交氨酰基-tRNA合成酶。

19.如权利要求18所述的方法，其特征在于，所述选择步骤包括从含多个突变型氨酰基-tRNA合成酶分子的库中正选择和负选择所述O-RS，所述分子在所述定点诱变后产生。

20.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供编码所述O-tRNA的多核苷酸。

21.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供O-tRNA，所述O-tRNA是琥珀抑制型tRNA。

22.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供编码或含有所述O-tRNA的核酸，其中所述核酸包含SEQ ID NO：1所示多核苷酸序列。

23.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供编码所述O-RS的核酸，其中所述核酸包含SEQ ID NO：5、7或9所示多核苷酸序列。

24.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供含有琥珀选择者密码子的核酸。

25.如权利要求14所述的方法，其特征在于，所述蛋白质包含不同于所述第一非天然氨基酸的第二非天然氨基酸，其中所述翻译系统还包含第二O-RS和第二O-tRNA，其中所述第二O-RS用不同于所述第一非天然氨基酸的第二非天然氨基酸优先氨酰化所述第二O-tRNA，其中所述第二O-tRNA识别核酸中与所述第一O-tRNA识别的选择者密码子不同的选择者密码子。

26.如权利要求14所述的方法，其特征在于，所述提供翻译系统包括提供宿主细胞，其中所述宿主细胞包含所述第一非天然氨基酸，所述第一O-RS、所述第一O-tRNA和所述核酸，其中所述掺入步骤包括培养所述宿主细胞。

27.如权利要求26所述的方法，其特征在于，所述宿主细胞是真细菌宿主细胞。

28.如权利要求27所述的方法，其特征在于，所述真细菌宿主细胞是大肠杆菌宿主细胞。

29.如权利要求26所述的方法，其特征在于，所述宿主细胞包含编码所述O-RS的核酸。

30.如权利要求29所述的方法，其特征在于，编码所述O-RS的所述核酸包含SEQ ID NO：5、7或9所述的核苷酸序列。

31.如权利要求14所述的方法，其特征在于，所述方法还包括步骤(c)使所述蛋白质中所述所选位置的所述苯基硒代半胱氨酸反应，从而产生在所述位置含有脱氢丙氨酸的蛋白质。

32.如权利要求31所述的方法，其特征在于，通过氧化消除进行所述反应。

33.如权利要求31所述的方法，其特征在于，所述反应包括使所述苯基硒代半胱氨酸与过氧化氢接触。

34.一种在翻译系统中产生在所选位置含脂质部分的蛋白质的方法，所述方法包括：

(a)提供翻译系统，该系统包含：

(i)苯基硒代半胱氨酸非天然氨基酸；

(ii)正交氨酰基-tRNA合成酶(O-RS)；

(iii)正交tRNA(O-tRNA)；其中所述O-RS用所述苯基硒代半胱氨酸优先氨酰化所述O-tRNA；和

(iv)编码所述蛋白质的核酸，其中所述核酸在所述所选位置包含所述O-tRNA识别的选择者密码子；

(b)在所述蛋白质的翻译期间对所述选择者密码子起反应而将苯基硒代半胱氨酸掺入所述蛋白质的所述所选位置；

(c)使所述蛋白质中所述所选位置的所述苯基硒代半胱氨酸反应，从而产生在所选位置含有脱氢丙氨酸的蛋白质；和

(d)使所述所选位置的所述脱氢丙氨酸与脂质部分反应，从而产生在蛋白质中所述所选位置含有脂化氨基酸部分的蛋白质。

35.如权利要求34所述的方法，其特征在于，通过氧化消除使所述蛋白质中所选位置的所述苯基硒代半胱氨酸发生所述反应。

36.如权利要求34所述的方法，其特征在于，使所述蛋白质中所选位置的所述苯基硒代半胱氨酸发生所述反应包括使所述苯基硒代半胱氨酸接触过氧化氢。

37.如权利要求34所述的方法，其特征在于，所述脂质部分选自：硫代棕榈酸、法尼基硫醇和1-十六烷硫醇。

38.如权利要求34所述的方法，其特征在于，所述脂化氨基酸部分选自：棕榈酰基半胱氨酸、法尼基半胱氨酸和S-十六烷基半胱氨酸。

39.如权利要求34所述的方法，其特征在于，通过迈克尔加成反应使所述蛋白质中所选位置的所述脱氢丙氨酸发生所述反应。

40.一种在翻译系统中产生在所选位置含脱氢丙氨酸非天然氨基酸的蛋白质的方法，所述方法包括：

(a)提供翻译系统，该系统包含：

(i)苯基硒代半胱氨酸非天然氨基酸；

(ii)正交氨酰基-tRNA合成酶(O-RS)；

(b)在所述蛋白质的翻译期间对所述选择者密码子起反应而将所述苯基硒代半胱氨酸非天然氨基酸掺入所述蛋白质的所述所选位置；

(c)使所述蛋白质中所选位置的所述苯基硒代半胱氨酸反应，从而产生在所选位置含有所述脱氢丙氨酸非天然氨基酸的蛋白质。

41.如权利要求40所述的方法，其特征在于，通过氧化消除使所述蛋白质中所选位置的所述苯基硒代半胱氨酸发生所述反应。

42.如权利要求40所述的方法，其特征在于，使所述蛋白质中所选位置的所述苯基硒代半胱氨酸发生所述反应包括使所述苯基硒代半胱氨酸接触过氧化氢。

43.一种包含多肽的组合物，所述多肽含有的氨基酸序列选自SEQ IDNO：4、6或8所示氨基酸序列及其保守性变体构成的组。

44.如权利要求43所述的组合物，其特征在于，所述保守性变体多肽用非天然氨基酸氨酰化关联正交tRNA(O-tRNA)的效率是另一翻译系统的观察效率的至少50％，后一翻译系统含有所述O-tRNA、所述非天然氨基酸和含SEQID NO：4、6或8所示氨基酸序列的氨酰基-tRNA合成酶。

45.如权利要求43所述的组合物，其特征在于，所述组合物包含含有所述多肽的细胞。

46.一种编码权利要求43所述多肽的多核苷酸。

47.如权利要求46所述的多核苷酸，其特征在于，所述多核苷酸包含SEQID NO：5、7或9所示的核苷酸序列。

48.一种包含权利要求46所述多核苷酸的载体。

49.一种包含权利要求46所述多核苷酸的表达载体。

50.一种包含载体的细胞，所述载体含有权利要求46所述的多核苷酸。

51.一种包含多核苷酸的组合物，所述多核苷酸含有SEQ ID NO：5、7或9所示的核苷酸序列。