CN101535338A

CN101535338A - 在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质

Info

Publication number: CN101535338A
Application number: CNA2007800390157A
Authority: CN
Inventors: 刘文设; P·G·舒尔茨
Original assignee: Scripps Research Institute
Current assignee: Scripps Research Institute
Priority date: 2006-10-18
Filing date: 2007-10-17
Publication date: 2009-09-16
Also published as: WO2008073184A2; US20100021963A1; EP2069481A4; BRPI0718389A2; JP2010506591A; EP2069481A2; MX2009004043A; IL197917A0; RU2009112104A; CA2665678A1; AU2007333010A1; US20080166766A1; US9624485B2; WO2008073184A3; KR20090094812A

Abstract

本发明涉及能在哺乳动物宿主细胞，如灵长类宿主细胞和啮齿动物细胞中将非天然氨基酸掺入蛋白质的tRNA和氨酰－tRNA合成酶的正交对。本发明提供，例如但不限于包括宿主细胞(如灵长类或啮齿类细胞)，衍生自真细菌合成酶的正交氨酰－tRNA合成酶、正交tRNA以及非天然氨基酸的翻译系统。本发明还涉及在哺乳动物宿主细胞系统中产生含有至少一个非天然氨基酸的感兴趣蛋白质的方法。

Description

在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质

相关申请的交叉参考

本申请要求2006年10月18日提交的美国临时专利申请序列号60/853,008和2007年4月12日提交的序列号60/923,458的优先权，通过引用将其全部内容纳入本文用于所有目的。

对联邦资助研发下所作发明的权利的声明

本发明在国立卫生研究院资助号GM62159的政府支持下做出。政府对本发明享有某些权利。

发明领域

本发明属于翻译生物化学领域。本发明涉及制备和利用正交(orthogonal)tRNA、正交氨酰-tRNA合成酶和它们的配对将非天然氨基酸掺入蛋白质的组合物和方法。本发明还涉及用这种配对在细胞中产生蛋白质的方法以及用这种方法产生的蛋白质。

发明背景

已有描述在哺乳动物细胞中将非天然氨基酸定点插入蛋白的方法。分别将化学氨酰化的抑制子tRNA显微注射或电穿孔到CHO细胞或神经元中，并用一系列的非天然氨基酸抑制无义琥珀突变(Monahan等(2003)，“将非天然氨基酸定点掺入哺乳动物细胞中表达的受体”(Site-specific incorporation of unnaturalamino acids into receptors expressed in Mammalian cells)Chem Biol 10：573-580)。然而，使用氨酰化tRNA作为化学计量试剂严重限制了能够产生的蛋白的量。

此外，工程改造不与宿主tRNA、aaRS或氨基酸(正交tRNA/aaRS)交叉反应的异源抑制子tRNA/aaRS对使蛋白中选择性掺入非天然氨基酸。例如，Yokoyama及其同事对脂肪嗜热芽孢杆菌(Bacillus stearothermophilus)琥珀抑制子

(

)以及大肠杆菌(E.coli)酪氨酰-tRNA合成酶(EcTyrRS)进行修饰使3-碘-L-酪氨酸掺入到CHO细胞的蛋白中(Sakamoto等(2002)，“在哺乳动物细胞中将非天然氨基酸定点掺入蛋白质中”(Site-specificincorporation of an unnatural amino acid into proteins in mammalian cells)NucleicAcids Res30：4692-4699)。同样，Zhang及其同事对正交枯草杆菌(Bacillus subtilis)抑制子tRNA/色氨酸-tRNA合成酶对进行工程改造使5-羟色氨高保真的掺入到哺乳动物细胞的蛋白中(Zhang等(2004)“将5-羟色氨选择性掺入到哺乳动物细胞蛋白中”(Selective incorporation of 5-hydroxytryptophan into proteins inmammalian cells)Proc Natl Acad Sci USA 101：8882-8887).

然而，使用基于结构的诱变产生氨酰化侧链与野生型底物显著不同的氨基酸的aaRS变体需要突变多个活性位点残基，而这些残基难以事先预测(Zhang等(2002)，“基于结构设计突变詹氏甲烷球菌(Methanococcusjannaschii)酪氨酰-tRNA合成酶以掺入O-甲基-L-酪氨酸”(Structure-based design of mutantMethanococcus jannaschii tyrosyl-tRNA synthetase for incorporation ofO-methyl-L-tyrosine)Proc Natl Acad Sci U S A 99：6579-6584；Turner等(2005)，“对-乙酰苯丙氨酸氨酰基tRNA合成酶的结构鉴定”(Structuralcharacterization of a p-acetylphenylalanyl aminoacyl-tRNA synthetase)J Am ChemSoc127：14976-14977；Turner等(2006)，“氨酰-tRNA合成酶活性位点的结构可塑性”(Structural plasticity of an aminoacyl-tRNA synthetase active site)ProcNatl Acad Sci USA 103：6483-6488)。此外，工程改造的突变体仍可识别宿主氨基酸，如使关联

携带3-碘-L-酪氨酸的突变aaRS(Sakamoto等(2002)，“在哺乳动物细胞中将非天然氨基酸定点掺入蛋白质中”(Site-specificincorporation of an unnatural amino acid into proteins in mammalian cells)NucleicAcids Res 30：4692-4699；以及Kiga等(2002)，“一种在真核翻译中将非天然氨基酸定点掺入蛋白的工程改造的大肠杆菌酪氨酰-tRNA合成酶及其在麦芽无细胞体系中的应用”(An engineered Escherichia coli tyrosyl-tRNA synthetase forsite-specific incorporation of an unnatural amino acid into proteins in eukaryotictransl ation and its application in a wheat germ cell-free system)Proc Natl Acad SciU S A 99：9715-9720)。

此外，可尝试在哺乳动物细胞中直接演化特异性改变的aaRS。例如，Wang及其同事最近在人B细胞系中使用体细胞超变异直接演化具有增强的光稳定性和远红发射的单体形式的红色荧光蛋白(Wang等(2004)，“通过反复体细胞超变异使新非抗体蛋白演化”(Evolution of new nonantibody proteins via iterativesomatic hypermutation)Proc Natl Acad Sci USA 101：16745-16749)。然而，体细胞超变异在整个蛋白中引入随机突变，其有效性小于演化底物特异性改变的突变体时进行的活性位点靶向诱变中产生的遗传多样性。然而后者受限于在哺乳动物细胞中产生大的稳定文库的困难。

正交翻译技术

已开发出能将结构多样的非天然氨基酸体外定点掺入原核生物和酵母蛋白的常用方法，这些非天然氨基酸具有非天然的物理、化学和生物学属性。这些方法依赖于在体内多肽翻译中能识别合适选择编码子并在感兴趣基因的明确位点插入期望的非天然氨基酸的正交蛋白翻译组件。这些方法使用识别选择编码子(如无义琥珀编码子)的正交tRNA(O-tRNA)，并且对应的特定正交氨酰-tRNA合成酶(O-RS)使该O-tRNA特异性携带非天然氨基酸。这些组件不与宿主有机体内任意内源性tRNA或RS交叉反应(即工程改造的tRNA和RS是正交的)。

在大肠杆菌宿主系统中使用此技术，由詹氏甲烷球菌tRNA^Tyr/TyrRS对、古细菌tRNA^Glu/嗜热古菌(Pyrococcus horikoshii)谷氨酰-tRNA合成酶对、以及古细菌tRNA^Lys/嗜热古菌赖氨酰-tRNA合成酶对产生功能性琥珀和移码抑制子tRNA/aaRS对。在酿酒酵母(Saccharomyces cerevisiae，S.cerevisiae)中，功能性tRNA_CUA/aaRS对衍生自对应的大肠杆菌tRNA^Tyr/TyrRS以及tRNA^Leu/亮氨酰-tRNA合成酶对。使用正向和反向选择组合对这些抑制子tRNA/aaRS对的定向演化能够在大肠杆菌和酿酒酵母中有效、高选择性地体内掺入大量不同的非天然氨基酸。这些包括荧光、糖基化、硫酸化、金属离子结合和氧化还原活性氨基酸以及具有新化学和光化学反应性的氨基酸。该方法为在体内外探索蛋白结构和功能以及产生诸如具有新的或增强特性的治疗性蛋白等蛋白质提供了有力的工具。将这些方法扩展至哺乳动物细胞，如灵长类和啮齿动物细胞系将显著增强该方法的实用性。

本领域普遍知道利用适合于在体内制备含一个或多个非天然氨基酸的蛋白质的正交翻译系统。例如，参见国际公布号WO 2002/086075，其名为“METHODS AND COMPOSITION FOR THE PRODUCTION OFORTHOGONAL tRNA-AMINOACYL-tRNA SYNHETASE PAIRS(产生正交tRNA-氨酰-tRNA合成酶配对的方法和组合物)”；WO 2002/085923，其名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”；WO 2004/094593，其名为“EXPANDING THEEUKARYOTIC GENETIC CODE(扩展真核遗传密码)”；2004年7月7日提交的WO 2005/019415；2004年7月7日提交的WO 2005/007870；2004年7月7日提交的WO 2005/007624；和2005年10月27日提交的WO2006/110182，其名为“ORTHOGONAL TRANSLATION COMPONENTSFOR THE IN VIVO INCORPORATION OF UNNATURAL AMINOACIDS(体内掺入非天然氨基酸的正交翻译组分)”。这些申请各自通过引用全文纳入本文。

正交翻译系统的其它讨论参见如Wang等(2001)，“扩展大肠杆菌的遗传密码”(Expanding the genetic code of Escherichiacoli)Science 292：498-500；Wang和Schultz(2002)，“扩展遗传密码”(Expanding the Genetic Code)Chem.Commun.(Camb.)1：1-11；Alfonta等(2003)，“在蛋白中定点掺入氧化还原活性氨基酸”(Site-Specific Incorporation of a Redox-Active Amino Acid into Proteins)J Am ChemSoc125：14662-14663；Santoro等(2003)，“用于在大肠杆菌中对蛋白进行非天然氨基酸诱变的古细菌起源的谷氨酰-tRNA合成酶和tRNA”(Anarchaebacteria-derived glutamyl-tRNA synthetase and tRNA pair for unnatural amino acidmutagenesis of proteins in Escherichiacoli)Nucleic Acids Res 31：6700-6709；Chin等(2003)，“扩展的真核遗传密码”(An expanded eukaryotic genetic code)Science301，964-967；Chin等(2003)，“扩展的真核遗传密码进展”(Progress toward anexpanded eukaryotic genetic code)Chem Biol 10，511-519；以及Wu等(2004)，“遗传编码的光笼蔽氨基酸”(A genetically encoded photocaged amino acid)J AmChem Soc 126，14306-14307；Summerer等(2006)，“遗传编码的荧光氨基酸”(AGenetically Encoded Fluorescent Amino Acid)PNAS 103(26)：9785-9789；Anderson等(2004)，“具有功能性四联密码子的扩展遗传密码”(An expandedgenetic code with a functional quadruplet codon)Proc Natl Acad Sci U S A 101：7566-7571；Zhang等(2004)，“合成糖蛋白的新策略”(A new strategy for thesynthesis of glycoproteins)Science 303，371-373；Wang和Schultz“扩展遗传密码”(Expanding the Genetic Code)Angewandte Chemie Int.Ed.，44(1)：34-66(2005)；Xie和Schultz“扩展的遗传密码”(An Expanding Genetic Code)Methods36(3)：227-238(2005)；Xie和Schultz“在遗传库中加入氨基酸”(Adding AminoAcids to the Genetic Repertoire)Curr.Opinion in Chemical Biology 9(6)：548-554(2005)；Wang等“扩展遗传密码”(Expanding the Genetic Code)Annu.Rev.Biophys.Biomol.Struct.，35：225-249(2006)；Xie和Schultz(2006)“蛋白化学工具箱-扩展遗传密码”(A Chemical Toolkit for Proteins-an Expanded GeneticCode)Nat.Rev.Mol.Cell Biol.，7(10)：775-782；Summerer等(2006)，“遗传编码的荧光氨基酸”(A Genetically Encoded Fluorescent Amino Acid)Proc NatlAcad Sci U S A 103，9785-9789；Wang等(2006)，“遗传编码的荧光氨基酸”(AGenetically Encoded Fluorescent Amino Acid)J Am Chem Soc 128，8738-8739；以及Liu和Schultz(2006)，“在大肠杆菌中重组表达选择性硫酸化的蛋白”(Recombinant Expression of Selectively Sulfated Proteins in E.coli)NatBiotechnol.，24(11)：1436-1440。上述每一出版物的内容均通过引用纳入本文。

本领域需要开发在期望将非天然氨基酸掺入设定位点时，能够在哺乳动物细胞宿主系统，例如灵长类和啮齿类宿主细胞系统中将非天然氨基酸掺入蛋白质的改良的正交翻译组件。本领域需要用于筛选和鉴别能用于哺乳动物细胞如啮齿类和人细胞的正交翻译组件(如突变的氨酰-tRNA合成酶)的改良方法。本文所述发明满足此类及其它需求，在浏览下述公开文本后将明了。

发明内容

本发明提供了允许在哺乳动物细胞如啮齿类和灵长类细胞中遗传表达具有多种理化和生物学属性的非天然氨基酸的常用方法。首先在酵母中演化突变的大肠杆菌(Escherichia coli，E.coli)氨酰-tRNA合成酶(RS)，以选择性使用感兴趣的非天然氨基酸。使用突变RS及来自真细菌如脂肪嗜热芽孢杆菌(B.stearothermophilus))的琥珀抑制子tRNA在哺乳动物细胞中响应于琥珀无义密码子而将非天然氨基酸定点掺入蛋白质中。将十种非天然氨基酸(图1提供的非天然氨基酸)独立掺入中国仓鼠卵巢(CHO)细胞或人293T表达的模式蛋白中，蛋白表达效率高达每2×10⁷个细胞产生1μg蛋白。质谱确认非天然氨基酸的高翻译保真度。该方法利于在蛋白中引入生物学探针进行细胞研究，并可能最终利于在哺乳动物细胞如啮齿类和灵长类细胞中合成含非天然氨基酸的治疗性蛋白。

本发明提供了在宿主细胞如啮齿类宿主细胞或灵长类宿主细胞体内，响应选择者密码子如琥珀终止密码子，在延伸的多肽链中掺入非天然氨基酸的组合物和方法。这些组合物包括宿主细胞、以及不与宿主细胞翻译机器相互作用的正交-tRNA(O-tRNA)和正交氨酰-tRNA合成酶(O-RS)对。也就是说，宿主细胞的内源性氨酰-tRNA合成酶未使(或未显著使)该O-tRNA携带(天然的或非天然的)氨基酸。同样，本发明提供的O-RS未使任意内源性tRNA携带显著或可检测水平的氨基酸(天然的或非天然的)。这些新组合物允许在哺乳动物宿主细胞系统中产生大量翻译掺入非天然氨基酸的蛋白质。

在一些方面，本发明提供了翻译系统。这些系统包含(a)哺乳动物宿主细胞如啮齿类或灵长类宿主细胞，含有(b)第一正交氨酰-tRNA合成酶(O-RS)，(c)第一正交tRNA(O-tRNA)以及(d)第一非天然氨基酸，其中第一O-RS优选用第一非天然氨基酸氨酰化第一O-tRNA。非天然氨基酸可以是，但不限于：

对-甲氧基苯丙氨酸(pMpa)；

对-乙酰基苯丙氨酸(pApa)；

对-苯甲酰苯丙氨酸(pBpa)；

对-碘代苯丙氨酸(pIpa)；

对-叠氮基苯丙氨酸(pAzpa)；

对-炔丙基氧基苯丙氨酸(pPpa)；

α-氨基辛酸；

邻-硝基苄基半胱氨酸(o-NBC)；

1，5-丹磺酰丙氨酸；和

邻-硝基苄基丝氨酸(o-NBS).

在一些方面，O-RS优选用所述非天然氨基酸氨酰化O-tRNA，其效率至少为包含相同O-tRNA、非天然氨基酸和含有选自SEQ ID NO：57-101的氨基酸序列的氨酰-tRNA合成酶的翻译系统效率的50％。

该翻译系统可使用衍生自多种来源的组分。在一个实施方式中，第一O-RS衍生自大肠杆菌氨酰-tRNA合成酶，如野生型大肠杆菌酪氨酰或亮氨酰合成酶。在一些实施方式中，O-tRNA包含SEQ ID NO：3或由SEQ ID NO：3编码。系统中所用O-RS可包含氨基酸序列SEQ ID NOS：57-101以及该序列的保守变体。在一些方面，宿主细胞可包含一种或多种编码翻译系统组件，包括O-RS或O-tRNA的多核苷酸。在一些实施方式中，编码O-RS的多核苷酸包含选自SEQ ID NO：8-56的核苷酸序列。

在一些方面，该翻译系统还包含编码感兴趣蛋白的核酸，其中所述核酸具有至少一个能被O-tRNA识别的选择者密码子。

在一些方面，该翻译系统(即宿主细胞)纳入使用第二非天然氨基酸的第二正交对(即第二O-RS和第二O-tRNA)，因此该系统现在能够将至少两种不同非天然氨基酸掺入到多肽的不同所选位点。在这个双重系统中，第二O-RS优选用不同于第一非天然氨基酸的第二非天然氨基酸氨酰化第二O-tRNA，并且第二O-tRNA识别的选择者密码子不同于第一O-tRNA识别的选择者密码子。

翻译系统中所用的哺乳动物宿主细胞不受特别限制，只要O-RS和O-tRNA在宿主细胞环境中保留其正交性。宿主细胞可以是啮齿类宿主动物细胞如小鼠细胞和大鼠细胞。当宿主细胞为灵长类细胞时，细胞可为，例如人宿主细胞、黑猩猩宿主细胞、倭黑猩猩宿主细胞、大猩猩宿主细胞、猩猩宿主细胞、长臂猿宿主细胞、短尾猿宿主细胞、绢毛猴宿主细胞或狨宿主细胞。宿主细胞可为，例如CHO细胞或人293T。

在另一些方面，本发明提供了产生在所选位置具有一个或多个非天然氨基酸的感兴趣蛋白质的方法。这些方法使用上述翻译系统。通常，这些方法从提供翻译系统的步骤开始，该翻译系统包括：(i)第一非天然氨基酸(如图1中非天然氨基酸)；(ii)第一正交氨酰-tRNA合成酶(O-RS)；(iii)第一正交tRNA(O-tRNA)，其中O-RS优选用非天然氨基酸氨酰化O-tRNA；以及(iv)编码感兴趣蛋白的核酸，其中该核酸包含至少一个能被第一O-tRNA识别的选择者密码子，并且选择者密码子在核酸中的位置对应感兴趣蛋白中的所选位置。所有这些系统组件均包含于合适的宿主细胞，如啮齿类或灵长类细胞中。产生具有非天然氨基酸的蛋白质的方法通常需要在上述翻译系统所有组件存在下培养宿主细胞。在这些方法中，非天然氨基酸可选自(但不限于)：

对-甲氧基苯丙氨酸(pMpa)；

对-乙酰基苯丙氨酸(pApa)；

对-苯甲酰苯丙氨酸(pBpa)；

对-碘代苯丙氨酸(pIpa)；

对-叠氮基苯丙氨酸(pAzpa)；

对-炔丙基氧基苯丙氨酸(pPpa)；

α-氨基辛酸；

邻-硝基苄基半胱氨酸(o-NBC)；

1，5-丹磺酰丙氨酸；和

邻-硝基苄基丝氨酸(o-NBS).

在这些方法的一些方面，O-RS优选用非天然氨基酸氨酰化O-tRNA，其效率至少为包含相同O-tRNA、非天然氨基酸和含有选自SEQ ID NO：57-101的氨基酸序列的氨酰-tRNA合成酶的翻译系统效率的50％。

该方法可利用多种试剂进行广泛应用。在本方法的一些实施方式中，O-tRNA包含SEQ ID NO：3或由SEQ ID NO：3编码。在一些实施方式中，提供了编码O-RS和/或O-tRNA的多核苷酸。在一些实施方式中，O-RS衍生自大肠杆菌氨酰-tRNA合成酶，如野生型大肠杆菌酪氨酰或亮氨酰-tRNA合成酶。一些实施方式中，提供步骤包括提供含有选自SEQ ID NO：57-101的氨基酸序列及其保守变体的O-RS。在这些方法的一些方面，提供了编码O-RS的多核苷酸。例如，编码O-RS的多核苷酸可包含选自SEQ ID NO：8-56的核苷酸序列。

在这些方法的一些实施方式中，提供O-RS需要通过定点诱变技术突变野生型氨酰-tRNA合成酶的氨基酸结合口袋，和选择优先用非天然氨基酸氨酰化O-tRNA的所得的O-RS。选择步骤可包括在定点诱变后从得到的氨酰-tRNA合成酶分子库中正向和负向选择O-RS。

还可改进这些方法以在蛋白质中掺入一个以上非天然氨基酸。在那些方法中，联用第二正交翻译系统与第一翻译系统，其中第二系统具有不同的氨基酸和选择者密码子特异性。例如，提供步骤可包括提供第二O-RS和第二O-tRNA，其中第二O-RS优先用不同于第一非天然氨基酸的第二非天然氨基酸氨酰化第二O-tRNA，且第二O-tRNA识别核酸中不同于第一O-tRNA所识别的选择者密码子的选择者密码子。

定义

在详细描述本发明前，应该知道本发明不局限于具体的生物系统，本发明当然可以有各种变化。还应知道本文所用的术语只是为了描述具体的实施方式，而非限制性的。除非另有明确指出，本说明书和随附的权利要求书中使用的单数形式“一个”、“一种”和“该”也包括复数对象。因此，例如述及“一个细胞”包括两个或多个细胞的组合；“一个多核苷酸”实际上包括该多核苷酸的多份拷贝。

除了此处和说明书以下其余部分所定义的，本文所用的所有技术和科学术语都与本发明所属领域普通技术人员常规理解的意义相同。

正交：本文所用的术语“正交”指与某细胞或翻译系统的内源性相应分子相比，某分子(例如，正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))与该细胞内源性组分起作用的效率降低，或不能与该细胞的内源性组分起作用。就tRNA和氨酰-tRNA合成酶而言，正交指与和内源性tRNA合成酶起作用的内源性tRNA相比，正交tRNA不能与内源性tRNA合成酶起作用或起作用的效率降低；或者与和内源性tRNA起作用的内源性tRNA合成酶相比，正交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低，所述效率降低例如，小于20％的效率，小于10％的效率，小于5％的效率，或小于1％的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如，与内源性RS氨酰化内源性tRNA相比，细胞的任何内源性RS氨酰化细胞中正交tRNA的效率降低或者甚至为0。在另一例子中，与内源性RS氨酰化内源性tRNA相比，正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者甚至为0。可将能与第一正交分子一起起作用的第二正交分子引入细胞。例如，正交tRNA/RS配对包括在细胞中共同起作用且与对照，例如相应的tRNA/RS内源性配对相比其效率是，例如45％效率、50％效率、60％效率、70％效率、75％效率、80％效率、90％效率、95％效率或99％效率，或更高的引入补充组分，或活性正交配对(如酪氨酰或亮氨酰衍生的正交tRNA/RS配对)。

正交酪氨酰-tRNA：本文所用的正交酪氨酰-tRNA(酪氨酰-O-tRNA)是与感兴趣翻译系统正交的tRNA，其中所述tRNA是：(1)与天然酪氨酰-tRNA相同或基本类似；(2)通过天然或人工诱变衍生自天然酪氨酰tRNA；(3)由考虑了(1)或(2)的野生型或突变型酪氨酰tRNA序列的任何方法产生；(4)与野生型或突变型酪氨酰tRNA同源；(5)与称为酪氨酰tRNA合成酶底物的任何tRNA同源；或(6)称为酪氨酰tRNA合成酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可加载有氨基酸，或处于非负载状态。还应知道“酪氨酰-O-tRNA”任选被关联(cognate)合成酶分别加载(氨酰化)除酪氨酸以外的氨基酸，例如非天然氨基酸。应该知道，实际上优选利用本发明酪氨酰-O-tRNA在翻译期间响应于选择者密码子而将基本上任何氨基酸(无论天然或非天然的)掺入延伸的多肽内。

正交酪氨酰氨基酸合成酶：本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-O-tRNA的酶。酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸，无论是天然的、非天然的还是人工的，并且不限于本文所述的氨基酸。该合成酶任选与天然酪氨酰氨基酸合成酶相同或同源，或者本文提供的称为O-RS的合成酶相同或同源。例如，所述O-RS可以是图16的酪氨酰-O-RS的保守变体，和/或与图16中O-RS的序列(SEQ ID NO：57-101)至少有50％、60％、70％、80％、90％、95％、98％、99％或以上相同。

正交亮氨酰-tRNA：如本文所用，正交亮氨酰-tRNA(亮氨酰-O-tRNA)是对感兴趣翻译系统正交的tRNA，其中tRNA是：(1)与天然发生的亮氨酰-tRNA相同或基本相似，(2)通过天然或人工诱变衍生自天然发生的亮氨酰-tRNA，(3)由考虑了(1)或(2)的野生型或突变型亮氨酰-tRNA序列的任何方法产生，(4)与野生型或突变型酪氨酰-tRNA同源；(5)与称为亮氨酰-tRNA合成酶底物的任何tRNA同源，或(6)称为亮氨酰-tRNA合成酶底物的任何示范性tRNA的保守变体。亮氨酰-tRNA可以加载有氨基酸，或处于非负载状态。还应知道，“亮氨酰-O-tRNA”任选被关联合成酶分别加载(氨酰化)除亮氨酸外的氨基酸，如非天然氨基酸。事实上，应理解优选利用本发明亮氨酰-O-tRNA在翻译期间响应于选择密码子而将基本上任何氨基酸(无论是天然或是非天然)掺入延伸的多肽中。

正交亮氨酰氨基酸合成酶：本文所用的正交亮氨酰氨基酸合成酶(亮氨酰-O-RS)是感兴趣翻译系统中用氨基酸优先氨酰化亮氨酰-O-tRNA的酶。被亮氨酰-O-RS加载到亮氨酰-O-tRNA上的氨基酸可以是任何氨基酸，如天然、非天然或人工氨基酸，在本文中不作限制。所述合成酶任选与天然产生的亮氨酰氨基酸合成酶相同或同源，或者与本文中称为O-RS的合成酶相同或同源。例如，O-RS可以是图16的亮氨酰-O-RS的保守变体，和/或可能与图16的O-RS有至少50％、60％、70％、80％、90％、95％、98％、99％或更多序列相同。

关联(cognate)：术语“关联”指共同起作用或彼此具有一定特异性的组分，例如正交tRNA和正交氨酰-tRNA合成酶。这些组分也可互称为“互补的”。

优先氨酰化：对于本文所用正交翻译系统而言，当某表达系统中O-RS使O-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时，该O-RS“优先氨酰化”关联O-tRNA。即，当翻译系统中存在摩尔比大致相等的O-tRNA与任何给定的内源性tRNA时，O-RS加载O-tRNA的频率高于它加载内源性tRNA的频率。当翻译系统中存在等摩尔浓度的O-tRNA与内源性tRNA时，由O-RS加载的O-tRNA与由O-RS加载的内源性tRNA的相对比例优选较高，最好导致O-RS仅加载或几乎仅加载O-tRNA。当存在等摩尔浓度的O-tRNA与O-RS时，O-RS加载的O-tRNA与内源性tRNA的相对比例大于1:1，优选至少约2:1，更优选5:1，更优选10:1，更优选20:1，更优选50:1，更优选75:1，更优选95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更高。

当(a)与内源性tRNA相比，O-RS优先氨酰化O-tRNA，和(b)与O-RS用任何天然氨基酸氨酰化O-tRNA相比，氨酰化对非天然氨基酸特异时，称O-RS“优先用非天然氨基酸氨酰化O-tRNA”。即，当包含O-RS和O-tRNA的翻译系统中存在等摩尔量的非天然和天然氨基酸时，O-RS用非天然氨基酸加载O-tRNA的频率高于用天然氨基酸加载的频率。加载有非天然氨基酸的O-tRNA与加载有天然氨基酸的O-tRNA的相对比例优选较高。O-RS最好使O-tRNA仅加载，或者几乎仅加载有非天然氨基酸。当翻译系统中存在等摩尔浓度的天然和非天然氨基酸时，使O-tRNA带上非天然氨基酸与使O-tRNA带上天然氨基酸的相对比例大于1:1，优选至少约2:1，更优选5:1，更优选10:1，更优选20:1，更优选50:1，更优选75:1，更优选95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更高。

选择者密码子：术语“选择者密码子”指翻译过程中为O-tRNA所识别而不为内源性tRNA所识别的密码子。O-tRNA反密码子环识别mRNA上的选择者密码子并在多肽的此位置掺入其氨基酸，例如非天然氨基酸。选择者密码子可包括，例如无义密码子，如终止密码子(如，琥珀、赭石和乳白密码子)；四碱基或四碱基以上密码子；罕用密码子；衍生自天然或非天然碱基对的密码子，等等。

抑制子tRNA：抑制子tRNA是在多肽翻译期间通常响应于终止密码子而掺入氨基酸(即，“连读”)来改变给定的翻译系统中信使RNA(mRNA)阅读的tRNA。在一些方面，本发明的选择者密码子是抑制子密码子，例如，终止密码子(如，琥珀、赭石和乳白密码子)、四碱基密码子、罕用密码子等。

抑制活性：本文所用的术语“抑制活性”总体上指tRNA(例如，抑制子tRNA)能翻译连读在其它情况中可导致翻译终止或错译(例如，移码)的密码子(例如，作为选择者密码子的琥珀密码子或四个或以上个碱基的密码子)的能力。抑制子tRNA的抑制活性可表示为与第二抑制子tRNA，或与对照系统，例如缺乏O-RS的对照系统相比，观察到的翻译连读活性的百分比。

本发明提供定量测定抑制活性的各种方法。特定O-tRNA和O-RS对感兴趣选择者密码子(例如，琥珀密码子)的抑制百分比指，在感兴趣的翻译系统中，在编码表达测试标记的核酸中含有选择者密码子的该给定表达测试标记(例如，LacZ)的活性与阳性对照构建物相比的百分比，所述感兴趣的翻译系统包含O-RS和O-tRNA，所述阳性对照没有O-tRNA、O-RS和选择者密码子。因此，例如，如果在给定翻译系统中观察到不含选择者密码子的活性阳性对照标记构建物的活性为X(其单位与所述标记试验相关)，则含有选择者密码子的测试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境条件下(除了该测试标记构建物在也含有O-tRNA和O-RS的翻译系统中表达外)，该测试标记构建物显示的X百分比。表达该测试标记的翻译系统一般也包含O-RS和O-tRNA识别的氨基酸。可任选通过将测试标记与“背景”或“阴性”对照标记构建物比较来校正抑制百分比的测量值，所述“背景”或“阴性”对照标记构建物含有与测试标记相同的选择者密码子，但其所在的系统不含O-tRNA、O-RS和/或O-tRNA和/或O-RS识别的相关氨基酸。该阴性对照可用于标准化抑制百分比测定值以补偿感兴趣的翻译系统中标记的背景信号的影响。

可通过本领域已知的许多试验测定抑制效率。例如，可采用β-半乳糖苷酶报道试验，如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)连同含有本发明的O-tRNA的质粒引入合适生物(例如，可利用正交组分的生物)的细胞。还可引入关联合成酶(可以是多肽或表达时能编码该关联合成酶的多核苷酸)。细胞在培养基中生长至所需密度，例如至OD₆₀₀约为0.5，进行β-半乳糖苷酶试验，例如用诺瓦金公司(Novagen)的BetaFluor^TM β-半乳糖苷酶试验试剂盒。可将抑制百分比计算为样品相对于可比较对照，例如，衍生的lacZ构建物的观察值的活性百分比，该构建物在所需位置具有相应的有义密码子而非选择者密码子。

翻译系统：术语“翻译系统”指将氨基酸掺入延伸中的多肽链(蛋白质)的各组分。翻译系统的组分可包括，例如核糖体、tRNA、合成酶、mRNA等。本发明的O-tRNA和/或O-RS可加入体外或体内翻译系统或是其一部分，例如存在于哺乳动物细胞，如啮齿动物细胞、灵长动物细胞。

非天然氨基酸：本文所用的术语“非天然氨基酸”指不在20种常见天然氨基酸或硒代半胱氨酸或吡咯赖氨酸(pyrrolysine)之列的任何氨基酸，修饰的氨基酸和/或氨基酸类似物。参见例如图1提供的非天然氨基酸。

衍生自：本文所用的术语“衍生自”指分离自特定分子或生物，或是用特定分子或生物的信息制得的某组份。例如，衍生自第二多肽的多肽含有与该第二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例，可通过，例如天然产生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍生多肽的诱变可以是有意定向或有意随机的，或混用两种方法。诱变多肽以产生衍生自第一(多肽)的不同多肽可以是随机的(例如，聚合酶失真所致)，可通过合适的筛选方法，例如本文所述的方法鉴定衍生的多肽。诱变多肽通常需要对编码该多肽的多核苷酸进行操作。

正选择或筛选标记：本文所用的术语“正选择或筛选标记”指当存在该标记时(例如被表达或激活等)可从不具有特征的细胞中鉴定出具有特征的细胞，例如具有正选择标记的细胞。

负选择或筛选标记：本文所用的术语“负选择或筛选标记”指当存在该标记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如，与确实具有该特性或特征的细胞相比)。

报道分子：本文所用的术语“报道分子”是指可用于鉴定和/或选择感兴趣系统的靶组分的组分。例如，报道分子可以包括蛋白质，如能赋予抗生素抗性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光筛选标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如萤火虫萤光素酶蛋白)、亲和力筛选标记，或者可选择的正或负标记基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、ura3、leu2、lys2等。

真核生物：本文所用的术语“真核生物”指属于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而区别于原核生物：典型的多细胞组织(但不都是多细胞，例如酵母)，存在膜限制的核与其它膜限制的细胞器，线形遗传物质(即，线形染色体)，不存在操纵子，存在内含子、信使(RNA)加帽和聚-A mRNA，以及其它生物化学特征，如不同的核糖体结构。真核生物包括，例如动物(如哺乳动物、昆虫、爬行动物、鸟等)，纤毛虫，植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动物等。

原核生物：本文所用的术语“原核生物”指属于原核生物界(也称为原核生物(Procarya))的生物。原核生物通常因其以下特征而区别于真核生物：单细胞组织，通过出芽或分裂的无性生殖，缺乏膜限制的核与其它膜限制的细胞器，环状染色体，存在操纵子，不存在内含子、信使(RNA)加帽和聚-A mRNA，以及其它生物化学特征，如不同的核糖体结构。原核生物包括真细菌和古细菌(Archaea)(有时称为“古细菌(Archaebacteria)”)亚界。在原核生物界有时将蓝细菌(蓝绿藻)与支原体(历史上认为是细菌)分为不同类别。

真细菌：本文所用的术语“真细菌”和“细菌”指不同于古细菌的原核生物。类似地，古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准区分真细菌和古细菌。例如，可采用核糖体RNA序列、RNA聚合酶结构的差异，内含子的存在与否，抗生素敏感性，细胞壁肽聚糖和其它细胞壁组分的存在与否，膜脂质的分枝与不分枝结构，存在/不存在组蛋白和组蛋白样蛋白而将某生物指定为真细菌或古细菌。

真细菌的例子包括大肠杆菌(Escherichia coli)、嗜热栖热菌(Thermusthermophilus)、枯草芽孢杆菌(Bacillus subtilis)和嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)等)。古细菌的例子包括詹氏甲烷球菌(Methanococcusjannaschii)(Mj)、梅氏甲烷八叠球菌(Methanosarcina mazei)(Mm)、嗜热碱甲烷杆菌(Methanobacteriurn thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、甲烷嗜热菌(Methanopyrus kandleri)、盐细菌(Halobacterium)(例如沃氏富盐菌(Haloferax volcanii)和盐细菌种NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcus furiosus)(Pf)、极端嗜热古菌(Pyrococcus horikoshii)(Ph)、好氧火球菌(Pyrobaculum aerophilum)、深海火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、超嗜热泉古菌(Sulfolobus tokodaii)、嗜热泉生古细菌(Aeuropyrum pernix)(Ap)、嗜酸热原体(Thermoplasma acidophilum)和火山热原体(Thermoplasmavolcanium)。

保守变体：就翻译组分而言，本文所用的术语“保守变体”指某翻译组份，例如保守变体O-tRNA或保守变体O-RS，其所执行的功能与与其相似的基本组分(例如O-tRNA或O-RS)相类似，但与参比O-tRNA或O-RS相比序列中有变异的。例如，O-RS或该O-RS的保守变体可用非天然氨基酸，例如图1的非天然氨基酸氨酰化关联O-tRNA。在该例子中，所述O-RS及保守变体O-RS的氨基酸序列不相同。所述保守变体在序列中可具有例如一处变异、两处变异、三处变异、四处变异或五处或更多处变异，只要该保守变体仍与关联的相应O-tRNA或O-RS互补(例如，与之起作用)。

在一些实施方式中，保守变体O-RS与衍生其的O-RS相比，含有一个或多个保守性氨基酸取代。在一些实施方式中，保守变体O-RS与衍生其的O-RS相比，含有一个或多个保守性氨基酸取代，此外还保留了O-RS的生物学活性；例如，保守变体O-RS保留了衍生其的亲本O-RS分子至少10％，或者至少20％，至少30％，或至少40％的生物学活性。在一些优选实施方式中，所述保守变体O-RS保留了衍生其的亲本O-RS分子至少50％的生物学活性。保守变体O-RS的保守性氨基酸取代可出现在该O-RS的任何结构域内，包括氨基酸结合袋。

选择或筛选试剂：本文所用的术语“选择或筛选试剂”指当存在时可从某群体中选择/筛选某些组分的试剂。例如，选择或筛选试剂可以是但不限于，如营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可因例如浓度、强度等而有所不同。

响应：本文所用的术语“响应”指本发明的O-tRNA识别选择者密码子并介导与该tRNA偶联的非天然氨基酸掺入延伸中的多肽链的过程。

编码：本文所用的术语“编码”指用多聚大分子或序列链中的信息来指导不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用的该术语应用广泛，可用于各领域。在一些方面，术语“编码”描述了半保留DNA复制的过程，其中双链DNA分子的一条链用作模板，借助依赖DNA的DNA合成酶来编码新合成的互补姊妹链。

在另一方面，术语“编码”指用一种分子的信息来指导产生化学性质不同于该第一分子的第二种分子的任何过程。例如，DNA分子可编码RNA分子(例如，包含依赖DNA的RNA聚合酶的转录过程)。RNA分子也可编码多肽，例如翻译过程。当术语“编码”用于描述翻译过程时，其含义也延伸至编码氨基酸的三联密码子。在一些方面，RNA分子可编码DNA分子，例如通过包含依赖RNA的DNA合成酶的逆转录过程。在另一方面，DNA分子可编码多肽，应该知道该情况用“编码”同时包括转录和翻译过程。

附图简述

图1提供非天然氨基酸：对-甲氧基苯丙氨酸(pMpa)、对-乙酰基苯丙氨酸(pApa)、对-苯甲酰苯丙氨酸(pBpa)、对-碘代苯丙氨酸(pIpa)、对-叠氮基苯丙氨酸(pAzpa)、对-炔丙基氧基苯丙氨酸(pPpa)、α-氨基辛酸、邻-硝基苄基半胱氨酸(o-NBC)、1，5-丹磺酰丙氨酸和邻-硝基苄基丝氨酸(o-NBS)的化学结构和命名。使用其它命指代多数这些非天然氨基酸，图中也有标明。

图2显示使用正交

和EcTyrRS对在英杰(Invitrogen)^TM T-REx^TMCHO细胞中表达全长GFP的Western印迹分析。用质粒pcDNA4-GFP37TAG、pcDNA4-EcTyrRS变体和

共转染细胞，并在存在或不存在非天然氨基酸的条件下培养。第一泳道是pcDNA4-GFP瞬时转染的T-rex CHO细胞中野生型GFP的表达。第二泳道是野生型EcTyrRS和

抑制下的GFP37TAG的全长表达。后随的泳道是在存在或不存在非天然氨基酸的条件下，EcTyrRS变体和

抑制下的GFP37TAG全长表达。pMpaRS代表pMpa-tRNA合成酶等。用抗-c-myc抗体分析每一反应40μg细胞裂解物(第一泳道上样10μg细胞裂解物)。用于蛋白表达的非天然氨基酸浓度为10mMpMpa、10mM pApa、1mM pBpa、8mM pIpa、5mM pAzpa以及1mM pPpa。

图3显示使用如图2所示正交

和EcTyrRS对在英杰^TM T-REx^TM293细胞中表达全长GFP的Western印迹分析。用抗-His-HRP抗体分析每一反应20μg细胞裂解物(对照反应5μg)。试剂、非天然氨基酸浓度和泳道定义同图2所示。

图4A提供pSWAN-pMpaRS的质粒图。

图4B提供pSWAN-GFP37TAG的质粒图。

图5提供野生型GFP和GFP-pMpa肽的氨基酸序列。Y^*表示野生型GFP中的酪氨酸或GFP-pMpa中的pMpa。显示了肽FSVSGEGEGDATY^*GK(SEQID NO：103)片段化过程中产生的y-和b-型离子。

图6提供图5中野生型GFP肽FSVSGEGEGDATY^*GK(SEQ ID NO：103)的注释的串联质谱图。为了比较和明确起见，仅对富集的Y^*-离子系列以及使pMpa明确定位于37位的b₁₃离子作注释。用抗-myc亲和柱纯化蛋白并用SDS-PAGE分析。切下GFP条带进行MS分析。

图7提供来自GFP-pMpa的肽FSVSGEGEGDATY^*GK(SEQ ID NO：103)的注释串连质谱图。Y^*-离子系列的串连质谱图显示了预期的14Da的质量漂移。

图8提供亲和纯化的GFP-pMpa的完整蛋白ESI TOF-MS谱图。解卷积电荷状态包络线(插图所示)显示一种29696Da的主组分，这与修饰蛋白减去N-末端甲硫氨酸再加上乙酰化的预期质量(理论质量29696.52)在实验误差内吻合。29654Da的小特征峰指定为GFP-pMpa减去N-末端甲硫氨酸。两侧条带可能是由非特异性修饰产生的。

图9提供含pApa的突变GFP的串连质谱图。与野生型GFP谱图中相同离子相比，Y^*-离子的质量漂移为26Da。

图10提供含pBpa的突变GFP的串连质谱图。清楚观察到突变GFP和野生型GFP之间86Da的特征性质量漂移。

图11提供含pAzpa的突变GFP的串连质谱图。多数pAzpa衰变为pAmpa(对氨基苯丙胺酸；胰蛋白酶消化后含pAmpa的片段的串连质谱图参见图15)。然而，与野生型GFP信号相比，仍清晰观察到Y^*-离子25Da的特征性质量漂移。

图12提供含pPpa的突变GFP的串连质谱图。背景掩盖了大部分pPpa片段信号。尽管如此，通过搜索MSDB数据库中的图谱仍然具有很好的分辨率。观察到特征性质量漂移为38Da的较强的Y^*-离子。

图13A和13B显示在英杰^TM T-REx^TM CHO和英杰^TM T-RExTM293细胞中琥珀抑制依赖于EcTyrRS和基因。图13A提供不同构建物瞬时转染的英杰^TM T-REx^TM CHO细胞的绿色荧光图像。在第一张图中，用pcDNA4-GFP转染细胞。在第二张图中，用pcDNA4-EcTyrRS和pcDNA4-GFP37TAG转染细胞。在第三张图中，用

和pcDNA4-GFP37TAG转染细胞。在第四张图中，用

pcDNA4-EcTyrRS和pcDNA4-GFP37TAG转染细胞。图13B提供不同构建物瞬时转染的英杰^TM T-REx^TM 293细胞的绿色荧光图像。不同图中使用的构建物与图13A中所示相同。

图14提供在英杰^TM T-REx^TM CHO和293细胞中六种EcTyrRS变体表达的Western印迹分析。用抗-c-myc抗体分析每一反应的40μg细胞裂解物。EcTyrRS变体的表达不受活性位点突变的影响。T-REx^TM CHO和T-REx^TM 293细胞系中变体表达相等。

图15提供来自含pAzpa的突变GFP的肽FSVSGEGEGDATY^*GK(SEQ IDNO：103)的注释串连质谱图。Y^*代表pAmpa(对氨基苯丙氨酸)。为明确起见仅注释了Y^*-离子系列。pAzpa多数衰变成pAmpa，因为pAzpa肽的信号强度很弱(参见图11)，并且在野生型GFP的片段和含pAzpa的突变型GFP的片段之间检测到的质量差异为1Da。

图16提供了核苷酸和氨基酸序列。

发明详述

本发明提供了快速筛选和分离突变型氨酰-tRNA合成酶(RS)的常用方法，这些突变型氨酰-tRNA合成酶能够在哺乳动物宿主系统中使合适的正交抑制子tRNA带上不同理化和生物学属性的非天然氨基酸，此外，其中筛选方法也消除了对在哺乳动物细胞中进行缓慢的有技术挑战性的筛选的需求。在这些方法中，突变的大肠杆菌氨酰-tRNA合成酶(RS)在酵母中演化，能够选择性使用感兴趣的非天然氨基酸。然后使用同样的突变RS以及来自嗜热脂肪芽孢杆菌的琥珀抑制子tRNA在哺乳动物细胞中响应选择者密码子(如琥珀无义密码子)将非天然氨基酸定点掺入感兴趣的蛋白质中。通过工程改造编码感兴趣蛋白的多核苷酸使其包含转导非天然氨基酸掺入信号的选择者密码子，可对非天然氨基酸掺入蛋白进行编程使其发生在任何需要的位置上。

本发明也提供了新的翻译系统，该系统包含了至今尚未考虑过的宿主细胞。例如，本发明的翻译系统包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自真细菌的氨酰-tRNA合成酶，通常为大肠杆菌RS的正交氨酰-tRNA合成酶(O-RS)，以及(iv)包含这些组件的哺乳动物宿主细胞，其中哺乳动物宿主细胞可为啮齿类细胞(如小鼠细胞或大鼠细胞)，或灵长类细胞，即属于通常称为猿(包括猿、人和旧大陆猴)、新大陆猴和原猴(pro-simian)(如狐猴)的类群的任何细胞。人细胞对本发明尤其有用。然而，上述列举的细胞并非意在限制本发明的范围，本发明也可使用其它宿主细胞。

本发明也提供了用于制造在选定位置具有至少一个非天然氨基酸的蛋白质的方法，所述方法使用上述翻译系统。该方法在蛋白质翻译期间通过在选择者密码子的位点程序性掺入非天然氨基酸，导致非天然氨基酸掺入。

本发明提供了使用突变RS(最初在酿酒酵母中演化)以及来自合适真细菌如嗜热脂肪芽孢杆菌(B.stearothermophilus)的琥珀抑制子在哺乳动物宿主细胞如啮齿类细胞和灵长类细胞中将多种非天然掺入蛋白的常用方法。作为验证，已经成功使用本方法响应琥珀无义密码子将总共十种不同非天然氨基酸定点掺入到模型蛋白中，在中国仓鼠卵巢(CHO)细胞和人239T宿主细胞中具有优秀的保真性和良好的效率。例如，将非天然氨基酸独立掺入CHO细胞表达的绿色荧光蛋白(GFP)中，效率高达每2×10⁷个细胞1μg蛋白质。质谱确认了非天然氨基酸的高翻译保真度。该方法利于在蛋白质中引入生物学探针进行细胞研究，并可能最终利于在哺乳动物细胞中合成含非天然氨基酸的治疗性蛋白。

在一些方面，为了展示(而非限制)本发明，本文的公开文本提出可在哺乳动物细胞中将非天然氨基酸部分掺入到不同模型蛋白中。不应理解非天然氨基酸的掺入仅限于任一感兴趣的特定蛋白。从本公开文本中能清楚了解，将不同非天然氨基酸掺入感兴趣的特定蛋白中可用于各种不同的蛋白质和目的。

应当注意的是，控制在酵母中演化的突变型大肠杆菌氨酰-tRNA合成酶(O-RS)和O-tRNA表达的基因并不能直接用于哺乳动物宿主细胞(如啮齿类或人细胞)。必须用合适的调节元件重新工程改造这些基因，驱动其在哺乳动物细胞背景中表达。原本与O-tRNA和O-RS基因相关的酵母转录调节元件在哺乳动物细胞中无效(或者并非最佳)。本领域熟练技术人员应该意识到这一点。已对哺乳动物基因表达元件进行很好的鉴定，随时可用于需要优化(如最大化)与其相关的基因序列的各种重组构建物。

本发明使用的非天然氨基酸

本发明提供能在哺乳动物宿主细胞系统如灵长类和啮齿类宿主细胞系统中产生含非天然氨基酸的多肽的正交翻译系统。这些翻译系统中使用的非天然氨基酸不受特别限制。通常，本发明使用的非天然氨基酸通常为大肠杆菌衍生的突变型氨酰-tRNA合成酶用来在酿酒酵母宿主系统中加载到相应正交tRNA上的那些氨基酸。例如本文所用，本发明使用下列非天然氨基酸：

对-甲氧基苯丙氨酸(pMpa)

对-乙酰基苯丙氨酸(pApa)

对-苯甲酰苯丙氨酸(pBpa)

对-碘代苯丙氨酸(pIpa)

对-叠氮基苯丙氨酸(pAzpa)

对-炔丙基氧基苯丙氨酸(pPpa)

图1显示了这六种非天然氨基酸的每一种的结构。还标出了这些氨基酸的其它命名和不同的缩写，如图1所示。如实施例所示，在人和啮齿类宿主细胞中，使用最初由酵母宿主细胞系统筛选和分离的大肠杆菌衍生的O-RS物质将这六种非天然氨基酸独立掺入绿色荧光蛋白(GFP)中。

除了上述列举的以外，本发明还使用了其它非天然氨基酸。下文列举的非天然氨基酸曾成功用于酵母宿主细胞系统中，由大肠杆菌衍生的正交RS将其加载于O-tRNA上。这些非天然氨基酸包括：

α-氨基辛酸

邻-硝基苄基半胱氨酸(o-NBC)

1，5-丹磺酰丙氨酸

邻-硝基苄基丝氨酸

这些非天然氨基酸的结构及其不同的命名和简写如图1所示。

所有这些非天然氨基酸在酵母宿主细胞中的成功使用已有记录，如Chin等(2003)，“扩展的真核遗传密码”(An expanded eukaryotic genetic code)Science301：964-967；Deiters等(2003)，“在酿酒酵母的遗传密码中加入具有新反应性的氨基酸”(Adding amino acids with novel reactivity to the genetic code ofSaccharomyces cerevisiae)J Am Chem Soc 125：11782-11783；Summerer等(2006)，“遗传编码的荧光氨基酸”(A Genetically Encoded Fluorescent AminoAcid)PNAS 103(26)：9785-9789；Deiters等的2004年4月16日提交的WO

2005/003294“非天然反应性氨基酸遗传密码增加”(UNNATURAL REACTIVEAMINO ACID GENETIC CODE ADDITIONS)；Deiters等的2005年9月21日提交的WO 2006/034410“在遗传密码中加入光调节性氨基酸”(ADDINGPHOTOREGULATED AMINO ACIDS TO THE GENETIC CODE)，以及2005年10月27日提交的WO 2006/110182“用于体内掺入非天然氨基酸的正交翻译组件”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)。

本发明使用的宿主细胞

本发明提供了新型翻译系统，该系统使用迄今为止尚未考虑过的宿主细胞。例如，本发明翻译系统包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大肠杆菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS)，以及(iv)包含这些组件的哺乳动物宿主细胞，其中哺乳动物宿主细胞可为啮齿类细胞(如小鼠细胞或大鼠细胞)，或灵长类细胞，即属于通常称为猿(包括猿、人和旧大陆猴)、新大陆猴和原猴(如狐猴)的类群的任何细胞。人细胞对本发明尤其有用。用于本发明的动物细胞系可衍生自该动物的任何组织。上述列举的细胞并非意在限制本发明的范围，本发明也可使用其它宿主细胞。

本文所用术语“宿主细胞”也包括多个独立细胞，通常指“细胞系”，在该情况下是“宿主细胞系”。

用于产生含有至少一个非天然氨基酸的多肽的宿主细胞可为任一类型的宿主细胞，但是一些宿主细胞尤其有用。例如，可使用一些宿主细胞类型产生用于生产重组治疗性多肽的多肽。

当宿主细胞为啮齿类细胞时，啮齿类细胞的类型不受特别限制。如实施例所述，中国仓鼠卵巢(CHO)细胞可作为宿主细胞。CHO细胞被广泛采用并且是公众接受的重组蛋白表达系统。然而，并不意味本发明仅限于这种啮齿动物细胞类型。事实上，本领域熟练技术人员了解可用作生产重组蛋白的宿主细胞的大量啮齿动物细胞系。

啮齿动物细胞系包括任一衍生自哺乳动物啮齿目的细胞系，啮齿目包括但不限于真鼠(true mice)、大鼠、仓鼠、花栗鼠、海狸和松鼠。啮齿类细胞系包括衍生自普通家鼠—小鼠(Mus musculus)及其所有品系的细胞系。同样，啮齿类细胞系包括衍生自大鼠，如家鼠属的任一种，如褐家鼠(Rattus norvegicus)(挪威大鼠)和屋顶鼠(Rattus rattus)(黑鼠)及其任何和所有品系的细胞系。

本发明的宿主细胞可为灵长类细胞。灵长类细胞类型不受特别限制。如实施例中所述，人胚肾细胞(也称作HEK细胞、HEK 293或293)可用作宿主细胞。293细胞被广泛采用并且是公众接受的重组蛋白表达系统。然而，并不意味本发明仅限于该种人的细胞类型。事实上，本领域熟练技术人员了解可用作生产重组蛋白的宿主细胞的大量人或其它灵长动物细胞系。

灵长类细胞系包括任一起源于哺乳动物灵长目的细胞系，灵长目包括但不限于(i)猿，包括旧大陆猿猴，包括人)，(ii)新大陆猴以及(iii)原猴(如狐猴)。灵长类细胞系可衍生自任一灵长类物种。例如但不限于，灵长类细胞系可衍生自黑猩猩、狒狒、狨、短尾猿和非洲绿猴(如COS-1细胞系)。

下表提供了灵长类物种的非穷举列表，衍生自这些物种的细胞系可用于本发明。

物种	常用名
物种	常用名	施氏黑猩猩Pan troglodytes schweinfurthii	东方黑猩猩Eastern chimpanzee
黑猩猩Pan troglodytes	黑猩猩Chimpanzee	施氏黑猩猩Pan troglodytes schweinfurthii	东方黑猩猩Eastern chimpanzee
黑猩猩Pan troglodytes	黑猩猩Chimpanzee	倭黑猩猩Pan paniscus	倭黑猩猩Bonobo
白脸黑猩猩Pan troglodytes verus	西方黑猩猩Western chimpanzee	倭黑猩猩Pan paniscus	倭黑猩猩Bonobo
白脸黑猩猩Pan troglodytes verus	西方黑猩猩Western chimpanzee	大猩猩Gorilla gorilla	西方低地大猩猩Western lowland gorilla
苏门答腊猩猩Pongo pygmaeus abelii	苏门答腊猩猩Sumatran orangutan	大猩猩Gorilla gorilla	西方低地大猩猩Western lowland gorilla
苏门答腊猩猩Pongo pygmaeus abelii	苏门答腊猩猩Sumatran orangutan	婆罗洲猩猩Pongo pygmaeus pygmaeus	婆罗洲猩猩Bornean orangutan
长臂猿Hylobates sp.	长臂猿gibbon sp.	婆罗洲猩猩Pongo pygmaeus pygmaeus	婆罗洲猩猩Bornean orangutan
长臂猿Hylobates sp.	长臂猿gibbon sp.	短尾猴Macaca arctoides	短尾猴stump-tailed macaque
长尾猴Macaca fascicularis	长尾猴Long-tailed macaque	短尾猴Macaca arctoides	短尾猴stump-tailed macaque
长尾猴Macaca fascicularis	长尾猴Long-tailed macaque	白喉长尾猴Cercopithecus mitis albogularis	蓝猴blue monkey
食蟹猴Macaca fascicularis	长尾猕猴Long-tailed macaque	白喉长尾猴Cercopithecus mitis albogularis	蓝猴blue monkey
食蟹猴Macaca fascicularis	长尾猕猴Long-tailed macaque	恒河猴Macaca mulatta	恒河猴Rhesus macaque
地中海猕猴Macaca sylvanus	巴巴利猕猴Barbary macaque	恒河猴Macaca mulatta	恒河猴Rhesus macaque

白脸黑猩猩Pan troglodytes verus	西方黑猩猩Western chimpanzee
白脸黑猩猩Pan troglodytes verus	西方黑猩猩Western chimpanzee	阿拉伯狒狒Papio hamadryas anubis	橄榄狒狒Olive baboon
狒狒Papio sp.	狒狒baboon sp.	阿拉伯狒狒Papio hamadryas anubis	橄榄狒狒Olive baboon
狒狒Papio sp.	狒狒baboon sp.	绒顶柽柳猴Saguinus oedipus	绒顶柽柳猴Cotton top tamarin
普通狨Callithrix jacchus	普通狨Common marmoset	绒顶柽柳猴Saguinus oedipus	绒顶柽柳猴Cotton top tamarin
普通狨Callithrix jacchus	普通狨Common marmoset	倭黑猩猩Pan paniscus	倭黑猩猩Bonobo
智人Homo sapiens	人human	倭黑猩猩Pan paniscus	倭黑猩猩Bonobo

可在促进灵长类分子生物学研究组织(Research Infrastructure to PromotePrimate Molecular Biology)(INPRIMAT；西班牙巴塞罗那)以及生物医学灵长类研究中心(Biomedical Primate Research Centre)(BPRC；荷兰瑞斯维基克(Rijswijk))的网站上找到衍生自这些灵长类物种的细胞系。

使用人细胞系生产重组多肽已经广为接受并在本发明的范围内。人宿主细胞系可为任一来源，衍生自任一组织。适合生产重组蛋白的人细胞系广为人知，并可获自本领域技术人员熟知的大量商业来源。

此外，衍生自其它多种哺乳动物物种的宿主细胞系也在本发明的范围之内。包括牛、猪、绵羊、犬、马和山羊细胞系。源于这些物种的细胞系为本领域所知，并且本领域一般技术人员易于使用。

本领域已建立啮齿类细胞系、灵长类细胞系和多种其它哺乳动物群来源的细胞系，以及培养这些动物细胞系的材料和方法，它们可从多种来源获得。例如，参见美国典型培养物保藏中心(American Type Culture Collection(ATCC；弗吉尼亚州玛纳萨斯(Manassas，VA)))以获取更多可利用细胞系的列表。可从数种来源获取细胞培养基，例如吉布科

品牌(英杰^TM)细胞培养基以及

的MT公司(Mediatech，Inc.)培养基。此外，本发明也可使用全新建立的细胞系(原代细胞系或建立细胞系)作为宿主细胞，用于产生含有至少一个非天然氨基酸的重组蛋白。

本发明使用的O-RS物质

本发明提供了新的正交翻译系统，该系统能够在以前未关注的哺乳动物宿主细胞，例如灵长类和啮齿类宿主细胞系统中产生含非天然氨基酸的多肽。本发明的翻译系统包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大肠杆菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS)，以及(iv)包含这些组件的哺乳动物宿主细胞，其中哺乳动物宿主细胞可以是，例如啮齿类细胞(如小鼠细胞或大鼠细胞)，或灵长类细胞(如人或小鼠细胞)。本发明还提供了产生在选定位置具有至少一个非天然氨基酸的蛋白质的方法，所述方法使用上述翻译系统。该方法在蛋白质翻译期间通过在选择者密码子的位点程序性掺入非天然氨基酸，导致在哺乳动物宿主细胞中掺入非天然氨基酸。

本发明所用O-RS物质不受特别限制，但通常具有下列属性。本发明所用O-RS通常衍生自大肠杆菌氨酰-tRNA合成酶，如野生型大肠杆菌亮氨酰-tRNA合成酶(Ec LeuRS；SEQ ID NO：4提供了氨基酸序列，SEQ ID NO：5提供了多核苷酸序列)或者野生型大肠杆菌酪氨酰-tRNA合成酶(Ec TyrRS；SEQ ID NO：6提供了氨基酸序列，SEQ ID NO：7提供了多核苷酸序列)。本发明使用的突变的O-RS物质(例如，衍生自SEQ ID NO：4或6的合成酶)最初在酿酒酵母宿主细胞系统中演化和选择。

本领域已知大量本发明使用的此类O-RS物质。在酿酒酵母中，功能性tRNACUA/RS对已成功衍生自对应的大肠杆菌tRNA^Tyr/TyrRS和tRNA^Leu/亮氨酰-tRNA合成酶对。参见例如Chin等(2003)，“扩展的真核遗传密码”(Anexpanded eukaryotic genetic code)Science 301：964-967；Chin等，“扩展真核遗传密码进展”(Progress Toward an Expanded Eukaryotic Genetic Code)Chem Biol10，511-519(2003)；Deiters等(2003)，“在酿酒酵母的遗传密码中加入具有新反应性的氨基酸”(Adding amino acids with novel reactivity to the genetic code ofSaccharomyces cerevisiae)J Am Chem Soc 125：11782-11783；Summerer等(2006)，“遗传编码的荧光氨基酸”(A Genetically Encoded Fluorescent AminoAcid)PNAS 103(26)：9785-9789；Wu等(2004)，“遗传编码的光笼蔽氨基酸”(Agenetically encoded photocaged amino acid)J Am Chem Soc 126，14306-14307。授权Deiters等的2004年4月16日提交的WO 2005/003294“非天然反应性氨基酸遗传密码增加”(UNNATURAL REACTIVE AMINO ACID GENETICCODE ADDITIONS)；Deiters等的2005年9月21日提交的WO 2006/034410“在遗传密码中加入光调节性氨基酸”(ADDING PHOTOREGULATEDAMINO ACIDS TO THE GENETIC CODE)，以及2005年10月27日提交的WO2006/110182“用于体内掺入非天然氨基酸的正交翻译组件”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)。每一参考文献均通过引用全文纳入本文。本领域这些教导为构建本发明使用的其它O-RS物质提供了充分的指导。

图16提供本发明所使用的O-RS物质的例子。SEQ ID NO：8-56提供编码O-RS的多核苷酸序列。SEQ ID NO：57-101提供对应的O-RS多肽序列。应当注意的是，本发明对RS进行操作时未必需要全长O-RS。仅表达RS活性位点片段足以满足本发明的使用，如图16所示的一些序列。图16中每一O-RS序列均为本领域所知，如本文引用参考文献所述。

应了解，本发明并不局限于使用图16提供的O-RS。本文鉴定的任何用于本发明的O-RS物质均可作为模板衍生其它本发明可用的O-RS物质，例如，通过在现有O-RS物质内进行保守氨基酸取代。只要新衍生的O-RS保持优选用非天然氨基酸氨酰化对应的O-tRNA的生物学活性，则允许的取代数目不受限制。

O-RS的生物学活性可表示为已证明可为本发明使用的另一“参考”O-RS的生物学活性的百分数。例如，本发明所用O-RS可包括优选用非天然氨基酸氨酰化O-tRNA，其效率为含有O-tRNA、非天然氨基酸和已知序列的氨酰-tRNA合成酶(RS)的“参考”翻译系统效率的至少50％的O-RS。任意选择活性阈值，“50％”仅作为示例。事实上，本发明所用O-RS可包括优选用非天然氨基酸氨酰化O-tRNA，其效率至少为“参考”翻译系统效率的20％、30％、40％、50％、60％、70％、80％、90％、95％、98％或99％的O-RS。

本发明使用的O-TRNA物质

本发明使用的突变O-RS物质最初在酵母宿主细胞系统中演化和选择。在酵母宿主细胞系统中演化的O-RS物质与O-tRNA联合行使功能，所述O-tRNA被O-RS用非天然氨基酸优先氨酰化。例如，在酵母宿主系统中有功能的抑制子O-tRNA物质可为，例如SEQ ID NO：1或2的tRNA。

相反，本发明翻译系统使用在哺乳动物宿主细胞(如啮齿类或灵长类细胞)中正交的不同O-tRNA。例如，本发明使用的O-tRNA可为嗜热脂肪芽孢杆菌的琥珀抑制子酪氨酰-tRNA_CUA(Bs-tRNATyrCUA)，如SEQ ID NO：3所示。这并不意味本发明仅限于使用这一种tRNA物质，也考虑使用该tRNA序列的变体、衍生自嗜热脂肪芽孢杆菌的其它tRNA以及衍生自其它有机体(如其它真细菌种类)的tRNA物质。

正交tRNA/氨酰-tRNA合成酶技术

理解与正交tRNA和正交氨酰-tRNA合成酶配对有关的活性有助于理解本发明的新型组合物和方法。为在遗传密码中加入额外的非天然氨基酸，需要含有氨酰-tRNA合成酶和适当tRNA的新正交配对，它们可在宿主翻译机制中有效起作用，但对于所述翻译系统是“正交”的，这意味着它可不依赖于翻译系统的内源性合成酶和tRNA而起作用。正交配对的所需特征包括能解码或识别不由任何内源性tRNA解码的仅一种特定密码子(例如选择者密码子)的tRNA，和只能优先用一种特定非天然氨基酸氨酰化(或“加载”)其关联tRNA的氨酰-tRNA合成酶。内源性合成酶通常不氨酰化O-tRNA(或氨酰化，即加载不佳)。例如，在大肠杆菌宿主系统中，正交配对包括不与任何内源性tRNA(例如，大肠杆菌中有40种)交叉反应的氨酰-tRNA合成酶和不被任何内源性合成酶(例如，大肠杆菌中有21种)氨酰化的正交tRNA。

本领域已知适于制备含有一个或多个非天然氨基酸的蛋白质的正交翻译系统的通用原则，例如制备正交翻译系统的通用方法。例如，可参见国际公开号WO2002/086075，名为“METHODS AND COMPOSITIONS FOR THEPRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNASYNTHETASE PAIRS”(产生正交tRNA-氨酰-tRNA合成酶配对的方法和组合物)；WO 2002/085923，名为“IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS”(非天然氨基酸的体内掺入)；WO2004/094593，名为“EXPANDING THE EUKARYOTIC GENETIC CODE”(扩展真核遗传密码)；2004年7月7日提交的WO 2005/019415；2004年7月7日提交的WO 2005/007870；2004年7月7日提交的WO 2005/007624；2005年10月27日提交的国际申请号PCT/US2005/039210，名为“ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS”(用于体内掺入非天然氨基酸的正交翻译组分)和2007年3月7日提交的美国临时申请序列号60/783,497，名为“SYSTEMS FOR THE EXPRESSION OF ORTHOGONALTRANSLATION COMPONENTS IN EUBACTERIAL HOST CELLS(在真细菌宿主细胞中表达正交翻译组分的系统)”。这些申请各自通过引用全文纳入本文。掺入非天然氨基酸的正交翻译系统和它们的产生及使用方法的讨论还可参见Wang和Schultz，“Expanding the Genetic Code(扩展遗传密码)”，Angewandte Chemie Int.Ed.，44(1)：34-66(2005)；Xie和Schultz，“An Expanding Genetic Code(扩展的遗传密码)”，Methods36(3)：227-238(2005)；Xie和Schultz，“Adding Amino Acids to the Genetic Repertoire(将氨基酸加入遗传库)”，Curr.Opinion in Chemical Biology 9(6)：548-554(2005)；和Wang等，“Expanding the Genetic Code(扩展遗传密码)”，Annu.Rev.Biophys.Biomol.Struct.，35：225-249(2006)；这些文献的内容通过引用全文纳入本文。

正交翻译系统

正交翻译系统一般包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和非天然氨基酸的细胞(可以是哺乳动物细胞，例如啮齿动物细胞或灵长动物细胞)，其中所述O-RS用所述非天然氨基酸氨酰化所述O-tRNA。本发明的正交配对可以包括O-tRNA，例如抑制子tRNA、移码tRNA等和关联O-RS。本发明的正交系统通常包含处于宿主细胞环境中或无宿主细胞的O-tRNA/O-RS配对。除多组分系统外，本发明还提供单组分，例如，正交氨酰-tRNA合成酶多肽(例如，SEQ ID NO：57-101)和编码那些多肽的多核苷酸(例如，SEQ ID NO：8-56)。

当正交配对识别选择者密码子并对该选择者密码子起反应而加载氨基酸时，通常称该正交配对“抑制”该选择者密码子。即，不被翻译系统的(例如，细胞的)内源性机制识别的选择者密码子通常不被加载，从而阻断了多肽产生，否则可自核酸翻译该多肽。在正交配对系统中，O-RS用特定的非天然氨基酸氨酰化O-tRNA。加载的O-tRNA识别选择者密码子并抑制选择者密码子所致的翻译阻断。

在一些方面，与包含本文序列表所示多核苷酸序列或由其编码的O-tRNA的抑制效率相比，本发明的O-tRNA识别选择者密码子并在关联合成酶存在下对选择者密码子起反应而具有至少约，例如，45％、50％、60％、75％、80％或90％或更高的抑制效率。

在一些实施方式中，联用O-RS和O-tRNA的抑制效率是缺乏O-RS的O-tRNA的抑制效率的约，例如5倍、10倍、15倍、20倍或25倍或更高。在一些方面，联用O-RS和O-tRNA的抑制效率是本文序列表所示正交合成酶配对的抑制效率的至少约，例如35％、40％、45％、50％、60％、75％、80％或90％或更高。

宿主细胞利用O-tRNA/O-RS配对将非天然氨基酸掺入延伸中的多肽链，例如经由包含编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸包含所述O-tRNA识别的选择者密码子。在某些优选方面，细胞可包含一种或多种其它O-tRNA/O-RS配对，其中所述其它O-RS用不同的非天然氨基酸加载所述其它O-tRNA。例如，O-tRNA之一可识别四碱基密码子，其它O-tRNA可识别终止密码子。或者，多个不同的终止密码子或多个不同的四碱基密码子可用于同一编码核酸。

应注意，在一些实施方式中，细胞或其它翻译系统中可存在多个O-tRNA/O-RS配对，从而能将多个非天然氨基酸掺入多肽。例如，细胞还可包含额外的不同O-tRNA/O-RS配对和第二非天然氨基酸，其中该额外的O-tRNA识别第二选择者密码子，该额外的O-RS优先用该第二非天然氨基酸氨酰化该额外的O-tRNA。例如，包含O-tRNA/O-RS配对的细胞(其中所述O-tRNA识别，例如琥珀选择者密码子)还可包含第二正交配对，其中该第二O-tRNA识别不同的选择者密码子，例如乳白密码子、四碱基密码子等。不同的正交配对优选衍生自不同来源，从而有助于识别不同的选择者密码子。

在某些实施方式中，系统包含例如哺乳动物细胞等细胞，例如但不限于啮齿动物和灵长动物细胞，这些细胞含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)、非天然氨基酸和包含编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸包含所述O-tRNA识别的选择者密码子。翻译系统还可以是无细胞系统，例如与本文所述O-tRNA/O-RS配对和非天然氨基酸组合的各种市售可得“体外”转录/翻译系统。

O-tRNA和/或O-RS可以是天然产生的，或者可以是，例如天然tRNA和/或RS经突变衍生，例如，通过产生各种生物的tRNA文库和/或RS文库和/或采用各种可用的突变方案。例如，产生正交tRNA/氨酰-tRNA合成酶配对的一种方案包括将，例如得自除宿主细胞外的来源或多个来源的异源(对宿主细胞而言)tRNA/合成酶配对输入宿主细胞。候选异源合成酶的特性包括，例如不加载任何宿主细胞tRNA，候选异源tRNA的特性包括，例如不被任何宿主细胞合成酶所氨酰化。此外，异源tRNA对于所有宿主细胞合成酶是正交的。产生正交配对的第二种方案包括产生用于筛选和/或选择O-tRNA或O-RS的突变体文库。也可联用这些方案。

正交tRNA(O-tRNA)

本发明的正交tRNA(O-tRNA)优选在例如体内或体外介导将非天然氨基酸掺入蛋白质内，所述蛋白质由含选择者密码子的多核苷酸编码，而这种选择者密码子可被该O-tRNA识别。在某些实施方式中，与包含本文序列表中O-tRNA序列所示多核苷酸序列或由其编码的O-tRNA相比，本发明的O-tRNA在关联合成酶存在下，对选择者密码子起反应而具有至少45％、50％、60％、75％、80％、90％或更高的抑制效率。

可通过本领域已知的多种试验测定抑制效率。例如，可采用β半乳糖苷酶报道分子试验，例如，将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)和含有本发明O-tRNA的质粒一起导入合适生物(如可利用正交组分的生物)的细胞内。还可导入关联合成酶(多肽或表达时可编码关联合成酶的多核苷酸)。将细胞在培养基内培养到所需密度，如OD₆₀₀约0.5时，采用例如诺瓦金公司(Novagen)的BetaFluor^TM β-半乳糖苷酶检测试剂盒进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较对照(如衍生的lacZ构建物的观察值，所述构建物在所需位置上含有相应的有义密码子而不是选择者密码子)的活性百分数。

本发明所用的O-tRNA的例子见本文序列表，例如参见图16和SEQ IDNO：3。本文内容还提供了设计其它等价O-tRNA的指导。在RNA分子(例如O-RS mRNA或O-tRNA分子)中，与给定序列(或对编码DNA而言反之亦然)或其互补序列相比，胸腺嘧啶(T)被尿嘧啶(U)取代。还可存在碱基的其它修饰以大量产生功能等同分子。

本发明还包括对应于本文具体O-tRNA的O-tRNA保守性变体。例如，O-tRNA保守性变体包括功能与具体O-tRNA(例如本文序列表中的)相似的，和因合适的自身互补性而保留了tRNA的L-形结构但不具有与例如序列表或图16所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些分子。

含O-tRNA的组合物还可包含正交氨酰-tRNA合成酶(O-RS)，其中所述O-RS优先用非天然氨基酸氨酰化O-tRNA。在某些实施方式中，含有O-tRNA的组合物还可包含(例如体外或体内)翻译系统。细胞中也可存在含有编码感兴趣多肽的多核苷酸的核酸或这些物质中一个或多个的组合，其中所述多核苷酸含有O-tRNA能识别的选择者密码子。

产生正交tRNA(O-tRNA)的方法也是本发明的特征之一。通过该方法产生的正交tRNA(O-tRNA)也是本发明的特征之一。在本发明的某些实施方式中，可通过构建突变体文库来产生O-tRNA。可采用本领域已知的各种诱变技术构建突变体tRNA文库。例如，可通过位点特异性突变、随机位点突变、同源重组、DNA改组或其它递归诱变(recursive mutagenesis)方法、嵌合体构建、或者这些技术的任何组合产生突变体tRNA，例如SEQ ID NO：3所示O-tRNA。

也可将其它突变引入特定位置，例如tRNA的所需环或区域(如反密码子环、接纳茎、D臂或环、可变环、TPC臂或环、tRNA分子的其它区域或其组合)中一个或多个非保守位置、保守位置、一个或多个随机位置或者二者的组合位置。tRNA中的突变通常包括使突变型tRNA文库内各成员的反密码子环突变以使其能识别选择者密码子。该方法还可包括给O-tRNA加上额外序列。与起始材料(例如多种tRNA序列)相比，O-tRNA通常提高了对所需生物的正交性，同时保留其对所需RS的亲和力。

这些方法任选包括分析tRNA和/或氨酰-tRNA合成酶序列的相似性(和/或所推断的同源性)以确定显示与特定生物正交的潜在候选O-tRNA、O-RS和/或其配对。可利用本领域已知和本文所述的计算机程序进行这种分析，例如可用BLAST和堆积(pileup)程序。在一个实施例中，为筛选用于哺乳动物细胞如啮齿动物细胞和灵长动物细胞的可能的正交翻译组分，可选择与宿主生物不显示接近的序列相似性的合成酶和/或tRNA。

通常可通过，例如负选择第一物种的细胞群以获得O-tRNA，其中所述细胞含有多种潜在O-tRNA的某成员。负选择可去除含有被细胞内源性氨酰-tRNA合成酶(RS)氨酰化的潜在O-tRNA文库某成员的细胞。这样就可以得到第一物种细胞的正交tRNA库。

某些实施方式在负选择中将选择者密码子引入编码负选择标记(例如能赋予抗生素抗性的酶如β内酰胺酶；能得到可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶(CAT)，所述产物例如是毒性产物，如芽孢杆菌RNA酶)的多核苷酸的非必须位置(例如，仍能产生功能性芽孢杆菌RNA酶)等。还任选在选择性试剂(比如抗生素，如氨苄青霉素)存在下培养细胞群来进行筛选/选择。在一个实施方式中，选择性试剂的浓度不同。

例如，为检测抑制子tRNA的活性，可利用基于选择者密码子的体内抑制的选择系统，例如将无义(如终止)或移码突变引入编码负选择标记的多核苷酸(如编码β-内酰胺酶的基因(bla))中。例如，构建在某位置(如，A184)含有选择者密码子的多核苷酸变体，如bla变体。用这些多核苷酸转化细胞，如细菌。以不能被内源性大肠杆菌合成酶有效加载的正交tRNA为例，抗生素抗性(例如氨苄青霉素抗性)应约为或小于未用质粒转化的细菌的抗生素抗性。如果tRNA不是正交的，或者能加载该tRNA的异源合成酶在此系统内共同表达，应可观察到更高水平的抗生素(如氨苄青霉素)抗性。选出那些在抗生素浓度与未用质粒转化的细胞大致相等的LB琼脂平板上不能生长的细胞，如细菌。

以毒性产物(如核糖核酸酶或芽孢杆菌RNA酶)为例，当多种潜在的tRNA中的成员被内源性宿主(如大肠杆菌)合成酶(即与宿主如大肠杆菌合成酶不是正交的)氨酰化时，选择者密码子被抑制，所产生的毒性多核苷酸产物导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞可存活。

然后，在一个实施方式中，对与所需生物正交的tRNA库进行正选择，其中将选择者密码子置于正选择标记中(例如抗药性基因(如β内酰胺酶基因)编码的标记)。对以下细胞进行正选择：含有编码与该细胞正交的tRNA库某成员的多核苷酸或包含该成员的多核苷酸、含有编码正选择标记的多核苷酸和含有编码关联RS的多核苷酸。在某些实施方式中，第二群细胞含有不能通过负选择除去的细胞。该多核苷酸在胞内表达，细胞在有选择试剂(如氨苄青霉素)存在下生长。然后选择能被共同表达的关联合成酶氨酰化以及对此选择者密码子起反应而插入氨基酸的tRNA。与一种或多种含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比，这些细胞通常显示抑制效率升高。含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞对该抗生素敏感。因此在两次选择中能保留下的tRNA是：(i)不是内源性宿主(如大肠杆菌)合成酶的底物；(ii)能被感兴趣的合成酶氨酰化；以及(iii)能在翻译过程中起作用。

因此，根据筛选所处的环境，同一标记可以是正或负标记。即，如果为了筛选该标记，则它是正标记，但如果为了抵御该标记则它是负标记。

上述方法中，筛选，如正选择、负选择或者正负选择的严格性任选包括改变选择的严格性。例如，由于芽孢杆菌RNA酶是毒性极高的蛋白质，可通过将不同数目的选择者密码子引入到芽孢杆菌RNA酶基因内和/或使用可诱导启动子来控制负选择的严格性。在另一实施例中，选择或筛选试剂的浓度(如氨苄青霉素的浓度)可以不同。在本发明的一些方面，因为在前几轮中所需活性较低，严格性可以不同。因此，前几轮适用较低的严格性筛选标准，而后几轮选择适用更严谨的标准。在某些实施方式中，负选择、正选择或者正负选择可重复多次。也可使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方式中，正选择标记和负选择标记可以相同。

其他类型的选择/筛选方法也可用于本发明以制备正交翻译组分，如O-tRNA、O-RS和能对选择者密码子起反应而加载非天然氨基酸的O-tRNA/O-RS配对。例如，负选择标记、正选择标记或正负选择标记可包括发荧光的或在合适反应物存在下能催化发光反应的标记。在另一实施方式中，可通过荧光激活细胞分选(FACS)或发光检测标记的产物。标记任选可包括亲和筛选标记。也参见Francisco，J.A.等(1993)，“Production and fluorescence-activatedcell sorting of Escherichia coli expressing afunctional antibody fragement on theexternal surface(在外表面表达功能性抗体片段的大肠杆菌的制备与荧光激活细胞分选)”，Proc Natl Acad Sci USA.，90：10444-8。

制备重组正交tRNA的其它方法可见，例如名为“METHODS ANDCOMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNAAMINOACYL-tRNA SYNTHETASE PAIRS(制备正交tRNA-氨酰-tRNA合成酶配对的方法和组合物)”的国际申请公开号WO 2002/086075；名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传密码)”的WO 2004/094593；与2004年7月7日提交的WO 2005/019415。也参见Forster等，(2003)，“Programming peptidomimetic synthetases bytranslating genetic codes designed de novo(通过翻译从头设计的遗传密码来编程肽模拟合成酶)”，PNAS，100(11)：6353-6357；和Feng等，(2003)，“Expanding tRNA recognition of a tRNA synthetase by a single amino acidchange(通过单氨基酸改变扩大tRNA合成酶的tRNA识别)”，PNAS，100(10)：5676-5681。

正交氨酰-tRNA合成酶(O-RS)

本发明的O-RS在体外或体内优先用非天然氨基酸氨酰化O-tRNA。可通过含O-RS的多肽和/或编码O-RS或其部分的多核苷酸将本发明的O-RS提供给翻译系统，如细胞。例如，示例性O-RS包含选自SEQ ID NO：57-101的氨基酸序列或其保守变体。在另一实施例中，O-RS或其部分是由编码本文序列表和实施例所示的氨基酸序列的多核苷酸序列或其互补多核苷酸序列编码。可参见，例如选自SEQ ID NO：8-56的多核苷酸。

鉴定可与O-tRNA一起应用的正交氨酰-tRNA合成酶(O-RS)，例如O-RS的方法也是本发明的特征之一。例如，一种方法包括选择(如正选择)第一物种的细胞群，其中所述细胞各自含有：1)多种氨酰-tRNA合成酶(RS)的成员之一(例如，所述多种RS可包括突变型RS、衍生自第一物种之外的物种的RS，或突变型RS和衍生自第一物种之外的物种的RS二者)；2)正交tRNA(O-tRNA)(例如，一个或多个物种的)；以及3)编码选择(例如正选择)标记并含有至少一个选择者密码子的多核苷酸。与缺乏所述多种RS的成员或成员数目少的细胞相比，选择或筛选显示抑制效率提高的那些细胞。可用本领域已知和本文所述的方法测定抑制效率。抑制效率提高的细胞包含能氨酰化O-tRNA的活性RS。将第一物种的第一组tRNA的活性RS氨酰化的水平(体外或体内)与第二物种的第二组tRNA被活的RS氨酰化的水平作比较。通过可检测物质(例如，标记的非天然氨基酸)测定氨酰化水平。通常选择与第一组tRNA相比更有效地氨酰化第二组tRNA的活性RS，从而获得能与O-tRNA联用的有效(如优化)正交氨酰-tRNA合成酶。采用这种方法鉴定的O-RS也是本发明的特征之一。

可用许多试验来测定氨酰化。这些试验可在体外或体内进行。例如，体外氨酰化试验可见例如Hoben和Soll，(1985)，Methods Enzymol.，113：55-59。也可联用报道分子和正交翻译组分并检测细胞中的报道分子来测定氨酰化，所述细胞表达含有至少一个选择者密码子并编码某蛋白质的多核苷酸。也参见名为“IN VIVO INCORPORATION OF UNNATURAL AMINOACIDS(非天然氨基酸的体内掺入)”的WO 2002/085923和名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传密码)”的WO 2004/094593。

还可进一步改造鉴定的O-RS以改变该合成酶的底物特异性，从而使得O-tRNA只加载上所需的非天然氨基酸，而不是任何常见的20种氨基酸。产生对非天然氨基酸具有底物特异性的正交氨酰tRNA-合成酶的方法包括，例如通过组合合成酶的不同结构域而使合成酶在其活性位点、在其编辑机制位点、在不同位点发生突变等，并应用选择方法。也可以采用先正选择再负选择的方案。在正选择中，抑制引入阳性标记的一个或多个非重要位置的选择者密码子使得细胞在正选择压力下存活。在同时有天然和非天然氨基酸存在时，如此存活的细胞编码使正交抑制子tRNA带有天然或非天然氨基酸的活性合成酶。在负选择中，抑制引入阴性标记的一个或多个非重要位置的选择者密码子使合成酶失去天然氨基酸特异性。经正、负选择而存活的细胞编码只用非天然氨基酸氨酰化(加载)正交抑制子tRNA的合成酶。然后通过例如DNA改组或其它递归诱变方法进一步诱变这些合成酶。

可采用本领域已知的各种诱变技术产生突变型O-RS文库。例如，可用位点特异性突变、随机点突变、同源重组、DNA改组或其它递归诱变方法，嵌合构建或它们的组合来制备突变型RS。例如，可从两种或更多种其它如较小、多样性较低的“亚文库”来制备突变型RS文库。本发明也包括RS的嵌合文库。应注意，可以构建各种生物(例如微生物，如真细菌或古细菌)的tRNA合成酶文库，例如具有天然多样性的文库(参见，例如授予Short等的美国专利号6,238,884；授予Schallenberger等的美国专利号5,756,316；授予Petersen等的美国专利号5,783,431；授予Thompson等的美国专利号5,824,485；授予Short等的美国专利号5,958,672)，并任选构建和筛选正交配对。

一旦合成酶经历正和负选择/筛选方法，就可进一步诱变这些合成酶。例如可分离编码O-RS的核酸；从该核酸产生编码突变O-RS的一组多核苷酸(例如通过随机诱变、位点特异性诱变、重组或它们的任何组合)；可重复各步骤或各步骤的组合直至获得优先用非天然氨基酸氨酰化O-tRNA的突变O-RS。在本发明的一些方面，这些步骤可进行多次，例如至少两次。

本发明方法也可采用其它水平的选择/筛选严格性来产生O-tRNA、O-RS或其配对。可改变O-RS产生方法中一个或两个步骤的选择或筛选严格性。这包括，例如，改变选择/筛选试剂的用量等。也可额外进行几轮正和/或负选择。选择或筛选也可包括以下一种或多种改变：氨基酸渗透性、翻译效率、翻译保真度(translational fidelity)等。一种或多种改变通常依据用正交tRNA-tRNA合成酶配对来产生蛋白质的生物中一种或多种基因突变。

产生O-RS并改变合成酶底物特异性的其它常规细节见名为“METHODS AND COMPOSITIONS FOR THE PRODUCTION OFORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS(产生正交tRNA-氨酰基tRNA合成酶配对的方法和组合物)”的WO 2002/086075和名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传密码)”的WO 2004/094593。也可参见Wang和Schultz，“Expanding theGenetic Code(扩展遗传密码)”，Angewandte Chemie Int.Ed.，44(1)：34-66(2005)，其内容以引用方式全文纳入。

来源和宿主生物

本发明正交翻译组分(O-tRNA和O-RS)可得自任何生物(或生物的组合)，可用于任何其它物种的宿主翻译系统，只要所述O-tRNA/O-RS组分与宿主系统能以正交方式起作用。某正交配对中的O-tRNA和O-RS无需得自同一生物。在一些方面，正交组分得自用于哺乳动物宿主系统(如啮齿动物或灵长动物宿主系统)的大肠杆菌(即，真细菌)基因。

例如，正交O-tRNA可衍生自古菌生物，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜高热菌(Methanopyrus kandleri)、梅氏甲烷八叠球菌(Mm)、耐超高温热棒菌(Pyrobaculum aerophilum)、深海火球菌、硫磺矿硫化叶菌(Ss)、超嗜热古菌(Sulfolobus tokodaii)、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌(Bacillus subtilis)、嗜热脂肪芽孢杆菌等；而正交O-RS可得自以下生物(或生物的组合)，例如古细菌，如詹氏甲烷球菌、嗜热碱甲烷杆菌；盐细菌，如沃氏富盐菌和盐细菌种NRC-1；闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜高热菌、梅氏甲烷八叠球菌、耐超高温热棒菌、深海火球菌、硫磺矿硫化叶菌、超嗜热古菌、嗜酸热原体、火山热原体等；或真细菌，如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。在一个实施方式中，真核生物来源，例如植物、藻类、原生动物、真菌、酵母菌、动物(例如哺乳动物、昆虫、节肢动物等)等也可用作O-tRNA和O-RS的来源。

O-tRNA/O-RS配对的各组分可得自同一生物或不同生物。在一个实施方式中，O-tRNA/O-RS配对可来自同一生物。或者，O-tRNA/O-RS配对的O-tRNA和O-RS可来自不同生物。

O-tRNA、O-RS或O-tRNA/O-RS配对可在体内或体外选择或筛选和/或可用于细胞，例如哺乳动物细胞，如啮齿动物或灵长动物细胞，从而产生含有非天然氨基酸的多肽。不特别限制所用的哺乳动物宿主细胞。含本发明翻译组分的哺乳动物细胞组合物也是本发明特征之一。

为在一种生物中筛选O-tRNA和/或O-RS以用于另一种生物，也可参见2004年4月16日提交的名为“EXPANDING THE EUKARYOTICGENETIC CODE(扩展真核生物遗传密码)”的国际申请公布号WO2004/094593。

虽然正交翻译系统(例如，含有O-RS、O-tRNA和非天然氨基酸)可利用培养的宿主细胞产生含非天然氨基酸的蛋白质，但并非要求本发明的正交翻译系统需要完整的、有活力的宿主细胞。例如，在细胞提取物存在下，正交翻译系统可利用无细胞系统。实际上，使用无细胞的体外转录/翻译系统产生蛋白质是公认的技术。利用本文所述的正交翻译系统组分，使这些体外系统适用于产生含非天然氨基酸的蛋白质也属于本发明的范围。

选择者密码子

本发明的选择者密码子扩大了蛋白质生物合成机理的遗传密码子框架。例如，选择者密码子包括，如独特的三碱基密码子、无义密码子(如终止密码子(如琥珀密码子(UAG)或乳白密码子(UGA)))、非天然密码子、至少四碱基的密码子、罕用密码子等。可将许多选择者密码子引入所需基因，例如一个以上、两个以上、三个以上等。利用不同的选择者密码子，可利用多对正交tRNA/合成酶配对，从而能利用这些不同的选择者密码子同时位点特异性地掺入多个非天然氨基酸，例如包含至少一个非天然氨基酸。

在一个实施方式中，这些方法包括利用作为终止密码子的选择者密码子在细胞中体内掺入非天然氨基酸。例如，制备能识别终止密码子的O-tRNA，并由O-RS用非天然氨基酸氨酰化该O-tRNA。宿主的天然氨酰-tRNA合成酶不识别该O-tRNA。可采用常规的定点诱变将终止密码子引入编码感兴趣多肽的多核苷酸中感兴趣的位点。可参见，例如Sayers，J.R.等，(1988)，“5′，3′Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis(硫代磷酸酯寡核苷酸定向诱变中的5’，3’核酸外切酶)”，Nucleic Acids Res，791-802。当例如在体内联用O-RS、O-tRNA和编码感兴趣多肽的核酸时，可对终止密码子起反应而掺入非天然氨基酸，从而获得在特定位点含有非天然氨基酸的多肽。在本发明的一个实施方式中，用作选择者密码子的终止密码子是琥珀密码子UAG和/或乳白密码子UGA。在一实施例中，UAG和UGA都用作选择者密码子的遗传密码可编码22个氨基酸，同时保留赭石无义密码子，UAA，其是最丰富的终止信号。

体内掺入非天然氨基酸不会显著干扰宿主细胞。例如，在非真核细胞，如大肠杆菌中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制子tRNA)与释放因子1(RF1)(其可结合UAG密码子，进而引起延伸中的肽从核糖体释放)之间的竞争，因此可通过，例如提高O-tRNA(如抑制子tRNA)的表达水平，或利用RF1缺陷型菌株调节抑制效率。在真核细胞中，由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制子tRNA)和真核释放因子(如eRF)(其可结合终止密码子，进而引起延伸中的肽从核糖体释放)之间的竞争，因此可通过，例如提高O-tRNA(如抑制子tRNA)的表达水平调节抑制效率。此外，也可存在其它化合物，例如还原剂，如二硫苏糖醇(DTT)。

非天然氨基酸也可由罕用密码子编码。例如，当体外蛋白合成反应中的精氨酸浓度下降时，证实罕用的精氨酸密码子AGG可利用丙氨酸酰化的合成tRNA而有效插入ala。可参见Ma等，Biochemistry，32：7939(1993)。在此情况中，合成tRNA可与大肠杆菌中作为次要成分存在的天然tRNAArg竞争。此外，一些生物不能利用所有三联密码子。已可在体外转录/翻译提取物中利用藤黄微球菌(Micrococcus luteus)的未指定密码子AGA插入氨基酸。可参见，例如Kowal和Oliver，Nucl.Acid.Res.，25：4685(1997)。可产生本发明的各组分以体内利用这些罕用密码子。

选择者密码子也可包括延伸密码子，例如四个或四个以上碱基的密码子，如四个、五个、六个或更多碱基的密码子。四碱基密码子的例子包括，例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子包括，例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明方法可包括使用基于移码抑制的延伸密码子。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质。在其它实施方式中，反密码子环可解码例如至少一种四碱基密码子、至少一种五碱基密码子或至少一种六碱基密码子或更多。由于可能的四碱基密码子有256种，所以同一细胞中可用四个或四个以上碱基的密码子编码多种非天然氨基酸。也可参见，Anderson等，(2002)，“Exploring the Limits of Codon and AnticodonSize(密码子和反密码子大小极限的研究)”，Chemistry and Biology，9：237-244和Magliery，(2001)，“Expanding the Genetic Code：Selection ofEfficient Suppressors of Four-base Codons and Identification of＂Shifty＂Four-base Codons with a Library Approach in Escherichia coli(扩增遗传密码：在大肠杆菌中选择有效的四碱基密码子抑制剂并用文库方法鉴定“变化的”四碱基密码子)”，J.Mol.Biol.，307：755-769。

例如，已采用体外生物合成方法利用四碱基密码子将非天然氨基酸掺入蛋白质。参见，例如Ma等，(1993)，Biochemistry，32：7939和Hohsaka等，(1999)，J.Am.Chem.Soc.，121：34。联用CGGG和AGGU及两种化学酰化的移码抑制子tRNA在体外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时掺入链霉亲和素。可参见，例如Hohsaka等，(1999)，J.Am.Chem.Soc.，121：12194。在体内研究中，Moore等检测了含NCUA反密码子的tRNA^Leu衍生物抑制UAGN密码子(N可以是U、A、G或C)的能力，发现含UCUA反密码子的tRNA^Leu能解码四联UAGA，其效率为13到26％，而在0或-1读框中几乎不解码。可参见Moore等，(2000)，J.Mol.Biol.，298：195。在一个实施方式中，本发明可利用基于罕用密码子或无义密码子的延伸密码子，它们能降低在其它不期望位点的错义连读(missense readthrough)和移码抑制。四碱基密码子已在各种正交系统中用作选择者密码子。可参见，例如，WO 2005/019415；WO 2005/007870和WO 2005/07624。也可参见Wang和Schultz，“Expanding the Genetic Code(扩展遗传密码)”，AngewandteChemie Iht.Ed.，44(1)：34-66(2005)，其内容通过引用的方式全文纳入。虽然以下例子利用琥珀选择者密码子，但通过改进本文的实例使之包含四碱基O-tRNA和经修饰包含与之前描述的各非天然氨基酸O-RS的突变相似的突变的合成酶，也可使用四碱基或更多碱基的密码子。

对于给定系统，选择者密码子还可包括天然三碱基密码子中内源性系统不用(或很少用)的那个天然碱基密码子。例如，这包括缺乏能识别该天然三碱基密码子的tRNA的系统，和/或该三碱基密码子是罕用密码子的系统。

选择者密码子任选包含非天然碱基对。这些非天然碱基对进一步扩大了现有的遗传字符集(genetic alphabet)。一种额外的碱基对可将三联密码子的数目从64增加至125。第三碱基对的特性包括：稳定和选择性的碱基配对，利用聚合酶高保真地有效酶促掺入DNA，新生非天然碱基对合成后引物继续有效延伸。适用于这些方法和组合物的非天然碱基对的描述包括：例如Hirao等，(2002)，“An unnatural base pair for incorporating amino acidanalogues into protein(将氨基酸类似物掺入蛋白质的非天然碱基对)”，Nature Biotechnology，20：177-182。也可参见Wu，Y.等，(2002)，J.Am.Chem.Soc.，124：14626-14630。下文列出了其它的相关出版物。

对于体内使用，非天然核苷是膜可渗透的，并可磷酸化形成相应的磷酸三酯。此外，增加的遗传信息稳定且不为细胞酶所破坏。Benner与他人先前的工作利用了不同于经典Watson-Crick配对的氢键模式，其中最值得注意的例子是异-C：异-G配对(iso-C：iso-G pair)。参见，例如Switzer等，(1989)，J.Am.Chem.Soc.，111：8322；Piccirilli等，(1990)，Nature，343：33；Kool，(2000)，Curr.Opin.Chem.Biol.，4：602。这些碱基通常与天然碱基有一定程度的错配，因而不能酶促复制。Kool和同事证明，碱基间的疏水包装相互作用(hydrophobic packing interaction)可替代氢键以驱动碱基对形成。参见Kool，(2000)，Curr.Opin.Chem.Biol.，4：602；Guckian和Kool，(1998)，Angew.Chem.hit.Ed.Engl.，36：2825。在致力于开发符合以上所有要求的非天然碱基对的过程中，Schultz、Romesberg和同事已系统地合成并研究了一系列非天然疏水碱基。发现PICS：PICS自身配对比天然碱基对更稳定，并可用大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地掺入DNA。可参见，例如McMinn等，(1999)，J.Am.Chem.Soc.，121：11586；和Ogawa等，(2000)，J.Am.Chem.Soc.，122：3274。就生物学功能而言，KF合成3MN：3MN自身配对的效率和选择性足够。可参见，例如Ogawa等，(2000)，J.Am.Chem.Soc.，122：8803。然而，这两种碱基均作为进一步复制的链终止子而起作用。近来开发了可用于复制PICS自身配对的突变型DNA聚合酶。此外，可复制7AI自身配对。可参见，例如Tae等，(2001)，J.Am.Chem.Soc.，123：7439。还已开发了与Cu(II)结合后可形成稳定配对的金属碱基(metallobase)对Dipis：Py。可参见，Meggers等，(2000)，J.Am.Chem.Soc.，122：10714。因为延伸密码子和非天然密码子在本质上与天然密码子正交，所以本发明方法可利用该特性产生它们的正交tRNA。

还可利用翻译旁路系统将非天然氨基酸掺入所需多肽。在翻译旁路系统中，可将一个大序列插入基因，但该序列不翻译成蛋白质。该序列含有可作为提示的结构，从而能诱导核糖体跳过该序列然后恢复该插入序列的下游翻译。

非天然氨基酸

本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种遗传编码的α-氨基酸以外的任何氨基酸、修饰的氨基酸或氨基酸类似物：丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α-氨基酸的通用结构如式I所示：

非天然氨基酸一般具有式I所示的任何结构，其中R基团是除20种天然氨基酸中所用以外的任何取代基。20种天然氨基酸的结构可参见，例如《生物化学》(Biochemistry)，L.Stryer编，第三版，1988，福里曼公司(Freemanand Company)，纽约。注意，本发明的非天然氨基酸可以是除以上20种α-氨基酸以外的天然化合物。

由于本发明的非天然氨基酸与天然氨基酸通常区别在侧链，所以非天然氨基酸与其它氨基酸(例如天然或非天然的)形成酰胺键的方式与天然蛋白质中酰胺键的形成方式相同。然而，非天然氨基酸的侧链不同于天然氨基酸的侧链。

虽然本文所述实施例中主要感兴趣的是图1所示的非天然氨基酸，但并非要将本发明严格限制于这些结构。实际上，不难制备各种易于获得且结构相关的类似物，这些类似物保留产生它们的结构(即图1所示结构)的主要特性，而且本文参考的氨酰-tRNA合成酶(例如，SEQ ID NO：57-101所示O-RS)还特异性识别这些类似物。这些相关的氨基酸类似物属于本发明的范围。

在其它非天然氨基酸中，例如式I中的R可任选含有烷基-、芳基-、酰基-、肼、氰基-、卤代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦酰基、膦、烯酮、亚胺、酯、羟胺、胺等，或上述基团的任何组合。感兴趣的其它非天然氨基酸包括但不限于：含光可活化交联剂的氨基酸、自旋-标记的氨基酸、荧光氨基酸、金属结合氨基酸、含金属的氨基酸、放射性氨基酸、含有新官能团的氨基酸、能与其它分子共价或非共价相互作用的氨基酸、光锁定(photocaged)和/或光致异构(photoisomerizable)的氨基酸、含生物素或生物素类似物的氨基酸、含酮基的氨基酸、糖基化的氨基酸、与氨基酸侧链相连的糖部分、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学方法可切割或光可切割的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如聚醚或长链烃，如超过约5个、约10个碳原子等)、含碳连接糖的氨基酸、含氨基硫代酸的氨基酸以及含一个或多个毒性部分的氨基酸。

本发明另一方面提供具有以下式IV所示通用结构的非天然氨基酸：

具有此结构的非天然氨基酸一般可以是任何结构，其中R₁是20种天然氨基酸之一(例如，酪氨酸或苯丙氨酸)所用的取代基，R₂是取代基。因此，此类非天然氨基酸可视作天然氨基酸衍生物。

除了含有图1所示非天然氨基酸结构外，非天然氨基酸还可任选含有经修饰的骨架结构，例如式II和III所示的结构：

其中，Z一般包含OH、NH₂、SH、NH-R′或S-R′；X和Y可以相同或不同，一般包含S或O，R和R′可任选相同或不同，通常选自与上述式I所示非天然氨基酸的R基团相同的组成以及氢。例如，本发明的非天然氨基酸还任选在式II和III所示氨基或羧基中包含取代基。该类型的非天然氨基酸包括但不限于：例如含有20种常见氨基酸的相应侧链或非天然侧链的α-羟酸、α-硫代酸、α-氨基硫代羧酸酯等。另外，α碳上的取代基还任选包括L、D或α-α-双取代氨基酸，如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它替代结构包括环形氨基酸，如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物，β和γ氨基酸，如取代的β丙氨酸和γ-氨基丁酸。

在一些方面，本发明使用L-构型的非天然氨基酸。然而，本发明并非仅限于使用L-构型的非天然氨基酸。还考虑了这些非天然氨基酸的D-对映体可用于本发明。

本发明所用的非天然氨基酸不严格局限于图1所示的非天然氨基酸。本领域技术人员知道不难获得天然氨基酸的各种非天然类似物。例如，但不限于不难制备衍生自苯丙氨酸或酪氨酸的非天然氨基酸。酪氨酸类似物包括，例如对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸，其中该取代的酪氨酸含有炔基、乙酰基、苯甲酰基、氨基、肼、羟胺、巯基、羧基、异丙基、甲基、C₆-C₂₀直链或支链烃、饱和或不饱和的烃、O-甲基、聚醚基团、硝基等。此外，也包括多取代的芳环。本发明的谷氨酰胺类似物包括但不限于：α-羟基衍生物、γ-取代的衍生物、环形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的例子包括但不限于：对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸，其中所述取代基含有炔基、羟基、甲氧基、甲基、烯丙基、醛基、硝基、巯基或酮基等。非天然氨基酸的具体例子包括但不限于：磺基酪氨酸、对-乙基硫代羰基-L-苯丙氨酸、对-(3-氧代丁酰基)-L-苯丙氨酸、1，5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羟基-香豆素氨基酸、硝基苄基-丝氨酸、O-(2-硝基苄基)-L-酪氨酸、对-羧甲基-L-苯丙氨酸、对-氰基-L-苯丙氨酸、间-氰基-L-苯丙氨酸、联苯基丙氨酸、3-氨基-L-酪氨酸、联吡啶基丙氨酸、对-(2-氨基-1-羟乙基)-L-苯丙氨酸、对-异丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和对-硝基-L-苯丙氨酸。还包括对-炔丙氧基苯丙氨酸、3，4-二羟基-L-苯丙氨酸(DHP)、3，4，6-三羟基-L-苯丙氨酸、3，4，5-三羟基-L-苯丙氨酸、4-硝基-苯丙氨酸、对-乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巯基-酪氨酸、三-O-乙酰基-GlcNAc β-丝氨酸、L-多巴(Dopa)、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰丝氨酸、膦酰酪氨酸、对-碘代-苯丙氨酸、对-溴代苯丙氨酸、对-氨基-L-苯丙氨酸以及异丙基-L-苯丙氨酸等。本文引用的参考文献披露了各种非天然氨基酸的结构。还可参见国际申请公开号WO 2004/094593，题为“EXPANDING THE EUKARYOTICGENETIC CODE(扩展真核遗传密码)”和2005年10月27日提交的国际申请PCT/US2005/039210，题为“ORTHOGONAL TRANSLATIONCOMPONENTS FOR THE VIVO INCORPORATION OF UNNATURALAMINO ACIDS(体内掺入非天然氨基酸的正交翻译组分)”。

非天然氨基酸的化学合成

上述许多非天然氨基酸可以从，例如美国的西格玛公司(Sigma)或美国威斯康星州密尔沃基市的阿尔得里奇公司(Aldrich)等购得。那些不能商品化购得的非天然氨基酸可任选如各种出版物所述或采用本领域技术人员已知的标准方法合成。有机合成技术可参见，例如Fessendon和Fessendon，Organic Chemistry(有机化学)，(1982，第二版，威拉德格兰特出版社(WillardGrant Press)，波士顿，马萨诸塞州)；March，Advanced Organic Chemistry(高级有机化学)(第三版，1985，威立父子公司(Wiley and Sons)，纽约)；以及Carey和Sundberg的Advanced Organic Chemistry(高级有机化学)(第三版，A和B部分，1990，普莱纳姆出版社(Plenum Press)，纽约)。其它描述非天然氨基酸合成的出版物包括：名为“非天然氨基酸的体内掺入”的国际专利申请WO 2002/085923；Matsoukas等，(1995)J.Med.Chem.，38，4660-4669；King和Kidd，(1949)“A New Synthesis of Glutamine and ofγ-Dipeptides of Glutamic Acid from Phthylated Intermediates”(从邻苯二甲酰化中间体合成谷氨酰胺和γ-二肽的新方法).J.Chem.Soc.，3315-3319；Friedman和Chatterrji，(1959)“Synthesis of Derivatives of Glutamine asModel Substrates for Anti-tumor Agents(合成谷氨酰胺衍生物作为抗肿瘤药物的模拟底物)”.J.Am.Chem.Soc.81，3750-3752；Craig等，(1988)“AbsoluteConfiguration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine)(7-氯-4[[4-(二乙基氨基)-1-甲基丁基]氨基]喹啉(氯喹)对映体的绝对构型)”.J.Org.Chem.53，1167-1170；Azoulay等(1991)“Glutamine analogues as PotentialAntimalarials(谷氨酰胺类似物作为潜在的抗疟药)”，Eur.J.Med.Chem.26：201-205；Koskinen和Rapoport，H.(1989)“Synthesis of 4-Substituted Prolinesas Conformationally Constrained Amino Acid Analogues(合成4-取代的脯氨酸作为构象约束的氨基酸类似物)”.J.Org.Chem.54：1859-1866；Christie和Rapoport(1985)“Synthesis of Optically Pure Pipecolates fromL-Asparagine.Application to the Total Synthesis of(+)-Apovincamine throughAmino Acid Decarbonylation and Iminium Ion Cyclization(从L-天冬酰胺合成光学纯的哌啶酸酯，应用于通过氨基酸脱羰基和亚氨鎓离子环化总合成(+)-阿扑长春胺)”.J.Org.Chem.1989：1859-1866；Barton等，(1987)“Synthesisof Novelα-Amino-Acids and Derivatives Using Radical Chemistry：Synthesisof L-and D-α-Amino-Adipic Acids，L-α-aminopimelic Acid and AppropriateUnsaturated Derivatives(采用自由基化学方法合成新的α-氨基酸和衍生物：合成L-和D-α氨基酸、L-α-氨基庚二酸以及合适的不饱和衍生物)”.Tetrahedron Lett.43：4297-4308；以及Subasinghe等，(1992)“Quisqualic acidanalogues：synthesis of beta-heterocyclic 2-aminopropanoic acid derivativesand their activity at a novel quisqualate-sensitized site(使君子氨酸类似物：β-杂环2-氨基丙酸衍生物的合成及其在使君子氨酸敏化部位的活性)”.J.Med.Chem.35：4602-7。还可参见2003年12月22日提交的名为“ProteinArrays(蛋白质阵列)”的国际专利申请WO2004/058946。

非天然氨基酸的细胞摄取

细胞摄取非天然氨基酸通常是设计和选择非天然氨基酸，例如用于掺入蛋白质中应考虑的问题之一。例如，α-氨基酸的高电荷密度提示这些化合物不可能透过细胞。天然氨基酸通过蛋白质转运系统的收集(作用)摄取入细胞，这些系统往往显示程度不同的氨基酸特异性。可进行快速筛选来评估细胞将摄取哪种非天然氨基酸(如果有的话)。可参见，例如2003年12月22日提交的名为“Protein Arrays(蛋白质阵列)”的国际公布WO 2004/058946中的毒性试验；Liu和Schultz，(1999)，“Progress toward the evolution of anorganism with an expanded genetic code(含扩增遗传密码的生物演化的进展)”，PNAS，96：4780-4785。虽然不难采用各种试验分析摄取情况，但设计适合于细胞摄取途径的非天然氨基酸的另一种方法是提供生物合成途径，从而能在体内产生氨基酸。

非天然氨基酸的生物合成

细胞中已有许多生物合成途径来产生氨基酸和其它化合物。虽然自然界中，例如细胞中，可能不存在特定非天然氨基酸的生物合成方法，但本发明提供了这种方法。例如，通过加入新的酶或修饰现有的宿主细胞途径可以在宿主细胞中任选产生非天然氨基酸的生物合成途径。其它新的酶任选是天然产生的酶或人工开发的酶。例如，生物合成对氨基苯丙氨酸(如WO 2002/085923(同上)中的实施例所示)依赖加入其它生物的已知酶的混合物。可通过用含这些酶的基因的质粒转染细胞而将这些基因引入细胞。当这些基因在细胞中表达时，它们提供了合成所需化合物的酶途径。可任选加入的酶类型的例子见以下实施例。其它酶序列见例如Genbank。也可以相同方式将人工开发的酶任选加入细胞。可以此方式操控细胞机理和资源用以产生非天然氨基酸。

实际上，可采用各种方法产生新的酶从而在体内或体外用于生物合成途径，改进现有途径，产生非天然氨基酸。开发酶和其它生物合成途径组分的许多现有方法适用于本发明以产生非天然氨基酸(或者，实际上，用于开发合成酶使之具有新的底物特异性或其它感兴趣的活性)。例如，可任选采用DNA改组来开发新的酶和/或这些酶的途径，从而能在体外或体内产生非天然氨基酸(或产生新的合成酶)。可参见，例如Stemmer，(1994)，“Rapid evolution of a protein in vitro by DNA shuffling(通过DNA改组在体外快速进化蛋白质)”，Nature，370(4)：389-391；Stemmer，(1994)，“DNAshuffling by random fragmentation and reassembly：In vitro recombinationfor molecular evolution(通过随机断裂和装配的DNA改组：分子进化的体外重组)”，Proc.Natl.Acad.Sci.USA.，91：10747-10751。相关方法改组关联的(例如同源的)基因家族，从而能快速开具有所需特性的酶。这种“家族基因改组”方法的例子见Crameri等，(1998)，“DNA shuffling of a family ofgenes from diverse species accelerates directed evolution(不同种类基因家族的DNA改组加速了定向进化)”，Nature，391(6664)：288-291。也可采用称为“产生杂交酶的递增截短”(ITCHY)的DNA重组方法来产生新的酶(无论是生物合成途径组分或合成酶)，例如Ostermeier等，(1999)，“Acombinatorial approach to hybrid enzymes independent of DNA homology(不依赖DNA同源性的杂交酶的组合方法)”，Nature Biotech，17：1205中所述。该方法也可用于产生用作一种或多种体外或体内重组方法底物的酶或其它途径变体的文库。也可参见，Ostermeier等，(1999)，“CombinatorialProtein Engineering by Incremental Truncation(采用递增截短的组合蛋白质工程)”，Proc.Natl.Acad.Sci.USA，96：3562-67；Ostermeier等，(1999)，“Incremental Truncation as a Strategy in the Engineering of NovelBiocatalysts(作为工程改造新生物催化剂的方法的递增截短)”，Biologicaland Medicinal Chemistry，7：2139-44。另一种方法采用指数集合诱变(exponential ensemble mutagenesis)来产生酶或其它途径变体的文库，其能例如催化与产生非天然氨基酸(或新合成酶)有关的生物合成反应。在该方法中，平行地随机选取(randomized)感兴趣序列中的小基团残基，以在各不同位置鉴定可产生功能性蛋白质的氨基酸。适用于本发明以产生新酶进而产生非天然氨基酸(或新合成酶)的此类方法的例子见Delegrave和Youvan，(1993)，Biotechnology Research，11：1548-1552。在另一方法中，利用掺杂或简并寡核苷酸的随机或半随机诱变可用于工程改造酶和/或途径成分，例如采用如以下文献所述的通用诱变方法：Arkin和Youvan，(1992)，“Optimizing nucleotide mixtures to encode specific subsets of amino acids forsemi-random mutagenesis”(优化核苷酸混合物来编码用于半随机诱变的特定氨基酸亚组)，Biotechnology 10：297-300；或Reidhaar-Olson等，(1991)，“Random mutagenesis ofprotein sequences using oligonucleotide cassettes”(用寡核苷酸盒随机诱变蛋白质序列)，Methods Enzymol.，208：564-86。利用多核苷酸重装配和位点饱和诱变的另一种方法(常称为“非随机”诱变)可用于产生酶和/或途径组分，然后筛选它们行使一种或多种合成酶或生物合成途径功能(例如在体内产生非天然氨基酸)的能力。可参见，例如Short，“NON-STOCHASTIC GENERATION OF GENETIC VACCINES ANDENZYMES(遗传疫苗和酶的非随机产生)”，WO 00/46344。

这种突变方法的替代方法包括重组生物的整个基因组并选择得到的后代的特定途径功能(常称为“全基因组改组”)。该方法适用于本发明，例如通过基因组重组并选择能够产生非天然氨基酸(或其中间体)的生物(大肠杆菌或其它细胞)。例如，以下出版物所指导的方法可应用于途径设计，从而能开发细胞中现有和/或新的途径进而在体内产生非天然氨基酸：Patnaik等，(2002)，“Genome shuffling of lactobacillus for improved acid tolerance(乳酸杆菌基因组改组来提高酸耐受性)”，Nature Biotechnology，20(7)：707-712；和Zhang等，(2002)，“Genome shuffling leads to rapid phenotypicimprovement in bacteria(基因组改组导致细菌表型快速改善)”，Nature，2月7日，415：644-646。

其它可用于生物和代谢途径工程改造(例如为产生所需化合物)的技术也适用于产生非天然氨基酸。指导有用的路径工程改造方法的出版物的例子包括：Nakamura和White，(2003)，“Metabolic engineering for the microbialproduction of 1，3 propanediol(微生物生产1，3丙二醇的代谢工程)”，Curr.Opin.Biotechnol.，14(5)：454-9；Berry等，(2002)，“Application of MetabolicEngineering to improve both the production and use of Biotech Indigo(应用代谢工程来提高Biotech Indigo的生产和用途)”，J.Industrial Microbiology andBiotechnology，28：127-133；Banta等，(2002)，“Optimizing an artificialmetabolic pathway：Engineering the cofactor specificity of Corynebacterium2，5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis(优化人工代谢途径：工程改造用于维生素C生物合成的棒状杆菌2，5-二酮基-D-葡糖酸还原酶的辅助因子特异性)”，Biochemistry，41(20)：6226-36；Selivonova等，(2001)，“Rapid Evolution of Novel Traits in Microorganisms(微生物中新特性的快速进化)”，Applied and Environmental Microbiology，67：3645，和许多其它出版物。

无论采用什么方法，用本发明工程改造的生物合成途径产生的非天然氨基酸的浓度足以有效地生物合成蛋白质，例如天然细胞含量，但不应达到显著影响其它细胞氨基酸的浓度或耗尽细胞资源的程度。以此方式在体内所产生的浓度一般为约10mM到约0.05mM。一旦细胞被工程改造从而产生了特定途径所需的酶和非天然氨基酸，为了核糖体蛋白质合成和细胞生长，可任选采用体内选择以进一步优化非天然氨基酸的产生。

掺入非天然氨基酸的正交组分

本发明提供制备正交组分从而能在体内对选择者密码子，如琥珀终止密码子、无义密码子、四碱基或多碱基密码子等起反应而将图1所示的非天然氨基酸掺入延伸的多肽链中的方法和组合物。例如，本发明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及其配对。这些配对可用于将非天然氨基酸掺入延伸的多肽链中。

本发明的组合物包含正交氨酰-tRNA合成酶(O-RS)，所述O-RS优先用图1的非天然氨基酸氨酰化O-tRNA。在某些实施方式中，O-RS包含选自SEQ ID NO：57-101的氨基酸序列及其保守变体。在本发明的某些实施方式中，O-RS优先用特定的非天然氨基酸氨酰化O-tRNA胜过任何内源性tRNA，其中所述O-RS对O-tRNA有偏好(bias)，其中加载有非天然氨基酸的O-tRNA与加载有相同非天然氨基酸的内源性tRNA的比例大于1:1，更优选O-RS排他性地或者几乎排他性地加载O-tRNA。

含O-RS的组合物还可任选含有正交tRNA(O-tRNA)，该O-tRNA识别选择者密码子。与包含本文序列表(例如，SEQ ID NO：1)和实施例所列的多核苷酸序列或由其编码的O-tRNA的抑制效率相比，在关联合成酶存在下，本发明O-tRNA对选择者密码子起反应而通常具有至少约，例如45％、50％、60％、75％、80％、90％或更高的抑制效率。在一个实施方式中，O-RS结合O-tRNA的抑制效率至少是没有O-RS存在下O-tRNA的抑制效率高，例如5倍、10倍、15倍、20倍、25倍或更高。在一些方面，O-RS与O-tRNA一起的抑制效率至少是衍生自大肠杆菌(E.Coli)的正交亮氨酰或酪氨酰-tRNA合成酶的抑制效率的45％。

包含O-tRNA的组合物还可任选包含宿主细胞(例如哺乳动物细胞，如啮齿动物细胞或灵长动物细胞)和/或完整翻译系统。

本发明还提供包含翻译系统的细胞(如啮齿动物细胞或灵长动物细胞)，所述翻译系统包含正交-tRNA(O-tRNA)；正交氨酰-tRNA合成酶(O-RS)和图1所示非天然氨基酸。O-RS通常优先用非天然氨基酸氨酰化O-tRNA胜过任何内源性tRNA，该O-RS对O-tRNA有偏好，加载有非天然氨基酸的O-tRNA与加载有相同非天然氨基酸的内源性tRNA的比例大于1∶1，更优选该O-RS排他性地或者几乎排他性地加载O-tRNA。O-tRNA识别第一选择者密码子，O-RS优先用非天然氨基酸氨酰化O-tRNA。在一个实施方式中，O-tRNA含有SEQ ID NO：3所示多核苷酸序列或其互补多核苷酸序列，或者由其编码。在一个实施方式中，该O-RS含有选自SEQ ID NO：57-101的氨基酸序列和其保守变体。

本发明的细胞还可任选包含其它不同的O-tRNA/O-RS配对和第二非天然氨基酸，例如，此O-tRNA识别第二选择者密码子，此O-RS优先用第二非天然氨基酸氨酰化相应的O-tRNA，其中所述第二氨基酸不同于第一非天然氨基酸。本发明的细胞可任选包含含有编码感兴趣多肽的多核苷酸的核酸，所述多核苷酸含有所述O-tRNA能识别的选择者密码子。

在某些实施方式中，本发明的宿主细胞是哺乳动物细胞(如啮齿动物细胞或灵长动物细胞)，所述细胞含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、非天然氨基酸和含有编码感兴趣多肽的多核苷酸的核酸，其中所述多核苷酸含有该O-tRNA能识别的选择者密码子。在本发明的某些实施方式中，所述O-RS优先用所述非天然氨基酸氨酰化所述O-tRNA，其效率高于该O-RS氨酰化任何内源性tRNA的效率。

在本发明的某些实施方式中，本发明的O-tRNA含有本文序列表(例如，SEQ ID NO：3)或实施例中所示的多核苷酸序列或其互补多核苷酸序列，或由这些序列编码。在本发明的某些实施方式中，O-RS含有序列表中所示氨基酸序列或其保守变体。在一个实施方式中，O-RS或其部分由编码本文序列表和实施例所示氨基酸序列的多核苷酸序列或其互补的多核苷酸序列编码。

本发明的O-tRNA和/或O-RS可衍生自各种生物(如真核和/或非真核生物)。

多核苷酸也是本发明的特征。本发明的多核苷酸(例如，SEQ IDNO：8-56)包括人工的(如人造的和非天然产生的)多核苷酸，所述多核苷酸序列含有编码本文序列表所示多肽的核苷酸序列，和/或与该多核苷酸序列互补。本发明的多核苷酸还可包括在高度严谨条件下能与上述多核苷酸在基本全长的核酸上杂交的核酸。本发明的多核苷酸还包括与天然tRNA或相应编码核酸的序列具有，例如至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性的多核苷酸(但是本发明的多核苷酸不是天然tRNA或相应的编码核酸)，所述tRNA识别选择者密码子，如四碱基密码子。与上述任何多核苷酸序列和/或含上述任何序列的保守变体的多核苷酸有，例如至少80％、至少90％、至少95％、至少98％或更高相同性的人工多核苷酸也包括在本发明的多核苷酸内。

含本发明多核苷酸的载体也是本发明的特征。例如，本发明的载体可以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明载体的细胞也是本发明的特征。

O-tRNA/O-RS配对组分的制备方法也是本发明的特征。用这些方法制备的组分也是本发明的特征。例如，产生至少一种与细胞正交的tRNA(O-tRNA)的方法包括制备突变体tRNA文库；使突变体tRNA文库中各成员的反密码子环突变使得其能识别选择者密码子，藉此提供潜在的O-tRNA文库，并对第一物种的第一细胞群进行负选择，所述细胞含有潜在O-tRNA文库的成员。负选择可去除含潜在O-tRNA文库成员的细胞，该潜在O-tRNA可被细胞的内源性氨酰-tRNA合成酶(RS)氨酰化。由此提供与第一物种的细胞正交的tRNA库，从而至少提供一种O-tRNA。还提供用本发明方法产生的O-tRNA。

在某些实施方式中，这些方法还包括正选择第一物种的第二细胞群，其中所述细胞含有与第一物种的细胞正交的tRNA库的成员、关联氨酰-tRNA合成酶和阳性选择标记。采用正选择可选择或筛选出含有能被关联氨酰-tRNA合成酶氨酰化而且在阳性选择标记存在下可显示所需反应的tRNA库成员的那些细胞，藉此提供O-tRNA。在某些实施方式中，第二细胞群含有未被负选择去除的细胞。

还提供能用非天然氨基酸加载O-tRNA的正交-氨酰-tRNA合成酶的鉴定方法。例如，该方法包括对第一物种的细胞群进行筛选，其中所述细胞各自含有：1)多种氨酰-tRNA合成酶(RS)的成员(例如，所述多种RS可包括突变型RS、衍生自第一物种以外的物种的RS、或者突变型RS和衍生自第一物种以外的物种的RS二者)；2)正交-tRNA(O-tRNA)(如衍生自一个或多个物种)；和3)编码阳性选择标记并且包含至少一个选择者密码子的多核苷酸。

选择或筛选与不含所述多种RS的成员或所含成员数目较少的细胞相比细胞(如宿主细胞)中显示抑制效率提高的那些细胞。这些选择/筛选的细胞含有能氨酰化O-tRNA的活性RS。用这些方法鉴定到的正交氨酰-tRNA合成酶也是本发明的特征。

在宿主细胞(例如哺乳动物，如啮齿动物细胞或灵长动物细胞等)内产生在所选位置含有非天然氨基酸的蛋白质的方法也是本发明的特征。例如，一种方法包括在适当的培养基内培养细胞，其中所述细胞含有核酸，而该核酸含有至少一个选择者密码子并编码一种蛋白，从而提供非天然氨基酸并在含所述至少一个选择者密码子的核酸的翻译过程中将该非天然氨基酸掺入该蛋白质的特定位置，从而产生该蛋白质。细胞还含有：在细胞内起作用并识别选择者密码子的正交-tRNA(O-tRNA)；以及优先用非天然氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。用这种方法产生的蛋白质也是本发明的特征。

本发明还提供含有蛋白质的组合物，其中所述蛋白质包含非天然氨基酸。在某些实施方式中，蛋白质包含的氨基酸序列与已知蛋白，如治疗蛋白、诊断蛋白和工业用酶或其一部分的氨基酸序列有至少75％相同性。组合物任选包含药学上可接受的载体。

核酸和多肽序列及变体

如本文所述，本发明提供编码例如O-tRNA和O-RS的多核苷酸序列，多肽氨基酸序列，例如O-RS，以及例如包含所述多核苷酸或多肽序列的组合物、系统和方法。本文披露了所述序列的例子，如O-tRNA和O-RS的氨基酸和核苷酸序列(见图16，例如SEQ ID NO：3和8-101)。然而，本领域技术人员应知道本发明并不限于本文，例如实施例和序列表中披露的那些序列。本领域技术人员应知道本发明还提供具有本文所述功能的许多相关序列，例如编码本文所披露O-RS的保守变体的多核苷酸和多肽。

本领域已知构建和分析能够在酵母宿主系统中用非天然氨基酸氨酰化O-tRNA的正交合成酶物质(O-RS)的通用方法。

本发明提供多肽(O-RS)和多核苷酸，如O-tRNA、编码O-RS或其诸部分的多核苷酸，用于分离氨酰-tRNA合成酶克隆的寡核苷酸等。本发明的多核苷酸包括编码本发明的感兴趣蛋白或多肽并含有一个或多个选择者密码子的那些多核苷酸。另外，本发明多核苷酸包括，例如含有选自SEQ IDNO：8-56的核苷酸序列的多核苷酸；与其多核苷酸序列互补或编码其多核苷酸序列的多核苷酸。本发明的多核苷酸还包括编码选自SEQ ID NO：57-101的O-RS氨基酸序列的任何多核苷酸。类似地，在高严谨条件下，可与上述多核苷酸在基本全长的核酸上杂交(并且不是天然多核苷酸序列)的人工核酸也是本发明多核苷酸。在一个实施方式中，组合物包含本发明的多肽和赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明还提供可与本发明多肽发生特异性免疫反应的抗体或抗血清。人工多核苷酸是人造而不是天然产生的多核苷酸。

本发明的多核苷酸还包括人工多核苷酸，即与天然tRNA具有如至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性(但不是天然tRNA)。多核苷酸还包括与天然tRNA具有如至少75％、至少80％、至少90％、至少95％、至少98％或更高相同性(但不是100％相同)的人工多核苷酸。

在某些实施方式中，载体(如质粒、粘粒、噬菌体、病毒等)含有本发明的多核苷酸。在一个实施方式中，所述载体是表达载体。在另一个实施方式中，所述表达载体包含与本发明的一种或多种多核苷酸操作性相连的启动子。在另一个实施方式中，细胞包含含有本发明多核苷酸的载体。

本领域技术人员还知道本发明包括所披露序列的多种变体。例如，产生功能相同序列的所披露序列的保守变体也属于本发明。核酸多核苷酸序列的变体也属于本发明，所述变体与至少一种所披露序列杂交。本文披露序列的独特亚序列，例如可通过标准序列比较技术测定的独特亚序列也属于本发明。

保守性变异

由于遗传密码的简并性，“沉默取代”(即，核酸序列中的取代不导致所编码多肽改变)是编码氨基酸序列的每条核酸序列所隐含的特征。类似地，也不难鉴定氨基酸序列中有一个或少数氨基酸被具有高度相似特性的不同氨基酸取代的“保守性氨基酸取代”，因为它与披露的构建物高度相似。披露的各序列的这种保守性变异是本发明的特征之一。

具体核酸序列的“保守性变异”指编码相同或基本相同的氨基酸序列的那些核酸，或者，如果核酸不编码氨基酸序列，则指基本上相同的序列。技术人员知道改变、加入或删除所编码序列中一个氨基酸或少部分氨基酸(一般低于5％、更常见低于4％、2％或1％)的各种取代、缺失或插入是“保守性修饰变异”，这些改变导致氨基酸的缺失、插入或被化学性质相似的氨基酸所取代。因此，本发明所列举多肽序列的“保守性变异”包括用同一保守性取代组的氨基酸取代该多肽序列的少部分(通常低于5％，更常见是低于2％或1％)的氨基酸。最后，加入不改变某核酸分子所编码活性的序列(例如加入无功能序列)是基础核酸的保守性变异。

本领域熟知提供功能类似的氨基酸的保守性取代表，其中一个氨基酸残基被另一个具有相似化学特性(例如芳族侧链或带正电荷的侧链)的氨基酸残基取代，因此基本上不改变该多肽分子的功能特性。以下例举多组化学特性相似的天然氨基酸，其中，各组内的取代即“保守性取代”。

保守性氨基酸取代

非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链
非极性和/或脂族侧链	极性，不带电荷的侧链	芳族侧链	带正电荷的侧链	带负电荷的侧链	甘氨酸丙氨酸缬氨酸亮氨酸异亮氨酸脯氨酸	丝氨酸苏氨酸半胱氨酸甲硫氨酸精氨酸谷氨酰胺	苯丙氨酸酪氨酸色氨酸	赖氨酸精氨酸组氨酸	天冬氨酸谷氨酸

核酸杂交

可采用比较杂交来鉴定本发明的核酸，包括本发明核酸的保守性变体，该比较杂交方法是区别本发明核酸的优选方法。此外，在高度、超高度和超超高度严谨性条件下能与SEQ ID NO：8-56所示核酸杂交的靶核酸是本发明的特征。这种核酸的例子包括与某给定的核酸序列相比，含有一个或少许沉默或保守性核酸取代的核酸。

当测试核酸与探针的杂交程度是与完美匹配的互补靶标杂交程度的至少50％，即信噪比至少是该探针与靶标在完美匹配的探针与完美匹配的互补靶标结合的条件下杂交的信噪比的一半高时，可称该测试核酸与探针核酸特异性杂交；此条件下，完美匹配的探针与完美匹配的互补靶核酸结合的信噪比至少是与任何不匹配靶核酸杂交所观察到的信噪比的约5-10倍。

当核酸结合(一般在溶液中)时，称其“杂交”。核酸因各种已充分表征的理化力，例如氢键、溶剂排斥、碱基堆积等而杂交。核酸杂交的广泛指南见Tijssen，(1993)，Laboratory Techniques in Biochemistry and MolecularBiology--Hybridization with Nucleic Acid Probes(生物化学与分子生物学的实验室技术——核酸探针杂交)，第一部分第二章，“Overview ofprinciplesof hybridization and the strategy of nucleic acid probe assays(杂交原理概述与核酸探针试验方法)”，(艾尔赛弗公司(Elsevier)，纽约)；以及Current Protocolsin Molecular Biology(最新分子生物学方法)，Ausubel等编，“CurrentProtocols”(最新方法)，格林出版合伙公司(Greene Publishing Associates，Inc.)和约翰威立父子公司(John Wiley & Sons)的合资企业，(2004年增补)；Hames和Higgins，(1995)，Gene Probes 1(基因探针1)和Gene Probes 2(基因探针2)，IRL出版社，牛津大学出版社，牛津，英格兰，它们提供了合成、标记、检测和定量测定DNA及RNA，包括寡核苷酸的细节。

在Southern或northern印迹滤膜上具有100个以上互补残基的互补核酸杂交的严谨性杂交条件的例子是：含1mg肝素的50％福尔马林，42℃杂交过夜。严谨性洗涤条件的例子是65℃，用0.2×SSC洗涤15分钟(SSC缓冲液的描述可参见Sambrook等；Molecular Cloning-A LaboratoryManual(分子克隆-实验室手册)，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001)。通常先进行低严谨性洗涤除去背景探针信号，再进行高严谨性洗涤。示例性低严谨性洗涤是40℃，用2×SSC洗涤15分钟。具体杂交试验中信噪比是无关探针观察到的信噪比的5倍(或更高)通常表示检测到特异性杂交。

核酸杂交实验(例如，Southern和northern杂交)的“严谨性杂交洗涤条件”取决于序列，并随不同的环境参数而不同。核酸杂交的广泛指南见Tijssen，(1993)，生物化学与分子生物学的实验室技术——核酸探针杂交，第一部分第二章，“杂交原理概述与核酸探针试验方法”，(艾尔赛弗公司，纽约)；Hames和Higgins，(1995)，基因探针1，IRL出版社，牛津大学出版社，牛津，英格兰，和Hames和Higgins，(1995)，基因探针2，IRL出版社，牛津大学出版社，牛津，英格兰。不难凭经验确定适合任何测试核酸的严谨性杂交和洗涤条件。例如，在确定严谨性杂交和洗涤条件时，可逐渐提升杂交和洗涤条件(例如，通过升高杂交或洗涤的温度、降低杂交或洗涤中的盐浓度、增加杂交或洗涤中的洗涤剂浓度和/或增加杂交或洗涤中的有机溶剂如福尔马林的浓度)直至符合选定的标准。例如，在高度严谨性杂交和洗涤条件中，逐渐提升杂交和洗涤条件直至探针与完美匹配的互补靶标结合的信噪比至少是该探针与不匹配靶标杂交所观察到的信噪比的5倍。

选择的“非常严谨”的条件等于具体探针的热解链温度(T_m)。T_m是50％的测试序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH下)。为本发明的目的，“高度严谨”的杂交和洗涤条件一般选择为在规定的离子强度和pH下比具体序列的T_m约低5℃。

“超高严谨”的杂交和洗涤条件指，增加杂交和洗涤条件的严谨性直至探针与完美匹配的互补靶核酸结合的信噪比至少是任何不匹配靶核酸杂交时观察到的信噪比的10倍。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超高严谨性条件下与探针结合。

类似地，可通过逐渐提升相关杂交试验的杂交和/或洗涤条件来确定甚至更高的严谨性水平。例如，提升杂交和洗涤的条件的严谨性直至探针与完美匹配的互补靶核酸结合的信噪比至少是任何不匹配靶核酸杂交信噪比的10、20、50、100或500倍或更高。靶核酸在这种条件下与探针杂交的信噪比至少是完美匹配的互补靶核酸的1/2时，可称其在超超高度严谨性条件下与探针结合。

如果在严谨性条件下彼此不杂交的核酸所编码的多肽基本相同，则这些核酸仍基本相同。例如，当利用遗传密码所允许的最大密码简并性产生核酸的拷贝时会发生这种情况。

独特亚序列

在一些方面，本发明提供含有选自本文披露的O-tRNA和O-RS序列的核酸中独特亚序列的核酸。与对应于任何已知O-tRNA或O-RS核酸序列的核酸相比，所述独特亚序列是独特的。可采用，例如设置默认参数的BLAST进行核酸比对。任何独特亚序列可用作，例如探针来鉴定本发明核酸或相关核酸。

类似地，本发明包括含有选自本文披露的O-RS序列的多肽中独特亚序列的多肽。与对应于任何已知多肽序列的多肽相比，本文的独特亚序列是独特的。

本发明还提供能在严谨性条件下与独特的编码寡核苷酸杂交的靶核酸，所述寡核苷酸编码选自O-RS序列的多肽中的独特亚序列，其中与对应于任何对照多肽(例如，通过突变获得本发明合成酶的亲代序列)的多肽相比，所述独特亚序列是独特的。可如上所述测定独特序列。

序列比较、相同性和同源性

对于两个或多个核酸或多肽序列，术语“相同的”或“相同性百分比”指当用下文所述序列比较算法(或技术人员可用的其它算法)或通过目测观察来比较和比对最大相应性时，这两个或多个序列或亚序列相同，或者有特定百分比的氨基酸残基或核苷酸相同。

对于两个核酸或多肽(例如，编码O-tRNA或O-RS的DNA，或O-RS的氨基酸序列)，术语“基本相同”指当利用序列比较算法或通过目测观察来比较和比对最大相应性时，两个或多个序列或亚序列至少有约60％、约80％、约90-95％、约98％、约99％或更多的核苷酸或氨基酸残基相同。这种“基本相同”的序列通常认为是“同源的”，而不论实际祖先。优选在至少长约50个残基的序列区域，更优选在至少约100个残基的区域存在“基本相同性”，待比较两条序列最好在至少约150个残基或者在全长上基本相同。

当蛋白质和/或蛋白质序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列时，它们是“同源的”。类似地，当核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列时，它们是“同源的”。例如，可通过任何可用的诱变方法来修饰任何天然核酸使之含有一个或多个选择者密码子。当该诱变的核酸表达时，它编码的多肽含有一个或多个非天然氨基酸。当然，该突变方法还可改变一个或多个标准密码子，从而也改变了所得突变型蛋白质中的一个或多个标准氨基酸。通常可从两种或多种核酸或蛋白质(或其序列)间的序列相似性推断同源性。可用于确认同源性的序列间精确的相似性百分比因所研究的核酸与蛋白质而有所不同，但常规利用低至25％的序列相似性来确认同源性。还可用更高水平的序列相似性，例如30％、40％、50％、60％、70％、80％、90％、95％或99％或更高来确认同源性。本文描述了测定序列相似性百分比的方法(例如，采用参数默认的BLASTP和BLASTN)，这些方法众所周知。

对于序列比较和同源性测定，通常将一条序列用作参比序列与测试序列相比较。当采用序列比较算法时，将测试序列与参比序列输入计算机，如果需要可指定亚序列坐标，并指定序列算法程序参数。然后根据所指定的程序参数，序列比较算法可计算测试序列相比于参比序列的序列相同性百分比。

可用以下方法进行比较序列的最佳比对，例如Smith和Waterman的局部同源性算法，Adv.Appl.Math.，2：482，(1981)；Needleman和Wunsch的同源性比对算法，J.，Mol.Biol.，48：443，(1970)；Pearson和Lipman的相似性检索方法，Proc.Nat’l.Acad.Sci.USA，85：2444，(1988)；计算机执行这些算法(威斯康星遗传软件包中的GAP，BESTFIT，FASTA和TFASTA，遗传学计算机组(Genetics Computer Group)，575 Science Dr.，麦迪逊，威斯康星州)；或者目测观察(一般可参见Current Protocols in MolecularBiology(最新分子生物学方法)，Ausubel等编，“Current Protocols(最新方法)”，格林出版合伙公司和约翰威立父子公司的合资企业，2006年增补)。

适用于测定序列相同性和序列相似性百分比的算法的一个例子是Altschul等，J.Mol.Biol.，215：403-410，(1990)所述的BLAST算法。进行BLAST分析的软件由国家生物技术信息中心对公众开放。该算法包括：首先通过在查询序列中鉴定长为W的短字串来鉴定高评分序列配对(HSP)，这些字串与数据库序列中相同长度的字串比对时符合或满足某些正值阈值评分T。T称为邻近字串评分阈值(Altschul等，J.Mol.Biol.，215：403-410(1990))。这些原始邻近字串选中(hit)作为启动检索的种子来找寻含有它们的较长HSP。然后使这些字串选中沿着各条序列双向延伸，以致累积比对评分增加。对于核苷酸序列，用参数M(一对匹配残基的奖励评分；恒大于0)和N(错配残基的罚分；恒小于0)计算累积评分。对于氨基酸序列，则用评分矩阵来计算累积评分。当出现以下情况时终止各方向的字串选中延伸：累积比对评分从其达到的最高值下降X；因一个或多个负评分残基比对的累积导致累积评分降至0或0以下；或者到达各序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程序(用于核苷酸序列)默认11为字长(W)、10为期望值(E)、100为截断值、M＝5、N＝-4，并进行双链比较。对于氨基酸序列，BLAST程序默认3为字长(W)、10为期望值(E)并采用BLOSUM62评分矩阵(参见Henikoff和Henikoff，(1989)，Proc.Natl.Acad.Sci.USA，89：10915)。

除了计算序列相同性百分比外，BLAST算法也可对两条序列间的相似性进行统计学分析(参见，例如Karlin和Altschul，Proc.Nat’l.Acad.Sci.USA，90：5873-5787，(1993))。BLAST算法提供的相似性量度之一是最小总概率(P(N))，其指示两条核苷酸或氨基酸序列之间发生随机匹配的概率。例如，如果在测试核酸与参比核酸的比较中最小总概率小于约0.1，更优选小于约0.01，最优选小于约0.001，则可认为该核酸与参比核酸相似。

诱变与其它分子生物学技术

可采用分子生物学技术操作本发明的和用于本发明的多核苷酸和多肽。描述分子生物学的通用教材包括Berger和Kimmel，Guide to MolecularCloning Techniques(分子克隆技术指南)，Methods in Enzymology(酶学方法)，第152卷，学术出版社公司(Academic Press，Inc.)，圣迭戈，加利福尼亚州；Sambrook等，Molecular Cloning-A Laboratory Manual(分子克隆-实验室手册)，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001和CurrentProtocolsinMolecular Biology(最新分子生物学方法)，Ausubel等编；“Current Protocols in Molecular Biology(分子生物学最新方法)”，格林出版合伙公司和约翰威立父子公司的合资企业，(2006年增补)。这些教材描述了诱变、载体的应用、启动子和涉及，例如产生含有选择者密码子的基因从而产生含非天然氨基酸的蛋白质，正交tRNA、正交合成酶及其配对的许多其它相关课题。

本发明可采用各种类型的诱变，例如以使tRNA分子突变、产生tRNA文库、产生合成酶文库、插入编码感兴趣蛋白质或多肽中的非天然氨基酸的选择者密码子。它们包括但不限于：定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、利用含尿嘧啶的模板诱变、寡核苷酸指导的诱变、硫代磷酸酯修饰的DNA诱变、利用缺口双螺旋DNA的诱变等，或者是它们的任何组合。其它合适的方法包括点错配修复、利用修复缺陷宿主株的诱变、限制性选择和限制性纯化、缺失诱变、总基因合成诱变、双链断裂修复等。本发明也包括，例如涉及嵌合构建物的诱变。在一个实施方式中，可用天然分子或经改变或突变的天然分子的已知信息，例如序列，序列比较、物理特性、晶体结构等来指导诱变。

可利用本发明多核苷酸或含有本发明多核苷酸的构建物，例如本发明的载体(例如可以是克隆载体或表达载体)来遗传改造(例如转化、转导或转染)宿主细胞。例如，可将正交tRNA、正交tRNA合成酶和待衍生蛋白质的编码区操作性连接于可在所需宿主细胞中起作用的基因表达控制元件。典型的载体含有转录和翻译终止子、转录和翻译起始序列和用于调节具体靶核酸表达的启动子。这些载体可任选地包含遗传表达盒，所述表达盒含有至少一个独立的终止子序列，允许该表达盒在真核细胞或原核细胞或二者中复制的序列(例如，穿梭载体)，和适用于原核与真核系统的选择标记。载体适用于在原核细胞、真核细胞或优选二者中复制和/或整合。参见Giliman和Smith，Gene，8：81，(1979)；Roberts等，Nature，328：731，(1987)；Schneider等，Protein Expr.Purif.，6435：10，(1995)；Berger和Kimmel，分子克隆技术指南，酶学方法，第152卷，学术出版社公司，圣迭戈，加利福尼亚州；Sambrook等，分子克隆-实验室手册，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001；和最新分子生物学方法，Ausubel等编；最新方法，格林出版合伙公司和约翰威立父子公司的合资企业，(2006年增补)。例如，载体可以是质粒、细菌、病毒、裸多核苷酸或缀合的多核苷酸形式。可通过标准方法将载体导入细胞和/或微生物，所述方法包括电穿孔(From等，Proc.Natl.Acad.Sci.USA，82，5824，(1985))，病毒载体感染，利用在小珠或颗粒的基质内或其表面上含有核酸的小颗粒的高速弹丸穿透(Klein等，Nature，327：70-73(1987))等。

本领域技术人员广泛了解用于克隆的细菌和噬菌体，它们可由各种来源获得。参见例如美国典型培养物保藏中心(弗吉尼亚州玛纳萨斯(Manassas，VA)的ATCC)和ATCC出版的TheATCC Catalogue of Bacteria andBacteriophage(ATCC细菌和细菌噬菌体目录)，(1996)，Gherna等编。测序、克隆的其它基本方法和分子生物学的其它方面及基础理论思考也可参见Sambrook等，分子克隆-实验室手册，(第三版)，第1-3卷，冷泉港实验室，冷泉港，纽约，2001；最新分子生物学方法，Ausubel等编；最新方法，格林出版合伙公司和约翰威立父子公司的合资企业，(2006年增补)；和Watson等，(1992)，Recombinant DNA(重组DNA)，第二版，科学美国书籍公司(Scientific American Books)，纽约。此外，可以向各种商业来源定制或标准定购基本上任何核酸(和实际上任何标记的核酸，无论标准或非标准的)，例如得克萨斯州米德兰的米德兰检定试剂公司(Midland Certified ReagentCompany，Midland，TX)、加利福尼亚州雷蒙纳市的大美国基因公司(TheGreat American Gene Company，Ramona，CA)、伊利诺斯州芝加哥市的表达基因公司(ExpressGen Inc.)、加利福尼亚州阿拉米达市的操纵子技术公司(Operon Technologies Inc.)和许多其它公司。

可利用为例如筛选步骤、激活启动子或选择转化子的活性而作适当改进的常规营养培养基培养工程改造的宿主细胞。这些细胞任选培养成转基因生物。其它可用的参考文献，例如细胞分离和培养(例如，用于随后核酸分离)的文献包括：Freshney，(1994)，Culture of Animal Cells，a Manual ofBasic Technique(动物细胞培养，基本技术手册)，第三版，威立利斯公司(Wiley-Liss)，纽约及其所引用的参考文献；Payne等，(1992)，Plant Cell andTissue Culture in Liquid Systems(液体系统中的植物细胞与组织培养)，约翰威立父子公司，纽约，纽约州；Gamborg和Phillips编，(1995)，Plant Cell，Tissue and Organ Culture(植物细胞、组织和器官培养)；FundamentalMethods(基本方法)，Springer Lab Manual(斯普林格实验室手册)，S-V公司(Springer-Verlag)(伯林海德尔堡纽约)；Atlas和Parks编，The HandbookofMicrobiological Media(微生物培养基手册)，(1993)，CRC出版社(CRCPress)，伯克莱屯，佛罗里达州。

感兴趣的蛋白质与多肽

在细胞中产生在特定位置含非天然氨基酸的蛋白质的方法也是本发明特征之一。例如，一种方法包括用适当的培养基培养细胞，其中所述细胞包含含有至少一个选择者密码子并编码蛋白质的核酸；和提供非天然氨基酸；其中所述细胞还包含：在细胞内具有功能并识别选择者密码子的正交-tRNA(O-tRNA)；和优先用非天然氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。该方法所产生的蛋白质也是本发明特征之一。

在某些实施方式中，与表达系统中任何内源性tRNA相比，O-RS偏向于氨酰化关联的O-tRNA。当O-tRNA和O-RS以等摩尔浓度存在时，O-RS所加载的O-tRNA与内源性tRNA的相对比例大于1:1，优选至少约2:1，更优选5:1，更优选10:1，更优选20:1，更优选50:1，更优选75:1，更优选95:1，98:1，99:1，100:1，500:1，1,000:1，5,000:1或更高。

本发明还提供包含蛋白质的组合物，所述蛋白质含有非天然氨基酸。在某些实施方式中，所述蛋白质含有的氨基酸序列与治疗性蛋白、诊断性蛋白、工业用酶或其部分的序列至少有75％相同。

本发明的组合物和本发明方法制备的组合物任选处于细胞中。然后可将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中，从而将非天然氨基酸掺入蛋白质。2004年4月16日提交的，名为“EXPANDINGTHE EUKARYOTIC GENETIC CODE(扩展真核遗传密码)”的国际公布号WO2004/094593和名为“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS(非天然氨基酸的体内掺入)”的国际公布号WO2002/085923描述了该方法，这两篇文献以引用的方式纳入本文。例如，当O-tRNA/O-RS配对引入宿主，例如啮齿动物或灵长动物细胞时，该配对对选择者密码子起反应而将非天然氨基酸(如图1所示非天然氨基酸)在体内掺入蛋白质。加入系统的非天然氨基酸可以是合成氨基酸，例如可以外源性加入生长培养基的苯丙氨酸或酪氨酸衍生物。本发明的组合物任选为体外翻译系统，或体内系统。

本发明的细胞能大量合成包含非天然氨基酸的蛋白质。在一些方面，组合物任选包含，例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含非天然氨基酸的蛋白质，或者体内蛋白质产生方法所能达到的含量(本文提供重组蛋白质制备和纯化的细节)。在另一方面，组合物中包含在例如细胞裂解液、缓冲液、药学缓冲液或其它液体混悬液中(例如，体积为约1nL-约100L)的蛋白质浓度任选是，例如每升至少10微克蛋白质、每升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质或更高。在细胞中制备大量(例如，大于采用其它方法如体外翻译通常可能得到的量)包含至少一个非天然氨基酸的蛋白质是本发明特征之一。

可掺入非天然氨基酸来，例如改变蛋白质结构和/或功能，如改变大小、酸性、亲核性、氢键、疏水性、蛋白酶靶位的易接近性、对某部分的靶向(如用于蛋白阵列)、掺入标记物或反应基团等。含有非天然氨基酸的蛋白质的催化或物理特性可得到改善，甚至获得全新的催化或物理特性。例如，可通过将非天然氨基酸掺入蛋白质来任选改进以下特性：毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如血清半衰期)、与其它分子的反应能力(如共价或非共价的)等。包含含有至少一个非天然氨基酸的蛋白质的组合物可用作，例如新型治疗剂、诊断剂、催化酶、工业用酶、结合蛋白(如抗体)以及用于例如研究蛋白质结构和功能。参见例如Dougherty，(2000)，“Unnatural Amino Acids as Probes of ProteinStructure and Function(作为蛋白质结构和功能探针的非天然氨基酸”)，Current Opinion in Chemical Biology，4：645-652。

在本发明的一些方面，组合物包含至少一种含有至少一个，例如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或更多非天然氨基酸的蛋白质。所述非天然氨基酸可以相同或不同，例如蛋白质中可以在1、2、3、4、5、6、7、8、9或10个或更多不同的位点上含有1、2、3、4、5、6、7、8、9或10个或更多不同的非天然氨基酸。在另一方面，组合物包含蛋白质，该蛋白质中存在的至少一个(但不是全部)具体氨基酸是非天然氨基酸。对于给定的含多个非天然氨基酸的蛋白质，所述非天然氨基酸可以相同或不同(如蛋白质可包含两个或多个不同类型的非天然氨基酸，或者可包含两个相同的非天然氨基酸)。对于含两个以上非天然氨基酸的给定蛋白质，所述非天然氨基酸可以相同，不同，或是多个同一类型的非天然氨基酸与至少一个不同的非天然氨基酸的组合。

利用本文组合物和方法可制备基本上任何含非天然氨基酸的蛋白质(或其一部分)(与任何相应的编码核酸，例如含有一个或更多选择者密码子的核酸)。未试图鉴定成百上千的已知蛋白质，可修饰它们中的任一种使之含有一个或多个非天然氨基酸，例如通过改进任何可用的突变方法从而使相关翻译系统中包含一个或多个合适的选择者密码子。已知蛋白质的共有序列库包括GenBankEMBL、DDBJ和NCBI。通过检索互联网不难鉴定其它库。

这些蛋白质通常与任何可用的蛋白质(例如，治疗性蛋白、诊断性蛋白、工业用酶或其一部分等)有，例如至少60％、至少70％、至少75％、至少80％、至少90％、至少95％或至少99％或更高的相同性，同时这些蛋白质含有一个或多个非天然氨基酸。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的例子参见但不限于2004年4月16日提交的名为“Expanding the Eukaryotic Genetic Code(扩展真核生物遗传密码)”的国际公布号WO 2004/094593和名为“IN VIVO INCORPORATION OFUNNATURAL AMINO ACIDS.(非天然氨基酸的体内掺入”)的WO2002/085923。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的例子包括但不限于：例如蛭素、α-1抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolytic factor)、抗体(抗体的其它细节见下文)、载脂蛋白、脱辅蛋白、心房利钠因子、心房利钠多肽、心房肽(Atrial peptides)、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋白-1α、单核细胞炎性蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配体、C-kit配体、胱冬酶、胶原、集落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(如，上皮嗜中性活化肽-78(epithelial Neutrophil Activating Peptide-78)、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)、表皮生长因子(EGF)、促红细胞生成素(“EPO”)、剥落性毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、血纤蛋白原、纤连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、Hedgehog蛋白(如Sonic，Indian，Desert)、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如，IFN-α、IFN-β、IFN-γ)、白介素(如，IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质形成细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、萤光素酶、神经营养因子(Neurturin)、嗜中性白细胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲状腺激素、PD-ECSF、PDGF、肽激素(如，人生长激素)、多效营养因子、胱冬酶原-3、胱冬酶原-9、A蛋白、G蛋白、热源性外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、促生长素抑制剂、促生长素、链激酶、超抗原，即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克综合征毒素(TSST-1)、胸腺素α1、组织纤溶酶原激活物、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶和许多其它蛋白。

可采用本文所述能在体内掺入非天然氨基酸的组合物和方法制备的一类蛋白质包括转录调节剂或其一部分。示例性转录调节剂包括调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节剂存在于原核生物、病毒和真核生物(包括真菌、植物、酵母菌)、昆虫和动物(包括哺乳动物)中，从而提供了广泛的治疗靶点。应该理解表达和转录激活物通过许多机理调控转录，例如通过与受体结合、刺激信号转导级联反应、调控转录因子表达、与启动子和增强子结合、与结合启动子和增强子的蛋白质结合、DNA解链、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。

本发明的一类蛋白质(例如，含有一个或多个非天然氨基酸的蛋白质)包括生物学活性蛋白，例如蛭素、细胞因子、炎性分子、生长因子、它们的受体和癌基因产物，如白介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和透明素(hyalurin)/CD44；信号转导分子和相应的癌基因产物，例如Mos、Ras、Raf和Met；转录激活物和阻遏物，例如p53、Tat、Fos、Myc、Jun、Myb、Rel和类固醇激素受体，例如雌激素、孕酮、睾酮、醛甾酮的那些受体，LDL受体配体和皮质酮。

本发明也提供含有至少一个非天然氨基酸的酶(例如工业用酶)或其一部分。酶的例子包括但不限于：酰胺酶、氨基酸消旋酶、酰基转移酶、脱卤酶、双加氧酶、二芳基丙烷过氧化物酶(diarylpropane peroxidases)、差向异构酶、环氧化物水解酶、酯酶、异构酶、激酶、葡糖异构酶、糖苷酶、糖基转移酶、卤素过氧化物酶(haloperoxidases)、单加氧酶(例如p450)、脂酶、木质素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、转氨酶和核酶。

许多这些蛋白质可商品化购得(参见，例如西格玛生物科学公司(SigmaBioSciences))，相应的蛋白质序列和基因及其许多变体通常是熟知的(参见，例如Genbank)。可根据本发明通过插入一个或多个非天然氨基酸来修饰任何这些蛋白，从而(例如)改变这些蛋白质一种或多种感兴趣的治疗、诊断或酶活性。治疗相关特性包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(例如，通过在非天然氨基酸中加入报道基团(如标记物或标记结合位点))、LD₅₀或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性的例子包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶特性的例子包括保存半衰期、稳定性、酶活性、生产能力等。

也可采用本发明方法和组合物修饰各种其它蛋白质使之包含一个或多个非天然氨基酸。例如，本发明可包括用非天然氨基酸取代一种或多种疫苗蛋白质中的一个或多个天然氨基酸，例如以下来源的蛋白质：感染性真菌，如曲霉(Aspergillus)、假丝酵母(Candida)种；细菌，特别是用作病原性细菌模型的大肠杆菌，以及医学上重要的细菌，如葡萄球菌属(Staphylococci)(如，金黄色葡萄球菌)或链球菌属(Streptococci)(如，肺炎链球菌)；原生动物，如孢子纲(如，疟原虫(Plasmodia))、根足虫(rhizopods)(如，内变形虫(Entamoeba))和鞭毛虫类(锥虫(Trypanosoma)、利什曼原虫(Leishmania)、毛滴虫(Trichomonas)、贾第虫(Giardia)等)；病毒，如(+)RNA病毒(例子包括痘病毒，如痘苗病毒(vaccinia)；小RNA病毒，如脊髓灰质炎病毒(polio)；披膜病毒，如风疹病毒(rubella)；黄病毒(Flaviviruses)，如HCV；和冠状病毒)、(-)RNA病毒(如棒状病毒(Rhabdovirus)，如VSV；副粘病毒，如RSV；正粘病毒，如流感病毒；布尼亚病毒和嵌沙样病毒)、dsDNA病毒(如呼肠孤病毒)、RNA到DNA的病毒，即逆转录病毒，如HIV和HTLV和某些DNA到RNA的病毒，如乙肝病毒。

农业相关的蛋白也是非天然氨基酸修饰的合适靶位，例如抗虫蛋白(如Cry蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生长酶(如核酮糖1，5-二磷酸羧化酶/加氧酶，“RUBISCO”)、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。

在某些实施方式中，本发明方法和/或组合物中的感兴趣多肽或蛋白质(或其一部分)由核酸编码。所述核酸通常含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、十个或更多个选择者密码子。

可采用本领域技术人员熟知和本文在“诱变与其它分子生物学技术”中所述的方法诱变编码感兴趣蛋白质或多肽的基因，从而使之含有(例如)一个或多个选择者密码子来掺入非天然氨基酸。例如，可诱变感兴趣蛋白质的核酸，使之含有一个或多个选择者密码子以插入一个或多个非天然氨基酸。本发明包括任何蛋白质的这种变体(例如突变体)形式，例如含有至少一个非天然氨基酸。类似地，本发明也包括相应的核酸，即具有编码一个或多个非天然氨基酸的一个或多个选择者密码子的任何核酸。

为制备含有非天然氨基酸的蛋白质，可利用适合通过正交tRNA/RS配对在体内掺入非天然氨基酸的宿主细胞和生物。可用表达正交tRNA、正交tRNA合成酶的一个或多个载体和编码待衍生蛋白质的载体来遗传改造(例如转化、转导或转染)宿主细胞。各组分可以位于同一载体或各自位于不同载体，或者可以两个组分位于一个载体而第三组分位于第二载体。载体可以是例如质粒、细菌、病毒、裸多核苷酸或偶联多核苷酸的形式。

通过免疫反应性测定多肽

因为本发明多肽提供了各种新的多肽序列(例如，以在本文翻译系统中合成的蛋白质为例，多肽含有非天然氨基酸；或者，以新的合成酶为例，则是标准氨基酸的新序列)，这些多肽也提供了可在例如免疫测定中识别的新结构特征。产生能与本发明多肽特异性结合的抗血清以及能与这种血清结合的多肽是本发明的特征之一。本文所用的术语“抗体”包括但不限于：基本上由一个或多个免疫球蛋白基因编码的多肽，或其能特异性结合并识别分析物(抗原)的片段。例子包括多克隆、单克隆、嵌合型和单链抗体等。本文所用的术语“抗体”也包括免疫球蛋白片段，包括Fab片段和由表达文库(包括噬菌体展示文库)产生的片段。抗体的结构与术语可参见，例如Paul，Fundamental Immunology(基础免疫学)，第四版，1999，雷文出版社(Raven Press)，纽约。

为产生用于免疫测定的抗血清，可如本文所述产生并纯化一种或多种免疫原性多肽。例如，可在重组细胞中产生重组蛋白。采用标准小鼠免疫方案(关于用于测定特异性免疫反应性的抗体产生、免疫测定形式和条件的标准说明可参见，例如Harlow和Lane，(1988)，Antibodies，ALaboratory Manual(抗体，实验室手册)，冷泉港出版社，纽约)，用免疫原性蛋白和标准佐剂(如弗氏佐剂)免疫小鼠的近交品系(此类小鼠因其实际遗传相同性使得实验结果重现性较高而用于测定)。蛋白质、抗体、抗血清等的其它细节可见名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传密码)”的国际公布号WO 2004/094593；名为“IN VIVO INCORPORATIONOF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”的WO2002/085923；名为“GLYCOPROTEIN SYNTHESIS(糖蛋白合成)”的WO2004/035605和名为“PROTEIN ARRAYS(蛋白质阵列)”的WO2004/058946。

O-tRNA和O-RS以及O-tRNA/O-RS配对的应用

本发明的组合物和用本发明方法制备的组合物任选存在于细胞内。然后可将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中，从而将非天然氨基酸掺入蛋白质。Schultz等人的名为“非天然氨基酸的体内掺入”的国际公布号WO 2002/085923描述了该方法，该篇文献以引用的方式纳入本文。例如，当O-tRNA/O-RS配对引入宿主，例如大肠杆菌细胞或酵母时，该配对对选择者密码子，例如琥珀无义密码子起反应而将可外源性加入生长培养基的非天然氨基酸在体内掺入蛋白质，例如肌红蛋白测试蛋白或治疗蛋白中。本发明的组合物可以任选处于体外翻译系统，或细胞体内系统中。含非天然氨基酸的蛋白质的应用范围广泛。例如掺入蛋白质的非天然部分可作为广泛修饰的靶标，如与其它蛋白质、与小分子如标记物或染料和/或生物分子交联。通过这些修饰，掺入非天然氨基酸可产生改进的治疗蛋白，可用于改变或提高酶的催化功能。在一些方面，蛋白质中掺入非天然氨基酸和随后进行修饰有助于研究蛋白质的结构、与其它蛋白质的相互作用，等等。

试剂盒

试剂盒也是本发明特征之一。例如，提供用于在啮齿动物或灵长动物细胞中产生含至少一个非天然氨基酸的蛋白质的试剂盒，所述试剂盒中装有至少一个容器，而该容器含有编码O-tRNA的多核苷酸序列和/或编码O-RS的多核苷酸序列、和/或O-RS多肽。在一个实施方式中，所述试剂盒还包含非天然氨基酸。在另一实施方式中，所述试剂盒还包含制备含有非天然氨基酸的蛋白质的使用说明材料。

实施例

提供以下实施例只是为了说明，并非要限制本发明。技术人员应该知道可以改变各种非关键性参数而不会脱离本发明的范围。应该知道，本文所述的实施例和实施方式只是为说明目的，本领域技术人员借鉴这些实施例和实施方式可以作出各种改进或改变而仍属于本申请的构思和权限以及随附权利要求书的范围内。

实施例1

用非哺乳动物翻译组件进行无义抑制的技术限制

在哺乳动物细胞中遗传编码非天然氨基酸的一种策略是使现有的大肠杆菌或酿酒酵母宿主系统中生成的突变tRNA/aaRS对适应(哺乳动物细胞)。因为大肠杆菌的tRNA^Tyr鉴别元件，包括可变臂和接纳茎中G1:C72碱基对，与哺乳动物细胞不同(Wang和Schultz“扩展遗传密码”(Expanding the Genetic Code)Angewandte Chemie Int.Ed.，44(1)：34-66(2005)；以及Bonnefond等(2005)，“tRNA(Tyr)/TyrRS氨酰化系统的演化”(Evolution of the tRNA(Tyr)/TyrRSaminoacylation systems)Biochimie 87：873-883)，不幸的是，细菌中使用的tRNA/aaRS对不大可能在真核细胞中正交。相反，酿酒酵母和哺乳动物细胞中的tRNA经相似处理并具有同样的鉴别元件(Bonnefond等(2005)，“tRNA(Tyr)/TyrRS氨酰化系统的演化”(Evolution of the tRNA(Tyr)/TyrRSaminoacylation systems)Biochimie 87：873-883)。此外，因为酿酒酵母的翻译机器也与高等真核生物同源，因此可能将酵母中演化的经修饰的正交tRNA/aaRS对转移到哺乳动物细胞中。事实上，Yokoyama及其同事在CHO细胞中使用酵母中演化的EcTyrRS变体来接受对-苯甲酰-L-苯丙氨酸(pBpa)，将该光反应性氨基酸掺入到人Grb2蛋白中(Hino等(2005)，“哺乳动物细胞中通过定点掺入光反应性氨基酸进行蛋白光交联”(Protein photo-cross-linking in mammaliancells by site-specific incorporation of a photoreactive amino acid，＂Nat Methods2，201-206)。不幸的是，具有功能活性的大肠杆菌

不能在哺乳动物细胞中很好地表达，严重限制了突变蛋白的产率(Sakamoto等(2002)，“在哺乳动物细胞中将非天然氨基酸定点掺入蛋白质中”(Site-specific incorporation of anunnatural amino acid into proteins in mammalian cells)Nucleic Acids Res 30：4692-4699)。

实施例2

在哺乳动物细胞中创建新的无义抑制系统

为了克服上述正交tRNA表达的局限性，本发明提供了一种常用方法允许将酵母中演化的突变抑制tRNA/aaRS对转移到哺乳动物细胞中使用。本文所展示的该方法以及新的正交系统在啮齿类CHO宿主细胞和灵长类(人)293T宿主细胞中将数种非天然氨基酸有效引入到绿色荧光蛋白中。尽管用这两种细胞进行实验，但本发明能够广泛应用于来自多种物种的哺乳动物宿主细胞中。

创建新的哺乳动物无义抑制系统

真核细胞中tRNA由RNA聚合酶III转录，该聚合酶识别两个保守的基因内部转录控制元件，即A和B盒(Sprague，《真核tRNA基因转录》(TranscriptionofEukaryotic tRNA Genes)，AMS出版社，华盛顿特区；1994)。大肠杆菌tRNA^Tyr仅具有B盒元件，研究表明引入假-A盒产生不能被EcTyrRS识别的无功能tRNA(Sakamoto等，“在哺乳动物中将非天然氨基酸定点掺入蛋白质中”(Site-specific incorporation of an unnatural amino acid into proteins in mammaliancells)Nucleic Acids Res 30：4692-4699(2002))。不同于大肠杆菌tRNA^Tyr，来自嗜热脂肪芽孢杆菌的tRNA^Tyr(其具有相似的鉴别元件并且仍可被EcTyrRS加载，Bedouelle，“酪氨酰-tRNA合成酶识别tRNA(Tyr)”(Recognition of tRNA(Tyr)by tyrosyl-tRNA synthetase)Biochimie 72，589-598(1990))具有天然产生的内部A和B盒。因此，该tRNA与EcTyrRS能够在哺乳动物细胞中行使正交tRNA/aaRS对的功能(Sakamoto等(2002)，“在哺乳动物中将非天然氨基酸定点掺入蛋白质中”(Site-specific incorporation of an unnatural amino acid intoproteins in mammalian cells)Nucleic Acids Res 30：4692-4699)。

构建并表达琥珀抑制子正交tRNA

为提供琥珀抑制子

，将BstRNA^Tyr三核苷反密码子改变为C(34)UA。因为原核tRNA^Tyr的G34仅为TyrRS的一个弱鉴别元件(Hou和Schimmel(1989)，“用体外动力学参数建模详述体内转移RNA种类”(Modelingwith invitro kinetic parameters for the elaboration of transfer RNA identity in vivo)Biochemistry 28：4942-4947)，所以G34C突变体应当不显著影响EcTyrRS与

的结合。此外，因为哺乳动物基因组TAG终止密码子的出现频率较低(智人的TAG，23％；TAA，30％；TGA，47％)，所以在哺乳动物细胞中无义琥珀抑制应当比蛋白石或赭石抑制更加耐受。因为真核生物中

基因的表达也依赖于5’侧接序列，所以将人tRNA^Tyr的5’侧接序列加到

上以增强其在哺乳动物中的转录。为进一步增加

的转录，构建了含三个串连重复的

基因的基因簇，将该基因簇插入到pUC18质粒中得到

对提取自

转染CHO细胞的总tRNA进行Northern印迹分析，显示

的水平是仅含单一拷贝

的pUC18质粒转染细胞的两倍。

正交合成酶的表达

下一步，将野生型EcTyrRS基因插入哺乳动物表达载体pcDNA4/TO/myc-His A中得到pcDNA4-EcTyrRS，其表达受到四环素(Tet)-调节的CMV启动子的控制。使用诱导型表达意在降低在哺乳动物细胞中异源表达EcTyrRS可能产生的毒性。

展示功能性

正交对

在哺乳动物细胞中检测所得抑制子

/EcTyrRS对有效抑制模型绿色荧光蛋白GFP(GFP37TAG)Y37位的琥珀密码子突变的能力。因为Y37位于GFP表面，并远离荧光团，因此预计在此位点引入非天然氨基酸不会影响蛋白的折叠和荧光属性(Ormo等(1996)，“水母(Aequorea victori)绿色荧光蛋白的晶体结构”(Crystal structure of the Aequorea victoria green fluorescent protein)Science 273：1392-1395)。并且GFP37TAG的琥珀抑制导致全长GFP表达，提供快速定量测定琥珀抑制效率的实验方法。将突变GFP37TAG基因插入pcDNA4/TO/myc-His A得到pcDNA4-GFP37TAG，其中GFP与myc和6×His表位在C末端融合，并处于Tet-调节的启动子的控制下。

在英杰^TM T-REx^TM啮齿类CHO和人293细胞中检测

/EcTyrRS对抑制GFP37TAG无义琥珀密码子的能力。两种细胞系均组成型表达四环素阻抑物并适合使用pcDNA4/TO/myc-His A质粒进行Tet-调节的蛋白表达。细胞生长至80-90％铺满(英杰^TM T-REx^TM CHO细胞生长于含10％FBS、1％青链霉素、2mM L-谷氨酰胺、10μg/ml杀稻瘟素的F12培养基中；英杰^TM T-REx^TM293细胞生长于含10％ FBS、1％青链霉素、2mML-谷氨酰胺和5μg/ml杀稻瘟素的DMEM中)，使用罗氏应用科学部(Roche Applied Science)的

进行瞬时转染，每2×10⁶个细胞使用3μg质粒(0.5μg

、0.5μgpcDNA4-EcTyrRS、2μg pcDNA4-GFP37TAG；当

或pcDNA4-EcTyrRS不存在时用等量pUC18替换)。转染6小时后加入1μg/ml四环素诱导蛋白质表达，细胞在37℃生长两天。在两种细胞系中，全长GFP的表达依赖于

和EcTyrRS基因的存在(参见图13A和13B)。当用pcDNA4-GFP37TAG和pcDNA4-EcTyrRS或单独

转染时，细胞不呈现绿色荧光。这些实验证明，仅EcTyrRS使

获得负载，并且/EcTyrRS对在灵长类细胞和啮齿类细胞中有效行使抑制无义琥珀密码子的功能。

实施例3

用6种非天然氨基酸证明系统的普遍性

验证该正交系统的一般性。在该测试系统中，检测了

和6种EcTyrRS变体在英杰^TM T-REx^TM CHO和293细胞系中将各种对应的非天然氨基酸掺入GFP37TAG的能力。6种EcTyrRS变体最初在酿酒酵母中演化并编码下列非天然氨基酸：

对-甲氧基-L-苯丙氨酸(pMpa)；

对-乙酰基-L-苯丙氨酸(pApa)；

对-苯甲酰-L-苯丙氨酸(pBpa)；

对-碘代-L-苯丙氨酸(pIpa)；

对-叠氮基-L-苯丙氨酸(pAzpa)；

对-炔丙基氧基苯丙氨酸(pPpa)

图1结构1-6显示了这些非天然氨基酸的结构。选择和分离这些合成酶变体的方法参见例如Chin等(2003)，“扩展的真核遗传密码”(An expandedeukaryotic genetic code)Science 301，964-967；Deiters等(2003)，“在酿酒酵母的遗传密码中加入新反应性的氨基酸”(Adding amino acids with novel reactivityto the genetic code of Saccharomyces cerevisiae)J Am Chem Soc125：11782-11783；Deiters等的2004年4月16日提交的WO 2005/003294“非天然反应性氨基酸遗传密码增加”(UNNATURAL REACTIVE AMINO ACIDGENETIC CODE ADDITIONS)；Deiters等的2005年9月21日提交的WO2006/034410“在遗传密码中加入光调节性氨基酸”(ADDINGPHOTOREGULATEDAMINO ACIDS TO THE GENETIC CODE)。

将6种EcTyrRS基因中的每一种插入到pcDNA4/TO/myc-His A中得到pcDNA4-EcTyrRS衍生物，Western印迹分析aaRS在T-REx^TM CHO和293细胞中的表达(图14)。所有6种EcTyrRS变体在T-REx^TM CHO和T-REx^TM293细胞中显示相似的表达水平。

然后在培养基中存在或不存在非天然氨基酸的条件下检测6种EcTyrRS变体和

一起抑制GFP37TAG中琥珀密码子的能力。如对野生型EcTyrRS所述用质粒瞬时转染细胞。转染6小时后，换用新鲜培养基，其中含1μg/ml四环素并补充相应的非天然氨基酸(pMpa，10mM；pApa，10mM；pBpa，1mM；pIpa，8mM；pAzpa，5mM；或pPpa，1mM)。T-REx^TM CHO细胞培养24小时，T-REx^TM 293细胞培养48小时，然后收获细胞。在T-REx^TM CHO和293细胞中，全长GFP37TAG的表达依赖于生长培养基中非天然氨基酸的存在，如图2和3所示。在缺少非天然氨基酸时，未检测到GFP表达(<1％)，表明EcTyrRS变体特异性、高保真地使

携带其关联非天然氨基酸。观察到T-REx^TM CHO细胞中含pIpa GFP表达水平低，而在T-REx^TM 293细胞中无含pIpa GFP表达，这也许是因为pIpa有细胞毒性(在8mM pIpa存在条件下，T-REx^TM 293细胞在6小时内死亡)。

实施例4

表达掺入对-甲氧基-L-苯丙氨酸的正交组件的改良质粒表达系统

因为异源表达对-甲氧基-L-苯丙氨酸-tRNA合成酶(pMpaRS)在所用生长条件下未显示出任何明显的细胞毒性，因此修饰含pMpaRS基因的质粒，以编码(a)3个串联重复的

基因，以及(b)pMpaRS基因(图4A中pSWAN-pMpaRS)。

在非调节CMV启动子后直接插入pMpaRS基因用于有效持续表达pMpaRS。构建另一质粒(图4B中pSWAN-GFP37TAG)，同时含有三个串联重复基因和GFP37TAG基因。在Tet-调节的CMV启动子后插入编码GFP37TAG的基因以最小化哺乳动物细胞内源性琥珀抑制引起的无义琥珀密码子通读的可能。然后检测这两个质粒的抑制效率。因为两个质粒均含有三个串联重复的基因，所以预计无法通过改变两种质粒的比例增加抑制水平来改变转染细胞的

基因的总量。在优化的转染条件下(每2×10⁶个细胞0.5μg pSWAN-pMpaRS和2.5μgpSWAN-GFP37TAG)，抑制水平大概是使用三个质粒

、pcDNA4-pMpaRS和pcDNA4-GFP37TAG的两倍(通过荧光细胞数测定抑制水平)。诱导后细胞生长1-2天，在收集前保持活力。对含pMpa的突变GFP(GFP-pMpa)的产量进行定量。在培养基中存在10mM pMpa时，可从2×10⁷个贴壁T-REx^TM CHO细胞中得到1μg突变GFP。

实施例5

质谱和保真度分析

为进一步鉴定GFP-pMpa，在用pSWAN-pMpaRS和pSWAN-GFP37TAG瞬时转染的T-REx^TM CHO细胞中表达突变蛋白。用抗-myc抗体琼脂糖柱纯化蛋白并用SDS-PAGE分离。用胰蛋白酶消化来自SDS-PAGE凝胶的GFP-pMpa条带并用纳米反相液相层析/质谱/质谱(纳米-RP LC/MS/MS)进行分析。平行的，从转染pcDNA4-GFP的细胞中纯化野生型GFP并进行相同分析。

含片段FSVSGEGEGDATY*GK(参见图5和SEQ ID NO：103，其中Y^*代表酪氨酸或pMpa)的突变蛋白的胰蛋白酶解Y37的串联质谱图揭示了强pMpa峰，表明有效的pMpa掺入(参见图6和图7)。与野生型GFP相比，含离子(y₃-y₁₄)的Y^*都发生14Da的质量漂移，这与酪氨酸和pMpa的质量差准确吻合。Y离子系列的质量漂移以及图7中观察到b13离子的相同质量漂移明确指示了pMpa的掺入位点是GFP的37位。

也获得了含pMpa肽和含酪氨酸肽的MS峰的比值。FSVSGEGEGDATY*GK(参见图5和SEQ ID NO：103)前体离子的单一离子色谱的积分表明pMpa掺入的高保真度(>99.9％)。根据监测串联质谱数据中3个最丰富的片段离子(y₉、y₁₁和y₁₂)作出的推测表明甚至更高的纯度(99.93％)。为了获取亲本蛋白的质量，将抗-myc抗体柱纯化的突变蛋白进行ESI TOF-MS分析。缺少N-末端甲硫氨酸的乙酰化突变蛋白的理论质量为29,696.00Da，这与图8中带电态解卷积ESI TOF-MS谱观察到的29,696.0Da的主要组分良好吻合。29,654.0Da的一个较小特征峰指定为缺少N-末端乙酰化的GFP-pMpa的质量。未检测到野生型GFP信号或表明掺入多个pMpa的信号。该结果进一步确认在GFP37位选择性掺入pMpa。

实施例6

用于表达掺入pApa、pBpa、pIpa、pAzpa和pPpa的正交组件的改良质粒表达系统

通过亚克隆编码不同合成酶变体的基因重新工程改造质粒，以提供其它pSWAN-EcTyrRS变体双质粒系统。这些合成酶变体为：

对-乙酰基-L-苯丙氨酸-tRNA合成酶(pApaRS)

对-苯甲酰-L-苯丙氨酸-tRNA合成酶(pBpaRS)

对-碘代-L-苯丙氨酸-tRNA合成酶(pIpaRS)

对-叠氮基-L-苯丙氨酸-tRNA合成酶(pAzpaRS)

对-炔丙基氧基-L-苯丙氨酸-tRNA合成酶(pPpaRS)

pSWAN-EcTyrRS变体和pSWAN-GFP37TAG(每2×10⁶个细胞0.5μgpSWAN-EcTyrRS变体和2.5μgpSWAN-GFP37TAG)瞬时转染T-REx^TM CHO和293细胞所提供的抑制水平均为三种质粒

pcDNA4-EcTyrRS变体和pcDNA4-GFP37TAG转染时的大约两倍(pIpa特异性变体除外)。也在pSWAN-EcTyrRS变体和pSWAN-GFP37TAG转染的T-REx^TMCHO细胞中表达含pApa、pBpa、pAzpa或pPpa的突变GFP，在含对应非天然氨基酸的培养基(pApa，10mM；pBpa，1mM；pAzpa，5mM或pPpa，1mM)中培养细胞1-2天，并用抗-myc抗体柱纯化。含pApa和pAzpa突变蛋白的产率与pMpa接近(每2×10⁷个细胞约1μg蛋白)，含pBpa和pPpa突变蛋白的产率较低(每2×10⁷个细胞0.7μg蛋白)。因为EcTyrRS变体在T-REx^TM CHO细胞中的表达水平相似，所以含pBpa和pPpa突变蛋白的产率较低也许是因为培养基中非天然氨基酸浓度较低。

同样利用纳米-RP LC/MS/MS分析突变GFP蛋白，获取胰蛋白酶解片段FSVSGEGEGDATY*GK(图5和SEQ ID NO：103)的串联质谱图。

串联质谱数据(图9-12)清楚显示在GFP37位掺入非天然氨基酸。仅可检测到微弱的含pAzpa的突变GFP。更仔细的分析数据揭示了存在含对-氨基苯丙氨酸的肽(图15)，考虑到叠氮基的化学反应性和光不稳定性这不足为奇(曾经从含pAzpa肽的质谱分析中观察到pAmpa；Chin等(2003)，“扩展的真核遗传密码进展”(Progress toward an expanded eukaryotic genetic code)Chem Biol 10，511-519)。鉴别出pBpa样品中痕量的野生型肽，但信号太弱无法准确计算pBpa/酪氨酸比值。在pApa、pAzpa和pPpa样品中未探测到野生型信号。来自所有5种突变蛋白的数据表明非天然氨基酸掺入的高选择性和保真度。

实施例7

讨论/结论

在哺乳动物基因组中，琥珀终止密码子的出现频率较高(人23％)，而大肠杆菌相比较低(7％)。因此，如果必需蛋白未被正确终止，琥珀抑制也许具有细胞毒性。Yokoyama和同事证明，使关联tRNA携带3-碘代-L-酪氨酸的突变EcTyrRS的诱导表达将可能的细胞毒性降到最低，这种毒性来自在缺少3-碘代-L-酪氨酸时突变aaRS造成的内源性酪氨酸背景掺入。本发明提供了该问题的解决方案。所有EcTyrRS变体都曾在酿酒酵母中由两步正向/负向选择方案演化，从而去除了掺入内源性氨基酸的aaRS变体。pSWAN-EcTyrRS变体和pSWAN-GFP37TAG共转染细胞后，在缺少非天然氨基酸的条件下观察不到GFP37TAG中无义琥珀密码子的通读，表明在缺少非天然氨基酸的条件下tRNA/aaRS对不足以有效抑制天然TAG终止密码子。因此在缺少非天然氨基酸的条件下稳定表达tRNA和aaRS蛋白的细胞系能够存活。因为未观察到内源性琥珀抑制，含非天然氨基酸的靶蛋白的表达也无须诱导。产生维持tRNA、aaRS和靶蛋白基因的稳定细胞系能够在补充非天然氨基酸时有效产生含非天然氨基酸的靶蛋白。在当前所述原理论证实验中，宿主哺乳动物细胞能够存活至加入非天然氨基酸3天后，这大概足够重组蛋白的表达。

这些实验已成功扩展到其它非天然氨基酸中，包括1，5-丹磺酰丙氨酸、邻-硝基苄基半胱氨酸和α-氨基辛酸。并不意味本发明仅限于本文所述细胞系或非天然氨基酸。

实施例8

哺乳动物细胞中的光调节性蛋白序列

在要求保护的翻译系统和方法的一些实施方式中，所述非天然氨基酸是光调节性氨基酸，如邻-硝基苄基丝氨酸、邻-硝基苄基半胱氨酸、α-氨基辛酸及其它。可使用光调节性氨基酸(如光致变色的、光切割的、光异构化的等)从空间和时间上控制许多生物学过程，如通过直接调节酶、受体、离子通道等的活性，或通过调节不同信号分子的细胞内浓度。参见，如Shigeri等，Pharmacol.Therapeut.，2001，91：85+；Curley等，Pharmacol.Therapeut.，1999，82：347+；Curley等，Curr.Op.Chem.Bio.，1999，3：84+；“笼蔽化合物”(Caged Compounds)《酶学方法》(Methods in Enzymology)，Marriott，G.编，科学出版社，纽约，1998，291卷；Adams等，Annu.Rev.Physiol.，1993，55：755+；以及Bochet等，J.Chem.Soc.，Perkin1，2002，125+。

为了提高源自大肠杆菌tRNALeu的琥珀抑制子tRNA的转录水平，将抑制子tRNA置于人起始子(initiator)tRNA^Met 5’-和3’-侧接序列的控制之下。在CHO细胞和人293T细胞中使用过度转录的琥珀抑制子tRNA以及对邻-硝基苄基半胱氨酸有特异性的突变大肠杆菌亮氨酰-tRNA合成酶将该非天然氨基酸定点掺入人胱冬酶原-3活性位点。在邻-硝基苄基半胱氨酸存在条件下表达蛋白，然后将细胞暴露于紫外线5分钟触发细胞死亡，表明紫外线诱导从非天然半胱氨酸残基上切割硝基苄基，恢复了胱冬酶原-3的活性，触发了细胞凋亡。

该实验证实了在活哺乳动物细胞中用邻-硝基苄基半胱氨酸选择性取代蛋白质中的活性位点半胱氨酸可用于，例如，通过使用诸如紫外线等从空间上控制蛋白活性。用具有不同反应性位点基团的蛋白可获取相似结果(例如，在丝氨酸蛋白酶活性位点残基上使用邻-硝基苄基丝氨酸)。关于光笼蔽和光调节氨基酸的进一步细节可在如下PCT公开文本中找到：WO 2006/034410，Dieters等(2006年3月30日)，“在遗传密码中加入光调节性氨基酸”(ADDINGPHOTOREGULATED AMINO ACIDS TO THE GENETIC CODE)，通过引用将其内容整体纳入本文。

实施例9

材料和方法：哺乳动物细胞转染和Western印迹分析

T-REx^TM CHO和T-REx^TM293细胞(英杰^TM)组成型表达四环素抑制子，其调节插入pcDNA4/TO/myc-His A质粒的基因的表达。用含10％ FBS(英杰^TM)、1％青链霉素(英杰^TM)、2mM L-谷氨酰胺(英杰^TM)和10μg/ml杀稻瘟素(英杰^TM)的F-12培养基(英杰^TM)，在含5％ CO₂的37℃潮湿环境中培养T-REx^TM CHO细胞。用含有10％ FBS、1％青链霉素、2mM L-谷氨酰胺和5μg/ml杀稻瘟素的吉布科D-MEM培养基(英杰^TM)，在含5％ CO₂的37℃潮湿环境中培养T-REx^TM 293细胞。细胞在克斯塔6-孔培养板中生长至80-90％铺满，然后利用质粒和

6(罗氏应用科学部)(9μl

+3μg质粒)进行转染。转染6小时后，换成含1μg/ml四环素的新鲜培养基。

为了检测在对应非天然氨基酸存在下EcTyrRS变体的琥珀抑制，在新鲜培养基中加入非天然氨基酸。培养基中非天然氨基酸的浓度为10mM pMpa(巴凯公司(Bachem，Inc))、10mM pApa(新凯公司(Synchem，Inc))、1mM pBpa(巴凯公司)、8mM pIpa(巴凯公司)、5mM pAzpa(巴凯公司)以及1mM pPpa。如前所述合成手性纯pPpa(Deiters等(2003)，“在酿酒酵母的遗传密码中加入具有新反应性的氨基酸”(Adding amino acids with novel reactivity to the geneticcode ofSaccharomyces cerevisiae)JAm Chem Soc 125：11782-11783)。在加入四环素后继续培养T-REx^TM CHO细胞24小时，收集细胞；T-REx^TM 293细胞则在孵育48小时后收集。

为了进行Western印迹分析，在含1:100稀释的蛋白酶抑制剂混合物(西格玛公司(sigma))的RIPA缓冲液(UB公司/密理博公司(UpstateBiotechnology/Millipore))中裂解收集的细胞。在变性条件下用SDS-PAGE分离上清，并转移到0.45μm硝酸纤维素膜(英杰^TM)上。对于T-REx^TM CHO细胞，固化于膜上的蛋白质用抗-myc抗体(英杰^TM；1:5000稀释)作为一抗，抗-小鼠IgG-HRP(英杰^TM)作为二抗进行检测。用皮尔斯公司(PIERCE)ECL Western印迹底物进行化学发光检测。对于T-REx^TM 293细胞，用抗-His-HRP(英杰^TM；1∶5000稀释)探测并用皮尔斯公司(PIERCE)ECL Western印迹底物进行检测

材料和方法：细菌细胞转染

使用前10位的大肠杆菌细胞(英杰^TM)克隆、维持并扩增质粒。使用Pfx高保真DNA聚合酶(英杰^TM)进行聚合酶链反应(PCR)。使用

6(罗氏应用科学部)作为转染试剂。所有质粒均经测序校验。

实施例10

材料和方法：质粒构建

通过使四种寡聚脱氧核苷酸退火构建基因(集成DNA技术公司(Integrated DNA Technologies，Inc))。该基因由缺少人tRNA^Tyr基因的3′-CCA和5′-侧接序列的相应tRNA序列组成：

AGCGCTCCGGTTTTTCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC

(SEQ ID NO：104)

将两个限制性位点整合到合成DNA双链体中，EcoRI整合入5′端，BamHI整合入3′端，然后将其插入pUC18得到

然后，通过PCR扩增

中的将5′端含有BglII限制性位点且3′端含有BamHI位点的扩增的

插入的BamHI限制性位点中，得到

质粒

仅含有一个BamHI限制性位点，用该位点引入另一个拷贝的

得到

通过PCR扩增pEcTyrRS/tRNACUA得到EcTyrRS和其六种变体(Chin等(2003)，“扩展的真核遗传密码”(An expanded eukaryotic geneticcode)，Science 301：964-967)，然后将其插入pcDNA4/TO/myc-His A质粒(英杰(Invitrogen)^TM)的XbaI和ApaI位点中，得到pcDNA4-EcTyrRS载体。将EcTyrRS基因设置在两个四环素操纵子序列和CMV启动子之后，CMV启动子能在英杰^TM T-REx^TM细胞系中指导四环素调节的基因表达。也将它们连接于c-myc表位，以便进行Western印迹分析。六种EcTyrRS变体中的突变是：

pMpaRS：Y37V/D182S/F183M

pApaRS：Y37I/D182G/F183M/L186A

pBpaRS：Y37G/D182G/F183Y/L186M

pIpaRS：Y37I/D183S/F183M

pAzpaRS：Y37L/D182S/F183M/L186A

pPpaRS：Y37S/D182T/F183M/L186V

pcDNA4-EcTyrRS和pcDNA4-GFP37TAG

将野生型增强的GFP基因插入载体pcDNA4/TO/myc-His A的XbaI和ApaI位点内，产生pcDNA4-GFP。在pcDNA4-GFP中，在C末端将该GFP基因与myc表位和6×His标签连接，以便对表达的蛋白质进行Western印迹分析和亲和纯化。通过

定点诱变试剂盒(司查塔基公司(Stratagene))产生Y37的三联体密码子突变成TAG琥珀密码子的质粒cDNA4-GFP37TAG。

pSWAN-EcTyrRS变体和pSWAN-GFP37TAG

为了构建pSWAN-EcTyrRS变体，利用BamHI和EcoRI限制性酶由

分离

将其插入pcDNA3.1/hygro(+)(英杰^TM)的BglII和MfeI位点中，得到。然后，将编码此六种EcTyrRS变体的基因插入的XbaI和ApaI位点中，得到pSWAN-EcTyrRS变体。为了产生pSWAN-GFP37TAG，扩增pSWAN-EcTyrRS载体并用MluI和PciI限制性酶消化。通过琼脂糖凝胶电泳分离消化的片段，通过

凝胶纯化试剂盒(凯杰

)纯化含有

的片段。通过PCR扩增从CMV启动子到BGH聚A位点的pcDNA4-GFP37TAG片段，用MluI和PciI限制性酶消化，然后与含有

的pSWAN-EcTyrRS片段连接，得到pSWAN-GFP37TAG(～4000bp)。

实施例11

材料和方法：蛋白质表达和纯化

利用pSWAN-EcTyrRS变体和pSWAN-GFP37TAG表达含有非天然氨基酸的突变GFP。在75cm²组织培养瓶(BD生物科学公司(BD Biosciences))中培养T-REx^TM CHO细胞(英杰^TM)至80-90％铺满，用60μl

6以及2μgpSWAN-EcTyrRS和10μgpSWAN-GFP37TAG转染。培育过夜后，将培养基更换为含有非天然氨基酸(pMpa，10mM；pApa，10mM；pBpa，1mM；pAzpa，5mM；和pPpa，1mM)和1μg/ml四环素的新鲜培养基。然后，37℃培养细胞1-2天，收获细胞，用RIPA裂解缓冲液裂解。细胞裂解物的上清液用PBS缓冲液透析和平衡，然后加载到抗-myc抗体琼脂糖柱(西格马公司(Sigma))上。用15倍柱体积的PBS缓冲液洗柱，然后用0.1M氢氧化铵洗脱。纯化的蛋白质用0.1M乙酸中和，并用SDS-PAGE分析。剪下对应于GFP的条带进行质谱分析。为了测定产率和获得完整蛋白质质谱，洗脱后将该蛋白浓缩至～0.1mg/ml。

实施例12

材料和方法：蛋白酶解

用测序级改良的胰蛋白酶(普洛麦格公司(Promega))于37℃培育蛋白质过夜，以便使亲和纯化的蛋白质发生蛋白酶解(对野生型和pBpa样品进行这种操作)，其中根据100mM三乙铵碳酸氢盐缓冲液(pH8.5)中的蛋白质浓度估计值，底物/酶的比例为10∶1(wt/wt)。按照改良的EMBL方法(参见德国海德尔堡(Heidelberg，Germany)的EMBL的网站，生物分析研究组(Bioanalytical ResearchGroup))进行凝胶中消化(对pMpa、pAzpa、pApa和pPpa样品进行)。简要说，将凝胶块切成约1mm×1mm的小块，用水洗涤5分钟，用乙腈洗涤15分钟，真空离心干燥，然后用50mM三乙铵碳酸氢盐缓冲液(pH8.5)配制的12.5纳克/微升测序级改良的胰蛋白酶在0℃再水化30分钟。去除过量缓冲液，将20微升50mM三乙铵碳酸氢盐缓冲液(pH8.5)加入该凝胶块，然后于37℃培育过夜。如方案部分所述从所述凝胶块中提取肽。

实施例13

材料和方法：纳米-RP LC/MS/MS

用HPLC泵、自动取样器(加州帕洛阿尔托的安捷伦技术公司(AgilentTechnologies，Palo Alto，CA))和LTQ Orbitrap杂交质谱用仪(加州圣何塞的热电公司(ThermoElectron，San Jose，CA))进行纳米-RP LC/MS/MS。用压力泵(pressure bomb)将胰蛋白酶消化物加载到内径为75微米的预装4厘米5微米Monitor C18颗粒的预装柱(加州安大略的柱工程公司(Column Engineering，Ontario，CA))上，流速约为2微升/分钟。然后，将该预装柱连接于HPLC泵，用溶剂A洗涤数分钟后，串联集成有发射尖头(emittertip)的分析柱(360微米外径x75微米内径；10厘米5微米C18，～5微米尖头)。用100％溶剂A(0.1％乙酸水溶液)至50％溶剂B(0.1％乙酸的乙腈溶液)进行色谱40分钟；通过分析柱的流速约为100纳升/分钟。

在依赖数据的实验中，在质谱仪上设定程序，以便首先记录高分辨Orbitrap扫描，然后记录全扫描离子阱谱(m/z 500-2,000)。然后进行10次依赖数据的MS/MS扫描(相对碰撞能量＝35％；3-Da分离窗)，触发离子阱扫描，最后是两次靶定MS/MS扫描。第一次靶定MS/MS扫描能分离和片段化预测的非天然氨基酸修饰肽(FSVSGEGEGDATY^*GK；SEQ ID NO：103)的双电荷前体离子。

第二次靶定MS/MS扫描总是能分离和片段化野生型肽(FSVSGEGEGDATYGK；SEQ ID NO：102)的双电荷前体离子，其m/z为752.3。用MASCOT(英国伦敦的MS公司(Matrixscience，London，UK))搜索MSDB数据库的原始数据，以便随着变量改变鉴定蛋白质和发现包含含有非天然氨基酸的靶肽的扫描。为了估计GFP-pMpa的Y*37上的保真度，用Xcalibur软件包(加州圣何塞的热电公司)对单一离子色谱(野生型双电荷前体离子的m/z为752.3，pMpa双电荷前体离子的m/z为759.3)和所选离子色谱(y₉、y₁₁和y₁₂)进行积分。

在装有自动取样器的毛细管LC和QTOF2质谱仪组成的自动化LC/MS系统(马萨诸塞州米尔福德沃特公司(Waters，Milford，MA))上获得完整蛋白质质谱。将GFP-pMpa(0.1mg/ml)加载到反相蛋白质Captrap(加州奥本的MB公司(Michrom Bioresources，Auburn，CA))上，用0.1％乙酸水溶液脱盐，并用80％乙腈/0.1％乙酸以5微升/分钟的速率洗脱到质谱仪的ESI源中。利用MassLynx(马萨诸塞州米尔福德沃特公司)软件包，以MaxEnt1算法对谱图进行求和、平滑和解卷积处理。

实施例14

哺乳动物转录的启动子

在哺乳动物细胞中，tRNA转录的强启动子包括大肠杆菌阻抑物tRNA^Leu5(CUA)的5’侧接序列GATCCGACCGTGTGC TTGGCAGAAC(SEQ IDNO：105)和大肠杆菌阻抑物tRNA^Leu5(CUA)的3’侧接序列GTCCTTTTTTTG(SEQ ID NO：106)。

***

虽然出于阐述和理解的目的详细描述了上述发明，但本领域技术人员应明了，通过阅读该公开，可在不背离本发明真实范围的情况下对其形式和细节进行各种改变。通过引用将本申请引用的所有发表物、专利、专利申请和/或其它文件全文纳入本文用于所有目的，其程度就好像通过引用将各篇发表物、专利、专利申请和/或其它文件单独纳入本文用于所有目的那样。

Claims

1.一种翻译系统，其包括

(a)选自下组的第一非天然氨基酸：

i)对-甲氧基苯丙氨酸(pMpa)；

ii)对-乙酰基苯丙氨酸(pApa)；

iii)对-苯甲酰苯丙氨酸(pBpa)；

iv)对-碘代苯丙氨酸(pIpa)；

v)对-叠氮基苯丙氨酸(pAzpa)；

vi)对-炔丙基氧基苯丙氨酸(pPpa)；

vii)α-氨基辛酸；

viii)邻-硝基苄基半胱氨酸(o-NBC)；

ix)1，5-丹磺酰丙氨酸；和

x)邻-硝基苄基丝氨酸(o-NBS)；

(b)第一正交tRNA(O-tRNA)；

(c)衍生自真细菌氨酰-tRNA合成酶的第一正交氨酰-tRNA合成酶(O-RS)，其中所述O-RS优先用所述非天然氨基酸氨酰化所述O-tRNA；和

(d)包含(a)、(b)和(c)的宿主细胞，所述细胞选自啮齿动物细胞或灵长动物细胞。

2.如权利要求1所述的翻译系统，其特征在于，所述第一O-RS优先用所述第一非天然氨基酸氨酰化所述第一O-tRNA，其效率至少为包含所述O-tRNA、所述非天然氨基酸和含有选自SEQ ID NO：57-101的氨基酸序列的氨酰-tRNA合成酶的翻译系统效率的50％。

3.如权利要求1所述的翻译系统，其特征在于，所述第一O-tRNA包含SEQ ID NO：3所示的多核苷酸序列或由其编码。

4.如权利要求1所述的翻译系统，其特征在于，所述第一O-RS衍生自大肠杆菌氨酰-tRNA合成酶。

5.如权利要求1所述的翻译系统，其特征在于，所述第一O-RS包含选自SEQ ID NO：57-101的氨基酸序列或其保守变体。

6.如权利要求1所述的翻译系统，其特征在于，所述宿主细胞还包含编码感兴趣蛋白质的核酸，所述核酸包含至少一个选择者密码子，其中所述选择者密码子被所述第一O-tRNA识别。

7.如权利要求6所述的翻译系统，其特征在于，所述宿主细胞还包含不同于所述第一非天然氨基酸的第二非天然氨基酸、第二O-RS和第二O-tRNA，其中所述第二O-RS优先用所述第二非天然氨基酸氨酰化所述第二O-tRNA，所述第二O-tRNA识别由核酸编码的选择者密码子，其不同于所述第一O-tRNA识别的选择者密码子。

8.如权利要求1所述的翻译系统，其特征在于，所述宿主细胞包含编码所述第一O-RS的多核苷酸。

9.如权利要求8所述的翻译系统，其特征在于，所述多核苷酸包含选自SEQ ID NO：8-56的核苷酸序列。

10.如权利要求1所述的翻译系统，其特征在于，所述宿主细胞包含编码所述第一O-tRNA的多核苷酸。

11.如权利要求1所述的翻译系统，其特征在于，所述啮齿动物宿主细胞选自大鼠宿主细胞或小鼠宿主细胞。

12.如权利要求1所述的翻译系统，其特征在于，所述灵长动物宿主细胞选自人宿主细胞、黑猩猩宿主细胞、倭黑猩猩宿主细胞、大猩猩宿主细胞、猩猩宿主细胞、长臂猿宿主细胞、短尾猿宿主细胞、绢毛猴宿主细胞或狨宿主细胞。

13.如权利要求1所述的翻译系统，其特征在于，所述啮齿动物宿主细胞是CHO宿主细胞。

14.如权利要求1所述的翻译系统，其特征在于，所述灵长动物宿主细胞是293T宿主细胞。

15.一种产生在选定位置含有非天然氨基酸的蛋白质的方法，所述方法包括：

(a)提供：

(i)选自下组的第一非天然氨基酸：

A)对-甲氧基苯丙氨酸(pMpa)；

B)对-乙酰基苯丙氨酸(pApa)；

C)对-苯甲酰苯丙氨酸(pBpa)；

D)对-碘代苯丙氨酸(pIpa)；

E)对-叠氮基苯丙氨酸(pAzpa)；

F)对-炔丙基氧基苯丙氨酸(pPpa)；

G)α-氨基辛酸；

H)邻-硝基苄基半胱氨酸(o-NBC)；

I)1，5-丹磺酰丙氨酸；和

J)邻-硝基苄基丝氨酸(o-NBS)；

(ii)第一正交tRNA(O-tRNA)；

(iii)第一正交氨酰-tRNA合成酶(O-RS)，其中所述第一O-RS优先用所述非天然氨基酸氨酰化所述第一O-tRNA；

(iv)编码所述蛋白质的核酸，其中所述核酸包含至少一个所述第一O-tRNA识别的选择者密码子，该选择者密码子在所述核酸中的位置对应于所述蛋白质的所选位置；和

(v)包含(i)、(ii)、(iii)和(iv)的宿主细胞，所述宿主细胞选自啮齿动物细胞或灵长动物细胞；和

(b)在所述蛋白质翻译期间，在所述非天然氨基酸、O-tRNA和O-RS存在下，响应所述选择者密码子而将所述非天然氨基酸掺入所述蛋白质中的所述所选位置，从而产生在所述所选位置上含有所述非天然氨基酸的所述蛋白质。

16.如权利要求15所述的方法，其特征在于，所述第一O-RS优先用所述第一非天然氨基酸氨酰化所述第一O-tRNA，其效率至少为包含所述O-tRNA、所述非天然氨基酸和含有选自SEQ ID NO：57-101的氨基酸序列的氨酰-tRNA合成酶的翻译系统效率的50％。

17.如权利要求15所述的方法，其特征在于，所述第一O-tRNA包含SEQ ID NO：3所示的多核苷酸序列或由其编码。

18.如权利要求15所述的方法，其特征在于，提供第一O-RS包括提供编码所述第一O-RS的多核苷酸。

19.如权利要求15所述的方法，其特征在于，所述第一O-RS衍生自大肠杆菌氨酰-tRNA合成酶。

20.如权利要求15所述的方法，其特征在于，所述第一O-RS包含选自SEQ ID NO：57-101的氨基酸序列或其保守变体。

21.如权利要求15所述的方法，其特征在于，所述提供第一O-RS包括提供编码所述O-RS的多核苷酸。

22.如权利要求21所述的方法，其特征在于，所述多核苷酸包含选自SEQ ID NO：8-56的核苷酸序列。

23.如权利要求15所述的方法，其特征在于，所述提供第一O-RS包括通过定点诱变技术突变野生型氨酰-tRNA合成酶的氨基酸结合口袋，和选择优先用所述第一非天然氨基酸氨酰化所述第一O-tRNA的所得的O-RS。

24.如权利要求23所述的方法，其特征在于，所述选择步骤包括在定点诱变后从得到的氨酰-tRNA合成酶分子库中正向和负向选择所述第一O-RS。

25.如权利要求15所述的方法，其特征在于，所述提供第一O-tRNA包括提供编码所述第一O-tRNA的多核苷酸。

26.如权利要求15所述的方法，其特征在于，所述蛋白质包含不同于所述第一非天然氨基酸的第二非天然氨基酸，所述方法还提供所述第二非天然氨基酸、第二O-RS和第二O-tRNA，其中所述第二O-RS优先用所述第二非天然氨基酸氨酰化所述第二O-tRNA，所述第二O-tRNA识别核酸中的选择者密码子，其不同于所述第一O-tRNA识别的选择者密码子。

27.如权利要求15所述的方法，其特征在于，所述掺入步骤包括培养所述宿主细胞。

28.如权利要求15所述的方法，其特征在于，所述第一非天然氨基酸包括光笼蔽氨基酸，所述方法还包括：

使所述宿主细胞暴露于紫外线。

29.如权利要求29所述的方法，其特征在于，使所述宿主细胞暴露于紫外线能够从空间上控制所述宿主细胞中的蛋白质活性。