CN101076598B - 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用 - Google Patents

正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用 Download PDF

Info

Publication number
CN101076598B
CN101076598B CN2004800194641A CN200480019464A CN101076598B CN 101076598 B CN101076598 B CN 101076598B CN 2004800194641 A CN2004800194641 A CN 2004800194641A CN 200480019464 A CN200480019464 A CN 200480019464A CN 101076598 B CN101076598 B CN 101076598B
Authority
CN
China
Prior art keywords
trna
codon
amino acid
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800194641A
Other languages
English (en)
Other versions
CN101076598A (zh
Inventor
J·C·安德森
N·吴
S·桑托罗
P·G·舒尔茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Scripps Research Institute
Original Assignee
Scripps Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scripps Research Institute filed Critical Scripps Research Institute
Publication of CN101076598A publication Critical patent/CN101076598A/zh
Application granted granted Critical
Publication of CN101076598B publication Critical patent/CN101076598B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)
  • Saccharide Compounds (AREA)

Abstract

本发明提供了制备蛋白生物合成机组分的组合物和方法,所述蛋白生物合成机包含正交赖氨酰tRNA、正交赖氨酰-氨酰tRNA合成酶和赖氨酰-tRNA/合成酶正交对,该生物合成机可将高谷氨酰胺插入到蛋白质中以响应四碱基密码子。本发明还提供了鉴定这些正交对的方法以及利用这些正交对制备含高谷氨酰胺的蛋白质的方法。

Description

正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用
相关申请的交叉参考
本申请要求2003年7月7日提交的临时专利申请USSN 60/485,451;2003年12月10日提交的临时专利申请USSN 60/528,815和2004年1月15日提交的临时专利申请USSN 60/537,149的优先权,并获益于上述临时专利申请,本申请已将其公开的内容完整纳入作为参考。
有关由联邦政府资助的研究和开发项目所形成的发明的权利声明
本发明是在政府资助下完成的,资助来自于能源部的基金DE-FG0300ER45812。因此政府对本发明也享有一定的权利。
发明领域
本发明属于翻译生物化学领域。本发明涉及制备正交tRNA、正交氨酰tRNA合成酶及tRNA/氨酰tRNA合成酶对的方法和组合物,其中的蛋白质插入有非天然氨基酸,如高谷氨酰胺(homoglutamine),以响应选择者密码子(selector coden)如四碱基和终止选择者密码子。其中包括在一个蛋白链内插入多个不同的非天然氨基酸以响应终止选择者密码子和四碱基选择者密码子。本发明还涉及利用这种tRNA/氨酰tRNA合成酶对及其相关的组合物在细胞内制备蛋白质的方法。
发明背景
除了少数例子以外,所有已知有机体的遗传密码都编码相同的20个氨基酸,但是,将一个新的氨基酸加入到有机体的氨基酸谱中所需要的全部组分包括独特的tRNA/氨酰tRNA合成酶对、氨基酸原料以及该氨基酸特异性的独特选择者密码子(Furter(1998)Protein Sci.,7:419-426)。以前我们发现琥珀无义密码子TAG和正交的詹氏甲烷球菌(M.jannaschii)及大肠杆菌tRNA/氨酰tRNA合成酶对配合可在大肠杆菌(Wang等,(2000)J.Am.Chem.Soc.,122:5010-5011;Wang等,(2001)Science,292:498-500;Wang等,(2003)Proc.Natl.Acad.Sci.U.S.A.,100:56-61;Chin等,(2002)Proc.Natl.Acad.Sci.U.S.A.,99:11020-11024)和酵母(Chin和Schultz,(2002)Chem Bio Chem,3:1135-1137)内分别编码具有新颖特性的各种氨基酸。但是,有限数目的非编码三联密码子严格限制了有机体所编码的氨基酸的最终数目。
有许多天然的+1移码突变抑制因子,其中包括编码谷氨酰胺的Su7来源的UAGN抑制子(Magliery等,(2001)J.Mol.Biol.,307:755-769)、sufJ来源的编码苏氨酶的ACCN抑制型密码子(Anderson等,(2002)Chem.Biol.,9:237-244)以及tRNALys和tRNAGln来源的CAAA抑制子(Anderson和Schultz,(2003)Biochemistry,42(32):9598-608)。另外,利用遗传筛选可以从大的突变tRNA文库中鉴定出有效的四碱基或五碱基密码子抑制型tRNA,其中包括大肠杆菌tRNAUCCU Ser抑制子(Ibba等,(1999)Proc.Natl.Acad.Sci.U.S.A.,96:418-423;Kwok和Wong,(1980)Can.J.Biochem.,58:213-218)。这一自然现象已被用于在体外利用化学合成的氨酰化tRNA来诱变非天然氨基酸。许多氨基酸,包括荧光物质/淬灭剂对(Terada等,(2002)Nat.Struct.Biol.,9:257-262)已被插入到蛋白质中以响应AGGU和CGGG(Hou等,(1992)Biochemistry,31:4157-4160;Yarus等,(1986)J.Mol.Biol.192:235-255;Miller,(1972)《分子遗传学实验》,冷泉港实验室,纽约冷泉港)。为了进一步扩充遗传密码需要开发出改良的和/或其他的生物合成机组分,如正交tRNA、正交氨酰-tRNA合成酶和/或独特的密码子。本发明可以满足这些和其他需求,通过阅读下文可以清楚地了解这一点。
发明概述
本发明提供了利用正交tRNA和正交氨酰tRNA合成酶制备蛋白产物的新型翻译系统。本发明涉及装配的翻译系统、使用该翻译系统的方法以及该系统制备出的翻译产物。该技术可用于本文所描述的许多方面,例如而不限于治疗性产品、诊断试剂和工业用酶的制备。
一方面,本发明提供了一种翻译系统,该系统可利用正交赖氨酰tRNA(赖氨酰O-tRNA)或O-tRNA的修饰变体和/或优先用一个或多个氨基酸加载正交赖氨酰tRNA的正交氨酰tRNA合成酶(O-RS)或O-RS的修饰变体。在某些实施方式中,翻译系统位于细胞内,如大肠杆菌内。结合到O-tRNA上的氨基酸还可以是非天然氨基酸,如高谷氨酰胺。
在翻译系统的某些实施方式中,赖氨酰O-tRNA、O-tRNA的变体、O-RS,或者二者都来源于超嗜热古菌(Pyrococcus horikoshii)(PhKRS)。现已发现许多O-RS都可用于该翻译系统,其中包括PhKRS、E444G、PhΔAD和PhΔAD的I41和/或S268突变体。在某些实施方式中,当超嗜热古菌O-RS在大肠杆菌细胞内表达时所具有的毒性等于或低于PhΔAD的I41和/或S268突变体。
赖氨酰O-tRNA或突变的O-tRNA还可以包含四碱基密码子或琥珀密码子的识别序列。例如,赖氨酰O-tRNA或其变体可包含AGGA的识别序列。在翻译系统的一些相关方面,赖氨酰O-tRNA或其变体可利用一个序列为CU(X)nXXXAA的反密码子环。在这一方面的某些实施方式中,CU(X)nXXXAA序列可以是CUCUAAA或CUUCCUAA。实施例包括包含序列SEQ ID NO:24或SEQ ID NO:26的赖氨酰O-tRNA或其变体。
在本发明的某些实施方式中,O-RS、赖氨酰O-tRNA或其变体抑制终止选择者密码子或移码选择者密码子的效率至少要达到E444G、PhΔAD或PhΔAD的I41和/或S268突变体联合具有序列SEQ ID NO:24或SEQ ID NO:26的O-tRNA的50%。在另外的实施方式中,翻译系统可利用其他的O-RS和其他的O-tRNA,这些其他的组分可抑制移码选择者密码子,这些移码选择者密码子与赖氨酰O-tRNA或O-tRNA变体和优先加载赖氨酰O-tRNA或O-tRNA变体的O-RS所抑制的移码选择者密码子不同。在其他的实施方式中,翻译系统既抑制靶多肽编码靶核酸上的四碱基选择者密码子,也抑制终止选择者密码子。四碱基选择者密码子还可以使用序列AGGA,终止选择者密码子还可以使用序列TAG或UAG。在某些实施方式中,翻译系统包括含四碱基选择者密码子的靶核酸。翻译系统还可以包含靶核酸编码的蛋白质。例如,这个蛋白质可含有高谷氨酰胺残基。
翻译系统还可以包含编码四碱基选择者密码子和终止选择者密码子的靶核酸。在某些方面,翻译系统包含靶核酸编码的蛋白质,其中的蛋白质包含至少两个不同的非天然氨基酸。
例如,本发明提供了一种翻译系统,该系统利用可识别四碱基选择者密码子的第一正交tRNA(O-tRNA)、将第一非天然氨基酸优先加载到O-tRNA上的第一正交氨酰tRNA合成酶(O-RS)、可识别终止选择者密码子的第二O-tRNA以及将第二非天然氨基酸优先加载到第二O-tRNA上的第二O-RS。在一个实施方式中,四碱基选择者密码子是AGGA,终止密码子是UAG。翻译系统还可以位于细胞内。
在翻译系统的某些实施方式中,第一或第二O-tRNA是正交赖氨酰tRNA(赖氨酰O-tRNA)或其修饰变体。另外,第一O-tRNA可以是正交赖氨酰tRNA(赖氨酰O-tRNA)或其适宜变体,第二O-tRNA是正交酪氨酰tRNA(酪氨酰O-tRNA)或其适宜变体。翻译系统还可以包含至少编码一个四碱基选择者密码子和一个终止选择者密码子的核酸。在这些实施方式中,四碱基选择者密码子可以是AGGA,终止选择者密码子可以是TAG或UAG,被翻译的核酸一般是表达出的RNA。在某些实施方式中,核酸编码的蛋白质内至少包含两个不同的非天然氨基酸,如高谷氨酰胺和第二非天然氨基酸,如亲电子的氨基酸。翻译系统可以包含各种非天然氨基酸,其中包括高谷氨酰胺。在一个实施例中,翻译系统内的蛋白质与肌红蛋白同源,但是其中包含一个非天然氨基酸如高谷氨酰胺。
本发明提供了含有蛋白质的组合物,其中的蛋白质包含但不仅限于PhKRS、E444G、PhΔAD、PhΔAD的I41和/或S268突变体的氨基酸序列,或者这些蛋白质的保守变体。本发明同样提供了编码PhKRS、E444G、PhΔAD、PhΔAD的I41和/或S268突变体的核酸,或者这些核酸的保守变体。本发明提供了包含SEQ ID NO:24或SEQ ID NO:26相应的tRNA的部分或完整序列的核酸,或者这些核酸的任意保守变体。
在其他方面,本发明提供了包含但不仅限于正交氨酰-tRNA合成酶(O-RS)的组合物,其中的O-RS优先用高谷氨酰胺氨酰化O-tRNA。这种O-RS含有PhΔAD的I41和/或S268突变体相应的突变,或者这个蛋白的任何保守变体。在某些实施方式中,O-RS优先氨酰化O-tRNA,其效率至少为PhΔAD的I41和/或S268突变体的50%。在某些实施方式中,O-RS来源于超嗜热古菌。在O-RS和O-tRNA都包含于组合物内的某些实施方式中,O-tRNA可识别四碱基选择者密码子,如AGGA。
在上述组合物包含细胞或存在于细胞内的某些实施方式中,O-RS可被细胞内的一种或多种核酸编码,这些细胞可以是大肠杆菌细胞。组合物可包含翻译系统。在包含细胞并且其中的O-RS是被细胞内的一种或多种核酸编码的组合物中,细胞还可以包含能识别第一选择者密码子和高谷氨酰胺的正交-tRNA(O-tRNA),例如,其中的O-RS优先用高谷氨酰胺氨酰化O-tRNA。在某些实施方式中,细胞包含编码目的多肽的靶核酸,其中的靶核酸编码一个能被O-tRNA识别的选择者密码子。
O-tRNA还可以被多核苷酸的部分或完整序列编码,如上述的SEQ ID NO:24或SEQ ID NO:26,或其互补的多核苷酸序列,O-RS包含相应于PhKRS、E444G、PhΔAD、PhΔAD的I41和/或S268突变体的氨基酸序列,或者该序列的任何保守变体。需要说明的是本文所描述的任一核酸序列都可以RNA或DNA的形式出现;因此,除非在上下文中特别说明,序列如SEQ ID NO:24或25可以是RNA的形式,也可以是DNA的形式,无论是否清晰地指出。在某些实施方式中,O-RS和O-tRNA抑制终止选择者密码子或移码选择者密码子的效率至少要达到E444G、PhΔAD或PhΔAD的I41和/或S268突变体联合具有序列SEQ ID NO:24或SEQ ID NO:26的O-tRNA的50%。在组合物包含细胞的实施方式中,细胞可以是大肠杆菌细胞。这个组合物的细胞还可以包含其他不同的O-tRNA/O-RS对和其他不同的非天然氨基酸,其中O-tRNA可识别第二选择者密码子,O-RS优先用第二非天然氨基酸氨酰化O-tRNA。细胞还可以包含编码第一和第二选择者密码子的靶核酸。另外,这种组合物的细胞还可以包含靶核酸编码的蛋白质,其中的蛋白质至少插入有两个不同的非天然氨基酸。
本发明还提供了至少包含一个高谷氨酰胺的蛋白质。在某些实施方式中,蛋白质所包含的氨基酸序列与野生型治疗性蛋白、诊断蛋白、工业用酶或这些蛋白的任何部分的序列至少有75%相同。另外,蛋白质上还可以连接药学上可接受的载体。
在其他方面,本发明提供了筛选有活性的正交-氨酰-tRNA合成酶(O-RS)的方法,其中的O-RS可将高谷氨酰胺加载到正交tRNA(O-tRNA)上。这些方法的第一步是提供一群细胞用于筛选,这些细胞都包含1)O-tRNA,其中O-tRNA对于细胞群内含有O-tRNA的细胞来说是正交的;2)包括一种或多种有活性的O-RS成员的O-RS群,这些成员可在该细胞群的一种或多种细胞内将高谷氨酰胺加载到O-tRNA上;3)编码选择标记的多核苷酸,其中多核苷酸至少编码一个可被O-tRNA识别的选择者密码子;以及4)高谷氨酰胺。在这个筛选过程中,与无RS但是有O-tRNA的对照细胞相比,细胞群内含有活性O-RS的靶细胞因其对选择标记的抑制效应增强而被筛选出来。该方法的第二步是筛选含有活性O-RS的靶细胞。本发明还提供了通过任意筛选方法鉴定正交氨酰-tRNA合成酶的方法。
在这些方法的某些实施方式中,细胞还可以被进一步筛选以去除那些含有非靶O-RS的细胞,其中的非靶O-RS可以将高谷氨酰胺之外的氨基酸加载到O-tRNA上。在某些实施方式中,筛选是正筛选,选择标记是正选择标记。
在这些方法的不同实施方式中,RS群可以是不同来源的,其中包括而不限于突变的RS、第一物种之外的一个或多个物种来源的RS,或者二者都有。
本发明还提供了在细胞内制备在特定位置上是高谷氨酰胺的蛋白质的方法。该方法包括在适宜培养基内培养细胞的步骤,其中的细胞含有至少编码一个选择者密码子和一个蛋白质的核酸,例如,其中的细胞还可以包含能识别选择者密码子的正交-tRNA(O-tRNA)和优先用高谷氨酰胺氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS);提供高谷氨酰胺;将高谷氨酰胺插入到特定位置以响应选择者密码子,从而制备出蛋白质。在该方法的一个实施方式中,O-RS的氨基酸序列利用了E444G、PhΔAD、PhΔAD的I41和/或S268突变体、或者其保守变体的完整或部分序列。
定义
在详细描述本发明前,需要说明的是本发明并不局限于某些特定的生物系统,本发明可以有各种变化。还应当说明的是本文所用的方法只是为了描述特定的实施方式,并不意味着对本发明的限制。如本发明的说明书和附属权利要求所使用的,除非特别指明,单数形式“一个”、“一种”和“这种”也包括复数。因此,“一个细胞”也包括两个或多个细胞;“细菌”也包括细菌的混合物等。
除了在此处和说明书的其余部分所定义的,本文所用的所有技术术语和科学术语都与本发明所属领域的技术人员所通常理解的意义相同。
正交赖氨酰-tRNA:本文所用的术语正交赖氨酰-tRNA(赖氨酰-O-tRNA)是与目的翻译系统正交的tRNA,其中tRNA:(1)与天然的赖氨酰tRNA相同或基本类似,(2)来源于发生自然突变或人工诱变的天然赖氨酰tRNA,(3)由考虑到(1)或(2)的野生型或突变赖氨酰tRNA序列的任意方法所制备,(4)与野生型或突变的赖氨酰tRNA同源,(5)与表1中所列的被定义为赖氨酰tRNA合成酶底物的典型tRNA同源,或(6)表1中所列的被定义为赖氨酰tRNA合成酶底物的典型tRNA的保守变体。赖氨酰tRNA可以携带一个氨基酸,或者处于非负载状态。还需要说明的是“赖氨酰-O-tRNA”还可以被同源的合成酶加载(氨酰化)上赖氨酸之外的氨基酸,如高谷氨酰胺。本发明的赖氨酰-O-tRNA确实可用于将任何必需的氨基酸,无论是天然的或是人工合成的,插入到正在合成的多肽内,如翻译期间,以响应选择者密码子。
正交赖氨酰氨基酸合成酶:本文所用的正交赖氨酰氨基酸合成酶(赖氨酰-O-RS)是一种可以在目的翻译系统内优先将氨基酸加载到赖氨酰-O-tRNA上的合成酶。被赖氨酰-O-RS加载到赖氨酰-O-tRNA上的氨基酸可以是任何氨基酸,无论是天然的还是人工合成的,不仅仅局限于本文所描述的。合成酶还可以与天然的赖氨酰氨基酸合成酶相同或同源,或者与表1所列的赖氨酰-O-RS相同或同源。例如,赖氨酰-O-RS可以是表1所列的赖氨酰-O-RS的保守变体,和/或与表1所列的赖氨酰-O-RS的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或更高的相同性。
正交:本文所用的术语“正交”是指一个分子(如正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))的功能与细胞的内源性组分一样,但是其活性与细胞或翻译系统内的其相应的内源性分子相比下降,或者不具有细胞内源性组分的功能。在用于tRNA和氨酰-tRNA合成酶时,正交的是指正交的tRNA与内源性tRNA合成酶配合时其效率与内源性tRNA和内源性tRNA合成酶配合时相比下降,如下降到20%、10%、5%或1%以下。正交分子缺乏细胞内内源性互补分子的正常功能。例如,与内源性的tRNA被内源性RS氨酰化相比,细胞内的正交tRNA被细胞的内源性RS氨酰化时其效率降低,甚至根本检测不到。在另外一个实施例中,与内源性的RS氨酰化内源性的tRNA相比,正交的RS在目的细胞内氨酰化任何内源性的tRNA时其效率降低,或者根本检测不到。第二正交分子可以被引入到细胞内和第一正交分子一起发挥功能。例如,正交tRNA/RS对包括引入的互补组分,在细胞内一起行使功能时其效率与对照,如相应的内源性tRNA/RS对或活性正交对(如酪氨酰正交tRNA/RS对)相比可以达到45%、50%、60%、70%、75%、80%、90%、95%、99%或更高。
同源:术语“同源”是指能联合发挥功能的组分,如正交tRNA和优先氨酰化正交tRNA的正交氨酰-tRNA合成酶。该组分也被称为“互补的”。
优先氨酰化:术语“优先氨酰化”是指O-RS在将一个特定氨基酸加载到特定tRNA上时的效率比加载其他tRNA上时要高。例如,O-RS加载同源O-tRNA时的效率比氨酰化非同源tRNA(如作为底物用于制备同源O-tRNA的tRNA,如通过突变)时的效率要高(如70%、75%、85%、90%、95%、99%或更高)。
选择者密码子:术语“选择者密码子”是指在翻译过程中能被O-tRNA识别但通常不被内源性tRNA识别的密码子。典型的例子包括终止密码子、含四个或更多碱基接的密码子等。O-tRNA反密码子环可识别选择者密码子,如表达的RNA如mRNA内的选择者密码子,通过翻译系统的翻译可将其相应的氨基酸插入到多肽内。例如,在本文的一个实施方式中,O-tRNA可识别选择者密码子如四碱基密码子,通过翻译过程将一个非天然氨基酸如高谷氨酰胺插入到多肽内。选择者密码子包括无义密码子如终止密码子,例如琥珀密码子、赭石密码子和乳白密码子;四碱基或多碱基密码子;稀有密码子;天然或非天然碱基对来源的密码子等。
抑制型tRNA:抑制型tRNA是一种可在给定的翻译系统内改变信使RNA(mRNA)的阅读的tRNA,例如通过将氨基酸插入到多肽链内以响应选择者密码子的机制。例如,抑制型tRNA可阅读过终止密码子、四碱基密码子、稀有密码子等。
抑制活性:如本文所述,术语“抑制活性”通常是指tRNA(如抑制型tRNA)在翻译过程中阅读过密码子(如为琥珀密码子或四碱基或多碱基密码子的选择者密码子)的能力,如果阅读不过则翻译终止或产生错误翻译(如移码突变)。抑制型tRNA的抑制活性可以表达为与第二抑制型tRNA或对照系统如缺乏O-RS的对照系统相比所观察到的翻译通读活性的百分数。
本发明提供了定量测定抑制活性的各种方法。一种特定O-tRNA和ORS对目的选择者密码子(如琥珀密码子)的抑制百分率是指一种位于编码表达检测标记的核酸上的给定表达检测标记(如LacZ),包括选择者密码子,在目的翻译系统内的活性相对于阳性对照构建体活性的百分数,其中的目的翻译系统包含O-RS和O-tRNA,而阳性对照不包含O-tRNA、O-RS和选择者密码子。因此,如果缺乏选择者密码子的有活性的阳性对照标记构建体在一个给定翻译系统内的活性是X,那么含有选择者密码子的被检测构建体的抑制百分率为被检测构建体在与阳性对照标记基本相同的表达环境条件下所展示的X的百分比,其中被检测标记构建体所表达的翻译系统还包含O-tRNA和O-RS。一般来说,表达被检测标记的翻译系统还包含能被O-RS和O-tRNA识别的氨基酸。另外,百分抑制率还可以通过比较被检测标记与“背景”或“阴性”对照标记构建体来加以精炼,后者含有与被检测标记相同的选择者密码子,但是系统中不包含O-tRNA、O-RS和/或能被O-tRNA和/或O-RS识别的相关氨基酸。这种阴性对照由于考虑到了标记在目的翻译系统中所产生的背景信号,因此可以使百分抑制率更加准确。
抑制效率可通过本领域熟知的多种方法检测。例如,可以利用β半乳糖苷酶报告基因分析方法,如将衍生的lacZ质粒(其中构建体含有选择者密码子和lacZ核酸序列)和含有本发明的O-tRNA的质粒一起导入到适宜有机体(如可使用正交组分的有机体)的细胞内。同源的合成酶也要导入(或者以多肽或编码同源合成酶的多核苷酸的形式)。细胞在培养基内生长到预期的密度时,如OD600达到约0.5时,利用BetaFluorTMβ-半乳糖苷酶检测试剂盒(Novagen)进行β半乳糖苷酶活性分析。百分抑制率可以计算为样品相对于可比较对照的活性百分数,如衍生的lacZ构建体所展示的活性,其中构建体在预期位置上含有有义密码子而不是选择者密码子。
翻译系统:术语“翻译系统”是指可以将氨基酸插入到正在合成的多肽链(蛋白)上的组分。翻译系统的组分包括核糖体、tRNA、合成酶、mRNA等。本发明的O-tRNA和/或O-RS也可以加入到体外或体内翻译系统中,或者作为翻译系统的一部分,如非真核细胞如细菌(如大肠杆菌)或真核细胞如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等内的翻译系统。
非天然氨基酸:如本文所述,术语“非天然氨基酸”是指20个天然氨基酸或稀有天然氨基酸硒氨酸或吡咯赖氨酸之外的任何氨基酸、修饰氨基酸和/或氨基酸类似物,如高谷氨酰胺。
来源于:本文所用的术语“来源于”是指从特定分子或有机体、或者特定分子或有机体的信息中分离的组分,或者利用特定分子或有机体、或者特定分子或有机体的信息制备的组分。
阳性选择标记:本文所用的术语“阳性选择标记”是指当一个标记存在时,如表达、活化等,会导致具有该标记相应性状的细胞被鉴定出来,如可以将具有阳性选择标记的细胞与无此形状的细胞区别开来。
阴性选择标记:本文所用的术语“阴性选择标记”是指一个标记存在时,如表达、活化等,可以鉴定出不具有被筛选特性或形状的细胞(如,与具有该特性或形状的细胞比较时)。
报告子:本文所用的术语“报告子”是指可用于鉴定和/或筛选目的系统内靶组分的组分。例如,报告子可以是蛋白,如能赋予抗生素耐药性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光选择标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如萤火虫荧光素酶蛋白)、亲和性的选择标记,或者正或负选择标记基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、Adh(乙醇脱氢酶)、his3、ura3、leu2、lys2等。
真核生物:本文所用的术语“真核生物”是指在系统进化树内属于真核生物域的有机体,如动物(如哺乳动物、昆虫、爬行动物、鸟类等)、纤毛虫、植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛虫、微孢子虫、原生生物等。
非真核生物:本文所用的术语“非真核生物”是指非真核有机体。例如,非真核有机体可能属于真细菌系统发育区(如大肠杆菌、嗜热栖杆菌、嗜热脂肪芽孢杆菌等)或古细菌(如詹氏甲烷球菌(Methanococcus jannaschii)(Mj)、马氏微球菌(Methanosarcina mazei)(Mm)、热自养甲烷球菌(Methanobacterium thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、坎氏甲烷嗜热菌(Methanopyruskandleri)、盐杆菌属如沃氏盐杆菌(Haloferax volcanii)和嗜盐菌NRC-1(Halobacteriumspecies NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌Pyrococcusfurious)(Pf)、超嗜热古菌(Ph)、超耐高温热棒菌(Pyrobaculum aerophilum)、火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、硫化叶菌(Sulfolobustokodaii)、Aeuropyrum pernix(Ap)、噬酸热原体(Thermoplasma acidophilum)、火山热原体(Thermoplasma volcanium)等)系统发育区。
保守变体:如本文所描述,术语“保守变体”用于指翻译组分时是指一个翻译组分,如保守突变的O-tRNA或保守突变的O-RS,其功能特性与基本组分O-tRNA或O-RS相似,但是在序列上与参照O-tRNA或O-RS相比有些不同。例如,O-RS可用非天然氨基酸如高谷氨酰胺氨酰化互补的O-tRNA或保守突变的O-tRNA,但是O-tRNA和保守突变的O-tRNA在序列上是有差异的。保守变体在序列上可能含有一个、两个、三个、四个、五个或更多个突变,只要保守变体与相应的O-tRNA或O-RS能够互补。
筛选试剂:本文所用的术语“筛选试剂”是指当一个试剂存在时可以从一群组分中筛选出某种特定组分。例如,筛选试剂包括而不限于营养素、抗生素、光的波长、抗体、表达的多核苷酸等。筛选试剂可以使用不同的浓度、密度等。
响应:本文所用的术语“响应”是指本发明的tRNA识别选择者密码子并将相应的氨基酸,如非天然氨基酸如高谷氨酰胺,插入到正在合成的多肽链中的过程,其中的氨基酸是由tRNA携带的。
编码:如本文所描述,术语“编码”是指利用多聚大分子或序列符号串上的信息指导合成第二分子或序列符号串的过程,其中的第二分子或序列符号串与第一分子或序列符号串是不同的。如本文所描述,该术语的使用范围很宽,可用于许多方面。一方面,术语“编码”可用于描述DNA的半保留复制过程,其中双链DNA分子的一条链作为模板由DNA依赖的DNA聚合酶编码出新合成的一条互补姊妹链。
另一方面,术语“编码”是指利用一个分子上的信息指导合成化学性质与第一分子不同的第二分子的过程。例如,DNA分子编码一个RNA分子(如通过DNA依赖的RNA聚合酶参与的转录过程)。另外,RNA分子也可以编码多肽,比如在翻译过程中。当该术语用于描述翻译过程时,该术语也可以扩展到编码氨基酸的三联密码子。在某些方面,RNA分子也可编码DNA分子,比如通过RNA依赖的DNA聚合酶参与的反转录过程。在另一个方面,DNA分子可编码多肽,应当理解的是,在这种情况下,术语编码是指转录和翻译两个过程。
附图简述
图1描述的是古细菌tRNALys序列的排列。Pa,火球菌(Pyrococcus abyssi);Pf,激烈火球菌;Ph,超嗜热古菌;Pya,超耐高温热棒菌;Ta,噬酸热原体;Tv,火山热原体(Thermoplasma volcanum);Af,闪烁古生球菌;Hh,嗜盐菌NRC-1;Mj,詹氏甲烷球菌;Mt,热自养甲烷球菌;Mm,马氏微球菌;St,硫化叶菌(Sulfolobustokodaii);Ss,硫磺矿硫化叶菌;Ap,Aeropyrum pernix来源的基因组序列用GCG程序pileup排列,并用prettybox程序展示。
图2,A和B都是直方图,描述的是在体外的种间氨酰化。(A)大肠杆菌完整tRNA或(B)嗜盐菌完整tRNA被EcKRS(□)、PhKRS(■)或无合成酶(▲)氨酰化。试验在20μl的反应液内进行,其中含有50mM Tris-Cl,pH 7.5,30mM KCl,20mM MgCl2,3mM谷胱甘肽、0.1mg/mL BSA、10mMATP、1μM[3H]赖氨酸(Amersham)、750nM合成酶和0、2、10或40μM全tRNA,反应在37℃进行20分钟。
图3用图表的形式描述了共有序列来源的琥珀抑制型tRNA。古细菌tRNALys序列家族的共有序列在于三叶草构型。反密码子环从共有序列变成CUCUAAA,形成AKCUA
图4是一个直方图,描述的是正交合成酶-tRNA对的体内活性。GeneHogs细胞(Invitrogen)用图中所示的质粒转染,或者不用质粒转染,设四复孔,测定其中的β-半乳糖苷酶的活性。质粒pKQ表达PhKRS的E444G突变体。质粒pKQ作为无合成酶的样品。质粒pACGFP表达AKCUA,质粒pACGFP作为不含tRNA的样品。LacZ报告基因来自于质粒pLASC-lacZ。细胞在2YT培养基内生长,加入适量的抗生素,当细胞生长到OD600等于0.5时用Miller的方法进行分析(Miller,(1972),《分子遗传学实验》(Experiments in molecular genetics),冷泉港实验室,冷泉港,纽约)。
图5.琥珀抑制型tRNA和四碱基抑制型tRNA的构建。琥珀抑制型tRNA构建自多种tRNALys序列的多序列排列。正交AGGA抑制型tRNA通过筛选受体臂文库而获得。
图6A和6B.图6A显示的是PhKRS活性位点的结构。残基E41和Y268可与赖氨酸底物特异性接触。这些残基可同时随机用于构建活性位点库。图6B显示的是各种氨基酸的结构。
图7A和7B提供的是化学荧光磷光成像(chemifluorescence phosphoimage),显示的是AGGA抑制子对肌红蛋白表达的影响。图7A,在AKUCCU tRNA和PhΔAD,一种hGln特异性的变体,或JYRS存在的情况下,G24位为AGGA密码子的肌红蛋白基因的表达。琥珀抑制子在S4位上对肌红蛋白表达的抑制作用,其企图与用PhΔAD或JYRS一样。b,hGln通过AGGA抑制子在24位上插入,AzPhe通过琥珀抑制子在75位上插入,二者插入到同一条多肽链上。
图8.含高谷氨酰胺或赖氨酸的胰酶水解片段的基质辅助的寄过解吸/电离飞行时间(MALDI-TOF)分析。
图9.在24位含高谷氨酰胺、在75位含O-甲基-酪氨酸的全长肌红蛋白的电喷雾质谱分析。
详细描述
为了在体内将其他的合成氨基酸如高谷氨酰胺插入到基因密码内,需要设计一个能在翻译系统中发挥正常功能但是对于组织内的翻译系统来说是“正交的”的新型氨酰-tRNA合成酶/tRNA正交对,也就是说该正交对在翻译系统内可独立地行使合成酶和tRNA的功能。我们希望正交对所具有的特性包括tRNA只能解码或识别一个特异性的新密码,如筛选密码,该密码不被任何内源性的tRNA所解码,氨酰-tRNA合成酶只用特异性的非天然氨基酸如高谷氨酰胺优先氨酰化(或加载)其同源的tRNA。O-tRNA也不能被内源性的合成酶氨酰化。例如,在大肠杆菌内,一个正交对包含一个基本不能氨酰化任何内源性tRNA的氨酰tRNA合成酶和一个基本不能被任何内源性合成酶氨酰化的正交tRNA,在大肠杆菌内,内源性的tRNA有40种,内源性的氨酰tRNA合成酶有21种。
在本文中我们描述了用古细菌tRNALys序列制备新的正交合成酶/tRNA对的过程,该正交对可有效而特异地将氨基酸高谷氨酰胺(hGln)插入到肌红蛋白内以响应四碱基选择者密码子AGGA。hGln所产生的移码校正抑制不会显著影响蛋白的产量或细胞的生长速率,与第二O-tRNA-ORS对所产生的TAG抑制互相正交。这一研究的结果表明可用的三联密码子的数量和翻译机器本身都不再成为进一步扩展密码子的显著障碍。
为了使四联密码子能在体内编码非天然氨基酸,人们必须制备出能特异识别这个密码子的正交tRNA(O-tRNA)以及相应的合成酶,这个合成酶只能利用非天然的目的氨基酸来氨酰化这个O-tRNA。由于以前所制备的正交詹氏甲烷球菌琥珀抑制型tRNA的反密码子环是同型合成酶JYRS的关键识别元件,因此利用这个环来解码四碱基密码子是比较困难的。虽然有可能使JYRS反密码子环的结合特异性下降,但是如果只用反密码子环序列来构建与琥珀抑制子和四碱基抑制子不同的互补正交对可能是比较困难的。因此,本发明利用不同来源的正交对来构建一个系统,该系统可将两个或多个不同的非天然氨基酸同时插入到多肽中以响应两个或多个不同的选择者密码子。
本发明提供了鉴定和制备另外的正交tRNA-氨酰-tRNA合成酶对,如O-tRNA/O-RS对的组合物和方法,其中的正交对可用于插入非天然氨基酸,如高谷氨酰胺。本发明的典型O-tRNA能够在体内使高谷氨酰胺插入到多核苷酸编码的蛋白质内,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。O-tRNA的反密码子环可识别mRNA上的选择者密码子,并将其对应的氨基酸如高谷氨酰胺插入到多肽的这个位点上。本发明的正交氨酰-tRNA合成酶只用特异性的非天然氨基酸优先氨酰化(或加载)其O-tRNA。
正交tRNA/正交氨酰-tRNA合成酶及其对
适于制备包含一个或多个非天然氨基酸的蛋白质的翻译系统描述于题为“METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGANOLtRNA-AMINOACYL-tRNA SYNTHETASE PARIS”(用于制备正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO2002/086075和题为“IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS”(非天然氨基酸的体内插入)的WO2002/085923中。另外,还可以参见国际专利PCT/US2004/011786,申请日为2004年4月16日。这些专利申请都已完整纳入本文作为参考。这种翻译系统一般都包括含正交tRNA(O-tRNA)的细胞(可以是非真核细胞如大肠杆菌,或真核细胞如酵母)、正交氨酰tRNA合成酶(O-RS)以及非天然氨基酸(在本发明中,高谷氨酰胺是这种非天然氨基酸的典型例子),其中O-RS可用高谷氨酰胺氨酰化O-tRNA。本发明的正交对包含O-tRNA,如抑制型tRNA、移码tRNA等,以及O-RS。本发明还提供了其他组分。
一般来说,当正交对识别选择者密码子并加载氨基酸以响应选择者密码子时,正交对被称为“抑制”了选择者密码子。这就是说,不被翻译系统(如细胞)的内源性机器识别的选择者密码子通常不被翻译,导致多肽合成的中断,否则多肽就可以从核酸上翻译出来。本发明的O-tRNA可识别选择者密码子,与包含或编码于上文所列的多核苷酸序列的O-tRNA相比,在同源合成酶存在的条件下,本发明的O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。O-RS可用非天然的目的氨基酸如高谷氨酰胺氨酰化O-tRNA。细胞利用O-tRNA/O-RS对将非天然氨基酸插入到正在合成的多肽链内,例如通过一个包含编码目的多肽的多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。在某些我们期望的方面,细胞可以包含其他的O-tRNA/O-RS对,其中的O-tRNA可被其他的O-RS加载上不同的非天然氨基酸。例如,一个O-tRNA可识别四碱基密码子,而另一个可以识别终止密码子。另外,多个不同的终止密码子或多个不同的四碱基密码子也可以特异性地识别不同的选择者密码子。
在本发明的某些实施方式中,细胞如大肠杆菌细胞包含正交tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、高谷氨酰胺和包含编码目的多肽的多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。翻译系统也可以是无细胞系统,如各种的市售“体外”转录/翻译系统再加上本文所描述的O-tRNA/ORS对和非天然氨基酸。
在一个实施方式中,O-RS和O-tRNA联合在一起所产生的抑制效率至少是缺少O-RS的O-tRNA的抑制效率的5倍、10倍、15倍、20倍、25倍或更高。在一方面,O-RS和O-tRNA联合在一起所产生的抑制效率至少是如上文所列序列的正交合成酶对抑制效率的约35%、40%、45%、50%、60%、75%、80%、90%或更高。
如上所述,本发明还可以包括位于细胞或其他翻译系统内的多个O-tRNA/O-RS对,这样就可以插入不止一个非天然氨基酸,如高谷氨酰胺和其他的非天然氨基酸。例如,细胞还可以包含其他的O-tRNA/O-RS对和第二种非天然氨基酸,其中这个其他的O-tRNA可识别第二选择者密码子,这个其他的O-RS优先用第二种非天然氨基酸氨酰化O-tRNA。例如,包含一种O-tRNA/O-RS对(其中O-tRNA可识别琥珀选择者密码子)的细胞还可以包含第二种正交对,如亮氨酰、赖氨酰、谷氨酰tRNA等(其中第二O-tRNA可识别不同的选择者密码子,如乳白密码子、四碱基密码子等)。不同的正交对最好来源不同,这样有利于对不同选择者密码子的识别。
O-tRNA和/或O-RS可以是天然的,也可以是通过突变天然的tRNA和/或RS而获得的,例如通过制备各种有机体来源的tRNA文库和/或RS文库,或者通过各种已有的突变技术来获得。例如,一种制备正交tRNA/氨酰-tRNA合成酶对的策略是将宿主之外的有机体或多种有机体来源的异源(相对于宿主细胞来说)tRNA/合成酶对导入到宿主细胞内。候选异源合成酶的特性包括不能加载宿主细胞的任何tRNA,优选异源tRNA的特性包括不能被宿主细胞的任何合成酶氨酰化。另外,异源tRNA对于宿主细胞的合成酶来说是正交的。
制备正交对的第二种策略是制备突变文库,然后从中筛选出O-tRNA或O-RS。这些策略可联合使用。
正交tRNA(O-tRNA)
我们期望本发明的正交tRNA(O-tRNA)可以在体内和体外介导非天然氨基酸如高谷氨酰胺向蛋白质内的插入,其中的蛋白质是由含选择者密码子的多核苷酸编码的,这种选择者密码子可被O-tRNA识别。在某些实施方式中,本发明的O-tRNA与包含或编码于上文所列的多核苷酸序列的O-tRNA相比,在同源合成酶存在的条件下,为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。
抑制效率可通过本领域熟知的多种方法检测。例如,可以利用β半乳糖苷酶报告基因分析方法,如将衍生的lacZ质粒(其中构建体含有选择者密码子和lacZ核酸序列)和含有本发明的O-tRNA的质粒一起导入到适宜有机体(如可使用正交组分的有机体)的细胞内。同源的合成酶也要导入(或者以多肽或编码同源合成酶的多核苷酸的形式)。细胞在培养基内生长到预期的密度时,如OD600达到约0.5时,利用BetaFluorTMβ-半乳糖苷酶检测试剂盒(Novagen)进行β半乳糖苷酶活性分析。百分抑制率可以计算为样品相对于可比较对照的活性百分数,如衍生的lacZ构建体所展示的活性,其中构建体在预期位置上含有有义密码子而不是选择者密码子。
本发明的典型O-tRNA为本文所列的序列。也可参见本文的表、实施例和图中所显示的典型O-tRNA和O-RS分子的序列。还可参见本文的“核酸和多肽序列及其变体”部分。在RNA分子,如O-RS mRNA或O-tRNA分子中,其尿嘧啶是由一个给定序列(或者其编码DNA)或其互补链的胸腺嘧啶替换而来的。序列中还可以有其他的碱基修饰。
本发明还包括本文特定的O-tRNA相应的保守突变的O-tRNA。例如,O-tRNA的保守变体包括那些与特定O-tRNA功能类似的分子,如本文所列的序列以及那些依赖自身互补而保持tRNA L型结构但是其序列与本文的列表、图或实施例中所列序列(最好不是野生型的tRNA分子)不一样的序列。参见本文的“核酸和多肽序列及其变体”部分。
含O-tRNA的组合物还可以包含正交氨酰-tRNA合成酶(O-RS),其中的O-RS优先用非天然氨基酸如高谷氨酰胺氨酰化O-tRNA。在某些实施方式中,含有O-tRNA的组合物还可以包含翻译系统(如在体外或体内)。含有编码目的多肽的多核苷酸的核酸,或者这些物质的一种或多种的混合物也可以存在于细胞内,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。参见本文的“正交氨酰-tRNA合成酶”部分。
制备正交tRNA(O-tRNA)的方法也是本发明的特征。利用该方法制备的O-tRNA也是本发明的特征。在本发明的某些实施方式中,O-tRNA可通过构建突变体文库来制备。突变的tRNA文库可用本领域已知的各种技术构建。例如,突变的tRNA可通过位点特异性突变技术、随机点突变技术、同源重组技术、DNA重组技术或其他回归突变方法、嵌合构建、或者混合使用上述技术来制备。
其他的突变也可以被引入到特定位置上,如tRNA环或区的非保守区、保守区、随机区或者混合区,如反密码子环、接受臂、D臂或环、可变环、TPC或tRNA分子上的其他区域。一般来说,tRNA分子上的突变包括突变tRNA突变体文库内每个成员的反密码子环以使其能够识别选择者密码子。该方法还能够将一个额外的序列(CCA)加到O-tRNA的末端。一般来说,O-tRNA对目的有机体的正交性要高于其起始材料,如tRNA序列群,但是却保留了对目的RS的亲和性。
本发明的方法还包括分析tRNAs和/或tRNA合成酶序列的相似性(和/或理论同源性)以确定对特定有机体具有正交性的潜在候选O-tRNA、O-RS和/或O-tRNA/O-RS对。本领域熟知的以及本文所描述的计算机程序都可用于这种分析,如BLAST和pileup程序。在一个实施例中,为了筛选潜在的正交翻译组分用于原核有机体大肠杆菌,需要选择序列与原核有机体不一样的合成酶和/或tRNA。
一般来说,可以通过负筛选第一物种的细胞群来获得O-tRNA,其中的细胞含有O-tRNA群的成员。负筛选可去除含有O-tRNA文库的成员的细胞,其中的O-tRNA成员可被细胞内源性的氨酰-tRNA合成酶(RS)氨酰化。这样就可以得到对第一物种的细胞具有正交性的tRNA库。
在某些实施方式中,进行负筛选时需要将选择者密码子引入到编码负选择标记的多核苷酸中,如能赋予抗生素耐药性的酶如β内酰胺酶,编码可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶(CAT),毒性产物如自杀基因引入到非必须位置上(还能产生功能性的自杀产物)等。筛选还可以通过使细胞群在含筛选试剂(比如抗生素,如氨苄青霉素)的培养基中生长来完成。在一个实施方式中,筛选试剂的浓度是变化的。
例如,为了测定抑制型tRNA的活性,根据选择者密码子如无义密码子或移码突变在体内的抑制活性使用一个筛选系统,其中的选择者密码子被引入到编码负性选择标记如β半乳糖苷酶基因(bla)的多核苷酸内。例如,构建在某个位置(如A184)上含有选择者密码子的多核苷酸变体如bla变体。用这些多核苷酸转化细胞,如细菌。如果存在无法被大肠杆菌内源性合成酶有效加载的正交tRNA,细菌所具有的抗生素耐药性如氨苄青霉素耐药性应当约等于或低于未被质粒转化的细菌的耐药性。如果tRNA不是正交的,或者能加载tRNA的异源合成酶在系统内共表达,那么应该可以观察到更高水平的抗生素耐药性,如氨苄青霉素耐药性。挑出那些无法在抗生素浓度约等于未用质粒转化的细胞的LB琼脂平板上生长的细胞,如细菌。
如果存在毒性产物(如RNA酶或自杀酶),当一群候选tRNA的成员被宿主如大肠杆菌的内源性合成酶氨酰化时(即对于宿主如大肠杆菌的合成酶来说不是正交的),选择者密码子被抑制,所产生的毒性多核苷酸产物可导致细胞的死亡。而含有正交tRNA或非功能性tRNA的细胞存活下来。
在一个实施方式中,目的有机体正交的tRNA库需要进行正筛选,其中选择者密码子位于正选择标记,例如耐药基因如β内酰胺酶基因编码的正选择标记内。正筛选在含有编码或包含细胞正交的tRNA的多核苷酸、编码正选择标记的多核苷酸和编码同源性RS的多核苷酸的细胞内进行。在某些实施方式中,第二群细胞含有无法通过负筛选去除的细胞。多核苷酸在细胞内表达,细胞可在含筛选试剂如氨苄青霉素的培养基内生长。然后根据tRNA被共表达的同源合成酶氨酰化的能力以及响应其选择者密码子而插入氨基酸的能力来筛选tRNA。一般来说,这些细胞与含有非功能性的tRNA或不能被目的合成酶有效识别的tRNA的细胞相比其抑制效应应该是升高的。含有非功能性的tRNA或不能被目的合成酶有效识别的tRNA的细胞对抗生素敏感。因而那些(i)不是宿主如大肠杆菌内源性合成酶的底物;(ii)能被目的合成酶氨酰化;以及(iii)在翻译过程中有功能的tRNA可在两轮筛选中保留下来。
相应的,根据其被筛选的环境不同,同一个标记既可以是正选择标记,也可以是负选择标记。就是说,如果为了筛选它则是正选择标记,如果为了耐受它则是负选择标记。
在上面所描述的方法中,筛选,如正筛选、负筛选或者正负筛选的严格程度还包括改变筛选的严格条件。例如,由于自杀酶是毒性很高的蛋白质,负筛选条件的严格程度可通过将不同数目的选择者密码子引入到自杀基因内和/或通过使用可诱导启动子来加以调控。在另一个实施例中,筛选试剂的浓度是可以改变的(如氨苄青霉素的浓度)。在本发明的一个方面,筛选条件的严格程度是随时变化的,因为在前几轮筛选中目的活性较低。因此,在前几轮中筛选标准的严格程度较低,而在后几轮筛选中需要更严格的筛选标准。在某些实施方式中,负筛选、正筛选或者正负筛选可重复多次。也可以使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方式中,正选择标记和负选择标记可以是相同的。
其他类型的筛选方法也可用于本发明中以制备出正交的翻译组分,如O-tRNA、O-RS和能加载非天然氨基酸如高谷氨酰胺以响应选择者密码子的O-tRNA/O-RS对。例如,负选择标记、正选择标记或正负选择标记可以是在适当反应物存在的情况下能发荧光或催化发光反应的标记。在另一个实施方式中,标记的产物可通过荧光激活的细胞分选法(FACS)或发光检测技术检测。另外,标记还可以是亲和选择标记。参见Francisco,J.A.等,(1993)Production and fluorescence-activated cell sorting ofEscherichia coli expressing a functional antibody fragement on the external surface.Proc Natl Acad Sci USA.90:10444-8。
制备重组正交tRNA的其他方法见于题为“Methods and compositions for theproduction of orthogonal tRNA-aminoacyltRNA synthetase paris”(用于制备正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO 2002/086075和题为“EXPANDING THE EUKARYOTIC GENETIC CODE”(扩充真核遗传密码)的USSN60/479,931及60/496,548。还见于Forster等,(2003)Programming peptidomimeticsynthetases by translating genetic codes designed de novo PNAS 100(11):6353-6357;和Feng等,(2003),Expanding tRNA recognition of a tRNA synthetase by asingle amino acidchange,PNAS 100(10):5676-5681。
正交氨酰-tRNA合成酶(O-RS)
本发明的O-RS在体外或体内优先用非天然氨基酸如高谷氨酰胺氨酰化O-tRNA。本发明的O-RS可通过加入含O-RS的多肽或编码O-RS或O-RS片段的多核苷酸而提供给翻译系统。例如,O-RS的例子包含本文列表和实施例中所列的氨基酸序列或其保守变体。在另一个实施例中,O-RS或O-RS片段是由多核苷酸或其互补序列编码的,该多核苷酸编码本文列表或实施例中所列的氨基酸序列。参见本文列表和实施例中所列的典型O-RS分子的序列。也可参见本文的“核酸和多肽序列及其变体”部分。
鉴定可与O-tRNA作用的正交氨酰-tRNA合成酶(O-RS),如O-RS的方法也是本发明的特征。例如,该方法包括筛选,如正筛选,第一物种的细胞群,其中的个别细胞含有:1)一组氨酰-tRNA合成酶(RS)的一个成员(如这组RS内可能包括突变的RS、第一物种之外的物种来源的RS,或者二者都包括);2)正交tRNA(O-tRNA)(如一个或多个物种来源的);以及3)编码选择标记(如正选择标记)并且含有至少一个选择者密码子的多核苷酸。筛选出那些与缺乏RS成员或RS成员数目少的细胞相比抑制效率升高的细胞。抑制效率可用本领域熟知的和本文所描述的方法测定。抑制效率升高的细胞包含有活性的RS,这些RS可氨酰化O-tRNA。来自于第一物种的第一组tRNA被有活性的RS氨酰化的水平(体外或体内)与来自于第二物种的第二组tRNA被有活性的RS氨酰化的水平相比较。氨酰化的水平可通过检测底物(标记的氨基酸或非天然氨基酸,如标记的高谷氨酰胺)来确定。一般来说被筛选出的有活性的RS氨酰化第二组tRNA的效率比第一组更高,因此可获得能更有效作用于O-tRNA的正交氨酰-tRNA合成酶。利用这种方法鉴定出的O-RS也是本发明的特征。
许多分析方法都可用于确定氨酰化的水平。这些方法可在体外或体内进行。例如,体外氨酰化水平分析方法被描述于Hoben和Soll(1985)Methods Enzymol.113:55-59中。氨酰化水平还可以通过利用一个与正交翻译组分相连的报告分子并检测报告基因在表达多核苷酸的细胞内的水平来确定,其中的多核苷酸至少含有一个编码蛋白质的选择者密码子。见题为“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS(非天然氨基酸的体内插入)”的WO 2002/085923和2004年4月16日提交的国际专利申请PCT/US2004/011786。
鉴定出的O-RS还可以被进一步修饰以改变合成酶的底物特异性,这样O-RS就只能将我们所期望的非天然氨基酸如高谷氨酰胺而不是其他任何的20种常见氨基酸加载到O-tRNA上。制备对非天然氨基酸具有底物特异性的正交氨酰tRNA合成酶的方法包括突变合成酶,例如在合成酶的活性位点、编辑机制位点上突变合成酶,在不同的位点上将合成酶的不同区域连接起来等等,然后通过筛选过程加以筛选。还有一种策略是根据先使用正筛选,随后通过负筛选来完成。在正筛选过程中,被引入到正选择标记非必需位置上的选择者密码子所产生的抑制效应可使细胞在正筛选压力下存活下来。如果同时存在天然氨基酸和非天然氨基酸,存活下来的细胞就可以编码有活性的合成酶,这些合成酶利用天然的或非天然的氨基酸可氨酰化正交的抑制型tRNA。在负筛选过程中,被引入到负选择标记非必需位置的选择者密码子所产生的抑制效应可去除具有天然氨基酸特异性的合成酶。经过负筛选和正筛选存活下来的细胞所编码的合成酶只能用非天然氨基酸来氨酰化(加载)正交的抑制型tRNA。这些合成酶可被进一步突变,如通过DNA重组技术或其他回归突变方法突变。
突变的O-RS文库可利用本领域熟知的各种技术来构建。例如,可通过位点特异性突变技术、随机点突变技术、同源重组技术、DNA重组技术或其他回归突变方法、嵌合构建、或者混合使用上述技术来制备。例如,可利用两个或多个较小的、低分散的“亚文库”来构建突变的RS文库。本发明还包括RS的嵌合文库。应当注意的是也可以构建各种有机体(例如微生物如真细菌或古细菌)的tRNA合成酶文库,如具有天然多样性的文库(见Short等人的美国专利No.6,238,884;Schallenberger等人的美国专利No.5,756,316;Petersen等人的美国专利No.5,783,431;Thompson等人的美国专利No.5,824,485;Short等人的美国专利No.5,958,672)来筛选正交对。
合成酶一旦通过正筛选和负筛选过程,这些合成酶就应该进一步被诱变。例如,分离编码O-RS的核酸;利用该核酸制备出一组编码突变的O-RS(如通过随机突变、位点特异性突变、重组或联合技术)的多核苷酸;这些步骤的每一步或者所有这些步骤都可以重复进行直到获得能够优先用非天然氨基酸如高谷氨酰胺氨酰化O-tRNA的突变O-RS。在本发明的一个方面,步骤可进行多次,如至少两次。
其他严格程度的筛选条件也可用于本发明的方法中以制备O-tRNA、O-RS或O-tRNA/O-RS对。筛选条件的严格程度在制备O-RS的一个步骤或两个步骤中可以是不同的。这包括改变筛选试剂的使用浓度等。还可以进行额外轮次的正筛选和/或负筛选。筛选还可以包括氨基酸渗透性的一次或多次改变,翻译效率的改变、翻译精确度的改变等。一般来说,要根据有机体的一个或多个基因上的突变来确定进行一次或多次改变,其中正交的tRNA-tRNA合成酶对被用于制备蛋白质。
制备O-RS以及改变合成酶的底物特异性的其他通用细节可参见名称为Methodsand compositions for the production of orthogonal tRNA-aminoacyltRNA synthetaseparis”(用于制备正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO 2002/086075和申请日为2004年4月16日的国际专利申请PCT/US2004/011786。
来源和宿主有机体
本发明的翻译组分可来源于非真核有机体。例如,正交的O-tRNA可来源于非真核有机体(或有机体混合物),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernR,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌(Mm),超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌(Ss),硫化叶菌(Sulfolobustokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌(Thermusthermophilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermphilus)等,正交的O-RS也可以来源于非真核有机体(或有机体混合物),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌,超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌,硫化叶菌(Sulfolobustokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等。在一个实施方式中,真核有机体如植物、藻类、原生生物、真菌、酵母、动物(如哺乳动物、昆虫、节肢动物等)等也可作为O-tRNA和O-RS的来源。
O-tRNA/O-RS对的各个组分可以来源于同一有机体,也可以来源于不同有机体。在一个实施方式中,O-tRNA/O-RS对来源于同一有机体。另外O-tRNA/O-RS对的O-tRNA和O-RS也可以来源于不同有机体。在一个优选实施方式中,古细菌超嗜热古菌的赖氨酰合成酶/tRNA对被用作大肠杆菌翻译系统正交对。如本文所描述,这个正交对被修饰使其能够识别四碱基选择者密码子,也可以被修饰成能够用非天然氨基酸如高谷氨酰胺加载O-tRNA的形式。这个正交对(或其修饰形式)也可以与以前描述的正交对联合使用,如那些詹氏甲烷球菌来源的,经修饰后能识别终止选择者密码子的正交对。这样就可以通过在目的翻译系统中加入包含两个或多个能被O-tRNA/O-RS对识别的选择者密码子的蛋白质编码核酸,从而使制备出的蛋白质含有两个不同的非天然氨基酸。
可在体内或体外,或者利用细胞,如非真核细胞或真核细胞,来筛选O-tRNA、O-RS或O-tRNA/O-RS对以制备出含高谷氨酰胺或其他非天然的目的氨基酸的多肽。非真核细胞可以是各种来源的,如真细菌,如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等,或者古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrumpernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌,超耐高温热棒菌,火球菌(Pyrococcusabyssi),硫磺矿硫化叶菌,硫化叶菌(Sulfolobus tokodaii),噬酸热原体,火山热原体等。真核细胞也可以是各种来源的,如植物(如复杂植物,如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母(如酿酒酵母)、动物(如哺乳动物、昆虫、节肢动物等)等。含本发明的翻译组分的细胞组合物也是本发明的特征。
筛选一个物种的O-tRNA和/或O-RS用于另外一个物种的描述见申请日为2004年4月16日的国际专利申请PCT/US2004/011786。
选择者密码子
本发明的选择者密码子扩大了蛋白质生物合成机的遗传密码框架。例如,选择者密码子包括独特的三碱基密码子,无义密码子如终止密码子,例如琥珀密码子(UAG)、或乳白密码子,一种非天然密码子,至少一个四碱基密码子(如AGGA),一个稀有密码子等。不同数目的选择者密码子都可以被插入到目的基因内,如一个、两个、三个或三个以上等。通过使用不同的选择者密码子,可利用多个正交tRNA/合成酶对同时将多个不同的非天然氨基酸同时引入到特异性位点上。
在一个实施方式中,本发明的方法包括利用终止密码子作为选择者密码子在体内将高谷氨酰胺引入到细胞内。例如,制备出可识别四碱基选择者密码子的O-tRNA,然后被O-RS氨酰化加载上高谷氨酰胺。这个O-tRNA不被翻译系统内源性的氨酰-tRNA合成酶所识别。可利用常规的位点特异性突变技术将选择者密码子引入到编码目的多肽的靶多核苷酸的特定位点上。参见Sayers,J.R.等,(1988),″5′,3′Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis.″Nucleic Acids Res,791-802。当O-RS、O-tRNA和编码目的多肽的核酸在体内结合时,高谷氨酰胺因响应选择者密码子而被插入,制备出一个在特定位置上含高谷氨酰胺的多肽。
非天然氨基酸如高谷氨酰胺在体内的插入对宿主细胞可以不产生显著影响。例如,在非真核细胞如大肠杆菌内,由于终止选择者密码子UAG的抑制效率依赖于O-tRNA如琥珀抑制型tRNA和释放因子1(RF1)(RF1可结合UAG密码子,启动正在合成的肽从核糖体上释放下来)之间的竞争,因此可通过增加O-tRNA如抑制型tRNA的表达水平或者利用RF1缺陷株来调节抑制的效率。在真核细胞内,由于UAG密码子的抑制效率依赖于O-tRNA如琥珀抑制型tRNA和真核释放因子(如eRF)(eRF可结合终止密码子,启动正在合成的肽从核糖体上释放下来)之间的竞争,因此可通过增加O-tRNA如抑制型tRNA的表达水平来调节抑制的效率。另外,也可以通过添加其他的化合物来调节释放因子的活性,例如还原剂二硫苏糖醇(DTT)。
非天然氨基酸,包括高谷氨酰胺,也可以被稀有密码子编码。例如,当体外蛋白合成反应体系内的精氨酸浓度下降时,稀有的精氨酸密码子AGG被证实可通过一个丙氨酸酰化的合成tRNA有效地将丙氨酸插入到多肽链内。见Ma等,Biochemistry,32:7939(1993)。在这种情况下,合成的tRNA可与天然的tRNAArg竞争,后者作为稀有成分存在于大肠杆菌内。另外,某些有机体无法利用所有的三联密码子。藤黄微球菌(Micrococcus luteus)内的独立密码子AGA可被用于氨基酸在体外转录/翻译提取物内的插入。见Kowal和Oliver,Nucl.Acid.Res.,25:4685(1997)。在体内利用这些稀有密码子可以制备出本发明的组分。
选择者密码子还包括扩充的密码子,例如四碱基或多碱基密码子,如四碱基、五碱基、六碱基或多碱基密码子。四碱基密码子的例子有AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子有AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明的方法包括使用基于移码抑制的扩充密码子。四碱基或多碱基密码子可用于将一个或多个非天然氨基酸如高谷氨酰胺插入到同一个蛋白质内。在其他的实施方式中,反密码子环可以解码至少一个四碱基密码子、至少一个五碱基密码子、至少一个六碱基密码子等。由于共有256个可能的四碱基密码子,因此,利用四碱基或多碱基密码子可在同一个细胞内编码多个非天然氨基酸。见Anderson等,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology,9:237-244;以及Magliery,(2001)Expanding the Genetic Code:Selection of EfficientSuppressors of Four-base Codons and Identification of″Shiffy″Four-base Codons with aLibrary Approach in Escherichia coli,J.Mol.Biol.307:755-769。
例如,利用体外生物合成方法通过四碱基密码子可将非天然氨基酸插入到蛋白质内。见Ma等,(1993)Biochemistry,32:7939;以及Hohsaka等,(1999)J.Am.Chem. Soc.,121:34。CGGG和AGGU与两个化学酰化的移码抑制型tRNA一起可以将赖氨酸的2-萘丙氨酸和NBD衍生物同时插入到链亲和素内。见Hohsaka等,(1999)J.Am. Chem.Soc.,121:12194。在一个体内试验中,Moore等人检测了tRNALeu衍生物和NCUA反密码子抑制UAGN密码子的能力(N代表U、A、G或C),结果发现四联密码子UAGA可被携带UCUA反密码子的tRNALeu解码,其效率为13~26%,在0或-1框架处解码。见Moore等,(2000)J.Mol.Biol.298:195。在一个实施方式中,来源于稀有密码子或无义密码子的扩充密码子被用于本发明中,这些密码子可降低在其他非目的位点上发生错义通读和移码校正抑制的几率。在本文的实施例中,描述了一种能识别AGGA选择者密码子的正交对,该正交对可在蛋白翻译过程中将高谷氨酰胺插入。
在一个给定的系统中,选择者密码子还可以是一个天然的三碱基密码子,其中内源性的翻译系统不能利用(或很少利用)这个天然的三碱基密码子。例如,缺乏能识别天然三碱基密码子的tRNA的系统和/或三碱基密码子是稀有密码子的系统。
选择者密码子还包括非天然碱基对。这些非天然碱基对进一步扩充了现有的遗传密码表。一个额外的碱基对就可以将三联密码子的数目从64个增加到125个。第三碱基对的特性包括稳定而特异的碱基配对、可以被聚合酶高保真地插入到DNA内、以及在起始非天然碱基对合成以后可进一步延伸引物。可用于本发明的方法和组合物中的非天然碱基对描述于Hirao等,(2002)An unnatural base pair forincorporating amino acid analogues into protein,Nature Biotechnology,20:177-182和Wu,Y.等,(2002)J.Am.Chem.Soc.124:14626-14630。其他相关的文献将在下文列出。
非天然核苷在用于体内时是可以穿透生物膜的,被磷酸化后形成相应的三磷酸盐形式。另外,这些增加的遗传信息是稳定的,不易被细胞的酶破坏。Benner及其同事在以前的试验中利用了氢键模式的特点,这些氢键模式与经典的Watson-Crick碱基对内的氢键模式是不同的,其中最值得注意的是iso-C:iso-G对。见Switzer等,(1989)J.Am.Chem.Soc.,111:8322和Piccirilli等,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol.,4:602。一般来说,这些碱基会与天然碱基发生某种程度的错配,并且不能被酶催化而复制。Kool及其同事的研究表明碱基之间的疏水性包裹作用可被氢键代替,从而驱动碱基对的形成。见Kool,(2000)Curr.Opin.Chem.Biol.,4:602和Guckian和Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。为了开发出能满足上述所有要求的非天然碱基对,Schultz、Romesberg及其同事系统地合成和研究了一系列的非天然疏水碱基。结果发现PICS:PICS自身配对比天然碱基对更稳定,可以被大肠杆菌DNA聚合酶I的Klenow片段(KF)插入到DNA内。见McMinn等,(1999)J.Am.Chem.Soc.,121:11586和Ogawa等,(2000)J.Am.Chem.Soc.,122:3274。3MN:3MN自身配对可由KF合成,其活性和特异性足以满足其行使生物学功能。见Ogawa等,(2000)J.Am.Chem.Soc.122:8803。但是,这两个碱基都作为链的末端以便于进一步复制。最近开发出了一种可用于复制PICS自身配对的突变的DNA聚合酶。另外,7AI自身配对也能被复制。见Tae等,(2001)J.Am.Chem.Soc.,123:7439。一种新型的金属碱基对Dipic:Py也被开发出来,该碱基对在结合Cu(II)后可形成稳定的碱基对。见Meggers等,(2000)J.Am.Chem.Soc.,122:1071。由于扩充的密码子和非天然密码子本来就是与天然密码子正交的,因此本发明的方法可利用这一特性来制备用于这些密码子的正交tRNA。
一种翻译旁路系统也可用于将高谷氨酰胺或其他非天然氨基酸插入到目的多肽内。在翻译旁路系统中,一个不能被翻译成蛋白的大片段序列被插入到基因内。这个序列含有一个可作为提示符的结构,诱导核糖体跳过这个序列,在这个插入片段的下游恢复翻译。
非天然氨基酸
如本文所述,非天然氨基酸是指除硒氨酸和/或吡咯赖氨酸和下列20个遗传密码编码的α氨基酸之外的所有氨基酸、修饰氨基酸或氨基酸类似物:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α氨基酸的通用结构可用结构式I表示:
非天然氨基酸一般都具有结构式I的结构,其中R基团代表20个天然氨基酸使用的基团之外的任何取代基。见L.Stryer编的《生物化学》(Biochemistry)(第三版,1988,Freeman and Company,New York)以了解20个天然氨基酸的结构。需要注意的是,本发明的非天然氨基酸也可以是上述20个α氨基酸之外的天然化合物(或者人工制备的合成化合物)。
一般来说,本发明的非天然氨基酸在侧链上与天然氨基酸是不同的,因此非天然氨基酸可以与其他氨基酸形成酰胺键,形成的方式与天然蛋白中的酰胺键一样。但是,非天然氨基酸含有将其与天然氨基酸区别开来的侧链基团。
在将非天然氨基酸插入蛋白质的过程中令我们非常感兴趣的是它有能力插入高谷氨酰胺。对于其他的非天然氨基酸来说,结构式I中的R基团可以是烷基、芳基、酰基、酮基、叠氮基、羟基、肼、腈基、卤素-、酰肼、烯基、炔基、醚、巯醇、硒基、磺酰基、硼酸基、磷酸基、磷、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺、胺等,或上述基团的混合物。我们感兴趣的其他非天然氨基酸包括而不限于含光活化交联物的氨基酸、自旋-标记的氨基酸、荧光标记的氨基酸、金属结合的氨基酸、含金属的氨基酸、放射性氨基酸、含有新官能团的氨基酸、与其他分子共价或非共价结合的氨基酸、光陷阱(photocaged)和/或可感光异构的(photoisomerizable)氨基酸、含生物素或生物素类似物的氨基酸、含酮类的氨基酸、糖基化的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代氨基酸、可化学裂解或光裂解的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如超过约5个、约10个碳原子的聚醚或长链烃)、含碳连接糖的氨基酸、具有氧化还原活性的氨基酸、含氨基硫代酸的氨基酸、以及含一个或多个毒性基序的氨基酸。在某些实施方式中,非天然氨基酸含有光活化交联物。在一个实施方式中,非天然氨基酸含有连接于氨基酸侧链上的糖基和/或其他糖类修饰。
非天然氨基酸除了可以包含新型侧链以外,还可以包含经修饰的骨架结构,如结构式II和III所示的结构:
Figure G200480019464120060126D000251
式中,Z一般为OH、NH2、SH、NH-R′或S-R′;X和Y可以相同或不同,一般包括S或O,R和R′可以相同,也可以不同,一般选自与上述结构式I所示的非天然氨基酸的R基团相同的一组取代基团以及氢。例如,本发明的非天然氨基酸还可以在结构式II和III所示的氨基或羧基上含有取代基团。这一类型的非天然氨基酸包括而不限于带20个常见氨基酸相应的侧链或非天然侧链的α-羟酸、α-硫代酸、α-氨基硫代羧酸盐。另外,α碳原子上的取代基还包括L,D或α-α-双取代基氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨酪酸等。其他的结构形式包括环形氨基酸,如脯氨酸类似物以及3、4、6、7、8和9环脯氨酸类似物,β和γ氨基酸,如取代的β丙氨酸和γ-氨酪酸。本发明其他结构的非天然氨基酸包括同型-β-型结构,比如其中临近α碳原子处有一个亚甲基或氨基夹心,例如同型-β-酪氨酸、α-胼基-酪氨酸的同分异构体。如图所示:
Figure G200480019464120060126D000261
许多非天然氨基酸来源于天然氨基酸,如酪氨酸、谷氨酰胺、苯丙氨酸等。例如,酪氨酸类似物包括副取代酪氨酸、正取代酪氨酸和偏取代酪氨酸,其中取代酪氨酸携带乙酰基、苯甲酰基、氨基、肼、羟氨基、巯基、羧基、异丙基、甲基、C6-C20直链或支链烷基、饱和或不饱和烷基、O-甲基、聚醚基等。另外,也可以包含多取代芳环。本发明的谷氨酰胺类似物包括而不限于α-羟基衍生物、γ-取代衍生物、环状衍生物和酰胺取代基谷氨酰胺衍生物。典型的苯丙氨酸类似物的例子包括而不限于副取代苯丙氨酸、正取代苯丙氨酸和偏取代苯丙氨酸,其中的取代基包括羟基、甲氧基、甲基、丙稀基、醛基或酮基等。非天然氨基酸的特殊例子包括而不限于高谷氨酰胺、3,4-羟基-L-苯丙氨酸、p-乙酰基-L-苯丙氨酸、p-炔丙氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-丙稀基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAc-丝氨酸、L-多巴、含氟苯丙氨酸、异丙基-L-苯丙氨酸、p-叠氮基-L-苯丙氨酸、p-酰基-L-苯丙氨酸、p-苯甲酰基-L-苯丙氨酸、L-磷丝氨酸、磷酰基丝氨酸、磷酰基酪氨酸、p-碘-苯丙氨酸、p-溴苯丙氨酸、p-氨基-L-苯丙氨酸以及异丙基-L-苯丙氨酸等。各种非天然氨基酸的结构显示在题为“非天然氨基酸的体内插入”的WO 2002/085923的图16、17、18、19、26和29中。
非天然氨基酸的化学合成
上面所提到的许多非天然氨基酸都可以从Sigma(USA)或Aldrich(Milwaukee,WI,USA)等公司购买到。那些未商业化的非天然氨基酸可以利用文献中或本领域技术人员熟知的方法合成。见Fessendon和Fessendon的《有机化学》(Organic Chemistry)(1982,第二版,Willard Grant Press,Boston Mass.);March的《高级有机化学》(Advanced Organic Chemistry)(第三版,1985,Wiley and Sons,New York);以及Carey和Sundberg的《高级有机化学》(Advanced Organic Chemistry)(第三版,A和B部分,1990,PlenumPress,New York)。其他描述非天然氨基酸合成的文献包括:题为“非天然氨基酸的体内插入”的国际专利申请WO 2002/085923;Matsoukas等,(1995)J.Med.Chem.,38,4660-4669;King,F.E.和Kidd,D.A.A.(1949)A New Synthesis of Glutamine and ofγ-Dipeptides of Glutamic Acid from Phthylated Intermediates.J.Chem.Soc.,3315-3319;Friedman,O.M.和Chatterrji,R.(1959)Synthesis of Derivatives of Glutamine as ModelSubstrates for Anti-tumor Agents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等(1988)Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F.(1991)Glutamine analogues asPotential Antimalarials,Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P.和Rapoport,H.(1989)Synthesis of 4-Substituted Prolines as Conformationally Constrained AminoAcid Analogues.J.Org.Chem.54,1859-1866;Christie,B.D.和Rapoport,H.(1985)Synthsis if Optically Pure Pipecolates from L-Asparagine.Application to the TotalSynthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium IonCyclization.J.Org.Chem.1989:1859-1866;Barton等,(1987)Synthesis of Novelα-Amino-Acids and Derivatives Using Radical Chemistry:Synthesis of L-andD-α-Amino-Adipic Acids,L-α-aminopimelic Acid and Appropriate UnsaturatedDerivatives.Tetrahedron Lett.43:4297-4308;以及Subasinghe等,(1992)Quisqualic acidanalogues:synthesis of beta-heterocyclic 2-aminopropanoic dcid derivatives and theiractivity at a novel quisqualate-sensitized site.J.Med.Chem.35:4602-7。还可以参见2003年12月22日提交的题为“Protein Arrays(蛋白质阵列)”的国际专利申请PCT/US03/41346。
非天然氨基酸的细胞摄取
一般来说,在设计和筛选非天然氨基酸,如用于插入到蛋白质中,的时候需要考虑的一个问题就是细胞对非天然氨基酸的摄取。例如,带高密度电荷的α氨基酸是不可能透过细胞膜的。天然氨基酸通过以蛋白质为基础的转运系统的收集进入到细胞内,但是这些转运系统一般都有不同程度的氨基酸特异性。有一种快速筛选方法可用于评价哪种非天然氨基酸可被细胞摄取。见下列文献中的毒性分析方法:2003年12月22日提交的题为“Protein Arrays(蛋白质阵列)”的国际专利申请PCT/US03/41346;以及Liu,D.R.&Schultz,P.G.(1999)Progress toward the evolutionofanorganism with an expanded genetic code.PNAS United States 96:4780-4785。虽然可以通过各种方法很容易地分析摄取的情况,但是,设计能利用细胞摄取通路的非天然氨基酸的另外一种方法是在体内提供生物合成通路来合成氨基酸。
非天然氨基酸的生物合成
在细胞内已经存在许多生物合成通路用于合成氨基酸和其他化合物。但是某种特定非天然氨基酸的生物合成方法在自然界中可能是不存在的,如在细胞内,本发明提供了这样的方法。例如,可以通过加入新的酶或者修饰现有的宿主细胞通路来设计出非天然氨基酸的生物合成通路。额外的新酶可以是天然的酶,也可以是经人工改造的酶。例如,p-氨基苯丙氨酸(如上述WO 2002/085923的实施例中存在的氨基酸)的生物合成依赖于添加其他有机体来源的已知酶的混合物。可以通过用含这些酶的基因的质粒转化细胞而将这些基因导入到细胞内。这些基因在细胞内表达时,可以提供一个酶催化通路来合成所需要的化合物。可用于本发明的这类酶的典型例子见下面实施例的描述。这些额外的酶的序列可在Genbank中找到。人工修饰的酶也可以同样的方式加入到细胞内。在这种方式中,可以通过选择细胞内合成机器和细胞的来源来制备非天然氨基酸。
许多方法确实都可用于在体外或体内制备生物合成通路所用的新型酶、改造现有的通路、制备非天然氨基酸。许多现有的修饰酶和生物合成通路其他组分的方法都可用于本发明以制备非天然氨基酸(或者修饰酶使其具有新的底物特异性或其他有用的活性)。例如,DNA重组技术可用于制备新型酶和/或这种酶的通路以便于在体外或体内制备非天然氨基酸(或制备新的合成酶)。见Stemmer(1994),Rapid evolutionof a protein in vitro by DNA shuffling,Nature 370(4):389-391;以及Stemmer,(1994),DNA shuffling by random fragmentation and reassembly:In vitro recombination formolecular evolution,Proc.Natl.Acad.Sci.USA.,91:10747-10751。一个相似的方法可以使相关家族的基因(如同源的基因)快速地进化成具有所需特性的酶。这种“家族基因重组”方法的一个典型例子见于Crameri等(1998)DNA shuffling of a family of genesfrom diverse species accelerates directedevolution Nature,391(6664):288-291的描述。新型酶(生物合成通路的组分或合成酶)也可以通过DNA重组方法制备,这种方法被称为“制备杂交酶的渐进式截断技术”(ITCHY),如Ostermeier等,(1999)″Acombinatorial approach to hybrid enzymes independent of DNA homology″Nature Biotech 17:1205中所描述的。这种方法也可用于制备酶或其他通路变体的文库,其中的酶或通路变体可作为一种或多种体外或体内重组方法的底物。见Ostermeier等(1999)″Combinatorial Protein Engineering by Incremental Truncation,″Proc.Natl.Acad. Sci.USA,96:3562-67,和Ostermeier等(1999),″Incremental Truncation as a Strategy inthe Engineering ofNovel Biocatalysts,″Biological and Medicinal Chemistry,7:2139-44。另外一种方法可通过指数整体诱变来制备酶或其他通路变体的文库,通过筛选文库可以找到一些酶或其他通路变体,这些酶和通路变体能够催化用于制备非天然氨基酸(或新的合成酶)的生物合成反应。在这种方法中,目的序列上的残基小组合可被用于随机地平行鉴定位置发生改变的从而导致具有新功能的蛋白产生的每一个氨基酸。能用于本发明来制备可生产非天然氨基酸的新酶(或新的合成酶)的这种方法的例子见于Delegrave和Youvan(1993)Biotechnology Research 11:1548-1552的描述。在另一种方法中,利用掺入的(doped)或退化的寡核苷酸来改造酶和/或通路组分的随机或半随机突变方法也可以被使用,例如通过Arkin和Youvan(1992)″Optimizingnucleotide mixtures to encode specific subsets of amino acids for semi-randommutagenesis″Biotechnology 10:297-300或Reidhaar-Olson等(1991)″Randommutagenesis of protein sequences using oligonucleotide cassettes″Methods Enzymol.208:564-86所描述的通用突变方法。被称为“非随机”突变的另一种方法通过多核苷酸重新组装和位点饱和突变技术来制备酶和/或通路组分,然后筛选这些酶或组分以确定其是否具有一种或多种合成酶或生物合成通路的功能(如在体内制备非天然氨基酸)。见Short的专利申请WO 00/46344,专利名称为“基因疫苗和酶的非随机制备”。
这种突变方法的一种替代方法包括重组有机体的完整基因组并筛选具有特定通路功能的子代(通常被称为“完整基因组重组技术”)。这种方法也可用于本发明中,如通过基因组重组和筛选有机体(如大肠杆菌或其他细胞)来找到能够制备出非天然氨基酸(或其中间体)的有机体。例如,下列文献中所描述的方法就可用来设计通路以修饰细胞内现有的和/或新的通路,用于在体内制备非天然氨基酸:Patnaik等(2002)″Genome shuffling of lactobacillus for improved acid tolerance″Nature Biotechnology,20(7):707-712;以及Zhang等(2002)″Genome shuffling leads to rapid phenotypicimprovement in bacteria″Nature,02-7,415(6872):644-646。
现在还有一些其他的技术可被用来改造用于制备目的化合物的有机体和代谢通路,这些方法也可用于制备非天然氨基酸。描述这种通路改造方法的文献包括:Nakamura和White(2003)″Metabolic engineering for the microbial production of 1,3propanediol″Curr.Opin.Biotechnol.14(5):454-9;Berry等(2002)″Application ofMetabolic Engineering to improve both the production and use of Biotech Indigo″J. Industrial Microbiology and Biotechnology28:127-133;Banta等(2002)″Optimizing anartificial metabolic pathway:Engineering the cofactor specificity of Corynebacterium2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis″Biochemistry,41(20),6226-36;Selivonova等(2001)″Rapid Evolution ofNovel Traits in Microorganisms″Appllied and Environmental Microbiology,67:3645等等。
一般来说,无论用什么方法,用本发明的人工生物合成通路制备出的非天然氨基酸的浓度都足以满足蛋白质的生物合成,如细胞内的天然含量,但是其浓度还没有对细胞内的其他氨基酸的浓度产生显著影响,或者耗竭掉细胞内的资源。用这种方法在体内制备出的浓度一般约为10mM到0.05mM。一旦细胞经过改造可以产生用于特异性通路和非天然氨基酸制备的酶以后,就需要进行体内筛选以进一步优化用于核糖体蛋白合成和细胞生长的非天然氨基酸的制备。
用于插入高谷氨酰胺的正交组分
本发明提供了用于在体内将高谷氨酰胺插入到正在合成的多肽链中以响应选择者密码子,如终止密码子、无义密码子、四碱基或多碱基密码子等的正交组分的制备方法和组合物。例如,本发明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及其正交对。这些正交对可用于将高谷氨酰胺插入到正在合成的多肽链中。
本发明的组合物包括正交氨酰-tRNA合成酶(O-RS),其中的O-RS优先用高谷氨酰胺氨酰化O-tRNA。在某些实施方式中,O-RS含有携带SEQ ID NO:1或其保守变体的氨基酸序列。在本发明的某些实施方式中,O-RS优先氨酰化O-tRNA,其效率至少是含氨基酸序列SEQ ID NO.:1的多肽的50%。
含有O-RS的组合物还可以含有正交tRNA(O-tRNA),其中的O-tRNA可识别选择者密码子。一般来说,与包含或编码于本文序列表和实施例所列的多核苷酸序列的O-tRNA相比,在同源合成酶存在的条件下,本发明的O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。在一个实施方式中,O-RS联合O-tRNA所产生的抑制效率至少比缺少O-RS的O-tRNA所产生的抑制效率高5倍、10倍、15倍、20倍、25倍或更高。一方面,O-RS联合O-tRNA所产生的抑制效率至少是詹氏甲烷球菌来源的正交酪氨酰-tRNA合成酶对所产生的抑制效率的45%。
包含O-tRNA的组合物还可以包含细胞(例如非真核细胞如大肠杆菌等,或真核细胞)和/或翻译系统。
包含翻译系统的细胞(如非真核细胞或真核细胞)也是本发明的内容,其中的翻译系统包括正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和高谷氨酰胺。一般来说,O-RS优先氨酰化O-tRNA,其效率至少是含氨基酸序列SEQ ID NO.:1多肽的50%。O-tRNA可识别第一选择者密码子,O-RS优先用高谷氨酰胺氨酰化O-tRNA。在一个实施方式中,O-tRNA含有SEQ ID NO.:2所示的序列或其互补多核苷酸序列,或者被该序列编码。在一个实施方式中,O-RS含有任何一个SEQ ID NO.:1或其保守变体所示的氨基酸序列。
本发明的细胞还可以包含其他的O-tRNA/O-RS对和第二种非天然氨基酸,例如,其中的这个O-tRNA可识别第二选择者密码子,这个O-RS优选用第二种非天然氨基酸氨酰化O-tRNA。另外,本发明的细胞还可以包含含有目的多肽编码多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。
在某些实施方式中,本发明的细胞包括大肠杆菌细胞,细胞内含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、高谷氨酰胺和含有目的多肽编码多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。
在本发明的某些实施方式中,本发明的O-tRNA含有本文列表中和实施例中所示的多核苷酸序列或其互补的多核苷酸序列,或者被这些序列编码。在本发明的某些实施方式中,O-RS含有序列表中所示的氨基酸序列或其保守变体。在一个实施方式中,O-RS或其片段被编码本文列表中和实施例中所示的氨基酸序列的多核苷酸序列或其互补的多核苷酸序列编码。
本发明的O-tRNA和/或O-RS可来源于各种有机体(如真核和/或非真核有机体)。
多核苷酸也是本发明的特征。本发明的多核苷酸包括人工的(如人造的和非天然产生的)多核苷酸,其中含有编码本文列表所示多肽的核苷酸序列,和/或与该多核苷酸序列互补或者就是那个多核苷酸序列。本发明的多核苷酸还包括在较严格的条件下能与上述多核苷酸在核酸全长上杂交的核酸。本发明的多核苷酸还包括与天然tRNA或其相应编码核酸的序列具有至少75%、80%、90%、95%、98%或更高相同性的多核苷酸(但是本发明的多核苷酸不是天然tRNA或其相应的编码核酸),其中的tRNA可识别选择者密码子,如四碱基密码子。与上述任何多核苷酸序列至少有80%、90%、95%、98%或更高相同性的人工多核苷酸序列,和/或含上述序列保守变体的多核苷酸也包括在本发明的多核苷酸中。
含本发明的多核苷酸的载体也是本发明的特征。例如,本发明的载体可以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明的载体的细胞也是本发明的特征。
O-tRNA/O-RS对的组分的制备方法也是本发明的特征。利用这些方法制备出的组分也是本发明的特征。例如,至少制备一个与细胞正交的tRNA(O-tRNA)的方法包括制备突变的tRNA文库;突变tRNA突变文库内每一个成员的反密码子环使其能识别选择者密码子,从而形成一个O-tRNA文库,负筛选第一物种的第一细胞群,其中的细胞含有O-tRNA文库的成员。负筛选可去除含O-tRNA文库的成员的细胞,其中的O-tRNA可被细胞内源性的氨酰-tRNA合成酶(RS)氨酰化。这样就形成一个与第一物种的细胞正交的tRNA库,从而至少可以获得一个O-tRNA。利用本发明的方法制备出的O-tRNA也包括在本发明之内。
在某些实施方式中,本发明的方法还包括正筛选第一物种的第二细胞群,其中的细胞含有与第一物种的细胞正交的tRNA库的成员、同源的氨酰-tRNA合成酶和正选择标记。通过正筛选筛选出的那些细胞含有能被同源氨酰-tRNA合成酶氨酰化的tRNA库的成员,在正选择标记存在的情况下可出现预期的反应,从而可以获得O-tRNA。在某些实施方式中,第二细胞群含有没有被负筛选去除的细胞。
本发明还提供了能将高谷氨酰胺加载到O-tRNA上的正交-氨酰-tRNA合成酶的鉴定方法。例如,该方法包括筛选第一物种的细胞群,其中的细胞都含有1)一组氨酰-tRNA合成酶(RS)的成员(如一组RS可包括突变的RS、第一物种之外的物种来源的RS、或者二者都包括);2)正交-tRNA(O-tRNA)(如来源于一个或多个物种);以及3)编码正选择标记并且至少包含一个选择者密码子的多核苷酸。
筛选细胞(如宿主细胞)以挑出与不含RS群的成员或含量较少的细胞相比抑制效率升高的那些细胞。这些被筛选出的细胞含有能氨酰化O-tRNA的有活性的RS。利用这种方法鉴定出的正交氨酰-tRNA合成酶也是本发明的特征。
在细胞(例如非真核细胞如大肠杆菌细胞等,或者真核细胞)内制备特定位置上为高谷氨酰胺的蛋白质的方法也是本发明的特征。例如,一种方法是在适当的培养基内培养细胞,其中的细胞含有核酸,该核酸至少含有一个选择者密码子,编码一个蛋白,加入高谷氨酰胺,在至少含有一个选择者密码子的核酸的翻译过程中高谷氨酰胺被插入到蛋白质的特定位置上,生成蛋白质。细胞还含有:在细胞内有功能并且能识别选择者密码子的正交-tRNA(O-tRNA);以及优先用高谷氨酰胺氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用这种方法制备的蛋白质也是本发明的特征。
本发明还提供了包含蛋白质的组合物,其中的蛋白质含有高谷氨酰胺。在某些实施方式中,蛋白质的氨基酸序列与已知蛋白如治疗性蛋白、诊断蛋白、工业用酶的氨基酸序列或其部分至少75%相同性。另外,组合物还可以包含药学上可接受的载体。
核酸和多肽序列及其变体
如上文和下文所描述,本发明提供了核酸的多核苷酸序列,如O-tRNA和O-RS,、多肽的氨基酸序列,如O-RS,以及包含所述序列的组合物、系统和方法。所述序列的例子如O-tRNA和O-RS也在本文中列出(见本文的序列表和实施例)。但是,本领域的技术人员应该了解本发明并不仅仅局限于这些序列,如实施例和列表中的序列。本领域的技术人员应当了解本发明还包括具有本文所描述的功能如编码合适O-tRNA或O-RS的许多相关和不相关序列。
本发明提供了多肽(O-RS)和多核苷酸,如O-tRNA、编码O-RS或其片段的多核苷酸,用于分离氨酰-tRNA合成酶克隆的寡核苷酸等。本发明的多核苷酸包括那些编码本发明的目的蛋白或多肽的多核苷酸,其中的蛋白或多肽含有一个或多个选择者密码子。另外,本发明的多核苷酸还包括含有序列表中所列核苷酸序列的多核苷酸;与多核苷酸序列互补的多核苷酸或者编码多核苷酸序列的多核苷酸。本发明的多核苷酸还可以编码包含本文序列表或实施例中的那些序列的氨基酸序列。本发明的多核苷酸还包括编码本发明的多肽的多核苷酸。同样,在高严格条件下,可与上述多核苷酸在全长核酸序列上杂交的人工核酸也包括在本发明的多核苷酸范围内。在一个实施方式中,组合物包含本发明的多肽和各种赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明还提供了可与本发明的多肽发生特异性免疫反应的抗体或抗血清。人工多核苷酸是由人制备的,不是天然发生的。
本发明的多核苷酸还包括人工的多核苷酸,这种多核苷酸与天然tRNA、本文列表或实施例中的任何tRNA或其编码核酸的多核苷酸(但是天然tRNA除外)至少有75%、80%、90%、95%、98%或更高的相同性。多核苷酸还包括与天然tRNA的多核苷酸至少有75%、80%、90%、95%、98%或更高相同性的人工多核苷酸。
在某些实施方式中,载体(如质粒、粘粒、噬菌体、病毒等)含有本发明的多核苷酸。在一个实施方式中,载体是表达载体。在另一个实施方式中,表达载体包含与本发明的一个或多个多核苷酸功能相连的启动子。在另一个实施方式中,细胞包含携带本发明的多核苷酸的载体。
本领域的技术人员还应该理解的是本发明还包括公开序列的多种变体。例如,可形成功能相似序列的公开序列的保守变体也包含在本发明的范围内。核酸多核苷酸序列的变体也被认为包括在本发明的范围之内,其中的变体可与至少一个公开序列杂交,并且能识别选择者密码子。本文公开的序列的独特序列,例如通过标准序列比较技术确定的独特序列,也包括在本发明的范围之内。
保守变体
由于遗传密码的简并性,“静默替代”(即核酸序列上的替代不会导致其编码多肽的改变)是每个编码氨基酸的核酸的隐含特性。同样,氨基酸序列上的一个或几个氨基酸发生“保守氨基酸替代”是指用特性高度相似的不同氨基酸来替代,也很容易被鉴定为与公开的构建体高度相似。每一个公开序列的这种保守变体也是本发明的特征。
特定核酸序列的“保守变体”是指那些编码一样或基本一样的氨基酸序列的核酸,或者是指虽然不编码氨基酸序列、但序列基本相同的核酸。本领域的技术人员应该认识到导致编码序列上单个氨基酸或一小部分氨基酸(一般少于5%,更常见的是少于4%、2%或1%)发生改变、添加或删除的单个替代、缺失或插入是“保守修饰的变体”,其中的改变可导致氨基酸的删除、氨基酸的添加或以化学相似的氨基酸替代原来的氨基酸。因此,本发明所列出的多肽序列的“保守变体”包括用具有相同保守取代基团的氨基酸替代一小部分氨基酸,一般低于多肽氨基酸总数的5%,更常见的是低于2%或1%。最后,不改变核酸分子编码活性的序列添加,如添加非功能序列,被称为基础氨基酸的保守变体。
可提供功能相似氨基酸的保守替代表是本领域熟知的,其中一个氨基酸残基被另一个具有相似化学特性(芳香族侧链或带正电荷的侧链)的氨基酸替代,因此不会在实质上改变多肽分子的功能。下面列出了几组具有相似化学特性的天然氨基酸,其中每一组内的互相替代都是“保守替代”。
  非极性和/或脂肪族侧链   极性不带电荷的侧链   芳香族侧链   带正电荷的侧链   带负电荷的侧链
  甘氨酸丙氨酸缬氨酸亮氨酸异亮氨酸脯氨酸   丝氨酸苏氨酸半胱氨酸蛋氨酸天冬酰胺谷氨酰胺   苯丙氨酸酪氨酸色氨酸   赖氨酸精氨酸组氨酸   天冬氨酸谷氨酸
核酸杂交
对比杂交可用于鉴定本发明的核酸,如本文序列表中所列的那些核酸,包括本发明的核酸的保守变体,这种对比杂交方法是一种将本发明的核酸与不相关核酸区别开来的方法。另外,能与序列表中所列的那些核酸在高、超高、超超高严格条件下杂交的靶核酸也是本发明的特征。这类核酸的典型例子包括那些与一个给定核酸序列相比发生一个或几个静默核酸替代或保守核酸替代的核酸。
如果一个被检测核酸被说成可与一个核酸探针特异性杂交,那么这个被检测核酸与探针的匹配程度至少相当于与完全匹配的互补靶核酸匹配程度的1/2,即信噪比至少是探针与靶核酸杂交的1/2,杂交的条件为完全匹配的探针与完全匹配的互补靶核酸结合所产生的信噪比至少等于与任何不匹配的靶核酸杂交所产生的信噪比的约5倍到10倍。
当核酸相遇时发生杂交,一般是在溶液中。核酸之所以可以发生杂交是由各种已知的物理-化学作用力造成的,如氢键、溶剂排斥、碱基堆积等。较全面的有关核酸杂交的指导手册是Tijssen(1993)的《生物化学和分子生物学实验技术-与核酸探针杂交》(Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes)中第I部分第2章,“杂交原理和核酸探针分析策略概述(Overview of principles of hybridization and the strategy of nucleic acid probe assays)”,(Elsevier,New York),以及上述Ausubel的文献。Hames和Higgins(1995)编辑的Gene Probes 1(基因探针1》,牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 1)以及Hames和Higgins(1995)编辑的Gene Probes 2(基因探针2),牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 2)详细描述了DNA和RNA,其中包括寡核苷酸的合成、标记、检测和定量方法。
在DNA印迹或RNA印迹中,含有超过100个互补残基的互补核酸杂交到滤膜上的一个典型杂交条件是50%甲醛、1mg肝素、42℃杂交过夜。严格洗涤条件的例子是65℃用0.2×SSC洗涤15分钟(见上述文献Sambrook有关SSC缓冲液的描述)。一般情况下先用低严格条件再用高严格条件洗涤以去除背景探针信号。低严格洗涤条件的一个例子是40℃用2×SSC洗涤15分钟。如果所检测到的信噪比比不相关探针在特定杂交试验中所产生的信噪比高5倍(或更高),就说明这是一个特异性杂交。
“严格的杂交洗涤条件”用于核酸杂交试验如DNA印迹和RNA印迹时是指序列依赖性的,但是在不同的环境参数下该条件是不同的。较全面的有关核酸杂交的指导手册是上述的Tijssen(1993)和Hames和Higgins,1和2。任何被检测核酸所用的杂交和洗涤条件的严格程度可以根据经验很容易地确定。例如,在确定杂交和洗涤条件的严格程度时,可以逐渐提高杂交和洗涤条件的严格程度(如,在杂交或洗涤过程中通过升高温度、降低盐浓度、增加洗涤剂的浓度和/或增加有机溶剂如甲醛的浓度),直到满足了所选择的一组标准。例如,在高严格杂交和洗涤条件下,逐渐增加杂交和洗涤条件直到探针与互补靶核酸完全匹配,所产生的信噪比至少是探针与不匹配靶核酸杂交所产生的信噪比的5倍。
对于一个特定探针来说,十分严格的条件等于其热熔点(Tm)。Tm是指50%的被检测核酸与完全匹配的探针杂交时的温度。一般来说,在一定的离子强度和pH条件下,本发明所选择的“高严格”杂交和洗涤条件比一个特定序列的Tm约低5℃。
“超高严格程度”的杂交和洗涤条件是指杂交和洗涤条件的严格程度逐渐升高,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超高严格条件下与探针结合。
同样可以通过逐渐提高预杂交试验的杂交和/或洗涤条件的严格程度来确定更高严格程度的杂交条件。例如,逐渐升高杂交和洗涤条件的严格程度,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍、20倍、50倍、100倍、500倍或更高。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超超高严格条件下与探针结合。
如果核酸编码的多肽是基本相同的,那么即使核酸不能彼此杂交,这两个核酸也是基本相同的。这种情况发生在核酸的拷贝是充分利用遗传密码所允许的最大简并性来制备的时候。
独特的亚序列
一方面,本发明提供了含独特亚序列的核酸,这些亚序列位于选自本文所描述的O-tRNA和O-RS序列的核酸内。与任何已知的tRNA或RS核酸序列相应的核酸相比,独特亚序列都是独特的。可利用BLAST进行核酸的排列,使用默认参数。任何独特亚序列都可作为探针用于鉴定本发明的核酸。
同样,本发明还包括含独特亚序列的多肽,这些独特亚序列位于选自本文所描述的O-RS序列的多肽内。在这里,与任何已知的RS序列相应的多肽相比,独特亚序列都是独特的。
本发明还提供了能在严格条件下与独特编码寡核苷酸杂交的靶核酸,该寡核苷酸编码选自O-RS序列的多肽内的独特亚序列,其中的独特亚序列与任何对照多肽(如本发明的合成酶来源的亲本序列,如通过突变获得)相应的多肽相比都是独特的。独特序列可通过上述方法确定。
序列比较、相同性和同源性
术语“相同的”或“百分相同性”用于两个或多个核酸或多肽序列的比较时是指两个或多个序列或亚序列在一起排列并比较其最大相似性时,这两个或多个序列或亚序列是相同的,或者有特定百分比的氨基酸残基或核苷酸是相同的,这种比较可利用下面所描述的一种序列比较算法(或本领域技术人员所熟知的其他算法)或通过肉眼观察来完成。
术语“基本相同的”用于两个或多个核酸或多肽(如编码O-tRNA或O-RS的DNA,O-RS的氨基酸序列)的比较时是指两个或多个序列或亚序列在一起排列并比较其最大相似性时,这两个或多个序列或亚序列至少有约60%、80%、90-95%、98%、99%或更多的核苷酸或氨基酸残基是相同的,这种比较可利用序列比较算法或通过肉眼观察来完成。无论实际来源于何种家系,这种“基本相同的”序列一般被认为是“同源的”。“实质相同性”是指在序列的一个区域内的比较,这个区域至少约含50个残基,更优选的是至少约含100个残基,最优选的是至少约含150个残基,或者在两个序列的全长上进行比较。
当蛋白和/或蛋白序列来源于同一个亲本蛋白或蛋白序列时,不论是自然获得的还是经过改造的,这些蛋白和/或蛋白序列都是“同源的”。同样,当核酸和/或核酸序列来源于同一个亲本核酸或核酸序列时,不论是自然获得的还是经过改造的,这些核酸和/或核酸序列都是“同源的”。例如,任何天然核酸都可以用现有的突变方法加以修饰使其包含一个或多个选择者密码子。当这个突变的核酸被表达时,就编码出一条含一个或多个非天然氨基酸,如高谷氨酰胺的多肽。当然,突变过程也可以改变一个或多个标准密码子,从而使其编码的突变蛋白上产生一个或多个标准氨基酸的改变。同源性一般是根据两个或多个核酸或蛋白(或其序列)的序列相同性推算出来的。可用于推算同源性的序列之间的精确百分相同性根据所要比较的蛋白和核酸的不同而不同,但是一般来说至少要有25%的序列相同性才能建立同源性。更高的序列类似性,如30%、40%、50%、60%、70%、80%、90%、95%、99%或更高,也可用于建立同源性。确定序列相同性百分比的方法(如BLASTP和BLASTN,使用默认参数)见本文的描述,这些方法都是现有的。
为了进行序列比较并确定其同源性,一般需要把一个序列看作参考序列,被检测序列与之比较。在使用序列比较算法时,将被测序列与参考序列输入到计算机内,如果需要,设定亚序列匹配值和序列算法程序的参数。序列比较算法就可以根据设定的程序参数计算出被测序列相对于参考序列的百分序列相同性。
进行序列比较的理想序列排列方法可用下列算法完成:局部同源性算法,Smith&Waterman,Adv.Appl.Math.2:482(1981);同源性排列算法,Needleman&Wunsch,J.Mol.Biol.48:443(1970);相似性检索方法,Pearson&Lipman,Proc.Nat′l.Acad.Sci. USA85:2444(1988),以及这些算法的计算机程序(Wisconsin Genetics SoftwarePackage内的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,WI),或者通过肉眼检查(见下面Ausubel等的文献)。
适于确定百分序列相同性和序列相似性的算法的一个例子是BLAST算法,该算法描述于文献Altschul等,J.Mol.Biol.215:403-410(1990)中。执行BLAST分析的软件可在国家生物技术信息中心的网站(www.ncbi.nlm.nih.gov/)免费下载。这种算法首先通过鉴定查询序列中长度为W的短字符来确定高分序列对(HSP),这个短字符在与数据库中相同长度的字符一起排列时可匹配或达到某些正阈值记分T。T被称为相邻字符记分阈值(Altschul等,同上)。这些初始的相邻字符采样数(hits)作为种子启动检索来寻找含有这些字符的HSP。然后字符采样数在每一序列的两个方向上扩展,直到累积排列记分升高。用参数M(匹配残基对的奖赏分数;总是大于0)和N(错配残基的惩罚分数;总是小于0)来计算核苷酸序列的累积记分。对于氨基酸来说,可利用计分矩阵来计算累积记分。字符采样数在每个方向上的延伸停止于下列时刻:累积排列记分从其曾达到的最大数值开始回落时;由于累积了一个或多个负记分残基排列使累积记分达到0或0以下时;或者达到序列的末端时。BLAST算法的参数W、T和X决定了算法的灵敏度和速度。BLASTN程序(用于核苷酸序列)的默认参数为:字长(W)=11,期望值(E)=10,终止值=100,M=5,N=-4,两条链进行比较。对于氨基酸序列来说,BLASTP程序的默认参数为:字长(W)=3,期望值(E)=10,使用BLOSUM62计分矩阵(见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。
除了能够计算百分序列相同性以外,BLAST算法还可以进行两个序列之间相似性的统计分析(见Karlin和Altschul,Proc.Nat′l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法所提供的一个相似性数据是最小总概率(P(N)),这一数据说明了两个核苷酸或氨基酸序列之间相匹配的可能性。例如,如果将被测核酸与参考核酸比较后得到的最小总概率约在0.1以下、优选约0.01以下、最优选的是约0.001以下,则这个核酸被认为与参考序列是相似的。
突变和其他分子生物学技术
本发明的以及用于本发明的多核苷酸和多肽可以用分子生物学技术进行改造。描述分子生物学技术的综合性教科书包括:Berger和Kimmel的《分子克隆技术指导》(Guide to Molecular Cloning Techniques)第152卷“酶学方法”,Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人的《分子克隆实验手册》(Molecular Cloning-ALaboratory Manual)(第三版)1-3卷,冷泉港实验室,纽约冷泉港,2001(″Sambrook″)和《现代分子生物学操作指南》(Current Protocols in Molecular biology),F.M.Ausubel等人编辑,《现代操作指南》(Current Protocols),Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.,共同投资出版,(2003年增补)(″Ausubel″)。这些教科书描述了突变、载体的使用、启动子以及许多其他相关主题,如与基因制备有关的主题,这些包含选择者密码子的基因可用于蛋白质的制备,其中包括高谷氨酰胺、正交tRNA、正交合成酶及其正交对。
各种突变技术都可用于本发明中进行tRNA分子的突变、tRNA文库的制备、合成酶文库的制备、编码高谷氨酰胺的选择者密码子向目的蛋白或多肽内的插入。这些技术包括而不限于位点定向突变、随机点突变、同源重组、DNA重组或其他的回归突变方法、嵌合构建体、利用含尿嘧啶的模板进行的突变、寡核苷酸定向突变、硫代磷酸修饰的DNA突变、利用带缺口的双链DNA进行的突变等。其他合适的方法包括点错配修复、利用修复缺陷宿主系进行的突变、限制性筛选和限制性纯化、缺失突变、通过总基因合成进行的突变、双链断裂修复等。利用嵌合构建体进行的突变也包括在本发明中。在一个实施方式中,可以利用已知的有关天然分子或者改变的或突变的天然分子的信息指导突变,如序列、序列比较、物理特性、晶体结构等。
宿主细胞可用本发明的多核苷酸或包含本发明多核苷酸的构建体进行遗传改造(如转化、转导或转染),如本发明的载体,这些载体可以是克隆载体,也可以是表达载体。例如,正交tRNA、正交tRNA合成酶及其衍生的蛋白质的编码区可以被可操控地连接到能在目的宿主细胞内发挥功能的基因表达调节元件上。典型的载体都包含转录和翻译终止子、转录和翻译起始序列和用于调节特定靶核酸表达的启动子。载体还可以包含基因表达盒,其中至少含有一个独立的终止子序列,允许表达盒在真核或原核宿主、或者二者内(如穿梭载体)复制的序列以及用于原核和真核系统内的选择标记。载体可以在原核或真核宿主内表达和/或整合,最好是既可在真核宿主内又可在原核宿主内表达和/或整合。见Giliman和Smith,Gene 8:81(1979);Roberts等,Nature,328:731(1987);Schneider,B.等,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(这三篇文献同上)。载体可以是质粒、细菌、病毒、裸多核苷酸或共轭多核苷酸的形式。可用标准方法将载体导入到细胞和/或微生物内,如电穿孔(From等,Proc.Natl.Acad.Sci.USA 82,5824(1985));用病毒载体感染;用含核酸的小粒子高压渗透,其中核酸位于小珠或离子的基质内或表面上(Klein等,Nature327,70-73(1987))。
ATCC提供了可用于克隆的细菌和噬菌体的目录,如ATCC出版的《细菌和噬菌体的ATCC目录》(The ATCC Catalogue of Bacteria and Bacteriophage)(1996),Gherna等(编)。用于测序、克隆和分子生物学其他方面的其他基础方法及其理论阐述见于Sambrook(同上)、Ausubel(同上)和Watson等(1992)科学美国人丛书第二版重组DNA(Recombinant DNA Second Edition Scientific American Books),NY。另外,几乎所有核酸(以及几乎所有的标记核酸,无论是标准的还是非标准的)都可以从各个公司里购买或订购,如Midland Certified Reagent Company(Midland,TX mcrc.com)、The GreatAmerican Gene Company(Ramona,CA,网址是www.genco.com)、ExpressGen Inc.(Chicago,IL,网址是www.expressgen.com)、Operon Technologies Inc.(Alameda,CA)等。
经遗传改造的宿主细胞可用经过适当改变以便于进行下列操作的常规营养培养基进行培养:筛选、活化启动子或筛选转化子。这些细胞还可以培养成转基因有机体。有关细胞分离和培养(如用于亚序列核酸分离)的其他有用文献包括Freshney(1994)《动物细胞培养-基本操作技术》(Culture of Animal Cells,a Manual of BasicTechnique),第三版,Wiley-Liss,New York及其引用的参考文献;Payne等(1992)《在液体系统中进行植物细胞培养和组织培养》(Plant Cell and Tissue Culture inLiquid Systems),John Wiley&Sons,Inc.,New York,NY;Gamborg和Phillips(编)(1995)《植物细胞、组织和器官培养》(Plant Cell,Tissue and Organ Culture),FundamentalMethods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)以及Atlas和Parks(编)《微生物学培养基手册》(The Handbook ofMicrobiological Media)(1993),CRC Press,Boca Raton,FL。
目的蛋白和多肽
至少含有一个高谷氨酰胺的目的蛋白或多肽是本发明的特征,含有两个或多个不同的非天然氨基酸的多肽也是本发明的特征。赋形剂(如药学上可接受的赋形剂)也可以和蛋白质一起存在。另外,本发明的蛋白还可以进行翻译后修饰。
在细胞内制备特定位置上为高谷氨酰胺或其他非天然氨基酸的蛋白质的方法也是本发明的特征。例如,一种方法是在适宜的培养基内培养细胞,其中的细胞含有至少包含一个选择者密码子并能编码一个蛋白质的核酸;提供高谷氨酰胺或其他非天然氨基酸;其中的细胞还包含:在细胞内有功能并能识别选择者密码子的正交-tRNA(O-tRNA)和优先用高谷氨酰胺或其他非天然氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。在某些实施方式中,与包含或编码于本文序列表和实施例所列的多核苷酸序列的O-tRNA相比,在同源合成酶存在的条件下,这种O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。利用这种方法制备的蛋白也是本法发明的特征。
本发明还提供了含有蛋白的组合物,其中的蛋白包含高谷氨酰胺。在某些实施方式中,蛋白所包含的氨基酸序列与靶蛋白如治疗性蛋白、诊断蛋白、工业用蛋白或其片段的序列至少有75%的相同性,如那些因为插入了一个或多个非天然氨基酸如高谷氨酰胺而与靶蛋白不同的蛋白质。
本发明的组合物和利用本发明的方法制备出的组合物也可以存在于细胞内。因此本发明的O-tRNA/O-RS对或其单个组分可被用于宿主系统的翻译机器中,从而将高谷氨酰胺插入到蛋白质内。国际专利申请PCT/US2004/011786(申请日为2004年4月16日,名称为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(扩充真核遗传密码”)和WO 2002/085923(题为“非天然氨基酸的体内插入”)描述了这一过程,本文已纳入作为参考。例如,当O-tRNA/O-RS对被引入到宿主如大肠杆菌细胞内后,O-tRNA/O-RS对在体内响应选择者密码子后可将高谷氨酰胺,一种合成的氨基酸,插入到蛋白质内,如酪氨酸或苯丙氨酸衍生物,这是作为外源性物质加入到培养基内的。另外,本发明的组合物既可以用于体内翻译系统,也可以用于体外翻译系统。
利用本发明的细胞可以大规模地合成含非天然氨基酸的蛋白质。一方面,组合物可以包含至少10μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、10mg或更多含高谷氨酰胺或多种非天然氨基酸的蛋白质,或者含有蛋白质的量能够达到体内蛋白合成方法的要求(本文提供了重组蛋白制备和纯化方法的详细描述)。另一方面,组合物中所含的蛋白质浓度可以是每升细胞裂解物、缓冲液、药学上可接受的缓冲液或其他液体悬液中至少含10μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、10mg或更高(如以1nL到100L的体积)。在细胞内大量制备(例如大于其他方法,如体外翻译,在一般情况下所能达到的规模)至少含一个高谷氨酰胺的蛋白质也是本发明的特征。
插入高谷氨酰胺或其他非天然氨基酸可导致蛋白质结构和/或功能的变化,如大小、酸性、亲核性、氢键、疏水性、蛋白酶靶位点的易接近性、对基序的靶向性(如用于蛋白芯片时)等。含有高谷氨酰胺的蛋白质的催化活性或物理特性可能会得以改善,或者获得全新的催化活性或物理特性。例如,下列特性可通过在蛋白质内插入高谷氨酰胺或其他非天然氨基酸加以改变:毒性、生物分布、结构特性、分光光度特性、化学和/或光化学特性、催化能力、半衰期(如血清半衰期)、与其他分子相互作用的能力(共价的或非共价的)。包含至少携带一个高谷氨酰胺的蛋白质的组合物可用作新型的治疗蛋白、诊断蛋白、催化酶、工业用酶、结合蛋白(如抗体)以及可用于蛋白质结构和功能的研究。见Dougherty,(2000)UnnaturalAmino Acids as Probes ofProtein Structure and Function,Current Opinion in Chemical Biology,4:645-652。另外,一个或多个非天然氨基酸可以被插入到多肽内以形成分子标签,如用于将多肽固定到固体支持物上。见Wang和Schultz的专利申请“蛋白质芯片”,申请日为2003年12月22日,代理人备案号为54-000810PC,参见其中的“利用含非天然氨基酸的多肽制备芯片的方法”的延伸讨论。
在本发明的一个方面,组合物包含至少一个蛋白质,其中的蛋白质至少含有1、2、3、4、5、6、7、8、9、10或更多个非天然氨基酸,如高谷氨酰胺或其他非天然氨基酸。这些非天然氨基酸可以是相同的,也可以是不同的,如在蛋白质的1、2、3、4、5、6、7、8、9、10或更多个不同的位点上含有1、2、3、4、5、6、7、8、9、10或更多个不同的非天然氨基酸。另一方面,组合物包含一个蛋白质,这个蛋白质至少有一个但不是全部的特定氨基酸被高谷氨酰胺替代。对于一个给定的含多个非天然氨基酸的蛋白质来说,其中的非天然氨基酸可以是相同的,也可以是不同的(如蛋白质包含两个或多个不同类型的非天然氨基酸,或者包含两个相同的非天然氨基酸)。对于一个给定的含两个以上非天然氨基酸的蛋白质来说,其中的非天然氨基酸可以是相同的,也可以是不同的,或者其中有多个非天然氨基酸是相同的,但是至少有一个不同非天然氨基酸。
一般来说,包含非天然氨基酸如高谷氨酰胺的任何蛋白质(或其片段),或者编码多个不同非天然氨基酸的任何蛋白(及其相应的编码核酸,如包含一个或多个选择者密码子的核酸)都可用本发明的组合物和方法制备。无需将已知的成千上万个蛋白质都一一鉴定,其中的任何一个都可以被修饰成含一个或多个非天然氨基酸的形式,如通过任何已知的突变方法将一个或多个适宜的选择者密码子插入到相关的翻译系统内。已知蛋白序列的常用数据库包括GenBankEMBL、DDBJ和NCBI。其他数据库通过搜索互联网也可以很容易地找到。
一般来说,本发明的蛋白质与已知的蛋白(如治疗性蛋白、诊断蛋白、工业用蛋白,或其片段等)至少有60%、70%、75%、80%、90%、95%、99%或更高的相同性,其中包含一个或多个非天然氨基酸。可被修饰使其包含一个或多个高谷氨酰胺的治疗性蛋白、诊断蛋白以及其他蛋白可在下列文献中找到,但是又不仅仅局限于这些文献:2004年4月16日提交的题为“Expanding the Eukaryotic Genetic Code(扩充真核遗传密码)”的国际专利申请PCT/US2004/011786;以及WO 2002/085923,题为“非天然氨基酸的体内插入”。可被修饰使其包含一个或多个高谷氨酰胺的治疗性蛋白、诊断蛋白以及其他蛋白包括而不限于α-1抗胰蛋白酶、血管他丁、抗溶血因子、抗体(有关抗体的详细描述见下文)、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配基、C-kit配基、胶原蛋白、集落刺激因子(CSF)、补体因子5a、补体抑制因子、补体受体1、细胞因子(如上皮细胞中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)表皮生长因子(EGF)、红细胞生成素(EPO)、剥脱毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤溶酶、G-CSF、GM-CSF、葡萄糖脑敢脂酶、绒毛膜促性腺激素、生长因子、Hedgehog蛋白(如Sonic、Indian、Desert)、血红素、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如IFN-α、IFN-β、IFN-γ)、白细胞介素(如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质化细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、Neurturin、中性粒细胞抑制因子(NIF)、抑瘤素M、骨形成蛋白、甲状旁腺激素、PD-ECSF、PDGF、肽类激素(如人生长激素、Pleiotropin、蛋白A、蛋白G、发热外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体1、可溶性I-CAM1、可溶性白细胞介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物歧化酶(SOD)、中毒性休克综合征毒素TSST-1)、胸腺激素α1、组织纤溶酶原激活因子、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶等。
可以利用本发明的组合物和方法在体内制备出的含本文所描述的高谷氨酰胺的一类蛋白质是转录调节因子或其片段。转录调节因子的例子包括能调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节因子存在于原核细胞、病毒和真核生物如真菌、植物、酵母、昆虫和动物如哺乳动物,提供了一个大范围的治疗靶位。应当理解的是表达和转录活化因子调节转录的机制很多,如与受体结合、刺激信号转导级联、调节转录因子的表达、与启动子和增强子结合、与启动子和增强子结合的蛋白结合、解链DNA、剪接mRNA前体、多聚腺苷酸化RNA和降解RNA。
本发明的一类蛋白质(如携带一个或多个高谷氨酰胺的蛋白质)是表达活化因子,包括细胞因子、炎症分子、生长因子及其受体、以及癌基因产物,如白细胞介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44;信号转导分子及其相应的癌基因产物,如Mos、Ras、Raf和Met;以及转录活化因子和抑制因子,如p53、Tat、Fos、Myc、Jun、Myb、Rel,以及类固醇激素受体,如雌激素、孕酮、睾丸酮、醛固酮、LDL受体的配基和皮质酮。
本发明还提供了至少携带一个同型固氨酰胺的酶(如工业用酶)或其片段。酶的例子包括而不限于酰胺酶、氨基酸消旋酶、酰基转移酶、脱氢酶、二氧合酶、二芳基丙烷过氧化物酶、表位酶、环氧化物水解酶、酯酶、异构酶、激酶、葡萄糖异构酶、糖苷酶、葡萄糖酰基转移酶、卤素过氧化物酶(haloperoxidase)、单假氧酶(如p450)、脂肪酶、木素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酯酶、枯草杆菌蛋白酶、转氨酶和核酶。
这些蛋白中有许多是可以从公司购买到的(见Sigma BioSciences的2003年产品目录和价目表),其相应的蛋白序列和基因及其变体通常都是已知的(见Genbank)。它们都可以按照本发明的方法通过插入一个或多个高谷氨酰胺或其他非天然氨基酸来加以修饰,例如改变蛋白质的一种或多种治疗、诊断或酶催化特性。与治疗相关的特性包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(如通过在非天然氨基酸如高谷氨酰胺上插入报告基团(如标记物或标记结合位点))、LD50或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶催化特性包括保存半衰期、稳定性、酶活性、生产能力等。
其他的多种蛋白也可加以修饰使其包含一个或多个本发明的高谷氨酰胺或其他非天然氨基酸。例如,本发明包含的蛋白质可以是用高谷氨酰胺替代一个或多个天然氨基酸的疫苗蛋白,这些蛋白来自于感染性真菌,如曲霉属、念珠菌属的真菌;细菌,特别是大肠杆菌,可以作为致病菌的模型,和医学上有重要影响的细菌如葡萄球菌属(如金黄色葡萄糖球菌)或链球菌属(如肺炎链球菌)的细菌;原虫如孢子虫(如刚地弓形虫)、根足虫(如内阿米巴原虫)和鞭毛虫(锥形虫、利什曼原虫、毛滴虫、鞭毛虫等);病毒如(+)RNA病毒(例子包括痘病毒类如痘苗病毒;细小核糖核酸病毒如脊髓灰质炎病毒;披膜病毒如风疹病毒;黄病毒如HCV;以及冠状病毒),(-)RNA病毒(如弹状病毒如VSV;副黏液病毒如RSV;正粘病毒如流感病毒;布亚病毒;以及沙粒病毒),dsDNA病毒(如呼肠孤病毒),RNA到DNA的病毒,即逆转录病毒如HIV和HTLV,以及某些DNA到RNA的病毒如乙肝病毒。
与农业有关的蛋白质如昆虫抗性蛋白(如Cry蛋白)、淀粉和脂质生成酶、植物和昆虫毒素、毒素抗性蛋白、霉菌毒素解毒蛋白、植物生长酶(如核酮糖1,5-二磷酸羧化酶/氧合酶,″RUBISCO″)、脂肪加氧酶(LOX)、以及磷酸烯醇丙酮酸(PEP)羧化酶也是高谷氨酰胺或其他非天然氨基酸修饰的适宜靶位。
在某些实施方式中,本发明的方法和/或组合物内的目的蛋白或多肽(或其片段)是由核酸编码的。一般来说,这种核酸至少含有1、2、3、4、5、6、7、8、9、10或更多个选择者密码子。
目的蛋白或多肽的编码基因可用本领域技术人员熟知的方法以及本文“突变和其他分子生物学技术”部分描述的方法加以突变使其携带用于插入高谷氨酰胺的一个或多个选择者密码子。例如,目的蛋白的编码核酸可被突变使其携带一个或多个选择者密码子,因而可以插入一个或多个高谷氨酰胺。本发明包括任何蛋白的这种突变版本,比如至少含有一个高谷氨酰胺。同样,本发明还包括相应的核酸,即含有一个或多个编码一个或多个高谷氨酰胺的选择者密码子的任何核酸。
为了使蛋白包含高谷氨酰胺,需要使用适于通过正交tRNA/RS对在体内插入高谷氨酰胺的宿主细胞和有机体。宿主细胞用一种或多种载体进行遗传改造(如转化、转导或转染),这些载体表达正交tRNA、正交tRNA合成酶和编码衍生蛋白的载体。这些组分可以位于同一个载体上,或者位于不同的载体上,或者两个组分位于一个载体上而第三个组分位于第二个载体上。载体可以是质粒、细菌、病毒、裸多核苷酸或共轭多核苷酸。
根据免疫活性定义多肽
由于本发明的多肽提供了多种新的多肽序列(如在本文的翻译系统中合成的蛋白中含有高谷氨酰胺或者在新型合成酶、标准氨基酸的新型序列存在的情况下合成的蛋白中含有高谷氨酰胺),因此多肽可能会提供能被免疫分析方法识别的新型结构特征。能特异性结合本发明多肽的抗血清的制备以及能被这些抗血清结合的多肽也是本发明的特征。本文所用的术语“抗体”包括而不限于免疫球蛋白基因或其片段编码的多肽,这些多肽可特异性识别并结合分析物(抗原)。例子包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。免疫球蛋白的片段,其中包括Fab片段和表达文库如噬菌体展示文库产生的片段,也包括在本文所用的术语“抗体”之中。见Paul编辑的《基础免疫性》(Funcamental Immunology),第四版,1999,Raven Press,NewYork,中关于抗体结构和方法学的描述。
为了制备用于免疫分析中的抗血清,可按照本文所描述的方法制备和纯化一种或多种免疫原性多肽。例如,用重组细胞制备重组蛋白。纯系小鼠(用于此分析中,因为纯系小鼠具有遗传相同性,因此得到的结果重复性更高)用含标准佐剂如福氏完全佐剂的免疫原性蛋白按照标准的免疫方法免疫(见Harlow和Lane(1988),《抗体一实验室操作手册》(Antibodies,ALaboratory Manual)(冷泉港出版社,纽约)中关于抗体制备、用于确定特异性免疫反应的免疫分析方法和条件的描述)。关于蛋白、抗体、抗血清等的其他详细描述见USSN 60/479,931、60/463,869和60/496,548,题为“扩充真核遗传密码”(Expanding the Eukaryotic Genetic Code);WO 2002/085923,题为“非天然氨基酸的体内插入”;专利申请USSN 60/441,450,名称为“糖蛋白合成”,申请日为2003年1月16日;以及专利申请“蛋白质芯片”,代理人备案号为P1001US00,申请日为2002年12月22日。
O-tRNA和O-RS以及O-tRNA/O-RS对的应用
本发明的组合物以及用本发明的方法制备的组合物存在于细胞内。因而本发明的O-tRNA/O-RS对或其各个组分可用于宿主系统的翻译机器中,结果导致高谷氨酰胺被插入到蛋白质内。Schultz等人的专利申请“非天然氨基酸的体内插入”(WO2002/085923)描述了这一过程,本文已纳入作为参考。例如,当O-tRNA/O-RS对被导入到宿主如大肠杆菌内时,O-tRNA/O-RS对就可在体内将高谷氨酰胺插入到蛋白质如肌红蛋白或治疗性蛋白内以响应选择者密码子如琥珀无义密码子,其中的高谷氨酰胺可外源性地加入到培养基中。另外,本发明的组合物既可用于体外翻译系统中,也可用于体内系统中。含高谷氨酰胺的蛋白质可用作治疗性蛋白,也可用于研究蛋白质的结构、与其他蛋白质的相互作用、蛋白质内的电子转移过程等。
试剂盒
试剂盒也是本发明的特征。例如,本发明提供了用于在细胞内制备至少含一个高谷氨酰胺的蛋白质的试剂盒,其中的试剂盒包括一个盛有O-tRNA和/或O-tRNA编码多核苷酸序列、和/或O-RS编码多核苷酸序列、和/或O-RS的容器。在一个实施方式中,试剂盒还包括高谷氨酰胺。在另一个实施方式中,试剂盒还包括关于制备蛋白质的说明书。本发明的任何组合物、系统或装置都可以用适当的包装材料(如容器等)包装起来制成试剂盒的形式。
实施例
下面所提供的实施例是为了说明本发明,并不意味着对本发明权利要求的限制。本领域的技术人员应该知道在不偏离本发明权利要求范围的情况下可以对各种非关键性的参数做出修改。
实施例1:衍生于ARCHAEL tRNALys的正交合成酶/tRNA对的制备
正交合成酶-tRNA对来源于超嗜热古菌的赖氨酰tRNA合成酶。根据古细菌tRNALys序列的多序列排列的共有序列得到的琥珀抑制型tRNA可以在β半乳糖苷酶分析试验中产生32%的琥珀抑制效应。因此,这个正交对是一个高效的系统,可用于在大肠杆菌内将非天然氨基酸插入到蛋白质内。
将有机体的遗传密码扩充到20个常见氨基酸之外的其他氨基酸最少需要两个新基因:可选择性活化非天然氨基酸但是不能将氨基酸转移到内源tRNA上的氨酰-tRNA合成酶基因和可接受非天然氨基酸但是不能被内源性合成酶加载的同源正交tRNA基因(Furter,(1998)Protein Sci.,7:419-426)。另外,还需要tRNA能够响应非编码密码子如无义密码子或移码密码子并转移氨基酸。已经鉴定出的詹氏甲烷球菌酪氨酰tRNA合成酶和同源琥珀抑制型tRNA对的变体(Wang等,(2000)J.Am. Chem.Soc.,122:5010-5011;Wang等,(2001)Science,292:498-500)符合这些标准,并已被用于在大肠杆菌内将各种非天然氨基酸,包括含酮氨基酸(Wang等,(2003)Proc. Natl.Acad.Sci.U.S.A.,100:56-61)和光交联氨基酸,高效高保真地插入到蛋白质内(Chin等,(2002)Proc.Natl.Acad.Sci.U.S.A.,99:11020-11024;Chin和Schultz,(2002)Chem Bio Chem,3:1135-1137)。拓宽能被遗传密码编码的非天然氨基酸的范围和数目就有可能使用新的正交合成酶-tRNA对和编码它们的新密码子(Magliery等,(2001)J.Mol.Biol.,307:755-769;Anderson等,(2002)Chem.Biol.,9:237-244)。
最近诞生了一种新的方法,该方法利用热自养甲烷球菌亮氨酰-tRNA合成酶和盐杆菌NRC-1来源的同源正交琥珀、乳白和四碱基抑制型tRNA构建正交对(Anderson和Schultz,(2003)Biochemistry,42(32):9598-608)。这些根据多序列排列的古细菌亮氨酰tRNA的相同序列而设计出的抑制型tRNA可提供有效的正交移码和乳白抑制型tRNA。正常的正交抑制型tRNA含有CU(X)XXXAA反密码子环(其中的(X)XXX是密码子的反向互补序列),其茎区无错配碱基。我们现在描述的是利用“共有序列抑制型”策略进行古细菌tRNALys序列和古细菌超嗜热古菌赖氨酰-tRNA合成酶来源的正交合成酶-tRNA对的理论设计。
这种tRNA/合成酶对有几个诱人的特征可用于构建大肠杆菌内的正交抑制型对。可用于大肠杆菌的正交tRNA不应该与大肠杆菌氨酰-tRNA合成酶发生交叉反应。虽然原核生物和古细菌的tRNALys序列之间具有很高的相似性,但是其73位碱基是一个鉴别碱基,原核生物的是A,而古细菌的是G(Ibba等,(1999)Proc.Natl.Acad.Sci. U.S.A.,96:418-423),这点可防止古细菌的tRNA成为大肠杆菌合成酶的底物。研究发现大肠杆菌的总细胞裂解物确实不能酰化古细菌红皮盐杆菌(Halobacteriumcutirubrum)的tRNA(Kwok和Wong,(1980)Can.J.Biochem.,58:213-218)。为了构建抑制型tRNA需要改变反密码子的序列,但是不能对其氨酰化活性有副作用。通过对古细菌超嗜热古菌的赖氨酰tRNA合成酶(PhKRS)识别tRNA的研究(Terada等,(2002)Nat.Struct.Biol.,9:257-262)发现反密码子可以被改变而不降低tRNA的识别能力。因此,密码子如琥珀无义密码子UAG的抑制型tRNA有可能能够从这些tRNA构建。最后,古细菌的I型赖氨酰tRNA合成酶PhKRS的晶体结构是已知的(Terada等,(2002)Nat.Struct.Biol.,9:257-262),这有利于氨酰-tRNA合成酶的改造。
为了确定PhKRS是否是大肠杆菌正交的,需要证明合成酶不能有效地加载大肠杆菌tRNA。PhKRS的基因是从基因组DNA中通过PCR扩增出来的,插入到质粒pBAD-Myc/HisA(Invitrogen)内过量表达。所得到的PhKRS蛋白加以纯化使之成为均一物质。用盐杆菌NRC-1或大肠杆菌来源的全tRNA进行氨酰化分析试验。盐杆菌NRC-1来源的tRNA序列和超嗜热古菌来源的tRNA序列是高度同源的(图1)。因此,我们预测嗜盐菌tRNA可以很容易地被PhKRS加载。确实,在20分钟内,PhKRS加载的嗜盐菌全tRNA的量比加载的大肠杆菌全tRNA的量高出14倍以上(图2;10μM[tRNA])。虽然PhKRS也能少量加载大肠杆菌tRNA,但是,在相同浓度的大肠杆菌全tRNA存在的情况下,其加载速率比大肠杆菌合成酶低28倍,只是背景加载速率的7倍。另外,海沼甲烷球菌(M mariplaudis)来源的高同源性古细菌合成酶只能很微弱地补偿lysS/lysU双突变缺陷的大肠杆菌赖氨酰tRNA合成酶(Ibba等,(1999)Proc.Natl.Acad.Sci.U.S.A.,96:418-423)。因此,PhKRS在体内可能很难与内源性的大肠杆菌合成酶竞争加载大肠杆菌的tRNA。
为了进一步了解PhKRS的正交性,我们试图将PhKRS基因插入到组成型表达载体pKQ内。这个质粒含有组成型谷氨酰胺启动子控制下的核糖体结合位点、多克隆位点和质粒pBAD-Myc/HisA(Invitrogen)来源的rrnB终止子。这个质粒还含有一个ColE1复制起点和一个用于质粒筛选的卡那霉素耐药选择标记。不幸的是,野生型PhKRS基因在以组成型的方式表达时是有毒性的。但是,我们偶然发现E444G突变体(质粒pKQ-PhE444G)在大肠杆菌内表达时其毒性是降低的。E444G突变可导致对系统的毒性明显下降的机制还不清楚,一种可能是突变阻止了大肠杆菌tNRA的低水平种间错误加载,这种情况在体外可以观察到。
下一步就是构建能被PhKRS加载的无义抑制型tRNA。PhKRS的反密码子结合决定簇是较弱的,这说明这个酶应该可以接受含有不同反密码子序列的tRNA(Terada等,(2002)Nat.Struct.Biol.,9:257-262)。由于琥珀型抑制研究得的最透,也是大肠杆菌内最有效的抑制形式(Anderson等,(2002)Chem.Biol.,9:237-244),因此,我们利用共有序列来构建正交的古细菌琥珀抑制型tRNA-AKCUA(Anderson和Schultz,(2003)Biochemistry,42(32):9598-608)。利用GCG程序pileup将现有基因组序列中所有的古细菌tRNALys序列进行多序列排列(图1)。找出排列在一起的tRNA的共有序列,绘出典型的三叶草型结构(图3)。然后检查这个序列,寻找茎区内的非经典碱基配对或错配碱基对,这些碱基对会降低抑制效率(Hou等,(1992)Biochemistry,31:4157-4160)。tRNALys的共有序列内没有这样的错配碱基对。然后将反密码子环改变成CUCUAAA,因为这个序列可产生最佳的琥珀型抑制效果(Yarus等,(1986)J. Mol.Biol.,192:235-255)。通过合成的寡核苷酸(Genosys)的重叠延伸构建出这个tRNA序列,然后插入到质粒pACGFP的EcoRI和PstI限制性酶切位点之间(Magliery等,(2001)J.Mol.Biol.,307:755-769),置于组成型lpp强启动子控制之下。所得到的质粒pAC-AKCUA还包含p15A复制起点和氯霉素耐药选择标记。
为了检验这个正交合成酶-tRNA对的抑制效率,用pKQ-PhE444G、pAC-AKCUA和lacZ报告质粒pLASC-lacZ(TAG)共同转化GeneHogs大肠杆菌细胞(Invitrogen)(Anderson和Schultz,(2003)Biochemistry,42(32):9598-608)。来源于pSC101的这个质粒含有氨苄青霉素耐药选择标记和处于lpp启动子控制之下的编码β-半乳糖苷酶的lacZ基因。在lacZ基因的允许位25位残基上有一个琥珀型密码子,这个密码子可导致翻译的提前终止。在无琥珀抑制型tRNA存在的情况下,含pLASC-lacZ(TAG)的细胞所观察到的β半乳糖苷酶活性只有含质粒pLASC-lacZ(Lys)的细胞所具有活性的0.17%(质粒pLASC-lacZ(Lys)在25位上含有一个AAA(赖氨酸)有义密码子),比不含质粒的细胞所具有的活性也只高2倍。如果AKCUA不能被内源性的大肠杆菌合成酶加载,当tRNA与pLASC-lacZ(TAG)共表达时不应该产生琥珀型抑制。含pAC-AKCUA和pLASC-lacZ(TAG)的细胞只有1.7%的抑制效率(相对于lacZ(lys)表达时)。如果PhKRS能够加载正交tRNA,那么当质粒pKQ-PhE444G被导入到系统内时应该可以观察到更高水平的抑制。确实,所观察到的抑制水平达32%。与此相对应的是,上面所描述的大肠杆菌正交的詹氏甲烷球菌来源的酪氨酸合成酶-tRNA对在同源合成酶存在的情况下展示出18.5%的抑制效率,如果没有同源合成酶则抑制效率只有0.2%。在同源合成酶存在和不存在的情况下,热自养甲烷球菌(M.thermoautotrophicum)来源的亮氨酸琥珀型正交对的抑制效率分别为33.2%和1.5%(Anderson和Schultz,(2003)Biochemistry,42(32):9598-608)。
在这个实施例中,我们鉴定出了I型赖氨酰-tRNA合成酶,并且通过古细菌tRNALys序列的多序列排列设计出了一种琥珀抑制型tRNA,二者一起组成正交合成酶-tRNA对,可用于非天然氨基酸在大肠杆菌内的位点特异性插入。PhKRS/AKCUA所具有的高效率(32%的抑制效率)证明了共有序列策略可有效地用于正交抑制型tRNA的构建。
实施例2:利用非天然氨基酸进行移码校正抑制可消除PHKRS的毒性
超嗜热古菌的I型赖氨酰tRNA合成酶来源的正交tRNA-合成酶对已被用于大肠杆菌中。该系统的tRNA部分可以很好地行使正交琥珀酰抑制子的功能。合成酶表达质粒pKQ-PhE444G能够加载这种tRNA,但是依然可以观察到毒性效应。当其单独表达时,含pKQ-PhE444G的细胞的生长密度只有不含质粒的细胞的56%。报告质粒pAC-AKCUA和pAC-AKCUA也有中等程度的毒性,其生长密度分别是不含质粒的细胞的72%和52%。当pKQ-PhE444G与质粒pAC-AKCUA共同转化时,细胞的密度下降到17%。另外,当与β半乳糖苷酶报告质粒pAC-AKCUA(质粒pACKO-A184TAG的衍生物)共表达时,细胞的密度只有5%。这清楚地表明tRNA和合成酶在这个系统内都有毒性效应。另外,用两个质粒共转化细胞时可能具有协同效应,使细胞的存活能力大大降低。为了解决这一问题,我们需要找到PhKRS的低毒性突变体。
我们猜测在PhKRS上进行点突变或其他类型的突变可能能够降低合成酶的毒性同时又保留其加载活性。因此,我们将pKQ-PhE444G转化到化学感受态XL1-red细胞(Stratagene)内,然后将细胞接种到含25μg/ml卡那霉素的LB琼脂培养板上。这个细胞株含有几个能导致转化质粒发生高频率突变的基因组突变。从培养板上挑出约100个克隆,然后在含卡那霉素的25ml液体LB培养基内扩增。预计pKQ-PhE444G的非毒性突变株的生长速度要快于野生型的细胞株,通过细胞的系列培养可导致这些突变株的累积。经过2个系列培养,每一步稀释10000倍,吸出少量细胞导入到含质粒pAC-AKCUA的Genehog细胞中,然后接种到含25μg/ml卡那霉素和25μg/ml氯霉素、以及各种浓度的氨苄青霉素的LB琼脂培养板上。90%以上的转化细胞无明显的毒性,可以在含1000μg/ml氨苄青霉素的LB琼脂培养板上生长。甚至在含1500μg/ml氨苄青霉素的培养板上也看到了较小的克隆,说明产生了有效的琥珀型抑制。分离出一个突变的合成酶,命名为pKQ-PhKep,通过限制性酶切图谱和PhKRS开放阅读框架测序的方法确定其特征。突变的基因含有一个778bp的插入片段,位于残基S357之后,但是其他的序列都与质粒pKQ-PhE444G相同。通过BLAST检索发现这个插入片段与质粒p1658/97上被称为“insAcp1”的序列同源,但是在这篇文献中再也没有提到这个序列,因此也无法知道这个序列的来源。当PhKRS从起始密码子开始翻译时,这个基因的预测产物在S357的下游被截掉6个氨基酸。为了确定PhKRS的这种截断是否就是毒性下降的原因,合成了一个序列为5′-CAGTGGAATTCAGTAAGTTGGCAGCATCAC-3′的引物CA510R,用它在质粒pKQ上构建截断突变体。利用引物CA279和CA510R通过PCR扩增质粒pKQ-PhKep,扩增的产物亚克隆到质粒pKQ的NcoI和EcoRI位点之间。所得到的质粒pKQ-PhΔAD(也被称为pKQ-Ph510)与质粒pAC-AKCUA共转化,结果显示得到的转化子与pKQ-PhKep转化细胞具有相同的IC50,没有明显的毒性。
在残基357后的截断好像可以删除PhKRS的反密码子结合区,我们想要了解这种删除对合成酶的tRNA识别特性会产生何种影响。因此,我们在体外过量表达合成酶并且进行氨酰化分析。用引物CA279和CA511(5′-CATTGGAATTCGAGTAAGTTGGCAGCATCAC-3′)通过PCR从pKQ-PhKep上扩增这个基因,然后亚克隆到pBAD-Myc/HisA的NcoI和EcoRI位点之间,使其与C末端Myc/His标记处于同一个阅读框架内。利用Ni-NTA层析技术纯化表达的蛋白质。
实施例3:用四碱基密码子和非天然氨基酸扩充遗传密码
虽然除了几个例子之外几乎所有已知有机体的遗传密码都编码相同的20个氨基酸,但是需要加到新构筑模块内的所有组分就是独特的tRNA/氨酰-tRNA合成酶对、氨基酸原料和氨基酸特异性的独特密码子(Wang等,(2001)Expanding the genetic code.Science 292:498-500)。以前的研究已经表明琥珀型无义密码子TAG和正交詹氏甲烷球菌及大肠杆菌tRNA/合成酶对一起可被用于在大肠杆菌(Wang等,(2003)Additionof the keto functionnal group to the genetic code of Escherichia coli.Proc.Natl.Acad.Sci. U.S.A.100:56-61;Santoro等,(2002)An efficient system for the evolution ofaminoacyl-tRNAsynthetase specificity.Nat.Biotechnol.20:1044-8;Chin等,(2002)Addition of a photocrosslinking amino acid to the genetic code of Escherichia coli.Proc. Natl.Acad.Sci.U.S.A.99:11020-11024;Mehl等(2003)Generation of a bacterium witha 21amino acid genetic code.J.Am.Chem.Soc.125:935-9)和酵母(Chin等(2003)Anexpanded eukaryotic genetic code.Science 301:964-7)内制备各种具有新特性的氨基酸。然而,有限数目的非编码三联密码子大大限制了有机体编码的氨基酸的最终数目。我们在本发明中描述了利用古细菌tRNALys序列制备新型正交合成酶/tRNA对的方法,这种正交对可响应四碱基密码子AGGA而将氨基酸高谷氨酰胺(hGln)有效而特异地插入到肌红蛋白内。HGln所产生的移码校正抑制不会明显影响蛋白质的产率或细胞的生长速率,与TAG的抑制作用互相正交。这个研究结果表明可用三联密码子的数目和翻译系统本身都不再成为进一步扩充遗传密码的重要障碍。
有许多天然的+1移码校正抑制子,其中包括Su7编码谷氨酰胺UAGN(N=A、G、C或T)抑制子(Curran和Yarus(1987)Reading frame selection and transfer RNAanticodon loop stacking.Science 238:1545-50)、编码苏氨酸的sufJ来源的ACCN抑制型密码子(Bossi和Roth(1981)Four-base codons ACCA,ACCU and ACCC arerecognized by frameshift suppressor sufJ.Cell 25:489-96)和tRNALys和tRNAGln来源的CAAA抑制子(O′Connor(2002)Insertions in the anticodon loop of tRNA(1)(Gln)(sufG)and tRNA(Lys)promote quadruplet decoding of CAAA.Nucleic Acids Res.30:1985-1990)。另外,遗传筛选已被用于从突变tRNA大文库中鉴定有效的四碱基和五碱基抑制型tRNA,其中包括大肠杆菌tRNAUCCU Ser抑制子(Magliery等,(2001)Expanding thegenetic code:selection of efficient suppressors of four-base codons and identification of″shifty″four-base codons with a library approach in Escherichia coli.J.Mol.Biol.307:755-769;Anderson等,(2002)Exploring the limits of codon and anticodon size.Chem. Biol.9:237-244;Hohsaka等,(1999)Incorporation of two nonnatural amino acids intoproteins through extension of the genetic code.Nucleic Acids Symp.Ser.42:79-80;Hohsaka等,(2001)Five-base codons for incorporation of nonnatural amino acids intoproteins.Nucleic Acids Res.29:3646-51;Hohsaka和Sisido(2002)Icorporation ofnon-natural amino acids mto proteins.Curr.Opin.Chem.Biol.6:809-15)。
为了在体内用四联密码子编码非天然氨基酸,我们必需制备出一种能特异性识别这种密码子的tRNA和一种只能用目的非天然氨基酸特异性地氨酰化这种tRNA的相应合成酶。由于以前所制备的正交詹氏甲烷球菌琥珀抑制型tRNA的反密码子环是同源合成酶JYRS的关键识别元件,因此要改造这个tRNA使其解码四碱基密码子是很困难的。虽然也有可能降低JYRS的反密码子结合特异性,但是要构建出用一个反密码子序列就可以区别琥珀型抑制子和四碱基抑制子的互相正交的对可能是很困难的。因此,最可能的情况是一个系统利用两个不同来源的正交对将两个不同的非天然氨基酸同时插入到多肽内,这样就需要设计出另一个新的正交tRNA-合成酶对。
我们一开始将目光集中在古细菌超嗜热古菌(PhKRS)的赖氨酰合成酶/tRNA对上,将其作为候选的正交对,因为:1)这个对可能是正交的,因为它在原核生物中的保守碱基是A73,在古细菌中的保守碱基是G73(Ibba等(1999)Substrate recognition byclass I lysyl-tRNA synthetase:a molecular basis for gene displacement.Proc.Natl.Acad. Sci.U.S.A.96:418-423),2)PhKRS允许tRNA反密码子环上发生碱基替代以便于加载抑制型tRNA(Terada等(2002)Functional convergence of two lysyl-tRNA synthetase withunrelated topologie.Nat.Struct.Biol.9:257-262),以及3)PhKRS的晶体结构是已知的(Terada等(2002)Functional convergence of two lysyl-tRNA synthetase with unrelatedtopologie.Nat.Struct.Biol.9:257-262),这样有利于改变其氨基酸特异性。但不幸的是,我们发现当PhKRS进行组成型表达时对大肠杆菌细胞是有毒性的。但是,在突变型XL-1-red内经过系列培养以后可分离出一个非毒性的突变株PhΔAD,该突变株因为插入了一个被称为insAcp1的778bp的元件,使其在残基S357的下游被截断了6个氨基酸。因此,其反密码子环结合区被删除,使因反密码子环替代而导致的活性丢失的可能性进一步降低。
如实施例1所详细描述的,为了确定这个截断突变体在大肠杆菌内是否有功能、是否是正交的,需要证明这个合成酶不能加载大肠杆菌的tRNA,但是要保留加载同源古细菌tRNA的活性。克隆PhΔAD和EcKRS的基因并使其过量表达,纯化所得到的蛋白使其成为均一的物质。用古细菌盐杆菌NRC-1或大肠杆菌来源的全tRNA进行氨酰化分析试验。在20分钟内,PhΔAD加载的嗜盐菌全tRNA的量比加载的大肠杆菌全tRNA的量要多很多(图2;10μM[tRNA])。虽然PhΔAD也能少量加载大肠杆菌tRNA,但是,在相同浓度的大肠杆菌全tRNA存在的情况下,其加载速率比大肠杆菌合成酶低28倍,只是背景加载速率的7倍。另外,PhΔAD不能弥补PALΔSΔUTR(pMAKlysU)株在43℃下的生长(Chen等,(1994)Properties of the lysyl-tRNA synthetase gene andproduct from the extreme thermophile Thermus thermophilus.J. Bacteriol.176:2699-705),这是一个大肠杆菌赖氨酰tRNA合成酶发生lysS/lysU双缺陷的突变株。但是,EcKRS(克隆自大肠杆菌HB101株的lysU位点)可使其正常生长。因此,PhΔAD不能替代PhKRS,在体内可能很难与内源性的大肠杆菌合成酶竞争加载大肠杆菌的tRNA。
为了证明PhΔAD在大肠杆菌内是有功能的,我们利用正交琥珀抑制型tRNA进行β半乳糖苷酶抑制试验来分析PhΔAD。这种方法还可以使我们利用以前设计的詹氏甲烷球菌正交对筛选试验方案。抑制型tRNACUA(AKCUA)是利用最近描述的共有序列抑制策略(Anderson和Schultz,P.G.(2003)Adaptation of an Orthogonal ArchaealLeucyl-tRNA and Synthetase Pair for Four-base,Amber,and Opal Suppression.Biochemistry42:9598-608)设计出来的。从现有的基因组序列中挑出所有的古细菌tRNALys序列进行多序列排列,确定其共有序列。将反密码子环序列改变成CUCUAAA从而形成一个琥珀抑制型tRNA(图1)。合成AKCUA的基因,并将其插入质粒pACKO-A 184TAG(Anderson和Schultz,P.G.(2003)Adaptation of an OrthogonalArchaeal Leucyl-tRNA and Synthetase Pair for Four-base,Amber,and Opal Suppression.Biochemistry42:9598-608)以确定其琥珀型抑制效率。这个质粒含有β半乳糖苷酶的基因(bla),该基因的允许位A184上是一个TAG密码子。当没有tRNA时,检测不到全长β半乳糖苷酶的表达,对5μg/ml的氨苄青霉素敏感。当AKCUA表达时,对氨苄青霉素的耐药性没有升高,说明tRNA没有被大肠杆菌的合成酶加载。当与PhΔAD共表达时,正交tRNA被加载,产生有效的琥珀型抑制,对氨苄青霉素的耐药性升高到1000μg/ml。这些结果表明PhΔAD/AKCUA正交对是有效的正交琥珀型抑制系统。
以前的研究结果表明四碱基密码子可被大肠杆菌的tRNAUCCU Ser有效抑制。在这种情况下,四碱基密码子的抑制可与稀有密码子AGG竞争,从而使抑制型tRNA的毒性消失。AGGA抑制型tRNA来源于AKCUA,是将其反密码子环改变成CUUCCUAA,将AGGA抑制型tRNA插入到质粒pACKO-A184AGGA中。与pACKO-A184TAG一样,这个质粒在A184位点上也含有AGGA密码子,该密码子可导致翻译流产,对氨苄青霉素的耐药性只有5μg/ml。不幸的是,这个tRNA不再与大肠杆菌的合成酶正交。含有这种tRNA的细胞无论是否存在PhΔAD都可以在200μg/ml的氨苄青霉素中存活。
为了鉴定正交变体,我们构建了一个tRNA文库,其中位于1-4位和69-72位的tRNA受体臂的最后四个碱基对都是随机分布的(Anderson和Schultz,P.G.(2003)Adaptation of an Orthogonal Archaeal Leucyl-tRNA and Synthetase Pair for Four-base,Amber,and Opal Suppression.Biochemistry42:9598-608)。这些tRNA与PhΔAD共表达,细胞经两轮200μg/ml的氨苄青霉素筛选后得到一组有活性的AGGA抑制型tRNA。为了鉴定正交的变体,分离tRNA质粒,挑出384个在不存在PhΔAD时对氨苄青霉素敏感的克隆。这些克隆中,活性最高的正交克隆在有PhΔAD时对氨苄青霉素的耐药性达到700μg/ml,而在没有PhΔAD时对氨苄青霉素的耐药性只有5μg/ml。这个tRNA,AKUCCU,包含多个受体臂上的碱基替代,其中一个偶然发现的A37C突变的重要性是未知的(图5)。
为了插入能响应AGGA的高谷氨酰胺,下一步要做的是改变PhΔAD的特异性。选择高谷氨酰胺作为起始靶位来确定突变的合成酶的保真度,因为它与赖氨酸的大小一样,既有氢键提供特性,也有氢键接受特性。经过对PhKRS晶体结构的分析,发现只有两个残基E41和Y268可以特异性地识别赖氨酸的ε-氨基基团。在构建PhΔAD的小活性位点文库时通过饱和突变使这两个残基随机分布。为了筛选出hGln特异性的合成酶,我们使用了一个GFP报告质粒pREP2-AKCUA(Santoro等,(2002)Anefficient system for the evolution of aminoacyl-tRNA synthetase specificity.Nat.Biotechnol.20:1044-8),这个质粒编码AKCUA的基因、在M1和Q107位置含有两个TAG密码子的T7RNA聚合酶基因和位于T7启动子之下的GFPuv。当pREP2-AKCUA和PhΔAD共同转化时,T7RNAP上的琥珀型密码子被抑制,导致GFPuv的表达,产生绿色荧光。在没有合成酶时,细胞是白色的。因此,通过观察是否能发荧光就可以鉴定出含活性合成酶的细胞。细胞用pREP2-AKCUA共转化,然后在含hGln的培养板上培养文库。分离出每一个绿色克隆,然后用含和不含非天然氨基酸的培养基培养,挑出那些需要hGln才能发荧光的克隆。在挑出的15个克隆中,有5个能在含hGln的培养板上产生较强的荧光。在这些克隆中,除了一个之外其他都含有保守的Y268S替代;这些合成酶中特异性最高的合成酶hGlnRS具有I41和S268突变,对其做进一步鉴定。与PhΔAD相比,5个克隆相应的5个突变体具有如下的序列变化:
克隆       Y268(密码子)       E41(密码子)
2号克隆    Ser(TCT)    Val(GTT)
3号克隆    Ser(TCG)    Thr(ACG)
4号克隆    Ser(AGT)    Ser(AGT)
5号克隆    Ser(TCG)    Ile(ATT)
6号克隆    Gly(GGT)    Pro(CCG)
含有Gly24→AGGA突变的肌红蛋白用正交hGlnRS/AKTCCT对表达以确定所观察到的hGln依赖性表型是否是因为非天然氨基酸的特异性插入。在hGlnRS不存在的情况下,突变的肌红蛋白基因表达时,检测不到蛋白质的产生。而与hGlnRS共表达时,可以分离出1.8mg/ml肌红蛋白。与此相比,含野生型肌红蛋白基因的质粒pBAD-JYAMB表达时所产生的肌红蛋白的量为3.8mg/ml。对纯化蛋白的胰酶水解片段进行基质辅助的激光解吸/电离飞行时间(MALDI-TOF)分析,结果发现多肽的分子量为1676.85Da,与预测的1676.88Da一致。没有检测到在24位上含赖氨酸或谷氨酰胺的多肽。另外,我们观察到在为响应AGGA而将hGln插入期间,几乎没有毒性。在无阿拉伯糖诱导的肌红蛋白表达所使用的培养条件下,GeneHogs细胞在指数生长期间的倍增时间是含hGln的细胞的两倍。无论是否存在hGln都可以观察到生长速率的下降,这说明所产生的轻微毒性是合成酶和tRNA表达的结果,而不是AGGA抑制的结果。因此,AGGA抑制子和稀有AGG密码子之间的交叉反应并不会限制移码抑制的实际使用。
图7A说明了通过AGGA抑制而插入hGln残基时肌红蛋白的表达情况。这个图是一个蛋白印迹杂交图,所用探针为抗His C末端抗体。只有在AK514tRNA、hGlnRS(PhKRSΔ的一种hGln特异性变体)和hGln(2-5道)这三个组分都存在的情况下在G24位上含AGGA密码子的肌红蛋白基因(Myo24AGGA)才能表达出蛋白。只有在JYRS及其同源琥珀型tRNA存在的情况下在75位上为琥珀型抑制的肌红蛋白(Myo75TAG)才有可能表达,这说明赖氨酰和酪氨酰对(6-9道)是互相正交的。
我们还观察了使用PhΔAD/AKUCCU对和詹氏甲烷球菌酪氨酸合成酶JYRS在一条多肽链上同时进行TAG和AGGA抑制的可能性。当与质粒pBK-JYRS上的JYRS共表达时,pMyo-AKUCCU不能表达肌红蛋白。因此说明JYRS不能加载AKUCCU。反过来,我们通过用PhΔAD加载使质粒pBAD/JYAMB-4TAG表达肌红蛋白。这个表达质粒包含4位为TAG密码子的肌红蛋白基因和正交tRNATyr,J17(Mehl等(2003)Generation of a bacterium with a 21amino acid genetic code.J.Am.Chem.Soc.125:935-9)。与JYRS共表达时可产生3.8mg/ml的肌红蛋白,但是用PhΔAD时没有蛋白产生。这说明PhΔAD不能加载J17。因此,这些合成酶/tRNA对是互相正交的,能够联合使用而没有交叉反应。
为了在肌红蛋白中插入两个非天然氨基酸,将AKUCCU和J17一起插入到一个质粒中,这个质粒表达含Gly24→AGGA和Ala75→TAG突变的肌红蛋白。将JYRS来源的一个O-甲基-L-酪氨酸-特异性合成酶(OMeYRS)(Chin等,(2002)Addition of aphotocrosslinking amino acid to the genetic code of Escherichia coli.Proc.Natl.Acad.Sci. U.S.A.99:11020-11024)和hGlnRS共同插入到第二个质粒内。当用这两个质粒共转化的细胞在含两种氨基酸的培养基上生长时,可产生1.7mg/L肌红蛋白。但是如果排除一个非天然氨基酸或一个合成酶,则没有蛋白产生。
图7B描述的是利用两个正交tRNA系统同时插入两个不同的非天然氨基酸的肌红蛋白模型系统。这个图是一个蛋白印迹图,所用探针为抗His C末端抗体。在赖氨酰和酪氨酰正交对都存在的情况下,24位上含AGGA密码子和75位上含TAG密码子的肌红蛋白基因(Myo24AGGA/75TAG)可表达出蛋白质。利用hGlnRS和OmeTyrRS,24位上的AGGA抑制密码子和75位上的琥珀抑制型密码子分别将hGln和O-甲基-酪氨酸(OmeTyr)插入到一条多肽链上。如图所示,只有在两种非天然氨基酸、赖氨酰正交系统和酪氨酰正交系统都存在的条件下才能制备出蛋白来。
图7A和7B的蛋白印迹结果被图8和图9的分析结果进一步确证。图8显示的是如图7A所示的野生型肌红蛋白(MyoWT;据推测在24位上为赖氨酸)和突变的肌红蛋白(24AGGA;据推测可能含有hGln)的胰酶水解片段的基质辅助的激光解吸/电离飞行时间分析结果。通过对纯化蛋白的胰酶水解肽片段的分析发现多肽的分子量为1,676.85Da,与预测的分子量1676.88Da一致。没有观察到在24位上为赖氨酸(用PhKRSΔ表达的蛋白质的胰酶裂解肽的分子量为950.46Da,计算出的分子量为950.53Da,全长肽的分子量为1,661.91Da)或谷氨酰胺(计算出的分子量为1661.87Da)的多肽。
图9显示的是全长双突变蛋白(如图7B所示)的电喷雾质谱(MS)分析结果。MS结果表明含两个非天然氨基酸的肌红蛋白的分子量为18,546.40Da(SD 0.11),与预测的分子量18,546.60(SD 0.81)一致,含G24K和A75Y替代的肌红蛋白的理论分子量为18,518.3Da。
总之,我们的试验结果证明了利用移码抑制可在体内进行非天然氨基酸的位点特异性插入。另外,我们的试验结果还表明这个超嗜热古菌(P.horikoshii)来源的tRNA合成酶和詹氏甲烷球菌酪氨酰-tRNA合成酶来源的正交对是互相正交的,我们能够在一条多肽链上同时插入两个非天然氨基酸。筛选出能将互相正交的活性氨基酸甚至是荧光氨基酸插入的合成酶变体应该也是可能的。利用这种材料就有可能将荧光对插入到多肽中用于在体内进行FRET研究。同样,通过插入氨基酸之外的基序如α羟酸来制备非天然多聚物的核糖体产物也是可能的。其他的密码子如CCCU或CUAG也可以被使用,这些密码子在大肠杆菌内都是被抑制的。另外,利用有限的密码子的简并性来从新合成大肠杆菌的基因组,从而可以使可用的密码子达到43个。
材料和方法
合成酶基因的克隆和表达:制备从美国典型培养物收集中心获得的超嗜热古菌(ATCC;#700860)的基因组DNA。通过PCR扩增PhKRS,然后插入到质粒pBAD/Myc-HisA(Invitrogen)的NcoI和EcoRI位点之间,用于过量表达PhKRS。为了使其进行组成型表达,将这个合成酶基因克隆到pGLN和pKQ内(Anderson和Schultz,(2003)Adaptation of an Orthogonal Archaeal Leucyl-tRNA and Synthetase Pairfor Four-base,Amber,and Opal Suppression.Biochemistry42:9598-608),处于谷氨酰胺启动子的控制之下。这些质粒来源于pBAD/Myc-HisA,分别具有氨苄青霉素和卡那霉素抗性。同样,从大肠杆菌HB101株的lysU位点中克隆出EcKRS。按照QiagenQIA表达试剂盒所描述的方法在SYT培养基中过量表达蛋白,然后用100mMTris-HCl,pH 7.5;100mM NaCl和10%甘油透析。
体外氨酰化分析:大肠杆菌全tRNA购自Roche,嗜盐菌tRNA用RNA/DNA提取试剂盒(Qiagen)从盐杆菌NRC-1(ATCC;#700922)培养物中提取。反应总体系为20μl,其中含有50mM Tris-HCl,pH 7.5;30mM KCl;20mM MgCl2;3mM谷胱甘肽;0.1mg/mL BSA;10mMATP;1μM[3H]赖氨酸(Amersham);750nM合成酶和0、2、10或40μM全tRNA,37℃反应20分钟。
补偿分析:PALΔSΔUTR(pMAKlysU)细胞用pGLN衍生物转化以表达PhΔAD、EcKRS、或不表达合成酶,在30℃、含50μg/ml氨苄青霉素的LB琼脂培养板上培养细胞。在不含抗生素的LB琼脂培养板或液体培养基内进行合成酶缺失生长缺陷突变株PALASAUTR的补偿分析,试验温度为43℃。GeneHogs的生长状况以为阳性对照以消除合成酶表达所产生的毒性效应的可能性。对于液体培养基来说,饱和培养物用新鲜培养基稀释1000倍,在600nm处监测其8小时的生长情况。
文库构建:通过合成寡核苷酸(Genosys)的重叠延伸构建tRNA的基因,亚克隆到pACKO-A184TAG或pACKO-A184AGGA的EcoRI和PstI位点之间。这些pACYC184来源的报告质粒含有p15A复制起点、氯霉素耐药基因和一个强的组成型启动子来控制tRNA基因的表达。PhΔAD来源的文库用质粒pKQ通过EIPCR构建(Stemmer和Morris,S.K.(1992)Enzymatic inverse PCR:a restriction site independent,single-fragment method for high-efficiency,site-directed mutagenesis.Biotechniques13:214-20)。在寡核苷酸合成过程中用预先混合的亚磷酸胺来构建文库。文库的差异度比理论差异度高900倍,通过测序发现没有序列偏向性。
抑制效率的确定:通过在添加25μg/ml卡那霉素和氯霉素以及从5到1000μg/ml之间不同浓度的氨苄青霉素的LB琼脂培养基内接种来确定抑制效率。抑制效率定义为细胞能存活并形成克隆的一系列培养板中的最高浓度,其次高或次低的浓度应该在该值的20%以内。
含hGln的肌红蛋白的表达和特性鉴定:为了进行单位点插入试验,构建含p15A复制起点和编码氯霉素乙酰转移酶AKUCCU和抹香鲸肌红蛋白的基因的质粒pMyo-AKUCCU。肌红蛋白的基因被置于阿拉伯糖启动子的控制之下,在其24位是AGGA密码子。为了进行双位点插入,通过在质粒pMyo-AKUCCU的肌红蛋白基因的A74位上引入TAG密码子来构建另一个质粒。将正交tRNALys-J17置于第二lpp启动子的控制之下。合成酶hGlnRS和AzPheRS用质粒pQK表达,受谷氨酰胺独立启动子的控制。含有合适合成酶和肌红蛋白表达质粒的GeneHogs细胞在37℃培养,使之生长到OD600=0.7,所用的培养基为GMML培养基,其中添加了除赖氨酸之外的其他19种氨基酸,每种0.4mg/ml,1mg/ml hGln(Sigma),用0.02%的阿拉伯糖诱导,然后使其生长到饱和状态。超声裂解细胞,用Qiagen QIA表达试剂盒纯化肌红蛋白。其胰酶水解片段用TSRI Proteomics Facility进行MALDI-MS分析。
实施例4:示例性赖氨酰O-RS和赖氨酰O-tRNA
示例性O-tRNA见于实施例和/或表1中。示例性O-RS也见于实施例和/或表1中。因此,编码O-RS或其片段的典型多核苷酸也包括实施例和/或表1中所列的那些多核苷酸。
本发明的其他细节,特别是特殊试验的细节,见于Anderson,John Christopher,″Pathway Engineering of the Expanding Genetic Code″,Ph.D.Dissertation,The ScrippsResearch Institute[2003]的描述。
应当理解的是本文所描述的实施例和实施方式只是为了说明的目的,本领域的技术人员可以对这些实施例和实施方式进行各种修改或改变,这些经修改的实施例或实施方式也包括在本申请的精神和范围之内以及本发明附属权利要求的范围之内。
虽然为了便于理解本发明,在上文已经对本发明做了某种程度的详细描述,但是应该清楚的是,只要不偏离本发明的范围,本领域的技术人员通过阅读本说明书就可以对本发明的形式和细节作出各种修改。例如,上面所描述的各种技术方法和装置都可以不同组合的方式加以使用。出于所有目的,本申请所引用的所有文献、专利、专利申请和/或其他文献都已完整纳入本文作为参考,这就好比各个文献、专利、专利申请和/或其他文献都被单独纳入本文作为参考。
表1
Figure G200480019464120060126D000611
  SEQ ID:25   AK茎文库   NNNNCCGUAGCUCAGCCUGGUAGAGCGGCGGGCUUCCUAACCCGCAGGUCGCGGGUUCAAAUCCCGCCGGNNNNGCCA
  SEQ ID:26   AKUCCU   UGGUCCGUAGCUCAGCCUGGUAGAGCGGCGGGCUUCCUCACCCGCAGGUCGCGGGUUCAAAUCCCGCCGGACUAGCCA
  SEQ ID:27-   PhΔAD ATGGTTCATT GGGCCGATTA TATTGctgat aaaataatta gagagaggggggagaaggag aagtacgttg ttgagagtgg aataacgcca agtggttacgttcacgttgg gaactttagg gagcttttta cagcttatat tgtgggccatgccctaaggg ataaggggta tgaggttagg cacatccaca tgtgggatgattatgataga tttaggaagg ttccaaggaa cgttccccag gaatggaaagattacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccatgagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaaattagggatc gaagttgact ttctttatgc gagtgaactc tacaagagaggggaatattc tgaggagata aggttagcct ttgagaaaag ggataagataatggagatac taaacaagta tagggaaatt gcgaaacaac ctccccttccagagaactgg tggcccgcaa tggtttactg ccctgagcat aggagggaagcagagatcat tgaatgggat gggggctgga aggttaagta taagtgccccgaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgaggtggcgtgtt gattggccca tgcgttggtc tcactttggc gttgacttcgaacctgctgg aaaggatcat cttgtggctg gttcaagcta cgatacgggaaaggagatta taaaggaagt ttatggaaag gaagctccgt tatctttaatgtatgagttt gttggaatta aggggcagaa ggggaagatg agtggtagtaagggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggtctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagatagatctaggt cttggcattc taaacctcta cgatgagttc gataaagttgagagaatata cttcggggtt gagggtggta aaggtgatga tgaagaattaaggaggactt acgagctttc gGTGATGCTG CCAACTTACT GA
  SEQ ID:28   PhΔAD.pep MVHWADYIAD KIIRERGEKE KYVVESGITP SGYVHVGNFR ELFTAYIVGHALRDKGYEVR HIHMWDDYDR FRKVPRNVPQ EWKDYLGMPI SEVPDPWGCHESYAEHFMRK FEEEVEKLGI EVDFLYASEL YKRGEYSEEI RLAFEKRDKIMEILNKYREI AKQPPLPENW WPAMVYCPEH RREAEIIEWD GGWKVKYKCPEGHEGWVDIR SGNVKLRWRV DWPMRWSHFG VDFEPAGKDH LVAGSSYDTGKEIIKEVYGK EAPLSLMYEF VGIKGQKGKM SGSKGNVILL SDLYEVLEPGLVRFIYARHR PNKEIKIDLG LGILNLYDEF DKVERIYFGV EGGKGDDEELRRTYELSVML PTY
  SEQ ID:29   PhE444G也称为PhKPS atggttcatt gggccgatta tattgctgat aaaataatta gagagaggggggagaaggag aagtacgttg ttgagagtgg aataacgcca agtggttacgttcacgttgg gaactttagg gagcttttta cagcttatat tgtgggccatgccctaaggg ataaggggta tgaggttagg cacatccaca tgtgggatgattatgataga tttaggaagg ttccaaggaa cgttccccag gaatggaaagattacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccatgagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaaattagggatc gaagttgact ttctttatgc gagtgaactc tacaagagaggggaatattc tgaggagata aggttagcct ttgagaaaag ggataagataatggagatac taaacaagta tagggaaatt gcgaaacaac ctccccttccagagaactgg tggcccgcaa tggtttactg ccctgagcat aggagggaagcagagatcat tgaatgggat gggggctgga aggttaagta taagtgccccgaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgaggtggcgtgtt gattggccca tgcgttggtc tcactttggc gttgacttcgaacctgctgg aaaggatcat cttgtggctg gttcaagcta cgatacgggaaaggagatta taaaggaagt ttatggaaag gaagctccgt tatctttaatgtatgagttt gttggaatta aggggcagaa ggggaagatg agtggtagtaagggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggtctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagatagatctaggt cttggcattc taaacctcta cgatgagttc gataaagttgagagaatata cttcggggtt gagggtggta aaggtgatga tgaagaattaaggaggactt acgagctttc aatgcctaag aagcctgaga gattagtcgc
- tcaagctcct tttaggttcc tagcggtgtt ggttcagtta ccgcatttaaccgaagaaga cataataaat gttctaatca aacagggaca tattcccagggatctatcca aggaggacgt tgagagggtt aaacttagga taaaccttgctaggaattgg gttaaaaagt atgcccctga ggatgttaaa ttctcaatacttgagaaacc tccagaagtt gaggtaagtg Gagatgttag ggaggccatgaatgaggttg ctgagtggct tgagaatcat gaggaattta gcgttgaagagtttaataac attctattcg aagttgccaa gaggaggggg atatccagtagggagtggtt ttcgacgctc tacagattat ttattggaaa ggaaaggggaccgagattgg ccagtttcct ggcatctctt gataggagtt tcgttattaaacgacttaga cttgagggat ag
 SEQ ID:30   PhE444G.pep也称为PhKPS MVHWADYIAD KIIRERGEKE KYVVESGITP SGYVHVGNFR ELFTAYIVGHALRDKGYEVR HIHMWDDYDR FRKVPRNVPQ EWKDYLGMPI SEVPDPWGCHESYAEHFMRK FEEEVEKLGI EVDFLYASEL YKRGEYSEEI RLAFEKRDKIMEILNKYREI AKQPPLPENW WPAMVYCPEH RREAEIIEWD GGWKVKYKCPEGHEGWVDIR SGNVKLRWRV DWPMRWSHFG VDFEPAGKDH LVAGSSYDTGKEIIKEVYGK EAPLSLMYEF VGIKGQKGKM SGSKGNVILL SDLYEVLEPGLVRFIYARHR PNKEIKIDLG LGILNLYDEF DKVERIYFGV EGGKGDDEELRRTYELSMPK KPERLVAQAP FRFLAVLVQL PHLTEEDIIN VLIKQGHIPRDLSKEDVERV KLRINLARNW VKKYAPEDVK FSILEKPPEV EVSGDVREAMNEVAEWLENH EEFSVEEFNN ILFEVAKRRG ISSREWFSTL YRLFIGKERGPRLASFLASL DRSFVIKRLR LEG
 SEQ ID:31   pACKO-A184TAG gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccggataaaactt gtgcttattt ttctttacgg tctttaaaaa ggccgtaatatccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgcctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatccagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgataactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagttggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggcccagggcttccc ggtatcaaca gggacaccag gatttattta ttctgcgaagtgatcttccg tcacaggtat ttattcggcg caaagtgcgt cgggtgatgctgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtggcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggtgcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatactggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtggcaggagaaaa aaggctgcac cggtgcgtca gcagaatatg tgatacaggatatattccgc ttcctcgctc actgactcgc tacgctcggt cgttcgactgcggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgccaggaagata cttaacaggg aagtgagagg gccgcggcaa agccgtttttccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatcagtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccctggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgtcattccgctg ttatggccgc gtttgtctca ttccacgcct gacactcagttccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgttcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacccggaaagaca tgcaaaagca ccactggcag cagccactgg taattgatttagaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaaggacaagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagagttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttcgttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatcatcttattaa tcagataaaa tatttctaga tttcagtgca atttatctcttcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctcatgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacagttaaattgct aacgcagtca ggcaccgtgt atgaaatcta acaatgcgctcatcgtcatc ctcggcaccg tcaccctgga tgctgtaggc ataggcttggttatgccggt actgccgggc ctcttgcggg atatcGGTTT CTTAGACGTCAGGTGGCACT TTtcggggaa atgtgcgcgg aacccctatt tgtttatttttctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa
- atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccgtgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctcacccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgcacgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagagttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgctatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggtcgccgcatac actattctca gaatgacttg gttgagtact caccagtcacagaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctgccataaccat gagtgataac actgcggcca acttacttct gacaacgatcggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgtaactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacgacgagcgtga caccacgatg cctTAGgcaa tggcaacaac gttgcgcaaactattaactg gcgaactact tactctagct tcccggcaac aattaatagactggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttccggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtctcgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgtagttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagacagatcgctga gataggtgcc tcactgatta agcattggca ccaccaccaccaccactaaC CCGGGACCAA GTTTACTCAT ATATACttta gattgatttaaaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataatCTCATGACC AAAATCCCTT AACGgcatgc accattcctt gcggcggcggtgctcaacgg cctcaaccta ctactGGGCT GCTTCCTAAT GCAGGAGTCGCATAAGGGAG AGCGTCTGGC GAAAGGGGGA TGTGCTGCAA GGCGATTAAGTTGGGTAACG CCAGGGTTTT CCCAGTCACG ACGTTGTAAA ACGACGGCCAGTGCCAAGCT TAAAAAaaat ccttagcttt cgctaaggat CTGCAGTTATAATCTCTTTC TAATTGGCTC TAAAATCTTT ATAAGTTCTT CAGCTACAGCATTTTTTAAA TCCATTGGAT GCAATTCCTT ATTTTTAAAT AAACTCTCTAACTCCTCATA GCTATTAACT GTCAAATCTC CACCAAATTT TTCTGGCCTTTTTATGGTTA AAGGATATTC AAGGAAGTAT TTAGCTATCT CCATTATTGGATTTCCTTCA ACAACTCCAG CTGGGCAGTA TGCTTTCTTT ATCTTAGCCCTAATCTCTTC TGGAGAGTCA TCAACAGCTA TAAAATTCCC TTTTGAAGAACTCATCTTTC CTTCTCCATC CAAACCCGTT AAGACAGGGT TGTGAATACAAACAACCTTT TTTGGTAAAA GCTCCCTTGC TAACATGTGT ATTTTTCTCTGCTCCATCCC TCCAACTGCA ACATCAACGC CTAAATAATG AATATCATTAACCTGCATTA TTGGATAGAT AACTTCAGCA ACCTTTGGAT TTTCATCCTCTCTTGCTATA AGTTCCATAC TCCTTCTTGC TCTTTTTAAG GTAGTTTTTAAAGCCAATCT ATAGACATTC AGTGTATAAT CCTTATCAAG CTGGAATTCagcgttacaag tattacacaa agttttttat gttgagaata tttttttgatggggcgccac ttatttttga tcgttcgctc aaagAAGCGG CGCCAGGGNTGTTTTTCTTT TCACCAGTNA GACGGGCAAC AGAACGCCAT Gagcggcctcatttcttatt ctgagttaca acagtccgca ccgctgtccg gtagctccttccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttctttatcatgca actcgtagga caggtgccgg cagcgcccaa cagtcccccggccacggggc ctgccaccat acccacgccg aaacaagcgc cctgcaccattatgttccgg atctgcatcg caggatgctg ctggctaccc tgtggaacacctacatctgt attaacgaag cgctaaccgt ttttatcagg ctctgggaggcagaataaat gatcatatcg tcaattatta cctccacggg gagagcctgagcaaactggc ctcaggcatt tgagaagcac acggtcacac tgcttccggtagtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgaccctgccctga accgacgacc gggtcgaatt tgctttcgaa tttctgccattcatccgctt attatcactt attcaggcgt agcaccaggc gtttaagggcaccaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcagtactgttgta attcattaag cattctgccg acatggaagc catcacagacggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcgtataatattt gcccatggtg aaaacggggg cgaagaagtt gtccatattggccacgttta aatcaaaact ggtgaaactc acccagggat tggctgagacgaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcaccgtaacacgc cacatcttgc gaatatatgtgtagaaactg ccggaaatcgtcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa
aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctttcattgccat acg
  SEQ ID:32-   pACKO-A184AGGA gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccggataaaactt gtgcttattt ttctttacgg tctttaaaaa ggccgtaatatccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgcctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatccagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgataactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagttggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggcccagggcttccc ggtatcaaca gggacaccag gatttattta ttctgcgaagtgatcttccg tcacaggtat ttattcggcg caaagtgcgt cgggtgatgctgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtggcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggtgcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatactggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtggcaggagaaaa aaggctgcac cggtgcgtca gcagaatatg tgatacaggatatattccgc ttcctcgctc actgactcgc tacgctcggt cgttcgactgcggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgccaggaagata cttaacaggg aagtgagagg gccgcggcaa agccgtttttccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatcagtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccctggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgtcattccgctg ttatggccgc gtttgtctca ttccacgcct gacactcagttccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgttcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacccggaaagaca tgcaaaagca ccactggcag cagccactgg taattgatttagaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaaggacaagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagagttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttcgttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatcatcttattaa tcagataaaa tatttctaga tttcagtgca atttatctcttcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctcatgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacagttaaattgct aacgcagtca ggcaccgtgt atgaaatcta acaatgcgctcatcgtcatc ctcggcaccg tcaccctgga tgctgtaggc ataggcttggttatgccggt actgccgggc ctcttgcggg atatcGGTTT CTTAGACGTCAGGTGGCACT TTtcggggaa atgtgcgcgg aacccctatt tgtttatttttctaaataca ttcaaatatg tatccgctca tgagacaata accctgataaatgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccgtgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctcacccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgcacgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagagttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgctatgtggcgc ggtattatcc cgtgttgacg ccgggcaaga gcaactcggtcgccgcatac actattctca gaatgacttg gttgagtact caccagtcacagaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctgccataaccat gagtgataac actgcggcca acttacttct gacaacgatcggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgtaactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacgacgagcgtga caccacgatg cctAGGAgca atggcaacaa cgttgcgcaaactattaact ggcgaactac ttactctagc ttcccggcaa caattaatagactggatgga ggcggataaa gttgcaggac cacttctgcg ctcggcccttccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtctcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcgtagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaatagacagatcgctg agataggtgc ctcactgatt aagcattggc accaccaccaccaccactaa CCCGGGACCA AGTTTACTCA TATATACttt agattgatttaaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata
- atCTCATGAC CAAAATCCCT TAACGgcatg caccattcct tgcggcggcggtgctcaacg gcctcaacct actactGGGC TGCTTCCTAA TGCAGGAGTCGCATAAGGGA GAGCGTCTGG CGAAAGGGGG ATGTGCTGCA AGGCGATTAAGTTGGGTAAC GCCAGGGTTT TCCCAGTCAC GACGTTGTAA AACGACGGCCAGTGCCAAGC TTAAAAAaaa tccttagctt tcgctaagga tCTGCAGTTATAATCTCTTT CTAATTGGCT CTAAAATCTT TATAAGTTCT TCAGCTACAGCATTTTTTAA ATCCATTGGA TGCAATTCCT TATTTTTAAA TAAACTCTCTAACTCCTCAT AGCTATTAAC TGTCAAATCT CCACCAAATT TTTCTGGCCTTTTTATGGTT AAAGGATATT CAAGGAAGTA TTTAGCTATC TCCATTATTGGATTTCCTTC AACAACTCCA GCTGGGCAGT ATGCTTTCTT TATCTTAGCCCTAATCTCTT CTGGAGAGTC ATCAACAGCT ATAAAATTCC CTTTTGAAGAACTCATCTTT CCTTCTCCAT CCAAACCCGT TAAGACAGGG TTGTGAATACAAACAACCTT TTTTGGTAAA AGCTCCCTTG CTAACATGTG TATTTTTCTCTGCTCCATCC CTCCAACTGC AACATCAACG CCTAAATAAT GAATATCATTAACCTGCATT ATTGGATAGA TAACTTCAGC AACCTTTGGA TTTTCATCCTCTCTTGCTAT AAGTTCCATA CTCCTTCTTG CTCTTTTTAA GGTAGTTTTTAAAGCCAATC TATAGACATT CAGTGTATAA TCCTTATCAAG CTGGAATTCagcgttacaa gtattacaca aagtttttta tgttgagaat atttttttgatggggcgcca cttatttttg atcgttcgct caaagAAGCG GCGCCAGGGNTGTTTTTCTT TTCACCAGTN AGACGGGCAA CAGAACGCCA TGAgcggcctcatttcttat tctgagttac aacagtccgc accgctgtcc ggtagctccttccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttctttatcatgc aactcgtagg acaggtgccg gcagcgccca acagtcccccggccacgggg cctgccacca tacccacgcc gaaacaagcg ccctgcaccattatgttccg gatctgcatc gcaggatgct gctggctacc ctgtggaacacctacatctg tattaacgaa gcgctaaccg tttttatcag gctctgggaggcagaataaa tgatcatatc gtcaattatt acctccacgg ggagagcctgagcaaactgg cctcaggcat ttgagaagca cacggtcaca ctgcttccggtagtcaataa accggtaaac cagcaataga cataagcggc tatttaacgaccctgccctg aaccgacgac cgggtcgaat ttgctttcga atttctgccattcatccgct tattatcact tattcaggcg tagcaccagg cgtttaagggcaccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgcagtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacagacggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgcgtataatatt tgcccatggt gaaaacgggg gcgaagaagt tgtccatattggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgagacgaaaaacat attctcaata aaccctttag ggaaataggc caggttttcaccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatcgtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatggaaaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtctttcattgcca tacg
  SEQ ID:33   pACKO-Bla gaactccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccggataaaactt gtgcttattt ttctttacgg tctttaaaaa ggccgtaatatccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgcctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatccagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgataactcaaaaa atacgcccgg tagtgatctt atttcattat ggtgaaagttggaacctctt acgtgccgat caacgtctca ttttcgccaa aagttggcccagggcttccc ggtatcaaca gggacaccag gatttattta ttctgcgaagtgatcttccg tcacaggtat ttattcggcg caaagtgcgt cgggtgatgctgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtggcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggtgcgtaacggc aaaagcaccg ccggacatca gcgctagcgg agtgtatactggcttactat gttggcactg atgagggtgt cagtgaagtg cttcatgtggcaggagaaaa aaggctgcac cggtgcgtca gcagaatatg tgatacaggatatattccgc ttcctcgctc actgactcgc tacgctcggt cgttcgactgcggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgccaggaagata cttaacaggg aagtgagagg gccgcggcaa agccgttttt
- ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatcagtggtggcg aaacccgaca ggactataaa gataccaggc gtttccccctggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgtcattccgctg ttatggccgc gtttgtctca ttccacgcct gacactcagttccgggtagg cagttcgctc caagctggac tgtatgcacg aaccccccgttcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacccggaaagaca tgcaaaagca ccactggcag cagccactgg taattgatttagaggagtta gtcttgaagt catgcgccgg ttaaggctaa actgaaaggacaagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagagttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttcgttttcagag caagagatta cgcgcagacc aaaacgatct caagaagatcatcttattaa tcagataaaa tatttctaga tttcagtgca atttatctcttcaaatgtag cacctgaagt cagccccata cgatataagt tgtaattctcatgtttgaca gcttatcatc gataagcttt aatgcggtag tttatcacagttaaattgct aacgcagtca ggcaccgtgt atgaaatcta acaatgcgctcatcgtcatc ctcggcaccg tcaccctgga tgctgtaggc ataggcttggttatgccggt actgccgggc ctcttgcggg atatcGGTTT CTTAGACGTCAGGTGGCact tttcggggaa atgtgcgcgg aacccctatt tgtttatttttctaaataca ttcaaatatg tatccgctca tgagacaata accctgataaatgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccgtgtcgccctt attccctttt ttgcggcatt ttgccttCCT GTTTTTGCTCACCCAGAAAC ACTAGtgcag caatggcaac aacgttgcgc aaactattaactggcgaact acttactcta gcttcccggc aacaattaat agactggatggaggcggata aagttgcagg accacttctg cgctcggccc ttccggctggctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggtatcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatctacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgctgagataggt gcctCACTGA TTAAGCATTG GTAACCCGGG ACCAAGTTTACTCATATATA Ctttagattg atttaaaact tcatttttaa tttaaaaggatctaggtgaa gatccttttt gataatCTCA TGACCAAAAT CCCTTAACGgcatgcaccat tccttgcggc ggcggtgctc aacggcctca acctactactGGGCTGCTTC CTAATGCAGG AGTCGCATAA GGGAGAGCGT CTGGCGAAAGGGGGATGTGC TGCAAGGCGA TTAAGTTGGG TAACGCCAGG GTTTTCCCAGTCACGACGTT GTAAAACGAC GGCCAGTGCC AAGCTTAAAA Aaaatccttagctttcgcta aggatCTGCA GTTATAATCT CTTTCTAATT GGCTCTAAAATCTTTATAAG TTCTTCAGCT ACAGCATTTT TTAAATCCAT TGGATGCAATTCCTTATTTT TAAATAAACT CTCTAACTCC TCATAGCTAT TAACTGTCAAATCTCCACCA AATTTTTCTG GCCTTTTTAT GGTTAAAGGA TATTCAAGGAAGTATTTAGC TATCTCCATT ATTGGATTTC CTTCAACAAC TCCAGCTGGGCAGTATGCTT TCTTTATCTT AGCCCTAATC TCTTCTGGAG AGTCATCAACAGCTATAAAA TTCCCTTTTG AAGAACTCAT CTTTCCTTCT CCATCCAAACCCGTTAAGAC AGGGTTGTGA ATACAAACAA CCTTTTTTGG TAAAAGCTCCCTTGCTAACA TGTGTATTTT TCTCTGCTCC ATCCCTCCAA CTGCAACATCAACGCCTAAA TAATGAATAT CATTAACCTG CATTATTGGA TAGATAACTTCAGCAACCTT TGGATTTTCA TCCTCTCTTG CTATAAGTTC CATACTCCTTCTTGCTCTTT TTAAGGTAGT TTTTAAAGCC AATCTATAGA CATTCAGTGTATAATCCTTA TCAAGCTGGA ATTCagcgtt acaagtatta cacaaagttttttatgttga gaatattttt ttgatggggc gccacttatt tttgatcgttcgctcaaagA AGCGGCGCCA GGGNTGTTTT TCTTTTCACC AGTTAGACGGGCAACAGAAC GCCATGAgcg gcctcatttc ttattctgag ttacaacagtccgcaccgct gtccggtagc tccttccggt gggcgcgggg catgactatcgtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggtgccggcagcg cccaacagtc ccccggccac ggggcctgcc accatacccacgccgaaaca agcgccctgc accattatgt tccggatctg catcgcaggatgctgctggc taccctgtgg aacacctaca tctgtattaa cgaagcgctaaccgttttta tcaggctctg ggaggcagaa taaatgatca tatcgtcaattattacctcc acggggagag cctgagcaaa ctggcctcag gcatttgagaagcacacggt cacactgctt ccggtagtca ataaaccggt aaaccagcaatagacataag cggctattta acgaccctgc cctgaaccga cgaccgggtc
- gaatttgctt tcgaatttct gccattcatc cgcttattat cacttattcaggcgtagcac caggcgttta agggcaccaa taactgcctt aaaaaaattacgccccgccc tgccactcat cgcagtactg ttgtaattca ttaagcattctgccgacatg gaagccatca cagacggcat gatgaacctg aatcgccagcggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaacgggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtgaaactcaccca gggattggct gagacgaaaa acatattctc aataaaccctttagggaaat aggccaggtt ttcaccgtaa cacgccacat cttgcgaatatatgtgtaga aactgccgga aatcgtcgtg gtattcactc cagagcgatgaaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacactatcccatatca ccagctcacc gtctttcatt gccatacg
  SEQ ID:34   pKQ ATGGATCCGA GCTCGAGATC TGCAGCTGGT ACCATATGGG AATTCGAAGCTTGGGCCCGA ACAAAAACTC ATCTCAGAAG AGGATCTGAA TAGCGCCGTCGACCATCATC ATCATCATCA TTGAGTTTAA ACGGTCTCCA GCTTGGCTGTTTTGGCGGAT GAGAGAAGAT TTTCAGCCTG ATACAGATTA AATCAGAACGCAGAAGCGGT CTGATAAAAC AGAATTTGCC TGGCGGCAGT AGCGCGGTGGTCCCACCTGA CCCCATGCCG AACTCAGAAG TGAAACGCCG TAGCGCCGATGGTAGTGTGG GGTCTCCCCA TGCGAGAGTA GGGAACTGCC AGGCATCAAATAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGTTTGTCGGTGA ACGATATCTG CTTTTCTTCG CGAATtaatt ccgcttcgcaACATGTgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcgttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaatcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagataccaggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctgccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgctttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgctccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgccttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatcgccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtaggcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactagaaggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaaaagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtggtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaagaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaactcacgttaa gggattttgg TCATGAgttg tgtctcaaaa tctctgatgttacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgcttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaacgtcttgctc gaggccgcga ttaaattcca acatggatgc tgatttatatgggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatctatcgattgtat gggaagcccg atgcgccaga gttgtttctg aaacatggcaaaggtagcgt tgccaatgat gttacagatg agatggtcag actaaactggctgacggaat ttatgcctct tccgaccatc aagcatttta tccgtactcctgatgatgca tggttactca ccactgcgat ccccgggaaa acagcattccaggtattaga agaatatcct gattcaggtg aaaatattgt tgatgcgctggcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttttaacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaataacggtttggt tgatgcgagt gattttgatg acgagcgtaa tggctggcctgttgaacaag tctggaaaga aatgcataag cttttgccat tctcaccggattcagtcgtc actcatggtg atttctcact tgataacctt atttttgacgaggggaaatt aataggttgt attgatgttg gacgagtcgg aatcgcagaccgataccagg atcttgccat cctatggaac tgcctcggtg agttttctccttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgatatgaataaatt gcagtttcat ttgatgctcg atgagttttt ctaatcagaattggttaatt ggttgtaaca ctggcagagc attacgctga cttgacgggacggcggcttt gttgaataaa tcgaactttt gctgagttga aggatcCRCGGGagttgtca gcctgtcccg cttataagat catacgcctg tatacGTTGTTTACGCTTTG AGGAATTAAC C
  SEQ ID:35-   pKQ-PhKep ATGGTTCATT GGGCCGATTA TATTGctgat aaaataatta gagagaggggggagaaggag aagtacgttg ttgagagtgg aataacgcca agtggttacgttcacgttgg gaactttagg gagcttttta cagcttatat tgtgggccatgccctaaggg ataaggggta tgaggttagg cacatccaca tgtgggatgattatgataga tttaggaagg ttccaaggaa cgttccccag gaatggaaagattacctggg aatgcccatt agtgaagttc ctgatccctg gggatgccatgagagttatg ctgaacactt catgagaaag ttcgaggagg aggtagaaaaattagggatc gaagttgact ttctttatgc gagtgaactc tacaagagaggggaatattc tgaggagata aggttagcct ttgagaaaag ggataagataatggagatac taaacaagta tagggaaatt gcgaaacaac ctccccttccagagaactgg tggcccgcaa tggtttactg ccctgagcat aggagggaagcagagatcat tgaatgggat gggggctgga aggttaagta taagtgccccgaaggtcacg agggatgggt tgatataagg agtgggaacg tgaaactgaggtggcgtgtt gattggccca tgcgttggtc tcactttggc gttgacttcgaacctgctgg aaaggatcat cttgtggctg gttcaagcta cgatacgggaaaggagatta taaaggaagt ttatggaaag gaagctccgt tatctttaatgtatgagttt gttggaatta aggggcagaa ggggaagatg agtggtagtaagggaaatgt tattttactc agcgatctgt atgaggttct tgagccaggtctcgttagat ttatctacgc tcggcatagg ccaaacaagg agataaagatagatctaggt cttggcattc taaacctcta cgatgagttc gataaagttgagagaatata cttcggggtt gagggtggta aaggtgatga tgaagaattaaggaggactt acgagctttc ggtgatgctg ccaacttact gatttagtgtatgatggtgt ttttgaggtg ctccagtggc ttctgtttct atcagctgtccctcctgttc agctactgac ggggtggtgc gtaacggcaa aagcaccgccggacatcagc gctatctctg ctctcactgc cgtaaaacat ggcaactgcagttcacttac accgcttctc aacccggtac gcaccagaaa atcattgatatggccatgaa tggcgttgga tgccgggcaa ccgcccgcat tatgggcgttggcctcaaca cgattttccg ccatttaaaa aactcaggcc gcagtcggtaacctcgcgca tacagccggg cagtgacgtc atcgtctgcg cggaaatggacgaacagtgg ggatacgtcg gtgctaaatc gcgccagcgc tggctgttttacgcgtatga caggctccgg aagacggttg ttgcgcacgt attcggtgaacgcactatgg cgacgctggg gcgtcttatg agcctgctgt caccctttgacgtggtgata tggatgacgg atggctggcc gctgtatgaa tcccgcctgaagggaaagct gcacgtaatc agcaagcgat atacgcagcg aattgagcggcataacctga atctgaggca gcacctggca cggctgggac ggaagtcgctgtcgttctca aaatcggtgg agctgcatga caaagtcatc gggcattatctgaacataaa acactatcaa taagttggag tcattacccc gagctttcaatgcctaagaa gcctgagaga ttagtcgctc aagctccttt taggttcctagcggtgttgg ttcagttacc gcatttaacc gaagaagaca taataaatgttctaatcaaa cagggacata ttcccaggga tctatccaag gaggacgttgagagggttaa acttaggata aaccttgcta ggaattgggt taaaaagtatgcccctgagg atgttaaatt ctcaatactt gagaaacctc cagaagttgaggtaagtgaa gatgttaggg aggccatgaa tgaggttgct gagtggcttgagaatcatga ggaatttagc gttgaagagt ttaataacat tctattcgaagttgccaaga ggagggggat atccagtagg gagtggtttt cgacgctctacagattattt attggaaagg aaaggggacc gagattggcc agtttcctggcatctcttga taggagtttc gttattAAAC GACTTAGACT TGAGGGATAAGAATTCGAAG CTTGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGAATAGCGCCGT CGACCATCAT CATCATCATC ATTGAGTTTA AACGGTCTCCAGCTTGGCTG TTTTGGCGGA TGAGAGAAGA TTTTCAGCCT GATACAGATTAAATCAGAAC GCAGAAGCGG TCTGATAAAA CAGAATTTGC CTGGCGGCAGTAGCGCGGTG GTCCCACCTG ACCCCATGCC GAACTCAGAA GTGAAACGCCGTAGCGCCGA TGGTAGTGTG GGGTCTCCCC ATGCGAGAGT AGGGAACTGCCAGGCATCAA ATAAAACGAA AGGCTCAGTC GAAAGACTGG GCCTTTCGTTTTATCTGTTG TTTGTCGGTG AACGATATCT GCTTTTCTTC GCGAATtaattccgcttcgc aACATGTgag caaaaggcca gcaaaaggcc aggaaccgtaaaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgagcatcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggactataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg
- ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcgggaagcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgtaggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccgaccgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaagacacgacttat cgccactggc agcagccact ggtaacagga ttagcagagcgaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacggctacactag aaggacagta tttggtatct gcgctctgct gaagccagttaccttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgctggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaaaaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcagtggaacgaaa actcacgtta agggattttg gTCATGAgtt gtgtctcaaaatctctgatg ttacattgca caagataaaa atatatcatc atgaacaataaaactgtctg cttacataaa cagtaataca aggggtgtta tgagccatattcaacgggaa acgtcttgct cgaggccgcg attaaattcc aacatggatgctgatttata tgggtataaa tgggctcgcg ataatgtcgg gcaatcaggtgcgacaatct atcgattgta tgggaagccc gatgcgccag agttgtttctgaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtcagactaaactg gctgacggaa tttatgcctc ttccgaccat caagcattttatccgtactc ctgatgatgc atggttactc accactgcga tccccgggaaaacagcattc caggtattag aagaatatcc tgattcaggt gaaaatattgttgatgcgct ggcagtgttc ctgcgccggt tgcattcgat tcctgtttgtaattgtcctt ttaacagcga tcgcgtattt cgtctcgctc aggcgcaatcacgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgtaatggctggcc tgttgaacaa gtctggaaag aaatgcataa gcttttgccattctcaccgg attcagtcgt cactcatggt gatttctcac ttgataaccttatttttgac gaggggaaat taataggttg tattgatgtt ggacgagtcggaatcgcaga ccgataccag gatcttgcca tcctatggaa ctgcctcggtgagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattgataatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttttctaatcaga attggttaat tggttgtaac actggcagag cattacgctgacttgacggg acggcggctt tgttgaataa atcgaacttt tgctgagttgaaggatcCTC GGGagttgtc agcctgtccc gcttataaga tcatacgccgttatacGTTG TTTACGCTTT GAGGAATTAA CC

Claims (18)

1.一种翻译系统,该翻译系统包括:
正交赖氨酰tRNA(赖氨酰O-tRNA)以及优先将一个或多个氨基酸加载于赖氨酰O-tRNA的正交氨酰tRNA合成酶(O-RS),其中所述赖氨酰O-tRNA和O-RS来源于超嗜热古菌(Pyrococcus horikoshii),所述正交赖氨酰O-tRNA抑制翻译系统中核酸的选择者密码子,
其中,所述O-RS是如SEQ ID NO:30所示的PhE444G、如SEQ ID NO:28所示的PhΔAD、或是PhΔAD的I41和S268突变体,
所述正交赖氨酰O-tRNA是根据共有序列抑制型策略设计的,其含有CU(X)XXXAA反密码子环,其中的(X)XXX是密码子的反向互补序列,且其茎区无错配碱基。
2.如权利要求1所述的翻译系统,其特征在于,所述翻译系统包含细胞。
3.如权利要求2所述的翻译系统,其特征在于,所述细胞是大肠杆菌细胞。
4.如权利要求1所述的翻译系统,其特征在于,所述氨基酸是非天然氨基酸。
5.如权利要求4所述的翻译系统,其特征在于,所述非天然氨基酸是高谷氨酰胺。
6.如权利要求1所述的翻译系统,其特征在于,当所述O-RS在大肠杆菌内表达时,它所具有的毒性等于或低于PhΔAD的I41和/或S268突变体。
7.如权利要求1所述的翻译系统,其特征在于,所述赖氨酰O-tRNA包含四碱基密码子或琥珀密码子的识别序列。
8.如权利要求1所述的翻译系统,其特征在于,所述赖氨酰O-tRNA包含AGGA的识别序列。
9.如权利要求1所述的翻译系统,其特征在于,所述CU(X)XXXAA序列为CUCUAAA或CUUCCUAA。
10.如权利要求1所述的翻译系统,其特征在于,所述O-RS和赖氨酰O-tRNA抑制终止或移码选择者密码子的效率至少相当于SEQ ID NO:30所示的PhE444G、如SEQ ID NO:28所示的PhΔAD或PhΔAD的I41和/或S268突变体与SEQ IDNO:24或SEQ ID NO:26的O-tRNA联合时的50%。
11.如权利要求1所述的翻译系统,该系统包括其它O-RS和其它O-tRNA,其中所述其它O-RS和其它O-tRNA所抑制的移码选择者密码子不同于所述赖氨酰O-tRNA和优先加载所述赖氨酰O-tRNA的所述O-RS所抑制的移码选择者密码子。
12.如权利要求1所述的翻译系统,其特征在于,所述翻译系统对编码靶多肽的靶核酸中的四碱基选择者密码子和终止选择者密码子均抑制。
13.如权利要求12所述的翻译系统,其特征在于,所述四碱基选择者密码子的序列为AGGA,且终止选择者密码子的序列为TAG或UAG。
14.如权利要求1所述的翻译系统,该系统包括含四碱基选择者密码子的靶核酸。
15.如权利要求14所述的翻译系统,该系统包括所述靶核酸编码的蛋白质。
16.如权利要求15所述的翻译系统,其特征在于,所述蛋白质含有高谷氨酰胺。
17.如权利要求1所述的翻译系统,该系统包括含有四碱基选择者密码子和终止选择者密码子的靶核酸。
18.如权利要求17所述的翻译系统,该系统包括由所述靶核酸编码的蛋白质,其中所述蛋白质含有至少两个不同的非天然氨基酸。
CN2004800194641A 2003-07-07 2004-07-07 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用 Expired - Fee Related CN101076598B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US48545103P 2003-07-07 2003-07-07
US60/485,451 2003-07-07
US52881503P 2003-12-10 2003-12-10
US60/528,815 2003-12-10
US53714904P 2004-01-15 2004-01-15
US60/537,149 2004-01-15
PCT/US2004/022187 WO2005019415A2 (en) 2003-07-07 2004-07-07 Compositions of orthogonal lysyl-trna and aminoacyl-trna synthetase pairs and uses thereof

Publications (2)

Publication Number Publication Date
CN101076598A CN101076598A (zh) 2007-11-21
CN101076598B true CN101076598B (zh) 2012-07-25

Family

ID=34222340

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800194641A Expired - Fee Related CN101076598B (zh) 2003-07-07 2004-07-07 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用

Country Status (14)

Country Link
US (4) US7638297B2 (zh)
EP (2) EP1666604B1 (zh)
JP (2) JP5192150B2 (zh)
CN (1) CN101076598B (zh)
AT (2) ATE471385T1 (zh)
AU (1) AU2004267359B2 (zh)
BR (1) BRPI0412272A (zh)
CA (1) CA2531146A1 (zh)
DE (2) DE602004027770D1 (zh)
ES (1) ES2301099T3 (zh)
MX (1) MXPA06000242A (zh)
PT (2) PT1666604E (zh)
SI (1) SI1666604T1 (zh)
WO (1) WO2005019415A2 (zh)

Families Citing this family (135)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2464532T3 (es) * 2001-04-19 2014-06-03 The Scripps Research Institute Métodos y composiciones para la producción de pares ortogonales de ARNt-aminoacil-ARNt sintetasa
CA2500653A1 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
ATE542894T1 (de) 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
BRPI0411475A (pt) 2003-06-18 2006-07-25 Scripps Research Inst adições de código genético de aminoácido reativo não natural
JP5192150B2 (ja) * 2003-07-07 2013-05-08 ザ スクリプス リサーチ インスティチュート 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用
WO2005038002A2 (en) 2003-10-14 2005-04-28 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
KR20070007086A (ko) 2004-02-02 2007-01-12 암브룩스, 인코포레이티드 변형된 인간의 4 개의 나선형 다발 폴리펩티드 및 이의용도
WO2005116237A2 (en) * 2004-05-25 2005-12-08 The Scripps Research Institute Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination
NZ551335A (en) 2004-06-18 2010-03-26 Ambrx Inc Antibodies and fragments thereof comprising an non naturally encoded amino acid coupled to a linker
US7718410B2 (en) 2004-09-21 2010-05-18 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
US20080064059A1 (en) 2004-10-20 2008-03-13 Scripps Research Institute In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria
AU2005330514B2 (en) 2004-10-27 2011-05-12 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
MX2007007591A (es) 2004-12-22 2007-07-25 Ambrx Inc Metodos para expresion y purificacion de hormona de crecimiento humano recombinante.
CN103520735B (zh) 2004-12-22 2015-11-25 Ambrx公司 包含非天然编码的氨基酸的人生长激素配方
NZ584597A (en) 2004-12-22 2011-09-30 Ambrx Inc Modified human growth hormone
BRPI0519568C8 (pt) 2004-12-22 2022-06-14 Ambrx Inc Aminoacil-trna sintetase (rs), composições que compreendem a dita aminoacil-trna sintetase, célula de levedura, célula fúngica, célula não eucariótica, vetor que codifica uma rs, polinucleotídeo e ainda método para produzir um polipeptídeo em uma célula com um aminoácido selecionado em uma posição especificada
CA2609205A1 (en) 2005-06-03 2006-12-14 Ambrx, Inc. Improved human interferon molecules and their uses
CN101287830B (zh) 2005-10-12 2015-01-07 斯克利普斯研究院 噬菌体展示多肽的选择性翻译后修饰
DK2339014T3 (en) 2005-11-16 2015-07-20 Ambrx Inc Methods and compositions comprising non-natural amino acids
JP2009521227A (ja) 2005-12-22 2009-06-04 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド ヌクレオチドアナログ組込み用ポリメラーゼ
WO2007103490A2 (en) * 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US7790847B2 (en) 2006-03-16 2010-09-07 The Scripps Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
RU2473690C2 (ru) * 2006-05-23 2013-01-27 Зе Скрипс Ресеч Инститьют Генетически кодируемые флюоресцентные кумариновые аминокислоты
KR20090052360A (ko) 2006-09-08 2009-05-25 암브룩스, 인코포레이티드 척추동물 세포에서의 서프레서 tRNA 전사
WO2008030558A2 (en) 2006-09-08 2008-03-13 Ambrx, Inc. Modified human plasma polypeptide or fc scaffolds and their uses
US8114627B2 (en) * 2006-09-21 2012-02-14 The Scripps Research Institute Genetically programmed expression of selectively sulfated proteins in eubacteria
CA2665678A1 (en) 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
DK2068909T3 (da) 2007-03-30 2012-08-06 Ambrx Inc Modificerede FGF-21-polypeptider og anvendelse heraf
KR20100019467A (ko) 2007-05-02 2010-02-18 암브룩스, 인코포레이티드 변형된 인터페론 베타 폴리펩티드 및 그의 용도
MX2010004464A (es) 2007-10-25 2010-06-07 Scripps Research Inst Incorporacion genetica de 3-aminotirosina a reductasas.
JP5513398B2 (ja) 2007-11-02 2014-06-04 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸を含有する蛋白質を使用する指向的進化
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst BORONIC AMINO ACID GENETICALLY CODED
MX2010005317A (es) 2007-11-20 2010-06-02 Ambrx Inc Polipeptidos de insulina modificados y sus usos.
CN101939410A (zh) * 2007-12-11 2011-01-05 斯克利普斯研究院 甲基营养酵母菌巴斯德毕赤酵母中的体内非天然氨基酸表达
SG188143A1 (en) 2008-02-08 2013-03-28 Ambrx Inc Modified leptin polypeptides and their uses
KR20100125290A (ko) * 2008-02-08 2010-11-30 더 스크립스 리서치 인스티튜트 유전적으로 코딩된 비천연 아미노산에 의한 면역 내성의 파괴
WO2009151491A2 (en) * 2008-02-27 2009-12-17 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
CA2720046C (en) 2008-03-31 2018-07-24 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
ES2654387T3 (es) 2008-07-23 2018-02-13 Ambrx, Inc. Polipéptidos G-CSF bovinos modificados y sus usos
UA106731C2 (uk) 2008-09-26 2014-10-10 Амбркс, Інк. Модифіковані поліпептиди еритропоетину тварин та їх застосування
NZ592249A (en) 2008-09-26 2013-03-28 Ambrx Inc Non-natural amino acid replication-dependent microorganisms and vaccines
US8637306B2 (en) * 2008-12-10 2014-01-28 The Scripps Research Institute Production of carrier-peptide conjugates using chemically reactive unnatural amino acids
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris
AU2010341516B2 (en) 2009-12-21 2014-01-16 Ambrx, Inc. Modified bovine somatotropin polypeptides and their uses
JP2013515081A (ja) 2009-12-21 2013-05-02 アンブルックス,インコーポレイテッド 修飾されているブタのソマトトロピンポリペプチドおよびそれらの使用
JP6066900B2 (ja) 2010-04-26 2017-01-25 エータイアー ファーマ, インコーポレイテッド システイニルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
EP2563381B1 (en) 2010-04-27 2017-08-09 aTyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of isoleucyl trna synthetases
AU2011248521B2 (en) 2010-04-27 2017-03-16 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of threonyl tRNA synthetases
US8993723B2 (en) 2010-04-28 2015-03-31 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of alanyl-tRNA synthetases
US9034320B2 (en) 2010-04-29 2015-05-19 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of Valyl-tRNA synthetases
CA2797374C (en) 2010-04-29 2021-02-16 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of asparaginyl trna synthetases
CN103096925A (zh) 2010-05-03 2013-05-08 Atyr医药公司 与精氨酰-tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
CA2797977C (en) 2010-05-03 2019-08-20 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of phenylalanyl-alpha-trna synthetases
WO2011139988A2 (en) 2010-05-03 2011-11-10 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of seryl-trna synthetases
CA2797978C (en) 2010-05-03 2019-12-03 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of methionyl-trna synthetases
US9062301B2 (en) 2010-05-04 2015-06-23 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glutamyl-prolyl-tRNA synthetases
WO2011140267A2 (en) 2010-05-04 2011-11-10 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of p38 multi-trna synthetase complex
JP6396656B2 (ja) 2010-05-14 2018-09-26 エータイアー ファーマ, インコーポレイテッド フェニルアラニルβtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
JP6027965B2 (ja) 2010-05-17 2016-11-16 エータイアー ファーマ, インコーポレイテッド ロイシルtRNA合成酵素のタンパク質フラグメントに関連した治療用、診断用および抗体組成物の革新的発見
CN103096913B (zh) 2010-05-27 2017-07-18 Atyr 医药公司 与谷氨酰胺酰‑tRNA合成酶的蛋白片段相关的治疗、诊断和抗体组合物的创新发现
US8962560B2 (en) 2010-06-01 2015-02-24 Atyr Pharma Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of Lysyl-tRNA synthetases
US8999321B2 (en) 2010-07-12 2015-04-07 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-tRNA synthetases
US8969301B2 (en) 2010-07-12 2015-03-03 Atyr Pharma Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of aspartyl-tRNA synthetases
WO2012021247A2 (en) 2010-07-12 2012-02-16 Atyr Pharma, Inc. Innovative discovery of therapeutic, diagnostic, and antibody compositions related to protein fragments of glycyl-trna synthetases
EA030418B1 (ru) 2010-07-12 2018-08-31 ЭйТИР ФАРМА, ИНК. ТЕРАПЕВТИЧЕСКАЯ КОМПОЗИЦИЯ И СПОСОБ ДЛЯ ЛЕЧЕНИЯ ВОСПАЛИТЕЛЬНОГО ЗАБОЛЕВАНИЯ, ПОЛИПЕПТИД АМИНОАЦИЛ-тРНК-СИНТЕТАЗЫ (AARS)
US9567386B2 (en) 2010-08-17 2017-02-14 Ambrx, Inc. Therapeutic uses of modified relaxin polypeptides
PE20140160A1 (es) 2010-08-17 2014-02-08 Ambrx Inc Polipeptidos de relaxina modificados y sus usos
EP2608801B1 (en) 2010-08-25 2019-08-21 aTyr Pharma, Inc. INNOVATIVE DISCOVERY OF THERAPEUTIC, DIAGNOSTIC, AND ANTIBODY COMPOSITIONS RELATED TO PROTEIN FRAGMENTS OF TYROSYL-tRNA SYNTHETASES
TWI480288B (zh) 2010-09-23 2015-04-11 Lilly Co Eli 牛顆粒細胞群落刺激因子及其變體之調配物
AU2011311956C1 (en) 2010-10-06 2017-06-15 Pangu Biopharma Limited Innovative discovery of therapeutic, diagnostic, and antibody compositions related protein fragments of tryptophanyl tRNA synthetases
US20130078671A1 (en) * 2011-03-25 2013-03-28 The Texas A&M University System Incorporation of two different noncanonical amino acids into a single protein
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9714419B2 (en) 2011-08-09 2017-07-25 Atyr Pharma, Inc. PEGylated tyrosyl-tRNA synthetase polypeptides
WO2013086228A1 (en) 2011-12-06 2013-06-13 Atyr Pharma, Inc. Pegylated aspartyl-trna synthetase polypeptides
WO2013086216A1 (en) 2011-12-06 2013-06-13 Atyr Pharma, Inc. Improved aspartyl-trna synthetases
CN102517241B (zh) * 2011-12-19 2013-06-19 中国药科大学 一种含有d型氨基酸的双羰基还原酶的突变体的制备方法
CA2858613A1 (en) 2011-12-29 2013-08-08 Atyr Pharma, Inc. Aspartyl-trna synthetase-fc conjugates
EP2852664B1 (en) 2012-05-18 2017-09-06 Medical Research Council Methods of incorporating an amino acid comprising a bcn group into a polypeptide using an orthogonal codon encoding it and an orthorgonal pylrs synthase.
UY35368A (es) 2013-03-08 2014-10-31 Irm Llc Péptidos y composiciones para el tratamiento de daño articular
ES2708565T3 (es) 2013-03-15 2019-04-10 Atyr Pharma Inc Conjugados de Fc-histidil-ARNt sintetasa
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
EP3021942A4 (en) 2013-07-19 2017-04-19 The Regents of The University of California Milk fat globule epidermal growth factor 8 regulates fatty acid uptake
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
EP4079847A1 (en) 2014-07-30 2022-10-26 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EA036697B1 (ru) 2014-10-24 2020-12-09 Бристол-Майерс Сквибб Компани Модифицированные полипептиды fgf-21 и их применение
EP3456346B1 (en) 2015-07-30 2021-07-07 MacroGenics, Inc. Pd-1 and lag-3 binding molecules and methods of use thereof
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
JP6955507B2 (ja) 2015-12-14 2021-10-27 マクロジェニクス,インコーポレーテッド Pd‐1及びctla‐4との免疫応答性を有する二重特異性並びにその使用方法
GB2568182A (en) 2016-08-03 2019-05-08 Harvard College Adenosine nucleobase editors and uses thereof
JP7201153B2 (ja) 2016-08-09 2023-01-10 プレジデント アンド フェローズ オブ ハーバード カレッジ プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR102622411B1 (ko) 2016-10-14 2024-01-10 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
IL266361B2 (en) 2016-11-14 2024-02-01 Novartis Ag Methods and preparations for the treatment of cartilage damage and arthritis
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3580232B1 (en) 2017-02-08 2023-09-20 Bristol-Myers Squibb Company Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
CN110536694A (zh) 2017-04-20 2019-12-03 Atyr 医药公司 用于治疗肺部炎症的组合物和方法
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
EP3676376A2 (en) 2017-08-30 2020-07-08 President and Fellows of Harvard College High efficiency base editors comprising gam
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
JP2021518114A (ja) 2018-03-15 2021-08-02 ウニベルジテート ハンブルグUniversitaet Hamburg 拡張アンチコドンループを有する合成転移rna
LU100734B1 (en) 2018-03-15 2019-10-01 Univ Hamburg Synthetic transfer RNA with extended anticodon loop
EP3775693A4 (en) 2018-03-27 2021-12-22 SCP Holdings, an Assumed Business Name of Nitride Igniters, LLC. HOT SURFACE IGNITION DEVICES FOR COOKING PLATES
CA3098910A1 (en) 2018-05-01 2019-11-07 Ambrx, Inc. A method for optimizing antibody expression
US12049485B2 (en) 2018-09-11 2024-07-30 Ambrx, Inc. Interleukin-2 polypeptide conjugates and their uses
CN113366015A (zh) 2018-10-19 2021-09-07 Ambrx公司 白细胞介素-10多肽缀合物、其二聚体及其用途
CN111718920B (zh) * 2019-03-19 2021-05-07 宁波鲲鹏生物科技有限公司 在蛋白中高效引入赖氨酸衍生物的氨酰基-tRNA合成酶
JP2022531539A (ja) 2019-03-19 2022-07-07 ザ ブロード インスティテュート,インコーポレーテッド 編集ヌクレオチド配列を編集するための方法および組成物
LU101182B1 (en) * 2019-04-11 2020-10-12 Univ Hamburg Synthetic transfer RNA with extended anticodon loop
AU2020273255A1 (en) 2019-04-11 2021-10-28 Arcturus Therapeutics, Inc. Synthetic transfer RNA with extended anticodon loop
CN110172467B (zh) * 2019-05-24 2021-03-16 浙江大学 一种利用嵌合设计方法构建正交的氨酰-tRNA合成酶/tRNA体系
IL296099A (en) 2020-03-11 2022-11-01 Ambrx Inc Interleukin-2 polypeptide conjugates and methods of using them
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
CN114250243B (zh) * 2020-09-24 2024-05-03 深圳华大生命科学研究院 一种检测极端嗜盐生物中氨酰-tRNA合成酶和tRNA活性的系统及方法
CA3224147A1 (en) 2021-07-09 2023-01-12 Vijaya Raghavan PATTABIRAMAN Antibody conjugates and manufacture thereof
JP2024524534A (ja) 2021-07-09 2024-07-05 ブライト ピーク セラピューティクス エージー 炎症性疾患及び自己免疫疾患の治療のための修飾il-2ポリペプチド
EP4366782A1 (en) 2021-07-09 2024-05-15 Bright Peak Therapeutics AG Conjugates of checkpoint inhibitors with il-2, and uses thereof
WO2023281482A1 (en) 2021-07-09 2023-01-12 Bright Peak Therapeutics Ag Cd20-targeted il-2 and its uses
US20240158537A1 (en) 2021-07-09 2024-05-16 Bright Peak Therapeutics Ag Synthetic il-7 and il-7 immunocytokines
WO2023069816A2 (en) 2021-09-20 2023-04-27 The Broad Institute, Inc. Compositions and methods for multiplex decoding of quadruplet codons
US20240132563A1 (en) 2022-02-23 2024-04-25 Bright Peak Therapeutics Ag Bifunctional cytokine compositions
WO2023161854A1 (en) 2022-02-23 2023-08-31 Bright Peak Therapeutics Ag Immune antigen specific il-18 immunocytokines and uses thereof
CN114908066B (zh) * 2022-05-17 2024-01-23 杭州嵌化合生医药科技有限公司 一种正交翻译系统及其在再分配密码子恢复ptc疾病中功能蛋白表达方面的应用
WO2024091824A1 (en) 2022-10-26 2024-05-02 Ada Forsyth Institute, Inc. Differentiation and reprogramming of chondrocyte
WO2024150175A1 (en) 2023-01-11 2024-07-18 Bright Peak Therapeutics Ag Conditionally activated proteins and methods of use
CN115975978B (zh) * 2023-02-01 2023-08-01 珠海宝锐生物科技有限公司 Bst DNA聚合酶大片段突变体及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002085923A2 (en) * 2001-04-19 2002-10-31 The Scripps Research Institute In vivo incorporation of unnatural amino acids

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU746956B2 (en) * 1997-05-06 2002-05-09 Zymogenetics Inc. Novel tumor antigens
US20030008820A1 (en) * 2001-03-27 2003-01-09 Massachusetts Institute Of Technology Methods and products related to FGF dimerization
IL161361A0 (en) * 2001-10-17 2004-09-27 Zymogenetics Inc Secreted protein, ztnf9
CA2500653A1 (en) * 2002-10-16 2004-04-29 The Scripps Research Institute Glycoprotein synthesis
AU2003277373B2 (en) * 2002-10-16 2009-05-07 The Scripps Research Institute Site specific incorporation of keto amino acids into proteins
AU2003300389B2 (en) * 2002-12-22 2009-10-08 The Scripps Research Institute Protein arrays
ATE542894T1 (de) * 2003-04-17 2012-02-15 Scripps Research Inst Ausweitung des eukaryotischen genetischen codes
BRPI0411475A (pt) * 2003-06-18 2006-07-25 Scripps Research Inst adições de código genético de aminoácido reativo não natural
US20060160175A1 (en) * 2003-07-07 2006-07-20 The Scripps Research Institute Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
JP5192150B2 (ja) * 2003-07-07 2013-05-08 ザ スクリプス リサーチ インスティチュート 直交リシルtRNAとアミノアシルtRNAシンテターゼの対の組成物及びその使用
WO2005007624A2 (en) * 2003-07-07 2005-01-27 The Scripps Research Institute Compositions of orthogonal glutamyl-trna and aminoacyl trna synthetase pairs and uses thereof
WO2005038002A2 (en) * 2003-10-14 2005-04-28 The Scripps Research Institute Site-specific incorporation of redox active amino acids into proteins
CA2549830A1 (en) * 2003-12-18 2006-01-05 The Scripps Research Institute Selective incorporation of 5-hyroxytryptophan into proteins in mammalian cells
WO2005116237A2 (en) * 2004-05-25 2005-12-08 The Scripps Research Institute Site specific incorporation of heavy atom-containing unnatural amino acids into proteins for crystal structure determination
US20060134746A1 (en) * 2004-09-21 2006-06-22 The Scripps Research Institute Adding photoregulated amino acids to the genetic code
US7718410B2 (en) * 2004-09-21 2010-05-18 The Scripps Research Institute In vivo incorporation of alkynyl amino acids into proteins in eubacteria
JP2008513806A (ja) * 2004-09-22 2008-05-01 ザ スクリップス リサーチ インスティテュート Nmr試験のための蛋白質の部位特異的標識
US20080064059A1 (en) * 2004-10-20 2008-03-13 Scripps Research Institute In Vivo Site-Specific Incorporation of N-Acetyl-Galactosamine Amino Acids in Eubacteria
AU2005330514B2 (en) * 2004-10-27 2011-05-12 The Scripps Research Institute Orthogonal translation components for the in vivo incorporation of unnatural amino acids
FR2888097B1 (fr) * 2005-07-06 2007-10-05 Oreal Dispositif de conditionnement et d'application comportant un organe d'essorage
CN101287830B (zh) * 2005-10-12 2015-01-07 斯克利普斯研究院 噬菌体展示多肽的选择性翻译后修饰
WO2007103490A2 (en) * 2006-03-09 2007-09-13 The Scripps Research Institute System for the expression of orthogonal translation components in eubacterial host cells
US7790847B2 (en) * 2006-03-16 2010-09-07 The Scripps Research Institute Genetically programmed expression of proteins containing the unnatural amino acid phenylselenocysteine
RU2473690C2 (ru) * 2006-05-23 2013-01-27 Зе Скрипс Ресеч Инститьют Генетически кодируемые флюоресцентные кумариновые аминокислоты
US8114627B2 (en) * 2006-09-21 2012-02-14 The Scripps Research Institute Genetically programmed expression of selectively sulfated proteins in eubacteria
CA2665678A1 (en) * 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
TWI334126B (en) * 2007-07-17 2010-12-01 Au Optronics Corp Voltage adjusting circuit, method, and display apparatus having the same
MX2010004464A (es) * 2007-10-25 2010-06-07 Scripps Research Inst Incorporacion genetica de 3-aminotirosina a reductasas.
EP2220218A4 (en) * 2007-11-02 2010-12-08 Scripps Research Inst BORONIC AMINO ACID GENETICALLY CODED
JP5513398B2 (ja) * 2007-11-02 2014-06-04 ザ スクリプス リサーチ インスティチュート 非天然アミノ酸を含有する蛋白質を使用する指向的進化
WO2009064416A2 (en) 2007-11-15 2009-05-22 The Scripps Research Institute Genetic incorporation of an alpha-hydroxy acid into proteins to generate ester backbone linkages at defined sites
KR20100125290A (ko) * 2008-02-08 2010-11-30 더 스크립스 리서치 인스티튜트 유전적으로 코딩된 비천연 아미노산에 의한 면역 내성의 파괴
WO2009151491A2 (en) 2008-02-27 2009-12-17 The Scripps Research Institute In vivo incorporation of an unnatural amino acid comprising a 1,2-aminothiol group
US20090197339A1 (en) * 2008-12-10 2009-08-06 The Scripps Research Institute In vivo unnatural amino acid expression in the methylotrophic yeast pichia pastoris

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002085923A2 (en) * 2001-04-19 2002-10-31 The Scripps Research Institute In vivo incorporation of unnatural amino acids

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Alexandre Ambrogelly et al.Functional Annotation of Class Ⅰ Lysyl-tRNASynthetasePhylogeny Indicates a Limited Role for GeneTransfer.JOURNAL OF BACTERIOLOGY第184卷 第16期.2002,第184卷(第16期),图5.
Alexandre Ambrogelly et al.Functional Annotation of Class Ⅰ Lysyl-tRNASynthetasePhylogeny Indicates a Limited Role for GeneTransfer.JOURNAL OF BACTERIOLOGY第184卷 第16期.2002,第184卷(第16期),图5. *
Takaho Terada et al.Functional convergence of two lysyl-tRNA synthetaseswithunrelated topologies.NATURE STRUCTURAL BIOLOGY第9卷 第4期.2002,第9卷(第4期),第261页和图1.
Takaho Terada et al.Functional convergence of two lysyl-tRNA synthetaseswithunrelated topologies.NATURE STRUCTURAL BIOLOGY第9卷 第4期.2002,第9卷(第4期),第261页和图1. *

Also Published As

Publication number Publication date
AU2004267359A1 (en) 2005-03-03
DE602004011789T2 (de) 2009-02-12
ES2301099T3 (es) 2008-06-16
PT1666604E (pt) 2008-05-19
EP1649004A4 (en) 2008-04-09
US20060177900A1 (en) 2006-08-10
US20100291559A1 (en) 2010-11-18
EP1666604A1 (en) 2006-06-07
BRPI0412272A (pt) 2006-09-05
AU2004267359B2 (en) 2010-09-09
US7575895B2 (en) 2009-08-18
ATE471385T1 (de) 2010-07-15
EP1666604B1 (en) 2008-02-13
EP1649004A2 (en) 2006-04-26
JP2011101656A (ja) 2011-05-26
DE602004027770D1 (de) 2010-07-29
ATE386133T1 (de) 2008-03-15
US20120129215A1 (en) 2012-05-24
JP2007529998A (ja) 2007-11-01
SI1666604T1 (sl) 2008-08-31
PT1914314E (pt) 2010-09-08
US20070042461A1 (en) 2007-02-22
JP5192150B2 (ja) 2013-05-08
US7638297B2 (en) 2009-12-29
CN101076598A (zh) 2007-11-21
US8669073B2 (en) 2014-03-11
MXPA06000242A (es) 2006-04-07
CA2531146A1 (en) 2005-03-03
US8030028B2 (en) 2011-10-04
WO2005019415A2 (en) 2005-03-03
DE602004011789D1 (de) 2008-03-27
WO2005019415A3 (en) 2007-01-25

Similar Documents

Publication Publication Date Title
CN101076598B (zh) 正交赖氨酰-tRNA和氨酰-tRNA合成酶对的组合物及其应用
US7527943B2 (en) Compositions of orthogonal glutamyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof
US20060160175A1 (en) Compositions of orthogonal leucyl-trna and aminoacyl-trna synthetase pairs and uses thereof
CN101400796B (zh) 在真细菌宿主细胞内表达正交翻译组分的系统
JP4444113B2 (ja) ケトアミノ酸の部位特異的蛋白質組込み方法
JP5657850B2 (ja) 酸化還元機能性アミノ酸のタンパク質への部位特異的組み入れ
CN101151366B (zh) 将炔基氨基酸体内掺入真细菌的蛋白
EP1914314B1 (en) Compositions of orthogonal lysyl-tRNA and aminoacyl-tRNA synthetase pairs and uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120725

Termination date: 20160707