CN101595215A

CN101595215A - 具有增强的动力学和功能性表达的突变水解酶蛋白

Info

Publication number: CN101595215A
Application number: CNA2007800489622A
Authority: CN
Inventors: 阿尔迪斯·达尔津斯; 兰斯·P·昂塞尔; 雷切尔·弗西德曼·瓦纳; 保罗·奥托; 格季米纳斯·维杜基里斯; 基思·V·伍德; 莫妮卡·G·伍德; 克里斯·齐默曼; 迈克尔·R·斯兰特尔; 凯特·钦·赵
Original assignee: Promega Corp
Current assignee: Promega Corp
Priority date: 2006-10-30
Filing date: 2007-10-30
Publication date: 2009-12-02

Abstract

本发明提供具有增强的动力学和功能性表达的突变水解酶蛋白，以及编码该突变蛋白的多核苷酸，和使用所述多核苷酸和不同蛋白质的方法。

Description

具有增强的动力学和功能性表达的突变水解酶蛋白

对相关申请的交叉参考

本申请要求于2006年10月30日提交的美国申请系列号60/855,237、和于2007年5月15日提交的美国申请系列号60/930,201的申请日的利益，将其公开内容引入本文作为参考。

背景

分子的特异性检测是理解该分子在细胞中作用的重点。标记，例如与目的分子共价连接的那些，允许在复杂混合物中容易地检测该分子。标记可以是由体外化学合成添加的或例如通过重组技术体内附着的标记。例如，荧光或其他标记附着在蛋白质上传统上通过在蛋白质纯化后进行体外化学修饰完成(Hermanson，1996)。对于标记的体内附着，来自水母Aequoreavictoria的绿色荧光蛋白(GFP)与许多宿主蛋白遗传性融合，从而产生原位荧光嵌合体(Tsien，1998；Chalfie等，1998)。然而，虽然基于GFP的指示剂目前用在多种测定法中，例如测量pH(Kneen等，1998；Llopis等，1998；

等，1998)、Ca²⁺(Miyawaki等，1997；Rosomer等，1997)、和膜电位(Siegel等，1997)中，但是标记蛋白诸如GFP固有的荧光性受到蛋白质结构性质，例如，有限的荧光颜色范围和相对低的固有亮度的限制(Cubitt等，1995；等，1996)。

为了解决原位GFP标记的不足，Griffen等(1998)合成了分子成分的紧密-结合对：由少至6个天然氨基酸组成的小受体结构域和可以与多种光谱探针或交联剂连接的小(＜700道尔顿)合成配体。所述受体结构域包括位于α螺旋的i，i+1，i+4，和i+5位置处的四个半胱氨酸，且所述配体是4′，5′-二(1，3，2-dithioarsolan-2-基)荧光素(FLASH)。Griffen等公开所述配体在非转染哺乳动物细胞中具有相对少的结合位点，是膜-渗透和非荧光性的，直至其以纳摩尔或更低解离常数的高度亲和性和特异性结合于重组蛋白质中的四半胱氨酸结构域，从而导致细胞被荧光标记(“FLASH”标记)。然而，关于细胞中的背景结合，Stroffekova等(2001)公开了FLASH-EDT₂非-特异性结合于内源性富含半胱氨酸的蛋白。此外，由FLASH标记蛋白质受到可以使用的荧光团范围的限制。

受体-介导的靶向方法使用遗传编码的靶向序列将荧光团定位于几乎任何细胞位点，条件是靶蛋白能够正确地折叠。例如，Farinas等(1999)公开cDNA转染用于将单-链抗体(sFv)靶定于细胞中的特定位点。Farinas等公开半抗原(4-乙氧基亚甲基-2-苯基-2-噁唑啉-5-酮，phOx)和荧光探针(例如，BODIPY Fl、四甲基罗丹明、和荧光素)的缀合物以高度亲和性(约5nM)结合于活的中国仓鼠卵巢细胞中的sFv亚细胞位点，说明靶抗体起关于细胞-渗透性半抗原-荧光团缀合物高亲和性受体的功能。然而，在还原环境中，功能性sFv表达可能相对较差。

因此，需要的是标记理想分子的改良方法。

发明概述

虽然某些蛋白有效用于多种体内应用，但是由于它们在大肠杆菌(E.coli)和无细胞表达系统中功能性表达的水平，它们对于体外应用(例如破坏(pull downs))可能不是最佳的。本发明提供突变的水解酶序列，其在多种系统中表现出如通过改良荧光性极化(FP)信号确定的提高的功能性表达和如通过活性蛋白(底物标记)和总蛋白测量的增强的蛋白生成。还描述了导致具有提高的固有结合动力学的突变水解酶蛋白的序列。

本发明提供用于将一种或多种官能团例如通过共价或另外的稳定键束缚(连接)于本发明的蛋白质或包括本发明蛋白质的融合蛋白(嵌合体)的方法、组合物和试剂盒。本发明的蛋白质(突变水解酶)在结构上与野生型(天然)水解酶有关，但是包括至少一个氨基酸取代，例如，导致提高的功能性表达或提高的结合动力学的一个氨基酸取代，且在一些实施方案中包括至少两个氨基酸取代，例如，导致与水解酶底物形成稳定键的一个氨基酸取代和至少一个导致提供的功能性表达、提高的结合动力学或二者的其他氨基酸取代，均与相应的野生型水解酶有关。上述束缚通过使用关于水解酶的底物发生，例如发生在溶液或混悬液中，在细胞中，在固体支持物上或在溶液/表面界面处，所述水解酶包括反应基且被修饰为包括一种或多种官能团。

在一个实施方案中，突变水解酶与相应的野生型水解酶具有至少约80％或更高，例如，至少约85％，90％，95％或98％但低于100％的氨基酸序列同一性，即所述突变水解酶包括许多取代。在一个实施方案中，突变水解酶与SEQ ID NO：1具有至少约80％或更高，例如，至少约85％，90％，95％或98％但低于100％的氨基酸序列同一性。那些取代包括提供稳定键形成和提高的功能性表达和/或结合动力学的那些，以及在耐受取代的区域，即不改变本发明突变水解酶功能的区域中的那些。因此，在一个实施方案中，本发明的突变水解酶相对于相应的野生型水解酶包括至少两个氨基酸取代，其中一个氨基酸取代导致突变水解酶与底物形成比在相应野生型水解酶和所述底物之间形成的键更稳定的键。所述一个取代处在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在相应野生型水解酶和底物之间形成的键，或者处在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处，或者在这两个残基处均具有取代。例如，相对于仅具有导致与底物形成稳定键的取代的突变水解酶，另一个取代处在改进突变水解酶功能性表达、结合动力学，或二者的残基处。

在一个实施方案中，突变水解酶具有导致突变水解酶与底物形成比在相应野生型水解酶和该底物之间形成的键更稳定的键的一个氨基酸取代，其中所述取代处在相应野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在相应野生型水解酶和底物之间形成的键，或者处在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。在一个实施方案中，处在与活化水分子有关的氨基酸残基处的取代是处在与SEQID NO：1中位置272相对应的位置处的取代，所述活化水分子裂解在相应野生型水解酶和底物之间形成的键。在一个实施方案中，处在与底物形成酯中间体的氨基酸残基处的取代是处在与SEQ ID NO：1中位置106相对应的位置处的取代。在一个实施方案中，突变水解酶具有处在对应于SEQ IDNO：1中位置272的位置处和处在对应于SEQ ID NO：1中位置106的位置处的取代。相对于具有这样的取代的相应的突变水解酶，所述取代相对于相应的野生型水解酶提供稳定的键形成，在突变水解酶中提供提高的表达或结合动力学的取代包括在下列位置中一处或多处的取代：与SEQ IDNO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，175，176，187，195，204，221，224，227，231，250，256，257，263，264，273，277，282，291或292相对应的位置。突变水解酶因此可以具有多个取代，包括处在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处的多个取代，至少其中之一赋予提高的表达或结合动力学，并且可以包括在耐受取代的位置中的其他取代。在一个实施方案中，突变水解酶可以因此具有多个取代，包括处在与位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应的位置处的多个取代。在一个实施方案中，突变水解酶是具有多个取代，例如至少5、10、15但少于60，例如，50个或更少个取代的突变脱卤素酶，其包括处在与SEQ ID NO：1中位置106和/或272相对应的位置处的取代，所述取代导致突变脱卤素酶与脱卤素酶底物形成比在相应的野生型脱卤素酶和该底物之间形成的键更稳定的键，并且包括多个取代，例如，至少5、10、15但少于60个取代，其可以包括与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，175，176，187，195，204，221，224，227，231，250，256，257，263，264，273，277，282，291或292相对应的多个取代，至少其中之一赋予提高的表达或结合动力学，例如，位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292的一处或多处，以及耐受取代的其他位置。

在一个实施方案中，突变水解酶相对于相应野生型水解酶具有至少三个氨基酸取代。两个氨基酸取代导致突变水解酶与底物形成比在相应的野生型水解酶和该底物之间形成的键更稳定的键，其中一个取代处在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在相应野生型水解酶和底物之间形成的键，且另一个取代处在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。至少一个其他取代处在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，175，176，187，195，204，221，224，227，231，250，256，257，263，264，273，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶具有多个取代，例如，至少5，10，15但少于60个，例如，少于25个或少于50个取代的突变脱卤素酶，其包括处在与SEQ ID NO：1中位置106和/或272相对应位置处的取代，所述取代导致突变脱卤素酶与脱卤素酶底物形成比在相应的野生型脱卤素酶和该底物之间形成的键更稳定的键。在一个实施方案中，突变水解酶可以因此具有多个取代，包括与位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应位置处的多个取代。突变脱卤素酶也包括多个取代，例如，至少5，10，15但少于25个，例如，少于20个取代，其相应于SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，175，176，187，195，204，221，224，227，231，250，256，257，263，264，273，277，282，291或292，至少其中之一赋予提高的表达或结合动力学，例如，SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292中的一处或多处。

本发明的突变水解酶可以包括处在N-端处的一个或多个氨基酸取代，例如，由改变核苷酸序列以具有某些限制性位点产生的那些，或包括处在C-端的一个或多个氨基酸取代和一个或多个额外的残基(″尾部″)，例如，由改变核苷酸序列以具有某些限制性位点或选择以相对于相应野生型水解酶提高表达产生的那些。例如，尾部可以包括多至70或80个氨基酸残基，只要具有该尾部的突变水解酶的活性基本不变，例如，相对于不具有尾部的相应突变水解酶，活性降低不超过10％，25％或50％。

突变水解酶可以是融合蛋白，例如，由编码突变水解酶和至少一种目的蛋白质的重组DNA表达的融合蛋白或通过化学合成形成的融合蛋白。例如，融合蛋白可以包括突变水解酶和目的酶，例如，萤光素酶，RNA酶抑制剂或RNA酶，和/或通道蛋白，例如，离子通道蛋白，受体，膜蛋白，胞质蛋白，核内蛋白，结构蛋白，磷蛋白，激酶，信号传导蛋白，代谢蛋白，线粒体蛋白，受体相关蛋白，荧光蛋白，酶底物，转录因子，可选择的标记蛋白，核酸结合蛋白，胞外基质蛋白，分泌蛋白，受体配体，血清蛋白，具有反应性半胱氨酸的蛋白，转运蛋白和/或靶向序列，例如，肉豆蔻酰化序列，线粒体定位序列，或细胞核定位序列，其将突变水解酶导向，例如，到特定位置。目的蛋白可以与突变水解酶的N-端或C-端融合。在一个实施方案中，融合蛋白包括位于突变水解酶N-端的目的蛋白，和另一种蛋白，例如，位于C-端的不同蛋白。例如，目的蛋白可以是荧光蛋白或抗体。

任选地，在融合体中的蛋白质通过连接体序列，例如，优选地具有至少2氨基酸残基的连接体，诸如具有13和多至40或50个氨基酸残基的连接体分开。相对于每种单独蛋白质的功能，在本发明的融合蛋白中存在连接体序列基本不改变该融合体中各种蛋白质的功能，这可能归因于连接体序列为通过该融合体中的每种蛋白提供灵活性(自主性)。例如，对于具有至少一个导致与底物和Renilla萤光素酶形成稳定键的取代的突变脱卤素酶融合体，连接体序列的存在基本不改变突变脱卤素酶和其底物之间形成键的稳定性或萤光素酶的活性。而且，在一个实施方案中，连接体序列基本不降低，并可以增高，融合体中各种或两种蛋白质的功能性表达或结合动力学。对于在融合体中的任何特殊蛋白质组合，可以使用广泛种类的连接体序列。在一个实施方案中，连接体序列是酶识别的序列或是可光致断裂的。在一个实施方案中，连接体序列包括蛋白酶识别位点。

还提供分离的核酸分子(多核苷酸)，其包括编码水解酶，例如，本发明的突变水解酶的核酸序列。还提供包括编码融合蛋白的核酸序列的分离核酸分子，所述融合蛋白包括本发明的突变水解酶和位于所述突变水解酶N-端和/或C-端的一个或多个氨基酸残基。在一个实施方案中，编码的融合蛋白包括至少2个不同的融合配偶体，其中一个可以是用于纯化的序列，意欲改变融合蛋白其余部分的性质的序列，例如，蛋白质去稳定序列、或具有可区分的性质的序列。在一个实施方案中，所述分离的核酸分子包括最适合于在至少一种选择的宿主中表达的核酸序列。最适序列包括作为最优化的密码子的序列，最优化的密码子，即，相对于另一种生物体，例如关系远的生物体，在一种生物质中更频繁使用的密码子，以及包括修饰，用以添加或修饰Kozak序列和/或内含子，和/或用于去除不需要的序列，例如，潜在的转录因子结合位点。在一个实施方案中，所述多核苷酸包括编码脱卤素酶的核酸序列，所述核酸序列最适合于在选择的宿主细胞中表达。在一个实施方案中，最适合的多核苷酸不再与相应的非适合的序列杂交，例如，在中等或高度严格条件下不与非适合的序列杂交。在另一个实施方案中，所述多核苷酸与相应的非适合序列具有少于90％，例如少于80％的核酸序列同一性，并任选地，编码与由非适合序列编码的多肽具有至少80％，例如，至少85％、90％或更高的氨基酸序列同一性的多肽。核酸序列的最适化在本领域中已知，见，例如WO 02/16944。所述分离的核酸分子，例如，本发明的最适合多核苷酸可以引入到体外转录/翻译反应中或宿主细胞中，从而表达所述编码的蛋白质。

还提供包括所述分离的核酸分子，例如最适合的多核苷酸的构建体，例如表达盒，和载体，以及具有所述构建体的宿主细胞，和包括所述分离的核酸分子或一种或多种构建体或载体的试剂盒。宿主细胞包括原核细胞或真核细胞诸如植物或脊椎动物细胞，例如，哺乳动物细胞，包括但不仅限于人，非-人灵长类动物，狗，猫，牛，马，绵羊或啮齿动物(例如，兔，大鼠，貂或小鼠)细胞。优选地，所述表达盒包括启动子，例如，组成型或可调控的启动子，其与核酸分子操作性地相连接。在一个实施方案中，所述表达盒包含可诱导的启动子。在一个实施方案中，本发明包括载体，所述载体包括编码包括突变脱卤素酶的融合蛋白的核酸序列。

有效用于本发明的底物是这样的底物，即其被突变水解酶特异性结合，并优选地导致与突变水解酶的氨基酸，例如，反应性残基形成键，所述键比在该底物和野生型水解酶的相应氨基酸之间形成的键更稳定。尽管突变水解酶特异性结合可以由相应的野生型水解酶特异性结合的底物，但是在一个实施方案中，在通过相应的野生型水解酶和底物之间的反应导致产物形成的条件下，由突变水解酶和底物之间的相互作用不形成产物或形成充分少的产物，例如，少2-，10-，100-，或1000-倍。在一个实施方案中，在本发明的突变水解酶和底物之间形成的键具有这样的半衰期(即，t_1/2)，所述半衰期比相应野生型水解酶和底物之间在由该相应的野生型水解酶导致产物形成的条件下形成的键的t_1/2高至少2-倍，和更优选地，至少4-或甚至10-倍，和多至100-，1000-或10,000-倍。优选地，在突变水解酶和底物之间形成的键具有至少30分钟和优选至少4小时，和多至至少10小时的t_1/2，且对由洗涤、蛋白质变性剂、和/或高温引起的破坏具有抗性，例如，所述键对在SDS中煮沸是稳定的。在一个实施方案中，所述底物是脱卤素酶，例如，卤烷脱卤素酶或裂解脂肪族或芳香族卤化底物中的碳-卤键的脱卤素酶的底物，诸如红球菌属(Rhodococcus)、葡萄球菌属(Staphylococcus)、假单胞菌属(Pseudomonas)、伯克氏菌属(Burkholderia)、土壤杆菌属(Agrobacterium)或黄色杆菌属(Xanthobacter)脱卤素酶的底物，或丝氨酸β-内酰胺酶的底物。

在一个实施方案中，本发明的底物任选地包括将底物中一个或多个官能团与反应基物理分开的连接体。例如，对于一些突变水解酶，即，具有深催化口袋的那些，本发明的底物可以包括这样的连接体，其具有充足的长度和结构，从而使本发明底物的一个或多个官能团不干扰水解酶(野生型或突变型)的3-D结构。

本发明还包括组合物和试剂盒，其包括针对包含连接体的水解酶的底物，针对包含一个或多个官能团和任选地连接体的水解酶的底物，包含一个或多个官能团的连接体，针对缺乏一个或多个官能团和任选地包含连接体的水解酶的底物，连接体，或突变水解酶，或其任意组合。例如，本发明包括包含突变水解酶底物的固体支持物、包含本发明的突变水解酶或其融合体的固体支持物、包含编码本发明的突变水解酶或其融合体的载体的试剂盒。

本发明的底物和突变水解酶有效用于分离、检测、识别、成像、展示、或定位目的分子、标记细胞，包括活细胞成像，或在体外和/或在体内标记蛋白质。例如，与固体支持物结合的突变水解酶的底物、或与固体支持物结合的突变水解酶可以用于生成蛋白质阵列、细胞阵列、囊泡/细胞器阵列、基因阵列、和/或细胞膜阵列。在一个实施方案中，本发明提供用于分离目的分子的方法。所述方法包括提供包括一种或多种融合蛋白的样品，至少其中之一包括本发明的突变水解酶和任选地与目的分子预结合的蛋白质，并且提供具有一种或多种水解酶底物的固体支持物。然后使所述样品和固体支持物相接触，从而分离目的分子。

还提供表达本发明的突变水解酶的方法。所述方法包括向宿主细胞或体外转录/翻译反应引入编码本发明的突变水解酶的重组核酸分子，从而表达所述突变水解酶。在一个实施方案中，突变水解酶可以由所述细胞或反应分离。突变水解酶可以瞬时地或稳定地、组成型地或在组织-特异性或药物-调控的启动子下、和类似地表达。还提供分离的宿主细胞，其包括编码本发明的突变水解酶的重组核酸分子。

在一个实施方案中，本发明提供用于检测或确定突变水解酶的存在或量的方法。所述方法包括使本发明的突变水解酶与包括一个或多个官能团的水解酶底物相接触。检测或确定所述官能团的存在或量，由此检测或确定突变水解酶的存在或量。在一个实施方案中，突变水解酶位于细胞表面中或之上。在另一个实施方案中，突变水解酶处于细胞裂解产物中。在另一个实施方案中，突变水解酶是体外转录/翻译反应的产物。

还提供用于分离蛋白质或目的分子的方法。在一个实施方案中，所述方法包括提供包含一种或多种融合蛋白的样品，至少其中之一包括突变水解酶和目的蛋白，和提供包含一种或多种水解酶底物的固体支持物。突变水解酶相对于相应的野生型水解酶具有至少2个氨基酸取代，其中一个氨基酸取代导致突变水解酶与底物形成比在相应的野生型水解酶和该底物之间形成的键更稳定的键，且所述取代处在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在相应的野生型水解酶和底物之间形成的键，或处在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。在一个实施方案中，突变水解酶具有处在导致突变水解酶与底物形成比在相应的野生型水解酶和该底物之间形成的键更稳定的键的氨基酸处的取代，所述取代处在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解相应的野生型水解酶和底物之间形成的键，或处在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。突变水解酶还包括处在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的一处或多处位置处的取代。在一个实施方案中，突变水解酶可以因此具有多个取代，包括处在与位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应的位置处的多个取代。使所述样品和固体支持物相接触，从而分离目的蛋白。在一个实施方案中，样品中的目的蛋白在与固体支持物接触前与目的分子结合。在另一个实施方案中，在所述样品和固体支持物接触后，加入怀疑具有与目的蛋白结合的分子的混合物。

还提供使用本发明的突变水解酶和针对包括一个或多个官能团的相应水解酶的底物，例如，分离分子或检测或确定细胞中某些分子的存在或量，位置例如胞内、亚细胞或胞外位置，或运动的方法。例如，将编码与目的蛋白融合的突变脱卤素酶的载体引入细胞、细胞溶解产物、体外转录/翻译混合物、或上清液中，并向其中加入由官能团标记的水解酶底物。例如，使细胞与载体相接触，所述载体包括启动子，例如，可调节的启动子，和编码与同目的分子相互作用的蛋白质融合的突变水解酶的核酸序列。在一个实施方案中，在启动子诱导所述融合体的瞬时表达的条件下培养转染的细胞，，并然后检测与官能团有关的活性。

本发明因此提供用于监测细胞中蛋白质表达、位置和/或运动(运输)以及用于监测样品，例如，细胞中微环境变化的方法。在另一个实施方案中，使用2对突变水解酶/底物允许进行多重通道、同时检测，和基于FRET或BRET的测定法。

其他应用包括检测或标记细胞。因此，使用本发明的突变水解酶和本发明的相应底物允许进行细胞检测，例如，用于检测细胞体外迁移(例如，血管发生/趋化性测定，等等)，和或细胞成像后的免疫细胞化学法。

在一个实施方案中，本发明提供用于标记细胞的方法。所述方法包括使具有包括突变水解酶的细胞或其溶解产物的样品与包括一个或多个官能团的水解酶底物相接触。相对于相应野生型水解酶，突变水解酶具有至少2个氨基酸取代，其中一个氨基酸取代导致突变水解酶与底物形成比在相应的野生型水解酶和该底物之间形成的键更稳定的键，且所述取代处在相应野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解相应的野生型水解酶和底物之间形成的键，或处在相应野生型水解酶中与底物形成酯中间体的氨基酸残基处。在一个实施方案中，第二个取代处在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶具有多个取代，例如，除处在，例如，位置106或272处之外，处在与SEQ ID NO：1的位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应的位置的处取代。检测或确定样品中官能团的存在或量。

附图简述

图1A显示DhaA.H272F蛋白的分子模型。螺旋帽结构域显示为淡蓝色。α/β水解酶核心结构域(深蓝色)包含催化三联体残基。所述帽和核心结构域界面附近的带红色的残基代表H272F和D106亲核体。带黄色的残基表示位置E 130和卤化物-螯合残基W107。

图1B显示紫红红球菌(Rhodococcus rhodochrous)脱卤素酶(DhaA)蛋白(Kulakova等，1997)的序列(SEQ ID NO：1)。下划线标记催化三联体残基Asp(D)，Glu(E)和His(H)。以斜体显示构成帽结构域的残基。能够与卤烷底物形成共价键的DhaA.H272F和DhaA.D106C蛋白突变体分别包含将催化三联体His(H)和Asp(D)残基替换为Phe(F)和Cys(C)。

图1C举例说明由DhaA.H272F和卤烷底物引起的共价中间体形成机制。由Asp106亲核替代卤素基团，然后形成共价酯中间体。用Phe残基替换His272防止水活化和捕获(trap)共价中间体。

图1D描述由DhaA.D106C和卤烷底物引起的共价中间体形成的机制。由Cys106硫醇酯亲核替代卤素而产生对水解稳定的硫醚中间体。

图1E描述具有处于活性位点活性的共价附着的羧基四甲基罗丹明-C₁₀H₂₁NO₂-Cl配体的DhaA.H272F变体的结构模型。所述帽和核心结构域界面附近的带红色的残基代表H272F和D106亲核体。带黄色的残基表示位置E 130和卤化物-螯合残基W107。

图1F显示DhaA.H272F底物结合通道的结构模型。

图2A-B显示处在DhaA.H272F位置175，176和273处的取代的序列(图A)和处在DhaA.D106C位置175和176处的取代的序列(图B)。

图3提供本发明范围内突变脱卤素酶的示范性序列(SEQ ID Nos.12-16)。作为克隆的结果，在3’末端编码2个额外的残基(Gln-Tyr)。具有关于那两个额外残基的密码子的突变脱卤素酶编码核酸分子以类似于或高于不具有那些残基的突变脱卤素酶的水平表达。

图4显示HT2的核苷酸(SEQ ID NO：20)和氨基酸(SEQ ID NO：21)序列。引入列出的限制性位点，以促进功能性N-和C-端融合体的产生。C-端残基Ala-Gly可以被替换为Val。

图5提供额外的取代，所述取代改善具有那些取代的DhaA突变体在大肠杆菌中的功能性表达。

图6显示关于在大肠杆菌中作为N-端融合体表达的突变脱卤素酶″V7″(SEQ ID NO：19，其具有与SEQ ID NO：16，即″V6″相同的序列，区别是SEQ ID NO：17中的C-端残基不同于SEQ ID NO：16中的那些；见图8)的TMR配体标记和动力学。

图7提供关于兔网织红细胞转录/翻译反应中V7的表达数据。

图8提供HT和V7的C-端的对比(SEQ ID NO：2)。

图9显示麦芽转录/翻译反应中V7的功能性表达。

图10显示HeLa细胞的体内标记。

图11总结V7相对于HT2的性质。

图12显示来自破坏测定的结果。

图13总结利用纯化的蛋白质的TMR-配体和FAM-配体的二级速率常数数据。该数据是通过利用FP随时间追踪标记产生的。

图14显示选择的蛋白在不同温度下的残余活性。使蛋白暴露于指定温度30分钟并然后通过FP分析FAM-配体结合。将数据表述为残余活性，针对每种蛋白在不暴露于升高的温度下具有的活性量进行标准化。

图15举例说明不同DhaA突变体(320nM)在存在尿素(A)或盐酸胍(B)的条件下室温下过夜的稳定性.

图16举例说明具有TMR配体的不同DhaA突变体的标记动力学。

图17举例说明具有FAM配体的不同DhaA突变体的标记动力学。

图18提供两种DhaA突变体标记率的比较。

图19显示不同DhaA突变体的核苷酸和氨基酸序列，所述DhaA突变体包括在C-端具有尾部的(N融合体)或在N-端位置1或2处具有取代(C融合体)的那些(HT2，SEQ ID NO：18由SEQ ID NO：17编码；V2n，SEQ ID NO：22由SEQ ID NO：32编码；V3n，SEQ ID NO：23由SEQ ID NO：33编码；V4n，SEQ ID NO：24由SEQ ID NO：34编码；V5n，SEQ ID NO：25由SEQ IDNO：35编码；V6n，SEQ ID NO：26由SEQ ID NO：36编码；V7n，SEQ ID NO：27由SEQ ID NO：37编码；V2c，SEQ ID NO：42由SEQ ID NO：52编码；V3c，SEQ ID NO：43由SEQ ID NO：53编码；V4c，SEQ ID NO：44由SEQ ID NO：54编码；V5c，SEQ ID NO：45由SEQ ID NO：55编码；V6c，SEQ ID NO：46由SEQID NO：56编码；V7n，SEQ ID NO：47由SEQ ID NO：57编码)。SEQ ID NOs：48，49，28和29是代表性的连接体序列。SEQ ID NOs：60-65表示最小(无尾部)突变DhaA序列的残基1-293，且SEQ ID NOs：66-71表示具有C-端取代和尾部的突变DhaA序列。

图20显示p65-突变DhaA融合蛋白在转染后不同时间的检测(细胞-到-凝胶分析)。用p65-HT2(绿色)、p65-V3(粉色)、p65-V7(蓝色/白色)、p65-V7F(黄色)瞬时转染HeLa细胞不同的时期，用TMR配体标记(5μM，15分钟)，裂解并在荧光成像仪Typhoone-9400上进行分析。注意到V7t是具有V7序列的突变DhaA，所述V7具有63个氨基酸的尾部(eisggggsggggsggggenlyfqaielgtrgssrvdlqacklirlltkperklswllpplsnn；SEQ IDNO：72)。

图21显示p65-突变DhaA融合蛋白在转染后不同时间的检测(蛋白质印迹分析).用p65-HT2(绿色)、p65-V3(粉色)、p65-V7(蓝色/白色)、p65-V7F(黄色)瞬时转染HeLa细胞不同的时期，裂解并用p65AB(上图)和IkB AB(下图)探测。

图22举例说明盐中标记动力学的依赖性。在20mM HEPES pH 7.2+0-2M NaCl中测量和计算V7(16.5nM)对FAM配体(7.5nM)的标记速率。在盐浓度和标记速率之间存在正相关性。

图23显示pH对标记动力学的影响。缓冲液包括25mM乙酸钠(有效缓冲范围pH 3.6-5.6)，25mM MES(pH 5.5-6.7)，50mM Tris(pH 7.0-9.0)和50mM NaCl。酸性调节：乙酸，碱性调节：四甲基氢氧化铵。

图24显示DTT对标记动力学的影响。浓度＜1mM的DTT对标记动力学没有影响，而浓度＞1mM的DTT抑制标记动力学。

图25显示毛地黄皂苷对标记动力学的影响。

图26显示非离子型去污剂对标记动力学的影响。

图27显示阳离子去污剂对标记动力学的影响。

图28显示离子型去污剂对标记动力学的影响。

图29显示兼性离子去污剂对标记动力学的影响。

发明详述

用于本文中时，″底物″包括具有反应基和任选地一个或多个官能团的底物。包括一个或多个官能团的底物一般在本文中称为本发明的底物。底物，例如，本发明的底物，还可以任选地包括连接体，例如，可裂解的连接体，其在底物中物理上将一个或多个官能团与反应基分开，且在一个实施方案中，所述连接体优选为12-30个原子长。所述连接体可以不一定存在于本发明的底物中，然而，在一些实施方案中，可能需要将反应基和官能团的在物理上分开，以便使反应基可以与突变水解酶中的反应性残基互相作用，从而形成共价键。优选地，当存在时，相对于缺乏所述连接体的相应底物与野生型或突变水解酶的特异性或反应性，所述连接体基本不改变，例如，削弱，具有所述连接体的底物与野生型或突变水解酶的特异性或反应性。此外，所述连接体的存在优选地基本不改变，例如，削弱，官能团的一种或多种性质，例如，功能。例如，对于一些突变水解酶，即，具有深催化口袋的那些，本发明的底物可以包括这样的连接体，其具有充足的长度和结构，从而使本发明的底物的一个或多个官能团不干扰水解酶(野生型或突变型)的3-D结构。底物可以具有2个或更多不同的官能团。

当用于本文中时，″官能团″是可检测的或能够检测的分子，例如，可通过直接或间接方式测量的分子(例如，可光活化的分子，洋地黄毒苷，镍NTA(氨三乙酸)，生色团，荧光团或发光团)，可以结合或附着于第二分子(例如，生物素，半抗原，或交联基团)，或可以是固体支持物。官能团可以具有多于一种性质诸如能够检测和能够结合于另一种分子。

当用于本文中时，″反应基″是底物中由特殊野生型或本发明的突变水解酶特异性识别的最少原子数。底物中反应基和野生型水解酶的相互作用导致产物和野生型水解酶的再生。

当用于本文中时，术语″异源″核酸序列或蛋白质指相对于参考序列具有不同来源的序列，例如，源自外源物种，或，如果源自相同物种，则其可以是由原始形式充分修饰的。

术语″融合多肽″当用于本文中时指包含与不同蛋白如突变水解酶连接的目的蛋白(例如，萤光素酶、亲合标记物或靶向序列)的嵌合蛋白。

″亲核体″是提供电子的分子。

当用于本文中时，″标记基因″或″报道基因″是这样的基因，其授予表达该基因的细胞不同的表型并因此允许具有该基因的细胞与不具有该基因的细胞区分开。所述基因可以编码可选择的或可筛选的标记，其依赖于该标记是否赋予可通过化学方式，即通过使用选择性试剂(例如，除草剂，抗生素，等等)“选择”的特性，或是否仅是人们能够通过观察或测试，即通过“筛选”识别的″报道″特性。本公开内容的原理通过使用具体的标记基因详细示范。当然，合适的标记基因或报道基因的许多实例在本领域中已知，其可以用于实施本发明。因此，应该理解下列讨论是示范性的而非穷举的。根据本文中公开的技术和本领域中已知的一般重组技术，本发明使得任何基因的改变成为可能。示范性修饰的报道蛋白由包括修饰的报道基因的核酸分子编码，所述修饰的报道基因包括但不仅限于下列各项的修饰：neo基因、β-gal基因、gus基因、cat基因、gpt基因、hyg基因、hisD基因、ble基因、mprt基因、bar基因、腈水解酶基因、吡喃半乳糖苷基因、木糖苷酶基因、胸苷激酶基因、阿拉伯糖苷酶基因、突变乙酰乳酸合酶基因(ALS)或乙酰酸合酶基因(AAS)、甲氨蝶呤-抗性dhfr基因、茅草枯脱卤素酶基因、赋予针对5-甲基色氨酸抗性的突变邻氨基苯甲酸合酶基因(WO 97/26366)、R-基因座基因、β-内酰胺酶基因、xylE基因、α-淀粉酶基因、酪氨酸酶基因、萤光素酶(luc)基因(例如、海洋腔肠(Renillareniformis)萤光素酶基因、萤火虫荧光素酶基因，或叩头虫荧光素酶(Pyrophorus plagiophthalamus)基因、水母发光蛋白基因、红色荧光蛋白基因，或绿色荧光蛋白基因。属于该术语范围的可选择或可筛选标记基因还是编码″可分泌标记″的基因，所述“可分泌标记”的分泌可以检测，作为鉴定或选择转化的细胞的方法。实例包括编码可以由抗体相互作用鉴定的可分泌抗原，或甚至可以由它们的催化活性检测的可分泌酶的标记。可分泌蛋白分成许多类，包括，例如可由ELISA检测的小的、可扩散蛋白和插入或陷入细胞膜中的蛋白。

“可选择的标记蛋白”编码赋予细胞在缺乏另外是必需营养物(例如，酵母细胞中的TRPl基因)的培养基中或在具有抗生素或其他药物的培养基中生长的能力的酶活性，即相对于不具有该基因的相应细胞，编码可选择的标记蛋白的基因在细胞中的表达赋予该细胞针对抗生素或药物的抗性。当宿主细胞必须表达可选择的标记以在选择性培养基中生长时，认为所述标记是阳性选择标记(例如，赋予在适当的抗生素存在下生长能力的抗生素抗性基因)。可选择的标记还可以用于针对包含特殊基因(例如，sacB基因，其如果表达，则杀死在包含5％蔗糖的培养基中生长的细菌宿主细胞)的宿主细胞进行选择；以这种方式使用的可选择的标记称为阴性选择的标记或相反-选择的标记。普通的可选择的标记基因序列包括对抗抗生素例如氨苄青霉素、四环素、卡那霉素、嘌呤霉素、博来霉素、链霉素、潮霉素、新霉素、Zeocin^TM，等等的那些。可选择的营养缺陷型基因序列包括，例如hisD，其容许在组氨醇存在下在无组氨酸的培养基中生长。合适的可选择的标记基因包括博来霉素-抗性基因、金属硫蛋白基因、潮霉素B-磷酸转移酶基因、AURI基因、腺苷脱氨酶基因、氨基糖苷磷酸转移酶基因、二氢叶酸还原酶基因、胸苷激酶基因、黄嘌呤-鸟嘌呤磷酸核糖基转移酶基因，等等。

″核酸″，用于本文中时，是共价连接的核苷酸序列，其中一个核苷酸的戊糖的3’位置通过磷酸二酯基团与下一个核苷酸的戊糖的5’位置相连接，且其中核苷酸残基(碱基)以特定的顺序连接，即核苷酸的线性顺序，且包括其类似物，诸如具有一个或多种修饰碱基、糖和/或磷酸酯骨架的那些。“多核苷酸”，用于本文中时，是包含长度大于约100个核苷酸的序列的核酸。“寡核苷酸”或“引物”，用于本文中时，是短多核苷酸或多核苷酸的一部分。术语“寡核苷酸”或“寡”用于本文中时，定义为由2个或更多脱氧核糖核苷酸或核糖核苷酸，优选地多于3个，和通常多于10个，但少于250个，优选地少于200个脱氧核糖核苷酸或核糖核苷酸组成的分子。所寡核苷酸可以通过任何方式生成，所述方式包括化学合成，DNA复制，扩增，例如，聚合酶链反应(PCR)，反转录(RT)，或其组合。“引物”是能够在处于起始引物延伸的条件下起核酸合成起始点作用的寡核苷酸。选择引物在其3’末端具有与靶标(模板)的特定序列基本互补的区域。引物必须是充分互补的，以使得与靶标杂交，从而发生引物的延伸。引物序列不需要反映靶标的准确序列。例如，非-互补的核苷酸片段可以附着于引物的5’末端，其中该引物序列的剩余部分与所述靶标基本互补。非-互补的碱基或较长序列可以散置在引物中，条件是该引物序列与靶标序列具有足以杂交的互补性，并由此形成复合物用以合成引物的延伸产物。引物与基因序列的匹配或互补性可以用于扩增反应、RT-PCR等。

认为核酸分子具有“5’-端”(5’末端)和“3’-端”(3’末端)，因为核酸磷酸二酯键出现在取代单核苷酸的戊糖环的5’碳和3’碳处。新键将出现在其5’碳处的多核苷酸的末端是其5’端核苷酸。新键将出现在其3’碳处的多核苷酸的末端是3’端核苷酸。末端核苷酸，用于本文中时，是在3’-或5’-端末端位置的核苷酸。

认为DNA分子具有“5’末端”和“3’末端”，因为单核苷酸以这样的方式反应从而形成寡核苷酸，所述方式是一个单核苷酸戊糖环的5’磷酸通过磷酸二酯键以一种方向附着于其相邻的3’氧。因此，如果其5’磷酸不与单核苷酸戊糖环的3’氧相连接，则寡核苷酸的末端称为“5’末端”，并且如果其3’氧不与随后的单核苷酸戊糖环的5’磷酸相连接，则称为“3’末端”。

用于本文中时，核酸序列，即使在较大寡核苷酸或多核苷酸内部，也可以认为具有5’和3’末端。在线性或环形DNA分子中，离散元件称为“下游”或3’元件的“上游”或5’。该术语反映这样的事实，即转录沿着DNA链以5’到3’方式进行。典型地，指导连接的基因(例如，开放阅读框或编码区)转录的启动子和增强子元件通常位于编码区的5’或上游。然而，增强子元件甚至在位于启动子元件和编码区的3’时发挥其作用。转录终止和多聚腺苷化信号位于编码区的3’或下游。

术语“密码子”用于本文中时，是基本遗传编码单位，由三个核苷酸的序列组成，所述三个核苷酸指定结合到多肽链中的特定氨基酸、或起始或终止信号。术语“编码区”当关于结构基因使用时，指编码在作为mRNA分子翻译的结果产生的新生多肽中存在的氨基酸的核苷酸序列。典型地，所述编码区在5’侧结合编码起始密码子甲硫氨酸的核苷酸三联体“ATG”，并且在3’侧结合终止密码子(例如，TAA，TAG，TGA)。在一些情形中，还已知所述编码区由核苷酸三联体“TTG”起始。

用于本文中时，术语“分离的”指体外制备、分离和/或纯化核酸分子、多肽、肽或蛋白质，以使其与体内物质无关。因此，术语“分离的”在关于核酸使用时，如在“分离的寡核苷酸”或“分离的多核苷酸”中，指从在其来源中一般有关的至少一种污染物中鉴定和分开的核酸序列。分离的核酸处于与天然存在不同的形式或配制中。相反，非-分离的核酸(例如DNA和RNA)以它们天然存在的状态存在。例如，发现给定的DNA序列(例如，基因)以接近相邻基因的方式存在于宿主细胞染色体上；发现RNA序列(例如，编码特定蛋白的特定mRNA序列)作为与编码多种蛋白质的许多其他mRNA的混合物存在于细胞中。因此，关于“分离的核酸分子”，其包括基因组、cDNA、或合成来源的多核苷酸或其一些组合，所述“分离的核酸分子”(1)与天然存在所述“分离的核酸分子”的多核苷酸的全部或一部分无关，(2)与天然不相连的多核苷酸操作性地连接，或(3)天然不作为较大序列的一部分出现。分离的核酸分子可以以单链或双链形式存在。当使用核酸分子表达蛋白质时，该核酸最少包括有义链或编码链(即该核酸可以是单链的)，但是可以包括有义和反义链二者(即，该核酸可以是双链的)。

术语“分离的”当关于多肽使用时，如在“分离的蛋白质”或“分离的多肽”中，指从在其来源中一般有关的至少一种污染物中鉴定和分开的多肽。因此，分离的多肽(1)与天然存在的蛋白质无关，(2)不含来自相同来源的其他蛋白质，例如不含人蛋白，(3)由来自不同物种的细胞表达，或(4)天然不存在。因此，分离的多肽以与天然存在不同的形式或配制存在。相反，非-分离的多肽(例如蛋白质和酶)以它们天然存在的状态存在。术语“分离的多肽”、“分离的肽”或“分离的蛋白质”包括由包含一个合成起点的cDNA或重组RNA编码的多肽、肽或蛋白质，或其一些组合。

术语“野生型”用于本文中时，指具有由天然存在的来源分离的基因或基因产物的特征的基因和基因产物。野生型基因是种群中最频繁观察到的基因，并因此任意地命名为基因的“野生型”形式。相反，术语“突变型”指当与野生型基因或基因产物比较时，在序列和/或功能性特性中展示变化(即，改变的特征)的基因或基因产物。注意可以分离天然-存在的突变体；这些是通过这样的事实鉴定的，即当与野生型基因或基因产物比较时，它们具有改变的特征。

术语“基因”指这样的DNA序列，其包括编码序列和任选地对于从该DNA序列生成多肽所必需的调控序列。

已知核酸包含不同类型的突变。“点”突变指核苷酸序列中在单碱基位置处与野生型序列不同的变化。突变还可以指插入或缺失一个或多个碱基，以使核酸序列与参考，例如野生型序列不同。

术语“重组DNA分子”意指杂交DNA序列，其包括天然通常不一起存在的至少两种核苷酸序列。术语“载体”关于这样的核酸分子使用，在所述核酸分子中，可以插入或克隆DNA片段，并且可以用于将DNA片断转移到细胞中，并能够在细胞中复制。载体可以源自质粒、噬菌体、病毒、黏端质粒，等。

术语“重组载体”、“表达载体”或“构建体”用于本文中时，指包含理想编码序列的DNA或RNA序列和在特定宿主生物体中表达操作连接的编码序列所必需的合适的DNA或RNA序列。原核表达载体包括启动子、核糖体结合位点、用于在宿主细胞中自主复制的复制起点和可能地其他序列，例如任选的操纵子序列、任选的限制性酶位点。启动子定义为指导RNA聚合酶结合于DNA和起始RNA合成的DNA序列。真核表达载体包括启动子，任选地多聚腺苷化信号和任选地增强子序列。

具有“编码肽、蛋白质或多肽”的核苷酸序列的多核苷酸意指包括基因编码区的核酸序列或其片段，所述片段编码与相应的全长肽、蛋白质或多肽具有基本相同活性的基因产物。所述编码区可以以cDNA、基因组DNA或RNA形式存在。当以DNA形式存在时，寡核苷酸可以是单链的(即，有义链)或双链的。如果需要，合适的调控元件诸如增强子/启动子，剪接接头、多聚腺苷化信号等可以置于基因编码区的紧密接近处，以允许适当起始转录和/或正确处理初级RNA转录物。备选地，本发明的表达载体中使用的编码区可以包含内源增强子/启动子、剪接接头、间插序列、多聚腺苷化信号等。在其他实施方案中，编码区可以包含内源和外源控制元件的组合。

术语“转录调节元件”或“转录调节序列”指控制核酸序列表达的一些方面的遗传元件或序列。例如，启动子是促进操作连接的编码区转录起始的调节元件。其他调节元件包括，但不限于，转录因子结合位点、剪接信号、多聚腺苷化信号、终止信号和增强子元件，且包括增加或减少连接序列转录的元件，例如在反式-作用元件的存在下。

真核细胞中的转录控制信号包括“启动子”和“增强子”元件。启动子和增强子由与参与转录的细胞蛋白特异性相互作用的DNA序列的短阵列组成。启动子和增强子元件分离自多种真核来源，包括酵母、昆虫和哺乳动物细胞中的基因。启动子和增强子元件还分离自病毒，且类似的控制元件，诸如启动子也存在于原核生物中。特定启动子和增强子的选择依赖于用于表达目的蛋白的细胞类型。一些真核启动子和增强子具有宽宿主范围，而其他在有限的细胞类型子集中起作用。例如，SV40早期基因增强子在来自许多哺乳动物物种的广泛多种细胞类型中非常活跃，并且已经广泛用于在哺乳动物细胞中表达蛋白。在宽范围的哺乳动物细胞类型中活跃的启动子/增强子的两种其他实例是来自人延伸因子1基因和劳斯肉瘤病毒的长末端重复；和来自人巨细胞病毒的那些。

术语“启动子/增强子”表示包含能够提供启动子和增强子功能(即，由上述启动子元件和增强子元件提供的功能)的序列的DNA片断。例如，反转录病毒的长末端重复包含启动子和增强子功能。增强子/启动子可以是“内源的”或“外源的”或“异源的”。“内源”增强子/启动子是在基因组中与给定基因天然连接的增强子/启动子。“外源”或“异源”增强子/启动子是通过遗传操作(即分子生物学技术)置于与基因并列的那种，以使基因的转录受到连接的增强子/启动子的指导。

表达载体上存在“剪接信号”经常导致重组转录物在真核宿主细胞中更高的表达水平。剪接信号介导从初级RNA转录物中去除内含子，并由剪接供体和接纳体位点组成。普遍使用的剪接供体和接纳体位点是来自SV40的16S RNA的剪接接头。

重组DNA序列在真核细胞中的有效表达需要表达指导由此生成的转录物的有效终止和多聚腺苷化的信号。转录终止信号通常存在于多聚腺苷化信号的下游，并且长度是几百个核苷酸。术语“多(A)位点”或“多(A)序列”用于本文中时，表示指导新生RNA转录物终止和多聚腺苷化的DNA序列。重组转录物的有效多聚腺苷化是需要的，因为缺乏多(A)尾部的转录物是不稳定的，且迅速降解。表达载体中使用的多(A)信号可以是“异源的”或“内源的”。内源多(A)信号是在基因组中给定基因编码区3’末端天然存在的那种。异源多(A)信号是从一种基因中分离的并位于另一种基因的3’的那种。普遍使用的异源多(A)信号是SV40多(A)信号。SV40多(A)信号包含在237bp的BamH I/Bcl I限制性片段上并指导终止和多聚腺苷化。

真核表达载体还可以包含“病毒复制子”或“病毒复制起点”。病毒复制子是容许在表达合适的复制因子的宿主细胞中染色体外复制载体的病毒DNA序列。包括SV40或多瘤病毒复制起点的载体在表达合适的病毒T抗原的细胞中复制到高拷贝数(多至10⁴个拷贝/细胞)。相反，包含来自牛乳头瘤病毒或埃巴病毒的复制子的载体以低拷贝数(约100个拷贝/细胞)进行染色体外复制。

术语“体外”指人工环境和人工环境中发生的过程或反应。体外环境包括，但不限于，试管和细胞裂解产物。术语“原位”指细胞培养。术语“体内”指天然环境(例如，动物或细胞)和天然环境中发生的过程或反应。

术语“表达系统”指用于确定(例如，检测)目的基因表达的任何测定法或系统。分子生物学领域中的那些技术人员应该理解，可以使用宽泛种类的表达系统中的任一种。广阔范围的适合的哺乳动物细胞可以获自广阔范围的来源(例如，美国典型培养物保藏中心，Rockland，MD)。转化或转染的方法和表达媒介物的选择应该依赖于选择的宿主系统。转化和转染方法在本领域中已知。表达系统包括体外基因表达测定，其中目的基因(例如，报道基因)与调控序列连接，且在用抑制或诱导该基因表达的试剂处理后监测该基因的表达。基因表达的检测可以通过任何合适的方式进行，包括，但不限于，检测表达的mRNA或蛋白质(例如，报道基因的可检测产物)或通过表达目的基因的细胞的表型中可检测的变化。表达系统还可以包括检测裂解事件或其他核酸或细胞改变的测定。

用于本文中时，术语“杂交(hybridize)”和“杂交(hybridization)”指针对靶核酸的互补序列的退火，即两种包含互补序列的核酸(多核苷酸)的多聚体通过碱基配对退火的能力。术语“退火的”和“杂交的”始终互换使用，并意欲包括互补序列和靶核酸之间的任何特异性和可重复的相互作用，包括仅具有部分互补性的区域的结合。天然核酸中通常不存在的某些碱基可以包括在本发明的核酸中，并包括，例如，肌苷和7-脱氮鸟嘌呤。核酸技术领域中的那些技术人员在考虑许多变量后，所述变量包括，例如，互补序列的长度、碱基组成和寡核苷酸序列、离子强度和错配碱基对的出现，可以通过经验确定双链体的稳定性。核酸双链体的稳定性通过解链温度或“T_m”测量。特定条件下特殊核酸双链体的T_m是平均一半碱基对解离的温度。

术语“严格”用于指进行核酸杂交的温度、离子强度，和其他化合物存在的条件。在“高度严格”条件下，核酸碱基配对应该仅发生在具有高频互补碱基序列的核酸片段之间。因此，在希望不完全彼此互补的核酸杂交或退火在一起时，经常需要“中度”或“低度”严格条件。本领域公知许多等价条件可以用于包括中度或低度严格条件。杂交条件的选择对本领域技术人员通常是显然的，并且通常受杂交目的、杂交类型(DNA-DNA或DNA-RNA)、和序列之间理想相关性水平的指导(例如，Sambrook等，1989；核酸杂交，实践方法(Nucleic Acid Hybridization，A PracticalApproach)，IRL出版社，华盛顿特区，1985，用于方法的综合讨论)。

已知核酸双链体的稳定性随着错配碱基数量的增多而降低，并且取决于杂交双链体中错配的相对位置进一步降低至更大或更小的程度。因此，杂交的严格可以用于最大化或最小化所述双链体的稳定性。杂交严格可以通过下列各项改变：调节杂交温度；调节杂交混合物中螺旋去稳定剂，诸如甲酰胺的百分比；和调节洗涤溶液的温度和或盐浓度。为了过滤杂交，最终杂交严格性经常由用于杂交后洗涤的盐浓度和/或温度确定。

当关于核酸杂交使用时，“高度严格条件”包括与以下等价的条件：当使用约500个核苷酸长的探针时，在由5X SSPE(43.8g/l NaCl，6.9g/lNaH₂PO₄ H₂O和1.85g/l EDTA，用NaOH将pH调节到7.4)，0.5％SDS，5X Denhardt试剂和100μg/ml变性的鲑精DNA组成的溶液中，在42℃结合或杂交，随后在包括0.1X SSPE、1.0％SDS的溶液中在42℃洗涤。

当关于核酸杂交使用时，“中度严格条件”包括与以下等价的条件：当使用约500个核苷酸长的探针时，在由5X SSPE(43.8g/l NaCl，6.9g/lNaH₂PO₄ H₂O和1.85g/l EDTA，用NaOH将pH调节到7.4)，0.5％SDS，5X Denhardt试剂和100μg/ml变性的鲑精DNA组成的溶液中，在42℃结合或杂交，随后在包括1.0X SSPE、1.0％SDS的溶液中在42℃洗涤。

“低度严格条件”包括与以下等价的条件：当使用约500个核苷酸长的探针时，在由5X SSPE(43.8g/l NaCl，6.9g/l NaH₂PO₄ H₂O和1.85g/lEDTA，用NaOH将pH调节到7.4)，0.1％SDS，5X Denhardt试剂[每500ml 50X Denhardt包含：5g Ficoll(400型，法玛西亚(Pharmacia))，5g BSA(级分V；西格玛(Sigma))]和100μg/ml变性的鲑精DNA组成的溶液中，在42℃结合或杂交，随后在包括5X SSPE、0.1％SDS的溶液中在42℃清洗。

“肽”、“蛋白质”和“多肽”意指任何氨基酸链，无论长度或翻译后修饰(例如，糖基化或磷酸化)。除非另外指出，这些术语可互换。本发明的核酸分子编码天然-存在的(野生型)蛋白的变体。优选地，所述突变的蛋白具有与相应的野生型蛋白质氨基酸序列至少80％，例如至少85％，90％，和95％或99％相同的氨基酸序列。术语“同源性”指互补的程度。可能存在部分同源或完全同源(即，相同)。同源性通常使用序列分析软件(例如，Accelryn公司的序列分析软件包，圣地亚哥)测量。该软件通过对不同的取代、缺失、插入、或其他修饰分配同源度而匹配相似的序列。在一个实施方案中，突变蛋白相对于相应的野生型蛋白具有多个保守的取代。保守确定典型地包括下列组中的取代：甘氨酸、丙氨酸；缬氨酸、异亮氨酸、亮氨酸；天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺；丝氨酸、苏氨酸；赖氨酸、精氨酸；和苯丙氨酸、酪氨酸。

认为多肽分子具有“氨基端“(N-端)和”羧基端“(C-端)”，因为肽键存在于第一个氨基酸残基的主链氨基基团和第二个氨基酸残基的主链羧基基团之间。关于多肽序列的术语“N-端”和“C-端”指分别包括多肽的N-端和C-端区的部分的多肽区域。包括多肽N-端区部分的序列包括主要来自多肽链N-端一半的氨基酸，但不仅限于这样的序列。例如，N-端序列可以包括包含来自该多肽N-端和C-端两半部分的碱基的多肽序列的内部部分。同样适用于C-端区。N-端和C-端区可以，但不必须，分别包括定义多肽最终N-端和C-端的氨基酸。

术语“重组蛋白”或“重组多肽”用于本文中时，指由重组DNA分子表达的蛋白质分子。相反，术语“天然蛋白质”用于本文中时，表示由天然存在的(即，非重组)来源分离而来的蛋白质。分子生物学技术可以用于生成与蛋白质天然形式相比具有相同性质的重组蛋白质形式。

用于本文中时，术语“抗体”指具有一种或多种基本由免疫球蛋白基因或免疫球蛋白基因片段编码的多肽的蛋白质。确定的免疫球蛋白基因包括κ、λ、α、γ、δ、ε、μ恒定区基因，以及众多免疫球蛋白可变区基因。轻链分类为κ或λ。重链分类为γ、μ、α、δ或ε，其依次分别定义免疫球蛋白种类IgG，IgM，IgA，IgD和IgE。

已知基本的免疫球蛋白(抗体)结构单元包括四聚体。每个四聚体由两对相同的多肽链组成，每对具有一条“轻”链(约25kD)和一条“重”链(约50-70kD)。每条链的N-端定义主要负责抗原识别的约100-110或更多氨基酸的可变区。术语可变轻链(V_L)和可变主链(V_H)分布指这些轻链和重链。

抗体可以作为完整的免疫球蛋白或作为以多种形式存在的修饰存在，所述修饰包括，例如，FabFc₂，Fab，Fv，Fd，(Fab’)₂，仅包含轻链和重链可变区的Fv片段，包含可变区和部分恒定区的Fab或(Fab)’₂片段，单链抗体，例如scFv，CDR-移植的抗体等等。Fv的重链和轻链可以源自相同的抗体或不同的抗体，由此生成嵌合Fv区。抗体可以是动物(特别地，小鼠或大鼠)或人来源的，或可以是嵌合或人源化的。当用于本文中时，术语“抗体”包括这些不同的形式。

术语“细胞”、“细胞系”、“宿主细胞”，当用于本文中时，可互换使用，并且全部所述名称包括这些名称的后代或潜在后代。“转化的细胞”意指已经向其中(或向其先祖中)引入了本发明的核酸分子的细胞。任选地，本发明的核酸分子可以引入到合适的细胞系中，从而构建能够生成由所述核酸分子编码的蛋白质或多肽的稳定转染细胞系。用于构建所述细胞系的载体、细胞和方法在本领域中是公知的。词语“转化体”或“转化的细胞”包括来源于最初转化的细胞的原代转化细胞，而不考虑转移的次数。由于有意或无意的突变，所有的后代在DNA内容物上可能不准确一致。但是，具有与在最初转化的细胞中筛选时的相同功能性的突变后代包括在转化体的定义中。

术语“纯化的”或“用于纯化”意指从目的成分诸如蛋白质或核酸中去除一些污染物的任何方法的结果。样品中纯化成分的百分比因此增加。

术语“可操作地连接”用于本文中时，指生成以这样的形式的核酸序列连接，所述形式是生成能够指导给定基因转录和/或理想蛋白分子合成的核酸分子。该术语还指以这样的形式的编码氨基酸的序列连接，所述形式是生成功能性(例如，酶活性的、能够与结合配偶体结合的、能够抑制的等)蛋白质或多肽，或其前体，例如所述蛋白质或多肽的前-或前原-形式。

本文中确定的所有氨基酸残基是以天然L-构型存在。与标准多肽命名法一致，氨基酸残基的缩写如下对应表所示。

对应表

1-字母 3-字母氨基酸

Y Tyr L-酪氨酸

G Gly L-甘氨酸

F Phe L-苯丙氨酸

M Met L-甲硫氨酸

A Ala L-丙氨酸

S Ser L-丝氨酸

I Ile L-异亮氨酸

L Leu L-亮氨酸

T Thr L-苏氨酸

V Val L-缬氨酸

P Pro L-脯氨酸

K Lys L-赖氨酸

H His L-组氨酸

Q Gln L-谷氨酰胺

E Glu L-谷氨酸

W Trp L-色氨酸

R Arg L-精氨酸

D Asp L-天冬氨酸

N Asn L-天冬酰胺

C Cys L-半胱氨酸

用于本文中时，术语“多-组氨酸束”或(His标签)指包括2-10个组氨酸残基的分子，例如，5-10个残基的多-组氨酸束。多-组氨酸束容许在固定的金属，例如、镍、锌、钴或铜、螯合柱或通过与另一种分子的相互作用(例如与His标记反应的抗体)亲合纯化共价连接的分子。

“蛋白质去稳定序列”或“蛋白质去稳定结构域”包括一个或多个氨基酸残基，当存在于蛋白质的N-端或C-端时，其将连接的蛋白质的半衰期相对于缺乏蛋白质去稳定序列或结构域的相应的蛋白质，缩短或降低至少80％，优选地至少90％，更优选地，至少95％或更多，例如99％。蛋白质去稳定序列包括，但不限于，PEST序列，例如来自细胞周期蛋白，例如有丝分裂细胞周期蛋白、尿嘧啶透性酶或ODC的PEST序列，来自短命蛋白诸如ODC、早期响应蛋白诸如细胞因子、淋巴因子、原癌基因、例如c-myc或c-fos、MyoD、HMG CoA还原酶、S-腺苷甲硫氨酸脱羧酶的C端区序列，CL序列，细胞周期蛋白破坏盒，N-降解决定子，或在体内遍在的蛋白质或其片段。

用于本文中时，“纯”意指目标种类是存在的主要种类(即，在摩尔基础上，其比组合物中其他各个种类更丰富)，且优选地，基本纯化的组分是这样的组合物，其中目标种类包括所有存在的大分子种类的至少约50％(基于摩尔)。一般地，“基本纯”组合物应该包括组合物中存在的所有大分子种类的多于约80％，更优选地，多于约85％，约90％，约95％，和约99％。最优选地，将目标种类纯化为基本均匀的(通过常规检测方法不能在该组合物中检测出污染种类)，其中所述组合物基本由单一大分子种类组成。

突变水解酶

本发明范围内的突变水解酶包括但不限于通过重组技术，例如，位点定向诱变或循环诱变(recursive mutagenesis)制备的那些，并包括一个或多个氨基酸取代。在一个实施方案中，至少一个所述取代致使突变水解酶能够与关于相应的非突变(野生型)水解酶的底物形成稳定的键，例如，共价键，所述底物包括被修饰为包含一个或多个官能团的野生型底物，所述键比相应的野生型水解酶和该底物之间形成的键更稳定。在一个实施方案中，突变水解酶中的至少一个所述取代导致提高的功能性表达或结合动力学，或二者。本发明范围内的水解酶包括，但不仅限于，例如，http://www.expasy.ch/enzyme/nzyme-byclass.html中公开的那些，并包括肽酶、酯酶(例如，胆固醇酯酶)、糖苷酶(例如，葡糖淀粉酶)、磷酸酶(例如，碱性磷酸酶)等等。例如，水解酶包括，但不限于，在酯键上起作用的酶，诸如羧酸酯水解酶，硫酯水解酶，磷酸单酯水解酶，磷酸二酯水解酶，三磷酸单酯水解酶，硫酸酯水解酶，二磷酸单酯水解酶，磷酸三酯水解酶，生成5′-磷酸单酯的外切脱氧核糖核酸酶，生成5′-磷酸单酯的外切核糖核酸酶，生成3′-磷酸单酯的外切核糖核酸酶，对核糖核酸或脱氧核糖核酸起作用的外切核酸酶，对核糖核酸或脱氧核糖核酸起作用的外切核酸酶，生成5′-磷酸单酯的内切脱氧核糖核酸酶，生成除5′-磷酸单酯外的内切脱氧核糖核酸酶，特异于改变的碱基的位点-特异性内切脱氧核糖核酸酶，生成5′-磷酸单酯的内切核糖核酸酶，生成除5′-磷酸单酯外的内切核糖核酸酶，对核糖核酸或脱氧核糖核酸起作用的内切核糖核酸酶，对核糖核酸或脱氧核糖核酸糖基化酶起作用的内切核糖核酸酶；糖基化酶；糖苷酶，例如，水解O-和S-糖基、以及水解N-糖基化合物的酶；作用于醚键诸如三烷基锍水解酶或醚水解酶；作用于肽键的酶(肽水解酶)诸如氨基肽酶，二肽酶，二肽基-肽酶和三肽基-肽酶，肽基-二肽酶，丝氨酸-型羧肽酶，金属羧肽酶，半胱氨酸-型羧肽酶，ω肽酶，丝氨酸内肽酶，半胱氨酸内肽酶，天冬氨酸内肽酶，金属内肽酶，苏氨酸内肽酶，和未知催化机制的内肽酶；作用于除肽键外的碳-氮键的酶，诸如线性酰胺、环酰胺、线性脒、环脒、腈、或其他化合物中的那些碳-氮键；作用于酸酐的酶，诸如包含磷的酐和包含磺酰的酐中的那些；作用于酸酐的酶(催化跨膜运动)；作用于酸酐或参与细胞和亚细胞运动的酶；作用于碳-碳键的酶(例如，在酮底物中)；作用于卤素键的酶(例如，在C-卤化化合物中)，作用于磷-氮键的酶；作用于硫-氮键的酶；作用于碳-磷键的酶；和作用于硫-硫键的酶。作用于卤素键的示范性水解酶包括，但不限于，烷基卤化酶，2-卤酸脱卤素酶，卤代乙酸脱卤素酶，甲状腺素脱碘酶，卤烷脱卤素酶，4-氯苯甲酸脱卤素酶，4-氯苯甲酰-CoA脱卤素酶，和莠去净(atrazine)氯水解酶。作用于环酰胺中碳-氮键的示范性水解酶包括，但不限于，巴比妥酸酶，二氢嘧啶酶，二氢乳清酸酶，羧基甲基乙内酰脲酶，尿囊素酶，β-内酰胺酶，咪唑酮丙酸酶，5-羟脯氨酸酶(ATP-水解)，肌酸肝酶，L-赖氨酸-内酰胺酶，6-氨基己酸-环状-二聚体水解酶，2，5-二氧代哌嗪水解酶，N-甲基乙内酰脲酶(ATP-水解)，氰尿酸氨基水解酶，马来酰亚胺水解酶。″β-内酰胺酶″用于本文中时包括A型，C型和D型β-内酰胺酶以及D-ala羧肽酶/转肽酶，酯酶EstB，青霉素结合蛋白2X，青霉素结合蛋白5，和D-氨基肽酶。优选地，β-内酰胺酶是丝氨酸β-内酰胺酶，例如，在与金黄色葡萄球菌(S.aureus)PC1的丝氨酸β-内酰胺酶的残基70相对应的位置处具有催化丝氨酸残基，并且在与金黄色葡萄球菌PC1的丝氨酸β-内酰胺酶的残基166相对应的位置处具有谷氨酸的那个，其任选地在与金黄色葡萄球菌PC1的丝氨酸β-内酰胺酶的残基73相对应的位置处具有赖氨酸残基，和还任选地在与金黄色葡萄球菌PC1的丝氨酸β-内酰胺酶的残基234相对应的位置处具有赖氨酸残基。

在一个实施方案中，本发明的突变水解酶包括在这样的残基处的至少一个氨基酸取代，所述残基，在野生型水解酶中，与活化水分子有关，例如，催化三联体或辅助残基中的残基，其中活化的水分子裂解野生型水解酶中的催化残基和水解酶底物之间形成的键。用于本文中时，″辅助残基″是改变另一种残基活性的残基，例如，其增强活化水分子的残基的活性。本发明范围内活化水的残基包括但不限于与酸-碱催化作用有关的那些，例如，组氨酸，天冬氨酸和谷氨酸。在另一个实施方案中，本发明的突变水解酶包括在这样的残基处的至少一个氨基酸取代，所述残基在野生型水解酶中，通过底物对水解酶的亲核攻击形成酯中间体。

在另一个实施方案中，本发明的突变水解酶包括至少2个与跟底物形成稳定键有关的氨基酸取代，一个取代位于在野生型水解酶中与活化水分子有关的残基处，或位于在野生型水解酶中通过底物对水解酶的亲核攻击而形成酯中间体的残基处，且另一个取代位于在野生型水解酶中位于水解酶底物结合位点处或其附近的残基处，例如该残基的至少一个原子在与野生型水解酶结合的水解酶底物的3或

之内，但不位于在相应野生型水解酶中与活化水分子有关或与底物形成酯中间体的残基处。在一个实施方案中，第二个取代可以位于这样的残基处，所述残基，在野生型水解酶中，沿着关于底物进入活性位点腔的位点排列，并具有至少一个原子位于与野生型水解酶结合的水解酶底物的3或

之内，诸如在底物通道中的残基，其不是相应野生型水解酶中与活化水分子有关或与底物形成酯中间体的残基。另外的取代优选地增加那些突变体与相应野生型水解酶的底物的形成稳定的共价键的速率。

在一个实施方案中，至少一个取代在与来自紫红红球菌的DhaA的残基272相对应的残基处。“相对应的残基”是这样的残基，所述残基在一种野生型蛋白质中，相对于参考野生型蛋白质，具有相同活性(功能)或任选地，当排列这两种蛋白质的一级序列时，所述残基处于相同的相关位置。例如，在一种酶中形成部分催化三联体或活化水分子的残基可以是该酶中的残基272，所述残基272对应于另一种酶中的残基73，其中残基73形成部分催化三联体并且活化水分子。因此，在一个实施方案中，本发明的突变脱卤素酶在与来自紫红红球菌的DhaA的残基272相对应的位置处具有除组氨酸外的残基，例如苯丙氨酸残基。在本发明的另一个实施方案中，突变水解酶是突变脱卤素酶，其包括与来自紫红红球菌的DhaA的残基106相对应的残基处的至少一个氨基酸取代，例如针对除天冬氨酸外的残基的取代。例如，本发明的突变脱卤素酶在与来自紫红红球菌的DhaA的残基106相对应位置处具有半胱氨酸或谷氨酸残基。在另一个实施方案中，突变水解酶是包含至少两个氨基酸取代的突变脱卤素酶，一个位于与来自紫红红球菌的DhaA的残基106相对应的残基处，和一个位于与来自紫红红球菌的DhaA的残基272相对应的残基处。在一个实施方案中，突变水解酶是包含至少两个氨基酸取代的突变脱卤素酶，一个位于与来自紫红红球菌的DhaA的残基272相对应的残基处，和另一个位于与来自紫红红球菌的DhaA的残基175，176，245和/或273相对应的残基处。在另一个实施方案中，突变水解酶是突变丝氨酸β-内酰胺酶，其包含位于与金黄色葡萄球菌(Staphylococcus aureus)PC1的丝氨酸β-内酰胺酶中的残基166或残基170相对应的残基处的至少一个氨基酸取代。

在一个实施方案中，一个取代位于在野生型水解酶中活化水分子的残基处，例如组氨酸残基处，和位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处，例如位于与氨基酸残基272相对应的位置处的取代的氨基酸是丙氨酸，谷氨酰胺，天冬酰胺，苯丙氨酸或甘氨酸。在另一个实施方案中，一个取代位于野生型水解酶中与底物形成酯中间体的残基处，例如，天冬氨酸残基处，和在与紫红红球菌脱卤素酶的氨基酸残基106相对应的残基处。在一个实施方案中，在与氨基酸106相对应的位置处的取代的氨基酸是半胱氨酸。在一个实施方案中，第二个取代位于与紫红红球菌脱卤素酶的位置175，176，或273相对应的氨基酸残基处，例如在与氨基酸残基175相对应的位置处的取代的氨基酸是甲硫氨酸、缬氨酸、谷氨酸、天冬氨酸、丙氨酸、亮氨酸、丝氨酸或半胱氨酸，在与氨基酸残基176相对应的位置处的取代的氨基酸是丝氨酸、甘氨酸、天冬酰胺、天冬氨酸、苏氨酸、丙氨酸或精氨酸，在与氨基酸残基273相对应的位置处的取代的氨基酸是苯丙氨酸、亮氨酸、甲硫氨酸或半胱氨酸。在另一个实施方案中，突变水解酶还包括第三和任选地第四个取代，其位于在野生型水解酶中在活性位点腔中和在与野生型水解酶结合的水解酶底物的3或内的氨基酸残基处，例如，所述第三个取代位于与紫红红球菌脱卤素酶的氨基酸残基273相对应的位置处，且所述第四个取代位于与紫红红球菌脱卤素酶的氨基酸残基175或176相对应的位置处。

例如，野生型脱卤素酶DhaA裂解卤化烃(HaloC₃-HaloC₁₀)中的碳-卤键。DhaA的催化中心是经典的催化三联体，其包括亲核体、酸和组氨酸残基。三联体中的氨基酸深入位于DhaA内部(长度约

和横截面约

)。DhaA的卤化底物中的卤素原子，例如，Cl-烷底物的氯原子位于紧密接近DhaA催化中心处。DhaA结合底物，可能形成ES复合物，且酯中间体通过由DhaA的Asp106(编号基于DhaA的蛋白质序列)亲核攻击底物形成。然后，Dha的His272活化水，并且活化的水水解该中间体，从催化中心释放产物。因此，在本发明的一个实施方案中，突变水解酶是包括在下列残基处的至少一个氨基酸取代的突变脱卤素酶，所述残基，在野生型脱卤素酶中，与活化水分子有关，例如，催化三联体中的残基或辅助残基，其中活化的水分子裂解在野生型脱卤素酶的催化残基和脱卤素酶底物之间形成的键。

在一个实施方案中，突变水解酶是卤烷脱卤素酶，例如，诸如在革兰氏-阴性(Keuning等，1985)和革兰氏-阳性利用卤烷的细菌(Keuning等，1985；Yokota等，1987；Scholtz等，1987；Sallis等，1990)中存在的那些。卤烷脱卤素酶，包括来自自养黄色杆菌(Xanthobacter autotrophicus)GJ10的DhlA(Janssen等，1988，1989)，来自紫红红球菌的DhaA，和来自少动鞘氨醇单胞菌(Spingomonas paucimobilis)UT26的LinB(Nagata等，1997)，是催化相对应烃的水解脱卤素化的酶。进行转化的卤化脂族烃包括C₂-C₁₀饱和脂族烃，其具有一个或多个附着的卤素基团，其中至少2个卤素在邻接的碳原子上。所述脂族烃包括挥发性氯化脂族(VCA)烃。VCA的烃包括，例如，脂族烃诸如二氯乙烷，1，2-二氯-丙烷，1，2-二氯丁烷和1，2，3-三氯丙烷。术语″卤化烃″用于本文中时意指卤化的脂族烃。当用于本文中时，术语″卤素″包括氯、溴、碘、氟，、砹等。优选的卤素是氯。

在一个实施方案中，突变水解酶是热稳定水解酶，诸如热稳定脱卤素酶，其包括在与紫红红球菌脱卤素酶的氨基酸残基117和/或175相对应的位置处的至少一个取代，所述取代与增强的热稳定性相关。在一个实施方案中，热稳定水解酶能够在低温度下，例如，0℃-约25℃结合水解酶底物。在一个实施方案中，热稳定水解酶是热稳定突变水解酶，即，除在与紫红红球菌脱卤素酶的氨基酸残基117和/或175相对应的位置处的取代外，具有一个或多个取代的那种。在一个实施方案中，热稳定突变脱卤素酶具有导致去除带电残基，例如，赖氨酸的取代。在一个实施方案中，热稳定突变脱卤素酶在与来自紫红红球菌的DhaA中残基117和/或175相对应的位置处具有丝氨酸或甲硫氨酸。

在一个实施方案中，本发明的突变水解酶包括至少2个氨基酸取代，至少其中之一与稳定的键形成有关，例如，野生型水解酶中活化水分子的残基，例如，组氨酸残基，且位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处，例如，取代的氨基酸是丙氨酸、天冬酰胺、甘氨酸或苯丙氨酸，且至少另一个与提高的功能性表达或结合动力学，或二者有关，例如，在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶在与位置175，176，272，和273相对应的位置处具有取代，以及在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处具有至少另一个取代。在一个实施方案中，突变水解酶在与位置175，176，272，和273相对应的位置处具有取代，以及在与SEQ ID NO：1位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应的位置处具有至少另一个取代。

在一个实施方案中，突变水解酶在与位置106，175，和176相对应的位置处具有取代，以及在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处具有至少另一个取代。在一个实施方案中，突变水解酶在与位置106，175，176，272，和273相对应的位置处具有取代，以及在与SEQ ID NO：1的位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处具有至少另一个取代。在一个实施方案中，突变水解酶在与位置106，175，176，272，和273相对应的位置处具有取代，以及在与位置5，7，11，12，20，30，32，47，54，55，56，58，60，65，78，80，82，87，88，94，96，109，113，116，117，118，121，124，128，131，134，136，144，147，150，151，155，157，160，161，164，165，167，172，175，176，180，182，183，187，195，197，204，218，221，224，227，231，233，250，256，257，263，264，273，277，280，282，288，291，292，和/或294相对应的位置处具有至少另一个取代。

突变水解酶可以包括其他取代，例如，引入促进相应基因或其一部分的克隆的那些，和/或位于N-和/或C-端处或附近的额外的残基，例如引入促进相应的基因或其一部分的克隆，但是其不必须具有活性，例如不能分别检测的那些。

融合配偶体

本发明编码突变水解酶的多核苷酸可以与其他核酸序列一起使用，例如，天然序列诸如cDNA或已经进行体外操作的核酸序列，例如用于制备N-端、C-端或N-和C-端融合蛋白。许多合适是融合配偶体的实例在本领域中已知，且可以用在本发明的实施中。

例如，本发明还提供融合蛋白，其包括突变水解酶和关于目的蛋白质或肽的氨基酸序列，例如，关于下列各项的序列：标记蛋白，例如可选择的标记蛋白，亲合标记物的序列，例如多组氨酸序列，目的酶，例如萤光素酶，RNA酶抑制剂，RNA酶，和/或GFP，核酸结合蛋白，胞外基质蛋白，分泌蛋白，抗体或其一部分诸如Fc，生物发光蛋白，受体配体，调节蛋白，血清蛋白，免疫原性蛋白，荧光蛋白，具有反应性半胱氨酸的蛋白，受体蛋白，例如NMDA受体，通道蛋白，例如离子通道蛋白诸如钠-、钾-或钙-敏感的通道蛋白包括HERG通道蛋白，膜蛋白，胞质蛋白，核内蛋白，结构蛋白，磷蛋白，激酶，信号传导蛋白，代谢蛋白，线粒体蛋白，受体相关蛋白，荧光蛋白，酶底物，例如蛋白酶底物，转录因子，蛋白质去稳定序列，或转运蛋白，例如，EAAT1-4谷氨酸转运蛋白，以及指导突变水解酶到达特定位置的靶向信号，例如，质体靶向信号，诸如线粒体定位序列，细胞核定位信号或myristilation序列。

在一个实施方案中，融合蛋白可以在突变水解酶N-端包括目的蛋白，任选地，在C-端包括不同的目的蛋白。

在一个实施方案中，融合蛋白包括突变水解酶和与膜缔合的蛋白质或其一部分，例如，靶向蛋白诸如用于内质网靶向的那些，细胞膜结合蛋白质，例如，整联蛋白或其结构域诸如整联蛋白的细胞质、跨膜和/或胞外柄结构域，和/或将突变水解酶连接于细胞表面的蛋白，例如，糖基磷酸肌醇信号序列。

融合配偶体可以包括具有酶活性的那些。例如，功能性蛋白质序列可以编码激酶催化结构域(Hanks和Hunter，1995)，从而生成可以向特定氨基酸酶促添加磷酸酯部分的融合蛋白，或可以编码Src同源2(SH2)结构域(Sadowski等，1986；Mayer和Baltimore，1993)，从而生成特异性结合磷酸化酪氨酸的融合蛋白。

所述融合还可以包括亲合结构域，其包括能够与结合配偶体相互作用的肽序列，例如，诸如固定在固体支持物中，有效用于鉴定或纯化的肽序列。编码多个连续单氨基酸，诸如组氨酸的DNA序列，在融合于表达的蛋白质时，可以用于通过与树脂柱，诸如镍琼脂糖高亲合性结合一步纯化重组蛋白质。示范性亲合结构域包括His5(HHHHH)(SEQ ID NO：3)，HisX6(HHHHHH)(SEQ ID NO：4)，C-myc(EQKLISEEDL)(SEQ ID NO：5)，Flag(DYKDDDDK)(SEQ ID NO：6)，StrepTag(WSHPQFEK)(SEQ IDNO：7)，血凝素，例如，HA标签(YPYDVPDYA)(SEQ ID NO：8)，GST，硫氧还蛋白，纤维素结合结构域，RYIRS(SEQ ID NO：9)，Phe-His-His-Thr(SEQID NO：10)，壳多糖结合结构域，S-肽，T7肽，SH2结构域，C-末端RNA标签，WEAAAREACCRECCARA(SEQ ID NO：11)，金属结合结构域，例如，锌结合结构域或钙结合结构域诸如来自钙-结合蛋白质的那些，例如，钙调蛋白，肌钙蛋白C，钙依赖磷酸酶B，肌球蛋白轻链，恢复蛋白，S-调制蛋白，视锥蛋白，VILIP，神经钙蛋白，海马钙蛋白，frequenin，钙牵蛋白，需钙蛋白大亚基，S100蛋白质，小清蛋白，钙结合蛋白D_9K，钙结合蛋白D_28K，和钙网膜蛋白，内含肽，生物素，链霉抗生物素，MyoD，Id，亮氨酸拉链序列，和麦芽糖结合蛋白质。

示范性的异源序列包括但不限于序列诸如FRB和FKBP中的那些，蛋白质激酶的调节亚基(PKa-R)和蛋白质激酶的催化亚基(PKa-C)，src同源区(SH2)和能够被磷酸化的序列，例如，包含酪氨酸的序列，14-3-3的同种型，例如，14-3-3t(见Mils等，2000)，和能够被磷酸化的序列，具有WW区的蛋白质(结合富含脯氨酸的分子的蛋白质中的序列(见Ilsley等，2002；和Einbond等，1996))和能够被磷酸化的异源序列，例如，包含丝氨酸和/或苏氨酸的序列，以及二氢叶酸还原酶(DHFR)和促旋酶B(GyrB)中的序列。

最优化的水解酶序列，和编码该水解酶的载体和宿主细胞

还提供包括编码水解酶或其融合体的核酸序列的分离的核酸分子(多核苷酸)。在一个实施方案中，所述分离的核酸分子包括最优化为在至少一种选择的宿主中表达的核酸序列。最优化的序列包括作为最优化的密码子的序列，即，相对于另一种生物体，例如，关系远的生物体，在一种生物体中更频繁使用的密码子，以及包括用于添加或修饰Kozak序列和/或内含子，和/或去除不需要的序列例如潜在转录因子结合位点的修饰。在一个实施方案中，多核苷酸包括编码突变脱卤素酶的核酸序列，该核酸序列最优化在选择的宿主细胞中表达。在一个实施方案中，最优化的多核苷酸不再与相应的非最适合序列杂交，例如，在中度或高度严格条件下不与非最适合的序列杂交。在另一个实施方案中，多核苷酸与相应的非最适合序列具有少于90％，例如，少于80％，的核酸序列同一性，并任选地编码与由所述非最适合序列编码的多肽具有至少80％，例如，至少85％，90％或更多，氨基酸序列同一性的多肽。还提供包括所述分离的核酸分子的构建体，例如，表达盒，和载体，以及包括所述分离核酸分子、构建体或载体的试剂盒。

包括编码与水解酶的融合体的核酸序列的核酸分子任选地最优化为在特定宿主细胞中表达，并且还任选地与转录调节序列，例如，一个或多个增强子、启动子、转录终止序列或其组合操作性地相连接，从而形成表达盒。

在一个实施方案中，通过用在特定(选择的)细胞中优选使用的密码子替换野生型或突变水解酶序列中的密码子而最优化编码水解酶或其融合体的核酸序列。优选的密码子在选择的细胞中具有相对高的密码子使用频率，且优选地，它们的引入导致为所选择的宿主细胞中存在的转录因子引入相对少的转录因子结合位点，和相对少的其他不需要的结构属性。因此，最优化的核酸产物由于提高的密码子使用频率而具有提高的表达水平，并且由于减少不需要的转录调节序列的数量而具有降低的不适当转录行为风险。

本发明分离的和最优化的核酸分子可以具有这样的密码子组成，所述密码子组成与相应野生型核酸序列的密码子组成在多于30％，35％，40％或多于45％，例如，50％，55％，60％或更多密码子处不同。用于本发明的优选密码子是在特定生物体中比至少一种关于同一氨基酸的其他密码子更频繁使用的那些，并且更优选地，也不是在该生物体中低使用的密码子且不是在用于克隆或筛选该核酸分子表达的生物体中低使用的密码子。而且，对于某些氨基酸(即，具有3个或更多个密码子的那些氨基酸)优选的密码子，可以包括2个或更多个比其他(非-优选的)密码子更频繁使用的密码子。在一种生物体中比在另一种生物体中更频繁使用的密码子在核酸分子中的存在导致核酸分子，在被引入到更频繁使用那些密码子的生物体的细胞中时，在那些细胞中，以比野生型或亲本核酸序列在那些细胞中的表达更高的水平表达。

在本发明的一个实施方案中，不同的密码子是在哺乳动物中更频繁使用的那些，而在另一个实施方案中，不同的密码子是在植物中更频繁使用的那些。不同生物体的优选密码子在本领域中已知，例如，见www.kazusa.or.jp./codon/。一种特殊类型的哺乳动物，例如，人，可以具有与另一种类型的哺乳动物不同的优选密码子组。同样地，特殊类型的植物可以具有与另一种类型的植物不同的优选密码子组。在本发明的一个实施方案中，大部分不同的密码子是在理想的宿主细胞中优选的密码子。生物体，包括哺乳动物(例如，人)和植物的优选密码子在本领域中已知(例如，Wada等，1990；Ausubel等，1997)。例如，优选的人密码子包括，但不限于，CGC(Arg)，CUG(Leu)，UCU(Ser)，AGC(Ser)，ACC(Thr)，CCA(Pro)，CCT(Pro)，GCC(Ala)，GGC(Gly)，GUG(Val)，AUC(Ile)，AUU(Ile)，AAG(Lys)，AAC(Asn)，CAG(Gln)，CAC(His)，GAG(Glu)，GAC(Asp)，UAC(Tyr)，UGC(Cys)和TTC(Phe)(Wada等，1990)。因此，在一个实施方案中，本发明的合成的核酸分子，具有这样的密码子组成，该密码子组成通过具有增多数量的优选的人密码子而与野生型核酸序列相区别，所述优选的人密码子例如，CGC，CUG，UCU，AGC，ACC，CCA，CCU，GCC，GGC，GUG，AUC，AUU，AAG，AAC，CAG，CAC，GAG，GAC，UAC，UGC，UUC，或其任意组合。例如，相对于野生型核酸序列，本发明的核酸分子可以具有增多数量的CUG或UUG亮氨酸-编码密码子，GUG或GUC缬氨酸-编码密码子，GGC或GGU甘氨酸-编码密码子，AUC或AUU异亮氨酸-编码密码子，CCA或CCU脯氨酸-编码密码子，CGC或CGU精氨酸-编码密码子，AGC或TCU丝氨酸-编码密码子，ACC或ACU苏氨酸-编码密码子，GCC或GCU丙氨酸-编码密码子，或其任意组合。在另一个实施方案中，优选的秀丽隐杆线虫(C.elegans)密码子包括，但不限于，UUC(Phe)，UUU(Phe)，CUU(Leu)，UUG(Leu)，AUU(Ile)，GUU(Val)，GUG(Val)，UCA(Ser)，UCU(Ser)，CCA(Pro)，ACA(Thr)，ACU(Thr)，GCU(Ala)，GCA(Ala)，UAU(Tyr)，CAU(His)，CAA(Gln)，AAU(Asn)，AAA(Lys)，GAU(Asp)，GAA(Glu)，UGU(Cys)，AGA(Arg)，CGA(Arg)，CGU(Arg)，GGA(Gly)，或其任意组合。在另一个实施方案中，优选的果蝇(Drosophilia)密码子包括，但不限于，UUC(Phe)，CUG(Leu)，CUC(Leu)，AUC(Ile)，AUU(Ile)，GUG(Val)，GUC(Val)，AGC(Ser)，UCC(Ser)，CCC(Pro)，CCG(Pro)，ACC(Thr)，ACG(Thr)，GCC(Ala)，GCU(Ala)，UAC(Tyr)，CAC(His)，CAG(Gln)，AAC(Asn)，AAG(Lys)，GAU(Asp)，GAG(Glu)，UGC(Cys)，CGC(Arg)，GGC(Gly)，GGA(gly)，或其任意组合。优选的酵母密码子包括但不限于UUU(Phe)，UUG(Leu)，UUA(Leu)，CCU(Leu)，AUU(Ile)，GUU(Val)，UCU(Ser)，UCA(Ser)，CCA(Pro)，CCU(Pro)，ACU(Thr)，ACA(Thr)，GCU(Ala)，GCA(Ala)，UAU(Tyr)，UAC(Tyr)，CAU(His)，CAA(Gln)，AAU(Asn)，AAC(Asn)，AAA(Lys)，AAG(Lys)，GAU(Asp)，GAA(Glu)，GAG(Glu)，UGU(Cys)，CGU(Trp)，AGA(Arg)，CGU(Arg)，GGU(Gly)，GGA(Gly)，或其任意组合。类似地，具有增多数量的在植物中更频繁使用的密码子的核酸分子，具有这样的密码子组成，所述密码子组成通过具有增多数量的植物密码子与野生型或亲本核酸序列相区别，所述植物密码子包括，但不限于，CGC(Arg)，CUU(Leu)，UCU(Ser)，UCC(Ser)，ACC(Thr)，CCA(Pro)，CCU(Pro)，GCU(Ser)，GGA(Gly)，GUG(Val)，AUC(Ile)，AUU(Ile)，AAG(Lys)，AAC(Asn)，CAA(Gln)，CAC(His)，GAG(Glu)，GAC(Asp)，UAC(Tyr)，UGC(Cys)，UUC(Phe)，或其任意组合(Murray等，1989)。优选的密码子对不同类型的植物可以不同(Wada等，1990)。

在一个实施方案中，编码水解酶或其融合体的最优化核酸序列相对于编码相应水解酶或其融合体的非最适合核酸序列具有少于100％，例如，少于90％或少于80％，的核酸序列同一性。例如，编码DhaA的最优化核酸序列相对于编码相应DhaA的非最适合(野生型)核酸序列具有少于约80％的核酸序列同一性，且由最优化核酸序列编码的DhaA任选地与相应的野生型DhaA具有至少85％的氨基酸序列同一性。在一个实施方案中，由最优化核酸序列编码的DhaA的活性是由非最适合序列编码的DhaA的活性的至少10％，例如，50％或更高，例如，由最优化核酸序列编码的突变DhaA以与由非最适合核酸序列编码的突变DhaA结合相同底物基本相同的效率，即，至少50％，80％，100％或更高，结合底物。

突变DhaA的示范性最优化DhaA基因具有下列密码子最优化序列(对于大肠杆菌和多种哺乳动物物种消除罕用密码子)并编码D78G，K175M，C176G，H272N，和Y273F取代：

：atggcagaaatcggtactggctttccattcgacccccattatgtggaagtcctgggcgagcgcatgcactacgtcg

atgttggtccgcgcgatggcacccctgtgctgttcctgcacggtaacccgacctcctcctacctgtggcgcaacatc

atcccgcatgttgcaccgagccatcgctgcattgctccagacctgatcggtatgggcaaatccgacaaaccagacc

tgggttatttcttcgacgaccacgtccgctacctggatgccttcatcgaagccctgggtctggaagaggtcgtcctgg

tcattcacgactggggctccgctctgggtttccactgggccaagcgcaatccagagcgcgtcaaaggtattgcatgt

atggagttcatccgccctatcccgacctgggacgaatggccagaatttgcccgcgagaccttccaggccttccgca

ccgccgacgtcggccgcgagctgatcatcgatcagaacgcttttatcgagggtgcgctgccgatgggtgtcgtcc

gcccgctgactgaagtcgagatggaccattaccgcgagccgttcctgaagcctgttgaccgcgagccactgtggc

gcttcccaaacgagctgccaatcgccggtgagccagcgaacatcgtcgcgctggtcgaagcatacatgaactggc

tgcaccagtcccctgtcccgaagctgctgttctggggcaccccaggcgttctgatcccaccggccgaagccgctc

gcctggccgaaagcctgcctaactgcaagactgtggacatcggcccgggtctgaattttctgcaagaagacaacc

cggacctgatcggcagcgagatcgcgcgctggctgccggcgctg(SEQ ID NO：30)

其编码

maeigtgfpfdphyvevlgermhyvdvgprdgtpvlflhgnptssylwmiiphvapshrciapdligmgks

dkpdlgyffddhvryldafiealgleevvlvihdwgsalgfhwakrnpervkgiacmefirpiptwdewpefa

retfqafrtadvgreliidqnafiegalpmgvvrpltevemdhyrepflkpvdreplwrfpnelpiagepaniva

lveaymnwlhqspvpkllfwgtpgvlippaeaarlaeslpncktvdigpglnflqednpdligseiarwlpal

(SEQ ID NO：73)。

可以将核酸分子或表达盒引入载体中，例如，质粒或病毒载体中，其任选地包括可选择的标记基因，且可以将所述载体引入到目的细胞中，例如，原核细胞诸如大肠杆菌，链霉菌属(Streptomyces spp.)，杆菌属(Bacillus spp.)，葡萄球菌属(Staphylococcus spp.)等等，以及真核细胞，包括植物(双子叶植物或单子叶植物)，真菌，酵母，例如，毕赤酵母菌属(Pichia)，酵母属(Saccharomyces)或裂殖酵母属(Schizosaccharomyces)，或哺乳动物细胞。优选的哺乳动物细胞包括牛、山羊、绵羊、犬科、猫科、非-人灵长类动物例如猿、和人细胞。优选的哺乳动物细胞系包括，但不限于，CHO，COS，293，Hela，CV-1，SH-SY5Y(人成神经细胞瘤细胞)，HEK293，和NIH3T3细胞。

编码的突变水解酶的表达可以受控于能够在原核细胞或真核细胞中表达的任何启动子。优选的原核启动子包括，但不限于，SP6，T7，T5，tac，bla，trp，gal，lac或麦芽糖启动子。优选的真核启动子包括，但不限于，组成型启动子，例如，病毒启动子诸如CMV、SV40和RSV启动子，以及可调节的启动子，例如，可诱导的或可抑制的启动子诸如tet启动子，hsp70启动子和受CRE调节的合成启动子。在一个实施方案中，用于克隆或表达的载体包括Flexi

载体，诸如美国公开的申请号20050074785和20050074883中公开的那些，将其内容引人本文作为参考，Gateway^TM载体，或任何其他合适的克隆或表达载体。用于细菌表达的载体包括pGEX-5X-3，且用于真核表达的载体包括但不限于pCIneo-CMV。

可以通过任何方法，包括，但不限于，钙-介导的转化、电穿孔、显微注射、脂转染、粒子轰击等等，将本发明的核酸分子、表达盒和/或载体引入细胞。

官能团

本发明的底物和方法中有效使用的官能团是可检测或能够检测的分子。本发明范围内的官能团能够共价连接双功能性连接体或水解酶的底物的一个反应性取代基，并且，作为本发明的底物的一部分，与不与天然存在的底物相连接并能够与突变水解酶形成稳定复合物的官能团具有基本相同的活性。官能团因此具有一种或多种促进检测，和任选地分离，具有该官能团的底物和突变水解酶之间的稳定复合物的性质。例如，官能团包括具有特有的电磁光谱性质诸如发射或吸收，磁性，电子自旋共振，电容，介电常数或电导率的那些，以及铁磁性，顺磁性，反磁性，发光，电化学发光，荧光性，磷光性，彩色，抗原性，或具体不同质量的官能团。官能团包括，但不限于，核酸分子，即，DNA或RNA，例如，寡核苷酸或核苷酸，诸如具有核苷酸类似物的那种，能够结合蛋白质的DNA，相应于目的基因的单链DNA，相应于目的基因的RNA，缺乏终止密码子的mRNA，氨基乙酰化起始子tRNA，氨基乙酰化琥珀抑制基因tRNA，或用于RNAi的双链RNA，蛋白质，例如，发光蛋白，肽，肽核酸，由配体识别的表位，例如，生物素或链霉抗生物素，半抗原，氨基酸，脂质，脂质双分子层，固体支持物，荧光团，生色团，报道分子，放射性核素，诸如用在例如放射活性测量中的放射性同位素或用在方法诸如同位素编码的亲合标记物(ICAT)中的稳定同位素，电子不穿透分子，X-射线造影试剂，MRI造影剂，例如，锰，钆(III)或氧化铁粒子，等等。在一个实施方案中，所述官能团是氨基酸，蛋白质，糖蛋白，多糖，三重致敏物，例如，CALI，核酸分子，药物，毒素，脂质，生物素，或固体支持物，诸如自我-装配的单分子层(见，例如，Kwon等，2004)，结合Ca²⁺，结合K⁺，结合Na⁺，是pH灵敏的，是电子不穿透的，是生色团，是MRI造影剂，存在NO下发荧光或对下列各项灵敏：活性氧，纳米颗粒，酶，酶的底物，酶的抑制剂，例如，自杀底物(见，例如，Kwon等，2004)，辅因子，例如，NADP，辅酶，琥珀酰亚胺基酯或醛，荧光素，谷胱甘肽，NTA，生物素，cAMP，磷脂酰肌醇，cAMP的配体，金属，用作自旋阱(spintrap)的硝基氧或硝酮(通过电子自旋共振(ESR)检测的)，金属螯合剂，例如，用于在时间分辨的荧光性中或为了捕获金属用作造影剂，光笼蔽(photocaged)化合物，例如，当辐射释放笼蔽化合物诸如荧光团时，嵌入剂，例如，诸如补骨脂素或有效用于结合DNA或用作光活化分子的另一种嵌入剂，即三磷酸酯或亚磷酰胺，例如，用于容许将底物结合到DNA或RNA中，抗体，或异双功能性交叉-连接体诸如有效缀合蛋白质或其他分子的那种，交叉-连接体包括但不限于酰肼，芳基叠氮化物，马来酰亚胺，碘乙酰胺/溴乙酰胺，N-羟基琥珀酰亚胺基酯，混合的二硫化物诸如吡啶基二硫化物，乙二醛/苯甲酰甲醛，乙烯基砜/乙烯基磺酰胺，丙烯酰胺，硼酯(boronic ester)，异羟肟酸，imidate酯，异氰酸酯/异硫氰酸酯，或氯三嗪/二氯三嗪。

例如，官能团包括但不限于一种或多种氨基酸，例如，天然存在的氨基酸或非-天然的氨基酸，肽或多肽(蛋白质)，包括抗体或其片段，His-标记物，FLAG标记物，Streptag，酶，辅因子，辅酶，酶的肽或蛋白质底物，例如，分支的肽底物(例如，Z-氨基苯甲酰基(Abz)-Gly-Pro-Ala-Leu-Ala-4-硝基苄酰胺(NBA)，自杀底物，或受体，一种或多种核苷酸(例如，ATP，ADP，AMP，GTP或GDP)，包括其类似物，例如，寡核苷酸，对应于基因或其一部分的双链或单链DNA，例如，能够结合蛋白质诸如转录因子的DNA，对应于基因的RNA，例如，缺乏终止密码子的mRNA，或其一部分，用于RNAi的双链RNA或其载体，糖蛋白，多糖，肽-核酸(PNA)，脂质，包括脂质双分子层；或是固体支持物，例如，沉积粒子诸如磁性粒子，琼脂糖或纤维素珠，膜，玻璃，例如，载玻片，纤维素，藻酸盐，塑料或其他合成制备的聚合物，例如，eppendorf管或多-孔板的孔，自我装配的单分子层，表面等离振子共振芯片，或具有电子传导表面的固体支持物，且包括药物，例如，化学治疗剂诸如多柔比星，5-氟尿嘧啶，或盐酸伊立替康和山梨醇注射剂(CPT-11；伊立替康)，氨基乙酰化tRNA诸如氨基乙酰化起始子tRNA或氨基乙酰化琥珀抑制基因tRNA，结合Ca²⁺的分子，结K⁺的分子，结合Na⁺的分子，pH灵敏的分子，放射性核素，电子不穿透的分子，造影剂，例如，钡，碘或其他MRI或X-射线造影剂，存在NO下发荧光或对下列各项灵敏的分子：活性氧，纳米颗粒，例如，免疫金颗粒，顺磁性纳米颗粒，增频(upconventing)纳米颗粒，或量子点，酶的非蛋白质底物，酶的抑制剂，可逆或不可逆的抑制剂，螯合剂，交联基团，例如，琥珀酰亚胺基酯或醛，谷胱甘肽，生物素或其他抗生物素蛋白结合分子，抗生物素蛋白，链霉抗生物素，cAMP，磷脂酰肌醇，血红素，cAMP的配体，金属，NTA，并且，在一个实施方案中，包括一种或多种染料，例如，呫吨染料，钙灵敏染料，例如，1-[2-氨基-5-(2，7-二氯-6-羟基-3-氧-9-呫吨基)-苯氧基]-2-(2′-氨基-5′-甲基苯氧基)乙烷-N，N，N′，N′-四乙酸(Fluo-3)，钠灵敏染料，例如，1，3-苯二羧酸，4，4′-[1，4，10，13-四氧杂-7，16-二氮杂环十八烷-7，16-二基二(5-甲氧基-6，2-苯并呋喃二基)]二(PBFI)，NO灵敏染料，例如，4-氨基-5-甲基氨基-2′，7′-二荧光素，或其他荧光团。在一个实施方案中，所述官能团是半抗原或免疫原性分子，即，被特异于该分子的抗体结合的那种。在一个实施方案中，所述官能团不是放射性核素。在另一个实施方案中，所述官能团是放射性核素，例如，³H，¹⁴C，³⁵S，¹²⁵I，¹³¹I，包括有效用于诊断方法中的分子。

用于检测特殊官能团方法在本领域中已知。例如，核酸分子可以通过杂交、扩增、与特异于该核酸分子的核酸结合蛋白的结合、酶测定(例如，如果该核酸分子是核糖核酸酶)检测，或，如果该核酸分子本身包括可检测或能够检测的分子，例如，放射性标签或生物素，则其可以通过适用于该分子的测定法检测。

示范性官能团包括半抗原，例如，有效用于增强免疫原性的分子，诸如匙孔血蓝蛋白(KLH)，可裂解的标签，例如，光致断裂的生物素，和荧光标记，例如，N-羟基琥珀酰亚胺(NHS)修饰的香豆素和琥珀酰亚胺或sulfonosuccinimide修饰的BODIPY(其可以通过UV和/或可见光激发的荧光性检测来检测)，罗丹明，例如，R110，对甲氨基酚，CRG6，德克萨斯甲基红(羧基四甲基罗丹明)，5-羧基-X-罗丹明，或fluoroscein，香豆素衍生物，例如，7氨基香豆素，和7-羟基香豆素，2-氨基-4-甲氧基萘，1-羟基芘，试卤灵，phenalenones或benzphenalenones(美国专利号4,812,409)，吖啶酮(acridinones)(美国专利号4,810,636)，蒽，和α-和β-萘酚的衍生物，氟化呫吨衍生物，包括氟化的荧光素和对甲氨基酚(例如，美国专利号6,162,931)，生物发光分子，例如，荧光素，腔肠素(coelenterazine)，萤光素酶，化学发光分子，例如，稳定化的二氧杂环丁烷，和电化学发光分子。由于与相应的野生型水解酶的底物相连接而与突变水解酶相连接的荧光(或发光)官能团，可以用于在系统中实时感应改变，如磷酸化。而且，荧光分子，诸如金属离子的化学感应剂，例如，Cu²⁺的9-羰基蒽修饰的甘氨酰基-组氨酰基-赖氨酸(GHK)，在本发明的底物中，可以用于标记与该底物结合的蛋白质。发光或荧光官能团诸如BODIPY，罗丹明绿，GFP，或红外染料，也存在作为官能团的用途并可以，例如，用在相互作用的研究中，例如，使用BRET，FRET，LRET或电泳。

另一种类型的官能团是与包含接纳体基团的分子(“亲合”分子)选择性相互作用的分子。因此，包括亲合分子的水解酶底物，由于该亲合分子与另一种分子，例如可以是生物或非-生物来源的接纳体分子的选择性相互作用，可以促进具有所述底物和突变水解酶的复合物的分离。例如，亲合分子与之相互作用的特异性分子(称为接纳体分子)可以是小的有机分子、化学基团诸如巯基基团(-SH)或大生物分子诸如关于亲合分子的抗体或其他天然存在的配体。所述结合通常在自然界中是化学性的，且可以涉及共价或非-共价键或相互作用诸如离子或氢键的形成。所述接纳体分子可以是在溶液中游离的或自身与固体或半-固体表面、聚合物基质或固体或半-固体基底表面上的残基结合。所述相互作用也可以由外部试剂诸如光、温度、压力或添加起催化剂作用的化学或生物学分子触发。发生从反应混合物中检测和/或分离复合物，这是因为亲合分子和接纳体分子之间的相互作用，通常为一种类型的结合。

亲合分子的实例包括分子，诸如免疫原性分子，例如，蛋白质、肽、碳水化合物或脂质的表位，即有效用于制备特异于该分子的抗体的任何分子；生物素，抗生物素蛋白，链霉抗生物素，及其衍生物；金属结合分子；和这些分子的片段和组合。示范性亲合分子包括His5(HHHHH)(SEQ IDNO：3)，HisX6(HHHHHH)(SEQ ID NO：4)，C-myc(EQKLISEEDL)(SEQ IDNO：5)，Flag(DYKDDDDK)(SEQ ID NO：6)，SteptTag(WSHPQFEK)(SEQID NO：7)，HA标记物(YPYDVPDYA)(SEQ ID NO：8)，硫氧还蛋白，纤维素结合结构域，壳多糖结合结构域，S-肽，T7肽，钙调蛋白结合肽，C-末端RNA标记物，金属结合结构域，金属结合反应基，氨基酸反应基，内含肽，生物素，链霉抗生物素，和麦芽糖结合蛋白质。例如，包括生物素的水解酶底物与突变水解酶接触。生物素在突变水解酶和底物之间的复合物中的存在允许复合物与抗生物素蛋白分子，例如包被在表面例如，珠、微孔、硝化纤维等上的链霉抗生物素分子的选择性结合。合适的表面包括用于层析分离的树脂、塑料诸如组织培养表面或结合板、微量滴定皿和珠、陶瓷和玻璃、粒子包含磁性粒子、聚合物和其他基质。例如，用磷酸盐缓冲液(PBS)洗涤处理的表面，从而去除缺乏生物素，并分离包含-生物素的复合物。在一些情形中，这些物质可以是生物分子传感装置，诸如光纤、chemfets、胞质基因检测器的一部分。

亲合分子的另一个实例是丹磺酰赖氨酸。与丹磺酰环相互作用的抗体可商购获得(西格玛化学(Sigma Chemical)St.Louis，MO)或可以使用已知方案诸如在抗体：实验室手册(Antibodies：A Laboratory Manual(Harlow和Lane，1988))中记述的方案而制备。例如，将抗-丹磺酰抗体固定在层析柱的包装基质上。该方法，即亲合柱层析，通过使得本发明的突变水解酶和底物之间的复合物由于其与固定的抗体的相互作用保留在柱中，而其他分子流过柱而实现分离。然后，通过破坏抗体-抗原相互作用释放所述复合物。特异性层析柱材料诸如离子-交换或亲合琼脂糖，聚丙烯酰胺葡聚糖，交联葡聚糖和其他层析树脂可商购获得(西格玛化学(Sigma Chemical)St.Louis，MO；法玛西亚生物技术(Pharmacia Biotech)；Piscataway，N.J.)。丹磺酰赖氨酸可以由于其荧光性质便利地检测。

当使用抗体作为接纳体分子时，分离也可以通过其他的生物化学分离方法，诸如将抗体免疫沉淀和固定到过滤器或其他表面诸如珠、板或树脂上进行。例如，本发明的突变水解酶和底物的复合物可以通过用亲合分子-特异性或水解酶-特异性抗体包被磁珠而分离。珠时常利用磁场从混合物中分离出来。

另一种类型的功能性分子包括可利用电磁辐射检测的分子，且包括但不限于呫吨荧光团，丹磺酰荧光团，香豆素和香豆素衍生物，荧光acridinium部分，基于苯并芘的荧光团，以及7-硝基苯-2-氧杂-1，3-二唑，和3-N-(7-硝基苯-2-氧杂-1，3-二唑-4-基)-2，3-二氨基-丙酸。优选地，所述荧光分子在与天然氨基酸不同的波长处具有荧光性的高量子产率，和更优选地，具有在光谱的可见光或在UV和可见光二者部分激发的荧光性的高量子产率。当在预选的波长处激发时，可以视觉上或使用常规荧光性检测方法检测低浓度的分子。电化学发光分子诸如钌螯合物及其衍生物或硝基氧氨基酸及其衍生物可以在毫微微摩尔范围及以下检测。

在一个实施方案中，任选可检测的官能团包括下列之一：

其中R₁是C₁-C₈。

除荧光分子外，多种具有基于分子对电磁场和辐射的相互作用和响应的物理性质的分子可以用于检测本发明的突变水解酶和底物之间的复合物。这些性质包括电磁谱UV、可见光和红外区的吸收、具有拉曼活性的生色团的存在，并可以进一步通过共振拉曼光谱学、电子自旋共振活性和核磁共振和分子质量，例如通过质谱仪进一步增强。

用于检测和分离具有亲合分子的复合物的方法包括色谱技术，其包括凝胶过滤、快-压或高-压液体色谱、反相色谱、亲合色谱和离子交换色谱法。蛋白质分离的其他方法也有效用于检测及随后分离本发明的突变水解酶和底物之间的复合物，例如电泳、等电聚焦和质谱法。

连接体

术语“连接体”，其也通过符号“L”识别，指将一个或多个官能团共价附着到包含反应基的底物上或反应基上的一个基团或数个基团。连接体，用于本文中时，不是单共价键。连接体的结构不关键，条件是它产生能够被其靶酶结合的底物。在一个实施方案中，连接体可以是二价基团，其将官能团(R)和反应基分开约5埃-约1000埃的长度，包含端点。其他合适的连接体包括将R和反应基分开约5埃-约100埃的连接体，以及将R和底物分开约5埃-约50埃、约5-埃-约25癌、约5埃-约500埃、或约30埃-约100埃的连接体。

在一个实施方案中，所述连接体是氨基酸。

在另一个实施方案中，所述连接体是肽。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代，其中该链中的一个或多个(例如，1，2，3，或4个)碳原子任选地被非-过氧化物-O-，-S-或-NH-替换，且其中该链中的一个或多个(例如，1，2，3，或4份额)碳原被芳基或杂芳基环替换。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代，其中该链中的一个或多个(例如，1，2，3，或4个)碳原子任选地被非-过氧化物-O-，-S-或-NH-替换，且其中该链中的一个或多个(例如，1，2，3，或4个)碳原被一个或多个(例如，1，2，3，或4个)芳基或杂芳基环替换。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代，其中该链中的一个或多个(例如，1，2，3，或4个)碳原子任选地被非-过氧化物-O-，-S-或-NH-替换，且其中该链中的一个或多个(例如，1，2，3，或4个)碳原被一个或多个(例如，1，2，3，或4个)杂芳基环替换。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代，其中该链中的一个或多个(例如，1，2，3，或4个)碳原子任选地被非-过氧化物-O-，-S-或-NH-替换。

在另一个实施方案中，所述连接体是式-W-F-W-的二价基团，其中F是(C₁-C₃₀)烷基，(C₂-C₃₀)链烯基，(C₂-C₃₀)炔基，(C₃-C₈)环烷基，或(C₆-C₁₀)，其中W是-N(Q)C(＝O)-，-C(＝O)N(Q)-，-OC(＝O)-，-C(＝O)O-，-O-，-S-，-S(O)-，-S(O)₂-，-N(Q)-，-C(＝O)-，或直接的键；其中每个Q是独立的H或(C₁-C₆)烷基。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键。

在另一个实施方案中，所述连接体是包括约2-约30个碳原子的二价分支或不分支的碳链。

在另一个实施方案中，所述连接体是包括约2-约20个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代。

在另一个实施方案中，所述连接体是包括约2-约20个碳原子的二价分支或不分支的碳链，所述链任选地包括一个或多个(例如，1，2，3，或4个)双键或三键。

在另一个实施方案中，所述连接体是包括约2-约20个碳原子的二价分支或不分支的碳链。

在另一个实施方案中，所述连接体是-(CH₂CH₂O)-_1-10。

在另一个实施方案中，所述连接体是-C(＝O)NH(CH₂)₃-；-C(＝O)NH(CH₂)₅C(＝O)NH(CH₂)-；-CH₂OC(＝O)NH(CH₂)₂O(CH₂)₂O(CH₂)-；-C(＝O)NH(CH₂)₂O(CH₂)₂O(CH₂)₃-；-CH₂OC(＝O)NH(CH₂)₂O(CH₂)₂O(CH₂)₃-；-(CH₂)₄C(＝O)NH(CH₂)₂O(CH₂)₂O(CH₂)₃-；-C(＝O)NH(CH₂)₅C(＝O)NH(CH₂)₂O(CH₂)₂O(CH₂)₃-。

在另一个实施方案中，所述连接体包括一个或多个二价杂芳基基团。

具体地，(C₁-C₃₀)烷基可以是甲基，乙基，丙基，异丙基，丁基，异-丁基，仲-丁基，戊基，3-戊基，己基，庚基，辛基，壬基，或癸基；(C₃-C₈)环烷基可以是环丙基，环丁基，环戊基，或环己基；(C₂-C₃₀)链烯基可以是乙烯基，烯丙基，1-丙烯基，2-丙烯基，1-丁烯基，2-丁烯基，3-丁烯基，1，-戊烯基，2-戊烯基，3-戊烯基，4-戊烯基，1-己烯基，2-己烯基，3-己烯基，4-己烯基，5-己烯基，庚烯基，辛烯基，壬烯基，或癸烯基；(C₂-C₃₀)炔基可以是乙炔基，1-丙炔基，2-丙炔基，1-丁炔基，2-丁炔基，3-丁炔基，1-戊炔基，2-戊炔基，3-戊炔基，4-戊炔基，1-己炔基，2-己炔基，3-己炔基，4-己炔基，5-己炔基，庚炔基，辛炔基，壬炔基，或癸炔基；(C₆-C₁₀)芳基可以是苯基，茚基，或萘基；和杂芳基可以是呋喃基，咪唑基，三唑基，三嗪基，噁唑基，异噁唑基，噻唑基，异噻唑基，吡唑基，吡咯基，吡嗪基，四唑基，吡啶基，(或其N-氧化物)，噻吩基，嘧啶基(或其N-氧化物)，吲哚基，异喹啉基(或其N-氧化物)或喹啉基(或其N-氧化物)。

术语芳香族包括芳基和杂芳基基团。

芳基表示苯基自由基或具有约9-10个环原子的单边稠合的双环碳环自由基，其中至少一个环是芳香族的。

杂芳基包括通过包含5或6个环原子的单环芳香族环的环碳附着的自由基，所述环由碳和1-4个杂原子组成，其每个选自由非-过氧化物氧、硫、和N(X)组成的组，其中X不存在或是H，O，(C₁-C₄)烷基，苯基或苄基，以及包括源自其的约8-10个环原子单边稠合的双环杂环的自由基，具体地是苯-衍生物或通过向其融合丙烯、亚丙基、或四亚甲基二自由基来源的那种。

术语″氨基酸，″当关于连接体使用时，包括处于D或L形式的天然氨基酸(例如，Ala，Arg，Asn，Asp，Cys，Glu，Gln，Gly，His，Hyl，Hyp，Ile，Leu，Lys，Met，Phe，Pro，Ser，Thr，Trp，Tyr，和Val)，以及非天然氨基酸(例如，磷酸丝氨酸，磷酸苏氨酸，磷酸酪氨酸，羟基脯氨酸，γ-羧基谷氨酸；马尿酸，八氢吲哚-2-羧酸，statine，1，2，3，4，-四氢异喹啉-3-羧酸，青霉胺，鸟氨酸，瓜氨酸，α-甲基-丙氨酸，对-苯甲酰苯丙氨酸，苯基甘氨酸，炔丙基甘氨酸，肌氨酸，和叔-丁基甘氨酸)的残基。该术语还包括带有常规氨基保护基团(例如，乙酰基或苄氧基羰基)的天然和非天然氨基酸，以及在羧基端(例如，如(C₁-C₆)烷基，苯基或苄基酯或酰胺)受保护的天然和非天然氨基酸。其他合适的氨基和羧基保护基团是本领域中那些技术人员已知的(见例如，Greene，有机合成中的保护基团(Protecting groups In Organic Synthesis)；Wiley：纽约，1981，和其中引用的参考文献)。氨基酸可以通过羧基端、氨基端、或通过任何其他方便的附着点，诸如，例如，通过半胱氨酸的硫与另一种分子相连接。

术语“肽”在关于连接体使用时，描述2-25个氨基酸(例如如上文中定义的)或肽基残基的序列。所述序列可以是线性或环形的。例如，可以制备或可以由在序列中2个半胱氨酸残基之间二硫键的形成产生环肽。肽可以通过羧基端、氨基端、或通过任何其他方便的附着点，诸如，例如，通过半胱氨酸的硫与另一种分子相连接。优选地，肽包括3-15，或5-21个氨基酸。可以如美国专利号4,612,302；4,853,371；和4,684,620中公开的，制备肽衍生物。本文中具体叙述的肽序列按氨基端在左和羧基端在右书写。

示范性底物

在一个实施方案中，水解酶底物具有式(I)的化合物：R-连接体-A-X，其中R是一个或多个官能团，其中所述连接体是多原子直链或分支链，包括C，N，S，或O，或包括一个或多个环，例如，饱和或不饱和环，诸如一个或多个芳基环，杂芳基环，或其任意组合的基团，其中A-X是脱卤素酶如卤烷脱卤素酶或裂解脂肪族或芳香族卤化底物中的碳-卤键的脱卤素酶的底物，诸如关于红球菌属(Rhodococcus)、鞘氨醇单胞菌属(Sphingomonas)、葡萄球菌属(Staphylococcus)、假单胞菌属(Pseudomonas)、伯克氏菌属(Burkholderia)、土壤杆菌属(Agrobacterium)或黄色杆菌属(Xanthobacter)脱卤素酶的底物，且其中X是卤素。在一个实施方案中，卤代烷共价附着于连接体L，其是共价附着一个或多个官能团从而形成脱卤素酶底物的一个基团或多个基团。

在一个实施方案中，具有连接体的关于脱卤素酶的本发明底物具有式(I)：

R-连接体-A-X(I)

其中R是一个或多个官能团(诸如荧光团，生物素，发光团，或荧光或发光分子，或是固体支持物，包括微球体，膜，聚合板，玻璃珠，载玻片，等等)，其中所述连接体是多原子直链或分支链，包括C，N，S，或O，其中A-X是脱卤素酶的底物，且其中X是卤素。在一个实施方案中，A-X是脱卤素酶的卤代脂族或卤代芳香族底物。在一个实施方案中，所述连接体是包括约12-约30个碳原子的二价分支的或不分支的碳链，所述链任选地包括一个多个(例如，1，2，3，或4个)双键或三键，且所述链任选地被一个或多个(例如，2，3，或4个)羟基或氧代(＝O)基团取代，其中所述链中的一个或多个(例如，1，2，3，或4个)碳原子任选地被非-过氧化物-O-，-S-或-NH-替换。在一个实施方案中，连接体包括3-30个原子，例如，11-30个原子。在一个实施方案中，连接体包括(CH₂CH₂O)_y且y＝2-8。在一个实施方案中，A是(CH₂)_n且n＝2-10，例如，4-10。在一个实施方案中，A是CH₂CH₂或CH₂CH₂CH₂。在另一个实施方案中，A包括芳基或杂芳基基团。在一个实施方案中，关于脱卤素酶诸如红球菌属脱卤素酶的底物中的连接体是多原子直链或分支链，包括C，N，S，或O，且优选地当官能团R包括芳香族环系统或是固体支持物时，为11-30个原子。

在另一个实施方案中，具有连接体的关于脱卤素酶的本发明底物具有式(II)：

R-连接体-CH₂-CH₂-CH₂-X (II)

其中X是卤素，优选地氯化物。在一个实施方案中，R是一个或多个官能团，诸如荧光团，生物素，发光团，或荧光或发光分子，或是固体支持物，包括微球体，膜，玻璃珠，等等。当R是放射性标记，或小的可检测原子诸如光谱活性的同位素时，所述连接体可以是0-30个原子。

示范性脱卤素酶底物记述在美国公开的申请号2006/0024808和2005/0272114中，将其引入本文作为参考。

示范性方法

本发明提供用于监测细胞中分子表达、位置和/或运输，以及用于监测细胞中微环境变化，例如，以用于成像，鉴定，定位，展示或检测样品中，例如，细胞中可能存在的一种或多种分子，或用于捕获，纯化或分离分子，诸如细胞中的那些的方法，所述方法使用本发明的水解酶底物和突变水解酶。本发明方法中使用的水解酶底物优选地可溶于水性或主要为水性的溶液，包括水和具有大于或等于约6的pH的水溶液。然而，底物的储液，可以在稀释到水溶液或缓冲液中之前溶解在有机溶剂中。优选的有机溶剂是非质子极性溶剂诸如DMSO，DMF，N-甲基吡咯烷酮，丙酮，乙腈，二噁烷，四氢呋喃和其他非羟基、完全水-混合溶剂。待使用的水解酶底物和突变水解酶浓度依赖于实验条件和所需要的结果，例如，为了在合理时间内，以最小背景或不需要的标记获得结果。水解酶底物的浓度典型地在纳摩尔-微摩尔的范围内。对相应的突变水解酶所需的水解酶底物的浓度通过底物中系统变化直至实现满意的标记来确定。起始范围容易由本领域中已知的方法确定。

在一个实施方案中，包括具有光学性质的官能团的底物用于检测细胞分子和具有突变水解酶的融合体的融合配偶体之间的相互作用。所述底物与包括融合片段的目的样品结合一段时间，所述时间足以使融合配偶体结合细胞分子和突变水解酶结合底物，其后，在选择用于激发该官能团光学响应的波长处照射该样品。任选地，洗涤所述样品，从而去除残余的、过量或未结合的底物。在一个实施方案中，所述标记用于通过进一步比较所述光学响应和标准或预期响应而确定样品的特定特征。例如，与底物结合的突变水解酶用于针对它们在样品中的空间和时间分布，监测所述样品的特异性成分。备选地，与底物结合的突变水解酶用于确定或检测某种分子的存在或数量。

与固有性荧光蛋白，例如GFP相反，与荧光底物结合的突变水解酶不需要天然蛋白质结合来保持荧光性。在荧光底物结合后，可以在例如，变性电泳凝胶，例如SDS-PAGE中，或在用有机溶剂，例如低聚甲醛固体的细胞中检测突变水解酶。

可检测的光学响应意指在测试系统中通过直接观察或通过仪器能够察觉到的参数改变或出现。所述可检测的响应包括颜色、荧光性、反射率、化学发光、光极化、光散射、或X-射线散射的改变或出现。典型地，可检测的响应是在荧光性的改变，诸如荧光的强度、激发或发射波长分布，荧光性寿命，荧光极化，或其组合中的改变。可检测的光学响应可以遍及样品或在具有结合突变水解酶的底物的样品的局部部分发生。光学响应与标准或预期响应的程度比较可以用于确定样品是否和以何种程度具有给定的特征。

包括突变水解酶的样品典型地通过被动方式，即通过与底物温育进行标记。然而，任何将底物引入样品的方法，诸如将底物显微注射到细胞或细胞器中，可以用于将底物引入样品。本发明的底物，在使用浓度下，通常对活细胞和其他生物学成分是无毒的。

包括突变水解酶的样品可以在与本发明的底物接触后立即观察。包括突变水解酶或其融合体的样品任选地在标记过程中与其他溶液结合，包括洗涤溶液、透化和/或固定溶液、和包含另外的检测试剂的其他溶液。与底物接触后的洗涤可以提高光学响应的检测，这归因于洗涤后非特异性背景的减少。通过使用较低的标记浓度，可以在不洗涤的条件下获得满意的显现。许多固定剂和固定条件在本领域中已知，包括甲醛、低聚甲醛、福尔马林、戊二醛、冷甲醇和3∶1甲醇∶乙酸。固定典型地用于保持细胞形态学和在研究致病样品时降低生物危害。选择的底物实施方案在细胞中充分保持。按照本领域中通常已知的方法，任选地，在固定后进行或伴随着固定进行透化，诸如用丙酮、乙醇、DMSO或不同去污剂，从而容许本发明的大底物穿过细胞膜。任选地，底物的使用可以与产生可检测响应的另外的检测试剂的使用相结合，这是因为包括突变水解酶或其融合体的样品中存在特异性细胞成分、胞内物质、或细胞条件。当另外的检测试剂具有与底物的那些不同的光谱性质时，多-色应用是可能的。

在与具有带光学性质的官能团的底物结合后或该过程中的任何时刻，用导致可检测光学响应的光波长照射包括突变水解酶或其融合体的样品，并用用于检测光学响应的方法进行观察。尽管一些底物可使用环境光通过比色法检测，但是其他底物通过亲本荧光团的荧光性性质检测。当诸如通过紫外或可见波长发射灯，弧光灯、激光或甚至日光或普通的室内光照射时，底物，包括与互补特异性结合对成员结合的底物，展示出强烈的可见的吸光度以及荧光发射。选择的有效用于照射本发明底物的设备包括，但不限于，手持紫外灯、水银弧光灯、氙气灯、氩激光器、激光二极管、和YAG激光器。这些照射源任选地整合到激光扫描仪、荧光微量板读数器、标准或小荧光计、或色谱检测器中。该比色吸光度或荧光发射任选地通过视觉检查，或通过使用任何下列装置检测：CCD照相机、摄像机、照相胶片、激光扫描装置、荧光计、光二极管、量子计数器、落射荧光显微镜、扫描显微镜、流式细胞仪、荧光微量板读数器，或通过用于扩增信号的设备诸如光电倍增管检测。当利用流式细胞仪、荧光显微镜或荧光计检查包括突变水解酶或其融合体的样品时，该仪器任选地用于区分和辨别包括作为荧光团的官能团的底物和具有可检测的不同光学性质的第二荧光团，典型地通过区分底物的荧光响应和第二荧光团的荧光响应。当利用流式细胞仪检查样品时，样品的检查任选地包括通过使用分类装置基于底物的荧光响应分离样品中的粒子。

示范性突变水解酶和使用那些水解酶的方法

在一个实施方案中，本发明提供第一突变脱卤素酶，其相对于第二突变脱卤素酶包括至少一个氨基酸取代。所述第一和第二突变脱卤素酶与包括一个或多个官能团的脱卤素酶底物形成键，所述键比在相应的野生型脱卤素酶和该底物之间形成的键更稳定。在所述第一突变脱卤素酶中而不在所述第二突变脱卤素酶中的至少一个氨基酸取代，是提高功能性表达或结合动力学的取代。所述第一和第二突变脱卤素酶在这样的残基处或在这样的氨基酸残基处具有至少一个氨基酸取代，所述残基在相应的野生型脱卤素酶中与活化水分子有关，所述活化水分子裂解相应的野生型脱卤素酶和该底物之间形成的键，所述氨基酸残基在野生型脱卤素酶中与底物形成酯中间体。至少一个提高功能性表达或结合动力学的取代位于与SEQ IDNO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，所述第一突变脱卤素酶具有至少2个位于与SEQID NO：1中位置5，11，20，30，32，58，60，65，78，8087，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291和292相对应的位置处的取代。在一个实施方案中，所述第一突变脱卤素酶具有位于与SEQ ID NO：1中位置58，78，87，155，172，224，227，291，或292相对应的位置或其多处位置的取代，和位于与SEQ IDNO：1中位置175，176，272或273相对应的位置或其多处位置的取代。在一个实施方案中，所述第一突变脱卤素酶具有位于与SEQ ID NO：1中58，78，155，172，224，291，或292相对应的位置或其多处位置的取代，和位于与SEQ ID NO：1中位置175，176，272或273相对应的位置或其多处位置的取代。例如，所述第一突变脱卤素酶中处于与位置291相对应的位置处的取代的氨基酸是G、S或Q，或与位置80相对应的位置处的取代氨基酸是Q，N，K或T。在一个实施方案中，所述第二突变脱卤素酶具有位于与位置272相对应的残基处的取代，并且还包括位于与SEQ ID NO：1中位置175，176或273相对应的位置处的一个或多个取代，例如具有SEQ ID NO：18。在一个实施方案中，所述第一或第二突变脱卤素酶的至少一个取代位于野生型脱卤素酶中处在活性位点腔中的氨基酸残基处，并且该残基的一个原子在与野生型脱卤素酶结合的脱卤素酶底物的内。在一个实施方案中，所述第一和第二突变脱卤素酶的至少一个取代位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处，例如，位于与氨基酸残基272相对应的位置的取代的氨基酸是天冬酰胺，谷氨酰胺，苯丙氨酸，甘氨酸或丙氨酸，和任选地位于位置273处的另一个取代。

在一个实施方案中，所述第一突变脱卤素酶还包括目的蛋白，由此产生融合蛋白，例如，可选择的标记蛋白，膜蛋白，胞质蛋白，核内蛋白，结构蛋白，酶，酶底物，受体蛋白，转运蛋白，转录因子，通道蛋白，磷蛋白，激酶，信号传导蛋白，代谢蛋白，线粒体蛋白，受体相关蛋白，核酸结合蛋白，胞外基质蛋白，分泌蛋白，受体配体，血清蛋白，免疫原性蛋白质，荧光蛋白，或具有反应性半胱氨酸的蛋白质。

还提供编码所述第一突变脱卤素酶的分离的多核苷酸。在一个实施方案中，所述分离的多核苷酸编码融合多肽，所述融合多肽包括所述第一突变脱卤素酶和非脱卤素酶多肽。在一个实施方案中，所述第一突变脱卤素酶在非脱卤素酶多肽的C-端。在一个实施方案中，所述融合体在所述第一突变脱卤素酶和非脱卤素酶多肽之间包括具有蛋白酶识别序列的连接体序列，例如，所述连接体序列包括EPTTEDLYFQS/C(SEQ ID NO：31)或EPTTEDLYFQS/CDN(SEQ ID NO：38)。

本发明的突变水解酶有效用于多种方法中。在一个实施方案中，本发明提供用于检测或确定突变水解酶的存在或量的方法。所述方法包括使具有突变水解酶样品与包括一个或多个官能团的水解酶底物相接触，其中突变水解酶相对于相应野生型水解酶包括至少2个氨基酸取代，其中一个氨基酸取代导致所述突变水解酶与底物形成比相应的野生型水解酶和该底物之间形成的键更稳定的键，且位于在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解相应的野生型水解酶和底物之间形成的键，或位于在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。在一个实施方案中，第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶具有位于与SEQ ID NO：1中位置5，11，20，30，32，58，60，65，78，80，87，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291，或292相对应的位置处的多个取代。在一个实施方案中，突变水解酶具有至少一个与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处的取代，例如，其中位于与氨基酸残基272相对应的位置处的取代的氨基酸是天冬酰胺、谷氨酰胺、苯丙氨酸、甘氨酸或丙氨酸。在一个实施方案中，突变水解酶还包括位于与SEQ ID NO：1中位置175，176或273相对应的位置处的一个或多个取代。在一个实施方案中，突变水解酶与相应的野生型水解酶具有至少80％，例如，至少85％的氨基酸序列同一性。检测或确定所述官能团的存在或量，由此检测或确定所述突变水解酶的存在或量。在一个实施方案中，突变水解酶融合于目的分子，例如，目的蛋白。

在一个实施方案中，本发明提供用于标记细胞的方法。所述方法包括使具有包括突变水解酶的细胞的样品与包括一个或多个官能团的水解酶底物相接触，其中所述突变水解酶相对于相应的野生型水解酶包括至少2个氨基酸取代。一个氨基酸取代导致突变水解酶与底物形成比相应的野生型水解酶和该底物之间形成的键更稳定的键，且所述取代位于在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解相应的野生型水解酶和底物之间形成的键，或位于在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶具有位于与SEQ ID NO：1中位置5，11，20，30，32，58，60，65，78，80，87，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291，或292相对应的位置处的多个取代。在一个实施方案中，突变水解酶具有至少一个位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处的取代，例如，其中位于与氨基酸残基272相对应的位置处的取代的氨基酸是天冬酰胺、谷氨酰胺、苯丙氨酸、甘氨酸或丙氨酸。在一个实施方案中，突变水解酶还包括位于与SEQ ID NO：1中位置175，176或273相对应的位置处的一个或多个取代。在一个实施方案中，突变水解酶与相应的野生型水解酶具有至少80％，例如，至少85％的氨基酸序列同一性。然后检测或确定样品中所述官能团的存在或量。在一个实施方案中，所述细胞是细菌细胞。在另一个实施方案中，所述细胞是哺乳动物细胞。在一个实施方案中，突变水解酶融合于目的分子，例如，目的蛋白。

在一个实施方案中，本发明提供用于分离目的蛋白的方法。所述方法包括提供包括一种或多种融合蛋白的样品，至少其中一种融合蛋白包括突变水解酶和目的蛋白，并且提供包括一种或多种水解酶底物的固体支持物。所述突变水解酶相对于相应的野生型水解酶包括至少2个氨基酸取代，其中一个氨基酸取代导致突变水解酶与底物形成比相应的野生型水解酶和该底物之间形成的键更稳定的键，且所述取代位于在相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解相应的野生型水解酶和底物之间形成的键，或位于在相应的野生型水解酶中与底物形成酯中间体的氨基酸残基处。第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。在一个实施方案中，突变水解酶具有位于与SEQ ID NO：1中位置5，11，20，30，32，58，60，65，78，80，87，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291，或292相对应的位置处的多个取代。在一个实施方案中，突变水解酶具有位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处的至少一个取代，例如，其中位于与氨基酸残基272相对应的位置处的取代的氨基酸是天冬酰胺、谷氨酰胺、苯丙氨酸、甘氨酸或丙氨酸。在一个实施方案中，突变水解酶还包括位于与SEQ ID NO：1中位置175，176或273相对应的位置处的一个或多个取代。在一个实施方案中，突变水解酶与相应的野生型水解酶具有至少80％，例如，至少85％的氨基酸序列同一性。所述样品和所述固体支持物相接触，从而分离目的蛋白。在一个实施方案中，目的蛋白与目的分子结合。在一个实施方案中，分离与目的蛋白结合的目的分子。

本发明的方法使用包括水解酶底物的化合物。在一个实施方案中，所述突变水解酶是突变脱卤素酶，且所述底物是式(I)的化合物：R-连接体-A-X，其中R是一个或多个官能团；连接体分开R和A的基团；A-X是脱卤素酶的底物；和X是卤素，例如，Cl或Br。在一个实施方案中，连接体是多原子直链或分支链，其包括C，N，S，或O。在一个实施方案中，连接体是包括约2-约30个碳原子的二价分支的或不分支的碳链，所述链任选地包括一个或多个双键或三键，且所述链任选地被一个或多个羟基或氧代(＝O)基团取代，其中所述链中的一个或多个碳原子任选地被非-过氧化物-O-，-S-或-NH-替换。在一个实施方案中，连接体在所述链中通过至少12个原子分开R和A。在一个实施方案中，所述链中的一个或多个碳原子被芳基或杂芳基环替换。在一个实施方案中，A是(CH₂)_n且n＝2-10或n＝4-10。在一个实施方案中，R包括生物素或其他抗生物素蛋白结合分子，固体支持物，例如，磁性粒子，琼脂糖珠，纤维素珠，载玻片，或多孔板的孔，或荧光团，诸如呫吨，香豆素，色烯，吲哚，异吲哚，唑，BODIPY，BODIPY衍生物，咪唑，嘧啶，噻吩，芘，苯并芘，苯并呋喃，荧光素，罗丹明，对甲氨基酚，phenalenone，acridinone，试卤灵，萘，蒽，acridinium，α-萘酚，β-萘酚，丹磺酰，花青，嗪，硝基苯并噁唑(NBD)，dapoxyl，萘二酰亚胺，苯乙烯基，等。

本发明将进一步通过下列非限制性实施例进行描述。

实施例1

在缺乏融合配偶体的条件下，HT2在大肠杆菌或无细胞系统中的表达是充沛的。然而，当与另一种基因融合时，可溶性和功能性HT2的产量较低，这可能归因于该融合体的两种成分之间的结构不相容性。一般地，当HT2是融合体的C-端成分时，该问题更明显。为了改善突变水解酶诸如在与SEQ ID NO：1中位置272相对应的位置处具有取代的突变脱卤素酶与融合配偶体之间的结构相容性，并且为了改善除具有TMR官能团的那些以外的水解酶底物的相对标记动力学，使用演变的过程。FAM配体用于筛选进一步最优化的突变DhaA，其目的是一些鉴定的突变提供提高的FAM配体动力学。然后，用TMR配体检查候选者，从而确保所述突变基本不改变与该配体的动力学。

形成针对DhaA.H272F H11YL(图4；″HT2，SEQ ID NO：20)的DNA的下列位点-定向的改变，并发现其相对于DhaA.H272F H11YL，提高了在大肠杆菌：D78G，F80S，P291A，和P291G中的功能性表达。

DhaA.H272F H11YL中的密码子80，272，和273处的位点-饱和诱变用于构建包含处于这些位置中每一个的所有可能的氨基酸的文库。该文库在大肠杆菌中过表达，并利用包含脱卤素酶底物(C₃₁H₃₁ClNO₈)的羧基二氢荧光素(FAM)和荧光极化(FP)筛选功能性表达/提高的动力学。筛选的性质容许鉴定具有提供的表达以及提供的动力学的蛋白。具体地，该筛选排除具有较低固有动力学的突变体。具有理想性质的取代包括下列：F80Q，F80N，F80K，F80H，F80T，H272N，H272Y，Y273F，Y273M，和Y273L。其中，Y273F显示提供的固有动力学。

HT2中272处的Phe缺乏与Glu-130形成氢键的能力。认为His-272和Glu-130之间的相互作用起结构作用，并且因此该键的缺乏可以使HT2去稳定化。而且，Phe与位置273处的Tyr-＞Leu变化的接近可以提供来自这些相邻残基的侧链之间的潜在协助性相互作用。在位置273处为Leu或Phe的情形中，确定Asn为位置272处的较好残基。当建模包括Asn-272的HT2结构时，证明1)Asn填充与His相比相似的几何学的空间，和2)Asn可以与Glu-130形成氢键。发现在位置272处具有Asn取代的HT2在大肠杆菌、无细胞系统、和哺乳动物细胞中产生较高水平的功能性蛋白，这可能是提高所述蛋白总稳定性的结果。

两轮诱变PCR用于以1-2氨基酸取代/序列的频率向HT2的整个编码序列中引入突变。该方法容许靶向整个序列，并不依赖于任何HT2结构/功能的现有技术。在第一轮诱变中，在N-端HT2融合的情形中，将Asn-272、Phe-273、和Gly-78固定于作为模板的人源化Renilla萤光素酶。确定6种有益于改善针对FAM配体的FP信号的突变(S58T，A155T，A172T，A224E，P291S，A292T；V2)，并确定除A172T以外的每种取代在大肠杆菌中提供增加的蛋白质产量。然而，A172T变化提供提高的固有动力学。然后组合这6种取代(包括Leu+/-273)，从而提供组合序列(V3/V2)，该序列在与多个配偶体融合且以两种方向融合时，提供显著提高的蛋白质生产和固有标记动力学。

在第二轮诱变中，使用6种不同的模板：V3或V2在C-端与人源化Renilla萤光素酶(RL)、萤火虫萤光素酶、或Id融合。如上进行诱变PCR，将确定为有益于3种配偶体中的至少2种的突变组合，从而提供V6(Leu-273)。在第二轮诱变PCR中，在选择赋予热稳定性的序列的尝试中，利用升高的温度(30℃)诱导蛋白表达。突变DhaA融合体增高的固有结构稳定性可以导致蛋白质更有效的生成。

与理想性质有关的随机突变包括下列：G5C，G5R，D11N，E20K，R30S，G32S，L47V，S58T，R60H，D65Y，Y87F，L88M，A94V，S109A，F113L，K117M，R118H，K124I，C128F，P134H，P136T，Q150H，A151T，A155T，V157I，E160K，A167V，A172T，D187G，K195N，R204S，L221M，A224E，N227E，N227S，N227D，Q231H，A250V，A256D，E257K，K263T，T264A，D277N，I282F，P291S，P291Q，A292T，和A292E。

除以上取代外，确定了在突变DhaA和下游C-端配偶体Renilla荧光素酶之间的连接体序列中的取代。亲本连接体序列(残基294-320)是：QYSGGGGSGGGGSGGGGENLYFQAIEL(SEQ ID NO：19)。在连接体中确定的与提高的FP信号有关的取代是Y295N，G298C，G302D，G304D，G308D，G310D，L313P，L313Q，和A317E。特别地，9种中的5种带负电荷。

除A172T和Y273F(在H272N情形中)外，所有以上取代作为N-端融合，在大肠杆菌中提供提高的功能性表达。然而，A172T和Y273F提高标记的固有动力学。

突变DhaA中具有一般提高的性质的示范性组合的取代是：

DhaA 2.3(V3)：S58T，D78G，A155T，A172T，A224E，F272N，P291S，和A292T。

DhaA 2.4(V4)：S58T，D78G，Y87F，A155T，A172T，A224E，N227D，F272N，Y273F，P291Q，和A292E。

DhaA 2.5(V5)：G32S，S58T，D78G，Y87F，A155T，A172T，A224E，N227D，F272N，P291Q，和A292E。

DhaA 2.6(V6)：L47V，S58T，D78G，Y87F，L88M，C128F，A155T，E160K，A167V，A172T，K195N，A224E，N227D，E257K，T264A，F272N，P291S，和A292T。

DhaA2.6中存在的取代中，除改善固有动力学的A167V以外，全部改善在大肠杆菌中的功能性表达。

图5提供在大肠杆菌中提高的功能性表达的另外的取代。

实施例2

使用V6序列作为C-端处诱变的模板。在Id-V6融合体(V6是C-端配偶体)的情形中，制备包含随机、二-残基延长(尾部)的突变体文库，并用FAM配体筛选。鉴定具有提高的蛋白质生产和较少非-特异性裂解(如通过TMR配体标记和凝胶分析确定地)的突变体。DhaA 2.6(″V6″)中的两个C-端残基被Glu-Ile-Ser-Gly替换，从而产生V7(图8)。作为对Id的N-和C-端两端的融合，将V7的表达与V6进行比较。融合体在大肠杆菌中过表达，并用10μM TMR配体标记完全，然后由SDS-PAGE+荧光成像解析(图6)。数据显示由V7序列形成更多功能性的融合蛋白。另外，关于V7，FAM配体随时间的标记动力学与关于V6的相似(图6)，尽管在测试纯化的非融合蛋白时，V7具有比V6更快的动力学。

V7还表达在兔网织红细胞TNT不含细胞的表达系统中(图7)。用10μM TMR配体标记裂解物至完全，并通过SDS-PAGE+荧光成像分析功能性表达。如在大肠杆菌中的表达，在兔裂解物中，更多功能性蛋白由V7序列的表达产生。V7的表达比SEQ ID NO：20(″HT2″)提高约140--250-倍。相对于麦芽转录/翻译系统中的HT2，V7的表达也提高了(图9)。

为了测试体内标记，用关于HT2，V3，V7和V7F(V7F相对于V7具有单氨基酸差别；V7F在位置273处具有Phe而非Leu)的载体转染HeLa细胞后24小时，用0.2μM TMR配体体内标记细胞5分钟，15分钟，30分钟或2小时。通过SDS-PAGE/荧光成像分析并通过ImageQuant定量样品。V7和V7F导致比HT2和V2更好的功能性表达，且V7、V7F和V3相对于HT2在哺乳动物细胞中具有提高的体内动力学(图10)。

而且，V7作为N-或C-端融合体具有提高的功能性表达(图11)，且在破坏(pull down)测定中比其他突变DhaA更有效。结果显示关于能够利用HaloLink^TM-固定的突变DhaA-Id融合体破坏的MyoD的量，V7＞V6＞V3。V7和V7F具有提高的标记动力学(图13)。具体地，V7F具有比V7快约1.5-约3.0-倍的标记。

图14显示关于不同突变DhaA蛋白的热稳定性数据。该数据是利用纯化的蛋白产生的，并且显示关于热稳定性，V7＞V6＞V7F＞V3＞HT2。例如，在一些条件下(暴露于48℃30分钟)，纯化的V7F失去其活性的50％，而V7仍保持80％活性。当V7和V7F在大肠杆菌中表达并作为裂解物分析时，这二者中间的热稳定性差异更显著。

图15显示暴露于尿素和盐酸胍后的稳定性。

图16-17显示使用两种不同配体对不同DhaA突变体的标记动力学。

图18比较关于两种DhaA突变体对比链霉抗生物素-生物素的标记速率。

图19提供关于包括那些有效用作N-或C-端融合体的不同DhaA突变体的核苷酸和氨基酸序列。注意到这些突变体末端可以接纳包括尾部和连接体序列以及取代的不同序列。例如，突变DhaA的N-端可以是M/GA/SETG(SEQ ID NO：39)，且C-端可以包括取代和添加(“尾部“)，例如，P/S/QA/T/ELQ/EY/I(SEQ ID NO：40)，和任选地SG。例如，该C-端可以是EISG(SEQ ID NO：41)，EI，QY或Q。关于N-载体，N-端可以是MAE，且在C-载体中，N-端序列或突变DhaA可以是GSE或MAE。尾部包括但不限于QY和EISG。

两种蛋白质之间的序列(连接体序列)可以包括由蛋白酶识别的序列。在一个实施方案中，连接体序列可以包括TEV蛋白酶位点(Doherty等，1989)、约4个氨基酸的上游区域(P10-P7)、和约2或3个氨基酸的下游区域(P′2-P′4)。包含TEV位点可以降低重组表达在大肠杆菌中的溶解性(Kurz等，2006)，并可以减少哺乳动物表达(数据未显示)。为了解决该问题，最优化TEB位点，从而在不降低TEV蛋白酶裂解序列能力的条件下，维持在哺乳动物细胞、无细胞表达系统或大肠杆菌中的表达水平。为了增强哺乳动物的表达，在TEV蛋白酶位点中进行下列改变：在P5，N变为D，且在上游区序列中，在P10处，I变为E，P′2D，P′3N和任选地P′4D。这些改变提高TEB裂解，减少在大肠杆菌中的非特异性平截，并提高在哺乳动物细胞和无细胞表达系统中的表达。为了与DhaA突变体一起使用，N-端序列包括EPTT-EDLYFQ(S/C)-DN(SEQ ID NO：38)，且C-端序列包括EPTT-EDLYFQS-DND(SEQ ID NO：50)。这些序列不减少在哺乳动物细胞、无细胞系统、或大肠杆菌细胞中DhaA突变融合蛋白表达的表达或溶解性。这些序列可以与任何融合体一起使用。

按照生产商的建议，利用LT1(Mirus)，将携带p65-HT2，p65-HTv3，p65-HTv6，p65-HTv7和p65-HTv7f的载体引入到涂布在24孔板(每个时间点或配体浓度2个孔)中的HeLa细胞中。转染后24小时，用图20中指出的不同浓度TMR配体(5μM，15分钟)标记细胞一段不同的时间段。洗去未结合的配体，并用SDS-PAGE样品缓冲液收集细胞。将荧光标记的蛋白质在SDS-PAGE上解析，并在荧光成像(Typhoon-9410，安玛西亚(Amersham))上分析。

用p65-HT2，p65-V3，p65-V7，或p65-V7F瞬时转染、裂解并用p65AB和IkB AB探测的HeLa细胞的蛋白质印迹分析显示在图21中。

为了进一步在不同条件下探索突变DhaA的标记动力学，在增高的盐浓度、裂解缓冲液中存在的非去污剂试剂、不同的缓冲剂和不同的去污剂的存在下进行反应(图22-29)。

公开的突变DhaA提供提高的功能性融合蛋白生产，这容许利用与基底或载玻片连接的合适的配体破坏蛋白质-蛋白质相互作用。

预期的取代包括图5中公开的位置处的那些，以及位置147，例如，E147K，位置282，例如，L282M，或位置164，例如，D164E。

参考文献

Ausubel等，现代分子生物学方法(Current Protocols in MolecularBiology)，卷III，A.1(3-4)，增刊38(1997).

Chalfie，M.和Kain，S.R.，编，GFP：绿色荧光蛋白策略和应用(GFP：Green Fluorescent Protein Strategies and Applications)(Wiley，纽约，1998).

Cubitt等，生物化学科学趋势(Trends Biochem.Sci.)，20：448(1995).

Doherty等，病毒学(Virol.)，171：356(1989).

Einbond等，FEBS通信(FEBS Lett.)，384：1(1996).

Farinas等，生物化学杂志(J.Biol.Chem.)，274：7603(1999).

Griffin等，科学(Science)，281：269(1998).

Hanks和Hunter，FASEB杂志(FASEB J)，9：576-595(1995).

Harlow和Lane，在：抗体：实验室手册(Antibodies：A LaboratoryManual)，冷泉港实验室出版社，第726页(1988)

Ilsley等，细胞信号传导(Cell Signaling)，14：183(2002).

Hermanson，生物缀合技术(Bioconjugate Techniques)，学院出版社(Academic Press)，圣地亚哥，CA(1996).

Janssen等，细菌学杂志(J.Bacteriol.)，171：6791(1989).

Keuning等，细菌学杂志(J.Bacteriol.)，163：635(1985).

Kneen等，生物物理杂志(Biophys.J.)，74：1591(1998).

Kulakova等，微生物学(Microbiology)，143：109(1997).

Kurz等，蛋白质表达和纯化(Protein Expression and Purification)，50：68(2006).

Llopis等，美国国家科学院学报(Proc.Natl.Acad.Sci.USA)，95：6803(1998).

Mayer和Baltimore，细胞生物学趋势(Trends Cell.Biol)，3：8(1993).

等，自然(Nature)，394：192(1998).

Mils等，癌基因(Oncogene)，19：1257(2000).

Miyawaki等，自然(Nature)，388：882(1967).

Nagata等，环境微生物学应用(Appl.Environ.Microbiol.)，63：3707(1997).

等，科学(Science)，273：1392(1996).

Rosomer等，生物化学杂志(J.Biol.Chem.)，272：13270(1997).

Sadowski，等，分子细胞生物学(Mol.Cell.Bio.)，6：4396(1986).

Sallis等，遗传学和微生物学杂志(J.Gen.Microbiol.)，136：115(1990).

Scholtz等，细菌学杂志(J.Bacteriol.)，169：5016(1987).

Stroffekova等，欧洲生理学杂志(Eur.J.Physiol.)，442：859(2001).

Tsien，生物化学年度综述(Ann.Rev.Biochem.)，67：509(1998).

Wada等，核酸研究(Nucleic Acids Res.)，18增刊：2367(1990).

Yokota等，细菌学杂志(J.Bacteriol.)，169：4049(1987).

所有公开、专利和专利申请引入本文作为参考。尽管在前述说明书中，是以及关于其某些优选实施方案描述了本发明，且为了举例说明的目的，已经阐述了许多详细信息，但是本领域中的那些技术人员应该清楚的是，本发明可受另外的实施方案的影响，并且本文中的某些详细信息可以在不偏离本发明的基本原则的条件下显著变化。

序列表

<110>普罗梅加公司

阿尔迪斯·达尔津斯

兰斯·P·昂塞尔

雷切尔·弗西德曼·瓦纳

保罗·奥托

格季米纳斯·维杜基里斯

基思·V·伍德

莫妮卡·G·伍德

克里斯·齐默曼

<120>具有增强的动力学和功能性表达的突变水解酶蛋白

<130>341.048US1

<150>US 60/855,237

<151>2006-10-30

<150>US 60/930,201

<151>2007-05-15

<160>73

<170>FastSEQ for Windows Version 4.0

<210>1

<211>293

<212>PRT

<213>紫红红球菌(Rhodococcus rhodochrous)

<400>1

Met Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Lys Cys

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu His

260 265 270

Tyr Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Pro Ala Leu

290

<210>2

<211>7

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA C-端序列

<400>2

Ser Thr Leu Glu Ile Ser Gly

1 5

<210>3

<211>5

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>3

His His His His His

1 5

<210>4

<211>6

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>4

His His His His His His

1 5

<210>5

<211>10

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>5

Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu

1 5 10

<210>6

<211>8

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>6

Asp Tyr Lys Asp Asp Asp Asp Lys

1 5

<210>7

<211>8

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>7

Trp Ser His Pro Gln Phe Glu Lys

1 5

<210>8

<211>9

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>8

Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

1 5

<210>9

<211>5

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>9

Arg Tyr Ile Arg Ser

1 5

<210>10

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>10

Phe His His Thr

1

<210>11

<211>17

<212>PRT

<213>人工序列

<220>

<223>合成的亲合结构域

<400>11

Trp Glu Ala Ala Ala Arg Glu Ala Cys Cys Arg Glu Cys Cys Ala Arg

1 5 10 15

Ala

<210>12

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的突变脱卤素酶

<400>12

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgcta cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgaa ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaattttc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgc aatat 885

<210>13

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的突变脱卤素酶

<400>13

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgcta cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgaa ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaatctgctgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctgtcgacgctgc aatat 885

<210>14

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的突变脱卤素酶

<400>14

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaattttc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg caggagctgc aatat 885

<210>15

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的突变脱卤素酶

<400>15

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatagcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg caggagctgc aatat 885

<210>16

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的突变脱卤素酶

<400>16

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacgt gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt catggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atttatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcaag 480

ctgatcatcg atcagaacgt ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaatcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccaa aagcctgcct 780

aactgcaagg ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgc aatat 885

<210>17

<211>876

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>17

tccgaaatcg gtacaggctt ccccttcgac ccccattatg tggaagtcct gggcgagcgt 60

atgcactacg tcgatgttgg accgcgggat ggcacgcctg tgctgttcct gcacggtaac 120

ccgacctcgt cctacctgtg gcgcaacatc atcccgcatg tagcaccgag tcatcggtgc 180

attgctccag acctgatcgg gatgggaaaa tcggacaaac cagacctcga ttatttcttc 240

gacgaccacg tccgctacct cgatgccttc atcgaagcct tgggtttgga agaggtcgtc 300

ctggtcatcc acgactgggg ctcagctctc ggattccact gggccaagcg caatccggaa 360

cgggtcaaag gtattgcatg tatggaattc atccggccta tcccgacgtg ggacgaatgg 420

ccagaattcg cccgtgagac cttccaggcc ttccggaccg ccgacgtcgg ccgagagttg 480

atcatcgatc agaacgcttt catcgagggt gcgctcccga tgggggtcgt ccgtccgctt 540

acggaggtcg agatggacca ctatcgcgag cccttcctca agcctgttga ccgagagcca 600

ctgtggcgat tccccaacga gctgcccatc gccggtgagc ccgcgaacat cgtcgcgctc 660

gtcgaggcat acatgaactg gctgcaccag tcacctgtcc cgaagttgtt gttctggggc 720

acacccggcg tactgatccc cccggccgaa gccgcgagac ttgccgaaag cctccccaac 780

tgcaagacag tggacatcgg cccgggattg ttcttgctcc aggaagacaa cccggacctt 840

atcggcagtg agatcgcgcg ctggctcccg gcactc 876

<210>18

<211>292

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>18

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Asp Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala Tyr

210 215 220

Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Phe Leu

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Pro Ala Leu

290

<210>19

<211>27

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<400>19

Gln Tyr Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

1 5 10 15

Gly Glu Asn Leu Tyr Phe Gln Ala Ile Glu Leu

20 25

<210>20

<211>943

<212>DNA

<213>人工序列

<220>

<223>合成的HT2序列

<400>20

gctagccagc tggcgcggat atcgccacca tgggatccga aatcggtaca ggcttcccct 60

tcgaccccca ttatgtggaa gtcctgggcg agcgtatgca ctacgtcgat gttggaccgc 120

gggatggcac gcctgtgctg ttcctgcacg gtaacccgac ctcgtcctac ctgtggcgca 180

acatcatccc gcatgtagca ccgagtcatc ggtgcattgc tccagacctg atcgggatgg 240

gaaaatcgga caaaccagac ctcgattatt tcttcgacga ccacgtccgc tacctcgatg 300

ccttcatcga agccttgggt ttggaagagg tcgtcctggt catccacgac tggggctcag 360

ctctcggatt ccactgggcc aagcgcaatc cggaacgggt caaaggtatt gcatgtatgg 420

aattcatccg gcctatcccg acgtgggacg aatggccaga attcgcccgt gagaccttcc 480

aggccttccg gaccgccgac gtcggccgag agttgatcat cgatcagaac gctttcatcg 540

agggtgcgct cccgatgggg gtcgtccgtc cgcttacgga ggtcgagatg gaccactatc 600

gcgagccctt cctcaagcct gttgaccgag agccactgtg gcgattcccc aacgagctgc 660

ccatcgccgg tgagcccgcg aacatcgtcg cgctcgtcga ggcatacatg aactggctgc 720

accagtcacc tgtcccgaag ttgttgttct ggggcacacc cggcgtactg atccccccgg 780

ccgaagccgc gagacttgcc gaaagcctcc ccaactgcaa gacagtggac atcggcccgg 840

gattgttctt gctccaggaa gacaacccgg accttatcgg cagtgagatc gcgcgctggc 900

tccccgggct ggccggctaa tagttaatta agtaggcggc cgc 943

<210>21

<211>301

<212>PRT

<213>人工序列

<220>

<223>合成的HT2序列

<400>21

Met Gly Ser Glu Ile Gly Thr Gly Phe Pro Phe Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His His Tyr Val Asp Val Gly Pro Arg Asp

20 25 30

Gly Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu

35 40 45

Trp Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala

50 55 60

Pro Asp Leu Ile Gly Met Gly Lys Ser Asp Ala Lys Pro Asp Leu Asp

65 70 75 80

Tyr Phe Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala

85 90 95

Leu Gly Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala

100 105 110

Leu Gly Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Val Lys Gly

115 120 125

Ile Ala Cys Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp

130 135 140

Pro Glu Phe Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val

145 150 155 160

Gly Arg Glu Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu

165 170 175

Leu Pro Met Gly Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His

180 185 190

Tyr Arg Glu Pro Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg

195 200 205

Phe Pro Asn Glu Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala

210 215 220

Leu Val Glu Gly Ala Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro

225 230 235 240

Lys Leu Leu Phe Trp Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu

245 250 255

Ala Ala Arg Leu Ala Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile

260 265 270

Gly Pro Gly Leu Phe Leu Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile

275 280 285

Gly Ser Glu Ile Ala Arg Trp Leu Pro Gly Leu Ala Gly

290 295 300

<210>22

<211>295

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>22

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu Gln Tyr

290 295

<210>23

<211>295

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>23

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu Gln Tyr

290 295

<210>24

<211>295

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>24

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Gln Glu Leu Gln Tyr

290 295

<210>25

<211>295

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>25

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Ser

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Gln Glu Leu Gln Tyr

290 295

<210>26

<211>295

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>26

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu Gln Tyr

290 295

<210>27

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>27

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu Glu Ile Ser Gly

290 295

<210>28

<211>16

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<400>28

Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Ser Asp Asn Ala Ile Ala

1 5 10 15

<210>29

<211>17

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<400>29

Val Ser Leu Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Ser Asp Asn

1 5 10 15

Asp

<210>30

<211>879

<212>DNA

<213>人工序列

<220>

<223>合成的突变DhaA序列

<400>30

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gagccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgcta cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccgccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtgcgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag catacatgaa ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaattttc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg ccggcgctg 879

<210>31

<211>11

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<220>

<221>位点

<222>11

<223>Xaa＝S或C

<400>31

Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Xaa

1 5 10

<210>32

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>32

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgcta cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgaa ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaattttc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgc aatat 885

<210>33

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>33

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgcta cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgaa ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgc aatat 885

<210>34

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>34

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaattttc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg caggagctgc aatat 885

<210>35

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>35

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatagcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacct gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt cctggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atgtatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcgag 480

ctgatcatcg atcagaacgc ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaagcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccga aagcctgcct 780

aactgcaaga ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg caggagctgc aatat 885

<210>36

<211>885

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>36

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacgt gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt catggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atttatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcaag 480

ctgatcatcg atcagaacgt ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaatcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccaa aagcctgcct 780

aactgcaagg ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgc aatat 885

<210>37

<211>891

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>37

atggcagaaa tcggtactgg ctttccattc gacccccatt atgtggaagt cctgggcgag 60

cgcatgcact acgtcgatgt tggtccgcgc gatggcaccc ctgtgctgtt cctgcacggt 120

aacccgacct cctcctacgt gtggcgcaac atcatcccgc atgttgcacc gacccatcgc 180

tgcattgctc cagacctgat cggtatgggc aaatccgaca aaccagacct gggttatttc 240

ttcgacgacc acgtccgctt catggatgcc ttcatcgaag ccctgggtct ggaagaggtc 300

gtcctggtca ttcacgactg gggctccgct ctgggtttcc actgggccaa gcgcaatcca 360

gagcgcgtca aaggtattgc atttatggag ttcatccgcc ctatcccgac ctgggacgaa 420

tggccagaat ttgcccgcga gaccttccag gccttccgca ccaccgacgt cggccgcaag 480

ctgatcatcg atcagaacgt ttttatcgag ggtacgctgc cgatgggtgt cgtccgcccg 540

ctgactgaag tcgagatgga ccattaccgc gagccgttcc tgaatcctgt tgaccgcgag 600

ccactgtggc gcttcccaaa cgagctgcca atcgccggtg agccagcgaa catcgtcgcg 660

ctggtcgaag aatacatgga ctggctgcac cagtcccctg tcccgaagct gctgttctgg 720

ggcaccccag gcgttctgat cccaccggcc gaagccgctc gcctggccaa aagcctgcct 780

aactgcaagg ctgtggacat cggcccgggt ctgaatctgc tgcaagaaga caacccggac 840

ctgatcggca gcgagatcgc gcgctggctg tcgacgctgg agatttccgg a 891

<210>38

<211>13

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<220>

<221>位点

<222>11

<223>Xaa＝S或C

<400>38

Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Xaa Asp Asn

1 5 10

<210>39

<211>5

<212>PRT

<213>人工序列

<220>

<223>合成的N-端突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<

220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>39

Xaa Xaa Glu Thr Gly

1 5

<210>40

<211>5

<212>PRT

<213>人工序列

<220>

<223>合成的C-端突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝P，S或Q

<220>

<221>位点

<222>2

<223>Xaa＝A，T或E

<220>

<221>位点

<222>4

<223>Xaa＝Q或E

<220>

<221>位点

<222>5

<223>Xaa＝Y或I

<400>40

Xaa Xaa Leu Xaa Xaa

1 5

<210>41

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的C-端突变DhaA序列

<400>41

Glu Ile Ser Gly

1

<210>42

<211>294

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>42

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn Phe

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Ser Thr Leu Gln Tyr

290

<210>43

<211>294

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>43

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn Leu

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Ser Thr Leu Gln Tyr

290

<210>44

<211>294

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>44

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn Phe

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Gln Glu Leu Gln Tyr

290

<210>45

<211>294

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>45

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Ser Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn Leu

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Gln Glu Leu Gln Tyr

290

<210>46

<211>294

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>46

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys Leu

145 150 155 160

Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Lys

245 250 255

Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn Leu

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Ser Thr Leu Gln Tyr

290

<210>47

<211>296

<212>PRT

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>47

Ser Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu Val

1 5 10 15

Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys Leu

145 150 155 160

Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Lys

245 250 255

Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn Leu

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Ser Thr Leu Glu Ile Ser Gly

290 295

<210>48

<211>48

<212>DNA

<213>人工序列

<220>

<223>合成的连接体序列

<400>48

gagccaacca ctgaggatct gtactttcag agcgataacg cgatcgcc 48

<210>49

<211>50

<212>DNA

<213>人工序列

<220>

<223>合成的连接体序列

<400>49

tttctctcga gccaaccact gaggatctgt actttcagag cgataacgat 50

<210>50

<211>14

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<400>50

Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Ser Asp Asn Asp

1 5 10

<210>51

<211>13

<212>PRT

<213>人工序列

<220>

<223>合成的连接体序列

<400>51

Glu Pro Thr Thr Glu Asp Leu Tyr Phe Gln Ser Asp Asn

1 5 10

<210>52

<211>882

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>52

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcct gggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat ggcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacctgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgctacct ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatg tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcgagctg 480

atcatcgatc agaacgcttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga agcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatgaactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccgaaag cctgcctaac 780

tgcaagactg tggacatcgg cccgggtctg aattttctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgtcg acgctgcaat at 882

<210>53

<211>882

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>53

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcct gggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat ggcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacctgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgctacct ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatg tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcgagctg 480

atcatcgatc agaacgcttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga agcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatgaactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccgaaag cctgcctaac 780

tgcaagactg tggacatcgg cccgggtctg aatctgctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgtcg acgctgcaat at 882

<210>54

<211>882

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>54

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcct gggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat ggcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacctgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgcttcct ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatg tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcgagctg 480

atcatcgatc agaacgcttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga agcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatggactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccgaaag cctgcctaac 780

tgcaagactg tggacatcgg cccgggtctg aattttctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgcag gagctgcaat at 882

<210>55

<211>882

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>55

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcct gggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat agcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacctgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgcttcct ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatg tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcgagctg 480

atcatcgatc agaacgcttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga agcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatggactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccgaaag cctgcctaac 780

tgcaagactg tggacatcgg cccgggtctg aatctgctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgcag gagctgcaat at 882

<210>56

<211>882

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>56

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcct gggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat ggcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacgtgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgcttcat ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatt tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcaagctg 480

atcatcgatc agaacgtttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga atcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatggactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccaaaag cctgcctaac 780

tgcaaggctg tggacatcgg cccgggtctg aatctgctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgtcg acgctgcaat at 882

<210>57

<211>888

<212>DNA

<213>人工序列

<220>

<223>合成的DhaA突变体

<400>57

tccgaaatcg gtactggctt tccattcgac ccccattatg tggaagtcctgggcgagcgc 60

atgcactacg tcgatgttgg tccgcgcgat ggcacccctg tgctgttcct gcacggtaac 120

ccgacctcct cctacgtgtg gcgcaacatc atcccgcatg ttgcaccgac ccatcgctgc 180

attgctccag acctgatcgg tatgggcaaa tccgacaaac cagacctggg ttatttcttc 240

gacgaccacg tccgcttcat ggatgccttc atcgaagccc tgggtctgga agaggtcgtc 300

ctggtcattc acgactgggg ctccgctctg ggtttccact gggccaagcg caatccagag 360

cgcgtcaaag gtattgcatt tatggagttc atccgcccta tcccgacctg ggacgaatgg 420

ccagaatttg cccgcgagac cttccaggcc ttccgcacca ccgacgtcgg ccgcaagctg 480

atcatcgatc agaacgtttt tatcgagggt acgctgccga tgggtgtcgt ccgcccgctg 540

actgaagtcg agatggacca ttaccgcgag ccgttcctga atcctgttga ccgcgagcca 600

ctgtggcgct tcccaaacga gctgccaatc gccggtgagc cagcgaacat cgtcgcgctg 660

gtcgaagaat acatggactg gctgcaccag tcccctgtcc cgaagctgct gttctggggc 720

accccaggcg ttctgatccc accggccgaa gccgctcgcc tggccaaaag cctgcctaac 780

tgcaaggctg tggacatcgg cccgggtctg aatctgctgc aagaagacaa cccggacctg 840

atcggcagcg agatcgcgcg ctggctgtcg acgctggaga tttccgga 888

<210>58

<400>58

000

<210>59

<400>59

000

<210>60

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>60

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu

290

<210>61

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>61

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Thr Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu

290

<210>62

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>62

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Gln Glu Leu

290

<210>63

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>63

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Ser

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Gln Glu Leu

290

<210>64

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>64

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu

290

<210>65

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<400>65

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Thr Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Ser Thr Leu

290

<210>66

<211>296

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>290

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>291

<223>Xaa＝T，E或A

<220>

<221>位点

<222>293

<223>Xaa＝Q或E

<220>

<221>位点

<222>(294)...(294)

<223>Xaa＝y或I

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝G或不存在

<400>66

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly Thr

20 25 30

Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp Arg

35 40 45

Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro Asp

50 55 60

Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe Phe

65 70 75 80

Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly Leu

85 90 95

Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly Phe

100 105 110

His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys Met

115 120 125

Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe Ala

130 135 140

Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu Leu

145 150 155 160

Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly Val

165 170 175

Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro Phe

180 185 190

Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu Leu

195 200 205

Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu Tyr

210 215 220

Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp Gly

225 230 235 240

Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala Glu

245 250 255

Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn Phe

260 265 270

Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg Trp

275 280 285

Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>67

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>291

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>292

<223>Xaa＝T，E或A

<220>

<221>位点

<222>294

<223>Xaa＝Q或E

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝Y或I

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(297)...(297)

<223>Xaa＝G或不存在

<400>67

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>68

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>291

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>292

<223>Xaa＝T，E或A

<220>

<221>位点

<222>294

<223>Xaa＝Q或E

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝Y或I

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(297)...(297)

<223>Xaa＝G或不存在

<400>68

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>69

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>291

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>292

<223>Xaa＝T，E或A

<220>

<221>位点

<222>294

<223>Xaa＝Q或E

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝Y或I

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(297)...(297)

<223>Xaa＝G或不存在

<400>69

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Ser

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>70

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>291

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>292

<223>Xaa＝T，E或A

<220>

<221>位点

<222>294

<223>Xaa＝Q或E

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝Y或I

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(7)...(297)

<223>Xaa＝G或不存在

<400>70

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>71

<211>297

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<220>

<221>位点

<222>1

<223>Xaa＝M或G

<220>

<221>位点

<222>2

<223>Xaa＝A或S

<220>

<221>位点

<222>291

<223>Xaa＝S，Q或P

<220>

<221>位点

<222>292

<223>Xaa＝T，E或A

<220>

<221>位点

<222>294

<223>Xaa＝Q或E

<220>

<221>位点

<222>(295)...(295)

<223>Xaa＝Y或I

<220>

<221>位点

<222>(296)...(296)

<223>Xaa＝S或不存在

<220>

<221>位点

<222>(297)...(297)

<223>Xaa＝G或不存在

<400>71

Xaa Xaa Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Val Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Thr His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Phe Met Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Phe

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Thr Asp Val Gly Arg Lys

145 150 155 160

Leu Ile Ile Asp Gln Asn Val Phe Ile Glu Gly Thr Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Asn Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Glu

210 215 220

Tyr Met Asp Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Lys Ser Leu Pro Asn Cys Lys Ala Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Leu Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Xaa Xaa Leu Xaa Xaa Xaa Xaa

290 295

<210>72

<211>63

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA尾序列

<400>72

Glu Ile Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

1 5 10 15

Gly Glu Asn Leu Tyr Phe Gln Ala Ile Glu Leu Gly Thr Arg Gly Ser

20 25 30

Ser Arg Val Asp Leu Gln Ala Cys Lys Leu Ile Arg Leu Leu Thr Lys

35 40 45

Pro Glu Arg Lys Leu Ser Trp Leu Leu Pro Pro Leu Ser Asn Asn

50 55 60

<210>73

<211>293

<212>PRT

<213>人工序列

<220>

<223>合成的突变DhaA序列

<400>73

Met Ala Glu Ile Gly Thr Gly Phe Pro Phe Asp Pro His Tyr Val Glu

1 5 10 15

Val Leu Gly Glu Arg Met His Tyr Val Asp Val Gly Pro Arg Asp Gly

20 25 30

Thr Pro Val Leu Phe Leu His Gly Asn Pro Thr Ser Ser Tyr Leu Trp

35 40 45

Arg Asn Ile Ile Pro His Val Ala Pro Ser His Arg Cys Ile Ala Pro

50 55 60

Asp Leu Ile Gly Met Gly Lys Ser Asp Lys Pro Asp Leu Gly Tyr Phe

65 70 75 80

Phe Asp Asp His Val Arg Tyr Leu Asp Ala Phe Ile Glu Ala Leu Gly

85 90 95

Leu Glu Glu Val Val Leu Val Ile His Asp Trp Gly Ser Ala Leu Gly

100 105 110

Phe His Trp Ala Lys Arg Asn Pro Glu Arg Val Lys Gly Ile Ala Cys

115 120 125

Met Glu Phe Ile Arg Pro Ile Pro Thr Trp Asp Glu Trp Pro Glu Phe

130 135 140

Ala Arg Glu Thr Phe Gln Ala Phe Arg Thr Ala Asp Val Gly Arg Glu

145 150 155 160

Leu Ile Ile Asp Gln Asn Ala Phe Ile Glu Gly Ala Leu Pro Met Gly

165 170 175

Val Val Arg Pro Leu Thr Glu Val Glu Met Asp His Tyr Arg Glu Pro

180 185 190

Phe Leu Lys Pro Val Asp Arg Glu Pro Leu Trp Arg Phe Pro Asn Glu

195 200 205

Leu Pro Ile Ala Gly Glu Pro Ala Asn Ile Val Ala Leu Val Glu Ala

210 215 220

Tyr Met Asn Trp Leu His Gln Ser Pro Val Pro Lys Leu Leu Phe Trp

225 230 235 240

Gly Thr Pro Gly Val Leu Ile Pro Pro Ala Glu Ala Ala Arg Leu Ala

245 250 255

Glu Ser Leu Pro Asn Cys Lys Thr Val Asp Ile Gly Pro Gly Leu Asn

260 265 270

Phe Leu Gln Glu Asp Asn Pro Asp Leu Ile Gly Ser Glu Ile Ala Arg

275 280 285

Trp Leu Pro Ala Leu

290

Claims

1.第一突变脱卤素酶，其相对于第二突变脱卤素酶包括至少一个氨基酸取代，其中所述第一和第二突变脱卤素酶与包括一个或多个官能团的脱卤素酶底物形成键，所述键比在相应的野生型脱卤素酶和所述底物之间形成的键更稳定，其中在所述第一突变脱卤素酶中而不在所述第二突变脱卤素酶中的至少一个氨基酸取代是提高功能性表达或结合动力学的取代，其中所述第一和第二突变脱卤素酶具有在这样的残基处或在这样的氨基酸残基处的至少一个氨基酸取代，所述残基在所述相应的野生型脱卤素酶中与活化水分子有关，所述活化水分子裂解所述相应的野生型脱卤素酶和所述底物之间形成的键，所述氨基酸残基在所述野生型脱卤素酶中与底物形成酯中间体，并且其中提高功能性表达或结合动力学的所述至少一个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处。

2.权利要求1的第一突变脱卤素酶，其具有位于与SEQ ID NO：1中位置5，11，20，30，32，58，60，65，78，8087，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291和292相对应的位置处的至少2个取代。

3.权利要求1或2的第一突变脱卤素酶，其具有位于与SEQ ID NO：1中位置58，78，87，155，172，224，227，291，292相对应的位置处或其多处的取代，和位于与SEQ ID NO：1中位置175，176，272或273相对应的位置处或其多处的取代。

4.权利要求1或2的第一突变脱卤素酶，其具有位于与SEQ ID NO：1中位置58，78，155，172，224，291，或292相对应的位置处或其多处的取代，和位于与SEQ ID NO：1中位置175，176，272或273相对应的位置处或其多处的取代。

5.权利要求1-4中任一项的第一突变脱卤素酶，其中位于与位置291相对应的位置处的取代的氨基酸是G、S或Q。

6.权利要求1-5中任一项的第一突变脱卤素酶，其具有位于与位置272相对应的残基处的取代，并还包括位于与SEQ ID NO：1中位置175，176或273相对应的位置处的一个或多个取代。

7.权利要求1-6中任一项的第一突变脱卤素酶，其还包括目的蛋白，由此产生融合蛋白。

8.权利要求7的第一突变脱卤素酶，其中所述目的蛋白是选择标记蛋白、膜蛋白、胞质蛋白、核内蛋白、结构蛋白、酶、酶底物、受体蛋白、转运蛋白、转录因子、通道蛋白、磷蛋白、激酶、信号传导蛋白、代谢蛋白、线粒体蛋白、受体相关蛋白、核酸结合蛋白、胞外基质蛋白、分泌蛋白、受体配体、血清蛋白、免疫原性蛋白、荧光蛋白、或具有反应性半胱氨酸的蛋白。

9.权利要求1-8中任一项的第一突变脱卤素酶，其中所述第一和第二突变脱卤素酶中的所述至少一个取代位于与紫红红球菌(Rhodococcusrhodochrous)脱卤素酶的氨基酸残基272相对应的位置处。

10.权利要求9的第一突变脱卤素酶，其中位于与氨基酸残基272相对应的位置处的取代的氨基酸是天冬酰胺、谷氨酰胺、苯丙氨酸、甘氨酸或丙氨酸。

11.权利要求1-10中任一项的第一突变脱卤素酶，其中位于与位置80相对应的位置处的取代的氨基酸是Q、N、K或T。

12.权利要求1-11中任一项的第一突变脱卤素酶，其中所述第一和第二突变脱卤素酶还包括位于位置273处的取代。

13.用于检测或确定突变水解酶的存在或量的方法，其包括：

a)使具有突变水解酶的样品与包括一个或多个官能团的水解酶底物相接触，其中所述突变水解酶相对于相应的野生型水解酶包括至少2个氨基酸取代，其中一个氨基酸取代导致所述突变水解酶与所述底物形成比在所述相应的野生型水解酶和所述底物之间形成的键更稳定的键，且位于在所述相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在所述相应的野生型水解酶和所述底物之间形成的键，或位于在所述相应的野生型水解酶中与所述底物形成酯中间体的氨基酸残基处，且其中第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处；和

b)检测或确定所述官能团的存在或量，由此检测或确定所述突变水解酶的存在或量。

14.用于标记细胞的方法，其包括：

a)使具有包括突变水解酶的细胞的样品与包括一个或多个官能团的水解酶底物相接触，其中所述突变水解酶相对于相应的野生型水解酶包括至少2个氨基酸取代，其中一个氨基酸取代导致所述突变水解酶与所述底物形成比在所述相应的野生型水解酶和所述底物之间形成的键更稳定的键，且所述取代位于在所述相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解在所述相应的野生型水解酶和所述底物之间形成的键，或位于在所述相应的野生型水解酶中与所述底物形成酯中间体的氨基酸残基处，且其中第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处；和

b)检测或确定所述样品中所述官能团的存在或量。

15.权利要求14的方法，其中所述细胞是细菌细胞。

16.权利要求14的方法，其中所述细胞是哺乳动物细胞。

17.权利要求13或14的方法，其中所述突变水解酶与目的蛋白融合。

18.权利要求13或14的方法，其中所述突变水解酶与目的分子融合。

19.分离目的蛋白的方法，其包括：

a)提供包括一种或多种融合蛋白的样品，其中至少一种融合蛋白包括突变水解酶和目的蛋白，并且提供包括一种或多种水解酶底物的固体支持物，其中所述突变水解酶相对于相应的野生型水解酶包括至少2个氨基酸取代，其中一个氨基酸取代导致所述突变水解酶与所述底物形成比所述相应的野生型水解酶和所述底物之间形成的键更稳定的键，且所述取代位于在所述相应的野生型水解酶中与活化水分子有关的氨基酸残基处，所述活化水分子裂解所述相应的野生型水解酶和所述底物之间形成的键，或位于在所述相应的野生型水解酶中与所述底物形成酯中间体的氨基酸残基处，且其中第二个取代位于与SEQ ID NO：1中位置5，11，20，30，32，47，58，60，65，78，80，87，88，94，109，113，117，118，124，128，134，136，150，151，155，157，160，167，172，187，195，204，221，224，227，231，250，256，257，263，264，277，282，291或292相对应的位置处；和

b)使所述样品与所述固体支持物相接触，从而分离所述目的蛋白。

20.权利要求19的方法，其中所述目的蛋白与目的分子结合。

21.权利要求20的方法，其中所述目的分子是分离的。

22.权利要求13-18中任一项的方法，其中所述突变水解酶是突变脱卤素酶，且其中所述底物是式(I)的化合物：R-连接体-A-X，其中所述连接体是包括2-30个碳原子的分支的或不分支的碳链，所述链任选地包括一个或多个双键或三键，且所述链任选地被一个或多个羟基或氧代(＝O)基团取代，其中所述链中的一个或多个碳原子任选地被非-过氧化物-O-，-S-或-NH-替换，其中所述连接体-A通过所述碳链中的至少11个原子分开R和X，其中A-X是脱卤素酶的底物，其中A是(CH₂)_n且n＝2-10，其中X是卤素，R-连接体-A-X，且其中R是一个或多个官能团。

23.权利要求22的方法，其中R包括光学检测分子。

24.权利要求23的方法，取自R包括荧光团或生物素。

25.权利要求19-21中任一项的方法，其中所述底物是式(I)的化合物：固体支持物-连接体-A-X，其中所述连接体是包括2-30个碳原子的分支的或不分支的碳链，所述链任选地包括一个或多个双键或三键，且所述链任选地被一个或多个羟基或氧代(＝O)基团取代，其中所述链中的一个或多个碳原子任选地被非-过氧化物-O-，-S-或-NH-替换，其中所述连接体-A通过所述碳链中的至少11个原子分开R和X，其中A-X是脱卤素酶的底物，其中A是(CH₂)_n且n＝2-10，其中X是卤素，R-连接体-A-X。

26.权利要求25的方法，其中所述固体支持物是磁性粒子、琼脂糖珠、纤维素珠、载玻片、或多孔板的孔。

27.权利要求22-26中任一项的方法，其中所述链中一个或多个碳原子被芳基或杂芳基环替换。

28.权利要求22-27中任一项的方法，其中X是氯或溴。

29.权利要求13-28中任一项的方法，其中所述突变水解酶具有位于与SEQ ID NO：1中位置5，11，20，30，32，58，60，65，78，80，87，94，109，113，117，118，124，134，136，150，151，155，157，172，187，204，221，224，227，231，250，256，263，277，282，291，或292相对应的位置处的多个取代。

30.权利要求29的方法，其中所述突变水解酶还包括位于与SEQ IDNO：1中位置175，176或273相对应的位置处的一个或多个取代。

31.权利要求13-30中任一项的方法，其中所述突变水解酶与所述相应的野生型水解酶具有至少80％的氨基酸序列同一性。

32.权利要求13-31中任一项的方法，其中所述突变水解酶具有位于与紫红红球菌脱卤素酶的氨基酸残基272相对应的位置处的至少一个取代。

33.权利要求32的方法，其中位于与氨基酸残基272相对应的位置处的取代的氨基酸是天冬酰胺、谷氨酰胺、苯丙氨酸、甘氨酸或丙氨酸。

34.权利要求13-33中任一项的方法，其中所述突变水解酶还包括位于位置273处的取代。

35.编码权利要求1-12中任一项的第一突变脱卤素酶的多核苷酸。

36.编码包括权利要求1-12中任一项的第一突变脱卤素酶和非脱卤素酶多肽的融合多肽的多核苷酸。

37.权利要求36的多核苷酸，其中所述融合体在所述第一突变脱卤素酶和非脱卤素酶多肽之间包括具有蛋白酶识别序列的连接体序列。

38.权利要求37的多核苷酸，其中所述第一突变脱卤素酶在所述非脱卤素酶多肽的C-端。

39.权利要求37的多核苷酸，其中所述连接体序列包括EPTTEDLYFQS/C(SEQ ID NO：31)或EPTTEDLYFQSDN(SEQ ID NO：51)。

40.具有权利要求35-39中任一项的多核苷酸的宿主细胞。

41.包括编码EPTTEDLYFQS/C(SEQ ID NO：31)的核苷酸序列的多核苷酸。

42.权利要求41的多核苷酸，其中所述核苷酸序列还编码与EPTTEDLYFQS/C(SEQ ID NO：31)融合的多肽。

43.权利要求41的多核苷酸，其中所述核苷酸序列还编码与EPTTEDLYFQSDN(SEQ ID NO：51)融合的多肽。