CN103827298A

CN103827298A - 脂肪酶变体及其编码多核苷酸

Info

Publication number: CN103827298A
Application number: CN201280045174.9A
Authority: CN
Inventors: W.贝森马特; A.斯文德森; J.B.兰内斯; C.杰克尔
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2011-07-15
Filing date: 2012-07-03
Publication date: 2014-05-28
Also published as: WO2013010783A1; EP2732033A1

Abstract

本发明涉及具有改进的酰胺-键反应中的活性的脂肪酶变体、编码所述变体的多核苷酸、产生所述变体的方法，以及使用所述变体的方法。

Description

脂肪酶变体及其编码多核苷酸

涉及序列表

本申请包含计算机可读形式的序列表，其通过提述并入本文。

发明背景

技术领域

本发明涉及具有改进的酰胺-键反应中的活性的脂肪酶变体、编码所述变体的多核苷酸、产生所述变体的方法，以及使用所述变体的方法。更具体地，本发明涉及与南极假丝酵母(Candida antarctica)脂肪酶B(CALB)具有至少60%同源性的修饰酶，其与相应的未修饰酶相比具有改进的酰胺-键反应中的活性。

相关技术的描述

脂肪酶(三酰基甘油水解酶，EC3.1.1.3)是催化脂肪酸酯(甘油三酯)水解的丝氨酸水解酶。它们具有宽的底物特异性，可接受结构差异巨大的多种酯、醇、和羧酸作为底物。脂肪酶不催化或者难以催化酰胺的水解，这部分可以用酰胺的反应性比酯更低来解释(Bruice,P.Y.(1998)Organic Chemistry,678)。然而，已经有少数关于脂肪酶水解酰胺的报道公开：Duarte DE.,Castillo E.,Bárzana E.,&López-Munguía A.(2000)Biotechnol Lett.,22,1811-1814公开了来自南极假丝酵母的脂肪酶B对辣椒素，一种天然水不溶性酰胺的水解。Henke E.&Bornscheuer U.T.(2003)Anal Chem.,75,255-260描述了一种用于高通量测定酰胺水解的荧光测定法，其被用来评估22种未修饰的脂肪酶和酯酶，以及筛选15000种通过易错PCR和其他随机诱变方法生成的突变体。该定向进化实验未揭示阳性结果，即新的酰胺酶活性。

在另一项定向进化实验中，Fujii R.,Nakagawa Y.,Hiratake J.,Sogabe A.,&Sakata K.(2005)Protein Eng Des Sel.,18,93-101针对通过易错PCR随机产生的20000个铜绿假单胞菌脂肪酶突变体筛选改进的酰胺水解，发现了3个突变，即F207S,A213D和F265L，可影响酰胺酶/酯酶活性比。Nakagawa Y.,Hasegawa A.,Hiratake J.&Sakata K.(2007)Protein Eng Des Sel.,20,339-346描述了这项工作的后续进展，其中他们突变了铜绿假单胞菌脂肪酶以寻求更高的酰胺酶活性，并显示三重突变体F207S+A213D+M252F，而非残基M16或H83的取代，产生酰胺酶活性的增加。该项研究还试图进一步揭示为什么不水解酰胺，尽管其与能够水解酰胺的丝氨酸蛋白酶有某些相似性。二者都含有催化一个三联体，其由Ser-His-Asp/Glu以及一个氧阴离子孔构成。但是二者也有相当大的差异，表现在丝氨酸蛋白酶与铜绿假单胞菌脂肪酶之间少于30%的序列同一性。铜绿假单胞菌脂肪酶和南极假丝酵母脂肪酶B享有的序列同一性小于30%。南极假丝酵母脂肪酶B已经是有机化学中一种确立的工具，尤其是用于酯-键反应，即酯的水解和合成以及酯交换反应。

因此，理想的是产生也能够用于催化酰胺的切割(水解)和形成的脂肪酶。本发明提供在酰胺-键反应中与亲本脂肪酶相比具有改进的活性的脂肪酶变体。

发明内容

本发明涉及亲本脂肪酶的变体，所述变体是：(a)与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽；(b).由在低严格条件下与(i)SEQ IDNO:1的成熟多肽编码序列、或(ii)(i)的全长互补物杂交的多核苷酸所编码的多肽；(c)由与SEQ ID NO:1的成熟多肽编码序列、或编码SEQ ID NO:2的成熟多肽的序列具有至少60%同一性的多核苷酸所编码的多肽；或(d)SEQ IDNO:2的成熟多肽的片段，其中所述变体相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性。

本发明涉及在对应于SEQ ID NO:2的成熟多肽的S31R/K;G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;7P38H/N/A/G;G41P/S;A132;N79;Q106;和/或L140R/K/H中的一个或多个位置上包含取代的变体。

本发明还涉及编码所述变体的多核苷酸；包含所述多核苷酸的核酸构建体、载体和宿主细胞；以及产生所述变体的方法。

本发明还涉及使用这些脂肪酶变体催化酰胺-键反应的方法。

附图简要说明

图1显示脂肪酶氨基酸序列的比对。

定义

酰胺-键反应中的活性：术语“酰胺-键反应中的活性”意指酰胺键的形成或裂解(永久性的或暂时性的)，包括但不限于酰胺合成、酰胺水解、醇解、氨解、酰胺交换、酸解、转酰基(transacylation)、酰基转移(acyl transfer)、以及这些反应的逆反应。为本发明的目的，酰胺-键反应中的活性是根据实施例中描述的程序测定的。在一个方面，本发明的变体与亲本脂肪酶，例如SEQ IDNO:2的成熟多肽相比，具有改进的酰胺-键反应中的活性。

酰胺酶：术语“酰胺酶”意指催化酰胺水解的酶。

酯酶：术语“酯酶”意指在水的存在下催化酯水解成酸和醇的酶。

脂肪酶：术语“脂肪酶”意指催化脂质的水解或形成的酶。为本发明的目的，术语“脂肪酶”还包括任何与SEQ ID NO:2的氨基酸残基1-317有至少60%同源性的酶，无论其酶分类为何。

活性位点残基：术语“活性位点残基”指任何与底物、转化状态或产物直接接触的残基(或骨架部分)。

等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列的步骤加工包括剪接，然后作为成熟的已剪接的mRNA出现。

编码序列：术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定，所述开读框通常以起始密码子如ATG、GTG或TTG开始，并且以终止密码子例如TAA、TAG或TGA结束。编码序列可以是DNA、cDNA、合成的DNA，或它们的组合。

调控序列(control sequence)：术语“调控序列”意指包括对编码本发明变体的多核苷酸表达是必需的所有成分。每个调控序列对于编码所述变体的核苷酸序列可以是天然的或外源的，或每个调控序列对于彼此可以是天然(即来自相同基因)的或外源的(即来自不同基因)。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少，调控序列包括启动子和转录和翻译的终止信号。调控序列可以具备用于引入可促进调控序列与编码变体的核苷酸序列编码区的连接的特异性限制位点的接头。

表达：术语“表达”包括涉及变体产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语“表达载体”意指线性的或环状的DNA分子，其包含编码变体的多核苷酸，并且所述多核苷酸与帮助其表达的控制序列可操作地连接。

片段：术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽；其中所述片段具有改进的酰胺-键反应中的活性。

高严格条件：术语“高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在65℃将载体材料最终洗涤三次，每次15分钟。

宿主细胞：术语“宿主细胞”意指任何适合于使用包含本发明多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的细胞类型。术语“宿主细胞”涵盖亲本细胞的由于在复制过程中发生的突变而不与亲本细胞完全相同的后代。

改进的性质：术语“改进的性质”意指变体的相比于亲本有所改进的相关性质。这样的改进的性质涉及增加的酰胺-键反应中的活性，且包括但不限于：催化效率、催化速率(catalytic rate)、转换数(turnover number)、比活性、底物结合、底物裂解(substrate cleavage)、底物特异性、和产物释放。

分离的：术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(1)任何非天然存在的物质，(2)任何至少部分地与一种或多种或所有与其天然伴随的天然存在的成分分开的物质，包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子；(3)任何这样的物质：相对于在自然界存在的该物质，其经过人工修饰；或(4)任何这样的物质：该物质经过增加该物质相对于与其自然伴随的其他成分的量的修饰(例如，宿主细胞中编码该物质的基因的多重拷贝；和与编码该物质的基因自然结合的启动子更强的启动子的使用)。分离的物质可以存在于发酵液样品中。

低严格条件：术语“低严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在50℃将载体材料最终洗涤三次，每次15分钟。

成熟多肽：术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽，所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面，成熟多肽为SEQ ID NO:2的氨基酸1-317。本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有改进的酰胺-键反应中的活性的成熟多肽的多核苷酸。在一个方面，成熟多肽编码序列是SEQ ID NO:1的核苷酸76至1026。

中等严格条件：术语“中等严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在55℃将载体材料最终洗涤三次，每次15分钟。

中等-高严格条件：术语“中等-高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在60℃将载体材料最终洗涤三次，每次15分钟。

突变体：术语“突变体”意指编码变体的多核苷酸。

核酸构建体：术语“核酸构建体”意指单链或双链的核酸分子，所述核酸分子分离自天然存在的基因，或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段，或所述核酸分子是合成的，包含一个或多个调控序列。

可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中调控序列被置于相对于多核苷酸序列的编码序列的适当位置，使得该调控序列指导该编码序列的表达。

亲本或亲本脂肪酶：术语“亲本”或“亲本脂肪酶”意指被施加取代以产生本发明的脂肪酶变体的脂肪酶。亲本可以是天然存在的(野生型)多肽或其变体或片段。

序列同一性：参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Riceet al.,2000,Trends Genet.16:276-277)(优选5.0.0版或更新版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的可选参数为缺口开启罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为百分比同一性，并计算如下：

(同样的残基×100)/(比对长度-比对中缺口的总数)

就本发明而言，两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite，Rice等，2000，见上文)(优选5.0.0版或更新版本)的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，见上文)来测定。使用的可选参数为缺口开启罚分10，缺口延伸罚分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性，并计算如下：

(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)

亚序列：术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如几个)核苷酸的多核苷酸；其中所述亚序列编码具有改进的酰胺-键反应中的活性的片段。

变体：术语“变体”意指在一个或多个(例如几个)位置包含取代的、具有改进的酰胺-键反应中的活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代。本发明的变体与亲本脂肪酶相比具有改进的酰胺-键反应中的活性。

非常高严格条件：术语“非常高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在70℃将载体材料最终洗涤三次，每次15分钟。

非常低严格条件：术语“非常低严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在45℃将载体材料最终洗涤三次，每次15分钟。

野生型：术语“野生型”意指由天然存在的生物体，例如自然界中出现的细菌、古细菌、酵母、真菌、植物或动物所表达的多肽。

变体指称规则

为本发明的目的，使用SEQ ID NO:2中公开的成熟多肽来确定另一脂肪酶中的相应氨基酸残基。将另一脂肪酶的氨基酸序列与SEQ ID NO:2中公开的成熟多肽对齐，并基于该比对，使用如EMBOSS程序包(EMBOSS:The EuropeanMolecular Biology Open Software Suite,Rice et al.,2000,Trends Genet.16:276-277)，优选5.0.0或更新的版本中的Needle程序所实现的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来确定与SEQ ID NO:2中公开的成熟多肽中的任何氨基酸残基对应的氨基酸位置编号。所用的参数为缺口开启罚分10、缺口延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。

对另一脂肪酶中的对应氨基酸残基的指认可以通过使用几种计算机程序，以其各自的缺省参数进行多个多肽序列的比对来确定，所述计算机程序包括但不限于MUSCLE(基于log-期望的多重序列比较；3.5或更新版本；Edgar,2004,Nucleic Acids Research 32:1792-1797),MAFFT(6.857或更新版本；Katoh and Kuma,2002,Nucleic Acids Research30:3059-3066;Katoh et al.,2005,Nucleic Acids Research33:511-518;Katoh and Toh,2007,Bioinformatics23:372-374;Katoh et al.,2009,Methods in Molecular Biology537:39-64;Katohand Toh,2010,Bioinformatics26:1899-1900),和使用ClustalW的EMBOSSEMMA(1.83或更新版本;Thompson et al.,1994,Nucleic Acids Research 22:4673-4680)。

当所述另一种酶与SEQ ID NO:2的成熟多肽已经分歧到如此程度，以至于传统的基于序列的比较无法检测出它们的关系时(Lindahl and Elofsson,2000,J.Mol.Biol.295:613-615)，可以使用其他逐对的序列比较算法(pairwisesequence comparison)。当其它酶与SEQ IDΝ0:27的成熟多肽差异较大从而传统的基于序列的比较不能检测它们之间的关系时(Lindahl和Elofsson,2000，J.Mol.Biol.295:613-615)，可以使用其它逐对序列比较算法。使用利用多肽家族(谱)的概率代表搜索数据库的搜索程序，可在基于序列的搜索中获得更高的灵敏度。例如，PSI-BLAST程序通过迭代的数据库搜索过程产生谱，并且能检测关系较远的同源物(Atschul等，1997，Nucleic Acids Res.25:3389-3402)。如果多肽家族或超家族在蛋白质结构数据库中有一个或多个代表，则可以实现甚至更高的灵敏度。程序如GenTHREADER(Jones,1999,J.Mol.Biol.287:797-815;McGuffin and Jones,2003,Bioinformatics19:874-881)利用来自多种来源的信息(PSI-BLAST，二级结构预测，结构比对谱，和溶解势)作为神经网络的输入，所述网络可预测所查询序列的结构折叠。类似地，可以使用Gough et al.,2000,J.Mol.Biol.313:903-919的方法比对未知结构的序列与SCOP数据库中存在的超家族模型。然后可以使用这些比对结果产生多肽的同源性模型，并且可以使用专门开发的多种工具评价这类模型的精确度。

对于已知结构的蛋白质，有几种工具和资源可用于获取和产生结构比对。例如，已经比对了蛋白质的SCOP超家族的结构，并且这些比对结果是可以访问和下载的。可以使用多种算法，如距离比对矩阵(Holm和Sander,1998，Proteins 33:88-96)或组合延伸(Shindyalov和Bourne,1998,Protein Eng.11:739-747)比对两个或更多个蛋白质的结构，并且执行这些算法还能用于查询具有目的结构的结构数据库以发现可能的结构同源物(例如，Holm和Park,2000,Bioinformatics16:566-567)。

在描述本发明的变体时，为便于提述，采用下述命名法。在所有情况下，应用公认的IUPAC单字母或三字母氨基酸缩写。

取代.对于氨基酸取代，使用下述命名法：原始氨基酸、位置、取代氨基酸。因此，在位置226用丙氨酸取代苏氨酸表示为“Thr226Ala”或“Τ226Α”。

多个取代.多个突变用加号(“+”)分隔，例如，“Arg170Tyr+Gly195Glu”或“R170Y+G195E”，代表在位置170和195的突变，分别用酪氨酸取代精氨酸，和用谷氨酸取代甘氨酸。

不同的取代.当在一个位置可以引入不同的改变时，不同的改变用逗号分隔，例如，“Arg170Tyr,Glu”，或者用斜线分隔，例如“R170Y/E”，代表在位置170用酪氨酸或谷氨酸取代精氨酸。因此，“Tyr167Gly,Ala+Arg170Gly,Ala”或“Y167G/A+R170G/A”分别表示下述变体：

“Tyr167Gly+Arg170Gly”,“Tyr167Gly+Arg170Ala”,“Tyr167Ala+Arg170Gly”,和“Tyr167Ala+Arg170Ala”或“Y167G+R170G”,“Y167G+R170A”,“Y167A+R170G”和“Y167A+R170A”。

发明详述

改进的酰胺-键反应中的活性

与亲本酶相比，本发明涉及变体对至少一种底物中的至少一个选定的酰胺键的活性的改进。因此，具备改进的酰胺-键反应中的活性的酶可以用于许多目的，例如在胺和酰胺是关键中间体和产物的生物催化、有机合成和分析中，例如在药物和杀虫剂合成、分析和降解中，水解(例如保护基团的除去、残余物的降解)，醇解，氨解，酸解，酰胺形成，酰胺交换反应，酰胺、胺、羧酸、酯和醇的外消旋拆分，对不希望的酰胺的降解，例如对土壤、表面、食品和饲料的净化；从中间产品去除天然产生的酰胺，对含有酰胺的产品的改性。对于任何使用此类生物催化剂的工业用途，增加酰胺-键反应中的活性都可能是理想的。

底物和产物

底物或产物可以是任何包含酰胺-键的化合物。实例包括但不限于N-异丙基-丁酰胺(N-propyl-butyramide)，2-氯-N-乙基-乙酰胺(2-chloro-N-ethyl-acetamide)、2-溴-N-癸基-乙酰胺(2-bromo-N-decyl-acetamide)、N-[3-(二甲基氨基)-丙基]-月桂酰胺(N-[3-(dimethylamino)-propyl]-lauramide))、对-硝基苯基-酰胺(p-nitrophenyl-amides)，例如对-硝基苯基-乙酰胺(=对-硝基乙酰苯胺)，对-硝基苯基-丁酰胺、N-(2-萘基)-酰胺(N-(2-naphthyl)-amides)，例如N-(2-萘基)油酰胺(N-(2-naphthyl)-oleamide)、4-硝基-N-丙基-苯甲酰胺(4-nitro-N-propyl-benzamide)。进一步的例子是结构如下的化合物：

其中任何R基团可为氢(H)或另一已知在有机化合物中出现的残基。

这些底物示例包括，但不限于N-苄基氯乙酰胺(=2-氯-N-苄基-乙酰胺)、N-苄基-丁酰胺、N-苄基癸酰胺、N-苄基苯甲酰胺、2,2,2-三氟-N-[α-甲基-苄基]-乙酰胺、2,2-二氯-N-(1-苯乙基)-乙酰胺、N-(1-苯乙基)辛酰胺、N-(1-苯乙基)-2-甲氧基乙酰胺、N-[1-(4-甲基苯基)-乙基]-辛酰胺、N-[1-(4-氯苯基)-乙基]-2-甲氧基乙酰胺、N-[1-(4-苯氧基苯基)-乙基]-辛酰胺、N-[1-(萘-2-基)-乙基]-乙酰胺、N-[1{二环[2.2.1]庚烷-1-基}-乙基)-辛酰胺、辣椒素(=8-甲基-N-香草基反式-6-壬烯酰胺)，氟丁酰草胺(beflubutamid)(=(RS)-N-苄基-2(α,α,α,4-四氟-间-甲苯氧基)-丁酰胺)，苄草胺(benzipram)(=N-苄基-N-异丙基-3,5-二甲基苯甲酰胺)、溴丁酰草胺(bromobutide)(=(RS)-2-2-溴-3,3-二甲基-N-(1-甲基-1-苯基乙基)-丁酰胺)，牧草胺(tebutam)(=N-苄基-N-异丙基-2,2-二甲基丙酰胺),ε-氨基己酰基-对-氯苯甲酰胺、N-乙酰普鲁卡因胺(N-acetyl-procainamide)、3-(4-羟基苯基)-N-苄基-丙酰胺、N,N′-二苄基-邻苯二甲酰胺。

催化三联体附近的改变

在脂肪酶的活性位点中有三个氨基酸：一个丝氨酸(S)、一个组氨酸(H)和一个天冬氨酸(D)/谷氨酸(E)，形成催化三联体。SEQ ID NO:2的催化三联体是(constitute)残基S105、D187和H224。

可以修改亲本脂肪酶的氨基酸序列中位于距离催化三联体中的任何残基或

以内的至少一个氨基酸残基，改变含有该催化三联体的口袋的几何条件和/或通过静电场影响该催化三联体。

这样位于距SEQ ID NO:2的至少一个催化三联体残基

以内的氨基酸残基为：G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38；G41；A132；N79；Q106;和L140。位于距SEQ ID NO:2的S105

以内的氨基酸残基为：G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；P38；G41；A132；N79；和Q106。位于距SEQ ID NO:2的D187

以内的氨基酸残基为：A225；L278；W104；D223；I189；Q191；D134；E188；V221；A132；Q106；和L140。位于距SEQ ID NO:2的H224

以内的氨基酸残基为：G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134;E188；V221；P38；G41；A132；Q106;和L140。

这样位于距SEQ ID NO:2的至少一个催化三联体残基

以内的氨基酸残基为：G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134;E188；V221；P38；G41；A132；Q106；和L140。位于距SEQ ID NO:2的S105

以内的氨基酸残基为G39；A225；T103；W104；T42；I189；D134;P38；G41；A132；和Q106。位于距SEQ ID NO:2的D187

以内的氨基酸残基为A225；W104；D223；I189；Q191；D134；E188；V221；A132；和L140。位于距SEQ ID NO:2的H224以内的氨基酸残基为G39；A225；L278；W104；D223；I189；Q191；D134;E188；A132；和Q106。

这样位于距SEQ ID NO:2的至少一个催化三联体残基

以内的氨基酸残基为：G39；A225；T103；L278；W104；D223；I189；Q191；D134；E188；P38；A132；Q106；和L140。位于距SEQ ID NO:2的S105

以内的氨基酸残基为G39；T103；W104；I189；D134；P38；A132；和Q106。位于距SEQ ID NO:2的D187

以内的氨基酸残基为D223；I189；Q191；E188；A132；和L140。位于距SEQ ID NO:2的H224

以内的氨基酸残基为A225；L278；W104；D223；I189；E188；A132；和Q106。

本发明涉及分离的脂肪酶变体，其在对应于SEQ ID NO:2的成熟多肽的位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中的一个或多个(例如几个)位置上包含取代，其中该变体具有改进的酰胺-键反应中的活性。

本发明在某些实施方案中涉及这样的变体，其中所述变体包含至少一个氨基酸残基的取代，所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基

以内的位置，所述位置选自：G39；A225；T103V/S/A；L278G/K/R/H；W104Y/K/R；T42G/S/Q/H/I/L/M；D223G/N/A/V/H；I189；Q191；D134V/T/I/F/A/S/K/R;E188；V221A/R/K/H；P38H/N/A/G；G41P/S；A132；N79；Q106；L140R/K/H。

本发明在某些实施方案中涉及这样的变体，其中所述取代为：G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;N79V/Q/E;或Q106N/Y。

本发明在某些实施方案中涉及这样的变体，其中所述变体还包含至少一个氨基酸残基的取代，所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基

以内的位置，所述位置选自：T103G；L278A/V；W104F/Q；T42N/V/A;D134L;G41A。

本发明在某些实施方案中涉及这样的变体，其中所述变体包含至少一个氨基酸残基的取代，所述氨基酸残基对应于SEQ ID NO:2中位于距离催化三联体中的至少一个氨基酸残基以内的位置，所述位置选自：G39；A225；T103V/S/A；L278G/K/R/H；W104Y/K/R；T42G/S/Q/H/I/L/M；D223G/N/A/V/H；I189；Q191；D134V/T/I/F/A/S/K/R;E188；V221A/R/K/H；P38H/N/A/G；G41P/S；A132；Q106；L140R/K/H。

本发明在某些实施方案中涉及这样的变体，其中所述取代为：G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;或Q106N/Y。

以内的位置，所述位置选自：G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188；P38H/N/A/G;A132;Q106;L140R/K/H。

以内的位置，所述位置选自：T103G；L278A/V；W104F/Q;D134L。

本发明在某些实施方案中涉及这样的变体，其相比于亲本脂肪酶包含导致活性位点口袋的几何条件(即体积或形状)的变化的至少一个氨基酸残基的取代。这可以提供底物、过渡态或活性位点口袋残基的改善的结合或更好的朝向。

本发明在某些实施方案中涉及一种变体，其中所述变体包含至少一个对应于SEQ ID NO:2中选自下列的位置的氨基酸残基的取代：G39；A225；T103V/S/A；L278G；W104Y/K/R；T42G/S/Q/H/I/L/M；D223G/N/A/V/H；I189；Q191；D134V/T/I/F/A/S/K/R;E188；V221A/R/K/H；P38H/N/A/G；G41P/S；A132；N79；Q106。

本发明在某些实施方案中涉及这样的变体，其中所述变体还包含至少一个对应于SEQ ID NO:2中选自下列的位置的氨基酸残基的取代：T103G；L278A/V；W104F/Q；T42N/V/A;D134L;G41A。

本发明在某些实施方案中涉及一种变体，其与亲本脂肪酶相比，包含至少一个氨基酸残基的导致该残基更带正电的取代，即带负电的残基被取代为中性或带正电的残基，而中性残基被取代为带正电的残基。不意在限定，认为向更带正电的变化可通过静电场影响至少一个催化三联体残基。

本发明在某些实施方案中涉及一种变体，其中所述变体包含至少一个氨基酸残基的取代，所述氨基酸残基对应于SEQ ID NO:2中选自下列的位置：A225；L278K/R/H；W104K/R；T42H；D223G/N/A/V/H；I189；Q191；D134V/T/I/F/A/S/K/R;E188；V221R/K/H；P38；A132；Q106；和L140R/K/H。

本发明在某些实施方案中涉及这样的变体，其中所述取代为：A225K/R/H;I189R/K/H;Q191R/K/H;E188Q/R/N/K/H/A;A132H/K/R;和Q106N/Y。

本发明在某些实施方案中涉及这样的变体，其中所述变体还包含对应于SEQ ID NO:2中的位置的至少一个氨基酸残基的取代，其选自：D134L。

本发明在某些实施方案中涉及这样的变体，其包含两个或更多个(几个)氨基酸残基的取代，所述取代影响活性位点口袋的几何条件，即体积或形状，和/或活性位点残基的电荷。本发明在某些实施方案中涉及这样的变体，其中至少一个影响几何条件的取代与至少一个影响活性位点残基电荷的取代组合。

在一个方面，所述变体具有改进的酰胺-键反应中的活性，并且与亲本脂肪酶有至少60%、例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。在一个方面，所述变体的氨基酸序列与亲本脂肪酶相差至多20个氨基酸，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸。

亲本脂肪酶

亲本多肽，即亲本脂肪酶可以获自任何属的生物体。为本发明的目的，本文中结合给定来源使用的术语“获自”的意思应为：由多核苷酸编码的亲本多肽是由该来源产生的，或者是由已插入了来自该来源的所述多核苷酸的细胞所产生的。在一个方面，亲本多肽是胞外分泌的。

亲本多肽可以是真菌多肽。在一个方面，所述亲本多肽是真菌多肽例如南极假丝酵母脂肪酶B、Hyphozyma sp.脂肪酶、玉米黑粉菌(Ustilago maydis)脂肪酶、丝孢堆黑粉菌(Sporisorium reilianum)脂肪酶或Cryptococcustsukubaensis(Pseudozyma tsukubaensis)脂肪酶多肽。应当理解，对于上述物种，本发明包括完全状态和不完全状态，以及其他分类学上的等同物，例如无性型，而无论这些物种已知的名称如何。本领域技术人员将容易识别合适的等同物的身份。

在一个方面，亲本多肽组成为，或包含与选自下组的脂肪酶具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%，或100%同一性的氨基酸序列：南极假丝酵母脂肪酶B(SEQ ID No:2),Hyphozyma sp.脂肪酶(SEQ ID No:3),玉米黑粉菌脂肪酶(SEQ ID No:4),Sporisorium reilianum脂肪酶,SEQ ID No:5),和Cryptococcus tsukubaensis(Pseudozyma tsukubaensis)脂肪酶(SEQ ID No:6)。

亲本脂肪酶可以是(a)与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽；(b)由在低严格条件下与(i)SEQ ID NO:1的成熟多肽编码序列、或(ii)(i)的全长互补物杂交的多核苷酸所编码的多肽；或(c)由与SEQ ID NO:1的成熟多肽编码序列具有至少60%同一性的多核苷酸所编码的多肽。

表1：脂肪酶氨基酸序列

在一个方面，所述亲本多肽具有与SEQ ID No:2-6中的任何多肽相差少于20个氨基酸，少于19个氨基酸，少于18个氨基酸，少于17个氨基酸，少于16个氨基酸，少于15个氨基酸，少于14个氨基酸，少于13个氨基酸，少于12个氨基酸，少于11个氨基酸，少于10个氨基酸，少于9个氨基酸，少于8个氨基酸，少于7个氨基酸，少于6个氨基酸，少于5个氨基酸，少于4个氨基酸，少于3个氨基酸，少于2个氨基酸，或相差0个氨基酸的氨基酸序列。

除了20种标准氨基酸，非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。可以用有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸来取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上可获得的，包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸，和3,3-二甲基脯氨酸。

在一个方面，亲本多肽组成为或包含SEQ ID NO:2-6中的任一氨基酸序列，其等位变体或其片段。在一个方面，亲本多肽组成为或包含SEQ ID NO:2-6之任一的成熟多肽。在另一个方面，亲本多肽组成为或包含选自下组的氨基酸：SEQ ID No:2的氨基酸1至317；SEQ ID No:3的氨基酸1至319；SEQID No:4的氨基酸1至336；SEQ ID No:5的氨基酸1至341；SEQ ID No:6的氨基酸1至316；其等位变体及其片段。

SEQ ID NO:2-6中任一者的多肽或成熟多肽的等位变体是由等位变体(即基因的占据同一染色体座位的两种或更多中可选形式)编码的多肽。

SEQ ID NO:2-6中任一者的多肽或成熟多肽的片段是从该氨基酸序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽。优选地，片段含有至少100个氨基酸残基、至少125个氨基酸残基、至少150个氨基酸残基、至少175个氨基酸残基、至少180个氨基酸残基、至少190个氨基酸残基、至少200个氨基酸残基、至少210个氨基酸残基、至少220个氨基酸残基或至少230个氨基酸残基。片段可由100至450个氨基酸组成，例如由150至450、175至400、200至350、225至325、或250至300个氨基酸组成。在一个方面，所述亲本多肽组成为或包含SEQ ID NO:2的氨基酸残基34至277、或氨基酸残基39至54。

SEQ ID NO:1的成熟多肽编码序列或其同源物的亚序列是已有一个或多个(几个)核苷酸从5’和/或3’末端缺失的核苷酸序列。优选的，亚序列含有至少300个核苷酸、至少375个核苷酸、至少450个核苷酸、至少525个核苷酸、至少540个核苷酸、至少570个核苷酸、至少600个核苷酸、至少630个核苷酸、至少660个核苷酸、或至少690个核苷酸。

SEQ ID NO:1的多核苷酸或其亚序列、以及SEQ ID NO:2的氨基酸序列或其片段可以用来设计核酸探针来从不同属或种的株根据本领域公知的方法鉴定和克隆编码亲本多肽的DNA。特别地，此类探针可以用来依照标准Southern印迹程序与感兴趣的属或种的基因组或cDNA杂交，以鉴定并分离其中的相应基因。这样的探针可以显著短于完整序列，但长度应该为至少14个，例如至少25,至少35,或至少70个核苷酸。优选地，核酸探针长度为至少100个核苷酸，例如长度为至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸，或至少900个核苷酸。DNA和RNA探针都可以使用。探针通常进行标记(例如用³²P、³H、³⁵S、生物素、或亲和素标记)以检测对应的基因。本发明涵盖此类探针。

可从自此类其他生物中制备的基因组DNA或cDNA文库筛选与上述探针杂交并编码亲本的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术分离来自此类其他生物的基因组或其他DNA。可将来自所述文库的DNA或分离的DNA转移到硝化纤维或其他合适载体材料上并固定在其上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA，将载体材料用于Southern印迹法。

就本发明目的而言，杂交指所述多核苷酸在低严格条件至非常高严格条件下杂交到对应于(i)SEQ ID NO:1；(ii)SEQ ID NO:1的成熟多肽编码序列；(iii)其全长互补物；或(iv)其亚序列的标记核苷酸探针上。与所述探针杂交的分子可以使用例如X射线胶片或本领域已知的任何其他检测手段进行检测。

在一个方面，所述核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一个方面，所述核酸探针是SEQ ID NO:1的核苷酸76至1026。在另一个方面，所述核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列，或其亚序列。

就长度为至少100个核苷酸的长探针而言，非常低至非常高的严格条件定义为在42℃，在5X SSPE，0.3%SDS，200微克/mL剪切变性鲑精DNA，以及25%甲酰胺(非常低和低严格条件)、35%甲酰胺(中等和中-高严格条件)或50%甲酰胺(高和非常高严格条件)中预杂交和杂交，按照标准Southern印迹程序进行12至24小时(最适)。

就长度为至少100个核苷酸的长探针而言，最后用2X SSC，0.2%SDS优选地在45℃(非常低严格条件)，50℃(低严格条件)，55℃(中等严格条件)，60℃(中-高严格条件)，65℃(高严格条件)，70℃(非常高严格条件)洗涤载体材料三次，每次15分钟。

就长度为约15个核苷酸至约70个核苷酸的短探针而言，严格条件定义为在比根据Bolton和McCarthy(1962,Proc.Natl.Acad.Sci.USA 48:1390)的算法计算出的T_m低约5℃至约10℃，在0.9M NaCl，0.09M Tris-HCl pH7.6，6mM EDTA，0.5%NP-40,1X Denhardt溶液，1mM焦磷酸钠，1mM磷酸二氢钠，0.1mMATP，以及0.2mg酵母RNA每毫升中预杂交、杂交、以及杂交后洗涤，按照标准Southern印迹程序进行12-24小时(最适)。

就长度为约15个核苷酸至约70个核苷酸的短探针而言，最后将载体材料在6X SCC加0.1%SDS中洗涤一次，时间15分钟，并且用6X SSC洗涤两次，每次15分钟，洗涤温度为低于计算出的T_m5℃至10℃。

在第三个方面，亲本多肽是由这样的多核苷酸编码的，所述多核苷酸包含或组成为与SEQ ID NO:1的成熟多肽编码序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%，或100%的同一性程度的核苷酸序列。在一个方面，所述成熟多肽编码序列是SEQ ID NO:1的核苷酸76-1026。

在另一个方面，所述亲本是由与(i)SEQ ID NO:1的成熟多肽编码序列，或(ii)(i)的全长互补物(Sambrook,Fritsch,and Maniatis,1989,MolecularCloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)在非常低严格条件、低严格条件、中等严格条件、中-高严格条件、高严格条件、或非常高严格条件下杂交的多核苷酸所编码的。

所述亲本可以是融合多肽或可切割的融合多肽，其中将另一个多肽融合到本发明多肽的N末端或C末端。通过将编码另一个多肽的多核苷酸融合于编码本发明多肽的多核苷酸序列来产生融合的多肽。产生融合多肽的技术是本领域已知的，包括连接编码多肽的编码序列以使它们符合读框，并且使融合多肽的表达在相同启动子和终止子的控制下。还可以使用蛋白质内含子(Cooper et al.,1993,EMBO J.12:2575-2583;Dawson et al.,1994,Science 266:776-779)技术来构建融合多肽，使得融合在翻译后形成。

融合多肽还可以在两个多肽之间包括切割位点。融合蛋白一旦被分泌，所述位点就被切割，释放这两个多肽。切割位点的实例包括，但不限于，Martin etal.,2003,J.Ind.Microbiol.Biotechnol.3:568-576;Svetina et al.,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson et al.,1997,Appl.Environ.Microbiol.63:3488-3493;Ward et al.,1995,Biotechnology13:498-503;and Contreras et al.,1991,Biotechnology9:378-381;Eaton et al.,1986,Biochemistry25:505-512;Collins-Racie et al.,1995,Biotechnology13:982-987;Carter et al.,1989,Proteins:Structure,Function,and Genetics6:240-248;及Stevens,2003,DrugDiscovery World4:35-48中公开的位点。

可以使用上述的探针从其它来源鉴定和获得所述亲本，所述来源包括从自然界(例如，土壤、堆肥、水等)分离的微生物或直接从天然材料(例如，土壤、堆肥、水等)获得的DNA样品。用于从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过类似地筛选另一种微生物的基因组或cDNA文库或混合的DNA样品来获得编码所述亲本的多核苷酸。一旦用探针检测到编码亲本的多核苷酸，就能够通过使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见，例如，Sambrook,1989,同上)。

变体

本发明提供脂肪酶变体，其在对应于SEQ ID No:2的位置S31;G39;A225;T103;L278;W104;T42;D223;I189;Q191;D134E188;V221;P38H;G41;A132;N79;Q106;和L140的一个或多个(例如几个)位置上包含突变，其中所述变体具有改进的酰胺-键反应中的活性。

在一个实施方案中，所述变体与亲本脂肪酶的氨基酸序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在另一个实施方案中，所述变体与SEQ ID NO:2的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。在一个实施方案中，所述变体与SEQ ID NO:2的氨基酸序列34-277具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。在一个实施方案中，所述变体与SEQ ID NO:2的氨基酸序列38-254具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在另一个实施方案中，所述变体与SEQ ID NO:3的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在另一个实施方案中，所述变体与SEQ ID NO:4的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在另一个实施方案中，所述变体与SEQ ID NO:5的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在另一个实施方案中，所述变体与SEQ ID NO:6的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%，例如至少96%、至少97%、至少98%、或至少99%、但小于100%的序列同一性。

在一个方面，本发明的变体中的取代的数目为1-20,1-10,1-5,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20个改变。

在另一个方面，变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140的一个或多个(例如几个)位置包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的两个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的三个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的四个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的五个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的六个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的七个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的八个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的九个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十一个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十二个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十三个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十四个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十五个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十六个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十七个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中任意位置的十八个位置上包含取代。在另一个方面，所述变体在对应于位置S31；G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38H；G41；A132；N79；Q106；和L140中每一位置的位置上均包含取代。

在另一个方面，所述变体在或者仅在对应于位置S31的位置上包含取代(comprises or consists of a substitution at a position corresponding to positionS31)。在另一个方面，在对应于位置S31的位置上的氨基酸被取代为Arg。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代S31R或S31K。

在另一个方面，所述变体在或者仅在对应于位置G39的位置上包含取代。在另一个方面，在对应于位置G39的位置上的氨基酸被取代为Ala。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代G39A。

在另一个方面，所述变体在或者仅在对应于位置A225的位置上包含取代。在另一个方面，在对应于位置A225的位置上的氨基酸被取代为Ile、Val、Leu、Met、Lys、Arg、Ser、Thr、Gly、或His。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代A225I、A225V、A225L、A225M、A225K、A225R、A225S、A225T、A225G、或A225H。

在另一个方面，所述变体在或者仅在对应于位置T103的位置上包含取代。在另一个方面，在对应于位置T103的位置上的氨基酸被取代为Ala、Ser、或Val。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代T103V、T103S、或T103A。

在另一个方面，所述变体在或者仅在对应于位置L278的位置上包含取代。在另一个方面，在对应于位置L278的位置上的氨基酸被取代为Arg、Gly、His、或Lys。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代L278G、L278K、L278R、或L278H。

在另一个方面，所述变体在或者仅在对应于位置W104的位置上包含取代。在另一个方面，在对应于位置W104的位置上的氨基酸被取代为Arg、Lys、或Tyr。在另一个方面，所述变体包含或仅包含取代W104Y、W104K、或W104R。

在另一个方面，所述变体在或者仅在对应于位置T42的位置上包含取代。在另一个方面，在对应于位置T42的位置上的氨基酸被取代为Gln、Gly、His、Ile、Leu、Met、或Ser。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代T42G、T42S、T42Q、T42H、T42I、T42L、或T42M。

在另一个方面，所述变体在或者仅在对应于位置D223的位置上包含取代。在另一个方面，在对应于位置D223的位置上的氨基酸被取代为Ala、Asn、Gly、His、或Val。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代D223G、D223N、D223A、D223V、或D223H。

在另一个方面，所述变体在或者仅在对应于位置I189的位置上包含取代。在另一个方面，在对应于位置I189的位置上的氨基酸被取代为Ala、Arg、Asn、Gln、Glu、His、Lys、Ser、Thr、或Val。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代I189Y、I189H、I189Q、I189N、I189R、I189K、I189A、I189E、I189S、I189T、或I189G。

在另一个方面，所述变体在或者仅在对应于位置Q191的位置上包含取代。在另一个方面，在对应于位置Q191的位置上的氨基酸被取代为Asn、Ala、Arg、Lys、或His。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代Q191N、Q191A、Q191R、Q191K、或Q191H。

在另一个方面，所述变体在或者仅在对应于位置D134的位置上包含取代。在另一个方面，在对应于位置D134的位置上的氨基酸被取代为Ala、Arg、Ile、Lys、Phe、Ser、Thr、或Val。在另一个方面，所述变体包含或仅包含SEQID NO:2的成熟多肽的取代D134V、D134T、D134I、D134F、D134A、D134S、D134K、或D134R。

在另一个方面，所述变体在或者仅在对应于位置E188的位置上包含取代。在另一个方面，在对应于位置E188的位置上的氨基酸被取代为Gln、Arg、Asp、Asn、Lys、His、或Ala。在另一个方面，所述变体包含或仅包含SEQ IDNO:2的成熟多肽的取代E188Q、E188R、E188D、E188N、E188K、E188H、或E188A。

在另一个方面，所述变体在或者仅在对应于位置V221的位置上包含取代。在另一个方面，在对应于位置V221的位置上的氨基酸被取代为Ala、Arg、His、或Lys。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代V221A、V221R、V221K、或V221H。

在另一个方面，所述变体在或者仅在对应于位置P38的位置上包含取代。在另一个方面，在对应于位置P38的位置上的氨基酸被取代为Ala、Asn、Gly、或His。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代P38H、P38N、P38A、或P38G。

在另一个方面，所述变体在或者仅在对应于位置G41的位置上包含取代。在另一个方面，在对应于位置G41的位置上的氨基酸被取代为Pro、或Ser。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代G41P、或G41S。

在另一个方面，所述变体在或者仅在对应于位置A132的位置上包含取代。在另一个方面，在对应于位置A132的位置上的氨基酸被取代为Ser、Asn、Gly、His、Lys、或Arg。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代A132S、A132N、A132G、A132H、A132K、或A132R。

在另一个方面，所述变体在或者仅在对应于位置N79的位置上包含取代。在另一个方面，在对应于位置N79的位置上的氨基酸被取代为Val、Gln、或Glu。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代N79V、N79Q、或N79E。

在另一个方面，所述变体在或者仅在对应于位置Q106的位置上包含取代。在另一个方面，在对应于Q106的位置上的氨基酸被取代为Asn或Tyr。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代Q106N、或Q106Y。

在另一个方面，所述变体在或者仅在对应于位置L140的位置上包含取代。在另一个方面，在对应于位置L140的位置上的氨基酸被取代为Arg、His、或Lys。在另一个方面，所述变体包含或仅包含SEQ ID NO:2的成熟多肽的取代L140R、L140K、或L140H。

在另一个方面，所述变体包含或仅包含下表2所示的对应于SEQ ID NO:2中位置的氨基酸残基序列的如下任何组合：

表2:对应于SEQ ID NO:2中位置的氨基酸残基的取代

所述变体可以在一个或多个(例如几个)其他位置进一步包含一个或多个额外的改变。

氨基酸改变可能是次要性的(of a minor nature)，即不显著影响蛋白质的折叠和/或活性的保守的氨基酸取代、缺失或插入；小的缺失，通常为1-30个氨基酸；小的氨基或羧基末端延伸，如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill，1979，于The Proteins,Academic Press,New York中描述。常见的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly。

在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的催化效率。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的催化速率。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的比活性。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的底物结合。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的底物裂解。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的底物特异性。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的产物释放。在一个实施方案中，所述变体相比于亲本脂肪酶具有改进的转换数。

变体的制备

本发明还涉及用于获得具有改进的酰胺-键反应中活性的变体的方法，包括：(a)向亲本脂肪酶的一个或多个(例如几个)位置导入取代，所述位置对应于SEQ ID NO:2的成熟多肽的位置S31;G39；A225；T103；L278；W104；T42；D223；I189；Q191；D134；E188；V221；P38；G41；A132；N79；Q106；和L140，其中所述变体具有改进的酰胺-键反应中的活性；和(b)回收该变体。

所述变体可以使用本领域已知的任何诱变程序来制备，例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组、增变株、物理和化学诱变原(例如UV光、离子化辐照、亚硝酸、羟胺)，等等。

定点诱变是其中在编码亲本的多核苷酸中的一个或多个确定位点上制造一个或多个(几个)突变的技术。定点诱变能在体外通过PCR完成，所述PCR涉及使用包含期望诱变的寡核苷酸引物。定点诱变也能在体外通过盒诱变进行，所述盒诱变涉及限制性酶在包含编码亲本的多核苷酸中的某个位点上切割，以及随后包含该多核苷酸中的突变的寡核苷酸。通常消化质粒和寡核苷酸的限制性酶是相同的，使得质粒的粘性末端和插入序列的粘性末端能够彼此连接。参见例如Scherer and Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton et al.,1990,Nucleic Acids Res.18:7349-4966。定点诱变也可以通过本领域已知的方法在体内实现。参见例如美国专利申请公布第2004/0171154号；Storici et al.,2001,Nature Biotechnol.19:773-776;Kren et al.,1998,Nat.Med.4:285-290;以及Calissano and Macino,1996,Fungal Genet.Newslett.43:15-16。任何定点诱变程序都能够用于本发明。有多种商业试剂盒可用来制备变体。

合成基因构建涉及在体外合成设计为编码目标多肽分子的多核苷酸分子。基因合成可使用多种技术进行，如由Tian等所述基于多通道微芯片(multiplex microchip-based)的技术(Tian，et.al.，Nature432：1050-1054)，以及类似的技术，其中合成寡核苷酸并在可用光编程(photo-programmable)的微流芯片(microfluidic chip)上组装。

可使用已知的诱变、重组、和/或改组方法制造并测试单个或多个氨基酸取代、缺失、和/或插入，随后进行相关的筛选程序，例如那些由以下文献公开的程序：Reidhaar-Olson and Sauer,1988,Science241:53-57;Bowie andSauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或WO95/22625。可用的其他方法包括易错PCR、噬菌体展示(Lowman et al.,1991,Biochemistry30:10832-10837;美国专利5,223,409;WO92/06204)和区域定向诱变(Derbyshire et al.,1986,Gene46:145;Ner et al.,1988,DNA 7:127)。

诱变/改组方法可与高通量自动化筛选方法组合使用以检测由宿主细胞表达的经克隆的经诱变多肽的活性(Ness et al.,1999,Nature Biotechnology 17:893-896)。编码活性多肽的经诱变DNA分子可从宿主细胞中回收并使用本领域的标准方法快速测序。通过这些方法可以迅速确定各别氨基酸残基在多肽中的重要性。

半合成基因构建可通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组等方面组合而达成。典型的半合成构建是将合成的多核苷酸片段与PCR技术组合使用的方法。例如，基因中的确定区域可从头合成，另外的区域可使用定点诱变引物扩增，再另外的其他区域可进行易错PCR或非易错PCR扩增。多核苷酸亚序列可随后进行改组。

多核苷酸

本发明还涉及编码本发明变体的分离的多核苷酸。

核酸构建体

本发明还涉及核酸构建体，其包含与一种或多种(几种)调控序列可操作地连接的、编码本发明的变体的多核苷酸，所述调控序列指导所述编码序列在合适的宿主中在与所述调控序列相容的条件下表达。

可以用许多方式操作多核苷酸以便为变体的表达提供条件。依赖于表达载体，在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

调控序列可为启动子，其是被用于表达编码多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子含有介导变体的表达的转录控制序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA基因(Agaisse and Lereclus,1994,Molecular Microbiology 13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon et al.,1988,Gene 69:301-315)、天蓝链霉菌琼脂酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedingsof the National Academy of Sciences USA75:3727-3731)，以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA 80:21-25)。另外的启动子在"Useful proteinsfrom recombinant bacteria"于Gilbert等,1980,Scientific American,242:74-94中；和Sambrook等,1989,见上文中描述。串联启动子的例子公开于WO99/43835。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、以及NA2-tpi启动子(一种来自曲霉属中性α-淀粉酶基因的修饰的启动子，其中的非翻译前导序列已被来自曲霉属丙糖磷酸异构酶的基因的非翻译前导序列所替代；非限制性实例包括：来自黑曲霉中性α-淀粉酶基因的修饰的启动子，其中的非翻译前导序列已被来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的非翻译前导序列所替代)；和它们的突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子从如下的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。

调控序列也可以是转录终止子，其由宿主细胞识别以终止转录。所述终止子序列与编码所述变体的多核苷酸的3’末端可操作地连接。在本发明中，可使用任何在宿主细胞中有功能的终止子。

对于细菌宿主细胞而言优选的终止子获自克劳氏芽孢杆菌(Bacillusclausii)碱性磷酸酶(aprH),地衣芽孢杆菌α淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)的基因。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。

调控序列还可以是位于基因的启动子下游和编码序列上游的mRNA稳定化区域，其增加该基因的表达。

合适的mRNA稳定化区域的例子获自苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue et al.,1995,Journal ofBacteriology 177:3465-3471)。

调控序列还可以是合适的前导序列，其为对于由宿主细胞进行的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码所述变体的多核苷酸的5’-末端。可使用在宿主细胞中有功能的任何前导序列。

对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。

对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调控序列也可以是聚腺苷酸化序列，其是与变体编码序列的3’末端可操作地连接的序列，并且当被转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.Cellular Biol.15:5983-5990描述。

调控序列还可以是信号肽编码区，其编码与变体的N端相连，并指导所述变体进入细胞分泌途径的信号肽。多核苷酸的编码序列5’端可固有地包含信号肽编码序列，其与编码所述变体的编码序列的区段一起天然地连接在翻译阅读框中。或者，编码序列5’端可含有外源于所述编码序列的信号肽编码序列。在编码序列不天然地含有信号肽编码序列时，外源信号肽编码序列可能是必需的。或者，外源信号肽编码序列可直接取代天然信号肽编码区域以增强多肽的分泌。然而，可使用指导表达的变体进入宿主细胞的分泌途径的任何信号肽编码序列。

对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。更多的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。

对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。

调控序列还可以是前肽编码序列，其编码位于变体N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的，并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。

当信号肽和前肽序列二者均存在时，前肽序列被置于紧接着(next to)变体的N端，并且信号肽序列被置于紧接着前肽区域的N端。

同样理想的是添加相对于宿主细胞的生长调节变体的表达的调节序列。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中，可使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下被扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的多核苷酸将与调节序列可操作地连接。

表达载体

本发明还涉及重组表达载体，所述重组表达载体包含本发明变体的多核苷酸、启动子、以及转录和翻译终止信号。可以将各种核苷酸和控制序列连结到一起来产生重组表达载体，其可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码所述变体的多核苷酸。或者，可以通过在适当的用于表达的载体中插入所述多核苷酸或包含所述多核苷酸的核酸构建体来表达所述多核苷酸。在创建表达载体的过程中，将编码序列置于载体中，使得该编码序列与用于表达适当的调控序列可操作地连接。

重组表达载体可以是任何能够方便地对其进行重组DNA步骤，并且能够带来多核苷酸的表达的载体(例如，质粒或病毒)。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(total DNA)，或可以使用转座子(transposon)。

所述载体优选地含有一个或多个选择性标记，使得简单地选择经转化、转染、转导等的细胞成为可能。选择性标记是基因，它的产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因，或赋予抗生素抗性的标记，所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。对于酵母宿主细胞合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。

所述载体优选含有允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制的元件。

为了整合入宿主细胞基因组，载体可依赖编码变体的多核苷酸的序列或任何其它载体元件用于通过同源或非同源重组整合入基因组。或者，载体可以含有额外的多核苷酸，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应含有足够数量的核酸，如100至10,000碱基对，400至10,000碱基对，和/或800至10,000碱基对，其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可为任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可为非编码或编码的多核苷酸。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点，ARS1,ARS4,ARS1和CEN3的组合，和ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67；Cullen等,1987,Nucleic Acids Res.15:9163-9175；WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。

可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加变体的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。

宿主细胞

本发明还涉及重组宿主细胞，其包含编码本发明变体的多核苷酸，所述多核苷酸与一种或多种指导本发明的变体产生的调控序列可操作地连接。将包含多核苷酸的构建体或载体导入宿主细胞，使该构建体或载体如前所述作为染色体整合物或者作为自主复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何由于复制过程中发生的突变而不同于该亲本细胞的后代。宿主细胞的选择将在很大程度上依赖于编码变体的基因及其来源。

宿主细胞可以是变体的重组产生中有用的任何细胞，例如，原核或真核生物。

原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于，芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于，弯曲杆菌属、大肠杆菌、黄杆菌属、泥杆菌属、螺杆菌属、梭杆菌属(Ilyobacter)、奈瑟氏菌属、假单胞菌属、沙门氏菌属、和脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞。包括但不限于，嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞。包括但不限于，似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞。包括但不限于，不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。

可通过如下方法实现将DNA引入到芽孢杆菌属细胞：例如原生质体转化(参见，例如，Chang and Cohen,1979,Mol.Gen.Genet.168:111-115)，感受态细胞转化(参见，例如，Young and Spizizen,1961,J.Bacteriol.81:823-829,或Dubnau and Davidoff-Abelson,1971,J.Mol.Biol.56:209-221)，电穿孔(参见，例如，Shigekawa and Dower,1988,Biotechniques6:742-751)或接合(参见，例如，Koehler and Thorne,1987,J.Bacteriol.169:5271-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞：例如原生质体转化(参见，例如，Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见，例如，Dower et al.,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞：例如原生质体转化和电穿孔(参见，例如，Gong et al.,2004,FoliaMicrobiol.(Praha)49:399-405)，接合(参见，例如，Mazodier et al.,1989,J.Bacteriol.171:3583-3585)，或转导(参见，例如，Burke et al.,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞：例如电穿孔(参见，例如，Choi et al.,2006,J.Microbiol.Methods64:391-397)或接合(参见，例如，Pinedo and Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞：例如天然感受态(natural competence)(参见，例如，Perry and Kuramitsu,1981,Infect.Immun.32:1295-1297)，原生质体转化(参见，例如，Catt and Jollick,1991,Microbios68:189-207)，电穿孔(参见，例如，Buckley et al.,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见，例如，Clewell,1981,Microbiol.Rev.45:409-436)。然而，可以使用本领域已知的将DNA引入宿主细胞的任何方法。

宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。

宿主细胞可为真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporicfungi)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。

宿主细胞可以是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，酵母应如Biology and Activities of Yeast(Skinner,Passmore,和Davenport,编，Soc.App.Bacteriol.Symposium Series No.9,1980)中所述定义。酵母宿主细胞可以是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞，诸如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowia lipolytica)细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由上文Hawksworth等，1995所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵性的。丝状真菌宿主细胞可为枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。例如，丝状真菌宿主细胞可为泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporiuminops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporiumlucknowense、Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、曼赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本领域已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023，Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474以及Christensen等,1988,Bio/Technology6:1419-1422中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume194,pp182-187,Academic Press,Inc.,New York；Ito等,1983,J.Bacteriol.153:163；和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。

产生方法

本发明还涉及产生变体的方法，包括(a)在有助于产生变体的条件下培养细胞，其以其野生型形式能够产生多肽；和(b)回收所述变体。

所述宿主细胞使用本领域已知的方法在适合于产生所述变体的营养培养基中培养。例如，可以通过在合适培养基中和允许表达和/或分离所述变体的条件下的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果变体分泌到营养培养基中，可以从所述培养基中直接回收变体。如果变体不分泌，可以将其从细胞裂解物回收。

可以使用本领域已知的对于所述变体特异性的方法来检测变体。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶测定法(enzyme assay)可用于确定多肽变体的活性。

所述变体可以使用本领域已知的方法回收。例如，变体可以通过常规方法从营养培养基中回收，所述常规方法包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。

变体可以通过多种本领域已知的方法纯化以获得基本上纯的变体，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或萃取(参见，例如，Protein Purification,Janson和Ryden编，VCH Publishers,New York,1989)。

在另一个方面，不回收变体，而是使用表达所述变体的本发明的宿主细胞作为所述变体的来源。

用途

本发明的方法可以用于酰胺-键反应，例如在酰胺合成、水解、醇解、氨解、酰胺交换、转酰基、或酰基转移。脂肪酶变体的一种应用可以是在生物催化领域中用于有机合成、分析或降解的目的，例如去除保护基团或酰胺、胺、羧酸、酯和醇的外消旋拆分。所述脂肪酶变体可以特别由于其稳定性、接受相对宽范围的底物的能力、化学-、区域-、和/或立体选择性而得到应用。所述脂肪酶变体可以以固定化形式、在水溶液中、在缓冲溶液中、在有机溶剂中、在无溶剂液体底物中、在气相中、在离子液体中或在超临界流体中使用。反应产物可以在原料化学品、精细化学品、农业化学品、药物、食品或饲料工业中使用。

所述脂肪酶变体的用途的其他例子有对不希望的酰胺的降解，例如对土壤、表面、食品或饲料的净化，例如净化去除杀虫剂如氟丁酰草胺、苄草胺、溴丁酰草胺或牧草胺等除草剂。所述脂肪酶变体还可以用于降解天然产生的酰胺，例如辣椒及其他辣椒属物种中含有的辣椒碱(capsaicinoids)，以降低刺激性。所述脂肪酶变体可用于对含有酰胺的产品例如尼龙的改性。

植物

本发明还涉及分离的植物，例如，转基因植物、植物部分或植物细胞，其包含本发明的多核苷酸，从而以可回收的量表达和产生所述变体。变体可从植物或植物部分回收。或者，可以按原样(as such)将含有该变体的植物或植物部分用于改进食品或饲料的质量，例如，改进营养价值、适口性(palatability)和流变性质(rheological properties)，或用于破坏抗营养因子。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses)，如草地早熟禾(meadow grass)(蓝草(blue grass)，早熟禾属(Poa))；饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium)；寒地型牧草(temperate grass)，如Agrostis(翦股颖属)；和谷类，例如，小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。

双子叶植物的实例是烟草(tobacco)，豆类(legumes)，如羽扇豆(lupins)，马铃薯，糖甜菜(sugar beet)，豌豆，豆(bean)和大豆(soybean)，和十字花科的(cruciferous)植物(十字花科(family Brassicaceae))，如花椰菜(cauliflower)，油菜籽(rape seed)和近缘的模型生物体拟南芥(Arabidopsis thaliana)。

植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber)，以及包含这些部分的独立组织，例如，表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments)，如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外，任何植物细胞，无论什么组织来源，都被认为是植物部分。同样地，植物部分，如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分，例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。

这些植物、植物部分和植物细胞的后代同样包含于本发明范围内。

表达变体的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之，通过如下方法构建所述植物或植物细胞：将编码变体的一个或多个表达构建体并入植物宿主基因组或叶绿体基因组，并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。

表达构建体便利地是包含编码变体的多核苷酸的核酸构建体，所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外，表达构建体可以包含对于鉴定植物细胞有用的选择性标记，在所述植物细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。

调节序列的选择，例如启动子和终止子序列和任选地信号或转运序列的选择，举例来说，基于期望何时、何处以及如何表达变体而确定。例如，编码本发明的多肽的基因的表达可以是组成型的或诱导型的，或可以是发育、阶段或组织特异性的，并且基因产物可以靶向特定的组织或植物部分如种子或叶。调节序列由例如Tague等,1988,Plant Physiology86:506所述。

对于组成性表达，可以使用35S-CaMV、玉米泛素1或稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689；Zhang等,1991,Plant Cell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303)，或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878)，种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant Cell Physiol.39:885-889)，来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.Plant Physiol.152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant Cell Physiol.39:935-941)，来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子，或本技术领域公知的任何其他种子特异性的启动子，例如，在WO91/14772中所描述的。此外，启动子可为叶特异性的启动子，如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000)，小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Mol.Biol.26:85-93)，来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674)，或伤口诱导的启动子，如马铃薯pin2启动子(Xu等,1993,Plant Mol.Biol.22:573-588)。同样地，所述启动子可通过非生物的处理诱导，所述非生物的处理诸如温度、干旱或盐度变化，或通过外源施加的激活所述启动子的物质诱导，例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellic acid)，和重金属。

启动子增强子元件也可以用于实现变体在植物中的较高表达。例如，启动子增强子元件可以是内含子，其置于启动子和编码变体的多核苷酸之间。例如Xu等,1993,见上，公开了使用稻肌动蛋白1基因的第一内含子以增强表达。

选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。

将核酸构建体根据本领域已知的常规技术并入植物基因组，所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293；Potrykus,1990,Bio/Technology8:535；Shimamoto等,1989,Nature338:274)。

根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移是一种产生转基因双子叶植物(综述可参见Hooykas和Schilperoort,1992,Plant Mol.Biol.19:15-38)、和用于转化单子叶植物的方法，虽然对于这些植物也可以使用其他的转化方法。产生转基因单子叶植物的一种方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developingembryos)(Christou,1992,Plant J.2:275-281；Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162；Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化，如由Omirulleh等,1993,Plant Mol.Biol.21:415-428所描述的。其它的转化方法包括描述于美国专利号6,395,966和7,151,204中的那些(两者均通过提述以其整体并入本文)。

转化之后，根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。

除了直接用本发明的构建体直接转化具体植物基因型之外，还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言，可将编码变体的构建体通过杂交而引入特定植物品种，而根本无需直接转化该给定品种的植物。因此，本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物，还包括此类植物的后代(progeny)。如用于本文，后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体。杂交导致转基因通过将起始种系供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例描述于US7,151,204。

植物通过回交转化方法生成。举例而言，该植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。

可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势，在于其可用于避免由表型变异导致的错误。进一步，遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言，当原本不具有非农艺学所需的遗传背景但具有所需性状的植物与良种亲本杂交时，可使用遗传标记来选择不仅具有目标性状，还具有相对较大比例所需种质的后代。以此方式，使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。

本发明亦涉及产生本发明的变体的方法，其包括：(a)在有助于产生所述变体的条件下培养转基因植物或植物细胞，所述植物或植物细胞包含编码具有变体的多核苷酸；和(b)回收所述变体。

实施例

下面的实施例进一步说明本发明，它们不应被解释为限制本发明的范围。

实施例1：变体的产生

(A)为了产生用于在米曲霉菌株中表达的SEQ ID NO:1的变体，利用导入期望的序列改变(取代)的诱变引物进行基于PCR的定点诱变。引物被设计为突变位于寡核苷酸的中央，两侧有足够的核苷酸(15-25个)。PCR模板是一个7467碱基对的质粒，其含有SEQ ID NO:1，并能够在大肠杆菌中增殖且能够转化曲霉属菌株。PCR设置有校对DNA聚合酶(Phusion DNA聚合酶(来自Finnzymes,Themo Scientific)；或者KOD DNA聚合酶(来自Novagen,Toyobo))。

根据供应商提供的说明将PCR产物用于转化感受态大肠杆菌DH5α细胞(来自TaKaRa)。从单克隆转化的大肠杆菌菌株分离质粒DNA，并测序以验证期望的取代的存在。用经过确认的质粒变体转化一种米曲霉菌株，该菌株是pyrG(乳清苷-5’-磷酸脱羧酶)阴性，并且还是蛋白酶pepC(一种与yscB同源的丝氨酸蛋白酶)、alp(一种碱性磷酸酶)、NpI(一种中性蛋白酶I)阴性，以避免发酵过程中和发酵后脂肪酶变体的降解。

将经转化的曲霉菌株以深层培养物的形式在摇瓶中发酵，脂肪酶变体被分泌到发酵培养基中。在发酵之后，从经无菌过滤的发酵培养基通过三步程序纯化出脂肪酶变体：(1)在癸胺-琼脂糖上、或者丁基-toyopearl上的疏水相互作用层析，(2)通过凝胶过滤，或者通过超滤的缓冲液交换，以及(3)在SP-sepharose上以pH4.5进行阳离子交换层析，或者在Q-sepharose上以pH7进行阴离子层析。脂肪酶变体溶液冷冻保存。

(B)为了产生用于在巴斯德毕赤酵母菌株中表达的SEQ ID NO:1的变体，利用导入期望的序列改变(取代)的诱变引物进行基于PCR的定点诱变。引物被设计为突变位于寡核苷酸的中央，两侧有足够的核苷酸(15-25个)。PCR模板是一个8604碱基对的质粒，其包含带有His标签的SEQ ID NO:1，并能够在大肠杆菌中增殖且能够转化毕赤酵母属菌株。PCR设置有校对DNA聚合酶(Phusion DNA聚合酶(来自Finnzymes,Themo Scientific))。

根据供应商提供的说明用PCR产物转化感受态大肠杆菌DH5α细胞(来自TaKaRa)。从单克隆转化的大肠杆菌菌株分离质粒DNA，并测序以验证期望的取代的存在。用经过确认的质粒变体转化一种Mut(s)、Suc(+)、His(-)的巴斯德毕赤酵母菌株。

将经转化的毕赤酵母菌株以深层培养物的形式在深孔板中发酵，并通过添加甲醇来诱导脂肪酶变体分泌到发酵培养基中。在发酵之后，从经过澄清的上清液用标准His-标签纯化规程(来自Qiagen)分离出脂肪酶变体，并利用Amicon Ultra离心过滤装置用10kDa截留(来自Merck Millipore)将其缓冲液更换为50mM磷酸盐缓冲液，pH7.0。

带有C末端His标签(下划线)的SEQ ID NO:1：

实施例2：酰胺-键反应中活性的测定

利用与Henke E.&Bornscheuer U.T.(2003)Anal Chem.,75,255-260所描述的荧光测定法相似的荧光测定法测定酰胺-键反应中的活性。

含水反应混合物中的浓度为0.03mg/ml酶、5mM底物、25mM磷酸盐pH7.0,10%(w/v)四氢呋喃。该反应混合物是通过在96孔微量滴定板的微量滴定孔中将75uL酶溶液(其含有0.08mg/ml酶(脂肪酶变体))与125uL测试溶液(其含有8mM底物(苄基氯乙酰胺=2-氯-N-苄基乙酰胺)，40mM磷酸盐(钾盐)pH7.0,16%(w/v)四氢呋喃)一起吹打(pipetting)而制备的。

酶溶液是通过稀释浓缩酶储液而制备的，酶储液的浓度通过测量280nm的吸光度并计算浓度来确定。对于南极假丝酵母脂肪酶B使用1.21的消光系数(1.21的光吸收等于1mg/ml)。

微量滴定板用Parafilm(来自Pechiney Plastic Packaging Company，Chicago,Illinois,USA)覆盖，在MTP Thermomixer Comfort(来自Eppendorf AG,Hamburg,Germany)中37℃、300rpm温育18小时。然后将50uL溶于1-己醇的20mM4-氯-7-硝基苯并呋咱(NBD-Cl,4-氯-7-硝基-1,2,3-苯并氧杂二唑)移液到孔中并在37℃、500rpm温育1小时。

然后用荧光计Fluostar Optima(来自BMG Labtech GmbH,Ortenberg,Germany)测量荧光强度，激发为485nm(滤片BMG0038485-P)，发射为540nm(滤片BMG 0414A 540-20)，每个孔100次闪照(flashes)。每个酶变体在3个孔中三次重复测量。平行地，每个酶变体还设置3个不同的无底物的孔，以测量来自每个变体的微小背景荧光。为了测量底物的微小的自水解，还设置了3个有底物而没有酶的孔。此外还设置了3个没有底物也没有酶、因此只有含水培养基及缓冲剂和溶剂的孔，用来测量来自培养基的微小背景荧光。

来自有酶且有底物的测量的平均值名为“es”，有酶而没有底物的值为“e”，没有酶而有底物的值为“s”；没有酶且没有底物的值为“o”。为了针对来自酶、培养基和自水解的荧光进行校正，计算如下的减法：(es-e)-(s-o)=(es-s)-(e-o)=es-e-s+o=经校正的酶变体活性值。s-o=底物的自水解。由于这些测量值是以自定义荧光单位计，将这些值标准化为反应了的底物的百分比。0%表示底物没有反应，100%意味着底物完全反应成产物。为了该标准化，为每种酶变体平行地设定2个孔。这些孔所含的组成与其他孔相同，只是它们不含有底物，而是含有对应于10%反应的浓度的产物。在这个实施例中，这两个孔中的浓度为0.03mg/ml酶、0.5mM水解产物(即0.5mM苄胺和0.5mM氯乙酸)、25mM磷酸盐pH7.0、10%(w/v)四氢呋喃。来自这些有酶且有产物的测量的平均值名为“ep”。为了针对来自酶变体的背景荧光进行校正，减去来自有酶而没有产物(且没有底物)的测量的平均值(其名为“e”)。简而言之，经标准化和校正的酶变体活性计算如下：10·((es-e)-(s-o))/(ep-e)。

96孔微量滴定板设置方案：

实施例3：不同野生型酯酶的酰胺酶活性

测定了不同酯酶的酰胺酶活性，并将它们的活性作为相对于南极假丝酵母脂肪酶B的酰胺酶活性的百分比显示。还显示了它们相对于南极假丝酵母脂肪酶B的氨基酸序列的相对氨基酸序列同一性。

表3:不同野生型酶在酰胺-键反应中的活性，表示为南极假丝酵母脂肪酶B的活性的百分比并与其比较

实施例4：不同变体的酰胺酶活性

表4：显示了不同脂肪酶在酰胺-键反应中的活性，以改进因子(IF)表示。IF通过用不同脂肪酶的活性除以其亲本脂肪酶的活性来计算。改进因子大于1表明改进的酰胺-键反应中活性。

实施例5：对其他样品的酰胺-键反应中活性的测量

如实施例1中所述制备变体之后，将下列蛋白质样品通过超滤浓缩，并更换缓冲液为25mM磷酸盐pH7.0，再如实施例2所述测量。

表5:显示了不同样品在酰胺-键反应中的活性，以改进因子(IF)表示。IF通过用不同脂肪酶的活性除以其亲本脂肪酶的活性来计算。改进因子大于1表明改进的酰胺-键反应中活性。

在曲霉中表达的脂肪酶	改进因子(IF)
		亲本脂肪酶	1.0
G39A	1.7
		G39A+T103G	0.8
G39A+W104F	2.3
		G39A+L278A	3.1–3.3
G39A+T103G+L278A	2.0–3.8
		G39A+W104F+L278A	5.2–6.3
G39A+T103G+W104F+L278A	10.0–11.2
		G39A+T103G+W104Y+L278A	2.8
G39A+T103G+W104Q+L278A	1.9
		G39A+W104F+A225K+L278A	0.8
G39A+W104F+D223N+A225I+L278A	2.8

实施例6:对底物N-苄基-2-氯乙酰胺的酶促酰胺水解活性的测定

在一个基于E.Henke and U.T.Bornscheuer,Anal.Chem.2003,75,255-260所描述的测定法的二步荧光测定法中测定了CalB变体的酰胺酶活性。所有测定中均使用经过Ni²⁺-亲和层析和脱盐后的酶制备物。

首先，在96孔微量滴定板(Nunc，透明平底，聚苯乙烯)中以200uL总体积进行酰胺底物N-苄基-2-氯乙酰胺的酶促水解。所有的反应均在同一微量滴定板上一式三份地进行。反应混合物含有20uL溶于100%DMSO的50mM酰胺底物(终浓度：5mM酰胺底物，10%DMSO)，100uL100mM磷酸盐缓冲液pH7.0(终浓度：50mM),20uL3-30uM CalB变体(终浓度：0.3-3uM),20uL120ug/mL BSA(终浓度：12ug/mL)，和40uL H₂O。为了测定非酶促的背景酰胺水解，在每个微量滴定板上进行了一式三份的相同但没有任何酶的反应。将微量滴定板封盖，将反应在振荡式培养箱中37℃、220rpm温育18-20小时。

在第二步中，将50uL溶于1-己醇的20mM 4-硝基-7-氯-苯并-2-氧杂-1,3-二唑(NBD-Cl)加入所述样品，给平板封盖，NBD-Cl与苄胺(酰胺水解过程中形成的)的反应在37℃、220rpm在同一振荡式培养箱中进行1小时。使用荧光酶标仪(SpectraMax M3)以485nm激发、测量538nm发射来测定最终反应产物的荧光。

为了能够计算酰胺水解反应过程中形成的苄胺，在每个微量滴定板上用与酶水解样品相似但不含有酶、且用苄胺代替酰胺底物N-苄基-2-氯乙酰胺的反应混合物制定校准曲线。校准曲线包含具有涵盖0.04mM到5mM之间范围的最少8个胺浓度的一式三份的样品。校准样品的处理与上述酶样品相同。

为了计算酶活性，求出一式三份测量的荧光的平均值，并将酶样品的所得的值针对背景反应的相应值校正。然后基于经背景校正的荧光值(F_c,单位：au)、校准曲线的线性部分的斜率m(y=mx+n，y轴上的荧光值相对x轴上以mM计的苄胺浓度)、反应时间(t,单位：min)、以及酶浓度(c_E：浓度uM)，按照下式1计算所测定的CalB变体的比活性(specific activity)(v，单位：min^-1)：v=(((F_c/m)/t)*1000)/c_E。

将CalB变体的比活性v除以CalB野生型(亦通过上述测定法测定)的相应值，得出酰胺酶活性的改进因子(xi)。

表6:CalB变体对底物N-苄基-2-氯乙酰胺的比酰胺酶活性v和所得的相对CalB野生型的改进因子。

实施例7:对底物对-硝基苯基丁酰胺的酶促酰胺水解的测定

在一项基于Syren et al.,ChemBioChem 2012,13,645-648所述的测定法的光度测定中测定CalB变体对底物对-硝基苯基丁酰胺(又称“酰替苯胺”)的酰胺酶活性。在所有测定中均使用纯化的酶制备物。

在96孔微量滴定板(Nunc，透明平底，聚苯乙烯)中以200uL总体积实施对酰胺底物对-硝基苯基丁酰胺的酶促水解。所有反应均在相同微量滴定板上一式三份地进行。反应混合物包含20uL溶于100%DMSO中的10mM酰胺底物(终浓度：1mM酰胺底物，10%DMSO),100uL100mM磷酸盐缓冲液pH7.0(终浓度：50mM)、20uL3-30uM CalB变体(终浓度：0.3-3uM)、和60uLH₂O。为了确定非酶促的背景酰胺水解，在每个微量滴定板上进行一式三份相同但没有任何酶的反应。微量滴定板封盖，将反应在振荡式培养箱中37℃、220rpm温育48小时。在温育过程中的确定的时间点，用微量滴定板SpectraMax M3分光光度计测量所有样品的410nm吸光度。

为了计算酶活性，计算一式三份测量的吸光度(A,单位：au)的平均值，并通过对吸光度值相对反应时间的线性回归分析(A=mx+n,y轴上的吸光度值对x轴上的反应时间(t,单位：min))来确定反应斜率(m,单位：au min^-1)。将所得的酶样品的反应斜率m相对于背景反应的相应值m_b进行校正，得到m_c(m_c=m-m_b)。然后基于经过背景校正的反应斜率m_c、对-硝基苯胺的消光系数(ε_410nm=9100M^-1cm^-1)、光径长度(d=0.5cm)、和酶浓度(c_E:单位uM)使用式1来计算测定的CalB变体的比活性(v，单位：min^-1)：v=((m_c/(ε*d))*1000000)/c_E。

将CalB变体的比活性除以CalB野生型的相应值(也使用上述的测定法测定)，得到酰胺酶活性的改进系数(x_i)(表1)。

表7：CalB变体对底物对-硝基苯基丁酰胺的比酰胺酶活性v和所得的相对CalB野生型的改进因子

突变	v(min^-1)	x_i
			-	0,0026	1
I189Y	0,0241	9,4
			I189H	0,0139	5,4

I189A	0,0128	5,0
			S31K	0,0041	1,6
I189G	0,0161	6,3

本申请中描述并要求保护的发明的范围不应局限于本申请中公开的具体方面，因为这些方面仅仅是意图用于例示说明本发明的若干方面。本发明的范围内意图涵盖任何等同的方面。实际上，本领域技术人员鉴于前面的描述，容易想到除了本文开示和描述者之外对本发明的各种修改。这样的修改也意图落入随附的权利要求的范围内。在有冲突之时，应以本公开包括定义在内为准。

Claims

1.亲本脂肪酶的变体，所述变体是：

a.与SEQ ID NO:2的成熟多肽具有至少60%序列同一性的多肽；

b.由在低严格条件下与(i)SEQ ID NO:1的成熟多肽编码序列、或(ii)编码SEQ ID NO:2的成熟多肽的序列、或(iii)(i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽；

c.由与SEQ ID NO:1的成熟多肽编码序列、或编码SEQ ID NO:2的成熟多肽的序列具有至少60%同一性的多核苷酸所编码的多肽；或

d.SEQ ID NO:2的成熟多肽的片段，

其中所述变体相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性。

2.权利要求1的变体，其在对应于SEQ ID NO:2的成熟多肽的位置S31R/K;G39;A225;T103V/S/A;L278G/K/R/H;W104Y/K/R;T42G/S/Q/H/I/L/M;D223G/N/A/V/H;I189;Q191;D134V/T/I/F/A/S/K/R;E188;V221A/R/K/H;7P38H/N/A/G;G41P/S;A132;N79;Q106;和/或L140R/K/H中的一个或多个位置上包含取代。

3.权利要求2的变体，其中所述取代为：G39A;A225I/V/L/M/K/R/S/T/G/H;I189Y/H/Q/N/R/K/A/E/S/T/G;Q191N/A/R/K/H;E188Q/R/D/N/K/H/A;A132S/N/G/H/K/R;N79V/Q/E;和/或Q106N/Y。

4.权利要求2或3的变体，其还包含选自下列的取代：T103G；L278A/V；W104F/Q；T42N/V/A;D134L;和G41A。

5.权利要求1-4中任一项的变体，其与所述亲本脂肪酶的氨基酸序列具有至少60%，例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%同一性，至少96%,至少97%,至少98%,或至少99%,但小于100%序列同一性。

6.权利要求1-5中任一项的变体，其与SEQ ID NO:2的成熟多肽具有至少60%，例如至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%,但小于100%序列同一性。

7.权利要求1-6中任一项的变体，其中取代的个数为1-20,1-10,1-5,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,或20。

8.权利要求1-7中任一项的变体，其包含或含有：

a.A225K;

b.A225I;

c.A225V;

d.A225L;

e.A225M;

f.A225S;

g.G39A;

h.D223G;

i.D223N;

j.T42G;

k.T42S;

l.Q191R;

m.I189Y;

n.I189H;

o.T103V;

p.T103S;

q.T103A;

r.G39A+L278A;

s.G39A+W104F;

t.G39A+Q191R;

u.G39A+L278A+A281G;

v.G39A+T103G+L278A;

w.G39A+W104F+L278A;

x.G39A+W104Q+L278A;

y.G39A+T103G+W104F+L278A;

z.G39A+T103G+W104Q+L278A;

aa.G39A+T103G+W104Y+L278A;

bb.G39A+T103G+W104F+D223G+A225K+L278A;

cc.G39A+T103G+W104F+D223N+A225K+L278A;

dd.G39A+W104F+A225K+L278A;

ee.G39A+W104F+D223N+A225K+L278A;

ff.G39A+W104F+D223N+A225I+L278A;

gg.G39A+T103G+D223N+A225K+L278A;

hh.G39A+T103G+W104Y+D223N+A225K+L278A;

ii.G39A+T103G+W104F+M129L+L278A;

jj.G39A+T103G+W104F+M129L+D223N+L278A;

kk.G39A+A225K+L278A;

ll.G39A+D223G+A225K+L278A;

mm.G39A+D223G+A225I+L278A;

nn.G39A+T103G+W104F+A225K+L278A;

oo.G39A+T103G+W104F+A225I+L278A;

pp.G39A+T103G+W104F+D223G+A225I+L278A;

qq.G39A+T103G+W104F+D223N+A225I+L278A;

rr.G39A+W104F+A225I+L278A;

ss.G39A+W104F+V221R+D223N+A225K+L278A;

tt.G39A+T103G+A225K+L278A;

uu.G39A+T103G+A225I+L278A;

vv.G39A+T103G+D223G+A225K+L278A;

ww.G39A+T103G+D223G+A225I+L278A;

xx.G39A+T103G+D223N+A225I+L278A;

yy.G39A+T103G+I189Y+L278A;

zz.G39A+T103G+W104Y+I189Y+D223N+A225K+L278A;

aaa.G39A+W104F+I189Y+D223N+A225K+L278A;

bbb.G39A+T103G+W104F+V221R+D223N+A225K+L278A;

ccc.G39A+T103G+I189Y+D223N+A225K+L278A;

ddd.G39A+T103G+W104Y+I189Y+L278A;

eee.T103G+W104F+D223G+A225K;

fff.T103G+W104F+A225K;

ggg.T103G+W104F+I189Y+D223G;

hhh.T103G+W104F+I189Y;

iii.T103G+W104F+D223G+L278A;

jjj.T103G+W104F+L278A;

kkk.T103G+W104F+Q191R+D223G;

lll.T103G+W104F+Q191R;

mmm.G39A+T42G+T103G+W104F+I189Y+D223G+A225K;

nnn.G39A+T42G+T103G+W104F+D223G+A225K;

ooo.G39A+T42G+T103G+W104F+I189Y+Q191R+D223G+A225K;

ppp.G39A+T42G+T103G+W104F+Q191R+D223G+A225K;

qqq.G39A+W104F+D223G;+A225K

rrr.G39A+W104F+I189Y+D223G;+A225K

sss.G39A+W104F+I189Y;+A225K

ttt.G39A+W104F+A225K;

uuu.G39A+W104F+I189H;

vvv.G39A+W104F+I189Y+D223G;

www.G39A+W104F+I189Y;

xxx.G39A+W104F+D223G;+L278A

yyy.G39A+W104F+I189Y+D223G;+L278A

zzz.G39A+W104F+I189Y;+L278A

aaaa.G39A+W104F+L278A;

bbbb.G39A+T42G+T103G+W104F+M129L+I189Y+D223G+A225K+L278A;

cccc.G39A+T103G+W104F+D223G;

dddd.G39A+T103G+W104F+I189Y+D223G;

eeee.G39A+T103G+W104F+I189Y;

ffff.G39A+T103G+W104F;

gggg.G39A+W104F+I189Y+A281G+A282G+I285A+V286A+L278A;

hhhh.G39A+W104F+A281G+A282G+I285A+V286A+L278A;

iiii.W104F+I189Y+A281G+A282G+I285A+V286A+L278A;

jjjj.W104F+A281G+A282G+I285A+V286A+L278A;

kkkk.G39A+W104F+Q191R;

llll.G39A+W104F+Q191R+D223G;

mmmm.G39A+T42G+T103G+W104F+D223G+A225K+L278A;

nnnn.G39A+T42G+T103G+W104F+D223N+A225K+L278A;

oooo.G39A+T42G+W104F+A225K+L278A;

pppp.G39A+T42G+W104F+D223N+A225K+L278A;

qqqq.G39A+T42G+W104F+D223N+A225I+L278A;

rrrr.G39A+T42G+T103G+D223N+A225K+L278A;

ssss.G39A+T42G+T103G+W104Y+D223N+A225K+L278A;

tttt.T42G+T103G+W104F+D223G+A225K+L278A;

uuuu.T42G+T103G+W104F+D223N+A225K+L278A;

vvvv.T42G+W104F+A225K+L278A;

wwww.T42G+W104F+D223N+A225K+L278A;

xxxx.T42G+W104F+D223N+A225I+L278A;

yyyy.T42G+T103G+D223N+A225K+L278A;

zzzz.T42G+T103G+W104Y+D223N+A225K+L278A;

aaaaa.G39A+T103G+W104F+L278A

bbbbb.G39A+T103G+W104F+D223G+L278A

ccccc.S31R+G39A+T103G+W104F+L278A

ddddd.I189A

eeeee.S31K

fffff.S31R

ggggg.I189G

hhhhh.S31R+G39A+L278A。

9.权利要求1-8中任一项的变体，其相对于所述亲本脂肪酶具有改进的酰胺-键反应中的活性，其中所述反应选自下组：催化效率、催化速率、转换数、比活性、底物结合、底物裂解、底物特异性、底物稳定性、和产物释放。

10.一种分离的多核苷酸，其编码权利要求1-9中任一项的变体。

11.一种核酸构建体，其包含权利要求10的多核苷酸。

12.一种表达载体，其包含权利要求10的多核苷酸。

13.一种宿主细胞，其包含权利要求10的多核苷酸。

14.一种产生脂肪酶变体的方法，其包括：

a)在适于该变体表达的条件下培养权利要求13的宿主细胞；和

b)回收该变体。

15.一种转基因植物、植物部分或植物细胞，其经过权利要求10的多核苷酸的转化。

16.一种产生权利要求1-9中任一项的变体的方法，包括：

a)在有助于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物或植物细胞；和

b)回收所述变体。

17.用于从亲本脂肪酶获得变体的方法，所述变体与所述亲本脂肪酶相比具有改进的酰胺-键反应中的活性，所述方法包括：

a.选择位于任何催化三联体残基以内的至少一个这样的氨基酸残基，其(i)改变含有该催化三联体的口袋的几何条件；和/或(ii)通过静电场影响该催化三联体；

b.对该至少一个氨基酸残基进行取代；

c.制备由步骤(a)和(b)得到的变体；

d.测试该变体在酰胺-键反应中的活性；和

e.选择相比于所述亲本脂肪酶具有改进的酰胺-键反应中的活性的变体。

18.权利要求17的方法，其中所述至少一个氨基酸残基处的取代选自：对应于SEQ ID NO:2的成熟多肽中的位置的S31R/K;G39；A225；T103V/S/A；L278G/K/R/H；W104Y/K/R；T42G/S/Q/H/I/L/M；D223G/N/A/V/H；I189；Q191；D134V/T/I/F/A/S/K/R；E188；V221A/R/K/H；P38H/N/A/G；G41P/S；A132；N79；Q106；和/或L140R/K/H。

19.权利要求1-9中任一项的变体用于催化酰胺-键反应的用途。

20.权利要求19的用途，其中所述酰胺-键反应选自下组：催化效率、催化速率、转换数、比活性、底物结合、底物裂解、底物特异性、底物稳定性、和产物释放。