CN113215123A

CN113215123A - 一种S型ω-转氨酶高活性突变体

Info

Publication number: CN113215123A
Application number: CN202010072818.XA
Authority: CN
Inventors: 王继国; 王华磊; 刘清海; 魏东芝
Original assignee: East China University of Science and Technology
Current assignee: East China University of Science and Technology
Priority date: 2020-01-21
Filing date: 2020-01-21
Publication date: 2021-08-06

Abstract

本发明属于生物催化领域，具体涉及一种转氨酶高活性突变体。本发明公开了一种S型ω‑转氨酶高活性的突变体，其氨基酸序列为基于但不同于SEQ ID NO:1，并且与SEQ ID NO:1相比，所述突变体中的残基差异是25位的谷氨酰胺突变为酪氨酸或苯丙氨酸，突变体简称为Q25Y和Q25F；或64位置的色氨酸突变为亮氨酸或半胱氨酸，突变体简称为W64L和W64C。本发明所公开转氨酶突变体具有很好的催化活性及特异性，在转氨酶突变体制备的手性胺过程中提高反应速率，减少了酶用量，降低了后处理的难度。

Description

一种S型ω-转氨酶高活性突变体

技术领域

本发明属于生物催化领域，具体涉及一种转氨酶高活性突变体。

背景技术

手性胺类化合物是合成许多手性药物的关键中间体。有许多重要的神经类药物、心血管药物、抗高血压药物、抗感染药物等都是以手性胺作为中间体来进行合成的。目前，手性胺的合成主要通过化学法实现，例如不对称还原Schiff碱(Chiral amine synthesis:methods,developments and applications[M].West Sussex,United Kingdom:JohnWiley&Sons.2010)，但是反应中存在反应条件苛刻、使用有毒的过渡态金属催化剂、产品立体选择性低等不足。

转氨酶是催化酮类至手性胺的直接氨基化的特异类型的酶。对映体纯手性胺在合成具有广泛生物活性的许多药物化合物中是关键中间体。目前在进行许多努力以利用生物催化剂开发用于它们制备的有效催化方法。近期，转氨酶已经显现出作为用于手性胺生产的有希望的生物催化剂。

目前已经报道几类手性胺合成生物催化剂，如转氨酶类，单胺氧化酶类，亚胺还原酶类及胺脱氢酶类等，其中最有工业应用前景是ω-转氨酶（ω-TAs），虽然大量新型TAs被报道，但能用于制药工业的为数不多。ω-TAs的工业广泛应用受限于酶不稳定性及反应可逆性。

我们已获得授权的专利野生酶ATA-W12（中国专利：CN106520719B）以其优良的热稳定型，高浓度异丙胺的兼容性成为新型具有工业潜力的ω-TAs，其氨基酸序列为SEQ IDNO：1，已经实现了(S)-(+)- 1-Boc-3-氨基哌啶的工业化生产。虽然ATA-W12具有天然的工业用潜力，但其催化效率低，很难使生产效率进一步提升。

发明内容

本发明的目的在于提供一种转氨酶高活性突变体，以提高催化效率，使生产效率进一步提升。

为此，本发明公开了一种S型ω-转氨酶高活性的突变体，其氨基酸序列为基于但不同于SEQ ID NO:1，并且与SEQ ID NO:1相比，所述突变体中的残基差异是是25位的谷氨酰胺突变为酪氨酸或苯丙氨酸，突变体简称为Q25Y和Q25F；或64位置的色氨酸突变为亮氨酸或半胱氨酸，突变体简称为W64L和W64C。进一步地，所述突变体，其氨基酸序列为SEQ IDNO：2~5中之一所示。

进一步地，所述突变体，其氨基酸序列优选为SEQ ID NO：2。

在另一个方面，本发明公开内容提供了编码S型ω-转氨酶高活性突变体的多核苷酸、以及包含该多核苷酸的表达载体、和能够表达编码S型ω-转氨酶高活性突变体的多核苷酸的宿主细胞。所述多核苷酸序列为SEQ ID NO:6、7、8、9中之一。

在一些实施方案中，本发明公开内容还提供了S型ω-转氨酶高活性突变体的制备方法，其中该方法可包括在适合于表达酶的条件下培养能够表达编码工程化S型ω-转氨酶高活性突变体的多核苷酸的宿主细胞。

在一些实施方案中，制造工程化S型ω-转氨酶高活性突变体的方法还可包括：

(a)合成编码S型ω-转氨酶高活性突变体的多核苷酸，其核苷酸序列如：SEQ ID NO::6、7、8、9中之一；

(b)表达由多核苷酸编码的S型ω-转氨酶。

在另一个方面，本发明公开内容提供了所述S型ω-转氨酶高活性突变体作为生物催化剂的用途，优选为手性胺合成生物催化剂的用途。

在另一个方面，本发明公开内容提供了一种固定化转氨酶，所述突变体固定在固体支持物上；在一些实施方案中，所述固体支持物为甲基丙烯酸酯的树脂，所述突变体与所述树脂连接。

本发明所公开转氨酶突变体具有很好的催化活性及特异性，在转氨酶突变体制备的手性胺过程中提高反应速率，减少了酶用量，降低了后处理的难度。

附图说明

图1 ATA-W12 突变体纯化蛋白鉴定。

图2 ATA-W12和突变体对1-Boc-3-哌啶酮催化20min OD值变化。

图3 ATA-W12 和突变体对1-Boc-3-吡咯烷酮催化20min OD值变化。

图4 ATA-W12 突变体与野生酶相对活性比较。

具体实施方式

1、术语

关于本公开内容，除非另外具体指明，否则本文的说明书中使用的技术术语和科学术语将具有本领域普通技术人员通常理解的含义。因此，以下术语意为具有以下含义。

“蛋白”、“多肽”和“肽”在本文中可互换使用，表示通过酰胺键共价连接的至少两个氨基酸的聚合物，而不论长度或翻译后修饰(例如，糖基化、磷酸化、脂化、肉豆蔻化(myristilation)、泛素化等等)。在这一定义中包括D-氨基酸和L-氨基酸，以及D-氨基酸和L-氨基酸的混合物。

“多核苷酸”或“核酸”和“DNA”在本文中可互换使用，是指共价地连接在一起的两个或更多个核苷。多核苷酸可完全由核糖核苷(即，RNA)组成，完全由2’-脱氧核糖核苷酸(即，DNA)组成或由核糖核苷和2’-脱氧核糖核苷的混合物组成。尽管核苷将通常通过标准磷酸二酯键合连接在一起，但多核苷酸可包括一个或多个非标准的键合。多核苷酸可以是单链的或双链的，或可包括单链区和双链区两者。此外，虽然多核苷酸将通常由天然存在的编码核碱基(即，腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成，但其可包括一个或更多个修饰的和/或合成的核碱基，诸如，例如，肌苷、黄嘌呤、次黄嘌呤等。优选地，这种修饰的或合成的核碱基将为编码核碱基。

“转氨酶”或“氨基转移酶”在本文可互换使用，以指具有从伯胺将氨基(NH2)转移至受体分子的羰基(C＝O)的酶促能力的酶。如本文所用的转氨酶包括天然存在的(野生型)转氨酶以及由人工操作产生的非天然存在的工程化多肽。

“氨基受体”和“胺受体”、“酮底物”、“酮基”、和“酮”在本文可互换使用以指接受来自供体胺的氨基基团的羰基(酮基、或酮)化合物。在一些实施方案中，氨基受体是以下通式的分子

其中，R^α与R^β中的每一个当独立地被采用时，是烷基、环烷基、杂环烷基、芳基或杂芳基，其可以是未被取代的或用一个或更多个酶学上可接受的基团取代的。R^α可在结构或手性上与R^β相同或不同。在一些实施方案中，R^α与R^β，一起可形成为未被取代的、取代的或稠合至其他环的环。氨基受体包括酮基羧酸和链烷酮(酮)。典型的酮基羧酸是α-酮基羧酸诸如乙醛酸、丙酮酸、草酰乙酸和类似的酮基羧酸，以及这些酸的盐。氨基受体还包括由其他酶或全细胞进程转化为氨基受体的物质，诸如富马酸(其可被转化为草酰乙酸)、葡萄糖(其可被转化为丙酮酸盐)、乳酸盐、马来酸以及其他。可被使用的氨基受体包括，通过举例的方式而非限制，3,4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、苯乙酮、3’-羟基苯乙酮、2-甲氧基-5-氟苯乙酮、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1-苯基丁-1-酮、1-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基)丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸，包括可能的(R)和(S)单异构体二者。

“氨基供体”或“胺供体”是指向氨基受体给予氨基，因此成为羰基物质的氨基化合物。在一些实施方案中，氨基供体是以下通式的分子，

其中，R^ε与R^δ中的每一个当独立地被采用时，是烷基、环烷基、杂环烷基、芳基或杂芳基，其是未被取代的或用一个或更多个酶学上非抑制基团取代的。Rε可在结构或手性上与Rδ相同或不同。在一些实施方案中，R^ε与R^δ，一起可形成为未被取代的、取代的或稠合至其他环的环。可使用的典型的氨基供体包括手性与非手性氨基酸、以及手性与非手性胺。可使用的氨基供体包括，通过举例的方式而非限制，异丙胺(也称为2-氨基丙烷)、α-苯乙胺(也称为1-苯乙胺)以及其对映异构体(S)-1-苯乙胺与(R)-1-苯乙胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸单钠、L-丙氨酸、D-丙氨酸、D,L-丙氨酸、L-天冬氨酸、L-赖氨酸、D,L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺(也被称为腐胺)、1,6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢化萘、2-氨基四氢化萘、2-氨基-5-甲氧基四氢化萘和1-氨基茚满，包括可能的(R)和(S)单异构体二者且包括该胺的所有可能的盐。

“手性胺”是指通式Rα-CH(NH2)-Rβ的胺并且以其最广泛的意义在本文中使用，包括多种不同和混合的官能类型的脂族和脂环族化合物，特征在于与仲碳原子结合的伯氨基的存在，该仲碳原子除了氢原子之外还携带(i)形成手性环状结构的二价基团，或(ii)在结构或手性上彼此不同的两个取代基(除了氢)。形成手性环状结构的二价基团包括，例如，2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。在仲碳原子上的两种不同的取代基(上述Rα和Rβ)还可广泛地变化，且包括烷基、芳烷基、芳基、卤代、羟基、低级烷基、低级烷氧基、低级烷基硫、环烷基、羧基、烷氧羰基(carbalkoxy)、氨基甲酰基、单(低级烷基)取代的氨基甲酰基和二(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单(低级烷基)取代的氨基和二(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰胺基、芳基甲酰胺基等，以及由前述基团取代的烷基、芳烷基或芳基。

“吡哆醛磷酸”、“PLP”、“吡哆醛-5’-磷酸”、“PYP”和“P5P”在本文中可互换使用以指在转氨酶反应中充当辅酶的化合物。在一些实施方案中，吡哆醛磷酸由结构1-(4’-甲酰基-3’-羟基-2’-甲基-5’-吡啶基)甲氧基膦酸定义，CAS号[54-47-7]。吡哆醛-5’-磷酸可通过吡哆醇(也被称为维生素B6)的磷酸化和氧化在体内产生。在使用转氨酶类的氨基转移反应中，氨基供体的胺基被转移到辅酶以产生酮基副产物，同时吡哆醛-5’-磷酸被转化成磷酸吡哆胺。吡哆醛-5’-磷酸通过与不同的酮基化合物(氨基受体)反应而被再生。胺基从磷酸吡哆胺向氨基受体的转移产生胺并再生辅酶。在一些实施方案中，吡哆醛-5’-磷酸可以被维生素B6家族的其它成员代替，包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM)，和它们的磷酸化的对应物；磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。

“编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如，基因)。

“天然存在的”或“野生型”是指在自然界发现的形式。例如，天然存在的或野生型多肽或多核苷酸序列是生物体中存在的序列，其可从天然来源分离且未通过人为操纵而被有意识地修改。

“突变体”是指相对于野生型，某个性状发生可遗传变异或某个基因发生突变的生物体材料。

当关于例如细胞、核酸或多肽使用时，“重组的”或“工程化的”或“非天然存在的”指如下材料或与该材料的自然或天然形式相应的材料：已经以天然本来不存在的方式被修饰或与其相同但由合成的材料产生或衍生和/或通过使用重组技术操作产生。非限制性实例包括，表达在细胞的天然(非重组的)形式中未发现的基因或表达另外以不同的水平被表达的天然基因的重组细胞以及其他。

“序列同一性的百分比”和“同源性百分比”在本文可互换使用以指多核苷酸和多肽之间的对比，并通过跨比较窗比较两条最佳比对的序列来确定，其中多核苷酸或多肽序列在比较窗中的部分参考序列相比可以包括添加或缺失(即，缺口)，以用于两条序列的最佳比对。百分比可以如下计算：通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目，以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。可选地，百分比可以如下计算：通过确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与缺口对齐的位置的数目，以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。本领域的技术人员理解，存在许多可用于比对两个序列的已建立的算法。用于比较的最佳序列比对可如下进行，例如，通过Smith和Waterman，1981，Adv.Appl.Math.2:482的局部同源性算法，通过Needleman和Wunsch，1970，J.Mol.Biol.48:443的同源性比对算法，通过Pearson和Lipman，1988，Proc.Natl.Acad.Sci.USA 85:2444的相似度检索方法，通过这些算法的计算机实现(在GCGWisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)，或通过目测(通常参见，CurrentProtocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols,ajointventure between Greene Publishing Associates,Inc.and John Wiley&Sons,Inc.,(1995增刊)(Ausubel))。适合用于确定序列同一性百分比和序列相似性的算法的实例是BLAST和BLAST 2.0算法，其被分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410以及Altschul等人,1977,Nucleic Acids Res.3389-3402中。用于进行BLAST分析的软件为通过美国国家生物技术信息中心网站公共可获得的。这一算法包括首先通过识别查询序列(query sequence)中具有长度W的短字来确定高评分序列对(HSP)，当其与数据库序列中相同长度的字比对时，所述短字匹配或满足某个正值阈值评分T。T被称为邻近字评分阈值(Altschul等人，如上述)。这些最初的邻近字匹配(word hit)用作启动检索的种子以找到更长的包括它们的HSP。然后字匹配沿着每个序列的两个方向延伸到累积比对评分不能增加的程度。对于核苷酸序列，累积评分使用参数M(用于一对匹配残基的奖励评分；总是>0)和N(用于错配残基的惩罚评分；总是<0)来计算。对于氨基酸序列，使用评分矩阵以计算累积评分。当发生以下情况时字匹配在每个方向的延伸停止：累积比对评分从其最大获得的值下降了量X时；由于一个或多个负评分残基比对的累积，累积评分变成零或以下时；或达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M＝5、N＝-4、以及两个链的比较作为缺省参数。对于氨基酸序列，BLASTP程序使用3的字长(W)、10的期望值(E)，和BLOSUM62评分矩阵作为缺省(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA 89:10915)。序列比对与％序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序，使用提供的缺省参数。

“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集，例如，全长基因或多肽序列的区段。通常，参考序列为至少20个核苷酸或氨基酸残基的长度，至少25个残基的长度，至少50个残基的长度，或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即，完整序列的一部分)，且(2)还可包括在两种序列之间不同的序列，所以两种(或更多种)多核苷酸或多肽之间的序列比较通常通过在“比较窗”内比较两种多核苷酸或多肽的序列来进行，以确定和比较具有序列相似性的局部区域。在一些实施方案中，“参考序列”可基于基本氨基酸序列，其中参考序列为可在基本序列中具有一个或更多个变化的序列。例如，“基于SEQ ID NO:1、在相应于Q25的残基已经改变成色氨酸的参考序列。

“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性片段，其中序列可与至少20个连续的核苷酸或氨基酸的参考序列进行比较，并且其中在比较窗中序列的一部分与用于两个序列的最佳比对的参考序列相比，可以包括20％或更少的添加或缺失(即，空位)。比较窗可以比20个连续的残基更长，并任选地包括30、40、50、100或更长的窗。

“基本同一性”指以下的多核苷酸或多肽序列，其与参考序列相比，在至少20个残基位置的比较窗内，经常在至少30-50个残基的比较窗内，具有至少80％序列同一性、至少85％同一性和89％至95％序列同一性、更通常至少99％序列同一性，其中序列同一性百分比通过在比较窗内比较参考序列与包括总计参考序列的20％或更少的缺失或添加的序列来计算。在应用于多肽的特定的实施方式中，术语“基本同一性”指当最佳比对时，如通过程序GAP或BESTFIT使用缺省空位权重，两种多肽序列共有至少80％的序列同一性，优选地至少89％的序列同一性，至少95％的序列同一性或更多(例如99％的序列同一性)。优选地，不相同的残基位置通过保守的氨基酸取代而不同。

当在给定的氨基酸或多核苷酸序列编号的上下文中使用时，“对应于”、“关于”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列相比时，参考序列的残基编号。换言之，给定的聚合物的残基数目或残基位置关于参考序列被指定，而不是通过给定的氨基酸或多核苷酸序列内的残基的实际的数字位置被指定。例如，给定的氨基酸序列，如工程化转氨酶的氨基酸序列，可以通过引入空位以优化两个序列之间的残基匹配，与参考序列比对。在这些情况中，虽然存在空位，给定的氨基酸或多核苷酸序列中残基的编号是关于与其比对的参考序列作出。

“氨基酸差异”或“残基差异”是指相对于参考序列中在相应位置上的氨基酸残基，在多肽序列的位置上的氨基酸残基中的变化。氨基酸差异的位置通常在本文中称为“Xn”，其中n是指残基差异基于其的参考序列中的相应位置。例如，“与SEQ ID NO:1相比在位置X25上的残基差异”是指相应于SEQ ID NO:1的位置25的氨基酸残基的变化。因此，如果SEQID NO:2的在位置25上具有谷胺酰胺，那么“与SEQ ID NO:1相比在位置X25上的残基差异”，在相应于SEQ ID NO:1的位置25的多肽位置上的酪氨酸以外的任何残基的氨基酸置换。在本文大多数情况下，位置上的特定氨基酸残基差异表示为“XnY”，其中“Xn”指定如上所述的相应位置，且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即，与参考多肽相比的不同残基)。在一些实施方案中，当多于一个氨基酸可出现在特定残基位置中时，备选的氨基酸可以形式XnY/Z列出，其中Y和Z表示替代的氨基酸残基。在一些情况下，本公开内容还提供了由常规表示法“AnB”表示的特定氨基酸差异，其中A是参考序列中残基的单字母标识符，“n”是参考序列中的残基位置的数目，且B是工程化多肽的序列中的残基置换的单字母标识符。此外，在一些情况下，本公开内容的多肽相对于参考序列可包括一个或更多个氨基酸残基差异，这由相对于参考序列做出变化的一列特定位置指示。

“保守氨基酸置换”指用具有相似侧链的不同残基置换残基，并且因此，通常涉及用在相同或相似定义类别的氨基酸内的氨基酸置换多肽中的氨基酸。通过示例的方式而非限制，具有脂族侧链的氨基酸可被另一个脂族氨基酸置换，例如，丙氨酸、缬氨酸、亮氨酸和异亮氨酸；具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸置换，例如，丝氨酸和苏氨酸；具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换，例如，苯丙氨酸、酪氨酸、色氨酸和组氨酸；具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸置换，例如，赖氨酸和精氨酸；具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸置换，例如，天冬氨酸或谷氨酸；且疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性氨基酸置换。

“非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨基酸。非保守置换可以利用限定组之间，而不是它们之内的氨基酸，并影响(a)置换的区域中肽骨架的结构(例如，脯氨酸置换甘氨酸)(b)电荷或疏水性，或(c)侧链的体积。通过示例的方式而非限制，示例性的非保守置换可以是酸性氨基酸被碱性或脂族氨基酸置换；芳香族氨基酸被小氨基酸置换；以及亲水性氨基酸被疏水性氨基酸置换。

“缺失”是指通过从参考多肽去除一个或多个氨基酸而对多肽进行的修饰。缺失可以包括除去1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至组成参考酶的氨基酸总数的10％、或多至氨基酸总数的20％，同时保留酶活性和/或保留工程化转氨酶的改进特性。缺失可以涉及多肽的内部和/或端部。在各个实施方案中，缺失可以包括连续的区段或可以是不连续的。

“插入”是指通过向参考多肽添加一个或多个氨基酸而对多肽进行的修饰。在一些实施方案中，改进的工程化转氨酶类包括一个或多个氨基酸插入天然存在的转氨酶多肽，以及一个或多个氨基酸插入其它改进的转氨酶多肽。插入可以是在多肽的内部或到羧基或氨基末端。如本文所用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由参考多肽中的一个或更多个氨基酸分隔。

如本文所用的“片段”是指如下多肽：所述多肽具有氨基端和/或羧基端缺失，但剩余的氨基酸序列与该序列中相应位置相同。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长，以及多至全长转氨酶多肽。

“分离的多肽”是指如下多肽：所述多肽与其天然伴随的其它污染物，例如，蛋白、脂质和多核苷酸基本上分离。术语包括已从它们天然存在环境或表达系统(例如，宿主细胞或体外合成)中除去或纯化的多肽。改进的转氨酶类可以存在于细胞内，存在于细胞培养基中，或以各种形式制备，诸如溶解产物或分离的制剂。因此，在一些实施方案中，改进的转氨酶类可以是分离的多肽。

“基本上纯的多肽”是指如下组合物，在所述组合物中多肽物质是存在的优势物质(即，在摩尔基础或重量基础上，它比在该组合物中的任何其它个体大分子物质更丰富)，并且当目标物质构成存在的大分子物质的按摩尔或％重量计至少约50％时，一般是基本上纯化的组合物。一般而言，基本上纯的转氨酶组合物将构成该组合物中存在的所有大分子物质的按摩尔或％重量计约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多以及约98％或更多。在一些实施方案中，将目标物质纯化至基本的均一性(即，通过常规检测方法不能在组合物中检测出污染物质)，其中组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)、以及元素离子物质不被认为是大分子物质。在一些实施方案中，分离的改进的转氨酶多肽是基本上纯的多肽组合物。

“立体选择性”是指在化学反应或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的，其中一种立体异构体的形成优于另一种立体异构体的形成，或立体选择性可以是完全的，其中只形成一种立体异构体。当立体异构体是对映体时，立体选择性被称为对映体选择性，即一种对映体在两种对映体的总和中的分数(通常被报告为百分比)。它在本领域通常可选择地被报告为(通常为百分比)对映体过量，其根据以下式计算[主要对映体-次要对映体]/[主要对映体+次要对映体]。当立体异构体是非对映异构体时，立体选择性被称为非对映选择性，即一种非对映体在两种非对映体的混合物中的分数(通常被报告为百分比)，通常可选择地报告为非对映体过量。对映体过量和非对映体过量是立体异构体过量的类型。

“高立体选择性”是指能够将底物例如化合物(2)转化为其对应的具有至少约85％立体异构体过量的手性胺产物例如化合物(1)的化学或酶促反应。

“改进的酶特性”是指相比于参考转氨酶表现出任何酶特性的改进的转氨酶多肽。对于本文描述的工程转化氨酶多肽，通常对野生型转氨酶进行比较，虽然在一些实施方案中，参考转氨酶可以是另一工程化转氨酶。期望改进的酶特性包括，但不限于，酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制剂的耐受性(例如，底物或产物抑制)、和立体选择性(包括对映体选择性)。

“增加的酶活性”是指工程化转氨酶多肽的改进特性，其可被表示为与参考转氨酶相比，增加的比活性(例如，产生的产物/时间/重量蛋白)，或底物至产物的增加的转化率百分比(例如，在指定的时间段使用指定量的转氨酶，起始量的底物至产物的转化率百分比)。确定酶活性的示例性方法被提供于实施例中。可影响与酶活性相关的任何特性，包括经典的酶特性Km、Vmax或kcat，它们的改变能够导致增加的酶活性。酶活性的改进可以是从相应的野生型转氨酶的酶活性的约1.2倍，到相比于天然存在的转氨酶或从其衍生转氨酶多肽的另一种工程化转氨酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更大的酶活性。转氨酶活性可通过标准测定中的任何一个来测量，诸如通过监测反应物或产物的分光光度法性质中的变化。在一些实施方案中，产生的产物的量可以通过高效液相色谱法(HPLC)分离结合诸如o-酞二醛(OPA)衍生化后的UV吸光度或荧光检测来测量。使用确定的酶制剂、在设定条件下的确定的测定(defined assay)、和一种或更多种确定的底物进行酶活性的比较，如本文进一步详细地描述的。通常，当比较溶解产物时，细胞的数目和测定的蛋白的量被确定，并使用相同的表达系统和相同的宿主细胞以将由宿主细胞产生的和溶解产物中存在的酶的量的变化最小化。

“转化率”是指底物至相应的产物的酶促转化率。“转化率百分比”是指在指定条件下一段时间内被转化为产物的底物的百分比。因此，转氨酶多肽的“酶活性”或“活性”可表示为底物至产物的“转化率百分比”。

“热稳定的”是指与野生型酶相比，转氨酶多肽在暴露于高温(例如，40℃-80℃)持续一段时间(例如，0.5-24小时)之后维持相似活性(例如，大于60％至80％)。

“溶剂稳定的”指与野生型酶相比，转氨酶多肽在暴露于不同浓度(例如5-99％)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24小时)之后维持相似的活性(多于例如60％至80％)。

“热且溶剂稳定的”指热稳定的且溶剂稳定的转氨酶多肽。

“异源的”多核苷酸指通过实验技术被引入宿主细胞的任何多核苷酸，且包括从宿主细胞取出，接受实验处理并然后再引入宿主细胞的多核苷酸。

“密码子优化”指编码蛋白的多核苷酸的密码子变化为具体的生物体中优先使用的那些，以使编码的蛋白在受关注的生物体中被有效地表达。尽管遗传密码是简并的，即大多数氨基酸由称为“同义的(synonyms)”或“同义(synonymous)”密码子的几个密码子表示，但熟知的是：具体的生物体的密码子使用是非随机的并且偏向特定的密码子三联体。对于给定的基因、共同功能或遗传起源的基因、高度表达的蛋白对低拷贝数(low copy number)蛋白、和生物体基因组的聚集蛋白编码区、这一密码子使用偏好可以更高。在一些实施方案中，编码转氨酶的多核苷酸可以为表达选择的宿主生物体的最佳生产而进行密码子优化。

“优选地、最佳的、高度密码子使用偏好密码子”互换地指以下的密码子，其以比编码相同的氨基酸的其它密码子更高的频率在蛋白编码区中被使用。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高度表达的基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关的生物体的聚集蛋白编码区中的密码子频率、或其组合确定。频率随着基因表达水平增加的密码子通常是用于表达的最佳密码子。已知多种方法用于确定特定的生物体中的密码子频率(例如密码子使用、相对的同义密码子的使用)和密码子偏好，包括多变量分析，例如，使用聚类分析或对应分析，和基因中使用的密码子的有效数目(参见GCG CodonPreference，Genetics Computer Group Wisconsin Package；CodonW，John Peden，University of Nottingham；McInerney，J.O，1998，Bioinformatics14:372-73；Stenico等人，1994，Nucleic Acids Res.222437-46；Wright，F.，1990，Gene87:23-29)。对于增长的生物体列表密码子使用表是可获得的(参见，例如，Wada等人，1992，Nucleic Acids Res.20:2111-2118；Nakamura 等人，2000，Nucl.AcidsRes.28:292；Duret,等人，如上述；Henaut和Danchin，“Escherichia coli andSalmonella,”1996，Neidhardt,等人编，ASM Press，Washington D.C.，2047-2066页。用于获得密码子使用的数据来源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集合包括实际上已知编码表达的蛋白(例如完整的蛋白编码序列-CDS)、表达的序列标签(ESTS)、或预测的基因组序列的编码区的核酸序列(参见，例如，Mount，D.，Bioinformatics:Sequence andGenome Analysis，第8章，Cold Spring HarborLaboratory Press，Cold Spring Harbor，N.Y.，2001；Uberbacher，E.C.，1996，MethodsEnzymol.266:259-281；Tiwari等，1997，Comput.Appl.Biosci.13:263-270)。

“控制序列”在本文被定义为包括对于本公开内容的多核苷酸和/或多肽的表达是必需的或有利的所有组分。对于编码多肽的核酸序列，每个控制序列可以是天然的或外来的。这些控制序列包括但不限于：前导序列(leader)、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子、和转录和翻译终止信号。控制序列可以与连接子一起被提供，以用于引入促进控制序列与编码多肽的核酸序列的编码区域的连接的特定的限制位点。

“可操作地连接”在本文被定义为以下的构型，其中控制序列被适当地置于(即，处于功能性关系)与受关注的多核苷酸有关的位置以使控制序列指导或调节受关注的多核苷酸和/或多肽的表达。

“启动子序列”指被宿主细胞识别用于受关注的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含转录控制序列，其介导受关注的多核苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列，其包括突变体、截短的和杂合启动子，并且可以获自编码对于宿主细胞同源的或异源的细胞外或细胞内多肽的基因。

“适当的反应条件”是指在生物催化反应溶液中的那些条件(例如，酶载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围)，在上述条件下本公开内容的转氨酶多肽能够将底物化合物转化为产物化合物。示例性的“适当的反应条件”被提供在详细说明中，并通过实施例说明。

“载量”，诸如在“化合物载量”或“酶载量”或“辅因子载量”中是指在反应开始时反应混合物中组分的浓度或量。

在生物催化剂介导的方法的上下文中的“底物”是指由生物催化剂作用的化合物或分子。

在生物催化剂介导的方法的上下文中的“产物”是指由生物催化剂的作用产生的化合物或分子。

2、工程化转氨酶突变体

本发明公开内容提供了具有转氨酶活性的工程化S型ω-转氨酶高活性突变体、编码其的多核苷酸、以及使用该突变体的方法。当上文描述涉及多肽时，应理解，其还描述了编码该突变体的多核苷酸。

野生酶的活性较低，酶使用量较大。为了解决上述问题，本发明通过定向进化的手段对野生酶进行蛋白质改造，提高酶的活性和立体选择性，开发出可用于工业化生产的转氨酶。

中国专利：CN106520719B所述内容一并引入本发明说明书。

发明人通过定向进化的方法对来源于中国专利：CN106520719B所述野生酶ATA-W12进行定向进化，提高酶活、降低酶使用量的同时，又进一步提高了酶的立体选择性。

具体的，以来源于中国专利：CN106520719B所述野生酶ATA-W12，其氨基酸序列为SEQ ID NO：1为模板，通过采用计算机对转氨酶和底物的三维结构进行对接模拟分析，在酶催化中心附近选择一些氨基酸，可能与酶活有很大关系。在构建的点突变的基础上，对这些可能有影响的氨基酸位点进行饱和突变，以获得活性大幅度提高的突变体。

其中，饱和突变是通过对目的蛋白的编码基因进行改造，短时间内获取靶位点氨基酸分别被其它19种氨基酸替代的突变体的一种方法。此方法不仅是蛋白质定向改造的强有力工具，而且是蛋白质结构－功能关系研究的重要手段。饱和突变往往能获得比单点突变更为理想的进化体。而对于定点突变方法不能解决的这些问题，恰恰是饱和突变方法所擅长的独特之处。

在饱和突变获得活性提高的突变体基础上，可对有益的氨基酸位点进行组合，以获得性状更优的突变体。组合突变中双点突变的构建方法和单点突变的构建方法一样，采用全质粒PCR法构建。同时突变2个及以上位点的多点突变通过采用重叠延伸PCR扩增进行，获得含多点突变的突变基因，两端经限制性内切酶酶切后，连接到表达载体上，转化至大肠杆菌细胞内，涂布于含有100μg/mL氨苄青霉素的LB培养皿中，37℃培养过夜，获得组合突变体，测序鉴定。

在饱和突变获得活性提高的突变体基础上，可对有益的氨基酸位点进行组合，以获得性状更优的突变体。组合突变中双点突变的构建方法和单点突变的构建方法一样，采用全质粒PCR法构建。同时也可突变2个及以上位点的多点突变通过采用重叠延伸PCR扩增进行，获得含多点突变的突变基因，两端经限制性内切酶酶切后，连接到表达载体上，转化至大肠杆菌细胞内，涂布于含有100μg/mL氨苄青霉素的LB培养皿中，37℃培养过夜，获得组合突变体，测序鉴定。

重叠延伸PCR技术(gene splicing by overlap extension PCR，简称SOEPCR)是采用具有互补末端的引物，使PCR产物形成了重叠链，从而在随后的扩增反应中通过重叠链的延伸，将不同来源的扩增片段重叠拼接起来。此技术利用PCR技术能够在体外进行有效的基因重组，常常被用于多点突变的构建中。

根据本发明一种典型的实施方式，提供一种转氨酶突变体。该转氨酶突变体的氨基酸序列为基于SEQ ID NO:1并且与SEQ ID NO:1相比，所述工程化多肽中的残基差异是是25位的谷氨酰胺突变为酪氨酸或苯丙氨酸，突变体简称为Q25Y和Q25F；或64位置的色氨酸突变为亮氨酸或半胱氨酸，突变体简称为W64L和W64C；更优选的，突变至少还包括如下突变位点或突变位点组合之一：Q25Y、Q25F、W65L、W65C。

根据本发明一种典型的实施方式，提供一种DNA分子。该DNA分子编码上述转氨酶突变体。该DNA分子编码的上述转氨酶突变体具有高可溶性表达特性以及高活力特性。

本发明的上述DNA分子还可以以“表达盒”的形式存在。“表达盒”是指线性或环状的核酸分子，涵盖了能够指导特定核苷酸序列在恰当宿主细胞中表达的DNA和RNA序列。一般而言，包括与目标核苷酸有效连接的启动子，其任选的是与终止信号和/或其他调控元件有效连接的。表达盒还可以包括核苷酸序列正确翻译所需的序列。编码区通常编码目标蛋白，但在正义或反义方向也编码目标功能RNA，例如反义RNA或非翻译的RNA。包含目标多核苷酸序列的表达盒可以是嵌合的，意指至少一个其组分与其至少一个其他组分是异源的。表达盒还可以是天然存在的，但以用于异源表达的有效重组形成获得的。

根据本发明一种典型的实施方式，提供一种重组质粒。该重组质粒含有上述任一种DNA分子。上述重组质粒中的DNA分子置于重组质粒的适当位置，使得上述DNA分子能够正确地、顺利地复制、转录或表达。

虽然本发明在限定上述DNA分子时所用限定语为“含有”，但其并不意味着可以在DNA序列的两端任意加入与其功能不相关的其他序列。本领域技术人员知晓，为了满足重组操作的要求，需要在DNA序列的两端添加合适的限制性内切酶的酶切位点，或者额外增加启动密码子、终止密码子等，因此，如果用封闭式的表述来限定将不能真实地覆盖这些情形。

本发明中所使用的术语“质粒”包括双链或单链线状或环状形式的任何质粒、粘粒、噬菌体或农杆菌二元核酸分子，优选为重组表达质粒，可以是原核表达质粒也可以是真核表达质粒，但优选原核表达质粒，在某些实施方案中，重组质粒选自pET-22a(+)、pET-22b(+)、pET-3a(+)、pET-3d(+)、pET-11a(+)、pET-12a(+)、pET-14b(+)、pET-15b(+)、pET-16b(+)、pET-17b(+)、pET-19b(+)、pET-20b(+)、pET-21a(+)、pET-23a(+)、pET-23b(+)、pET-24a(+)、pET-25b(+)、pET-26b(+)、pET-27b(+)、pET-28a(+)、pET-29a(+)、pET-30a(+)、pET-31b(+)、pET-32a(+)、pET-35b(+)、pET-38b(+)、pET-39b(+)、pET-40b(+)、pET-41a(+)、pET-41b(+)、pET-42a(+)、pET-43a(+)、pET-43b(+)、pET-44a(+)、pET-49b(+)、pQE2、pQE9、pQE30、pQE31、pQE32、pQE40、pQE70、pQE80、pRSET-A、pRSET-B、pRSET-C、pGEX-5X-1、pGEX-6p-1、pGEX-6p-2、pBV220、pBV221、pBV222、pTrc99A、pTwin1、pEZZ18、pKK232-18、pUC-18或pUC-19。更优选，上述重组质粒是pET-22b(+)。

根据本发明一种典型的实施方式，提供一种宿主细胞，宿主细胞含有上述任一种重组质粒。适用于本发明的宿主细胞包括但不仅限于原核细胞、酵母或真核细胞。优选原核细胞为真细菌，例如革兰氏阴性菌或革兰氏阳性菌。更优选原核细胞为大肠杆菌BL21细胞或大肠杆菌DH5α感受态细胞。

在一些实施方案中，在宿主细胞中表达的任何工程化转氨酶可以使用任何一种或更多种熟知的蛋白纯化方法从细胞和或培养介质回收，方法包括，溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法以及其他。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的适合的溶液被提供于实施例中，并且还是例如从 St.Louis MO的Sigma-Aldrich以商标名CelLytic BTM商业上可获得的。

用于分离转氨酶多肽的色谱方法包括，反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法以及其他。用于纯化具体的酶的条件将部分地取决于如净电荷、疏水性、亲水性、分子量、分子形状等因素，并且对于本领域技术人员将是显然的。

在一些实施方案中，亲和技术可被用于分离改进的转氨酶突变体。对于亲和色谱纯化，可使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生，各种宿主动物，包括但不限于：兔、小鼠、大鼠等，可通过注射转氨酶多肽或其片段而被免疫。借助侧链官能团或连接到侧链官能团的连接子，转氨酶多肽或片段可被连接到适合的载体，诸如BSA。

在一些实施方案中，工程化转氨酶突变体可被提供在固体支持物上，诸如膜、树脂、固体载体(solid carrier)、或其他固相材料。固体支持物可以包括有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚丙烯酰胺以及其共聚物和接枝物。固体支持物还可以是无机的，诸如玻璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的结构可呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或非多孔的，并且可以具有溶胀的或非溶胀的性质。固体支持物可以被配置成孔、凹部或其它容器、器皿(vessel)、特征(feature)或位置(location)的形式。

在一些实施方案中，本公开内容的具有转氨酶活性的工程化突变体可被固定在固体支持物上，使得它们保留它们的相对于SEQ ID NO:1的野生型转氨酶改进的活性、立体选择性、和/或其他改进特性。在一些实施方案中，固定的多肽可促进式(II)的底物化合物或其他适当的底物生物催化转化为式(I)的产物化合物或相应的产物，并且在反应完全后很容易保留(例如，通过保留在其上固定多肽的珠)，并且然后在后续反应中再利用或回收。这样的固定的酶的方法允许更高的效率和成本降低。因此，进一步设想，使用本公开内容的工程化转氨酶突变体的方法中的任一种，可使用结合或固定在固体支持物上的相同的工程化转氨酶多肽来进行。

酶固定的方法是本领域中熟知的。可非共价地或共价地结合工程化转氨酶突。用于缀合和固定酶至固体支持物(例如，树脂、膜、珠、玻璃等等)的各种方法是本领域熟知的并描述于例如：Yi等人，“Covalent immobilization ofω-transaminase fromVibriofluvialis JS17on chitosan beads,”Process Biochemistry 42(5):895-898(May2007)；Martin等人，“Characterization of free and immobilized(S)-aminotransferase for acetophenone production,”Applied MicrobiologyandBiotechnology76(4):843-851(Sept.2007)；Koszelewski等人，“Immobilization ofω-transaminases by encapsulation in a sol-gel/celite matrix,”JournalofMolecular Catalysis B:Enzymatic,63:39-44(Apr.2010)；Truppo等人，“Developmentofan Improved Immobilized CAL-B for the Enzymatic Resolution of aKeyIntermediate to Odanacatib,”Organic Process Research&Development,publishedonline:dx.doi.org/10.1021/op200157c；Hermanson,G.T.,BioconjugateTechniques,Second Edition,Academic Press(2008)；Mateo等人，“Epoxy sepabeads:anovel epoxysupport for stabilization of industrial enzymes via very intensemultipointcovalent attachment,”Biotechnology Progress 18(3):629-34(2002)；以及Bioconjugation Protocols:Strategies and Methods,In Methods inMolecularBiology,C.M.Niemeyer编著,Humana Press(2004)；其每个的公开内容通过引用并入本文。可用于固定本公开内容的工程化转氨酶的固体支持物包括但不限于，包括以下的珠或树脂：具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本公开内容的工程化转氨酶的示例性固体支持物包括但不限于，壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi)，包括以下不同类型的SEPABEAD：EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。

在一些实施方案中，工程化转氨酶突变体可以是各种形式，例如，诸如分离的制剂，作为基本上纯的酶、用编码酶的基因转化的整个细胞、和/或作为细胞提取物和/或此类细胞的溶解产物。酶可以冻干、喷雾干燥、沉淀、或为粗糊料的形式。

3、工程化转氨酶的使用

在另一方面，本文描述一种生产手性胺的方法。该方法包括转氨酶对酮类化合物及氨基供体进行催化转氨基反应的步骤，其中将来自氨基供体的氨基基团转移至氨基受体，例如酮底物，以产生胺。前手性酮受体的使用可导致以对映体过量产生手性胺。通常，用于进行转氨反应的方法包括在适于将氨基受体转化为胺的反应条件下使氨基供体和氨基受体接触本公开内容的工程化转氨酶突变体或与之温育。

应用本发明的转氨酶对酮类化合物及氨基供体进行催化转氨基反应的反应体系中，pH为7～11，优选为8～10，也就是说pH的取值可以任选为7～11中的值，例如7、7.5、8、8、8.6、9、10、10.5等。转氨酶对酮类化合物及氨基供体进行催化转氨基反应的反应体系的温度为25～60℃，更优选为30～60℃，进一步优选为40～50℃，也就是说温度的取值可以任选为25～60℃中的值，例如30、31、32、35、37、38、39、40、42、45、48、50、51、52、55等。转氨酶对酮类化合物及氨基供体进行催化转氨基反应的反应体系中二甲基亚砜体积浓度为0％～50％，例如选10％、15％、18％、20％、30％、35％、38％、40％、42％、48％、49％等。

本领域技术人员公知，在不背离本发明精神的情况下，可以对本发明做出许多修改，这样的修改也落入本发明的范围。且下述实验方法如无特别说明，均为常规方法，所使用的实验材料如无特别说明，均可容易地从商业公司获取。

下面将结合实验数据及实施例进一步说明本发明的有益效果。

1. ATA-W12突变体基因的克隆

（1）引物设计和配制：

设计并合成如下四种单点突变体的引物：

Q25Y-F：TGGCCCACCACCTGCCGGCCtacGCCGATCACAAGGTCATCGC

Q25Y-R：GCGATGACCTTGTGATCGGCgtaGGCCGGCAGGTGGTGGGCCA

Q25F-F：TGGCCCACCACCTGCCGGCCtttGCCGATCACAAGGTCATCGC

Q25F-R：GCGATGACCTTGTGATCGGCaaaGGCCGGCAGGTGGTGGGCCA

W64L-F：TCGACGGCATGGCCGGGCTGctgTGCGTGAACGTCGGCTACGG

W64L-R：CCGTAGCCGACGTTCACGCAcagCAGCCCGGCCATGCCGTCGA

W64C-F：TCGACGGCATGGCCGGGCTGtgcTGCGTGAACGTCGGCTACGG

W64C-R：CCGTAGCCGACGTTCACGCAgcaCAGCCCGGCCATGCCGTCGA

（2）PCR反应体系的配制：

以ATA-W12质粒为模板及以上设计引物，按 TOROGreen® One HS KOD Kit（TOROIVD）说明书设置PCR循环条件：95℃，30sec预变性，35个循环（变性：98℃，10秒；退火：60℃，5秒；延伸：68℃，70sec），4℃孵育。用凝胶电泳鉴定扩增是否成功。

（3） ATA-W12突变体基因的克隆

将如上扩增成功的45ul反应液中加入20U Dpn I内切酶，在37℃消化PCR产物中环状ATA-W12质粒模板1个小时。取4支50ul大肠杆菌BL21(DE3)感受态细胞，加入5ul 4种PCR产物消化液，轻弹后混匀，在冰中静置30min。置于42℃热激90秒，然后再快速转入冰中，使细胞冷却3min。加入450ul 不含抗生素的LB液体培养基中，混匀后37℃台式冷冻振荡器150rpm振荡培养60分钟，进行细胞复苏。复苏的同时将LB固体培养基微波炉加热中融化，冷却到45℃后100ml培养基中加入100ul硫酸卡那霉素（30mg/ml），在超净台中轻轻分装到无菌培养皿中，轻轻混匀平铺，等平板冷却成固体后使用。复苏后感受态细胞5000rpm高速离心3min，弃250ul上清。将剩余的感受态细胞混匀，加到含卡那霉素的固体培养基平皿上，用涂布棒均匀涂开，剩余菌液置于4℃冰箱。涂好的平皿置于室温直至液体被吸收，倒置平板在37℃生化培养箱中培养16h。

（4）单克隆测序鉴定：

每个PCR产物挑单克隆2个，加入10ul无菌水中，混匀悬浮。将22个菌种接种到3ml试管中，混匀后37℃，150rpm振荡培养16h。取培养后的菌体测序确认突变位点是否正确。

2. ATA-W12突变体的表达及纯化

（1）ATA-W12突变体基因的诱导表达

将鉴定成功的4个ATA-W12突变体菌种接种到3ml含卡那霉素的LB液体培养基的试管中，37℃摇床过夜培养。按1%（500ul）的量接种到50ml含卡那霉素的LB液体培养基中，37℃培养菌体使得OD达到0.6-0.8，该过程大约2-3小时。然后在每瓶中加入0.1mM IPTG的50ul置入20℃摇床以200rpm诱导表达培养。用50ml离心管收集诱导表达培养后的菌液，4℃，7000g离心10min收集菌体。弃上清，用50ml0.85%的生理盐水涡旋振荡重悬沉淀，4℃,7000g离心10min收集菌体;该洗涤操作重复一次后倒置控干。用蛋白裂解液2ml涡旋振荡重悬沉淀，转入2ml离心管中，使重悬菌液浓度为20%（0.2g菌泥）用1ml脱盐液重悬。

（2）ATA-W12突变体的纯化及鉴定

取ATA-W12突变体的菌体重悬液1ml装入PI破碎管(杭州遂真)中，加入蛋白纯化的脱盐液在生物样品低温快速制备系统（杭州遂真）进行低温破碎。设置破碎程序为：Shake time，10s；Hold time，1min；T（温度）；4℃；速度，6.50m/s,启动程序，开始低温菌体破碎。菌体破碎结束后，12000rpm 离心5min，取菌体上清。根据磁珠蛋白纯化试剂盒（苏州海狸）的说明书纯化突变体蛋白。纯化结束后，取20μL突变体蛋白纯化液进行蛋白鉴定，鉴定结果如图1所示。

3. 1-PEA动力学法测定ATA-W12突变体活性

（1）ATA-W12突变体蛋白定量

采用NanoReady紫外可见分光光度计测定纯化蛋白的浓度，测定三次取平均值。根据测定结果，将ATA-W12突变酶及ATA-W12野生酶的蛋白浓度稀释到0.05ug/ul，作为酶活力测定酶液。

（2）ATA-W12突变体相对比酶活力分析

参照S Schätzle et al酶动力学分析法配制如下反应液：250mM 1-PEA甲醇溶液1ml，50mM PLP 甲醇溶液200ul, 100mM Tris-HCl buffer ( pH8.0) 98.8ml充分混合配制成供体辅酶反应液100ml，分装每孔1ml到96孔深孔板中。将250mM的1-Boc-3-哌啶酮及1-Boc-3-吡咯烷酮甲醇溶液用100mM Tris-HCl buffer ( pH8.0)稀释20倍，各取200ul加入以上用96孔深孔板中，反复吹打混合配成底物-1-PEA反应液。将4种含0.05ug/ul酶工作液80ul加入到96孔UV Star板中，然后用八排枪同时加入120ul底物-PEA反应液到反应孔中，立即置入酶标仪检测。酶标仪提前设置检测波长245nm，孵育温度37℃，孵育时间20min，孵育前混合30秒。以20min内吸光值的变化来表征四种突变体及野生酶对1-Boc-3-哌啶酮及1-Boc-3-吡咯烷酮的催化活性提高情况，四种突变体在20min的吸光值的变化如图2和图3。

4. 催化活力提高倍数计算

用ATA-W12对两种底物反应在20min内产生的OD值变化值为1，用其他突变体在20min内OD值变化值除以ATA-W12对两种底物反应在20min内产生的OD值变化值，可以计算出各突变体对1-Boc-3-哌啶酮及1-Boc-3-吡咯烷酮的催化活性提升的倍数（见图4）。针对于1-Boc-3-哌啶酮底物提升的倍数为：Q25Y为10.36倍，Q25F-9.71倍，W64C为2.13 倍，W64L为1.78倍。针对于1-Boc-3-吡咯烷酮提升的倍数为：Q25Y为5.51倍，Q25F-4.55倍，W64C为2.64 倍，W64L为3.41倍。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质。

序列表

<110> 华东理工大学

<120> 一种S型ω-转氨酶高活性突变体

<141> 2020-01-17

<160> 9

<170> SIPOSequenceListing 1.0

<210> 2

<211> 468

<212> PRT

<213> Caulobacter sp

<400> 2

Met Thr Ala Pro Leu Arg Asn His Asp Ile Ala Glu Leu Lys Arg Leu

1 5 10 15

Asp Leu Ala His His Leu Pro Ala Gln Ala Asp His Lys Val Ile Ala

20 25 30

Glu Gln Gly Gly Ser Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Ile

35 40 45

His Asp Gly Glu Gly His Gln Ile Leu Asp Gly Met Ala Gly Leu Trp

50 55 60

Cys Val Asn Val Gly Tyr Gly Arg Glu Glu Leu Ala Lys Ala Ala Tyr

65 70 75 80

Asp Gln Met Leu Glu Leu Pro Tyr Tyr Asn Thr Phe Phe Lys Thr Ala

85 90 95

Thr Pro Pro Pro Ile Glu Leu Ala Ala Lys Ile Ala Gln Lys Met Gly

100 105 110

Gly His Leu Ser His Val Phe Tyr Asn Ser Ser Gly Ser Glu Ala Asn

115 120 125

Asp Thr Val Phe Arg Leu Val Arg His Phe Trp Lys Leu Lys Gly Glu

130 135 140

Pro Ser Arg Thr Val Phe Ile Ser Arg Trp Asn Ala Tyr His Gly Ser

145 150 155 160

Thr Val Ala Gly Val Ser Leu Gly Gly Met Lys His Met His Lys Gln

165 170 175

Gly Asp Leu Pro Ile Ala Gly Val Glu His Val Met Gln Pro Tyr Gln

180 185 190

Phe Gly Asp Gly Phe Gly Glu Asp Pro Ala Ala Phe Arg Asp Arg Ala

195 200 205

Val Gln Ala Ile Glu Asp Lys Ile Leu Glu Val Gly Pro Glu Asn Val

210 215 220

Ala Ala Phe Ile Gly Glu Pro Val Gln Gly Ala Gly Gly Val Ile Ile

225 230 235 240

Pro Pro Asp Gly Tyr Trp Pro Ala Val Glu Ala Leu Cys Arg Lys Tyr

245 250 255

Gly Ile Leu Leu Val Cys Asp Glu Val Ile Cys Gly Phe Gly Arg Leu

260 265 270

Gly Gln Trp Phe Gly His Gln His Tyr Gly Ile Lys Pro Asp Leu Ile

275 280 285

Ala Met Ala Lys Gly Leu Ser Ser Gly Tyr Leu Pro Ile Ser Ala Val

290 295 300

Gly Val Ala Asp His Ile Val Ala Glu Leu Arg Glu Lys Gly Gly Asp

305 310 315 320

Phe Ile His Gly Phe Thr Tyr Ser Gly His Pro Thr Ala Ala Ala Val

325 330 335

Ala Leu Lys Asn Ile Glu Ile Met Glu Arg Glu Gly Leu Val Glu Arg

340 345 350

Thr Arg Asp Glu Thr Gly Pro Tyr Leu Ala Gln Ala Leu Ala Ser Leu

355 360 365

Asn Asp His Pro Leu Val Gly Glu Val Arg Ser Leu Gly Leu Ile Gly

370 375 380

Ala Val Glu Ile Val Arg Glu Lys Gly Thr Asn His Arg Phe Leu Asp

385 390 395 400

Lys Glu Gly Glu Ala Gly Pro Ile Val Arg Asp Leu Cys Ile Lys Asn

405 410 415

Gly Leu Met Val Arg Ala Ile Arg Asp Ser Ile Val Cys Cys Pro Pro

420 425 430

Leu Ile Ile Thr Lys Ala Gln Ile Asp Glu Leu Val Gly Ile Ile Arg

435 440 445

Lys Ser Leu Asp Glu Ala Glu Pro Val Leu Arg Ala Leu Lys Pro Lys

450 455 460

Glu Gly Glu Asp

465

<210> 2

<211> 468

<212> PRT

<213> Caulobacter sp

<220>

<221> MUTAGEN

<222> (25)..(25)

<223> Q25Y

<400> 2

Met Thr Ala Pro Leu Arg Asn His Asp Ile Ala Glu Leu Lys Arg Leu

1 5 10 15

Asp Leu Ala His His Leu Pro Ala Tyr Ala Asp His Lys Val Ile Ala

20 25 30

Glu Gln Gly Gly Ser Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Ile

35 40 45

His Asp Gly Glu Gly His Gln Ile Leu Asp Gly Met Ala Gly Leu Trp

50 55 60

Cys Val Asn Val Gly Tyr Gly Arg Glu Glu Leu Ala Lys Ala Ala Tyr

65 70 75 80

Asp Gln Met Leu Glu Leu Pro Tyr Tyr Asn Thr Phe Phe Lys Thr Ala

85 90 95

Thr Pro Pro Pro Ile Glu Leu Ala Ala Lys Ile Ala Gln Lys Met Gly

100 105 110

Gly His Leu Ser His Val Phe Tyr Asn Ser Ser Gly Ser Glu Ala Asn

115 120 125

Asp Thr Val Phe Arg Leu Val Arg His Phe Trp Lys Leu Lys Gly Glu

130 135 140

Pro Ser Arg Thr Val Phe Ile Ser Arg Trp Asn Ala Tyr His Gly Ser

145 150 155 160

Thr Val Ala Gly Val Ser Leu Gly Gly Met Lys His Met His Lys Gln

165 170 175

Gly Asp Leu Pro Ile Ala Gly Val Glu His Val Met Gln Pro Tyr Gln

180 185 190

Phe Gly Asp Gly Phe Gly Glu Asp Pro Ala Ala Phe Arg Asp Arg Ala

195 200 205

Val Gln Ala Ile Glu Asp Lys Ile Leu Glu Val Gly Pro Glu Asn Val

210 215 220

Ala Ala Phe Ile Gly Glu Pro Val Gln Gly Ala Gly Gly Val Ile Ile

225 230 235 240

Pro Pro Asp Gly Tyr Trp Pro Ala Val Glu Ala Leu Cys Arg Lys Tyr

245 250 255

Gly Ile Leu Leu Val Cys Asp Glu Val Ile Cys Gly Phe Gly Arg Leu

260 265 270

Gly Gln Trp Phe Gly His Gln His Tyr Gly Ile Lys Pro Asp Leu Ile

275 280 285

Ala Met Ala Lys Gly Leu Ser Ser Gly Tyr Leu Pro Ile Ser Ala Val

290 295 300

Gly Val Ala Asp His Ile Val Ala Glu Leu Arg Glu Lys Gly Gly Asp

305 310 315 320

Phe Ile His Gly Phe Thr Tyr Ser Gly His Pro Thr Ala Ala Ala Val

325 330 335

Ala Leu Lys Asn Ile Glu Ile Met Glu Arg Glu Gly Leu Val Glu Arg

340 345 350

Thr Arg Asp Glu Thr Gly Pro Tyr Leu Ala Gln Ala Leu Ala Ser Leu

355 360 365

Asn Asp His Pro Leu Val Gly Glu Val Arg Ser Leu Gly Leu Ile Gly

370 375 380

Ala Val Glu Ile Val Arg Glu Lys Gly Thr Asn His Arg Phe Leu Asp

385 390 395 400

Lys Glu Gly Glu Ala Gly Pro Ile Val Arg Asp Leu Cys Ile Lys Asn

405 410 415

Gly Leu Met Val Arg Ala Ile Arg Asp Ser Ile Val Cys Cys Pro Pro

420 425 430

Leu Ile Ile Thr Lys Ala Gln Ile Asp Glu Leu Val Gly Ile Ile Arg

435 440 445

Lys Ser Leu Asp Glu Ala Glu Pro Val Leu Arg Ala Leu Lys Pro Lys

450 455 460

Glu Gly Glu Asp

465

<210> 3

<211> 468

<212> PRT

<213> Caulobacter sp

<220>

<221> MUTAGEN

<222> (25)..(25)

<223> Q25F

<400> 3

Met Thr Ala Pro Leu Arg Asn His Asp Ile Ala Glu Leu Lys Arg Leu

1 5 10 15

Asp Leu Ala His His Leu Pro Ala Phe Ala Asp His Lys Val Ile Ala

20 25 30

Glu Gln Gly Gly Ser Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Ile

35 40 45

His Asp Gly Glu Gly His Gln Ile Leu Asp Gly Met Ala Gly Leu Trp

50 55 60

Cys Val Asn Val Gly Tyr Gly Arg Glu Glu Leu Ala Lys Ala Ala Tyr

65 70 75 80

Asp Gln Met Leu Glu Leu Pro Tyr Tyr Asn Thr Phe Phe Lys Thr Ala

85 90 95

Thr Pro Pro Pro Ile Glu Leu Ala Ala Lys Ile Ala Gln Lys Met Gly

100 105 110

Gly His Leu Ser His Val Phe Tyr Asn Ser Ser Gly Ser Glu Ala Asn

115 120 125

Asp Thr Val Phe Arg Leu Val Arg His Phe Trp Lys Leu Lys Gly Glu

130 135 140

Pro Ser Arg Thr Val Phe Ile Ser Arg Trp Asn Ala Tyr His Gly Ser

145 150 155 160

Thr Val Ala Gly Val Ser Leu Gly Gly Met Lys His Met His Lys Gln

165 170 175

Gly Asp Leu Pro Ile Ala Gly Val Glu His Val Met Gln Pro Tyr Gln

180 185 190

Phe Gly Asp Gly Phe Gly Glu Asp Pro Ala Ala Phe Arg Asp Arg Ala

195 200 205

Val Gln Ala Ile Glu Asp Lys Ile Leu Glu Val Gly Pro Glu Asn Val

210 215 220

Ala Ala Phe Ile Gly Glu Pro Val Gln Gly Ala Gly Gly Val Ile Ile

225 230 235 240

Pro Pro Asp Gly Tyr Trp Pro Ala Val Glu Ala Leu Cys Arg Lys Tyr

245 250 255

Gly Ile Leu Leu Val Cys Asp Glu Val Ile Cys Gly Phe Gly Arg Leu

260 265 270

Gly Gln Trp Phe Gly His Gln His Tyr Gly Ile Lys Pro Asp Leu Ile

275 280 285

Ala Met Ala Lys Gly Leu Ser Ser Gly Tyr Leu Pro Ile Ser Ala Val

290 295 300

Gly Val Ala Asp His Ile Val Ala Glu Leu Arg Glu Lys Gly Gly Asp

305 310 315 320

Phe Ile His Gly Phe Thr Tyr Ser Gly His Pro Thr Ala Ala Ala Val

325 330 335

Ala Leu Lys Asn Ile Glu Ile Met Glu Arg Glu Gly Leu Val Glu Arg

340 345 350

Thr Arg Asp Glu Thr Gly Pro Tyr Leu Ala Gln Ala Leu Ala Ser Leu

355 360 365

Asn Asp His Pro Leu Val Gly Glu Val Arg Ser Leu Gly Leu Ile Gly

370 375 380

Ala Val Glu Ile Val Arg Glu Lys Gly Thr Asn His Arg Phe Leu Asp

385 390 395 400

Lys Glu Gly Glu Ala Gly Pro Ile Val Arg Asp Leu Cys Ile Lys Asn

405 410 415

Gly Leu Met Val Arg Ala Ile Arg Asp Ser Ile Val Cys Cys Pro Pro

420 425 430

Leu Ile Ile Thr Lys Ala Gln Ile Asp Glu Leu Val Gly Ile Ile Arg

435 440 445

Lys Ser Leu Asp Glu Ala Glu Pro Val Leu Arg Ala Leu Lys Pro Lys

450 455 460

Glu Gly Glu Asp

465

<210> 4

<211> 468

<212> PRT

<213> Caulobacter sp

<220>

<221> MUTAGEN

<222> (64)..(64)

<223> W64L

<400> 4

Met Thr Ala Pro Leu Arg Asn His Asp Ile Ala Glu Leu Lys Arg Leu

1 5 10 15

Asp Leu Ala His His Leu Pro Ala Gln Ala Asp His Lys Val Ile Ala

20 25 30

Glu Gln Gly Gly Ser Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Ile

35 40 45

His Asp Gly Glu Gly His Gln Ile Leu Asp Gly Met Ala Gly Leu Leu

50 55 60

Cys Val Asn Val Gly Tyr Gly Arg Glu Glu Leu Ala Lys Ala Ala Tyr

65 70 75 80

Asp Gln Met Leu Glu Leu Pro Tyr Tyr Asn Thr Phe Phe Lys Thr Ala

85 90 95

Thr Pro Pro Pro Ile Glu Leu Ala Ala Lys Ile Ala Gln Lys Met Gly

100 105 110

Gly His Leu Ser His Val Phe Tyr Asn Ser Ser Gly Ser Glu Ala Asn

115 120 125

Asp Thr Val Phe Arg Leu Val Arg His Phe Trp Lys Leu Lys Gly Glu

130 135 140

Pro Ser Arg Thr Val Phe Ile Ser Arg Trp Asn Ala Tyr His Gly Ser

145 150 155 160

Thr Val Ala Gly Val Ser Leu Gly Gly Met Lys His Met His Lys Gln

165 170 175

Gly Asp Leu Pro Ile Ala Gly Val Glu His Val Met Gln Pro Tyr Gln

180 185 190

Phe Gly Asp Gly Phe Gly Glu Asp Pro Ala Ala Phe Arg Asp Arg Ala

195 200 205

Val Gln Ala Ile Glu Asp Lys Ile Leu Glu Val Gly Pro Glu Asn Val

210 215 220

Ala Ala Phe Ile Gly Glu Pro Val Gln Gly Ala Gly Gly Val Ile Ile

225 230 235 240

Pro Pro Asp Gly Tyr Trp Pro Ala Val Glu Ala Leu Cys Arg Lys Tyr

245 250 255

Gly Ile Leu Leu Val Cys Asp Glu Val Ile Cys Gly Phe Gly Arg Leu

260 265 270

Gly Gln Trp Phe Gly His Gln His Tyr Gly Ile Lys Pro Asp Leu Ile

275 280 285

Ala Met Ala Lys Gly Leu Ser Ser Gly Tyr Leu Pro Ile Ser Ala Val

290 295 300

Gly Val Ala Asp His Ile Val Ala Glu Leu Arg Glu Lys Gly Gly Asp

305 310 315 320

Phe Ile His Gly Phe Thr Tyr Ser Gly His Pro Thr Ala Ala Ala Val

325 330 335

Ala Leu Lys Asn Ile Glu Ile Met Glu Arg Glu Gly Leu Val Glu Arg

340 345 350

Thr Arg Asp Glu Thr Gly Pro Tyr Leu Ala Gln Ala Leu Ala Ser Leu

355 360 365

Asn Asp His Pro Leu Val Gly Glu Val Arg Ser Leu Gly Leu Ile Gly

370 375 380

Ala Val Glu Ile Val Arg Glu Lys Gly Thr Asn His Arg Phe Leu Asp

385 390 395 400

Lys Glu Gly Glu Ala Gly Pro Ile Val Arg Asp Leu Cys Ile Lys Asn

405 410 415

Gly Leu Met Val Arg Ala Ile Arg Asp Ser Ile Val Cys Cys Pro Pro

420 425 430

Leu Ile Ile Thr Lys Ala Gln Ile Asp Glu Leu Val Gly Ile Ile Arg

435 440 445

Lys Ser Leu Asp Glu Ala Glu Pro Val Leu Arg Ala Leu Lys Pro Lys

450 455 460

Glu Gly Glu Asp

465

<210> 5

<211> 468

<212> PRT

<213> Caulobacter sp

<220>

<221> MUTAGEN

<222> (64)..(64)

<223> W64C

<400> 5

Met Thr Ala Pro Leu Arg Asn His Asp Ile Ala Glu Leu Lys Arg Leu

1 5 10 15

Asp Leu Ala His His Leu Pro Ala Gln Ala Asp His Lys Val Ile Ala

20 25 30

Glu Gln Gly Gly Ser Arg Ile Ile Thr Arg Ala Glu Gly Val Tyr Ile

35 40 45

His Asp Gly Glu Gly His Gln Ile Leu Asp Gly Met Ala Gly Leu Cys

50 55 60

Cys Val Asn Val Gly Tyr Gly Arg Glu Glu Leu Ala Lys Ala Ala Tyr

65 70 75 80

Asp Gln Met Leu Glu Leu Pro Tyr Tyr Asn Thr Phe Phe Lys Thr Ala

85 90 95

Thr Pro Pro Pro Ile Glu Leu Ala Ala Lys Ile Ala Gln Lys Met Gly

100 105 110

Gly His Leu Ser His Val Phe Tyr Asn Ser Ser Gly Ser Glu Ala Asn

115 120 125

Asp Thr Val Phe Arg Leu Val Arg His Phe Trp Lys Leu Lys Gly Glu

130 135 140

Pro Ser Arg Thr Val Phe Ile Ser Arg Trp Asn Ala Tyr His Gly Ser

145 150 155 160

Thr Val Ala Gly Val Ser Leu Gly Gly Met Lys His Met His Lys Gln

165 170 175

Gly Asp Leu Pro Ile Ala Gly Val Glu His Val Met Gln Pro Tyr Gln

180 185 190

Phe Gly Asp Gly Phe Gly Glu Asp Pro Ala Ala Phe Arg Asp Arg Ala

195 200 205

Val Gln Ala Ile Glu Asp Lys Ile Leu Glu Val Gly Pro Glu Asn Val

210 215 220

Ala Ala Phe Ile Gly Glu Pro Val Gln Gly Ala Gly Gly Val Ile Ile

225 230 235 240

Pro Pro Asp Gly Tyr Trp Pro Ala Val Glu Ala Leu Cys Arg Lys Tyr

245 250 255

Gly Ile Leu Leu Val Cys Asp Glu Val Ile Cys Gly Phe Gly Arg Leu

260 265 270

Gly Gln Trp Phe Gly His Gln His Tyr Gly Ile Lys Pro Asp Leu Ile

275 280 285

Ala Met Ala Lys Gly Leu Ser Ser Gly Tyr Leu Pro Ile Ser Ala Val

290 295 300

Gly Val Ala Asp His Ile Val Ala Glu Leu Arg Glu Lys Gly Gly Asp

305 310 315 320

Phe Ile His Gly Phe Thr Tyr Ser Gly His Pro Thr Ala Ala Ala Val

325 330 335

Ala Leu Lys Asn Ile Glu Ile Met Glu Arg Glu Gly Leu Val Glu Arg

340 345 350

Thr Arg Asp Glu Thr Gly Pro Tyr Leu Ala Gln Ala Leu Ala Ser Leu

355 360 365

Asn Asp His Pro Leu Val Gly Glu Val Arg Ser Leu Gly Leu Ile Gly

370 375 380

Ala Val Glu Ile Val Arg Glu Lys Gly Thr Asn His Arg Phe Leu Asp

385 390 395 400

Lys Glu Gly Glu Ala Gly Pro Ile Val Arg Asp Leu Cys Ile Lys Asn

405 410 415

Gly Leu Met Val Arg Ala Ile Arg Asp Ser Ile Val Cys Cys Pro Pro

420 425 430

Leu Ile Ile Thr Lys Ala Gln Ile Asp Glu Leu Val Gly Ile Ile Arg

435 440 445

Lys Ser Leu Asp Glu Ala Glu Pro Val Leu Arg Ala Leu Lys Pro Lys

450 455 460

Glu Gly Glu Asp

465

<210> 6

<211> 1407

<212> DNA

<213> Caulobacter sp

<220>

<221> mutation

<222> (73)..(75)

<400> 6

atgaccgccc ccctccgcaa ccacgacatc gccgagctca agcgcctgga cctggcccac 60

cacctgccgg cctacgccga tcacaaggtc atcgccgagc agggcggaag ccggatcatc 120

acccgcgccg agggcgtcta catccatgac ggcgagggcc atcagatcct cgacggcatg 180

gccgggctgt ggtgcgtgaa cgtcggctac ggtcgcgagg aactggccaa ggccgcctac 240

gaccagatgc tggagctgcc ctactacaat acgttcttca agaccgcgac gccgccgccg 300

atcgagctgg cggccaagat cgcgcagaag atgggcgggc atctttccca cgtcttctac 360

aattcgtcgg ggtcggaggc gaacgacacg gtcttccgcc tggtgcgcca cttttggaag 420

ttgaaggggg agccaagccg cacggtcttc atcagccgct ggaacgccta tcacggctcg 480

acggtggcgg gcgtcagcct gggcggcatg aagcacatgc acaagcaggg cgacctgccg 540

atcgccggcg tcgagcatgt gatgcagccc taccagttcg gcgacggctt cggcgaggat 600

ccggccgcct tccgcgaccg ggcggtgcag gccatcgagg acaagatcct ggaagtcggg 660

cccgagaacg tcgcggcctt catcggcgag ccggtgcagg gcgcgggcgg ggtgatcatc 720

ccgccggacg gctattggcc ggcggtcgag gccctgtgcc gcaagtacgg catcctgctg 780

gtctgcgacg aggtgatctg cggctttggg cggctgggcc agtggttcgg ccaccagcac 840

tatggcatca agcccgacct gatcgccatg gccaagggcc tgtcgtccgg ctatctgccg 900

atcagcgccg tgggcgtggc cgaccacatc gtcgccgagc tgcgcgagaa gggcggcgac 960

ttcatccacg gctttacgta ctcgggccac ccgacggcgg cggccgtggc gctgaagaac 1020

atcgagatca tggagcgcga gggcctggtc gagcgcaccc gcgacgagac cggcccctat 1080

ctggcgcagg ccctggccag cctcaacgac cacccgctgg tgggtgaagt tcgctcgctg 1140

ggcctgatcg gcgcggtcga gatcgtgcgc gagaagggga ccaaccaccg cttcctcgac 1200

aaggagggcg aggccgggcc gatcgtgcgc gacctgtgca tcaagaacgg cctgatggtt 1260

cgcgccatcc gcgacagcat cgtctgctgc ccgccgctga tcatcaccaa ggcgcagatc 1320

gacgagctgg tcggcatcat ccgaaagtcg ctcgacgaag ccgagccggt gctgcgggcg 1380

ctgaagccta aggagggcga ggactga 1407

<210> 7

<211> 1407

<212> DNA

<213> Caulobacter sp

<220>

<221> mutation

<222> (73)..(75)

<400> 7

atgaccgccc ccctccgcaa ccacgacatc gccgagctca agcgcctgga cctggcccac 60

cacctgccgg cctttgccga tcacaaggtc atcgccgagc agggcggaag ccggatcatc 120

acccgcgccg agggcgtcta catccatgac ggcgagggcc atcagatcct cgacggcatg 180

gccgggctgt ggtgcgtgaa cgtcggctac ggtcgcgagg aactggccaa ggccgcctac 240

gaccagatgc tggagctgcc ctactacaat acgttcttca agaccgcgac gccgccgccg 300

atcgagctgg cggccaagat cgcgcagaag atgggcgggc atctttccca cgtcttctac 360

aattcgtcgg ggtcggaggc gaacgacacg gtcttccgcc tggtgcgcca cttttggaag 420

ttgaaggggg agccaagccg cacggtcttc atcagccgct ggaacgccta tcacggctcg 480

acggtggcgg gcgtcagcct gggcggcatg aagcacatgc acaagcaggg cgacctgccg 540

atcgccggcg tcgagcatgt gatgcagccc taccagttcg gcgacggctt cggcgaggat 600

ccggccgcct tccgcgaccg ggcggtgcag gccatcgagg acaagatcct ggaagtcggg 660

cccgagaacg tcgcggcctt catcggcgag ccggtgcagg gcgcgggcgg ggtgatcatc 720

ccgccggacg gctattggcc ggcggtcgag gccctgtgcc gcaagtacgg catcctgctg 780

gtctgcgacg aggtgatctg cggctttggg cggctgggcc agtggttcgg ccaccagcac 840

tatggcatca agcccgacct gatcgccatg gccaagggcc tgtcgtccgg ctatctgccg 900

atcagcgccg tgggcgtggc cgaccacatc gtcgccgagc tgcgcgagaa gggcggcgac 960

ttcatccacg gctttacgta ctcgggccac ccgacggcgg cggccgtggc gctgaagaac 1020

atcgagatca tggagcgcga gggcctggtc gagcgcaccc gcgacgagac cggcccctat 1080

ctggcgcagg ccctggccag cctcaacgac cacccgctgg tgggtgaagt tcgctcgctg 1140

ggcctgatcg gcgcggtcga gatcgtgcgc gagaagggga ccaaccaccg cttcctcgac 1200

aaggagggcg aggccgggcc gatcgtgcgc gacctgtgca tcaagaacgg cctgatggtt 1260

cgcgccatcc gcgacagcat cgtctgctgc ccgccgctga tcatcaccaa ggcgcagatc 1320

gacgagctgg tcggcatcat ccgaaagtcg ctcgacgaag ccgagccggt gctgcgggcg 1380

ctgaagccta aggagggcga ggactga 1407

<210> 8

<211> 1407

<212> DNA

<213> Caulobacter sp

<220>

<221> mutation

<222> (190)..(191)

<223> t191c,g191t

<400> 8

atgaccgccc ccctccgcaa ccacgacatc gccgagctca agcgcctgga cctggcccac 60

cacctgccgg cccaggccga tcacaaggtc atcgccgagc agggcggaag ccggatcatc 120

acccgcgccg agggcgtcta catccatgac ggcgagggcc atcagatcct cgacggcatg 180

gccgggctgc tgtgcgtgaa cgtcggctac ggtcgcgagg aactggccaa ggccgcctac 240

gaccagatgc tggagctgcc ctactacaat acgttcttca agaccgcgac gccgccgccg 300

atcgagctgg cggccaagat cgcgcagaag atgggcgggc atctttccca cgtcttctac 360

aattcgtcgg ggtcggaggc gaacgacacg gtcttccgcc tggtgcgcca cttttggaag 420

ttgaaggggg agccaagccg cacggtcttc atcagccgct ggaacgccta tcacggctcg 480

acggtggcgg gcgtcagcct gggcggcatg aagcacatgc acaagcaggg cgacctgccg 540

atcgccggcg tcgagcatgt gatgcagccc taccagttcg gcgacggctt cggcgaggat 600

ccggccgcct tccgcgaccg ggcggtgcag gccatcgagg acaagatcct ggaagtcggg 660

cccgagaacg tcgcggcctt catcggcgag ccggtgcagg gcgcgggcgg ggtgatcatc 720

ccgccggacg gctattggcc ggcggtcgag gccctgtgcc gcaagtacgg catcctgctg 780

gtctgcgacg aggtgatctg cggctttggg cggctgggcc agtggttcgg ccaccagcac 840

tatggcatca agcccgacct gatcgccatg gccaagggcc tgtcgtccgg ctatctgccg 900

atcagcgccg tgggcgtggc cgaccacatc gtcgccgagc tgcgcgagaa gggcggcgac 960

ttcatccacg gctttacgta ctcgggccac ccgacggcgg cggccgtggc gctgaagaac 1020

atcgagatca tggagcgcga gggcctggtc gagcgcaccc gcgacgagac cggcccctat 1080

ctggcgcagg ccctggccag cctcaacgac cacccgctgg tgggtgaagt tcgctcgctg 1140

ggcctgatcg gcgcggtcga gatcgtgcgc gagaagggga ccaaccaccg cttcctcgac 1200

aaggagggcg aggccgggcc gatcgtgcgc gacctgtgca tcaagaacgg cctgatggtt 1260

cgcgccatcc gcgacagcat cgtctgctgc ccgccgctga tcatcaccaa ggcgcagatc 1320

gacgagctgg tcggcatcat ccgaaagtcg ctcgacgaag ccgagccggt gctgcgggcg 1380

ctgaagccta aggagggcga ggactga 1407

<210> 9

<211> 1407

<212> DNA

<213> Caulobacter sp

<220>

<221> mutation

<222> (192)..(192)

<223> g192c

<400> 9

atgaccgccc ccctccgcaa ccacgacatc gccgagctca agcgcctgga cctggcccac 60

cacctgccgg cccaggccga tcacaaggtc atcgccgagc agggcggaag ccggatcatc 120

acccgcgccg agggcgtcta catccatgac ggcgagggcc atcagatcct cgacggcatg 180

gccgggctgt gctgcgtgaa cgtcggctac ggtcgcgagg aactggccaa ggccgcctac 240

gaccagatgc tggagctgcc ctactacaat acgttcttca agaccgcgac gccgccgccg 300

atcgagctgg cggccaagat cgcgcagaag atgggcgggc atctttccca cgtcttctac 360

aattcgtcgg ggtcggaggc gaacgacacg gtcttccgcc tggtgcgcca cttttggaag 420

ttgaaggggg agccaagccg cacggtcttc atcagccgct ggaacgccta tcacggctcg 480

acggtggcgg gcgtcagcct gggcggcatg aagcacatgc acaagcaggg cgacctgccg 540

atcgccggcg tcgagcatgt gatgcagccc taccagttcg gcgacggctt cggcgaggat 600

ccggccgcct tccgcgaccg ggcggtgcag gccatcgagg acaagatcct ggaagtcggg 660

cccgagaacg tcgcggcctt catcggcgag ccggtgcagg gcgcgggcgg ggtgatcatc 720

ccgccggacg gctattggcc ggcggtcgag gccctgtgcc gcaagtacgg catcctgctg 780

gtctgcgacg aggtgatctg cggctttggg cggctgggcc agtggttcgg ccaccagcac 840

tatggcatca agcccgacct gatcgccatg gccaagggcc tgtcgtccgg ctatctgccg 900

atcagcgccg tgggcgtggc cgaccacatc gtcgccgagc tgcgcgagaa gggcggcgac 960

ttcatccacg gctttacgta ctcgggccac ccgacggcgg cggccgtggc gctgaagaac 1020

atcgagatca tggagcgcga gggcctggtc gagcgcaccc gcgacgagac cggcccctat 1080

ctggcgcagg ccctggccag cctcaacgac cacccgctgg tgggtgaagt tcgctcgctg 1140

ggcctgatcg gcgcggtcga gatcgtgcgc gagaagggga ccaaccaccg cttcctcgac 1200

aaggagggcg aggccgggcc gatcgtgcgc gacctgtgca tcaagaacgg cctgatggtt 1260

cgcgccatcc gcgacagcat cgtctgctgc ccgccgctga tcatcaccaa ggcgcagatc 1320

gacgagctgg tcggcatcat ccgaaagtcg ctcgacgaag ccgagccggt gctgcgggcg 1380

ctgaagccta aggagggcga ggactga 1407

Claims

1.一种S型ω-转氨酶高活性的突变体，其氨基酸序列为基于但不同于SEQ ID NO:1，并且与SEQ ID NO:1相比，所述突变体中的残基差异是25位的谷氨酰胺突变为酪氨酸或苯丙氨酸，突变体简称为Q25Y和Q25F；或64位置的色氨酸突变为亮氨酸或半胱氨酸，突变体简称为W64L和W64C；或这些位点与其它的位点的组合。

2.如权利要求1所述的突变体，其特征在于所述其氨基酸序列为SEQ ID NO：2~5中之一所示。

3.如权利要求1所述的突变体，其特征在于所述其氨基酸序列优选为SEQ ID NO：2。

4.一种多核苷酸，所述多核苷酸编码权利要求1所述的突变体。

5.如权利要求4所述的多核苷酸，其特征在于所述多核苷酸序列为SEQ ID NO:6~9中之一。

6.一种表达载体，所述表达载体包含权利要求4所述的多核苷酸。

7.一种宿主细胞，所述宿主细胞包括权利要求4所述的多核苷酸或权利要求6所述的表达载体。

8.权利要求1所述突变体的制备方法，包括在适合于表达酶的条件下培养能够表达编码工程化S型ω-转氨酶高活性突变体的多核苷酸的宿主细胞。

9.权利要求1所述突变体作为生物催化剂的用途。

10.一种固定化转氨酶，其特征在于权利要求1所述突变体固定在固体支持物上。