CN102341494B

CN102341494B - 转氨酶多肽

Info

Publication number: CN102341494B
Application number: CN201080010926.9A
Authority: CN
Inventors: 伊什·库马尔·达万; 格雷戈里·米勒; 张希云
Original assignee: Codexis Inc
Current assignee: Codexis Inc
Priority date: 2009-01-08
Filing date: 2010-01-08
Publication date: 2014-10-15
Anticipated expiration: 2030-01-08
Also published as: US8470564B2; HUE052297T2; WO2010081053A3; US20100209981A1; EP3354727A1; EP3354727B1; US10995323B2; DK2385983T3; US11939602B2; US10323233B2; US20180201911A1; US10550370B2; US11542485B2; EP2385983A2; US20130266994A1; US20150210988A1; US20180298355A1; ES2840000T3; EP2385983A4; US20230120624A1

Abstract

本公开内容提供与天然存在的野生型转氨酶相比具有改进的性质的工程转氨酶。还提供了编码所述工程转氨酶的多核苷酸，能够表达所述工程转氨酶的宿主细胞和使用所述工程转氨酶合成多种手性化合物的方法。

Description

转氨酶多肽

相关申请的交叉引用

本申请要求35U.S.C.§119(e)下2009年1月8日提交的申请序列号为61/143,401的权益，其内容通过引用并入本文。

参考序列表、表格或计算机程序

序列表的正式复本作为ASCII格式化文本文件与说明书经EFS-Web同时被提交，文件名“376247-034.txt”，创建日期2010年1月8日，且大小为569千字节。经EFS-Web提交的序列表是说明书的一部分且通过引用全部并入本文。

技术领域

本发明涉及转氨酶多肽，编码此类转氨酶多肽的多核苷酸以及使用所述多肽的方法。

背景

氨基转移酶，还称为转氨酶(E.C.2.6.1)，催化来自氨基供体底物的伯胺的氨基，一对电子和质子向氨基受体分子的羰基转移。Ω-转氨酶(ω-转氨酶)转移与羰基间隔至少一个亚甲基插入的胺基团。

通常的转氨酶反应显示在下面的反应I中。在这一反应中，氨基受体(I，酮基(keto)或酮)，即期望的氨基酸产物的前体，与氨基供体(II)反应。转氨酶交换氨基供体的氨基与氨基受体的酮基团。因此反应产生期望的手性胺产物(III)和作为副产物的新的氨基受体(酮)化合物(IV)。

多种ω-转氨酶已经从微生物分离，微生物包括但不限于：反硝化产碱菌(Alcaligenes denitrificans)、支气管败血性博德特氏菌(Bordetella bronchiseptica)、副百日咳博德特氏菌(Bordetella parapertussis)、羊流产布氏杆菌(Brucella melitensis)、鼻疽伯克霍尔德氏菌(Burkholderia malle)、类鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)、青紫色素杆菌(Chromobacterium violaceum)、Oceanicola granulosus HTCC2516、海洋杆菌(Oceanobacter sp.RED65)、Oceanospirillum sp.MED92、恶臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌(Ralstonia solanacearum)、苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌(Rhizobium sp.)(菌株NGR234)、河流弧菌(Vibrio fluvialis)、苏云金杆菌(Bacillus thuringensis)和肺炎克雷伯氏菌(Klebsiella pneumoniae)(Shin等，2001，Biosci.Biotechnol，Biochem.65：1782-1788)。

几个氨基转移酶基因和酶序列也已经被报道，例如，青枯雷尔氏菌(Genbank登录号YP_002257813.1，GI：207739420)、类鼻疽伯克霍尔德氏菌1710b(Genbank登录号ABA47738.1，GI：76578263)和彼得里鲍特氏菌(Bordetellapetru)(Genbank登录号AM902716.1，GI：163258032)。两种转氨酶，EC 2.6.1.18和EC 2.6.1-19，已经被结晶和表征(参见Yonaha等人，1983，Agric.Biol.Chem.47(10)：2257-2265)。

来自河流弧菌JS17的酶ω-氨基酸：丙酮酸转氨酶(ω-APT，E.C.2.6.1.18)进行以下反应

使用吡哆醛-5’-磷酸作为辅因子。已经报道来自河流弧菌的转氨酶显示针对不携带羧基的脂肪族胺的催化活性。

转氨酶具有潜在的工业用途，用于立体选择性合成光学纯的手性胺和手性胺和氨基酸的对映异构体富集(Shin等，2001，Biosci.Biotechnol.Biochem.65：1782-1788；Iwasaki等，2003，Biotech.Lett.25：1843-1846；Iwasaki等，2004，Appl.Microb.Biotech.69：499-505，Yun等，2004，Appl.Environ.Microbiol.70：2529-2534；和Hwang等，2004，Enzyme Microbiol.Technol.34：429-426)。手性胺在制药、农业化学和化学工业中起重要作用且通常被用作中间体或合成子，用于制备多种药物，如头孢菌素或吡咯烷衍生物。使用氨基转移酶产生有用的化合物的实例包括：制备普加巴林的中间体和前体(例如WO 2008/127646)；β-氨基酸的立体定向合成和对映异构体富集(例如WO 2005/005633)；胺的对映异构体富集(例如美国专利第US 4,950,606号；美国专利第5,300,437号；和美国专利第5,169,780号)；氨基酸和衍生物的产生(例如美国专利第5,316,943号；美国专利第4,518,692号；美国专利第4,826,766号；美国专利第6,197,558号；和美国专利第4,600,692号)。

在许多手性胺的各种应用中，仅一种特定的旋光形式，(R)或(S)对映体是生理学活性的。因此，转氨酶被用于手性胺的对映异构体富集和立体选择性合成。

然而，用于介导转氨基反应的转氨酶可能具有不期望的性质，如不稳定性和窄的底物识别谱，因此使得它们对于商业应用是不期望的。因此，需要可以被用于制备旋光形式的手性胺的方法的其它类型的转氨酶。

概述

本公开内容提供具有催化氨基从供体胺向胺受体分子转移的能力的转氨酶多肽，编码这些多肽的多核苷酸和使用多肽的方法。通常，转氨酶多肽用于手性胺的对映异构体富集和立体选择性合成。

在一方面，本文描述的转氨酶多肽与参照酶如用河流弧菌获得的天然存在的转氨酶(例如SEQ ID NO：2)或工程转氨酶如SEQ ID NO：18的多肽相比，具有改变的性质。酶性质的改变可以包括但不限于酶活性、立体选择性、立体专一性、热稳定性、溶剂稳定性的改进，和/或减少的底物或产物抑制。在本文的实施方式中，改变的性质基于与天然存在的河流弧菌转氨酶或参照工程转氨酶如SEQ ID NO：18序列的参照序列相比在特定的残基位置具有残基差异的工程化转氨酶多肽。在一些实施方式中，残基差异存在于以下残基位置中的一个或多个：X4、X6、X9、X12、X21、X30、X31、X44、X45、X、56、X57、X81、X82、X85、X86、X95、X112、X113、X127、X147、X153、X157、X166、X177、X181、X208、X211、X228、X233、X253、X272、X294、X297、X302、X311、X314、X316、X317、X318、X319、X320、X321、X324、X385、X391、X398、X407、X408、X409、X415、X417、X418、X420、X431、X434、X438、X444和X446。可以存在于特定的残基位置的氨基酸残基和对酶性质的相关的改变在详细描述中被提供。

在一些实施方式中，公开内容的转氨酶多肽特征在于与野生型多肽相比在相同的反应条件下增强的热稳定性。因此，所述多肽能够介导转氨基反应(例如反应方案I、II或III)，如通过比野生型多肽在更高的温度和持续更久的时间继续形成产物所示。在一些实施方式中，本发明的转氨酶多肽在更高浓度供体胺如2M浓度异丙胺下能够保留活性方面被改进。在一些实施方式中，具有增强的热稳定性和/或增强的异丙胺稳定性的工程转氨酶包括与SEQ ID NO：10、16或18的参照序列至少约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同的氨基酸序列。

在一些实施方式中，工程转氨酶多肽与野生型转氨酶或参照工程转氨酶相比可以具有用于将底物转化成产物的增强的酶活性。改进的量可以在相应的野生型或参照的转氨酶的酶活性的多于1.1倍(或倍)至多达2倍、5倍、10倍、20倍或更多的范围。在一些实施方式中，工程转氨酶显示比SEQ ID NO：2的野生型转氨酶或SEQ ID NO：18的参照转氨酶的酶活性大至少1.1-倍、2-倍、3-倍、4-倍、5-倍、10-倍、25-倍、50-倍、100-倍、500-倍或1000-倍的改进的酶活性。酶活性的改进也可以伴随在立体选择性、立体专一性、热稳定性、溶剂稳定性和/或底物结合方面的增强，或减少的底物和/或产物抑制。

在一些实施方式中，工程转氨酶特征在于对多种结构不同的胺受体底物的活性。在一些实施方式中，工程转氨酶能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率(rate)立体选择性地将底物3，4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3，3-二甲基丁-2-酮、辛-2-酮、1-(4-溴苯基)乙酮、4-苯基丁-2-酮、3-氧代丁酸乙酯、1-(6-甲氧基萘-2-基)乙酮、1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮、1-(4-苯氧基苯基)乙酮、(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯和/或(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成相应的胺产物。

在一些实施方式中，改进的转氨酶多肽包括对应于SEQ ID NO：4、6、8、10、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198的氨基酸序列。

在一些实施方式中，本文描述的工程转氨酶可以通过诱变处理编码天然存在的野生型转氨酶的基因来获得，该天然存在的野生型转氨酶的基因与河流弧菌转氨酶的氨基酸序列(SEQ ID NO：2)至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同。

在另一方面，本公开内容提供编码本文描述的工程转氨酶的多核苷酸或在高度严格条件下与这些多核苷酸杂交的多核苷酸。多核苷酸可以包括用于表达编码的工程转氨酶的启动子和其它调控元件，且可以使用为特定的期望的表达系统优化的密码子。

在一些实施方式中，编码改进的转氨酶的多核苷酸包括对应于SEQ IDNO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、 35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195或197的序列。

在另一方面，本公开内容提供包括本文描述的多核苷酸和/或表达载体的宿主细胞。宿主细胞可以是河流弧菌或它们可以是不同的生物体，如大肠杆菌(E.coli)。宿主细胞可以被用于本文描述的工程转氨酶的表达和分离，或可选地，它们可以直接被用于将底物转化成立体异构产物。

在进一步的方面，还提供使用本文描述的工程转氨酶的任一个用于进行反应方案I、II或III(下面)的方法，该方法包括在氨基供体的存在下在适合用于将底物转化成胺产物的反应条件下使氨基受体底物与公开内容的转氨酶多肽接触或孵育，由此将底物转化成产物化合物。不论用整个细胞、细胞提取物或纯化的转氨酶进行该方法，单个转氨酶可以被使用或可选地，两个或多个转氨酶的混合物可以被使用。

附图简述：

图1说明转氨酶在通式I的氨基受体(酮)底物和通式II的氨基供体向手性胺(III)产物和氨基受体(酮)副产物(IV)的转化中的作用。这一反应使用本文描述的转氨酶和辅因子如吡哆醛-5’-磷酸。

详细描述

缩写

用于遗传编码的氨基酸的缩写是常规的且如下：

当使用三字母缩写时，除非特定地在“L”或“D”之后或根据使用缩写的上下文是清楚的，氨基酸关于α-碳(C_α)可以是L-或D-构型。例如，“Ala”指定未规定关于α-碳的构型的丙氨酸，而“D-Ala”和“L-Ala”分别指D-丙氨酸和L-丙氨酸。当一字母缩写被使用时，大写字母指定关于α-碳处于L构型的氨基酸且小写字母指定关于α-碳处于D构型的氨基酸。例如，“A”指L-丙氨酸且“a”指D-丙氨酸。当多肽序列作为一字母或三字母缩写(或其混合物)的串呈现时，根据常规序列以氨基(N)向羧基(C)的方向呈现。

用于遗传编码核苷的缩写是常规的且如下：腺苷(A)；鸟苷(G)；胞苷(C)；胸苷(T)；和尿苷(U)。除非特定地描述，缩写的核苷可以是核糖核苷或2’-脱氧核糖核苷。核苷可以在个体基础上或在聚集体基础上被指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列作为一字母缩写串呈现时，根据常规序列以5’向3’的方向出现，且不显示磷酸。

定义

如本文所用，以下术语意欲具有以下含义。

“蛋白”、“多肽”和“肽”在本文被互换地用于表示通过酰胺键共价地连接的至少两个氨基酸的聚合物，不论长度或翻译后的修饰(例如糖基化、磷酸化、脂质化、豆蔻酰化(myristilation)、泛素化等)。这一定义包括D-与L-氨基酸和D-与L-氨基酸的混合物。

“氨基转移酶”和“转氨酶”在本文被互换地用于指具有从伯胺转移氨基(NH₂)、一对电子和质子至受体分子的羰基(C＝O)的酶能力的多肽。更特定地，转氨酶多肽能够立体选择性地催化方案1的方法(下面)。如本文所用的转氨酶包括天然存在的(野生型)转氨酶以及由人处理产生的非天然存在的工程化的多肽。

“氨基受体”和“胺受体”、“酮底物”、“酮基”和“酮”在本文互换地用于指羰基(酮基或酮)化合物，其接受来自供体胺的氨基。氨基受体是通式I的分子，

其中R¹、R²中的每一个独立地是未取代的或用一个或多个酶学上可接受的基团取代的烃基、烃基芳基或芳基。R¹在结构或手性上可以相同于或不同于R²。R¹和R²合在一起可以形成环，该环可以是未取代的、取代的或稠合到其它环上。氨基受体包括酮基羧酸和烷酮(酮)。典型的酮基羧酸是α-酮基羧酸如乙醛酸、丙酮酸、草酰乙酸和类似酸，以及这些酸的盐。氨基受体还包括通过其它酶或完整的细胞程序被转化成氨基受体的底物，如富马酸(其可以被转化成草酰乙酸)、葡萄糖(其可以被转化成丙酮酸)、乳酸盐、马来酸和其它。可以使用的氨基受体包括，举例且不限于：3，4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3，3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、乙酰苯、2-甲氧基-5-氟乙酰苯、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1-苯基丁-1-酮、1-(2，5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基)丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸，包括可能的(R)和(S)单一异构体。

“氨基供体”指向氨基受体给予氨基，因此成为羰基物类的氨基化合物。氨基供体是通式II的分子，

其中R³、R⁴中的每一个独立地是未取代的或用一个或多个酶学上非抑制性基团取代的烃基、烃基芳基或芳基。R³在结构或手性上可以相同于或不同于R⁴。R³和R⁴合在一起可以形成环，该环可以是未取代的、取代的或稠合到其它环上。可以用于本发明的典型的氨基供体包括手性的与非手性的氨基酸和手性的与非手性的胺。可以用于本发明的氨基供体，举例且不限于：异丙胺(也称作2-氨基丙烷)，α-苯乙胺(也称作1-苯基乙胺)和其对映体(S)-1-苯基乙胺和(R)-1-苯基乙胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸一钠、L-丙氨酸、D-丙氨酸、D，L-丙氨酸、L-天冬氨酸、L-赖氨酸、L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1，4-丁二胺、1，6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、l-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、l-苯基-2-氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、l-氨基-l-苯基丁烷、l-苯基-2-氨基丁烷、1-(2，5-二甲氧基-4-甲基苯基)-2-氨基丁烷、l-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、l-氨基-3-甲基环戊烷、l-氨基-2-甲基环己烷、l-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢萘、2-氨基四氢萘、2- 氨基-5-甲氧基四氢萘和1-氨基茚满，包括可能的(R)和(S)单一异构体且包括胺的所有可能的盐。

“手性胺”指通式R¹-CH(NH₂)-R²的胺且以其最广泛的意义在本文使用，包括多种不同和混合的官能类型的脂肪族和脂环化合物，特征在于与仲碳原子结合的伯氨基的存在，该仲碳原子除了氢原子，还携带(i)形成手性环状结构的二价基团，或(ii)在结构或手性上互相不同的两种取代基(除了氢)。形成手性环状结构的二价基团包括，例如，2-甲基丁烷-1，4-二基、戊烷-1，4-二基、己烷-1，4-二基、己烷-1，5-二基、2-甲基戊烷-1，5-二基。仲碳原子上的两种不同的取代基(上面的R¹和R²)也可以非常不同且包括烃基、芳烃基、芳基、卤代、羟基、低级烃基、低级烃氧基、低级烃基硫代、环烃基、羧基、cabalkoxy、氨基甲酰基、单和二(低级烃基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单和二(低级烃基)取代的氨基、烃基磺酰基、芳基磺酰基、烃基甲酰胺基、芳基甲酰胺基等，以及由前述取代的烃基、芳烃基或芳基。

“吡哆醛磷酸”、“PLP”、“吡哆醛-5’-磷酸”、“PYP”和“P5P”在本文被互换地用于指在转氨酶反应中担任辅酶的化合物。在一些实施方式中，吡哆醛磷酸由结构1-(4′-甲酰基-3′-羟基-2′-甲基-5′-吡啶基)甲氧基磷酸，CAS号[54-47-7]定义，吡哆醛-5’-磷酸可以通过吡哆醇(还已知为维生素B₆)的磷酸化和氧化在体内产生。在使用转氨酶的转氨基反应中，氨基供体的胺基团被转移到辅酶以产生酮副产物，同时吡哆醛-5’-磷酸被转化成磷酸吡哆胺。吡哆醛-5’-磷酸通过与不同的酮化合物(氨基受体)反应而再生。胺基团从磷酸吡哆胺转移到氨基受体产生手性胺并再生辅酶。在一些实施方式中，吡哆醛-5’-磷酸可以由维生素B₆家族的其它成员代替，包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM)，和它们的磷酸化的对应物；磷酸吡哆醇(PNP)，和磷酸吡哆胺(PMP)。

“编码序列”指编码蛋白的氨基酸序列的核酸的那部分(例如基因)。

“天然存在的”或“野生型”指天然发现的形式。例如，天然存在的或野生型多肽或多核苷酸序列是生物体中存在的序列，其可以从天然来源分离且其未通过人为处理被有意识地修改。

当提及例如细胞、核酸或多肽时使用的“重组的”或“工程化的”或“非天然存在的”指将以天然不存在的其他方式被修饰或与其相同但由合成的材料产生或衍生和/或通过使用重组技术处理产生的材料或与材料的自然或天然形式相应的材料。非限制性实例包括但不限于，表达在细胞的天然形式(非重组的)中未发现的基因或以不同的水平另外表达天然基因的重组细胞。

“序列同一性百分比”和“同源性百分比”在本文被互换地用于指多核苷酸之间和多肽之间的对比，且通过在比较窗上比较两个最佳比对序列来确定，其中多核苷酸或多肽在比较窗中的部分与用于两个序列的最佳比对的参照序列相比可包括添加或缺失(即，空位)。百分比可以如下计算：确定两个序列中出现相同的核酸碱基或氨基酸残基的位置数目，以产生匹配位置的数目，匹配位置的数目除以比较窗中位置总数并将结果乘以100以得到序列同一性百分比。可选地，百分比可以如下计算：确定两个序列中相同的核酸碱基或氨基酸残基发生或核酸碱基或氨基酸残基与空位对齐的位置数目，以产生匹配位置的数目，匹配位置的数目除以比较窗中位置总数并将结果乘以100以得到序列同一性百分比。本领域技术人员将认识存在许多可用于比对两个序列的建立的算法。用于比较的序列的最佳比对可以如下进行，例如通过Smith和Waterman的局部同源性算法，1981，Adv.Appl.Math.2：482，通过Needleman和Wunsch的同源比对算法，1970，J.Mol.Biol.48：443，通过Pearson和Lipman的相似度检索方法，1988，Proc.Natl.Acad.Sci.USA 85：2444，通过这些算法的计算机化执行(GCGWisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)，或通过目检(一般参见，Current Protocols in Molecular Biology，F.M.Ausubel等，编著，Current Protocols，Greene Publishing Associates，Inc.和John Wiley & Sons，Inc.的合资企业，(1995增刊)(Ausubel))。适合确定序列同一性和序列相似性百分比的算法的实例是BLAST和BLAST 2.0算法，其分别在Altschul等，1990，J.Mol.Biol.215：403-410和Altschul等，1977，Nucleic Acids Res.3389-3402中被描述。用于进行BLAST分析的软件是通过美国国家生物技术信息中心(National Center for Biotechnology Information)公共可获得的。这一算法涉及首先通过鉴定查询序列(query sequence)中长度W的短字来鉴定高评分序列对(HSP)，当与数据库序列中相同长度中的字比对时，所述短字匹配或满足一些正值的阈值评分T。T被称作邻近字评分阈值(Altschul等，如上述)。这些最初的邻近字击中(word hits)用作启动检索以找到更长的包含它们的HSP的种子。然后字击中沿着每个序列的两个方向延伸到累积比对评分不能增加的程度。对于核苷酸序列，累积评分使用参数M(对于匹配残基对的奖励评分；总是＞0)和N(对于非匹配残基的惩罚评分；总是＜0)被计算。对于氨基酸序列，使用评分矩阵计算累积评分。当：累积比对评分从其最大的到达值跌落量X时；由于一个或多个负评分残基比对的积累，累积评分到零或以下时；或达到任一序列的末端时，字击中在每个方向中的延伸被停止。BLAST算法参数W、T和X确定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M＝5、N＝-4和两条链的比较作为缺省参数。对于氨基酸序列，BLASTP程序使用3的字长(W)、10的期望值(E)和BLOSUM62评分矩阵作为缺省参数(参见Henikoff和Henikoff，1989，Proc Natl Acad Sci USA 89：10915)。序列比对和％序列同一性的示例性确定可以使用GCGWisconsin软件包(Accelrys，Madison WI)中的BESTFIT或GAP程序，使用提供的缺省参数。

“参照序列”指用作序列比较的基础的确定序列。参照序列可以是更大的序列的子集，例如，全长基因或多肽序列的区段。通常，参照序列在长变上是至少20个核苷酸或氨基酸残基，在长度上至少25个残基，在长度上至少50个残基或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括在两种序列之间相似的序列(即，完整序列的一部分)，且(2)可以进一步包括在两种序列之间不同的序列，两种(或更多)多核苷酸或多肽之间的序列比较通常通过在“比较窗”内比较两种多核苷酸或多肽的序列来进行以鉴定和比较序列相似性的局部区域。

在一些实施方式中，“参照序列”可以基于基本氨基酸序列，其中参照序列是可以在基本序列中具有一个或多个变化的序列。例如，“在对应于X85的残基处具有丙氨酸或缬氨酸的基于SEQ ID NO：2的参照序列”指其中SEQ ID NO：2中是苯丙氨酸的X85处相应的残基已经改变成丙氨酸或缬氨酸的参照序列。

“比较窗”指至少约20个连续的核苷酸位置或氨基酸残基的概念性片段，其中序列可以与至少20个连续的核苷酸或氨基酸的参照序列比较，并且其中比较窗的序列部分与用于最佳比对两个序列的参照序列(其不包括添加或缺失)相比可以包括20％或更少的添加或缺失(即，空位)。比较窗可以比20个连续的残基更长，并且包括，任选地30、40、50、100或更长的窗。

“基本同一性”指以下的多核苷酸或多肽序列，其与参照序列相比，在至少20个残基位置的比较窗内，经常在至少30-50个残基的比较窗内，具有至少80％序列同一性，至少85％同一性和89％至95％序列同一性，更通常至少99％序列同一性，其中序列同一性百分比通过在比较窗内比较参照序列与包括总计参照序列的20％或更少的缺失或添加的序列来计算。在应用于多肽的特定的实施方式中，术语“基本同一性”指当最佳比对时，如通过程序GAP或BESTFIT使用缺省空位权重，两种多肽序列共有至少80％的序列同一性，优选地至少89％的序列同一性，至少95％的序列同一性或更多(例如99％的序列同一性)。优选地，不相同的残基位置通过保守的氨基酸取代而不同。

当在给定的氨基酸或多核苷酸序列编号的上下文中使用时，“对应于”、“参考”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参照序列相比时，参照序列的残基编号。换句话说，给定的聚合物的残基数目或残基位置关于参照序列被指定，而不是通过给定的氨基酸或多核苷酸序列内的残基的实际的数字位置被指定。例如，给定的氨基酸序列，如工程转氨酶的氨基酸序列，可以通过引入空位以优化两个序列之间的残基匹配，与参照序列比对。在这些情况中，虽然存在空位，给定的氨基酸或多核苷酸序列中残基的编号是关于与其比对的参照序列作出。

“立体选择性”指在化学或酶反应中一种立体异构体相对于另一种的优先形成。立体选择性可以是部分的，其中一种立体异构体的形成优于另一种异构体，或可以是完全的，其中仅形成一种立体异构体。当立体异构体是对映体时，立体选择性被称为对映体选择性，一种对映体在两种的总和中的分数(通常报道为百分比)。其通常可选地在本领域被报道为(通常作为百分比)根据式[主要对映体-次要对映体]/[主要对映体+次要对映体]计算的对映体过量(e.e)。当立体异构体是非对映体时，立体选择性被称为非对映立体选择性，一种非对映体在两种非对映体的混合物中的分数(通常报道为百分比)，通常可选地报道为非对映体过量(d.e)。对映体过量和非对映体过量是立体异构体过量的类型。

“高立体选择性”指能够以至少约85％的立体异构体过量将底物转化成相应的手性胺产物的转氨酶多肽。

“立体专一性”指在化学或酶反应中一种立体异构体相对于另一种的优先转化。立体专一性可以是部分的，其中一种立体异构体的转化优于另一种，或其可以是完全的，其中仅转化一种立体异构体。

“化学选择性”指在化学或酶反应中一种产物相对于另一种的优先形成。

“改进的酶性质”指与参照转氨酶相比显示任何酶性质的改进的转氨酶多肽。对于本文描述的工程转氨酶多肽，通常对野生型转氨酶作出比较，虽然在一些实施方式中，参照转氨酶可以是另一改进的工程转氨酶。期望改进的酶性质包括，但不限于，酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制剂的耐受性(例如，底物或产物抑制)、立体专一性和立体选择性(包括对映体选择性)。

“增强的酶活性”指工程转氨酶多肽的改进的性质，其可以被表示为与参照转氨酶相比，比活性(例如产生的产物/时间/重量蛋白)的增强或底物向产物的转化百分比的增加(例如在指定的时间段使用指定的量的转氨酶，起始量的底物向产物的转化百分比)。确定酶活性的示例性方法在实施例中被提供。与酶活性相关的任何性质可以被影响，包括经典的酶性质K_m、V_max或k_cat，其变化可导致增强的酶活性。酶活性中的改进可以是相应的野生型转氨酶的酶活性的约1.1倍，至多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更多倍于天然存在的转氨酶或从其衍生所述转氨酶多肽的另外的工程转氨酶的酶活性。在特定的实施方式中，工程转氨酶显示比母体转氨酶的酶活性高1.5至50倍、1.5至100倍的范围内的改进的酶活性。本领域技术人员应当理解：任何酶的活性是扩散限制的以致催化转换速率不可能超过底物的扩散速率，包括任何需要的辅因子。扩散限制的理论最高值，或k_cat/K_m，通常是约10⁸至10⁹(M^-1s^-1)。因此，转氨酶的酶活性中的任何改进将具有与由转氨酶作用的底物的扩散速率相关的上限。转氨酶活性可以通过标准测试的任何一个测定，如通过监测反应物或产物的光谱光度测量性质中的变化。在一些实施方式中，产生的产物的量可以通过高效液相色谱法(HPLC)分离结合UV吸光度或o-酞二醛(OPA)衍生化后的荧光检测被测定。使用确定的酶制品、在设定条件下的确定的测试、和一个或多个确定的底物进行酶活性的比较，如本文进一步详细地描述的。通常，当比较裂解产物时，细胞数和测试的蛋白的量被测定，并使用相同的表达系统和相同的宿主细胞以将宿主细胞产生的和裂解产物中存在的酶的量的差异最小化。

“转化”指底物向相应的产物的酶转化。“转化百分比”指在指定条件下在一段时间内被转化成产物的底物的百分比。因此，转氨酶多肽的“酶活性”或“活性”可以被表示为底物向产物的“转化百分比”。

“热稳定的”指与野生型酶相比转氨酶多肽在暴露于升高的高温(例如40-80℃)之后维持相似活性(例如多于60％至80％)持续一段时间(例如0.5-24小时)。

“溶剂稳定的”指与野生型酶相比转氨酶多肽在暴露于不同浓度(例如5-99％)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)之后维持相似的活性(多于例如60％至80％)持续一段时间(例如0.5-24小时)。

“pH稳定的”指与未处理的酶相比转氨酶多肽在暴露于高或低pH(例如，4.5-6或8至12)后维持相似的活性(多于例如60％至80％)持续一段时间(例如0.5-24小时)。

“热且溶剂稳定的”指热稳定的且溶剂稳定的转氨酶多肽。

如本文所用，“衍生自”在工程转氨酶的上下文中鉴定工程化所基于的原始转氨酶，和/或编码这些转氨酶的基因。例如，SEQ ID NO：18的工程转氨酶经多代人工进化编码SEQ ID NO：2的河流弧菌转氨酶的基因而获得。因此，这一工程转氨酶是“衍生自”SEQ ID NO：2的野生型转氨酶。

“亲水性氨基酸或残基”指根据Eisenberg等，1984，J.Mol.Biol.179：125-142的标准化的统一疏水性量表具有显示低于零的疏水性的侧链的氨基酸或残基。遗传编码的亲水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。

“酸性氨基酸或残基”指当氨基酸被包括在肽或多肽中时具有显示小于约6的pK值的侧链的亲水性氨基酸或残基。酸性氨基酸在生理pH下由于氢离子的丧失而通常具有负电荷侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。

“碱性氨基酸或残基”指当氨基酸被包括在肽或多肽中时具有显示大于约6的pK值的侧链的亲水性氨基酸或残基。碱性氨基酸在生理pH下由于与水合离子结合而通常具有正电荷侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。

“极性氨基酸或残基”指具有在生理pH下无电荷、但具有其中由两个原子共享的电子对被所述原子中的一个更紧密地持有的至少一个键的侧链的亲水性氨基酸或残基。遗传编码的极性氨基酸包括L-Asn (N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。

“疏水性氨基酸或残基”指根据Eisenberg等，1984，J.Mol.Biol.179：125-142的标准化的统一疏水性量表具有显示大于零的疏水性的侧链的氨基酸或残基。遗传编码的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-yr(Y)。

“芳族氨基酸或残基”指具有包括至少一个芳族环或杂芳族环的侧链的亲水性或疏水性氨基酸或残基。遗传编码的芳族氨基酸包括L-Phe (F)、L-Tyr(Y)和L-Trp(W)。虽然归因于其杂芳族氮原子的pKa，L-His(H)有时被分类为碱性残基，或因为其侧链包括杂芳族环而被分类为芳族残基，本文的组氨酸被分类为亲水性残基或“限制性残基”(参见下面)。

“限制性氨基酸或残基”指具有限制性的几何学的氨基酸或残基。在本文，限制性残基包括L-pro(P)和L-his(H)。组氨酸具有限制性几何学，因为其具有相对小的咪唑环。脯氨酸具有限制性的几何形状，因为其也具有五元环。

“非极性氨基酸或残基”指具有在生理pH下无电荷且具有其中由两个原子共享的电子对通常被两个原子中的每个相等地持有(即，侧链是非极性的)的键的侧链的疏水性氨基酸或残基。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。

“脂肪族氨基酸或残基”指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。

由L-Cys(C)表示的“半胱氨酸”是罕见的，因为其可以与其它L-Cys(C)氨基酸或其它含硫烷基(sulfanyl)-或巯基的氨基酸形成二硫键桥。“半胱氨酸样残基”包括半胱氨酸和包括可用于形成二硫键桥的巯基部分的其它氨基酸。L-Cys(C)(和具有含SH侧链的其它氨基酸)以还原的游离-SH还是氧化的二硫键桥形式存在于肽中的能力影响肽的净疏水性或亲水性特征。虽然根据Eisenberg(Eisenberg等，1984，上文)的标准化的统一量表L-Cys(C)显示0.29的疏水性，应当理解为了本发明内容的目的L-Cys(C)被分类成其独特的组。

“小的氨基酸或残基”指具有由共三个或更少的碳和/或杂原子(除了碳和氢)组成的侧链的氨基酸或残基。根据上面的定义，小的氨基酸或残基可以进一步被分类为脂肪族、非极性、极性或酸性的小氨基酸或残基。遗传编码的小的氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。

“含羟基的氨基酸或残基”指含羟基(-OH)部分的氨基酸。遗传编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。

“氨基酸差异”或“残基差异”指当与参照序列相比时在多肽序列的特定的位置的残基中的改变。例如，在参照序列具有丙氨酸的位置X9的残基差异指位置X9的残基改变成除丙氨酸之外的任何残基。如本文所公开，酶可以包括相对于参照序列的一个或多个残基差异，其中多个残基差异通常通过相对于参照序列作出改变的特定的位置的列表显示。

“保守的”氨基酸取代或突变指具有相似侧链的残基的可互换性，且因此通常涉及用属于相同的或相似的氨基酸定义类别的氨基酸取代多肽中的氨基酸。然而，在一些实施方式中，如果保守的突变可以是从脂肪族到脂肪族，非极性到非极性，极性到极性，酸性到酸性，碱性到碱性，芳族到芳族，或限制性到限制性残基的取代，本文所用保守的突变不包括从亲水性到亲水性，从疏水性到疏水性，从含羟基到含羟基，或小的到小的残基的取代。此外，如本文所用，A、V、L或I可以被适当地突变成另一脂肪族残基或另一非极性残基。下表显示示例性的保守取代。

“非保守的取代”指用具有显著地不同的侧链性质的氨基酸取代或突变多肽中的氨基酸。非保守的取代可以使用上面列出的定义的组之间的氨基酸而不是组之内的氨基酸。在一种实施方式中，非保守的突变影响(a)取代区域中肽主链的结构(例如脯氨酸取代甘氨酸)(b)电荷或疏水性，或(c)侧链体积。

“缺失”指通过从参照多肽中除去一个或多个氨基酸来修饰多肽。缺失可以包括除去1个或多个、2个或多个氨基酸，5个或多个氨基酸，10个或多个氨基酸，15个或多个氨基酸，或20个或多个氨基酸，最多组成参照酶的氨基酸总数的10％，或最多组成参照酶的氨基酸总数的20％，同时保留工程转氨酶的酶活性和/或保留工程转氨酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方式中，缺失可以包括连续的片段或可以是不连续的。

“插入”指通过从参照多肽中添加一个或多个氨基酸来修饰多肽。在一些实施方式中，改进的工程转氨酶包括向天然存在的转氨酶多肽插入一个或多个氨基酸以及向其它改进的转氨酶多肽插入一个或多个氨基酸。插入可以处于多肽的内部部分，或插入到羧基或氨基末端。如本文所用的插入包括本领域已知的融合蛋白。插入可以是连续的氨基酸区段或被天然存在的多肽中的一个或多个氨基酸分隔。

如本文所用的“片段”指具有氨基-末端和/或羧基-末端缺失但其中剩余的氨基酸序列与序列中相应的部分相同的多肽。片段可以是至少14个氨基酸长，至少20个氨基酸长，至少50个氨基酸长或更长，且最多全长转氨酶例如SEQ ID NO：2的多肽或SEQ ID NO：10的工程转氨酶多肽的70％、80％、90％、95％、98％和99％。

“分离的多肽”指基本上与天然伴随多肽的其它污染物例如蛋白、脂质和多核苷酸分离的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如宿主细胞或体外合成)中移出或纯化的多肽。改进的转氨酶可以存在于细胞中，存在于细胞介质中或以多种形式如裂解物或分离的制品被制备。像这样，在一些实施方式中，改进的转氨酶可以是分离的多肽。

“基本上纯的多肽”指以下的组合物，其中多肽物类是存在的占优势的物类(即，在摩尔或重量基础上其比组合物中的任何其它个体大分子物类更丰富)，并且当按摩尔或％重量计目标物类占存在的大分子物类的至少约50％时通常是基本上纯的组合物。通常，按摩尔或％重量计，基本上纯的转氨酶组合物将包括约60％或更多，约70％或更多，约80％或更多，约90％或更多，约95％或更多和约98％或更多的组合物中存在的所有大分子物类。在一些实施方式中，目标物类被纯化至基本上同质(即，污染物物类通过常规检测方法不能在组合物中被检测到)，其中组合物基本上由单一的大分子物类组成。溶剂物类，小分子(＜500道尔顿)和元素离子物类不被认为是大分子物类。在一些实施方式中，分离的改进的转氨酶多肽是基本上纯的多肽组合物。

本文使用的“严格杂交”指核酸杂交体稳定的条件。如本领域技术人员已知，杂交体的稳定性通过杂交体的熔化温度(T_m)反映。大体上，杂交体的稳定性是离子强度、温度、G/C含量和离液剂存在的函数。使用预测熔化温度的已知的方法可以计算多核苷酸的T_m值(参见例如Baldino等，Methods Enzymology 168：761-777；Bolton等，1962，Proc.Natl.Acad.Sci.USA 48：1390；Bresslauer等，1986，Proc.Natl.Acad.Sci USA 83：8893-8897；Freier等，1986，Proc.Natl.Acad.Sci USA 83：9373-9377；Kierzek等，Biochemistry 25：7840-7846；Rychlik等，1990，Nucleic Acids Res18：6409-6412(勘误，1991，Nucleic Acids Res 19：698)；Sambrook等，上文)；Suggs等，1981，于Developmental Biology Using Purified Genes(使用纯化基因的发育生物学)(Brown等，编)，pp.683-693，Academic Press；和Wetmur，1991，Crit Rev Biochem Mol Biol 26：227-259.所有出版物通过引用并入本文)。在一些实施方式中，多核苷酸编码本公开的多肽并且在定义的条件下，如适度地严格的或高度严格的条件下与编码本公开内容的工程转氨酶的序列的互补序列杂交。

“杂交严格性”涉及核酸杂交中的杂交条件，如洗涤条件。通常，杂交反应在低严格性的条件下进行，随后是不同的但更高严格性的洗涤。术语“适度地严格杂交”指允许靶-DNA结合以下互补的核酸的条件，所述互补的核酸具有与靶DNA约60％的同一性，优选地约75％的同一性，约85％的同一性，与靶-多核苷酸的大于约90％的同一性。示例性适度严格的条件等同于以下的条件：在50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％SDS中在42℃杂交，随后在0.2×SSPE、0.2％SDS中在42℃洗涤。“高度严格的杂交”通常指以下的条件：偏离对于定义的多核苷酸序列在溶液条件下确定的热熔化温度T_m约10℃或更少。在一些实施方式中，高度严格的条件指以下的条件，其仅允许那些在0.018M NaCl在65℃形成稳定的杂交体的核酸序列的杂交(即，如果杂交体在0.018M NaCl在65℃是不稳定的，其将在高度严格的条件下是不稳定的，如本文所考虑)。可以例如通过以下提供高度严格条件，在与50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％SDS 在42℃等同的条件杂交，随后在0.1×SSPE和0.1％SDS在65℃洗涤。另一高度严格的条件是在与以下等同的条件中杂交：在包含0.1％(w∶v)SDS的5X SSC中在65℃杂交并在包含0.1％SDS的0.1x SSC中在65℃洗涤。其它高度严格的杂交条件，以及适度地严格的条件是上面引用的文献中描述的。

“异源的”多核苷酸指通过实验方法被引入宿主细胞的任何多核苷酸，且包括从宿主细胞取出，接受实验处理并然后再引入宿主细胞的多核苷酸。

“密码子优化”指编码蛋白的多核苷酸的密码子变化为具体的生物体中优先使用的那些，以使编码的蛋白在受关注的生物体中被有效地表达。尽管遗传密码是简并的，即大多数氨基酸由称为“同义的(synonyms)”或“同义(synonymous)”密码子的几个密码子表示，但熟知的是：具体的生物体的密码子使用是非随机的并且偏向特定的密码子三联体。对于给定的基因，共同功能或遗传起源的基因，高度表达的蛋白对低拷贝数(low copy number)蛋白和生物体基因组的聚集蛋白编码区，这一密码子使用偏好可以更高。在一些实施方式中，编码转氨酶的多核苷酸可以为表达选择的宿主生物体的最佳生产而进行密码子优化。

“优选地、最佳的、高度密码子使用偏好密码子”互换地指以下的密码子，其以比编码相同的氨基酸的其它密码子更高的频率在编码区域的蛋白中被使用。优选的密码子可以根据单个基因，共同功能或起源的一组基因，高度表达的基因，整个生物体的聚集蛋白编码区中的密码子频率，相关的生物体的聚集蛋白编码区中的密码子频率，或其组合中的密码子使用确定。频率随着基因表达水平增加的密码子通常是用于表达的最佳密码子。已知多种方法用于确定特定的生物体中的密码子频率(例如密码子使用，相对的同义密码子的使用)和密码子偏好，包括多变量分析，例如，使用聚类分析或对应分析，和基因中使用的密码子的有效数目(参见GCGCodonPreference，Genetics Computer Group Wisconsin Package；CodonW，John Peden，University of Nottingham；McInerney，J.O，1998，Bioinformatics14：372-73；Stenico等，1994，Nucleic Acids Res.222437-46；Wright，F.， 1990，Gene 87：23-29)。对于增长的生物体列表密码子使用表是可获得的(参见，例如，Wada等，1992，Nucleic Acids Res.20：2111-2118；Nakamura等，2000，Nucl.Acids Res.28：292；Duret，等，如上述；Henaut和Danchin，“Escherichia coli and Salmonella(大肠杆菌和沙门氏菌)，”1996，Neidhardt，等编.，ASM Press，Washington D.C.，p.2047-2066。用于获得密码子使用的数据来源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集合包括实际上已知编码表达的蛋白(例如完整的蛋白编码序列-CDS)，表达的序列标签(ESTS)，或预测的基因组序列的编码区的核酸序列(参见，例如，Mount，D.，Bioinformatics：Sequence and Genome Analysis(生物信息学：序列和基因组分析)，第8章，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.，2001；Uberbacher，E.C.，1996，Methods Enzymol.266：259-281；Tiwari等，1997，Comput.Appl.Biosci.13：263-270)。

“控制序列”在本文被定义为包括对于本公开内容的多核苷酸和/或多肽的表达是必需的或有利的所有组分。对于编码多肽的核酸序列，每个控制序列可以是天然的或外来的。这些控制序列包括但不限于：前导序列(leader)、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子，和转录和翻译停止信号。控制序列可以与连接子一起被提供，以用于引入促进控制序列与编码多肽的核酸序列的编码区域的连接的特定的限制位点。

“可操作地连接”在本文被定义为以下的构型，其中控制序列被适当地置于(即，处于功能性关系)与受关注的多核苷酸有关的位置以使控制序列指导或调节受关注的多核苷酸和/或多肽的表达。

“启动子序列”指被宿主细胞识别用于受关注的多核苷酸如编码序列的表达的核酸序列。启动子序列包含转录控制序列，其介导受关注的多核苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列，其包括突变体、截短的和杂合启动子，并且可以获自编码对于宿主细胞同源的或异源的细胞外或细胞内多肽的基因。

“烃基”本身或作为另一取代基的部分指具有说明的数目的碳原子(例如C₁-C₆指一至六个碳原子)的饱和的或不饱和的支链、直链或环状单价烃基团，其通过从母体烷、烯或炔的单个碳原子除去一个氢原子得到。术语“烃基”明确意欲包括具有任何饱和程度或水平的基团，即，仅具有碳碳单键的基团，具有一个或多个碳碳双键的基团，具有一个或多个碳碳三键的基团和具有碳碳单键、双键和三键的混合物的基团。当期望特定的饱和水平时，使用措辞“烷基”、“烯基”和“炔基”。措辞“低级烃基”指由1至6个碳原子，优选地1-4个碳原子组成的烃基。

“烷基”本身或作为另一取代基的部分指饱和的支链、直链或环状烃基，其通过从母体烷的单个碳原子除去一个氢得到。烷基包括但不限于：甲烷基；乙烷基；丙烷基，如丙烷-1-基、丙烷-2-基(异丙基)、环丙烷-1-基等；丁烷基，如丁烷-1-基、丁烷-2-基(仲丁基)、2-甲基-丙烷-1-基(异丁基)、2-甲基丙烷-2-基(叔丁基)、环丁烷-1-基等；以及类似基团。在一些实施方式中，烷基是(C₁-C₆)烃基。

“烯基”本身或作为另一取代基的部分指具有至少一个碳碳双键的不饱和的支链、直链或环状烃基，其通过从母体烯的单个碳原子除去一个氢得到。该基团就双键而言可以是顺式或反式构象。烯基包括但不限于：乙烯基；丙烯基，如丙-1-烯-1-基、丙-1-烯-2-基、丙-2-烯-1-基、丙-2-烯-2-基、环丙-1-烯-1-基；环丙-2-烯-1-基；丁烯基，如丁-1-烯-1-基、丁-1-烯-2-基、2-甲基-丙-1-烯-1-基、丁-2-烯-1-基、丁-2-烯-2-基、丁-1，3-二烯-1-基、丁-1，3-二烯-2-基、环丁-1-烯-1-基、环丁-1-烯-3-基、环丁-1，3-二烯-1-基等；和类似基团。在一些实施方式中，烯基是(C₂-C₆)烯基。

“炔基”本身或作为另一取代基的部分指具有至少一个碳碳三键的不饱和的支链、直链或环状烃基，其通过从母体炔的单个碳原子除去一个氢得到。典型的炔基包括但不限于：乙炔基；丙炔基，如丙-1-炔-1-基、丙-2-炔-1-基等；丁炔基，如丁-1-炔-1-基、丁-1-炔-3-基、丁-3-炔-1-基等；和类似基团。在一些实施方式中，炔基是(C₂-C₆)炔基。

“环烃基”和“杂环烃基”本身或作为另一取代基的部分分别指“烃基”和“杂烃基”的环状版本。对于杂烃基，杂原子可以占据与分子的剩余部分相连接的位置。典型的环烃基包括但不限于：环丙基；环丁基如环丁烷基和环丁烯基；环戊基，如环戊烷基和环戊烯基；环己基，如环己烷基和环己烯基；以及类似基团。典型的杂环烃基包括但不限于：四氢呋喃基(例如四氢呋喃-2-基、四氢呋喃-3-基等)，哌啶基(例如哌啶-1-基、哌啶-2-基等)，吗啉基(例如吗啉-3-基、吗啉-4-基等)，哌嗪基(例如哌嗪-1-基、哌嗪-2-基等)，和类似基团。

“芳基”本身或作为另一取代基的部分指具有说明的数目的碳原子(例如C₅-C₁₅指5至15个碳原子)的单价芳族烃基团，其通过从母体芳族环系统的单个碳原子除去一个氢原子得到。在一些实施方式中，芳基是(C₅-C₁₅)芳基，且(C₅-C₁₀)是更优选的。在一些实施方式中，芳基是环戊二烯基、苯基和萘基。

“杂芳基”本身或作为另一取代基的部分指具有说明的数目的环原子(例如“5-14元”指5至14个环原子)的单价杂芳基团，其通过从母体杂芳族环系统的单个原子除去一个氢原子得到。在一些实施方式中，杂芳基是5-14元杂芳基。在一些实施方式中，杂芳基是5-10元杂芳基。

“烃氧基”本身或作为另一取代基的部分指-OR⁷，其中R⁷表示如本文定义的烃基或环烃基。典型的烃氧基包括但不限于甲氧基、乙氧基、丙氧基、丁氧基、环己基氧基和类似基团。

“烃基羰基”本身或作为另一取代基的部分指-C(O)-R⁸，其中R⁸是烃基，如上面所定义。典型的烃氧基羰基包括但不限于：乙酰基、乙基羰基、正丙基羰基和类似基团。

“烃氧基羰基”本身或作为另一取代基的部分指C(O)OR⁹，其中R⁹表示如本文定义的烃基或环烃基。典型的烃氧基羰基包括但不限于甲氧基羰基、乙氧基羰基、丙氧基羰基、丁氧基羰基、环己基氧基羰基和类似基团。

“氨基”本身或作为另一取代基的部分指基团-NH₂。取代的氨基指基团-NHR¹⁰、NR¹⁰R¹⁰和NR¹⁰R¹⁰R¹⁰，其中每个R¹⁰独立地选自取代的或未取代的烃基、环烃基、环杂烃基、烃氧基、芳基、杂芳基、杂芳基烃基、酰基、烃氧基羰基、硫烷基、亚硫酰基、磺酰基和类似基团。典型的氨基包括但不限于：二甲基氨基、二乙基氨基、三甲基氨基、三乙基氨基、甲基磺酰基氨基、呋喃基-氧基-磺氨基和类似基团。

“取代的烃基、芳基、芳基烃基、杂芳基或杂芳基烃基”指其中一个或多个氢原子用其它的取代基代替的烃基、芳基、芳基烃基、杂芳基或杂芳基烃基基团。示例性取代基包括但不限于：-OR¹¹、-SR¹¹、-NR¹¹R¹¹-、-NO₂、-NO、-CN、-CF₃、卤素(例如-F、-Cl、-Br和-I)、-C(O)R¹¹、-C(O)OR¹¹、-C(O)NR¹¹、-S(O)₂R¹¹、-S(O)₂NR¹¹R¹¹，其中每个R¹⁰独立地选自由氢和(C₁-C₆)烃基组成的组。

如本文所用“取代的”指基团的一个或多个氢原子(例如1、2、3、4、5或6个氢原子)用药物化学中普遍使用的取代基原子或基团代替。每个取代基可以是相同的或不同的。适合的取代基的实例包括但不限于：烃基、烯基、炔基、环烃基、芳基、芳烃基、环杂烃基、杂芳基、OR¹²(例如羟基、烷氧基(例如甲氧基、乙氧基和丙氧基)、芳基氧基、杂芳基氧基、芳烃基氧基、醚、酯、氨基甲酸酯等)、羟基烃基、烃氧基羰基、烃氧基烃氧基、全卤代烃基、全氟烃基(例如CF₃、CF₂、CF₃)、全氟烃氧基(例如OCF₃、OCF₂CF₃)、烃氧基烃基、SR¹²(例如硫醇、烃基硫代、芳基硫代、杂芳基硫代、芳烃基硫代、等)、S⁺R¹¹ ₂、S(O)R¹²、SO₂R¹²、NR¹²R¹²(例如伯胺(即，NH₂)、仲胺、叔胺、酰胺、氨基甲酸酯、脲等)、酰肼、卤化物、腈、硝基、硫化物、亚砜、氨磺酰、硫醇、羧基、醛、酮基、羧酸、酯、酰胺、亚胺和酰亚胺(imide)，包括其硒基和硫代衍生物，其中每个取代基可以是任选地进一步取代的。在其中具有芳族碳环的官能团被取代的实施方式中，这些取代将通常是约1至5个，而约1或2个取代是优选的。

转氨酶

本公开内容提供具有催化氨基从供体胺向胺受体分子转移的能力的转氨酶多肽，编码这些多肽的多核苷酸和使用所述多肽的方法。转氨酶多肽用于手性胺的对映异构体富集和立体选择性合成。

本文描述的转氨酶能够催化氨基从通式II的氨基供体向通式I的氨基受体(酮底物)转移。这一反应的产物是具有由*显示的立体碳原子的手性胺(III)和氨基受体(酮)副产物(IV)，如方案1所示：

方案1

其中与胺键合的手性碳主要具有(S)或(R)立体化学。像这样，手性胺产物以立体异构过量产生。

在一些实施方式中，本文描述的转氨酶能够催化氨基从通式II的氨基供体转移到通式I的氨基受体(酮底物)且立体选择性地形成手性胺(III_S)，其中胺所键合的手性碳具有占优势的(S)立体化学，和氨基受体(酮)副产物(IV)，如方案2中所示：

方案2

在一些实施方式中，本文描述的转氨酶能够催化氨基从通式II的氨基供体转移到通式I的氨基受体(酮)，其中反应的产物是具有占优势的(R)立体化学的手性胺(III_R)，和氨基受体(酮)副产物(IV)，如方案3所示：

方案3

R¹、R²、R³和R⁴中的每一个可以独立是未取代的或用一个或多个酶学上非抑制性基团取代的烃基、烃基芳基或芳基，其中R¹在结构或手性上不同于R²，或R¹和R²合在一起是包含手性中心的4个或多个碳原子的烃链。在一些实施方式中，烃基可以是取代的或未取代的支链或直链烃基。R³在结构或手性上与R⁴可以相同或不同。在一些实施方式中，R³和R⁴合在一起可以形成未取代的、取代的或稠合到其它环上的环。在一些实施方式中，环可以是取代的或未取代的环烃基或杂环烃基。在R³和R⁴的一些实施方式中，单独地或作为取代的或未取代的烃基芳基的烃基是低级烃基。

总的来说，酶过程仅运转胺的一种手性形式，或运转一种手性形式远大于另一种的程度。因此，本文描述的转氨酶多肽能够进行立体选择性合成，其中上面说明的手性胺产物(III_S或III_R)中的一种以显著大于另一种的量产生。如本文所用“显著大于”指占两种手性形式的混合量的百分数，其为至少约51％((例如至少51、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99％)。像这样，在一些实施方式中，转氨酶的产物在立体异构过量方面可以是至少5％、10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、96％、97％、98％或99％或更大。

方案1至3中显示的反应使用氨基受体底物和氨基供体底物。氨基受体是通式I的化合物：

其中R¹、R²中的每一个独立地可以是未取代的或用一个或多个酶学上非抑制性基团取代的烃基、烃基芳基或芳基。如上面所注明，R¹与R²在结构或手性上可以相同或不同。在一些实施方式中，R¹和R²合在一起可以形成未取代的，取代的或稠合到其它环上的环。在一些实施方式中，氨基受体是根据上面式1的任何化合物。

氨基供体是通式II的化合物：

其中R³、R⁴中的每一个独立地是未取代的或用一个或多个酶学上非抑制性基团取代的烃基、烃基芳基或芳基。R³在结构或手性上与R⁴可以相同或不同。R³和R⁴合在一起可以形成未取代的、取代的或稠合到其它环上的环。在R³和R⁴的一些实施方式中，单独的或作为取代的或未取代的烃基芳基的烃基是低级烃基。氨基供体可以包括式II的化合物的所有的盐形式。

在一些实施方式中，氨基供体是上面根据式II的任何化合物和所有可能的盐形式。示例性氨基供体包括但不限于，异丙胺(2-氨基丙烷)、D-丙氨酸、L-丙氨酸或D，L-丙氨酸，和这些氨基供体的所有可能的盐。

如所说明的，反应可以正向或逆向进行。在一些实施方式中，可以通过加入或除去起始材料或反应产物来促进正向或逆向反应。例如，当立体选择性地合成胺(III_S或III_R)的一种手性形式时，如反应I和II中所示，可以添加另外的氨基受体(酮)或氨基供体(达到饱和)和/或可以除去形成的手性胺或酮副产物。

为了进行转氨反应，本公开内容提供以下的工程转氨酶，它能够立体选择性地将氨基受体转化成相应的手性氨基产物，且当与获自河流弧菌的天然存在的酶(SEQ ID NO：2)比较时或当与其它工程转氨酶(例如SEQID NO：18)比较时，具有改进的性质。

在本文的转氨酶的表征中，可以参照河流弧菌的天然存在的转氨酶或另一工程转氨酶的氨基酸序列描述多肽。像这样，从起始甲硫氨酸(M)残基(即，M表示残基位置1)开始在转氨酶中确定氨基酸残基位置，尽管本领域技术人员将理解：这一起始甲硫氨酸残基可通过如宿主细胞或体外翻译系统中的生物加工器被除去以产生缺乏起始甲硫氨酸残基的成熟蛋白。具体的氨基酸或氨基酸变化存在于氨基酸序列中的氨基酸残基位置，有时在本文以术语“Xn”或“位置n”描述，其中n指残基位置。取代突变，其是参照序列中的氨基酸残基用不同的氨基酸残基替换，可以通过符号“→”表示或通过本领域使用的常规标志表示，例如Y(数字)Z，其中Y是参照序列中的氨基酸残基，“数字”指残基位置且Z是氨基残基取代。

编码天然存在的河流弧菌JS17转氨酶的多核苷酸序列在Shin等，2003，“Purification，characterization，and molecular cloning of a novel amine：pyruvate transaminase from Vibrio fluvialis JS 17(来自河流弧菌JS 17的新的胺：丙酮酸转氨酶的纯化、表征和分子克隆)”Appl MicrobiolBiotechnol.61(5-6)：463-471)中被描述。河流弧菌转氨酶的多核苷酸和氨基酸序列分别以SEQ ID NO：1和SEQ ID NO：2提供于本文。

如上面所注明，本公开内容的转氨酶特征在于与天然存在的母体酶或另一工程转氨酶多肽相比改进的酶性质。在本文的实施方式中，转氨酶的改进的性质可以是关于但不限于酶活性、稳定性(例如溶剂-和/或热稳定性)、立体选择性、立体专一性、抑制剂抗性和底物识别。在一些实施方式中，转氨酶多肽可以具有多于一种的改进的性质，如增强的稳定性和底物识别。

在一些实施方式中，工程转氨酶与参照序列(例如SEQ ID NO：2的天然存在的多肽或SEQ ID NO：18的工程化的多肽)相比具有导致酶性质的改变的各种残基差异。残基差异可表征为参照序列的“修饰”，其中所述修饰包括氨基酸取代、缺失和插入。任一修饰或修饰组合可以存在以产生改进的工程转氨酶。这些残基差异也可以被描述为改进的工程化的多肽在特定的残基位置的的具体特征。

在一些实施方式中，提供改进的转氨酶性质的与参照转氨酶多肽的残基差异的数目可以包括一个或多个残基位置、2个或多个残基位置、3个或多个残基位置、5个或多个残基位置、10个或多个残基位置或20个或多个残基位置的差异，最多参照酶序列的氨基酸总数的10％，最多参照酶序列的氨基酸总数的20％，最多参照酶序列的氨基酸总数的30％。在一些实施方式中，与参照序列相比残基差异数目可以是约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基位置。在一些实施方式中，与参照序列相比差异数目可以是1、2、3、4、5、6、7、8、9、10、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45、50、55或60个残基位置。

在一些实施方式中，残基差异包括与参照序列相比的取代。在一些实施方式中，与参照序列相比的取代可以在一个或多个残基位置、2个或多个残基位置、3个或多个残基位置、5个或多个残基位置、10个或多个残基位置或20个或多个残基位置，最多参照酶序列的氨基酸总数的10％，最多参照酶序列的氨基酸总数的20％，最多参照酶序列的氨基酸总数的30％。在一些实施方式中，与参照序列相比取代数目可以是约1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基位置的取代。在一些实施方式中，与参照序列相比取代数目可以是1、2、3、4、5、6、7、8、9、10、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45、50、55或60个残基位置。

在一些实施方式中，本公开内容的工程转氨酶的残基差异可以在以下残基位置中一个或多个残基位置发生：X4、X9、X12、X21、X30、X31、X44、X45、X、56、X57、X81、X82、X85、X86、X95、X112、X113、X127、X147、X153、X157、X166、X177、X181、X208、X211、X228、X233、X253、X272、X294、X297、X302、X311、X314、X316、X317、X318、X319、X320、X321、X324、X385、X391、X398、X407、X408、X409、X415、X417、X418、X420、X431、X434、X438、X444和X446。如本文所述，特定的氨基酸残基在这些残基位置的存在与转氨酶的性质的变化相关。在一些实施方式中，残基差异的数目可以是指定的残基位置中的至少2、3、4、5或6或更多个。

在一些实施方式中，指定的残基位置选择的氨基酸残基可以基于以下特征。X4是碱性残基；X9是极性残基；X12是非极性残基；X21是极性残基；X30是脂肪族或非极性残基；X31是脂肪族或非极性残基；X44是脂肪族或非极性残基；X45是限制性残基；X56非极性或脂肪族残基；X57是芳族、脂肪族、非极性、极性或半胱氨酸残基；X81是酸性残基；X82 是芳族或限制性残基；X85是脂肪族、非极性、极性或半胱氨酸残基；X86是限制性、芳族或极性残基；X95是极性残基；X112是非极性或脂肪族残基；X113是半胱氨酸、芳族或限制性残基；X127是脂肪族或非极性残基；X147是非极性残基；X153是脂肪族、非极性或极性残基；X157是极性残基；X166是极性残基；X177是非极性或脂肪族残基；X181是碱性残基；X208是非极性或脂肪族残基；X211是酸性残基；X228是非极性残基；X233是极性或脂肪族残基；X253是非极性残基；X272是非极性或脂肪族残基；X294是非极性或脂肪族残基；X297是脂肪族残基；X302是酸性残基；X311是脂肪族残基；X314是脂肪族或极性残基；X316是酸性残基；X317是芳族、非极性或脂肪族残基；X318是芳族、碱性或非极性残基；X319是非极性、脂肪族或极性残基；X320是脂肪族残基；X321是脂肪族残基；X324是非极性残基；X385是碱性残基；X398是碱性残基；X407是极性残基；X408是脂肪族残基；X409是非极性残基；X415是非极性残基；X417是非极性、脂肪族、极性、酸性或半胱氨酸残基；X418是非极性或脂肪族残基；X420是极性残基；X431是酸性残基；X434是脂肪族残基；X438是脂肪族残基；X444是非极性或脂肪族残基；和X446是非极性或脂肪族残基。在一些实施方式中，当参照序列的相应的残基位置的氨基酸残基被包含在为指定的位置描述的氨基酸种类中时，在本文提供的教导下可以使用该氨基酸种类中的不同氨基酸。

在一些实施方式中，转氨酶多肽可以在上面X未指定的残基位置另外具有与参照序列相比的一个或多个残基差异，参照序列例如SEQ ID NO：2。在一些实施方式中，差异可以是在上面X未界定的其它氨基酸残基位置的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个残基差异。在一些实施方式中，差异的数目可以是在其它氨基酸残基位置的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个或60个残基差异。在一些实施方式中，差异包括保守的突变。

在一些实施方式中，指定的位置的氨基酸残基可以选自以下特征中的一个或多个：X4是R；X9是T；X12是G；X21是N；X30是A；X31是A；X44是A；X45是H；X56是V；X57是L、I、F、A、S或C；X81是D；X82是H；X85是A、S、V、T、N或C；X86是S、H、N、F、G或A；X95是T；X112是I；X113是H或C；X127是L；X147是G；X153是A、S T、N、G、Q或C；X157是T；X166是S；X177是L；X181是R；X208是I；X211是K；X228是G；X233是T、S或L；X253是M；X272是A；X294是V；X297是A；X302是K；X311是V；X314是V或T；X316是K；X317是L、Y或M；X318是G、R或F；X319是V或Q；X320是A；X321是L；X324是G；X385是R；X391是A；X398是R；X407是S；X408是A；X409是G；X415是M；X417是F、A、I、C、T、S或C；X418是V；X420是N；X431是D；X434是V；X438是L；X444是V；和X446是V。在一些实施方式中，转氨酶多肽可以在上面X未指定的残基位置另外具有与参照序列相比的一个或多个残基差异，参照序列例如SEQ ID NO：2。在一些实施方式中，差异可以是在上面X未界定的其它氨基酸残基位置的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个残基差异。在一些实施方式中，差异的数目可以是在其它氨基酸残基位置的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个或60个残基差异。在一些实施方式中，差异包括保守的突变。在一些实施方式中，工程转氨酶可以包括具有一个或多个前述特征的氨基酸序列，该氨基酸序列至少80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多与基于SEQ ID NO：2的参照相同，并且特征在于本文描述的一个或多个改进的酶性质。

在一些实施方式中，改进的转氨酶多肽包括在以下残基位置具有至少一个或多个与参照序列相比的残基差异的氨基酸序列：X57、X85、X86、X153、X228、X233、X317、X318和X417，参照序列例如SEQ ID NO：2 的天然存在的序列或SEQ ID NO：18的工程转氨酶序列。在一些实施方式中，这些残基位置的残基可以选自以下特征：X57是芳族、脂肪族、非极性、极性或半胱氨酸残基；X85是脂肪族、非极性、极性或半胱氨酸残基；X86是限制性、芳族或极性残基；X153是脂肪族、非极性或极性残基；X228是非极性残基；X233是极性或脂肪族残基；X317是芳族、非极性或脂肪族残基；X318是芳族、碱性或非极性残基；和X417是非极性、脂肪族、极性、酸性或半胱氨酸残基。在一些实施方式中，这些残基位置的残基可以选自以下特征：X57是L、I、F、A、S或C；X85是A、S、V、T、N或C；X86是S、H、N、F、G或A；X153是A、S、T、N、G、Q或C；X228是G；X233是T、S或L；X317是L、Y或M；X318是G、R或F；和X417是F、A、I、C、T、S或C。在一些实施方式中，工程转氨酶可以包括具有一个或多个前述特征的氨基酸序列，其至少80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多与基于SEQ ID NO：2的参照相同，并且特征在于本文描述的一个或多个改进的酶特征。

在一些实施方式中，改进的转氨酶多肽可以包括以下的氨基酸序列：其至少80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多与对应于SEQ ID NO：4、6、8、10、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198的序列相同。在一些这些实施方式中，转氨酶多肽可以具有本文描述的一种或多种改进的性质。

在一些实施方式中，改进的转氨酶多肽包括对应于SEQ ID NO：4、6、8、10、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198的序列的氨基酸序列。

在一些实施方式中，转氨酶多肽的改进的性质关于其稳定性，如热稳定性和/或溶剂稳定性。这对于转氨酶多肽能够在升高的温度和溶剂条件中保持酶活性以驱动反应完成是有利的。例如，SEQ ID NO：2的转氨酶多肽可以在升高的温度(例如40-45℃)或在反应组分例如胺供体异丙胺的存在下失去活性。在一些实施方式中，本公开内容的热稳定的多肽特征在于与SEQ ID NO：2的转氨酶相比，当在约35℃至50℃，在约7.5至9.0的pH，被处理持续约0.5至24小时时，具有更高的活性保留。在一些实施方式中，在定义的高温的处理之后，酶活性保留的量，即，残余活性，可以是在定义的条件测试的未处理多肽的活性的至少5％、10％、20％、30％、40％，50％或更多。在一些实施方式中，高温条件是50℃持续23小时。在后一条件下，在定义的条件处理之后SEQ ID NO：2的天然存在的转氨酶不具有残余活性而本公开内容的工程转氨酶保持显著的活性。例如，在氨基供体异丙胺的存在下，在实施例中描述的测试条件下，在50℃处理23小时之后SEQ ID NO：16或18的转氨酶分别能够将10％和23％的底物丙酮酸转化成产物丙氨酸。

在一些实施方式中，工程转氨酶多肽特征在于对抗由于溶剂或反应组分例如异丙胺造成的失活的抗性。在一些实施方式中，工程转氨酶对由上至1M或上至2M的异丙胺的失活是抗性的。在一些实施方式中，在用溶剂或反应组分(例如，异丙胺)处理之后，酶活性保留的量，即，残余活性，可以是未处理的多肽的活性的至少5％、10％、20％、30％、40％、50％或更多。

在一些实施方式中，特征在于增强的热和/或溶剂稳定性的改进的转氨酶多肽包括以下氨基酸序列，其至少约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多与SEQ ID NO：10、16或18 的序列相同。在一些实施方式中，特征在于增强的热稳定性的转氨酶多肽对应于SEQ ID NO：10，16或18的序列。

在一些实施方式中，具有改进的热稳定性的转氨酶多肽(与SEQ IDNO：2相比)可以在以下残基位置中的一处或多处具有与SEQ ID NO：2相比的残基差异：X4、X9、X12、X21、X45、X86、X157、X177、X208、X211、X253、X272、X294、X302、X316、X324、X391、X398、X418、X420、X431、X444和X446。在一些实施方式中，残基差异的数目可以是与增强的热稳定性相关的指定的残基位置的至少2、3、4、5或6或更多个。

在一些实施方式中，与SEQ ID NO：2相比对于它们的热稳定性改进的转氨酶多肽具有以下特征中的一个或多个：X4是R、Q或L；X9是T；X12是K；X21是N；X45是H；X86是Y；X157是T；X177是L；X208是I；X211是K；X253是M；X272是A；X294是V；X302是K；X316是K；X324是G；X391是A；X398是R；X418是V；X420是N；X431是D；X444是V；和X446是V。

在一些实施方式中，特征在于增强的热稳定性的转氨酶多肽包括但不限于具有以下特征或特征组中的一个的氨基酸序列：X45是H，X86是Y，X177是L，X211是K，X294是V，X324是G；X391是A，X398是R，且X420是N；X9是T，X45是H，X86是Y，X177是L，X211是K，X294是V，X324是G，且X391是A；X21是N，X45是H，X177是L，X208是I，X211是K，X324是G，X391是A；以及X9是T，X21是N，X86是Y，X208是I，且X294是V。

在一些实施方式中，转氨酶多肽在酶活性、底物识别、立体专一性和/或立体选择性以及其它性质方面被改进。这些特征可以存在于热和/或溶剂稳定的工程转氨酶如SEQ ID NO：10、16或18的环境中。例如，热/溶剂稳定的转氨酶可以被修饰以具有其它酶性质方面的改进，同时保留其热/溶剂稳定的性质。以热和/或溶剂稳定性的转氨酶作为获得其它酶性质例如底物识别、酶活性、立体选择性、立体专一性的改进基础的显著的优势是：工程转氨酶可以在不适合天然存在的酶的过程条件下被使用，过程条件例如但不限于，(a)在高温和/或高溶剂浓度下在各种底物上筛选活性；(b)放大条件，其中转氨基反应可以被进行持续更长的时间段，和/或(c)在高底物载量条件下。在一些实施方式中，在高温和/或更高的溶剂浓度用底物筛选保持转氨酶多肽的热和/或溶剂稳定特征，同时允许在其它酶性质方面的改进的鉴定。

然而，在一些实施方式中，在其它酶性质中的改进可以在天然存在的转氨酶多肽，如SEQ ID NO：2的序列的环境中。因此，在一些实施方式中，特征在于改进的酶活性、底物识别或立体选择性的工程转氨酶多肽可以包括以下的氨基酸序列，其至少80％，85％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％或更多与SEQ ID NO：2的序列相同且具有所示的改进的性质。

在一些实施方式中，转氨酶多肽的改进的性质是关于底物至产物的转化率的增加。酶活性的这一改进可以由这种能力证实：使用与野生型(SEQID NO：2)或其它参照序列(例如SEQ ID NO：18)相比更少的改进的多肽在给定的时间量中产生相同量的产物。在一些实施方式中，酶活性的改进可以由这种能力证实：用与野生型或参照酶相比相同的量的酶在界定的时间将更大百分比的底物转化成产物。在一些实施方式中，转氨酶多肽能够以以下的比率将底物转化成产物，所述比率是超过SEQ ID NO：2或SEQ IDNO：18的比率的至少1.1-倍、1.5倍、2倍、3倍、4倍、5-倍、10-倍、25-倍、50-倍、75-倍、100-倍、150-倍、200-倍、250-倍、300-倍、500-倍、1000-倍或更多。

在一些实施方式中，特征在于改进的酶活性即与SEQ ID NO：2和/或SEQ ID NO：18相比以更大的比率将底物转化成产物的转氨酶多肽可以包括具有一个或多个以下特征的氨基酸序列：X30是A；X31是A；X44是A；X45是N；X56是V；X57是A、C、F、I、L或S；X81是D；X82是H；X85是A、C、S、N、T、G，或V；X86是F、S、N、A、G，或H；X95是T；X112是I；X113是C或H；X127是L；X147是G；X153是A、C、G、N、M、Q、S，或T；X166是S；X177是V；X181是R；X208是I；X211是R；X228是G或T；X233是L、S、I、V、N、G或T；X294是M；V297是A、S、T、I、M、Q、C，或G；X311是V；X314 是T或V；X317是L、M，或Y；X318是G、F、C、K、W，或R；X319是Q、G、M、N，或V，X320是A或K；X321是L、M，或I；X324是S；X385是R；X398是R；X407是S；X408是A；X409是G；X415是M；X417是A，C，E，F，I，N，Q，Y，S，T，或V；X420是N；X434是V；和X438是L。

在一些实施方式中，能够具有增强的酶活性的转氨酶多肽可以包括具有一个或多个以下特征的氨基酸序列：X30是A；X31是A；X56是V；X81是D；X82是H；X95是T；X113是C或H。

在一些实施方式中，与SEQ ID NO：2和/或SEQ ID NO：18相比在它们的酶活性比率例如它们将底物转化成产物的比率方面改进的转氨酶多肽可以包括具有以下特征组中的一种的氨基酸序列：X12是G且X434是V；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是A且X317是L；X85是S且X153是A；X85是A且X153是A；X85是S且X153是S；X86是S且X153是S；X86是H且X153是A；X112是I且X317是L；或X113是H且X407是S；X153是S且X233是S；X311是V且X314是T；X314是V且X409是G；和X318是G且X408是A。

在一些实施方式中，与SEQ ID NO：2和/或SEQ ID NO：18相比在它们的酶活性比率即它们将底物转化成产物的比率方面改进的转氨酶多肽可以包括具有以下特征组中的至少一种的氨基酸序列：X57是A，X153是S且X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F且X153是Q；X57是A，X153是C且X321是L；X57是C，X86是S且X417是T；X57是C，X86是A且X317是L；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是F，X318是G且X417是I；X57是L，X86是F且X318是F；X57是L，X417是C且X438是L；X57是F，X127是L且X417是C；X57是S，X233是L且X417是V；X57是S，X86是G且X417是C；X85是A，X147是G且X153是A；X85是S，X153是A且X233是T；X85是A，X153是S且X417是S；X86是H，X153是A且X417是C； X86是H，X153是S且X417是C；X86是F，X153是C且X297是A；X86是S，X153是T且X297是A；X86是H，X233是L且X417是A；X86是F，X318是R且X417是A；X86是N，X228是G且X317是L；X95是T，X153是A且X417是C；X113是C，X385是R且X417是C；X153是A，X317是L且X318是G；X153是A，X233是T且X417是C；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X153是T，X228是G且X321是L；X153是S，X317是L且X417是C；X153是T，X319是V且X417是I；X153是S，X228是G且X417是V；X153是C，X317是Y且X319是Q；X153是T，X228是G且X417是A；X228是G，X317是L且X417是C；X228是G，X318是G且X417是C；X233是L，X321是L且X417是I；和X317是L，X318是R且X417是T。

在一些实施方式中，与SEQ ID NO：2和/或SEQ ID NO：18相比在它们的酶活性比率即它们将底物转化成产物的比率方面改进的转氨酶多肽可以包括具有以下特征组中的一种的氨基酸序列：X57是L且X86是F且X153是S且X233是T且X417是T；X86是H且X153是A且XA228是G且X417是I；以及X86是H且X153是S且X181是R且X417是T。

在一些实施方式中，本文描述的转氨酶多肽能够以大于野生型河流弧菌转氨酶(SEQ ID NO：2)的比率立体选择性地将氨基受体底物转化成相应的手性胺产物。能够进行上面反应的多肽包括但不限于包括对应于SEQ IDNO：18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190或192的氨基酸序列的多肽。与特定的底物相关的工程转氨酶的活性在下面更详细地被描述。

在一些实施方式中，转氨酶多肽的改进的性质与其将氨基受体底物转化成手性氨基产物的立体选择性的增加相关。在一些实施方式中，转氨酶的改进的性质与立体选择性的增加，在本文即产物的立体异构过量的增加相关。在一些实施方式中，转氨酶性质的改进的性质与以立体异构过量产生手性胺的S对映体相关。在一些实施方式中，转氨酶性质的改进的性质与以立体异构过量产生手性胺的R对映体相关。

在一些实施方式中，转氨酶多肽特征在于能够以大于SEQ ID NO：18的多肽的立体异构过量将氨基受体底物转化成(R)构型的手性胺产物。在一些实施方式中，R-选择性转氨酶多肽包括具有以下特征中的一种或多种的氨基酸序列：X57是L；X81是D；X82是H；X85是A、C、N、T或V；X86是S、F或H；X95是T；X112是I；X147是G；X153是A、S、N、G或T；X233是S或T；X317是L，X318是G或R；和X319是V。

在一些实施方式中，能够以大于SEQ ID NO：18的热稳定性的多肽的比率将氨基受体底物转化成主要为(R)构型的手性胺产物的转氨酶多肽可以包括具有以下特征中的一种的氨基酸序列：X85是A；X85是A且X153是A；和X85是S且X153是A。

在一些实施方式中，能够以大于SEQ ID NO：18的热稳定性的多肽的比率将氨基受体底物转化成主要为(R)构型的手性胺产物的转氨酶多肽包括对应于SEQ ID NO：22、30、32、34、36、40、44、48、56、58、60、62、64、66、68、70、72、76、84、88、90、92、104、108、110、120、122、124、126、128、132、160或176的氨基酸序列。

在一些实施方式中，能够以大于SEQ ID NO：18的热稳定性的多肽的比率将氨基受体底物转化成主要为(R)构型的手性胺产物的转氨酶多肽包括对应于SEQ ID NO：32、36、40、56、58、60、62、64、66、122、124、126、128或132的氨基酸序列。

在一些实施方式中，能够以大于SEQ ID NO：18的热稳定性的多肽的比率将氨基受体底物转化成主要为(R)构型的手性胺产物的转氨酶多肽包括对应于SEQ ID NO：122、124、126、128、130或132的氨基酸序列。

在一些实施方式中，工程转氨酶多肽能够结合并转化结构多样的底物。在一些例子中，天然存在的河流弧菌酶对于结构不同的底物的转化率可能是不显著的。因此，在一些实施方式中，工程转氨酶多肽特征在于对于SEQ ID NO：2的多肽或另一工程转氨酶如SEQ ID NO：18未能以显著的比率转化的底物的增强的转化率。

在一些实施方式中，转氨酶多肽特征在于能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率立体选择性地将底物3，4-二氢萘-1(2H)-酮转化成产物(S)-1，2，3，4-四氢萘-1-胺，如下，

与对底物3，4-二氢萘-1(2H)-酮的活性增加相关的残基位置包括以下中的一个或多个：X30、X44、X57、X82、X85、X113、X153、X166、X233、X314、X311、X317、X318、X319、X320、X407、X409和X417。

在一些实施方式中，能够以大于SEQ ID NO：2或SEQ ID NO：18的比率将3，4-二氢萘-1(2H)-酮转化成(S)-1，2，3，4-四氢萘-1-胺的转氨酶多肽包括具有以下特征或特征组中至少一个或多个的氨基酸序列：X30是A；X31是A；X57是I；X82是H；X85是V；X85是C；X153是S；X317是M；X317是Y；X417是A；X319是Q；X320是A；X417是I；X113是H且X407是S；X44是A且X166是S；X314是V且X409是G；X153是S且X233是S；X311是V且X314是T；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X153是S，X317是L且X417是C；X233是L，X321是L，且X417是I；和X153是C，X317是Y且X319是Q。

在一些实施方式中，能够以大于SEQ ID NO：2和/或SEQ ID NO：18的比率将3，4-二氢萘-1(2H)-酮转化成(S)-1，2，3，4-四氢萘-1-胺的转氨酶多肽包括对应于SEQ ID NO：38、42、44、52、56、66、74、76、78、80、82、 84、94、96、98、100、104、118、160、164、172、184或188的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将3，4-二氢萘-1(2H)-酮立体选择性地转化成(S)-1，2，3，4-四氢萘-1-胺。能够进行上面反应的多肽包括但不限于包括对应于SEQ ID NO：44、104、164、172、184或188的氨基酸序列的多肽。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少10-倍或更多的比率将3，4-二氢萘-1(2H)-酮立体选择性地转化成(S)-1，2，3，4-四氢萘-1-胺。能够进行上面反应的多肽包括但不限于包括对应于SEQ ID NO：164或188的氨基酸序列的多肽。

在一些实施方式中，转氨酶多肽能够以大于SEQ ID NO：2和/或SEQID NO：18的多肽的比率将底物1-苯基丁-2-酮立体选择性地转化成产物(S)-1-苯基丁-2-胺，如下

与对底物1-苯基丁-2-酮的活性增强相关的残基位置包括以下中的一个或多个：X57；X81；X86；X153；X181；X228；X233；X317；X318；X319；X321；和X417。

在一些实施方式中，能够以大于野生型河流弧菌(SEQ ID NO：2)的比率将1-苯基丁-2-酮转化成产物(S)-1-苯基丁-2-胺的转氨酶多肽包括具有以下特征或特征组中的至少一个的氨基酸序列：X81是D且X86是H；X86是H且X153是A；X86是H，X153是A且X417是C；X86是H，X153是S且X417是C；X86是H，X153是A，X228是G且X417是I；X86是H，X153是S，X181是R且X417是T；X228是G，X317是L且X417是C；X57是A，X153是S且X318是G；X57是F，X86是H，且X153 是Q；X57是A，X153是C且X321是L；X86是F，X318是R且X417是A；X228是G，X318是G且X417是C；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X86是N，X228是G且X317是L；X153是T，X228是G且X321是L；X153是S，X317是L，X417是C；X57is L，X86是S且X153是A；X153是S，X228是G且X417是V；X153是C，X317是Y且X319是Q；和X153是T，X228是G且X417是A。

在一些实施方式中，能够将1-苯基丁-2-酮立体选择性地转化成(S)-1-苯基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：22、88、90、92、106、110、138、140、142、148、150、152、160、164、168、170、172、178、182、188或190的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将1-苯基丁-2-酮立体选择性地转化成(S)-1-苯基丁-2-胺。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQID NO：8的多肽大至少5-倍或更多的比率将1-苯基丁-2-酮立体选择性地转化成(S)-1-苯基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：22、88、90、92、106或110的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物3，3-二甲基丁-2-酮立体选择性地转化成产物(S)-3，3-二甲基丁-2-胺，如下：

与对底物3，3-二甲基丁-2-酮的活性增强相关的残基位置包括以下中的一个或多个：X12、X30、X31、X44、X57、X81、X82、X85、X86、X95、X112、X113、X127、X153、X166、X181、X228、X233、X297、X311、X314、X317、X318、X319、X320、X321、X385、X407、X408、X409、X417、 X434和X438。

在一些实施方式中，能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将3，3-二甲基丁-2-酮转化成产物(S)-3，3-二甲基丁-2-胺的转氨酶多肽包括具有以下特征或特征组中的至少一个的氨基酸序列：X30是A；X31是A；X57是L；X57是I；X82是H；X85是V；X85是S；X85是T；X85是A；X85是N；X85是C；X86是S；X86是N；X86是F；X153是T；X153是N；X153是G；X153是S；X317是M；X317是Y；X319是Q；X320是A；X417是A；X417是I；X417是C；X12是G且X434是V；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是S且X153是A；X85是A且X153是A；X85是A且X317是L；X86是H且X153是A；X86是S且X153是S；X112是I且X317是L；X113是H且X407是S；X153是S且X233是S；X311是V且X314是T；X314是V且X409是G；X318是G且X408是A；X57是L，X417是C且X438是L；X57是F，X127是L且X417是C；X57是S，X233是L且X417是V；X57是A，X153是S且X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F且X153是Q；X57是C，X86是S且X417是T；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是L，X86是F且X318是F；X57是F，X318是G且X417是I；X86是H，X153是S且X417是C；X86是H，X153是A且X417是C；X86是F，X153是C且X297是A；X86是H，X233是L且X417是A；X86是N，X228是G且X317是L；X95是T，X153是A，且X417是C；X113是C，X385是R且X417是C；X153是A，X317是L且X318是G；X153是A，X233是T且X417是C；X153是C，X233是L且X318是R；X153是T，X228是G，且X321是L；X153是S，X317是L，且X417是C；X153是T，X319是V且X417是I；X153是S，X228是G且X417是V；X153是C，X317是Y，且X319是Q；X153是T，X228是G且X417是A；X233是L，X321是L且X417是I；X228是G，X318是G且X417是C；X317是L，X318是R且X417是T；X86是H，X153是A，X228是G且X417是I；和X86是H，X153是S，X181是R且X417是T。

在一些实施方式中，能够将3，3-二甲基丁-2-酮立体选择性地转化成(S)-3，3-二甲基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、134、140、142、144、146、152、154、156、158、162、164、168、170、172、174、176、178、180、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少1.1-倍或更多的比率将3，3-二甲基丁-2-酮立体选择性地转化成(S)-3，3-二甲基丁-2-胺。在一些实施方式中，能够以比SEQ IDNO：2和/或SEQ ID NO：18的多肽大至少1.1-倍或更多的比率将3，3-二甲基丁-2-酮立体选择性地转化成(S)-3，3-二甲基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：30、34、38、44、52、54、70、72、74、76、80、82、96、98、100、104、118、120、164、178或188的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物辛-2-酮立体选择性地转化成产物(S)-辛-2-胺，如下：

与对底物辛-2-酮的活性增强相关的残基位置包括以下中的一个或多个：X12、X30、X31、X44、X57、X81、X82、X85、X86、X95、X112、X113、X127、X153、X166、X181、X228、X233、X297、X311、X314、X317、X318、X319、X320、X321、X385、X407、X408、X409、X417、X434和X438。

在一些实施方式中，能够将辛-2-酮转化成产物(S)-辛-2-胺的转氨酶多肽包括具有以下特征或特征组中的至少一个的氨基酸序列：X30是A；X31是A；X57是I；X57是L；X82是H；X85是V；X85是S；X85是T；X85是A；X85是N；X85是C；X86是S；X86是N；X86是F；X153是S；X153是T；X153是N；X153是G；X317是M；X317是Y；X417是A；X319是Q；X320是A；X417是I；X417是C；X12是G且X434是V；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是A且X317是L；X85是S且X153是A；X85是A且X153是A；X86是H且X153是A；X86是S且X153是S；X112是I且X317是L；X113是H且X407是S；X153是S且X233是S；X311是V且X314是T；X314是V且X409是G；X318是G且X408是A；X57是L，X417是C且X438是L；X57是F，X127是L且X417是C；X57是S，X233是L且X417是V；X57是S，X86是G且X417是C；X57是A，X153是S且X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F且X153是Q；X57是A，X153是C且X321是L；X57是C，X86是S且X417是T；X57是C，X86是A且X317是L；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是L，X86是F且X318是F；X57是F，X318是G且X417是I；X86是F，X318是R且X417是A；X86是F，X153是C且X297是A；X86是S，X153是T且X297是A；X86是H，X233是L且X417是A；X86是N，X228是G，且X317是L；X86是H，X153是A且X417是C；X86是H，X153是S且X417是C；X95是T，X153是A且X417是C；X113是C，X385是R且X417是C；X153是A，X233是T且X417是C；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X153是S，X228是G且X417是V；X153是C，X317是Y且X319是Q；X153是T，X228是G，且X417是A；X153是T，X319是V且X417是I；X153是T，X228是G且X321是L；X153是S，X317是L且X417是C；X153是A，X317是L且X318是G；X228是G，X318是G且X417是C；X228是G，X317是L且X417是C；X233是L，X321是L且X417是I；X317是L，X318是R且X417是T；X86是H，X153是A，X228是G且X417是I；和X86是H，X153是S， X181是R且X417是T。

在一些实施方式中，能够将辛-2-酮立体选择性地转化成(S)-辛-2-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、134、136、138、140、142、144、146、152、154、156、158、160、162、164、166、168、170、172、174、178、180、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少1.1-倍或更多的比率将辛-2-酮立体选择性地转化成(S)辛-2-胺。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少1.1-倍的比率将辛-2-酮立体选择性地转化成(S)-辛-2-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、34、38、42、44、46、48、52、54、70、72、74、76、80、82、84、86、92、96、98、102、104、108、110、112、114、116、134、136、138、140、142、144、146、152、154、156、164、166、168、170、172、174、178、180、182、184、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将辛-2-酮立体选择性地转化成(S)辛-2-胺。能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少5-倍的比率将辛-2-酮立体选择性地转化成(S)-辛-2-胺的示例性多肽包括对应于SEQ ID NO：22或192的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物1-(4-溴苯基)乙酮立体选择性地转化成产物(S)-1-(4-溴苯基)乙胺，如下

与对底物1-(4-溴苯基)乙酮的活性增加相关的残基位置包括以下中的一个或多个：X12、X30、X31、X44、X57、X81、X82、X85、X86、X95、X112、X113、X127、X153、X153、X166、X181、X228、X233、X297、X311、X314、X317、X318、X319、X320、X321、X385、X407、X408、X409、X417、X434和X438。

在一些实施方式中，能够将1-(4-溴苯基)乙酮立体选择性地转化成(S)-1-(4-溴苯基)乙胺的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X30是A；X57是L；X57是I；X82是H；X85是V；X85是T；X85是A；X85是N；X86是N；X86是F；X86是S；X153是S；X153是T；X153是N；X153是G；X317是M；X317是Y；X319是Q；X320是A；X417是A；X417是I；X417是C；X12是G且X434是V；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是S且X153是A；X85是A且X153是A；X86是S且X153是S；X86是H且X153是A；X112是I且X317是L；X113是H且X407是S；X153是S且X233是S；X314是V且X409是G；X318是G且X408是A；X31是A，X311是V且X314是T；X57是L，X417是C且X438是L；X57是F，X127是L且X417是C；X57是I，X86是F且X320是A；X57是S，X86是G且X417是C；X57是C，X86是S且X417是T；X57是C，X86是A且X317是L；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是F，X318是G且X417是I；X86是H，X153是A且X417是C；X86是H，X153是S且X417是C；X86是F，X318是R且X417是A；X86是F，X153是C且X297是A；X86是S，X153是T且X297I是A；X86是N，X228是G且X317是L；X86是H，X233是L且X417是A；X95是T， X153是A且X417是C；X113是C，X385是R且X417是C；X153是A，X233是T且X417是C；X153是A，X317是L且X318是G；X153是S，X318是R且X417是E；X153是T，X228是G且X321是L；X153是S，X317是L且X417是C；X153是C，X233是L且X318是R；X153是S，X228是G且X417是V；X153是T，X319是V且X417是I；X153是C，X317是Y且X319是Q；X153是T，X228是G且X417是A；X228是G，X317是L且X417是C；X228是G，X318是G且X417是C；X233是L，X321是L且X417是I；X317是L，X318是R且X417是T；X86是H，X153是A，X228是G且X417是I；和X86是H，X153是S，X181是R且X417是T。

在一些实施方式中，能够将1-(4-溴苯基)乙酮转化成(S)-1-(4-溴苯基)乙胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、34、36、38、40、42、44、46、48、50、52、54、56、60、62、64、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、136、138、144、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少1.1-倍或更多的比率将1-(4-溴苯基)乙酮转化成(S)-1-(4-溴苯基)乙胺。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少1.1-倍或更多的比率将1-(4-溴苯基)乙酮转化成(S)-1-(4-溴苯基)乙胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、34、38、42、44、46、48、50、52、54、68、70、72、74、76、78、80、82、84、86、88、92、94、96、98、100、102、104、108、110、112、114、116、118、136、150、152、154、156、160、164、166、170、172、174、182、184、186、188或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将1-(4-溴苯基)乙酮转化成产物(S)-1-(4-溴苯基)乙胺。在一些实施方式中，能够以比SEQ ID NO：2和/或 SEQ ID NO：18的多肽大至少5-倍或更多的比率将1-(4-溴苯基)乙酮转化成(S)-1-(4-溴苯基)乙胺的转氨酶多肽包括对应于SEQ ID NO：84、102、108、120、122、124、128、132、172、184或186的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物4-苯基丁-2-酮立体选择性地转化成产物(R)-4-苯基丁-2-胺，如下：

与对底物4-苯基丁-2-酮的活性增强相关的残基位置包括以下中的一个或多个：X30、X31、X44、X57、X81、X82、X85、X86、X113、X153、X166、X181、X228、X233、X297、X317、X318、X319、X320、X321、X385、X407、X408、X417和X438。

在一些实施方式中，能够将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X30是A；X31是A；X57是L；X57是I；X82是H；X85是V；X85是S；X85是T；X85是A；X86是S；X86是N；X86是F；X153是S；X153是T；X153是N；X153是G；X319是Q；X317是M；X317是Y；X320是A；X417是A；X417是I；X417是C；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是A且X153是A；X85是A且X317是L；X85是S且X153是A；X86是S且X153是S；X86是H且X153是A；X113是H且X407是S；X318是G且X408是A；X153是S且X233是S；X57是A，X153是S且X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F，且X153是Q；X57是A，X153是C且X321是L；X57是L，X417是C且X438是L；X57是S，X233是L且X417是V；X57是C，X86是S，且X417是T；X57是S，X86是G 且X417是C；X57是C；X86是A且X317是L；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是L，X86是F且X318是F；X57是F，X318是G且X417是I；X86是H，X153是S且X417是C；X86是H，X153是A且X417是C；X86是F，X318是R且X417是A；X86是F，X153是C且X297是A；X86是S，X153是T且X297是A；X86是H，X233是L且X417是A；X86是N，X228是G且X317是L；X113是C，X385是R且X417是C；X153是A，X233是T且X417是C；X153是A，X317是L且X318是G；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X153是T，X228是G且X321是L；X153是S，X317是L且X417是C；X153是S，X228是G且X417是V；X153是C，X317是Y且X319是Q；X153是T，X228是G且X417是A；X228是G，X317是L且X417是C；X228是G，X318是G且X417是C；X233是L，X321是L且X417是I；X317是L，X318是R且X417是T；X86是H，X153是A，X228是G且X417是I；和X86是H，X153是S，X181是R且X417是T。

在一些实施方式中，能够将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、178、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少1.1-倍或更多的比率将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少1.1-倍或更多的比率将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、34、42、44、46、52、68、72、74、76、78、80、 82、84、86、88、90、92、94、96、98、102、104、110、112、114、134、136、138、140、142、144、146、148、150、154、156、158、162、164、166、168、172、174、178、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQID NO：18的多肽大至少5-倍或更多的比率将4-苯基丁-2-酮立体选择性地转化成(R)-4-苯基丁-2-胺的转氨酶多肽包括对应于SEQ ID NO：154、172或178的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物3-氧代丁酸乙酯立体选择性地转化成产物(R)-3-氨基丁酸乙酯，如下

与对底物1-氧代丁酸乙酯的活性增强相关的残基位置包括以下中的一个或多个：X57、X85、X86、X147、X153、X233、X317、X318和X417。

在一些实施方式中，能够将3-氧代丁酸乙酯立体选择性地转化成(R)3-氨基丁酸乙酯的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X85是V；X85是S；X85是T；X85是A；X85是N；X85是C；X153是T；X153是N；X153是G；X153是S；X417是C；X85是S且X153是A；X85是A且X153是A；X85是A且X317是L；X86是H且X153是A；X85是A，X153是S且X417是S；X85是S，X153是A且X233是T；X85是A，X147是G且X153是A；X86是H，X153是A且X417是C；X86是H，X153是S且X417是C；X153是A，X317是L且X318是G；X57是I，X85是A，X86是H且X417是C；和X57是L，X86是F，X153是S，X233是T且X417是T。

在一些实施方式中，能够将3-氧代丁酸乙酯立体选择性地转化成(R)-3-氨基丁酸乙酯的转氨酶多肽包括对应于SEQ ID NO：32、34、36、40、44、56、58、60、62、64、66、68、70、72、86、88、90、92、122、126、128、130或132的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将3-氧代丁酸乙酯立体选择性地转化成(R)-3-氨基丁酸乙酯。能够进行上面反应的多肽包括但不限于包括对应于SEQ ID NO：32、36、40、56、58、60、62、64、66、126、128或130的氨基酸序列的多肽。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物3-氧代丁酸乙酯立体选择性地转化成产物(S)-3-氨基丁酸乙酯，如下：

与对底物1-氧代丁酸乙酯的活性增强相关的残基位置包括以下中的一个或多个：X12、X30、X31、X44、X57、X81、X82、X85、X86、X112、X113、X127、X153、X166、X228、X233、X297、X311、X314、X317、X318、X319、X320、X321、X385、X407、X408、X409、X417、X434和X438。

在一些实施方式中，能够将3-氧代丁酸乙酯转化成(S)-3-氨基丁酸乙酯的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X30是A；X31是A；X57是I；X57是L；X82是H；X86是S；X86是N；X86是F；X317是M；X417是A；X319是Q；X320是A；X12是G且X434是V；X44是A且X166是S；X57是I且X153是S；X81是D且X86是H；X82是H且X417是F；X85是S且X153是S；X86是S且X153是S；X112是I且X317是L；X113是H且X407是S；X318是G且X408是A；X314是V且X409是G；X311是V且X314是T；X57 是L，X417是C且X438是L；X57是F，X127是L且X417是C；X57是S，X233是L且X417是V；X57是S，X86是G且X417是C；X57是A，X153是S且X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F且X153是Q；X57是A，X153是C且X321是L；X57是C，X86是A且X317是L；X57是F，X318是F且X417是S；X57是L，X86是S且X153是A；X57是L，X86是F且X318是F；X57是C，X86是S且X417是T；X57是F，X318是G且X417是I；X86是F，X318是R且X417是A；X86是N，X228是G且X317是L；X86是F，X153是C且X297是A；X86是S，X153是T且X297是A；X86是H，X233是L且X417是A；X113是C，X385是R且X417是C；X153是A，X233是T且X417是C；X153是C，X233是L且X318是R；X153是T，X228是G且X321是L；X153是S，X317是L且X417是C；X153是S，X228是G且X417是V；X153是C，X317是Y且X319是Q；X153是T，X228是G且X417是A；X228是G，X317是L且X417是C；X228是G，X318是G且X417是C；X233是L，X321是L且X417是I；X317是L，X318是R且X417是T；和X86是H，X153是A，X228是G且X417是I。

在一些实施方式中，能够将3-氧代丁酸乙酯立体选择性地转化成(S)-3-氨基丁酸乙酯的转氨酶多肽包括对应于SEQ ID NO：20、22、24、26、28、30、38、42、46、48、50、52、54、74、78、80、82、94、96、98、100、102、106、112、114、116、118、120、124、134、136、138、140、142、144、146、148、150、152、154、156、158、162、164、166、168、170、172、174、178、180、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少1.1-倍或更多的比率将3-氧代丁酸乙酯立体选择性地转化成(S)-3-氨基丁酸乙酯。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少1.1-倍或更多的比率将3-氧代丁酸乙酯转化成(S)-3-氨基丁酸乙酯的转氨酶多肽包括对应于SEQ ID NO：22、26、28、38、46、56、60、64、78、84、86、90、100、102、106、112、118、 136、144、146、154、156、158、160、164、166、168、170、172、174、178、182、188或190的氨基酸序列。

在一些实施方式中，转氨酶多肽能够以比SEQ ID NO：2和/或SEQ IDNO：18的多肽大至少5-倍或更多的比率将3-氧代丁酸乙酯立体选择性地转化成(S)-3-氨基丁酸乙酯。在一些实施方式中，能够以比SEQ ID NO：2和/或SEQ ID NO：18的多肽大至少5-倍或更多的比率将3-氧代丁酸乙酯立体选择性地转化成(S)-3-氨基丁酸乙酯的转氨酶多肽包括对应于SEQ ID NO：22、26、28、38、46、56、60、64、78、84、86、90、100、102、106、112、118、136、144、154、166、170、174、178或188的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物1-(6-甲氧基萘-2-基)乙酮立体选择性地转化成产物(S)-1-(6-甲氧基萘-2-基)乙胺，如下：

与对底物1-(6-甲氧基萘-2-基)乙酮的活性增加相关的残基位置包括以下中的一个或多个：X57、X86、X153、X233、X317、X318、X320、X321、X417和X438。

在一些实施方式中，能够将1-(6-甲氧基萘-2-基)乙酮转化成(S)-1-(6-甲氧基萘-2-基)乙胺的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X57是L；X86是F或N；X417是C，I或A；X57是L，X86是F，X153是S，X233是T且X417是T；X57是C，X86是S且X417是T；X57是S，X233是L，且X417是V；X57是A，X153是S且X318是G；X57是A，X153是C，且X321是L；X57是L，X86是S，且X153是A；X57是S，X86是G且X417是C；X57是L，X86是F，X318是F；X57是F，X86是F，且X153是Q；X57是I；X86是F且X320是A；X57是C，X86是A且X317是L；X57是L，X417是C且 X438是L；X86是F，X318是R且X417是A；X57是F.X86是H且X153是Q；X57是F，X318是F且X417是S；X86是H，X153是S，X181是R且X417是T；X153是S，X317是L且X417是C；X153是T，X228是G且X417是A；X57是F，X127是L且X417是C；X228是G，X317是L且X417是C；X233是L，X321是L且X417是I；X228是G，X318是G且X417是C；X86是H，X153是S且X417是C；X86是H，X233是L且X417是A；X86是S且X153是S；X86是F，X153是C且X297是A；X153是S，X228是G且X417是V；X57是F，X318是G且X417是I；X153是T，X228是G且X321是L；X317是L，X318是R且X417是T；X153是C，X317是Y，且X319是Q；X57是I且X153是S；X86是H，X153是A且X417是C；X153是A，X233是T且X417是C；X95是T，X153是A且X417是C；X86是N，X228是G且X317是L；和X86是S，X153是T，X297是A。

在一些实施方式中，能够将1-(6-甲氧基萘-2-基)乙酮立体选择性地转化成(S)-1-(6-甲氧基萘-2-基)乙胺的转氨酶多肽包括对应于SEQ ID NO：24、26、28、46、48、78、84、86、88、92、102、108、110、114、116、126、134、136、138、140、142、144、146、148、150、152、154、156、158、162、166、168、170、172、174、178、180、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮立体选择性地转化成产物(S)-1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙胺，如下：

与对底物1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮的活性增加相关的残基位置包括以下中的一个或多个：X57、X86、X153、X228、X233、X297、X318、X320、X417和X438。

在一些实施方式中，能够将1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮转化成产物(S)-1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙胺的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X31是A；X57是C、I或L；X86是S或F；X153是G或S；X417是T或I；X57是F，X86是F，且X153是Q；X57是I且X153是S；X57是L，X86是F，X153是S，X233是T且X417是T；X86是F，X153是C，且X297是A；X57是L，X417是C，且X438是L；X57是S，X233是L，且X417是V；X57是L，X86是S，X153是A；X57是S，X86是G，且X417是C；X57是A，X153是S，X318是G；X57是I，X86是F且X320是A；X57是L，X86是F，X318是F；X153是S，X228是G，且X417是V；X57是C，X86是A，且X317是L；X153是S且X233是S；X57是A，X153是C且X321是L；X86是S且X153是S；X86是H，X153是S，X181是R，且X417是T；X21是N，X45是N，X177是V，X208是I，X211是R，X324是S，且X391是T；X86是H，X153是A，X228是G，且X417是I；和X153是C，X233是L且X318是R。

在一些实施方式中，能够将1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮立体选择性地转化成产物(S)-1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙胺的转氨酶多肽包括对应于SEQ ID NO：16、26、28、42、44、46、48、72、84、98、104、106、110、114、126、134、136、140、144、146、148、152、156、164、166、178、180或182的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物1-(4-苯氧基苯基)乙酮立体选择性地转化成产物(S)-1-(4-苯氧基苯基)乙胺，如下：

与对底物1-(4-苯氧基苯基)乙酮的活性增加相关的残基位置包括以下中的一个或多个：X57、X86、X153、X181、X233、X297、X318、X417和X438。

在一些实施方式中，能够将1-(4-苯氧基苯基)乙酮转化成(S)-1-(4-苯氧基苯基)乙胺的转氨酶多肽包括具有以下特征或特征组中的至少一种的氨基酸序列：X31是A；X86是S或F；X57是L或I；X153是S或G；X417是A或I；X57是I且X153是S；X86是S且X153是S；X153是S且X233是S；X86是H且X153是A；X86是H；X153是A且X417是C；X95是T，X153是A且X417是C；X86是H，X153是S且X417是C；X57是L，X417是C且X438是L；X57是S，X233是L且X417是V；X57是S，X86是G且X417是C；X57是A，X153是S，X318是G；X57是F，X86是H且X153是Q；X57是I，X86是F且X320是A；X57是F，X86是F且X153是Q；X57是C，X86是S且X417是T；X86是F，X153是C且X297是A；X86是H，X233是L且X417是A；X153是C，X233是L且X318是R；X57是C，X86是A且X317是L；X57是L，X86是S且X153是A；X57是L，X86是F且X318是F；X153是S，X228是G且X417是V；X153是T，X228是G且X417是A；X86是H，X153是A，X228是G且X417是I；X86是H，X153是S，X181是R，且X417是T；和X57是L，X86是F，X153是S，X233是T且X417是T。

在一些实施方式中，能够将1-(4-苯氧基苯基)乙酮立体选择性地转化成产物(S)-1-(4-苯氧基苯基)乙胺的转氨酶多肽包括对应于SEQ ID NO：16、20、26、28、42、44、46、48、72、78、84、88、90、92、98、104、106、108、110、114、126、134、136、140、142、144、146、154、156、162、 164、166、178、180、182或190的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯立体选择性地转化成产物(3S，4S)-3-氨基四氢-2H-吡喃-3-基-苯甲酸酯，如下：

与对底物(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯的活性增强相关的残基位置包括以下中的一个或多个：X57、X86、X153、X233、X317、X318、X320、X321和X417。

在一些实施方式中，能够将(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯转化成产物(3S，4S)-3-氨基四氢-2H-吡喃-3-基苯甲酸酯的转氨酶多肽包括具有以下特征或特征组中至少一个的氨基酸序列：X57是I且X153是S；X57是A，X153是S且X318是G；X57是A，X153是C且X321是L；X57是L，X86是S且X153是A；X57是I，X86是F，X320是A；X57是S，X86是G，且X417是C；X57是C，X86是S且X417是T；X57是C，X86是A且X317是L；X57是L，X86是F，X153是S，X233是T且X417是T。

在一些实施方式中，能够将(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯立体选择性地转化成产物(3S，4S)-3-苄氧基四氢-2H-吡喃-4-胺的转氨酶多肽包括对应于SEQ ID NO：46、126、136、140、144、148、154、166或178的氨基酸序列。

在一些实施方式中，本文描述的转氨酶多肽能够以大于SEQ ID NO：2和/或SEQ ID NO：18的多肽的比率将底物(R)-3-(苄氧基)二氢-2H-吡喃 -4(3H)-酮立体选择性地转化成产物(3S，4S)-3-(苄氧基)四氢-2H-吡喃-4-胺，如下：

与对底物(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮的活性增强相关的残基位置包括以下中的一个或多个：X57、X86、X153、X233、X317、X318、X320、X321和X417。

在一些实施方式中，能够将(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成产物(3S，4S)-(3-(苄氧基)四氢-2H-吡喃-4-胺的转氨酶多肽包括具有以下特征或特征组中至少一个的氨基酸序列：X30是A；X31是A；X57是I或L；X82是H；X85是S，T，A；X86是S，F；X153是N，G，S，T；X317是M或Y；X319是Q；X320是A；X417是A，I或C；X57是I且X153是S；X85是S且X153是S；X81是D且X86是H；X86是H且X153是A；X86是S且X153是S；X85是S且X153是A；X85是A且X153是A；X314是V且X409是G；X311是V且X314是T；X82是H且X417是F；X85是A且X317是L；X318是G且X408是A；X153是S且X233是S；X113是H且X407是S；X12是G且X434是V；X112是I且X317是L；X44是A且X166是S；X86是H，X153是S且X417是C；X57是F.X127是L且X417是C；X57是S，X86是G且X417是C；X228是G，X317是L，X417是C；X57是F，X86是H且X153是Q；X86是F，X318是R且X417是A；X86是F，X153是C且X297是A；X86是N，X228是G且X317是L；X57是L，X86是F且X318是F；X153是S，X228是G且X417是V；X57是F，X86是F且X153是Q；X57是L，X417是C且X438是L；X57是A，X153是C且X321是L；X57是S，X233是L且X417是V；X86是S，X153是T且X297是A； X57是F，X318是F且X417是S；X153是T，X319是V且X417是I；X57是S，X233是L且X417是V；X57是I，X86是F且X320是A；X57是F，X318是G且X417是I；X153是C，X317是Y且X319是Q；X57是L，X86是S且X153是A；X233是L，X321是L且X417是I；X95是T，X153是A；和X417是C；X86是H，X153是A且X417是C；X228是G，X318是G且X417是C；X85是S，X153是A且X233是T；X57是A，X153是S且X318是G；X153是S，X318是R且X417是E；X153是C，X233是L且X318是R；X153是A；X233是T且X417是C；X85是A，X147是G且X153是A；X153是S，X317是L且X417是C；X317是L，X318是R且X417是T；X153是T，X228是G且X417是A；X57是C，X86是A且X317是L；X153是A，X317是L且X318是G；X57是C，X86是S且X417是T；X86是H，X233是L且X417是A；X153是T，X228是G，X321是L；X113是C，X385是R且X417是C；X86是H，X153是S，X181是R且X417是T；X86是H，X153是A，X228是G且X417是I；X57是I，X85是A，X86是H且X417是C；和X57是L，X86是F，X153是S，X233是T且X417是T。

在一些实施方式中，能够将(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮立体选择性地转化成(3S，4S)-3-(苄氧基)四氢-2H-吡喃-4-胺的转氨酶多肽包括对应于SEQ ID NO：20、22、26、28、30、32、34、36、40、42、44、46、48、50、52、58、60、68、70、72、78、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、114、116、118、122、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190或192的氨基酸序列。

在一些实施方式中，与SEQ ID NO：1的多核苷酸编码的SEQ ID NO：2的多肽的表达相比，本发明的转氨酶多肽在宿主细胞、具体地大肠杆菌宿主细胞中的表达被改进。在这种实施方式中，转氨酶多肽可以具有含有以下特征中的至少一个或多个的氨基酸序列：X4是R；X6是R或I或N；X9是T或G；X6是R且X133是T；X12是K且X302是K；和X9是T， X86是Y且X294是V。在一些实施方式中，具有增强的表达的转氨酶多肽可以由以下多核苷酸序列编码，所述多核苷酸序列具有与SEQ ID NO：1或SEQ ID NO：17的多核苷酸序列相比的以下残基差异中的一个或多个：X852是T且X861是A；X18是T且X286是T；X891是C；X12是A且X15是A且X18是T；X309是T；和X561是C。

能够增强表达的示例性转氨酶多肽包括但不限于包括对应于SEQ IDNO：4、6、8、12、14、194、196或198的氨基酸序列的多肽。

因为具有SEQ ID NO：18的氨基酸序列的参照多肽能够以相对野生型(SEQ ID NO：2)被改进的比率(例如，1g/L底物与约10g/L的转氨酶在50％异丙胺中在pH 8在20小时中100％转化)和立体选择性将底物转化成产物，所以相对SEQ ID NO：18被改进的本文的多肽相对野生型也被改进。

下面表2提供与SEQ ID NO：2的野生型转氨酶相比具有增强的热和/或溶剂稳定性的SEQ ID NO列表。所有序列从野生型河流弧菌转氨酶序列(SEQ ID NO：2)得到。在下面表2中，每行列出两个SEQ ID NO，其中标记“Nuc ID”的列中的奇数指编码由标记“Pep ID”的列中偶数提供的氨基酸序列的核苷酸序列。与SEQ ID NO：2的热稳定的河流弧菌氨基酸序列相比的氨基酸取代列在列“有效的氨基酸突变”中。

表2：序列表和相应的热稳定性改进

¹ND＝不可检测

^a％活性测定为50℃1.0M丙酮酸与1.0M异丙胺在pH 9的％转化。

^b％活性测定为与35℃相同的反应相比在50℃23h之后丙酮酸的％转化。

下面表3提供将七种不同的氨基受体底物转化成相应的氨基产物的S对映体的转氨酶的SEQ ID NO以及与它们相关的活性的列表。底物1至7是(Sub 1)3，4-二氢萘-1(2H)-酮；(Sub 2)1-苯基丁-2-酮；(Sub 3)3，3-二甲基丁-2-酮；(Sub 4)辛-2-酮；(Sub 5)3-氧代丁酸乙酯；(Sub 6)4-苯基丁-2-酮；和(Sub 7)1-(4-溴苯基)乙酮。与SEQ ID NO：18的热稳定的河流弧菌氨基酸序列相比氨基酸取代列在列“有效的氨基酸突变”中。在活性列中，一个或多个加号“+”表明多肽与SEQ ID NO：2的野生型氨基酸序列相比具有将氨基受体底物转化成手性胺产物的改进的能力。两个加号“++”表明多肽与SEQ ID NO：18相比是约1.1至5-倍改进的。三个加号“+++”表明多肽与SEQID NO：18相比是约5至10-倍改进的。四个加号“++++”表明多肽与SEQ IDNO：18相比是大于10-倍改进的。空白显示数据不可用。对于大多数突变的多肽底物3-7显示增强的活性。对于较少的多肽底物1和2显示增强的活性。

表3：序列表和相应的活性改进

下面表4提供将两种不同的氨基受体底物转化成相应的氨基产物的R对映体的SEQ ID NO与它们相关的活性的列表。底物5和6是(Sub 5)3-氧代丁酸乙酯和(Sub 6)4-苯基丁-2-酮。下面所有序列从野生型河流弧菌转氨酶序列(SEQ ID NO：2)得到。在下面表4中，标记“Nuc ID”的列中的奇数SEQ ID NO指编码由标记“Pep ID”的列中偶数SEQ ID NO提供的氨基酸序列的核苷酸序列。与SEQ ID NO：18的氨基酸序列相比的氨基酸取代列在“有效的氨基酸突变”中。在活性列中，一个或多个加号“+”表明多肽与SEQID NO：2的野生型氨基酸序列相比具有将氨基受体底物转化成手性胺产物的改进的能力。两个加号“++”表明多肽与SEQ ID NO：18相比是约1.1至5-倍改进的。三个加号“+++”表明多肽与SEQ ID NO：18相比是约5至10-倍改进的。四个加号“++++”表明多肽与SEQ ID NO：18相比是大于10-倍改进的。空白显示数据不可用。对于大多数突变的多肽底物5显示增强的活性。对于较少的多肽底物6显示增强的活性。

表4：序列表和相应的活性改进

在一些实施方式中，改进的转氨酶包括与SEQ ID NO：2或SEQ ID NO：18至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的氨基酸序列，其中氨基酸序列包括与对应于SEQ ID NO：2或SEQ ID NO：18的参照序列相比表3或表4中列出的多肽序列的任何一个中包含的突变组中的任何一个。在一些实施方式中，这一转氨酶多肽包括表3或表4中列出的突变组的任何一个。在一些实施方式中，工程转氨酶可以在其它残基位置另外具有约1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55或1-60个残基差异。在一些实施方式中，与参照序列相比差异数目可以是1、2、3、4、5、6、7、8、9、10、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45、50、55或60个残基位置。在一些实施方式中，残基差异包括保守的突变。

在一些实施方式中，改进的转氨酶多肽包括与以下参照序列至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的氨基酸序列，所述参照序列对应于SEQ IDNO：4、6、8、10、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198，其中与对应于SEQ IDNO：2或SEQ ID NO：18的参照序列相比，工程转氨酶氨基酸序列包括在表3或表4中列出的多肽序列的任一个中包含的突变组中的任一个。在一些实施方式中，这一转氨酶多肽包括表3或表4中列出的突变组中的任何一个。在一些实施方式中，这些工程转氨酶可以在其它残基位置另外具有约1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55或1-60个残基差异。在一些实施方式中，与参照序列相比的差异数目可以是1、2、3、4、5、6、7、8、 9、10、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45、50、55或60个残基位置。在一些实施方式中，残基差异包括保守的突变。

在一些实施方式中，本发明的多肽的氨基酸序列明确排除通过以下任何单个突变中的仅一个与河流弧菌的野生型序列不同的那些：残基X57是G；残基X147是G；残基X231是G；残基X233是L；残基X265是L；残基X285是A；残基X297是A；和残基X415是L。

本文描述的工程转氨酶可以通过诱变处理编码天然存在的野生型转氨酶的基因来获得，所述天然存在的野生型转氨酶的基因与河流弧菌转氨酶的氨基酸序列(SEQ ID NO：2)至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同，所述诱变处理使用标准的实验方法，包括各种诱变和重组方法。

如本领域技术人员所理解，除非另外说明，用于描述本文的工程转氨酶的上面定义的氨基酸残基类别中的一些类别不是互相排斥的。因此，具有显示两种或多种物化性质的侧链的氨基酸可以被包括在多个类别中。特别是参考本文提供的详细公开内容，任何氨基酸或残基的适合的分类对于本领域技术人员将是显然的。

在一些实施方式中，改进的工程转氨酶多肽包括本文描述的工程转氨酶多肽的缺失。因此，对于本公开内容的转氨酶多肽的每一个实施方案，缺失可以包括1个或多个氨基酸、2或多个氨基酸、3或多个氨基酸、4或多个氨基酸、5或多个氨基酸、6或多个氨基酸、8或多个氨基酸、10或多个氨基酸、15或多个氨基酸，或20或多个氨基酸，最多转氨酶多肽的氨基酸总数的10％，最多转氨酶多肽的氨基酸总数的10％，最多转氨酶多肽的氨基酸总数的20％，最多转氨酶多肽的氨基酸总数的30％，只要转氨酶的功能活性和/或改进的性质被保持。在一些实施方式中，缺失可以包括：1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个氨基酸残基。在一些实施方式中，缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个或60个氨基酸。在一些实施方式中，缺失可以包括1个、2个、3个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、25个或30个氨基酸残基的缺失。

在一些实施方式中，改进的工程转氨酶多肽可以包括本文描述的工程转氨酶多肽的片段。在一些实施方式中，多肽片段可以是全长转氨酶多肽如SEQ ID NO：18的转氨酶的70％、80％、90％、95％、98％或99％。

本文描述的多肽不限于遗传编码的氨基酸。除了遗传编码的氨基酸，本文描述的多肽可以全部或部分地由天然存在的和/或合成的非编码的氨基酸构成。可以组成本文描述的多肽的某些常见的非编码的氨基酸包括但不限于：遗传编码的氨基酸的D-立体异构体；2，3-二氨基丙酸(Dpr)；α-氨基异丁酸(Aib)；ε-氨基己酸(Aha)；δ-氨基戊酸(Ava)；N-甲基甘氨酸或肌氨酸(MeGly或Sar)；鸟氨酸(Orn)；瓜氨酸(Cit)；叔丁基丙氨酸(Bua)；叔丁基甘氨酸(Bug)；N-甲基异亮氨酸(MeIle)；苯基甘氨酸(Phg)；环己基丙氨酸(Cha)；正亮氨酸(Nle)；萘基丙氨酸(Nal)；2-氯苯丙氨酸(Ocf)；3-氯苯丙氨酸(Mcf)；4-氯苯丙氨酸(Pcf)；2-氟苯丙氨酸(Off)；3-氟苯丙氨酸(Mff)；4-氟苯丙氨酸(Pff)；2-溴苯丙氨酸(Obf)；3-溴苯丙氨酸(Mbf)；4-溴苯丙氨酸(Pbf)；2-甲基苯丙氨酸(Omf)；3-甲基苯丙氨酸(Mmf)；4-甲基苯丙氨酸(Pmf)；2-硝基苯丙氨酸(Onf)；3-硝基苯丙氨酸(Mnf)；4-硝基苯丙氨酸(Pnf)；2-氰基苯丙氨酸(Ocf)；3-氰基苯丙氨酸(Mcf)；4-氰基苯丙氨酸(Pcf)；2-三氟甲基苯丙氨酸(Otf)；3-三氟甲基苯丙氨酸(Mtf)；4-三氟甲基苯丙氨酸(Ptf)；4-氨基苯丙氨酸(Paf)；4-碘苯丙氨酸(Pif)；4-氨基甲基苯丙氨酸(Pamf)；2，4-二氯苯丙氨酸(Opef)；3，4-二氯苯丙氨酸(Mpcf)；2，4-二氟苯丙氨酸(Opff)；3，4-二氟苯丙氨酸(Mpff)；吡啶-2-基丙氨酸(2pAla)；吡啶-3-基丙氨酸(3pAla)；吡啶-4-基丙氨酸(4pAla)；萘-1-基丙氨酸(1nAla)；萘-2-基丙氨酸(2nAla)；噻唑基丙氨酸(taAla)；苯并噻吩基丙氨酸(bAla)；噻吩基丙氨酸(tAla)；呋喃基丙氨酸(fAla)；高苯丙氨酸(hPhe)；高酪氨酸(hTyr)；高色氨酸(hTrp)；五氟苯丙氨酸(5ff)；苯乙烯基丙氨酸(sAla)；蒽基丙氨酸(aAla)；3，3-二苯丙氨酸(Dfa)；3-氨基-5-苯基戊酸(Afp)；青霉胺(Pen)；1，2，3，4-四氢异喹啉-3-羧酸(Tic)；β-2-噻吩基丙氨酸(Thi)；甲硫氨酸亚砜(Mso)；N(w)-硝基精氨酸(nArg)；高赖氨酸(hLys)；膦酰基甲基苯丙氨酸(pmPhe)；磷酸丝氨酸(pSer)；磷酸苏氨酸(pThr)；高天冬氨酸(hAsp)；高谷氨酸(hGlu)；1-氨基环戊-(2或3)-烯-4羧酸；哌可酸(PA)，氮杂环丁烷-3-羧酸(ACA)；1-氨基环戊烷-3-羧酸；烯丙基甘氨酸(aOly)；炔丙基甘氨酸(pgGly)；高丙氨酸(hAla)；正缬氨酸(nVal)；高亮氨酸(hLeu)；高缬氨酸(hVal)；高异亮氨酸(hIle)；高精氨酸(hArg)；N-乙酰基赖氨酸(AcLys)；2，4-二氨基丁酸(Dbu)；2，3-二氨基丁酸(Dab)；N-甲基缬氨酸(MeVal)；高半胱氨酸(hCys)；高丝氨酸(hSer)；羟基脯氨酸(Hyp)和高脯氨酸(hPro)。可以组成本文描述的多肽的另外的非编码的氨基酸对于本领域技术人员将是明显的(参见，例如Fasman，1989，CRC Practical Handbook of Biochemistry and Molecular Biology(CRC生物化学和分子生物学实践手册)，CRC Press，Boca Raton，FL，pp.3-70和其中引用的文献中提供的各种氨基酸，其全部通过引用并入)。这些氨基酸可以是L-或D-构型。

本领域技术人员将认识：带侧链保护基的氨基酸或残基也可以构成本文描述的多肽。这些保护的氨基酸的非限制性实例，在这一情况中属于芳族类型，包括(保护基列在括弧中)但不限于：Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶亚磺酰基)、Glu(δ-苄基酯)、Gln(占吨基)、Asn(N-δ-占吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。

可组成本文描述的多肽的构象限制的非编码的氨基酸包括但不限于：N-甲基氨基酸(L-构型)；1-氨基环戊-(2或3)-烯-4-羧酸；哌可酸；氮杂环丁烷-3-羧酸；高脯氨酸(hPro)；和1-氨基环戊烷-3-羧酸。

如上面所描述引入天然存在的多肽以产生工程转氨酶的各种修饰可以靶向酶的特定的性质。

在一些实施方式中，本公开内容的多肽可以是融合多肽的形式，其中工程化的多肽被融合到其它多肽，如，举例但非限制，抗体标签(例如myc表位)，纯化序列(例如用于与金属结合的His标签)和细胞定位信号(例如分泌信号)。因此，本文描述的工程化的多肽可以伴随与其它多肽的融合或不伴随与其它多肽的融合被使用。

在一些实施方式中，本文描述的多肽可以试剂盒的形式被提供。试剂盒中的酶可以个体地存在或作为多个酶存在。试剂盒可以进一步包括用于进行酶反应的试剂，用于评价酶活性的底物，以及用于检测产物的试剂。试剂盒还可包括试剂分配器和对试剂盒的使用说明书。

在一些实施方式中，多肽可以在物理底材上被提供。在一些实施方式中，多肽可以阵列的形式被提供，其中多肽被排列在位置不同的位置中。阵列可以被用于测试多种底物被多肽的转化。在阵列环境中“底材”、“支持体”、“固体支持体”、“固体载体”或“树脂”指任何固相材料。底材还包括术语如“固相”、“表面”和/或“膜”。固体支持体可以由有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧基和聚丙烯酰胺及其共聚物和嫁接物组成。固体支持体也可以是无机的，如玻璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属，如金或铂。底材的构造可以呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的，基本上平面的或非平面的。固体支持体可以是多孔的或非多孔的，并且可以具有溶胀的或非溶胀的性质。固体支持体可以被配置成孔、凹窝或其它容器、管(vessel)、特征或位置的形式。多个支持体可以配置在阵列上的不同的位置，这对于试剂的机器人递送或通过检测方法和/或工具是可寻址的。

在某些实施方式中，本公开内容的试剂盒包括以下的阵列，其包括在不同的可寻址的位置的多个不同的转氨酶多肽，其中不同的多肽是参照序列的不同的变体，所述变体各自具有至少一个不同的改进的酶性质。包括多个工程化的多肽的这种阵列和它们的使用方法被描述在例如WO2009/008908A2中。

在一些实施方式中，转氨酶多肽可以被结合在物理底材上。转氨酶多肽可以被非共价地或共价地结合。用于与底材例如膜、珠、玻璃等轭合的各种方法，被描述在Hermanson，G.T.，Bioconjugate Techniques(生物轭合技术)，第二版，Academic Press；(2008)，和Bioconjugation Protocols：Strategies and Methods(生物轭合方案：策略和方法)，于Methods in Molecular Biology(分子生物学方法)，C.M.Niemeyer编著.，Humana Press(2004)等；其公开内容通过引用并入本文。

编码工程转氨酶的多核苷酸

在另一方面，本公开内容提供编码工程转氨酶的多核苷酸。多核苷酸可以与控制基因表达的一个或多个异源的调节序列可操作地连接，以产生能够表达多肽的重组的多核苷酸。包含编码工程转氨酶多肽的异源的多核苷酸的表达构建体可以被引入适合的宿主细胞以表达相应的转氨酶多肽。

因为知晓与各种氨基酸相应的密码子，所以蛋白序列的可用性提供能够编码主题的所有多核苷酸的说明。遗传密码的简并性，其中相同的氨基酸由可选的或同义的密码子编码，允许制备非常大数目的核酸，其都编码本文描述的改进的转氨酶。因此，鉴定了具体的氨基酸序列后，本领域技术人员将能以不改变蛋白的氨基酸序列的方式通过简单地修改序列的一个或多个密码子来制备任何数目的不同的核酸。在这一角度，本公开内容明确涵盖多核苷酸的每个可能的变型，其可以通过选择基于可能的密码子选择的组合被制备，并且所有这样的变型被认为对于本文公开的任何多肽的明确公开，包括表3或表4中所列的氨基酸序列。

在各种实施方式中，密码子被优选地选择以适合产生蛋白的宿主细胞。例如，细菌中使用的优选的密码子被用于在细菌中表达基因；酵母中使用的优选的密码子被用于酵母中的表达；并且哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。

在某些实施方式中，所有密码子不需要被替换以优化转氨酶的密码子使用，因为天然序列将包括优选的密码子并且因为优选的密码子的使用可能不是对于所有氨基酸残基必需的。因此，编码转氨酶的密码子优化的多核苷酸可以在全长编码区域的约40％、50％、60％、70％、80％或大于90％的密码子位置包含优选的密码子。

在一些实施方式中，多核苷酸包括编码具有以下的氨基酸序列的转氨酶多肽的核苷酸序列，所述氨基酸序列与本文描述的参照工程转氨酶多肽的任一个具有至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的序列同一性。因此，在一些实施方式中，多核苷酸编码与以下SEQ ID NO至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同的氨基酸序列，所述SEQ ID NO为SEQ ID NO：4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198，其中多肽具有转氨酶活性和本文描述的改进的性质中的一种或多种。

在一些实施方式中，多核苷酸包括编码具有以下的氨基酸序列的工程转氨酶多肽的核苷酸序列，所述氨基酸序列与包括对应于SEQ ID NO：10的氨基酸的多肽具有至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的序列同一性，其中多肽具有转氨酶活性和本文描述的改进的性质中的一个或多个。

在一些实施方式中，多核苷酸包括编码具有以下的氨基酸序列的工程转氨酶多肽的核苷酸序列，所述氨基酸序列与包括对应于SEQ ID NO：16的氨基酸的多肽具有至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的序列同一性，其中多肽具有转氨酶活性和本文描述的改进的性质中的一个或多个。

在一些实施方式中，多核苷酸包括编码具有以下的氨基酸序列的工程转氨酶多肽的核苷酸序列，所述氨基酸序列与包括对应于SEQ ID NO：18 的氨基酸的多肽具有至少约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的序列同一性，其中多肽具有转氨酶活性和本文描述的改进的性质中的一个或多个。

在一些实施方式中，编码工程转氨酶的多核苷酸选自SEQ ID NO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195和197。

在一些实施方式中，多核苷酸能够在高度严格的条件下与以下多核苷酸杂交：对应于SEQ ID NO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195或197或其互补序列，并且编码具有转氨酶活性和本文描述的改进的性质中的一种或多种的多肽。

在一些实施方式中，多核苷酸编码本文描述的多肽但在核苷酸水平上与编码工程转氨酶的参照多核苷酸具有约80％或更多的序列同一性，约80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更多的序列同一性。在一些实施方式中，参照多核苷酸序列选自SEQ ID NO：3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、 87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195和197。

编码改进的转氨酶多肽的分离的多核苷酸可以多种方式处理以提供多肽的表达。取决于表达载体，在将分离的多核苷酸插入载体之前对其进行处理可以是期望的或必要的。使用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。指导提供在Sambrook等，2001，Molecular Cloning：A Laboratory Manual(分子克隆：实验室手册)，第三版，Cold Spring Harbor Laboratory Press；和Current Protocols in Molecular Biology(最新分子生物学方案)，Ausubel.F.编著，Greene Pub.Associates，1998，更新至2006中。

对于细菌宿主细胞，用于指导本公开内容的核酸构建体的转录的适合的启动子包括获自以下的启动子：大肠杆菌的乳糖操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热芽孢杆菌(Bacillus stearothermophilus)淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核的β-内酰胺酶基因(Villa-Kamaroff等，1978，Proc.Natl Acad.Sci.USA75：3727-3731)，以及tac启动子(DeBoer等，1983，Proc.Natl Acad.Sci.USA 80：21-25)。

对于丝状真菌宿主细胞，用于指导本公开内容的核酸构建体的转录的适合的启动子包括获自以下基因的启动子：米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的启动子的杂合体)和其突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子可以来自以下的基因：酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其它有用的启动子由Romanos等，1992，Yeast 8：423-488描述。

控制序列也可以是适合的转录终止子序列，转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3′末端。在选择的宿主细胞中有功能的任何终止子可以用于本发明。

例如，用于丝状真菌宿主细胞的示例性转录终止子可以获自以下的基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。

用于酵母宿主细胞的示例性终止子可以获自以下的基因：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其它有用的终止子由Romanos等，1992描述，如上描述。

控制序列也可以是适合的前导序列，mRNA的非翻译区，其对于由宿主细胞翻译是重要的。前导序列可操作地连接到编码多肽的核酸序列的5′末端。可以使用在选择的宿主细胞中是功能性的前导序列。对于丝状真菌宿主细胞，示例性前导序列获自以下的基因：米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。对于酵母宿主细胞，适合的前导序列获自以下的基因：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列也可以是多腺苷酸化序列，多腺苷酸化序列是可操作地连接到核酸序列的3′末端的序列，并且当转录时，其被宿主细胞识别为将聚腺苷残基加到转录的mRNA的信号。在选择的宿主细胞中是功能性的任何多腺苷酸化序列可以用于本发明。对于丝状真菌宿主细胞，示例性多腺苷酸化序列可以获自以下的基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。对于酵母宿主细胞，有用的多腺苷酸化序列由Guo和Sherman，1995，Mol Cell Bio 15：5983-5990描述。

控制序列也可以是信号肽编码区，其编码与多肽的氨基末端连接的氨基酸序列并指导编码的多肽进入细胞的分泌途径。核酸序列的编码序列的5′末端可以本身包含信号肽编码区域，其与编码分泌的多肽的编码区的区段按照翻译读码框天然地连接。可选地，编码序列5′末端可以包含对于编码序列是外来的信号肽编码区。当编码区天然不含信号肽编码区时，可能需要外来信号肽编码区。

可选地，外来信号肽编码区可以简单地替换天然信号肽编码区以增强多肽的分泌。然而，指导表达的多肽进入选择的宿主细胞分泌途径的任何信号肽编码区可以被用于本发明。

对于细菌宿主细胞，有效的信号肽编码区是获自以下基因的信号肽编码区：芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。进一步的信号肽由Simonen和Palva，1993，Microbiol Rev 57：109-137描述。

对于丝状真菌宿主细胞，有效的信号肽编码区可以是获自以下基因的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa)脂肪酶。

对于酵母宿主细胞，有用的信号肽可以来自酿酒酵母α因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区由Romanos等，1992，如上描述。

控制序列也可以是前肽编码区，其编码多肽的氨基末端位置的氨基酸序列。产生的多肽称为前酶(proenzyme)或前多肽(或在一些情况中酶原(zymogen))。通过催化或自动催化前肽从前多肽裂解，前多肽可以被转化成成熟的活性多肽。前肽编码区可以获自以下基因：枯草芽孢杆菌碱性蛋白酶(aprE)，枯草芽孢杆菌中性蛋白酶(nprT)，酿酒酵母α因子，米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(WO 95/33836)。

当信号肽和前肽区同时存在于多肽的氨基末端时，前肽区定位在紧邻多肽的氨基末端并且信号肽区域定位在紧邻前肽区的氨基末端。

加入调节序列也可以是期望的，其允许相对于宿主细胞生长调节多肽表达。调节系统的实例是引起响应化学或物理刺激物，包括调节化合物的存在，而开启或关闭基因的表达的那些调节系统。在原核宿主细胞中，适合的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中，适合的调节系统包括，作为实例，ADH2系统或GAL1系统。在丝状真菌中，适合的调节序列包括TAKA α-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子。

调节序列的其它实例是允许基因扩增的那些。在真核系统中，这些包括二氢叶酸还原酶基因，其在氨甲喋呤的存在下被扩增，和金属硫蛋白基因，其用重金属扩增。在这些情况中，编码本发明的多肽的核酸序列将与调节序列可操作地连接。

因此，在另一方面，本公开内容也涉及重组表达载体，取决于它们被引入的宿主的类型，重组表达载体包括编码工程转氨酶多肽或其变体的多核苷酸，和一种或多种表达调节区域如启动子和终止子，复制起点等。上面描述的各种核酸和控制序列可以连接在一起产生重组表达载体，其可以包括一个或多个方便的限制位点以允许编码多肽的核酸序列在这些位点的插入或取代。可选地，本公开内容的核酸序列可以通过将核酸序列或包括所述序列的核酸构建体插入适合的表达载体来表达。在产生表达载体中，编码序列位于载体中以使编码序列与用于表达的适合的控制序列可操作地连接。

重组表达载体可以是任何载体(例如质粒或病毒)，其可以方便地接受重组DNA过程并且可以带来多核苷酸序列的表达。载体的选择将通常取决于载体与载体将被引入的宿主细胞的相容性。载体可以是线性的或闭合的环状质粒。

表达载体可以是自主复制载体，即，作为染色体外的实体存在的载体，其复制独立于染色体复制，自主复制载体例如质粒、染色体外元件、微型染色体或人工染色体。载体可以包含用于保证自身复制的任何部件(means)。可选地，载体可以是当被引入宿主细胞时，被整合进入基因组并与其所整合进入的染色体一起复制的载体。此外，可以使用单一载体或质粒或一起包含待引入宿主细胞的基因组的总DNA的两种或多种载体或质粒，或转座子。

本发明的表达载体优选地包含一个或多个可选择的标记，其使得容易选择转化的细胞。可选择的标记是基因，其产物提供杀生物剂或病毒抗性，对重金属的抗性，营养缺陷型的原养型以及类似性质。细菌的可选择的标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，其赋予抗生素抗性如氨苄西林、卡那霉素、氯霉素(实施例1)或四环素抗性的标记。对于酵母宿主细胞适合的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。

用于丝状真菌宿主细胞的可选择的标记包括但不限于：amdS(乙酰胺酶)，argB(鸟氨酸氨甲酰基转移酶)，bar(草胺膦乙酰基转移酶)，hph(潮霉素磷酸转移酶)，niaD(硝酸还原酶)，pyrG(乳清酸核苷-5′-磷酸脱羧酶)，sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)以及其等同物。用于曲霉细胞的实施方式包括构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。

本发明的表达载体可以包含以下的元件，其允许载体整合进入宿主细胞的基因组或允许载体在细胞中独立于基因组而自主复制。对于整合进入宿主细胞基因组，载体可以依赖于编码多肽的核酸序列或用于通过同源的或非同源的重组将载体整合进入基因组的载体的任何其它元件。

可选地，表达载体可以包含用于指导通过同源重组整合进入宿主细胞的基因组的另外的核酸序列。另外的核酸序列能够使载体在染色体中精确的位置被整合进入宿主细胞基因组。为了增加在精确的位置的整合的可能性，整合元件应当优选地包含足够的数目的核酸，如100至10,000个碱基对，优选地400至10,000个碱基对，和最优选地800至10,000个碱基对，其与相应的靶序列高度同源以提高同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码或编码核酸序列。在另一方面，载体可以通过非同源的重组被整合进入宿主细胞的基因组。

对于自主复制，载体可以进一步包括能够使载体在相关的宿主细胞中自主复制的复制起点。细菌的复制起点的实例是P15Aori(如图5的质粒中所示)或允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)或pACYC184的复制起点和允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。用于酵母宿主细胞的复制起点的实例是2微米的复制起点，ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。复制起点可以是具有使得其在宿主细胞中运行是温度敏感的突变的复制起点(参见，例如Ehrlich，1978，Proc NatlAcad Sci.USA 75：1433)。

本发明的核酸序列的多于一个拷贝可以被插入宿主细胞以提高基因产物的产量。可以通过以下获得核酸序列的拷贝数的增加：通过整合序列的至少一个另外的拷贝进入宿主细胞基因组或通过包括可扩增的选择性标记基因与核酸序列，其中细胞包含扩增的选择性标记基因的拷贝，并因此可以通过在适合的选择剂的存在下培养细胞来选择核酸序列的另外的拷贝。

用于本发明的表达载体中的许多是商业上可获得的。适合的商业表达载体包括来自Sigma-Aldrich Chemicals，St.Louis MO.的p3xFLAGTM^TM表达载体，其包括用于哺乳动物宿主细胞中的表达的CMV启动子和hGH多腺苷酸化位点和用于大肠杆菌中扩增的pBR322复制起点和氨苄西林抗性标记。其它适合的表达载体是pBluescriptII SK(-)和pBK-CMV，其可商业途径获自Stratagene，LaJolla CA，和从pBR322(Gibco BRL)，pUC(GibcoBRL)，pREP4，pCEP4(Invitrogen)或pPoly(Lathe等，1987，Gene 57：193-201) 衍生的质粒。

用于表达转氨酶多肽的宿主细胞

在另一方面，本公开内容提供以下的宿主细胞，其包括编码本公开内容的改进的转氨酶多肽的多核苷酸，所述多核苷酸可操作地连接到用于宿主细胞中转氨酶的表达的一个或多个控制序列。用于表达由本发明的表达载体编码的多肽的宿主细胞是本领域熟知的并且包括但不限于：细菌细胞如大肠杆菌、河流弧菌、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞；真菌细胞如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(ATCC登录号201178))；昆虫细胞如果蝇S2和灰翅夜蛾Sf9(Spodoptera Sf9)细胞；动物细胞如CHO，COS，BHK，293和Bowes黑色素瘤细胞；以及植物细胞。对于上面描述的宿主细胞，适合的培养介质和生长条件是本领域熟知的。

用于转氨酶的表达的多核苷酸可以通过本领域已知的各种方法被引入细胞。方法包括但不限于，电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞的各种方法对于本领域技术人员将是明显的。

示例性宿主细胞是大肠杆菌(Escherichia coli)W3110。表达载体通过以下产生：将编码改进的转氨酶的多核苷酸可操作地连接进入质粒pCK110900，进而可操作地连接到在lacI阻抑物的控制下的lac启动子。表达载体也包含P15a复制起点和氯霉素抗性基因。

产生工程转氨酶多肽的方法

在一些实施方式中，为了制备本发明内容的多核苷酸和多肽，催化转氨基反应的天然存在的转氨酶获自(或得自)河流弧菌。在一些实施方式中，母体多核苷酸序列是密码子优化的以增强特定的宿主细胞中转氨酶的表达。作为说明，编码河流弧菌的野生型多肽的母体多核苷酸序列由以下构建：基于已知的河流弧菌序列的多肽序列制备的寡核苷酸(Shin等，2003，“Purification，characterization，and molecular cloning of a novel amine：pyruvate transaminase from Vibrio fluvialis JS 17(来自河流弧菌JS 17 的新的胺：丙酮酸转氨酶的纯化、表征和分子克隆)”Appl Microbiol Biotechnol.61(5-6)：463-471)。母体多核苷酸序列，如SEQ ID NO：1所指定，是为了大肠杆菌中的表达而密码子优化的，并将密码子优化的多核苷酸克隆进入表达载体，将转氨酶基因的表达置于lac启动子和lacI阻抑物基因的控制下。在大肠杆菌中表达活性转氨酶的克隆被鉴定并且基因被测序以确认它们的身份。SEQ ID NO：17指定的序列是母体序列，用作自河流弧菌转氨酶演化的工程转氨酶的大多数实验和文库构建的起点。

工程转氨酶可以通过使编码天然存在的转氨酶的多核苷酸接受诱变和/或定向演化方法获得，如上面所讨论。示例性的定向演化方法是诱变和/或DNA改组，如Stemmer，1994，Proc Natl Acad Sci USA 91：10747-10751；WO 95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767和美国专利6,537,746中所描述。可以使用的其它定向演化过程包括但不限于，交错延伸程序(StEP)，体外重组(Zhao等，1998，Nat.Biotechnol.16：258-261)，诱变PCR(Caldwell等，1994，PCR Methods Appl.3：S136-S140)，和盒式诱变(Black等，1996，Proc Natl Acad Sci USA93：3525-3529)。用于本文的目的的诱变和定向演化技术也被描述在以下文献中：Ling，等，1997，Anal.Biochem.254(2)：157-78；Dale等，1996，“Oligonucleotide-directed random mutagenesis using the phosphorothioate method(使用磷硫酰方法的寡聚核苷酸指导的随机诱变)”，于Methods Mol.Biol.57：369-74；Smith，1985，Ann.Rev.Genet.19：423-462；Botstein等，1985，Science 229：1193-1201；Carter，1986，Biochem.J.237：1-7；Kramer等，1984，Cell，38：879-887；Wells等，1985，Gene 34：315-323；Minshull等，1999，Curr Opin Chem Biol 3：284-290；Christians等，1999，Nature Biotech17：259-264；Crameri等，1998，Nature 391：288-291；Crameri等，1997，Nature Biotech 15：436-438；Zhang等，1997，Proc Natl Acad Sci USA94：45-4-4509；Crameri等，1996，Nature Biotech 14：315-319；Stemmer，1994，Nature 370：389-391；Stemmer，1994，Proc Natl Acad Sci USA91：10747-10751；WO 95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767和美国专利6,537,746。所有出版物通过引用并入本文。

可以筛选诱变处理后获得的克隆以获得具有期望的改进的酶性质的工程转氨酶。使用标准的生物化学技术，如在产物胺的OPA衍生化之后的HPLC分析，可以进行来自表达文库的酶活性的测定。

当期望改进的酶性质是热稳定性时，可以在使酶制品接受定义的温度并测定热处理之后剩余的酶活性的量之后测定酶活性。然后包含编码转氨酶的多核苷酸的克隆被分离，测序以鉴定核苷酸序列变化(如果有)，并且用于在宿主细胞中表达酶。

当工程化的多肽的序列是已知的，根据已知的合成方法，编码酶的多核苷酸可以通过标准的固相方法被制备。在一些实施方式中，最多约100个碱基的片段可以被个体地合成，然后连接(例如通过酶或化学连接方法(litigation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如，使用，例如Beaucage等，1981，Tet Lett 22：1859-69描述的经典的亚磷酰胺法或由Matthes等，1984，EMBO J.3：801-05描述的方法，例如，如通常在自动合成方法中所实践的，本发明的多核苷酸和寡核苷酸可以通过化学合成被制备。根据亚磷酰胺方法，寡核苷酸被例如在自动的DNA合成器中合成，纯化，退火，连接和克隆入适合的载体。另外，基本上任何核酸可以获自多种商业来源的任一种。

在宿主细胞中表达的工程转氨酶可以使用任何一种或多种熟知的蛋白纯化方法从细胞和或培养介质回收，方法包括但不限于，溶菌酶处理，声处理，过滤，盐析，超速离心和色谱法。用于裂解和从细菌，如大肠杆菌，高效提取蛋白的适合的溶液是商业上在来自St.Louis MO的Sigma-Aldrich的商标名CelLytic B^TM下可获得的。

用于分离转氨酶多肽的色谱方法包括但不限于，反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法。用于纯化具体的酶的条件将部分地取决于如净电荷、疏水性、亲水性、分子量、分子形状等因素，并且对于本领域技术人员将是显然的。

在一些实施方式中，亲和技术可以被用于分离改进的转氨酶。对于亲和色谱纯化，可以使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生，各种宿主动物，包括但不限于：兔、小鼠、大鼠等，可以通过注射转氨酶多肽或其片段而被免疫。借助侧链官能团或连接到侧链官能团的连接子，转氨酶多肽或片段可以被连接到适合的载体，如BSA。各种佐剂可以被用于提高免疫性应答，取决于宿主物种，包括但不限于：Freund’s(完全的和不完全的)，矿物凝胶如氢氧化铝，表面活性物质如溶血卵磷脂、复合多元醇、聚阴离子、肽、油性乳液、钥孔戚血蓝素(keyhole limpet hemocyanin)、二硝基酚和可能有用的人佐剂如BCG(卡介苗)和短小棒状杆菌(Corynebacterium parvum)。

使用工程转氨酶的方法和用其制备的化合物

在一些实施方式中，本文描述的转氨酶可以被用于进行方案1至3中显示的方法，如上述，其中来自通式II的氨基供体的氨基被转移到通式I的氨基受体(酮底物)以产生手性胺。反应可以立体异构过量产生R手性胺或S手性胺。通常，用于进行转氨基反应的方法可以包括在适合将胺受体转化成立体异构过量的(S)或(R)手性胺的反应条件下，使式II的氨基供体和式I的氨基受体与本公开内容的工程转氨酶多肽接触或孵育。

对于R¹、R²、R³和R⁴适合的基团在上面被描述。

在方法的一些实施方式中，氨基受体可以选自：丙酮酸、二氢萘-1(2H)-酮、1-苯基丁-2-酮、3，3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮和2-甲基-环己酮和7-甲氧基-2-四氢萘酮、1-(6-甲氧基萘-2-基)乙酮、1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮、1-(4-苯氧基苯基)乙酮、(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯和(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮。

因此，在一些实施方式中，方法包括使二氢萘-1(2H)-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将二氢萘-1(2H)-酮转化成对映体过量的(S)-1，2，3，4-四氢萘-1-胺的反应条件下接触。在方法的一些实施方式中，产物(S)-1，2，3，4-四氢萘-1-胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使1-苯基丁-2-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将1-苯基丁-2-酮转化成对映体过量的(S)-1-苯基丁-2-胺的反应条件下接触。在方法的一些实施方式中，产物(S)-1-苯基丁-2-胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使3，3-二甲基丁-2-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将3，3-二甲基丁-2-酮转化成对映体过量的(S)-3，3-二甲基丁-2-胺的反应条件下接触。在方法的一些实施方式中，产物(S)-3，3-二甲基丁-2-胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使辛-2-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将辛-2-酮转化成对映体过量的(S)-辛-2-胺的反应条件下接触。在方法的一些实施方式中，产物(S)-辛-2-胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使1-(4-溴苯基)乙酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将1-(4-溴苯基)乙酮转化成对映体过量的(S)-1-(4-溴苯基)乙胺的反应条件下接触。在方法的一些实施方式中，产物(S)-1-(4-溴苯基)乙胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使4-苯基丁-2-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将4-苯基丁-2-酮转化成对映体过量的(R)-4-苯基丁-2-胺的反应条件下接触。在方法的一些实施方式中，产物(R)-4-苯基丁-2-胺可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使3-氧代丁酸乙酯与本公开内容的转氨酶多肽在氨基供体的存在下在适合将3-氧代丁酸乙酯转化成对映体过量的(R)-3-氨基丁酸乙酯的反应条件下接触。在方法的一些实施方式中，产物(R)-3-氨基丁酸乙酯可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使3-氧代丁酸乙酯与本公开内容的转氨酶多肽在氨基供体的存在下在适合将3-氧代丁酸乙酯转化成对映体过量的(S)-3-氨基丁酸乙酯的反应条件下接触。在方法的一些实施方式中，产物(S)-3-氨基丁酸乙酯可以至少10％、20％、30％、40％、50％、60％、70％、80％、90％或95％或更多的立体异构过量被形成。

在一些实施方式中，方法包括使1-(6-甲氧基萘-2-基)乙酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将1-(6-甲氧基萘-2-基)乙酮转化成对映体过量的(S)-1-(6-甲氧基萘-2-基)乙胺的反应条件下接触。

在一些实施方式中，方法包括使1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙酮转化成对映体过量的(S)-1-(2，3-二氢苯并[b][1，4]二噁英-6-基)乙胺的反应条件下接触。

在一些实施方式中，方法包括使1-(4-苯氧基苯基)乙酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将1-(4-苯氧基苯基)乙酮转化成对映体过量的(S)-1-(4-苯氧基苯基)乙胺的反应条件下接触。

在一些实施方式中，方法包括使(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮与本公开内容的转氨酶多肽在氨基供体的存在下在适合将(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成对映体过量的(3S，4S)-3-(苄氧基)四氢-2H-吡喃-4-胺的反应条件下接触。

在方法的一些实施方式中，氨基供体包括式II的化合物，如本文所述。在方法的一些实施方式中，氨基供体选自：异丙胺(2-氨基丙烷)、α-苯乙胺、D-丙氨酸、L-丙氨酸或D，L-丙氨酸，特别地异丙胺。

在方法中，本文描述的工程化转氨酶的任何一种可以被用于将胺受体在氨基供体的存在下转化成产物手性胺。在一些实施方式中，方法中使用的工程转氨酶包括以下的氨基酸序列，其与SEQ ID NO：10、16或18的序列至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同。这些工程转氨酶可以具有一种或多种改进的性质，包括热稳定性、溶剂稳定性、异丙胺抗性、增强的酶活性、立体选择性，和/或底物识别/结合等。

在方法的一些实施方式中，工程转氨酶可以在以下残基位置具有与SEQ ID NO：2的天然存在的转氨酶或参照工程转氨酶如SEQ ID NO：18相比的一个或多个残基差异：X4、X9、X12、X21、X30、X31、X44、X45、X、56、X57、X81、X82、X85、X86、X95、X112、X113、X127、X147、X153、X157、X166、X177、X181、X208、X211、X228、X233、X253、X272、X294、X297、X302、X311、X314、X316、X317、X318、X319、X320、X321、X324、X385、X391、X398、X407、X408、X409、X415、X417、X418、X420、X431、X434、X438、X444和X446。

选择用于特定的胺受体底物的工程转氨酶的指导被提供在本文的说明书中，如表3和表4中，其显示各种工程转氨酶对于结构不同的氨基受体底物的活性。在方法的一些实施方式中，工程转氨酶可以包括对应于SEQ ID NO：4、6、8、10、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196或198的氨基酸序列。

在手性胺的对映体富集的方法的一些实施方式中，可以加入另外的量的氨基受体(最多饱和)和/或形成的氨基受体(酮)可以被不断地从反应混合物除去。相反，当胺的不期望的手性形式被转化成氨基受体(酮)副产物并且期望的手性形式未被转化时，后者可以通过常规方法被容易地分离。部分分离可以通过以下实现：酸化，用烃如庚烷萃取以除去酮，使得水相是碱性的，并用烃如庚烷再萃取。另一方面，当胺的两种手性形式都是期望的时，转化成酮的形式可以从反应混合物(或两相混合物中的水相)中移出并独立地在氨基供体的存在下接受ω-转氨酶的作用以产生最初被转化成酮的相同的手性形式。

如本文所注明，本公开内容的转氨酶可以被用于介导方案1中的可逆反应，即，式III的手性胺向式I的酮转化以及式IV的酮向式II的胺转化。(R)或(S)手性胺的立体专一性转化可以被用于(R)和(S)胺混合物的手性拆分。因此，在一些实施方式中，手性拆分的方法可以包括使式IIIa的(R)和(S)手性胺的混合物(例如消旋混合物)与本公开内容的立体专一性转氨酶在式IV的酮的存在下，

在适合形成式I的酮和式II的胺的反应条件下接触，由此产生具有立体异构过量的式IIIb的手性胺的混合物。

如本领域技术人员已知，转氨基反应通常需要辅因子。由本文描述的工程转氨酶催化的反应也通常需要辅因子，尽管工程转氨酶的许多实施方式需要比用野生型转氨酶催化的反应少得多的辅因子。如本文所用，术语“辅因子”指与转氨酶联合作用的非蛋白化合物。适合与本文描述的工程转氨酶一起使用的辅因子包括但不限于：吡哆醛-5’-磷酸(也称为吡哆醛-磷酸、PLP、P5P)。在一些实施方式中，PLP辅因子在细胞提取物中被提供并且不需要被添加。在使用高度纯化的转氨酶的一些实施方式中，辅因子在反应开始时被加到反应混合物或另外的辅因子在反应过程中可以被加入。在一些实施方式中，维生素B6家族的不同成员如吡哆醇代替PLP被使用。

在一些实施方式中，转氨酶反应可以在还原型辅因子，烟酰胺腺嘌呤二核苷酸(NADH)，的存在下被进行，其可以限制转氨酶的失活(参见van Ophem等，1998，Biochemistry 37(9)：2879-88)。在一些实施方式中，辅因子再生系统，如葡萄糖脱氢酶(GDH)和葡萄糖或甲酸脱氢酶和甲酸可以被用于再生反应介质中的NADH。

本文描述的转氨基反应一般在溶剂中进行。适合的溶剂包括水、有机溶剂(例如乙醇、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯和类似溶剂)、离子液体(例如1-乙基4-甲基咪唑鎓四氟硼酸、1-丁基-3-甲基咪唑鎓四氟硼酸、1-丁基-3-甲基咪唑鎓六氟磷酸和类似离子液体)。在一些实施方式中，使用含水(aqueous)溶剂，其包括水和含水的共溶剂系统。

示例性含水的共溶剂系统包括水和一种或多种有机溶剂。大体上，含水的共溶剂系统的有机溶剂组分选择为其不使转氨酶完全失活。适合的共溶剂系统可以通过使用酶活性测定，如本文描述的那些，测定特定的工程转氨酶与定义的关注的底物在候选的溶剂系统中的活性，被容易地鉴定。

含水的共溶剂系统的有机溶剂组分可以是与含水的组分混溶的，提供单一的液相，或可以是与含水的组分部分地混溶的或不混溶的，提供两个液相。通常地，当含水的共溶剂系统被使用时，其被选择为双相的，水分散在有机溶剂中或相反。一般，当含水的共溶剂系统被使用时，期望选择可容易从水相分离的有机溶剂。大体上，共溶剂系统中水与有机溶剂的比例通常在约1％比约99％(v/v)的有机溶剂比水的范围。共溶剂系统可以是在加到反应混合物之前被预形成的，或其可以在反应容器中在原位被形成。

含水的溶剂(水或含水的共溶剂系统)可以是pH-缓冲的或非缓冲的。通常，转氨酶反应可以在约10或以下的pH，通常在约5至约10的pH范围内进行。在一些实施方式中，转氨酶反应在约9或以下的pH，通常在约5至约9的pH范围内进行。在一些实施方式中，转氨酶反应在约8或以下的pH，通常在约5至约8的pH范围内和通常在约6至约8的pH范围内进行。转氨酶反应也可以在约7.8或以下，或7.5或以下的pH下进行。可选地，转氨酶反应可以在中性pH，即，约7下进行。

在转氨基反应的过程中，反应混合物的pH可以变化。通过在反应过程中加入酸或碱，反应混合物的pH可以被维持在期望的pH或在期望的pH范围内。可选地，pH可以通过使用包括缓冲液的含水的溶剂被控制。用于维持期望的pH范围的适合的缓冲液是本领域已知的且包括，例如，磷酸盐缓冲液、三乙醇胺缓冲液和类似缓冲液。也可以使用缓冲作用和酸或碱的加入的组合。

在进行本文描述的转氨基反应中，工程转氨酶可以纯化的酶，用编码酶的基因转化的整个细胞和/或这些细胞的细胞提取物和/或裂解物的形式被加到反应混合物中。编码工程转氨酶的基因可以被单独地转化进入宿主细胞或一起转化进入同一宿主细胞。例如，在一些实施方式中宿主细胞的一个集合可以用编码一种工程转氨酶的基因转化并且另一集合可以用编码另一工程转氨酶的基因转化。转化的细胞的两个集合可以在反应混合物中以整个细胞的形式或以从其得到的裂解物或提取物的形式一起被使用。在另一实施方式中，宿主细胞可以用编码多个工程转氨酶的基因转化。在一些实施方式中，工程化的多肽可以分泌的多肽的形式被表达并且包含分泌的多肽的培养介质可以被用于转氨酶反应。

用编码工程转氨酶的基因转化的整个细胞或其细胞提取物、裂解物和分离的酶可以多种不同的形式被使用，包括固体(例如冻干的、喷雾干燥的和类似形式)或半固体(例如粗的糊)。

细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理或类似方法，随后脱盐过程，之后冻干(例如超滤、透析和类似方法)来部分地纯化。任何细胞制品可以通过使用已知的交联剂，例如，戊二醛或固定化至固相(例如Eupergit C，和类似固相)被稳定。

可以多种不同的形式，包括粉末(例如冻干的、喷雾干燥的和类似粉末)，溶液，乳液，悬浮液和类似形式向反应提供固体反应物(例如酶、盐等)。使用本领域普通技术人员已知的方法和装置可以容易地冻干或喷雾干燥反应物。例如，蛋白溶液可以在-80℃以小份冷冻，然后加到预冷的冻干室中，随后应用真空。

用于转氨基反应的反应物的量将一般取决于期望的产物的量，和伴随地使用的转氨酶底物的量而不同。本领域普通技术人员将容易地理解如何改变这些量以使它们适合期望的水平的生产力和生产规模。大体上，转氨酶底物保持在以下的水平：其基本上达到完全的或几乎完全的底物转化成产物。

加入反应物的顺序不是关键的。可以在相同的时间将反应物一起加到溶剂中(例如单相溶剂、双相含水共溶剂系统，和类似溶剂系统)，或可选地，反应物中的一些可以被单独地添加，并且一些反应物在不同的时间点一起添加。例如，辅因子、转氨酶和转氨酶底物可以被先加到溶剂中。

当含水的共溶剂系统被使用时，为了改进混合效率，转氨酶和辅因子可以被首先加入并混合进入水相。然后加入有机相并混合，随后加入转氨酶底物。可选地，在加入水相之前，转氨酶底物可以在有机相中预混合。

进行本文描述的转氨酶催化的转氨基反应的适合的条件包括多种条件，其可易于通过常规实验被优化，常规实验包括但不限于：使工程转氨酶与底物在实验pH和温度下接触并，例如，使用本文提供的实施例中描述的方法检测产物。

转氨酶催化的反应通常在约15℃至约60℃的范围内的温度下进行。对于一些实施方式，反应在约20℃至约55℃的范围内的温度下进行。对于一些实施方式，反应在约35℃至约50℃的范围内的温度下进行。在又一些实施方式中，其在约40℃至约50℃的范围内的温度下进行。反应也可以在环境条件下进行。

通常允许转氨基反应进行直到获得基本上完全或几乎完全的底物转化。底物转化成产物可以使用已知的方法通过检测底物和/或产物来监测。适合的方法包括气相色谱法、HPLC和类似方法。反应混合物中产生的手性胺产物的转化收率通常大于约50％，也可以大于约60％，也可以大于约70％，也可以大于约80％，也可以大于90％并且通常大于约97％。

实施例

本公开内容的各种特征和实施方式在以下代表性实施例中被说明，其意欲说明而非限制。

实施例1：使用异丙胺作为胺供体对热稳定的转氨酶变体的筛选

以下方法被用于筛选转氨酶库以获得热稳定的主链，大多数多肽变体是从该热稳定的主链演化得到的。生物转化在96-孔板中进行并包括以下：100mM三乙醇胺盐酸盐缓冲液(pH 7.5)中的1.0M异丙胺(pH 7.5)和1.0M丙酮酸。然后使用o-酞二醛/N-乙酰基半胱氨酸试剂(OPA)将胺产物(丙氨酸)转化成其相应的异吲哚产物，由HPLC分离，并使用外标定量。

试剂，每孔：

组分	体积/孔	最终浓度
			丙酮酸，pH 7.5(2.5M)	80μL	1.0M
IPM(5.0M，pH 7.5)	40μL	1.0M
			1.0M TEA，pH 7.5	20μL	100mM
水	20μL
			裂解物	40μL

200μL/孔终体积

生物转化。将包含转氨酶变体的裂解物加到96-孔圆底板(40μL/孔)。将板热密封并在50℃孵育24h。在50℃24h之后，通过加入160mL/孔的50℃预热的1.25M丙酮酸、1.25M异丙胺和125mM三乙醇胺溶液(pH7.5)开始反应。将反应简单地搅动，热封，并返回到50℃孵育器。2h之后，将10mL/孔生物转化转移至包含190mL/孔0.5mM羟胺水溶液的96-孔板。将这一羟胺-猝灭的板热封并在4℃冰箱中储存用于后面的分析。将反应板热封并返回到50℃孵育器中。24h总反应时间之后，将另一10mL/孔等份的生物转化加到包含190mL/孔0.5mM羟胺的新的96-孔板。然后将猝灭的生物转化(2h和24h时间点)OPA衍生并通过HPLC分析。如下进行丙氨酸的定量：

1.将20μL/孔猝灭的生物转化转移到空的96-孔板。

2.制备包含已知量的异丙胺和丙氨酸的混合物(50mM总胺浓度)的六个标准品并且将20μL的每个标准品加到第二个96-孔板中。

3.将猝灭的生物转化板和标准品板转移到安装有自动进样器的HPLC。

4.在HPLC分析之前通过向每个20μL等份自动化加入80μL OPA衍生试剂，每个样品至相应的异吲哚产物的在线OPA衍生被立即进行。

5.将异吲哚产物通过HPLC分离并通过320nm的吸光度检测。

6.标准品的峰面积被用于产生校正曲线。

7.从校正曲线计算丙氨酸产物浓度并考虑稀释步骤。

实施例2：高度表达的河流弧菌转氨酶变体的产生

基于报道的氨基酸序列(Kim和/或Shin)，编码来自河流弧菌的野生型ω转氨酶的基因SEQ ID NO：1被合成并克隆进入内部pCK110900载体系统(美国专利申请公开20060195947)并随后在大肠杆菌W3110fhuA中表达。产生两个随机诱变库，个体菌落在96-孔板中生长。然后将来自细胞的粗的裂解物用于筛选增强的活性。筛选条件如下：100mM三乙醇胺缓冲液中1.0M异丙胺和110mM丙酮酸(pH 9)在50℃持续4-4.5h。通过加入0.5mM盐酸羟胺水溶液将反应猝灭并且然后通过HPLC分析。产生显著更高收率的产物(L-丙氨酸)的变体被测序并通过SDS-PAGE分析，显示N-末端的编码和非编码的突变(最多至并包括第12个残基)能够很大地增强表达水平。

表5

+++：相比wt 1-5x增强

++++：相比wt 5-10x增强

+++++：相比wt 10-20x增强

实施例3：使用异丙胺作为胺-供体的3-氧代丁酸乙酯的胺化以下实施例描述进行下面的反应的条件：

高通量方法被用于使用异丙胺作为胺-供体筛选转氨酶库的多肽变体。生物转化在96-孔板中进行并包括以下：包含5％乙醇的100mM三乙醇胺盐酸盐缓冲液(pH 7.0)中的50mM异丙胺(pH 7.0)和50mM 3-氧代丁酸乙酯。然后使用o-酞二醛/N-乙酰基半胱氨酸试剂(OPA)将胺产物转化成其相应的异吲哚产物，由HPLC分离，并使用外标定量。

通过向30μL“反应混合物”加入包含100μM PLP的70μL裂解物开始生物转化。反应混合物由包含16.7％乙醇的333mM三乙醇胺缓冲液(pH7.0)中的167mM异丙胺(pH 7.0)和167mM 3-氧代丁酸乙酯组成。将生物转化在室温搅动17h并且然后通过加入0.1体积的1.5mM盐酸羟胺水溶液猝灭。

如下进行3-氨基丁酸乙酯的定量：

1.将20μL/孔猝灭的生物转化转移到空的96-孔板。

2.制备包含已知量的异丙胺和3-氨基丁酸乙酯的混合物(50mM总胺浓度)的六个标准品并且将20μL的每个标准品加到第二个96-孔板中。

5.将异吲哚产物通过HPLC分离并通过320nm的吸光度检测。

6.标准品的峰面积被用于产生校正曲线。

7.从校正曲线计算3-氨基丁酸乙酯产物浓度并考虑稀释步骤。

这一实施例中的过程也被用于用3，4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、2-甲基环己酮和1-(4-溴苯基)乙酮作为氨基受体筛选转氨酶库。

实施例4：使用异丙胺作为胺-供体的辛-2-酮的胺化

以下实施例描述进行下面的反应的条件：

以下高通量方法被用于使用异丙胺作为胺-供体筛选转氨酶库的变体。生物转化在96-孔板中进行并包括以下：包含5％乙醇的100mM三乙醇胺盐酸盐缓冲液(pH 7.0)中的200mM异丙胺(pH 7.0)和100mM辛-2-酮。然后使用o-酞二醛/N-乙酰基半胱氨酸试剂(OPA)将胺产物转化成其相应的异吲哚产物，由HPLC分离，并使用外标定量。

通过向20μL“反应混合物”加入包含100μM PLP的80μL裂解物开始生物转化。反应混合物由包含25％乙醇的500mM三乙醇胺缓冲液(pH7.0)中的1.0M异丙胺(pH 7.0)和500mM辛-2-酮组成。将生物转化在室温搅动17h并且然后通过加入3体积的0.5mM盐酸羟胺水溶液猝灭。

如下进行辛-2-胺的定量：

1.将20μL/孔猝灭的生物转化转移到空的96-孔板。

2.制备包含已知量的异丙胺和辛-2-胺的混合物(50mM总胺浓度)的六个标准品并且将20μL的每个标准品加到第二个96-孔板中。

4.在HPLC分析之前通过向每个20μL等份自动化加入80μL OPA衍生试剂，每个样品至相应的异吲哚产物的在线OPA衍生成被立即进行。

5.将异吲哚产物通过HPLC分离并通过320nm的吸光度检测。

6.标准品的峰面积被用于产生校正曲线。

7.从校正曲线计算辛-2-胺产物浓度并考虑稀释步骤。

实施例5：使用异丙胺作为胺-供体的3，3-二甲基丁-2-酮的胺化

以下实施例描述进行下面的反应的条件：

以下高通量方法被用于使用异丙胺作为胺-供体筛选转氨酶库的多肽变体。生物转化在96-孔板中进行并包括以下：包含5％乙醇的100mM三乙醇胺盐酸盐缓冲液(pH 7.0)中的200mM异丙胺(pH 7.0)和100mM 3，3-二甲基丁-2-酮。然后使用o-酞二醛/N-乙酰基半胱氨酸试剂(OPA)将胺产物转化成其相应的异吲哚产物，由HPLC分离，并使用外标定量。

通过向60μL“反应混合物”加入包含100μM PLP的40μL裂解物开始生物转化。反应混合物由包含8.3％乙醇的167mM三乙醇胺缓冲液(pH7.0)中的333mM异丙胺(pH 7.0)和167mM 3，3-二甲基丁-2-酮组成。将生物转化在室温搅动17h并且然后通过加入3体积的0.5mM盐酸羟胺水溶液猝灭。

如下进行3，3-二甲基丁-2-胺的定量：

1.将20μL/孔猝灭的生物转化转移到空的96-孔板。

2.制备包含已知量的异丙胺和3，3-二甲基丁-2-胺的混合物(50mM总胺浓度)的六个标准品并且将20μL的每个标准品加到第二个96-孔板中。

5.将异吲哚产物通过HPLC分离并通过320nm的吸光度检测。

6.标准品的峰面积被用于产生校正曲线。

7.从校正曲线计算3，3-二甲基丁-2-胺产物浓度并考虑稀释步骤。

这一实施例中的过程也被用于用4-苯基丁-2-酮作为氨基受体筛选转氨酶库。

实施例6：1-(6-甲氧基萘-2-基)乙酮至相应的S-胺的胺化

反应条件和分析：根据以下反应条件，对于酮底物1-(6-甲氧基萘-2-基)乙酮至其相应的胺产物(S)-1-(6-甲氧基萘-2-基)乙胺的转化，测定转氨酶变体：1mg/mL(或6.25mg/mL)酮底物、0.5mg/mL PLP、0.5mg/mL NAD、0.1mg/mL乳酸脱氢酶(LDH)、1mg/mL甲酸脱氢酶(FDH)、90mg/mL L-丙氨酸、40mg/mL甲酸、5vol％DMSO、缓冲液pH 7.5。允许反应混合物反应24h伴随在30℃摇动。可选地，GDH和葡萄糖可以代替FDH和甲酸用于再循环NAD辅因子。典型的浓度如下：1mg/mL GDH、90mg/mL葡萄糖。

另外，在除了使用异丙胺(iPr-NH₂)而不是L-丙氨酸作为胺供体用于反应的相同的条件下筛选变体的子集。根据以下反应条件：100mM三乙醇胺缓冲液pH 7.5或8.5中1mg/mL(或5mg/mL)酮底物、0.5mg/mL PLP、1M iPr-NH₂、5-40vol％DMSO。允许反应混合物在30℃反应24h。

在反应之后，将混合物萃取进入有机溶剂相(例如乙酸乙酯、乙酸丙酯或甲基叔丁基醚)并通过HPLC分析。转化百分比基于峰面积被计算为胺产物峰面积与(酮底物峰面积+胺产物峰面积)的比。

如表6中列出的结果所示，使用丙氨酸作为胺供体的反应比使用异丙胺作为供体的反应产生明显更高的转化。丙氨酸作为供体和1.0mg/mL底物载量的反应能够将最多21.3％的底物-(6-甲氧基萘-2-基)乙酮转化成其相应的胺产物。

至少以下残基差异与将至少2.0％底物转化成其相应的胺产物的能力有关：W57A/C/F/I/L/S、Y86A/F/G/H/S、V153A/C/Q/S、P233L/T、F317L、P318F/G/R、G320A、F321L、L417A/S/T/V和F438L。

表6

+≥0.2％

++≥0.5％

+++≥1.0％

++++≥5.0％

+++++≥10.0％

实施例7：能够将酮底物1-(2，3-二氢苯并[b][1.4]二噁英-6-基)乙酮转化成其相应的S-胺产物的转氨酶变体

反应条件和分析：根据以下反应条件，对于酮底物1-(2，3-二氢苯并[b][1.4]二噁英-6-基)乙酮至其相应的胺产物(S)-1-(2，3-二氢苯并[b][1.4]二噁英-6-基)乙胺的转化，测定转氨酶变体：1mg/mL酮底物、0.5mg/mL PLP、0.5mg/mL NAD、0.1mg/mL LDH、1mg/mL FDH、90mg/mL L-丙氨酸、40mg/mL甲酸、5vol％DMSO、缓冲液pH 7.5。允许反应混合物在30℃反应24h。

如表7中列出的结果所示，变体能够将最多9.3％的酮底物1-(2，3-二氢苯并[b][1.4]二噁英-6-基)乙酮转化成其相应的S-胺产物。SEQ ID NO：18的阳性对照河流弧菌TA显示仅0.7％转化。

至少以下残基差异与将至少2.0％式(2)的底物转化成其相应的胺产物的能力有关：W57A/C/F/I/L/S、Y86F/G/S、V153A/C/Q/S、A228G、P233L/T、V297A、P318F/G、G320A、L417C/T/V和F438L。

表7

+≥0.8％

++≥2.0％

++++++≥5.0％

实施例8：能够将酮底物1-(4-苯氧基苯基)乙酮转化成其相应的S-胺产物的转氨酶变体

反应条件和对酮底物转化的分析：根据以下反应条件，对于酮底物1-(4-苯氧基苯基)乙酮至其相应的胺产物(S)-1-(4-苯氧基苯基)乙胺的转化，测定转氨酶变体：1mg/mL酮底物、0.5mg/mL PLP、0.5mg/mL NAD、0.1mg/mL LDH、1mg/mL FDH、90mg/mL L-丙氨酸、40mg/mL甲酸、5vol％DMSO、缓冲液pH 7.5。允许反应混合物在30℃反应24h。

如表8中列出的结果所示，变体能够将最多2.0％的酮底物1-(4-苯氧基苯基)乙酮转化成其相应的S-胺产物。SEQ ID NO：18的阳性对照河流弧菌TA显示在测定条件下不可检测的转化。

至少以下残基差异与将至少0.5％式(3)的底物转化成其相应的胺产物的能力有关：W57C/F/I/L、Y86H/F/S、V153A/C/Q/S、C181R、P233T、V297A、P318F、L417C/T和F438L。

表8

+≥0.2％

++≥1.0％

实施例9：能够将酮底物(R)-4-氧代四氢-2H-吡喃-3-基苯甲酸酯转化成其相应的S-胺产物的转氨酶变体。

反应条件和分析：根据以下反应条件，对于酮底物(R)-4-氧代四氢-2H-吡喃-3-基苯甲酸酯至其相应的胺产物(3S，4S)-4-氨基四氢-2H-吡喃-3-基苯甲酸酯的转化，测定转氨酶变体：1mg/mL酮底物、0.5mg/mL PLP、0.5mg/mL NAD、0.1mg/mL LDH、1mg/mL FDH、90mg/mL L-丙氨酸、40mg/mL甲酸、5vol％DMSO、缓冲液pH 7.5。允许反应混合物在30℃反应24h。

如表9中列出的结果所示，变体能够将最多57％的酮底物(R)-4-氧代四氢-2H-吡喃-3-基苯甲酸酯转化成其相应的S-胺产物。SEQ ID NO：18的阳性对照河流弧菌TA显示不可检测的转化。

至少以下残基差异与将至少1％底物(R)-4-氧代四氢-2H-吡喃-3-基苯甲酸酯转化成其相应的S-胺产物的能力有关：W57A/C/I/L/S、Y86A/F/G/S、V153C/S、P233T、F317L、P318G、G320A、F321L和L417T。

表9

+≥1％

++≥5％

+++≥50％

实施例10：能够将酮底物(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成其相应的S-胺产物的转氨酶变体

反应条件和分析：根据以下反应条件，对于酮底物(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮至其相应的胺产物(3S，4S)-3-(苄氧基)四氢-2H-吡喃-4(-胺的转化，测定转氨酶变体：1mg/mL酮底物、0.5mg/mL PLP、0.5mg/mL NAD、0.1mg/mL LDH、1mg/mL FDH、90mg/mL L-丙氨酸、40mg/mL甲酸、5vol％DMSO、缓冲液pH 7.5。允许反应混合物在30℃反应24h。

如表10中列出的结果所示，变体能够将最多100％的酮底物(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成其相应的胺产物。SEQ ID NO：18的阳性对照河流弧菌TA显示仅9％转化。

至少以下残基差异与将至少90％底物(R)-3-(苄氧基)二氢-2H-吡喃-4(3H)-酮转化成其相应的S-胺产物的能力有关：W57F/I/S；G81D；F85S；Y86F/G/H/N；M127L；V153C/Q/S；A228G；V297A；F317L；P318F/R；L417A/C/V和F438L。

表10

+≥10％

++≥20％

+++≥50％

++++≥90％

本申请中引用的所有的出版物、专利、专利申请和其它文献通过引用据此全部并入本文用于所有目的，其程度如同每个单个的出版物、专利、专利申请或其它文献被个体地显示通过引用并入用于所有目的。

虽然各种特定的实施方式已经被说明和描述，应认识到可以做出各种变化而不偏离本发明的精神和范围。

Claims

1.一种转氨酶，由具有转氨酶活性并且与SEQ ID NO:2的多肽相比在50℃具有增强的热稳定性的多肽组成，其中所述多肽由与SEQ ID NO:2相比，在与增强的热稳定性相关的残基位置处的残基被定义如下的氨基酸序列组成：X9是T，X45是H，X86是Y、F、S或N，X177是L，X211是K，X294是V，X324是G，且X391是A。

2.根据权利要求1所述的转氨酶，其中在50℃处理所述多肽23h之后，在氨基供体异丙胺的存在下在丙酮酸向L-丙氨酸的转化中，所述多肽具有至少约10％的残余活性。

3.根据权利要求1或2所述的转氨酶，所述转氨酶还具有与SEQ IDNO:2相比增强的用于氨基受体底物向相应的手性氨基产物转化的转氨酶活性，并且其中所述转氨酶的氨基酸序列选自SEQIDNO:22、28、30、32、34、36、38、40、42、44、46、48、50、52、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190或192。

4.根据权利要求3所述的转氨酶，其中所述转氨酶的氨基酸序列选自SEQ ID NO:106或110。

5.根据权利要求1或2所述的转氨酶，其中所述多肽能够以与SEQ IDNO:18相比改进的R-对映体选择性将氨基受体底物转化成相应的氨基产物，并且其中所述转氨酶的氨基酸序列选自SEQ ID NO:32、34、36、40、44、48、56、58、60、62、64、66、68、70、72、76、88、92、104、110、122、124、126、128、130、132、160或176。

6.根据权利要求5所述的转氨酶，其中所述转氨酶的氨基酸序列选自SEQ ID NO:36或40。

7.根据权利要求1或2所述的转氨酶，所述转氨酶能够以大于SEQ IDNO:2或18的多肽的比率将选自3,4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮和1-(4-溴苯基)乙酮的氨基受体底物转化成相应的胺产物，并且其中所述转氨酶的氨基酸序列选自SEQ ID NO:38、42、44、52、56、66、74、76、78、80、82、84、94、96、98、100、104、118、160、164、172、184、188。

8.一种多核苷酸，所述多核苷酸编码权利要求1至7中任一项所述的转氨酶中所包括的多肽。

9.根据权利要求8所述的多核苷酸，所述多核苷酸包括对应于SEQ IDNO:17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189或191的多核苷酸序列。

10.一种表达载体，所述表达载体包括权利要求8或9所述的多核苷酸。

11.根据权利要求10所述的表达载体，所述表达载体还包括控制序列。

12.根据权利要求11所述的表达载体，其中所述控制序列包括启动子。

13.一种宿主细胞，所述宿主细胞包括权利要求8或9所述的多核苷酸。

14.根据权利要求13所述的宿主细胞，所述宿主细胞是大肠杆菌(E.coli)。

15.一种将式I的底物转化成立体异构过量的式III的手性胺产物的方法，

其中

所述手性胺产物的手性碳原子用*标记；

R¹、R²、R³和R⁴中的每一个独立是未取代的或取代的烃基、烃基芳基或芳基，其中R¹在结构或手性上不同于R²，或R¹和R²合在一起是包含手性中心的4个或更多个碳原子的烃链，

所述方法包括在氨基供体的存在下在用于将底物转化成立体异构过量的式III的产物的适合的反应条件下使式I的底物与权利要求1至7中任一项的转氨酶中所包括的多肽接触。

16.根据权利要求15所述的方法，其中所述式I的底物是：

(a)3,4-二氢萘-1(2H)-酮，其被转化成立体异构过量的产物(S)-1,2,3,4-四氢萘-1-胺；

(b)1-苯基丁-2-酮，其被转化成立体异构过量的产物(S)-1-苯基丁-2-胺；

(c)3,3-二甲基丁-2-酮，其被转化成立体异构过量的产物(S)-3,3-二甲基丁-2-胺；

(d)辛-2-酮，其被转化成立体异构过量的产物(S)-辛-2-胺；

(e)1-(4-溴苯基)乙酮，其被转化成立体异构过量的产物(S)-1-(4-溴苯基)乙胺；

(f)4-苯基丁-2-酮，其被转化成立体异构过量的产物(R)-4-苯基丁-2-胺；

(g)3-氧代丁酸乙酯，其被转化成立体异构过量的产物(R)-3-氨基丁酸乙酯；

(h)3-氧代丁酸乙酯，其被转化成立体异构过量的产物(S)-3-氨基丁酸乙酯；

(i)1-(6-甲氧基萘-2-基)乙酮，其被转化成立体异构过量的产物(S)-1-(6-甲氧基萘-2-基)乙胺；

(j)1-(2,3-二氢苯并[b][1,4]二噁英-6-基)乙酮，其被转化成立体异构过量的产物(S)-1-(6-甲氧基萘-2-基)乙胺

(k)1-(4-苯氧基苯基)乙酮，其被转化成立体异构过量的产物(S)-1-(4-苯氧基苯基)乙胺；

(l)(R)-4-氧代四氢-2H-吡喃-3-基-苯甲酸酯，其被转化成立体异构过量的产物(3S,4S)-3-氨基四氢-2H-吡喃-3-基苯甲酸酯；或

(m)(R)-3-苄氧基二氢-2H-吡喃-4(3H)-酮，其被转化成立体异构过量的产物(3S,4S)-3-苄氧基四氢-2H-吡喃-4-胺。

17.根据权利要求15所述的方法，其中所述氨基供体选自由异丙胺，α-苯乙胺，D-丙氨酸或L-丙氨酸组成的组。

18.根据权利要求15所述的方法，其中所述反应条件是20℃至55℃。

19.根据权利要求15所述的方法，其中所述反应条件是35℃至50℃。

20.根据权利要求15所述的方法，其中所述氨基受体副产物被除去。

21.根据权利要求15所述的方法，所述方法在还原型烟酰胺腺嘌呤二核苷酸(NADH)的存在下进行。