CN115698310A

CN115698310A - 还原酶以及制备和使用还原酶的方法

Info

Publication number: CN115698310A
Application number: CN202180037228.6A
Authority: CN
Inventors: T·贝科维克斯; K·M·卡马乔·索托; J·麦金托什; J·C·摩尔; W·潘; D·维尔马; 肖力
Original assignee: Merck Sharp and Dohme BV
Current assignee: Merck Sharp and Dohme BV
Priority date: 2020-05-22
Filing date: 2021-05-20
Publication date: 2023-02-03
Also published as: JP2023526433A; US20230174992A1; WO2021236860A2; EP4153766A2; WO2021236860A3

Abstract

本公开内容提供了与天然存在的野生型酮还原酶相比具有改进的性质的酮还原酶，所述改进的性质包括还原N‑(7‑((2S,4R,5R)‑4‑氟‑3,3‑二羟基‑5‑(羟甲基)四氢呋喃‑2‑基)‑4‑氧代‑4,7‑二氢‑3H‑吡咯并[3,2‑d]嘧啶‑2‑基)异丁酰胺的能力。还提供了编码酮还原酶的多核苷酸，能够表达酮还原酶的宿主细胞以及使用酮还原酶合成N‑(9‑((2R,3S,4S,5R)‑4‑氟‑3‑羟基‑5‑(羟甲基)四氢呋喃‑2‑基)‑6‑氧代‑6,9‑二氢‑1H‑嘌呤‑2‑基)异丁酰胺的方法。

Description

还原酶以及制备和使用还原酶的方法

技术领域

本发明涉及酮还原酶，其在涉及酮还原为手性醇的生物催化和合成过程中是有用的。此类酶在制备核苷和核苷酸(如氟化核苷酸)中可能特别有用。

针对以电子方式提交的序列表

本申请的序列表以ASCII格式的序列表形式通过EFS-Web以电子方式提交，文件名为“24998WOPCT-SEQTEXT-14MAY2021.txt”，创建日期为2021年05月14日，大小为24KB。通过EFS-Web提交的序列表是本说明书的一部分，并且其全部内容通过引用并入本文。

背景技术

酶是用于加速活细胞的化学反应(通常是几个数量级)的蛋白分子。如果没有酶，大多数生化反应都会太慢，甚至无法进行生命过程。酶显示出很强的特异性，并且不会因参与反应而永久改变。由于酶在反应过程中不发生变化，因而可以成本有效地用作所需化学转化的催化剂。

酮还原酶，也称为醇脱氢酶，是一种酶促还原剂，其是一类特殊的酶，催化酮选择性还原为手性醇。属于酮还原酶或羰基还原酶的酶可用于合成光学活性醇。酮还原酶可以选择性地将酮或醛底物转化为相应的手性醇产物；这些酶也可以在逆反应中将醇转化为相应的酮或醛。酮和醛的酶促还原需要一个可以充当电子供体的辅因子的参与，而醇的酶促氧化需要一个能够充当电子受体的辅因子的参与。

酮还原酶在自然界中是众所周知的，并且已报道了很多编码酮还原酶的基因和酮还原酶序列。参见，例如，木兰假丝酵母(Candida magnoliae)(Genbank登录号JC7338；GI:11360538)、近平滑假丝酵母(Candida parapsilosis)(Genbank登录号10BAA24528.1；GI:2815409)、赭色掷孢酵母(Sporobolomyces salmonicolor)(Genbank登录号AF160799；GI:6539734)和红串红球菌(Rhodococcus erythropolis)(Genbank登录号AAN73270.1；GI:34776951)。

酮还原酶被越来越多地用于提供关键化合物的替代合成途径。当使用时，酮还原酶可以作为纯化的酶或作为表达所需酮还原酶的整个细胞提供。鉴于其改善合成途径的前景，仍然需要鉴定可用于进行转化以制备特定手性醇的其他酮还原酶。

发明内容

本公开内容涉及能够将酮转化为手性醇的酮还原酶，特别是作为核苷酸合成的一部分的酮还原酶。在实施方式中，本文所述的主题酮还原酶能够在氟核苷酸的合成中将酮转化为手性醇。特别地，本文所述的主题酮还原酶可用于制备氟化核苷，如(O-{[(2R,3S,4S,5R)-5-(2-氨基-6-氧化-9H-嘌呤-9-基)-3-氟-4-羟基氧杂环戊烷-2基]甲基}硫代磷酸三钠水合物(1：6))，也称为3’-氟硫代鸟苷一磷酸或3’-F-硫代-GMP。此类氟化核苷可用作生物活性化合物或用作合成更复杂的生物活性化合物的中间体。.

其他实施方式描述了用于制备主题酮还原酶的方法以及使用主题酮还原酶的方法。

本发明的其他实施方式、方面和特征在随后的说明书、实施例和所附权利要求书中进一步描述或者将是显而易见的。

附图说明

图1描述了SDS-PAGE凝胶，其显示了从冻干酶制剂中去除IPA不容性蛋白。

具体实施方式

定义

某些技术和科学术语具体定义如下。出非在本文其他地方特别定义，否则本文中使用的所有其他技术和科学术语具有本公开内容涉及的本领域普通技术人员通常理解的含义。尽管有并且出非另有说明，否则以下定义适用于整个说明书和权利要求。化学名、通用名和化学结构可以互换使用来描述相同的结构。如果同时使用化学结构和化学名来指化合物，并且结构和名称之间存在歧义，则以结构占优势。除非另有说明，否则无论术语是单独使用还是与其他术语结合使用，这些定义都适用。因此，“烷基”的定义适用于“烷基”以及“羟基烷基”、“卤代烷基”、“-O-烷基”等的“烷基”部分。

如本文所用，以及贯穿本公开内容，出非另有说明，否则以下术语应理解为具有以下含义：

如本文所用，包括所附权利要求，单词的单数形式，如“一个/一种(a)”、“一个/一种(an)”和“所述(the)”，包括其对应的复数引用，除非上下文另有明确规定。特别地，“一个/一种(a)”、“一个/一种(an)”和“所述(the)”项目各自包括从列表中选择的单个项目以及从列表中选择的两个或更多个项目的混合。

如本文所用，术语“至少一个”项目或“一个或多个”项目各自包括从列表中选择的单个项目以及从列表中选择的两个或更多个项目的混合。例如，“至少一种酮还原酶型酶”(或者称为“酮还原酶型酶”)指单一酮还原酶型酶以及两种或更多种不同酮还原酶型酶的混合物。类似地，术语“至少两个”项目和“两个或更多个”项目各自包括从列表中选择的两个项目的混合以及从列表中选择的三个或更多个项目的混合。

在整个说明书和权利要求中使用的“基本上由……组成(Consists essentiallyof)”和诸如“基本上由……组成(consist essentially of)”或“基本上由……组成(consisting essentially of)”的变体表示包含任何列举的要素或要素的组，以及任选地包含其他要素，其与所列举的要素具有相似或不同的性质，不会实质性地改变给定给药方案、方法或组合物的基本或新性质。

在整个说明书和权利要求中，词语“包括(comprise)”，或诸如“包含(comprises)”或“含有(comprising)”的变体将被理解为暗示包含所陈述的要素或要素的组，但不排除任何其他要素或要素的组。在整数的情况下，单词“包括(comprise)”，或诸如“包含(comprises)”或“含有(comprising)”的变体将被理解为暗示包含指定的整数或整数的组，但不排除任何其他整数或整数的组。除非上下文另有要求，否则单数术语应包括复数，复数术语应包括单数。术语“例如(e.g.)”或“例如(for example)”后的任何一个或多个实例并不意味着详尽或限制。应当理解，在本文中使用语言“包括(comprising)”来描述实施方式的任何地方，也提供了以“由……组成(consisting of)”和/或“基本上由……组成(consisting essentially of)”来描述的类似实施方式。

除非另有明确说明，否则本文引用的所有范围均包含在内；即，范围包括范围的上限和下限的值以及介于两者之间的所有值。所有范围也旨在包括所有包括的子范围，尽管不一定明确阐述。例如，本文所述的温度范围、百分比、当量范围等包括范围的上限和下限以及其间连续范围内的任何值。本文提供的数值以及术语“约”的使用可以包括±1％、±2％、±3％、±4％、±5％和±10％及其等同数值的变化。“约”当用于修改数值定义的参数时，表示该参数可能会比规定的数值低或高出多达10％；在适当的情况下，所述参数可以四舍五入到最接近的整数。例如，约5mg的量可能在4.5mg和5.5mg之间变化。此外，如本文所用，术语“或”表示可酌情组合的备选方案；也就是说，术语“或”包括单独列出的每个备选方案以及其组合。

如本文所用，术语“烷基”指其氢原子之一被具有指定碳原子数的键取代的脂肪族烃基。在不同实施方式中，烷基含有1至6个碳原子(C₁-C₆烷基)或1至3个碳原子(C₁-C₃烷基)。烷基的非限制性实例包括甲基、乙基、正丙基、异丙基、正丁基、仲丁基、异丁基、叔丁基、正戊基、新戊基、异戊基、正己基、异己基和新己基。在一个实施方式中，烷基是线形的。在另一个实施方式中，烷基是支链的。

如本文所用，术语“卤素”和“卤代”指-F(氟)、-Cl(氯)、-Br(溴)或-I(碘)。

如本文所用，术语“卤代烷基”指如上定义的烷基，其中烷基的一个或多个氢原子已被卤素取代。在一个实施方式中，卤代烷基具有1至6个碳原子。在另一个实施方式中，卤代烷基具有1至3个碳原子。在另一个实施方式中，卤代烷基被1至3个卤原子取代。卤代烷基的非限制性实例包括-CH₂F、-CHF₂和-CF₃。术语“C₁-C₄卤代烷基”指具有1至4个碳原子的卤代烷基。

如本文所用，术语“烷氧基”指-O-烷基，其中烷基如上所定义。烷氧基的非限制性实例包括甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基和叔丁氧基。烷氧基通过其氧原子与分子的其余部分键合。

如本文所用，术语“芳基”指包含约6至约14个碳原子的芳香族单环或多环系统。在一个实施方式中，芳基包含约6至10个碳原子(C₆-C₁₀芳基)。在另一个实施方式中，芳基是苯基。芳基的非限制性实例包括苯基和萘基。

当化合物中的官能团被称为“受保护的”时，该官能团处于修饰形式，以防止当化合物进行反应时在受保护位点发生不希望的副反应。如本文所用，术语“PG”指保护基团。本领域技术人员将容易想到适用于根据本公开内容的化合物和方法中的保护基团。本领域普通技术人员以及根据标准教科书将意识到适宜的保护基团，比如，例如，GREEN’SPROTECTIVE GROUPS IN ORGANIC SYNTHESIS(第5版，Peter G.M.Wuts编著，2014)。适用于本文公开的方法的保护基团包括酸不稳定的保护基。适用于本文的PG的非限制性实例包括-S(O)₂R⁸、-C(O)OR⁸、-C(O)R⁸、-CH₂OCH₂CH₂SiR⁸和-CH₂R₈，其中R⁸选自以下：-C_1-8烷基(直链或支链)、-C_3-8环烷基、-CH₂(芳基)和-CH(芳基)₂，其中每个芳基独立地是苯基或萘基并且每个所述芳基任选地独立地未被取代或者被一个或多个(例如，1个、2个或3个)独立地选自-OCH₃、-Cl、-Br和-I的基团取代。

术语“取代的”指指定部分的原子上的一个或多个氢被选自指定基团的选择取代，条件是原子在现有情况下的正常化合价不超过，并且取代导致稳定的化合物。仅当此类组合产生稳定的化合物时，才允许使用取代基和/或变量的组合。“稳定的化合物”或“稳定的结构”指足够稳健以经受住从反应混合物中分离到有用的纯度并配制成有效治疗剂的化合物。

当任何取代基或变量在任何化合物中出现一次以上时，除非另有说明，否则其每次出现的定义独立于其在每隔一次出现时的定义。例如，包括表述“-N(C₁-C₃烷基)₂”的基团的描述指-N(CH₃)(CH₂CH₃)、-N(CH₃)(CH₂CH₂CH₃)和-N(CH₂CH₃)(CH₂CH₂CH₃)，以及-N(CH₃)₂、-N(CH₂CH₃)₂和-N(CH₂CH₂CH₃)₂。

还应注意的是，本文中的文本、路线、实例和表格中的任何具有不满足化合价的碳或杂原子被假定具有足够的一个或多个氢原子来满足化合价。这些氢原子中的任何一个或多个可以是氘。

本公开内容还包括与本文所述的那些相同的同位素标记的化合物，但事实上一个或多个原子被具有不同于通常在自然界中发现的原子质量或质量数的原子质量或质量数的原子取代。可以结合到本发明化合物中的同位素的实例包括氢、碳、氮、氧、磷、氟和氯以及碘的同位素，如分别是²H、³H、¹¹C、¹³C、¹⁴C、¹⁵N、¹⁸O、¹⁷O、³¹P、³²P、³⁵S、¹⁸F、³⁶Cl和¹²³I。

某些同位素标记的化合物(例如，用³H和¹⁴C标记的化合物)可用于化合物和/或底物组织分布测定。特别优选氚化(即，³H)和碳-14(即，¹⁴C)同位素，因为其易于制备和可检测。发生差向异构化的位点处的同位素取代可能会减慢或减少差向异构化过程，从而使化合物的活性或有效形式保持更长的时间。同位素标记的化合物，特别是那些含有具有较长半衰期(T_1/2>1天)的同位素的化合物，通常可以通过以下类似于下文路线和/或实施例中公开的那些的程序，通过用适当的同位素标记试剂替代非同位素标记试剂。

本文的化合物可以含有一个或多个立体中心，并且可以作为外消旋体、外消旋混合物、单一对映异构体、非对映异构体混合物和单独的非对映异构体存在。取决于分子上各种取代基的性质，可能存在额外的不对称中心。每个这样的不对称中心将独立地产生两种旋光异构体，并且混合物中的所有可能的旋光异构体和非对映异构体以及作为纯的或部分纯化的化合物都包括在本公开内容中。未指定特定立体化学的本文所述的化合物的任何化学式、结构或名称旨在涵盖任何和所有如上所述的现有异构体及其任何比例的混合物。当指定立体化学时，本公开内容旨在涵盖纯形式的特定异构体或作为与任何比例的其他异构体的混合物的一部分。

通过本领域技术人员熟知的方法，比如，例如，通过色谱法和/或分级结晶，可以根据其物理化学差异将非对映体混合物分离成其各自的非对映体。通过与适当的光学活性化合物(例如，手性助剂，如手性醇或Mosher酰氯)反应分离非对映异构体并将单独的非对映异构体转化(例如，水解)为相应的纯对映异构体，可以通过将对映异构混合物转化为非对映异构混合物来分离对映异构体。对映异构体也可以通过使用手性HPLC柱进行分离。

所公开化合物(包括化合物的盐和溶剂化物以及前药的盐、溶剂化物和酯)的所有立体异构体(例如，几何异构体、光学异构体等)，如由于各种取代基上的不对称碳而可能存在的那些，包括对映异构形式(即使在没有不对称碳的情况下也可能存在)、旋转异构形式、阻转异构体和非对映异构形式，均包括在本公开内容的范围内。化合物的单个立体异构体可以例如基本上不含其他异构体，或者可以例如作为外消旋体或与所有其他或其他选定的立体异构体混合。手性中心可以具有IUPAC 1974建议所定义的S或R构型。

本公开内容还包括所有分离形式的化合物和合成中间体。例如，上述化合物旨在涵盖化合物的所有形式，如其任何溶剂化物、水合物、立体异构体和互变异构体。

本领域技术人员将意识到手性化合物，特别是糖中的手性化合物，可以以很多不同的等效方式绘制。本领域技术人员将进一步认识到，核糖上取代基的特性和区域化学位置可以广泛变化，并且无论取代基如何，都适用相同的立体化学等效原理。此类等效物的非限制性实例包括下面举例说明的那些。

类似地，本领域技术人员将意识到某些化合物，特别是含有某些杂原子以及双键或三键的化合物，可以是互变异构体、易于相互转化的结构异构体。因此，互变异构化合物可以以多种不同的等效方式绘制。此类互变异构体的非限制性实例包括下面举例说明的那些。

化合物可以形成也在本公开内容范围内的盐。除非另有说明，否则本文提及的化合物应理解为包括提及其盐。如在本文中所使用的，术语“盐”表示与无机和/或有机酸形成的酸式盐，以及与无机和/或有机碱形成的碱式盐。此外，当化合物包含碱性部分(比如但不限于吡啶或咪唑)和酸性部分(比如但不限于羧酸)两者时，可以形成两性离子(“内盐”)，并包括在如本文所用的术语“盐”中。优选药学上可接受(即，无毒的、生理学上可接受的)盐，尽管其他盐也是有用的。化合物的盐可以例如通过使化合物与一定量的酸或碱(如当量)在如盐沉淀的介质中或在水性介质中随后冻干反应而形成。

示例性的酸加成盐包括乙酸盐、抗坏血酸盐、苯甲酸盐、苯磺酸盐、硫酸氢盐、硼酸盐、丁酸盐、柠檬酸盐、樟脑酸盐、樟脑磺酸盐、富马酸盐、盐酸盐、氢溴酸盐、氢碘酸盐、乳酸盐、马来酸盐、甲磺酸盐、萘磺酸盐、硝酸盐、草酸盐、磷酸盐、丙酸盐、水杨酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、甲苯磺酸盐(toluenesulfonate)(也称为甲苯磺酸盐(tosylate))等。此外，通常认为适于从碱性药物化合物形成可药用盐的酸在例如P.Stahl等，Camille G.(编著)，HANDBOOK OF PHARMACEUTICAL SALTS:PROPERTIES,SELECTION ANDUSE(2002)Zurich:Wiley-VCH；S.Berge等，J.Pharm.Sci.(1977)66(1)1-19；P.Gould,International J.of Pharmaceutics(1986)33 201-217；Anderson等，THE PRACTICE OFMEDICINAL CHEMISTRY(1996)，Academic Press,New York；和The Orange Book(Food&DrugAdministration,Washington,D.C.)中讨论。这些公开内容通过引用并入本文。

示例性的碱式盐包括铵盐、碱金属盐如钠盐、锂盐和钾盐，碱土金属盐如钙盐和镁盐，与有机碱(例如，有机胺)的盐，如二环己胺、叔丁胺，以及与氨基酸的盐，如精氨酸、赖氨酸等。碱性含氮基团可以用试剂季铵化，如低级烷基卤化物(例如，甲基、乙基和丁基氯化物、溴化物和碘化物)、二烷基硫酸盐(例如，二甲基、二乙基和二丁基硫酸盐)、长链卤化物(例如，癸基、月桂基和硬脂基的氯化物、溴化物和碘化物)、芳烷基卤化物(例如，苄基和苯乙基溴化物)及其他。

所有此类酸式盐和碱式盐旨在为本发明范围内的药学上可接受的盐，并且所有酸式盐和碱式盐被认为等同于用于本发明目的的相应化合物的游离形式。

本文中的一种或多种化合物可以与药学上可接受的溶剂，如水、乙醇等，以非溶剂化和溶剂化形式存在，并且本公开内容旨在涵盖溶剂化和非溶剂化形式。“溶剂化物”指化合物与一种或多种溶剂分子的物理结合。这种物理结合涉及不同程度的离子键和共价键，包括氢键。在某些情况下，溶剂化物将能够分离，例如当一种或多种溶剂分子结合到结晶固体的晶格中时。“溶剂化物”包括溶液相和可分离的溶剂化物。适宜的溶剂化物的非限制性实例包括乙醇化物、甲醇化物等。“水合物”是溶剂分子是H₂O的溶剂化物。

“蛋白”、“多肽”和“肽”在本文中可以互换使用，表示至少两个氨基酸通过酰胺键共价连接的聚合物，无论长度或翻译后修饰(例如，糖基化或磷酸化、脂化、豆蔻酰化、泛素化等)如何。该定义包括D-和L-氨基酸，以及D-和L-氨基酸的混合物，以及包含D-和L-氨基酸，以及D-和L-氨基酸的混合物的聚合物。蛋白、多肽和肽可以包含标签，如组氨酸标签，在确定序列同一性百分比时不应包含该标签。

如在本文公开的多肽的上下文中使用的，“氨基酸”或“残基”指序列位置处的特定单体。在本文中氨基酸通过其通常已知的三字母符号或IUPAC-IUB生物化学命名委员会推荐的单字母符号来指代。同样，核苷酸可以通过其普遍接受的单字母代码来表示。

用于遗传编码氨基酸的缩写是常规的，如下所示：丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。

用于遗传编码核苷的缩写是常规的，如下所示：腺苷(A)；鸟苷(G)；胞苷(C)；胸苷(T)；和尿苷(U)。除非特别说明，否则缩写的核苷可以是核糖核苷或2′-脱氧核糖核苷。核苷可以单独地或聚集地指定为核糖核苷或2′-脱氧核糖核苷。当核酸序列以一串单字母缩写表示时，序列按照惯例以5’至3’方向表示，而磷酸盐则未标明。

在酶的上下文中，如本文所用，“来源于”标识了该酶所基于的起源酶和/或编码这种酶的基因。例如，SEQ ID NO:7的酮还原酶是通过多代人工进化编码SEQ ID NO:1的酮还原酶的基因而获得的。因此，这种进化的酮还原酶“来源于”SEQ ID NO:1的酮还原酶。

“亲水性氨基酸或残基”指具有显示出根据Eisenberg等，1984,J.Mol.Biol.179:125-142的标准化共有疏水性标度其疏水性小于零的侧链的氨基酸或残基。基因编码的亲水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。

“酸性氨基酸或残基”指当氨基酸包含在肽或多肽中时具有显示出小于约6的pK值的侧链的亲水性氨基酸或残基。由于失去氢离子，酸性氨基酸通常在生理pH下具有带负电荷的侧链。基因编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。

“碱性氨基酸或残基”指当氨基酸包含在肽或多肽中时具有显示出大于约6的pKa值的侧链的亲水性氨基酸或残基。由于与水合氢离子结合，碱性氨基酸通常在生理pH下具有带正电荷的侧链。基因编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。

“极性氨基酸或残基”指亲水性氨基酸或残基，其侧链在生理pH下不带电荷，但具有至少一个键，其中两个原子共有的电子对更紧密地保持在原子之一。基因编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。

“疏水性氨基酸或残基”指具有显示出根据Eisenberg等，1984,J.Mol.Biol.179:125-142的标准化共有疏水性标度其疏水性大于零的侧链的氨基酸或残基。基因编码的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。

“芳香族氨基酸或残基”指亲水性或疏水性氨基酸或残基，其侧链包含至少一个芳香族或杂芳香族环。基因编码的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)、L-His(H)和L-Trp(W)。L-His(H)组氨酸在本文中也分类为亲水性残基或受限的残基。

如本文所用，“受限的氨基酸或残基”指具有受限的几何形状的氨基酸或残基。在此，受限的残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何性状，因为其具有相对较小的咪唑环。脯氨酸具有受限的几何性状，因为其还有一个五元环。

“非极性氨基酸或残基”指疏水性氨基酸或残基，其侧链在生理pH下不带电荷，并且具有键，其中两个原子共有的电子对通常由两个原子中的每一个平等地保持(即，侧链不是极性的)。基因编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。

如本文所用，“脂肪族氨基酸或残基”指具有脂肪烃侧链的疏水性氨基酸或残基。基因编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。

L-Cys(C)(和其他具有含-SH侧链的氨基酸)以还原的游离-SH或氧化的二硫键桥接形式存在于肽中的能力会影响L-Cys(C)是否贡献净疏水性或亲水性肽的特征。虽然根据Eisenberg的归一化共有尺度(Eisenberg等，1984，同上)，L-Cys(C)表现出0.29的疏水性，但应理解，为了本公开的目的，L-Cys(C)被分类到自己独特的组中。值得注意的是，半胱氨酸(或“L-Cys”或“[C]”)的不寻常之处在于其可以与其他L-Cys(C)氨基酸或其他含硫烷基或巯基的氨基酸形成二硫键。“半胱氨酸样残基”包括半胱氨酸和其他含有可用于形成二硫键的巯基部分的氨基酸。

如本文所用，“小氨基酸或残基”指具有由共计三个或更少的碳和/或杂原子(不包括α-碳和氢)组成的侧链的氨基酸或残基。根据上述定义，小氨基酸或残基可以进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。基因编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。

“含羟基的氨基酸或残基”指含有羟基(-OH)部分的氨基酸。基因编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。

如本文所用，“多核苷酸”和“核酸”指共价连接在一起的两个或更多个核苷酸。多核苷酸可以完全由核糖核苷酸(即，RNA)组成，完全由2’脱氧核糖核苷酸(即，DNA)组成，或者由核糖和2’脱氧核糖核苷酸的混合物组成。尽管核苷通常通过标准磷酸二酯键连接在一起，但多核苷酸可以包含一个或多个非标准键。多核苷酸可以是单链或双链的，或者多核苷酸可以包含单链区和双链区。此外，尽管多核苷酸通常由天然存在的编码核碱基(即，腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成，但其可以包含一种或多种修饰的和/或合成的核碱基，比如，例如，肌苷、黄嘌呤、次黄嘌呤等。在一些实施方式中，这种修饰的或合成的核碱基是编码氨基酸序列的核碱基。

如本文所用，“核苷”指包含核碱基(即，含氮碱基)和5-碳糖(例如，核糖和脱氧核糖)的糖基胺。核苷的非限制性实例包括胞苷、尿苷、腺苷、鸟苷、胸苷和肌苷。而相反的，术语“核苷酸”指包含核碱基、5-碳糖和一个或多个磷酸基团的糖基胺。在一些实施方式中，核苷可以被激酶磷酸化以产生核苷酸。

如本文所用，“核苷二磷酸”指包含核碱基(即，含氮碱基)、5-碳糖(例如，核糖或脱氧核糖)和二磷酸(即，焦磷酸)部分的糖基胺。在本文的一些实施方式中，“核苷二磷酸”缩写为“NDP”。核苷二磷酸的非限制性实例包括胞苷二磷酸(CDP)、尿苷二磷酸(UDP)、腺苷二磷酸(ADP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)和肌苷二磷酸(IDP)。在一些情况下，术语“核苷”和“核苷酸”可以互换使用。

如本文所用，“核苷三磷酸”指包含核碱基(即，含氮碱基)、5-碳糖(例如，核糖或脱氧核糖)和三磷酸部分的糖基胺。在本文的一些实施方式中，“核苷三磷酸”缩写为“NTP”。核苷三磷酸的非限制性实例包括胞苷三磷酸(CTP)、尿苷三磷酸(UTP)、腺苷三磷酸(ATP)、鸟苷三磷酸(GTP)、胸苷三磷酸(TTP)和肌苷三磷酸(ITP)。在一些情况下，术语“核苷”和“核苷酸”可以互换使用。

如本文所用，“保守性氨基酸取代”指用具有相似侧链的不同残基取代残基，并且因此通常涉及用相同或相似定义的氨基酸类别内的氨基酸取代多肽中的氨基酸。作为实例而非限制性，在一些实施方式中，具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如，丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代；具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如，丝氨酸和苏氨酸)取代；具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如，苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代；具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如，赖氨酸和精氨酸)取代；具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如，天冬氨酸和谷氨酸)取代；和/或疏水性或亲水性氨基酸分别被另一种疏水性或亲水性氨基酸取代。

如本文所用，“非保守性取代”指用具有显著不同侧链性质的氨基酸取代多肽中的氨基酸。非保守性取代可以在定义的基团之间而不是在定义的基团内使用氨基酸，并影响(a)取代区域中肽骨架的结构(例如，脯氨酸替代甘氨酸)，(b)电荷或疏水性，或(c)侧链体积。作为实例而非限制性，示例性的非保守性取代可以是被碱性或脂肪族氨基酸取代的酸性氨基酸；被小氨基酸取代的芳香族氨基酸；和被疏水性氨基酸取代的亲水性氨基酸。

如本文所用，“缺失”指通过从参考多肽中去除一个或多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸，最多为氨基酸总数的10％，或者可达构成参考酶的氨基酸总数的20％，同时保留酶活性和/或保留进化酶的改进的性质。缺失可针对多肽的内部部分和/或末端部分。在各种实施方式中，缺失可以包括连续片段或者可以是不连续的。在氨基酸序列中缺失通常用“-”表示。

如本文所用，“插入”指通过添加来自参考多肽的一个或多个氨基酸来修饰多肽。插入可以在多肽的内部，或者羧基或氨基末端。如本文所用的插入包括本领域公知的融合蛋白。插入可以是连续的氨基酸区段或者被天然存在的多肽中的一个或多个氨基酸隔开。

术语“氨基酸取代集合”或“取代集合”指与参考序列相比，多肽序列中的一组氨基酸取代。取代集合可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个氨基酸取代。

“功能性片段”或“生物活性片段”在本文中可互换使用，是指具有氨基末端和/或羧基末端缺失和/或内部缺失的多肽，但是其中剩余的氨基酸序列与与之比较的序列中的相应位置相同并且基本上保留了全长多肽的所有活性。

如本文所用，“分离的多肽”指与天然伴随其的其他污染物(例如，蛋白、脂质和多核苷酸)基本上分离的多肽。该术语包括已从其天然存在的环境或表达系统(例如，在宿主细胞内或通过在体外合成)中去除或纯化的多肽。重组多肽可以存在于细胞内，存在于细胞培养基中，或者以各种形式制备，如裂解物或分离的制剂。因此，在一些实施方式中，重组多肽可以是分离的多肽。

如本文所用，“基本上纯的多肽”或“纯化的蛋白”指其中多肽种类是存在的主要种类的组合物(即，在摩尔或重量基础上，其比组合物中的任何其他单个大分子种类更丰富)，并且是当目标物质包含按摩尔或重量％计至少约50％的大分子物质时，通常是基本上纯化的组合物。然而，在一些实施方式中，包含酶的组合物包含纯度小于50％(例如，约10％、约20％、约30％、约40％或约50％)的酶。通常，基本上纯的酶或多肽组合物包含约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多和约98％或更多的在组合物中存在的以摩尔或重量％计的所有大分子物质。在一些实施方式中，将目标物质纯化至基本上均质(即，通过常规检测方法无法在组合物中检测到污染物质)，其中组合物基本上由单一大分子物质组成。不将溶剂物质、小分子(<500道尔顿)和元素离子物质认为是大分子物质。在一些实施方式中，分离的重组多肽是基本上纯的多肽组合物。

“改进的酶性质”指与参考酶相比在任何酶性质方面表现出改进的酶。对于本文所述的酶，通常与野生型酶进行比较，尽管在一些实施方式中，参考酶可以是另一种改进的酶。需要改进的酶性质包括但不限于酶活性(其可以以底物的转化百分比表示)、热稳定性、pH活性曲线、辅因子要求、对抑制剂的不应性(例如，产物抑制)、立体特异性和立体选择性(包括对映选择性)。

“提高的酶活性”指改进的酶的性质，与参考酶相比，其可以表现为比活性的提高(例如，产生的产物/时间/重量蛋白)或底物转化为产物百分比的增加(例如，使用指定量的酶在指定时间段内底物起始量转化为产物的百分比)。实施例中提供了确定酶活性的示例性方法。任何与酶活性有关的性质都可能受到影响，包括K_m、V_max或k_cat的经典酶性质，其变化会导致酶活性增加。酶活性的提高可以是相应野生型酶的酶活性的约1.5倍，最高可达天然存在的酶或作为多肽来源的另一种酶的酶活性的2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍、500倍、1000倍、3000倍、5000倍、7000倍或更多。在特定实施方式中，酶显示出比母体酶提高范围从150至3000倍、3000至7000倍或超过7000倍的酶活性。本领域技术人员将理解，任何酶的活性是扩散受限的，因此催化转换速率不能超过底物的扩散速率，包括任何所需的辅因子。扩散限度或k_cat/K_m的理论最大值通常约为10⁸至10⁹(M^-1s^-1)。因此，酶活性的任何提高都将具有与酶作用的底物的扩散速率相关的上限。酶活性可以通过用于测量激酶活性的任何一种标准测定来测量，或通过与能够催化多肽产物和核苷碱基之间的反应以提供核苷的核苷磷酸化酶的偶联测定，或通过任何传统的化学反应分析方法，包括但不限于HPLC、HPLC-MS、UPLC、UPLC-MS、TLC和NMR。如本文进一步详细描述的，使用确定的酶制剂，在设定条件下确定的测定和一种或多种确定的底物进行酶活性的比较。通常，当比较裂解物时，确定细胞数量和测定的蛋白的量，以及使用相同的表达系统和相同的宿主细胞，以最大限度地减少宿主细胞产生的和存在于裂解物中的酶量的变化。

如本文所用，“载体”是用于将DNA序列引入细胞的DNA构建体。在一些实施方式中，载体是与适宜控制序列可操作地连接的表达载体，所述控制序列能够影响DNA序列中编码的多肽在适宜的宿主中的表达。在一些实施方式中，“表达载体”具有可操作地连接至DNA序列(例如，转基因)的启动子序列，以驱动在宿主细胞中的表达，并且在一些实施方式中，还包含转录终止子序列。

如本文所用，术语“表达”包括涉及多肽产生的任何步骤，包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方式中，该术语还包括从细胞分泌多肽。

如本文所用，术语“产生”指细胞产生蛋白和/或其他化合物。该术语旨在涵盖涉及多肽产生的任何步骤，包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方式中，该术语还包括从细胞分泌多肽。

如本文所用，氨基酸或核苷酸序列(例如，启动子序列、信号肽、终止子序列等)对于与之可操作地连接的另一序列是“异源的”，如果这两条序列在本质上是不相关的。例如，“异源多核苷酸”是通过实验室技术引入宿主细胞的任何多核苷酸，该术语包括从宿主细胞中取出、进行实验室操作、然后再引入宿主细胞的多核苷酸。

如本文所用，术语“宿主细胞”和“宿主菌株”指包含本文提供的DNA(例如，编码变体的多核苷酸)的表达载体的适宜宿主。在一些实施方式中，宿主细胞是用本领域公知的重组DNA技术构建的载体转化或转染的原核或真核细胞。

术语“类似物”指与参考多肽相比具有大于70％序列同一性但小于100％序列同一性的多肽(例如，大于75％、78％、80％、83％、85％、88％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性)。在一些实施方式中，“类似物”是指含有一个或多个非天然存在的氨基酸残基的多肽，包括但不限于高精氨酸、鸟氨酸和正缬氨酸，以及天然存在的氨基酸。在一些实施方式中，类似物还包括一个或多个D-氨基酸残基以及两个或更多个氨基酸残基之间的非肽键。

如本文所用，“EC”编号指国际生物化学和分子生物学联盟命名委员会(NC-IUBMB)的酶命名法。IUBMB生物化学分类是基于酶催化的化学反应的酶的数字分类系统。

如本文所用，“ATCC”指美国典型培养物保藏中心，其生物储存库包括基因和菌株。

如本文所用，“NCBI”指国家生物信息中心及其提供的序列数据库。

“编码序列”指编码蛋白的氨基酸序列的核酸(例如，基因)的部分。

“天然存在的”或“野生型”指自然界中存在的形式。例如，天然存在的或野生型多肽或多核苷酸序列是存在于生物体中的序列，该序列可以从自然界的来源中分离出来并且未被人为操纵有意地修饰，唯一的例外是本文鉴定的野生型多肽或多核苷酸序列可以包含标签，如组氨酸标签，在确定序列同一性百分比时不应包含该标签。在本文中，“野生型”多肽或多核苷酸序列可以表示为“WT”。

“重组体(recombinant)”当用于指代，例如，细胞、核酸或多肽时，指材料或对应于材料的天然或天然形式的材料，其已经以自然界中不存在的方式进行修饰，或与其相同但由合成材料和/或通过使用重组技术操纵产生或衍生。非限制性实例尤其包括表达在细胞的天然(非重组)形式中未发现的基因或表达以不同水平表达的天然基因的重组细胞。

“序列同一性百分比”、“同一性百分比”和“同一百分比”在本文中用于指多核苷酸序列或多肽序列之间的比较，并且通过在比较窗口上比较两个最佳比对的序列来确定，其中与参考序列相比，比较窗口中的多核苷酸或多肽序列可以包含添加或缺失(即，空位)，以实现两个序列的最佳比对。通过确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数量或者核酸碱基或氨基酸残基与空位对齐以产生匹配位置的数量，将匹配位置的数量除以比较窗口中的位置总数，然后将结果乘以100计算百分比，以产生序列同一性百分比。使用BLAST和BLAST 2.0算法确定最佳比对和序列同一性百分比(参见，例如，Altschul等，1990,J.Mol.Biol.215:403-410；和Altschul等，1977,Nucleic Acids Res.3389-3402)。用于进行BLAST分析的软件可以通过国家生物技术信息中心网站公开获得。

简言之，BLAST分析首先通过鉴定查询序列中长度为W的短单词来鉴定高评分序列对(HSP)，当与数据库序列中相同长度的单词对齐时，其匹配或满足某个正值阈值评分T。T称为邻域词评分阈值(Altschul等，同上)。这些初始邻域词命中充当启动检索以查找包含其的更长HSP的种子。然后，沿着每个序列在两个方向上扩展词命中，直到可以增加累积对齐分数。对于核苷酸序列，使用参数M(针对配对残基的奖励分数；总是>0)和N(针对错配残基的惩罚分数；总是<0)计算累积分数。对于氨基酸序列，将评分矩阵用于计算累积分数。在以下情况下，词命中在每个方向上的扩展停止：累积对齐分数从其最大达到的值下降了X数量；由于一个或多个负分数残基比对的累积，累积分数变为零或更低；或达到任一序列的末尾。BLAST算法参数W、T和X确定对齐的灵敏度和速度。BLASTN程序(针对核苷酸序列)使用默认词长(W)11、期望(E)10，M＝5、N＝-4以及两条链的比较。对于氨基酸序列，BLASTP程序使用默认词长(W)3，期望(E)10和BLOSUM62评分矩阵(参见Henikoff和Henikoff,1989,Proc.Natl.Acad.Sci.USA 89:10915)。

在为两个序列提供同一性百分比方面，很多其他算法的功能类似于BLAST。可以通过以下进行用于比较的序列最佳比对，例如，通过Smith&Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法，通过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法，通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA85:2444的相似性搜索方法，通过这些算法(在GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)的计算机化实施，或者通过目测检查(通常参见，Current Protocols inMolecular Biology,F.M.Ausubel等编著，Current Protocols,a joint venture betweenGreene Publishing Associates,Inc.and John Wiley&Sons,Inc.,(1995增刊)(Ausubel))。此外，确定序列比对和序列同一性百分比的可以使用在GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT or GAP程序，使用提供的默认参数。

“基本同一性”指在至少20个残基位置的比较窗，通常在至少30-50个残基的窗内，与参考序列相比，具有至少80％序列同一性，优选至少85％序列同一性，更优选至少89％序列同一性，更优选至少95％序列同一性和甚至更优选至少99％序列同一性的多核苷酸或多肽序列，其中序列同一性百分比通过将参考序列与包含缺失或添加的序列进行比较来计算，所述缺失或添加在比较窗口内总计为参考序列的20％或更少。在应用于多肽的具体实施方式中，术语“基本同一性”指两个多肽序列，当优化比对时，如使用默认空位权重的程序GAP或BESTFIT时，共享至少80％序列同一性，优选至少89％序列同一性，更优选至少95％序列同一性或更高(例如，99％序列同一性)。优选地，不相同的残基位置因保守性氨基酸取代而不同。

当在给定氨基酸或多核苷酸序列编号的上下文中使用时，“对应于”、“涉及”或“相对于”指当给定氨基酸或多核苷酸序列时指定参考序列的残基编号与参考序列进行比较。换言之，给定聚合物的残基编号或残基位置是相对于参考序列指定的，而不是通过残基在给定氨基酸或多核苷酸序列中的实际数字位置来指定。例如，通过引入空位以优化两个序列之间的残基匹配，可以将给定的氨基酸序列与参考序列进行比较。在这些情况下，尽管存在空位，但给定氨基酸或多核苷酸序列中的残基编号是相对于其已与之比对的参考序列进行的。

“立体选择性”指在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的，其中一种立体异构体的形成优于另一种立体异构体，或者其可以是完全的，其中仅形成一种立体异构体。当立体异构体是对映异构体时，将立体选择性称为对映选择性，即一种对映异构体在两者总和中的比例(通常以百分比报告)。或者，本领域通常报道为根据公式[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]计算的对映异构体过量(EE)(通常为百分比)。在立体异构体是非对映异构体的情况下，将立体选择性称为非对映选择性，一种非对映异构体在两种非对映异构体的混合物中的分数(通常以百分比报告)，通常也报告为非对映异构体过量(DE)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。

“高度立体选择性”指能够将底物转化为其相应产物的化学或酶促反应，其中立体异构体过量至少约85％。

“化学选择性”指在化学或酶促反应中一种产物相对于另一种产物的优先形成。

“转化”指底物酶促转化为相应的产物。“转化百分比”指在特定条件下，在一段时间内转化为产物的底物的百分比。因此，例如，多肽的“酶活性”或“活性”可以表示为底物向产物的“转化百分比”。

“手性醇”指通式为R¹-CH(OH)-R²的胺，其中R¹和R²不相同，并且在本文中以其最广泛的含义使用，包括各种不同和混合功能类型的脂肪族和脂环族化合物，其特征在于存在与仲碳原子键合的伯羟基基团，该仲碳原子除氢原子外，还带有(i)形成手性环状结构的二价基团，或(ii)结构或手性彼此不同的两个取代基(氢除外)。形成手性环状结构的二价基团包括，例如，2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。仲碳原子上的两个不同取代基(上述R¹和R²)也可以有很大不同，并且包括烷基、芳烷基、芳基、卤素、羟基、低级烷基、低级烷氧基、低级烷硫基、环烷基、羧基、烷烃氧基、氨基甲酰基、单和二(低级烷基)取代的氨基甲酰基、三氟甲基、苯基、硝基、氨基、单和二(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰胺基、芳基甲酰胺基等，以及由前述取代的烷基、芳烷基或芳基。

固化的酶制剂具有很多公认的优点。例如，其能够赋予酶制剂保质期，能够提高反应稳定性，能够在有机溶剂中保持稳定性，能够有助于从反应流中去除蛋白。“稳定”指固化的酶在含有有机溶剂的溶剂系统中保持其结构构象和/或活性的能力。稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于10％活性。稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于9％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于8％活性。优选7％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于6％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于5％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于4％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于3％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于2％活性。优选地，稳定的固化酶在含有有机溶剂的溶剂系统中每小时失去少于1％活性。

“热稳定的”指与未处理的酶相比在暴露于升高的温度(例如，40℃至80℃)一段时间(例如，0.5h至24h)后保持相似活性(超过60％至80％，例如)的多肽。

“溶剂稳定的”指与未处理的酶相比在暴露于不同浓度(例如，5％至99％)的溶剂(异丙醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)一段时间(例如，0.5h至24h)后保持相似活性(超过例如60％至80％)的多肽。

“pH稳定”指与未处理的酶相比在暴露于较高或较低pH(例如，4.5至6或8至12)一段时间(例如，0.5h至24h)后保持相似活性(超过例如60％至80％)的多肽。

“热稳定的和溶剂稳定的”指既热稳定又溶剂稳定的多肽。

如本文所用，术语“生物催化”、“生物催化的”、“生物转化”和“生物合成”指在有机化合物上进行化学反应的酶的用途。

术语“有效量”指足以产生所需结果的量。本领域的一般技术人员可以通过使用常规实验来确定有效量。

术语“分离的”和“纯化的”用于指从与其天然相关的至少一种其他组分中去除的分子(例如，分离的核酸、多肽等)或其他组分。术语“纯化的”不需要绝对纯度，而是旨在作为相对定义。

本文描述了示例性方法和材料，尽管与本文描述的那些相似或等效的方法和材料也可用于本公开内容的实践或测试。材料、方法和实施例仅是说明性的而不是限制性的。

缩略语

ACN,MeCN 乙腈

DMSO 二甲基亚砜

g 克

h 小时

Hz 赫兹

IPA 异丙醇

IPTG 异丙基β-D-1-硫代吡喃半乳糖苷

J NMR耦合常数

L 升

M 摩尔，摩尔每升

mg 毫克

min 分钟

mL,ml 毫升

mm 毫米

mM 毫摩尔每升

nm 纳米

NaCl 氯化钠

NADP 烟酰胺腺嘌呤二核苷酸磷酸

OD₆₀₀ 在600nm波长处的光密度

PTFE 聚四氟乙烯

RH 相对湿度

RPM,rpm 每分钟转数

RT 室温，约25℃

TFA 三氟乙酸

THF 四氢呋喃

UPLC 超高效液相色谱

vol 体积

v/v 体积/体积

μg,ug 微克

μL,μl,uL,ul 微升

酮还原酶

本公开内容涉及能够在核苷(特别是氟核苷)的合成中将酮还原为手性醇的酮还原酶。在实施方式中，酮还原酶能够进行下述转化：

在特定实施方式中，酮还原酶能够进行下述转化：

在实施方式中，本文所述的酮还原酶具有与野生型酮还原酶或修饰的酮还原酶的参考氨基酸序列相比具有一个或多个氨基酸差异的氨基酸序列，其导致酶对确定的酮底物具有改善的性质。

本文所述的酮还原酶是从可商购的野生型酮还原酶定向进化的产物，其通过筛选Prozomix宏基因组嵌板(Prozomix metagenomic panel)进行鉴定，并且具有如下SEQ IDNO:1中所示的氨基酸序列。MHHHHHHNKTIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGFFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSTASITAYTNGGSYCISKFALLGMSKVLREELKPHHVRVTSILPGATLTDSWAGVELPAERFIASEDIAQIVWTAHCLPSTTVLEEILIRPQLGDL(SEQ ID NO:1)

在实施方式中，本公开内容的酮还原酶可以显示出相对于SEQ ID NO:1的酮还原酶的改进，如酶活性、立体选择性、立体特异性、热稳定性、溶剂稳定性增加或产物抑制降低。

在一些实施方式中，本公开内容的酮还原酶可以显示出酶活性速率的改进，即，将底物转化为产物的速率。在一些实施方式中，酮还原酶多肽能够以由SEQ ID NO:1的酶显示出的速率的至少1.5倍、2倍、3倍、4倍、5倍、10倍、25倍、50倍、100倍、150倍、200倍、400倍、1000倍、3000倍、5000倍、7000倍或超过7000倍的速率将底物转化为产物。

在一些实施方式中，此类酮还原酶多肽还能够将底物转化为具有至少约80％的立体过量百分比的产物。在一些实施方式中，此类酮还原酶多肽还能够将底物转化为具有至少约90％的立体过量百分比的产物。在一些实施方式中，此类酮还原酶多肽还能够将底物转化为具有至少约99％的立体过量百分比的产物。

在一些实施方式中，酮还原酶多肽是高度立体选择性的，其中所述多肽可以以大于约99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、99.7％、99.8％或99.9％的立体过量将底物还原为产物。

在实施方式中，本文所述的酮还原酶包括具有如下述SEQ IDNO:2中所示的氨基酸序列的酮还原酶。

MHHHHHHNKTIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGFFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSTASITAYTNGGSYCISKFALLGMSKVLREELKPHHVRVTSILPGATLNDSWAGVELPAERFIASEDIAQIVWTAHCLPSTTVLEEILIRPQLGDL(SEQ ID NO:2)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:3中所示的氨基酸序列的酮还原酶。

MHHHHHHNKTIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGFFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASITAYTSGGSYCISKFALLGMSKVLREELKPHHVRVTSILPGATLNDSWAKVELPAERFIASEDIAQIVWTAHCLPSTTVLEEILIRPQLGDL(SEQ ID NO:3)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:4中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGFFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASITAYTSGGSYCISKTALLGMSKVLREELKPHHVRVTSILPGATLNDSWAKVELPAEWFIASEDIAQIVWTAHCLPSTTVLEEILIRPQLGDL(SEQ ID NO:4)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:5中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGWFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAQLGMSKVLREELKPHHVRVTSILPGAVLNDSWAKVELPAEWFIASEDIAQIVWTAHCLPSTTVLEEILIRPQLGDL(SEQ ID NO:5)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:6中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTKGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGWFLPGEINNEAEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAQLGMSKVLREELKPHHVRVTSILPGAVLNDSWAKVELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPQTGDL(SEQ ID NO:6)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:7中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTAGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGWFLPGEINNEEEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAQLGMSKVLREELKPHHVRVTSILPGAVLNDSWAKVELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPQEGDL(SEQ ID NO:7)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:8中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTAGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGHFLPGEINNEEEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAELGMSKVLREELKPHHVRVTSILPGAVLNDSWAKAELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPQEGDL(SEQ ID NO:8)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:9中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTAGDNFPENVHFFKADLSKKVEVLAFADFIKQTVNQVDILVNNTGHFLPGEINNEEEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAELAMSRVLREELKPHHVRVTSILPGAVLNDNWAKAELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPTEGDL(SEQ ID NO:9)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:10中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTAGDNFPENVHFFKADLSKKVEVLAFADFIKATVNQVDILVNNTGHFLPGEINNEEEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTPGGSYCISKTAELAMSRVLREELKPHHVRVTSILPGAVLNDNWAKAELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPTEGDL(SEQ ID NO:10)

在其他实施方式中，本文所述的酮还原酶包括具有如下述SEQ ID NO:11中所示的氨基酸序列的酮还原酶。

MHHHHHPATIVVTGGTKGIGRAIVEKFAKEGFTVLTCARTAGDNFPENVHFFKADLSKKVEVLAFADFIKATVNQVDILVNNTGHFLPGEINNEEEGTLEAMIETNLYSAYYLTRALVGDMITKKEGHIFNICSYASIVPYTSGGSYCISKTAMLAMSRVLREELKPHHVRVTSILPGAVLNDNWAKAELPAELFIAPEDIAQIVWTAHCLPSTTVLEEILIRPTEGDL(SEQ ID NO:11)

在一些实施方式中，本公开内容的改进的酮还原酶基于SEQ ID NO:2、3、4、5、6、7、8、9、10或11的序列式，并且可以包含与参考序列SEQ ID NO:2、3、4、5、6、7、8、9、10或11具有至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。这些差异可以是氨基酸插入、缺失、取代或这些改变的任何组合。在一些实施方式中，氨基酸序列差异可以包括非保守、保守以及非保守和保守氨基酸取代的组合。

其他实施方式提供了包含本文所述的多核苷酸和/或表达载体的宿主细胞。宿主细胞可以是大肠杆菌，或者其可以是不同生物体，如L.brevis。宿主细胞可用于本文所述的酮还原酶的表达和分离，或者，替代地，可以将其直接用于将底物转化为立体异构产物。

无论是用全细胞、细胞提取物还是纯化的酮还原酶进行该方法，都可以使用单一的酮还原酶，或者，可以使用两种或更多种酮还原酶的混合物。

实施方式涉及能够在核苷(特别是氟核苷)的合成中选择性制备手性醇的酮还原酶。在实施方式中，酮还原酶能够进行下述转化：

在特定实施方式中，酮还原酶能够进行下述转化：

需要改进的酶性质包括但不限于酶活性、热稳定性、pH活性曲线、辅因子要求、对抑制剂的不应性(例如，产物抑制)、立体特异性、立体选择性和溶剂稳定性。改进可以涉及单一酶性质，如酶活性，或者酶性质的组合，如酶活性和立体选择性。

下表1提供了本文公开的SEQ ID NO的列表以及相关活性。除非另有说明，否则以下序列是基于SEQ ID NO:1的酮还原酶序列。在下表中，每行列出一个SEQ ID NO。列出突变数(即，残基变化)的列指与SEQ ID NO:1的酮还原酶序列相比的氨基酸取代的数量。在表的转化列中，+表示<10％的底物转化为产物，++表示10-60％转化，+++表示>60％转化。在表的％DE列中，–表示R选择性，+表示<50％S,S-非对映体产物，++表示>50％S,S-非对映体产物。

编码酮还原酶的多核苷酸

在另一个方面中，本公开内容提供了编码本文公开的酮还原酶的多核苷酸。多核苷酸可以与一种或多种控制基因表达的异源调控序列可操作地连接，以产生能够表达多肽的重组多核苷酸。可以将含有编码酮还原酶的异源多核苷酸的表达构建体引入合适的宿主细胞以表达相应的酮还原酶多肽。

由于已知对应于各种氨基酸的密码子，因而蛋白序列的可用性提供了对能够编码受试者的所有多核苷酸的描述。遗传密码的简并性，其中相同的氨基酸由替代或同义密码子编码，允许制造非常大量的核酸，所有这些核酸都编码本文公开的改进的酮还原酶。因此，在鉴定了特定的氨基酸序列后，本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单地修饰一个或多个密码子序列来制造任何数量的不同核酸。在这方面，本公开内容特别地涉及可以通过基于可能的密码子选择来选择组合而产生的多核苷酸的每一种可能的变化，并且所有这些变化都被认为是针对本文公开的任何多肽而具体公开的。

在各种实施方式中，优选选择密码子以适合产生蛋白的宿主细胞。例如，细菌中使用的优选密码子用于在细菌中表达基因；酵母中使用的优选密码子用于在酵母中表达；和哺乳动物中使用的优选密码子用于在哺乳动物细胞中表达。例如，SEQ ID NO:3的多核苷酸已针对在大肠杆菌中的表达进行了密码子优化。

在某些实施方式中，不需要替换所有密码子以优化酮还原酶的密码子使用，因为天然序列将包含优选的密码子，并且因为可能不需要对所有氨基酸残基使用优选的密码子。因此，编码酮还原酶的密码子优化的多核苷酸可以在全长编码区的密码子区域的约40％,50％,60％,70％,80％或大于90％处包含优选的密码子。

在各种实施方式中，可以以多种方式操纵编码改进的酮还原酶多肽的分离的多核苷酸以提供多肽的表达。取决于表达载体，在将分离的多核苷插入载体之前对其进行操纵可能是所需的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域众所周知的。在Sambrook等，2001,Molecular Cloning:A Laboratory Manual，第3版，ColdSpring Harbor Laboratory Press；和Current Protocols in Molecular Biology,Ausubel.F编著，Greene Pub.Associates,1998，更新至2006中提供了指导。

在一些实施方式中，编码本文中任何酮还原酶多肽的分离的多核苷酸以多种方式操纵以促进酮还原酶多肽的表达。在一些实施方式中，编码酮还原酶多肽的多核苷酸包含表达载体，其中存在一个或多个控制序列以调控酮还原酶多核苷酸和/或多肽的表达。根据所使用的表达载体，在将分离的多核苷酸插入载体之前对其进行操纵可能是所需要的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域众所周知的。在一些实施方式中，控制序列尤其包括启动子、前导序列、多腺苷酸化序列、原肽序列、信号肽序列和转录终止子。在一些实施方式中，基于宿主细胞的选择来选择适宜的启动子。对于细菌宿主细胞，用于指导本公开内容的核酸构建体转录的适宜启动子包括但不限于从以下获得的启动子：E.coli lac操纵子、天蓝链酶菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)左旋蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacilluslicheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)青霉素酶基因(penP)、枯草芽孢杆菌(Bacillus subtilis)xylA和xylB基因，以及原核β-内酰胺酶基因(参见例如，Villa-Kamaroff等，Proc.Natl Acad.Sci.USA 75:3727-3731[1978])，以及tac启动子(参见例如，DeBoer等，Proc.Natl Acad.Sci.USA 80:21-25[1983])。丝状真菌宿主细胞的示例性启动子包括但不限于从以下基因获得的启动子：米曲霉(Aspergillusoryzae)TAKA淀粉酶、米黑根毛酶(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉(Aspergillus niger)酸稳定α-淀粉酶、黑曲霉(Aspergillus niger)或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛酶(Rhizomucor miehei)脂肪酶、米曲霉(Aspergillus oryzae)碱性蛋白酶、米曲霉(Aspergillus oryzae)丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰酶样蛋白酶(参见例如，WO 96/00787)，以及NA2-tpi启动子(黑曲霉(Aspergillus niger)中性α-淀粉酶和米曲霉(Aspergillus oryzae)丙糖磷酸异构酶基因启动子的杂交体)，及其突变、截短和杂合启动子。示例性酵母细胞启动子可以来自以下基因：酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵(Saccharomyces cerevisiae)母半乳糖激酶(GAL1)、酿酒酵母(Saccharomycescerevisiae)乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母(Saccharomycescerevisiae)3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子是本领域众所周知的(参见例如，Romanos等，Yeast 8:423-488[1992])。

在一些实施方式中，控制序列也是适宜的转录终止子序列(即，被宿主细胞识别以终止转录的序列)。在一些实施方式中，终止子序列可操作地连接至编码酶多肽的核酸序列的3’末端。在所选宿主细胞中起作用的任何适宜终止子都可用于本发明。丝状真菌宿主细胞的示例性转录终止子可以从以下基因获得：米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)葡糖淀粉酶、构巢曲霉(Aspergillus nidulans)邻氨基苯甲酸合酶、黑曲霉(Aspergillus niger)α-葡糖苷酶和尖孢镰刀菌(Fusarium oxysporum)胰酶样蛋白酶。酵母宿主细胞的示例性终止子可以从以下基因获得：酿酒酵母(Saccharomyces cerevisiae)烯醇化酶、酿酒酵母(Saccharomyces cerevisiae)细胞色素C(CYC1)和酿酒酵母(Saccharomyces cerevisiae)甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用终止子是本领域众所周知的(参见例如，Romanos等，同上)。

在一些实施方式中，控制序列也是适宜的前导序列(即，对宿主细胞翻译很重要的mRNA的非翻译区)。在一些实施方式中，前导序列可操作地连接至编码酮还原酶的核酸序列的5’末端。在所选宿主细胞中起作用的任何适宜的前导序列都可用于本发明。丝状真菌宿主细胞的示例性前导序列可以从以下基因获得：米曲霉(Aspergillus oryzae)TAKA淀粉酶和构巢曲霉(Aspergillus nidulans)丙糖磷酸异构酶。酵母宿主细胞的适宜前导序列可以从以下基因获得：酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母(Saccharomyces cerevisiae)3-磷酸甘油酸激酶、酿酒酵母(Saccharomyces cerevisiae)α因子和酿酒酵母(Saccharomyces cerevisiae)乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

在一些实施方式中，控制序列也是多聚腺苷酸化序列(即，可操作地连接至核酸序列的3’末端的序列，并且在转录时被宿主细胞识别为向转录的mRNA添加多聚腺苷残基的信号)。在所选宿主细胞中起作用的任何适宜的多聚腺苷酸化序列均可用于本发明。丝状真菌宿主细胞的示例性腺苷酸化序列包括但不限于以下的基因：米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)葡糖淀粉酶、构巢曲霉(Aspergillus nidulans)邻氨基苯甲酸合酶、尖孢镰刀菌(Fusarium oxysporum)胰酶样蛋白酶和黑曲霉(Aspergillus niger)α-葡糖苷酶。酵母宿主细胞的有用多聚腺苷酸化序列是公知的(参见例如，Guo和Sherman,Mol.Cell.Biol.,15:5983-5990[1995])。

在一些实施方式中，控制序列也是信号肽(即，编码与多肽氨基末端连接的氨基酸序列的编码区，并且将编码的多肽引导到细胞的分泌途径中)。在一些实施方式中，核酸序列编码序列的5’末端固有地含有信号肽编码区，该信号肽编码区在翻译阅读框中与编码分泌多肽的编码区区段天然连接。或者，在一些实施方式中，编码序列的5’末端含有与编码序列无关的信号肽编码区。指导表达的多肽进入所选宿主细胞的分泌途径的任何适宜的信号肽编码区都可用于表达一个或多个工程化多肽。细菌宿主细胞的有效信号肽编码区是以下信号肽编码区，包括但不限于，从以下基因获得的那些，芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacillus licheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌(Bacillus licheniformis)β-内酰胺酶、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌(Bacillus subtilis)prsA。其他信号肽是本领域公知的(参见例如，Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。在一些实施方式中，丝状真菌宿主细胞的有效信号肽编码区包括但不限于从以下基因获得的信号肽编码区：米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)中性淀粉酶、黑曲霉(Aspergillus niger)葡糖淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和胎毛腐质霉(Humicola lanuginosa)脂肪酶。酵母宿主细胞的有用信号肽包括但不限于来自以下基因的那些：酿酒酵母(Saccharomycescerevisiae)α因子和酿酒酵母(Saccharomyces cerevisiae)转化酶。

在一些实施方式中，也使用了调控序列。这些序列促进了多肽表达相对于宿主细胞生长的调控。调控系统的实例是那些导致基因表达响应于化学或物理刺激而开启或关闭的系统，包括存在调控化合物。在原核宿主细胞中，适宜的调控序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中，适宜的调控系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中，适宜的调控系统包括但不限于TAKAα-淀粉酶启动子、黑曲霉(Aspergillus niger)葡糖淀粉酶启动子和米曲霉(Aspergillus oryzae)葡糖淀粉酶启动子。

在另一个方面中，本发明涉及一种重组表达载体，其包含编码酮还原酶多肽的多核苷酸，以及一个或多个表达调控区，如启动子和终止子、复制原点等，这取决于其将被引入的宿主的类型。在一些实施方式中，将本文所述的各种核酸和控制序列连接在一起以产生重组表达载体，其中包括一个或多个方便的限制性位点以允许在这些位点插入或取代编码酶多肽的核酸序列。或者，在一些实施方式中，本发明的核酸序列通过将核酸序列或包含该序列的核酸构建体插入到适宜的表达载体中来表达。在涉及产生表达载体的一些实施方式中，编码序列位于载体中，使得编码序列与适宜的控制序列可操作地连接以用于表达。

重组表达载体可以是任何适宜载体(例如，质粒或病毒)，其可以方便地进行重组DNA程序并引起酶多核苷酸序列的表达。载体的选择通常取决于载体与要引入载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。

在一些实施方式中，表达载体是自主复制载体(即，作为染色体外实体存在的载体，其复制独立于染色体复制，如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含任何确保自我复制的手段。在一些替代实施方式中，载体是这样一种载体，当被引入宿主细胞时，其被整合到基因组中，并与其所整合的一个或多个染色体一起复制。此外，在一些实施方式中，使用单个载体或质粒，或者两个或更多个载体或质粒，其一起包含将被引入宿主细胞基因组的总DNA和/或转座子。

在一些实施方式中，表达载体包含一个或多个选择标记物，其可以容易地选择转化的细胞。“选择标记物”是基因，其产物提供生物杀伤剂或病毒抗性、对重金属的抗性、原养型到营养缺陷型等。细菌选择标记物的实例包括但不限于来自枯草芽孢杆菌(Bacillussubtilis)或地衣芽孢杆菌(Bacillus licheniformis)的dal基因，或者赋予抗生素抗性(如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的标记物。酵母宿主细胞的适宜标记物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记物包括但不限于amdS(乙酰胺酶；例如，来自A.nidulans或A.orzyae)、argB(鸟氨酸氨基甲酰基转移酶)、bar(膦丝菌素乙酰转移酶；例如，来自S.hygroscopicus)，hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)，pyrG(乳清酸-5’-磷酸脱羧酶；例如，来自A.nidulans或A.orzyae)，sC(硫酸腺苷转移酶)和trpC(邻氨基苯甲酸合酶)，及其等效物。

在另一个方面中，本发明提供了一种宿主细胞，其包含至少一种编码本发明的至少一种酮还原酶的多核苷酸，该多核苷酸与一个或多个控制序列可操作地连接，用于在宿主细胞中表达至少一种酮还原酶。适于表达由本发明的表达载体编码的多肽的宿主细胞是本领域众所周知的，并且包括但不限于细菌细胞，如E.coli、河流弧菌(Vibriofluvialis)、链霉菌(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞；真菌细胞，如酵母细胞(例如，酿酒酵母(Saccharomyces cerevisiae)或毕赤酵母(Pichiapastoris)(ATCC登录号201178))。示例性宿主细胞还包括各种大肠杆菌菌株(例如，W3110(ΔfhuA)和BL21)。细胞选择标记物的实例包括但不限于来自枯草芽孢杆菌(Bacillussubtilis)或地衣芽孢杆菌(Bacillus licheniformis)的dal基因，或者赋予抗生素抗性如氨苄青霉素、卡那霉素、氯霉素和/或四环素抗性的标记物。

在一些实施方式中，本发明的表达载体包含允许载体整合到宿主细胞基因组中或载体在细胞中不依赖于基因组自我复制的一个或多个元件。在涉及整合到宿主细胞基因组中的一些实施方式中，载体依赖于编码多肽的核酸序列或载体的任何其他元件，以通过同源或非同源重组将载体整合到基因组中。

在一些替代实施方式中，表达载体包含其他核酸序列，其用于指导通过同源重组整合到宿主细胞基因组中。其他核酸序列使载体能够在一个或多个染色体中的一个或多个精确位置整合到宿主细胞基因组中。为增加在精确位置整合的可能性，整合元件优选包含足够数量的核苷酸，如100至10,000个碱基对，优选400至10,000个碱基对，以及更优选800至10,000个碱基对，其与相应的靶序列高度同源，以提供同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码或编码核酸序列。另一方面，载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制，载体可以进一步包含使载体能够在所讨论的宿主细胞中自主复制的复制原点。细菌复制原点的实例是允许在大肠杆菌中复制的P15A ori或质粒pBR322、pUC19、pACYCl77(其包含P15A ori)或pACYC184(其包含P15A ori)的复制原点，以及允许在芽孢杆菌中复制的pUB110、pE194或pTA1060。用于酵母宿主细胞的复制原点的实例是2微米复制原点、ARS1、ARS4、ARS1和CEN3的组合以及ARS4和CEN6的组合。复制原点可以是具有突变的复制原点，该突变使其功能在宿主细胞中对温度敏感(参见例如，Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433[1978])。

在一些实施方式中，将多于一个拷贝的本发明核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可以通过将至少一个额外的序列拷贝整合到宿主细胞基因组中或通过在其中细胞包含选择标记物基因的可扩张拷贝的核酸序列中包含可扩增的可选择标记基因来获得，因此可以通过在适宜的选择剂存在下培养细胞来选择核酸序列的额外拷贝。

用于本发明的很多表达载体是可商购的。适宜的商业表达载体包括但不限于

pET大肠杆菌T7表达载体(Millipore Sigma)和p3xFLAGTM^TM表达载体(Sigma-Aldrich Chemicals)。其他适宜表达载体包括但不限于pBluescriptII SK(-)和pBK-CMV(Stratagene)，以及来自pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly的质粒(参见例如，Lathe等，Gene 57:193-201[1987])。

因此，在一些实施方式中，将包含编码至少一种变体酮还原酶的序列的载体转化到宿主细胞中，以允许载体的增殖和一种或多种变体酮还原酶的表达。在一些实施方式中，在允许一种或多种变体酮还原酶表达的条件下，在适宜营养培养基中培养上述转化的宿主细胞。可用于培养宿主细胞的任何适宜培养基都可用于本发明，包括但不限于含有适宜补充剂的基础或复杂培养基。在一些实施方式中，宿主细胞在HTP培养基中生长。适宜的培养基可以从各种商业供应商处获得，或者可以根据公布的配方制备(例如，在美国典型培养物保藏中心的目录中)。

用于表达酮还原酶的宿主细胞

在另一个方面中，本公开内容提供了一种宿主细胞，其包含编码本公开内容的改进的酮还原酶多肽的多核苷酸，该多核苷酸可操作地连接至一个或多个控制序列，以在宿主细胞中表达酮还原酶。用于表达由本发明的表达载体编码的酮还原酶多肽的宿主细胞是本领域众所周知的，并且包括但不限于细菌细胞，如大肠杆菌、B.枯草芽孢杆菌属(B.subtilis)、地衣芽孢杆菌(B.licheniformis)、巨大芽孢杆菌(B.megaterium)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克氏乳杆菌(Lactobacillus kejir)、短乳杆菌(Lactobacillus brevis)、小乳酸杆菌(Lactobacillus minor)、链霉菌(Streptomyces)和鼠伤寒沙门氏菌(Salmonellatyphimurium)细胞；真菌细胞，如酵母细胞(例如，酿酒酵母(Saccharomyces cerevisiae)或毕赤酵母(Pichia pastoris)(ATCC登录号201178))。上述宿主细胞的适宜培养基和生长条件是本领域众所周知的。

可通过本领域公知的各种方法将用于表达酮还原酶的多核苷酸引入细胞中。技术尤其包括电穿孔、基因枪粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。将多核苷酸引入细胞的各种方法对于技术人员来说是显而易见的。

在本发明的一些实施方式中，丝状真菌宿主细胞是任何适宜的属和种，包括但不限于，绵霉属(Achlya)、支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢子菌属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、蒂腐菌属(Diplodia)、Endothis、镰刀菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉菌属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨形孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉菌属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉菌(Scytalidium)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)和/或小包脚菇属(Volvariella)和/或有形体，或无形体，及其同义词、基名或分类学等效物。

在本发明的一些实施方式中，宿主细胞是酵母细胞，包括但不限于念珠菌属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)种的细胞。在本发明的一些实施方式中，酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母(Saccharomyces cerevisiae)、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、诺本酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyces kluyveri)、裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichiafinlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜蹼毕赤酵母(Pichia membranaefaciens)、仙人掌毕赤酵母(Pichia opuntiae)、耐热毕赤酵母(Pichiathermotolerans)、柳毕赤酵母(Pichia salictaria)、Pichia quercuum、皮杰普氏毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichiamethanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyceslactis)、白色念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowia lipolytica)。

在一些其他实施方式中，宿主细胞是原核细胞。适宜的原核细胞包括但不限于革兰氏阳性、革兰氏阴性和革兰氏变异细菌细胞。任何适宜的宿主生物体都可以用于本发明，包括但不限于农杆菌属(Agrobacterium)、脂环酸杆菌属(Alicyclobacillu)、鱼腥藻属(Anabaena)、无囊菌属(Anacystis)、不动杆菌属(Acinetobacter)、嗜酸菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布氏菌属(Buchnera)、蘑菇属(Campestris)、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、大肠杆菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭菌属(Fusobacterium)、粪杆菌属(Faecalibacterium)、弗朗西斯菌属(Francisella)、黄杆菌属(Flavobacterium)、土杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、肠杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属(Methylobacterium)、分枝杆菌属(Mycobacterium)、奈瑟氏菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球菌属(Prochlorococcus)、红杆菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属(Rhodopseudomonas)、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、聚球菌属(Synecoccus)、糖单胞菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、热厌氧菌属(Thermoanaerobacterium)、Tropheryma、土拉菌属(Tularensis)、Temecula、嗜热聚球菌(Thermosynechococcus)、嗜热球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木霉属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施方式中，宿主细胞是以下属种：农杆菌属(Agrobacterium)、不动杆菌属(Acinetobacter)、固氮杆菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、布氏杆菌属(Buchnera)、土杆菌属(Geobacillus)、弯曲杆菌属(Campylobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、大肠杆菌属(Escherichia)、肠球菌属(Enterococcus)、欧文氏菌属(Erwinia)、黄杆菌属(Flavobacterium)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、葡萄球菌属(Staphylococcus)、沙门氏菌属(Salmonella)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)或发酵单胞菌属(Zymomonas)。在一些实施方式中，细菌宿主菌株对人是非致病性的。在一些实施方式中，细菌宿主菌株是工业菌株。很多细菌工业菌株是已知的并且适用于本发明。在本发明的一些实施方式中，细菌宿主细胞是农杆菌属种(例如，A.radiobacter、A.rhizogenes和A.rubi)。在本发明的一些实施方式中，细菌宿主细胞是节杆菌属种(例如，A.aurescens、A.citreus、A.globiformis、A.hydrocarboglutamicus、A.mysorens、A.nicotianae、A.paraffineus、A.protophonniae、A.roseoparqffinus、A.sulfureus和A.ureafaciens)。在本发明的一些实施方式中，细菌宿主细胞是芽孢杆菌属种(例如，B.thuringensis、B.anthracis、B.megaterium、B.subtilis、B.lentus、B.circulans、B.pumilus、B.lautus、B.coagulans、B.brevis、B.firmus、B.alkaophius、B.licheniformis、B.clausii、B.stearothermophilus、B.halodurans和B.amyloliquefaciens)。在一些实施方式中，宿主细胞是工业芽孢杆菌菌株，包括但不限于B.subtilis、B.pumilus、B.licheniformis、B.megaterium、B.clausii、B.stearothermophilus或B.amyloliquefaciens。在一些实施方式中，芽孢杆菌宿主细胞是B.subtilis、B.licheniformis、B.megaterium、B.stearothermophilus和/或B.amyloliquefaciens。在一些实施方式中，细菌宿主细胞是梭菌属种(例如，C.acetobutylicum、C.tetani E88、C.lituseburense、C.saccharobutylicum、C.perfringens和C.beijerinckii)。在一些实施方式中，细菌宿主细胞棒状杆菌属种(例如，C.glutamicum和C.acetoacidophilum)。在一些实施方式中，细菌宿主细胞是大肠杆菌属种(例如，大肠杆菌)。在一些实施方式中，宿主细胞是大肠杆菌W3110。在一些实施方式中，宿主是大肠杆菌BL21或BL21(DE3)。在一些实施方式中，细菌宿主细胞是欧文氏菌属种(例如，E.uredovora、E.carotovora、E.ananas、E.herbicola、E.punctata和E.terreus)。在一些实施方式中，细菌宿主细胞是泛菌属种(例如，P.citrea和P.agglomerans)。在一些实施方式中，细菌宿主细胞是假单胞菌属(例如，P.putida、P.aeruginosa、P.mevalonii和P.sp.D-0l 10)。在一些实施方式中，细菌宿主细胞是链球菌属种(例如，S.equisimiles、S.pyogenes和S.uberis)。在一些实施方式中，细菌宿主细胞是链霉菌属种(例如，S.ambofaciens、S.achromogenes、S.avermitilis、S.coelicolor、S.aureofaciens、S.aureus、S.fungicidicus、S.griseus和S.lividans)。在一些实施方式中，细菌宿主细胞是发酵单胞菌属物种(例如，Z.mobilis和Z.lipolytica)。

可用于本发明的很多原核和真核菌株是公众易于从很多培养物保藏中心获得的，如美国典型培养物保藏中心(ATCC)、德国微生物和细胞培养物保藏中心(DSM)、中央真菌培养局(CBS)和农业研究服务专利培养物保藏中心，北方地区研究中心(NRRL)。

在一些实施方式中，宿主细胞被基因修饰以具有改善蛋白分泌、蛋白稳定性和/或蛋白表达和/或分泌所需的其他性质的特征。基因修饰可以通过基因工程技术和/或经典微生物技术(例如，化学或UV诱变和随后的选择)来实现。事实上，在一些实施方式中，将重组修饰和经典选择技术的组合用于产生宿主细胞。使用重组技术，可以以导致宿主细胞和/或培养基中的酮还原酶变体产量增加的方式引入、缺失、抑制或修饰核酸分子。在一种基因工程方法中，将同源重组用于通过在体内特异性靶向基因以抑制编码蛋白的表达来诱导靶向基因修饰。在替代方法中，siRNA、反义和/或核酶技术可用于抑制基因表达。本领域已知多种用于降低细胞中蛋白表达的方法，包括但不限于缺失编码蛋白的全部或部分基因和位点特异性诱变以破坏基因产物的表达或活性。(参见例如，Chaveroche等，Nucl.Acids Res.,28:22e97[2000]；Cho等，Molec.Plant Microbe Interact.,19:7-15[2006]；Maruyama和Kitamoto,Biotechnol.Lett.,30:1811-1817[2008]；Takahashi等，Mol.Gen.Genom.,272:344-352[2004]；和You等，Arch.Microbiol.,191:615-622[2009]，其全部内容均通过引用并入本文)。随机诱变，然后筛选所需的突变也是有用的(参见例如，Combier等，FEMSMicrobiol.Lett.,220:141–8[2003]；和Firon等，Eukary.Cell2:247–55[2003]，其全部内容均通过引用并入本文)。

可以使用本领域公知的任何适宜方法将载体或DNA构建体引入宿主细胞，包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、PEG介导的转化、电穿孔或本领域公知的其他常规技术。

在一些实施方式中，将本发明的工程化宿主细胞(即，“重组宿主细胞”)在常规营养培养基中培养，该培养基经过适当改良以激活启动子、选择转化体或扩增酮还原酶多核苷酸。培养条件，如温度、pH等，是此前与选择用于表达的宿主细胞一起使用的那些，并且是本领域技术人员熟知的。如前所述，很多标准参考文献和本文可用于很多细胞的培养和生产，包括细菌、植物、动物(特别是哺乳动物)和古细菌来源的细胞。

在一些实施方式中，表达本发明的酮还原酶的细胞在分批或连续发酵条件下生长。经典“分批发酵”是封闭系统，其中培养基的成分在发酵开始时就设定好了，在发酵过程中不受人为改变。分批系统的变体是“补料分批发酵”，其也可以用于本发明。在这种变化中，底物随着发酵的进行而增加。当分解代谢物抑制可能抑制细胞的新陈代谢并且需要在培养基中具有有限量的底物时，分批补料系统是有用的。分批和补料分批发酵在本领域中是常见的和众所周知的。“连续发酵”是开放系统，其中将确定的发酵培养基连续添加到生物反应器中，同时去除等量的条件培养基以促进反应进程。连续发酵通常将培养物维持在恒定高密度，其中细胞主要处于对数生长期。连续发酵系统力求保持稳定的生长条件。针对连续发酵过程调节营养物和生长因子的方法以及使产物形成速率最大化的技术在工业微生物学领域是众所周知的。

可以将多于一个拷贝的本发明核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可以通过将至少一个额外的序列拷贝整合到宿主细胞基因组中或通过在核酸序列中包含可扩增的可选择标记基因来获得，其中细胞含有可选择标记的扩增拷贝，可以通过在适宜的选择剂存在下培养细胞来选择标记基因，从而选择核酸序列的额外拷贝。

在本发明的一些实施方式中，无细胞转录和翻译系统可用于产生酮还原酶。几种系统是可商购的，并且这些方法是本领域技术人员熟知的。

进化酮还原酶的方法

在一些实施方式中，为制备本公开内容的酮还原酶，从大肠杆菌中获得(或衍生)催化还原反应的酮还原酶。在一些实施方式中，亲本多核苷酸序列经过密码子优化以增强酮还原酶在特定宿主细胞中的表达。命名为SEQ ID NO:1的亲本多核苷酸序列被密码子优化以在大肠杆菌中表达，并且将密码子优化的多核苷酸克隆到表达载体中，将酮还原酶基因的表达置于T7启动子的控制之下。表达目的基因所需的T7聚合酶受lac启动子的控制，目的基因和T7聚合酶都受到lacl抑制。IPTG的存在激活T7激活酶产生并消除抑制，导致酮还原酶基因的产生。鉴定在大肠杆菌中表达活性酮还原酶的克隆，并对基因进行测序以确认其身份。

本公开内容的酮还原酶可以通过使用编码亲本序列的多核苷酸经诱变和/或定向进化方法获得。示例性定向进化技术是诱变和/或DNA改组，如在Stemmer,1994,Proc.Natl.Acad.Sci.USA 91:10747-10751；WO 95/22625；WO 97/20078；WO 97/35966；WO98/27230；WO 00/42651；WO 01/75767和美国专利号6,537,746中描述的。可以使用的其他定向进化程序尤其包括交错延伸过程(StEP)、体外重组(Zhao等，1998,Nat.Biotechnol.16:258-261)、诱变PCR(Caldwell等，1994,PCR Methods Appl.3:S136-S140)和表达盒诱变(Black等，1996,Proc.Natl.Acad.Sci.USA 93:3525-3529)。

对诱变处理后获得的克隆筛选具有所需改进酶特性的酮还原酶。可以使用用于测量底物和产物的标准化学分析技术(如UPLC-MS)以及监测NADH降低率(通过吸光度或荧光减少)或NADPH浓度(因为其转化成NAD+或NADP+)的标准生化技术从表达文库中测量酶活性。在该反应中，NADH或NADPH被酮还原酶消耗(氧化)，因为酮还原酶将酮底物还原为相应的羟基。每单位时间通过吸光度或荧光减少测量的NADH或NADPH浓度的降低速率表明酮还原酶多肽在固定量的裂解物(或由其制成的冻干粉)中的相对(酶促)活性。当所需改进的酶性质是热稳定性的情况下，酶活性可以在使酶制剂经受确定的温度并测量热处理后剩余的酶活性的量之后测量。然后分离含有编码酮还原酶的多核苷酸的克隆，测序以鉴定核苷酸序列变化(如果有的话)，并用于在宿主细胞中表达酶。

在已知多肽序列的情况下，编码酶的多核苷酸可以根据已知的合成方法通过标准固相方法制备。在一些实施方式中，最多约100个碱基的片段可以单独合成，然后连接(例如，通过酶促或化学连接法，或者聚合酶介导的方法)以形成任何所需的连续序列。例如，可以通过化学合成制备本发明的多核苷酸和寡核苷酸，例如，使用经典亚磷酰胺法，由Beaucage等，1981,Tet.Lett.22:1859-69描述的，或者由Matthes等，1984,EMBO J.3:801-05描述的方法，例如，因为其通常在自动合成方法中实践。根据亚磷酰胺法，例如，在自动DNA合成仪中合成寡核苷酸，在适当在载体中纯化、退火、连接和克隆。此外，基本上任何核酸都可以从多种商业来源中的任何一种获得，如The Midland Certified ReagentCompany,Midland,Tex.，The Great American Gene Company,Ramona,Calif.，ExpressGenInc.Chicago,Ill.，Operon Technologies Inc.,Alameda,Calif.和很多其他公司。

在宿主细胞中表达的酮还原酶可以使用任何一种或多种用于蛋白纯化的众所周知的技术从细胞和/或培养基中回收，其中包括溶菌酶处理、超声处理、过滤、盐析、超声-离心和色谱法。用于从细菌如大肠杆菌中裂解和高效提取蛋白的适宜溶液是市售的，可以商品名

购自St.Louis Mo的Sigma-Aldrich。

用于分离酮还原酶多肽的色谱技术包括反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱等。用于纯化特定酶的条件将部分取决于诸如净电荷、疏水性、亲水性、分子量、分子性状等因素，并且对于本领域技术人员而言是显而易见的。

在一些实施方式中，亲和技术可用于分离改进的酮还原酶。对于亲和层析纯化，可以用识别序列标记蛋白序列以实现纯化。常见标签包括纤维素结合结构域、多聚His标签、二His螯合物、FLAG-标签和本领域技术人员显而易见的很多其他标签。也可以将抗体作为亲和纯化试剂。可以使用特异性结合酮还原酶多肽的任何抗体。

使用酮还原酶的方法

本文所述的酮还原酶可以催化式(I-2)的底物化合物：

还原成式(I-3)的相应异构体产物：

在特定实施方式中，本文所述的酮还原酶可以催化底物化合物N-(7-((2S,4R,5R)-4-氟-3,3-二羟基-5-(羟甲基)四氢呋喃-2-基)-4-氧代-4,7-二氢-3H-吡咯并[3,2-d]嘧啶-2-基)异丁酰胺(化合物A)：

还原成相应异构体产物N-(9-((2R,3S,4S,5R)-4-氟-3-羟基-5-(羟甲基)四氢呋喃-2-基)-6-氧代-6,9-二氢-1H-嘌呤-2-基)异丁酰胺(化合物B)：

在一些实施方式中，用于将化合物A还原为化合物B的方法包括在适于将化合物A还原或转化为化合物B的反应条件下使底物与本文公开的酮还原酶接触或孵育。化合物B是合成(O-{[(2R,3S,4S,5R)-5-(2-氨基-6-氧化-9H-嘌呤-9-基)-3-氟-4-羟基氧杂环戊烷-2基]甲基}硫代磷酸三钠水合物(1:6))的中间体，也称为3’-氟-硫代-鸟苷一磷酸或3’-F-硫代-GMP。因此，在合成3’-F-硫代-GMP的方法中，该方法可以包括使用本文公开的酮还原酶将化合物A转化为化合物B的步骤。在一些实施方式中，与相应(R)醇产物相比，产物具有大于约99％、99.1％、99.2％、99.3％、99.4％、99.5％、99.6％、60 99.7％、99.8％或99.9％的立体过量。

如本文所述，在一些实施方式中，酮还原酶可以包含与包含SEQ ID NO：2、3、4、5、6、7、8、9、10或11的序列的参考序列相比具有至少约85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的氨基酸序列。在一些实施方式中，这些酮还原酶多肽可以对SEQ ID NO：2、3、4、5、6、7、8、9、10或11的氨基酸序列具有一个或多个修饰。修饰可以包含取代、缺失和插入。修饰可以是非保守取代、保守取代或非保守取代和保守取代的组合。

在用于将底物还原成产物的方法的一些实施方式中，底物以大于约99％的立体过量被还原为产物，其中酮还原酶多肽包含对应于SEQ ID NO：2、3、4、5、6、7、8、9、10或11的序列。

在用于将底物还原成产物的该方法的另一个实施方式中，当使用大于约100g/L的底物和小于约5g/L的多肽进行时，至少约95％的底物在小于约24小时内转化为产物，其中多肽包含对应于SEQ IDNO:2、3、4、5、6、7、8、9、10或11的氨基酸序列。

如本领域技术人员所知的，酮还原酶催化的还原反应通常需要辅因子。由本文所述的酮还原酶催化的还原反应通常也需要辅因子，尽管工程化酮还原酶的很多实施方式比用野生型酮还原酶催化的反应需要的辅因子少得多。如本文所用，术语“辅因子”指与酮还原酶结合起作用的非蛋白化合物。适用于本文所述的工程化酮还原酶的辅因子包括但不限于NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、NADPH(NADP+的还原形式)、NAD+(烟酰胺腺嘌呤二核苷酸)和NADH(NAD+的还原形式)。通常，将还原形式的辅因子添加到反应混合物中。还原的NAD(P)H形式可以任选地使用辅因子再生系统从氧化的NAD(P)+形式再生。

术语“辅因子再生系统”指参与还原辅因子氧化形式(例如，NADP+至NADPH)的反应的一组反应物。由酮还原酶催化的酮底物还原所氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包含化学计量还原剂，该还原剂是还原氢当量的来源并且能够还原辅因子的氧化形式。辅因子再生系统可以进一步包含催化剂，例如催化还原剂对氧化形式的辅因子进行还原的酶催化剂。分别从NAD+或NADP+再生NADH或NADPH的辅因子再生系统是本领域公知的，并且可用于本文所述的方法中。

可以使用的适宜示例性辅因子再生系统包括但不限于葡萄糖和葡萄糖脱氢酶、甲酸和甲酸脱氢酶、葡萄糖-6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇(例如，异丙醇)和仲醇脱氢酶、亚磷酸和亚磷酸脱氢酶、分子氢和氢化酶等。这些系统可以与作为辅因子的NADP+/NADPH或NAD+/NADH组合使用。使用氢化酶的电化学再生也可以用作辅因子再生系统。参见例如，美国专利号5,538,867和6,495,023，这两者均通过引用并入本文。包含金属催化剂和还原剂(例如，分子氢或甲酸盐)的化学辅因子再生系统也是适宜的。参见例如，PCT公开号WO 2000/053731，其通过引用并入本文。

术语“葡萄糖脱氢酶”和“GDH”在本文中可互换使用，指NAD+或NADP+依赖性酶，其分别催化D-葡萄糖和NAD+或NADP+转化为葡糖酸和NADH或NADPH。

适用于实施本文所述方法的葡萄糖脱氢酶包括天然存在的葡萄糖脱氢酶以及非天然存在的葡萄糖脱氢酶。文献中已经报道了天然存在的葡萄糖脱氢酶编码基因。例如，将枯草芽孢杆菌(Bacillus subtilis)61297GDH基因在大肠杆菌中表达，据报道其物理化学性质与其天然宿主中产生的酶相同(Vasantha等，1983,Proc.Natl.Acad.Sci.USA 80:785)。B.subtilis GDH基因的基因序列，对应于Genbank登录号M12276，由Lampel等，1986,J.Bacterial.166:238-243报道，并由Yamane等1996,Microbiology 142:3047-3056作为Genbank登录号D50453提供了校正形式。天然存在的GDH基因还包括编码来自B.cereusATCC 14579(Nature,2003,423:87-91；Genbank登录号AE017013)和B.megaterium(Eur.J.Biochem.,1988,174:485-490,Genbank登录号X12370；J.Ferment.Bioeng.,1990,70:363-369，Genbank登录号GI216270)的GDH的那些。在PCT公开WO 2005/018579中提供了来自芽孢杆菌属的葡萄糖脱氢酶，其公开内容通过引用并入本文。

可以使用公知方法产生非天然存在的葡萄糖脱氢酶，比如，例如，诱变、定向进化等。具有适宜活性的GDH酶，无论是天然存在的还是非天然存在的，都可以由本领域普通技术人员容易地鉴定，包括使用PCT公开WO 2005/018579的实施例4中描述的测定，其公开内容通过引用并入本文。

本文所述的酮还原酶催化的还原反应通常在溶剂中进行。适宜的溶剂包括水、有机溶剂(例如，乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)和离子液体(例如，1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓六氟磷酸盐等)。在一些实施方式中，使用水性溶剂，包括水和水性共溶剂系统。

示例性水性共溶剂系统具有水和一种或多种有机溶剂。在通常情况下，选择水性共溶剂系统的有机溶剂组分，以使得其不会完全灭活酮还原酶。适宜的共溶系统可以通过使用酶活性测定法，如本文所述的那些，通过在候选溶剂系统中测量特定的工程化酮还原酶与确定的目标底物的酶活性来容易地鉴定。

水性共溶剂系统的有机溶剂组分可以与水性组分混溶，提供单一液相，或者可以与水性组分部分混溶或不混溶，提供两个液相。通常，当使用水性共溶剂系统时，将其选择为双相，水分散在有机溶剂中，反之亦然。通常，当使用水性共溶剂系统时，希望选择可以容易地与水相分离的有机溶剂。在通常情况下，在共溶剂系统中水与有机溶剂的比例通常在约90:10至约10:90(v/v)有机溶剂比水的范围内，并且有机溶剂比水介于80:20至20:80(v/v)之间。共溶剂系统可以在加入反应混合物之前预先形成，或者其可以在反应容器中原位形成。

水性溶剂(水或水性共溶剂系统)可以是pH缓冲的或非缓冲的。通常，还原可以在约10或更低的pH下进行，通常在约5至约10的范围内。在一些实施方式中，还原在约9或更低的pH下进行，通常在约5至约9的范围内。在一些实施方式中，还原在约8或更低的pH下进行，通常在约5至约8的范围内，并且通常在约6至约8的范围内。还原还可以在约7.8或更低，或者7.5或更低的pH下进行。或者，还原可以在中性pH，即约7下进行。

在还原反应过程中，反应混合物的pH可能会发生变化。通过在反应过程中添加酸或碱，可以将反应混合物的pH保持在所需的pH或在所需的pH范围内。或者，pH可以通过使用包含缓冲剂的水性溶剂来控制。维持所需pH范围的适宜缓冲剂是本领域公知的，并且包括例如磷酸盐缓冲剂、三乙醇胺缓冲剂等。也可以使用缓冲和酸或碱添加的组合。

当使用葡萄糖/葡萄糖脱氢酶辅因子再生系统时，如果不以其他方式中和所得葡糖酸水溶液，则方程式(1)中所示葡糖酸共产生(pKa＝3.6)导致反应混合物的pH下降。可以通过标准缓冲技术将反应混合物的pH保持在所需水平，其中缓冲液中和葡糖酸直至提供的缓冲能力，或者通过在转化过程中同时添加碱。也可以使用缓冲和碱添加的组合。上文描述了维持所需pH范围的适宜缓冲剂。用于中和葡糖酸的适宜碱是有机碱，例如胺、醇盐等，以及无机碱，例如，氢氧化物盐(例如，NaOH)、碳酸氢盐(例如，NaHCO₃)、碳酸盐(例如，K₂CO₃)、碱性磷酸盐(例如，K₂HPO4，Na₃PO₄)等。在转化过程中加入碱可以手动完成，同时监测反应混合物的pH值，或者更方便地，使用自动滴定仪作为pH调节器。部分缓冲能力和碱添加的组合也可用于过程控制。

当使用碱添加来中和在酮还原酶催化的还原反应期间释放的葡糖酸时，可以通过添加碱的量来监测转化的进程以维持pH。通常，在还原过程中添加到未缓冲或部分缓冲的反应混合物中的碱是在水溶液中添加的。

在一些实施方式中，辅因子再生系统可以包含甲酸脱氢酶。术语“甲酸脱氢酶”和“FDH”在本文中可互换使用，指NAD+或NADP+依赖性酶，其分别催化甲酸和NAD+或NADP+转化为二氧化碳和NADH或NADPH。适合用作本文所述的酮还原酶催化的还原反应中的辅因子再生系统的甲酸脱氢酶包括天然存在的甲酸脱氢酶以及非天然存在的甲酸脱氢酶。甲酸脱氢酶包括对应于PCT公开WO2005/018579的SEQ ID NO：70(假单胞菌属)和72(博伊丁假丝酵母)的那些，其分别由对应于PCT公开WO 2005/018579的SEQ IDNO：69和71的多核苷酸序列编码，其公开内容通过引用并入本文。在本文所述的方法中使用的甲酸脱氢酶，无论是天然存在的还是非天然存在的，都可以显示出至少约1μmol/min/mg，有时至少约10μmol/min/mg，或至少约10²μmol/min/mg，高达约10³μmol/min/mg或更高的活性，并且可以容易地在PCT公开WO 2005/018579的实施例4中描述的测定中筛选活性。

如本文所用，术语“甲酸盐”指甲酸盐阴离子(HCO₂ ^-)、甲酸(HCO₂H)及其混合物。甲酸盐可以盐的形式提供，通常是碱金属盐或铵盐(例如，HCO₂Na、KHCO₂NH₄等)，以甲酸形式提供，通常是甲酸水溶液，或其混合物。甲酸是中等强度的酸。在其pKa的几个pH单位内的水溶液中(水中pKa＝3.7)，甲酸盐以平衡浓度的HCO₂ ^-和HCO₂H形式存在。在高于约pH4的pH值下，甲酸盐主要以HCO₂ ^-形式存在。当甲酸盐以甲酸形式提供时，通常通过添加碱来缓冲反应混合物或降低其酸性以提供所需的pH，通常为约pH 5或更高。用于中和甲酸的适宜碱包括但不限于有机碱，例如胺、醇盐等，以及无机碱。当使用葡萄糖/葡萄糖脱氢酶辅因子再生系统时，如果不以其他方式中和所得葡糖酸水溶液，则方程式(1)中所示葡糖酸共产生(pKa＝3.6)导致反应混合物的pH下降。可以通过标准缓冲技术将反应混合物的pH保持在所需水平，其中缓冲液中和葡糖酸直至提供的缓冲能力，或者通过在转化过程中同时添加碱。也可以使用缓冲和碱添加的组合。上文描述了维持所需pH范围的适宜缓冲剂。用于中和的适宜碱，例如，氢氧化物盐(例如，NaOH)、碳酸氢盐(例如，NaHCO₃)、碳酸盐(例如，K₂CO₃)、碱性磷酸盐(例如，K₂HPO4，Na₃PO₄)等。

当使用甲酸和甲酸脱氢酶作为辅因子再生系统时，可以通过标准缓冲技术将反应混合物的pH值保持在所需水平，其中缓冲剂释放质子达到所提供的缓冲能力，或通过在转化过程中同时添加酸。在反应过程中添加以维持pH的适宜酸包括有机酸，例如羧酸、磺酸、膦酸等，无机酸，例如氢卤酸(如盐酸)、硫酸、膦酸等，酸式盐，例如氢卤酸(如盐酸)、硫酸、磷酸等，酸式盐，例如磷酸二氢盐(例如，KH₂PO₄)、硫酸氢盐(例如，NaHSO₄)等。一些实施方案利用甲酸，由此维持溶液的甲酸盐浓度和pH。

当在使用甲酸/甲酸脱氢酶辅因子再生系统的还原反应期间采用酸添加来维持pH时，可以通过添加酸的量来监测转化进程以维持pH。通常，在转化过程中添加到未缓冲或部分缓冲的反应混合物中的酸以水溶液形式添加。

在使用辅因子再生系统进行本文所述的酮还原酶催化的还原反应的实施方式中，最初可以提供氧化或还原形式的辅因子。如上所述，辅因子再生系统将氧化的辅因子转化为其还原形式，然后将其用于还原酮还原酶底物。

在一些实施方式中，不使用辅因子再生系统。对于在不使用辅因子再生系统的情况下进行的还原反应，将辅因子以还原形式添加到反应混合物中。

在一些实施方式中，当使用宿主生物的全细胞进行该过程时，全细胞可以天然地提供辅因子。备选地或组合地，细胞可以天然地或重组地提供葡萄糖脱氢酶。

在进行本文所述的立体选择性还原反应时，可以将酮还原酶和任何包含任选辅因子再生系统的酶以纯化酶，用编码酶的一个或多个基因转化的全细胞的形式和/或这些细胞的细胞提取物和/或裂解物添加到反应混合物中。编码酮还原酶和任选的辅因子再生酶的一个或多个基因可以分别转化到宿主细胞中或一起转化到相同宿主细胞中。例如，在一些实施方式中，可以将一组宿主细胞用编码酮还原酶的一个或多个基因转化，可以将另一组用编码辅因子再生酶的一个或多个基因转化。这两组转化的细胞可以以全细胞形式，或者以来源于其的裂解物或提取物的形式一起用于反应混合物中。在其他实施方式中，可以使用编码酮还原酶和辅因子再生酶两者的一个或多个基因转化宿主细胞。

使用编码酮还原酶和/或任选的辅因子再生酶的一个或多个基因转化的全细胞或者其细胞提取物和/或裂解物可以以多种不同形式使用，包括固体(例如，冻干的、喷雾干燥的等)或半固体(例如，粗糊)。

细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)进行部分纯化，然后在冻干之前进行脱盐程序(例如，超滤、透析等)。任何细胞制剂都可以通过使用已知的交联剂进行交联来稳定。

在一些实施方式中，纯度提高的酮还原酶可能是需要的。在此类实施方式中，用于获得酮还原酶的澄清的细胞裂解物可以用于异丙醇预处理，以使异丙醇的体积％达到25％。异丙醇处理的裂解物可以在室温下孵育1小时至过夜。然后可以将异丙醇处理的裂解物离心，并且可以除去沉淀。然后可以将上清液转移到培养皿(petri dish)中，并在-80℃下冷冻至少2小时。然后可以使用标准自动化方案将样品冻干。如图1中所示，使用十二烷基硫酸钠(SDS，也称为月桂基硫酸钠)和聚丙烯酰胺凝胶(也称为SDS-PAGE)的凝胶电泳，显示了不溶于异丙醇(IPA)的蛋白的去除，提供纯化的酮还原酶。在图1中，T是总培养物；L是裂解物上清液；S-IPA是25％IPA处理后上清液；SFP-IPA是IPA处理的上清液的摇瓶粉末；和P-IPA指25％IPA处理去除的沉淀。

用于进行本文所述的酮还原酶催化的还原反应的适宜条件包括可以通过常规实验容易地优化的多种条件，包括但不限于在实验pH和温度下使用工程化的酮还原酶和底物接触并检测产物，例如，使用本文提供的实施例中描述的方法。

酮还原酶催化的还原通常在约15℃至约75℃的温度范围内进行。对于一些实施方式，在范围从约20℃至约55℃的温度下进行反应。在又一些实施方式中，在范围从约20℃至约45℃的温度下进行。反应也可以在环境条件下进行。

通常允许还原反应进行直到获得基本完全或接近完全的底物还原。可以使用公知方法通过检测底物和/或产物来监测底物到产物的还原。适宜的方法包括气相色谱、HPLC等。在反应混合物中产生的醇还原产物的转化率一般大于约50％，也可以大于约60％、也可以大于约70％、也可以大于约80％、也可以大于约90％，并且通常大于约97％。

实施例

实施例1：酶的制备

使用Luria-Bretani肉汤(细胞培养基)作为稀释剂将大肠杆菌培养物系列稀释至10^-4、10^-5和10^-6的稀释液，所述大肠杆菌培养物均含有编码酮还原酶的质粒，其可以由如上所述的由以下SEQ IDNO.3-11中的氨基酸序列表示。将100μL稀释液分别涂布在含有LBS琼脂并补充了50μg/mL卡那霉素的培养皿(petri dish)上。将板置于30℃培养箱中过夜。

将每孔200μL Luria-Bretani肉汤(细胞培养基)(500mL LB+50μg/mL卡那霉素)等分到标记的96孔浅孔板中。将浅孔板装载到集落选择器的板堆叠器中。将含有充分稀释以使得大部分集落彼此分离的集落(本领域技术人员将其称为单集落)的琼脂平板被挑选到浅孔平板的独特孔中。允许集落在200rpm、30℃和85％RH下生长过夜。

将390μL Terrific肉汤(TB)生长培养基(可以从ThermoFisher Scientific购买获得，目录号#A1374301)(TB+50μg/mL卡那霉素)等分到标记的96孔深孔传代培养板中。

将13μL过夜生长培养基从主浅孔板的每个孔中转移到相应的标记深孔传代培养板中。将板用透气膜密封，并将板在30℃和85％RH下以250rpm振荡2-2.5h。振荡后，测量至少一个板的光密度(OD₆₀₀，在600nm波长处的光密度)，以确定生长情况。当该板的OD₆₀₀在0.4-0.8范围内时，用每孔40μL的诱导培养基对深孔板进行诱导。将板重新密封并在250rpm、30℃和85％RH下振荡孵育18-20h。

孵育后，将所有深孔板以4000rpm在4℃下离心15min。离心后，弃去上清液。将板热封并储存在-80℃下。

将细胞板从-80℃存储下取出，并在室温下解冻。制备100mM磷酸钠pH 6.0、1mg/mL溶菌酶、0.50mg/mL硫酸多粘菌素B(PMBS)、3单位/mL DNase I和4mm MgCl₂的裂解缓冲液。将400μL裂解缓冲液等分到每个孔中。将裂解混合物在板振荡器上以1000rpm在室温下振荡1.5-2h。然后将裂解混合物在4℃下以4000rpm离心15min以制备含有酶的裂解物溶液(其在上清液中)。在一些情况下，裂解物溶液进一步与异丙醇在25-30％异丙醇溶液中孵育1-5h。孵育后，如上所述将裂解物离心。

实施例2：在孔板中的酮还原酶反应

通过在100％DMSO中制备100g/L底物酮溶液并加入等体积的THF制备10x酮储备溶液。通过在100mM磷酸钠中混合5.8g/L的市售酮还原酶KRED-P1 B10(可以从Codexis获得)、5.8g/L NADP和11.5％异丙醇至pH 6.0来制备反应缓冲液。

将350μL反应缓冲液添加到1mL圆底孔板中。向每个孔中添加40μL 10x酮储备溶液，然后加入10μL实施例1的含酶裂解物溶液。将板热封并以1000rpm在30℃下振荡过夜。

振荡过夜后，将190μL 50％ACN/水+0.05％TFA的混合物等分到过滤器滤板(圆底板顶部的过滤板，具有0.20μM亲水性PTFE，可从Millipore MSRLN2250商购)中。反应板未密封。将来自反应板的10μL反应混合物转移到相应过滤板中，过滤板下方有一个接收板。然后将板以4000rpm在4℃下离心3min。除去过滤板，并将接收板中的澄清溶液热封。

通过超高效液相色谱(UPLC)对过滤后的溶液进行分析，使用高通量筛选方法监测底物和底物的降解以及产物峰面积。UPLC在Waters HSS T3 1.8μm、2.1x75mm色谱柱上使用15％CH₃CN/H₂O+v0.05％TFA等度法在1.5分钟内进行；流速1mL/min。初始物质在0.84min洗脱，所需对映异构体在1min洗脱，不需要的对映异构体在1.09min洗脱。

实施例3：在摇瓶中制备酶

用10μL大肠杆菌细胞接种5mL Luria-Bretani肉汤(细胞培养基)(250mL LB+50μg/mL卡那霉素+1％葡萄糖)，所述大肠杆菌细胞均含有编码酮还原酶的质粒，其可以由如上所述的由以下SEQ ID NO.3-11中的氨基酸序列表示，其已在-80℃下贮存在20％的甘油中，并分装到标记的15mL细胞培养管中。将细胞培养管密封并在30℃下以250rpm振荡孵育20-24h。

生长过夜后，将过夜的生长培养物(2-5mL细胞培养物(初始OD600为0.2))添加到250mL Terrific肉汤(TB)生长培养基(可以从ThermoFisher Scientific购买获得，目录号#A1374301)(TB+50μg/mL卡那霉素)中至终体积为250mL。将培养瓶在30℃下以250rpm振荡3-4h。振荡后，测量OD₆₀₀以确定生长情况，直至OD₆₀₀达到0.4-0.6。此时，向培养物中添加1mM IPTG(250μl 1M IPTG)以诱导表达，使培养物在250rpm、30℃下生长20-24h。

在额外的生长期后，将培养物转移到已知重量的离心瓶中并以4000rpm在4℃下离心20min。离心后，弃去上清液，称量瓶中剩余的细胞沉淀。通过减去已知的瓶子重量计算细胞沉淀的重量，并将细胞沉淀重悬于5倍体积的50mM磷酸钠缓冲液(pH＝7)中，体积为细胞沉淀重量的5倍。

使用微流化仪裂解来自重悬细胞沉淀的细胞，收集细胞裂解物并以10000rpm在4℃下离心60min。将澄清的裂解液偶尔用异丙醇在25-30％异丙醇溶液中进一步处理1-5h。孵育后，如前所述对裂解物离心。将澄清的上清液转移到培养皿(petri dish)中，并在-80℃下冷冻约2h。使用标准自动化方案冻干样品。

实施例4：在药瓶中的酮还原酶反应

将10μL每种酮还原酶接种到在标记的15mL细胞培养管中的5mL Luria-Bretani肉汤(细胞培养基)中，其中补充了1％葡萄糖和50μg/mL卡那霉素抗生素，并且使其以30℃，250rpm在振荡培养箱中生长过夜20-24h，所述酮还原酶可以由以下SEQ ID NO.3-11中的氨基酸序列表示。

将5mL过夜培养物用于在1L摇瓶中的250mL Terrific肉汤生长培养基(可以从ThermoFisher Scientific购买获得，目录号#A1374301)中传代培养。使传代培养物在振荡培养箱中以250rpm在30℃下生长3h。当OD₆₀₀测量值介于0.4和0.6之间时，加入IPTG，使得IPTG终浓度为1mM。使得传代培养物生长过夜18-20h。

生长期后，将培养物转移到离心瓶中，并在4℃下以4000rpm离心20min。离心后，弃去上清液。将细胞沉淀重悬在50mM磷酸钠缓冲液(pH＝7)中。

使用微流化仪裂解来自重悬细胞沉淀的细胞，收集细胞裂解物并以10000rpm在4℃下离心60min。在一些情况下，裂解物溶液进一步与异丙醇在25-30％异丙醇溶液中孵育1-5h。孵育后，如前所述对裂解物离心。将澄清的上清液转移到培养皿(petri dish)中，并在-80℃下冷冻最少2h。任选地使用标准自动化方案将样品冻干。

将酮还原酶(20mg，从传代培养物中收获)和化合物A(20mg)添加到6个4mL药瓶的每一个中。

向单独的药瓶中添加1mL含NADPH(32mg)的1mg/mL市售酮还原酶(KRED-P1 B10，可从CODEXIS获得)溶液，随后添加3mL 100mM磷酸盐缓冲液(pH＝6.0)。

向含有酮还原酶和化合物A的每个药瓶中添加600μL缓冲溶液，随后添加120μLIPA。将药瓶的内容物在振荡器中混合并在30℃下保持20h。

实施例5：酮还原酶反应

将10μL每种酮还原酶接种到5mL Luria-Bretani肉汤(细胞培养基)中，其中补充了1％葡萄糖和50μg/mL卡那霉素抗生素，并且使其以30℃，250rpm在振荡培养箱中生长过夜20-24h，所述酮还原酶可以由以下SEQ ID NO.3-11中的氨基酸序列表示。

将20mg市售的酮还原酶(KRED-P1 B10，可从CODEXIS获得)，连同NADPH(20mg)、酮还原酶(250mg，从传代培养物中收获)和化合物A(250mg)一起添加到反应容器中。将10mL磷酸盐缓冲液(0.1M，pH＝6.0)和1mL IPA添加到反应容器中。将温度设定为30℃，将反应混合物以350rpm搅拌。20h后，将混合物冷却至15℃。将NaCl(2g)添加到反应容器中，并使反应混合物去过饱和过夜。过滤固体并用2.5mL(10vol)水洗涤。将湿饼置于50℃真空烘箱中干燥过夜。

¹H NMR(500M Hz,DMSO-d6)δ11.68(s,2H),8.27(s,1H),5.96(d,J＝5.4Hz,1H),5.83(d,J＝8.1Hz,1H),5.22(t,J＝5.4Hz,1H),5.07(dd,J＝54.3,4.1Hz,1H),4.77(dddd,27.3,8.1,4.1,4.1Hz,1H),4.25(dddd,J＝27.2,8.1,4.1Hz,4.1Hz,1H),3.61(m,2H),2.75(sept,J＝6.8Hz,1H),1.12(d,J＝6.8Hz,6H)。

¹³C NMR(125MHz,DMSO-d6)δ180.2,154.8,149.3,148.4,137.4,120.1,92.8(d,J＝183Hz),85.0,83.6(d,J＝21.1Hz),83.5,72.6(d,J＝16.1Hz),60.6(d,J＝11.2Hz),34.8,18.8,18.8。

¹⁹F NMR(500MHz,DMSO-d6)δ-197.5。

将意识到的是，上述各种以及其他特征和功能，或者其替代物，可以合意地组合到很多其他不同的系统或应用中。此外，本领域技术人员随后可以在其中做出各种目前未预见或未预料到的替代、修改、变化或改进，其也旨在被以下权利要求所涵盖。