CN116254252A

CN116254252A - 苏氨酸醛缩酶及其制备方法和用途

Info

Publication number: CN116254252A
Application number: CN202211370269.XA
Authority: CN
Inventors: 冯雁; 何远志
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2022-11-03
Filing date: 2022-11-03
Publication date: 2023-06-13

Abstract

本发明涉及苏氨酸醛缩酶及其制备方法和用途。具体地，本发明涉及一种苏氨酸醛缩酶基因编码蛋白的功能鉴定及体外定向进化。通过扩增来自海神单胞菌Neptunomonas marine的苏氨酸醛缩酶基因，基于理性设计对其进行定向进化改造，最终获得对L‑threo‑甲磺酰基苯基丝氨酸非对映选择性显著提高的苏氨酸酶突变体N18S/Q39R/Y319L。本发明的突变体可用于体外酶法合成L‑threo‑甲磺酰基苯基丝氨酸等药物中间体。本发明证实了该基因编码蛋白的功能及其在合成L‑threo‑甲磺酰基苯基丝氨酸等药物中间体中的潜力。

Description

苏氨酸醛缩酶及其制备方法和用途

技术领域

本发明涉及分子生物学和生物催化领域，具体涉及一种苏氨酸醛缩酶及其制备方法和用途，尤其涉及一种氨酸醛缩酶及其突变体在合成L-threo-甲磺酰基苯基丝氨酸(L-threo-MPTS)等药物中间体的应用。

背景技术

β-羟基-α-氨基酸是一类应用于化工，医药等领域的重要手性化合物。在过去几年中，生物催化已成为化学品工业生产的一种新兴工具，特别是在精细化学品和药物生产所需的手性构建块。生物催化具有反应条件温和，高立体选择性和不使用任何保护基团等特性，已经成为将经典化学和化学催化于一体的更具吸引力的手段。

苏氨酸醛缩酶能催化碳碳键的形成或裂解，产生立体化学上的纯手性产物而受到广泛关注。苏氨酸醛缩酶在自然界中普遍存在，在脊椎动物、植物、细菌、酵母和真菌中都能找到苏氨酸醛缩酶。它是一类5-磷酸吡哆醛(PLP)依赖的I型折叠酶，是在甘氨酸生物合成途径中催化L-苏氨酸或l-allo-苏氨酸裂解为甘氨酸和乙醛。其也可以通过逆向反应催化醛和甘氨酸缩合生产具有两个手性中心的氨基酸衍生物。

迄今为止，已报道的苏氨酸醛缩酶在羟醛缩合反应中存在立体选择性差、活性低和底物范围窄等问题，限制了其在β-羟基-α-氨基酸合成中的应用。因此挖掘和改造新的立体选择性好、活性高和底物范围广的醛缩酶是非常重要的研究，也能进一步应用于多种手性氨基酸药物及其前体的高效绿化合成。

鉴于现有技术的上述缺陷，本发明所需要解决的技术问题是开发一种新型苏氨酸醛缩酶(L-TAnem)，用于体外酶法转化合成单一非对映体产物L-thero-甲磺酰基苯基丝氨酸以及L-threo-苯基丝氨酸衍生物。

发明内容

本发明的目的就是提供一种苏氨酸醛缩酶及其突变体。

本发明的另一目的是提供苏氨酸醛缩酶及其突变体在合成L-threo-甲磺酰基苯基丝氨酸等药物中间体的应用。

在本发明的第一方面，提供了一种苏氨酸醛缩酶，所述的苏氨酸醛缩酶选自下组：

(a)具有SEQ ID NO:2所示氨基酸序列的多肽；

(b)将SEQ ID NO:2所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的并具有苏氨酸醛缩酶活性的衍生多肽；

(c)氨基酸序列与SEQ ID NO:2所示氨基酸序列的同源性≥85％(较佳地≥95％)，并具有苏氨酸醛缩酶活性的衍生多肽。

在另一优选例中，所述的苏氨酸醛缩酶的氨基酸序列如SEQ ID NO:2所示。

在另一优选例中，所述的苏氨酸醛缩酶的氨基酸序列在对应于SEQ ID NO:2所示氨基酸序列的一个或多个位点的选自下组的氨基酸残基突变：第18位、第39位、第319位。

在另一优选例中，所述的苏氨酸醛缩酶具有以下突变：N18S/Q39R/Y319L。

在本发明的第二方面，提供了一种分离的多核苷酸，所述的多核苷酸编码本发明第一方面所述的苏氨酸醛缩酶。

在另一优选例中，所述的分离的多核苷酸为选自下组的序列：

(a)编码如SEQ ID NO:2所示多肽的核苷酸序列；

(b)如SEQ ID NO:1所示的核苷酸序列；

(c)与SEQ ID NO:1所示序列的同源性≥95％(较佳地≥98％)的核苷酸序列；

(d)在SEQ ID NO:1所示核苷酸序列的5’端和/或3’端截短或添加1-60个(较佳地1-30，更佳地1-10个)核苷酸所形成的核苷酸序列；

(e)与(a)-(d)任一所述的核苷酸序列互补(较佳地完全互补)的核苷酸序列。

在另一优选例中，所述的核苷酸的序列如SEQ ID NO:1所示。

在另一优选例中，序列如SEQ ID NO:1所示的多核苷酸编码氨基酸序列如SEQ IDNO:2所示的苏氨酸醛缩酶。

在本发明的第三方面，提供了一种载体，述的载体含有本发明第二方面所述的多核苷酸。

在另一优选例中，所述的载体包括重组载体、表达载体、整合载体。

在本发明的第四方面，提供了一种遗传工程化的宿主细胞，所述宿主细胞含有本发明第三方面所述的载体，或其基因组中整合有外源的本发明第二方面所述的多核苷酸。

在另一优选例中，所述的宿主细胞包括原核细胞和真核细胞。

在另一优选例中，所述的宿主细胞为大肠杆菌。

在本发明的第五方面，提供了一种制备本发明第一方面所述的苏氨酸醛缩酶的方法，所述方法包括：

(a)在适合表达的条件下，培养本发明第四方面所述的宿主细胞，从而表达本发明第一方面所述的苏氨酸醛缩酶；和

(b)分离表达产物，从而获得所述的苏氨酸醛缩酶。

在本发明的第六方面，提供了一种本发明第一方面所述的苏氨酸醛缩酶的用途，用于催化羟醛缩合反应或用于制备催化羟醛缩合反应的催化试剂。

在另一优选例中，所述羟醛缩合反应如下所示：

其中，

R为位于邻位、间位或对位的选自下组的一个或多个基团：卤素、硝基、甲基和甲磺酰基，

PLP为5-磷酸吡哆醛。

在本发明的第七方面，提供了一种体外制备式(I)化合物的催化方法，包括步骤：

在苏氨酸醛缩酶存在的情况下，使甘氨酸和苯甲醛衍生物为底物进行羟醛缩合反应，从而形成式I所示的氨基酸产物：

其中，

R为邻位、间位或对位的选自下组的一个或多个基团：卤素、硝基、甲基和甲磺酰基，

PLP为5-磷酸吡哆醛。

在另一优选例中，所述的苯甲醛衍生物和甘氨酸的摩尔比为0.5～2：1～100。

在另一优选例中，所述反应在亲水性有机溶剂中进行。

在另一优选例中，所述的亲水性有机溶剂为N-N二甲基酰胺(DMF)。

在另一优选例中，所述方法还包括：向反应体系中提供用于调节酶活性的添加物。

在另一优选例中，所述的用于调节酶活性的添加物是：提高酶活性或抑制酶活性的添加物。

在另一优选例中，所述的用于调节酶活性的添加物选自下组：Mn²⁺、K⁺、Ba²⁺、Zn²⁺、Mg²⁺、NH₄ ⁺、Ca²⁺、Fe²⁺或Fe³⁺、或其组合。

在另一优选例中，所述方法的5-磷酸吡哆醛(PLP)浓度条件为：1μM～100μM，优选20μM～50μM。

在另一优选例中，所述方法的pH条件为：pH 5.0～10.0，较佳地pH 7.0～pH9.0，更佳地8.0。

在另一优选例中，所述方法的温度条件为：20℃-50℃，较佳地25℃～30℃，更佳地30℃。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

下列附图用于说明本发明的具体实施方案，而不用于限定由权利要求书所界定的本发明范围。

图1显示了苏氨酸醛缩酶L-TAnem纯化后SDS-PAGE电泳分析结果图。

图2显示了苏氨酸醛缩酶L-TAnem反应所需的最适pH结果图。

图3显示了苏氨酸醛缩酶L-TAnem反应所需的最适温度结果图。

图4显示了苏氨酸醛缩酶L-TAnem反应所需的最适5-磷酸吡哆醛(PLP)浓度结果图

图5显示了苏氨酸醛缩酶L-TAnem的金属离子影响活性结果图。

图6显示了苏氨酸醛缩酶L-TAnem的温度耐受性结果图。

图7显示了苏氨酸醛缩酶L-TAnem的天然底物结果图。

图8显示了苏氨酸醛缩酶L-TAnem中S16位点、N18位点、Q39位点和Y319位点饱和突变体合成L-threo-甲磺酰基苯基丝氨酸的相对活性及非对映体立体选择性结果图。

图9显示了苏氨酸醛缩酶L-TAnem中多点组合突变体合成L-threo-甲磺酰基苯基丝氨酸的相对活性及非对映体立体选择性结果图。

图10显示了苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L合成L-threo-甲磺酰基苯基丝氨酸放大反应结果图。

图11显示了苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L以非天然苯甲醛衍生物与甘氨酸为底物合成不同β-羟基-α氨基酸的活性和非对映体立体选择性的结果图。

图12显示了苏氨酸醛缩酶L-TAnem突变体合成L-threo-甲磺酰基苯基丝氨酸的HPLC和MS分析图谱。

具体实施方式

本发明人经过广泛而深入的研究，首次提供了一种苏氨酸醛缩酶及其制备方法和用途。具体地，通过扩增来自海神单胞菌Neptunomonas marine的苏氨酸醛缩酶基因，基于理性设计对其进行定向进化改造，最终获得对L-threo-甲磺酰基苯基丝氨酸非对映选择性显著提高的苏氨酸酶突变体。本发明的突变体可用于体外酶法合成L-threo-甲磺酰基苯基丝氨酸等药物中间体。在此基础上完成了本发明。

术语

为了可以更容易地理解本公开，首先定义某些术语。如本申请中所使用的，除非本文另有明确规定，否则以下术语中的每一个应具有下面给出的含义。在整个申请中阐述了其它定义。

如本文所用，术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之，所述术语也包括“基本上由…构成”、或“由…构成”。

苏氨酸醛缩酶(L-TAnem)

苏氨酸醛缩酶L-TAnem是一类5-磷酸吡哆醛依赖的I型折叠酶，可进一步催化醛和甘氨酸缩合生产具有两个手性中心的β-羟基-α氨基酸衍生物。

在本发明中，借助已报道苏氨酸醛缩酶的序列和结构，通过在NCBI等数据库中进行非冗余性检索，基于蛋白结构相似性、保守位点分析和宿主来源多样等原则，筛选了一些候选酶基因。将筛选的基因在大肠杆菌表达系统中进行功能表达，纯化后获得纯酶。优选的苏氨酸醛缩酶为来源于Neptunomonas marine的苏氨酸醛缩酶L-TAnem，其具有广泛的底物谱，能够催化一系列醛和α-氨基酸底物生成相应的β-羟基-α-氨基酸化合物。

野生型L-TAnem核苷酸序列如SEQ ID NO:1所示，氨基酸序列如SEQ ID NO:2所示。

SEQ ID NO:1:

ATGGCTAGTAATGATTCATGTATAGAAGACACAGTGAGCTTCACCTCCGACAACATCGCGGCTGCGGCTCCGGAAATCGTGCAGGCGATGGCGCAAGCGTGTCAGGGCAATGCGCAACCGTACGGCGGAGACGCGCTGACTCAAAATGTTGAGGCACAGCTTAAGGCTATCTTCGAGTGTGACCTCCAGCTGTTCTTGGTACCGACGGGTTCGGCTGCCAACGCGATCAGCCTGGCTGCGCTCACCCCTCCGTGGGGGGCGATTTTGTGCCACCAGGAGAGCCATATTAACAACGATGAGTGCGGTGCGCCGGAATTCTTTACCGCAGGTGCCAAACTGATCGCGGTGGCGGGCACCCATGGCAAACTGGATCCGCAGGCGTTGACTCAAGCAGCGCGCAATAAACGCGGCGACGTTCACAGCGTCGAGCCGACCACCGTGAGTATTACCCAGGCAACCGAAGTTGGTTCTATCTACGCGTTGGACGAGCTGAACGAGATTGGTCAGATTTGCCGTAACGAAGGTCTGAAACTGCACATGGATGGTGCGCGTTTCGCTAACGCACTGTCTGCGCTGGGTTGTACCCCAGCTGAAATGACCTGGAAGGCAGGCGTTGATGTGCTGAGCTTTGGTGCGACTAAGAATGGTTCCCTTTGCGCCGAGGCTATCATCTTGTTCGATAAAAGCTATGCCCAAGAAATCGCGTTCCGCCGTAAACGTGGTGGCCATCTGCTGTCCAAGATGCGTTTTCTCAGCGCACAAATGCATGCGTACCTGGCGGACGACCTGTGGCTGACCAATGCCCGCCACGCGAATCTGATGGCAGCGCGTTTGGCTGCTGGCCTGTCAGCCTTGAGCCGTGTTTCGCTGATCGCGCCGACCGAAAGCAACATTATCTTCTGCCGCATGCCGACCAAGATGATTGCCGCATTACAGCAACAGGGTTTTCAGTTTTATCACGATCGTTGGGGCGACGGCATTGTTAGACTGGTCACGTCTTTCGCCACGACGCAGGCTCAAGTGGATACCTTTATCGCGGCTGCCGCGCAACTGAACCAGAACACCGAT

SEQ ID NO:2:

MASNDSCIEDTVSFTSDNIAAAAPEIVQAMAQACQGNAQPYGGDALTQNVEAQLKAIFECDLQLFLVPTGSAANAISLAALTPPWGAILCHQESHINNDECGAPEFFTAGAKLIAVAGTHGKLDPQALTQAARNKRGDVHSVEPTTVSITQATEVGSIYALDELNEIGQICRNEGLKLHMDGARFANALSALGCTPAEMTWKAGVDVLSFGATKNGSLCAEAIILFDKSYAQEIAFRRKRGGHLLSKMRFLSAQMHAYLADDLWLTNARHANLMAARLAAGLSALSRVSLIAPTESNIIFCRMPTKMIAALQQQGFQFYHDRWGDGIVRLVTSFATTQAQVDTFIAAAAQLNQNTD

如本文所用，术语“活性多肽”、“本发明的多肽”、“本发明的酶”、“苏氨酸醛缩酶”或“本发明的苏氨酸醛缩酶”或“L-TAnem”可互换使用，均指的是本发明第一方面所述的苏氨酸醛缩酶。

如本文所用，“分离的多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。

在本发明中，对氨基酸序列如SEQ ID NO:1所示的野生型苏氨酸醛缩酶进行特定位点的突变，得到了活性显著提高的相应的突变体。如本文所用，术语“突变蛋白”、“突变体”可互换使用，指的是苏氨酸醛缩酶突变体。

如本文所用，在描述突变时，以术语“N18S/Q39R/Y319L”为例，指基于SEQ ID NO:1(野生型)所示的序列，第18位N突变为S、第39位Q突变为R以及第319位Y突变为L。其他突变的描述方式与此类似。

本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

本发明还包括所述多肽的片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。

本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

在本发明的活性多肽具有糖基转移酶活性，并且能够催化下述反应：

其中，R和PLP的定义如上所述。

所述的多肽优选序列为SEQ ID NO:2所示的多肽，该术语还包括具有与所示多肽具有相同功能的、SEQ ID NO:2序列的变异形式。这些变异形式包括(但并不限于)：一个或多个(通常为1-50个，较佳地1-30个，更佳地1-20个，最佳地1-10个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加一个或数个(通常为20个以内，较佳地为10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人EGFRvA蛋白的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然人EGFRvA多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

一类优选的活性衍生物指与SEQ ID NO.:2所示氨基酸序列相比，有至多5个，较佳地至多3个，更佳地至多2个，最佳地1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。

表A

/>

编码核酸及其组合

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO:1所示的编码区序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质，但与SEQ ID NO:1所示的编码区序列有差别的核酸序列。

编码SEQ ID NO:2的成熟多肽的多核苷酸包括：只编码成熟多肽的编码序列；成熟多肽的编码序列和各种附加编码序列；成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。

术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码的多肽的功能。

本发明中的多肽和多核苷酸优选以分离的形式提供，更佳地被纯化至均质。

本发明的L-TAnem核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据本发明所公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。

目前，已经可以完全通过化学合成来得到编码本发明蛋白(或其片段，或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外，还可通过化学合成将突变引入本发明蛋白序列中。

应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时，可优选使用RACE法(RACE-cDNA末端快速扩增法)，用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

载体

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或L-TAnem蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术，可利用本发明的多聚核苷酸序列可用来表达或生产重组的苏氨酸醛缩酶L-TAnem。一般来说有以下步骤：

(1)用本发明的编码苏氨酸醛缩酶的多核苷酸(或变异体)，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；

(2)在合适的培养基中培养的宿主细胞；

(3)从培养基或细胞中分离、纯化蛋白质。

本发明中，L-TAnem多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含L-TAnem编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。这些启动子的代表性例子有：大肠杆菌的lac或trp启动子；λ噬菌体PL启动子；真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

宿主细胞

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母；植物细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。

本发明的多核苷酸在高等真核细胞中表达时，如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子，通常大约有10到300个碱基对，作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时，能吸收DNA的感受态细胞可在指数生长期后收获，用CaCl₂法处理，所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要，转化也可用电穿孔的方法进行。当宿主是真核生物，可选用如下的DNA转染方法：磷酸钙共沉淀法，常规机械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的多肽。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

应用

本发明涉及的苏氨酸醛缩酶及其突变体的用途包括(但不限于)：特异和高效地催化底物4-甲磺酰基苯甲醛或苯甲醛衍生物和甘氨酸的转化，合成L-threo-甲磺酰基苯基丝氨酸及其L-threo-苯基丝氨酸衍生物。

本发明提供了一种工业催化方法，包括：在提供苏氨酸醛缩酶存在的条件下，用本发明的苏氨酸醛缩酶将式(I)化合物转化为式(II)化合物，其中所述的酶优选为具有SEQID NO:2所示氨基酸序列以及其单点或多点突变的氨基选序列的活性多肽。

在所述方法中，还可以添加酶活性添加物(提高酶活性或抑制酶活性的添加物)。所述酶活性的添加物可以选自下组：Mn²⁺、K⁺、Ba²⁺、Zn²⁺、Mg²⁺、NH₄ ⁺、Ca²⁺、Fe²⁺或Fe³⁺、或其组合。

所述方法的pH条件为：pH5.0～10.0，优选pH 7.0～pH 9.0，更优选8.0。

所述方法的温度条件为：20℃～50℃，优选25℃～30℃，更优选30℃。

所述方法的PLP浓度条件为：1μM～100μM，优选20μM～50μM。

本发明还提供了一种组合物，它含有有效量的本发明的活性多肽或苏氨酸醛缩酶L-TAnem，以及食品学上或工业上可接受的载体或赋形剂。这类载体包括(但并不限于)：水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。

所述的组合物中还可添加调节本发明的苏氨酸醛缩酶活性的物质。任何具有提高酶活性功能的物质均是可用的。

在获得了本发明的苏氨酸醛缩酶后，本领域人员可以方便地应用该酶来发挥体外酶法合成，特别是对底物4-甲磺酰基苯甲醛和甘氨酸的转化作用。

作为本发明的优选方式，还提供了形成L-threo-甲磺酰基苯基丝氨酸的方法，所述方法包括：用本发明所述的苏氨酸醛缩酶酶处理待转转化的底物，所述的底物包括4-甲磺酰基苯甲醛和甘氨酸。较佳地，在pH5.0-10条件下，用所述的苏氨酸醛缩酶处理待转转化的底物。较佳地，在温度25-50℃条件下，用所述的苏氨酸醛缩酶处理待转转化的底物。

本发明的主要优点：

1.利用本发明所述的苏氨酸醛缩酶在体外酶法合成L-threo-甲磺酰基苯基丝氨酸，对底物4-甲磺酰基苯甲醛和甘氨酸的转化率可达80％；其突变体在相同条件下，催化4-甲磺酰基苯甲醛和甘氨酸生成L-threo-甲磺酰基苯基丝氨酸的活性是野生型的1.4-1.5倍，de值提高至99％。

2.利用本发明所述的苏氨酸醛缩酶突变体成功实现了在体外酶法合成单一对映纯L-threo-甲磺酰基苯基丝氨酸。

3.本发明获得的苏氨酸醛缩酶及其突变体可用于体外酶法合成L-threo-甲磺酰基苯基丝氨酸和和L-threo-苯基丝氨酸衍生物，是区别于现有生产技术的一种新的生产方法，生产过程简化、消耗低、绿色环保。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件，或按照制造厂商所建议的条件。

本发明所述的生物材料的来源的一般性说明：

1.引物合成：本发明中所使用的引物均由擎科生物公司合成制备。

2.实验中所使用的Primer STAR Max DNA聚合酶购自TakaRa公司；使用的DNA胶回收试剂盒及质粒小提试剂盒均购自Axygen公司。

实施例1苏氨酸醛缩酶的筛选

借助已报道苏氨酸醛缩酶的序列和结构，通过在NCBI等数据库中进行非冗余性检索，基于蛋白结构相似性、保守位点分析和宿主来源多样等原则，筛选得到来源于Neptunomonas marine的苏氨酸醛缩酶基因L-TAnem。该基因经过密码子优化后通过全基因合成获得，全长以NdeⅠ、XhoⅠ酶切位点克隆至pET22b(+)质粒。

实施例2苏氨酸醛缩酶表达与纯化

将上述筛选基因的重组表达质粒热休克转化至大肠杆菌BL21(DE3)感受态细胞，进行基因表达及蛋白纯化。培养重组菌浓度至OD600为0.6-0.9时，添加IPTG至终浓度为0.5mM，在低温25℃、220rpm条件下诱导培养过夜。离心收集菌体，将细胞重悬于50mM HEPES缓冲液中(pH 8.0，500mM NaCl，50mM咪唑)。250mL的培养细胞最终重悬于40mL的缓冲液中，使用高压细胞破碎仪(4～6℃，700pa)进行细胞破碎，然后细胞破碎液以12000rpm高速离心30min(4℃)，收集上清液再次重复12000rpm离心30min(4℃)，收集上清，利用Ni-NTA柱亲和纯化蛋白，使用50mM HEPES缓冲液中(pH 8.0，500mM NaCl，50mM咪唑)洗脱杂蛋白，最后使用50mM HEPES缓冲液中(pH 8.0，500mM NaCl，250mM咪唑)洗脱目标蛋白，洗脱目标蛋白液经过浓缩除盐得到纯化的蛋白。纯化的蛋白保存于100mM Tris-HCl缓冲液中(pH 8.0)，使用12％ SDS-PAGE对纯化后的蛋白进行电泳检测，使用Bradford蛋白浓度测定试剂盒(上海生工生物)测定蛋白浓度。

结果如图1所示。结果表明，在41.9kDa处得到一条清晰的条带，这表明目标蛋白L-TAnem已得到纯化。

实施例3苏氨酸醛缩酶L-TAnem酶学性质测定

使用偶联醇脱氢酶ADH测定苏氨酸醛缩酶L-TAnem的酶活。具体步骤如下：

1.苏氨酸醛缩酶L-TAnem最适pH、最适温度、最适PLP浓度和不同金属离子的测定：

分别在不同pH(5.0、6.0、7.0、7.5、8.0、8.5、9.0、10.0)下探究L-TAnem的酶活，反应体系为：10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NAD⁺、50mM苏氨酸。使用50mMHEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD₃₄₀的变化，计算出活性。计算不同pH下的相对酶活。

结果如图2所示。结果表明，L-TAnem在pH 8.0时具有高活性。

分别在不同温度(20℃、25℃、30℃、37℃)下探究L-TAnem的酶活，反应体系为：10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH⁺、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD₃₄₀的变化，计算不同温度反应条件下的相对酶活。

结果如图3所示。结果表明，L-TAnem在30℃时具有高活性。

分别在不同PLP(1μM、10μM、20μM、40μM、60μM、80μM、100μM)下探究L-TAnem的酶活，反应体系为：10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH⁺、50mM苏氨酸。使用50mMHEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD₃₄₀的变化，计算不同温度反应条件下的相对酶活。

结果如图4所示。结果表明，L-TAnem在40μM浓度下具有高活性。

分别在1mM不同金属离子浓度(Mn²⁺、K⁺、Ba²⁺、Ni²⁺、Zn²⁺、Cu²⁺、Mg²⁺、NH₄ ⁺、Ca²⁺、Fe²⁺、Fe³⁺)下探究L-TAnem的酶活，反应体系为：10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mMNADH⁺、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。反应在25℃下监测OD₃₄₀的变化，计算不同温度反应条件下的相对酶活。

结果如图5所示。结果表明，Ni⁺和Cu²⁺对L-TAnem的活性有明显的抑制作用，其他金属离子对L-TAnem的活性影响不大。

2.苏氨酸醛缩酶L-TAnem的天然底物谱测定：

分别下探究L-TAnem对D-苏氨酸和L-苏氨酸的活性。反应体系为：10μg/mL L-TAnem纯酶、10U ADH(Sigma)、0.2mM NADH⁺、50mM苏氨酸，25℃，使用50mM HEPES(pH8.0)缓冲液将最终反应体积补足至1000μL。下监测OD₃₄₀的变化，计算活性。

结果如图7所示。结果表明，L-TA_nem具对L-苏氨酸具有良好的活性，对D-苏氨酸没有活性。

3.苏氨酸醛缩酶L-TA_nem的热稳定性测定：

在30℃、40℃、50℃和60℃条件下孵育不同的时间(0min、5min、10min、15min、30min和60min)后探究L-TAnem的酶活，反应体系为：10μg/mL L-TAnem纯酶、5U ADH(Sigma)、0.2mM NADH⁺、50mM苏氨酸。使用50mM HEPES缓冲液将最终反应体积补足至1000μL。

结果如图6所示。结果表明，L-TAnem具有良好的热稳定性，在50℃处理30min后其活性保持了85％左右。

实施例4苏氨酸醛缩酶L-TAnem突变体的构建及筛选

针对苏氨酸醛缩酶L-TAnem具有催化合成L-threo-甲磺酰基苯基丝氨酸的活性特征，基于L-TAnem的晶体结构、分子对接分析通过理性设计选择位点，对该酶进行定向进化改造以获得能催化合成单一非对映体L-threo-甲磺酰基苯基丝氨酸的突变体。

4.1以重组质粒pET22b-L-TAnem为模板，以带有突变位点为简并碱基(NNK)的一对互补寡核苷酸作引物，用Primestar高保真酶进行全质粒PCR扩增，获得具有特定突变位点的重组质粒。引物序列如下：

对应于SEQ NO:2中第16位丝氨酸被其它19种氨基酸取代的突变体：

S16-F:AGCTTCACCNNKGACAACATCGCGGCTGCG(SEQ ID NO:3)

S16-R:GATGTTGTCMNNGGTGAAGCTCACTGTGTC(SEQ ID NO:4)

对应于SEQ NO:2中第18位天冬酰胺被其它19种氨基酸取代的突变体：

N18-F:ACCTCCGACNNKATCGCGGCTGCGGCTCCG(SEQ ID NO:5)

N18-R:AGCCGCGATMNNGTCGGAGGTGAAGCTCAC(SEQ ID NO:6)

对应于SEQ NO:2中第39位谷氨酰胺被其它19种氨基酸取代的突变体：

Q39-F:GGCAATGCGNNKCCGTACGGCGGAGACGCG(SEQ ID NO:7)

Q39-R:GCCGTACGGMNNCGCATTGCCCTGACACGC(SEQ ID NO:8)

对应于SEQ NO:2中第140位组氨酸被其它19种氨基酸取代的突变体：

H140-F:GGCGACGTTNNKAGCGTCGAGCCGACCACC(SEQ ID NO:9)

H140-R:CTCGACGCTMNNAACGTCGCCGCGTTTATT(SEQ ID NO:10)

对应于SEQ NO:2中第319位酪氨酸被其它19种氨基酸取代的突变体：

Y319-F:TTTCAGTTTNNKCACGATCGTTGGGGCGAC(SEQ ID NO:11)

Y319-R:ACGATCGTGMNNAAACTGAAAACCCTGTTG(SEQ ID NO:12)

扩增体系为：重组质粒模板1ng、引物(10uM)各2uL、PrimeSTAR Max DNA聚合酶25uL、补充双蒸水至50uL。

扩增条件为：94℃预变性1分钟，94℃变性10秒，56℃退火35秒，72℃延伸1分钟，共30个循环。

反应结束后，以1％琼脂糖凝胶电泳检测扩增产物。产物经PCR产物纯化试剂盒纯化回收，用DpnⅠ酶(NEB公司)在37℃条件下消化回收产物2小时，降解初始模板。消化产物转化至E.coli BL21(DE3)感受态细胞，涂布到含有100ug/mL氨苄霉素LB琼脂平板上，37℃过夜培养，筛选阳性克隆，测序验证，得到苏氨酸醛缩酶L-TAnem指定位点的饱和突变体重组菌。

按照实施例2的方法得到苏氨酸醛缩酶L-TAnem指定位点的饱和突变体纯化蛋白。

突变体酶活测定反应体系为：20μg/mL L-TAnem纯酶、100mM醛、1M甘氨酸、50μMPLP、和10％(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至500μL。反应在25℃下以250rpm的速度振荡孵育0.5小时。然后取50μL反应液加入至950μL丙酮中终止反应，离心取上清，使用HPLC进行分析。

结果

结果如图8所示。从文库中共筛选出约100个克隆，获得12个阳性突变体，分别是S16G、S16A、N18T、N18S、Q39A、Q39K、Q39L、Q39R、Y319L、Y319S和Y319D。

对于S16和N18位点，所有突变体的活性都降低了(图8)。在立体选择性方面，只有S16A、S16G、N18S和N18T的de值相比野生型增加，他们的的de值分别为94.3％、94.1％、92.5％和91.1％。但与L-TAnem-WT相比，它们的活性分别降低了54.7％、74.9％、24.4％和33.3％(图8)。

对于Q39位点，有5个突变体(Q39A、Q39R、Q39K、Q39H和Q39L)的de值升高，并保持了绝大部分的活性。其中，Q39R和Q39K的活性较L-TAnem-WT分别提高3.5U/mg和8U/mg，分别达到68.3U/mg和72.8U/mg(图8)。

对于Y319位点，Y319D、Y319L和Y319S对de值均有正向影响，他们的de值分别达到94.0％、93.7％、92.7％。在活性方面，Y319D仅为L-TAnem-WT的27.5％。Y319S的活性较L-TAnem-WT提高了1.4U/mg(图8)。

4.2为了进一步提高L-TAnem的立体选择性，进行了多点组合突变。以前面得到的12个阳性突变体为模板，设计引物，用Primestar高保真酶进行全质粒PCR扩增，获得具有特定突变位点的重组质粒。引物序列如下：

对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第16位丝氨酸被丙氨酸取代的突变体：

S16A-F:AGCTTCACCGCTGACAACATCGCGGCTGCG(SEQ ID NO:13)

S16A-R:GATGTTGTCAGCGGTGAAGCTCACTGTGTC(SEQ ID NO:14)

对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第16位丝氨酸被甘氨酸取代的突变体：

S16G-F:AGCTTCACCGGCGACAACATCGCGGCTGCG(SEQ ID NO:15)

S16G-R:GATGTTGTCGCCGGTGAAGCTCACTGTGTC(SEQ ID NO:16)

对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第18位天冬酰胺被丝氨酸取代的突变体：

N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:17)

N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:18)

对应于SEQ NO:2中第319位点酪氨酸被亮氨酸取代同时第39位谷氨酰胺被精氨酸取代的突变体：

Q39R-F:GGCAATGCGCGTCCGTACGGCGGAGACGCG(SEQ ID NO:19)

Q39R-R:GCCGTACGGACGCGCATTGCCCTGACACGC(SEQ ID NO:20)

对应于SEQ NO:2中第319位点酪氨酸被天冬氨酸取代同时第39位谷氨酰胺被精氨酸取代的突变体：

Q39R-F:GGCAATGCGCGTCCGTACGGCGGAGACGCG(SEQ ID NO:21)

Q39R-R:GCCGTACGGACGCGCATTGCCCTGACACGC(SEQ ID NO:22)

对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代同时第16位丝氨酸被丙氨酸取代的突变体：

S16A-F:AGCTTCACCGCTGACAACATCGCGGCTGCG(SEQ ID NO:23)

S16A-R:GATGTTGTCAGCGGTGAAGCTCACTGTGTC(SEQ ID NO:24)

对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被亮氨酸取代的同时，第18位天冬酰胺被丝氨酸取代的突变体：

N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:25)

N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:26)

对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被亮氨酸取代的同时，第18位天冬酰胺被苏氨酸取代的突变体：

N18T-F:ACCTCCGACACCATCGCGGCTGCGGCTCCG(SEQ ID NO:27)

N18T-R:AGCCGCGATGGTGTCGGAGGTGAAGCTCAC(SEQ ID NO:28)

对应于SEQ NO:2中第39位点谷氨酰胺被精氨酸取代和第319位点酪氨酸被天冬氨酸取代的同时，第18位天冬酰胺被丝氨酸取代的突变体：

N18S-F:ACCTCCGACTCAATCGCGGCTGCGGCTCCG(SEQ ID NO:29)

N18S-R:AGCCGCGATTGAGTCGGAGGTGAAGCTCAC(SEQ ID NO:30)

突变体酶活测定的反应体系为：20μg/mL L-TAnem突变体、100mM醛、1M甘氨酸、50μM PLP、和10％(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至500μL。反应在25℃下以250rpm的速度振荡孵育0.5小时。然后取50μL反应液加入至950μL丙酮中终止反应，离心取上清，使用HPLC进行分析。

结果

结果如图9A所示，共获得了6个阳性双点突变体，分别为S16G/Y319L、Q39R/Y319L、N18S/Y319L、S16A/Q39R、Q39R/Y319D和S16A/Y319L。

其中，Q39R/Y319L的立体选择性最好，de值达到97.6％，比WT提高了8％。Q39R/Y319L的比活性为WT的2.0倍，达到133U/mg。同时，其他5个双突变体也较单点进一步提高了de值。其中，N18S/Y319L的de值达到96.7％，比活性达到64.4U/mg。S16A/Y319L、S16A/Q39R、Q39R/Y319D和S16G/Y319L对立体选择性也有提高，de值分别为95.9％、95.2％、96.3％和96.2％。

在双突变的基础上，进一步组合提高了L-TAnem的非对映选择性。鉴定出3个高效突变体N18T/Q39R/Y319L、N18S/Q39R/Y319L和N18S/Q39R/Y319D。它们的de值分别为98.6％、99.3％和98.5％(图9A)。N18S/Q39R/Y319L比活性达到95.7U/mg，显著高于野生型(64.8U/mg)(图9B)。

实施例5苏氨酸醛缩酶L-TAnem及其突变体合成L-threo-甲磺酰基苯基丝氨酸

针对合成L-threo-甲磺酰基苯基丝氨酸的反应体系的放大。反应条件为：15mg L-TAnem以及突变体、100mM醛、1M甘氨酸、50μM PLP、和10％(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至1L。反应在25℃下以250rpm的速度振荡孵育2.5小时。分别在不同的时间点取样50μL反应液加入至950μL丙酮中终止反应，离心取上清，使用HPLC进行分析

结果如图10所示。结果表明，反应140min后苏氨酸醛缩酶L-TAnem合成L-threo-甲磺酰基苯基丝氨酸反应的转化率达到54.8％，de值为89.1％；突变体N18S/Q39R/Y319L合成L-threo-甲磺酰基苯基丝氨酸反应的转化率达到80.1％，de值>99％。

实施例6苏氨酸醛缩酶L-TAnem及其突变体N18S/Q39R/Y319L合成L-threo-苯基丝氨酸衍生物

反应条件为：1.5U L-TAnem及其突变体、100mM醛、1M甘氨酸、50μMPLP、和10％(v/v)DMF。使用HEPES(pH 8.0)缓冲液将最终反应体积补足至1L。反应在25℃下以250rpm的速度振荡孵育2小时。分别在不同的时间点取样50μL反应液加入至950μL丙酮中终止反应，离心取上清，使用HPLC进行分析

结果如图10所示。结果表明，该苏氨酸醛缩酶对不同芳香醛底物都具有良好的活性和选择性，其中对于对位取代的底物，突变体表现出了更好的非对映体立体选择性。同时对于双取代的底物，也能表现出良好的活性。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

1.一种苏氨酸醛缩酶(L-TAnem)，其特征在于，所述的苏氨酸醛缩酶选自下组：

(a)具有SEQ ID NO:2所示氨基酸序列的多肽；

2.如权利要求1所述的苏氨酸醛缩酶，其特征在于，所述的苏氨酸醛缩酶的氨基酸序列如SEQ ID NO:2所示。

3.如权利要求2所述的苏氨酸醛缩酶，其特征在于，所述的苏氨酸醛缩酶的氨基酸序列在对应于SEQ ID NO:2所示氨基酸序列的一个或多个位点的选自下组的氨基酸残基突变：第18位、第39位、第319位。

4.如权利要求3所述的苏氨酸醛缩酶，其特征在于，所述的苏氨酸醛缩酶具有以下突变：N18S/Q39R/Y319L。

5.一种分离的多核苷酸，其特征在于，所述的多核苷酸编码权利要求1所述的苏氨酸醛缩酶。

6.一种载体，其特征在于，所述的载体含有权利要求5所述的多核苷酸。

7.一种遗传工程化的宿主细胞，其特征在于，所述宿主细胞含有权利要求6所述的载体，或其基因组中整合有外源的如权利要求5所述的多核苷酸。

8.一种制备如权利要求1所述的苏氨酸醛缩酶的方法，其特征在于，所述方法包括：

(a)在适合表达的条件下，培养权利要求7所述的宿主细胞，从而表达权利要求1所述的苏氨酸醛缩酶；和

(b)分离表达产物，从而获得所述的苏氨酸醛缩酶。

9.如权利要求1所述的苏氨酸醛缩酶的用途，其特征在于，用于催化羟醛缩合反应或用于制备催化羟醛缩合反应的催化试剂。

10.一种体外制备式(I)化合物的催化方法，其特征在于，包括步骤：

其中，

PLP为5-磷酸吡哆醛。