WO2021135796A1

WO2021135796A1 - D-木酮糖4-差向异构酶、其突变体及其用途

Info

Publication number: WO2021135796A1
Application number: PCT/CN2020/133395
Authority: WO
Inventors: 张以恒; 周伟
Original assignee: 中国科学院天津工业生物技术研究所
Priority date: 2019-12-31
Filing date: 2020-12-02
Publication date: 2021-07-08
Also published as: BR112022012915A2; MX2022008199A; CA3163520A1; EP4083199A1; KR20220119128A; EP4083199A4; CN113122528A; JP2023509176A; US20230220433A1

Abstract

本公开涉及D-木酮糖4-差向异构酶、其突变体及其用途。具体来说，本公开涉及一种具有D-木酮糖4-差向异构酶活性的多肽，前述多肽的制备方法，以及前述多肽在以D-木糖或D-木酮糖为原料，制备L-戊糖中的用途。本公开发现的一种新的制备L-戊糖的方法，其相较于现有技术中传统的生产方法，生产工艺更加简单，并且使得生产L-戊糖的成本下降。

Description

D-木酮糖4-差向异构酶、其突变体及其用途

技术领域

本公开属于生物催化和合成生物学领域。本公开涉及能够可逆催化D-木酮糖和L-核酮糖之间相互转化的新型多肽(酶)以及它们的突变体，命名D-木酮糖4-差向异构酶(Xu4E)；以及通过构建多条人工酶途径，利用该酶，从自然界最丰富的戊糖D-木糖生产L-戊糖(即L-阿拉伯糖、L-核糖、L-核酮糖、L-木酮糖、L-木糖和L-来苏糖)的新方法。

背景技术

戊糖(或戊单糖)，化学式为C ₅H ₁₀O ₅，是五个碳原子的单糖。它们可分为两大类：戊醛糖和戊酮糖；一共有八种戊醛糖和四种戊酮糖，每一个戊酮糖对应两种戊醛糖。十二种戊糖也可分为L-型糖和D-型糖，并且每一型的糖具有四种戊醛糖和两种戊酮糖。D-木糖、D-核糖和L-阿拉伯糖是天然糖，但是其它戊糖是自然界中极少量存在的稀少糖。D-木糖为自然界中最丰富的戊糖。L-戊糖由于其在医疗和健康的应用，特别是作为许多重要医药前体的巨大潜能，引起很多的关注。

D-木糖为自然界中最丰富的戊糖，可以自木质纤维素中分离，被称为木糖(wood sugar)。D-木糖是半纤维素木聚糖的主要组成部分。现在D-木糖主要从玉米芯和甜菜浆的酸性或碱性水解物中分离，大部分木糖用来转化为零卡路里的甜味剂木糖醇。

L-阿拉伯糖为一种美国食品和药物管理局(FDA)批准的具有蔗糖50％甜度的、零卡路里天然甜味剂(Antila等1997，Boku等2001)。更重要的是，添加3-4％的L-阿拉伯糖到蔗糖，可以抑制蔗糖酶的活性，防止蔗糖水解，阻止蔗糖吸收，所以L-阿拉伯糖被认为是一种蔗糖中和剂，根据卡路里摄入(Morimoto等2001)。同时，在肠道中未利用的糖是一种促进有益细菌生长的益生元，从而抑制大肠中有害微生物的生长。L-阿拉伯糖也是一种用作合成药物的起始原料和一种广泛应用于分子生物学实验和工业发酵的生化产品。

L-阿拉伯糖以阿拉伯聚糖、阿拉伯木聚糖、阿拉伯半乳聚糖等形式存在于高等植物的半纤维素中。在日本，L-阿拉伯糖是利用碱法提取玉米纤维(Boku等2001)、阿拉伯树胶、甜菜浆(Antila等1997)等中的半纤维素，然后进行酸水解制得的。在中国，L-阿拉伯糖是对玉米芯进行酸水解生产D-木糖的副产物。L-阿拉伯糖的价格高、供应量有限大大地限制了其广泛的应用。

L-核糖在自然界中不广泛存在。它是许多新型核苷酸类似物的前体，用来生产抗病毒药物，如抗人类免疫缺陷病毒、肝炎病毒和巨细胞病毒的药物(Kim等2014)。L-核糖也可作为葡萄糖脱氢酶的竞争性抑制剂(Beerens等2012)。以前，L-核糖的生产方法是以通过核糖醇为中间产物的两步法微生物转化。最近，L-核糖的生物合成通过两步酶催化反应：通过L-阿拉伯糖异构酶(L-AI)和L-核糖异构酶(L-RI，EC 5.3.1.B3)或甘露糖6-磷酸异构酶(MPI，EC 5.3.1.8)将L-核酮糖转化为L-核糖(Kim等2014)。

L-核酮糖是合成L-核糖和L-阿拉伯糖的起始原料。它的5’-磷酸产物L-核酮糖5-磷酸是戊糖磷酸途径的重要代谢产物。

L-木酮糖可以作为α-葡萄糖苷酶的抑制剂，可以用来降低血糖。L-木酮糖也可用于生产其他重要的稀少糖，如用于生产抗病毒药物的L-核糖和作为肝炎或肝硬化指标的L-木糖。

L-来苏糖是用于动物的抗生素阿维拉霉素A的成分，是一种潜在的L-岩藻糖苷酶抑制剂。

L-木糖是合成抗乙肝病毒(HBV)核苷和合成L-核糖呋喃糖以及衍生物的起始原料。

表1不同种类的L-戊糖的应用

差向异构酶是一类催化含多个不对称中心的底物中某一个不对称碳原子发生构型变化的异构酶。人们寻找戊单糖4-差向异构酶已有很长时间，但是从来没有被报道过(Beerens等2017)。自然界中的4-差向异构酶，如L-核酮糖5-磷酸4-差向异构酶(EC 5.1.3.4)和UDP-D-木糖4-差向异构酶(EC 5.1.3.5)，需要其戊糖底物有磷酸或尿苷二磷酸(UDP)基团。

Ken Izumori教授提出了一个用于稀少糖生物合成的完整策略(如本公开的图1所示)。从D-木糖开始，通过使用L-核酮糖3-差向异构酶(或戊酮糖3-差向异构酶)、醛糖异构酶、醛糖还原酶和多元醇脱氢酶可制得其他11种戊糖。现有技术以D-木糖为原料，生产六种L-戊糖时，必须经过生产木糖醇或核糖醇的步骤，因此，需要使用两种基于辅酶NAD(P)的氧化还原酶——醛糖还原酶和多元醇脱氢酶。因为要使用昂贵且不稳定的辅酶(NAD(P))，对可逆的平衡反应中的产物以及有关中间体进行复杂分离，导致L-戊糖生产成本很高。

发明内容

发明要解决的问题

由于现有L-戊糖生产技术存在成本高、生产工艺复杂的缺陷，需要提供一种新的生产L-戊糖的方法。

在一个实施方式中，本公开提供一种野生型多肽(酶)及其突变体，其具有催化D-木酮糖和L-核酮糖相互转化的化学反应能力(图2)。本公开中的野生型D-木酮糖4-差向异构酶(D-xylulose 4-epimerase，Xu4E)及其突变体可以利用自然界中最丰富的戊糖，即D-木糖作为原料，生产L-戊糖。在一个实施方式中，示例性的L-戊糖选自六种L-戊单糖，即L-阿拉伯糖、L-核糖、L-核酮糖、L-木酮糖、L-木糖和L-来苏糖。

在另一个实施方式中，本公开提供一种制备前述Xu4E突变体的方法，其通过分子生物学和基因工程方法，制备Xu4E突变体。

在另一个实施方式中，本公开提供前述野生型Xu4E及其突变体的用途，其可以用于生产L-戊糖。

在另一个实施方式中，本公开提供一种新的用于生产L-戊糖的方法，所述方法包括以D-木糖或D-木酮糖为原料，生产L-戊糖的方法。

在另一个实施方式中，本公开提供一种新的用于生产L-戊糖的方法，所述方法包括利用Xu4E或其突变体，将D-木酮糖转化为L-核酮糖的步骤。

在一个具体的实施方式中，本公开提供了一种对于前述生产L-戊糖的方法进行进一步优化的方法。

用于解决问题的方案

本公开用于解决前述技术问题的技术方案如下。

(1)所述多肽具有D-木酮糖4-差向异构酶活性，其中，所述多肽选自由(a)-(d)组成的组中的任一项：

(a)由与SEQ ID NO：2-32任一项所示的序列具有至少60％、至少70％、至少80％或至少90％的序列同一性的序列编码的多肽；

(b)由多核苷酸编码的多肽，所述多核苷酸在非常高严格条件下与(i)或(ii)所示的多核苷酸杂交：

(i)编码如SEQ ID NO：2-32任一项所示的氨基酸序列的多核苷酸；

(ii)(i)的全长互补多核苷酸；

(c)多肽，所述多肽为如SEQ ID NO：2-32任一项所示的多肽的突变体，所述突变体在一个或多个位置处包含取代、重复、缺失或添加一个或多个氨基酸，并且所述多肽仍然具有D-木酮糖4-差向异构酶活性；以及

(d)由(a)、(b)、(c)所示的多肽的片段，并且所述片段具有D-木酮糖4-差向异构酶活性。

(2)根据(1)所述的多肽，其中，所述多肽为突变体，并且所述多肽与SEQ ID NO：2-32任一项所示的多肽相比，具有至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。

(3)根据(1)-(2)任一项所述的多肽，其中，所述多肽为如SEQ ID NO：2-32任一项所示的多肽的突变体，所述突变体在至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个位点处包含氨基酸的突变，并且所述多肽仍然具有D-木酮糖4-差向异构酶活性。

(4)根据(1)-(3)任一项所述的多肽，所述多肽为如下所示的多肽：

(a)与SEQ ID NO：2所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点处包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(b)与SEQ ID NO：3所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(c)与SEQ ID NO：4所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(d)与SEQ ID NO：5所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、270、271、301、310、322、341、398、406、407组成的组中的一种或多种；

(e)与SEQ ID NO：6所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、269、270、300、309、321、340、397、405、406组成的组中的一种或多种；

(f)与SEQ ID NO：7所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由117、140、146、176、178、285、286、316、325、337、355、412、420、421组成的组中的一种或多种；

(g)与SEQ ID NO：8所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由125、148、154、184、186、293、294、324、333、345、363、420、428、429组成的组中的一种或多种；

(h)与SEQ ID NO：9所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由124、147、153、183、185、297、298、328、337、349、368、425、433、434组成的组中的一种或多种；

(i)与SEQ ID NO：10所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由108、131、137、167、169、276、277、307、316、328、346、403、411、412组成的组中的一种或多种；

(j)与SEQ ID NO：11所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由115、138、144、174、176、280、281、311、320、332、351、408、416、417组成的组中的一种或多种；

(k)与SEQ ID NO：12所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由107、130、136、166、168、272、273、303、312、324、343、400、408、409组成的组中的一种或多种；

(l)与SEQ ID NO：13所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由109、132、138、168、170、275、276、306、315、327、346、403、411、412组成的组中的一种或多种；

(m)与SEQ ID NO：14所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由103、126、132、162、164、267、268、298、307、319、338、395、403、404组成的组中的一种或多种；

(n)与SEQ ID NO：15所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、271、272、302、311、323、342、399、407、408组成的组中的一种或多种；

(o)与SEQ ID NO：16所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由64、88、94、123、125、236、237、267、274、286、373、381、382组成的组中的一种或多种；

(p)与SEQ ID NO：17所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由110、133、139、169、171、271、272、302、311、323、342、399、407、408组成的组中的一种或多种；

(q)与SEQ ID NO：18所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402、403组成的组中的一种或多种；

(r)与SEQ ID NO：19所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由121、144、150、180、182、289、290、320、329、341、359、416、424、425组成的组中的一种或多种；

(s)与SEQ ID NO：20所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由107、130、136、166、168、273、274、304、313、325、344、401、409、410组成的组中的一种或多种；

(t)与SEQ ID NO：21所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由21、48、54、84、86、182、183、213、222、234、260、324、332、333组成的组中的一种或多种；

(u)与SEQ ID NO：22所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由30、55、61、91、93、202、203、233、242、254、273、330、338、339组成的组中的一种或多种。

(5)根据(1)-(4)任一项所述的多肽，其中，所述多肽为在对应于SEQ ID NO：2上的，存在如下所示的突变的多肽：

(a)在102位上的突变；

(b)在125位上的突变；

(c)在131位上的突变；

(d)在161位上的突变；

(e)在163位上的突变；

(f)在266位上的突变；

(g)在267位上的突变；

(h)在297位上的突变；

(i)在306位上的突变；

(j)在318位上的突变；

(k)在337位上的突变；

(l)在394位上的突变；

(m)在402位上的突变；

(n)在403位上的突变

(o)在267和297位上的组合突变；

(p)在306和403位上的组合突变；

(q)在125和297位上的组合突变；

(r)在163、267、403位上的组合突变；

(s)在125、267和297位上的组合突变；

(t)在163、267、297和403位上的组合突变；

(u)在125、163、267和297位上的组合突变；

(v)在125、163、267、297和403位上的组合突变；

(w)在125、163、267、297、402和403位上的组合突变；

(x)在163、267、297、306、402和403位上的组合突变；

(y)在125、163、267、297、306、402和403位上的组合突变；

(z)在125、131、163、267、297、306、402和403位上的组合突变；

(aa)

(bb)在125、163、267、297、306、318、402和403位上的组合突变；

(cc)在125、131、163、267、297、306、318、402和403位上的组合突变。

(6)根据(5)所述的多肽，其中，所述多肽为在对应于SEQ ID NO：2上的以下任一种位点的突变的多肽：

(a)对应于SEQ ID NO：2上的位点102的氨基酸由甘氨酸(G)突变为亮氨酸(L)；

(b)对应于SEQ ID NO：2上的位点125的氨基酸由丝氨酸(S)突变为天门冬氨酸(D)、半胱氨酸(C)、酪氨酸(Y)、谷氨酰胺(Q)、谷氨酸(E)、苏氨酸(T)或天冬酰胺(N)；

(c)对应于SEQ ID NO：2上的位点131的氨基酸由精氨酸(R)突变为天门冬氨酸(D)、苏氨酸(T)、谷氨酸(E)或丝氨酸(S)；

(d)对应于SEQ ID NO：2上的位点161的氨基酸由天门冬氨酸(D)突变为丙氨酸(A)；

(e)对应于SEQ ID NO：2上的位点163的氨基酸由缬氨酸(V)突变为赖氨酸(K)、精氨酸(R)、丝氨酸(S)、异亮氨酸(I)或蛋氨酸(M)；

(f)对应于SEQ ID NO：2上的位点266的氨基酸由谷氨酸(E)突变为丙氨酸(A)；

(g)对应于SEQ ID NO：2上的位点267的氨基酸由缬氨酸(V)突变为亮氨酸(L)、蛋氨酸(M)或异亮氨酸(I)；

(h)对应于SEQ ID NO：2上的位点297的氨基酸由天冬酰胺(N)突变为苯丙氨酸(F)、酪氨酸(Y)或赖氨酸(K)；

(i)对应于SEQ ID NO：2上的位点306的氨基酸由色氨酸(W)突变为蛋氨酸(M)、丝氨酸(S)或苏氨酸(T)；

(j)对应于SEQ ID NO：2上的位点318的氨基酸由谷氨酰胺(Q)突变为赖氨酸(K)；

(k)对应于SEQ ID NO：2上的位点337的氨基酸由赖氨酸(K)突变为天门冬氨酸(D)；

(l)对应于SEQ ID NO：2上的位点394的氨基酸由天门冬氨酸(D)突变为蛋氨酸(M)；

(m)对应于SEQ ID NO：2上的位点402的氨基酸由丝氨酸(S)突变为缬氨酸(V)、亮氨酸(L)、苯丙氨酸(F)、半胱氨酸(C)或酪氨酸(Y)；

(n)对应于SEQ ID NO：2上的位点403的氨基酸由酪氨酸(Y)突变为色氨酸(W)、苏氨酸(T)、异亮氨酸(I)或苯丙氨酸(F)。

(7)根据权利要求1-6任一项所述的多肽，其中，所述多肽来源于海栖热袍菌(Thermotoga maritima)，新阿波罗栖热袍菌(Thermotoga neapolitana)，栖热袍菌(Thermotoga sp)，Thermotoga caldifontis，产假假单胞菌(Pseudothermotoga lettingae)，牙合嗜盐菌(Halanaerobium congolense)，Thermosediminibacter litoriperuensis，Rhodothermus marinus，Gracilibacillus timonensis，栖热袍菌(Thermotogae bacterium)，Thermotogae bacterium，醋酸假丝酵母(Candidatus Acetothermia bacterium)，Pseudothermotoga thermarum，解热嗜热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)，Thermofilum adornatus，Thermoanaerobacter italicus，Thermotoga naphthophila，Thermoclostridium stercorarium，Dictyoglomus thermophilum，Spirochaeta thermophila，Singulisphaera acidiphila，Thermotoga caldifontis，Pseudothermotoga lettingae，枯草杆菌(Bacillus subtilis)，Geobacillus zalihae，Geobacillus stearothermophilus,Parageobacillus thermoglucosidasius,Thermoanaero-bacterium thermosaccharolyticum或大肠杆菌(Escherichia coli)。

(8)根据(1)所述的多肽，其中，所述多肽包括在如SEQ ID NO：2-32所示的多肽的N端或中间部位或C端缺失一个或超过一个氨基酸残基。

(9)根据(8)所述的多肽，其中，所述多肽选自下组：

(i)对应于如SEQ ID NO：2所示的多肽的N端起，缺失1-100个氨基酸，优选1-90个氨酸酸，更优选1-86个，更优选1-50个，更优选1-30个，最优选1-10个氨基酸而形成，并且具有催化D-木酮糖转化为L-核酮糖活性；或

(ii)对应于SEQ ID NO：2所示的多肽的第196-236位氨基酸中，缺失1-41个氨基酸，优选1-30个，更优选1-20个，最优选1-10个氨基酸而形成的，且具有催化D-木酮糖转化为L-核酮糖活性。

(10)根据(8)-(9)任一项所述的多肽，其中，所述多肽选自下组：

(i)对应于如SEQ ID NO：2所示的多肽中，缺失第1-86位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性；

(ii)对应于SEQ ID NO：2所示的多肽中，缺失第196-236位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性；或

(iii)对应于SEQ ID NO：2所示的多肽中，缺失第1-86位氨基酸和第196-236位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性。

(11)根据(1)-(10)任一项所述的多肽，其中，所述多肽包含与SEQ ID NO：33-122所示的序列具有至少96％的序列同一性的氨基酸序列或由其组成；可选的，所述多肽包含与如SEQ ID NO：33-122所编码的多肽中的任一项具有至少98.3％、至少98.5％、至少98.7％、至少98.9％、至少99.1％、至少99.3％、至少99.5％、至少99.7％或100％的序列同一性的氨基酸序列或由其组成。

(12)根据(1)-(11)任一项所述的多肽，其中，所述多肽和如SEQ ID NO：2所示的多肽相比，具有改进的D-木酮糖4-差向异构酶活性。

(13)根据(1)-(12)任一项所述的多肽，其中，所述多肽由包含如SEQ ID NO：33-122所示的序列编码，或者所述多肽为由如SEQ ID NO：33-122所示的序列编码的多肽。

(14)一种分离的多核苷酸，其中，所述多核苷酸包含编码根据(1)-(13)任一项所述多肽的核苷酸序列。

(15)根据(14)所述的分离的多核苷酸，其在编码如SEQ ID NO：2-32任一项所示的氨基酸的核苷酸中包含至少一个突变；优选的，所述多核苷酸序列编码如SEQ ID NO:33-122任一项所示的氨基酸。

(16)一种核酸构建体，其包含根据(14)或(15)所述的多核苷酸，所述多核苷酸与一个或多个调控序列可操作地连接，所述调控序列指导多肽在表达宿主中产生。

(17)一种重组表达载体，其包含根据(16)所述的核酸构建体。

(18)一种重组宿主细胞，其包含根据(16)所述的核酸构建体或根据(17)所述的重组表达载体。

(19)一种用于产生根据(1)-(13)中任一项所述的多肽的方法，其中，所述方法包括如下步骤：(a)在有助于所述多肽产生的条件下培养细胞或菌株，所述细胞或菌株产生所述多肽；其中，所述细胞或菌株包含根据(16)所述的核酸构建体或(17)所述的重组表达载体，所述核酸构建体或所述重组表达载体包含编码所述多肽的核苷酸序列；

可选的，所述方法还包括如下步骤：

(b)纯化或回收所述多肽。

(20)一种D-木酮糖转化为L-核酮糖的方法，其中，所述方法包括利用根据(1)-(13)任一项所述多肽进行催化反应。

(21)根据(20)所述的方法，其中，所述多肽由包含如SEQ ID NO：2-122任一项所示的氨基酸序列编码，或者所述多肽为由如SEQ ID NO：2-122任一项所示的序列编码的多肽。

(22)一种制备L-戊糖的方法，其中，所述制备L-戊糖的方法包括如下步骤：

(a)采用D-木酮糖4-差向异构酶，将D-木酮糖转化为L-核酮糖；

可选的，所述方法还包括：

(b)采用D-木糖异构酶，将D-木糖转化为D-木酮糖。

(23)根据(22)所述的方法，其中，所述方法进一步包括，采用L-阿拉伯糖异构酶，将L-核酮糖转化为L-阿拉伯糖，所述L-戊糖为L-阿拉伯糖。

(24)根据(22)所述的方法，其中，所述方法进一步包括，采用L-核糖异构酶或甘露糖6-磷酸异构酶或它们的组合，将L-核酮糖转化为L-核糖，所述L-戊糖为L-核糖。

(25)根据(22)所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，所述L-戊糖为L-木酮糖。

(26)根据(22)所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，采用L-岩藻糖异构酶或D-阿拉伯糖异构酶或L-鼠李糖异构酶，将L-木酮糖或L-木酮糖和L-核酮糖的组合转化为L-木糖，所述L-戊糖为L-木糖。

(27)根据(22)所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，采用L-鼠李糖异构酶将L-木酮糖转化为L-木糖，所述L-戊糖为L-来苏糖。

(28)根据(22)-(27)任一项所述的方法，其中，所述D-木酮糖4-差向异构酶选自(1)-(13)任一项所述的多肽；优选的，所述D-木酮糖4-差向异构酶由包含如SEQ ID NO：2-122任一项所示的氨基酸序列编码，或者所述酶为由如SEQ ID NO：2-122任一项所示的序列编码的酶。

(29)根据(22)-(28)任一项所述的方法，其中，所述方法中还包含纯化和/或分离所述L-戊糖的步骤。

(30)根据(29)所述的方法，其中，所述分离步骤包含使用模拟移动床(SMB)分离的步骤。

(31)根据(22)-(30)任一项所述的方法，其中，所述方法的反应体系中还包含酶反应液；优选的，所述酶反应液中含有金属离子；更优选的，所述金属离子可以为Co ²⁺、Zn ²⁺、Mg ²⁺、Mn ²⁺、Ca ²⁺、Ni ²⁺、Cu ²⁺、Fe ²⁺、Sr ²⁺、Ba ²⁺、Cd ²⁺、Pb ²⁺、Fe ³⁺、Al ³⁺、Bi ³⁺、Ag ⁺、Li ⁺中的一种或多种。

(32)根据(22)-(31)任一项所述的方法，其中，所述反应在有氧、微有氧或无氧条件下进行。

(33)根据(22)-(32)任一项所述的方法，其中，所述反应在30℃-90℃温度下进行；优选的，所述反应在40℃-80℃温度下进行。

(34)根据(22)-(33)任一项所述的方法，其中，所述反应在pH为3.0至11.0的范围内进行；优选的，所述反应在pH为4.0至10.0的范围内进行。

(35)根据(22)-(34)任一项所述的方法，其中，所述反应在无氧、45-55℃温度、pH为8.0、金属离子为Co ²⁺或Mg ²⁺或Mn ²⁺或它们的组合的的条件下进行。

(36)根据(22)-(35)任一项所述的方法，其中，所述反应包括体外催化反应或全细胞生物催化反应。

(37)根据(36)所述的方法，其中，所述反应为体外催化反应，所述体外催化反应可以分步进行或同时进行。

(38)根据(37)所述的方法，其中，所述体外催化反应分步进行时，其在一个反应容器中或一个以上串联的反应容器中进行。

(39)根据(38)所述的方法，其中，所述反应容器选自分批进料生物反应器、含固定化酶的填充床生物反应器、酶或细胞再循环生物反应器、含膜分离的生物反应器和连续进料生物反应器中的一种或多种。

(40)根据(22)-(39)任一项所述的方法，其中，所述体外催化反应中的酶以游离酶、含有所述酶的细胞裂解液、含有所述酶的全细胞、固定化酶中的一种或多种形式存在。

(41)根据(36)所述的方法，其中，所述全细胞生物催化反应的反应方式为利用细胞工厂进行反应，所述细胞中包含根据(16)所述的核酸构建体或根据(17)所述的重组表达载体。

(42)多肽在制备L-戊糖中的应用，所述多肽选自根据(1)-(13)中任一项所述的多肽。

(43)根据(42)所述的应用，其中，所述L-戊糖选自L-阿拉伯糖、L-核糖、L-核酮糖、L-木酮糖、L-木糖和L-来苏糖中的一种或多种。

(44)多肽作为具有D-木酮糖4-差向异构酶活性的酶的用途，所述多肽选自根据(1)-(13)中任一项所述的多肽。

发明的效果

在一个实施方式中，本公开发现了具有催化D-木酮糖和L-核酮糖相互转化的化学反应能力的野生型D-木酮糖4-差向异构酶(Xu4E)及其突变体。

在一个具体的实施方式中，本公开提供的Xu4E突变体相较于野生型Xu4E，具有改进的性质，例如改进的物理和/或化学性质。示例性的，在一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其比酶活增加；在另一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其反应速率增加；在另一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其K _m降低。

在另一个实施方式中，本公开发现了一种新的制备L-戊糖的方法，其相较于现有技术中传统的生产方法，生产工艺更加简单，并且使得生产L-戊糖的成本下降。

附图说明

图1示出了现有技术中将所有戊糖之间相互转化的Izumoring图。

图2示出了由D-木酮糖4-差向异构酶(Xu4E)催化的D-木酮糖和L-核酮糖之间相互转化的图。

图3示出了基于Xu4E将D-木糖转化为六种L-戊糖的人工多酶途径。其中，D-XI：D-木糖异构酶(EC 5.3.1.5)；L-AI：L-阿拉伯糖异构酶(EC 5.3.1.4)；L-RI：L-核糖异构酶(EC 5.3.1.B3)；MPI：甘露糖磷酸异构酶(EC 5.3.1.8)；D-LI：D-核糖异构酶(EC 5.3.1.15)；Ru3E：L-核酮糖3-差向异构酶(EC 5.1.3.31)；L-Ful：L-岩藻糖异构酶(EC 5.3.1.25)；D-AI：D-阿拉伯糖异构酶(EC 5.3.1.3)和L-RaI：L-鼠李糖异构酶(EC 5.3.1.14)。

图4示出了四种稀少糖的HPLC色谱分离的结果。其中，(a)示出了利用Bio-Rad Aminex HPX-87H氢离子交换柱，其分离条件为：柱温60℃，流动相为5mM硫酸，流速为0.6mL/min。(b)示出了利用Bio-Rad Aminex HPX-87P铅离子交换柱，其分离条件为：柱温60℃，流动相为去离子水，流速为0.6mL/min。(c)示出了利用Waters Sugar Pak I钙离子交换柱，其分离条件为：柱温80℃，流动相为去离子水，流速为0.5mL/min。(d)示出了利用Shodex Sugar KS-801钠离子交换柱，其分离条件为：柱温70℃，流动相为去离子水，流速为0.5mL/min。

图5示出了在不同反应条件下野生型Xu4E与通过定向进化获得的8个代表性的Xu4E突变体的比酶活的比较。

图6示出了基于野生型TmXu4E的单个氨基酸残基变化对其比活性的影响。

图7示出了通过热处理纯化的在大肠杆菌E.coli BL21(DE3)中表达的三种热稳酶(即D-XI、Xu4E和L-AI)的SDS-PAGE分析。T：总细胞裂解液，S：上清，H：热处理细胞裂解液。

图8示出了由50mM D-木糖一锅法生产L-阿拉伯糖。L-阿拉伯糖在包含1U/mL XI和1U/mL AI、0.2mM Co ²⁺、1mM Mn ²⁺、1mg/mL Xu4E(野生型或突变体)的100mM HEPES缓冲液(pH 8.0)中生产。反应在50℃无氧条件下进行。

图9示出了从500mM D-木糖一锅法生产L-阿拉伯糖。反应在包含10U/mL XI和10U/mL AI、0.2mM Co ²⁺、1mM Mn ²⁺、10mg/mL Xu4E M87的100mM HEPES缓冲液(pH 8.0)中进行。反应在50℃无氧条件下进行。

图10示出了通过生物转化和模拟移动床(SMB)分离(a)生产L-阿拉伯糖与工业化高果糖玉米糖浆(HFCS)生产和分离(b)的比较图。

图11示出了由Xu4E催化的底物(D-木酮糖)生产产物(L-核酮糖)的HPLC分离图。其中，HPLC分离的峰由一级质谱(图12)和二级质谱(图13)验证。

图12示出了HPLC分离的底物(D-木酮糖)和产物(L-核酮糖)峰的一级质谱图。

图13示出了HPLC分离的底物(D-木酮糖)和产物(L-核酮糖)峰的二级质谱图。

图14A和图14B示出了来自不同物种的具有Xu4E活性的多肽的氨基酸序列分析比较结果。

具体实施方式

定义

在本公开的权利要求和/或说明书中，除非上下文中另有说明，否则例如“一个/种(a,an)”、“所述(said)”或“所述(the)”等指示对象旨在支持单数和/或复数情况二者。

如在权利要求和说明书中所使用的，词语“包含”、“具有”、“包括”、“拥有”、或“含有”是指包括在内的或开放式的，并不排除额外的、未引述的元件或方法步骤。

如本公开所使用的，术语“约”表示：一个数值包括测定该数值所使用的装置或方法的误差的标准偏差。示例性的，前述标准偏差一般为原始数值相差20-30％的范围之内。

虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”，但除非明确表示仅为替代物或替代物之间相互排斥外，权利要求中的术语“或”是指“和/或”。

如本公开所使用的，尽管可以使用其他有机或无机催化剂，但术语“转化(converting)”是指主要由一种或多种的多肽(酶)催化从一个分子到另一个分子的化学转化；其得率是指产物的摩尔量与底物的摩尔量之间的比率(以％为单位)。

如本公开所使用的，术语“单糖”指任何一类糖(如D-葡萄糖、戊单糖、D-木糖、L-阿拉伯糖)，其不能水解得到更简单的糖，并且没有化学基团修饰，如磷酸基团或UDP基团。

如本公开所使用的，术语“戊糖”或“戊单糖”指分子含有五个碳原子的任何一类单糖，如D-木糖和L-阿拉伯糖。

如本公开所使用的，“单糖”可按“D-”、或“L-”标记。前述两个系列的划分是以甘油醛的结构为比较标准，并根据费歇尔投影式中最下面一个不对称碳原子的构型决定。规定将右旋的甘油醛定为费歇尔投影式中羟基在右的异构体，称为D-异构体；将左旋的定为羟基在左的甘油醛，称为L-异构体。也就是说，若单糖的该手性碳原子与D-甘油醛相同，羟基位于右端，则标记为D-单糖；若与L-甘油醛相同，羟基位于左端，则标记为L-单糖。

如本公开所使用的，术语“4-差向异构酶”是指，能交换糖的碳4位羟基的酶。示例性的，“4-差向异构酶”能够交换D-塔格糖和D-果糖的碳4位羟基的酶、能够交换D-木酮糖和L-核酮糖的碳4位羟基的酶、能够交换D-葡萄糖和D-半乳糖的碳4位羟基的酶、能够交换D-木糖和L-阿拉伯糖的碳4位羟基的酶。

如本公开所使用的，术语“多肽”、“酶”、“多肽或酶”、“多肽/酶”具有相同的含义，其在本公开中可以互换。前述术语是指一种由和很多氨基酸通过肽键组成的聚合物，其可能含有或可能不含有如磷酸基和甲酰基的修饰。

如本公开所使用的，术语“D-木酮糖4-差向异构酶”(D-xylulose 4-epimerase)及其缩写名称“Xu4E”是指，能够催化D-木酮糖和L-核酮糖相互转化的多肽(酶)。

如本公开所使用的，1个“酶活力单位(U)”定义为每分钟底物通过酶催化反应生成1μmol产物所需要的酶量。

如本公开所使用的，术语“比酶活”也被表述为“比活力”或“比活度”，其在本公开中具有相同的含义，可以互换使用。其是指每毫克多肽(酶)的酶活力(U/mg)。

如本公开所使用的，在两种核酸或多肽比较中的术语“序列同一性”或“同一性百分比”，是指当使用核苷酸或氨基酸残基序列比较算法或通过目视检查测量，以最大的对应性进行比较和比对时，它们是具有相同的或具有相同序列特定百分比数。也就是说，核苷酸或者氨基酸序列的同一性可以利用下述比例来定义，该比例是将两个或多个核苷酸或氨基酸序列按照一致的核苷酸或氨基酸数比较达到最大的方式，并根据需要加入空位来进行比对时一致的核苷酸数或氨基酸数，在比对部分的全部核苷酸或氨基酸数中的比例。

如本公开所使用的，两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定：将多核苷酸或多肽的核苷酸或氨基酸序列对准且对经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分，且将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸或缺失核苷酸而在一个位置处不同。多肽可例如通过含有不同氨基酸或缺失氨基酸而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言，可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。

示例性的，在本公开中，当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时，两个或多个序列或子序列具有至少40％、50％、60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％核苷酸或氨基酸残基的“序列同一性”或“同一性百分比”。“序列同一性”或“同一性百分比”的判断/计算可以基于序列任何合适的区域上。例如，长度至少约50个残基的区域、至少约100个残基的区域，至少约200个残基的区域，至少约400个残基的区域，或至少约500个残基的区域。在某些实施方案中，所述序列在任一或两个相比较的生物聚合物(就是核酸或多肽)的整个长度上基本相同。

如本公开所使用的，将不同序列的核苷酸或者氨基酸的编号进行对应的依据为，当使用核苷酸或氨基酸残基序列比较算法或通过目视检查测量，以最大的对应性进行比较或比对，进而判断“序列同一性”或“同一性百分比”时，目标核苷酸或者目标氨基酸相较于基准核苷酸或者基准氨基酸的编号。示例性的，在本公开中，“SEQ ID NO：5所示的序列，依据SEQ ID NO：2所示的序列进行编号”是指，SEQ ID NO：5所示的序列(相当于目标氨基酸)和SEQ ID NO：2所示的序列(相当于基准氨基酸)进行“序列同一性”或“同一性百分比”判断时，将SEQ ID NO：5所示的序列以最大的对应性对于SEQ ID NO：2所示的序列进行比较或比对时，SEQ ID NO：2所示的序列所对应的编号，即为SEQ ID NO：5所示的序列的编号。

如本公开所使用的，术语“氨基酸突变”或“核苷酸突变”，包括“取代、重复、缺失或添加一个或多个氨基酸或核苷酸”。在本公开中，术语“突变”是指核苷酸序列或者氨基酸序列的改变。在一个具体的实施方式中，术语“突变”是指“取代”。

在一个实施方式中，本公开的“突变”可以选自“保守突变”。在本公开中，术语“保守突变”是指可正常维持蛋白质的功能的突变。保守突变的代表性例子为保守置换。

如本公开所使用的，术语“保守置换”涉及用具有类似侧链的氨基酸残基替换氨基酸残基。本领域已经定义了具有类似侧链的氨基酸残基家族，并且包括具有碱性侧链(例如赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸和谷氨酸)、不带电极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、和半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸和色氨酸)、β-支链(例如苏氨酸、缬氨酸和异亮氨酸)和芳香侧链(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸)。

如本公开所使用的，“保守置换”通常在蛋白质的一个或多个位点上交换一种氨基酸。这种取代可以是保守的。作为被视作保守置换的置换，具体而言，可以举出Ala向Ser或Thr的置换、Arg向Gln、His或Lys的置换、Asn向Glu、Gln、Lys、His或Asp的置换、Asp向Asn、Glu或Gln的置换、Cys向Ser或Ala的置换、Gln向Asn、Glu、Lys、His、Asp或Arg 的置换、Glu向Gly、Asn、Gln、Lys或Asp的置换、Gly向Pro的置换、His向Asn、Lys、Gln、Arg或Tyr的置换、Ile向Leu、Met、Val或Phe的置换、Leu向Ile、Met、Val或Phe的置换、Lys向Asn、Glu、Gln、His或Arg的置换、Met向Ile、Leu、Val或Phe的置换、Phe向Trp、Tyr、Met、Ile或Leu的置换、Ser向Thr或Ala的置换、Thr向Ser或Ala的置换、Trp向Phe或Tyr的置换、Tyr向His、Phe或Trp的置换、及Val向Met、Ile或Leu的置换。此外，保守突变还包括起因于基因所来源的个体差异、株、种的差异等天然产生的突变。

如本公开所使用的，术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式，也可以是更大的核苷酸序列结构的一个组成部分，其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的，能够通过标准分子生物学方法(例如，使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时，这也包括一个RNA序列(即A、U、G、C)，其中“U”取代“T”。换句话说，“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物，或者可以是一个较大核苷酸结构的组成部分或成分，如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。“重组多核苷酸”属于“多核苷酸”中的一种。

如本公开所使用的，术语“重组多核苷酸”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中，且该载体可用于转化至合适的宿主细胞。含有重组多核苷酸的宿主细胞被称为“重组宿主细胞”。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”。

如本公开所使用的，术语“表达”包括涉及多肽产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰、和分泌。

如本公开所使用的，术语“表达载体”是指线状或环状DNA分子，该分子包含编码多肽的多核苷酸并且该多核苷酸有效地连接于供用于其表达的控制序列。

如本公开所使用的，术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括，例如包含i)对基因表达具有调控作用的遗传元素的集合，例如启动子和增强子；ii)转录成mRNA并翻译成蛋白质的结构或编码序列；以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要，并可以使用任何载体，包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列，例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体，来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。

如本公开所使用的，术语“可操作地连接”是指如下的构造：调控序列相对于多核苷酸的编码序列安置在适当位置，从而使得该调控序列指导该编码序列的表达。示例性的，所述调控序列可以选自启动子和/或增强子编码的序列。

如本公开所使用的，术语“核酸构建体”包含与适合的调控序列有效地连接的编码多肽或结构域或模块的多核苷酸，该调控序列对于在所选细胞或者菌株进行多核苷酸的表达是必需的。

如本公开所使用的，术语“内源的”指在生物体或细胞内自然表达或产生的多核苷酸、多肽或其他化合物。也就是说，内源性多核苷酸、多肽或其他化合物不是外源的。例如，当细胞最初从自然界分离时，细胞中存在一种“内源性”多核苷酸或多肽。

如本公开所使用的，术语“外源的”指在需要表达的特定细胞或有机体中天然发现或表达的任何多核苷酸或多肽。外源多核苷酸、多肽或其他化合物不是内源性的。

如本公开所使用的，术语“野生型的”指在自然界中可以找到的对象。例如，一种存在于生物体中，可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。如本公开所用的，“天然存在的”和“野生型的” 是同义词。

如本公开所使用的，术语“突变体”是指相对于“野生型”，或者“相比较的”多核苷酸或多肽，在一个或多个(例如，若干个)位置处包含改变(即，取代、插入和/或缺失)的多核苷酸或多肽，其中，取代是指用不同的核苷酸或氨基酸置换占用一个位置的核苷酸或氨基酸。缺失是指去除占据某一位置的核苷酸或氨基酸。插入是指在邻接并且紧随占据位置的核苷酸或氨基酸之后添加核苷酸或氨基酸。示例性的，本公开中的“突变体”为仍然具有D-木酮糖4-差向异构酶(Xu4E)活性的多肽。

如本公开所使用的，“过表达的”重组基因比微生物中相应的天然存在的基因产生更多的RNA和/或蛋白质。本领域测量RNA和蛋白质量的方法是已知的。过表达也可以通过测量蛋白质活性，如酶活性来测定。根据本公开的实施方案，“过表达”是至少3％、至少5％、至少10％、至少20％、至少25％或至少50％以上的量。过表达的多核苷酸通常是宿主细胞固有的多核苷酸，其产物的生成量大于宿主细胞中的正常生成量。例如但并非限制，过表达通过可操作性地将多核苷酸连接到不同于多核苷酸的天然启动子的启动子，或将多核苷酸的附加拷贝引入宿主细胞实现。

如本公开所使用的，术语“片段”意指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如，若干个)氨基酸的一种多肽或一个催化或碳水化合物结合模块。在本公开的技术方案中，所述片段具有D-木酮糖4-差向异构酶(Xu4E)活性。

如本公开所使用的，术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质，(2)包括但不限于任何酶、突变体、核酸、蛋白质、肽或辅因子的任何物质，该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除；(3)相对于天然发现的物质通过人工修饰的任何物质；或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生；编码该物质的基因的多个拷贝；以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中。例如宿主细胞可以被遗传修饰以表达本公开的多肽。来自宿主细胞的发酵液将包含分离的多肽。分离的物质可以存在于生物转化液的样品中。例如目标产物L-阿拉伯糖可以从酶催化的多糖混合液体中分离出来。

如本公开所使用的，术语“高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

如本公开所使用的，术语“非常高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

如本公开所使用的，术语“游离酶”指不含活生物体的酶。本公开的游离酶可在经过裂解其所表达的细胞，是部分或高度纯化之后，悬浮在溶液中，是可溶的或结合到不溶性基质上。

如本公开所使用的，术语“固定化酶”，是指在一定的空间范围内起催化作用，并能反复和连续使用的酶。通常酶催化反应都是在水溶液中进行的，而固定化酶是将水溶性酶用物理或化学方法处理，使之成为不溶于水的，但仍具有酶活性的状态。

如本公开所使用的，术语“宿主细胞”意指易于用包含本公开的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。

如本公开所使用的，术语“全细胞微生物”指没有完全裂解细胞膜的全细胞。含有所述酶的全细胞微生物可以直接使用，或固定化以保持稳定性和可回收再利用，或者可以对全细胞进行通透性处理，以获得快速反应速率。

如本公开所使用的，术语“催化反应”是指在催化剂作用下进行的化学反应。一种催化剂只能选择性地加速特定的反应，从而可能使化学反应朝着几个热力学可能的方向之一进行。催化剂与反应物处于同一相的称均相催化反应(Homogeneous Catalytic Reaction)，处于不同相者称异相催化反应(或多相催化反应)(Heterogeneous Catalytic Reaction)。由生物催化剂-酶参加的反应称酶催化反应(Enzymic Catalytic Reaction)。

在一个具体的实施方式中，所述催化反应可以在全细胞体外由酶或多酶进行催化，前述催化反应也可以被称为“酶催化反应”，指利用酶作为催化剂进行化学转化的过程，这种反应过程又称为生物转化(biotransformation)或生物催化(biocatalysis)。

在另一个具体的实施方式中，所述催化反应可以在生物体内/细胞内进行，前述催化反应也可以被称为“胞内催化反应”。

如本公开所使用的，术语“胞内催化反应”也可以被称为“全细胞生物催化反应”，其是指利用完整的生物有机体(即全细胞、组织甚至个体)作为催化剂进行化学转化的过程。全细胞生物催化反应中常用的有机催化体主要是微生物，其本质是利用一个或多个微生物细胞内的一个酶或多个酶进行催化。现在也发展出利用动物细胞、植物细胞甚至生物个体等进行的生物转化方式。常用的全细胞生物转化方式是将细胞固定于反应平面、微球体悬浮、多孔固相载体等方式。

如本公开所使用的，术语“发酵产物”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。发酵产物可以含有在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地，发酵产物是未分级的并且包含用过的培养基以及例如通过离心去除微生物细胞(例如，丝状真菌细胞)之后存在的细胞碎片。在一些实施方式中，发酵产物含有用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

如本公开所使用的，术语“生物催化产物”是指由生物催化剂(多肽或酶或全细胞)进行生物催化产生的不经历或经历最低限的回收和/或纯化的制剂。生物催化是在生物催化剂催化的水相缓冲液中进行，包含金属离子。在一些实施方式中，生物催化剂包括游离酶进行反应、含有所述酶的细胞裂解液、含有所述酶的全细胞生物、固定化所述酶、和交联所述酶的聚集体。

如本公开所使用的，术语“生物反应器”是利用酶或生物体(如微生物)所具有的生物功能，进行生物转化反应的装置系统。它是一种生物功能模拟机，如发酵罐、固定化酶或固定化细胞反应器等。

除非另外定义或由背景清楚指示，否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。

D-木酮糖4-差向异构酶及突变体

在一个实施方式中，我们发现了从未报道过的戊糖4-差向异构酶，其可实现D-木酮糖和L-核酮糖之间的相互转化。我们将其命名为D-木酮糖4-差向异构酶(Xu4E)(图2)。

在一个具体的实施方式中，我们首次从两个酶家族的一些酶中发现了有具有Xu4E的酶活性：塔格糖酮酸3-差向异构酶(EC 5.1.2.7)和L-核酮糖5-磷酸4-差向异构酶(EC 5.1.3.4)。

在另一个实施方式中，我们利用野生型Xu4E，制造了xu4e的DNA突变体库，并从中鉴定了具有改变的物理化学性质的Xu4E突变体。

示例性的，在一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其比酶活增加；在另一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其反应速率增加；在另一个具体的实施方式中，Xu4E突变体相较于野生型Xu4E，其K _m降低。

用于L-戊糖生产的人工酶途径

我们设计了无需辅酶NAD(P)的、基于Xu4E将D-木糖转化为6种L-戊糖的人工多酶催化途径(表2)。借助于Xu4E及其突变体，我们设计了人工多酶催化途径，通过4-差向异构酶、3-差向异构酶和醛糖异构酶(图3和表2)，从D-木糖制备6种L-戊糖(即L-阿拉伯糖、L-核糖、L-核酮糖、L-木糖、L-来苏糖和L-木酮糖)，这些人工多酶途径不需要昂贵的两个NAD(P)依赖的氧化还原酶(即醛糖还原酶和多元醇脱氢酶)。

示例性的，在本公开所示的L-戊糖的生产过程中，不需要通过图1所示的经过木糖醇或核糖醇的途径。

表2.基于Xu4E从D-木糖生产L-戊糖的人工多酶催化途径

酶和/或其突变体

本公开公开的新酶自然存在于各种生物体中。虽然在实施例中使用具有所需活性的特定酶，但本公开不限于这些酶，因为其他酶可能具有类似的活性并且可以使用。例如，可能发现一些新的多肽也可以催化D-木酮糖和L-核酮糖的相互转化。本公开中描述的其他反应可由本实施的方案中未描述的酶催化，也被包括在本实施方案中。

在某些实施方案中，可在本公开中使用这些酶的突变体，其中催化活性已被改变，例如使其在酸性或碱性条件下更为活跃和稳定。多肽的氨基酸序列突变体包括替换、插入或缺失突变体，并且突变体可与未经修饰的酶基本上同源或基本相同。在某些实施方案中，突变体至少保留酶的一些生物活性，例如催化活性。其他突变体包括保留至少约10％，优选至少约50％、更优选至少约75％、最优选至少约90％生物活性的酶突变体。

一种来源于生物体的多肽或多核苷酸含有对天然氨基酸序列或核苷酸序列的一个或多个修饰，并与天然酶相比，如果不是更好的话，表现出类似的活性(例如，是天然酶活性水平的至少10％、至少30％、至少50％、至少70％、至少80％、至少90％、至少100％或者至少110％，甚至更高的酶活性)。例如，在某些情况下，通过亲本/天然存在序列的定向进化改善酶活性。另外可选地，对酶编码序列进行突变以获得所需的性能。示例性的，所述“所需的性能”选自热稳定性更好、反应速率增加、最适pH改变或金属辅因子偏好性等。

酶的形式

本公开中所使用的游离酶或含有所述酶的细胞裂解液是水溶性的。通常最好使用固定化酶。固定化酶通常更稳定和耐用。固定化酶也更容易回收并在多个催化循环中使用，从而降低了生产过程的成本。在本领域，许多酶固定化的方法是已知的。酶也可以交叉连接以形成交联酶聚集体(Cross-linked enzyme aggregate,CLEA)，其通常更稳定并且更易于回收和再利用。许多酶都存在于生物体中，它们可以作为生物催化剂生产稀少糖，但是它们也可以在经工程改造的微生物中进行异源表达，然后可以用作生物催化剂。

本公开中所使用的重组酶可保留在整个细胞中，而无需完全的细胞裂解。整个细胞含有一种或多种酶。通常最好使用固定化的全细胞。全细胞可以通过许多技术进行通透性处理，如有机溶剂处理、化学试剂处理或热处理。固定化细胞也更容易回收并在多个催化循环中反复使用，从而降低了生产过程的成本。在本领域，许多全细胞通透性和全细胞固定化的方法是已知的。本公开涉及催化本公开所述反应的全细胞的固定化和交联方法。

易错PCR

易错PCR是在采用DNA聚合酶进行启动子序列扩增时，通过调整反应条件，如提高镁离子浓度、加入锰离子、改变体系中四种的dNTPs浓度或运用低保真度DNA聚合酶等方法，来改变DNA扩增过程中的突变频率，从而以较高突变频率向目标DNA序列中随机引入突变，获得针对目标序列的随机突变体。

生产L-戊糖的过程

(1)生产/分离/纯化过程

本公开的方法和组合物可以适于各种常规发酵或酶催化生物反应器(例如分批、分批进料、细胞或酶再循环和连续发酵或连续酶催化)。

在本公开的实施例中，每单位时间形成的生物催化产物的量一般来说是酶的催化活性条件(例如pH、温度、金属离子)和催化工艺中所存在的酶的量的函数。

在本公开的实施方式中，含有所述金属离子的溶液中可以含有一种或者多种金属离子。示例性的，所述含有金属离子的溶液可以选自含有CuCl ₂、FeCl ₃、ZnCl ₂、CaCl ₂、MgCl ₂、CoCl ₂、NiCl ₂或MnCl ₂的溶液。

高效微生物催化的发酵工艺的一些关键参数包括能够使微生物生长到较大细胞密度、增加所要产物的产率、增加容积生产率的量、去除不合需要的共代谢物、改进便宜的碳和氮来源的利用、调适以改变发酵槽条件、增加菌体的生产、增加重组酶的合成、增加对酸性条件的耐受性、增加对碱性条件的耐受性、增加对有机溶剂的耐受性、增加对高盐条件的耐受性和增加对高温或低温的耐受性。

在一些实施例中，如本文中提供的多个酶，它们可以以游离酶、含有所述酶的细胞裂解液、含有所述酶的全细胞、固定化酶中的一种或多种形式存在，在含戊糖底物的反应液中进行生物催化，使转化的产物生成到反应液中。在一个实施例中，酶催化的最终产物可以使用本领域中已知的任何合适方法从反应液中分离。

L-戊糖可从多酶、反应物、反应中间物以及生物催化产物中分离，并使用本领域已知的各种方法从反应物以及反应中间物回收和/或纯化生物催化产物。在一些实施例中，将生物催化产物从生物反应器中回收。在一个实施例中，使微生物破裂，并且将培养基或溶解物离心以去除微粒细胞碎片和分离细胞膜，得到可溶蛋白质部分包括所述酶，将所述多酶可以催化生产L-戊糖。L-戊糖的分离纯化方法包括，但不限于色谱法、模拟移动床色谱法、结晶法、基于离子型、疏水性和尺寸排除树脂的吸附和释放、过滤、微滤、超滤、纳滤、离心、萃取、盐或溶剂沉淀、干燥或其组合。所需的分离不限于酶的去除/ 回收，也包括回收一些或所有剩余产物和反应物(包括D-木糖、D-木酮糖、L-戊糖和金属离子)的混合物；所需的分离可能无需进一步纯化。具有或不具有D-木糖、D-木酮糖和L-核酮糖回收、以及酶的纯化、固定化和回收利用是包括在本公开进一步的实施方案。

(2)在经改造的微生物细胞生产多肽(酶)

本公开所述的催化一些或所有反应的酶可在非天然的、经工程改造的异源生物体中表达。具体地，编码途径用酶的基因可被分离，插入到用于转化生产的生物体的表达载体中，可被并入至基因组，并直接表达所述酶。在本领域，用于操纵微生物的方法是已知的，如《分子生物学现代方法》(Online ISBN：9780471142720,John Wiley and Sons,Inc.)、《微生物代谢工程：方法和规程》(Qiong Cheng Ed.,Springer)和《系统代谢工程：方法和规程》(Hal S.Alper Ed.,Springer)等出版物中被解释。

可以使用本领域熟知的方法通过上调或下调该多核苷酸的表达来构建突变体，例如插入、破坏、替换、或缺失。例如，待修饰或失活的多核苷酸可以是活性必需的编码区或其部分，或编码区的表达所需的调控元件。此类调节或控制序列的实例可以是启动子序列或其功能部分，即足以影响多核苷酸表达的部分。可修饰的其他控制序列包括但不限于：前导子、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。

本领域技术人员可培养经工程改造的微生物细胞生产所述酶。微生物细胞生产重组酶的指南和规程可在以下出版物中找到，如《发酵和生物化学工程手册：原理、过程设计和仪器》(2nd Edition,Henry C.Vogel and Celeste L.Todaro,Noyes Publications 1997)和《发酵技术原理》(2nd Edition,P.F.Stanbury et.al.,Butterworth Heineman,2003)。

(3)生物反应条件

在本公开的一些实施例中，将多个酶进行混合组成人工多酶途径，可以将原料，如D-木糖或其他中间产物(D-木酮糖)，转化为L-戊糖，并回收L-戊糖。生物反应过程可以在有氧、微氧或无氧条件下进行。在本公开的另一些实施例中，生物催化反应在无氧条件下(即没有可检测的氧气)中进行。

在本公开的一些实施例中，生物反应过程在30℃-90℃的条件下进行反应。在本公开的一些具体实施例中，生物反应过程在40℃-80℃的条件下进行反应。在本公开的一些更具体实施例中，生物反应过程在50℃-70℃的条件下进行反应。在本公开的一些更具体实施例中，生物反应过程在60℃-70℃的条件下进行反应。

质粒以及重组蛋白制备

所有重组蛋白的过表达均使用大肠杆菌E.coli BL21(DE3)进行。本公开中涉及的所有重组蛋白的表达/过表达方法，均可以根据《分子生物学实验指南》记载的技术方案进行。

示例性的，携带有相应蛋白编码基因的pET质粒制备方式如下所述。

为制备可能拥有Xu4E酶活的L-核酮糖5-磷酸-4-差向异构酶(RP4E)，它们来源于海栖热孢菌(T.maritima)、大肠杆菌(E.coli)、芽孢杆菌(Bacillus subtilis 168)以及嗜热脂肪芽孢杆菌(Geobacillus stearothermophilus)的rp4e基因被从它们相应的基因组中扩增获得。通过基于延长重叠延伸PCR(POE-PCR)的简单克隆技术(You,C.,X.-Z.Zhang and Y.-H.P.Zhang(2012)."Simple Cloning:direct transformation of PCR product(DNA multimer)to Escherichia coli and Bacillus subtilis."Appl.Environ.Microbiol.78:1593-1595.)，它们被插入到pET20b质粒，构建得到相应质粒pET20b-TmRP4E、pET20b-EcRP4E、pET20b-BsRP4E和pET20b-GsRP4E。POE-PCR的反应条件如下：250ng pET20b质粒骨架及等摩尔的目的基因片段，0.2mM各种dNTPs，以及0.02U/μl Q5 DNA聚合酶。PCR扩增条件：98℃ 1min；98℃ 20s，60℃ 20s，72℃ 72s，30个循环；72℃ 5min。

为制备可能拥有Xu4E酶活的野生型D-木酮糖4-差向异构酶(Xu4E)，利用一对引物F_UxaE(F)和R_UxaE(R):

F(SEQ ID NO：123)：5’-GAGATATACCCATATGGTCTTGAAAGTGTTCAAAGACC-3’；

R(SEQ ID NO：124)：GGTGGTGGTGCTCGAGCCCCTCCAGCAGATCCACGTGCC-3’。

通过PCR方法，将uxaE基因从海栖热孢菌基因组中扩增得到。

基于pET28a，利用一对引物F_pET28a(F)和R_pET28a(R)进行扩增：

F(SEQ ID NO：125)：5’-GCTGGAGGGGCTCGAGCACCACCACCACCACCACTG-3’；

R(SEQ ID NO：126)：5’-CTTTCAAGACCATATGGGTATATCTCCTTCTTAAAG-3’。

通过POE-PCR方法，扩增得到多聚体质粒，被转入到大肠杆菌E.coli TOP10，得到质粒pET28a-tm_UxaE。

为制备L-阿拉伯糖异构酶(L-AI)，来源于耐热菌嗜热脂肪芽孢杆菌(Geobacillus stearothermophilus)的AI的DNA序列经过密码子优化并由通用生物(安徽，中国)合成，得到质粒pET20b-BsAI。

编码来源于嗜热栖热菌(Thermus thermophiles)的耐热木糖异构酶(D-XI)的质粒pET20b-TtcXI，是从参考文献得到(Wu等2018)。

除特别注明，所有重组酶均有拥有组氨酸融合标签，利用镍离子树脂通过亲和吸附进行纯化。携带有编码目的蛋白基因的pET质粒利用大肠杆菌E.coli BL21细胞在250毫升LB培养基中培养，培养温度为37℃。当细胞吸光度A ₆₀₀达到～0.6-0.8时，添加0.1mM IPTG诱导蛋白表达。蛋白表达在37℃进行6小时或在18℃进行16小时。通过离心收集细胞后，使用包含有0.1M氯化钠以及10mM咪唑的50mM HEPES缓冲液(pH 7.5)重悬沉淀。超声破碎细胞膜，离心后，将含所述酶的上清液样品上样到镍离子树脂纯化柱上。使用包含有0.1M氯化钠以及150-500mM咪唑的50mM HEPES缓冲液(pH 7.5)洗脱纯化目的酶。酶浓度可以被Bradford测量方法进行测定，牛血清蛋白用作标准品蛋白。重组蛋白的表达水平以及蛋白的纯度使用十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)进行检测，并使用Image Lab软件(伯乐，赫拉克勒斯，加利福尼亚，美国)的丰度分析功能进行定量。

用于L-阿拉伯糖合成的热稳酶，是来源于嗜热栖热菌(Thermus thermophiles)的D-木糖异构酶、来源于海栖热孢菌(T.maritima)的野生型Xu4E及Xu4E突变体M8、以及来源于嗜热脂肪芽孢杆菌(Geobacillus stearothermophilus)的L-阿拉伯糖异构酶，它们可以通过热处理(50-80℃，10-60分钟)进行纯化。细胞裂解液经过热处理和离心，将包含上述三个酶的上清液混合，可以用于从D-木糖到L-阿拉伯糖的转化。

构建筛选质粒pGS-Xu4E及筛选宿主大肠杆菌JZ919

筛选质粒pGS-Xu4E包含在P _BAD启动子控制下的mCherry基因、在P _AraC启动子控制下的野生型的araC基因，以及在P _tac启动子控制下的xu4e基因。在大肠杆菌细胞中，Xu4E阳性突变体可产生更多的L-阿拉伯糖，从而诱导大肠杆菌细胞表达更高水平的mCherry荧光蛋白，产生更强的荧光信号。筛选质粒利用标准DNA组装技术进行构建。

大肠杆菌E.coli JZ919(TOP10ΔxylB：：araA)被构建用作筛选宿主，与筛选质粒pGS-Xu4E共同使用。筛选质粒pGS-Xu4E携带有基因传感器能对胞内的L-阿拉伯糖浓度进行检测，显示mCherry荧光信号。为积累L-阿拉伯糖，大肠杆菌宿主细胞中与D-木酮糖和L-核酮糖利用相关的两个基因被敲除，同时araA基因被插入到大肠杆菌的基因组。从大肠杆菌E.coli Top10(ΔaraABCD)出发，基因组中的xylB基因被araA基因替代，敲除与插入同步进行。

构建Xu4E突变体文库

xu4e基因的突变体文库利用低突变率的易错PCR(ep-PCR)建立。

以质粒pET28a-UxaE作为DNA模板，引物为：MUxaE-IF(SEQ ID NO：127)： 5’-CCATATGGTCTTGAA-3’；MUxaE-IR(SEQ ID NO：128)：5’-GGTGGTGGTGCTCGAGCCCCTCCAGCAGATCCACG TGCC-3’。

通过PCR扩增得到突变体文库。MUxaE-IF为5’-末端磷酸化引物。MUxaE-I R 5’末端的最后28bp序列与质粒骨架的序列为同源互补序列。50μl ep-PCR反应体系包括1ng/μl质粒pGS-Xu4E、0.2mM dATP、0.2mM dGTP、1mM dCTP、1mM dTTP、5mM MgCl ₂、0.05mM MnCl ₂、0.4μM引物(MUxaE-IF和MUxaE-IR)以及0.05U/μl NEB Taq聚合酶。

Xu4E突变体文库的高通量筛选

E.coli JZ919的化学感受态细胞可以根据现有技术，例如通过《分子生物学实验指南》中记载的方法进行制备。进一步的，将携带uxaE突变体文库的E.coli JZ919细胞在含有D-木糖的LB固体培养基上进行培养。在37℃培养12小时后，每4小时观察菌落颜色。通过眼球观察或者通过UV辐射检测菌落的荧光强度挑选阳性克隆。显示更强荧光强度的克隆被挑选并在含有0.5毫升LB培养基的96深孔板培养，LB培养基中添加D-木糖，在37℃培养12小时。96孔板中细胞培养基的荧光信号利用SynergyMx多功能微孔板检测仪(伯腾，佛蒙特，美国)。荧光激发扫描在589nm进行，发射扫描在610nm进行。

判断多肽/酶是否具有Xu4E酶活性的测定方法

D-木糖/D-木酮糖混合液的准备。D-木糖/D-木酮糖混合液在1毫升50mM HEPES缓冲液(pH 7.5)中制备，缓冲液中含有1M木糖、5mM MgCl ₂和50mg固定化的D-XI，XI购自Sigma-Aldrich(G4166)。在70℃，过夜反应后，通过离心除去固定化的XI。D-木糖/D-木酮糖混合液包含大约700mM木糖和300mM木酮糖。

Xu4E的酶活性测定是使用分步酶活测定方法。反应液是50mM Tris缓冲液包括含有70mM木糖，30mM木酮糖和0.2mM Co ²⁺或2mM Zn ²⁺。除特殊注明，Xu4E酶活测定在30-80℃进行15分钟到24小时，酶蛋白溶度是0.001-10g/L。Xu4E催化反应后，吸取65μL反应液与35μL 1.88M HClO ₄混合，混合液加入13.5μL 5M KOH中和。离心去掉沉淀后，第二步转化反应在含有10U/mL(过量的)L-AI和1mM Mn ²⁺的50mM HEPES缓冲液(pH 7.5)中进行将含有L-核酮糖的上清液被转化为L-阿拉伯糖，酶反应在50℃进行15min。L-阿拉伯糖浓度用Megazyme L-阿拉伯糖/D-半乳糖测定试剂盒(K-ARGA，博雷，爱尔兰)测定。

为测定动力学参数，Xu4E的酶活测定在含有0.2mM Co ²⁺的50mM Tris缓冲液(pH 8.5)中在50℃进行。D-木糖及D-木酮糖的总浓度为1.5到1000mM，而D-木酮糖的浓度为0.5到300mM。酶活测定在50℃进行15min。Xu4E对于D-木酮糖的表观K _m及k _cat常数基于米氏方程的非线性拟合，使用GraphPad Prism 5软件计算(Graphpad软件公司，洛杉矶，加利福尼亚，美国)。

利用D-木糖生产L-阿拉伯糖

从50mM D-木糖生产L-阿拉伯糖在1毫升的反应体系中进行，反应体系是100mM HEPES缓冲液(pH 8.0)包括0.2mM Co ²⁺、1mM Mn ²⁺、1g/L Xu4E(野生型，它的DNA序列SEQ ID No：1，和代表性突变体M8，它的氨基酸序列SEQ ID No：40)、1U/mL D-XI和1U/mL L-AI。从500mM D-木糖生产L-阿拉伯糖时，Xu4E的浓度增加为10g/L，而D-XI和L-AI的浓度也增加为10U/mL。反应液在三酶混合后在50℃反应。L-阿拉伯糖的浓度使用Megazyme L-阿拉伯糖/D-半乳糖测定试剂盒(K-ARGA，博雷，爱尔兰)测定，而D-木糖、D-木酮糖和L-核酮糖的浓度使用配有示差折光检测器的岛津高效液相色谱进行检测，使用伯乐Aminex HPLC HPX-87H液相柱进行分离。

确认Xu4E利用D-木酮糖生产的产物为L-核酮糖

通过野生型或者突变型Xu4E，得到的产物L-核酮糖使用LC-ESI-QTOF-MS分析。1mL反应体系中包括50mM Tris缓冲液(pH 8.5)、10mM D-木酮糖、0.2mM Co ²⁺和1g/L Xu4E。反应在50℃进行1小时后添加538μL HClO ₄终止反应。混合液添加207μL 5M KOH中和。离心去除失活的蛋白及沉淀，样品使用岛津高效液相色谱进行分离，产品使用配有电喷雾离子化(ESI)的四级杆飞行时间串联质谱QTOF(compact QTOF，Bruker，德国)进行检测。。沃特世Sugar Pak I钙离子交换柱(300x 6.5mm，10μm粒径尺寸)被用作固定相用于样品分离(Waters Co，米尔福德，马塞诸萨，美国)。流动相为去离子水，流速为0.5mL/min，柱温为80℃，上样量为20μl。ESI使用负离子模式。毛细管电压为4500V，喷雾器压力位2bar，干燥加热器为200℃，干燥气流为8L/min。

发酵产物或细胞裂解液

本公开还涉及包含本公开的多肽的发酵产物或细胞裂解液。发酵产物进一步包含在发酵过程中使用的另外的成分，例如全细胞(包括含有编码本公开的多肽的基因的宿主细胞，这些宿主细胞被用于产生感兴趣的多肽)、或细胞裂解液。在一些实施例中，该组合物是含有杀灭的含所述酶的全细胞、含所述酶的细胞裂解液以及含培养基的含所述酶的细胞杀灭的全培养液。

模拟移动床分离

模拟移动床(SMB)是一种利用吸附原理进行液体分离操作的传质设备，它是以逆流连续操作方式进行。工业化的SMB已经被越来越多的用于分离低附加值的生物产品，比如有机酸、氨基酸和稀少糖。结合酶固定化及SMB分离可有效降低所需L-戊糖的生产成本并提高底物的利用效率。示例性的，SMB树脂包括Shodex Sugar KS-801钠离子交换柱、Waters Sugar Pak I钙离子交换柱、Bio-Rad Aminex HPX-87P铅离子交换柱或Bio-Rad Aminex HPX-87H氢离子交换柱所用到的一种，或其他类似的树脂，或者它们的系列组合。

实施例

本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是，应当理解的是，详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出，因为在阅读该详细说明后，在本公开的精神和范围内所作出的各种改变和修饰，对于本领域技术人员来说将变得显而易见。

实施例中采用的所有试剂，除非另有强调，否则均可以通过商业途径购买获得。

材料与方法

药品与材料

除特殊注明，所有药品均为分析纯或更高纯度，采购自Sigma-Aldrich(圣路易斯，密苏里州，美国)或中国国药集团(上海，中国)。海栖热孢菌(Thermotoga maritima)MSB8以及风产液菌(Aquifex aeolicus)的基因组DNA采购自美国菌种保藏中心American Type Culture Collection(马纳萨斯，弗吉尼亚，美国)。大肠杆菌E.coli TOP10和DH5α(赛默飞世尔科技，沃尔瑟姆，马塞诸塞，美国)被用于DNA操作以及质粒扩增。大肠杆菌E.coli BL21(DE3)(英潍捷基生命技术有限公司，卡尔斯巴德，加利福尼亚，美国)被用于重组蛋白的表达。

在本公开的技术方案中，说明书核苷酸和氨基酸序列表的编号所代表的含义如下所示：

SEQ ID NO：1所示的是海栖热袍菌(Thermotoga maritima)MSB8的野生型塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_004081526.1，KEGG ID TM0440)的核苷酸序列；

SEQ ID NO：2所示的是海栖热袍菌(Thermotoga maritima)MSB8的野生型塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_004081526.1，KEGG ID TM0440)的氨基酸序列；

SEQ ID NO：3所示的是新阿波罗栖热袍菌(Thermotoga neapolitana)的塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_015918744.1)的氨基酸序列；

SEQ ID NO：4所示的是栖热袍菌SG1(Thermotoga sp SG1)的塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_101512888.1)的氨基酸序列；

SEQ ID NO：5所示的是Thermotoga caldifontis的塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_041077375.1)的氨基酸序列；

SEQ ID NO：6所示的是产假假单胞菌(Pseudothermotoga lettingae)的塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_012002872.1)的氨基酸序列；

SEQ ID NO：7所示的是牙合嗜盐菌(Halanaerobium congolense)的塔格糖酮酸碳3-差向异构酶基因(NCBI参考序列：WP_081374543.1)的氨基酸序列；

SEQ ID NO：8所示的是Thermosediminibacter litoriperuensis的4-差向异构酶基因(NCBI参考序列：TYP53248.1)的氨基酸序列；

SEQ ID NO：9所示的是Rhodothermus marinus的4-差向异构酶基因(NCBI参考序列：WP_012844026.1)的氨基酸序列；

SEQ ID NO：10所示的是Gracilibacillus timonensis的4-差向异构酶基因(NCBI参考序列：WP_066188474.1)的氨基酸序列；

SEQ ID NO：11所示的是栖热袍菌(Thermotogae bacterium)的4-差向异构酶基因(NCBI参考序列：HCZ06146.1)的氨基酸序列；

SEQ ID NO：12所示的是Thermotogae bacterium的4-差向异构酶基因(NCBI参考序列：RKX45454.1)的氨基酸序列；

SEQ ID NO：13所示的是醋酸假丝酵母(Candidatus Acetothermia bacterium)的4-差向异构酶基因(NCBI参考序列：HAF71394.1)的氨基酸序列；

SEQ ID NO：14所示的是Pseudothermotoga thermarum的4-差向异构酶基因(Kegg ID：Theth_1083)的氨基酸序列；

SEQ ID NO：15所示的是解热嗜热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)DSM 571的4-差向异构酶基因(Kegg ID：Tthe_2391)的氨基酸序列；

SEQ ID NO：16所示的是Thermofilum adornatus 1505的4-差向异构酶基因(Kegg ID：TCARB_0828)的氨基酸序列；

SEQ ID NO：17所示的是Thermoanaerobacter italicus的4-差向异构酶基因(Kegg ID：Thit_1746)的氨基酸序列；

SEQ ID NO：18所示的是Thermotoga naphthophila的4-差向异构酶基因(Kegg ID：Tnap_0222)的氨基酸序列；

SEQ ID NO：19所示的是Thermoclostridium stercorarium DSM 8532的4-差向异构酶基因(Kegg ID：Cst_c08510)的氨基酸序列；

SEQ ID NO：20所示的是Dictyoglomus thermophilum的4-差向异构酶基因(Kegg ID：DICTH_1923)的氨基酸序列；

SEQ ID NO：21所示的是Spirochaeta thermophila DSM 6192的4-差向异构酶基因(Kegg ID：STHERM_c04350)的氨基酸序列；

SEQ ID NO：22所示的是Singulisphaera acidiphila的4-差向异构酶基因(Kegg ID：Sinac_2806)的氨基酸序列；

SEQ ID NO：23所示的是Thermotoga maritima MSB8的D-木酮糖5-磷酸4-差向异构酶基因(Kegg ID：TM0283)的氨基酸序列；

SEQ ID NO：24所示的是Thermotoga caldifontis的D-木酮糖5-磷酸4-差向异构酶基因(NCBI Reference Sequence：WP_041077291.1)的氨基酸序列；

SEQ ID NO：25所示的是Thermotoga neapolitana DSM 4359的D-木酮糖5-磷酸4-差向异构酶基因(GenBank：ACM22577.1)的氨基酸序列；

SEQ ID NO：26所示的是Pseudothermotoga lettingae的II类醛缩酶(GenBank：KUK21094.1)的氨基酸序列；

SEQ ID NO：27所示的是枯草芽孢杆菌(Bacillus subtilis)的D-木酮糖5-磷酸4-差向异构酶基因(Kegg ID：BSU28780)的氨基酸序列；

SEQ ID NO：28所示的是Geobacillus zalihae的D-木酮糖5-磷酸4-差向异构酶基因(NCBI Reference Sequence：WP_060788488.1)的氨基酸序列；

SEQ ID NO：29所示的是Geobacillus stearothermophilus的D-木酮糖5-磷酸4-差向异构酶基因(GenBank：KFL15052.1)的氨基酸序列；

SEQ ID NO：30所示的是Parageobacillus thermoglucosidasius的D-木酮糖5-磷酸4-差向异构酶基因(NCBI Reference Sequence：WP_042385633.1)的氨基酸序列；

SEQ ID NO：31所示的是Thermoanaerobacterium thermosaccharolyticum的D-木酮糖5-磷酸4-差向异构酶基因(NCBI Reference Sequence：WP_094043878.1)的氨基酸序列；

SEQ ID NO：32所示的是大肠艾希氏菌(Escherichia coli)K-12MG1655的D-木酮糖5-磷酸4-差向异构酶基因(Kegg ID：b0061)的氨基酸序列。

SEQ ID NO：33-122所示的是发明人构建的突变体。所述突变体的具体突变位点参见本公开中表3的记载。

需要说明的是，根据现有技术的数据库(例如GenBank)中公开的内容，与如SEQ ID NO：3-32所示的氨基酸序列所对应的核苷酸序列，也属于本领域技术人员已知的内容。

实施例1.戊糖的分离和检测

D-木糖、D-木酮糖、D-核酮糖和L-阿拉伯糖，通过使用如下(1)-(4)中所述的任一种方法进行分离：

(1)伯乐(Bio-Rad)Aminex HPLC HPX-87H液相离子交换柱进行分离，其分离条件为：柱温为60℃，流动相为5mM硫酸，流速为0.6mL/min。

(2)伯乐Aminex HPX-87P铅离子交换柱，柱温为80℃，流动相为去离子水，流速为0.6mL/min；

(3)沃特世Sugar Pak I钙离子交换柱，柱温为80℃，流动相为去离子水，流速为0.5mL/min；以及

(4)Shodex Sugar KS-801钠离子交换柱，柱温为70℃，流动相为去离子水，流速为0.5mL/min。

对于通过上述(1)-(4)的方法，分离得到的D-木糖、D-木酮糖、D-核酮糖和L-阿拉伯糖，其浓度可以使用配有示差折光检测器的岛津高效液相色谱进行检测。

实验结果：对于D-木糖、D-木酮糖、D-核酮糖和L-阿拉伯糖，利用以上(1)-(4)所示的HPLC进行色谱分离的效果如图4所示。其中，(1)所示的HPLC分离条件具有最好的分离效果。

实施例2.从L-核酮糖-5-磷酸4-差向异构酶中挖掘具有Xu4E功能的酶

考虑到底物结构的相似性以及可能的酶催化机理，我们从L-核酮糖-5-磷酸4-差向异构酶家族(RP4E，EC 5.1.3.4)中选择了有可能具备将D-木酮糖转化为L-核酮糖功能的Xu4E酶。我们分别从枯草芽孢杆菌(Bacillus subtilis 168)、嗜热脂肪芽孢杆菌(Geobacillus stearothermophilus)、大肠杆菌(Escherichia coli)以及海栖热孢菌(T.maritima)中克隆了四个RP4E，并把它们克隆至pET质粒。携带有表达质粒的E.coli BL21(DE3)被培养并且表达重组蛋白。

通过亲和吸附纯化出带有His-tag的蛋白后，通过本公开中记载的用于“ 判断多肽/酶是否具有Xu4E酶活性的测定方法”，对得到的重组蛋白进行检测。从检测结果来看，三个来源于海栖热孢菌、枯草芽孢杆菌以及嗜热脂肪芽孢杆菌的RP4E表现出一定的Xu4E 活性，其比活力大约为0.0002～0.0003U/mg，而E.coli来源的RP4E的比活力低于0.0001U/mg。

基于上述实验结果，我们从更多具有L-核酮糖-5-磷酸4-差向异构酶家族(RP4E，EC5.1.3.4)的微生物中克隆了相应的rp4e基因，并把它们克隆至pET质粒。携带有前述表达质粒的E.coli BL21(DE3)被培养并且表达重组蛋白。进一步的，通过本公开中记载的用于“ 判断多肽/酶是否具有Xu4E酶活性的测定方法”，对得到的重组蛋白进行检测。

通过前述实验方法进行检测，发现具有Xu4E酶的活性的天然酶为由如SEQ ID NO：23-32所示的序列编码的酶。

实施例3.从塔格糖酮酸3-差向异构酶中挖掘具有Xu4E功能的新酶

考虑到底物结构的相似性以及可能的酶催化机理，我们采用和实施例2类似的方法，从塔格糖酮酸3-差向异构酶(UxaE，EC 5.1.2.7)中选择了有可能具备将D-木酮糖转化为L-核酮糖功能的新酶。我们分别从不同的微生物中克隆了多个uxae基因，并把它们克隆至pET质粒。携带有表达质粒的E.coli BL21(DE3)被培养并且表达重组蛋白。

通过亲和吸附纯化出带有His-tag的蛋白后，通过本公开中记载的用于“ 判断多肽/酶是否具有Xu4E酶活性的测定方法”，对得到的重组蛋白进行检测。从检测结果来看，来自海栖热孢菌的塔格糖酮酸3-差向异构酶(Tm0440)在没有最优化的反应条件(70度，5mM Zn ²⁺)，显示出比酶活大约是0.012U/mg。

通过前述实验方法进行检测，发现具有Xu4E酶的活性的天然酶为由如SEQ ID NO：2-22所示的序列编码的酶。

实施例4.增强活性的Xu4E突变体M4

我们使用来源于海栖热孢菌，具备较高热稳定性以及较高催化混杂活性的塔格糖酮酸3-差向异构酶(TmXu4E)作为定向进化出发的天然酶。其中，前述TmXu4E的氨基酸序列为如SEQ ID NO：2所示的序列，编码前述氨基酸的核苷酸序列为如SEQ ID NO：1所示的序列。

我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中，并涂布到含有D-木糖的LB培养基固体平板上。大约10,000克隆在平板上被筛选，阳性突变体被挑出接种到96孔板中，在含有D-木糖的LB培养基中培养。利用本公开中记载的“ Xu4E突变体文库的高通量筛选”方法，我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。每轮几个阳性突变体被挑选。

从筛选得到的突变体中，我们从中选择了含有S125D的突变体M4。我们对突变体M4的比酶活进行了检测。结果发现，相对于天然酶，M4表现出25％比酶活的提高(图5)。

实施例5.继续增强活性的Xu4E突变体M47

从实施例4中选择的突变体M2出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中，并涂布到含有D-木糖的LB培养基固体平板上。大约10,000克隆在平板上被筛选，阳性突变体被挑出接种到96孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有两个氨基酸突变S125D/N297F的突变体M47。我们对前述突变体M47的比酶活进行了检测。结果发现，M47表现出更高的比酶活(图5)。

实施例6.继续增强活性的Xu4E突变体M57

从实施例5中选择的突变体M47出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中，并涂布到含有D-木糖的LB培养基固体平板上。大约10,000克隆在平板上被筛选，阳性突变体被挑出接种到96孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有三个氨基酸突变S125D/V267I/N297F的突变体M57。我们对前述突变体M57的比酶活进行了检测。结果发现，M57表现出更高的比酶活(图5)。

实施例7.继续增强活性的Xu4E突变体M61

从实施例6中选择的突变体M57出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中，并涂布到含有D-木糖的LB培养基固体平板上。大约20,000克隆在平板上被筛选，阳性突变体被挑出接种到96孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有四个氨基酸突变S125D/V163K/V267I/N297F的突变体M61。我们对前述突变体M61的比酶活进行了检测。结果发现，M61表现出更高的比酶活(图5)。

实施例8.继续增强活性的Xu4E突变体M64

从实施例7中选择的突变体M61出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中并涂布到含有D-木糖的LB培养基固体平板上。大约15,000克隆在平板上被筛选，阳性突变体被挑出接种到96深孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了突变体M64，其包含有五个氨基酸突变S125D/V163K/V267I/N297F/Y403W。我们对前述突变体M64的比酶活进行了检测。结果发现，M64表现出更高的比酶活(图5)。

实施例9.继续增强活性的Xu4E突变体M72

从实施例8中选择的突变体M64出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中，并涂布到含有D-木糖的LB培养基固体平板上。大约12,000克隆在平板上被筛选，阳性突变体被挑出到96孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有六个氨基酸突变S125D/V163K/V267I/N297F/S402V/Y403W的突变体M72。我们对前述突变体M72的比酶活进行了检测。结果发现，M72表现出更高的比酶活(图5)。

实施例10.继续增强活性的Xu4E突变体M75

从实施例9中选择的突变体M72出发，我们使用低突变率的易错PCR(即每基因产生～1个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中并涂布到加入D-木糖的LB培养基固体平板上。大约18,000克隆在平板上被筛选，阳性突变体被挑出到96孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有七个氨基酸突变S125D/V163K/V267I/N297F/W306M/S402V/Y403W的突变体M75。我们对前述突变体M75的比酶活进行了检测。结果发现，M75表现出更高的比酶活(图5)。

实施例11.继续增强活性的Xu4E突变体M87

从实施例9中选择的突变体M72出发，我们使用低突变率的易错PCR(即每基因产生1-2个突变位点)去构建xu4e突变体文库。插入到质粒pGS-Xu4E的突变体文库被转入到宿主E.coli JZ919中并涂布到加入D-木糖的LB培养基固体平板上。大约25,000克隆在平板上被筛选，阳性突变体被挑出到96深孔板中，在含有D-木糖的LB培养基中培养。我们使用酶标仪对微孔板中的细胞培养液的荧光信号进行检测，确认阳性突变体。

从筛选得到的突变体中，我们从中选择了包含有九个氨基酸突变S125D/R131S/V163K/V267I/N297F/W306M/Q318K/S402V/Y403W的突变体M87。前述突变体M87的氨基酸序列为如SEQ ID NO：119所示的序列。

实施例12.M87突变体的比酶活测定

我们将实施例11得到的突变体M87的比酶活与野生型Xu4E进行了对比(图5)。

从比较的结果来看，突变体M87的比酶活大约为2U/mg。也就是说，突变体相较于野生型Xu4E，其比酶活有了明显的提高。

实施例13.单点氨基酸突变的突变体制备

从野生型TmXu4E开始，通过本公开中记载的“ 构建Xu4E突变体文库”的方法，我们制备了九个单一氨基酸位点的突变体文库，它们是通过定点饱和突变在野生型TmXu4E上改变一个氨基酸残基。其中，前述野生型TmXu4E的氨基酸序列为如SEQ ID NO：2所示的序列，编码前述氨基酸的核苷酸序列为如SEQ ID NO：1所示的序列。

九个氨基酸突变位点选自突变体M87，它们分别是在位置125的丝氨酸，在位置131的精氨酸，在位置161的缬氨酸，在位置267的缬氨酸，在位置297的天冬酰胺，在位置306的色氨酸，位置318的谷氨酰胺，位置402的丝氨酸，或位置403的酪氨酸。将9个突变体文库插入宿主大肠杆菌JZ919的质粒pGS-Xu4E，再将它们涂布在每个含有D-木糖的LB培养基。通过本公开记载的“ Xu4E突变体文库的高通量筛选”方法筛选阳性突变体。与野生型酶相比，阳性突变体在96孔微孔板中得到验证，并通过DNA测序进行测序。

从筛选得到的突变体中，我们从中选择了如下9个突变体：S125D，R131S，V163K，V267I，N297F，W306M，Q318K，S402V和Y403W，其中，前述突变体中氨基酸的编号均根据SEQ ID NO：2进行编号。

将上述9个突变体在大肠杆菌BL21(DE3)中过表达，并通过在含镍离子树脂上的亲和吸附进行纯化。突变体S125D，V163K，V267I，N297F，W306M，Q318K，S402V和Y403W的Xu4E酶的比活度在图6所示。其中，八个突变体的比活性高于野生型TmXu4E，而一个突变体R131S变异体的比活度比野生型TmXu4E略低。

实施例14.多点氨基酸Xu4E突变体的制备和比酶活测定

通过和实施例4-实施例11相同的方法，我们对Xu4E突变体进行了进一步的筛选。

经过筛选，我们得到基于Xu4E的多点氨基酸突变体如下(其中，前述Xu4E突变体均根据SEQ ID NO：2进行编号)：

M41(双突变)：V267I/N297F；

M46(双突变)：W306M/Y403W；

M50(三突变)：V163K/V267I/Y403W；

M58(四突变)：V163K/V267I/N297F/Y403W；

M68(六突变)：V163K/V267I/N297F/W306M/S402V/Y403W；

M78(七突变)：R131S/V163K/V267I/N297F/W306M/S402V/Y403W。

通过本公开记载的“ Xu4E酶活测定”方法，对上述突变体的比酶活进行检测。

从实验结果来看，M41，M46，M50，M58，M68，M78酶活分别大约为0.30U/mg，0.21U/mg，0.18U/mg，0.33U/mg，0.41U/mg，0.57U/mg。

实施例15.单点氨基酸Xu4E突变体的制备和比酶活测定

通过和实施例4相同的方法，我们得到了Xu4E突变体库。

我们得到的Xu4E突变体如下(其中，前述Xu4E突变体均根据SEQ ID NO：2进行编号)：

M13(单突变)：D161A；

M19(单突变)：E266A；

M1(单突变)：G102L；

M30(单突变)：K337D；

M31(单突变)：D394M。

从实验结果来看，M13，M19，M1，M30，M31酶活分别大约为0.008U/mg，0.013U/mg，0.03U/mg，0.06U/mg，0.04U/mg。

从上述实验结果来看，虽然上述Xu4E突变体的比酶活和野生型TmXu4E(0.09U/mg)相比，存在一定程度的降低，但是，其仍然具有Xu4E酶活性。

实施例16.重组热稳酶的简单纯化

来源于嗜热栖热菌(T.thermophiles)的D-木糖异构酶，来源于海栖热孢菌(T.maritima)的Xu4E，以及来源于嗜热脂肪芽孢杆菌(G.stearothermophilus)的L-阿拉伯糖异构酶在大肠杆菌E.coli BL21(DE3)中异源表达。收集细胞并破碎后，细胞裂解液的上清液通过热处理(70℃，20min)。离心后，将包含三个热稳酶的上清液混合，用于D-木糖到L-阿拉伯糖的生物转化。目标蛋白的表达水平及纯化后的蛋白纯度使用SDS-PGAE检测(图7)。

实施例17.从D-木糖合成L-核酮糖

我们构建了一个包括D-木糖异构酶(D-XI)和Xu4E突变体M87的双酶体系，底物为50mM D-木糖。反应混合物包括100mM HEPES缓冲液(pH 8.0)、0.2mM Co ²⁺、1mM Mn ²⁺、1g/L Xu4E M8和1U/mL XI。反应液温和混合后在无氧条件下50℃进行反应。

经过12小时反应后，L-核酮糖使用HPLC检测，成功获得L-核酮糖。证明该人工路线结果与设计一致。

实施例18.利用50mM D-木糖合成L-阿拉伯糖

我们构建了一个包括D-木糖异构酶(D-XI)、Xu4E突变体M87和L-阿拉伯糖合成酶(L-AI)的三酶体系，底物为50mM D-木糖。反应混合物是100mM Tris缓冲液(pH 8.0)包括0.2mM Co ²⁺、1mM Mn ²⁺、1g/L Xu4E(其中，Xu4E选自野生型或M87突变体)、1U/mL D-XI和1U/mL L-AI。三酶和含底物的反应液混合后，在50℃进行反应。

含有Xu4E突变体M87的三酶体系，在8小时反应后生产了21mM L-阿拉伯糖，而包含了野生型的三酶体系24小时反应仅仅生产了1.25mM L-阿拉伯糖(图8)。

实施例19.利用500mM D-木糖合成L-阿拉伯糖

我们构建了一个包括D-木糖异构酶(D-XI)、Xu4E突变体M87和L-阿拉伯糖合成酶(L-AI)的三酶体系，底物为500mM D-木糖。反应混合物包括100mM Tris缓冲液(pH 8.0)、0.2mM Co ²⁺和1mM Mn ²⁺。Xu4E的浓度为15g/L，XI及AI的浓度提升为20U/mL。

含有M87的三酶体系4小时反应后生产了175mM L-阿拉伯糖。它的比体积生产速率达到6.56g L-阿拉伯糖/升/小时。反应8小时后，当反应达到平衡时，底物D-木糖为207mM，中间产物D-木酮糖及L-核酮糖分别为55及42mM，产物L-阿拉伯糖为196mM(图9)。

实施例20.利用D-木糖生产L-核糖

我们构建了一个包括D-木糖异构酶(D-XI)、Xu4E突变体M87和磷酸甘露糖异构酶(MPI)的三酶体系，底物为50mM D-木糖。来源于嗜热脱氮芽孢杆菌(G.thermodenitrificans)的mpi基因被克隆并插入到pET质粒(Kim等2014)。反应混合物是50mM Tris缓冲液(pH 8.0)包括0.2mM Co ²⁺、1mM Mn ²⁺、1g/L Xu4E(M87突变体)、1U/mL XI和1U/mL MPI。三酶和含底物的反应液混合后，催化反应在下40℃进行。

24小时反应后，L-核糖使用HPLC检测，证明该人工路线结果与设计一致。

实施例21.L-戊糖的生产及分离

由于差向异构酶及异构酶所催化的反应存在反应平衡，将目的底物与酶及底物/中间产物进行有效分离非常重要。比如，利用D-葡萄糖生产高果糖浆就是利用模拟移动床 (SMB)对D-葡萄糖和果糖浆进行分离，得到含高果糖的糖浆，而没有被利用D-葡萄糖被进一步循环利用(图10)。固定化的木糖异构酶以及包含木糖异构酶的固定化微生物全细胞已经被广泛用于工业上生产高果糖浆(图10)。将多个酶进行共固定，不限于纯化后的重组酶或含过表达重组酶的细胞粗裂解液，延长了酶的使用寿命，便于酶及产物/中间产物的分离，并且降低了酶的使用成本。此外，对包含所述酶的微生物全细胞进行固定化，提高生物催化剂的稳定性及生物催化剂的可重复利用性，是可选择的解决方案。此外，为提高反应速度，对微生物全细胞进行透化处理，也是可选择的解决方案。

在本实施例中，我们采用了模拟移动床(SMB)，有关填充树脂不限于Shodex Sugar KS-801钠离子交换柱、Waters Sugar Pak I钙离子交换柱、Bio-Rad Aminex HPX-87P铅离子交换柱、Bio-Rad Aminex HPX-87H氢离子交换柱、或有着相似功能的色谱分离柱。

以L-阿拉伯糖的生产为例，模拟移动床(SMB)可用于将L-阿拉伯糖与未被利用的D-木糖及中间产物L-核酮糖和D-木酮糖进行分离(图10)。

实施例22.Xu4E催化的产物L-核酮糖的表征

用野生型Xu4E和Xu4E突变体M87催化底物D-木酮糖的反应。野生型Xu4E在50℃下进行24小时，Xu4E突变体M87在50℃下进行10分钟。通过配备有Waters Sugar Pak柱的HPLC分离底物D-木酮糖和产物L-核酮糖。

HPLC色谱图如图11所示。产物(L-核酮糖)的保留时间是15.49分钟的新峰(黑色实线)，与L-核酮糖标准品的保留时间相同。与D-木酮糖和L-核酮糖的标准品相比，HPLC分离的产物峰由一级质谱(图12)和二级质谱(图13)表征。

实验结果清楚地证明，野生型Xu4E和Xu4E突变体M87能够催化从D-木酮糖到L-核酮糖的酶反应。

实施例23.不同来源的野生型Xu4E的突变体的功能检测

基于生物信息学的方法，我们将实施例3、实施例14和实施例15获得的不同野生型Xu4E的序列进行了分析比较。其中，＊所示的是不同来源的野生型Xu4E的保守氨基酸位点。

与此同时，我们通过如本申请实施例记载的试验方法，按照与如SEQ ID NO：2所示的序列相比，计算序列同一性时的编号，对前述不同野生型的Xu4E中的氨基酸进行编号。

我们发现，如图14A和图14B所示，对于前述不同的野生型的Xu4E，在其对应于前述如SEQ ID NO：2所示的编号进行编号时，其对应于SEQ ID NO：2所示的编号的如下位置的氨基酸，进行突变后，仍然具有Xu4E活性：G102、S125、R131、D161、V163、E266、V267、N297、W306、Q318、K337、D394、S402和Y403。

实施例24.构建序列缩短的Xu4E突变体

我们将编码野生型Xu4E进行截短，将编码1-86位及196-236位的氨基酸序列分别或一起去除，并通过本公开记载的方法，判断前述截短后的Xu4E突变体的生物活性。

实验结果显示，序列截短后蛋白的活性仍保持Xu4E的活性，分别为野生型Xu4E酶活的90％(去除1-86位氨基酸)，87％(去除196-236位氨基酸)或85％(同时去除1-86位氨基酸和196-236位氨基酸)。

实施例25.本公开中具有Xu4E活性的酶的统计

通过本公开实施例4-16所记载的方法，我们得到了具有Xu4E活性的酶的序列，以及其酶活的实验结果。

实验结果如表3所示。

表3本公开中具有Xu4E活性的酶的实验结果

本说明书公开的所有技术特征都可以任何组合方式进行组合。本说明所公开的每个特征也可以被其它具有相同、相等或相似作用的特征所替换。因此，除非特殊说明，所公开的每一特征仅仅是一系列相等或相似特征的实例。

此外，从上述描述中，本领域技术人员可从本公开中很容易清楚本公开的关键特征，在不脱离本公开的精神及范围的情况下，可对发明进行很多修改以适应各种不同的使用目的及条件，因此这类修改也旨在落入所附权利要求书的范围内。

参考文献

Antila,J.,V.Ravanko and P.Walliander(1997).Method of preparing L-arabinose from sugar beet pulp.US6506897B1.

Bhosale,S.H.,M.B.Rao and V.V.Deshpande(1996)."Molecular and industrial aspects of glucose isomerase." Microbiological Reviews 60(2):280.

Boku,T.,I.Kusakabe,N.Matsuo and e.al.(2001).Method for isolating l-arabinose.JP2002262899A.

Izumori,K.,S.Sugimoto and B.Kraska(1980)."Induction of D-ribose isomerase by L-ribose in Mycobacterium smegmatis." Agric.Biol.Chem.44:223-225.

Izumori,K.,Y.Ueda and K.Yamanaka(1978)."Pentose metabolism in Mycobacterium smegmatis:comparison of L-arabinose isomerase induced by L-arabinose and D-galactose." J.Bacteriol.133:413-414.

Kim,K.-R.,E.-S.Seo and D.-K.Oh(2014)."l-Ribose Production from l-Arabinose by Immobilized Recombinant Escherichia coli Co-expressing the l-Arabinose Isomerase and Mannose-6-Phosphate Isomerase Genes from Geobacillus thermodenitrificans." Appl.Biochem.Biotechnol.172(1):275-288.

Kim,Y.S.,K.C.Shin,Y.R.Lim and D.K.Oh(2013)."Characterization of a recombinant L-rhamnose isomerase from Dictyoglomus turgidum and its application for L-rhamnulose production." Biotechnol.Lett.35:259-264.

Morimoto,A.,K.Mukai,Y.Nisikawa,H.Tanaka and G.Yoshikawa(2001).Process for producing l-arabinose,l-arabinose-containing enzymatically processed products,diet foods,diabetic diet foods and fruit or vegetable juices and process for producing the same.EP1167536A1.

Mortlock,R.P.(1966)."D-Arabinose isomerase." Methods Enzymol.9:583-585.

Park,C.S.,S.J.Yeom,Y.R.Lim,Y.S.Kim and D.K.Oh(2010)."Characterization of a recombinant thermostable L-rhamnose isomerase from Thermotoga maritima ATCC 43589 and its application in the production of L-lyxose and L-mannose." Biotechnol.Lett.32:1947-1953.

Rodionova,I.A.,D.A.Scott,N.V.Grishin,A.L.Osterman and D.A.Rodionov(2012)."Tagaturonate–fructuronate epimerase UxaE,a novel enzyme in the hexuronate catabolic network in Thermotoga maritima." Environ.Microbiol.14(11):2920-2934.

Uechi,K.,G.Takata,Y.Fukai,A.Yoshihara and K.Morimoto(2013)."Gene Cloning and Characterization of L-Ribulose 3-epimerase from Mesorhizobium loti and Its Application to Rare Sugar Production." Bioscience,Biotechnology,and Biochemistry 77(3):511-515.

Wu,R.,C.Ma,Y.-H.P.Zhang and Z.Zhu(2018)."Complete oxidation of xylose for bioelectricity generation by reconstructing a bacterial xylose utilization pathway in vitro." ChemCatChem 10(9):2030-2035.

Yang,S.J.,Y.H.Kim,S.B.Kim,S.W.Park,I.H.PARK,M.H.Kim and Y.M.Lee(2014).Production method for tagatose.WO2014196811A1,US20160138053A1..

Yang,S.J.,Y.H.Kim,I.H.PARK,Y.M.Lee,H.K.CHO,S.B.Kim and S.W.Park(2015).Hexuronate C4-epimerase mutant with improved conversion activity,and method for producing D-tagatose by using same.US10196626B2.

Claims

一种多肽，所述多肽具有D-木酮糖4-差向异构酶活性，其中，所述多肽选自由(a)-(d)组成的组中的任一项：

(a)由与SEQ ID NO：2-32任一项所示的序列具有至少60％、至少70％、至少80％或至少90％的序列同一性的序列编码的多肽；

(b)由多核苷酸编码的多肽，所述多核苷酸在非常高严格条件下与(i)或(ii)所示的多核苷酸杂交：

(i)编码如SEQ ID NO：2-32任一项所示的氨基酸序列的多核苷酸；

(ii)(i)的全长互补多核苷酸；

(c)多肽，所述多肽为如SEQ ID NO：2-32任一项所示的多肽的突变体，所述突变体在一个或多个位置处包含取代、重复、缺失或添加一个或多个氨基酸，并且所述多肽仍然具有D-木酮糖4-差向异构酶活性；以及

(d)由(a)、(b)、(c)所示的多肽的片段，并且所述片段具有D-木酮糖4-差向异构酶活性。
根据权利要求1所述的多肽，其中，所述多肽为突变体，并且所述多肽与SEQ ID NO：2-32任一项所示的多肽相比，具有至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性。
根据权利要求1-2任一项所述的多肽，其中，所述多肽为如SEQ ID NO：2-32任一项所示的多肽的突变体，所述突变体在至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个位点处包含氨基酸的突变，并且所述多肽仍然具有D-木酮糖4-差向异构酶活性。
根据权利要求1-3任一项所述的多肽，其中，所述多肽为如下所示的多肽：

(a)与SEQ ID NO：2所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点处包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(b)与SEQ ID NO：3所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(c)与SEQ ID NO：4所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402和403组成的组中的一种或多种；

(d)与SEQ ID NO：5所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、270、271、301、310、322、341、398、406、407组成的组中的一种或多种；

(e)与SEQ ID NO：6所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、269、270、300、309、321、340、397、405、406组成的组中的一种或多种；

(f)与SEQ ID NO：7所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由117、140、146、176、178、285、286、316、325、337、355、412、420、421组成的组中的一种或多种；

(g)与SEQ ID NO：8所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由125、148、154、184、186、293、294、324、333、345、363、420、428、429组成的组中的一种或多种；

(h)与SEQ ID NO：9所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由124、147、153、183、185、297、298、328、337、349、368、425、433、434组成的组中的一种或多种；

(i)与SEQ ID NO：10所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由108、131、137、167、169、276、277、307、316、328、346、403、411、412组成的组中的一种或多种；

(j)与SEQ ID NO：11所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由115、138、144、174、176、280、281、311、320、332、351、408、416、417组成的组中的一种或多种；

(k)与SEQ ID NO：12所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由107、130、136、166、168、272、273、303、312、324、343、400、408、409组成的组中的一种或多种；

(l)与SEQ ID NO：13所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由109、132、138、168、170、275、276、306、315、327、346、403、411、412组成的组中的一种或多种；

(m)与SEQ ID NO：14所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由103、126、132、162、164、267、268、298、307、319、338、395、403、404组成的组中的一种或多种；

(n)与SEQ ID NO：15所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由105、128、134、164、166、271、272、302、311、323、342、399、407、408组成的组中的一种或多种；

(o)与SEQ ID NO：16所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由64、88、94、123、125、236、237、267、274、286、373、381、382组成的组中的一种或多种；

(p)与SEQ ID NO：17所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由110、133、139、169、171、271、272、302、311、323、342、399、407、408组成的组中的一种或多种；

(q)与SEQ ID NO：18所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由102、125、131、161、163、266、267、297、306、318、337、394、402、403组成的组中的一种或多种；

(r)与SEQ ID NO：19所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由121、144、150、180、182、289、290、320、329、341、359、416、424、425组成的组中的一种或多种；

(s)与SEQ ID NO：20所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由107、130、136、166、168、273、274、304、313、325、344、401、409、410组成的组中的一种或多种；

(t)与SEQ ID NO：21所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由21、48、54、84、86、182、183、213、222、234、260、324、332、333组成的组中的一种或多种；

(u)与SEQ ID NO：22所示的序列相比，所述多肽的氨基酸序列中的一个或多个氨基酸在对应于以下位点包含突变，其中，所述位点为选自由30、55、61、91、93、202、203、233、242、254、273、330、338、339组成的组中的一种或多种。
根据权利要求1-4任一项所述的多肽，其中，所述多肽为在对应于SEQ ID NO：2上的，存在如下所示的突变的多肽：

(a)在102位上的突变；

(b)在125位上的突变；

(c)在131位上的突变；

(d)在161位上的突变；

(e)在163位上的突变；

(f)在266位上的突变；

(g)在267位上的突变；

(h)在297位上的突变；

(i)在306位上的突变；

(j)在318位上的突变；

(k)在337位上的突变；

(l)在394位上的突变；

(m)在402位上的突变；

(n)在403位上的突变

(o)在267和297位上的组合突变；

(p)在306和403位上的组合突变；

(q)在125和297位上的组合突变；

(r)在163、267、403位上的组合突变；

(s)在125、267和297位上的组合突变；

(t)在163、267、297和403位上的组合突变；

(u)在125、163、267和297位上的组合突变；

(v)在125、163、267、297和403位上的组合突变；

(w)在125、163、267、297、402和403位上的组合突变；

(x)在163、267、297、306、402和403位上的组合突变；

(y)在125、163、267、297、306、402和403位上的组合突变；

(z)在125、131、163、267、297、306、402和403位上的组合突变；

(aa)在125、163、267、297、306、318、402和403位上的组合突变；

(bb)在125、131、163、267、297、306、318、402和403位上的组合突变。
根据权利要求1-5任一项所述的多肽，其中，所述多肽为在对应于SEQ ID NO：2上的以下任一种位点的突变的多肽：

(a)对应于SEQ ID NO：2上的位点102的氨基酸由甘氨酸(G)突变为亮氨酸(L)；

(b)对应于SEQ ID NO：2上的位点125的氨基酸由丝氨酸(S)突变为天门冬氨酸(D)、半胱氨酸(C)、酪氨酸(Y)、谷氨酰胺(Q)、谷氨酸(E)、苏氨酸(T)或天冬酰胺(N)；

(c)对应于SEQ ID NO：2上的位点131的氨基酸由精氨酸(R)突变为天门冬氨酸(D)、苏氨酸(T)、谷氨酸(E)或丝氨酸(S)；

(d)对应于SEQ ID NO：2上的位点161的氨基酸由天门冬氨酸(D)突变为丙氨酸(A)；

(e)对应于SEQ ID NO：2上的位点163的氨基酸由缬氨酸(V)突变为赖氨酸(K)、精氨酸(R)、丝氨酸(S)、异亮氨酸(I)或蛋氨酸(M)；

(f)对应于SEQ ID NO：2上的位点266的氨基酸由谷氨酸(E)突变为丙氨酸(A)；

(g)对应于SEQ ID NO：2上的位点267的氨基酸由缬氨酸(V)突变为亮氨酸(L)、蛋氨酸(M)或异亮氨酸(I)；

(h)对应于SEQ ID NO：2上的位点297的氨基酸由天冬酰胺(N)突变为苯丙氨酸(F)、酪氨酸(Y)或赖氨酸(K)；

(i)对应于SEQ ID NO：2上的位点306的氨基酸由色氨酸(W)突变为蛋氨酸(M)、丝氨酸(S)或苏氨酸(T)；

(j)对应于SEQ ID NO：2上的位点318的氨基酸由谷氨酰胺(Q)突变为赖氨酸(K)；

(k)对应于SEQ ID NO：2上的位点337的氨基酸由赖氨酸(K)突变为天门冬氨酸(D)；

(l)对应于SEQ ID NO：2上的位点394的氨基酸由天门冬氨酸(D)突变为蛋氨酸(M)；

(m)对应于SEQ ID NO：2上的位点402的氨基酸由丝氨酸(S)突变为缬氨酸(V)、亮氨酸(L)、苯丙氨酸(F)、半胱氨酸(C)或酪氨酸(Y)；

(n)对应于SEQ ID NO：2上的位点403的氨基酸由酪氨酸(Y)突变为色氨酸(W)、苏氨酸(T)、异亮氨酸(I)或苯丙氨酸(F)。
根据权利要求1-6任一项所述的多肽，其中，所述多肽来源于海栖热袍菌(Thermotoga maritima)，新阿波罗栖热袍菌(Thermotoga neapolitana)，栖热袍菌(Thermotoga sp)，Thermotoga caldifontis，产假假单胞菌(Pseudothermotoga lettingae)，牙合嗜盐菌(Halanaerobium congolense)，Thermosediminibacter litoriperuensis，Rhodothermus marinus，Gracilibacillus timonensis，栖热袍菌(Thermotogae bacterium)，Thermotogae bacterium，醋酸假丝酵母(Candidatus Acetothermia bacterium)，Pseudothermotoga thermarum，解热嗜热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)，Thermofilum adornatus，Thermoanaerobacter italicus，Thermotoga naphthophila，Thermoclostridium stercorarium，Dictyoglomus thermophilum，Spirochaeta thermophila，Singulisphaera acidiphila，Thermotoga caldifontis，Pseudothermotoga lettingae，枯草杆菌(Bacillus subtilis)，Geobacillus zalihae，Geobacillus stearothermophilus,Parageobacillus thermoglucosidasius,Thermoanaero-bacterium thermosaccharolyticum或大肠杆菌(Escherichia coli)。
根据权利要求1所述的多肽，其中，所述多肽包括在如SEQ ID NO：2-32所示的多肽的N端或中间部位或C端缺失一个或超过一个氨基酸残基。
根据权利要求8所述的多肽，其中，所述多肽选自下组：

(i)对应于如SEQ ID NO：2所示的多肽的N端起，缺失1-100个氨基酸，优选1-90个氨酸酸，更优选1-86个，更优选1-50个，更优选1-30个，最优选1-10个氨基酸而形成，并且具有催化D-木酮糖转化为L-核酮糖活性；或

(ii)对应于SEQ ID NO：2所示的多肽的第196-236位氨基酸中，缺失1-41个氨基酸，优选1-30个，更优选1-20个，最优选1-10个氨基酸而形成的，且具有催化D-木酮糖转化为L-核酮糖活性。
根据权利要求8-9任一项所述的多肽，其中，所述多肽选自下组：

(i)对应于如SEQ ID NO：2所示的多肽中，缺失第1-86位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性；

(ii)对应于SEQ ID NO：2所示的多肽中，缺失第196-236位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性；或

(iii)对应于SEQ ID NO：2所示的多肽中，缺失第1-86位氨基酸和第196-236位氨基酸，并且具有催化D-木酮糖转化为L-核酮糖活性。
根据权利要求1-10任一项所述的多肽，其中，所述多肽包含与SEQ ID NO：33-122所示的序列具有至少96％的序列同一性的氨基酸序列或由其组成；可选的，所述多肽包含与如SEQ ID NO：33-122所编码的多肽中的任一项具有至少98.3％、至少98.5％、至少98.7％、至少98.9％、至少99.1％、至少99.3％、至少99.5％、至少99.7％或100％的序列同一性的氨基酸序列或由其组成。
根据权利要求1-11任一项所述的多肽，其中，所述多肽和如SEQ ID NO：2所示的多肽相比，具有改进的D-木酮糖4-差向异构酶活性。
根据权利要求1-12任一项所述的多肽，其中，所述多肽由包含如SEQ ID NO：33-122所示的序列编码，或者所述多肽为由如SEQ ID NO：33-122所示的序列编码的多肽。
一种分离的多核苷酸，其中，所述多核苷酸包含编码根据权利要求1-13任一项所述多肽的核苷酸序列。
根据权利要求14所述的分离的多核苷酸，其在编码如SEQ ID NO：2-32任一项所示的氨基酸的核苷酸中包含至少一个突变；优选的，所述多核苷酸序列编码如SEQ ID NO:33-122任一项所示的氨基酸。
一种核酸构建体，其包含根据权利要求14或15所述的多核苷酸，所述多核苷酸与一个或多个调控序列可操作地连接，所述调控序列指导多肽在表达宿主中产生。
一种重组表达载体，其包含根据权利要求16所述的核酸构建体。
一种重组宿主细胞，其包含根据权利要求16所述的核酸构建体或根据权利要求17所述的重组表达载体。
一种用于产生根据权利要求1-13中任一项所述多肽的方法，其中，所述方法包括如下步骤：(a)在有助于所述多肽产生的条件下培养细胞或菌株，所述细胞或菌株产生所述多肽；其中，所述细胞或菌株包含根据权利要求16所述的核酸构建体或权利要求17所述的重组表达载体，所述核酸构建体或所述重组表达载体包含编码所述多肽的核苷酸序列；

可选的，所述方法还包括如下步骤：

(b)纯化或回收所述多肽。
一种D-木酮糖转化为L-核酮糖的方法，其中，所述方法包括利用根据权利要求1-13任一项所述多肽进行催化反应。
根据权利要求20所述的方法，其中，所述多肽选自权利要求1-13任一项所述的多肽；优选的，所述多肽由包含如SEQ ID NO：2-122任一项所示的氨基酸序列编码，或者所述多肽为由如SEQ ID NO：2-122任一项所示的序列编码的多肽。
一种制备L-戊糖的方法，其中，所述制备L-戊糖的方法包括如下步骤：

(a)采用D-木酮糖4-差向异构酶，将D-木酮糖转化为L-核酮糖；

可选的，所述方法还包括：

(b)采用D-木糖异构酶，将D-木糖转化为D-木酮糖。
根据权利要求22所述的方法，其中，所述方法进一步包括，采用L-阿拉伯糖异构酶，将L-核酮糖转化为L-阿拉伯糖，所述L-戊糖为L-阿拉伯糖。
根据权利要求22所述的方法，其中，所述方法进一步包括，采用L-核糖异构酶或甘露糖磷酸异构酶或它们的组合，将L-核酮糖转化为L-核糖，所述L-戊糖为L-核糖。
根据权利要求22所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，所述L-戊糖为L-木酮糖。
根据权利要求22所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，采用L-岩藻糖异构酶或D-阿拉伯糖异构酶或L-鼠李糖异构酶，将L-木酮糖转化为L-木糖，所述L-戊糖为L-木糖。
根据权利要求22所述的方法，其中，所述方法进一步包括，采用L-核酮糖3-差向异构酶，将L-核酮糖转化为L-木酮糖，采用L-鼠李糖异构酶将L-木酮糖转化为L-来苏糖，所述L-戊糖为L-来苏糖。
根据权利要求22-27任一项所述的方法，其中，所述D-木酮糖4-差向异构酶选自权利要求1-13任一项所述的多肽；优选的，所述D-木酮糖4-差向异构酶由包含如SEQ ID NO：2-122任一项所示的氨基酸序列编码，或者所述酶为由如SEQ ID NO：2-122任一项所示的序列编码的酶。
根据权利要求22-28任一项所述的方法，其中，所述方法中还包含纯化和/或分离所述L-戊糖的步骤。
根据权利要求29所述的方法，其中，所述分离步骤包含使用模拟移动床(SMB)分离的步骤。
根据权利要求22-30任一项所述的方法，其中，所述方法的反应体系中还包含酶反应液；优选的，所述酶反应液中含有金属离子；更优选的，所述金属离子可以为Co ²⁺、 Zn ²⁺、Mg ²⁺、Mn ²⁺、Ca ²⁺、Ni ²⁺、Cu ²⁺、Fe ²⁺、Sr ²⁺、Ba ²⁺、Cd ²⁺、Pb ²⁺、Fe ³⁺、Al ³⁺、Bi ³⁺、Ag ⁺、Li ⁺中的一种或多种。
根据权利要求22-31任一项所述的方法，其中，所述反应在有氧、微有氧或无氧条件下进行。
根据权利要求22-32任一项所述的方法，其中，所述反应在30℃-90℃温度下进行；优选的，所述反应在40℃-80℃温度下进行。
根据权利要求22-33任一项所述的方法，其中，所述反应在pH为3.0至11.0的范围内进行；优选的，所述反应在pH为4.0至10.0的范围内进行。
根据权利要求22-34任一项所述的方法，其中，所述反应在无氧、45-55℃温度、pH为8.0、金属离子为Co ²⁺或Mg ²⁺或Mn ²⁺或它们的组合的条件下进行。
根据权利要求22-35任一项所述的方法，其中，所述反应包括体外催化反应或全细胞生物催化反应。
根据权利要求36所述的方法，其中，所述反应为体外催化反应，所述体外催化反应可以分步进行或同时进行。
根据权利要求37所述的方法，其中，所述体外催化反应分步进行时，其在一个反应容器中或一个以上串联的反应容器中进行。
根据权利要求38所述的方法，其中，所述反应容器选自分批进料生物反应器、含固定化酶的填充床生物反应器、酶或细胞再循环生物反应器、含膜分离的生物反应器和连续进料生物反应器中的一种或多种。
根据权利要求22-39任一项所述的方法，其中，所述体外催化反应中的酶以游离酶、含有所述酶的细胞裂解液、含有所述酶的全细胞、固定化酶中的一种或多种形式存在。
根据权利要求36所述的方法，其中，所述全细胞生物催化反应的反应方式为利用细胞工厂进行反应，所述细胞中包含根据权利要求16所述的核酸构建体或根据权利要求17所述的重组表达载体。
多肽在制备L-戊糖中的应用，所述多肽选自根据权利要求1-13中任一项所述的多肽。
根据权利要求42所述的应用，其中，所述L-戊糖选自L-阿拉伯糖、L-核糖、L-核酮糖、L-木酮糖、L-木糖和L-来苏糖中的一种或多种。
多肽作为具有D-木酮糖4-差向异构酶活性的酶的用途，所述多肽选自根据权利要求1-13中任一项所述的多肽。