CN114341350A

CN114341350A - 用于制备熊脱氧胆酸的方法

Info

Publication number: CN114341350A
Application number: CN202080061324.XA
Authority: CN
Inventors: 詹卢卡·加尔迪; 西尔维亚·拉帕乔利; 罗伯托·韦尔加
Original assignee: Aixiyi Co ltd
Current assignee: Aixiyi Co ltd
Priority date: 2019-09-27
Filing date: 2020-09-24
Publication date: 2022-04-12
Also published as: EP4034643A1; IT201900017411A1; WO2021059182A1

Abstract

描述了一种用于从脱氧胆酸(DCA)开始制备熊脱氧胆酸(UDCA)的化学‑酶促方法，所述化学‑酶促方法包括制备具有用于将脱氧胆酸(DCA)转化为熊胆酸(UCA)的高7β‑羟化酶活性的酶，所述转化是所述方法的第一步。

Description

用于制备熊脱氧胆酸的方法

说明

发明领域

本发明涉及一种用于从脱氧胆酸(DCA)开始制备熊脱氧胆酸(UDCA)的化学-酶促方法，以及一种具有高7β-羟化酶活性的酶，用于将DCA转化为熊胆酸(UCA)，所述转化是所述方法的第一步。

背景技术

熊脱氧胆酸(UDCA)是通常以少量存在于人类胆汁中的化合物，熊脱氧胆酸(UDCA)增加胆汁对于胆固醇的溶解能力。

UDCA或3α,7β-二羟基-5β-胆烷酸，具有以下式：

UDCA以其治疗特性被已知，例如在肝紊乱包括胆固醇结石、原发性胆汁性胆管炎和硬化性胆管炎的治疗中的治疗特性被已知。

因此，具有可用于工业产生UDCA的方法是非常有利的。

多于一种用于UDCA合成的化学和酶促两种类型的方法在文献中是已知的。然而，迄今，所述方法已经表现出明显的局限性，特别是在UDCA的区域选择性和最终收率方面。

因此，本发明的目的是提供用于制备UDCA的方法，该方法高效、经济并提供高收率和纯度的UDCA。

发明概述

如所附权利要求中描述的，所述目的已通过用于制备UDCA的化学-酶促方法实现。

在另一方面，本发明涉及一种具有高7β-羟化酶活性的酶，所述高7β-羟化酶活性的酶可以有利地用于所述方法的将脱氧胆酸(DCA)转化为熊胆酸(UCA)的步骤中。

在另一方面，本发明涉及一种表达载体，所述表达载体包含编码所述酶的核苷酸序列。

附图简述

本发明的特征和优势将从以下详细描述、出于说明性和非限制性目的提供的工作实施例以及通过附图变得明显，其中：

-图1示出了根据实施例鉴定用于饱和诱变测试的细胞色素的氨基酸序列的区域。呈灰色的，诱变靶残基；

-图2示出了Seq11，用组合的A和B克隆的突变重建的氨基酸序列。呈灰色的，两个突变的氨基酸；

-图3示出了不同生物催化剂载量的化学动力学：10％w/v、20％w/v、30％w/v。转化率表示为24h-48h-72h-96h中产生的UCA(ppm)；

-图4示出了酶Seq73的序列。呈粗体的，根据实施例的随机诱变的残基；并且

-图5示出了细胞色素g3484序列与那些表现出7β-羟化酶活性的细胞色素序列之间的比较。

发明详述

因此，本发明的目的是具有7β-羟化酶活性并具有SEQ ID N.1的酶，其中彼此独立地：

-位置113处的氨基酸是选自A、E、F、I、L、P、Y、W和V的疏水性氨基酸；

-位置110处的氨基酸是选自R、N、Q、S和T的形成氢键的氨基酸；

-位置368处的氨基酸是I；

-位置365处的氨基酸是选自A、N、Q、S和T的形成氢键的氨基酸。

优选地，在本发明的酶中，位置113处的氨基酸是V。

优选地，在本发明的酶中，位置110处的氨基酸是R或S。

优选地，在本发明的酶中，位置365处的氨基酸是A或S。

在优选的实施方案中，本发明的酶具有SEQ ID N.2。

在最优选的实施方案中，本发明的酶具有SEQ ID N.3。

优选地，本发明主题酶的氨基酸序列具有匹配SEQ ID N.1的至少80％的序列同一性，更优选地，该氨基酸序列具有匹配SEQ ID N.1的至少85％的序列同一性。

本发明的另外的主题是一种表达载体，所述表达载体包含编码本发明的具有7β-羟化酶活性的酶的序列的核苷酸。

优选地，所述表达载体包含编码本发明的具有7β-羟化酶活性的酶的核苷酸序列SEQ ID N.11、核苷酸序列SEQ ID N.12或核苷酸序列SEQ ID N.13。

在优选的方面，本发明的酶在所述表达载体中在启动子AOX1、TEF、GUT1、GCW14、GK1或GAP，优选地启动子TEF的控制下被表达。

在本发明的优选的方面，该表达载体能够在真核细胞中自我复制。

优选地，所述酶在巴斯德毕赤酵母(P.pastoris)、大肠杆菌(E.coli)、芽孢杆菌属(Bacillus)、酿酒酵母(S.cerevisiae)、乳酸克鲁维酵母(K.lactis)或者曲霉属(Aspergillus)的细胞中被表达.

在本发明的优选的方面，所述酶在巴斯德毕赤酵母菌株中通过发酵方法被表达。

优选地，所述发酵方法在25℃至35℃优选地约30℃的温度和在6.5-7.5优选地7.0的pH的包含酪蛋白蛋白胨、酵母提取物、甘油和磷酸盐缓冲液的培养基中进行。

优选地，所述巴斯德毕赤酵母菌株选自巴斯德毕赤酵母X-33、巴斯德毕赤酵母KM71H、巴斯德毕赤酵母SMD1168H、巴斯德毕赤酵母M5(Superman5)及其组合。优选地，菌株是巴斯德毕赤酵母X-33。

可选地，本发明的主题也是具有7-β羟化酶活性和SEQ ID N.1的酶，其中彼此独立地：

-位置110处的氨基酸是选自A、E、F、I、L、P、Y、W和V的疏水性氨基酸；

-位置113处的氨基酸是选自R、N、Q、S和T的形成氢键的氨基酸；

-位置365处的氨基酸是I；

-位置368处的氨基酸是选自A、N、Q、S和T的形成氢键的氨基酸。

优选地，在本发明的酶中，位置110处的氨基酸是V。

优选地，在本发明的酶中，位置113处的氨基酸是R或S。

优选地，在本发明的酶中，位置368处的氨基酸是A或S。

本发明的另外的主题是用于制备熊脱氧胆酸(UDCA)的化学-酶促方法，所述化学-酶促方法包括以下步骤：

a)通过使用本发明具有7β-羟化酶活性的酶，将脱氧胆酸(DCA)转化为熊胆酸(UCA)。

b)通过使用12α-羟基类固醇脱氢酶(12α-HSDH)和乳酸脱氢酶(LDH)，将熊胆酸(UCA)转化为12K-UDCA，以及

c)进行Wolff-Kishner还原，从而得到UDCA。

下文是本发明方法优选的实施方案的示意图：

在优选的方面，在本发明方法的步骤a)中，DCA向UCA的转化通过使用以编码本发明的具有7-β羟化酶活性的酶的表达载体转化的巴斯德毕赤酵母的生物质来实现。

优选地，在转化的步骤a)中，从巴斯德毕赤酵母(Pichia pastoris)的发酵获得的细胞被直接使用。

可选地，在所述转化步骤a)中，本发明的具有7-β羟化酶活性的酶在溶液中游离使用或固定在固体基质上，所述固体基质选自本领域已知的树脂。

所述酶通过本领域已知的细胞裂解方法裂解用本发明载体转化的细胞而获得。

在优选的实施方案中，将收集的细胞以20％最终浓度加入至100mM pH 7.00的磷酸盐缓冲液中，所述磷酸盐缓冲液含有200mM山梨醇。在搅拌下加入溶解在有机溶剂优选地DMSO中的10×DCA溶液(每升悬浮液中100ml)。

优选地，DCA的浓度是5-30g/L，更优选地是约20g/L。

优选地，将整个混合物维持搅拌48-96h，更优选地72h。

从DCA到UCA的最终转化收率百分比是约60％-65％。

在优选的方面，在本发明方法的步骤b)中，使用选自12a_988、12a_829、12a_793、12a_956和12a_698的脱氢酶12α-HSDH以及使用选自LDH_CUPNH、LDH_THECA、LDH_CAEEL、LDA_GEOSE和LDH_LACPE的乳酸脱氢酶LDH。

优选地，在步骤b)中，使用乳酸脱氢酶LDH_LACPE和脱氢酶12a_829的组合或乳酸脱氢酶LDH_LACPE和脱氢酶12a_793的组合。

在另外的优选的方面，在本发明方法步骤b)中使用的脱氢酶12α-HSDH和LDH酶可以在反应溶液中是游离的或固定在固体基质上，所述固体基质选自本领域已知的树脂。

优选地，UCA的浓度是20-50g/L，更优选地约40g/L。

在优选的方面，本发明化学-酶促方法的步骤b)在24℃-30℃的孵育温度、在0.1-1M的磷酸盐缓冲液浓度和在6.5-7.5的pH值进行。

优选地，步骤b)在约27℃的温度、在pH＝7和在约1M的磷酸盐缓冲液浓度进行。

在另外的优选的方面，所使用的LDH的体积是3％-6％v/v，并且所使用的12α-HSDH的体积是3％-6％v/v。

从UCA到12K-UDCA的最终转化收率百分比几乎是全部，即>98％-99％。

在可选的实施方案中，步骤a)和b)以一锅法(one-pot)进行，即在相同的反应环境中进行，没有中间的分离步骤。

一锅法实施方案变体是其中在加入12α-羟基类固醇脱氢酶和乳酸脱氢酶之前未反应的DCA被分离的方法。

在该方法的步骤c)中，使12K-UDCA经历Wolff-Kishner还原，从而得到UDCA。

Wolff-Kishner还原是从醛或酮开始产生烷烃的还原性脱氧化学反应，并且在文献中已知数十年。因此，例如遵循Dutcher等人(“Studies on the Wolff-Kishnerreduction of steroid ketones”tuColumbia University,1939,Journal of theAmerican chemical society，第61卷)的教导或Szmant(“The Mechanism of the Wolff-Kishner Reduction,Elimination,and Isomerization Reactions”,Angew.Chem.Internat.编著，1968，第7卷，第2期)的教导，Wolff-Kishner还原也可以在本发明的上下文中实现。最初方法包括将腙与乙醇钠一起加热至约200℃，但随着时间推移在该方法中已经引入各种修改。最近，Wolff-Kishner还原使用醛或酮、KOH、肼和乙二醇在单个步骤中进行。

在可选的实施方案中，步骤a)、b)和c)以一锅法进行，即在相同的反应环境中进行，没有中间的分离步骤。

酶的制备方法、其用途及涉及该酶的合成方法的优选的方面的所有可能的组合应如本文所述和类似优选地理解。

还要理解的是，对于酶，所有被鉴定为优选的和有利的方面对于使用该酶的方法都是类似优选的和有利的。

下文是为了说明性和非限制性目的而提供的本发明的工作实施例。

实施例

选择拟枝孢镰刀菌(Fusarium sporotrichioides)的贝壳杉烯氧化酶细胞色素 g3484的候选替代物

在拟枝孢镰刀菌中鉴定的细胞色素P450(贝壳杉烯氧化酶)与数据库中记载的另外10种相似的蛋白之间做比较。

拟枝孢镰刀菌(F.sporotrichioides)中的贝壳杉烯氧化酶序列与在UniProtKB/Swiss-Prot数据库中记录的已知序列之间的匹配鉴定了100个表现出与参考酶相比在43％与98％之间的相似性的序列。

所鉴定的序列根据进化距离相互比较可以分为10个亚群，在这些亚群中的蛋白在系统发生上相关。

10个选择的序列的鉴定ID列于表1中，表明了相对于拟枝孢镰刀菌酶的相似性百分比和微生物起源。

表1.用于表达和相对于拟枝孢镰刀菌的酶的生物转化收率比较的10个选择的序列的列表。

n.d.＝对整个基因组应用测序技术获得的推定基因的翻译，所述推定基因的真实活性从未通过试验被证明。

克隆与转化

订购序列并且针对在巴斯德毕赤酵母中的表达进行优化。将基因克隆在用于由甲醇诱导的启动子调控的酵母细胞内表达的载体，例如载体pPICZA中。所获得的质粒转化巴斯德毕赤酵母菌株，该菌株还能够表达操作细胞色素所必需的被鉴定为g11235的真菌辅助蛋白NAD(P)H-p450还原酶，能够为细胞色素提供完成反应所需的还原力。

每个载体选择两个克隆，在液体培养基中繁殖，并且冷冻保存，以用于表达测试。同一转化体的不同克隆之间的比较是必要的，因为与大肠杆菌等其他宿主生物体不同，表达取决于载体如何整合到基因组中，并且因此同一质粒的克隆之间的表达可能存在显著的差异。

生物转化测试

开发了呈两个步骤的生物转化测试：表达被分析细胞色素的生物质的积累和实际生物转化。在第一步中，在血红素基团的已知前体δ红氨基乙酰丙酸和巴斯德毕赤酵母表达系统所需的诱导物甲醇存在情况下，将克隆接种在富集培养基中。表达3天之后，收集生物质，以20％w/v重悬于缓冲液中，并且在以3g/L的DCA存在的情况下用于生物转化反应。

3天之后，在细胞悬浮液酸化后，利用2体积乙酸乙酯提取胆汁酸。将提取物利用分析实验室中常规使用的INERTSIL ODS-2柱，C18，250×4.6至5um，CPS分析型(目录号5020-01128)(方法EP 8.0)进行分析。

分析的细胞色素中仅4个能够将DCA转化为UCA，这表明表1中列出的蛋白1、2、3、10以相对于参考蛋白的65％至98％的相似性转化。

除蛋白10外，前三个呈现出相对于参考(表1)最高的序列相似性，并且属于同一系统发生簇；可能是经历了相似的进化过程使得它们获得了以或多或少特异性的方式将DCA识别为底物的相同能力。

在g3484细胞色素存在的情况下对DCA->UCA生物转化的分析中，发现蛋白1与拟枝孢镰刀菌的细胞色素具有非常相似的转化谱，起因于这两个序列实际上是相同的(98％相似性)。

相对于参考表现出65％的序列相似性的蛋白10，由于存在其他样品中不存在的多种杂质，产生约8％的反应收率，这些杂质是由降低细胞色素从DCA产生UCA效率的非特异性反应引起的。

细胞色素3表现出约30％的收率，没有参考反应中的过氧化化合物，但包括其他非特异性峰的出现。

蛋白2的有趣之处在于与标准的40％相比，它提供了49.7％的转化收率。优异的结果是因为在标准反应中包含过氧化分子的杂质以较小的量存在，即使存在更多的剩余未反应底物(约45％，相比之下参考为3％)。

对杂质面积百分比的分析表明，与在用鉴定的蛋白2转化的情况下的18％的面积百分比相比，在细胞色素g3484反应中，这些杂质占存在的胆汁酸的多于55％。在绝对值方面，与利用基因g3484在使用乙酸乙酯提取后获得的1200ppm的UCA相比，用新的细胞色素测量的相关产物的量是1500ppm。

因此，蛋白2在识别DCA作为底物的方面天然地比细胞色素g3484是更具选择性的，并且构成鉴定用于生物转化的最佳蛋白的更好的起点。

将样品以HPLC利用方法04 MA RS035(方法HPLC-RI 12K-UDCA)第1版进行分析，该方法提供了短保留时间化合物的改进的分辨率。观察到，与参考反应相比，包含新细胞色素的样品呈现较少的过氧化化合物。

从获得的结果清楚的是，源自禾谷镰刀菌的细胞色素2是进一步提高反应收率的最有希望的候选者。该蛋白不促进朝向不期望的产物的氧化反应，所述不期望的产物构成了在利用细胞色素g3484时导致相对较低收率的污染物，并且该蛋白直接实现大于49％的DCA->UCA的转化收率。

因此，与已知的蛋白结构进行了比较，以便应用I-TASSER预测方法定制三维计算机模型。该模型表明了哪些残基参与血红素辅基(heme prosthetic group)(通常细胞色素)的键合，以及哪些氨基酸构成与底物的键合口袋，使得确定哪些氨基酸参与形成与底物键合位点成为可能。

随后进行对接分析，这是对蛋白与所讨论的底物(DCA)之间相互作用的模拟，诸如以鉴定哪些氨基酸取代存在的氨基酸，以便获得潜在优异的酶变体用于将DCA转化为UCA。

合理诱变

对于合理诱变，利用其已知结构在RCSB-PDB数据库(Research Center forStructural Biology-Protein Data Bank)中可得的相似的蛋白作为支架，使用细胞色素2在计算机中(in silicon)对三维蛋白结构计算机建模。

突出显示的蛋白位置3和12是与OH基团键合的碳，而位置7是所讨论的羟基化的靶位置。

第一次对接分析鉴定了与底物相互作用的蛋白的残基，所述残基使得以正确取向容纳键合口袋，以引起位置7处的碳与由血红素基团铁原子激活的氧反应，血红素基团是细胞色素的特征催化中心。

表2总结了分析结果，显示了蛋白根据该模型可以与DCA接触并调节碳7的β羟基化结果的氨基酸残基。

表2.细胞色素2在键合口袋中与特定的底物原子(环的碳原子C，或取代基羟基基团OH)相互作用的氨基酸残基的列表。Va1301可能与血红素基团的位置相关，调节其反应性。

氨基酸残基	底物
		Arg113	12C处的-OH
Arg220	12C处的-OH
		Glu110	12C处的-OH
Phe123	2C
		Leu212	7C
Met485	7C
		Leu300	4C
Thr116	3C处的-OH
		His117	3C处的-OH
Arg370	24C
		Asp217	24C
Leu365	24C
		Leu366	24C
Ala216	24C
		Val301	血红素

特别重要的是靠近位置12处的羟基基团的氨基酸，因为对接研究观察到，在键合口袋中的底物使其β侧面对血红素时，位置12处的羟基基团与生物催化剂之间的氢键促进碳7的β处氧化。

随机诱变

作为合理诱变的备选的常用的定向进化测试方法是随机诱变，随机诱变利用分子生物学技术在已知序列中引入随机突变，并且产生无法先验定义的酶变体。

易错PCR

易错PCR能够利用通常以高精度延伸DNA序列的PCR(聚合酶链式反应)分子生物学技术在选择的DNA序列中引入随机突变。改变反应条件，例如通过引入锰盐或改变dNTP的浓度，诱导反应中的DNA聚合酶在DNA聚合期间利用不正确的核苷酸，导致在延伸的DNA序列中引入突变。

Ep-PCR是定向进化测试中常用的技术，用于获得编码具有与野生型不同氨基酸的蛋白的参考核苷酸序列的变体，以便根据预期的用途赋予初始蛋白新的和潜在的更感兴趣的特性。

该技术能够产生编码具有随机突变的蛋白的序列池，在商业载体pPICZA中克隆，用于由甲醇诱导的启动子调控的酵母细胞内表达。所获得的质粒被用于转化先前选择的菌株，该菌株还能够表达称为g11235的真菌辅助蛋白NAD(P)H-p450还原酶，该还原酶由于提供完成反应的还原力而是细胞色素功能所必需的。将克隆用于表达和生物转化测试。

饱和诱变

除了ep-PCR提供的随机诱变测试外，还在饱和条件下进行了更加靶向的随机诱变测试。利用直到该时间点从分子对接所获得的数据，鉴定蛋白与底物接触的两个区域，从而有望在与用ep-PCR测试相比更受限制的区域进行随机诱变测试。

鉴定用于饱和诱变测试的细胞色素氨基酸序列的区域示于图1中，其中指示了靶诱变残基。

将细胞色素序列与前一步骤中表现出7β-羟化酶活性的细胞色素序列进行比较，观察到这些区域是保守的(图5)，而细胞色素2的残基Glu110、Arg113、Leu365、Ala368表现出几乎不保守的取代，包括空间体积(steric bulk)或电荷与细胞色素2残基不同的氨基酸。考虑到所比较的4种蛋白表现出不同的生物转化谱和收率，这些不同的残基可能在定义酶促性能方面起着重要作用。因此，选择它们进行饱和诱变测试，这预测4个残基中的每一个都被所有其他20个L-氨基酸取代，获得204个可能的不同序列组合进行试验。

将细胞色素2序列作为PCR反应模板，其中将该序列在具有与4个残基中的每一个相关的简并的引物存在的情况下进行扩增，因此仅在四个选择的位置中引入随机突变。

用于引入最大可能数目的突变，将获得终止密码子的可能性降低至最小的引物如下：

EVAR位点(SEQ ID N.4)

LLGAFR位点(SEQ ID N.5)

获得了序列池，克隆在通过由甲醇诱导的启动子调控的酵母细胞内表达的商品化载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株，该菌株还能够表达真菌辅助蛋白NAD(P)H-p450还原酶。

表达和生物转化测试

从使用由随机诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于在巴斯德毕赤酵母中表达和生物转化的HTS测试，利用小型化系统，使用24孔微孔板(2ml培养基/孔)用于细胞生长和96深孔微孔板用于生物转化步骤，诸如以降低工作体积并且能够同时对多个克隆(每次测试多达192个克隆)进行宽谱筛选。

进行总计10次表达和生物转化测试，因此实现总计960个克隆的分析。

生长步骤包括在浓度为2％(v/v)的诱导物(甲醇)的存在下，在缓冲培养基中，以每个微孔板的孔一个克隆进行的接种。生长3天之后，将细胞糊状物通过离心与耗尽的培养基分离，并在以20％wwcp/V重悬于反应缓冲液中并且加入DCA底物至3g/L的最终浓度后用于准备生物转化测试。

反应3天之后，在细胞悬浮液酸化后利用2体积甲醇提取总胆汁酸。提取物的分析利用INERTSIL ODS-2柱，C18，250×4.6至5um，CPS分析型(目录号5020-01128)，(方法EP8.0)来进行。

从分析的960个克隆中，2个被鉴定为表现出感兴趣的性能。克隆A实现60.6％的转化收率，获得1820ppm的UCA和850ppm的未转化底物的剩余物(29％剩余物)。相反，克隆B实现65％的转化，获得1950ppm的产物和700ppm的未反应DCA(23.3％)。

突变分析

使获得的两个突变经历测序，以鉴定哪些核苷酸取代以及因此氨基酸序列中的哪些突变被引入。分析表明，克隆A表达其中位置368处的丙氨酸残基已经被来自异亮氨酸的残基突变(Ala368->Ile368)的酶，而由克隆B表达的单加氧酶表现出精氨酸残基被来自缬氨酸的残基的突变(Arg113->Val113)。将两个突变的残基定位在用于先前部分中描述的饱和诱变的靶区域中。第一对接分析结果将这些位点鉴定为底物与蛋白之间相互作用的区域。氨基酸侧链的电荷或极性的改变以及空间体积的变化改变与蛋白底物的键合位点，允许底物在键合口袋中的改进的容纳并且因此优化反应是可能的。

由于PCR反应，两个突变组合到单个序列中，称为seq11(SEQ ID N.2)。

由该核苷酸序列编码的蛋白序列示于图2中。

将新的核苷酸序列克隆在由甲醇诱导的启动子调控的酵母细胞内表达的商品化载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株，该菌株还能表达真菌辅助蛋白NAD(P)H-p450还原酶。

利用3g/L的DCA的蛋白表达和生物转化测试(根据下文描述的方案)确认了利用克隆B实现的收率，即65％收率。这两个突变被证明是相容的，因此使用Seq11(SEQ ID N.2)作为模板，产生相对于已引入的突变具有加性效应的其他突变，以实现预定的目的。

第二诱变周期

Seq11是第二突变周期的起点。注意不仅要消除不想要的副反应(collateralreactions)，例如在酶修饰的第一步期间，而且要降低可能的底物抑制，诸如增加反应中DCA的浓度，以便实现对该方法的工业化步骤有用的转化。

利用来自对接分析的数据，第二诱变周期集中在生物信息学分析中鉴定的某些位置上，这些位置不仅对增加底物与蛋白之间的亲和力是重要的，而且对消除可能产生用于DCA的第二个键合口袋的残基也是重要的。生物信息学的底物-细胞色素相互作用模型鉴定了潜在的第二区域的存在，在那里DCA可以定位自身，从而阻碍进入活性位点。

表3列出了根据至少三种对接模型的比较可能参与形成与DCA的第二键合位点的主要残基。

表3.参与用于多于一种对接模型中蛋白与DCA之间的相互作用的第二位点形成的残基的列表。

残基	位置
		组氨酸	83
谷氨酸	110
		精氨酸	220
亮氨酸	365
		甘氨酸	367
精氨酸	370

观察到，这些残基远离一级蛋白序列，但在酶具有决定其活性的三级结构时，这些残基在附近。

选择这些残基作为饱和诱变测试的靶，这包括将表3中列出的6个残基中的每个用所有其他20个L-氨基酸取代，获得206个可能的不同序列组合进行测试。利用Seq11作为PCR反应模板，其中将序列在具有与6个残基中的每一个相关的简并的引物存在的情况下进行扩增，诸如以仅在6个选择的位置中引入随机突变。

下文描述了用于引入最大可能数目的突变，将获得终止密码子的可能性降低至最小的引物。

在下文列出的引物中，4个含氮碱基使用传统的缩写表示，而其他字母具有以下含义：

A＝腺嘌呤

C＝胞嘧啶

G＝鸟嘌呤

T＝胸腺嘧啶

R＝G A(嘌呤)

Y＝T C(嘧啶)

K＝GT(酮)

M＝A C(氨基)

S＝G C(强键)

W＝A T(弱键)

B＝G T C(除A外的全部)

D＝G A T(除C外的全部)

H＝A C T(除G外的全部)

V＝G、C、A(除T外的全部)

N＝A G C T(全部)

Glu110(SEQ ID N.6)

His83(SEQ ID N.7)

Arg220(SEQ ID N.8)

GIFR位点(SEQ ID N.9)

Leu365(SEQ ID N.10)

将获得的序列池克隆在由甲醇诱导的启动子调控的酵母细胞内表达的商用载体pPICZA中。所获得的质粒用于转化先前选择的巴斯德毕赤酵母菌株，该菌株还能表达真菌辅助蛋白NAD(P)H-p450还原酶。

表达和生物转化测试

从利用如本文以上部分中描述的诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于在巴斯德毕赤酵母表达和生物转化的HTS测试，利用24孔微孔板(2ml培养基/孔)用于细胞生长和96深孔微孔板用于生物转化步骤的小型化系统，诸如以降低工作体积并且能够同时对多个克隆(每次测试多达192个克隆)进行宽谱筛选。

进行总计6次表达和生物转化测试，因此分析总计多于1000个克隆。

生长步骤包括在浓度为2％(v/v)的诱导物(甲醇)的存在下，在缓冲培养基中，以每个微孔板的孔一个克隆进行的接种。生长3天之后，将细胞糊状物通过离心与耗尽的培养基分离并且在以20％wwcp/V重悬于反应缓冲液中后用于准备生物转化测试。与初始筛选相比，所提供的底物浓度从3g/L增加至5g/L，诸如以满足两个要求：从方法的工业化的角度出发，选择能够转化显著量DCA的酶，以及不因所讨论的胆汁酸的溶解性差而使小体积筛选变得困难。

反应3天之后，在细胞悬浮液酸化后利用2体积甲醇提取总胆汁酸。提取物的分析通过PCA分析实验室中常规使用的INERTSIL ODS-2柱，C18，250×4.6至5um，CPS分析型(目录号5020-01128)(方法EP 8.0)来进行。

与来自第一诱变周期的最佳克隆的1950ppm的产物相比，在所分析的克隆中，一个被鉴定，称为克隆73，相对于350ppm未反应底物能够产生4500ppm的UCA。与在先处理步骤期间获得的65％收率相比，该突变的酶实现90％的收率。

与第一次诱变的最佳克隆相比增加的收率是DCA消耗更大和关于底物选择性增加二者的结果，导致过氧化杂质减少。测量结果显示，未反应底物的降低，以及对应于可能比所需产物极性更强的化合物的峰面积的降低二者。

突变体分析

使克隆73经历测序，以鉴定在诱变周期期间引入的核苷酸取代。与模板(Seq11)和野生型序列(蛋白2)相比，由这些取代产生的氨基酸序列报道于表4中。在描述的处理步骤期间引入了两个突变：位置110处的谷氨酸残基被丝氨酸残基突变，并且位置365处的亮氨酸残基被丝氨酸残基突变。

表4.诱变之前(ICE2)、第一诱变周期之后(Seq11)以及第二诱变周期之后(Seq73)的序列的比较。浅灰色指示第一诱变之后突变的残基，深灰色指示第二次诱变之后突变的残基。

残基的极性、电荷和空间体积的改变改变酶的三维结构、促进DCA进入活性位点并且增加蛋白对所讨论的底物的亲和力是可能的。特别地，位置110处的谷氨酸用丝氨酸的取代可能消除了该谷氨酸与位置220处的精氨酸残基之间的盐桥，至少部分地修饰了DCA与蛋白之间的第二键合口袋，这是先前鉴定的底物抑制作用的原因。

来自连续诱变周期的突变总和不仅导致实现了70％的最小反应收率(步骤4定义的最终目标)，而且还通过实现了90％的转化百分比超过了这一数值。诱变活性也部分地消除底物引起的抑制作用，使羟基化底物超过2g/L成为可能，这构成了第一诱变周期结束时的最大转化极限。

发酵的优化

扩大发酵规模的第一个关键步骤是消除甲醇，甲醇在用于所讨论的细胞色素的表达的商业巴斯德毕赤酵母系统中被用作表达的指示物，以避免易燃性和毒性问题。

因此，作为AOX启动子的替代，对4个启动子进行测试，这些启动子被用于异源蛋白在选择的宿主系统中的组成型表达。将酵母使用产生的4种新的载体转化，并且在无甲醇培养基中表达3天之后，获得的生物质用于DCA的生物转化反应。从反应混合物中提取的胆汁酸的HPLC分析能够鉴定启动子1为调控所讨论的蛋白质表达的最佳选择。

进行从HT筛选步骤期间利用的3ml培养基至锥形烧瓶中的100ml培养基的转变。在富集培养基中，在96h的总发酵中实现120g/L的生物质产生。

第二个扩大步骤包括从锥形瓶培养基至2L发酵罐的转变。这是重要的步骤，并且已经指示在中试规模上可预见的发酵罐收率，因为有可能控制培养中酵母生长的基本参数，包括pH、温度和氧合。在向酵母提供营养的碳源和蛋白提取物和/或水解物、维生素和辅助因子的存在的情况下(这些维生素和辅助因子不仅是生长所需的，而且是细胞色素异源表达所需的)，在缓冲盐水培养基中评价替代的工业原料也是可能的。

然后应用旨在组合不同的蛋白提取物和水解物，同时评价48个生长条件和随后表达的实验设计。

应用的实验设计能够鉴定最佳的组分组合作为锥形瓶中富集培养基的替代，特别是消除合成复杂蛋白如细胞色素所必需的纯辅助因子的加入，该加入在工业发酵中难以经济维持。

所得到的培养基不仅使用工业组分维持了富集培养基实现的收率(125gwcp/L)，而且时间也减半：最大产量在发酵的48h，而不是96h，被实现。

增加DCA载量

所产生的生物质以20％w/v在5g/L、10g/L、20g/L、30g/L的DCA标量浓度在反应中被利用。

孵育3天之后，将反应通过HPLC分析(表5)进行评价，生物质也转化10g/L底物，产生90％的收率，直到该时间点实现载量加倍。

表5.增加的底物载量测试的HPLC分析。在10g/L时，维持90％的转化收率。

样品	UCA	剩余的DCA	转化收率
				5	4.9g/L	n.d.	99％
10	9.7g/L	0.15g/L	90％
				20	12.5g/L	6.8g/L	62％
30	8.9g/L	20g/L	29％

如表5中示出的，在反应中DCA增加至高于10g/L之后，转化收率降低：在两个诱变周期中引入的突变确实降低了酶底物抑制，但没有完全消除它。然而，应该注意的是，在20g/L载量，实现12.5g/L的UCA的最大浓度，并且收率的下降仅归因于未反应底物的积累，而不是由于在使用原始酶最初发生的不期望的氧化的产物。

反应动力学分析

反应动力学通过制备三种不同浓度的湿细胞糊状物(wcp)，具体地10％w/v、20％w/v和30％w/v，利用初始20g/L的DCA来评价。在连续的间隔提取胆汁酸以评价反应的发展。

如图3中示出，在72h以20％w/v的生物质实现了最大转化。在较高浓度的生物催化剂，较长的时间尺度不改进收率，而较低浓度的酶不允许实现所需的性能。

与使用游离酶的反应相比，相对高的生物催化剂百分比可以归因于细胞色素的复杂性，所述细胞色素锚定至细胞膜上并依赖于辅助蛋白，该辅助蛋白也整合至细胞膜上，以用于正确操作以及底物和胆汁产物通过细胞膜渗透的需要。

生物催化剂的稳定性

进行了生物催化剂(生物质)稳定性测试，评价参数包括：稳定剂(甘油或山梨醇)的不存在或存在、保存温度(具体地-80℃、-20℃、4℃和25℃)和保存时间(7天、14天、30天)。

在10g/L的DCA存在的情况下，利用不同条件下保存的生物质评价稳定性，并且表示为生物转化收率。

反应产物的比较表明，在4℃保存的酶的性能维持稳定多达14天，无需加入稳定剂。30天之后，生物催化剂经历活性的部分减少，因此最大储存可以预见保存多达发酵后回收细胞团之后的14天至15天(在4℃至6℃)(可能根据更详细的随后评价，在14天至30天的时间范围内)。

最佳12α-HSDH候选者的选择

考虑到迄今使用的芽孢杆菌种(Bacillus sp)的12α-HSDH(ID数据库：A3IBN0)在所需的反应中表现出优异的性能，该酶的序列是用于选择数据库中可得的那些范围内的其他潜在的12α-HSDH的起点。用于选择候选者采用的策略是维持与所用序列最大可能的相似性，假定相似的氨基酸序列会诱导相似的二级和三级结构，并且因此赋予不同蛋白相同的特性和在匹配条件下相同的行为。

在UniProtKB/Swiss-Prot数据库中对与目前使用的序列最相似的序列的目录学研究导致表6中列出的蛋白的选择。

表6.选择用于在大肠杆菌中表达的12α-HSDH的列表。相似性表示为与芽孢杆菌种的12α-HSDH(ID数据库：A3IBN0被描述为“预测的短链脱氢酶”)相比的氨基酸序列相似性的百分比。

69％至98.8％的相似性范围的选择表示在与迄今已经给出优异结果的蛋白的高相似性和足够的多样性之间的良好折衷。

最佳LDH候选者的选择

兔肌肉乳酸脱氢酶的异源表达总是导致比12α-HSDH更多的问题。这可能是错误的折叠问题和随后溶解度/活性降低的后果，这是真核蛋白在宿主细菌的表达期间频繁遇到的。

因此，LDH新品种的选择策略是基于微生物大肠杆菌的异源表达的便利性，因此选择提供最少复杂可能的四级结构的细菌来源序列或蛋白，以及基于与迄今使用的蛋白相关和在新候选者之间两者的最大的序列多样性，诸如从数据库中存在的所有乳酸脱氢酶亚类中选择一个代表性的，并且不依赖于1.6-二磷酸果糖和热稳定性。

用于表达选择的酶列于表7中。

表7.用于在大肠杆菌中表达选择的LDH的列表。

两种蛋白LDH_GEOSE和LDH_THECA表现出相对于数据库中记录的序列的突变，因为这些修饰赋予1.6-二磷酸果糖的不依赖性。特别地LDH_GEOSE表现出突变R104C、Q189L、N293S，而序列LDH_THECA表现出6个突变，具体地L67E、H68D、E178K、A235R、R173Q和R216L，这些突变显著增加蛋白的热稳定性。

相反，列表中的其他酶在野生型形式已经不依赖效应子。

对序列之间进化距离的分析表明，选择的蛋白除了表示LDH的不同亚类外，在进化上也是弱相关的，这表明评价进化以适应不同条件并因此表现出不同特性的酶的可能性。

制备合成基因

编码选择的酶的基因在经历用于在作为宿主选择的微生物中表达的优化之后进行化学合成。优化算法利用遗传密码的简并来构思核苷酸序列，所述核苷酸序列尽管编码与所需蛋白的相同的蛋白，但能够在选择的表达系统中转录和优化翻译，稳定信使RNA，促进核糖体键合，并且消除诱导翻译过早中断的区域。

表达载体的克隆

在第一个操作步骤中选择的五个LDH和五个12α-HSDH的编码序列分别总结于表8和表9中。

表8.用于在大肠杆菌中表达的选择的LDH的列表

名称	生物体	功能	数据库ID
				LDH_CUPNH.Ec	钩虫贪铜菌	LDH	Q07251
LDH_LACPE.Ec	戊糖乳杆菌	LDH	P56511
				LDH_GEOSE.Ec	嗜热脂肪芽孢杆菌	LDH	P00344_mut6A
LDH_THECA.Ec	Thermus caldophilus	LDH	P06150_mutQ4P2
				LDH_CAEEL.Ec	秀丽隐杆线虫	LDH	Q27888

表9.用于在大肠杆菌中表达的选择的12α-HSDH的列表

名称	生物体	功能	数据库ID
				12a_988.Ec	球形赖氨酸芽孢杆菌CBAM5	氧化还原酶	W7S3E4
12a_956.Ec	纺缍形赖氨酸芽孢杆菌ZC1	短链DH	D7WVF0
				12a_829.Ec	沙氏芽孢杆菌	氧化还原酶	A0A0Q3WK25
12a_793.Ec	动性球菌属亚种L10.15	氧化还原酶	A0A0K9SYS7
				12a_698.Ec	Jeotgalicoccus亚种13MG44_air	应激蛋白39	A0A078M324

将针对使用大肠杆菌作为宿主进行优化之后合成的基因克隆在用于细胞质表达的特异性载体(pET21 12a_988)中，该载体表现出可使用乳糖或合成类似物例如IPTG(异丙基β-d-1-硫代半乳糖吡喃糖苷)诱导的启动子，并且赋予氨苄青霉素抗性。

转化与LDH表达测试

使用构建的载体转化异源表达通常使用的超生产型大肠杆菌菌株。还转化了先前通过hdhA基因缺失制备的菌株(菌株ΔhdhA)，该基因编码导致不想要的副反应的内源酶7α-HSDH。每个菌株的转化克隆在选择性液体培养基中繁殖，并且然后以不同量冷冻保存。这些样品代表所有随后表达测试的起点。

使用获得的甘油酯的初步测试在最小培养基中通过由乳糖诱导进行。在蛋白的预期分子量在32.8kDa(LDH_THECA)与36.8kDa(LDH_CUPNH)之间时，表达的定性和半定量分析使用SDS-PAGE(十二烷基硫酸钠存在下的聚丙烯酰胺凝胶电泳)进行。鉴于表达与所用的大肠杆菌类型无关，测试表明，所用的菌株不是限制性参数。进行的测试表明，对于被分析的5种酶中的任何酶，超产菌株与对应的缺失菌株之间的比较在表达上不存在明显差异。

为了优化表达，在实验室规模(最终体积＝50ml)测试可能促进蛋白表达的不同条件。为此目的，所有的测试都在环境温度进行。

特别地，考虑以下变量：

培养基：标准和优化；

诱导物浓度(乳糖)：2g/L或10g/L；

诱导时所处的生长期：指数期或稳定期；

搅拌：250rpm或150rpm。

无论测试条件如何，LDH_CUPNH、LDH_THECA和LDH_LACPE都实现良好的过表达水平。

但是，在LDH_GEOSE和LDH_CAEEL的表达中观察到较大的变异性。

对列出的变量的所有组合的评价能够鉴定提供所有感兴趣的LDH酶最有利表达的条件，即优化的培养基、在指数期期间使用2g/L乳糖诱导以及以250rpm搅拌。

纯化和溶解度

乳酸脱氢酶应用机械裂解方法来纯化，包括在去污剂存在的情况下使用超声处理细胞，以促进膜的溶解。使可溶性级分(合适地与不溶性级分分离)经历使用SDS-PAGE的首次定性分析。

对应于酶LDH_LACPE、LDH_CAEEL和LDH_CUPNH的条带在聚丙烯酰胺凝胶上是可见的，包括第一种酶的更强的条带，因此它是五种感兴趣的蛋白中最可溶的。相反，酶LDH_GEOSE和LDH_THECA是不可见的。

酶活性

应用先前开发的“UV Bict LDH”方法对酶进行滴定。标准测试条件包括在环境温度，pH7的100mM磷酸盐缓冲液中孵育酶。

测量的活性水平示于表10中。

表10.以单位/ml表示的细胞裂解物的活性。还报道了用于标准生物转化中的乳酸脱氢酶兔肌肉的LDH样品(LDH.A)(批次LDH010111/4)的活性，。

LDH	活性(U/ml)
		LDH.A	225±4.6
LDH_CAEEL	290±1.2
		LDH_CUPNH	47±11.5
LDH_GEOSE	20±0.7
		LDH_LACPE	2830±45
LDH_THECA	4±1.1

在定性分析中最可溶的酶，LDH_LACPE，在标准条件下表现出更大的活性。较低的溶解度也与较低的活性对应，如对于酶LDH_GEOSE和LDH_THECAL观察到的。

滴定是在标准条件下体外建立的活性值。因此，评价LDH在目标反应条件下的性能是有必要的，因为这些条件可能正面地或负面地影响每种特定蛋白的活性。

12α-HSDH的转化及表达测试

与LDH的情况一样，使用构建的载体转化异源表达通常使用的超生产型大肠杆菌菌株，包括菌株ΔhdhA。每个菌株的转化克隆在选择性液体培养基中繁殖，并且然后冷冻保存。这些冷冻样品代表所有随后表达测试的起点。

在最小培养基上用乳糖诱导的初步试验表明，12α-HSDH表达的基本参数是宿主菌株。

可能的是，表达诱导除ROS菌株外的所有细胞过度应激，因此ROS菌株被选择作为随后测试的最佳菌株。

对于每一个ROS转化子，还产生了具有内源7α-HSDH缺失的形式，目的是作为没有与预期相关的副反应的表达菌株偶然使用。

与对LDH表达执行的操作相匹配，对12α-HSDH进行了ROS菌株的优化表达，在实验室规模(最终体积＝50ml)测试了可以促进可溶形式蛋白表达的不同条件下。为此目的，所有的测试都在环境温度进行，评价不同的诱导物(乳糖或IPTG)、诱导时所处的生长步骤(指数或固定)和培养基(标准或优化)。

在优化的培养基中在指数期乳糖诱导下获得了最佳表达，并且其他酶也获得了类似的结果。

纯化和溶解度

12α-HSDH利用机械裂解方法来纯化，包括使用超声处理细胞，以及随后分离可溶性和不可溶性级分。利用SDS-PAGE的第一分析表明，在通过细胞超声纯化后，所有蛋白均是可溶性的，在可溶性级分中所有条带均是可见的。

酶促活性

将酶使用先前定义的方法“Uv Bict 12α-HSDH”进行滴定。标准测试条件包括在环境温度，在pH8.5的100mM磷酸盐缓冲液中孵育酶。

表11显示了获得的值，包括用于标准反应的酶Ox111(批次12A010113/1)的活性。

表11.以单位/ml表示的细胞裂解物的活性。同时还报道了用于标准生物转化的酶12α-HSDH Ox111(批次12A010113/1)样品的活性。

12a-HSDH	活性(U/ml)
		Ox111	1380±28
12a_988	716±38
		12a_956	525±23
12a_829	406±56
		12a_793	55±2.3
12a_698	70±0.7

根据体外滴定，与酶Ox111相比，所有表达的蛋白表现出较低的活性。然而，酶的性能在反应条件下可以不同，这取决于结构和蛋白活性如何受与体外那些相比的反应参数差异的影响。

还观察到，根据先前进行的测试，胆酸向12k-CDCA生物转化中的限制因素不是12α-HSDH的活性，而是辅助因子NAD+/NADH的循环反应，并且因此影响乳酸脱氢酶(LDH)的性能。因此，可能的是，通过优化后一种酶，新的12α-HSDH变体相对于标准酶(Ox111)的较低活性不会负面地影响反应收率。

生物转化

为了鉴定在新的LDH与新的12α-HSDH之间在收率方面最有利的组合，根据表12中列出的因子设计实施初步测试。将所有五种乳酸脱氢酶与五种12α-HSDH的每一种组合，利用在Bict应用的小型化系统，该小型化系统能够对很小的体积(1ml)执行高通量筛选(HTS)，同时分析不同的参数。作为对照，反应也与酶LDH.A和OX111组合实施。

表12.所有感兴趣的6种LDH(5种新的和对照LDH.A)与所有感兴趣的6种12α-HSDH(5种新的和对照Ox111)的组合。

反应在标准条件下进行。

20h之后，根据“在12K-CDCA的氧化法”(Method Ox of CA at 12K-CDCA)利用HPLC分析对生物转化收率进行验证。表13呈现了以色谱面积百分比表示的剩余胆酸值。

表13.以色谱面积百分比表示的剩余胆酸。

在标准条件下，没有组合实现与两种标准酶LDH.A和Ox111的收率相当的收率，剩余底物面积百分比是约50％，而仅LDH_CAEEL实现至少80％的转化。表9显示，在这两种酶之间，是乳酸脱氢酶调节收率，考虑到在相同的LDH下，不管利用的12α-HSDH如何，剩余胆酸获得相似的值。即使是在体外最有前途的LDH，在反应条件下也给出了非常糟糕的结果。

限制因素：LDH与酶稳定性

考虑到调节酶促活性的重要因素之一是蛋白在反应条件下的稳定性，随后对各乳酸脱氢酶的剩余活性进行了体外滴定，在标准条件下(T＝30℃，pH8)的反应混合物中孵育。

表14显示了从反应混合物中取样后的特定时间(1h、4h、20h)记录的活性值(U/ml)。

表14.在随后时间在反应混合物中孵育后，使用“Method Uv-Bict LDH”测量的滴度。表中的值表示为单位/ml(U/ml)。

	0h	1h	4h	20h
					CAEEL	290	109.5	74.4	61.3
CUPNH	47	57.3	43.7	65.3
					GEOSE	20	16.1	38.2	61
THECA	4	17.1	33	52.3
					LDH.A	225	82.9	103	80.4
LACPE	2830	36	39	50

表14显示，真核蛋白(LDH_LDH.A和LDH_CAEEL)在一小时后失去其活性的多于60％，并且酶滴度在随后数小时内保持不变。LDH_CUPNH、LDH_GEOSE和LDH_THECA是稳定的，但活性保持太低，不能实现目标收率。虽然LDH_LACPE表现出远高于其他蛋白的初始滴度，但在一小时之后活性急剧下降，证明其在感兴趣的生物转化中极其不稳定。

因此，明显的是，标准条件不适用于所选择的五种乳酸脱氢酶的活性，特别是在体外视为表现的最有希望的一种，LDH_LACPE。

限制因素：LDH和pH

标准反应分析的主要参数是pH值：蛋白氨基酸质子化的不同状态可以调节其三维结构，并且因此调节其活性。

平行实施反应，其中将Ox111由不同的LDH与在每种情况下确定的辅助因子循环系统关联，对每种酶组合测试3个pH，pH＝7.5、pH＝7和pH＝6.5。20h之后，LDH的剩余活性利用““Method Uv-Bict LDH”来滴定。

获得的实验结果表明，乳酸脱氢酶变体在反应混合物中孵育后相对不稳定，特别是在较低的pH值相对不稳定。唯一的例外是l’LDH_LACPE，它的稳定性随着反应环境酸度的增加而增加。这一行为得到了文献数据的支持，其中该酶的最佳pH是5.5，并且这可能解释了尽管与其他滴定剂相比体外蛋白滴度高，但生物转化收率低。

根据“从CA至12K-CDCA氧化法”(Method Ox from CA to 12K-CDCA)，利用HPLC分析确定中性和酸性pH值的生物转化收率。

如预测的，LDH_LACPE的稳定性随着pH减少而增加，并且反应收率也增加，由50％的转化(pH8)转变至约93％的转化(pH7)。可能的是，在pH 6.5，收率低于中性条件下的收率，因为Ox111的活性成为限制；已知12α-HSDH变体表现出碱性最佳pH(约8)。

相反，另一种LDH转移到酸性条件表现出性能恶化。

12α-HSDH的选择

在鉴定了最佳LDH和改进其性能的条件后，努力选择能够实现至少与OX111相当的收率的12α-HSDH。

在LDH_LACPE活性更加稳定的pH值(pH7、pH6.5、pH6)，与每一个替代OX111的12α-HSDH组合，实施平行反应。

在30℃20h之后，将样品根据“从CA至12K-CDCA氧化法”处理和分析。

最佳收率使用酶LDH_LACPE与12a_829或12a_793获得，这表现出与对照Ox111收率相当的值，但仅在pH7，这表示LDH的最佳酸性pH与12α-HSDH的碱性pH值之间的良好折衷。

优化击中

使给出最佳收率的组合LDH_LACPE/12α-HSDH_829和LDH_LACPE/12α-HSDH_793经历优化，以便接近所需的目标(剩余胆酸低于0.5％)。

因此，实施反应，不同的参数包括：孵育温度(30℃/24℃)、LDH体积(6％v/v或3％v/v)、12α-HSDH体积(3％v/v或6％v/v)和pH7磷酸缓冲液的浓度(1M或0.1M)。收率应用“从CA至12K-CDCA氧化法”进行评价。

考虑仅使用100mM浓度的磷酸盐缓冲液实现目标，表15中的所得值显示区分要素是发生反应的磷酸盐缓冲液的摩尔浓度。可以注意的是，与标准相比，LDH的浓度可以减半，因为可能在这些条件下，酶是非常活跃的，并且大大过量。

表15.使用12a_829和12a_793的反应优化过程中的反应收率。报告的值被理解为HPLC分析色谱中剩余胆酸的面积百分比。Std:[LACPE]＝6％V/V，[12α-HSDH]＝3％V/V，12A_2X:[12α-HSDH]＝6％V/V，[LACPE]＝6％V/V；LDH_0.5X:[LACPE]＝3％V/V，[12α-HSDH]＝3％V/V

根据对小体积(1ml)筛选和优化步骤期间获得的数据，进行了扩大测试，在200ml的反应体积中重现最佳条件。生物转化完成之后，将产物使用HPLC进行纯化和分析。

考虑到在筛选步骤期间两种酶12a_829和12a_793返回相似的结果，对它们均进行了测试。

HPLC分析返回如下剩余胆酸的面积值百分比：

12a_829＝0.466

12a_793＝0.657

发现对小规模选择的参数使用较大的体积实现所需收率也是可能的，并且12a_829是两种选择中较好的酶。

样品制备

利用以上本文描述的菌株和最佳条件，将酶LDH_LACPE、12A_829和12A_793在实验室规模(500ml锥形瓶)的发酵方法中进行表达。

将蛋白根据以上描述方法进行纯化。然后，细胞裂解物形式的酶以25％v/v重悬于甘油中，以便实现改进的蛋白和滴度稳定性。

另外的诱变

如上文观察到的，进行的两个诱变循环产生了两个进行的突变体，其中最后一个(Seq73)表现出几乎完全消除氧化化合物，并且利用多达10g/L的DCA底物的约90％转化。

对该酶的结构生物信息学分析揭示了许多其他任选的突变以便潜在增加性能，可能以便进一步降低底物抑制(作用于酶三维结构中所谓的“第二口袋”)。

因此，利用生物信息学分析期间收集的信息，对所有潜在有用的突变进行了进一步的考虑，以产生另外的改进。

利用从对接分析导出的数据，本工作针对生物信息学分析鉴定对不仅增加底物与蛋白之间的亲和力而且对消除可能产生用于DCA的第二个键合口袋的残基重要的某些位置。

表16列出了根据至少三种对接模型的比较可能参与与DCA形成第二个键合位点的主要残基。

表16.在多于一种对接模型中参与蛋白与DCA之间第二相互作用位点形成的残基的列表。

残基	位置
		苯丙氨酸	60
丙氨酸	64
		组氨酸	83
亮氨酸	86
		精氨酸	220
甘氨酸	367
		精氨酸	370
赖氨酸	390

图4清楚地示出了蛋白的氨基酸序列中包含的感兴趣的残基：它们在一级线性序列彼此远离，但在生物催化剂折叠之后，它们都靠近与底物相互作用的区域。底物-细胞色素相互作用的生物信息学模型鉴定第二区域的可能存在，在那里DCA可以定位自身，因此阻止进入实际的活性位点，并且从而降低酶的性能。

选择所述残基作为用于饱和诱变测试的靶，这旨在将所有6个残基用所有其他19个L-氨基酸取代，得到19⁶种用于测试的潜在的不同序列组合。使用Seq11作为PCR反应模板，其中将序列在具有影响8个残基的每一个的简并的引物存在的情况下进行扩增，以便仅在8个选择的位置中引入随机突变。使用5种不同的引物引入最大可能的突变数，将获得终止密码子的可能性降低至最小。

将获得的序列池克隆在以上本文描述的用于由组成型启动子调控的酵母细胞内表达的载体中被，因此消除商业载体中预见的甲醇作为诱导物的使用，但难以在工业规模上应用于发酵(易燃性和毒性风险)。利用所获得的质粒转化先前选择的巴斯德毕赤酵母菌株，该菌株也能够表达真菌辅助蛋白NAD(P)H-p450还原酶。

表达和生物转化测试

从使用由随机诱变获得的序列转化巴斯德毕赤酵母获得的克隆用于HTS表达和生物转化测试，利用24孔微孔板小型化系统(2ml培养基/孔)用于细胞生长的和96深孔微孔板用于生物转化步骤，诸如以降低操作体积，并且能够同时对不同克隆(每次测试多达192个克隆)进行宽谱筛选。

进行总计5次表达和生物转化测试，实现总计960个克隆的分析。

生长步骤包括在缓冲培养基中以每个微孔板的孔一个克隆进行的接种。生长3天之后，将细胞糊状物通过离心与耗尽的培养基分离并且随后以20％wwcp/V重悬于反应缓冲液中，并且加入20g/L最终浓度的DCA底物，用于准备生物转化测试。

反应3天之后，在细胞悬浮液酸化后使用2体积甲醇提取总胆汁酸。提取物的分析使用INERTSIL ODS-2柱，C18，250×4.6至5um，CPS分析型(目录号5020-01128)来进行。

在分析的960个克隆中，在小规模HTS测试中，没有一个克隆表现出比原始克隆更好的性能，但鉴定出提供与阳性对照相比相似性能的三个克隆(P2B1、P5C3、P8D5)。

然后，将鉴定的3个克隆在具有100ml培养基的500ml锥形瓶中在更大规模测试，诸如以改进培养物的氧合度，氧合度是最大调节巴斯德毕赤酵母生长的参数之一。以这种方式，以下是可能的：评价在最佳生长和表达条件下，克隆是否会产生提供优于野生型收率的突变的细胞色素，或者尽管提供相似的性能，克隆是否可能在随着时间的推移产生的生物质方面表现出优异的生长。从工业应用的角度来看，考虑到生物催化剂包含在生物质自身中，对于感兴趣的细胞色素的同等表达，具有尽可能快速生长的酵母克隆是有利的，诸如限制发酵时间并且因此限制成本。

生长3天之后，将细胞糊状物通过离心与耗尽的培养基分离并且随后以20％wwcp/V重悬于反应缓冲液中，并且加入20g/L最终浓度的DCA底物，用于准备生物转化测试。与表达Seq73的酵母克隆相比，这三个克隆没有表现出更高的生长速度。

序列表

<110> 艾希易股份公司

<120>用于制备熊脱氧胆酸的方法

<130> ADV00459PTITWO

<160> 13

<170> BiSSAP 1.3.6

<210> 1

<211> 513

<212> PRT

<213> 未知(Unknown)

<220>

<223> 蛋白2

<400> 1

Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu

1 5 10 15

Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu

20 25 30

Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro

35 40 45

Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala

50 55 60

Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr

65 70 75 80

Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe

85 90 95

Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala

100 105 110

Arg Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser

115 120 125

Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu

130 135 140

Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn

145 150 155 160

His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu

165 170 175

Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly

180 185 190

Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr

195 200 205

Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg

210 215 220

Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val

225 230 235 240

Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp

245 250 255

Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser

260 265 270

Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys

275 280 285

Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His

290 295 300

Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln

305 310 315 320

Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser

325 330 335

Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp

340 345 350

Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ala

355 360 365

Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val

370 375 380

Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn

385 390 395 400

Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu

405 410 415

Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser

420 425 430

Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro

435 440 445

Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met

450 455 460

Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser

465 470 475 480

Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met

485 490 495

Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp

500 505 510

Glu

<210> 2

<211> 513

<212> PRT

<213> 未知(Unknown)

<220>

<223> 蛋白11

<400> 2

Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu

1 5 10 15

Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu

20 25 30

Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro

35 40 45

Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala

50 55 60

Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr

65 70 75 80

Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe

85 90 95

Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Glu Val Ala

100 105 110

Val Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser

115 120 125

Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu

130 135 140

Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn

145 150 155 160

His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu

165 170 175

Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly

180 185 190

Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr

195 200 205

Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg

210 215 220

Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val

225 230 235 240

Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp

245 250 255

Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser

260 265 270

Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys

275 280 285

Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His

290 295 300

Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln

305 310 315 320

Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser

325 330 335

Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp

340 345 350

Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Leu Leu Gly Ile

355 360 365

Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val

370 375 380

Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn

385 390 395 400

Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu

405 410 415

Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser

420 425 430

Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro

435 440 445

Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met

450 455 460

Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser

465 470 475 480

Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met

485 490 495

Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp

500 505 510

Glu

<210> 3

<211> 513

<212> PRT

<213> 未知(Unknown)

<220>

<223> 蛋白73

<400> 3

Met Ala Thr Asp Leu Asp Leu Val Leu Gly Lys Ser Gln Tyr Ala Leu

1 5 10 15

Phe Cys Gly Ile Thr Leu Phe Ser Phe Phe Ile Leu Lys Tyr Ser Leu

20 25 30

Leu Gly Asn Gly Gly Lys Gln Tyr Pro Tyr Ile Asn Pro Lys Lys Pro

35 40 45

Phe Glu Leu Ser Asn Gln Arg Val Val Gln Asp Phe Ile Glu Asn Ala

50 55 60

Arg Asp Ile Leu Thr Lys Gly Arg Ser Leu Tyr Lys Asp Thr Pro Tyr

65 70 75 80

Lys Ala His Thr Asp Leu Gly Asp Val Leu Val Ile Pro Pro Glu Phe

85 90 95

Ala Asp Ala Leu Lys Ser Glu Arg Gln Leu Asp Phe Thr Ser Val Ala

100 105 110

Val Asp Asp Thr His Gly Tyr Ile Pro Gly Phe Glu Pro Ile Gly Ser

115 120 125

Pro Phe Asp Leu Val Pro Leu Val Asn Lys Tyr Leu Thr Arg Ala Leu

130 135 140

Ala Lys Leu Thr Lys Pro Leu Trp Ala Glu Ala Ser Leu Gly Val Asn

145 150 155 160

His Val Leu Gly Thr Ser Thr Glu Trp His Pro Ile Asn Pro Gly Glu

165 170 175

Asp Ile Met Arg Ile Val Ser Arg Met Ser Ser Arg Ile Phe Met Gly

180 185 190

Glu Glu Leu Cys Lys Asp Asp Asp Trp Leu Lys Val Ser Ile Glu Tyr

195 200 205

Thr Val Gln Leu Phe Gln Thr Ala Asp Glu Leu Arg Asn Tyr Pro Arg

210 215 220

Trp Thr Arg Pro Tyr Ile His Trp Phe Leu Pro Ser Cys Gln Gly Val

225 230 235 240

Arg Arg Lys Leu Gln Glu Ala Arg Asp Leu Leu Gln Pro His Ile Asp

245 250 255

Arg Arg Asn Ala Val Lys Lys Glu Ala Ile Ala Glu Gly Arg Pro Ser

260 265 270

Pro Phe Asp Asp Ser Ile Glu Trp Phe Glu Asn Glu Tyr Glu Gly Lys

275 280 285

Ser Asp Pro Ala Thr Glu Gln Ile Lys Leu Ser Leu Val Ala Ile His

290 295 300

Thr Thr Thr Asp Leu Leu Ser Glu Thr Met Phe Asn Ile Ala Leu Gln

305 310 315 320

Pro Glu Leu Leu Gly Pro Leu Arg Glu Glu Ile Val Thr Val Leu Ser

325 330 335

Thr Glu Gly Leu Lys Lys Thr Ser Phe Tyr Asn Leu Lys Leu Met Asp

340 345 350

Ser Val Ile Lys Glu Ser Gln Arg Leu Arg Pro Val Ser Leu Gly Ile

355 360 365

Phe Arg Arg Met Ala Leu Ala Asp Val Thr Leu Pro Asn Gly Asp Val

370 375 380

Ile Lys Lys Gly Thr Lys Ile Ile Cys Asp Thr Thr His Gln Trp Asn

385 390 395 400

Pro Glu Tyr Tyr Pro Asp Ala Ser Lys Phe Asn Ala Tyr Arg Phe Leu

405 410 415

Gln Met Arg Gln Thr Pro Gly Gln Asp Lys Arg Ala His Leu Val Ser

420 425 430

Thr Ser His Asp Gln Met Gly Phe Gly His Gly Leu His Ala Cys Pro

435 440 445

Gly Arg Phe Phe Ala Ala Asn Glu Ile Lys Ile Ala Leu Cys His Met

450 455 460

Leu Leu Lys Tyr Asp Trp Lys Leu Pro Glu Gly Val Val Pro Lys Ser

465 470 475 480

Lys Ala Leu Gly Met Ser Leu Leu Gly Asp Arg Glu Ala Lys Leu Met

485 490 495

Val Lys Arg Arg Ala Ala Glu Ile Asp Ile Asp Ala Ile Gly Ser Asp

500 505 510

Glu

<210> 4

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> /PCR_引物="n=任何碱基a、c、g或t；k=g或t s=g或c"

/注释="合成核苷酸"

<400> 4

ctttgaaatc tgagagacaa ttggatttca ctnnkgttgc tnnsgatgat actcacggtt 60

acattccagg 70

<210> 5

<211> 72

<212> DNA

<213> 未知(Unknown)

<220>

<223> /PCR_引物="n=任何碱基a、c、g或t，k=g或t；S=g或c "

/注释="人工序列"

<400> 5

ctgttattaa agagtctcaa agattgagac ctgttnnktt gggtnnsttc agaagaatgg 60

ctttggctga tg 72

<210> 6

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> /PCR_引物="n=任何碱基a、c、g或t；k=g或t"

/注释="合成核苷"

<400> 6

ctttgaaatc tgagagacaa ttggatttca ctnnkgttgc tgtcgatgat actcacggtt 60

acattccagg 70

<210> 7

<211> 59

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> /PCR_引物="N=任何碱基a、c、g或t"

/注释="合成核苷"

<400> 7

gtagatcttt gtacaaggat actccatata aagctnnkac tgatttggga gatgttttg 59

<210> 8

<211> 80

<212> DNA

<213> 未知(Unknown)

<220>

<223> /PCR_引物="n=任何碱基a、c、g或t，K=g或t，b= c、g或t"

/注释="Arg220"

<400> 8

ttgagtacac tgttcaattg tttcaaactg ctgatgaatt gbnkaattac cctagatgga 60

ctagaccata tattcattgg 80

<210> 9

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> /PCR_引物="n= a、c、g或t，k=g或t，h=a、c或t"

/注释="合成核苷酸"

<400> 9

gagtctcaaa gattgagacc tgttagtttg hnkatcttcn nkagaatggc tttggctgat 60

gttactttgc ca 72

<210> 10

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> /PCR_引物="n= a、c、g或t，k=g或t"

/注释="合成引物"

<400> 10

ctgttattaa agagtctcaa agattgagac ctgttnnktt gggtatcttc agaagaatgg 60

ctttggctga tg 72

<210> 11

<211> 1544

<212> DNA

<213> 未知(Unknown)

<220>

<223> 蛋白2的核苷酸序列

<400> 11

atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60

actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120

ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180

atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240

ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300

tgaaatctga gagacaattg gatttcactg aagttgctag agacgatact cacggttaca 360

ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420

tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480

atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540

gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600

attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660

gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720

ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780

ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840

ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900

tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960

aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020

tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080

gattgagacc tgttttgttg ggtgctttca gaagaatggc tttggctgat gttactttgc 1140

caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200

accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260

aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320

ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380

ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440

ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500

gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544

<210> 12

<211> 1544

<212> DNA

<213> 未知(Unknown)

<220>

<223> 蛋白11的核苷酸序列

<400> 12

atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60

actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120

ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180

atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240

ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300

tgaaatctga gagacaattg gatttcactg aagttgctgt cgacgatact cacggttaca 360

ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420

tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480

atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540

gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600

attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660

gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720

ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780

ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840

ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900

tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960

aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020

tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080

gattgagacc tgttttgttg ggtatcttca gaagaatggc tttggctgat gttactttgc 1140

caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200

accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260

aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320

ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380

ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440

ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500

gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544

<210> 13

<211> 1544

<212> DNA

<213> 未知(Unknown)

<220>

<223> 蛋白73的核苷酸序列

<400> 13

atggctactg atttggattt ggttttgggt aaatctcaat acgctttgtt ttgtggtatc 60

actttgtttt ctttctttat cttgaagtat tctttgttgg gtaacggtgg taaacaatac 120

ccttacatca acccaaagaa acctttcgag ttgtctaacc aaagagttgt tcaagatttc 180

atcgaaaacg ctagagatat cttgactaag ggtagaagtc cttgtacaag gatactccat 240

ataaagctca tactgatttg ggagatgttt tggttattcc acctgaattt gctgatgctt 300

tgaaatctga gagacaattg gatttcacta gtgttgctgt cgacgatact cacggttaca 360

ttccaggttt tgagcctatt ggttctccat tcgatttggt tcctttggtt aacaagtatt 420

tgactagagc tttggctaag ttgactaaac cattgtgggc tgaagcttct ttgggtgtta 480

atcatgtttt gggtacttct actgagtggc acccaattaa ccctggtgaa gatattatga 540

gaatcgtttc tagaatgtct tctagaattt ttatgggtga agagttgtgt aaggatgatg 600

attggttgaa agtttctatt gagtacactg ttcaattgtt tcaaactgct gatgaattga 660

gaaattaccc tagatggact agaccatata ttcattggtt cttgccttct tgtcaaggtg 720

ttagaagaaa gttgcaagaa gctagagatt tgttgcaacc acacattgat agaagaaatg 780

ctgttaagaa agaggctatt gctgaaggta gaccatctcc ttttgatgat tctattgagt 840

ggttcgaaaa cgagtacgag ggtaaatctg atccagctac tgaacaaatt aaattgtctt 900

tggttgctat ccatactact actgatttgt tgtctgagac tatgttcaat attgctttgc 960

aacctgaatt gttgggtcca ttgagagaag agattgttac tgttttgtct actgaaggtt 1020

tgaagaaaac ttctttctac aacttgaagt tgatggattc tgttattaaa gagtctcaaa 1080

gattgagacc tgttagtttg ggtatcttca gaagaatggc tttggctgat gttactttgc 1140

caaacggaga tgttattaag aaaggtacta agattatttg tgatactact catcaatgga 1200

accctgaata ctatccagat gcttctaagt ttaacgctta cagattcttg caaatgagac 1260

aaactcctgg tcaagataaa agagcccatt tggtttctac ttctcacgat caaatgggtt 1320

ttggtcatgg tttgcacgct tgtccaggta gatttttcgc tgctaacgag attaaaattg 1380

ctttgtgtca catgttgttg aagtatgatt ggaaattgcc tgaaggtgtt gttccaaagt 1440

ctaaagcttt gggtatgtct ttgttgggag atagagaggc taagttgatg gttaaaagaa 1500

gagctgctga gattgatatt gatgctattg gttctgatga ataa 1544

Claims

1.具有7-β羟化酶活性的酶，并且所述酶具有SEQ ID N.1，其中彼此独立地：

-位置368处氨基酸是I；

2.根据权利要求1所述的具有7-β羟化酶活性的酶，其中所述位置110处的氨基酸是R或S。

3.根据权利要求1或2所述的具有7-β羟化酶活性的酶，其中所述位置365处的氨基酸是A或S。

4.根据权利要求1-3中任一项所述的具有7-β羟化酶活性的酶，其中所述位置113处的氨基酸是V。

5.根据权利要求1-4中任一项所述的具有7-β羟化酶活性的酶，所述酶具有SEQ IDN.3。

6.根据权利要求1-5中任一项所述的具有7-β羟化酶活性的酶，其中所述酶的氨基酸序列与SEQ ID N.1具有至少80％的序列同一性，优选地所述酶的氨基酸序列与SEQ ID No.1具有至少85％的序列同一性。

7.表达载体，所述表达载体包含编码根据权利要求1-6中任一项所述的具有7-β羟化酶活性的酶的核苷酸序列。

8.一种用于制备熊脱氧胆酸(UDCA)的化学-酶促方法，所述化学-酶促方法包括以下步骤：

a)通过使用权利要求1所述的具有7-β羟化酶活性的酶，将脱氧胆酸(DCA)转化为熊胆酸(UCA)，

b)通过使用12α-羟基类固醇脱氢酶(12-HSDH)和乳酸脱氢酶(LDH)，将熊胆酸(UCA)转化为12K-UDCA，以及

c)进行Wolff-Kishner还原，从而得到UDCA。

9.根据权利要求8所述的化学-酶促方法，其中将DCA转化为UCA的步骤a)通过使用以编码具有7-β羟化酶活性的酶的权利要求7所述的表达载体转化的巴斯德毕赤酵母(P.pastoris)的生物质进行。

10.根据权利要求8或9所述的化学-酶促方法，其中在步骤b)中，使用脱氢酶12α-HSDH，所述脱氢酶12α-HSDH选自12a_988、12a_829、12a_793、12a_956和12a_698；以及使用乳酸脱氢酶LDH，所述乳酸脱氢酶LDH选自LDH_CUPNH、LDH_THECA、LDH_CAEEL、LDA_GEOSE和LDH_LACPE。

11.根据权利要求10所述的化学-酶促方法，其中在步骤b)中使用乳酸脱氢酶LDH_LACPE和脱氢酶12a_829的组合或乳酸脱氢酶LDH_LACPE和脱氢酶12a_793的组合。

12.根据权利要求8-11中任一项所述的化学-酶促方法，其中步骤b)在24℃-30℃的孵育温度，在0.1-1M的磷酸盐缓冲液浓度和在6.5-7.5的pH，优选地在约27℃的温度，在pH＝7和在约1M的磷酸盐缓冲液浓度进行。

13.根据权利要求8-12中任一项所述的化学-酶促方法，其中在步骤b)中使用的LDH的体积是3％-6％v/v，并且使用的12α-HSDH的体积是3％-6％v/v。