一种达比加群中间体的酶催化合成方法及脂肪酶
技术领域
本发明涉及酶工程领域,具体领域为一种达比加群中间体的酶催化合成方法。
背景技术
达比加群酯(Dabigatran etexilate),商品名泰毕全,CAS号211915-06-9,是新一代口服抗凝血药物,由德国的勃林格殷格翰制药公司研制开发。2008年在德国和英国上市,用于关节置换术后静脉血栓栓塞症形成的预防。
1998年,达比加群酯化合物的专利WO9837075报道了达比加群酯类似物的合成方法。该方法以对氯间硝基苯甲酸甲酯D1为原料,制备化合物DF,该路线合成D3和DE副反应多,收率较低,成本偏高,对环境的污染较为严重。
达比加群酯的化合物专利WO9837075、专利CN10600709、CN1861596等报道了另外一条合成路线,以对氯间硝基苯甲酸DA为原料,通过取代偶联,氢化还原,再缩合和环化得到关键中间体DE。DE后的工艺和第一条路线相同,具体路线如下所示。与路线一相比,合成过程中不需要将4-氯-3-硝基苯甲酸甲酯的甲酯水解,减少反应步骤,提髙工艺总收率。该工艺反应步骤比较短,成本相对较低。
在该路线中,DB制备DC需要重要中间体D1N1,D1N1的合成主要为化学方法制备,需要甲苯等有机溶剂参与,且容易产生三种杂质(如下Z1/Z2/Z3)。
发明内容
本发明的第一目的在于提供一种脂肪酶。
本发明的第二目的在于提供一种上述脂肪酶的制备方法。
本发明的第三目的在于提供一种采用脂肪酶催化合成达比加群中间体的方法。
为实现上述目的,本发明提供如下技术方案:
一种脂肪酶,其基因来源菌株为南极假丝酵母,为优化后的CALB(南极假丝酵母脂肪酶B),其核苷酸序列如SEQ ID NO:1所示。该脂肪酶的氨基酸序列如SEQ ID NO:2 所示。
上述脂肪酶的制备方法:将优化后的CALB的序列经过PCR扩增后,导入质粒pRSFDuet-1的HindⅢ和BamHⅠ酶切位点获得重组表达载体,将重组表达载体电转入 CALB表达细胞中,得到CALB表达工程菌,经过抗生素抗性平板涂布筛选后,获得克隆菌株,送检测序确认无误,进行活化后发酵培养,离心收集菌体,洗涤并重悬,超声破碎,冻干得到CALB冻干粉。
其中,所述CALB表达细胞为E.coli Rosetta(DE3)。
采用上述脂肪酶催化合成达比加群中间体的方法,包括如下步骤:以化合物II为底物,在优化后的CALB、溶剂有机相中,进行化合物II和化合物III的加成反应,形成C-N键,生成化合物I,合成路线如下:
其中,酶催化为无水催化,所述溶剂为DMSO。
其中,化合物II与化合物III的摩尔比为1:1~5。
其中,化合物II与CALB的质量比为1:5~30。
其中,化合物II与溶剂的质量体积比为1:10~100g/mL。
与现有技术相比,本发明的有益效果是:
与纯化学合成路线相比,将生物法与化学法相结合,以化合物III和化合物II为底物,通过CALB催化加成反应,获得化合物I,操作方法简单,反应条件温和,对环境友好。
本发明的酶催化反应不需要高温高压等极端催化环境,也可以减少使用对人及环境有危害的催化剂,更重要地是,酶具有优异的立体选择性,可以有效提高产率和产品的光学纯度,降低杂质的产生量,具有很好的应用前景。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
步骤1:CALB基因工程菌的制备
CALB来源于南极假丝酵母Candida antarctica,Genebank登录号为Z30645.1,序列详见SEQ ID No:5。
将来源于酵母菌的CALB优化序列,得到优化后的CALB,其核苷酸序列如SEQ IDNO: 1所示。该脂肪酶的氨基酸序列如SEQ ID NO:2所示。进行PCR扩增后载入表达质粒pRSFDuet-1,双酶切位点为HindⅢ和BamHⅠ,引物为(如SEQ ID NO:3-4所示):
F:CGCGGATCCAATGAAACTGCTGTCTCTGACC
R:CCCAAGCTTTGGGGTAACGATACCGGAG
将重组表达质粒转入E.coli Rosetta(DE3)感受态,挑取阳性转化子并测序鉴定后,获得CALB表达工程菌:CALB-11。
步骤2:CALB的制备
将获得的CALB工程菌株CALB-11,接种到含有抗生素卡那抗性的LB液体培养基中,于37℃过夜培养,得到种子培养液。取1ml种子液接种至100ml TB发酵液培养基中。然后置于37℃下培养至OD600值为0.6,加入终浓度为0.05mol的IPTG,置于16℃继续培养18h后,12000rmp,4℃下离心收集菌体,加入液氮罐中速冻5min,冻干,获得冻干粉。
实施例2化合物I的制备
于250ml锥形瓶中,加入60ml DMSO,依次加入10g基因优化后的CALB(DNA序列详见SEQ ID No:1),1g化合物II,0.94g化合物III,加入反应器,200rpm搅拌,于 20℃下反应24h,得到化合物I。反应结果经HPLC检测,转化率为70%,重结晶纯度90%。
实施例3化合物I的制备
参考实施例1制备优化后的CALB的方法,制备未优化的CALB(DNA序列详见SEQ IDNO:5)。
于250ml锥形瓶中,加入60ml DMSO,依次加入10g未优化的CALB,1g化合物II,0.94g化合物III,加入反应器,200rpm搅拌,于20℃下反应24h,得到化合物I。反应结果经HPLC检测,转化率为36%,重结晶纯度87%。
通过上述实验结果可以看出,本发明优化后的CALB和未优化的CALB均可用于催化制备化合物I,但是优化后的CALB催化效果更佳。
本发明制得的酶具有优异的立体选择性,可以有效提高产率和产品的光学纯度,降低杂质的产生量,具有很好的应用前景。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
序列表
<110> 江苏阿尔法药业有限公司
<120> 一种达比加群中间体的酶催化合成方法及脂肪酶
<160> 5
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1026
<212> DNA
<213> CALB(Artificial Sequence)
<400> 1
atgaaactgc tgtctctgac cggtgttgct ggtgttctgg cgacttgtgt agcagctacc 60
ccactggtta aacgtctgcc gtctggctct gacccggcat tctctcagcc aaaaagcgtt 120
ctggacgctg gtctgacctg tcagggtgct tccccgtcta gcgtctctaa acctattctg 180
ctggtgccgg gtactggtac taccggtcca cagtccttcg acagcaactg gattccgctg 240
tctacccagc tgggctatac cccgtgttgg atttccccgc cgcctttcat gctgaacgat 300
acgcaggtca acaccgaata tatggtgaac gcaatcactg cgctgtatgc cggctccggc 360
aacaacaaac tgccagtgct gacctggtcc cagggtggtc tggttgccca gtggggtctg 420
actttcttcc cgagcattcg ttctaaagtt gaccgcctga tggcgttcgc tcctgattac 480
aagggcaccg ttctggcagg tccgctggat gctctggctg tgtccgctcc atctgtctgg 540
cagcaaacca cgggtagcgc actgaccact gcactgcgta acgctggcgg cctgactcag 600
attgttccaa ccaccaacct gtactctgcc actgacgaaa tcgtgcaacc tcaggtttct 660
aacagcccac tggactctag ctacctgttt aacggtaaaa acgtacaagc gcaggctgtg 720
tgtggcccgc tgttcgttat tgatcacgcg ggctccctga cttctcagtt cagctatgtt 780
gtgggtcgtt ccgctctgcg ttccaccact ggtcaggcac gttccgctga ttacggtatc 840
accgattgta acccgctgcc tgctaatgat ctgactccgg aacaaaaagt tgctgctgct 900
gcactgctgg ctccagcagc agcagctatt gtcgcaggtc caaaacagaa ctgcgaacca 960
gatctgatgc cgtacgctcg tccgtttgcg gttggtaaac gcacctgctc cggtatcgtt 1020
acccca 1026
<210> 2
<211> 342
<212> PRT
<213> CALB(Artificial Sequence)
<400> 2
Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys
1 5 10 15
Val Ala Ala Thr Pro Leu Val Lys Arg Leu Pro Ser Gly Ser Asp Pro
20 25 30
Ala Phe Ser Gln Pro Lys Ser Val Leu Asp Ala Gly Leu Thr Cys Gln
35 40 45
Gly Ala Ser Pro Ser Ser Val Ser Lys Pro Ile Leu Leu Val Pro Gly
50 55 60
Thr Gly Thr Thr Gly Pro Gln Ser Phe Asp Ser Asn Trp Ile Pro Leu
65 70 75 80
Ser Thr Gln Leu Gly Tyr Thr Pro Cys Trp Ile Ser Pro Pro Pro Phe
85 90 95
Met Leu Asn Asp Thr Gln Val Asn Thr Glu Tyr Met Val Asn Ala Ile
100 105 110
Thr Ala Leu Tyr Ala Gly Ser Gly Asn Asn Lys Leu Pro Val Leu Thr
115 120 125
Trp Ser Gln Gly Gly Leu Val Ala Gln Trp Gly Leu Thr Phe Phe Pro
130 135 140
Ser Ile Arg Ser Lys Val Asp Arg Leu Met Ala Phe Ala Pro Asp Tyr
145 150 155 160
Lys Gly Thr Val Leu Ala Gly Pro Leu Asp Ala Leu Ala Val Ser Ala
165 170 175
Pro Ser Val Trp Gln Gln Thr Thr Gly Ser Ala Leu Thr Thr Ala Leu
180 185 190
Arg Asn Ala Gly Gly Leu Thr Gln Ile Val Pro Thr Thr Asn Leu Tyr
195 200 205
Ser Ala Thr Asp Glu Ile Val Gln Pro Gln Val Ser Asn Ser Pro Leu
210 215 220
Asp Ser Ser Tyr Leu Phe Asn Gly Lys Asn Val Gln Ala Gln Ala Val
225 230 235 240
Cys Gly Pro Leu Phe Val Ile Asp His Ala Gly Ser Leu Thr Ser Gln
245 250 255
Phe Ser Tyr Val Val Gly Arg Ser Ala Leu Arg Ser Thr Thr Gly Gln
260 265 270
Ala Arg Ser Ala Asp Tyr Gly Ile Thr Asp Cys Asn Pro Leu Pro Ala
275 280 285
Asn Asp Leu Thr Pro Glu Gln Lys Val Ala Ala Ala Ala Leu Leu Ala
290 295 300
Pro Ala Ala Ala Ala Ile Val Ala Gly Pro Lys Gln Asn Cys Glu Pro
305 310 315 320
Asp Leu Met Pro Tyr Ala Arg Pro Phe Ala Val Gly Lys Arg Thr Cys
325 330 335
Ser Gly Ile Val Thr Pro
340
<210> 3
<211> 31
<212> DNA
<213> 引物F(Artificial Sequence)
<400> 3
cgcggatcca atgaaactgc tgtctctgac c 31
<210> 4
<211> 28
<212> DNA
<213> 引物R(Artificial Sequence)
<400> 4
cccaagcttt ggggtaacga taccggag 28
<210> 5
<211> 1029
<212> DNA
<213> 南极假丝酵母(Candida antarctica)
<400> 5
atgaagctac tctctctgac cggtgtggct ggtgtgcttg cgacttgcgt tgcagccact 60
cctttggtga agcgtctacc ttccggttcg gaccctgcct tttcgcagcc caagtcggtg 120
ctcgatgcgg gtctgacctg ccagggtgct tcgccatcct cggtctccaa acccatcctt 180
ctcgtccccg gaaccggcac cacaggtcca cagtcgttcg actcgaactg gatccccctc 240
tcaacgcagt tgggttacac accctgctgg atctcacccc cgccgttcat gctcaacgac 300
acccaggtca acacggagta catggtcaac gccatcaccg cgctctacgc tggttcgggc 360
aacaacaagc ttcccgtgct tacctggtcc cagggtggtc tggttgcaca gtggggtctg 420
accttcttcc ccagtatcag gtccaaggtc gatcgactta tggcctttgc gcccgactac 480
aagggcaccg tcctcgccgg ccctctcgat gcactcgcgg ttagtgcacc ctccgtatgg 540
cagcaaacca ccggttcggc actcaccacc gcactccgaa acgcaggtgg tctgacccag 600
atcgtgccca ccaccaacct ctactcggcg accgacgaga tcgttcagcc tcaggtgtcc 660
aactcgccac tcgactcatc ctacctcttc aacggaaaga acgtccaggc acaggccgtg 720
tgtgggccgc tgttcgtcat cgaccatgca ggctcgctca cctcgcagtt ctcctacgtc 780
gtcggtcgat ccgccctgcg ctccaccacg ggccaggctc gtagtgcaga ctatggcatt 840
acggactgca accctcttcc cgccaatgat ctgactcccg agcaaaaggt cgccgcggct 900
gcgctcctgg cgccggcagc tgcagccatc gtggcgggtc caaagcagaa ctgcgagccc 960
gacctcatgc cctacgcccg cccctttgca gtaggcaaaa ggacctgctc cggcatcgtc 1020
accccctga 1029