CN116536280A

CN116536280A - 2-酮戊二酸依赖性双加氧酶及其应用

Info

Publication number: CN116536280A
Application number: CN202310719497.1A
Authority: CN
Inventors: 王丽; 陈雪青; 侯壮伟; 孙文恺; 聂宝; 李�诚
Original assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Current assignee: Agricultural Genomics Institute at Shenzhen of CAAS
Priority date: 2023-02-13
Filing date: 2023-06-16
Publication date: 2023-08-04

Abstract

本发明涉及一种2‑酮戊二酸依赖性双加氧酶及其应用。本发明的多肽与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽具有至少60％，至少65％，至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列相似性。实验证明，本发明的多肽具有2‑酮戊二酸依赖性双加氧酶的功能，能够催化洋川芎内酯A生成丁苯酞。本发明对有效解决丁苯酞资源稀缺问题具有重要意义。

Description

2-酮戊二酸依赖性双加氧酶及其应用

技术领域

本发明涉及一种具有2-酮戊二酸依赖性双加氧酶功能的多肽、编码该多肽的多核苷酸、含有该多核苷酸的核酸构建体、重组载体和宿主细胞。本发明还涉及制备丁苯酞的方法。

背景技术

川芎(Ligusticum chuanxiong Hort.)是伞形科藁本属植物，根入药，在我国主要分布在四川。川芎在传统中药中用于月经不调，经闭痛经，症瘕腹痛，胸胁刺痛，跌扑肿痛，头痛，风湿痹痛等相关疾病的治疗。目前，已有近60种苯酞类化合物从川芎中被分离出来，其中主要包括藁本内酯、洋川芎内酯A、丁烯基苯酞和丁苯酞等化合物。它们具有舒张血管、抗氧化、抗血栓、抗菌消炎等多种药理作用。其中，丁苯酞在临床上主要被用来治疗慢性或急性的缺血性脑卒中。随着人们生活水平的提高，同时伴随着心脑血管疾病的发病率逐年增长，含有川芎的药品的临床需求量日益增大。

巨大的市场需求使得很多科学家投身到丁苯酞的合成研究中,大部分研究集中于丁苯酞的化学合成。然而，化学合成过程中会代入很多杂质且很难被去除，影响丁苯酞原料药的质量。由于苯酞类物质的良好应用前景，产业上迫切需要一种不依赖于天然提取途径的3-取代苯酞类化合物的合成方法。因此，去解析丁苯酞的合成路径，可突破化学合成中面临的产业瓶颈，有助于推进丁苯酞原料药的来源的多样性。

发明内容

本发明提供了具有2-酮戊二酸依赖性双加氧酶活性的多肽，也可以说是属于2-酮戊二酸依赖性双加氧酶家族的多肽。

本发明的多肽可以是氨基酸序列为SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽。

本发明的多肽还可以是氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10％或至少12％或至少14％或至少15％或至少16％或至少17％或至少18％或至少19％或至少20％或至少21％或至少22％或至少24％或至少26％或至少28％或至少29％或至少30％或至少31％或至少32％或至少34％或至少36％或至少38％或至少40％或至少42％或至少44％或至少46％或至少48％或至少50％或至少52％或至少54％或至少56％或至少58％或至少59％或至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上相似性的多肽，且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽还可以是氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10％或至少12％或至少14％或至少15％或至少16％或至少17％或至少18％或至少19％或至少20％或至少21％或至少22％或至少24％或至少26％或至少28％或至少29％或至少30％或至少31％或至少32％或至少34％或至少36％或至少38％或至少40％或至少42％或至少44％或至少46％或至少48％或至少50％或至少52％或至少54％或至少56％或至少58％或至少59％或至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上相似性的多肽，且该多肽来源于川芎(Ligusticum chuanxiong hort.)，且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽还可以是由如下多核苷酸编码得到的多肽：(a)SEQ ID NO:2或SEQID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸；(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ IDNO:20具有60％以上相似性的多核苷酸；(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ IDNO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸，该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽包括与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10％或至少12％或至少14％或至少15％或至少16％或至少17％或至少18％或至少19％或至少20％或至少21％或至少22％或至少24％或至少26％或至少28％或至少29％或至少30％或至少31％或至少32％或至少34％或至少36％或至少38％或至少40％或至少42％或至少44％或至少46％或至少48％或至少50％或至少52％或至少54％或至少56％或至少58％或至少59％或至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上相似性的多肽的任何等位变体。多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。其中，多肽的等位变体是由等位基因变体编码产生的。等位基因变体是指同一染色体基因座上两种或更多种基因中的任何一种。等位基因变体是由自然突变产生的，可在群体内导致多态性的产生。基因突变可以是沉默的(不改变其编码的多肽)或者是导致其编码的多肽的氨基酸序列的改变。

本发明的多肽还可是在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ IDNO:17或SEQ ID NO:19或SEQ ID NO:21的基础上进行一个位置或多个位置的氨基酸残基替换、插入和/或缺失后得到的多肽突变体，该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

其中，氨基酸取代、缺失和/或插入的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个。这种替换、插入和/或缺失可以是在非必需氨基酸位置上进行的。本领域技术人员可以利用现有技术来推断序列的必需氨基酸，例如动力学参数测定法、X射线晶体结构分析法、定点诱变法等。

本发明的多肽还可是在SEQ ID NO:1所示氨基酸序列的基础上，在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体：自其N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸(尤其是第180位、第102位、第76位)，该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽还可是在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ IDNO:19或SEQ ID NO:21所示氨基酸序列的基础上，在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体：与自SEQ ID NO:1的N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸(尤其是第180位、第102位、第76位)对应的位置；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽还可是在SEQ ID NO:1所示氨基酸序列的基础上，进行如下任意一种或任意几种的突变后得到的多肽突变体：W180A、Y102A、Y76F、G165A、Q66A(尤其是W180A、Y102A、Y76F)；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽还可是在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ IDNO:19或SEQ ID NO:21所示氨基酸序列的基础上，以SEQ ID NO:1为参照，在相对应的位置上进行相应的氨基酸种类突变后得到的多肽突变体；其中，SEQ ID NO:1中相应位置和相应氨基酸突变种类为如下的任一种或任几种：W180A、Y102A、Y76F、G165A、Q66A(尤其是W180A、Y102A、Y76F)；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多肽包括由如下多核苷酸编码得到的多肽：(a)SEQ ID NO:2或SEQ IDNO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸；(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有60％以上相似性的多核苷酸；(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸，该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员。严格条件指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃、于5X SSPE、0.3％SDS、200μg/mL剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。使用0.2X SSC、0.2％SDS，在70℃下洗涤三次，每次15分钟。互补序列可以是完全互补序列，也可以是不完全互补序列。

本发明的多肽包括SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽与另一种多肽形成的融合多肽或可切割的融合多肽。该另一种多肽在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽的N-末端或C-末端处融合。融合多肽可进一步包含两个多肽之间的切割位点，在融合蛋白分泌之时，该位点被切割，从而释放出这两种多肽。其中另一种多肽包括但不限于组氨酸等纯化标签、标记蛋白(如荧光蛋白，进一步如红色荧光蛋白、绿色荧光蛋白等)或信号肽等。

本发明的多肽还包括上面以所述多肽(SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽)的截短体，该截短体具有2-酮戊二酸依赖性双加氧酶活性或该截短体是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

编码上述任一所述多肽的多核苷酸也属于本发明的保护范围。多核苷酸可以是DNA、RNA或cDNA。

所述多核苷酸为如下(1)或(2)或(3)：

(1)包含SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ IDNO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20的多核苷酸；

(2)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上序列相似性的多核苷酸，且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

(3)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQID NO:18或SEQ ID NO:20所示多核苷酸或其互补体或其gDNA杂交的多核苷酸，且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

严格条件指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃、于5X SSPE、0.3％SDS、200μg/mL剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2％SDS，在70℃下洗涤三次，每次15分钟。

互补序列可以是完全互补序列，也可以是不完全互补序列。

分离或克隆多核苷酸的技术是本领域已知的，既可以从基因组DNA也可以从cDNA中进行分离。技术可以是聚合酶链式反应(PCR)、抗体文库筛选，还可以是其他核酸扩增程序，例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。该多核苷酸可以是多核苷酸的多肽编码区的等位基因或种类变体。

本发明的多核苷酸包括与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ IDNO:16或SEQ ID NO:18或SEQ ID NO:20的多核苷酸具有至少60％，至少65％，至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列相似性的多核苷酸的任何等位基因变体，且多核苷酸的任何等位变体编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。等位基因变体是指同一染色体基因座上两种或更多种基因中的任何一种。等位基因变体是由自然突变产生的，可在群体内导致多态性的产生。基因突变可以是沉默的(不改变其编码的多肽)或者是导致其编码的多肽的氨基酸序列的改变。

本发明的多核苷酸包括来源于药物植物川芎(Ligusticum chuanxiong Hort.)且与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ IDNO:20的多核苷酸具有至少60％，至少65％，至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列相似性，且编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；其中，2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本发明的多核苷酸包括在SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ IDNO:16或SEQ ID NO:18或SEQ ID NO:20的基础上对一个或多个位置的碱基进行突变和/或修饰后得到的多核苷酸。这种突变或修饰包括密码子优化、简并碱基设计、甲基化修饰等等。实现这种修饰或突变的途径是本领域公知的，包括但不限于：插入、缺失，易错PCR，不同序列的重新连接，序列的不同部分与其他来源的同源序列进行定向进化，化学试剂诱变。

本发明的多核苷酸还包括编码上述任一所述融合多肽或截短体的多核苷酸。

本发明还包括编码上述任一所述多肽的多核苷酸的重组载体、核酸构建体或重组宿主细胞。

本发明的重组载体包括重组表达载体或重组克隆载体，重组表达载体中涉及的载体可以是本领域公知的用于基因表达的载体，包括但不限于pEAQ-HT、pSuper-1300、pET-28a、pET30a、pET24b、pESC-Ura、pESC-Trp、pESC-Leu、pESC-His、pGEX2T、pTAex3、pYMB03，优选pSuper1300和pET24b。

其中表达指包括涉及多肽产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰、以及分泌。表达载体指直链或环状DNA分子，其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的调控序列。

本发明涉及的核酸构建体包含可操作地连接至一个或多个调控序列的本发明的多核苷酸，该一个或多个控制序列指导该编码序列在适合的宿主细胞中的表达。调控序列与多核苷酸可以是同源的也可以是异源的。

调控序列指对于表达编码多肽的多核苷酸来说必需的核酸序列。调控序列与编码多肽的多核苷酸可以是同源的(即二者来自相同的基因)，也可以是异源的(即二者来自不同的基因)。这种调控序列包括但不限于前导序列、启动子、信号肽序列、转录终止子、增强子等。最少，调控序列包括启动子、以及转录和翻译终止信号。控制序列可以通过接头与编码多肽的多核苷酸连接。

本发明还涉及重组宿主细胞，这些宿主细胞包含可操作地连接至一个或多个调控序列的本发明的多核苷酸，该一个或多个控制序列调控本发明的多肽的产生。将包含多核苷酸的构建体或载体引入到宿主细胞中，构建体或载体要么整合到宿主染色体上，要么不整合而自主复制。这些宿主细胞还包含由于复制期间出现突变而与亲本细胞不完全相同的任何亲本细胞后代。宿主细胞的选择将取决于编码该多肽的基因及其来源。

该宿主细胞可以是任何可以用于生产本发明多肽的微生物细胞。如原核细胞或真核细胞。原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。微生物细胞包括但不限于：链霉菌、假单孢菌、芽孢杆菌、酵母细胞、大肠杆菌。

将表达载体引入宿主细胞的方法是本领域已知的，包括但不限于电穿孔、聚乙二醇(PEG)转化、脂质转染、热休克、磷酸钙沉淀、病毒介导和显微注射。

本发明包括生产本发明多肽的方法，该方法包括如下步骤：在有利于多肽表达的条件下，使含有编码本发明多肽的多核苷酸的重组宿主细胞进行表达，得到本发明多肽。

本发明包括生产本发明多肽的方法，该方法包括在有利于产生本发明多肽的条件下培养本发明的重组宿主细胞，得到本发明多肽。本发明生产本发明多肽的方法还可包括回收该多肽的步骤。

可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞，该培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。如果多肽被分泌到该营养培养基中，那么可以直接从该培养基中回收该多肽。如果多肽不进行分泌，那么其可以从细胞裂解液中进行回收。

可以使用本领域公知的检测多肽的方法来检测多肽。这些检测方法包括但不限于：特异性抗体检测、酶活检测。

可以使用本领域已知的方法来回收多肽，包括但不限于：收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。

可以使用本领域已知的方法来纯化多肽，包括但不限于：色谱法(例如，离子交换、亲和、疏水、色谱聚焦和尺寸排阻)、电泳程序(例如，制备型等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE。

本发明还包括生产本发明多肽的方法，该方法包括在有益于产生该多肽的条件下培养转基因植物或植物细胞的步骤，其中该转基因植物或植物细胞包含编码本发明多肽的多核苷酸。该生产本发明多肽的方法还可包括回收该多肽的步骤。

本发明还包括包含编码本发明上述任一所述多肽的多核苷酸或核酸构建体的重组植物细胞或植物体。植物细胞可为植物体任何部位的细胞，如根、茎、叶、发根等。植物体可包括外植体，具体包括但不限于：插条、组织培养物、细胞悬浮液和愈伤组织。植物种类包括但不限于川芎或烟草。

本发明还包括具有2-酮戊二酸依赖性双加氧酶活性的多肽或一种属于2-酮戊二酸依赖性双加氧酶家族的多肽，即为上述任一所述的本发明多肽。

本发明提供了一种制备苯酞类化合物的方法，包括如下步骤：以式Ⅰ和/或式Ⅱ所示化合物为底物，使其与酶接触，得到式Ⅲ和/或式Ⅳ所示苯酞类化合物，其中酶是2-酮戊二酸依赖性双加氧酶家族中的酶或该酶具有2-酮戊二酸依赖性双加氧酶活性；

其中，式Ⅰ，式Ⅱ，式Ⅲ或式Ⅳ中R为不含任何取代基的碳原子数为1～10的直链烷烃，其中碳原子数为1-2，1-3，1-4，1-5，1-6，1-7，1-8，1-9，1-10，2-3，2-4，2-5，2-6，2-7，2-8，2-9，2-10，3-4，3-5，3-6，3-7，3-8，3-9，3-10，4-5，4-6，4-7，4-8，4-9，或4-10，或具体为1，2，3，4，5，6，7，8，9，10。

上述方法中，酶为本发明上述多肽中的任意一种或几种，或者为下述蛋白提取物。

本发明的制备方法中，底物可以是任何能被本发明多肽催化成苯酞类化合物的底物，包括但不限于式Ⅱ所示洋川芎内酯A或式Ⅰ所示藁本内酯。

本发明的制备方法中，产物是苯酞类化合物，进一步为3-取代苯酞类化合物，包括但不限于式Ⅳ所示丁苯酞、式Ⅲ所示丁烯基苯酞。

当以洋川芎内酯A为底物时，可以生成丁苯酞。当以藁本内酯为底物时，可以生成丁烯基苯酞。

本发明还涉及一种蛋白提取物，是川芎(Ligusticum chuanxiong Hort.)根的总蛋白提取物，该提取物具有2-酮戊二酸依赖性双加氧酶活性。关于从植物中提取蛋白的方法是本领域公知的。作为本发明的一个较佳实施例，用提取缓冲液进行蛋白提取，所用的提取缓冲液包括终浓度为20mM Tris-HCl，pH7.5，10mM DTT(二硫苏糖醇，Dithiothreitol)，15％Glycerol(甘油)，1％PVPP(交联聚乙烯吡咯烷酮)，1X Complete Mini ProteaseInhibitor(不含EDTA的complete^TMMini蛋白酶抑制剂混合物)。

本发明的蛋白提取物中含有上述任一所述的本发明的具有2-酮戊二酸依赖性双加氧酶活性的多肽或该提取物中含有2-酮戊二酸依赖性双加氧酶家族的成员的多肽。如氨基酸序列包含SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽。

本文中的2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性，还可是本文中发现的将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。

本文中该酶还可称为：铁(Ⅱ)/2-酮戊二酸依赖性双加氧酶OGD[e(II)/2-oxoglutarate-dependent dioxygenase(OGD)]、丁苯酞合成酶、洋川芎内酯A氧化酶。

本文中洋川芎内酯A：CAS No.62006-39-7。化学全称为(3S)-3-丁基-4,5-二氢-1(3H)-异苯并呋喃酮。英文名称为Senkyunolide A。

本文中藁本内酯：CAS NO.4431-01-0。化学全称为3-丁烯基-4,5-二氢-1(3H)-异苯并呋喃酮。英文名称Ligustilide。

本文中丁苯酞：CAS NO.6066-49-5。化学全称为3-丁基-1(3H)-异苯并呋喃酮。英文名称为3-Butylphthalide。

本文中丁烯基苯酞：CAS NO.551-08-6。化学全称为3-亚丁基-1(3H)-异苯并呋喃酮。英文名3-Butylidenephthalide。

本文中3-取代苯酞类化合物：3-Substituted phthalides，其中包括丁苯酞和丁烯基苯酞等。

本文中序列相似性：两个氨基酸序列之间的关联度或者两个核苷酸序列之间的关联度用参数“序列相似性”来描述。

本文中3-取代苯酞类化合物(如丁苯酞或丁烯基苯酞)包括任何类型的光学异构体，包括但不限于左旋类型。

实验证明，本发明的多肽具有2-酮戊二酸依赖性双加氧酶的功能，能够催化洋川芎内酯A和藁本内酯生成丁苯酞和丁烯基苯酞。本发明对有效解决丁苯酞资源稀缺问题具有重要意义。

附图说明

图1川芎不同组织中丁苯酞的含量。

图2川芎根粗蛋白体外催化洋川芎内酯A生成丁苯酞和丁烯基苯酞(a,丁苯酞；b，丁烯基苯酞；c,洋川芎内酯A；d,藁本内酯)。

图3重组质粒Lc2OGD1/2的PCR鉴定结果。

图4GC-MS检测Lc2OGD1/2酶促产物的总离子色谱图(TIC)。A、丁苯酞；B、丁烯基苯酞。

图5Lc2OGD1/2主要酶促产物的质谱图。A、丁苯酞离子碎片；B、丁烯基苯酞离子碎片。

图6大肠杆菌表达的蛋白体催化洋川芎内酯A生成丁苯酞。

图7烟草中表达突变体后突变体催化洋川芎内酯A生成丁苯酞。

图8GC-MS检测Lc2OGD3/4/5/6催化洋川芎内酯A生成丁苯酞。

图9GC-MS检测Lc2OGD3/4/5/6催化藁本内酯丁烯基苯酞。

具体实施方式

以下结合实施例，进一步阐述本发明。这些实施例仅用于解释本发明而不用于限制本发明的范围。实施例中记载的技术术语，若无特殊说明，均为本领域的常规理解。此外，任何与所记载内容相似或相同的方法及材料都可用于本发明中。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。以下实施例中所使用的实验方法如何特殊说明，均采用常规方法。所用的材料、试剂和耗材等，如无特殊说明，均可从商业途径获得。

川芎(Ligusticum chuanxiong Hort.)植株为商品川芎，由四川省彭州市军乐镇农户购买，公众可自行采集或从中药材天地网上获得。

OMEGA Plant RNA Kit(Omega)，Plus All-in-one 1st StrandcDNA Synthesis SuperMix(gDNA Purge)(Novoprotein)，KOD One TM PCR Master Mix-Blue-(Toyobo)，Gel&PCR Clean Up Kit(Omega)，HiPure PCR Pure Micro Kit(Magen)，HiPure Plasmid Micro Kit C(Magen)，BamHⅠ(NEB)，EocRⅠ(NEB)，XbaⅠ(NEB)，KpnⅠ(NEB)，Fast DNA Assembly Mix(Cistrome)，2×T5 Super PCR Mix(Colony)(北京擎科)，StarMarker D2000(Genstar)，DH5α(康体生命)，GV3101(维地生物)，引物合成(北京六合华大基因科技有限公司)，基因测序(北京六合华大基因科技有限公司)。

GC-MS检测条件：GC-MS仪器为安捷伦7890B/7000C(美国Waldbronn安捷伦科技)，质谱检测器参数：70eV，氦气流速1.2mL·min^-1，色谱柱安捷伦HP-5MS(5％苯基甲基氧化硅，30m×250μm内径，0.25μm膜厚度)；升温程序为50℃开始，以4℃/min升至130℃，再以2℃/min升至230℃，保留10min，再以2℃/min升至250℃，保留5min；氦气流量1.0mL/min，进样口250℃；进样方式，脉冲不分流，进样量，1μL。质朴条件：标准EI源(轰击能量为70eV)，离子源温度230℃，接口温度280℃，扫描质荷比(m/z)为40-350，并以丁苯酞标准品或丁烯基苯酞标准品作为对照组，对产物进行定性定量分析。

实施例1、丁苯酞检测体系的构建

用机溶剂(如甲醇、乙酸乙酯或甲基叔丁基醚(MTBE))对川芎的根、茎和叶进去萃取，过0.22μm滤膜，采用高效液相色谱和质谱联用测定丁苯酞的含量。结果如图1所示，证明川芎根中的丁苯酞的含量高于川芎茎和叶，与传统用药部位一致。

实施例2、川芎根部总蛋白的提取与活性实验

取生长旺盛的川芎根，洗净后，液氮冷冻研磨，加入提取缓冲液(终浓度为20mMTris-HCl，pH7.5，10mM DTT，15％Glycerol，1％PVPP，1X Complete Mini ProteaseInhibitor)冰上孵育，每隔15min轻轻上下振荡几次，1小时后，4℃，13000rpm离心20min，收集上清。上清液分别用40％-80％硫酸铵沉淀，4℃过夜后，13000rpm离心20min，收集上清。过脱盐柱，用Pirece 660nm protein assay试剂进行蛋白浓度测定。

脱盐后的蛋白根据蛋白浓度，取蛋白总量为10μg，蛋白液为20μL，实验组加入100μM的洋川芎内酯A和/或藁本内酯，对照组为不加任何物质的原始粗蛋白，其他均相同，置于冰上孵育1小时，每15分钟，缓慢摇几次，1小时后，加入等体积的乙酸乙酯终止反应，13000rpm离心10min，0.22μM滤膜过滤后，通过GC-MS检测。

检测结果如图2所示，结果表明川芎根中存在酶，能够催化洋川芎内酯A和藁本内酯，生成丁苯酞和丁烯基苯酞。

实施例3、川芎中Lc2OGD1、Lc2OGD2的克隆和序列分析

1)Lc2OGD基因的筛选和序列分析

根据已测序的川芎基因组和转录组数据，通过注释、差异表达基因分析，在川芎的根转录组数据库中，找到4条具有完整开放阅读框的氧化酶基因，分别命名为Lc2OGD1、Lc2OGD2、Lc2OGD3和Lc2OGD4(Ligusticum chuanxiong Fe(II)/2-oxoglutarate-dependent dioxygenase)。通过序列比对分析，发现：Lc2OGD1、Lc2OGD2的氨基酸序列分别与胡萝卜中prolyl 4-hydroxylase 6和DNA oxidative demethylase最近似。Lc2OGD1、Lc2OGD2读码框氨基酸序列和核苷酸序列分别为SEQ ID No.1、SEQ ID No.2和SEQ IDNo.3、SEQ ID No.4所示。

2)川芎根的cDNA的合成

取适量川芎根(-80℃冰箱保存)，液氮磨碎。采用法Trizon法提取川芎总RNA，提取后用DNase I及RNA纯化试剂盒，对所提取的总RNA进行精制，去除RNA中的基因组污染。

根据Novoprotein的第一链cDNA合成试剂盒Plus All-in-one 1stStrand cDNA Synthesis SuperMix(gDNA Purge)说明书进行操作，反转录体系如下：

(1)去基因组DNA反应：

42℃孵育5min，反应结束后冰上放置。

(2)逆转录反应：

50℃孵育30min，75℃孵育5min，终止反应。

cDNA样品于-20℃保存。

3)Lc2OGD的克隆

以Lc2OGD基因的核苷酸序列为依据，设计Lc2OGD基因的合成引物，引物包含XbaⅠ和KpnⅠ酶切位点序列。以川芎根的cDNA为模板，采用PCR的方法扩增Lc2OGD基因，与经XbaⅠ和KpnⅠ双酶切的线性pSuper1300载体重组，采用Fast DNA Assembly Mix试剂盒的方法获得重组质粒，并转入大肠杆菌DH5α后，提取质粒测序(北京六合华大基因科技有限公司)，阳性重组质粒命名为pSuper1300-Lc2OGD。

其中Lc2OGD的扩增引物序列如下：

Lc2OGD1-Forward：

CTCGATACACCAAATCGACTCTAGAATGGCGACCAAGGCCAA(SEQ ID No.5下划线为载体序列)

Lc2OGD1-Reverse：

CCCTTGCTCACCATGGTACCCTACGCGGAGCAAGCATTACA(SEQ ID No.6下划线为载体序列)

Lc2OGD2-Forward：

CTCGATACACCAAATCGACTCTAGAATGGAGCAATTTGTGAGCAG(SEQ ID No.7下划线为载体序列)

Lc2OGD2-Reverse：

CCCTTGCTCACCATGGTACCTTACGACAGATAGTAGAACAA(SEQ ID No.8下划线为载体序列)

4)胶回收

胶回收步骤：

取PCR产物与DNA loading buffer混合，在1％琼脂糖凝胶上以140V电压电泳15分钟；

用刀片切割含有DNA片段的凝胶，尽可能靠近DNA片段切割，将切下的胶放入已经称重的1.5mL离心管中并称重，记下回收胶的重量；

加入等量的(V：m＝1:1)Binging buffer，在50℃的水浴锅中孵育10min，期间颠倒混匀2-3次，促进胶融化，保证胶，全部溶解，在上柱前将凝胶混合物快速涡旋混匀一次；

转移最多750μL胶混合液到回收纯化柱中，13000rpm离心1min，弃透过液，然后将回收柱放回相同的收集管；

加入700μL Wash Buffer到纯化柱中，13000rpm离心1min，弃透过液，然后将纯化柱放回收集管中；

在13000rpm 1min，离心空的纯化柱，彻底去除残留的Wash Buffer；

将纯化柱移至1.5mL微量离心管，加入30-50μL ddH₂O(65℃预热)于纯化柱，静置2min，13000rpm离心1min；

丢掉纯化柱，将纯化后的DNA储存在-80℃的冰箱中。

实施案例4、Lc2OGD1和Lc2OGD2的烟草异源表达

将实例3中的重组载体导入农杆菌GV3101中，使用该重组的农杆菌GV3101侵染本氏烟草叶片。用转入pSuper1300载体的农杆菌作为对照菌株，同时侵染本氏烟草叶片。本氏烟草培养培养于25℃，16h光照条件下，直到长至6片真叶时用于农杆菌的侵染。将含有重组质粒的农杆菌于28℃下培养OD₆₀₀＝1.0，用注射缓冲液重悬清洗一次菌体，然后于注射缓冲液中脱毒2h，室温，避光。注射缓冲液配方(即如下农杆菌重悬液)。然后，用1mL的无菌注射器于烟草的背面注射到烟草叶片内，避光过夜，培养于25℃，16h光照条件下，3天后，注射100μM的底物洋川芎内酯A或藁本内酯。注射底物1天后，收集烟草，储存于-80℃中备用。

农杆菌重悬液

实施例5Lc2OGD1和Lc2OGD2催化产物的提取与鉴定

烟草通过冷冻干燥后，用研钵磨成粉，每100mg烟草用2mL乙酸乙酯提取，提取物超声处理30min，12000rpm下4℃离心10min，收集上清，真空浓缩至0.5mL，用0.45μm尼龙过滤器将上清过滤至棕色样品瓶中，待进样。采用GC-MS对转基因烟草的丁苯酞含量和丁烯基苯酞含量进行检测。

重组质粒Lc2OGD1/2的PCR鉴定结果如图3，催化结果如图4和图5所示。图4和5中的结果表明，Lc2OGD1和Lc2OGD能够催化洋川芎内酯A和生成丁苯酞和丁烯基苯酞。

实施例6大肠杆菌中表达的Lc2OGD1和Lc2OGD2的催化活性检测

将实施案例3中的重组质粒构建到pMal载体上，将该载体转入到Rosetta(DE3)中，验证转入后，挑选单克隆，37℃过夜培养。第二天从过夜培养的菌中，吸取少量，37℃，200rpm继续扩大培养，直至菌的OD₆₀₀值达到0.6左右，加入0.5M的IPTG处理1小时后，加入20μL的洋川芎内酯A，16℃，180rpm共培养12小时后。加入等体积的乙酸乙酯，超声萃取30min，取有机相，真空浓缩干燥，加入200μL的乙酸乙酯复溶，通过GC-MS进行检测丁苯酞的含量。结果表明，Lc2OGD1和Lc2OGD2能够催化洋川芎内酯A生成丁苯酞(图6)。

实施例7突变体重组表达载体的构建

对Lc2OGD1进行序列分析、分子对接和突变，发现与Lc2OGD1催化效率相关的5个活性位点，分别是66，76，102，165和180位的氨基酸残基，将这5个氨基酸位点进行不同形式突变(表1)，得到5个Lc2OGD1蛋白突变体(表2)。

将双链分子1插入至表达载体pSuper1300上，得到重组表达载体pSuper1300-W180A(测序验证正确)。双链DNA分子1是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比，双链DNA分子1的差别仅在于：将序列自5’端第538位t突变为g，第539位g突变为c。与Lc2OGD1蛋白SEQ ID No.1相比，DNA分子1编码蛋白的差别仅在于，将序列所示的第180位W突变为A。

将双链分子2插入至表达载体pSuper1300上，得到重组表达载体pSuper1300-Y102A(测序验证正确)。双链DNA分子2是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比，双链DNA分子2的差别仅在于：将序列自5’端第304位t突变为g，第305位a突变为c。与Lc2OGD1蛋白SEQ ID No.1相比，DNA分子2编码蛋白的差别仅在于，将序列所示的第102位Y突变为A。

将双链分子3插入至表达载体pSuper1300上，得到重组表达载体pSuper1300-Y76F(测序验证正确)。双链DNA分子3是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQ IDNo.2相比，双链DNA分子3的差别仅在于：将序列自5’端第227位a突变为t。与Lc2OGD1蛋白SEQ ID No.1相比，DNA分子3编码蛋白的差别仅在于，将序列所示的第76位Y突变为F。

将双链分子4插入至表达载体pSuper1300上，得到重组表达载体pSuper1300-G165A(测序验证正确)。双链DNA分子4是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比，双链DNA分子4的差别仅在于：将序列自5’端第494位g突变为c。与Lc2OGD1蛋白SEQ ID No.1相比，DNA分子4编码蛋白的差别仅在于，将序列所示的第165位G突变为A。

将双链分子5插入至表达载体pSuper1300上，得到重组表达载体pSuper1300-Q66A(测序验证正确)。双链DNA分子5是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQ IDNo.2相比，双链DNA分子5的差别仅在于：将序列自5’端第196位c突变为g，第197位a突变为c。与Lc2OGD1蛋白SEQ ID No.1相比，DNA分子5编码蛋白的差别仅在于，将序列所示的第66位Q突变为A。

表1氨基酸位点及其突变形式

表2突变体信息

突变体名称	氨基酸突变形式	核苷酸突变形式
			LcOGD1w180A	W180A	t538g,g539c
LcOGD1Y102A	Y102A	t304g,a305c
			LcOGD1Y76F	Y76F	a227t
LcOGD1G165A	G165A	g494c
			LcOGD1Q66A	Q66A	c196g,a197c

用于制备突变体的相关引物如下：

Q66A-F:SEQ ID NO:22；Q66A-R:SEQ ID NO:23；

Y76F-F:SEQ ID NO:24；Y76F-R:SEQ ID NO:25；

Y102A-F:SEQ ID NO:26；Y102A-R:SEQ ID NO:27；

G165A-F:SEQ ID NO:28；G165A-R:SEQ ID NO:29；

W180A-F:SEQ ID NO:30；W180A-R:SEQ ID NO:31。

实施案例8、突变体的烟草异源表达

将实例7中的重组载体导入农杆菌GV3101中，使用该重组的农杆菌GV3101侵染本氏烟草叶片。用转入pSuper1300载体的农杆菌作为对照菌株，同时侵染本氏烟草叶片。本氏烟草培养培养于25℃，16h光照条件下，直到长至6片真叶时用于农杆菌的侵染。将含有重组质粒的农杆菌于28℃下培养OD₆₀₀＝1.0，用注射缓冲液重悬清洗一次菌体，然后于注射缓冲液中脱毒2h，室温，避光。注射缓冲液配方(农杆菌重悬液)。然后，用1mL的无菌注射器于烟草的背面注射到烟草叶片内，避光过夜，培养于25℃，16h光照条件下，3天后，注射100μM的底物洋川芎内酯A。注射底物洋川芎内酯A，1天后，收集烟草，储存于-80℃中备用。

农杆菌重悬液

实施例9突变体催化产物的提取与鉴定

烟草通过冷冻干燥后，用研钵磨成粉，每100mg烟草用2mL乙酸乙酯提取，提取物超声处理30min，12000rpm下4℃离心10min，收集上清，真空浓缩至0.5mL，用0.45μm尼龙过滤器将上清过滤至棕色样品瓶中，待进样。采用GC-MS对转基因烟草的丁苯酞含量进行检测。

结果如图7，显示W180A,Y102A和Y76F可以增强Lc2OGD1的催化效率，G165A和Q66A不能增强Lc2OGD1的催化效率。

实施例10、川芎中Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6的克隆和序列分析

1)基因的筛选和序列分析

根据已测序的川芎基因组和转录组数据，通过注释、差异表达基因分析，在川芎的根转录组数据库中，找到4条具有完整开放阅读框的氧化酶基因，分别命名为Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6(Ligusticumchuanxiong Fe(II)/2-oxoglutarate-dependentdioxygenase)。它们的核苷酸序列依次为SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20；它们的氨基酸序列依次为SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:9、SEQ IDNO:21。

Claims

1.一种多肽，为如下任一所述多肽：

(1)氨基酸序列包含SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽；

(2)氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQID NO:19或SEQ ID NO:21具有至少10％或至少12％或至少14％或至少15％或至少16％或至少17％或至少18％或至少19％或至少20％或至少21％或至少22％或至少24％或至少26％或至少28％或至少29％或至少30％或至少31％或至少32％或至少34％或至少36％或至少38％或至少40％或至少42％或至少44％或至少46％或至少48％或至少50％或至少52％或至少54％或至少56％或至少58％或至少59％或至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上相似性的多肽，且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；

(3)氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQID NO:19或SEQ ID NO:21具有至少10％或至少12％或至少14％或至少15％或至少16％或至少17％或至少18％或至少19％或至少20％或至少21％或至少22％或至少24％或至少26％或至少28％或至少29％或至少30％或至少31％或至少32％或至少34％或至少36％或至少38％或至少40％或至少42％或至少44％或至少46％或至少48％或至少50％或至少52％或至少54％或至少56％或至少58％或至少59％或至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上相似性的多肽，且该多肽来源于川芎(Ligusticum chuanxiong hort.)，且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；

(4)由如下多核苷酸编码得到的多肽：(a)SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸；(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ IDNO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有60％以上相似性的多核苷酸；(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ IDNO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸，该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员；

(5)在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的基础上进行一个位置或多个位置的氨基酸残基替换、插入和/或缺失后得到的多肽突变体，该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；

(6)在SEQ ID NO:1所示氨基酸序列的基础上，在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体：自其N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸，该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；

(7)在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示氨基酸序列的基础上，在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体：与自SEQ ID NO:1的N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸对应的位置；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；

(8)在SEQ ID NO:1所示氨基酸序列的基础上，进行如下任意一种或任意几种的突变后得到的多肽突变体：W180A、Y102A、Y76F、G165A、Q66A；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；

(9)在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示氨基酸序列的基础上，以SEQ ID NO:1为参照，在相对应的位置上进行任一种或任几种相应的氨基酸种类突变后得到的多肽突变体；其中，SEQ ID NO:1中相应位置和相应氨基酸突变种类为如下的任一种或任几种：W180A、Y102A、Y76F、G165A、Q66A；该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员；

(10)在(1)或(2)或(3)或(4)或(5)或(6)或(7)或(8)或(9)所示多肽的N-末端或C-末端处融合另一多肽后形成的融合多肽。

2.编码权利要求1所述多肽的多核苷酸。

3.根据权利要求2所述的多核苷酸，其特征在于：所述多核苷酸为如下(1)或(2)或(3)：

(1)包含SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQID NO:20的多核苷酸；

(2)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ IDNO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有至少60％或至少65％或至少70％或至少75％或至少80％或至少81％或至少82％或少83％或至少84％或至少85％或至少86％或至少87％或至少88％或至少89％或至少90％或至少91％或至少92％或至少93％或至少94％或至少95％或至少96％或至少97％或至少98％或至少99％以上序列相似性的多核苷酸，且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或是2-酮戊二酸依赖性双加氧酶家族的成员；

(3)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补体或其gDNA杂交的多核苷酸，且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或是2-酮戊二酸依赖性双加氧酶家族的成员。

4.含有权利要求2或3所述多核苷酸的重组载体、核酸构建体或重组宿主细胞。

5.一种蛋白提取物，是川芎(Ligusticum chuanxiong Hort.)根的总蛋白提取物，该提取物具有2-酮戊二酸依赖性双加氧酶活性或该提取物中含有2-酮戊二酸依赖性双加氧酶家族的成员酶。

6.一种制备苯酞类化合物的方法，包括如下步骤：以式Ⅰ和/或式Ⅱ所示化合物为底物，使其与酶接触，得到式Ⅲ和/或式Ⅳ所示苯酞类化合物，其中酶是2-酮戊二酸依赖性双加氧酶家族中的酶或该酶具有2-酮戊二酸依赖性双加氧酶活性；

7.根据权利要求6所述的方法，其特征在于：所述酶为权利要求1中所述多肽的任意一种或几种，或者为权利要求5所述蛋白提取物。

8.根据权利要求6或7所述的方法，其特征在于：所述式Ⅱ所示化合物为洋川芎内酯A，所述式Ⅰ所示化合物为藁本内酯。

9.根据权利要求6-8任意所述的方法，其特征在于：所述式Ⅳ所示化合物为丁苯酞，所述式Ⅲ所示化合物为丁烯基苯酞。

10.制备权利要求1所述多肽的方法，包括如下步骤：在有利于多肽表达的条件下，使含有权利要求2所述多核苷酸的重组宿主细胞进行表达，得到权利要求1所述多肽。