CN116867894A

CN116867894A - 由异丁香酚生物合成香草醛

Info

Publication number: CN116867894A
Application number: CN202180087914.4A
Authority: CN
Inventors: R·周; J·马; O·于
Original assignee: BASF SE
Current assignee: BASF SE
Priority date: 2020-12-18
Filing date: 2021-12-17
Publication date: 2023-10-10
Also published as: US20240052380A1; EP4263846A1; WO2022133274A1

Abstract

本公开总体上涉及使用异丁香酚作为底物通过生物转化产生天然香草醛。更具体地，本发明的方法利用真菌性异丁香酚单加氧酶催化异丁香酚生物转化为香草醛，这可以在细胞系统(例如，细菌或酵母)中或在不使用细胞系统的酶促反应混合物中进行。

Description

由异丁香酚生物合成香草醛

相关申请的交叉引用

本申请要求于2020年12月18日提交的美国临时专利申请第63/127,503号的权益，所述美国临时专利申请通过引用整体并入本文。

序列表

本申请包含已经以ASCII格式以电子方式提交并且以全文引用的方式特此并入的序列表。创建于2021年12月17日的所述ASCII副本命名为074008_2040_00_WO_000326_SL.txt并且大小为19,847字节。

技术领域

本公开总体上涉及使用异丁香酚作为底物通过生物转化产生天然香草醛。

背景技术

香草香精是全世界最频繁使用的香精之一。其被用于多种食物的调味剂，如冰淇淋、乳制品、甜点、糖果、烘焙产品和烈酒。其还用于香水、药物和个人卫生用品。

传统上已经从香草兰的发酵豆荚中获得天然香草香精。其主要是在豆类收获后数周的干燥和发酵过程期间通过豆类中存在的香草醛葡糖苷的水解而形成。香草香精的主要芳香物质是香草醛(4-羟基3-甲氧基苯甲醛)。

香草醛是最常见的香精化学品之一，并且广泛用于食物和饮料、香水、制药和医疗行业。每年消耗约12,000吨香草醛，其中仅20-50吨是从香草豆中提取的，其余主要是从如愈创木酚和木质素等石油化学产品中合成产生的。近年来，对天然香精的需求不断增加，导致香精行业通过生物转化生产香草醛，因为当从如活细胞或其酶等生物来源生产时，这种生物转化的产品被各监管和立法机构(例如，欧洲共同体立法(European CommunityLegislation))视为天然的，并且可以作为“天然产品”销售。

天然异丁香酚可以从精油中提取，并且用于通过酶促转化或微生物生物转化产生香草醛是经济的。已经广泛报道了在许多微生物，包含黑曲霉(Aspergillus niger)、枯草芽孢杆菌(Bacillus subtilis)和恶臭假单胞菌(Pseudomonas putida)中通过异丁香酚的转化产生香草醛。然而，所报道的通过这些微生物产生的滴度非常低(低于2g/L)，极大地限制了这种方法在工业中的实际应用。此外，所报道的生物转化过程复杂，进一步增加了香草醛的生产成本。

因此，本领域需要具有更高滴度和转化率的用于产生香草醛的更具成本效益的方法。

发明内容

本发明人通过鉴定真菌性异丁香酚单加氧酶解决了上述问题，所述真菌性异丁香酚单加氧酶与先前报道的用于产生香草醛的异丁香酚单加氧酶具有非常低的序列同一性。从玉米黑粉菌(Ustilago maydis)中鉴定出的真菌性异丁香酚单加氧酶(UmIEM)在将异丁香酚转化为香草醛方面表现出令人惊讶的高活性。构建了携带所述UmIEM基因的表达质粒，并开发了工程化宿主菌株并用于以高滴度和高转化率从异丁香酚中产生香草醛。由所述UmIEM基因表达的重组蛋白也可以分离和纯化，并且用于在体外将异丁香酚转化为香草醛。

因此，一方面，本公开涉及产生香草醛的生物转化方法。所述方法可以包括在混合物中表达UmIEM基因，将异丁香酚添加到混合物中，以及将异丁香酚转化为香草醛。在一些实施例中，所表达的UmIEM基因可以具有与SEQ ID NO:2具有至少60％同一性、与SEQ IDNO:2具有至少65％同一性、与SEQ ID NO:2具有至少70％同一性、与SEQ ID NO:2具有至少75％同一性、与SEQ ID NO:2具有至少80％同一性、与SEQ ID NO:2具有至少85％同一性、与SEQ ID NO:2具有至少90％同一性、与SEQ ID NO:2具有至少95％同一性或与SEQ ID NO:2具有至少99％同一性的氨基酸序列。在一些实施例中，所表达的UmIEM基因可以具有与SEQID NO:2相同的氨基酸序列。

在各个实施例中，所述生物转化方法可以包含通过体外翻译表达UmIEM基因。在替代性实施例中，所述生物转化方法可以包含在细胞系统中表达UmIEM基因。在某些实施例中，所述生物转化方法可以包含在细菌或酵母细胞中表达UmIEM基因。所述生物转化方法可以包含对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。在一些实施例中，可以将经纯化的重组蛋白作为生物催化剂添加到含有异丁香酚的反应混合物中。在一些实施例中，异丁香酚可以直接进料到其中表达UmIEM基因的混合物中。

本文所描述的生物转化方法可以包含从混合物中回收香草醛。可以根据本领域已知的任何常规分离或纯化方法进行香草醛的回收。在回收香草醛之前，所述方法还可以包含从混合物中去除生物质(酶、细胞材料等)。

一方面，本公开涉及使用分离的重组宿主细胞产生香草醛的方法，其中已经用核酸构建体转化了分离的重组宿主细胞，所述核酸构建体包含能够编码异丁香酚单加氧酶的多核苷酸序列。例如，异丁香酚单加氧酶可以具有与SEQ ID NO:2具有至少60％同一性、与SEQ ID NO:2具有至少65％同一性、与SEQ ID NO:2具有至少70％同一性、与SEQ ID NO:2具有至少75％同一性、与SEQ ID NO:2具有至少80％同一性、与SEQ ID NO:2具有至少85％同一性、与SEQ ID NO:2具有至少90％同一性、与SEQ ID NO:2具有至少95％同一性或与SEQID NO:2具有至少99％同一性的氨基酸序列。在一些实施例中，异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中，所述方法可以包含：(i)在培养基中培养分离的重组宿主细胞；(ii)向所述培养基中添加异丁香酚以开始将异丁香酚生物转化为香草醛；以及(iii)从所述培养基中提取香草醛。在其它实施例中，所述方法可以包含：(i)在培养基中培养分离的重组宿主细胞，以允许异丁香酚单加氧酶的表达；(ii)分离所述异丁香酚单加氧酶；(iii)将分离的异丁香酚单加氧酶添加到包含异丁香酚的反应混合物中；以及(iv)从反应培养基中提取香草醛。

一方面，本公开涉及使用核酸构建体转化的分离的重组宿主细胞，所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列，其中所述异丁香酚单加氧酶具有与SEQ IDNO:2具有至少60％同一性、与SEQ ID NO:2具有至少65％同一性、与SEQ ID NO:2具有至少70％同一性、与SEQ ID NO:2具有至少75％同一性、与SEQ ID NO:2具有至少80％同一性、与SEQ ID NO:2具有至少85％同一性、与SEQ ID NO:2具有至少90％同一性、与SEQ ID NO:2具有至少95％同一性或与SEQ ID NO:2具有至少99％同一性的氨基酸序列。在一些实施例中，异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中，核酸构建体可以含有多核苷酸序列，所述多核苷酸序列包含与SEQ ID NO:1的核酸序列至少70％相同、与SEQ ID NO:1的核酸序列至少75％相同、与SEQ ID NO:1的核酸序列至少80％相同、与SEQ ID NO:1的核酸序列至少85％相同、与SEQ ID NO:1的核酸序列至少90％相同或与SEQID NO:1的核酸序列至少95％相同的序列。在一些实施例中，核酸构建体可以含有与SEQ IDNO:1相同的多核苷酸序列。在一些实施例中，分离的重组宿主细胞可以包含含有SEQ IDNO:4的分离的核酸序列的载体。在各个实施例中，宿主细胞可以选自由以下组成的组：细菌、酵母、不是黑粉菌属(Ustilago)的真菌、藻青菌、藻类和植物细胞。例如，宿主细胞可以选自由以下组成的微生物组：埃希氏菌属(Escherichia)；沙门氏菌属(Salmonella)；芽孢杆菌属(Bacillus)；不动杆菌属(Acinetobacter)；链霉菌属(Streptomyces)；棒状杆菌属(Corynebacterium)；甲基弯曲菌属(Methylosinus)；甲基单胞菌属(Methylomonas)；红球菌属(Rhodococcus)；假单胞菌属(Pseudomonas)；红杆菌属(Rhodobacter)；集胞藻属(Synechocystis)；酵母菌属(Saccharomyces)；接合酵母菌属(Zygosaccharomyces)；克鲁维酵母菌属(Kluyveromyces)；假丝酵母菌属(Candida)；汉逊氏酵母菌属(Hansenula)；德巴利氏酵母菌属(Debaryomyces)；毛霉菌属(Mucor)；毕赤酵母菌属(Pichia)；球拟酵母菌属(Torulopsis)；曲霉菌属(Aspergillus)；节丛孢属(Arthrobotlys)；短杆菌属(Brevibacteria)；微杆菌属(Microbacterium)；节杆菌属(Arthrobacter)；柠檬酸杆菌属(Citrobacter)；克雷伯菌属(Klebsiella)；泛菌属(Pantoea)；以及梭菌属(Clostridium)。

可以收集使用本文所描述的方法和/或分离的重组宿主细胞产生的香草醛并将其掺入到可消费产品中。例如，香草醛可以与可消费产品混合。在一些实施例中，香草醛可以以足以在可消费产品中赋予、改变、促进或增强期望的味道、风味或感觉或隐藏、改变或最小化不期望的味道、风味或感觉的量掺入到可消费产品中。可消费产品例如可以选自由以下组成的组：食物、食物成分、食物添加剂、饮料、药物和烟草。在一些实施例中，香草醛可以以足以在可消费产品中赋予、改变、促进或增强期望的香味或气味或隐藏、改变或最小化不期望的香味或气味的量掺入到可消费产品中。可消费产品例如可以选自由以下组成的组：芳香剂、化妆品、浴室用品、家庭和身体护理、洗涤剂、驱虫剂、化肥、空气清新剂和肥皂。

第一实施例是用于产生香草醛的生物转化方法，所述方法包括：在混合物中表达UmIEM基因，其中所述UmIEM基因的所表达的蛋白具有与所述混合物中的SEQ ID NO:2具有至少70％同一性的氨基酸序列；将异丁香酚进料到所述混合物中；以及将异丁香酚转化为香草醛。

第二实施例是根据第一实施例所述的方法，其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少80％同一性的氨基酸序列。

第三实施例是根据第一实施例所述的方法，其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少90％同一性的氨基酸序列。

第四实施例是根据第一实施例所述的方法，其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少95％同一性的氨基酸序列。

第五实施例是根据第一至第四实施例所述的方法，其中表达所述UmIEM基因的步骤选自由以下组成的组：通过体外翻译表达所述基因；在细胞系统中表达所述基因；以及在细菌或酵母细胞中表达所述基因。

第六实施例是根据第五实施例所述的方法，其进一步包括对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。

第七实施例是根据第一至第六实施例所述的方法，其进一步包括收集所述香草醛。

第八实施例是根据第七实施例所述的方法，其中从异丁香酚到香草醛的转化率高于80％。

第九实施例是根据第七实施例所述的方法，其中从异丁香酚到香草醛的转化率高于85％。

第十实施例是根据第七实施例所述的方法，其中从异丁香酚到香草醛的转化率高于90％。

第十一实施例是一种使用分离的重组宿主细胞产生香草醛的方法，所述方法包括以下步骤：(i)在培养基中培养分离的重组宿主细胞；(ii)将异丁香酚添加到(i)的所述培养基中，以开始将异丁香酚生物转化为香草醛；以及(iii)从所述培养基中提取香草醛，其中已使用包括编码异丁香酚单加氧酶的多核苷酸序列的核酸构建体转化所述分离的重组宿主细胞，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少70％同一性的氨基酸序列。

第十二实施例是根据第十一实施例所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少80％同一性的氨基酸序列。

第十三实施例是根据第十一实施例所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少90％同一性的氨基酸序列。

第十四实施例是根据第十一实施例所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少95％同一性的氨基酸序列。

第十五实施例是一种制造可消费产品的方法，所述方法包括以下步骤：根据第一至第十四实施例所述的方法产生香草醛，包含以下步骤：收集所述香草醛；以及将所述香草醛掺入可消费产品中。

第十六实施例是根据第十五实施例所述的方法，其包括将所述香草醛与所述可消费产品混合的步骤。

第十七实施例是根据第十五或第十六实施例所述的方法，其中所述香草醛以足以赋予风味调性的量掺入所述可消费产品中。

第十八实施例是根据第十五至第十七实施例所述的方法，其中所述可消费产品选自由以下组成的组：风味产品、食物产品、食物前体产品、在食物的生产中采用的添加剂、药物组合物、膳食补充剂、营养品和化妆品。

第十九实施例是根据第十五或第十六实施例所述的方法，其中所述香草醛以足以赋予香气调性的量掺入所述可消费产品中。

第二十实施例是根据第十五、第十六或第十九实施例中任一项所述的方法，其中所述可消费产品选自由以下组成的组：芳香产品、化妆品、卫生间产品和房屋清洁产品。

第二十一实施例一种使用核酸构建体转化的分离的重组宿主细胞，所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列，其中所述异丁香酚单加氧酶具有与SEQ IDNO:2具有至少70％同一性的氨基酸序列。

第二十二实施例是根据第二十一实施例所述的分离的重组宿主细胞，其中所述多核苷酸序列包括与SEQ ID NO:1的核酸序列至少90％相同的序列。

第二十三实施例是根据第二十一或第二十二实施例所述的分离的重组宿主细胞，其进一步包括含有SEQ ID NO:4的分离的核酸序列的载体。

第二十四实施例是根据第二十一第二十三实施例所述的分离的重组宿主细胞，其中所述宿主细胞选自由以下组成的组：细菌、酵母、不是黑粉菌属的真菌、藻青菌、藻类和植物细胞。

第二十五实施例是根据第二十一至第二十四实施例所述的分离的重组宿主细胞，其中所述宿主细胞选自由以下组成的微生物组：埃希氏菌属；沙门氏菌属；芽孢杆菌属；不动杆菌属；链霉菌属；棒状杆菌属；甲基弯曲菌属；甲基单胞菌属；红球菌属；假单胞菌属；红杆菌属；集胞藻属；酵母菌属；接合酵母菌属；克鲁维酵母菌属；假丝酵母菌属；汉逊氏酵母菌属；德巴利氏酵母菌属；毛霉菌属；毕赤酵母菌属；球拟酵母菌属；曲霉菌属；节丛孢属；短杆菌属；微杆菌属；节杆菌属；柠檬酸杆菌属；克雷伯菌属；泛菌属；以及梭菌属。

本发明的其它特征和优点将在以下参照附图的详细描述中变得明显。

附图说明

图1展示了从异丁香酚到香草醛的酶促途径。

图2提供了根据本公开的UmIEM-pET28a质粒构建体的示意图。

图3是示出所表达的UmIEM的重组蛋白的纯化的SDS-PAGE图片。

图4是示出通过UmIEM的基因产物将异丁香酚生物转化为香草醛的HPLC色谱图。上图是使用UmIEM的经纯化的基因产物获得的。下图是使用热变性的UmIEM酶作为阴性对照获得的。

图5示出了根据本教导的在摇瓶中通过转化的大肠杆菌(E.coli)菌株ISEG-V224以异丁香酚为底物产生香草醛。

图6示出了根据本教导的在5升发酵罐中通过转化的大肠杆菌菌株ISEG-V224以异丁香酚为底物产生香草醛。

序列简要说明

表1简要描述了本文和所附序列表中所公开的序列。如本领域技术人员已知的，注意到原核生物使用交替的起始密码子，主要是GUG和UUG，其被翻译为甲酰甲硫氨酸。

具体实施方式

如本文所使用的，除非内容另外明确指出，否则单数形式“一个/种(a/an)”以及“所述(the)”包含复数指示物。

就描述或权利要求中使用的术语“包含”、“具有”等而言，此类术语旨在以类似于术语“包括”的方式具有包容性，因为“包括”是在权利要求中用作过渡词时被解释。

“示例性”一词在本文中意指充当示例、实例或说明。在本文中描述为“示例性”的任何实施例不必被解释为比其它实施例更优选或有利。

“生物转化”在本文中是指产物的细胞产生，例如，通过体内产生，在细胞培养物中的宿主细胞中，如微生物宿主细胞中，所述细胞产生可以任选地与进一步的生物合成产生步骤(例如，在不同于先前的宿主细胞的宿主细胞)组合，和/或例如通过体外反应与化学合成反应组合。贯穿整个说明书，术语“生物转化(bioconversion)”可以与术语“生物转化(biotransformation)”和/或“生物合成(biosynthesis/biosynthetic)”可互换地使用。

“细胞系统”是提供异位蛋白质的表达的任何细胞。细胞系统包含细菌、酵母、植物细胞和动物细胞。细胞系统包含原核细胞和真核细胞两者。细胞系统还包含基于如核糖体等细胞组分的蛋白质的体外表达。

“编码序列”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于指编码特定氨基酸序列的DNA序列。

“生长”或“培养”细胞系统包含提供将会允许细胞繁殖和分裂的适合的培养基。“生长”或“培养”细胞系统还包含提供资源使得细胞或细胞组分可以转译和制备重组蛋白。

酵母是被分类为真菌界成员的真核单细胞微生物。酵母是从多细胞祖先进化而来的单细胞生物，但是其中可用于本发明的一些物种是能够通过形成称为假菌丝(pseudohyphae/false hyphae)的连接芽殖细胞串来发展多细胞特性的那些。

术语“互补”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于描述能够相互杂交的核苷酸碱基之间的关系。例如，相对于DNA，腺苷与胸腺嘧啶互补，并且胞嘧啶与鸟嘌呤互补。因此，主题技术还包含分离的核酸片段，其与随附的序列表中报道的完整序列以及那些基本上类似的核酸序列互补。

术语“核酸”和“核苷酸”应赋予本领域普通技术人员其相应的普通和惯用含义，并且用于但不限于指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。除非具体限制，否则所述术语涵盖含有天然核苷酸的已知类似物的核酸，所述已知类似物具有与参考核酸类似的结合性质并且以与天然存在的核苷酸类似的方式代谢。除非另有说明，否则特定核酸序列还明确涵盖其保守修饰或简并的变体(例如，简并密码子取代)和互补序列以及明确指明的序列。

术语“分离的”应赋予本领域普通技术人员其普通和习惯的含义，并且当在分离的核酸或分离的多肽的上下文中使用时，用于但不限于指代通过人为手段脱离其自然环境而存在并且因此不是自然产物的核酸或多肽。分离的核酸或多肽可以以纯化形式存在，或者可以存在于非天然环境，例如转基因宿主细胞中。

如本文所使用的，术语“温育(incubating/incubation)”是指混合两种或更多种化学或生物实体(如化学化合物和酶)并允许其在有利于产生香草醛的条件下相互作用的过程。

术语“简并变体”是指具有与参考核酸序列相差一个或多个简并密码子取代的残基序列的核酸序列。简并密码子取代可以通过产生一个或多个所选(或全部)密码子的第三位用混合碱基和/或脱氧肌苷残基取代的序列实现。核酸序列及其所有简并变体将表达相同的氨基酸或多肽。

术语“多肽”、“蛋白质”和“肽”应赋予本领域普通技术人员其相应的普通和惯用含义；这三个术语有时可互换地使用，并且用于但不限于指代氨基酸的聚合物或氨基酸类似物，无论其大小或功能如何。尽管“蛋白质”经常用于指代相对大的多肽，并且“肽”经常用于指代小的多肽，但是这些术语在本领域中的使用是重叠和变化的。除非另有说明，否则如本文所使用的术语“多肽”是指肽、多肽和蛋白质。当提及多核苷酸产物时，术语“蛋白质”、“多肽”和“肽”在本文中可互换使用。因此，示例性多肽包含多核苷酸产物、天然存在的蛋白质、同源物、直系同源物、旁系同源物、片段以及前述的其它等同物、变体和类似物。

当关于参考多肽使用时，术语“多肽片段”和“片段”应赋予本领域普通技术人员其普通和惯用含义，并且用于但不限于指代与参考多肽自身相比，其中缺失氨基酸残基、但其中剩余氨基酸序列通常与参考多肽中对应位置相同的多肽。此类缺失可以发生在参考多肽的氨基末端或羧基末端处，或可替代地发生在以上二者处。

术语多肽或蛋白质的“功能片段”是指作为全长多肽或蛋白质的一部分的肽片段，并且具有与全长多肽或蛋白质基本上相同的生物学活性或执行基本上相同的功能(例如，进行相同的酶促反应)。

可互换地使用的术语“变体多肽”、“经修饰的氨基酸序列”或“经修饰的多肽”是指与参考多肽相差一个或多个氨基酸，例如一个或多个氨基酸取代、缺失和/或添加的氨基酸序列。一方面，变体是保留参考多肽的一些或全部能力的“功能变体”。

术语“功能变体”进一步包含保守取代的变体。术语“保守取代的变体”是指具有与参考肽相差一个或多个保守氨基酸取代并保持所述参考肽的部分或全部活性的氨基酸序列的肽。“保守氨基酸取代”是用功能上类似的残基取代氨基酸残基。保守取代的实例包含一个非极性(疏水性)残基(如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸)取代另一个；一个带电荷或极性(亲水性)残基取代另一个，如精氨酸与赖氨酸之间、谷氨酰胺与天冬酰胺之间、苏氨酸与丝氨酸之间；一个碱性残基(如赖氨酸或精氨酸)取代另一个；或者一个酸性残基(如天冬氨酸或谷氨酸)取代另一个；或者一个芳香族残基(如苯丙氨酸、酪氨酸或色氨酸)取代另一个。预期此类取代对蛋白质或多肽的表观分子量或等电点的影响很小或没有影响。短语“保守取代的变体”还包含其中残基被化学衍生的残基替代的肽，前提是所得肽保持如本文所描述的参考肽的部分或全部活性。

与本主题技术的多肽相关的术语“变体”进一步包含具有与参考多肽的氨基酸序列至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％以及甚至100％相同的氨基酸序列的功能活性多肽。

术语“同源”在其所有语法形式和拼写变体中都是指具有“共同进化起源”的多核苷酸或多肽之间的关系，包含来自超家族的多核苷酸和多肽和来自不同物种的同源多核苷酸或蛋白质(Reeck等人,《细胞(Cell)》50:667,1987)。此类多核苷酸或多肽具有序列同源性，如其序列相似性所反映的，无论是在同一性百分比方面还是在保守位置处的特定氨基酸或基序的存在方面。例如，两种同源多肽可以具有至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％以及甚至100％相同的氨基酸序列。

“合适的调节序列”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列，并且其影响相关编码序列的转录、RNA加工或稳定性或翻译。调节序列可以包含启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。

“启动子”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于指代能够控制编码序列或功能性RNA的表达的DNA序列。通常，编码序列位于启动子序列的3'。启动子可以全部来源于天然基因，或者由来源于在自然界中发现的不同启动子的不同元件构成，或者甚至包括合成DNA片段。本领域技术人员应理解，不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的表达。使基因在大多数时间在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。进一步认识到，由于在大多数情况下调节序列的确切界限尚未完全限定，因此不同长度的DNA片段可以具有相同的启动子活性。

术语“可操作地连接”是指单一核酸片段上的核酸序列的缔合，使得一者的功能受另一者影响。例如，当启动子能够影响编码序列的表达(即，编码序列在启动子的转录控制之下)时，所述启动子与所述编码序列可操作地连接。编码序列可以按照有义或反义定向与调控序列可操作地连接。

如本文所使用的，术语“表达”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于指代来源于本主题技术的核酸片段的有义(mRNA)或反义RNA的转录和稳定累积。“过表达”是指转基因生物体或重组生物体中的基因产物的产生超过正常或未经转化的生物体中的产生水平。

“转化”应赋予本领域普通技术人员其普通和习惯的含义，并且用于但不限于指代将多核苷酸转移到靶细胞中。经转移的多核苷酸可以掺入到靶细胞的基因组或染色体DNA中，从而引起遗传稳定的遗传，或者其可以独立于宿主染色体进行复制。含有经转化的核酸片段的宿主生物体被称为“转基因”或“经转化”或“重组”。

术语“经转化”、“转基因”和“重组”当在本文中与宿主细胞结合使用时，应赋予本领域普通技术人员其相应的普通和惯用含义，并且用于但不限于指代其中引入了异源核酸分子的宿主生物体的细胞，如植物或微生物细胞。核酸分子可以稳定地整合到宿主细胞的基因组中，或者核酸分子可以作为染色体外分子存在。此类染色体外分子可以自动复制。经转化的细胞、组织或对象被理解为不仅涵盖转化过程的最终产物，而且涵盖其转基因后代。

术语“重组”、“异源”和“外源”当在本文中与多核苷酸结合使用时，应赋予本领域普通技术人员其普通和惯用含义，并且用于但不限于指代多核苷酸(例如，DNA序列或基因)来源于对于特定宿主细胞来说是外源来源，或者如果来自相同来源，则从其原始形式修饰而来。因此，宿主细胞中的异源基因包含特定宿主细胞内源性但已通过例如定点诱变或其它重组技术的使用进行修饰的基因。这些术语还包含天然存在的DNA序列的非天然存在的多个拷贝。因此，这些术语是指对于细胞来说是外源的或异源的，或与细胞同源但在宿主细胞内通常不存在此元件的位置或形式的DNA片段。

类似地，术语“重组”、“异源”和“外源”当在本文中与多肽或氨基酸序列结合使用时，意指源自对特定宿主细胞来说是外源来源的多肽或氨基酸序列，或者如果来自相同来源，则从其原始形式修饰而来。因此，重组DNA片段可以在宿主细胞中表达以产生重组多肽。

“蛋白质表达”是指在基因表达之后发生的蛋白质产生。蛋白质产生由将DNA转录为信使RNA(mRNA)后的阶段组成。然后将mRNA翻译成多肽链，所述多肽链最终折叠成蛋白质。DNA通过转染-将核酸有意地引入到细胞中的过程-而存在于细胞中。此术语常用于真核细胞中的非病毒方法。此术语还可以指其它方法和细胞类型，但优选其它术语：“转化”更常用于描述细菌、包含植物细胞在内的非动物真核细胞中的非病毒DNA转移。在动物细胞中，转染是优选的术语，因为转化还用于指在这些细胞中发展成癌性状态(致癌作用)。转导常用于描述病毒介导的DNA转移。转化、转导和病毒性感染包含在本申请的转染定义下。

术语“质粒”、“载体”和“盒”应赋予本领域普通技术人员其相应的普通和惯用含义，并且用于但不限于指代通常携带基因的额外染色体元件，这些基因不是细胞的中央代谢的一部分，并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列，其中许多核苷酸序列已经连接或重组成独特的构建，其能够将所选基因产物的启动子片段和DNA序列连同适当的3'非翻译序列引入到细胞中。“转化盒”是指含有外源基因并且具有除外源基因之外促进特定宿主细胞转化的元件的特定载体。“表达盒”是指含有外源基因并且具有除外源基因之外允许此基因在外源宿主中增强表达的元件的特定载体。

如本文所使用的，“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分例如核苷酸或氨基酸的整个比对窗口中不变的程度。测试序列和参考序列的比对区段的“同一性分数”是两个比对序列共享的完全相同的组分的数量除以参考序列区段即整个参考序列或参考序列的较小定义部分中的组分总数。

如本文所使用的，术语“序列同一性百分比”或“同一性百分比”是指在两个序列进行最佳比对(在比较窗口上，适合的核苷酸插入、删除或间隙总计小于参考序列的20％)时参考(“查询”)多核苷酸分子(或其互补链)与测试(“受试者”)多核苷酸分子(或其互补链)相比线性多核苷酸序列中完全相同的核苷酸的百分比。用于比对比较窗口的最佳序列比对是本领域技术人员熟知的，并且可以通过如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法等工具来执行，并且优选地通过这些算法的计算机化实施方式，如作为Wisconsin/>(马萨诸塞州柏林顿的Accelrys公司(Accelrys Inc.))的一部分可得到的GAP、BESTFIT、FASTA和TFASTA来执行。测试序列和参考序列的比对区段的“同一性分数”是两个比对序列共享的完全相同的组分的数量除以参考序列区段即整个参考序列或参考序列的较小定义部分中的组分总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其部分的比较或者与更长的多核苷酸序列的比较。出于本发明的目的，还可以使用用于翻译核苷酸序列的BLASTX 2.0版和用于多核苷酸序列的BLASTN 2.0版来确定“同一性百分比”。

序列同一性百分比优选使用Sequence Analysis Software Package^TM(第10版；威斯康星州麦迪逊的遗传学计算机集团公司(Genetics Computer Group,Inc.))的“最佳拟合(Best Fit)”或“间隙(Gap)”程序来确定。“间隙”利用Needleman和Wunsch的算法(Needleman和Wunsch,《分子生物学杂志(Journal of Molecular Biology)》48:443-453,1970)来找到两个序列的比对，所述比对将匹配数最大化并将空位数最小化。“最佳拟合”使用Smith和Waterman的局部同源性算法(Smith和Waterman,《应用数学进展(Advances inApplied Mathematics)》,2:482-489,1981；Smith等人,《核酸研究(Nucleic AcidsResearch)》11:2205-2220,1983)来进行在两个序列之间具有相似性的最佳区段的最佳比对，并插入间隙以最大化匹配数。最优选使用“最佳拟合”程序来确定百分比同一性。

用于确定序列同一性的有用方法还公开在局部比对搜索基本工具(BLAST)程序中，所述局部比对搜索基本工具程序可从位于马里兰州贝塞斯达国家卫生研究所国家医学图书馆(National Library of Medicine,National Institute of Health,Bethesda,Md.)的国家生物技术信息中心(National Center Biotechnology Information，NCBI),20894获得；参见《BLAST手册(BLAST Manual)》,Altschul等人,NCBI，NLM，NIH；Altschul等人,《分子生物学杂志(J.Mol.B_IOL)》.215:403-410(1990)；BLAST程序的2.0版或更高版本允许将间隙(缺失和插入)引入到比对中；对于肽序列，可以使用BLASTX来确定序列同一性；并且对于多核苷酸序列，可以使用BLASTN来确定序列同一性。

如本文所使用的，术语“相当大的序列同一性百分比”是指序列同一性百分比为至少约70％序列同一性、至少约80％序列同一性、至少约85％序列同一性、至少约90％序列同一性、或甚至更大的序列同一性如约98％或约99％序列同一性。因此，本发明的一个实施例是与本文所述的多核苷酸序列具有至少约70％序列同一性、至少约80％序列同一性、至少约85％序列同一性、至少约90％序列同一性或甚至更大的序列同一性如约98％或约99％序列同一性的多核苷酸分子。具有本发明的活性基因的多核苷酸分子能够引导产生香草醛，与本文所提供的多核苷酸序列具有相当大的序列同一性，并且涵盖在本发明的范围内。

同一性是在序列比对(所述比对可以使用仅序列信息或结构信息或其它某个信息来完成，但其通常是单独基于序列信息)后一对序列之间相同的氨基酸分数，并且相似性是基于使用某个相似性矩阵的比对分配的得分。相似性指数可以是以下中的任一个：BLOSUM62、PAM250或GONNET，或本领域技术人员用于蛋白质序列比对的任何矩阵。

同一性是两个子序列之间的对应程度(序列之间没有间隙)。25％或更高的同一性意味着功能的相似性，而18％-25％意味着结构或功能的相似性。请记住，两个完全不相关的或随机的序列(大于100个残基)可以具有高于20％的同一性。相似性是在比较两个序列时这两个序列之间的相似程度。这取决于其同一性。

编码核酸序列

本发明涉及编码如本文所描述的异丁香酚单加氧酶的核酸序列，并且其可以用于进行所需的基因工程操纵。本发明还涉及与本文具体公开的序列具有一定程度“同一性”的核酸。例如，本发明的各方面涵盖具有与SEQ ID NO:1具有至少60％同一性、与SEQ ID NO:1具有至少65％同一性、与SEQ ID NO:1具有至少70％同一性、与SEQ ID NO:1具有至少75％同一性、与SEQ ID NO:1具有至少80％同一性、与SEQ ID NO:1具有至少85％同一性、与SEQID NO:1具有至少90％同一性、与SEQ ID NO:1具有至少95％同一性或与SEQ ID NO:1具有至少99％同一性的核酸序列。在一些实施例中，用于编码可用于本发明的异丁香酚单加氧酶的核酸序列可以具有与SEQ ID NO:1相同的核酸序列。

本发明还涉及编码与SEQ ID NO:2具有至少60％同一性、与SEQ ID NO:2具有至少65％同一性、与SEQ ID NO:2具有至少70％同一性、与SEQ ID NO:2具有至少75％同一性、与SEQ ID NO:2具有至少80％同一性、与SEQ ID NO:2具有至少85％同一性、与SEQ ID NO:2具有至少90％同一性、与SEQ ID NO:2具有至少95％同一性或与SEQ ID NO:2具有至少99％同一性的氨基酸序列的异丁香酚单加氧酶的核酸序列。在一些实施例中，异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中，本发明可以涉及编码前述中任一者的功能等同物的核酸序列。

根据本发明的构建体

在一些方面，本发明涉及用于表达异丁香酚单加氧酶的构建体，如表达载体。

在一实施例中，表达载体包含用于在各种宿主细胞中表达本文所描述的重组多肽(即，UmIEM)的那些遗传元件。用于宿主细胞中的转录和翻译的元件可以包含启动子、蛋白质复合物的编码区和转录终止子。

本领域普通技术人员将了解可用于制备表达载体的分子生物学技术。如上文所描述的，用于掺入到主题技术的表达载体中的多核苷酸可以通过常规技术，如聚合酶链式反应(PCR)来制备。在分子克隆中，载体是用作媒剂的DNA分子，用于将外源遗传物质人工携带到另一个细胞中，在那里其可以复制和/或表达(例如，质粒、粘粒、λ噬菌体)。含有外源DNA的载体被认为是重组DNA。载体的四种主要类型为质粒、病毒载体、粘粒和人工染色体。其中，最常用的载体是质粒。所有工程化载体的共同点是复制起点、多克隆位点和可选择标志物。

已经开发了通过互补的内聚末端将DNA可操作地连接至载体的各种分子生物学技术。在一个实施例中，可以将互补的同聚物束添加到要插入到载体DNA中的核酸分子中。载体和核酸分子然后通过互补均聚物尾部之间的氢键连接以形成重组DNA分子。

在一替代性实施例中，包含所提供的一个或多个限制性位点的合成接头用于将主题技术的多核苷酸可操作地连接至表达载体。在一实施例中，多核苷酸通过限制性核酸内切酶消化产生。在一实施例中，核酸分子用噬菌体T4 DNA聚合酶或大肠杆菌DNA聚合酶I处理，这些酶以其3'-5'核酸外切活性去除突出的3'单链端，并以其聚合活性填充凹陷的3'端，由此产生齐平端DNA片段。然后，在存在能够催化齐平端DNA分子连接的酶(如噬菌体T4DNA连接酶)的情况下，将齐平端片段与大摩尔过量接头分子一起温育。因此，反应的产物是在其末端处携带聚合接头序列的多核苷酸。然后用合适的限制酶切割这些多核苷酸，并连接至表达载体，所述表达载体已经用产生与多核苷酸的末端相容的末端的酶切割。

可替代地，可以采用具有不依赖连接的克隆(LIC)位点的载体。然后可以将所需的PCR扩增的多核苷酸克隆到LIC载体中，而无需限制性消化或连接(Aslanidis和de Jong,《核酸研究(N_UCL.A_CID R_ES)》.18 6069-74,(1990)；Haun等人,《生物技术(Biotechniques)》13,515-18(1992)，所述文献中的每一个均通过引用并入本文)。

在一实施例中，为了分离和/或修饰所关注多核苷酸以插入到所选质粒中，适于使用PCR。可以设计用于序列的PCR制备的合适引物，以分离所需的核酸分子的编码区，添加限制性核酸内切酶或LIC位点，并将编码区放置在期望的阅读框中。

在一实施例中，使用适合PCR的寡核苷酸引物制备用于掺入到主题技术的表达载体中的多核苷酸。编码区被扩增，同时引物本身掺入到经扩增的序列产物中。在一实施例中，扩增引物含有限制性核酸内切酶识别位点，其允许将经扩增的序列产物克隆到合适的载体中。

可以通过常规转化或转染技术将表达载体引入到微生物或植物宿主细胞中。使用本领域技术的表达载体转化合适的细胞是通过本领域已知的方法完成的，并且通常取决于载体和细胞两者的类型。合适的技术包含磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、化学穿孔(chemoporation)或电穿孔。

/*成功转化的细胞，即那些含有表达载体的细胞，可以通过本领域熟知的技术来鉴定。例如，可以培养用主题技术的表达载体转染的细胞以产生本文所描述的多肽。可以通过本领域熟知的技术检查细胞中表达载体DNA的存在。

宿主细胞可以含有先前所描述的表达载体的单个拷贝，或者可替代地，表达载体的多个拷贝。

在一些实施例中，经转化的细胞是细菌细胞、植物细胞、藻类细胞、不是黑粉菌属的真菌细胞或酵母细胞。在优选实施例中，经转化的细胞可以选自由以下组成的组：埃希氏菌属；沙门氏菌属；芽孢杆菌属；不动杆菌属；链霉菌属；棒状杆菌属；甲基弯曲菌属；甲基单胞菌属；红球菌属；假单胞菌属；红杆菌属；集胞藻属；酵母菌属；接合酵母菌属；克鲁维酵母菌属；假丝酵母菌属；汉逊氏酵母菌属；德巴利氏酵母菌属；毛霉菌属；毕赤酵母菌属；球拟酵母菌属；曲霉菌属；节丛孢属；短杆菌属；微杆菌属；节杆菌属；柠檬酸杆菌属；克雷伯菌属；泛菌属；以及梭菌。在一些实施例中，细胞是选自由以下组成的组的植物细胞：卡诺拉(canola)植物细胞、油菜籽植物细胞、棕榈植物细胞、向日葵植物细胞、棉花植物细胞、玉米植物细胞、花生植物细胞、亚麻植物细胞、芝麻植物细胞、大豆植物细胞和矮牵牛植物细胞。

含有引导外源蛋白质的高水平表达的调节序列的微生物宿主细胞表达系统和表达载体是本领域技术人员熟知的。这些中的任一者都可以用于构建用于在微生物宿主细胞中表达主题技术的重组多肽的载体。然后可以通过转化将这些载体引入到适当的微生物中，以允许本主题技术的重组多肽的高水平表达。

用于转化合适的微生物宿主细胞的载体或盒是本领域熟知的。通常，载体或盒含有引导相关多核苷酸的转录和翻译的序列、可选择标志物和允许自主复制或染色体整合的序列。合适的载体包括携带转录起始控制的多核苷酸的5'区和控制转录终止的DNA片段的3'区。优选两个控制区均来源于与经转化的宿主细胞同源的基因，但应理解的是，此类控制区不需要来源于被选择作为宿主的特定物种的天然基因。

终止控制区也可以来源于微生物宿主的各种天然基因。对于本文所描述的微生物宿主，可以任选地包含终止位点。

优选的宿主细胞包含那些已知具有从异丁香酚中产生香草醛的能力的细胞。例如，优选的宿主细胞可以包含埃希氏菌属和假单胞菌属的细菌。

香草醛的发酵性产生

异丁香酚通过涉及丙烯基苯的侧链的氧化的环氧化物-二醇途径代谢成香草醛(图1)。本发明人已经令人惊讶地发现，与先前报道的细菌性IEM(例如，来自恶臭假单胞菌和硝基还原假单胞菌(Pseudomonas nitroreducens))相比，推定的来自玉米黑粉菌的异丁香酚单加氧酶(UmIEM)在将异丁香酚生物转化为香草醛方面显示出令人惊讶的高活性。更具体地，通过使携带UmIEM基因的宿主菌株工程化并在包含异丁香酚的混合物中培养工程化的宿主菌株，本发明人能够以高于10g/L的滴度以及高于90％的转化率产生香草醛。在不使用其它粗制酶和/或亚因子的情况下获得了高滴度和高转化率。

宿主细胞的培养可以在存在常用营养物质的水性培养基中进行。合适的培养基例如可以包含碳源、有机或无机氮源、无机盐和生长因子。对于培养基，葡萄糖可以是优选的碳源。酵母提取物可以是有用的氮源。可以添加磷酸盐、生长因子和微量元素。

可以在生物反应器中制备培养液并将其灭菌。然后可以将根据本发明的工程化宿主菌株接种到培养液中以开始生长期。生长期的适当持续时间可以为约5-40小时，优选地约10-35小时，并且最优选地约10-20小时。

生长期终止后，可以将发酵液的pH转变为pH 8.0或更高，并且将底物异丁香酚进料到培养物中。合适的底物进料的量可以为0.1-40g/L的发酵液，优选地约0.3-30g/L。底物可以作为固体物质或作为水溶液或悬浮液进料。底物的总量可以在一个步骤中、在两个或更多个进料步骤中或连续地进料。

生物转化期从底物进料开始并持续约5-50小时，优选地10-40小时，并且最优选地15-30小时，即直到所有底物转化为产物和副产物为止。

在终止的生物转化期之后，生物质可以通过如离心或膜过滤等任何熟知的方法从发酵液中分离出来，以获得无细胞发酵液。

可以使用例如与水不混溶的有机溶剂、植物油或任何固体提取剂，例如，树脂，优选地中性树脂，将提取相添加到发酵液中。可以将发酵液进一步灭菌或巴氏消毒。在一些实施例中，可以将发酵液浓缩。可以使用例如连续液-液提取工艺或分批提取工艺选择性地从发酵液中提取香草醛。

除此之外，本发明的优点包含在同一培养基中进行生长期和随后的生物转化期的能力。这极大地简化了产生过程，使过程高效且经济，因此允许扩大至工业生产水平。

^*本领域技术人员将认识到，通过本文所描述的方法产生的香草醛组合物可以进一步纯化并与如上文所描述的芳香和/或调味可消费产品以及膳食补充剂、药物组合物和药妆品混合，用于营养品以及医药产品。

在考虑以下非限制性实例后，将更充分地理解本公开。应当理解的是，尽管这些实例说明了本主题技术的优选实施例，但是其仅仅为了举例说明。通过以上讨论和这些实例，本领域的技术人员可以确定本主题技术的必要特征，并且可以在不脱离本主题技术的精神和范围的情况下可以对本主题技术进行各种改变和修改，以使本发明适用于各种用途和条件。

实例

菌株、质粒和培养条件。

DH5a和BL21(DE3)的大肠杆菌菌株购自英杰公司(Invitrogen)(加利福尼亚州卡尔斯巴德)。质粒pET28a购自EMD密理博公司(EMD Millipore)(马萨诸塞州比尔里卡)，其用于基因克隆和基因表达目的两者。

DNA操纵。

所有DNA操纵均按照标准程序进行。限制酶和T4 DNA连接酶购自新英格兰生物实验室(New England Biolabs)(马萨诸塞州伊普斯维奇)。根据制造商的指导，所有PCR反应均使用新英格兰生物实验室的Phusion PCR系统进行。

实例1：靶基因的鉴定

从NCBI数据库中鉴定出GenBank ID号为XP_023428676的来自玉米黑粉菌521的假定蛋白UMAG_05084(表1，SEQ ID NO:1)。此假定蛋白的基因位于玉米黑粉菌521染色体4上(表1，SEQ ID NO:2)。其基因序列经密码子优化以用于在大肠杆菌中表达(表1，SEQ ID NO:3)，并且由Gene Universal股份有限公司(Gene Universal Inc.)(特拉华州纽瓦克)合成。以下实例的结果指示此蛋白质是异丁香酚单加氧酶(UmIEM)，因为其显示出异丁香酚产生香草醛的高活性。具体地，携带具有UmIEM基因的表达质粒的大肠杆菌菌株能够以高滴度和高摩尔转化率产生香草醛。

实例2：质粒构建与宿主细胞转化

将UmIEM的开放阅读框(ORF)克隆到pET28a的Nde I/Xho I限制位点，使得重组蛋白在N端处具有6XHis标签，便于提取和纯化。使用UmIEM-NdeI-F和UmIEM-Xho I-R引物(表1)扩增UmIEM的ORF，以在5'端处引入Nde I限制位点，并且在3'端处引入Xho I位点。将所得PCR产物用限制酶Nde I和Xho I消化，并将所得的具有粘性端的PCR片段连接到表达质粒载体pET28a的限制位点Nde I或Xho I中，以产生重组质粒UmIEM-pET28a(图2；表1，SEQ IDNO:4)。使用质粒UmIEM-pET28a来转化DH5α感受态细胞。序列确认后，使用质粒UmIEM-pET28a以标准化学转化方案转化大肠杆菌菌株BL21(DE3)，以产生大肠杆菌菌株ISEG-V224。

实例3：UmIEM在大肠杆菌中的异源表达及重组蛋白的纯化

将大肠杆菌菌株ISEG-V224的单个菌落在含有50mg/L的卡那霉素的5mL的LB培养基中在37℃下生长过夜。将此菌种培养物转移至含有50mg/L的卡那霉素的200mL的LB培养基中。使细胞在37℃下以250rpm生长至OD600为0.6-0.8，并且然后添加异丙基β-D-1-硫代半乳糖苷(IPTG)至终浓度为0.5mM，并将生长温度改为16℃。IPTG诱导16小时后，通过在4℃下以4000g离心15分钟来采集大肠杆菌细胞。将所得颗粒重新悬浮于5mL的100mM HEPES-NaOH，pH 7.5、100mM NaCl、10％甘油(v/v)和1mM PMSF中，并在冰上超声处理2分钟。将混合物在4℃下以4000g离心20分钟。遵循制造商的方案，使用来自美国塔卡拉生物公司(TakaraBio USA,Inc.)(加利福尼亚州山景城)的His60 Ni Superflow树脂纯化上清液中的重组蛋白。通过SDS-PAGE(图3)检查重组蛋白的纯化。

实例4：体外酶测定

通过测量以异丁香酚作为底物的香草醛的形成来测定推定的异丁香酚单加氧酶的酶活性。反应混合物含有10mM异丁香酚、100mM Tris-HCl缓冲液(pH 7.0)、10％(v/v)DMSO和适量的酶，总体积为0.2ml。通过添加酶溶液开始反应，然后在往复振荡(160个冲程min^-1)下在30℃下进行10分钟，并通过添加0.2ml的甲醇停止反应。在以21,500rpm离心后，通过HPLC分析上清液，以测定异丁香酚和香草醛以及香草醇。将在沸水中处理5分钟的UmIEM酶用作阴性对照。

使用Vanquish Ultimate 3000系统对异丁香酚和香草醛进行HPLC分析。通过反相色谱法在Dionex Acclaim 120 C18柱(粒径3μm；150x 2.1mm)上分离中间体，梯度为0.15％(体积/体积)乙酸(洗脱液A)和甲醇(洗脱液B)，范围为60至100％(体积/体积)，并且流速为0.4毫升/分钟。为了定量，使用外部标准品对所有中间体进行了校准。这些化合物是通过其保留时间以及对应的光谱来识别的，这些光谱是用系统中的二极管阵列检测器识别的。

参考图4，上图证实了UmIEM的经纯化的基因产物能够催化异丁香酚转化为香草醛。相比之下，下图(用阴性对照获得)显示，当UmIEM酶变性时，没有产生香草醛。

实例5：使用摇瓶的异丁香酚到香草醛的体内生物转化

使大肠杆菌菌株IEUG-V224在具有含50μg/L卡那霉素的3ml LB的LB培养基中在37℃下生长过夜作为菌种培养物。将0.2mL的菌种培养物在125mL摇瓶中接种到含有50μg/L卡那霉素的20mL LB培养基中。使细胞在振荡器中以250rpm的振荡速度在30℃下生长至OD600为0.6，并添加异丙基β-D-1-硫代半乳糖苷(IPTG)至终浓度为0.5mM。在相同的培养条件下将细胞培养另外5小时，并且然后将100μl 50％异丁香酚(v/v在甲醇中)添加到烧瓶中。随后，在首次添加异丁香酚6小时和12小时后，将100μl 50％异丁香酚(v/v在甲醇中)添加到培养物中。以指定的时间间隔从烧瓶中取出100μl样品，通过涡旋与900μl的甲醇充分混合，并且然后以20,000g离心15分钟。将50μL的澄清上清液转移到HPLC样品小瓶中，并使用实例4中所描述的程序用于HPLC分析。实验一式三份地进行。

参考图5，在添加异丁香酚后六小时，用UmIEM基因转化的大肠杆菌菌株能够以高于3g/L的滴度产生香草醛，所述滴度在24小时后增加至超过5g/L。

实例6：在发酵罐中将异丁香酚生物转化为香草醛

开发了用于使用大肠杆菌菌株ISEG-V224在发酵罐中将异丁香酚生物转化为香草醛的发酵工艺。在500mL烧瓶中将一ml的ISEG-V224的甘油原液接种到100mL菌种培养基(Luria Bertani培养基，含有5g/L酵母提取物、10g/L胰蛋白酶、10g/L NaCl和50mg/L卡那霉素)中。将菌种在振荡器中以200rpm的振荡速度在37℃下培养8小时，并且然后在5升发酵罐中转移到Luria Bertani培养基加上6g/L初始葡萄糖、50mg/L卡那霉素的2升的发酵培养基中。

此发酵工艺有两个时期；即，细胞生长期和生物转化期。细胞生长期为0小时至17小时，并且被称为经过的发酵时间(EFT)。在EFT期间，发酵参数设置如下：空气流量：0.6vvm；通过使用4N NaOH将pH控制在不低于7.1。生长温度设置为30℃，并且搅拌速度设置为300-500rpm。溶解氧(DO)水平保持高于30％。在EFT 6.5小时时，添加IPTG至终浓度为0.5mM，并以0.4g/L/小时的速率进料葡萄糖，持续17小时。

生物转化期为EFT 17小时至46.5小时。发酵参数设置如下：空气流量：0.4vvm。使用4N NaOH将pH控制在不低于8.0，并且温度保持在30℃。搅拌设置为250-500rpm，并且DO保持在高于30％。以1.5g/L的速率以EFT 17小时开始进料异丁香酚，并持续4小时。在EFT 21小时时，异丁香酚进料速率降低至1g/L。在EFT 23小时时，异丁香酚进料速率进一步降低至0.6g/L/小时，并且维持另外8小时。以特定时间间隔收集样品，然后如实例4中所描述的通过HPLC进行分析。

参考图6，使用5升发酵罐，用UmIEM基因转化的大肠杆菌菌株ISEG-V224能够以高达14.8g/L的滴度使用异丁香酚作为底物产生香草醛。还值得注意的是，异丁香酚到香草醛的摩尔转化率达到90％以上。

根据前述描述显而易见的是，本公开的某些方面不受本文所提供的实例的特定细节限制，并且因此预期本领域技术人员将会想到其它修改和应用或其等同物。因此，权利要求书应当旨在覆盖不脱离本公开的精神和范围的所有此类修改和应用。

此外，除非另外定义，否则本文所使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解含义相同的含义。虽然本公开的实践或测试中可以使用类似于或等同于本文所述的方法和材料的任何方法和材料，但上文描述了优选的方法和材料。

虽然出于理解的目的通过说明和实例相当详细地描述了前述发明，但是对于本领域技术人员而言显而易见的是，可以实践某些变化和修改。因此，说明和实例不应被解释为限制本发明的范围，本发明的范围由所附权利要求书界定。

所关注序列

SEQ ID NO:1-UmIEM的核酸序列

ATGGCGCCTACCGCAACCCAAGATCCAGTGGCAGTGGCGGTGCCTGCCTCGAAAGCAGCCAAGCATGGCTACGTCCACCCGACCGACATGCTTCCGTCCGGCTGGCCAACGGCTACCGATCTGTCCGGAGGTGCACAGCCGCGCCGATTCGAAGGCACCATCTTCGACGTCATGGTGCGCGGTACGATCCCCAAGGAGCTGTACGGTACGTTTTACCGTATCATGCCCGACTACGCCGAGGCGCCGACGTACTACAAGGGAGGCGAGCTCAATGCGCCCATTGACGGCGATGGC

ACCGTGGCGGCGTTCCGGTTCAAGGACGGCAAGGTCGACTACCGCCAGCGATTCGTCG

AGACCGATCGATTCAAGGTGGAACGTCGTGCGAGGAAGAGCATGTACGGTCTGTACCG

CAACCCATACACGCACCATCCGTGTGTGAGGCAGACAGTCGACTCGACGGCCAACACC

AACGTCGTCATGCACGCCGGAAGGTTCCTAGCCATGAAGGAGAACGGCAACGCATACG

AGCTCGACCCGCACACACTCCAGACGCTCGGCTACAACCCATTCAAGCTGCCCTCCAAG

ACAATGACGGCGCACCCCAAGCAGTGTTCGGTGACGGGCAACCTGGTAGGCTTCGGAT

ACGAGGCCAAAGGATTGGCCACCAAAGATGTCTATTACTTTGAGGTGGATCCGTCCGGT

AAAGTGGTGCACGAGCTCTGGCTGGAAGCTCCGTGGTGTGCGTTTATCCACGACTGCGC

GCTGACACCCAACTACCTCGTGCTGATGCTTTGGCCATTCGAGGCCAACCTCGATAGGAT

GAAGGCGGGCGGTCACCACTGGGCGTACGACTACGACAAGCCGATCACTTGGATCACG

ATCCCTCGCGGTGCCAAGAGCAAAGACCAAGTCAAGTGCTGGTACTGGAAGAACGGCA

TGCCCATCCACACAGCTTCCGGATTCGAGGATGACCAAGGTCGCATCATCATTGATTCGT

CACTGGTGCACGGCAATGCGTTCCCCTTTTTCCCGCCCGACTCGGCCGAGCAGAGGCAG

AAACAGCAATCTGACGGAACGCCTAAAGCTCAATTTGTGCGATGGACCATCGATCCGCG

CAATGATAGCAATGAGCGTCTGCCCGATCCCGAGGTGATTCTCGACACGCCTTCCGAGTT

CCCGCAGATCGACAACCGTTTCATGGGCGTCGAGTACTCGAGCGCGTTTATCAACGTCT

TTGTACCCGACCGCAGCGATGGCAACAAGAACGTCTTCCAGGGCCTCAACGGTCTTGCG

CACTACCGACGTAAACAAGGCACTACCGAATGGTACTATGCCGGCGACAATTGCCTGAT

TCAAGAACCCGTCTTCAGCCCGCGCTCCGCCGACGCACCCGAAGGCGACGGCTTTGTG

CTCGCGATTGTCGACCGTCTCGATTTGAACCGCAGCGAGGTGGTCATCATCGACACCAG

AGACTTTACCACCGCGATTGCCGCTGTTCAACTCCCCTTCGCTATCCGTTCCGGCATCCA

CGGCCAGTGGATCCCCGGCCAGGTCACCCCCGACTTTGACTCAAGAGGCCTCATCGACC

TGCCAAAGCAACAACACTGGGCTCCGCCTTCTCAAAGCGCCTTTGATCCGAACATGTAASEQ ID NO:2-UmIEM的氨基酸序列

MAPTATQDPVAVAVPASKAAKHGYVHPTDMLPSGWPTATDLSGGAQPRRFEGTIFDVMVR

GTIPKELYGTFYRIMPDYAEAPTYYKGGELNAPIDGDGTVAAFRFKDGKVDYRQRFVETDR

FKVERRARKSMYGLYRNPYTHHPCVRQTVDSTANTNVVMHAGRFLAMKENGNAYELDP

HTLQTLGYNPFKLPSKTMTAHPKQCSVTGNLVGFGYEAKGLATKDVYYFEVDPSGKVVHE

LWLEAPWCAFIHDCALTPNYLVLMLWPFEANLDRMKAGGHHWAYDYDKPITWITIPRGAK

SKDQVKCWYWKNGMPIHTASGFEDDQGRIIIDSSLVHGNAFPFFPPDSAEQRQKQQSDGTP

KAQFVRWTIDPRNDSNERLPDPEVILDTPSEFPQIDNRFMGVEYSSAFINVFVPDRSDGNKN

VFQGLNGLAHYRRKQGTTEWYYAGDNCLIQEPVFSPRSADAPEGDGFVLAIVDRLDLNRS

EVVIIDTRDFTTAIAAVQLPFAIRSGIHGQWIPGQVTPDFDSRGLIDLPKQQHWAPPSQSAFDPNM

SEQ ID NO:3-被密码子优化以在大肠杆菌中表达的UmIEM的核酸序列ATGGCCCCTACCGCAACCCAGGACCCTGTGGCAGTTGCAGTGCCGGCCAGCAAAGCCGCAAAACATGGCTATGTGCATCCGACCGATATGCTGCCGAGTGGTTGGCCGACCGCAACCGATCTGAGCGGTGGTGCACAGCCGCGTCGTTTTGAAGGTACAATTTTTGATGTGATGGTGCGTGGTACAATTCCGAAAGAACTGTATGGTACATTTTATCGTATCATGCCGGATTATGCAGAAGCACCGACCTATTATAAAGGTGGTGAACTGAATGCCCCGATTGATGGTGACGGTACAGTTGCAGCCTTTCGTTTTAAAGATGGTAAAGTGGATTACCGTCAGCGCTTTGTGGAAACCGATCGCTTTAAAGTTGAACGCCGTGCCCGTAAAAGCATGTATGGTCTGTATCGCAATCCGTATACCCATCATCCGTGCGTGCGCCAGACCGTTGATAGCACCGCCAATACCAATGTTGTGATGCATGCCGGCCGTTTTCTGGCCATGAAAGAAAATGGTAATGCCTATGAACTGGACCCTCATACCCTGCAGACCCTGGGTTATAATCCGTTTAAATTACCGAGCAAAACCATGACCGCCCATCCGAAACAGTGCAGCGTGACCGGCAATCTGGTGGGCTTTGGCTATGAAGCCAAAGGTCTGGCAACCAAAGATGTTTATTATTTTGAAGTGGACCCGAGTGGTAAAGTTGTGCATGAACTGTGGCTGGAAGCACCGTGGTGTGCATTCATTCATGATTGCGCACTGACCCCGAATTATCTGGTTCTGATGCTGTGGCCGTTTGAAGCAAATCTGGATCGCATGAAAGCAGGCGGCCATCATTGGGCCTATGATTATGATAAACCGATTACCTGGATTACCATTCCGCGCGGTGCAAAAAGCAAAGATCAGGTTAAATGTTGGTATTGGAAAAATGGTATGCCGATTCATACCGCCAGTGGTTTTGAAGATGATCAGGGTCGCATTATTATTGATAGCAGTCTGGTTCATGGTAATGCCTTTCCGTTTTTCCCGCCGGATAGTGCAGAACAGCGCCAGAAACAGCAGAGCGATGGTACACCGAAAGCACAGTTTGTTCGCTGGACCATTGATCCGCGTAATGATAGCAATGAACGTCTGCCGGACCCTGAAGTGATTCTGGATACCCCGAGCGAATTTCCGCAGATTGATAATCGTTTTATGGGCGTGGAATATAGTAGCGCATTCATTAATGTGTTTGTTCCTGATCGTAGTGATGGTAATAAGAATGTTTTTCAGGGCCTGAATGGTCTGGCCCATTATCGTCGCAAACAGGGCACCACCGAATGGTATTATGCCGGCGATAATTGCCTGATTCAGGAACCGGTTTTTAGCCCGCGCAGTGCAGATGCACCGGAAGGTGACGGTTTTGTTCTGGCCATTGTTGATCGTCTGGATCTGAATCGTAGCGAAGTGGTTATTATTGATACCCGCGATTTTACCACCGCAATTGCCGCAGTGCAGCTGCCGTTTGCAATTCGTAGCGGTATTCATGGCCAGTGGATTCCGGGTCAGGTTACCCCGGATTTTGATAGTCGCGGCCTGATTGATCTGCCGAAACAGCAGCATTGGGCACCGCCGAGCCAGAGCGCATTTGATCCGAATATGTAA

SEQ ID NO:4-质粒pET28a的核酸序列

ATCCGGATATAGTTCCTCCTTTCAGCAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGGTTATGCTAGTTATTGCTCAGCGGTGGCAGCAGCCAACTCAGCTTCCTTTCGGGCT

TTGTTAGCAGCCGGATCTCAGTGGTGGTGGTGGTGGTGCTCGAGTGCGGCCGCTTACAT

ATTCGGATCAAATGCGCTCTGGCTCGGCGGTGCCCAATGCTGCTGTTTCGGCAGATCAAT

CAGGCCGCGACTATCAAAATCCGGGGTAACCTGACCCGGAATCCACTGGCCATGAATAC

CGCTACGAATTGCAAACGGCAGCTGCACTGCGGCAATTGCGGTGGTAAAATCGCGGGTA

TCAATAATAACCACTTCGCTACGATTCAGATCCAGACGATCAACAATGGCCAGAACAAA

ACCGTCACCTTCCGGTGCATCTGCACTGCGCGGGCTAAAAACCGGTTCCTGAATCAGGC

AATTATCGCCGGCATAATACCATTCGGTGGTGCCCTGTTTGCGACGATAATGGGCCAGAC

CATTCAGGCCCTGAAAAACATTCTTATTACCATCACTACGATCAGGAACAAACACATTAA

TGAATGCGCTACTATATTCCACGCCCATAAAACGATTATCAATCTGCGGAAATTCGCTCGG

GGTATCCAGAATCACTTCAGGGTCCGGCAGACGTTCATTGCTATCATTACGCGGATCAAT

GGTCCAGCGAACAAACTGTGCTTTCGGTGTACCATCGCTCTGCTGTTTCTGGCGCTGTTC

TGCACTATCCGGCGGGAAAAACGGAAAGGCATTACCATGAACCAGACTGCTATCAATAA

TAATGCGACCCTGATCATCTTCAAAACCACTGGCGGTATGAATCGGCATACCATTTTTCC

AATACCAACATTTAACCTGATCTTTGCTTTTTGCACCGCGCGGAATGGTAATCCAGGTAA

TCGGTTTATCATAATCATAGGCCCAATGATGGCCGCCTGCTTTCATGCGATCCAGATTTGC

TTCAAACGGCCACAGCATCAGAACCAGATAATTCGGGGTCAGTGCGCAATCATGAATGA

ATGCACACCACGGTGCTTCCAGCCACAGTTCATGCACAACTTTACCACTCGGGTCCACT

TCAAAATAATAAACATCTTTGGTTGCCAGACCTTTGGCTTCATAGCCAAAGCCCACCAGA

TTGCCGGTCACGCTGCACTGTTTCGGATGGGCGGTCATGGTTTTGCTCGGTAATTTAAAC

GGATTATAACCCAGGGTCTGCAGGGTATGAGGGTCCAGTTCATAGGCATTACCATTTTCT

TTCATGGCCAGAAAACGGCCGGCATGCATCACAACATTGGTATTGGCGGTGCTATCAAC

GGTCTGGCGCACGCACGGATGATGGGTATACGGATTGCGATACAGACCATACATGCTTTT

ACGGGCACGGCGTTCAACTTTAAAGCGATCGGTTTCCACAAAGCGCTGACGGTAATCCA

CTTTACCATCTTTAAAACGAAAGGCTGCAACTGTACCGTCACCATCAATCGGGGCATTCA

GTTCACCACCTTTATAATAGGTCGGTGCTTCTGCATAATCCGGCATGATACGATAAAATGT

ACCATACAGTTCTTTCGGAATTGTACCACGCACCATCACATCAAAAATTGTACCTTCAAA

ACGACGCGGCTGTGCACCACCGCTCAGATCGGTTGCGGTCGGCCAACCACTCGGCAGC

ATATCGGTCGGATGCACATAGCCATGTTTTGCGGCTTTGCTGGCCGGCACTGCAACTGCC

ACAGGGTCCTGGGTTGCGGTAGGGGCCATATGGCTGCCGCGCGGCACCAGGCCGCTGCT

GTGATGATGATGATGATGGCTGCTGCCCATGGTATATCTCCTTCTTAAAGTTAAACAAAAT

TATTTCTAGAGGGGAATTGTTATCCGCTCACAATTCCCCTATAGTGAGTCGTATTAATTTC

GCGGGATCGAGATCTCGATCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCC

ACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCGATGGGGAAGATCGGGCTCG

CCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTGGGTATGGTGGCAGGCCCCGTGGCCG

GGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGGCGGCGGTGCTCAAC

GGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAGGGAGAGCGTCG

AGATCCCGGACACCATCGAATGGCGCAAAACCTTTCGCGGTATGGCATGATAGCGCCCG

GAAGAGAGTCAATTCAGGGTGGTGAATGTGAAACCAGTAACGTTATACGATGTCGCAGA

GTATGCCGGTGTCTCTTATCAGACCGTTTCCCGCGTGGTGAACCAGGCCAGCCACGTTTC

TGCGAAAACGCGGGAAAAAGTGGAAGCGGCGATGGCGGAGCTGAATTACATTCCCAAC

CGCGTGGCACAACAACTGGCGGGCAAACAGTCGTTGCTGATTGGCGTTGCCACCTCCA

GTCTGGCCCTGCACGCGCCGTCGCAAATTGTCGCGGCGATTAAATCTCGCGCCGATCAA

CTGGGTGCCAGCGTGGTGGTGTCGATGGTAGAACGAAGCGGCGTCGAAGCCTGTAAAG

CGGCGGTGCACAATCTTCTCGCGCAACGCGTCAGTGGGCTGATCATTAACTATCCGCTG

GATGACCAGGATGCCATTGCTGTGGAAGCTGCCTGCACTAATGTTCCGGCGTTATTTCTT

GATGTCTCTGACCAGACACCCATCAACAGTATTATTTTCTCCCATGAAGACGGTACGCGA

CTGGGCGTGGAGCATCTGGTCGCATTGGGTCACCAGCAAATCGCGCTGTTAGCGGGCCC

ATTAAGTTCTGTCTCGGCGCGTCTGCGTCTGGCTGGCTGGCATAAATATCTCACTCGCAA

TCAAATTCAGCCGATAGCGGAACGGGAAGGCGACTGGAGTGCCATGTCCGGTTTTCAAC

AAACCATGCAAATGCTGAATGAGGGCATCGTTCCCACTGCGATGCTGGTTGCCAACGAT

CAGATGGCGCTGGGCGCAATGCGCGCCATTACCGAGTCCGGGCTGCGCGTTGGTGCGGA

TATCTCGGTAGTGGGATACGACGATACCGAAGACAGCTCATGTTATATCCCGCCGTTAAC

CACCATCAAACAGGATTTTCGCCTGCTGGGGCAAACCAGCGTGGACCGCTTGCTGCAAC

TCTCTCAGGGCCAGGCGGTGAAGGGCAATCAGCTGTTGCCCGTCTCACTGGTGAAAAG

AAAAACCACCCTGGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCAT

TAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAA

TTAATGTAAGTTAGCTCACTCATTAGGCACCGGGATCTCGACCGATGCCCTTGAGAGCCT

TCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATG

ACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTC

GGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGG

AATCTTGCACGCCCTCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCG

AGAAGCAGGCCATTATCGCCGGCATGGCGGCCCCACGGGTGCGCATGATCGTGCTCCTG

TCGTTGAGGACCCGGCTAGGCTGGCGGGGTTGCCTTACTGGTTAGCAGAATGAATCACC

GATACGCGAGCGAACGTGAAGCGACTGCTGCTGCAAAACGTCTGCGACCTGAGCAACA

ACATGAATGGTCTTCGGTTTCCGTGTTTCGTAAAGTCTGGAAACGCGGAAGTCAGCGCC

CTGCACCATTATGTTCCGGATCTGCATCGCAGGATGCTGCTGGCTACCCTGTGGAACACC

TACATCTGTATTAACGAAGCGCTGGCATTGACCCTGAGTGATTTTTCTCTGGTCCCGCCG

CATCCATACCGCCAGTTGTTTACCCTCACAACGTTCCAGTAACCGGGCATGTTCATCATC

AGTAACCCGTATCGTGAGCATCCTCTCTCGTTTCATCGGTATCATTACCCCCATGAACAGA

AATCCCCCTTACACGGAGGCATCAGTGACCAAACAGGAAAAAACCGCCCTTAACATGG

CCCGCTTTATCAGAAGCCAGACATTAACGCTTCTGGAGAAACTCAACGAGCTGGACGCG

GATGAACAGGCAGACATCTGTGAATCGCTTCACGACCACGCTGATGAGCTTTACCGCAG

CTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGA

CGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTC

AGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGA

GTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATAT

GCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCG

CTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCT

CACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACAT

GTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTT

TTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGT

GGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTG

CGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGA

AGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGC

TCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGG

TAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCA

CTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGG

TGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCA

GTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAG

CGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAG

ATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGG

ATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTAT

GAGCCATATTCAACGGGAAACGTCTTGCTCTAGGCCGCGATTAAATTCCAACATGGATGC

TGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTAT

CGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGT

TGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCT

TCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATC

CCCGGGAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTT

GATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAAGAATTAATTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGAAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCC

SEQ ID NO:5-引物UmIEM-NdeI-F的核酸序列

GGAATTCCATATGGCCCCTACCGCAACCCAGGACCCTGTG

SEQ ID NO:6-引物UmIEM-XhoI-R的核酸序列

CCGCTCGAGTTACATATTCGGATCAAATGCGCTCTGGCTC。

序列表

<110> 巴斯夫公司（BASF SE）

<120> 由异丁香酚生物合成香草醛

<130> 074008-2040-WO-000326

<150> US 63/127,503

<151> 2020-12-18

<160> 6

<170> PatentIn 3.5版

<210> 1

<211> 1647

<212> DNA

<213> 玉米黑粉菌（Ustilago maydis）

<220>

<221> misc_feature

<222> (1)..(1647)

<223> UmIEM的核酸序列

<220>

<221> misc_feature

<222> (1645)..(1647)

<223> 终止密码子

<400> 1

atggcgccta ccgcaaccca agatccagtg gcagtggcgg tgcctgcctc gaaagcagcc 60

aagcatggct acgtccaccc gaccgacatg cttccgtccg gctggccaac ggctaccgat 120

ctgtccggag gtgcacagcc gcgccgattc gaaggcacca tcttcgacgt catggtgcgc 180

ggtacgatcc ccaaggagct gtacggtacg ttttaccgta tcatgcccga ctacgccgag 240

gcgccgacgt actacaaggg aggcgagctc aatgcgccca ttgacggcga tggcaccgtg 300

gcggcgttcc ggttcaagga cggcaaggtc gactaccgcc agcgattcgt cgagaccgat 360

cgattcaagg tggaacgtcg tgcgaggaag agcatgtacg gtctgtaccg caacccatac 420

acgcaccatc cgtgtgtgag gcagacagtc gactcgacgg ccaacaccaa cgtcgtcatg 480

cacgccggaa ggttcctagc catgaaggag aacggcaacg catacgagct cgacccgcac 540

acactccaga cgctcggcta caacccattc aagctgccct ccaagacaat gacggcgcac 600

cccaagcagt gttcggtgac gggcaacctg gtaggcttcg gatacgaggc caaaggattg 660

gccaccaaag atgtctatta ctttgaggtg gatccgtccg gtaaagtggt gcacgagctc 720

tggctggaag ctccgtggtg tgcgtttatc cacgactgcg cgctgacacc caactacctc 780

gtgctgatgc tttggccatt cgaggccaac ctcgatagga tgaaggcggg cggtcaccac 840

tgggcgtacg actacgacaa gccgatcact tggatcacga tccctcgcgg tgccaagagc 900

aaagaccaag tcaagtgctg gtactggaag aacggcatgc ccatccacac agcttccgga 960

ttcgaggatg accaaggtcg catcatcatt gattcgtcac tggtgcacgg caatgcgttc 1020

ccctttttcc cgcccgactc ggccgagcag aggcagaaac agcaatctga cggaacgcct 1080

aaagctcaat ttgtgcgatg gaccatcgat ccgcgcaatg atagcaatga gcgtctgccc 1140

gatcccgagg tgattctcga cacgccttcc gagttcccgc agatcgacaa ccgtttcatg 1200

ggcgtcgagt actcgagcgc gtttatcaac gtctttgtac ccgaccgcag cgatggcaac 1260

aagaacgtct tccagggcct caacggtctt gcgcactacc gacgtaaaca aggcactacc 1320

gaatggtact atgccggcga caattgcctg attcaagaac ccgtcttcag cccgcgctcc 1380

gccgacgcac ccgaaggcga cggctttgtg ctcgcgattg tcgaccgtct cgatttgaac 1440

cgcagcgagg tggtcatcat cgacaccaga gactttacca ccgcgattgc cgctgttcaa 1500

ctccccttcg ctatccgttc cggcatccac ggccagtgga tccccggcca ggtcaccccc 1560

gactttgact caagaggcct catcgacctg ccaaagcaac aacactgggc tccgccttct 1620

caaagcgcct ttgatccgaa catgtaa 1647

<210> 2

<211> 548

<212> PRT

<213> 玉米黑粉菌（Ustilago maydis）

<220>

<221> MISC_FEATURE

<222> (1)..(548)

<223> UmIEM的氨基酸序列

<400> 2

Met Ala Pro Thr Ala Thr Gln Asp Pro Val Ala Val Ala Val Pro Ala

1 5 10 15

Ser Lys Ala Ala Lys His Gly Tyr Val His Pro Thr Asp Met Leu Pro

20 25 30

Ser Gly Trp Pro Thr Ala Thr Asp Leu Ser Gly Gly Ala Gln Pro Arg

35 40 45

Arg Phe Glu Gly Thr Ile Phe Asp Val Met Val Arg Gly Thr Ile Pro

50 55 60

Lys Glu Leu Tyr Gly Thr Phe Tyr Arg Ile Met Pro Asp Tyr Ala Glu

65 70 75 80

Ala Pro Thr Tyr Tyr Lys Gly Gly Glu Leu Asn Ala Pro Ile Asp Gly

85 90 95

Asp Gly Thr Val Ala Ala Phe Arg Phe Lys Asp Gly Lys Val Asp Tyr

100 105 110

Arg Gln Arg Phe Val Glu Thr Asp Arg Phe Lys Val Glu Arg Arg Ala

115 120 125

Arg Lys Ser Met Tyr Gly Leu Tyr Arg Asn Pro Tyr Thr His His Pro

130 135 140

Cys Val Arg Gln Thr Val Asp Ser Thr Ala Asn Thr Asn Val Val Met

145 150 155 160

His Ala Gly Arg Phe Leu Ala Met Lys Glu Asn Gly Asn Ala Tyr Glu

165 170 175

Leu Asp Pro His Thr Leu Gln Thr Leu Gly Tyr Asn Pro Phe Lys Leu

180 185 190

Pro Ser Lys Thr Met Thr Ala His Pro Lys Gln Cys Ser Val Thr Gly

195 200 205

Asn Leu Val Gly Phe Gly Tyr Glu Ala Lys Gly Leu Ala Thr Lys Asp

210 215 220

Val Tyr Tyr Phe Glu Val Asp Pro Ser Gly Lys Val Val His Glu Leu

225 230 235 240

Trp Leu Glu Ala Pro Trp Cys Ala Phe Ile His Asp Cys Ala Leu Thr

245 250 255

Pro Asn Tyr Leu Val Leu Met Leu Trp Pro Phe Glu Ala Asn Leu Asp

260 265 270

Arg Met Lys Ala Gly Gly His His Trp Ala Tyr Asp Tyr Asp Lys Pro

275 280 285

Ile Thr Trp Ile Thr Ile Pro Arg Gly Ala Lys Ser Lys Asp Gln Val

290 295 300

Lys Cys Trp Tyr Trp Lys Asn Gly Met Pro Ile His Thr Ala Ser Gly

305 310 315 320

Phe Glu Asp Asp Gln Gly Arg Ile Ile Ile Asp Ser Ser Leu Val His

325 330 335

Gly Asn Ala Phe Pro Phe Phe Pro Pro Asp Ser Ala Glu Gln Arg Gln

340 345 350

Lys Gln Gln Ser Asp Gly Thr Pro Lys Ala Gln Phe Val Arg Trp Thr

355 360 365

Ile Asp Pro Arg Asn Asp Ser Asn Glu Arg Leu Pro Asp Pro Glu Val

370 375 380

Ile Leu Asp Thr Pro Ser Glu Phe Pro Gln Ile Asp Asn Arg Phe Met

385 390 395 400

Gly Val Glu Tyr Ser Ser Ala Phe Ile Asn Val Phe Val Pro Asp Arg

405 410 415

Ser Asp Gly Asn Lys Asn Val Phe Gln Gly Leu Asn Gly Leu Ala His

420 425 430

Tyr Arg Arg Lys Gln Gly Thr Thr Glu Trp Tyr Tyr Ala Gly Asp Asn

435 440 445

Cys Leu Ile Gln Glu Pro Val Phe Ser Pro Arg Ser Ala Asp Ala Pro

450 455 460

Glu Gly Asp Gly Phe Val Leu Ala Ile Val Asp Arg Leu Asp Leu Asn

465 470 475 480

Arg Ser Glu Val Val Ile Ile Asp Thr Arg Asp Phe Thr Thr Ala Ile

485 490 495

Ala Ala Val Gln Leu Pro Phe Ala Ile Arg Ser Gly Ile His Gly Gln

500 505 510

Trp Ile Pro Gly Gln Val Thr Pro Asp Phe Asp Ser Arg Gly Leu Ile

515 520 525

Asp Leu Pro Lys Gln Gln His Trp Ala Pro Pro Ser Gln Ser Ala Phe

530 535 540

Asp Pro Asn Met

545

<210> 3

<211> 1647

<212> DNA

<213> 人工

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(1647)

<223> 被密码子优化以在大肠杆菌中表达的UmIEM的核酸序列

<220>

<221> misc_feature

<222> (1645)..(1647)

<223> 终止密码子

<400> 3

atggccccta ccgcaaccca ggaccctgtg gcagttgcag tgccggccag caaagccgca 60

aaacatggct atgtgcatcc gaccgatatg ctgccgagtg gttggccgac cgcaaccgat 120

ctgagcggtg gtgcacagcc gcgtcgtttt gaaggtacaa tttttgatgt gatggtgcgt 180

ggtacaattc cgaaagaact gtatggtaca ttttatcgta tcatgccgga ttatgcagaa 240

gcaccgacct attataaagg tggtgaactg aatgccccga ttgatggtga cggtacagtt 300

gcagcctttc gttttaaaga tggtaaagtg gattaccgtc agcgctttgt ggaaaccgat 360

cgctttaaag ttgaacgccg tgcccgtaaa agcatgtatg gtctgtatcg caatccgtat 420

acccatcatc cgtgcgtgcg ccagaccgtt gatagcaccg ccaataccaa tgttgtgatg 480

catgccggcc gttttctggc catgaaagaa aatggtaatg cctatgaact ggaccctcat 540

accctgcaga ccctgggtta taatccgttt aaattaccga gcaaaaccat gaccgcccat 600

ccgaaacagt gcagcgtgac cggcaatctg gtgggctttg gctatgaagc caaaggtctg 660

gcaaccaaag atgtttatta ttttgaagtg gacccgagtg gtaaagttgt gcatgaactg 720

tggctggaag caccgtggtg tgcattcatt catgattgcg cactgacccc gaattatctg 780

gttctgatgc tgtggccgtt tgaagcaaat ctggatcgca tgaaagcagg cggccatcat 840

tgggcctatg attatgataa accgattacc tggattacca ttccgcgcgg tgcaaaaagc 900

aaagatcagg ttaaatgttg gtattggaaa aatggtatgc cgattcatac cgccagtggt 960

tttgaagatg atcagggtcg cattattatt gatagcagtc tggttcatgg taatgccttt 1020

ccgtttttcc cgccggatag tgcagaacag cgccagaaac agcagagcga tggtacaccg 1080

aaagcacagt ttgttcgctg gaccattgat ccgcgtaatg atagcaatga acgtctgccg 1140

gaccctgaag tgattctgga taccccgagc gaatttccgc agattgataa tcgttttatg 1200

ggcgtggaat atagtagcgc attcattaat gtgtttgttc ctgatcgtag tgatggtaat 1260

aagaatgttt ttcagggcct gaatggtctg gcccattatc gtcgcaaaca gggcaccacc 1320

gaatggtatt atgccggcga taattgcctg attcaggaac cggtttttag cccgcgcagt 1380

gcagatgcac cggaaggtga cggttttgtt ctggccattg ttgatcgtct ggatctgaat 1440

cgtagcgaag tggttattat tgatacccgc gattttacca ccgcaattgc cgcagtgcag 1500

ctgccgtttg caattcgtag cggtattcat ggccagtgga ttccgggtca ggttaccccg 1560

gattttgata gtcgcggcct gattgatctg ccgaaacagc agcattgggc accgccgagc 1620

cagagcgcat ttgatccgaa tatgtaa 1647

<210> 4

<211> 6948

<212> DNA

<213> 人工

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(6948)

<223> 质粒pET28a的核酸序列

<400> 4

atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60

ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120

tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcttacatat 180

tcggatcaaa tgcgctctgg ctcggcggtg cccaatgctg ctgtttcggc agatcaatca 240

ggccgcgact atcaaaatcc ggggtaacct gacccggaat ccactggcca tgaataccgc 300

tacgaattgc aaacggcagc tgcactgcgg caattgcggt ggtaaaatcg cgggtatcaa 360

taataaccac ttcgctacga ttcagatcca gacgatcaac aatggccaga acaaaaccgt 420

caccttccgg tgcatctgca ctgcgcgggc taaaaaccgg ttcctgaatc aggcaattat 480

cgccggcata ataccattcg gtggtgccct gtttgcgacg ataatgggcc agaccattca 540

ggccctgaaa aacattctta ttaccatcac tacgatcagg aacaaacaca ttaatgaatg 600

cgctactata ttccacgccc ataaaacgat tatcaatctg cggaaattcg ctcggggtat 660

ccagaatcac ttcagggtcc ggcagacgtt cattgctatc attacgcgga tcaatggtcc 720

agcgaacaaa ctgtgctttc ggtgtaccat cgctctgctg tttctggcgc tgttctgcac 780

tatccggcgg gaaaaacgga aaggcattac catgaaccag actgctatca ataataatgc 840

gaccctgatc atcttcaaaa ccactggcgg tatgaatcgg cataccattt ttccaatacc 900

aacatttaac ctgatctttg ctttttgcac cgcgcggaat ggtaatccag gtaatcggtt 960

tatcataatc ataggcccaa tgatggccgc ctgctttcat gcgatccaga tttgcttcaa 1020

acggccacag catcagaacc agataattcg gggtcagtgc gcaatcatga atgaatgcac 1080

accacggtgc ttccagccac agttcatgca caactttacc actcgggtcc acttcaaaat 1140

aataaacatc tttggttgcc agacctttgg cttcatagcc aaagcccacc agattgccgg 1200

tcacgctgca ctgtttcgga tgggcggtca tggttttgct cggtaattta aacggattat 1260

aacccagggt ctgcagggta tgagggtcca gttcataggc attaccattt tctttcatgg 1320

ccagaaaacg gccggcatgc atcacaacat tggtattggc ggtgctatca acggtctggc 1380

gcacgcacgg atgatgggta tacggattgc gatacagacc atacatgctt ttacgggcac 1440

ggcgttcaac tttaaagcga tcggtttcca caaagcgctg acggtaatcc actttaccat 1500

ctttaaaacg aaaggctgca actgtaccgt caccatcaat cggggcattc agttcaccac 1560

ctttataata ggtcggtgct tctgcataat ccggcatgat acgataaaat gtaccataca 1620

gttctttcgg aattgtacca cgcaccatca catcaaaaat tgtaccttca aaacgacgcg 1680

gctgtgcacc accgctcaga tcggttgcgg tcggccaacc actcggcagc atatcggtcg 1740

gatgcacata gccatgtttt gcggctttgc tggccggcac tgcaactgcc acagggtcct 1800

gggttgcggt aggggccata tggctgccgc gcggcaccag gccgctgctg tgatgatgat 1860

gatgatggct gctgcccatg gtatatctcc ttcttaaagt taaacaaaat tatttctaga 1920

ggggaattgt tatccgctca caattcccct atagtgagtc gtattaattt cgcgggatcg 1980

agatctcgat cctctacgcc ggacgcatcg tggccggcat caccggcgcc acaggtgcgg 2040

ttgctggcgc ctatatcgcc gacatcaccg atggggaaga tcgggctcgc cacttcgggc 2100

tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg ggactgttgg 2160

gcgccatctc cttgcatgca ccattccttg cggcggcggt gctcaacggc ctcaacctac 2220

tactgggctg cttcctaatg caggagtcgc ataagggaga gcgtcgagat cccggacacc 2280

atcgaatggc gcaaaacctt tcgcggtatg gcatgatagc gcccggaaga gagtcaattc 2340

agggtggtga atgtgaaacc agtaacgtta tacgatgtcg cagagtatgc cggtgtctct 2400

tatcagaccg tttcccgcgt ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa 2460

aaagtggaag cggcgatggc ggagctgaat tacattccca accgcgtggc acaacaactg 2520

gcgggcaaac agtcgttgct gattggcgtt gccacctcca gtctggccct gcacgcgccg 2580

tcgcaaattg tcgcggcgat taaatctcgc gccgatcaac tgggtgccag cgtggtggtg 2640

tcgatggtag aacgaagcgg cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg 2700

caacgcgtca gtgggctgat cattaactat ccgctggatg accaggatgc cattgctgtg 2760

gaagctgcct gcactaatgt tccggcgtta tttcttgatg tctctgacca gacacccatc 2820

aacagtatta ttttctccca tgaagacggt acgcgactgg gcgtggagca tctggtcgca 2880

ttgggtcacc agcaaatcgc gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg 2940

cgtctggctg gctggcataa atatctcact cgcaatcaaa ttcagccgat agcggaacgg 3000

gaaggcgact ggagtgccat gtccggtttt caacaaacca tgcaaatgct gaatgagggc 3060

atcgttccca ctgcgatgct ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc 3120

attaccgagt ccgggctgcg cgttggtgcg gatatctcgg tagtgggata cgacgatacc 3180

gaagacagct catgttatat cccgccgtta accaccatca aacaggattt tcgcctgctg 3240

gggcaaacca gcgtggaccg cttgctgcaa ctctctcagg gccaggcggt gaagggcaat 3300

cagctgttgc ccgtctcact ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc 3360

gcctctcccc gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg 3420

gaaagcgggc agtgagcgca acgcaattaa tgtaagttag ctcactcatt aggcaccggg 3480

atctcgaccg atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg 3540

catgactatc gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt 3600

gccggcagcg ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat 3660

cggcctgtcg cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg 3720

tcccgccacc aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccccacg 3780

ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta ggctggcggg gttgccttac 3840

tggttagcag aatgaatcac cgatacgcga gcgaacgtga agcgactgct gctgcaaaac 3900

gtctgcgacc tgagcaacaa catgaatggt cttcggtttc cgtgtttcgt aaagtctgga 3960

aacgcggaag tcagcgccct gcaccattat gttccggatc tgcatcgcag gatgctgctg 4020

gctaccctgt ggaacaccta catctgtatt aacgaagcgc tggcattgac cctgagtgat 4080

ttttctctgg tcccgccgca tccataccgc cagttgttta ccctcacaac gttccagtaa 4140

ccgggcatgt tcatcatcag taacccgtat cgtgagcatc ctctctcgtt tcatcggtat 4200

cattaccccc atgaacagaa atccccctta cacggaggca tcagtgacca aacaggaaaa 4260

aaccgccctt aacatggccc gctttatcag aagccagaca ttaacgcttc tggagaaact 4320

caacgagctg gacgcggatg aacaggcaga catctgtgaa tcgcttcacg accacgctga 4380

tgagctttac cgcagctgcc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat 4440

gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg 4500

tcagggcgcg tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc agtcacgtag 4560

cgatagcgga gtgtatactg gcttaactat gcggcatcag agcagattgt actgagagtg 4620

caccatatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 4680

gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 4740

tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 4800

agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 4860

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 4920

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 4980

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 5040

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 5100

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 5160

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 5220

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 5280

ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 5340

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 5400

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 5460

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 5520

tggtcatgaa caataaaact gtctgcttac ataaacagta atacaagggg tgttatgagc 5580

catattcaac gggaaacgtc ttgctctagg ccgcgattaa attccaacat ggatgctgat 5640

ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 5700

ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 5760

aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 5820

accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 5880

gggaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 5940

gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 6000

agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat 6060

gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 6120

cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 6180

aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 6240

gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 6300

ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 6360

tttcatttga tgctcgatga gtttttctaa gaattaattc atgagcggat acatatttga 6420

atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 6480

tgaaattgta aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 6540

attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 6600

gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 6660

caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 6720

ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 6780

cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 6840

agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 6900

cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgcc 6948

<210> 5

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(40)

<223> 引物UmIEM-NdeI-F的核酸序列

<400> 5

ggaattccat atggccccta ccgcaaccca ggaccctgtg 40

<210> 6

<211> 40

<212> DNA

<213> 人工

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(40)

<223> 引物UmIEM-XhoI-R的核酸序列

<400> 6

ccgctcgagt tacatattcg gatcaaatgc gctctggctc 40

Claims

1.一种产生香草醛的生物转化方法，所述方法包括：

a.在混合物中表达UmIEM基因，其中所述UmIEM基因的所表达的蛋白具有与所述混合物中的SEQ ID NO:2具有至少70％同一性的氨基酸序列；

b.将异丁香酚进料到所述混合物中；以及

c.将异丁香酚转化为香草醛。

2.根据权利要求1所述的方法，其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少80％同一性的氨基酸序列。

3.根据权利要求1所述的方法，其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少90％同一性的氨基酸序列。

4.根据权利要求1所述的方法，其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少95％同一性的氨基酸序列。

5.根据权利要求1所述的方法，其中所述表达所述UmIEM基因的步骤选自由以下组成的组：通过体外翻译表达所述基因；在细胞系统中表达所述基因；以及在细菌或酵母细胞中表达所述基因。

6.根据权利要求5所述的方法，其进一步包括对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。

7.根据权利要求1所述的方法，其进一步包括收集所述香草醛。

8.根据权利要求7所述的方法，其中从异丁香酚到香草醛的转化率高于80％。

9.根据权利要求7所述的方法，其中从异丁香酚到香草醛的转化率高于85％。

10.根据权利要求7所述的方法，其中从异丁香酚到香草醛的转化率高于90％。

11.一种使用分离的重组宿主细胞产生香草醛的方法，所述方法包括：

(i)在培养基中培养分离的重组宿主细胞；

(ii)将异丁香酚添加到(i)的所述培养基中，以开始将异丁香酚生物转化为香草醛；以及

(iii)从所述培养基中提取香草醛，其中已使用包括编码异丁香酚单加氧酶的多核苷酸序列的核酸构建体转化所述分离的重组宿主细胞，其中所述异丁香酚单加氧酶具有与SEQID NO:2具有至少70％同一性的氨基酸序列。

12.根据权利要求11所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少80％同一性的氨基酸序列。

13.根据权利要求11所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少90％同一性的氨基酸序列。

14.根据权利要求11所述的方法，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少95％同一性的氨基酸序列。

15.一种制造可消费产品的方法，所述方法包括以下步骤：根据权利要求1所述的方法产生香草醛；收集所述香草醛；以及将所述香草醛掺入到可消费产品中。

16.根据权利要求15所述的方法，其包括将所述香草醛与所述可消费产品混合的步骤。

17.根据权利要求15所述的方法，其中所述香草醛以足以赋予风味调性的量掺入到所述可消费产品中。

18.根据权利要求15所述的方法，其中所述可消费产品选自由以下组成的组：风味产品、食物产品、食物前体产品、在食物的生产中采用的添加剂、药物组合物、膳食补充剂、营养品和化妆品。

19.根据权利要求15所述的方法，其中所述香草醛以足以赋予香气调性的量掺入到所述可消费产品中。

20.根据权利要求15所述的方法，其中所述可消费产品选自由以下组成的组：芳香产品、化妆品、卫生间产品和房屋清洁产品。

21.一种使用核酸构建体转化的分离的重组宿主细胞，所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列，其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少70％同一性的氨基酸序列。

22.根据权利要求21所述的分离的重组宿主细胞，其中所述多核苷酸序列包括与SEQID NO:1的核酸序列至少90％相同的序列。

23.根据权利要求21所述的分离的重组宿主细胞，其进一步包括含有SEQ ID NO:4的分离的核酸序列的载体。

24.根据权利要求21所述的分离的重组宿主细胞，其中所述宿主细胞选自由以下组成的组：细菌、酵母、不是黑粉菌属(Ustilago)的真菌、藻青菌、藻类和植物细胞。

25.根据权利要求21所述的分离的重组宿主细胞，其中所述宿主细胞选自由以下组成的微生物组：埃希氏菌属(Escherichia)；沙门氏菌属(Salmonella)；芽孢杆菌属(Bacillus)；不动杆菌属(Acinetobacter)；链霉菌属(Streptomyces)；棒状杆菌属(Corynebacterium)；甲基弯曲菌属(Methylosinus)；甲基单胞菌属(Methylomonas)；红球菌属(Rhodococcus)；假单胞菌属(Pseudomonas)；红杆菌属(Rhodobacter)；集胞藻属(Synechocystis)；酵母菌属(Saccharomyces)；接合酵母菌属(Zygosaccharomyces)；克鲁维酵母菌属(Kluyveromyces)；假丝酵母菌属(Candida)；汉逊氏酵母菌属(Hansenula)；德巴利氏酵母菌属(Debaryomyces)；毛霉菌属(Mucor)；毕赤酵母菌属(Pichia)；球拟酵母菌属(Torulopsis)；曲霉菌属(Aspergillus)；节丛孢属(Arthrobotlys)；短杆菌属(Brevibacteria)；微杆菌属(Microbacterium)；节杆菌属(Arthrobacter)；柠檬酸杆菌属(Citrobacter)；克雷伯菌属(Klebsiella)；泛菌属(Pantoea)；以及梭菌属(Clostridium)。