CN116867894A - 由异丁香酚生物合成香草醛 - Google Patents

由异丁香酚生物合成香草醛 Download PDF

Info

Publication number
CN116867894A
CN116867894A CN202180087914.4A CN202180087914A CN116867894A CN 116867894 A CN116867894 A CN 116867894A CN 202180087914 A CN202180087914 A CN 202180087914A CN 116867894 A CN116867894 A CN 116867894A
Authority
CN
China
Prior art keywords
vanillin
isoeugenol
seq
identity
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180087914.4A
Other languages
English (en)
Inventor
R·周
J·马
O·于
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN116867894A publication Critical patent/CN116867894A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/33Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds containing oxygen
    • A61K8/34Alcohols
    • A61K8/347Phenols
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/20Organic compounds containing oxygen
    • C11D3/2072Aldehydes-ketones
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/50Perfumes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
    • C12Y113/11Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of two atoms of oxygen (1.13.11)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2800/00Properties of cosmetic compositions or active ingredients thereof or formulation aids used therein and process related aspects
    • A61K2800/10General cosmetic use
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q13/00Formulations or additives for perfume preparations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Emergency Medicine (AREA)
  • Nutrition Science (AREA)
  • Dermatology (AREA)
  • Polymers & Plastics (AREA)
  • Food Science & Technology (AREA)
  • Birds (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开总体上涉及使用异丁香酚作为底物通过生物转化产生天然香草醛。更具体地,本发明的方法利用真菌性异丁香酚单加氧酶催化异丁香酚生物转化为香草醛,这可以在细胞系统(例如,细菌或酵母)中或在不使用细胞系统的酶促反应混合物中进行。

Description

由异丁香酚生物合成香草醛
相关申请的交叉引用
本申请要求于2020年12月18日提交的美国临时专利申请第63/127,503号的权益,所述美国临时专利申请通过引用整体并入本文。
序列表
本申请包含已经以ASCII格式以电子方式提交并且以全文引用的方式特此并入的序列表。创建于2021年12月17日的所述ASCII副本命名为074008_2040_00_WO_000326_SL.txt并且大小为19,847字节。
技术领域
本公开总体上涉及使用异丁香酚作为底物通过生物转化产生天然香草醛。
背景技术
香草香精是全世界最频繁使用的香精之一。其被用于多种食物的调味剂,如冰淇淋、乳制品、甜点、糖果、烘焙产品和烈酒。其还用于香水、药物和个人卫生用品。
传统上已经从香草兰的发酵豆荚中获得天然香草香精。其主要是在豆类收获后数周的干燥和发酵过程期间通过豆类中存在的香草醛葡糖苷的水解而形成。香草香精的主要芳香物质是香草醛(4-羟基3-甲氧基苯甲醛)。
香草醛是最常见的香精化学品之一,并且广泛用于食物和饮料、香水、制药和医疗行业。每年消耗约12,000吨香草醛,其中仅20-50吨是从香草豆中提取的,其余主要是从如愈创木酚和木质素等石油化学产品中合成产生的。近年来,对天然香精的需求不断增加,导致香精行业通过生物转化生产香草醛,因为当从如活细胞或其酶等生物来源生产时,这种生物转化的产品被各监管和立法机构(例如,欧洲共同体立法(European CommunityLegislation))视为天然的,并且可以作为“天然产品”销售。
天然异丁香酚可以从精油中提取,并且用于通过酶促转化或微生物生物转化产生香草醛是经济的。已经广泛报道了在许多微生物,包含黑曲霉(Aspergillus niger)、枯草芽孢杆菌(Bacillus subtilis)和恶臭假单胞菌(Pseudomonas putida)中通过异丁香酚的转化产生香草醛。然而,所报道的通过这些微生物产生的滴度非常低(低于2g/L),极大地限制了这种方法在工业中的实际应用。此外,所报道的生物转化过程复杂,进一步增加了香草醛的生产成本。
因此,本领域需要具有更高滴度和转化率的用于产生香草醛的更具成本效益的方法。
发明内容
本发明人通过鉴定真菌性异丁香酚单加氧酶解决了上述问题,所述真菌性异丁香酚单加氧酶与先前报道的用于产生香草醛的异丁香酚单加氧酶具有非常低的序列同一性。从玉米黑粉菌(Ustilago maydis)中鉴定出的真菌性异丁香酚单加氧酶(UmIEM)在将异丁香酚转化为香草醛方面表现出令人惊讶的高活性。构建了携带所述UmIEM基因的表达质粒,并开发了工程化宿主菌株并用于以高滴度和高转化率从异丁香酚中产生香草醛。由所述UmIEM基因表达的重组蛋白也可以分离和纯化,并且用于在体外将异丁香酚转化为香草醛。
因此,一方面,本公开涉及产生香草醛的生物转化方法。所述方法可以包括在混合物中表达UmIEM基因,将异丁香酚添加到混合物中,以及将异丁香酚转化为香草醛。在一些实施例中,所表达的UmIEM基因可以具有与SEQ ID NO:2具有至少60%同一性、与SEQ IDNO:2具有至少65%同一性、与SEQ ID NO:2具有至少70%同一性、与SEQ ID NO:2具有至少75%同一性、与SEQ ID NO:2具有至少80%同一性、与SEQ ID NO:2具有至少85%同一性、与SEQ ID NO:2具有至少90%同一性、与SEQ ID NO:2具有至少95%同一性或与SEQ ID NO:2具有至少99%同一性的氨基酸序列。在一些实施例中,所表达的UmIEM基因可以具有与SEQID NO:2相同的氨基酸序列。
在各个实施例中,所述生物转化方法可以包含通过体外翻译表达UmIEM基因。在替代性实施例中,所述生物转化方法可以包含在细胞系统中表达UmIEM基因。在某些实施例中,所述生物转化方法可以包含在细菌或酵母细胞中表达UmIEM基因。所述生物转化方法可以包含对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。在一些实施例中,可以将经纯化的重组蛋白作为生物催化剂添加到含有异丁香酚的反应混合物中。在一些实施例中,异丁香酚可以直接进料到其中表达UmIEM基因的混合物中。
本文所描述的生物转化方法可以包含从混合物中回收香草醛。可以根据本领域已知的任何常规分离或纯化方法进行香草醛的回收。在回收香草醛之前,所述方法还可以包含从混合物中去除生物质(酶、细胞材料等)。
一方面,本公开涉及使用分离的重组宿主细胞产生香草醛的方法,其中已经用核酸构建体转化了分离的重组宿主细胞,所述核酸构建体包含能够编码异丁香酚单加氧酶的多核苷酸序列。例如,异丁香酚单加氧酶可以具有与SEQ ID NO:2具有至少60%同一性、与SEQ ID NO:2具有至少65%同一性、与SEQ ID NO:2具有至少70%同一性、与SEQ ID NO:2具有至少75%同一性、与SEQ ID NO:2具有至少80%同一性、与SEQ ID NO:2具有至少85%同一性、与SEQ ID NO:2具有至少90%同一性、与SEQ ID NO:2具有至少95%同一性或与SEQID NO:2具有至少99%同一性的氨基酸序列。在一些实施例中,异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中,所述方法可以包含:(i)在培养基中培养分离的重组宿主细胞;(ii)向所述培养基中添加异丁香酚以开始将异丁香酚生物转化为香草醛;以及(iii)从所述培养基中提取香草醛。在其它实施例中,所述方法可以包含:(i)在培养基中培养分离的重组宿主细胞,以允许异丁香酚单加氧酶的表达;(ii)分离所述异丁香酚单加氧酶;(iii)将分离的异丁香酚单加氧酶添加到包含异丁香酚的反应混合物中;以及(iv)从反应培养基中提取香草醛。
一方面,本公开涉及使用核酸构建体转化的分离的重组宿主细胞,所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列,其中所述异丁香酚单加氧酶具有与SEQ IDNO:2具有至少60%同一性、与SEQ ID NO:2具有至少65%同一性、与SEQ ID NO:2具有至少70%同一性、与SEQ ID NO:2具有至少75%同一性、与SEQ ID NO:2具有至少80%同一性、与SEQ ID NO:2具有至少85%同一性、与SEQ ID NO:2具有至少90%同一性、与SEQ ID NO:2具有至少95%同一性或与SEQ ID NO:2具有至少99%同一性的氨基酸序列。在一些实施例中,异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中,核酸构建体可以含有多核苷酸序列,所述多核苷酸序列包含与SEQ ID NO:1的核酸序列至少70%相同、与SEQ ID NO:1的核酸序列至少75%相同、与SEQ ID NO:1的核酸序列至少80%相同、与SEQ ID NO:1的核酸序列至少85%相同、与SEQ ID NO:1的核酸序列至少90%相同或与SEQID NO:1的核酸序列至少95%相同的序列。在一些实施例中,核酸构建体可以含有与SEQ IDNO:1相同的多核苷酸序列。在一些实施例中,分离的重组宿主细胞可以包含含有SEQ IDNO:4的分离的核酸序列的载体。在各个实施例中,宿主细胞可以选自由以下组成的组:细菌、酵母、不是黑粉菌属(Ustilago)的真菌、藻青菌、藻类和植物细胞。例如,宿主细胞可以选自由以下组成的微生物组:埃希氏菌属(Escherichia);沙门氏菌属(Salmonella);芽孢杆菌属(Bacillus);不动杆菌属(Acinetobacter);链霉菌属(Streptomyces);棒状杆菌属(Corynebacterium);甲基弯曲菌属(Methylosinus);甲基单胞菌属(Methylomonas);红球菌属(Rhodococcus);假单胞菌属(Pseudomonas);红杆菌属(Rhodobacter);集胞藻属(Synechocystis);酵母菌属(Saccharomyces);接合酵母菌属(Zygosaccharomyces);克鲁维酵母菌属(Kluyveromyces);假丝酵母菌属(Candida);汉逊氏酵母菌属(Hansenula);德巴利氏酵母菌属(Debaryomyces);毛霉菌属(Mucor);毕赤酵母菌属(Pichia);球拟酵母菌属(Torulopsis);曲霉菌属(Aspergillus);节丛孢属(Arthrobotlys);短杆菌属(Brevibacteria);微杆菌属(Microbacterium);节杆菌属(Arthrobacter);柠檬酸杆菌属(Citrobacter);克雷伯菌属(Klebsiella);泛菌属(Pantoea);以及梭菌属(Clostridium)。
可以收集使用本文所描述的方法和/或分离的重组宿主细胞产生的香草醛并将其掺入到可消费产品中。例如,香草醛可以与可消费产品混合。在一些实施例中,香草醛可以以足以在可消费产品中赋予、改变、促进或增强期望的味道、风味或感觉或隐藏、改变或最小化不期望的味道、风味或感觉的量掺入到可消费产品中。可消费产品例如可以选自由以下组成的组:食物、食物成分、食物添加剂、饮料、药物和烟草。在一些实施例中,香草醛可以以足以在可消费产品中赋予、改变、促进或增强期望的香味或气味或隐藏、改变或最小化不期望的香味或气味的量掺入到可消费产品中。可消费产品例如可以选自由以下组成的组:芳香剂、化妆品、浴室用品、家庭和身体护理、洗涤剂、驱虫剂、化肥、空气清新剂和肥皂。
第一实施例是用于产生香草醛的生物转化方法,所述方法包括:在混合物中表达UmIEM基因,其中所述UmIEM基因的所表达的蛋白具有与所述混合物中的SEQ ID NO:2具有至少70%同一性的氨基酸序列;将异丁香酚进料到所述混合物中;以及将异丁香酚转化为香草醛。
第二实施例是根据第一实施例所述的方法,其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少80%同一性的氨基酸序列。
第三实施例是根据第一实施例所述的方法,其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少90%同一性的氨基酸序列。
第四实施例是根据第一实施例所述的方法,其中所表达的UmIEM蛋白具有与SEQID NO:2具有至少95%同一性的氨基酸序列。
第五实施例是根据第一至第四实施例所述的方法,其中表达所述UmIEM基因的步骤选自由以下组成的组:通过体外翻译表达所述基因;在细胞系统中表达所述基因;以及在细菌或酵母细胞中表达所述基因。
第六实施例是根据第五实施例所述的方法,其进一步包括对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。
第七实施例是根据第一至第六实施例所述的方法,其进一步包括收集所述香草醛。
第八实施例是根据第七实施例所述的方法,其中从异丁香酚到香草醛的转化率高于80%。
第九实施例是根据第七实施例所述的方法,其中从异丁香酚到香草醛的转化率高于85%。
第十实施例是根据第七实施例所述的方法,其中从异丁香酚到香草醛的转化率高于90%。
第十一实施例是一种使用分离的重组宿主细胞产生香草醛的方法,所述方法包括以下步骤:(i)在培养基中培养分离的重组宿主细胞;(ii)将异丁香酚添加到(i)的所述培养基中,以开始将异丁香酚生物转化为香草醛;以及(iii)从所述培养基中提取香草醛,其中已使用包括编码异丁香酚单加氧酶的多核苷酸序列的核酸构建体转化所述分离的重组宿主细胞,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少70%同一性的氨基酸序列。
第十二实施例是根据第十一实施例所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少80%同一性的氨基酸序列。
第十三实施例是根据第十一实施例所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少90%同一性的氨基酸序列。
第十四实施例是根据第十一实施例所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少95%同一性的氨基酸序列。
第十五实施例是一种制造可消费产品的方法,所述方法包括以下步骤:根据第一至第十四实施例所述的方法产生香草醛,包含以下步骤:收集所述香草醛;以及将所述香草醛掺入可消费产品中。
第十六实施例是根据第十五实施例所述的方法,其包括将所述香草醛与所述可消费产品混合的步骤。
第十七实施例是根据第十五或第十六实施例所述的方法,其中所述香草醛以足以赋予风味调性的量掺入所述可消费产品中。
第十八实施例是根据第十五至第十七实施例所述的方法,其中所述可消费产品选自由以下组成的组:风味产品、食物产品、食物前体产品、在食物的生产中采用的添加剂、药物组合物、膳食补充剂、营养品和化妆品。
第十九实施例是根据第十五或第十六实施例所述的方法,其中所述香草醛以足以赋予香气调性的量掺入所述可消费产品中。
第二十实施例是根据第十五、第十六或第十九实施例中任一项所述的方法,其中所述可消费产品选自由以下组成的组:芳香产品、化妆品、卫生间产品和房屋清洁产品。
第二十一实施例一种使用核酸构建体转化的分离的重组宿主细胞,所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列,其中所述异丁香酚单加氧酶具有与SEQ IDNO:2具有至少70%同一性的氨基酸序列。
第二十二实施例是根据第二十一实施例所述的分离的重组宿主细胞,其中所述多核苷酸序列包括与SEQ ID NO:1的核酸序列至少90%相同的序列。
第二十三实施例是根据第二十一或第二十二实施例所述的分离的重组宿主细胞,其进一步包括含有SEQ ID NO:4的分离的核酸序列的载体。
第二十四实施例是根据第二十一第二十三实施例所述的分离的重组宿主细胞,其中所述宿主细胞选自由以下组成的组:细菌、酵母、不是黑粉菌属的真菌、藻青菌、藻类和植物细胞。
第二十五实施例是根据第二十一至第二十四实施例所述的分离的重组宿主细胞,其中所述宿主细胞选自由以下组成的微生物组:埃希氏菌属;沙门氏菌属;芽孢杆菌属;不动杆菌属;链霉菌属;棒状杆菌属;甲基弯曲菌属;甲基单胞菌属;红球菌属;假单胞菌属;红杆菌属;集胞藻属;酵母菌属;接合酵母菌属;克鲁维酵母菌属;假丝酵母菌属;汉逊氏酵母菌属;德巴利氏酵母菌属;毛霉菌属;毕赤酵母菌属;球拟酵母菌属;曲霉菌属;节丛孢属;短杆菌属;微杆菌属;节杆菌属;柠檬酸杆菌属;克雷伯菌属;泛菌属;以及梭菌属。
本发明的其它特征和优点将在以下参照附图的详细描述中变得明显。
附图说明
图1展示了从异丁香酚到香草醛的酶促途径。
图2提供了根据本公开的UmIEM-pET28a质粒构建体的示意图。
图3是示出所表达的UmIEM的重组蛋白的纯化的SDS-PAGE图片。
图4是示出通过UmIEM的基因产物将异丁香酚生物转化为香草醛的HPLC色谱图。上图是使用UmIEM的经纯化的基因产物获得的。下图是使用热变性的UmIEM酶作为阴性对照获得的。
图5示出了根据本教导的在摇瓶中通过转化的大肠杆菌(E.coli)菌株ISEG-V224以异丁香酚为底物产生香草醛。
图6示出了根据本教导的在5升发酵罐中通过转化的大肠杆菌菌株ISEG-V224以异丁香酚为底物产生香草醛。
序列简要说明
表1简要描述了本文和所附序列表中所公开的序列。如本领域技术人员已知的,注意到原核生物使用交替的起始密码子,主要是GUG和UUG,其被翻译为甲酰甲硫氨酸。
具体实施方式
如本文所使用的,除非内容另外明确指出,否则单数形式“一个/种(a/an)”以及“所述(the)”包含复数指示物。
就描述或权利要求中使用的术语“包含”、“具有”等而言,此类术语旨在以类似于术语“包括”的方式具有包容性,因为“包括”是在权利要求中用作过渡词时被解释。
“示例性”一词在本文中意指充当示例、实例或说明。在本文中描述为“示例性”的任何实施例不必被解释为比其它实施例更优选或有利。
“生物转化”在本文中是指产物的细胞产生,例如,通过体内产生,在细胞培养物中的宿主细胞中,如微生物宿主细胞中,所述细胞产生可以任选地与进一步的生物合成产生步骤(例如,在不同于先前的宿主细胞的宿主细胞)组合,和/或例如通过体外反应与化学合成反应组合。贯穿整个说明书,术语“生物转化(bioconversion)”可以与术语“生物转化(biotransformation)”和/或“生物合成(biosynthesis/biosynthetic)”可互换地使用。
“细胞系统”是提供异位蛋白质的表达的任何细胞。细胞系统包含细菌、酵母、植物细胞和动物细胞。细胞系统包含原核细胞和真核细胞两者。细胞系统还包含基于如核糖体等细胞组分的蛋白质的体外表达。
“编码序列”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指编码特定氨基酸序列的DNA序列。
“生长”或“培养”细胞系统包含提供将会允许细胞繁殖和分裂的适合的培养基。“生长”或“培养”细胞系统还包含提供资源使得细胞或细胞组分可以转译和制备重组蛋白。
酵母是被分类为真菌界成员的真核单细胞微生物。酵母是从多细胞祖先进化而来的单细胞生物,但是其中可用于本发明的一些物种是能够通过形成称为假菌丝(pseudohyphae/false hyphae)的连接芽殖细胞串来发展多细胞特性的那些。
术语“互补”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于描述能够相互杂交的核苷酸碱基之间的关系。例如,相对于DNA,腺苷与胸腺嘧啶互补,并且胞嘧啶与鸟嘌呤互补。因此,主题技术还包含分离的核酸片段,其与随附的序列表中报道的完整序列以及那些基本上类似的核酸序列互补。
术语“核酸”和“核苷酸”应赋予本领域普通技术人员其相应的普通和惯用含义,并且用于但不限于指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。除非具体限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,所述已知类似物具有与参考核酸类似的结合性质并且以与天然存在的核苷酸类似的方式代谢。除非另有说明,否则特定核酸序列还明确涵盖其保守修饰或简并的变体(例如,简并密码子取代)和互补序列以及明确指明的序列。
术语“分离的”应赋予本领域普通技术人员其普通和习惯的含义,并且当在分离的核酸或分离的多肽的上下文中使用时,用于但不限于指代通过人为手段脱离其自然环境而存在并且因此不是自然产物的核酸或多肽。分离的核酸或多肽可以以纯化形式存在,或者可以存在于非天然环境,例如转基因宿主细胞中。
如本文所使用的,术语“温育(incubating/incubation)”是指混合两种或更多种化学或生物实体(如化学化合物和酶)并允许其在有利于产生香草醛的条件下相互作用的过程。
术语“简并变体”是指具有与参考核酸序列相差一个或多个简并密码子取代的残基序列的核酸序列。简并密码子取代可以通过产生一个或多个所选(或全部)密码子的第三位用混合碱基和/或脱氧肌苷残基取代的序列实现。核酸序列及其所有简并变体将表达相同的氨基酸或多肽。
术语“多肽”、“蛋白质”和“肽”应赋予本领域普通技术人员其相应的普通和惯用含义;这三个术语有时可互换地使用,并且用于但不限于指代氨基酸的聚合物或氨基酸类似物,无论其大小或功能如何。尽管“蛋白质”经常用于指代相对大的多肽,并且“肽”经常用于指代小的多肽,但是这些术语在本领域中的使用是重叠和变化的。除非另有说明,否则如本文所使用的术语“多肽”是指肽、多肽和蛋白质。当提及多核苷酸产物时,术语“蛋白质”、“多肽”和“肽”在本文中可互换使用。因此,示例性多肽包含多核苷酸产物、天然存在的蛋白质、同源物、直系同源物、旁系同源物、片段以及前述的其它等同物、变体和类似物。
当关于参考多肽使用时,术语“多肽片段”和“片段”应赋予本领域普通技术人员其普通和惯用含义,并且用于但不限于指代与参考多肽自身相比,其中缺失氨基酸残基、但其中剩余氨基酸序列通常与参考多肽中对应位置相同的多肽。此类缺失可以发生在参考多肽的氨基末端或羧基末端处,或可替代地发生在以上二者处。
术语多肽或蛋白质的“功能片段”是指作为全长多肽或蛋白质的一部分的肽片段,并且具有与全长多肽或蛋白质基本上相同的生物学活性或执行基本上相同的功能(例如,进行相同的酶促反应)。
可互换地使用的术语“变体多肽”、“经修饰的氨基酸序列”或“经修饰的多肽”是指与参考多肽相差一个或多个氨基酸,例如一个或多个氨基酸取代、缺失和/或添加的氨基酸序列。一方面,变体是保留参考多肽的一些或全部能力的“功能变体”。
术语“功能变体”进一步包含保守取代的变体。术语“保守取代的变体”是指具有与参考肽相差一个或多个保守氨基酸取代并保持所述参考肽的部分或全部活性的氨基酸序列的肽。“保守氨基酸取代”是用功能上类似的残基取代氨基酸残基。保守取代的实例包含一个非极性(疏水性)残基(如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸)取代另一个;一个带电荷或极性(亲水性)残基取代另一个,如精氨酸与赖氨酸之间、谷氨酰胺与天冬酰胺之间、苏氨酸与丝氨酸之间;一个碱性残基(如赖氨酸或精氨酸)取代另一个;或者一个酸性残基(如天冬氨酸或谷氨酸)取代另一个;或者一个芳香族残基(如苯丙氨酸、酪氨酸或色氨酸)取代另一个。预期此类取代对蛋白质或多肽的表观分子量或等电点的影响很小或没有影响。短语“保守取代的变体”还包含其中残基被化学衍生的残基替代的肽,前提是所得肽保持如本文所描述的参考肽的部分或全部活性。
与本主题技术的多肽相关的术语“变体”进一步包含具有与参考多肽的氨基酸序列至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%以及甚至100%相同的氨基酸序列的功能活性多肽。
术语“同源”在其所有语法形式和拼写变体中都是指具有“共同进化起源”的多核苷酸或多肽之间的关系,包含来自超家族的多核苷酸和多肽和来自不同物种的同源多核苷酸或蛋白质(Reeck等人,《细胞(Cell)》50:667,1987)。此类多核苷酸或多肽具有序列同源性,如其序列相似性所反映的,无论是在同一性百分比方面还是在保守位置处的特定氨基酸或基序的存在方面。例如,两种同源多肽可以具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%以及甚至100%相同的氨基酸序列。
“合适的调节序列”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列,并且其影响相关编码序列的转录、RNA加工或稳定性或翻译。调节序列可以包含启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。
“启动子”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代能够控制编码序列或功能性RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'。启动子可以全部来源于天然基因,或者由来源于在自然界中发现的不同启动子的不同元件构成,或者甚至包括合成DNA片段。本领域技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的表达。使基因在大多数时间在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下调节序列的确切界限尚未完全限定,因此不同长度的DNA片段可以具有相同的启动子活性。
术语“可操作地连接”是指单一核酸片段上的核酸序列的缔合,使得一者的功能受另一者影响。例如,当启动子能够影响编码序列的表达(即,编码序列在启动子的转录控制之下)时,所述启动子与所述编码序列可操作地连接。编码序列可以按照有义或反义定向与调控序列可操作地连接。
如本文所使用的,术语“表达”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代来源于本主题技术的核酸片段的有义(mRNA)或反义RNA的转录和稳定累积。“过表达”是指转基因生物体或重组生物体中的基因产物的产生超过正常或未经转化的生物体中的产生水平。
“转化”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代将多核苷酸转移到靶细胞中。经转移的多核苷酸可以掺入到靶细胞的基因组或染色体DNA中,从而引起遗传稳定的遗传,或者其可以独立于宿主染色体进行复制。含有经转化的核酸片段的宿主生物体被称为“转基因”或“经转化”或“重组”。
术语“经转化”、“转基因”和“重组”当在本文中与宿主细胞结合使用时,应赋予本领域普通技术人员其相应的普通和惯用含义,并且用于但不限于指代其中引入了异源核酸分子的宿主生物体的细胞,如植物或微生物细胞。核酸分子可以稳定地整合到宿主细胞的基因组中,或者核酸分子可以作为染色体外分子存在。此类染色体外分子可以自动复制。经转化的细胞、组织或对象被理解为不仅涵盖转化过程的最终产物,而且涵盖其转基因后代。
术语“重组”、“异源”和“外源”当在本文中与多核苷酸结合使用时,应赋予本领域普通技术人员其普通和惯用含义,并且用于但不限于指代多核苷酸(例如,DNA序列或基因)来源于对于特定宿主细胞来说是外源来源,或者如果来自相同来源,则从其原始形式修饰而来。因此,宿主细胞中的异源基因包含特定宿主细胞内源性但已通过例如定点诱变或其它重组技术的使用进行修饰的基因。这些术语还包含天然存在的DNA序列的非天然存在的多个拷贝。因此,这些术语是指对于细胞来说是外源的或异源的,或与细胞同源但在宿主细胞内通常不存在此元件的位置或形式的DNA片段。
类似地,术语“重组”、“异源”和“外源”当在本文中与多肽或氨基酸序列结合使用时,意指源自对特定宿主细胞来说是外源来源的多肽或氨基酸序列,或者如果来自相同来源,则从其原始形式修饰而来。因此,重组DNA片段可以在宿主细胞中表达以产生重组多肽。
“蛋白质表达”是指在基因表达之后发生的蛋白质产生。蛋白质产生由将DNA转录为信使RNA(mRNA)后的阶段组成。然后将mRNA翻译成多肽链,所述多肽链最终折叠成蛋白质。DNA通过转染-将核酸有意地引入到细胞中的过程-而存在于细胞中。此术语常用于真核细胞中的非病毒方法。此术语还可以指其它方法和细胞类型,但优选其它术语:“转化”更常用于描述细菌、包含植物细胞在内的非动物真核细胞中的非病毒DNA转移。在动物细胞中,转染是优选的术语,因为转化还用于指在这些细胞中发展成癌性状态(致癌作用)。转导常用于描述病毒介导的DNA转移。转化、转导和病毒性感染包含在本申请的转染定义下。
术语“质粒”、“载体”和“盒”应赋予本领域普通技术人员其相应的普通和惯用含义,并且用于但不限于指代通常携带基因的额外染色体元件,这些基因不是细胞的中央代谢的一部分,并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已经连接或重组成独特的构建,其能够将所选基因产物的启动子片段和DNA序列连同适当的3'非翻译序列引入到细胞中。“转化盒”是指含有外源基因并且具有除外源基因之外促进特定宿主细胞转化的元件的特定载体。“表达盒”是指含有外源基因并且具有除外源基因之外允许此基因在外源宿主中增强表达的元件的特定载体。
如本文所使用的,“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分例如核苷酸或氨基酸的整个比对窗口中不变的程度。测试序列和参考序列的比对区段的“同一性分数”是两个比对序列共享的完全相同的组分的数量除以参考序列区段即整个参考序列或参考序列的较小定义部分中的组分总数。
如本文所使用的,术语“序列同一性百分比”或“同一性百分比”是指在两个序列进行最佳比对(在比较窗口上,适合的核苷酸插入、删除或间隙总计小于参考序列的20%)时参考(“查询”)多核苷酸分子(或其互补链)与测试(“受试者”)多核苷酸分子(或其互补链)相比线性多核苷酸序列中完全相同的核苷酸的百分比。用于比对比较窗口的最佳序列比对是本领域技术人员熟知的,并且可以通过如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法等工具来执行,并且优选地通过这些算法的计算机化实施方式,如作为Wisconsin/>(马萨诸塞州柏林顿的Accelrys公司(Accelrys Inc.))的一部分可得到的GAP、BESTFIT、FASTA和TFASTA来执行。测试序列和参考序列的比对区段的“同一性分数”是两个比对序列共享的完全相同的组分的数量除以参考序列区段即整个参考序列或参考序列的较小定义部分中的组分总数。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其部分的比较或者与更长的多核苷酸序列的比较。出于本发明的目的,还可以使用用于翻译核苷酸序列的BLASTX 2.0版和用于多核苷酸序列的BLASTN 2.0版来确定“同一性百分比”。
序列同一性百分比优选使用Sequence Analysis Software PackageTM(第10版;威斯康星州麦迪逊的遗传学计算机集团公司(Genetics Computer Group,Inc.))的“最佳拟合(Best Fit)”或“间隙(Gap)”程序来确定。“间隙”利用Needleman和Wunsch的算法(Needleman和Wunsch,《分子生物学杂志(Journal of Molecular Biology)》48:443-453,1970)来找到两个序列的比对,所述比对将匹配数最大化并将空位数最小化。“最佳拟合”使用Smith和Waterman的局部同源性算法(Smith和Waterman,《应用数学进展(Advances inApplied Mathematics)》,2:482-489,1981;Smith等人,《核酸研究(Nucleic AcidsResearch)》11:2205-2220,1983)来进行在两个序列之间具有相似性的最佳区段的最佳比对,并插入间隙以最大化匹配数。最优选使用“最佳拟合”程序来确定百分比同一性。
用于确定序列同一性的有用方法还公开在局部比对搜索基本工具(BLAST)程序中,所述局部比对搜索基本工具程序可从位于马里兰州贝塞斯达国家卫生研究所国家医学图书馆(National Library of Medicine,National Institute of Health,Bethesda,Md.)的国家生物技术信息中心(National Center Biotechnology Information,NCBI),20894获得;参见《BLAST手册(BLAST Manual)》,Altschul等人,NCBI,NLM,NIH;Altschul等人,《分子生物学杂志(J.Mol.BIOL)》.215:403-410(1990);BLAST程序的2.0版或更高版本允许将间隙(缺失和插入)引入到比对中;对于肽序列,可以使用BLASTX来确定序列同一性;并且对于多核苷酸序列,可以使用BLASTN来确定序列同一性。
如本文所使用的,术语“相当大的序列同一性百分比”是指序列同一性百分比为至少约70%序列同一性、至少约80%序列同一性、至少约85%序列同一性、至少约90%序列同一性、或甚至更大的序列同一性如约98%或约99%序列同一性。因此,本发明的一个实施例是与本文所述的多核苷酸序列具有至少约70%序列同一性、至少约80%序列同一性、至少约85%序列同一性、至少约90%序列同一性或甚至更大的序列同一性如约98%或约99%序列同一性的多核苷酸分子。具有本发明的活性基因的多核苷酸分子能够引导产生香草醛,与本文所提供的多核苷酸序列具有相当大的序列同一性,并且涵盖在本发明的范围内。
同一性是在序列比对(所述比对可以使用仅序列信息或结构信息或其它某个信息来完成,但其通常是单独基于序列信息)后一对序列之间相同的氨基酸分数,并且相似性是基于使用某个相似性矩阵的比对分配的得分。相似性指数可以是以下中的任一个:BLOSUM62、PAM250或GONNET,或本领域技术人员用于蛋白质序列比对的任何矩阵。
同一性是两个子序列之间的对应程度(序列之间没有间隙)。25%或更高的同一性意味着功能的相似性,而18%-25%意味着结构或功能的相似性。请记住,两个完全不相关的或随机的序列(大于100个残基)可以具有高于20%的同一性。相似性是在比较两个序列时这两个序列之间的相似程度。这取决于其同一性。
编码核酸序列
本发明涉及编码如本文所描述的异丁香酚单加氧酶的核酸序列,并且其可以用于进行所需的基因工程操纵。本发明还涉及与本文具体公开的序列具有一定程度“同一性”的核酸。例如,本发明的各方面涵盖具有与SEQ ID NO:1具有至少60%同一性、与SEQ ID NO:1具有至少65%同一性、与SEQ ID NO:1具有至少70%同一性、与SEQ ID NO:1具有至少75%同一性、与SEQ ID NO:1具有至少80%同一性、与SEQ ID NO:1具有至少85%同一性、与SEQID NO:1具有至少90%同一性、与SEQ ID NO:1具有至少95%同一性或与SEQ ID NO:1具有至少99%同一性的核酸序列。在一些实施例中,用于编码可用于本发明的异丁香酚单加氧酶的核酸序列可以具有与SEQ ID NO:1相同的核酸序列。
本发明还涉及编码与SEQ ID NO:2具有至少60%同一性、与SEQ ID NO:2具有至少65%同一性、与SEQ ID NO:2具有至少70%同一性、与SEQ ID NO:2具有至少75%同一性、与SEQ ID NO:2具有至少80%同一性、与SEQ ID NO:2具有至少85%同一性、与SEQ ID NO:2具有至少90%同一性、与SEQ ID NO:2具有至少95%同一性或与SEQ ID NO:2具有至少99%同一性的氨基酸序列的异丁香酚单加氧酶的核酸序列。在一些实施例中,异丁香酚单加氧酶可以具有与SEQ ID NO:2相同的氨基酸序列。在一些实施例中,本发明可以涉及编码前述中任一者的功能等同物的核酸序列。
根据本发明的构建体
在一些方面,本发明涉及用于表达异丁香酚单加氧酶的构建体,如表达载体。
在一实施例中,表达载体包含用于在各种宿主细胞中表达本文所描述的重组多肽(即,UmIEM)的那些遗传元件。用于宿主细胞中的转录和翻译的元件可以包含启动子、蛋白质复合物的编码区和转录终止子。
本领域普通技术人员将了解可用于制备表达载体的分子生物学技术。如上文所描述的,用于掺入到主题技术的表达载体中的多核苷酸可以通过常规技术,如聚合酶链式反应(PCR)来制备。在分子克隆中,载体是用作媒剂的DNA分子,用于将外源遗传物质人工携带到另一个细胞中,在那里其可以复制和/或表达(例如,质粒、粘粒、λ噬菌体)。含有外源DNA的载体被认为是重组DNA。载体的四种主要类型为质粒、病毒载体、粘粒和人工染色体。其中,最常用的载体是质粒。所有工程化载体的共同点是复制起点、多克隆位点和可选择标志物。
已经开发了通过互补的内聚末端将DNA可操作地连接至载体的各种分子生物学技术。在一个实施例中,可以将互补的同聚物束添加到要插入到载体DNA中的核酸分子中。载体和核酸分子然后通过互补均聚物尾部之间的氢键连接以形成重组DNA分子。
在一替代性实施例中,包含所提供的一个或多个限制性位点的合成接头用于将主题技术的多核苷酸可操作地连接至表达载体。在一实施例中,多核苷酸通过限制性核酸内切酶消化产生。在一实施例中,核酸分子用噬菌体T4 DNA聚合酶或大肠杆菌DNA聚合酶I处理,这些酶以其3'-5'核酸外切活性去除突出的3'单链端,并以其聚合活性填充凹陷的3'端,由此产生齐平端DNA片段。然后,在存在能够催化齐平端DNA分子连接的酶(如噬菌体T4DNA连接酶)的情况下,将齐平端片段与大摩尔过量接头分子一起温育。因此,反应的产物是在其末端处携带聚合接头序列的多核苷酸。然后用合适的限制酶切割这些多核苷酸,并连接至表达载体,所述表达载体已经用产生与多核苷酸的末端相容的末端的酶切割。
可替代地,可以采用具有不依赖连接的克隆(LIC)位点的载体。然后可以将所需的PCR扩增的多核苷酸克隆到LIC载体中,而无需限制性消化或连接(Aslanidis和de Jong,《核酸研究(NUCL.ACID RES)》.18 6069-74,(1990);Haun等人,《生物技术(Biotechniques)》13,515-18(1992),所述文献中的每一个均通过引用并入本文)。
在一实施例中,为了分离和/或修饰所关注多核苷酸以插入到所选质粒中,适于使用PCR。可以设计用于序列的PCR制备的合适引物,以分离所需的核酸分子的编码区,添加限制性核酸内切酶或LIC位点,并将编码区放置在期望的阅读框中。
在一实施例中,使用适合PCR的寡核苷酸引物制备用于掺入到主题技术的表达载体中的多核苷酸。编码区被扩增,同时引物本身掺入到经扩增的序列产物中。在一实施例中,扩增引物含有限制性核酸内切酶识别位点,其允许将经扩增的序列产物克隆到合适的载体中。
可以通过常规转化或转染技术将表达载体引入到微生物或植物宿主细胞中。使用本领域技术的表达载体转化合适的细胞是通过本领域已知的方法完成的,并且通常取决于载体和细胞两者的类型。合适的技术包含磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、化学穿孔(chemoporation)或电穿孔。
/*成功转化的细胞,即那些含有表达载体的细胞,可以通过本领域熟知的技术来鉴定。例如,可以培养用主题技术的表达载体转染的细胞以产生本文所描述的多肽。可以通过本领域熟知的技术检查细胞中表达载体DNA的存在。
宿主细胞可以含有先前所描述的表达载体的单个拷贝,或者可替代地,表达载体的多个拷贝。
在一些实施例中,经转化的细胞是细菌细胞、植物细胞、藻类细胞、不是黑粉菌属的真菌细胞或酵母细胞。在优选实施例中,经转化的细胞可以选自由以下组成的组:埃希氏菌属;沙门氏菌属;芽孢杆菌属;不动杆菌属;链霉菌属;棒状杆菌属;甲基弯曲菌属;甲基单胞菌属;红球菌属;假单胞菌属;红杆菌属;集胞藻属;酵母菌属;接合酵母菌属;克鲁维酵母菌属;假丝酵母菌属;汉逊氏酵母菌属;德巴利氏酵母菌属;毛霉菌属;毕赤酵母菌属;球拟酵母菌属;曲霉菌属;节丛孢属;短杆菌属;微杆菌属;节杆菌属;柠檬酸杆菌属;克雷伯菌属;泛菌属;以及梭菌。在一些实施例中,细胞是选自由以下组成的组的植物细胞:卡诺拉(canola)植物细胞、油菜籽植物细胞、棕榈植物细胞、向日葵植物细胞、棉花植物细胞、玉米植物细胞、花生植物细胞、亚麻植物细胞、芝麻植物细胞、大豆植物细胞和矮牵牛植物细胞。
含有引导外源蛋白质的高水平表达的调节序列的微生物宿主细胞表达系统和表达载体是本领域技术人员熟知的。这些中的任一者都可以用于构建用于在微生物宿主细胞中表达主题技术的重组多肽的载体。然后可以通过转化将这些载体引入到适当的微生物中,以允许本主题技术的重组多肽的高水平表达。
用于转化合适的微生物宿主细胞的载体或盒是本领域熟知的。通常,载体或盒含有引导相关多核苷酸的转录和翻译的序列、可选择标志物和允许自主复制或染色体整合的序列。合适的载体包括携带转录起始控制的多核苷酸的5'区和控制转录终止的DNA片段的3'区。优选两个控制区均来源于与经转化的宿主细胞同源的基因,但应理解的是,此类控制区不需要来源于被选择作为宿主的特定物种的天然基因。
终止控制区也可以来源于微生物宿主的各种天然基因。对于本文所描述的微生物宿主,可以任选地包含终止位点。
优选的宿主细胞包含那些已知具有从异丁香酚中产生香草醛的能力的细胞。例如,优选的宿主细胞可以包含埃希氏菌属和假单胞菌属的细菌。
香草醛的发酵性产生
异丁香酚通过涉及丙烯基苯的侧链的氧化的环氧化物-二醇途径代谢成香草醛(图1)。本发明人已经令人惊讶地发现,与先前报道的细菌性IEM(例如,来自恶臭假单胞菌和硝基还原假单胞菌(Pseudomonas nitroreducens))相比,推定的来自玉米黑粉菌的异丁香酚单加氧酶(UmIEM)在将异丁香酚生物转化为香草醛方面显示出令人惊讶的高活性。更具体地,通过使携带UmIEM基因的宿主菌株工程化并在包含异丁香酚的混合物中培养工程化的宿主菌株,本发明人能够以高于10g/L的滴度以及高于90%的转化率产生香草醛。在不使用其它粗制酶和/或亚因子的情况下获得了高滴度和高转化率。
宿主细胞的培养可以在存在常用营养物质的水性培养基中进行。合适的培养基例如可以包含碳源、有机或无机氮源、无机盐和生长因子。对于培养基,葡萄糖可以是优选的碳源。酵母提取物可以是有用的氮源。可以添加磷酸盐、生长因子和微量元素。
可以在生物反应器中制备培养液并将其灭菌。然后可以将根据本发明的工程化宿主菌株接种到培养液中以开始生长期。生长期的适当持续时间可以为约5-40小时,优选地约10-35小时,并且最优选地约10-20小时。
生长期终止后,可以将发酵液的pH转变为pH 8.0或更高,并且将底物异丁香酚进料到培养物中。合适的底物进料的量可以为0.1-40g/L的发酵液,优选地约0.3-30g/L。底物可以作为固体物质或作为水溶液或悬浮液进料。底物的总量可以在一个步骤中、在两个或更多个进料步骤中或连续地进料。
生物转化期从底物进料开始并持续约5-50小时,优选地10-40小时,并且最优选地15-30小时,即直到所有底物转化为产物和副产物为止。
在终止的生物转化期之后,生物质可以通过如离心或膜过滤等任何熟知的方法从发酵液中分离出来,以获得无细胞发酵液。
可以使用例如与水不混溶的有机溶剂、植物油或任何固体提取剂,例如,树脂,优选地中性树脂,将提取相添加到发酵液中。可以将发酵液进一步灭菌或巴氏消毒。在一些实施例中,可以将发酵液浓缩。可以使用例如连续液-液提取工艺或分批提取工艺选择性地从发酵液中提取香草醛。
除此之外,本发明的优点包含在同一培养基中进行生长期和随后的生物转化期的能力。这极大地简化了产生过程,使过程高效且经济,因此允许扩大至工业生产水平。
*本领域技术人员将认识到,通过本文所描述的方法产生的香草醛组合物可以进一步纯化并与如上文所描述的芳香和/或调味可消费产品以及膳食补充剂、药物组合物和药妆品混合,用于营养品以及医药产品。
在考虑以下非限制性实例后,将更充分地理解本公开。应当理解的是,尽管这些实例说明了本主题技术的优选实施例,但是其仅仅为了举例说明。通过以上讨论和这些实例,本领域的技术人员可以确定本主题技术的必要特征,并且可以在不脱离本主题技术的精神和范围的情况下可以对本主题技术进行各种改变和修改,以使本发明适用于各种用途和条件。
实例
菌株、质粒和培养条件
DH5a和BL21(DE3)的大肠杆菌菌株购自英杰公司(Invitrogen)(加利福尼亚州卡尔斯巴德)。质粒pET28a购自EMD密理博公司(EMD Millipore)(马萨诸塞州比尔里卡),其用于基因克隆和基因表达目的两者。
DNA操纵
所有DNA操纵均按照标准程序进行。限制酶和T4 DNA连接酶购自新英格兰生物实验室(New England Biolabs)(马萨诸塞州伊普斯维奇)。根据制造商的指导,所有PCR反应均使用新英格兰生物实验室的Phusion PCR系统进行。
实例1:靶基因的鉴定
从NCBI数据库中鉴定出GenBank ID号为XP_023428676的来自玉米黑粉菌521的假定蛋白UMAG_05084(表1,SEQ ID NO:1)。此假定蛋白的基因位于玉米黑粉菌521染色体4上(表1,SEQ ID NO:2)。其基因序列经密码子优化以用于在大肠杆菌中表达(表1,SEQ ID NO:3),并且由Gene Universal股份有限公司(Gene Universal Inc.)(特拉华州纽瓦克)合成。以下实例的结果指示此蛋白质是异丁香酚单加氧酶(UmIEM),因为其显示出异丁香酚产生香草醛的高活性。具体地,携带具有UmIEM基因的表达质粒的大肠杆菌菌株能够以高滴度和高摩尔转化率产生香草醛。
实例2:质粒构建与宿主细胞转化
将UmIEM的开放阅读框(ORF)克隆到pET28a的Nde I/Xho I限制位点,使得重组蛋白在N端处具有6XHis标签,便于提取和纯化。使用UmIEM-NdeI-F和UmIEM-Xho I-R引物(表1)扩增UmIEM的ORF,以在5'端处引入Nde I限制位点,并且在3'端处引入Xho I位点。将所得PCR产物用限制酶Nde I和Xho I消化,并将所得的具有粘性端的PCR片段连接到表达质粒载体pET28a的限制位点Nde I或Xho I中,以产生重组质粒UmIEM-pET28a(图2;表1,SEQ IDNO:4)。使用质粒UmIEM-pET28a来转化DH5α感受态细胞。序列确认后,使用质粒UmIEM-pET28a以标准化学转化方案转化大肠杆菌菌株BL21(DE3),以产生大肠杆菌菌株ISEG-V224。
实例3:UmIEM在大肠杆菌中的异源表达及重组蛋白的纯化
将大肠杆菌菌株ISEG-V224的单个菌落在含有50mg/L的卡那霉素的5mL的LB培养基中在37℃下生长过夜。将此菌种培养物转移至含有50mg/L的卡那霉素的200mL的LB培养基中。使细胞在37℃下以250rpm生长至OD600为0.6-0.8,并且然后添加异丙基β-D-1-硫代半乳糖苷(IPTG)至终浓度为0.5mM,并将生长温度改为16℃。IPTG诱导16小时后,通过在4℃下以4000g离心15分钟来采集大肠杆菌细胞。将所得颗粒重新悬浮于5mL的100mM HEPES-NaOH,pH 7.5、100mM NaCl、10%甘油(v/v)和1mM PMSF中,并在冰上超声处理2分钟。将混合物在4℃下以4000g离心20分钟。遵循制造商的方案,使用来自美国塔卡拉生物公司(TakaraBio USA,Inc.)(加利福尼亚州山景城)的His60 Ni Superflow树脂纯化上清液中的重组蛋白。通过SDS-PAGE(图3)检查重组蛋白的纯化。
实例4:体外酶测定
通过测量以异丁香酚作为底物的香草醛的形成来测定推定的异丁香酚单加氧酶的酶活性。反应混合物含有10mM异丁香酚、100mM Tris-HCl缓冲液(pH 7.0)、10%(v/v)DMSO和适量的酶,总体积为0.2ml。通过添加酶溶液开始反应,然后在往复振荡(160个冲程min-1)下在30℃下进行10分钟,并通过添加0.2ml的甲醇停止反应。在以21,500rpm离心后,通过HPLC分析上清液,以测定异丁香酚和香草醛以及香草醇。将在沸水中处理5分钟的UmIEM酶用作阴性对照。
使用Vanquish Ultimate 3000系统对异丁香酚和香草醛进行HPLC分析。通过反相色谱法在Dionex Acclaim 120 C18柱(粒径3μm;150x 2.1mm)上分离中间体,梯度为0.15%(体积/体积)乙酸(洗脱液A)和甲醇(洗脱液B),范围为60至100%(体积/体积),并且流速为0.4毫升/分钟。为了定量,使用外部标准品对所有中间体进行了校准。这些化合物是通过其保留时间以及对应的光谱来识别的,这些光谱是用系统中的二极管阵列检测器识别的。
参考图4,上图证实了UmIEM的经纯化的基因产物能够催化异丁香酚转化为香草醛。相比之下,下图(用阴性对照获得)显示,当UmIEM酶变性时,没有产生香草醛。
实例5:使用摇瓶的异丁香酚到香草醛的体内生物转化
使大肠杆菌菌株IEUG-V224在具有含50μg/L卡那霉素的3ml LB的LB培养基中在37℃下生长过夜作为菌种培养物。将0.2mL的菌种培养物在125mL摇瓶中接种到含有50μg/L卡那霉素的20mL LB培养基中。使细胞在振荡器中以250rpm的振荡速度在30℃下生长至OD600为0.6,并添加异丙基β-D-1-硫代半乳糖苷(IPTG)至终浓度为0.5mM。在相同的培养条件下将细胞培养另外5小时,并且然后将100μl 50%异丁香酚(v/v在甲醇中)添加到烧瓶中。随后,在首次添加异丁香酚6小时和12小时后,将100μl 50%异丁香酚(v/v在甲醇中)添加到培养物中。以指定的时间间隔从烧瓶中取出100μl样品,通过涡旋与900μl的甲醇充分混合,并且然后以20,000g离心15分钟。将50μL的澄清上清液转移到HPLC样品小瓶中,并使用实例4中所描述的程序用于HPLC分析。实验一式三份地进行。
参考图5,在添加异丁香酚后六小时,用UmIEM基因转化的大肠杆菌菌株能够以高于3g/L的滴度产生香草醛,所述滴度在24小时后增加至超过5g/L。
实例6:在发酵罐中将异丁香酚生物转化为香草醛
开发了用于使用大肠杆菌菌株ISEG-V224在发酵罐中将异丁香酚生物转化为香草醛的发酵工艺。在500mL烧瓶中将一ml的ISEG-V224的甘油原液接种到100mL菌种培养基(Luria Bertani培养基,含有5g/L酵母提取物、10g/L胰蛋白酶、10g/L NaCl和50mg/L卡那霉素)中。将菌种在振荡器中以200rpm的振荡速度在37℃下培养8小时,并且然后在5升发酵罐中转移到Luria Bertani培养基加上6g/L初始葡萄糖、50mg/L卡那霉素的2升的发酵培养基中。
此发酵工艺有两个时期;即,细胞生长期和生物转化期。细胞生长期为0小时至17小时,并且被称为经过的发酵时间(EFT)。在EFT期间,发酵参数设置如下:空气流量:0.6vvm;通过使用4N NaOH将pH控制在不低于7.1。生长温度设置为30℃,并且搅拌速度设置为300-500rpm。溶解氧(DO)水平保持高于30%。在EFT 6.5小时时,添加IPTG至终浓度为0.5mM,并以0.4g/L/小时的速率进料葡萄糖,持续17小时。
生物转化期为EFT 17小时至46.5小时。发酵参数设置如下:空气流量:0.4vvm。使用4N NaOH将pH控制在不低于8.0,并且温度保持在30℃。搅拌设置为250-500rpm,并且DO保持在高于30%。以1.5g/L的速率以EFT 17小时开始进料异丁香酚,并持续4小时。在EFT 21小时时,异丁香酚进料速率降低至1g/L。在EFT 23小时时,异丁香酚进料速率进一步降低至0.6g/L/小时,并且维持另外8小时。以特定时间间隔收集样品,然后如实例4中所描述的通过HPLC进行分析。
参考图6,使用5升发酵罐,用UmIEM基因转化的大肠杆菌菌株ISEG-V224能够以高达14.8g/L的滴度使用异丁香酚作为底物产生香草醛。还值得注意的是,异丁香酚到香草醛的摩尔转化率达到90%以上。
根据前述描述显而易见的是,本公开的某些方面不受本文所提供的实例的特定细节限制,并且因此预期本领域技术人员将会想到其它修改和应用或其等同物。因此,权利要求书应当旨在覆盖不脱离本公开的精神和范围的所有此类修改和应用。
此外,除非另外定义,否则本文所使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解含义相同的含义。虽然本公开的实践或测试中可以使用类似于或等同于本文所述的方法和材料的任何方法和材料,但上文描述了优选的方法和材料。
虽然出于理解的目的通过说明和实例相当详细地描述了前述发明,但是对于本领域技术人员而言显而易见的是,可以实践某些变化和修改。因此,说明和实例不应被解释为限制本发明的范围,本发明的范围由所附权利要求书界定。
所关注序列
SEQ ID NO:1-UmIEM的核酸序列
ATGGCGCCTACCGCAACCCAAGATCCAGTGGCAGTGGCGGTGCCTGCCTCGAAAGCAGCCAAGCATGGCTACGTCCACCCGACCGACATGCTTCCGTCCGGCTGGCCAACGGCTACCGATCTGTCCGGAGGTGCACAGCCGCGCCGATTCGAAGGCACCATCTTCGACGTCATGGTGCGCGGTACGATCCCCAAGGAGCTGTACGGTACGTTTTACCGTATCATGCCCGACTACGCCGAGGCGCCGACGTACTACAAGGGAGGCGAGCTCAATGCGCCCATTGACGGCGATGGC
ACCGTGGCGGCGTTCCGGTTCAAGGACGGCAAGGTCGACTACCGCCAGCGATTCGTCG
AGACCGATCGATTCAAGGTGGAACGTCGTGCGAGGAAGAGCATGTACGGTCTGTACCG
CAACCCATACACGCACCATCCGTGTGTGAGGCAGACAGTCGACTCGACGGCCAACACC
AACGTCGTCATGCACGCCGGAAGGTTCCTAGCCATGAAGGAGAACGGCAACGCATACG
AGCTCGACCCGCACACACTCCAGACGCTCGGCTACAACCCATTCAAGCTGCCCTCCAAG
ACAATGACGGCGCACCCCAAGCAGTGTTCGGTGACGGGCAACCTGGTAGGCTTCGGAT
ACGAGGCCAAAGGATTGGCCACCAAAGATGTCTATTACTTTGAGGTGGATCCGTCCGGT
AAAGTGGTGCACGAGCTCTGGCTGGAAGCTCCGTGGTGTGCGTTTATCCACGACTGCGC
GCTGACACCCAACTACCTCGTGCTGATGCTTTGGCCATTCGAGGCCAACCTCGATAGGAT
GAAGGCGGGCGGTCACCACTGGGCGTACGACTACGACAAGCCGATCACTTGGATCACG
ATCCCTCGCGGTGCCAAGAGCAAAGACCAAGTCAAGTGCTGGTACTGGAAGAACGGCA
TGCCCATCCACACAGCTTCCGGATTCGAGGATGACCAAGGTCGCATCATCATTGATTCGT
CACTGGTGCACGGCAATGCGTTCCCCTTTTTCCCGCCCGACTCGGCCGAGCAGAGGCAG
AAACAGCAATCTGACGGAACGCCTAAAGCTCAATTTGTGCGATGGACCATCGATCCGCG
CAATGATAGCAATGAGCGTCTGCCCGATCCCGAGGTGATTCTCGACACGCCTTCCGAGTT
CCCGCAGATCGACAACCGTTTCATGGGCGTCGAGTACTCGAGCGCGTTTATCAACGTCT
TTGTACCCGACCGCAGCGATGGCAACAAGAACGTCTTCCAGGGCCTCAACGGTCTTGCG
CACTACCGACGTAAACAAGGCACTACCGAATGGTACTATGCCGGCGACAATTGCCTGAT
TCAAGAACCCGTCTTCAGCCCGCGCTCCGCCGACGCACCCGAAGGCGACGGCTTTGTG
CTCGCGATTGTCGACCGTCTCGATTTGAACCGCAGCGAGGTGGTCATCATCGACACCAG
AGACTTTACCACCGCGATTGCCGCTGTTCAACTCCCCTTCGCTATCCGTTCCGGCATCCA
CGGCCAGTGGATCCCCGGCCAGGTCACCCCCGACTTTGACTCAAGAGGCCTCATCGACC
TGCCAAAGCAACAACACTGGGCTCCGCCTTCTCAAAGCGCCTTTGATCCGAACATGTAASEQ ID NO:2-UmIEM的氨基酸序列
MAPTATQDPVAVAVPASKAAKHGYVHPTDMLPSGWPTATDLSGGAQPRRFEGTIFDVMVR
GTIPKELYGTFYRIMPDYAEAPTYYKGGELNAPIDGDGTVAAFRFKDGKVDYRQRFVETDR
FKVERRARKSMYGLYRNPYTHHPCVRQTVDSTANTNVVMHAGRFLAMKENGNAYELDP
HTLQTLGYNPFKLPSKTMTAHPKQCSVTGNLVGFGYEAKGLATKDVYYFEVDPSGKVVHE
LWLEAPWCAFIHDCALTPNYLVLMLWPFEANLDRMKAGGHHWAYDYDKPITWITIPRGAK
SKDQVKCWYWKNGMPIHTASGFEDDQGRIIIDSSLVHGNAFPFFPPDSAEQRQKQQSDGTP
KAQFVRWTIDPRNDSNERLPDPEVILDTPSEFPQIDNRFMGVEYSSAFINVFVPDRSDGNKN
VFQGLNGLAHYRRKQGTTEWYYAGDNCLIQEPVFSPRSADAPEGDGFVLAIVDRLDLNRS
EVVIIDTRDFTTAIAAVQLPFAIRSGIHGQWIPGQVTPDFDSRGLIDLPKQQHWAPPSQSAFDPNM
SEQ ID NO:3-被密码子优化以在大肠杆菌中表达的UmIEM的核酸序列ATGGCCCCTACCGCAACCCAGGACCCTGTGGCAGTTGCAGTGCCGGCCAGCAAAGCCGCAAAACATGGCTATGTGCATCCGACCGATATGCTGCCGAGTGGTTGGCCGACCGCAACCGATCTGAGCGGTGGTGCACAGCCGCGTCGTTTTGAAGGTACAATTTTTGATGTGATGGTGCGTGGTACAATTCCGAAAGAACTGTATGGTACATTTTATCGTATCATGCCGGATTATGCAGAAGCACCGACCTATTATAAAGGTGGTGAACTGAATGCCCCGATTGATGGTGACGGTACAGTTGCAGCCTTTCGTTTTAAAGATGGTAAAGTGGATTACCGTCAGCGCTTTGTGGAAACCGATCGCTTTAAAGTTGAACGCCGTGCCCGTAAAAGCATGTATGGTCTGTATCGCAATCCGTATACCCATCATCCGTGCGTGCGCCAGACCGTTGATAGCACCGCCAATACCAATGTTGTGATGCATGCCGGCCGTTTTCTGGCCATGAAAGAAAATGGTAATGCCTATGAACTGGACCCTCATACCCTGCAGACCCTGGGTTATAATCCGTTTAAATTACCGAGCAAAACCATGACCGCCCATCCGAAACAGTGCAGCGTGACCGGCAATCTGGTGGGCTTTGGCTATGAAGCCAAAGGTCTGGCAACCAAAGATGTTTATTATTTTGAAGTGGACCCGAGTGGTAAAGTTGTGCATGAACTGTGGCTGGAAGCACCGTGGTGTGCATTCATTCATGATTGCGCACTGACCCCGAATTATCTGGTTCTGATGCTGTGGCCGTTTGAAGCAAATCTGGATCGCATGAAAGCAGGCGGCCATCATTGGGCCTATGATTATGATAAACCGATTACCTGGATTACCATTCCGCGCGGTGCAAAAAGCAAAGATCAGGTTAAATGTTGGTATTGGAAAAATGGTATGCCGATTCATACCGCCAGTGGTTTTGAAGATGATCAGGGTCGCATTATTATTGATAGCAGTCTGGTTCATGGTAATGCCTTTCCGTTTTTCCCGCCGGATAGTGCAGAACAGCGCCAGAAACAGCAGAGCGATGGTACACCGAAAGCACAGTTTGTTCGCTGGACCATTGATCCGCGTAATGATAGCAATGAACGTCTGCCGGACCCTGAAGTGATTCTGGATACCCCGAGCGAATTTCCGCAGATTGATAATCGTTTTATGGGCGTGGAATATAGTAGCGCATTCATTAATGTGTTTGTTCCTGATCGTAGTGATGGTAATAAGAATGTTTTTCAGGGCCTGAATGGTCTGGCCCATTATCGTCGCAAACAGGGCACCACCGAATGGTATTATGCCGGCGATAATTGCCTGATTCAGGAACCGGTTTTTAGCCCGCGCAGTGCAGATGCACCGGAAGGTGACGGTTTTGTTCTGGCCATTGTTGATCGTCTGGATCTGAATCGTAGCGAAGTGGTTATTATTGATACCCGCGATTTTACCACCGCAATTGCCGCAGTGCAGCTGCCGTTTGCAATTCGTAGCGGTATTCATGGCCAGTGGATTCCGGGTCAGGTTACCCCGGATTTTGATAGTCGCGGCCTGATTGATCTGCCGAAACAGCAGCATTGGGCACCGCCGAGCCAGAGCGCATTTGATCCGAATATGTAA
SEQ ID NO:4-质粒pET28a的核酸序列
ATCCGGATATAGTTCCTCCTTTCAGCAAAAAACCCCTCAAGACCCGTTTAGAGGCCCCAAGGGGTTATGCTAGTTATTGCTCAGCGGTGGCAGCAGCCAACTCAGCTTCCTTTCGGGCT
TTGTTAGCAGCCGGATCTCAGTGGTGGTGGTGGTGGTGCTCGAGTGCGGCCGCTTACAT
ATTCGGATCAAATGCGCTCTGGCTCGGCGGTGCCCAATGCTGCTGTTTCGGCAGATCAAT
CAGGCCGCGACTATCAAAATCCGGGGTAACCTGACCCGGAATCCACTGGCCATGAATAC
CGCTACGAATTGCAAACGGCAGCTGCACTGCGGCAATTGCGGTGGTAAAATCGCGGGTA
TCAATAATAACCACTTCGCTACGATTCAGATCCAGACGATCAACAATGGCCAGAACAAA
ACCGTCACCTTCCGGTGCATCTGCACTGCGCGGGCTAAAAACCGGTTCCTGAATCAGGC
AATTATCGCCGGCATAATACCATTCGGTGGTGCCCTGTTTGCGACGATAATGGGCCAGAC
CATTCAGGCCCTGAAAAACATTCTTATTACCATCACTACGATCAGGAACAAACACATTAA
TGAATGCGCTACTATATTCCACGCCCATAAAACGATTATCAATCTGCGGAAATTCGCTCGG
GGTATCCAGAATCACTTCAGGGTCCGGCAGACGTTCATTGCTATCATTACGCGGATCAAT
GGTCCAGCGAACAAACTGTGCTTTCGGTGTACCATCGCTCTGCTGTTTCTGGCGCTGTTC
TGCACTATCCGGCGGGAAAAACGGAAAGGCATTACCATGAACCAGACTGCTATCAATAA
TAATGCGACCCTGATCATCTTCAAAACCACTGGCGGTATGAATCGGCATACCATTTTTCC
AATACCAACATTTAACCTGATCTTTGCTTTTTGCACCGCGCGGAATGGTAATCCAGGTAA
TCGGTTTATCATAATCATAGGCCCAATGATGGCCGCCTGCTTTCATGCGATCCAGATTTGC
TTCAAACGGCCACAGCATCAGAACCAGATAATTCGGGGTCAGTGCGCAATCATGAATGA
ATGCACACCACGGTGCTTCCAGCCACAGTTCATGCACAACTTTACCACTCGGGTCCACT
TCAAAATAATAAACATCTTTGGTTGCCAGACCTTTGGCTTCATAGCCAAAGCCCACCAGA
TTGCCGGTCACGCTGCACTGTTTCGGATGGGCGGTCATGGTTTTGCTCGGTAATTTAAAC
GGATTATAACCCAGGGTCTGCAGGGTATGAGGGTCCAGTTCATAGGCATTACCATTTTCT
TTCATGGCCAGAAAACGGCCGGCATGCATCACAACATTGGTATTGGCGGTGCTATCAAC
GGTCTGGCGCACGCACGGATGATGGGTATACGGATTGCGATACAGACCATACATGCTTTT
ACGGGCACGGCGTTCAACTTTAAAGCGATCGGTTTCCACAAAGCGCTGACGGTAATCCA
CTTTACCATCTTTAAAACGAAAGGCTGCAACTGTACCGTCACCATCAATCGGGGCATTCA
GTTCACCACCTTTATAATAGGTCGGTGCTTCTGCATAATCCGGCATGATACGATAAAATGT
ACCATACAGTTCTTTCGGAATTGTACCACGCACCATCACATCAAAAATTGTACCTTCAAA
ACGACGCGGCTGTGCACCACCGCTCAGATCGGTTGCGGTCGGCCAACCACTCGGCAGC
ATATCGGTCGGATGCACATAGCCATGTTTTGCGGCTTTGCTGGCCGGCACTGCAACTGCC
ACAGGGTCCTGGGTTGCGGTAGGGGCCATATGGCTGCCGCGCGGCACCAGGCCGCTGCT
GTGATGATGATGATGATGGCTGCTGCCCATGGTATATCTCCTTCTTAAAGTTAAACAAAAT
TATTTCTAGAGGGGAATTGTTATCCGCTCACAATTCCCCTATAGTGAGTCGTATTAATTTC
GCGGGATCGAGATCTCGATCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCC
ACAGGTGCGGTTGCTGGCGCCTATATCGCCGACATCACCGATGGGGAAGATCGGGCTCG
CCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTGGGTATGGTGGCAGGCCCCGTGGCCG
GGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGGCGGCGGTGCTCAAC
GGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAGGGAGAGCGTCG
AGATCCCGGACACCATCGAATGGCGCAAAACCTTTCGCGGTATGGCATGATAGCGCCCG
GAAGAGAGTCAATTCAGGGTGGTGAATGTGAAACCAGTAACGTTATACGATGTCGCAGA
GTATGCCGGTGTCTCTTATCAGACCGTTTCCCGCGTGGTGAACCAGGCCAGCCACGTTTC
TGCGAAAACGCGGGAAAAAGTGGAAGCGGCGATGGCGGAGCTGAATTACATTCCCAAC
CGCGTGGCACAACAACTGGCGGGCAAACAGTCGTTGCTGATTGGCGTTGCCACCTCCA
GTCTGGCCCTGCACGCGCCGTCGCAAATTGTCGCGGCGATTAAATCTCGCGCCGATCAA
CTGGGTGCCAGCGTGGTGGTGTCGATGGTAGAACGAAGCGGCGTCGAAGCCTGTAAAG
CGGCGGTGCACAATCTTCTCGCGCAACGCGTCAGTGGGCTGATCATTAACTATCCGCTG
GATGACCAGGATGCCATTGCTGTGGAAGCTGCCTGCACTAATGTTCCGGCGTTATTTCTT
GATGTCTCTGACCAGACACCCATCAACAGTATTATTTTCTCCCATGAAGACGGTACGCGA
CTGGGCGTGGAGCATCTGGTCGCATTGGGTCACCAGCAAATCGCGCTGTTAGCGGGCCC
ATTAAGTTCTGTCTCGGCGCGTCTGCGTCTGGCTGGCTGGCATAAATATCTCACTCGCAA
TCAAATTCAGCCGATAGCGGAACGGGAAGGCGACTGGAGTGCCATGTCCGGTTTTCAAC
AAACCATGCAAATGCTGAATGAGGGCATCGTTCCCACTGCGATGCTGGTTGCCAACGAT
CAGATGGCGCTGGGCGCAATGCGCGCCATTACCGAGTCCGGGCTGCGCGTTGGTGCGGA
TATCTCGGTAGTGGGATACGACGATACCGAAGACAGCTCATGTTATATCCCGCCGTTAAC
CACCATCAAACAGGATTTTCGCCTGCTGGGGCAAACCAGCGTGGACCGCTTGCTGCAAC
TCTCTCAGGGCCAGGCGGTGAAGGGCAATCAGCTGTTGCCCGTCTCACTGGTGAAAAG
AAAAACCACCCTGGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCAT
TAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAA
TTAATGTAAGTTAGCTCACTCATTAGGCACCGGGATCTCGACCGATGCCCTTGAGAGCCT
TCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCCGCACTTATG
ACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTC
GGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGG
AATCTTGCACGCCCTCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCG
AGAAGCAGGCCATTATCGCCGGCATGGCGGCCCCACGGGTGCGCATGATCGTGCTCCTG
TCGTTGAGGACCCGGCTAGGCTGGCGGGGTTGCCTTACTGGTTAGCAGAATGAATCACC
GATACGCGAGCGAACGTGAAGCGACTGCTGCTGCAAAACGTCTGCGACCTGAGCAACA
ACATGAATGGTCTTCGGTTTCCGTGTTTCGTAAAGTCTGGAAACGCGGAAGTCAGCGCC
CTGCACCATTATGTTCCGGATCTGCATCGCAGGATGCTGCTGGCTACCCTGTGGAACACC
TACATCTGTATTAACGAAGCGCTGGCATTGACCCTGAGTGATTTTTCTCTGGTCCCGCCG
CATCCATACCGCCAGTTGTTTACCCTCACAACGTTCCAGTAACCGGGCATGTTCATCATC
AGTAACCCGTATCGTGAGCATCCTCTCTCGTTTCATCGGTATCATTACCCCCATGAACAGA
AATCCCCCTTACACGGAGGCATCAGTGACCAAACAGGAAAAAACCGCCCTTAACATGG
CCCGCTTTATCAGAAGCCAGACATTAACGCTTCTGGAGAAACTCAACGAGCTGGACGCG
GATGAACAGGCAGACATCTGTGAATCGCTTCACGACCACGCTGATGAGCTTTACCGCAG
CTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGA
CGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTC
AGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGCGATAGCGGA
GTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATAT
GCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCG
CTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCT
CACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACAT
GTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTT
TTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGT
GGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTG
CGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGA
AGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGC
TCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGG
TAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCA
CTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGG
TGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCA
GTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAG
CGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAG
ATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGG
ATTTTGGTCATGAACAATAAAACTGTCTGCTTACATAAACAGTAATACAAGGGGTGTTAT
GAGCCATATTCAACGGGAAACGTCTTGCTCTAGGCCGCGATTAAATTCCAACATGGATGC
TGATTTATATGGGTATAAATGGGCTCGCGATAATGTCGGGCAATCAGGTGCGACAATCTAT
CGATTGTATGGGAAGCCCGATGCGCCAGAGTTGTTTCTGAAACATGGCAAAGGTAGCGT
TGCCAATGATGTTACAGATGAGATGGTCAGACTAAACTGGCTGACGGAATTTATGCCTCT
TCCGACCATCAAGCATTTTATCCGTACTCCTGATGATGCATGGTTACTCACCACTGCGATC
CCCGGGAAAACAGCATTCCAGGTATTAGAAGAATATCCTGATTCAGGTGAAAATATTGTT
GATGCGCTGGCAGTGTTCCTGCGCCGGTTGCATTCGATTCCTGTTTGTAATTGTCCTTTTAACAGCGATCGCGTATTTCGTCTCGCTCAGGCGCAATCACGAATGAATAACGGTTTGGTTGATGCGAGTGATTTTGATGACGAGCGTAATGGCTGGCCTGTTGAACAAGTCTGGAAAGAAATGCATAAACTTTTGCCATTCTCACCGGATTCAGTCGTCACTCATGGTGATTTCTCACTTGATAACCTTATTTTTGACGAGGGGAAATTAATAGGTTGTATTGATGTTGGACGAGTCGGAATCGCAGACCGATACCAGGATCTTGCCATCCTATGGAACTGCCTCGGTGAGTTTTCTCCTTCATTACAGAAACGGCTTTTTCAAAAATATGGTATTGATAATCCTGATATGAATAAATTGCAGTTTCATTTGATGCTCGATGAGTTTTTCTAAGAATTAATTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGAAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCC
SEQ ID NO:5-引物UmIEM-NdeI-F的核酸序列
GGAATTCCATATGGCCCCTACCGCAACCCAGGACCCTGTG
SEQ ID NO:6-引物UmIEM-XhoI-R的核酸序列
CCGCTCGAGTTACATATTCGGATCAAATGCGCTCTGGCTC。
序列表
<110> 巴斯夫公司(BASF SE)
<120> 由异丁香酚生物合成香草醛
<130> 074008-2040-WO-000326
<150> US 63/127,503
<151> 2020-12-18
<160> 6
<170> PatentIn 3.5版
<210> 1
<211> 1647
<212> DNA
<213> 玉米黑粉菌(Ustilago maydis)
<220>
<221> misc_feature
<222> (1)..(1647)
<223> UmIEM的核酸序列
<220>
<221> misc_feature
<222> (1645)..(1647)
<223> 终止密码子
<400> 1
atggcgccta ccgcaaccca agatccagtg gcagtggcgg tgcctgcctc gaaagcagcc 60
aagcatggct acgtccaccc gaccgacatg cttccgtccg gctggccaac ggctaccgat 120
ctgtccggag gtgcacagcc gcgccgattc gaaggcacca tcttcgacgt catggtgcgc 180
ggtacgatcc ccaaggagct gtacggtacg ttttaccgta tcatgcccga ctacgccgag 240
gcgccgacgt actacaaggg aggcgagctc aatgcgccca ttgacggcga tggcaccgtg 300
gcggcgttcc ggttcaagga cggcaaggtc gactaccgcc agcgattcgt cgagaccgat 360
cgattcaagg tggaacgtcg tgcgaggaag agcatgtacg gtctgtaccg caacccatac 420
acgcaccatc cgtgtgtgag gcagacagtc gactcgacgg ccaacaccaa cgtcgtcatg 480
cacgccggaa ggttcctagc catgaaggag aacggcaacg catacgagct cgacccgcac 540
acactccaga cgctcggcta caacccattc aagctgccct ccaagacaat gacggcgcac 600
cccaagcagt gttcggtgac gggcaacctg gtaggcttcg gatacgaggc caaaggattg 660
gccaccaaag atgtctatta ctttgaggtg gatccgtccg gtaaagtggt gcacgagctc 720
tggctggaag ctccgtggtg tgcgtttatc cacgactgcg cgctgacacc caactacctc 780
gtgctgatgc tttggccatt cgaggccaac ctcgatagga tgaaggcggg cggtcaccac 840
tgggcgtacg actacgacaa gccgatcact tggatcacga tccctcgcgg tgccaagagc 900
aaagaccaag tcaagtgctg gtactggaag aacggcatgc ccatccacac agcttccgga 960
ttcgaggatg accaaggtcg catcatcatt gattcgtcac tggtgcacgg caatgcgttc 1020
ccctttttcc cgcccgactc ggccgagcag aggcagaaac agcaatctga cggaacgcct 1080
aaagctcaat ttgtgcgatg gaccatcgat ccgcgcaatg atagcaatga gcgtctgccc 1140
gatcccgagg tgattctcga cacgccttcc gagttcccgc agatcgacaa ccgtttcatg 1200
ggcgtcgagt actcgagcgc gtttatcaac gtctttgtac ccgaccgcag cgatggcaac 1260
aagaacgtct tccagggcct caacggtctt gcgcactacc gacgtaaaca aggcactacc 1320
gaatggtact atgccggcga caattgcctg attcaagaac ccgtcttcag cccgcgctcc 1380
gccgacgcac ccgaaggcga cggctttgtg ctcgcgattg tcgaccgtct cgatttgaac 1440
cgcagcgagg tggtcatcat cgacaccaga gactttacca ccgcgattgc cgctgttcaa 1500
ctccccttcg ctatccgttc cggcatccac ggccagtgga tccccggcca ggtcaccccc 1560
gactttgact caagaggcct catcgacctg ccaaagcaac aacactgggc tccgccttct 1620
caaagcgcct ttgatccgaa catgtaa 1647
<210> 2
<211> 548
<212> PRT
<213> 玉米黑粉菌(Ustilago maydis)
<220>
<221> MISC_FEATURE
<222> (1)..(548)
<223> UmIEM的氨基酸序列
<400> 2
Met Ala Pro Thr Ala Thr Gln Asp Pro Val Ala Val Ala Val Pro Ala
1 5 10 15
Ser Lys Ala Ala Lys His Gly Tyr Val His Pro Thr Asp Met Leu Pro
20 25 30
Ser Gly Trp Pro Thr Ala Thr Asp Leu Ser Gly Gly Ala Gln Pro Arg
35 40 45
Arg Phe Glu Gly Thr Ile Phe Asp Val Met Val Arg Gly Thr Ile Pro
50 55 60
Lys Glu Leu Tyr Gly Thr Phe Tyr Arg Ile Met Pro Asp Tyr Ala Glu
65 70 75 80
Ala Pro Thr Tyr Tyr Lys Gly Gly Glu Leu Asn Ala Pro Ile Asp Gly
85 90 95
Asp Gly Thr Val Ala Ala Phe Arg Phe Lys Asp Gly Lys Val Asp Tyr
100 105 110
Arg Gln Arg Phe Val Glu Thr Asp Arg Phe Lys Val Glu Arg Arg Ala
115 120 125
Arg Lys Ser Met Tyr Gly Leu Tyr Arg Asn Pro Tyr Thr His His Pro
130 135 140
Cys Val Arg Gln Thr Val Asp Ser Thr Ala Asn Thr Asn Val Val Met
145 150 155 160
His Ala Gly Arg Phe Leu Ala Met Lys Glu Asn Gly Asn Ala Tyr Glu
165 170 175
Leu Asp Pro His Thr Leu Gln Thr Leu Gly Tyr Asn Pro Phe Lys Leu
180 185 190
Pro Ser Lys Thr Met Thr Ala His Pro Lys Gln Cys Ser Val Thr Gly
195 200 205
Asn Leu Val Gly Phe Gly Tyr Glu Ala Lys Gly Leu Ala Thr Lys Asp
210 215 220
Val Tyr Tyr Phe Glu Val Asp Pro Ser Gly Lys Val Val His Glu Leu
225 230 235 240
Trp Leu Glu Ala Pro Trp Cys Ala Phe Ile His Asp Cys Ala Leu Thr
245 250 255
Pro Asn Tyr Leu Val Leu Met Leu Trp Pro Phe Glu Ala Asn Leu Asp
260 265 270
Arg Met Lys Ala Gly Gly His His Trp Ala Tyr Asp Tyr Asp Lys Pro
275 280 285
Ile Thr Trp Ile Thr Ile Pro Arg Gly Ala Lys Ser Lys Asp Gln Val
290 295 300
Lys Cys Trp Tyr Trp Lys Asn Gly Met Pro Ile His Thr Ala Ser Gly
305 310 315 320
Phe Glu Asp Asp Gln Gly Arg Ile Ile Ile Asp Ser Ser Leu Val His
325 330 335
Gly Asn Ala Phe Pro Phe Phe Pro Pro Asp Ser Ala Glu Gln Arg Gln
340 345 350
Lys Gln Gln Ser Asp Gly Thr Pro Lys Ala Gln Phe Val Arg Trp Thr
355 360 365
Ile Asp Pro Arg Asn Asp Ser Asn Glu Arg Leu Pro Asp Pro Glu Val
370 375 380
Ile Leu Asp Thr Pro Ser Glu Phe Pro Gln Ile Asp Asn Arg Phe Met
385 390 395 400
Gly Val Glu Tyr Ser Ser Ala Phe Ile Asn Val Phe Val Pro Asp Arg
405 410 415
Ser Asp Gly Asn Lys Asn Val Phe Gln Gly Leu Asn Gly Leu Ala His
420 425 430
Tyr Arg Arg Lys Gln Gly Thr Thr Glu Trp Tyr Tyr Ala Gly Asp Asn
435 440 445
Cys Leu Ile Gln Glu Pro Val Phe Ser Pro Arg Ser Ala Asp Ala Pro
450 455 460
Glu Gly Asp Gly Phe Val Leu Ala Ile Val Asp Arg Leu Asp Leu Asn
465 470 475 480
Arg Ser Glu Val Val Ile Ile Asp Thr Arg Asp Phe Thr Thr Ala Ile
485 490 495
Ala Ala Val Gln Leu Pro Phe Ala Ile Arg Ser Gly Ile His Gly Gln
500 505 510
Trp Ile Pro Gly Gln Val Thr Pro Asp Phe Asp Ser Arg Gly Leu Ile
515 520 525
Asp Leu Pro Lys Gln Gln His Trp Ala Pro Pro Ser Gln Ser Ala Phe
530 535 540
Asp Pro Asn Met
545
<210> 3
<211> 1647
<212> DNA
<213> 人工
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(1647)
<223> 被密码子优化以在大肠杆菌中表达的UmIEM的核酸序列
<220>
<221> misc_feature
<222> (1645)..(1647)
<223> 终止密码子
<400> 3
atggccccta ccgcaaccca ggaccctgtg gcagttgcag tgccggccag caaagccgca 60
aaacatggct atgtgcatcc gaccgatatg ctgccgagtg gttggccgac cgcaaccgat 120
ctgagcggtg gtgcacagcc gcgtcgtttt gaaggtacaa tttttgatgt gatggtgcgt 180
ggtacaattc cgaaagaact gtatggtaca ttttatcgta tcatgccgga ttatgcagaa 240
gcaccgacct attataaagg tggtgaactg aatgccccga ttgatggtga cggtacagtt 300
gcagcctttc gttttaaaga tggtaaagtg gattaccgtc agcgctttgt ggaaaccgat 360
cgctttaaag ttgaacgccg tgcccgtaaa agcatgtatg gtctgtatcg caatccgtat 420
acccatcatc cgtgcgtgcg ccagaccgtt gatagcaccg ccaataccaa tgttgtgatg 480
catgccggcc gttttctggc catgaaagaa aatggtaatg cctatgaact ggaccctcat 540
accctgcaga ccctgggtta taatccgttt aaattaccga gcaaaaccat gaccgcccat 600
ccgaaacagt gcagcgtgac cggcaatctg gtgggctttg gctatgaagc caaaggtctg 660
gcaaccaaag atgtttatta ttttgaagtg gacccgagtg gtaaagttgt gcatgaactg 720
tggctggaag caccgtggtg tgcattcatt catgattgcg cactgacccc gaattatctg 780
gttctgatgc tgtggccgtt tgaagcaaat ctggatcgca tgaaagcagg cggccatcat 840
tgggcctatg attatgataa accgattacc tggattacca ttccgcgcgg tgcaaaaagc 900
aaagatcagg ttaaatgttg gtattggaaa aatggtatgc cgattcatac cgccagtggt 960
tttgaagatg atcagggtcg cattattatt gatagcagtc tggttcatgg taatgccttt 1020
ccgtttttcc cgccggatag tgcagaacag cgccagaaac agcagagcga tggtacaccg 1080
aaagcacagt ttgttcgctg gaccattgat ccgcgtaatg atagcaatga acgtctgccg 1140
gaccctgaag tgattctgga taccccgagc gaatttccgc agattgataa tcgttttatg 1200
ggcgtggaat atagtagcgc attcattaat gtgtttgttc ctgatcgtag tgatggtaat 1260
aagaatgttt ttcagggcct gaatggtctg gcccattatc gtcgcaaaca gggcaccacc 1320
gaatggtatt atgccggcga taattgcctg attcaggaac cggtttttag cccgcgcagt 1380
gcagatgcac cggaaggtga cggttttgtt ctggccattg ttgatcgtct ggatctgaat 1440
cgtagcgaag tggttattat tgatacccgc gattttacca ccgcaattgc cgcagtgcag 1500
ctgccgtttg caattcgtag cggtattcat ggccagtgga ttccgggtca ggttaccccg 1560
gattttgata gtcgcggcct gattgatctg ccgaaacagc agcattgggc accgccgagc 1620
cagagcgcat ttgatccgaa tatgtaa 1647
<210> 4
<211> 6948
<212> DNA
<213> 人工
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(6948)
<223> 质粒pET28a的核酸序列
<400> 4
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcttacatat 180
tcggatcaaa tgcgctctgg ctcggcggtg cccaatgctg ctgtttcggc agatcaatca 240
ggccgcgact atcaaaatcc ggggtaacct gacccggaat ccactggcca tgaataccgc 300
tacgaattgc aaacggcagc tgcactgcgg caattgcggt ggtaaaatcg cgggtatcaa 360
taataaccac ttcgctacga ttcagatcca gacgatcaac aatggccaga acaaaaccgt 420
caccttccgg tgcatctgca ctgcgcgggc taaaaaccgg ttcctgaatc aggcaattat 480
cgccggcata ataccattcg gtggtgccct gtttgcgacg ataatgggcc agaccattca 540
ggccctgaaa aacattctta ttaccatcac tacgatcagg aacaaacaca ttaatgaatg 600
cgctactata ttccacgccc ataaaacgat tatcaatctg cggaaattcg ctcggggtat 660
ccagaatcac ttcagggtcc ggcagacgtt cattgctatc attacgcgga tcaatggtcc 720
agcgaacaaa ctgtgctttc ggtgtaccat cgctctgctg tttctggcgc tgttctgcac 780
tatccggcgg gaaaaacgga aaggcattac catgaaccag actgctatca ataataatgc 840
gaccctgatc atcttcaaaa ccactggcgg tatgaatcgg cataccattt ttccaatacc 900
aacatttaac ctgatctttg ctttttgcac cgcgcggaat ggtaatccag gtaatcggtt 960
tatcataatc ataggcccaa tgatggccgc ctgctttcat gcgatccaga tttgcttcaa 1020
acggccacag catcagaacc agataattcg gggtcagtgc gcaatcatga atgaatgcac 1080
accacggtgc ttccagccac agttcatgca caactttacc actcgggtcc acttcaaaat 1140
aataaacatc tttggttgcc agacctttgg cttcatagcc aaagcccacc agattgccgg 1200
tcacgctgca ctgtttcgga tgggcggtca tggttttgct cggtaattta aacggattat 1260
aacccagggt ctgcagggta tgagggtcca gttcataggc attaccattt tctttcatgg 1320
ccagaaaacg gccggcatgc atcacaacat tggtattggc ggtgctatca acggtctggc 1380
gcacgcacgg atgatgggta tacggattgc gatacagacc atacatgctt ttacgggcac 1440
ggcgttcaac tttaaagcga tcggtttcca caaagcgctg acggtaatcc actttaccat 1500
ctttaaaacg aaaggctgca actgtaccgt caccatcaat cggggcattc agttcaccac 1560
ctttataata ggtcggtgct tctgcataat ccggcatgat acgataaaat gtaccataca 1620
gttctttcgg aattgtacca cgcaccatca catcaaaaat tgtaccttca aaacgacgcg 1680
gctgtgcacc accgctcaga tcggttgcgg tcggccaacc actcggcagc atatcggtcg 1740
gatgcacata gccatgtttt gcggctttgc tggccggcac tgcaactgcc acagggtcct 1800
gggttgcggt aggggccata tggctgccgc gcggcaccag gccgctgctg tgatgatgat 1860
gatgatggct gctgcccatg gtatatctcc ttcttaaagt taaacaaaat tatttctaga 1920
ggggaattgt tatccgctca caattcccct atagtgagtc gtattaattt cgcgggatcg 1980
agatctcgat cctctacgcc ggacgcatcg tggccggcat caccggcgcc acaggtgcgg 2040
ttgctggcgc ctatatcgcc gacatcaccg atggggaaga tcgggctcgc cacttcgggc 2100
tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg ggactgttgg 2160
gcgccatctc cttgcatgca ccattccttg cggcggcggt gctcaacggc ctcaacctac 2220
tactgggctg cttcctaatg caggagtcgc ataagggaga gcgtcgagat cccggacacc 2280
atcgaatggc gcaaaacctt tcgcggtatg gcatgatagc gcccggaaga gagtcaattc 2340
agggtggtga atgtgaaacc agtaacgtta tacgatgtcg cagagtatgc cggtgtctct 2400
tatcagaccg tttcccgcgt ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa 2460
aaagtggaag cggcgatggc ggagctgaat tacattccca accgcgtggc acaacaactg 2520
gcgggcaaac agtcgttgct gattggcgtt gccacctcca gtctggccct gcacgcgccg 2580
tcgcaaattg tcgcggcgat taaatctcgc gccgatcaac tgggtgccag cgtggtggtg 2640
tcgatggtag aacgaagcgg cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg 2700
caacgcgtca gtgggctgat cattaactat ccgctggatg accaggatgc cattgctgtg 2760
gaagctgcct gcactaatgt tccggcgtta tttcttgatg tctctgacca gacacccatc 2820
aacagtatta ttttctccca tgaagacggt acgcgactgg gcgtggagca tctggtcgca 2880
ttgggtcacc agcaaatcgc gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg 2940
cgtctggctg gctggcataa atatctcact cgcaatcaaa ttcagccgat agcggaacgg 3000
gaaggcgact ggagtgccat gtccggtttt caacaaacca tgcaaatgct gaatgagggc 3060
atcgttccca ctgcgatgct ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc 3120
attaccgagt ccgggctgcg cgttggtgcg gatatctcgg tagtgggata cgacgatacc 3180
gaagacagct catgttatat cccgccgtta accaccatca aacaggattt tcgcctgctg 3240
gggcaaacca gcgtggaccg cttgctgcaa ctctctcagg gccaggcggt gaagggcaat 3300
cagctgttgc ccgtctcact ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc 3360
gcctctcccc gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg 3420
gaaagcgggc agtgagcgca acgcaattaa tgtaagttag ctcactcatt aggcaccggg 3480
atctcgaccg atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg 3540
catgactatc gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt 3600
gccggcagcg ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat 3660
cggcctgtcg cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg 3720
tcccgccacc aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccccacg 3780
ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta ggctggcggg gttgccttac 3840
tggttagcag aatgaatcac cgatacgcga gcgaacgtga agcgactgct gctgcaaaac 3900
gtctgcgacc tgagcaacaa catgaatggt cttcggtttc cgtgtttcgt aaagtctgga 3960
aacgcggaag tcagcgccct gcaccattat gttccggatc tgcatcgcag gatgctgctg 4020
gctaccctgt ggaacaccta catctgtatt aacgaagcgc tggcattgac cctgagtgat 4080
ttttctctgg tcccgccgca tccataccgc cagttgttta ccctcacaac gttccagtaa 4140
ccgggcatgt tcatcatcag taacccgtat cgtgagcatc ctctctcgtt tcatcggtat 4200
cattaccccc atgaacagaa atccccctta cacggaggca tcagtgacca aacaggaaaa 4260
aaccgccctt aacatggccc gctttatcag aagccagaca ttaacgcttc tggagaaact 4320
caacgagctg gacgcggatg aacaggcaga catctgtgaa tcgcttcacg accacgctga 4380
tgagctttac cgcagctgcc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat 4440
gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg 4500
tcagggcgcg tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc agtcacgtag 4560
cgatagcgga gtgtatactg gcttaactat gcggcatcag agcagattgt actgagagtg 4620
caccatatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 4680
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 4740
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 4800
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 4860
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 4920
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 4980
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 5040
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 5100
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 5160
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 5220
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 5280
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 5340
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 5400
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 5460
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 5520
tggtcatgaa caataaaact gtctgcttac ataaacagta atacaagggg tgttatgagc 5580
catattcaac gggaaacgtc ttgctctagg ccgcgattaa attccaacat ggatgctgat 5640
ttatatgggt ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga 5700
ttgtatggga agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc 5760
aatgatgtta cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg 5820
accatcaagc attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc 5880
gggaaaacag cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat 5940
gcgctggcag tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac 6000
agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat 6060
gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg 6120
cataaacttt tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat 6180
aaccttattt ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc 6240
gcagaccgat accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca 6300
ttacagaaac ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag 6360
tttcatttga tgctcgatga gtttttctaa gaattaattc atgagcggat acatatttga 6420
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 6480
tgaaattgta aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 6540
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 6600
gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 6660
caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 6720
ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 6780
cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 6840
agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 6900
cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgcc 6948
<210> 5
<211> 40
<212> DNA
<213> 人工
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(40)
<223> 引物UmIEM-NdeI-F的核酸序列
<400> 5
ggaattccat atggccccta ccgcaaccca ggaccctgtg 40
<210> 6
<211> 40
<212> DNA
<213> 人工
<220>
<223> 合成多核苷酸
<220>
<221> misc_feature
<222> (1)..(40)
<223> 引物UmIEM-XhoI-R的核酸序列
<400> 6
ccgctcgagt tacatattcg gatcaaatgc gctctggctc 40

Claims (25)

1.一种产生香草醛的生物转化方法,所述方法包括:
a.在混合物中表达UmIEM基因,其中所述UmIEM基因的所表达的蛋白具有与所述混合物中的SEQ ID NO:2具有至少70%同一性的氨基酸序列;
b.将异丁香酚进料到所述混合物中;以及
c.将异丁香酚转化为香草醛。
2.根据权利要求1所述的方法,其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少80%同一性的氨基酸序列。
3.根据权利要求1所述的方法,其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少90%同一性的氨基酸序列。
4.根据权利要求1所述的方法,其中所表达的UmIEM蛋白具有与SEQ ID NO:2具有至少95%同一性的氨基酸序列。
5.根据权利要求1所述的方法,其中所述表达所述UmIEM基因的步骤选自由以下组成的组:通过体外翻译表达所述基因;在细胞系统中表达所述基因;以及在细菌或酵母细胞中表达所述基因。
6.根据权利要求5所述的方法,其进一步包括对来自将所述UmIEM基因表达为重组蛋白的步骤的产物进行纯化。
7.根据权利要求1所述的方法,其进一步包括收集所述香草醛。
8.根据权利要求7所述的方法,其中从异丁香酚到香草醛的转化率高于80%。
9.根据权利要求7所述的方法,其中从异丁香酚到香草醛的转化率高于85%。
10.根据权利要求7所述的方法,其中从异丁香酚到香草醛的转化率高于90%。
11.一种使用分离的重组宿主细胞产生香草醛的方法,所述方法包括:
(i)在培养基中培养分离的重组宿主细胞;
(ii)将异丁香酚添加到(i)的所述培养基中,以开始将异丁香酚生物转化为香草醛;以及
(iii)从所述培养基中提取香草醛,其中已使用包括编码异丁香酚单加氧酶的多核苷酸序列的核酸构建体转化所述分离的重组宿主细胞,其中所述异丁香酚单加氧酶具有与SEQID NO:2具有至少70%同一性的氨基酸序列。
12.根据权利要求11所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少80%同一性的氨基酸序列。
13.根据权利要求11所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少90%同一性的氨基酸序列。
14.根据权利要求11所述的方法,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少95%同一性的氨基酸序列。
15.一种制造可消费产品的方法,所述方法包括以下步骤:根据权利要求1所述的方法产生香草醛;收集所述香草醛;以及将所述香草醛掺入到可消费产品中。
16.根据权利要求15所述的方法,其包括将所述香草醛与所述可消费产品混合的步骤。
17.根据权利要求15所述的方法,其中所述香草醛以足以赋予风味调性的量掺入到所述可消费产品中。
18.根据权利要求15所述的方法,其中所述可消费产品选自由以下组成的组:风味产品、食物产品、食物前体产品、在食物的生产中采用的添加剂、药物组合物、膳食补充剂、营养品和化妆品。
19.根据权利要求15所述的方法,其中所述香草醛以足以赋予香气调性的量掺入到所述可消费产品中。
20.根据权利要求15所述的方法,其中所述可消费产品选自由以下组成的组:芳香产品、化妆品、卫生间产品和房屋清洁产品。
21.一种使用核酸构建体转化的分离的重组宿主细胞,所述核酸构建体包括编码异丁香酚单加氧酶的多核苷酸序列,其中所述异丁香酚单加氧酶具有与SEQ ID NO:2具有至少70%同一性的氨基酸序列。
22.根据权利要求21所述的分离的重组宿主细胞,其中所述多核苷酸序列包括与SEQID NO:1的核酸序列至少90%相同的序列。
23.根据权利要求21所述的分离的重组宿主细胞,其进一步包括含有SEQ ID NO:4的分离的核酸序列的载体。
24.根据权利要求21所述的分离的重组宿主细胞,其中所述宿主细胞选自由以下组成的组:细菌、酵母、不是黑粉菌属(Ustilago)的真菌、藻青菌、藻类和植物细胞。
25.根据权利要求21所述的分离的重组宿主细胞,其中所述宿主细胞选自由以下组成的微生物组:埃希氏菌属(Escherichia);沙门氏菌属(Salmonella);芽孢杆菌属(Bacillus);不动杆菌属(Acinetobacter);链霉菌属(Streptomyces);棒状杆菌属(Corynebacterium);甲基弯曲菌属(Methylosinus);甲基单胞菌属(Methylomonas);红球菌属(Rhodococcus);假单胞菌属(Pseudomonas);红杆菌属(Rhodobacter);集胞藻属(Synechocystis);酵母菌属(Saccharomyces);接合酵母菌属(Zygosaccharomyces);克鲁维酵母菌属(Kluyveromyces);假丝酵母菌属(Candida);汉逊氏酵母菌属(Hansenula);德巴利氏酵母菌属(Debaryomyces);毛霉菌属(Mucor);毕赤酵母菌属(Pichia);球拟酵母菌属(Torulopsis);曲霉菌属(Aspergillus);节丛孢属(Arthrobotlys);短杆菌属(Brevibacteria);微杆菌属(Microbacterium);节杆菌属(Arthrobacter);柠檬酸杆菌属(Citrobacter);克雷伯菌属(Klebsiella);泛菌属(Pantoea);以及梭菌属(Clostridium)。
CN202180087914.4A 2020-12-18 2021-12-17 由异丁香酚生物合成香草醛 Pending CN116867894A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063127503P 2020-12-18 2020-12-18
US63/127,503 2020-12-18
PCT/US2021/064140 WO2022133274A1 (en) 2020-12-18 2021-12-17 Biosynthesis of vanillin from isoeugenol

Publications (1)

Publication Number Publication Date
CN116867894A true CN116867894A (zh) 2023-10-10

Family

ID=80050990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180087914.4A Pending CN116867894A (zh) 2020-12-18 2021-12-17 由异丁香酚生物合成香草醛

Country Status (4)

Country Link
US (1) US20240052380A1 (zh)
EP (1) EP4263846A1 (zh)
CN (1) CN116867894A (zh)
WO (1) WO2022133274A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117924053A (zh) * 2024-03-22 2024-04-26 山东新和成药业有限公司 一种氧化异丁香酚制备香兰素的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106754773B (zh) * 2016-12-26 2020-04-24 波顿(上海)生物技术有限公司 一种异丁香酚单加氧酶操纵子基因及其重组载体和重组假单胞菌
BR112020017362A2 (pt) * 2018-03-29 2020-12-29 Firmenich S.A. Método para produzir vanilina
MX2021013176A (es) * 2019-04-29 2022-01-04 Conagen Inc Biosintesis de vainillina a partir de isoeugenol.

Also Published As

Publication number Publication date
US20240052380A1 (en) 2024-02-15
EP4263846A1 (en) 2023-10-25
WO2022133274A1 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
DK2664670T3 (da) Perhydrolase
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
CN112725256B (zh) 重组大肠杆菌及利用重组大肠杆菌生物合成香叶木素的方法
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
CN109825488A (zh) 一种在大肠杆菌中进行木聚糖酶分泌表达的新方法
EP2181195A2 (de) Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges
KR20110063576A (ko) 효모에서 증가된 이종성 Fe-S 효소 활성
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
CN110577965B (zh) xCas9n-epBE碱基编辑系统在基因编辑中的应用
JP7387194B2 (ja) イソオイゲノールからのバニリンの生合成
CN114072507A (zh) 香草醛从异丁香酚的生物合成
CN116867894A (zh) 由异丁香酚生物合成香草醛
JP2021535757A (ja) バイカレインおよびスクテラレインを合成する微生物、その製造方法およびその使用
CN111607545B (zh) 一种高产法尼烯的重组菌及其构建方法与应用
CN108456687B (zh) 基于赖氨酸浓度控制的重组表达质粒、转化子及其应用
WO2014197457A1 (en) Production of dirhamnose-lipid in recombinant nonpathogenic bacterium pseudomonas chlororaphis
CN112912510A (zh) 用于生物生产乙酸甘油酯化合物的方法
CN114369560A (zh) 一种提高生物靛蓝产量的方法
CN113302303A (zh) 经修饰的丝状真菌宿主细胞
CN108728389B (zh) 一株用于生产2,3,5,6-四甲基吡嗪的大肠杆菌工程菌及其应用
KR20240009946A (ko) 레독스 민감성 cralbp 돌연변이 단백질
CN117222622A (zh) 多取代基裸盖菇素衍生物及使用方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination