CN108138151B - 苯丙素类和二氢苯丙素类衍生物的生物合成 - Google Patents

苯丙素类和二氢苯丙素类衍生物的生物合成 Download PDF

Info

Publication number
CN108138151B
CN108138151B CN201680044252.1A CN201680044252A CN108138151B CN 108138151 B CN108138151 B CN 108138151B CN 201680044252 A CN201680044252 A CN 201680044252A CN 108138151 B CN108138151 B CN 108138151B
Authority
CN
China
Prior art keywords
polypeptide
recombinant
seq
gene encoding
hydrogen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680044252.1A
Other languages
English (en)
Other versions
CN108138151A (zh
Inventor
迈克尔·内斯比
埃内斯托·西蒙贝西利亚
迈克尔·艾肯伯格
贝亚塔·乔安娜·列赫卡
沃尔登·埃米尔·比约恩-尤希莫托
尼尔斯·比约·詹森
简·丹诺·迪埃凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evolva Holding SA
Original Assignee
Evolva AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evolva AG filed Critical Evolva AG
Publication of CN108138151A publication Critical patent/CN108138151A/zh
Application granted granted Critical
Publication of CN108138151B publication Critical patent/CN108138151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • C12N9/002Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with a cytochrome as acceptor (1.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12N9/1037Naringenin-chalcone synthase (2.3.1.74), i.e. chalcone synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01038Trans-2-enoyl-CoA reductase (NADPH) (1.3.1.38)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01094Polyprenol reductase (1.3.1.94)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01095Trihydroxystilbene synthase (2.3.1.95)

Abstract

本文提供了用于在微生物中产生苯丙素类衍生物(例如查耳酮和茋)和二氢苯丙素类衍生物(例如二氢查耳酮和二氢茋)的方法和组合物。特别地,本公开内容提供了用于产生苯丙素类衍生物化合物和二氢苯丙素类衍生物化合物的重组微生物及使用所述重组微生物的方法。

Description

苯丙素类和二氢苯丙素类衍生物的生物合成
相关申请的交叉引用
本申请要求2015年6月5日提交的美国临时申请No.62/171,742、2016年5月3日提交的美国临时申请No.62/331,023和2016年5月17日提交的美国临时申请No.62/337,576的权益,其各自的公开内容通过引用整体并入本文。
发明背景
技术领域
本文提供了用于在宿主生物体中生物合成产生化合物的方法和组合物。特别地,本公开内容涉及生物合成产生苯丙素类(phenylpropanoid)衍生物化合物(例如查耳酮和茋)和二氢苯丙素类衍生物化合物(例如二氢查耳酮和二氢茋)。
相关技术说明
苯丙素类是植物中由酚类氨基酸前体生物合成产生的多样的酚类化合物家族。苯丙素类及其衍生物具有期望的应用,例如在食品和卫生保健工业中具有期望的应用。
一种示例性苯丙素类衍生物是柚皮素,该化合物也是下游苯丙素类衍生物产生中的中间体。柚皮素具有以下化学结构:
Figure BPA0000256041170000011
柚皮素在植物中天然产生,并且还在遗传改造成具有类黄酮生物合成途径组分的细胞中生物合成产生(参见例如,Koopman等,(2012)Microbial Cell Factories 2012,11:155)。例如,将改造成产生香豆酰CoA的细胞进一步改造成具有表达将香豆酰CoA转化成柚皮素的蛋白质的重组基因。
另一种示例性苯丙素类衍生物是茋类白藜芦醇,其也是产生其他下游苯丙素类衍生物中的中间体。白藜芦醇具有以下化学结构:
Figure BPA0000256041170000021
白藜芦醇也使用香豆酰CoA前体分子产生。二氢苯丙素类是其中苯丙素类丙烯尾部的双键被还原的苯丙素类衍生物。二氢苯丙素类(例如二氢香豆酰CoA或二氢肉桂酰CoA)在产生多种期望化合物(例如二氢查耳酮的成员和二氢茋类(dihydrostilbenoid)的成员)中提供了重要的生物合成中间体。
二氢茋类的实例是二氢白藜芦醇和二氢赤松素,其分别由二氢香豆酰CoA或二氢肉桂酰CoA的茋合酶(stilbene synthase,STS)催化的转化而产生,并且由以下化学结构表示:
Figure BPA0000256041170000022
amorfrutin是另一类具有潜在健康益处的二氢苯丙素类衍生的二氢茋类植物化合物。参见,例如Sauer,Chembiochem 2014,15(9):1231-8。amorfrutin的一个实例是amorfrutin 2,其由以下化学结构表示:
Figure BPA0000256041170000031
二氢查耳酮类(dihydrochalconoid)化合物的一个实例是根皮苷。根皮苷天然存在于一些植物中,包括梨树、苹果树、樱桃树和其他果树。已经显示,根皮苷抑制参与从肠和肝的葡萄糖重吸收的钠/葡萄糖协同转运蛋白1(Sodium/Glucose Cotransporter 1,SGLT1)和钠/葡萄糖协同转运蛋白2(Sodium/Glucose Cotransporter 2,SGLT2)。因此,根皮苷具有控制血糖水平的潜在用途,例如预防与2型糖尿病相关的高血糖症,以及其他改善人健康的潜在用途。根皮苷由以下化学结构表示:
Figure BPA0000256041170000032
二氢苯丙素类衍生物的另一个实例是根皮苷的生物合成前体,称为根皮素(根皮苷是根皮素的2′-葡糖苷)。根皮素与根皮苷共有一些相同的特性,包括例如抑制SGLT1和SGLT2的主动转运的能力。此外,已发现根皮素抑制葡萄糖转运蛋白2(GlucoseTransporter 2,GLUT2)。根皮素由以下化学结构表示:
Figure BPA0000256041170000033
二氢查耳酮(例如根皮素和根皮苷)和二氢茋二者的生物合成途径的一个步骤是苯丙素类(例如对香豆酰CoA)转化成二氢苯丙素类(例如对二氢香豆酰CoA)。改造为用于对香豆酰CoA生物合成的重组宿主是本领域已知的(参见例如美国专利No.8,343,739)。然而,仍然需要将苯丙素类重组转化成二氢苯丙素类。
另外,目前产生柚皮素、白藜芦醇和其他苯丙素类衍生物的方法由于竞争苯丙素类如香豆酰CoA作为底物的途径而受到限制。例如,已知某些改造成产生柚皮素的细胞还通过未知机制产生根皮酸(参见例如,Koopman等,(2012)Microbial Cell Factories 2012,11:155)。根皮酸是二氢苯丙素类,并且用于二氢苯丙素类产生的生物合成途径的一个步骤是将苯丙素类(例如对香豆酰CoA)转化成二氢苯丙素类(例如对二氢香豆酰CoA)。然而,负责产生二氢苯丙素类(并降低例如柚皮素的产生)的酶是未知的。因此,本领域需要在重组宿主细胞中优化产生苯丙素类衍生物如柚皮素。
发明概述
本文公开的方法和组合物不限于特定的优点或功能。
在一个方面,本公开内容提供了在重组宿主细胞中调节苯丙素类衍生物化合物相对于二氢苯丙素类衍生物化合物的产生的方法,所述方法包括:(a)通过降低或消除(i)双键还原酶活性或(ii)编码双键还原酶多肽的基因的表达来提高所述苯丙素类衍生物化合物相对于所述二氢苯丙素类衍生物化合物的产生;或者(b)通过提高(i)双键还原酶活性或(ii)编码双键还原酶多肽的基因的表达来降低所述苯丙素类衍生物化合物相对于所述二氢苯丙素类衍生物化合物的产生;其中所述苯丙素类衍生物化合物是查耳酮或茋,并且其中所述二氢苯丙素类衍生物化合物是二氢查耳酮或二氢茋。在一些实施方案中,双键还原酶多肽是:(a)烯酰还原酶多肽;或(b)多萜醇还原酶多肽。在一些实施方案中,烯酰还原酶多肽是酿酒酵母(S.cerevisiae)反式-2-烯酰CoA还原酶TSC13。在一些实施方案中,多萜醇还原酶多肽是酿酒酵母DFG10。在一些实施方案中,苯丙素类衍生物化合物是柚皮素、白藜芦醇、赤松素、松属素查耳酮或松属素。在一些实施方案中,二氢苯丙素类衍生物化合物是根皮素、根皮苷、二氢赤松素、3-O-甲基二氢赤松素、2-异戊二烯基-3-O-甲基二氢赤松素或二氢白藜芦醇。在一些实施方案中,编码还原酶多肽的基因包含SEQ ID NO:7或SEQ ID NO:43。在一些实施方案中,编码还原酶多肽的基因包含与SEQ ID NO:7具有至少70%同一性或与SEQ ID NO:43具有至少80%同一性的核苷酸序列。在一些实施方案中,编码还原酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:22;(b)SEQ ID NO:26;(c)与SEQ IDNO:22具有至少70%同一性的多肽;或(d)与SEQ ID NO:26具有至少75%同一性的多肽。
在另一个方面,本公开内容提供了重组酵母细胞,其包含编码双键还原酶多肽的基因,其中所述基因的表达或由其编码的双键还原酶多肽的活性被降低或消除。在一些实施方案中,双键还原酶多肽是:(i)烯酰还原酶多肽;或(ii)多萜醇还原酶多肽。在一些实施方案中,烯酰还原酶多肽是酿酒酵母反式-2-烯酰CoA还原酶TSC13。在一些实施方案中,多萜醇还原酶多肽是酿酒酵母DFG10。在一些实施方案中,编码还原酶多肽的基因包含SEQ IDNO:7或SEQ ID NO:43。在一些实施方案中,编码还原酶多肽的基因包含与SEQ ID NO:7具有至少70%同一性或与SEQ ID NO:43具有至少80%同一性的核苷酸序列。在一些实施方案中,编码还原酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:22;(b)SEQ IDNO:26;(c)与SEQ ID NO:22具有至少70%同一性的多肽;或(d)与SEQ ID NO:26具有至少75%同一性的多肽。
在本文公开的重组酵母细胞的一些实施方案中,重组酵母细胞还包含编码部分或完全补充所述双键还原酶多肽之功能的酶的重组基因。在一些实施方案中,编码部分或完全补充所述双键还原酶多肽之功能的酶的重组基因包含:(a)SEQ ID NO:94至96中的任一个,或(b)与SEQ ID NO:94至96中任一个具有至少65%同一性的核苷酸序列。在一些实施方案中,编码部分或完全补充所述双键还原酶多肽之功能的酶的重组基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:65至67中的任一个,或(b)与SEQ ID NO:65至67中任一个具有至少65%同一性的多肽。
在本文公开的重组酵母细胞的一些实施方案中,重组酵母细胞还包含编码III型聚酮合酶多肽的重组基因。在一些实施方案中,III型聚酮合酶多肽是:(i)查耳酮合酶多肽;或(ii)茋合酶多肽。在一些实施方案中,编码查耳酮合酶多肽的基因包含SEQ ID NO:4。在一些实施方案中,编码查耳酮合酶多肽的基因包含与SEQ ID NO:4具有至少65%同一性的核苷酸序列。在一些实施方案中,编码查耳酮合酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:19;或(b)与SEQ ID NO:19具有至少65%同一性的多肽。在一些实施方案中,编码茋合酶多肽的基因包含SEQ ID NO:23。在一些实施方案中,编码茋合酶多肽的基因包含与SEQ ID NO:23具有至少70%同一性的核苷酸序列。在一些实施方案中,编码茋合酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:24;或(b)与SEQ ID NO:24具有至少80%同一性的多肽。
在本文公开的重组酵母细胞的一些实施方案中,重组酵母细胞还包含以下一种或更多种:(c)编码苯丙氨酸解氨酶多肽的重组基因;(d)编码肉桂酸4-羟化酶多肽的重组基因;(e)编码4-香豆酸-CoA连接酶多肽的重组基因;(f)编码细胞色素p450多肽的重组基因;或(g)编码查耳酮异构酶多肽的重组基因。
在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因包含SEQ ID NO:1.在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因包含与SEQ ID NO:1具有至少70%同一性的核苷酸序列。在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:16;或(b)与SEQ ID NO:16具有至少70%同一性的多肽。
在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因包含SEQ ID NO:2。在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因包含与SEQ ID NO:2具有至少70%同一性的核苷酸序列。在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:17;或(b)与SEQ ID NO:17具有至少70%同一性的多肽。
在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因包含SEQ ID NO:3。在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因包含与SEQ ID NO:3具有至少65%同一性的核苷酸序列。在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:18;或(b)与SEQ ID NO:18具有至少65%同一性的多肽。
在一些实施方案中,编码细胞色素p450多肽的基因包含SEQ ID NO:6。在一些实施方案中,编码细胞色素p450多肽的基因包含与SEQ ID NO:6具有至少65%同一性的核苷酸序列。在一些实施方案中,编码细胞色素p450多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:21;或(b)与SEQ ID NO:21具有至少65%同一性的多肽。
在一些实施方案中,编码查耳酮异构酶多肽的基因包含SEQ ID NO:80至86中的任一个。在一些实施方案中,编码查耳酮异构酶多肽的基因包含与SEQ ID NO:80至86中任一个具有至少60%同一性的核苷酸序列。在一些实施方案中,编码查耳酮异构酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:87至93中的任一个;或(b)与SEQ ID NO:87至93中任一个具有至少65%同一性的多肽。
在本文公开的重组酵母细胞的一些实施方案中,重组酵母细胞能够产生苯丙素类或苯丙素类衍生物化合物。在一些实施方案中,苯丙素类是肉桂酸或香豆酸。在一些实施方案中,苯丙素类衍生物化合物是查耳酮化合物或茋类化合物。
在一些实施方案中,重组酵母细胞是酿酒酵母(Saccharomyces cerevisiae)细胞、粟酒裂殖酵母(Schizosaccharomyces pombe)细胞、解脂耶氏酵母(Yarrowialipolytica)细胞、光滑念珠菌(Candida glabrata)细胞、棉阿舒囊霉(Ashbya gossypii)细胞、产朊假丝酵母(Cyberlindnera jadinii)细胞、巴斯德毕赤酵母(Pichia pastoris)细胞、乳酸克鲁维酵母(Kluyveromyces lactis)细胞、多形汉逊酵母(Hansenulapolymorpha)细胞、博伊丁假丝酵母(Candida boidinii)细胞、Arxula adeninivorans细胞、红发夫酵母(Xanthophyllomyces dendrorhous)细胞或白色念珠菌(Candidaalbicans)细胞。在一些实施方案中,重组酵母细胞是酵母菌(Saccharomycete)。在一些实施方案中,重组酵母细胞是来自酿酒酵母物种的细胞。
在另一个方面,本公开内容提供了产生苯丙素类化合物或苯丙素类衍生物化合物的方法,所述方法包括在其中表达重组基因的条件下,在培养基中培养如本文所公开的重组酵母细胞,并且其中苯丙素类化合物或苯丙素类衍生物化合物通过重组酵母细胞合成。在一些实施方案中,苯丙素类化合物是肉桂酸或香豆酸。在一些实施方案中,苯丙素类衍生物化合物是查耳酮化合物或茋化合物。在一些实施方案中,查耳酮化合物包含白藜芦醇。
在另一个方面,本公开内容提供了产生式(III)化合物或其可药用盐的方法:
Figure BPA0000256041170000071
其中
A是键或C=O;
n是整数0、1、2、3或4;
Figure BPA0000256041170000081
是双键时,R是氢,或者当A是C=O且
Figure BPA0000256041170000082
是单键时,R和R5与其所连接的原子一起形成6元杂环基;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基;
所述方法包括在其中表达重组基因的条件下,在培养基中培养本公开内容的重组酵母细胞,并且其中式I化合物通过所述重组酵母细胞合成。在一些实施方案中,所述方法还包括收获所述化合物。在一些实施方案中,所述方法还包括分离所述化合物。
在另一个方面,本公开内容提供了重组宿主细胞,其包含:(a)编码烯酰还原酶多肽的重组基因;和(b)编码III型聚酮合酶多肽的重组基因。在一些实施方案中,烯酰还原酶多肽被过表达。在一些实施方案中,烯酰还原酶多肽是反式-2-烯酰CoA还原酶。在一些实施方案中,反式-2-烯酰CoA还原酶是酿酒酵母TSC13。在一些实施方案中,编码烯酰还原酶多肽的基因包含SEQ ID NO:7。在一些实施方案中,编码烯酰还原酶多肽的基因与SEQ ID NO:7具有至少70%同一性。在一些实施方案中,编码烯酰还原酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:22;或(b)与SEQ ID NO:22具有至少70%同一性的多肽。
在一些实施方案中,编码III型聚酮合酶多肽的重组基因包含:(i)编码查耳酮合酶多肽的重组基因;或(ii)编码茋合酶多肽的重组基因。在一些实施方案中,编码查耳酮合酶多肽的基因包含SEQ ID NO:4、27或68至70之一。在一些实施方案中,编码查耳酮合酶多肽的基因包含与SEQ ID NO:4、27或68至70之一具有至少65%同一性的核苷酸序列。在一些实施方案中,编码查耳酮合酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:19、49或71至73之一;(b)与SEQ ID NO:19、49或71至73之一具有至少65%同一性的多肽;或(c)在SEQ ID NO:19或71至73之一的覆盖第95至105、132至142、191至201和266至276位氨基酸的组合区域中与所述SEQ ID NO:19或71至73之一具有至少90%序列同一性的多肽。在一些实施方案中,编码茋合酶多肽的基因包含SEQ ID NO:23。在一些实施方案中,编码茋合酶多肽的基因包含与SEQ ID NO:23具有至少70%同一性的核苷酸序列。在一些实施方案中,编码茋合酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:24;或(b)与SEQ ID NO:24具有至少80%同一性的多肽。
在一些实施方案中,重组宿主细胞还包含以下一种或更多种:(c)编码苯丙氨酸解氨酶多肽的重组基因;(d)编码肉桂酸4-羟化酶多肽的重组基因;(e)编码4-香豆酸-CoA连接酶多肽的重组基因;(f)编码细胞色素p450多肽的重组基因;或(g)编码UDP糖基转移酶(UDP glycosyl transferase,UGT)多肽的重组基因。在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因包含SEQ ID NO:1。在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因包含与SEQ ID NO:1具有至少70%同一性的核苷酸序列。在一些实施方案中,编码苯丙氨酸解氨酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:16;或(b)与SEQ ID NO:16具有至少70%同一性的多肽。在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因包含SEQID NO:2。在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因包含与SEQ ID NO:2具有至少70%同一性的核苷酸序列。在一些实施方案中,编码肉桂酸4-羟化酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:17;或(b)与SEQ ID NO:17具有至少70%同一性的多肽。在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因包含SEQ ID NO:3。在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因包含与SEQ ID NO:3具有至少65%同一性的核苷酸序列。在一些实施方案中,编码4-香豆酸-CoA连接酶多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:18;或(b)与SEQ ID NO:18具有至少65%同一性的多肽。在一些实施方案中,编码UDP糖基转移酶(UGT)多肽的基因包含SEQ ID NO:5。在一些实施方案中,编码UDP糖基转移酶(UGT)多肽的基因包含与SEQ ID NO:5具有至少65%同一性的核苷酸序列。在一些实施方案中,编码UDP糖基转移酶(UGT)多肽的基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:20;或(b)与SEQ ID NO:20具有至少70%同一性的多肽。
在一些实施方案中,重组宿主细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些实施方案中,细菌细胞包含埃希氏菌属(Escherichia)细胞、乳杆菌属(Lactobacillus)细胞、乳球菌属(Lactococcus)细胞、棒状杆菌属(Cornebacterium)细胞、醋杆菌属(Acetobacter)细胞、不动杆菌属(Acinetobacter)细胞或假单胞菌属(Pseudomonas)细胞。在一些实施方案中,酵母细胞包含酿酒酵母细胞、粟酒裂殖酵母细胞、解脂耶氏酵母细胞、光滑念珠菌细胞、棉阿舒囊霉细胞、产朊假丝酵母细胞、巴斯德毕赤酵母细胞、乳酸克鲁维酵母细胞、多形汉逊酵母细胞、博伊丁假丝酵母细胞、Arxula adeninivorans细胞、红发夫酵母细胞或白色念珠菌细胞。在一些实施方案中,酵母细胞是酵母菌。在一些实施方案中,酵母细胞是来自酿酒酵母物种的细胞。
在另一个方面,本公开内容提供了产生二氢苯丙素类衍生物化合物(例如二氢查耳酮化合物或二氢茋化合物)的方法,其包括在其中表达重组基因的条件下,在培养基中培养本文公开的重组宿主细胞,并且其中所述化合物通过所述重组宿主细胞合成。在一些实施方案中,所述方法是产生二氢查耳酮化合物的方法。在一些实施方案中,二氢查耳酮化合物是根皮素或根皮素衍生物。在一些实施方案中,根皮素衍生物是根皮苷。在一些实施方案中,所述方法是产生二氢茋类化合物的方法。
在另一个方面,本公开内容提供了产生式(III)化合物或其可药用盐的方法:
Figure BPA0000256041170000111
其中
A是键或C=O;
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基;
所述方法包括在其中表达重组基因的条件下,在培养基中培养本文公开的重组宿主细胞,并且其中式III化合物通过所述重组宿主细胞合成。在一些实施方案中,所述方法还包括从培养基中收获所述化合物。在一些实施方案中,所述方法还包括从培养基中分离所述化合物。
根据以下详细描述结合所附权利要求书一起将更加充分地理解这些以及其他特征和优点。
附图简述
当结合以下附图阅读时可最佳地理解以下详细描述,在附图中:
图1对比了苯丙素类衍生的查耳酮和茋的生物合成与二氢苯丙素类衍生的二氢查耳酮和二氢茋的生物合成。双键还原酶(double bond reductase,DBR)的作用使这些生物合成分支分开。
图2示出了通过DBR酶的作用分开的从对香豆酸到不同苯丙素类衍生物和二氢苯丙素类衍生物的苯丙素类途径分支。(在图3中示出了从肉桂酸(而不是对香豆酸)的对应途径)。在每侧示出了两种III型PKS酶的作用:查耳酮合酶(chalcone synthase,CHS)和茋合酶(STS)。其他酶缩写是:苯丙氨酸裂解酶(PAL或TAL);需要还原酶(CPR)活性的肉桂酸-4-羟化酶(cinnamate-4-hydroxylase,C4H);4-香豆酰CoA连接酶(4-Coumaroyl-CoA ligase,4CL);查耳酮异构酶(chalcone isomerase,CHI);和根皮苷葡糖基转移酶(phlorizinglucosyl transferase,P2’UGT)。
图3示出了从肉桂酸(而不是图2所示的对香豆酸)分支的苯丙素类/二氢苯丙素类途径。如图2,在每侧示出了由CHS和STS表示的两个分支。其他酶缩写是:O-甲基转移酶(O-methyl transferase,OMT)和异戊烯基转移酶(prenyltransferase,PT)。
图4示出了基于UPLC-MS峰积分的菌株Sc1.0、Sc1.1和Sc1.2中二氢香豆酰CoA衍生物根皮素(m/z=274.3Da)和对香豆酰CoA衍生物柚皮素(m/z 272.3)的产量。当Tsc13活性或表达低时,苯丙素类柚皮素的产量增加。
图5示出了基于LC-MS峰积分的菌株Sc1.0、Sc1.1和Sc1.3中根皮素(m/z=274.3Da)和根皮苷(m/z=436.4Da)的产量。
图6示出了具有11种不同查耳酮合酶的酵母菌株中根皮素(m/z=274.3Da)和根皮苷(m/z=436.4Da)的产量(基于LC-MS峰积分)。
图7示出了过表达多种不同烯酰还原酶的酵母菌株中根皮素(m/z=274.3Da)和柚皮素(m/z=272.3Da)的产量(基于LC-MS峰积分),以及每种菌株的根皮素产量与柚皮素产量的比率。
图8示出了与核心茋途径组合过表达TSC13的酵母菌株中白藜芦醇(m/z=228.2Da)和二氢白藜芦醇(m/z=230.2Da)的产量(基于LC-MS峰积分)。
图9示出了过表达CHS2 Hv的天然酶和三种突变体的酵母菌株中根皮素(m/z=274.3Da)和柚皮素(m/z=272.3Da)的产量(基于LC-MS峰积分),以及每种菌株的根皮素产量与柚皮素产量的比率。
图10示出了酿酒酵母的PIN和PINDHC菌株中松属素二氢查耳酮(m/z=258.3Da)和松属素(m/z=256.3Da)的产量(基于LC-MS峰积分)。
图11示出了由多种酵母还原酶敲除菌株产生的白藜芦醇与根皮酸的比率。
图12示出了由另外的酵母还原酶敲除菌株产生的白藜芦醇与根皮酸的比率。
图13示出了在SC培养基中培养4天后,由不同敲除菌株消耗的香豆酸和产生的根皮酸的水平。
图14示出了以下基础菌株中的苯丙素类途径谱:在着丝粒质粒PSB33上过表达TSC13(pROP492)(菌株Sc10.4中)和DFG10(pROP493)(菌株Sc10.5中)的基础菌株Sc10.1(对照菌株Sc10.3)(图14A),以及在PSB34上过表达TSC13(pROP494)(菌株Sc10.7中)和DFG10(pROP495)(菌株Sc10.8中)的基础菌株Sc10.2(对照菌株Sc10.6)(图14B)。
图15示出了具有以下的酿酒酵母菌株的色谱图:(A)单独PAL,其导致产生肉桂酸;(B)PAL与C4HL5ATR2,其导致产生香豆酸;(C)PAL与C4HL5ATR2和4Cl,其导致产生根皮酸(二氢香豆酸);以及(D)PAL与4Cl,其导致产生二氢肉桂酸。
图16示出了具有不同Tsc13直系同源物的酿酒酵母菌株中苯丙素类途径中间体的产生。在合成的补料分批培养基中进行产生测试。T1-表达AtECR的菌株,T2-表达Gh2ECR的菌株,T3-表达MdECR的菌株,C-背景菌株对照。
图17示出了培养72小时的酵母细胞的形态。背景对照菌株示出在左侧,表达MdECR的菌株示出在右侧。放大倍率400×。
发明详述
本文中引用的所有出版物、专利和专利申请均出于所有目的而在此明确地通过引用并入。
由于很多苯丙素类衍生物和二氢苯丙素类衍生物尤其可用作药物化合物,因此需要用于其产生的高效方法。例如,二氢查耳酮类根皮苷和根皮素可用于控制血糖水平以及其他改善人健康的潜在用途。查耳酮类柚皮素和茋类白藜芦醇可用于控制血糖水平以及其他改善人健康的潜在用途。
因此,本文中提供了可用于生物合成苯丙素类衍生物(包括查耳酮和茋)和二氢苯丙素类衍生物(包括二氢查耳酮和二氢茋)的材料和方法。在一些实施方案中,本公开内容提供了用于生物合成柚皮素和其他查耳酮的重组宿主和方法。在一些实施方案中,本公开内容提供了用于生物合成白藜芦醇和其他茋的重组宿主和方法。在一些实施方案中,本公开内容提供了用于生物合成根皮苷和根皮苷前体的重组宿主和方法。
在详细描述所公开的方法和组合物之前,将对多个术语进行定义。除非上下文另外明确指出,否则本文中使用的没有数量词修饰的名词涵盖一个/种和/或更多个/种。例如,提到“核酸”是指一个/种或更多个/种核酸。
应注意,例如“优选”、“一般”和“通常”的术语在本文中不用于限制所要求保护发明的范围或暗指某些特征对于所要求保护发明的结构或功能是关键的、必要的或甚至重要的。相反,这些术语仅仅旨在突出可以或不可以用于本发明特定实施方案中的替选的或额外的特征。
出于描述和定义本发明的目的,应注意,术语“基本上”在本文中用于表示可归因于任何定量比较、值、测量或其他表述的固有不确定程度。术语“基本上”在本文中还用于表示定量表示可与所述参照不同但不导致所讨论主题的基本功能改变的程度。
可以使用本领域技术人员公知的方法来构建本文中公开的遗传表达构建体和重组细胞。这些方法包括体外重组DNA技术、合成技术、体内重组技术和聚合酶链反应(PCR)技术。参见,例如Maniatis等,1989,MOLECULAR CLONING:A LABORATORY MANUAL,Cold SpringHarbor Laboratory,New York;Ausubel等,1989,CURRENT PROTOCOLS IN MOLECULARBIOLOGY,Greene Publishing Associates and Wiley Interscience,New York;以及PCRProtocols:A Guide to Methods and Applications(Innis等,1990,Academic Press,SanDiego,CA)中所述的技术。
本文中使用的术语“多核苷酸”、“核苷酸”、“寡核苷酸”和“核酸”可互换使用,是指包含DNA、RNA、其衍生物、或其组合的核酸。
本文中使用的术语“微生物”、“微生物宿主”、“微生物宿主细胞”、“重组宿主”、“宿主细胞”和“重组宿主细胞”可以互换使用。本文中使用的术语“重组宿主”旨在是指其基因组已增加至少一个DNA序列的宿主。这样的DNA序列包括但不限于不是天然存在的、在细胞中不正常转录成RNA也不天然翻译成蛋白质(“表达”)的基因或DNA序列,以及期望引入宿主中的其他基因或DNA序列。应理解,通常通过稳定引入一个或更多个重组基因来增加本文中所述重组宿主的基因组。一般来说,引入的DNA最初并不存在于为该DNA的接受者的宿主中,但是从给定宿主分离DNA区段并随后将该DNA的一个或更多个另外拷贝引入同一宿主中,例如以增强基因产物的产生或改变基因的表达模式在本公开内容的范围内。在一些情况下,引入的DNA将通过例如同源重组或定点诱变修饰或甚至替代内源基因或DNA序列。合适的重组宿主包括微生物。
本文中使用的术语“基因”是指由本文中公开的至少一个DNA序列、或编码本文中公开的氨基酸序列的任何DNA序列、或与本文中公开的编码序列的互补物杂交的任何DNA序列构成的多核苷酸单元。优选地,该术语包括编码区和非编码区,以及优选地正常基因表达所必需的所有序列,包括启动子、增强子以及其他调节序列。
本文中使用的术语“重组基因”是指引入到接受者宿主中的基因或DNA序列,不管这样的宿主中是否可已存在相同或类似的基因或DNA序列。在此背景下,“引入”或“增加”在本领域中是已知的,意指人工(hand of man)引入或增加。因此,重组基因可以是来自另一物种的DNA序列,或者可以是来源于或存在于相同物种但已通过重组方法整合到宿主中形成重组宿主的DNA序列。应理解,引入宿主中的重组基因可以与正常存在于所转化宿主中的DNA序列相同,并且被引入以提供该DNA的一个或更多个另外拷贝从而允许过表达或修饰该DNA的基因产物的表达。重组基因特别地由cDNA编码。
编码本文中所述多肽的重组基因包含所述多肽的编码序列,其在有义方向上与适于表达所述多肽的一个或更多个调节区有效连接。由于很多微生物能够从多顺反子mRNA表达多种基因产物,因此如果需要的话,对于这些微生物可以在单调节区的控制下任选地表达多种多肽。当调节区和编码序列被定位成使得调节区有效地用于调节该序列的转录或翻译时,编码序列和调节区是有效连接的。通常来说,编码序列的翻译阅读框的翻译起始位点位于单顺反子基因的调节区下游的1至约50个核苷酸。在很多情况下,本文中所述多肽的编码序列在不同于重组微生物的物种中鉴定到,即是异源核酸。因此,编码序列可以来自其他原核或真核微生物、来自植物或来自动物。然而,在一些情况下,编码序列是微生物天然的序列,并且被重新引入该生物体中。
本文中使用的术语“改造的生物合成途径”是指在如本文所述的重组宿主中发生并且在该宿主中不天然存在的生物合成途径。在一些实施方案中,改造的生物合成途径包含由宿主天然产生的酶,其中在某些实施方案中,编码这些酶的基因的表达程度和量在重组宿主中改变;在一些实施方案中,这些酶在重组宿主中过表达。
本文中使用的术语“内源”基因是指来源于特定生物体、组织或细胞并且在其中产生或合成的基因。
本文中使用的术语“异源序列”和“异源编码序列”用于描述来源于除重组宿主之外的物种的序列。在一些实施方案中,重组宿主是酿酒酵母细胞,并且异源序列来源于除酿酒酵母之外的生物体。异源编码序列例如可以来自与表达异源序列的重组宿主不同的原核微生物、真核微生物、植物、动物、昆虫或真菌。在一些实施方案中,编码序列是宿主天然的序列。
“调节区”是指具有影响转录或翻译起始和速率以及转录或翻译产物的稳定性和/或移动性的核苷酸序列的核酸。调节区包括但不限于启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导型元件、蛋白质结合序列、5’和3’非翻译区(UTR)、转录起始位点、终止序列、多腺苷酸化序列、内含子、及其组合。调节区通常包含至少一个核心(基本)启动子。调节区还可以包含至少一个控制元件,例如增强子序列、上游元件或上游激活区(UAR)。通过将调节区和编码序列定位成使得调节区有效地调节该序列的转录或翻译来使调节区与编码序列有效连接。例如,为了有效连接编码序列和启动子序列,通常将编码序列的翻译阅读框的翻译起始位点定位在启动子下游的1至约50个核苷酸。然而,调节区可以定位在更远距离,例如在翻译起始位点上游的多至约5,000个核苷酸,或者在转录起始位点上游的约2,000个核苷酸。
待包含的调节区的选择取决于数个因素,包括但不限于效率、可选择性、可诱导性、期望的表达水平和在某些培养阶段期间的优先表达。通过适当地选择并相对于编码序列定位调节区来调节编码序列的表达对于本领域技术人员而言是常规手段。应理解,可以存在多于一个调节区,例如内含子、增强子、上游激活区、转录终止子和诱导型元件。一个或更多个基因可以在重组核酸构建体中组合在可用于化合物产生的离散方面的“模块”中。在模块(特别是多顺反子模块)中组合多个基因有利于在多种物种中使用模块。除可用于化合物产生的基因之外,重组构建体通常还包含复制起点和一个或更多个用于使构建体维持在合适物种中的选择性标记。
应理解,由于遗传密码的筒并性,很多核酸可以编码特定的多肽;即对于很多氨基酸,存在多于一个核苷酸三联体用作氨基酸的密码子。因此,可以使用用于特定微生物的合适密码子偏好表修饰给定多肽的编码序列中的密码子,使得在该微生物中获得最佳表达。核酸也可以被优化成对特定微生物优选的GC含量,和/或降低重复序列的数目。作为分离的核酸,这些经修饰序列可以作为纯化分子存在,并且可以并入载体或病毒中用于构建用于重组核酸构建体的模块。另外,可以修饰异源核酸以在相关微生物中提高表达或甚至最佳表达。因此,在本文中公开的方法和组合物的一些实施方案中,异源核酸已被密码子优化用于在相关微生物中表达。密码子优化可以通过本领域已知的常规方法进行(参见例如Welch,M.,等(2011),Methods in Enzymology 498:43-66)。
苯丙素类衍生物和二氢苯丙素类衍生物
本文中使用的术语“查耳酮”和“查耳酮类”是可互换的并且是指式(I)化合物的衍生物:
Figure BPA0000256041170000181
其中式(I)可以在一个或更多个合适的位置被取代。示例性的取代基包括但不限于卤素、氰基、硝基、C1-C6烷基、C1-C6卤代烷基、C1-C6羟基烷基、羟基、C1-C6烷氧基、巯基(thiol)、C1-C6烷硫基、氨基、C1-C6烷基氨基、二C1-C6烷基氨基、羧基、C1-C6烷氧基羰基、酰氨基和糖基。
本文中使用的术语“茋”和“茋类”是可互换的并且是指基于式(II)化合物的化合物:
Figure BPA0000256041170000182
其中式(II)可以在一个或更多个合适的位置被取代。示例性的取代基包括但不限于卤素、氰基、硝基、C1-C6烷基、C1-C6卤代烷基、C1-C6羟基烷基、羟基、C1-C6烷氧基、巯基(thiol)、C1-C6烷硫基、氨基、C1-C6烷基氨基、二C1-C6烷基氨基、羧基、C1-C6烷氧基羰基、酰氨基和糖基。
本文中使用的术语“二氢查耳酮”和“二氢查耳酮类”是可互换的并且是指式(I)化合物的衍生物:
Figure BPA0000256041170000183
其中式(I)可以在一个或更多个合适的位置被取代。示例性的取代基包括但不限于卤素、氰基、硝基、C1-C6烷基、C1-C6卤代烷基、C1-C6羟基烷基、羟基、C1-C6烷氧基、巯基、C1-C6烷硫基、氨基、C1-C6烷基氨基、二C1-C6烷基氨基、羧基、C1-C6烷氧基羰基、酰氨基和糖基。
本文中使用的术语“二氢茋”和“二氢茋类”是可互换的并且是指基于式(II)化合物的化合物:
Figure BPA0000256041170000191
其中式(II)可以在一个或更多个合适的位置被取代。示例性的取代基包括但不限于卤素、氰基、硝基、C1-C6烷基、C1-C6卤代烷基、C1-C6羟基烷基、羟基、C1-C6烷氧基、巯基、C1-C6烷硫基、氨基、C1-C6烷基氨基、二C1-C6烷基氨基、羧基、C1-C6烷氧基羰基、酰氨基和糖基。
本文中使用的术语“苯丙素类”是指基于3-苯基丙-2-烯酸酯(3-phenylprop-2-enoate)骨架的化合物。这样的化合物的实例包括但不限于肉桂酸、香豆酸、咖啡酸、阿魏酸、5-羟基阿魏酸、芥子酸、肉桂酰CoA、对香豆酰CoA等。
本文中使用的术语“苯丙素类衍生物”和“苯丙素类衍生物化合物”是可互换的并且是指由苯丙素类衍生、合成或生物合成的任何化合物,即苯丙素类衍生物包括苯丙素类化合物为前体或中间体的任何化合物。苯丙素类衍生物的实例包括但不限于茋化合物和查耳酮化合物。苯丙素类衍生物的具体实例包括但不限于柚皮素、白藜芦醇、赤松素、松属素查耳酮和松属素。
本文中使用的术语“二氢苯丙素类”是指基于苯基丙酸酯骨架的化合物。这样的化合物的实例包括但不限于二氢肉桂酸、根皮酸、3,4-二羟基氢化肉桂酸、氢化阿魏酸、二氢香豆酰CoA、二氢肉桂酰CoA等。
本文中使用的术语“二氢苯丙素类衍生物”和“二氢苯丙素类衍生物化合物”是可互换的并且是指由二氢苯丙素类衍生、合成或生物合成的任何化合物;即二氢苯丙素类衍生物包括二氢苯丙素类化合物为前体或中间体的任何化合物。二氢苯丙素类衍生物的实例包括但不限于二氢茋类化合物和二氢查耳酮化合物。二氢苯丙素类衍生物的具体实例包括但不限于根皮素、根皮苷、二氢赤松素、3-O-甲基二氢赤松素、2-异戊二烯基-3-O-甲基二氢赤松素(amorfrutin 2;IUPAC:3-甲氧基-2-(3-甲基丁-2-烯-1-基)-5-苯乙基酚)和二氢白藜芦醇。
本文中使用的术语“苯丙素类途径”、“苯丙素类衍生物途径”、“苯丙素类衍生物合成途径”和“苯丙素类衍生物生物合成途径”是可互换的并且是指其中苯丙素类为前体或中间体并且其中苯丙素类衍生物化合物为产物的任何生物合成途径。苯丙素类衍生物(例如查耳酮和茋)根据苯丙素类衍生物生物合成途径而生物合成。
本文中使用的术语“二氢苯丙素类途径”、“二氢苯丙素类衍生物途径”、“二氢苯丙素类衍生物合成途径”和“二氢苯丙素类衍生物生物合成途径”是可互换的并且是指其中苯丙素类或二氢苯丙素类为前体或中间体并且其中二氢苯丙素类衍生物化合物为产物的任何生物合成途径。二氢苯丙素类衍生物(例如二氢查耳酮和二氢茋)根据二氢苯丙素类衍生物生物合成途径而生物合成。
除非另有说明,否则本文中使用的术语“烷基”是指含有1至20个碳原子的直链或支链烃。术语“Cm-Cn烷基”是指具有m至n个碳原子的烷基。例如,“C1-C6烷基”是具有1至6个碳原子的烷基。烷基的代表性实例包括但不限于甲基、乙基、正丙基、异丙基、正丁基、仲丁基、异丁基、叔丁基、正戊基、异戊基、新戊基、正己基、3-甲基己基、2,2-二甲基戊基、2,3-二甲基戊基、正庚基、正辛基、正壬基和正癸基。
除非另有说明,否则本文中使用的术语“烯基”是指含有2至20个碳并且含有至少一个碳-碳双键的直链或支链烃。术语“Cm-Cn烯基”是指具有m至n个碳原子的烯基。例如,“C2-C6烯基”是具有1至6个碳原子的烯基。烯基的代表性实例包括但不限于乙烯基、2-丙烯基、2-甲基-2-丙烯基、3-丁烯基、4-戊烯基、5-己烯基、2-庚烯基、2-甲基-1-庚烯基、3-癸烯基和3,7-二甲基辛-2,6-二烯基和2-丙基-2-庚烯基。
本文中使用的术语“烷氧基”是指通过氧原子与母体分子部分连接的如本文所定义的烷基。烷氧基的代表性实例包括但不限于甲氧基、乙氧基、丙氧基、2-丙氧基、丁氧基、叔丁氧基、戊氧基和己氧基。
本文中使用的术语“氰基”和“腈”是指-CN基团。
本文中使用的术语“卤素”是指-Cl、-Br、-I或-F。
术语“卤代烷基”是指被一个或更多个卤素原子取代的烷基。
本文中使用的术语“杂环基”是指单环杂环或双环杂环。单环杂环是含有至少一个独立地选自O、N和S的杂原子的3、4、5、6或7元环,其中该环是饱和的或不饱和的,但不是芳族的。3或4元环含有1个选自O、N和S的杂原子。5元环可以含有0或1个双键和1、2或3个选自O、N和S的杂原子。6或7元环含有0、1或2个双键和1、2或3个选自O、N和S的杂原子。双环杂环是与苯基、单环环烷基、单环环烯基、单环杂环或单环杂芳基稠合的单环杂环。双环杂环可以通过任一环状部分(例如通过杂环或通过苯基)连接。杂环的代表性实例包括但不限于吖丙啶基、二氮杂环庚基、1,3-二
Figure BPA0000256041170000211
烷基、1,3-二氧戊环基、1,3-二硫戊环基、1,3-二噻烷基、咪唑啉基、咪唑烷基、异噻唑啉基、异噻唑烷基、异
Figure BPA0000256041170000212
唑啉基、异
Figure BPA0000256041170000213
唑烷基、吗啉基、
Figure BPA0000256041170000214
二唑啉基、
Figure BPA0000256041170000215
二唑烷基、
Figure BPA0000256041170000216
唑啉基、
Figure BPA0000256041170000217
唑烷基、哌嗪基、哌啶基、吡喃基、吡唑啉基、吡唑烷基、吡咯啉基、吡咯烷基、四氢呋喃基、四氢噻吩基、噻二唑啉基、噻二唑烷基、噻唑啉基、噻唑烷基、硫代吗啉基、1,1-二氧化硫代吗啉基(1,1-dioxidothiomorpholinyl)(硫代吗啉砜)、噻喃基(thiopyranyl)、三噻烷基(trithianyl)、2,3-二氢苯并呋喃-2-基和二氢吲哚基。
术语“羟基烷基”是指被一个或更多个-OH基团取代的烷基。
本文中使用的术语“糖基”是指通过从单糖或二糖的环状形式中除去半缩醛羟基而获得的一价基团。单糖或单糖单元可以选自由以下组成的任何包含5至9个碳原子的糖:醛糖(例如D-葡萄糖、D-半乳糖、D-甘露糖、D-核糖、D-阿拉伯糖、L-阿拉伯糖、D-木糖等)、酮糖(例如D-果糖、D-山梨糖、D-塔格糖等)、脱氧糖(例如L-鼠李糖、L-岩藻糖等)、脱氧-氨基糖(例如N-乙酰葡萄糖胺、N-乙酰甘露糖胺、N-乙酰半乳糖胺等)、糖醛酸、酮醛糖酸(例如唾液酸)等。
本文中使用的术语“硝基”是指-NO2基团。
本文中使用的短语“一个或更多个”取代基是指等于1至基于可用键合位点的数目可能的最大取代基数目的取代基数目,条件是满足上述稳定性和化学可行性条件。除非另外指明,否则任选取代的基团可在所述基团的每个可取代位置处具有取代基,并且所述取代基可相同或不同。本文中使用的术语“独立地选择”意指对于单个化合物中的给定变量的多个实例可以选择相同或不同的值。
“任选的”或“任选地”意指随后描述的事件或情况可能发生或可能不发生,并且该描述包括其中所述事件或情况发生的例子和其中所述事件或情况不发生的例子。本领域普通技术人员将理解,对于任何描述为包含一个或更多个任选取代基的分子,仅意图包括空间上实际和/或合成上可行的化合物。除非另有说明,否则“任选取代的”是指术语中的所有后续修饰语。
本文中使用的术语“经取代的”是指指定部分的氢基团被指定取代基的基团取代,条件是取代产生稳定的或化学上可行的化合物。
苯丙素类衍生物化合物的生物合成
在一个方面,本公开内容提供了经改造以降低或消除苯丙素类衍生物生物合成途径中的基因表达或多肽活性的重组宿主细胞。在一些实施方案中,重组宿主进行苯丙素类的烯酰基双键还原得到二氢苯丙素类的能力降低或消除,从而降低或消除二氢苯丙素类和二氢苯丙素类衍生物的产生,而有利于苯丙素类和苯丙素类衍生物。例如,在一些实施方案中,重组宿主进行对香豆酰CoA的双键还原得到二氢香豆酰CoA或进行肉桂酰CoA的双键还原得到二氢肉桂酰CoA的能力降低或消除。在一些实施方案中,烯酰基双键的还原通过烯酰还原酶进行。在一些实施方案中,烯酰基双键的还原通过多萜醇还原酶进行。这些还原酶也统称为双键还原酶(DBR)。因此,DBR是一类还原酶,其尤其包括烯酰还原酶和多萜醇还原酶。
在一些实施方案中,烯酰还原酶包含酿酒酵母反式-2-烯酰CoA还原酶(TSC13)或其功能同源物。在一些实施方案中,烯酰还原酶由包含在本文中公开为SEQ ID NO:7的序列的基因编码。在一些实施方案中,烯酰还原酶由与SEQ ID NO:7具有至少70%同一性的基因编码。在一些实施方案中,烯酰还原酶是与SEQ ID NO:22具有至少70%同一性的多肽。
在一些实施方案中,多萜醇还原酶包含酿酒酵母多萜醇还原酶DFG10或其功能同源物。在一些实施方案中,多萜醇还原酶由包含在本文中公开为SEQ ID NO:43的序列的基因编码。在一些实施方案中,多萜醇还原酶由与SEQ ID NO:43具有至少80%同一性的基因编码。在一些实施方案中,多萜醇还原酶是与SEQ ID NO:26具有至少75%同一性的多肽。
本文中使用的“表达降低”是指基因或蛋白质以低于该基因或蛋白质的天然表达的水平表达。例如,在一些实施方案中,通过降低编码还原酶的基因的蛋白质产物或表达量来降低该还原酶的活性。
基因表达的降低或消除(即,破坏)可以通过任何已知的方法来实现,所述方法包括插入、错义突变、移码突变、缺失、替换、或DNA序列置换、或其任意组合。插入包括整个基因的插入,所述基因可以是任何来源的。基因表达的降低或消除可以例如包括改变或置换基因的启动子、增强子或剪接位点,从而导致部分或完全抑制正常基因产物的产生。在一些实施方案中,基因表达的降低或消除包括改变细胞或生物体中表达的蛋白质产物的总水平。在另一些实施方案中,基因的破坏包括降低或消除细胞或生物体中基因的蛋白质产物的活性。在本公开内容的一些实施方案中,破坏是其中不存在该基因的显著表达的无效破坏。在一些实施方案中,宿主细胞或生物体中基因的破坏发生在两条染色体中,在这种情况下,其是纯合破坏。在另一些实施方案中,宿主细胞或生物体中基因的破坏仅发生在一条染色体中,另一条染色体拷贝保持完整,在这种情况下,其是杂合基因破坏。在另一些实施方案中,宿主细胞或生物体中基因的每个拷贝被不同地破坏。
基因表达的降低或消除还可以包括基因敲除或敲减。“基因敲除”是指细胞或生物体中的一种或更多种基因的表达被消除。“基因敲减”是指细胞或生物体中的一种或更多种基因的水平降低但未完全消除。
在一些实施方案中,通过例如RNA干扰(RNAi)的技术降低或消除基因表达,RNA干扰为使用RNA分子通常通过造成特定mRNA分子的破坏来抑制基因表达的方法。RNAi也被称为共抑制、转录后基因沉默(post-transcriptional gene silencing,PTGS)和压制(quelling)。
本文中使用的“活性降低”是指多肽(例如如酶)的活性的水平低于该多肽的天然活性水平。降低多肽活性的任何手段均可用于所公开的实施方案中。例如,可以改变双键还原酶的序列或结构,导致对酶的原始底物的活性较低。在另一个实例中,可通过在双键还原酶多肽的抑制剂的存在下培养宿主细胞,或通过共表达或共产生双键还原酶多肽的抑制剂来降低双键还原酶多肽的活性。
在一些实施方案中,本文中公开的重组酵母细胞还包含编码部分或完全补充双键还原酶多肽之功能的酶的重组基因。本文中使用的短语“补充......的功能”是指执行其所“补充”的酶的一些或全部天然功能的酶。例如,在一些实施方案中,降低或消除DBR多肽的表达或活性可导致宿主细胞的致死或生长不良。为了改善所导致的致死或生长不良,可以引入(例如,重组地)互补酶,所述互补酶执行降低/消除的DBR的对于生长必要的活性,但是不催化将苯丙素类转化成二氢苯丙素类(例如,其不使用香豆酸或肉桂酸作为底物)。部分或完全补充DBR之功能的酶的实例包括但不限于其他烯酰还原酶和多萜醇还原酶。
在一些实施方案中,编码部分或完全补充双键还原酶多肽之功能的酶的重组基因包含:(a)SEQ ID NO:94至96中的任一个,或(b)与SEQ ID NO:94至96中任一个具有至少65%同一性的核苷酸序列。在一些实施方案中,编码部分或完全补充双键还原酶多肽之功能的酶的重组基因编码以下多肽,所述多肽包含:(a)SEQ ID NO:65至67中的任一个,或(b)与SEQ ID NO:65至67中任一个具有至少65%同一性的多肽。
在本文中公开的重组酵母细胞的一些实施方案中,重组酵母细胞还包含编码III型聚酮合酶多肽的重组基因。在一些实施方案中
在一些实施方案中,本公开内容的重组酵母细胞被进一步改造以过表达重组III型聚酮合酶多肽。在一些实施方案中,重组III型聚酮合酶多肽包含:(i)重组查耳酮合酶多肽;或(ii)重组茋合酶多肽。
在一些实施方案中,重组宿主细胞还包含苯丙素类衍生物生物合成途径的一种或更多种多肽。在一些实施方案中,提供了催化形成在查耳酮、茋或其他苯丙素类衍生物的生物合成中的中间体的重组基因。中间体尤其包含肉桂酸、肉桂酰CoA、对香豆酸、对香豆酰CoA、柚皮素和白藜芦醇。
在一些实施方案中,重组细胞还包含编码催化形成肉桂酸的苯丙氨酸解氨酶多肽的内源基因或重组基因。在一些实施方案中,重组宿主细胞表达与拟南芥(Arabidopsisthaliana)PAL2基因具有同源性的多肽。在一些实施方案中,重组宿主细胞表达包含在本文中公开为SEQ ID NO:1的序列的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQID NO:1具有至少70%同一性的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQID NO:16具有至少70%同一性的重组多肽。
在某些实施方案中,重组宿主细胞被改造以表达催化形成对香豆酸的一种或更多种重组多肽。因此,在一些实施方案中,重组细胞还包含编码肉桂酸4-羟化酶多肽的重组基因。在一些实施方案中,重组宿主细胞表达包含SEQ ID NO:2的肉桂酸4-羟化酶基因。在另一些实施方案中,肉桂酸4-羟化酶基因与SEQ ID NO:2具有至少70%的同一性。还提供了包含以下重组基因的重组宿主细胞,所述重组基因编码与SEQ ID NO:17具有至少70%同一性的肉桂酸4-羟化酶多肽。
在一些实施方案中,宿主细胞被改造以表达催化形成对香豆酰CoA或肉桂酰CoA的重组多肽。因此,在一些实施方案中,重组细胞还包含编码4-香豆酸-CoA连接酶多肽的基因。在一些具体实施方案中,4-香豆酸-CoA连接酶基因包含SEQ ID NO:3。在一些具体实施方案中,4-香豆酸-CoA连接酶基因与SEQ ID NO:3具有至少65%同一性。在另一些实施方案中,重组基因编码与SEQ ID NO:18具有至少65%同一性的4-香豆酸-CoA连接酶多肽。
在一些实施方案中,本公开内容提供了以下重组宿主细胞,其被改造以表达催化形成苯丙素类(例如肉桂酸和香豆酸)和/或催化形成苯丙素类衍生物(例如查耳酮和茋类)的重组多肽。
在某些实施方案中,重组宿主细胞被改造以表达催化由香豆酰CoA或肉桂酰CoA形成查耳酮(例如柚皮素前体化合物)的重组多肽。因此,在一些实施方案中,重组细胞还包含一种或更多种查耳酮合酶基因。在某些实施方案中,重组宿主细胞表达与大麦(Hordeumvulgare)查耳酮合酶2具有同源性的异源基因。在另一些实施方案中,重组宿主细胞表达包含SEQ ID NO:4的序列的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:4具有至少65%同一性的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:19具有至少65%同一性的重组多肽。
在一些实施方案中,本公开内容提供了以下重组宿主细胞,其被改造以表达催化由对香豆酰CoA或肉桂酰CoA形成茋类的重组多肽。因此,在一些实施方案中,重组宿主细胞还包含一种或更多种茋合酶基因。
在一些实施方案中,重组宿主细胞表达与赤松(Pinus densiflora)茋合酶基因具有同源性的异源基因。在另一些实施方案中,重组宿主细胞表达包含SEQ ID NO:23的序列的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:23具有至少70%同一性的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:24具有至少80%同一性的重组多肽。
在一些实施方案中,重组宿主细胞还包含编码重组细胞色素p450多肽的重组基因,其中重组细胞色素p450基因由SEQ ID NO:6编码。在一些实施方案中,重组细胞色素p450基因与SEQ ID NO:6具有至少65%同一性。在另一些实施方案中,重组基因编码与SEQID NO:21具有至少65%同一性的细胞色素p450多肽。
在一些实施方案中,重组宿主细胞还包含编码重组查耳酮异构酶多肽的基因,其中重组查耳酮异构酶由SEQ ID NO:80至86中任一个的核苷酸序列编码。在一些实施方案中,重组查耳酮异构酶基因与SEQ ID NO:80至86中的任一个具有至少60%同一性。在另一些实施方案中,查耳酮异构酶多肽与SEQ ID NO:87至93中的任一个具有至少65%同一性。
在另一个方面,本公开内容提供了产生苯丙素类(例如肉桂酸和香豆酸)和/或产生苯丙素类衍生物(例如查耳酮或茋)的方法,其包括在其中表达重组基因的条件下,在培养基中培养本文中公开的重组酵母细胞,并且其中所述化合物通过所述重组酵母细胞合成。
在一些实施方案中,本公开内容的方法用于产生查耳酮化合物。在一些实施方案中,所述查耳酮化合物是柚皮素或柚皮素衍生物。除柚皮素之外,本文中公开的一些实施方案还可用于产生其他查耳酮,例如异甘草素(甘草素查耳酮)、紫铆因(紫铆素(Butin)查耳酮)、松属素查耳酮、圣草酚查耳酮和高圣草酚查耳酮。
在一些实施方案中,本公开内容的方法用于产生茋类化合物。在一些实施方案中,茋化合物是白藜芦醇。除白藜芦醇之外,本公开内容的一些实施方案还可用于产生其他茋类,例如白皮杉醇、二氢白藜芦醇、白藜芦醇3-O-葡糖苷(云杉新苷、虎杖苷)、ε-葡萄素、δ-葡萄素和Pallidol。
在一些实施方案中,产生查耳酮或茋化合物的方法还包括收获所述化合物。本文中使用的术语“收获”是指收集化合物的任何手段,其可以包括或可以不包括分离化合物。在一些实施方案中,产生查耳酮或茋化合物的方法还包括分离所述化合物。
在另一个方面,本公开内容提供了产生式(III)化合物或其可药用盐的方法:
Figure BPA0000256041170000261
其中
A是键或C=O;
n是整数0、1、2、3或4;
Figure BPA0000256041170000271
是双键时,R是氢,或者当A是C=O且
Figure BPA0000256041170000272
是单键时,R和R5与其所连接的原子一起形成6元杂环基;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基;
所述方法包括在其中表达重组基因的条件下,在培养基中培养本文中公开的重组宿主细胞,并且其中式(III)化合物通过所述重组宿主细胞合成。
在一些实施方案中,式(III)化合物不是其中R1、R2和R4独立地为氢的化合物。
在一些实施方案中,式(III)化合物为式(IV)或其可药用盐:
Figure BPA0000256041170000281
其中
A是键或C=O;
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV)化合物不是其中R1、R2和R4独立地为氢的化合物。
在一些实施方案中,式(IV)化合物是茋类化合物,其中A是键。例如,通过本发明的方法产生的茋类包括式(IV-A)的那些或其可药用盐:
Figure BPA0000256041170000291
其中
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-A)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-A)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是-OR11
R2是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;其中R11独立地是氢或C1-C6烷基;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)OR12和-C(O)N(R12)2,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11或C2-C12烯基,其中烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-C(O)OR10,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C2-C6烯基或-C(O)OR10,其中烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-A)化合物是其中n是0的那些。在另一些实施方案中,式(IV-A)化合物是其中R1是-OR11且R11是氢或甲基的那些。一些实施方案提供了其中R1是氢的式(IV-A)化合物。
一些实施方案提供了以下式(IV-A)化合物,其中R2是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了其中R2是氢的式(IV-A)化合物。
一些实施方案提供了以下式(IV-A)化合物,其中R4是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了以下式(IV-A)化合物,其中R4是任选地被一个或更多个R7取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的3-甲基丁-2-烯-1-基。在一些实施方案中,R4是3-甲基丁-2-烯-1-基。
一些实施方案提供了其中R5是氢的式(IV-A)化合物。
一些实施方案提供了其中R6是氢或-C(O)OR10的式(IV-A)化合物。在一个实施方案中,R6是氢或-C(O)OH。
式(IV-A)化合物的代表性实例包括但不限于以下:白藜芦醇、astringin、蝶茋(pterostilbene)、赤松素、白皮杉醇、云杉新苷、
Figure BPA0000256041170000321
Figure BPA0000256041170000331
在一些实施方案中,式(IV)化合物是式(IV-B)的查耳酮化合物或其可药用盐:
Figure BPA0000256041170000332
其中
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-B)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢、-OR11、-C(O)OR10或-C(O)N(R10)2,其中每个R10独立地是氢或C1-C6烷基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-B)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;其中R11独立地是氢或C1-C6烷基;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)OR12和-C(O)N(R12)2,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11或C2-C12烯基,其中烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-C(O)OR10,其中R10独立地是氢或C1-C6烷基;并且
R6是氢、C2-C6烯基或-C(O)OR10,其中烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(IV-B)化合物是其中n是0的那些。在另一些实施方案中,式(IV-B)化合物是其中R1是-OR11且R11是氢或甲基的那些。一些实施方案提供了其中R1是氢的式(IV-B)化合物。
一些实施方案提供了以下式(IV-B)化合物,其中R2是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了其中R2是氢的式(IV-B)化合物。
一些实施方案提供了以下式(IV-B)化合物,其中R4是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了以下式(IV-B)化合物,其中R4是任选地被一个或更多个R7取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的3-甲基丁-2-烯-1-基。在一些实施方案中,R4是3-甲基丁-2-烯-1-基。
一些实施方案提供了其中R5是氢的式(IV-B)化合物。
一些实施方案提供了其中R6是氢或-C(O)OR10的式(IV-B)化合物。在一个实施方案中,R6是氢或-C(O)OH。
式(IV-B)化合物的代表性实例包括但不限于松属素查耳酮和柚皮素查耳酮。
在一些实施方案中,式(III)化合物是式(V)化合物或其可药用盐:
Figure BPA0000256041170000371
其中
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(V)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11、-N(R10)2、-C(O)R10、-C(O)OR10或-C(O)N(R10)2,其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(V)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;其中R11独立地是氢或C1-C6烷基;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)OR12和-C(O)N(R12)2,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11或C2-C12烯基,其中烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;并且
R6是氢、C2-C6烯基或-C(O)OR10,其中烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(V)化合物是其中n是0的那些。在另一些实施方案中,式(V)化合物是其中R1是-OR11且R11是氢或甲基的那些。一些实施方案提供了其中R1是氢的式(V)化合物。
一些实施方案提供了以下式(V)化合物,其中R2是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了其中R2是氢的式(V)化合物。
一些实施方案提供了以下式(V)化合物,其中R4是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了以下式(V)化合物,其中R4是任选地被一个或更多个R7取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的3-甲基丁-2-烯-1-基。在一些实施方案中,R4是3-甲基丁-2-烯-1-基。
一些实施方案提供了其中R6是氢或-C(O)OR10的式(V)化合物。在一个实施方案中,R6是氢或-C(O)OH。
式(V)化合物的代表性实例包括但不限于松属素、橙皮素、圣草酚、高圣草酚和柚皮素。
在一些实施方案中,产生式(III)、(IV)、(IV-A)、(IV-B)或(V)中任一个的化合物的方法还包括收获所述化合物。在一些实施方案中,产生式(III)、(IV)、(IV-A)、(IV-B)或(V)中任一个的化合物的方法还包括分离所述化合物。
二氢苯丙素类衍生物化合物的生物合成
在另一个方面,本公开内容提供了被改造成在苯丙素类衍生物生物合成途径中具有一个或更多个异源重组基因的重组宿主细胞。在一些实施方案中,重组宿主能够通过重组表达双键还原酶(DBR)(例如烯酰还原酶(enoyl reductase,ENR))来进行苯丙素类的烯酰基双键还原以产生二氢苯丙素类。例如,在一些实施方案中,重组宿主能够还原对香豆酰CoA的双键得到二氢香豆酰CoA,或还原肉桂酰CoA的双键得到二氢肉桂酰CoA。
在一些实施方案中,烯酰还原酶被过表达。本文中使用的术语“过表达”是指基因或蛋白质的表达水平高于该基因或蛋白质的天然表达。
在一些实施方案中,烯酰还原酶包含酿酒酵母反式-2-烯酰CoA还原酶(TSC13)或其功能同源物。在一些实施方案中,重组烯酰还原酶由包含在本文中公开为SEQ ID NO:7的序列的基因编码。在一些实施方案中,重组烯酰还原酶由与SEQ ID NO:7具有至少70%同一性的基因编码。在一些实施方案中,重组烯酰还原酶:(a)包含SEQ ID NO:22的多肽,或(b)包含与SEQ ID NO:22具有至少70%同一性的多肽。
在一些实施方案中,重组宿主细胞将重组III型聚酮合酶多肽与重组烯酰还原酶一起共表达。在一些实施方案中,重组III型聚酮合酶多肽包含:(i)重组查耳酮合酶多肽;或(ii)重组茋合酶多肽。
在一些实施方案中,重组宿主细胞还包含二氢苯丙素类衍生物生物合成途径的一种或更多种多肽。在一些实施方案中,提供了催化形成二氢查耳酮或二氢茋生物合成中的中间体的重组基因。中间体尤其包括肉桂酸、肉桂酰CoA、二氢肉桂酰CoA、对香豆酸、对香豆酰CoA、对二氢香豆酰CoA和根皮素。
在一些实施方案中,重组细胞还包含编码催化形成肉桂酸的苯丙氨酸解氨酶多肽的内源基因或重组基因。在一些实施方案中,重组宿主细胞表达与拟南芥PAL2基因具有同源性的多肽。在一些实施方案中,重组宿主细胞表达包含在本文中公开为SEQ ID NO:1的序列的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:1具有至少70%同一性的重组基因。在另一些实施方案中,重组宿主细胞表达:(a)包含SEQ ID NO:16的重组多肽,或(b)与SEQ ID NO:16具有至少70%同一性的重组多肽。
在某些实施方案中,重组宿主细胞被改造以表达催化形成对香豆酸的一种或更多种重组多肽。因此,一些实施方案包括表达编码肉桂酸4-羟化酶多肽的重组基因的宿主细胞。在一些实施方案中,重组宿主细胞表达包含SEQ ID NO:2的肉桂酸4-羟化酶基因。在另一些实施方案中,肉桂酸4-羟化酶基因与SEQ ID NO:2具有至少70%的同一性。还提供了包含以下重组基因的重组宿主细胞,所述重组基因编码:(a)包含SEQ ID NO:17的肉桂酸4-羟化酶多肽;或(b)与SEQ ID NO:17具有至少70%同一性的肉桂酸4-羟化酶多肽。
在一些实施方案中,宿主细胞被改造以表达催化形成对香豆酰CoA或肉桂酰CoA的重组多肽。因此,在某些实施方案中,宿主细胞表达编码4-香豆酸-CoA连接酶多肽的重组基因。在一些具体实施方案中,4-香豆酸-CoA连接酶基因包含SEQ ID NO:3。在一些具体实施方案中,4-香豆酸-CoA连接酶基因与SEQ ID NO:3具有至少65%同一性。在另一些实施方案中,重组基因编码:(a)包含SEQ ID NO:18的4-香豆酸-CoA连接酶多肽,或(b)与SEQ ID NO:18具有至少65%同一性的4-香豆酸-CoA连接酶多肽。
在一些实施方案中,本公开内容提供了以下重组宿主细胞,其被改造以表达催化形成二氢苯丙素类衍生物(例如二氢查耳酮和二氢茋类)的重组多肽。在一些实施方案中,宿主细胞被改造以表达催化由例如二氢香豆酰CoA或二氢肉桂酰CoA形成根皮苷化合物和/或根皮苷前体化合物的重组多肽。在某些实施方案中,重组宿主细胞被改造以表达催化由对二氢香豆酰CoA或二氢肉桂酰CoA形成根皮苷前体化合物(包括根皮素)的重组多肽。
在一些实施方案中,重组宿主细胞包含一种或更多种查耳酮合酶基因。在某些实施方案中,重组宿主细胞表达编码大麦(Hordeum vulgare)查耳酮合酶2(HvCHS2)或者其同源物或功能类似物的异源基因。在一些实施方案中,重组宿主细胞表达包含SEQ ID NO:4或68至70之一的重组基因。在一些实施方案中,重组宿主细胞表达与SEQ ID NO:4或68至70之一具有至少65%同一性的重组基因。在一些实施方案中,重组宿主细胞表达:(a)包含(a)SEQ ID NO:19或71至73之一的重组多肽;(b)与SEQ ID NO:19或71至73之一具有至少65%同一性的多肽;或(c)在SEQ ID NO:19或71至73之一的覆盖第95至105、132至142、191至201和266至276位氨基酸的组合区域中与所述SEQ ID NO:19或71至73之一具有至少90%序列同一性的多肽。
在一些实施方案中,本公开内容的重组宿主细胞包含编码大麦的查耳酮合酶2(CHS2)的核酸序列,其中所述核酸序列包含选自G595A、A799T和A801T的一个或更多个核酸替换。在一些实施方案中,本公开内容的重组宿主细胞包含编码大麦的查耳酮合酶2(CHS2)的核酸序列,所述查耳酮合酶2包含选自A199T和1267F的一个或更多个氨基酸替换。
在某些实施方案中,重组宿主细胞表达编码浆果金丝桃(Hypericumandrosaemum)查耳酮合酶(HaCHS)或者其同源物或功能类似物的异源基因。在一些实施方案中,重组宿主细胞表达包含SEQ ID NO:27的重组基因或与SEQ ID NO:27具有至少65%序列同一性的重组基因。在一些实施方案中,重组宿主细胞表达包含SEQ ID NO:49的重组多肽或与SEQ ID NO:49具有至少65%序列同一性的重组多肽。
在一些实施方案中,本公开内容提供了被改造以表达催化由根皮素形成根皮苷的重组多肽的重组宿主细胞。在某些实施方案中,重组宿主被改造成具有与苹果(Malusdomestica)P2′UGT基因具有同源性的异源UDP糖基转移酶(UGT)。在另一些实施方案中,本文中公开的重组宿主包含含有SEQ ID NO:5的异源基因。在另一些实施方案中,重组宿主包含与SEQ ID NO:5具有至少65%同一性的异源基因。在另一些实施方案中,重组宿主表达:(a)包含SEQ ID NO:20的UGT多肽,或(b)与SEQ ID NO:20具有至少70%同一性的UGT多肽。
在一些实施方案中,本公开内容提供了以下重组宿主细胞,其被改造以表达催化由对二氢香豆酰CoA或二氢肉桂酰CoA形成二氢茋类的重组多肽。因此,在一些实施方案中,重组宿主细胞包含一种或更多种茋合酶基因。
在一些实施方案中,重组宿主细胞表达与赤松茋合酶基因具有同源性的异源基因。在另一些实施方案中,重组宿主细胞表达包含SEQ ID NO:23的序列的重组基因。在另一些实施方案中,重组宿主细胞表达与SEQ ID NO:23具有至少70%同一性的重组基因。在另一些实施方案中,重组宿主细胞表达:(a)包含SEQ ID NO:24的重组多肽,或(b)与SEQ IDNO:24具有至少80%同一性的重组多肽。
在一些实施方案中,本公开内容提供了表达编码重组细胞色素p450多肽的重组基因的重组宿主细胞,其中重组细胞色素p450基因由SEQ ID NO:6编码。在一些实施方案中,重组细胞色素p450基因与SEQ ID NO:6具有至少65%同一性。在另一些实施方案中,重组基因编码:(a)包含SEQ ID NO:21的细胞色素p450多肽,或(b)与SEQ ID NO:21具有至少65%同一性的细胞色素p450多肽。
在另一个方面,本公开内容提供了产生二氢查耳酮或二氢茋化合物的方法,其包括在其中表达重组基因的条件下,在培养基中培养如本文所公开的重组宿主细胞,并且其中所述化合物通过重组宿主细胞合成。
在一些实施方案中,本公开内容的方法用于产生二氢查耳酮化合物。在一些实施方案中,二氢查耳酮化合物是根皮素或根皮素衍生物。在一些实施方案中,根皮素衍生物是根皮苷。
除根皮苷之外,本文中公开的一些实施方案还可用于产生其他二氢查耳酮,例如新橙皮苷二氢查耳酮(neohesperidin dihydrochalcone,NHDC)。
在一些实施方案中,本公开内容的方法用于产生二氢茋类化合物。
在一些实施方案中,产生二氢查耳酮或二氢茋化合物的方法还包括收获所述化合物。本文中使用的术语“收获”是指收集化合物的任何手段,其可以包括或可以不包括分离化合物。在一些实施方案中,产生二氢查耳酮或二氢茋化合物的方法还包括分离所述化合物。
在另一个方面,本公开内容提供了产生式(III)化合物或其可药用盐的方法:
Figure BPA0000256041170000431
其中
A是键或C=O;
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基;
所述方法包括在其中表达重组基因的条件下,在培养基中培养本文中公开的重组宿主细胞,并且其中式(III)化合物通过所述重组宿主细胞合成。
在一些实施方案中,式(III)化合物不是其中R1、R2和R4独立地为氢的化合物。
在一些实施方案中,式(III)化合物是二氢茋类化合物,其中A是键。例如,通过本发明的方法产生的二氢茋类包括式(III-A)的那些或其可药用盐:
Figure BPA0000256041170000451
其中
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-A)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-A)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是-OR11
R2是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;其中R11独立地是氢或C1-C6烷基;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)OR12和-C(O)N(R12)2,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11或C2-C12烯基,其中烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢;并且
R6是氢或C2-C6烯基,其中烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-A)化合物是其中n是0的那些。在另一些实施方案中,式(III-A)化合物是其中R1是-OR11且R11是氢或甲基的那些。一些实施方案提供了其中R1是氢的式(III-A)化合物。
一些实施方案提供了以下式(III-A)化合物,其中R2是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了其中R2是氢的式(III-A)化合物。
一些实施方案提供了以下式(III-A)化合物,其中R4是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了以下式(III-A)化合物,其中R4是任选地被一个或更多个R7取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的3-甲基丁-2-烯-1-基。在一些实施方案中,R4是3-甲基丁-2-烯-1-基。
一些实施方案提供了其中R5是氢的式(III-A)化合物。
一些实施方案提供了其中R6是氢的式(III-A)化合物。
式(III-A)化合物的代表性实例包括但不限于以下:二氢白藜芦醇、二氢赤松素、amorfrutin 2、
Figure BPA0000256041170000481
在一些实施方案中,式(III)化合物是式(III-B)的二氢查耳酮化合物或其可药用盐:
Figure BPA0000256041170000482
其中
n是整数0、1、2、3或4;
R1是氢或-OR11
其中每个R11独立地是氢、C1-C6烷基或糖基;
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-B)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)R12、-C(O)OR12、-C(O)N(R12)2和-S(O)2R12,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢或-OR11;并且
R6是氢、C1-C6烷基、C2-C6烯基、-OR11或-N(R10)2,其中每个R10独立地是氢或C1-C6烷基,并且其中烷基和烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-B)化合物是以下那些,其中:
n是整数0、1、2、3或4;
R1是氢或-OR11
R2是氢、-OR11、C1-C12烷基或C2-C12烯基,其中烷基和烯基任选地被一个或更多个R7取代;其中R11独立地是氢或C1-C6烷基;
或者R2和R6与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
或者R2和R4与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R3独立地选自C1-C6羟基烷基、-OR12、-N(R12)2、-C(O)OR12和-C(O)N(R12)2,其中每个R12独立地是氢或C1-C6烷基;
R4是-OR11或C2-C12烯基,其中烯基任选地被一个或更多个R7取代;
或者R4和R2与其所连接的原子一起形成任选地被一个或更多个R7基团取代的5至7元杂环基;
R5是氢;并且
R6是氢或C2-C6烯基,其中烯基任选地被一个或更多个R8取代;或者R6和R2与其所连接的原子一起形成任选地被一个或更多个R8基团取代的5至7元杂环基;
每个R7和R8独立地是卤素、氰基、硝基、C1-C6烷基、C2-C6烯基、C1-C6卤代烷基、C1-C6羟基烷基、-OR13、-SR13、-N(R13)2、-C(O)R13、-C(O)OR13、-C(O)N(R13)2或-S(O)2R13,其中每个R13独立地是氢或C1-C6烷基。
在一些实施方案中,式(III-B)化合物是其中n是0的那些。在另一些实施方案中,式(III-B)化合物是其中R1是-OR11且R11是氢或甲基的那些。一些实施方案提供了其中R1是氢的式(III-B)化合物。
一些实施方案提供了以下式(III-B)化合物,其中R2是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了其中R2是氢的式(III-B)化合物。
一些实施方案提供了以下式(III-B)化合物,其中R4是-OR11,并且R11独立地是氢或C1-C6烷基。在一些实施方案中,R11是氢或甲基。另一些实施方案提供了以下式(III-B)化合物,其中R4是任选地被一个或更多个R7取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的C2-C12烯基。在一些实施方案中,R4是任选地被羟基取代的3-甲基丁-2-烯-1-基。在一些实施方案中,R4是3-甲基丁-2-烯-1-基。
一些实施方案提供了其中R5是氢的式(III-B)化合物。
一些实施方案提供了其中R6是氢的式(III-B)化合物。
式(III-B)化合物的代表性实例包括但不限于根皮素、根皮苷和松属素二氢查耳酮。
在一些实施方案中,产生式(III)、(III-A)或(III-B)中任一个的化合物的方法还包括收获所述化合物。在一些实施方案中,产生式(III)、(III-A)或(III-B)中任一个的化合物的方法还包括分离所述化合物。
功能同源物
上述多肽的功能同源物也可适合用于在如本文中提供的重组宿主中产生二氢苯丙素类衍生物。功能同源物是与参照多肽具有序列相似性并且执行参照多肽的一种或更多种生物化学或生理功能的多肽。功能同源物和参照多肽可以是天然存在的多肽,并且序列相似性可以归因于趋同或趋异演化事件。因此,功能同源物有时在文献中被称为同源物、或直系同源物、或旁系同源物。天然存在的功能同源物的变体(例如由野生型编码序列的突变体编码的多肽)本身可以是功能同源物。还可以通过多肽的编码序列的定点诱变或通过组合来自不同天然存在多肽的编码序列的结构域(“结构域交换”)来产生功能同源物。用于修饰编码本文中所述的功能性多肽的基因的技术是已知的,并且尤其包括定向演化技术、定点诱变技术和随机诱变技术,并且可用于提高多肽的比活性、改变底物特异性、改变表达水平、改变亚细胞定位或以期望的方式修饰多肽-多肽相互作用。这样的经修饰多肽被认为是功能同源物。术语“功能同源物”有时应用于编码功能同源多肽的核酸。
可以通过分析核苷酸和多肽序列比对来鉴定功能同源物。例如,对核苷酸或多肽序列的数据库进行查询可以鉴定苯丙素类或二氢苯丙素类衍生物生物合成途径多肽的同源物。序列分析可以涉及使用TSC13、CHS2或P2’UGT氨基酸序列作为参照序列对非冗余数据库进行BLAST、交互BLAST或PSI-BLAST分析。在一些情况下,由核苷酸序列推导氨基酸序列。数据库中具有大于40%序列同一性的那些多肽是用于进一步评价作为苯丙素类或二氢苯丙素类衍生物生物合成途径多肽的适合性的候选物。氨基酸序列相似性允许保守的氨基酸替换,例如一个疏水性残基替换成另一个疏水性残基,或一个极性残基替换成另一个极性残基。如果需要的话,可以对这样的候选物进行人工检查以缩小需进一步评价的候选物的数量。可以通过选择那些显示具有存在于苯丙素类或二氢苯丙素类衍生物生物合成途径多肽中的结构域(例如,保守的功能性结构域)的候选物来进行人工检查。
保守区可以通过定位苯丙素类或二氢苯丙素类衍生物生物合成途径多肽的一级氨基酸序列中的以下区域来鉴定,所述区域为重复序列、形成一些二级结构(例如螺旋和β片层)、建立带正电荷或带负电荷的结构域或者代表蛋白质基序或结构域。参见,例如Pfam网站,其在万维网的sanger.ac.uk/Software/Pfam/和pfam.janelia.org/描述了多种蛋白质基序和结构域的共有序列。Pfam数据库包括的信息在Sonnhammer等,Nucl.Acids Res.,26:320-322(1998);Sonnhammer等,Proteins,28:405-420(1997);以及Bateman等,Nucl.Acids Res.,27:260-262(1999)中进行了描述。保守区还可以通过比对来自紧密相关物种的相同或相关多肽的序列来确定。紧密相关物种优选地来自同一科。在一些实施方案中,来自两种不同物种的序列的比对足以鉴定这样的同源物。
通常来说,显示出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区显示出至少45%氨基酸序列同一性(例如,至少50%、至少60%、至少70%、至少80%或至少90%氨基酸序列同一性)。在一些实施方案中,保守区显示出至少92%、94%、96%、98%或99%氨基酸序列同一性。
例如,适合在重组宿主中产生根皮苷的多肽包括TSC13、CHS2和P2′UGT的功能同源物。在另一个实例中,适于在重组宿主中产生柚皮素的同源物包括查耳酮合酶和/或查耳酮异构酶基因的重组同源物。
修饰例如查耳酮合酶、查耳酮异构酶、茋合酶、TSC13、CHS2或P2′UGT的底物特异性的方法是本领域技术人员已知的,并且包括但不限于定点/合理诱变方法、随机定向演化方法和其中在酶的活性位点附近进行随机诱变/饱和技术的组合。例如,参见Osmani等,2009,Phytochemistry70:325-347。
候选序列的长度通常为参照序列的长度的80%至200%,例如参照序列的长度的82%、85%、87%、89%、90%、93%、95%、97%、99%、100%、105%、110%、115%、120%、130%、140%、150%、160%、170%、180%、190%或200%。功能同源物多肽的长度通常为参照序列的长度的95%至105%,例如参照序列的长度的90%、93%、95%、97%、99%、100%、105%、110%、115%或120%,或之间的任何范围。任何候选核酸或多肽相对于参照核酸或多肽的%同一性可如下确定。使用计算机程序ClustalW(1.83版,默认参数)将参照序列(例如,本文中所述的核酸序列或氨基酸序列)与一个或更多个候选序列比对,所述计算机程序允许核酸或多肽序列在其全长上进行比对(全局比对)。Chenna等,2003,Nucleic AcidsRes.31(13):3497-500。
ClustalW计算参照与一个或更多个候选序列之间的最佳匹配,并将其比对,使得可以确定同一性、相似性和差异。可以在参照序列、候选序列或二者中插入一个或更多个残基的空位以最大化序列比对。对于核酸序列的快速成对比对,使用以下默认参数:字长:2;窗口大小:4;评分方法:%年龄;顶对角线数:4;以及空位罚分:5。对于核酸序列的多重比对,使用以下参数:空位开放罚分:10.0;空位延伸罚分:5.0;以及权重转换:是。对于蛋白质序列的快速成对比对,使用以下参数:字长:1;窗口大小:5;评分方法:%年龄;顶对角线数:5;空位罚分:3。对于蛋白质序列的多重比对,使用以下参数:权重矩阵:blosum;空位开放罚分:10.0;空位延伸罚分:0.05;亲水性空位:开;亲水性残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys;残基特异性空位罚分:开。ClustalW输出是反映序列之间关系的序列比对。可以例如在万维网的Baylor College of Medicine Search Launcher网站(searchlauncher.bcm.tmc.edu/multi-align/multi-align.html)和万维网的欧洲生物信息研究院(European Bioinformatics Institute)网站(ebi.ac.uk/clustalw)运行ClustalW。
为了确定候选核酸或氨基酸序列与参照序列的百分比同一性,使用ClustalW比对序列,用比对中相同匹配的数目除以参照序列的长度,并将结果乘以100。应注意的是,百分比同一性值可以四舍五入到最接近的十分位。例如,78.11、78.12、78.13和78.14向下舍入至78.1,而78.15、78.16、78.17、78.18和78.19向上进至78.2。
应理解,例如参与苯丙素类衍生物或二氢苯丙素类生物合成的酶(例如TSC13、CHS2和P2’UGT)的功能同源物可以包含不参与由酶执行的酶活性的另外氨基酸。
重组核酸
编码本文中所述多肽的重组基因包含所述多肽的编码序列,其在有义方向上与适于表达所述多肽的一个或更多个调节区有效连接。由于很多微生物能够由多顺反子mRNA表达多种基因产物,因此如果需要的话,对于这些微生物可以在单调节区的控制下表达多种多肽。当调节区和编码序列被定位成使得调节区有效地用于调节该序列的转录或翻译时,认为编码序列和调节区是有效连接的。通常来说,编码序列的翻译阅读框的翻译起始位点位于单顺反子基因的调节区下游的1至约50个核苷酸。
在很多情况下,本文中所述多肽的编码序列在不同于重组宿主的物种中鉴定到,即是异源核酸。因此,如果重组宿主是微生物,则编码序列可以来自其他原核或真核微生物、来自植物或来自动物。然而,在一些情况下,编码序列是宿主天然的序列,并且被重新引入该生物体中。天然序列与天然存在序列的区别之处通常可在于:存在与外源核酸连接的非天然序列,例如重组核酸构建体中在天然序列侧翼的非天然调节序列。另外,稳定转化的外源核酸通常整合在除发现天然序列的位置之外的位置。“调节区”是指具有影响转录或翻译起始和速率以及转录或翻译产物的稳定性和/或移动性的核苷酸序列的核酸。调节区包括但不限于启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导型元件、蛋白质结合序列、5′和3′非翻译区(UTR)、转录起始位点、终止序列、多腺苷酸化序列、内含子、及其组合。调节区通常包含至少一个核心(基本)启动子。调节区还可以包含至少一个控制元件,例如增强子序列、上游元件或上游激活区(UAR)。通过将调节区和编码序列定位成使得调节区有效地调节该序列的转录或翻译使调节区与编码序列有效连接。例如,为了有效连接编码序列和启动子序列,通常将编码序列的翻译阅读框的翻译起始位点定位在启动子下游的1至约50个核苷酸。然而,调节区可以定位在翻译起始位点上游的多至约5,000个核苷酸,或者在转录起始位点上游的约2,000个核苷酸。
待包含的调节区的选择取决于数个因素,包括但不限于效率、可选择性、可诱导性、期望的表达水平和在某些培养阶段期间的优先表达。通过适当地选择并相对于编码序列定位调节区来调节编码序列的表达对于本领域技术人员而言是常规手段。应理解,可以存在多于一个调节区,例如内含子、增强子、上游激活区、转录终止子和诱导型元件。
重组宿主
可以使用重组宿主来表达用于苯丙素类衍生物或二氢苯丙素类衍生物产生的多肽,所述重组宿主包括哺乳动物、昆虫、植物和藻类细胞。多种原核生物和真核生物也适合用于构建本文中所述的重组微生物,例如革兰氏阴性细菌、酵母和真菌。首先分析选择用作苯丙素类衍生物或二氢苯丙素类衍生物产生菌株的物种和菌株以确定哪些产生基因相对于所述菌株是内源的以及哪些基因不存在。将在菌株中不存在内源对应物的基因有利地组装在一个或更多个重组构建体中,然后将所述构建体转化到菌株中以提供缺失的功能。
可以使用常规发酵方法来培养本文中提供的经构建和经遗传改造的微生物,所述常规发酵方法尤其包括恒化器、分批、补料分批培养、连续灌流发酵和连续灌流细胞培养。
本发明方法中使用的碳源包括可以被重组宿主细胞代谢以促进生长和/或苯丙素类衍生物或二氢苯丙素类衍生物产生的任何分子。合适碳源的实例包括但不限于蔗糖(例如,如见于糖蜜中)、果糖、木糖、乙醇、甘油、葡萄糖、纤维素、淀粉、纤维二糖或其他含葡萄糖聚合物。在使用酵母作为宿主的一些实施方案中,例如,例如蔗糖、果糖、木糖、乙醇、甘油和葡萄糖的碳源是合适的。可以在整个培养期间向宿主生物体提供碳源,或者作为替代地,可以在其他能量来源(例如蛋白质)存在下培养生物体一段时间,然后仅在补料分批阶段期间提供碳源。
示例性的原核生物和真核生物物种在下文更详细地描述。然而,应理解,其他物种也可以是合适的。例如,合适的物种可以在以下属中:伞菌属(Agaricus)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、念珠菌属(Candida)、棒状杆菌属、假囊酵母属(Eremothecium)、埃希氏菌属、镰孢霉属(Fusarium)/赤霉属(Gibberella)、克鲁维酵母属(Kluyveromyces)、硫磺菌属(Laetiporus)、香菇属(Lentinus)、红发夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、小立碗藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、红发夫酵母属(Xanthophyllomyces)或耶氏酵母属(Yarrowia)。来自这样的属的示例性物种包括虎皮香菇(Lentinus tigrinus)、硫磺菌(Laetiporussulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯德毕赤酵母、产朊假丝酵母(Cyberlindnera jadinii)、小立碗藓(Physcomitrella patens)、黏红酵母32(Rhodoturula glutinis 32)、胶红酵母(Rhodoturula mucilaginosa)、红发夫酵母UBV-AX(Phaffia rhodozyma UBV-AX)、红发夫酵母(Xanthophyllomyces dendrorhous)、藤仓镰孢菌(Fusarium fujikuroi)/藤仓赤霉(Gibberella fujikuroi)、产朊假丝酵母(Candidautilis)、光滑念珠菌、白色念珠菌和解脂耶氏酵母。
在一些实施方案中,微生物可以是原核生物,例如大肠杆菌(Escherichia coli)、类球红细菌(Rhodobacter sphaeroides)、英膜红细菌(Rhodobacter capsulatus)或圆红酵母(Rhodotorula toruloides)。
在一些实施方案中,微生物可以是子囊菌(Ascomycete),例如藤仓赤霉、乳酸克鲁维酵母、粟酒裂殖酵母、黑曲霉(Aspergillus niger)、解脂耶氏酵母、棉阿舒囊霉或酿酒酵母。
在一些实施方案中,微生物可以是藻类细胞,例如三孢布拉霉菌(Blakesleatrispora)、杜氏盐藻(Dunaliella salina)、雨生红球藻(Haematococcus pluvialis)、小球藻(Chlorella sp.)、裙带菜(Undaria pinnatifida)、马尾藻(Sargassum)、海带(Laminaria japonica)、Scenedesmus almeriensis物种。
在一些实施方案中,微生物可以是蓝细菌细胞,例如三孢布拉霉菌、杜氏盐藻、雨生红球藻、小球藻、裙带菜、马尾藻、海带、Scenedesmus almeriensis。
酵母属(Saccharomyces spp.)
酵母是合成生物学中广泛使用的底盘生物,并且可以用作重组微生物平台。例如,存在可用于酿酒酵母的突变体文库、质粒、详细代谢计算机模型以及其他信息,从而允许对多个模块进行合理设计以提高产品产率。用于制备重组微生物的方法是已知的。
曲霉属(Aspergillus spp.)
例如米曲菌(A.oryzae)、黑曲霉(A.niger)和酱油曲霉(A.sojae)的曲霉属物种是食品生产中广泛使用的微生物,并且也可以用作重组微生物平台。构巢曲菌(A.nidulans)、烟曲霉(A.fumigatus)、米曲菌、棒曲霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组的核苷酸序列是可获得的,从而允许对内源途径进行合理设计和修饰以提高通量并提高产品产率。已开发了用于曲霉属的代谢模型。一般来说,黑曲霉被培养用于多种食品成分(例如柠檬酸和葡糖酸)的工业生产,并且因此例如黑曲霉的物种通常适合用于生产苯丙素类衍生物或二氢苯丙素类衍生物。
大肠杆菌
大肠杆菌,合成生物学中另一种广泛使用的平台生物,也可以用作重组微生物平台。与酵母类似,存在可用于大肠杆菌的突变体文库、质粒、详细代谢计算机模型以及其他信息,从而允许对多个模块进行合理设计以提高产品产率。可使用与上文针对酵母所述的那些方法类似的方法来制备重组大肠杆菌(E coli)微生物。
伞菌属、赤霉属和平革菌属
伞菌属、赤霉属和平革菌属可以是可用的,因为已知它们在培养物中产生大量的类异戊二烯。因此,用于生产大量苯丙素类衍生物或二氢苯丙素类衍生物的前体已由内源基因产生。
Arxula adeninivorans(Blastobotrys adeninivorans)
Arxula adeninivorans是一种具有独特生物化学特征的二形性酵母(其在高至42℃的温度下类似于烘焙酵母作为芽殖酵母生长,高于该阅值时,其以丝状形式生长)。其可以在广泛种类的底物上生长并且可以同化硝酸盐。其已被成功地应用于产生可产生天然塑料的菌株或开发针对环境样品中雌激素的生物传感器。
解脂耶氏酵母
解脂耶氏酵母是一种二形性酵母(参见Arxula adeninivorans)并且属于半子囊菌(Hemiascomycete)科。解脂耶氏酵母的整个基因组是已知的。耶氏酵母属物种是需氧的并且被认为是非致病性的。耶氏酵母高效地使用疏水性底物(例如,烷烃、脂肪酸、油)并且可以在糖上生长。其具有很高的工业应用潜力,并且是一种产油微生物。解脂耶氏酵母可以将脂质含量累积至其干细胞重量的约40%,是用于脂质累积和再活化的模型生物。参见例如Nicaud,2012,Yeast 29(10):409-18;Beopoulos等,2009,Biohimie 91(6):692-6;Bankar等,2009,Appl Microbiol Biotechnol.84(5):847-65。
红酵母属(Rhodotorula sp.)
红酵母是一种单细胞的有色酵母。产油的红色酵母黏红酵母已被示出由粗甘油生产脂质和类胡萝卜素(Saenge等,2011,Process Biochemistry 46(1):210-8)。圆红酵母菌株已被示出是用于改进生物质和脂质生产力的高效补料-分批发酵系统(Li等,2007,Enzyme and Microbial Technology41:312-7)。
圆红冬孢酵母(Rhodosporidium toruloides)
圆红冬孢酵母是一种产油酵母并且可用于改造脂质产生途径(参见例如Zhu等,2013,Nature Commun.3:1112;Ageitos等,2011,Applied Microbiology andBiotechnology 90(4):1219-27)。
博伊丁假丝酵母
博伊丁假丝酵母是一种甲基营养型酵母(其可以在甲醇上生长)。类似于其他甲基营养型物种(例如多形汉逊酵母和巴斯德毕赤酵母),其提供用于生产异源蛋白的优异平台。已报道了所分泌外来蛋白的产率在多克范围内。最近,计算方法IPRO预测了在实验上将博伊丁假丝酵母木糖还原酶的辅因子特异性从NADPH转变为NADH的突变。
多形汉逊酵母(安格斯毕赤酵母(Pichia angusta))
多形汉逊酵母是另一种甲基营养型酵母(参见博伊丁假丝酵母)。其可进一步在广泛范围的其他底物上生长;其是耐热的并且可以同化硝酸盐(另参见乳酸克鲁维酵母)。其已被应用于生产乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α-2a,还被应用于一系列技术酶。
乳酸克鲁维酵母
乳酸克鲁维酵母是一种常用于生产克菲尔(kefir)的酵母。其可以在数种糖上生长,最重要的是在存在于乳和乳清中的乳糖上生长。其已被成功地尤其应用于生产凝乳酶(通常存在于牛胃中的酶)来产生乳酪。生产以40,000L的规模在发酵罐中进行。
巴斯德毕赤酵母
巴斯德毕赤酵母是一种甲基营养型酵母(参见博伊丁假丝酵母和多形汉逊酵母)。其提供用于生产外来蛋白的高效平台。平台组分可作为试剂盒获得,并且其在学术界中广泛地用于生产蛋白质。已改造了可以生产复杂人N-聚糖的菌株(酵母聚糖与见于人中的那些类似但不相同)。
小立碗藓属(Physcomitrella spp.)
苔藓小立碗藓(Physcomitrella mosses)在悬浮培养物中生长时具有与酵母或其他真菌培养物类似的特征。该属正成为一种重要的细胞类型,用于生产在其他类型的细胞中可难以产生的植物次级代谢物。
产生苯丙素类衍生物和二氢苯丙素类衍生物的方法
可以在产生苯丙素类衍生物或二氢苯丙素类衍生物的方法中使用本文中所述的重组宿主。
例如,所述方法可以包括在其中表达苯丙素类衍生物或二氢苯丙素类衍生物生物合成基因的条件下,在培养基中培养重组宿主。可以在补料分批或连续过程中培养重组宿主。通常来说,将重组宿主在限定温度下在发酵罐中培养期望的时间段。根据所述方法中使用的具体宿主,还可以存在和表达其他重组基因。底物和中间体的水平可以通过从培养基中提取样品以根据公开的方法进行分析来确定。
在已将重组宿主在培养物中培养期望的时间段之后,然后可以使用本领域已知的多种技术从培养物中回收苯丙素类衍生物(例如柚皮素、白藜芦醇、赤松素、松属素查耳酮和松属素)或二氢苯丙素类衍生物(如根皮苷或根皮苷前体)。在一些实施方案中,可以添加透化剂以帮助原料进入宿主中,并且帮助产物从宿主释放。例如,可以将经培养微生物的粗制裂解物离心以获得上清液。然后,可以将得到的上清液施加到色谱柱(例如C-18柱),并用水洗涤除去亲水性化合物,之后用溶剂(例如甲醇)洗脱目标化合物。然后,可以根据本领域已知的方法通过制备型HPLC进一步纯化化合物。
应理解,本文中讨论的不同基因可以存在于两种或更多种重组宿主中而不是单一宿主中。当使用多种重组宿主时,可以将其在混合培养物中培养以产生苯丙素类衍生物或二氢苯丙素类衍生物。
或者,可以将两种或更多种宿主各自在单独的培养基中培养,并且可以将第一培养基的产品(例如柚皮素、白藜芦醇或根皮苷前体)引入第二培养基中以被转化成后续中间体或者最终产品,例如,如分别柚皮素、白藜芦醇或根皮苷。然后,回收由第二或最后宿主产生的产品。还应理解,在一些实施方案中,使用除培养基之外的营养源并利用除发酵罐之外的系统来培养重组宿主。
在一些实施方案中,通过在重组宿主中表达参与苯丙素类衍生物生物合成途径或二氢苯丙素类衍生物生物合成途径的一种或更多种酶来在体内产生苯丙素类衍生物或二氢苯丙素类衍生物。例如,可以使用其中编码酿酒酵母反式-2-烯酰CoA还原酶多肽的一种或更多种基因表达不足或不表达并且表达以下基因的柚皮素产生或白藜芦醇产生重组宿主来体内产生查耳酮化合物,例如柚皮素:编码一种或更多种拟南芥苯丙氨酸解氨酶(PAL2)多肽的重组基因、编码大阿米芹(Ammi majus)肉桂酸4-羟化酶(CH4)多肽的基因、编码拟南芥4-香豆酸-CoA连接酶(4CL2)多肽的基因、编码大麦查耳酮合酶2(CHS2)多肽的基因和/或编码细胞色素P450还原酶(CPR1)多肽的基因。
作为另一个实例,可以使用表达一种或更多种以下基因的根皮苷产生重组宿主来体内产生根皮苷:编码酿酒酵母反式-2-烯酰CoA还原酶(TSC13)多肽的基因、编码拟南芥苯丙氨酸解氨酶(PAL2)多肽的基因、编码大阿米芹肉桂酸4-羟化酶(C4H)多肽的基因、编码拟南芥4-香豆酸-CoA连接酶(4CL2)多肽的基因、编码大麦查耳酮合酶2(CHS2)多肽的基因、编码细胞色素P450还原酶(CPR1)多肽的基因和/或编码苹果P2′UGT多肽的基因。
作为另一个实例,可以使用其中编码酿酒酵母反式-2-烯酰CoA还原酶多肽的一种或更多种基因表达不足或不表达并且表达以下基因的茋类(例如白藜芦醇)产生重组宿主来体内产生茋类化合物,例如白藜芦醇:编码一种或更多种拟南芥苯丙氨酸解氨酶(PAL2)多肽的重组基因、编码大阿米芹肉桂酸4-羟化酶(CH4)多肽的基因、编码拟南芥4-香豆酸-CoA连接酶(4CL2)多肽的基因和/或编码茋合酶(STS)多肽的基因。
作为另一个实例,可以使用表达一种或更多种以下基因的二氢茋类(例如二氢白藜芦醇)产生重组宿主来体内产生二氢茋类化合物:编码酿酒酵母反式-2-烯酰CoA还原酶(TSC13)多肽的基因、编码拟南芥苯丙氨酸解氨酶(PAL2)多肽的基因、编码大阿米芹肉桂酸4-羟化酶(C4H)多肽的基因、编码拟南芥4-香豆酸-CoA连接酶(4CL2)多肽的基因和/或编码茋合酶(STS)多肽的基因。
在一些实施方案中,通过使期望化合物的前体与参与苯丙素类衍生物或二氢苯丙素类衍生物生物合成途径的一种或更多种酶在体外接触来产生苯丙素类衍生物或二氢苯丙素类衍生物。例如,使对香豆酰CoA与查耳酮合酶多肽接触可以使得在体外产生柚皮素或柚皮素衍生物化合物。在一些实施方案中,通过使上游柚皮素前体与参与柚皮素途径的一种或更多种酶在体外接触来产生柚皮素前体。作为另一个实例,在不存在反式-2烯酰CoA还原酶下,使对香豆酰CoA与查耳酮合酶接触可以使得在体外产生柚皮素。作为另一个实例,使根皮素与P2′UGT多肽接触可以使得在体外产生根皮苷化合物。在一些实施方案中,通过使上游根皮苷前体与参与根皮苷途径的一种或更多种酶在体外接触来产生根皮苷前体。作为另一个实例,使对香豆酰CoA与反式-2-烯酰CoA还原酶接触可以使得在体外产生对二氢香豆酰CoA。
在一些实施方案中,通过生物转化产生苯丙素类衍生物或二氢苯丙素类衍生物。为了发生生物转化,表达参与苯丙素类衍生物或二氢苯丙素类衍生物生物合成途径的一种或更多种酶的宿主细胞摄取并修饰细胞中的苯丙素类衍生物前体或二氢苯丙素类衍生物前体;在体内修饰之后,苯丙素类衍生物或二氢苯丙素类衍生物保留在细胞中和/或被分泌到培养基中。例如,表达编码查耳酮合酶多肽的基因的宿主细胞可在细胞中摄取香豆酰CoA并将其转化为柚皮素;在体内转化之后,柚皮素化合物被分泌到培养基中。作为另一个实例,表达编码UGT多肽的基因的宿主细胞可在细胞中摄取根皮素并使根皮素糖基化;在体内糖基化之后,根皮苷化合物被分泌到培养基中。
在一些实施方案中,将本文中公开的苯丙素类衍生物或二氢苯丙素类衍生物分离并纯化至均质(例如至少90%、92%、94%、96%或98%纯)。在另一些实施方案中,苯丙素类衍生物或二氢苯丙素类衍生物作为提取物从重组宿主或体外产生方法分离。在这方面,苯丙素类衍生物或二氢苯丙素类衍生物可以被分离,但不必然纯化至均质。期望地,产生的苯丙素类衍生物或二氢苯丙素类衍生物的量可以为约1mg/L至约20,000mg/L或更高。例如,可以产生约1至约100mg/L、约30至约100mg/L、约50至约200mg/L、约100至约500mg/L、约100至约1,000mg/L、约250至约5,000mg/L、约1,000至约15,000mg/L或约2,000至约10,000mg/L的苯丙素类衍生物或二氢苯丙素类衍生物。一般来说,培养时间越长将使得产物的量越大。因此,可以将重组微生物培养1天至7天、1天至5天、3天至5天、约3天、约4天或约5天。
实施例
下面的实施例是对本文中公开的具体实施方案及其各种用途的举例说明。其仅仅是出于解释目的而提出,并不被认为是限制性的。
实施例1:酵母中根皮素的产生
材料和方法
实施例1和2中使用的酿酒酵母菌株列出在表1中:
表1:实施例1和2中使用的菌株。在背景菌株Sc1.0中通过体内同源重组组装三种不同的质粒(pPHLO、pPHLON、pPHLOZ),以制备菌株Sc1.1、Sc1.2和Sc1.3。
菌株 说明
Sc1.0 酿酒酵母背景菌株
Sc1.1 Sc1.0+pPHLO
Sc1.2 Sc1.0+pPHLON
Sc1.3 Sc1.0+pPHLOZ
实施例1和2中使用的基因列出在表2中:
表2:实施例1和2中使用的基因
Figure BPA0000256041170000631
化学参照化合物购自Sigma-Aldrich,Switzerland(柚皮素、根皮苷)或Extrasynthese,France(根皮素)。
基因克隆:
经密码子优化用于在酵母中表达的合成基因由DNA2.0 Inc.,Menlo Park,CA,USA或GeneArt AG,Regensburg,Germany制备(SEQ ID NO:1、2、4和5)。在合成期间,向除PAL2At以外的所有基因在5′端提供包含HindIII限制性识别位点和Kozak序列的DNA序列AAGCTTAAA,并且在3′端提供包含SacII识别位点的DNA序列CCGCGG。通过PCR,向PAL2 At在5′端提供包含HindIII限制性识别位点和Kozak序列的DNA序列AAGCTTAAA,并且在3′端提供包含SacII识别位点的DNA序列CCGCGG。通过PCR从第一链cDNA扩增拟南芥(A.thaliana)基因4CL2(SEQ ID NO:3)。4CL2序列具有一个内部HindIII和一个内部SacII位点,并且因此使用In-Fusion HD Cloning Plus试剂盒(Clontech Inc.)根据制造商的说明克隆到HindIII和SacII中。通过PCR从背景菌株Sc1.0的基因组DNA中扩增酿酒酵母基因(SEQ ID NO:6和7)。在PCR期间,向两种基因在5′端提供包含HindIII限制性识别位点和Kozak序列的DNA序列AAGCTTAAA,并且在3′端提供包含SacII识别位点的DNA序列CCGCGG。通过定点诱变利用沉默点突变(C519T)除去SEQ ID NO:6的内部SadI位点。将所有基因克隆到基于pUC18的载体的HindIII和SacII中,所述载体包含由天然酵母启动子和终止子得到的酵母表达盒。已经通过PCR从酵母基因组DNA制备了Shao等(Nucl.Acids Res.2009,37(2):e16)描述的启动子和终止子。每个表达盒在两侧侧接60bp同源重组标签(homologous recombination tag,HRT)序列,并且包含这些HRT的盒继而侧接AscI识别位点。设计HRT使得第一表达盒片段的3′端标签与第二表达盒片段的5′端标签相同,等等。使用三种辅助性片段(SEQ ID NO:11至14)通过同源重组在酵母中组装多重表达质粒。一种辅助性片段包含酵母营养缺陷标记(URA3)和细菌pSC101复制起点(SEQ ID NO:11)。第二辅助性片段包含用于在酵母中复制的ARS4/CEN6序列和细菌氯霉素抗性标记(SEQ ID NO:12)。两种片段均具有侧翼HRT。第三片段设计成仅具有由短的600bp间隔区序列分开的HRT。根据所得多重表达质粒包含的基因表达盒的数目,这种辅助性片段包含不同的HRT(例如,SEQ ID NO:13,对于6个基因(例如pPHLO和pPHLON));和SEQ ID NO:14,对于7个基因(例如,pPHLOZ))。所有的辅助性片段均已被克隆到基于pUC18的骨架中以在大肠杆菌中扩增。将所有片段克隆在AscI位点中,从此处其可以被切除。
为了制备三种质粒pPHLO、pPHLON和pPHLOZ(SEQ ID NO:8至10),将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表3中所列的包含不同组的基因的三种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化酵母菌株Sc1.0,并通过同源重组在体内组装质粒pPHLO、pPHLON和pPHLOZ,如Shao等2009描述的。
表3:实施例1和2中使用的多重表达质粒
Figure BPA0000256041170000641
pPHLO含有将苯丙氨酸转化为根皮素的整个生物合成途径,包含PAL2 At、C4H Am、CPR1 Sc、4CL2 At、TSC13 Sc和CHS2 Hv。pPHLON等同于pPHLO,不同之处在于将TSC13 Sc替换成非表达填充序列(SEQ ID NO:15);pPHLOZ等同于pPHLO,不同之处在于其包含具有P2′UGT Md的另外的表达盒。
培养条件:
将经改造的酵母菌株在24深孔板(Kuhner AG,Switzerland)中的2.5mL标准SC-全肉汤(Sc1.0)或SC-Ura(即,没有尿嘧啶(Sc1.1、Sc1.2和Sc1.3)且具有2%葡萄糖(ForMedium,Hunstanton,U.K.))中培养。在以5cm振幅以300RPM恒定摇动下,将培养物在30℃下培养72小时。其从在0.4mL培养基中于相同条件下培养24小时至OD为0.1的预培养物接种。
分析程序:
样品制备:用等体积的100%甲醇稀释酵母培养物。在通过以1500RPM涡旋30秒剧烈混合之后,将细胞以4000×g离心5分钟。使沉淀物和上清液分离。不经进一步纯化,将5μL上清液注入与单四极杆检测器(Single Quadrupole Detector,SQD)质谱仪(Waters,Milford,Mass.,USA)偶联的UPLC仪器(Waters AcquityTM超高效液相色谱,Waters,Milfbrd,Mass.,USA)中。
固定相:所使用的柱为Waters Acquity
Figure BPA0000256041170000651
Bridged Ethyl Hybrid(BEH)C181.7m 2.1x100mm。液相色谱法:流动相A:H2O+0.1%甲酸。流动相B:乙腈+0.1%甲酸。
运行条件:
时间(分钟) 流量(mL/分钟) %流动相A %流动相B
T=0 0.400 80 20
8.0 0.400 65 35
8.1 0.400 0 100
10.0 0.400 0 100
10.1 0.400 80 20
12.0 0.400 80 20
PDA参数:λ范围:210nm至400nm。
分辨率:1.2nm。
采样速率:20点/秒
SQD参数:来源:正模式的电喷雾电离(ESI+)。
毛细管:3.5kV。锥孔:30V。萃取器:3V。
源温度:150℃。
去溶剂化温度:350℃。气体流量对于锥孔设定为50L/小时,对于去溶剂化设定为450L/小时。
MS模式:SIR(选择离子记录,selected ion recording)模式。选择要记录的离子质量以检测目标化合物(参见结果)。
使柱保持在35℃的恒定温度。
结果:
在乙醇稀释后,通过UPLC-MS分析Sc1.0、Sc1.1和Sc1.2培养物的上清液,并记录根皮素的预期质量(m/z=274.3Da)和柚皮素的预期质量(m/z=272.3Da)的离子色谱图。对峰下面积求积分并根据标准曲线计算根皮素和柚皮素的产量。比较由Sc1.1和Sc1.2产生的根皮素和柚皮素的量(图4),显示Sc1.1中与核心类黄酮途径组合的TSC13的过表达使根皮素产量提高1.9倍,而柚皮素产量降低11.8倍。未过表达任何基因的背景菌株Sc1.0未产生任何根皮素或柚皮素。
本领域描述了提出将苯丙素类转化为二氢苯丙素类的植物酶。Dare等(PlantPhysiol Biochem.2013,72:54-61)提出了参与转化的两种蛋白质:ENRL3和ENRL5。蛋白质序列分析将这些酶置于通常参与VLCFA合成的烯酰还原酶的组中。Ibdah等(Phytochemistry.2014,107:24-31)描述了参与转化的另一种酶MdHCDBR。MdHCDBR蛋白序列表明其属于通常还原小型醛的双键还原酶组。
将三种还原酶ENRL3、ENRL5和MdHCDBR的合成的经酵母密码子优化基因形式与根皮素的剩余途径的酶一起在酵母中表达。在对培养物进行化学分析后,没有观察到根皮素产量增加(数据未示出)。然而,令人惊讶且出乎意料的是,观察到在不表达异源还原酶的菌株中产生少量根皮素。这促使测试酵母的天然还原酶,以观察这些还原酶的任一种是否参与。在数种天然还原酶中,TSC13被鉴定为具有还原酶活性。如图4所示,TSC13的过表达证实该酶的活性与剩余异源途径一起对于根皮素的有效产生是关键的。
由于之前仅已知酿酒酵母TSC13参与脂肪酸合成过程中的烯酰还原,由棕榈酸产生26个碳的超长链脂肪酸(very long chain fatty acid,VLCFA),因此对香豆酰CoA是TSC13的非常出乎意料的底物。因此,使用TSC13的过表达来产生二氢查耳酮(例如根皮苷和根皮素)和二氢茋类的前体是令人惊讶且出乎意料的。
实施例2:酵母中根皮苷的产生
材料和方法
实施例2的材料和方法与针对实施例1所述的那些相同。
结果:
在乙醇稀释后,通过LC-MS分析Sc1.0、Sc1.1和Sc1.3培养物的上清液,并提取根皮素的预期质量(m/z=274.3Da)和根皮苷的预期质量(m/z=436.4)的离子色谱图。对峰下面积求积分并根据标准曲线计算根皮素和根皮苷的产量。Sc1.3中P2′UGT Md的另外过表达使得产生0.4mg/L根皮苷(图5)。未过表达任何基因的背景菌株Sc1.0未产生任何根皮素或根皮苷。
实施例3:具有不同查耳酮合酶的酵母中根皮素的产生
材料和方法
实施例3的材料和方法与针对实施例1所述的那些相同,不同之处在于使用不同的亲本菌株和不同的CHS序列。
实施例3中使用的酿酒酵母菌株列出在表4中:
表4:实施例3中使用的菌株。在背景菌株Sc3.0中通过体内同源重组组装12种不同的质粒(pPHCHS1至12),以制备菌株Sc3.1至Sc3.12。
Figure BPA0000256041170000671
Figure BPA0000256041170000681
实施例3中使用的另外基因列出在表5中:
表5:实施例3中使用的另外基因
Figure BPA0000256041170000682
基因克隆
经密码子优化用于在酵母中表达的合成基因由DNA2.0 Inc.,Menlo Park,CA,USA或GeneArt AG,Regensburg,Germany制备(SEQ ID NO:4和27至32)。在合成期间,向所有基因在5′端提供包含HindIII限制性识别位点和Kozak序列的DNA序列AAGCTTAAA,并且在3′端提供包含SacII识别位点的DNA序列CCGCGG。通过PCR从第一链cDNA扩增苹果(M.domestica)基因CHSa、b、c、d(SEQ ID NO:33至36)。使用In-Fusion HD Cloning Plus试剂盒(ClontechInc.)根据制造商的说明将其克隆到HindIII和SacII中。将所有基因克隆到基于pUC18的HRT载体的HindHI和SacII中。
为了制备12种质粒pPHCHS1至12,将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表6中所列的包含不同组的基因的12种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化背景酵母菌株Sc3.0,并通过同源重组在体内组装质粒pPHCHS1至12,如Shao等2009描述的。
表6:实施例3中使用的多重表达质粒
名称 HRT载体中的基因
pPHCHS1 CHS Ha,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS2 CHS Pc,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS3 CHS Ph,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS4 CHS1 Hv,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS5 CHS2 Hv,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS6 CHS Sb,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS7 CHS Md c co,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS8 CHS Md a,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS9 CHS Md b,TSC13 Sc,4CL2 At,PAL2 Ar,C4H Am,CPR1 Sc
pPHCHS10 CHS Md c,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS11 CHS Md d,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHCHS12 663 bp填克序列,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
结果:
在乙醇稀释后,通过LC-MS分析Sc3.1至Sc3.12培养物的上清液,并记录根皮素的预期质量(m/z=274.3Da)和柚皮素的预期质量(m/z=272.3Da)的离子色谱图。对峰下面积求积分并根据标准曲线计算根皮素和柚皮素的产量(图6)。在11种测试的CHS中,对其中10种观察到根皮素的产生。利用CHS Ha(菌株Sc3.1)观察到26.2mg/l的最高根皮素滴度。
实施例4:酵母中二氢白藜芦醇的产生
材料和方法
实施例4的材料和方法与针对实施例1所述的那些相同,不同之处在于使用不同的亲本菌株和两种另外的3型聚酮合酶序列。
实施例4中使用的酿酒酵母菌株列出在表7中:
表7:实施例4中使用的菌株。在背景菌株Sc4.0中通过体内同源重组组装四种不同的质粒(pDHR1、pDHR2、pDHRN1和pDHRN2),以制备菌株Sc4.1至Sc4.4。
菌株 说明
Sc4.0 酿酒酵母背景菌株
Sc4.1 Sc4.0+pDHR1
Sc4.2 Sc4.0+pDHR2
Sc4.3 Sc4.0+pDHRN1
Sc4.4 Sc4.0+pDHRN2
实施例4中使用的另外基因列出在表8中:
表8:实施例4中使用的另外基因
Figure BPA0000256041170000701
基因克隆:
将合成基因密码子优化用于在酵母中表达(SEQ ID NO:37至38)。在合成期间,向基因在5′端提供包含Kozak序列的DNA序列AAA。基因包含一个和两个内部HindIII位点,并且因此使用In-Fusion HD Cloning Plus试剂盒(Clontech Inc.)根据制造商的说明克隆到HindIII和SacII中。为了制备四种质粒pDHR1、pDHR2、pDHRN1和pDHRN2,将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表9中所列的包含不同组的基因的四种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化背景酵母菌株Sc4.0,并通过同源重组在体内组装质粒pDHR1、pDHR2、pDHRN1和pDHRN2,如Shao等2009描述的。
表9:实施例4中使用的多重表达质粒
名称 HRT载体中的基因
pDHR1 STS Vp,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pDHR2 VST1 Vv,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,GPR1 Sc
pDHRN1 STS Vp,663 bp填充序列,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pDHRN2 VST1 Vv,663 bp填充序列,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
结果:
在乙醇稀释后,通过LC-MS分析Sc4.1至Sc4.4培养物的上清液,并记录二氢白藜芦醇(m/z=230.2Da)和白藜芦醇(m/z=228.2Da)的预期质量的离子色谱图。对峰下面积求积分。如图8所示,对由菌株Sc4.1至Sc4.4产生的二氢白藜芦醇和白藜芦醇的量进行比较,显示与核心茋途径组合过表达TSC13(Sc4.1和Sc4.2与Sc4.3和Sc4.4进行比较)使得二氢白藜芦醇的产量增加,而白藜芦醇的产量降低。
实施例5:用于产生根皮素的双键还原酶的比较
材料和方法:
实施例5的材料和方法与针对实施例1所述的那些相同,不同之处在于使用不同的亲本菌株和不同的双键还原酶序列。
实施例5的酿酒酵母菌株列出在表10中:
表10:实施例5的菌株。在背景菌株Sc5.0中通过体内同源重组组装12种不同的质粒(pPHDR1至12),以制备菌株Sc5.1至Sc5.12。
菌株 说明
Sc5.0 酿酒酵母背景菌株
Sc5.1 Sc5.0+pPHDR1
Sc5.2 Sc5.0+pPHDR2
Sc5.3 Sc5.0+pPHDR3
Sc5.4 Sc5.0+pPHDR4
Sc5.5 Sc5.0+pPHDR5
Sc5.6 Sc5.0+pPHDR6
Sc5.7 Sc5.0+pPHDR7
Sc5.8 Sc5.0+pPHDR8
Sc5.9 Sc5.0+pPHDR9
Sc5.10 Sc5.0+pPHDR10
Sc5.11 Sc5.0+pPHDR11
Sc5.12 Sc5.0+pPHDR12
实施例5的另外基因列出在表11中:
表11:实施例5的另外基因
Figure BPA0000256041170000721
基因克隆:
经密码子优化用于在酵母中表达的合成基因由GeneArt AG,Regensburg,Germany制备(SEQ ID NO:39至48)。在合成期间,向基因在5′端提供包含HindIII限制性识别位点和Kozak序列的DNA序列AAGCTTAAA,并且在3′端提供包含SacII识别位点的DNA序列CCGCGG。将基因克隆到基于pUC18的HRT载体的HindIII和SacII中。
为了制备12种质粒pPHDR1至12,将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表12中所列的包含不同组的基因的12种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化背景酵母菌株Sc5.0,并通过同源重组在体内组装质粒pPHDR1至12,如Shao等2009描述的。
表12:实施例5中使用的多重表达质粒
名称 HRT载体中的基因
pPHDR1 CHS Ha,ENR3 Md,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR2 CHS Ha,ENR5 Md,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR3 CHS Ha,ZS1 Ri,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR4 CHS Ha,ENR Er,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR5 CHS Ha,DFG10 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR6 CHS Ha,TSC13 Sc,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR7 CHS Ha,HCDBR Md,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR8 CHS Ha,ENR At,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR9 CHS Ha,ENR Gh,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR10 CHS Ha,ENR Md,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
名称 HRT载体中的基因
pPHDR11 CHS Ha,TSC13 KI,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
pPHDR12 CHS Ha,663 bp填充序列,4CL2 At,PAL2 At,C4H Am,CPR1 Sc
结果:
在乙醇稀释后,通过LC-MS分析Sc5.1至Sc5.12培养物的上清液,并记录根皮素的预期质量(m/z=274.3Da)和柚皮素的预期质量(m/z=272.3Da)的离子色谱图。对峰下面积求积分并根据标准曲线计算根皮素和柚皮素的产量(图7)。在过表达的11种ENR中,与对照菌株(Sc5.12)相比根皮素与柚皮素的比率的增加仅对TSC13 Sc(菌株Sc5.6)和TSC13 KI(菌株Sc5.11)观察到,其中后者是来自与酿酒酵母密切相关的真菌乳酸克鲁维酵母(K.lactis)的TSC13同源物。利用TSC13 Sc(菌株Sc5.6)观察到38.6mg/l的最高根皮素滴度。
实施例6:特异性和活性提高的CHS-2 Hv的突变体
为了实现二氢查耳酮的最高产率,生物合成途径的每个步骤的酶促反应对于优选反应的底物应具有高活性和高特异性二者。例如,在用3个丙二酰CoA单元对二氢苯丙素类-CoA进行延伸的情况下,如果缩合酶查耳酮合酶(CHS)相对于苯丙素类-CoA对二氢苯丙素类-CoA具有高活性和特异性,则目标产物的产率提高。可通过增加重组宿主中相关基因的拷贝数在一定程度上实现更高的活性。然而,更高的特异性更加难以设计,并且差的特异性导致前体损失且因此碳源进入不期望的产物,并且导致副产物形成,这可能使期望产物的纯化和下游过程复杂化。如实施例3中所述,测试了多种CHS酶对二氢苯丙素类-CoA底物的活性,并且HaCHS显示出最高的活性。然而,该酶也显示出针对非还原苯丙素类-CoA的活性,导致形成柚皮素(参见图6中的菌株Sc3.1,其具有HaCHS)。出人意料地,HvCHS2(参见图6中的菌株Sc3.5)对还原的底物具有高得多的优先性,并且产生非常少的柚皮素。
CHS酶的正常底物是CoA活化的非羟基化或单羟基化苯丙素类肉桂酸和对香豆酸。然而,已经表明包括来自大麦的HvCHS2(SEQ ID NO:19;也参见GenBank登录号CAA70435;Christensen等,1998,Plant Mol Biol.37(5):849-57)的几种酶对进一步羟基化和/或甲基化的底物,例如CoA活化的咖啡酸和阿魏酸具有优选性。这种酶是通过UV光或通过病原体攻击而诱导。这种酶的蛋白质序列与其他CHS酶具有小于80%的氨基酸同一性,但是催化位点是保守的(Austin&Noel,2003,Nat.Prod.Rep.20(1):79-110)。检查蛋白质序列并与来自紫苜蓿(Medicago sativa)的MsCHS(其结构已阐明(Ferrer等,1999,Nat.Struct.Biol.6:775-784))进行比对,表明HvCHS2包含高度保守序列的区域,以及具有明显差异的区域。后一种区域中的一些与已经预测对于功能多样性重要的区域重叠,例如,包含第95至105、132至142、191至201和266至276位氨基酸的区域。
本实施例证实,通过选择性地交换这些区域中的氨基酸,可以改变底物特异性和活性。出乎意料地,非天然底物二氢香豆酰CoA的情况也是如此,证明了相对于对香豆酰CoA,对其具有改善的活性和提高的选择性。考虑到这种酶的天然底物是咖啡酰CoA和阿魏酰CoA,这是非常意外的。以下事实进一步强调了这些结果的出乎意料,酶HvCHS2来源于其中未报道二氢查耳酮的植物大麦。
材料和方法:
实施例6的材料和方法与针对实施例1所述的那些相同,不同之处在于使用不同的亲本菌株和不同的CHS序列。
实施例6的酿酒酵母菌株列出在表13中:
表13:实施例6中使用的菌株。在背景菌株Sc6.0中通过体内同源重组组装四种不同的质粒(pCHSM1至4),以制备菌株Sc6.1至Sc6.4。
菌株 说明
Sc6.0 酿酒酵母背景菌株
Sc6.1 Sc6.0+pCHSM1
Sc6.2 Sc6.0+pCHSM2
Sc6.3 Sc6.0+pCHSM3
Sc6.4 Sc6.0+pCHSM4
实施例6的另外基因列出在表14中:
表14:实施例6的另外基因
Figure BPA0000256041170000751
基因克隆:
使用引物EVPR13492至13497(表15),如Heckman等,2007,Nat.Protoc.2:924-932所述通过重叠延伸PCR制备在酶的底物结合口袋(A199T)和环化口袋(I267F)中包含突变(如Ferrer等2009所述)的CHS2Hv的三种变体(SEQ ID NO:68至70)。
为了制备四种质粒pCHSM1至4,将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表16中所列的包含不同组的基因的四种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化背景酵母菌株Sc6.0,并通过同源重组在体内组装质粒pCHSM1至4,如Shao等2009描述的。
表15:实施例6中使用的引物
Figure BPA0000256041170000761
表16:实施例6中使用的多重表达质粒
Figure BPA0000256041170000762
结果:
在甲醇稀释后,通过LC-MS分析Sc6.1至Sc6.4培养物的上清液,并记录根皮素的预期质量(m/z=274.3Da)和柚皮素的预期质量(m/z=272.3Da)的离子色谱图。对峰下面积求积分并根据标准曲线计算根皮素和柚皮素的产量(图9)。在测试的4种CHS中,对其全部都观察到根皮素的产生。利用CHS2 Hv(A199T/I267F)(SEQ ID NO:73)(菌株Sc6.4)观察到最高根皮素滴度,其还表现出相对于亲本酶CHS2 Hv提高的特异性。CHS2 Hv(I267F)(菌株Sc6.3)(SEQ ID NO:72)表现出甚至更高的特异性,其计算为根皮素与柚皮素的比率。
实施例7:松属素二氢查耳酮的产生
之前没有查耳酮合酶(CHS)使用二氢肉桂酰CoA作为底物产生松属素二氢查耳酮的报道。本实施例提供了结果表明来自浆果金丝桃的CHS(HaCHS)(以及推定地延伸到许多其他CHS酶)能够使用二氢肉桂酰CoA作为底物。通过在酵母中过表达TSC13,产生二氢肉桂酰CoA,其然后可被CHS利用。
材料和方法:
实施例7的材料和方法与针对实施例1所述的那些相同,不同之处在于使用不同的亲本菌株和不同的CHS序列。此外,本实施例中不使用C4H Am和CPR1 Sc,以制备非羟基化前体肉桂酰CoA代替对香豆酰CoA。
实施例7中使用的酿酒酵母菌株列出在表17中:
表17:实施例7中使用的菌株。在背景菌株Sc7.0中通过体内同源重组组装两种不同质粒(pPIN1至2),以制备菌株PIN和PINDHC。
菌株 说明
Sc7.0 酿酒酵母背景菌株
PIN Sc7.0+pPIN1
PINDHC Sc7.0+pPIN2
基因克隆:
为了制备两种质粒pPIN1和pPIN2,将来自三种辅助性质粒的质粒DNA与来自包含表达盒的每种质粒的质粒DNA混合。制备表18中所列的包含不同组的基因的两种不同混合物。用AscI消化质粒DNA的混合物。这从质粒骨架释放所有片段,并产生在末端具有HRT的片段,这些继而与下一片段的HRT重叠。用每种经消化的混合物转化背景酵母菌株Sc7.0,并通过体内同源重组组装质粒pPIN1和pPIN2,如Shao等2009描述的。
表18:实施例7中使用的多重表达质粒
名称 HRT载体中的基因
pPIN1 CHS Ha,663bp填充序列,4CL2 At,PAL2 At
pPIN2 CHS Ha,TSC13 SC,4CL2 At,PAL2 At
结果:
在甲醇稀释后,通过LC-MS分析PIN和PINDHC培养物的上清液,并记录松属素二氢查耳酮的预期质量(m/z=258.3Da)和松属素的预期质量(m/z=256.3Da)的离子色谱图。对峰下面积求积分并根据标准曲线计算松属素二氢查耳酮和松属素的产量(图10)。相对于黄烷酮的产生,TSC13 Sc的过表达明显增加二氢查耳酮,表明该酶也接受二氢肉桂酰CoA作为底物。
实施例8:鉴定相对于二氢苯丙素类衍生物产生具有提高的苯丙素类衍生物产生的缺失菌株
分析酵母还原酶敲除菌株(即其中还原酶基因的一个或两个拷贝已经被除去的酵母菌株)在产生白藜芦醇和根皮酸方面的活性。敲除菌株从酵母敲除文库(StanfordUniversity,California)获得。在第一轮实验中使用的敲除示出在表19中。在第二轮实验中使用的敲除示出在表20中。
表19.第一轮还原酶敲除菌株
oye2/oye2
osm1/osm1
TSC13/tsc13
gre2/gre2
frd1/frd1
aad4/aad4
shh3/shh3
ymr226c/ymr226c
ypl088w/ypl088w
yml131w/yml131w
ari1/ari1
aad3/aad3
aad6/aad6
ydr541c/ydr541c
adh7/adh7
oye3/oye3
dfg10/dfg10
sps19/sps19
irc24/irc24
ylr460c/ylr460c
zta1/zta1
adh6/adh6
SDH3/sdh3
表20.第2轮敲除菌株
lot6/lot6
zta1/zta1
ypl088w/ypl088w
yml131w/yml131w
ydl124w/ydl124w
yjr096w/yjr096w
osm1/osm1
sps1g/sps19
ERG27/erg27
ydr541c/ydr541c
ayr1/ayr1
TSC13/tsc13
dfg10/dfg10
在两轮实验中,根据本领域中已知的方法(参见,例如Gietz&Schiesti,Nat.Protoc.2007,2(1):31-34)用Rho0011质粒(具有TEF-At4CL2+TDH3-VvVST1的pESC-HIS)转化缺失突变体和对应野生型菌株。如果可能的话,将还原酶敲除菌株作为纯合二倍体进行测试(例如dfg10/dfg10)。然而,在纯合致死性的情况下,在杂合背景下分析还原酶。例如,TSC13的纯合缺失导致致死性,因此tsc13突变体作为杂合二倍体(即,TSC13/tsc13)进行测试。
对于每种菌株,将4个转化体各自接种在1mL缺少组氨酸的合成培养基(SC-His)中,并在30℃,400rpm下孵育过夜。第二天,将50μL每种培养物转移到0.5mL新鲜培养基中并添加50μL溶解在96%乙醇中的100mg/mL对香豆酸。将培养物再孵育72小时并测量其OD600,以通过存在的细胞数来校正产量值。将100μL的每种培养物添加到100μL的96%乙醇中(以促进多酚溶解度),混合并离心,并将上清液用于通过高压液相色谱(high-pressureliquid chromatography,HPLC)测量化合物。
通过HPLC确定野生型对照菌株和缺失菌株的白藜芦醇和根皮酸的水平。数据作为这些菌株中产生的白藜芦醇与根皮酸之间的比率进行分析。这些数据示出在图11(第1轮)和图12(第2轮)中。
图5和6中所示的其中白藜芦醇/根皮酸比率显著较高的两种情况(TSC13/tsc13和dfg10/dfg10敲除)指示了其中香豆酸积累而不是转化为二氢香豆酸的菌株。所得到的白藜芦醇产量增加和伴随根皮酸水平降低表明TSC13和DFG10能够还原对香豆酰CoA的双键,并且降低或消除TSC13和/或DFG10的活性使得茋、查耳酮或类黄酮相对于其二氢对应物的比率增加。
实施例9:进一步鉴定相对于二氢苯丙素类衍生物产生具有提高的苯丙素类衍生物产生的缺失菌株
在第三轮中继续进行实施例8中描述的实验,其中使用查耳酮合酶(CHS)和查耳酮异构酶(CHI)代替白藜芦醇合酶。在第三轮实验中使用的敲除示出在表21中。
表21.第3轮敲除菌株
oye2/oye2
ylr460c/ylr460c
adh7/adh7
ydr541c/ydr541c
gre2/gre2
adh6/adh6
yml131w/yml131w
ymr226c/ymr226c
oye3/oye3
ypl088w/yp/088w
aad4/aad4
aad6/aad6
dfg10/dfg10
zta 1/zta1
ari1/ari1
aad3/aad3
frd1/frd1
shh3/shh3
osm1/osm1
lot6/lot6
ayr1/ayr1
yjr096w/yjr096w
ydl124w/ydl124w
TSC13/tsc13
SDH3/sdh3
ERG27/erg27
为了鉴定内源还原酶,通过Shao等2008描述的转化相关同源重组方法在第3轮敲除菌株中体内组装编码部分柚皮素产生途径(At4Cl、MsCHI和HaCHS)的质粒。该质粒的片段从表22中所示的经AscI消化质粒混合物获得。
表22.用于产生编码部分柚皮素产生途径的质粒的经AscI消化质粒混合物。右手列示出了用于转化每种敲除菌株的每种质粒的浓度(等摩尔比)。
Figure BPA0000256041170000811
将经转化菌株(每种6个重复)接种在缺少尿嘧啶的合成培养基(SC-Ura)中,并在96深孔板中在30℃,400rpm下孵育24小时。第二天,将50μL转移到0.5mL新鲜SC培养基(具有尿嘧啶)中,所述培养基含有5μL在96%乙醇中的100mg/mL对香豆酸。然后,将转化体在96深孔板中在30℃,400rpm下孵育96小时。将100μL的每种培养物添加到100μL的96%乙醇中(以促进多酚溶解度),混合并离心,并将上清液用于通过高压液相色谱(HPLC)测量化合物。
在26个CoA依赖性双键还原酶敲除中,与其他测试菌株相比,其中两个TSC13/Tsc13和dfg10/dfg10消耗较少香豆酸,并因此产生较少根皮酸(图13)。
实施例10:TSC13和DFG10的过表达
进行其中TSC13和DFG10过表达的研究。用于本实施例的酵母菌株示出在表23中。
表23.用于实施例10的酿酒酵母菌株
Figure BPA0000256041170000821
在菌株Sc10.1中的着丝粒质粒p416gpd(PSB33)(具有TSC13的质粒pROP 492和具有DFG10的pROP 493)和菌株Sc10.2(积累香豆酸的菌株)中的多拷贝质粒p426gpd(PSB34)(具有TSC13的质粒pROP 494和具有DFG10的pROP 495)上过表达还原酶TSC13和DFG10。这些另外菌株示出在表24中。
表24.实施例10产生的另外的酿酒酵母菌株
菌株 基因型
Sc10.3 菌株Sc10.1+PSB33(对照)
Sc10.4 菌株Sc10.1+pROP 492(具有TSC13)
Sc10.5 菌株Sc10.1+pROP 493(具有DFG10)
Sc10.6 菌株Sc10.2+PSB34(对照)
Sc10.7 菌株Sc10.2+pROP 494(具有TSC13)
Sc10.8 菌株Sc10.2+pROP 495(具有DFG10)
对于每种测试菌株,将六个菌落接种在0.5mL缺少尿嘧啶的合成培养基(SC-Ura)中,并在96深孔板中在30℃,400rpm下孵育过夜。第二天,将50μL每种培养物转移到0.5mL新鲜SC培养基(无尿嘧啶)中。然后将转化体在96深孔板中在30℃,400rpm下孵育72小时。在培养72小时后进行取样,以OD600测量(在Envision 2104读板器上进行)开始。将100μL每种培养物与100μL的96%乙醇合并,以1500rpm旋转混合30秒,并以4000×g离心10分钟。然后通过高压液相色谱(HPLC)分析上清液。
当与对照菌株Sc10.3和Sc10.6相比时,TSC13在菌株Sc10.4中着丝粒质粒pROP492上和在菌株Sc10.7中多拷贝质粒pROP494上的过表达使得柚皮素水平显著降低,以及根皮酸及其衍生物根皮素的水平稍微提高(图14)。
使用积累香豆酸的菌株Sc10.2作为菌株Sc10.6至Sc10.8的基础菌株是为了提高还原酶底物的水平,从而增加观察到由DFG10过表达产生的效果的可能性。尽管如此,当与对照菌株Sc 4.3和Sc10.6相比时,其中DFG10过表达(在菌株Sc10.5中的着丝粒pROP493质粒上,以及在菌株Sc10.8中的多拷贝质粒pROP495上)的菌株均没有表现出苯丙素类途径的改变(图14)。
基于响应于TSC13过表达而不是DFG10过表达的根皮酸水平提高,这些结果表明Tsc13是酵母中负责将香豆酸还原成根皮酸的主要酶,而Dfg10的作用是次要的。
实施例11:酿酒酵母中内源还原酶的苯丙素类底物的鉴定
为了确定哪些底物被内源酿酒酵母还原酶所接受,产生了表达拟南芥苯丙氨酸解氨酶(AtPAL2)、肉桂酸-4-羟化酶(AtC4H)和4-香豆酰CoA连接酶(At4CL)的多种组合的菌株。菌株在表25中示出。
表25.实施例11产生的菌株
Figure BPA0000256041170000831
对于每种菌株,将六个菌落接种在0.5mL缺少尿嘧啶的合成培养基(SC-Ura)中,并在96深孔板中在30℃,400rpm下孵育过夜。第二天,将50μL每种培养物转移到0.5mL新鲜SC培养基(无尿嘧啶)中。然后将转化体在96深孔板中在30℃,400rpm下孵育72小时。在培养72小时后进行取样,以OD600测量(在EnVision 2104读板器上进行)开始。将100μL每种培养物与100μL的96%乙醇合并,以1500rpm旋转混合30秒,并以4000×g离心10分钟。然后通过高压液相色谱(HPLC)分析上清液。
在所测试的菌株中,仅在表达AtPAL、AtC4H和At4Cl的菌株Sc11.3中形成根皮酸(图15C),这表明香豆酰CoA用作酵母内源还原酶的底物。在共表达PAL和4Cl的菌株(Sc11.4)中,二羟基肉桂酸与肉桂酸一起形成(图15D),与其中积累肉桂酸的仅具有PAL的菌株(Sc11.1)(图15A)形成对比。这些结果表明肉桂酰CoA也用作内源还原酶的底物。
实施例12:用替代基因替换TSC13
根据Fairhead等描述的方法使用分裂URA3盒(Fairhead等,1996,Yeast 12:1439-1457),在菌株Sc10.1中用以下TSC13直系同源物替换TSC13的天然ORF:拟南芥(AtECR)(SEQID NO:95)、陆地棉(GhECR2)(SEQ ID NO:95)和苹果(MdECR)(SEQ ID NO:96)。通过用一对重组DNA片段共转化酵母来获得ORF替换,所述片段各自携带URA3标记的一部分,其在重组之后再生并用于选择。之后除去标记,得到ORF的干净的完全替换。将引入的同源物置于天然TSC13启动子下。通过PCR验证正确的插入片段,并通过对PCR片段进行测序确认。对每种经PCR确认的转化体的两个进行进一步实验,除GhECR2转化体之外,其仅获得一个菌落。
为了测试具有TSC13同源物的菌株中苯丙素类衍生物的产生,将细胞在合成补料分批(SC)培养基(m2p-lab)中培养72小时。在将菌株在SC培养基中培养72小时后,通过读取OD 600来测量菌株的生长。
用来自拟南芥(AtECR)、陆地棉(GhECR2)和苹果(MdECR)的直系同源物替换野生型TSC13的ORF使得菌株存活;由于TSC13的敲除通常是致死的,这些菌株的存活表明这些直系同源物能够补偿Tsc13的损失。
当在柚皮素产生菌株(Sc10.1)中表达时,植物直系同源物均没有获得任何根皮酸产生。这表明ScTsc13对CoA活化的苯丙素类的活性是该酶的一个特定特征,这在所测试的直系同源物中不是保守的。
在所有测试菌株中,具有MdECR直系同源物的菌株产生最多的香豆酸和柚皮素(图16)。具有AtECR直系同源物的菌株生长不良(生长72小时后降低62%)(图17)。表达GhECR2和MdECR的菌株的生长也降低,但是与表达AtECR的菌株相比程度较低(分别地约50%和30%)。
尽管已参照本发明的一些具体实施方案详细描述了本发明,但是明显的是,可进行修改和改变而不偏离所附权利要求书中限定的本发明范围。更特别地,尽管本发明的一些方面在本文中被鉴定为特别有利的,但是应构想,本发明并不必然局限于本发明的这些具体方面。
序列
Figure BPA0000256041170000851
Figure BPA0000256041170000861
Figure BPA0000256041170000871
Figure BPA0000256041170000881
Figure BPA0000256041170000891
Figure BPA0000256041170000901
Figure BPA0000256041170000911
Figure BPA0000256041170000921
Figure BPA0000256041170000931
Figure BPA0000256041170000941
Figure BPA0000256041170000951
Figure BPA0000256041170000961
Figure BPA0000256041170000971
Figure BPA0000256041170000981
Figure BPA0000256041170000991
Figure BPA0000256041170001001
Figure BPA0000256041170001011
Figure BPA0000256041170001021
Figure BPA0000256041170001031
Figure BPA0000256041170001041
Figure BPA0000256041170001051
Figure BPA0000256041170001061
Figure BPA0000256041170001071
Figure BPA0000256041170001081
Figure BPA0000256041170001091
Figure BPA0000256041170001101
Figure BPA0000256041170001111
Figure BPA0000256041170001121
Figure BPA0000256041170001131
Figure BPA0000256041170001141
Figure BPA0000256041170001151
Figure BPA0000256041170001161
Figure BPA0000256041170001171
Figure BPA0000256041170001181
Figure BPA0000256041170001191
Figure BPA0000256041170001201
Figure BPA0000256041170001211
Figure BPA0000256041170001221
Figure BPA0000256041170001231
Figure BPA0000256041170001241
Figure BPA0000256041170001251
Figure BPA0000256041170001261
Figure BPA0000256041170001271
Figure BPA0000256041170001281
Figure BPA0000256041170001291
Figure BPA0000256041170001301
Figure BPA0000256041170001311
Figure BPA0000256041170001321
Figure BPA0000256041170001331
Figure BPA0000256041170001341
Figure BPA0000256041170001351
Figure BPA0000256041170001361
Figure BPA0000256041170001371
Figure BPA0000256041170001381
Figure BPA0000256041170001391
Figure BPA0000256041170001401
Figure BPA0000256041170001411
Figure BPA0000256041170001421
Figure BPA0000256041170001431
Figure BPA0000256041170001441
Figure BPA0000256041170001451
Figure BPA0000256041170001461
Figure BPA0000256041170001471
Figure BPA0000256041170001481
Figure BPA0000256041170001491
Figure BPA0000256041170001501
Figure BPA0000256041170001511
Figure BPA0000256041170001521
Figure BPA0000256041170001531
Figure BPA0000256041170001541
Figure BPA0000256041170001551
Figure BPA0000256041170001561
Figure BPA0000256041170001571
Figure BPA0000256041170001581
Figure BPA0000256041170001591
Figure BPA0000256041170001601
Figure BPA0000256041170001611
Figure BPA0000256041170001621
Figure BPA0000256041170001631
Figure BPA0000256041170001632
Figure IPA0000256041130000011
Figure IPA0000256041130000021
Figure IPA0000256041130000031
Figure IPA0000256041130000041
Figure IPA0000256041130000051
Figure IPA0000256041130000061
Figure IPA0000256041130000071
Figure IPA0000256041130000081
Figure IPA0000256041130000091
Figure IPA0000256041130000101
Figure IPA0000256041130000111
Figure IPA0000256041130000121
Figure IPA0000256041130000131
Figure IPA0000256041130000141
Figure IPA0000256041130000151
Figure IPA0000256041130000161
Figure IPA0000256041130000171
Figure IPA0000256041130000181
Figure IPA0000256041130000191
Figure IPA0000256041130000201
Figure IPA0000256041130000211
Figure IPA0000256041130000221
Figure IPA0000256041130000231
Figure IPA0000256041130000241
Figure IPA0000256041130000251
Figure IPA0000256041130000261
Figure IPA0000256041130000271
Figure IPA0000256041130000281
Figure IPA0000256041130000291
Figure IPA0000256041130000301
Figure IPA0000256041130000311
Figure IPA0000256041130000321
Figure IPA0000256041130000331
Figure IPA0000256041130000341
Figure IPA0000256041130000351
Figure IPA0000256041130000361
Figure IPA0000256041130000371
Figure IPA0000256041130000381
Figure IPA0000256041130000391
Figure IPA0000256041130000401
Figure IPA0000256041130000411
Figure IPA0000256041130000421
Figure IPA0000256041130000431
Figure IPA0000256041130000441
Figure IPA0000256041130000451
Figure IPA0000256041130000461
Figure IPA0000256041130000471
Figure IPA0000256041130000481
Figure IPA0000256041130000491
Figure IPA0000256041130000501
Figure IPA0000256041130000511
Figure IPA0000256041130000521
Figure IPA0000256041130000531
Figure IPA0000256041130000541
Figure IPA0000256041130000551
Figure IPA0000256041130000561
Figure IPA0000256041130000571
Figure IPA0000256041130000581
Figure IPA0000256041130000591
Figure IPA0000256041130000601
Figure IPA0000256041130000611
Figure IPA0000256041130000621
Figure IPA0000256041130000631
Figure IPA0000256041130000641
Figure IPA0000256041130000651
Figure IPA0000256041130000661
Figure IPA0000256041130000671
Figure IPA0000256041130000681
Figure IPA0000256041130000691
Figure IPA0000256041130000701
Figure IPA0000256041130000711
Figure IPA0000256041130000721
Figure IPA0000256041130000731
Figure IPA0000256041130000741
Figure IPA0000256041130000751
Figure IPA0000256041130000761
Figure IPA0000256041130000771
Figure IPA0000256041130000781
Figure IPA0000256041130000791
Figure IPA0000256041130000801
Figure IPA0000256041130000811
Figure IPA0000256041130000821
Figure IPA0000256041130000831
Figure IPA0000256041130000841
Figure IPA0000256041130000851
Figure IPA0000256041130000861
Figure IPA0000256041130000871
Figure IPA0000256041130000881
Figure IPA0000256041130000891
Figure IPA0000256041130000901
Figure IPA0000256041130000911
Figure IPA0000256041130000921
Figure IPA0000256041130000931
Figure IPA0000256041130000941
Figure IPA0000256041130000951
Figure IPA0000256041130000961
Figure IPA0000256041130000971
Figure IPA0000256041130000981
Figure IPA0000256041130000991
Figure IPA0000256041130001001
Figure IPA0000256041130001011
Figure IPA0000256041130001021
Figure IPA0000256041130001031
Figure IPA0000256041130001041
Figure IPA0000256041130001051
Figure IPA0000256041130001061
Figure IPA0000256041130001071
Figure IPA0000256041130001081
Figure IPA0000256041130001091
Figure IPA0000256041130001101
Figure IPA0000256041130001111
Figure IPA0000256041130001121
Figure IPA0000256041130001131
Figure IPA0000256041130001141
Figure IPA0000256041130001151
Figure IPA0000256041130001161
Figure IPA0000256041130001171
Figure IPA0000256041130001181
Figure IPA0000256041130001191
Figure IPA0000256041130001201
Figure IPA0000256041130001211
Figure IPA0000256041130001221
Figure IPA0000256041130001231
Figure IPA0000256041130001241
Figure IPA0000256041130001251
Figure IPA0000256041130001261
Figure IPA0000256041130001271
Figure IPA0000256041130001281
Figure IPA0000256041130001291
Figure IPA0000256041130001301
Figure IPA0000256041130001311
Figure IPA0000256041130001321
Figure IPA0000256041130001331
Figure IPA0000256041130001341
Figure IPA0000256041130001351
Figure IPA0000256041130001361
Figure IPA0000256041130001371
Figure IPA0000256041130001381
Figure IPA0000256041130001391
Figure IPA0000256041130001401
Figure IPA0000256041130001411
Figure IPA0000256041130001421
Figure IPA0000256041130001431
Figure IPA0000256041130001441
Figure IPA0000256041130001451
Figure IPA0000256041130001461
Figure IPA0000256041130001471
Figure IPA0000256041130001481
Figure IPA0000256041130001491
Figure IPA0000256041130001501
Figure IPA0000256041130001511
Figure IPA0000256041130001521
Figure IPA0000256041130001531
Figure IPA0000256041130001541
Figure IPA0000256041130001551
Figure IPA0000256041130001561
Figure IPA0000256041130001571
Figure IPA0000256041130001581
Figure IPA0000256041130001591

Claims (11)

1.一种能够产生白藜芦醇的重组酿酒酵母(Saccharomyces cerevisiae)细胞,所述重组酿酒酵母细胞包含编码双键还原酶多肽的基因,
其中所述编码双键还原酶多肽的基因的表达或由其编码的所述双键还原酶多肽的活性被降低或消除,并且其中所述双键还原酶多肽由SEQ ID NO:22或SEQ ID NO:26的序列组成;
其中所述重组酿酒酵母细胞还包含编码部分或完全补充所述双键还原酶多肽之功能的酶的重组基因,其中所述重组基因编码由SEQ ID NO:65至67中的任一个组成的多肽;并且
其中所述重组酿酒酵母细胞还包含编码III型聚酮合酶多肽的重组基因,其中所述III型聚酮合酶多肽是茋合酶多肽。
2.权利要求1所述的重组酿酒酵母细胞,其中所述双键还原酶多肽由SEQ ID NO:7或SEQ ID NO:43的核酸序列编码。
3.权利要求1或2所述的重组酿酒酵母细胞,其中所述编码部分或完全补充所述双键还原酶多肽之功能的酶的重组基因由SEQ ID NO:94至96中的任一个组成。
4.权利要求1所述的重组酿酒酵母细胞,其还包含以下一种或更多种:
(a)编码苯丙氨酸解氨酶多肽的重组基因;
(b)编码肉桂酸4-羟化酶多肽的重组基因;
(c)编码4-香豆酸-CoA连接酶多肽的重组基因;或
(d)编码细胞色素p450多肽的重组基因。
5.权利要求1所述的重组酿酒酵母细胞,其中编码茋合酶多肽的重组基因编码由SEQID NO:24组成的多肽。
6.权利要求5所述的重组酿酒酵母细胞,其中所述编码茋合酶多肽的重组基因由SEQID NO:23组成。
7.权利要求4所述的重组酿酒酵母细胞,其中所述编码苯丙氨酸解氨酶多肽的重组基因编码由SEQ ID NO:16组成的多肽;
其中所述编码肉桂酸4-羟化酶多肽的重组基因编码由SEQ ID NO:17组成的多肽;
其中所述编码4-香豆酸-CoA连接酶多肽的重组基因编码由SEQ ID NO:18组成的多肽;或者
其中所述编码细胞色素p450多肽的重组基因编码由SEQ ID NO:21组成的多肽。
8.权利要求7所述的重组酿酒酵母细胞,其中所述编码苯丙氨酸解氨酶多肽的重组基因由SEQ ID NO:1组成;
其中所述编码肉桂酸4-羟化酶多肽的重组基因由SEQ ID NO:2组成;
其中所述编码4-香豆酸-CoA连接酶多肽的重组基因由SEQ ID NO:3组成;或者
其中所述编码细胞色素p450多肽的重组基因由SEQ ID NO:6组成。
9.一种产生白藜芦醇的方法,其包括在其中表达重组基因的条件下,在培养基中培养权利要求1至8中任一项所述的重组酿酒酵母细胞,并且其中白藜芦醇通过所述重组酿酒酵母细胞合成。
10.权利要求9所述的方法,其还包括收获所述白藜芦醇。
11.权利要求9或10所述的方法,其还包括分离所述白藜芦醇。
CN201680044252.1A 2015-06-05 2016-06-06 苯丙素类和二氢苯丙素类衍生物的生物合成 Active CN108138151B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201562171742P 2015-06-05 2015-06-05
US62/171,742 2015-06-05
US201662331023P 2016-05-03 2016-05-03
US62/331,023 2016-05-03
US201662337576P 2016-05-17 2016-05-17
US62/337,576 2016-05-17
PCT/EP2016/062818 WO2016193504A1 (en) 2015-06-05 2016-06-06 Biosynthesis of phenylpropanoid and dihydrophenylpropanoid derivatives

Publications (2)

Publication Number Publication Date
CN108138151A CN108138151A (zh) 2018-06-08
CN108138151B true CN108138151B (zh) 2022-09-13

Family

ID=56132898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680044252.1A Active CN108138151B (zh) 2015-06-05 2016-06-06 苯丙素类和二氢苯丙素类衍生物的生物合成

Country Status (5)

Country Link
US (1) US10760062B2 (zh)
EP (1) EP3303573A1 (zh)
JP (1) JP7034715B2 (zh)
CN (1) CN108138151B (zh)
WO (1) WO2016193504A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2590221B1 (es) * 2015-05-18 2017-07-10 Universidad De Oviedo Ácido nucleico recombinante para su uso en la producción de polifenoles
CN107805646A (zh) * 2017-10-10 2018-03-16 嘉兴欣贝莱生物科技有限公司 一种大肠杆菌全细胞催化生产根皮素的方法
CN107586795B (zh) * 2017-10-10 2021-11-05 嘉兴欣贝莱生物科技有限公司 一种酿酒酵母发酵生产根皮素的方法
CN108384814B (zh) * 2018-03-02 2022-05-17 重庆大学 一种根皮素的制备方法
WO2019183193A1 (en) * 2018-03-20 2019-09-26 Manus Bio, Inc. Enzymes, cells, and methods for production of 3-(4-farnesyloxyphenyl)propionic acid
CN109913508A (zh) * 2018-06-05 2019-06-21 嘉兴欣贝莱生物科技有限公司 一种利用蓝藻合成根皮素的方法
CA3121271A1 (en) * 2018-11-28 2020-06-04 Novozymes A/S Modified filamentous fungal host cells
EP3931330A4 (en) 2019-02-25 2023-03-15 Ginkgo Bioworks, Inc. BIOSYNTHESIS OF CANNABINOIDS AND CANNABINOID PRECURSORS
KR102201271B1 (ko) * 2019-09-09 2021-01-11 이화여자대학교 산학협력단 생물전환 공정을 이용한 플라바논의 생산방법
CN110819660A (zh) * 2019-11-25 2020-02-21 陈江 一种酶催化法合成反式-4-香豆酸的方法
US20230257785A1 (en) * 2020-01-10 2023-08-17 Barrit Sarl Production of bioactive bibenzylic acid or derivatives thereof by genetically modified microbial hosts
CN111521703B (zh) * 2020-04-25 2022-06-17 内蒙古大学 液-质联用鉴定异戊烯基二氢茋的方法及新化合物的结构和应用
IL301396A (en) 2020-09-30 2023-05-01 Nobell Foods Inc Recombinant milk proteins and food compositions containing them
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
CN112899314B (zh) * 2021-02-04 2022-06-17 陕西师范大学 一种促进重组解脂亚罗酵母菌合成根皮素的方法
EP4301865A1 (en) * 2021-03-03 2024-01-10 Symrise AG Biocatalytical production of dihydrochalcones
GB202115470D0 (en) * 2021-10-27 2021-12-08 Univ Stellenbosch Recombinant saccharomyces cerevisiae strains for enzymatic hydrolysis of bioplastic polymers
CN117737018B (zh) * 2024-02-07 2024-05-03 广东金骏康生物技术有限公司 一种烯醛还原酶突变体、鼠李糖苷酶突变体、三酶表达菌株及其应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0503657D0 (en) * 2005-02-22 2005-03-30 Fluxome Sciences As Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof
GB0614442D0 (en) 2006-07-20 2006-08-30 Fluxome Sciences As Metabolically engineered cells for the production of pinosylvin
US20080295202A1 (en) * 2007-05-17 2008-11-27 Zhongsen Li Soybean promoters SC194 and flower-preferred expression thereof in transgenic plants
DE102012213492A1 (de) 2012-07-31 2014-02-06 Symrise Ag Verfahren zur biotechnologischen Herstellung von Dihydrochalkonen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Synthesis of non-natural flavanones and dihydrochalcones in metabolically engineered yeast;Werner, S. R. et al.;《Journal of Molecular Catalysis B: Enzymatic》;20100608;第66卷(第3-4期);第257-263页 *
The role of enoyl reductase genes in phloridzin biosynthesis in apple;Dare, A. P. et al.;《Plant Physiology and Biochemistry》;20130305;第72卷;第54页摘要,第55页图1,第60页左栏第4段 *

Also Published As

Publication number Publication date
EP3303573A1 (en) 2018-04-11
JP2018520661A (ja) 2018-08-02
US10760062B2 (en) 2020-09-01
JP7034715B2 (ja) 2022-03-14
CN108138151A (zh) 2018-06-08
WO2016193504A1 (en) 2016-12-08
US20180142216A1 (en) 2018-05-24

Similar Documents

Publication Publication Date Title
CN108138151B (zh) 苯丙素类和二氢苯丙素类衍生物的生物合成
US20170306376A1 (en) Methods and Materials for Recombinant Production of Saffron Compounds
CN107849591B (zh) 苯丙素类和苯丙素类衍生物的生物合成
CN107109358B (zh) 在重组宿主中生产甜菊醇糖苷
AU2022204430A1 (en) Methods and materials for biosynthesis of mogroside compounds
EP4148137A1 (en) Production of steviol glycosides in recombinant hosts
US20180371513A1 (en) Production of Anthocyanin from Simple Sugars
WO2020141230A1 (en) Recombinant host cells with improved production of tetraketide derivatives
EP3158069B1 (en) Improved selectivity of the production of vanilloids in a recombinant unicellular host
EP3134539A1 (en) Methods for recombinant production of saffron compounds
US20180327723A1 (en) Production of Glycosylated Nootkatol in Recombinant Hosts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant