CN118119716A - 从脂肪酸中生物合成产生大环麝香内酯 - Google Patents

从脂肪酸中生物合成产生大环麝香内酯 Download PDF

Info

Publication number
CN118119716A
CN118119716A CN202280034158.3A CN202280034158A CN118119716A CN 118119716 A CN118119716 A CN 118119716A CN 202280034158 A CN202280034158 A CN 202280034158A CN 118119716 A CN118119716 A CN 118119716A
Authority
CN
China
Prior art keywords
acid
lactone
fatty acids
reaction mixture
produced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280034158.3A
Other languages
English (en)
Inventor
陈辉
M·G·维内加斯
O·于
M·纳扎罗
A·斯图尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Conagen Inc
Original Assignee
Conagen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Conagen Inc filed Critical Conagen Inc
Publication of CN118119716A publication Critical patent/CN118119716A/zh
Pending legal-status Critical Current

Links

Abstract

本文提供了用于从脂肪酸中产生内酯诸如大环内酯的生物合成方法。还提供了使用这些生物合成方法和/或在这些生物合成方法期间产生的内酯。

Description

从脂肪酸中生物合成产生大环麝香内酯
相关申请
本申请根据35 U.S.C.§119(e)要求2021年3月9日提交的名称为“BIOSYNTHETICPRODUCTION OF MACROCYCLIC MUSK LACTONES FROM FATTY ACIDS”的美国临时申请号63/158,843和2021年4月30日提交的名称为“BIOSYNTHETIC PRODUCTION OF MACROCYCLICMUSK LACTONES FROM FATTY ACIDS”的美国临时申请号63/182,242的权益,这两篇美国临时申请中的每一篇美国临时申请的全部内容以引用方式并入本文。
序列表段落
本申请包含通过EFS-Web以ASCII格式提交并且据此全文以引用方式并入的序列表。所述ASCII副本创建于2022年3月9日,名称为C149770047WO00-SEQ-ZJG,大小为30,286字节。
技术领域
本发明的领域涉及可用于产生内酯化合物(例如,可以带有风味或香味的大环内酯化合物)的方法和工艺。
背景技术
麝香内酯一般是稀缺且昂贵的。目前,只有有限数量的大环麝香内酯可供使用,并且它们只具有有限的差异性麝香香韵。现有的麝香内酯大部分是化学合成的,天然的麝香内酯很少。
发明内容
在一些方面,本公开提供了从脂肪酸产生内酯(诸如大环内酯)的方法(例如,生物合成方法)。在一些实施方案中,使用本文所述的方法产生的内酯(诸如大环内酯)具有差异性麝香香韵。如本文所述,具有羟化酶活性的细胞色素P450酶可以进行本文所述的生物合成方法的第一步骤,即将脂肪酸转化为ω-1、ω-2、ω-3羟基脂肪酸或它们的组合。本文所述的生物合成方法的第二步骤,即ω-1、ω-2、ω-3羟基脂肪酸的大环内酯化可以通过脂肪酶进行。还提供了新型内酯,诸如大环内酯。
因此,本公开的一些方面提供了生产内酯的方法,该方法包括:
(i)制备包含一种或多种脂肪酸、细胞色素P450羟化酶和NADPH的第一反应混合物;
(ii)将第一反应混合物温育足够的时间以产生选自ω-1羟基脂肪酸、ω-2羟基脂肪酸、ω-3羟基脂肪酸以及它们的组合的羟基脂肪酸;
(iii)制备包含在步骤(ii)中产生的羟基脂肪酸和脂肪酶的第二反应混合物;以及
(iv)将第二反应混合物温育足够的时间以产生内酯。
在一些实施方案中,其中步骤(ii)还包括从第一反应混合物中分离羟基脂肪酸。
在一些实施方案中,细胞色素P450羟化酶包含与SEQ ID NO:1或SEQ ID NO:3的氨基酸序列具有至少80%同一性的氨基酸序列。在一些实施方案中,细胞色素P450羟化酶包含SEQ ID NO:1或SEQ ID NO:3的氨基酸序列。
在一些实施方案中,脂肪酶是来自南极假丝酵母(Candida antarctica)的脂肪酶B。在一些实施方案中,脂肪酶包含与SEQ ID NO:5的氨基酸序列具有至少80%同一性的氨基酸序列。在一些实施方案中,脂肪酶包含SEQ ID NO:5的氨基酸序列。在一些实施方案中,脂肪酶固定在固体支持物上。在一些实施方案中,第二反应混合物还包含溶剂,任选地其中溶剂为甲苯或二氯乙烷。在一些实施方案中,第二反应混合物中的羟基脂肪酸的总浓度为0.02M-0.1M,任选地其中羟基脂肪酸的总浓度为0.025M-0.5M。在一些实施方案中,第二反应混合物中的脂肪酶的浓度为20g/L-150g/L,任选地其中脂肪酶的浓度为50g/L-100g/L。在一些实施方案中,步骤(iv)还包括分离内酯。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括包含12个至28个碳原子的直链脂肪酸,任选地其中步骤(i)的该一种或多种脂肪酸包括包含15个、16个、17个、18个或20个碳原子的直链脂肪酸。在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括饱和脂肪酸。在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括不饱和脂肪酸,任选地其中不饱和脂肪酸包含至少一个双键,任选地其中不饱和脂肪酸包含至少一个Z双键。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸选自:
(C15:0,十五烷酸);
(C16:0,棕榈酸);
(C16:1,棕榈油酸);
(C17:0,十七烷酸);
(C18:0,十八烷酸);
(C18:1,油酸);
(C18:2,亚油酸);
(C20:4,花生四烯酸);
((7Z,10Z,13Z)-十六碳三烯酸);
((6Z,9Z,12Z)-十六碳三烯酸);
((4E,7E,10E)-十六碳三烯酸);
((2E,4E,6E)-十六碳三烯酸);
(γ-亚麻酸);
(α-亚麻酸);
((8E,10E,12Z)-十八碳三烯酸);
((9Z,11E,13E)-十八碳-9,11,13-三烯酸);
((9E,11E,13E)-十八碳-9,11,13-三烯酸);
((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸);
(8Z,11Z,14Z-二十碳三烯酸);
((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸);
以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸选自:
(顺式-10-十七碳烯酸);
(顺式-10-十九碳烯酸);
(反式-10-十七碳烯酸);
(顺式-11-二十碳烯酸)以及它们的组合。在一些实施方案中,内酯包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内。
在一些实施方案中,内酯包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
n为6至20之间的整数,包括端值在内。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C15:0,十五烷酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C16:0,棕榈酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C16:1,棕榈油酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C17:0,十七烷酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C18:0,十八烷酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C18:1,油酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C18:2,亚油酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,步骤(i)的该一种或多种脂肪酸包括(C20:4,花生四烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中用作第一反应混合物中的底物的该一种或多种脂肪酸包括
((7Z,10Z,13Z)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((6Z,9Z,12Z)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((4E,7E,10E)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((2E,4E,6E)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(γ-亚麻酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(α-亚麻酸)并且在步骤(iv)中产生的内酯包括:/>
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(α-十八碳三烯酸;(8E,10E,12Z)-十八碳三烯酸)并且在步骤(iv)中产生的内酯包括:以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((9Z,11E,13E)-十八碳-9,11,13-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((9E,11E,13E)-十八碳-9,11,13-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(8Z,11Z,14Z-二十碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-10-十七碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(反式-10-十七碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-10-十九碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-11-二十碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,第一反应混合物是体外的。在一些实施方案中,第一反应是基于细胞的反应混合物。在一些实施方案中,基于细胞的反应混合物包含选自酵母、植物、藻类、真菌和细菌的细胞。在一些实施方案中,基于细胞的反应混合物包含选自以下属的细菌细胞:埃希氏菌(Escherichia);沙门氏菌(Salmonella);芽孢杆菌(Bacillus);不动杆菌(Acinetobacter);棒状杆菌(Corynebacterium);甲基弯曲菌(Methylosinus);甲基单胞菌(Methylomonas);红球菌(Rhodococcus);假单胞菌(Pseudomonas);红杆菌(Rhodobacter);集胞藻(Synechocystis);短杆菌(Brevibacteria);细杆菌(Microbacterium);节杆菌(Arthrobacter);柠檬酸杆菌(Citrobacter);埃希氏菌(Escherichia);克雷伯氏菌(Klebsiella);泛菌(Pantoea);沙门氏菌(Salmonella);棒状杆菌(Corynebacterium);和梭菌(Clostridium),任选地其中基于细胞的反应混合物包含大肠杆菌(E.coli)细胞。在一些实施方案中,基于细胞的反应混合物包含选自以下属的真菌:酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)、链霉菌属(Streptomyces)、汉逊酵母属(Hansenula)、德巴利氏酵母属(Debaryomyces)、毛霉菌(Mucor)、毕赤酵母属(Pichia)、球拟酵母属(Torulopsis)、曲霉菌属(Aspergillus)和节丛孢属(Arthrobotlys)。
在一些实施方案中,步骤(iv)中产生的内酯具有至少70%的纯度。在一些实施方案中,步骤(iv)中产生的内酯具有麝香香韵。
本公开的其他方面提供了下式的内酯:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内;
前提是内酯不具有下式:
在一些实施方案中,内酯具有下式:
其中:
R为甲基、乙基或正丙基;
在化合价允许的情况下,每个___独立地为单键或Z双键,其中0个、1个、2个或4个___为Z双键;并且
m为4至11之间的整数,包括端值在内;
前提是内酯不具有下式:
在一些实施方案中,每个___为单键。在一些实施方案中,一个___为E或Z双键,并且其余的___为单键。在一些实施方案中,两个___独立地为E或Z双键,并且其余的___为单键。在一些实施方案中,三个___独立地为E或Z双键,并且其余的___为单键。在一些实施方案中,四个___独立地为E或Z双键,并且其余的___为单键。在一些实施方案中,每个双键(如果存在)为Z双键。在一些实施方案中,每个双键(如果存在)为E双键。在一些实施方案中,内酯不包含C=C=C、C=C≡C和C≡C=C中的任一者。在一些实施方案中,k为8、9、10、11、12、13或15。
在一些实施方案中,内酯具有下式:
在一些实施方案中,内酯具有下式:
/>
/>
在一些实施方案中,内酯具有下式:
在一些实施方案中,手性碳原子具有S构型。在一些实施方案中,手性碳原子具有R构型。
还提供了本文所述的两种或更多种内酯的混合物以及包含本文所述的内酯或两种或更多种内酯的混合物的组合物。在一些实施方案中,组合物还包含美容上可接受的赋形剂。
本文还提供了通过本文所述的方法中的任一种方法产生的内酯。
虽然本公开易于进行各种修改和替代形式,但是本公开的具体实施方案在附图中以示例的方式示出并且将在本文中详细描述。然而,应当理解,本文给出的附图和详细描述并非旨在将本公开限制于所公开的特定实施方案,相反,旨在涵盖落入由所附权利要求限定的本公开的实质和范围内的所有修改、等同物和替代物。
在以下参照附图对本发明的优选实施方案的详细描述中,本发明的其他特征和优点将变得显而易见。
附图说明
附图并非按比例绘制。在附图中,各个附图中示出的每个相同或几乎相同的部件由相似的数字表示。为了清楚起见,并非每个附图中的每个部件都被标记。在附图中,
图1:示出脂肪酸羟基化(工艺1)和获得大环内酯的反应(工艺2)的总体合成方案。
图2:由脂肪酶催化的反应产物的GC/MS分析。数字表示来自不同脂肪酸的麝香内酯峰。这些麝香内酯的分子量与其计算分子量匹配。
图3A至图3F:示出脂肪酸羟基化和油酸(图3A)、亚油酸(图3B)、花生四烯酸(图3C)、棕榈酸(图3D)、十七烷酸(图3E)和十八烷酸(图3F)的闭环的反应方案。
图4:示出棕榈酸羟基化(工艺1)和获得对应麝香内酯产物的反应(工艺2)的总体合成方案。
图5:示出羟基油酸环化以获得对应的麝香内酯产物(工艺2)的反应。
图6:示出油酸大环内酯化产物的分析的色谱图和谱图。
图7:示出亚油酸羟基化(工艺1)和获得对应麝香内酯产物的反应(工艺2)的总体合成方案如图6所示。
图8:示出亚油酸大环内酯化产物的分析的GC/MS。
图9:从羟基γ-亚麻酸(GLA,C18:3)中产生麝香内酯。
图10:衍生自羟基GLA的麝香内酯(分子量:276)的GC/MS分析。
图11:从α-亚麻酸(ALA,C18:3)中产生麝香内酯。
图12:来自羟基ALA的麝香内酯(分子量:276)的GC/MS分析。
图13:从8Z,11Z,14Z-二十碳三烯酸、二高-γ-亚麻酸(DGLA,C20:3)中产生麝香内酯。
图14:来自羟基DGLA的麝香内酯(分子量:304)的GC/MS分析。
图15:示出顺式-10-十七碳烯酸(C17:1cis-10)羟基化和环化以获得对应麝香内酯产物的反应。
图16:示出反式-10-十七碳烯酸(C17:1trans-10)羟基化和环化以获得对应麝香内酯产物的反应。
图17:示出顺式-10-十九碳烯酸(C19:1cis-10)羟基化和环化以获得对应麝香内酯产物的反应。
图18:示出顺式-11-二十碳烯酸(C20:1cis-11)羟基化和环化以获得对应麝香内酯产物的反应。
图19:来自顺式-10-十七碳烯酸(C17:1cis-10)的麝香内酯的GC/MS分析。
图20:来自反式-10-十七碳烯酸(C17:1trans-10)的麝香内酯的GC/MS分析。
图21:来自顺式-10-十九碳烯酸(C19:1cis-10)的麝香内酯的GC/MS分析。
图22:来自顺式-11-二十碳烯酸(C20:1cis-11)的麝香内酯的GM/MS分析。
定义
术语“烷基”是指支链或非支链的饱和无环烃基团的基团。在某些实施方案中,烷基为C3-36烷基。在某些实施方案中,烷基为C10-36烷基。在某些实施方案中,烷基为C11-27烷基。除非另外提供,否则烷基为C3-29烷基。
术语“烯基”是指在化合价允许的情况下具有一个或多个碳-碳双键(C=C键;例如,1个、2个、3个、4个、5个或6个C=C键)的支链或非支链的无环烃基团的基团。在烯基基团中,是E双键,/>是Z双键。涉及E或Z双键的其他情况是本领域已知的。在烯基基团中,立体化学未指定的C=C键(例如,-CH=CH-或/>)可为E或Z双键。在某些实施方案中,烯基为C3-36烯基。在某些实施方案中,烯基为C10-36烯基。在某些实施方案中,烯基为C11-27烯基。除非另外提供,否则烯基为C3-29烯基。
术语“炔基”是指在化合价允许的情况下具有一个或多个碳-碳三键(C≡C键;例如,1个、2个、3个或4个三键)的支链或非支链的无环烃基团的基团。在某些实施方案中,炔基是C3-36炔基。在某些实施方案中,炔基是C10-36炔基。在某些实施方案中,炔基是C11-27炔基。除非另外提供,否则炔基为C3-29炔基。
将后缀“烯”附连到基团表示该基团是二价部分,例如,亚烷基是烷基的二价部分(例如,C3-36烷基、C10-36烷基、C11-27烷基或C3-29烷基),亚烯基是烯基的二价部分(例如,C3-36烯基、C10-36烯基、C11-27烯基或C3-29烯基),并且亚炔基是炔基的二价部分(例如,C3-36炔基、C10-36炔基、C11-27炔基或C3-29炔基)。
“脂肪酸”是下式的羧酸:RA-C(=O)OH,其中RA为C3-36烷基、C3-36烯基或C3-36炔基(例如,C3-29烷基、C3-29烯基或C3-29炔基)。RA中距离羧基部分最远的碳原子(例如,C1)被标记为ω(omega)。与C1相邻的碳原子(例如,C2)被标记为ω-1。与C2相邻且不与C1相邻的碳原子(例如,C3)被标记为ω-2。与C3相邻且不与C2相邻的碳原子(例如,C4)被标记为ω-3。15:0脂肪酸是其中碳原子数为15并且C=C和C≡C键的数量为0的脂肪酸。16:0脂肪酸是其中碳原子数为16并且C=C和C≡C键的数量为0的脂肪酸。16:1脂肪酸是其中碳原子数为16,C=C键的数量为1,并且C≡C键的数量为0的脂肪酸。16:3脂肪酸是其中碳原子数为16,C=C键的数量为3,并且C≡C键的数量为0的脂肪酸。17:0脂肪酸是其中碳原子数为17并且C=C和C≡C键的数量为0的脂肪酸。18:0脂肪酸是其中碳原子数为18并且C=C和C≡C键的数量为0的脂肪酸。18:1脂肪酸是其中碳原子数为18,C=C键的数量为1,并且C≡C键的数量为0的脂肪酸。18:2脂肪酸是其中碳原子数为18,C=C键的数量为2,并且C≡C键的数量为0的脂肪酸。18:3脂肪酸是其中碳原子数为18,C=C键的数量为3,并且C≡C键的数量为0的脂肪酸。20:3脂肪酸是其中碳原子数为20,C=C键的数量为3,并且C≡C键的数量为0的脂肪酸。20:4脂肪酸是其中碳原子数为20,C=C键的数量为4,并且C≡C键的数量为0的脂肪酸。其他脂肪酸也可以这样命名。
“饱和脂肪酸”是其中RA为C3-36烷基(例如,C3-29烷基)的脂肪酸。
“不饱和脂肪酸”是其中RA为C3-36烯基或C3-36炔基(例如,C3-29烯基或C3-29炔基)的脂肪酸。
术语“羟基”或“氢氧基”是指基团-OH。
“羟基脂肪酸”、“氢氧基脂肪酸”或“羟基化脂肪酸”是其中一个或多个氢原子被羟基取代的脂肪酸。在一些实施方案中,羟基脂肪酸是其中一个氢原子被羟基取代的脂肪酸(单羟基脂肪酸)。在一些实施方案中,羟基脂肪酸是其中多于一个(例如,2个、3个或更多个)氢原子被羟基取代的脂肪酸(多羟基脂肪酸)。
“内酯”是单环化合物,其中部分-C(=O)O-是单环的一部分,并且单环化合物的其余部分是亚烷基、亚烯基或亚炔基。当亚烷基、亚烯基或亚炔基是支链时,内酯还包括亚烷基、亚烯基或亚炔基的支链。
“细胞系统”是提供异位蛋白质表达的任何细胞。细胞系统包括细菌、酵母、植物细胞和动物细胞。细胞系统可包括经修饰以表达重组蛋白并在适当的培养基中培养的原核或真核宿主细胞。细胞系统还包含基于细胞组分(诸如核糖体)的蛋白质的体外表达。
“编码序列”应赋予本领域普通技术人员其普通和习惯的含义,并且不限于用于指代编码特定氨基酸序列的DNA序列。
“培养细胞系统”。培养包括提供允许细胞繁殖和分裂的适当培养基以形成细胞培养物。培养还包括提供资源,使得细胞或细胞组分可翻译和制造重组蛋白。
“蛋白质表达”。蛋白质产生可发生在基因表达后。蛋白质表达由DNA转录为信使RNA(mRNA)之后的阶段组成。然后将mRNA翻译成多肽链,最终将其折叠成蛋白质。DNA或RNA可通过转染存在于细胞中,转染是一种故意将核酸引入细胞的过程。该术语通常用于真核细胞中的非病毒方法。该术语也可指代其他方法和细胞类型,尽管其他术语是优选的:“转化”更常用于描述细菌、非动物真核细胞(包括植物细胞)中的非病毒DNA转移。在动物细胞中,转染是优选术语,因为转化也用于指在这些细胞中进展到癌变状态(致癌作用)。转导通常用于描述病毒介导的DNA转移。对于本申请,转化、转导和病毒感染包含在转染的定义下。
“酵母”。根据本公开,酵母是被分类为真菌界成员的真核单细胞微生物。酵母是被认为是从多细胞祖先进化而来的单细胞生物。
如本文所使用,单数形式“一(a,an)”和“所述(the)”包含复数参考物,除非内容另有明确规定。
就在说明书或权利要求中使用术语“包含(include)”、“具有(have)”,此术语旨在以类似于术语“包括(comprise)”在权利要求中用作过渡词时被解释为“包括”的方式为包含性的。
词语“示例性”在本文中用于表示“用作实例、示例或说明”。本文描述为“示例性”的任何实施方案不一定被解释为比其他实施方案优选或有利。
术语“互补”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于描述能够彼此杂交的核苷酸碱基之间的关系。例如,关于DNA,腺苷与胸腺嘧啶互补,并且胞嘧啶与鸟嘌呤互补。因此,本发明技术还包含分离的核酸片段,这些核酸片段与所附序列表中报道的完整序列以及那些基本上相似的核酸序列互补。
术语“核酸”和“核苷酸”应赋予本领域普通技术人员其相应的普通和习惯的含义,并且用于但不限于指代脱氧核糖核苷酸或核糖核苷酸以及其单链或双链形式的聚合物。除非特别限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,其具有与参考核酸相似的结合特性,并且以类似于天然存在的核苷酸的方式代谢。除非另外指明,否则特定的核酸序列还隐含地包含其保守修饰或简并的变体(例如,简并密码子取代)和互补序列,以及明确指示的序列。
术语“分离的”应赋予本领域普通技术人员其普通和习惯的含义,并且当在分离的核酸或分离的多肽的上下文中使用时,用于但不限于指代通过人手脱离其天然环境而存在并因此不是自然产物的核酸或多肽。分离的核酸或多肽可以纯化的形式存在或可以存在于非天然环境中,例如,存在于转基因宿主细胞中。
如本文所使用的术语“温育(incubating/incubation)”意指混合两种或更多种化学或生物实体(诸如化合物和酶)并允许其在有利于产生δ-内酯组合物的条件下相互作用的过程。
术语“简并变体”是指具有与参考核酸序列相差一个或多个简并密码子取代的残基序列的核酸序列。简并密码子取代可通过产生其中一个或多个选定(或所有)密码子的第三位置被混合的碱基和/或脱氧肌苷残基取代的序列来实现。核酸序列及其所有简并变体将表达相同的氨基酸或多肽。
术语“多肽”、“蛋白质”和“肽”应赋予本领域普通技术人员其相应的普通和习惯含义;这三个术语有时可互换使用,并且用于但不限于指代氨基酸或氨基酸类似物的聚合物,不管其大小或功能如何。尽管“蛋白质”通常是参考相对较大的多肽使用,并且“肽”通常是参考较小的多肽使用,但是这些术语在本领域中的使用是重叠的并且是变化的。除非另有说明,否则如本文所用的术语“多肽”是指肽、多肽和蛋白质。术语“蛋白质”、“多肽”和“肽”在本文中当涉及多氨基酸产物时可互换使用。因此,示例性多肽包括多氨基酸产物、天然存在的蛋白质、同系物、直系同源物、旁系同源物、片段以及上述的其他等效物、变体和类似物。
术语“多肽片段”和“片段”,当用于参考多肽时,应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代与参考多肽本身相比其中氨基酸残基缺失,但剩余的氨基酸序列通常与参考多肽中的对应位置一致的多肽。这样的缺失可以发生在参考多肽的氨基末端或羧基末端,或者两者兼而有之。
术语多肽或蛋白质的“功能片段”是指作为全长多肽或蛋白质的一部分,并且具有与全长多肽或蛋白质基本相同的生物学活性或执行与全长多肽或蛋白质基本相同的功能(例如,进行相同的酶促反应)的肽片段。
可互换使用的术语“变体多肽”、“修饰的氨基酸序列”或“修饰的多肽”是指与参考多肽相差一个或多个氨基酸,例如一个或多个氨基酸取代、缺失和/或添加的氨基酸序列。一方面,变体是“功能变体”,其保留了参考多肽的一些或全部能力。
术语“功能变体”还包括保守取代的变体。术语“保守取代的变体”是指具有与参考肽相差一个或多个保守氨基酸取代,并维持所述参考肽的一些或全部活性的氨基酸序列的肽。“保守氨基酸取代”是用功能相似的残基取代氨基酸残基。保守取代的实例包含用一个非极性(疏水)残基(例如异亮氨酸、缬氨酸、亮氨酸或蛋氨酸)取代另一个;用一个带电荷或极性(亲水性)的残基取代另一个,例如精氨酸和赖氨酸之间、谷氨酰胺和天冬酰胺之间、苏氨酸和丝氨酸之间;用一个碱性残基(例如赖氨酸或精氨酸)取代另一个;或用一个酸性残基(例如天冬氨酸或谷氨酸)取代另一个;或用一个芳香族残基(例如苯丙氨酸、酪氨酸或色氨酸)取代另一个。预计此类取代对蛋白质或多肽的表观分子量或等电点几乎没有影响。短语“保守取代的变体”还包括其中残基被化学衍生的残基取代的肽,条件是所得肽保持本文所述的参考肽的一些或全部活性。
与本发明技术的多肽相关的术语“变体”还包括具有与参考多肽的氨基酸序列具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%和甚至100%同一性的氨基酸序列的功能活性多肽。
术语“同源”在其所有语法形式和拼写变化中是指具有“共同进化起源”的多核苷酸或多肽之间的关系,包括来自超家族的多核苷酸或多肽和来自不同物种的同源多核苷酸或蛋白质(Reeck等人,Cell,第50卷:第667页,1987年)。这种多核苷酸或多肽具有序列同源性,如其序列相似性所反映的,无论是在同一性百分比上,还是在保守位置上存在特定氨基酸或基序。例如,两个同源多肽可具有至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少900、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%和甚至100%同一性的氨基酸序列。
“合适的调节序列”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或翻译的核苷酸序列。调节序列可包含启动子、转译前导序列、内含子和聚腺苷酸化识别序列。
“启动子”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代能够控制编码序列或功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'处。启动子可完全来源于天然基因,或由来源于自然界中所发现的不同启动子的不同元件构成,或甚至包含合成DNA区段。本领域的技术人员应理解,不同启动子可引导基因在不同组织或细胞类型中或在不同的发育阶段或响应于不同的环境条件来表达。导致基因在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全确定,不同长度的DNA片段可能具有相同的启动子活性。
术语“可操作地连接”是指单个核酸片段上的核酸序列的缔合,使得一个核酸片段的功能受到另一个核酸片段的影响。例如,当启动子能够影响编码序列的表达时(即,编码序列在启动子的转录控制之下),则该启动子与该编码序列可操作地连接。编码序列可以有义或反义方向可操作地连接至调节序列。
本文所用的术语“表达”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代源于本发明技术的核酸片段的有义(mRNA)或反义RNA的转录和稳定积累。“过表达”是指基因产物在转基因或重组生物中的产量超过正常或非转化生物中的产量水平。
“转化”应赋予本领域适当技术人员其普通和习惯的含义,并且用于但不限于指代将多核苷酸转移到靶细胞中以被该细胞进一步表达。可将转移的多核苷酸并入靶细胞的基因组或染色体DNA中,从而产生遗传稳定的遗传,或者可独立于宿主染色体DNA进行复制。含有转化的核酸片段的宿主生物被称为“转基因的”或“重组的”或“转化的”生物。
当在本文中与宿主细胞结合使用时,术语“转化的”、“转基因的”和“重组的”应赋予本领域普通技术人员其相应的普通和习惯的含义,并且用于但不限于指代宿主生物的细胞,诸如植物或微生物细胞,其中已引入异源核酸分子。该核酸分子可稳定地整合到宿主细胞的基因组中,或者该核酸分子可作为染色体外的分子存在。这种染色体外的分子可自动复制。转化的细胞、组织或受试者被理解为不仅包含转化过程的终产物,而且还包含其转基因子代。
当在本文中与多核苷酸结合使用时,术语“重组”、“异源”和“外源”应赋予本领域普通技术人员其普通和习惯的含义,并且用于但不限于指代多核苷酸(例如,DNA序列或基因)源自特定宿主细胞的外源,或者如果来自相同来源,则从其原始形式进行修饰。因此,宿主细胞中的异源基因包括特定宿主细胞内源性的但是已经通过例如使用定点诱变或其他重组技术进行修饰的基因。该术语还包括天然存在的DNA序列的非天然存在的多个拷贝。因此,该术语是指与细胞外源或异源,或与细胞同源,但在宿主细胞内通常不存在该元件的位置或形式的DNA区段。
类似地,当在本文中与多肽或氨基酸序列结合使用时,术语“重组”、“异源”和“外源”是指多肽或氨基酸序列源自特定宿主细胞外源,或如果来自相同来源,则从其原始形式进行修饰。因此,重组DNA区段可在宿主细胞中表达以产生重组多肽。
术语“质粒”、“载体”和“基因盒”应赋予本领域普通技术人员其相应的普通和习惯的含义,并且用于但不限于指代通常携带基因的额外染色体元件,所述基因携带不是细胞中央代谢的一部分,通常以环状双链DNA分子的形式存在。这些元件可以是源自任何来源的单链或双链DNA或RNA的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,为线性或环状的,其中许多核苷酸序列已被连接或重组为独特的结构,该结构能够将所选基因产物的启动子片段和DNA序列以及适当的3'未转译序列引入到细胞中。“转化基因盒”是指含有外源基因并且除外源基因外还具有促进特定宿主细胞转化的元件的特定载体。“表达基因盒”是指含有外源基因并且除外源基因外还具有允许该基因在外源宿主中增强表达的元件的特定载体。
除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。尽管类似于或等同于本文所述的方法或材料的任何方法和材料都可用于本公开的实践或测试,但是优选的材料和方法如下所述。
具体实施方式
在一些方面,本文提供了用于从脂肪酸(例如,直链脂肪酸)中产生内酯(诸如大环内酯)的方法(例如,生物合成方法)。在一些实施方案中,使用本文所述的方法产生的内酯(诸如大环内酯)具有差异性麝香香韵(也被称为“麝香内酯”或“麝香味内酯”)。在一些实施方案中,使用本文所述的方法产生的大环内酯包含甲基、乙基或丙基侧链。在一些实施方案中,内酯(诸如大环内酯)使用本文所述的方法从饱和脂肪酸(不具有碳-碳双键)或不饱和脂肪酸(例如,具有一个或多个碳-碳双键)中产生。如本文所述,具有羟化酶活性的细胞色素P450酶可以进行本文所述的生物合成方法的第一步骤,即将脂肪酸转化为ω-1、ω-2、ω-3羟基脂肪酸或它们的组合。本文所述的生物合成方法的第二步骤,即ω-1、ω-2、ω-3羟基脂肪酸的大环内酯化可以通过脂肪酶进行。
本公开的其他方面提供了具有差异性麝香香韵的内酯诸如大环内酯,这些内酯是使用本文所述的方法产生的。在一些实施方案中,本文产生的内酯(诸如,大环内酯)包含一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内。
在一些实施方案中,本文产生的内酯(诸如,大环内酯)包含以下结构:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
n为6至20之间的整数,包括端值在内。
用于产生内酯的生物合成方法
本文所述的生物合成方法利用脂肪酸(例如,直链脂肪酸)作为酶促产生内酯(诸如大环内酯)(例如,具有差异性麝香香韵的内酯)的底物。本文所述的方法包括两个酶促转化步骤。在第一步骤中,脂肪酸在ω-1、ω-2或ω-3位置被具有羟化酶活性的细胞色素P450酶或其功能变体羟基化,以产生羟基脂肪酸(例如,ω-1羟基脂肪酸、ω-2羟基脂肪酸、ω-3羟基脂肪酸以及它们的组合)。在第二步骤中,羟基脂肪酸通过脂肪酶(例如,Novozyme435)进行大环化以产生内酯(诸如,具有甲基、乙基或丙基侧链的大环内酯)。不受任何特定理论的束缚,据信大环或侧链或这两个部分赋予可用于工业应用的麝香香韵。使用本文所述的方法产生的具有麝香香韵的内酯(诸如大环内酯)也被称为“麝香内酯”。
在一些实施方案中,产生内酯(例如,大环内酯)的生物合成方法包括:(i)制备包含一种或多种脂肪酸、细胞色素P450羟化酶和NADPH的第一反应混合物;(ii)将第一反应混合物温育足够的时间以产生选自ω-1羟基脂肪酸、ω-2羟基脂肪酸、ω-3羟基脂肪酸以及它们的组合的羟基脂肪酸;(iii)制备包含在步骤(ii)中产生的羟基脂肪酸和脂肪酶的第二反应混合物;以及(iv)将第二反应混合物温育足够的时间以产生麝香内酯。
在第一反应混合物中,脂肪酸是在NADPH的存在下可以通过细胞色素P450羟化酶转化为羟基脂肪酸的底物。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括包含至少12个碳(例如,至少12个碳、至少13个碳、至少14个碳、至少15个碳、至少16个碳、至少17个碳、至少18个碳、至少19个碳、至少20个碳或至少25个碳)的直链脂肪酸。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括包含12个至28个(例如,12个至28个、12个至25个、12个至20个、12个至15个、15个至28个、15个至25个、15个至20个、20个至28个、20个至25个或25个至28个)碳的直链脂肪酸。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括包含12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个或28个碳或它们的任何组合的直链脂肪酸。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括包含15个、16个、17个、18个、19个或20个碳或它们的任何组合的直链脂肪酸。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括包含不同碳数的直链脂肪酸的混合物,例如包含15个、16个、17个、18个、19个或20个碳的脂肪酸的混合物。
在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括饱和脂肪酸(即,任何两个碳之间没有双键)。在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸包括不饱和脂肪酸。在一些实施方案中,不饱和脂肪酸包含至少一个(例如,1个、2个、3个、4个、5个或更多个)双键。在一些实施方案中,不饱和脂肪酸包含至少一个(例如,1个、2个、3个、4个、5个或更多个)Z双键。
在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸选自:
(C15:0,十五烷酸);
(C16:0,棕榈酸);
(C16:1,棕榈油酸);
(C17:0,十七烷酸);
(C18:0,十八烷酸);
(C18:1,油酸);
(C18:2,亚油酸);
(C20:4,花生四烯酸);以及它们的任何组合。
在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸选自:
((7Z,10Z,13Z)-十六碳三烯酸);
((6Z,9Z,12Z)-十六碳三烯酸);
((4E,7E,10E)-十六碳三烯酸);
((2E,4E,6E)-十六碳三烯酸);
(γ-亚麻酸);
(α-亚麻酸);
((8E,10E,12Z)-十八碳三烯酸);
((9Z,11E,13E)-十八碳-9,11,13-三烯酸);
((9E,11E,13E)-十八碳-9,11,13-三烯酸);
((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸);
(8Z,11Z,14Z-二十碳三烯酸);
((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸);
以及它们的任何组合。
在一些实施方案中,步骤(i)的第一反应混合物中的该一种或多种脂肪酸选自:
(顺式-10-十七碳烯酸);
(顺式-10-十九碳烯酸);/>
(反式-10-十七碳烯酸);
(顺式-11-二十碳烯酸);以及它们的任何组合。
使第一反应混合物中的脂肪酸底物羟基化的酶是具有羟化酶活性的细胞色素P450酶(本文中称为“细胞色素P450羟化酶”)或其功能变体。在一些实施方案中,细胞色素P450羟化酶是细菌细胞色素P450酶。可根据本公开使用的细胞色素P450酶的示例包括但不限于来自巨大芽孢杆菌(Bacillus megaterium)的CYP102A1;来自巨大芽孢杆菌DSM319的CYP106A1;来自巨大芽孢杆菌ATCC13368的CYP106A2;来自枯草芽孢杆菌(B.subtilis)168的CYP109B1;来自巨大芽孢杆菌DSM19的CYP109E1;来自鼻疽诺卡氏菌(Nocardiafarcinica)IFM 10152的CYP154C5;来自纤维素堆囊菌(Sorangium cellulosum)Soce56的CYP260A1和CYP260B1;来自灰色链霉菌(Streptomyces griseus)SGR1085的CYP154C3;来自链霉菌属W2233-SM的CYP154C8和来自嗜芳烃新鞘氨醇杆菌(Novosphingobiumaromaticivorans)DSM12444(saro0307)的CYP219A;来自浅灰链霉菌(Streptomycesgriseolus)ATCC 11796的CYP105A1;来自稀有放线菌淡灰红小单孢菌(Micromonosporagriseorubida)的CYP107E1;来自百脉根中慢生根瘤菌(Mesorhizobium loti)MAFF303099(mlr5876)的CYP107D1和CYP127A3;来自念珠藻(Nostoc)属PCC7120的CYP110A1、CYP110C1、CYP110D1和CYP110E1;来自慢生型大豆根瘤菌(Bradyrhizobium japonicum)USDA110的CYP200A1;分别来自极性芽孢杆菌属PAMC 25034和类芽孢杆菌(Paenibacillus)属PAMC22724的CYP102A15和CYP102A170;来自小麦植物(Triticum aestivum)的CYP709C1;来自海鱼分枝杆菌(Mycobacterium marinum)的CYP147G1;来自白腐真菌黄孢原毛平革菌(Phanerochaete chrysosporium)的CYP505D6;以及来自解淀粉芽孢杆菌(Bacillusamyloliquefaciens)DSM 7的CYP102家族酶(bamf2522和bamf0695)。
本文表明,来自巨大芽孢杆菌的细胞色素P450酶(CYP102A1,例如,如Miura等人,Biochim.Biophys.Acta.,第388卷:第305-317页,1975年中所述,以引用方式并入本文)和来自嗜热毁丝霉(Myceliophthora thermophile)的细胞色素P450酶(CYP505A30,UniProt登录号:G2QDZ3)能够进行本文所述的生物合成方法的第一步骤,即,将脂肪酸转化为在ω-1、ω-2或ω-3位置中的一者处羟基化的单羟基脂肪酸或其单羟基脂肪酸的组合。CYP102A1的氨基酸序列作为SEQ ID NO:1提供。CYP505A30的氨基酸序列作为SEQ ID NO:3提供。
在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含与SEQ ID NO:1的氨基酸序列具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%)同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含与SEQ ID NO:1的氨基酸序列具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含SEQ ID NO:1的氨基酸序列。
在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含与SEQ ID NO:3的氨基酸序列具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%)同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含与SEQ ID NO:3的氨基酸序列具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的细胞色素P450羟化酶包含SEQ ID NO:3的氨基酸序列。
在一些实施方案中,步骤(i)的第一反应混合物是体外反应混合物,例如使用分离的重组产生的细胞色素P450羟化酶。在一些实施方案中,步骤(i)的第一反应混合物是基于细胞的反应混合物。在一些实施方案中,基于细胞的反应混合物包含选自酵母、植物、藻类、真菌和细菌的细胞。在一些实施方案中,基于细胞的反应混合物包含选自以下属的细菌细胞:埃希氏菌;沙门氏菌;芽孢杆菌;不动杆菌;棒状杆菌;甲基弯曲菌;甲基单胞菌;红球菌;假单胞菌;红杆菌;集胞藻;短杆菌;细杆菌;节杆菌;柠檬酸杆菌;埃希氏菌;克雷伯氏菌;泛菌;沙门氏菌;棒状杆菌;和梭菌。在一些实施方案中,基于细胞的反应混合物包含大肠杆菌细胞。在一些实施方案中,基于细胞的反应混合物包含选自以下属的真菌:酵母属、接合酵母属、克鲁维酵母菌属、假丝酵母属、链霉菌属、汉逊酵母属、德巴利氏酵母属、毛霉菌、毕赤酵母属、球拟酵母属、曲霉菌属和节丛孢属。
在一些实施方案中,基于细胞的反应混合物中使用的细胞重组表达细胞色素P450羟化酶。例如,基于细胞的反应混合物中使用的细胞可以用包含编码细胞色素P450羟化酶的核苷酸序列的核酸分子(例如,载体诸如表达载体)转化。在一些实施方案中,编码细胞色素P450羟化酶的核苷酸序列可操作地连接至启动子(例如,诱导型启动子或组成型启动子)。转化的细胞可以在允许细胞色素P450羟化酶表达的条件下培养。可以收集含有表达的细胞色素P450羟化酶的细胞并将其用于基于细胞的反应混合物中。编码CYP102A1(SEQ IDNO:1)的核苷酸序列作为SEQ ID NO:2提供。编码CYP505A30(SEQ ID NO:3)的核苷酸序列作为SEQ ID NO:4提供。
在一些实施方案中,基于细胞的反应混合物中使用的细胞(例如,细菌细胞,诸如大肠杆菌或芽孢杆菌细胞)用核酸分子转化,该核酸分子包含与SEQ ID NO:2或SEQ ID NO:4的核苷酸序列具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%)同一性的核苷酸序列。在一些实施方案中,基于细胞的反应混合物中使用的细胞(例如,细菌细胞,诸如大肠杆菌或芽孢杆菌细胞)用核酸分子转化,该核酸分子包含与SEQ ID NO:2或SEQ ID NO:4的核苷酸序列具有70%、75%、80%、85%、90%、95%或99%同一性的核苷酸序列。在一些实施方案中,基于细胞的反应混合物中使用的细胞(例如,细菌细胞,诸如大肠杆菌或芽孢杆菌细胞)用核酸分子转化,该核酸分子包含SEQ IDNO:2或SEQ ID NO:4的核苷酸序列。
在一些实施方案中,在本文所述的生物合成方法的步骤(ii)中,将第一反应混合物温育足够的时间以产生羟基脂肪酸。在一些实施方案中,将第一反应混合物温育至少1小时(例如,至少1小时、至少2小时、至少5小时、至少10小时或更长时间)。在一些实施方案中,温育在37℃下进行。在一些实施方案中,在本文所述的生物合成方法的步骤(ii)中产生的羟基脂肪酸是在位置ω-1、ω-2或ω-3中的任一者处羟基化的单羟基脂肪酸。在一些实施方案中,在本文所述的生物合成方法的步骤(ii)中产生的羟基脂肪酸包括ω-1羟基脂肪酸、ω-2羟基脂肪酸、ω-3羟基脂肪酸以及它们的组合,以及它们的任何组合。
在一些实施方案中,本文所述的生物合成方法的步骤(ii)还包括从反应混合物中分离羟基脂肪酸。可以使用任何合适的萃取方法。例如,可以使用基于烃的有机溶剂(例如,己烷)和水不溶性极性溶剂(例如,乙酸乙酯)的混合物通过液-液萃取来萃取羟基脂肪酸。
在步骤(ii)中产生的羟基脂肪酸可以通过脂肪酶催化的大环内酯化进一步转化为内酯。在一些实施方案中,作为本文所述的生物合成方法的步骤(iii),制备第二反应混合物,该第二反应混合物包含在步骤(ii)中产生的羟基脂肪酸和脂肪酶。本领域的技术人员能够识别适用于该反应的脂肪酶。在一些实施方案中,第二反应混合物中使用的脂肪酶是来自南极假丝酵母的脂肪酶B(Uniprot登录号:P41365)。来自南极假丝酵母的脂肪酶B的氨基酸序列作为SEQ ID NO:5提供。就这一点而言,Krishna等人(Catalysis Reviews,第44卷,第499-591页,2002年)提供了对有机溶剂中脂肪酶催化的酯化反应的概述。每种脂肪酶都可以用不同的溶剂进行测试,以识别最适合羟基脂肪酸内酯化以产生麝香内酯的组合。
在一些实施方案中,本文所述的生物合成方法中使用的脂肪酶包含与SEQ ID NO:5的氨基酸序列具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%)同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的脂肪酶包含与SEQ ID NO:5的氨基酸序列具有70%、75%、80%、85%、90%、95%或99%同一性的氨基酸序列。在一些实施方案中,本文所述的生物合成方法中使用的脂肪酶包含SEQ ID NO:5的氨基酸序列。
在一些实施方案中,本文所述的生物合成方法的步骤(iii)中的第二反应混合物中使用的脂肪酶固定在固体支持物(例如,丙烯酸树脂)上。在一些实施方案中,本文所述的生物合成方法的步骤(iii)中的第二反应混合物中使用的脂肪酶是Novozyme 435(固定在丙烯酸树脂上的来自南极假丝酵母的脂肪酶B,可购自西格玛公司(Sigma),目录号L4777)。在一些实施方案中,其中第二反应混合物还包含溶剂。可以使用任何合适的溶剂。在一些实施方案中,溶剂是甲苯或二氯乙烷。
在一些实施方案中,在第二反应混合物中,羟基脂肪酸的总浓度为0.02M至0.1M(例如,0.02M、0.03M、0.04M、0.05M、0.06M、0.07M、0.08M、0.09M或0.1M)。在一些实施方案中,在第二反应混合物中,羟基脂肪酸的总浓度为0.025M至0.05M(例如,0.025M、0.03M、0.035M、0.04M、0.045M或0.05M)。在一些实施方案中,在第二反应混合物中,脂肪酶的浓度为20g/L至150g/L(例如,20g/L至150g/L、20g/L至100g/L、20g/L至50g/L、50g/L至150g/L、50g/L至100g/L或100g/L至150g/L)。在一些实施方案中,在第二反应混合物中,脂肪酶的浓度为50g/L至100g/L(例如,50g/L、60g/L、70g/L、80g/L、90g/L或100g/L)。
在一些实施方案中,作为本文所述的生物合成方法的步骤(iv),将第二反应混合物温育足够的时间以产生羟基脂肪酸。在一些实施方案中,将第二反应混合物温育至少10小时(例如,至少10小时、至少15小时、至少20小时、至少24小时或更长时间)。在一些实施方案中,将第二反应混合物温育15小时至24小时(例如,15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时或24小时)。在一些实施方案中,温育在40℃至60℃(例如,40℃至60℃、40℃至55℃、40℃至50℃、40℃至45℃、45℃至60℃、45℃至55℃、45℃至50℃、50℃至60℃、50℃至55℃或55℃至60℃)下进行。在一些实施方案中,温育在40℃、45℃、50℃、55℃或60℃下进行。
在一些实施方案中,在温育第二反应混合物之后,步骤(iv)还包括从反应混合物中分离内酯化合物。可以使用从反应混合物中分离内酯化合物的已知方法,包括但不限于过滤和/或色谱法。在一些实施方案中,对分离的内酯化合物进行干燥。
在一些实施方案中,通过本文所述的生物合成方法产生的内酯化合物具有至少50%重量/重量(例如,至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%重量/重量)的纯度。纯度涉及产生的所有内酯化合物,在一些实施方案中,这些化合物包括不同结构的内酯化合物。在一些实施方案中,在步骤(iv)中产生的内酯化合物具有麝香香韵。
内酯
在一些实施方案中,使用本文所述的生物合成方法产生的内酯(例如,大环内酯)包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内。
在一些实施方案中,使用本文所述的生物合成方法产生的内酯(例如,大环内酯)包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
n为6至20之间的整数,包括端值在内。
在某些实施方案中,R为甲基。在某些实施方案中,R为乙基。在某些实施方案中,R为正丙基。
在某些实施方案中,每个___为单键。在某些实施方案中,至少一个(例如,一个、两个、三个或四个)___为E或Z双键。在某些实施方案中,至少一个(例如,一个、两个、三个或四个)___为E双键。在某些实施方案中,至少一个(例如,一个、两个、三个或四个)___为Z双键。在某些实施方案中,每个___独立地为单键、E双键或Z双键。在某些实施方案中,每个___独立地为单键或Z双键。在某些实施方案中,一个___为Z双键,并且每个其余的___为单键。在某些实施方案中,两个___为Z双键,并且每个其余的___为单键。在某些实施方案中,三个___为Z双键,并且每个其余的___为单键。在某些实施方案中,四个___为Z双键,并且每个其余的___为单键。在某些实施方案中,至少一个(例如,一个、两个或三个)___为三键。在某些实施方案中,任何两个相邻的___中的至少一者为单键。
在某些实施方案中,一个___为E或Z双键,并且其余的___为单键。在某些实施方案中,两个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,三个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,四个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,每个双键(如果存在)为Z双键。在某些实施方案中,每个双键(如果存在)为E双键。在某些实施方案中,内酯不包含C=C=C、C=C≡C和C≡C=C中的任一者。
在某些实施方案中,k为6。在某些实施方案中,k为7。在某些实施方案中,k为8。在某些实施方案中,k为9。在某些实施方案中,k为10。在某些实施方案中,k为11。在某些实施方案中,k为12。在某些实施方案中,k为13。在某些实施方案中,k为14。在某些实施方案中,k为15。在某些实施方案中,k为16。在某些实施方案中,k为8、9、10、11、12、13或15。在某些实施方案中,k为8、9、10、11、12、13、14或15。在某些实施方案中,k为17至20之间的整数,包括端值在内。在某些实施方案中,k为21至25之间的整数,包括端值在内。在某些实施方案中,k为26至30之间的整数,包括端值在内。
在某些实施方案中,n为6。在某些实施方案中,n为7。在某些实施方案中,n为8。在某些实施方案中,n为9。在某些实施方案中,n为10。在某些实施方案中,n为11。在某些实施方案中,n为12。在某些实施方案中,n为13。在某些实施方案中,n为14。在某些实施方案中,n为15、16、17、18、19或20。在某些实施方案中,n为7至14之间的整数,包括端值在内。
在某些实施方案中,使用本文所述的生物合成方法产生的内酯包含手性碳原子,即下式中用*标记的碳原子:在某些实施方案中,使用本文所述的生物合成方法产生的内酯包含手性碳原子,即下式中用*标记的碳原子:/>在某些实施方案中,手性碳原子具有S构型。在某些实施方案中,手性碳原子具有R构型。
在某些实施方案中,使用本文所述的生物合成方法产生的内酯是内酯的混合物。在某些实施方案中,当忽略R/S构型的差异(如果存在)时,使用本文所述的生物合成方法产生的内酯是具有不同n值和不同R部分的(例如,两种或三种)内酯的混合物。在某些实施方案中,使用本文所述的生物合成方法产生的内酯是具有相同R/S构型但不同n值和不同R部分的内酯的混合物。在某些实施方案中,使用本文所述的生物合成方法产生的内酯是具有不同R/S构型但相同n值和相同R部分的内酯的混合物。在某些实施方案中,使用本文所述的生物合成方法产生的内酯是具有不同R/S构型、不同n值和不同R部分的内酯的混合物。在某些实施方案中,使用本文所述的生物合成方法产生的内酯基本上(例如,在90%至95%之间、在95%至97%之间、在97%至99%之间或在99%至99.9%之间,包括端值在内,按摩尔计算)是内酯的外消旋混合物。
在某些实施方案中,使用本文所述的生物合成方法产生的内酯基本上(例如,在90%至95%之间、在95%至97%之间、在97%至99%之间或在99%至99.9%之间,包括端值在内,按摩尔计算)是一种单一类型的内酯(例如,基本上不含其他类型的内酯,包括该一种单一类型的内酯的相反对映异构体)。在某些实施方案中,使用本文所述的生物合成方法产生的内酯基本上(在90%至95%之间、在95%至97%之间、在97%至99%之间或在99%至99.9%之间,包括端值在内,按摩尔计算)是作为彼此的相反对映异构体的两种类型的内酯(例如,基本上不含其他类型的内酯)。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C15:0,十五烷酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C16:0,棕榈酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C16:1,棕榈油酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C17:0,十七烷酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C18:0,十八烷酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C18:1,油酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C18:2,亚油酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(C20:4,花生四烯酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,在步骤(i)中用作第一反应混合物中的底物的该一种或多种脂肪酸包括
((7Z,10Z,13Z)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((6Z,9Z,12Z)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((4E,7E,10E)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((2E,4E,6E)-十六碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(γ-亚麻酸)并且在步骤(iv)中产生的内酯包括:/>以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(α-亚麻酸)并且在步骤(iv)中产生的内酯包括:/>
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((8E,10E,12Z)-十八碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((9Z,11E,13E)-十八碳-9,11,13-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((9E,11E,13E)-十八碳-9,11,13-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(8Z,11Z,14Z-二十碳三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-10-十七碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(反式-10-十七碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-10-十九碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。
在一些实施方案中,在步骤(i)中的第一反应混合物中用作底物的该一种或多种脂肪酸包括(顺式-11-二十碳烯酸)并且在步骤(iv)中产生的内酯包括:/> 以及它们的组合。在一些实施方案中,使用本文提供的生物合成方法产生的内酯包括表1中提供的内酯中的任何一种或多种(例如,1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、11种、12种、13种、14种、15种、16种、17种、18种、19种、20种、21种、22种、23种或24种)内酯。在一些实施方案中,使用本文提供的生物合成方法产生的内酯包括表2中提供的内酯中的任何一种或多种(例如,25种、26种、27种、28种、29种、30种或31种)内酯。
本公开的其他方面提供了下式的新型内酯:
其中:
R为甲基、乙基或正丙基;
每个___在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内;
前提是内酯不具有下式:
本公开的其他方面提供了下式的新型内酯:
其中:
R为甲基、乙基或正丙基;
在化合价允许的情况下,每个___独立地为单键或Z双键,其中0个、1个、2个或4个___为Z双键;并且
m为4至11之间的整数,包括端值在内;
前提是内酯不具有下式:
在某些实施方案中,新型内酯具有下式:
在某些实施方案中,新型内酯具有下式:
/>
在某些实施方案中,新型内酯具有下式:
在某些实施方案中,每个___为单键。在某些实施方案中,一个___为Z双键,并且其余的___为单键。在某些实施方案中,两个___为Z双键,并且其余的___为单键。在某些实施方案中,四个___为Z双键,并且其余的___为单键。
在某些实施方案中,一个___为E或Z双键,并且其余的___为单键。在某些实施方案中,两个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,三个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,四个___独立地为E或Z双键,并且其余的___为单键。在某些实施方案中,每个双键(如果存在)为Z双键。在某些实施方案中,每个双键(如果存在)为E双键。在某些实施方案中,内酯不包含C=C=C、C=C≡C和C≡C=C中的任一者。
变量k如本文所述。
在某些实施方案中,m为4。在某些实施方案中,m为5。在某些实施方案中,m为6。在某些实施方案中,m为7。在某些实施方案中,m为8。在某些实施方案中,m为9。在某些实施方案中,m为10。在某些实施方案中,m为11。
在某些实施方案中,新型内酯的手性碳原子具有S构型。在某些实施方案中,新型内酯的手性碳原子具有R构型。
本公开的另一方面提供了两种或更多种新型内酯的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是的相反对映异构体、/>的相反对映异构体和的相反对映异构体的混合物。
在某些实施方案中,两种或更多种新型内酯的混合物是的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是的相反对映异构体、/>的相反对映异构体和的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和的相反对映异构体的混合物。在某些实施方案中,两种或更多种新型内酯的混合物是/>的相反对映异构体、/>的相反对映异构体和/>的相反对映异构体的混合物。
合成生物学
本文所用的标准重组DNA和分子克隆技术是本领域众所周知的,并且例如描述于Sambrook,J.、Fritsch,E.F.和Maniatis,T.,“Molecular Cloning:A Laboratory Manual”第二版,冷泉港实验室:冷泉湾,纽约,1989年(下文称为“Maniatis”);以及Silhavy,T.J.、Bennan,M.L.和Enquist,L.W.,“Experiments with Gene Fusions”,冷泉港实验室:冷泉湾,纽约,1984年;以及Ausubel,F.M.等人,1987年,由格林出版社与威利交叉科学出版社(Greene Publishing and Wiley-Interscience)出版的“In Current Protocols inMolecular Biology”中(这些文献中的每一篇文献的全文据此以引用方式并入本文)。
除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。尽管类似于或等同于本文所述的方法或材料的任何方法和材料都可用于本公开的实践或测试,但是优选的材料和方法如下所述。
在考虑以下非限制性实施例的情况下,将更充分地理解本公开。应当理解,这些实施例虽然指示了本发明技术的优选实施方案,但仅通过说明的方式给出。通过以上讨论和这些实施例,本领域技术人员可以确定本发明技术的基本特征,并且在不脱离其实质和范围的情况下,可以对本发明技术进行各种更改和修改,以使其适应各种用途和条件。
细菌产生系统
原核生物中蛋白质的表达最常在细菌宿主细胞中进行,其中含有组成型或诱导型启动子的载体引导融合蛋白或非融合蛋白的表达。融合载体将许多氨基酸添加到其中编码的蛋白中,通常添加到重组蛋白的氨基末端。此类融合载体通常起到三个目的:(1)增加重组蛋白的表达;(2)增加重组蛋白的溶解度;以及(3)通过在亲和纯化中充当配体来有助于重组蛋白的纯化。通常,在融合部分与重组蛋白的接合处引入蛋白水解裂解位点,以在融合蛋白纯化之后使重组蛋白与融合部分分离。此类载体在本公开的范围内。
在一个实施方案中,表达载体包含用于在细菌细胞中表达重组多肽的那些遗传元件。细菌细胞中用于转录和翻译的元件可包括启动子、蛋白复合物的编码区和转录终止子。我们仅使用一种标准大肠杆菌表达系统来进行这项概念验证工作。进一步的修饰和优化正在进行中。
本领域普通技术人员将了解可用于制备表达载体的分子生物学技术。如上所述,用于并入本发明技术的表达载体中的多核苷酸可以通过诸如聚合酶链反应(PCR)的常规技术制备。
已经开发了许多分子生物学技术,以通过互补的粘性末端将DNA可操作地连接到载体。在一个实施方案中,互补均聚物束可添加到核酸分子中,以插入到载体DNA中。然后,载体和核酸分子通过互补均聚物尾部之间的氢键结合而形成重组DNA分子。
在另选的实施方案中,含有一个或多个限制性位点的合成接头用于将本发明技术的多核苷酸可操作地连接至表达载体。在实施方案中,通过限制性核酸内切酶消化产生多核苷酸。在实施方案中,用噬菌体T4 DNA聚合酶或大肠杆菌DNA聚合酶I处理核酸分子,该酶以3'-5'-核酸外切活性去除突出的3'-单链末端,并以聚合活性填充凹陷的3'-末端,从而产生钝末端DNA区段。然后在存在能够催化钝末端DNA分子连接的酶(诸如噬菌体T4 DNA连接酶)的情况下,将钝末端区段与大量摩尔过量的接头分子一起温育。因此,反应的产物是在其末端带有聚合物接头序列的多核苷酸。然后将这些多核苷酸用适当的限制酶切割,并连接至已经用产生与该多核苷酸的末端相容的末端的酶切割的表达载体。
或者,可利用具有连接非依赖性克隆(LIC)位点的载体。然后可以将所需的PCR扩增的多核苷酸克隆到LIC载体中,而无需限制性消化或连接(Aslanidis和de Jong,核酸研究第18卷:第6069-6074页,1990年;Haun等人,Biotechniques,第13卷:第515-518页,1992年,这些文献以引用方式在与本文一致的程度上并入本文)。
在一个实施方案中,为了分离和/或修饰感兴趣的多核苷酸以插入到所选择的质粒中,使用PCR是合适的。可设计用于序列的PCR制备的适当引物,以分离核酸分子的所需编码区,添加限制性核酸内切酶或LIC位点,将编码区置于预期阅读框中。
在一个实施方案中,通过使用PCR,使用适当的寡核苷酸引物制备用于并入本发明技术的表达载体中的多核苷酸。扩增编码区,而将引物本身并入扩增的序列产物中。在实施方案中,扩增引物含有限制性核酸内切酶识别位点,其允许将扩增的序列产物克隆到适当的载体中。
可通过常规转化或转染技术将表达载体引入植物或微生物宿主细胞。用本发明技术的表达载体对适当细胞的转化是通过本领域已知的方法实现的,并且通常取决于载体和细胞的类型。合适的技术包含磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染、化学穿孔或电穿孔。
可通过本领域众所周知的技术鉴定成功转化的细胞,即含有表达载体的那些细胞。例如,可培养用本发明技术的表达载体转染的细胞以产生本文所述的多肽。可通过本领域众所周知的技术检查细胞是否存在表达载体DNA。
宿主细胞可以含有先前描述的表达载体的单个拷贝,或者另选地,表达载体的多个拷贝。
在一些实施方案中,转化的细胞是动物细胞、昆虫细胞、植物细胞、藻类细胞、真菌细胞或酵母细胞。在一些实施方案中,该细胞选自由以下组成的组:油菜植物细胞、油菜籽植物细胞、棕榈植物细胞、向日葵植物细胞、棉花植物细胞、玉米植物细胞、花生植物细胞、亚麻植物细胞、芝麻植物细胞、大豆植物细胞和矮牵牛植物细胞。
微生物宿主细胞表达系统和表达载体含有引导外源蛋白质高水平表达的调节序列,这是本领域技术人员众所周知的。这些表达系统和表达载体中的任一者都可用于构建载体以在微生物宿主细胞中表达本发明技术的重组多肽。然后可将这些载体通过转化引入适当的微生物中,以允许本发明技术的重组多肽的高水平表达。
可用于转化合适的微生物宿主细胞的载体或基因盒是本领域众所周知的。通常,载体或基因盒含有引导相关多核苷酸的转录和翻译的序列、选择标记以及允许自主复制或染色体整合的序列。合适的载体包含具有转录起始控制的多核苷酸的5'区和控制转录终止的DNA片段的3'区。优选的是,两个控制区均源自与转化的宿主细胞同源的基因,尽管应理解,此类控制区不必源自被选作宿主的特定物种的天然基因。
可用于驱动重组多肽在期望的微生物宿主细胞中的表达的起始控制区或启动子是众多的且为本领域技术人员熟悉的。能够驱动这些基因的几乎任何启动子都适用于本发明技术,这些启动子包括但不限于CYCI、HIS3、GALI、GALIO、ADHI、PGK、PH05、GAPDH、ADCI、TRPI、URA3、LEU2、ENO、TPI(可用于在酵母菌中表达);AOXI(可用于在毕赤酵母中表达);以及lac、trp、JPL、IPR、T7、tac和trc(可用于在大肠杆菌中表达)。
终止控制区也可源自微生物宿主天然的各种基因。对于本文所述的微生物宿主,可任选地包含终止位点。
在植物细胞中,本发明技术的表达载体可包含可操作地连接至启动子的编码区,这些启动子能够在期望的发育阶段引导本发明技术的重组多肽在期望的组织中的表达。为了方便起见,要表达的多核苷酸可包含源自相同多核苷酸的启动子序列和翻译前导序列。还应存在编码转录终止信号的3'非编码序列。表达载体还可包含一个或多个内含子,以便促进多核苷酸表达。
对于植物宿主细胞,能够诱导编码区表达的任何启动子和任何终止子的任何组合可用于本发明技术的载体序列中。启动子和终止子的一些合适的示例包括来自胭脂碱合酶(nos)、章鱼碱合酶(ocs)和花椰菜花叶病毒(CaMV)基因的那些示例。可使用的有效植物启动子的一种类型是高水平植物启动子。与本发明技术的表达载体可操作地连接的此类启动子应当能够促进载体的表达。可用于本发明技术的高水平植物启动子包括例如来自大豆的核酮糖-l,5-二磷酸羧化酶的小亚基的启动子(Berry-Lowe等人,J.Molecular andApp.Gen.,第1卷:第483-498页,1982年,该文献的内容全文据此在与本文一致的程度上并入本文)和叶绿素结合蛋白的启动子。已知这两个启动子在植物细胞中为光诱导的(参见例如,“Genetic Engineering of Plants,an Agricultural Perspective”,A.Cashmore,Plenum,纽约,1983年,第29-38页;Coruzzi,G.等人,The Journal of BiologicalChemistry,第258卷:第1399页,1983年;和Dunsmuir,P.等人,Journal of Molecular andApplied Genetics,第2卷:第285页,1983年,这些文献中的每一篇文献据此以引用方式在与本文一致的程度上并入本文)。
本领域的技术人员将认识到,通过本文所述的方法产生的内酯组合物可进一步纯化并与其他内酯、调味剂或香料混合以获得用于多种消费品或食品中的所需组合物。
使用同一性评分分析序列相似性
如本文所使用,“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分(例如核苷酸或氨基酸)的比对窗口中不变的程度。测试序列和参考序列的比对片段的“同一性部分”是两个比对序列所共有的相同组分的数量除以参考序列片段中的组分总数,即整个参考序列或参考序列的较小定义部分。
如本文所使用,术语“序列同一性百分比”或“同一性百分比”是指当两个序列最佳比对时(在比较窗口中,适当的核苷酸插入、缺失或间隔合计少于参考序列的20%),与测试(“受试者”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。用于比对比较窗口的序列的最佳比对是本领域技术人员熟知的,并且可以通过诸如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法等工具,并且优选地通过这些算法的计算机化实施(如GAP、BESTFIT、FASTA和TFASTA,可作为Wisconsin(Accelrys Inc.,Burlington,MA)的一部分获得)来进行。测试序列和参考序列的比对区段的“同一性部分”是两个比对序列所共有的相同组分的数量除以参考序列区段中的组分总数,即整个参考序列或参考序列的较小定义部分。序列同一性百分比表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是与全长多核苷酸序列或其一部分或与更长的多核苷酸序列的比较。为了本公开的目的,“同一性百分比”也可使用用于翻译的核苷酸序列的BLASTX版本2.0和用于多核苷酸序列的BLASTN版本2.0来确定。
优选使用序列分析软件包TM(第10版;威斯康星州麦迪逊市的Genetics ComputerGroup,Inc.)的“Best Fit”或“Gap”程序来确定序列同一性的百分比。“Gap”利用Needleman和Wunsch的算法(Needleman和Wunsch,分子生物学杂志(JOURNAL OF MOLECULAR BIOLOGY)48:443-453,1970)来找到使匹配数最大并使间隙数最小的两个序列的比对。“BestFit”使用Smith和Waterman的局部同源算法(Smith和Waterman,应用数学进展(ADVANCES INAPPLIED MATHEMATICS),2:482-489,1981,Smith等人,核酸研究(NUCLEIC ACIDSRESEARCH)11:2205-2220,1983)来进行两个序列之间的最佳相似性区段的最佳比对并插入间隙以使匹配数最大。同一性百分比最优选使用“BestFit”程序确定。
确定序列同一性的有用方法还公开在基本局部比对搜索工具(BLAST)程序中,所述程序可从马里兰州贝塞斯达市国立卫生研究院国家医学图书馆的国家生物技术信息中心(NCBI)20894公开获得;见BLAST手册,Altschul等人,NCBI,NLM,NIH;Altschul等人,分子生物学杂志(J.MOL.BIOL.)215:403-410(1990);BLAST程序的2.0或更高版本允许在比对中引入间隙(缺失和插入);对于肽序列,BLASTX可用于确定序列同一性;并且,对于多核苷酸序列,BLASTN可用于确定序列同一性。
如本文所用,术语“基本序列同一性百分比”是指如下序列同一性百分比:至少约70%序列同一性、至少约80%序列同一性、至少约85%同一性、至少约90%序列同一性,或者甚至更大的序列同一性,例如约98%或约99%序列同一性。因此,本公开的一个实施方案是与本文所述的多核苷酸序列具有至少约70%序列同一性、至少约80%序列同一性、至少约85%同一性、至少约90%序列同一性、或甚至更大的序列同一性(诸如约98%或约99%序列同一性)的多核苷酸分子。具有本公开的Blu1和细胞色素P450基因的活性的多核苷酸分子能够引导多种内酯(诸如,大环内酯)的产生,并且与本文提供的多核苷酸序列具有相当大百分比的序列同一性,并且包含在本公开的范围内。
同一性是指序列比对后一对序列之间相同的氨基酸部分(可仅使用序列信息或结构信息或一些其他信息来完成,但通常仅基于序列信息即可),并且相似性是基于使用一些相似性矩阵的比对而分配的分数。相似性指数可以是以下BLOSUM62、PAM250或GONNET中的任何一种,或者是本领域技术人员用于蛋白质序列比对的任何矩阵。
同一性是两个子序列之间的对应程度(序列之间没有间隙)。25%或更高的同一性意味着功能相似,而18%至25%意味着结构或功能相似。请记住,两个完全不相关或随机序列(大于100个残基)可具有高于20%的同一性。相似性是两个序列进行比较时的相似程度。这取决于序列的同一性。
从前述描述中显而易见的是,本公开的某些方面不受本文示出的示例的特定细节的限制,并且因此可以预期,本领域技术人员将想到其他修改和应用或其等同物。因此,意图是权利要求书应涵盖不脱离本公开的精神和范围的所有此类修改和应用。
此外,除非另有定义,否则本文中使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。尽管类似于或等同于本文描述的方法或材料的任何方法和材料都可以用于本公开的实践或测试,但是优选的方法和材料如上所述。
实施例
实施例1:
在此工艺中,使用具有脂肪酸亚末端羟化酶活性的细胞色素P450酶,例如P450BM3(Miura和Fulco,1975年)来制备ω-1、ω-2或ω-3羟基脂肪酸或它们的混合物(工艺1,Miura Y、Fulco AJ,1975年,“Omega-1,Omega-2and Omega-3hydroxylation of long-chain fatty acids,amides and alcohols by a soluble enzyme system fromBacillus megaterium”,Biochim.Biophys.Acta.,第388卷:第305-317页)。
羟基脂肪酸产物可在有机溶剂中通过脂肪酶催化的闭环反应进一步加工,以形成支链麝香大环内酯(工艺2)。总体合成方案如图1所示。
工艺1涉及通过使饱和或不饱和脂肪酸经受存在于发酵培养基中的生物催化剂(羟化酶)的作用来进行脂肪酸羟基化。由工艺1获得的羟基脂肪酸可从发酵液中分离(例如通过使用基于烃的有机溶剂诸如己烷和水不溶性极性溶剂诸如乙酸乙酯的混合物进行液-液萃取)。
工艺2涉及通过使羟基脂肪酸在脂肪酶的催化下发生分子内大环内酯化反应而获得大环内酯的反应。脂肪酶可固定在固体支持物上并用于大环内酯化过程。固定的脂肪酶易于回收,并且可长期反复循环使用。
工艺2可在固定的脂肪酶催化剂诸如Novozyme 435的存在下在溶剂诸如甲苯或二氯乙烷中进行。将羟基脂肪酸的浓度调节为0.05摩尔至0.025摩尔。可将固定的脂肪酶的浓度适当地选择为不降低反应速度的量。在使用Novozyme 435的情况下,优选将浓度调节为50克/升至100克/升。通常将反应体系在40℃至60℃下振荡并搅拌约15小时至24小时。
可以使用常规纯化技术(诸如过滤、色谱法和干燥)的适当组合从反应混合物中分离目标大环内酯。
实施例2:
总共八种脂肪酸用于产生麝香内酯:
C15:0(十五烷酸)
C16:0(棕榈酸)
C16:1(棕榈油酸)
C17:0(十七烷酸)
C18:0(十八烷酸)
C18:1(油酸)
C18:2(亚油酸)
C20:4(花生四烯酸)
羟基化和闭环后,由这八种脂肪酸分别产生八种不同的麝香内酯混合物,如图2所示。八种脂肪酸及对应的麝香内酯产物如表1所示。在图3A至图3F中分别示出了针对油酸、亚油酸、花生四烯酸、棕榈酸、十七烷酸和十八烷酸的示出脂肪酸羟基化和闭环的反应方案。
表1
/>
脂肪酸羟基化
嗜热毁丝霉的BM3同源物(CYP505A30)的氨基酸序列从UniProt(uniprot.org/uniprot/G2QDZ3.fasta)获得,并且对应的基因经密码子优化以在大肠杆菌中表达并由GenScript(新泽西州皮斯卡特维)合成。
将所得基因产物通过NdeI和XhoI位点克隆到pETDuet-1载体(AMP+,Novagen)中。将构建体转化到BL21(DE3)细胞中进行表达。
在典型的实验中,使用过夜培养物来接种含有100mg/L羧苄青霉素和0.4mM 5-氨基乙酰丙酸的液体LB培养基(2%)。首先将培养物在37℃下培养至OD600为0.6,然后冷却至16℃。然后加入1mM IPTG以诱导蛋白质表达。在16℃下温育16小时后,通过离心收获细胞。
将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mMNADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后加入1g/L的脂肪酸底物。将混合物在37℃下在振荡器中振荡。
从棕榈酸中产生支链麝香大环内酯
示出棕榈酸羟基化和获得对应麝香内酯产物的反应的总体合成方案如图4所示。将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mM NADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后加入1g/L棕榈酸(C16:0)。将混合物在37℃下在振荡器中振荡。
通过乙酸乙酯萃取羟基化棕榈酸,并在SpeedVacTM真空浓缩器中干燥乙酸乙酯相。然后加入丙烯酸树脂形式并以甲苯作为溶剂的Novozym 435(Sigma),在60℃振荡下进行闭环反应。通过GC/MS分析来自羟基棕榈酸的产物。
在偶联GCMS-QP2010S检测器的Shimadzu GC-2010系统上进行GC/MS分析。分析柱为SHRXI-5MS(厚度为0.25μm;长度为30m;直径为0.25mm),并且在分流模式下进样温度为265℃。温度梯度为0分钟至3分钟150℃;3分钟至6.7分钟150℃至260℃,梯度为30℃;6.7分钟至15.7分钟260℃。
从油酸中产生支链麝香大环内酯
首先,如实施例1中的工艺1所述,将油酸羟基化以形成羟基脂肪酸。此后,如图5(工艺2)所示,将羟基脂肪酸环化。
将3升含有羟基油酸类似物的发酵液用11升50%乙酸乙酯-己烷以1升批量进行萃取。在减压下蒸馏去除溶剂,得到11.50g粗提取物,为淡红色油状物。将粗萃取物通过硅胶柱色谱法纯化,用20%至50%乙酸乙酯-己烷洗脱,得到1.40g羟基油酸异构体。
将1.40g(4.66mmol)羟基油酸类似物溶解在200mL甲苯中。将20g Novozyme 435加入该溶液中。将反应混合物加热至55℃并搅拌15小时,然后冷却至室温。通过过滤分离固定的脂肪酶并用二氯甲烷冲洗。在减压下蒸馏去除挥发物,得到1.50g粗产物,为黄色油状物。将粗产物通过硅胶柱色谱法纯化,用5%乙酸乙酯-己烷洗脱,得到1.10g(3.92mmol,分离收率62.7%,三种异构体总纯度98%)对应的大环内酯化产物。
经感官评估证实,三种组分的混合物具有奢华新颖的麝香香味。
使用30m×0.25mm 0.25μm Rtx-5MS(由Restek制造),在毛细管气相色谱-质谱仪GCMS-QP2020 NX(由Shimadzu制造)上分析1mg/mL纯化产物的己烷溶液。使用高纯度氦气作为流动相,以1mL/min的流速进行分析。使用的温度程序为150℃持续3分钟,以50℃/分钟的温度梯度至260℃,并在260℃下等温持续9分钟。结果如图6所示。
从亚油酸中产生支链麝香大环内酯
示出亚油酸羟基化(工艺1)和获得对应麝香内酯产物的反应(工艺2)的总体合成方案如图7所示。将2升含有羟基亚油酸类似物的发酵液用7升50%乙酸乙酯-己烷以0.7升批量进行萃取。在减压下蒸馏去除溶剂,得到18.5g粗提取物,为淡红色油状物。将粗萃取物通过硅胶柱色谱法纯化,用20%至50%乙酸乙酯-己烷洗脱,得到1.2g羟基亚油酸异构体。
将1.2g(4.05mmol)羟基亚油酸类似物溶解在160mL甲苯中。将16g Novozyme 435(100g/L)加入该溶液中。将反应混合物加热至50℃并搅拌17小时,然后冷却至室温。通过过滤分离固定的脂肪酶并用二氯甲烷冲洗。在减压下蒸馏去除挥发物,得到1.10g粗产物,为黄色油状物。
将粗产物通过硅胶柱色谱法纯化,用5%乙酸乙酯-己烷洗脱,得到0.70g(2.52mmol,分离收率62.2%,三种异构体总纯度95%)对应的大环内酯化产物。
使用30m×0.25mm 0.25μm Rtx-5MS(由Restek制造),在毛细管气相色谱-质谱仪GCMS-QP2020 NX(由Shimadzu制造)上分析1mg/mL纯化产物的己烷溶液。使用高纯度氦气作为流动相,以1mL/min的流速进行分析。使用的温度程序为150℃持续3分钟,以50℃/分钟的温度梯度至260℃,并在260℃下等温持续9分钟。结果如图8所示。
实施例3
在此工艺中,使用具有脂肪酸亚末端羟化酶活性以制备ω-1、ω-2或ω-3羟基脂肪酸或它们的混合物的细胞色素P450酶,例如P450 BM3(Miura和Fulco,1975年;Wen和Fulco,1987年)或其同系物(Baker等人,2017年)。在提取和纯化后,羟基脂肪酸在有机溶剂中经受脂肪酶催化的闭环反应,以形成支链麝香大环内酯(图9)。
嗜热毁丝霉的BM3同源物(CYP505A30)的氨基酸序列从UniProt(uniprot.org/uniprot/G2QDZ3.fasta)获得,并且对应的基因经密码子优化以在大肠杆菌中表达并由GenScript(新泽西州皮斯卡特维)合成。
将所得基因产物通过NdeI和XhoI位点克隆到pETDuet-1载体(AMP+,Novagen)中。将构建体转化到BL21(DE3)细胞中进行表达。
在典型的实验中,使用过夜培养物来接种含有100mg/L羧苄青霉素和0.4mM 5-氨基乙酰丙酸的液体LB培养基(2%)。首先将培养物在37℃下培养至OD600为0.6,然后冷却至16℃。然后加入1mM IPTG以诱导蛋白质表达。在16℃下温育16小时,通过离心收获细胞。
将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mMNADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后加入1g/Lγ-亚麻酸(GLA,C18:3)。将混合物在37℃下在振荡器中振荡。衍生自羟基GLA的麝香内酯(分子量:276)的GC/MS分析的结果如图10所示。
可以使用的其他脂肪酸底物和内酯产物在下面提供并示于表2中。
从α-亚麻酸(ALA)中产生支链麝香大环内酯
将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mMNADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后加入1g/Lα-亚麻酸(ALA,C18:3)。将混合物在37℃下在振荡器中振荡5小时。
通过乙酸乙酯萃取羟基化α-亚麻酸,并在SpeedVacTm真空浓缩器中干燥乙酸乙酯相。然后加入丙烯酸树脂形式并以甲苯作为溶剂的Novozym 435(Sigma),在60℃振荡下进行闭环反应。通过GC/MS分析来自羟基α-亚麻酸的产物。参见图11和图12。
从C20:3(8Z,11Z,14Z-二十碳三烯酸、二高-γ-亚麻酸、DGLA)中产生支链麝香大环内酯
将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mMNADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后加入1g/L的二高-γ-亚麻酸(DGLA,C20:3)。将混合物在37℃下在振荡器中振荡5小时。
通过乙酸乙酯萃取羟基化DGLA,并在SpeedVacTM真空浓缩器中干燥乙酸乙酯相。然后加入丙烯酸树脂形式并以甲苯作为溶剂的Novozym 435(Sigma),在60℃振荡下进行闭环反应。通过GC/MS分析来自羟基DGLA酸的产物。参见图13和图14。
表2:其他脂肪酸底物和内酯
/>
实施例4
总共四种单不饱和脂肪酸用于产生麝香内酯。生物合成过程如图15至图18所示。单不饱和脂肪酸和所得内酯的结构如表3所示。
所使用的内酯产生工艺涉及使用P450羟化酶和脂肪酶对单不饱和脂肪酸进行生物合成转化。嗜热毁丝霉的BM3同源物(CYP505A30)的氨基酸序列从UniProt(uniprot.org/uniprot/G2QDZ3.fasta)获得。对应的基因经密码子优化以在大肠杆菌中表达,并由GenScript(新泽西州皮斯卡特维)合成。然后将所得基因产物通过NdeI和XhoI位点克隆到pETDuet-1载体(AMP+,Novagen)中。然后将所得构建体转化到BL21(DE3)细胞中进行表达。
为了产生羟基化脂肪酸,使用过夜培养物来接种含有100mg/L羧苄青霉素和0.4mM5-氨基乙酰丙酸的液体LB培养基(2%)。首先将培养物在37℃下培养至OD600为0.6,然后冷却至16℃。然后加入1mM IPTG以诱导蛋白质表达。在16℃下温育16小时后,通过离心收获细胞。将收获的细胞沉淀以100g/L鲜重的浓度重新悬浮于含有0.1%Tween 40和10mM NADPH的100mM磷酸钾缓冲液(pH 7.0)中。然后,加入1g/L或3g/L的各种脂肪酸。将混合物在37℃下在振荡器中振荡。
用乙酸乙酯萃取羟基化脂肪酸。将乙酸乙酯相在SpeedVacTM真空浓缩器中干燥。为了进行闭环反应,加入丙烯酸树脂形式并以甲苯作为溶剂的Novozym 435(Sigma),并在60℃振荡下温育。
然后通过GC/MS分析内酯产物。参见图19至图22。在偶联GCMS-QP2020NX检测器的Shimadzu GC-2030系统上进行GC/MS分析。分析柱为SHRXI-5MS(厚度为0.25μm;长度为30m;直径为0.2mm),并且在分流模式下进样温度为265℃。温度梯度为0分钟至3分钟150℃;3分钟至6.7分钟150℃至260℃,梯度为30℃;6.7分钟至15.7分钟260℃。
表3
参考文献
Baker GJ、Girvan HM、Matthews S、McLean KJ、Golovanova M、Waltham TN、RigbySEJ、Nelson DR、Blankley RT、Munro AW,2017年,“Expression,Purification,andBiochemical Characterization of the Flavocytochrome P450 CYP505A30 fromMyceliophthora thermophile”,ACS Omega,第2卷:第4705-4724页。
Miura Y、Fulco AJ,1975年,“Omega-1,Omega-2and Omega-3hydroxylation oflong-chain fatty acids,amides and alcohols by a soluble enzyme system fromBacillus megaterium”,Biochim.Biophys.Acta.,第388卷:第305-317页。
Wen LP、Fulco AJ,1987年,“Cloning of the gene encoding a catalyticallyself-sufficient cytochrome P-450fatty acid monooxygenase induced bybarbiturates in Bacillus megaterium and its functional expression andregulation in heterologous(Escherichia coli)and homologous(Bacillusmegaterium)hosts”,J.Biol.Chem.,第262卷:第6676-6682页。
氨基酸和核苷酸序列
SEQ ID NO:1—来自巨大芽孢杆菌的细胞色素P450 CYP102A1的氨基酸序列MTIKEMPQPKTFGELKNLPLLNTDKPVQALMKIADELGEIFKFEAPGRVTRYLSSQRLIKEACDESRFDKNLSQALKFVRDFAGDGLFTSWTHEKNWKKAHNILLPSFSQQAMKGYHAMMVDIAVQLVQKWERLNADEHIEVPEDMTRLTLDTIGLCGFNYRFNSFYRDQPHPFITSMVRALDEAMNKLQRANPDDPAYDENKRQFQEDIKVMNDLVDKIIADRKASGEQSDDLLTHMLNGKDPETGEPLDDENIRYQIITFLIAGHETTSGLLSFALYFLVKNPHVLQKAAEEAARVLVDPVPSYKQVKQLKYVGMVLNEALRLWPTAPAFSLYAKEDTVLGGEYPLEKGDELMVLIPQLHRDKTIWGDDVEEFRPERFENPSAIPQHAFKPFGNGQRACIGQQFALHEATLVLGMMLKHFDFEDHTNYELDIKETLTLKPEGFVVKAKSKKIPLGGIPSPSTEQSAKKVRKKAENAHNTPLLVLYGSNMGTAEGTARDLADIAMSKGFAPQVATLDSHAGNLPREGAVLIVTASYNGHPPDNAKQFVDWLDQASADEVKGVRYSVFGCGDKNWATTYQKVPAFIDETLAAKGAENIADRGEADASDDFEGTYEEWREHMWSDVAAYFNLDIENSEDNKSTLSLQFVDSAADMPLAKMHGAFSTNVVASKELQQPGSARSTRHLEIELPKEASYQEGDHLGVIPRNYEGIVNRVTARFGLDASQQIRLEAEEEKLAHLPLAKTVSVEELLQYVELQDPVTRTQLRAMAAKTVCPPHKVELEALLEKQAYKEQVLAKRLTMLELLEKYPACEMKFSEFIALLPSIRPRYYSISSSPRVDEKQASITVSVVSGEAWSGYGEYKGIASNYLAELQEGDTITCFISTPQSEFTLPKDPETPLIMVGPGTGVAPFRGFVQARKQLKEQGQSLGEAHLYFGCRSPHEDYLYQEELENAQSEGIITLHTAFSRMPNQPKTYVQHVMEQDGKKLIELLDQGAHFYICGDGSQMAPAVEATLMKSYADVHQVSEADARLWLQQLEEKGRYAKDVWAG
SEQ ID NO:2—来自巨大芽孢杆菌的细胞色素P450 CYP102A1的核苷酸序列ATGACAATTAAAGAAATGCCTCAGCCAAAAACGTTTGGAGAGCTTAAAAATTTACCGTTATTAAACACAGATAAACCGGTTCAAGCTTTGATGAAAATTGCGGATGAATTAGGAGAAATCTTTAAATTCGAGGCGCCTGGTCGTGTAACGCGCTACTTATCAAGTCAGCGTCTAATTAAAGAAGCATGCGATGAATCACGCTTTGATAAAAACTTAAGTCAAGCGCTTAAATTTGTACGTGATTTTGCAGGAGACGGGTTATTTACAAGCTGGACGCATGAAAAAAATTGGAAAAAAGCGCATAATATCTTACTTCCAAGCTTCAGTCAGCAGGCAATGAAAGGCTATCATGCGATGATGGTCGATATCGCCGTGCAGCTTGTTCAAAAGTGGGAGCGTCTAAATGCAGATGAGCATATTGAAGTACCGGAAGACATGACACGTTTAACGCTTGATACAATTGGTCTTTGCGGCTTTAACTATCGCTTTAACAGCTTTTACCGAGATCAGCCTCATCCATTTATTACAAGTATGGTCCGTGCACTGGATGAAGCAATGAACAAGCTGCAGCGAGCAAATCCAGACGACCCAGCTTATGATGAAAACAAGCGCCAGTTTCAAGAAGATATCAAGGTGATGAACGACCTAGTAGATAAAATTATTGCAGATCGCAAAGCAAGCGGTGAACAAAGCGATGATTTATTAACGCATATGCTAAACGGAAAAGATCCAGAAACGGGTGAGCCGCTTGATGACGAGAACATTCGCTATCAAATTATTACATTCTTAATTGCGGGACACGAAACAACAAGTGGTCTTTTATCATTTGCGCTGTATTTCTTAGTGAAAAATCCACATGTATTACAAAAAGCAGCAGAAGAAGCAGCACGAGTTCTAGTAGATCCTGTTCCAAGCTACAAACAAGTCAAACAGCTTAAATATGTCGGCATGGTCTTAAACGAAGCGCTGCGCTTATGGCCAACTGCTCCTGCGTTTTCCCTATATGCAAAAGAAGATACGGTGCTTGGAGGAGAATATCCTTTAGAAAAAGGCGACGAACTAATGGTTCTGATTCCTCAGCTTCACCGTGATAAAACAATTTGGGGAGACGATGTGGAAGAGTTCCGTCCAGAGCGTTTTGAAAATCCAAGTGCGATTCCGCAGCATGCGTTTAAACCGTTTGGAAACGGTCAGCGTGCGTGTATCGGTCAGCAGTTCGCTCTTCATGAAGCAACGCTGGTACTTGGTATGATGCTAAAACACTTTGACTTTGAAGATCATACAAACTACGAGCTGGATATTAAAGAAACTTTAACGTTAAAACCTGAAGGCTTTGTGGTAAAAGCAAAATCGAAAAAAATTCCGCTTGGCGGTATTCCTTCACCTAGCACTGAACAGTCTGCTAAAAAAGTACGCAAAAAGGCAGAAAACGCTCATAATACGCCGCTGCTTGTGCTATACGGTTCAAATATGGGAACAGCTGAAGGAACGGCGCGTGATTTAGCAGATATTGCAATGAGCAAAGGATTTGCACCGCAGGTCGCAACGCTTGATTCACACGCCGGAAATCTTCCGCGCGAAGGAGCTGTATTAATTGTAACGGCGTCTTATAACGGTCATCCGCCTGATAACGCAAAGCAATTTGTCGACTGGTTAGACCAAGCGTCTGCTGATGAAGTAAAAGGCGTTCGCTACTCCGTATTTGGATGCGGCGATAAAAACTGGGCTACTACGTATCAAAAAGTGCCTGCTTTTATCGATGAAACGCTTGCCGCTAAAGGGGCAGAAAACATCGCTGACCGCGGTGAAGCAGATGCAAGCGACGACTTTGAAGGCACATATGAAGAATGGCGTGAACATATGTGGAGTGACGTAGCAGCCTACTTTAACCTCGACATTGAAAACAGTGAAGATAATAAATCTACTCTTTCACTTCAATTTGTCGACAGCGCCGCGGATATGCCGCTTGCGAAAATGCACGGTGCGTTTTCAACGAACGTCGTAGCAAGCAAAGAACTTCAACAGCCAGGCAGTGCACGAAGCACGCGACATCTTGAAATTGAACTTCCAAAAGAAGCTTCTTATCAAGAAGGAGATCATTTAGGTGTTATTCCTCGCAACTATGAAGGAATAGTAAACCGTGTAACAGCAAGGTTCGGCCTAGATGCATCACAGCAAATCCGTCTGGAAGCAGAAGAAGAAAAATTAGCTCATTTGCCACTCGCTAAAACAGTATCCGTAGAAGAGCTTCTGCAATACGTGGAGCTTCAAGATCCTGTTACGCGCACGCAGCTTCGCGCAATGGCTGCTAAAACGGTCTGCCCGCCGCATAAAGTAGAGCTTGAAGCCTTGCTTGAAAAGCAAGCCTACAAAGAACAAGTGCTGGCAAAACGTTTAACAATGCTTGAACTGCTTGAAAAATACCCGGCGTGTGAAATGAAATTCAGCGAATTTATCGCCCTTCTGCCAAGCATACGCCCGCGCTATTACTCGATTTCTTCATCACCTCGTGTCGATGAAAAACAAGCAAGCATCACGGTCAGCGTTGTCTCAGGAGAAGCGTGGAGCGGATATGGAGAATATAAAGGAATTGCGTCGAACTATCTTGCCGAGCTGCAAGAAGGAGATACGATTACGTGCTTTATTTCCACACCGCAGTCAGAATTTACGCTGCCAAAAGACCCTGAAACGCCGCTTATCATGGTCGGACCGGGAACAGGCGTCGCGCCGTTTAGAGGCTTTGTGCAGGCGCGCAAACAGCTAAAAGAACAAGGACAGTCACTTGGAGAAGCACATTTATACTTCGGCTGCCGTTCACCTCATGAAGACTATCTGTATCAAGAAGAGCTTGAAAACGCCCAAAGCGAAGGCATCATTACGCTTCATACCGCTTTTTCTCGCATGCCAAATCAGCCGAAAACATACGTTCAGCACGTAATGGAACAAGACGGCAAGAAATTGATTGAACTTCTTGATCAAGGAGCGCACTTCTATATTTGCGGAGACGGAAGCCAAATGGCACCTGCCGTTGAAGCAACGCTTATGAAAAGCTATGCTGACGTTCACCAAGTGAGTGAAGCAGACGCTCGCTTATGGCTGCAGCAGCTAGAAGAAAAAGGCCGATACGCAAAAGACGTGTGGGCTGGGTAA
SEQ ID NO:3—来自嗜热毁丝霉的细胞色素P450 CYP505A30的氨基酸序列
MADKTTETVPIPGPPGLPLVGNALAFDSELPLRTFQEFAEEYGEIYRLTLPTGTTLVVSSQALVHELCDDKRFKKPVAAALAEVRNGVNDGLFTAREEEPNWGIAHRILMPAFGPASIQGMFTEMHEIASQLALKWARHGPDTPIFVTDDFTRLTLDTLALCTMNFRFNSYYHDELHPFINAMGNFLTESGARAMRPAITSIFHQAANRKYWEDIEVLRKTAQGVLDTRRKHPTNRKDLLSAMLDGVDAKTGQKLSDSSIIDNLITFLIAGHETTSGLLSFAFYLLIKHQDAYRKAQEEVDRVIGKGPIKVEHIKKLPYIAAVLRETLRLCPTIPIINRAAKQDEVIGGKYAVAKDQRLALLLAQSHLDPAVYGETAKQFIPERMLDENFERLNREYPDCWKPFGTGMRACIGRPFAWQEAVLVMAMLLQNFDFVLHDPYYELHYKQTLTTKPKDFYMRAILRDGLTATELEHRLAGNAASVARSGGGGGGPSKPTAQKTSPAEAKPMSIFYGSNTGTCESLAQRLATDAASHGYAAAAVEPLDTATEKLPTDRPVVIITASFEGQPPDNAAKFCGWLKNLEGDELKNVSYAVFGCGHHDWSQTFHRIPKLVHQTMKAHGASPICDEGLTDVAEGNMFTDFEQWEDDVFWPAVRARYGAAGAVAETEDAPGSDGLNIHFSSPRSSTLRQDVREATVVGEALLTAPDAPPKKHIEVQLPDGATYKVGDYLAVLPVNSKESIGRVMRKFQLSWDSHVTIASDRWTALPTGTPVPAYDVLGSYVELSQPATKRGILRLADAAEDEATKAELQKLAGDLYTSEISLKRASVLDLLDRFPSISLPFGTFLSLLPPIRPRQYSISSSPLNDPSRATLTYSLLDSPSLANPSRRFVGVATSYLSSLVRGDKLLVSVRPTHTAFRLPDEDKMGETAIICVGAGSGLAPFRGFIQERAALLAKGTQLAAALLFYGCRSPEKDDLYRDEFDKWQESGAVDVRRAFSRVDSDDTEARGCRHVQDRLWHDREEVKALWDRGARVYVCGSRQVGEGVKTAMGRIVLGEEDAEDAISKWYETVRNDRYATDVFD
SEQ ID NO:4—来自嗜热毁丝霉的细胞色素P450 CYP505A30的密码子优化的核苷酸序列
ATGGCGGATAAGACCACCGAAACCGTGCCGATTCCGGGTCCGCCGGGCCTGCCGCTGGTTGGTAATGCGCTGGCGTTTGATAGCGAACTGCCGCTGCGTACCTTCCAGGAATTTGCGGAGGAATACGGCGAGATCTATCGTCTGACCCTGCCGACCGGTACCACCCTGGTGGTTAGCAGCCAAGCGCTGGTTCACGAACTGTGCGACGATAAGCGTTTCAAGAAGCCGGTTGCTGCGGCGCTGGCGGAAGTGCGTAACGGCGTTAACGACGGTCTGTTTACCGCGCGTGAAGAGGAGCCGAACTGGGGCATCGCGCACCGTATTCTGATGCCGGCGTTTGGTCCGGCGAGCATTCAGGGCATGTTTACCGAAATGCACGAGATCGCGAGCCAACTGGCGCTGAAATGGGCGCGTCACGGTCCGGACACCCCGATTTTCGTTACCGACGATTTTACCCGTCTGACCCTGGATACCCTGGCGCTGTGCACCATGAACTTCCGTTTTAACAGCTACTATCACGACGAACTGCACCCGTTCATCAACGCGATGGGCAACTTTCTGACCGAGAGCGGTGCGCGTGCGATGCGTCCGGCGATCACCAGCATTTTCCACCAGGCGGCGAACCGTAAGTACTGGGAAGATATTGAGGTTCTGCGTAAAACCGCGCAAGGTGTGCTGGACACCCGTCGTAAGCACCCGACCAACCGTAAAGATCTGCTGAGCGCGATGCTGGACGGCGTGGATGCGAAAACCGGTCAGAAACTGAGCGACAGCAGCATCATTGATAACCTGATCACCTTTCTGATTGCGGGCCACGAAACCACCAGCGGTCTGCTGAGCTTCGCGTTTTACCTGCTGATTAAGCACCAGGACGCGTATCGTAAAGCGCAAGAAGAGGTGGATCGTGTTATCGGCAAGGGCCCGATTAAAGTTGAACACATCAAGAAACTGCCGTACATCGCGGCGGTGCTGCGTGAAACCCTGCGTCTGTGCCCGACCATTCCGATCATTAACCGTGCGGCGAAGCAGGACGAAGTTATCGGTGGCAAGTACGCGGTGGCGAAAGATCAGCGTCTGGCGCTGCTGCTGGCGCAAAGCCACCTGGACCCGGCGGTTTATGGCGAAACCGCGAAGCAATTCATTCCGGAGCGTATGCTGGACGAAAACTTTGAGCGTCTGAACCGTGAGTATCCGGATTGCTGGAAACCGTTCGGTACCGGCATGCGTGCGTGCATCGGTCGTCCGTTTGCGTGGCAGGAAGCGGTGCTGGTTATGGCGATGCTGCTGCAAAACTTCGACTTTGTTCTGCACGATCCGTACTATGAGCTGCACTACAAGCAGACCCTGACCACCAAGCCGAAAGACTTCTATATGCGTGCGATCCTGCGTGATGGCCTGACCGCGACCGAACTGGAGCACCGTCTGGCGGGTAACGCGGCGAGCGTGGCGCGTAGCGGTGGCGGTGGCGGTGGCCCGAGCAAACCGACCGCGCAGAAAACCAGCCCGGCGGAAGCGAAACCGATGAGCATCTTCTACGGCAGCAACACCGGTACCTGCGAGAGCCTGGCGCAACGTCTGGCGACCGATGCGGCGAGCCACGGTTATGCTGCGGCGGCGGTGGAACCGCTGGACACCGCGACCGAGAAGCTGCCGACCGATCGTCCGGTGGTTATCATTACCGCGAGCTTCGAGGGTCAGCCGCCGGACAACGCGGCGAAGTTTTGCGGCTGGCTGAAAAACCTGGAAGGTGATGAGCTGAAAAACGTGAGCTACGCGGTTTTCGGTTGCGGCCACCACGACTGGAGCCAGACCTTTCACCGTATTCCGAAGCTGGTTCACCAAACCATGAAAGCGCACGGTGCGAGCCCGATCTGCGACGAAGGCCTGACCGATGTGGCGGAGGGTAACATGTTCACCGATTTTGAACAATGGGAGGACGATGTGTTCTGGCCGGCGGTTCGTGCGCGTTATGGCGCGGCGGGTGCGGTTGCGGAAACCGAGGACGCGCCGGGTAGCGATGGTCTGAACATCCACTTTAGCAGCCCGCGTAGCAGCACCCTGCGTCAGGACGTGCGTGAAGCGACCGTGGTTGGTGAAGCGCTGCTGACCGCGCCGGATGCGCCGCCGAAGAAACACATTGAAGTTCAACTGCCGGACGGCGCGACCTACAAAGTGGGTGATTATCTGGCGGTGCTGCCGGTTAACAGCAAGGAGAGCATTGGTCGTGTTATGCGTAAATTCCAGCTGAGCTGGGACAGCCACGTGACCATCGCGAGCGATCGTTGGACCGCGCTGCCGACCGGTACCCCGGTGCCGGCGTACGACGTTCTGGGTAGCTATGTGGAGCTGAGCCAACCGGCGACCAAACGTGGTATCCTGCGTCTGGCGGATGCGGCGGAAGATGAGGCGACCAAGGCGGAACTGCAAAAACTGGCGGGTGATCTGTACACCAGCGAGATTAGCCTGAAACGTGCGAGCGTTCTGGACCTGCTGGATCGTTTCCCGAGCATCAGCCTGCCGTTCGGTACCTTTCTGAGCCTGCTGCCGCCGATTCGTCCGCGTCAATACAGCATCAGCAGCAGCCCGCTGAACGACCCGAGCCGTGCGACCCTGACCTATAGCCTGCTGGATAGCCCGAGCCTGGCGAACCCGAGCCGTCGTTTCGTGGGCGTTGCGACCAGCTACCTGAGCAGCCTGGTTCGTGGTGACAAGCTGCTGGTGAGCGTTCGTCCGACCCACACCGCGTTTCGTCTGCCGGACGAAGATAAAATGGGTGAAACCGCGATCATTTGCGTGGGTGCGGGTAGCGGTCTGGCGCCGTTCCGTGGTTTTATCCAGGAACGTGCGGCGCTGCTGGCGAAAGGTACCCAACTGGCGGCGGCGCTGCTGTTCTACGGTTGCCGTAGCCCGGAGAAGGACGATCTGTATCGTGACGAATTCGATAAATGGCAAGAGAGCGGTGCGGTGGATGTTCGTCGTGCGTTTAGCCGTGTTGATAGCGACGATACCGAGGCGCGTGGTTGCCGTCACGTTCAGGACCGTCTGTGGCACGATCGTGAAGAGGTGAAGGCGCTGTGGGACCGTGGCGCGCGTGTGTACGTTTGCGGTAGCCGTCAAGTGGGCGAAGGTGTTAAAACCGCGATGGGCCGTATCGTGCTGGGTGAAGAGGACGCGGAGGATGCGATCAGCAAGTGGTATGAAACCGTGCGTAATGACCGTTATGCGACCGATGTGTTCGACTAA
SEQ ID NO:5—来自南极假丝酵母的脂肪酶B的氨基酸序列
MKLLSLTGVAGVLATCVAATPLVKRLPSGSDPAFSQPKSVLDAGLTCQGASPSSVSKPILLVPGTGTTGPQSFDSNWIPLSTQLGYTPCWISPPPFMLNDTQVNTEYMVNAITALYAGSGNNKLPVLTWSQGGLVAQWGLTFFPSIRSKVDRLMAFAPDYKGTVLAGPLDALAVSAPSVWQQTTGSALTTALRNAGGLTQIVPTTNLYSATDEIVQPQVSNSPLDSSYLFNGKNVQAQAVCGPLFVIDHAGSLTSQFSYVVGRSALRSTTGQARSADYGITDCNPLPANDLTPEQKVAAAALLAPAAAAIVAGPKQNCEPDLMPYARPFAVGKRTCSGIVTP
序列表
<110> 科纳根公司
<120> 从脂肪
酸中生物合成产生大环麝香内酯
<130> C1497.70047WO00
<140> 尚未分配
<141> 一起同时
<150> US 63/182,242
<151> 2021-04-30
<150> US 63/158,843
<151> 2021-03-09
<160> 5
<170> PatentIn版本3.5
<210> 1
<211> 1049
<212> PRT
<213> 巨大芽孢杆菌
<400> 1
Met Thr Ile Lys Glu Met Pro Gln Pro Lys Thr Phe Gly Glu Leu Lys
1 5 10 15
Asn Leu Pro Leu Leu Asn Thr Asp Lys Pro Val Gln Ala Leu Met Lys
20 25 30
Ile Ala Asp Glu Leu Gly Glu Ile Phe Lys Phe Glu Ala Pro Gly Arg
35 40 45
Val Thr Arg Tyr Leu Ser Ser Gln Arg Leu Ile Lys Glu Ala Cys Asp
50 55 60
Glu Ser Arg Phe Asp Lys Asn Leu Ser Gln Ala Leu Lys Phe Val Arg
65 70 75 80
Asp Phe Ala Gly Asp Gly Leu Phe Thr Ser Trp Thr His Glu Lys Asn
85 90 95
Trp Lys Lys Ala His Asn Ile Leu Leu Pro Ser Phe Ser Gln Gln Ala
100 105 110
Met Lys Gly Tyr His Ala Met Met Val Asp Ile Ala Val Gln Leu Val
115 120 125
Gln Lys Trp Glu Arg Leu Asn Ala Asp Glu His Ile Glu Val Pro Glu
130 135 140
Asp Met Thr Arg Leu Thr Leu Asp Thr Ile Gly Leu Cys Gly Phe Asn
145 150 155 160
Tyr Arg Phe Asn Ser Phe Tyr Arg Asp Gln Pro His Pro Phe Ile Thr
165 170 175
Ser Met Val Arg Ala Leu Asp Glu Ala Met Asn Lys Leu Gln Arg Ala
180 185 190
Asn Pro Asp Asp Pro Ala Tyr Asp Glu Asn Lys Arg Gln Phe Gln Glu
195 200 205
Asp Ile Lys Val Met Asn Asp Leu Val Asp Lys Ile Ile Ala Asp Arg
210 215 220
Lys Ala Ser Gly Glu Gln Ser Asp Asp Leu Leu Thr His Met Leu Asn
225 230 235 240
Gly Lys Asp Pro Glu Thr Gly Glu Pro Leu Asp Asp Glu Asn Ile Arg
245 250 255
Tyr Gln Ile Ile Thr Phe Leu Ile Ala Gly His Glu Thr Thr Ser Gly
260 265 270
Leu Leu Ser Phe Ala Leu Tyr Phe Leu Val Lys Asn Pro His Val Leu
275 280 285
Gln Lys Ala Ala Glu Glu Ala Ala Arg Val Leu Val Asp Pro Val Pro
290 295 300
Ser Tyr Lys Gln Val Lys Gln Leu Lys Tyr Val Gly Met Val Leu Asn
305 310 315 320
Glu Ala Leu Arg Leu Trp Pro Thr Ala Pro Ala Phe Ser Leu Tyr Ala
325 330 335
Lys Glu Asp Thr Val Leu Gly Gly Glu Tyr Pro Leu Glu Lys Gly Asp
340 345 350
Glu Leu Met Val Leu Ile Pro Gln Leu His Arg Asp Lys Thr Ile Trp
355 360 365
Gly Asp Asp Val Glu Glu Phe Arg Pro Glu Arg Phe Glu Asn Pro Ser
370 375 380
Ala Ile Pro Gln His Ala Phe Lys Pro Phe Gly Asn Gly Gln Arg Ala
385 390 395 400
Cys Ile Gly Gln Gln Phe Ala Leu His Glu Ala Thr Leu Val Leu Gly
405 410 415
Met Met Leu Lys His Phe Asp Phe Glu Asp His Thr Asn Tyr Glu Leu
420 425 430
Asp Ile Lys Glu Thr Leu Thr Leu Lys Pro Glu Gly Phe Val Val Lys
435 440 445
Ala Lys Ser Lys Lys Ile Pro Leu Gly Gly Ile Pro Ser Pro Ser Thr
450 455 460
Glu Gln Ser Ala Lys Lys Val Arg Lys Lys Ala Glu Asn Ala His Asn
465 470 475 480
Thr Pro Leu Leu Val Leu Tyr Gly Ser Asn Met Gly Thr Ala Glu Gly
485 490 495
Thr Ala Arg Asp Leu Ala Asp Ile Ala Met Ser Lys Gly Phe Ala Pro
500 505 510
Gln Val Ala Thr Leu Asp Ser His Ala Gly Asn Leu Pro Arg Glu Gly
515 520 525
Ala Val Leu Ile Val Thr Ala Ser Tyr Asn Gly His Pro Pro Asp Asn
530 535 540
Ala Lys Gln Phe Val Asp Trp Leu Asp Gln Ala Ser Ala Asp Glu Val
545 550 555 560
Lys Gly Val Arg Tyr Ser Val Phe Gly Cys Gly Asp Lys Asn Trp Ala
565 570 575
Thr Thr Tyr Gln Lys Val Pro Ala Phe Ile Asp Glu Thr Leu Ala Ala
580 585 590
Lys Gly Ala Glu Asn Ile Ala Asp Arg Gly Glu Ala Asp Ala Ser Asp
595 600 605
Asp Phe Glu Gly Thr Tyr Glu Glu Trp Arg Glu His Met Trp Ser Asp
610 615 620
Val Ala Ala Tyr Phe Asn Leu Asp Ile Glu Asn Ser Glu Asp Asn Lys
625 630 635 640
Ser Thr Leu Ser Leu Gln Phe Val Asp Ser Ala Ala Asp Met Pro Leu
645 650 655
Ala Lys Met His Gly Ala Phe Ser Thr Asn Val Val Ala Ser Lys Glu
660 665 670
Leu Gln Gln Pro Gly Ser Ala Arg Ser Thr Arg His Leu Glu Ile Glu
675 680 685
Leu Pro Lys Glu Ala Ser Tyr Gln Glu Gly Asp His Leu Gly Val Ile
690 695 700
Pro Arg Asn Tyr Glu Gly Ile Val Asn Arg Val Thr Ala Arg Phe Gly
705 710 715 720
Leu Asp Ala Ser Gln Gln Ile Arg Leu Glu Ala Glu Glu Glu Lys Leu
725 730 735
Ala His Leu Pro Leu Ala Lys Thr Val Ser Val Glu Glu Leu Leu Gln
740 745 750
Tyr Val Glu Leu Gln Asp Pro Val Thr Arg Thr Gln Leu Arg Ala Met
755 760 765
Ala Ala Lys Thr Val Cys Pro Pro His Lys Val Glu Leu Glu Ala Leu
770 775 780
Leu Glu Lys Gln Ala Tyr Lys Glu Gln Val Leu Ala Lys Arg Leu Thr
785 790 795 800
Met Leu Glu Leu Leu Glu Lys Tyr Pro Ala Cys Glu Met Lys Phe Ser
805 810 815
Glu Phe Ile Ala Leu Leu Pro Ser Ile Arg Pro Arg Tyr Tyr Ser Ile
820 825 830
Ser Ser Ser Pro Arg Val Asp Glu Lys Gln Ala Ser Ile Thr Val Ser
835 840 845
Val Val Ser Gly Glu Ala Trp Ser Gly Tyr Gly Glu Tyr Lys Gly Ile
850 855 860
Ala Ser Asn Tyr Leu Ala Glu Leu Gln Glu Gly Asp Thr Ile Thr Cys
865 870 875 880
Phe Ile Ser Thr Pro Gln Ser Glu Phe Thr Leu Pro Lys Asp Pro Glu
885 890 895
Thr Pro Leu Ile Met Val Gly Pro Gly Thr Gly Val Ala Pro Phe Arg
900 905 910
Gly Phe Val Gln Ala Arg Lys Gln Leu Lys Glu Gln Gly Gln Ser Leu
915 920 925
Gly Glu Ala His Leu Tyr Phe Gly Cys Arg Ser Pro His Glu Asp Tyr
930 935 940
Leu Tyr Gln Glu Glu Leu Glu Asn Ala Gln Ser Glu Gly Ile Ile Thr
945 950 955 960
Leu His Thr Ala Phe Ser Arg Met Pro Asn Gln Pro Lys Thr Tyr Val
965 970 975
Gln His Val Met Glu Gln Asp Gly Lys Lys Leu Ile Glu Leu Leu Asp
980 985 990
Gln Gly Ala His Phe Tyr Ile Cys Gly Asp Gly Ser Gln Met Ala Pro
995 1000 1005
Ala Val Glu Ala Thr Leu Met Lys Ser Tyr Ala Asp Val His Gln
1010 1015 1020
Val Ser Glu Ala Asp Ala Arg Leu Trp Leu Gln Gln Leu Glu Glu
1025 1030 1035
Lys Gly Arg Tyr Ala Lys Asp Val Trp Ala Gly
1040 1045
<210> 2
<211> 3150
<212> DNA
<213> 巨大芽孢杆菌
<400> 2
atgacaatta aagaaatgcc tcagccaaaa acgtttggag agcttaaaaa tttaccgtta 60
ttaaacacag ataaaccggt tcaagctttg atgaaaattg cggatgaatt aggagaaatc 120
tttaaattcg aggcgcctgg tcgtgtaacg cgctacttat caagtcagcg tctaattaaa 180
gaagcatgcg atgaatcacg ctttgataaa aacttaagtc aagcgcttaa atttgtacgt 240
gattttgcag gagacgggtt atttacaagc tggacgcatg aaaaaaattg gaaaaaagcg 300
cataatatct tacttccaag cttcagtcag caggcaatga aaggctatca tgcgatgatg 360
gtcgatatcg ccgtgcagct tgttcaaaag tgggagcgtc taaatgcaga tgagcatatt 420
gaagtaccgg aagacatgac acgtttaacg cttgatacaa ttggtctttg cggctttaac 480
tatcgcttta acagctttta ccgagatcag cctcatccat ttattacaag tatggtccgt 540
gcactggatg aagcaatgaa caagctgcag cgagcaaatc cagacgaccc agcttatgat 600
gaaaacaagc gccagtttca agaagatatc aaggtgatga acgacctagt agataaaatt 660
attgcagatc gcaaagcaag cggtgaacaa agcgatgatt tattaacgca tatgctaaac 720
ggaaaagatc cagaaacggg tgagccgctt gatgacgaga acattcgcta tcaaattatt 780
acattcttaa ttgcgggaca cgaaacaaca agtggtcttt tatcatttgc gctgtatttc 840
ttagtgaaaa atccacatgt attacaaaaa gcagcagaag aagcagcacg agttctagta 900
gatcctgttc caagctacaa acaagtcaaa cagcttaaat atgtcggcat ggtcttaaac 960
gaagcgctgc gcttatggcc aactgctcct gcgttttccc tatatgcaaa agaagatacg 1020
gtgcttggag gagaatatcc tttagaaaaa ggcgacgaac taatggttct gattcctcag 1080
cttcaccgtg ataaaacaat ttggggagac gatgtggaag agttccgtcc agagcgtttt 1140
gaaaatccaa gtgcgattcc gcagcatgcg tttaaaccgt ttggaaacgg tcagcgtgcg 1200
tgtatcggtc agcagttcgc tcttcatgaa gcaacgctgg tacttggtat gatgctaaaa 1260
cactttgact ttgaagatca tacaaactac gagctggata ttaaagaaac tttaacgtta 1320
aaacctgaag gctttgtggt aaaagcaaaa tcgaaaaaaa ttccgcttgg cggtattcct 1380
tcacctagca ctgaacagtc tgctaaaaaa gtacgcaaaa aggcagaaaa cgctcataat 1440
acgccgctgc ttgtgctata cggttcaaat atgggaacag ctgaaggaac ggcgcgtgat 1500
ttagcagata ttgcaatgag caaaggattt gcaccgcagg tcgcaacgct tgattcacac 1560
gccggaaatc ttccgcgcga aggagctgta ttaattgtaa cggcgtctta taacggtcat 1620
ccgcctgata acgcaaagca atttgtcgac tggttagacc aagcgtctgc tgatgaagta 1680
aaaggcgttc gctactccgt atttggatgc ggcgataaaa actgggctac tacgtatcaa 1740
aaagtgcctg cttttatcga tgaaacgctt gccgctaaag gggcagaaaa catcgctgac 1800
cgcggtgaag cagatgcaag cgacgacttt gaaggcacat atgaagaatg gcgtgaacat 1860
atgtggagtg acgtagcagc ctactttaac ctcgacattg aaaacagtga agataataaa 1920
tctactcttt cacttcaatt tgtcgacagc gccgcggata tgccgcttgc gaaaatgcac 1980
ggtgcgtttt caacgaacgt cgtagcaagc aaagaacttc aacagccagg cagtgcacga 2040
agcacgcgac atcttgaaat tgaacttcca aaagaagctt cttatcaaga aggagatcat 2100
ttaggtgtta ttcctcgcaa ctatgaagga atagtaaacc gtgtaacagc aaggttcggc 2160
ctagatgcat cacagcaaat ccgtctggaa gcagaagaag aaaaattagc tcatttgcca 2220
ctcgctaaaa cagtatccgt agaagagctt ctgcaatacg tggagcttca agatcctgtt 2280
acgcgcacgc agcttcgcgc aatggctgct aaaacggtct gcccgccgca taaagtagag 2340
cttgaagcct tgcttgaaaa gcaagcctac aaagaacaag tgctggcaaa acgtttaaca 2400
atgcttgaac tgcttgaaaa atacccggcg tgtgaaatga aattcagcga atttatcgcc 2460
cttctgccaa gcatacgccc gcgctattac tcgatttctt catcacctcg tgtcgatgaa 2520
aaacaagcaa gcatcacggt cagcgttgtc tcaggagaag cgtggagcgg atatggagaa 2580
tataaaggaa ttgcgtcgaa ctatcttgcc gagctgcaag aaggagatac gattacgtgc 2640
tttatttcca caccgcagtc agaatttacg ctgccaaaag accctgaaac gccgcttatc 2700
atggtcggac cgggaacagg cgtcgcgccg tttagaggct ttgtgcaggc gcgcaaacag 2760
ctaaaagaac aaggacagtc acttggagaa gcacatttat acttcggctg ccgttcacct 2820
catgaagact atctgtatca agaagagctt gaaaacgccc aaagcgaagg catcattacg 2880
cttcataccg ctttttctcg catgccaaat cagccgaaaa catacgttca gcacgtaatg 2940
gaacaagacg gcaagaaatt gattgaactt cttgatcaag gagcgcactt ctatatttgc 3000
ggagacggaa gccaaatggc acctgccgtt gaagcaacgc ttatgaaaag ctatgctgac 3060
gttcaccaag tgagtgaagc agacgctcgc ttatggctgc agcagctaga agaaaaaggc 3120
cgatacgcaa aagacgtgtg ggctgggtaa 3150
<210> 3
<211> 1080
<212> PRT
<213> 嗜热毁丝霉
<400> 3
Met Ala Asp Lys Thr Thr Glu Thr Val Pro Ile Pro Gly Pro Pro Gly
1 5 10 15
Leu Pro Leu Val Gly Asn Ala Leu Ala Phe Asp Ser Glu Leu Pro Leu
20 25 30
Arg Thr Phe Gln Glu Phe Ala Glu Glu Tyr Gly Glu Ile Tyr Arg Leu
35 40 45
Thr Leu Pro Thr Gly Thr Thr Leu Val Val Ser Ser Gln Ala Leu Val
50 55 60
His Glu Leu Cys Asp Asp Lys Arg Phe Lys Lys Pro Val Ala Ala Ala
65 70 75 80
Leu Ala Glu Val Arg Asn Gly Val Asn Asp Gly Leu Phe Thr Ala Arg
85 90 95
Glu Glu Glu Pro Asn Trp Gly Ile Ala His Arg Ile Leu Met Pro Ala
100 105 110
Phe Gly Pro Ala Ser Ile Gln Gly Met Phe Thr Glu Met His Glu Ile
115 120 125
Ala Ser Gln Leu Ala Leu Lys Trp Ala Arg His Gly Pro Asp Thr Pro
130 135 140
Ile Phe Val Thr Asp Asp Phe Thr Arg Leu Thr Leu Asp Thr Leu Ala
145 150 155 160
Leu Cys Thr Met Asn Phe Arg Phe Asn Ser Tyr Tyr His Asp Glu Leu
165 170 175
His Pro Phe Ile Asn Ala Met Gly Asn Phe Leu Thr Glu Ser Gly Ala
180 185 190
Arg Ala Met Arg Pro Ala Ile Thr Ser Ile Phe His Gln Ala Ala Asn
195 200 205
Arg Lys Tyr Trp Glu Asp Ile Glu Val Leu Arg Lys Thr Ala Gln Gly
210 215 220
Val Leu Asp Thr Arg Arg Lys His Pro Thr Asn Arg Lys Asp Leu Leu
225 230 235 240
Ser Ala Met Leu Asp Gly Val Asp Ala Lys Thr Gly Gln Lys Leu Ser
245 250 255
Asp Ser Ser Ile Ile Asp Asn Leu Ile Thr Phe Leu Ile Ala Gly His
260 265 270
Glu Thr Thr Ser Gly Leu Leu Ser Phe Ala Phe Tyr Leu Leu Ile Lys
275 280 285
His Gln Asp Ala Tyr Arg Lys Ala Gln Glu Glu Val Asp Arg Val Ile
290 295 300
Gly Lys Gly Pro Ile Lys Val Glu His Ile Lys Lys Leu Pro Tyr Ile
305 310 315 320
Ala Ala Val Leu Arg Glu Thr Leu Arg Leu Cys Pro Thr Ile Pro Ile
325 330 335
Ile Asn Arg Ala Ala Lys Gln Asp Glu Val Ile Gly Gly Lys Tyr Ala
340 345 350
Val Ala Lys Asp Gln Arg Leu Ala Leu Leu Leu Ala Gln Ser His Leu
355 360 365
Asp Pro Ala Val Tyr Gly Glu Thr Ala Lys Gln Phe Ile Pro Glu Arg
370 375 380
Met Leu Asp Glu Asn Phe Glu Arg Leu Asn Arg Glu Tyr Pro Asp Cys
385 390 395 400
Trp Lys Pro Phe Gly Thr Gly Met Arg Ala Cys Ile Gly Arg Pro Phe
405 410 415
Ala Trp Gln Glu Ala Val Leu Val Met Ala Met Leu Leu Gln Asn Phe
420 425 430
Asp Phe Val Leu His Asp Pro Tyr Tyr Glu Leu His Tyr Lys Gln Thr
435 440 445
Leu Thr Thr Lys Pro Lys Asp Phe Tyr Met Arg Ala Ile Leu Arg Asp
450 455 460
Gly Leu Thr Ala Thr Glu Leu Glu His Arg Leu Ala Gly Asn Ala Ala
465 470 475 480
Ser Val Ala Arg Ser Gly Gly Gly Gly Gly Gly Pro Ser Lys Pro Thr
485 490 495
Ala Gln Lys Thr Ser Pro Ala Glu Ala Lys Pro Met Ser Ile Phe Tyr
500 505 510
Gly Ser Asn Thr Gly Thr Cys Glu Ser Leu Ala Gln Arg Leu Ala Thr
515 520 525
Asp Ala Ala Ser His Gly Tyr Ala Ala Ala Ala Val Glu Pro Leu Asp
530 535 540
Thr Ala Thr Glu Lys Leu Pro Thr Asp Arg Pro Val Val Ile Ile Thr
545 550 555 560
Ala Ser Phe Glu Gly Gln Pro Pro Asp Asn Ala Ala Lys Phe Cys Gly
565 570 575
Trp Leu Lys Asn Leu Glu Gly Asp Glu Leu Lys Asn Val Ser Tyr Ala
580 585 590
Val Phe Gly Cys Gly His His Asp Trp Ser Gln Thr Phe His Arg Ile
595 600 605
Pro Lys Leu Val His Gln Thr Met Lys Ala His Gly Ala Ser Pro Ile
610 615 620
Cys Asp Glu Gly Leu Thr Asp Val Ala Glu Gly Asn Met Phe Thr Asp
625 630 635 640
Phe Glu Gln Trp Glu Asp Asp Val Phe Trp Pro Ala Val Arg Ala Arg
645 650 655
Tyr Gly Ala Ala Gly Ala Val Ala Glu Thr Glu Asp Ala Pro Gly Ser
660 665 670
Asp Gly Leu Asn Ile His Phe Ser Ser Pro Arg Ser Ser Thr Leu Arg
675 680 685
Gln Asp Val Arg Glu Ala Thr Val Val Gly Glu Ala Leu Leu Thr Ala
690 695 700
Pro Asp Ala Pro Pro Lys Lys His Ile Glu Val Gln Leu Pro Asp Gly
705 710 715 720
Ala Thr Tyr Lys Val Gly Asp Tyr Leu Ala Val Leu Pro Val Asn Ser
725 730 735
Lys Glu Ser Ile Gly Arg Val Met Arg Lys Phe Gln Leu Ser Trp Asp
740 745 750
Ser His Val Thr Ile Ala Ser Asp Arg Trp Thr Ala Leu Pro Thr Gly
755 760 765
Thr Pro Val Pro Ala Tyr Asp Val Leu Gly Ser Tyr Val Glu Leu Ser
770 775 780
Gln Pro Ala Thr Lys Arg Gly Ile Leu Arg Leu Ala Asp Ala Ala Glu
785 790 795 800
Asp Glu Ala Thr Lys Ala Glu Leu Gln Lys Leu Ala Gly Asp Leu Tyr
805 810 815
Thr Ser Glu Ile Ser Leu Lys Arg Ala Ser Val Leu Asp Leu Leu Asp
820 825 830
Arg Phe Pro Ser Ile Ser Leu Pro Phe Gly Thr Phe Leu Ser Leu Leu
835 840 845
Pro Pro Ile Arg Pro Arg Gln Tyr Ser Ile Ser Ser Ser Pro Leu Asn
850 855 860
Asp Pro Ser Arg Ala Thr Leu Thr Tyr Ser Leu Leu Asp Ser Pro Ser
865 870 875 880
Leu Ala Asn Pro Ser Arg Arg Phe Val Gly Val Ala Thr Ser Tyr Leu
885 890 895
Ser Ser Leu Val Arg Gly Asp Lys Leu Leu Val Ser Val Arg Pro Thr
900 905 910
His Thr Ala Phe Arg Leu Pro Asp Glu Asp Lys Met Gly Glu Thr Ala
915 920 925
Ile Ile Cys Val Gly Ala Gly Ser Gly Leu Ala Pro Phe Arg Gly Phe
930 935 940
Ile Gln Glu Arg Ala Ala Leu Leu Ala Lys Gly Thr Gln Leu Ala Ala
945 950 955 960
Ala Leu Leu Phe Tyr Gly Cys Arg Ser Pro Glu Lys Asp Asp Leu Tyr
965 970 975
Arg Asp Glu Phe Asp Lys Trp Gln Glu Ser Gly Ala Val Asp Val Arg
980 985 990
Arg Ala Phe Ser Arg Val Asp Ser Asp Asp Thr Glu Ala Arg Gly Cys
995 1000 1005
Arg His Val Gln Asp Arg Leu Trp His Asp Arg Glu Glu Val Lys
1010 1015 1020
Ala Leu Trp Asp Arg Gly Ala Arg Val Tyr Val Cys Gly Ser Arg
1025 1030 1035
Gln Val Gly Glu Gly Val Lys Thr Ala Met Gly Arg Ile Val Leu
1040 1045 1050
Gly Glu Glu Asp Ala Glu Asp Ala Ile Ser Lys Trp Tyr Glu Thr
1055 1060 1065
Val Arg Asn Asp Arg Tyr Ala Thr Asp Val Phe Asp
1070 1075 1080
<210> 4
<211> 3243
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 4
atggcggata agaccaccga aaccgtgccg attccgggtc cgccgggcct gccgctggtt 60
ggtaatgcgc tggcgtttga tagcgaactg ccgctgcgta ccttccagga atttgcggag 120
gaatacggcg agatctatcg tctgaccctg ccgaccggta ccaccctggt ggttagcagc 180
caagcgctgg ttcacgaact gtgcgacgat aagcgtttca agaagccggt tgctgcggcg 240
ctggcggaag tgcgtaacgg cgttaacgac ggtctgttta ccgcgcgtga agaggagccg 300
aactggggca tcgcgcaccg tattctgatg ccggcgtttg gtccggcgag cattcagggc 360
atgtttaccg aaatgcacga gatcgcgagc caactggcgc tgaaatgggc gcgtcacggt 420
ccggacaccc cgattttcgt taccgacgat tttacccgtc tgaccctgga taccctggcg 480
ctgtgcacca tgaacttccg ttttaacagc tactatcacg acgaactgca cccgttcatc 540
aacgcgatgg gcaactttct gaccgagagc ggtgcgcgtg cgatgcgtcc ggcgatcacc 600
agcattttcc accaggcggc gaaccgtaag tactgggaag atattgaggt tctgcgtaaa 660
accgcgcaag gtgtgctgga cacccgtcgt aagcacccga ccaaccgtaa agatctgctg 720
agcgcgatgc tggacggcgt ggatgcgaaa accggtcaga aactgagcga cagcagcatc 780
attgataacc tgatcacctt tctgattgcg ggccacgaaa ccaccagcgg tctgctgagc 840
ttcgcgtttt acctgctgat taagcaccag gacgcgtatc gtaaagcgca agaagaggtg 900
gatcgtgtta tcggcaaggg cccgattaaa gttgaacaca tcaagaaact gccgtacatc 960
gcggcggtgc tgcgtgaaac cctgcgtctg tgcccgacca ttccgatcat taaccgtgcg 1020
gcgaagcagg acgaagttat cggtggcaag tacgcggtgg cgaaagatca gcgtctggcg 1080
ctgctgctgg cgcaaagcca cctggacccg gcggtttatg gcgaaaccgc gaagcaattc 1140
attccggagc gtatgctgga cgaaaacttt gagcgtctga accgtgagta tccggattgc 1200
tggaaaccgt tcggtaccgg catgcgtgcg tgcatcggtc gtccgtttgc gtggcaggaa 1260
gcggtgctgg ttatggcgat gctgctgcaa aacttcgact ttgttctgca cgatccgtac 1320
tatgagctgc actacaagca gaccctgacc accaagccga aagacttcta tatgcgtgcg 1380
atcctgcgtg atggcctgac cgcgaccgaa ctggagcacc gtctggcggg taacgcggcg 1440
agcgtggcgc gtagcggtgg cggtggcggt ggcccgagca aaccgaccgc gcagaaaacc 1500
agcccggcgg aagcgaaacc gatgagcatc ttctacggca gcaacaccgg tacctgcgag 1560
agcctggcgc aacgtctggc gaccgatgcg gcgagccacg gttatgctgc ggcggcggtg 1620
gaaccgctgg acaccgcgac cgagaagctg ccgaccgatc gtccggtggt tatcattacc 1680
gcgagcttcg agggtcagcc gccggacaac gcggcgaagt tttgcggctg gctgaaaaac 1740
ctggaaggtg atgagctgaa aaacgtgagc tacgcggttt tcggttgcgg ccaccacgac 1800
tggagccaga cctttcaccg tattccgaag ctggttcacc aaaccatgaa agcgcacggt 1860
gcgagcccga tctgcgacga aggcctgacc gatgtggcgg agggtaacat gttcaccgat 1920
tttgaacaat gggaggacga tgtgttctgg ccggcggttc gtgcgcgtta tggcgcggcg 1980
ggtgcggttg cggaaaccga ggacgcgccg ggtagcgatg gtctgaacat ccactttagc 2040
agcccgcgta gcagcaccct gcgtcaggac gtgcgtgaag cgaccgtggt tggtgaagcg 2100
ctgctgaccg cgccggatgc gccgccgaag aaacacattg aagttcaact gccggacggc 2160
gcgacctaca aagtgggtga ttatctggcg gtgctgccgg ttaacagcaa ggagagcatt 2220
ggtcgtgtta tgcgtaaatt ccagctgagc tgggacagcc acgtgaccat cgcgagcgat 2280
cgttggaccg cgctgccgac cggtaccccg gtgccggcgt acgacgttct gggtagctat 2340
gtggagctga gccaaccggc gaccaaacgt ggtatcctgc gtctggcgga tgcggcggaa 2400
gatgaggcga ccaaggcgga actgcaaaaa ctggcgggtg atctgtacac cagcgagatt 2460
agcctgaaac gtgcgagcgt tctggacctg ctggatcgtt tcccgagcat cagcctgccg 2520
ttcggtacct ttctgagcct gctgccgccg attcgtccgc gtcaatacag catcagcagc 2580
agcccgctga acgacccgag ccgtgcgacc ctgacctata gcctgctgga tagcccgagc 2640
ctggcgaacc cgagccgtcg tttcgtgggc gttgcgacca gctacctgag cagcctggtt 2700
cgtggtgaca agctgctggt gagcgttcgt ccgacccaca ccgcgtttcg tctgccggac 2760
gaagataaaa tgggtgaaac cgcgatcatt tgcgtgggtg cgggtagcgg tctggcgccg 2820
ttccgtggtt ttatccagga acgtgcggcg ctgctggcga aaggtaccca actggcggcg 2880
gcgctgctgt tctacggttg ccgtagcccg gagaaggacg atctgtatcg tgacgaattc 2940
gataaatggc aagagagcgg tgcggtggat gttcgtcgtg cgtttagccg tgttgatagc 3000
gacgataccg aggcgcgtgg ttgccgtcac gttcaggacc gtctgtggca cgatcgtgaa 3060
gaggtgaagg cgctgtggga ccgtggcgcg cgtgtgtacg tttgcggtag ccgtcaagtg 3120
ggcgaaggtg ttaaaaccgc gatgggccgt atcgtgctgg gtgaagagga cgcggaggat 3180
gcgatcagca agtggtatga aaccgtgcgt aatgaccgtt atgcgaccga tgtgttcgac 3240
taa 3243
<210> 5
<211> 342
<212> PRT
<213> 南极假丝酵母
<400> 5
Met Lys Leu Leu Ser Leu Thr Gly Val Ala Gly Val Leu Ala Thr Cys
1 5 10 15
Val Ala Ala Thr Pro Leu Val Lys Arg Leu Pro Ser Gly Ser Asp Pro
20 25 30
Ala Phe Ser Gln Pro Lys Ser Val Leu Asp Ala Gly Leu Thr Cys Gln
35 40 45
Gly Ala Ser Pro Ser Ser Val Ser Lys Pro Ile Leu Leu Val Pro Gly
50 55 60
Thr Gly Thr Thr Gly Pro Gln Ser Phe Asp Ser Asn Trp Ile Pro Leu
65 70 75 80
Ser Thr Gln Leu Gly Tyr Thr Pro Cys Trp Ile Ser Pro Pro Pro Phe
85 90 95
Met Leu Asn Asp Thr Gln Val Asn Thr Glu Tyr Met Val Asn Ala Ile
100 105 110
Thr Ala Leu Tyr Ala Gly Ser Gly Asn Asn Lys Leu Pro Val Leu Thr
115 120 125
Trp Ser Gln Gly Gly Leu Val Ala Gln Trp Gly Leu Thr Phe Phe Pro
130 135 140
Ser Ile Arg Ser Lys Val Asp Arg Leu Met Ala Phe Ala Pro Asp Tyr
145 150 155 160
Lys Gly Thr Val Leu Ala Gly Pro Leu Asp Ala Leu Ala Val Ser Ala
165 170 175
Pro Ser Val Trp Gln Gln Thr Thr Gly Ser Ala Leu Thr Thr Ala Leu
180 185 190
Arg Asn Ala Gly Gly Leu Thr Gln Ile Val Pro Thr Thr Asn Leu Tyr
195 200 205
Ser Ala Thr Asp Glu Ile Val Gln Pro Gln Val Ser Asn Ser Pro Leu
210 215 220
Asp Ser Ser Tyr Leu Phe Asn Gly Lys Asn Val Gln Ala Gln Ala Val
225 230 235 240
Cys Gly Pro Leu Phe Val Ile Asp His Ala Gly Ser Leu Thr Ser Gln
245 250 255
Phe Ser Tyr Val Val Gly Arg Ser Ala Leu Arg Ser Thr Thr Gly Gln
260 265 270
Ala Arg Ser Ala Asp Tyr Gly Ile Thr Asp Cys Asn Pro Leu Pro Ala
275 280 285
Asn Asp Leu Thr Pro Glu Gln Lys Val Ala Ala Ala Ala Leu Leu Ala
290 295 300
Pro Ala Ala Ala Ala Ile Val Ala Gly Pro Lys Gln Asn Cys Glu Pro
305 310 315 320
Asp Leu Met Pro Tyr Ala Arg Pro Phe Ala Val Gly Lys Arg Thr Cys
325 330 335
Ser Gly Ile Val Thr Pro
340

Claims (70)

1.一种产生内酯的方法,所述方法包括:
(i)制备包含一种或多种脂肪酸、细胞色素P450羟化酶和NADPH的第一反应混合物;
(ii)将所述第一反应混合物温育足够的时间以产生选自ω-1羟基脂肪酸、ω-2羟基脂肪酸、ω-3羟基脂肪酸以及它们的组合的羟基脂肪酸;
(iii)制备包含在步骤(ii)中产生的所述羟基脂肪酸和脂肪酶的第二反应混合物;以及
(iv)将所述第二反应混合物温育足够的时间以产生所述内酯。
2.根据权利要求1所述的方法,其中步骤(ii)还包括从所述第一反应混合物中分离所述羟基脂肪酸。
3.根据权利要求1或权利要求2所述的方法,其中所述细胞色素P450羟化酶包含与SEQID NO:1或SEQ ID NO:3的氨基酸序列具有至少80%同一性的氨基酸序列。
4.根据权利要求3所述的方法,其中所述细胞色素P450羟化酶包含SEQ ID NO:1或SEQID NO:3的所述氨基酸序列。
5.根据权利要求1至4中任一项所述的方法,其中所述脂肪酶是来自南极假丝酵母的脂肪酶B。
6.根据权利要求5所述的方法,其中所述脂肪酶包含与SEQ ID NO:5的氨基酸序列具有至少80%同一性的氨基酸序列。
7.根据权利要求6所述的方法,其中所述脂肪酶包含SEQ ID NO:5的所述氨基酸序列。
8.根据权利要求1至6中任一项所述的方法,其中所述脂肪酶固定在固体支持物上。
9.根据权利要求1至8中任一项所述的方法,其中所述第二反应混合物还包含溶剂,任选地其中所述溶剂为甲苯或二氯乙烷。
10.根据权利要求1至9中任一项所述的方法,其中所述第二反应混合物中的所述羟基脂肪酸的总浓度为0.02M至0.1M,任选地其中所述羟基脂肪酸的总浓度为0.025M至0.5M。
11.根据权利要求1至10中任一项所述的方法,其中所述第二反应混合物中的所述脂肪酶的浓度为20g/L至150g/L,任选地其中所述脂肪酶的浓度为50g/L至100g/L。
12.根据权利要求1至11中任一项所述的方法,其中步骤(iv)还包括分离所述内酯。
13.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括包含12个至28个碳原子的直链脂肪酸,任选地其中步骤(i)的所述一种或多种脂肪酸包括包含15个、16个、17个、18个或20个碳原子的直链脂肪酸。
14.根据权利要求1至13中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括饱和脂肪酸。
15.根据权利要求1至13中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括不饱和脂肪酸,任选地其中所述不饱和脂肪酸包含至少一个双键,任选地其中所述不饱和脂肪酸包含至少一个Z双键。
16.根据权利要求1至15中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸选自:
(C15:0,十五烷酸);
(C16:0,棕榈酸);
(C16:1,棕榈油酸);
(C17:0,十七烷酸);
(C18:0,十八烷酸);
(C18:1,油酸);
(C18:2,亚油酸);
(C20:4,花生四烯酸);
((7Z,10Z,13Z)-十六碳三烯酸);
((6Z,9Z,12Z)-十六碳三烯酸);
((4E,7E,10E)-十六碳三烯酸);
((2E,4E,6E)-十六碳三烯酸);
(γ-亚麻酸);
(α-亚麻酸);
((8E,10E,12Z)-十八碳三烯酸);
((9Z,11E,13E)-十八碳-9,11,13-三烯酸);
((9E,11E,13E)-十八碳-9,11,13-三烯酸);
((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸);
(8Z,11Z,14Z-二十碳三烯酸);
((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸);
以及它们的组合。
17.根据权利要求1至15中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸选自:
(顺式-10-十七碳烯酸);
(顺式-10-十九碳烯酸);(反式-10-十七碳烯酸);
(顺式-11-二十碳烯酸)以及它们的组合。
18.根据权利要求1至17中任一项所述的方法,其中所述内酯包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个---在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内。
19.根据权利要求1至17中任一项所述的方法,其中所述内酯包括一种或多种下式的化合物:
其中:
R为甲基、乙基或正丙基;
每个---在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
n为6至20之间的整数,包括端值在内。
20.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C15:0,十五烷酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
21.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C16:0,棕榈酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
22.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C16:1,棕榈油酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
23.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C17:0,十七烷酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
24.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C18:0,十八烷酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
25.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C18:1,油酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
26.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C18:2,亚油酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
27.根据权利要求1至12中任一项所述的方法,其中步骤(i)的所述一种或多种脂肪酸包括(C20:4,花生四烯酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
28.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中用作所述第一反应混合物中的底物的所述一种或多种脂肪酸包括
((7Z,10Z,13Z)-十六碳三烯酸)并且在步骤(iv)中产生的所述内酯包括:
29.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((6Z,9Z,12Z)-十六碳三烯酸)并且在步骤(iv)中产生的所述内酯包括:/>以及它们的组合。
30.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((4E,7E,10E)-十六碳三烯酸)并且在步骤(iv)中产生的所述内酯包括:以及它们的组合。
31.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((2E,4E,6E)-十六碳三烯酸)并且在步骤(iv)中产生的所述内酯包括:以及它们的组合。
32.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(γ-亚麻酸)并且在步骤(iv)中产生的所述内酯包括:/>以及它们的组合。
33.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(α-亚麻酸)并且在步骤(iv)中产生的所述内酯包括:/>
34.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(α-十八碳三烯酸;(8E,10E,12Z)-十八碳三烯酸)并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
35.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((9Z,11E,13E)-十八碳-9,11,13-三烯酸);并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
36.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((9E,11E,13E)-十八碳-9,11,13-三烯酸);并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
37.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((5Z,9Z,12Z)-十八碳-5,9,12-三烯酸);并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
38.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(8Z,11Z,14Z-二十碳三烯酸)并且在步骤(iv)中产生的所述内酯包括:以及它们的组合。
39.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括((5Z,8Z,11Z)-二十碳-5,8,11-三烯酸);并且在步骤(iv)中产生的所述内酯包括:以及它们的组合。
40.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(顺式-10-十七碳烯酸)并且在步骤(iv)中产生的所述内酯包括:/> 以及它们的组合。
41.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(反式-10-十七碳烯酸)并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
42.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(顺式-10-十九碳烯酸)并且在步骤(iv)中产生的所述内酯包括: 以及它们的组合。
43.根据权利要求1至12中任一项所述的方法,其中在步骤(i)中的所述第一反应混合物中用作底物的所述一种或多种脂肪酸包括(顺式-11-二十碳烯酸)并且在步骤(iv)中产生的所述内酯包括:以及它们的组合。
44.根据权利要求1至43中任一项所述的方法,其中所述第一反应混合物是体外的。
45.根据权利要求1至44中任一项所述的方法,其中所述第一反应混合物是基于细胞的反应混合物。
46.根据权利要求45所述的方法,其中所述基于细胞的反应混合物包含选自酵母、植物、藻类、真菌和细菌的细胞。
47.根据权利要求45所述的方法,其中所述基于细胞的反应混合物包含选自以下属的细菌细胞:埃希氏菌;沙门氏菌;芽孢杆菌;不动杆菌;棒状杆菌;甲基弯曲菌;甲基单胞菌;红球菌;假单胞菌;红杆菌;集胞藻;短杆菌;细杆菌;节杆菌;柠檬酸杆菌;埃希氏菌;克雷伯氏菌;泛菌;沙门氏菌;棒状杆菌;和梭菌,任选地其中所述基于细胞的反应混合物包含大肠杆菌细胞。
48.根据权利要求45所述的方法,其中所述基于细胞的反应混合物包含选自以下属的真菌:酵母属、接合酵母属、克鲁维酵母菌属、假丝酵母属、链霉菌属、汉逊酵母属、德巴利氏酵母属、毛霉菌、毕赤酵母属、球拟酵母属、曲霉菌属和节丛孢属。
49.根据权利要求1至48中任一项所述的方法,其中在步骤(iv)中产生的所述内酯具有至少70%的纯度。
50.根据权利要求1至49中任一项所述的方法,其中在步骤(iv)中产生的所述内酯具有麝香香韵。
51.一种具有下式的内酯:
其中:
R为甲基、乙基或正丙基;
每个---在化合价允许的情况下独立地为单键、E双键、Z双键或三键;并且
k为6至30之间的整数,包括端值在内;
前提是内酯不具有下式:
52.根据权利要求51所述的内酯,其中所述内酯具有下式:
其中:
R为甲基、乙基或正丙基;
在化合价允许的情况下,每个---独立地为单键或Z双键,其中0个、1个、2个或4个---为Z双键;并且
m为4至11之间的整数,包括端值在内;
前提是内酯不具有下式:
53.根据前述权利要求18至19中任一项所述的方法,或根据权利要求51至52中任一项所述的内酯,其中每个---为单键。
54.根据权利要求18至19中任一项所述的方法,或根据权利要求51至52中任一项所述的内酯,其中一个---为E或Z双键,并且其余的---为单键。
55.根据权利要求18至19中任一项所述的方法,或根据权利要求51至52中任一项所述的内酯,其中两个---独立地为E或Z双键,并且其余的---为单键。
56.根据权利要求18至19中任一项所述的方法,或根据权利要求51至52中任一项所述的内酯,其中三个---独立地为E或Z双键,并且其余的---为单键。
57.根据权利要求18至19中任一项所述的方法,或根据权利要求51至52中任一项所述的内酯,其中四个---独立地为E或Z双键,并且其余的___为单键。
58.根据权利要求18至19和54至57中任一项所述的方法,或根据权利要求51至52和54至57中任一项所述的内酯,其中每个双键(如果存在)为Z双键。
59.根据权利要求18至19和54至57中任一项所述的方法,或根据权利要求51至52和54至57中任一项所述的内酯,其中每个双键(如果存在)为E双键。
60.根据权利要求18至19和54至59中任一项所述的方法,或根据权利要求51至52和54至59中任一项所述的内酯,其中所述内酯不包含C=C=C、C=C≡C和C≡C=C中的任一者。
61.根据权利要求18至19和53至60中任一项所述的方法,或根据权利要求51至60中任一项所述的内酯,其中k为8、9、10、11、12、13或15。
62.根据权利要求1至61中任一项所述的方法,或根据权利要求51至61中任一项所述的内酯,其中所述内酯具有下式:
63.根据权利要求1至61中任一项所述的方法,或根据权利要求51至61中任一项所述的内酯,其中所述内酯具有下式:
/>
64.根据权利要求1至61中任一项所述的方法,或根据权利要求51至61中任一项所述的内酯,其中所述内酯具有下式:
/>
65.根据权利要求18至64中任一项所述的方法,或根据权利要求51至64中任一项所述的内酯,其中所述所述手性碳原子具有S构型。
66.根据权利要求18至63中任一项所述的方法,或根据权利要求51至64中任一项所述的内酯,其中所述所述手性碳原子具有R构型。
67.一种混合物,即两种或更多种根据权利要求51至66中任一项所述的内酯的混合物。
68.一种组合物,所述组合物包含根据权利要求51至66中任一项所述的内酯或根据权利要求67所述的混合物。
69.根据权利要求68所述的组合物还包含美容上可接受的赋形剂。
70.一种通过权利要求1至66中任一项所述的方法产生的内酯。
CN202280034158.3A 2021-03-09 2022-03-09 从脂肪酸中生物合成产生大环麝香内酯 Pending CN118119716A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US63/158843 2021-03-09
US63/182242 2021-04-30

Publications (1)

Publication Number Publication Date
CN118119716A true CN118119716A (zh) 2024-05-31

Family

ID=

Similar Documents

Publication Publication Date Title
Liebergesell et al. Cloning and nucleotide sequences of genes relevant for biosynthesis of poly (3‐hydroxybutyric acid) in Chromatium vinosum strain D
JP5936601B2 (ja) alkL遺伝子産物を用いた生体触媒による酸化法
JP7270301B2 (ja) ガンマラクトンの生合成生産
US20220112526A1 (en) Biosynthesis of vanillin from isoeugenol
CN113557259B (zh) 使用具有亚末端羟化酶活性的细胞色素P450酶生物合成生产γ-内酯和δ-内酯
US20220112525A1 (en) Biosynthesis of vanillin from isoeugenol
US11345907B2 (en) Method for producing albicanol compounds
CN110396507B (zh) 源自Cnuibacter physcomitrellae的L-泛解酸内酯脱氢酶
WO2007147256A1 (en) Fatty acid hydroxylases and uses thereof
CN106754818B (zh) 一种耐热酯酶突变体及其制备方法和应用
Jong-Won et al. Characterization of styrene catabolic genes of Pseudomonas putida SN1 and construction of a recombinant Escherichia coli containing styrene monooxygenase gene for the production of (S)-styrene oxide
Summers et al. E. coli cells expressing the Baeyer–Villiger monooxygenase ‘MO14’(ro 03437) from Rhodococcus jostii RHA1 catalyse the gram-scale resolution of a bicyclic ketone in a fermentor
US10036047B2 (en) Methods for hydroxylating phenylpropanoids
CN118119716A (zh) 从脂肪酸中生物合成产生大环麝香内酯
JP2024509930A (ja) 脂肪酸からの大環状ムスクラクトンの生合成生成
JP6034332B2 (ja) 組換え微生物及び当該組換え微生物を用いた物質製造方法
US20240052380A1 (en) Biosynthesis of vanillin from isoeugenol
US20240052381A1 (en) Biosynthesis of vanillin from isoeugenol
CN116286698A (zh) 一种l-泛解酸内酯脱氢酶、其表达载体以及其共表达工程菌在d-泛解酸内酯合成中的应用
JP2010110233A (ja) ニトロレダクターゼを用いたカルボニル化合物の製造法

Legal Events

Date Code Title Description
PB01 Publication