多不饱和脂肪酸合酶核酸分子和多肽,及其组合物、制备方法和用途
发明背景
发明领域
本发明涉及参与PUFA生产的多不饱和脂肪酸(PUFA)合酶的分离的核酸分子和多肽,其中所述PUFA包括富含二十二碳六烯酸(DHA),二十碳五烯酸(EPA)或其组合的PUFA。本发明涉及含有所述核酸分子和所述核酸分子编码的多肽的载体和宿主细胞,含有所述核酸分子或多肽的组合物,及其制备方法和用途。
发明背景
破囊壶菌是破囊壶菌目的微生物,包括破囊壶菌属(Thraustochytrium)和裂殖壶菌属(Schizochytrium),被认为是PUFA的替代来源。参见例如,美国专利号5,130,242。近来发现海洋细菌和破囊壶菌中的聚酮化合物合酶(PKS)样系统能从乙酰基-CoA和丙二酰CoA合成多不饱和脂肪酸(PUFA)。本文中这些PKS合酶样系统也称作PUFA合酶系统。美国专利6,140,486描述了海洋细菌希瓦氏菌(Shewanella)和海水螺菌(Vibrio marinus)中的PUFA系统。美国专利6,566,583中描述了破囊壶菌裂殖壶菌属中的PUFA合酶系统。美国专利7,247,461描述了裂殖壶菌属(Schizochytrium)和破囊壶菌属(Thraustochytrium)的破囊壶菌中的PUFA合酶系统。美国专利7,211,418描述了破囊壶菌属的破囊壶菌的PUFA合酶系统,及使用该系统产生二十碳五烯酸(C20:5,Ω3)(EPA)和其他PUFA。美国专利7,217,856描述了奥利那希瓦氏菌(Shewanella olleyana)和日本希瓦氏菌(Shewanella japonica)中的PUFA合酶。WO 2005/097982描述了SAM2179菌株中的PUFA合酶。美国专利7,208,590和7,368,552描述了来自金黄色破囊壶菌(Thraustochytrium aureum)的PUFA合酶基因和蛋白质。
文献经典描述的PKS系统无非三种基本类型之一,通常称作I型(模块化或迭代)、II型和III型。I型模块PKS系统也称作“模块”PKS系统,I型迭代PKS系统也称作“I型”PKS系统。II型系统的特征是可分离的蛋白质,它们中的每一个都执行不同的酶反应。酶协同工作产生终产物,系统中的每种酶在终产物的产生中参与数次。这种类型的系统与植物和细菌中的脂肪酸合酶(FAS)系统的操作方式相似。I型迭代PKS系统与II型系统相似,因为酶以迭代方式用于产生终产物。I型迭代系统与II型系统的区别在于,其酶活不与可分离的蛋白质相关联,而存在于较大蛋白的结构域中。该系统与动物和真菌中的I型FAS系统类似。
与II型系统不同,I型模块PKS系统的每一酶结构域在产生终产物的过程中仅使用一次。结构域存在于非常大的蛋白质中,并且每一反应的产物传递至PKS蛋白质的另一结构域。
最近发现的III型系统属于植物缩合酶中的查耳酮合酶家族。III型PKS不同于I型和II型PKS系统,其通常利用游离CoA底物以迭代缩合反应产生杂环终产物。
在PUFA合成的常规或标准途径中,通过一系列的延伸和去饱和反应对中等链长的饱和脂肪酸(脂肪酸合酶(FAS)系统的产物)进行修饰。延伸反应的底物是脂肪酰基-CoA(待延伸的脂肪酸链)和丙二酰-CoA(在每一延伸反应中加入的两个碳的来源)。延伸酶反应的产物是线性链中加入两个碳的脂肪酰基-CoA。去饱和酶通过在氧依赖性反应中提取两个氢在存在的脂肪酸链中产生顺式双键。去饱和酶的底物是酰基辅酶A(在某些动物中)或酯化成磷脂(如磷脂酰胆碱)甘油主链的脂肪酸。
依照脂肪酸的碳链长度和饱和特征对其进行分类。按照链中碳的数目可分为短链、中链或长链脂肪酸,当碳原子间没有双键时称为饱和脂肪酸,存在双键时则称为不饱和脂肪酸。当仅有一个双键存在时,不饱和长链脂肪酸是单不饱和的,当存在多于一个双键时则是多不饱和的。
按照脂肪酸甲基端的第一个双键的位置对PUFA进行归类:ω-3(n-3)脂肪酸在第三个碳上含有第一个双键,而ω-6(n-6)脂肪酸则在第六个碳上含有第一个双键。例如,二十二碳六烯酸(“DHA”)是链长22个碳,含有6个双键的ω-3PUFA,通常记作“22:6 n-3”。其他ω-3 PUFA包括记作“20:5 n-3”的二十碳五烯酸(“EPA”)和记作“22:5 n-3”的ω-3二十二碳五烯酸(“DPA n-3”)。DHA和EPA称作“必需”脂肪酸。ω-6 PUFA包括记作“20:4 n-6”的花生四烯酸(″ARA″),记作“22:5 n-6”的ω-6二十二碳五烯酸(“DPA n-6”)。
由于出现于细胞膜上,ω-3脂肪酸是影响细胞生理功能的重要生物学分子,它能调节生物活性化合物的产生和基因表达,并作为生物合成的底物。Roche,H.M.,Proc.Nutr.Soc.58:397-401(1999)。例如DHA,约占人大脑皮层中脂质的15%-20%,视网膜脂质的30%-60%,在睾丸和精子中富集,是母乳中的重要成分。Bergé,J.P.,和Barnathan,G.Adv.Biochem.Eng.Biotechnol.96:49-125(2005)。DHA占脑中ω-3脂肪酸的多达97%,占视网膜中ω-3脂肪酸的多达93%。而且,DHA是胎儿和婴儿发育,以及成人认知功能的维持所必需的。同上。因为在人体中ω-3脂肪酸并非从头合成,因此这些脂肪酸必需来源于营养成分。
亚麻籽油和鱼油是公认的ω-3脂肪酸的良好膳食来源。亚麻籽油不包含EPA、DHA、DPA或ARA,而包含使身体制造EPA的基础成分亚麻酸(C18:3n-3)。然而,有证据表明其代谢转化速率缓慢且不同,尤其是健康受损患者中。鱼油中脂肪酸组成的类型和含量存在显著差异,这取决于具体的物种及其饮食。例如,水产养殖鱼比野生鱼类的ω-3脂肪酸含量低。而且,鱼油有包含环境污染物的风险,且有稳定性问题和鱼的气味或味道。
破囊壶菌产生的油类与对应的鱼油或细菌油类相比常常具有更简单的多不饱和脂肪酸分布。Lewis,T.E.,Mar.Biotechnol.1:580-587(1999)。有报道称破囊壶菌菌株产生的ω-3脂肪酸占该有机体产生的总脂肪酸的比例高。美国专利5,130,242;Huang,J.等,J.Am.Oil.Chem.Soc.78:605-610(2001);Huang,J.等,Mar.Biotechnol.5:450-457(2003)。然而,分离的破囊壶菌所产生的PUFA种类和数量不同,因此之前描述的一些菌株可具有不期望的PUFA分布特征。
通过对内源产生的脂肪酸进行修饰从而在油籽作物中产生PUFA。对具有脂肪酸延伸酶和去饱和酶的不同个体基因的植物进行遗传修饰,产生包含可检测水平的PUFA如EPA的叶子或种子,但也包含显著水平的混合短链和较少不饱和PUFA(Qi等,Nature Biotech.22:739(2004);PCT公开号WO 04/071467;Abbadi等,PlantCell 16:1(2004));Napier和Sayanova,Proc.Nutrition Society64:387-393(2005);Robert等,Functional Plant Biology 32:473-479(2005);和美国申请公开号2004/0172682)。
因此,还需要对与期望PUFA分布相关的核酸分子和多肽进行分离,以及通过使用所述核酸分子和多肽产生所需PUFA分布的方法。
发明概述
本发明涉及分离的核酸分子,其选自下组:(a)包含与SEQ ID NO:1至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有多不饱和脂肪酸(PUFA)合酶活性的多肽,所述活性选自β-酮酰-ACP合酶(KS)活性、丙二酰CoA:ACP酰基转移酶(MAT)活性、酰基运载体蛋白(ACP)活性、酮还原酶(KR)活性、β-羟酰基-ACP脱水酶(DH)活性及其组合;
(b)包含与SEQ ID NO:7至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽;
(c)包含与SEQ ID NO:9至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有MAT活性的多肽;
(d)包含与SEQ ID NO:13、15、17、19、21或23中任一项至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽;
(e)包含与SEQ ID NO:11至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽;
(f)包含与SEQ ID NO:25至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KR活性的多肽;以及
以及(g)包含与SEQ ID NO:27至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:1、7、9、11、13、15、17、19、21、23、25和27至少90%或至少95%相同。在一些实施方式中,所述核酸分子分别包含SEQ ID NO:1、7、9、11、13、15、17、19、21、23、25和27的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:2至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQID NO:8至少80%相同的氨基酸序列,并且所述多肽含有KS活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQID NO:10至少80%相同的氨基酸序列,并且所述多肽含有MAT活性;
(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含与SEQ IDNO:14、16、18、20或24中任一项至少80%相同的氨基酸序列,并且所述多肽含有ACP活性;
(e)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQID NO:12至少80%相同的氨基酸序列,并且所述多肽含有ACP活性;
(f)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQID NO:26至少80%相同的氨基酸序列,并且所述多肽含有KR活性;
以及(g)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:28至少80%相同的氨基酸序列,并且所述多肽含有DH活性。在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:2、8、10、12、14、16、18、20、22、24、26和28至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:2、8、10、12、14、16、18、20、22、24、26和28的氨基酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有与SEQ ID NO:3至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码包含选自KS活性、链长因子(CLF)活性、酰基转移酶(AT)活性、烯酰-ACP还原酶(ER)活性及其组合的PUFA合酶活性的多肽;
(b)包含与SEQ ID NO:29至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽;
(c)包含与SEQ ID NO:31至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有CLF活性的多肽;
(d)包含与SEQ ID NO:33至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有AT活性的多肽;以及
以及(e)包含与SEQ ID NO:35至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽。在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:3、29、31、33和35至少90%或者95%相同。在一些实施方式中,所述核酸分子分别包含SEQ ID NO:3、29、31、33和35的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:4至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:30至少80%相同的氨基酸序列,并且所述多肽含有KS活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:32至少80%相同的氨基酸序列,并且所述多肽含有CLF活性;
(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:34至少80%相同的氨基酸序列,并且所述多肽含有AT活性;
以及(e)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:36至少80%相同的氨基酸序列,并且所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:4、30、32、34和36至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:4、30、32、34和36的氨基酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)包含与SEQ ID NO:5至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码包含选自DH活性、ER活性及其组合的PUFA合酶活性的多肽;
(b)包含与SEQ ID NO:37至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽;
(c)包含与SEQ ID NO:39至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽;
以及(d)包含与SEQ ID NO:41至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽;在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:5、37、39和41至少90%或者95%相同。在一些实施方式中,所述核酸分子分别包含SEQ ID NO:5、37、39和41的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:6至少80%相同的氨基酸序列,并且所述多肽含有选自DH活性、ER活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:38至少80%相同的氨基酸序列,并且所述多肽含有DH活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:40至少80%相同的氨基酸序列,并且所述多肽含有DH活性;
以及(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:42至少80%相同的氨基酸序列,并且所述多肽含有ER活性;在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:6、38、40和42至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:6、38、40和42的氨基酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有与SEQ ID NO:68或120至少80%相同的核苷酸序列的核酸分子,其中所述多核苷酸编码包含选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性的多肽;
(b)包含与SEQ ID NO:74至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽;
(c)包含与SEQ ID NO:76至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有MAT活性的多肽;
(d)包含与SEQ ID NO:80、82、84、86、88、90、92、94、96或98至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽;
(e)包含与SEQ ID NO:78至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽;
(f)包含与SEQ ID NO:100至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KR活性的多肽;以及
以及(g)包含与SEQ ID NO:118至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:68、74、76、78、80、82、84、86、88、90、92、94、96、98、100、118和120至少90%或者95%相同。在一些实施方式中,所述核酸分子包含SEQ ID NO:68、74、76、78、80、82、84、86、88、90、92、94、96、98、100、118和120的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:69至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:75至少80%相同的氨基酸序列,并且所述多肽含有KS活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:77至少80%相同的氨基酸序列,并且所述多肽含有MAT活性;
(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:81、83、87、89、91、93、95、97或99至少80%相同的氨基酸序列,并且所述多肽含有ACP活性;
(e)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:79至少80%相同的氨基酸序列,并且所述多肽含有ACP活性;
(f)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:101至少80%相同的氨基酸序列,并且所述多肽含有KR活性;
以及(g)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:119至少80%相同的氨基酸序列,并且所述多肽含有DH活性。在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:69、75、77、79、81、83、85、87、89、91、93、95、97、99、101和119至少90%或者95%相同。在一些实施方式中,所述多肽包含SEQ ID NO:69、75、77、79、81、83、85、87、89、91、93、95、97、99、101和119的氨基酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)包含与SEQ ID NO:70或SEQ ID NO:121至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码多肽包含选自KS活性、链长因子(CLF)活性、酰基转移酶(AT)活性、烯脂酰还原酶(ER)活性及其组合的PUFA合酶活性;
(b)包含与SEQ ID NO:102至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽;
(c)包含与SEQ ID NO:104至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有CLF活性的多肽;
(d)包含与SEQ ID NO:106至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有AT活性的多肽;以及
以及(e)包含与SEQ ID NO:108至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽。在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:70、102、104、106、108和121至少90%或者95%相同。在一些实施方式中,所述核酸分子分别包含SEQ ID NO:70、102、104、106、108和121的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:71至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:103至少80%相同的氨基酸序列,并且所述多肽含有KS活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:105至少80%相同的氨基酸序列,并且所述多肽含有CLF活性;
(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:107至少80%相同的氨基酸序列,并且所述多肽含有AT活性;
以及(e)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:109至少80%相同的氨基酸序列,并且所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:71、103、105、107和109至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ IDNO:71、103、105、107和109的氨基酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有与SEQ ID NO:72或122至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码包含选自DH活性、ER活性及其组合的PUFA合酶活性的多肽;
(b)包含与SEQ ID NO:110至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽;
(c)包含与SEQ ID NO:112至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽;
以及(d)包含与SEQ ID NO:114至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽。在一些实施方式中,所述多核苷酸序列分别与SEQ ID NO:72、110、112、114和122至少90%或者95%相同。在一些实施方式中,所述核酸分子分别包含SEQ ID NO:72、110、112、114和122的多核苷酸序列。
本发明涉及分离的核酸分子,其选自下组:(a)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:73至少80%相同的氨基酸序列,并且所述多肽含有选自DH活性、ER活性及其组合的PUFA合酶活性;
(b)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:111至少80%相同的氨基酸序列,并且所述多肽含有DH活性;
(c)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQID NO:113至少80%相同的氨基酸序列,并且所述多肽含有DH活性;
以及(d)含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:115至少80%相同的氨基酸序列,并且所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ ID NO:73、111、113和115至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:73、111、113和115的氨基酸序列。
本发明涉及包含编码多肽的多核苷酸序列的分离的核酸分子,所述多肽包含选自KS活性、MAT活性、ACP活性、KR活性、CLF活性、AT活性、ER活性、DH活性及其组合的PUFA合酶活性,其中所述多核苷酸在严谨条件下与上述任何多核苷酸序列的互补序列杂交。
本发明涉及含有多核苷酸序列的分离的核酸分子,所述多核苷酸序列与上述任何多核苷酸序列完全互补。
本发明涉及包含上述任何核酸分子及其组合以及转录控制序列的重组核酸分子。在一些实施方式中,所述重组核酸分子是重组载体。
本发明涉及表达上述任何核酸分子、上述任何重组核酸分子及其组合的宿主细胞。在一些实施方式中,所述宿主细胞选自植物细胞、微生物细胞和动物细胞。在一些实施方式中,所述微生物细胞是细菌。在一些实施方式中,所述细菌是大肠杆菌(E.coli)。在一些实施方式中,所述细菌是海洋细菌。在一些实施方式中,所述微生物细胞是破囊壶菌。在一些实施方式中,所述破囊壶菌是裂殖壶菌属(Schizochytrium)。在一些实施方式中,所述破囊壶菌是破囊壶菌属(Thraustochytrium)。在一些实施方式中,所述破囊壶菌是吾肯氏壶菌属(Ulkenia)。
本发明涉及产生至少一种PUFA的方法,包括:在能有效产生PUFA的条件下,于宿主细胞中表达PUFA合酶基因,其中所述PUFA合酶基因包含任何上述分离的核酸分子,任何上述重组核酸分子或其组合,以及产生至少一种PUFA。在本实施方式的一个方面,所述宿主细胞选自植物细胞、分离的动物细胞和微生物细胞。在本实施方式的另一方面,至少一种PUFA包含二十二碳六烯酸(DHA)或二十碳五烯酸(EPA)。
本发明涉及一种产生富含DHA、EPA或其组合的脂质的方法,包括:在能有效产生脂质的条件下,于宿主细胞中表达PUFA合酶基因,其中所述PUFA合酶基因包含任何上述分离的核酸分子,任何上述重组核酸分子或其组合,并且产生富含DHA、EPA或其组合的脂质。本发明涉及产生重组载体的方法,包括将任何一种上述分离的核酸分子插入载体。
本发明涉及产生重组宿主细胞的方法,包括将上述重组载体引入宿主细胞。在一些实施方式中,所述宿主细胞选自植物细胞、分离的动物细胞和微生物细胞。
本发明涉及上述任何多核苷酸序列编码的分离多肽。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:2至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:8至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性;
(c)含有与SEQ ID NO:10至少80%相同的氨基酸序列的多肽,其中所述多肽含有MAT活性;
(d)含有与SEQ ID NO:14、16、18、20或24中任一项至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性;
(e)含有与SEQ ID NO:12至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性;
(f)含有与SEQ ID NO:26至少80%相同的氨基酸序列的多肽,其中所述多肽含有KR活性;并且
以及(g)含有与SEQ ID NO:28至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:2、8、10、12、14、16、18、20、22、24、26和28至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:2、8、10、12、14、16、18、20、22、24、26和28的氨基酸序列。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:4至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:30至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性;
(c)含有与SEQ ID NO:32至少80%相同的氨基酸序列的多肽,其中所述多肽含有CLF活性;
(d)含有与SEQ ID NO:34至少80%相同的氨基酸序列的多肽,其中所述多肽含有AT活性;并且
以及(e)含有与SEQ ID NO:36至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:4、30、32、34和36至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:4、30、32、34和36的氨基酸序列。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:6至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自DH活性、ER活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:38至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性;
(c)含有与SEQ ID NO:40至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性;
以及(e)含有与SEQ ID NO:42至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:6、38、40和42至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:6、38、40和42的氨基酸序列。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:69至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:75至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性;
(c)含有与SEQ ID NO:77至少80%相同的氨基酸序列的多肽,其中所述多肽含有MAT活性;
(d)含有与SEQ ID NO:81、83、85、87、89、91、93、95、97或99中任一项至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性;
(e)含有与SEQ ID NO:79至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性;
(f)含有与SEQ ID NO:101至少80%相同的氨基酸序列的多肽,其中所述多肽含有KR活性;并且
以及(g)含有与SEQ ID NO:119至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:69、75、77、79、81、83、85、87、89、91、93、95、97、99、101和119至少90%或者95%相同。在一些实施方式中,所述多肽包含SEQ ID NO:69、75、77、79、81、83、85、87、89、91、93、95、97、99、101和119的氨基酸序列。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:71至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:103至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性;
(c)含有与SEQ ID NO:105至少80%相同的氨基酸序列的多肽,其中所述多肽含有CLF活性;
(d)含有与SEQ ID NO:107至少80%相同的氨基酸序列的多肽,其中所述多肽含有AT活性;并且
以及(e)含有与SEQ ID NO:109至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:71、103、105、107和109至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:71、103、105、107和109的氨基酸序列。
本发明涉及分离多肽,其选自下组:(a)含有与SEQ ID NO:73至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自DH活性、ER活性及其组合的PUFA合酶活性;
(b)含有与SEQ ID NO:111至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性;
(c)含有与SEQ ID NO:113至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性;
以及(e)含有与SEQ ID NO:115至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。在一些实施方式中,所述氨基酸序列分别与SEQ IDNO:73、111、113和115至少90%或者95%相同。在一些实施方式中,所述多肽分别包含SEQ ID NO:73、111、113和115的氨基酸序列。
在一些实施方式中,任何本发明的分离多肽可以是融合多肽。
本发明涉及包含上述任何多肽和生物学可接受运载体的组合物。
本发明涉及一种在具有PUFA合酶活性的有机体中增加DHA、EPA或其组合产量的方法,包括:在可有效产生DHA、EPA或其组合的条件下,于有机体中,表达上述任何分离的核酸分子,上述任何的重组核酸分子,或其组合,其中PUFA合酶活性在有机体中取代失活或缺失的活性、引入新活性或增强已有活性,其中有机体中DHA、EPA或其组合的产量是增加的。
本发明涉及从宿主细胞中分离脂质的方法:包括(a)在能有效产生脂质的条件下,于宿主细胞中表达PUFA合酶基因,其中所述PUFA合酶基因包含任何上述分离的核酸分子、任何上述重组核酸分子或其组合,和(b)从所述宿主细胞中分离脂质。在一些实施方式中,所述宿主细胞选自植物细胞、分离的动物细胞和微生物细胞。在一些实施方式中,所述脂质包括DHA、EPA或其组合。
附图简要说明
图1显示本发明中裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 PUFA合酶的基因结构。
图2显示本发明中破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 PUFA合酶的基因结构。
图3显示本发明中裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695和破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 PUFA合酶,以及来自裂殖壶菌(Schizochytrium sp.)ATCC 20888、破囊壶菌(Thraustochytrium sp)ATCC20892、金黄色破囊壶菌(Thraustochytrium aureum)和SAM2179的合酶的结构域结构。
图4显示本发明裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa1p氨基酸序列(SEQ ID NO:2)和破囊壶菌(Thraustochytrium sp)ATCC PTA-10212Pfa1p氨基酸序列(SEQ ID NO:69)与来自裂殖壶菌(Schizochytrium sp.)ATCC20888(SEQ ID NO:54)和破囊壶菌(Thraustochytrium sp)ATCC 20892(SEQ IDNO:56)的OrfA序列以及来自金黄色破囊壶菌(Thraustochytrium aureum)的ORF A序列(SEQ ID NO:55)的比对。
图5显示本发明裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa2p氨基酸序列(SEQ ID NO:4)和破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 Pfa2p氨基酸序列(SEQ ID NO:71)与来自裂殖壶菌(Schizochytrium sp.)ATCC20888(SEQ ID NO:57)与破囊壶菌(Thraustochytrium sp)ATCC 20892(SEQ IDNO:58)的OrfB序列以及来自金黄色破囊壶菌(Thraustochytrium aureum)的ORFB序列(SEQ ID NO:59)的比对。
图6显示本发明裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3p氨基酸序列(SEQ ID NO:6)和破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 Pfa3p氨基酸序列(SEQ ID NO:73)与来自裂殖壶菌(Schizochytrium sp.)ATCC20888(SEQ ID NO:61)与破囊壶菌(Thraustochytrium sp)ATCC 20892(SEQ IDNO:60)的ORF C序列的比对。
图7显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 PFA1的多核苷酸序列(SEQ ID NO:1)。
图8显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa1p的氨基酸序列(SEQ ID NO:2)。
图9显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 PFA2的多核苷酸序列(SEQ ID NO:3)。
图10显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa2p的氨基酸序列(SEQ ID NO:4)。
图11显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 PFA3的多核苷酸序列(SEQ ID NO:5)。
图12显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3p的氨基酸序列(SEQ ID NO:6)。
图13显示裂殖壶菌(Schizochytrium sp.)ATCC PTA-10212 PFA1的多核苷酸序列(SEQ ID NO:68)。
图14显示为在裂殖壶菌中表达进行密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212PFA1的多核苷酸序列(SEQ ID NO:120)。
图15显示破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 Pfa1p的氨基酸序列(SEQ ID NO:69)。
图16显示破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 PFA2的多核苷酸序列(SEQ ID NO:70)。
图17显示为在裂殖壶菌中表达进行密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 PFA2的多核苷酸序列(SEQ ID NO:121)。
图18显示破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 Pfa2p的氨基酸序列(SEQ ID NO:71)。
图19显示破囊壶菌(Thraustochytrium sp)ATCC PTA-10212 PFA3的多核苷酸序列(SEQ ID NO:72)。
图20显示为在裂殖壶菌中表达进行密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 PFA3的多核苷酸序列(SEQ ID NO:122)。
图21显示破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 Pfa3p的氨基酸序列(SEQ ID NO:73)。
图22显示裂殖壶菌的密码子使用表。
发明详述
本发明涉及参与PUFA产生的多不饱和脂肪酸(PUFA)合酶的分离的核酸分子和多肽,所述PUFA包括富含二十二碳六烯酸(DHA)、二十碳五烯酸(EPA)及其组合的PUFA。本发明涉及包含所述核酸分子和所述核酸分子编码的多肽的载体和宿主细胞,包含所述核酸分子或多肽的组合物及其制备方法和用途。
PUFA合酶
如本文所用术语“PUFA合酶”指参与多不饱和脂肪酸产生的酶。参见例如,Metz等,Science 293:290-293(2001).
本发明部分涉及三个名为Pfa1p(SEQ ID NO:2或SEQ ID NO:69)、Pfa2p(SEQ ID NO:4或SEQ ID NO:71)和Pfa3p(SEQ ID NO:6或SEQ ID NO:73)的PUFA合酶亚基,以及编码名为PFA1(SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120)、PFA2(SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121)和PFA3(SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122)亚基的基因。参见图1-3和7-21。其他破囊壶菌的PUFA合酶分别记作ORF 1、ORF 2和ORF 3,或OrfA、OrfB、和OrfC。参见美国专利号7,247,461和7,256,022中的裂殖壶菌(Schizochytrium sp.)(ATCC 20888)和破囊壶菌(Thraustochytriumsp.)(ATCC 20892)中记作orfA、orfB和orfC基因以及对应的OrfA、OrfB和OrfC蛋白,以及美国专利号7,368,552中的金黄色破囊壶菌(Thraustochytriumaureum)(ATCC 34304)中记作ORF A、ORF B和ORF C基因和蛋白质。参见WO/2005/097982中的SAM2179菌株,记作ORF 1、ORF 2和ORF 3基因和蛋白质。
核酸分子
本发明涉及包含PUFA合酶基因多核苷酸序列的分离的核酸分子,以及来源于分离的微生物的结构域,它是2009年3月19日提交的共待审美国申请号12/407,687的主题,将其整体纳入作参考。该微生物于2009年1月7日保存在布达佩斯条约下的美国典型培养物保藏中心,专利保藏处,大学大道10801号,马纳萨斯,VA20110-2209(American Type Culture Collection,PatentDepository,10801 University Boulevard,Manassas,VA 20110-2209),ATCC登录号PTA-9695,也被称为裂殖壶菌(Schizochytrium sp)ATCC PTA-9695。这些基因表达产生独特的脂肪酸分布,部分特征是高水平的ω-3脂肪酸,尤其是高水平的DHA。
本发明涉及包含PUFA合酶基因多核苷酸序列的分离的核酸分子,以及来源于分离的微生物的结构域,它是2010年1月19日提交的美国申请号61/296,456的主题,将其整体纳入作参考。该微生物于2009年7月14日保存在布达佩斯条约下的美国典型培养物保藏中心,专利登记,大学大道10801号,马纳萨斯,VA20110-2209(American Type Culture Collection,PatentDepository,10801 University Boulevard,Manassas,VA 20110-2209),ATCC登录号PTA-10212,也被称为在破囊壶菌(Thraustochytrium sp)ATCC PTA-10212。这些基因表达产生独特的脂肪酸分布,其部分特征是高水平的ω-3脂肪酸,尤其是高水平的DHA、EPA及其组合。
如本文所用“多核苷酸”可包含常规磷酸二酯键或非常规键(如酰胺键,如肽核酸(PNA)中的酰胺键)。多核苷酸可包含全长cDNA序列的核苷酸序列,包括未翻译的5′和3′序列,编码序列,以及片段、表位、结构域和核酸序列变体。多核苷酸可由任何多核糖核苷酸或多脱氧核糖核苷酸组成,可以是未修饰的RNA或DNA或修饰的RNA或DNA。例如,多核苷酸可由单链或双链DNA、单链或双链区混合物DNA、单链或双链RNA、单链或双链区混合物RNA、包含单链或更典型双链或者单链区和双链区混合物的DNA和RNA的杂交分子组成。此外,多核苷酸可由包含RNA或DNA或RNA和DNA的三链区组成。多核苷酸可包含核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)或任何其磷酸酯类似物,如硫代磷酸酯和硫酯。多核苷酸还可包含一个或多个修饰的碱基或为了稳定性或其它原因修饰的DNA或RNA主链。“修饰的”碱基包括,例如三苯甲基碱基和非常见碱基如次黄嘌呤核苷。可对DNA和RNA进行多种修饰;因此“多核苷酸”涵盖化学、酶或代谢修饰形式。术语核酸分子仅仅指分子的一级和二级结构,不限定任何特定三级形式。因此,该术语包含双链DNA,尤其是线状或环状DNA分子(如限制性片段)、质粒和染色体中的双链DNA等。当讨论特殊双链DNA分子的结构时,本文可以按普通常规描述序列,仅在沿非转录的DNA链的5′到3′方向上给出序列(即具有mRNA同源序列的链)。
术语“分离的”核酸分子指从天然环境中移出的核酸分子,DNA或RNA。分离的核酸分子的其它例子包括含有异源宿主细胞中维持的重组多核苷酸或溶液中的纯化(部分或基本全部)的多核苷酸的核酸分子。分离的RNA分子包括本发明多核苷酸的体内或体外RNA转录物。根据本发明,分离的核酸分子还包括合成产生的此类分子。此外,核酸分子或多核苷酸可包括调控元件,如启动子,核糖体结合位点,或转录终止子。
“基因”指编码多肽的核苷酸的组装,包括cDNA和基因组DNA核酸。“基因”还指表达特定蛋白质的核酸片段,包括各编码片段(外显子)间的间隔序列(内含子),以及编码序列前(5’非编码序列)后(3’非编码序列)的调控序列。“天然基因”指自然存在具有自身调控序列的基因。
本发明涉及包含与裂殖壶菌ATCC PTA-9695 PFA1(SEQ ID NO:1)、裂殖壶菌ATCC PTA-9695 PFA2(SEQ ID NO:3)、裂殖壶菌ATCC PTA-9695PFA3(SEQ ID NO:5)、破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:68或SEQ ID NO:120)、破囊壶菌ATCC PTA-10212 PFA2(SEQ ID NO:70或SEQID NO:121)、破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:72或SEQ ID NO:122)的多核苷酸序列至少80%相同的多核苷酸序列及其组合的分离核酸分子,其中所述多核苷酸编码包含一种或多种PUFA合酶活性的多肽。
PUFA合酶活性与每一合酶多肽中的一个或多个结构域相关,其中所述结构域可通过其保守结构或功能性基序与已知基序同源性鉴别,也可基于特定生化活性鉴别。参见例如,美国专利号7,217,856,将其整体纳入本文参考。PUFA合酶结构域的例子包括:Pfa1p中的β-酮酰基ACP合酶(KS)结构域,丙二酰-CoA:ACP酰基转移酶(MAT)结构域,酰基载体蛋白(ACP)结构域,酮还原酶(KR)结构域和β-羟酰基-ACP脱水酶(DH)结构域;Pfa2p中的KS结构域,链长因子(CLF)结构域,酰基转移酶(AT)结构域和烯酰基-ACP还原酶(ER)结构域;Pfa3p中的DH结构域和ER结构域。
具有β-酮酰基-ACP合酶(KS)生物学活性(功能)的多肽或多肽结构域之前被证明能够进行脂肪酸延伸反应循环的最初步骤。术语“β-酮酰基-ACP合酶”与术语“3-酮酰基-ACP合酶”“β-酮酰基-ACP合酶”和“酮酰基ACP合酶”可互换使用。在其它系统中,用于延伸的酰基与半胱氨酸残基在KS活性位点通过硫酯键链接,酰基-KS与丙二酰ACP缩合形成酮酰基-ACP、CO2以及未成键的(“游离的”)KS。在这类系统中,与反应循环的其它多肽相比,KS显示出更强的底物特异性。通过与已知的KS序列同源性,易于鉴定多肽(或多肽的结构域)属于KS家族。
具有丙二酰CoA:ACP酰基转移酶(MAT)活性的多肽或多肽结构域显示能够将丙二酰部分从丙二酰-CoA部分转移到ACP上。术语“丙二酰-CoA:ACP酰基转移酶”与“丙二酰酰基转移酶”可互换使用。除了活性位点基序(GxSxG)外,MAT还具有扩展基序(关键位置的R和Q氨基酸)。通过与已知MAT序列的同源性或扩展基序结构,易于鉴定多肽(或多肽的结构域)属于MAT家族。
具有酰基运载体蛋白质(ACP)活性的多肽或多肽结构域显示能够作为通过硫酯链接至共价结合的辅因子而生长脂肪酰基链的运载体。ACP通常长约80-100个氨基酸,通过将CoA的磷酸泛酰巯基乙胺基部分转移到ACP的高度保守的丝氨酸残基,从而由失活的脱辅基形式转化为活性全蛋白形式。通过硫酯链接,酰基与ACP在磷酸泛酰巯基乙胺基部分的游离末端链接。多种活性位点基序(LGIDS*)的出现也被认为是ACP的特征。活性位点丝氨酸(S*)的功能性已在细菌PUFA合酶中证实(Jiang等,J.Am.Chem.Soc.130:6336-7(2008))。利用放射性泛酰巯基乙胺标记或通过与已知ACP的序列同源性易于鉴定多肽(或多肽结构域)属于ACP家族。
具有脱水酶或脱水酶(DH)活性的多肽或多肽结构域显示能够催化脱水反应。提及DH活性通常指FabA-样β-羟酰基-ACP脱水酶生物学活性。FabA-样β-羟酰基-ACP脱水酶生物学活性从β-酮酰基基-ACP中移除HOH,首先在碳链中产生反式双键。术语“FabA-样β-羟酰基-ACP脱水酶”与术语“FabA-样β-羟酰基-ACP脱水酶”、“β-羟酰基-ACP脱水酶”和“脱水酶”互换使用。PUFA合酶系统的DH结构域与FAS系统相关细菌DH酶(而非其它PKS系统的DH结构域)同源。参见例如,美国专利号7,217,856,将其整体纳入本文参考。细菌DH的一个子集,FabA-样DH,具有顺反异构酶活性(Heath等,J.Biol.Chem.,271,27795(1996))。基于与FabA-样DH蛋白的同源性,一种或全部PUFA合酶系统DH结构域可将顺式双键插入PUFA合酶产物中。多肽或结构域也可具有非FabA-样DH活性,或者非FabA-样β-羟酰基-ACP脱水酶(DH)活性。更具体说,在PUFA合酶DH结构域中鉴定出长约13个氨基酸的保守活性位点基序:LxxHxxxGxxxxP(基序中的L位置也可以是I)。参见例如,美国专利号7,217,856,和Donadio S,Katz L.,Gene 111(1):51-60(1992),将每一纳入整体纳入作参考。在所有已知PUFA合酶序列中的相似区域可以找到该保守基序,可能与非FabA样脱水相关。
具有β-酮酰基-ACP还原酶(KR)活性的多肽或多肽结构域显示能够催化吡啶-核苷酸-依赖的3-酮酰基形式的ACP的还原。术语“β-酮酰基-ACP还原酶”与“酮还原酶”、“3-酮酰基-ACP还原酶”和“酮酰基ACP还原酶”互换使用。在其它系统中确定KR功能包括在从头脂肪酸生物合成延伸循环的第一个还原步骤。通过与已知PUFA合酶KR的序列同源性,易于鉴定多肽(或多肽的结构域)属于KR家族。
具有链长因子(CLF)活性的多肽或多肽结构域之前定义为具有如下一种或多种活性或特征:(1)可确定延伸循环的数目,因此可确定最终产物的链长,
(2)与KS同源,但缺少KS活性位点的半胱氨酸,
(3)可与KS异源二聚化,
(4)可提供最初的酰基进行延伸,
或者(5)可对丙二酸进行脱羧(形成丙二酰-ACP),因此形成能够转移至KS活性位点并可作为进行初始延伸(缩合)反应的“起始”分子的乙酸基团。目前鉴定的所有PUFA合酶系统均含有CLF结构域,并且均为多结构域蛋白质的一部分。通过与已知PUFA合酶CLF的序列同源性,易于鉴定多肽(或多肽的结构域)属于CLF家族。
具有酰基转移酶(AT)活性的多肽或多肽结构域之前定义为具有如下一种或多种活性或特征:(1)可将脂肪酰基基团从ACP结构域转移到水上(即硫酯酶),以游离脂肪酸形式释放脂肪酰基基团,
(2)可将脂肪酰基基团转移到接受体如CoA,
(3)可在不同ACP结构域间转移酰基基团,
或者(4)可将脂肪酰基基团转移到亲脂性接收分子上(如至溶血磷脂酸)。通过与已知PUFA合酶AT的序列同源性,易于鉴定多肽(或多肽的结构域)属于AT家族。
具有烯酰基-ACP还原酶(ER)生物学活性的多肽或多肽结构域之前显示能够还原脂肪酰基-ACP中的反式双键(通过DH活性引入),从而使相关碳饱和。PUFA合酶系统中的ER结构域之前显示与ER酶家族同源(Heath等,Nature 406:145-146(2000),整体纳入作参考),ER同源物显示在体外作为烯酰基-ACP还原酶(Bumpus等.J.Am.Chem.Soc.,130:11614-11616(2008),整体纳入作参考)。术语“烯酰基-ACP还原酶”与“烯酰基还原酶”、“烯酰ACP-还原酶”和“烯酰-ACP还原酶”互换使用。通过与已知PUFA合酶ER的序列同源性,易于鉴定多肽(或多肽的结构域)属于ER家族。
在一些实施方式中,本发明涉及包含多核苷酸序列的核酸分子,所述多核苷酸序列与PFA1(SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同。在一些实施方式中,所述核酸分子包含与PFA1(SEQ ID NO:1、SEQ ID NO:68或SEQ IDNO:120)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同的多核苷酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:7或SEQID NO:74),MAT结构域(SEQ ID NO:9或SEQ ID NO:76),ACP结构域(如SEQ ID NO:13、15、17、19、21、23、80、82、84、86、88、90、92、94、96或98中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQ ID NO:11或SEQ ID NO:78及其部分),KR结构域(SEQ ID NO:25或SEQ ID NO:100),DH结构域(SEQID NO:27或SEQ ID NO:118)及其组合。在一些实施方式中,所述核酸分子包含两种或多种多核苷酸序列,其中至少两种或多种多核苷酸序列各自与PFA1(SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120)中编码一种或多种PUFA合酶结构域的多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120中的相同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120中的不同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120中不同的多核苷酸序列80%相同,与SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120中对应序列的顺序相比,所述至少两种或多种多核苷酸序列在核酸分子中的顺序相同或不同。在一些实施方式中,所述至少两种或多种多核苷酸序列各自与PFA1(SEQID NO:1,SEQ ID NO:68或SEQ ID NO:120)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:7或SEQ ID NO:74),MAT结构域(SEQ ID NO:9或SEQ ID NO:76),ACP结构域(如SEQ ID NO:13、15、17、19、21、23、80、82、84、86、88、90、92、94、96或98中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQ ID NO:11或SEQ ID NO:78及其部分),KR结构域(SEQ ID NO:25或SEQ ID NO:100),DH结构域(SEQ ID NO:27或SEQ ID NO:118)及其组合。在一些实施方式中,所述核酸分子包含PFA1(SEQ ID NO:1、SEQ ID NO:68或SEQ IDNO:120)中编码一种或多种PUFA合酶结构域的一个或多个多核苷酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含多核苷酸序列的核酸分子,所述多核苷酸序列与PFA2(SEQ ID NO:3、SEQ ID NO:70,或SEQ ID NO:121)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同。在一些实施方式中,所述核酸分子包含与PFA2(SEQ ID NO:3、SEQ ID NO:70或SEQ IDNO:121)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同的多核苷酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:29或SEQID NO:102),CLF结构域(SEQ ID NO:31或SEQ ID NO:104),AT结构域(SEQ ID NO:33或SEQ ID NO:106),ER结构域(SEQ ID NO:35或SEQ IDNO:108)及其组合。在一些实施方式中,所述核酸分子包含两种或多种多核苷酸序列,其中所述至少两种或多种多核苷酸序列与PFA2(SEQ ID NO:3、SEQID NO:70或SEQ ID NO:121)中编码一种或多种PUFA合酶结构域的多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:3、SEQ ID NO:70或SEQ IDNO:121中的相同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121中的不同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121中不同的多核苷酸序列80%相同,与SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121中对应序列的顺序相比,所述至少两种或多种多核苷酸序列在核酸分子中的顺序相同或不同。在一些实施方式中,所述至少两种或多种多核苷酸序列各自与PFA2(SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121)中编码一种或多种PUFA合酶结构域的多核苷酸序列80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:29或SEQ ID NO:102),CLF结构域(SEQ ID NO:31或SEQ ID NO:104),AT结构域(SEQ ID NO:33或SEQ ID NO:106),ER结构域(SEQ ID NO:35或SEQ ID NO:108)及其组合。在一些实施方式中,所述核酸分子包含PFA2(SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121)中编码一种或多种PUFA合酶结构域的一个或多个多核苷酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含多核苷酸序列的核酸分子,所述多核苷酸序列与PFA3(SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同。在一些实施方式中,所述核酸分子包含与PFA3(SEQ ID NO:5、SEQ ID NO:72或SEQ IDNO:122)中编码一种或多种PUFA合酶结构域的多核苷酸序列至少80%相同的多核苷酸序列,所述PUFA合酶结构域如DH结构域(SEQ ID NO:37、SEQID NO:39、SEQ ID NO:110或SEQ ID NO:112),ER结构域(SEQ ID NO:41或SEQ ID NO:114)及其组合。在一些实施方式中,所述核酸分子包含两种或多种多核苷酸序列,其中所述至少两种或多种多核苷酸序列与PFA3(SEQ IDNO:5,SEQ ID NO:72或SEQ ID NO:122)中编码一种或多种PUFA合酶结构域的多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122中的相同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与编码一种或多种PUFA合酶结构域的SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122中的不同多核苷酸序列80%相同。在一些实施方式中,所述至少两种或多种多核苷酸序列与SEQ IDNO:5、SEQ ID NO:72或SEQ ID NO:122中不同的多核苷酸序列80%相同,与SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122中对应序列的顺序相比,所述至少两种或多种多核苷酸序列在核酸分子中的顺序相同或不同。在一些实施方式中,所述至少两种或多种多核苷酸序列各自与PFA3(SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122)中编码一种或多种PUFA合酶结构域的多核苷酸序列80%相同,所述PUFA合酶结构域如DH结构域(SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:110或SEQ ID NO:112),ER结构域(SEQID NO:41或SEQ ID NO:114)及其组合。在一些实施方式中,所述核酸分子包含PFA3(SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122)中编码一种或多种PUFA合酶结构域的一个或多个多核苷酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及一种含有与SEQ ID NO:1、SEQ ID NO:68或SEQ ID NO:120至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码包含选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:7或SEQ ID NO:74至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:9或SEQ ID NO:76至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有MAT活性的多肽。
在一些实施方式中,本发明涉及一种包含与SEQ ID NO:13、15、17、19、21、23、80、82、84、86、88、90、92、94、96或98中任一项至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽;
在一些实施方式中,本发明涉及含有与SEQ ID NO:11或SEQ ID NO:78至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ACP活性的多肽。
在一些实施方式中,所述核酸分子包含与SEQ ID NO:11中编码1、2、3、4、5或6个ACP结构域的多核苷酸序列至少80%相同的多核苷酸序列,其中所述多核苷酸序列编码含有与一个或多个ACP结构域相关的ACP活性的多肽。SEQ ID NO:13、15、17、19、21和23是SEQ ID NO:11中编码一个ACP结构域的代表性多核苷酸序列。
在一些实施方式中,所述核酸分子包含与SEQ ID NO:78中编码1、2、3、4、5、6、7、8、9或10个ACP结构域的多核苷酸序列至少80%相同的多核苷酸序列,其中所述多核苷酸序列编码含有与一个或多个ACP结构域相关的ACP活性的多肽。SEQ ID NO:80、82、84、86、88、90、92、94、96和98是SEQ ID NO:78中编码一个ACP结构域的代表性多核苷酸序列。
在一些实施方式中,本发明涉及含有与SEQ ID NO:25或SEQ ID NO:100至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KR活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:27或SEQ ID NO:118至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。
在一些实施方式中,本发明涉及一种含有与SEQ ID NO:3、SEQ ID NO:70或SEQ ID NO:121至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码包含选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:29或SEQ ID NO:102至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有KS活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:31或SEQ ID NO:104至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有CLF活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:33或SEQ ID NO:106至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有AT活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:35或SEQ ID NO:108至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽。
在一些实施方式中,本发明涉及一种含有与SEQ ID NO:5、SEQ ID NO:72或SEQ ID NO:122中任一项至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸编码包含选自DH活性、ER活性及其组合的PUFA合酶活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:37至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:39至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:110至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:112至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有DH活性的多肽。
在一些实施方式中,本发明涉及含有与SEQ ID NO:41或SEQ ID NO:114至少80%相同的多核苷酸序列的核酸分子,其中所述多核苷酸序列编码含有ER活性的多肽。
本发明涉及包含编码多肽的多核苷酸序列的分离的核酸分子,其中所述多肽包含与Pfa1p(SEQ ID NO:2或SEQ ID NO:69),Pfa2p(SEQ ID NO:4或SEQ ID NO:71)或Pfa3p(SEQ ID NO:6或SEQ ID NO:73)的氨基酸序列至少80%相同的氨基酸序列,其中所述多核苷酸编码包含一种或多种PUFA合酶活性的多肽。
本发明涉及包含编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与本发明中PUFA合酶的一个或多个PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列。
在一些实施方式中,本发明涉及包含编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与含一个或多个PUFA合酶结构域的Pfa1p(SEQ ID NO:2或SEQ ID NO:69)内的氨基酸序列至少80%相同的氨基酸序列。在一些实施方式中,所述多肽包含与Pfa1p(SEQ ID NO:2,SEQ ID NO:69)中含有一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:8或SEQ ID NO:75),MAT结构域(SEQ ID NO:10或SEQ ID NO:77),ACP结构域(如SEQ ID NO:14、16、18、20、22、24、81、83、85、87、89、91、93、95、97或99中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQ ID NO:12或SEQ ID NO:79及其部分),KR结构域(SEQ ID NO:26或SEQ ID NO:101),DH结构域(SEQ ID NO:28或SEQ ID NO:119)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ IDNO:2,SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQID NO:2,SEQ ID NO:69)中各自包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中的不同氨基酸序列80%相同,与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:8或SEQ ID NO:75)、MAT结构域(SEQ IDNO:10或SEQ ID NO:77)、ACP结构域(如SEQ ID NOs:14、16、18、20、22、24、81、83、85、87、89、91、93、95、97或99中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQ ID NO:12或SEQ ID NO:79及其部分),KR结构域(SEQID NO:26或SEQ ID NO:101),DH结构域(SEQ ID NO:28或SEQ ID NO:119)及其组合。在一些实施方式中,所述多肽包含Pfa1p(SEQ ID NO:2或SEQID NO:69)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与包含一个或多个PUFA合酶结构域的Pfa2p(SEQ IDNO:4或SEQ ID NO:71)内的氨基酸序列至少80%相同的氨基酸序列。在一些实施方式中,所述多肽包含与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中含有一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:30或SEQ ID NO:103),CLF结构域(SEQ ID NO:32或SEQ ID NO:105),AT结构域(SEQ ID NO:34或SEQ ID NO:107),ER结构域(SEQ ID NO:36或SEQ ID NO:109)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4,SEQ ID NO:71)中的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4,SEQ ID NO:71)中各自包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中的不同氨基酸序列80%相同,与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4或SEQ IDNO:71)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:30或SEQ ID NO:103),CLF结构域(SEQ ID NO:32或SEQ ID NO:105),AT结构域(SEQ ID NO:34或SEQID NO:107),ER结构域(SEQ ID NO:36或SEQ ID NO:109)及其组合。在一些实施方式中,所述多肽包含Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与包含一个或多个PUFA合酶结构域的Pfa3p(SEQ IDNO:6或SEQ ID NO:73)内的氨基酸序列至少80%相同的氨基酸序列。在一些实施方式中,所述多肽包含与Pfa3(SEQ ID NO:6或SEQ ID NO:73)中含有一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如DH结构域(SEQ ID NO:38、SEQ ID NO:40,SEQ IDNO:111或SEQ ID NO:113)、ER结构域(SEQ ID NO:42或SEQ ID NO:115)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6,SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6,SEQ IDNO:73)中各自包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中的不同氨基酸序列80%相同,与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同,所述PUFA合酶结构域如DH结构域(SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:111或SEQ ID NO:113),ER结构域(SEQ ID NO:42或SEQ ID NO:115)及其组合。在一些实施方式中,所述多肽包含Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:2或SEQ ID NO:69至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:8或SEQ ID NO:75至少80%相同的氨基酸序列,并且所述多肽含有KS活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:10或SEQ ID NO:77至少80%相同的氨基酸序列,并且所述多肽含有MAT活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:14、16、18、20、22、24、81、83、87、89、91、93、95、97或99至少80%相同的氨基酸序列,并且所述多肽含有ACP活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:12或SEQ ID NO:79至少80%相同的氨基酸序列,并且所述多肽含有ACP活性。
在一些实施方式中,本发明涉及含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:12至少80%相同的氨基酸序列,并且所述多肽含有ACP活性。在一些实施方式中,所述氨基酸序列与SEQ ID NO:12中包含1、2、3、4、5或6个ACP结构域的氨基酸序列至少80%相同,其中所述多肽包含与一个或多个ACP结构域相关的ACP活性。SEQ ID NO:14、16、18、20、22和24是SEQ ID NO:12中含有单一ACP结构域的代表性氨基酸序列。
在一些实施方式中,本发明涉及含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:79至少80%相同的氨基酸序列,并且所述多肽含有ACP活性。在一些实施方式中,所述氨基酸序列与SEQ ID NO:79中包含1、2、3、4、5、6、7、8、9或10个ACP结构域的氨基酸序列至少80%相同,其中所述多肽包含与一个或多个ACP结构域相关的ACP活性。SEQID NO:81、83、85、87、89、91、93、95、97和99是SEQ ID NO:79中包含单个ACP结构域的代表性氨基酸序列。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:26或SEQ ID NO:101至少80%相同的氨基酸序列,并且所述多肽含有KR活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:28或SEQ ID NO:119至少80%相同的氨基酸序列,并且所述多肽含有DH活性。
在一些实施方式中,本发明涉及含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:4或SEQ ID NO:71至少80%相同的氨基酸序列,并且所述多肽含有选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:30或SEQ ID NO:103至少80%相同的氨基酸序列,并且所述多肽含有KS活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:32或SEQ ID NO:105至少80%相同的氨基酸序列,并且所述多肽含有CLF活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:34或SEQ ID NO:107至少80%相同的氨基酸序列,并且所述多肽含有AT活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:36或SEQ ID NO:109至少80%相同的氨基酸序列,并且所述多肽含有ER活性。
在一些实施方式中,本发明涉及含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽包含与SEQ ID NO:6或SEQ ID NO:73相同至少80%的氨基酸序列,并且所述多肽含有选自DH活性、ER活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:38至少80%的氨基酸序列,并且所述多肽含有DH活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:40至少80%相同的氨基酸序列,并且所述多肽含有DH活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:111至少80%相同的氨基酸序列,并且所述多肽含有DH活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:113至少80%相同的氨基酸序列,并且所述多肽含有DH活性。
在一些实施方式中,本发明涉及一种含有编码多肽的多核苷酸序列的核酸分子,其中所述多肽含有与SEQ ID NO:42或SEQ ID NO:115至少80%相同的氨基酸序列,并且所述多肽含有ER活性。
在一些实施方式中,所述核酸分子包含与本文报道的多核苷酸序列至少约80%、85%或90%相同,或者与本文报道的多核苷酸序列至少约95%、96%、97%、98%、99%或100%相同的多核苷酸序列。本领域所知术语“相同性百分数”指,通过序列比较确定两条或多条氨基酸序列或两条或多条核苷酸序列之间的关系。本领域中“相同”也指氨基酸或多核苷酸序列之间序列相关的程度,视情况通过此类序列字串之间配对进行确定。
例如,核酸分子的多核苷酸序列与本发明的对照多核苷酸序95%“相同”,是指核酸分子的多核苷酸序列与对照序列相同,除了所述多核苷酸序列在每100个核苷酸中有多至5个核苷酸不同于对照多核苷酸序列。换言之,为了获得与对照多核苷酸序列至少95%相同的多核苷酸序列,对照序列中多至5%的核苷酸可被缺失或用其它核苷酸代替,或者对照序列总核苷酸的多至5%数目的核苷酸可被插入到对照序列中。
实际上,一般通过已知计算机程序确定任何特定多核苷酸序列或氨基酸序列与本发明的多核苷酸序列或氨基酸序列至少80%、85%、90%、95%、96%、97%、98%或99%相同。通过序列比对并计算相同性评分可确定查询序列(本发明序列)和对象序列之间的最佳总体配对的方法。使用计算机程序AlignX进行比对,该程序是英骏公司(Invitrogen)(www.invitrogen.com)Vector NTI套件的一个组件。使用ClustalW比对软件对氨基酸和多核苷酸序列进行比对(Thompson,J.D.,等.Nucl.Acids Res.22:4673-4680(1994))。分别使用默认打分矩阵Blosum62mt2和swgapdnamt进行氨基酸和多核苷酸序列比对。对于氨基酸序列,默认的缺口开放罚分为10,缺口延伸罚分为0.1。对于多核苷酸序列,默认的缺口开放罚分为15,缺口延伸罚分为6.66。
本发明涉及包含编码含PUFA合酶活性多肽的多核苷酸的分离的核酸分子,所述合酶活性选自KS活性、MAT活性、ACP活性、KR活性、CLF活性、AT活性、ER活性、DH活性及其组合,其中所述多核苷酸在严谨条件下与上述任何多核苷酸序列的互补序列杂交。
当单链形式的分子在合适的温度和溶液条件下可与其它核酸分子(如cDNA、基因组DNA或RNA)退火时,该核酸分子是与所述其它核酸分子是“可杂交的”。杂交和洗涤条件众所周知,易于举例。参见例如,Sambrook J.和RussellD.2001.《分子克隆:实验室手册》(第三版)冷泉港实验室出版社,纽约冷泉港(Molecular cloning:A laboratory manual,3rd edition.Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York)。温度和离子强度条件确定了杂交的“严谨性”。可调整严谨性条件以筛选适度相似的片段,如来自亲缘关系较远的有机体的同源性片段,到高度相似的片段,如来自亲缘关系较近的功能重复的酶。杂交后的洗涤决定了严谨条件。一个条件的集合使用一系列的洗涤,始于6X SSC,0.5%SDS室温15min,然后用2X SSC,0.5%SDS 45℃重复洗涤30min,再用0.2X SSC,0.5%SDS 50℃洗涤30min重复两次。对于更严谨的条件,洗涤在更高的温度中进行,条件同上,除了最后两次用0.2X SSC,0.5%SDS洗涤30min的温度升高到60℃。另一个高严谨条件的集合中最后两次洗涤的条件为0.1X SSC,0.1%SDS 65℃。另一高严谨条件为在0.1X SSC,0.1%SDS,65℃杂交;洗涤条件为2X SSC,0.1%SDS,然后是0.1X SSC,0.1%SDS。
本发明涉及含有多核苷酸序列的分离的核酸分子,所述多核苷酸序列与上述任何多核苷酸序列完全互补。术语“互补”用于描述能够彼此杂交的核苷酸碱基间的关系。例如,当涉及DNA时,腺嘌呤与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。
在某些实施方式中,所述多核苷酸或核酸是DNA。当指DNA时,包含多肽编码多核苷酸序列的核酸分子通常包含启动子和/或其它转录或翻译控制元件,这些元件与一个或多个编码区可操作的连接。可操作的连接指,当基因产物如多肽的编码区与一个或多个调控序列以此方式连接时,将使该基因产物的表达受到该调控序列的影响或控制。如果启动子功能的诱导使编码所需基因产物的mRNA转录,且如果两个DNA片段间连接的属性不干扰表达调控序列指导基因产物表达或不干扰转录DNA模板的能力,则两个DNA片段(如多肽编码区及其相连的启动子)“可操作地相连接”。因此,如果启动子能够影响多核苷酸序列的转录,则启动子区域与多肽编码多核苷酸序列可操作的连接。启动子可以是仅在预先确定的细胞中指导DNA大量转录的细胞特异性启动子。通常,编码区位于启动子的3′末端。启动子可整体来自于天然基因,或由来自不同天然启动子的不同元件所组成,或包含合成的DNA片段。本领域熟练技术人员了解,不同的启动子可指导不同组织或细胞类型的基因表达,或指导不同发育阶段的基因表达,或对不同的环境或生理条件应答从而指导基因表达。在多数时候多数细胞类型中引起基因表达的启动子称作“组成型启动子”。还应认识到的是,既然多数情况下调控序列界限不完全明确,不同长度的DNA片段可有相同的启动子活性。通常启动子基因的界限为3′末端的转录起始位点,向上游(5’方向)延伸,以包括起始高于背景的可检测水平的转录所需的最小数目碱基或元件。启动子内部可找到转录起始位点(常通过核酸酶S1作图确定),以及负责RNA聚合酶结合的蛋白质结合域(共有序列)。
合适的调控区域包括位于上游(5’非编码序列)、在编码区内或下游(3’非编码序列)的核酸区域,它影响相关编码区的转录、RNA加工或稳定性,或翻译。调控区域包含启动子、翻译引导序列、RNA加工位点、效应子结合位点和茎环结构。除了启动子以外,其它转录控制元件还有增强子、操纵子、阻抑物和转录终止信号,可与多核苷酸可操作地连接以指导细胞特异性转录。编码序列的边界由5’(氨基)末端翻译起始密码子和3’(羧基)末端翻译终止密码子界定。编码区包括但不限于,原核区域、来自mRNA的cDNA、基因组DNA分子、合成DNA分子或RNA分子。如果在真核细胞中表达编码区,常常在编码区的3’存在聚腺苷酸化信号和转录终止序列。
在本发明的某些方面,至少20个碱基、至少30个碱基、或者至少50个碱基并且与本发明多核苷酸序列杂交的多核苷酸序列可用作PCR引物。通常,在PCR-型扩增技术中,引物具有不同的序列,并且彼此不互补。根据所需检测条件,引物序列的设计应使目的核酸的复制有效且保真。PCR引物设计方法常见且为本领域所熟知。通常从DNA或RNA中扩增编码同源基因的较长的核酸片段时,可采用聚合酶链反应(PCR)方案扩增所述序列的两个短片段。聚合酶链反应也可在克隆核酸片段文库上进行,其中一条引物的序列来自于所述核酸片段,另一引物的序列则方便利用编码微生物基因的mRNA前体的3’末端的聚腺苷酸通道的存在。或者,第二条引物序列基于来自克隆载体的序列。
此外,设计特定引物并用于扩增所述序列的部分或全长。可在扩增反应中直接标记得到的扩增产物,也可在扩增反应后标记,并在合适严谨性的条件下检测分离的全长DNA片段。
因此,本发明的核酸分子可用于从相同或其它种类或细菌种类中分离同源蛋白质的编码基因。本领域熟知使用序列依赖性方案分离同源基因。序列依赖性方案的例子包括但不限于,核酸扩增技术的多种用途所示例的核酸杂交方法,以及DNA和RNA扩增方法(例如聚合酶链反应,Mullis等,美国专利号4,683,202;连接酶链反应(LCR)(Tabor,S.等,Proc.Acad.Sci.USA 82:1074(1985));或链取代扩增(SDA;Walker等,Proc.Natl.Acad.Sci.U.S.A.89:392(1992))。
在一些实施方式中,本发明的分离的核酸分子用于从其它有机体中分离同源核酸分子,以鉴定产生相似或改善PUFA分布的PUFA合酶。在一些实施方式中,本发明的分离的核酸分子用于从参与产生大量DHA的其它有机体中分离同源的核酸分子。
本发明的核酸分子还包含与标记物序列在框内融合的编码PUFA合酶基因、PUFA合酶基因结构域或PUFA合酶基因片段的多核苷酸序列,所述标记物序列用于检测本发明的多肽。标记物序列包括本领域一般技术人员所知的营养缺陷型或显性标记物,如ZEO(零霉素)、NEO(G418)、潮霉素、亚砷酸盐、HPH、NAT等。
本发明还涵盖PUFA合酶基因的变体。变体可在编码区、非编码区或两者中包含改变。多核苷酸变体的例子包含产生沉默性取代、添加或缺失,但不改变所编码多肽的性质或活性的变化。在某些实施方式中,由于基因密码子简并形成的沉默取代产生多核苷酸序列变体。在一些实施方式中,因多种原因产生多核苷酸序列,例如,为了在特定条宿主中表达优化密码子(如,将破囊壶菌中的密码子改变为其它生物,如大肠杆菌或酿酒酵母中优选的)。
本发明还提供等位变体,直系同源物和/或物种同源物。使用本文公开序列信息,通过本领域所知步骤可用于获取本文所述基因的全长基因、等位基因变体、剪接变体、全长编码部分、直系同源物和/或物种同源物。例如,通过产生本文提供序列的合适探针或引物,并且为等位基因变体和/或所需同源物筛选合适的核酸来源,可分离并鉴定等位基因变体和/或物种同源物。
本发明涉及包含上述任何核酸分子或其组合以及转录控制序列的重组核酸分子。在一些实施方式中,所述重组核酸分子是重组载体。
本发明涉及产生重组载体的方法,包括将本文所述的一种或多种分离的核酸分子插入载体。
本发明的载体可以是例如克隆载体或表达载体。载体可以是,例如质粒、病毒颗粒、噬菌体等形式。
本发明的多核苷酸序列可包含于任何用于表达多肽的表达载体中。此类载体包括染色体、非染色体和合成DNA或RNA序列,如SV40衍生物;细菌质粒和酵母质粒。然而,可使用其它任何本领域一般技术人员所知的合适载体。
可通过多种步骤将合适的DNA序列插入载体。通常,通过本领域已知方法将DNA序列插入合适的限制性核酸内切酶切割位点。此类步骤及其它可认为是在本领域技术人员所知范围内。
本发明还包括含有一个或多个上述多核苷酸序列的重组构建物。所述构建物包括载体,如质粒或病毒载体,其中正向或反向插入一个或多个本发明的序列。在本发明的一个方面,所述构建物还包括调控序列,包括例如可操作地连接于序列的启动子。本领域技术人员知道大量合适的载体和启动子,并可商业购得。
多肽
本发明涉及包含来自ATCC登录号PTA-9695和PTA-10212的分离的微生物的PUFA合酶蛋白质和结构域氨基酸序列的分离的多肽。
本文所用术语“多肽”包括单数形式和复数形式,涵盖酰胺键(也称肽键)线性连接的单体(氨基酸)所组成的分子。术语“多肽”指两个或多个氨基酸的任何一条链或多条链,而非具体长度的产物。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或其它任何用于指两个或多个氨基酸的一条或多条链的术语均包含于“多肽”的定义内,术语“多肽”可与这些术语替代或互换使用。术语“多肽”还指多肽表达后修饰的产物,这些修饰包括但不限于糖基化,乙酰基化,磷酸化,氨基化,通过已知保护/封闭基团衍生化,蛋白酶切割或非天然氨基酸修饰。
本文所述多肽包括但不限于片段、变体或衍生分子。术语“片段”、“变体”、“衍生物”和“类似物”当指多肽时,包括任何保留至少一些生物学活性的多肽。多肽片段可包括任何蛋白酶解片段,缺失片段和当递送给动物时易于抵达作用位点的片段。多肽片段还包括任何包含天然多肽的抗原性或免疫原性表位的多肽部分,包括线性或三维表位。多肽片段可包含变体区,包括上述片段,还包括由于氨基酸替换、缺失或插入引起的氨基酸序列改变的多肽。变体可天然产生,如等位基因变体。通过“等位基因变体”指占据有机体染色体给定座位的基因的替代形式。使用本领域所知的诱变技术产生非天然变体。本发明的多肽片段包含保守的或非保守的氨基酸取代、缺失或添加。多肽变体本文中也称作“多肽类似物”。本发明的多肽片段包括衍生分子。本文所用多肽或多肽片段的“衍生物”指对象多肽的一个或多个残基由功能性侧链反应化学衍生而来。“衍生物”还包括那些含有一个或多个20种标准氨基酸的天然氨基酸衍生物的肽。例如,4-羟基脯氨酸可取代为脯氨酸;5-羟基赖氨酸可取代为赖氨酸;3-甲基组氨酸可取代为组氨酸;高丝氨酸可取代为丝氨酸;鸟氨酸可取代为赖氨酸。
本发明的多肽可由本发明的任何核酸分子所编码。
本发明涉及分离的多肽,所述多肽包含与Pfa1p(SEQ ID NO:2或SEQ IDNO:69),Pfa2p(SEQ ID NO:4或SEQ ID NO:71),Pfa3p(SEQ ID NO:6或SEQ ID NO:73)及其组合的氨基酸序列至少80%相同的氨基酸序列,其中所述多肽包含一种或多种PUFA合酶活性。
本发明涉及包含氨基酸序列的多肽,所述氨基酸序列与本发明PUFA合酶的一个或多个PUFA合酶结构域的氨基酸序列至少80%相同。
在一些实施方式中,本发明涉及包含氨基酸序列的多肽,所述氨基酸序列与包含一种或多种PUFA合酶结构域的Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中的氨基酸序列至少80%相同。在一些实施方式中,所述多肽包含与Pfa1p(SEQ ID NO:2,SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:8或SEQ ID NO:75),MAT结构域(SEQ ID NO:10或SEQ IDNO:77),ACP结构域(如SEQ ID NO:14、16、18、20、22、24、81、83、85、87、89、91、93、95、97或99中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQID NO:12或SEQ ID NO:79及其部分),KR结构域(SEQ ID NO:26或SEQID NO:101),DH结构域(SEQ ID NO:28或SEQ ID NO:119)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2,SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2,SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中的不同氨基酸序列80%相同,与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的氨基酸序列至少80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:8或SEQ ID NO:75),MAT结构域(SEQ ID NO:10或SEQ ID NO:77),ACP结构域(如SEQ ID NO:14、16、18、20、22、24、81、83、85、87、89、91、93、95、97或99中任一),两种或多种ACP结构域的组合,如2、3、4、5、6、7、8、9或10种ACP结构域的组合,包括串联结构域(SEQ ID NO:12或SEQID NO:79及其部分),KR结构域(SEQ ID NO:26或SEQ ID NO:101),DH结构域(SEQ ID NO:28或SEQ ID NO:119)及其组合。在一些实施方式中,所述多肽包含Pfa1p(SEQ ID NO:2或SEQ ID NO:69)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含氨基酸序列的多肽,所述氨基酸序列与包含一种或多种PUFA合酶结构域的Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中的氨基酸序列至少80%相同。在一些实施方式中,所述多肽包含与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如KS结构域(SEQ ID NO:30或SEQ ID NO:103),CLF结构域(SEQ ID NO:32或SEQID NO:105),AT结构域(SEQ ID NO:34或SEQ ID NO:107),ER结构域(SEQID NO:36或SEQ ID NO:109)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4,SEQ ID NO:71)中的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQ ID NO:4,SEQ ID NO:71)中各自包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa2p(SEQID NO:4或SEQ ID NO:71)中的不同氨基酸序列80%相同,与Pfa2p(SEQ IDNO:4或SEQ ID NO:71)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种多肽分子与Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同,所述PUFA合酶结构域如KS结构域(SEQ ID NO:30或SEQ ID NO:103),CLF结构域(SEQ ID NO:32或SEQID NO:105),AT结构域(SEQ ID NO:24或SEQ ID NO:107),ER结构域(SEQID NO:36或SEQ ID NO:109)及其组合。在一些实施方式中,所述多肽包含Pfa2p(SEQ ID NO:4或SEQ ID NO:71)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含氨基酸序列的多肽,所述氨基酸序列与包含一种或多种PUFA合酶结构域的Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中的氨基酸序列至少80%相同。在一些实施方式中,所述多肽包含与Pfa3(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的氨基酸序列至少80%相同的氨基酸序列,所述PUFA合酶结构域如DH结构域(SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:111或SEQ ID NO:113),ER结构域(SEQ ID NO:42或SEQ ID NO:115)及其组合。在一些实施方式中,所述多肽包含两种或多种氨基酸序列,其中所述至少两种或多种氨基酸序列各自与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6,SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的相同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6,SEQ ID NO:73)中各自包含一种或多种PUFA合酶结构域的不同氨基酸序列80%相同。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中的不同氨基酸序列80%相同,与Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中的对应结构域顺序相比,所述至少两种或多种氨基酸序列在多肽中以相同或不同顺序排列。在一些实施方式中,所述至少两种或多种氨基酸序列与Pfa3(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的氨基酸序列80%相同,所述PUFA合酶结构域如DH结构域(SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:111或SEQ ID NO:113),ER结构域(SEQ ID NO:42或SEQ IDNO:115)及其组合。在一些实施方式中,所述多肽包含Pfa3p(SEQ ID NO:6或SEQ ID NO:73)中包含一种或多种PUFA合酶结构域的一个或多个氨基酸序列,包括一个或多个拷贝的任何独立结构域与一个或多个拷贝任何其它独立结构域的组合。
在一些实施方式中,本发明涉及包含与SEQ ID NO:2或SEQ ID NO:69至少80%相同的氨基酸序列的多肽,其中所述多肽包含选自KS活性、MAT活性、ACP活性、KR活性、DH活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:8或SEQ ID NO:75至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:10或SEQ ID NO:77至少80%相同的氨基酸序列的多肽,其中所述多肽含有MAT活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:14、16、18、20、22、24、81、83、87、89、91、93、95、97或99中任一项至少80%相同的氨基酸序列的多肽,并且所述多肽含有ACP活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:12或SEQ ID NO:79至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:12至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性。在一些实施方式中,所述氨基酸序列与SEQ ID NO:12中包含1、2、3、4、5或6个ACP结构域的氨基酸序列至少80%相同,其中所述多肽包含与一个或多个ACP结构域有关的ACP活性。SEQ ID NO:14、16、18、20、22和24是SEQ ID NO:12中含有单一ACP结构域的代表性氨基酸序列。
在一些实施方式中,本发明涉及含有与SEQ ID NO:79至少80%相同的氨基酸序列的多肽,其中所述多肽含有ACP活性。在一些实施方式中,所述氨基酸序列与SEQ ID NO:79中包含1、2、3、4、5、6、7、8、9或10个ACP结构域的氨基酸序列至少80%相同,其中所述多肽包含与一个或多个ACP结构域有关的ACP活性。SEQ ID NO:81、83、85、87、89、91、93、95、97和99是SEQ ID NO:79中包含单个ACP结构域的代表性氨基酸序列。
在一些实施方式中,本发明涉及含有与SEQ ID NO:26或SEQ ID NO:101至少80%相同的氨基酸序列的多肽,其中所述多肽含有KR活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:28或SEQ ID NO:119至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。
在一些实施方式中,本发明涉及的多肽包含的氨基酸序列至少80%与SEQID NO:4或SEQ ID NO:71相同,并且所述多肽含有选自KS活性、CLF活性、AT活性、ER活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:30或SEQ ID NO:103至少80%相同的氨基酸序列的多肽,其中所述多肽含有KS活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:32或SEQ ID NO:105至少80%相同的氨基酸序列的多肽,其中所述多肽含有CLF活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:34或SEQ ID NO:107至少80%相同的氨基酸序列的多肽,其中所述多肽含有AT活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:36或SEQ ID NO:109至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。
在一些实施方式中,本发明涉及包含与SEQ ID NO:6或SEQ ID NO:73至少80%相同的氨基酸序列的多肽,并且所述多肽含有选自DH活性、ER活性及其组合的PUFA合酶活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:38至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:40至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:111至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:113至少80%相同的氨基酸序列的多肽,其中所述多肽含有DH活性。
在一些实施方式中,本发明涉及含有与SEQ ID NO:42或SEQ ID NO:115至少80%相同的氨基酸序列的多肽,其中所述多肽含有ER活性。
在一些实施方式中,所述多肽包含与本文报道的氨基酸序列至少约80%、85%或90%相同,或者至少约95%、96%、97%、98%、99%或100%相同的氨基酸序列。
所述多肽的氨基酸序列与查询氨基酸序列至少,例如95%“相同”,意在表示对象多肽的氨基酸序列与查询序列相同,除了在查询氨基酸序列的每100个氨基酸中,所述对象多肽序列可包括最多5个氨基酸变化。换而言之,为得到包含与查询氨基酸序列至少有95%相同的氨基酸序列的多肽,对象序列中最多有5%的氨基酸可被插入、缺失、(得失位)或用其它氨基酸取代。参比序列的这些变化可以发生在参比氨基酸序列的氨基或羧基端或这些端位置之间的任何位置,可以在参比序列上各自分散开,或者出现在参比序列内的一个或一个以上毗连序列中。
实际上,一般通过已知计算机程序确定任何特定多肽是否具有与本发明的氨基酸序列至少80%、85%、90%、95%、96%、97%、98%或99%相同的氨基酸序列。如上所述,通过序列比对并计算相同性评分可确定查询序列(本发明序列)和对象序列之间的最佳总体配对的方法。使用计算机程序AlignX进行比对,该程序是英骏公司(Invitrogen)(www.invitrogen.com)Vector NTI套件的一个组件。使用ClustalW比对软件进行比对(J.Thompson等.,Nucleic Acids Res.22(22):4673-4680(1994)。
使用默认评分矩阵Blosum62mt2。默认缺口开放罚分为10,缺口扩展罚分为0.1。
在本发明的另一些方面,具有与本文所公开的多核苷酸序列至少80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸序列的核酸分子编码具有一种或多种PUFA合酶活性的多肽。具有一种或多种PUFA合酶活性的多肽显示与本发明PUFA合酶的一种或多种活性相似,但不一定完全相同的一种或多种活性。
当然,因为遗传密码子的简并,本领域一般技术人员立即意识到大部分具有与本文所述多核苷酸序列至少80%、85%、90%、95%、96%、97%、98%或99%相同的多核苷酸序列的核酸分子编码“具有PUFA合酶功能活性”的多肽。事实上,由于任何这些多核苷酸的简并变体均编码相同的多肽,在许多情况下,本领域熟练技术人员可根据保守取代以及保守功能结构域的知识预测显示活性的多肽。在本发明的某些方面,以分离的形式提供本发明的多肽和多核苷酸,如纯化至均一。或者,常规合成人员可合成产生本发明的多肽和多核苷酸。
本领域所知,通过比较多肽的氨基酸序列及其保守氨基酸取代物与第二条多肽的序列,可确定两条多肽间的“相似性”。
在一些实施方式中,本发明的多肽是融合多肽。
如本文所用,“融合多肽”指包含第一条多肽通过肽键与第二条多肽线性连接的多肽。第一条多肽与第二条多肽可以相同或不同,可直接连接,也可以通过肽接头连接。本文所用术语“连接”、“融合的”和“融合”可以互换使用。这些术语指通过某些方式如化学偶联或重组将两个或更多的元件或组件结合在一起。“框内融合”指以维持原有开放阅读框正确读框的方式,将两个或多个开放阅读框连接形成连续更长的开放阅读框。因此,得到的重组融合蛋白是包含两个或多个片段的单一蛋白质,所述片段对应原始开放阅读框编码的多肽(这些片段在自然条件下通常不如此连接)。尽管阅读框为连续的融合片段,但片段仍可被物理或空间分割,如框内接头序列。“接头”序列是融合蛋白中分隔两个多肽编码区域的一个或多个氨基酸。
本发明涉及包含一种或多种本发明多肽和生物学可接受运载体的组合物。
在一些实施方式中,所述组合物包含生物学可接受的“赋形剂”,其中所述赋形剂是组分或组分的混合物,将其用于本发明的组合物中,使组合物具有所需特征,其包括运载体。“生物学可接受的”指化合物、材料、组合物、盐和/或剂型,在充分的医学评估范围内,适合与活细胞组织接触而不引起过度的毒性、刺激、炎症反应或其它问题性并发症,在接触期间有合理的受益/风险比。可使用不同的赋形剂。在一些实施方式中,赋形剂可以是但不限于碱剂、稳定剂、抗氧化剂、粘附剂、分离剂、涂饰剂、外部相组分、控释组分、溶剂、表面活性剂、保湿剂,缓冲剂、填料,软化剂及其组合。除了本文所述的赋形剂外,赋形剂还可包括但不限于《雷明顿:药学科学与实践》(第21版)(Remington:The Science and Practice of Pharmacy,21st ed.)(2005)所列的那些。本文将赋形剂列入特定的分类(例如,“溶剂”)旨在说明赋形剂的作用,而非限制。特定赋形剂可属于多种分类之中。
本发明还涉及本文所公开任何多肽的片段、变体、衍生物或类似物。
本发明的多肽可以是重组多肽、天然多肽或合成多肽。
宿主细胞
本发明涉及表达上述任何核酸分子、上述任何重组核酸分子及其组合的宿主细胞。
本文所用术语“表达”指基因产生生化物质如RNA或多肽的过程。该过程包括任何在细胞内基因的任何功能表现,包括但不限于,基因敲除以及瞬时表达和稳定表达。包括但不限于,基因转录为信使RNA(mRNA),转移RNA(tRNA),小发夹RNA(shRNA),小干扰RNA(siRNA),或任何其它RNA产物,以及此类mRNA翻译为多肽。若最终期望产物是生化物质,表达包括创造该生化物质和任何前体。
为了产生一种或多种期望的多不饱和脂肪酸,可遗传修饰宿主细胞,将本发明的PUFA合酶系统引入宿主细胞。
当根据本发明遗传修饰有机体表达PUFA合酶系统时,一些宿主有机体可内源性表达与PUFA合酶系统联合以产生PUFA所需的附属蛋白质。然而,即便是有机体内源性产生同源附属蛋白质,也可能需要使用编码一种或多种附属蛋白质的核酸分子转化有机体,以使有机体能够产生PUFA或增强有机体产生PUFA。一些异源性附属蛋白质能够比宿主细胞内源性附属蛋白质更有效或更高效地与转化的PUFA合酶蛋白质一起工作。
本文定义附属蛋白质为并非核心PUFA合酶系统的一部分(即并非PUFA合酶复合物本身的一部分),但可能对于使用本发明的核心PUFA合酶复合物产生或有效产生PUFA是必需的蛋白质。例如,为了产生PUFA,PUFA合酶系统必须与附属蛋白质一起工作,所述附属蛋白质将4′-磷酸泛酰巯基乙胺基部分从辅酶A转移到酰基运载体蛋白质(ACP)结构域上。因此,可认为PUFA合酶系统包括至少一个4′-磷酸泛酰巯基乙胺基转移酶(PPT酶)结构域,或者可认为此结构域是PUFA合酶系统的一个附属结构域或蛋白质。PPT酶的结构和功能特征描述参见美国专利申请公开号2002/0194641、2004/0235127和2005/0100995。
具有4′-磷酸泛酰巯基乙胺基转移酶生物学活性(功能)的结构域或蛋白质被表征为将4′-磷酸泛酰巯基乙胺基部分从辅酶A转移到酰基运载体蛋白质(ACP)的酶。向ACP中不变的丝氨酸残基的此种转移将失活的脱辅基(apo-)形式激活为活性全蛋白(holo-)形式。在聚酮化合物和脂肪酸合成中,磷酸泛酰巯基乙胺基团与成长的酰基链形成硫酯。PPT酶是在脂肪酸、酮聚化合物和非核糖体肽合成中已经良好表征的一个酶家族。多种PPT酶序列已知,晶体结构确定(如Reuter K.,等,EMBO J.18(23):6823-31(1999)),突变分析鉴定出多个对活性至关重要的氨基酸残基(Mofid M.R.等,Biochemistry 43(14):4128-36(2004))。
之前识别裂殖壶菌ACP结构域作为底物的异源PPT酶是念珠藻(Nostocsp.)PCC7120(旧称念珠藻(Anabaena sp).PCC 7120)的Het I蛋白。Het I是出现于念珠藻中的一类基因,已知负责长链羟基脂肪酸的合成,该脂肪酸是这种有机体异形细胞中糖脂层的组分(Black和Wolk,J.Bacteriol.176:2282-2292(1994);Campbell等,Arch.Microbiol.167:251-258(1997))。Het I可能激活出现在该类中的蛋白质Hgl E的ACP结构域。包含HetI的序列和构建物的描述参见如美国专利申请公开号2007/0244192,将其整体纳入作参考。
之前证明识别裂殖壶菌ACP结构域的另一异源性PPT酶是Sfp,其来自枯草芽孢杆菌(Bacillus subtilis)。Sfp研究透彻并广泛使用,因为它能够识别广泛的底物。基于公开的序列信息(Nakana,等,Molecular and General Genetics 232:313-321(1992)),之前产生了Sfp的表达载体,通过将编码区和确定的上下游侧接DNA序列克隆入pACYC-184克隆载体得到该表达载体。该构建物编码功能性PPT酶,表现在当与裂殖壶菌Orfs在大肠杆菌中共表达时,在合适的条件下,引起细胞中DHA的蓄积(参见美国申请公开号2004/0235127,整体纳入作参考)。
宿主细胞包括微生物细胞、动物细胞、植物细胞和昆虫细胞。合适宿主的代表性例子包括细菌细胞;嗜热菌或嗜温菌;海洋细菌;破囊壶菌;真菌细胞如酵母,植物细胞;昆虫细胞;以及分离的动物细胞。宿主细胞可以是未转染细胞或者已经用至少一种其它重组核酸分子转染的细胞。宿主细胞还可以包括已经工程改造表达PUFA合酶的转基因细胞。本领域熟练技术人员经过学习本文,能够选择合适的宿主。
宿主细胞包括任何破囊壶菌目的微生物,如微生物的属包括但不限于:破囊壶菌属(Thraustochytrium),网粘菌属(Labyrinthuloides),日本壶菌属(Japonochytrium)和裂殖壶菌属(Schizochytrium)。这些属内的物种包括但不限于:任何裂殖壶菌(Schizochytrium)种类,包括黄金石斛裂殖壶菌(Schizochytriumaggregatum)、里氏裂殖壶菌(Schizochytrium limacinum)、米氏裂殖壶菌(Schizochytrium minutum);任何破囊壶菌种类(Thraustochytrium)(包括之前的吾肯氏壶菌属种类,如威瑟氏吾肯氏壶菌(U.visurgensis)、阿姆氏吾肯氏壶菌(U.amoeboida)、萨迦氏吾肯氏壶菌(U.sarkariana)、普氏吾肯氏壶菌(U.profunda)、拉氏吾肯氏壶菌(U.radiate)、米氏吾肯氏壶菌(U.minuta)和吾肯氏壶菌(Ulkeniasp.)BP-5601),包括斯托特破囊壶菌(Thraustochytrium striatum)、金黄色破囊壶菌(Thraustochytrium aureum)、罗萨破囊壶菌(Thraustochytrium roseum);以及日本壶菌属(Japonochytrium)种类。破囊壶菌菌株包括但不限于:裂殖壶菌(S31)(ATCC 20888)、裂殖壶菌(S8)(ATCC 20889)、裂殖壶菌(LC-RM)(ATCC18915)、裂殖壶菌(SR21)、黄金石斛裂殖壶菌(Goldstein et Belsky)(ATCC28209)、里氏裂殖壶菌(Honda et Yokochi)(IFO 32693)、破囊壶菌(23B)(ATCC20891)、斯托特破囊壶菌(施奈德)(ATCC 24473)、金黄色破囊壶菌(高士登)(Goldstein)(ATCC 34304)、罗萨破囊壶菌(高士登)(ATCC 28210)以及日本壶菌(L1)(ATCC 28207)。其它合适遗传修饰的宿主微生物的例子包括但不限于:酵母,包括酿酒酵母(Saccharomyces cerevisiae)、卡尔酵母(Saccharomycescarlsbergensis)或其它酵母,如念珠菌(Candida),乳酸克鲁维斯酵母(Kluyveromyces)或其它真菌,例如,丝状真菌如曲霉(Aspergillus),链孢霉(Neurospora),青霉(Penicillium)等。细菌细胞也可用于宿主。包括用于发酵过程的大肠杆菌。或者,如乳酸菌(Lactobacillus)种或芽孢杆菌(Bacillus)种可用作宿主。
植物宿主细胞包括但不限于:任何高等植物,包括双子叶和单子叶植物,以及消费植物,包括作物和油料植物。这些植物可包括例如:芸苔(canola)、大豆、油菜籽、亚麻子、玉米、红花、向日葵和烟草。其他优选的植物包括已知可产生用作药剂、芳香剂、营养剂、功能食物成分或美容活性剂的化合物的植物或者经遗传工程改造产生这些化合物/试剂的植物。因此,可选择任何植物种类或植物细胞。植物和植物细胞,以及其来源植物包括但不限于:来自芸苔(Brassica rapa L.);芸苔栽培品种NQC02CNX12(ATCC PTA-6011)、NQC02CNX21(ATCC PTA-6644)和NQC02CNX25(ATCC PTA-6012)的植物和植物细胞,以及衍生自芸苔栽培品种NQC02CNX12、NQC02CNX21和NQC02CNX25的栽培品种、育种品种和植物部分(分别参见美国专利7,355,100、7,456,340和7,348,473);大豆(Glycine max),油菜籽(Brassica spp.);亚麻子/亚麻(Linum usitatissimum),玉米(玉米)(Zea mays),红花(Carthamustinctorius);向日葵(Helianthus annuus);烟草(Nicotiana tabacum);拟南芥、巴西坚果(Betholettia excelsa);蓖麻子(Riccinus communis),椰子(Cocusnucifera),香菜(Coriandrum sativum),棉花(Gossypium spp.),花生(Arachishypogaea);霍霍巴(Simmondsia chinensis);榨菜(Brassica spp.和Sinapis alba);油棕(Elaeis guineeis),橄榄油(Olea eurpaea);水稻(Oryza sativa),南瓜(Cucurbita maxima),大麦(Hordeum vulgare),小麦(Traeticum aestivum);和浮萍(Lemnaceae sp.)。可对来自这些或其它植物的植株品系进行生产、选择或优化,使其具有所需性状,如或关于但不限于种子产量、抗倒伏、出苗、抗病性或耐受性、成熟、晚季植物完整性、株高、抗落叶、便于植株改造、油含量或油特征。通过植物育种,如系谱育种、轮回选择育种、互交和回交育种以及如标记辅助育种和耕作方法选择植株品系。参见例如,美国专利号7,348,473。
动物细胞包括任何分离的动物细胞。
本发明涉及表达一种或多种本发明的核酸分子或重组核酸分子包括载体的宿主细胞。
本发明涉及制备重组宿主细胞的方法,包括将重组载体引入宿主细胞。
使用本发明的载体例如克隆载体或表达载体可对宿主细胞进行遗传工程改造(转导或转化或转染)。载体可以是,例如质粒、病毒颗粒、噬菌体等形式。载体包含本文所述多核苷酸序列,以及合适的启动子或控制序列,可用于转化合适的宿主使其表达多核苷酸序列编码的多肽。宿主细胞的遗传修饰还可包括对优选或最佳宿主密码子使用进行的基因优化。
工程改造的宿主细胞可在常规营养培养基中培养,对所述培养基进行改良用于激活启动子,选择转化子,或扩增本发明的基因。培养条件,例如温度,pH等与选择宿主细胞用于表达的条件,为本领域一般技术人员所知。
在一些实施方式中,本发明涉及遗传修饰植物或植物部分以表达本文所述PUFA合酶系统,其至少包括核心PUFA合酶酶复合物。本文定义的“植物的部分”或“植物部分”包含植物的任何部分,例如但不限于种子(未成熟或成熟),油,花粉,胚,花,果实,芽,叶,根,茎,外植体等。在一些实施方式中,遗传修饰的植物或植物部分产生一种或多种PUFA,如EPA、DHA、DPA(n-3或n-6)、ARA、GLA、SDA、其它PUFA及其组合。已知植物不包含内源性PUFA合酶系统;因此本发明的PUFA合酶系统可用于工程改造植物具有独特的脂肪酸生产能力。在另外的实施方式中,进一步遗传修饰植物或植物部分表达至少一种PUFA合酶附属蛋白质(如PPT酶)。在一些实施方式中,植物是油料植物,其中油料种子和/或油料种子里的油包含PUFA合酶系统产生的PUFA。在一些实施方式中,遗传修饰的植物,植物部分,油料种子和/或油料种子里的油包含PUFA合酶系统产生的可检测量的至少一种PUFA。在另外的实施方式中,此类植物,植物部分,油料种子和/或油料种子里的油基本没有中间产物或副产物,所述中间产物或副产物不是引入的PUFA合酶系统的主要PUFA产物,也不是野生型植物的内源性FAS系统天然产生的。尽管通过FAS系统,野生型植物产生许多短或中链PUFA,如18碳PUFA,但由于使用本文所述PUFA合酶系统进行遗传修饰,植物、植物部分、油料种子和/或油料种子的油中仍可产生新的或另外的PUFA。
使用经典植株开发和/或分子遗传学技术,可对植物进行遗传学修饰。参见美国申请公开号2007/0244192。本领域了解产生转基因植物的方法,其中将编码所需氨基酸序列的重组核酸分子插入植物的基因组中。例如,可使用病毒载体产生转基因植物,如通过美国专利号5,569,597;5,589,367;和5,316,931所述方法使用病毒载体转化单子叶植物。本领域熟知通过转化遗传改造或修饰植物的方法,包括生物学和物理转化方案。参见例如,B.L.Miki等,《植物分子生物学和生物技术》(METHODS IN PLANT MOLECULAR BIOLOGY ANDBIOTECHNOLOGY 67-88)中67-88页“将外源DNA引入植物的步骤”(Proceduresfor Introducing Foreign DNA into Plants)(Glick,B.R.和Thompson,J.E.编,CRC出版公司,博卡拉顿,1993)。此外,可获得用于植物细胞或组织的转化和植物再生的载体和体外培养方法。参见例如,M.Y.Gruber等,《植物分子生物学和生物技术》(METHODS IN PLANT MOLECULAR BIOLOGY ANDBIOTECHNOLOGY)中89-119页“用于植物转化的载体”(Vectors for PlantTransformation)(Glick,B.R.和Thompson,J.E.编,CRC出版公司,博卡拉顿,1993)。
一种广泛应用的将表达载体引入植物的方法是基于农杆菌天然转化系统。参见例如Horsch等,Science 227:1229(1985)以及美国专利号6,051,757。根癌土壤杆菌(A.tumefaciens)和毛根土壤杆菌(A.rhizogenes)是植物致病性土壤细菌,其能遗传转化植物细胞。根癌土壤杆菌和毛根土壤杆菌的Ti和Ri质粒分别携带负责遗传转化植物的基因。参见例如,Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。多份参考文献提供了农杆菌载体系统的描述以及农杆菌介导的基因转移的方法,包括Gruber等,同上;Miki等,同上;Moloney等,PlantCell Reports8:238(1989);美国专利号5,177,010;5,104,310;5,149,645;5,469,976;5,464,763;4,940,838;4,693,976;5,591,616;5,231,019;5,463,174;4,762,785;5,004,863;和5,159,135;和欧洲专利申请号0131624、120516、159418、176112、116718、290799、320500、604662、627752、0267159和0292435。
其它用于植物转化的方法包括微弹介导的转化,其中DNA携带于微弹的表面。用生物射弹设备将微粒加速到足以穿透植物细胞壁和细胞膜的速度,以便将表达载体引入植物组织。参见,Sanford等,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988),Sanford,J.C.,Physiol.Plant 79:206(1990),Klein等,Biotechnology 10:268(1992)以及美国专利号5,015,580和5,322,783。还描述了将遗传物质包被的微弹加速导入细胞的技术,如美国专利号4,945,050和5,141,141所述。借助物理途径将DNA递送给植物的另一种方法是超声处理靶细胞。参见例如,Zhang等,Bio/Technology 9:996(1991)。或者,利用脂质体或原生质球融合将表达载体引入植物中。参见例如Deshayes等,EMBO J.,4:2731(1985),Christou等,Proc Natl.Acad.Sci.USA 84:3962(1987)。利用CaCl2沉淀、DNA注射、聚乙烯醇或聚-L-鸟氨酸将DNA直接摄入原生质体已见诸报道。参见例如Hain等,Mol.Gen.Genet.199:161(1985)和Draper等,Plant Cell Physiol.23:451(1982)。对原生质体以及完整的细胞和组织进行电穿孔也已见诸报道。参见例如Donn等,第七届国际植物细胞和组织培养会议摘要(Abstracts of VIIth International Congress on Plant Cell and TissueCulture)IAPTC,A2-38,第53页(1990);D′Halluin等,Plant Cell 4:1495-1505(1992)和Spencer等,Plant Mol.Biol.24:51-61(1994);国际申请公开号WO87/06614、WO 92/09696和WO 93/21335;以及美国专利号5,472,869和5,384,253。其它转化技术包括晶须技术,参见例如,美国专利号5,302,523和5,464,765。
还可直接转化叶绿体或质体。因此,可产生重组植物,其中仅有叶绿体和质体DNA用上述任何核酸分子和重组核酸分子及其组合进行修饰。在叶绿体或质体中发挥功能的启动子为本领域所知。参见例如,Hanley-Bowden等,Trends in Biochemical Sciences 12:67-70(1987)。获得含插入异源DNA的叶绿体的细胞的方法和组合物可参见如美国专利号5,693,507和5,451,513。
还可使用其它有效转化的方法。
本领域熟悉用于植物转化的合适载体。参见例如,美国专利号6,495,738;7,271,315;7,348,473;7,355,100;7,456,340;5,571,698和5,625,033,及其公开的参考文献。
表达载体可包含至少一种可操作地连接于调控元件(如启动子)的遗传标记物,从而使包含标记物的转化细胞通过负向选择(即抑制不含标记物基因细胞的生长)或正向选择(筛选遗传标记物编码的产物)回收。转化领域熟知数种常用选择性标记物基因,例如编码酶的基因,所述酶代谢解除化学试剂如抗生素或除草剂的毒性,或者编码改变靶点的基因,使其对于抑制剂不敏感。植物转化可用的选择性标记物包括但不限于:转座子Tn5(Aph II)的氨基糖苷类磷酸转移酶基因,它编码卡那霉素、新霉素和G418抗性,以及草甘膦、潮霉素、甲氨蝶呤、膦蓖麻毒蛋白(bialophos)、咪唑啉、磺脲类三唑并嘧啶磺酰胺除草剂,如氯磺隆、溴苯、达拉朋等抗性或耐受性的编码基因。植物转化的一个常用选择性标记物基因是新霉素磷酸转移酶II(nptII)基因,该基因在植物调控信号的控制之下,产生卡那霉素抗性。参见例如Fraley等,Proc.Natl.Acad.Sci.U.S.A.80:4803(1983)。另外常用的选择性标记物基因是潮霉素磷酸转移酶基因,该基因产生对于抗生素潮霉素的抗性。参见例如,Vanden Elzen等,PlantMol.Biol.5:299(1985)。其它来源于细菌的产生抗性的选择性标记物基因包括庆大霉素乙酰转移酶、链霉素磷酸转移酶、氨基糖苷类3′-腺苷酸转移、博莱霉素抗性决定因子。参见Hayford等,Plant Physiol.86:1216(1988),Jones等,Mol.Gen.Genet.210:86(1987),Svab等,Plant Mol.Biol.14:197(1990),Hille等,Plant Mol.Biol.7:171(1986)。其它选择性标记物基因产生对除草剂如草甘膦、草铵膦或溴苯腈的抗性。参见例如,Comai等,Nature 317:741-744(1985),Gordon-Kamm等,Plant Cell 2:603-618(1990)和Stalker等,Science 242:419-423(1988)。植物转化的其它选择性标记物基因非细菌来源。这些基因包括例如,小鼠二氢叶酸还原酶、植物5-烯醇丙酮酰莽草酸-3-磷酸合酶和植物乙酰乳酸合酶。参见例如Eichholtz等,Somatic Cell Mol.Genet.13:67(1987),Shah等,Science 233:478(1986),Charest等,Plant Cell Rep.8:643(1990)。
报道基因可与或不与选择性标记物一起使用。报道基因是通常不出现在接收者有机体中的基因,常常编码蛋白质得到某种表型改变或酶特征。参见例如K.Weising等,Ann.Rev.Genetics 22:421(1988)。报道基因包括但不限于β-葡萄糖醛酸糖苷酶(GUS)、β-半乳糖苷酶、氯霉素乙酰基转移酶、绿色荧光蛋白和荧光素酶基因。参见例如,Jefferson,R.A.,Plant Mol.Biol.Rep.5:387(1987),Teeri等,EMBO J.8:343(1989),Koncz等,Proc.Natl.Acad.Sci U.S.A.84:131(1987),DeBlock等,EMBO J.3:1681(1984)和Chalfie等,Science 263:802(1994)。在将基因引入接收者细胞后的合适时间可采用实验检测报道基因表达。这种实验需要使用编码大肠杆菌β-葡糖醛酸糖苷酶基因座的β-葡萄糖醛酸糖苷酶(GUS)的基因,如Jefferson等,Biochem.Soc.Trans.15:17-19(1987)所述。
多种来源的启动子调控元件可有效用于植物细胞以表达外源基因。例如,可使用细菌来源的启动子调控元件,如章鱼碱合酶启动子、胭脂氨酸合酶启动子、甘露碱合酶启动子,以及病毒来源的启动子,如花椰菜花叶病毒(35S和19S),35T(这是一个重新工程改造的35S启动子,参见国际申请公开号WO97/13402)。植物启动子调控元件包括但不限于核酮糖-1,6-二磷酸(RUBP)羧基酶小亚基(ssu)、β-伴大豆球蛋白启动子、β-菜豆蛋白启动子、ADH启动子、热休克启动子和组织特异性启动子。基质连接区、支架连接区、内含子、增强子和聚腺苷酸化序列也可用于提高转录效率和DNA整合。可包含这类元件以在植物中获得转化DNA的理想性能。典型的元件包括但不限于:Adh-内含子1、Adh-内含子6、苜蓿花叶病毒包被蛋白前导序列、玉米条纹病毒包被蛋白质前导序列,以及本领域技术人员可用的那些。也可使用组成型启动子调控元件指导连续基因表达。组成型启动子包括但不限于:来自植物病毒的启动子,如CaMV的35S启动子(Odell等,Nature 313:810-812(1985)),以及如水稻肌动蛋白(McElroy等,PlantCell 2:163-171(1990))、泛素(Christensen等,Plant Mol.Biol.12:619-632(1989)和Christensen等,Plant Mol.Biol.18:675-689(1992))、pEMU(Last等,Theor.Appl.Genet.81:581-588(1991))、MAS(Velten等,EMBOJ.3:2723-2730(1984)),玉米H3组蛋白(Lepetit等,Mol.Gen.Genetics231:276-285(1992)和Atanassova等,Plant Journal 2(3):291-300(1992))的启动子,和ALS启动子,甘蓝型油菜(Brassica napus)ALS3结构基因5′侧的Xba1/NcoI片段(与Xba1/NcoI片段相似的核苷酸序列)(国际申请公开号WO96/30530)。还可在特定细胞或组织类型,如叶或种子中使用组织特异性启动子调控元件表达基因(如玉米醇溶蛋白、油质蛋白、油菜籽蛋白、ACP、球蛋白等)。组织特异性或组织优选性启动子包括但不限于,根优选启动子,如来自菜豆蛋白基因的启动子(Murai等,Science 23:476-482(1983),和Sengupta-Gopalan等,Proc.Natl.Acad.Sci.U.S.A.82:3320-3324(1985));叶特异性和光诱导性启动子,如来自cab或核酮糖二磷酸羧化酶-加氧酶(rubisco)的启动子(Simpson等,EMBO J.4(11):2723-2729(1985)和Timko等,Nature318:579-582(1985));花药特异性启动子如来自LAT52的启动子(Twell等,Mol.Gen.Genetics 217:240-245(1989));花粉特异性启动子,如来自Zm13的启动子(Guerrero等,Mol.Gen.Genetics 244:161-168(1993));或小孢子优选启动子,如来自apg的启动子(Twell等,Sex.Plant Reprod.6:217-224(1993))。启动子调控元件可在植物发育的特定阶段以及植物组织和器官中激活,包括但不限于:花粉特异性、胚胎特异性、玉米穗丝特异性、棉花纤维特异性、根特异性以及种子胚乳特异性启动子调控元件。可使用诱导型启动子调控元件,这种调控元件对于特定信号应答从而使基因表达,这些信号例如:物理刺激(热休克基因);光(RUBP羧基酶);激素(Em);代谢物;化学物质和应激。诱导型启动子包括但不限于:来自ACEI系统对于铜产生应答的启动子(Mett等,PNAS90:4567-4571(1993));来自玉米In2基因对于苯磺酰胺除草安全剂响应的启动子(Hershey等,Mol..Gen Genetics 227:229-237(1991)以及Gatz等,Mol.Gen.Genetics 243:32-38(1994)),来自Tn10Tet抑制物的启动子(Gatz等,Mol.Gen.Genetics 227:229-237(1991));以及来自甾体激素基因的启动子,其转录活性由糖皮质激素诱导(Schena等,Proc.Natl.Acad.Sci.U.S.A.88:0421(1991)。
可使用信号序列指导多肽至细胞器或亚细胞组分或分泌到质外体。参见例如Becker等,Plant Mol.Biol.20:49(1992),Knox,C.,等,Plant Mol.Biol.9:3-17(1987),Lerner等,Plant Physiol.91:124-129(1989),Fontes等,Plant Cell3:483-496(1991),Matsuoka等,Proc.Natl.Acad.Sci.88:834(1991),Gould等,J.Cell.Biol.108:1657(1989),Creissen等,Plant J.2:129(1991),Kalderon,等,Cell 39:499-509(1984),and Steifel等,Plant Cell 2:785-793(1990)。此类靶向序列使需要表达的蛋白质转移到最有效发挥功能的细胞结构,或转移到期望的表型功能所需细胞过程最集中的细胞区域。
在一些实施方式中,使用信号序列指导本发明的蛋白质到亚细胞组分,如质体或叶绿体。通过将基因产物与信号序列融合,可将基因产物,包括异源基因产物,靶向至质体或叶绿体,所述信号序列在叶绿体输入时被切割,从而产生成熟蛋白质。参见例如Comai等.,J.Biol.Chem.263:15104-15109(1988),以及van den Broeck等,Nature 313:358-363(1985)。可从编码RUBISCO蛋白、CAB蛋白、EPSP合酶、GS2蛋白的cDNA中,或从任何自然产生的叶绿体靶向蛋白中分离合适信号序列的编码DNA,所述自然产生的叶绿体靶向蛋白包含指导靶蛋白到叶绿体的信号序列(也称作叶绿体转运肽(CTP))。这些叶绿体靶向蛋白是本领域众所周知的。这些叶绿体靶向蛋白以包含氨基端CTP的较大前体蛋白形式质合成,CTP指导所述前体至叶绿体输入机器。通常叶绿体细胞器内的特异性内切酶切割CTP,因此从前体释放靶向的成熟蛋白进入叶绿体环境,所述成熟蛋白包括活性蛋白质,如酶。适合将基因或基因产物靶向至叶绿体或质体的肽的编码序列的例子包括矮牵牛花EPSPS CTP、拟南芥EPSPSCTP2和内含子以及本领所知其它序列。CTP的具体例子包括但不限于:拟南芥核酮糖二磷酸羧化酶小亚基ats1A转运肽,拟南芥EPSPS的转运肽,和玉米核酮糖二磷酸羧化酶小亚基的转运肽。优化转运肽的描述参见如,Van denBroeck等,Nature 313:358-363(1985)。原核和真核信号肽序列参见如Michaelis等,Ann.Rev.Microbiol.36:425(1982)。本发明可用的转运肽的其它例子包括叶绿体转运肽,参见Von Heijne等,Plant Mol.Biol.Rep.9:104-126(1991);Mazur等,Plant Physiol.85:1110(1987);Vorst等,Gene 65:59(1988);Chen和Jagendorf,J.Biol.Chem.268:2363-2367(1993);来自烟草(Nicotianaplumbaginifolia)rbcS基因的转运肽(Poulsen等,Mol.Gen.Genet.205:193-200(1986));以及来自甘蓝型油菜酰基ACP硫酯酶的转运肽(Loader等,Plant Mol.Biol.23:769-778(1993);Loader等,Plant Physiol.110:336-336(1995)。
本发明遗传修饰的植物还可通过修饰使内源性脂肪酸合酶缺失或失活,以减少与外源性PUFA合酶系统竞争丙二酰CoA,从而使丙二酰CoA水平增加,及其组合。参见例如,美国申请公开号2007/0245431。
遗传修饰的植物可培养于发酵培养基中,或在合适的培养基,如土壤中生长。适合高等植物的培养基包括任何植物生长培养基,例如但不限于,土壤、沙、支持根生长的任何其它特定培养基(如蛭石、珍珠岩等)或水培以及合适的光、水、优化高等植物生长的营养补充剂。通过从植物中抽提化合物的纯化工艺可将PUFA从遗传修饰的植物中回收。可通过收获植物以及收获植物的油(从油料种子中)来回收PUFA。植物可以天然状态消耗或者进一步加工为可消耗产品。在一些实施方式中,本发明涉及遗传修饰的植物,其中作为遗传修饰的结果,植物至少产生一种PUFA,其中作为植物遗传修饰的结果,植物或蓄积PUFA的植物部分中总脂肪酸分布包含可检测量的PUFA。在一些实施方式中,所述植物是油料种子植物。在一些实施方式中,油料种子植物在其成熟种子中产生PUFA或在其种子的油中包含PUFA。
也可利用各种哺乳动物细胞培养系统来表达重组蛋白。表达载体包含复制起始位点、合适的启动子和增强子,以及任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供受体位点、转录终止序列和5′侧接非转录序列。
异源表达方法
本发明涉及产生至少一种PUFA的方法,包括在有效产生PUFA的条件下,于宿主细胞中,表达PUFA合酶系统,其中所述PUFA合酶系统包含本文所述任何分离的核酸分子和重组核酸分子及其组合,其中产生至少一种PUFA。在一些实施方式中,所述至少一种PUFA包括DHA、EPA或其组合。在一些实施方式中,所述宿主细胞是植物细胞、分离的动物细胞或微生物细胞。在一些实施方式中,所述宿主细胞是破囊壶菌。
本发明涉及产生富含DHA、EPA或其组合的脂质的方法,包括在有效产生脂质的条件下,于宿主细胞中表达PUFA合酶基因,其中在宿主细胞中所述PUFA合酶基因包含本文所述任何分离的核酸分子和重组核酸分子及其组合,其中产生富含DHA、EPA或其组合的脂质。
本发明涉及从宿主细胞中分离脂质的方法,包括在有效产生脂质的条件下,于宿主细胞中表达PUFA合酶基因,并从所述宿主细胞中分离脂质,其中所述宿主细胞的PUFA合酶系统包含本文所述任何分离的核酸分子和重组核酸分子及其组合。
在一些实施方式中,从宿主细胞中分离含PUFA的一种或多种脂质组分。在一些实施方式中,从宿主细胞中分离的一种或多种组分包括总脂肪酸组分,甾醇酯组分,甘油三酯组分,游离脂肪酸组分,甾醇组分,双甘油组分,磷脂组分或其组合。在一些实施方式中,从宿主细胞中分离PUFA,根据引入宿主细胞的PUFA合酶系统的组成,所述PUFA富含ω-3脂肪酸、ω-6脂肪酸或其组合。在一些实施方式中,根据引入宿主细胞的PUFA合酶系统的组成,所述PUFA富含DHA、EPA、DPA n-6、ARA或其组合。在一些实施方式中,所述PUFA富含DHA、EPA或其组合。在一些实施方式中,从宿主细胞分离的PUFA的PUFA分布特征包括高浓度DHA,低浓度EPA、ARA、DPAn-6或其组合。在一些实施方式中,从宿主细胞分离的PUFA的PUFA分布特征包括高浓度DHA和EPA,低浓度ARA、DPA n-6或其组合。在一些实施方式中,从宿主细胞分离的PUFA的PUFA分布特征包括高浓度EPA,低浓度DHA、ARA、DPAn-6或其组合。
本发明涉及在具有PUFA合酶活性的有机体中替换失活或缺失的PUFA合酶活性、引入新的PUFA合酶活性或增强已有的PUFA合酶活性的方法,包括在有效表达PUFA合酶活性的条件下于有机体中表达本文所述任何分离的核酸分子和重组核酸分子及其组合。在一些实施方式中,核酸分子包含本文所述PFA1、PFA2或PFA3 PUFA合酶的多核苷酸序列中的一种或多种,所述多核苷酸序列编码一种或多种PUFA合酶结构域。在一些实施方式中,有机体的PUFA分布特征在引入本发明的一种或多种核酸分子后发生改变。在一些实施方式中,PUFA分布特征的改变包括ω-3脂肪酸增加和ω-6脂肪酸减少。在一些实施方式中,PUFA特征的改变包括ω-6脂肪酸增加和ω-3脂肪酸减少。在一些实施方式中,ω-3和ω-6脂肪酸都增加。在一些实施方式中,DHA的量增加,而EPA、ARA、DPA n-6或其组合中一种或多种的量维持或减少。在一些实施方式中,EPA和DHA的量增加,而ARA、DPA n-6或其组合的量维持或减少。在一些实施方式中,EPA的量增加,而EPA、ARA、DPA n-6或其组合中一种或多种的量维持或减少。在一些实施方式中,所述核酸分子包含PFA3或其一个或多个结构域的多核苷酸序列。在一些实施方式中,所述核酸分子包含PFA3或其一个或多个结构域的多核苷酸序列,并且所述有机体中ω-3脂肪酸的量增加且ω-6脂肪酸的量减少。在一些实施方式中,所述核酸分子包含PFA2或其一个或多个结构域的多核苷酸序列,并且所述有机体中DHA的量增加且EPA的量减少。
本发明涉及在具有PUFA合酶活性的有机体中增加DHA、EPA或其组合产量的方法,包括在有效产生DHA、EPA或其组合的条件下于有机体中表达本文所述的任何分离的核酸分子和重组核酸分子及其组合,其中在所述有机体中PUFA合酶活性代替失活或缺失的活性,引入新活性或增强已有活性,并且所述有机体中DHA、EPA或其组合的产量增加。
概述本发明后,参考本文提供的实施例可获得更进一步理解本发明。以下实施例仅用于说明目的,不构成限制。
实施例1
设计KS和DH PUFA合酶结构域的简并引物,并从分离的微生物中分离对应的序列,所述微生物保藏于ATCC登录号PTA-9695,也称作裂殖壶菌ATCC PTA-9695。
根据公开的日本希瓦氏菌(Shewanella japonica)、裂殖壶菌(Schizochytriumsp.)ATCC 20888、金黄色破囊壶菌(Thraustochytrium aureum)(ATCC 34304)和破囊壶菌(Thraustochytrium sp.)23B ATCC 20892的PFA1(之前称为orfA或ORF 1)序列,设计裂殖壶菌ATCC PTA-9695PFA1的KS区域(即包含KS结构域的区域)的简并引物:
prDS173(正向):GATCTACTGCAAGCGCGGNGGNTTYAT(SEQ ID NO:62),以及
prDS174(反向):GGCGCAGGCGGCRTCNACNAC(SEQ ID NO:63)。
根据公开的南极细菌(Moritella marina)、裂殖壶菌(Schizochytrium sp.)ATCC 20888、深海发光杆菌(Photobacter profundum)和破囊壶菌23B ATCC20892序列,设计裂殖壶菌ATCC PTA-9695 PFA3的DH区域(之前称为orfC或ORF3)的简并引物:
JGM190(正向):CAYTGGTAYTTYCCNTGYCAYTT(SEQ ID NO:64);以及
BLR242(反向):CCNGGCATNACNGGRTC(SEQ ID NO:65)。
使用染色体DNA模板的PCR条件如下:0.2μM dNTP,每种引物0.1uM,8%DMSO,200ng染色体DNA,2.5U Herculase
II融合聚合酶(斯查塔基公司(Stratagene))和1X Herculase
缓冲液(斯查塔基公司),总体积50μL。该PCR方法包括以下步骤:(1)98℃3分钟;(2)98℃30秒;(3)50℃30秒;(4)72℃2分钟;(5)重复第2-4步40个循环;(6)72℃5分钟;和(7)存于6℃。
对于两对引物,使用来自裂殖壶菌(Schizochytrium sp.)ATCC登录号PTA-9695的染色体模板,PCR得到期望大小的不同的DNA产物。根据厂商手册分别将PCR产物克隆到载体pJET1.2/钝端(富酶泰斯(Fermentas))中,使用提供的标准引物确定插入序列。
获自PCR产物的DNA序列与来自NCBI GenBank的已知序列进行比较,使用标准BLASTx搜索(BLASTx参数:低复杂性过滤打开;矩阵:BLOSUM62;缺口消耗;存在11,延伸1。Stephen F.Altschul,Thomas L.Madden,AlejandroA.
Jinghui Zhang,Zheng Zhang,Webb Miller和David J.Lipman(1997),《缺口BLAST和PSI-BLAST:新一代的蛋白数据库搜索程序》(Gapped BLASTand PSI-BLAST:a new generation of protein database search programs),NucleicAcids Res.25:3389-3402.)。
在氨基酸水平,与来源于含破囊壶菌ATCC PTA-9695的KS片段的克隆DNA推导出的氨基酸序列具有最高水平同源性的是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基A”(相同性=87%;阳性率=92%);内德斯希瓦氏菌(Shewanella oneidensis)MR-1“多结构域β-酮酰合酶”(相同性=49%;阳性率=64%);以及希瓦氏菌(Shewanella sp.)MR-4“β-酮酰合酶“(相同性=49%;阳性率=64%)。
在氨基酸水平,与来源于含破囊壶菌ATCC PTA-9695的DH片段的克隆DNA的氨基酸序列具有最高水平同源性的是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基C”(相同性=61%;阳性率=71%);皮氏希瓦氏菌(Shewanellapealeana)ATCC 700345“β-羟酰基-(酰基-载体-蛋白)脱水酶FabA/FabZ”(相同性=35%;阳性率=50%);以及斯得明希瓦氏菌(Shewanella sediminis.)HAW-EB3“ω-3多不饱和脂肪酸合酶PfaC(相同性=34%;阳性率=50%)。
实施例2
从裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695中鉴定PUFA合酶基因。
通过标准步骤从微生物中制备基因组DNA。参见例如,Sambrook J.和Russell D.2001.《分子克隆:实验室手册》(第三版)冷泉港实验室出版社,纽约冷泉港(Molecular cloning:A laboratory manual,3rd edition.Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York)。简单的说:(1)从对数中期培养物中离心获得500μL细胞。再次离心细胞,用小口径枪头移去细胞团块中所有的残留液体;
(2)团块重悬于200μL裂解缓冲液中(20mM Tris pH 8.0,125μg/mL蛋白酶K,50mM NaCl,10mM EDTA pH 8.0,0.5%SDS);
(3)在50℃裂解细胞1小时;
(4)用移液器将裂解混合物转移到锁相凝胶(PLG-艾本德)(PLG-Eppendorf)2mL试管中;
(5)加入等体积的P∶C∶I并混合1.5小时;
(6)将试管12k x g离心5分钟;
(7)将水相从PLG管内的凝胶上移去,在水相中加入等体积的氯仿,混合30分钟;
(8)将试管14k x g离心约5分钟;
(9)从氯仿中将上层(水相)吸去,并放在一个新试管中;
(10)加入0.1体积的3M NaOAC并混合(倒置数次);
(11)加入2体积100%EtOH并混合(倒置数次),基因组DNA沉淀在该阶段形成;
(12)在微型离心机中将试管于4℃14k离心约15分钟;
(13)将液体小心倒去,基因组DNA在试管底部;
(14)用0.5mL 70%EtOH洗涤团块;
(15)在微型离心机中将试管于4℃14k离心约5分钟;
(16)小心倒去EtOH,干燥基因组DNA团块;
和(17)直接在基因组DNA团块中加入合适体积的H2O和RNA酶。
根据厂商手册,利用分离的基因组,在粘粒pWEB-TNCTM(艾比森得)(Epicentre)中产生包含大片段(约40kB)的重组文库。根据标准克隆杂交步骤使用32P放射性标记的探针筛选粘粒文库(Sambrook J.和Russell D.2001.《分子克隆:实验室手册》(第三版)冷泉港实验室出版社,纽约冷泉港(Molecularcloning:A laboratory manual,3rd edition.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York))。探针含有与实施例1中来自其它有机体的公开PUFA合酶序列同源的DNA。将来自上述pJET1.2/钝端克隆的克隆片段分别进行DNA限制性酶切得到这些探针,并用标准方法标记。在所有的情况下,各个探针与某些粘粒的强烈杂交表明克隆含有与PUFA合酶基因同源的DNA。
粘粒克隆pDS115显示与KS区域的探针强烈结合,选择该克隆进行裂殖壶菌ATCC PTA-9695 PFA1基因的DNA测序。粘粒克隆pDS115,包含裂殖壶菌ATCC PTA-9695 PFA1和PFA2基因,于2009年1月27日保存在布达佩斯条约下的美国典型培养物保藏中心,专利保藏所,大学大道第10801号,马纳萨斯,VA20110-2209(American Type Culture Collection,Patent Depository,10801University Boulevard,Manassas,VA 20110-2209),ATCC登录号PTA-9737。使用标准方法设计实施例1中确定的KS区域DNA序列的测序引物。为了确定裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695PFA1的DNA序列,进行数轮DNA测序,包括使用标准方法设计后续测序引物,以“走完”粘粒克隆。
之前公开的破囊壶菌PUFA合酶系统中,PUFA合酶基因PFA1和PFA2簇集排布以异向转录。来自裂殖壶菌ATCC PTA-9695的PFA1和PFA2也是如此。通过对于来自粘粒克隆pDS115的DNA序列进行“步测”,概念上PFA2的起始位点距离PFA1的起始位点493个核苷酸,并且异向转录。裂殖壶菌ATCC PTA-9695 PFA1和PFA2 PUFA合酶基因的每一核苷酸碱基对均被至少两个独立的高质量DNA测序反应所覆盖,所述测序反应最小集合Phred评分为40(置信水平为99.99%)。
粘粒克隆pBS4显示了与DH区域的探针强烈结合,选择该克隆进行裂殖壶菌ATCC PTA-9695 PFA3基因的DNA测序。粘粒克隆pBS4,包含裂殖壶菌ATCC PTA-9695 PFA3基因,于2009年1月27日保存在布达佩斯条约下的美国典型培养物保藏中心,专利保藏所,大学大道第10801号,马纳萨斯,VA20110-2209(American Type Culture Collection,Patent Depository,10801University Boulevard,Manassas,VA 20110-2209),ATCC登录号PTA-9736。使用标准方法设计实施例1中确定的DH区域DNA序列的测序引物.为了确定裂殖酵母ATCC PTA-9695 PFA3的DNA序列,进行数轮DNA测序,包括使用标准方法设计后续测序引物,以“走完”粘粒克隆。裂殖壶菌ATCC PTA-9695PFA3 PUFA合酶基因的每一核苷酸碱基对均被至少两个独立的高质量DNA测序反应所覆盖,所述测序反应最小集合Phred评分为40(置信水平为99.99%)。
表1显示了与之前公开的序列相比,裂殖壶菌ATCC PTA-9695PFA1(SEQID NO:1)、PFA2(SEQ ID NO:3)和PFA3(SEQ ID NO:5)多核苷酸序列的相同性。利用DNA比对标准VectorNTI程序的“AlignX”程序中的评分矩阵“swgapdnamt”来确定相同性。
表1:PFA1、PFA2和PFA3多核苷酸序列相同性百分比
表2显示了与之前公开PUFA合酶氨基酸序列相比,裂殖壶菌ATCCPTA-9695 Pfa1p(SEQ ID NO:2)、Pfa2p(SEQ ID NO:4)和Pfa3p(SEQ ID NO:6)氨基酸序列的相同性。利用蛋白比对标准VectorNTI程序的“AlignX”程序中的评分矩阵“blosum62mt2”来确定相同性。
表2:Pfa1p、Pfa2p和Pfa3p氨基酸序列百分比相同性
实施例3
进行结构域分析,以注释裂殖壶菌ATCC PTA-9695PFA1、PFA2和PFA3的PUFA合酶结构域和活性位点各自的序列坐标。基于与已知PUFA合酶、脂肪酸合酶和聚酮化合物合酶结构域的同源性鉴定结构域。
表3显示与裂殖壶菌ATCC PTA-9695 PFA1相关的结构域和活性位点。
表3:裂殖壶菌ATCC PTA-9695 PFA1结构域分析
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1的第一个结构域是KS结构域。含有裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1 KS结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:7,对应SEQ ID NO:1的第7-1401位。含有裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1 KS结构域的氨基酸序列在此表示为SEQ ID NO:8,对应SEQ ID NO:2的第3-467位。KS结构域包含活性位点基序:DXAC*(SEQ ID NO:43),其中*酰基结合位点对应SEQID NO:2的C203。同样,KS结构域末端存在一个特征性基序:GFGG(SEQ IDNO:44),对应SEQ ID NO:2的第455-458位以及SEQ ID NO:8的第453-456位。
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1的第二个结构域是MAT结构域。含有裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1 MAT结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:9,对应SEQ ID NO:1的第1798-2700位。含有裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1MAT结构域的氨基酸序列在此表示为SEQ ID NO:10,对应SEQ ID NO:2的第600-900位。MAT结构域包含活性位点基序:GHS*XG(SEQ ID NO:46),其中*酰基结合位点对应SEQ ID NO:2的S699。
裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa1的第3-8个结构域是6个串联的ACP结构域,本文记作ACP1、ACP2、ACP3、ACP4、ACP5和ACP6。包含第一个ACP结构域ACP1的核苷酸序列本文中为SEQ ID NO:13,包含于SEQ ID NO:1的约3325-3600位置的核苷酸序列范围内。包含ACP1的氨基酸序列本文记作SEQ ID NO:14,包含于SEQ ID NO:2的约1109-1200位置的氨基酸序列范围内。包含ACP2的核苷酸序列本文记作SEQ ID NO:15,包含于SEQ ID NO:1的约3667-3942位置的核苷酸序列范围内。包含ACP2的氨基酸序列本文记作SEQ ID NO:16,包含于SEQ ID NO:2的约1223-1314位置的氨基酸序列范围内。包含ACP3的核苷酸序列本文记作SEQ ID NO:17,包含于SEQ ID NO:1的约4015-4290位置的核苷酸序列范围内。包含ACP3的氨基酸序列本文记作SEQ ID NO:18,包含于SEQ ID NO:2的约1339-1430位置的氨基酸序列范围内。包含ACP4的核苷酸序列本文记作SEQ ID NO:19,包含于SEQ ID NO:1的约4363-4638位置的核苷酸序列范围内。包含ACP4的氨基酸序列本文记作SEQ ID NO:20,包含于SEQ ID NO:2的约1455-1546位置的氨基酸序列范围内。包含ACP5的核苷酸序列本文记作SEQ ID NO:21,包含于SEQ ID NO:1的约4711-4986位置的核苷酸序列范围内。包含ACP5的氨基酸序列本文记作SEQ ID NO:22,包含于SEQ ID NO:2的约1571-1662位置的氨基酸序列范围内。包含ACP6的核苷酸序列本文记作SEQ ID NO:23,包含于SEQ ID NO:1的约5053-5328位置的核苷酸序列范围内。包含ACP6的氨基酸序列本文记作SEQ ID NO:24,包含于SEQ ID NO:2的约1685-1776位置的氨基酸序列范围内。所有6种ACP结构域一起覆盖裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa1的SEQ ID NO:1的约3298-5400位置的区域,大约对应SEQ ID NO:2的氨基酸位置1100-1800。包含所有6个结构域的整个ACP区域的核苷酸序列本文中记作SEQ ID NO:11;而包含所有6个结构域的整个ACP区域的氨基酸序列记作SEQ ID NO:12。SEQ ID NO:11内6个ACP区域的重复间隔约为每342个核苷酸(相邻活性位点丝氨酸间的氨基酸实际数目范围为114-116个氨基酸)。6个ACP结构域的每一个包含泛酰巯基乙胺结合基序LGIDS*(SEQ ID NO:47),其中S*是泛酰巯基乙胺结合位点丝氨酸(S)。泛酰巯基乙胺结合位点丝氨酸(S)位置靠近每个ACP结构域序列的中央。6个ACPD结构域的活性位点丝氨酸的位置(即泛酰巯基乙胺结合位点),对于SEQ ID NO:2的氨基酸序列而言是:ACP1=S1152、ACP2=S1266、ACP3=S1382、ACP4=S1498、ACP5=S1614和ACP6=S1728。
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695Pfa1的第9个结构域是KR结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa KR结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:25,对应SEQ ID NO:1的第5623-7800位。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa1 KR结构域的氨基酸序列在此表示为SEQ ID NO:26,对应SEQ ID NO:2的第1875-2600位。KR结构域内部是与短链醛脱氢酶(KR是该家族成员)同源的核心区域(包含于核苷酸序列SEQ ID NO:48和氨基酸序列SEQ ID NO:49中)。
该核心区域范围是SEQ ID NO:1的约5998-6900位,对应SEQ ID NO:2的2000-2300氨基酸位置。裂殖壶菌(Schizochytrium sp)ATCC PTA-9695Pfa1的第10个结构域是DH结构域。包含裂殖壶菌(Schizochytrium sp)ATCCPTA-9695Pfa1DH结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:27,对应SEQ ID NO:1的第7027-7065位。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695Pfa1DH结构域的氨基酸序列在此表示为SEQ ID NO:28,对应SEQ ID NO:2的第2343-2355位。DH结构域包含保守的活性位点基序(参见Donadio,S.和Katz.,L.,Gene 111(1):51-60(1992)):LxxHxxxGxxxxP(SEQ IDNO:50)。
表4显示与裂殖菌(Schizochytrium sp.)ATCC PTA-9695PFA2相关的结构域和活性位点。
表4:裂殖壶菌ATCC PTA-9695 PFA2结构域分析
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2的第一个结构域是KS结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 KS结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:29,对应SEQ ID NO:3的第10-1350位。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 KS结构域的氨基酸序列在此表示为SEQ ID NO:30,对应SEQ ID NO:4的第4-450位。KS结构域包含活性位点基序:DXAC*(SEQ ID NO:43),其中*酰基结合位点对应SEQ ID NO:4的C191。同样,KS结构域末端存在一个特征性基序:GFGG(SEQ ID NO:44),对应SEQ ID NO:4的第438-441位以及SEQ ID NO:30的第435-438位。
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2的第3个结构域是CLF结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 CLF结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:31,对应SEQ ID NO:3的第1408-2700位。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 CLF结构域的氨基酸序列在此表示为SEQ ID NO:32,对应SEQ ID NO:4的第470-900位。
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695Pfa2的第3个结构域是AT结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695Pfa2AT结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:33,对应SEQ ID NO:3的第2998-4200位。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 AT结构域的氨基酸序列在此表示为SEQ ID NO:34,对应SEQ ID NO:4的第1000-1400位。AT结构域包含活性位点基序GxS*xG(SEQ ID NO:52),这是酰基转移酶(AT)蛋白的特征,活性位点丝氨酸残基对应SEQ ID NO:4的S1141。
裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2的第四个结构域是ER结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa2 ER结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:35,对应SEQ ID NO:3的第4498-5700位。包含Pfa2 ER结构域的氨基酸序列在此表示为SEQ ID NO:36,对应SEQ ID NO:4的第1500-1900位。
表5显示与裂殖菌(Schizochytrium sp.)ATCC PTA-9695 PFA3相关的结构域和活性位点。
表5:裂殖壶菌ATCC PTA-9695 PFA3结构域分析
裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3的第一、二个结构域本文分别记作DH1和DH2。包含裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695Pfa3 DH1结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:37,对应SEQ ID NO:5的第1-1350位。包含裂殖壶菌(Schizochytrium sp.)ATCCPTA-9695 Pfa3 DH1结构域的氨基酸序列在此表示为SEQ ID NO:38,对应SEQID NO:6的第1-450位。包含裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3DH2结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:39,对应SEQ IDNO:5的第1501-2700位。包含裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695Pfa3 DH2结构域的氨基酸序列在此表示为SEQ ID NO:40,对应SEQ ID NO:6的第501-900位。DH结构域包含活性位点基序:FxxH*F(SEQ ID NO:53)。DH1中包含活性位点基序的核苷酸序列对应SEQ ID NO:5的位置931-933,而DH2中包含活性位点基序的核苷酸序列对应SEQ ID NO:5的位置2401-2403。基序FxxH*F中的活性位点H*基于来自Leesong等,Structure4:253-64(1996)和Kimber等,J Biol Chem.279:52593-602(2004)的数据,DH1中的活性位点H*对应SEQ ID NO:6的H310,DH2中的活性位点H*对应SEQID NO:6的H801。
裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3的第三个结构域是ER结构域。包含裂殖壶菌(Schizochytrium sp)ATCC PTA-9695 Pfa3 ER结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:41,对应SEQ ID NO:5的第2848-4200位。包含裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 Pfa3 ER结构域的氨基酸序列在此表示为SEQ ID NO:42,对应SEQ ID NO:6的第950-1400位。
实施例4
设计KS、ER和DH PUFA合酶结构域的简并引物,并从分离的微生物中分离对应的序列,所述微生物保藏于ATCC登录号PTA-10212,也称作破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212。
根据公开的裂殖壶菌(Schizochytrium sp.)ATCC 20888、金黄色破囊壶菌(Thraustochytrium aureum)(ATCC 34304)和破囊壶菌(Thraustochytrium sp.)23BATCC 20892的PFA1(之前称为orfA或ORF 1)序列,设计破囊壶菌ATCCPTA-10212 PFA1的KS区域(即包含KS结构域的区域)的简并引物:
prDS233(正向):TGATATGGGAGGAATGAATTGTGTNGTNGAYGC(SEQ ID NO:123)
prDS235(反向):TTCCATAACAAAATGATAATTAGCTCCNCCRAANCC(SEQ ID NO:124).
根据公开的日本希瓦氏菌、裂殖壶菌ATCC 20888、金黄色破囊壶菌(ATCC34304)和破囊壶菌23B ATCC 20892的PFA2(之前称为orfB或ORF 2)序列,设计破囊壶菌ATCC PTA-10212PFA2ER区域(即包含ER结构域的区域)的简并引物:
prDS183(正向):GGCGGCCACACCGAYAAYMGNCC(SEQ ID NO:125)
prDS184(反向):CGGGGCCGCACCANAYYTGRTA(SEQ ID NO:126).
根据公开的日本希瓦氏菌、裂殖壶菌ATCC 20888、金黄色破囊壶菌(ATCC34304)和破囊壶菌23B ATCC 20892的PFA3(之前称为orfC或ORF 3)序列,设计破囊壶菌ATCC PTA-10212 PFA3ER区域(即包含ER结构域的区域)的简并引物:
prDS181(正向):TCCTTCGGNGCNGSNGG(SEQ ID NO:127)
prDS184(反向):CGGGGCCGCACCANAYYTGRTA(SEQ ID NO:126).
使用如上所述的简并引物JGM190(正向,SEQ ID NO:64)和BLR242(反向,SEQ ID NO:65)扩增破囊壶菌ATCC PTA-10212中PFA3的DH区域。
使用染色体DNA模板的PCR条件如下:0.2μM dNTP,每种引物0.1uM,6%DMSO,200ng染色体DNA,2.5U Herculase
II融合聚合酶(斯查塔基公司)和1X Herculase
缓冲液(斯查塔基公司),总体积50μL。该PCR方法包括以下步骤:(1)98℃3分钟;(2)98℃30秒;(3)54℃45秒;(4)72℃2分钟;(5)重复第2-4步40个循环;(6)72℃5分钟;和(7)存于6℃。
对于所有引物对,使用来自破囊壶菌ATCC PTA-10212的染色体模板,PCR得到期望大小的不同的DNA产物。根据厂商手册分别将PCR产物克隆到载体pJET1.2/钝端(富酶泰斯)中,使用提供的标准引物确定插入序列。
如实施例1所述将获自PCR产物的DNA序列与来自NCBI GenBank的已知序列比较。
在氨基酸水平,与来自含破囊壶菌ATCC PTA-10212的PFA1的KS片段的克隆DNA推导出的氨基酸序列具有最高水平同源性的序列是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基A”(相同性=80%;阳性率=90%);本希卡希瓦氏菌(Shewanella benthica)KT99“ω-3多不饱和脂肪酸合酶PfaA”(相同性=51%;阳性率=67%);罗西卡希瓦氏菌(Shewanella loihica)PV-4“β-酮酰合酶“(相同性=50%;阳性率=67%);沃地希瓦氏菌(Shewanella woodyi)ATCC 51908“聚酮型多不饱和脂肪酸合酶PfaA”(相同性=51%;阳性率=66%)。
在氨基酸水平,与含来自含破囊壶菌(Thraustochytrium sp.)ATCCPTA-10212的PFA2的ER片段的克隆DNA推导出的氨基酸序列具有最高水平同源性的序列是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基B”(相同性=70%;阳性率=85%);裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基C”(相同性=66%;阳性率=83%);泡沫节旋藻(Nodularia spumigena)CCY9414“2-硝基丙烷二加氧酶”(相同性=57%;阳性率=74%);南极细菌(Moritella sp.)PE36“多不饱和脂肪酸合酶PfaD”(相同性=57%;阳性率=71%)。
在氨基酸水平,与来自含破囊壶菌ATCC PTA-10212的PFA3的ER片段的克隆DNA推导出的氨基酸序列具有最高水平同源性的序列是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基C”(相同性=80%;阳性率=90%);裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基B”(相同性=78%;阳性率=89%);南极细菌PE36“多不饱和脂肪酸合酶PfaD”(相同性=56%;阳性率=71%);亚马逊希瓦氏菌(Shewanella amazonensis)SB2B“ω-3多不饱和脂肪酸合酶”(相同性=55%;阳性率=73%)。
在氨基酸水平,与来自含破囊壶菌ATCC PTA-10212的PFA3的DH片段的克隆DNA推导出的氨基酸序列具有最高水平同源性的序列是:裂殖壶菌ATCC 20888“多不饱和脂肪酸合酶亚基C”(相同性=63%;阳性率=76%);皮氏希瓦氏菌(Shewanella pealeana)ATCC 700345“β-羟酰基-(酰基-运载体-蛋白)脱水酶FabA/FabZ”(相同性=35%;阳性率=53%);皮佐希瓦氏菌(Shewanellapiezotolerans)WP3“多结构域β-酮酰基合酶”(相同性=36%;阳性率=52%);本希卡希瓦氏菌(Shewanella benthica)KT99″ω-3多不饱和脂肪酸合酶PfaC”(相同性=35%;阳性率=51%)。
实施例5
从破囊壶菌(Schizochytrium sp.)ATCC PTA-10212中鉴定PUFA合酶基因。
在室温下将1mL细胞从-80℃冻存管中解冻,加入到含50mL液体HSFM培养基(如下)的250mL无挡板培养瓶中。将培养瓶在23℃孵育3天。收集细胞用于标准细胞人工染色体(BAC)文库构建(露西经公司,米德尔顿,美国威斯康星(Lucigen Corporation,Middleton,WI USA))。
表6:HSFM培养基
氮给料:
典型的培养条件包括:
根据BAC载体pSMART(露西经公司(Lucigen Corporation))中的厂商指南处理包含大片段(约120kB)的重组BAC文库。通过使用32P放射性标记探针的标准克隆杂交步骤筛选BAC文库(Sambrook J.和Russell D.2001.《分子克隆:实验室手册》(第三版)冷泉港实验室出版社,纽约冷泉港(Molecular cloning:Alaboratory manual,3rd edition.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,New York))。探针含有与实施例4中来自其它有机体的公开PUFA合酶序列同源的DNA。将来自上述pJET1.2/钝端克隆的克隆片段分别进行DNA限制性酶切得到这些探针,并用标准方法标记。在所有的情况下,各个探针与某些BAC的强烈杂交表明克隆含有与PUFA合酶基因同源的DNA。
BAC克隆pLR130(也称作LuMaBAC 2M23)显示与KS和ER区域的探针强烈杂交,表明其含有PFA1和PFA2基因,选择该克隆进行破囊壶菌ATCCPTA-10212 PFA1和PFA2基因的DNA测序。通过标准步骤对BAC进行测序(欧陆MWG操纵子公司,阿拉巴马,汉茨维尔(Eurofins MWG Operon,Huntsville,AL))。BAC克隆pLR130,包含PFA1和PFA2基因,于2009年12月1日保存在布达佩斯条约下的美国典型培养物保藏中心,专利保藏所,大学大道第10801号,马纳萨斯,VA20110-2209(American Type Culture Collection,PatentDepository,10801 University Boulevard,Manassas,VA 20110-2209),ATCC登录号PTA-10511。
之前公开的破囊壶菌PUFA合酶系统中,PUFA合酶基因PFA1和PFA2簇集排布以异向转录。来自破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212的PFA1和PFA2也是如此。概念上PFA2的起始位点位距离PFA1起始位点693个核苷酸,并且异向转录。
BAC克隆pDS127(也称为LuMaBAC 9K17)显示与PFA3的DH区域和ER区域的探针强烈杂交,选择该克隆进行PFA3基因的DNA测序。BAC克隆pDS130,包含PFA3基因,于2009年12月1日保存在布达佩斯条约下的美国典型培养物保藏中心,专利保藏所,大学大道第10801号,马纳萨斯,VA20110-2209,ATCC登录号PTA-10510。使用标准方法设计实施例4中确定的DH区域和ER区域和DNA序列的测序引物。为了确定破囊壶菌ATCCPTA-10212 PFA3基因的DNA序列,进行数轮DNA测序,包括使用标准方法设计后续测序引物,以“走完”BAC克隆。PFA3基因的每一核苷酸碱基对均被至少两个独立的高质量DNA测序反应所覆盖,所述测序反应最小集合Phred评分为40(置信水平为99.99%)。
表7显示与之前公开的序列以及裂殖壶菌PTA-9695的序列相比,破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:68)、PFA2(SEQ ID NO:70)和PFA3(SEQ ID NO:72)多核苷酸序列的相同性。利用DNA比对标准VectorNTI程序的“AlignX”程序中的评分矩阵“swgapdnamt来确定相同性。”
表7:PFA1、PFA2和PFA3多核苷酸序列相同性百分比
表8显示与之前公开的序列以及裂殖壶菌PTA-9695的PUFA合酶氨基酸序列相比,破囊壶菌ATCC PTA-10212 Pfa1p(SEQ ID NO:69)、Pfa2p(SEQ IDNO:71)和Pfa3p(SEQ ID NO:73)氨基酸序列的相同性。利用蛋白比对标准VectorNTI程序的“AlignX”程序中的评分矩阵“blosum62mt2来确定相同性。”
表8:Pfa1p、Pfa2p和Pfa3p氨基酸序列相同性百分比
实施例6
进行结构域分析,以注释破囊壶菌ATCC PTA-10212 PFA1、PFA2和PFA3的PUFA合酶结构域以及活性位点各自的序列坐标。基于与已知PUFA合酶、脂肪酸合酶和聚酮化合物合酶结构域的同源性鉴定结构域。
表9显示与破囊壶菌ATCC PTA-10212 PFA1相关的结构域和活性位点。
表9:破囊壶菌ATCC PTA-10212 PFA1结构域分析
破囊壶菌ATCC PTA-10212 Pfa1的第一个结构域是KS结构域。包含破囊壶菌ATCC PTA-10212 Pfa1 KS结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:74,对应SEQ ID NO:68的第13-1362位。包含破囊壶菌ATCCPTA-10212 Pfa1 KS结构域的氨基酸序列在此表示为SEQ ID NO:75,对应SEQID NO:69的第5-454位。KS结构域包含活性位点基序:DXAC*(SEQ ID NO:43),其中*酰基结合位点对应SEQ ID NO:69的C204。同样,KS结构域末端存在一个特征性基序:GFGG(SEQ ID NO:44),对应SEQ ID NO:69的第451-454位以及SEQ ID NO:75的第447-450位。
破囊壶菌ATCC PTA-10212 Pfa1的第二个结构域是MAT结构域。包含破囊壶菌ATCC PTA-10212 Pfa1 MAT结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:76,对应SEQ ID NO:68的第1783-2703位。包含破囊壶菌ATCC PTA-10212 Pfa1 MAT结构域的氨基酸序列在此表示为SEQ ID NO:77,对应SEQ ID NO:69的第595-901位。MAT结构域包含活性位点基序:GHS*XG(SEQ ID NO:46),其中*酰基结合位点对应SEQ ID NO:69的S695。
破囊壶菌ATCC PTA-10212Pfa1p的第3-12个结构域是10个串联的ACP结构域,本文记作ACP1、ACP2、ACP3、ACP4、ACP5、ACP6、ACP7、ACP8、ACP9和ACP10。包含第一个ACP结构域ACP1的核苷酸序列本文中为SEQ IDNO:80,包含于SEQ ID NO:68的约3280-3534位置的核苷酸序列范围内。包含ACP1的氨基酸序列本文记作SEQ ID NO:81,包含于SEQ ID NO:69的约1094-1178位置的氨基酸序列范围内。包含ACP2的核苷酸序列本文记作SEQ ID NO:82,包含于SEQ ID NO:68的约3607-3861位置的核苷酸序列范围内。包含ACP2的氨基酸序列本文记作SEQ ID NO:83,包含于SEQ ID NO:69的约1203-1287位置的氨基酸序列范围内。包含ACP3的核苷酸序列本文记作SEQ ID NO:84,包含于SEQ ID NO:68的约3934-4185位置的核苷酸序列范围内。包含ACP3的氨基酸序列本文记作SEQ ID NO:85,包含于SEQ IDNO:69的约1312-1396位置的氨基酸序列范围内。包含ACP4的核苷酸序列本文记作SEQ ID NO:86,包含于SEQ ID NO:68的约4261-4515位置的核苷酸序列范围内。包含ACP4的氨基酸序列本文记作SEQ ID NO:87,包含于SEQ ID NO:69的约1421-1505位置的氨基酸序列范围内。包含ACP5的核苷酸序列本文记作SEQ ID NO:88,包含于SEQ ID NO:68的约4589-4842位置的核苷酸序列范围内。包含ACP5的氨基酸序列本文记作SEQ ID NO:89,包含于SEQ ID NO:69的约1530-1614位置的氨基酸序列范围内。包含ACP6的核苷酸序列本文记作SEQ ID NO:90,包含于SEQ ID NO:68的约4915-5169位置的核苷酸序列范围内。包含ACP6的氨基酸序列本文记作SEQ ID NO:91,包含于SEQ ID NO:69的约1639-1723位置的氨基酸序列范围内。包含ACP7的核苷酸序列本文记作SEQ ID NO:92,包含于SEQ ID NO:68的约5242-5496位置的核苷酸序列范围内。包含ACP7的氨基酸序列本文记作SEQ ID NO:93,包含于SEQ ID NO:69的约1748-1832位置的氨基酸序列范围内。包含ACP8的核苷酸序列本文记作SEQ ID NO:94,包含于SEQ ID NO:68的约5569-5832位置的核苷酸序列范围内。包含ACP8的氨基酸序列本文记作SEQ ID NO:95,包含于SEQ ID NO:69的约1857-1941位置的氨基酸序列范围内。包含ACP9的核苷酸序列本文记作SEQ ID NO:96,包含于SEQ ID NO:68的约5896-6150位置的核苷酸序列范围内。包含ACP9的氨基酸序列本文记作SEQ ID NO:97,包含于SEQ ID NO:69的约1966-2050位置的氨基酸序列范围内。包含ACP10的核苷酸序列本文记作SEQ ID NO:98,包含于SEQ ID NO:68的约6199-6453位置的核苷酸序列范围内。包含ACP10的氨基酸序列本文记作SEQ ID NO:99,包含于SEQ ID NO:69的约2067-2151位置的氨基酸序列范围内。所有10种ACP结构域一起覆盖破囊壶菌ATCC PTA-10212 Pfa1的SEQ ID NO:68的约3208-6510位置的区域,对应SEQ ID NO:69的氨基酸位置1070-2170。包含所有10个结构域的整个ACP区域的核苷酸序列本文中记作SEQ ID NO:78;而包含所有6个结构域的整个ACP区域的氨基酸序列记作SEQ ID NO:79。SEQ ID NO:78内10个ACP区域的重复间隔约为每327个核苷酸(相邻活性位点丝氨酸间的氨基酸实际数目范围为101-109个氨基酸)。10个ACP结构域的每一个包含泛酰巯基乙胺结合基序LGIDS*(SEQ ID NO:47),其中S*是泛酰巯基乙胺结合位点丝氨酸(S)。泛酰巯基乙胺结合位点丝氨酸(S)位置靠近每个ACP结构域序列的中央。6个ACPD结构域的活性位点丝氨酸的位置(即泛酰巯基乙胺结合位点),对于SEQ ID NO:69的氨基酸序列而言是:ACP1=S1135、ACP2=S1244、ACP3=S1353、ACP4=S1462、ACP5=S1571、ACP6=S1680、APC7=S1789、ACP7=S1789、ACP8=S1898、ACP9=S=2007和ACP10=S2108。
破囊壶菌ATCC PTA-10212 Pfa1的第13个结构域是KR结构域。包含Pfa1KR结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:100,对应SEQ IDNO:68的第6808-8958位。包含Pfa1 KR结构域的氨基酸序列在此表示为SEQID NO:101,对应SEQ ID NO:69的第2270-2986位。KR结构域内部是与短链醛脱氢酶(KR是该家族成员)同源的核心区域(包含于核苷酸序列SEQ IDNO:116和氨基酸序列SEQ ID NO:117中)。该核心区域范围是SEQ ID NO:68的约5998-6900位,对应SEQ ID NO:69的2000-2300氨基酸位置。
破囊壶菌ATCC PTA-10212 Pfa1的第14个结构域是DH结构域。包含Pfa1DH结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:118,对应SEQ IDNO:68的第7027-7065位。包含Pfa1 DH结构域的氨基酸序列在此表示为SEQID NO:119,对应SEQ ID NO:69的第2343-2355位。DH结构域包含保守的活性位点基序(参见Donadio,S.和Katz.,L.,Gene 111(1):51-60(1992)):LxxHxxxGxxxxP(SEQ ID NO:50)。
表10显示与破囊壶菌ATCC PTA-10212PFA2相关的结构域和活性位点。
表10:破囊壶菌ATCC PTA-10212 PFA2结构域分析
破囊壶菌ATCC PTA-10212 Pfa2的第一个结构域是KS结构域。包含破囊壶菌ATCC PTA-10212 Pfa2 KS结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:102,对应SEQ ID NO:70的第10-1320位。包含破囊壶菌ATCCPTA-10212 Pfa2 KS结构域的氨基酸序列在此表示为SEQ ID NO:103,对应SEQ ID NO:71的第4-440位。KS结构域包含活性位点基序:DXAC*(SEQ IDNO:43),其中*酰基结合位点对应SEQ ID NO:71的C191。同样,KS结构域末端存在一个特征性基序:GFGG(SEQ ID NO:44),对应SEQ ID NO:71的第423-426位以及SEQ ID NO:70的第1267-1278位。
破囊壶菌ATCC PTA-10212 Pfa2的第二个结构域是CLF结构域。包含破囊壶菌ATCC PTA-10212 Pfa2 CLF结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:104,对应SEQ ID NO:70的第1378-2700位。包含破囊壶菌ATCC PTA-10212Pfa2CLF结构域的氨基酸序列在此表示为SEQ ID NO:105,对应SEQ ID NO:71的第460-900位。
破囊壶菌ATCC PTA-10212 Pfa2的第三个结构域是AT结构域。包含破囊壶菌ATCC PTA-10212 Pfa2 AT结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:106,对应SEQ ID NO:70的第2848-4200位。包含破囊壶菌ATCCPTA-10212 Pfa2 AT结构域的氨基酸序列在此表示为SEQ ID NO:107,对应SEQ ID NO:71的第950-1400位。AT结构域包含活性位点基序GxS*xG(SEQID NO:50),这是酰基转移酶(AT)蛋白的特征,活性位点丝氨酸残基对应SEQID NO:71的S1121。
破囊壶菌ATCC PTA-10212 Pfa2的第四个结构域是ER结构域。包含破囊壶菌ATCC PTA-10212 Pfa2 ER结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:108,对应SEQ ID NO:70的第4498-5700位。包含破囊壶菌ATCCPTA-10212 Pfa2 ER结构域的氨基酸序列在此表示为SEQ ID NO:109,对应SEQ ID NO:71的第1500-1900位。
表11显示与破囊壶菌ATCC PTA-10212 PFA3相关的结构域和活性位点。
表11:破囊壶菌ATCC PTA-10212 PFA3结构域分析
破囊壶菌ATCC PTA-10212 Pfa3的第一和第二个结构域本文分别记作DH1和DH2。包含破囊壶菌ATCC PTA-10212 Pfa3 DH1结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:110,对应SEQ ID NO:72的第1-1350位。包含破囊壶菌ATCC PTA-10212Pfa3DH1结构域的氨基酸序列在此表示为SEQ ID NO:111,对应SEQ ID NO:73的第1-450位。包含破囊壶菌ATCCPTA-10212 Pfa3 DH2结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:112,对应SEQ ID NO:72的第1501-2700位。包含破囊壶菌ATCC PTA-10212Pfa3 DH2结构域的氨基酸序列在此表示为SEQ ID NO:113,对应SEQ ID NO:73的第501-900位。DH结构域包含活性位点基序:FxxH*F(SEQ ID NO:53).DH1中包含活性位点基序的核苷酸序列对应SEQ ID NO:72的位置934-936,而DH2中包含活性位点基序的核苷酸序列对应SEQ ID NO:72的位置2401-2403。基序FxxH*F中的活性位点H*基于来自Leesong等,Structure4:253-64(1996)和Kimber等,J Biol Chem.279:52593-602(2004)的数据,DH1中的活性位点H*对应SEQ ID NO:73的H312,DH2中的活性位点H*对应SEQ ID NO:73的H801。
破囊壶菌ATCC PTA-10212Pfa3的第三个结构域是ER结构域。包含破囊壶菌ATCC PTA-10212 Pfa3 ER结构域的编码序列的核苷酸序列在此表示为SEQ ID NO:114,对应SEQ ID NO:72的第2848-4200位。包含破囊壶菌ATCCPTA-10212 Pfa3 ER结构域的氨基酸序列在此表示为SEQ ID NO:115,对应SEQ ID NO:73的第950-1400位。
实施例7
之前展示并描述了在裂殖壶菌ATCC 20888中失活天然的PUFA合酶基因,以产生PUFA营养缺陷型,并用外源引入同源基因替换此类失活基因以恢复PUFA合成。参见例如,美国专利号7,217,856,将其全文纳入本文作参考。之前将三个来源于裂殖壶菌ATCC 20888的PUFA合酶基因命名为orfA、orfB和orfC,分别对应本文所用PFA1、PFA2和PFA3的命名法。同上。
用包含orfA侧接区域序列包围的零霉素(Zeocin)TM抗性标记物的载体转化后,通过同源重组替换裂殖壶菌ATCC 20888的天然orfA基因。产生缺少功能性orfA基因的突变株。该突变株是营养缺陷型,生长需要补充PUFA。
将裂殖壶菌ATCC PTA-9695 PFA1(SEQ ID NO:1)克隆入表达载体pREZ37产生pREZ345。表达载体包含来自裂殖壶菌ATCC 20888的天然orfA基因座的侧接区域的约2kb DNA。使用包含PFA1的pREZ345通过电穿孔加上酶预处理(见下)转化缺少功能性orfA的裂殖壶菌ATCC 20888突变子。基于突变体中侧接零霉素TM抗性标记物和pREZ345中侧接PFA1基因的同源区域,发生双交叉重组,从而使PFA1插入天然的orfA基因座。与裂殖壶菌ATCCPTA-9695 PFA1(SEQ ID NO:1)发生重组恢复了缺少orfA的裂殖壶菌(Schizochytrium sp)ATCC 20888突变体的PUFA生产。简而言之,将细胞在M2B液体培养基(见下)中30℃200rpm振荡培养3天。收集细胞,利用标准技术将脂肪酸转化为甲酯。使用配备火焰离子化探测的气相色谱(GC-FID)确定脂肪酸甲酯(FAME)形式的脂肪酸分布。包含功能性orfA基因的天然裂殖壶菌(Schizochytrium sp.)ATCC 20888菌株以2.3∶1的比例产生DHA和DPA。其中失活orfA基因替换为裂殖壶菌(Schizochytrium sp.)ATCC PTA-9695 PFA1(SEQID NO:1)的重组菌株也以2.4∶1的比例产生DHA和DPA n-6。重组菌株的EPA含量为2.7%脂肪酸甲酯(FAME),DPA n-3含量为0.7%,DPA n-6含量为8.8%,DHA含量为21.2%。
M2B培养基-10g/L葡萄糖、0.8g/L(NH4)2SO4、5g/L Na2SO4、2g/LMgSO4·7H2O、0.5g/L KH2PO4、0.5g/L KCl、0.1g/L CaCl2·2H2O、0.1M MES(pH6.0)0.1%PB26金属和0.1%PB26维生素s(v/v)。PB26维生素由50mg/mL维生素B12、100μg/mL硫胺素和100μg/mL Ca-泛酸盐组成。调节PB26为pH 4.5,它由3g/L FeSO4·7H2O、1g/L MnCl2·4H2O、800mg/mL ZnSO4·7H2O、20mg/mLCoCl2·6H2O、10mg/mL Na2MoO4·2H2O、600mg/mL CuSO4·5H2O,和800mg/mLNiSO4·6H2O组成。将PB26母液分别过滤除菌,并在高压灭菌后加入肉汤。将葡萄糖、KH2PO4和CaCl2·2H2O每种均在与肉汤其它组分混合前单独高压灭菌,以防止盐沉淀和糖焦化。所有培养基成分均购自密苏里州圣路易斯的西格玛化学公司(Sigma Chemical,St Louis,MO)。
电穿孔和酶预处理-细胞生长于50mL M50-20培养基中(参见美国公开号2008/0022422),30℃振荡培养2天。用M2B培养基以1∶100比例稀释细胞并培养过夜(16-24h),让其生长至对数中期(OD600 1.5-2.5)。将细胞在50mL锥形管中约3000x g离心5min。去掉上清,然后将细胞重悬于合适体积的1M甘露醇,pH 5.5中,使其终浓度为2个OD
600单位。将5mL细胞分装入25mL振荡培养瓶,加入10mM CaCl
2(1.0M母液,过滤除菌)和0.25mg/mL蛋白酶XIV (10mg/mL母液,过滤除菌;西格玛-奥德里奇公司,密苏里圣路易斯)(Sigma-Aldrich,St.Louis,MO)。将培养瓶在30℃约100rpm振荡培养4h。在显微镜下观察形成原生质体的程度,最好是单细胞。将细胞在圆底试管(即14mL鹰牌(Falcon)
TM试管,BD生物科学,加州圣何塞(BD Biosciences,SanJose,CA))中2500x g离心5min。去除上清,将细胞轻柔重悬于5mL冰冷的10%甘油中。在圆底试管中将细胞再次约2500x g离心5min。去除上清,使用粗枪头将细胞轻柔重悬于500μL冰冷的10%甘油中。将90μL细胞分装入预冷的电转杯中(基因脉冲(Gene Pulser)
杯-0.1cm间隙或0.2cm间隙,伯乐公司,加州赫尔库司)(Bio-Rad,Hercules,CA)。将1-5μg DNA(小于等于10μL体积)加入杯中,用移液器头轻柔混合,置于冰上5min。在200欧姆(电阻)、25μF(电容)以及250V(0.1cm间隙)或500V(0.2cm间隙)的条件下对细胞进行电穿孔。立即将0.5mL M50-20培养基加入杯中。接着将细胞转移到含4.5mLM50-20培养基的25mL振荡培养瓶中,并在30℃约100rpm振荡培养2-3h。在圆底试管中将细胞约2500x g离心5min。去除上清,将细胞团块重悬于0.5mLM50-20培养基中。将细胞铺板于合适数量(2-5)的含合适选择压力的M2B平板上,并在30℃孵育。
也用含有PFA1的pREZ345转化缺少功能性orfA的裂殖壶菌(Schizochytrium sp.)ATCC 20888突变体,以使PFA1随机整合入该突变体,并恢复产生PUFA。
实施例8
重新合成破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:68)(DNA2.0),并为在裂殖壶菌中表达进行密码子优化(SEQ ID NO:120),然后将其克隆入表达载体中产生pLR95。使用裂殖壶菌密码子使用表进行密码子优化(图22)。表达载体包含来自裂殖壶菌ATCC 20888的天然orfA基因座的侧接区域的约2kbDNA。
通过电穿孔以及酶预处理(参见实施例7),利用含有密码子优化的破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:120)的pLR95转化来自实施例7的缺少功能性orfA的裂殖壶菌ATCC 20888。基于突变体中侧接零霉素TM抗性标记物和pLR95中侧接PFA1基因的同源区域,发生双交叉重组,从而使密码子优化的破囊壶菌ATCC PTA-10212 PFA1插入天然的orfA基因座。与密码子优化的破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:120)发生重组恢复了缺少orfA的裂殖壶菌ATCC 20888突变体的PUFA生产。如实施例7进行细胞培养和FAME分析。包含功能性orfA基因的天然裂殖壶菌ATCC 20888菌株以25∶1的比例产生DHA和DPA。其中失活orfA基因替换为密码子优化的破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:120)的重组菌株以5.4∶1的比例产生DHA和DPA,这进一步表明裂殖壶菌中的PUFA分布特征可被本文所述核酸分子所改变。重组菌株的EPA含量为4.4%FAME,DPA n-3含量为2.3%,DPA n-6含量为4.9%,DHA含量为24.0%。
也用含有PFA1的pLR95转化缺少功能性orfA的裂殖壶菌ATCC 20888突变体,从而使PFA1随机整合入该突变体,并恢复产生PUFA。
实施例9
通过电穿孔以及酶预处理(参照实施例7)用包含orfB侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换裂殖壶菌ATCC 20888的天然orfB基因。产生缺少功能性orfB基因的突变株。该突变株是营养缺陷型,生长需要补充PUFA。
将裂殖壶菌ATCC PTA-9695PFA2(SEQ ID NO:3)克隆入表达载体pDS04产生pREZ331。表达载体包含来自裂殖壶菌ATCC 20888的天然orfB基因座的侧接区域的约2kb DNA。
用包含PFA2的pREZ331转化缺少功能性orfB的裂殖壶菌ATCC 20888。基于突变体中的随机整合,裂殖壶菌ATCC PTA-9695 PFA2(SEQ ID NO:3)恢复了PUFA的产生。
如实施例7进行细胞培养和FAME分析。
包含功能性orfB基因的天然裂殖壶菌ATCC 20888菌株以2.3∶1的比例产生DHA和DPA n-6。其中失活orfB基因替换为裂殖壶菌ATCC PTA-9695PFA2(SEQ ID NO:3)的重组菌株以3.5∶1的比例产生DHA和DPA n-6。重组菌株的EPA含量为0.8%FAME,DPA n-3含量为0.1%,DPA n-6含量为7.1%以及DHA含量为25.1%。
也用含有PFA2的pREZ331转化缺少功能性orfB的裂殖壶菌ATCC 20888突变体,从而使PFA2插入天然orfB基因座,并恢复产生PUFA。
实施例10
重新合成破囊壶菌ATCC PTA-10212 PFA2(SEQ ID NO:70)(DNA2.0),并为在裂殖壶菌中表达进行密码子优化(SEQ ID NO:121),然后将其克隆入表达载体产生pLR85。使用裂殖壶菌密码子使用表进行密码子优化(图22)。表达载体包含来自裂殖壶菌ATCC 20888的天然orfB基因座的侧接区域的约2kbDNA。
在DHA产量提高的裂殖壶菌ATCC 20888的子品系中也对orf基因的替换进行了研究。通过电穿孔以及酶预处理(参照实施例7)用包含orfB侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换子菌株的天然orfB基因。产生缺少功能性orfB基因的突变株。该突变株是营养缺陷型,生长需要补充PUFA。使用包含密码子优化的破囊壶菌ATCC PTA-10212PFA2(SEQ ID NO:121)的pLR85通过电穿孔以及酶预处理转化突变株(参见实施例8)。基于突变体中侧接零霉素TM抗性标记物和pLR85中侧接PFA2基因的同源区域,发生双交叉重组,从而使密码子优化的破囊壶菌ATCC PTA-10212PFA2插入天然的orfB基因座。与密码子优化的破囊壶菌(Thraustochytriumsp.)ATCC PTA-10212PFA2(SEQ ID NO:121)发生重组恢复了缺少orfB的子菌株突变体的PUFA生产。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为1.0%FAME,DPA n-3含量为0.3%,DPA n-6含量为7.0%以及DHA含量为31.0%。
在进行的实验中,通过电穿孔以及酶预处理(参见实施例8),利用含有密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212PFA2(SEQ IDNO:121)的pLR85转化来自实施例9的缺少功能性orfB的裂殖壶菌ATCC20888突变体。基于突变体中侧接零霉素TM抗性标记物和pLR85中侧接PFA2基因的同源区域,发生双交叉重组,从而使密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212 PFA2插入天然的orfB基因座。与密码子优化的破囊壶菌(Thraustochytrium sp.)ATCC PTA-10212PFA2(SEQ ID NO:121)发生重组恢复了缺少orfB的裂殖壶菌ATCC 20888突变体的PUFA生产。
也用含有PFA2的pLR85转化裂殖壶菌ATCC 20888以及缺少功能性orfB的子菌株突变体,以使PFA2随机整合入该突变体,并恢复每种突变体的PUFA生产。
实施例11
通过用源自细菌转座子Tn5的新霉素磷酸转移酶II(npt)的编码区代替pMON50000/pTUBZEO11-2中的博来霉素/零霉素TM抗性基因(ble)编码区(美国专利7,001,772B2),为裂殖壶菌ATCC 20888开发含有在裂殖壶菌中有功能的巴龙霉素抗性标记物盒的质粒。pMON50000中,ble抗性基因由裂殖壶菌(Schizochytrium)α-微管蛋白启动子驱动,并且后随SV40转录终止子。pMON50000中的ble区域在ATG起始密码子处包含NcoI限制性位点,紧随TGA终止信号后包含PmlI限制性位点。使用PCR扩增pCaMVnpt中的npt编码区(Shimizu等,Plant J.26(4):375(2001)),因此产物在起始ATG(粗体)处包含BspHI限制性位点(下文下划线部分,引物CAX055),在紧随终止信号(粗体-反向互补)处包含PmlI限制性位点(下文下划线部分,引物CAX056):
CAX055(正向):G
TTGAACAAGATGGATTGCAC(SEQ IDNO:66)
CAX056(反向):C
CACGTG GAAGAACTCGTCAAGAA(SEQ IDNO:67).
使用TaqMaster聚合酶试剂盒(5Prime),将产物克隆进入pCR4-TOPO(英骏公司),用所得质粒转化大肠杆菌(E.coli)TOP10(英骏公司)。使用载体引物的DNA序列分析鉴定出包含所需805bp结构的多个克隆(即,序列与源模板加上工程改造的限制性位点匹配)。通过BspHI和PmlI限制性酶消化将修饰的npt编码区域分离,将纯化的DNA片段与NcoI和PmlI酶消化产生的pMON50000载体片段连接。限制性酶BspHI和NcoI留下兼容交叠末端,PmlI留下钝末端。得到的质粒pTS-NPT包含npt新霉素/巴龙霉素抗性基因,且与原来pMON50000中ble基因构架相同。
使用裂殖壶菌(Schizochytrium)粒子轰击(美国专利号7,001,772B2)评价pTS-NPT中新巴龙霉素抗性盒的功能。在包含50μg/mL硫酸巴龙霉素(西格玛公司(Sigma))的琼脂平板上进行巴龙霉素(APR)抗性选择。发现巴龙霉素抗性裂殖壶菌(Schizochytrium)转化子的频率与来自pMON50000的零霉素TM抗性相似。可使用多种限制性酶将“α-微管蛋白启动子/npt/SV40终止子”盒从pTS-NPT中释放,后续可用作其它开发用途。
实施例12
用包含来自orfC侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换裂殖壶菌ATCC 20888的天然orfC基因。产生缺少功能性orfC基因的突变株。该突变株是营养缺陷型,生长需要补充PUFA。
将裂殖壶菌ATCC PTA-9695PFA3(SEQ ID NO:5)克隆入表达载体pREZ22中产生pREZ324。表达载体包含裂殖壶菌ATCC 20888天然orfC基因座的侧接区域的约2kb DNA。
用包含裂殖壶菌ATCC PTA-9695 PFA3的pREZ324转化缺少功能性orfC的裂殖壶菌ATCC 20888。基于突变体中侧接巴龙霉素抗性标记物和pREZ324中侧接裂殖壶菌PTA-9695 PFA3基因的同源区域,发生双交叉重组,从而使裂殖壶菌ATCC PTA-9695 PFA3插入天然的orfC基因座。与裂殖壶菌ATCCPTA-9695 PFA3(SEQ ID NO:5)发生同源重组恢复了缺少orfC的裂殖壶菌ATCC 20888突变体的PUFA生产。如实施例7进行细胞培养和FAME分析。包含功能性orfC基因的天然裂殖壶菌ATCC 20888菌株以2.3∶1的比例产生DHA和DPA n-6。其中失活orfC基因替换为裂殖壶菌ATCC PTA-9695 PFA3(SEQ ID NO:5)的重组株以14∶9的比例产生DHA和DPA n-6,进一步表明裂殖壶菌的PUFA分布特征可被本文所述的核酸分子所改变。重组菌株的EPA含量为1.2%FAME,DPA n-3含量为0.2%,DPA n-6含量为2.9%以及DHA含量为43.4%。
也用含有PFA3的pREZ324转化缺少功能性orfC的裂殖壶菌ATCC 20888突变体,因此使PFA3随机整合入该突变体,并恢复产生PUFA。重组菌株的EPA含量为1.2%FAME,DPA n-3含量为0.2%,DPA n-6含量为2.5%以及DHA含量为39.1%。
用包含orfC侧接区域序列包围的巴龙霉素抗性标记物的载体转化后,通过同源重组替换实施例10中讨论的子菌株的天然orfC基因。产生缺少功能性orfC基因的突变株。该突变株是营养缺陷型,生长需要补充PUFA。用pREZ324转化缺少功能性orfC的突变体。发生双交叉重组,使裂殖壶菌ATCC PTA-9695PFA3插入到突变株的天然orfC基因座。与裂殖壶菌ATCC PTA-9695PFA3(SEQ ID NO:5)发生同源重组恢复了缺少orfC的子菌株突变体的PUFA生产。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为1.2%FAME,DPA n-3含量为0.3%,DPA n-6含量为2.8%以及DHA含量为43.1%。
也用含有PFA3的pREZ324转化缺少功能性orfB的子菌株突变体,从而使PFA3随机整合入突变体中,并恢复产生PUFA。
实施例13
重新合成破囊壶菌ATCC PTA-10212PFA3(SEQ ID NO:72)(DNA2.0),并为在裂殖壶菌中表达进行密码子优化(SEQ ID NO:122),然后将其克隆入表达载体pREZ22产生pREZ337。使用裂殖壶菌密码子使用表进行密码子优化(图22)。表达载体包含来自裂殖壶菌ATCC 20888天然orfC基因座的侧接区域的约2kb DNA。
使用包含密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)的pREZ337通过电穿孔以及酶预处理转化实施例12中的缺少功能性orfC的子菌株突变株(参见实施例8)。基于突变体中侧接零霉素TM抗性标记物和pREZ337中侧接PFA3基因的同源区域,发生双交叉重组,从而使密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)插入天然的orfC基因座。与密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)发生重组恢复了缺少orfC的子菌株突变体的PUFA生产。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为1.3%FAME,DPA n-3含量为0.4%,DPAn-6含量为2.7%以及DHA含量为50.2%。
在进行的实验中,通过电穿孔以及酶预处理(参见实施例8),利用含有密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)的pREZ337转化来自实施例12的缺少功能性orfC的裂殖壶菌ATCC 20888突变体。基于突变体中侧接零霉素TM抗性标记物和pREZ337中侧接PFA3基因的同源区域,发生双交叉重组,从而使密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQID NO:122)插入天然的orfC基因座。与密码子优化的破囊壶菌ATCCPTA-10212 PFA3(SEQ ID NO:122)发生重组恢复了缺少orfC的裂殖壶菌ATCC20888突变体的PUFA生产。
也用含有PFA3的pREZ337转化缺少功能性orfC的裂殖壶菌ATCC 20888以及子菌株突变体,以使PFA3随机整合入该突变体,并恢复每种突变体的PUFA生产。
实施例14
在用包含合适orf侧接区域序列包围的零霉素TM或巴龙霉素抗性标记物的载体转化裂殖壶菌ATCC 20888后,通过同源重组替换orfA、orfB和orfC中的任何两种或全部三种。产生缺少orfA、orfB和orfC中任何两种或全部三种功能性基因的突变菌株。该突变株是营养缺陷型,生长需要补充PUFA。
用包含对应PFA基因(SED ID NO:1、3、5、120、121或122中的一种或多种)的一种或多种表达载体转化缺少功能性orf基因的裂殖壶菌ATCC20888突变体。基于突变株中侧接零霉素TM或巴龙霉素抗性标记物和各个载体中侧接PFA基因的同源区域,发生双交叉重组,从而使PFA基因插入到天然的orf基因座中。这些表达载体的随机整合也可在仅基于恢复PUFA生产的转化子选择中。与PFA基因同源重组恢复了突变株中的PUFA产生,从而基于插入突变株的PFA基因的组合,恢复或改变天然的PUFA分布特征。
在进行的实验中,用实施例12中缺少功能性orfC基因并包含随机整合的裂殖壶菌ATCC PTA-9695 PFA3(SEQ ID NO:5)的裂殖壶菌ATCC 20888菌株替换orfA和orfB。用包含orfA和orfB侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换菌株的天然orfA和orfB基因。产生的菌株缺少功能性orfA、orfB和orfC,并且包含随机整合的裂殖壶菌ATCCPTA-9695 PFA3。用包含密码子优化裂殖壶菌ATCC PTA-9695PFA1(SEQ IDNO:1)的pREZ345和包含密码子优化的裂殖壶菌ATCC PTA-9695PFA2(SEQID NO:3)的pREZ331转化菌株,以便随机整合PFA1和PFA2。得到的缺少功能性orfA、orfB和orfC的重组菌株包含随机整合的裂殖壶菌ATCC PTA-9695PFA1、PFA2和PFA3。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为6.6%FAME,DPA n-3含量为0.8%,DPA n-6含量为1.6%以及DHA含量为20.9%。
在另一个进行的实验中,实施例12中缺少功能性orfC基因并插入天然orfC基因座的裂殖壶菌ATCC PTA-9695PFA3(SEQ ID NO:5)的子菌株用于替换orfA和orfB基因。用包含orfA和orfB侧接区域序列包围的巴龙霉素抗性标记物的载体转化后,通过同源重组替换菌株的天然orfA和orfB基因。产生的菌株缺少功能性orfA、orfB和orfC,并且包含插入到天然orfC基因座中的裂殖壶菌ATCC PTA-9695 PFA3。用包含密码子优化的裂殖壶菌ATCCPTA-9695 PFA1(SEQ ID NO:1)的pREZ345和包含密码子优化的裂殖壶菌ATCC PTA-9695 PFA2(SEQ ID NO:3)的pREZ331转化菌株。发生双交叉重组,从而使裂殖壶菌ATCC PTA-9695 PFA1插入到菌株的天然orfA基因座中,并使裂殖壶菌ATCC PTA-9695 PFA2插入到菌株的天然orfB基因座中。所得重组菌株缺少功能性orfA、orfB和orf,并包含裂殖壶菌各自分别插入orfA、orfB和orfC基因座的ATCC PTA-9695 PFA1、PFA2和PFA3。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为7.3%FAME,DPA n-3含量为0.4%,DPA n-6含量为1.5%以及DHA含量为23.9%。
在另一个进行的实验中,实施例12中缺少功能性orfC基因并包含随机整合的裂殖壶菌ATCC PTA-9695 PFA3(SEQ ID NO:5)的子菌株用于替换orfA和orfB基因。用包含orfA和orfB侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换菌株的天然orfA和orfB基因。产生的菌株缺少功能性orfA、orfB和orfC,并且包含随机整合的裂殖壶菌ATCC PTA-9695PFA3。用包含密码子优化裂殖壶菌ATCC PTA-9695 PFA1(SEQ ID NO:1)的pREZ345和包含密码子优化的裂殖壶菌ATCC PTA-9695 PFA2(SEQ ID NO:3)的pREZ331转化菌株,以便随机整合PFA1和PFA2。得到的缺少功能性orfA、orfB和orfC的重组菌株包含随机整合的裂殖壶菌ATCC PTA-9695 PFA1、PFA2和PFA3。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为6.2%FAME,DPA n-3含量为1.3%,DPA n-6含量为0.9%以及DHA含量为16.6%。
在另一个进行的实验中,实施例13中缺少功能性orfC基因并包含插入天然orfC基因座的裂殖壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)的子菌株用于替换orfA和orfB基因。用包含orfA和orfB侧接区域序列包围的巴龙霉素抗性标记物的载体转化后,通过同源重组替换菌株的天然orfA和orfB基因。产生的菌株缺少功能性orfA、orfB和orfC,并且包含插入到天然orfC基因座中的裂殖壶菌ATCC PTA-10212 PFA3。用包含密码子优化的裂殖壶菌ATCCPTA-10212 PFA1(SEQ ID NO:120)的pLR95和包含密码子优化的裂殖壶菌ATCC PTA-10212 PFA2(SEQ ID NO:121)的pLR85转化菌株。发生双交叉重组,从而使裂殖壶菌ATCC PTA-10212 PFA1插入到菌株的天然orfA基因座中,并使裂殖壶菌ATCC PTA-10212 PFA2插入到菌株的天然orfB基因座中。所得重组菌株缺少功能性orfA、orfB和orf,并包含各自分别插入orfA、orfB和orfC基因座的裂殖壶菌ATCC PTA-10212 PFA1、PFA2和PFA3。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为5.2%FAME,DPA n-3含量为0.6%,DPA n-6含量为2.1%以及DHA含量为47.1%。
在另一个进行的实验中,实施例13中缺少功能性orfC基因并包含随机整合的裂殖壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)的子菌株用于替换orfA和orfB基因。用包含orfA和orfB侧接区域序列包围的零霉素TM抗性标记物的载体转化后,通过同源重组替换菌株的天然orfA和orfB基因。产生的菌株缺少功能性orfA、orfB和orfC,并且包含随机整合的裂殖壶菌ATCCPTA-10212 PFA3。用包含密码子优化的裂殖壶菌ATCC PTA-10212PFA1(SEQID NO:120)的pLR95和包含密码子优化的裂殖壶菌ATCC PTA-10212 PFA2(SEQ ID NO:121)的pLR85转化菌株,以便随机整合PFA1和PFA2。得到的缺少功能性orfA、orfB和orfC的重组菌株包含随机整合的裂殖壶菌ATCCPTA-10212 PFA1、PFA2和PFA3。如实施例7进行细胞培养和FAME分析。重组菌株的EPA含量为1.8%FAME,DPA n-3含量为1.8%,DPA n-6含量为2.3%以及DHA含量为34.1%。
实施例15
将来自裂殖壶菌ATCC 20888的orfA、orfB和orfC基因克隆入一系列的二重载体(Duet vector)(诺瓦基公司(Novagen))。该二重表达载体是一套兼容性质粒,其中克隆有多个目标基因,并由大肠杆菌的T7诱导型启动子共表达。二重质粒pREZ91在pETDuet-1中包含裂殖壶菌ATCC 20888 orfA;二重质粒pREZ96在pCDFDuet-1中包含裂殖壶菌ATCC 20888 orfB;二重质粒pREZ101在pCOLADuet-1中包含裂殖壶菌ATCC 20888 orfC。将二重质粒pREZ91、pREZ96和pREZ101,以及包含所需附属基因HetI的质粒pJK737(如美国专利7,217,856所述,整体纳入作参考)转化到包含诱导型T7RNA聚合酶基因的大肠杆菌菌株BLR(DE3)中。细胞生长和加入IPTG后,根据厂商指南(诺瓦基公司),产生DHA和DPA n-6。简而言之,当细胞600nm光密度达到约0.5,加入1mM IPTG用于诱导。细胞在30℃卢里亚(Luria)肉汤中生长12小时后收集。用标准技术将脂肪酸转化为甲酯。使用配备火焰离子化探测的气相色谱(GC-FID)确定脂肪酸甲酯(FAME)形式的脂肪酸分布。
将裂殖壶菌ATCC PTA-9695 PFA1(SEQ ID NO:1)基因克隆入表达载体pETDuet-1中产生pREZ346。将二重质粒pREZ346(包含裂殖壶菌ATCCPTA-9695PFA1)、pREZ96(包含orfB)以及pREZ101(包含orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。裂殖壶菌ATCC PTA-9695 PFA1基因与裂殖壶菌ATCC 20888 orfB和orfC基因共表达。裂殖壶菌ATCCPTA-9695 PFA1以及裂殖壶菌ATCC 20888 orfB和orfC在诱导条件下表达时支持大肠杆菌中产生DHA。转化大肠杆菌的DHA含量为2.8%FAME,DPA n-6含量为1.1%,DPA n-3含量为0.6%以及EPA含量为3.7%。
实施例16
将密码子优化的破囊壶菌ATCC PTA-10212 PFA1(SEQ ID NO:120)基因克隆入表达载体pETDuet-1中产生pLR100。将二重质粒pLR100(包含密码子优化的破囊壶菌ATCC PTA-10212PFA1)、pREZ96(包含裂殖壶菌ATCC 20888的orfB)、pREZ101(包含裂殖壶菌ATCC 20888的orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。破囊壶菌ATCCPTA-10212 PFA1与裂殖壶菌ATCC 20888 orfB和orfC基因共表达。破囊壶菌ATCC PTA-10212 PFA1以及裂殖壶菌ATCC 20888 orfB和orfC在诱导条件下表达支持大肠杆菌中产生DHA和EPA。
实施例17
将裂殖壶菌ATCC PTA-9695 PFA3(SEQ ID NO:5)基因克隆入表达载体pCOLADuet-1产生pREZ326。将二重质粒pREZ326(包含裂殖壶菌ATCCPTA-9695PFA3)、pREZ91(包含裂殖壶菌ATCC PTA-20888的orfA)、pREZ96(包含裂殖壶菌ATCC 20888的orfB)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。裂殖壶菌ATCC PTA-9695 PFA3以及裂殖壶菌ATCC 20888 orfA和orfB在诱导条件下的表达支持大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为0.3%FAME。
实施例18
将密码子优化的破囊壶菌ATCC PTA-10212 PFA3(SEQ ID NO:122)基因克隆入表达载体pCOLADuet-1产生pREZ348。将二重质粒pREZ348(包含密码子优化的破囊壶菌ATCC PTA-10212 PFA3)、pREZ91(包含裂殖壶菌ATCC20888 orfA)、pREZ96(包含裂殖壶菌ATCC 20888的orfB)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。破囊壶菌ATCCPTA-10212 PFA3以及裂殖壶菌ATCC 20888 orfA和orfB在诱导条件下表达支持大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌DHA含量为2.9%FAME,DPA n-6含量为0.4%。
实施例19
将裂殖壶菌ATCC PTA-9695 PFA2(SEQ ID NO:3)基因克隆入表达载体pCDFDuet-1产生pREZ330。将二重质粒pREZ330(包含裂殖壶菌ATCCPTA-9695 PFA2)、pREZ326(包含裂殖壶菌ATCC PTA-9695 PFA3)、pREZ91(包含裂殖壶菌ATCC 20888的orfA)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例9。裂殖壶菌ATCC PTA-9695 PFA2和PFA3以及裂殖壶菌ATCC 20888 orfA在诱导条件下表达支持大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌DHA含量为0.8%FAME,DPA n-6含量为0.2%。
实施例20
将密码子优化的破囊壶菌ATCC PTA-10212 PFA2(SEQ ID NO:121)基因克隆入表达载体pCDFDuet-1产生pLR87。将二重质粒pLR87(包含密码子优化的裂殖壶菌ATCC PTA-10212 PFA2)、pREZ348(包含密码子优化的破囊壶菌ATCC PTA-10212 PFA3)、pREZ91(包含裂殖壶菌ATCC 20888的orfA)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。破囊壶菌ATCC PTA-10212 PFA2和PFA3以及裂殖壶菌ATCC 20888 orfA在诱导条件下表达支持大肠杆菌中产生DHA和低水平EPA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为4.4%FAME,DPA n-6含量为1.1%,EPA含量为0.1%。
实施例21
将二重质粒pREZ346(包含裂殖壶菌ATCC PTA-9695 PFA1)、pREZ330(包含裂殖壶菌ATCC PTA-9695 PFA2)、pREZ326(包含裂殖壶菌ATCC PTA-9695PFA3)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。裂殖壶菌ATCC PTA-9695 PFA1、PFA2和PFA3在诱导条件下表达支持在大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为0.3%FAME,EPA含量为0.3%。
实施例22
将二重质粒pLR100(包含密码子优化的破囊壶菌ATCC PTA-10212PFA1)、pLR87(包含密码子优化的破囊壶菌ATCC PTA-10212PFA2)、pREZ348(包含裂殖壶菌ATCC PTA-10212的PFA3)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。破囊壶菌ATCC PTA-10212PFA1、PFA2和PFA3在诱导条件下表达支持在大肠杆菌中产生DHA和EPA。
实施例23
将二重质粒pREZ330(包含裂殖壶菌ATCC PTA-9695 PFA2)、pREZ91(包含裂殖壶菌ATCC 20888 orfA)、pREZ101(包含裂殖壶菌ATCC 20888的orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。裂殖壶菌ATCC PTA-9695PFA2以及裂殖壶菌ATCC 20888 orfA和orfC在诱导条件下表达支持在大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为0.6%FAME,DPA n-6含量为0.3%。
实施例24
将二重质粒pLR187(包含密码子优化的破囊壶菌ATCC PTA-10212PFA2)、pREZ91(包含裂殖壶菌ATCC 20888的orfA)、pREZ101(包含裂殖壶菌ATCC 20888的orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。密码子优化的破囊壶菌ATCC PTA-10212 PFA2以及裂殖壶菌ATCC 20888 orfA和orfC在诱导条件下表达支持大肠杆菌中产生DHA和低水平EPA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为1.7%FAME,DPA n-6含量为0.9%,EPA含量为0.1%。
实施例25
将二重质粒pREZ346(包含裂殖壶菌ATCC PTA-9695 PFA1)、pREZ330(包含裂殖壶菌ATCC PTA-9695 PFA2)、pREZ101(包含裂殖壶菌ATCC 20888 orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。PFA1和PFA2以及裂殖壶菌ATCC 20888 orfC在诱导条件下表达支持大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为0.3%FAME,DPA n-6含量为0.1%,EPA含量为0.5%。
实施例26
将二重质粒pLR100(包含密码子优化的破囊壶菌ATCC PTA-10212PFA1)、pLR87(包含密码子优化的破囊壶菌ATCC PTA-10212 PFA2)、pREZ101(包含裂殖壶菌ATCC 20888的orfC)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。密码子优化的破囊壶菌ATCCPTA-10212 PFA1和PFA2以及裂殖壶菌ATCC 20888 orfC在诱导条件下表达支持在大肠杆菌中产生DHA和EPA。
实施例27
将二重质粒pREZ346(包含裂殖壶菌ATCC PTA-9695 PFA1)、pREZ96(包含裂殖壶菌ATCC ATCC 20888 orfB)、pREZ326(包含裂殖壶菌ATCCPTA-9695PFA3)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。裂殖壶菌ATCC PTA-9695 PFA1和PFA3以及裂殖壶菌ATCC20888 orfB在诱导条件下表达支持在大肠杆菌中产生DHA。如实施例15进行细胞培养和FAME分析。转化大肠杆菌的DHA含量为0.1%FAME,EPA含量为0.1%。
实施例28
将二重质粒pLR100(包含密码子优化的破囊壶菌ATCC PTA-10212PFA1)、pREZ96(包含裂殖壶菌ATCC 20888的orfB)、pREZ348(包含密码子优化的破囊壶菌ATCC PTA-10212 PFA3)和pJK737(包含HetI)一起转化到大肠杆菌菌株BLR(DE3)中。见实施例15。密码子优化的破囊壶菌ATCC PTA-10212PFA1和PFA3以及裂殖壶菌ATCC 20888 orfB在诱导条件下表达支持在大肠杆菌中产生DHA和EPA。
实施例29
通过标准步骤在裂殖壶菌ATCC PTA-9695和破囊壶菌ATCC PTA-10212单独敲除Pfa1p、Pfa2p和Pfa3p PUFA合酶活性。参见例如,美国专利号7,217,856,将其全文纳入本文作参考。
将零霉素TM、潮霉素、杀稻瘟素或其它合适的抗性标记物插入包含于质粒中的PFA1基因(SEQ ID NO:1或SEQ ID NO:68)的限制性位点中。在插入抗性标记物之后,通过粒子轰击、电穿孔或其它合适的转化方法将质粒分别引入裂殖壶菌ATCC PTA-9695或破囊壶菌ATCC PTA-10212。发生同源重组,产生天然PFA1基因被零霉素TM、潮霉素、杀稻瘟素或其它合适抗性标记物替换或破坏的突变体。在包含零霉素TM、潮霉素、杀稻瘟素或其它合适选择试剂并补充PUFA的平板上选择转化体。在不补充PUFA的条件下进一步检测克隆的生长能力。抽提对于选择试剂有抗性且无法在缺乏PUFA的条件下生长的克隆的基因组DNA。所述DNA的PCR和Southern印记分析表明PFA1基因缺失或被破坏。
以相似步骤敲除PFA2。发现得到的需要补充PUFA的敲除突变体缺少全长PFA2。
以相似步骤敲除PFA3。发现得到的需要补充PUFA的敲除突变体缺少全长PFA3。
本文所述的所有不同方面、实施方式和选择可以任何和全部的变化形式组合。
将本说明书中提到的所有发表物、专利和专利申请以其全文形式纳入本文作为参考,就好像将各篇单独的发表物、专利或专利申请具体地和单独地通过引用纳入本文一样。