CN101473038B - 含有多不饱和脂肪酸的植物种子油 - Google Patents

含有多不饱和脂肪酸的植物种子油 Download PDF

Info

Publication number
CN101473038B
CN101473038B CN200780017847.9A CN200780017847A CN101473038B CN 101473038 B CN101473038 B CN 101473038B CN 200780017847 A CN200780017847 A CN 200780017847A CN 101473038 B CN101473038 B CN 101473038B
Authority
CN
China
Prior art keywords
plant
pufa
seq
structural domain
carbon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200780017847.9A
Other languages
English (en)
Other versions
CN101473038A (zh
Inventor
詹姆斯·G·梅茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Priority claimed from PCT/US2007/064105 external-priority patent/WO2007106904A2/en
Publication of CN101473038A publication Critical patent/CN101473038A/zh
Application granted granted Critical
Publication of CN101473038B publication Critical patent/CN101473038B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)

Abstract

本发明披露了已被遗传修饰为表达PKS样系统以产生PUFA(PUFAPKS系统)的植物,其中所述植物产生的油含有所述PUFA PKS系统产生的至少一种PUFA,并且不混合有短链和较不饱和的PUFA,所述短链和较不饱和的PUFA为对标准脂肪酸途径中FAS系统的产物进行修饰而产生的脂肪酸产物。另外,本发明也披露了含油种子、油和包含上述系统产生的上述油的产物及得到上述植物的方法。

Description

含有多不饱和脂肪酸的植物种子油
技术领域
本发明大体涉及多不饱和脂肪酸(polyunsaturated fatty acid,PUFA)在已遗传修饰为表达PKS样系统(PUFA PKS系统)以产生PUFA的植物(包括含油种子植物(oil seed plant))中的产生,并且涉及含油种子、油和包含上述系统产生的上述油的产物。所述植物产生的油含有所述PUFA PKS系统产生的至少一种PUFA,并且不混合有短链和较不饱和的PUFA,所述短链和较不饱和的PUFA为对标准脂肪酸途径中FAS系统的产物进行修饰而产生的脂肪酸产物。 
背景技术
作为与脂肪酸合成酶(FAS)系统相关的酶复合物,聚酮化合物合成酶(polyketide synthase,PKS)系统在本领域中是众所周知的,但其经常被高度地修饰,以得到通常很少与脂肪酸相似的特定产物。然而,现在已显示的是,PKS样系统(本申请也称为PUFA PKS系统或PUFA合成酶系统)存在于能从乙酰辅酶A和丙二酰辅酶A合成多不饱和脂肪酸(PUFA)的海洋细菌(marinebacteria)和某些真核生物体中。美国专利号6,140,486详细描述了在希瓦氏菌属(Shewanella)和另一种海洋细菌即Vibrio marinus中合成PUFA的PUFAPKS途径。美国专利号6,566,583详细描述了在真核的破囊壶菌(Thraustochytrid)和裂殖壶菌属(Schizochytrium)中合成PUFA的PUFA PKS途径。美国专利申请公开号20020194641(公开于2002年12月19日)和PCT公开号WO 2006/135866(公开于2006年12月21日)详细描述了在真核生物诸如破囊壶菌目(Thraustochytriales)成员中合成PUFA的PUFA PKS途径,并且还描述了裂殖壶菌属中的PUFA PKS系统,确定了破囊壶菌属(Thraustochytrium)中的PUFA PKS系统,及详细描述了这些系统的用途。美国专利申请公开号20040235127(公开于2004年11月25日)披露了对破囊壶菌属中PUFA PKS系统的详细结构描述,并且进一步详细描述了利用上述系统产生二十碳五烯酸(eicosapentaenoic acid)(C20:5,ω-3)(EPA)和其它利于 该系统产生的PUFA。美国专利申请公开号20050100995(公开于2005年5月12日)披露了对Shewanella olleyana和Shewanella japonica中PUFA PKS系统的结构描述和功能描述及上述系统的用途。这些申请也披露了用包含PUFA PKS途径的基因对生物体(包括微生物和植物)进行的遗传修饰和通过上述生物体产生PUFA。此外,PCT专利公开号WO05/097982描述了Ulkenia中的PUFA PKS系统,而美国专利申请公开号20050014231描述了来自破囊壶菌(Thraustochytrium aureum)的PUFA PKS基因和蛋白质。在此将上述每项申请完整引入作为参考。 
人们认为多不饱和脂肪酸(PUFA)可用于营养用途、药物用途、工业用途及其它目的。然而,当前供应的来自天然来源和化学合成的PUFA不足以满足商业需要。得自含油种子农作物(oil seed crop)的植物油是相对廉价的,并且没有与鱼油(鱼油)相关的污染问题。然而,在商业开发的植物油中发现的PUFA通常限于亚油酸(linoleice)(18个碳且在Δ9位和Δ12位具有2个双键即18:2Δ9,12)和亚麻酸(linolenic acid)(18:3Δ9,12,15)。在合成PUFA的常规途径(即“标准”途径或”经典”途径)中,通过一系列延长反应和去饱和反应来对中链长度的饱和脂肪酸(脂肪酸合成酶(FAS)系统的产物)进行修饰。所述延长反应的底物为脂肪酰基辅酶A(待延长的脂肪酸链)和丙二酰辅酶A(每步延长反应所增加的2个碳的来源)。延长酶(elongases)反应的产物为在直链中增加2个碳的脂肪酰基辅酶A。去饱和酶(desaturase)通过在基于氧的反应中去掉2个氢而在先前存在的脂肪酸链中形成顺式双键。去饱和酶的底物为酰基辅酶A(在一些动物中)或与PL(例如磷脂酰胆碱(phosphatidylcholine))的甘油骨架发生酯化的脂肪酸。 
因此,由于在从亚油酸和亚麻酸合成脂肪酸时需要多种不同的去饱和酶和延长酶以形成较饱和和较长链的PUFA,所以为了表达PUFA诸如二十碳五烯酸(EPA)和二十二碳六烯酸(docosahexaenoic acid,DHA)而进行工程化的植物宿主细胞可能需要表达几种不同的酶来实现合成。另外,为了产生可用量的上述PUFA,可能需要进行额外的工程化努力。因此,重要的是要得到在天然产生上述脂肪酸的物种的PUFA生物合成(例如PUFA PKS系统)中参与的遗传物质,并且单独表达所述分离的物质或与可受控产生商业量PUFA的异源系统组合表达。 
已作出很多努力,以通过对内源性形成的脂肪酸进行修饰而在含油种 子农作植物中产生PUFA。用针对脂肪酸延长酶和去饱和酶的各种单独基因对这些植物进行遗传修饰(genetic modification),由此已得到含有显著水平的PUFA诸如EPA但也含有显著水平的混合短链PUFA和较不饱和PUFA的叶子或种子(Qi et al.,Nature Biotech.22:739(2004)、PCT公开号WO 04/071467、Abbadi et al.,Plant Cell16:1(2004))、Napier and Sayanova,Proceedings of theNutrition Society(2005),64:387-393、Robert et al.,Functional PlantBiology(2005)32:473-479或美国专利申请公开号2004/0172682。 
因此,本领域仍需要高效并且有效地在含油种子植物中形成大量的富含所期望PUFA的脂质(例如三酰甘油(TAG)和磷脂(PL))的方法。 
发明内容
本发明的一个实施方案涉及植物或所述植物的部分,其中所述植物或所述植物的部分中的全部脂肪酸分布包含至少约0.5%重量的至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA),并且其中所述植物或所述植物的部分中的全部脂肪酸分布就以下PUFA的总量而言含有少于5%的以下PUFA:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物或所述植物的部分中的全部脂肪酸分布包含至少约0.5%重量的至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA),并且其中所述植物或所述植物的部分中的全部脂肪酸分布就以下每种PUFA而言含有少于1%的以下PUFA:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物或所述植物的部分中的全部脂肪酸分布包含至少约0.5%重量的至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA),并且其中所述植物或所述植物的部分中的全部脂肪酸分布含有少于2%的γ-亚麻酸(GLA;18:3,n-6)和双高-γ-亚麻酸(dihomo-gamma-linolenic acid)(DGLA或HGLA;20:3,n-6)。在这个实施方案的一个方面,所述植物或所述植物的部 分中的全部脂肪酸分布含有少于1%重量的γ-亚麻酸(GLA;18:3,n-6)和双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物或所述植物的部分中的全部脂肪酸分布包含至少约0.5%重量的至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA),并且其中所述植物或所述植物的部分中的全部脂肪酸分布含有少于1%的γ-亚麻酸(GLA;18:3,n-6)。在这个实施方案的一个方面,所述植物或所述植物的部分中的全部脂肪酸分布含有少于0.5%重量的γ-亚麻酸(GLA;18:3,n-6)。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物已遗传修饰为对产生至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA)的酶进行表达,其中所述植物或所述植物的部分中的全部脂肪酸分布包含至少约0.5%重量的所述至少一种PUFA,并且其中除所述至少一种PUFA外,所述酶产生的全部脂肪酸占所述植物产生的全部脂肪酸的约10%以下。在这个实施方案的一个方面,除所述至少一种PUFA外,所述酶产生的全部脂肪酸占所述植物产生的全部脂肪酸的5%重量以下。在这个实施方案的另一个方面,由γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA组成的脂肪酸占所述植物产生的全部脂肪酸的5%重量以下。在这个实施方案的另一个方面,γ-亚麻酸(GLA;18:3,n-6)占所述植物产生的全部脂肪酸的1%重量以下。 
在本发明的以上任何实施方案的一个方面,所述植物没有遗传修饰为表达去饱和酶或延长酶,特别是在基于FAS而产生PUFA的常规或标准途径中使用的去饱和酶或延长酶。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物已用来自产生至少一种多不饱和脂肪酸(PUFA)的真核生物的PUFA PKS系统进行遗传修饰,并且其中所述植物或所述植物的部分中的全部脂肪酸分布包含可检测量的所述至少一种PUFA。在这个实施方案的一个方面,所述植物或所述植物的部分中的全部脂肪酸分布包含至少0.5%重量的所述至少一种PUFA。在这个实施方案的另一个方面,除所述至少一种PUFA外,所述PUFA PKS系统产生的全部脂肪酸占所述植物产生的全部脂肪酸的约10%重量以下。在这个实施方案的另一个方面,除所述至少一种PUFA外, 所述酶产生的全部脂肪酸占所述植物产生的全部脂肪酸的约5%重量以下。 
在以上实施方案的一个方面,所述PUFA PKS系统包含(a)至少一个烯酰ACP还原酶(enoyl-ACP reductase,ER)结构域;(b)至少四个酰基载体蛋白(acyl carrier protein,ACP)结构域;(c)至少两个β-酮脂酰ACP合成酶(β-ketoacyl-ACP synthase,KS)结构域;(d)至少一个酰基转移酶(acyltransferase,AT)结构域;(e)至少一个β-酮脂酰ACP还原酶(β-ketoacyl-ACP reductase,KR)结构域;(f)至少两个FabA样β-羟酰ACP脱水酶(FabA-like β-hydroxyacyl-ACP dehydrase,DH)结构域;(g)至少一个链长度因子(chain length factor,CLF)结构域;和(h)至少一个丙二酰辅酶A:ACP酰基转移酶(malonyl-CoA:ACP acyltransferase,MAT)结构域。 
在以上实施方案的另一个方面,所述PUFA PKS系统包含(a)两个烯酰ACP还原酶(ER)结构域;(b)8个或9个酰基载体蛋白(ACP)结构域;(c)两个β-酮脂酰ACP合成酶(KS)结构域;(d)一个酰基转移酶(AT)结构域;(e)一个酮还原酶(ketoreductase,KR)结构域;(f)两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)一个链长度因子(CLF)结构域;和(h)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域。 
在一个方面,上述PUFA PKS系统来自破囊壶菌目微生物。在一个方面,所述PUFA PKS系统来自裂殖壶菌属。在一个方面,所述PUFA PKS系统来自破囊壶菌属。在一个方面,所述PUFA PKS系统来自选自以下的微生物:裂殖壶菌属种American Type Culture Collection(ATCC)No.20888(保藏单位地址:Rockville,Md.20852 USA;保藏日期:1988-08-05)、破囊壶菌属23B ATCC No.20892(保藏单位地址:Rockville,Md.20852 USA;保藏日期:1988-08-05)和任何所述微生物的突变体。在一个方面,编码所述PUFAPKS系统的核酸序列在严格的杂交条件下与对来自选自以下的微生物的PUFA PKS系统进行编码的基因发生杂交:裂殖壶菌属种American TypeCulture Collection(ATCC)No.20888、破囊壶菌属23B ATCC No.20892和任何所述微生物的突变体。在一个方面,编码所述PUFA PKS系统的核酸序列在严格的杂交条件下与对来自裂殖壶菌属种American Type CultureCollection(ATCC)No.20888或其突变体的PUFA PKS系统进行编码的基因发生杂交。在一个方面,所述PUFA PKS系统包含至少一个来自破囊壶菌目微生物的PUFAPKS系统的结构域。在另一个方面,所述PUFAPKS系统包括选自以下的任何一个或多个核酸序列或氨基酸序列:SEQ ID NO:1-32或38-68。 
在以上任何实施方案中,在一个方面,所述PUFA PKS系统还包含磷酸泛酰巯基乙氨基转移酶(phosphopantetheinyl transferase,PPTase)。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物已用产生至少一种多不饱和脂肪酸(PUFA)的PUFA PKS系统进行遗传修饰,并且其中所述植物或所述植物的部分中的全部脂肪酸分布包含可检测量的所述至少一种PUFA,其中所述PUFA PKS系统为在至少约25℃产生PUFA的细菌PUFA PKS系统,并且其中所述细菌PUFA PKS系统包含(a)至少一个烯酰ACP还原酶(ER)结构域;(b)至少6个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰ACP合成酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个酮还原酶(KR)结构域;(f)至少两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)至少一个链长度因子(CLF)结构域;(h)至少一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域;和(i)至少一个4’-磷酸泛酰巯基乙氨基转移酶(PPTase)结构域。在这个实施方案的一个方面,所述PUFA PKS系统来自选自以下的微生物:Shewanella olleyana Australian Collection ofAntarctic Microorganisms(ACAM)菌株号644(保藏单位地址:Private Bag 98Hobart Tasmania 7001 AU;保藏日期:2002-01-27)、Shewanella japonica ATCC菌株号BAA-316(保藏单位地址:Manassas,Virginia 20110-2209USA;保藏日期:2001-07-03)和任何所述微生物的突变体。在一个方面,编码所述PUFAPKS系统的核酸序列在严格的杂交条件下与对来自选自以下的微生物的PUFA PKS系统进行编码的基因发生杂交:Shewanella olleyana AustralianCollection of Antarctic Microorganisms(ACAM)菌株号644或Shewanellajaponica ATCC菌株号BAA-316或任何所述微生物的突变体。在另一个方面,所述PUFA PKS系统包括选自以下的任何一个或多个核酸序列或氨基酸序列:SEQ ID NO:69-80。 
本发明的另一个实施方案涉及含油种子植物或所述含油种子植物的部分,所述含油种子植物产生成熟的种子,其中总种子脂肪酸分布包含至少1.0%重量的至少一种具有至少20个碳原子和至少4个碳-碳双键的多不饱和脂肪酸,并且其中所述植物或所述植物的部分中的全部脂肪酸分布就以下PUFA的总量而言含有少于5%的以下PUFA:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。 
本发明的另一个实施方案涉及含油种子植物或所述含油种子植物的部分,所述含油种子植物产生成熟的种子,其中总种子脂肪酸分布包含至少 1.0%重量的至少一种具有至少20个碳原子和至少4个碳-碳双键的多不饱和脂肪酸,并且其中所述植物或所述植物的部分中的全部脂肪酸分布含有少于1%的γ-亚麻酸(GLA;18:3,n-6)。 
在本发明的任何上述实施方案中,在一个方面,所述至少一种PUFA具有至少20个碳和5个或更多个碳-碳双键。在另一个方面,所述至少一种PUFA选自DHA(二十二碳六烯酸(C22:6,n-3))、ARA(二十碳四烯酸(eicosatetraenoic acid)或花生四烯酸(arachidonic acid)(C20:4,n-6))、DPA(二十二碳五烯酸(docosapentaenoic acid)(C22:5,n-6或n-3))和EPA(二十碳五烯酸(C20:5,n-3)。在另一个方面,所述至少一种PUFA选自DHA(二十二碳六烯酸(C22:6,n-3))、DPA(二十二碳五烯酸(C22:5,n-6或n-3))和EPA(二十碳五烯酸(C20:5,n-3)。在另一个方面,所述至少一种PUFA选自DHA(二十二碳六烯酸(C22:6,n-3))、ARA(二十碳四烯酸或花生四烯酸(C20:4,n-6))、DPA(二十二碳五烯酸(C22:5,n-6或n-3))、EPA(二十碳五烯酸(C20:5,n-3)、γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(stearidonic acid)(STA或SDA;18:4,n-3)和双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)。在另一个方面,所述至少一种PUFA为DHA。在另一个方面,当靶标PUFA为DHA时,所述植物产生的EPA与DHA的比例小于1:1。在另一个方面,所述至少一种PUFA为EPA。在另一个方面,所述至少一种PUFA为DHA和DPA n-6。在另一个方面,所述至少一种PUFA为EPA和DHA。在另一个方面,所述至少一种PUFA为ARA和DHA。在另一个方面,所述至少一种PUFA为ARA和EPA。 
在本发明的任何上述实施方案的一个方面,所述植物为含油种子植物,并且其中所述植物的部分为成熟的含油种子。在一个方面,所述植物为农作植物。在另一个方面,所述植物为双子叶植物。在另一个方面,所述植物为单子叶植物。在另一个方面,所述植物选自油菜、大豆、油菜子、亚麻子、玉米、红花、向日葵和烟草。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物或所述植物的部分中的全部脂肪酸分布包含可检测量的DHA(二十二碳六烯酸(C22:6,n-3))和DPA(二十二碳五烯酸(C22:5,n-6),其中DPA n-6与DHA的比例为1:1或大于1:1。在这个实施方案的一个方面,所述植物或所述植物的部分中的全部脂肪酸分布就以下PUFA的总量而言含有少于5%重量的以下PUFA:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的 PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。 
本发明的另一个实施方案涉及植物或所述植物的部分,其中所述植物已用产生至少一种多不饱和脂肪酸(PUFA)的PUFA PKS系统进行遗传修饰,并且其中所述植物或所述植物的部分中的全部脂肪酸分布包含可检测量的所述至少一种PUFA,其中所述PUFA PKS系统包含(a)两个烯酰ACP还原酶(ER)结构域;(b)8个或9个酰基载体蛋白(ACP)结构域;(c)两个β-酮脂酰ACP合成酶(KS)结构域;(d)一个酰基转移酶(AT)结构域;(e)一个酮还原酶(KR)结构域;(f)两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)一个链长度因子(CLF)结构域;(h)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域;和(i)一个磷酸泛酰巯基乙氨基转移酶(PPTase)。 
本发明的另一个实施方案涉及得自任何上述植物或植物部分的种子。本发明的另一个实施方案涉及包含上述种子的食品(food product)。 
本发明的另一个实施方案涉及得自任何上述植物的种子的油。 
本发明的另一个实施方案包括油,其包含图2或图3显示的脂肪酸分布。 
本发明的另一个实施方案包括油共混物,其包含由本申请所述植物产生的任何油和另一种油。在一个方面,所述另一种油为微生物油(microbialoil),而在另一个方面,所述另一种油为鱼油(fish oil)。 
本发明的另一个实施方案涉及油,其包含以下脂肪酸:DHA(C22:6n-3)、DPA n-6(C22:5n-6)、油酸(oleic acid,C18:1)、亚麻酸(C18:3)、亚油酸(C18:2)、C16:0、C18:0、C20:0、C20:1 n-9、C20:2 n-6、C22:1 n-9,其中所述油就以下任何脂肪酸而言包含少于0.5%的以下脂肪酸:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。 
本发明的另一个实施方案涉及植物油,其包含至少约0.5%重量的至少一种具有至少20个碳和4个或更多个碳-碳双键的多不饱和脂肪酸(PUFA),并且其中所述油的全部脂肪酸分布就以下PUFA的总量而言含有少于5%的以下PUFA:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和4个碳-碳双键的PUFA、具有20个碳和3个碳-碳双键的PUFA和具有22个碳和2个或3个碳-碳双键的PUFA。
本发明的另一个实施方案涉及植物油,其包含可检测量的DHA(二十二碳六烯酸(C22:6,n-3))和DPA(二十二碳五烯酸(C22:5,n-6),其中DPA n-6与DHA的比例为1:1或大于1:1。 
本发明的另一个实施方案涉及食品,其含有任何上述油。在一个实施方案中,所述食品还包括任何上述种子。 
本发明的另一个实施方案涉及药品(pharmaceutical product),其含有任何上述油。 
本发明的另一个实施方案涉及产生包含至少一种PUFA的油的方法,其包括从任何上述种子回收油。 
本发明的另一个实施方案涉及产生包含至少一种PUFA的油的方法,其包括从任何上述植物或所述植物的部分回收油。 
本发明的另一个实施方案涉及向个体提供包含至少一种PUFA的补品(supplement)或治疗品(therapeutic product)的方法,其包括向所述个体提供任何上述植物或植物部分、任何上述种子、任何上述油、任何上述食品和/或任何上述药品。 
附图说明
图1为对照酵母和表达裂殖壶菌属Orf sA、sB、C和HetI的酵母的FAME分布。 
图2为图1的酵母的FAME分布,其被放大以显示靶标PUFA的产生。 
图3为野生型Arabidopsis和表达裂殖壶菌属Orf A、B*、C和HetI的Arabidopsis谱系263(质体靶向)的FAME分布。 
具体实施方式
本发明大体涉及在已遗传修饰为表达PUFA PKS系统的含油种子植物中产生PUFA的方法、含油种子、油和包含上述系统产生的上述油的产物。所述植物产生的油含有所述PUFA PKS系统产生的至少一种PUFA,并且不混合有短链和较不饱和的PUFA,所述短链和较不饱和的PUFA为对FAS系统的产物进行修饰而产生的脂肪酸产物。 
已描述了酶中PUFA合成酶(即PUFA PKS系统)家族的基本结构域结构和序列特征(参见背景技术部分和以下)。已显示的是,PUFA合成酶能从头 合成各种PUFA(例如EPA、DHA和DPA n-6),并且上述产物可积累在宿主生物体的磷脂(PL)中,而且在一些情况下,可积累在中性脂质(例如三酰甘油(TAG))中。另外,已描述的是,使用这些PUFA合成酶系统来对宿主生物体(包括植物)进行遗传修饰。本申请提供的数据显示,在已遗传修饰为对编码裂殖壶菌属PUFA PKS系统的基因和编码PUFA PKS辅助酶即4’-磷酸泛酰巯基乙氨基转移酶(PPTase)的基因进行表达的植物中产生了PUFA。上述植物产生的油含有显著量的DHA(二十二碳六烯酸(C22:6,n-3))和DPA(二十二碳五烯酸(C22:5,n-6),二者是由PUFA PKS基因所源于的裂殖壶菌属产生的主导PUFA(主要PUFA)。显著地,本发明人在本申请中显示,与进行遗传工程化以通过上述“标准”途径来产生PUFA的植物相比,来自使用PUFAPKS途径来产生相同PUFA的植物的油具有不同的脂肪酸分布。特别地,来自已遗传工程化为通过PUFA PKS途径来产生特定PUFA的植物的油基本不含有各种中间体产物和副产物,而所述中间体产物和副产物积累在当使用标准PUFA合成途径时产生的油中。以下详细讨论了上述特征。 
更具体地,通过“标准”途径来在植物中产生长链PUFA的努力都采用了相同的基本措施,而所述基本措施受上述合成途径的限制。这些努力有赖于通过导入对各种延长酶和去饱和酶进行编码的基因来对植物的内源性脂肪酸进行修饰。植物典型地通过在其质体中的II型脂肪酸合成酶(FAS)来产生18个碳的脂肪酸(例如油酸、亚油酸或亚麻酸)。通常,当将上述脂肪酸与ACP连接时,形成单个双键,然后在酰基-ACP硫酯酶的作用下,使油酸(18:1)与ACP裂解。游离脂肪酸从质体输出,然后转化成酰基辅酶A。可使所述18:1与磷脂酰胆碱(PC)酯化,并且可再增加至多两个顺式双键。新导入的延长酶可利用酰基辅酶A池中的底物来增加碳数,其增量为两个碳。新导入的去饱和酶可利用与PC发生酯化的脂肪酸或酰基辅酶A池中的脂肪酸,这取决于所述酶的来源。然而,产生长链PUFA的上述方案的一个结果是在所述途径中积累了中间体或副产物,在所述植物油中,所述中间体或副产物通常为新脂肪酸中的主要部分,而靶标长链PUFA不是新脂肪酸中的主要部分。 
例如,当靶标PUFA产物(即人们使用标准途径来靶向产生、努力产生或试图产生的PUFA产物)为DHA或EPA(例如使用可从FAS系统的产物产生DHA或EPA的延长酶和去饱和酶来产生)时,使用上述标准或经典途径, 除所述DHA或EPA外还可产生各种中间体产物和副产物,并且这些中间体或副产物在所述途径产生的产物中通常为主要部分,或在生物体产生的脂质中至少以显著的量存在。上述中间体和副产物包括但不限于与靶标或主要PUFA相比具有较少碳原子和/或较少双键的脂肪酸,并且可包括不常见的脂肪酸副产物,其可能具有与靶标或主要PUFA相同的碳数,但其双键可处于不常见的位置。在使用标准途径来产生EPA的实例中显示了上述结果(例如参见美国专利申请公开号2004/0172682)。具体地,当所述途径的靶标PUFA为EPA(即由于使用特异性地作用于FAS系统的产物来产生EPA的特定延长酶和去饱和酶)时,所述系统产生的油包括各种中间体和副产物,这些中间体和副产物包括γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(STA或SDA;18:4,n-3)、双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)、花生四烯酸(ARA,C20:4,n-6)、二十碳三烯酸(eicosatrienoic acid,ETA;20:3,n-9)和各种其它中间体或副产物诸如20:0、20:1(Δ5)、20:1(Δ11)、20:2(Δ8,11)、20:2(Δ11,14)、20:3(Δ5,11,14)、20:3(Δ11,14,17)、蜂蜜酸(mead acid)(20:3;Δ5,8,11)或20:4(Δ5,1,14,17)。所述系统的中间体也可包括不是遗传修饰的靶标的长链PUFA(例如用于产生DHA的标准途径酶系统实际上可产生比DHA多的EPA作为中间体产物,这记载在例如美国专利申请公开号2004/0172682中,参见以下对此进行的额外讨论)。 
相反地,本发明的PUFA PKS合成酶不利用FAS系统的脂肪酸产物。实际上,它从小的前体分子(其与FAS和延长酶利用的小的前体分子相同)(丙二酰辅酶A)产生最终PUFA产物(主要PUFA产物)。因此,所述合成循环中释放的中间体的量不具有任何显著度,并且将所述PUFA产物(本申请也将其称为主要PUFA产物)高效地转移到脂质中的磷脂(PL)和三酰甘油(TAG)部分。实际上,PUFA PKS系统可产生两种靶标或主要PUFA产物(例如来自裂殖壶菌属的PUFA PKS系统产生DHA和DPA n-6作为主要产物),但DPA不是所述途径中形成DHA的中间体。相反地,DHA和DPA n-6各自是同一PUFA PKS系统中不同的产物。因此,PUFA PKS基因是在异源的宿主诸如植物中产生含有PUFA特别是长链PUFA(LCPUFA)的油的极好手段,其中所述油基本不含有(以下定义)使“标准”PUFA途径产生的油受到污染的中间体和副产物(以下也定义)。 
因此,本发明的目的是通过如本申请描述的那样对植物进行遗传操作 来产生具有期望链长度和期望双键数目的多不饱和脂肪酸,及进一步开发得到含油种子和得自上述含有这些PUFA的植物(即得自上述植物的含油种子)的油。本发明可产生的PUFA的实例包括但不限于DHA(二十二碳六烯酸(C22:6,n-3))、ARA(二十碳四烯酸或花生四烯酸(C20:4,n-6))、DPA(二十二碳五烯酸(C22:5,n-6或n-3))和EPA(二十碳五烯酸(C20:5,n-3))。通过本发明人利用产生PUFA的聚酮化合物合成酶样系统而开发的遗传修饰的植物,本发明可产生具有商业价值的脂质,其富含一种或多种期望的(靶标或主要)PUFA。 
根据本发明,“主要PUFA”、“靶标PUFA”、“预期的PUFA”或“期望的PUFA”指特定的PUFA或多种PUFA,其为产生所述PUFA(或多种PUFA)的酶途径的预期产物或靶标产物。例如,当使用延长酶和去饱和酶来对FAS系统的产物进行调节时,可选择延长酶和去饱和酶的特定组合,所述延长酶和去饱和酶当一起使用时可产生靶标或期望的PUFA(例如DHA或EPA)。如上所述,当以占所述系统产生的全部脂肪酸的百分比表示时,就PUFA的量而言,标准途径产生的上述靶标PUFA或期望的PUFA实际上可能不是“主要”PUFA,这是因为所形成的中间体和副产物在所述系统产生的产物中实际上可能是主要部分。然而,即使在上述情况下也可使用术语“主要PUFA”来指所述系统使用的延长酶或去饱和酶产生的靶标PUFA或预期的PUFA产物。 
当使用本发明优选的PUFA PKS系统时,源于特定生物体的给定PUFAPKS系统可产生特定的PUFA(或多种PUFA),从而使从特定生物体选择的PUFA PKS系统可产生具体的靶标PUFA或主要PUFA。例如,可使用来自裂殖壶菌属的PUFA PKS系统来产生DHA和DPA n-6作为靶标或主要PUFA。在另一个方面,可使用来自各种希瓦氏菌属种的PUFA PKS系统来产生EPA作为靶标PUFA或主要PUFA。应该注意的是,主要或靶标PUFA的比例随以下情况而变化:所选择的特定PUFA PKS系统和上述系统如何响应于上述系统在其中表达的具体条件。例如,也可使用来自破囊壶菌属23B(ATCC No.20892)的PUFA PKS系统来产生DHA和DPA n-6作为靶标或主要PUFA,并且在破囊壶菌属23B的情况下,DHA与DPA n-6的比例为约10:1(可以是约8:1至约40:1),然而就裂殖壶菌属而言,所述比例通常为约2.5:1。因此,与裂殖壶菌属相比,即使靶标PUFA是相同的,也可使用 破囊壶菌属的PUFA PKS系统或蛋白质或结构域来改变生物体产生的PUFA的比例。另外,如下所述,也可通过对来自不同PUFA PKS系统或PUFA PKS和PKS系统的蛋白质和结构域进行混合来对给定的PUFA PKS系统进行调节,或可对给定PUFA PKS系统的结构域或蛋白质进行调节,以改变靶标PUFA产物和/或比例。 
根据本发明,产生PUFA的酶系统的“中间体产物”或“副产物”指当所述系统产生靶标或主要PUFA(或多种PUFA)时所述酶系统产生的任何产物,特别是脂肪酸产物,但这些产物不是主要或靶标PUFA(或多种PUFA)。在一个实施方案中,中间体和副产物可包括野生型植物或用作所述遗传修饰接受体(recipient)的母体植物(parent plant)所天然产生的非靶标脂肪酸,但现在将所述非靶标脂肪酸归类为中间体或副产物,这是因为与野生型植物或用作所述遗传修饰接受体的母体植物所产生的水平相比,当进行遗传修饰时,所述非靶标脂肪酸以较高的水平产生。如上所述,中间体和副产物在合成PUFA的标准途径中是特别显著的,但在PUFA PKS途径中的显著度是基本较低的。应该注意的是,一种酶系统的主要或靶标PUFA可以是另一种酶系统的中间体,在所述另一种酶系统中,主要或靶标产物是不同的PUFA,并且就产生PUFA的标准途径的产物而言,这是特别真实的,因为所述PUFA PKS系统基本没有产生中间体。例如,当使用产生EPA的标准途径时,产生了显著量的脂肪酸诸如GLA、DGLA和SDA作为中间体产物(例如美国专利申请公开号2004/0172682记载了上述现象)。相似地,并且也记载在美国专利申请公开号2004/0172682中,当使用产生DHA的标准途径时,除以上提及的脂肪酸外,还产生了显著量的ETA和EPA(值得注意的是所述EPA为以上第一实例中的靶标PUFA),并且实际上,相对于全部脂肪酸产物,与靶标PUFA本身相比,所述ETA和EPA的量可能是显著更高的。上述后一现象也记载在美国专利申请公开号2004/0172682中,其中当以占全部脂肪酸的百分比表示时,工程化为通过标准途径来产生DHA的植物所产生的EPA多于所述靶标DHA。 
本申请使用的PUFA PKS系统(其也可称为PUFA合成酶系统或PUFA合成酶)通常具有以下鉴定特征:(1)其产生PUFA特别是长链PUFA作为所述系统的天然产物;和(2)其包含几种多功能蛋白质,所述多功能蛋白质组装成的复合物(complex)既对脂肪酸链进行重复加工,也进行非重复加工, 包括在所选择的循环中进行反式-顺式异构化和烯酰基还原反应。另外,存在于PUFA合成酶中的ACP结构域需要通过接附辅因子(4-磷酸泛酰巯基乙胺)来活化。通过磷酸泛酰巯基乙氨基转移酶(PPTase)来接附上述辅因子。如果宿主生物体的内源性PPTase不能活化PUFA合成酶的ACP结构域,则需要提供能发挥上述功能的PPTase。本发明人已确定念珠藻属种(Nostoc sp.)的HetI酶为活化PUFA合成酶ACP结构域的示范性和合适的PPTase。PUFAPKS系统或PUFA合成酶总体上指以下所有基因和由其编码的产物,所述基因和由其编码的产物在复合物中发挥作用,以在生物体中产生PUFA。因此,所述PUFA PKS系统具体地指其天然产物为PUFA的PKS系统。 
更具体地,本申请使用的PUFA PKS系统产生多不饱和脂肪酸(PUFA)特别是长链PUFA(LCPUFA)作为产物。例如,内源性地(天然地)含有PUFAPKS系统的生物体使用上述系统来产生PUFA。根据本发明,PUFA为具有以下特征的脂肪酸:其碳链长度为至少16个碳,优选为至少18个碳,更优选为至少20个碳,更优选为22个或更多个碳,并且具有至少3个或更多个双键,优选为4个或更多个双键,更优选为5个或更多个双键,甚至更优选为6个或更多个双键,其中所有双键呈顺式构型。本申请使用的长链多不饱和脂肪酸(LCPUFA)更特别地指碳链长度为18个和更多个碳优选为20个和更多个碳并且含有3个或更多个双键的脂肪酸。ω-6系列的LCPUFA包括γ-亚麻酸(C18:3)、双高γ-亚麻酸(di-homo-gamma-linolenicacid)(C20:3n-6)、花生四烯酸(arachidonic acid)(C20:4n-6)、肾上腺酸(adrenicacid)(也称为二十二碳四烯酸(docosatetraenoic acid)或DTA)(C22:4n-6)和二十二碳五烯酸(C22:5n-6)。ω-3系列的LCPUFA包括α-亚麻酸(C18:3)、二十碳三烯酸(eicosatrienoic acid)(C20:3n-3)、二十碳四烯酸(eicosatetraenoicacid)(C20:4n-3)、二十碳五烯酸(C20:5n-3)、二十二碳五烯酸(C22:5n-3)和二十二碳六烯酸(C22:6n-3)。LCPUFA也包括碳数多于22个并且具有4个或更多个双键的脂肪酸,包括但不限于C28:8(n-3)。 
本发明的PUFA PKS系统也包含几种多功能蛋白质(并且可包括单功能蛋白质,特别是就海洋细菌的PUFA PKS系统而言),所述多功能蛋白质组装成的复合物既对脂肪酸链进行重复加工,也进行非重复加工,包括在所选择的循环中进行反式-顺式异构化和烯酰基还原反应。本申请也将这些蛋白质称为核心PUFA PKS酶复合物或核心PUFA PKS系统。这些蛋白质含有 的结构域和模体(motif)的一般功能在本领域中都是已知的,并且已就来自海洋细菌和真核生物体的各种PUFA PKS系统进行了详细描述(参见例如美国专利号6,140,486、美国专利号6,566,583、Metz et al.,Science293:290-293(2001)、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO2006/135866)。可发现所述结构域为单一蛋白质(即所述结构域和蛋白质是同义的),或如上所述为单一蛋白质的两种或更多种(数种)结构域中的一种。 
已对海洋细菌和破囊壶菌属成员的各种PUFA PKS系统的结构域构造和包含上述PUFA PKS系统的基因和蛋白质的结构特征和功能特征进行了详细描述(参见例如美国专利号6,140,486、美国专利6,566,583、Metz et al.,Science293:290-293(2001)、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO2006/135866)。 
可用于本发明的PUFA PKS系统及其蛋白质或结构域包括细菌和非细菌的PUFA PKS系统。非细菌的PUFA PKS系统为来自或源于不是细菌的生物体(诸如真核生物或古细菌)的PUFA PKS系统。根据细胞分化的程度将真核生物与原核生物分开,而真核生物的分化程度比原核生物高。通常,原核生物不具有核膜,在细胞分裂期间不进行有丝分裂,仅具有一种染色体,在其细胞质中含有70S核糖体,不具有线粒体、内质网、叶绿体、溶酶体或高尔基体,并且可能具有鞭毛,如果存在鞭毛,则所述鞭毛含有单个原纤维(fibril)。相反地,真核生物具有核膜,在细胞分裂期间进行有丝分裂,具有多种染色体,在其细胞质中含有80S核糖体,具有线粒体、内质网、叶绿体(在藻类中)、溶酶体或高尔基体,并且可能具有鞭毛,如果存在鞭毛,则所述鞭毛含有多个原纤维。通常,细菌为原核生物,而藻类、真菌、原生生物、原生动物和高等植物为真核生物。根据本发明,可得到以下遗传修饰的植物,所述遗传修饰的植物整合了非细菌的PUFA PKS功能域与细菌的PUFA PKS功能域及来自其它PKS系统(I型重复的或模块的、II型或III型)或FAS系统的PKS功能域或蛋白质。 
优选地,本发明的PUFA PKS系统包含至少以下生物活性结构域(其通常包含在三种或更多种蛋白质中):(a)至少一个烯酰ACP还原酶(ER)结构域;(b)多个酰基载体蛋白(ACP)结构域(例如至少一个到四个ACP结构域, 优选至少五个ACP结构域,并且在一些实施方案中多达六个、七个、八个、九个、十个或多于十个ACP结构域);(c)至少两个β-酮脂酰ACP合成酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个β-酮脂酰ACP还原酶(KR)结构域;(f)至少两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)至少一个链长度因子(CLF)结构域;和(h)至少一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域。在一个实施方案中,本发明的PUFA PKS系统也包含至少一个含有脱水酶(DH)保守活性位点模体的区域。 
在优选的实施方案中,PUFA PKS系统包含至少以下生物活性结构域:(a)至少一个烯酰ACP还原酶(ER)结构域;(b)至少五个酰基载体蛋白(ACP)结构域;(c)至少两个β-酮脂酰ACP合成酶(KS)结构域;(d)至少一个酰基转移酶(AT)结构域;(e)至少一个β-酮脂酰ACP还原酶(KR)结构域;(f)至少两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)至少一个链长度因子(CLF)结构域;和(h)至少一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域。在一个实施方案中,本发明的PUFA PKS系统也包含至少一个含有脱水酶(DH)保守活性位点模体的区域或结构域,所述区域或结构域不是FabA样DH结构域的部分。上述结构域各自的结构特征和功能特征详细地记载在美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO 2006/135866中。 
根据本发明,具有3-酮脂酰ACP合成酶(KS)生物活性(功能)的结构域或蛋白质以如下酶为特征,所述酶催化FAS(和PKS)延长反应循环的起始步骤。术语“β-酮脂酰ACP合成酶”可与术语“3-酮脂酰ACP合成酶”、“β-酮脂酰ACP合成酶”和“酮脂酰ACP合成酶”及相似的衍生术语互换使用。用于延长反应的酰基在所述酶的活性位点通过硫酯键与半胱氨酸残基相连。在多步骤反应中,所述酰基-酶与丙二酰基-ACP发生缩合,以形成酮酰基-ACP、CO2和游离酶。所述KS在延长循环中发挥重要作用,并且已在多种系统中显示出与反应循环中的其它酶相比具有较高的底物特异性。例如,大肠杆菌具有三种不同的KS酶—每种都在所述生物体的生理过程中发挥其本身特有的作用(Magnuson et al.,Microbiol.Rev.57,522(1993))。在海洋细菌和本申请所述破囊壶菌(thraustochytrid)中描述的PUFA-PKS系统的两种KS结构域可能在PUFA的生物合成反应顺序中发挥不同的作用。KS作为一类酶已被很好地表征。多种证实的KS基因的序列是已知的,已鉴定活性 位点模体,并且已确定几种的晶体结构。如果蛋白质(或蛋白质的结构域)与已知的KS序列具有同源性,则可容易地鉴定所述蛋白质(或蛋白质的结构域)属于KS酶家族。 
根据本发明,具有丙二酰辅酶A:ACP酰基转移酶(MAT)生物活性(功能)的结构域或蛋白质以如下酶为特征,所述酶将丙二酰基从丙二酰辅酶A转移到ACP。术语“丙二酰辅酶A:ACP酰基转移酶”可与“丙二酰基酰基转移酶”及相似的衍生术语互换使用。除活性位点模体(GxSxG)外,这些酶还在关键位置具有R和Q氨基酸的扩展模体(extended motif),这使它们成为MAT酶(例如与下述AT结构域对比)。在一些PKS系统中,MAT结构域(而不是PUFA PKS结构域)可优先地将甲基丙二酸酯或乙基丙二酸酯(从相应的CoA酯)加载到ACP基团上,由此在直链碳链中引入支链。MAT结构域可通过其与已知的MAT序列具有同源性和其扩展模体的结构来识别。 
根据本发明,具有酰基载体蛋白(ACP)生物活性(功能)的结构域或蛋白质的特征为小的多肽(通常长度为80个至100个氨基酸),该小的多肽的功能是作为载体使脂肪酰基链通过硫酯键与所述蛋白质的辅因子共价相连而延长所述脂肪酰基链。所述小的多肽以单独单元的形式存在,或作为较大蛋白质中的结构域。通过将CoA的磷酸泛酰巯基乙氨基转移到ACP的高度保守的丝氨酸残基来使所述ACP从无活性的脱辅基形式(apo-form)转化成具有完整功能的形式(functional holo-form)。酰基通过硫酯键在磷酸泛酰巯基乙氨基的游离端与ACP相连。ACP可通过用放射性的泛酰巯基乙胺进行标记和与已知的ACP具有序列同源性来鉴定。存在上述模体(LGIDS*)的变体也是ACP的特征。 
根据本发明,具有酮还原酶活性(也称为3-酮脂酰ACP还原酶(KR)生物活性(功能))的结构域或蛋白质以如下酶为特征,所述酶催化对3-酮酰基形式的ACP进行的基于吡啶-核苷酸的还原反应(pyridine-nucleotide-dependent reduction)。所述还原反应为全程脂肪酸生物合成延长循环(de novo fatty acid biosynthesis elongation cycle)中的第一还原步骤,并且为在聚酮化合物生物合成中经常进行的反应。术语“β-酮脂酰ACP还原酶”可与术语“酮还原酶”、“3-酮脂酰ACP还原酶”、“酮脂酰ACP还原酶”及相似的衍生术语互换使用。就烯酰基ACP还原酶(ER)家族、FAS的其它还原酶(而不是存在于PUFA PKS系统中的ER家族)和短链醇脱氢酶家族 而言,观察到显著的序列相似性。对所述PUFA PKS区域进行的Pfam分析显示出其就核心区域而言与短链醇脱氢酶家族具有同源性。对相同区域进行的Blast分析显示出其就核心区域而言匹配于已知的KR酶及就同源性的扩展区域而言与其它特征化PUFA PKS系统相匹配。 
根据本发明,基于以下理论,将结构域或蛋白质称为链长度因子(CLF)。最初将CLF描述成II型(解离的酶(dissociated enzyme))PKS系统的特征,并且假设其在确定延长循环的次数因此确定终产物的链长度时发挥作用。CLF氨基酸序列显示出与KS结构域的同源性(并且认为其与KS蛋白形成杂二聚体),但它们缺乏活性位点半胱氨酸。CLF在PKS系统中的作用一直存在争议。新的证据(C.Bisang et al.,Nature401,502(1999))暗示其在启动(提供待延长的初始酰基)PKS系统时发挥作用。就上述作用而言,认为CLF结构域使丙二酸酯(例如丙二酰基-ACP)发生脱羧,由此形成乙酸酯基团,后者可被转移到KS活性位点。因此,上述乙酸酯作为可进行初始延长(缩合)反应的“启动”分子。已鉴定所述II型CLF的同源物为一些模块PKS系统中的“负载”结构域。在当前鉴定的所有PUFA PKS系统中都发现了具有CLF序列特征的结构域,并且在每种情况下都发现所述具有CLF序列特征的结构域为多结构域蛋白质的部分。 
“酰基转移酶”或“AT”指一大类可催化多种不同酰基转移反应的酶。术语“酰基转移酶”可与术语“酰基转移酶”互换使用。在本申请所述PUFA PKS系统中鉴定的AT结构域彼此具有良好的同源性,并且与存在于当前检验的所有其它PUFA PKS系统中的结构域具有良好的同源性,但与一些已确定其特异性功能的酰基转移酶具有很差的同源性(例如与丙二酰辅酶A:ACP酰基转移酶(MAT)具有很差的同源性)。尽管与MAT具有很差的同源性,但不认为上述AT结构域的功能与MAT相同,因为所述AT结构域不具有上述酶的扩展模体结构特征(参见以上对MAT结构域的描述)。出于披露的目的,PUFA PKS系统中AT结构域的可能功能包括但不限于将脂肪酰基从ORFA ACP结构域转移到水中(即硫酯酶—以游离脂肪酸的形式释放脂肪酰基),将脂肪酰基转移到接纳体诸如CoA,在各个ACP结构域之间转移所述酰基,或将脂肪酰基转移到亲脂性接纳体分子(例如转移到溶血磷脂酸(lysophosphadic acid))。 
根据本发明,上述结构域具有烯酰基还原酶(ER)生物活性。所述ER酶 对脂肪酰基-ACP中的反式双键(通过DH活性来引入)进行还原,这使那些碳完全饱和。PUFA-PKS中的ER结构域与最近表征的ER酶家族具有同源性(Heath et al.,Nature 406,145(2000))。Heath和Rock通过以下方法鉴定了这类新的ER酶:克隆来自肺炎链球菌(Streptococcus pneumoniae)的重要基因,纯化上述基因表达的蛋白质,并且显示其在体外测定中具有ER活性。当前检验的所有PUFA PKS系统都含有至少一种与裂殖壶菌属ER结构域具有极高度序列同源性的结构域,所述裂殖壶菌属ER结构域与上述肺炎链球菌ER蛋白质具有同源性。 
根据本发明,具有脱水酶或脱水酶(DH)活性的蛋白质或结构域对脱水反应进行催化。本申请一般使用的DH活性通常指FabA样β-羟酰ACP脱水酶(DH)生物活性。FabA样β-羟酰ACP脱水酶(DH)生物活性从β-酮脂酰ACP中除去HOH,并且在碳链中最初形成反式双键。术语“FabA样β-羟酰ACP脱水酶”可与术语“FabA样β-羟酰ACP脱水酶”、“β-羟酰ACP脱水酶”、“脱水酶”及相似的衍生术语互换使用。PUFA PKS系统的DH结构域与细菌的DH酶具有同源性(而不是与其它PKS系统的DH结构域具有同源性),所述细菌的DH酶与细菌的FAS系统相关。细菌的DH的一个亚类即FabA样DH具有顺反异构酶活性(Heath et al.,J.Biol.Chem.,271,27795(1996))。由于本申请所述DH结构域中的一种或本申请描述的各种DH结构域与FabA样DH蛋白具有同源性,所以本申请所述DH结构域中的一种或本申请描述的各种DH结构域负责在PUFA PKS的产物中插入顺式双键。 
可用于本发明的PUFA PKS蛋白也可具有不以FabA样(例如上述顺反活性与FabA样活性相关)为特征的脱水酶活性,本申请通常将其称为非FabA样DH活性或非FabA样β-羟酰ACP脱水酶(DH)生物活性。更具体地,在PKS系统的脱水酶结构域中发现了保守活性位点模体(长度为约13个氨基酸即L*xxHxxxGxxxxP;例如SEQ ID NO:70的氨基酸2504-2516;模体中的*表示L也可以是I)(Donadio S,Katz L. Gene.1992Feb1;111(1):51-60)。在迄今所有已知PUFA-PKS序列的相似区域中并且在本申请描述的PUFAPKS序列中发现了上述保守模体(本申请也将其称为脱水酶(DH)保守活性位点模体或DH模体),但相信最近检测到的只有组氨酸(His)模体。上述保守模体处于PUFA-PKS序列的具有高度同源性的非特征化区域中。本申请提出的通过PUFA-PKS进行的PUFA生物合成需要非FabA样脱水反应,并且 上述模体可负责所述反应。 
出于说明的目的,以下详细描述了几种PUFA PKS系统的结构。然而,应该理解的是,本发明不限于只使用这些PUFA PKS系统。 
裂殖壶菌属PUFA PKS系统
在一个实施方案中,来自裂殖壶菌属的PUFA PKS系统包含至少以下生物活性结构域:(a)两个烯酰ACP还原酶(ER)结构域;(b)五个到十个或更多个酰基载体蛋白(ACP)结构域,并且在一个方面为九个ACP结构域;(c)两个β-酮脂酰ACP合成酶(KS)结构域;(d)一个酰基转移酶(AT)结构域;(e)一个β-酮脂酰ACP还原酶(KR)结构域;(f)两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)一个链长度因子(CLF)结构域;和(h)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域。在一个实施方案中,本发明的裂殖壶菌属PUFAPKS系统也包含至少一个含有脱水酶(DH)保守活性位点模体的区域或结构域,所述脱水酶(DH)保守活性位点模体不是FabA样DH结构域的部分。这些结构域各自的结构特征和功能特征在本领域中通常是已知的(参见例如美国专利6,566,583、Metz et al.,Science293:290-293(2001)、美国专利申请公开号20020194641和PCT公开号WO 2006/135866)。 
有三个可读框能形成上述核心裂殖壶菌属PUFA PKS系统。每个可读框的结构域结构如下。 
裂殖壶菌属可读框A(OrfA)
本申请将OrfA的完整核苷酸序列表示为SEQ ID NO:1。OrfA为8730个核苷酸的序列(不包括终止密码子),其编码2910个氨基酸的序列,本申请将所述2910个氨基酸的序列表示为SEQ ID NO:2。OrfA具有十二个结构域:(a)一个β-酮脂酰ACP合成酶(KS)结构域;(b)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域;(c)九个酰基载体蛋白(ACP)结构域;和(d)一个酮还原酶(KR)结构域。已对编码裂殖壶菌属种ATCC 20888和ATCC 20888的子菌株(daughter strain)(称为裂殖壶菌属种菌株N230D)的Orf A的基因组DNA克隆(质粒)进行了分离和测序。 
就本发明人已知的最大范围而言,本申请称为JK1126的从裂殖壶菌属种ATCC 20888分离的基因组克隆包含跨越SEQ ID NO:1的1位至8730位的核苷酸序列,并且编码SEQ ID NO:2的相应氨基酸序列。基因组克隆pJK1126(当形式为含有裂殖壶菌属ATCC 20888“Orf A”基因的大肠杆菌质 粒载体时称为pJK1126 Orf A基因组克隆)在2006年6月8日保藏在American Type Culture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-7648。本发明包括pJK1126 Orf A基因组克隆的核苷酸序列和上述质粒编码的氨基酸序列。 
就本发明人已知的最大范围而言,本申请称为pJK306 Orf A基因组克隆和pJK320 Orf A基因组克隆的从裂殖壶菌属种N230D一起分离的两种基因组克隆(重叠克隆)包含SEQ ID NO:1的核苷酸序列,并且编码SEQ IDNO:2的氨基酸序列。基因组克隆pJK306(称为pJK306 Orf A基因组克隆,形式为含有裂殖壶菌属种N230D Orf A基因5’部分(与pJK320有2.2kB重叠)的大肠杆菌质粒时)在2006年6月8日保藏在American Type CultureCollection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并且ATCC保藏号为PTA-7641。本发明包括pJK306 Orf A基因组克隆的核苷酸序列和由上述质粒编码的氨基酸序列。基因组克隆pJK320(称为pJK320 Orf A基因组克隆,形式为含有裂殖壶菌属种N230D Orf A基因3’部分(与pJK306有2.2kB重叠)的大肠杆菌质粒时)在2006年6月8日保藏在American Type Culture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并且ATCC保藏号为PTA-7644。本发明包括pJK320 Orf A基因组克隆的核苷酸序列和上述质粒编码的氨基酸序列。 
Orf A中的第一结构域为KS结构域,本申请也将其称为ORFA-KS,并且本申请将含有编码所述ORFA-KS结构域的序列的核苷酸序列表示为SEQID NO:7(SEQ ID NO:1的1位-1500位)。本申请将含有所述ORFA-KS结构域的氨基酸序列表示为SEQ ID NO:8(SEQ ID NO:2的1位-500位)。应该注意的是,所述ORFA-KS结构域含有活性位点模体即DXAC*(*表示酰基结合位点C215)。另外,在裂殖壶菌属KS区域端部的特征模体即GFGG存在于SEQ ID NO:2的上述结构域中,因此存在于SEQ ID NO:8中。 
OrfA中的第二结构域为MAT结构域,本申请也将其称为ORFA-MAT,并且本申请将含有编码所述ORFA-MAT结构域的序列的核苷酸序列表示为SEQ ID NO:9(SEQ ID NO:1的1723位-3000位)。本申请将含有所述ORFA-MAT结构域的氨基酸序列表示为SEQ ID NO:10(SEQ ID NO:2的575位-1000位)。所述MAT结构域在93位包含天冬氨酸(aspartate),并且在94位包含组氨酸(分别相应于SEQ ID NO:2的667位和668位)。应该注意的是, 所述ORFA-MAT结构域含有活性位点模体即GHS*XG(*表示酰基结合位点S706),本申请将其表示为SEQ ID NO:11。 
Orf A的结构域3-11为九个串联的ACP结构域,本申请也将其称为ORFA-ACP(所述序列中的第一结构域为ORFA-ACP1,第二结构域为ORFA-ACP2,第三结构域为ORFA-ACP3,依此类推)。第一ACP结构域即ORFA-ACP1包含在跨越SEQ ID NO:1(Orf A)的约3343位至约3600位的核苷酸序列中。本申请将包含编码ORFA-ACP1结构域的序列的核苷酸序列表示为SEQ ID NO:12(SEQ ID NO:1的3343位-3600位)。含有第一ACP结构域的氨基酸序列跨越SEQ ID NO:2的约1115位至约1200位。本申请将含有ORFA-ACP1结构域的氨基酸序列表示为SEQ ID NO:13(SEQ ID NO:2的1115位-1200位)。应该注意的是,所述ORFA-ACP1结构域含有活性位点模体即LGIDS*(*表示泛酰巯基乙胺结合模体S1157),本申请用SEQ ID NO:14表示。 
所有九个ACP结构域的核苷酸序列和氨基酸序列都是高度保守的,因此本申请没有用各自的序列标识符(sequence identifier)来表示每个结构域的序列。然而,基于本申请披露的信息,本领域技术人员可容易地确定含有其它八个ACP结构域之一的序列。所有九个ACP结构域一起跨越Orf A中SEQ ID NO:1的约3283位至约6288位的区域,其相应于SEQ ID NO:2的约1095位氨基酸至约2096位氨基酸。本申请将编码含有所有九个结构域的完整ACP区域的核苷酸序列表示为SEQ ID NO:16。SEQ ID NO:16表示的区域包括各个ACP结构域之间的接头(linker)片段。在SEQ ID NO:16中,针对所述九个结构域的重复间隔(repeat interval)为约330个核苷酸(在相邻活性位点丝氨酸之间测量的氨基酸的实际数目为104至116个氨基酸)。所述九个ACP结构域各自含有泛酰巯基乙胺结合模体LGIDS*(本申请用SEQ IDNO:14表示),其中S*为泛酰巯基乙胺结合位点丝氨酸(S)。所述泛酰巯基乙胺结合位点丝氨酸(S)位于每个ACP结构域序列的核心附近。在ACP结构域区域的每个端部及在各个ACP结构域之间的是高度富含脯氨酸(P)和丙氨酸(A)的区域,认为所述区域是接头区域。例如,在ACP结构域1和2之间的是以下序列:APAPVKAAAPAAPVASAPAPA,本申请将其表示为SEQ IDNO:15。就SEQ ID NO:2的氨基酸序列而言,所述九个ACP结构域各自的活性位点丝氨酸残基(即泛酰巯基乙胺结合位点)的位置如下:ACP1=S1157; ACP2=S1266;ACP3=S1377;ACP4=S1488;ACP5=S1604;ACP6=S1715;ACP7=S1819;ACP8=S1930;和ACP9=S2034。如果ACP结构域的平均大小在不包括接头时为约85个氨基酸,而在包括接头时为约110个氨基酸,并且所述活性位点丝氨酸大概处于所述结构域的核心,则本领域技术人员可容易地确定九个ACP结构域在Orf A中各自的位置。 
Orf A中的结构域12为KR结构域,本申请也将其称为ORFA-KR,并且本申请将含有编码所述ORFA-KR结构域的序列的核苷酸序列表示为SEQ ID NO:17(SEQ ID NO:1的6598位-8730位)。本申请将含有所述ORFA-KR结构域的氨基酸序列表示为SEQ ID NO:18(SEQ ID NO:2的2200位-2910位)。在所述KR结构域中的是与短链醛脱氢酶具有同源性的核心区域(KR为短链醛脱氢酶家族的成员)。上述核心区域跨越SEQ ID NO:1的约7198位至约7500位,其相应于SEQ ID NO:2的2400位氨基酸-2500位氨基酸。 
裂殖壶菌属可读框B(Orf B) 
本申请将Orf B的完整核苷酸序列表示为SEQ ID NO:3。Orf B为6177个核苷酸的序列(不包括终止密码子),其编码2059个氨基酸的序列,本申请将所述2059个氨基酸的序列表示为SEQ ID NO:4。在Orf B中的是四个结构域:(a)一个酮脂酰ACP合成酶(KS)结构域;(b)一个链长度因子(CLF)结构域;(c)一个酰基转移酶(AT)结构域;和(d)一个烯酰ACP还原酶(ER)结构域。 
已对来自编码裂殖壶菌属种ATCC 20888和ATCC 20888的子菌株(称为裂殖壶菌属种菌株N230D)的Orf B的基因组DNA克隆(质粒)进行了分离和测序。 
就本发明人已知的最大范围而言,本申请称为pJK1129的从裂殖壶菌属种ATCC 20888分离的基因组克隆包含SEQ ID NO:3的核苷酸序列,并且编码SEQ ID NO:4的氨基酸序列。基因组克隆pJK1129(称为pJK1129 Orf B基因组克隆,形式为含有裂殖壶菌属ATCC 20888“Orf B”基因的大肠杆菌质粒载体时)在2006年6月8日保藏在American Type Culture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-7649。本发明包括pJK1126 Orf B基因组克隆的核苷酸序列和由上述质粒编码的氨基酸序列。
就本发明人已知的最大范围而言,本申请称为pJK324 Orf B基因组克隆的从裂殖壶菌属种N230D分离的基因组克隆包含SEQ ID NO:3的核苷酸序列,并且编码SEQ ID NO:4的氨基酸序列。基因组克隆pJK324(当形式为含有裂殖壶菌属种N230D Orf B基因序列的大肠杆菌质粒时称为pJK324Orf B基因组克隆)在2006年6月8日保藏在American Type CultureCollection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并且ATCC保藏号为PTA-7643。本发明包括pJK324 Orf B基因组克隆的核苷酸序列和由上述质粒编码的氨基酸序列。 
Orf B中的第一结构域为KS结构域,本申请也将其称为ORFB-KS,并且本申请将含有编码所述ORFB-KS结构域的序列的核苷酸序列表示为SEQID NO:19(SEQ ID NO:3的1位-1350位)。本申请将含有所述ORFB-KS结构域的氨基酸序列表示为SEQ ID NO:20(SEQ ID NO:4的1位-450位)。上述KS结构域在SEQ ID NO:20的371位包含缬氨酸(即SEQ ID NO:20的371位)。应该注意的是,所述ORFB-KS结构域含有活性位点模体即DXAC*(*表示酰基结合位点C196)。另外,在上述KS区域端部的特征模体即GFGG存在于SEQ ID NO:4的上述结构域中,因此存在于SEQ ID NO:20中。 
Orf B中的第二结构域为CLF结构域,本申请也将其称为ORFB-CLF,并且本申请将含有编码所述ORFB-CLF结构域的序列的核苷酸序列表示为SEQ ID NO:21(SEQ ID NO:3的1378位-2700位)。本申请将含有所述ORFB-CLF结构域的氨基酸序列表示为SEQ ID NO:22(SEQ ID NO:4的460位-900位)。应该注意的是,所述ORFB-CLF结构域含有的KS活性位点模体不具有酰基结合半胱氨酸。 
Orf B中的第三结构域为AT结构域,本申请也将其称为ORFB-AT,并且本申请将含有编码所述ORFB-AT结构域的序列的核苷酸序列表示为SEQID NO:23(SEQ ID NO:3的2701位-4200位)。本申请将含有所述ORFB-AT结构域的氨基酸序列表示为SEQ ID NO:24(SEQ ID NO:4的901位-1400位)。应该注意的是,所述ORFB-AT结构域含有的活性位点模体即GxS*xG(*表示酰基结合位点S1140)以酰基转移酶(AT)蛋白为特征。 
Orf B中的第四结构域为ER结构域,本申请也将其称为ORFB-ER,并且本申请将含有编码所述ORFB-ER结构域的序列的核苷酸序列表示为SEQID NO:25(SEQ ID NO:3的4648位-6177位)。本申请将含有所述ORFB-ER 结构域的氨基酸序列表示为SEQ ID NO:26(SEQ ID NO:4的1550位-2059位)。 
裂殖壶菌属可读框C(Orf C)
本申请将Orf C的完整核苷酸序列表示为SEQ ID NO:5。Orf C为4506个核苷酸的序列(不包括终止密码子),其编码1502个氨基酸的序列,本申请将所述1502个氨基酸的序列表示为SEQ ID NO:6。在Orf C中的是三个结构域:(a)两个FabA样羟酰ACP脱水酶(DH)结构域;和(b)一个烯酰ACP还原酶(ER)结构域。 
已对编码裂殖壶菌属种ATCC 20888和ATCC 20888的子菌株(称为裂殖壶菌属种菌株N230D)的Orf C的基因组DNA克隆(质粒)进行了分离和测序。 
就本发明人已知的最大范围而言,本申请称为pJK1131的从裂殖壶菌属种ATCC 20888分离的基因组克隆包含SEQ ID NO:5的核苷酸序列,并且编码SEQ ID NO:6的氨基酸序列。基因组克隆pJK1131(称为pJK1131 Orf C基因组克隆,形式为含有裂殖壶菌属ATCC 20888“Orf C”基因的大肠杆菌质粒载体时)在2006年6月8日保藏在American Type Culture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-7650。本发明包括pJK1131 Orf C基因组克隆的核苷酸序列和上述质粒编码的氨基酸序列。 
就本发明人已知的最大范围而言,本申请称为pBR002 Orf C基因组克隆的从裂殖壶菌属种N230D分离的基因组克隆包含SEQ ID NO:5的核苷酸序列,并且编码SEQ ID NO:6的氨基酸序列。基因组克隆pBR002(称为pBR002 Orf C基因组克隆,形式为含有裂殖壶菌属种N230D Orf C基因序列的大肠杆菌质粒载体时)在2006年6月8日保藏在American Type CultureCollection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209USA,并且ATCC保藏号为PTA-7642。本发明包括pBR002 Orf C基因组克隆的核苷酸序列和由上述质粒编码的氨基酸序列。 
Orf C中的第一结构域为DH结构域,本申请也将其称为ORFC-DH1。其为Orf C中两种DH结构域中的一种,因此称为DH1。本申请将含有编码所述ORFC-DH1结构域的序列的核苷酸序列表示为SEQ ID NO:27(SEQ IDNO:5的1位-1350位)。本申请将含有所述ORFC-DH1结构域的氨基酸序列 表示为SEQ ID NO:28(SEQ ID NO:6的1位-450位)。 
Orf C中的第二结构域为DH结构域,本申请也将其称为ORFC-DH2。其为Orf C中两种DH结构域中的第二种,因此称为DH2。本申请将含有编码所述ORFC-DH2结构域的序列的核苷酸序列表示为SEQ ID NO:29(SEQID NO:5的1351位-2847位)。本申请将含有所述ORFC-DH2结构域的氨基酸序列表示为SEQ ID NO:30(SEQ ID NO:6的451位-949位)。上述DH结构域在SEQ ID NO:30的426位-440位包含氨基酸H-G-I-A-N-P-T-F-V-H-A-P-G-K-I(SEQ ID NO:6的876位-890位)。 
Orf C中的第三结构域为ER结构域,本申请也将其称为ORFC-ER,并且本申请将含有编码所述ORFC-ER结构域的序列的核苷酸序列表示为SEQID NO:31(SEQ ID NO:5的2995位-4506位)。本申请将含有所述ORFC-ER结构域的氨基酸序列表示为SEQ ID NO:32(SEQ ID NO:6的999位-1502位)。 
破囊壶菌属PUFA PKS系统
在一个实施方案中,破囊壶菌属PUFA PKS系统包含至少以下生物活性结构域:(a)两个烯酰ACP还原酶(ER)结构域;(b)五个到十个或更多个酰基载体蛋白(ACP)结构域,并且在一个方面为八个ACP结构域;(c)两个β-酮脂酰ACP合成酶(KS)结构域;(d)一个酰基转移酶(AT)结构域;(e)一个β-酮脂酰ACP还原酶(KR)结构域;(f)两个FabA样β-羟酰ACP脱水酶(DH)结构域;(g)一个链长度因子(CLF)结构域;和(h)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域。在一个实施方案中,本发明的破囊壶菌属PUFA PKS系统也包含至少一个含有脱水酶(DH)保守活性位点模体的区域或结构域,所述脱水酶(DH)保守活性位点模体不是FabA样DH结构域的部分。这些结构域各自的结构特征和功能特征在本领域中通常是已知的(参见例如上述美国专利公开号2004035127)。 
有三个可读框能形成上述核心破囊壶菌属23B(Thraustochytrium23B)PUFA PKS系统。每个可读框的结构域结构如下。 
破囊壶菌属23B可读框A(Orf A)
本申请将Th.23B(破囊壶菌属23B)Orf A的完整核苷酸序列表示为SEQID NO:38。Th.23B Orf A为8433个核苷酸的序列(不包括终止密码子),其编码2811个氨基酸的序列,本申请将所述2811个氨基酸的序列表示为SEQID NO:39。SEQ ID NO:38编码Th.23B Orf A中的以下结构域:(a)一个β- 酮脂酰ACP合成酶(KS)结构域;(b)一个丙二酰辅酶A:ACP酰基转移酶(MAT)结构域;(c)八个酰基载体蛋白(ACP)结构域;和(d)一个β-酮脂酰ACP还原酶(KR)结构域。 
就本发明人已知的最大范围而言,本申请称为Th23BOrf A_pBR812.1和Th23BOrfA_pBR811(Orf A基因组克隆)的从破囊壶菌属23B一起分离的两种基因组克隆(重叠克隆)包含SEQ ID NO:38的核苷酸序列,并且编码SEQ ID NO:39的氨基酸序列。基因组克隆Th23BOrf A_pBR812.1(称为Th23BOrfA_pBR812.1基因组克隆,形式为含有破囊壶菌属23B Orf A基因序列的大肠杆菌质粒载体时)在2007年3月1日保藏在American TypeCulture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-8232。本发明包括Th23BOrfA_pBR812.1(Orf A基因组克隆)的核苷酸序列和上述质粒编码的氨基酸序列。基因组克隆Th23BOrfA_pBR811(称为Th23BOrfA_pBR811基因组克隆,形式为含有破囊壶菌属23B Orf A基因序列的大肠杆菌质粒载体时)在2007年3月1日保藏在American Type Culture Collection(ATCC),10801 UniversityBoulevard,Manassas,Va.20110-2209USA,并且ATCC保藏号为PTA-8231。本发明包括Th23BOrf A_pBR811(Orf A基因组克隆)的核苷酸序列和上述质粒编码的氨基酸序列。 
Th.23B Orf A中的第一结构域为KS结构域,本申请也将其称为Th.23BOrf A-KS,并且包含在跨越SEQ ID NO:38的约1位至约1500位的核苷酸序列中,本申请将其表示为SEQ ID NO:40。含有所述Th.23B KS结构域的氨基酸序列为SEQ ID NO:39中跨越SEQ ID NO:39的约1位至约500位的区域,本申请将其表示为SEQ ID NO:41。SEQ ID NO:39中的上述区域就Pfam而言匹配于跨越SEQ ID NO:39的1位至约450位(即SEQ ID NO:41的1位至约450位)的FabB(β-酮脂酰ACP合成酶)。应该注意的是,所述Th.23B Orf A-KS结构域含有活性位点模体即DXAC*(*表示酰基结合位点C207)。另外,在Th.23B KS区域端部的特征模体即GFGG存在于SEQ IDNO:39的453位-456位(即SEQ ID NO:41的453位-456位)中。 
Th.23B Orf A中的第二结构域为MAT结构域,本申请也将其称为Th.23B Orf A-MAT,并且包含在跨越SEQ ID NO:38的约1503位至约3000位的核苷酸序列中,本申请将其表示为SEQ ID NO:42。含有所述Th.23B MAT 结构域的氨基酸序列为SEQ ID NO:39中跨越约501位至约1000位的区域,本申请用SEQ ID NO:43表示。SEQ ID NO:39中的上述区域就Pfam而言匹配于跨越SEQ ID NO:39的约580位至约900位(SEQ ID NO:43的80位-400位)的FabD(丙二酰辅酶A:ACP酰基转移酶)。应该注意的是,所述Th.23BOrf A-MAT结构域含有活性位点模体即GHS*XG(*表示酰基结合位点S697),其用SEQ ID NO:39的695位-699位表示。 
Th.23B Orf A的结构域3-10为八个串联的ACP结构域,本申请也将其称为Th.23B Orf A-ACP(所述序列中的第一结构域为Orf A-ACP1,第二结构域为Orf A-ACP2,第三结构域为Orf A-ACP3,依此类推)。第一Th.23B ACP结构域即Th.23B Orf A-ACP1包含在跨越SEQ ID NO:38(OrfA)的约3205位至约3555位的核苷酸序列中,本申请将其表示为SEQ ID NO:44。含有第一Th.23B ACP结构域的氨基酸序列为SEQ ID NO:39中跨越SEQ ID NO:39的约1069位至约1185位的区域,本申请用SEQ ID NO:45表示。 
Th.23B Orf A中的八个ACP结构域彼此相邻,并且可通过是否存在磷酸泛酰巯基乙胺结合位点模体即LGXDS*(用SEQ ID NO:46表示)来鉴定,其中所述S*为磷酸泛酰巯基乙胺结合位点。就SEQ ID NO:39而言,八个S*位点各自的氨基酸位置为1128(ACP1)、1244(ACP2)、1360(ACP3)、1476(ACP4)、1592(ACP5)、1708(ACP6)、1824(ACP7)和1940(ACP8)。所有八个Th.23B ACP结构域的核苷酸序列和氨基酸序列都是高度保守的,因此本申请没有用各自的序列标识符来表示每个结构域的序列。然而,基于本申请披露的信息,本领域技术人员可容易地确定含有SEQ ID NO:38和SEQID NO:39中含有其它七个ACP结构域之一的序列。 
所有八个Th.23B ACP结构域一起跨越Th.23B Orf A中SEQ ID NO:38的约3205位至约5994位的区域,其相应于SEQ ID NO:39的约1069位氨基酸至约1998位氨基酸。本申请将编码含有所有八个结构域的完整ACP区域的核苷酸序列表示为SEQ ID NO:47。SEQ ID NO:47编码本申请用SEQID NO:48表示的氨基酸序列。SEQ ID NO:48包括各个ACP结构域之间的接头片段。在SEQ ID NO:48中,所述八个结构域的每个重复间隔为约116个氨基酸,并且相信每个结构域都由约116个聚集在活性位点上的氨基酸组成(上述)。 
Th.23B Orf A中的最后一个结构域为KR结构域,本申请也将其称为 Th.23B Orf A-KR,其包含在跨越SEQ ID NO:38的约6001位至约8433位的核苷酸序列中,本申请用SEQ ID NO:49表示。含有所述Th.23B KR结构域的氨基酸序列为SEQ ID NO:39中跨越SEQ ID NO:39的约2001位至约2811位的区域,本申请用SEQ ID NO:50表示。SEQ ID NO:39中的上述区域就Pfam而言匹配于跨越SEQ ID NO:39的约2300位至约2550位(SEQ IDNO:50的300位-550位)的FabG(β-酮脂酰ACP还原酶)。 
破囊壶菌属23B可读框B(Orf B)
本申请将Th.23B Orf B的完整核苷酸序列表示为SEQ ID NO:51,其为5805个核苷酸的序列(不包括终止密码子),所述5805个核苷酸的序列编码1935个氨基酸的序列,本申请将所述1935个氨基酸的序列表示为SEQ IDNO:52。SEQ ID NO:51编码Th.23B Orf B中的以下结构域:(a)一个β-酮脂酰ACP合成酶(KS)结构域;(b)一个链长度因子(CLF)结构域;(c)一个酰基转移酶(AT)结构域;和(d)一个烯酰ACP还原酶(ER)结构域。 
就本发明人已知的最大范围而言,本申请称为Th23BOrf B_pBR800(OrfB基因组克隆)的从破囊壶菌属23B分离的基因组克隆包含SEQ ID NO:51的核苷酸序列,并且编码SEQ ID NO:52的氨基酸序列。基因组克隆Th23BOrfB_pBR800(称为Th23BOrfB_pBR800基因组克隆,形式为含有破囊壶菌属23B Orf B基因序列的大肠杆菌质粒载体时)在2007年3月1日保藏在American Type Culture Collection(ATCC),10801 University Boulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-8227。本发明包括Th23BOrfB_pBR800(OrfB基因组克隆)的核苷酸序列和上述质粒编码的氨基酸序列。 
Th.23B Orf B中的第一结构域为KS结构域,本申请也将其称为Th.23BOrf B-KS,其包含在跨越SEQ ID NO:51(Th.23B Orf B)的约1位至约1500位的核苷酸序列中,本申请将其表示为SEQ ID NO:53。含有所述Th.23B KS结构域的氨基酸序列为SEQ ID NO:52中跨越SEQ ID NO:52的约1位至约500位的区域,本申请将其表示为SEQ ID NO:54。SEQ ID NO:52中的上述区域就Pfam而言匹配于跨越约1位至约450位(SEQ ID NO:54的1位-450位)的FabB(β-酮脂酰ACP合成酶)。应该注意的是,所述Th.23B Orf B-KS结构域含有活性位点模体即DXAC*,其中C*为酰基结合位点,并且其中所述C*处于SEQ ID NO:52的201位。另外,在所述KS区域端部的特征模 体即GFGG存在于SEQ ID NO:52的434位氨基酸-437位氨基酸中。 
Th.23B Orf B中的第二结构域为CLF结构域,本申请也将其称为Th.23B Orf B-CLF,其包含在跨越SEQ ID NO:51(Orf B)的约1501位至约3000位的核苷酸序列中,本申请将其表示为SEQ ID NO:55。含有所述CLF结构域的氨基酸序列为SEQ ID NO:52中跨越SEQ ID NO:52的约501位至约1000位的区域,本申请将其表示为SEQ ID NO:56。SEQ ID NO:52中的上述区域就Pfam而言匹配于跨越约550位至约910位(SEQ ID NO:56的50位-410位)的FabB(β-酮脂酰ACP合成酶)。虽然CLF与KS蛋白具有同源性,但其缺乏活性位点半胱氨酸,而在KS蛋白中,酰基与所述活性位点半胱氨酸相连。 
Th.23B Orf B中的第三结构域为AT结构域,本申请也将其称为Th.23BOrf B-AT,其包含在跨越SEQ ID NO:51(Th.23B Orf B)的约3001位至约4500位的核苷酸序列中,本申请将其表示为SEQ ID NO:58。含有所述Th.23B AT结构域的氨基酸序列为SEQ ID NO:52中跨越SEQ ID NO:52的约1001位至约1500位的区域,本申请将其表示为SEQ ID NO:58。SEQ ID NO:52中的上述区域就Pfam而言匹配于跨越约1100位至约1375位(SEQ ID NO:58的100位-375位)的FabD(丙二酰辅酶A:ACP酰基转移酶)。虽然所述PUFA合成酶的上述AT结构域与MAT蛋白具有同源性,但其缺乏所述MAT的扩展模体(关键的精氨酸残基和谷氨酰胺残基),并且认为在丙二酰辅酶A的转移过程中不涉及所述AT结构域。存在酰基转移酶的GXS*XG模体,其中所述S*为酰基结合位点,其就SEQ ID NO:52而言处于1123位。 
Th.23B Orf B中的第四结构域为ER结构域,本申请也将其称为Th.23BOrf B-ER,其包含在跨越SEQ ID NO:51(Orf B)的约4501位至约5805位的核苷酸序列中,本申请将其表示为SEQ ID NO:59。包含所述Th.23B ER结构域的氨基酸序列为SEQ ID NO:52中跨越SEQ ID NO:52的约1501位至约1935位的区域,本申请将其表示为SEQ ID NO:60。SEQ ID NO:52中的上述区域就Pfam而言匹配于跨越约1501位至约1810位(SEQ ID NO:60的1位-310位)的与2-硝基丙烷双加氧酶相关的双加氧酶家族。由于上述结构域与最近表征的肺炎链球菌的ER酶具有同源性而可进一步预测上述结构域的功能是作为ER。 
破囊壶菌属23B可读框C(Orf C)
本申请将Th.23B Orf C的完整核苷酸序列表示为SEQ ID NO:61,其为4410个核苷酸的序列(不包括终止密码子),所述4410个核苷酸的序列编码1470个氨基酸的序列,本申请将所述1470个氨基酸的序列表示为SEQ IDNO:62。SEQ ID NO:61编码Th.23B Orf C中的以下结构域:(a)两个FabA样β-羟酰ACP脱水酶(DH)结构域,二者都与FabA蛋白(一种酶,其催化反式2-癸烯酰基-ACP的合成和上述产物向顺式3-癸烯酰基-ACP的可逆异构化)具有同源性;和(b)一个烯酰ACP还原酶(ER)结构域,其与裂殖壶菌属Orf B的ER结构域具有高度同源性。 
就本发明人已知的最大范围而言,本申请称为Th23BOrfC_pBR709A(OrfC基因组克隆)的从破囊壶菌属23B分离的基因组克隆包含SEQ ID NO:61的核苷酸序列,并且编码SEQ ID NO:62的氨基酸序列。基因组克隆Th23BOrf C_pBR709A(称为Th23BOrf C_pBR709A基因组克隆,形式为含有破囊壶菌属23B Orf C基因序列的大肠杆菌质粒载体时)在2007年3月1日保藏在American Type Culture Collection(ATCC),10801 UniversityBoulevard,Manassas,Va.20110-2209 USA,并且ATCC保藏号为PTA-8228。本发明包括Th23BOrf C_pBR709A(Orf C基因组克隆)的核苷酸序列和上述质粒编码的氨基酸序列。 
Th.23B Orf C中的第一结构域为DH结构域,本申请也将其称为Th.23B Orf C-DH1,其包含在跨越SEQ ID NO:61(Orf C)的约1位至约1500位的核苷酸序列中,本申请将其表示为SEQ ID NO:63。含有所述Th.23B DH1结构域的氨基酸序列为SEQ ID NO:62中跨越SEQ ID NO:62的约1位至约500位的区域,本申请将其表示为SEQ ID NO:64。如上所述,SEQ ID NO:62中的上述区域就Pfam而言匹配于跨越约275位至约400位(SEQ ID NO:64的275位-400位)的FabA。 
Th.23B Orf C中的第二结构域也是DH结构域,本申请也将其称为Th.23B Orf C-DH2,其包含在跨越SEQ ID NO:61(Orf C)的约1501位至约3000位的核苷酸序列中,本申请将其表示为SEQ ID NO:65。含有所述Th.23BDH2结构域的氨基酸序列为SEQ ID NO:62中跨越SEQ ID NO:62的约501位至约1000位的区域,本申请将其表示为SEQ ID NO:66。如上所述,SEQID NO:62中的上述区域就Pfam而言匹配于跨越约800位至约925位(SEQID NO:66的300位-425位)的FabA。
Th.23B Orf C中的第三结构域为ER结构域,本申请也将其称为Th.23BOrf C-ER,其包含在跨越SEQ ID NO:61(Orf C)的约3001位至约4410位的核苷酸序列中,本申请将其表示为SEQ ID NO:67。含有所述Th.23B ER结构域的氨基酸序列为SEQ ID NO:62中跨越SEQ ID NO:62的约1001位至约1470位的区域,本申请将其表示为SEQ ID NO:68。如上所述,SEQ ID NO:62中的上述区域就Pfam而言匹配于跨越约1025位至约1320位(SEQ ID NO:68的25位-320位)的与2-硝基丙烷双加氧酶相关的双加氧酶。由于上述结构域与最近表征的肺炎链球菌的ER酶具有同源性而也可预测上述结构域的功能是作为ER。 
Shewanella iaponica PUFA PKS
有五个可读框能形成Shewanella japonica核心PUFA PKS系统及其上述PPTase。每个可读框的结构域结构如下。 
SEQ ID NO:69为Shewanella japonica黏粒3F3的核苷酸序列,并且发现其含有15个ORF(可读框)。与上述微生物中的PUFA PKS系统相关的ORF表征如下。 
pfaA(SEQ ID NO:69的核苷酸10491-18854)编码PFAS A(SEQ ID NO:70)即具有以下结构域的PUFA PKS蛋白:β-酮酰基-合成酶(KS)(SEQ ID NO:69的核苷酸10575-12029,SEQ ID NO:70的氨基酸29-513);丙二酰辅酶A:ACP酰基转移酶(MAT)(SEQ ID NO:69的核苷酸12366-13319,SEQ ID NO:70的氨基酸625-943);六个串联的酰基载体蛋白(ACP)结构域(SEQ ID NO:69的核苷酸14280-16157,SEQ ID NO:70的氨基酸1264-1889);β-酮脂酰ACP还原酶(KR)(SEQ ID NO:69的核苷酸17280-17684,SEQ ID NO:70的氨基酸2264-2398);和所述PFAS A蛋白中在SEQ ID NO:70的氨基酸2399至2787之间的区域,其含有脱水酶(DH)保守活性位点模体LxxHxxxGxxxxP(SEQ IDNO:70的氨基酸2504-2516),本申请将其称为DH-模体区域。 
在PFAS A中,KS活性位点DXAC*位于SEQ ID NO:70的氨基酸226-229,其中所述C*为酰基结合位点。MAT活性位点即GHS*XG位于SEQID NO:70的氨基酸721-725,其中所述S*为酰基结合位点。ACP活性位点即LGXDS*在SEQ ID NO:70中位于以下位置:氨基酸1296-1300、氨基酸1402-1406、氨基酸1513-1517、氨基酸1614-1618、氨基酸1728-1732和氨基酸1843-1847,其中所述S*为磷酸泛酰巯基乙胺结合位点。在SEQ ID NO:70的氨基酸2399和2787之间,所述PFAS A也含有上述脱水酶(DH)保守活性位点模体LxxHxxxGxxxxP(SEQ ID NO:70的氨基酸2504-2516)。 
pfaB(SEQ ID NO:69的核苷酸18851-21130)编码PFAS B(SEQ ID NO:71)即具有以下结构域的PUFA PKS蛋白:酰基转移酶(AT)(SEQ ID NO:69的核苷酸19982-20902,SEQ ID NO:71的氨基酸378-684)。 
在PFAS B中,活性位点GXSuXG模体位于SEQ ID NO:71的氨基酸463-467,其中所述S*为酰基结合位点。 
pfaC(SEQ ID NO:69的核苷酸21127-27186)编码PFAS C(SEQ ID NO:72)即具有以下结构域的PUFA PKS蛋白:KS(SEQ ID NO:69的核苷酸21139-22575,SEQ ID NO:72的氨基酸5-483);链长度因子(CLF)(SEQ IDNO:69的核苷酸22591-23439,SEQ ID NO:72的氨基酸489-771);和两个FabA3-羟酰ACP脱水酶,将其称为DH1(SEQ ID NO:69的核苷酸25408-25836,SEQ ID NO:72的氨基酸1428-1570)和DH2(SEQ ID NO:69的核苷酸26767-27183,SEQ ID NO:72的氨基酸1881-2019)。 
在PFAS C中,KS活性位点DXAC*位于SEQ ID NO:72的氨基酸211-214,其中所述C*为酰基结合位点。 
pfaD(SEQ ID NO:69的核苷酸27197-28825)编码PFAS D(SEQ ID NO:73)即具有以下结构域的PUFA PKS蛋白:烯酰基还原酶(ER)(SEQ ID NO:69的核苷酸27446-28687,SEQ ID NO:73的氨基酸84-497)。 
pfaE(反向互补链上的SEQ ID NO:69的核苷酸6150-7061)编码PFASE(SEQ ID NO:74)即4’-磷酸泛酰巯基乙氨基转移酶(PPTase),其具有确定的结构域(SEQ ID NO:69的核苷酸6504-6944,SEQ ID NO:74的氨基酸40-186)。 
Shewanella olleyana PUFA PKS 
有五个可读框能形成Shewanella o1leyan核心PUFA PKS系统及其上述PPTase。每个可读框的结构域结构如下。 
SEQ ID NO:75为Shewanella olleyana黏粒9A10的核苷酸序列,并且发现其含有17个ORF。与上述微生物中的PUFA PKS系统相关的ORF表征如下。 
pfaA(SEQ ID NO:75的核苷酸17437-25743)编码PFAS A(SEQ ID NO:76)即具有以下结构域的PUFA PKS蛋白:β-酮酰基-合成酶(KS)(SEQ ID NO:75 的核苷酸17521-18975,SEQ ID NO:76的氨基酸29-513);丙二酰辅酶A:ACP酰基转移酶(MAT)(SEQ ID NO:75的核苷酸19309-20265,SEQ ID NO:76的氨基酸625-943);六个串联的酰基载体蛋白(ACP)结构域(SEQ ID NO:75的核苷酸21259-23052,SEQ ID NO:76的氨基酸1275-1872);β-酮脂酰ACP还原酶(KR)(SEQ ID NO:75的核苷酸24154-24558,SEQ ID NO:76的氨基酸2240-2374);和所述PFAS A蛋白中在SEQ ID NO:76的氨基酸2241和2768之间的区域,其含有脱水酶(DH)保守活性位点模体LxxHxxxGxxxxP(SEQ IDNO:76的氨基酸2480-2492),本申请将其称为DH-模体区域。 
在PFAS A中,KS活性位点DXAC*位于SEQ ID NO:76的氨基酸226-229,其中所述C*为酰基结合位点。MAT活性位点即GHS*XG位于SEQID NO:76的氨基酸721-725,其中所述S*为酰基结合位点。ACP活性位点即LGXDS*在SEQ ID NO:76中位于以下位置:氨基酸1307-1311、氨基酸1408-1412、氨基酸1509-1513、氨基酸1617-1621、氨基酸1721-1725和氨基酸1826-1830,其中所述S*为磷酸泛酰巯基乙胺结合位点。在SEQ IDNO:76的氨基酸2241和2768之间,所述PFAS A也含有上述脱水酶(DH)保守活性位点模体LxxHxxxGxxxxP(SEQ ID NO:76的氨基酸2480-2492)。 
pfaB(SEQ ID NO:75的核苷酸25740-27971)编码PFAS B(SEQ ID NO:77)即具有以下结构域的PUFA PKS蛋白:酰基转移酶(AT)(SEQ ID NO:75的核苷酸26837-27848,SEQ ID NO:77的氨基酸366-703)。 
在PFAS B中,活性位点GXS*XG模体位于SEQ ID NO:77的氨基酸451-455,其中所述S*为酰基结合位点。 
pfaC(SEQ ID NO:75的核苷酸27968-34030)编码PFAS C(SEQ ID NO:78)即具有以下结构域的PUFA PKS蛋白:KS(SEQ ID NO:75的核苷酸27995-29431,SEQ ID NO:78的氨基酸10-488);链长度因子(CLF)(SEQ IDNO:75的核苷酸29471-30217,SEQ ID NO:78的氨基酸502-750);和两个FabA3-羟酰ACP脱水酶,将其称为DH1(SEQ ID NO:75的核苷酸32258-32686,SEQ ID NO:78的氨基酸1431-1573)和DH2(SEQ ID NO:75的核苷酸33611-34027,SEQ ID NO:78的氨基酸1882-2020)。 
在PFAS C中,KS活性位点DXAC*位于SEQ ID NO:78的氨基酸216-219,其中所述C*为酰基结合位点。 
pfaD(SEQ ID NO:75的核苷酸34041-35669)编码PFAS D(SEQ ID NO:79) 即具有以下结构域的PUFA PKS蛋白:烯酰基还原酶(ER)(SEQ ID NO:75的核苷酸34290-35531,SEQ ID NO:79的氨基酸84-497)。 
pfaE(反向互补链上的SEQ ID NO:75的核苷酸13027-13899)编码PFASE(SEQ ID NO:80)即4’-磷酸泛酰巯基乙氨基转移酶(PPTase),其具有确定的结构域(SEQ ID NO:75的核苷酸13369-13815,SEQ ID NO:80的氨基酸29-177)。 
其它PUFA PKS序列
sOrf A
SEQ ID NO:35(称为sOrf A)表示编码来自裂殖壶菌属的Orf A的核酸序列(SEQ ID NO:1),已将其重合成,用于对酵母中的密码子选择进行优化。SEQ ID NO:1和SEQ ID NO:35各自编码SEQ ID NO:2。 
sOrf B
SEQ ID NO:36(称为sOrf B)表示编码来自裂殖壶菌属的Orf B的核酸序列(SEQ ID NO:3),已将其重合成,用于对酵母中的密码子选择进行优化。SEQ ID NO:3和SEQ ID NO:36各自编码SEQ ID NO:4。 
OrfB *
SEQ ID NO:37(称为Orf B*)表示编码来自裂殖壶菌属的Orf B的核酸序列(SEQ ID NO:3),已在部分SEQ ID NO:3中将其重合成,用于在植物细胞中使用,并且其源于为了对大肠杆菌中的密码子选择进行优化而最初开发的极相似序列,也将其称为Orf B*。除重合成的BspHI(SEQ ID NO:3的核苷酸4415)至SacII片段(SEQ ID NO:3中的统一位点(unique site))外,两种形式的OrfB*(对于大肠杆菌和对于植物)都与SEQ ID NO:3相同。与Orf B的原始基因组序列(SEQ ID NO:3)相比,两种版本的Orf B*(大肠杆菌和植物)都在所述基因的起点(start)附近具有两处其它密码子修饰。首先,第四密码子即精氨酸(R)从所述基因组序列中的CGG变成Orf B*中的CGC。其次,第五密码子即天冬酰胺(N)从所述基因组序列中的AAT变成Orf B*中的AAC。为了有助于将上述基因克隆到植物载体中以得到SEQ ID NO:37,在大肠杆菌Orf B*序列的第20个碱基(从所述基因的起点数起)处,将PstI位点(CTGCAG)也工程化到大肠杆菌Orf B*序列中。上述变化不会使所编码的蛋白质的氨基酸序列发生改变。SEQ ID NO:37和SEQ ID NO:3(及用于大肠杆菌的Orf B*形式)都编码SEQ ID NO:4。
PUFA PKS系统还可包括一种或多种辅助蛋白,本申请将所述辅助蛋白定义为被认为不是上述核心PUFA PKS系统的部分的蛋白质(即不是所述PUFA合成酶复合物本身的部分),但就使用本发明的核心PUFA合成酶复合物来产生PUFA而言或至少就使用本发明的核心PUFA合成酶复合物来高效地产生PUFA生而言,所述辅助蛋白可能是必需的或就是必需的。例如,为了产生PUFA,PUFA PKS系统必须与以下辅助蛋白一起工作,所述辅助蛋白将4’-磷酸泛酰巯基乙氨基从辅酶A转移到酰基载体蛋白(ACP)结构域(或多个酰基载体蛋白(ACP)结构域)。因此,可认为PUFA PKS系统包括至少一个4’-磷酸泛酰巯基乙氨基转移酶(PPTase)结构域,或可认为上述结构域为所述PUFA PKS系统的辅助结构域或辅助蛋白。 
根据本发明,具有4’-磷酸泛酰巯基乙氨基转移酶(PPTase)生物活性(功能)的结构域或蛋白质以如下酶为特征,所述酶将4’-磷酸泛酰巯基乙氨基从辅酶A转移到酰基载体蛋白(ACP)。上述向ACP的固定丝氨酸残基进行的转移使无活性的脱辅基形式活化成完整形式。在聚酮化合物的合成和脂肪酸的合成中,磷酸泛酰巯基乙胺基团与延长的酰基链形成硫酯。所述PPTase为已在脂肪酸的合成、聚酮化合物的合成和非核糖体肽的合成中充分表征的酶家族。多种PPTase的序列是已知的,并且已确定晶体结构(例如ReuterK,Mofid MR,Marahiel MA,Ficner R.“Crystal structure of the surfactinsynthetase-activating enzyme sfp:a prototype of the 4’-phosphopantetheinyltransferase superfamily”EMBO J.1999 Dec 1;18(23):6823-31),及对就活性而言重要的氨基酸残基进行了突变分析(Mofid MR,Finking R,Essen LO,Marahiel MA.“Structure-based mutational analysis of the4’-phosphopantetheinyl transferases Sfp from Bacillus subtilis:carrier proteinrecognition and reaction mechanism”Biochemistry. 2004 Apr13;43(14):4128-36)。PPTase中的这些固定并且高度保守的氨基酸包含在来自上述两种希瓦氏菌属菌株的pfaE ORF中。 
先前已证明一种异源的PPTase可识别本申请描述的OrfA ACP结构域而将其作为底物,所述异源的PPTase为念珠藻属种PCC 7120(先前称为鱼腥蓝细菌属种(Anabaena sp.)PCC 7120)的HetI蛋白。HetI存在于念珠藻属的基因簇中,已知其负责长链羟基-脂肪酸的合成,所述长链羟基-脂肪酸为存在于上述生物体的异形胞中的糖脂层的组分(Black and Wolk,1994,J. Bacteriol.176,2282-2292和Campbell et al.,1997,Arch.Microbiol.167,251-258)。HetI可能使存在于上述簇中的蛋白质即Hgl E的ACP结构域活化。Hgl E的两个ACP结构域与在裂殖壶菌属Orf A中发现的ACP结构域具有高度序列同源性。SEQ ID NO:34表示念珠藻属HetI蛋白的氨基酸序列,并且为可与本发明描述的PUFA PKS系统(包括来自裂殖壶菌属和破囊壶菌属的PUFA PKS系统)一起使用的功能性PPTase。SEQ ID NO:34由SEQ IDNO:33编码。还没有鉴定出HetI的内源性起始密码子(在所述推定的蛋白质中没有任何甲硫氨酸)。在所述可读框的5’端附近有几种潜在的可替换的起始密码子(例如TTG和ATT)。在所述序列中没有任何甲硫氨酸密码子(ATG)。然而,利用PCR以用甲硫氨酸密码子(ATG)(作为NdeI限制性酶识别位点的部分)代替最远的5’潜在的可替换的起始密码子(TTG),并且在所述编码序列的3’端引入XhoI位点,从而完成对HetI表达构建体(expression construct)的构建,并且已显示所编码的PPTase(SEQ ID NO:34)具有功能。 
先前已证明另一种异源的PPTase可识别本申请描述的Orf A ACP结构域而将其作为底物,所述异源的PPTase为源于枯草芽孢杆菌(Bacillus subtilis)的sfp。已对sfp进行了充分的表征,并且由于其能识别很多种底物而被广泛地使用。基于公开的序列信息(Nakana,et al.,1992,Molecular and GeneralGenetics 232:313-321),先前通过将所述编码区域及上游和下游的侧翼DNA序列克隆到pACYC-184克隆载体中而得到了sfp的表达载体。上述构建体(construct)编码功能性PPTase,表现为其能在大肠杆菌中与裂殖壶菌属OrfA、B*和C共表达,这在合适的条件下使DHA积累在那些细胞中(参见美国专利申请公开号20040235127)。 
当根据本发明对生物体(例如微生物或植物)进行遗传修饰以表达PUFAPKS系统时,一些宿主生物体可内源性地表达PUFA PKS产生PUFA所需要一起工作的辅助蛋白(例如PPTase)。然而,一些生物体可用编码本申请所述一种或多种辅助蛋白的核酸分子进行转化,以使所述生物体能产生PUFA和/或提高PUFA的产生,即使所述生物体内源性地产生同源的(homologous)辅助蛋白(即与宿主细胞的内源性辅助蛋白相比,一些异源的辅助蛋白可更有效或更高效地与所述转化的PUFA合成酶蛋白一起工作)。本发明提供了已用本发明的包括辅助PPTase的PUFA PKS系统进行遗传修饰的酵母和植物的实例。PPTase的结构特征和功能特征已详细地记载在例如美国专利申 请公开号20020194641、美国专利申请公开号20040235127和美国专利申请公开号20050100995中。 
根据本发明,产生PUFA的“标准”或“经典”途径指其中通过一系列延长和去饱和反应来修饰中链饱和脂肪酸(脂肪酸合成酶(FAS)系统的产物)的脂肪酸合成途径。延长反应的底物为脂肪酰基辅酶A(待延长的脂肪酸链)和丙二酰辅酶A(在每次延长反应期间增加的2个碳的来源)。延长酶反应的产物为在直链中增加2个碳的脂肪酰基辅酶A。去饱和酶通过在基于氧的反应中去掉2个氢而在先前存在的脂肪酸链中形成顺式双键。如以上讨论的那样,上述途径和上述途径中涉及的基因在文献中是众所周知的。 
本申请使用的术语“脂质”包括磷脂(PL)、游离脂肪酸、脂肪酸的酯、三酰甘油(TAG)、二酰基甘油酯、单酰基甘油酯、磷脂(phosphatide)、蜡(醇和脂肪酸的酯)、甾醇和甾醇酯、类胡萝卜素(carotenoid)、叶黄素(xanthophyll)(例如氧化类胡萝卜素(oxycarotenoid))、碳氢化合物和本领域技术人员已知的其它脂质。术语“多不饱和脂肪酸”和“PUFA”不但包括游离脂肪酸形式,而且也包括其它形式诸如TAG形式和PL形式。 
为了得到产率显著高的一种或多种所期望的多不饱和脂肪酸,可对植物进行遗传修饰,以将PUFA PKS系统引入到所述植物中。尚未知道植物是否内源性地含有PUFA PKS系统,因此本发明的PUFA PKS系统提供了使植物具有独特脂肪酸产生能力的机会。本发明的特别优选的实施方案是对植物进行遗传工程化,以在所述植物中产生一种或多种PUFA,包括EPA、DHA、DPA(n-3或n-6)、ARA、GLA、SDA和其它PUFA。本发明提供了以各种比例和各种形式产生众多“设计者油(designer oil)”中任何一种的能力。而且,对本申请所述特定海洋生物体的PUFA PKS基因的披露提供了更容易地拓展PUFA产生范围的机会,并且提供了在用于大多数农作植物生长的温度范围内更成功地产生上述PUFA的机会。 
因此,本发明的一个实施方案涉及遗传修饰的植物或植物部分(例如其中所述植物已遗传修饰为表达本申请描述的PUFA PKS系统),所述植物或植物部分包括至少核心PUFA PKS酶复合物,并且在一个实施方案中还包括至少一种PUFA PKS辅助蛋白(例如PPTase),从而使所述植物产生PUFA。优选地,所述植物为含油种子植物,其中所述含油种子和/或所述含油种子中的油含有所述PUFA PKS系统产生的PUFA。上述油含有可检测量的至少 一种靶标或主要PUFA,其为所述PUFA PKS系统的产物。另外,上述油基本不含有中间体或副产物,所述中间体或副产物不是靶标或主要PUFA产物,并且不是野生型植物中的内源性FAS系统所天然产生的(即野生型植物通过FAS系统来产生一些短链或中链PUFA(诸如18个碳的PUFA),但当用PUFA PKS系统进行遗传修饰时,在所述植物中产生新的或额外的脂肪酸)。换言之,与野生型植物(没有进行遗传修饰)或用作所述遗传修饰接受体的母体植物的全部脂肪酸分布相比,在已用PUFA PKS系统进行遗传修饰的植物所产生的全部脂肪酸的分布中,额外的脂肪酸(所述遗传修饰产生的新脂肪酸或增加的脂肪酸)中的大部分包含所述PUFA PKS系统的靶标或预期的PUFA产物(即在所述遗传修饰的植物所产生的全部脂肪酸中,额外或新脂肪酸中的大部分为靶标PUFA(或多种PUFA))。 
此外,在合成PUFA的系统“基本不含有”所述系统的中间体或副产物或不含有显著量的中间体或副产物,这意味着当引入或存在可产生PUFA的酶系统时,在所述遗传修饰的植物(和/或植物部分和/或种子油部分)中产生的任何中间体或副产物脂肪酸(非靶标PUFA)(即野生型植物或用作所述遗传修饰接受体的母体植物不产生所述中间体或副产物脂肪酸)的量在所述植物产生的全部脂肪酸中少于约10%重量,更优选地少于约9%,更优选地少于约8%,更优选地少于约7%,更优选地少于约6%,更优选地少于约5%,更优选地少于约4%,更优选地少于约3%,更优选地少于约2%,更优选地少于约1%重量,并且更优选地少于约0.5%重量。 
在优选的实施方案中,在合成PUFA的系统“基本不含有”所述系统的中间体或副产物或不含有显著量的中间体或副产物,这意味着当所述酶系统产生PUFA时,在所述遗传修饰的植物(和/或植物部分和/或种子油部分)中产生的任何中间体或副产物脂肪酸(即野生型植物或用作所述遗传修饰(用于产生靶标PUFA)接受体的母体植物不产生所述中间体或副产物脂肪酸)的量在所述植物产生的总额外脂肪酸(将额外的脂肪酸定义为以下脂肪酸或脂肪酸水平,野生型植物或用作所述遗传修饰(用于产生靶标PUFA)接受体的母体植物不会天然产生所述脂肪酸)中少于约10%重量,更优选地少于约9%,更优选地少于约8%,更优选地少于约7%,更优选地少于约6%,更优选地少于约5%,更优选地少于约4%,更优选地少于约3%,更优选地少于约2%,并且更优选地少于约1%。因此,与已遗传修饰为通过标准途径 来产生PUFA的植物的脂肪酸分布相比,当用PUFA PKS系统进行遗传修饰时,脂肪酸产物中的大部分可以是所述靶标或预期的脂肪酸产物。 
当PUFA PKS系统的靶标产物为长链PUFA(诸如DHA、DPA(n-6或n-3)或EPA)时,在用上述PUFA PKS进行遗传修饰的植物的总脂质中量不显著的中间体产物和副产物可包括但不限于γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(stearidonic acid)(STA或SDA;18:4,n-3)、双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)、花生四烯酸(ARA,C20:4,n-6)、二十碳三烯酸(ETA;20:3,n-9)和各种其它中间体或副产物诸如20:0、20:1(Δ5)、20:1(Δ11)、20:2(Δ8,11)、20:2(Δ11,14)、20:3(Δ5,11,14)、20:3(Δ11,14,17)、蜂蜜酸(20:3;Δ5,8,11)或20:4(Δ5,1,14,17)。另外,当靶标产物为特定的PUFA(诸如DHA)时,在所述遗传修饰的植物的总脂质中量不显著的中间体产物和副产物也包括其它PUFA,包括作为不同PUFA PKS系统的天然产物的其它PUFA,诸如上述实例中的EPA。应该注意的是,如果需要,本发明的PUFA PKS系统也可用于产生可包括GLA、SDA或DGLA的PUFA作为靶标PUFA。 
利用本申请所述PUFA PKS系统的遗传基础和结构域结构的知识,本发明人已设计并且得到对上述PUFA PKS系统进行编码的构建体,并且已成功地得到表达所述PUFA PKS系统的转基因植物。所述转基因植物产生含有PUFA的油,并且所述油基本不含有在标准PUFA途径中积累的中间体产物。本发明人也已显示的是,使用所述构建体以在另一种真核生物即酵母中产生PUFA,作为在得到转基因植物前的概念证实(proof-of-concept)实验。所述实例显示,用产生DHA和DPA n-6作为靶标PUFA的PUFA PKS系统进行转化的酵母和植物产生上述两种PUFA,作为所述植物(即扣除(subtract)野生型植物中产生的脂肪酸)和所述酵母的全部脂肪酸中的主要额外脂肪酸,并且所述实例还显示,在野生型植物或母体植物的脂肪酸中不存在的任何其它脂肪酸实际上是检测不到的。以下详细描述了本发明的遗传修饰的植物及其部分和油的具体特征。 
如上所述,本发明可使用的遗传修饰的植物已遗传修饰为表达PUFAPKS系统。所述PUFA PKS系统可包括任何PUFA PKS系统,诸如记载在例如美国专利6,566,583、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO 2006/135866中的任何PUFA PKS系统。所述PUFA PKS系统可选自但 不限于在这些专利和专利出版物中鉴定和表征的任何具体的PUFA PKS系统,诸如来自以下生物体的PUFA PKS系统:裂殖壶菌属种American TypeCulture Collection(ATCC)No.20888及其衍生的突变体菌株(例如菌株N230D)、破囊壶菌属23B ATCC No.20892及其衍生的突变体菌株、Shewanella olleyana Australian Collection of Antarctic Microorganisms(ACAM)菌株号644及其衍生的突变体菌株或Shewanella japonica ATCC菌株号BAA-316及其衍生的突变体菌株。 
在一个实施方案中,所述PUFA PKS系统包含选自以上任何PUFA PKS系统的结构域,其中对所述结构域进行组合(混合或匹配),以形成满足上述最低需要的完整PUFA PKS系统。所述植物也可进一步用另一种PKS系统的至少一种结构域或其生物活性片段来修饰,所述另一种PKS系统包括但不限于I型PKS系统(重复的或模块的)、II型PKS系统和/或III型PKS系统,其可代替PUFA PKS系统中的结构域。最后,可基于PUFA PKS系统的天然结构而对所述PUFA PKS系统的任何结构域进行修饰,以调节或提高上述结构域在所述PUFA PKS系统中的功能(例如调节所述系统产生的PUFA的类型或其比例)。在上述专利和专利出版物中描述了对结构域进行上述混合以产生意想不到的PUFA PKS蛋白(chimeric PUFA PKS protein)。 
最后,如上所述,对所述植物进行的遗传修饰可包括引入一种或多种辅助蛋白,所述一种或多种辅助蛋白可与核心PUFA PKS酶复合物一起工作,以使所述植物能产生PUFA或促进或提高所述植物进行的PUFA产生。例如,本发明包括用编码PUFA PKS酶复合物和编码可与所述PUFA PKS复合物一起工作的PPTase的核酸分子对所述植物进行转化。其它辅助分子也可用于对所述植物进行转化,这些辅助分子诸如为在所述植物中有助于向TAG和PL部分进行转移和有助于在TAG和PL部分中进行积累的任何分子。上述实施方案详细记载在美国专利号6,566,583、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和美国临时申请号60/689,167中。 
本申请使用的遗传修饰的植物可包括任何遗传修饰的植物,包括高等植物,特别是任何消耗性植物(consumable plant)或可用于产生本发明期望的PUFA的植物。本申请使用的“植物部分”包括植物的任何部分,包括但不限于种子(未成熟或成熟的)、油、花粉、胚芽、花、果实、枝、叶、根、茎、 外植体等。遗传修饰的植物具有以下基因组,与所述基因组的正常(即野生型或天然)形式相比,对所述基因组进行修饰(即突变或变化),或所述基因组含有遗传修饰或外源性引入的核酸,从而达到所期望的结果(即PUFA PKS的活性和PUFA的产生)。可利用经典菌株发育和/或分子遗传技术来对植物进行遗传修饰。在转基因植物中,将编码所期望氨基酸序列的重组核酸分子合并到所述植物的基因组中,并且得到所述转基因植物的方法在本领域中是已知的。根据本发明进行遗传修饰的优选植物优选为适于供动物(包括人类)消耗的植物。 
根据本发明进行遗传修饰的优选植物(即植物宿主细胞)包括但不限于任何高等植物,包括双子叶植物和单子叶植物,特别是消耗性植物,包括农作植物,尤其是由于其含有油而使用的植物。上述植物可包括例如油菜、大豆、油菜子、亚麻子、玉米、红花、向日葵和烟草。其它优选的植物包括已知产生以下化合物的那些植物或遗传工程化为产生以下化合物的植物,所述化合物可用作药物、香料、营养素、功能性食物成分或美容活性物。 
根据本发明,遗传修饰的植物包括已利用重组技术来修饰的植物,所述重组技术可与经典诱变和筛选技术组合进行。本申请使用的一些遗传修饰使基因表达减少,使基因的功能降低,或使基因产物(即所述基因编码的蛋白质)的功能降低,这样的遗传修饰可以称为是对基因进行的钝化(完全或部分)、除去、干扰、阻断或下调。例如,对基因进行的使上述基因编码的蛋白质的功能降低的遗传修饰可以是完全除去所述基因(即所述基因不存在因此所述蛋白质不存在)、使所述基因发生突变而使所述蛋白质的翻译不完全或不发生(例如不表达所述蛋白质)或使所述基因发生突变而降低或破坏所述蛋白质的天然功能(例如对酶活性或酶作用降低或不具有任何酶活性或酶作用的蛋白质进行表达)。使基因表达增加或功能提高的遗传修饰可以是对基因进行的扩增、过度产生、过度表达、活化、提高、增加或上调。 
根据本发明对植物进行的遗传修饰使所述植物产生一种或多种PUFA。所述植物产生的PUFA的PUFA分布和比例无需与PUFA PKS系统所源于的生物体所产生的PUFA的PUFA分布和比例相同。 
就得到遗传修饰的植物而言,对植物进行遗传工程化的方法在本领域中也是众所周知的。例如,已开发了对植物进行转化的多种方法,包括生 物和物理转化方案。参见例如Miki et al.,“Procedures for Introducing ForeignDNA into Plants”in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.and Thompson,J.E.Eds.(CRC Press,Inc.,Boca Raton,1993)pp.67-88。另外,用于对植物细胞或组织进行转化和对植物进行再造(regeneration)的载体和体外培养方法是可得到的。参见例如Gruber et al.,“Vectors for Plant Transformation”in Methods in Plant Molecular Biology andBiotechnology,Glick,B.R.and Thompson,J.E.Eds.(CRC Press,Inc.,BocaRaton,1993)pp.89-119。 
使用最广的将表达载体引入到植物中的方法是基于土壤杆菌属(Agrobacterium)的天然转化系统。参见例如Horsch et al.,Science227:1229(1985)。根癌土壤杆菌(A.tumefaciens)和发根土壤杆菌(A.rhizogenes)为使植物患病的土壤细菌,其使植物细胞发生遗传转化。根癌土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带使植物发生遗传转化的基因。参见例如Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。多篇参考文献描述了用于进行土壤杆菌属介导的基因转移的土壤杆菌属载体系统和方法,这些参考文献包括上述Gruber et al.、上述Miki et al.、Moloney et al.,Plant CellReports8:238(1989)及美国专利号4,940,838和5,464,763。 
另一种通常可使用的对植物进行转化的方法为微粒介导的转化,其中DNA携带在微粒的表面上。用生物射弹装置(biolistic device)将所述表达载体引入到植物组织中,所述生物射弹装置将所述微粒加速到足以穿透植物细胞壁和细胞膜的速度。参见Sanford et al.,Part.Sci.Technol.5:27(1987)、Sanford,J.C.,Trends Biotech.6:299(1988)、Sanford,J.C.,Physiol.Plant79:206(1990)和Klein et al.,Biotechnology10:268(1992)。 
将DNA物理递送到植物中的另一种方法为对靶标细胞进行超声处理。参见Zhang et al.,Bio/Technology9:996(1991)。可替换地,脂质体或原生质球融合已用于将表达载体导入到植物中。参见Deshayes et al.,EMBO J.,4:2731(1985)和Christou et al.,Proc.Natl.Acad.Sci.USA 84:3962(1987)。也已报道的是,利用CaCl2沉淀(CaCl2precipitation)、聚乙烯醇或聚L-鸟氨酸来将DNA直接摄取到原生质体中。参见Hain et al.,Mol.Gen.Genet.199:161(1985)和Draper et al.,Plant Cell Physiol.23:451(1982)。也已描述的是,对原生质体和完整细胞和组织进行电穿孔。参见Donn et al.,In Abstracts of VIIth International Congress on Plant Cell and Fissue Culture IAPTC,A2-38,p.53(1990)、D’Halluin et al.,Plant Cell 4:1495-1505(1992)和Spencer et al.,Plant Mol.Biol.24:51-61(1994)。 
使基因产物(gene product)靶向于质体或叶绿体,这通过在各种蛋白质的氨基端发现的信号序列来控制,并且在转运得到成熟蛋白期间,使所述信号序列裂解(例如就叶绿体靶向而言,参见例如Comai et al.,J.Biol.Chem.263:15104-15109(1988))。这些信号序列可与异源的基因产物融合,以将异源的产物转运到叶绿体中(van den Broeck et al.Nature 313:358-363(1985))。可从编码以下蛋白质的cDNA中分离到合适的信号序列的DNA编码:RUBISCO蛋白、CAB蛋白、EPSP合成酶、GS2蛋白和已知定位于叶绿体的多种其它蛋白质。 
将叶绿体靶向的天然存在的蛋白质合成为含有氨基端叶绿体靶向肽的更大前体蛋白,所述氨基端叶绿体靶向肽使所述前体靶向于叶绿体转运器(chloroplast import machinery),这在本领域中是众所周知的。叶绿体靶向肽一般通过位于叶绿体细胞器中的特异性内切酶来裂解,由此将靶向的成熟的并且优选活具有活性的酶从所述前体释放到叶绿体环境中。对适于使基因或基因产物靶向于植物细胞的叶绿体或质体的对肽进行编码的序列的实例包括矮牵牛(petunia)EPSPS CTP、Arabidopsis EPSPS CTP2和内含子及本领域技术人员已知的其它实例。这些靶向序列将期望表达的蛋白质转移到所述蛋白质最有效发挥功能的细胞结构中,或将期望表达的蛋白质转移到以下细胞区域中,在所述细胞区域中集中了发挥期望表型功能所需要的细胞过程(cellular process)。叶绿体靶向肽的具体实例在本领域中是众所周知的,并且包括拟南芥(Arabidopsis thaliana)核酮糖二磷酸酯羧化酶小亚单元ats1A转运肽、拟南芥EPSPS转运肽和玉米(Zea maize)核酮糖二磷酸酯羧化酶小亚单元转运肽。 
例如在Van den Broeck et al.,“Targeting of a foreign protein tochloroplasts by fusion to the transit peptide from the small subunit of ribulose1,5-biphosphate carboxylase”,Nature,313:358-363(1985)中描述了优化的转运肽。例如在Michaelis et al.(1982)Ann.Rev.Microbiol.36,425中披露了原核信号序列和真核信号序列。本发明可使用的转运肽的其它实例包括诸如在Von Heijne et al.,Plant Mol.Biol.Rep.9:104-126(1991)、Mazur et al.,Plant Physiol.85:1110(1987)和Vorst et al.,Gene 65:59(1988)中所述那样的叶绿体转运肽。Chen和Jagendorf(J.Biol.Chem.268:2363-2367(1993))已描述了将叶绿体转运肽用于转运异源的转基因。所使用的上述肽为来自Nicotianaplumbaginifolia的rbcS基因的转运肽(Poulsen et al.Mol.Gen.Genet.205:193-200(1986))。本申请已用于将异源的蛋白质定位于叶绿体的一种CTP源于欧洲油菜(Brassica napus)酰基-ACP硫酯酶(例如就欧洲油菜酰基-ACP硫酯酶的序列而言,参见Loader et al.,1993,Plant MoI.Biol.23:769-778和Loader et al.,1995,Plant Physiol.110:336-336)。 
将基因定位于叶绿体或质体的可替换方法包括对叶绿体或质体进行转化。可得到以下重组植物,在所述重组植物中,仅使叶绿体DNA发生改变,以合并本申请提出的分子。在叶绿体中发挥功能的启动子在本领域中是已知的(Hanley-Bowden et al.,Trends in Biochemical Sciences 12:67-70,1987)。例如Daniell等人(美国专利号5,693,507;1997)和Maliga等人(美国专利号5,451,513;1995)已描述了得到含有其中已插入有异源DNA的叶绿体的细胞的方法和策略。 
因此,本发明包括利用来自某些海洋细菌的基因和任何破囊壶菌PUFAPKS系统或其它真核PUFA PKS系统来对植物细胞进行遗传修饰的方法,并且本发明还可利用基因混合(gene mixing)来拓展或改变PUFA产物的范围,以包括EPA、DHA、DPA(n-3或n-6)、ARA、GLA、SDA和其它PUFA。得到产生分布发生变化的这些PUFA的方法不但包括将来自各种生物体的基因混合到破囊壶菌PUFA PKS基因中,而且也包括对本发明披露的内源性破囊壶菌PUFA PKS基因进行遗传修饰的各种方法。有关破囊壶菌PUFAPKS系统和海洋细菌PUFA PKS系统的遗传基础和结构域结构的知识为设计新的遗传修饰的产生各种PUFA分布的生物体提供了基础。可对存在于微生物(诸如破囊壶菌或大肠杆菌)中的新的PUFA PKS构建体进行分离,并且将其用于对植物进行转化,以使所述植物具有相似的PUFA产生性质。对本发明包括的PUFA PKS系统进行的特定修饰详细记载在例如美国专利申请公开号20020194641、美国专利申请公开号20040235127和美国专利申请公开号20050100995中。 
遗传修饰的植物优选地在发酵培养基中培养,或在合适的介质(诸如土壤)中生长。以上已详细讨论了合适或有效的发酵培养基。适于高等植物的 生长介质包括适于植物的任何生长介质,包括但不限于土壤、沙子、支持根生长的任何其它特定介质(例如蛭石、珍珠岩等)或水培(hydroponic culture)及合适的光、水和对高等植物的生长进行优化的营养补剂。对本发明的遗传修饰的植物进行工程化,以通过所述PUFA PKS系统的活性来产生PUFA。可通过从所述植物提取化合物的纯化方法来回收所述PUFA。在优选的实施方案中,通过收集所述植物来回收所述PUFA。在特别优选的实施方案中,通过从所述植物(例如从含油种子)收集油来回收所述PUFA。所述植物也可按其天然状态被消耗,或进一步加工成消耗品(consumable product)。 
优选地,本发明的遗传修饰的植物产生一种或多种多不饱和脂肪酸,包括但不限于EPA(C20:5,n-3)、DHA(C22:6,n-3)、DPA(C22:5,n-6或n-3)、ARA(C20:4,n-6)、GLA(C18:3,n-6)、ALA(C18:3,n-3)和/或SDA(C18:4,n-3)),更优选地产生一种或多种长链脂肪酸(LCPUFA),包括但不限于EPA(C20:5,n-3)、DHA(C22:6,n-3)、DPA(C22:5,n-6或n-3)或DTA(C22:4,n-6)。在特别优选的实施方案中,本发明的遗传修饰的植物产生一种或多种多不饱和脂肪酸,包括但不限于EPA(C20:5,n-3)、DHA(C22:6,n-3)和/或DPA(C22:5,n-6或n-3)。 
因此,本发明的一个实施方案涉及植物,优选为含油种子植物,其中所述植物产生(例如就含油种子植物而言在其成熟的种子中或在含油种子植物的种子的油中)至少一种PUFA(靶标PUFA),并且其中积累PUFA的植物或植物部分中的全部脂肪酸分布(例如就含油种子植物而言在其成熟的种子中或在含油种子植物的种子的油中)包含可检测量的上述PUFA或多种PUFA。优选地,靶标PUFA为至少20个碳的PUFA,并且包含至少3个双键,更优选为至少4个双键,甚至更优选为至少5个双键。此外,靶标PUFA优选为所述植物(即没有进行遗传修饰的野生型植物或用作所述遗传修饰接受体的母体植物)不会天然产生的PUFA。优选地,积累PUFA的植物或植物部分(包括所述植物的种子油)中的全部脂肪酸分布按全部脂肪酸的重量计包含至少0.1%的靶标PUFA(或多种PUFA),更优选为至少约0.2%,更优选为至少约0.3%,更优选为至少约0.4%,更优选为至少约0.5%,更优选为至少约1%,更优选为至少约1.5%,更优选为至少约2%,更优选为至少约2.5%,更优选为至少约3%,更优选为至少约3.5%,更优选为至少约4%,更优选为至少约4.5%,更优选为至少约5%,更优选为至少约5.5%,更优 选为至少约10%,更优选为至少约15%,更优选为至少约20%,更优选为至少约25%,更优选为至少约30%,更优选为至少约35%,更优选为至少约40%,更优选为至少约45%,更优选为至少约50%,更优选为至少约55%,更优选为至少约60%,更优选为至少约65%,更优选为至少约70%,更优选为至少约75%,并且按所述植物产生的全部脂肪酸的重量计更优选地包含多于75%的至少一种多不饱和脂肪酸(靶标PUFA或多种PUFA),或包含0.1%至75%中任何百分比或大于75%(高至100%或约100%)且增量为0.1%中任何百分比的靶标PUFA(或多种PUFA)。除非另有说明,本申请一般使用的PUFA产生百分量是按所述生物体(植物)产生的全部脂肪酸的重量计(例如在一些情况下重量百分比是相对于酶复合物(诸如PUFA PKS系统)产生的全部脂肪酸)。在一个实施方案中,通过对脂肪酸甲酯(FAME)制品进行气相色谱(GC)分析来确定植物产生的全部脂肪酸,此时将植物产生的全部脂肪酸表示成重量百分比,但全部脂肪酸的确定方法不限于上述方法。 
如上所述,上述植物(和/或植物部分或种子油部分)产生的全部脂肪酸的额外特征是,除产生靶标PUFA(或多种PUFA)的酶复合物所产生的靶标PUFA(或多种PUFA)外,所述植物产生的这些全部脂肪酸包含少于(或含有不多于)约10%重量的任何脂肪酸。优选地,除靶标PUFA(或多种PUFA)外,产生靶标PUFA(或多种PUFA)的酶复合物所产生的任何脂肪酸(例如当用产生靶标PUFA(或多种PUFA)的酶或酶复合物对所述植物进行遗传修饰时)按所述植物产生的全部脂肪酸的重量计少于约9%,更优选地少于约8%,更优选地少于约7%,更优选地少于约6%,更优选地少于约5%,更优选地少于约4%,更优选地少于约3%,更优选地少于约2%,并且更优选地少于约1%。 
在另一个实施方案中,除靶标PUFA(或多种PUFA)外,产生靶标PUFA(或多种PUFA)的酶复合物所产生的任何脂肪酸按在所述植物中产生靶标PUFA(或多种PUFA)的酶复合物所产生的全部脂肪酸的重量计(即这种测量方法限于产生靶标PUFA的酶复合物所产生的那些全部脂肪酸)少于(或不多于)约10%,更优选地少于约9%,更优选地少于约8%,更优选地少于约7%,更优选地少于约6%,更优选地少于约5%,更优选地少于约4%,更优选地少于约3%,更优选地少于约2%,更优选地少于约1%,并且更优选地少于约0.5%。
在本发明的这个实施方案的另一个方面,除靶标PUFA(或多种PUFA)或存在于野生型植物(没有进行遗传修饰)或用作所述遗传修饰接受体的母体植物中的PUFA外,所述植物(和/或植物部分或种子油部分)产生的全部脂肪酸按所述植物产生的全部脂肪酸的重量计含有少于(或含有不多于)10%的具有18个或更多个碳的PUFA。在其它方面,除靶标PUFA(或多种PUFA)或存在于野生型植物(没有进行遗传修饰)或用作所述遗传修饰接受体的母体植物中的PUFA外,所述植物(和/或植物部分或种子油部分)产生的全部脂肪酸按所述植物产生的全部脂肪酸的重量计含有少于9%的具有18个或更多个碳的PUFA,或含有少于8%的具有18个或更多个碳的PUFA,或含有少于7%的具有18个或更多个碳的PUFA,或含有少于6%的具有18个或更多个碳的PUFA,或含有少于5%的具有18个或更多个碳的PUFA,或含有少于4%的具有18个或更多个碳的PUFA,或含有少于3%的具有18个或更多个碳的PUFA,或含有少于2%的具有18个或更多个碳的PUFA,或含有少于1%的具有18个或更多个碳的PUFA。 
在本发明的这个实施方案的另一个方面,除靶标PUFA(或多种PUFA)或存在于野生型植物(没有进行遗传修饰)或用作所述遗传修饰接受体的母体植物中的PUFA外,所述植物(和/或植物部分或种子油部分)产生的全部脂肪酸按所述植物产生的全部脂肪酸的重量计含有少于(或含有不多于)10%的具有20个或更多个碳的PUFA。在其它方面,除靶标PUFA(或多种PUFA)或存在于野生型植物(没有进行遗传修饰)或用作所述遗传修饰接受体的母体植物中的PUFA外,所述植物(和/或植物部分或种子油部分)产生的全部脂肪酸按所述植物产生的全部脂肪酸的重量计含有少于9%的具有20个或更多个碳的PUFA,或含有少于8%的具有20个或更多个碳的PUFA,或含有少于7%的具有20个或更多个碳的PUFA,或含有少于6%的具有20个或更多个碳的PUFA,或含有少于5%的具有20个或更多个碳的PUFA,或含有少于4%的具有20个或更多个碳的PUFA,或含有少于3%的具有20个或更多个碳的PUFA,或含有少于2%的具有20个或更多个碳的PUFA,或含有少于1%的具有20个或更多个碳的PUFA。 
在一个实施方案中,所述植物(和/或植物部分或种子油部分)中的全部脂肪酸按所述植物产生的全部脂肪酸的重量计含有少于约10%、更优选地少于约9%、更优选地少于约8%、更优选地少于约7%、更优选地少于约 6%、更优选地少于约5%、更优选地少于约4%、更优选地少于约3%、更优选地少于约2%并且更优选地少于约1%的选自以下的任何一种或多种的脂肪酸:γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(STA或SDA;18:4,n-3)、双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)、花生四烯酸(ARA,C20:4,n-6)、二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸诸如20:0、20:1(Δ5)、20:1(Δ11)、20:2(Δ8,11)、20:2(Δ11,14)、20:3(Δ5,11,14)、20:3(Δ11,14,17)、蜂蜜酸(20:3;Δ5,8,11)或20:4(Δ5,1,14,17)。 
在另一个实施方案中,在所述植物中产生长链PUFA的酶系统所产生的脂肪酸按所述植物产生的全部脂肪酸的百分比计含有少于约10%重量的选自以下的脂肪酸:γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(STA或SDA;18:4,n-3)、双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)、花生四烯酸(ARA,C20:4,n-6)、二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸诸如20:0、20:1(Δ5)、20:1(Δ11)、20:2(Δ8,11)、20:2(Δ11,14)、20:3(Δ5,11,14)、20:3(Δ11,14,17)、蜂蜜酸(20:3;Δ5,8,11)或20:4(Δ5,1,14,17),更优选地含有少于约9%、更优选地含有少于约8%、更优选地含有少于约7%、更优选地含有少于约6%、更优选地含有少于约5%、更优选地含有少于约4%、更优选地含有少于约3%、更优选地含有少于约2%并且更优选地含有少于约1%的选自以下的脂肪酸:γ-亚麻酸(GLA;18:3,n-6)、十八碳四烯酸(STA或SDA;18:4,n-3)、双高-γ-亚麻酸(DGLA或HGLA;20:3,n-6)、花生四烯酸(ARA,C20:4,n-6)、二十碳三烯酸(ETA;20:3,n-9)和各种其它脂肪酸诸如20:0、20:1(Δ5)、20:1(Δ11)、20:2(Δ8,11)、20:2(Δ11,14)、20:3(Δ5,11,14)、20:3(Δ11,14,17)、蜂蜜酸(20:3;Δ5,8,11)或20:4(Δ5,1,14,17)。 
在另一个实施方案中,在所述植物中产生长链PUFA的酶系统所产生的脂肪酸按所述植物产生的全部脂肪酸的百分比计含有少于约10%重量的以下PUFA中的全部:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA,更优选地含有少于约9%、更优选地含有少于约8%、更优选地含有少于约7%、更优选地含有少于约6%、更优选地含有少于约5%、更优选地含有少于约4%、更优选地含有少于约3%、更优选地含有少于约2%并且更优选地含有少于约1%的以下PUFA中的全部:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和 三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA。 
在另一个实施方案中,在所述植物中产生长链PUFA的酶系统所产生的脂肪酸按所述植物产生的全部脂肪酸的百分比计含有少于约10%重量的以下PUFA中的每种:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA,更优选地含有少于约9%、更优选地含有少于约8%、更优选地含有少于约7%、更优选地含有少于约6%、更优选地含有少于约5%、更优选地含有少于约4%、更优选地含有少于约3%、更优选地含有少于约2%并且更优选地含有少于约1%的以下PUFA中的每种:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA。 
在另一个实施方案中,在所述植物中产生长链PUFA的酶系统所产生的脂肪酸按所述植物产生的全部脂肪酸的百分比计含有少于约10%重量的以下PUFA中的任何一种或多种:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA,更优选地含有少于约9%、更优选地含有少于约8%、更优选地含有少于约7%、更优选地含有少于约6%、更优选地含有少于约5%、更优选地含有少于约4%、更优选地含有少于约3%、更优选地含有少于约2%并且更优选地含有少于约1%的以下PUFA中的任何一种或多种:γ-亚麻酸(GLA;18:3,n-6)、具有18个碳和四个碳-碳双键的PUFA、具有20个碳和三个碳-碳双键的PUFA和具有22个碳和两个或三个碳-碳双键的PUFA。 
在本发明的这个实施方案的一个方面,所述植物产生至少两种靶标PUFA,并且积累PUFA的植物或植物部分(包括来自含油种子的油)中的全部脂肪酸分布包含可检测量的这些PUFA。在这个实施方案中,所述PUFA各自优选为至少20个碳的PUFA,并且包含至少3个双键,更优选地包含至少4个双键,甚至更优选地包含至少5个双键。上述PUFA最优选地选自DHA、DPA n-6和EPA。在一个方面,所述植物产生DHA和DPA n-6,并且DHA与DPA n-6的比例为约1:10至约10:1,包括之间的任何比例。在一个实施方案中,DHA与DPA的比例为约1:1至约3:1,并且在另一个实施方案中为约2.5:1。在一个实施方案中,所述植物产生DHA和EPA。
在本发明的这个实施方案的另一个方面,所述植物产生用图3表示的全部脂肪酸分布。 
本发明还包括本申请所述植物产生的任何种子及本申请所述植物或种子产生的任何油。本发明也包括使用本申请描述的植物、种子或油而得到的任何产物。 
优选地,具有任何上述特征的植物是已遗传修饰为表达本申详细请描述的PUFA PKS系统(PUFA合成酶)的植物(即所述PUFA PKS系统是在所述植物中产生靶标PUFA(或多种PUFA)的酶系统)。在一个实施方案中,所述植物已遗传修饰为表达由来自破囊壶菌的PUFA PKS蛋白/结构域组成的PUFA PKS系统,所述破囊壶菌包括但不限于裂殖壶菌属、破囊壶菌属、Ulkenia属、Japonochytrium属、Aplanochytrium属、Althornia属或Elina属。在一个实施方案中,所述植物已遗传修饰为表达由来自labrynthulid的PUFAPKS蛋白/结构域组成的PUFA PKS系统。在另一个实施方案中,所述植物已遗传修饰为表达由来自海洋细菌的PUFA PKS蛋白/结构域组成的PUFAPKS系统,所述海洋细菌包括但不限于Shewanella japonica或Shewanellaolleyana。在一个实施方案中,所述植物已遗传修饰为表达由以下蛋白质/结构域组成的PUFA PKS系统:以上描述的裂殖壶菌属OrfA、B和C(包括其同源物或合成版本)及PPTase(例如HetI)(例如参见SEQ ID NO:1-32和SEQID NO:33及以上对裂殖壶菌属PUFAPKS系统的讨论)。在另一个实施方案中,所述植物已遗传修饰为表达由以下蛋白质/结构域组成的PUFA PKS系统:以上描述的破囊壶菌属Orf A、B和C(包括其同源物或合成版本)及PPTase(例如HetI)(例如参见SEQ ID NO:38-68和SEQ ID NO:33及以上对破囊壶菌属PUFA PKS系统的讨论,也参见美国专利申请公开号20050014231)。在另一个实施方案中,所述植物已遗传修饰为表达由以下蛋白质/结构域组成的PUFA PKS系统:其它破囊壶菌Orf A、B和C(包括其同源物或合成版本)及PPTase(例如HetI)(例如参见PCT专利公开号WO05/097982)。在另一个实施方案中,所述植物已遗传修饰为表达由以下蛋白质/结构域组成的PUFA PKS系统:以上描述的来自海洋细菌(诸如希瓦氏菌属)的PUFA PKS Orf(包括其同源物或合成版本)和PPTase(例如内源性希瓦氏菌属PPTase)(例如参见针对Shewanella japonica的SEQ ID NO:1-6和针对Shewanella olleyana的SEQ ID NO:7-12)。在另一个实施方案中,所述植物 已遗传修饰为表达来自上述PUFA PKS系统的结构域和蛋白质的任何组合(例如意想不到的PUFA PKS系统)。 
本发明还包括本申请所述植物产生的任何种子及本申请所述植物或种子产生的任何油。本发明也包括使用本申请描述的植物、种子或油而得到的任何产物。 
本发明的一个实施方案涉及对含有至少一种脂肪酸的产品进行调节的方法,其包括向所述产品添加根据本发明并且如本申请描述的那样进行遗传修饰的植物(例如已用PUFA PKS系统进行遗传修饰并且具有本申请所述脂肪酸分布的植物)所产生的植物、植物部分、种子或油。本发明也包括通过上述方法生产或通常含有本申请描述的任何植物、植物部分、种子或来自所述植物的油的任何产品。 
优选地,所述产品选自食物、饮食补品、药物制剂、人化动物乳和婴儿配方。合适的药物制剂包括但不限于抗炎配方、化疗剂、活性赋形剂、骨质疏松药、抗抑郁药、抗惊厥药、抗幽门螺旋菌(Heliobactor pylori)药、用于治疗神经变性疾病的药物、用于治疗变性肝疾病(degenerative liverdisease)的药物、抗生素和降胆固醇制剂。在一个实施方案中,所述产品用于治疗选自以下的病症:慢性炎症、急性炎症、胃肠道疾病、癌症、恶病质(cachexia)、心脏再狭窄(cardiac restenosis)、神经变性疾病、肝脏变性疾病、血脂疾病、骨质疏松、骨关节炎、自身免疫疾病、先兆子痫、早产、年龄相关黄斑病(age related maculopathy)、肺部疾病和过氧化物酶体病(peroxisomal disorder)。 
合适的食品包括但不限于精致烘焙的点心(fine bakery wares)、面包和蛋卷(roll)、早餐谷物(breakfast cereal)、加工和未加工的奶酪(processed andunprocessed cheese)、调味品(condiment)(番茄酱(ketchup)、蛋黄酱(mayonnaise)等)、乳制品(dairy product)(牛奶(milk)、酸奶(yogurt))、布丁(pudding)和明胶点心(gelatine dessert)、碳酸饮料(carbonated drink)、茶、粉末饮料混合料(powdered beverage mixe)、加工的鱼产品(processed fish product)、基于水果的饮料(fruit-based drink)、口香糖、硬的糖果(hard confectionery)、冷冻的乳制品(frozen dairy product)、加工的肉制品(processed meat product)、坚果和基于坚果的涂抹酱(nut-based spread)、面食制品(pasta)、加工的禽制品(processedpoultry product)、肉汁(gravy)和酱汁(sauce)、薯片(potato chip)和其它薄片 (chip)或脆片(crisp)、巧克力和其它糖果、汤和汤混合料(soup mix)、基于大豆的制品(soya based product)(牛奶、饮料、冰淇淋、咖啡伴侣(whitener))、基于植物油的涂抹酱(vegetable oil-based spread)和基于蔬菜的饮料(vegetable-based drink)。 
一般定义
根据本发明,术语“破囊壶菌”指破囊壶菌目的任何成员,其包括破囊壶菌科,并且术语“网粘菌(labyrinthulid)”指网粘菌目(Labyrinthulales)的任何成员,其包括网粘菌科(Labyrinthulaceae)。曾认为网粘菌科的成员为破囊壶菌目的成员,但在对上述生物体的分类学进行的最新修订中,现在认为所述科为网粘菌目的成员,并且认为网粘菌目和破囊壶菌目都是网粘菌门(Labyrinthulomycota)的成员。不断的发展使破囊壶菌和网粘菌的分类学频繁地修订。然而,分类学理论家现在通常将这些微生物与藻类或藻类样原生生物置于管毛生物界(Stramenopile lineage)中。破囊壶菌和网粘菌的当前分类学设置可概括如下: 
界:管毛生物界(Stramenopila)(Chromista) 
  门:网粘菌门(Labyrinthulomycota) 
    纲:网粘菌纲(Labyrinthulomycetes) 
      目:网粘菌目(Labyrinthulales) 
        科:网粘菌科(Labyrinthulaceae) 
      目:破囊壶菌目 
        科:破囊壶菌科 
然而,由于分类学的其它不确定因素,出于本发明的目的,最好认为本发明描述的菌株为包括以下生物体的破囊壶菌:目为破囊壶菌目,科为破囊壶菌科,属为破囊壶菌属(种为arudimentale、aureum、benthicola、globosum、kinnei、motivum、multirudimentale、pachydermum、proliferum、roseum、striatum)、Ulkenia属(种为amoeboidea、kerguelensis、minuta、profunda、radiata、sailens、sarkariana、schizochytrops、visurgensis、yorkensis)、裂殖壶菌属(种为aggregatum、limnaceum、mangrovei、minutum、octosporum)、Japonochytrium属(种为marinum)、Aplanochytrium属(种为haliotidis、kerguelensis、profunda、stocchinoi)、Althornia属(种为crouchii)或Elina属(种为marisalba、sinorifica)。应该注意的是,没有在评论杂志(peer-reviewed journal)中公开对Ulkenia属的原始描述,所以就上述属和设置在其中的种的正确性而言存在一些问题。出于本发明的目的,可认为在Ulkenia属中描述的种为破囊壶菌属的成员。 
本发明作为网粘菌描述的菌株包括以下生物体:目为网粘菌目,科为网粘菌科,属为网粘菌属(种为algeriensis、coenocystis、chattonii、macrocystis、macrocystis atlantica、macrocystis macrocystis、marina、minuta、roscoffensis、valkanovii、vitellina、vitellina pacifica、vitellina vitellina、zopfii)、Labyrinthuloides属(种为haliotidis、yorkensis)、Labyrinthomyxa属(种为marina)、Diplophrys属(种为archeri)、Pyrrhosorus属(种为marinus)、Sorodiplophrys属(种为stercorea)或Chlamydomyxa属(种为labyrinthuloides、montana)(虽然当前就Pyrrhosorus属、Sorodiplophrys属或Chlamydomyxa属的分类学设置而言没有达成共识)。 
根据本发明,分离的蛋白质或肽(诸如来自PUFA PKS系统的蛋白质或肽)为已从其天然环境分离出来(即已接受人工处理)的蛋白质或其片段(包括多肽或肽),并且可包括例如纯化的蛋白质、部分纯化的蛋白质、重组产生的蛋白质和合成产生的蛋白质。同样地,“分离的”不反映所述蛋白质已纯化的程度。优选地,以重组的方式得到本发明的分离的蛋白质。可按合成(例如化学方法诸如通过肽合成)或重组的方式得到分离的肽。 
根据本发明,术语“修饰”和“突变”可交换使用,特别是就对本申请所述蛋白质或肽的主要氨基酸序列(或核酸序列)进行修饰/突变而言。术语“修饰”也可用于描述对蛋白质或肽进行的翻译后修饰,包括但不限于甲基化、法尼基化(farnesylation)、羧甲基化、忙牛儿基忙牛儿基化(geranyl geranylation)、糖基化、磷酸化、乙酰化、肉豆蔻酰化(myristoylation)、异戊二烯基化(prenylation)、棕榈酸化(palmitation)和/或酰胺化。修饰也可包括例如使蛋白质或肽与另一种化合物复合。例如,如果所述修饰不同于对天然野生型蛋白质或肽进行的翻译后修饰,则可认为上述修饰为突变。 
本申请使用的术语“同源物”用于指以下蛋白质或肽,通过对天然蛋白质或肽进行一种或多种较小的修饰或突变而使所述蛋白质或肽不同于天然蛋白质或肽(即“原型”或“野生型”蛋白质),但所述蛋白质或肽保留了所述天然形式的全部基础蛋白质(basic protein)和侧链结构(即所述同源物因与野生型蛋白质相关而得以确认)。上述变化包括但不限于一个或几个氨基酸侧链 的变化、一个或几个氨基酸的变化(包括除去(例如所述蛋白质或肽的截短版本(truncated version))、插入和/或代替)、一个或几个原子的立体化学变化和/或较小的衍生化(包括但不限于甲基化、法尼基化、忙牛儿基忙牛儿基化、糖基化、羧甲基化、磷酸化、乙酰化、肉豆蔻酰化、异戊二烯基化、棕榈酸化和/或酰胺化)。与天然存在的蛋白质或肽相比,同源物可具有提高、降低或基本相似的性质。以下详细描述了PUFA PKS蛋白或结构域的优选同源物。应该注意的是,同源物可包括合成得到的同源物、给定蛋白质或其结构域的天然等位变异体或来自除参考序列所源于的生物体外的生物体的同源序列。 
保守性代替(conservative substitution)通常包括以下基团之间的代替:甘氨酸和丙氨酸;缬氨酸、异亮氨酸和亮氨酸;天冬氨酸、谷氨酸、天冬酰胺和谷氨酰胺;丝氨酸和苏氨酸;赖氨酸和精氨酸;及苯基丙氨酸和酪氨酸。也可基于保守的疏水性或亲水性(Kyte and Doolittle,J.Mol.Biol.157:105(1982))或基于呈现相似多肽二级结构的能力(the ability to assumesimilar polypeptide secondary structure)(Chou and Fasman,Adv.Enzymol.47:45(1978))来进行代替。 
同源物可能是天然等位变异的结果或天然突变的结果。编码蛋白质的核酸的天然等位变异体为以下基因,该基因在基因组中处于与编码上述蛋白质的基因基本相同的基因座(或多个基因座),但由于例如突变或重组引起的天然变异,所述基因具有相似但不相同的序列。与和等位变异体进行比较的基因所编码的蛋白质相比,等位变异体通常编码的蛋白质具有相似的活性。一类等位变异体可编码相同的蛋白质,但由于遗传密码的简并而具有不同的核酸序列。等位变异体也可在所述基因的5’或3’非翻译区域内(例如在调节控制区域(regulatory control region)内)包含变化。等位变异体对于本领域技术人员来说是众所周知的。 
可使用本领域已知的用于产生蛋白质的技术来得到同源物,所述技术包括但不限于对分离的天然存在的蛋白质进行直接的修饰、对蛋白质进行直接的合成或使用例如经典或重组DNA技术来引起随机或靶标诱变而对编码所述蛋白质的核酸序列进行修饰。 
与天然存在的(野生型)蛋白质相比,对蛋白质同源物进行的修饰或突变可提高、降低或基本不改变所述同源物的基本生物活性。通常,蛋白质的 生物活性或生物作用指根据体内(即在所述蛋白质的天然生理环境中)或体外(即在实验室条件下)测量或观察时将其归为天然形式蛋白质的蛋白质所显示或发挥的任何功能(或多种功能)。已在本申请的其它地方和所参考的专利和申请中详细描述了PUFA PKS系统的生物活性和构成PUFA PKS系统的各种蛋白质/结构域。与天然存在的蛋白质相比,诸如在同源物中,对蛋白质进行的修饰可得到具有相同的生物活性的蛋白质,或得到具有降低或提高的生物活性的蛋白质。可将使蛋白质表达减少或使蛋白质活性降低的修饰称为蛋白质的钝化(完全或部分)、下调或作用(或活性)降低。相似地,可将使蛋白质表达增加或使蛋白质活性提高的修饰称为蛋白质的扩增、过度产生、活化、增加、上调或作用(或活性)提高。应该注意的是,具有野生型蛋白质的生物活性的同源物通常不一定意味着所述同源物就具有与野生型蛋白质相同的生物活性,特别是就生物活性的水平而言。进一步,同源物可发挥与野生型蛋白质相同的生物活性,但与野生型蛋白质相比,活性处于降低或提高的水平。PUFA PKS系统的功能域为能发挥生物功能(即具有生物活性)的结构域(即结构域可以是蛋白质的部分)。 
检测或测量PUFA PKS蛋白或结构域生物活性的方法包括但不限于测量PUFA PKS基因的转录、测量PUFA PKS蛋白或结构域的翻译、测量PUFAPKS蛋白或结构域的翻译后修饰、测量PUFA PKS蛋白或结构域的酶活性和/或测量PUFA PKS系统的一种或多种产物的产生(例如PUFA的产生)。应该注意的是,本发明的分离的蛋白质(包括同源物)不一定必需具有野生型蛋白质的生物活性。例如,PUFA PKS蛋白或结构域可以是截短、突变或无活性的蛋白质。上述蛋白质可例如用于筛选测定或用于其它目的诸如抗体的产生。在优选的实施方案中,本发明的分离的蛋白质具有与野生型蛋白质相似的生物活性(虽然如上所述不一定相等)。 
测量蛋白质表达水平的方法通常包括但不限于Western印迹、免疫印迹、酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、免疫沉淀、表面等离振子共振(surface plasmon resonance)、化学发光、荧光极化(fluorescentpolarization)、磷光、免疫组织化学分析、基质辅助激光解吸(matrix-assistedlaser desorption)/电离飞行时间(ionization time-of-flight)(MALDI-TOF)质谱、微细胞计量术(microcytometry)、微阵列(microarray)、显微术(microscopy)、荧光激活细胞分类术(fluorescence activated cell sorting,FACS)和流式细胞计 量术(flow cytometry)及基于蛋白质性质(包括但不限于酶活性或与其它蛋白质配体(partner)的相互作用)的测定。结合测定在本领域中也是众所周知的。例如,BIAcore机器可用于确定两种蛋白质的复合物的结合常数。当缓冲液经过芯片时,可通过监测折光率随时间的变化来确定所述复合物的解离常数(O’Shannessy et al.Anal.Biochem.212:457(1993)和Schuster et al.,Nature365:343(1993))。对一种蛋白质与另一种蛋白质的结合进行测量的其它合适的测定方法包括例如免疫测定诸如酶联免疫吸附测定(ELISA)和放射免疫测定(RIA),或通过荧光、UV吸收、圆二色性或核磁共振(NMR)来监测蛋白质的波谱性质或光学性质的变化,以对结合进行确定。 
根据本发明,就本申请描述的核酸或氨基酸序列而言,术语“连续的”或“相邻的”的意思是连接在未断开的序列中。例如,第一序列包含第二序列的30个连续的(或相邻的)氨基酸,其意思是第一序列包括由30个氨基酸残基组成的未断开的序列,所述未断开的序列与由第二序列中的30个氨基酸残基组成的未断开的序列100%相同。相似地,第一序列与第二序列“100%相同”,其意思是第一序列严密地匹配于第二序列,而在核苷酸或氨基酸之间没有任何间隙。 
典型地,参考蛋白的同源物具有的氨基酸序列与参考蛋白的氨基酸序列(例如与作为PUFA PKS系统的部分的蛋白质或与上述蛋白质含有的结构域)至少约50%相同,更优选地至少约55%相同,更优选地至少约60%相同,更优选地至少约65%相同,更优选地至少约70%相同,更优选地至少约75%相同,更优选地至少约80%相同,更优选地至少约85%相同,更优选地至少约90%相同,更优选地至少约95%相同,更优选地至少约96%相同,更优选地至少约97%相同,更优选地至少约98%相同,并且更优选地至少约99%相同(或60%和99%之间的任何百分比且增量为整数百分比)。所述同源物优选地具有其所源于或相关的蛋白质或结构域(即具有参考氨基酸序列的蛋白质或结构域)的生物活性。本发明明确地包括本申请描述的任何PUFAPKS蛋白的同源物。 
除非另有说明,本申请使用的百分比(%)相同指使用以下方法进行的同源性评价:(1)BLAST 2.0 Basic BLAST同源性搜索,其使用BLASTP用于搜索氨基酸,使用BLASTN用于搜索核酸,并且使用BLASTX用于搜索核酸和搜索在所有6个可读框中翻译的氨基酸,所有搜索的参数都是标准默 认参数,其中通过默认参数来对待测序列(query sequence)进行过滤,以降低区域复杂性(记载在Altschul,S.F.,Madden,T.L.,
Figure G2007800178479D0058114300QIETU
 A.A.,Zhang,J.,Zhang,Z.,Miller,W.& Lipman,D.J.(1997)“Gapped BLAST and PSI-BLAST:anew generation of protein database search programs.”Nucleic Acids Res.25:3389中,在此将其完整引入作为参考);(2)BLAST 2校正(使用下述参数);(3)和/或PSI-BLAST,其参数为标准默认参数(Position-Specific IteratedBLAST)。应该注意的是,由于BLAST 2.0 Basic BLAST和BLAST 2的标准参数存在一些差异,所以使用BLAST 2程序可能将两种具体的序列识别成具有显著的同源性,而BLAST 2.0 Basic BLAST使用所述序列之一作为待侧序列来进行的搜索可能确定另一种序列没有完全匹配。另外,PSI-BLAST提供了自动的易于使用的“分布”搜索版本,其就搜索序列同源物而言是灵敏的方法。所述程序首先进行Gapped BLAST数据库搜索。PSI-BLAST程序使用来自所返回的任何显著校正结果的信息,以构建位置特异性评分矩阵(position-specific score matrix),所述位置特异性评分矩阵代替所述待测序列,用于下一轮数据库搜索。因此,应该理解的是,可通过上述程序中的任何一种来确定百分比相同性。 
可使用记载在Tatusova and Madden,“Blast 2 sequences-a new tool forcomparing protein and nucleotide sequences”,FEMS Microbiol Lett.174:247(1999)中的BLAST2序列来对两种具体的序列进行彼此校正,在此将所述文献完整引入作为参考。使用BLAST 2.0算法来在BLASTP或BLASTN中进行BLAST 2序列校正,以在所述两种序列之间进行GappedBLAST搜索(BLAST 2.0),其允许在所得到的校正结果中引入间隙(除去和插入)。出于使本申请清楚的目的,使用以下标准默认参数来进行BLAST 2序列校正。 
对于BLASTN,使用0 BLOSUM62矩阵: 
匹配加分=1 
匹配扣分=-2 
开放间隙(open gap)(5)和扩展间隙(extension gap)(2)扣分 
gap x_dropoff(50)expect(10)字号(word size)(11)过滤器(filter)(开(on))。 
对于BLASTP,使用0 BLOSUM62矩阵: 
开放间隙(11)和扩展间隙(1)扣分
gap x_dropoff(50)expect(10)字号(3)过滤器(开)。 
根据本发明,具有PUFA PKS系统中至少一个结构域的生物活性的氨基酸序列为具有本申请详细描述的PUFA PKS系统中至少一个结构域(例如KS结构域、AT结构域、CLF结构域等)的生物活性的氨基酸序列。因此,本发明可使用的分离的蛋白质可包括任何PUFA PKS可读框的翻译产物、任何PUFA PKS结构域、上述翻译产物或结构域的任何生物活性片段或天然PUFA PKS可读框的具有生物活性的产物或结构域的任何同源物。 
在本发明的一个方面,本发明包括的PUFA PKS蛋白或结构域(包括本申请描述的特定PUFA PKS蛋白或结构域的同源物)包含以下氨基酸序列,所述氨基酸序列包括参考PUFA PKS蛋白的氨基酸序列中的至少约100个保守氨基酸,其中所述同源物的氨基酸序列具有本申请描述的至少一种结构域或蛋白质的生物活性。在其它方面,所述蛋白质的氨基酸序列包含所述参考蛋白的任何氨基酸序列中的至少约200个保守氨基酸,更优选为至少约300个保守氨基酸,更优选为至少约400个保守氨基酸,更优选为至少约500个保守氨基酸,更优选为至少约600个保守氨基酸,更优选为至少约700个保守氨基酸,更优选为至少约800个保守氨基酸,更优选为至少约900个保守氨基酸,并且更优选为至少约1000个保守氨基酸。 
在本发明的优选实施方案中,本发明的分离的蛋白质或结构域包含记载在以下文献中的任何氨基酸序列或其任何生物活性同源物、片段或结构域,基本由记载在以下文献中的任何氨基酸序列或其任何生物活性同源物、片段或结构域组成,或由记载在以下文献中的任何氨基酸序列或其任何生物活性同源物、片段或结构域组成:美国专利号6,566,583、Metz et al.,Science293:290-293(2001)、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO2006/135866。 
在本发明的另一个实施方案中,具有本发明的PUFA PKS系统中至少一个结构域的生物活性的氨基酸序列包括以下氨基酸序列,所述氨基酸序列与本申请具体描述的天然PUFA PKS蛋白或多肽足够相似,并且编码所述氨基酸序列的核酸序列能在中度严格、高度严格或极高度严格的条件(以下描述)下与编码天然PUFA PKS蛋白或多肽的核酸分子进行杂交(即杂交成编码天然PUFA PKS蛋白或多肽的核酸链的互补体(complement))。优选地, 具有本发明的PUFA PKS系统中至少一个结构域的生物活性的氨基酸序列由以下核酸序列编码,所述核酸序列在中度严格、高度严格或极高度严格的条件下杂交成编码PUFA PKS蛋白或结构域的上述任何氨基酸序列的核酸序列的互补体。推论互补序列的方法对于本领域技术人员来说是已知的。应该注意的是,由于氨基酸测序和核酸测序技术还不是完全无错的,所以本申请给出的序列最多表示本发明的PUFA PKS结构域和蛋白质的表观序列。 
本申请使用的杂交条件指标准杂交条件,在所述标准杂交条件下,核酸分子用于确定相似的核酸分子。上述标准条件记载在例如Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Labs Press(1989)中。在此将上述Sambrook et al.完整引入作为参考(具体参见第9.31-9.62页)。另外,计算合适的杂交和洗涤条件以使杂交达到各种核苷酸错配程度的方程式记载在例如Meinkoth et al.,Anal.Biochem.138,267(1984)和上述Meinkoth et al.中,在此将所述文献完整引入作为参考。 
更具体地,本申请使用的中度严格的杂交和洗涤条件指可分离到与在杂交反应中用作探针的核酸分子具有至少约70%核酸序列相同的核酸分子的条件(即令核苷酸错配为约30%或更少的条件)。本申请使用的高度严格的杂交和洗涤条件指可分离到与在杂交反应中用作探针的核酸分子具有至少约80%核酸序列相同的核酸分子的条件(即令核苷酸错配为约20%或更少的条件)。本申请使用的极高度严格的杂交和洗涤条件指可分离到与在杂交反应中用作探针的核酸分子具有至少约90%核酸序列相同的核酸分子的条件(即令核苷酸错配为约10%或更少的条件)。如上所述,本领域技术人员可使用上述Meinkoth et al.中的方程式来计算合适的杂交和洗涤条件,以实现这些特定的核苷酸错配水平。上述条件的变化可取决于是否形成DNA:RNA或DNA:DNA杂交体(hybrid)。DNA:DNA杂交体的解链温度(meltingtemperature)计算值比DNA:RNA杂交体低10℃。在特定的实施方案中,用于DNA:DNA杂交体的严格杂交条件包括在离子强度为6×SSC(0.9M Na+)并且温度为约20℃至约35℃(较低严格)更优选为约28℃至约40℃(较高严格)甚至更优选为约35℃至约45℃(甚至更高严格)及合适的洗涤条件下进行杂交。在特定的实施方案中,用于DNA:RNA杂交体的严格杂交条件包括在离子强度为6×SSC(0.9M Na+)并且温度为约30℃至约45℃更优选为约 38℃至约50℃甚至更优选为约45℃至约55℃及相似严格的洗涤条件下进行杂交。这些值是基于对核苷酸多于约100个、甲酰胺为0%并且G+C含量为约40%的分子的解链温度进行计算的。可替换地,可凭经验来计算Tm(解链温度),这记载在上述Sambrook et al.的第9.31至9.62页。通常,洗涤条件应该尽可能地严格,并且应该适于所选择的杂交条件。例如,杂交条件可包括对盐和温度条件进行组合,其中所述温度为约20-25℃,其低于特定杂交体的Tm计算值,并且洗涤条件通常包括对盐和温度条件进行组合,其中所述温度为约12-20℃,其低于特定杂交体的Tm计算值。适于与DNA:DNA杂交体一起使用的杂交条件的一个实例包括在离子强度为6×SSC(50%甲酰胺)并且温度为约42℃的条件下进行2-24小时杂交,接下来进行洗涤步骤,其包括在温度为室温并且离子强度为约2×SSC的条件下洗涤一次或多次,接下来再在温度较高和离子强度较低的条件下进行洗涤(例如在温度为约37℃并且离子强度为约0.1×-0.5×SSC的条件下洗涤至少一次,接下来在温度为约68℃并且离子强度为约0.1×-0.5×SSC的条件下洗涤至少一次)。 
本发明也包括以下融合蛋白,所述融合蛋白包括与一种或多种融合片段相连的任何PUFA PKS蛋白或结构域或其任何同源物或片段。适于与本发明一起使用的融合片段包括但不限于以下片段,所述片段可提高蛋白质的稳定性,提供其它想要的生物活性,和/或有助于蛋白质的纯化(例如通过亲和色谱)。合适的融合片段可以是任何大小的具有所期望功能的结构域,所述功能例如为提高蛋白质的稳定性、溶解度及生物活性和/或简化蛋白质的纯化。融合片段可与所述蛋白质的氨基端和/或羧基端相连,并且可容易地发生裂解,以便能直接回收想要的蛋白质。优选地,融合核酸分子对包括如上所述与本发明的蛋白质的羧基端和/或氨基端相连的融合片段的蛋白质进行编码,重组细胞用所述融合核酸分子进行转染,对所述重组细胞进行培养,由此得到融合蛋白。 
在本发明的一个实施方案中,可得到任何上述PUFA PKS氨基酸序列及上述序列的同源物,其中,至少一个并且至多约20个额外的异源氨基酸处于给定氨基酸序列的C末端和/或N末端的侧翼。可将所得到的蛋白质或多肽称为“基本由给定的氨基酸序列组成”。根据本发明,所述异源的氨基酸为以下氨基酸序列,在天然条件下在给定氨基酸序列的侧翼没有发现(即在 天然或体内的情况下没有发现)所述氨基酸序列即异源的氨基酸,或如果针对给定氨基酸序列所源于的生物体使用标准密码子选择来对天然序列中的核苷酸进行翻译,则所述氨基酸序列即异源的氨基酸不是由位于编码给定氨基酸序列的天然核酸序列(当其存在于基因中时)的侧翼的上述核苷酸编码。相似地,当与本申请的核酸序列一起使用时,短语“基本由...组成”指编码给定氨基酸序列的以下核酸序列,在所述核酸序列的侧翼可以是至少一个并且至多约60个额外的异源核苷酸,其位于编码给定氨基酸序列的核酸序列的5’端和/或3’端。在天然条件下在编码给定氨基酸序列的核酸序列(当其存在于天然基因中时)的侧翼没有发现(即在天然或体内的情况下没有发现)所述异源的核苷酸。 
在一个方面,本发明的蛋白质或结构域和/或其同源物或片段的最小尺寸为足以产生所需生物活性的尺寸、就产生抗体而言足以作为抗原的尺寸或在体外测定中足以作为靶标的尺寸。在一个实施方案中,本发明的蛋白质的长度为至少约8个氨基酸(例如适于抗体表位(antibody epitope)或在测定中作为可检测的肽)、至少约25个氨基酸、至少约50个氨基酸、至少约100个氨基酸、至少约150个氨基酸、至少约200个氨基酸、至少约250个氨基酸、至少约300个氨基酸、至少约350个氨基酸、至少约400个氨基酸、至少约450个氨基酸、至少约500个氨基酸,依此类推,即8个氨基酸至本发明蛋白质或结构域全长之间的任何长度或更长的长度,其为整数个氨基酸(例如8个、9个、10个...25个、26个...500个、501个...)。除实际的限制外,对上述蛋白质的最大尺寸没有任何限制,因为所述蛋白质可包括PUFA PKS蛋白、结构域或其生物活性或可用片段的部分或全长PUFA PKS蛋白或结构域加上额外的序列(例如融合蛋白序列)(如果需要)。 
本发明的另一个实施方案涉及包含以下两类核酸序列、基本由以下两类核酸序列组成或由以下核酸序列组成的分离的核酸分子,所述核酸序列编码本申请描述的任何PUFA PKS蛋白或结构域(包括任何上述蛋白质或结构域的同源物或片段),及与上述核酸序列完全互补的核酸序列。根据本发明,分离的核酸分子为已从其天然环境分离出来(即已接受人工处理)的核酸分子,其天然环境为在天然条件下发现所述核酸分子处于其中的基因组或染色体。同样地,“分离的”不一定反映所述核酸分子已纯化的程度,但表示所述分子不包括在天然条件下发现所述核酸分子处于其中的完整基因组或 完整染色体。分离的核酸分子可包括基因。包括基因的分离的核酸分子不是包括上述基因的染色体片段,但包括基因的分离的核酸分子包括与所述基因相关的编码区域和调节区域,但不包括在天然条件下在同一染色体上发现的任何其它基因,而编码本申请所述PUFA PKS系统的其它蛋白质的其它基因除外。分离的核酸分子也可包括特定的核酸序列,在其侧翼(即在所述序列的5’端和/或3’端)为额外的核酸,所述额外的核酸在天然条件下没有位于所述特定核酸序列的侧翼(即异源的序列)。分离的核酸分子可包括DNA、RNA(例如mRNA)或DNA或RNA的衍生物(例如cDNA)。虽然短语“核酸分子”主要指物理意义上的核酸分子,而短语“核酸序列”主要指所述核酸分子上的核苷酸序列,但这两个短语可交换使用,尤其是就核酸分子或核酸序列能编码蛋白质或蛋白质的结构域而言。 
优选地,使用重组DNA技术(例如聚合酶链反应(PCR)扩增或克隆)或化学合成来得到本发明的分离的核酸分子。分离的核酸分子包括天然的核酸分子及其同源物,包括但不限于天然的等位变异体和修饰的核酸分子,其中已对核苷酸进行插入、除去、代替和/或倒置(invert),从而使上述修饰对本申请描述的PUFA PKS系统生物活性产生想要的影响。以上已详细讨论了蛋白质同源物(例如核酸同源物编码的蛋白质)。 
可使用本领域技术人员已知的多种方法来得到核酸分子同源物(参见例如Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Labs Press(1989))。例如,可使用各种技术来对核酸分子进行修饰,所述技术包括但不限于经典诱变技术和重组DNA技术诸如位点靶向诱变、对核酸分子进行化学处理以引起突变、对核酸片段进行限制性酶裂解、对核酸片段进行连接(ligation)、对核酸序列的所选区域进行PCR扩增和/或诱变、对寡核苷酸混合物进行合成和对混合物组进行连接以“构建”核酸分子的混合物及这些方法的组合。可通过针对核酸编码的蛋白质的功能进行筛选和/或通过与野生型基因进行杂交来从修饰的核酸的混合物中选择核酸分子同源物。 
本发明的核酸分子的最小尺寸为足以形成探针或寡核苷酸引发剂(primer)的尺寸,所述寡核苷酸引发剂能与本发明的核酸分子的互补序列形成稳定的杂交体(例如在中度严格、高度严格或极高度严格的条件下),或本发明的核酸分子的最小尺寸为足以编码以下氨基酸序列的尺寸,所述氨基 酸序列具有本发明的PUFA PKS系统中至少一个结构域的生物活性。同样地,编码上述蛋白质的核酸分子的尺寸可取决于所述核酸的组成及所述核酸分子和互补序列之间的百分比同源性或百分比相同性,及取决于杂交条件本身(例如温度、盐浓度和甲酰胺浓度)。当所述核酸分子富含GC时,用作寡核苷酸引发剂或探针的核酸分子的最小长度通常为至少约12个至约15个核苷酸,而当所述核酸分子富含AT时,所述最小长度为至少约15个至约18个碱基。除实际的限制外,对本发明的核酸分子的最大尺寸没有任何限制,即所述核酸分子可包括足以编码以下物质的序列:PUFA PKS系统的结构域的生物活性片段、PUFA PKS系统的完整的结构域、PUFA PKS系统的可读框(Orf)中的几种结构域、PUFA PKS系统的完整的单结构域或多结构域蛋白质或PUFA PKS系统的一种以上的蛋白质。 
本发明的另一个实施方案包括以下重组核酸分子,所述重组核酸分子包含重组载体和编码以下蛋白质或肽的核酸序列,所述蛋白质或肽具有本申请描述的PUFA PKS蛋白中至少一个结构域(或其同源物或片段)的生物活性。以上详细描述了上述核酸序列。根据本发明,重组载体为工程化的(即人工产生的)核酸分子,其作为工具用于操纵所选择的核酸序列,或用于将上述核酸序列引入到宿主细胞中。因此,所述重组载体适于在以下情况下使用:诸如通过使所选择的核酸序列在宿主细胞中表达或将所选择的核酸序列递送到宿主细胞中以形成重组细胞而对所选择的核酸序列进行克隆、测序和/或其它操纵。上述载体通常含有以下异源的核酸序列,所述异源的核酸序列为在天然条件下在待克隆或待递送的核酸序列附近没有发现的核酸序列,虽然所述载体也可含有调节性核酸序列(例如启动子或非翻译区域),所述调节性核酸序列在天然条件下在本发明的核酸分子附近被发现,或可用于表达本发明的核酸分子(以下详细描述)。所述载体可以是RNA或DNA,可以是原核或真核的,并且通常为质粒。可将所述载体固定为染色体外元件(extrachromosomal element)(例如质粒),或可将其整合到重组生物体(例如微生物或植物)的染色体中。可使完整的载体保持在宿主细胞中的合适位置,或在某些条件下,可将质粒DNA除去而留下本发明的核酸分子。整合的核酸分子可受染色体启动子的控制,受本身或质粒启动子的控制,或受几种启动子组合的控制。可将所述核酸分子的一个或多个拷贝整合到所述染色体中。本发明的重组载体可含有至少一种可选择的标志(marker)。
在一个实施方案中,在本发明的重组核酸分子中使用的重组载体为表达载体。本申请使用的短语“表达载体”用于指适于产生所编码产物(例如重要蛋白质)的载体。在这个实施方案中,将编码待产生产物(例如PUFA PKS结构域或蛋白质)的核酸序列插入到所述重组载体中,以产生重组核酸分子。将编码待产生蛋白质的核酸序列插入到所述载体中,其方式使所述核酸序列与所述载体中的调节序列可操作地相连,所述调节序列使所述核酸序列能在所述重组宿主细胞中进行转录和翻译。 
在另一个实施方案中,在本发明的重组核酸分子中使用的重组载体为靶向载体。本申请使用的短语“靶向载体”指用于将特定的核酸分子递送到重组宿主细胞中的载体,其中所述核酸分子用于除去、钝化或代替所述宿主细胞或微生物中的内源性基因或基因部分(即用于靶向基因破坏或敲除技术)。在本领域中也可将上述载体称为“敲除”载体。在这个实施方案的一个方面,插入到所述载体中的部分载体,更典型地,插入到该载体中的核酸分子(即插入体(insert))具有以下核酸序列,所述核酸序列与所述宿主细胞中的靶标基因(即所靶向的待除去或待钝化的基因)的核酸序列具有同源性。将所述载体插入体的核酸序列设计成与所述靶标基因相关,从而使所述靶标基因和插入体可发生同源重组(homologous recombination),由此除去、钝化、削弱(即通过突变或除去至少部分内源性靶标基因)或代替内源性靶标基因。已描述了使用这类重组载体以例如用重组基因代替内源性裂殖壶菌属基因(参见例如美国专利申请公开号20050100995),并且用于对破囊壶菌进行遗传转化的一般技术详细记载在美国专利申请公开号20030166207(公开于2003年9月4日)中。用于植物的遗传转化技术在本领域中是众所周知的。在本发明的实施方案中,本申请描述的海洋细菌基因可单独用于对植物进行转化,或与破囊壶菌的PUFA PKS一起对植物进行转化,以提高和/或改变(调节或变化)上述植物的PUFA PKS产生能力。 
典型地,重组核酸分子包括本发明的至少一种核酸分子,其可操作地与一种或多种表达控制序列相连。本申请使用的短语“重组分子”或“重组核酸分子”主要指可操作地与表达控制序列相连的核酸分子或核酸序列,但当核酸分子为本申请描述的重组分子时,短语“重组分子”或“重组核酸分子”可与短语“核酸分子”互换使用。根据本发明,短语“可操作地相连”指使核酸分子与表达控制序列(例如转录控制序列和/或翻译控制序列)相连,其方式 使所述分子当转染(即转化、转导、转染、结合或传导)到宿主细胞中时可被表达。转录控制序列为对转录的起始、延长或终止进行控制的序列。特别重要的转录控制序列为对转录的起始进行控制的转录控制序列,诸如启动子、增强子、操纵子(operator)和阻抑子(repressor)序列。合适的转录控制序列包括可在所述重组核酸分子待导入其中的宿主细胞或生物体中发挥功能的任何转录控制序列。 
本发明的重组核酸分子也可含有额外的调节序列,诸如翻译调节序列、复制的起点(origin of replication)和与所述重组细胞相容的其它调节序列。在一个实施方案中,本发明的重组分子(包括整合到所述宿主细胞染色体中的那些重组分子)也含有分泌信号(secretory signal)(即信号片段核酸序列),以使表达的蛋白质能从产生所述蛋白质的细胞中分泌出来。合适的信号片段包括在天然条件下与待表达蛋白质相关的信号片段或能引起本发明蛋白质分泌的任何异源信号片段。在另一个实施方案中,本发明的重组分子包含前导序列,以将表达的蛋白质递送并且插入到宿主细胞的膜中。合适的前导序列包括在天然条件下与所述蛋白质相关的前导序列或能将所述蛋白质递送并且插入到细胞的膜中的任何异源前导序列。 
本发明的一种或多种重组分子可用于产生所编码的本发明的产物(例如PUFA PKS结构域、蛋白质或系统)。在一个实施方案中,通过在有效产生所述蛋白质的条件下对本申请描述的核酸分子进行表达来产生所编码的产物。产生所编码蛋白质的优选方法是通过用一种或多种重组分子对宿主细胞进行转染,以形成重组细胞。适于转染的宿主细胞包括但不限于可进行转染的任何细菌细胞、真菌(例如酵母)细胞、昆虫细胞、植物细胞或动物细胞。在本发明的一个实施方案中,优选的宿主细胞为植物宿主细胞。宿主细胞可以是未转染的细胞或已用至少一种其它重组核酸分子进行转染的细胞。 
根据本发明,术语“转染”用于指可将外源性核酸分子(即重组核酸分子)插入到细胞中的任何方法。当术语“转化”用于指将核酸分子导入到微生物细胞(诸如藻类、细菌和酵母)中或导入到植物细胞中时,术语“转化”可与术语“转染”互换使用。在微生物和植物系统中,术语“转化”用于描述由于微生物或植物得到外源性核酸而引起的遗传变化,并且基本与术语“转染”同义。然而,在动物细胞中,转化具有第二层意思,即其可例如指在培养中在细胞 发生癌化后细胞生长性质的变化。因此,为了避免混淆,就将外源性核酸导入到动物细胞中而言,优选地使用术语“转染”,并且本申请使用的术语“转染”通常包括对动物细胞进行的转染和对微生物细胞或植物细胞进行的转化,其保留了将外源性核酸导入到细胞中的意思。因此,转染技术包括但不限于转化、颗粒轰击(particle bombardment)、扩散、主动转运、超声处理、电穿孔、微注射、脂转染、吸附、感染和原生质体融合。 
本领域技术人员应该理解的是,重组DNA技术的使用可通过例如在宿主细胞中操纵核酸分子的多个拷贝来改进对转染核酸分子表达的控制,可提高对上述核酸分子进行转录的效率,提高对所得转录物进行翻译的效率,并且提高翻译后修饰的效率。另外,可对启动子序列进行遗传工程化,以与天然启动子相比提高表达水平。可用于对核酸分子的表达进行控制的重组技术包括但不限于将所述核酸分子整合到一种或多种宿主细胞染色体中、将载体稳定序列加至质粒、对转录控制信号(例如启动子、操纵子、增强子)进行代替或修饰、对翻译控制信号(例如核糖体结合位点、Shine-Dalgarno序列)进行代替或修饰、对核酸分子进行修饰以相应于宿主细胞的密码子选择和除去使转录物不稳定的序列。 
根据本发明,为了影响PUFA PKS系统的活性,诸如为了影响PUFA的产生分布,可对PUFA PKS系统或与PUFA PKS系统相互作用的基因进行任何遗传修饰,与没有进行遗传修饰的情况相比,所述任何遗传修饰可使生物体表达的PUFA PKS系统的任何生物活性出现任何可检测或可测量的变化或调节。根据本发明,短语“PUFA分布”、“PUFA表达分布”和“PUFA产生分布”可交换使用,并且用于描述生物体表达/产生的PUFA的整体分布。PUFA表达分布可包括生物体表达的PUFA的类型及所产生的PUFA的绝对量和/或相对量。因此,可将PUFA分布描述成生物体产生的PUFA彼此之间的比例、生物体产生的PUFA的类型和/或生物体产生的PUFA的绝对量和/或相对量。 
出于说明的目的,提供了以下实施例,但并非意在限制本发明的范围。 
实施例 
用于实施例的一般背景信息
有关裂殖壶菌属PUFA合成酶合成PUFA的生物化学信息。在先前的申请中已描述通过裂殖壶菌属和裂殖壶菌属样PUFA合成酶来合成PUFA的生 物化学途径。一些关键点为:碳来自丙二酰辅酶A(在启动反应(primingreaction)中可使用乙酰辅酶A),NAPDH用作还原剂,并且通过作为合成酶本身的活性的一部分,以游离脂肪酸的形式释放PUFA。在本申请中,本发明人显示了以下实施例,在所述实施例中,在酵母和拟南芥中对源于裂殖壶菌属的PUFA合成酶及来自念珠藻属的PPTase(HetI)进行表达。裂殖壶菌属PUFA合成酶的生物化学特征及有关酵母和高等植物生物化学的一般知识暗示,上述系统在酵母或植物细胞的细胞质及植物的质体中的表达可引起PUFA的积累,并且实际上已观察到所述现象。 
对合适的PPTase进行共表达。在先前的工作中,在大肠杆菌中对裂殖壶菌属PUFA合成酶及其它PUFA合成酶进行表达,所述先前的工作显示,内源性PPTases不能活化所述PUFA合成酶的ACP结构域。也显示的是,来自念珠藻属的PPTase即HetI可作为合适的异源PPTase来活化上述结构域,并且在表达HetI和所述合成酶的大肠杆菌细胞中可积累DHA和DPAn-6(裂殖壶菌属PUFA合成酶的主要产物)。本申请描述的工作显示,当在酵母或植物细胞的细胞质或质体中表达裂殖壶菌属PUFA合成酶时,能否在上述宿主中检测到DHA和DPA n-6取决于是否对HetI(或任何合适的PPTase)进行共表达。 
对裂殖壶菌属的PUFA合成酶Orf A和B进行修饰以在酵母中表达。 
如在美国专利申请公开号20040235127中指出的那样,天然形式的裂殖壶菌属Orf B基因在大肠杆菌中的表达可产生截短的蛋白质。在修饰的Orf中,已使含有15个相邻并且相同的丝氨酸密码子(TCT)的约190bp区域发生变化,以更好地模拟大肠杆菌中的密码子选择,对所述修饰的Orf进行表达,之后检测到了全长蛋白质产物。将上述修饰的Orf B序列称为Orf B*。初步实验表明,Orf A和Orf B*(SEQ ID NO:36)在酵母中的表达不能产生想要的蛋白质。因此,对所述Orf进行重合成,以更好地在酵母中表达。将重合成的Orf称为sOrf A(SEQ ID NO:35)和sOrf B(SEQ ID NO:36)。sOrf A和sOrf B编码的蛋白质分别具有与天然Orf A(SEQ ID NO:2)和天然Orf B(SEQ IDNO:4)所编码相同的氨基酸序列。针对构建体在其它异源生物体中的表达,相似的策略可用于对密码子选择进行优化。 
实施例1 
以下实施例显示了编码裂殖壶菌属PUFA合成酶的基因(sOrf A、sOrf B 和天然Orf C)及HetI在面包酵母(baker’s yeast)(酿酒酵母(Saccharomycescerevisiae))中的表达。 
使用得自Invitrogen的材料,在酵母中对裂殖壶菌属PUFA合成酶基因和HetI进行表达。酿酒酵母的INVscl菌株与以下转化载体一起使用:pYESLeu(sOrf A,SEQ ID NO:35)、pYES3/CT(sOrf B,SEQ ID NO:36)、pYES2/CT(OrfC,SEQ ID NO:5)和pYESHis(HetI,SEQ ID NO:33)。对一些载体进行修饰,以满足具体的克隆需要。基于特定的实验,使用合适的选择培养基。在各种情况下,将所述基因克隆在GAL1启动子后,并且按照Invitrogen提供的指导方针,通过将洗涤的细胞重新悬浮在含有半乳糖的培养基中来诱导表达。在转移到诱导培养基后,在30℃使细胞生长,然后在指示的时间进行收集(通过离心)。对细胞沉淀进行冷冻干燥,然后使用酸性方法来制备FAME,萃取到己烷中,然后通过GC(气相色谱)进行分析。 
图1显示了对表达裂殖壶菌属PUFA合成酶系统(sOrfA、sOrfB、OrfC和HetI)的酵母细胞的脂肪酸分布和对照细胞(缺乏sOrf A基因)的脂肪酸分布进行的比较。在诱导约20小时后,收集细胞。可观察到的是,在表达完整PUFA合成酶系统的菌株的分布中已出现两个新的FAME峰。通过与可信的标准品比较洗脱时间,随后通过MS分析,将这两个峰鉴定为DPA n-6和DHA。如本发明人对裂殖壶菌属PUFA合成酶进行的表征所预测的那样,在所述分布中,除DHA和DPA n-6外,没有任何其它新的峰。图2显示了图1GC色谱图中的区域,其含有所述PUFAFAME。对照细胞和表达PUFA合成酶的细胞都含有在DHA FAME附近洗脱的峰。已将其鉴定为C26:0FAME,并且(基于参考文献)其源于鞘脂。虽然它在DHA峰附近洗脱,但分辨率足以使它不干扰DHA的定量。在FAME分布中,DPA n-6峰与其它内源性酵母脂质良好地分离。在这个特定的实施例中,表达裂殖壶菌属PUFA合成酶系统的细胞积累2.4%DHA和2.0%DPA n-6(占总FAME的百分比)。DHA和DPA n-6的总量=在所述细胞中测量的脂肪酸的4.4%。在所述细胞中观察到的DHA与DPA n-6的比例为约1.2:1。 
以上给出的结果显示了裂殖壶菌属PUFA合成酶在酵母中的表达,所述结果确认了先前申请提出的途径,及确认了有关可在酵母和植物中出现的脂肪酸分布变化的预测。 
实施例2
以下实施例描述了编码裂殖壶菌属PUFA合成酶的基因(OrfA、Orf B*和Orf C)及HetI在拟南芥中的表达和在基本没有任何可检测的中间体或副产物的情况下靶标PUFA即DHA和DPA n-6的产生。 
将裂殖壶菌属Orf A(用SEQ ID NO:1表示的核苷酸序列)、Orf B*(用SEQ ID NO:37表示的核苷酸序列)和Orf C(用SEQ ID NO:5表示的核酸序列)及HetI(用SEQ ID NO:33表示的核苷酸序列)克隆(分别或以各种组合(包括全部4种基因在一个超级构建体(superconstruct)上))到合适的二元载体(binary vector)中,以将所述基因导入到植物中。以下及在实施例13中(用于4127的一种“超级构建体”)描述了上述构建体(三种表达构建体)和载体的实例。 
对5720进行构建:Orf B*(质体表达) 
在亚麻核丝(flax linin)启动子/终止子(美国专利号6,777,591)的控制下,将OrfB*(SEQ ID NO:37,编码SEQ ID NO:4)限制性地克隆到表达盒中。所述核丝启动子在种子发育期间控制转基因(或多种转基因)的时间特异性和组织特异性表达。直接位于裂殖壶菌属Orf B*上游和在裂殖壶菌属Orf B*框架内的是源于欧洲油菜酰基-ACP硫酯酶(PT-信号肽)的质体靶向序列,以使Orf B*靶向于质体。植物二元载体也含有现成的大肠杆菌磷酸甘露糖异构酶基因(Miles and Guest,1984,Gene32:41-48),其受在左右边缘序列之间的来自欧芹(Petroselinum crispum)的泛素启动子/终止子的驱动(Kawalleck etal.,1993,Plant Mol.Bio.,21:673-684),以进行正向选择(Haldrup et al.,1998,Plant Mol.Biol.37:287-296)。 
对4107进行构建:HetI和Orf C(质体表达) 
在亚麻核丝启动子/终止子(美国专利号6,777,591)的控制下,将裂殖壶菌属Orf C(用SEQ ID NO:5表示的核苷酸序列,编码SEQ ID NO:6)及HetI(用SEQ ID NO:33表示的核苷酸序列,编码SEQ ID NO:34)克隆到表达盒中。所述核丝启动子在种子发育期间控制转基因(或多种转基因)的时间特异性和组织特异性表达。直接位于裂殖壶菌属Orf C和HetI上游和在裂殖壶菌属Orf C和HetI框架内的是源于欧洲油菜酰基-ACP硫酯酶(PT-信号肽)的质体靶向序列,以使PUFA合成酶和PPTase靶向于质体。然后,将两种表达盒组装到一个植物二元载体中,所述植物二元载体含有使宿主植物耐受膦丝菌素(phosphinothricine)的pat基因(Wohlleben et al.,1988,Gene70:25-37), 所述pat基因受在左右边缘序列之间的来自欧芹的泛素启动子/终止子的驱动(Kawalleck et al.,1993,Plant Mol.Bio.,21:673-684)。 
对4757进行构建:OrfA(质体表达) 
在亚麻核丝启动子/终止子(美国专利号6,777,591)的控制下,将裂殖壶菌属Orf A(用SEQ ID NO:1表示的核苷酸序列,编码SEQ ID NO:2)克隆到表达盒中。所述核丝启动子在种子发育期间控制转基因(或多种转基因)的时间特异性和组织特异性表达。直接位于裂殖壶菌属OrfA上游和在裂殖壶菌属Orf A框架内的是源于欧洲油菜酰基-ACP硫酯酶(PT-信号肽)的质体靶向序列,以使PUFA合成酶和PP Tase靶向于质体。使所述表达盒包含在植物二元载体中,所述植物二元载体含有使宿主植物耐受卡那霉素的nptII基因,所述nptII基因受在左右边缘序列之间的MAS启动子/终止子的驱动。 
在一个实施例中,如上所述,将转基因克隆到以下三个不同的表达盒中:称为5720的构建体(含有编码SEQ ID NO:4的Orf B*)、称为4107的构建体(含有编码SEQ ID NO:6的Orf C和编码SEQ ID NO:34的HetI)和称为4757的构建体(含有编码SEQ ID NO:2的Orf A)。在每个构建体中对基因进行克隆。为了将所述蛋白质引导到质体,使对来自欧洲油菜酰基-ACP硫酯酶的质体靶向序列进行编码的额外5’序列直接位于Orf A、B*、C和HetI的上游。在框架内,将编码上述肽的核苷酸序列与各个PUFA合成酶Orf的起始甲硫氨酸密码子及HetI的工程化起始密码子(ATG)放置在一起。在其它构建体中(其中PUFA合成酶的定位靶向于植物细胞的细胞质),没有将任何编码额外蛋白质的序列置于所述Orf的5’端。 
使用标准方法来将所述基因导入到拟南芥中(将花浸到含有合适载体的土壤杆菌属菌株的混悬液中,这基本记载在Clough et al.,1998,Plant J.16:735-743中)。简要地,通过诊断用限制性酶切消化(restriction digest)和序列分析,确认了各种植物二元载体的完整性。然后,将分离的质粒通过电穿孔(25μF,2.5kV,200Ω)来对有能力的土壤杆菌属菌株EH101(Hood et al.,1986,J.Bacteriol.144:732-743)进行转化。将重组土壤杆菌属置于AB-大观霉素(spectinomycin)/卡那霉素(20×AB盐、2M葡萄糖、0.25mg/ml FeSO4·7H2O、1M MgSO4和1M CaCl2)上,并且单个菌落用于接种5mL AB-大观霉素/卡那霉素液体培养基。使这些培养物在28℃生长过夜。然后,通过花浸方法(Clough et al.,1998,Plant J.16:735-743),使用含有所述质粒的重组农杆菌 (Agrobacteria)来对野生型C24拟南芥植物进行转化。 
将得自这些植物的种子置于选择性培养基上。将鉴定为阳性的幼苗转移到土壤中,并且使之生长至成熟,此后对种子的PUFA含量进行分析。基于PUFA含量,使上述一些种子生长成下一代。对得自上述植物的汇集的种子的脂肪酸含量进行分析。源于这些转基因植物的靶标PUFA为二十二碳六烯酸(DHA)和二十二碳五烯酸(DPA n-6),它们是裂殖壶菌属PUFAPKS系统产生的主要PUFA,用于对植物进行转化的基因源于所述裂殖壶菌属PUFA PKS系统。 
图3显示了对一个示范性转基因植物谱系进行的一项示范性脂肪酸分析的结果。图3的上半部分显示了野生型拟南芥种子的典型脂肪酸分布,其通过对从汇集的种子样品制备的FAME进行GC分离和FID检测来表示。主要的脂肪酸为16:0、18:0、16:1、18:1、20:1、20:2和22:1。在来自野生型种子的样品中没有任何DHA或DPA n-6。 
图3的下半部分显示了来自以下一个示范性转基因拟南芥谱系(谱系263)的汇集的种子样品的脂肪酸分布,所述示范性转基因拟南芥谱系(谱系263)表达裂殖壶菌属PUFA合成酶基因和HetI基因,其中如上所述,所述裂殖壶菌属PUFA合成酶基因和HetI基因通过三个不同的表达盒(5720、4107和4757)来导入,并且所有所述表达盒都靶向于质体。就谱系263的脂肪酸分布而言,可容易地观察到,在转基因植物种子的分布中存在两个FAME峰,而在野生型种子的分布中不存在这两个峰。这两个峰的洗脱行为正好相应于可信的DHA和DPA n-6的洗脱行为(使用从裂殖壶菌属油制备的FAME作为标准品及使用从NuCheck Prep商购的DHA标准品)。在这个特定的实施例中,DHA峰占总FAME计算值的0.8%,而DPA n-6峰占1.7%。新PUFA的总和占总FAME的2.5%。 
针对其它转基因植物谱系进行的实验得到了相似的结果。例如,用与263谱系相同的构建体和方式进行转化的另一个转基因谱系(称为269)产生了占总FAME计算值约0.75%的DHA和占总FAME计算值1.41%的DPAn-6(数据没有显示)。 
而且,使用上述相同核酸分子得到的多种其它转基因拟南芥植物也产生了靶标PUFA,不论它们是否使用在不同构建体、组合构建体或单个超级构建体上提供PUFA PKS基因和HetI PPTase的构建体来得到。
另外,使PUFA PKS基因靶向于细胞溶胶的转基因植物都表达靶标PUFA(数据没有详细显示)。例如,借助上述三个不同表达盒(不具有质体靶向序列)来导入而在细胞溶胶中表达裂殖壶菌属PUFAPKS及HetI的植物谱系按占总FAME的百分比计产生了约0.45%DHA和约0.8%DPA。在另一个实施例中,借助单个超级构建体来导入而在细胞溶胶中表达裂殖壶菌属PUFA PKS及HetI的植物谱系按占总FAME的百分比计产生了约0.2-0.3%DHA和约0.5%DPA。 
在图3显示的种子脂肪酸分布中(并且在其它相似的转基因植物种子中)出现了DHA和DPA n-6,这表明当在植物细胞中表达时,导入的裂殖壶菌属PUFA合成酶系统发挥功能,并且可使所述蛋白质靶向于质体或细胞溶胶。当基于先前的生物化学数据和异源的表达数据(大肠杆菌和酵母中的异源表达数据)来进行预测时,在转基因植物种子的分布中检测到的新脂肪酸只有DHA和DPA n-6,这进一步表明就在植物中产生PUFA而言,本申请的PUFA PKS系统优于标准途径酶。 
本申请将以下专利、申请公开物和出版物完整引入作为参考:美国专利号6,566,583、Metz et al.,Science 293:290-293(2001)、美国专利申请公开号20020194641、美国专利申请公开号20040235127、美国专利申请公开号20050100995和PCT公开号WO 2006/135866。 
在此将美国临时申请号60/784,616和2006年3月15日提交的美国临时申请号60/783,205各自披露的全部内容引入作为参考。 
在此将本申请引用或讨论的每篇出版物完整引入作为参考。 
尽管已详细描述了本发明的各种实施方案,但显而易见的是,本领域技术人员可对上述实施方案进行修改和调整。然而,应该理解的是,上述修改和调整在权利要求书描述的本发明的范围内。

Claims (19)

1.一种培养植物或所述植物的种子的方法,其中所述植物或所述植物的种子被遗传修饰表达由SEQ ID NO:2、SEQ ID NO:4和SEQ ID NO:6组成的产生至少一种多不饱和脂肪酸的多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶,其中所述植物或所述植物的种子中的全部脂肪酸分布包含至少0.5%重量的至少一种由至少20个碳和4个或更多个碳-碳双键组成的多不饱和脂肪酸,并且其中所述植物或所述植物的种子中的全部脂肪酸分布就以下多不饱和脂肪酸的总量而言含有少于5%的以下所有多不饱和脂肪酸:γ-亚麻酸、具有18个碳和4个碳-碳双键的多不饱和脂肪酸、具有20个碳和3个碳-碳双键的多不饱和脂肪酸和具有22个碳和2个或3个碳-碳双键的多不饱和脂肪酸。
2.权利要求1的方法,其中所述植物或所述植物的种子中的全部脂肪酸分布就以下每种多不饱和脂肪酸而言含有少于1%的以下每种多不饱和脂肪酸:γ-亚麻酸、具有18个碳和4个碳-碳双键的多不饱和脂肪酸、具有20个碳和3个碳-碳双键的多不饱和脂肪酸和具有22个碳和2个或3个碳-碳双键的多不饱和脂肪酸。
3.一种培养植物或所述植物的种子的方法,其中所述植物或所述植物的种子被遗传修饰表达由SEQ ID NO:2、SEQ ID NO:4和SEQ ID NO:6组成的产生至少一种多不饱和脂肪酸的多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶,其中所述植物或所述植物的种子中的全部脂肪酸分布包含至少0.5%重量的至少一种由至少20个碳和4个或更多个碳-碳双键组成的多不饱和脂肪酸,并且其中所述植物或所述植物的种子中的全部脂肪酸分布含有的γ-亚麻酸和双高-γ-亚麻酸少于2%。
4.权利要求3的方法,其中所述植物或所述植物的种子中的全部脂肪酸分布含有的γ-亚麻酸和双高-γ-亚麻酸少于1%重量。
5.一种培养植物或所述植物的种子的方法,其中所述植物或所述植物的种子被遗传修饰表达由SEQ ID NO:2、SEQ ID NO:4和SEQ ID NO:6组成的产生至少一种多不饱和脂肪酸的多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶,其中所述植物或所述植物的种子中的全部脂肪酸分布包含至少0.5%重量的至少一种由至少20个碳和4个或更多个碳-碳双键组成的多不饱和脂肪酸,并且其中所述植物或所述植物的种子中的全部脂肪酸分布含有少于1%的γ-亚麻酸。
6.权利要求5的方法,其中所述植物或所述植物的种子中的全部脂肪酸分布含有少于0.5%重量的γ-亚麻酸。
7.权利要求1至6中任一项的方法,其中所述植物或所述植物的种子没有被遗传修饰来表达去饱和酶或延长酶。
8.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统包含:
a)至少一个烯酰ACP-还原酶结构域;
b)至少四个酰基载体蛋白结构域;
c)至少两个β-酮脂酰-ACP合成酶结构域;
d)至少一个酰基转移酶结构域;
e)至少一个β-酮脂酰-ACP还原酶结构域;
f)至少两个FabA样β-羟酰-ACP脱水酶结构域;
g)至少一个链长度因子结构域;和
h)至少一个丙二酰辅酶A:ACP酰基转移酶结构域。
9.权利要求8的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统包含:
a)两个烯酰ACP-还原酶结构域;
b)8个或9个酰基载体蛋白结构域;
c)两个β-酮脂酰-ACP合成酶结构域;
d)一个酰基转移酶结构域;
e)一个酮还原酶结构域;
f)两个FabA样β-羟酰-ACP脱水酶结构域;
g)一个链长度因子结构域;和
h)一个丙二酰辅酶A:ACP酰基转移酶结构域。
10.权利要求8的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统来自裂殖壶菌属。
11.权利要求8的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统来自破囊壶菌属。
12.权利要求8的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统来自选自以下的微生物:裂殖壶菌属种American Type Culture CollectionNo.20888和破囊壶菌属23B American Type Culture Collection No.20892。
13.权利要求8的方法,其中编码所述多不饱和脂肪酸聚酮化合物合成酶系统的核酸序列在严格的杂交条件下与对来自微生物的多不饱和脂肪酸聚酮化合物合成酶系统进行编码的基因发生杂交,所述微生物选自:裂殖壶菌属种American Type Culture Collection No.20888和破囊壶菌属23BAmerican Type Culture Collection No.20892。
14.权利要求1至6中任一项的方法,其中所述植物或所述植物的种子选自:油菜、大豆、油菜子、亚麻子、玉米、红花、向日葵和烟草。
15.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶可操作地与质体靶向序列相连。
16.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶并未可操作地与质体靶向序列相连。
17.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶表达于植物或植物种子的细胞的细胞溶胶中。
18.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶表达于植物或植物种子的细胞的质体中。
19.权利要求1至6中任一项的方法,其中所述多不饱和脂肪酸聚酮化合物合成酶系统和磷酸泛酰巯基乙氨基转移酶表达于植物或植物种子的细胞的细胞溶胶和质体中。
CN200780017847.9A 2006-03-15 2007-03-15 含有多不饱和脂肪酸的植物种子油 Expired - Fee Related CN101473038B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78320506P 2006-03-15 2006-03-15
US60/783,205 2006-03-15
US78461606P 2006-03-21 2006-03-21
US60/784,616 2006-03-21
PCT/US2007/064105 WO2007106904A2 (en) 2006-03-15 2007-03-15 Plant seed oils containing polyunsaturated fatty acids

Publications (2)

Publication Number Publication Date
CN101473038A CN101473038A (zh) 2009-07-01
CN101473038B true CN101473038B (zh) 2014-05-28

Family

ID=40829530

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200780017805.5A Expired - Fee Related CN101573451B (zh) 2006-03-15 2007-03-15 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法
CN200780017847.9A Expired - Fee Related CN101473038B (zh) 2006-03-15 2007-03-15 含有多不饱和脂肪酸的植物种子油

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200780017805.5A Expired - Fee Related CN101573451B (zh) 2006-03-15 2007-03-15 利用pufa聚酮化合物合成酶系统在异源的生物体中产生多不饱和脂肪酸的方法

Country Status (1)

Country Link
CN (2) CN101573451B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102695799A (zh) 2009-09-27 2012-09-26 Opx生物工艺学公司 用于制备3-羟基丙酸和其它产物的方法
GB2492256A (en) * 2010-01-27 2012-12-26 Opx Biotechnologies Inc Microorganism production of high-valve chemical products, and related compositions, methods and systems
CN104388439B (zh) * 2010-02-01 2018-02-23 三得利控股株式会社 编码酰基‑CoA合成酶同源物的多核苷酸及其用途
CN102191241B (zh) * 2010-03-05 2012-12-05 北京大学 产脂肪酸工程菌及其制备方法和应用
US11236351B2 (en) 2010-05-17 2022-02-01 Dow Agrosciences Llc Production of DHA and other LC PUFAs in plants
AU2012226528B2 (en) * 2011-03-07 2015-08-20 Dsm Nutritional Products Ag Engineering thraustochytrid microorganisms
TW201307553A (zh) 2011-07-26 2013-02-16 Dow Agrosciences Llc 在植物中生產二十二碳六烯酸(dha)及其他長鏈多元不飽和脂肪酸(lc-pufa)之技術
CN104718282A (zh) 2012-08-10 2015-06-17 Opx生物工艺学公司 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法
WO2014145096A1 (en) 2013-03-15 2014-09-18 Cindy Hoppe Flash evaporation for production purification and recovery
US20150057465A1 (en) 2013-03-15 2015-02-26 Opx Biotechnologies, Inc. Control of growth-induction-production phases
US11408013B2 (en) 2013-07-19 2022-08-09 Cargill, Incorporated Microorganisms and methods for the production of fatty acids and fatty acid derived products
BR112016001026A2 (pt) 2013-07-19 2017-10-24 Cargill Inc organismo geneticamente modificado
CN104513840B (zh) * 2013-09-30 2018-09-18 上海医药工业研究院 一种提高聚酮类化合物发酵产量的方法
EP2993228B1 (en) 2014-09-02 2019-10-09 Cargill, Incorporated Production of fatty acid esters
JP2020506702A (ja) 2017-02-02 2020-03-05 カーギル インコーポレイテッド C6−c10脂肪酸誘導体を生成する遺伝子組み換え細胞
CN112538481B (zh) * 2020-12-28 2022-05-20 浙江农林大学 一种利用基因编辑技术获得高油酸植株的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259865A (zh) * 1997-03-27 2000-07-12 布里斯托尔-迈尔斯斯奎布公司 二十二碳六烯酸和花生四烯酸促进不足月婴儿生长的用途

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259865A (zh) * 1997-03-27 2000-07-12 布里斯托尔-迈尔斯斯奎布公司 二十二碳六烯酸和花生四烯酸促进不足月婴儿生长的用途

Also Published As

Publication number Publication date
CN101473038A (zh) 2009-07-01
CN101573451B (zh) 2014-04-30
CN101573451A (zh) 2009-11-04

Similar Documents

Publication Publication Date Title
CN101473038B (zh) 含有多不饱和脂肪酸的植物种子油
US7897844B2 (en) PUFA polyketide synthase systems and uses thereof
US9382521B2 (en) Polyunsaturated fatty acid production in heterologous organisms using PUFA polyketide synthase systems
US7271315B2 (en) PUFA polyketide synthase systems and uses thereof
US20070244192A1 (en) Plant seed oils containing polyunsaturated fatty acids
JP5806259B2 (ja) Pufaポリケチドシンターゼ系およびそれらの使用方法
JP5551584B2 (ja) キメラpufaポリケチドシンターゼシステムおよびその使用
US20080005811A1 (en) Pufa polyketide synthase systems and uses thereof
CN101389213B (zh) Pufa聚酮化合物合酶系统及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DSM IP PROPERTY COMPANY

Free format text: FORMER OWNER: MARTEK BIOSCIENCES BOULDER CORP.

Effective date: 20121109

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20121109

Address after: Holland Heerlen

Applicant after: DSM IP asset company

Address before: American Maryland

Applicant before: Martek Biosciences Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140528

Termination date: 20150315

EXPY Termination of patent right or utility model