CN110114456A

CN110114456A - 新颖的酰基转移酶、变体硫酯酶和其用途

Info

Publication number: CN110114456A
Application number: CN201780070707.1A
Authority: CN
Inventors: J·L·莫斯利; J·加索拉里; X·赵; A·俄温; A·索曼奇; S·富兰克林; D·戴维斯
Original assignee: Kirbyn Biotech Corp
Current assignee: Kirbyn Biotech Corp; TerraVia Holdings Inc
Priority date: 2016-10-05
Filing date: 2017-10-05
Publication date: 2019-08-09
Also published as: WO2018067849A2; US20180142218A1; BR112019006856A2; EP3523425A2; US20200392470A1; WO2018067849A3

Abstract

提供编码酰基转移酶和变体硫酯酶的重组核酸和载体构建体，和由所述核酸编码的所述酰基转移酶和变体硫酯酶。所述酰基转移酶和变体硫酯酶可用于脂肪酸合成和三酰甘油制造。提供表达所述重组核酸的宿主细胞以及培养所述宿主细胞的方法，由所述宿主细胞制造油的方法。重组宿主细胞和由其产生的油具有变化的脂肪酸谱和/或具有变化的区域特异性的三酰甘油。

Description

新颖的酰基转移酶、变体硫酯酶和其用途

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2016年10月5日提交且标题为“新颖的酰基转移酶、变体硫酯酶和其用途”的美国临时专利申请第62/404,667号和2017年10月4日提交且标题为“新颖的酰基转移酶、变体硫酯酶和其用途”的美国专利申请第15/725,222号的优先权，所述两篇申请以全文引用的方式并入本文中。

参考序列表

本申请包括序列表，如实施方式末尾所展示。

技术领域

本发明的实施例涉及油/油脂、燃料、食品和油脂化学品和其从基因工程改造细胞的培养物产生。实施例涉及参与脂肪酸合成途径的核酸和蛋白质；具有高含量的在甘油主链上具有脂肪酰基的甘油三酯的油、高度稳定油、具有高含量油酸或中链脂肪酸的油，和由这类油产生的产品。

背景技术

共同拥有的专利申请WO2008/151149、WO2010/063031、WO2010/063032、WO2011/150410、WO2011/150411、WO2012/061647、WO2012/061647、WO2012/106560、WO2013/158938、WO2014/120829、WO2014/151904、WO2015/051319、WO2016/007862、WO2016/014968、WO2016/044779和WO2016/164495涉及微生物油和在宿主细胞(包括微藻)中制备那些油的方法。这些公开还描述这类油用以制备食品、油脂化学品、燃料和其它产品的用途。

脂肪酰基-CoA伸长途径的某些酶用以延长脂肪酰基-CoA分子的长度。延长酶-复合酶以2个碳添加延长脂肪酰基-CoA分子，例如延长肉豆蔻酰基-CoA至棕榈酰基-CoA、硬脂酰基-CoA至二十烷基-CoA、或油酰基-CoA至二十烷酰基-CoA、二十烷酰基-CoA至芥基-CoA。另外，延长酶还以2个碳增量延长酰基链长度。KCS酶缩合酰基-CoA分子与丙二酰基-CoA中的两个碳以形成β-酮脂酰-CoA。KCS和延长酶可展示对冷凝特定碳长度、修饰(例如羟基化)或饱和度的酰基底物的特异性。举例来说，荷荷芭(荷荷巴油(Simmondsia chinensis))β-酮脂酰-CoA合成酶已展现偏好单不饱和和饱和的C18-CoA和C20-CoA底物以提高转基因植物中的芥酸产量(Lassner等人,《植物细胞(Plant Cell)》,1996，第8(2)卷,第281-292页)，而布氏锥虫(Trypanosoma brucei)的特异性延长酶展示偏好延长短链和中链饱和CoA底物(Lee等人,《细胞(Cell)》,2006,第126(4)卷,第691-9页)。

II型脂肪酸生物合成途径采用一系列由可溶性蛋白质催化的反应，其中中间产物作为酰基载体蛋白(acyl carrier protein；ACP)的硫酯在酶之间穿梭。相比之下，I型脂肪酸生物合成途径使用单一的大多官能多肽。

产油非光合藻类莫氏原壁菌在过量供应营养碳的条件下存储大量甘油三酸酯油，但细胞分裂由于其它必需营养物而受到抑制。在质粒中发生碳链长度高达C18的脂肪酸的大量生物合成；随后脂肪酸被输出到内质网，在所述内质网中，据信延长超过C18和掺入甘油三酸酯(TAG)。脂质存储在称为脂质粒的大胞质器中直到环境条件变化以促进生长，于是其移动以提供能量和碳分子以进行合成代谢。

发明内容

在各个方面，本文所公开的本发明包括以下实施例的一个或多个。实施例可以单独实施或彼此组合实施。

实施例1：本发明的此实施例提供一种重组载体构建体或宿主细胞，其包含编码酰基转移酶的核酸，所述酰基转移酶任选地可经操作以在由表达核酸的宿主细胞产生的油中产生变化的脂肪酸谱或变化的sn-2谱。核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％、或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。本发明的酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)、或磷脂酶A2(PLA2)。本发明的酰基转移酶示于表5中。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。在一个实施例中，宿主细胞的重组载体构建体包含核酸，所述核酸与SEQ ID NO:19、20、21、22、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124或125所编码的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％一致。

实施例2：本发明的此实施例提供编码酰基转移酶的核酸，所述酰基转移酶在表达时在表达核酸的宿主细胞所产生的油中产生变化的脂肪酸谱或变化的sn-2谱。核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％、或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。本发明的酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)、或磷脂酶A2(PLA2)。本发明的酰基转移酶示于表5中。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。在一个实施例中，核酸包含与以下各者所编码的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性的核酸：SEQ ID NO:19、20、21、22、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、或125。

实施例3：本发明的此实施例提供经密码子优化的核酸，其编码酰基转移酶，所述酰基转移酶可经操作以在表达核酸的宿主细胞所产生的油中产生变化的脂肪酸谱和/或变化的sn-2谱。在一个方面中，优化密码子以用于在宿主细胞(包括源自植物的宿主细胞)中表达。在另一方面中，优化密码子以用于在原壁菌属或小球藻属中表达。在另一方面中，优化密码子以用于在莫氏原壁菌或原始小球藻(Chlorella protothecoides)中表达。经密码子优化的核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件也针对原壁菌属或小球藻属进行密码子优化。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。经密码子优化的核酸所编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ IDNO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。当优化密码子以用于在宿主生物体中表达时，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子为最优选的密码子。或者，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子为第一或第二最优选的密码子。经密码子优化的核酸编码示于表5中的酰基转移酶。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。经密码子优化的核酸所编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。在一个实施例中，密码子优化的核酸包含以下核酸：其与SEQ ID NO:19、20、21、22、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124或125所编码的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％一致。

实施例4：在此实施例中，本发明提供宿主细胞，其为产油微生物细胞或植物细胞。本发明的微生物是真核微生物。在一个方面中，宿主细胞是微藻。在一个实施例中，微藻属于绿藻(Chlorophyta)门，共球藻纲(Trebouxiophytae)，小球藻(Chlorellales)目或小球藻科。在一个实施例中，微藻属于原壁菌属或小球藻属。在一个实施例中，微藻属于物种莫氏原壁菌、左氏原壁菌(Prototheca zopfii)、魏氏原壁菌(Prototheca wickerhamii)、Prototheca blaschkeae、Prototheca chlorelloides、Prototheca crieana、Protothecadilamenta、Prototheca hydrocarbonea、Prototheca kruegeri、Protothecaportoricensis、Prototheca salmonis、Prototheca segbwema、Prototheca stagnorum、Prototheca trispora、Prototheca ulmea、或Prototheca viscosa。优选地，微藻属于莫氏原壁菌物种。在一个实施例中，微藻属于物种自养小球藻(Chlorella autotrophica)、Chlorella colonials、Chlorella lewinii、微小小球藻(Chlorella minutissima)、Chlorella pituitam、Chlorella pulchelloides、蛋白核小球藻(Chlorellapyrenoidosa)、Chlorella rotunda、Chlorella singularis、富油小球藻(Chlorellasorokiniana)、变异小球藻(Chlorella variabilis)或Chlorella volutis。优选地，微藻属于物种原始小球藻或原壳小球藻(Auxenochlorella protothecoides)。宿主细胞表达涉及本发明的酰基转移酶的实施例的核酸。

实施例5：在此实施例中，酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)、或磷脂酶A2(PLA2)。在一个实施例中，本发明的酰基转移酶示于表5中。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

实施例6：在此实施例中，编码酰基转移酶的核酸增加C8:0和/或C10:0脂肪酸的产量或改变宿主细胞中的sn-2谱。本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。相比于未表达编码本发明的LPAAT的重组核酸的细胞油的C8:0和/或C10:0含量，宿主细胞的油的C8:0或C10:0含量增加了5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、70％、80％、90％或更高。油的sn-2谱被本发明的LPAAT的表达改变且/或相比于在未表达编码本发明的LPAAT的重组核酸的细胞油的sn-2位置处的C8:0和/或C10:0脂肪酸，sn-2位置处的C8:0和/或C10:0脂肪酸增加了5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、70％、80％、90％或更高。经密码子优化的核酸所编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

实施例7：此实施例包含编码LPAAT、示于表5中和本文所公开的核酸。核酸所编码的LPAAT具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179或180。

实施例8：在此实施例中，编码本发明的GPAT的核酸具有与SEQ ID NO:181、182、183、184、185或186 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性。

实施例9：在此实施例中，编码本发明的DGAT的核酸具有与SEQ ID NO:187或188 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性。

实施例10：在此实施例中，编码本发明的LPCAT的核酸具有与SEQ ID NO:189、190、191或192 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性。

实施例11：此实施例包含编码PLA2的核酸。核酸所编码的PLA2具有与SEQ ID NO:193、194、195或196 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性。

实施例12：此实施例为培养宿主细胞的方法，所述宿主细胞表达编码实施例1至11的一种或多种酰基转移酶的核酸。

实施例13：此实施例为通过培养表达编码实施例1至12的一种或多种酰基转移酶的核酸的宿主细胞和回收油来产生油的方法。

实施例14：此实施例为油，其通过培养表达编码实例1至11的酰基转移酶的一种或多种核酸的宿主细胞和从宿主细胞回收油来产生。当宿主细胞为微藻时，宿主细胞所产生的细胞油具有与植物细胞所产生的甾醇不同的甾醇。细胞油具有与获自植物的油不同的甾醇谱。

实施例15：在此实施例中，提供重组酰基转移酶。重组酰基转移酶可由宿主细胞产生。重组酰基转移酶的糖基化从在非重组野生型细胞所产生的酰基转移酶中观测到的糖基化模式变化，所述非重组野生型细胞衍生编码酰基转移酶的基因。在一个实施例中，重组酰基转移酶本发明具有酰基转移酶活性并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在一个实施例中，重组酰基转移酶本发明具有酰基转移酶活性并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。经编码的酰基转移酶具有与以下各者的酰基转移酶75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

实施例16：本发明的此实施例提供重组载体构建体或宿主细胞，其包含编码变体芸苔属(Brassica)脂肪酰基-ACP硫酯酶的核酸，所述脂肪酰基-ACP硫酯酶任选地可经操作以在表达核酸的宿主细胞产生的油中产生变化的脂肪酸谱。核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的硫酯酶具有与SEQID NO:165、166、167或168 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。在一个实施例中，本发明的芜菁(Brassica Rapa)、甘蓝型油菜(Brassica napus)或芥菜(Brassica juncea)硫酯酶具有脂肪酰基水解活性并且偏好水解酰基载体蛋白中的长链脂肪酰基。在一个实施例中，自高等植物分离的硫酯酶基因被改变以产生变体硫酯酶，所述变体硫酯酶具有已从野生型酶变化的某些氨基酸。由于变化的氨基酸，硫酯酶的底物特异性被改变。在宿主细胞和从宿主细胞回收的油中，变体BnOTE酶提高按DCW计的C18:0含量、降低按DCW计的C18:1含量并且降低按DCW计的C18:2含量。

实施例17：本发明的此实施例提供重组载体构建体或宿主细胞，其包含编码山竹(Garcinia mangostana)变体脂肪酰基-ACP硫酯酶(GmFATA)的核酸，所述脂肪酰基-ACP硫酯酶任选地可经操作以在表达核酸的宿主细胞所产生的油中产生变化的脂肪酸谱。核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的变体藤黃属(Garcinia)硫酯酶具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149、150 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性，包含以下氨基酸变体中的一种更多种：D变体L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V T156F、T156A、T156K、T156V或V193A。在一个实施例中，本发明的山竹硫酯酶具有脂肪酰基水解活性且偏好水解酰基载体蛋白中的长链脂肪酰基。在一个实施例中，自高等植物分离的硫酯酶基因被改变以产生变体硫酯酶，所述变体硫酯酶具有已从野生型酶变化的某些氨基酸。由于变化的氨基酸，硫酯酶的底物特异性被改变。在宿主细胞和从宿主细胞回收的油中，变体BnOTE酶提高按DCW计的C18:0含量、降低按DCW计的C18:1含量并且降低按DCW计的C18:2含量。

实施例18：本发明的此实施例提供编码变体芸苔属硫酯酶或变体藤黃属硫酯酶的核酸，所述变体芸苔属硫酯酶或变体藤黃属硫酯酶在表达时在表达核酸的宿主细胞所产生的油中产生变化的脂肪酸谱。核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的变体芸苔属硫酯酶具有与SEQ ID NO:165、166、167或168 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。核酸所编码的变体变体藤黃属硫酯酶具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149、150 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性，并包含以下氨基酸变体中的一种更多种：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111VT156F、T156A、T156K、T156V或V193A。

实施例19：本发明的此实施例提供编码变体芸苔属硫酯酶或变体藤黃属硫酯酶的经密码子优化的核酸，所述变体芸苔属硫酯酶或变体藤黃属硫酯酶可经操作以在表达核酸的宿主细胞所产生的油中产生变化的脂肪酸谱。在一个方面中，优化密码子以用于在宿主细胞(包括源自植物的宿主细胞)中表达。在另一方面中，优化密码子以用于在原壁菌属或小球藻属中表达。在另一方面中，优化密码子以用于在莫氏原壁菌或原始小球藻中表达。经密码子优化的核酸可为核酸构建体或载体构建体，其还包括一种或多种调节元件。一种或多种调节元件也针对原壁菌属或小球藻属进行密码子优化。一种或多种调节元件包括启动子、靶向序列、分泌信号和控制或引导在宿主细胞中表达编码蛋白质的其它元件。核酸所编码的变体芸苔属硫酯酶具有与SEQ ID NO:165、166、167或168 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。核酸所编码的变体变体藤黃属硫酯酶具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性，并包含以下氨基酸变体中的一种更多种：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V T156F、T156A、T156K、T156V或V193A。当优化密码子以用于在宿主生物体中表达时，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子为最优选的密码子。或者，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子为第一或第二最优选的密码子。经密码子优化的核酸编码变体芸苔属硫酯酶和变体藤黃属硫酯酶。在一个实施例中，本发明的变体芸苔属硫酯酶和变体藤黃属硫酯酶具有硫酯酶活性。

实施例20：在此实施例中，本发明提供宿主细胞，其为产油微生物细胞或植物细胞。本发明的微生物是真核微生物。在一个方面中，宿主细胞是微藻。在一个实施例中，微藻属于绿藻门，共球藻纲，小球藻目或小球藻科。在一个实施例中，微藻属于原壁菌属或小球藻属。在一个实施例中，微藻属于物种莫氏原壁菌、左氏原壁菌(Prototheca zopfii)、魏氏原壁菌(Prototheca wickerhamii)、Prototheca blaschkeae、Prototheca chlorelloides、Prototheca crieana、Prototheca dilamenta、Prototheca hydrocarbonea、Protothecakruegeri、Prototheca portoricensis、Prototheca salmonis、Prototheca segbwema、Prototheca stagnorum、Prototheca trispora、Prototheca ulmea、或Protothecaviscosa。优选地，微藻属于莫氏原壁菌物种。在一个实施例中，微藻属于物种自养小球藻(Chlorella autotrophica)、Chlorella colonials、Chlorella lewinii、微小小球藻(Chlorella minutissima)、Chlorella pituitam、Chlorella pulchelloides、蛋白核小球藻(Chlorella pyrenoidosa)、Chlorella rotunda、Chlorella singularis、富油小球藻(Chlorella sorokiniana)、变异小球藻(Chlorella variabilis)或Chlorella volutis。优选地，微藻属于物种原始小球藻或原壳小球藻。宿主细胞表达涉及本发明的酰基转移酶的实施例的核酸。

实施例21：在此实施例中，编码变体芸苔属硫酯酶的核酸编码以下变体硫酯酶：其具有与SEQ ID NO:165、166、167或168 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。在另一方面中，编码变体藤黃属硫酯酶的核酸编码以下变体硫酯酶：其具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V T156F、T156A、T156K、T156V或V193A中的一种或多种。

实施例22：在此实施例中，核酸编码变体芸苔属硫酯酶或变体藤黃属硫酯酶，其在宿主细胞中降低C18:0的产量和/或降低C18:1脂肪酸的产量和/或降低C18:2脂肪酸sn-2的产量。

实施例23：在此实施例中，编码本发明的变体芸苔属硫酯酶的核酸具有SEQ ID NO:165、166、167或168并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。

实施例24：在此实施例中，编码本发明的变体藤黃属硫酯酶的核酸具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150 75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％的一致性并包含氨基酸变体L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V T156F、T156A、T156K、T156V或V193A中的一种或多种。

实施例25：此实施例为培养宿主细胞的方法，所述宿主细胞表达编码实施例16至24的一种或多种酰基转移酶的核酸。

实施例26：此实施例为通过以下产生油的方法：培养表达核酸的宿主细胞，所述核酸编码实施例16-25的一种或多种变体硫酯酶，以及回收油。

实施例27：此实施例为油，其通过以下产生：培养表达一种或多种核酸的宿主细胞，所述核酸编码实施例16-24的变体硫酯酶，以及从宿主细胞回收油。当宿主细胞为微藻时，宿主细胞所产生的细胞油具有与植物细胞所产生的甾醇不同的甾醇。细胞油具有与获自植物的油不同的甾醇谱。

实施例28：在此实施例中，提供重组变体硫酯酶。重组变体硫酯酶由宿主细胞产生。重组变体硫酯酶的糖基化从在非重组野生型细胞所产生的变体硫酯酶中观测到的糖基化模式变化，所述非重组野生型细胞衍生编码变体硫酯酶的基因。

借助于实例并且不意欲为唯一组合，本发明的酰基转移酶和/或变体酰基-ACP硫酯酶可在细胞中表达，在所述细胞中，内源性去饱和酶、KAS和/或脂肪酰基-ACP硫酯酶已消融或下调，如实例中所展示。本发明的一实施例为酰基转移酶和/或变体酰基-ACP硫酯酶伴随转化酶的共表达，如所公开的实例中所说明。另外，本发明的一实施例为酰基转移酶和/或变体酰基-ACP硫酯酶的表达以及转化酶的伴随表达和去饱和酶、KAS和/或脂肪酰基-ACP硫酯酶的消融或下调，如所公开的实例中所显示。

附图说明

图1.S7815对比S6573亲本的TAG谱.括号中的TAG与主要TAG的峰共洗脱，但以痕量存在，并且对面积无显著促进。M＝肉豆蔻酸酯(C14:0)，P＝棕榈酸酯(C16:0)，Po＝棕榈油酸酯(C16:1)，Ma＝十七烷酸(C17:0)，S＝硬脂酸酯(C18:0)，O＝油酸酯(C18:1)，L＝亚油酸酯(C18:2)，Ln＝亚麻酸酯(C18:3α)，A＝二十烷酸酯(C20:0)，B＝二十二酸酯(C22:0)，Lg＝二十四酸酯(C24:0)，Hx＝二十六酸酯(C26:0)。Sat-Sat-Sat＝三饱和化物。参见实例5。

图2.来自S7815对比S6573的发酵的脂质的TAG谱.括号中的TAG与主要TAG的峰共洗脱，但以痕量存在，并且对面积无显著促进。M＝肉豆蔻酸酯(C14:0)，P＝棕榈酸酯(C16:0)，S＝硬脂酸酯(C18:0)，O＝油酸酯(C18:1)，L＝亚油酸酯(C18:2)，Ln＝亚麻酸酯(C18:3α)，A＝二十烷酸酯(C20:0)，B＝二十二酸酯(C22:0)，Lg＝二十四酸酯(C24:0)，Hx＝二十六酸酯(C26:0)。Sat-Sat-Sat＝三饱和化物。参见实例5。

具体实施方式

I.定义

“等位基因”是指其中生物体有多个相似或相同的基因拷贝(甚至在相同的染色体上)的基因的拷贝。等位基因可以编码相同或相似的蛋白质。

“油”、“细胞油”或“细胞脂肪”应意味从生物体中获得的主要甘油三酯油，其中油尚未进行与另一天然或合成油的掺合或分馏以便显著地改变甘油三酯的脂肪酸谱。关于包含具有特定区域特异性的甘油三酯的油，细胞油或细胞脂肪未进行酯交换或其它合成方法以获得区域特异性甘油三酯谱，而是通过细胞或细胞群自然产生区域特异性。对于由细胞产生的细胞油，油的甾醇谱一般由细胞产生的甾醇确定，而不是通过加入甾醇以模拟细胞油而通过人工复原油来确定。关于细胞油或细胞脂肪，并且如一般在整个本公开中所使用的，除非另有说明，否则术语油和脂肪可互换使用。因此，取决于物质的组成和其它条件，“油”或“脂肪”在室温下可为液体、固体或部分固体。这里，术语“分馏”意味以相对于生物体产生的谱改变其脂肪酸谱的方式从油中除去物质，无论如何完成。术语“油”、“细胞油”和“细胞脂肪”涵盖从生物体获得的这类油，其中油已进行最小程度的加工，包括精炼、漂白、除臭和/或脱胶，其基本上不改变其甘油三酯谱。细胞油也可以是“非酯交换的细胞油”，这意味着细胞油未经历过以下过程：其中脂肪酸在其酰基键中被重新分配至甘油并且基本上保持与从生物体中回收时相同的构型。

如本文所用，如果相对于非富集油在油中所述脂肪酸的质量存在至少10％增加，那么认为油“富集”在一种或多种特定的脂肪酸中。举例来说，就表达本文所述的异源FatB基因的细胞而言，如果油中这些脂肪酸的质量比不表达异源FatB基因的相同类型细胞产生的油(例如野生型油)中的脂肪酸质量大10％，那么称细胞产生的油富集在例如C8和C16脂肪酸中。

“外源基因”应意味着编码以用于表达已经引入细胞(例如通过转化/转染)的RNA和/或蛋白质的核酸，并且也被称为“转基因”。包含外源基因的细胞可以称为重组细胞，可以向其中引入另外的外源基因。相对于转化的细胞，外源基因可以来自不同物种(并且因此是异源的)，或来自相同物种(并且因此是同源的)。因此，相对于基因的内源拷贝，外源基因可以包括占据细胞基因组中不同位置或处于不同控制下的同源基因。外源基因可以存在于细胞中的超过一个拷贝中。外源基因作为进入基因组(细胞核或质粒)的插入或作为附加分子维持在细胞中。

“FAD_C”(也称为“FAD2”或“FAD”)是编码δ-12脂肪酸去饱和酶的基因。“SAD”是编码硬脂酰基ACP去饱和酶，Δ-9脂肪酸去饱和酶的基因。去饱和酶使脂肪酰基链去饱和以产生双键。SAD将硬脂酸、C18:0转化为油酸、C18:1并且FAD将油酸、C18:1转化为亚油酸、C18:2。

“脂肪酸”应意味游离脂肪酸、脂肪酸盐，或甘油脂中的脂肪酰基部分。应理解，甘油脂的脂肪酰基可以根据甘油三酯水解或皂化时产生的羧酸或羧酸阴离子来描述。

“固定碳源”是含有碳的分子，通常为有机分子，其在环境温度和压力下呈固体或液体形式存在于培养基中，可被其中培养的微生物利用。因此，二氧化碳不是固定碳源。典型的固定碳源包括蔗糖、葡萄糖、果糖和其它众所周知的单糖、二糖和多糖。

“以可操作的连接”是两个核酸序列：这类控制序列(通常为启动子)与连接的序列(通常为编码蛋白质的序列，也称为编码序列)之间的功能性连接。启动子如果可调节基因的转录，那么它与外源基因处于可操作连接中。

“微藻”是含有叶绿体或其它质粒的真核微生物生物体，以及任选地能够进行光合作用的真核微生物生物体，或能够进行光合作用的原核微生物生物体。微藻包括专性光合自养生物，其不能代谢作为能量的固定碳源，以及异养生物，其可以仅仅以固定碳源为生。微藻还包括可以进行光合作用并代谢一种或多种固定碳源的混合营养生物。微藻包括在细胞分裂后不久与姐妹细胞分离的单细胞生物，例如衣藻属(Chlamydomonas)，以及微生物(例如团藻虫属(Volvox))，其是两种不同细胞类型的简单多细胞光合微生物。微藻包括如小球藻属、杜氏藻属(Dunaliella)和原壁菌属的细胞。微藻还包括表现出细胞-细胞粘附的其它微生物光合生物，例如阿格门氏藻属(Agmenellum)、鱼腥藻属(Anabaena)和桑椹藻属(Pyrobotrys)。微藻还包括丧失了进行光合作用能力的专性异养微生物，例如某些双鞭毛藻物种和原壁菌属物种。

如相对于核酸所使用，术语“分离的”是指核酸不含通常与天然存在的核酸一起存在的至少一种其它组分。因此，如果天然存在的核酸已经从与核酸一起天然存在的至少一种其它组分中纯化出来，那么其为分离的。

关于脂肪酸长度，“中链”应意味着C8至C16脂肪酸。

关于重组细胞，术语“基因敲落”是指基因在基因所编码的蛋白质的产量或活性方面已被部分抑制(例如抑制约1-95％)。用于下调或基因敲落基因表达的抑制性RNA技术是众所周知的。这些技术包括dsRNA、发夹RNA、反义RNA、干扰RNA(RNAi)等。

另外，关于重组细胞，术语“基因剔除”是指在基因所编码的蛋白质的产量或活性方面，基因已被完全或几乎完全(例如>95％)抑制。可以通过将核酸序列同源重组到编码序列来剥蚀基因、基因缺失、突变或其它方法来制备基因敲除。当进行同源重组时，插入(“敲入”)的核酸可以是编码所关注的外源基因的序列或不编码所关注基因的序列。通过同源重组进行的消融可以在所关注基因的一个、两个或更多个等位基因中进行。

“产油”细胞是能够天然或经由重组或典型的菌种选育产生按干细胞重量计至少20％脂质的细胞。“产油微生物(oleaginous microbe)”或“产油微生物(oleaginousmicroorganism)”是微生物，其包括产油的微藻(特别是储存脂质的真核微藻)。产油细胞还涵盖已除去其部分或全部脂质或其它内容物的细胞，以及活细胞和死细胞。

“有序油”或“有序脂肪”是指形成主要具有既定多晶型结构的晶体的一者。举例来说，有序油或有序脂肪可具有超过50％、60％、70％、80％或90％为β或β'多晶形式的晶体。

关于细胞油，“谱”是在油内特定物种或甘油三酯或脂肪酰基的分布。“脂肪酸谱”是油的甘油三酯中脂肪酰基的分布，而不涉及与甘油主链的连接。脂肪酸谱通常通过转化成脂肪酸甲酯(FAME)，然后用火焰离子化检测(flame ionization detection；FID)进行气相色谱(GC)分析来确定，如实例1中。脂肪酸谱可以表示为总脂肪酸信号中脂肪酸的一个或多个百分比，所述脂肪酸信号由所述脂肪酸的曲线下面积确定。FAME-GC-FID测量近似脂肪酸的重量百分比。“sn-2谱”是在油中甘油三酸酯的sn-2位置发现的脂肪酸的分布。“区域特异性谱”是甘油三酯的分布，其涉及酰基连接到甘油主链的定位，而不涉及立体特异性。换句话说，区域特异性谱描述sn-1/3对sn-2的酰基附着。因此，在区域特异性谱中，POS(棕榈酸酯-油酸酯-硬脂酸酯)和SOP(硬脂酸酯-油酸酯-棕榈酸酯)被相同地处理。“立体特异性谱”描述酰基在sn-1、sn-2和sn-3处的附着。除非另外指示，否则认为如SOP和POS的甘油三酯是等同的。“TAG谱”是甘油三酯中发现的脂肪酸的分布，其涉及与甘油主链的连接，但不涉及连接的区域特异性。因此，在TAG谱中，油中SSO的百分比为SSO和SOS的总和，而在区域特异性谱中，计算SSO的百分比而不包括油中的SOS物质。相比于FAME-GC-FID分析的重量百分比，甘油三酯百分比通常以摩尔百分比给出；即TAG混合物中给定TAG分子的百分比。

在两个或更多个氨基酸或核酸序列的上下文中，术语“序列一致性百分比”是指在如使用序列比较算法或通过视觉检查所测量，比较和比对最大对应性时，两个或更多个序列或子序列相同或具有指定百分比的相同氨基酸残基或核苷酸。为进行序列比较以测定核苷酸氨基酸一致性百分比，通常一个序列充当参考序列，使其与测试序列比较。当使用序列比较算法时，将测试和参考序列输入到计算机中，必要时指定子序列座标，并且指定序列算法程序参数。随后，序列比较算法根据所指定的程式参数来计算测试序列相对于参考序列的序列一致性百分比。可以使用设置为默认参数的NCBI BLAST软件(ncbi.nlm.nih.gov/BLAST/)进行用于比较的序列的最佳比对。举例来说，为了比较两个核酸序列，可以使用blastn，其中“BLAST 2Sequences”工具版本2.0.12(2000年4月21日)设置为以下默认参数：矩阵：BLOSUM62；匹配奖分：1；错配罚分：-2；开放缺口：5和延伸缺口：2罚分；缺口×下降：50；预期：10；字长：11；滤波器：开。为了成对比较两个氨基酸序列，可以使用“BLAST 2Sequences”工具版本2.0.12(2000年4月21日)，其中blastp例如设置在以下默认参数：矩阵：BLOSUM62；开放缺口：11和延伸缺口：1罚分；缺口×下降50；预期：10；字长：3；滤波器：开。

“重组”是细胞、核酸、蛋白质或载体已由于引入外源性核酸或改变天然核酸而被修饰。因此，例如重组细胞可表达细胞的天然(非重组)形式内未发现的基因或表达不同于非重组细胞所表达的那些基因的天然基因。重组细胞可以包括(但不限于)重组核酸，其编码基因产物或降低细胞中的活性基因产物含量的抑制元件，如突变、基因敲除、反义、干扰RNA(RNAi)、发夹RNA或dsRNA。“重组核酸”是最初在体外一般通过操纵核酸，例如使用聚合酶、连接酶、核酸外切酶和核酸内切酶，使用化学合成形成的核酸，或以其它方式呈通常不存在于自然界的形式。可以产生重组核酸以例如将两个或更多个核酸置于可操作的连接中。因此，通过连接在自然界中通常不连接的DNA分子在体外形成的经分离核酸或表达载体出于本发明的目的都被认为是重组的。在制得重组核酸并将其引入宿主细胞或生物体后，其可以使用宿主细胞的体内细胞机制进行复制；然而，这类核酸在以重组方式产生后，尽管随后在细胞内复制，但出于本发明的目的仍然认为是重组的。类似地，“重组蛋白”是使用重组技术(即通过度表达重组核酸)制备的蛋白质。重组蛋白将具有与从野生型生物体分离的蛋白质不同的糖基化模式。

基因可用于多种包括质粒或其它载体的基因构建体以用于在宿主细胞中表达或重组。可密码子优化基因以用于在标靶宿主细胞中表达。基因所产生的蛋白质可体内或呈纯化形式使用。

举例来说，基因可以在包含可操作地连接的启动子和5'UTR的表达载体中制备。当质粒细胞用作宿主时，具有适当活性的质粒靶向肽可以与FATB基因融合，如以下实例中。通常，对于新鉴定的FATB基因，在N端存在大约50个氨基酸，其构成质粒转运肽，所述质粒转运肽负责将酶输送到叶绿体。在以下实例中，此转运肽被38个氨基酸序列取代，所述氨基酸序列在莫氏原壁菌宿主细胞中有效将酶输送到那些细胞的质粒中。因此，本发明涵盖缺失和融合蛋白，以优化给定宿主细胞中的酶活性。举例来说，可以使用来自宿主或相关物种的转运肽代替本文所述的新发现的植物基因的转运肽。

可选择的标记基因可以包括在载体中以辅助分离转化细胞。可用于微藻的可选标记的实例包括蔗糖转化酶抗生素抗性基因和可用作可选标记的其它基因。在实例中公开卡尔斯伯酵母(S.carlbergensis)MEL1基因(赋予基于蜜二糖生长的能力)、阿拉伯芥(A.thaliana)THIC基因(赋予在不含硫胺的培养基中生长的能力)、酵母菌属蔗糖转化酶(赋予基于蔗糖生长的能力)。其它已知的可选标记为有用的并且在熟练技术人员的范围内。

术语“甘油三酯”，“甘油三酸酯”和“TAG”可互换使用，如所属领域中已知。

II.本发明的实施例

本发明的说明性实施例的特征在于产油细胞，其在甘油脂中产生变化的脂肪酸谱和/或变化的脂肪酸的区域特异性分布，以及由所述细胞产生的产物。产油细胞的实例包括具有II型脂肪酸生物合成途径的微生物细胞，包括质粒产油细胞，例如产油藻类的那些细胞，以及在适当情况下高等植物的产油细胞，所述高等植物包括但不限于商业含油种子作物，如大豆、玉米、油菜籽/芥花籽、棉花、亚麻、向日葵、红花和花生。细胞的其它特定实例包括绿藻门，共球藻纲，小球藻目或小球藻科的异养或专性异养微藻。产油微藻和培养方法的实例还提供于共同拥有的申请WO2008/151149、WO2010/063031、WO2010/063032、WO2011/150410、WO2011/150411、WO2012/061647、WO2012/061647、WO2012/106560和WO2013/158938、WO2014/120829、WO2014/151904、WO2015/051319、WO2016/007862、WO2016/014968、WO2016/044779、WO2016/164495中，所有申请均以引用并入，包括包含专性异养生物的属：小球藻属和原壁菌属的物种。产油细胞例如能够产生按细胞重量计25％、30％、40％、50％、60％、70％、80％、85％或约90％(±5％)的油。任选地，所产生的油的高度不饱和脂肪酸，例如DHA或EPA脂肪酸可较低。举例来说，油可包含小于5％、2％或1％的DHA和/或EPA。以上所提到的公开还公开用于培养这类细胞和提取油，尤其从微藻细胞提取油的方法；这类方法适用于本文所公开的细胞并通过参考这些教示内容并入。当使用微藻细胞时，它们可以自养(除非专性异养生物)或在黑暗中使用糖(例如葡萄糖、果糖和/或蔗糖)培养。在本文所述的任何实施例中，细胞可以是包含外源性转化酶基因的异养细胞，以使细胞从蔗糖原料中产生油。或者或另外，细胞可以从纤维素原料中代谢木糖。举例来说，可以对细胞进行基因工程改造以表达一种或多种木糖代谢基因，例如编码活性木糖转运蛋白、木酮糖-5-磷酸转运蛋白、木糖异构酶、木酮糖激酶、木糖醇脱氢酶和木糖还原酶的基因。参见2012年11月15日公开的WO2012/154626，“代谢木糖的经基因工程改造的微生物”，其包括利用木糖的经基因工程改造的原壁菌属菌株的公开内容。

表达酰基转移酶或变体甘蓝型油菜硫酯酶或变体山竹硫酯酶的宿主细胞可以任选地在生物反应器/发酵罐中培育。举例来说，可以在含糖营养肉汤上培养异养的产油微藻细胞。任选地，培养可以分两个阶段进行：接种阶段和脂质产生阶段。在接种阶段，发酵剂培养物中的细胞数目增加。因此，接种阶段通常包括富含营养物的氮充足培养基，其被设计成促进快速细胞分裂。在接种阶段之后，可以在营养限制(例如氮稀疏)的条件下给细胞供养糖，使得糖转化成甘油三酯。如本文所用，本文公开“标准的脂质产生条件”。在一个实施例中，培养条件是氮限制的。在发酵过程中可以添加糖和其它营养物，但不添加额外的氮。细胞将消耗全部或几乎所有存在的氮，但不提供额外的氮。举例来说，相对于接种阶段，脂质产生阶段中的细胞分裂速率可以降低50％、80％或更多。另外，接种阶段和脂质产生阶段之间培养基的变化可以诱导重组细胞表达不同的脂质合成基因，从而改变所产生的甘油三酯。举例来说，如下所述，氮和/或pH敏感性启动子可以置于内源或外源基因的前面。当在脂质产生阶段生产不支持在接种阶段细胞最佳生长的油时，这尤其有用。

产油细胞表达编码脂肪酸生物合成酶的一个或多个外源基因。结果，一些实施例的特征在于不能从非植物油或非种子油获得的细胞油，或根本不能获得的细胞油。

产油细胞(包括微藻细胞)可以通过典型的菌种选育技术，例如UV和/或化学诱变，随后在环境条件下筛选或选择，包括基于化学或生物化学毒素选择。例如，可以基于脂肪酸合成抑制剂、糖代谢抑制剂或除草剂选择细胞。作为选择的结果，可以获得菌株，其具有增加的糖产量，增加的油产量(例如以细胞体积、干重或细胞培养物升的百分比计)，或改善的脂肪酸或TAG谱。2016年3月31日提交的共同拥有的申请PCT/US2016/025023描述了用于经典诱变产油细胞的方法，所述申请以引用的方式并入本文中。

所述细胞可以基于以下中的一种或多种选择：1,2-环己二酮；19-醋酸炔诺酮；2,2-二氯丙酸；2,4,5-三氯苯氧基乙酸；2,4,5-三氯苯氧基乙酸，甲酯；2,4-二氯苯氧基乙酸；2,4-二氯苯氧基乙酸，丁酯；2,4-二氯苯氧基乙酸，异辛基酯；2,4-二氯苯氧基乙酸，甲酯；2,4-二氯苯氧基丁酸；2,4-二氯苯氧基丁酸，甲酯；2,6-二氯苯腈；2-脱氧葡萄糖；5-十四烷氧基-w-糠酸；A-922500；乙草胺；甲草胺；莠灭净；两性霉素；阿特拉津；氟草胺；地散磷；苯达松；除草定；溴苯腈；唑草胺；羰基氰化物间氯苯腙(CCCP)；羰基氰-对三氟甲氧基苯腙(FCCP)；浅蓝菌素；氯苯胺灵；氯磺隆；氯贝酸；二氯吡啶酸；秋水仙碱；环草敌；环己酰胺；C75；DACTHAL(四氯对苯二甲酸二甲酯)；麦草畏；二氯丙基((R)-2-(2,4-二氯苯氧基)丙酸)；吡氟草胺；二氢茉莉酸，甲酯；敌草快；敌草隆；二甲亚砜；表没食子儿茶素没食子酸酯(EGCG)；草藻灭；乙丁烯氟灵；乙醇；乙氧呋草黄；恶唑禾草灵-对乙基；吡氟禾草灵-对丁基；伏草隆；氟磺胺草醚；甲酰胺磺隆；赤霉酸；草铵膦；草甘膦；吡氟氯禾灵；环嗪酮；灭草喹；异噁草胺；脂肪酶抑制剂THL((-)-四氢利普司他汀)；丙二酸；MCPA(2-甲基-4-氯苯氧基乙酸)；MCPB(4-(4-氯-邻甲苯氧基)丁酸)；硝磺草酮；二氢茉莉酮酸甲酯；异丙甲草胺；嗪草酮；米尔膦酸盐；草达灭；抑草生；去甲哈尔满；奥利司他；噁草酮；乙氧氟草醚；百草枯；二甲戊乐灵；五氯苯酚；PF-04620110；苯乙醇；甜菜宁；毒莠定；平板素；平板霉素；扑灭通；扑草净；拿草特；毒草安；敌稗；扑灭津；杀草敏；喹禾灵-对乙基；二丙基硫代氨基甲酸s-乙酯(EPTC)；s,s,s-三丁基三硫代磷酸酯；水杨基羟肟酸；芝麻酚；环草隆；甲烷砷酸钠；西玛津；T-863(DGAT抑制剂)；丁噻隆；特草定；禾草丹；肟草酮；野麦畏；绿草定；三氯生；氟乐灵；和脱氧酸等。

产油细胞产生存储油，其主要是甘油三酸酯，并且可以被存储在细胞体中。通过破坏细胞并分离油，可以从细胞中获得原油。原油可包含由细胞产生的甾醇。专利申请WO2008/151149、WO2010/063031、WO2010/063032、WO2011/150410、WO2011/150411、WO2012/061647、WO2012/061647、WO2012/106560、WO2013/158938、WO2014/120829、WO2014/151904、WO2015/051319、WO2016/007862、WO2016/014968、WO2016/044779和WO2016/164495公开用于产油微藻的异养培养和油分离技术。举例来说，可以通过提供或培养、干燥和压制细胞来获得油。所产生的油可以如所属领域中已知或如WO2010/120939中所描述精制、漂白和除臭(RBD)。原油或RBD油可用于各种食品、化学品和工业产品或工艺中。即使在这类处理之后，油也可以保留来源的甾醇谱特征。下文公开了微藻和微藻细胞油的甾醇谱。在回收油之后，剩余有价值的残余生物质。残余生物质的用途包括纸、塑料、吸附剂、吸附剂、钻井液、动物饲料、人类营养物或肥料的生产。

在本发明的一个实施例中，提供编码新颖酰基转移酶的核酸。新颖的酰基转移酶可用于改变脂肪酸谱和/或改变宿主细胞产生的油的区域特异性谱。本发明的核酸可含有与所关注基因可操作连接的上游和下游的控制序列。这些控制序列包括启动子、靶向序列、非转译序列和其它控制元件。本发明的核酸编码在II型脂肪酸合成中起作用的酰基转移酶。酰基转移酶基因从高等植物中分离，并且可以在多种宿主细胞中表达。酰基转移酶包括溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)、或磷脂酶A2(PLA2)以及如本文所论述的其它脂质生物合成途径基因。本发明的酰基转移酶示于表5中。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝1的酰基转移酶至少96.3％、98％或99％的一致性。在另一实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝2的酰基转移酶至少93.9％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝3的酰基转移酶至少86.5％、90％、95％、98％或99％的一致性。在一个实施例中，本发明的酰基转移酶具有酰基转移酶活性，并且氨基酸序列包含与表5的进化枝4的酰基转移酶至少78.5％、80％、85％、90％、95％、98％或99％的一致性。酰基转移酶在表达时增加宿主细胞以及从宿主细胞中回收的油中的SOS、POP、POS、SLS、PLO和/或PLO含量DCW。当在宿主细胞中表达时，酰基转移酶降低按DCW计油的sat-sat-sat含量。当在宿主细胞中表达时，酰基转移酶提高按DCW计油的sat-unsat-sat/sat-sat-sat比率。

在本发明的一个实施例中，提供编码变体甘蓝型油菜硫酯酶(FATA)的核酸。新颖的硫酯酶可用于改变宿主细胞产生的油的脂肪酸谱。变体甘蓝型油菜硫酯酶偏好水解酰基载体蛋白中的长链脂肪酰基。本发明的核酸可含有与所关注基因可操作连接的上游和下游的控制序列。这些控制序列包括启动子、靶向序列、非转译序列和其它控制元件。本发明的核酸编码在II型脂肪酸合成中起作用的硫酯酶。从高等植物中分离的硫酯酶基因被改变以产生变体硫酯酶，其具有从野生型酶改变的某些氨基酸。由于变化的氨基酸，硫酯酶的底物特异性被改变。变体硫酯酶可在各种宿主细胞中表达。核酸编码变体硫酯酶，所述变体硫酯酶具有与SEQ ID NO:##-##75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％一致的氨基酸序列并包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。在宿主细胞和从宿主细胞回收的油中，变体BnOTE酶提高按DCW计的C18:0含量、降低按DCW计的C18:1含量并且降低按DCW计的C18:2含量。

在本发明的一个实施例中，提供编码变体山竹硫酯酶(FATA)的核酸。新颖的硫酯酶可用于改变宿主细胞产生的油的脂肪酸谱。变体山竹硫酯酶偏好水解酰基载体蛋白中的长链脂肪酰基。本发明的核酸可含有与所关注基因可操作连接的上游和下游的控制序列。这些控制序列包括启动子、靶向序列、非转译序列和其它控制元件。本发明的核酸编码在II型脂肪酸合成中起作用的硫酯酶。从高等植物中分离的硫酯酶基因被改变以产生变体硫酯酶，其具有从野生型酶改变的某些氨基酸。由于变化的氨基酸，硫酯酶的底物特异性被改变。变体硫酯酶可在各种宿主细胞中表达。核酸编码变体硫酯酶，所述变体硫酯酶具有与SEQ ID NO:##-##75％、80％、85％、90％、95％、98％、99％或100％、或至少75％、80％、85％、90％、95％、98％、99％或100％一致的氨基酸序列并包含氨基酸变体L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V T156F、T156A、T156K、T156V、或V193A中的一种或多种。在宿主细胞和从宿主细胞回收的油中，变体GmFATA酶提高按DCW计的C18:0含量、降低按DCW计的C18:1含量并且降低按DCW计的C18:2含量。

可密码子优化本发明的核酸以用于在标靶宿主细胞中表达(例如使用表1a、1b、2a和2b的密码子使用表)。举例来说，根据表1a、1b、2a和2b，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子可为最优选的密码子。或者，根据表1a、1b、2a和2b，至少60％、65％、70％、75％、80％、85％、90％、95％或100％的所使用密码子可为第一或第二最优选的密码子。原壁菌属菌株和原始小球藻的优选密码子分别如下表1a和1b中所示。

表1a：原壁菌属菌株中的优选的密码子使用.

表1b：原始小球藻中的优选的密码子使用.

表2a：Cuphea wrightii的密码子使用

表2b：芥菜属的密码子使用

因为甾醇谱将指示宿主生物体可与常规源区分，本发明的细胞油可区别于常规植物或动物三酰甘油源。常规的油来源包括大豆、玉米、向日葵、红花、棕榈、棕榈仁、椰子、棉籽、芥花籽、油菜、花生、橄榄、亚麻、牛脂、猪油、可可、牛油树、芒果、婆罗双树、雾冰草脂、印度山竹和阿兰藤黄。

本文所提供的油不是植物油。植物油是从植物和植物种子中提取的油。植物油可以基于其油含量与本文提供的非植物油区分开。可以采用多种分析油含量的方法来确定油的来源或者是否发生了本文提供的油与不同(例如植物)来源的油的掺杂。可以基于分析方法中的一种或组合进行确定。这些测试包括但不限于分析以下中的一种或多种：游离脂肪酸、脂肪酸谱、总三酰甘油含量、二酰甘油含量、过氧化值、光谱特性(例如UV吸收)、甾醇谱、甾醇降解产物、抗氧化剂(例如生育酚)、色素(例如叶绿素)、d13C值和感官分析(例如味道、气味和口感)。许多此类测试已经针对商业油标准化，例如食用脂肪和油的食品法典标准。

甾醇谱分析为用于确定有机物质的生物来源的特别熟知的方法。菜油甾醇、b-谷甾醇和豆甾醇是常见的植物甾醇，其中b-谷甾醇是主要的植物甾醇。举例来说，在某些种子油的分析中发现b-谷甾醇最丰富，玉米约占64％，油菜籽占29％，向日葵占64％，棉籽占74％，大豆占26％，并且橄榄油占79％(Gul等人《细胞和分子生物学杂志(J.Cell andMolecular Biology)》5:71-79,2006)。

微藻油的甾醇谱不同于从高等植物或动物中获得的油的甾醇谱。将从莫氏原壁菌菌株UTEX1435分离的油分别澄清(CL)、精制和漂白(RB)，或精制、漂白和除臭(RBD)，并根据JAOCS 1983年8月第60卷第8期中描述的程序测试甾醇含量。分析结果示于下表3中(单位为mg/100g)：

表3(单位为mg/100g)

这些结果展示三个显著的特征。首先，发现麦角甾醇在所有甾醇中最丰富，占总甾醇的约50％或更多。麦角甾醇的量大于组合的菜油甾醇、β-谷甾醇和豆甾醇的量。麦角甾醇是一种在真菌中常见，但在植物中不常见的类甾醇，其特别是大量的存在作为非植物油的有用标记。其次，发现油含有菜籽甾醇。除菜籽油外，在植物类油中通常不会发现菜籽甾醇。第三，发现存在少于2％的β-谷甾醇。β-谷甾醇是在微藻中不常见的突出的植物甾醇，其特别是大量的存在用作植物来源的油的有用标记。综上所述，已发现莫氏原壁菌菌株UTEX1435含有以总甾醇含量的百分比计算大量的麦角甾醇和仅微量的β谷甾醇。因此，麦角甾醇：β-谷甾醇或与菜籽甾醇的存在组合的比率可用于使此油与植物油区分。

在一些实施例中，本文提供的油的油含量含有以总甾醇的百分比计小于20％、15％、10％、5％、4％、3％、2％、或1％的β-谷甾醇。在其它实施例中，油不含β-谷甾醇。

在一些实施例中，油不含β-谷甾醇、菜油甾醇或豆甾醇中的一种或多种。在一些实施例中，油不含β-谷甾醇、菜油甾醇和豆甾醇。在一些实施例中，油不含菜油甾醇。在一些实施例中，油不含豆甾醇。

在一些实施例中，本文提供的油的油含量包含以总甾醇的百分比计小于20％、15％、10％、5％、4％、3％、2％、或1％的24-乙基胆甾-5-烯-3-醇。在一些实施例中，24-乙基胆甾-5-烯-3-醇为穿贝海绵甾醇。在一些实施例中，本文提供的油的油含量包含以总甾醇的百分比计至少1％、2％、3％、4％、5％、6％、7％、8％、9％或10％穿贝海绵甾醇。

在一些实施例中，本文提供的油的油含量含有以总甾醇的百分比计小于20％、15％、10％、5％、4％、3％、2％、或1％的24-甲基胆甾-5-烯-3-醇。在一些实施例中，24-甲基胆甾-5-烯-3-醇为22,23-二氢菜籽甾醇。在一些实施例中，本文提供的油的油含量包含以总甾醇的百分比计至少1％、2％、3％、4％、5％、6％、7％、8％、9％或10％的22,23-二氢菜籽甾醇。

在一些实施例中，本文提供的油的油含量含有以总甾醇的百分比计小于20％、15％、10％、5％、4％、3％、2％、或1％的5,22-胆甾二烯-24-乙基-3-醇。在一些实施例中，5,22-胆甾二烯-24-乙基-3-醇为多孔甾醇。在一些实施例中，本文提供的油的油含量包含以总甾醇的百分比计至少1％、2％、3％、4％、5％、6％、7％、8％、9％或10％多孔甾醇。

在一些实施例中，本文所提供的油的油含量含有麦角甾醇或菜籽甾醇或两者的组合。在一些实施例中，油含量含有以总甾醇的百分比计至少5％、10％、20％、25％、35％、40％、45％、50％、55％、60％或65％麦角甾醇。在一些实施例中，油含量含有以总甾醇的百分比计至少25％麦角甾醇。在一些实施例中，油含量含有以总甾醇的百分比计至少40％麦角甾醇。在一些实施例中，油含量含有以总甾醇的百分比计至少5％、10％、20％、25％、35％、40％、45％、50％、55％、60％或65％麦角甾醇和菜籽甾醇的组合。

在一些实施例中，油含量含有以总甾醇的百分比计至少1％、2％、3％、4％或5％菜籽甾醇。在一些实施例中，油含量含有以总甾醇的百分比计小于10％、9％、8％、7％、6％或5％菜籽甾醇。

在一些实施例中，麦角甾醇与菜籽甾醇的比率为至少5:1、10:1、15:1或20:1。

在一些实施例中，油含量含有以总甾醇的百分比计至少5％、10％、20％、25％、35％、40％、45％、50％、55％、60％或65％麦角甾醇和小于20％、15％、10％、5％、4％、3％、2％或1％β-谷甾醇。在一些实施例中，油含量含有以总甾醇的百分比计至少25％麦角甾醇和小于5％β-谷甾醇。在一些实施例中，油含量进一步包含菜籽甾醇。

甾醇含有27至29个碳原子(C27至C29)并在所有真核生物中发现。动物专门制备C27甾醇，因为它们缺乏进一步改性C27甾醇以产生C28和C29甾醇的能力。然而，植物能够合成C28和C29甾醇，并且C28/C29植物甾醇通常被称为植物甾醇。给定植物的甾醇谱的C29甾醇较高，并且植物中的主要甾醇通常是C29甾醇b-谷甾醇和豆甾醇。相比之下，非植物生物体的甾醇谱含有较高百分比的C27和C28甾醇。举例来说，真菌和许多微藻中的甾醇主要是C28甾醇。利用甾醇谱，以及特别是植物中C29甾醇相比于C28甾醇的显著优势来确定土壤样品中植物和海洋物质的比例(Huang,Wen-Yen,Meinschein W.G.,“作为生态指标的甾醇(Sterols as ecological indicators)”；《地球化学与宇宙化学学报(Geochimica etCosmochimia Acta.)》第43卷，第739-745页)。

在一些实施例中，本文提供的微藻油中的主要甾醇是除b-谷甾醇和豆甾醇以外的甾醇。在微藻油的一些实施例中，C29甾醇占小于50重量％、40重量％、30重量％、20重量％、10重量％或5重量％的总甾醇含量。

在一些实施例中，本文所提供的微藻油含有超过C29甾醇的C28甾醇。在微藻油的一些实施例中，C28甾醇占大于50重量％、60重量％、70重量％、80重量％、90重量％或95重量％的总甾醇含量。在一些实施例中，C28甾醇为麦角甾醇。在一些实施例中，C28甾醇为菜籽甾醇。

在甘油三酯(也称为“甘油三酸酯”或“TAG”)细胞油的脂肪酸谱在这里给出的情况下，应该理解，这是指在已经除去磷脂的条件下，或用对磷脂的脂肪酸基本上不敏感的分析方法(例如使用色谱法和质谱法)分析从细胞中提取的存储油的未分馏样品。可以对油进行RBD处理以除去磷脂、游离脂肪酸和气味，但对油中甘油三酯的脂肪酸谱仅有微小或可忽略的变化。因为细胞产油，在某些情况下，存储油将构成大部分细胞中的所有TAG。下文的实例1和2给出了用于测定TAG脂肪酸组成和区域特异性结构的分析方法。

大致分类，本发明的某些实施例包括(i)重组产油细胞，其包含内源多核苷酸的一个或两个或所有等位基因的的消融，包括编码溶血磷脂酸酰基转移酶(LPAAT)的多核苷酸或(ii)产生具有低浓度多不饱和脂肪酸的油的细胞，其包括对不饱和脂肪酸营养缺陷的细胞；(iii)由于一种或多种编码将脂肪酸转移至甘油或甘油酯的酶的外源基因的表达，产生具有高浓度特定脂肪酸的油的细胞；(iv)产生区域特异性油的细胞，(v)基因构建体或细胞，其编码LPAAT、溶血磷脂酰胆碱酰基转移酶(LPCAT)、磷脂酰胆碱二酰甘油胆碱磷酸转移酶(PDCT)、二酰甘油胆碱磷酸转移酶(DAG-CPT)或脂肪酰基延长酶(FAE)，(vi)产生低水平饱和脂肪酸和/或高水平C18:1、C18:2、C18:3、C20:1或C22:1的细胞，(vii)和与产生具有变化的谱的细胞油有关的其它发明。实施例还涵盖由这类细胞制备的油、在油提取之后来自这类细胞的残余生物质、油脂化学品、由油制成的燃料和食品以及培养细胞的方法。

在下文任何实施例中，使用的细胞任选地是具有II型脂肪酸生物合成途径的细胞，例如植物细胞、酵母细胞、微藻细胞(包括异养或专性异养微藻细胞)，其包括分类为绿藻门，共球藻纲，小球藻目或小球藻科的细胞，或使用合成生物学工具进行工程改造(即将II型脂肪酸生物合成的遗传机制移植到缺乏这类途径的生物体)以具有II型脂肪酸生物合成途径的细胞。使用具有II型途径的宿主细胞避免了外源酰基-ACP硫酯酶或其它ACP结合酶与I型细胞机制的多酶复合物之间不相互作用的可能性。在具体实施例中，细胞属于物种莫氏原壁菌、Prototheca krugani、Prototheca stagnora或左氏原壁菌或具有具有与SEQID NO:25至少65、70、75、80、85、90或95％核苷酸一致性的23SrRNA。通过在黑暗中培养或使用专性异养生物，所产生的细胞油的低叶绿素或其它着色剂较低。举例来说，在基本上不纯化的情况下，细胞油可以具有小于100、50、10、5、1、0.0.5ppm的叶绿素。

稳定的碳同位素值δ13C是相对于标准(例如PDB，来自南卡罗来纳的Peedee地层的Belemnite americana的化石骨架的硝酸甘油)¹³C/¹²C的比率的表达。油的稳定的碳同位素δ13C值(‰)可与所使用的原料的δ13C值相关。在一些实施例中，来源于产油生物体的油以异养方式基于来源于C4植物(如玉米或甘蔗)的糖生长。在一些实施例中，油的δ13C(‰)为-10至-17‰或-13至-16‰。

在下文论述的具体实施例和实例中，一种或多种脂肪酸合成基因(例如编码酰基-ACP硫酯酶、酮-酰基ACP合成酶、LPAAT、LPCAT、PDCT、DAG-CPT、FAE、硬脂酰基ACP去饱和酶或本文所述的其它物质)掺入微藻中。已经发现，对于某些微藻，植物脂肪酸合成基因产物在没有相应的植物酰基载体蛋白(ACP)的情况下是有功能的，即使在基因产物是需要ACP与官能基结合的酶，例如酰基-ACP硫酯酶时也为有功能的。因此，任选地，微藻细胞可利用这类基因制备所需的油而不共表达植物ACP基因。

对于包含外源基因或基因组合的重组细胞的各种实施例，考虑使用具有60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或100％核酸序列一致性的基因取代那些基因可以产生类似的结果，如可以取代编码具有60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、95.5％、96％、96.5％、97％、97.5％、98％、98.5％、99％或100％氨基酸序列一致性的蛋白质的基因。编码酰基转移酶的核酸编码具有与表5的进化枝1、进化枝2、进化枝3或进化枝4中所公开的酰基转移酶60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或100％、或至少60％、65％、70％、75％、80％、85％、90％、95％、98％、99％或100％氨基酸序列一致性的酰基转移酶。同样，对于新颖的调节元件，考虑用具有60％、70％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的核酸取代那些核酸可以是有效的。在各种实施例中，应当理解，功能不必需的序列(例如标记或插入的限制位点)在使用中通常可以省略，或者在比较基因、蛋白质和变体时忽略。

可使用所属领域中众所周知的技术将本文报导的新颖的基因和基因组合用于高等植物。举例来说，将外源性脂质代谢基因用于高等植物描述于美国专利6,028,247、5,850,022、5,639,790、5,455,167、5,512,482和5,298,421，其公开具有外源性酰基-ACP硫酯酶的高等植物。WO2009129582和WO1995027791公开在植物中克隆LPAAT。在WO 2013112578和WO2008/006171中教示高等植物中的FAD2消融和/或下调。在WO 2013112578和WO2008006171中教示高等植物中的SAD消融和/或下调。

新颖的酰基转移酶的表达在实例4、5、6和7中示出。寡瓣萼距花(Cupheapaucipetala)或火红萼距花(Cuphea ignea)LPAT的表达显著增加细胞油的C8:0和C10:0分数。另外，寡瓣萼距花或火红萼距花LPAAT的表达显著增加C8:0和C10:0脂肪酸在TAG的sn-2位置中的掺入。这公开于实例4中。

在宿主细胞中LPAT基因的表达增加C18:2水平并升高细胞油的sat-unsat-sat/sat-sat-sat(例如SOS/SSS)比率。举例来说，可可(Theobroma cacoa)LPAT2的表达驱动不饱和脂肪酸朝向sn-2位置转移并降低饱和脂肪酸在sn-2处的掺入。

公开对中链脂肪酸具有特异性的新颖的LPAAT、GPAT、DGAT、LPCAT和PLA2。在实例7中，公开LPAAT和DGAT的表达。

当本发明的酰基转移酶在宿主细胞中表达时，可以伴随表达一个或多个额外的外源基因。本发明的一实施例提供表达重组酰基转移酶并伴随表达一种或多种其它重组基因的宿主细胞。一种或多种另外的基因包括转化酶、脂肪酰基-ACP硫酯酶(FATA，FATB)、蜜二糖酶、酮脂酰合成酶(KASI、KASII、KASIII、KASIV)、抗生素选择性标记、如FLAG的标记和THIC。在实例4、5、6和7中，公开了编码LPAAT的核酸的共表达，所述LPAAT与编码转化酶、脂肪酰基-ACP硫酯酶、蜜二糖酶、酮脂酰合成酶、THIC的一种或多种外源基因共表达。

当本发明的酰基转移酶在宿主细胞中表达时，可能伴随消融或下调所述宿主细胞的内源基因，从而消除或降低宿主细胞的基因的表达。这可以通过使用同源重组技术或其它RNA抑制技术来实现。消融或下调的基因可以是宿主细胞中的任何基因。消融或下调的内源基因可为硬脂酰基ACP去饱和酶、脂肪酰基去饱和酶、脂肪酰基-ACP硫酯酶(FATA或FATB)、酮脂酰合成酶(KASI、KASII、KASIII或KAS IV)、或酰基转移酶(LPAAT、DGAT、GPAT、LPCAT)。当消融内源时，可以消融内源的一个、两个或更多个等位基因。在实例5中，公开了芸苔属LPAAT的表达，同时伴随消融内源性硬脂酰基ACP去饱和酶。在实例6中，表达了对中链脂肪酸具有特异性的LPAAT、GPAT、DGAT、LPCAT和PLA2，同时消除编码硬脂酰基ACP去饱和酶的基因。在实例7中，公开了内源性FAD2和发夹RNA的下调。在共同拥有的PCT/US2016/026265中，申请人公开了伴随的内源性LPAAT消融和外源性LPAAT表达。

在一个实施例中，酰基转移酶的表达改变由宿主生物体产生的油的脂肪酸谱和/或sn-2谱。表6、7、10、11、12、13、16、17、18、19、20、22、23和24中公开了由各种酰基转移酶的表达产生的脂肪酸谱和sn-2谱。本发明提供根据表6、7、10、11、12、13、16、17、18、19、20、22、23和24的具有变化的脂肪酸谱和变化的sn-2谱的宿主细胞。

如申请人共同拥有的PCT/US2016/026265中所描述，使用转录物分布发现响应于低氮条件调节表达的启动子。启动子适用于选择性表达各种基因并改变微生物油的脂肪酸组成。根据一实施例，存在包含异源启动子和基因的非天然构建体，其中所述启动子包含与SEQ ID NO:1-18的启动子中的任一种至少60％、65％、70％、75％、80％、85％、90％、95％、或100％的序列一致性并且所述基因在低氮对比高氮条件下差异表达。具体来说，莫氏原壁菌AMT02(SEQ ID NO:18)和AMT03启动子(SEQ ID NO:18)是用于控制外源基因表达的有用启动子。举例来说，可以将启动子置于亚油酸营养缺陷型中的FAD2基因前面，以在高氮条件下首先培养后，然后在低氮条件下培养来产生具有少于5、4、3、2或1％亚油酸的油。另外的启动子，特别是原壁菌属和小球藻属启动子在本申请的序列和说明书中描述。举例来说，在实例6、7、8和9中描述原壁菌属HXT1、SAD、LDH1和其它原壁菌属启动子。另外，小球藻属SAD、ACT和其它小球藻属启动子描述在实例6、7、8和9中。

在本发明的实施例中，表达一种或多种编码酰基转移酶和/或变体FATA的基因的产油细胞可产生具有至少20、40、60或70％的C8、C10、C12、C14、C16或C18脂肪酸的油。

本发明还提供，表达一种或多种编码酰基转移酶和/或变体FATA的基因的宿主细胞可产生富含油，为sat-unsat-sat油。这种类型的油包括SOS、POP、POS、SLS、PLO、PLO。sat-unsat-sat油按干细胞重量计占细胞油的至少30％、40％、50％、60％、65％、70％、75％、80％、85％、90％或95％。

本发明还提供，表达一种或多种编码酰基转移酶和/或变体FATA的基因的宿主细胞可产生三饱和油sat-sat-sat减少的油。这种类型的油包括PPP、PSS、PPS、SSS、SPS和PSP。sat-sat-sat油按摩尔分数或干细胞重量计占细胞油的小于50％、40％、30％、20％、15％、10％、8％、6％、5％、4％、3％、2％或1％。

本发明的宿主细胞可产生按细胞重量计25％、30％、40％、50％、60％、70％、80％、85％或约90％(±5％)油。任选地，所产生的油的DHA或EPA脂肪酸较低。举例来说，油可包含小于5％、2％或1％的DHA和/或EPA。

在本发明的其它实施例中，存在一种用于生产这些中的任一种的油、甘油三酯、脂肪酸或衍生物的方法，其包含转化具有本文所论述的任一种核酸的细胞。在另一实施例中，培养转化细胞以产生油，并任选地提取油。以这种方式提取的油可用于生产食品、油脂化学品或其它产品。

单独或呈组合形式的上文所论述的油适用于生产食品、燃料和化学品(包括塑料、泡沫、膜等)。油、来自油的甘油三酯、脂肪酸可以进行C-H活化、加氢氨基甲基化、甲氧基-碳酸化、臭氧分解、酶促转化、环氧化、甲基化、二聚化、硫醇化、复分解、加氢烷基化、内酯化或其它化学方法。

在提取油之后，可能剩下残余生物质，其可以用作燃料、动物饲料、或在纸、塑料或其它产品中的成分。举例来说，来自异养藻类的残余生物质可用于这类产品中。

实例

实例1：利用脂肪酸甲酯检测的脂肪酸分析

由干燥生物质制备脂质样品。将20-40mg干燥生物质再悬浮于2mL的于MeOH中的5％H₂SO₄中，并加入200μl含有适量内标物(C19:0)的甲苯。将混合物短暂超声处理以分散生物质，然后在70-75℃下加热3.5小时。加入2mL庚烷以萃取脂肪酸甲酯，然后加入2mL 6％K₂CO₃(水溶液)以中和酸。剧烈搅拌混合物，并将一部分上层转移到含有Na₂SO₄(无水)的小瓶中，以使用标准脂肪酸甲酯气相色谱火焰离子化检测(fatty acid methyl ester gaschromatography flame ionization detection；FAME GC/FID)方法进行气相色谱分析。通过此方法测定以下报道的脂肪酸谱。

实例2：区域特异性谱的分析

使用耦合到配备有APCI源的岛津(Shimadzu)LCMS 8030三重四极质谱仪上的岛津奈克塞拉(Nexera)超高效液相色谱系统进行LC/MS TAG分布分析，所述系统包括一个SIL-30AC自动取样器、两个LC-30AD泵、一个DGU-20A5在线脱气器以及一个CTO-20A柱恒温箱。使用在CID气体(氩气)压力被设定到230kPa的阳离子模式中在1428u/sec的扫描速度下的m/z350-1050的Q3扫描采集数据。APCI、脱溶剂管和加热块温度分别设定为300、250和200℃，雾化和干燥气体的流速分别为3.0L/min和5.0L/min，并且界面电压为4500V。将油样品溶解在二氯甲烷-甲醇(1:1)到5mg/mL的浓度，并将样品注射到保持在30℃下的岛津垫片组件XR-ODS III(2.0×200mm)。在0.48mL/min下的、历经27分钟的、从30％二氯甲烷-2-丙醇(1:1)/乙腈到51％二氯甲烷-2-丙醇(1:1)/乙腈的线性梯度用于色谱分离。

实例3：培养微藻

标准脂质生产条件：

将用牙签从源板刮取的细胞用于接种96孔块中的具有0.5mL EB03、0.5％葡萄糖、1X DAS2培养物的预接种培养物。使预接种培养物在Multitron振荡器中在28℃，900rpm下生长70-75小时。使用40μL预接种培养物接种具有0.46mL H29、4％葡萄糖、25mM柠檬酸盐pH5或100mM PIPESpH 7.3、1X DAS2(8％接种液)的种子培养物，并在Multitron振荡器中在28℃，900rpm下生长24-28小时。使用40μL种子培养物接种具有0.46mL H43、6％葡萄糖、25mM柠檬酸盐pH5、1X DAS2(8％接种液)的脂质生产培养物，并在Multitron振荡器中在28℃，900rpm下生长70-75小时。如实例1和2中所公开进行脂肪酸谱和脂质滴度分析。

50mL摇瓶型式

将利用接种环从源板刮取的细胞，或冷冻管中的细胞培养物用于接种50mL生物反应器管中具有10mL EB03、0.5％葡萄糖、1X DAS2培养物的预接种培养物。使预接种培养物在Kuhner振荡器中在28℃，200rpm下生长70-75小时。使用0.8mL预接种培养物接种具有10mL H29、4％葡萄糖、25mM柠檬酸盐pH 5或100mM PIPES pH 7.3、1X DAS2(8％接种液)的种子培养物，并在Kuhner振荡器中在28℃，200rpm下生长24-28小时。使用100μL种子培养物接种具有49.9mL H43、6％葡萄糖、25mM柠檬酸盐pH 5或100mM PIPES pH 7.3、1X DAS2(0.2％接种液)的脂质生产培养物，并在Kuhner振荡器中在28℃，200rpm下生长118-122小时。如实例1和2中所公开进行脂肪酸谱和脂质滴度分析。

EB03

H29

干燥化学品	最终
		组分	浓度(g/L)
K<sub>2</sub>HPO<sub>4</sub>(无水磷酸氢二钾)	0.25
		NaH<sub>2</sub>PO<sub>4</sub>(磷酸二氢钠)	0.18
MgSO<sub>4</sub>.7H<sub>2</sub>O(硫酸镁七水合物)	0.24
		柠檬酸单水合物	0.25
储备溶液
		组分	浓度(mL/L)
0.017M原料CaCl<sub>2</sub>.2H<sub>2</sub>O	10
		0.151M(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub>	52.2
100X C-Trace(2)	10
		消泡剂西格玛204	0.225

H43

干燥化学品	最终
		组分	浓度(g/L)
K2HPO4	0.25
		NaH2PO4	0.18
MgSO4 7H2O	0.24
		Citric acid H2O	0.25
储备溶液
		组分	浓度(mL/L)
0.017M原料CaCl22H2O	10
		100X C-Trace(2)	10
消泡剂西格玛204	0.225
		0.151M(NH4)2SO4	12.5

1000X DAS2

100X C-Trace(2)

干燥化学品	最终
		组分	浓度(g/L)
CuSO4-5H2O	0.011
		CoCl2-6H2O	0.081
H3BO3	0.33
		ZnSO4-7H2O	1.4
MnSO4-H2O	0.81
		Na2MoO4-2H2O	0.039
FeSO4-7H2O	0.11
		NiCl2-6H2O	0.013
柠檬酸单水合物	3.0

100X C-Trace(3)

干燥化学品	最终
		组分	浓度(g/L)
CuSO4-5H2O	0.011
		H3BO3	0.33
ZnSO4-7H2O	1.4
		MnSO4-H2O	0.81
Na2MoO4-2H2O	0.039
		FeSO4-7H2O	0.11
NiCl2-6H2O	0.013
		柠檬酸单水合物	3.0

实例4：通过度表达来自寡瓣萼距花、火红萼距花、CUPHEA PAINTERI和紫萼距花(CUPHEA HOOKERIANA)的异源LPAAT基因，从UTEX1435中测序的转录组中和工程改造的SN-2TAG区域特异性鉴定新的LPAAT基因.

对来自植物种子的溶血磷脂酰基转移酶(LPAAT)基因进行克隆并在来源于UTEX1435(莫氏原壁菌)的转基因菌株S6511中表达。异源LPAAT的表达增加C8:0和C10:0脂肪酸水平并显著增加在转基因菌株中的三酰甘油(TAG)的sn-2位置处C8:0和C10:0脂肪酸的掺入。

通过甘乃迪途径(Kennedy pathway)的三种ER居留酶-磷酸甘油酰基转移酶(GPAT)、LPAAT、和二酰甘油酰基转移酶(DGAT)的连续作用由各种链长酰基辅酶A和甘油-3-磷酸盐合成TAG。已知这些酰基转移酶的底物特异性决定了所得TAG的脂肪酸组成。LPAAT酰化溶血磷脂酸(LPA)的sn-2羟基以形成TAG的前体磷脂酸(PA)。在共同拥有的申请WO2013/158938、WO2015/051139和PCT/US2016/026265中，我们证实了来自椰(Cocos nucifera)的LPAAT的表达(CnLPAAT，寄存编号AAC49119；Knutzon等人，1995)。

菌株S6511表达来自紫萼距花(ChFATB2)的酰基-ACP硫酯酶(FATB2)基因，从而导致分别大约14％和28％的C8:0和C10:0脂肪酸积累。菌株S6511是根据以引用的方式并入本文中的共同拥有的WO2010/063031和WO2010/063032中公开的方法制备的菌株。简单来说，S6511为表达蔗糖转化酶的菌株和紫萼距花FATB2。构建体pSZ3101:6S::CrTUB2-ScSUC2-CvNR_a:PmAMT03-CpSAD1tp_trimmed:ChFATB2-CvNR_d::6S经工程改造到S3150中，所述S3150为经经典诱变以提高脂质产率的菌株。我们从表达出高水平C8:0和C10:0脂肪酸的种子中鉴定出新的C8:0特异性和C10:0-特异性LPAAT。在我们鉴定和克隆LPAAT后，我们在S6511中表达了LPAAT基因。

用于鉴定LPAAT的方法

从呈现升高水平的中链和其它特定脂肪酸(表4)的物种获得种子。

表4：成熟种子的脂肪酸谱.展示构成种子油的各种脂肪酸的百分比；丰富且罕见的脂肪酸物种以粗体指示。

简单来说，从干燥植物种子中提取RNA并提交用于使用Illumina Hiseq 2000平台进行配对末端测序。使用Trinity软件包将RNA序列读数汇编成对应的种子转录组。含LPAAT的cDNA重叠群通过使用BLAST挖掘转录组来鉴定与已知LPAAT具有同源性的序列，所述LPAAT先前经内部鉴定为CuPSR23 LPAAT2-1(参见WO2013/158938)。对于某些序列，使用Trinity组装高可信度、全长转录物。使用先前已知的全长LPAAT序列(经由NCBI可用)以及序列在Solazyme处衍生的先前已知的LPAAT的序列，使所有新的LPAAT的所得氨基酸序列进行系统发育分析。分析显示，新发现的LPPAAT的氨基酸序列与先前已知的LPAAT不相似。表5展示进化枝分析，其中根据邻接演算法聚类新颖LPAAT。发现这些形成如表5中所列的4种进化枝。

表5：LPAAT的进化枝分析

莫氏原壁菌中LPAAT的功能性

为了增加菌株S6511中的C8:0和C10:0脂肪酸水平，以及测试新鉴定LPAAT的功能性，我们鉴定了物种的转录组中的中链特异性LPAAT，所述物种在其油籽中展现出高水平的C8:0和C10:0脂肪酸，并将基因引入S6511中。选择与CuPSR23 LPAAT2-1，具体而言CpauLPAAT1、CigneaLPAAT1、ChookLPAAT1和CpaiLPAAT1共聚类的LPAAT以用于合成和测试。以密码子优化的形式合成CpauLPAAT1、CigneaLPAAT1、ChookLPAAT1和CpaiLPAAT1以反映UTEX1435密码子使用。通过用编码四种LPAAT基因之一的构建体转化菌株S6511产生转基因菌株。编码CpauLPAAT1的构建体pSZ3840作为实例显示，但是使用相同的方法产生剩余的三种构建体中的每一种。构建体pSZ3840可写成pLOOP::PmHXT1-ScarMEL1-CvNR:PmAMT3-CpauLPAAT1-CvNR::pLOOP。在图2中提供转化DNA的序列(pSZ3840)。构建体中分别来自5'-3'、BspQI、KpnI、SpeI、XhoI、EcoRI、SpeI、XhoI、SacI、BspQI的相关限制位点以小写，粗体和下划线表示。BspQI位点限定转化DNA的5'和3'末端。构建体的5'和3'末端的粗体小写序列代表来自UTEX 1435的基因组DNA，其通过同源重组靶向与pLOOP基因座的整合。沿5'到3'方向进行，选择标记盒具有驱动卡氏酵母(Saccharomyces carlsbergensis)MEL1(赋予基于蜜二糖生长的能力)和普通小球藻硝酸还原酶(NR)基因3'UTR的表达的莫氏原壁菌HXT1启动子。启动子由小写的加框文字表示。ScarMEL1的起始ATG和终止子TGA用粗体大写斜体表示，而编码区用小写斜体表示。3'UTR由小写下划线文字表示。含有来自寡瓣萼距花的密码子优化的CpauLPAAT1基因的第二盒由莫氏原壁菌AMT3启动子驱动并具有普通小球藻硝酸还原酶(NR)基因3'UTR。在此盒中，AMT3启动子由小写加框文字指示。CpauLPAAT1的起始ATG和终止子TGA用粗体大写斜体表示，而编码区用小写斜体表示。3'UTR由小写下划线文字表示。对最终构建体进行测序以确保正确的阅读框和靶向序列。

SEQ ID NO:19 pSZ3840/D2554转化构建体(CpauLPAAT1)

所有其它LPAAT构建体的序列除编码LPAAT之外与pSZ3840的序列完全相同。提供单独的具有侧接SpeI和XhoI限制性位点的LPAAT序列用于剩余的LPAAT构建体，如下所示。下文提供LPAAT蛋白的氨基酸序列。

SEQ ID NO:30 pSZ3841/D2555(CpaiLPAAT1)

SEQ ID NO:21 pSZ3842/D2556(CigneaLPAAT1)

SEQ ID NO:22 pSZ3844/D2557(ChookLPAAT1)

为了确定CpauLPAAT1、CigneaLPAAT1、ChookLPAAT1和CpaiLPAAT1基因对中链脂肪酸积累的影响，将含有密码子优化的CpauLPAAT1、CigneaLPAAT1、ChookLPAAT1和CpaiLPAAT1基因的上述构建体转化到菌株S6511中。将原代转化体克隆纯化并在pH 7.0下在标准脂质生产条件下生长(所有菌株需要在pH 7.0下生长以允许由pH调节的AMT3启动子驱动的LPAAT基因的最大表达)。由这些转化产生的一组代表性克隆得到的谱图如表6所示。

表6：pSZ3840(CpauLPAAT1)、pSZ3841(CpaiLPAAT1)、pSZ3842(CigneaLPAAT1)和pSZ3844(ChookLPAAT1)的转化体.表达LPAAT的转基因菌株的脂肪酸谱来源于寡瓣萼距花、C.painteri、火红萼距花和紫萼距花。

表6中的转化体显示在异源LPAAT的表达后，C8:0和C10:0脂肪酸的产量明显增加。为了确定异源LPAAT基因的表达是否影响sn-2位置处的脂肪酸的区域特异性，我们使用猪胰脂肪酶法分析了来自代表性D2554(CpauLPAAT1)、D2555(CpaiLPAAT1)、D2556(CigneaLPAAT1)和D2557(ChookLPAAT1)菌株的TAG。使细胞在一定条件下生长以使中链脂肪酸水平最大化并产生足够的生物量用于TAG分析。TAG和sn-2谱展示于表7中。

表7：在TAG的sn-2位置处C8:0和C10:0脂肪酸的包合物.将选择的转化体进行在sn-2位置处脂肪酸包涵体猪胰脂肪酶测定。显示三酰甘油(TAG)中的一般脂肪酸分布表明每种转化体的脂肪酸丰度。另外，展示sn-2特异性分布。以粗体和斜体突出显示的数字反映了与亲本S6511相比显著增加的所提及脂肪酸的包涵体。

表7

如表7中所公开，CpauLPAAT1和CigneaLPAAT1基因显示对C10:0脂肪酸的显著特异性。对比在没有异源LPAAT的S6511基础菌株中仅26.4％，D2554-20显示在sn-2位置39.0％的C10:0，证明在sn-2位置处C10:0包涵体增加1.5倍。对比S6511基础菌株中的26.4％，D2556-38显示在sn-2位置中36.2％的C10:0，表明在sn-2位置处C10:0包涵体增加1.4倍。尽管D2554-20和D2555-34菌株中C8:0水平略有增加，但绝大多数sn-2靶向为C10:0特异性的。类似地，CpaiLPAAT1和ChookLPAAT1显示出对C8:0脂肪酸的显著特异性。对比在没有异源LPAAT的S6511基础菌株中仅8.5％，D2555-34显示在sn-2位置22.3％的C8:0，证明在sn-2位置处C8:0包涵体增加2.6倍。对比8.5％，D2557-24显示在sn-2位置中29.1％的C8:0，证明在sn-2位置处C8:0包涵体增加3.4倍。我们教示CpauLPAAT1和CigneaLPAAT1为C10:0特异性LPAAT，并且CpaiLPAAT1和ChookLPAAT1为C8:0特异性LPAAT。Knutzon DS,Lardizabal KD,Nelsen JS,Bleibaum JL,Davies HM,Metz JG(1995)《克隆编码接受中链长度底物的1-酰基-sn-甘油-3-磷酸酯酰基转移酶的椰子内胚乳cDNA(Cloning of a coconut endospermcDNA encoding a 1-acyl-sn-glycerol-3-phosphate acyltransferase that acceptsmedium-chain-length substrates)》.《植物生理学(Plant Physiol)》109:999-1006

新颖LPAAT基因的氨基酸序列

SEQ ID NO:23 CpauLPAAT1

MAIPAAAVIFLFGLLFFTSGLIINLFQALCFVLVWPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMLGWVMGQHLGCLGSILSVAKKSTKFLPVLGWSMWFSEYLYIERSWAKDRTTLKSHIERLTDYPLPFWMVIFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDVTVAFPKTSPPPTLLNLFEGQSIVLHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHRTGSRPIKSLLVVISWVVVITFGALKFLQWSSWKGKAFSVIGLGIVTLLMHMLILSSQAERSSNPAKVAQAKLKTELSISKKATDKEN

SEQ ID NO:24 CprocLPAAT1

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPISKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWNKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTQTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDLTVAFPKTSPPPTLLNLFEGQSVVLHVHIKRHAMKDLPESDDEVAQWCRDKFVEKDALLDKHNAEDTFSGQELQHTGRRPIKSLLVVISWVVVIAFGALKFLQWSSWKGKAFSVIGLGIVTLLMHMLILSSQAERSKPAKVAQAKLKTELSISKTVTDKEN

SEQ ID NO:25 CprocLPAAT1b

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPISKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWNKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTQTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDLTVAFPKTSPPPTLLNLFEGQSVVLHVHIKRHAMKDLPESDDEVAQWCRDKFVEK

SEQ ID NO:26 CprocLPAAT2a

IVNLVQAVCFVLVRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNADDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAKIEGESSKTEMEKEK

SEQ ID NO:27 CprocLPAAT2b

IVNLVQAVCFVLVRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNADDTFSGQELQDTGRPIKSLLV

SEQ ID NO:28 CpaiLPAAT1

MAIPSAAVVFLFGLLFFTSGLIINLFQAFCFVLISPLSKNAYRRINRVFAELLPLEFLWLFHWCAGAKLKLFTDPETFRLMGKEHALVIINHKIELDWMVGWVLGQHLGCLGSILSVAKKSTKFLPVFGWSLWFSGYLFLERSWAKDKITLKSHIESLKDYPLPFWLIIFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAIYDVTVAFPKTSPPPTMLKLFEGQSVELHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNSEDTFSGQEVHHVGRPIKALLVVISWVVVIIFGALKFLLWSSLLSSWKGKAFSVIGLGIVAGIVTLLMHILILSSQAEGSNPVKAAPAKLKTELSSSKKVTNKEN

SEQ ID NO:29 ChookLPAAT1

MAIPSAAVVFLFGLLFFTSGLIINLFQAFCFVLISPLSKNAYRRINRVFAELLPLEFLWLFHWCAGAKLKLFTDPETFRLMGKEHALVIINHKIELDWMVGWVLGQHLGCLGSILSVAKKSTKFLPVFGWSLWFSEYLFLERSWAKDKITLKSHIESLKDYPLPFWLIIFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAIYDVTVAFPKTSPPPTMLKLFEGQSVELHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNSEDTFSGQEVHHVGRPIKALLVVISWVVVIIFGALKFLLWSSLLSSWKGKAFSVIGLGIVAGIVTLLMHILILSSQAEGSNPVKAAPAKLKTELSSSKKVTNKEN

SEQ ID NO:30 ChookLPAAT2a

LSLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFNLMGKEHALVVCNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSVPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPIKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKNEGESSKTEMEKEH

SEQ ID NO:31 ChookLPAAT2b

QIKVFTDHETFNLMGKEHALVVCNHKSDIDWLVGWVLAQWSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSVPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPIKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKLKKEGESSKPETDKQN

SEQ ID NO:32 ChookLPAAT3a

LSLLFFVSGLIVNLVQAVCFVLIRPLLKNTYRRINRVVAELLWLELVWLIDWWAGIKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSQMRSFVPAIYDVTVAIPKTSPPPTLLRMFKGQSSVLHVHLKRHLMNDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWATLVVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKPKNEGESSKTEMEKEH

SEQ ID NO:33 ChookLPAAT3b

LSLLFFVSGLIVNLVQAVCFVLIRPLLKNTYRRINRVVAELLWLELVWLIDWWAGIKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSQMRSFVPAIYDVTVAIPKTSPPPTLLRMFKGQSSVLHVHLKRHLMNDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPIKSLLVVISWAVLEIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKPETDKEN

SEQ ID NO:34 CigneaLPAAT1

MAIAAAAVIFLFGLLFFASGIIINLFQALCFVLIWPLSKNVYRRINRVFAELLLMDLLCLFHWWAGAKIKLFTDPETFRLMGMEHALVIMNHKTDLDWMVGWILGQHLGCLGSILSIAKKSTKFIPVLGWSVWFSEYLFLERSWAKDKSTLKSHMEKLKDYPLPFWLVIFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSCVSNMRSFVPAVYDVTVAFPKSSPPPTMLKLFEGQSIVLHVHIKRHALKDLPESDDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHHIGRPIKSLLVVIAWVVVIIFGALKFLQWSSLLSTWKGKAFSVIGLGIATLLMHMLILSSQAERSNPAKVAK

SEQ ID NO:35 CigneaLPAAT2

MAIAAAAVIFLFGLLFFASGIIINLFQALCFVLIWPLSKNVYRRINRVFAELLLMDLLCLFHWWAGAKIKLFTDPETFRLMGMEHALVIMNHKTDLDWMVGWILGQHLGCLGSILSIAKKSTKFIPVLGWSVWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPKNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSAPPTLLRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELHDIGRPVKSLLVVISWAMLVVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKQKNNEGESSKTEMEKEH

SEQ ID NO:36 DcLPAAT1

SGLVVNLIQAFFFVLVRPFSKNAYRKINRVVAELLWLELIWLIDWWAGVKIQLYTDPETFKLMGKEHALVICNHKSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDENTLKSGFQRLRDFPHAFWLALFVEGTRFTQAKLLAAQEYASSMGLPAPRNVLIPRTKGFVTAVTHMRPFVPAVYDVTLAIPKTSPPPTMLRLFKGQSSVVHIHLKRHLMSDLPKSDDSVAQWCKDAFVVKDNLLDKHKENDSFGDGVLQDTGRPLNSLVVVISWACLLIFGALKFFQWSSILSSWKGLAFSAVGLGIVTVLMQILIQFSQSERSNRPMPSKHAK

SEQ ID NO:37 DcLPAAT2

MAIPTAAYVVPLGAIFFFSGLLVNLIQAFFFITVWPLSKKTYIRINKVIVELLWLEFVWLADWWAGLKIEVYADAETFQLMGKEHALVICNHKSDIDWLVGWILAQRAGCLGSSFAVTKKSARYLPVVGWSIWFSGAIFLERSWEKDENTLKAGFQRLREFPCAFWLGLFVEGTRFTQAKLLAAQEYASTMGLPFPRNVLIPRTKGFIAAVNHMREFVPAIYDLTFAFPKDSPPPTMLRLLKGQPSVVHVHIKRHLMKDLPEKNEAVAQWCKDVFLVKDKLLDKHKDDGSFGDGELHEIGRPLKSLVVVTTWACLLILGTLKFLLWSSLLSSWKGLIFSATGLAVLTVLMQFLIQSTQSERSNPASLSK

SEQ ID NO:38 CcrLPAAT1a

LGLLFFISGLAVNLIQAVCFVFLRPLSKNTYRKINRVLAELLWLQLVWLVDWWAGVKIKVFADRESFNLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSSLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKEGLRRLKDFPRPFWLALFVEGTRFTQAKLLAAQEYATSQGLPVPRNVLIPRTKVHVHVKRHLMKELPETDEAVAQWCKDLFVEKDKLLDKHVAEDTFSDQPLQDIGRPVKPLLVVSSWACLVAYGALKFLQWSSLLSSWKGIAVSAVALAIVTILMQIMILFSQSERSIPAKVA

SEQ ID NO:39 CcrLPAAT1b

LGLLFFISGLAVNLIQAVCFVFLRPLSKNTYRKINRVLAELLWLQLVWLVDWWAGVKIKVFADRESFNLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSSLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKEGLRRLKDFPRPFWLALFVEGTRFTQAKLLAAQEYATSQGLPVPRNVLIPRTKGFVSAVSHMRSFVPAVYDMTVAIPKSSPSPTMLRLFKGQSSVVHVHVKRHLMKELPETDEAVAQWCKDLFVEKDKLLDKHVAEDTFSDQPLQDIGRPVKPLLVVSSWACLVAYGALKFLQWSSLLSSWKGIAVSAVALAIVTILMQIMILFSQSERSIPTKVA

SEQ ID NO:40 CcrLPAAT2a

MAIAAAAVVFLFGLLFFTSGLIINLAQAVCFVLIWPLSKNAYRRINRVFAELLLLELLWLFHWRAGAKLKLFADPETFRLFGKEHALVICNHRTDLDWMVGWVLGQHFGCLGSILSVAKKSTKFLPVLGWSMWFSEYLFLERSWAKDKSTLKSHTERLKDYPLPFWLGIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKLHVHIKRYAMKDLPESDDAVAQWCRDIYVEKDAFLDKHNAEDTFSGQEVHHIGRPIKSLLVVISWVVVIIFGALKFLRWSSLLSSWKGKAFSVIGLGIVTLLVNILILSSQAERSNPAKVAPAKLKTELSPSKKVTNKEN

SEQ ID NO:41 CcrLPAAT2b

MAIAAAAVVFLFGLLFFTSGLIINLAQAVCFVLIWPLSKNAYRRINRVFAELLLLELLWLFHWRAGAKLKLFADPETFRLFGKEHALVICNHRTDLDWMVGWVLGQHFGCLGSILSVAKKSTKFLPVLGWSMWFSEYLFLERSWAKDKSTLKSHTERLKDYPLPFWLGIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSMSHMRSFVPAVYDLTVAFPKTSPPPTLLKLFEGQSVVLHVHIKRYAMKDLPESDDAVAQWCRDIYVEKDAFLDKHNAEDTFSGQEVHHIGRPIKSLLVVISWVVVIIFGALKFLRWSSLLSSWKGKAFSVIGLGIVTLLVNILILSSQAERSNPAKVAPAKLKTELSPSKKVTNKEN

SEQ ID NO:42 BrLPAAT1a

AAAVIVPLGILFFISGLVVNLLQAICYVLIRPLSKNTYRKINRVVAETLWLELVWIVDWWAGVKIQVFADNETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVVLSWSCLLILGAMKFLHWSNLFSSWKGIAFSALGLGIITLCMQILIRSSQSERSTPAKVVPAKPKDNHNDSGSSSQTE

SEQ ID NO:43 BrLPAAT1b

AAAVIVPLGILFFISGLVVNLLQAVCYVLVRPMSKNTYRKINRVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVVLSWSCLLILGAMKFLHWSNLFSSWKGIAFSALGLGIITLCMQILIRSSQSERSTPAKVVPAKPKDNHNDSGSSSQTE

SEQ ID NO:44 BrLPAAT1c

MAIAAAVIVPLGLLFFISGLLMNLLQAICYVLVRPLSKNTYRKINRVVAETLWLELVWIVDWWAGVKIKVFADNETFSRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVVLSWSCLLILGAMKFLHWSNLFSSWKGIAFSALGLGIITLCMQILIRSSQSERSTPAKVVPAKPKDNHNDSGSSSQTE

SEQ ID NO:45 BjLPAAT1a

INLVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQKEQNIGRPIKSLAVSLIKTFPWLHPHQLTNIFVLFQVVVSWACLLTLGAMKFLHWSNLFSSWKGIALSAFGLGIITLCMQILIRSSQSERSTPAKVAPAKPK

SEQ ID NO:46 BjLPAAT1b

INLVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPEPEDEIAQWCRDQFVAKDALLDKHIAADTFPGQKEQNIGRPIKSLAVVVSWACLLTLGAMKFLHWSNLFSSWKGIALSAFGLGIITLCMQILIRSSQSERSTPAKVAPAKPK

SEQ ID NO:47 BjLPAAT1c

INLVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVVLSWSCLLILGAMKFLHWSNLFSSWKGIAFSALGLGIITLCMQILIRSSQSERSTPAKVVPAKPKDNHNDSGSSSQTE

SEQ ID NO:48 BjLPAAT1d

INLVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVSLS

SEQ ID NO:49 CcLPAAT1a

MAIGVAAIVVPLGLLFILSGLMVNLIQAICFILVRPLSKNMYRRVNRVVVELLWLELIWLIDWWGGVKVDVYADSETFQSLGKEHALVVSNHRSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYVFLERSWAKDESTLKSGLRRLKDFPRPFWLALFVEGTRFTQAKLLAAREYAASTGLPIPRNVLIPRTKGFVSAVSNMRSFVPAIYDVTVAIPKTQPSPTMLRIFNRQPSVVHVHIKRHSMNQLPQTDEGVGQWCKDIFVAKDALLDRHLAE

SEQ ID NO:50 CcLPAAT1b

MAIGVAAIVVPLGLLFILSGLMVNLIQAICFILVRPLSKNMYRRVNRVVVELLWLELIWLIDWWGGVKVDVYADSETFQSLGKEHALVVSNHRSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYVFLERSWAKDESTLKSGLRRLKDFPRPFWLALFVEGTRFTQAKLLAAREYAASTGLPIPRNVLIPRTKGFVSAVSNMRSFVPAIYDVTVAIPKTQPSPTMLRIFNRQPSVVHVHIKRHSMNQLPQTDEGVAQWCKDIFVAKDALLDRHLAEGKFDEKEFKRIRRPIKSLLVISSWSFLLMFGVFKFLKWSALLSTWKGVAVSTTVLLLVTVVMYMFILFSQSERSSPRKVAPSGPENG

SEQ ID NO:51 UcLPAAT1a

MAIGVAAIVVPLGLLFILSGLIINLIQAICFILVRPLSKNMYRKVNRVVVELLWLELIWLIDWWGGVKVDVYADSETFQSLGKEHALVVSNHRSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYVFLERSWAKDESTLKSGLQRLKDFPRPFWLALFVEGTRFTQAKLLAAQEYAASTGLPIPRNVLIPRTKGFVSAVSNMRSFVPAIYDVTVAIPKTQPSPTMLRIFNRQPSVVHVHIKRHSMNQLPQTDEGVAQWCKDIFVAKDALLDRHLAEGKFDEKEFKLIRRPIKSLLVISSWSFLLMFGVFKFLKWSALLSTWKGVAVSTAVLLLVTVVMYMFILFSQSERSSPRKVAPIGPENG

SEQ ID NO:52 UcLPAAT1b

MAIGVAAIVVPLGLLFILSGLIINLIQAICFILVRPLSKNMYRKVNRVVVELLWLELIWLIDWWGGVKVDVYADSETFQSLGKEHALVVSNHRSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYVFLERSWAKDESTLKSGLQRLKDFPRPFWLALFVEGTRFTQAKLLAAQEYAASTGLPIPRNVLIPRTKGFVSAVSNMRSFVPAIYDVTVAIPKTQPSPTMLRIFNRQPSVVHVHIKRHSMNQLPQTDEGVAQWCKDIFVAKDALLDRHLAE

SEQ ID NO:53 LdLPAAT1

SLLFFMSGLVVNFIQAVFYVLVRPISKNTYRRINTLVAELLWLELVWVIDWWAGVKVQLYTDTESFRLMGKEHALLICNHRSDIDWLIGWVLAQRCGCLSSSIAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDENTLKSGLQRLNDFPKPFWLALFVEGTRFTKAKLLAAQEYAASAGLPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDLTVAIPKTTEQPTMLRLFRGKSSVVHVHLKRHLMKDLPKTDDGVAQWCKDQFISKDALLDKHVAEDTFSGLEVQDIGRPMKSLVVVVSWMCLLCLGLVKFLQWSALLSSWKGMMITTFVLGIVTVLMHILIRSSQSEHSTPAK

SEQ ID NO:54 CaequLPAAT1a

QRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTETEKEN

SEQ ID NO:55 CaequLPAAT1b

DWWAGVKIKVFTDHETLSLMGKEHALVISNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLV

SEQ ID NO:56 CaequLPAAT1c

DWWAGVKIKVFTDHETLSLMGKEHALVISNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTETEKEN

SEQ ID NO:57 CaequLPAAT1d

QRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLV

SEQ ID NO:58 CglutLPAAT1a

LSLLFFVSGLFVNLVQAVCFVLIRPFSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETLSLMGKEHALVISNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTETEKEN

SEQ ID NO:59 CglutLPAAT1b

QAVCFVLIRPFSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETLSLMGKEHALVISNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLKRLKDYPLPFWLALFVEGTRFTQAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKMSTPPTMLRIFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPVKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTETEKEN

SEQ ID NO:60 CprLPAAT1

MAIAAAAVVFLFGLLFFTSGLIINLAQAVCFVLIWPLSKNAYRRINRVFAELLLLELLWLFHWRAGAKLKLFADPETFRLFGKEHALVICNHRTDLDWMVGWVLGQHFGCLGSILSVAKKSTKFLPVLGWSMWFSEYLFLERSWAKDKSTLKSHTERLKDYPLPFWLGIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSMSHMRSFVPAVYDLTVAFPKTSPPPTLLKLFEGQSVVLHVHIKRYAMKDLPESDDAVAQWCRDIYVEKDAFLDKHNAEDTFSGQEVHHIGRPIKSLLVVISWVVVIIFGALKFLRWSSLLSSWKGKAFSVIGLGIVTLLVNILILSSQAERSNPAKVVPAKLKTELSPSKKVTNKEN

SEQ ID NO:61 ChsLPAAT1

MAIPSAAVVFLFGLLFFASGLIINLVQAVCFVLIWPLSKNTCRRINIVFQDMLLSELLWLFHWRAGAKLKFFTDPETYRHMGKEHALVITNHRTDLDWMIGWVLGEHLGCLGSILSVVKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWFGIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAVYETTMTFPKTSPPPTLLKLFEGQPLVLHIHMKRHAMKDIPESDDAVAQWCRDKFVEKDALLDKHNAEDTFGGLEVHIGRSIKSLMVVICWVVVIIFGALKFLQWSSLLSSWKGIAFIGIGLGIVNLLVHVLILSSQAERSAPTKVAPAKLKTKLLSSKKITNKEN

SEQ ID NO:62 ChsLPAAT2

MAIPSAAVVFLFGLLFFASGLIINLVQAVCFVLIWPLSKNTCRRINIVFQDMLLSELLWLFHWRAGAKLKFFTDPETYRHMGKEHALVITNHRTDLDWMIGWVLGEHLGCLGSILSVVKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWFGIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPIKSLVVVISWAALVVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKPKREGESSKTEMDKEN

SEQ ID NO:63 CcalcLPAAT1a

MAIPAAAVVFLFGLLFFPSGLIINLFQAVCFVLIWPFSRNTCRRINIVFQEMLLSELLWLFHWRAGAKLKLFADPETYRHMGKEHALLITNHRTDLDWMIGWALGQHLGCLGSILSVVKKSTKFLPSHIERLEDFPQPFWMAIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYETTMTFPKTSPPPTLLKLFEGQPIVLHVHMKRHAMKDIPESDEAVAQWCRDKFVEKDSLLDKHNAGDTFSCQEIHIGRPIKSLMVVISWVVVIIFGALKFLQWSSLLSSWKGIAFSGIGLGIVTLLVHILILSSQAERSTPAKVAPAKLKTELSSSTKVTNKEN

SEQ ID NO:64 CcalcLPAAT1b

MAIPAAAVVFLFGLLFFPSGLIINLFQAVCFVLIWPFSRNTCRRINIVFQEMLLSELLWLFHWRAGAKLKLFADPETYRHMGKEHALLITNHRTDLDWMIGWALGQHLGCLGSILSVVKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWMAIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYETTMTFPKTSPPPTLLKLFEGQPIVLHVHMKRHAMKDIPESDEAVAQWCRDKFVEKDSLLDKHNAGDTFSCQEIHIGRPIKSLMVVISWVVVIIFGALKFLQWSSLLSSWKGIAFSGIGLGIVTLLVHILILSSQAERSTPAKVAPAKLKTELSSSTKVTNKEN

SEQ ID NO:65 CcalcLPAAT2

LSLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFRLMGTEHALVISNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDIGRPIKSLVVVISWAALVVFGAVKFLQWSSLLSSWKGLAFSGIALGIITLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTETDKEN

SEQ ID NO:66 ChtLPAAT1a

MAIPAAAVIFLFSILFFASGLIINLVQAVCFVLIWPLSKNTCRRINLVFQEMLLSELLGLFHWRAGAKLKLYTDPETYPLLGKEHALLMINHRTDLDWMIGWVLGQHLGCLGSILSVVKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWMAIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSTVSHMRSFVPAVYDTTLTFPKTSPPPTLLNLFAGQPIVLHIHIKRHAMKDIPESDDAVAQWCRDKFVEKDALLDKHNAEDAFSDQEFPISRSIKSLMVVISWVMVIIFGALKFLQWSSLLSSWKGKAFSVIAVGIVTLLMHMSILSSQAERSNPAKVALPKLKTELPSSKKVLNKEN

SEQ ID NO:67 ChtLPAAT1b

MAIPAAAVIFLFSILFFASGLIINLVQAVCFVLIWPLSKNTCRRINLVFQEMLLSELLGLFHWRAGAKLKLYTDPETYPLLGKEHALLMINHRTDLDWMIGWVLGQHLGCLGSILSVVKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWMAIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSTVSHMRSFVPAVYDTTLTFPKTSPPPTLLNLFAGQPIVLHIHIKRHAMKDIPESDDAVAQWCRDKFVEKDALLDKHNAEDAFSDQEFPISRSIKSLMVVISWVMVIIFGALKFLQWSSLLSSWKGIAFSGIGLGIVTLLMHILILSSQAERSTPAKVAQAKVKTELPSSTKVTNKGN

SEQ ID NO:68 CwLPAAT1

MAIPAAAVIFLFGILFFASGLIINLVQAVCFVLIWPLSKNTCRRINLVFQEMLLSELLWLFHWRAGAELKLFTDPETYRLLGKEHALVMTNHRTDLDWMIGWVTGQHLGCLGSILSIAKKSTKFLPVLGWSMWFSEYLFLERNWAKDKSTFKSHIERLEDFPQPFWMAIFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVCHMRSFVPAVYDTTLTFPKNSPPPTLLNLFAGQPIVLHIHIKRHAMKDMPKSDDAVAQWCRDKFVKKDALLDKHNTEDTFSDQEFPIGRPIKSLMVVISWVVVIIFGTLKFLQWSSLLSSWKGIAFSGIGLGIVTLLVHILILSSQAERSTPPKVAPAKLKTELSSTTKVINKGN

SEQ ID NO:69 CwLPAAT2b

LGLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRLNRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVDALLDKHNADDTFSGQELHDIGRPIKSLLVVISWAVLVVFGAVKFLQWSSLLSSWKGIAFSGIGLGIVTLLVHILILSSQAERSTSAKVAQAKVKTELSSSKKVKNKGN

SEQ ID NO:70 CwLPAAT2a

LGLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRLNRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDVLLDKHNAEDTFSGQELQDIGRPVKSLLVVISWTLLVIFGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKMETDKEN

SEQ ID NO:71 CgLPAAT1a

LAGWMGSSSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASLGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKPKNEGESSKAEMEKEK

SEQ ID NO:72 CgLPAAT1b

LAGWMGSSSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASLGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVRCFLVLSLIYLNGIMLKLRGPCLQVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKPKNEGESSKAEMEKEK

SEQ ID NO:73 CgLPAAT1c

LAGWMGSSSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASLGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVTSWAVLVISGAVKFLQWSSLLSSWKGLAFSGIGLGIVTLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTEKDKEN

SEQ ID NO:74 CpalLPAAT1

LGLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETLSLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDENTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYATSSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGVGLGIITLLMHILILFSQSERSTPAKVAPAKPKKDGESSKTEIEKEN

SEQ ID NO:75 CaLPAAT1

MAIAAAAVIVPVSLLFFVSGLIVNLVQAVCFVLIRPLFKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLLRMFKGQSSVLHVHLKRHQMNDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLIVISWAVLVVFGAVKFLQWSSLLSSWKGLAFSGIGLGVITLLMHILILFSQSERSTPAKVAPAKPKIEGESSKTEMEKEH

SEQ ID NO:76 CaLPAAT3

MTIASAAVVFLFGILLFTSGLIINLFQAFCSVLVWPLSKNAYRRINRVFAEFLPLEFLWLFHWWAGAKLKLFTDPETFRLMGKEHALVIINHKIELDWMVGWVLGQHLGCLGSILSVAKKSTKFLPVFGWSLWFSEYLFLERNWAKDKKTLKSHIERLKDYPLPFWLIIFVEGTRFTRTKLLAAQQYAASAGLPVPRNVLIPHTKGFVSSVSHMRSFVPAIYDVTVAFPKTSPPPTMLKLFEGHFVELHVHIKRHAMKDLPESEDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHHVGRPIKSLLVVISWVVVIIFGALKFLQWSSLLSSWKGIAFSVIGLGTVALLMQILILSSQAERSIPAKETPANLKTELSSSKKVTNKEN

SEQ ID NO:77 SalLPAAT1

MAIGAAAIVVPLGLLFMLSGLMVNLIQAICFILVRPLSKNMYRRVNRVVVELLWLELIWLIDWWGGVKVDVYADSETFQSLGKEHALVVSNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYVFLERSWAKDESTLKSGLQRLKDFPRPFWLALFVEGTRFTQAKLLAAQEYAASTGLPIPRNVLIPRTKGFVSAVSNMRSFVPAIYDVTVAIPKTQPSPTMLRIFNRQPSVVHVRIKRHSMNQLPPTDEGVAQWCKDIFVAKDALLDRHLAEGKFDEKEFKRIRRPIKSLLVISSWSFLLLFGVFKFLKWSALLSTWKGVAVSTAVLLLVTVVMYMFILFSQSERSSPRKVAPSGPENG

SEQ ID NO:78 CleptLPAAT1

MAIPAAVVIFLFGLLFFSSGLIINLFQALCFVLIWPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVNHMRSFVPAVYDLTVAFPKTSPPPTLLNLFEGQSVVLHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNAEDTFSSQEVHHTGSRPIKSLLVVISWVVVITFGALKFLQWSSWKGKAFSVIGLGIVTLLMHMLILSSQAERSKPAKVTQAKLKTELSISKKVTDKEN

SEQ ID NO:79 ClopLPAAT1

MAIAAAAVIFLFGLLFFASGLIINLFQALCFVLIRPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETLRLMGKEHALIIINHMTELDWMVGWVMGQHFGCLGSIISVAKKSTKFLPVLGWSMWFSEYLYLERSWAKDKSTLKSHIERLKDYPLPFWLVIFVEGTRFTRTKLLAAQEYAASSGLPVPRNVLIPRTKGFVSCVNHMRSFVPAVYDVTVAFPKTSPQPTLLNLFEGRSIVLHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHHTGRRPIKSLLVVMSWVVVTTFGALKFLQWSSWKGKAFSVIGLGIVTLLMHVLILSSQAERSNPAKVVQAELNTELSISKKVTNKGN

SEQ ID NO:80 CcrasLPAAT1a

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAK

SEQ ID NO:81 CcrasLPAAT1b

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVRCFLVLSLIYLNGIILKLCGLCLQVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAK

SEQ ID NO:82 CcrasLPAAT1c

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAKMEGESSKTEMEMEK

SEQ ID NO:83 CcrasLPAAT1d

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVRCFLVLSLIYLNGIILKLCGLCLQVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAKMEGESSKTEMEMEK

SEQ ID NO:84 CkoeLPAAT1

MAIAAAPVIFLFGLLFFASGLIINLFQAICFVLIWPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVITNHKIDLDWMIGWILGQHFGCLGSVISIAKKSTKFLPIFGWSLWFSEYLFLERNWAKDKRTLKSHIERMKDYPLPLWLILFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQETGRPIKSLLVVISWAVLEVYGAVKFLQWSSLLSSWKGLAFSGIGLGLITLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTEMEKEK

SEQ ID NO:85 CkoeLPAAT2

MHVLLEMVTFRFSSFFVFDNVQALCFVLIWPLSKSAYRKINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVITNHKIDLDWMIGWILGQHFGCLGSVISIAKKSTKFLPIFGWSLWFSEYLFLERNWAKDKRTLKSHIERMKDYPLPLWLILFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAVYDVTVAFPKTSPPPTMLSLFEGQSVVLHVHIKRHAMKDLPDSDDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHHVGRPIKSLLVVISWMVVIIFGALKFLQWSSLLSSWKGKAFSAIGLGIATLLMHVLVVFSQADRSNPAKVPPAKLNTELSSSKKVTNKEN

实例5：表达LPAAT以改善莫氏原壁菌的SN-2选择性

在实例中，我们公开了基因工程改造的莫氏原壁菌菌株，其中我们已经改性脂肪酸和三酰甘油生物合成以最大化硬脂酰基-油酰基-硬脂酰基(SOS)TAG的积累，并将三饱和TAG的产量降到最低。来自这些菌株的油类似于称为“结构脂肪”的植物种子油，其具有高比例的饱和-油酸酯-饱和TAG和低水平的三饱和化物。这些结构脂肪(通常称为“黄油”)在室温下通常是固体，但在35-40℃之间急剧熔化。

具有高SOS和低三饱和化物的菌株通过三次连续的转化获得，从S5100开始，所述S5100为莫氏原壁菌的野生型分离株-S376的经典改善的衍生物(改善以提高脂质滴度)。用构建体转化S5100，其中PmKASII-1的表达增加并且消融了SAD2-1等位基因。所得菌株S5780相对于S5100产生具有增加的C18:0和较低的C16:0含量的油。根据共同拥有的申请WO2013/158938中公开和如下所述的方法制备S5780。通过用过量表达来自山竹(GarmFATA1)的C18:0特异性FATA1硫酯酶基因的构建体转化S5780进一步增加C18:0水平，产生菌株S6573。S6573在共同拥有的申请WO2015/051319中公开。最后，通过度表达来自甘蓝型油菜、可可、Garcinia hombororiana或印度藤黄的编码LPAAT的基因减少S6573中三饱和TAG的积累，如下所述。

用于S5100中的SAD2基因剔除和PmKASII-1过量表达以产生S5780的构建体

从SAD2-1消融、PmKASII过度表达构建体pSZ2624转化DNA的序列在下文展示。构建体写成：pSZ2624:SAD2-1vD::PmKASII-1tp_PmKASII-1_FLAG-CvNR:CpACT-AtTHIC-CpEF1a::SAD2-1vE相关限制位点以小写粗体指示，并且来自5'-3'PmeI、SpeI、AscI、ClaI、SacI、AvrII、EcoRV、AflII、KpnI、XbaI、MfeI、BamHI、BspQI和PmeI。在构建体的5'和3'侧接序列处带下划线的序列代表来自莫氏原壁菌的基因组DNA，其能够在SAD2-1基因座处经由同源重组靶向整合转化DNA。SAD2-1 5'整合侧接序列含有内源性SAD2-1启动子，能够实现PmKASII基因的原位活化。沿5'到3'方向进行，编码PmKASII质粒靶向序列的区域由小写、带下划线的斜体表示。编码成熟PmKASII多肽的序列用小写斜体表示，而3xFLAG抗原决定基编码序列用粗体斜体表示。PmKASII-FLAG的起始ATG和终止子TGA用大写斜体表示。普通小球藻硝酸还原酶(CvNR)基因的3'UTR由小的大写字母表示。两个间隔区由小写文字表示。驱动AtTHIC基因表达的CpACT启动子(编码4-氨基-5-羟甲基-2-甲基嘧啶合成酶活性，从而允许菌株在不存在外源硫胺素的情况下生长)由小写加框文字表示。AtTHIC的起始ATG和终止子TGA用大写斜体表示，而编码区用小写斜体表示。原始小球藻EF1a(CpEF1a)基因的3'UTR由小的大写字母表示。THIC作为选择标记的用途在共同拥有的申请WO2011/150410和WO2013/150411中描述。

SEQ ID NO:86转化DNA的pSZ2624核苷酸序列

构建体D1683(pSZ2624)转化到S5100中。将原代转化体克隆纯化并在pH 5下在标准脂质生产条件下生长。通过DNA印迹分析验证在SAD2-1基因座处pSZ2624的整合。在50-mL摇瓶中分析主要菌株的脂肪酸谱和脂质滴度(表8)。同时发生的SAD2-1的消融和PmKASII的过度表达(由SAD2-1启动子原位驱动)导致C18:0水平高达26.1％。C16:0积累从S5100中的15.3％减少到来源于D1683的菌株的≤6％，表明PmKASII-1过度表达促进C16:0延长至C18:0。选择S5780进行进一步开发，因为它具有相对于S5100亲本的最高脂质滴度。

表8.相比于S5100亲本，SAD2-1消融，PmKASII-1过度表达来源于D1683-1的菌株的脂肪酸谱.

我们公开可与SAD2基因剔除和KASII过度表达结合使用的提高C18:0水平的额外方法。之前我们描述了来自甘蓝型油菜(BnFATA)(共同拥有的申请WO2012/106560)、山竹(GarmFATA1)(共同拥有的申请WO2015/051319)和可可(TcFATA)(共同拥有的申请WO2013/158938)的酰基-ACP硫酯酶，其具有对C18:0-ACP的裂解的特异性，并且我们观测到平均C18:0水平在我们用原始小球藻SAD1转运肽(CpSAD1tp)置换了天然BnFATA转运肽的菌株中较高。制备DNA构建体用于表达编码与预测的GarmFATA1成熟多肽和FLAG标签序列融合的CpSAD1tp的嵌合基因。

在下文展示来自GarmFATA1表达构建体pSZ3204的转化DNA的序列。构建体写成pSZ3204:6SA::CrTUB2-ScSUC2-CvNR:PmSAD2-2-CpSAD1tp_GarmFATA1_FLAG-CvNR::6SB。相关限制位点以小写、粗体表示，并且来自5'-3'BspQI、KpnI、XbaI、MfeI、BamHI、AvrII、EcoRV、SpeI、AscI、ClaI、AflII、SacI和BspQI。在构建体的5'和3'侧接序列处带下划线的序列代表来自莫氏原壁菌的基因组DNA，其能够在6S基因座处经由同源重组靶向整合转化DNA。沿5'到3'方向进行，CrTUB2启动子由小写、加框文字表示，所述启动子驱动酿酒酵母SUC2(ScSUC2)基因的表达，从而使菌株利用外源蔗糖。ScSUC2的起始ATG和终止子TGA用大写斜体表示，而编码区用小写斜体表示。CvNR基因的3'UTR用小的大写字母表示。间隔区由小写文字表示。驱动嵌合CpSAD1tp_GarmFATA1_FLAG基因表达的莫氏原壁菌SAD2-2(PmSAD2-2)启动子用小写、加框文字表示。引发ATG和终止子TGA用大写斜体表示；编码CpSAD1tp的序列用小写、带下划线的斜体表示；编码GarmFATA1成熟多肽的序列用小写斜体表示；并且3X FLAG抗原决定基标记用大写、粗体斜体表示。第二CvNR 3'UTR由小的大写字母表示。

SEQ ID NO:87 pSZ3204

将构建体D1940(pSZ3204)转化到S5780亲本菌株中。将原代转化体克隆纯化并在pH 5下在标准脂质生产条件下生长。通过DNA印迹分析验证在6S基因座处pSZ3204的整合。在50-mL摇瓶中分析主要菌株的脂肪酸谱和脂质滴度(表9)。GarmFATA1的过度表达(由SAD2-2启动子驱动)导致C18:0水平高达54.3％。来源于D1940和S5780亲本的菌株中的C16:0水平相当。选择S6573进行进一步开发，因为它具有>50％C18:0的菌株的最高脂质滴度。

表9.过度表达来源于D1940原代转化体的稳定菌株的GarmFATA1的脂肪酸谱.

溶血磷脂酸乙酰基转移酶(LPAAT)负责将酰基转移到甘油主链上的sn-2位置。我们在此公开，我们可以通过过度表达异源LPAAT基因来减少在我们的高SOS菌株中过量的三饱和化物的积累，所述异源LPAAT基因在区分饱和脂肪酸方面优于内源酰基转移酶。下文公开来自甘蓝型油菜、可可、Garcinia hombroriana和印度藤黄的LPAT2同系物的表达和其对高C18:0S6573菌株中的三饱和TAG的形成的影响。

下文展示来自BnLPAT2(Bn1.13)表达构建体pSZ4198的转化DNA的序列。构建体写成pSZ4198:PLOOP::PmHXT1-ScarMEL1-CvNR:PmSAD2-2v2-BnLPAT2(Bn1.13)-CvNR::PLOOP。相关限制位点以小写、粗体表示，并且来自5'-3'BspQI、KpnI、SpeI、SnaBI、EcoRI、SpeI、ClaI、BglII、AflII、HindIII、AflII、SacI和BspQI。在构建体的5'和3'侧接序列处带下划线的序列代表来自莫氏原壁菌的基因组DNA，其能够在PLOOP基因座处经由同源重组靶向整合转化DNA。沿5'到3'方向进行，PmHXT1启动子由小写、加框文字表示，所述启动子驱动卡尔斯伯酵母MEL1(ScarMEL1)基因的表达，从而使菌株利用外源蜜二糖。ScarMEL1的起始ATG和终止子TGA用大写斜体表示，而编码区用小写斜体表示。CvNR基因的3'UTR用小的大写字母表示。驱动BnLPAT2(Bn1.13)基因的表达的莫氏原壁菌SAD2-2v2启动子由小写加框文字表示。起始ATG和终止子TGA由大写斜体表示；编码BnLPAT2(Bn1.13)的序列由小写带下划线的斜体表示。第二CvNR 3'UTR由小的大写字母表示。甘蓝型油菜LPAAT2(BN1.13)序列来自基因银行寄存号GU045434。

SEQ ID NO:88：来自pSZ4198的转化DNA的核苷酸序列

用以测试来自甘蓝型油菜、可可、Garcinia hombroriana和印度藤黄的LPAAT的活性的额外转化构建体含有与pSZ4198相同的可选标记、限制位点、启动子和3'UTR元件。下文展示BnLPAT2(Bn1.5)、TcLPAT2、GhomLPAT2A、GhomLPAT2B、GhomLPAT2C、GindLPAT2A、GindLPAT2B和GindLPAT2C的编码序列。在各种情况下，起始ATG和终止子TGA由大写斜体表示；编码LPAT2同系物的序列由小写斜体表示。甘蓝型油菜LPAAT2(BN1.13)序列来自基因银行寄存号GU045435。可可LPAAT2序列来自cocoaGenDB数据库。

SEQ ID NO:89 BnLPAT2(1.5)编码序列的核苷酸序列，用于来自pSZ4202的转化DNA

SEQ ID NO:90 TcLPAT2编码序列的核苷酸序列，用于来自pSZ4206的转化DNA

SEQ ID NO:91 GhomLPAT2A编码序列的核苷酸序列，用于来自pSZ4412的转化.

SEQ ID NO:92 GhomLPAT2B编码序列的核苷酸序列，用于来自pSZ4413的转化.

SEQ ID NO:93 GhomLPAT2C编码序列的核苷酸序列，用于来自pSZ4414的转化.

SEQ ID NO:94 GindPAT2A编码序列的核苷酸序列，用于来自pSZ4415的转化DNA.

SEQ ID NO:95 GindPAT2B编码序列的核苷酸序列，用于来自pSZ4416的转化DNA

SEQ ID NO:96 GindPAT2C编码序列的核苷酸序列，用于来自pSZ4417的转化DNA.

将分别来源于pSZ4198、pSZ4202、pSZ4206、pSZ4412、pSZ4413、pSZ4414、pSZ4415、pSZ4416和pSZ4417的构建体D2971、D2973、D2975、D3219、D3221、D3223、D3225、D3227和D3229转化到S6573亲本菌株中。原代转化体的脂肪酸谱展示于表10中。还展示通过LC/MS多重响应测量测定SOS/SSS比率。当表达D2971、D2973、D2975、D3221、D3223和D3227构建体时，相比于菌株中的S6573亲本，LPAT2基因的表达对C16:0或C18:0积累不具有可辨别的影响，但C18:2水平增加1-2％。LPAT2基因的表达增加C18:2并且升高SOS/SSS的比率，表明三饱和TAG的积累减少。

表10.D2971、D2973、D2975、D3219、D3221、D3223、D3225、D3227和D3229原代转化体的脂肪酸谱和SOS/SSS比率.

表11呈现相对于S6573亲本由D2971、D2973、D2975、D3221、D3223和D3227原代转化体产生的脂质的TAG组成。LPAT2表达菌株中的SOS水平等于或略高于S6573对照物中的SOS水平。在表达异源LPAT2基因的所有菌株中，三饱和化物下降高达53％，并且总Sat-Unsat-Sat水平提高。在LPAT2基因中，表达可可LPAT2同系物的菌株在其TAG谱中显示出最大的改善)。

表11.相对于S6573亲本，D2971、D2973、D2975、D3221、D3223和D3227原代转化体的TAG组成.

我们分析了由D2975-33产生的稳定品系的50ml摇瓶培养物的脂肪酸谱、TAG谱和脂质滴度。菌株与S6573对照物之间的C18:0和C16:0水平相当，并且脂质滴度在亲本菌株滴度的75-105％范围内(表12)。在TcLPAT2表达菌株中，C18:2水平增加了超过2％。

表12.由D2975-33制得的TcLPAT2表达稳定品系的脂肪酸谱

在图1中比较S6573和S7815的TAG谱。LPAT2表达菌株中的SOS水平高于S6573对照物。三饱和化物从S6573中的10.2％减少到S7815中的5.6％。S7815中总sat-unsat-sat水平的显著提高来自硬脂酸酯-亚油酸酯-硬脂酸酯(SLS)的4％增加和棕榈酸酯-亚油酸酯-硬脂酸酯(PLS)的1.5％增加，与所述菌株的增加的C18:2含量一致。这些结果表明可可LPAT2减少在sn-2位置处饱和脂肪酸的掺入。

在高密度发酵中比较S7815对比S6573亲本菌株的性能。在发酵的两个时间点的每种菌株的脂肪酸谱展示在表13中。所述菌株具有与主要脂肪酸极相似的组成，具有5.5-5.7％C16:0、56.4-56.8％C18:0和27.2-28.6％C18:1。如在摇瓶分析中所观测到的，(参见表12)，C18:2水平从S6573中的5.5％提高到S7815中的7.7％(表13)。两种菌株之间的标准化脂质滴度和产率相当，表明在S7815中TcLPAT2基因的表达对生长或脂质积累不具有有害影响。

表13.S7815对比S6573发酵液的脂肪酸谱.

表13比较在S7815对比S6573的高密度发酵期间产生的脂质的TAG谱。S7815与S6573对照物之间的SOS和Sat-油酸酯-Sat水平近似相同。然而，相比于S6573，在S7815中Sat-亚油酸酯-Sat水平增加了超过7％，并且二不饱和和三不饱和TAG(U-U-U/Sat)下降了超过3％。在发酵端点时的三饱和化物从S6573中的10.1％减少到S7815中的6.1％。这些结果表明可可LPAT2的活性驱动不饱和脂肪酸向sn-2位置的转移，并且区别于在sn-2处饱和脂肪酸的掺入。

实例6：鉴别和表达对中链脂肪酸具有特异性的新颖LPAAT、GPAT、DGAT、LPCAT和PLA2

在此实例中，我们证明参与三酰甘油的生物合成的LPAAT、GPAT、DGAT、LPCAT和PLA2酶的表达的影响(在先前描述的莫氏原壁菌(UTEX 1435)转基因菌株，S7858和S8174中。根据以引用的方式并入本文中的共同拥有的WO2015/051319制备S7858和S8174。另外，共同拥有的WO2010/063031和WO2010/063032教示表达紫萼距花FATB2。简单来说，菌株S7858为表达蔗糖转化酶和紫萼距花FATB2的菌株。为了制备S7858，将构建体pSZ4329(SEQID NO:197)工程化到S3150中，S3150是经典诱变以增加脂质产量的菌株。质粒pSZ4329写成THI4a::CrTUB2-ScSUC2-PmPGH:PmAcp-P1p-CpSAD1tp_trimmed_ChFATB2_FLAG-CvNR::THI4a。pSZ4329的编码部分的注释在下表A中示出。

表A

pSZ4329	身份	核苷酸数目	核苷酸数目	核苷酸长度
					THI4a 3'侧接序列	内源性THI4的3'侧接序列	5,692	6,394	703
CvNR	3'UTR	5,278	5,679	402
					ChFATB2	CDS	4,105	5,271	1,167
CpSAD1tp修剪	CDS	3,991	4,104	114
					PmACP-P1启动子	启动子	3,411	3,981	571
缓冲液DNA		3,199	3,404	206
					UTR04424＝PmPGH UTR	3'UTR	2,749	3,192	444
ScSUC2(o)	CDS	1,144	2,742	1,599
					CrTUB2启动子	启动子	820	1,131	312
THI4a 5'侧接序列	内源性THI4的5'侧接序列	27	813	787

菌株S7858累积C8:0脂肪酸至约12％和累积C10:0脂肪酸至约22-24％。简单来说，菌株S8174为表达蔗糖转化酶的菌株和Cuphea.Avigera var.pulcherrima FATB2。为了制备S8174，将构建体pSZ5078(SEQ ID NO:198)工程化到S3150中，S3150是经典诱变以增加脂质产量的菌株。pSZ5078写成THI4a5'::CrTUB2_ScSUC2_PmPGH:PmAMT3_CpSAD1tp_trimmed-CaFATB1_Flag_CvNR::THI4a3'。菌株S8174累积C8:0脂肪酸至约24％和累积C10:0脂肪酸至约10％。pSZ5078的编码部分的注释在下表B中示出。

表B

pSZ5078	身份	核苷酸数目	核苷酸数目	核苷酸长度
					THI4a 3'侧接序列	内源性THI4的3'侧接序列	6,200	6,902	703
CvNR	3'UTR	5,786	6,187	402
					CaFATB1野生型	CDS	4,602	5,771	1,170
CpSAD1tp	CDS	4,488	4,601	114
					AMT3	启动子真核生物	3,411	4,481	1,071
缓冲液DNA	misc_feature	3,199	3,404	206
					PmPGH	3'UTR	2,749	3,192	444
ScSUC2(o)	CDS	1,144	2,742	1,599
					CrTUB2启动子	启动子	820	1,131	312
THI4a 5'侧接序列	内源性THI4的5'侧接序列	27	813	787

ER中的酰基-CoA池可用于合成TAG以及磷脂和长链脂肪酸。参与TAG和磷脂的合成的酶主动相互竞争相同的底物。酰基-CoA可缔合溶血磷脂酸以形成磷脂酸，所述磷脂酸转化为磷脂酰胆碱(PC)和其它磷脂物种。PC可以通过FAD2和FAD3酶去饱和以产生多不饱和脂肪酸，其可以由磷酸转移酶裂解并重新进入酰基-CoA池。酰基-CoA也可以直接通过酰基-CoA:溶血磷脂酰胆碱酰基转移酶(LPCAT)由PC产生。LPCAT还可催化逆反应以消耗酰基-CoA。从PC移除脂肪酸以形成酰基-CoA还可通过磷脂酶A2(PLA2)催化。来自酰基-CoA的ER中的TAG形成需要磷酸甘油酰基转移酶(GPAT)、溶血磷脂酸酰基转移酶(LPAAT)和二酰甘油酰基转移酶(DGAT)的作用。

内源性莫氏原壁菌TAG生物合成机制已演变成用菌株一般生成的较长链脂肪酸起作用。我们将天然积累高水平短链脂肪酸的物种中的异源酰基转移酶和磷脂酶引入原壁菌属以增加C8:0脂肪酸的积累。我们在NCBI中鉴定了以下植物酶，如下表14所示。

表14.表示从产生大量C8:0和C10:0的高等植物中鉴定的靶酶的基因.利用针对在原壁菌属中表达优化的密码子使用合成所有这些基因。

我们制备了一组表达异源短链特异性酰基转移酶和PLA2的构建体，如表15所示。对基因进行密码子优化以反映UTEX 1435密码子使用。

表15.转化到S7858或S8174中的构建体列表

表15中所示的所有构建体可以写成SAD2-1vD::所关注基因-PmATP-PmHXT1-ScarMEL-PmPGK::SAD2B，并使其将转化DNA靶向基因组上的SAD2基因座，从而破坏内源性硬脂酰基ACP去饱和酶的至少一个等位基因的表达。下文提供了所有转化DNA的序列。从5'-3'的构建体中的相关限制位点为Pme I、BspQ I、Kpn I、Xho I、Avr II、Spe I、SnaB I、EcoRV、Sac I、BspQ I、Pme I，分别以小写、粗体和带下划线表示。Pme I位点限定转化DNA的5'和3'末端。构建体的5'和3'末端的粗体小写序列代表来自UTEX 1435的基因组DNA，其通过同源重组靶向与SAD2基因座的整合，其中SAD2 5'侧接序列为下游所关注基因提供启动子。用如下所示的先前表征的CnLPAAT基因制备原代构建体，并且通过使用跨越任一侧上基因的限制位点Kpn I和Xho I将CnLPAAT基因替换为其它所关注基因来制备所有其它构建体。沿5'到3'方向进行，第一盒具有密码子优化的Cocos nucifera LPAAT和莫氏原壁菌ATP合成酶(PmATP)基因3'UTR。cDNA的起始ATG和终止子TGA用大写斜体表示，而编码区用小写斜体表示。3'UTR由小写下划线文字表示。含有来自卡氏酵母的选择基因蜜二糖(ScarMEL1)的第二盒由内源性HXT1启动子驱动，并具有内源性磷酸甘油酸激酶(PmPGK)基因3'UTR。在此盒中，PmHXT1启动子由小写加框文字指示。ScarMEL1基因的起始ATG和终止TGA用大写斜体表示，而编码区用小写斜体表示。3'UTR由小写下划线文字表示。对所有最终构建体进行测序以确保正确的阅读框和靶向序列。

SEQ ID NO:97转化DNA的pSZX61序列表达盒中在SAD2启动子下游的CnLPAAT，之后为第二盒中在PmHXT1启动子下游用于选择的ScarMEL1基因。

所有其它酰基转移酶构建体的序列除编码酰基转移酶之外与pSZEX61的序列完全相同。下文提供剩余酰基转移酶构建体的单独的酰基转移酶序列。

SEQ ID NO:98 CpauLPAAT1

SEQ ID NO:99 CprocLPAAT1

SEQ ID NO:100 CpaiLPAAT1

SEQ ID NO:101 ChookLPAAT1

SEQ ID NO:102 CignLPAAT1

SEQ ID NO:103 CavigLPAAT1

SEQ ID NO:104 CavigLPAAT2

SEQ ID NO:105 CpalLPAAT1

SEQ ID NO:106 CuPSR23 LPAAT2

SEQ ID NO:107 CkoeLPAAT1

SEQ ID NO:108 CkoeLPAAT2

SEQ ID NO:109 CprocLPAAT2

SEQ ID NO:110 CavigGPAT9

SEQ ID NO:111 ChookGPAT9-1

SEQ ID NO:112 CignGPAT9-1

SEQ ID NO:113 CignGPAT9-2

SEQ ID NO:114 CpalGPAT9-1

SEQ ID NO:115 CpalGPATt9-2

SEQ ID NO:116 CavigDGAT1

SEQ ID NO:117 ChookDGAT1-1

SEQ ID NO:118 CavigLPCAT

SEQ ID NO:119 CpalLPCAT

SEQ ID NO:120 CpauLPCAT

SEQ ID NO:121 CschuLPCAT

SEQ ID NO:122 CavigPLA2-1

SEQ ID NO:123 CignPLA2-1

SEQ ID NO:124 CuPSR23PLA2-2

SEQ ID NO:125 CprocPLA2-2

含有上文所述由UTEX 1453 SAD2启动子驱动的密码子优化基因的构建体转化到菌株S7858或S8714中。转化、细胞培养、脂质产生和脂肪酸分析均如本文所述进行。针对基于蜜二糖生长的能力选择转基因菌株。稳定的转化体在标准脂质生产条件下在pH 5(对于在菌株S7858中产生的转基因菌株)或在pH 7(对于在菌株S8174中产生的转基因菌株)下生长以用于脂肪酸分析。

LPAAT的表达

在WO2013/158938中，我们公开椰LPAAT酶对连接到甘油主链的脂肪酸酰基-CoA展现链长特异性。我们公开表达转基因菌株中的CnLPAAT的影响，所述转基因菌株还表达月桂酸酯特异性硫酯酶。在此实例中，我们将来源于富含C8-C10的萼距花属物种的5种LPAAT酶和CnLPAAT转化到S7858中，并将剩余的8种LPAAT酶转化到S8174中。由这些转化产生的一组代表性转基因品系得到的脂肪酸谱显示在表16和17中。如表16中所示的这些基因的表达导致C8:0和/或-C10:0脂肪酸积累增加。

表16：表达CpauLPAAT1、CpalLPAAT1、CignLPAAT1、CprocLPAAT1、ChookLPAAT1和CnLPAAT1的优化型式的S7858的代表性转基因菌株的脂肪酸谱.

表17在脂肪酶处理之前表达CavigLPAAT1、CavigLPAAT2、CpalLPAAT1、CuPSR23LPAAT1、CkoeLPAAT1、CkoeLPAAT2、CprocLPAAT1和CprocLPAAT2 S8174的代表转基因菌株的脂肪酸谱.

为了评估新颖LPAAT酶的区域特异性活性，用猪胰脏脂肪酶处理从这些转化体中的一些中提取的油，所述猪胰脏脂肪酶选择性水解三酰甘油的甘油单元中sn-1和sn-3位置处的脂肪酸，剩下仅位于sn-2位置处的脂肪酸的单酰甘油。通过氨基丙基滤筒上的固相萃取分离所得单酰甘油(2-MAG)的混合物，然后进行酯交换以产生脂肪酸甲酯(FAME)。通过GC-FID测定这些FAME的脂肪酸谱，其代表各种TAG的sn-2位置处的脂肪酸谱。当与没有脂肪酶处理的油的酯交换的脂肪酸谱相比时，sn-2脂肪酸谱显示表达的LPAAT对sn-2位置具有选择性。

表18中所公开的脂肪酶处理后的sn-2分析结果表明，CavigLPAAT1、CpaiLPAAT显示对任一C8:0脂肪酸和CpauLPAAT的选择性，CignLPAAT对C10:0脂肪酸具有选择性，表明在这些转基因菌株中表达的异源LPAAT具有在sn-2位置酰化的活性，偏好C8:0或C10:0。

表18表达CnLPAAT1、CpauLPAAT1、CpaiLPAAT1、CignLPAAT1、ChookLPAAT1和CavigLPAAT1、CavigLPAAT2、CpalLPAAT1的密码子优化型式的S7858和S8174的代表性转基因菌株的脂肪酸谱和sn-2位分析

GPAT、DGAT、LPCAT和PLA2的表达：

表达其它酰基转移酶(GPAT、DGAT、LPCAT和PLA2)的构建体转化到S8174中。稳定的转化体在标准脂质生产条件下在pH 7下生长并分析脂肪酸谱。与表达LPAAT的转基因品系相似，这些基因(GPAT、DGAT、LPCAT和PLA2)的表达也导致C8:0-C10:0脂肪酸积累增加(表19a、19b和20)。呈现的数据表明，我们已经鉴定新颖GPAT、DGAT、LPCAT和PLA2，其对C8-C10脂肪酸显示高特异性。为了确定新颖GPAT、DGAT、LPCAT和PLA2酶的区域特异性，如此实例和本文其它地方所公开进行sn-2分析。

表19a.表达GPAT和DGAT的S8174的代表性转基因菌株的脂肪酸谱

表19b.表达DGAT的S8174的代表性转基因菌株的脂肪酸谱

样品ID	C8:0	C10:0	C12:0	C8-C10
					S7485	0.00	0.00	0.07	0.00
S8174	24.61	9.10	0.42	33.71
					在SAD2-1vD基因座处的Cavig DGAT1
样品ID	C8:0	C10:0	C12:0	C8-C10
					S8174；D4549-7	24.89	9.28	0.36	34.17
S8174；D4549-6	24.53	9.04	0.47	33.57
					S8174；D4549-4	23.93	8.99	0.41	32.92
S8174；D4549-1	23.93	8.97	0.38	32.90
					S8174；D4549-3	23.76	8.9	0.36	32.66
在SAD2-1vD基因座处的Chook DGAT1
					样品ID	C8:0	C10:0	C12:0	C8-C10
S8174；D4550-1	24.67	9.12	0.41	33.79
					S8174；D4550-3	24.64	9.06	0.42	33.70
S8174；D4682-1	23.72	9.68	0.5	33.40
					S8174；D4682-2	23.49	9.66	0.41	33.15
S8174；D4550-2	22.42	8.81	0.41	31.23

表20：表达LPCAT和PLA2的S8174的代表性转基因菌株的脂肪酸谱

实例7：在原壁菌属中表达LPAAT和/或DGAT以制备高SOS和低三饱和TAG

在此实例中，我们描述了基因工程改造的莫氏原壁菌菌株，其中我们已经修饰脂肪酸和三酰甘油生物合成，以最大限度地积累硬脂酰基-油酰基-硬脂酰基(SOS)TAG，并最大限度地减少三饱和TAG的产生。来自这些菌株的特制油类似于称为“结构脂肪”的植物种子油，其具有高比例的饱和-油酸酯-饱和TAG和低水平的三饱和化物。这些结构脂肪(通常称为“黄油”)在室温下通常是固体，但在35-40℃之间急剧熔化。

高SOS菌株通过三次连续转化获得，从菌株S5100开始，所述菌株为莫氏原壁菌S376的野生型分离株的经典改善衍生物。用质粒pSZ5654转化菌株S5100以产生菌株S8754，其相对于S5100产生具有增加的硬脂酸(C18:0)含量、较低棕榈酸(C16:0)和减少的亚油酸(C18:2cisΔ9,12)含量的油。继而，用质粒pSZ5868转化菌株S8754以产生菌株S8813，其产生与S8754相比具有更高C18:0，更低C16:0的油和改善的sn-2选择性。最后，用质粒pSZ6383或pSZ6384转化菌株S8813以产生菌株S9119、S9120和S9121，其产生富含C18:0的油，具有降低水平的C18:2cis9,12Δ和改善的sn-3选择性。

用于S5100中的SAD2基因剔除的构建体

通过用整合质粒pSZ5654(SAD2-1vD::PmKASII-1tp_PmKASII-1_FLAG-CvNR:CrTUB2-PmFAD2hpA-CvNR:PmHXT1-2v2-ScarMEL1-PmPGK::SAD2-1vE)转化菌株S5100来制备第一中间菌株。构建体靶向内源性硬脂酰基-ACP去饱和酶2基因(SAD2)的等位基因1的消融，伴随编码莫氏原壁菌β-酮-酰基-ACP合成酶的PmKASII基因的表达，以及用于下调脂肪酸去饱和酶(FAD2)基因表达的RNAi发夹序列。SAD2的一个等位基因的缺失降低了SAD活性，导致C18:0水平升高。PmKASII的过度表达刺激C16:0延伸至C18:0，进一步增加C18:0。FAD2负责将C18:1cisΔ9(油酸)转化为C18:2cisΔ9,12(亚油酸)脂肪酸，并且FAD2的RNAi导致C18:2减少。因此，第一中间菌株相对于S5100亲本具有较高水平的C18:0和减少的C16:0和C18:2脂肪酸水平。编码分泌蜜二糖酶的卡氏酵母MEL1基因充当作为质粒pSZ5654的部分的可选标记，使得菌株基于蜜二糖生长。

下文提供pSZ5654转化DNA的序列。构建体中的相关限制位点以小写、粗体和下划线表示，并且分别为5'-3'PmeI、SpeI、AscI、ClaI、SacI、AvrII、EcoRV、EcoRI、SpeI、BsiWI、XhoI、SacI、KpnI、SnaBI、BspQI和PmeI。PmeI位点限定转化DNA的5'和3'末端。粗体小写序列代表SAD2-15'基因组DNA，其允许通过同源重组在SAD2-1基因座处靶向整合。以5'至3'方向进行，粗体小写序列代表SAD2-1 5'基因组DNA序列，其允许通过同源重组在FATA-1基因座处靶向整合。编码莫氏原壁菌KASII-1转运肽的序列(PmKASII-1tp)的起始ATG由大写、粗斜体表示，并且位于ATG与AscI位点之间的PmKASII-1tp序列用小写、带下划线斜体表示。PmKASII-1编码区由小写斜体表示。编码与PmKASII-1的C末端融合的3X FLAG标记的序列由大写斜体表示，并且TGA终止密码子用大写粗斜体表示。普通小球藻硝酸还原酶(NR)基因3'UTR由小写带下划线文字表示。间隔序列由小写文字表示。驱动PmFAD2hpA序列的表达的莱茵衣藻(C.reinhardtii)TUB2启动子由加框文字表示。粗斜体表示PmFAD2hpA序列，之后是表示普通小球藻硝酸还原酶3'UTR的小写带下划线文字。第二间隔序列由小写文字表示。驱动卡尔斯伯酵母MEL1基因的表达的莫氏原壁菌HXT1启动子由加框文字表示。MEL1基因的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌PGK3'UTR由小写带下划线文字表示。SAD2-1 3'基因组区域由粗体小写文字表示。

SEQ ID NO:126包含于pSZ5654中的转化DNA的核苷酸序列

构建体pSZ5654转化到S5100中。将原代转化体克隆纯化并在pH5下在标准脂质生产条件下筛选。通过DNA印迹分析验证在SAD2-1基因座处pSZ5654的整合。在50-mL摇瓶中分析主要菌株的脂肪酸谱和脂质滴度(表21)。选择S8754作为额外轮基因工程的主要菌株。如表21中所示，C16:0从17.6％降至小于6％，C18:0从4.3％增加至约28％，C18:2从5.8％降至1.3％。

表21.SAD2-1消融菌株的脂肪酸谱.

用于S8754中的FATA-1基因剔除的构建体

通过用整合质粒pSZ5868(FATA-1vB::CpSAD1tp_GarmFATA1(G108A)_FLAG-PmSAD2-1:PmG3PDH-1-TcLPAT2-PmATP:CrTUB2-ScSUC2-PmPGH::FATA-1vC)转化菌株S8754来制备第二中间菌株。此构建体靶向内源性脂肪酰基-ACP硫酯酶基因(FATA-1)的等位基因1的消融，并且含有GarmFATA1(G108A)的表达模组，其编码具有改善活性的山竹FATA1硫酯酶的变体，和编码可可溶血磷脂酸酰基转移酶(LPAAT)的TcLPAT2。FATA-1的一种拷贝的缺失降低了内源性硫酯酶活性，进一步减少C16:0积累。GarmFATA1(G108A)的表达刺激C18:0-ACP水解，进一步增加C18:0。与内源性LPAAT相比，TcLPAT2对于C18:1向甘油三酸酯的sn-2位置的转移具有更高的特异性，导致三饱和化物的积累减少。与其亲本S8754相比，第二中间菌株具有增加的C18:0和更低的C16:0。编码分泌蔗糖转化酶的酿酒酵母SUC2基因充当质粒pSZ5868的部分的可选标记且使菌株能够基于蔗糖生长。

下文提供pSZ5868转化DNA的序列。构建体中的相关限制位点以小写、粗体和下划线表示，并且分别为5'-3'BspQI、PmeI、SpeI、AscI、ClaI、SacI、AvrII、NdeI、NsiI、AflII、KpnI、XbaI、MfeI、BamHI、BspQI和PmeI。BspQI和PmeI位点限定转化DNA的5'和3'末端。以5'至3'方向进行，粗体小写序列代表FATA-1 5'基因组DNA，其允许通过同源重组在FATA-1基因座处靶向整合。编码原始小球藻SAD1转运肽的序列(CpSAD1tp)的起始ATG由大写、粗斜体表示，并且位于ATG与AscI位点之间的CpSAD1tp序列的其余部分用小写、带下划线斜体表示。GarmFATA1(G108A)编码区由小写斜体表示。编码与GarmFATA1(G108A)的C末端融合的3XFLAG标记的序列由大写斜体表示，并且TGA终止密码子用大写粗斜体表示。莫氏原壁菌SAD2-1 3'UTR由小写带下划线文字表示。间隔序列由小写文字表示。驱动TcLPAT2序列的表达的莫氏原壁菌G3PDH-1启动子由加框文字表示。TcLPAT2基因的起始ATG和终止TGA密码子由大写粗斜体表示，而编码区的其余部分用斜体表示。小写带下划线文字代表莫氏原壁菌ATP 3'UTR。第二间隔序列由小写文字表示。驱动酿酒酵母SUC2基因的表达的莱茵衣藻TUB2启动子由加框文字表示。SUC2的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌PGH 3'UTR由小写带下划线文字表示。FATA-1 3'基因组区域由粗体小写文字表示。

SEQ ID NO:127包含于pSZ5868中的转化DNA的核苷酸序列

构建体pSZ5868转化到S8754中。将原代转化体克隆纯化并在pH5下在标准脂质生产条件下筛选。通过DNA印迹分析验证在FATA-1基因座处pSZ5868的整合。在50-mL摇瓶中分析主要菌株的脂肪酸谱和脂质滴度(表22)。选择S8813作为最终轮基因工程的主要菌株。如表22中所示，与菌株S8754相比，C16:0从5.9％降至3.4％，并且C18:0从27.3％增加至约45％。C18:2由于可可LPAAT的活性从1.3％略微增加至约1.6％。

表22.FATA-1消融菌株的脂肪酸谱.

菌株	S5100	S8754	S8813	S8814
					C14:0	0.7	0.6	0.5	0.5
C16:0	18.8	5.9	3.4	3.4
					C16:1cis-9	0.5	0.0	0.0	0.0
C18:0	4.0	27.3	45.3	44.8
					C18:1	68.3	60.9	45.9	46.3
C18:2	6.3	1.3	1.5	1.6
					C18:3α	0.6	0.3	0.3	0.3
C20:0	0.3	2.4	2.0	2.1
					饱和化物	24.2	37.0	52.0	51.5
脂质(g/L)	12.7	11.9	11.9	11.9

用于S8813中的FAD2基因剔除的构建体

用整合质粒pSZ6383(FAD2-1vA::PmLDH1-AtTHIC-PmHSP90:PmSAD2-2v2-TcDGAT1-CvNR:PmSAD2-1v3-CpSAD1tp_GarmFATA1(G108A)_FLAG-PmSAD2-1::FAD2-1vB)、质粒pSZ6384(FAD2-1vA::PmLDH1-AtTHIC-PmHSP90:PmSAD2-2v2-TcDGAT2-CvNR:PmSAD2-1v3-CpSAD1tp_GarmFATA1(G108A)_FLAG-PmSAD2-1::FAD2-1vB)或质粒pSZ6377(FAD2-1vA::PmLDH1-AtTHIC-PmHSP90:PmSAD2-1v3-CpSAD1tp_GarmFATA1(G108A)_FLAG-PmSAD2-1::FAD2-1vB)转化菌株S8813来产生高SOS菌株。这些构建体靶向内源性脂肪酸去饱和酶2基因(FAD2-1)的等位基因1的消融，并且含有GarmFATA1(G108A)的第二拷贝的表达模组，和编码可可二酰甘油O-酰基转移酶1(pSZ6383)的TcDGAT1或编码可可二酰甘油O-酰基转移酶2(pSZ6384)的TcDGAT2。FAD2的一个等位基因的缺失进一步减少C18:2积累。GarmFATA1(G108A)的表达刺激C18:0-ACP水解，进一步增加C18:0。与内源性DGAT相比，TcDGAT1和TcLPAT2对于C18:0向甘油三酸酯的sn-3位置的转移具有更高的特异性，导致C18:0和脂质滴度提高，和三饱和TAG减少。最终菌相比其亲本S8813株具有更高的C18:0，更低的C16:0和更低的C18:2。阿拉伯芥THIC基因(AtTHIC)催化5-氨基咪唑核糖酸(AIR)向4-氨基-5-羟甲基嘧啶(HMP)转化，提供用于硫胺素生物合成的嘧啶环结构。AtTHIC充当可选标记作为质粒pSZ6383和pSZ6384的部分，允许菌株在不存在外源硫胺素的情况下生长。

下文提供pSZ6383转化DNA的序列。构建体中的相关限制位点以小写、粗体和下划线表示，并且分别为5'-3'BspQI、KpnI、XbaI、SnaBI、BamHI、AvrII、SpeI、ClaI、AflII、EcoRI、SpeI、AscI、ClaI、SacI和BspQ I。BspQI位点限定转化DNA的5'和3'末端。以5'至3'方向进行，粗体小写序列代表FAD2-15'基因组DNA，其允许通过同源重组在FAD2-1基因座处靶向整合。驱动阿拉伯芥THIC基因的表达的莫氏原壁菌LDH1启动子由加框文字表示。AtTHIC的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌HSP903'UTR由小写带下划线文字表示。间隔序列由小写文字表示。驱动TcDGAT1序列的表达的莫氏原壁菌SAD2-2启动子由加框文字表示。TcDGAT1基因的起始ATG和终止TGA密码子由大写粗斜体表示，而编码区的其余部分用斜体表示。小写带下划线文字代表普通小球藻NR 3'UTR。第二间隔序列由小写文字表示。由加框斜体文字表示的莫氏原壁菌SAD2-1启动子用于驱动山竹FATA1基因的表达。编码原始小球藻SAD1转运肽的序列(CpSAD1tp)的起始ATG由大写、粗斜体表示，并且位于ATG与AscI位点之间的CpSAD1tp序列的其余部分用小写、带下划线斜体表示。GarmFATA1(G108A)编码区由小写斜体表示。编码与GarmFATA1(G108A)的C末端融合的3X FLAG标记的序列由大写斜体表示，并且TGA终止密码子用大写粗斜体表示。莫氏原壁菌SAD2-1 3'UTR由小写带下划线文字表示。FAD2-1 3'基因组区域由粗体小写文字表示。

SEQ ID NO:128转化DNA的核苷酸序列包含于pSZ6383中

下文提供pSZ6384转化DNA的序列。构建体中的相关限制位点以小写、粗体和下划线表示，并且分别为5'-3'BspQI、KpnI、XbaI、SnaBI、BamHI、AvrII、SpeI、ClaI、AflII、EcoRI、SpeI、AscI、ClaI、SacI和BspQ I。BspQI位点限定转化DNA的5'和3'末端。以5'至3'方向进行，粗体小写序列代表FAD2-15'基因组DNA，其允许通过同源重组在FAD2-1基因座处靶向整合。驱动阿拉伯芥THIC基因的表达的莫氏原壁菌LDH1启动子由加框文字表示。AtTHIC的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌HSP903'UTR由小写带下划线文字表示。间隔序列由小写文字表示。驱动TcDGAT2序列的表达的莫氏原壁菌SAD2-2启动子由加框文字表示。TcDGAT2基因的起始ATG和终止TGA密码子由大写粗斜体表示，而编码区的其余部分用斜体表示。小写带下划线文字代表普通小球藻NR 3'UTR。第二间隔序列由小写文字表示。由加框斜体文字表示的莫氏原壁菌SAD2-1启动子用于驱动山竹FATA1基因的表达。编码原始小球藻SAD1转运肽的序列(CpSAD1tp)的起始ATG由大写、粗斜体表示，并且位于ATG与AscI位点之间的CpSAD1tp序列的其余部分用小写、带下划线斜体表示。GarmFATA1(G108A)编码区由小写斜体表示。编码与GarmFATA1(G108A)的C末端融合的3X FLAG标记的序列由大写斜体表示，并且TGA终止密码子用大写粗斜体表示。莫氏原壁菌SAD2-1 3'UTR由小写带下划线文字表示。FAD2-1 3'基因组区域由粗体小写文字表示。

SEQ ID NO：129包含于pSZ6384中的转化DNA的核苷酸序列

下文提供pSZ6377转化DNA的序列。构建体中的相关限制性位点以小写、粗体和下划线文字表示，并且分别是5'-3'BspQI、KpnI、XbaI、SnaBI、BamHI、AvrII、SpeI、AscI、ClaI、SacI和BspQ I。BspQI位点限定转化DNA的5'和3'末端。以5'至3'方向进行，粗体小写序列代表FAD2-1 5'基因组DNA，其允许通过同源重组在FAD2-1基因座处靶向整合。驱动阿拉伯芥THIC基因的表达的莫氏原壁菌LDH1启动子由加框文字表示。AtTHIC的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌HSP90 3'UTR由小写带下划线文字表示。间隔序列由小写文字表示。由加框斜体文字表示的莫氏原壁菌SAD2-1启动子用于驱动山竹FATA1基因的表达。编码原始小球藻SAD1转运肽的序列(CpSAD1tp)的起始ATG由大写、粗斜体表示，并且位于ATG与AscI位点之间的CpSAD1tp序列的其余部分用小写、带下划线斜体表示。GarmFATA1(G108A)编码区由小写斜体表示。编码与GarmFATA1(G108A)的C末端融合的3X FLAG标记的序列由大写斜体表示，并且TGA终止密码子用大写粗斜体表示。莫氏原壁菌SAD2-1 3'UTR由小写带下划线文字表示。FAD2-1 3'基因组区域由粗体小写文字表示。

SEQ ID NO:130包含于pSZ6377中的转化DNA的核苷酸序列

构建体pSZ6383、pSZ6384和pSZ6377转化到S8813中。将原代转化体克隆纯化并在pH 5下在标准脂质生产条件下筛选。通过DNA印迹分析验证在FAD2-1基因座处pSZ6383或pSZ6384的整合。在50-mL摇瓶中分析主要菌株的脂肪酸谱、sn-2谱和脂质滴度(表23)。在大多数菌株中，FAD2-1消融使C18:2降低至<1％。GarmFATA1(G108A)和TcDGAT1(S8990、S8992、S8998和S8999)或TcDGAT2(S8994、S9000和S9047)的第二拷贝的表达将C18:0升高至>56％。表达GarmFATA1(G108A)的第二拷贝而无可可DGAT基因(pSZ6377)中的任一个的D5393-28菌株具有相似的脂肪酸谱，但较低的脂质滴度。如表23中所示，与菌株S8813相比，对于表达TcDGAT1或TcDGAT2的菌株，C16:0从3.2％增加至3.7％-4.0％，C18:0从45.8％增加至约56％，C18:2从1.4％下降到约1.0％。

表23.FAD2-1消融菌株的脂肪酸谱.

菌株	S8813	D5393-28	S8990	S8992	S8998	S8999	S8994	S9000	S9047
										C12:0	0.1	0.2	0.2	0.2	0.1	0.2	0.1	0.1	0.2
C14:0	0.4	0.5	0.5	0.5	0.5	0.5	0.5	0.5	0.5
										C16:0	3.2	3.8	3.7	3.8	3.9	4.0	3.7	3.8	3.5
C16:1cis-7	0.1	0.1	0.1	0.1	0.1	0.1	0.1	0.1	0.1
										C16:1cis-9	0.0	0.1	0.1	0.1	0.1	0.1	0.1	0.1	0.1
C17:0	0.1	0.2	0.2	0.1	0.2	0.1	0.2	0.2	0.2
										C18:0	45.8	56.0	56.6	56.0	56.2	56.0	56.3	56.4	56.5
C18:1	45.9	35.8	35.4	35.9	35.7	35.5	35.9	35.7	35.9
										C18:2	1.4	1.0	0.9	1.0	0.9	1.1	0.9	0.9	0.8
C18:3α	0.3	0.3	0.3	0.2	0.3	0.2	0.2	0.3	0.3
										C20:0	2.0	1.6	1.6	1.5	1.6	1.5	1.5	1.5	1.5
C22:0	0.2	0.2	0.2	0.2	0.2	0.2	0.2	0.2	0.2
										C24:0	0.1	0.1	0.1	0.1	0.1	0.1	0.1	0.1	0.1
饱和化物	52.1	62.6	63.1	62.6	62.9	62.8	62.8	62.9	62.7

使用液相色谱和质谱分析分析最终菌株的TAG组成。菌株积累68-71％SOS，三饱和化物在2.5-2.8％范围内。表达GarmFATA1(G108A)的第二拷贝而无可可DGAT基因中的任一个的D5393-28菌株具有相似的SOS含量，但具有略微较高的三饱和化物。展示典型的乳木果硬脂和烛果油的样品的TAG组成以用于比较

表24.FAD2-1消融菌株的LC/MS TAG谱.La＝月桂酸酯(C12:0)，M＝肉豆蔻酸酯(C14:0)，P＝棕榈酸酯(C16:0)，Ma＝十七烷酸(C17:0)，S＝硬脂酸酯(C18:0)，O＝油酸酯(C18:1)，L＝亚油酸酯(C18:2)，Ln＝α-亚麻酸酯(C18:3α)，A＝二十烷酸酯(C20:0)，G＝(C20:1)，B＝二十二酸酯(C22:0)，Lg＝木质素(C24:0)，Hx＝二十六烷酸酯(C26:0)。Sat＝饱和，U＝不饱和

实例8变体甘蓝型油菜硫酯酶

在此实例中，我们证明通过靶向两个氨基酸位置D124和D209的位点定向诱变，修饰最初从甘蓝型油菜(BnOTE，寄存号CAA52070)分离的FATA硫酯酶的酶特异性。

为了确定每个氨基酸取代对BnOTE的酶特异性的影响，将野生型和突变型BnOTE基因克隆到能够实现表达的载体并在莫氏原壁菌菌株S8588中表达。菌株S8588为其中内源性FATA1等位基因已破坏且表达莫氏原壁菌KASII基因和蔗糖转化酶的菌株。具有FATA1破坏和莫氏原壁菌KASII与转化酶的共表达的重组菌株先前公开于共同拥有的申请WO2012/106560和WO2013/15898中，所述申请以引用的方式并入本文中。

表达野生型或突变型BnOTE酶、构建体pSZ6315、pSZ6316、pSZ6317或pSZ6318的菌株在S8588中表达。在这些构建体中，卡氏酵母MEL1基因(寄存号：AAA34770)用作可选标记，以使用先前描述的转化方法(基因枪)通过同源重组将野生型和突变型BnOTE基因引入莫氏原壁菌菌株S8588的FAD2-2基因座中。已在S8588中表达的构建体列于表25中。

表25.表达野生型和突变型BnOTE基因的DNA构建体的DNA批号和质粒ID

pSZ6315

构建体psZ6315可写成FAD2-2::PmHXT1-ScarMEL1-PmPGK:PmSAD2-2V3-CpSADtp-BnOTE-PmSAD2-1utr::FAD2-2。下文提供pSZ6315转化DNA的序列。pSZ6315中的相关限制位点以小写、粗体和下划线表示且分别为5'-3'SgrAI、Kpn I、SnaBI、AvrII、SpeI、AscI、ClaI、Sac I、SbfI。SgrAI和SbfI位点限定转化DNA的5'和3'末端。粗体小写序列代表FAD2-2基因组DNA，其允许通过同源重组在FAD2-2基因座处靶向整合。以5'至3'方向进行，由加框文字代表莫氏原壁菌HXT1启动子，其驱动卡氏酵母MEL1基因的表达。MEL1基因的起始ATG和终止子TGA用大写粗斜体表示，而编码区用小写斜体表示。莫氏原壁菌PGK 3'UTR由小写带下划线文字表示，之后为由加框斜体文字表示的莫氏原壁菌SAD2-2V3启动子。野生型BnOTE的起始ATG和终止TGA密码子由大写粗斜体表示，而编码区的其余部分由小写粗斜体表示。对应于标靶氨基酸D124和D209的三核苷酸密码子为小写、斜体、粗体和带波纹下划线的。莫氏原壁菌SAD2-1 3'UTR再次由小写带下划线文字表示，之后为由粗体小写文字表示的FAD2-2基因组区域。

SEQ ID NO:131包含于pSZ6315中的转化DNA的核苷酸序列

SEQ ID NO:132 pSZ6316中的BnOTE(D124A)的核苷酸序列

除了D209A点突变以外，pSZ6317转化DNA的序列与pSZ6315相同，下文提供BnOTED209ADNA序列。对应于两个标靶氨基酸D124和D209的三核苷酸密码子呈小写、斜体、加粗和带波纹下划线形式。pSZ6317写成FAD2-2::PmHXT1-ScarMEL1-PmPGK:PmSAD2-2V3-CpSADtp-BnOTE(D209A)-PmSAD2-1utr::FAD2-2。

SEQ ID NO:133 pSZ6317中的BnOTE(D209A)的核苷酸序列：

除了两个点突变D124A和D209A以外，pSZ6318转化DNA的序列与pSZ6315相同，下文提供BnOTE(D124A，D209A)DNA序列。对应于两个标靶氨基酸D124和D209的三核苷酸密码子呈小写、斜体、加粗和带波纹下划线形式。pSZ6318写成FAD2-2::PmHXT1-ScarMEL1-PmPGK:PmSAD2-2V3-CpSADtp-BnOTE(D124A,D209A)-PmSAD2-1utr::FAD2-2。

SEQ ID NO:134 pSZ6318中的BnOTE(D124A，D209A)的核苷酸序列

将含有野生型和突变型BnOTE基因的DNA构建体转化到亲本菌株S8588中。将原代转化体克隆纯化并在pH 5.0下在标准脂质生产条件下生长。由pSZ6315、pSZ6316、pSZ6317和pSZ6318转化到S8588中产生的代表性克隆的所得谱展示在表26中。亲本菌株S8588产生5.4％C18:0，当用表达野生型BnOTE的DNA盒转化时，转基因品系产生约11％C18:0。与野生型蛋白质相比，BnOTE突变体(D124A)使C18:0的量增加至少2倍。相比之下，BnOTE D209A突变似乎对BnOTE硫酯酶的酶活性/特异性没有影响。最后，BnOTE(D124A，D209A)的表达导致与我们在来自表达S8588的Bn OTE(D124A)的转化体中观察到的非常相似的脂肪酸谱，再次表明D209A对酶活性没有显著影响。

表26.S8588和用野生型和突变型BnOTE基因转化的衍生转基因品系中的脂肪酸谱

实例9变体山竹硫酯酶

在此实例中，使用靶向酶内的六个氨基酸位置的定点突变诱发和其各种组合，我们证明了修饰最初从山竹(GmFATA，寄存号O04792)分离的FATA硫酯酶的活性和特异性的能力。Facciotti等人(NatBiotech 1999)先前已经改变了三种氨基酸(G108，S111，V193)。剩余三个靶向氨基酸是L91、G96和T156。

为了测试每种突变对GmFATA活性的影响，将野生型和突变型基因克隆到能够实现在莫氏原壁菌菌株S3150内表达的载体。表27概括比较野生型GmFATA与14种突变体的三天脂质谱筛选的结果。与野生型蛋白质(DNA批号D3997)相比，三种GmFATA突变体(DNA批号D3998，D4000，D4003)将C18:0的量增加至少1.5倍。D3998和D4003是突变，Facciotti等人(NatBiotech1999)已将其描述为提高GmFATA活性的取代。表达DNA批号D4000中包含的突变的菌株S3150基于Solazyme的研究，所述研究证明此位置影响FATB硫酯酶的活性。对所有构建体进行密码子优化以反映UTEX 1435密码子使用。非突变GmFATA增加C18:0的脂肪酸含量并降低C18:1和C18:2的脂肪酸含量。从表27中可以看出，与野生型GmFATA相比，G90A突变型GmFATA增加C18:0的脂肪酸含量并降低C18:1和C18:2的脂肪酸含量。

表27

下文展示GmFATA野生型亲本基因表达载体的核苷酸序列(D3997，pSZ5083)。质粒pSZ5083可写成THI4a::CrTUB2-NeoR-PmPGH:PmSAD2-2Ver3-CpSAD1tp_GarmFATA1_FLAG-CvNR::THI4a。实现到Thi4基因座中的靶向整合的5'和3'同源臂以小写标注；CrTUB2启动子以大写斜体标注，其驱动以小写斜体标注的新霉素选择标记的表达，所述新霉素选择标记之后为以大写字母突出的PmPGH 3'UTR终止子。Pm SAD2-1启动子(以粗体文字标注)驱动GmFATA基因(用小写粗体文字标注)的表达，并以用带下划线的小写粗体标注的CvNR 3'UTR终止。限制性克隆位点和间隔区DNA片段记为带下划线的大写普通印字。除编码GmFATA之外，此实例中所公开的所有GmFATA构建体的核苷酸序列与pSZ5083的核苷酸序列相同。启动子、3'UTR、选择标记和靶向臂与针对pSZ5083所描述的相同。下文展示单个GmFATA突变序列。在图1中展示未诱变GmFATA的氨基酸序列。下文展示变化的GmFATA蛋白质的氨基酸序列。

SEQ ID NO:135 pSZ5083

SEQ ID NO:136 Gm FATA野生型亲本基因；D3997，pSZ5083的氨基酸序列.藻转运肽带下划线且FLAG抗原决定基标记为大写粗体

SEQ ID NO:137 Gm FATA S111A，V193A突变基因；D3998，pSZ5084的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且S111A、V193A残基为小写粗体。

SEQ ID NO:138 Gm FATA S111V，V193A突变基因；D3999，pSZ5085的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且S111V、V193A残基为小写粗体。

SEQ ID NO:139 Gm FATA G96A突变基因；D4000，pSZ5086的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G96A残基为小写粗体。

SEQ ID NO:140 Gm FATA G96T突变基因；D4001，pSZ5087的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G96T残基为小写粗体。

SEQ ID NO:141 Gm FATA G96V突变基因；D4002，pSZ5088的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G96V残基为小写粗体。

SEQ ID NO:142 Gm FATA G108A突变基因；D4003，pSZ5089的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G108A残基为小写粗体。

SEQ ID NO:143 Gm FATA L91F突变基因；D4004，pSZ5090的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且L91F残基为小写粗体。

SEQ ID NO:144 Gm FATA L91K突变基因；D4005，pSZ5091的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且L91K残基为小写粗体。

SEQ ID NO:145图10.Gm FATA L91S突变基因；D4006，pSZ5092的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且L91S残基为小写粗体。

SEQ ID NO:146 Gm FATA G108V突变基因；D4007，pSZ5093的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G108V残基为小写粗体。

SEQ ID NO:147 Gm FATA T156F突变基因；D4008，pSZ5094的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156F残基为小写粗体。

SEQ ID NO:148 Gm FATA T156A突变基因；D4009，pSZ5095的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156A残基为小写粗体。

SEQ ID NO:149 Gm FATA T156K突变基因；D4010，pSZ5096的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156K残基为小写粗体。

SEQ ID NO:150 Gm FATA T156V突变基因；D4011，pSZ5097的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156V残基为小写粗体。

SEQ ID NO:151 GmFATA S111A，V193A突变基因(D3998，pSZ5084)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttcgccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgcggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:152 GmFATA S111V，V193A突变基因(D3999，pSZ5085)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttcgtcaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgcggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:153 GmFATA G96A突变基因(D4000，pSZ5086)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtggcgtgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:154 GmFATA G96T突变基因(D4001，pSZ5087)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgacgtgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:155 GmFATA G96V突变基因(D4002，pSZ5088)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtggtgtgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:156 GmFATA G108A突变基因(D4003，pSZ5089)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ50836相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccgccggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:157 GmFATA L91F突变基因(D4004，pSZ5090)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacttcctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:158 GmFATA L91K突变基因(D4005，pSZ5091)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacaagctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:159 GmFATA L91S突变基因(D4006，pSZ5092)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaactcgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:160 GmFATA G108V突变基因(D4007，pSZ5093)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccgtcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:161 GmFATA T156F突变基因(D4008，pSZ5094)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcttccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:162 GmFATA T156A突变基因(D4009，pSZ5095)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcgcgcgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:163 GmFATA T156K突变基因(D4010，pSZ5096)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcaagcgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:164GmFATA T156V突变基因(D4011，pSZ5097)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttctccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcgtgcgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgtggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

序列

SEQ ID NO:1

SEQ ID NO:2

SEQ ID NO:3

SEQ ID NO:4

SEQ ID NO:5

SEQ ID NO:6

SEQ ID NO:7

SEQ ID NO:8

SEQ ID NO:9

SEQ ID NO:10

SEQ ID NO:11

SEQ ID NO:12

SEQ ID NO:13

SEQ ID NO:14

SEQ ID NO:15

SEQ ID NO:16

SEQ ID NO:17

莫氏原壁菌(UTEX 1435)Amt02启动子

TCACCAGCGGACAAAGCACCGGTGTATCAGGTCCGTGTCATCCACTCTAAAGAGCTCGACTACGACCTACTGATGGCCCTAGATTCTTCATCAAAAACGCCTGAGACACTTGCCCAGGATTGAAACTCCCTGAAGGGACCACCAGGGGCCCTGAGTTGTTCCTTCCCCCCGTGGCGAGCTGCCAGCCAGGCTGTACCTGTGATCGGGGCTGGCGGGAAAACAGGCTTCGTGTGCTCAGGTTATGGGAGGTGCAGGACAGCTCATTAAACGCCAACAATCGCACAATTCATGGCAAGCTAATCAGTTATTTCCCATTAACGAGCTATAATTGTCCCAAAATTCTGGTCTACCGGGGGTGATCCTTCGTGTACGGGCCCTTCCCTCAACCCTAGGTATGCGCACATGCGGTCGCCGCGCAACGCGCGCGAGGGCCGAGGGTTTGGGACGGGCCGTCCCGAAATGCAGTTGCACCCGGATGCGTGGCACCTTTTTTGCGATAATTTATGCAATGGACTGCTCTGCAAAATTCTGGCTCTGTCGCCAACCCTAGGATCAGCGGTGTAGGATTTCGTAATCATTCGTCCTGATGGGGAGCTACCGACTGCCCTAGTATCAGCCCGACTGCCTGACGCCAGCGTCCACTTTTGTGCACACATTCCATTCGTGCCCAAGACATTTCATTGTGGTGCGAAGCGTCCCCAGTTACGCTCACCTGATCCCCAACCTCCTTATTGTTCTGTCGACAGAGTGGGCCCAGAGGCCGGTCGCAGCC

SEQ ID NO:18

莫氏原壁菌(UTEX 1435)Amt03启动子Ggccgacaggacgcgcgtcaaaggtgctggtcgtgtatgccctggccggcaggtcgttgctgctgctggttagtgattccgcaaccctgattttggcgtcttattttggcgtggcaaacgctggcgcccgcgagccgggccggcggcgatgcggtgccccacggctgccggaatccaagggaggcaagagcgcccgggtcagttgaagggctttacgcgcaaggtacagccgctcctgcaaggctgcgtggtggaattggacgtgcaggtcctgctgaagttcctccaccgcctcaccagcggacaaagcaccggtgtatcaggtccgtgtcatccactctaaagagctcgactacgacctactgatggccctagattcttcatcaaaaacgcctgagacacttgcccaggattgaaactccctgaagggaccaccaggggccctgagttgttccttccccccgtggcgagctgccagccaggctgtacctgtgatcgaggctggcgggaaaataggcttcgtgtgctcaggtcatgggaggtgcaggacagctcatgaaacgccaacaatcgcacaattcatgtcaagctaatcagctatttcctcttcacgagctgtaattgtcccaaaattctggtctaccgggggtgatccttcgtgtacgggcccttccctcaaccctaggtatgcgcgcatgcggtcgccgcgcaactcgcgcgagggccgagggtttgggacgggccgtcccgaaatgcagttgcacccggatgcgtggcaccttttttgcgataatttatgcaatggactgctctgcaaaattctggctctgtcgccaaccctaggatcagcggcgtaggatttcgtaatcattcgtcctgatggggagctaccgactaccctaatatcagcccgactgcctgacgccagcgtccacttttgtgcacacattccattcgtgcccaagacatttcattgtggtgcgaagcgtccccagttacgctcacctgtttcccgacctccttactgttctgtcgacagagcgggcccacaggccggtcgcagcc

SEQ ID NO:19 pSZ3840/D2554转化构建体(CpauLPAAT1)

SEQ ID NO:20 pSZ3841/D2555(CpaiLPAAT1)

SEQ ID NO:21 pSZ3842/D2556(CigneaLPAAT1)

SEQ ID NO:22 pSZ3844/D2557(ChookLPAAT1)

SEQ ID NO:23 CpauLPAAT1

MAIPAAAVIFLFGLLFFTSGLIINLFQALCFVLVWPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMLGWVMGQHLGCLGSILSVAKKSTKFLPVLGWSMWFSEYLYIERSWAKDRTTLKSHIERLTDYPLPFWMVIFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDVTVAFPKTSPPPTLLNLFEGQSIVLHVHIKRHAMKDLPESDDAVAQWCRDKFVEKDALLDKHNAEDTFSGQEVHRTGSRPIKSLLVVISWVVVITFGALKFLQWSSWKGKAFSVIGLGIVTLLMHMLILSSQAERSSNPAKVAQAKLKTELSISKKATDKEN SEQ ID NO:

SEQ ID NO:24 CprocLPAAT1

SEQ ID NO:25 CprocLPAAT1b

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPISKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWNKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTQTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDLTVAFPKTSPPPTLLNLFEGQSVVLHVHIKRHAMKDLPESDDEVAQWCRDKFVEK SEQ ID NO:

SEQ ID NO:26 CprocLPAAT2aIVNLVQAVCFVLVRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNADDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAKIEGESSKTEMEKEK

SEQ ID NO:27 CprocLPAAT2b

SEQ ID NO:28 CpaiLPAAT1

SEQ ID NO:29 ChookLPAAT1

SEQ ID NO:30 ChookLPAAT2a

SEQ ID NO:31 ChookLPAAT2b

SEQ ID NO:32 ChookLPAAT3a

SEQ ID NO:33 ChookLPAAT3b

SEQ ID NO:34 CigneaLPAAT1

SEQ ID NO:35 CigneaLPAAT2

SEQ ID NO:36 DcLPAAT1

SEQ ID NO:37 DcLPAAT2

SEQ ID NO:38 CcrLPAAT1a

SEQ ID NO:39 CcrLPAAT1b

SEQ ID NO:40 CcrLPAAT2a

SEQ ID NO:41 CcrLPAAT2b

SEQ ID NO:42 BrLPAAT1a

SEQ ID NO:43 BrLPAAT1bAAAVIVPLGILFFISGLVVNLLQAVCYVLVRPMSKNTYRKINRVVAETLWLELVWIVDWWAGVKIQVFADDETFNRMGKEHALVVCNHRSDIDWLVGWILAQRSGCLGSALAVMKKSSKFLPVIGWSMWFSEYLFLERNWAKDESTLKSGLQRLNDFPRPFWLALFVEGTRFTEAKLKAAQEYAASSELPVPRNVLIPRTKGFVSAVSNMRSFVPAIYDMTVAIPKTSPPPTMLRLFKGQPSVVHVHIKCHSMKDLPESDDAIAQWCRDQFVAKDALLDKHIAADTFPGQQEQNIGRPIKSLAVVLSWSCLLILGAMKFLHWSNLFSSWKGIAFSALGLGIITLCMQILIRSSQSERSTPAKVVPAKPKDNHNDSGSSSQTE

SEQ ID NO:44 BrLPAAT1c

SEQ ID NO:45 BjLPAAT1a

SEQ ID NO:46 BjLPAAT1b

SEQ ID NO:47 BjLPAAT1c

SEQ ID NO:48 BjLPAAT1d

SEQ ID NO:49 CcLPAAT1a

SEQ ID NO:50 CcLPAAT1b

SEQ ID NO:51 UcLPAAT1a

SEQ ID NO:52 UcLPAAT1b

SEQ ID NO:53 LdLPAAT1

SEQ ID NO:54 CaequLPAAT1a

SEQ ID NO:55 CaequLPAAT1b

SEQ ID NO:56 CaequLPAAT1c

SEQ ID NO:57 CaequLPAAT1d

SEQ ID NO:58 CglutLPAAT1a

SEQ ID NO:59 CglutLPAAT1b

SEQ ID NO:60 CprLPAAT1

SEQ ID NO:61 ChsLPAAT1

SEQ ID NO:62 ChsLPAAT2

SEQ ID NO:63 CcalcLPAAT1a

SEQ ID NO:64 CcalcLPAAT1b

SEQ ID NO:65 CcalcLPAAT2

SEQ ID NO:66 ChtLPAAT1a

SEQ ID NO:67 ChtLPAAT1b

SEQ ID NO:68 CwLPAAT1

SEQ ID NO:69 CwLPAAT2bLGLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRLNRVVAELLWLELVWLIDWWAGVKIKVFTDHETFHLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLFLERSWAKDESTLKSGLNRLKDYPLPFWLALFVEGTRFTRAKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTMLRMFKGQSSVDALLDKHNADDTFSGQELHDIGRPIKSLLVVISWAVLVVFGAVKFLQWSSLLSSWKGIAFSGIGLGIVTLLVHILILSSQAERSTSAKVAQAKVKTELSSSKKVKNKGN

SEQ ID NO:70 CwLPAAT2a

SEQ ID NO:71 CgLPAAT1a

SEQ ID NO:72 CgLPAAT1b

SEQ ID NO:73 CgLPAAT1c

SEQ ID NO:74 CpalLPAAT1

SEQ ID NO:75 CaLPAAT1

SEQ ID NO:76 CaLPAAT3

SEQ ID NO:77 SalLPAAT1

SEQ ID NO:78 CleptLPAAT1

SEQ ID NO:79 ClopLPAAT1

SEQ ID NO:80 CcrasLPAAT1a

SEQ ID NO:81 CcrasLPAAT1b

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVRCFLVLSLIYLNGIILKLCGLCLQVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAK SEQ ID NO:

SEQ ID NO:82 CcrasLPAAT1c

MAIPAAAVIFLFGLIFFASGLIINLFQALCFVLIWPLWKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSILSVAKKSTKFLPVLGWSMWFTEYLYIERSWDKDKSTLKSHIERLKDYPLPFWLVIFAEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPRTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHVMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLEVFGAVKFLQWSSLLSSWKGLAFSGIGLGIITLLMHILILFSQSERSTPAKVAPAKAKMEGESSKTEMEM

SEQ ID NO:83 CcrasLPAAT1d

SEQ ID NO:84 CkoeLPAAT1

MAIAAAPVIFLFGLLFFASGLIINLFQAICFVLIWPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVITNHKIDLDWMIGWILGQHFGCLGSVISIAKKSTKFLPIFGWSLWFSEYLFLERNWAKDKRTLKSHIERMKDYPLPLWLILFVEGTRFTRTKLLAAQQYAASSGLPVPRNVLIPHTKGFVSSVSHMRSFVPAIYDVTVAIPKTSPPPTLIRMFKGQSSVLHVHLKRHLMKDLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQETGRPIKSLLVVISWAVLEVYGAVKFLQWSSLLSSWKGLAFSGIGLGLITLLMHILILFSQSERSTPAKVAPAKPKKEGESSKTEMEK

SEQ ID NO:85 CkoeLPAAT2

SEQ ID NO:86 pSZ2624 PmKASII

SEQ ID NO:87 pSZ3204 GarmFATA

SEQ ID NO:88 pSZ4198(BnLPAT2)

SEQ ID NO:89 pSZ4198 BnLPAT2(1.5)

SEQ ID NO:90 pSZ4206 TcLPAT2 GhomLPAT2A

SEQ ID NO:91 GhomLPAT2A编码序列的核苷酸序列，用于来自pSZ4412的转化DNA.

SEQ ID NO:92 GhomLPAT2B编码序列的核苷酸序列，用于来自pSZ4413的转化DNA.

SEQ ID NO:93 GhomLPAT2C编码序列的核苷酸序列，用于来自pSZ4414的转化DNA.

SEQ ID NO:95 GindPAT2B编码序列的核苷酸序列，用于来自pSZ4416的转化DNA.

SEQ ID NO:97 pSZEX61表达转化DNA的CnLPAAT.

SEQ ID NO:98 CpauLPAAT1

SEQ ID NO:99 CprocLPAAT1

SEQ ID NO:100 CpaiLPAAT1

SEQ ID NO:101 ChookLPAAT1

SEQ ID NO:102 CignLPAAT1

SEQ ID NO:103 CavigLPAAT1

SEQ ID NO:104 CavigLPAAT2

SEQ ID NO:105 CpalLPAAT1

SEQ ID NO:106 CuPSR23 LPAAT2

SEQ ID NO:107 CkoeLPAAT1

SEQ ID NO:108 CkoeLPAAT2

SEQ ID NO:109 CprocLPAAT2

SEQ ID NO:110 CavigGPAT9

SEQ ID NO:111 ChookGPAT9-1

SEQ ID NO:112 CignGPAT9-1

SEQ ID NO:113 CignGPAT9-2

SEQ ID NO:114 CpalGPAT9-1

SEQ ID NO:115 CpalGPATt9-2

SEQ ID NO:116 CavigDGAT1

SEQ ID NO:117 ChookDGAT1-1

SEQ ID NO:118 CavigLPCAT

SEQ ID NO:119 CpalLPCAT

SEQ ID NO:120 CpauLPCAT

SEQ ID NO:121 CschuLPCAT

SEQ ID NO:122 CavigPLA2-1

SEQ ID NO:123 CignPLA2-1

SEQ ID NO:124 CuPSR23PLA2-2

SEQ ID NO:125 CprocPLA2-2

SEQ ID NO:126包含于pSZ5654 PmKASII中的转化DNA的核苷酸序列

SEQ ID NO:127包含于pSZ5868 GarmFATA1(G108A)中的转化DNA的核苷酸序列

SEQ ID NO:128包含于pSZ6383 TcDGAT1和GarmFATA1(G108A)中的转化DNA的核苷酸序列

SEQ ID NO:129包含于pSZ6384 TcDGAT2-和GarmFATA1(G108A)中的转化DNA的核苷酸序列

SEQ ID NO:130包含于pSZ6377 GarmFATA1(G108A)中的转化DNA的核苷酸序列

SEQ ID NO:131包含于pSZ6315 BnOTE中的转化DNA的核苷酸序列

SEQ ID NO:132 pSZ6316中的BnOTE(D124A)的核苷酸序列：

SEQ ID NO:133 pSZ6317中的BnOTE(D209A)的核苷酸序列：

SEQ ID NO:134 pSZ6318中BnOTE(D124A，D209A)的核苷酸序列

SEQ ID NO:135包含于pSZ5083 GarmFATA1中的转化DNA的核苷酸序列

SEQ ID NO:136 Gm FATA野生型亲本基因；D3997，pSZ5083的氨基酸序列.

SEQ ID NO:137 Gm FATA S111A、V193A突变基因；D3998，pSZ5084的氨基酸序列.

SEQ ID NO:138 Gm FATA S111V，V193A突变基因；D3999，pSZ5085的氨基酸序列.

SEQ ID NO:139 Gm FATA G96A突变基因；D4000，pSZ5086的氨基酸序列.

SEQ ID NO:140 Gm FATA G96T突变基因；D4001，pSZ5087的氨基酸序列.

SEQ ID NO:141 GmFATA G96V突变基因；D4002，pSZ5088的氨基酸序列.

SEQ ID NO:142 GmFATA G108A突变基因；D4003，pSZ5089的氨基酸序列.

SEQ ID NO:143 GmFATA L91F突变基因；D4004，pSZ5090的氨基酸序列.

SEQ ID NO:144 GmFATA L91K突变基因；D4005，pSZ5091的氨基酸序列.

SEQ ID NO:145图10.GmFATA L91S突变基因；D4006，pSZ5092的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且L91S残基为小写粗体

SEQ ID NO:146 GmFATA G108V突变基因；D4007，pSZ5093的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且G108V残基为小写粗体。

SEQ ID NO:147 GmFATA T156F突变基因；D4008，pSZ5094的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156F残基为小写粗体。

SEQ ID NO:148 GmFATA T156A突变基因；D4009，pSZ5095的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156A残基为小写粗体。

SEQ ID NO:149 GmFATA T156K突变基因；D4010，pSZ5096的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156K残基为小写粗体。

SEQ ID NO:150 GmFATA T156V突变基因；D4011，pSZ5097的氨基酸序列.藻转运肽带下划线，FLAG抗原决定基标记为大写粗体且T156V残基为小写粗体。

SEQ ID NO:151 GmFATA S111A，V193A突变基因(D3998，pSZ5084)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttcgccaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgcggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:152 GmFATA S111V，V193A突变基因(D3999，pSZ5085)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同。

atggccaccgcatccactttctcggcgttcaatgcccgctgcggcgacctgcgtcgctcggcgggctccgggccccggcgcccagcgaggcccctccccgtgcgcgggcgcgccatccccccccgcatcatcgtggtgtcctcctcctcctccaaggtgaaccccctgaagaccgaggccgtggtgtcctccggcctggccgaccgcctgcgcctgggctccctgaccgaggacggcctgtcctacaaggagaagttcatcgtgcgctgctacgaggtgggcatcaacaagaccgccaccgtggagaccatcgccaacctgctgcaggaggtgggctgcaaccacgcccagtccgtgggctactccaccggcggcttcgtcaccacccccaccatgcgcaagctgcgcctgatctgggtgaccgcccgcatgcacatcgagatctacaagtaccccgcctggtccgacgtggtggagatcgagtcctggggccagggcgagggcaagatcggcacccgccgcgactggatcctgcgcgactacgccaccggccaggtgatcggccgcgccacctccaagtgggtgatgatgaaccaggacacccgccgcctgcagaaggtggacgcggacgtgcgcgacgagtacctggtgcactgcccccgcgagctgcgcctggccttccccgaggagaacaactcctccctgaagaagatctccaagctggaggacccctcccagtactccaagctgggcctggtgccccgccgcgccgacctggacatgaaccagcacgtgaacaacgtgacctacatcggctgggtgctggagtccatgccccaggagatcatcgacacccacgagctgcagaccatcaccctggactaccgccgcgagtgccagcacgacgacgtggtggactccctgacctcccccgagccctccgaggacgccgaggccgtgttcaaccacaacggcaccaacggctccgccaacgtgtccgccaacgaccacggctgccgcaacttcctgcacctgctgcgcctgtccggcaacggcctggagatcaaccgcggccgcaccgagtggcgcaagaagcccacccgcatggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagtga

SEQ ID NO:155 GmFATA G96V突变基因(D4002，pSZ5088)的核苷酸序列.启动子，3'UTR，选择标记和靶向臂与pSZ5083相同

SEQ ID NO:158 GmFATA L91K突变基因(D4005，pSZ5091)的核苷酸序列.

SEQ ID NO:159 GmFATA L91S突变基因(D4006，pSZ5092)的核苷酸序列.

SEQ ID NO:160 GmFATA G108V突变基因(D4007，pSZ5093)的核苷酸序列.

SEQ ID NO:161 GmFATA T156F突变基因(D4008，pSZ5094)的核苷酸序列.

SEQ ID NO:162 GmFATA T156A突变基因(D4009，pSZ5095)的核苷酸序列.

SEQ ID NO:163 GmFATA T156K突变基因(D4010，pSZ5096)的核苷酸序列.

SEQ ID NO:164 GmFATA T156V突变基因(D4011，pSZ5097)的核苷酸序列.

SEQ ID NO:165 pSZ6315中的野生型BnOTE的氨基酸序列(参见SEQ ID NO:131)

MATASTFSAFNARCGDLRRSAGSGPRRPARPLPVRGRASQLRKPALDPLRAVISADQGSISPVNSCTPADRLRAGRLMEDGYSYKEKFIVRSYEVGINKTATVETIANLLQEVACNHVQKCGFSTDGFATTLTMRKLHLIWVTARMHIEIYKYPAWSDVVEIETWCQSEGRIGTRRDWILRDSATNEVIGRATSKWVMMNQDTRRLQRVTDEVRDEYLVFCPREPRLAFPEENNSSLKKIPKLEDPAQYSMLELKPRRADLDMNQHVNNVTYIGWVLESIPQEIIDTHELQVITLDYRRECQQDDIVDSLTTSEIPDDPISKFTGTNGSAMSSIQGHNESQFLHMLRLSENGQEINRGRTQWRKKSSRMDYKDHDGDYKDHDIDYKDDDDK

SEQ ID NO:166 pSZ6316中BnOTE(D124A)的氨基酸序列(参见SEQ ID NO:132)

MATASTFSAFNARCGDLRRSAGSGPRRPARPLPVRGRASQLRKPALDPLRAVISADQGSISPVNSCTPADRLRAGRLMEDGYSYKEKFIVRSYEVGINKTATVETIANLLQEVACNHVQKCGFSTAGFATTLTMRKLHLIWVTARMHIEIYKYPAWSDVVEIETWCQSEGRIGTRRDWILRDSATNEVIGRATSKWVMMNQDTRRLQRVTDEVRDEYLVFCPREPRLAFPEENNSSLKKIPKLEDPAQYSMLELKPRRADLDMNQHVNNVTYIGWVLESIPQEIIDTHELQVITLDYRRECQQDDIVDSLTTSEIPDDPISKFTGTNGSAMSSIQGHNESQFLHMLRLSENGQEINRGRTQWRKKSSRMDYKDHDGDYKDHDIDYKDDDDK

SEQ ID NO:167 pSZ6317中BnOTE(D209A)的氨基酸序列(参见SEQ ID NO:133)

MATASTFSAFNARCGDLRRSAGSGPRRPARPLPVRGRASQLRKPALDPLRAVISADQGSISPVNSCTPADRLRAGRLMEDGYSYKEKFIVRSYEVGINKTATVETIANLLQEVACNHVQKCGFSTDGFATTLTMRKLHLIWVTARMHIEIYKYPAWSDVVEIETWCQSEGRIGTRRDWILRDSATNEVIGRATSKWVMMNQDTRRLQRVTAEVRDEYLVFCPREPRLAFPEENNSSLKKIPKLEDPAQYSMLELKPRRADLDMNQHVNNVTYIGWVLESIPQEIIDTHELQVITLDYRRECQQDDIVDSLTTSEIPDDPISKFTGTNGSAMSSIQGHNESQFLHMLRLSENGQEINRGRTQWRKKSSRMDYKDHDGDYKDHDIDYKDDDDK

SEQ ID NO:168 pSZ6318中BnOTE(D124A，D209A)的氨基酸序列(参见SEQ ID NO:134)

MATASTFSAFNARCGDLRRSAGSGPRRPARPLPVRGRASQLRKPALDPLRAVISADQGSISPVNSCTPADRLRAGRLMEDGYSYKEKFIVRSYEVGINKTATVETIANLLQEVACNHVQKCGFSTAGFATTLTMRKLHLIWVTARMHIEIYKYPAWSDVVEIETWCQSEGRIGTRRDWILRDSATNEVIGRATSKWVMMNQDTRRLQRVTAEVRDEYLVFCPREPRLAFPEENNSSLKKIPKLEDPAQYSMLELKPRRADLDMNQHVNNVTYIGWVLESIPQEIIDTHELQVITLDYRRECQQDDIVDSLTTSEIPDDPISKFTGTNGSAMSSIQGHNESQFLHMLRLSENGQEINRGRTQWRKKSSRMDYKDHDGDYKDHDIDYKDDDDK

SEQ ID NO:169 CpauLPAAT

SEQ ID NO:170 CprocLPAAT1i

SEQ ID NO:171 CpaiLPAAT1

SEQ ID NO:172 ChookLPAAT1

SEQ ID NO:173 CignLPAAT1

SEQ ID NO:174 CavigLPAAT1

SEQ ID NO:175 CavigLPAAT2

SEQ ID NO:176 CpalLPAAT1

MAIAAAAVIVPLGLLFFVSGLIVNLVQAVCFVLIRPLSKNTYRRINRVVAELLWLELVWLIDWWAGVKIKVFTDHETLSLMGKEHALVICNHKSDIDWLVGWVLAQRSGCLGSTLAVMKKSSKFLPVIGWSMWFSEYLPESDDAVAQWCRDIFVEKDALLDKHNAEDTFSGQELQDTGRPIKSLLVVISWAVLVIFGAVKFLQWSSLLSSWKGLAFSGVGLGIITLLMHILILFSQSERSTPAKVAPAKPKKDGESSKTEIEKENVPGALLGQGREHPEVRPEPPEGLPPALLAGPVRGGHPLHPRQAAGRPAVRHLLRPARAPQRADPPHQGLRVLRVPHALLRARHLRRDRGHPQDLPPPHHAAHVQGPVLRAARAPEAPPDEGP

SEQ ID NO:177 CuPSR23 LPAAT2

MAIAAAAVIFLFGLIFFASGLIINLFQALCFVLIRPLSKNAYRRINRVFAELLLSELLCLFDWWAGAKLKLFTDPETFRLMGKEHALVIINHMTELDWMVGWVMGQHFGCLGSIISVAKKSTKFLPVLGWSMWFSEYLYLERSWAKDKSTLKSHIERLIDYPLPFWLVIFVEGTRFTRTKLLAAQQYAVSSGLPVPRNVLIPRTKGFVSCVSHMRSFVPAVYDVTVAFPKTSPPPTLLNLFEGQSIMLHVHIKRHAMKDLPESDDAVAEWCRDKFVEKDALLDKHNAEDTFSGQEVCHSGSRQLKSLLVVISWVVVTTFGALKFLQWSSWKGKAFSAIGLGIVTLLMHVLILSSQAERSNPAEVAQAKLKTGLSISKKVTDKEN

SEQ ID NO:178 CkoeLPAAT1

MAIPAAVAVIPIGLLFIISGLIVNLIQAVVYVLIRPLSKNLHRKINKPIAELLWLELIWLVDWWAGIKVEVYADSQTLELMGKEHALLICNHRSDIDWLVGWVLAQRARCLGSALAIMKKSAKFLPVIGWSMWFSDYIFLDRTWAKDEKTLKSGFERLADFPMPFWLALFVEGTRFTKAKLLAAQEYAASRGLPVPQNVLIPRTKGFVTAVTHMRSYVPAIYDCTVDISKAHPAPSILRLIRGQSSVVKVQITRHSMQELPETADGISQWCMDLFVTKDGFLEKYHSKDIFGSLPVQNIGRPVKSLIVVLCWYCLMAFGLFKFFMWSSLLSSWEGILSLGLILLAVAIVMQILIQSTESERSTPVKSIQKDPSKETLLQN

SEQ ID NO:179 CkoeLPAAT2

SEQ ID NO:180 CprocLPAAT2

MAIPAAVAVIPIGLLFIISGLIVNLIQAVVYVLIRPLSKNLYRKINKPIAELLWLELIWLVDWWAGIKVEVYADSETLESMGKEHALLICNHRSDIDWLVGWVLAQRARCLGSALAIMKKSAKFLPVIGWSMWFSDYIFLDRTWEKDEKTLKSGFERLADFPMPFWLALFVEGTRFTKAKLLAAQEFAASRGLPVPQNVLIPRTKGFVTAVTHMRSYVPAIYDCTVDISKAHPAPSILRLIRGQSSVVKVQITRHSMQELPETPDGISQWCMDLFVTKDAFLEKYHSKDIFGSLPVHDIGRPVKSLIVVLCWYSLMAFGFYKFFMWSSLLSSWEGILSLGLVLIVIAIVMQILIQSSESERSTPVKSVQKDPSKETLLQN

SEQ ID NO:181 CavigGPAT9

MATGGSLKPSSSDLDLDHPNIEDYLPSGSSINEPAGKLRLRDLLDISPTLTEAAGAIVDDSFTRCFKSIPREPWNWNLYLFPLWCIGVLIRYFILFPGRVIVLTMGWITVISSFIAVRVLLKGHDALQIKLERLIVQLLCSSFVASWTGVVKYHGPRPSIRPKQVYVANHTSMIDFFILDQMTVFSVIMQKHPGWVGLLQSTLLESVGCIWFDRAEAKDRGIVAKKLWDHVHGEGNNPLLIFPEGTCVNNNYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSKKQSFTRHLLQLMTSWAVVCDVWYLEPQTLKPGETPIEFAERVRDIISARAGLKKVPWDGYLKYSRPSPKHRERKQQTFAESVLQRLEE

SEQ ID NO:182 ChookGPAT9-1

MATAGSLKPSRSELDFDRPNIEDYLPSGSSIIEPAGKLRLRDLLDISPTLTEAAGAIVDDSFTRCFKSNPPEPWNWNIYLFPLWCFGVLIRYLILFPARVIVLTIGWIIFLSSFIPVHLLLKGHDALRIKLERLLVELICSFFVASWTGVVKYHGPRPSIRPKQVYVANHTSMIDFFILDQMTVFSVIMQKHPGWVGLLQSTLLESVGCIWFDRAEAKDRGIVAKKLWDHVHGEGNNPLLIFPEGTCVNNNYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSKKQSFTRHLLQLMTSWAVVCDVWYLEPQTLKPGETPIEFAERVRDIISVRAGLKKVPWDGYLKYSRPSPKHTERKQQNFAESVLQRLEKK

SEQ ID NO:183 CignGPAT9-1

MATGGRLKPSSSELDLDRANTEDYLPSGSSINEPVGKLRLRDLLDISPTLTEAAGAIVDDSFTRCFKSIPPEPWNWNIYLFPLWCFGVLIRYFILFPARVIVLTIGWITVISSFTAVRFLLKGHNALQIKLERLIVQLLCSSFVASWTGVVKYHGPRPSIRPKQVYVANHTSMIDFLILDQMTVFSVIMQKHPGWVGLLQSTLLESVGCIWFNRAEAKDREIVAKKLWDHVHGEGNNPLLIFPEGTCVNNHYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSRKQSFTMHLLQLMTSWAVVCDVWYLEPQTLKPGETAIEFAERVRDIISVRAGLKKVPWDGYLKYSRPSPKHRESKQQSFAESVLRRLEEK

SEQ ID NO:184 CignGPAT9-2

MATGGRLKPSSSELDLDRANTEDYLPSGSSINEPVGKLRLRDLLDISPTLTEAAGAIVDDSFTRCFKSIPPEPWNWNIYLFPLWCFGVLIRYFILFPARVIVLTIGWITVISSFTAVRFLLKGHNALQIKLERLIVQLLCSSFVASWTGVVKYHGPRPSIRPKQVYVANHTSMIDFLILDQMTVFSVIMQKHPGWVGLLQSTLLESVGCIWFNRAEAKDREIVAKKLWDHVHGEGNNPLLIFPEGTCVNNHYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSKKHSFTRHLLQLMTSWAVVCDVWYLEPQTLKPGETPIEFAERVRDIISVRADLKKVPWDGYLKYSRPSPKHRERKQQKFAESVLRRLEEK

SEQ ID NO:185 CpalGPAT9-1

MATAGRLKPSSSELELDLDRPNIEDYLPSGSSINEPAGKLRLRDLLDISPMLTEAAGAIVDDSFTRCFKSIPPEPWNWNIYLFPLWCFGVLIRYLILFPARVIVLTVGWITVISSFITVRFLLKGHDSLRIKLERLIVQLFCSSFVASWTGVVKYHGPRPSIRPQQVYVANHTSMIDFIILNQMTVFSAIMQKHPGWVGLIQSTILESVGCIWFNRAEAKDREIVAKKLLDHVHGEGNNPLLIFPEGTCVNNHYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSKKQSFTMHLLQLMTSWAVVCDVWYLEPQTLKPGETPIEFAERVRDIISVRAGLKKVPWDGYLKYSRPSPKHRERKQQSFAESVLRRLEKR

SEQ ID NO:186 CpalGPATt9-2

MATAGRLKPSSSELELDLDRPNIEDYLPSGSSINEPAGKLRLRDLLDISPMLTEAAGAIVDDSFTRCFKSIPPEPWNWNIYLFPLWCFGVLIRYLILFPARVIVLTVGWITVISSFITVRFLLKGHDSLRIKLERLIVQLFCSSFVASWTGVVKYHGPRPSIRPQQVYVANHTSMIDFIILNQMTVFSAIMQKHPGWVGLIQSTILESVGCIWFNRAEAKDREIVAKKLLDHVHGEGNNPLLIFPEGTCVNNHYSVMFKKGAFELGCTVCPVAIKYNKIFVDAFWNSKKLSFTMHLLQLMTSWAVVCDVWYLEPQTLKPGETPIEFAERVRDIISVRAGLKKVPWDGYLKYSRPSPKHRERKQQTFAESVLRRLEEKGNVVPTVN

SEQ ID NO:187 CavigDGAT1

MAIADGGIIGAAGSISALTADTDPPSLRRRNVPAGQASAVSAFSTESMAKHLCDPSREPSPSPKSSDDGKDPDIGSVDSLNEKPSSPAAGKGRLQHDLRFTYRASSPAHRKVKESPLSSSNIFKQSHAGLFNLCVVVLVAVNSRLIIENLMKYGLLIKTGFWFSSRSLRDWPLFMCCLSLPIFPLAAFLVEKLAQKNRLQEPTVVCCHVLITSVSILYPVLVILRCDSAVLSGVALMLFACIVWLKLVSYAHSNYDMRYVAKSLDKGEPVVDSVIADHPYRVDYKDLVYFMVAPTLCYQLSYPLTPCVRKSWIARQVMKLVLFTGVMGFIVEQYINPIVQNSKHPLKGDLLYAIERVLKLSVPNLYVWLCMFYCFFHLWLNILAELICFGDREFYKDWWNAKTVEEYWRMWNMPVHKWMVRHIYFPCLRNGIPRGVAVLIAFLVSAVFHELCIAVPCHVFKLWAFIGIMFQVPLVLVSNCLQKKFQSSMAGNMFFWFIFCIFGQPMCVLLYYHDLMNRKGSRID

SEQ ID NO:188 ChookDGAT1-1

MAIADGGSAGAAGSISGSDPSPSTAPSLRRRNASAGQAFSTESMARDLCDPSREPSLSPKSSDDGKDPADDIGAADSVDSGGVKDEKPSSQAAAKARLEHDLRFTYRASSPAHRKVKESPLSSSNIFKQSHAGLFNLCVVVLVAVNSRLIIENLMKYGLLIKTGFWFSSRSLRDWPLFMCCLSLPIFPLAAFLVEKLAQKNRLQEPTVVCCHVIITSVSILYPVLVILRCDSAVLSGVALMLFACIVWLKLVSYAHANYDMRSVAKSLDKGETVADSVIVDHPYRVDYKDLVYFMVAPTLCYQLSYPLTPYVRKSWVARQVMKLVLFTGVMGFIVEQYINPIVQNSKHPLKGDLLYAIERVLKLSVPNLYVWLCMFYCFFHLWLNILAELTCFGDREFYKDWWNAKTVEEYWRMWNMPVHKWMVRHIYFPCLRNGIPRGVAVLIAFLVSAVFHELCIAVPCHVFKLWAFIGIMFQVPLVLVSNCLQKKFQSSMAGNMFFWFIFCIFGQPMCVLLYYHDLMNRKGSRID

SEQ ID NO:189 CavigLPCAT

MGLVSVAAAIGVSVPVARFLLCFLATIPVSFLWRLVPGRLPKHLYSAASGAILSYLSFGASSNLHFIVPMTLGYLSMLFFRPFSGLLTFFLGFGYLIGCHVYYMSGDAWKEGGIDATGALMVLTLKVISCSMNYNDGLLKEEGLRESQKKNRLTKMPSLIEYFGYCLCCGSHFAGPVYEMKDYLEWTEGKGIWSRSQKEPKPSPFGGALRAIIQAAVCMAMYLYLVPHHPLTRFTEPVYYEWGFFRRLSYQYMAALTARWKYYFIWSISEASLIISGLGFSGWTESSPPKPRWDRAKNVDIIGVEFAKSSVQLPLVWNIQVSIWLRHYVYDRLVQNGKRPGFFQLLATQTVSAVWHGLYPGYIIFFVQSALMIAGSRVIYRWQQAVPPKMGLVKNIFVFFNFAYTLLVLNYSAVGFMVLSMHETLASYGSVYYIGTILPITLILLSYVIKPGKPARSKAHKEQ

SEQ ID NO:190 CpalLPCAT

MELGSVAAAIGVSVPVARFLLCFLATIPVSFLWRLVPGRLPKHLYSAASGAILSYLSFGPSSNLHFIVPMTLGYLSMLFFRPFSGLLTFFLGFGYLIGCHVYYMSGDAWKEGGIDATGALMVLTLKVISCSINYNDGLLKEEGLRESQKKNRLTKMPSLIEYIGYCLCCGSHFAGPVYEMKDYLEWTEGKGVWSHSEKEPKPSPFGGALRAIIQAAVCMAMYMYLVPHHPLSRFTEPVYYEWGFFRRLSYQYMAGLTARWKYYFIWSISEASLIISGLGFSGWTESSPPKPRWDRAKNVDIIGVEFAKSSVQLPLVWNIQVSTWLRHYVYDRLVQNGKRPGFFQLLATQTVSAIWHGLYPGYIIFFVQSALMIAGSRVIYRWQQAVPPKMGLVKNIFVFFNFAYTLLVLNYSAVGFMVLSMHETLASYGSVYYIGTILPITLILLSYVIKPGKPARSKAHKEQ

SEQ ID NO:191 CpauLPCAT

MELEIGSVAAAIGVSVPVARFLLCFLATIPVSFLCRLLPARLPKHLYSAASGAILSYLSFGPSSNLHFIVPMSLGYLSMLFFRPFSGLLTFFLGFGYLIGCHVYYMSGDAWKEGGIDATGALMVLTLKVISCSINYNDGLLKEEGLRESQKKNRLTKMPSLIEYFGYCLCCGSHFAGPVYEMKDYLEWTEGKGIWSRSEKDPKPSPFGGALRAIIQAAVCMAMHMYLVPHHPLTRFTEPVYYEWGFFRRLSYQYMAAQTARWKYYFIWSISEASLIISGLGFSGWTESSPPKPRWDKAKNVDIIGVEFAKSSVQLPLVWNIQVSTWLRHYVYDRLVQNGKRPGFFQLLATQTVSAVWHGLYPGYIIFFVQSALMIAGSRVIYRWQQAVPQKMGLVKNIFVFFNFAYTLLVLNYSAVGFMVLSMHETLASYGSVYYIGTILPITLILLSYVIKPGKPTRSKVHKEQ

SEQ ID NO:192 CschuLPCAT

MELEMEPLAAAIGVSVAVFRFLVCFIATIPVSFICRLVPGGLPRHLFSAASGAVLSYLSFGFSSNLHFLVPMTLGYLSMILFRRFCGILTFFLGFGYLIGCHVYYMSGDAWKEGGIDATGALMVLTLKVISCSINYNDGLLKEEGLRESQKKNRLIRLPSLIEYFGYCLCCGSHFAGPVYEMKDYLDWTEGKGIWSHSEKGPKPSPLRAALRAIIQAGFCMAMYLYLVPHYPLTRFTDPVYYEWGILRRLSYQYMASFTARWKYYFIWSISEASLIISGLGFSGWTESSPPKPRWDRAKNVDILGVELAKSSVQIPLVWNIQVSTWLRHYVYDRLVQNGKRPGFLQLLATQTVSAIWHGVYPGYLIFFVQSALMIAGSRAIYRWQQAVPPKMSLVKNTLVFFNFAYTLLVLNYSAVGFMVLSMHETLASYGSVYYVGTILPVTLILLGYVIKPGKSPRSKASKEQ

SEQ ID NO:193 CavigPLA2-1

MNFDFLSNIPWFGAKASDNAGSSFGSATIVIQQPPPVSRGFDIRHWGWPWSVLSVLPWGKPGCDELRAPPTTINRRLKRNATSMHSSAVRGNAEAARVRFRPYVSKVPWHTGFRGLLSQLFPRYGHYCGPNWSSGKNGGSPVWDQRPIDWLDYCCYCHDIGYDTHDQAKLLEADLAFLECLERPSYPTKGDAHVAHMYKTMCVTGLRNVLIPYRTQLLRLNSRQPLIDFGWLSNAAWKGWNAQKS

SEQ ID NO:194 CignPLA2-1

MNLDFLSKIPWFEAKASENPGLNLGSTTIVIKQPRQGFDIRHWGWPWSVLTWGNRVTDEVHAPPTTINRRLKRNATGPAVQGDTEAARLRFRPYVSKVPWHTGFRGLLSQLFPRYGHYCGPNWSSGKNGGSPVWDQRPIDWLDYCCYCHDIGYDTHDQAKLLEADLAFLECLERPSYPTTGDAHVAHMYKTMCVTGLRNVLIPYRTQLLRLNFRQPLIDFGWLSNAAWKGWSAQKT

SEQ ID NO:195 CuPSR23PLA2-2

MVHLPHTLKLGLVIAISISGLCFSSTPARALNVGIQAAGVTVSVGKGCSRKCESDFCKVPPFLRYGKYCGLMYSGCPGEKPCDGLDACCMKHDACVQAKNNDYLSQECSQNLLNCMASFRMSGGKQFKGSTCQVDEVVDVLTVVMEAALLAGRYLHKP

SEQ ID NO:196 CprocPLA2-2

MVHLPHTLKLGLVIAISISGLCLSSTPARALNVGIQAAGVTVSVGKGCSRKCESDFCKVPPFLRYGKYCGLMYSGCPGEKPCDGLDACCMKHDACVQAKNDDYLSQECSQNLLNCMASFRMSGGKQFKGSTCQVDEVVDVLTVVMEAALLAGRYLHKP

SEQ ID NO:197 pSZ4329

SEQ ID NO:198 pSZ5078

Claims

1.一种重组载体构建体或宿主细胞，其包含编码具有酰基转移酶活性的蛋白质的核酸，其中所述酰基转移酶的氨基酸序列具有与以下各者的酰基转移酶至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

2.根据权利要求1所述的重组，其中所述蛋白质的氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少96.3％的一致性；

b.与表5的进化枝2的酰基转移酶至少93.9％的一致性；

c.与表5的进化枝3的酰基转移酶至少86.5％的一致性；或

d.与表5的进化枝4的酰基转移酶至少78.5％的一致性。

3.根据权利要求1所述的重组载体构建体或宿主细胞，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少98％的一致性；

b.与表5的进化枝2的酰基转移酶至少98％的一致性；

c.与表5的进化枝3的酰基转移酶至少90％的一致性；或

d.与表5的进化枝4的酰基转移酶至少80％的一致性。

4.根据权利要求1所述的重组载体构建体或宿主细胞，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少99％的一致性；

b.与表5的进化枝2的酰基转移酶至少99％的一致性；

c.与表5的进化枝3的酰基转移酶至少95％的一致性；或

d.与表5的进化枝4的酰基转移酶至少85％的一致性。

5.根据权利要求1所述的重组载体构建体或宿主细胞，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少98％的一致性；或

b.与表5的进化枝4的酰基转移酶至少90％的一致性。

6.根据权利要求1所述的重组载体构建体或宿主细胞，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少99％的一致性；或

b.与表5的进化枝4的酰基转移酶至少95％的一致性。

7.根据权利要求1所述的重组载体构建体或宿主细胞，其中所述蛋白质的所述氨基酸序列包含与表5的进化枝4的酰基转移酶至少98％或99％的一致性。

8.根据权利要求1至7中任一项所述的核酸，其中编码所述酰基转移酶的所述核酸经密码子优化以用于在原壁菌属(Prototheca)或小球藻属(Chlorella)中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

9.根据权利要求8所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

10.根据权利要求8所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

11.根据权利要求1至10中任一项所述的宿主细胞，其中所述细胞为微藻细胞、微生物细胞或植物细胞，并且其中所述宿主细胞的脂肪酸谱或sn-2谱通过所述核酸的表达而改变。

12.根据权利要求11所述的宿主细胞，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

13.根据权利要求12所述的宿主细胞，其中所述细胞为莫氏原壁菌(Protothecamoriformis)细胞。

14.根据权利要求1至13中任一项所述的重组载体构建体或宿主细胞，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)或磷脂酶A2(PLA2)。

15.根据权利要求14所述的重组载体构建体或宿主细胞，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)。

16.一种培养宿主细胞的方法，所述宿主细胞包含编码具有酰基转移酶活性的蛋白质的重组核酸，其中所述酰基转移酶的氨基酸序列具有与以下各者的酰基转移酶至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

17.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少96.3％的一致性；

b.与表5的进化枝2的酰基转移酶至少93.9％的一致性；

c.与表5的进化枝3的酰基转移酶至少86.5％的一致性；或

d.与表5的进化枝4的酰基转移酶至少78.5％的一致性。

18.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少98％的一致性；

b.与表5的进化枝2的酰基转移酶至少98％的一致性；

c.与表5的进化枝3的酰基转移酶至少90％的一致性；或

d.与表5的进化枝4的酰基转移酶至少80％的一致性。

19.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝16的酰基转移酶至少99％的一致性；

b.与表5的进化枝2的酰基转移酶至少99％的一致性；

c.与表5的进化枝3的酰基转移酶至少95％的一致性；或

d.与表5的进化枝4的酰基转移酶至少85％的一致性。

20.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少98％的一致性；或

b.与表5的进化枝4的酰基转移酶至少90％的一致性。

21.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含与表5的进化枝3的酰基转移酶至少99％的一致性；或

b.与表5的进化枝4的酰基转移酶至少95％的一致性。

22.根据权利要求16所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝4的酰基转移酶至少98％或99％的一致性。

23.根据权利要求16至22中任一项所述的方法，其中编码所述酰基转移酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

24.根据权利要求23所述的方法，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

25.根据权利要求23所述的方法，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

26.根据权利要求16至25中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

27.根据权利要求26所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

28.根据权利要求27所述的方法，其中所述细胞为莫氏原壁菌细胞。

29.根据权利要求16至28中任一项所述的方法，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)或磷脂酶A2(PLA2)。

30.根据权利要求29所述的方法，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)。

31.一种在宿主细胞中制造甘油三酯油的方法，所述宿主细胞包含编码具有酰基转移酶活性的蛋白质的重组核酸，其中所述酰基转移酶的氨基酸序列具有与以下各者的酰基转移酶至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

32.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少96.3％的一致性；

b.与表5的进化枝2的酰基转移酶至少93.9％的一致性；

c.与表5的进化枝3的酰基转移酶至少86.5％的一致性；或

d.与表5的进化枝4的酰基转移酶至少78.5％的一致性。

33.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少98％的一致性；

b.与表5的进化枝2的酰基转移酶至少98％的一致性；

c.与表5的进化枝3的酰基转移酶至少90％的一致性；或

d.与表5的进化枝4的酰基转移酶至少80％的一致性。

34.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝16的酰基转移酶至少99％的一致性；

b.与表5的进化枝2的酰基转移酶至少99％的一致性；

c.与表5的进化枝3的酰基转移酶至少95％的一致性；或

d.与表5的进化枝4的酰基转移酶至少85％的一致性。

35.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少98％的一致性；或

b.与表5的进化枝4的酰基转移酶至少90％的一致性。

36.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少99％的一致性；或

b.与表5的进化枝4的酰基转移酶至少95％的一致性。

37.根据权利要求31所述的方法，其中所述蛋白质的所述氨基酸序列包含与表5的进化枝4的酰基转移酶至少98％或99％的一致性。

38.根据权利要求31至37中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

39.根据权利要求38所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

40.根据权利要求39所述的方法，其中所述细胞为莫氏原壁菌细胞。

41.根据权利要求31至40中任一项所述的方法，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)或磷脂酶A2(PLA2)。

42.根据权利要求41所述的方法，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)。

43.一种油组合物，其通过培养宿主细胞和从所述宿主细胞回收所述油组合物来制造，所述宿主细胞包含编码具有酰基转移酶活性的蛋白质的重组核酸，其中所述酰基转移酶的氨基酸序列具有与以下各者的酰基转移酶至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ ID NO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

44.根据权利要求43所述的油组合物，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少96.3％的一致性；

b.与表5的进化枝2的酰基转移酶至少93.9％的一致性；

c.与表5的进化枝3的酰基转移酶至少86.5％的一致性；或

d.与表5的进化枝4的酰基转移酶至少78.5％的一致性。

45.根据权利要求43所述的油组合物，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少98％的一致性；

b.与表5的进化枝2的酰基转移酶至少98％的一致性；

c.与表5的进化枝3的酰基转移酶至少90％的一致性；或

d.与表5的进化枝4的酰基转移酶至少80％的一致性。

46.根据权利要求43所述的油，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝1的酰基转移酶至少99％的一致性；

b.与表5的进化枝2的酰基转移酶至少99％的一致性；

c.与表5的进化枝3的酰基转移酶至少95％的一致性；或

d.与表5的进化枝4的酰基转移酶至少85％的一致性。

47.根据权利要求43所述的油，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少98％的一致性；或

b.与表5的进化枝4的酰基转移酶至少90％的一致性。

48.油43，其中所述蛋白质的所述氨基酸序列包含：

a.与表5的进化枝3的酰基转移酶至少99％的一致性；或

b.与表5的进化枝4的酰基转移酶至少95％的一致性。

49.油43，其中所述蛋白质的所述氨基酸序列包含与表5的进化枝4的酰基转移酶至少98％或99％的一致性。

50.根据权利要求43至49中任一项所述的油组合物，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

51.根据权利要求50所述的油组合物，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

52.根据权利要求51所述的油组合物，其中所述细胞为莫氏原壁菌细胞。

53.根据权利要求43至52中任一项所述的油组合物，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)、磷酸甘油酰基转移酶(GPAT)、二酰甘油酰基转移酶(DGAT)、溶血磷脂酰胆碱酰基转移酶(LPCAT)或磷脂酶A2(PLA2)。

54.根据权利要求53所述的油组合物，其中所述酰基转移酶为溶血磷脂酸酰基转移酶(LPAAT)。

55.一种具有酰基转移酶活性的重组蛋白，其中所述蛋白质的氨基酸序列具有与以下各者的酰基转移酶至少75％、80％、85％、90％、95％、98％、99％或100％的一致性：SEQ IDNO:23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、42、42、43、44、45、46、47、48、49、50、52、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195或196。

56.一种重组载体构建体或宿主细胞，其包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQID NO:165、166、167或168至少80％或85％的一致性，所述变体硫酯酶包含氨基酸变体D124A、D209A、D127A或D212A中的一种或多种。

57.根据权利要求56所述的重组载体构建体或宿主细胞，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少90％的一致性。

58.根据权利要求56所述的重组载体构建体或宿主细胞，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少95％的一致性。

59.根据权利要求55至58中任一项所述的重组载体构建体或宿主细胞，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

60.根据权利要求59所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

61.根据权利要求59所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

62.一种宿主细胞，其表达根据权利要求59至61中任一项所述的重组蛋白，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

63.根据权利要求62所述的宿主细胞，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

64.根据权利要求63所述的宿主细胞，其中所述细胞为莫氏原壁菌细胞。

65.一种培养宿主细胞的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:165、166、167或168至少80％或85％的一致性，所述变体硫酯酶包含氨基酸变体D124A、D209A，或D124A和D209A两者。

66.根据权利要求65所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少90％的一致性。

67.根据权利要求65所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少95％的一致性。

68.根据权利要求65至67中任一项所述的核酸，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

69.根据权利要求68所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

70.根据权利要求68所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

71.根据权利要求65至70中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

72.根据权利要求71所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

73.根据权利要求72所述的方法，其中所述细胞为莫氏原壁菌细胞。

74.一种在宿主细胞中制造甘油三酯油的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:165、166、167或168至少80％或85％的一致性，所述变体硫酯酶包含氨基酸变体D124A、D209A或D124A和D209A两者，所述方法包含以下步骤：

a)提供所述宿主细胞；

b)将固定碳源添加至培养基；和

c)将所述宿主细胞培养一段时间。

75.根据权利要求74所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少90％的一致性。

76.根据权利要求74所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ ID NO:165、166、167或168中的任一种至少95％的一致性。

77.根据权利要求74至76中任一项所述的核酸，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

78.根据权利要求77所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

79.根据权利要求77所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

80.根据权利要求74至79中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

81.根据权利要求80所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

82.根据权利要求81所述的方法，其中所述细胞为莫氏原壁菌细胞。

83.一种油组合物，其通过培养宿主细胞和从所述宿主细胞回收所述油组合物来制造，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:165、166、167或168至少80％或85％的一致性，所述变体硫酯酶包含氨基酸变体D124A、D209A、或D124A和D209A两者，并且其中所述油组合物包含由所述宿主细胞制造的甘油三酯油和甾醇。

84.根据权利要求83所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少90％的一致性。

85.根据权利要求83所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少95％的一致性。

86.根据权利要求83至85中任一项所述的油，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

87.根据权利要求86所述的油，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

88.根据权利要求86所述的油，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

89.根据权利要求83至88中任一项所述的油组合物，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

90.根据权利要求89所述的油组合物，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

91.根据权利要求90所述的油组合物，其中所述细胞为莫氏原壁菌细胞。

92.一种重组载体构建体或宿主细胞，其包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQID NO:165、166、167或168至少80％或85％的一致性，并且其中所述变体硫酯酶包含氨基酸变体D124A、D209A，或D124A和D209A两者。

93.一种重组载体构建体或宿主细胞，其包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少80％或85％的一致性，所述变体硫酯酶包含以下一种或多种氨基酸变体：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V、T156F、T156A、T156K、T156V或V193A。

94.根据权利要求92所述的重组载体构建体或宿主细胞，其中所述变体硫酯酶的所述氨基酸序列具有与SEQ ID NO:165、166、167或168至少90％的一致性。

95.根据权利要求93所述的重组载体构建体或宿主细胞，其中所述变体硫酯酶的所述氨基酸序列具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少90％的一致性。

96.根据权利要求92所述的重组载体构建体或宿主细胞，其中所述变体硫酯酶的所述氨基酸序列具有与SEQ ID NO:165、166、167或168至少95％的一致性。

97.根据权利要求93所述的重组载体构建体或宿主细胞，其中所述变体硫酯酶的所述氨基酸序列具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少95％的一致性。

98.根据权利要求92至97中任一项所述的核酸，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

99.根据权利要求98所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

100.根据权利要求98所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

101.根据权利要求92至100中任一项所述的宿主细胞，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

102.根据权利要求101所述的宿主细胞，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

103.根据权利要求102所述的宿主细胞，其中所述细胞为莫氏原壁菌细胞。

104.一种培养宿主细胞的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:165、166、167或168至少80％或85％的一致性，并且其中所述变体硫酯酶包含氨基酸变体D124A、D209A，或D124A和D209A两者。

105.一种培养宿主细胞的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少80％或85％的一致性，所述变体硫酯酶包含以下一种或多种氨基酸变体：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、T156F、T156A、T156K、T156V或V193A。

106.根据权利要求104所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少90％的一致性。

107.根据权利要求105所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:137、138、139、140、141、142、143、144、145、146、147、148、149或中的任一种至少90％的一致性。

108.根据权利要求104所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少90％的一致性。

109.根据权利要求105所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:137、138、139、140、141、142、143、144、145、146、147、148、149或150中的任一种至少95％的一致性。

110.根据权利要求104至109中任一项所述的核酸，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

111.根据权利要求110所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

112.根据权利要求110所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

113.根据权利要求104至112中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

114.根据权利要求113所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

115.根据权利要求114所述的方法，其中所述细胞为莫氏原壁菌细胞。

116.一种制造甘油三酯油的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列与SEQ ID NO:165、166、167或168至少80％或85％的一致性，并且其中所述变体硫酯酶包含氨基酸变体D124A、D209A，或D124A和D209A两者，所述方法包含以下步骤：

a)提供所述宿主细胞；

b)将固定碳源添加到培养基；和

c)将所述宿主细胞培养一段时间。

117.一种制造甘油三酯油的方法，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少80％或85％的一致性，所述变体硫酯酶包含以下一种或多种氨基酸变体：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V、T156F、T156A、T156K、T156V或V193A，所述方法包含以下步骤：

a)提供所述宿主细胞；

b)将固定碳源添加到培养基；和

c)将所述宿主细胞培养一段时间。

118.根据权利要求116所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少90％的一致性。

119.根据权利要求117所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150中的任一种至少90％的一致性。

120.根据权利要求116所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:165、166、167或168中的任一种至少90％的一致性。

121.根据权利要求117所述的方法，其中编码所述蛋白质的所述核酸具有与SEQ IDNO:SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150中的任一种至少95％的一致性。

122.根据权利要求116至121中任一项所述的核酸，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以用于在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

123.根据权利要求122所述的核酸，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

124.根据权利要求122所述的核酸，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

125.根据权利要求116至124中任一项所述的方法，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

126.根据权利要求125所述的方法，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

127.根据权利要求126所述的方法，其中所述细胞为莫氏原壁菌细胞。

128.一种油组合物，其通过培养宿主细胞和从所述宿主细胞回收所述油组合物来制造，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:165、166、167或168至少80％或85％的一致性，并且其中所述变体硫酯酶包含氨基酸变体D124A、D209A，或D124A和D209A两者。

129.一种油组合物，其通过培养宿主细胞和从所述宿主细胞回收所述油组合物来制造，所述宿主细胞包含编码具有脂肪酰基-ACP硫酯酶活性的蛋白质的核酸，其中所述蛋白质为变体硫酯酶并且所述变体硫酯酶的氨基酸序列具有与SEQ ID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150至少80％或85％的一致性，所述变体硫酯酶包含以下一种或多种氨基酸变体：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V、T156F、T156A、T156K、T156V或V193A，并且其中所述油组合物包含由所述宿主细胞制造的甘油三酯油和甾醇。

130.根据权利要求128所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQID NO:165、166、167或168中的任一种至少90％的一致性。

131.根据权利要求129所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150中的任一种至少90％的一致性。

132.根据权利要求128所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQID NO:165、166、167或168中的任一种至少90％的一致性。

133.根据权利要求129所述的油组合物，其中编码所述蛋白质的所述核酸具有与SEQID NO:137、138、139、140、141、142、143、144、145、146、147、148、149或150中的任一种至少95％的一致性。

134.根据权利要求128至133中任一项所述的油组合物，其中编码所述脂肪酰基-ACP硫酯酶的所述核酸经密码子优化以在原壁菌属或小球藻属中表达，并且其中所述编码序列在所述编码序列的至少60％所述密码子中含有表1或表2中的最优选或次最优选的密码子，使得经密码子优化的序列在原壁菌属或小球藻属中比非密码子优化的序列更有效地转译。

135.根据权利要求134所述的油组合物，其中所述编码序列在所述编码序列的至少80％所述密码子中含有表1或表2中的最优选或次最优选密码子。

136.根据权利要求134所述的油组合物，其中所述编码序列在所述编码序列的至少90％所述密码子中含有表1或表2中的最优选或次最优选密码子。

137.根据权利要求128至136中任一项所述的油组合物，其中所述细胞为微藻细胞、微生物细胞或植物细胞。

138.根据权利要求137所述的油组合物，其中所述微藻细胞为原壁菌属细胞或小球藻属细胞。

139.油组合物权利要求138，其中所述细胞为莫氏原壁菌细胞。

140.一种变体甘蓝型油菜(Brassica napus)脂肪酰基-ACP硫酯酶，其具有与SEQ IDNO:165、166、167或168具有至少80％或85％的一致性的氨基酸序列，并且其中所述变体硫酯酶包含氨基酸变体D124A、D209A或D124A和D209A两者。

141.一种变体山竹(Garcinia mangostana)脂肪酰基-ACP硫酯酶，其具有与SEQ IDNO:137、138、139、140、141、142、143、144、145、146、147、148、149或150具有至少80％或85％一致性的氨基酸序列，其中所述变体硫酯酶包含以下一种或多种氨基酸变体：L91F、L91K、L91S、G96A、G96T、G96V、G108A、G108V、S111A、S111V、T156F、T156A、T156K、T156V或V193A。