CN104302770A

CN104302770A - 脂质和生长性状基因

Info

Publication number: CN104302770A
Application number: CN201380021610.3A
Authority: CN
Inventors: C·约恩
Original assignee: Sapphire Energy Inc
Current assignee: Sapphire Energy Inc
Priority date: 2012-02-24
Filing date: 2013-02-25
Publication date: 2015-01-21
Also published as: WO2013130406A1; CA2863638A1; EP2817409A4; US20160194649A1; AU2018236915A1; AU2013226364A1; EP2817409A1

Abstract

本发明所公开的内容提供了新的脂质和生长基因，该基因在生物过表达时导致脂质分布，和/或脂质含量，和/或生物生长的改变。本公开还描述了表达基因的生物，和使用该新基因来改变脂质含量、脂质分布或生物生长的方法。

Description

脂质和生长性状基因

相关申请的交叉引用

本申请要求以下申请的优先权：2012年2月24日提交的美国临时专利申请No.61/602,892，其全部内容通过引用而合并于此用于所有目的。

背景技术

微藻代表适合于各种生态生境的多样组的微生物(例如，如在Hu等人，Plant J.(2008)第54(4)621-639页)。许多微藻能产生大量(例如，20-50％的细胞干重)脂质，如三酰基甘油(TAG)和二酰基甘油(DAG)，作为应激条件下的贮存脂质，例如氮饥饿。在氮饥饿条件下，许多微藻表现出降低的生长速率和光合作用的成分的分解，如叶绿素。

脂肪酸是用于TAG和所有其它的细胞脂质的构件块，使用单组酶在叶绿体中合成，其中乙酰辅酶A羧化酶(ACCase)是调节脂肪酸合成速率的关键。然而，参与脂肪酸合成的基因的表达在微藻中难以理解。TAG合成和封存到胞质的脂质体看来是一种保护性机制，藻类细胞通过该机制应付应激条件。

对于脂质的调节已知之甚少，例如，在分子或细胞水平上的TAG形成。在生物化学层面上，获取的关于藻类中脂肪酸和TAG人工合成途径信息仍然不完全。关于对参与这些途径的调节基因和结构基因和途径之间的潜在相互作用的认识仍然不足。因为脂肪酸是合成膜脂质和TAG的常见前体，需要阐明所述藻类细胞如何协调将前体分配到两个不同目标或两种类型的脂质者之间的相互转化。需要解决涉及在藻类中的生物合成和脂肪酸和脂质调节的许多的基本生物学问题。

在过去的数十年里进行了许多有关使用微藻作为富含脂质的生物质原料可替代的或者可以再生的源用作生物燃料的研究工作。微藻是一种有吸引力的模型，因为，在应激条件下，例如氮饥饿，它们能够产生大量的脂质，例如TAG和DAG。然而，在氮饥饿条件下微藻的生长减缓使得更难以在大规模生产生物燃料中使用微藻。尽管藻类以富含脂质原料的形式提供了天然的原料，我们缺乏对脂质代谢用于在生理上和遗传上进行工艺操纵的细节的理解。

因此，需要更好地理解在藻类中在分子水平上的脂质调节，例如TAG和DAG。此外，较为有用的是通过基因操作藻类，使藻类能产生大量的脂质而不降低生长速率和藻类成分的分解，例如叶绿素。本公开通过提供新基因满足了这种需要，即，当这种新基因用来转化藻类产生所需表型。

此外，微藻和生物燃料保持有希望的伙伴关系，但生产率需要一个数量级的增加将需要发育新的技术，例如，细胞的转化以及性状基因的鉴定用于改进菌株。需要改进的菌株来增加容积生产率和产生所需水平的脂质。

在例如开放池塘中最优化藻类的生长是达成提高经济可行性的关键部分，并且在工业上仍然是一个挑战。鉴别在这些条件下生长良好的品种是正在进行的研究的焦点。藻类可以在各种温度下生长，生长主要是由养分有效性和光限制。生长速率通常受来自自屏蔽和水吸收的光的光透射进入到池塘中的限制，这些约束的主要决定因素是池深(Mayfield，S.等，生物燃料(2010)1(5):763-784)。

遗传和代谢工程很可能对改善微藻生产的经济可行性产生极大的影响。分子工程的藻类可用于，例如，增加光的光合效率以增加光下的生物质产量，提高生物质生长/生长速率，并提高生物质中油含量。

因此，进行藻类基因操作还将是有益的，使藻类生长加速，导致藻类生物质的增加。本公开通过提供新基因满足了这种需要，即，当这种新基因用来转化藻类生成所需表型时。

发明内容

在此提供的是分离的多核苷酸，包括：(a)SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列；(b)具有与SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列的至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列；或(d)具有与SEQ ID NO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列的至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列。在一个实施例中，生物体通过分离的多核苷酸转化。在另一个实施例中，载体包含分离的多核苷酸。在又一实施例中，载体还包含5’调节区。在一个实施例中，所述的5’调节区进一步包括启动子。在其它实施例中，启动子是组成型启动子或启动子是诱导型启动子。在一些实施例中，诱导型启动子是光诱导型启动子、硝酸盐诱导型启动子，或热响应型启动子。在一个实施例中，载体还包含3’调节区。

本文还提供一种编码蛋白质的分离的多核苷酸，包含，(a)SEQ ID NO:132、66、78、84、90、96、102、108、114、120、126、138、144、150、156、162、168或174的氨基酸序列；或(b)(a)的氨基酸序列的同系物，其中所述同系物与SEQ ID NO:132、66、78、84、90、96、102、108、114、120、126、138、144、150、156、162、168或174的氨基酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性。在一个实施例中，所述生物体是用分离的多核苷酸和能表达所述蛋白质的转化。

本发明还提供一种使用分离的多核苷酸转化的光合生物，包括:(a)SEQID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列；(b)SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列；或(d)具有与130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；其中，所述转化的生物的脂质含量或分布不同于未转化的生物的脂质含量或分布或第二转化的生物的脂质含量或分布。在一些实施例中，差别在于以下的增加或减少：一个或多个血红素、极性脂质、叶绿素的分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油，心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油、磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、甘油二酯三甲基高丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OH甲基羧基胆汁素、甘油二酯OH甲基三甲基丙氨酸、2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4,5-二磷。在其它实施例中，差值是通过萃取、萃取重量法，或亲脂性染色测定。在一些实施例中，萃取是Bligh-Dyer或MTBE(MTBE)。在其它实施例中，差值在于使用亲脂性染色使转化的生物的细胞的染色的增加或减少。在其它实施例中，亲脂性染色是Bodipy、尼罗红或Lipid TOX green。在一个实施例中，转化的光合生物是在水相环境中生长。在另一个实施例中，转化的光合生物是维管植物。在另一实施例中，转化的光合生物是非维管光合生物。在其它实施例中，转化的光合生物是藻类或细菌。在一个实施例中，所述细菌是蓝细菌。在其它实施例中，所述蓝藻为聚球蓝细菌属、集胞藻属、节旋藻属、粘球藻属、螺旋藻属(Spirulina sp.)、细鞘丝藻属、林氏藻属、颤藻属，或假鱼腥藻属。在另一个实施例中，藻类是微藻。在一些实施例中，微藻是以下中的至少1种：衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。在其它实施例中，所述微藻是以下中至少1种：莱茵衣藻、海洋微拟球藻(N.oceanica)、盐生微拟球藻(N.salina)、盐生杜氏藻、雨生红球藻(H.pluvalis)、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻(S.maximus)，或梭杆菌节旋藻。在另一个实施方式中，所述莱茵衣藻是野生型菌种CC-1690 21 gr mt+。在一个实施例中，转化的光合生物的核基因组发生转化。在另一个实施例中，转化的光合生物的叶绿体基因组发生转化。在另一项实施例中，转化的光合生物的叶绿体基因组发生转化，并且所转化的光合生物是同质的。

本发明提供了比较第一生物体的脂质含量或分布与第二生物体的脂质含量或分布的方法，包括:(a)使用第一多核苷酸转化第一生物体，其中第一多核苷酸包括：(i)SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列；(ii)与SEQID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(iii)SEQ IDNO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列；或(iv)具有与130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(b)确定第一生物体的脂质含量或分布；(c)确定第二生物体的脂质含量或分布；和(d)比较第一生物体的脂质含量或分布与第二生物体的脂质含量或分布。在另一个实施例中，第二生物体通过第二多核苷酸转化。在一种实施例中，第一生物体的脂质含量或分布不同于第二生物体的脂质含量或分布。在一些实施例中，差别在于以下一种或多种的增加或减少：血红素、极性脂质、叶绿素的分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油，心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油，磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、二酰甘油三甲基同型丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OH甲基羧基胆汁素、甘油二酯OH甲基三甲基丙氨酸、2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4,5-二磷在其它实施例中，差值的测定是通过萃取、萃取重量法，或亲脂性染色。在一些实施例中，萃取是Bligh-Dyer或MTBE。在其它实施例中，使用亲脂性染色，差值是与第二生物体的细胞相比的第一生物体细胞的染色增加还是减少。在另外的其它实施例中，亲脂性染色是Bodipy、尼罗红或Lipid TOX green。在一个实施例中，第一和第二生物体在水相环境中的生长。在另一个实施例中，第一和第二生物体是维管植物。在另一实施例中，第一和第二生物体是非维管光合生物。在其它实施例中，第一和第二生物体是一种藻类或细菌。在一个实施例中，所述细菌是一种蓝细菌。在另一个实施例中，藻类是微藻。在一些实施例中，微藻是以下的至少1种：衣藻属、团藻目属、杜氏藻、栅藻属、小球藻、血球菌属、团藻属、微拟球藻属、节旋藻属(Arthrospira sp.)、螺旋藻属(Spirulina sp.)、葡萄藻属、红球藻属，或链带藻属。在其它实施例中，所述微藻是以下中至少1种：莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻(S.maximus)，或梭杆菌节旋藻。在一个实施例中，莱茵衣藻是野生型菌种CC-1690 21 gr mt+。在其它实施例中，第一和/或第二生物体的核基因组发生转化。在其它实施例中，第一和/或第二生物体的叶绿体基因组转化。

还提供了一种增加脂质产出的方法，包括：i)当在生物体中表达时将生物体用包含编码蛋白质的核苷酸序列的多核苷酸转化，与未转化的生物或第二转化的生物相比，导致脂质的产出增加，并且其中所述核苷酸序列包括:(a)SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列；(b)与SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列的具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列；或(d)与130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列。在一些实施例中，脂质存储在所转化的生物的脂质体、细胞膜、类囊体内部空间，和/或质体基因(plastoglubuli)。在其它实施例中，该方法还包括收集从脂质体中的脂质转化的生物或从所述转化的生物的细胞膜。在一些实施例中，脂质，任何一个或多个血红素、极性脂质、叶绿素的分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油，心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油，磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、二酰甘油三甲基同型丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OH甲基羧基胆汁素、甘油二酯OH甲基三甲基丙氨酸、2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4,5-二磷。在一个实施例中，所述转化的生物在水相环境中生长。在另一个实施例，转化的生物是维管植物。在另一个实施例中，转化的生物是非维管光合生物。在一些实施例中，所述转化的生物是一种藻类或细菌。在一个实施例中，细菌是一种蓝细菌。在其它实施例中，所述蓝藻为聚球蓝细菌属、集胞藻属、节旋藻属、粘球藻属、螺旋藻属(Spirulina sp.)、细鞘丝藻属、林氏藻属、颤藻属，或假鱼腥藻属。在另一个实施例中，藻类是微藻。在一些实施例中，微藻是以下中的至少1种：衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属(Arthrospira sp.)、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。在其它实施例中，所述微藻是以下中至少1种：莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻(S.maximus)，或梭杆菌节旋藻。在一个实施例中，莱茵衣藻是野生型菌种CC-1690 21 gr mt+。在一个实施例中，转化的光合生物的核基因组转化。在另一个实施例中，转化的光合生物的叶绿体基因组发生转化。在另一项实施例中，转化的光合生物的叶绿体基因组发生转化，并且所转化的光合生物是同质的。

本发明还提供了一种方法，用于筛选在生物中参与脂质代谢的蛋白质，包括：(a)用多核苷酸转化生物体，包括:(i)SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列；(ii)与SEQ ID NO:131、65、77、83、89、95、101、107、113、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(iii)SEQ ID NO:130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列；或(iv)与130、64、76、82、88、94、100、106、112、118、124、136、142、148、154、160、166或172的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；其中，所述生物体的转化导致核苷酸序列或核苷酸序列所编码的多肽的表达；和(b)观察到RNA在转化的生物中的表达相对于在未转化的生物中的变化。在一个实施例中，与未转化的生物相比，所述变化是RNA在转化的生物中表达的增加。在另一实施例中，与未转化的生物相比，所述变化是在RNA在转化的生物中的表达的减少。在其他实施例中，这种改变通过微阵列、转录组测序(RNA-Seq)，或基因表达系列分析(SAGE)来测量。在其他实施例中，在RNA的表达中的改变至少是未转化生物体的至少两倍或至少四倍。在其他实施方式中，所述转化的生物是在存在或不存在氮气的条件下生长。

本发明还提供了一种使用分离的多核苷酸转化的高等植物，包括：(a)SEQ ID NO:113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列；(b)与SEQ ID NO:113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:112、64、76、82、88、94、100、106、130、118、124、136、142、148、154、160、166或172的核苷酸序列；或(d)与112、64、76、82、88、94、100、106、130、118、124、136、142、148、154、160、166或172的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；其中，所述转化的植物的脂质含量或分布不同于未转化的植物的脂质含量或分布或第二转化的植物的脂质含量或分布。在一些实施例中，差别是通过萃取、萃取重量法，或亲脂性染色测定。在其它实施例中，萃取是Bligh-Dyer或MTBE。在其他实施例中，所述差值的增加或减少在于所述转化的生物的细胞通过亲脂性染色的染色。在其它实施例中，亲脂性染色是Bodipy、尼罗红或Lipid TOX green。在其它实施例中，所述高等植物是拟南芥或芸苔属、大豆属、棉属、苜蓿属、玉蜀黍属、稻属、小麦属，或稷属。

在此提供的是一种分离的多核苷酸，包括：(a)SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；(b)与SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列。本发明还提供了通过分离的多核苷酸和载体转化的生物，所述载体包含所述分离的多核苷酸。在一个实施例中，载体还包含5’调节区。在另一个实施例中，5’调节区还包括启动子。该启动子可以是组成型启动子或诱导型启动子。在一些实施例中，诱导型启动子是光诱导型启动子、硝酸盐诱导型启动子，或热响应型启动子。在另一个实施例中，载体还包含3’调节区。

本发明还提供了一种编码蛋白质的分离的多核苷酸，包含，(a)SEQ IDNO:270、180、186、192、198、204、210、216、222、228、234、240、246、252、258、264、276、282、288、294，或300的氨基酸序列；或(b)所述氨基酸序列(a)的同系物，其中，所述同系物与SEQ ID NO:270、180、186、192、198、204、210、216、222、228、234、240、246、252、258、264、276、282、288、294和300的氨基酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性。还提供了一种用分离的多核苷酸转化的生物，其中多核苷酸编码的蛋白质被表达。

在此提供的是使用分离转化的多核苷酸光合生物，包括:(a)SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；(b)与SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；其中，与未转化的生物或第二转化的生物的生长相比，所述转化的生物的生长增长。在一个实施例中，生长的增长是至少通过转化的生物和未转化生物之间的竞争试验测定。在另一个实施例中，竞争试验包括附加的生物体。在另一个实施例中，竞争试验测定一个或多个恒浊器。在一些实施例中，所述转化的生物的生长的加速是通过生长速率、承载量，或培养产率测量。在其它实施例中，相比于未转化生物体或第二转化的生物，转化的生物的生长速率具有至少2％、至少4％、至少6％、至少8％、至少10％、至少12％、至少14％、至少16％、至少18％、至少20％、至少22％、至少24％、至少26％、至少28％、至少30％、至少50％、至少100％、至少150％、至少200％、至少250％、至少300％、至少350％、至少400％的增加。在另外的其它实施例中，相比于未转化生物体或第二转化的生物，转化的生物的生长速率具有从0.01％至2.0％、从2％至4％、从4％至6％、从6％至8％、从8％至10％、从10％至12％、从12％至14％、从14％至16％、从16％至18％、从18％至20％、从20％至22％、从22％至24％、从24％至26％、从26％至28％、从28％至30％、从30％至50％、从50％至100％、从100％至150％、从150％至200％、从200％-250％、从250％-300％、从300％至350％、从350％至400％或400％至600％的增加。在一个实施例中，相比于未转化生物体或第二转化的生物，该增加通过正向选择系数的生物体示出。在另一个实施例中，所述转化的生物是在水相环境中生长。在一个实施例中，转化的生物是维管植物。在另一个实施例中，转化的生物是非维管光合生物。在一些实施例中，所述转化的生物是一种藻类或细菌。在一个实施例中，细菌是一种蓝细菌。在其它实施例中，所述蓝藻为聚球蓝细菌属、集胞藻属、节旋藻属、粘球藻属、螺旋藻属(Spirulina sp.)、细鞘丝藻属、林氏藻属、颤藻属，或假鱼腥藻属。在另一个实施例中，藻类是微藻。在其它实施例中，微藻是以下中的至少1种：衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。在其它实施例中，所述微藻是以下中至少1种：莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻(S.maximus)，或梭杆菌节旋藻。在一个实施例中，莱茵衣藻是野生型菌种CC-1690 21 gr mt+。

本发明还提供了一种对第一生物体的生长与第二生物体的生长进行比较的方法，包括:(a)用第一多核苷酸转化第一生物体，其中所述第一多核苷酸包括:(i)SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；(ii)与SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(iii)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或(iv)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(b)测量所述第一生物体的生长；(c)测量所述第二生物体的生长；和(d)比较所述第一生物体的生长与所述第二生物体的生长。在一个实施例中，用第二多核苷酸转化第二生物体。在另一个实施例中，与第二生物体的生长相比，所述第一生物体的生长增长。在另一个实施例中，生长由第一转化生物体和第二生物体之间的竞争试验测定。在本发明的另一个实施例中，竞争试验包括附加的生物体。在一个实施例中，竞争试验是在一个或多个恒浊器。在其它实施例中，第一生物体的生长和第二生物体的生长通过生长速率、承载量，或培养产率测量。在其它实施例中，与第二生物体的生长速率相比，第一转化生物体的生长速率具有至少2％，至少4％，至少6％，至少8％、至少10％、至少12％、至少14％、至少16％、至少18％、至少20％、至少22％、至少24％、至少26％、至少28％、至少30％、至少50％、至少100％、至少150％、至少200％、至少250％、至少300％、至少350％、或至少400％的增长。在另一实施例中，与第二生物体相比，第一转化生物体具有正向选择系数到。在一个实施例中，所述生物是在水相环境中生长。所述生物可以是维管植物或非维管光合生物。该生物可以是藻类或细菌。在一个实施例中，细菌是一种蓝细菌。在另一个实施例中，藻类是微藻。在一些实施例中，微藻是以下中的至少1种：衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。在其它实施例中，莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻(S.maximus)，或梭杆菌节旋藻在一个实施例中，莱茵衣藻是野生型菌种CC-169021 gr mt+。在一个实施例中，第一和/或第二生物体的核基因组转化。在另一个实施例中，第一和/或第二生物体的叶绿体基因组转化。

本发明还提供了一种用于参与生物的生长的蛋白质的筛选方法，包括:(a)与多核苷酸转化所述生物包括:(i)SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；(ii)与SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(iii)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或(iv)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；其中，所述生物体的转化导致核苷酸序列或核苷酸序列所编码的多肽的表达；和(b)相对于未转化的生物，观察到在转化的生物中RNA表达的变化。在一个实施例中，与未转化的生物相比，所述变化是在转化的生物中RNA表达的增加。在另一个实施例中，与未转化的生物相比，所述变化是在转化的生物中RNA表达的减小。在其他实施例中，改变通过微阵列、转录组测序，或基因表达系列分析(SAGE)来测量。在其它实施例中，与未转化的生物相比，所述变化是至少两倍或至少四倍。在一个实施例中，所述转化的生物在无氮条件下生长。

在此提供的是用分离的多核苷酸转化的所述高等植物，包括：(a)SEQ IDNO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；(b)与SEQ IDNO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；(c)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列，其中，与第二未转化的生物的生长或转化的生物的生长相比，所述转化的生物的生长增长。在一些实施例中，生长的加速是通过竞争试验、生长速率、承载量、培养产率、细胞繁殖、种子产量、器官生长，或多聚核糖体积累来测定。在一个实施例中，该增加为通过生长速率测得。在一些实施例，相比于未转化生物体或第二转化的生物，转化的生物的生长速率具有至少2％、至少4％、至少6％、至少8％、至少10％、至少12％、至少14％、至少16％、至少18％、至少20％、至少22％、至少24％、至少26％、至少28％、至少30％、至少50％、至少100％、至少150％、至少200％、至少250％、至少300％、至少350％、至少400％的增长。在其它实施例中，相比于未转化的植物或第二转化的植物，转化的高等植物的生长速率具有从0.01％到2.0％、从2％到4％、从4％到6％、从6％到8％、从8％到10％、从10％至12％、从12％到14％、从14％到16％、从16％到18％、从18％到20％、从20％到22％、从22％至24％、从24％到26％、从26％至28％、从28％到30％、从30％至50％、从50％至100％、从100％到150％、从150％到200％、从200％-250％、从250％-300％、从300％到350％、从350-400％，或400％至600％的增长。在一个实施例中，高等植物是拟南芥。在一些实施例中，高等植物是芸苔属、大豆属、棉属、苜蓿属、玉蜀黍属、稻属、小麦属，或稷属。

附图简述

参照以下说明书、权利要求书和附图，将会更好地理解本公开的这些和其它特征、方面和优点。

图1示出了在正常生长(NG)和应激条件(SC)下各种类型的微藻和蓝藻的细胞脂质含量。(a)绿色微藻；(b)硅藻；(c)属于其他真核藻类分类的含油菌种/菌株；和(d)蓝藻。空心圆：在正常生长或氮充足条件下获得的细胞脂质含量。实心圆：在氮气贫化或其它应激条件下获得的细胞脂质含量。在正常生长和应激作用生长条件下，培养物在细胞脂质含量之间的差异对于通过ANOVA程序使用Duncan多范围检验的藻类的所有三个组(a、b和c)均有统计学意义。

图2示出了在叶绿体中脂肪酸从头合成途径。乙酰辅酶A进入到流程作为乙酰辅酶A羧化酶(反应1)的基质以及初始缩合反应(反应3)的基质。反应2由丙二酰辅酶A:ACP转移酶催化，并将丙二酰从辅酶A转移至形成丙二酰ACP。丙二酰ACP是碳供体，用于随后的延伸反应。在随后的缩合中，3-酮脂酰基ACP产物分别通过3-酮脂酰基ACP还原酶、3-羟酰ACP脱水酶和烯酰ACP还原酶进行还原(反应4)、脱水(反应5)和再次还原(反应6)，(摘自和修改自Ohlrogge和Browse，1995，Plant Cell，7，957-970)。

图3是一个示出了在藻类中三酰甘油(TAG)生物合成途径的简化示意图。(1)胞质甘油-3-磷酸盐酰基转移酶，(2)溶血磷脂酸酰基转移酶，(3)磷脂酸磷酸酶，和(4)二酰基甘油酰基转移酶。摘自Roessler等人，1994，提高微藻生产生物柴油燃料的遗传学改造方法。在用于燃料生产的生物质的酶转化(Himmel，M.E.，Baker，J.和Overend，R.P.编)。美国化学学会，第256-270页。

图4显示了在厌氧温育后的莱茵衣藻中鉴定出的发酵途径(摘自和修改自Mus等人，2007，J.Biol.Chem.,282，25475-25486)。在需氧条件下，丙酮酸盐主要通过丙酮酸盐脱氢酶复合物进行新陈代谢以产生还原型辅酶(NADH)和乙酰辅酶A，后者连接到脂质代谢(见图5)。ACK、乙酸激酶；ADH、乙醇脱氢酶；醇脱氢酶(ADHE)、酒精醛双功能脱氢酶；H2ase，氢化酶；PAT，磷酸转乙酰酶；PDC，丙酮酸盐脱羧酶；PFL，丙酮酸盐甲酸裂合酶；PFR，丙酮酸盐铁氧还蛋白氧化还原酶。

图5示出了脂质生物合成的途径，已知或假设发生在衣藻属中和它们推测的亚细胞定位。缩写：ACP，酰基载体蛋白质；AdoMet，腺苷甲硫氨酸；ASQD、2’-O-酰基硫代异鼠李糖甘油二酯；CDP、胞苷-5’-二膦酸盐；辅酶A，辅酶A；CTP、胞苷-5’-三磷酸盐；DAG，二酰基甘油；DGDG，双半乳糖二酰基甘油；DGTS，甘油二酯N，N，N-三甲基同型丝氨酸；Etn，乙醇胺；FA，脂肪酸；G-3-P、甘油-3-磷酸盐；Glc，葡萄糖；Glc-1-P，葡萄糖-1-磷酸盐；Ins，肌醇；Ins-3-P，肌醇-3-磷酸盐；Met，甲硫氨酸；MGDG、单半乳糖苷二脂酰甘油；P-Etn，磷酸乙醇胺；PtdEtn，磷脂酰乙醇胺；PtdGro，磷脂酰甘油；PtdGroP，磷脂酰甘油磷酸盐；Ptd1ns，磷脂酰肌醇；PtdOH，磷脂酸；Ser，丝氨酸；SQ，sulfoquinovose；SQDG，硫代异鼠李糖甘油二酯；UDP，尿苷-5-二膦酸盐(如Riekhof，W.R.，等，2005，真核细胞，4，242-252)。

图6示出了可以使用这里所公开的实施例的示例性表达载体(SEnuc357)。

图7示出了可以使用本文所公开的实施例的示例性表达载体。

图8A、8B、8C和8D示出了典型的氮应激作用表型。

图8A显示在存在和不存在氮的条件下三个藻株的百分比脂质水平(SE0004是二形栅藻；SE0043是杜氏盐藻；和SE0050是莱茵衣藻)。

图8B示出了在图8A中所示的两个藻株和加入的SE0003(杜氏盐藻)的百分比脂质水平。

图8C显示了在存在和不存在氮的条件下莱茵衣藻的生长。

图8D示出了莱茵衣藻在存在和不存在氮气的条件下在经过9天的过程中的叶绿素水平。

图9示出了在存在和不存在氮气的条件下通过高压液相色谱法-计算机辅助设计(HPLC-CAD)进行的总脂肪分析(24小时时间点)。24小时后，在没有氮的条件下，在这两个光谱中没有观察到显著差异。

图10示出了在存在和不存在氮气的条件下通过HPLC-CAD进行的总脂肪分析(48小时时间点)。48小时后，在不存在氮气的条件下，在中性脂质(x)峰(44-54分钟的保持时间)中存在提高。

图11示出了在没有氮的条件下在生长在TAP(三异丙基乙磺酰-醋酸盐-磷酸盐)中的莱茵衣藻上通过定量聚合酶链反应(qPCR)调节基因(24小时时间点)。

图12示出了在没有氮的条件下在生长在TAP中的莱茵衣藻通过qPCR进行基因调节(24小时时间点)。

图13描述了转录组测序组学的方法。

图14示出了在存在和不存在氮的条件下、在6小时的时间点、图13所述的方法产生的所有莱茵衣藻基因和它们的表达水平。白点表示在6个小时时间点被上调或下调至少4倍的基因。

图15示出了在氮饥饿的时间过程中的基因表达水平(如表2中所述)。每一条线代表不同的基因。

图16显示了所选择的14个靶基因的表达水平。基因表达水平经过氮饥饿的时间过程(如表2中所述)。每一条线代表不同的基因。

图17示出了克隆载体，用于将SN(应激-氮)靶克隆进藻类。

图18描述了在细胞分选法富集用于高脂类染料染色后过表达SN01、SN02和SN03的莱茵衣藻菌株的分布。

图19A、19B、19C和19D示出了从图18的FACS实验中鉴定出的SN03菌株的流式细胞术(Guava)结果。图19A和B使用Bodipy染料；图19C使用Lipid TOX green；和图19D使用尼罗红。野生型是莱茵衣藻重复试验，所述数字代表各种SN03菌株。

图20A和20B显示了在TAP中生长、过表达SN03或高盐介质(HSM)的莱茵衣藻菌株，然后萃取MTBE用于脂质含量。

图21示出了来自在存在和不存在氮的条件下生长的的野生型莱茵衣藻以及过表达SN03(SN03-34)的莱茵衣藻的1D 1H NMR的MTBE萃取油。

图22A和B显示了来自图21中所描述的实验中的闭合峰值。

图23A、23B和23C示出了过表达SN03的莱茵衣藻菌株的生长速率。基因负是一个对照的莱茵衣藻转基因株系，其中SN03开放读框被截断。野生型是莱茵衣藻。图23A和23B代表生长在TAP中的菌株，以及图23C表示在HSM中生长的菌株。

图24示出了在过表达SN03的莱茵衣藻菌株中通过qPCR表示的SN03蛋白质表达水平。

图25示出了在过表达SN03的莱茵衣藻菌株中的SN03蛋白质表达水平。

图26示出了使用HPLC和荷电气溶胶检测器(CAD)的己烷提取莱茵衣藻的总脂质的基准轨迹。

图27示出了生长在和不存在氮气的条件下、来自过表达SN03的莱茵衣藻菌株进行MTBE萃取油和来自野生型莱茵衣藻进行MTBE萃取油的高效液相色谱数据。

图28示出了过表达SN03的莱茵衣藻菌株的流式细胞术结果，使用几种不同的脂类染料确认高脂质表型。每组的左手列表示用Bodipy。染色每组的中间一列表示用尼罗红染色。每组的右边的列表示与Lipid TOX green染色。野生型莱茵衣藻重复试验和SN03-2、-3，-15，-32，-34表示各种SN03菌株。

图29示出了生长在TAP上的过表达SN03的莱茵衣藻菌株和MTBE萃取的脂质含量。

图30示出了在存在和不存在氮的条件下的野生型莱茵衣藻和过表达SN03的莱茵衣藻菌株的叶绿素水平。

图31示出了野生型莱茵衣藻和过表达SN03的莱茵衣藻菌株的生长速率。

图32示出了在野生型莱茵衣藻和表达SN03的特异性微小核糖核酸(miRNA)的莱茵衣藻(最优)中、在氮饥饿条件下诱导内源性SN03和应激诱导的蛋白质激酶(PK)。每组的左列表示应激诱导的PK，每组的右栏表示内源性SN03(147817)。x-轴代表各种敲落株系。

图33示出了野生型莱茵衣藻的MTBE萃取和莱茵衣藻菌株表达SN03的特异性miRNA(最优)。两个菌株在存在和不存在氮的条件下生长。该最优株系表明SN03在氮饥饿时是脂质积累所必需的。

图34示出了克隆载体(Ble2A-SN03)用于将SN(应激-氮)靶克隆进藻类。该载体使用AR4启动子以驱动博莱霉素抗性基因和SN基因。具有在细菌中用于生长的氨苄青霉素抗性盒。

图35示出了示例性表达载体(SEnuc357_SN03)，其可以用这里所公开的实施例。

图36示出了在存在和不存在氮的条件下、通过图13所述的方法产生的、在6小时的时间点，所有莱茵衣藻基因和它们的表达水平。白点代表在过表达SN03的莱茵衣藻菌株中上调4倍或更多的基因。

图37示出了在存在和不存在氮的条件下、通过图13所述的方法产生的、在6小时的时间点，所有莱茵衣藻基因和它们的表达水平。白点代表在过表达SN03的莱茵衣藻菌株中下调四倍或更多的基因。

图38示出了在氮饥饿的时间周期内、在野生型莱茵衣藻中的内源和转基因SN03RNA的表达水平，和在过表达株系的SN03中内源和转基因SN03RNA的表达水平。转基因(Ble)SN03用实线表示，内源性SN03由虚线表示。

图39示出了在氮饥饿的时间周期内、在野生型莱茵衣藻中的内源和转基因SN03 RNA的表达水平，和在过表达株系的SN03中内源和转基因SN03RNA的表达水平。每对的左手列表示转基因(Ble)SN03，每对的右手栏表示内源性SN03。

图40示出了在氮饥饿时间周期内、在野生型莱茵衣藻中的基因表达水平，和过表达株系的SN03中的基因表达水平。每一条线代表不同的基因。所示基因在氮饥饿中上调，在过表达株系的SN03中下调。

图41A显示了在存在和不存在氮的条件下、在人工海水培养基(MASM)介质中的野生型微拟球藻的生长。菱形表示在氮的存在下生长，方框表示在没有氮的存在下生长。

图41B显示了在存在和不存在氮的条件下、在MASM介质中的野生型微拟球藻的叶绿素水平。

图41C示出了在存在和不存在氮的条件下、在MASM介质中的野生型微拟球藻的MTBE提取。

图41D示出了在存在和不存在氮的条件下、在HSM介质中的野生型二形栅藻。菱形表示在氮的存在下生长，方框表示在没有氮的存在下生长。

图41E示出了在存在和不存在氮的条件下、在HSM介质中的野生型二形栅藻叶绿素含量。

图42A示出了FACS富集用于高脂类染料染色后的过表达SN01、SN02和SN03的莱茵衣藻菌株的分布。每列的实体部分代表过表达SN03的各个株系的百分比；每列的条纹部分代表过表达SN02的各个株系的百分比，并且每列的未填充部分代表过表达SN01的各个株系的百分比。

图42B示出了在存在和不存在的氮气的条件下的野生型莱茵衣藻的和过表达株系的SN03的流式细胞术(Guava)结果。每一组的左手栏是尼罗红；每一组的中间列是Lipid TOX green；和每一组的右手栏是Bodipy。

图42C示出了野生型莱茵衣藻和几个过表达株系的SN03的使用Bodipy的流式细胞术(Guava)结果。

图43示出了用于过表达株系的两个SN03的SN03载体的基因组整合位点(如图34所示)。

图44A示出了过表达株系的莱茵衣藻SN03中的SN03蛋白质表达水平。细菌碱性磷酸酶(BAP)用作阳性对照。

图44B在过表达SN03的莱茵衣藻菌株中通过qPCR示出了SN03 RNA水平。在野生型莱茵衣藻中没有检测到SN03 RNA的表达(N.D.)。

图45A示出了存在和不存在氮气的条件下的野生型莱茵衣藻在和过表达SN03的莱茵衣藻菌株，萃取MTBE用于脂质含量。

图45B示出了在HSM中的野生型莱茵衣藻和过表达SN03的莱茵衣藻的生长速率。

图45C示出了在存在和不存在氮气的条件下生长的野生型莱茵衣藻的承载量和在存在和不存在氮气的条件下生长的过表达株系的SN03。

图45D示出了在存在和不存在氮的条件下生长的野生型莱茵衣藻的叶绿素水平和在存在和不存在氮气的条件下生长的过表达株系的SN03。

图46A示出了在存在和不存在氮的条件下的野生型莱茵衣藻的MTBE萃取和三个SN03最优系。

图46B通过qPCR示出了在氮饥饿下的野生型莱茵衣藻中和三个SN03最优系中的SN03 RNA的上调和蛋白质激酶RNA诱导的应激。

图47A示出了使用尼罗红的野生型莱茵衣藻和几个过表达株系的SN03的流式细胞术(Guava)结果。“C”表示来自莱茵衣藻的密码子优化的内源性SN03序列(SEQ ID NO:13)，其中核苷酸序列在3’端编码FLAG-MAT标记。

图47B示出了使用尼罗红的野生型莱茵衣藻和几个过表达株系的SN03的流式细胞术(Guava)结果。“E”表示来自莱茵衣藻的内源性SN03序列(SEQID：10)，其中核苷酸序列在3’端编码FLAG-MAT标记。

图48示出了野生型莱茵衣藻和过表达SN03的莱茵衣藻菌株，萃取MTBE用于脂质含量。“C”表示来自莱茵衣藻的密码子优化的内源性SN03序列(SEQID NO:13)，其中核苷酸序列在3’端编码FLAG-MAT标记。

图49示出了美国能源部(DOE)的联合基因组研究所(JGI)注释的SN03序列(SEQ ID NO:6)和内源性SN03序列(SEQ ID NO:14)的蛋白质比对。

图50示出了野生型莱茵衣藻在没有氮的条件下存在的脂质体，和在SN03过表达株系中的脂质体。左上面板是在存在氮的条件下的野生型莱茵衣藻。右上面板是在不存在氮的条件下的野生型莱茵衣藻。底面板是SN03过表达株系的两个图像。所使用的染料是尼罗红。

图51示出了在存在和不存在氮的条件下野生型和SN03最优株系的HPLC分析。

图52示出了miRNA表达载体。

图53示出了SN01表达细胞株系的分析型流式细胞术(Guava)数据。三栏中中的每组的左手栏代表用Bodipy脂类染料染色的细胞；中间列代表用尼罗红染色脂类染料染色的细胞；和右手栏代表Lipid TOX脂类染料染色的株系。x-轴显示了12个独立细胞株系，y轴表示在染色中相对于野生型菌株的倍数差异。

图54表示SN08过表达细胞株系的分析流式细胞术(Guava)数据。三栏中的每组的左手栏表示用Bodipy脂类染料染色的细胞；中间列代表用尼罗红脂类染料染色的细胞；和右手栏代表Lipid TOX脂类染料染色的细胞。x-轴显示了12个独立细胞株系，y轴表示在染色中相对于野生型菌株的倍数差异。

图55示出了SN87过表达细胞株系的分析流式细胞术(Guava)数据。三栏中的每组的左手栏表示用Bodipy脂类染料染色的细胞；中间列代表用尼罗红脂类染料染色的细胞；和右手栏代表用Lipid TOX脂类染料染色的细胞。x-轴显示了12个独立细胞株系，y轴表示在染色中相对于野生型菌株的倍数差异。

图56显示了SN120过表达细胞株系的分析流式细胞术(Guava)数据。三栏中的每组的左手栏表示用Bodipy脂类染料染色的细胞；中间列代表用尼罗红脂类染料染色的细胞；和右手栏代表用Lipid TOX脂类染料染色的细胞。x-轴显示了12个独立细胞株系，y轴表示在染色中相对于野生型菌株的倍数差异。

图57示出了几种SN79转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图58示出了几种SN64转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图59示出了几种SN24转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图60示出了几种SN82转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图61示出了几种SN01转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图62示出了几种SN28转基因株系沿着野生型莱茵衣藻株系(沿x轴所示)的生长速率(在y轴上)。

图63示出了载体SENuc745。

图64示出了载体SENuc744。

图65示出了测量单个SN基因转化株的生长速率的96孔微量培养板生长试验的数据。5个转化株分析用于SN78。该数据分析通过转化株(株系)采用r的单因素方差分析(Oneway ANOVA)，使用用于具有对照的多重比较的Dunnett检验。

图66表示出测量单个SN基因转化株的理论峰值生产率(Kr/4)的96孔微量培养板生长试验的数据。分析8个转化株用于SN24，分析8个转化株用于SN26，和分析10个转化株用于SN39。数据分析通过转化株(株系)采用Kr/4的单因素方差分析，使用用于具有对照的多重比较的Dunnett检验。

图67示出了如实施例21中所述的物流模型和模型拟合的第一微分。

图68示出了以Bodipy脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

图69示出了以尼罗红脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

图70示出了以Lipid TOX脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

图71示出了以Bodipy脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

图72示出了以尼罗红脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

图73示出了以Lipid TOX脂类染料染色的几个SN过表达细胞株系的分析流式细胞术(Guava)的数据，分析通过单个SN细胞株系的单因素方差分析，采用具有对照的多重比较的Dunnett检验。

具体实施方式

提供以下具体实施方式以帮助本领域技术人员实施本公开。虽然如此，这些具体实施方式不应被解释为不适当地限定本公开，本领域的技术人员可以对本文所述的实施例作出修改和变化，而且不脱离本公开的精神或范围。

如在本说明书和所附权利要求中所使用的，单数形式的“一”、“一个”和“该”包括复数指示物，除非上下文另外明确指出。

内源性

本文所述的一种内源性核酸、核苷酸、多肽或蛋白质限定在与宿主生物的亲缘中。一种内源性核酸、核苷酸、多肽或蛋白质在宿主生物中自然发生。

外源性

本文所述的一种外源核酸、核苷酸、多肽或蛋白质限定在与宿主生物的亲缘中。外源性核酸、核苷酸、多肽或蛋白质是不天然存在于宿主生物或位于宿主生物中的不同位置上。

核酸和蛋白序列

以下核酸和氨基酸序列可用于所公开的实施例。

如果最初的起始密码子(Met)不存在于本文公开的氨基酸序列(包括包含在序列表中的序列)中的任一个，本领域中的一个技术人员将能够在核苷酸水平上包含起始ATG，因此所翻译的多肽将具有起始Met。如果起始和/或终止密码子不出现在编码序列的开始和/或结束，本领域的技术人员将知道：在编码序列开始时插入“ATG”，在编码序列结束时，编码用于终止密码子(TAA、TAG或TGA中的任一项)的核苷酸。本文所公开的一些核苷酸序列缺失初始“ATG”和/或缺失终止密码子。如果需要的话，所公开的任何核苷酸序列可以融合到另一个核苷酸序列，所述另一个核苷酸序列在可操作地连接到“控制元件”时产生编码氨基酸的正确翻译(例如，融合蛋白质)。此外，两个或多个核苷酸序列可以通过短肽连接，例如，病毒肽。

SEQ ID NO:1是在莱茵衣藻野生型菌株CC-169021grmt+基因组(JGI蛋白质ID#147817)中注释的核苷酸序列SN03。

SEQ ID NO:2是不带有初始“atg”和终止密码子的SEQ ID NO:1的序列。

SEQ ID NO:3是SEQ ID NO:1的核苷酸序列，优化以用于莱茵衣藻的细胞核中的表达。没有终止密码子。

SEQ ID NO:4是不带有初始的“atg”的SEQ ID NO:3的序列。

SEQ ID NO:5是核苷酸序列的SEQ ID NO:3，带有在3’端添加AgeI的限制性位点、编码FLAG标签的核苷酸序列、编码MAT标签的核苷酸序列、另一AgeI限制性位点，和终止密码子。

SEQ ID NO:6是SEQ ID NO:1的翻译的蛋白质序列。

SEQ ID NO:7是SEQ ID NO:5的翻译的蛋白质序列。

SEQ ID NO:8是取自莱茵衣藻野生型菌株CC-1690 21 gr mt+的内源性的核苷酸序列SN03 cDNA。

SEQ ID NO:9是不带有初始“atg”和终止密码子的SEQ ID NO:8的序列。

SEQ ID NO:10是SEQ ID NO:8的序列，带有用XhoI限制性位点代替在5’端的ATG、在最后的密码子之后的AgeI限制性位点、编码FLAG标签的核苷酸序列、编码MAT标签的核苷酸序列、对应加入XmaI和AgeI限制性位点结合的六碱基对序列，和在3’端的终止密码子。

SEQ ID NO:11是用于优化莱茵衣藻细胞核中的表达的SEQ ID NO:8密码子的序列。

SEQ ID NO:12是不带有初始“atg”和终止密码子的SEQ ID NO:11的序列。

SEQ ID NO:13是SEQ ID NO:11的序列，带有取代在5’端的ATG的XhoI限制性位点，在最后的密码子之后的AgeI的限制性位点、编码FLAG标签的核苷酸序列、编码MAT标签的核苷酸序列，对应XmaI和AgeI的限制性位点结合的六碱基对序列，和在3’端的终止密码子。

SEQ ID NO:14是SEQ ID NO:8的翻译的蛋白质。

SEQ ID NO:15是SEQ ID NO:13的翻译的蛋白质序列。

SEQ ID NO:16是SEQ ID NO:50的核苷酸序列，两个组氨酸的残基的密码子组成推定的锌指结构域，修改为用于苏氨酸编码；具体地，核酸编号982和983从CA变化为AC，核酸编号988和989从CA变化为AC。

SEQ ID NO:17是EQ ID NO:50的核苷酸序列S，一个组氨酸的残基的密码子组成推定的锌指结构域，修改为用于苏氨酸编码；具体地，核酸标记1024和1025从CA变化为AC。

SEQ ID NO:18是SEQ ID NO:50的核苷酸序列，三个组氨酸的残基的密码子组成推定的锌指结构域，修改为用于苏氨酸编码；具体地，核酸编号982和983从CA变化为AC，核酸编号988和989从CA变化为AC，核酸编号1024和1025从CA变化为AC。

SEQ ID NO:19是SEQ ID NO:16的翻译的蛋白质。

SEQ ID NO:20是SEQ ID NO:17的翻译的蛋白质。

SEQ ID NO:21是SEQ ID NO:18的翻译的蛋白质。

SEQ ID NO:22-37是引物序列。

SEQ ID NO:38-41是miRNA靶核苷酸序列。

SEQ ID NO:42-47是引物序列。

SEQ ID NO:48是BD11的核苷酸序列。

SEQ ID NO:49是引物序列。

SEQ ID NO:50是SEQ ID NO:3的序列，带有代替在5’端的ATG的XhoI限制性位点、在最后的密码子之后的AgeI的限制性位点、编码FLAG标签的核苷酸序列、编码MAT标签的核苷酸序列、编码AgeI限制性位点的六个碱基对序列，和在3’端的终止密码子。

SEQ ID NO:51是不带有初始“M”的SEQ ID NO:6的蛋白质序列。

SEQ ID NO:52是不带有初始“M”的SEQ ID NO:14的蛋白质序列。

SEQ ID NO:53是包括突变型推定的锌指结构域的核苷酸序列。

SEQ ID NO:54是包括突变型推定的锌指结构域的核苷酸序列。

SEQ ID NO:55是包括突变型推定的锌指结构域的核苷酸序列。

SEQ ID NO:56是SEQ ID NO:53的翻译的蛋白质序列。

SEQ ID NO:57是SEQ ID NO:54的翻译的蛋白质序列。

SEQ ID NO:58是SEQ ID NO:55的翻译的蛋白质序列。

SEQ ID NO:59是5’非翻译(UTR)区。

SEQ ID NO:60是3’非翻译(UTR)区。

脂质性状基因。

SEQ ID NO:61是SN02的内源性核苷酸序列。

SEQ ID NO:62是SEQ ID NO:61的翻译的蛋白质序列。

SEQ ID NO:63是SN02的密码子最优化的核苷酸序列，在5’和3’端带有附加的核苷酸序列。

SEQ ID NO:64是在5’和3’端没有附加核苷酸序列的SEQ ID NO:63。

SEQ ID NO:65是减去初始“ATG”和终止密码子的SEQ ID NO:61。

SEQ ID NO:66是减去初始“M”的SEQ ID NO:62。

SEQ ID NO:67是SN03的内源性核苷酸序列。

SEQ ID NO:68是SEQ ID NO:67的翻译的蛋白质序列。

SEQ ID NO:69是SN03的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:70是在5’和3’端没有附加核苷酸序列的SEQ ID NO:69。

SEQ ID NO:71是减去初始“ATG”和终止密码子的SEQ ID NO:67。

SEQ ID NO:72是减去初始“M”的SEQ ID NO:68。

SEQ ID NO:73为SN08的内源性核苷酸序列。

SEQ ID NO:74是SEQ ID NO:73的翻译的蛋白质序列。

SEQ ID NO:75是SN08的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:76是在5’和3’端没有附加核苷酸序列的SEQ ID NO:75。

SEQ ID NO:77是减去初始“ATG”和终止密码子的SEQ ID NO:73。

SEQ ID NO:78是减去初始“M”的SEQ ID NO:74。

SEQ ID NO:79是SN09的内源性核苷酸序列。

SEQ ID NO:80是SEQ ID NO:79的翻译的蛋白质序列。

SEQ ID NO:81是密码子最优化的SN09核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:82是在5’和3’端没有附加核苷酸序列的SEQ ID NO:81。

SEQ ID NO:83是减去初始“ATG”和终止密码子的SEQ ID NO:79。

SEQ ID NO:84是减去初始“M”的SEQ ID NO:80。

SEQ ID NO:85是SN11的内源性核苷酸序列。

SEQ ID NO:86是SEQ ID NO:85的翻译的蛋白质序列。

SEQ ID NO:87是SN11密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:88是在5’和3’端没有附加核苷酸序列的SEQ ID NO:87。

SEQ ID NO:89是SEQ ID NO:85减去初始“ATG”和终止密码子。

SEQ ID NO:90是减去初始“M”的SEQ ID NO:86。

SEQ ID NO:91是内源性核苷酸序列SN21。

SEQ ID NO:92是SEQ ID NO:91的翻译的蛋白质序列。

SEQ ID NO:93是SN21密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:94是在5’和3’端没有附加核苷酸序列的SEQ ID NO:93。

SEQ ID NO:95是减去初始“ATG”和终止密码子的SEQ ID NO:91。

SEQ ID NO:96是减去初始“M”的SEQ ID NO:92。

SEQ ID NO:97是SN26的内源性核苷酸序列。

SEQ ID NO:98是SEQ ID NO:97的翻译的蛋白质序列。

SEQ ID NO:99是SN26密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:100是在5’和3’端没有附加核苷酸序列的SEQ ID NO:99。

SEQ ID NO:101是减去初始“ATG”和终止密码子的SEQ ID NO:97。

SEQ ID NO:102是减去初始“M”的SEQ ID NO:98。

SEQ ID NO:103是SN39的内源性核苷酸序列。

SEQ ID NO:104是SEQ ID NO:103的翻译的蛋白质序列。

SEQ ID NO:105是SN39的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:106是在5’和3’端没有附加核苷酸序列的SEQ ID NO:105。

SEQ ID NO:107是减去初始“ATG”和终止密码子的SEQ ID NO:103。

SEQ ID NO:108是减去初始“M”的SEQ ID NO:104。

SEQ ID NO:109是SN71的内源性核苷酸序列。

SEQ ID NO:110是SEQ ID NO:109的翻译的蛋白质序列。

SEQ ID NO:111是SN71的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:112是在5’和3’端没有附加核苷酸序列的SEQ ID NO:111。

SEQ ID NO:113是SEQ ID NO:109减去初始“ATG”和终止密码子。

SEQ ID NO:110:114减去初始“M”。

SEQ ID NO:115是内源性核苷酸序列的SN75。

SEQ ID NO:116是SEQ ID NO:115的翻译的蛋白质序列。

SEQ ID NO:117是密码子最优化的SN75核苷酸序列，带有在附加的核苷酸序列在5’和3’端。

SEQ ID NO:118是SEQ ID NO:117，没有附加的核苷酸序列在5’和3’端。

SEQ ID NO:119是SEQ ID NO:115减去初始“ATG”和终止密码子。

SEQ ID NO:220是减去初始“M”的SEQ ID NO:116。

SEQ ID NO:121是SN80的内源性核苷酸序列。

SEQ ID NO:122是SEQ ID NO:121的翻译的蛋白质序列。

SEQ ID NO:123是SN80的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:124是在5’和3’端没有附加核苷酸序列的SEQ ID NO:123。

SEQ ID NO:125是减去初始“ATG”和终止密码子的SEQ ID NO:121。

SEQ ID NO:126减去初始“M”的SEQ ID NO:122。

SEQ ID NO:127是SN81的内源性核苷酸序列。

SEQ ID NO:128是SEQ ID NO:127的翻译的蛋白质序列。

SEQ ID NO:129是SN81的密码子最优化的核苷酸序列，带有在列5’和3’端附加的核苷酸序。

SEQ ID NO:130是在5’和3’端没有附加核苷酸序列的SEQ ID NO:129。

SEQ ID NO:131是减去初始“ATG”和终止密码子的SEQ ID NO:127。

SEQ ID NO:132是减去初始“M”的SEQ ID NO:128。

SEQ ID NO:133是SN84的内源性核苷酸序列。

SEQ ID NO:134是SEQ ID NO:133的翻译的蛋白质序列。

SEQ ID NO:135是SN84的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:136是在5’和3’端没有附加核苷酸序列的SEQ ID NO:135。

SEQ ID NO:137是减去初始“ATG”和终止密码子的SEQ ID NO:133。

SEQ ID NO:138是减去初始“M”的SEQ ID NO:134。

SEQ ID NO:139是SN87的内源性核苷酸序列。

SEQ ID NO:140是SEQ ID NO:139的翻译的蛋白质序列。

SEQ ID NO:141是SN87的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:142是在5’和3’端没有附加核苷酸序列的SEQ ID NO:141。

SEQ ID NO:143是减去初始“ATG”和终止密码子的SEQ ID NO:139。

SEQ ID NO:144是减去初始“M”的SEQ ID NO:140。

SEQ ID NO:145是SN91的内源性核苷酸序列。

SEQ ID NO:146是SEQ ID NO:145的翻译的蛋白质序列。

SEQ ID NO:147是SN91的密码子最优化的核苷酸序列，带有5’和3’端在附加的核苷酸序列。

SEQ ID NO:148是在5’和3’端没有附加核苷酸序列的SEQ ID NO:147。

SEQ ID NO:149是减去初始“ATG”和终止密码子的SEQ ID NO:145。

SEQ ID NO:150是减去初始“M”的SEQ ID NO:146。

SEQ ID NO:151是SN108的内源性核苷酸序列。

SEQ ID NO:152是SEQ ID NO:151的翻译的蛋白质序列。

SEQ ID NO:153是SN108的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:154是在5’和3’端没有附加核苷酸序列的SEQ ID NO:153。

SEQ ID NO:155是减去初始“ATG”和终止密码子的SEQ ID NO:151。

SEQ ID NO:156减去初始“M”的SEQ ID NO:152。

SEQ ID NO:157是SN110的内源性核苷酸序列。

SEQ ID NO:158是SEQ ID NO:157的翻译的蛋白质序列。

SEQ ID NO:159是SN110的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:160是在5’和3’端没有附加核苷酸序列的SEQ ID NO:159。

SEQ ID NO:161是减去初始“ATG”和终止密码子的SEQ ID NO:157。

SEQ ID NO:162减去初始“M”的SEQ ID NO:158。

SEQ ID NO:163是SN120的内源性核苷酸序列。

SEQ ID NO:164是SEQ ID NO:163的翻译的蛋白质序列。

SEQ ID NO:165是SN120的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:166是在5’和3’端没有附加核苷酸序列的SEQ ID NO:165。

SEQ ID NO:167是减去初始“ATG”和终止密码子的SEQ ID NO:163。

SEQ ID NO:168减去初始“M”的SEQ ID NO:164。

SEQ ID NO:169是SN124的内源性核苷酸序列。

SEQ ID NO:170是SEQ ID NO:169的翻译的蛋白质序列。

SEQ ID NO:171是SN124的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:172是在5’和3’端没有附加核苷酸序列的SEQ ID NO:171。

SEQ ID NO:173的减去初始“ATG”和终止密码子的SEQ ID NO:169。

SEQ ID NO:174减去初始“M”的SEQ ID NO:170。

生长性状基因。

SEQ ID NO:175是SN01的内源性核苷酸序列。

SEQ ID NO:176是SEQ ID NO:175的翻译的蛋白质序列。

SEQ ID NO:177是SN01的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:178是在5’和3’端没有附加核苷酸序列的SEQ ID NO:177。

SEQ ID NO:179是减去初始“ATG”和终止密码子的SEQ ID NO:175。

SEQ ID NO:180减去初始“M”的SEQ ID NO:176。

SEQ ID NO:181是SN06的内源性核苷酸序列。

SEQ ID NO:182是SEQ ID NO:181的翻译的蛋白质序列。

SEQ ID NO:183是SN06的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:184是在5’和3’端没有附加核苷酸序列的SEQ ID NO:183。

SEQ ID NO:185减去初始“ATG”和终止密码子的SEQ ID NO:181。

SEQ ID NO:186减去初始“M”的SEQ ID NO:182。

SEQ ID NO:187是SN24的内源性核苷酸序列。

SEQ ID NO:188SEQ ID NO:187的翻译的蛋白质序列。

SEQ ID NO:189是SN24的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:190是在5’和3’端没有附加核苷酸序列的SEQ ID NO:189。

SEQ ID NO:191是减去初始“ATG”和终止密码子的SEQ ID NO:187。

SEQ ID NO:192是减去初始“M”的SEQ ID NO:188。

SEQ ID NO:193是SN25的内源性核苷酸序列。

SEQ ID NO:194是SEQ ID NO:193的翻译的蛋白质序列。

SEQ ID NO:195是SN25的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:196是在5’和3’端没有附加核苷酸序列的SEQ ID NO:195。

SEQ ID NO:197是减去初始“ATG”和终止密码子的SEQ ID NO:193。

SEQ ID NO:198减去初始“M”的SEQ ID NO:194。

SEQ ID NO:199是SN28的内源性核苷酸序列。

SEQ ID NO:200是SEQ ID NO:199的翻译的蛋白质序列。

SEQ ID NO:201是SN28的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:202是在5’和3’端没有附加核苷酸序列的SEQ ID NO:201。

SEQ ID NO:203是减去初始“ATG”和终止密码子的SEQ ID NO:199。

SEQ ID NO:204是减去初始“M”的SEQ ID NO:200。

SEQ ID NO:205是SN42的内源性核苷酸序列。

SEQ ID NO:206是SEQ ID NO:205的翻译的蛋白质序列。

SEQ ID NO:207是SN42的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:208是在5’和3’端没有附加核苷酸序列的SEQ ID NO:207。

SEQ ID NO:209是减去初始“ATG”和终止密码子的SEQ ID NO:205。

SEQ ID NO:210是减去初始“M”的SEQ ID NO:206。

SEQ ID NO:211是SN46的内源性核苷酸序列。

SEQ ID NO:212是翻译的蛋白质序列。SEQ ID NO:211的

SEQ ID NO:213是SN46的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:214是在5’和3’端没有附加核苷酸序列的SEQ ID NO:213。

SEQ ID NO:215是减去初始“ATG”和终止密码子的SEQ ID NO:211。

SEQ ID NO:216是减去初始“M”的SEQ ID NO:212。

SEQ ID NO:217是SN47的内源性核苷酸序列。

SEQ ID NO:218是SEQ ID NO:217的翻译的蛋白质序列。

SEQ ID NO:219是SN47的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:220是在5’和3’端没有附加核苷酸序列的SEQ ID NO:219。

SEQ ID NO:221是减去初始“ATG”和终止密码子的SEQ ID NO:217。

SEQ ID NO:222减去初始“M”的SEQ ID NO:218。

SEQ ID NO:223是SN55的内源性核苷酸序列。

SEQ ID NO:224是SEQ ID NO:223的翻译的蛋白质序列。

SEQ ID NO:225是的密码子最优化的核苷酸序列SN55，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:226是在5’和3’端没有附加核苷酸序列的SEQ ID NO:225。

SEQ ID NO:227是减去初始“ATG”和终止密码子的SEQ ID NO:223。

SEQ ID NO:228减去初始“M”的SEQ ID NO:224。

SEQ ID NO:229是SN57的内源性核苷酸序列。

SEQ ID NO:230是SEQ ID NO:229的翻译的蛋白质序列。

SEQ ID NO:231是SN57的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:232是在5’和3’端没有附加核苷酸序列的SEQ ID NO:231。

SEQ ID NO:233是减去初始“ATG”和终止密码子的SEQ ID NO:229。

SEQ ID NO:234是减去初始“M”的SEQ ID NO:230。

SEQ ID NO:235是SN59的内源性核苷酸序列。

SEQ ID NO:236是SEQ ID NO:235的翻译的蛋白质序列。

SEQ ID NO:237是SN59的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:238是在5’和3’端没有附加核苷酸序列的SEQ ID NO:237。

SEQ ID NO:239是减去初始“ATG”和终止密码子的SEQ ID NO:235。

SEQ ID NO:240是减去初始“M”的SEQ ID NO:236。

SEQ ID NO:241是SN64的内源性核苷酸序列。

SEQ ID NO:242是SEQ ID NO:241的翻译的蛋白质序列。

SEQ ID NO:243是SN64的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:244是在5’和3’端没有附加核苷酸序列的SEQ ID NO:243。

SEQ ID NO:245是减去初始“ATG”和终止密码子的SEQ ID NO:241。

SEQ ID NO:246减去初始“M”的SEQ ID NO:242。

SEQ ID NO:247是SN69的内源性核苷酸序列。

SEQ ID NO:248是SEQ ID NO:247的翻译的蛋白质序列。

SEQ ID NO:249是SN69的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:250是在5’和3’端没有附加核苷酸序列的SEQ ID NO:249。

SEQ ID NO:251是减去初始“ATG”和终止密码子的SEQ ID NO:247。

SEQ ID NO:252是剪去初始“M”的SEQ ID NO:248。

SEQ ID NO:253是SN76的内源性核苷酸序列。

SEQ ID NO:254是SEQ ID NO:253的翻译的蛋白质序列。

SEQ ID NO:255是SN76的密码子最优化的核苷酸序列，带有在在5’和3’端附加的核苷酸序列。

SEQ ID NO:256是在5’和3’端没有附加核苷酸序列的SEQ ID NO:255。

SEQ ID NO:257是减去初始“ATG”和终止密码子的SEQ ID NO:253。

SEQ ID NO:258是减去初始“M”的SEQ ID NO:254。

SEQ ID NO:259是SN78的内源性核苷酸序列。

SEQ ID NO:260是SEQ ID NO:259的翻译的蛋白质序列。

SEQ ID NO:261是SN78的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:262是在5’和3’端没有附加核苷酸序列的SEQ ID NO:261。

SEQ ID NO:263是减去初始“ATG”和终止密码子的SEQ ID NO:259。

SEQ ID NO:264是减去初始“M”的SEQ ID NO:260。

SEQ ID NO:265是SN79的内源性核苷酸序列。

SEQ ID NO:266是SEQ ID NO:265的翻译的蛋白质序列。

SEQ ID NO:267是SN79的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:268是在5’和3’端没有附加核苷酸序列的SEQ ID NO:267。

SEQ ID NO:269是减去初始“ATG”和终止密码子的SEQ ID NO:265。

SEQ ID NO:270是减去初始“M”的SEQ ID NO:266。

SEQ ID NO:271是SN82的内源性核苷酸序列。

SEQ ID NO:272是翻译的蛋白质序列SEQ ID NO:271。

SEQ ID NO:273是SN82的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:274是在5’和3’端没有附加核苷酸序列的SEQ ID NO:273。

SEQ ID NO:275是减去初始“ATG”和终止密码子的SEQ ID NO:271。

SEQ ID NO:276是减去初始“M”的SEQ ID NO:272。

SEQ ID NO:277是SN111的内源性核苷酸序列。

SEQ ID NO:278是SEQ ID NO:277的翻译的蛋白质序列。

SEQ ID NO:279是SN111的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:280是在5’和3’端没有附加核苷酸序列的SEQ ID NO:279。

SEQ ID NO:281是减去初始“ATG”和终止密码子的SEQ ID NO:277。

SEQ ID NO:282是减去初始“M”的SEQ ID NO:278。

SEQ ID NO:283是SN118的内源性核苷酸序列。

SEQ ID NO:284是SEQ ID NO:283的翻译的蛋白质序列。

SEQ ID NO:285是SN118的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:286是在5’和3’端没有附加核苷酸序列的SEQ ID NO:285。

SEQ ID NO:287是减去初始“ATG”和终止密码子的SEQ ID NO:283。

SEQ ID NO:288是减去初始“M”的SEQ ID NO:284。

SEQ ID NO:289是SN122的内源性核苷酸序列。

SEQ ID NO:290是SEQ ID NO:289的翻译的蛋白质序列。

SEQ ID NO:291是SN122的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:292是在5’和3’端没有附加核苷酸序列的SEQ ID NO:291。

SEQ ID NO:293是减去初始“ATG”和终止密码子的SEQ ID NO:289。

SEQ ID NO:294是减去初始“M”的SEQ ID NO:290。

SEQ ID NO:295是SN128的内源性核苷酸序列。

SEQ ID NO:296是SEQ ID NO:295的翻译的蛋白质序列。

SEQ ID NO:297是SN128的密码子最优化的核苷酸序列，带有在5’和3’端附加的核苷酸序列。

SEQ ID NO:298是在5’和3’端没有附加核苷酸序列的SEQ ID NO:297。

SEQ ID NO:299是减去初始“ATG”和终止密码子的SEQ ID NO:295。

SEQ ID NO:300是减去初始“M”的SEQ ID NO:296。

使用过的介质或铵的水平

三异丙基乙磺酰-醋酸盐-磷酸盐(TAP)介质含7.5μM最终浓度的NH₄Cl。高盐介质(HSM)含有7.5μM最终浓度的NH₄Cl(例如，如Harris(2009)The Chlamydomonas Sourcebook,Academic Press,San Diego,CA.)。人工海水培养基(MASM)包含11.8μM最终浓度的NaNO₃和0.5mM的NH₄Cl。在TAP或HSM介质中最终的NH₄Cl浓度可以改变，例如，使得最终NH₄Cl浓度为约0.5μM至约7.5μM。

在藻类中的不同的氮限制性表型之间的相互关系(即，增加的脂质，光合体系的分解，降低的生长，以及杂交诱导)长期以来被认为是直接连接的。例如，努力从减小的生长中分离脂质增加一直遭遇失败，从而引导出公认的假设，即营养素通量是固定的，并且日益增长地使用一种途径(例如，脂质)总是导致另一途径中伴随还原(例如，生长)。在环境应激条件下，许多藻类修改其生物合成途径以积累较高水平的脂质，其中脂质积累的分布也同时地改变。

我们已鉴别出在野生型莱茵衣藻菌种CC-1690 21 gr mt+中编码蛋白质(SN03)的mRNA，在氮饥饿(应激反应条件)时上调mRNA的表达。SN03用作脂质触发；在藻类中该蛋白质的过表达导致脂质水平增加，很少影响其它氮限制性表型。在藻类中该蛋白质的过表达导致总的可提取脂肪的增加和脂质分布的变化，这种变化类似于由氮饥饿诱导的分布的变化。因此，在没有外来应激的情况下，我们已触发应激反应诱导的脂质积累。

根据修改的Bligh Dyer方法，利用甲醇/甲基-叔丁基醚(MTBE)提取以分析藻类的脂质总重量(如Matyash V.，等人.(2008)Journal of Lipid Research49:1137-1146)，或者根据原Bligh Dyer方法(如BLIGH和DYER(1959)Can J Biochem Physiol vol.37(8)pp.911-7)。这些总的可提取脂肪通过HPLC或NMR分析以确定各种脂质类别中脂质的分布(脂质分布)。

在宿主中SN03的过表达将允许制造增加水平的可提取的脂质，例如，生物燃料。SN03的鉴定将允许本领域技术人员能够确定受氮水平的变化影响的各种途径能够负责各种下游表型。另外，这里所描述的方法将允许鉴定与SN03同源的蛋白质。

另外，我们已经鉴定了在野生型莱茵衣藻菌种CC-1690 21 gr mt+中的许多编码蛋白质的mRNA，在氮饥饿(应激反应条件)时上调、下调mRNA的表达。也在过表达蛋白质的莱茵菌株SN03中上调或下调一些mRNA。在藻类中这些蛋白质的单个过表达导致在藻类中氮应激诱导的的那些相关的表型。这些表型包括总的可提取脂肪的增加、脂质含量或分布的变化和/或转化的生物的生长和生产力上的变化。因此，在不存在外来应激的条件下，我们已经触发表型相关的应激反应。

藻类

氧光合微藻和蓝藻(为简单起见，藻类)表示了极丰富、最高度专业化的组的微生物，它们生活在不同的生态生境，如淡水、淡盐水、海水和高浓度盐水，具有一定范围的温度和pH，以及唯一营养素可用性(例如，如Falkowski，P.G.，和Raven，J.A.，Aquatic Photosynthesis，Malden，MA:BlackwellScience)。已经鉴别处超过40,000的菌种并且有更多尚待确定，藻类的多个主要类型分类如下:蓝藻(蓝藻纲)、绿藻类(绿藻纲)、硅藻类(硅藻类)、黄-绿藻类(黄藻纲)、金藻类(金藻纲)、红藻(红藻纲)、褐藻类(褐藻纲)、甲藻类(甲藻纲)，和“微微型浮游生物”(绿枝藻纲和大眼藻纲)。对一些其他门和纲的单细胞藻类进行了描述，并且它们的具体结构和生物学是可用的(例如，如Van den Hoek等人，1995)。这些藻类分类群的成千上万的菌种和菌株目前在全世界进行培养集合(http://www.utex.org；http://ccmp.bigelow.org；http://ccap.ac.uk；http://www.marine.csiro.au/microalgae；http://wdcm.nig.ac.jp/hpcc.html)。另外，有许多大型藻类的种类，例如，刚毛藻属和墨角藻属。

在大范围的环境条件下，藻类存活或增殖的能力在很大程度上反映在极广的多样性，并且有时是藻类可产生的细胞脂质的异常模式，以及修改脂肪代谢的能力有效地响应于环境条件的变化(例如，如Guschina，I.A.和Harwood，J.L.(2006)Prog.Lipid Res.45，160-186；Thompson，G.A.(1996)Biochim.Biophys.Acta.1302，17-45；和Wada，H.和Murata，N.(1998)蓝藻中的膜脂质。在光合作用下的脂质中：结构、功能和遗传学(Siegenthaler，P.A.和Murata，N.，编辑).多德雷赫特，荷兰:克鲁维尔学术出版社，pp.65-81)。藻类产生的脂质可包括，但不限于，中性脂、极性脂质、蜡酯、甾醇类和烃类，以及异戊烯衍生物,例如生育酚、类胡萝卜素、萜烯、金鸡纳碱，以及phytylated吡咯衍生物，例如叶绿素。

在最佳的生长条件下，藻类合成脂肪酸主要是用于酯化到基于甘油的膜脂质，这组成了约5-20％的细胞干重(DCW)。脂肪酸包括中链(C10-C14)、长链(C16-18)，和极长链(C20或更多种)的种类和脂肪酸的衍生物。主要膜脂质是糖基甘油酯glycosylglycerides(例如，单半乳糖苷二脂酰甘油、双半乳糖二酰基甘油和硫代异鼠李糖甘油二酯)，它们富含在叶绿体中，以及伴有大量的磷酸甘油酯(例如，磷脂酰乙醇胺，PE，和磷脂酰甘油，PG)，这些主要位于等离子体膜和许多内膜系统(例如，如在Guckert，J.B.和Cooksey，K.E.(1990)J.Biol.Chem.265Phycol.26，72-79；Harwood，J.L.(1998)藻类中的膜脂质。在光合作用下的脂质:结构、功能和遗传学(Siegenthaler，P.A.和Murata，N.，编辑).多德雷赫特，荷兰:克鲁维尔学术出版社，第53-64；Pohl，P.和Zurheide，F.(1979)海洋藻类的脂肪酸和脂质及其受环境因素控制的生物合成。在药业中的海洋藻类(Hoppe，H.A.，Levring，T.和Tanaka，Y.，编辑).柏林:Walter de Gruyter，pp.473-523；Pohl，P.和Zurheide，F.(1979)波罗的海海洋藻类的脂肪酸和脂质的形成受环境因素的控制。在植物脂质的生物化学和生理学方面的进步(Appelqvist，L.A.和Liljenberg，C.，编辑).Amsterdam:Elsevier，pp.427-432；和Wada，H.和Murata，N.(1998)在蓝藻中的膜脂。光合作用下的脂质:结构、功能和遗传学(Siegenthaler，P.A.和Murata，N.，编辑).，多德雷赫特，荷兰:克鲁维尔学术出版社，pp.65-81)。膜甘油脂质的主要成分是各种类型的多不饱和的脂肪酸，并通过需氧去饱和衍生，延伸肽链从“前体”脂肪酸软脂酸(16:0)和油酸(18:1ω9)酸(例如，如Erwin，J.A.(1973)，真核微生物中脂肪酸的比较生物化学。在真核微生物中的脂质和生物膜(Erwin，J.A.，ed).，纽约:学术出版社，pp.3-141-143)。

然而，在不适宜的或在应激条件下的生长环境中，许多藻类改变其朝向中性脂质的形成和积累(20-50％的DCW)的脂质的生物合成途径，主要以三酰基甘油(TAG)的形式。与在膜中发现的甘油脂不同，TAG不执行结构性作用而是主要用作碳和能量的储藏形式。然而，有一些证据表明，在藻类中，除了作为碳和能量的储藏，TAG生物合成途径可以在应激反应中起更积极的作用。高等植物不同中的各个类的脂质可以是合成并且定位在特定细胞、组织或器官上，与此不同，许多这些不同类型的脂质存在于单一藻类细胞。在合成之后，TAG是沉积在位于藻类细胞的细胞质中的密集封装的脂质体，尽管脂质体的形成和积累也发生在某些绿藻的叶绿体的类囊体内部空间中，例如，巴氏藻(例如，如Ben-Amotz，A.，等人.(1989)植物生理学91，1040-1043所述)。在后一种情况下，叶绿体脂质体被称为质体小球。烃是通常可见于藻类的另一种中性脂质，其量小于5％的DCW(例如，参见Lee，R.F.和Loeblich，A.R.hIII(1971)植物化学，10，593-602)。该群落绿藻、布朗葡萄藻已经显示在不利的环境条件下会产生大量(高达80％的DCW)的极长链(C23-C40)烃，与石油中发现的类似。

脂质和三酰甘油含量

选择实验室中常规使用的大部分光合微生物(例如，莱茵衣藻)，因为便于养殖，或作为用于研究光合作用的遗传模型系统(例如，如Grossman等，2007，Curr.Opin.植物生物学，10，190-198；和Merchant等，2007年，科学，318，245-251所述)。未选择少数生物体以获得最佳脂质生产。因此，不同的有机体中的脂质合成和积累的检查具有深入了解新的机制的潜力以提高脂质生产。在过去的几十年，数千藻类和蓝藻菌种已经筛选出高油脂质含量型，其中几百种油质物质已经分离，并表征在实验室和/或室外培养条件下。油质藻类可以发现在不同的分类组中，总脂质含量在分类组之间、在各个菌种或菌株内可以发生显著的变化。属于所检测的菌株的绿藻类表示最大的分类组，已经从中标识油质候选者。这可能不是因为绿藻天然比其它藻类分类群包含相当多的脂质，而是因为许多绿藻普遍存在于不同的天然生长环境，可容易地分离，并且通常增长快于来自实验室条件下、其它分类群的菌种。图1(a)概括了总脂质含量的油性绿藻在文献中报道.的总脂质每个数据点代表一单一菌种或菌种最佳培养条件下生长。油质绿藻显示了平均总脂质含量为DCW的25.5％。当细胞处于不利的培养条件下，例如光氧化应激或营养型饥饿，所述脂质含量明显增加(两倍或三倍)。平均起来，在总脂质中增加的45.7％的DCW得自应激条件下生长的油质绿藻。付出努力以确定在属水平上的绿藻是否可以表现出不同的容量，以合成并积累脂质。各种油质绿藻的统计分析没有显示出显著差异。能够产生大量的脂质和油的内在能力是菌种/菌株-特异性的，而不是属-特异性(例如，如在Hu等人，2006年，Biodiesel fromAlgae:Lessons Learned Over the Past 60Years and Future Perspectives.Juneau,Alaska:Annual Meeting of the Phycological Society of America，2012年7月7日，第40-41页(摘要)所述)。

图1(b)示出起源自淡水和海水油质硅藻在正常和应激培养条件下生长的脂质含量(例如，如Hu等人，2006年，Biodiesel from Algae:Lessons LearnedOver the Past 60Years and Future Perspectives.Juneau,Alaska:Annual Meetingof the Phycological Society of America，2012年7月7日，第40-41页(摘要)所述)。统计学分析表明：当保持在正常生长条件下，油质硅藻的平均脂质含量为DCW的22.7％，而在应激条件下，总脂质含量达到DCW的44.6％。

图1(c)示出了以下油质藻类的脂质含量：金藻、定鞭藻、黄绿藻(eustigmatophytes)，dinophytes、黄藻(xanthophytes)，或红藻(例如，如Hu等人，2006年，Biodiesel from Algae:Lessons Learned Over the Past 60Yearsand Future Perspectives.Juneau,Alaska:Annual Meeting of the PhycologicalSociety of America，2012年7月7日，第40-41页(摘要)所述)。类似于油质绿藻和硅藻，分别在正常和应激培养条件下，这些菌种/菌株显示了27.1％的平均总脂质含量和44.6％的DCW。

保持在各种应激条件下的衰老藻类细胞或细胞的总脂质的增加主要由中性脂质组成，主要是TAG。这是由于来自膜脂质合成的脂质代谢变化至中性脂质贮存。某些现有膜极性脂质从头生物合成和转换成三酰基甘油，可以有助于整体TAG的增加。结果，TAG可以在细胞中占总脂质含量多达80％(例如，如Kathen，1949年，Arch.Mikrobiol.14，602-634；Klyachko-Gurvich，1974年，Soviet Plant Physiol.21，611-618；Suen等人，1987年，J.Phycol.23，289-297；Tonon等人，2002年，Phytochemistry 61，15-24；以及Tornabene等人，1983年，Enzyme Microbiol.Technol.5，435-440所述)。

蓝藻已经经用于筛选脂质生产(例如，如Basova，2005，Int.J.Algae，7，33-57；以及Cobelas和Lechado，1989，Grasas y Aceites，40，118-145所述)。不幸的是，在实验室检查的蓝藻生物中没有发现相当大的量的总脂质(图1d)，在天然存在的蓝藻中没有观察到中性脂质三酰基甘油的积聚。

脂肪酸成分

藻类合成脂肪酸作为多种类型的脂质的形成的结构单元。最通常合成的脂肪酸具有从C16至C18的链长度，类似于高等植物(例如，如在Ohlrogge和Browse，1995，Plant Cell，7，957-970)。脂肪酸可以是饱和的或不饱和的，并且不饱和脂肪酸可以改变双键在碳主链上的数量和位置。通常，在所检查的大多数藻类中，饱和和单不饱和脂肪酸是最主要的(例如，如在Borowitzka，1988，Fats,oils and hydrocarbons.In Microalgal Biotechnology(Borowitzka，M.A.和Borowitzka,L.J.，编辑).英国剑桥，剑桥大学出版社，第257-287页所述)。具体地，大多数脂肪酸在硅藻中为C16:0和C16:1，在绿藻纲(衣藻属、带藻属)中为C16:0和C18:1，在裸藻纲中为C16:0和C18:1，在金藻纲中为C16:0、C16:1和C18:1，在隐藻纲中为20:1，在大眼藻纲中为C16:0和C18:1，在绿枝藻纲中为C16:0和C18:1，在甲藻纲中为C16:0，在普林藻纲中为C16:0、C16:0和C18:1，在红藻纲中为16:0，在黄藻纲中为C14:0、C16:0和C16:1，和在蓝藻中为C16:0、C16:1和C18:1(例如，如Cobelas和Lechado，1989，Grasas y Aceites、40、118-145所述)。

多不饱和脂肪酸(PUFA)包含两个或多个双键。基于双键的数目，单脂肪酸被命名为二烯、三烯醇，四烯、五烯和六烯脂肪酸。而且，根据从碳链的甲基末端(x)开始的第一个双键的位置，脂肪酸既可以是x3 PUFA(即从脂肪酸末端开始的第三个碳原子)或x6 PUFA(即，从脂肪酸末端开始的第六个碳原子)。大多数PUFA在Bacillarilophyceae中为C20:5x3和22:6x3，在绿藻中为C18:2和18:3x3，在裸藻中为C18:2和C18:3x3，在金藻纲中为C20:5、C22:5和C22:6，在隐藻纲中为C18:3x3、18:4和C20:3，在大眼藻纲中为C20:3和C20:4x3，在绿枝藻纲中为C18:3x3和C20:5，在甲藻纲中为C18:5x3和C22:6x3，在普林藻纲中为C18:2、C18:3x3和C22:6x3，在红藻纲中为C18:2和C20:5，在黄藻纲中为C16:3和C 20:5，以及在蓝藻中为C16:0、C18:2和C18:3x3(例如，如Basova，2005年，Int.J.Algae，7，33-57；和Cobelas和Lechado，1989，Grasas y Aceites，40，118-145所述)。

与高等植物相比，在藻类分类群(taxa)中发现脂肪酸成分更大变化。一些藻类和蓝藻作为优势种群具备能够合成中链脂肪酸(例如，C10、C12和C14)的能力，而另外一些则会产生极长链脂肪酸(>C20)。例如，在丝状蓝藻红海束毛藻中发现了占总脂肪酸27-50％的C10脂肪酸(例如，如Parker等，1967，Science，155，707-708)，以及，在金藻小定鞭藻中，C14脂肪酸构成几乎70％的总脂肪酸(例如，参见Lee和Loeblich，1971年，Phytochemistry，10，593-602)。一些藻类的另一显著特征是大量的极长链PUFA。例如，在绿藻缺刻缘绿藻(如Bigogno等，2002，Phytochemistry，60，497-503)，硅藻三角褐指藻，以及甲藻寇氏隐甲藻(如DeSwaaf等人，1999年，J.Biotechnol.，70，185-192极长链脂肪酸花生四烯酸(C20:4x6)、二十碳五烯酸(C20:5x3)，或二十二碳六烯酸(C22:6x3)是主要的脂肪酸种群，分别占在三个种群的总脂肪酸含量的33.6-42.5％、约30％，和30-50％。

需要指出，许多先前提供的数据来自于迄今已鉴定的有限数量的藻类的种类，并且大部分来自藻类的脂肪酸成分的分析已经使用总脂质提取物而不是检查单个脂质类别。因此，这些数据表示共性，并且应当预期偏差。这可以解释为什么某些脂肪酸似乎差不多都出现在各个藻类分类单位。另外，藻类的脂肪酸成分可以在量和质上随着它们的生理状态和培养条件发生改变。

脂肪酸和三酰基甘油的生物合成

脂质代谢，特别是脂肪酸和TAG的生物合成途径，相比于高等植物在藻类中已经很少被研究。基于从涉及脂质代谢的藻类和高等植物中分离的多个基因和/或酶的序列同源性和一些共享的生物化学特性，通常认为藻类中的脂肪酸和TAG生物合成的基本途径非常类似于那些高等植物。

脂肪酸生物合成

在藻类中，从头合成的脂肪酸主要发生在叶绿体中。脂肪酸生物合成的普遍方案在图2中示出。该途径产生16-或18-碳脂肪酸或二者。它们然后作为前体用于合成叶绿体和其他细胞膜以及用于合成中性贮存脂质，主要是TAG，可以在不利环境或次最优的生长条件下积累。

脂肪酸合成中的关键步骤是将乙酰辅酶A转化为丙二酰辅酶A，这是由乙酰辅酶A羧化酶(ACCase)催化的。在叶绿体中，光合作用提供一种内源的乙酰辅酶A，以及一个以上的途径会有助于保持乙酰辅酶A池。在油质种子植物中，碳通量到达脂肪酸合成的主要途径可能涉及胞质糖酵解为磷酸烯醇式丙酮酸(PEP)，然后优先从胞质转运到质体，在那里它被转换成丙酮酸盐，从而转换成乙酰辅酶A(例如，如Baud等人，2007年，Plant J.，52，405-419；Ruuska等人，2002，Plant Cell，14，1191-1206；和Schwender和Ohlrogge，2002年，Plant Physiol，130，347-361所述)。在绿藻中，糖酵解和丙酮酸盐激酶(PK)，其从PEP中催化不可逆的丙酮酸盐合成，添加到溶胶存在于除了胞质以外的叶绿体中(例如，如Andre等人，2007年，Plant Cell，19，2006-2022所述)。因此，有可能的是糖酵解衍生的丙酮酸盐是主要光合产物，要转化成用于从头合成的脂肪酸的乙酰辅酶A。ACCase通常被认为催化脂肪酸生物合成途径的第一反应-从乙酰辅酶A和CO₂形成丙二酰辅酶A。该反应在两个阶段中进行，并由单个酶复合物催化。在第一阶段是三磷酸腺苷依赖性的，CO2(来自HCO₃ ^-)是由ACCase的生物素羧化酶辅基传送到生物素辅基的氮原子，该生物素辅基连接到赖氨酸残基的ε-氨基。在第二步中由羧基转移酶催化，激活的CO2从生物素乙酰辅酶A传送以形成丙二酰辅酶A(例如，如Ohlrogge和Browse，1995年，Plant Cell，7，957-970所述)。

根据Ohlrogge和Browse(1995年，Plant Cell，7，957-970)，羧基化反应的产物丙二酰辅酶A是脂肪酸合成的中央碳供体。将丙二酰基从辅酶A转移到酰基载体蛋白(ACP；图2)。所述途径的所有后续反应涉及ACP，直到成品准备好用于传送到甘油脂或从叶绿体输出。所述丙二酰基ACP的丙二酰基参与一系列与酰基ACP(或乙酰辅酶A)受体的缩合反应。该第一缩合反应形成四碳产物，并且由缩合酶、3-酮脂酰基ACP合酶III(KAS III)催化(例如，如Jaworski等人，1989年，Plant Physiol.，90，41-44所述)。另一种缩合酶KAS I负责产生各种链长(6-16个碳)。每次缩合后三个发生另外的反应。为了形成饱和脂肪酸，3-酮脂酰基ACP产物被酶3-酮脂酰基ACP还原酶还原，通过酶羟酰ACP脱水酶脱水，再由烯酰ACP还原酶还原(图2)。这四个反应导致前体脂肪酸延长两个碳原子。该脂肪酸生物合成途径产生饱和16:0-和18:0-ACP。为了产生不饱和脂肪酸，由可溶性酶硬脂酰ACP去饱和酶引入双键。脂肪酸的伸长在以下两种情况中被终止，当从ACP中通过酰基-ACP硫酯酶去除酰基，该酰基-ACP硫酯酶水解酰基ACP并释放游离脂肪酸，或者在叶绿体中的酰基转移酶将脂肪酸直接从ACP转移到甘油-3-磷酸盐或单酰基甘油-3-磷酸盐(例如，如Ohlrogge和Browse，1995年，Plant Cell，7，957-970所述)。通过使用这些酰基ACP的酶的活性在脂肪酸合成的终止阶段确定了各个藻类的最终脂肪酸成分。

ACCases已经在纯化和动力学上表征为两个单细胞藻类、硅藻小环藻(例如，如Roessler，1990年，Plant Physiol，92，73-78所述)和定鞭藻球等鞭金藻(例如，如Livne和Sukenik，1990年，Plant Cell Physiol.10031，851-858所述)。分离自小环藻的天然ACCASE具有大约为740kDa的分子量，并且似乎是由四个相同的含生物素的亚基组成。来自球等鞭金藻的天然ACCase的分子量据估算在700k Da。这表明来自藻类的ACCases和来自高等植物的大多数ACCases是相似的，即它们是由多个相同亚基组成，其中的每一个都含有结构域的多功能肽，负责生物素羧化和后续羧基转移到乙酰辅酶A(例如，如Roessler，1990年，Plant Physiol，92，73-78所述)。

Roessler(1988，Arch.Biochem.Biophys.，267，521-528)研究了在硅藻小环藻中的各种脂质和碳水化合物生物合成酶响应于硅缺乏导致活性的变化。在4小时和15小时缺乏硅生长之后，ACCase的活性分别增加大约2倍和4倍，表明较高的酶活性可能部分地是由于酶的共价修饰。因为酶活性的增加会遭到蛋白质合成抑制剂加入的阻止，有人提出了增强ACCase活性也可以是酶合成速率增长的结果(例如，如Roessler，1988年，Arch.Biochem.Biophys.267，521-528；以及Roessler等，1994年，Ann.Allergy Asthma N.Y.Acad.Sci.721，250-256所述)。

在小环藻中编码基因的ACCase已被分离和克隆(例如，如Roessler和Ohlrogge，1993，J.Biol.Chem.，268，19254-19259所述)。所示基因编码由2089个氨基酸类组成的多肽，分子量为230kDa。导出的氨基酸序列显示出与动物的序列和生物素羧化酶中的酵母ACCases和羧基转移酶结构域非常强的相似性。在生物素羧基载体蛋白质结构域中观察到较少的序列相似性，尽管存在生物素结合位点的高度保守的Met-Lys-Met序列。该预测的ACCASE的N-末端序列具有信号序列的特性，表明酶可以通过内质网转运到叶绿体中。

三酰甘油生物合成

已经建议在藻类中通过直接甘油途径进行三酰甘油生物合成(图3)(例如，如Ratledge，1988年，An overview of microbial lipids.In Microbial Lipids，第1卷(Ratledge，C.和Wilkerson，S.G.编)，New York:Academic Press.，第3-21页)。叶绿体中产生的脂肪酸依次从辅酶A转移到甘油-3-磷酸盐的位置1和2的中，从而形成了在中间代谢物磷脂酸(PA)(例如，如Ohlrogge和Browse，1995年，Plant Cell，7，957-970所述)。特定磷酸酶催化的PA的去磷酸化释放二酰基甘油(DAG)。在TAG合成的最后步骤中，第三脂肪酸转移到DAG的空闲位置3，并且该反应是由二酰基甘油酰基转移酶催化的反应，酶促反应对于TAG生物合成是唯一的。PA和DAG也可直接作为极性脂质合成的基质，如磷脂酰胆碱(PC)和半乳糖脂。参与TAG合成的酰基转移酶可以表现出对特异性酰基辅酶A分子的偏好，因此可在确定TAG最终的酰基组成中起重要作用。例如，据Roessler等人(1994，Genetic engineering approachesfor enhanced production of biodiesel fuel from microalgae.In EnzymaticConversion of Biomass for Fuels Production(Himmel，M.E.，Baker，J.和Overend，R.P.编)，美国化学学会，第256-270页))报道，在微拟球藻细胞中，所述溶血PA酰基转移酶酰化了甘油主键的第二位置(sn-2)，具有底物专一性，而甘油-3-磷酸盐酰基转移酶和DAG酰基转移酶的辨别力较低。此外，也确定溶血PC酰基转移酶相对于16:0-辅酶A来说更喜欢18:1-辅酶A。

尽管三个相继的酰基从酰基辅酶A转移到甘油主链认为是TAG合成的主要途径，但Dahlqvist等(2000年，Proc.Natl Acad.Sci，美国，97，6487-6492)报道了在一些植物和酵母中独立于酰基辅酶A的用于TAG合成的机构。该途径使用磷脂作为酰基供体，DAG作为受体，反应是由酶磷脂：二酰甘油酰基转移酶(PDAT)催化。在体外反应系统，PDAT酶显示PC的蓖麻油或vernoloyl基团的高的底物专一性，并提出了PDAT可在双分子层干扰脂肪酸的从PC到TAG池的特定通道中起重要作用，例如蓖麻油酸和斑鸠菊酸(例如，如Dahlqvist等人，2000，Proc.Natl.Acad.Sci.U.S.A.，Acad.Sci.美国，97，6487-6492)。在各种应激条件下，藻类通常经历快速降解光合膜，胞质TAG富集的脂质体伴随出现和积聚。如果PDAT定向进化同源物在一种藻类的细胞中鉴定，特别是在叶绿体中，可以想象，定向进化同源物可以在TAG的合成中使用PC、PE或甚至衍生自光合膜的半乳糖脂作为酰基供体。同样地，响应于各种环境和生长条件，不仅在植物中也在酵母中，藻类TAG的酰基辅酶A独立合成可以膜脂质组合物的调节中起重要作用。

在所检测的大多数藻类菌种/菌株，TAG主要由饱和的或单不饱和脂肪酸的C14-C18组成(例如，如Harwood，1998年，Membrane lipids in algae.InLipids in Photosynthesis:Structure,Function and Genetics(Siegenthaler，P.A.和Murata，N.，编辑).多德雷赫特，荷兰：克鲁维尔学术出版社，第53-64页；和Roessler，1990，J.Phycol26，393-399所述)。作为例外，在绿藻缺刻缘绿藻(共球藻纲)中已经观察到极长链(>C20)PUFA合成和这些脂肪酸的分裂成TAG(例如，如Bigogno等，2002年，Phytochemistry，60，497-503所述)，淡水红色微藻紫球藻(例如，如Cohen等人，2000年，Biochem.Soc.Trans.28，740-743所述)，海洋微藻微拟球藻(大眼藻纲)，三角褐指藻和假微型海链藻(硅藻类)，和破囊壶菌Penicilliumspp(例如，如Iida等人，1996年，J.Ferment.Bioeng.81，76-78)。据报道TAG中的C22:6的一个强的位置优先用于甘油主链的sn-1和sn-3位置，发生在海洋微藻寇氏隐甲藻中(例如，如Kyle等，1992年，Bioproduction of docoshexaenoic acid(DHA)by microalgae.In Industrial Applications of Single Cell Oils(Kyle，D.J.和Ratledge，C.，编辑).Champaign，IL:美国石油化学家协会，第287-300页)。已经提出，在PUFA形成的情况中，二酰甘油和/或TAG和磷脂之间的“酰基梭子”会导致极长的富含PUFA的TAG的出现(例如，如Kamisaka等，1999年，Biochim.Biophys.Acta，1438，185-198)。极长PUFA的生物合成已经在别处详细查看(例如，如在Certik和Shimizu，1999年，J.Biosci.Reports Bioeng.87，1-14；和Guschina和Harwood，2006年，Prog.Lipid Res.45，160-186)。

比较藻类和高等植物中的脂质代谢作用

尽管藻类通常具有相似的脂肪酸和TAG人工合成途径与高等植物，有一些证据表明脂肪代谢确实发生的差异。在藻类中，例如，从二氧化碳固定到TAG合成和封存的完整路径发生在单个细胞中，而TAG的合成和累积仅发生在油料作物植物的特殊组织或器官中(例如，种子或果实)。此外，C18以上的极长PUFA不能通过天然存在的高级植物大量合成，而许多藻类(特别是海洋菌种)能够合成并积累了大量的极长PUFA，如二十碳五烯酸(C20:5x3)、二十二碳六烯酸(C22:6x3)、和花生四烯酸(C20:4x6)。参与脂质代谢的基因的绿藻莱茵衣藻表明藻类脂肪代谢的复杂性可以小于拟南芥，这反映在某些路径的存在和/或不存在和表名各种活性的基因家族的表观大小中，(例如，如Riekhof等人，2005年，Eukaryotic Cell，4、242-252所述)。

影响三酰甘油累积和脂肪酸成分的因素

尽管TAG产生的发生和程度似乎是菌种/菌株特异性的，并且只是最终受控于生物个体的遗传组成，但油质藻类在最佳生长或有利的环境条件下仅产生少量的TAG(例如，如Hu，2004年，Environmental effects on cellcomposition.In Handbook of Microalgal Culture(Richmond，A.，ed.)Oxford:Blackwell，第83-93页所述)。当油质藻类放置在通过化学或物理环境刺激施加的应激条件下，无论是单独或组合作用，在细胞的细胞脂质和脂肪酸成分中出现相当大的改变带来的大量TAG的合成和积累。主要的化学刺激是营养素饥饿、盐度、和生长介质pH。主要的物理刺激是温度和光强度。除了化学和物理因素、生长阶段和/或培养的老化也会影响TAG含量和脂肪酸成分。

营养素

在评估的所有营养素中，氮限制是在藻类中影响脂质代谢的唯一最重要营养素。响应于氮缺乏，在各种藻类分类群的许多菌种或菌株中已经发现脂质(特别是TAG)的积累的一般趋势，如图1所示(例如，如Basova，2005年，Int.J.Algae，7，33-57；Beijerinck，1904，Rec.78.Trav.Bot.53-Neerl.1，28-40；Cobelas和Lechado，1989年，Grasas y Aceites，40，118-145；Merzlyak等人，2007年，J.Phycol，43，833-843；Roessler，1990年，J.Phycol，26，393-399；Shifrin和Chisholm，1981年，J.Phycol，17，374-384；Spoehr和Milner，1949，Plant Physiol，24，120-149；和Thompson，1996年，Biochim.Bioplhys.Acta，1302，17-45所述)。

此外，在硅藻是影响细胞脂质代谢的一种同样重要的营养素。例如，缺乏硅的小环藻细胞已经比硅充足的细胞表现出更高水平的中性脂质(主要是TAG)和较高比例的饱和和单不饱和脂肪酸(例如，如Roessler，1988年，Arch.Biochem.Biophys.，267，521-528所述)。

其它类型的促进脂质积累的营养素缺乏包括磷酸盐限制和硫酸盐限制。例如，磷限制导致脂质含量提高，主要是TAG，在头藻(大眼藻纲)(例如，如Khozin-Goldberg和Cohen，2006，Phytochemistry，67，696-701所述)，三角褐指藻和角毛藻属(硅藻)，和球等鞭金藻和陆兹尔巴夫藻(普林藻纲)中，但在极微小环藻(绿藻纲)和融合微藻属(绿枝藻纲)中发现脂质含量减少(例如，如Reitan等人，1994年，J.Phycol.30，972-979所述)。在检查的海洋菌种(例如，如Reitan等，1994年，J.Phycol.30，972-979所述)中，发现增加磷剥夺被会导致相对较高的16:0和18:1的含量，和相对较低的18:4x3、20:5x3，和22:6x3的含量。研究还表明，硫剥夺提高了绿藻小球藻属中总脂质的含量(例如，如Otsuka，1961年，J.Gen，Appl.Microbiol.7，72-77所述)和莱茵衣藻(例如，如在Sato等人，2000，Environmental effectson acidic lipids of thylakoid membranes.In Recent Advances in the Biochemistryof Plant Lipids(Harwood，J.L.和Quinn，P.J.，编辑)，伦敦:波特兰出版社有限公司，第912-914页所述)。

蓝藻似乎对营养素缺乏的反应不同于真核生物藻类。Piorreck和Pohl4(1984年，植物化学，23，217-233)研究了氮剥夺对蓝藻(组囊藻、铜绿微囊藻、红色颤藻和钝顶螺旋藻)的脂质代谢的影响，并且报告了这些生物的脂质含量或脂肪酸成分在氮剥夺条件下的明显改变。当单一菌种或菌株中的脂肪酸成分发生变化以响应营养素缺乏，C18:2脂肪酸水平降低，而C16:0和C18:1脂肪酸水平增加，类似于在真核藻类中所发生的(例如，如Olson和Ingram，1975年，J.Bacteriol.545，124，373-379所述)。在某些情况下，氮饥饿导致脂质和脂肪酸的合成降低(例如，如Saha等人，2003年，FEMSMicrobiol.Ecol.45，263-272)。

温度

已经发现温度会对藻类的脂肪酸成分起主要影响。已经观察到在许多藻类和蓝藻中的一般趋势，即，随着温度的降低，增加脂肪酸不饱和度，随着温度的升高，增加饱和脂肪酸(例如，如描述在Lynch和Thompson，1982，Plant Physiol，69、1369-1375；Murata等人，1975，Plant Physiol，56、508-517；Raison，1986，Alterations in the physical properties and thermal responses ofmembrane lipids:correlations with acclimation to chilling and high temperature.In Frontiers of Membrane Research in Agriculture)(St John，J.B.，Berlin，E.和Jackson，P.G.，编著)Totowa，NJ:Rowman和Allanheld，第383-401页；Renaud等人，2002，Aquaculture，211，195-214；和Sato和Murata，1980，Biochim.Bioplhys.Acta，619，353-366)。人们推测，藻类改变膜脂质的物理性能和热响应的能力在一定温度范围内表现为一种增强生理适应策略，虽然下层调控机制还不清楚(例如，说明于Somerville，1995年，Proc.Natl Acad.Sci.美国，92，6215-6218)。温度也会影响藻类中总脂质含量。例如，丹麦棕鞭藻(Ochromonas danica)(例如，如Aaronson，1973年，J.Phycol.9，111-113中所述)和黄绿藻微拟球藻(例如，如Boussiba等人，1987年，Biomass，12，37-47所述)中的脂质含量随着温度的增加而增加。相反，小球藻在不同温度下的生长中未观察到显著的脂质含量的变化(例如，如Patterson，1970年，Lipids，5，597-600所述)。

光强度

生长在各种光强度中的藻类在它们的总化学组成、色素含量和光合作用活性方面表现出明显变化(例如，如Falkowski和Owens，1980年，PlantPhysiol，66，592-595；Post等人，1985年，Mar.Ecol.Prog.Series，25，141-149；Richardson等人，1983，New Phytol.93、157-191；和Sukenik等人，1987年，Nature，327，704-707中所述)。典型地，低的光强度使得形成极性脂质、特别是叶绿体相关的膜极性脂质，而高光强减小总极性脂质含量，同时提高了中性贮存脂质，主要是TAG的量(例如，如Brown等人，1996，J.Biol.Chem271，Phycol，32，64-73；Khotimchenko和Yakovleva，2005，Phytochemistry，66，73-79；Napolitano，1994，J.Phycol、30，943-950；Orcutt和Patterson，1974，Lipids，9，1000-1003；Spoehr和Milner，1949，Plant Physiol，24、120-149；和Sukenik等，1989，J.Biol.Chem.264:Phycol.25，686-692中所述)。

该脂肪酸的饱和程度也可以通过光强度改变。在拟微球藻属中，例如，大多数PUFA C20:5x3的百分比在光限制的培养条件下保持相当稳定(约占总脂肪酸的35％)。然而，在光饱和条件下降低了约3倍，伴随着饱和和单不饱和脂肪酸的比例的增加(即，C14、C16:0和C16:1x7)(Fabregas等人，2004)。基于藻类菌种/菌株(例如，如Orcutt和Patterson，1974，Lipids，9，1000-1003；和Sukenik等人，1993，J.Phycol Res.29，620-626中所述)，除了几种例外情况之外，似乎低光有利于PUFA的形成，其依次结合到膜剂结构。另一方面，高亮度改变脂肪酸合成以产生更多的主要组成中性脂质的饱和和单不饱和脂肪酸。

生长期和生理状态

脂质含量和脂肪酸成分在生长循环过程中也是可变的。在检查的许多海藻菌种中，在稳定期期间经常观察到TAG提高。例如，在绿藻缺刻缘绿藻，TAG从对数期的43％提高(总脂肪酸)提高到稳定期的77％(例如，如Bigogno等，2002，Phytochemistry，60，497-503所述)，和在海洋甲藻裸甲藻属，TAG的比例从对数期的8％增加至稳定期的30％(例如，如Mansour等人，2003，Phytochemistry，63，145-153所述)。饱和和单不饱和16:0和18:1脂肪酸的相对比例的同步增加和总脂质中的PUFA的比例的同步减小也与从对数期到稳定期的生长期转变相关。然而，相对于此减小的PUFA，PUFA花生四烯酸(C20:4x6)为缺刻缘绿藻细胞中产生的TAG的主要成分(例如，如Bigogno等，2002，Phytochemistry，60，497-503所述)，而二十二碳六烯酸(22:6x3)和二十碳五烯酸(20:5x3)被划分到大眼藻纲眼点拟微球藻，硅藻类三角褐指藻和假微型海链藻，和陆兹尔巴夫藻的TAG中(例如，如Tonon等人，2002，Phytochemistry 61，15-24所述)。

培养老化或衰老也会影响脂质和脂肪酸含量和组成。在绿藻绿球藻(Chlorococcum macrostigma)中细胞的总脂质含量将随着年龄增加而增加(例如，如Collins和Kalnins，1969，Phyton，26，47-50所述)，和硅藻谷皮菱形藻(例如，如vo Denffer，1949，Arch，Mikrobiol，14，159-202所述)，海链藻(例如，如Conover，1975.Mar.Biol.32，231-246所述)和圆筛藻(Coscinodiscus eccentricus)(例如，Pugh，1971.Mar.Biol.11，118-124所述)。在硅藻三角褐指藻中报导了一种例外的情况，其中培养年龄几乎不会影响到总脂肪酸含量，尽管TAG的进行累积，并且极性脂质含量减少(例如，如Alonso等，2000，Phytochemistry，54，461-471所述)。硅藻类三角褐指藻和牟氏角毛藻中的脂肪酸成分的分析揭示饱和和单不饱和脂肪酸的水平的显著增加(例如，16:0、16:1x7和18:1x9)，伴随着培养年龄的增加，PUFA的水平降低(例如，16:3x4和20:5x3)(例如，Liang等人，2006，Bot.Mar.49，165-173)。大多数藻类脂质代谢研究都采用分批培养模式。因此，给定的培养的年龄可以或可不关联于营养素消耗，使得难以区分真正的老化效应和营养素缺乏对脂质代谢的影响。

三酰基甘油累积的生理角色

在环境应激条件下，藻类中的TAG的合成和TAG的沉积到胞质脂质体可以是默认途径，极少数情况除外。除了TAG作为碳和能量的储藏的明显的生理作用，特别在老龄藻类细胞中或应激条件下，TAG合成途径可以在应激反应中发挥多种活性和不同作用。该TAG从头合成途径在光致氧化应激下作为电子穴。在应激条件下，在光合电子传递链中的过剩电子聚集可诱导过量生产的反应性氧气菌种，这可能又导致光合作用的抑制和损伤到膜脂质、蛋白质和其它大分子。一个C18脂肪酸的形成消耗来自电子传递链的约24个还原型烟酰胺腺嘌呤二核苷酸磷酸(NADPH)，这是合成相同的量的碳水化合物或蛋白质分子所需的两倍，因此在强光下或其它应激状态松弛了过度还原的电子传递链。在藻类中，所述TAG合成途径通常是与次级类胡萝卜素合成协同(例如，如Rabbani等，1998，Plant Physiol，116，1239-1248；和Zhekisheva等人，2002，J.Phycol38，325-331)。这些在类胡萝卜素通道中产生的分子(例如，β-胡萝卜素、叶黄素或虾青素)通过TAG酯化，并进入到胞质脂质体。富含类胡萝卜素的脂质体的外围分布用作“防晒剂”以在应激条件下防止或减少多余的光照射到叶绿体。TAG合成也可以利用PC、PE和半乳糖脂或从膜剂系统中排除的毒性脂肪酸作为酰基给体，从而充当一种给膜脂质解毒的机制并将其以TAG的形式沉积。

在生物燃料生产中藻类基因组和模型体系的作用

由于光合微生物可能在单位面积的生物燃料生产中比好的陆生植物多产生8-24倍的脂质(例如，如Sheehan等人，1998，A Look Back at the USDepartment of Energy’s Aquatic Species Program-Biodiesel from Algae，CloseOut Report TP-580-24190.Golden,CO:国家可再生能源实验室)，这些微生物作为未来生物柴油的前沿。在蓝藻中获得超过20种完成的基因组序列(http://genome.jgi-psf.org/mic_cur1.html)(超过30种正在进行中)，产生一些脂质。另外，8种微藻的细胞核基因组中一些可产生显著量的贮存脂质，也已被测序(http://genome.jgipsf.org/euk_cur1.html)。这些真核生物包括莱茵衣藻(PlantPhysiol(2003)第131卷，第401-408页)、团藻(绿藻)(BMC Genomics(2009)10:132)，Cyanidioschizon merolae(红藻)(DNA Research(2003)10(2):67-77)，Osteococcus lucimarinus(Proc.Natl.Acad.Sci.)(2007)104，7705-7710)，Osteococcus tauris(海洋微微群真核生物)(Trens in Geneties，第23卷，第4期(2007)第151-154页)、Aureococcus annophageferrens(一种有害的海藻繁盛成分；http://genome.jgi-psf.org/Auran1/Auran1.info.html；序列还未公开)，三角褐指藻(Nature(2008)456(7219):239-44；和PlantPhysiol.100(2002)第129卷，第993-1002也)，和假微型海链藻(硅藻)(Nature(2008)456(7219):239-44；和Science(2004)十月1日；306:5693)。

莱茵衣藻是单细胞绿藻。由于其高适应性，这些绿藻生活在全世界许多不同的环境中。通常从光合作用获取能量、具有另一种碳来源的莱茵衣藻也可以完全黑暗中茁壮成长。

衣藻属的相对适应性和快速生成时间使其成为生物研究的重要模型。所述莱茵衣藻基因组描述于Science(2007)318(5848):245-50。

团藻是多细胞绿藻藻类，与单细胞莱茵衣藻紧密相关的。团藻属繁殖为无性单倍体，但可被诱导进行性别分化和生殖。48-小时生命周期允许简单的实验室培养，并包括胚胎形成程序，表征为许多动物和植物发育的标志。这些特征包括胚轴形成、不对称细胞分裂、类似原肠胚形成的转向，及胚芽和体细胞的分化。团藻属球状体中的约2000个体细胞是双鞭毛的并适于蠕动，而包含在球状体中的约16个大的生殖细胞是不能动的并专门用于生长和繁衍。团藻胚生成产生体鞭毛的协调配置和光感应眼睛部位，用于生物的特性所需的向前滚动运动。团藻目家族包括单细胞衣藻(其基因组序列时可用的)和团藻，还包括若干多细胞或菌落种类，具有中间体细胞数量和不那么复杂的发育程序。

Ostreococcus属于绿枝藻纲，绿藻谱系中的早期分类的纲，并被报道为全球丰富的单细胞藻类，在海洋的上部水层(受阳光照射的)生存。绿色鞭毛藻和相关菌种的最显著特征是它们的极小的蜂窝组织：裸露的，近1微米的细胞，无鞭毛，具有单个叶绿体和线粒体。该Ostreococcus基因组描述于Proc.Natl.Acad.Sci.美国(2007)104，7705-7710。

根据对光的适应强度，已经定义了三个不同的生态型或潜在菌种。一个(绿色鞭毛藻)适合于高光强度并对应于表面分离的菌株。第二(RCC141)已经被定义为微光和包括来自更深水层中生物菌株。第三(海洋真核微藻)对应于分离自海滨泻湖的菌株，并被认为是光多价的。Ostreococcus属的比较分析将有助于理解单细胞真核生物和真核生物中的基因组大小演变的生态位分化。

褐潮藻为一种2-3μm球形的、不能运动的海金藻，在大西洋东北和中部美国河口引起破坏性的“赤潮”，长达20多年。一种沿海微藻菌种——褐潮藻能够生长到非常高的密度(>浓度为10E9细胞L-1)，并且能够酶促地降解复合物形式的溶解的有机物作为细胞碳和氮的来源。已知该菌种同样适于低强度光，与一般较高的水温相关联，可快速地减少微量金属，并在繁殖期将大量的碳隔离。褐藻是有害藻华(HAB)菌种。HAB是浮游植物的细胞大量繁殖导致的对人类、动物或生态系统健康有害的环境，这通过光衰减或氧气水平的降低造成，或者通过产生毒素。HAB可能引起海洋生物中毒和/或死亡。

三角褐指藻和假微型海链藻(T.pseudononan)都是硅藻。硅藻是真核的光合微生物，生存在海洋和淡水生态系统中，其负责全部初级生产的20％左右。硅藻的限定特征是过分修饰的有图案生物硅化细胞壁(称为硅藻细胞膜)，其显示菌种-特异性纳米级结构。因此，这些生物在全球碳和硅循环中起主要作用。

该海洋翼状硅藻三角褐指藻是其全部基因组序列已生成的的第二硅藻。作为主要选择的原因是优异遗传资源可用于该硅藻(例如，遗传转化，100,000EST)，并且因为它已经用于基于实验室的硅藻生理的研究多达几十年。虽然不被认为具有很大的生态重要性，但已经在全世界的几个位置发现，典型地在盐度具有大波动的沿海地区。不像其它硅藻，它可能存在不同态型，并且细胞形状的变化可由环境条件来刺激。该特征可被用来探索在细胞形状控制和形态发生的分子基础。此外，该菌种可能会在没有硅的条件下生长，硅化硅藻细胞的生物发生是兼性的，从而为实验探索藻硅中以硅为基础的纳米结构提供机会。该序列是3千万碱基对，并且连同来自环纹硅藻海链藻假微型海链藻的序列(34Mbp；第一硅藻全部基因组序列)，提供了用于硅藻与其它真核生物的比较基因组学研究的基础，并且会提供用于解释这些生物的生态成功的根据。

测序的三角褐指藻的克隆是CCAP1055/1，并可由英国藻类和原生动物培养物保藏中心(CCAP)。该克隆代表在2003年五月来自菌株CCMP632的衍生自梭形细胞的单克隆培养，最初于1956年分离自Blackpool(英国)。已经保持在F/2培养基中连续培养。三角褐指藻基因组描述于Nature(2008)456(7219):239-44。

存在广泛的基因组、生物和生理数据用于莱茵衣藻——单细胞的水-氧化绿藻(例如，如Grossman，2005，Plant Physiol，137，410-427；Merchant等人，2007，Science，318，245-251；和Mus等人，2007，J.Biol.Chem.，25475-25486)。由于这些原因，衣藻最近作为用于研究真核细胞微生物的模型，包括许多过程，如光合作用、趋光性、鞭毛功能、营养素获取，以及生物合成和脂质的功能。

最近得到的衣藻属基因组的序列和生物化学研究表明，这种多用、遗传延展性真核生物具有在其他真核生物中未见的多种代谢途径的广泛网络，从中可获得全部的基因组序列信息。衣藻属对可再生能源的贡献是特别令人感兴趣的，因为其新陈代谢可通过营养素应激操纵以累积各个产能降低的化合物。

莱茵衣藻作为生氧光合作用的模型的优点主要来自其光养、混合养或非自养的能力(在黑暗中和在醋酸盐存在下)，同时保持完整的、功能性光合机构。该特性使得研究人员研究是在其它生物中致死的光合作用的突变。另外，莱茵衣藻花费其大部分生命周期作为任意接合型的单倍体生物+或)(Harris，1989，The Chlamydomonas Sourcebook.A Comprehensive Guide to Biology andLaboratory Use.圣地亚哥，CA：学术出版社)。配子形成通过环境应激触发，特别是氮缺乏(Sager和Granick，1954，J.Gen.Physiol.10037，729-742)，并且它的发生可由生长光/暗周期同步(Kates和Jones，1964，Biochim.Biophys.Acta，86，438-447)。在其单倍体阶段，莱茵衣藻可以进行基因工程，并且容易产生单个基因型。另外，通过将两种携带不同基因型的不同接合型的单倍体突变体杂交可以获得不同表型。相反，单突变株基因型可以通过携带多个突变的突变体和相反接合型的野生型菌种杂交而获得。

莱茵衣藻也可以用作发酵的模式生物，假设给定数目的通路在厌氧条件下通过生物化学方法识别(例如，如Gfeller和Gibbs，1984，Plant Physiol，75，212-218；和Ohta等，1987，Plant Physiol，83，1022-1026)或通过微阵列分析(例如，如Mus等，2007，J.Biol.Chem.254，282，25475-25486)。结果，总结于图4，表明丙酮酸甲酸裂解酶(PFL)和丙酮酸盐铁氧还蛋白氧化还原酶(PFR)途径在衣藻中、在厌氧生活下是功能性的，以及丙酮酸盐脱羧酶(PDC)途径。前两种途径产生乙酰辅酶A(脂质代谢的前体)和甲酸盐(PFL)或H2(PFR)，且后者可产生通过乙醇脱氢酶(ADH)催化的乙醛的还原。最后，乙酰辅酶A可以进一步通过莱茵衣藻代谢产生乙醇，通过醇/醛双功能脱氢酶(ADHE)活性，或产生醋酸盐，通过两种酶——磷酸转乙酰酶(PAT)和乙酸激酶(ACK)的连续活性。最后反应释放ATP。Mus等人，(2007，J.Biol.Chem.254，282，25475-25486)和Hemschemeier和Happe(2005，Chem.Soc.Trans 33，39-41)提出了前所未有的所有这些途径的存在赋予莱茵衣藻较高的灵活性以适应环境条件。最后，在特定条件下检测出发酵乳酸盐生产(Kreuzberg，1984，Physiol.Plant，61，87-94)。

尽管脂肪酸生物合成的途径存在于莱茵衣藻(图5)中，但不认为它们是通过光自养或混合营养型生长过表达(例如，描述于Harris，1989，TheChlamydomonas Sourcebook.A Comprehensive Guide to Biology and LaboratoryUse.，圣地亚哥，CA：学术出版社)。然而，这些途径可以在莱茵衣藻中以人工方式过表达。

据报道，在产生生物燃料(在这种情况为H2)条件下，衣藻属的全球的表达分布(例如，如Mus等，2007，J.Biol.Chem.254，282，25475-25486)已经使用具有预测的15,000基因的10,000基因的第二代微阵列(例如，如Eberhard等人，2006，Curr.Genet.3，49，106-124；和Merchant等，2007，Science，318，245-251所述)。然而，报道的大部分信息涉及发酵代谢，如上所述。当衣藻暴露于营养素应激，几乎没有或没有已经进行的研究以表征向上和向下调节的与脂质代谢相关的基因。营养素剥夺的莱茵衣藻将过度积累淀粉和脂质，可以用于甲酸盐、乙醇和生物柴油生产(例如，如在Mus等人，2007，J.Biol.Chem.282，25475-25486；和Riekhof等人，2005，Eukaryotic Cell，4，242-252)。

例如列举在本公开的“宿主细胞或宿主生物”部分中的其它生物可用作本发明的系统以产生有用的产物，例如，脂肪酸、甘油脂或生物燃料。

通过微藻进行的脂质积累

在某些生长条件下，许多微藻可以产生适于转换为液体运输燃料的脂质。在二十世纪四十年代晚期，据报道氮限制显著影响微藻脂质贮存。Spoehr和Milner(1949，Plant Physiol，24，120-149)公布了环境条件对藻类组合物的影响的详细信息，并描述了变化的氮供应对小球藻和一些硅藻的脂质和叶绿素含量的影响。通过Collyer和Fogg(1955，J.Exp.Bot.53-6，256-275)表明，大多数绿藻中脂肪酸的含量为DCW的10-30％。Werner(1966，Arch，Mikrobiol，55，278-308)报道了在硅饥饿期间硅藻.细胞脂质的增加。Coombs等人(1967，Plant Physiol，42，1601-1606)报道了硅藻舟形藻的脂质含量在14个小时硅饥饿期间增加了约60％。除了营养，也发现脂肪酸和脂质成分和含量受到许多其它因素如光(例如，如描述于Constantopolous和Bloch，1967，J.5503-242，3538-3542；Nichols，1965，Biochim.Bioplhys.Acta，106，274-279；Pohl4和Wagner，1972，Z.Naturforsch，27，53-61；和Rosenberg和Gouaux，1967，J.Mol.Biol.26.J.Lipid Res.58，80-83)和低温(例如，如描述于Ackman等，1968，J.Fisheries Res.Board Canada，25，1603-1620)的影响。

微藻生理学和生物化学。

根据水生物种计划(ASP)，开展对藻类生理学的研究，以许多菌种的能力为中心，营养素应激的条件下诱导脂质生物合成(例如，如Dempster和Sommerfeld，1998，J.Phycol、34，712-721；和McGinnis等人，1997，J.Appl.Chem.45:Phycol.9、19-24所述)。将注意力集中在硅藻小环藻，生物化学研究表明，硅缺乏导致酶ACCase的活性增加，其催化乙酰辅酶A转化为丙二酰辅酶A，脂肪酸合酶的基质(Roessler，1988，Arch.Biochem.Biophys.，267，521-528)。对ACCase酶进行广泛地表征(Roessler，1990，Plant Physiol，92，73-78)。另外的研究重点是用于生产贮藏碳水化合物金藻昆布多糖的途径，假设其与脂质途径竞争固定碳。来自小环藻的二磷酸尿核苷葡萄糖焦磷酸化酶(UGPase)和金藻昆布多糖合酶活性也进行表征(例如，如Roessler，1987，J.Phycol、23，494-498；和1988年，Arch.Biochem.Biophys.267，521-528所述)。

微藻分子生物学和基因工程

在ASP的后几年，国家可再生能源研究实验室的研究集中于绿藻类和硅藻类的遗传工程以增强脂质生产。微藻的遗传转化是要克服的一个主要障碍。在1994实现首次成功转化的微藻菌株，具有潜在的生物柴油生产，成功转化硅藻小环藻和舟形藻(Dunahay等人，1995，J.Phycol.31，1004-1012)。所述技术在ACCASE启动子和终止子元件的控制下使用粒子轰击和抗生素抗性选择标记。第二主要成就是隔离和表征编码ACCase和UGPase酶的小环藻的基因(Jarvis和Roessler，1999，美国专利No.5，5，928，932；Roessler和Ohlrogge，1993，J.Biol.Chem.2685503-268，19254-19259)。使用该转化系统试图改变小环藻中的ACCase和UGPase基因的表达水平获得了一些成功，但在这些初步实验中未观察到对脂质产生的作用(Sheehan等人，1998，USDepartment of Energy’s Office of Fuels Development，1998年7月.A Look Backat the US Department of Energy’s Aquatic Species Program-Biodiesel fromAlgae，Close Out Report TP-580-24190.Golden，CO:国家可再生能源实验室)。

新标签测序方法如454(Roche，美国)和Solexa(Illumina，美国)，可以给出精确的表达数据的全基因组图像，并且也可以是用于提供藻类样本中的mRNA的定量图像。

莱茵衣藻CC-125细胞的代谢物谱的程序使酶活性迅速失活，优化萃取容量，并容易进行大的样本尺寸，是由Bolling和Fiehn报告(2005，Plant Physiol，139，1995-2005)。该研究探究Tris-乙酸盐/磷酸盐-生长的细胞以及硫酸盐缺乏的细胞。氮、磷酸盐和铁缺乏图谱也被检查，并且每个新陈代谢图谱是不同的。硫耗尽导致厌氧条件，这是诱导氢化酶生物酶和H2生产所需的(例如，如Ghirardi等，2007，Annu.Rev.Neurosci.13.Rev.Plant Biol.C58、71-91；和Hemschemeier等人，2008，Planta，227，397-407)。采用耦合到飞行时间积谱法的气相色谱法分析迅速取样的细胞(通过14C-标记技术来测定细胞泄漏控制)，检测到的约800中能够识别超过100种代谢物(例如氨基酸类、碳水化合物、磷酸化中间体、核苷酸和有机酸)。一些磷酸化糖酵解的中间体的浓度在应激反应期间显著增加(例如，如Bolling和Fiehn，2005，Plant Physiol，139，1995-2005)，与在厌氧衣藻细胞中观察到的淀粉降解和发酵相关的许多基因的上调一致(例如，如Mus等，2007，J.Biol.Chem.254，282，25475-25486)。没有研究脂质代谢。

有许多衣藻蛋白质组学的相关研究的综述，详见Stauber和Hippler(2004，Plant Physiol，42，989-1001)。然而，还没有报道在生物燃料的生产条件下藻类中蛋白质组学的研究。

宿主细胞或宿主生物

生物质含有脂肪酸和/或甘油脂，它可用于本文描述的方法和系统可以从宿主细胞或宿主有机体获得。

一种宿主细胞可以包含编码本公开内容的SN蛋白质的多核苷酸。在一些实施例中，宿主细胞是多细胞生物的一部分。在其它实施例中，宿主细胞被培养为单细胞生物。

宿主生物可包括任何合适的宿主，例如，微生物。可用于本文所述方法的微生物包括，例如，光合细菌(例如，蓝藻)、非光合细菌(例如，大肠杆菌(E.coli))、酵母(例如，酿酒酵母(Saccharomyces cerevisia))，和藻类(例如，微藻，诸如，莱茵衣藻)。

可利用所关注的多核苷酸转化的宿主生物的例子(例如，编码用于一个SN蛋白质的多核苷酸)包括维管和非维管生物。该生物可以是原核的或真核的。该生物可以是单细胞或多细胞的。宿主生物是一种包含宿主细胞的生物。在其他实施例中，宿主生物是光合的。光合生物是自然发生光合作用(例如，藻类)或经基因工程处理或改造而具有光合作用。在一些情况下，光合生物可利用本公开的构建体或载体转化，这使得光合器官的全部或部分不能工作。

举例而言，非维管光合微藻物种(例如，莱茵衣藻、海洋微拟球藻、盐生微拟球藻、杜氏盐藻、雨生红球藻、二形栅藻、绿色杜氏藻、小球藻和杜氏盐藻可经基因工程处理以产生所关注的多肽，例如，SN蛋白质。使这些微藻中产生这种蛋白质可通过对微藻进行工程处理来表达藻类叶绿体或细胞核中的蛋白来实现。

在其它实施例中，宿主生物是维管植物。这种植物的非限制性例子包括各种单子叶植物和双子叶植物，包括高油种子植物，诸如，高油种子芸苔属(Brassica)(例如，黑芥(Brassica nigra)、欧洲油菜(Brassica napus)、白芥(Brassica hirta)、芜菁(Brassica rapa)、白菜型油菜(Brassica campestris)、埃塞俄比亚芥(Brassica carinata)和芥菜型油菜(Brassica juncea))、大豆(Glycine max)、蓖麻子(Ricinuscommunis)、棉花、红花(Carthamustinctorius)、向日葵(Helianthus annuus)、亚麻(Linumusitatissimum)、玉米(Zea mays)、椰子(Cocosnucifera)、棕榈(Elaeisguineensis)、油槟榔树，诸如，橄榄(Oleaeuropaea)、芝麻，和花生(Arachishypogaea)，以及拟南芥(Arabidopsis)、烟草、小麦、大麦、燕麦、苋菜、马铃薯、水稻、西红柿，和豆类植物(例如，豌豆、蚕豆、扁豆、苜蓿等。)。

所述宿主生物或细胞可以是原核的。本公开的一些原核生物的例子包括，但并不限于，蓝藻(例如，聚球藻(Synechococcus)、集胞藻(Synechocystis)、节旋藻(Athrospira)、粘球藻(Gleocapsa)、螺旋藻(Spirulina)、细鞘丝藻属、林氏藻(Lyngbya)，颤藻(Oscillatoria)和假鱼腥藻(Pseudoanabaena)。合适的原核细胞包括，但并不限于，各种实验室菌株大肠杆菌、乳杆菌、沙门氏菌，和志贺氏菌(例如，Carrier等人，(1992)J.Immunol.148:1176-1181；美国专利号6,447,784；和Sizemore等人，(1995)Science 270:299-302中所记载的)中的任一种。可在本公开中使用的沙门氏菌菌株的例子包括，但并不限于，伤寒沙门氏菌和鼠伤寒沙门氏菌。合适的志贺氏菌菌株包括，但并不限于，弗氏志贺菌(Shigellaflexneri)、宋内氏志贺菌(Shigellasonnei)和痢疾志贺菌(Shigelladisenteriae)。通常，实验室菌株是非致病性菌株。其他合适的细菌的非限制性例子包括，但并不限于，恶臭假单胞菌(Pseudomonaspudita)、铜绿假单胞菌(Pseudomonas aeruginosa)、迈氏假单胞菌(Pseudomonasmevalonii)、紫色非硫光合细菌(Rhodobactersphaeroide)、荚膜红细菌(Rhodobactercapsulatus)、深红红螺菌(Rhodospirillumrubrum)，和红球菌属(Rhodococcus sp.)。

在一些实施例中，宿主生物或细胞是真核的(例如，绿藻、红藻、褐藻)。在一些实施例中，藻类是一种绿藻，例如，绿藻纲的(Chlorophycean)。藻类可以是单细胞或多细胞的。合适的真核宿主细胞包括，但并不限于，酵母细胞、昆虫细胞、植物细胞、真菌细胞，和藻类细胞。合适的真核宿主细胞包括，但并不限于，巴斯德毕赤酵母(Pichiapastoris)、芬兰毕赤酵母(Pichiafinlandica)、喜海藻糖毕赤酵母(Pichiatrehalophila)、Pichiakoclamae、膜醭毕赤氏酵母(Pichiamembranaefaciens)、奥默酵母(Pichiaopuntiae)、耐热毕赤酵母(Pichiathermotolerans)、千屈菜毕赤酵母(Pichiasalictaria)、锈菌毕赤酵母(Pichiaguercuum)、皮杰普氏毕赤氏酵母(Pichiapijperi)、具柄毕赤氏酵母(Pichiastiptis)、甲醇毕赤酵母(Pichiamethanolica)、毕赤酵母属(Pichiasp.)、酿酒酵母(Saccharomyces cerevisiae)、酵母属(Saccharomyces sp.)、多形汉逊酵母(Hansenulapolymorpha)、克鲁维酵母属(Kluyveromyces sp.)、乳酸克鲁维酵母(Kluyveromyces lactis)、白假丝酵母(Candida albicans)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、里氏木霉(Trichoderma reesei)、勒克瑙金孢菌(Chrysosporiumlucknowense)、镰孢属(Fusarium sp.)、禾赤镰孢(Fusarium gramineum)、镶片镰孢(Fusarium venenatum)、粗糙脉孢菌(Neurospora crassa)和莱茵衣藻。

在一些实施例中，可以在该公开方法中使用真核生物微藻，例如衣藻(Chlamydomonas)、团藻(Volvacales)、杜氏藻(Dunaliella)、微拟球藻(Nannochloropsis)、Desmid、链带藻属、栅藻属、小球藻属(Chlorella)、节旋藻、螺旋藻、葡萄藻属、链带藻属，或红球藻菌种。

在其他实施例中，宿主细胞是莱茵衣藻、盐生杜氏藻、雨生红球藻(Haematococcus pluvialis)、海洋微拟球藻(Nannochloropsis oceania)、微拟球藻(Nannochloropsis salina)、二形栅藻(Scenedesmus dimorphus)、小球藻(Chlorella)菌种、螺旋藻(Spirulina)物种、鼓藻(Desmid)菌种、极大螺旋藻(Spirulina maximus)、椭圆节旋藻(Arthrospira fusiformis)、绿色杜氏藻(Dunaliella viridis)、眼点拟微绿球藻(N.oculata)、极大螺旋藻(S.maximus)，椭圆节旋藻(A.Fusiformis)或杜氏盐藻。

在一些情况下，生物是红藻(rhodophyte)、绿藻(chlorophyte)、异鞭藻(heterokontophyte)、黄丝藻(tribophyte)、灰胞藻(glaucophyte)、绿蜘藻(chlorarachniophyte)、裸藻(euglenoid)、定鞭藻(haptophyte)、隐丝藻(cryptomonad)、沟鞭藻(dinoflagellum)，或浮游藻(phytoplankton)。

在一些情况下，宿主生物是维管的且具有光合作用。维管植物的例子包括，但并不限于，被子植物、裸子植物、莱尼蕨植物(rhyniophyte)，或其他维管植物。

在一些情况下，宿主生物是非维管的且具有光合作用。依本文所用，“非维管光合生物”一词指任何宏观或微观生物，包括，但不限于，藻类、蓝藻和光合细菌，它们没有维管系统，诸如，在维管植物中发现的维管系统。非维管光合生物的例子包括苔藓植物(bryophtye)，诸如，地钱门植物(marchantiophyte)或角苔门植物(anthocerotophyte)。

在一些情况下，生物是一种蓝藻。在一些情况下，生物是藻类(例如，巨藻或微藻)。藻类可以是单细胞或多细胞藻类。例如,微藻莱茵衣藻可以用载体，或其线性化部分转化，从而编码一种或多种所关注的蛋白质(例如，SN蛋白质)。

藻类转化的方法记载在美国临时专利申请号60/142,091中。本公开的方法可以使用藻类，例如，微藻，莱茵衣藻来进行。根据本公开的方法来使用微藻来表达多肽提供的优点是，可以使大量微藻生长，包括商业上的(Cyanotech公司；Kailua-Kona HI)，因此允许产生，且如果需要的话，分离出大量的所需产物。

本公开的载体可能能够稳定地或瞬时地转化多种光合生物，包括但并不限于：光合细菌(包括蓝细菌)、蓝藻门(cyanophyta)、原绿藻门(prochlorophyta)、红藻门(rhodophyta)、绿藻门(chlorophyta)、异鞭藻门(heterokontophyta)、黄绿藻植物门(tribophyta)、灰色藻门(glaucophyta)、绿蜘藻(chlorarachniophyte)、裸藻门(euglenophyta)、眼虫藻(euglenoid)、定鞭藻门(haptophyta)、金藻门(chrysophyta)、隐藻门(cryptophyta)、隐藻(cryptomonad)、甲藻门(dinophyta)、双鞭藻门(dinoflagellata)、定鞭金藻门(pyrmnesiophyta)、硅藻门(bacillariophyta)、黄藻门(xanthophyta)、黄绿藻门(eustigmatophyta)、针胞藻门(raphidophyta)、褐藻门(phaeophyta)，以及浮游藻(hytoplankton)。本公开的其他载体能够稳定地或瞬时地转化，例如，莱茵衣藻(C.reinhardti)、海洋微拟球藻(N.oceania)、盐生微拟球藻(N.salina)、杜氏盐藻(D.salina)、雨生红球藻(H.pluvalis)、二形栅藻(S.dimorphus)、绿色杜氏藻(D.viridis)，或海洋单细胞绿藻(D.tertiolecta)。

适当宿主的例子包括，但并不限于：细菌细胞，诸如，大肠杆菌、链霉菌、鼠伤寒沙门菌；真菌细胞，诸如，酵母；昆虫细胞，诸如，果蝇S2和夜蛾Sf9；动物细胞，诸如，CHO、COS或Bowes黑色素瘤；腺病毒类；以及植物细胞。适当宿主的选择被认为是在本领域技术人员的了解范围内。

本文中所述的选择和分离的多核苷酸被引入到适合的宿主细胞内。适合的宿主细胞是能够促进重组和/或还原性重组的任何细胞。选择的多核苷酸可以，例如，在包括适当控制序列的载体中。宿主细胞可以是，例如，高等真核细胞，诸如，哺乳动物细胞，或低等真核细胞，诸如，酵母细胞，或宿主细胞可以是原核细胞，诸如，细菌细胞。可以通过，例如，磷酸钙转染、DEAE-葡聚糖介导的转染，或电穿孔来将构建体(载体)引入宿主细胞中。

重组多肽可以在植物中表达，允许生产这类植物作物，并且因此能方便地生产大量的所需产物，例如脂肪酸或甘油脂。因此，可以使用任何植物来实践本公开的方法，包括，例如，微藻和巨藻(诸如，海藻和海草)，以及在土壤中生长的植物。

在一个实施例中，宿主细胞是植物。“植物”一词在本文中广泛地用来指含有质体，诸如，叶绿体的一种真核生物，并且包括处于发育任何阶段的任何这类生物，或指植物的一部分，包括植物插条、植物细胞、植物细胞培养物、植物器官、植物种子，以及小植株。植物细胞是植物的结构和生理单位，包含原生质体和细胞壁。植物细胞可以是分离的单细胞或培养的细胞的形式，或可以是高等组织单位的一部分，例如，植物组织、植物器官，或植物。因此，植物细胞可以是原生质体、配子产生细胞，或可再生成全植物的细胞或细胞集合。像这样，包含多个植物细胞并且能够再生成全植物的种子被认为是用于实现本公开目的的植物细胞。植物组织或植物器官可以是种子、原生质体、愈伤组织，或组织成结构或功能单位的任何其他植物细胞群。特别有用的植物部分包括可收获部分以及可用于繁殖子代植物的部分。植物的可收获部分可以是植物的任何有用部分，例如，花、花粉、幼苗、块茎、叶、茎、果实、种子，以及根。可用于繁殖的植物的一部分包括，例如，种子、果实、插条、幼苗、块茎，以及根茎。

本公开的基因可以在高等植物中表达。例如，拟南芥。SN基因也可以在芸苔属、大豆、棉花、苜蓿、玉米、高粱、水稻、小麦、黍属物种中表达。

本公开的方法可产生含有基因组DNA的植物(例如，细胞核和/或质体基因组DNA)，其经基因改造以含有稳定整合的多核苷酸(例如，Hager和Bock，Appl.Microbiol.Biotechnol.54:302-310,2000中所记载的)。因此，本公开还提供了一种转基因植物，例如，莱茵衣藻，其包含一种或多种叶绿体，所述叶绿体含有编码一种或多种外源性或内源性多肽，包括可允许分泌燃料产物和/或燃料产物前体(例如，类异戊二烯、脂肪酸、脂类、甘油三酸酯)的多肽的多核苷酸。本公开的光合生物包含被改造成产生，例如，燃料产物或燃料产物前体的至少一个宿主细胞。

可用于所公开的实施例的一些宿主生物是，例如，极端微生物，诸如，超嗜热菌、嗜冷菌、耐冷菌、嗜盐微生物、嗜压微生物和嗜酸菌。可用于实施本公开的一些宿主生物是嗜盐(例如，盐生杜氏藻、绿色杜氏藻(D.viridis)，或杜氏盐藻(D.tertiolecta))。例如，杜氏盐藻(D.salina)可以在海水和盐湖(例如，盐度为千分之30-300)和高盐度的培养基(例如，人工海水培养基、海水营养琼脂、半咸水培养基，和海水培养基)中生长。在本公开的一些实施例中，表达本公开的蛋白质的宿主细胞可在液体环境中生长，例如，0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、31、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3摩尔或更高浓度的氯化钠。本领域技术人员将认识到，其它盐(钠盐、钙盐、钾盐或其它盐)也可存在于液体环境中。

当嗜盐生物用于本公开时，可以用本文所述的任何载体将其转化。例如，可以用能够插入叶绿体或细胞核基因组中并且含有编码蛋白质(例如，SN蛋白质)的核酸的载体来转化杜氏盐藻(D.salina)。然后，可以使转化的嗜盐生物在高盐环境(例如，盐湖、盐池，以及高盐培养基)中生长以产生所关注的产物(例如，脂类)。产物的分离可以涉及在从生物中提取产物之前从高盐环境中移出转化的生物。在产物分泌到周围环境中的情况下，在对产物进行任何进一步处理之前，使液体环境脱盐可能是必需的。

本公开进一步提供包含基因改造的宿主细胞的组合物。组合物包含一种基因改造的宿主细胞；并且在一些实施例中将包含一个或多个另外的组分，这些组分是部分基于预期使用基因改造的宿主细胞而选择的。适合的组分包括，但并不限于，盐类；缓冲剂；稳定剂；蛋白酶抑制剂；细胞膜-和/或细胞壁保护性化合物，例如，甘油和二甲基亚砜；以及适合于该细胞的营养培养基。

一种宿主细胞或宿主生物可以是遗传修饰的，从而成为转基因宿主细胞或转基因宿主生物。宿主细胞或宿主生物的质体可以是遗传修饰的，从而变成了转基因质体。

细胞或生物的培养

可以使生物在允许进行光合作用的条件下生长，然而，这不是必要条件(例如，可以使宿主生物在缺乏光的情况下生长)。在一些情况下，可以以这样一种方式对宿主生物进行基因改造，即其光合能力被削弱或破坏。在宿主生物不能够进行光合作用的生长条件下(例如，由于缺乏光和/或基因改造)，典型地，将必需的营养素提供给生物以支持在缺乏光合作用情况下的生长。例如，生物生长于其中(或其上)的培养基可以添加有任何需要的营养素，包括有机碳源、氮源、磷源、维生素、金属、脂类、核酸、微量营养素，和/或生物特异性需要物。有机碳源包括宿主生物能够代谢的任何碳源，包括，但并不限于，乙酸盐、简单的碳水化合物(例如，葡萄糖、蔗糖，以及乳糖)、复杂的碳水化合物(例如，淀粉和糖原)、蛋白质，和脂类。本领域的技术人员应当认识到的是，不是所有生物都能够充分代谢特定的营养素，并且从一种生物至另一种生物可能需要改变营养素混合物，以提供适当的营养素混合物。

生物的最佳生长通常发生在大约20℃至大约25℃的温度下，但是一些生物仍然可以在高达约35℃的温度下生长。活性生长典型地在液体培养物中完成。如果生物在液体培养基中生长并且被摇动或混合，在静止期，细胞密度可以是大约1至5×10⁸个细胞/ml。

例如，对于衣藻属(Chlamydomonas sp.)而言，在静止期，细胞密度可以是大约1至5×10⁷个细胞/ml；对于微拟球藻属(Nannochloropsis sp.)而言，在静止期，细胞密度可以是大约1至5×10⁸个细胞/ml；对于栅藻属(Scenedesmus sp.)而言，在静止期，细胞密度可以是大约1至5×10⁷个细胞/ml；并且对于小球藻属(Chlorella sp.)而言，在静止期，细胞密度可以是大约1至5×10⁸个细胞/ml。静止期的示例性细胞密度如下：衣藻属(Chlamydomonas sp.)可以是大约1×10⁷个细胞/ml；微拟球藻属(Nannochloropsis sp.)可以是大约1×10⁸个细胞/ml；栅藻属(Scenedesmus sp.)可以是大约1×10⁷个细胞/ml；并且小球藻属(Chlorella sp.)可以是大约1×10⁸个细胞/ml。示例性的生长速率可以，例如，每天产生细胞的两倍至二十倍增加，这取决于生长条件。此外，生物的倍增时间可以是，例如，5小时至30小时。

生物还可以在固体培养基上生长，例如，在平板中或斜面上含有大约1.5％琼脂的培养基。

一种能源是荧光灯，该荧光灯可以置于，例如，距离该生物大约1英寸至大约两英尺的距离。荧光灯类型的例子包括，例如，冷白光和日光。用空气或CO₂鼓泡提高生物的生长速率。用CO₂鼓泡可以，例如，用1％至5％的CO₂。如果以规则的间隔(例如，12：12或14：10小时的明∶暗)将光开启和关闭，那么一些生物的细胞将变得同步。

通过将生物划线到平板上，用，例如，Parafilm^TM来密封平板，并且将它们置于在大约10℃至大约18℃下的暗光下，可以实现生物的长期储存。可替代地，可以以划线或针刺的方式使生物在琼脂管中生长，加盖，并且在大约10℃至大约18℃下储存。这两种方法都允许将生物储存数月。

为了更长时间的储存，可以使生物在液体培养物中生长至对数期的中至晚期，然后添加穿透性冷冻保护剂，例如，DMSO或MeOH，并且储存在低于-130℃下。可以使用的示例性DMSO浓度范围是5％至8％。可以使用的示例性MeOH浓度范围是3％至9％。

可以使生物在限定的基本培养基(例如，高盐培养基(HSM)、改良人工海水培养基(MASM)，或F/2培养基)上生长，以光作为唯一能源。在其他情况下，可以使生物在培养基(例如，三羟甲基氨基甲烷乙酸磷酸盐(TAP)培养基)中生长，并且用有机碳源做补充。

生物，诸如，藻类可以自然生长于淡水或海水中。用于淡水藻类的培养物可以是，例如，合成培养基、富集培养基、土壤水培养基，以及固化培养基，诸如，琼脂。各种不同的培养基已经被开发出来，并且用于分离和培养淡水藻类，并且记载在Watanabe，M.W.(2005).Freshwater CultureMedia.In R.A.andersen(Ed.)，Algal Culturing Techniques(pp.13-20).Elsevier AcademicPress中。用于海藻的培养基可以是，例如，人工海水培养基或天然海水培养基。制备培养基的指南记载在Harrison，P.J.和Berges，J.A.(2005).MarineCultureMedia.In R.A.andersen(Ed.)，Algal Culturing Techniques(pp.21-33).ElsevierAcademic Press中。

生物可以生长在户外开放水域中，诸如，池塘、洋、海、河、水床、沼泽、浅水池、湖、渡槽，以及水库。当生长在水中时，生物可以包含在由lego样颗粒(lego-like particle)组成的halo样物体(halo-like object)中。Halo样物体环绕该生物并且允许其保持来自水下的营养素同时使其保持在开放的日光中。

在一些情况下，可以使生物生长在容器中，其中每个容器包含一种或两种生物，或多种生物。所述容器可以被配置成漂浮在水上。例如，可以用空气和水的组合来填充容器使该容器和在其中的生物有浮力。因此，可以使适合生长在淡水中的生物生长在盐水(例如，海洋)中，并且反之亦然。如果容器受损，那么此机制允许生物自动死亡。

用于藻类的培养技术是本领域的技术人员熟知的，并且，记载在，例如，Freshwater Culture Media.In R.A.Andersen(Ed.)，Algal CulturingTechniques.Elsevier Academic Press中。

由于光合生物，例如，藻类需要日光、CO₂和水用于生长，可以将它们培养在，例如，开放的池塘和湖中。然而，与封闭系统相比较，这些开放系统更易受到污染的影响。使用开放系统的一个挑战是，所关注的生物可能不如潜在的侵入物生长得快。当另一种生物侵入所关注的生物正生长于其中的液体环境时，这成了一个问题，并且该侵入的生物具有更快的生长速率并且占据了该系统。

此外，在开放系统中，对水温、CO₂浓度，以及采光条件存在较少的控制。生物的生长期主要依赖于位置，并且除了热带地区之外，受限于年度中较温暖的月份。此外，在开放系统中，可以生长的不同生物的数量受限于在选择的位置中能够存活的那些。然而，与封闭系统相比较，可以更廉价地建立和/或维持开放系统。

使生物生长的另一种方法是使用半封闭系统，诸如，用一种结构，例如，“温室型”结构来覆盖池塘或水池。虽然这可能会导致较小的系统，但是它解决了与开放系统相关的许多问题。半封闭系统的优点是其可以允许更大数量的不同生物生长，通过针对侵入生物生长所需营养素，允许所关注的生物竞争超过侵入生物，其可以允许生物比侵入生物占优势，并且它可以延长生物的生长期。例如，如果将系统加热，那么生物可以整年生长。

池塘系统的变体是人工池塘，例如，跑道池。在这些池塘中，生物、水，和营养素围绕“跑道”循环。明轮为跑道中的液体提供恒定运动，允许生物以选定的频率循环返回到液体表面。明轮还提供了一种搅拌源并且使该系统氧合。这些跑道池可以封闭在，例如，建筑物或温室中，或可以位于室外。

跑道池通常被保持在浅的状态，因为需要使生物暴露于日光，并且日光仅能够穿透池塘水到达有限深度。跑道池的深度可以是，例如，大约4英寸至大约12英寸。此外，可以包含在跑道池中的液体的体积可以是，例如，大约200升至大约600,000升。

跑道池可以以连续方式来操作，例如，将CO₂和营养素恒定地馈送入池塘中，同时在另一端将含有生物的水移开。

如果将跑道池置于室外，那么有数种不同途径来解决不需要的生物的侵入。例如，所希望的生物位于其中的液体的pH或盐度可以使得侵入生物的生长减慢或死亡。

而且，可以将化学品添加到液体中，诸如，漂白粉，或可以将杀虫剂，诸如，草甘磷添加到液体中。此外，可以对所关注的生物进行基因改造，使其更好地适合于在液体环境中存活。可以使用上述策略的任何一项或多项来解决不需要的生物的侵入。

可替代地，可以使生物，诸如，藻类生长于封闭结构，诸如，光生物反应器，其中该环境是处于比开放系统或半封闭系统更严格的控制下。光生物反应器是一种结合了某一类型的光源的生物反应器，以将光子能量输入提供给反应器。光生物反应器一词可以指相对于环境而被封闭的并且与该环境无气体和污染物直接交换的系统。光生物反应器可以被描述为封闭的、光照的培养容器，其被设计成用于光养液体细胞悬液培养物的受控的生物质产生。光生物反应器的例子包括，例如，玻璃容器、塑料管、槽、塑料套管，以及袋。可以用来提供维持光合作用所需能量的光源的例子包括，例如，荧光灯泡、LED，以及天然日光。因为这些系统是封闭的，生物生长所需要的所有事物(例如，二氧化碳、营养素、水，以及光)必须被引入该生物反应器中。

尽管建立和维持光生物反应器的成本不同，但它们具有多个胜过开放系统的优点，它们可以，例如，防止污染或将污染降至最低，允许单种培养(仅由一种生物种类组成的培养物)的无菌性生物培养，对培养条件(例如，pH、光、二氧化碳，以及温度)提供更好的控制，防止水分蒸发，降低由于放气造成的二氧化碳损耗，并且允许更高的细胞浓度。

另一方面，光生物反应器的某些要求，诸如，冷却、混合、氧积累以及生物污垢的控制，使得这些系统比开放系统或半封闭系统的建立和操作费用更高。

可以建立光生物反应器以便连续收获(当用大多数的较大体积的培养系统时)或一次一批地收获(例如，当用聚乙烯袋培养时)。使用，例如，营养素、生物(例如，藻类)，以及水来建立序批式光生物反应器，并且允许该生物生长直至收获该批次。可以，例如，连续地、每日地，或以固定时间间隔对连续的光生物反应器进行收获。

高密度光生物反应器记载在，例如，Lee等人《生物技术与生物工程》(Biotech.Bioengineering)44：1161-1167，1994中。其他类型的生物反应器，诸如，用于污水和废水处理的那些，记载在Sawayama等人《应用微生物学和生物技术》(Appl.Micro.Biotech.)，41：729-731，1994中。光生物反应器的额外例子记载在美国申请公开号2005/0260553、美国专利号5,958,761，以及美国专利号6,083,740中。而且，可以对生物，诸如，藻类进行大量培养用于从水、土壤，或其他来源或样本中除去重金属(例如，如Wilkinson，《生物技术通讯》(Biotech.Letters)，11：861-864，1989中所述)、氢(例如，如美国专利申请公开号2003/0162273中所述)，以及药物化合物。还可以在常规的发酵生物反应器中培养生物，这些生物反应器包括，但不并限于分批、分批补料、细胞再循环，以及连续发酵罐。培养生物的额外方法以及本文所述方法的变体是本领域的技术人员已知的。

还可以使生物在乙醇生产工厂或产生CO₂的其他设施或区域(例如，城市和公路)附近生长。像这样，本文所述的方法设想到用于将碳信用额销售给乙醇工厂或产生CO2的其他设施或区域的商业方法，同时通过使本文所述的一种或多种生物在乙醇生产工厂、设施，或区域附近生长来制造燃料或燃料产物。

生长于本文所述的任何系统中的所关注的生物可以，例如，连续地收获，或一次一批地收获。

例如，通过从含有生物的液体表面下鼓泡通入CO₂，可以将CO₂递送到本文所述的任何一个系统中。而且，可以使用喷雾来将CO₂注入液体中。喷雾器是，例如，也称为鼓泡器、碳酸化器、充气器、多孔石以及扩散器的多孔盘或管组件。

可用于本文所述系统的营养素包括，例如，氮(NO₃ ^-或NH₄ ⁺的形式)、磷，以及微量金属(Fe、Mg、K、Ca、Co、Cu、Mn、Mo、Zn、V，以及B)。营养素可以以，例如，固体形式或以液体形式存在。如果营养素是固体形式，那么在递送到含有生物的液体中之前，或递送到光生物反应器之前可将它们与，例如，淡水或盐水混合。

可以使生物以培养物的形式生长，例如，大规模培养，其中大规模培养是指培养物生长体积大于约6升，或大于约10升，或大于约20升。大规模生长还可以是培养物生长体积为50升或更多、100升或更多，或200升或更多。大规模生长可以是使培养物生长于，例如，池塘、器皿、容器，或其他区域中，其中含有该培养物的池塘、器皿、容器，或区域是面积，例如，至少5平方米、至少10平方米、至少200平方米、至少500平方米、至少1,500平方米、至少2,500平方米，或更大。

衣藻属(Chlamydomonas sp.)、微拟球藻属(Nannochloropsis sp.)、栅藻属(Scenedesmus sp.)，以及小球藻属(Chlorella sp.)是可以如本文所述进行培养并且可以在一系列广泛的条件下生长的示例性藻类。可以如本文所述进行培养的一种生物是常用的实验室种类莱茵衣藻。这个种类的细胞是单倍体，并且可以在无机盐的简单培养基上生长，使用光合作用来提供能量。如果提供乙酸盐作为碳源，那么这种生物还可以生长在完全黑暗的环境中。在标准荧光灯下在室温下莱茵衣藻可以容易地生长。此外，可以通过将它们置于明-暗周期中使所述细胞同步。培养莱茵衣藻细胞的其他方法是本领域的技术人员已知的。

多核苷酸和多肽

还提供了编码本文所述的一种蛋白质，例如，SN蛋白质的分离的多核苷酸。依本文所用，“分离的多核苷酸”意指这样一种多核苷酸，其不含有得到多核苷酸的生物的天然发生的基因组中的多核苷酸的侧翼的核苷酸序列之一或两者。该术语包括，例如，多核苷酸或其片段，该多核苷酸或其片段结合到一载体或表达盒中；结合到自主复制的质粒或病毒中；结合到原核生物或真核生物的基因组DNA中；或作为独立于其他多核苷酸的分离的分子而存在。其还包括重组多核苷酸，该重组多核苷酸是杂交多核苷酸，例如，编码多肽序列的杂交多核苷酸的一部分。

可以通过本领域已知的任何方法来制造本公开的新型蛋白质。可以使用固相肽合成或者通过又称液相肽合成的经典的溶液肽合成来合成该蛋白质。使用Val-Pro-Pro、乙丙脯氨酸(Enalapril)以及苯丁酸赖脯酸(Lisinopril)作为起始模板，可以使用固相或液相肽合成来合成若干系列的肽类似物，诸如，X-Pro-Pro、X-Ala-Pro，以及X-Lys-Pro，其中X代表任何氨基酸残基。还已经描述了用于进行结合到可溶性低聚物载体上的肽和寡核苷酸库的液相合成的方法。Bayer，Ernst和Mutter，Manfred，《自然》(Nature)237：512-513(1972)；Bayer，Ernst等人《美国化学协会期刊》(J.Am.Chem.Soc.)96：7333-7336(1974)；Bonora，Gian Maria等人《核酸研究》(Nucleic Acids Res.)18：3155-3159(1990)。液相合成法优于固相合成法之处在于，液相合成法不需要在第一反应物上存在适合于将反应物附连到固相上的结构。而且，液相合成法不需要避免可切割固相和第一反应物(或中间产物)之间的键的化学条件。此外，与多相的固相/液相系统中得到的那些，诸如，在固相合成中存在的那些相比较，均相溶液中的反应可得到更好的产量和更完全的反应。

在寡聚物支持的液相合成中，生长的产物被附连到大的可溶性聚合物基团上。然后，可以基于在相对较大聚合物附连的产物与未反应的反应物在尺寸上的较大差异从未反应的反应物中分离出每一合成步骤中的产物。这允许在均相溶液中进行反应，并且消除了与传统液相合成相关联的繁琐的纯化步骤。寡聚物支持的液相合成也适合于肽的自动液相合成。Bayer，Ernst等人《肽：化学、结构、生物学》(Peptides:Chemistry,Structure,Biology)，426-432。

对于固相肽合成而言，所述流程能够将适当的氨基酸依次组装到具有所需序列的肽中，同时使生长的肽的末端连接到不溶性载体上。通常，肽的羧基末端连接到当用切割试剂处理时可以将其释放的聚合物上。在常见方法中，氨基酸被结合到树脂颗粒上，并且通过依次添加保护氨基酸逐步产生肽，从而产生氨基酸链。常用的是Merrifield所述的技术的修改形式。参见，例如，Merrifield，《美国化学协会期刊》(J.Am.Chem.Soc.)96：2989-93(1964)。在自动固相方法中，通过将羧基端氨基酸加载到有机连接体上(例如，PAM，4-氧甲基苯基乙酰氨基甲基)来合成肽，该有机连接体共价附连到与二乙烯基苯交联的不溶性聚苯乙烯树脂上。可以通过用叔丁氧羰基封闭来保护末端胺。羟基和羧基基团通常通过用O-苄基基团封闭来保护。在自动化肽合成仪中实现合成，诸如，购自Applied Biosystems(福斯特市，加利福尼亚州)的合成仪。合成之后，可以将产物从树脂中移出。根据已建立的方法通过使用氢氟酸或三氟甲基磺酸将封闭基团去除。常规合成可产生0.5mmole肽树脂。在切割和纯化之后，典型地产生大致60％至70％的产量。通过，例如，从有机溶剂，诸如，甲基丁基醚中结晶肽，然后溶于蒸馏水中，并且使用透析(如果主题肽的分子量大于约500道尔顿)或反向高压液相色谱法(例如，使用C¹⁸柱，用0.1％三氟乙酸和乙腈作为溶剂)如果该肽的分子量小于500道尔顿，来完成产物肽的纯化。可以将纯化的肽冻干并且以干燥状态储存直至使用。可以使用分析型高压液相色谱法(HPLC)和电喷射质谱(ES-MS)的常见方法来完成对所产生的肽的分析。

在其他情况下，通过重组方法生产YD蛋白质。为了生产本文所述的任何一种蛋白质，可以使用利用含有编码这样的蛋白质的多核苷酸的表达载体来转化的宿主细胞。该宿主细胞可以是高等真核细胞，诸如，哺乳动物细胞，或低等真核细胞，诸如，酵母或藻类细胞，或宿主可以是原核细胞，诸如，细菌细胞。可以通过多种方法来将表达载体引入宿主细胞中，这些方法包括磷酸钙转染、DEAE-葡聚糖介导转染、聚凝胺、原生质体融合、脂质体、直接显微注射到细胞核中、划痕标记(scrape loading)、生物射弹转化以及电穿孔。从重组生物中大规模生产蛋白质是在商业规模上实践的得到确认的方法并且也在本领域的技术人员的能力范围之内。

多核苷酸序列可以包括至少1种突变，其包括一个或多个核苷酸添加、缺失或取代.该至少1种突变可以在编码区，可以在编码区编码的蛋白质中导致一个或多个氨基酸添加、缺失或替代，可以是在调控区，可以是在5’UTR中，可以在3’UTR，和/或可位于启动子中。

应当认识到的是，本公开不限于含有本文所公开的一种或多种蛋白质的转基因细胞、生物，以及质体，而是还可以包括利用编码涉及脂肪酸合成的酶的额外的核苷酸序列转化的这类细胞、生物，以及质体。因此，一些实施例涉及引入编码除了本文所公开的蛋白质之外的涉及脂肪酸合成的蛋白质的一种或多种序列。例如，可以直接地或者间接地连接脂肪酸产生途径中的数种酶，使得通过该途径中的一种酶产生的产物一旦产生，就紧密接近该途径中的下一个酶。这些额外的序列可包含在单个载体中，该单个载体可操作地连接到单个启动子或连接到多个启动子上，例如，每个序列一个启动子。可替代地，额外的编码序列可包含在多个额外的载体中。当使用多个载体时，可以同时地或依次地将它们引入宿主细胞或生物中。

额外的实施例提供了一种质体，并且具体地是一种叶绿体，利用编码本公开的蛋白质的多核苷酸来转化。可以使用本文所述的任何一种方法或本领域已知的其他方法将该蛋白质引入质体的基因组中。可以将质体包含在其自然发生在其中的生物中。可替代地，质体可以是一种分离的质体，即已经从其通常发生于其中的细胞中取出的质体。用于分离质体的方法是本领域已知的，并且可以，例如，在Maliga等人，《植物分子生物学方法》(Methods in PlantMolecular Biology)，冷泉港实验室出版社(Cold Spring Harbor LaboratoryPress)，1995；Gupta和Singh，《生物科学期刊》(J.Biosci.)，21：819(1996)；以及Camara等人，《植物生理学》(Plant Physiol.)，73：94(1983)中找到。可以将利用本公开的蛋白质转化的分离的质体引入宿主细胞中。宿主细胞可以是天然含有质体的细胞或质体并未自然发现于其中的细胞。

含有编码本公开的蛋白质中的任何一种或多种的核苷酸序列的人工质体基因组，例如，叶绿体基因组也在本公开的范围之内。用于组装人工质体基因组的方法可以在于2008年10月6日提交的共同未决的美国专利申请序列号12/287,230，作为于2009年5月14日提交的美国公开号2009/0123977公开，以及于2009年4月8日提交的美国专利申请序列号12/384,893，作为于2009年10月29日提交的美国公开号2009/0269816公开中找到，其全部内容各自通过引用并入本文。

本公开的一个或多个核苷酸也可以改造，使得所产生的氨基酸与未改造的或参考氨基酸是“基本上相同的”。

“基本上相同的”氨基酸序列是与参考序列相差一个或多个保守或非保守氨基酸替换、删除或插入物的序列，特别是当这种替换发生在不是分子的活性位点(催化区(CD))的位点时且假设多核苷酸基本上保留其功能属性。保守氨基酸替换物，例如，用一种氨基酸替换同类的另一种氨基酸(例如，用一种疏水性氨基酸，诸如，异亮氨酸、缬氨酸、亮氨酸，或蛋氨酸替换另一种，或用一种极性氨基酸替换另一种，诸如，用精氨酸替换赖氨酸，用谷氨酸替换天冬氨酸，或用谷氨酰胺替换天冬酰胺)。

本公开提供包含至少一种本文所讨论的保守氨基酸替换物(例如，保守氨基酸替换物是用相同特性的另一氨基酸替换多核苷酸中的给定氨基酸的那些)的本发明的多核苷酸(以及将其编码的核酸)的替代实施例。本发明提供多核苷酸(以及将其编码的核酸)，其中任一、一些或所有氨基酸残基由相同特性的另一氨基酸替换，例如，保守氨基酸替换物。

保守替换物是由相同特性的另一种氨基酸替换多核苷酸中的给定氨基酸的那些保守替换物。保守替换物的例子是以下代替物：用另一种脂肪族氨基酸来代替诸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸之类的脂肪族氨基酸；用苏氨酸来代替丝氨酸，反之亦然；用另一种酸性残渣来代替诸如天冬氨酸和谷氨酸之类的酸性残渣；用另一种具有酰胺基的残基来代替具有诸如天冬酰胺和谷氨酰胺之类的酰胺基的残基；用另一种基本残基来交换诸如赖氨酸和精氨酸之类的基本残基；以及用另一种芳香族残基来代替诸如苯丙氨酸、酪氨酸之类的芳香族残基。在替代方面中，这些保守替换物也可以是这些氨基酸的合成等价物。

多核苷酸引入宿主生物或细胞

为了产生经基因改造的宿主细胞，使用已建立的技术将多核苷酸，或克隆到载体中的多核苷酸稳定地或瞬时地引入宿主细胞中，这些技术包括，但并不限于，电穿孔、磷酸钙沉淀、DEAE-葡聚糖介导转染，以及脂质体介导转染。为了转化，本公开的多核苷酸通常将进一步包括可选择标记，例如，几种熟知的可选择标记中的任何一种，诸如，新霉素抗性、氨苄青霉素抗性、四环素抗性、氯霉素抗性，以及卡那霉素抗性。

可以使用本领域已知的任何方法将本文所述的多核苷酸或重组核酸分子引入细胞(例如，藻类细胞)中。多核苷酸可以通过本领域熟知的各种方法引入细胞中并且部分地基于特定的宿主细胞而被选择。例如，使用直接基因转移法，诸如，电穿孔或使用粒子枪的微粒介导的(生物射弹)转化，或“玻璃珠法”或通过花粉介导转化、脂质体介导转化、使用创伤的或酶降解的未成熟胚或创伤的或酶降解的胚性愈伤组织进行的转化，可以将多核苷酸引入至细胞中(例如，如Potrykus,Ann.Rev.Plant.Physiol.Plant Mol.Biol.42:205-225,1991中所记载的)。

如上文所讨论的，可以使用微弹介导转化将多核苷酸引入细胞中(例如，如Klein等人，《自然》(Nature)327：70-73，1987中所述)。

该方法利用微粒，诸如，金或钨，通过氯化钙、精脒或聚乙二醇沉淀用所希望的多核苷酸将其包被。使用装置，诸如，生物射弹PD-1000粒子枪(BioRad；Hercules Calif.)，使微粒粒子以高速加速进入细胞中。使用生物射弹法进行转化的方法是本领域熟知的(例如，如Christou，《植物科学趋势》(Trendsin Plant Science)1：423-431，1996中所述)。例如，已经使用了微粒介导转化来产生各种转基因植物物种，包括棉花、烟草、玉米、杂交白杨以及木瓜。也使用微粒介导递送方法对重要的谷类作物，诸如，小麦、燕麦、大麦、高粱以及水稻进行了转化(例如，如Duan等人，《自然生物技术》(NatureBiotech.)14：494-498，1996；以及Shimamoto，《生物技术新观点》(Curr.Opin.Biotech.)5：158-162，1994中所述)。用上述方法转化大多数双子叶植物是可能的。单子叶植物的转化也可以使用，例如，上述生物射弹法、原生质体转化、部分透化细胞的电穿孔、使用玻璃纤维的DNA引入，以及玻璃珠搅拌法进行转化。

用于光合微生物中的转化和表达的基本技术类似于通常用于大肠杆菌(E.coli)、酿酒酵母(Saccharomyces cerevisiae)以及其他物种的那些基本技术。专门用于光合微生物，例如，藻类菌株的叶绿体的转化方法是本领域已知的。这些方法记载在标准分子生物学操作的多个文本中(参见Packer&Glaser，1988，“Cyanobacteria”，《酶学方法》(Meth.Enzymol.)，Vol.167；Weissbach&Weissbach，1988，“植物分子生物学方法Methods for plantmolecular biology”，科学院出版社(Academic Press)，纽约(New York)，Sambrook，Fritsch&Maniatis，1989，“分子克隆实验手册”("Molecular Cloning:A laboratory manual")第二版(2nd edition)冷泉港实验室出版社(Cold SpringHarbor Laboratory Press)，冷泉港(Cold Spring Harbor)，纽约(N.Y.)；以及ClarkM S，1997，《植物分子生物学》(Plant Molecular Biology)，Springer，纽约(N.Y.))。这些方法包括，例如，生物射弹装置(参见，例如，Sanford，《生物技术趋势》(Trends In Biotech.)(1988)6：299-302，美国专利号4,945,050；电穿孔(Fromm等人，《美国国家科学院院刊》(Proc.Nat′l.Acad.Sci.(USA))(1985)82：5824-5828)；激光束、电穿孔、显微注射或能够将DNA引入宿主细胞中的任何其他方法的使用。

质体转化是用于将多核苷酸引入植物细胞叶绿体中的常规且熟知的方法(参见美国专利号5,451,513、5,545,817，以及5,545,818；WO95/16783；McBride等人，Proc.Natl.Acad.Sci.，USA 91：7301-7305，1994)。在一些实施例中，叶绿体转化涉及引入在所希望的核苷酸序列的侧翼的叶绿体DNA的区域，从而允许将外源DNA同源重组到目标叶绿体基因组中。在一些情况下，可以使用1至1.5kb的叶绿体基因组DNA的侧翼核苷酸序列。使用这种方法，可以利用耐受大观霉素和链霉素的叶绿体16S rRNA和rps12基因中的点突变作为转化的可选择标记(Svab等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.,USA)87：8526-8530，1990)，并且可能会以目标叶的大致100分之一轰击的频率产生稳定的同质转化体。

促进对植物质体基因组中引入的DNA编码序列表达的时间和组织模式进行控制的叶绿体转化/表达技术中的进一步精化已经在PCT国际公开WO95/16783以及美国专利5,576,198中进行了说明。这种方法涉及将构建体引入植物细胞中用于细胞核转化，它们提供病毒单亚基RNA聚合酶的表达并且通过融合到质体转运肽上将这种聚合酶靶向到质体中。用包含对从可操作地连接到所关注的DNA编码序列上的细胞核表达构建体中表达的RNA聚合酶具有特异性的病毒单亚基RNA聚合酶特异性启动子的DNA构建体来转化质体允许在包含细胞核聚合酶构建体和质体表达构建体两者的植物中以组织和/或发育特异性方式控制质体表达构建体。

可以将细胞核RNA聚合酶编码序列的表达置于组成型启动子，或组织或发育阶段特异性启动子的控制下，由此将这种控制延伸到响应于质体靶向的、细胞核编码的病毒RNA聚合酶的质体表达构建体。

当利用核转化时，通过使用植物细胞核转化构建体可以对蛋白质进行改造用于质体靶向，其中所关注的DNA编码序列融合到任何一个可供使用的转运肽序列上，该转运肽序列能够促进将编码的酶运送到植物载体中并且通过使用适当的启动子来驱动表达。可以通过将DNA编码质体，例如，叶绿体、白色体、造粉体等转运肽序列融合到编码所述酶的DNA的5′端上来实现蛋白质的靶向。可以，例如，从植物核编码的质体蛋白质获得编码转运肽区域的序列，诸如，二磷酸核酮糖羧化酶小亚基(SSU)、EPSP合成酶、植物脂肪酸生物合成相关基因，包括脂肪酰基-ACP硫酯酶、酰基载体蛋白质(ACP)、硬脂酰-ACP脱饱和酶、-酮脂酰-ACP合成酶以及酰基-ACP硫酯酶，或LHCPII基因等。还可以从编码类胡萝卜素生物合成酶，诸如，GGPP合成酶、八氢番茄红素合成酶，以及八氢番茄红素脱饱和酶的核酸序列获得质体转运肽序列。其他转运肽序列披露于Von Heijne等人(1991)《植物分子生物学报告》(Plant Mol.Biol.Rep.)9：104；Clark等人(1989)《生物化学期刊》(J.Biol.Chem.)264：17544；della-Cioppa等人(1987)《植物生理学》(Plant Physiol.)84：965；Romer等人(1993)《生物化学与生物物理学研究通讯》(Biochem.Biophys.Res.Commun.)196：1414；以及Shah等人(1986)《科学》(Science)233：478中。另一种转运肽序列是来自衣藻(Chlamydomonas)的完整ACCase的序列(genbank EDO96563，氨基酸1-33)。在运送到质体中有效的转运肽的编码序列可包括特定转运肽的编码序列的全部或一部分，并且还可以含有与特定转运肽相关联的成熟蛋白质编码序列的多个部分。存在可以用来将目标蛋白质递送到质体中的转运肽的许多实例，并且可用于本公开的特定转运肽编码序列不是关键性的，只要获得至质体中的递送即可。然后，在质体内的蛋白酶解加工产生成熟的酶。例如，用涉及聚羟基烷酸酯生物合成的酶(Nawrath等人(1994)《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)91：12760)，以及新霉素磷酸转移酶II(NPT-II)和CP4 EPSPS(Padgette等人(1995)《作物科学》(Crop Sci.)35：1451)已经证明这种技术是成功的。

所关注的是从已知的有待输入到种子白色体中的酶中得到的转运肽序列。含有有用的转运肽的酶的例子包括与以下各项有关的那些：脂质生物合成(例如，质体靶向的双子叶乙酰辅酶A羧化酶、生物素羧化酶、生物素羧基载体蛋白质、á-羧基-转移酶，以及质体靶向的单子叶多功能乙酰辅酶A羧化酶(Mw，220,000)的亚基；脂肪酸合成酶复合体的质体亚基(例如，酰基载体蛋白质(ACP)、丙二酰-ACP合成酶、KASI、KASII，以及KASIII)；硬脂酰-ACP脱饱和酶；硫酯酶(对于短、中，以及长链酰基ACP特异的)；靶向质体的酰基转移酶(例如，甘油-3-磷酸盐和酰基转移酶)；涉及天冬氨酸家族氨基酸的生物合成的酶类；八氢番茄红素合成酶；赤霉酸生物合成(例如，对映贝壳杉烯合成酶1和2)；以及类胡萝卜素生物合成(例如，番茄红素合成酶)。

在一些实施例中，藻类使用感兴趣的蛋白质(例如，SN蛋白质)编码的核酸进行转化。

在一个实施例中，转化可将核酸引入到宿主藻类的质体(例如，叶绿体)中。在另一个实施例中，转化可将核酸引入到宿主藻类的核基因组中。在又一个实施例中，转化可将核酸引入核基因组以及质体两者中。

在引入外源核酸之后，可将转化的细胞铺板于选择性培养基上。这种方法还可以包括用于筛选的若干步骤。可对初级转化体进行筛选，以确定哪些克隆具有外源核酸的正确插入。可以将显示正确整合的克隆繁殖并且再筛选，以确保遗传稳定性。这类方法确保转化体包含所关注的基因。在许多情况下，通过聚合酶链式反应(PCR)进行这样的筛选；然而，可以利用本领域已知的任何其他适当的技术。许多不同的PCR方法是本领域已知的(例如，巢式PCR、实时PCR)。对于任何给定的筛选，本领域的技术人员将认识到的是，可以改变PCR组分来实现最佳的筛选结果。例如，当在破碎的藻类细胞上进行PCR时可能需要向上调镁浓度，向这些细胞(它们螯合镁)中加入镁以螯合有毒金属。在用适当的外源核酸整合筛选克隆之后，可以筛选克隆中是否存在编码蛋白质和/或产物。可以通过Western印迹分析和/或酶活性测定进行蛋白质表达筛选。可以通过本领域已知的任何方法进行转运体和/或产物筛选，所述方法是，例如，ATP周转测定(turnover assay)、底物转运测定、HPLC或气相色谱法。

可以通过将编码蛋白质或酶的多核苷酸序列(基因)插入到微藻的叶绿体或核基因组中来实现蛋白质或酶的表达。可以使改造的微藻菌株同质化，以确保多核苷酸将稳定地维持在所有派生物的叶绿体基因组中。例如，当插入的基因存在于叶绿体基因组的所有拷贝中时，对于一种基因而言，微藻是同质的。对本领域普通技术人员显而易见的是叶绿体可含有其基因组的多个拷贝，且因此，术语“同质的”或“同质性”是指所关注的特定基因座的所有拷贝是基本上相同的状态。其中基因通过同源重组插入至存在于每个植物细胞中的环形质体基因组的所有数千个拷贝的质体表达利用相比于核表达的基因的巨大拷贝数优势，以允许表达水平能够容易地超过总的可溶性植物蛋白质的10％或更高。确定本公开生物的原生质状态的方法涉及针对在给定的所关注基因座处的外源核酸的存在和野生型核酸的缺乏来筛选转化体。

载体

在本公开中，构建体、载体和质粒可互换使用。可以将编码本文所述蛋白质的核酸包括在载体中，包括克隆载体和表达载体。克隆载体是用于将DNA片段转移到宿主细胞中的自主复制的DNA分子。三种常用类型的克隆载体是细菌质粒、噬菌体，以及其他病毒。表达载体是一种克隆载体，其被设计成使得在特定位点处插入的编码序列将被转录并转译成蛋白质。克隆和表达载体两者可含有允许载体在一种或多种适合的宿主细胞中复制的核苷酸序列。在克隆载体中，该序列通常是使该载体能够独立于宿主细胞染色体而复制的一种序列，并且还包括复制起点或自主复制序列。

在一些实施例中，使用本领域的技术人员已知的克隆技术将本公开的多核苷酸克隆或插入到表达载体中。可以通过各种方法将核苷酸序列插入到载体中。在最常用的方法中，使用本领域的技术人员通常已知的并且在，例如，Sambrook等人，《分子克隆实验手册》(Molecular Cloning，A LaboratoryManual)，第二版(2nd Ed.)，冷泉港出版社(Cold Spring Harbor Press)，(1989)以及Ausubel等人，《精编分子生物学实验指南》(Short Protocols in MolecularBiology)，第二版(2nd Ed.)，John Wiley & Sons(1992)中详述的流程将序列插入到适当的限制性内切核酸酶位点中。

适合的表达载体包括，但并不限于：杆状病毒载体、噬菌体载体、质粒、噬菌粒、粘粒、福斯质粒(fosmid)、细菌人工染色体、病毒载体(例如，基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40，以及单纯疱疹病毒的病毒载体)、基于PI的人工染色体、酵母质粒、酵母人工染色体，以及对于所关注的特定宿主具有特异性的任何其他载体(诸如，大肠杆菌(E.coli)和酵母)。因此，例如，可将编码SN蛋白质的多核苷酸插入到各种能够表达该蛋白质的表达载体的任一表达载体中。这类载体可包括，例如，染色体DNA序列、非染色体DNA序列以及合成DNA序列。

适合的表达载体包括染色体DNA序列、非染色体DNA序列，以及合成DNA序列，例如，SV 40衍生物类；细菌质粒类；噬菌体DNA；杆状病毒；酵母质粒类；从质粒和噬菌体DNA的组合衍生出的载体；以及病毒DNA，诸如，牛痘苗病毒、腺病毒、鸡痘病毒，以及伪狂犬病毒。此外，可以使用在宿主中可复制并且能存活的任何其他载体。例如，可以使用载体，诸如，Ble2A、Arg7/2A，以及SEnuc357用于表达蛋白质。

很多适合的表达载体是本领域的技术人员已知的。举例而言，提供以下载体；对于细菌宿主细胞为：pQE载体(Qiagen)、pBluescript质粒、pNH载体、lambda-ZAP载体(Stratagene)、pTrc99a、pKK223-3、pDR540，以及pRIT2T(Pharmacia)；对于真核宿主细胞为：pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pET21a-d(+)载体(Novagen)，以及pSVLSV40(Pharmacia)。然而，可以使用任何其他质粒或其他载体，只要其可与宿主细胞相容即可。

表达载体，或其线性部分，可以编码一个或多个外源或内源核苷酸序列。可以转化到宿主中的外源核苷酸序列的例子包括来自细菌、真菌、植物、光合细菌或其他藻类的基因。可以转化到宿主中的其他类型的核苷酸序列的例子包括，但并不限于：SN基因、转运体基因、产生类异戊二烯的基因、编码用两种磷酸盐产生类异戊二烯的蛋白质(例如，GPP合成酶和/或FPP合成酶)的基因、编码产生脂肪酸、脂质，或甘油三酯的蛋白质，例如，ACC酶的基因、内源启动子，以及来自psbA、atpA，或rbcL基因的5’UTR。在一些情况下，外源序列的侧翼为两个同源序列。

同源序列是，例如，与参考氨基酸序列或核苷酸序列，例如，在天然获得或得到蛋白质的宿主细胞中发现的氨基酸序列或核苷酸序列具有至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％或至少99％序列同一性的那些。

核苷酸序列还可与经密码子优化的基因序列是同源的。例如，核苷酸序列可与经密码子优化的基因序列有，例如，至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％，或至少99％的核苷酸序列同一性。

第一和第二同源序列能够将外源或内源序列重组到宿主生物的基因组中。第一和第二同源序列可以具有至少100、至少200、至少300、至少400、至少500，或至少1500个核苷酸的长度。

在一些实施例中，可以使用约0.5到约1.5kb的叶绿体基因组DNA的侧翼核苷酸序列。在其他实施例中，可以使用约0.5到约1.5kb的核基因组DNA的侧翼核苷酸序列，或可以使用约2.0到约5.0kb。

在一些实施例中，载体可包含对于正在被转化的生物中的表达是密码子偏倚的核苷酸序列。在另一实施例中，所关注的基因，例如，SN基因，可包含对于正在被转化的生物中的表达是密码子偏倚的核苷酸序列。此外，标记(tag)的核苷酸序列可以是密码子偏倚的或密码子优化的，用于在正在被转化的生物中表达。

多核苷酸序列可包含对于正在被转化的生物中的表达是密码子偏倚的核苷酸序列。

熟练的技术人员应当熟知，在使用核苷酸密码子来限定给定的氨基酸中通过特定宿主细胞展示的“密码子偏倚”。不受理论束缚，通过使用宿主细胞的偏爱密码子，转译速率可以更快。因此，当合成在宿主细胞中的表达提高的基因时，可能令人希望的是设计这种基因，使其密码子使用频率接近宿主细胞的偏爱密码子使用的频率。在一些生物中，密码子偏倚在核基因组和细胞器基因组之间是不同的，因此，可以进行针对靶基因组的密码子优化或偏倚(例如，核密码子偏倚或叶绿体密码子偏倚)。在一些实施例中，密码子偏倚发生在诱变之前，以产生多肽。在其他实施例中，密码子偏倚发生在诱变之后，以产生多核苷酸。在其他实施例中，密码子偏倚发生在诱变之前以及在诱变之后。本文对密码子偏倚进行详细说明。

在一些实施例中，载体包含可操作地连接到一个或多个控制元件，诸如，启动子和/或转录终止子的多核苷酸。当将核酸序列置于与另一种核酸序列的功能性关系中时，该核酸序列是可操作地连接的。例如，如果前序列或分泌性前导的DNA作为参与多肽的分泌的前蛋白而被表达，则前序列或分泌性前导序列的DNA可操作地连接到多肽的DNA；如果启动子影响该序列的转录，则该启动子可操作地连接到编码序列；或如果核糖体结合位点被定位成促进转译，则其可操作地连接到编码序列。一般而言，可操作地连接的序列是连续的，并且就分泌性前导而言是连续的并且在阅读相中。通过在限制性酶切位点处连接(ligation)来实现连接。如果适合的限制酶切位点不能得到，则如本领域的技术人员已知的，可以使用合成的寡核苷酸适应物或连接物。Sambrook等人，《分子克隆实验手册》(Molecular Cloning,A LaboratoryManual)，第二版(2^nd Ed.)，冷泉港出版社(Cold Spring Harbor Press)，(1989)，以及Ausubel等人，《精编分子生物学实验指南》(Short Protocols in MolecularBiology)，第二版(2^nd Ed.)，John Wiley & Sons(1992)。

在一些实施例中，载体提供了拷贝数的多核苷酸的扩增。载体可以是，例如，表达载体，提供在宿主细胞中提供SN蛋白质的表达，例如，原核宿主细胞或真核宿主细胞。

可以将一种多核苷酸或多种多核苷酸包含在一个载体或多个载体中。例如，当希望第二(或更多)核酸分子时，可以将第二核酸分子包含在载体中，该载体可以是，但不一定是与含有第一核酸分子的载体相同的载体。该载体可以是可用于将多核苷酸引入基因组的任何载体，并且可包括基因组DNA(例如，核或质体)的核苷酸序列，该序列足以经历与基因组DNA的同源重组，例如，包含基因组DNA的大约400至大约1500个或更多个基本上连续的核苷酸的核苷酸序列。

调节或控制元件，如本文所用术语，宽泛地是指调节多核苷酸的转录或转译或可操作地连接到其上的多肽的定位的核苷酸序列。例子包括，但并不限于：RBS、启动子、增强子、转录终止子、起始(start)密码子、用于内含子切除和正确读码框维持的剪接信号、STOP密码子、琥珀密码子或赭石密码子，以及IRES。调节元件可包括启动子和转录和转译终止信号。为了引入特异性限制酶切位点的目的，元件可以配备有连接物，以便于控制序列与编码多肽的核苷酸序列的编码区连接。此外，可以将包含细胞区室化信号的序列(即，将多肽靶向到胞质溶胶、细胞核、叶绿体膜或细胞膜的序列)附连到编码所关注的蛋白质的多核苷酸上。此类信号是本领域熟知的并且已广泛报道(参见，例如，美国专利号5,776,689)。

在载体中，所关注的核苷酸序列可操作地连接到由宿主细胞识别的启动子，以指导mRNA合成。启动子是位于距离结构基因的起始密码子上游通常100至1000个碱基对(bp)的非转译序列，它们调节在其控制下的核酸序列的转录和转译。

可用于本公开的启动子可来自任何来源(例如，病毒、细菌、真菌、原生生物，以及动物)。本文所设想的启动子可对光合生物、非维管光合生物，和维管光合生物(例如，藻类、开花植物)具有特异性。在一些情况下，上述核酸被插入到包含光合生物，例如，藻类的启动子的载体中。启动子可以是组成型启动子或诱导型启动子。启动子典型地包括转录起始位点附近的必需的核酸序列(例如，TATA元件)。

用于表达载体的常用启动子包括，但并不限于：LTR或SV40启动子、大肠杆菌lac或trp启动子，以及噬菌体lambda PL启动子。启动子的非限制性例子是内源性启动子，诸如，psbA和atpA启动子。可以使用已知用来控制原核或真核细胞中的基因表达的其他启动子并且是本领域的技术人员已知的。表达载体还可以含有用于转译起始的核糖体结合位点，以及转录终止子。载体还可以含有可用于扩增基因表达的序列。

“组成型”启动子是，例如，在大多数环境和发育条件下有活性的启动子。组成型启动子可，例如，维持相对稳定的转录水平。

“诱导型”启动子是在可控环境或发育条件下有活性的启动子。例如，诱导型启动子是响应于环境中的一些变化，例如，营养物存在与否或温度变化，启动在其控制下从DNA的增加的转录水平的启动子。

诱导型启动子/调节元件的例子包括，例如，硝酸盐诱导型启动子(例如，如Bock等人，《植物分子生物学》，(Plant Mol.Biol.)17：9(1991)中说明的)，或光诱导型启动子，(例如，如Feinbaum等人，《分子遗传学和基因组学》(MolGen.Genet.)226：449(1991)；以及Lam和Chua，《科学》(Science)248：471(1990)中说明的)，或热敏启动子(例如，如Muller等人，《基因》(Gene)111：165-73(1992)中说明的)。

在许多实施例中，本公开的多核苷酸包括编码本公开的蛋白质或酶的核苷酸序列，其中编码多肽的核苷酸序列被可操作地连接到诱导型启动子。诱导型启动子是本领域熟知的。适合的诱导型启动子包括，但并不限于：噬菌体λ的pL；Placo；Ptrp；Ptac(Ptrp-lac杂合启动子)；异丙基-β-D-硫代半乳糖吡喃糖苷(IPTG)-诱导型启动子，例如，lacZ启动子；四环素诱导型启动子；阿拉伯糖诱导型启动子，例如，P_BAD(例如，如Guzman等人(1995)《细菌学期刊》(J.Bacteriol.)177：4121-4130中说明的)；木糖诱导型启动子，例如，Pxyl(例如，如Kim等人(1996)《基因》(Gene)181：71-76中说明的)；GAL1启动子；色氨酸启动子；lac启动子；醇诱导型启动子，例如，甲醇诱导型启动子、乙醇诱导型启动子；棉子糖诱导型启动子；以及热诱导型启动子，例如，热诱导型λP_L启动子以及由热敏感型阻抑物控制的启动子(例如，C1857-抑制的基于λ的表达载体；例如，如Hoffmann等人(1999)FEMS MicrobiolLett.177(2)：327-34中说明的)。

在许多实施例中，本公开的多核苷酸包括编码本公开的蛋白质或酶的核苷酸序列，其中编码多肽的核苷酸序列被可操作地连接到组成型启动子。适用于原核细胞的组成型启动子是本领域已知的，并且包括，但并不限于，σ70启动子，以及共有σ70启动子。

适用于原核宿主细胞的启动子包括，但并不限于：噬菌体T7RNA聚合酶启动子；trp启动子；lac操纵子启动子；杂合启动子，例如，lac/tac杂合启动子、tac/trc杂合启动子、trp/lac启动子、T7/lac启动子；trc启动子；tac启动子；araBAD启动子；体内调节的启动子，诸如，ssaG启动子或相关启动子(例如，如美国专利公开号20040131637中说明的)、pagC启动子(例如，如Pulkkinen和Miller，《细菌学期刊》(J.Bacteriol.)，1991：173(1)：86-93；以及Alpuche-Aranda等人，PNAS，1992；89(21)：10079-83中说明的)、nirB启动子(例如，如Harborne等人(1992)《分子微生物学》(Mol.Micro.)6：2805-2813；Dunstan等人(1999)《传染与免疫》(Infect.Immun.)67：5133-5141；McKelvie等人(2004)《疫苗》(Vaccine)22：3243-3255；以及Chatfield等人(1992)《生物技术》(Biotechnol.)10：888-892中说明的)；σ70启动子，例如，共有σ70启动子(例如，GenBank登记号AX798980、AX798961，以及AX798183)；静止期启动子，例如，dps启动子、spv启动子；从致病岛SPI-2得到的启动子(例如，如WO96/17951中说明的)；actA启动子(例如，如Shetron-Rama等人(2002)《传染与免疫》(Infect.Immun.)70：1087-1096中说明的)；rpsM启动子(例如，如Valdivia和Falkow(1996).《分子微生物学》(Mol.Microbiol.)22：367-378中说明的)；tet启动子(例如，如Hillen、W.和Wissmann，A.(1989)InSaenger，W.and Heinemann，U.(eds)，Topics in Molecular and Structural Biology，Protein-Nucleic Acid Interaction.Macmillan，伦敦，英国，第10卷，第143-162页中说明的)；以及SP6启动子(例如，如Melton等人(1984)《核酸研究》(Nucl.Acids Res.)12：7035-7056中说明的)。

在酵母中，可以使用许多含有组成型或诱导型启动子的载体。关于这类载体的综述参见《现代分子生物学指南》(Current Protocols in MolecularBiology)，第2卷，1988，Ed.Ausubel等人，Greene Publish.Assoc.& WileyInterscience，Ch.13；Grant等人，1987，《酵母的表达和分泌载体》(Expressionand Secretion Vectors for Yeast)，《酶学方法》(in Methods in Enzymology)，Eds.Wu & Grossman，31987，Acad.出版社，纽约，第153卷，第516-544页；Glover，1986，《DNA克隆》(DNA Cloning)，第II卷，IRL出版社，Wash.，D.C.，Ch.3；Bitter，1987，《酵母中异源基因表达》(Heterologous Gene Expression in Yeast)，《酶学方法》(Methods in Enzymology)，Eds.Berger & Kimmel，Acad出版社，纽约，第152卷，第673-684页；以及酵母的分子生物学(The Molecular Biologyof the Yeast Saccharomyces)，1982，Eds.Strathern等人，冷泉港出版社(ColdSpring Harbor Press)，Vols.I和II。可以使用组成型酵母启动子，诸如，ADH或LEU2或诱导型启动子，诸如，GAL(例如，如《酵母中克隆》(Cloning inYeast)，第3章(Ch.3)，R.Rothstein在《DNA克隆》(DNACloning)中第11卷，《一种实用方法》(A Practical Approach)，Ed.DM Glover，1986，IRL出版社，Wash.，D.C.中所述)。可替代地，可以使用促进外源DNA序列整合到酵母染色体中的载体。

适合的真核启动子的非限制性例子包括CMV即刻早期、HSV胸苷激酶、早期和晚期SV40、逆转录病毒的LTRs，以及小鼠金属硫蛋白-I。适当的载体和启动子的选择也在本领域普通技术人员的水平范围内。表达载体还可以含有用于转译起始的核糖体结合位点，以及转录终止子。表达载体还可以包括用于扩增表达的适当序列。

用于实践本公开的载体也可含有对载体赋予令人希望的特性的一个或多个另外的核苷酸序列，包括，例如，多种序列，诸如，促进载体操作的克隆位点、指导载体的复制或包含在其中的核苷酸序列的转录的调节元件，以及编码可选择标记的序列。像这样，载体可含有，例如，一个或多个克隆位点，诸如，多克隆位点，可以但不一定被定位成使外源或内源多核苷酸可以插入到载体中并可操作地连接到所希望的元件上。

载体也可含有原核生物复制起点(ori)，例如，大肠杆菌复制起点或粘粒复制起点，从而使载体在原核生物宿主细胞以及植物叶绿体中传代。各种不同的细菌和病毒复制起点是本领域的技术人员熟知的并且包括，但不并限于，pBR322质粒起点、2u质粒起点，以及SV40、多瘤、腺病毒、VSV，以及BPV病毒起点。

调节或控制元件，如本文所用术语，宽泛地是指调节多核苷酸的转录或转译或可操作地连接到其上的多肽的定位的核苷酸序列。例子包括，但并不限于，RBS、启动子、增强子、转录终止子、起始(start)密码子、用于内含子切除和正确读码框维持的剪接信号、终止(STOP)密码子、琥珀密码子或赭石密码子、IRES。另外地，元件可以是细胞区室化信号(即，将多肽靶向到胞质溶胶、细胞核、叶绿体膜或细胞膜上的序列)。在本公开的一些方面，可以将细胞区室化信号(例如，细胞膜靶向序列)连接到基因和/或转录本上，使得该基因的转译发生在叶绿体中。在其他方面中，可以将细胞区室化信号连接到基因上，使得在该基因转译之后，蛋白质被运送到细胞膜上。细胞区室化信号是本领域熟知的并已广泛报道(参见，例如，美国专利号5,776,689)。

载体或其线性部分可包括编码报告基因多肽或其他可选择标记的核苷酸序列。术语“报告基因”或“可选择标记”是指赋予可检测表型的多核苷酸(或编码的多肽)。

报告基因通常编码可检测多肽，例如，绿色荧光蛋白或酶，诸如，荧光素酶，当与适当的试剂接触时(对应地是特定波长的光或荧光素)，该酶产生信号，该信号可以通过肉眼或使用适当仪器检测(例如，如Giacomin，《植物科学》(Plant Sci.)116：59-72，1996；Scikantha，《细菌学期刊》(J.Bacteriol.)178：121，1996；Gerdes，FEBS Lett.389：44-47，1996；以及Jefferson，EMBO J.6：3901-3907，1997，伊葡萄糖醛酸酶(fl-glucuronidase)中说明的)。

可选择标记(或可选择基因)通常是分子，当其在细胞中存在或表达时，向含有该标记的细胞提供选择优势(或劣势)，例如，能在试剂存在的情况下生长，否则该试剂将杀死细胞。选择基因可编码利用载体转化的宿主细胞的存活或生长所必需的蛋白质。

可选择标记可提供一种手段以获得，例如，表达该标记的原核细胞、真核细胞，和/或植物细胞，并且因此，可用作本公开载体的一个部件。选择基因或标记可编码利用载体转化的宿主细胞存活或生长所必需的蛋白质。一类可选择标记是天然的或改造的基因，其使宿主细胞恢复生物或生理功能(例如，恢复光合能力或恢复代谢途径)。可选择标记的其他例子包括，但并不限于，赋予抗代谢药抗性的那些，例如，赋予对甲氨喋呤的抗性的二氢叶酸还原酶(例如，如Reiss，《植物生理学》(Plant Physiol.)(《生命科学进展》(LifeSci.Adv.))13：143-149，1994中说明的)；赋予对氨基糖甙类新霉素、卡那霉素以及巴龙霉素的抗性的新霉素磷酸转移酶(例如，如Herrera-Estrella，EMBO J.2:987-995,1983中说明的)、赋予对潮霉素抗性的hygro(例如，如Marsh，《基因》(Gene)32：481-485，1984中说明的)、允许细胞利用吲哚代替色氨酸的trpB；允许细胞利用组氨醇代替组氨酸的hisD(例如，如Hartman，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.，USA)85：8047，1988中说明的)；允许细胞利用甘露糖的甘露糖-6-磷酸异构酶(例如，如PCT公开申请号WO 94/20627中说明的)；赋予对鸟氨酸脱羧酶抑制剂2-(二氟甲基)-DL-鸟氨酸的抗性的鸟氨酸脱羧酶(DFMO；例如，如McConlogue，1987，在《分子生物学最新通讯》中(Current Communications in Molecular Biology)，冷泉港实验室编辑(Cold Spring Harbor Laboratory ed.)中说明的)；以及赋予对杀稻瘟菌素S的抗性的来自土曲霉(Aspergillusterreus)的脱氨酶(例如，如Tamura，《生物科学、生物技术以及生物化学》(Biosci.Biotechnol.Biochem.)59：2336-2338，1995中说明的)。另外的可选择标记包括赋予除草剂抗性的那些，例如，赋予对草胺膦抗性的草胺膦乙酰转移酶基因(例如，如White等人，《核酸研究》(Nucl.Acids Res.)18：1062，1990；以及Spencer等人，《理论和应用遗传学》(Theor.Appl.Genet.)79：625-631，1990中说明的)、赋予草甘磷抗性的突变EPSPV合成酶(例如，如Hinchee等人，《生物技术》(BioTechnology)91：915-922，1998中说明的)、赋予对咪唑啉酮或磺酰脲抗性的突变乙酰乳酸合成酶(例如，如Lee等人，EMBO J.7：1241-1248，1988中说明的)、赋予对阿特拉津抗性的突变psbA(例如，如Smeda等人，《植物生理学》(PlantPhysiol.)103：911-917，1993中说明的)，或突变原卟啉原氧化酶(例如，如美国专利号5,767,373中说明的)，或赋予对除草剂，诸如，草丁膦抗性的其他标记。可选择标记包括多核苷酸，其赋予对真核细胞的二氢叶酸还原酶(DHFR)或新霉素的抗性；对原核生物，诸如，大肠杆菌的四环素或氨苄青霉素抗性；以及在植物中的对博来霉素、庆大霉素、草甘膦、潮霉素、卡那霉素、甲氨蝶呤、福来霉素、草铵磷、大观霉素、链霉素、磺酰胺和磺酰脲的抗性(例如，如Maliga等人，Methodin Plant Molecular Biology，Cold Spring Harbor Laboratory Press，1995，第39页中说明的)。选择标记可以具有其自己的启动子或其表达可通过启动子来驱动，该启动子驱动所关注的多肽的表达。选择标记的启动子驱动表达可以是组成型或诱导型启动子。

据报告，基因大大增强了在许多生物有机体中监控基因表达的能力。报道了基因已成功用于高等植物的叶绿体，并已报道高水平的重组蛋白表达。此外，报告基因已经用于莱茵衣藻的叶绿体中。在高等植物的叶绿体中，β-葡萄糖醛酸酶(uidA，例如，如Staub和Maliga，EMBO J.12：601-606，1993中说明的)、新霉素磷酸转移酶(nptII，例如，如Carrer等人，《分子基因遗传学》(Mol.Gen.Genet.)241：49-56，1993中说明的)、腺苷基-3-腺苷转移酶(aadA，例如，如Svab和Maliga，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.,USA)90：913-917，1993中说明的)，以及维多利亚多管发光水母(Aequoreavictoria)GFP(例如，如Sidorov等人，《植物期刊》(Plant J.)19：209-216，1999中说明的)已经用作报告基因(例如，如Heifetz，《生物化学》(Biochemie)82：655-666，2000中说明的)。这些基因的每一个均具有使它们成为叶绿体基因表达的有用报告基因的属性，诸如，分析简便、灵敏，或能在原位检测表达。基于这些研究，其他外源蛋白已经表达于高等植物的叶绿体中，赋予对昆虫食草动物的抗性，诸如，苏云金芽孢杆菌Cry毒素(例如，如Kota等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.，USA)96：1840-1845，1999中说明的)，或人促生长素(例如，如Staub等人，《自然生物技术》(Nat.Biotechnol.)18：333-338，2000中说明的)，一种潜在的生物药物。数种报告基因已经表达于真核绿藻，莱茵衣藻的叶绿体中，包括aadA(例如，如Goldschmidt-Clermont，《核酸研究》(Nucl.Acids Res.)19：4083-40891991；以及Zerges和Rochaix，《分子细胞生物学》(Mol.Cell Biol.)14：5268-5277，1994中说明的)、uidA(例如，如Sakamoto等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.,USA)90：477-501，1993；以及Ishikura等人，《生物科学与生物工程期刊》(J.Biosci.Bioeng.)87：307-314 1999中说明的)、海肾萤光素酶(例如，如Minko等人，《分子基因遗传学》(Mol.Gen.Genet.)262：421-425，1999中说明的)以及来自鲍曼不动杆菌(Acinetobacterbaumanii)的氨基糖苷磷酸转移酶aphA6(例如，如Bateman和Purton，《分子基因遗传学》(Mol.Gen.Genet)263：404-410，2000中说明的)。

在一个实施例中，通过添加N端strep标签表位对本文所述的蛋白质进行改造以辅助检测蛋白质表达。在另一个实施例中，通过添加Flag标签表位在C端对本文所述的蛋白质进行改造以辅助检测蛋白质表达，并且促成蛋白质纯化。

亲和标签可以被附加到蛋白质上，使其可以使用亲和技术从其粗生物来源纯化。这些包括，例如，几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)，以及谷胱甘肽-S-转移酶(GST)。聚(His)标签是一种广泛使用的蛋白标记；其结合至金属基体。一些亲和标签有双重作用，作为增溶剂，诸如，MBP和GST。色谱标记用于改变蛋白质的色谱性能，以跨越特定的分离技术得到不同分辨率。通常，这些由聚阴离子氨基酸，诸如，FLAG标签组成。表位标签是其被选择是因为高亲和性抗体能够可靠地产生于许多不同物种的短肽序列。这些通常是来自于病毒基因，它解释其高免疫反应性。表位标签包括，但并不限于，V5-标签、c-myc-标签，和HA-标签。这些标记对免疫印迹和免疫沉淀实验特别有用，但它们也应用于抗体纯化。

荧光标记用于对蛋白质进行目视读出。GFP及其变体是最常用的荧光标记。GFP的更高级的应用包括使用其作为折叠报告基因(如果是折叠的，是荧光的，如果不是，是无色的)。

在一个实施例中，本文所述的蛋白质可以在氨基末端融合到高表达蛋白(融合伴侣)的羧基末端。这些融合伴侣可提高基因的表达。工程化处理位点，例如，蛋白酶、蛋白水解，或胰蛋白酶处理或切割位点，可用于从融合伴侣中释放蛋白，允许期望的蛋白的纯化。可融合到基因的融合伴侣的例子是一种编码乳-相关的血清淀粉样蛋白(M-SAA)蛋白的序列、编码核酮糖二磷酸羧化酶的大和/或小亚基的序列、编码谷胱甘肽S-转移酶(GST)基因的序列、编码硫氧还蛋白(TRX)蛋白质的序列、编码麦芽糖结合蛋白(MBP)的序列、编码大肠杆菌(E.coli)蛋白质NusA，NusB，NusG或NusE中的任一个或多个的序列、编码泛素(Ub)蛋白质的序列、编码小泛素相关修饰(SUMO)蛋白质的序列、编码霍乱毒素B亚单基(CTB)蛋白质的序列、连接到编码MBP-编码malE基因的序列的3'端的连续的组氨酸残基序列、半乳糖激酶基因的启动子和前导序列，以及(ampicillinase)基因的前导序列。

在一些情况下，本公开的载体将含有多种元件，诸如，大肠杆菌(E.coli)或啤酒酵母(S.cerevisiae)复制起点。与适当的可选择标记结合的这些特征允许载体在目标宿主细胞与细菌和/或酵母细胞之间“穿梭”。本公开的穿梭载体在第二宿主中通过的能力可以允许更方便地操纵载体的特征。例如，可以将含有载体和插入的所关注的多核苷酸的反应混合物转化到原核宿主细胞中，诸如，大肠杆菌(E.coli)，使用常规方法进行扩增和收集，并且进行检查，以识别含有所关注的插入物或构建体的载体。如果希望的话，可以对载体进行进一步操作，例如，通过对插入的多核苷酸进行定点诱变，然后再一次扩增和选择具有所关注的突变多核苷酸的载体。然后可以将穿梭载体引入植物细胞叶绿体中，其中所关注的多肽可以被表达，并且如果希望的话，根据本公开的方法进行分离。

宿主生物，例如，莱茵衣藻的叶绿体或核基因组的知识可用于构建用于所公开的实施例的载体。用于选择叶绿体基因组的区域用作载体的叶绿体载体和方法是熟知的(参见，例如，Bock，《分子生物学期刊》(J.Mol.Biol.)312：425-438，2001；Staub和Maliga，《植物细胞》(Plant Cell)4：39-45，1992；以及Kavanagh等人，《遗传学》(Genetics)152：1111-1122，1999，其中的每一个通过引用并入本文)。莱茵衣藻的全叶绿体基因组可在环球网上在URL“biology.duke.edu/chlamy_genome/-chloro.html”下提供给公众(参见“以文本文件形式查看全基因组”链接以及“叶绿体基因组图谱”链接；J.Maul，J.W.Lilly，和D.B.Stern，未公开的结果；2002年1月28日修订版；将以GenBankAcc.No.AF396929形式公开；以及Maul，J.E.等人(2002)《植物细胞》(The PlantCell)，Vol.14(2659-2679))。通常，选择使用的叶绿体基因组DNA的核苷酸序列不是基因的一部分，包括调节序列或编码序列。例如，所选择的序列不是这样一种基因，如果断裂的话，由于同源重组事件，该基因将对叶绿体产生有害作用。例如，对叶绿体基因组的复制或对含有该叶绿体的植物细胞的有害作用。

在这个方面，含有莱茵衣藻叶绿体基因组序列的站点还提供了显示叶绿体基因组编码和非编码区的图谱，因此有助于选择可用于构建载体的序列(还在Maul，J.E.等人(2002)《植物细胞》(The Plant Cell)，Vol.14(2659-2679)中进行了说明)。例如，叶绿体载体，p322，是从位于大约位置143.1kb处的Eco(Eco RI)位点延伸到位于大约位置148.5kb处的Xho(Xho I)位点的克隆(参见，环球网，在URL“biology.duke.edu/chlamy_genome/chloro.html”下，并且点击“maps of the chloroplast genome”链接，以及“140-150kb”链接；还可以直接在环球网上在URL“biology.duke.edu/chlam-y/chloro/chlorol40.html”下进入)。

此外，莱茵衣藻的全核基因组在Merchant，S.S.等人，《科学》(Science)(2007)，318(5848)：245-250中进行说明，因此有助于本领域普通技术人员选择可用于构建载体的一个或多个序列。

为了在宿主中表达多肽，可以使用表达盒或载体。表达载体将包含转录和转译起始区，以及转录和转译终止区，该起始区可以是诱导型的或组成型的，其中编码区在转录起始区的转录控制下可操作地连接。这些控制区可能产自于基因，或可以从外源来源得到。表达载体通常具有位于启动子序列附近的方便的限制酶切位点，以提供编码外源或内源蛋白质的核酸序列的插入。可存在在表达宿主中可操作的可选择标记。

可以通过各种方法将核苷酸序列插入载体中。在最常用的方法中，使用本领域的技术人员通常已知，并且详见，例如，Sambrook等人，《分子克隆实验手册》(Molecular Cloning,A Laboratory Manual)，第二版(2^nd Ed.)，冷泉港出版社(Cold Spring Harbor Press)，(1989)以及Ausubel等人，《精编分子生物学实验指南》(Short Protocols in Molecular Biology)，第二版(2^nd Ed.)，JohnWiley & Sons(1992)的步骤将序列插入适当的限制性内切核酸酶位点中。

本文说明提供的是，宿主细胞可以用载体来转化。本领域的技术人员应当认识到的是，这类转化包括用环形载体、线性载体、载体的线性部分，或上述任一组合进行转化。

因此，包含载体的宿主细胞可含有细胞中的整个载体(环形或线性形式)，或者可含有本公开的载体的线性部分。

密码子优化

编码多核苷酸的一个或多个密码子可以被“偏倚”或“优化”，以反映宿主生物的密码子使用。这两个术语在本公开中可互换使用。例如，编码多核苷酸的一个或多个密码子可以被“偏倚”或“优化”，以反映莱茵衣藻中的叶绿体密码子使用(表A)或核密码子使用(表B)。大多数氨基酸是由两个或更多个不同的(退化)密码子编码的，并且众所公认的是各种不同的生物利用优先于其他密码子的某些密码子。通常，选择的密码子偏倚反映正在用本公开的核酸转化的植物(或其中的细胞器)的密码子使用。

一个或多个密码子可以改造，例如，通过诸如定点诱变，使用与将改变的核苷酸不匹配的引物使得扩增产物被偏倚成反映所选(叶绿体或核)密码子使用的PCR，或者通过从头合成多核苷酸序列使得改变(偏倚)被引入作为合成过程的结果之类的方法。

当密码子优化特定基因序列用于表达时，密码子使用以外的因素也会被考虑。例如，典型的是避免限制位点、重复序列，和潜在的甲基化位点。大多数基因合成公司利用计算算法来优化DNA序列，考虑这些和其他因素，同时维持密码子使用(如密码子使用表中所定义的)高于用户定义的阈值。例如，这个阈值可以设置成使得使用不到相应的氨基酸存在于蛋白质组中的时间的10％的密码子将避免出现在最终的DNA序列中。

表A(下表)显示莱茵衣藻(C.reinhardtii)的叶绿体密码子使用(参见于2004年1月22日公开的美国专利申请公开号：2004/0014174)。

表A

*-每1,000个密码子的密码子使用频率。**-在36个叶绿体编码序列中观察到的次数(10,193个密码子)。

莱茵衣藻叶绿体基因组显示高AT含量和显著的密码子偏倚(例如，如Franklin S.等人，(2002)Plant J 30:733-744；Mayfield S.P.和Schultz J.(2004)Plant J 37:449-458中所说明的)。

表B举例说明了优先用于衣藻(Chlamydomonas)核基因中的密码子。

表B

字段：[三联体(triplet)][频率：每一千]([数量])

编码GC 66.30％第一字母GC 64.80％第二字母GC 47.90％第三字母GC86.21％

一般而言，所选择的用于实现本公开目的的核密码子偏倚，包括，例如，制备本文所公开的合成多核苷酸，可反映藻核的核密码子使用，且包括产生含有大于60％的G/C含量的编码序列的密码子偏倚。

再造基因组

除了利用密码子偏倚作为提供多肽的有效转译的手段以外，还将认识到的是，用于获得多肽在生物中的有效转译的替代手段是再造基因组(例如，莱茵衣藻(C.reinhardtii)叶绿体或核基因组)来表达未在基因组中无法表达的tRNA。这种再造藻类表达一个或多个外源性tRNA分子提供以下优点，其将消除改造待引入并由藻类基因组表达的所关注的每一个多核苷酸的需求；相反，包含基因改造基因组的藻类，诸如，莱茵衣藻可以提供并加以利用以用于有效转译多肽。高表达基因中的tRNA多度和密码子使用之间的相关性是众所周知的(例如，如Franklin富兰克林等人，Plant J.30:733-744,2002；Dong等人，J.Mol.Biol.260:649-663,1996；Duret,Trends Genet.16:287-289,2000；Goldman等人，J.Mol.Biol.245:467-473,1995；和Komar等人，Biol.Chem.379:1295-1300,1998中所说明的)。在大肠杆菌(E.coli)中，例如，再造菌株以表达未充分利用的tRNA导致利用这些密码子的基因表达增强(参见Novy等人，在Novations 12:1-3,2001中)。利用内源性tRNA基因，定点诱变可用于产生合成tRNA基因，可将其引入到宿主生物的基因组中以补充基因组，诸如，莱茵衣藻(C.reinhardtii)叶绿体基因组中罕见的或未使用的tRNA基因。

对序列进行密码子优化以用于表达的另一种方式。

用于优化核酸序列用于表达的替代方式是对每一个氨基酸位置使用最常利用的密码子(如密码子使用表中所确定的)。这种类型的优化可被称作“热密码子”优化。通过这种方法产生不需要的限制位点，下一个最常利用的密码子可在位置中被取代，使限制位点不再存在。表C列出了当使用这种方法来优化核酸序列用于在莱茵衣藻的叶绿体中表达时针对每个氨基酸所选择的密码子。

表C

氨基酸	所利用的密码子
		F	TTC
L	TTA
		I	ATC
V	GTA
		S	TCA
P	CCA
		T	ACA
A	GCA
		Y	TAC
H	CAC
		Q	CAA
N	AAC
		K	AAA
D	GAC
		E	GAA
C	TGC
		R	CGT
G	GGC
		W	TGG
M	ATG
		Stop	TAA

链带藻(Desmodesmus)、衣藻(Chlamydomonas)、微拟球藻(Nannochloropsis)，或栅藻(Scenedesmus)菌种的细胞核的密码子优化

为了创建可以用于表达几种不同物种的细胞核中的基因的密码子使用表，对一些物种的密码子使用频率进行分析。对应于藻类物种栅藻(二形栅藻)、链带藻(Desmodesmus sp.)(未知的Desmodesmus sp.)，和微拟球藻(N.salina)中的每一种的核蛋白质编码区的DNA序列的30,000个碱基对用于创建每个物种的唯一的核密码子使用表。然后将这些表相互比较，并与莱茵衣藻的进行比较；对莱茵衣藻的核基因组的密码子表用作标准。对其他藻类物种具有非常低的密码子使用，但尚未在莱茵衣藻中使用的任何密码子固定于0，且因此，应当避免使用此密码子表(表D)设计的DNA序列。以下密码子应尽量避免：CGG、CAT、CCG，和TCG。生成的密码子使用表示于表D。

表D

衣藻(Chlamydomonas sp.)、栅藻(Desmodesmus sp.)、链带藻(Desmodesmus sp.)，和微拟球藻(Nannochloropsis)的核密码子使用

例如，在第一行中，小数(0.16)是使用密码子(UUU)来编码F(苯丙氨酸)的次数的百分比(16％)。

(*表示终止密码子)(aa是氨基酸)

百分比序列同一性

算法的一个实例适于确定核酸或多肽序列之间的百分比序列同一性或序列相似性是BLAST算法，其描述在，例如在Altschul等人，J.Mol:403-410(1990)。公众可以通过美国国立生物技术信息中心获得用于执行BLAST分析的软件。BLAST算法参数W、T和X决定了对齐的灵敏度和速度。BLASTN程序(用于核苷酸序列)用作默认值，字长(W)为11，期望值(E)为10，截断值为100，M＝5，N＝-4，并比较两条链。对于氨基酸序列，BLASTP程序用作默认值，字长(W)为3，期望值(E)为10，BLOSUM62评分矩阵(例如，描述于Henikoff&Henikoff(1989)美国科学院院报，89:10915)。除了计算百分比序列同一性之外，BLAST算法还可执行两个序列之间的相似性统计学分析(例如，如在Karlin&Altschul，美国科学院院报，90:5873-5787(1993))。由BLAST算法提供的相似性的一个量度是最小和概率(P(N))，其提供了概率的指标，说明两个核苷酸或氨基酸序列之间的匹配偶然发生。例如，如果在测试核酸与参考核酸的比较中最小和概率是约小于0.1、约小于0.01、或约小于0.001，认为核酸与参考序列相似。

通用脂质类

一种脂质在此定义为不溶于水并且可溶于非极性溶剂的细胞成分。脂质的例子是酰基脂质、类异戊二烯、卟啉，或酰基脂质衍生的细胞成分。

其它示例性的脂质包括血红素、极性脂质、叶绿素分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油、心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油，磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、二酰甘油三甲基同型丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OH甲基羧基胆碱，甘油二酯OH甲基三甲基丙氨酸，2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4，5-二磷。

“含量”是上述的任何一种或多种脂质的总量。“分布(profile)”是上述的任何一种或多种脂质的相对量。

例如，转化生物的脂质含量可以不同于未转化生物的脂质含量，这在于，与未转化生物相比，在转化生物中特定脂质的表达提高，因此增加了生物中脂质的总量。

另外，例如，转化的生物的脂质分布可以不同于未转化生物中的脂质分布，这在于，与未转化生物相比，在转化生物中若干脂质的表达或增加或减少了。

一种转化生物的脂质含量或分布还可以与任何其他生物相比，例如，另一种转化生物。

实施例

以下实施例旨在举例说明本公开的应用。以下实施例不旨在完整地定义或以其它方式限制本公开的范围。

本领域的技术人员可以理解，本领域已知的许多其它的方法可取代本文具体描述或引用的方法。

几种如下所述的方法先前已描述在美国临时专利申请No.60/61/301，2010年2月3日提交，以及国际公开号WO2011/097261，国际申请日为2011年2月1日，公开于2000年8月11日提交。

实施例1:在野生型藻类中的氮饥饿表型。

已知在许多野生型藻类菌种中(例如，盐生杜氏藻、二形栅藻、绿色杜氏藻，莱茵衣藻和微拟球藻)，氮饥饿可引起几种表型，其中包括总脂质增加型(图8A和8B，图41C)，生长速率降低型(图8C、图41A和41D)，和叶绿素的分解型(图8D和图41B和41E)。希望在分子水平上分离这些表型途径。例如，希望获得提高的脂质表型，其没有降低的生长速率和分解的藻类组分。

图8A示出了重力脂肪分析(己烷可萃取物)。两个组中每个组的左手列是在含有7.5m M的NH₄Cl的培养基中生长后己烷可提取的百分比脂质(％DW)，和两个中每组的右手栏中是在没有氮的条件下生长后培养基中己烷可萃取脂质的百分比(％DW)。三个不同菌株鉴定为：SE0004(二形栅藻)、SE0043(绿色杜氏藻)和SE0050(莱茵衣藻)。这些菌株代表绿藻纲的三个不同的目。

图8B示出了重力脂肪分析(己烷可萃取物)。两个中每个组的左手列是生长在含有7.5mM的NH₄Cl的培养基后己烷可萃取脂质的百分比(％DW)，和两个中每组的右手栏中是在没有氮的条件下的培养基中生长后己烷可萃取脂质的百分比(％DW)。三个不同菌株鉴定为：SE0003(杜氏盐藻)、SE0004(二形栅藻)和SE0043(绿色杜氏藻)。这些菌株代表绿藻纲的三个不同的目。

图41C示出了在氮应激下生长的藻类中可提取的脂质。野生型微拟球藻在含有11.8mM的NaNO3、0.5mM的NH₄Cl和16ppt的NaCl的MASM中，5％的二氧化碳，空气环境中有恒定的光照，生长至早期对数期。2-3升的培养液在3000-5000xg离心5-10分钟，和培养液的一半用300-500mL的MASM清洗，另一半用不包含氮气的300-500mL的MASM清洗。再次离心分离后，将两种培养液重悬在一定体积的培养基中(MASM或不含氮气的MASM)，相当于起始培养基体积。两天后，收集样本，并离心。根据修改的BlighDyer方法，使用甲醇/甲基-叔丁乙醚来萃取来分析细胞的总重量脂类(如MatyashV.，等人.(2008)Journal of Lipid Research 49:1137-1146)。可萃取的百分比示出在y轴，存在和不存在氮的样本示出在x轴上。

图8C示出了在氮应激条件下生长的藻类。野生型莱茵衣藻植株在含有7.5mM的NH₄Cl的50-100mL的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的HSM冲洗，而另一半培养液用20-50mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。这一点是记录为第0天。在5天的时间进程内，每天的光学密度(OD)取为750nm，并显示在y轴上。x轴代表超过5天的氮饥饿的时间进程。三角形表示在氮的存在下生长，而正方形表示在没有氮的存在下生长。

图41A示出了在氮应激条件下生长的微拟球藻。野生型微拟球藻在含有11.8mM的NaNO3、0.5mM的NH₄Cl和16ppt的NaCl的50-100mL的MASM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的MASM冲洗，而另一半培养液用20-50mL不包含氮的MASM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(MASM或不含氮的MASM)，相当于起始培养基体积。这一点是记录为第0天。在120小时的时间进程内，每天的光学密度(OD)取为750nm，并显示在y轴上。x轴代表超过5天的氮饥饿的时间进程。菱形表示在氮的存在下生长，而正方形表示在没有氮的存在下生长。

图41D示出了在氮应激条件下生长的二形栅藻。野生型二形栅藻在含有7.5mM的NH₄Cl的50-100mL的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的HSM冲洗，而另一半培养液用20-50mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。这一点是记录为第0天。在180小时的时间进程内，每天的光学密度(OD)1-2次取为750nm，并显示在y轴上。x轴代表超过7.5天的氮饥饿的时间进程。菱形表示在氮的存在下生长，而正方形表示在没有氮的存在下生长。

图8D示出了在氮应激条件下的叶绿素(μg叶绿素/mg无灰的干重量(AFDW)。野生型莱茵衣藻植株在含有7.5mM的NH₄Cl的50-100mL的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的HSM冲洗，而另一半培养液用20-50mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。这一点是记录为第0天。收集样本并离心。在甲醇中提取细胞，并利用光谱方法测定叶绿素水平，如(LICHTENTHALER Chlorophylls andCarotenoids:Pigments of Photosynthetic Biomembranes.Meth Enzymol(1987)第148卷，第350-382页)。在750nm光密度(OD)的培养液用于使细胞密度归一化，并且接近无灰干重。测量在9天的时间内进行。两个中的每个组的左手列是在氮存在的条件下的叶绿素含量，两个中的每个组的右手列是在氮不存在的条件下的叶绿素含量。

图41B示出了在氮应激条件下的叶绿素水平。野生型微拟球藻在含有11.8mM的NaNO3、0.5mM的NH₄Cl和16ppt的NaCl的50-100mL的MASM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的MASM冲洗，而另一半培养液用20-50mL不包含氮的MASM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(MASM或不含氮的MASM)，相当于起始培养基体积。两天后，收集样本，并离心。在甲醇中提取细胞，并利用光谱方法测定叶绿素水平，如(LICHTENTHALER Chlorophylls and Carotenoids:Pigments of Photosynthetic Biomembranes.Meth Enzymol(1987)第148卷，第350-382页)。加入叶绿素A和叶绿素B的计算，750nm的光学密度(OD)的培养液用于使细胞密度归一化。将该值绘制到y轴上，并且将存在和不存在氮的条件下样本表示于x轴上。

图41E示出了在氮应激条件下的叶绿素水平。野生型二形栅藻在含有7.5mM的NH₄Cl的50-100mL的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用20-50mL的HSM冲洗，而另一半培养液用20-50mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。两天后，收集样本，并离心。在甲醇中提取细胞，并利用光谱方法测定叶绿素水平，如(LICHTENTHALERChlorophylls and Carotenoids:Pigments of Photosynthetic Biomembranes.MethEnzymol(1987)第148卷，第350-382页)。加入叶绿素A和叶绿素B的计算，750nm的光学密度(OD)的培养液用于使细胞密度归一化。将该值绘制到y轴上，并且将存在和不存在氮的条件下样本表示于x轴上。

实施例2：野生型莱茵衣藻在生物化学和分子水平上应激响应的时序

在该实例中，对野生型莱茵衣藻的生物化学和分子反应的时序进行了研究。野生型莱茵衣藻细胞在含有5-10L的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至细胞达到早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用500-1000mL的HSM冲洗，而另一半培养液用500-1000mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。在表2所列的时间点，0.5-2L的细胞通过离心收获，并根据BlighDyer方法分析脂质总重量(如BLIGH和DYER，A rapid method of total lipid extraction andpurification.Can J Biochem Physiol(1959)，卷37(8)，第911-7页中所述)。使用样本的无灰干重计算萃取的百分比。

Bligh-Dyer从SE0050提取的油在反相高效液相色谱C18柱上进行。流动相A是MeOH/水/HOAc(750:250:4)。流动相B是CAN/MeOH/THF/HOAc(500:375:125:4)，经72分钟，A和B之间有梯度，流速0.8mL/min。经由荷电气溶胶检测器(CAD)进行检测。在氮饥饿24和48小时后，观察到SE0050的脂质表型的差异。这是在氮充足和氮饥饿状态下的总脂质分布的含量测定。y轴为CAD信号，代表充足，且x轴是高效液相色谱柱保留时间(以分钟计)。如图9所示，在24小时时间点观察到一些较小的差别(在脂质分布中)。相反，从HSM介质中除去氮后48小时可以看到较大的偏移(如图10所示)。在44和54分钟的保留时间之间检测到TAG，表明48小时的氮饥饿后TAG有很大的提高。这些差异表明在氮饥饿后24和48小时之间观察到脂质表型(在这种饥饿方式下的菌株中)。

图26示出了在HPLC/CAD上的藻类己烷抽提物的基准轨迹，由CAD制备(ESA-Dionex公司)。该附图用来解释图9和图10中的数据。1＝游离脂肪酸；2＝脂肪醇，3＝磷脂，4＝二酰基甘油酯；和5＝三酰基甘油酯。

在氮充足和氮饥饿的样本上使用qPCR进行分子水平上的测距实验(如图11所示的24小时时间点)。实验目的是找到氮饥饿表型涉及的分子信号。靶基因(在表1中沿X轴列举)的选择基于氮反应涉及的文献或途径衍生的期望。野生型莱茵衣藻细胞培养在5-10L的HSM介质、5％二氧化碳、空气环境中恒定的光照，直到细胞达到早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用500-1000mL的HSM冲洗，而另一半培养液用500-1000mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。在表2所列的时间点，通过离心收获50-100mL的细胞，从培养物中纯化出RNA。0.25-1.0ug的RNA结合0.25ug人脑RNA(Biochain，Hayward，CA)作为阳性对照，并通过SybrGreen检测用于iScript cDNA合成(BioRad，美国)和标准qPCR(BioRad，美国)。5个基因的显著上调(图中示为在Y轴上成倍上调)在24小时氮饥饿内可观察(如图11所示)。相对于三种人大脑对照基因执行三倍qPCR反应(左手列的对照基因是PGAM1中(独立基因Hs.632918)，中间列是BASP1(独立基因Hs.201641)，和右手列是SLC25A14(独立基因Hs.194686))。

图12示出了24小时的氮饥饿后在表1中同一组基因中的基因表达变化(成倍下调)。图12包含与图11相同的数据，而图12示出了上调，图11示出下调。在氮饥饿的24小时内观察到3种基因的大幅度下调(图中示为在Y轴上成倍下调)。在6小时时间点可观察类似的变化(上调或下调)。相对于三个对照基因执行三倍qPCR反应(左手列中对照基因是PGAM1(独立基因Hs.632918)，中间列是BASP1(独立基因Hs.201641)，和右手列是SLC25A14(独立基因Hs.194686))。这些结果表明，分子变化(如图11和12中qPCR所示)较早发生，在48小时可见的脂质改变前观察到(如图9和10所示)。

表1中提供图11和图12所示的qPCR数据中使用的靶基因的检索表。下列基因是已知的莱茵衣藻基因。该第一列示出了在24小时时成倍上调或下调。第二列示出在48小时时成倍上调或下调。在第一和第二列，下调用数字(-)表示，上调用数字(+)表示。

这些实验显示了氮饥饿诱导的脂质积聚和分布变化主要在24和48小时之间开始。与氮饥饿相关联的分子变化(即RNA表达)更早开始，早在氮饥饿后6小时已经发生RNA表达水平变化。

表1

实施例3:转录组测序转录组学的方法

在该例子中，描述了编码SN03的基因的鉴定的示例性方法。这里描述的方法可以用来鉴定其它蛋白质、多肽，或转录因子，例如，在生物(例如，藻类)中观察到的参与调节或控制不同的氮缺乏表型的那些。这些氮缺乏的表型包括，例如，提高的脂质生产和/或积累、光合系统的分解、减缓的生长，和杂交诱导。鉴定为参与调节或控制不同的氮缺乏的表型的基因可以对这些表型具有正面或负面影响，例如，提高或降低脂质生产，或者，提高或降低生长速率。

为了鉴定氮饥饿诱导脂质表型中所涉及的基因/蛋白，转录组测序转录组学的方法(图13；Wang等，Nat.Rev.Genet.(2009)第10(1)卷，第57-63页)用于确定在六种不同条件下生长的藻类中所有基因的表达水平(表2列出)。这些条件是基于图9、10、11和12中所述的测距实验建立。转录组测序转录组学的方法如下所述。

简言之，mRNA首先被转换为cDNA片段通过RNA断裂或DNA断裂(见图13)。测序适配器随后被添加到每个cDNA片段(具有适配器的EST库)，使用高通量测序技术(Solexa)从每个cDNA片段中获得短序列读数。得到的序列读数与参考转录组对齐，并可分为三种类型:外显子读数、结合读数和聚(A)末端读数。这些比对用于生成每个基因的表达谱，如图13的底部所示；酵母ORF示出具有一个内含子。

制备来自六个不同的条件的SE0050 RNA(指数生长：+氮；指数生长:6小时-氮；指数生长：24小时-氮；指数生长:48小时-氮；稳定期:+氮；和稳定期:氮(约11天))。野生型莱茵衣藻细胞在50-100mL的HSM，5％二氧化碳，空气环境中有恒定的光照，生长至早期对数期。培养液在3000-5000xg下离心5-10分钟，培养液的一半用500-1000mL的HSM冲洗，而另一半培养液用500-1000mL不包含氮的HSM冲洗。再次离心分离后，将两个培养液重悬在一定体积的培养基(HSM或不含氮的HSM)，相当于起始培养基体积。在表2所列的时间点，通过离心收获细胞的50-100mL和RNA从培养物中纯化。这种RNA采用标准Solexa方法(Sequensys，Inc，LaJolla，CA)中使用的转录组测序分析方法进行测序。每个样本在380万到1780万之间生成36-mer读数(见表2)。

此转录组测序转录子数据使用Arraystar软件被映射到版本3.0的能源部(DOE)的联合基因组研究所(JGI)莱茵衣藻基因组(DNASTAR，美国)。用于映射的这组基因包括16,824个注释的核基因。也使用JGI的功能注释(版本3.0)，并导入到Arraystar软件。这些注释的大部分基于预测算法，并且不具有支持的实验证据。小部分具有支持的实验证据。大约7,500具有某种种类的功能注释。使用的JGI功能注释包括KOG(直系同源基因簇)、EC(酶学委员会数值分配)，而GO(基因本体)。

SE0050 Solexa数据映射到版本3.0的转录本。每个样本产生4百万-1千8百万读数，并映射到基因组上，表示2GBases的数据-20亿+核苷酸。下面的表2中呈现了6个RNA样本的每一个生成的Solexa 36碱基对读数。对于每个样本，显示的还有那些成功地映射到莱茵衣藻v3.0转录组的读数(具有聚体采样数的总读数)的数量，总命中的百分数映射到转录组。

表2

然后，通过查看六个样本之间表达水平的变化并在氮饥饿的时间过程中，对转录子数据分析。图14示出SE0050中的所有16,000+基因的图，具有来自每个轴线上的不同样本的表达水平。这里示出的指数生长+氮(x-轴)和与之相对的指数生长6H-氮(y-轴)。表达水平不变的基因在对角线上。该白色数据点代表至少4倍的表达变化，在对角线之上的那些白点在6小时的氮饥饿后被上调，在对角线之下的那些白点在6小时的氮饥饿后被下调。这些图可以产生用于六个测序样本的任何成对比较。这些表达谱用于选择靶基因。

表达的时间过程的实施例(如上面图14提到)。图15示出了在氮饥饿期间的基因表达动力学(6H，24H，48H，静止的)如何用于进一步精制靶基因列表。每一行代表一种基因，在每种情况下与y轴是表达水平，而x轴表示对6个测序样本。这八个曲线图表示的是在6个样本代表的条件下具有相似表达模式的基因。这些模式和分组可用于进一步精制靶基因列表。

图16示出了14个基因的表达模式，所具有的表达模式表明这些基因在氮饥饿后快速开启，并停留。14基因代表图15的下部右侧框。选择这组14基因的原因是来自JGI的功能注释表明预期这些基因参与转录和/或基因调节。潜在地控制氮饥饿基因响应，并且有望是调节基因，被选作目标。该JGI基因注释在分子水平上的完全程度也确定潜在目标的可用性。例如，许多的注释基因不具有起始和/或终止密码子，因此完整的开放阅读框(ORF)是未知的。由于差的注释，最初的14个靶限定至5个。14个中的3个没有起始密码子，3个不具有终止密码子，2个既没有起始，也没有终止密码子，1个具有不适当的终止密码子。5个所选靶是具有起始密码子和终止密码子的全长ORF。

实施例4:SN03克隆到Ble2A。

SN03的ORF是利用莱茵衣藻的密码子使用表优化用于莱茵衣藻的核基因组的密码子，并且合成。将SN03的DNA构建物克隆到核过表达载体Ble2A(如图34所示)，并转化到SE0050。这种构建物产生一种RNA，该RNA具有编码选择性蛋白质的核苷酸序列(Ble)和编码感兴趣的蛋白质的核苷酸序列。这两个蛋白的表达通过病毒肽2A连接(例如，如Donnelly等，遗传病毒学杂志(2001)第82卷(Pt5)1013-25页)。这蛋白质序列有助于来自单个mRNA的两个多肽的表达。

表3

转化的DNA，如图34所示的Ble2A-SN03质粒，是通过使用pBluscript IISK(-)(Agilent Technologies，CA)产生作为载体骨架。标记“AR4启动子”的该段表示以莱茵衣藻Hsp70A启动子、莱茵衣藻rbcS2启动子和来自莱茵衣藻rbcS2基因的第一个内含子的四个拷贝开始的融合启动子区域(Sizova等人，277:221-229(2001))。编码博来霉素结合蛋白质的基因融合到口蹄疫病毒的2A区域和SN ORF，其中用XhoI和BamHI克隆FLAG-MAT标签。然后是莱茵衣藻rbcS2终止子。

转化DNA的制备方法是：用限制酶KpnI、XbaI或PsiI消化Ble2A-SN载体，接着用热将酶灭活。对于这些实验，所有转化都在莱茵衣藻cc1690(mt+)上进行。培养细胞并通过电穿孔转化。细胞在TAP培养基中生长到对数中期(约2-6x106细胞/ml)。在2000xg-5000xg下进行5分钟离心沉淀细胞。将上清夜移出，并将细胞再悬浮于TAP培养基+40mM蔗糖。250-1000ng(在1-5μLH₂O)的转化DNA与冰上的250μL的3x10⁸细胞/mL混合，并转移到0.4cm电穿孔试管。进行电穿孔用的电容设定为25uF、电压为800V，以传递2000V/cm导致时间常数约为10-14ms。电穿孔后，将试管放回常温5-20分钟。对于每个转化，细胞转移到10ml的TAP培养基+40mM蔗糖，使其在常温12-16小时恢复并连续振摇。然后通过在2000xg-5000xg下离心收获细胞，上清液弃去，将沉淀物重新悬浮在0.5ml的TAP培养基+40mM蔗糖。然后将重悬浮的细胞接种在固体TAP培养基+20μg/mL博莱霉素。结果，创建菌株SN03的过表达株系。

实施例5：对SN03的脂质染色/流式细胞术分析

通过流式细胞术(Guava)使用三种脂类染料以筛选37个单个SN03菌落。将细胞在1-5mL的TAP中培养至对数中期，然后在流式细胞仪(Guava)分析之前稀释在包含脂类染料的培养基中。总之，SN03株系显示出比野生型更高的脂类染料染色(wt-4为野生型的生物复制)，再次表明它们具有多种脂质。图19A示出了Bodipy染色，图19B示出了重复的Bodipy染色；图19C示出了Lipid TOX染色；和图19D示出了尼罗红染色。x轴表示单个菌株，无论是野生型或37SN03过表达株系(命名为SN-1到SN03-37)，而y轴代表相对荧光单位。

图42B示出了在存在和不存在氮和SN03过表达株系的条件下生长的野生型莱茵衣藻中通过脂类染料和流式细胞术(Guava)确定脂质含量。野生型莱茵衣藻细胞培养在10-100mL的TAP培养基，含有7.5mM的NH₄Cl，在空气环境中有恒定的光照，直到细胞达到早期对数期。培养物在3000-5000xg下离心5-10分钟，将培养物的一半用5-100mL的TAP清洗，而另一半用不含氮的5-100mL的TAP清洗。再次离心后，两种培养物再悬浮在一定体积中，其相当于起始培养体积。另外，一个SN03过表达株系生长在10-100mL的TAP培养基，其中含有7.5mM的NH₄Cl，空气环境中有恒定的光照，直到细胞达到早期对数期。野生型培养物在氮饥饿2-3天后，在分析流式细胞仪(Guava)之前将培养物稀释到含有脂类染料的培养基。将三种染料单独使用。在图42B，x轴表示列所代表的每组三种染料的样本。在每组的三列中，左列表示尼罗红，中间列表示Lipid TOX green，而右列表示Bodipy。左侧y轴表示尼罗红和Lipid TOX green(NR，LT)的相对荧光单位(RFU)，而右侧y轴表示Bodipy的RFU。SN03过表达株系显示脂类染色在氮存在下高于野生型，在没有氮的条件下与野生型相当。

图42C示出了几个独立的SN03过表达株系的脂质含量。野生型莱茵衣藻和五个SN03过表达株系在10-100mL的TAP培养基中培养，其中含有7.5mM的NH₄Cl，在空气环境中有恒定的光照，直到细胞达到早期对数期。在流式细胞仪(Guava)分析之前将培养物稀释到含有Bodipy的培养基上。x轴表示野生型(wt)或SN03过表达株系，而y轴表示相对荧光单位(RFU)。所有五种SN03过表达株系表现出脂类染色高于野生型。

实施例6：SN03过表达株系的表型分析

野生型细胞伴随的7个SN03转基因株系(图20A)在TAP培养基中培养，空气环境中有恒定的光照，直到细胞达到晚期对数期。另外，不包含SN基因(基因缺失)转基因株系伴随的SN03转基因株系、SN01转基因株系和野生型(图20B)系中的三个在HSM培养基中生长，5％二氧化碳，在空气环境中有恒定的光照，直到细胞达到对数晚期。1-2L的细胞通过离心收获，并根据修改的BlighDyer方法通过甲醇/甲基-叔丁乙醚萃取以分析总重量脂类(如Matyash V.，等人(2008)Journal of Lipid Research 49:1137-1146)。

具体地，使生物质沉淀并除去过剩水量。加入甲醇后，剧烈摇晃样本以裂解细胞。加入MTBE，将样本再摇晃一段较长的时间(大约1小时)。摇晃后，将水加入样本得到4:1.2:1的比率；分别是MTBE:MeOH:水。将样本离心以帮助相分离。除去有机层，第二次重复过程。只加入MTBE，第三次萃取样本；将样本摇晃、离心，并如上所述相分离。合并有机层，用硫酸镁干燥、过滤并浓缩到称重的小瓶中。使用样本的无灰干重计算可萃取的百分数。

图20A和B示出了数据点，具有以平均值+/-标准差的误差条。y轴表示可萃取的百分数，x轴表示上面描述的菌株。样本在p<0.05不同于星形标记的野生型。SN03株系具有比野生型株系更多的脂质。

图45A是附加的示例，其示出了SN03过表达株系比野生型积聚更多的脂质。野生型莱茵衣藻细胞培养在TAP的1-2L含有7.5mM的NH₄Cl的培养基，在空气环境中，有恒定光照下，直到细胞达到早期对数期。在3000-5000xg下离心培养物5-10分钟，一半培养物用100-500mL的TAP清洗，另一半用不包含氮的100-500mL的TAP清洗。再次离心分离，两种培养物再悬浮在一定体积中，其相当于起始培养体积。另外，两个SN03过表达株系生长在1-2L的含有7.5mM的NH₄Cl的TAP培养基中，在空气环境中有恒定的光照，直到细胞达到早期对数期。在野生型培养物氮饥饿2-3天后，细胞通过离心收获，并根据修改的BlighDyer方法通过甲醇/甲基-叔丁乙醚萃取以分析总重量脂类(如Matyash V.，等人(2008)Journal of Lipid Research 49:1137-1146)。图45A示出了数据点，具有以平均值+/-标准差的误差条。y轴表示可萃取的百分数，x轴表示上面描述的菌株。样本在p<0.05不同于星形标记的野生型。SN03株系具有比野生型株系更多的脂质，在缺氮的条件下具有堪比野生型的水平。

图21比较了取自图20a描述的样本的MTBE:MeOH提取物的1-D的1HNMR光谱(野生型、SN3基因阳性，和氮饥饿)。在收集NMR波谱之前将样本溶于CDCl₃。

氮气充足的野生型、SN3-34，和氮饥饿野生型培养物的MTBE:甲醇提取物的1D质子NMR波谱的比较。相对积分差异的波峰标有箭头。从氮充足的野生型到SN3-34的积分面积的方向的改变为每个波峰的左箭头所示。从氮充足的野生型到氮饥饿野生型的积分面积的方向的改变为每个波峰的右箭头所示。对于大多数波峰，峰面积的变化方向(组分浓度相对增加或减小)与进行氮应激和SN3-34过表达的的野生型是相同的。

这些图显示了SN03的脂质分布类似于来自氮饥饿培养的油的分布，虽然两者都不同于来自野生型培养物的油。这表明氮应激反应通过过表达SN03已经开启。

对于大多数波峰，峰面积的变化方向与表达SN3的细胞或经历氮应激的细胞是相同的。

图22A和B是来自图21的密集的NMR波峰。SN03和饥饿油样本是相似的，并且两者都不同于野生型油。同样SN03株系模拟了应激响应。饱和的亚甲基波峰出现在1.27ppm，末端甲基波峰出现在0.88ppm。饥饿野生型和SN03-34光谱彼此相似(相对于非饥饿野生型)。野生型饥饿(B)，野生型充足(C)，和SN3-34充足(A)在2.8ppm归一化到波峰。氮充足野生型、氮饥饿野生型，和SN03-34MTBE:甲醇萃取物质子NMR光谱在CDCl₃中的比较。SN3-34光谱(A)和野生型饥饿(B)在大多数峰值位置是类似的，而野生型充足(C)是不同的。的比较

图27是HPLC数据，显示存在或不存在氮的条件下生长的SN03过表达株系萃取的油的MTBE和野生型莱茵衣藻萃取的油的MTBE之间的差异。在反相HPLC法C18柱上进行MTBE萃取油脂质。流动相为乙腈/水/THF，10分钟内运行，流速0.9mL/min。检测是经由蒸发光散射检测器(ELSD)。这三个色谱图是用样本名称标记，包括在氮存在下生长的野生型(WT N+)，SN03过表达株系(SN03)，和在无氮条件下生长的野生型(WT N-)。代表分子类别的每组峰标记在迹线的底部(Chlorphylides，急性脂质，脱镁叶绿素和TAG)和叶绿素A(Ch1-A)和叶绿素B(Ch1-B)的波峰被标记在顶部。y轴是表示充裕的ELSD信号，而x轴表示HPLC柱保留时间(以分钟计)。

无论是在TAP或HSM培养基中生长，三个SN03过表达株系中的生长速率上没有显示出相对于野生型的显著差异。图23A和B显示了五种不同的SN03的生长速率，在TAP培养基中生长，在空气环境下有恒定的光照，并与不包含SN基因(基因缺失)的转基因株系、一个SN01转基因株系和野生型进行比较。图23C示出了三个SN03过表达株系的生长速率，在HSM培养基中生长，含5％二氧化碳，空气环境下有恒定的光照，并与不包含SN基因(基因缺失)的转基因株系、SN01转基因株系和野生型进行比较。将一式三份在旋转摇动器上的5ml试管中培养4-5天。一天1-2次采用750nm的光密度，基于所测OD的自然对数，生长速率计算为生长曲线的线性部分的斜率。该生长速率在y轴上示出。x轴代表所用的不同的株系。

图45B是附加的示例，示出了在SN03过表达株系中生长速率与野生型相当。野生型莱茵衣藻和一个SN03过表达株系在10-100mL的HSM培养基中生长，5％二氧化碳，在空气环境中有恒定的光照，直到培养到对数期中期。将细胞按1∶100稀释，置入含200μL的HSM的96孔板的12到24个孔。将细胞在含5％二氧化碳、空气生长环境中、恒定光照下培养到对数中期。一天1-2次采取750nm的光密度，生长速率为线性部分的斜率计算出生长曲线的基于所测OD的自然对数。该生长速率在y轴上示出。x轴代表所用的不同菌株。

图45C示出了SN03过表达株系的承载量与野生型类似。野生型莱茵衣藻细胞和SN03过表达株系培养在0.5-2.0μL的HSM培养基中，5％二氧化碳，在空气环境中有恒定的光照，直到细胞达到早期对数期。培养物在3000-5000xg下离心5-10分钟，将一半培养物用100-500mL的HSM清洗，另一半用不包含氮的100-500mL的HSM清洗。再次离心分离后，将两种培养物重悬在一定体积的培养基(HSM或不含氮的HSM)，其相当于起始培养体积。然后将细胞培养在5％二氧化碳下，在空气环境中有恒定的光照，直到细胞达到早期稳定期。通过离心收获15mL的培养物，并测定无灰干重(AFDW)。以g/L表示的AFDW示出在y轴，x轴表示所用的菌株。SN03菌株的承载量类似于在氮存在下的野生型，并且其在无氮条件下生长的野生型和SN03过表达株系中降低。

图45D示出野生型和SN03过表达株系中的总叶绿素水平是相当的，野生型和SN03过表达株系在无氮条件下生长时具有降低的叶绿素。野生型莱茵衣藻细胞和SN03过表达株系培养在50-500mL的HSM的培养基中，5％二氧化碳，在空气环境中有恒定的光照，直到细胞达到早期对数期。培养物在3000-5000xg下离心5-10分钟，将一半培养物用100-500mL的HSM清洗，另一半用不包含氮的100-500mL的HSM清洗。再次离心分离后，将两种培养物重悬在一定体积的培养基(HSM或不含氮的HSM)，其相当于起始培养体积。然后将细胞在5％二氧化碳下，在空气环境中有恒定的光照，再培养2天。通过离心收获1-2mL的培养物。在甲醇中萃取细胞，并利用光谱方法测定叶绿素水平(LICHTENTHALER Chlorophylls and Carotenoids:Pigments ofPhotosynthetic Biomembranes，Meth Enzymol(1987)第148卷，第350-382页)。培养物在750nm的光密度(OD)用于归一化至细胞密度。叶绿素水平显示在y轴上，x轴表示所用的株系。

图24示出RNA从SN03转基因中转录。野生型莱茵衣藻细胞以及5种SN03过表达株系在100-500mL的TAP培养基中，在空气环境中有恒定的光照，培养至细胞达到早期对数期。从野生型和5种SN03过表达株系中制备总RNA。使用0.25-1.0ug的RNA进行iScript cDNA合成(BioRad，美国)，执行使用iQ SybrGreen(BioRad，美国)检测的标准qPCR。通过使用引物的qPCR测定相对RNA水平，引物对转基因SN03进行扩增(四个单独的引物集合：SN03-1，2，3，4，由图24所示的每一组的四个柱表示(SEQ ID NO:24-31)。使用莱茵衣藻核糖体蛋白质L11，执行使用SybrGreen检测的标准qPCR，用于样本之间的归一化。L11RNA的特异引物是SEQ ID NO:22和23。在y轴上的RNA水平涉及平均SN03表达(每组5种株系的水平归一化的平均值为100)。转基因是优化莱茵衣藻中的核表达的密码子，所以没有检测到内源基因。在不同转基因株系之间有一些变化，但是，总体上，绝对表达水平全面地高(在qPCR中基于Ct值的主观评估)。x-轴表示SN03过表达株系(即，26＝SN03-26，11＝SN03-11等)。

图44B是附加的示例，其示出了RNA从SN03转基因中转录。野生型莱茵衣藻细胞以及5种SN03过表达株系的在100-500mL的TAP培养基中，在空气环境中有恒定的光照，培养至细胞达到早期对数期。从野生型和5SN03过表达株系中制备总RNA。使用0.25-1.0ug的RNA进行iScript cDNA合成(BioRad，美国)，并执行使用iQ SybrGreen(BioRad，美国)检测的标准qPCR。通过使用引物的qPCR测定相对RNA水平，引物对转基因SN03进行扩增。使用莱茵衣藻核糖体蛋白质L11，执行使用SybrGreen检测的标准qPCR，用于样本之间的归一化。在x轴上的RNA水平上的表达涉及平均SN03株系的表达(五种株系的每个的水平归一化至设定为1.0的株系SN03-34的水平)。转基因是优化莱茵衣藻中的核表达的密码子，所以没有检测到内源基因。在不同转基因株系之间有一些变化，但是，总体上，绝对表达水平是全面地高(在qPCR中基于Ct值的主观评估)。y轴表示SN03过表达株系。

图25示出了SN03过表达株系中检测SN03蛋白质(42kDa)。伴随不包含SN基因(基因缺失)的转基因株系的SN03转基因株系中的三个、一种SN01转基因株系和野生型培养在50-200mL的TAP，以3000-5000xg离心5-10分钟，并准备用于Western免疫印迹法。该SN03蛋白质具有连接的FLAG-MAT标记。一种连接有FLAG-MAT标记的过表达BD11(木聚糖酶)的菌株用做阳性对照。一种抗FLAG的抗体在样本被镍柱拉下后用来检测标记的蛋白，在十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)上运行并转移到尼龙膜。SN3#32、SN3#34和SN3#11在SN03蛋白质的正确的尺寸处显示出条带。也检测到BD11阳性对照。

图44A是附加的示例，其示出了在SN03过表达株系中检测到SN03蛋白质(42kDa)。伴随野生型的SN03过表达株系生长在50-200mL的TAP，以3000-5000xg离心5-10分钟，并准备用于Western免疫印迹法。该SN03蛋白质具有连接的FLAG-MAT标记。一种连接有FLAG-MAT标记的细菌碱性磷酸酶蛋白质(BAP)用做阳性对照。一种抗FLAG的抗体在样本被镍柱拉下后用来检测标记的蛋白，在十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)上运行并转移到尼龙膜。SN03-34显示了两个条带。上面的条带是通过2A肽连接的博莱霉素结合蛋白质和SN03蛋白质的融合。下面的条带仅是SN03蛋白质。2A介导的融合蛋白质已经被描述(Donnelly等人，分析口蹄疫病毒2A/2B多蛋白的“裂解”机制不仅指示蛋白水解反应，还有新的转化效果：假定的核糖体“跳过”，遗传病毒学杂志(2001)第82(Pt5)卷，第1013-25页)。也检测到BAP阳性对照。

实施例7：SN03转基因株系的RNA转录组学和附加的氮应激反应相关基因的鉴定。

氮饥饿导致衣藻属的基因表达变化，其中的一些子集负责观察到的提高的脂质表型。SN03，作为假定转录因子，在氮饥饿时被上调，并且很可能涉及控制基因表达的一些改变。SN03的过表达导致提高的脂质表型。因此，我们研究了过表达SN03的转基因株系细胞中相应的基因表达水平。我们预期这种基因(其表达通过SN03转基因的过表达修改)将是被氮饥饿影响的基因的一个子集。这个数据将帮助我们理解SN03蛋白质作用于哪些下游途径以产生更多的脂质。

三个过表达SN03的莱茵衣藻株系中在0.5-2L HSM培养基中，5％二氧化碳下，在空气环境中有恒定的光照，培养至细胞达到早期对数期。通过在3000-5000xg下离心5-10分钟收获50-100mL细胞，并从培养物中纯化出RNA。采用在转录组测序分析方法中使用的标准Solexa方法对RNA进行测序(Sequensys，Inc，LaJolla，CA)。使用Arraystar软件(DNASTAR，美国)将序列映射到JGI莱茵衣藻版本3.0或4.0版的转录组。以下在表4中给出生成用于三个RNA样本的Solexa 36个碱基对读数的总数。显示的还有那些每个样本中成功地映射到莱茵衣藻转录组的读数的数量(具有聚体采样数的总读数)和映射到转录组的总命中百分数。

表4

图36示出SE0050中的所有16，000+基因的图，其中表达水平来自每个轴线上的不同样本。这里示出的指数生长+氮(x-轴)对指数生长6H-氮(y-轴)。表达水平不变的基因在对角线上；6小时氮饥饿后，那些在对角线以上的被上调，6小时的氮气饥饿后，那些在对角线以下的被下调。该白色数据点代表在SN03过表达株系中的表达相对于野生型有至少4倍的增加。许多在SN03过表达株系中上调的基因在6小时的氮饥饿后也被上调(以对角线上方的白点表示)。然而，有一些在SN03过表达株系中上调的基因在6小时的氮饥饿气后也被下调节(以对角线下方的白点表示)。

图37示出SE0050中的所有16,000+基因的图，其中表达水平来自每个轴线上的不同样本。这里示出的指数生长+氮(x-轴)对指数生长6H-氮(y-轴)。表达水平不变的基因在对角线上；6小时氮饥饿后，那些对角线以上的被上调，6小时的氮气饥饿后，那些对角线以下的被下调。该白色数据点代表在SN03过表达株系中的表达相对于野生型有至少4倍的增加。许多在SN03过表达株系中下调节的基因在6小时的氮饥饿后也被下调(以对角线下方的白点表示)。然而，有一些在SN03过表达株系中下调节的基因在6小时的氮饥饿气后也被上调(以对角线上方的白点表示)。

图38显示内源性SN03转录物和转基因SN03转录物的RNA水平。在氮饥饿野生型莱茵衣藻和三个SN03过表达株系(在x轴上所表示的菌株和条件)的时间进程中，表达水平(以log2比例表示在y轴上)通过来自转录组测序数据的DANASTAR Arraystar软件测定。由于内源性和转基因SN03序列相似但不相同(由于密码子优化)，Arraystar软件不能100％准确地将读数分配给转录物。该转基因SN03的转录物不存在于野生型样本中，如野生型样本表达的低表达水平和SN03过表达株系中的高水平所示。在氮饥饿时内源性SN03表达的诱导在氮饥饿野生型样本中证明。

图39表示内源性SN03转录物和转基因SN03转录物的RNA水平，如图38所示。y轴表示RNA表达水平(log2比例)，并且每一组两列表示所用的菌株和条件。每组中左列是转基因SN03 RNA的表达水平，每组中的右列是内源性SN03 RNA的表达水平。该转基因SN03转录物不存在于野生型样本中，如野生型样本表达的低表达水平和SN03过表达株系中的高水平所示。在氮饥饿时内源性SN03表达的诱导在氮饥饿野生型样本中证明。

此转录组测序数据被用于确定候选基因列表以用于进一步理解SN03过表达的影响和附加的靶基因鉴定。Solexa从野生型莱茵衣藻的氮饥饿时间过程(以上实施例3中所述)，从三个SN03过表达株系测序的RNA使用DNASTAR Arraystar被映射到JGI莱茵衣藻的转录组。

使用Arraystar软件对具有相关的基因表达模式的集合进行鉴定。235个基因被认定是在一个或多个氮饥饿样本中至少4倍上调以及在至少1种SN03过表达菌株中至少4倍的上调。191个基因被认定是在一个或多个氮饥饿样本中至少4倍下调以及在至少1种SN03过表达株系中至少4倍下调。134个基因被认定是在一个或多个氮饥饿样本中至少4倍上调以及在至少1种SN03过表达株系中至少4倍下调。38个基因被认定是在一个或多个氮饥饿样本中至少4倍下调以及在至少1种SN03过表达株系中至少4倍上调。

如图40所示，使用另一种方法来分析转录组测序数据。此图显示在氮饥饿期间和三种SN03过表达菌株中的基因表达动力学(指数+氮和6H、24H、48H-氮)。每一行代表一种基因，在每种情况下，y轴是表达水平，而x轴表示7种测序的样本。这八个曲线图表示在7种样本表示的条件下具有相似的表达模式的基因。这里的大多数曲线图表示成组的基因通过氮饥饿进行上调，但是不通过SN03过表达进行上调。

如通过本方法鉴定出来的基因的例子所述，至少五种已知的具有组蛋白的KOG的功能注解的基因(组蛋白H2B或组蛋白H3和H4)显示成由两个氮被向上和/或向下调节饥饿和SN03的过表达。这些是来源于SN03过表达株系的表达模式的例子，可用来理解氮饥饿途径。这些基因和它们的表达模式如下：JGI蛋白质ID 97703：在氮饥饿中上调9倍、在SN03过表达株系中上调82倍；JGI蛋白质ID 170323：在氮饥饿中上调89倍、在SN03过表达株系中上调40倍；JGI蛋白质ID 115268：在氮饥饿中下调5倍、在SN03过表达株系中下调45倍；JGI蛋白质ID 167094：在氮饥饿中下调79倍、在SN03过表达株系中下调22倍；和JGI蛋白质ID 100008：在氮饥饿中上调4倍、在SN03过表达株系中上调9倍。

基于氮饥饿的表达模式，将莱茵衣藻中的101个基因(包括SN03)鉴定为过表达候选物。所选基因在一个或多个氮饥饿时间点显示提高至少4倍的表达。这些表达模式见表5。

基因	氮6H	氮24H	氮48H
				SN01	88.752上调	15.531上调	62.340上调
SN02	41.497上调	37.269上调	36.091上调
				SN03	41.264上调	30.110上调	29.339上调
SN04	31.458上调	11.010上调	17.677上调
				SN05	52.070上调	67.896上调	51.691上调
SN06	287.371上调	441.829上调	259.971上调
				SN07	18.037上调	12.886上调	12.791上调
SN08	7.309上调	5.075上调	10.000上调
				SN09	5.066上调	11.644上调	7.857上调
SN10	6.966上调	8.677上调	6.383上调
				SN11	5.913上调	31.364上调	20.842上调
SN12	14.575上调	8.589上调	16.036上调
				SN13	13.173上调	25.081上调	9.285上调
SN14	17.778上调	17.915上调	21.579上调
				SN15	30.605上调	12.024上调	4.794上调
SN16	11.456上调	18.052上调	10.770上调
				SN17	5.066上调	4.478上调	5.714上调
SN18	15.940上调	49.319上调	22.473上调
				SN19	7.853上调	7.263上调	6.517上调
SN20	114.541上调	108.572上调	178.571上调
				SN21	6.920上调	8.556上调	10.075上调
SN22	57.203上调	90.071上调	23.653上调
				SN23	7.245上调	6.454上调	6.456上调
SN24	1474.950上调	593.660上调	1.179下调
				SN25	216.831上调	460.015上调	305.683上调
SN26	291.979上调	3.249下调	1.179下调
				SN27	5.991上调	11.728上调	5.190上调

SN28	12.447上调	11.003上调	8.774上调
				SN29	11.202上调	83.572上调	34.765上调
SN30	13.173上调	4.478上调	7.142上调
				SN31	9.119上调	8.061上调	6.428上调
SN32	6.789上调	18.005上调	33.501上调
				SN33	16.603上调	24.461上调	14.230上调
SN34	12.499上调	6.443上调	5.714上调
				SN35	18.642上调	16.479上调	4.380上调
SN36	23.312上调	13.738上调	10.955上调
				SN37	545.960上调	202.386上调	37.242上调
SN38	5.964上调	4.853上调	4.919上调
				SN39	23.306上调	31.351上调	37.857上调
SN40	7.093上调	20.026上调	14.285上调
				SN41	6.305上调	4.279上调	6.428上调
SN42	274.981上调	121.538上调	323.051上调
				SN43	454.842上调	185.401上调	165.816上调
SN44	9.119上调	12.540上调	5.312上调
				SN45	10.900上调	9.635上调	15.366上调
SN46	70.277上调	14.671上调	81.893上调
				SN47	8.673上调	23.000上调	6.113上调
SN48	395.398上调	279.617上调	222.969上调
				SN49	21.115上调	46.663上调	14.884上调
SN50	6.055上调	16.059上调	25.611上调
				SN51	4.190上调	4.310上调	10.541上调
SN52	9.292上调	4.117上调	11.058上调
				SN53	18.773上调	16.594上调	15.438上调
SN54	4.053上调	4.926上调	4.285上调
				SN55	9.307上调	6.270上调	7.857上调
SN56	10.639上调	17.019上调	14.285上调

SN57	2.154下调	78.354上调	31.240上调
				SN58	6.810上调	7.804上调	4.051上调
SN59	11.667上调	3.249下调	1.179下调
				SN60	153.284上调	27.734上调	7.496上调
SN61	10.745上调	21.220上调	44.479上调
				SN62	4.693上调	1.791上调	2.515上调
SN63	2.154下调	15.987上调	12.748上调
				SN64	2.020上调	5.778上调	3.952上调
SN65	2.364上调	3.390上调	9.523上调
				SN66	5.066上调	3.583上调	7.142上调
SN67	23.051上调	12.422上调	13.675上调
				SN68	8.106上调	10.338上调	10.386上调
SN69	13.582上调	13.037上调	9.835上调
				SN70	180.585上调	212.843上调	127.292上调
SN71	2.154下调	14.433上调	11.509上调
				SN72	14.630上调	25.865上调	61.875上调
SN73	162.405上调	239.269上调	76.318上调
				SN74	20.629上调	9.117上调	1.179下调
SN75	7.600上调	1.343上调	1.071上调
				SN76	4.446上调	11.433上调	4.714上调
SN77	4.867上调	10.732上调	4.271上调
				SN78	180.813上调	3.249下调	1.179下调
SN79	72.681上调	107.626上调	64.366上调
				SN80	57.203上调	90.071上调	23.653上调
SN81	51.267上调	60.425上调	24.092上调
				SN82	47.870上调	3.249下调	8.435上调
SN83	41.743上调	34.061上调	1.179下调
				SN84	34.438上调	14.433上调	13.134上调
SN85	33.749上调	52.208上调	11.894上调

SN86	30.210上调	3.249下调	3.549上调
				SN87	21.092上调	11.184上调	1.179下调
SN88	13.173上调	9.853上调	2.857上调
				SN89	11.724上调	41.454上调	8.264上调
SN90	11.711上调	5.151上调	8.216上调
				SN91	11.146上调	1.116下调	1.428上调
SN92	11.146上调	9.853上调	2.142上调
				SN93	10.421上调	3.249下调	1.179下调
SN94	8.444上调	5.075上调	8.809上调
				SN95	8.294上调	4.360上调	1.463上调
SN96	7.155上调	5.862上调	2.516上调
				SN97	7.093上调	1.116下调	1.428上调
SN98	7.061上调	10.690上调	8.524上调
				SN99	6.966上调	8.677上调	6.383上调
SN100	6.766上调	5.981上调	1.179下调
				SN101	6.079上调	1.194上调	1.377下调

此外，基于氮饥饿和SN03过表达中的表达模式，将在莱茵衣藻中的30种基因鉴定为过表达候选物。在两种SN03过表达株系(SN03-48和SN03-41)中，所选基因显示提高至少4倍的表达。这些表达水平见表6。

这些131个应激反应靶的ORF(描述在下表中)是使用莱茵衣藻细胞核密码子使用表优化的每个密码子，并合成。131个靶的DNA构建体分别克隆到核过表达载体Ble2A(如图34、图63，或者图64所示)，并转化到SE0050。这种构建体会导致产生一种RNA。该RNA带有编码选择蛋白质的核苷酸序列(Ble)和编码感兴趣的蛋白质的核苷酸序列(SN01-SN137)。这两个蛋白质的表达是由病毒肽2A连接(例如，如Donnelly等人，遗传病毒学杂志(2001)，第82(Pt5)卷，第1013-25页)。蛋白质序列有助于表达来自单个mRNA的这两个多肽。将131个基因描述在下表7中。也对数个所述基因提供序列标识符。

表7

实施例8：SN基因的克隆和转基因株系的产生

因为氮利用率途径的重要性不仅在于脂质生产而且在于生长、光合作用和生产率，已对氮应激途径进行进一步的研究。基于氮饥饿和SN03过表达转录组学选择100多额外的基因，这些基因中每个基因的改造如衣藻中过表达细胞株系，如上所述。用于克隆和转化的所述载体为核转化载体Ble2a(如图34所示)。另外，使用的其他载体是基于图34所述的载体，附加有巴龙霉素的第二选择盒和加入FLAG-Mat蛋白质标记(图63和图64)。上面的表7列出了用于每个SN基因的载体。结果，创建SN基因中每一个的至少12个独立转基因株系。

实施例9：脂质表型筛选

从氮饥饿和SN03过表达转录组学中鉴定出131种靶基因。每个转基因的多个株系筛选出脂质含量和/或分布的变化。通过脂类染料(Guava筛选数据)和通过化学提取(脂质筛选数据)的筛选是用来识别具有潜在脂质表型的初始组的转基因。通过这些假定的获胜者进行更严格的化学提取(脂质提取数据)。

在莱茵衣藻中影响脂质积累、含量和/或分布的基因列于表8中，以及联合基因组研究所(JGI)蛋白质ID和功能注释。表8中还包括基因的序列鉴别号码。

表8.脂质性状基因

在下面的表9中提供一列密码子最优化的基因序列(SEQ ID NO表示)，其分别克隆到Ble2A表达构建体中。

SN02(SEQ ID NO:63)
	SN03(SEQ ID NO:69)
SN08(SEQ ID NO:75)
	SN09(SEQ ID NO:81)
SN11(SEQ ID NO:87)
	SN21(SEQ ID NO:93)
SN26(SEQ ID NO:99)
	SN39(SEQ ID NO:105)
SN71(SEQ ID NO:111)
	SN75(SEQ ID NO:117)
SN80(SEQ ID NO:123)
	SN81(SEQ ID NO:129)
SN84(SEQ ID NO:135)
	SN87(SEQ ID NO:141)
SN91(SEQ ID NO:147)
	SN108(SEQ ID NO:153)
SN110(SEQ ID NO:159)
	SN120(SEQ ID NO:165)
SN124(SEQ ID NO:171)

实施例10:微萃取-脂质筛选数据

所有株系都使用一种快速微萃取方法进行筛选。培养物培养在96孔块，并通过离心沉淀。每个8x12块代表一系列8个单独SN基因的12种转基因株系。将溶剂混合物(由乙腈(35％)、甲醇(26％)、四氢呋喃(9％)和甲基-叔丁基乙醚(30％)组成)中的颗粒状的生物质通过超声处理萃取。离心萃取混合物，上清液使用ELSD经过HPLC分析，筛选相对于野生型对照的脂质积累和叶绿素产生的变化。

如下所示的是候选获胜者的数据。装仓各类分子以进行分析，表中的值表示在高效液相色谱谱图上的曲线下方的总计面积。行表示单个转基因株系。任何增加的分子类型都以画下划线表示，包含96种菌株的整个板的平均值起始于2x，代表最多8种SN基因(列在每一组的第一行，“池平均值”)。各列中表示分子类型：血红素(脱植基叶绿素和相关的极性分解产物)、极性(极性脂质)、Chlor b(叶绿素b)、Chlor a(叶绿素a)、脱镁叶绿素和TAG(三酰基甘油，也包括二酰基甘油)。

基因混合物#1

样本	血红素	极性	叶绿素b	叶绿素a	脱镁叶绿素	TAG
							池平均值	3.319	3.821	2.439	0.013	0.059	0.007
SN26.1	3.690	7.210	2.901	0.017	0.139	0.000
							SN26.2	2.895	6.409	3.198	0.000	0.147	0.015
SN26.3	6.839	4.283	1.890	0.000	0.038	0.000
							SN26.4	1.087	2.376	1.712	0.006	0.063	0.004
SN26.5	6.797	2.829	0.754	0.000	0.007	0.000
							SN26.6	25.662	0.752	0.138	0.000	0.000	0.000
SN26.7	3.707	5.691	5.431	0.017	0.055	0.000
							SN26.8	3.291	4.006	4.110	0.004	0.047	0.000
SN26.9	4.646	4.674	4.063	0.007	0.021	0.000
							SN26.10	5.607	4.878	3.740	0.003	0.020	0.000
SN26.11	7.210	4.864	5.263	0.018	0.067	0.007
							SN26.12	3.534	7.320	8.287	0.020	0.250	0.014
SN71.1	1.788	3.947	1.699	0.000	0.084	0.018
							SN71.2	1.405	2.828	1.282	0.000	0.073	0.018
SN71.3	1.181	2.331	0.859	0.000	0.038	0.000
							SN71.4	0.762	1.741	1.349	0.000	0.058	0.000
SN71.5	1.003	2.127	1.412	0.000	0.028	0.002
							SN71.6	1.446	3.037	1.064	0.000	0.119	0.053

SN71.7	2.013	4.366	1.799	0.000	0.046	0.015
							SN71.8	1.929	3.931	1.656	0.000	0.090	0.002
SN71.9	2.094	3.961	1.350	0.000	0.102	0.038
							SN71.10	1.735	3.848	1.160	0.000	0.129	0.000
SN71.11	2.363	4.841	1.464	0.000	0.104	0.000
							SN71.12	2.360	5.930	2.781	0.000	0.117	0.000
SN75.1	3.020	6.308	2.458	0.000	0.032	0.018
							SN75.2	2.306	4.835	1.469	0.000	0.135	0.005
SN75.3	2.211	3.934	2.147	0.000	0.044	0.007
							SN75.4	1.091	3.100	1.964	0.000	0.080	0.000
SN75.5	1.319	2.555	1.641	0.000	0.065	0.014
							SN75.6	1.977	4.034	1.789	0.000	0.083	0.014
SN75.7	2.536	4.954	1.335	0.040	0.165	0.021
							SN75.8	2.442	5.158	2.840	0.128	0.000	0.013
SN75.9	2.558	4.852	2.349	0.074	0.043	0.004
							SN75.10	2.108	1.402	1.700	0.119	0.073	0.008
SN75.11	2.428	4.401	2.047	0.164	0.097	0.004
							SN75.12	2.533	5.835	2.012	0.000	0.115	0.019

基因混合物#2

样本	血红素	极性	叶绿素b	叶绿素a	脱镁叶绿素	TAG
							池平均值	1.595	1.844	0.932	1.270	0.142	0.016
SN02.1	0.244	0.915	0.681	0.981	0.168	0.105
							SN02.2	0.198	0.348	0.441	0.806	0.103	0.064
SN02.3	0.701	0.924	1.147	1.659	0.606	0.000
							SN02.4	1.143	1.274	0.988	1.212	0.249	0.122
SN02.5	2.023	1.811	0.658	0.661	0.237	0.096
							SN02.6	0.918	0.271	0.444	0.588	0.143	0.089
SN02.7	0.402	0.742	0.512	0.783	0.113	0.048
							SN02.8	1.150	1.363	1.059	1.298	0.370	0.112
SN02.9	0.590	1.104	0.818	0.977	0.130	0.007
							SN02.10	0.590	1.771	0.964	1.536	0.204	0.124
SN02.11	0.362	0.589	0.512	1.059	0.119	0.081
							SN02.12	1.574	1.377	0.256	0.396	0.052	0.037
SN21.1	0.858	1.185	1.076	1.441	0.363	0.089
							SN21.2	0.669	1.121	0.963	1.420	0.330	0.104

SN21.3	0.392	0.678	0.619	0.978	0.152	0.033
							SN21.4	1.370	1.974	1.317	1.765	0.457	0.131
SN21.5	1.093	1.768	1.034	1.438	0.252	0.107
							SN21.6	1.940	1.074	0.416	0.345	0.106	0.031
SN21.7	1.071	0.585	0.906	1.273	0.326	0.202
							SN21.8	1.543	1.810	1.443	1.628	0.511	0.220
SN21.9	0.681	0.185	0.415	0.597	0.128	0.070
							SN21.10	0.280	0.370	0.440	0.809	0.125	0.049
SN21.11	0.702	0.957	0.855	1.270	0.313	0.112
							SN21.12	1.270	2.226	1.296	1.520	0.458	0.168

基因混合物#7

基因混合物#9

样本	血红素	极性	叶绿素b	叶绿素a	脱镁叶绿素	TAG
							池平均值	3.784	2.166	1.776	2.488	0.272	0.008
SN08-1	2.455	2.088	1.606	2.377	0.181	0.000
							SN08-2	3.042	1.566	1.709	2.492	0.354	0.000
SN08-3	3.162	1.560	2.037	2.495	0.352	0.000
							SN08-4	3.301	0.221	0.681	0.624	0.038	0.000
SN08-5	2.607	1.868	2.466	3.505	0.451	0.011
							SN08-6	1.528	0.448	0.977	1.595	0.090	0.000
SN08-7	2.277	0.490	0.912	1.417	0.126	0.000
							SN08-8	2.419	0.248	0.688	0.941	0.091	0.000
SN08-9	3.239	1.411	1.161	2.122	0.339	0.000
							SN08-10	3.317	2.158	2.252	3.005	0.332	0.015
SN08-11	2.563	1.680	2.058	3.174	0.558	0.013
							SN08-12	1.464	0.227	1.251	2.353	0.314	0.000
SN09-1	6.896	2.145	1.327	2.080	0.231	0.000
							SN09-2	2.736	1.665	1.558	2.061	0.182	0.005
SN09-3	1.190	0.190	0.521	0.908	0.086	0.000
							SN09-4	1.884	0.523	0.763	1.286	0.160	0.000
SN09-5	1.985	1.897	1.951	2.778	0.453	0.000

SN09-6	2.771	1.595	0.000	0.000	0.000	0.000
							SN09-6	1.778	2.764	3.032	0.000	0.658	0.000
SN09-7	2.504	0.626	0.964	0.988	0.272	0.000
							SN09-8	1.485	2.164	2.125	2.457	0.458	0.000
SN09-9	1.708	2.117	1.942	2.398	0.363	0.000
							SN09-10	1.890	2.030	1.808	1.646	0.280	0.000
SN09-11	18.052	2.876	1.495	0.378	0.057	0.000
							SN09-12	3.671	3.957	3.279	3.605	1.140	0.000
SN87-1	9.955	3.795	2.607	3.486	0.252	0.010
							SN87-2	0.876	0.000	0.000	0.000	0.000	0.000
SN87-3	3.075	3.874	3.035	4.399	0.447	0.009
							SN87-4	7.170	0.446	1.125	1.393	0.036	0.000
SN87-5	5.386	5.498	3.864	5.486	0.464	0.019
							SN87-6	5.445	3.567	2.882	4.436	0.235	0.024
SN87-7	3.513	1.449	1.678	2.014	0.102	0.004
							SN87-8	4.734	4.793	2.935	4.426	0.338	0.015
SN87-9	4.203	5.097	3.170	5.184	0.546	0.015
							SN87-10	2.460	2.770	2.244	3.097	0.358	0.017
SN87-11	6.682	1.403	1.294	2.254	0.164	0.010
							SN87-12	3.839	0.297	0.362	0.601	0.033	0.016
SN91-1	19.524	1.885	1.941	2.691	0.214	0.017
							SN91-2	3.246	0.594	1.314	1.897	0.131	0.000
SN91-3	4.680	3.879	3.776	4.550	0.738	0.025
							SN91-4	2.703	2.151	1.721	2.500	0.277	0.012
SN91-5	3.691	3.570	2.779	3.808	0.296	0.018
							SN91-6	2.741	2.517	2.054	2.794	0.531	0.015
SN91-7	4.950	1.391	1.266	2.034	0.146	0.013
							SN91-8	4.644	3.338	2.575	3.455	0.435	0.022
SN91-9	2.690	2.986	2.426	3.374	0.502	0.021
							SN91-10	1.908	1.728	1.697	2.425	0.345	0.013
SN91-11	4.391	3.446	2.716	3.938	0.528	0.021
							SN91-12	3.157	3.684	3.130	4.037	0.950	0.029

基因混合物#10

基因混合物#11

基因混合物#12

实施例11:Guava筛选数据

一种基于脂类染料的试验也用于筛选SN基因株系的脂质含量。分析流式细胞术(Guava)是对荧光的直接测量，在培养物分别用三种脂类染料(Bodipy、尼罗红和Lipid TOX green)染色时使用荧光。对于细胞中不同脂质成分，所有三种染料是亲脂性的、特异性的、但并非是限定的亲和性。使用的三种不同染料给出更宽范围的可能的脂质表型(可以观察到)。令人感兴趣的是改变脂质总量的基因，而且是那些通过影响脂质的子集改变脂质分布的基因。测量每个单独的菌株，并与野生型莱茵衣藻样本对照进行比较。在Guava筛选中基于它们相对于野生型对照的性能来确定获胜者。代表性数据见图53、图54、图55和图56。

实施例12：脂质萃取数据

来自Guava筛选数据和快速微萃取的潜在的获胜者(脂质筛选数据)被选择用于附加的基于试验的附加萃取。在两次筛选之后选择的转基因株系中，选择出20种，使用小规模萃取结合LC-MS/MS用于更深入的分析，以识别主要脂质以及叶绿素及其分解产物。将约1L的培养培育，并且收获的生物质进行干燥，以及在溶剂混合物(由乙腈(35％)、甲醇(26％)、四氢呋喃(9％)和甲基-叔丁基乙醚(30％)组成的)通过超声波处理来萃取。在氮气流下蒸发溶剂后，经重量分析测定脂质产率。将萃取的油用HPLC-MS/MS来分析脂质产生相对于野生型对照的变化。

在比较野生型对照和氮饥饿野生型样本中，可以很容易地看出：三酰基甘油(TAG的)显著增加，而且叶绿素a与叶绿素b的生产如所期望的一样降低。具有最高的TAG的(是野生型的2倍以上)两个株系SN120和SN91都具有降低的叶绿素a和b水平，符合氮饥饿表型。另外，SN91、SN120、SN03和氮饥饿野生型对照均呈现出降低水平的DGDG(双半乳糖甘油二酯)。

在通过LC-MS/MS分析的SN基因中，几个在二酰甘油三甲基同型丝氨酸(DGTS)生产中表现出显著增加，当磷酸盐水平有限时，使用膜脂质代替磷脂。DGTS的线表现出增强的水平在2倍以上的过剩与野生型对照包括:SN08，SN75和SN108。这些株系相对于野生型对照还具有增加的可萃取物质。

具有最高萃取物的几种株系包括SN28和SN124，显示出叶绿素a水平的降低，在本研究中分析的脂质累积没有明显的变化。

下表10和表11示出了20种基因和野生型对照(氮饥饿和氮充足)的数据。总重量脂质产率在第一行中列出(％产量)，其中列出该提取的油的组分分子与它们各自占总产量的百分比。一些次要成分未列出，因此总和不等于100％。

表10

注释：DAG(二酰基甘油)；DGDG(双半乳糖甘油二酯)；DGTS(二酰甘油三甲基同型丝氨酸)；LPC(溶血磷脂酰胆碱)；MGDG(单半乳糖甘油二酯)；MAG(单酰甘油)；PG(磷脂酰甘油)；和TAG(三酰甘油)。

表11。

类型	SN110	SN120	SN124	SN03	WT-Nit	WT
							产量百分数	21.74	23.10	35.63	35.72	25.90	26.67
胡萝卜素	0.8	0.3	0.7	0.6	0.3	0.9
							叶绿素a	6.0	2.5	--	5.4	1.4	6.1
叶绿素b	2.0	0.9	5.6	3.3	0.4	5.3
							DAG	13.8	--	16.0	8.1	3.4	15.2
DGDG	6.2	0.1	3.5	1.0	0.6	7.0
							DGTS	14.9	15.7	0.4	11.4	11.7	6.9
LPC	--	1.4	0.4	0.4	0.2	--
							MGDG	0.8	5.9	4.1	2.2	6.5	--
MAG	--	--	--	--	0.7	2.5
							PG	--	--	--	--	--	--

脱镁叶绿素a	13.7	19.5	18.6	15.9	10.8	11.3
							脱镁叶绿素b	--	--	--	--	--	--
TAG	2.6	10.7	2.1	2.6	43.6	4.4
							未知	24.8	31.6	33.1	27.9	18.1	27.5

实验具体内容：

脂质萃取：将约30mg冻干的生物质称重，加入玻璃试管(16mL)。将100mL的5000ppm内标(IS)溶液中(全氟庚酸-C7HF13O2MeOH)加入到试管中。然后将9.9ml萃取剂加入试管来悬浮生物质。然后将试管盖上盖，使用50％功率、80％占空比(20秒开/5秒关)的超声处理20分钟。将萃取试管在4000rpm/4℃下离心15分钟。将上清夜移出，并转移到合适的琥珀色小瓶，进行LC/MS/MS分析。萃取溶液由乙腈(35％)、甲醇(26％)、四氢呋喃(9％)和甲基-叔丁基乙醚(30％)组成。在氮气流下蒸发溶液的等分试样至干燥后，用重量分析法测定脂质产率。

高压液相色谱法(HPLC)：一种Gemini NX柱(C₁₈，3mm，2.0x150mm，s/n:540676-12)用于分析。该溶剂系统包括：A.85/15MTBE/MeOH(1％1MNH₄Ac，0.1％HCOOH)，和B.90/10MeOH/水(1％1MNH₄Ac，0.1％HCOOH)。起始条件是5％A/95％B。一分钟后，开始该梯度并在3分钟时下降到65％B，然后在15分钟降至15％B。然后在0.1分钟内将其设定为回到起始条件(5％A/95％B)，并保持2.9分钟以确保再平衡。总运行时间为18分钟。流速0.3mL/min。柱温度为30℃。将10mL注入系统。

MS/MS：使用安捷伦科技ESI-L/低浓度调节混合物(Part#G1969-85000)来校准MaXis质谱仪，覆盖范围m/z50-2000。将C₂₄H₁₉F₃₆N₃O₆P₃离子结构的质量被用作锁定质量。该仪器调谐到大约30,000的分辨率。

实施例13：生长性状基因

也从整组(131)的SN转基因株系中筛选生长相关的表型。由于这些基因很可能参与了氮利用途径，菌株进行筛选为限制氮的池，并且在竞争性恒浊器中选择较高水平的生长。恒浊器是连续培养装置，具有培养容器的浊度和稀释速率之间的反馈(例如，如在Bryson，V.，&Szybalski，W.(1952)Microbial Selection.Science(New York,NY)，116(3003)，45-51.doi:10.1126/science.116.3003.45)。当浊度增加时，介质输送速率增加以稀释浊度回到其设定值。当浊度回落，输送速率降低，以便生长可以将浊度恢复到其设定点。这允许培养物长时间内保持在指数生长状态下，便于鉴别在具有生长加速或更高的生长速率的群落中的特定藻类株系。

恒浊器竞争试验测定由归一化SN基因8x12池组成。每个8x12的池代表8个单独SN基因的12种转基因株系的归一化的群落。将起动块接种于96深孔块，生长到中至晚期对数期，并通过基因汇集(归一化至OD)。然后，在HSM培养基中将8池的转基因菌株以相等的量组合，NH₄Cl的终浓度为1.5mM。在标准生长恒浊器中以生物一式三份执行生长竞争试验。在恒浊器建立的时间提取基线样本，用于起始群落基因分布的分类和计算。将恒浊器保持2周，最终每个恒浊器分类，并用PCR筛选出群落的最终基因组成。在池中比其它转基因株系更具竞争优势的株系相对于开始分布将增加它们在恒浊器内的表现。

表12中列出了影响莱茵衣藻中生长的现有基因，连同联合基因组研究所(JGI)蛋白质ID和功能注释。下面还包括的是基因的序列标识符号码。

表12

下面的表13中提供了一列密码子最优化的基因序列(SEQ ID NO)，这些序列分别克隆到Ble2A表达构建体。

SN01(SEQ ID NO:177)
	SN06(SEQ ID NO:183)
SN24(SEQ ID NO:189)
	SN25(SEQ ID NO:195)
SN28(SEQ ID NO:201)
	SN42(SEQ ID NO:207)
SN46(SEQ ID NO:213)
	SN47(SEQ ID NO:219)
SN55(SEQ ID NO:225)
	SN57(SEQ ID NO:231)
SN59(SEQ ID NO:237)
	SN64(SEQ ID NO:243)
SN69(SEQ ID NO:249)
	SN76(SEQ ID NO:255)
SN78(SEQ ID NO:261)
	SN79(SEQ ID NO:267)
SN82(SEQ ID NO:273)
	SN111(SEQ ID NO:279)
SN118(SEQ ID NO:285)
	SN122(SEQ ID NO:291)
SN128(SEQ ID NO:297)

生长筛选数据呈现在下面的表14中。下面的数据显示在转基因藻类菌株的群落中每个特定转基因的频率。基线表示与相等的表示的初始群落，在混合物(基于起始培养物的OD)中8个基因每一个的平等表现的靶(12.5％)。重复运行三次恒浊器(A，B，C)，示出了在恒浊器中两周后的每一个转基因的频率。那些增加频率的基因选择为“生长获胜者”。

表14。

表15示出了每个基因混合物中命名为“生长获胜者”的基因。

基因混合物编号	获胜者
		1	SN01，SN46，SN57
2	SN28
		3	SN25
4	SN06
		5	SN42，SN76
6	SN24
		7	SN47，SN59
8	SN79
		9	SN64，SN69
10	SN82
		11	SN118，SN128
12	无
		13	SN122
14	SN55
		15	SN78，SN111

除了以上描述的竞争生长试验，6个基因(SN79、64、24、82，1和28)的多达12个单独转基因株系的生长速率在生长试验中确定。细胞在96孔板中培养到全饱和。然后将细胞稀释到HSM培养基中，并培养过夜。从该培养物中，每个株系的复制稀释到HSM培养基中，在微量滴定板中，OD₇₅₀＝0.02。将板在5％的CO2环境下培养，每8-16小时进行OD750读数。基于OD的自然对数绘制数据。从曲线的斜率中读取一段时间的生长速率。图57-62示出了SN79、64、24、82，1和28的生长速率转基因株系以及野生型对照。

实施例14：在其它的藻类菌株中同源蛋白质的鉴定

如在许多种类的藻类中氮饥饿诱导脂质增加和生长变化，可以预料到SN蛋白质可具有引起这些变化的保守机构，因此在其他藻类菌株中鉴定同源蛋白质是理想的。生物信息学工具如BLAST可用于查询藻类和其它生物的公开的基因组和转录组序列。从藻类和其它生物的已公开的功能注释中可以搜索到与任何SN基因相似的注释。候选序列可使用ClustalW对准以确定任何SN基因的同一性和相似性。接着，这些序列可以在任何藻类菌株中表达以及根据需要，在衍生它们的菌种中，以测定它们对脂质积累和/或生长的影响。

实施例15：在氮饥饿条件下使用另外的藻类菌种的转录组学

在实施例3中所描述的用于SE0050(莱茵衣藻)的方法可以应用于藻类二形栅藻(SE0004)。利用454技术，测序归一化cDNA库而产生参考转录组。该库是从10个在变化处理下培养的不同藻类培养物中产生，以便最大化生物中所有转录本的表现。从一组在5种氮饥饿和充足的条件下培养的SE0004样本中，利用Solexa技术对RNA测序(1：氮充足，指数生长；2：氮充足；稳定生长；3：氮饥饿，6H；4：氮饥饿，24H；5：氮饥饿，48H)。此转录组测序数据已经映射至SE0004参考转录组，这些基因正在确认为是参与氮饥饿途径，包括脂质增加途径。这些基因将在SE0050和SE0004中被过表达和/或敲落以确定其对脂质积累的影响。

表7显示了SE0004参考转录组的细节。在标题“未加工”下列出了454测序读数的编号、它们的平均长度和所产生的序列的总量。在标题“加工”下列出了加工的参考转录组所代表的序列重叠群的数目、它们的平均长度和总核苷酸碱基。

表7

实施例16：在其它藻类菌种中一组氮饥饿诱导的基因的表达

已经鉴定来自SE0004的基因，显示出在氮饥饿条件下有上调的表达模式，如通过转录组测序转录组学鉴别。这些基因被克隆到SE0004特异性的表达载体，然后所述载体转化到SE0004藻类。我们使用SE0050表达载体(Ble2A、SEnuc357和Arg7/2A)来在SE0050(衣藻)中过表达，来自SE0004的基因鉴定为在氮饥饿条件下上调。我们使用SE0004载体以在SE0004菌株中过表达来自SE0050得SN03。

实施例17：使用SN DNA、RNA或蛋白质以鉴定相互作用的分子或在氮饥饿途径中所涉及的其它基因

本实施例描述了一种方法，用于使用编码SN基因或SN蛋白质的DNA或RNA来鉴定其它DNA、RNA或蛋白质和/或其相应的涉及氮饥饿途径的基因，这个实施例的知识和使用可能导致藻类中脂质积聚和分布的操作。

一种方法将是使用体外表达的SN蛋白质或从细胞培养到探针的高密度DNA微阵列，如(Berger等，Compact，通用DNA微阵列以全面地确定转录因子结合位点的特异性。自然生物技术(Nature Biotechnology)(2006)第24(11)卷，第1429-35页)。这可用于识别DNA结合位点，然后可映射到基因组以指示受SN蛋白质控制转录的基因。这些基因接着可以用来理解和修改氮饥饿所导致的表型。

其它方法可以是使用二杂种含量测定中的SN蛋白质，如(例如，如Miller和Stagljar。使用所述酵母双杂种系统以鉴定相互作用蛋白。方法MolBiol(2004)第261卷第247-62)。该SN蛋白质可在该酵母系统中用于识别其它藻类与SN蛋白质结合的蛋白质。然后，这些蛋白的基因可以被用来理解和修改氮饥饿所导致的表型。

实施例18：在其它生物中的SN基因的过表达

在其他藻类菌株脂质或生长基因的表达

本实施例描述了一种方法，用于过表达另一种藻类菌种中的SN基因以便改变藻类菌种的脂质含量、脂质，或生长。所述SN ORF(具有或不具有修改和/或密码子优化)可以克隆到一种转化载体，例如，如图6、7、18、34、35、63，或64和另一个藻类菌种中表达的蛋白质所述(例如杜氏藻属、栅藻属、链带藻属、拟微绿球藻、小球藻属、葡萄藻属，或红球藻属。或者，特异于宿主藻类菌种的具有核苷酸序列元件的转化载体(例如，启动子，终止子，和/或UTR)可以用与SN ORF。该替代载体还可以转化为藻类菌种(例如杜氏菌种栅藻属、链带藻属、拟微绿球藻、小球藻、葡萄藻属，或红球藻属。本文所述的任何菌种中脂质或生长基因的过表达可以用以产生所需的表型。

高等植物中脂质或生长基因的表达

这部分描述了一种方法，用于过表达高等植物中脂质或生长基因，如拟南芥，以便改变脂质含量、脂质分布，或加快生物的生长。

ORF(具有或不具有变体和/或密码子优化)可以克隆到转化载体，例如，如图63或图64，BSSK-2xmyc载体(如Magyar，Z.(2005)THE PLANT CELLONLINE，17(9)，2527-2541；doi:10.1105/tpc.105.033761所述的)，或pMAXY4384载体(如Kurek，I.，等人(2007)The Plant Cell，19(10)，3230-3241doi:10.1105/tpc.107.054171所述)，和表达的蛋白质，例如，芸苔属、大豆属、棉属、苜蓿属、玉蜀黍属、稻属、小麦属，或稷属。

或者，特异于宿主植物种的具有核苷酸序列元件(例如，启动子、终止子以及/或UTR)的转化载体可以用于脂质或生长基因ORF。该替代向量也可以转化成高等植物种，如芸苔属、大豆属、棉属、苜蓿属、玉蜀黍属、稻属、小麦属，或稷属。

本文所公开的任何物种中的脂质或生长基因的过表达可以用以产生具有所需表型的生物(例如，脂质含量或脂质分布的改变，或生长加速)。

实施例19：组合SN与其它性状的效果或将多个SN基因组合在一起

本实施例描述了多种方法来组合SN过表达与其它的表型不同于野生型菌种的转基因株系和/或修饰的菌株。

例如，一个或多个附加的过表达基因可以与SN过表达组合，或者通过将包含SN基因的载体转化到已经含有一种或多种过表达基因的转基因菌株，或通过一个或多个基因转化到过表达SN基因的菌株。

另一示例性组合可以是一个或多个与SN基因过表达组合的可敲落或敲除基因，或者通过将包含SN基因的载体转化到已经含有一种或多种可敲落或敲除转基因菌株，或通过一个或多个敲落或敲除构建体转化到过表达SN基因的菌株。

其它方法可以是变换的SN基因插入菌种，其已经通过诱变修饰或演变成具有特定表型。或者，过表达的SN基因可以被突变或进化，以便产生附加的表型。

在这些方法中，与SN表型结合的附加表型可能是，例如，产生其它脂质的积累或其它脂质分布变化的脂质表型。或者，附加表型可不包括脂质表型，例如生长的变化、叶绿素代谢的变化、对一些生物或非生物应激的抗性，或另一表型。

本领域的技术人员将能够制造关于上述方法的许多其它组合，以便研究SN基因与其它性状的表达组合的效果。

实施例20：使用SN基因敲落以识别一个或多个参与氮饥饿途径的附加基因。

本实施例描述了一种方法，用于鉴定参与氮饥饿的基因，使用转基因株系，其中SN基因是可敲落或敲除。我们预期这些基因(其表达由内源SN基因的敲落来修饰)将是氮饥饿影响的基因的一个子集。这个数据将帮助我们理解SN蛋白质是作用于哪些下游途径以产生更多的脂质并改变脂质分布。

鉴定这种基因的一种方法是在存在和不存在氮的条件下培养野生型和SN敲落/敲除转基因株系。可随后执行基因表达、蛋白质水平和/或代谢产物的一种分析。用于该分析的一种方法是转录组测序的方法，该方法将基于在样本中哪些基因被上调或下调而产生候选基因列表。

有很多可用的方法来产生SN基因的敲落或敲除。人工miRNA的表达可导致转录水平的降低。RNA沉默的其它方法包括应用的串联反向重复系统(Rohr等人，Plant J.，40:611-621(2004))，其中的靶基因转录物的100-碱基对区被表达为一种反向重复。沉默的其优点是，可以不同程度存在，其中所述目标转录物是可敲落的。时常地，转录物的表达是细胞存活力所需的。因此，可能存在中间体水平的表达，允许两种发育能力并且具有所需表型(例如，脂质诱导)。通过沉默可以找出产生表型需要的特定表达水平。

可通过许多方法进行同源重组并且已经在绿藻中证实(Zorin等人，Gene，423:91-96(2009)；Mages等人，Protist158:435-446(2007))。一种基因敲除可以通过同源重组获得，其中基因产物(例如mRNA转录物)可以通过基因缺失或插入中断基因的外源DNA来消除。

实施例21：SN基因的微量滴定生长测定

该多个单独的转基因株系的生长速率通过微量滴定(微孔板)生长试验测定。用于评价的SN菌株在生长试验开始前适应摇瓶中的培养基。每个SN菌株都生长到中至晚期对数期，在含有100ml培养物的250ml摇瓶中，2-3％的CO2，约65μE/m²/s的荧光照明，在New Brunswick Scientific Innova 2100平台旋转振荡器上以约120转/分钟。

在过夜培养之后，培养物转移并在培养基中归一化至3.5ml，OD_750nm＝0.2，24孔深块，使用Beckman Biomekfx机器人液体处理系统。在新鲜培养基中稀释培养物有助于维持培养基所需的标称浓度的营养素，因为培养基适应环境阶段期间可能发生营养素耗尽。所述深块布满透气膜，并使其生长在2-3％的CO2和约50μE/m²/s荧光灯上，在Thermo Scientific滴定板振动器(型号#4625)上以40％的摇动速度。振荡速度由保持悬浮培养需要的最小速度确定。

第2天，将培养物归一化至3.5ml，OD_750nm＝0.02，培养基在24孔深块中。随机归一化的培养物被转移到Costar的96-孔微量滴定板(型号#3903)，使用每孔200μl复制。在测定中选择96-孔微量滴定板，使用不透明侧以最小化在板的表面和侧面的光曝光形成的位置效应，透明底允许在96孔微量滴定板读数仪中在OD_750nm采集期间有750nm光的通道。将板覆盖有PDMS(聚二甲基硅氧烷)膜盖，其允许被覆盖的藻类培养在每个孔和室内环境之间的气体交换，同时随时间最小化蒸发损失的培养体积。

在培养实验中，覆盖平板设定为培养腔中定制的微量滴定板振荡器，提供3％的CO2，在盖的表面上的入射光可设置在50-18050–180μE/m²/s的范围内。在整个实验中以1700转/分钟施加15秒间歇摇动，各个旋转方向(CW/CCW)1秒，随后60秒不摇动。这种激励协议是在生长测定中维持足够的细胞悬浮液所需的搅拌的最低量。在6小时的间隔获得OD_750nm，进行96-134小时。培养物有足够的时间来在稳定期达到承载量。从各个采集时间点所得OD750nm数据进行编辑并绘制为时间序列。

所产生的数据可以以两种方式之一进行。

该指数生长模型是基于这样的假定，即细胞数目的改变速率与培养物中存在的细胞数成比例。

\frac{dN}{dt} = rN

其中溶液提供指数生长功能，

N(t)＝N_oe^rt

其中，

N(t)＝生物质在时间t的量，通过OD_750nm测量

N_o＝生物质的初始量，通过OD750nm测量

r＝特定生长速率

当使用指数模型建模数据，仅使用初始数据点，因为培养物仅在早期生长阶段到达无限制的指数生长的极。以这种方式建模数据提供了一个描述性参数r。

该逻辑模型也可以被用来表示数据集。在该模型中，假设生长速率随着生物质的量发生线性变化，最大速率在(相对较低)的初始密度，随着细胞数目增加而减小。对数生长的控制微分方程的是

\frac{dN}{dt} = rN (1 - \frac{N}{K})

这些参数如前所述的本系统的承载量一样，多加了K。应当注意到，上述方程要求细胞数目的变化速率将接近零，因为细胞的数量N接近承载量K。

上述微分方程的解决方案可以使用部分分式分解来解决，然后变量分离以获得一下形式的逻辑曲线方程，

N (t) = \frac{K}{1 + (\frac{K}{N_{o}} - 1) e^{- rt}}

来自每个板的编译的OD_750nm和时间数据被引入曲线拟合软件包，并装配到适当的功能。如果使用指数拟合，则测试对象进行比较。如果使用对数拟合，那么另外的参数被检查。

该逻辑函数具有其最大变化速率，其中的第一时间导数被最大化。此时，可以看出，最大变化速率等于复合量Kr/4。该比例(Kr/4)称为峰值理论生产率(见图67)，其表示在测定条件下生物质累积的最大速率。

如果逻辑建模是用于表示数据，使用在达到培养物稳定期的该点收集到的所有的数据。菌株进行比较，不仅通过它们的速率(如同指数模型)，而且通过其承载量和峰值生产率。

几个SN转基因株系的连同野生型对照生长速率进行测定，所述数据通过各个SN基因转化株(图65)的单因素方差分析“r”(生长速率)进行分析，或者通过各个SN基因的转化株(图66)的单因素方差分析“Kr/4”。在图65中，分析SN78，在图66中分析SN24、SN26和SN39。至于图65，SN78的单因素方差分析的平均值是0.081800，具有0.00684的标准偏差。对于SN78，相对于对照(野生型)的平均值使用Dunnett方法得到假定值为0.0014.，关于图66，SN24、SN26和SN39的单因素方差分析的平均值分别是0.012291，0.012138，0.011896，标准偏差分别为0.00079、0.00079和0.00071。对于SN24、SN26和SN39，相对于对照(野生型)的平均值使用Dunnett方法得到的假定值分别为0.0235、0.0358和0.0415。

方差分析(ANOVA)是一种用来确定两个以上的群落平均值是否相等的统计测试。该测试使用F-分布(概率分布)函数和关于每个群落的方差(内的)和群落的分组()之间之间以帮助判定每个群落之间和内的变异性是否显著不同的。

Dunnett检验(方法)是本领域技术人员已知的统计工具，并且例如描述在Dunnett，C.W(1955)“A multiple comparison procedure for comparing severaltreatments with a control”，Journal of the American Statistical Association，50:1096-1121和Dunnett，C.W.(1964)“New tables for multiple comparisons witha control”，Biometrics，20:482-491。Dunnett检验比较组平均值。它是专门设计用于这样的情况，其中所有基团都去对抗一个“参考”基团。它通常在ANOVA已经拒绝该假设的分布的平均值相等(尽管这不是必需从严格技术的观点来看)之后使用。Dunnett检验的目标是识别出其平均值显著地不同于参考组平均值的组。在零假设下测试，没有组的平均值显著不同于参照组的平均值。

实施例22：SN基因的脂质分析

测定SN基因的多个独立转基因株系的脂质含量。一种基于脂类染料的测定(如上所述)用于筛选SN转基因株系的脂质含量。分析流式细胞术(Guava)是荧光的直接测量，在培养物分别用三种脂类染料：Bodipy、尼罗红和Lipid TOX green进行染色时，可以使用荧光。所有三种染料是亲脂性的，具有特定的、但非限定的亲和力，用于在细胞中不同脂质成分。使用的三种不同染料提供更宽范围的可以观察到的可能的脂质表型。使人感兴趣的是SN基因改变脂质的总量，而且在那些通过影响脂质的子集改变脂质分布的SN基因中。测量每个单独的SN株系，并与野生型莱茵衣藻株系进行和比较。基于它们的性能、相对于在Guava筛选上的野生型对照，测定获胜者。获胜者包括至少1种或更多的转化株：SN1、SN9、SN11、SN21、SN26、SN39，SN71、SN80、SN110、SN120和SN124。

如图68到图72所示，通过Bodipy的单因素方差分析、尼罗红染色的单因素方差分析，和Lipid Tox染色的单因素方差分析进行分析数据。在下表16中示出使用Dunnett方法的图68到图72所示的数据该平均值的比较对照组(野生型)。

Abs(Dif)-LSD＝绝对(差)-最小显著差

表16

基因缺失

一种这样的方法是PCR扩增基因的两个不相连区域(从几百DNA碱基对至几千DNA碱基对)。这两个不相连区域被称为同源性区域1和同源性区域2，被克隆成质粒。然后质粒可用来转化宿主生物以产生基因敲除。

基因插入

另一种方式是PCR扩增基因的两个相连或两个不相连的区域(从几百DNA碱基对至几千DNA碱基对)。第三序列连接在第一和第二区域之间，并且将所得到的构建体克隆到质粒。然后质粒可用来转化宿主生物以产生基因敲除。第三序列可以是，例如，抗生素选择性标记盒、营养缺陷型标记盒、蛋白质表达盒或多个盒。

如何测量细胞株系的生长加速

本节描述了示范性方法，其可以用于确定细胞株系的生长加速。

细胞株系的生长加速可以通过竞争试验测定、生长速率、承载量、测量培养物生产率、细胞增殖、种子产量、器官生长，或多聚核糖体累积来测量。这些类型的测量是本领域技术人员已知的。

该生物的生长可以通过光密度、干重量、总有机碳，或通过本领域技术人员已知的其它方法测量。这些测量值可以是，例如，配合生长曲线以确定最大生长速率、承载量和培养物生产率(例如，g/m2/天；每单位面积/体积/单位时间产生的生物质的测量)。这些值可以与未转化的细胞株系或另一转化的细胞株系相比较，以便计算感兴趣的过表达细胞株系中生长的加速。

可以测量承载量，例如，克/升，克/立方米，克/平方米，或千克/英亩。本领域的技术人员将能够选择最适当的单位。可以测量每单位体积或面积的任何质量。

可以测量培养物生产率，例如，克/平方米/天、克/升/天、公斤/英亩/天，或克/立方米/天。本领域的技术人员将能够选择最适当的单位。

可以测量生长速率，例如，每小时、每天、每次生成或每周。本领域的技术人员将能够选择最适当的单位。可以测量任何单位时间。

生长速率

与未转化的或野生型生物相比或与另一转化的生物相比，一种SN基因转化的生物的生长速率的增加可以是，例如，约2％、约4％、约6％、约8％、约10％、约12％、约14％，约16％、约18％、约20％、约22％、约24％、约26％、约28％、约30％、约50％、约100％、约150％、约200％、约250％、约300％、约350％，或者约400％。

与未转化的或野生型生物相比或与另一转化的生物相比，一种SN基因转化的生物的生长速率的增加可以是，例如，至少2％、至少4％、至少6％、至少8％、至少10％、至少12％、至少14％、至少16％、至少18％、至少20％、至少22％、至少24％、至少26％、至少28％、至少30％、至少50％、至少100％、至少150％、至少200％、至少250％、至少300％、至少350％，或者至少400％。

虽然某些实施例已在此公开，但本领域技术人员显而易见的是，提供这些实施例仅仅是作为例子。本领域技术人员可想到不背离本发明的各种变化、改变和替换。应当理解，这里所描述的公开内容的实施例的各种替代方案可用于实施本公开内容。以下权利要求旨在限定本公开的范围，并且这些权利要求及其等价物的范围内的方法和结构都由其覆盖。

Claims

1.一种分离的多核苷酸，包括：

(a)SEQ ID NO：113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列；

(b)与SEQ ID NO：113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

(c)SEQ ID NO:112、64、76、82、88、94、100、106、130、118、124、136、142、148、154、160、166或172的核苷酸序列；或

(d)与112、64、76、82、88、94、100、106、130、118、124、136、142、148、154、160、166或172的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列。

2.根据权利要求1的分离多核苷酸，其中所述核酸或核苷酸序列编码一种蛋白质，其包括，(a)SEQ ID NO：114、66、78、84、90、96、102、108、132、120、126、138、144、150、156、162、168或174的氨基酸序列；或(b)(a)的所述氨基酸序列同系物，其中，所述同系物与SEQ ID NO：114、66、78、84、90、96、102、108、132、120、126、138、144、150、156、162、168或174的氨基酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性。

3.根据权利要求1所述的一种通过分离的多核苷酸转化的光合生物。

4.根据权利要求3所述的转化的光合生物，其中所述的蛋白质被表达。

5.一种通过分离的多核苷酸转化的光合生物，包括：

(a)SEQ ID NO:113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列；

(b)与SEQ ID NO:113、65、77、83、89、95、101、107、131、119、125、137、143、149、155、161、167或173的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

(d)与112、64、76、82、88、94、100、106、130、118、124、136、142、148、154、160、166或172的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

其中，所述转化的生物的脂质含量或分布不同于未转化的生物的脂质含量或分布或者不同于第二转化生物的脂质含量或分布。

6.根据权利要求5所述的转化的光合生物，其中所述差值是在下列中的增加或减少：一个或多个血红素、极性脂质、叶绿素的分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油，心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油，磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、二酰甘油三甲基同型丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OHOH甲基甲基羧基胆碱、甘油二酯三甲基丙氨酸、2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4，5-二磷。

7.根据权利要求5所述的转化的光合生物，其中所述差值通过萃取、萃取重量法，或亲脂性染色测定。

8.根据权利要求7所述的转化的光合生物，其中所述萃取是Bligh-Dyer或MTBE。

9.根据权利要求5所述转化的光合生物，其中所述差值是在所述转化的生物的细胞中使用亲脂性染料染色的增加或减少。

10.根据权利要求9所述的转化的光合生物，其中所述亲脂性染色是Bodipy、尼罗红或Lipid TOX green。

11.根据权利要求5所述的转化的光合生物，其中所述转化的生物是在水相环境中生长。

12.根据权利要求5所述的转化的光合生物，其中所述转化的生物是维管植物。

13.根据权利要求5所述的转化的光合生物，其中所述转化的生物是非维管光合生物。

14.根据权利要求5所述的转化的光合生物，其中所述转化的生物是一种藻类或细菌。

15.根据权利要求14所述的转化的光合生物，其中所述细菌是蓝藻。

16.根据权利要求15所述的转化的光合生物，其中所述蓝藻为聚球蓝细菌属，集胞藻属、节旋藻属、粘球藻属、螺旋藻属、细鞘丝藻属、林氏藻属、颤藻属，或假鱼腥藻。

17.根据权利要求14所述的转化的光合生物，其中所述藻类是微藻。

18.根据权利要求17所述的转化的光合生物，其中所述衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、雨生红球藻、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。

19.根据权利要求17所述的转化的光合生物，其中所述微藻是以下至少一种：莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻，或梭杆菌节旋藻。

20.根据权利要求5所述的转化的光合生物，其中所述转化的光合生物的细胞核基因组进行转化。

21.根据权利要求5所述的转化的光合生物，其中所述转化的光合生物的叶绿体基因组进行转化。

22.根据权利要求21所述的转化的光合生物，其中所述转化的光合生物是同质的。

23.一种增加脂质生产的方法，包括：i)将生物通过包含编码蛋白质的核苷酸序列的多核苷酸进行转化，与未转化的生物或第二转化的生物相比，所述蛋白质的表达导致脂质生产增加，并且其中，所述核苷酸序列包括：

24.根据权利要求23所述的方法，其中所述脂质是存储在生物的脂质体、细胞膜、类囊体内部空间，或质体小球内。

25.根据权利要求23所述的方法，其中所述方法进一步包括：收集来自生物的脂质体的脂质。

26.根据权利要求23所述的方法，其中所述方法进一步包括:收集来自生物的细胞膜的脂质。

27.根据权利要求23所述的方法，其中所述脂质是以下的任何一个或多个：血红素、极性脂质、叶绿素的分解产物、褐藻素、双半乳糖甘油二酯(DGDG)、三酰基甘油、二酰基甘油、单酰基甘油、甾醇、甾醇酯、蜡酯、生育酚、脂肪酸、磷脂酸、溶血磷脂酸、磷脂酰甘油，心磷脂(二磷脂酰甘油)、磷脂酰胆碱、溶血磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇、磷酰乙醇胺、醚脂、单半乳糖二酰基甘油、双半乳糖二酰基甘油，磺基-6-脫氧葡糖基二脂酰甘油、鞘氨醇、植物鞘氨醇、鞘磷脂、葡糖神经酰胺、二酰甘油三甲基同型丝氨酸、蓖麻油酸、前列腺素、茉莉酮酸、α-胡萝卜素、β-胡萝卜素、β-玉米黄质、变胞藻黄素、玉米黄素、叶绿素a、叶绿素b、脱镁叶绿素a、叶绿醌、脱植基叶绿素a、脱植基叶绿素b、脱镁叶绿酸a、鲍光过敏素a、脱镁叶绿酸b、脱镁叶绿素b、羟基叶绿素a、羟基脱镁叶绿素a、甘油二酯葡糖苷酸、甘油二酯OH甲基羧基胆汁素、甘油二酯OH甲基三甲基丙氨酸、2’-O-酰基-硫代异鼠李糖甘油二酯、磷脂酰肌醇-4-磷酸盐，或磷脂酰肌醇-4,5-二磷酸。

28.根据权利要求23所述的方法，其中所述转化的生物是在水相环境中生长。

29.根据权利要求23所述的方法，其中所述转化的生物是维管植物。

30.根据权利要求23所述的方法，其中所述转化的生物是非维管光合生物。

31.根据权利要求23所述的方法，其中所述转化的生物是一种藻类或细菌。

32.根据权利要求31所述的方法，其中所述细菌是一种蓝细菌。

33.根据权利要求32所述的方法，其中所述蓝细菌为聚球蓝细菌属、集胞藻属、节旋藻属、粘球藻属、螺旋藻属、细鞘丝藻属、假膜藻属、颤藻属，或假鱼腥藻。

34.根据权利要求31所述的方法，其中所述藻类是微藻。

35.根据权利要求34所述的方法，其中所述衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。

36.根据权利要求34所述的方法，其中所述莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻，或梭杆菌节旋藻。

37.根据权利要求23所述的方法，其中所述转化的生物的细胞核基因组进行转化。

38.根据权利要求23所述的方法，其中所述转化的生物的叶绿体基因组进行转化。

39.根据权利要求38所述的方法，其中所述转化的光合生物是同质的。

40.一种通过分离的多核苷酸转化的高等植物，包括：

其中，所述转化的植物的脂质含量或分布不同于未转化的植物的脂质含量或分布或第二转化的植物的脂质含量或分布。

41.根据权利要求40的转化的高等植物，其中所述差值是通过萃取、萃取重量法，或亲脂性染色测定。

42.根据权利要求41所述的转化的高等植物，其中所述萃取是Bligh-Dyer或MTBE。

43.根据权利要求40所述的转化的高等植物，其中所述差值是所述转化的生物的细胞使用亲脂性染料染色的增加或减少。

44.根据权利要求43所述的转化的高等植物，其中所述亲脂性染色是Bodipy、尼罗红或Lipid TOX green。

45.根据权利要求40所述的转化的高等植物，其中所述高等植物是拟南芥。

46.根据权利要求40所述的转化的高等植物，其中所述高等植物是芸苔属、大豆属、棉属、苜蓿属、玉米属、高粱属、稻属、小麦属，或稷属。

47.一种分离的多核苷酸，包括:

(a)SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；

(b)与SEQ ID NO:269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

(c)SEQ ID NO:268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或

(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列。

48.根据权利要求47所述的分离的多核苷酸，其中所述核酸或核苷酸序列编码蛋白质，其包含，(a)SEQ ID NO:270、180、186、192、198、204、210、216、222、228、234、240、246、252、258、264、276、282、288、294，或300的氨基酸序列；或(b)(a)的所述氨基酸序列的同系物，其中，所述同系物与SEQ ID NO:270、180、186、192、198、204、210、216、222、228、234、240、246、252、258、264、276、282、288、294和300的氨基酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性。

49.根据权利要求47所述的一种通过分离的多核苷酸转化的光合生物。

50.根据权利要求49所述的转化的光合生物，其中所述的蛋白质被表达。

51.一种光合生物转化与分离的多核苷酸包括：

(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

其中，与未转化的生物或第二转化的生物相比，所述转化的生物的生长加速。

52.根据权利要求51所述的转化的光合生物，其中所述生长加速是由至少所述转化的生物和未转化的生物之间的竞争试验测定。

53.根据权利要求52所述的转化的光合生物，其中所述竞争试验包括附加的生物。

54.根据权利要求52所述的转化的光合生物，其中所述竞争试验是在一个或多个恒浊器中。

55.根据权利要求51所述的转化的光合生物，其中所述转化的生物的生长加速是通过生长速率、承载量测量，或培养产率测量。

56.根据权利要求55所述的转化的光合生物，其中所述转化的生物的生长加速是通过生长速率测量。

57.根据权利要求56所述的转化的光合生物，其中，与所述未转化的生物或第二转化的生物相比，所述转化的生物具有从0.01％至2.0％，从2％至4％，从4％至6％，从6％至8％，从8％至10％，从10％至12％，从12％至14％，从14％至16％，从16％至18％，从18％至20％，从20％至22％，从22％至24％，从24％至26％，从26％至28％，从28％至30％，从30％至50％，从50％至100％，从100％至150％，从150％至200％，从200％至250％，从250％至300％，从300％至350％，从350至400％，或从400％至600％的生长速率增加。

58.根据权利要求51所述的转化的光合生物，其中，相比于未转化生物体或第二转化的生物，具有正向选择系数的转化的生物显示所述增加。

59.根据权利要求51所述的转化的光合生物，其中所述转化的生物是在水相环境中生长。

60.根据权利要求51所述的转化的光合生物，其中所述转化的生物是维管植物。

61.根据权利要求51所述的转化的光合生物，其中所述转化的生物是非维管光合生物。

62.根据权利要求51所述的转化的光合生物，其中所述转化的生物是一种藻类或细菌。

63.根据权利要求62的权利转化的光合生物，其中所述细菌是蓝细菌。

64.根据权利要求63所述的转化的光合生物，其中所述蓝细菌为聚球蓝细菌属，集胞藻属、节旋藻属、粘球藻属、螺旋藻属、细鞘丝藻属、假膜藻属、颤藻属，或假鱼腥藻。

65.根据权利要求62所述的转化的光合生物，其中所述藻类是微藻。

66.根据权利要求65所述的转化的光合生物，其中所述微藻是以下中的至少1种：衣藻属、团藻目属、带藻属、杜氏藻属、栅藻属、小球藻属、血球菌属、团藻属、拟微绿球藻、节旋藻属、螺旋藻属、葡萄藻属、红球藻属，或链带藻属。

67.根据权利要求65所述的转化的光合生物，其中所述微藻是以下中的至少1种：莱茵衣藻、海洋微拟球藻、盐生微拟球藻、盐生杜氏藻、雨生红球藻、二形栅藻、杜氏绿藻、眼点拟微球藻、杜氏盐藻、极大螺旋藻，或梭杆菌节旋藻。

68.一种通过分离的多核苷酸转化的高等植物，包括：

(a)SEQ ID NO：269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列；

(b)与SEQ ID NO：269、179、185、191、197、203、209、215、221、227、233、239、245、251、257、263、275、281、287、293，或299的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列；

(c)SEQ ID NO：268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列；或

(d)与268、178、184、190、196、202、208、214、220、226、232、238、244、250、256、262、274、280、286、292，或298的核苷酸序列具有至少80％、至少85％、至少90％、至少95％、至少98％，或至少99％的序列同一性的核苷酸序列，

其中，与未转化的植物的生长或第二转化的植物的生长相比，所述转化的植物的生长增加。

69.根据权利要求68所述的转化的高等植物，其中所述生长的加速是通过竞争试验、生长速率、承载量、培养产率、细胞繁殖、种子产量、器官生长，或多聚核糖体累积来测定。

70.根据权利要求69所述的转化的高等植物，其中所述生长的增加是通过生长速率测定。

71.根据权利要求70所述的转化的高等植物，其中，与所述未转化的植物或所述第二转化的植物相比，所述转化的高等植物具有从0.01％至2.0％，从2％至4％，从4％至6％，从6％至8％，从8％至10％，从10％至12％，从12％至14％，从14％至16％，从16％至18％，从18％至20％，从20％至22％，从22％至24％、从24％至26％，从26％至28％，从28％至30％，从30％至50％，从50％至100％，从100％至150％，从150％至200％，从200％至250％、从250％至300％、从300％至350％、从350至400％，或400％至600％的生长速率的增加。

72.根据权利要求68所述的转化的高等植物，其中所述高等植物是拟南芥。

73.根据权利要求68所述的转化的高等植物，其中所述高等植物是芸苔属、大豆属、棉属、苜蓿属、玉米属、高粱属、稻属、小麦属，或稷属。