CN112384619A - 具有增加的脂质产生的微生物和组合物及其制备和使用方法 - Google Patents

具有增加的脂质产生的微生物和组合物及其制备和使用方法 Download PDF

Info

Publication number
CN112384619A
CN112384619A CN201980044488.9A CN201980044488A CN112384619A CN 112384619 A CN112384619 A CN 112384619A CN 201980044488 A CN201980044488 A CN 201980044488A CN 112384619 A CN112384619 A CN 112384619A
Authority
CN
China
Prior art keywords
microorganism
mutant
gene
algal
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980044488.9A
Other languages
English (en)
Inventor
E·R·莫里林
T·卡尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viridos Inc
Original Assignee
Synthetic Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synthetic Genomics Inc filed Critical Synthetic Genomics Inc
Publication of CN112384619A publication Critical patent/CN112384619A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01211Long-chain-3-hydroxyacyl-CoA dehydrogenase (1.1.1.211)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/03Oxidoreductases acting on the CH-CH group of donors (1.3) with oxygen as acceptor (1.3.3)
    • C12Y103/03006Acyl-CoA oxidase (1.3.3.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/03Oxo-acid-lyases (4.1.3)
    • C12Y401/03001Isocitrate lyase (4.1.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01017Enoyl-CoA hydratase (4.2.1.17), i.e. crotonase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种突变体藻类微生物,所述突变体藻类微生物具有使TrifuncB和/或TrifuncA的表达弱化并且因此产生比对照藻类微生物更多的脂质的突变。所述突变体藻类微生物可以进一步包含对如ACO1或PXA1基因等过氧化物酶体β氧化通路蛋白或如ICL1基因等乙醛酸通路蛋白进行编码的基因中的突变,所述突变导致表达弱化以及脂质产生进一步增加。此外,本文提供了使用所述突变体藻类微生物产生脂质的方法以及制备突变体微生物的方法。

Description

具有增加的脂质产生的微生物和组合物及其制备和使用方法
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求于2018年7月23日提交的美国序列号62/702,253的优先权权益,所述申请的全部内容通过引用整体并入本文。
序列表的并入
所附序列表中的材料特此通过引用并入到本申请中。名称为SGI2190_1WO_Sequence_Listing的所附序列表文本创建于2019年7月16日并且大小为162kb。可以在使用Windows OS的计算机上使用Microsoft Word访问此文件。
技术领域
本发明涉及具有增加的脂质生产力的突变体藻类微生物及其在产生脂质中的用途。
背景技术
已经通过尝试操纵对用于氮同化或脂质代谢的酶进行编码的基因以及对涉及脂质储存的多肽进行编码的基因而进行通过增加脂质生物合成来改进脂质生产力的多种尝试。例如,US 2014/0162330公开了三角褐指藻(Phaeodactylum tricornutum)菌株,其中通过基于RNAi的敲低弱化硝酸还原酶(NR)基因的表达;Trentacoste等人((2013)《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》110:19748-19753)公开了用靶向被预测涉及脂质分解代谢的Thaps3_264297基因的RNAi构建体转化的硅藻;以及WO 2011127118公开了用对油质蛋白(脂质储存蛋白)进行编码的基因以及用对二酰基甘油转移酶(DGAT)基因进行编码的基因转化衣藻(Chlamydomonas)。尽管在每种情况下基于显微术或用亲脂性染料染色断言脂质生产增加,但是没有提供由操纵的细胞生产的脂质的定量,也没有确定生物质与脂质生产力之间随时间推移的关系。
Daboussi等人2014(《自然通讯(Nature Comm.)》5:3881)报道了在三角褐指藻中破坏UGPase基因导致脂质积累增加,所述三角褐指藻被认为提供昆布多糖(laminarin)(储存碳水化合物)合成的前体。然而,没有显示生物化学数据表明昆布多糖含量受到影响(或甚至存在)并且没有报道脂质和生物质生产力。类似地,若干个小组已经报道了在衣藻无淀粉突变体中脂质积累的增加(Wang等人2009,《真核细胞(Eukaryotic Cell)》8:1856-1868;Li等人2010,《代谢工程学(Metab Eng.)》12:387-391),然而,实际测量脂质生产力的连续报道得出结论:这些菌株在光养条件下生长时生长受损(Siaut等人(2011),《BMC生物技术(BMC Biotechnol.)》11:7;Davey等人2014,《真核细胞(Eukaryot Cell)》13:392-400)。这些报道得出结论,野生型亲本菌株实际上实现了最高的脂质生产力(以TAG每升每天测量)。
WO 2011/097261和US 20120322157报道了对抑制蛋白进行编码的被称为“SN03”的基因在衣藻中过表达时在营养充满条件下具有增加脂质产生的作用。然而,观察到SN03基因的过表达导致未标识的极性脂质(其未被定量)的出现,并且不导致甘油三酯(TAG)的增加。Boyle等人((2012)《生物化学杂志(J.Biol.Chem.)》287:15811-15825)描述了被标识为潜在地调节应激诱导的脂质生物合成的另一种多肽。在衣藻中敲除对“SQUAMOUSA”结构域多肽进行编码的NRR1基因导致在氮耗尽下的脂质生物合成相对于野生型细胞减少;然而,没有获得显示脂质产生增加的突变体。US 2010/0255550建议在藻类细胞中过表达推定的转录因子(“TF1、TF2、TF3、TF4和TF5”)以增加脂质产生,但是没有公开脂质产生增强的突变体。
US 2017/005803公开了ZyCys调节基因,当在包含硝酸盐的培养基中培养时,所述调节基因的弱化导致突变体藻类中脂质生产力增加。突变体藻类在培养物中显示生长,以野生型细胞的至少80%的速率积累生物质,同时产生多达野生型祖代菌株两倍的脂质。US2017/0121742公开了突变体藻类,其具有弱化的对具有溴结构域和TAZ锌指结构域的多肽进行编码的基因的表达,其证明了相对于野生型藻类提高的脂质生产力和生物质生产力的最小降低。
脂肪酸降解发生在植物和真菌的过氧化物酶体中,而在动物中,线粒体在脂肪酸的β氧化中发挥重大作用(Poirier等人,(2006)《生物化学与生物物理学学报(BiochemBiophys Acta)》1763:1413-1426;Bartlett和Eaton(2004),《欧洲生物化学杂志(Eur.J.Biochem.)》271:462-469)。Germain等人(《植物学杂志(Plant J.)》28:1-12,2001)公开了在对过氧化物酶体3-酮酰基-CoA硫解酶进行编码的KAT2基因中突变的拟南芥属(Arabidopsis)幼苗证明在发育中的幼苗中脂质体和TAG的持久性,以及Slocombe等人,(《植物生物技术杂志(Plant Biotechnol.J.)》7:694-703,2009)公开了具有对过氧化物酶体转运蛋白或过氧化物酶体酰基-CoA氧化酶进行编码的突变基因的拟南芥属植物在衰老叶中TAG积累增加。US 2016/0097066提出弱化对过氧化物酶体β氧化通路的组分进行编码的基因在产油酵母(如耶氏酵母属(Yarrowia))中的表达,包含酰基-CoA氧化酶、多功能酶(包含羟酰基-CoA脱氢酶和烯酰基-CoA水合酶的结构域)以及氧酰基-CoA硫解酶,以改进脂肪酸生产,但是US 2016/0215308公开了破坏过氧化物酶体转运蛋白(PXA2)和过氧化物酶体酰基-CoA氧化酶(POX1)的基因未改进在被工程化以过量生产脂肪酸的酵母属(Saccharomyces)菌株中的脂肪酸生产。
发明内容
在第一方面,本文提供了一种突变体微生物,如藻类或不等鞭毛体微生物,所述突变体微生物具有弱化的编码线粒体β氧化通路的多肽的至少一个基因的表达。例如,使其表达弱化的基因可以编码酰基-CoA脱氢酶、三功能蛋白α亚基或三功能蛋白β亚基。在一些实施例中,突变体微生物包含导致线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化的突变。对线粒体β氧化通路的多肽进行编码的基因的表达相对于对照微生物(例如,突变体微生物源自其的菌株的微生物)是弱化的。可以通过基因工程化使基因的表达弱化或可以是经典突变的结果。相比于对照藻类或真菌微生物(例如,野生型微生物或来自突变体微生物的微生物),具有弱化的对线粒体β氧化通路的多肽进行编码的基因表达的微生物可以具有更高的脂质生产力,并且例如可以在每日基础上积累更多的脂质。
本文提供的具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达的突变体微生物可以任选地另外具有弱化的编码过氧化物酶体β氧化通路的多肽的至少一个基因表达。例如,除了弱化的对酰基-CoA脱氢酶、TrifuncA或TrifuncB进行编码的基因表达之外,突变体微生物可以具有弱化的对酰基-CoA氧化酶或具有烯酰基-CoA水合酶和羟酰基-CoA脱氢酶活性的过氧化物酶体多功能酶或酮酰基-硫解酶或其任何组合进行编码的基因表达。可替代地或另外,本文提供的具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达的突变体微生物可以任选地另外具有弱化的编码过氧化物酶体酰基-CoA转运蛋白的至少一个基因表达。可替代地或除了任何上述内容之外,本文提供的具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达的突变体微生物可以任选地另外具有弱化的编码乙醛酸通路的酶(例如,异柠檬酸裂解酶)的至少一个基因表达。因此,在另外的方面,本文提供了一种突变体微生物,所述突变体微生物具有弱化的编码参与脂肪酸氧化的线粒体通路的多肽的至少一个基因表达以及弱化的编码参与脂肪酸氧化的过氧化物酶体通路(包含作为酶或作为转运蛋白)或乙醛酸通路的多肽的至少一个基因表达。相比于突变体微生物相同物种的对照微生物,所述突变体微生物可以在每体积或每面积基础上产生更多的脂质,例如可脂肪酸甲酯衍生的脂质(FAME脂质)。突变体微生物可以是藻类或不等鞭毛体微生物。
相比于对照微生物,本文提供的具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达以及另外具有弱化的编码酰基-CoA转运蛋白、在脂肪酸分解代谢中起作用的过氧化物酶体酶或乙醛酸通路的酶中的任一种的一个或多个另外的基因表达的突变体微生物可以具有更高的脂质生产力和/或可以在每日基础上积累更多的脂质,例如野生型微生物或具有弱化的线粒体β氧化基因以及过氧化物酶体酰基-CoA转运蛋白、过氧化物酶体酶和乙醛酸通路的酶中的至少一种的表达的突变体源自其的微生物。
具有弱化的线粒体β氧化通路并且任选地过氧化物酶体β氧化通路基因、过氧化物酶体酰基-CoA转运蛋白或乙醛酸通路酶的表达的微生物可以具有一种或多种另外的基因修饰,包含但不限于对脂质生物合成、光合效率、氮代谢、转运蛋白或对除草剂或毒素的抗性的调节因子进行编码的基因的修饰。此类修饰可以是基因工程化或经典诱变的结果。突变体微生物中的基因修饰还可以包含引入的基因或增加一个或多个基因的表达的突变,例如影响脂质生物合成、生长、除草剂或毒素抗性、光合效率等的基因。作为非限制性实例,所述微生物可以是藻类或不等鞭毛体微生物,例如微藻(microalga),如可以属于矽藻门(Bacillariophytes)(硅藻们(diatoms))、黄绿藻门(Eustigmatophytes)、黄藻门(Xanthophytes)、褐藻门(Phaeophytes)、金藻门(Chrysophytes)、绿鞭藻门(Raphidophytes)或绿藻门(Chlorophytes)(例如,绿藻纲(Chlorophyceae)、四爿藻纲(Chlorodendrophyceae)、共球藻纲(Trebouxiophyceae)或绿枝藻纲(Prasinophyceae)的成员)的真核微藻。例如,工程化或突变体微生物可以是属于例如矽藻门或黄绿藻门的藻类不等鞭毛体物种。可替代地,所述微生物可以是异养不等鞭毛体,如网粘菌纲(Labyrinthulomycete),例如网粘菌属(Labyrinthulids)或破囊壶菌属(Thraustochytrids)的成员。
本发明进一步包含生物质,所述生物质包括本文提供的突变体微生物以及本文提供的突变体微生物的裂解物或提取物。还考虑了包含此类生物质、裂解物或提取物的产品,包含食品、饲料以及生物燃料原料。
本发明的又另一方面是产生脂质的方法,所述方法包含培养突变体微生物和从培养物中分离脂质,所述突变体微生物具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达。还包含一种产生脂质的方法,所述方法包含培养突变体微生物以及从培养物中分离脂质,所述突变体微生物具有弱化的编码线粒体β氧化通路的多肽的至少一个基因表达以及弱化的编码酰基-CoA转运蛋白、在脂肪酸分解代谢中起作用的过氧化物酶体酶或乙醛酸通路的酶中的任一种的至少一个基因表达。
本发明的另一方面是改善微生物的脂质积累或生产力的方法,其中所述方法包含使编码在过氧化物酶体脂肪酸氧化通路中起作用的多肽和在线粒体β氧化通路中起作用的至少一种酶的至少一个基因的表达。
当结合附图阅读本发明的以下详细描述时,本发明的这些和其它目的和特征将变得更充分明显。
附图说明
图1.示意性描绘了迦得拟微球藻(Nannochloropsis gaditana)野生型菌株3730(“WT-3730”)中的线粒体和过氧化物酶体β氧化以及β氧化后的代谢通路。已经产生Cas9介导的插入突变的基因用X's指示,这指示已经被去官能化的代谢节点。
图2.示意性描绘了迦得拟微球藻WT-3730中的TrifuncB基因座和选择用于Cas9介导的最小HygR盒(“所选靶标”)插入的区域。实心块表示外显子,并且内含子以线描绘。还显示了用于确认插入诱变的测序引物的位置。
图3.与在分批生产力筛选中运行的野生型菌株WT-3730的两种培养物相比,针对TrifuncB敲除分离株#42的两种培养物绘制的FAME/TOC的图示。
图4.三种独立的TrifuncB敲除分离株以及在FAME/TOC基础上呈现的分批生产力筛选中生长的野生型WT-3730迦得拟微球藻菌株的脂肪酸谱的图示。显示了来自采样第5天的数据。
图5A-5C.在卡那霉素(kanamycin)对照菌株的存在下生长的Trifunc-B-KO菌株GE-8256、WT-3730和WT-3730的半连续生产力测定(SCPA)数据的图示。菌株是在模拟加利福尼亚州南部的春日的二十四小时光方案下以30%每日稀释率运行的。显示了所述菌株中的每种菌株的:A)FAME生产力;B)FAME/TOC;以及C)TOC生产力平均值。GE-8256显示FAME/TOC(B)相对于野生型增加~13%。
图6A-6C.TrifuncB敲除菌株GE-8256和产生的靶向过氧化物酶体β氧化中的两个不同基因(PXA1和ACO1)和GE-8256菌株中的乙醛酸循环(ICL)的基因的双突变体的SCPA生产力结果的图示。来自至少连续5天内的数据的生物一式三份半连续培养物的平均值和标准偏差显示了:A)稳定状态FAME/TOC;B)FAME生产力;以及C)TOC生产力。相对于野生型(WT-3730)的百分比变化是由每列上方的文本指示的。菌株如下:GE-8256、TrifuncB-KO;GE-8904、TrifuncB-KO/ICL-KO;GE-8905、TrifuncB-KO/PXA1-KO;GE-8907、TrifuncB-KO/ACO1-KO;野生型WT-3730。
具体实施方式
定义
除非另外定义,否则本文所使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在发生冲突的情况下,以包含定义的本申请为准。除非上下文另外要求,否则单数术语应包含复数含义,并且复数术语应包含单数含义。除非另外特别指出,否则本申请内提供的所有范围均包含所述范围的上端和下端的值。
出于所有目的,本文提及的所有出版物、专利和其它参考文献均通过引用整体并入本文,如同每个单独的出版物或专利申请被专门地且单独地指出通过引用并入。
所有标题均是为了读者的方便并且不限制本发明。
在本文中在短语,如“A和/或B”中所使用的术语“和/或”旨在包含“A和B”、“A或B”、“A”以及“B”中的任何一个。
“约”意指在所述值的10%内或在所述值的5%内或在一些情况下在所述值的2.5%内,或“约”可以意指四舍五入到最接近的有效数字。
术语“基因”广泛地用于指对多肽或表达的RNA进行编码的核酸分子(通常为DNA,但任选地为RNA)的任何区段。因此,基因包含对表达的RNA进行编码的序列(其可以包含多肽编码序列或例如功能RNA,如核糖体RNA、tRNA、反义RNA、微RNA、短发夹RNA、核酶等)。基因可以进一步包括其表达所需或影响其表达的调节序列,以及与蛋白质或处于其天然状态的RNA编码序列相关的序列,例如内含子序列、5'或3'非翻译序列等。在一些实例中,“基因”可以仅指DNA或RNA分子的蛋白质编码部分,其可以包含或可以不包含内含子。基因可以具有任何长度,并且优选地长度大于50个核苷酸,更优选地长度大于100个核苷酸,并且可以是例如长度介于50个核苷酸与500,000个核苷酸之间,如长度介于100个核苷酸与100,000个核苷酸之间或长度介于约200个核苷酸与约50,000个核苷酸之间或长度介于约200个核苷酸与约20,000个核苷酸。基因可以从多种来源获得,包含从兴趣来源克隆或从已知或预测的序列信息合成。
术语“核酸”或“核酸分子”是指DNA或RNA(例如,mRNA)的区段,并且还包含具有经过修饰的主链(例如,肽核酸、锁核酸)或经过修饰的或非天然存在的核碱基的核酸。核酸分子可以是双链或单链的;包括基因或其部分的单链核酸分子可以是编码(有义)链或非编码(反义)链。
核酸分子可以“源自”指定来源,其包含从指定来源分离(全部或部分)核酸区段。核酸分子还可以通过例如从指定的多核苷酸来源直接克隆、PCR扩增或人工合成而源自指定来源,或基于与指定的多核苷酸来源(其可以是例如生物体物种)相关的序列。源自特定来源或物种的基因或核酸分子还包含相对于来源核酸分子具有序列修饰的基因或核酸分子。例如,源自来源的基因或核酸分子(例如,特定参考基因)可以包含相对于来源基因或核酸分子的一个或多个突变,所述一个或多个突变是非预期的或有意引入的,并且如果有意引入一个或多个突变(包含取代、缺失或插入),则可以通过细胞或核酸的随机或靶向突变、通过扩增或其它基因合成或分子生物学技术或通过化学合成或其任何组合来引入序列改变。源自编码功能RNA或多肽的参考基因或核酸分子的基因或核酸分子可以编码与参考或来源功能RNA或多肽或与其功能片段至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的功能RNA或多肽。例如,源自编码功能RNA或多肽的参照基因或核酸分子的基因或核酸分子可以编码功能RNA或多肽,所述功能RNA或多肽与参照或来源功能RNA或多肽或与其功能片段具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。
如本文所使用的,“分离的”核酸或蛋白质是从其天然环境或核酸或蛋白质在自然界中存在的环境中去除的。例如,将分离的蛋白质或核酸分子从在其天然或自然环境中与其相关的细胞或生物体中去除。在某些情况下,分离的核酸或蛋白质可以被部分或基本上纯化,但是分离不需要特定的纯化水平。因此,例如,分离的核酸分子可以是已经从其自然整合的染色体、基因组或附加体切除的核酸序列。
“纯化的”核酸分子或核苷酸序列或蛋白质或多肽序列基本上不含细胞物质和细胞组分。例如,纯化的核酸分子或蛋白质可以基本上不含除缓冲液或溶剂之外的化学品。“基本上不含”不旨在意指除新核酸分子之外的其它组分是不可检测的。
术语“天然存在的”和“野生型”是指在自然界中发现的形式。例如,天然存在的或野生型核酸分子、核苷酸序列或蛋白质可以存在于天然来源中并且从天然来源分离,并且不是通过人为操纵有意修饰的。
如本文所使用的,“弱化”意指量、程度、强度(intensity)或强度(strength)降低。弱化的基因表达可以指所讨论的基因的转录或经过编码的蛋白质的翻译、折叠或组装的显著减少的量和/或速率。作为非限制性实例,弱化的基因可以是突变的或破坏的基因(例如,通过部分或完全缺失、截短、移码或插入突变而破坏的基因),所述突变的或破坏的基因不编码完全功能开放阅读框或由于编码或非编码序列(包含基因的转录区或翻译区的序列5'和基因的转录区或翻译区的序列3')的改变或破坏而具有降低的表达,并且可以包含例如基因调节序列。弱化的基因还可以是由构建体的核酸分子靶向的基因,所述构建体降低基因的表达,例如反义RNA、微RNA、RNAi分子或核酶。如本文所使用的,“突变体”,如“突变体生物体”、“突变体微生物”、“突变体藻类”“突变体藻类微生物”、“突变体不等鞭毛体微生物(mutant heterkont)”、“突变体细胞”等是指在基因序列或其相邻的5'或3'序列中具有一个或多个改变(插入、缺失、取代等)的生物体和细胞,并且还指包含靶向基因或其表达的外源核酸分子和/或基因构建体的生物体和细胞,例如反义RNA分子或用于表达反义RNA分子的构建体、RNAi构建体或RNAi分子、核酶或用于生产核酶的构建体等。弱化的基因表达可以是被消除,例如减少到不显著或不可检测的量的基因表达。弱化的基因表达还可以是导致不完全功能或非功能的RNA或蛋白质的基因表达,例如弱化的基因表达可以是导致截短的RNA和/或多肽或导致具有影响蛋白质折叠、蛋白质复合物组装和/或蛋白质活性的一个或多个氨基酸取代的多肽的基因表达。
“外源核酸分子”、“外源核酸”、“外源DNA”或“外源基因”是指已经被引入(“转化”)到细胞中的核酸分子或基因。经过转化的细胞可以称为重组细胞,另外的一个或多个外源基因可以任选地引入到所述重组细胞中。如果用核酸分子转化的细胞的后代已经遗传外源核酸分子,则其也称为“经过转化的”。相对于被转化的细胞,外源基因可以来自不同物种(并且因此是“异源的”)或来自同一物种(并且因此是“同源的”)。“内源”核酸分子、基因或蛋白质是天然核酸分子、基因或蛋白质,因为其存在于宿主中或由宿主天然产生。
本文所使用的术语“天然的”用于指代核酸序列或氨基酸序列,因为所述核酸序列或氨基酸序列天然存在于宿主中。本文所使用的术语“非天然的”用于指代不天然存在于宿主中的核酸序列或氨基酸序列。已经从细胞中去除、经历实验室操纵并且引入或再引入到宿主细胞中,使得其在基因组中的序列或位置相对于其在未操纵的生物体中的位置不同(即,在非转化生物体中与其未并置或可操作地连接的序列并置或可操作地连接)的核酸序列或氨基酸序列被认为是“非天然的”。因此,非天然基因包含对宿主微生物内源的基因,所述基因可操作地连接到已经重组到宿主基因组中的一个或多个异源调节序列。
“重组的”或“工程化的”核酸分子是已经通过人为操纵改变的核酸分子。作为非限制性实例,重组核酸分子包含执行以下的任何核酸分子:1)在体外已经部分地或完全地合成或修饰,例如使用化学或酶技术(例如,通过使用化学核酸合成或通过使用用于核酸分子的复制、聚合、消化(核酸外切或核酸内切)、连接、逆转录、转录、碱基修饰(包含例如甲基化)、整合或重组(包含同源和位点特异性重组)的酶);2)包含本质上不连接的连接核苷酸序列;3)已经使用分子克隆技术工程化,使得其相对于天然存在的核酸分子序列缺少一个或多个核苷酸;和/或4)已经使用分子克隆技术进行操纵,使得其相对于天然存在的核酸序列具有一个或多个序列改变或重排。作为非限制性实例,cDNA是重组DNA分子,如已经通过体外一个或多个聚合酶反应产生的或连接子已经附接到的或已经整合到载体(如克隆载体或表达载体)中的任何核酸分子。
如本文所使用的,术语“重组蛋白”是指通过基因工程产生的蛋白质,无论氨基酸是否不同于野生型蛋白的氨基酸。
当应用于生物体时,术语重组、工程化或基因工程化是指已经通过将异源或外源重组核酸序列引入到生物体中而被操纵的生物体,并且包含基因敲除、靶向突变、基因置换和启动子置换、缺失或插入,以及将转基因或合成基因引入到生物体中。重组或基因工程化的生物体还可以是其中已经引入用于基因“敲低”的构建体的生物体。此类构建体包含但不限于RNAi、微RNA、shRNA、siRNA、反义和核酶构建体。还包含其基因组已经被大范围核酸酶、锌指核酸酶、TALEN或CRISPR/Cas系统的活性改变的生物体。外源或重组核酸分子可以整合到重组/基因工程化生物体的基因组中,或在其它情况下可以不整合到宿主基因组中。如本文所使用的,“重组微生物”或“重组宿主细胞”包含本发明的重组微生物的后代或衍生物。因为由于突变或环境影响而在后续世代中可能发生某些修饰,所以这种后代或衍生物可能实际上与亲本细胞不同,但仍包含在本文所使用的术语的范围内。
“对照细胞”或“对照微生物”是基本上与所提及的操纵的、重组的或突变体细胞相同的细胞或微生物,除了对照细胞不具有操纵的、重组的或突变体细胞的修饰。对照细胞可以是野生型细胞,例如操作的、重组的或突变体细胞直接或间接源自其的菌株的野生型细胞。对照细胞可以是“基本上基因上相同的”或“基因上本质上相同的”,这意味着所述对照细胞包含与突变体或重组细胞或生物体相同的物种或菌株基因组以及相同的引入的构建体或基因改变,同时考虑到除了本文所述的变化之外,对照微生物与突变体微生物之间可能存在微小的且不重要的(出于与脂质生产力相关的本发明的目的)差异。例如,可能存在与在对照基因组和突变体基因组中不同的任何TrifuncA、TrifuncB、过氧化物酶体转运蛋白(perosisomal transporter)、酰基-CoA氧化酶和异柠檬酸裂解酶基因无关的小核苷酸多态性(SNP)。
在没有进一步解释预期含义的情况下,提及“基本上相同(substantially thesame)”或“基本上相同(substantially identical)”的特性旨在表示所述特性在参考值的10%之内,并且优选地在5%内,并且可以在参考值的2.5%内、在1%内或在0.5%内。在未阐述在特定上下文中“基本上”的预期含义的情况下,所述术语用于包含对于在本发明的上下文中被认为重要的特征而言无感紧要的微小且不相关的偏差。
尽管与本文所述的那些方法和材料类似或等同的方法和材料可以用于本发明的实践或测试中,但是下面描述了合适的方法和材料。材料、方法和实例仅是说明性的并且不旨在是限制性的。根据具体实施方式和权利要求,本发明的其它特征和优点将变得显而易见。
如本文所使用的,“相同的条件”或“相同的培养条件”意指基本上相同的条件,即参考条件之间的任何差异均是微小的并且与对于本发明而言是重要的微生物的功能或特性(例如,脂质产生或生物质产生)是不相关的。
“原型间隔相邻基序”或“PAM”是DNA序列,通常长度为二到八个核苷酸,例如长度为二到四个核苷酸,紧接着在Cas蛋白靶向的DNA序列之后或之前。PAM序列被认为对于Cas蛋白结合或切割靶DNA序列很重要。由微生物中的Cas蛋白引起的一些突变将位于许多碱基对内的PAM序列的上游或下游,如在5个碱基对内、在10个碱基对内、在15个碱基对内、在20个碱基对内、在25个碱基对内、在30个碱基对内、在35个碱基对内、在40个碱基对内、在45个碱基对内或在50个碱基对内。
术语“启动子”是指能够结合细胞中的RNA聚合酶并启动下游(3'方向)编码序列的转录的核酸序列。启动子包含以高于背景的可检测水平启动转录所必需的最小数量的碱基或元件。启动子可以包含转录起始位点以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。真核启动子通常但不总是含有“TATA”框和“CAT”框。原核启动子可以含有-10和-35原核启动子共有序列。来自多种不同来源的大量启动子,包含组成型、诱导型和阻遏型启动子在本领域中是众所周知的。代表性来源包含例如藻类、病毒、哺乳动物、昆虫、植物、酵母和细菌细胞类型,并且来自这些来源的合适的启动子容易获得,或可以基于在线公开可获得的序列合成制备,或例如来自保藏中心(如ATCC)以及其它商业或个人来源。启动子可以是单向的(在一个方向上启动转录)或双向的(在任一方向上启动转录)。启动子可以是组成型启动子、阻遏型启动子或诱导型启动子。除了RNA聚合酶结合以启动转录的基因近端启动子之外,启动子区还可以包含基因上游的另外序列,所述另外序列可以处于基因的转录起始位点的1kb、2kb、3kb、4kb、5kb或更多内,其中所述另外序列可以影响下游基因的转录速率并且任选地影响启动子对发育、环境或生物化学(例如,代谢)条件的反应性。
当关于多核苷酸、基因、核酸、多肽或酶使用时,术语“异源的”是指来自来源或源自除了宿主生物体物种之外的来源的多核苷酸、基因、核酸、多肽或酶。相比而言,“同源的”多核苷酸、基因、核酸、多肽或酶在本文中用于表示源自宿主生物物种的多核苷酸、基因、核酸、多肽或酶。当提及基因调节序列或提及用于保持或操纵基因序列的辅助核酸序列时(例如启动子、5'非翻译区、3'非翻译区、poly A添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等),“异源的”意指调节序列或辅助序列不与调节序列或辅助核酸序列与之并置在构建体、基因组、染色体或附加体中的基因天然地缔合。因此,可操作地连接到其在其天然状态下(即,在非基因工程化生物的基因组中)不可操作地连接的基因的启动子在本文中被称为“异源启动子”,即使所述启动子可以源自与其连接的基因相同的物种(或在一些情况下,同一生物)。
如本文所使用的,术语“蛋白质”或“多肽”旨在涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不指产物的特定长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指代两个或更多个氨基酸的一条或多条链的任何其它术语均包含在“多肽”的定义内,并且术语“多肽”可以代替这些术语中的任何术语或与其互换使用。
基因ID号(通常在基因或物种名称之后的括号中提供)是在美国国立卫生研究院维护的国家生物技术信息中心(NCBI)网站(ncbi.nlm.nih.gov)可公开获得的序列记录的唯一标识符。“基因ID”与基因的核苷酸和氨基酸序列相关。基于基因ID号搜索和获得核酸或基因序列或蛋白质序列在例如细胞生物学、生物化学、分子生物学和分子基因学领域中是众所周知的。除了基因名称之外,来自本文所提供的藻类迦得拟微球藻的基因还与nannochloropsis.org的万维网上的Naga编号相关。这些数字是指迦得拟微球藻基因组中的特定位置。技术人员将能够使用这些数字来搜索和获得核酸或基因序列或蛋白质序列。
如本文所使用的,相对于核酸或多肽序列的术语“同一性百分比”或“同源性”被定义为在比对序列以达到最大百分比同一性并且引入空位(如果必要的话)以实现最大百分比同源性之后,在候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N末端或C末端插入或缺失不应被解释为影响同源性,并且在多肽序列中少于约60个、少于约50个、少于约40个、少于约30个、少于约20个或少于约10个氨基酸残基的内部缺失和/或插入不应被解释为影响同源性。核苷酸或氨基酸序列水平的同源性或同一性可以使用程序blastp、blastn、blastx、tblastn和tblastx(Altschul(1997),《核酸研究(Nucleic Acids Res.)》25,3389-3402,和Karlin(1990),《美国国家科学院院刊》87,2264-2268)所采用的算法,通过BLAST(基本局部比对搜索工具)分析来确定,其被定制成用于序列相似性搜索。BLAST程序所使用的方法是首先考虑查询序列与数据库序列之间具有和不具有缺口的相似区段,然后评估所标识的所有匹配的统计显著性,并且最后仅概括满足预先选择的显著性阈值的那些匹配。关于序列数据库类似性搜索中的基本问题的讨论,参见Altschul(1994),《自然遗传学(Nature Genetics)》6,119-129。直方图、描述、比对、预期(即,用于报道针对数据库序列的匹配的统计显著性阈值)、截断、矩阵和过滤器(低复杂度)的搜索参数可以处于默认设置。blastp、blastx、tblastn和tblastx所使用的默认评分矩阵是BLOSUM62矩阵(Henikoff(1992),《美国国家科学院院刊》89,10915-10919),推荐长度超过85的查询序列(核苷酸碱基或氨基酸)。
对于设计用于比较核苷酸序列的blastn,评分矩阵通过M(即,一对匹配残基的奖励评分)与N(即,错配残基的罚分)的比率来设定,其中M和N的默认值可以分别为+5和-4。四个blastn参数可以调整如下:Q=10(空位产生罚分);R=10(空位延伸罚分);wink=1(在沿着查询的每个winkth位置处生成字命中);和gapw=16(设置其中生成空位对准的窗口宽度)。用于比较氨基酸序列的等效Blastp参数设置可以是:Q=9;R=2;wink=1;和gapw=32。GCG软件包10.0版中可获得的序列之间的Bestfit比较可以使用DNA参数GAP=50(空位产生罚分)和LEN=3(空位延伸罚分),并且蛋白质比较中的等同设置可以是GAP=8和LEN=2。
因此,当提及本发明的多肽或核酸序列时,包含的是与全长多肽或核酸序列或与其片段(其包括整个蛋白质的至少50个、至少75个、至少100个、至少125个、至少150个、至少200个或更多个氨基酸残基的连续序列)至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、或至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列同一性的序列同一性;此类序列的变体,例如其中至少一个氨基酸残基已经被插入所公开的含有插入和取代的一个或多个序列的N-末端和/或C-末端和/或内部。预期的变体可以另外或可替代地包含通过例如同源重组或定点或PCR诱变而含有预定突变的那些变体以及其它物种的对应多肽或核酸,包含但不限于本文所述的那些多肽或核酸,含有插入和取代的多肽或核酸家族的等位基因或其它天然存在的变体;和/或衍生物,其中多肽已经通过取代、化学、酶或其它适当的方式用除了含有插入和取代的天然存在的氨基酸之外的部分(例如,可检测部分,如酶)共价修饰。
如本文所使用的,“表达”包含至少在RNA产生水平上的基因表达,并且“表达产物”包含所表达基因的所得产物,例如多肽或功能RNA(例如,核糖体RNA、tRNA、反义RNA、微RNA、shRNA、核酶等)。术语“增加的表达”包含基因表达的改变以促进增加的mRNA产生和/或增加的多肽表达。[基因产物的]“产生的增加”包含与多肽的天然产生或酶活性相比,多肽表达量、多肽的酶活性水平或两者的组合的增加。
本发明的一些方面包含特定多核苷酸序列的表达的部分、实质或完全缺失、沉默、失活或下调。基因可以被部分地、基本上或完全地缺失、沉默、失活,或其表达可以被下调,以便影响由其编码的多肽所执行的活性,如酶的活性。通过插入破坏基因的功能和/或表达的核酸序列(例如,病毒插入、转座子诱变、大范围核酸酶工程化、同源重组、cas/CRISPR介导的通过非同源末端连接DNA修复或插入破坏基因的核酸序列(供体片段)的突变产生或本领域已知的其它方法),基因可以被部分地、基本上或完全地缺失、沉默、失活或下调。术语“消除(eliminate)”、“消除(elimination)”和“敲除(knockout)”可以与术语“缺失”、“部分缺失”、“基本缺失”或“完全缺失”互换使用。在某些实施例中,可以通过定点同源重组工程化兴趣微生物,以敲除特定的兴趣基因。在仍其它实施例中,RNAi或反义DNA(asDNA)构建体可以用于部分地、基本上或完全地沉默、失活或下调特定的兴趣基因。进一步地,CRISPR介导的突变(如但不限于供体片段在基因的非编码区(如启动子区、5'UTR或3'UTR)中的插入)可能导致靶向基因的表达减少。
某些核酸分子或特定多核苷酸序列的这些插入、缺失或其它修饰可以被理解为涵盖“一种或多种基因修饰”或“一种或多种转化”,使得微生物或宿主细胞的所得菌株可以被理解为“经过基因修饰的”、“基因工程化的”或“转化的”。
如本文所使用的,“下调的(down-regulated)”或“下调(down-regulation)”包含兴趣基因或核酸分子的表达或酶活性的降低,例如与尚未被下调的其它方面相同的基因或酶中的表达或活性相比,基因表达(包含但不限于降低的转录水平、降低的RNA转录物稳定性和降低的翻译水平)或酶活性的降低。
如本文所使用的,“突变体”是指在基因中具有突变的生物体,所述突变是例如使用γ辐射、UV或化学诱变剂的经典诱变的结果。如本文所使用的,“突变体”还指由于基因工程而具有改变的基因结构或表达的重组细胞,作为非限制性实例,所述重组细胞可以包含过表达,包含在不同的时间、生物或环境调节下的基因表达和/或与天然发生的程度不同程度的基因表达和/或在重组细胞中非天然表达的基因表达;同源重组,包含敲除和敲入(例如,用对具有比野生型多肽更高或更低活性的多肽进行编码的基因和/或显性阴性多肽进行基因置换);通过RNAi、反义RNA或核酶等进行的基因弱化;以及使用大范围核酸酶、TALEN和/或CRISPR技术等进行的基因组工程。因此,突变体不是天然存在的生物体。兴趣突变体生物体将通常具有与缺少突变的对应野生型或祖代菌株的表型不同的表型,其中所述表型可以通过生长测定、产物分析(例如,脂质和/或生物质分析)、光合特性、生物化学测定(例如,脂质生产力)等来评估。当提及基因“突变体”时,意指相对于天然或野生型基因,所述基因具有至少一个碱基(核苷酸)变化、缺失或插入。突变(一个或多个核苷酸的变化、缺失和/或插入)可以在基因的编码区中,或可以在内含子、3'UTR、5'UTR或启动子区中,例如转录起始位点的2kb内或翻译起始位点的3kb内。作为非限制性实例,突变体基因可以是在启动子区、内含子、3'UTR或5'UTR内具有插入的基因,其可以增加或降低基因的表达;可以是具有缺失的基因,从而导致非功能蛋白质、截短蛋白质、显性阴性蛋白质或无蛋白质的产生;可以是具有一个或多个点突变的基因,所述一个或多个点突变导致经过编码的蛋白质的氨基酸改变或导致基因转录物的异常剪接等。
术语“Pfam”是指由Pfam联盟维护的并且可在若干个受赞助的万维网网站上获得的蛋白质结构域和蛋白质家族的大集合,所述网站包含:pfam.xfam.org/(欧洲生物信息研究所(European Bioinformatics Institute)(EMBL-EBI))。Pfam的最新发布版本是Pfam29.0(2015年12月)。使用多序列比对和隐马尔可夫模型(HMM)标识Pfam结构域和家族。Pfam-A家族或结构域分配是通过使用蛋白质家族的代表性成员和基于种子比对的剖面隐马尔可夫模型的策划种子比对产生的高质量分配。(除非另外说明,否则所查询的蛋白质与Pfam结构域或家族的匹配是Pfam-A匹配。)然后将属于家族的所有经过标识的序列用于自动生成所述家族的完全比对(Sonnhammer(1998)《核酸研究》26,320-322;Bateman(2000)《核酸研究》26,263-266;Bateman(2004)《核酸研究》32,《数据库特辑(Database Issue)》,D138-D141;Finn(2006)《核酸研究-数据库特辑(Nucleic Acids Research DatabaseIssue)》34,D247-251;Finn(2010)《核酸研究-数据库特辑》38,D211-222)。通过例如使用上述网站访问Pfam数据库,可以使用HMMER同源性搜索软件(例如,HMMER2、HMMER3或更高版本,hmmer.org)针对HMM来查询蛋白质序列。将所查询的蛋白质标识为处于pfam家族(或具有特定的Pfam结构域)的显著匹配是其中位评分大于或等于Pfam结构域的聚集阈值的那些匹配。期望值(e值)也可以用作在Pfam中包含所查询的蛋白质或用于确定所查询的蛋白质是否具有特定的Pfam结构域的标准,其中低e值(远小于1.0,例如小于0.1,或小于或等于0.01)表示匹配归因于机会的低概率。
在没有进一步解释预期含义的情况下,提及“基本上相同”或“基本上相同”的特性旨在表示所述特性在参考值的10%内,并且优选地在5%内,并且可以在2.5%内。在未阐述在特定上下文中“基本上”的预期含义的情况下,所述术语用于包含对于在本发明的上下文中被认为重要的特征而言无感紧要的微小且不相关的偏差。
如本文所使用的,“相同的条件”或“相同的培养条件”意指基本上相同的条件,即参考条件之间的任何差异均是微小的并且与对于本发明而言是重要的微生物的功能或特性(例如,脂质产生或生物质产生)是不相关的。
相对于特定的细胞类型,“充满氮(nitrogen replete)”条件是在所述条件下细胞不会由于氮不足而经历生长缺陷的条件。
如本文所使用的,“脂质(lipid)”或“脂质(lipids)”是指脂肪、蜡、脂肪酸、脂肪酸衍生物,如脂肪醇、蜡酯、烷烃以及烯烃、甾醇、甘油单酯、甘油二酯、甘油三酯、磷脂、鞘脂、糖脂以及甘油脂。如本文所使用的,“脂肪酸甲酯脂质”、“可脂肪酸甲酯衍生的脂质”、“FAME脂质”或“FAME”是指具有可以衍生为脂肪酸甲酯的酰基部分的脂质,例如单酰甘油酯、二酰甘油酯、三酰甘油酯、蜡酯以及膜脂质,如磷脂、半乳糖脂等。脂质生产力可以以毫克每升(mg/L)计的FAME生产力来评估,并且对于藻类,脂质生产力可以报告为克每平方米每天(g/m2/天)(面积生产力)。在本文提供的半连续生产力测定(SCPA)中,通过考虑入射辐照面积(SCPA烧瓶架孔为11/2”x 33/8”或0.003145m2)和培养物的体积(550ml),将mg/L值转化成g/m2/天。为了获得以g/m2/天计的生产力值,将mg/L值乘以每日稀释率(30%)和转化因子0.175。除非另外指明,否则在脂质或其亚类(例如,TAG或FAME)被称为百分比的情况下,所述百分比是重量百分比。
“生物质”是指无论是活细胞还是死细胞的细胞质量,并且可以例如使用本领域已知的方法以抽吸的沉淀物重量来评估,但是更优选地是干重(例如,培养样品或沉淀细胞的冻干物)、无灰干重(AFDW)或总有机碳(TOC)。生物质在允许生长的条件下在培养物生长期间增加,并且可以被称为分批培养物中的“生物质积累”,例如其中将微生物接种到培养物的容器中,允许生长持续一段时间并且然后收获。在经历稳定或规则稀释的连续或半连续培养中,在培养物稀释期间去除以其它方式积累在培养物中的产生的生物质。因此,这些培养物的每日生物质生产力(生物质增加)也可以被称为“生物质积累”。生物质生产力可以以毫克每升(mg/L)计的总碳(“TOC”)生产力来评估,并且对于藻类,所述生物质生产力可以报告为克每平方米每天(g/m2/天)。在本文提供的半连续测定中,通过考虑入射辐照面积(SCPA烧瓶架孔为11/2”x 33/8”或0.003145m2)和培养物的体积(550ml),将mg/L值转化成g/m2/天。为了获得以g/m2/天计的生产力值,将mg/L值乘以每日稀释率(30%)和转化因子0.175。除非另外说明,否则当生物质被表示为百分比时,所述百分比是重量百分比。
在本发明的上下文中,“氮源”是可以被主题微生物吸收和代谢并且并入生物分子中以用于生长的氮源。例如,在本发明的上下文中,包含不能被微生物吸收和/或代谢以用于生长的氮的化合物(例如,含氮的生物缓冲液,如Hepes、Tris等)不被认为是氮源。
如本文所使用的,“还原氮”是呈铵、氨、尿素或氨基酸的化学形式的氮,所述氮可以通过被培养的微生物代谢以提供并入生物分子中的氮源,从而支持生长。例如,除了铵/氨和尿素之外,还原氮可以包含各种氨基酸,其中一种或多种氨基酸可以用作主题微生物的氮源。氨基酸的实例可以包含但不限于谷氨酸、谷氨酰胺、组氨酸、赖氨酸、精氨酸、天冬酰胺、丙氨酸和甘氨酸。在可以存在于微生物培养基中的氮源的上下文中的“非还原氮”是指在被微生物同化成有机化合物之前必须被还原的硝酸盐或亚硝酸盐。
“[在培养基中]唯一氮源”与“基本上唯一氮源”可互换使用,并且指示没有其它氮源有意添加到培养基中,或没有其它氮源以足以显著增加在参考培养基中培养的微生物或细胞的生长的量存在。贯穿本申请,为了简洁起见,术语“仅硝酸盐”和“仅尿素”分别用于表征其中硝酸盐是微生物可用于支持生长的唯一氮源,或尿素是微生物可用于支持生长的唯一氮源的培养基。
类似地,“[在培养基中]唯一碳源”与“基本上唯一碳源”可互换使用,并且指示没有其它碳源以足以增加在参考培养基中培养的微生物或细胞的生产力或生长的量存在,或没有显著并入生物分子(如由微生物或细胞产生的脂质)中。
如本文所使用的,术语“线粒体三功能蛋白”或“MTP”是指具有以下酶活性的线粒体蛋白:2-烯酰基辅酶A(CoA)水合酶、长链3-羟酰基-coA脱氢酶和长链3-酮酰基CoA硫解酶(Eaton等人(2000)《生物体、器官、细胞与细胞器(Organisms,Organs,Cells,andOrganelles)》28:177-182)。MTP由TrifuncA和TrifuncB亚基构成,所述亚基在MTP全酶内具有不同的酶活性,如本文所述。“线粒体三功能蛋白亚基A”或“TrifuncA”(也称为“羟酰基-CoA脱氢酶/3-酮酰基-CoA硫解酶/烯酰基-CoA水合酶(三功能蛋白)、α亚基”并且有时被称为“多功能脂肪酸氧化复合物亚基α”)是指位于线粒体上并且能够催化长链脂肪酸的线粒体β氧化的第二步骤和第三步骤的酶,即线粒体三功能蛋白全酶的3-羟酰基-CoA脱氢酶和烯酰基-CoA水合酶活性。当NAD单独存在时,酶将中链和长链2-烯酰基-CoA化合物转化成3-酮酰基-CoA,并且当NAD和CoA存在时,则将其转化成乙酰基-CoA。TrifuncA是UniprotW7TLR9(参见互联网uniprot.org)并且包含与酶委员会编号(Enzyme CommissionNumbers)1.1.1.211和4.2.1.17相对应的那些酶。TrifuncA包含pfam结构域PF00378(ECH-1,烯酰基-CoA水合酶/异构酶;“巴豆酸酶家族注释=‘巴豆酸酶/烯酰基-辅酶A(CoA)水合酶超家族’”)并且还包含pfam结构域PF02737(3HCDH_N,3-羟酰基-CoA脱氢酶,NAD结合结构域)和pfam结构域PF00725(3HCDH,3-羟酰基-CoA脱氢酶,C-末端结构域)。TrifuncA包含保守结构域“cl28491”,也被称为“FadJ超家族”。可以搜索蛋白质序列以标识ncbi.nlm.nih的保守结构域(BLAST菜单的CDD或“保守结构域数据库”)。
在SEQ ID NO:1中提供了野生型迦得拟微球藻TrifuncA的氨基酸序列。在SEQ IDNO:2中提供了对野生型迦得拟微球藻TrifuncA进行编码的cDNA的核苷酸序列。在SEQ IDNO:3中提供了野生型迦得拟微球藻TrifuncA基因的基因组DNA的核苷酸序列。可以在染色体基因座Naga_100466g3或NG_scf06(299664-304033)处发现迦得拟微球藻TrifuncA基因(参见在万维网nannochloropsis.org上可获得的微拟球藻(Nannochloropsis)基因组)。技术人员可以使用本公开,例如使用基因组DNA或cDNA来标识其它微生物物种(如藻类或不等鞭毛体物种)中的TrifuncA基因,作为对具有诊断TrifuncA多肽的蛋白质结构域和/或当表达时具有TrifuncA的酶活性的蛋白质进行编码的基因。来自与TrifuncA同源的其它物种的基因的实例如下,并且应当帮助技术人员标识其它微生物物种(如藻类或不等鞭毛体物种)中的TrifuncA基因:羟酰基-CoA脱氢酶/3-酮酰基-CoA硫解酶/烯酰基-CoA水合酶(三功能蛋白)、智人(Homo sapiens)的α亚基基因(官方符号:HADHA;基因ID:3030)、黑猩猩(Pantroglodytes)(官方符号:HADHA;基因ID:459079)、猕猴(Macaca mulatta)(官方符号:HADHA;基因ID:695975)、家犬(Canis lupus familiaris)(官方符号:HADHA;基因ID:100856745)、家牛(Bos taurus)(官方符号:HADHA;基因ID:281810)、小家鼠(Musmusculus)(官方符号:Hadha;基因ID:97212)、褐家鼠(Rattus norvegicus)(官方符号:Hadha;基因ID:170670)、原鸡(Gallus)(官方符号:HADHA;基因ID:395929)和热带爪蟾(Xenopus tropicalis)(官方符号:hadha;基因ID:394832)、羟酰基-辅酶A脱氢酶/3-酮酰基-辅酶A硫解酶/烯酰基-辅酶A水合酶、α亚基a和羟酰基-辅酶A脱氢酶/3-酮酰基-辅酶A硫解酶/烯酰基-辅酶A水合酶、斑马鱼(Danio rerio)的α亚基b基因(分别为官方符号:hadhaa;基因ID:553401和官方符号:hadhab;基因ID:793834)、黑腹果蝇(Drosophilamelanogaster)的线粒体三功能蛋白α亚基基因(官方符号:Mtpα;基因ID:34276)、冈比亚按蚊(Anopheles gambiae str.)PEST的AGAP007784-PA基因(官方符号:AgaP_AGAP007784;基因ID:1278181),以及秀丽隐杆线虫(Caenorhabditis elegans)的烯酰基-CoA水合酶基因(官方符号:ech-1.1;基因ID:180037和官方符号:exh-1.2;基因ID:172310)。
不等鞭毛体和藻类物种的TrifuncA多肽包含例如,硅藻物种大洋洲海链藻(Thalassiosira oceanica)的GenBank登录号EJK46802.1(SEQ ID NO:4)的多肽、硅藻物种假微型海链藻(Thalassiosira pseudonana)的GenBank登录号XP_002292674.1(SEQ IDNO:5)的多肽、硅藻物种三角褐指藻(Phaeodactylum tricornutum)的Genbank XP_002179641.1(SEQ ID NO:6)的多肽、硅藻物种圆柱拟脆杆藻(Fragilariopsis cylindrus)的GenBank登录号OEU18702.1(SEQ ID NO:7)的多肽、不等鞭毛体藻类抑食金球藻(Aureococcus anophagefferens)的GenBank登录号XP_009032222.1(SEQ ID NO:8)的多肽,以及褐藻长囊水云(Ectocarpus silicus)的GenBank登录号CBJ30498.1(SEQ ID NO:9)的多肽。
如本文所使用的,术语“线粒体三功能蛋白亚基B”或“TrifuncB”(也称为“3-酮酰基-CoA硫解酶、乙酰基l-CoA酰基转移酶”或“β-酮硫解酶”)是指至少部分地在线粒体中表达并且能够催化β-氧化的最终步骤的酶,其中3-酮酰基CoA被辅酶A的另一个分子的硫醇基切割。硫醇插入在C-2与C-3之间,这产生了乙酰基CoA分子和比进入β氧化循环的酰基-CoA短两个碳的酰基-CoA分子。TrifuncB包含与酶委员会编号2.3.1.16相对应的酶。TrifuncB包含pfam结构域PF00108(硫解酶N,“硫解酶,N-末端结构域”)并且还包含pfam结构域PF02803(硫解酶C,“硫解酶,C-末端结构域”)。TrifuncB包含保守结构域“cd00751”,“硫解酶”结构域。可以搜索蛋白质序列以标识ncbi.nlm.nih的保守结构域(BLAST菜单的CDD或“保守结构域数据库”)。
在SEQ ID NO:10中提供了野生型迦得拟微球藻TrifuncB的氨基酸序列。在SEQ IDNO:11中提供了对野生型迦得拟微球藻TrifuncB进行编码的cDNA的核苷酸序列。在SEQ IDNO:12中提供了野生型迦得拟微球藻TrifuncB基因的基因组DNA的核苷酸序列。迦得拟微球藻TrifuncB基因的基因组位置是NG_contig02524(74-597)或(Naga_102524g1)(在万维网nannochloropsis.org上可获得的微拟球藻基因组)。技术人员可以使用本公开,例如使用基因组DNA或cDNA来标识任何微生物物种(如任何藻类或不等鞭毛体物种)中的TrifuncB基因,作为对具有诊断TrifuncB多肽的蛋白质结构域和/或当表达时具有TrifuncA的酶活性的蛋白质进行编码的基因。来自与TrifuncB同源的其它物种的TrifuncB基因如下,并且应当帮助技术人员标识任何微生物物种(如藻类或不等鞭毛体物种)中的同源基因:羟酰基-CoA脱氢酶/3-酮酰基-CoA硫解酶/烯酰基-CoA水合酶(三功能蛋白)、智人的β亚基基因(官方符号:HADHB;基因ID:3032)、黑猩猩(官方符号:HADHB;基因ID:459080)、猕猴(官方符号:HADHB;基因ID:698025)、家犬(官方符号:HADHB;基因ID:607926)、家牛(官方符号:HADHB;基因ID:281811)、小家鼠(官方符号:Hadhb;基因ID:231086)、褐家鼠(官方符号:Hadhb;基因ID:171155)、原鸡(官方符号:HADHB;基因ID:421995)、热带爪蟾(官方符号:hadhb;基因ID:394747)以及斑马鱼(官方符号:hadhb;基因ID:336606)和黑腹果蝇的硫解酶基因(官方符号:硫解酶;基因ID:37784)、冈比亚按蚊PEST的AGAP011827-PA基因(官方符号:AgaP_AGAP011827;基因ID:1280821),以及秀丽隐杆线虫的假定蛋白基因(官方符号:B0303.3;基因ID:176216)。
藻类和不等鞭毛体物种的TrifuncB多肽包含例如硅藻物种假微型海链藻的GenBank登录号XP_002288423.1(SEQ ID NO:13)的多肽、硅藻物种三角褐指藻的GenbankXP_002185619.1(SEQ ID NO:14)的多肽、硅藻物种圆柱拟脆杆藻的GenBank登录号OEU17499.1(SEQ ID NO:15)的多肽、不等鞭毛体藻类赫氏颗石藻(Emiliania huxleyi)的GenBank登录号XP_005780946.1(SEQ ID NO:16)的多肽、不等鞭毛体藻类赫氏颗石藻的GenBank登录号XP_005771442.1(SEQ ID NO:17)的多肽、不等鞭毛体藻类抑食金球藻的GenBank登录号XP_009036682.1(SEQ ID NO:18)的多肽,以及褐藻长囊水云的GenBank登录号CBJ26972.1(SEQ ID NO:19)的多肽。
如本文所使用的,术语“过氧化物酶体ABC型酰基-辅酶A转运蛋白”或“ATP结合盒长链脂肪酸转运蛋白”是指位于过氧化物酶体上并且能够在ATP的存在下将酰基辅酶A转运进出过氧化物酶体的酶。过氧化物酶体ABC转运蛋白属于ABC转运蛋白的亚家族D,即是ABCD蛋白,并且可以被称为例如“PXA”(例如,“PXA1”或“PXA2”)、ALDP、ALDRP、ABCD(例如,ABCD1、ABCD2)、PMP(例如,PMP69、PMP70、PMP1、PMP2等)或CTS多肽。
过氧化物酶体ABC转运蛋白与Uniprot W7T9SO(参见互联网uniprot.org)相对应并且与酶委员会编号3.6.3.47相对应。PXA多肽或“过氧化物酶体ABC型酰基-CoA转运蛋白”包含cl26602或“SunT超家族”或“ABC型细菌素/抗生素输出体”保守结构域;可以针对ncbi.nlm.nih的CDD查询多肽以确定cl26602结构域的存在。过氧化物酶体ABC型酰基-CoA转运蛋白多肽包含pfam结构域PF00005(pfam ABC转运蛋白或“ABC_trans”)和/或pfam结构域PF06472(pfam ABC转运蛋白跨膜区2或“ABC_membrane_2”结构域)。例如,过氧化物酶体ABC型酰基-CoA转运蛋白多肽可以包含pfam结构域PF00005(pfam ABC转运蛋白或“ABC_trans”)和pfam结构域PF06472(pfam ABC转运蛋白跨膜区2或“ABC_membrane_2”结构域)。在SEQ ID NO:20中提供了野生型迦得拟微球藻过氧化物酶体ABC型酰基-CoA转运蛋白的氨基酸序列,在本文中被称为迦得拟微球藻PXA1。在SEQ ID NO:21中提供了对野生型迦得拟微球藻PXA1进行编码的cDNA的核苷酸序列。迦得拟微球藻PXA1基因的基因组位置是NG_chr16(42141-43970)、NG_chr16(44127-45281)或NG_chr16(46051-46789)(分别是Naga_101131g2、Naga_101730g1和Naga_102509g1)。技术人员可以使用本公开,例如使用基因组DNA或cDNA来标识任何微生物物种(如藻类或不等鞭毛体物种)中的过氧化物酶体ABC型酰基-CoA转运蛋白基因,例如作为对具有诊断过氧化物酶体ABC型酰基-CoA转运蛋白的蛋白质结构域和/或当表达时具有过氧化物酶体ABC型酰基-CoA转运蛋白的活性的蛋白质进行编码的基因。来自其它物种的过氧化物酶体ABC型酰基-CoA转运蛋白基因如下,并且可以帮助技术人员标识任何微生物(例如,藻类或不等鞭毛体)物种的同源基因:智人的ATP结合盒亚家族D(ALD)成员3基因(官方符号:ABCD3;基因ID:5825)、家犬(官方符号:ABCD3;基因ID:479939)、家牛(官方符号:ABCD3;基因ID:526059)、小家鼠(官方符号:Abcd3;基因ID:19299)、褐家鼠(官方符号:Abcd3;基因ID:25270)、原鸡(官方符号:ABCD3;基因ID:424487)和热带爪蟾(官方符号:abcd3;基因ID:100489671)、猕猴的ATP结合盒亚家族D成员3基因(官方符号:ABCD3;基因ID:709188)、斑马鱼的ATP结合盒亚家族D(ALD)成员3a基因(官方符号:abcd3a;基因ID:406803)、黑腹果蝇的Pmp70基因(官方符号:Pmp70;基因ID:32992)、冈比亚按蚊PEST的AGAP000440-PA基因(官方符号:AgaP_AGAP000440;基因ID:1271802)、秀丽隐杆线虫的过氧化物酶体膜蛋白相关基因(官方符号:pmp-1;基因ID:174126和官方符号:pmp-2;基因ID:174127),以及拟南芥(Arabidopsis thaliana)(官方符号:PXA1;基因ID:830144)和水稻粳稻组(Oryza sativa Japonica Group)(官方符号:LOC4337574;基因ID:4337574)的ABC转运蛋白D家族成员1基因。为了简洁起见,任何物种的过氧化物酶体ABC型酰基-CoA转运蛋白在本文中可以称为PXA多肽(或简称为“PXA”),并且任何物种的过氧化物酶体ABC型酰基-CoA转运蛋白基因在本文中可以称为PXA基因。
如本文所使用的,术语“酰基-CoA氧化酶”或“ACO”(例如,ACO1)(也称为“脂肪酰基-CoA氧化酶”、“酰基辅酶A氧化酶”和“脂肪酰基-辅酶A氧化酶”)是指位于过氧化物酶体中并且能够催化酰基-CoA与O2的反应以形成反式-2,3-脱氢酰基-CoA和H2O2作为过氧化物酶体β氧化通路的一部分的酶。酰基-CoA氧化酶包含与酶委员会编号1.3.3.6相对应的酶,并且可以被指定为例如“AOX”、“AXO”、“FAO”或“POX”。为了简洁起见,任何物种的酰基-CoA氧化酶多肽可以在本文中被称为ACO多肽(或简称“ACO”),任何物种的酰基-CoA氧化酶基因可以在本文中被称为ACO基因。在SEQ ID NO:22W中提供了野生型迦得拟微球藻过氧化物酶体酰基-CoA氧化酶的氨基酸序列,在本文中称为迦得拟微球藻ACO1。在SEQ ID NO:23X中提供了对野生型迦得拟微球藻ACO1进行编码的cDNA的核苷酸序列。技术人员可以使用本公开,例如使用基因组DNA或cDNA来标识在任何微生物物种(如藻类或不等鞭毛体物种)中与过氧化物酶体酰基-CoA氧化酶基因直系同源的任何基因,例如作为对具有诊断过氧化物酶体酰基-CoA氧化酶的蛋白质结构域和/或当表达时具有过氧化物酶体酰基-CoA氧化酶的活性的蛋白质进行编码的基因。可以通过ACO1(SEQ ID NO:22)的经过编码的多肽与酿酒酵母(Saccharomyces cerevisiae)过氧化物酶体酰基-CoA氧化酶(官方符号:POX1;基因ID:852667)或其它过氧化物酶体酰基-CoA氧化酶的同源性,以及通过已知结构域的存在,例如cl09933(酰基-CoA脱氢酶)保守结构域(ncbi.nlim.nih.gov/structure/cdd)来标识来自其它微生物(例如,藻类或不等鞭毛体)物种的过氧化物酶体酰基-CoA氧化酶基因,并且可以包含pfam结构域PF14749(酰基-辅酶A氧化酶N-末端)、PF02770(酰基-CoA脱氢酶,中间结构域)以及PF00441(酰基-CoA脱氢酶,C-末端结构域),和/或pfam结构域PF01756(酰基-CoA氧化酶)(pfam.xfam.org)。
如本文所使用的,术语“异柠檬酸裂解酶”或“ICL”,也称为“异柠檬酸酶(isocitrase)”、“异柠檬酸酶(isocitritase)”、“异柠檬酸酶(isocitratase)”、“苏式-D-异柠檬酸乙醛酸裂解酶”和“异柠檬酸乙醛酸裂解酶”是指至少部分地在线粒体和/或过氧化物酶体和/或被称为乙醛酸循环体的专门过氧化物酶体中表达并且能够催化异柠檬酸裂解为琥珀酸和乙醛酸作为乙醛酸通路的一部分的酶。ICL是Uniprot W7TRS4(参见互联网uniprot.org)并且包含与酶委员会编号4.1.3.1相对应的酶。在SEQ ID NO:24中提供了野生型迦得拟微球藻ICL的氨基酸序列。在SEQ ID NO:25中提供了对野生型迦得拟微球藻ICL进行编码的cDNA的核苷酸序列。迦得拟微球藻ICL基因的基因组位置是NG_chr09(682258-685950)(Naga_100025g12)。技术人员可以使用本公开来标识任何微生物物种(如藻类或不等鞭毛体物种)的ICL基因,作为对在微生物物种中表达并且具有pfam PF00463(异柠檬酸裂解酶)结构域和/或cl21457保守结构域(ICL/PEPM_KPHMT酶超家族)或具有ICL的酶活性的蛋白质进行编码的基因。保守结构域(包含pfam结构域)和来自其它物种的ICL基因如下,并且将帮助技术人员标识任何微生物(例如,藻类或不等鞭毛体)物种的同源基因:酿酒酵母中的异柠檬酸裂解酶1基因(官方符号:ICL;基因ID:856794)、乳酸克鲁维酵母(Kluyveromyces lactis)NRRL Y-1140中的假定蛋白基因(官方符号:KLLA0C08107g;基因ID:2892560)、棉阿舒囊霉(Ashbya gossypii)ATCC 10895中的ADL066Cp基因(官方符号:AGOS_ADL066C;基因ID:4620172)、稻瘟病菌(Magnaporthe oryzae)70-15中的异柠檬酸裂解酶基因(官方符号:MGG_04895;基因ID:2675603)、粗糙脉孢菌(Neurospora crassa)OR74A中的乙酸盐利用(acetate utilization)-3基因(官方符号:acu-3;基因ID:3877001),以及拟南芥(官方符号:ICL;基因ID:821726)、水稻粳稻组(官方符号:LOC4343441;基因ID:4343441)和纹膜醋酸杆菌(Acetobacter aceti.)(官方符号:aceA)中的异柠檬酸裂解酶基因。
具有增加的脂质生产力的突变体藻类微生物
β氧化通路是分解代谢过程,通过所述过程脂肪酸分子被分解以产生乙酰CoA。所述通路的一般机制发生在四个步骤:1)酰基-CoA脱氢酶催化与辅酶A缀合的长链脂肪酸(脂肪酰基-CoA)的脱氢以在C2与C3之间产生反式双键并且产生反式-δ2-烯酰基-CoA;2)烯酰基-CoA水合酶催化反式-δ2-烯酰基-CoA在双键处的水合以产生L-3-羟酰基-CoA;3)3-羟酰基-CoA脱氢酶催化L-3-羟酰基-CoA的脱氢以产生3-酮酰基-CoA;以及4)硫解酶催化辅酶A对3-酮酰基-CoA的C2与C3(α和β碳)之间的键的断裂以产生乙酰基-CoA和比作为初始底物的酰基-CoA短两个碳的脂肪酰基-CoA。四步法持续进行,直到脂肪酸中的所有碳均被转化成乙酰基-CoA。
在植物和大多数真菌中,过氧化物酶体是参与脂肪酸的β氧化的唯一区室(Poirier等人(2006)《生物化学与生物物理学学报(Biochim Biophys Acta)》1763:1413-1426),而在动物细胞中,脂肪酸的β氧化发生在过氧化物酶体和线粒体两者中。动物细胞中的线粒体β氧化的关键组分是具有三种酶功能的三功能蛋白:烯酰基-CoA水合酶、羟酰基-CoA脱氢酶和酮酰基-CoA硫解酶。哺乳动物线粒体三功能蛋白是包括α亚基和β亚基的异源二聚体,所述α亚基包含烯酰基-CoA水合酶和羟酰基-CoA脱氢酶活性,所述β亚基包含酮酰基-CoA硫解酶活性(Eaton等人(2000)《生物化学学会会报(Biochem Soc Transactions)》28:177-182)。
线粒体三功能蛋白(MTP)(由四个线粒体三功能蛋白亚基A(TrifuncA)亚基和四个线粒体三功能蛋白亚基B(TrifuncB)亚基构成的异源八聚体)能够在某些生物体中催化β氧化通路的最后三个步骤。MTP的这些酶功能被称为2-烯酰基辅酶A(CoA)水合酶、长链3-羟酰基-coA脱氢酶和长链3-酮酰基CoA硫解酶。如本文有利地提供的,线粒体TrifuncB和/或TrifuncA蛋白的表达的弱化可以导致例如在藻类和不等鞭毛体微生物中脂质生产力的增加。不受理论限制,据信脂质产生的这种增加是由于一种或多种TrifuncB和/或TrifuncA蛋白的表达弱化而导致的脂肪酸分解代谢水平降低的结果。
长链脂肪酸的分解代谢在许多生物体的过氧化物酶体中开始,并且因此这些反应被称为过氧化物酶体β氧化通路。在动物细胞中,通过过氧化物酶体β氧化加工的脂肪酸最终作为辛酰基-CoA(C8脂肪酸衍生物)被转移到线粒体中用于β氧化。在从将酰基-CoA输入到过氧化物酶体中开始的过氧化物酶体β氧化中涉及多个步骤。这可以通过过氧化物酶体ABC型酰基辅酶A转运蛋白(通常指定为PXA,例如PXA1)来进行。酰基-CoA氧化酶(通常称为ACO,例如ACO1)催化过氧化物酶体中的β氧化的第一步骤,将输入的酰基-CoA去饱和为2-反式-烯酰基-CoA,以便在下一步骤中进一步加工。如本文有利地提供的,相对于仅具有弱化的TrifuncB和/或TrifuncA的表达的突变体微生物的脂质生产力,弱化具有弱化的线粒体TrifuncB和/或TrifuncA蛋白的表达的突变体微生物中的过氧化物酶体ABC型酰基-辅酶A转运蛋白和/或过氧化物酶体酰基-CoA氧化酶蛋白的表达可以导致脂质生产力进一步增加。不受理论限制,据信在具有弱化的TrifuncB或TrifuncA之一或两者以及过氧化物酶体ABC型酰基-辅酶A转运蛋白和/或过氧化物酶体酰基-CoA氧化酶的表达的突变体微生物中脂质生产力的这种进一步增加是这些突变体中的脂肪酸分解代谢水平的甚至进一步降低的结果。
乙醛酸通路是植物、细菌、原生生物和真菌中的合成代谢通路,由此细胞将乙酰基-CoA转化成琥珀酸,以用于通过糖异生合成碳水化合物。涉及此通路的一种酶,异柠檬酸裂解酶(ICL),催化异柠檬酸裂解成琥珀酸和乙醛酸。如本文有利地提供的,相对于仅具有弱化的TrifuncB和/或TrifuncA的表达的突变体微生物的脂质生产力,也具有弱化的线粒体TrifuncB和/或TrifuncA蛋白的表达的突变体微生物中的ICL酶的表达的弱化可以导致脂质生产力进一步增加。不受理论限制,据信在具有弱化的TrifuncB和/或TrifuncA以及ICL两者的表达的突变体微生物中脂质生产力的这种进一步增加是由于来自酰基-CoA的糖异生水平降低而导致脂质在细胞中的积累增加的结果。
因此,本文提供了突变体微生物,如藻类或不等鞭毛体微生物,所述突变体微生物具有使线粒体TrifuncB和/或TrifuncA的表达弱化的突变,并且因此相比于确实具有弱化的TrifuncB和/或TrifuncA的表达的同一物种的对照微生物,产生(例如,在每体积或每面积每天的基础上)更多的脂质(如可脂肪酸甲酯衍生的脂质(FAME脂质))和/或具有更高的脂质与总生物质的比率(其可以被评估为总有机碳)。在相关的实施例中,本文提供了突变体微生物,如藻类或不等鞭毛体微生物,当在相同条件下培养时,所述突变体微生物具有至少一个突变,所述至少一个突变使TrifuncB和/或TrifuncA基因的表达弱化,并且与除了一个或多个突变之外本质上在基因上与突变体微生物相同的对照微生物相比,导致脂质产生增加(如体积脂质生产力增加)和/或脂质与总碳的比率更高。如本文所使用的,“突变”涵盖其表达被弱化的基因中的突变,包含基因的编码区和转录区的5'和3'区,并且还涵盖对微生物的其它基因修饰,如突变体微生物中的使基因表达弱化(减少或消除)的外源核酸分子或构建体,如但不限于反义RNA、核酶、微RNA、沉默RNA、RNAi、短发夹RNA、引导RNA以及对此类核酸分子进行编码的构建体。TrifuncB和/或TrifuncA突变可以是敲低突变,或在说明性实例中,是敲除突变。在说明性实施例中,突变体微生物中的突变是在TrifuncB基因中并且导致TrifuncB基因的表达弱化,当在相同条件下培养时,与除了突变之外基本上在基因上与突变体微生物相同的对照微生物相比,这导致突变体微生物增加其脂质生产力。
在一些实施例中,本文提供的具有弱化的对TrifuncB和/或TrifuncA多肽进行编码的基因的表达的突变体微生物可以是包含用于使TrifuncB和/或TrifuncA基因的表达弱化的基因构建体的微生物,例如用于表达反义RNA、微RNA、RNAi分子(例如,siRNA)或核酶的构建体。相对于不具有用于使TrifuncB和/或TrifuncA基因的表达弱化的构建体的同一物种的对照微生物的脂质的产生或脂质与碳的比率,突变体微生物可以具有弱化的编码线粒体TrifuncB和/或TrifuncA多肽的基因的表达,其中弱化的表达可以导致更多脂质(如可脂肪酸甲酯衍生的脂质(FAME脂质))的产生和/或更高的脂质与总碳的比率。在另外的实施例中,本文提供的具有弱化的对TrifuncB和/或TrifuncA多肽进行编码的基因的表达的突变体微生物可以是具有破坏的或突变的TrifuncB和/或TrifuncA基因的微生物,例如通过插入外源DNA或导致经过编码的多肽的移码突变和/或截短的突变而被破坏的TrifuncB和/或TrifuncA基因。被破坏的基因可以例如基本上不产生活性多肽。突变体微生物可以是不等鞭毛体或藻类微生物。
由于使TrifuncB和/或TrifuncA蛋白的表达弱化的突变或构建体,本文提供的相对于同一物种的对照微生物增加其脂质产生的突变体微生物可以进一步包含在对过氧化物酶体β氧化通路蛋白和/或乙醛酸通路蛋白进行编码的基因中的突变,所述基因导致过氧化物酶体β氧化通路蛋白和/或乙醛酸通路蛋白的表达弱化。在说明性实例中,来自过氧化物酶体β氧化通路的突变基因是过氧化物酶体酰基-CoA氧化酶基因,为了简洁起见,其在本文中可以被称为ACO基因,例如ACO1基因,和/或是过氧化物酶体ABC型酰基-CoA转运蛋白基因,其在本文中可以被称为PXA基因,如PXA1基因。作为非限制性实例,除了TrifuncB和/或TrifuncA基因的敲低或敲除突变之外,此类突变体藻类或不等鞭毛体微生物可以包含ACO和/或PXA基因中的敲低或敲除突变。可替代地,由于使TrifuncB和/或TrifuncA蛋白的表达弱化的突变或构建体,本文提供的相对于同一物种的对照藻类微生物增加其脂质产生的突变体藻类或不等鞭毛体微生物可以进一步包含用于使对过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白进行编码的基因的表达弱化的基因构建体,所述基因导致过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白的表达弱化,包含但不限于ACO或PXA基因。基因构建体可以是例如用于表达反义RNA、微RNA、RNAi分子(例如,siRNA)或核酶的构建体。具有突变或包含导致TrifuncB和/或TrifuncA蛋白的表达弱化的基因构建体并且另外具有突变或包含导致过氧化物酶体β氧化通路蛋白的表达弱化的基因构建体的突变体藻类微生物可以表现出比不包含突变或导致过氧化物酶体β氧化通路蛋白的表达弱化的基因构建体的菌株更高的脂质生产力和/或增加的脂质与总有机碳的比率(例如,FAME)。
在另外的实施例中,本文提供的由于TrifuncB和/或TrifuncA蛋白的表达弱化而增加其脂质产生的突变体藻类或不等鞭毛体微生物可以另外包含对乙醛酸通路蛋白(例如,乙醛酸通路蛋白异柠檬酸裂解酶(ICL))进行编码的基因中的突变。乙醛酸通路蛋白突变体(例如,ICL突变体)可以是例如具有TrifuncA和/或TrifuncB中的敲低或敲除突变的敲低或敲除突变。具有弱化的ICL基因的表达的突变体藻类或不等鞭毛体微生物可以包含用于使ICL基因的表达弱化的基因构建体,例如对反义RNA、微RNA、RNAi分子(例如,siRNA)或核酶进行编码的构建体。具有弱化的TrifuncB和/或TrifuncA蛋白的表达并且进一步具有弱化的ICL基因的表达的突变体藻类或不等鞭毛体微生物可以任选地进一步具有至少一个基因改变,所述至少一个基因改变导致过氧化物酶体β氧化通路基因(如ACO和/或PXA基因)的表达弱化。
如本文所指示的,TrifuncB、TrifuncA、PXA、ACO和/或ICL基因中的突变可以是敲低突变,或如在说明性实施例中,是敲除突变。敲除突变可以是例如其中多肽的阅读框被破坏以使得不产生功能蛋白质,或仅产生靶蛋白的不具有野生型蛋白质的一种或多种功能的一部分的突变。在某些实例中,敲低突变是通过表达外源DNA来提供的,例如编码干扰RNA、反义RNA或核酶、导致靶向基因的表达弱化的构建体。这种外源DNA可以任选地包含未在对照藻类微生物的基因组中发现的标记基因。在各个实施例中,突变体藻类微生物在基因的启动子区或5'非翻译区(例如,在基因的翻译起始位点的上游和/或基因的转录起始位点的上游)中具有突变,如但不限于插入。在一些实施例中,突变体藻类微生物在基因的3'非翻译区(例如,在基因的翻译终止位点的下游)中具有突变,如但不限于插入。在一些实施例中,突变体藻类微生物在基因的内含子中具有突变,如但不限于插入。在不将本发明限制于任何特定机制的情况下,所述突变可以是插入(如但不限于cas介导的插入)到基因的非编码区中可以降低所述基因的基因表达水平。在一些实施例中,突变体藻类微生物在TrifuncB、TrifuncA、PXA1、ACO1和ICL基因中的至少1个或至少2个、3个、4个或所有5个中具有突变,并且所述突变都是敲低突变,都是敲除突变,或所述突变是敲除突变和敲低突变的组合。突变可以发生在靶基因的任何部分中,并且在一些实施例中,可以发生在第一外显子、第二外显子或第三外显子中,或可以发生在不同于最后一个外显子或不同于来自最后一个外显子的第一个外显子中。术语“突变”涵盖被引入到微生物中的构建体或核酸分子,所述构建体或核酸分子导致由构建体或核酸分子靶向的基因的表达减少,例如具体包含通过RNAi分子、反义RNA、微RNA和核酶改变基因表达。
本发明的突变体微生物可以是天然表达线粒体TrifuncA或TrifuncB蛋白的任何微生物。突变体微生物可以是例如源自以下属的任何物种的藻类微生物:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、奥瑞可门(Aureococcus)、黄金色藻属(Boekelovia)、波利氏藻属(Bolidomonas)、包特氏菌(Borodinella)、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、荀球藻属(Bracteococcus)、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、球钙板藻属(Cricosphaera)、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、链带藻属(Desmodesmus)、杜氏藻属(Dunaliella)、后棘藻属(Elipsoidon)、球石藻属(Emiliania)、独球藻属(Eremosphaera)、衣迪斯藻属(Ernodesmius)、眼虫属(Euglena)、真眼点藻属(Eustigmatos)、伏氏藻属(Franceia)、脆杆藻属(Fragilaria)、拟脆杆藻属(Fragilaropsis)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、菱板藻属(Hantzschia)、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微芒藻属(Micractinium)、蒜头藻(Monodus)、单针藻属(Monoraphidium)、微球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、蚝球藻属(Ostreococcus)、拟小球藻属(Parachlorella)、雪衣藻属(Parietochloris)、杜氏亚属盐藻属(Pascheria)、巴夫藻属(Pavlova)、普莱格门(Pelagomonas)、褐指藻属
Figure BDA0002872016850000351
噬菌体属(Phagus)、皮级微绿藻属(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、宽球藻属(Pleurococcus)、原壁菌属(Prototheca)、假小球藻属(Pseudochlorella)、拟新绿藻属(Pseudoneochloris)、假十字趾藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、葡串藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、裂衣藻属(Schizochlamydella)、骨条藻属(Skeletonema)、水绵藻属(Spyrogyra)、裂丝藻属(Stichococcus)、四球藻属(Tetrachlorella)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、鲜绿球藻属(Viridiella)、魏氏藻属(Vischeria)和团藻属(Volvox)。例如,藻类微生物可以是叶绿素的成员,如但不限于葡萄藻属、小球藻属、独球藻属、伏氏藻属、微芒藻属、微球藻属、卵囊藻属、拟小球藻属、皮级微绿藻属、原壁菌属或假小球藻属。在一些方面,真核宿主细胞可以是属于以下属的物种:异养小球藻亚属(Auxenochlorella)、小球藻属、胶树小球藻属(Heveochlorella)、海球藻属(Marinichlorella)、拟小球藻属、假小球藻属或四球藻属。
在一些方面,本公开提供了一种重组或经典衍生的突变体藻类,其中所述突变体藻类是不等鞭毛体藻类。在一些实例中,所述突变体不等鞭毛体藻类属于硅藻门(矽藻门(Bacillariophytes))、黄绿藻门(Eustigmatophytes)、黄藻门(Xanthophytes)、海金藻类(Pelagophytes)、褐藻门(Phaeophytes)、金藻门(Chrysophytes)或绿鞭藻门(Raphidophytes)。在本文提供的任何实施例中,突变体藻类微生物可以是不等鞭毛体藻类,例如黄绿藻门或硅藻门(例如,矽藻门)。在一些实例中,突变体不等鞭毛体藻类是硅藻门并且在一些实施例中属于选自由以下组成的组的硅藻门的属:茧形藻属、双眉藻属、角毛藻属、小环藻属、脆杆藻属、拟脆杆藻属、菱板藻属、舟形藻属、菱形藻属、褐指藻属、骨条藻属以及海链藻属。在一些实例中,突变体藻类是黄绿藻门藻类。在一些实例中,所述黄绿藻门藻类属于选自由以下组成的组的属:小绿藻属(Chloridella)、绿囊藻属(Chlorobptrys)、椭球藻属(Ellipsoidion)、真眼点藻属、角绿藻属(Goniochloris)、拟单胞藻属(Monodopsis)、蒜头藻属、微拟球藻属、假拟小椿藻属(Pseudocharaciopsis)、拟角星鼓藻属(Pseudostaruastrum)、假四角藻属
Figure BDA0002872016850000361
和魏氏藻属。在一些实例中,所述突变体藻类细胞是微拟球藻属物种,例如迦得拟微球藻、颗粒微拟球藻(Nannochloropsis granulata)、湖泊拟微绿球藻(Nannochloropsis limnetica)、海洋微拟球藻(Nannochloropsis oceanica)、微绿球藻(Nannochloropsis oculata)以及盐生拟微绿球藻(Nannochloropsis salina)。
可以是本发明的突变体微生物的不等鞭毛体物种还包含但不限于卵菌与网粘菌纲(Labyrinthulomycetes),例如拉普利门(Labrinthulids)和破囊壶菌属(Thraustochytrids),例如网粘黏菌属(Labryinthula)、拟网粘菌类(Labryinthuloides)、破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium)、不动壶菌属(Aplanochytrium)、橙壶菌属(Aurantiochytrium)、长形壶菌属(Oblongichytrium)、日本壶菌属(Japonochytrium)、戴普罗弗门(Diplophrys)或吾肯氏壶藻菌属(Ulkenia)的物种。
技术人员可以使用本领域众所周知的各种方法标识对线粒体β氧化通路的酶进行编码的基因(如TrifuncB和TrifuncA)、对参与过氧化物酶体β氧化通路(包含过氧化物酶体ABC型酰基-CoA转运蛋白和过氧化物酶体酰基-CoA氧化酶)的多肽进行编码的基因和对乙醛酸通路(如异柠檬酸裂解酶)的酶进行编码的基因,所述方法包含但不限于与抗体筛选或活性测定组合的cDNA表达文库,与来自其它物种的同源基因的保守区的探针杂交,使用被设计成保守基因区的简并引物进行PCR,以及基因组测序和生物信息学注释。来自除了迦得拟微球藻之外的藻类或不等鞭毛体物种的同源或直系同源基因通常具有与本文提供的迦得拟微球藻TrifuncB、TrifuncA、PXA1、ACO1或ICL相同的酶活性和/或亚细胞定位,并且可以与以下具有至少30%、至少35%、至少40%或至少45%,并且通常具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一性:迦得拟微球藻TrifuncA(SEQID NO:1)或本文标识的其它TrifuncA多肽的任何氨基酸序列的至少50%、至少75%、至少80%、至少90%、至少95%或100%的连续段,包含例如SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQID NO:7、SEQ ID NO:8或SEQ ID NO:9;迦得拟微球藻TrifuncB(SEQ ID NO:10)或本文标识的其它TrifuncB基因,包含例如SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQID NO:7、SEQ ID NO:8或SEQ ID NO:9;迦得拟微球藻PXA1(SEQ ID NO:20)或其它过氧化物酶体ABC型酰基-CoA转运蛋白;迦得拟微球藻ACO1(SEQ ID NO:22)或其它过氧化物酶体酰基-CoA氧化酶或迦得拟微球藻ICL(SEQ ID NO:24)或其它异柠檬酸裂解酶。在一些实施例中,来自除了迦得拟微球藻之外的藻类物种的同源或直系同源基因可以具有编码区,所述编码区与迦得拟微球藻TrifuncA(SEQ ID NO:2)、TrifuncB(SEQ ID NO:11)、PXA1(SEQ ID NO:21)、ACO1(SEQ ID NO:23)或ICL(SEQ ID NO:25)的任何编码序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一性。
微生物的一些物种(例如,藻类或不等鞭毛体的一些物种)可以具有多于一个拷贝的TrifuncB、TrifuncA、过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶和/或异柠檬酸裂解酶基因。技术人员可以使用已知的方法和本文中的教导标识对这些靶蛋白进行编码的基因的此类另外的拷贝并且使其突变。例如,可以使用本文提供的靶基因中的每个靶基因的生物信息学分析和/或序列信息来标识藻类或不等鞭毛体微生物中除了微拟球藻属或微拟球藻属的不同物种之外的同源基因,无论是作为特定物种中的单拷贝基因还是多拷贝基因。在具有多于一个拷贝的TrifuncB、TrifuncA、过氧化物酶体ABC型酰基-CoA转运蛋白(如PXA1)、过氧化物酶体酰基-CoA氧化酶(如ACO1)和/或异柠檬酸裂解酶基因的物种中,在任何实施例中,可以使本文提供的多个拷贝(例如,所有拷贝)的这些靶基因中的一个或多个靶基因突变,或可以使一个或多个但少于所有拷贝的靶基因中的一个或多个靶基因突变以实现弱化的表达。
相对于在相同条件下培养的对照微生物,本文提供的突变体微生物可以具有更大的碳与脂质的分配(例如,更高的FAME/TOC比率),例如在充满氮、限制氮或耗尽氮的条件中在分批、半连续或连续培养条件下,在突变体藻类微生物的情况下,所述条件可以是光合自养条件。相对于对照微生物具有增加的碳与脂质的分配的突变体可以具有增加的碳与总可提取脂质、总中性脂质、甘油三酯和/或FAME衍生的脂质的分配。例如,本文提供的突变体微生物可以具有所产生的FAME衍生的脂质(“FAME”)的量与所产生的生物质(例如,其可以以TOC或无灰干重(AFDW)测量)的比率比对照微生物的比率高至少10%。脂质和生物质产生和/或产生可以例如通过本领域已知的重量分析来评估并且在本文的实例中证明。
例如,本文提供的具有弱化的TrifuncB和/或TrifuncA基因表达的突变体微生物,如突变体藻类或不等鞭毛体微生物的FAME与TOC的比率(FAME/TOC)可以比对照微生物的FAME/TOC比率高至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%或至少200%。在一些实施例中,本文提供的具有弱化的TrifuncB和/或TrifuncA基因的表达的突变体微生物的FAME与TOC的比率(FAME/TOC)可以比对照微生物的FAME/TOC比率高至少5%、至少10%、至少15%、至少20%、至少25%或至少30%,但是可以比对照微生物的FAME/TOC比率高小于500%、400%或300%。在一些实施例中,当在相同条件下培养突变体微生物和对照微生物两者时,本文提供的具有弱化的TrifuncB和/或TrifuncA基因表达的突变体微生物(如突变体藻类或不等鞭毛体微生物)的FAME与TOC的比率(FAME/TOC)可以比对照微生物的FAME/TOC比率高至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%或至少200%。例如,在一些实施例中,当在充满氮或限制氮的培养条件下培养突变体微生物和对照微生物两者时,本文提供的具有弱化的TrifuncB和/或TrifuncA基因表达的突变体微生物(如突变体藻类微生物)的FAME与TOC的比率(FAME/TOC)可以比对照微生物的FAME/TOC比率高至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少120%、至少140%、至少150%、至少170%、至少180%或至少200%。
在另外的实例中,当在相同条件下培养时,本文提供的具有弱化的TrifuncB和/或TrifuncA基因表达的突变体微生物可以产生多至少10%的FAME,同时产生至少50%、至少60%或至少70%的由对照细胞(如野生型细胞)产生的TOC,并且突变体微生物的FAME/TOC比率可以比对照微生物的FAME/TOC高至少20%、至少30%、至少35%、至少40%、至少50%、至少60%或至少65%。在脂质产生时间段期间,突变体微生物的FAME/TOC比率可以是例如至少0.30或至少0.35或至少约0.40。在一些实施例中,除了具有弱化的TrifuncB和/或TrifuncA基因表达之外,突变体微生物可以具有弱化的对在过氧化物酶体脂肪酸氧化中或在乙醛酸通路中起作用的多肽进行编码的基因的表达。在一些实施例中,突变体微生物具有弱化的对线粒体TrifuncB和/或TrifuncA多肽进行编码的基因表达,并且进一步具有弱化的对过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶和/或异柠檬酸裂解酶进行编码的基因表达。
本发明的突变体藻类或不等鞭毛体微生物可以是自发的突变体、经典衍生的突变体或工程化突变体,所述工程化突变体具有弱化的TrifuncA和/或TrifuncB基因并且任选地来自过氧化物酶体β氧化通路或乙醛酸通路的基因的表达。在各个实例中,突变体微生物是藻类或不等鞭毛体物种,并且具有弱化的基因表达,所述基因编码与迦得拟微球藻TrifuncB(SEQ ID NO:10)、TrifuncA(SEQ ID NO:1)、PXA1(SEQ ID NO:20)、ACO1(SEQ IDNO:22)或ICL(SEQ ID No:24)中的任何氨基酸序列的至少50%、75%、80%、90%、95%或100%的连续段具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、或至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性,和/或具有编码序列,所述编码序列与迦得拟微球藻TrifuncB(SEQ ID NO:11)、TrifuncA(SEQ ID NO:2)、PXA1(SEQ ID NO:21)、ACO1(SEQ ID NO:23)或ICL(SEQ ID NO:25)的任何编码序列具有至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或100%。突变基因通常具有与本文提供的TrifuncA、TrifuncB、过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶或异柠檬酸裂解酶相同的酶活性和/或亚细胞定位。
在一些实施例中,本文提供的突变体微生物具有弱化的对TrifuncA亚基进行编码的基因的表达,并且在分批、半连续或连续测定系统中产生比由不具有弱化的TrifuncA亚基基因的表达的对照微生物产生的脂质更多的脂质。在一些实施例中,本文提供的突变体微生物具有弱化的对TrifuncB亚基进行编码的基因的表达,并且在分批、半连续或连续测定系统中产生比由不具有弱化的TrifuncB亚基基因的表达的对照微生物产生的更多的脂质。在各个实施例中,本文提供的突变体微生物具有弱化的对TrifuncA亚基进行编码的基因和/或对TrifuncB亚基进行编码的基因的表达,并且进一步具有弱化的对过氧化物酶体β氧化通路的多肽进行编码的基因(如酶或转运蛋白)或对乙醛酸通路的酶进行编码的基因的表达。具有弱化的TrifuncA和/或TrifuncB基因的表达以及弱化的过氧化物酶体β氧化通路或乙醛酸通路基因的表达的突变体微生物可以比不具有弱化的TrifuncA和/或TrifuncB基因的表达以及弱化的过氧化物酶体β氧化通路或乙醛酸通路基因的表达的对照微生物产生更多的脂质。具有弱化的TrifuncA和/或TrifuncB基因的表达以及弱化的过氧化物酶体β氧化通路或乙醛酸通路基因的表达的突变体微生物的FAME/TOC比率可以比不具有弱化的TrifuncA和/或TrifuncB基因的表达以及弱化的过氧化物酶体β氧化通路或乙醛酸通路基因的表达的对照微生物更高。弱化基因是例如通过经典突变或基因工程而弱化的宿主微生物的天然存在的基因,包含但不限于一种或多种大范围核酸酶、TALEN、RNA引导的内切核酸酶(例如,Cas蛋白)、同源重组、随机插入、RNAi构建体、核酶构建体或反义构建体。弱化还可以包含导致氨基酸改变的突变,所述氨基酸改变降低或消除经过编码的蛋白质的活性。当微生物是二倍体或多倍体时,基因突变可以在对靶向多肽进行编码的一个基因、一些基因或所有基因中实现。
在一些实施例中,本文提供的突变体微生物具有弱化的对TrifuncA亚基和/或TrifuncB亚基进行编码的基因的表达,并且进一步具有弱化的对参与过氧化物酶体β氧化通路的多肽进行编码的基因的表达,例如过氧化物酶体ABC型酰基-CoA转运蛋白或过氧化物酶体酰基-CoA氧化酶。例如,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncA基因和对过氧化物酶体ABC型酰基-CoA转运蛋白进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncA基因和天然存在的过氧化物酶体ABC型酰基-CoA转运蛋白基因的表达的对照微生物产生更多的脂质。在其它实例中,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncB基因和对过氧化物酶体ABC型酰基-CoA转运蛋白进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncB基因和天然存在的过氧化物酶体ABC型酰基-CoA转运蛋白基因的表达的对照微生物产生更多的脂质。在又其它实例中,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncA基因和对过氧化物酶体酰基-CoA氧化酶进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncA基因和天然存在的过氧化物酶体酰基-CoA氧化酶基因的表达的对照微生物产生更多的脂质。在另一个实例中,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncB基因和对过氧化物酶体酰基-CoA氧化酶进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncB基因和天然存在的过氧化物酶体酰基-CoA氧化酶基因的表达的对照微生物产生更多的脂质。在又其它实例中,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncA基因和对异柠檬酸裂解酶进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncA基因和天然存在的过氧化物酶体异柠檬酸裂解酶基因的表达的对照微生物产生更多的脂质。在另外的实例中,本文提供的突变体微生物可以具有弱化的天然存在的TrifuncB基因和对异柠檬酸裂解酶进行编码的天然存在的基因的表达,并且可以比不具有弱化的天然存在的TrifuncB基因和天然存在的过氧化物酶体异柠檬酸裂解酶基因的表达的对照微生物产生更多的脂质。本文提供的任何突变体微生物可以在分批、半连续或连续测定系统中产生比由对照微生物产生的脂质更多的脂质。
具有弱化的TrifuncA和/或TrifuncB基因的表达并且任选地具有弱化的对来自过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的基因的表达的突变体藻类或不等鞭毛体微生物可以是“敲除”突变体,例如其中多肽的阅读框被破坏成使得功能蛋白质不产生。例如,基因可以包含外源DNA存在于基因中的插入、缺失或导致不产生功能蛋白质的阅读框中的突变。存在于基因中的外源DNA可以是未在藻类微生物物种的野生型基因组中发现的标记基因。在其它实例中,突变体藻类微生物可以是“敲低”突变体,其中基因的表达相对于对照藻类微生物减少。敲低可以是突变、插入或缺失发生在基因的非编码区中或外源DNA存在于基因中的突变体,或可以通过在细胞中表达使靶基因的表达弱化的构建体(例如,反义分子、RNAi分子或核酶)来实现。存在于基因中的外源DNA可以包括未在对照藻类或不等鞭毛体微生物的基因组中发现的标记基因。此外,突变体藻类或不等鞭毛体微生物可以具有敲除和敲低突变的组合以使所述基因中的一个或多个基因弱化。在突变体具有多于一个拷贝的弱化基因,并且弱化是通过在基因座处的突变(例如,突变,无论是通过例如一种或多种RNA引导的核酸酶(例如,Cas9、Cpf1、Csm1或Cms1酶)、TALEN、大范围核酸酶、同源重组或插入诱变而产生的插入、缺失或核苷酸改变)的情况下,可以在基因座中的一个、全部或子集处实现一种或多种突变。
本发明的某些实施例包含具有突变的TrifuncA和/或TrifuncB基因的突变体藻类或不等鞭毛体微生物,所述基因使一个或多个基因的表达弱化并且导致脂质产生增加,并且任选地在对过氧化物酶体β氧化通路、过氧化物酶体转运蛋白或乙醛酸通路酶的多肽进行编码的基因(例如,根据本文所公开的任何实施例的过氧化物酶体ABC型酰基-CoA转运蛋白基因、过氧化物酶体酰基-CoA氧化酶基因和/或异柠檬酸裂解酶基因)中的突变以及导致脂质产生进一步增加的本领域已知的一种或多种另外的突变。例如,如本文所公开的具有突变的TrifuncA和/或TrifuncB基因的突变体藻类或不等鞭毛体物种,所述基因使一个或多个基因的表达弱化并且导致脂质产生增加,并且任选地在过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶和/或异柠檬酸裂解酶基因中的突变可以进一步具有弱化的对脂质生物合成的调节因子(如在US2017/005803中公开的ZnCys-2845调节因子或其同系物或直向同源物或在共同未决和共同拥有的US 2017/0121742中公开的溴-1091调节因子或其同系物或直向同源物)进行编码的基因的表达。
技术人员将认识到,用于增加藻类中的脂质产生的其它已知方法可以与本文提供的突变的藻类微生物组合。
制备突变体的方法
用于使基因,如TrifuncB、TrifuncA、过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶和异柠檬酸裂解酶基因突变的方法是本领域已知的并且在本文中例示。可以使用此类方法来制备本文提供的任何突变体藻类或不等鞭毛体微生物。此类方法本身提供了本发明的另外的实施例。此外,使用本文提供的制备方法制备的任何突变的藻类或不等鞭毛体微生物本身是本发明的突变的藻类或不等鞭毛体微生物的实例。
因此,具有弱化的TrifuncA和/或TrifuncB基因,并且任选地过氧化物酶体ABC型酰基-CoA转运蛋白、过氧化物酶体酰基-CoA氧化酶和/或异柠檬酸裂解酶基因的表达的突变体藻类或不等鞭毛体微生物可以是通过任何可行的方法产生的突变体,所述方法包含但不限于UV照射、γ照射或化学诱变,以及筛选具有增加脂质产生的突变体,例如通过用亲脂性染料,如尼罗红(Nile Red)或BODIPY(例如,Cabanelas等人(2015)《生物资源技术(Bioresource Technology)》184:47-52)染色。用于产生微生物的经典突变体的方法是众所周知的。可以通过基因组测序或与基因组基因座相对应的PCR产物的测序来确认兴趣基因座中的突变。
在其它实例中,本文提供的比对照藻类微生物产生更多脂质的突变体藻类或不等鞭毛体微生物可以是基因工程化的突变体,例如其中基因(如TrifuncB、TrifuncA、过氧化物酶体ABC型酰基-CoA转运蛋白基因、过氧化物酶体酰基-CoA氧化酶基因和/或异柠檬酸裂解酶基因)的突变体已经通过同源重组被靶向,例如用于敲除、敲入或基因置换(例如,用突变形式的基因,所述基因可以编码相对于对照藻类微生物中的多肽具有降低活性的多肽)。例如,可以通过定点同源重组工程化兴趣微生物以将序列插入到基因组基因座中并且由此改变基因和/或其表达,或将启动子插入到宿主微生物的基因座中以影响特定基因或一组基因在所述基因座处的表达。在其它实例中,本文提供的突变体藻类或不等鞭毛体微生物可以是经过基因工程化的突变体,其中使用RNAi使TrifuncB和/或TrifuncA基因的表达,并且任选地PXA、ACO或ICL基因的表达弱化。
基因和多肽序列、蛋白质的保守结构域的可搜索数据库和标识此类结构域的搜索程序以及基因、蛋白质和保守结构域(如本文公开的那些基因、蛋白质和保守结构域)的搜索和序列比较软件在万维网上是可公开获得的,并且其用途是本领域的技术人员众所周知的。本领域的技术人员可以使用计算机模拟方法(in silico method)并且如果必要的话,与从兴趣物种产生的基因组或cDNA文库杂交、此类文库的抗体筛选、使用靶向保守结构域的简并引物的PCR、基因组步移、基因组和/或RNA测序等容易地标识对兴趣微生物物种(如藻类和不等鞭毛体物种)中的线粒体β氧化酶、过氧化物酶体转运蛋白、过氧化物酶体β氧化酶和乙醛酸通路的酶进行编码的基因。本文的公开内容包含可以被靶向的基因、经过编码的蛋白质的序列和此类蛋白质的保守结构域以及各种物种(包含藻类和不等鞭毛体物种)中的同源物的序列的实例。基于本文的公开内容和大量可获得的生物信息学信息和工具,本领域的技术人员将不会负担标识和靶向在另外的兴趣物种中对线粒体β氧化通路、过氧化物酶体β氧化通路、过氧化物酶体转运蛋白或乙醛酸通路酶的多肽进行编码的相关基因。
因此,用于制备具有弱化的例如TrifuncA和/或TrifuncB基因并且任选地ACO、PXA和/或ICL基因的表达的突变体藻类或不等鞭毛体微生物的方法可以利用例如同源重组;CRISPR系统,包含引导RNA、Cas酶,并且任选地用于插入靶向位点中的供体片段;RNAi构建体,包含用于产生shRNA、siRNA和微RNA的构建体;反义RNA分子和构建体;核酶构建体;TALENS、锌指核酸酶;以及大范围核酸酶。例如,被工程化以具有弱化的对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的基因的表达的突变体藻类或不等鞭毛体微生物可以具有破坏的基因,所述破坏的基因包含减少或消除基因表达的至少一个插入、突变或缺失,使得全功能蛋白质不产生或以比由不包含破坏的基因的对照藻类微生物产生的量更低的量产生。破坏的基因可以通过例如通过同源重组和/或通过靶向核酸酶(如大范围核酸酶、锌指核酸酶(Perez-Pinera等人(2012)《生物化学当代观点(Curr.Opin.Chem.Biol.)》16:268-277)、TALEN(WO 2014/207043;WO 2014/076571)或CRISPR系统的Cas蛋白(例如,Cas9蛋白))的活性介导的插入或基因置换来破坏。
通过同源重组的基因敲除或置换可以通过核酸(例如,DNA)片段的转化来进行,所述核酸片段包含与待改变的基因组区域同源的序列,如TrifuncA和/或TrifuncB基因并且任选地ACO1、PXA1和/或ICL基因,其中所述同源序列被外源序列中断,所述外源序列通常是允许选择整合的构建体的可选择标记基因。在外源序列或突变的基因序列的任一侧上的基因组同源侧接序列的长度可以为例如至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1,000个、至少1,200个、至少1,500个、至少1,750个或至少2,000个核苷酸。可以在载体中提供基因敲除或基因“敲入”构建体,其中外源序列侧接靶基因序列,所述载体可以任选地被线性化,例如在要经历同源重组的区域之外,或可以作为不在载体的上下文中的线性片段提供,例如敲除或敲入构建体可以是分离的或合成的片段,包含但不限于PCR产物。在一些实例中,分裂标记系统可以用于通过同源重组产生基因敲除,其中可以引入两个DNA片段,所述片段可以再生可选择标记并且通过三个交换事件破坏兴趣基因座(Jeong等人(2007)《FEMS微生物学快报(FEMS Microbiol Lett)》273:157-163)。
因此,本文提供了一种用于制备突变体藻类微生物的方法,所述方法包含使用以下中的一种或多种将重组核酸分子插入到线粒体三功能蛋白亚基B(TrifuncB)基因或线粒体三功能蛋白亚基A(TrifuncA)基因中:同源重组、成簇规律间隔短回文重复序列(CRISPR)/基于Cas的RNA引导的DNA内切核酸酶、转录激活因子样效应因子核酸酶(TALEN)、锌指核酸酶(ZFN)或大范围核酸酶。如本文提供的,突变通常导致弱化的TrifuncB或TrifuncA蛋白的表达,并且相对于对照野生型藻类微生物,突变体产生更多的脂质,例如如通过在每体积或每面积每天的基础上更多的可脂肪酸甲酯衍生的脂质(FAME脂质)所证明的和/或通过增加的可脂肪酸甲酯衍生的脂质与总有机碳(FAME/TOC)比率所证明的。
与在相同培养条件下生长的对照微生物相比,使一个拷贝的基因之一突变可以提供弱化的基因表达并且导致脂质产生增加。此外,在具有多于一个拷贝的TrifuncB、TrifuncA、PXA1、ACO1和/或ICL基因的物种中,在任何实施例中,可以使本文提供的多个拷贝(例如,所有拷贝)的这些靶基因中的一个或多个靶基因突变,或可以使一个或多个但少于所有拷贝的靶基因中的一个或多个靶基因突变以实现弱化的表达。
本文提供的任何突变体藻类微生物(其中TrifuncA和/或TrifuncB基因并且任选地ACO、PXA和/或ICL基因中的突变导致弱化的表达)可以通过使用靶向核酸酶(包含任何CRISPR/Cas系统)来产生。CRISPR系统,由Hsu等人(《细胞(Cell)》157:1262-1278,2014)和Zetsche等人()综述,除了Cas核酸酶多肽或复合物之外,还包含通过与靶位点序列的互补性与基因组靶位点相互作用的靶向RNA(通常称为“crRNA”)、反式激活(“tracr”)RNA,其与Cas多肽复合并且还包含结合靶向crRNA(通过互补性)的区域。
因此,在一个实施例中,导致弱化的TrifuncA和/或TrifuncB基因并且任选地ACO、PXA和/或ICL基因的表达的突变在Cas PAM序列(如Cas9 PAM序列)上游的5个、10个、15个、20个、25个、30个、40个、45个或50个碱基对内。如本文提供的,在示例性实施例中,突变是TrifuncB基因的第一外显子或第二外显子,其是由用CRISPR/基于Cas的RNA引导的DNA内切核酸酶进行的插入产生的。
本文提供的突变体藻类微生物可以使用可以被共转化到宿主菌株中(或在宿主菌株中表达)的两个RNA分子(“crRNA”和“tracrRNA”)产生,所述宿主菌株表达Cas蛋白或用其转染以用于基因组编辑,或使用包含与靶序列互补的序列以及与Cas蛋白相互作用的序列的单引导RNA。也就是说,在一些策略中,如本文所使用的CRISPR系统可以包括两个单独的RNA分子(RNA多核苷酸:“tracr-RNA”和“targeter-RNA”或“crRNA”,参见下文)并且在本文中被称为“靶向双分子DNA的RNA”或“靶向双分子DNA的RNA”。可替代地,靶向DNA的RNA还可以包含用于与Cas蛋白相互作用的反式激活序列(除了靶向同源(“cr”)序列之外),即靶向DNA的RNA可以是单个RNA分子(单个RNA多核苷酸),并且在本文中被称为“嵌合的引导RNA”、“单引导RNA”或“sgRNA”。术语“靶向DNA的RNA”和“gRNA”是包含性的,是指靶向双分子DNA的RNA和靶向单分子DNA的RNA(即,sgRNA)两者。单分子引导RNA和两种RNA系统两者均已经在文献中并且例如,在美国专利申请公开号US 2014/0068797中进行详细描述,所述美国专利申请通过引用整体并入本文。在一些实施例中,CRISPR系统的引导RNA包含例如天然存在的TrifuncB、TrifuncA、ACO、PXA或ICL基因的序列的至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个或至少25个核苷酸。
任何Cas蛋白可以用于本文的方法中,包含但不限于Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csm、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、MAD 1-20中的任一个、其同系物或其修饰版本。作为非限制性实例,Cas蛋白可以是Cas9蛋白,如酿脓葡萄球菌(Staphylococcus pyogenes)、嗜热链球菌(S.thermophilus)、肺炎链球菌(S.pneumonia)、金黄色葡萄球菌(S.aureus)或脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9蛋白。还考虑了在美国专利申请公开号US 2014/0068797中提供为SEQ ID NO:1-256和795-1346的Cas9蛋白,以及可以组合来自多于一种Cas9蛋白的结构域的嵌合Cas9蛋白,以及经过标识的Cas9蛋白的变体和突变体。作为非限制性实例,Cas蛋白可以是Cpf1蛋白,如As或新凶手弗朗西丝菌(Francisella novicida)、氨基酸球菌属(Acidaminococcus)、普雷沃菌属(Prevotella)或毛螺菌科细菌(Lachnospiraceae bacterium)或其衍生物或修饰版本的Cpf1蛋白。
Cas核酸酶活性切割靶DNA以产生双链断裂。这些断裂然后由细胞以两种方式中的一种修复:非同源末端连接或同源性定向修复。在非同源末端连接(NHEJ)中,通过将断裂末端彼此直接连接来修复双链断裂。在这种情况下,没有新的核酸材料插入到位点中,但是一些核酸材料可能丢失,从而导致缺失或改变,通常导致突变。在同源性定向修复中,将可以与切割的靶DNA序列具有同源的供体多核苷酸(有时称为“供体DNA”或“编辑DNA”)用作用于修复切割的靶DNA序列的模板,从而导致将基因信息从供体多核苷酸转移到靶DNA中。如此,新的核酸材料可以插入/复制到位点中。由于NHEJ和/或同源性定向修复(例如,使用供体DNA分子)引起的靶DNA的修饰可以导致例如基因校正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。Cas系统用于基因编辑的用途是本领域众所周知的并且在许多专利和公开的专利申请中进行描述,例如US 10,000,772、US 9,697,359、US 8,697,359、US 10,011,849、US 2017/0073695和WO 2016/166340,所述专利或公开的专利申请中的每一个以其整体并入本文。
在一些实例中,通过定点修饰多肽(例如,Cas核酸酶、锌指核酸酶、大范围核酸酶、TALEN或其它靶向核酸酶)切割DNA可以用于通过切割靶DNA序列并且允许细胞在不存在外源提供的供体多核苷酸的情况下修复序列来从靶DNA序列中缺失核酸材料。此类NHEJ事件可以在切割的末端的重新连接的位点处导致突变(“错误修复”),这可能导致基因破坏。
可替代地,如果将靶向DNA的RNA以及供体DNA共同施用于表达Cas核酸酶的细胞,则主题方法可以用于向靶DNA序列添加(即,插入或置换)核酸材料(例如,通过插入诱变“敲除”或“敲入”编码蛋白质(例如,可选择标记和/或任何兴趣蛋白质)、siRNA、miRNA等核酸,以修饰核酸序列(例如,引入突变)。
在特定实施例中,供体DNA可以包含基因调节序列(例如,启动子),所述基因调节序列可以使用CRISPR靶向插入基因的编码区的上游和基因的假定近端启动子区的上游,例如靶基因(如TrifuncA和/或TrifuncB基因,并且任选地ACO1、PXA1和/或ICL基因)的编码区的起始ATG的上游至少50bp、至少100bp、至少120bp、至少150bp、至少200bp、至少250bp、至少300bp、至少350bp、至少400bp、至少450bp或至少500bp。供体DNA可以包含可能干扰天然启动子的序列,例如可选择标记或任何方便的序列。插入开放阅读框的起始ATG的上游(例如,在基因的5'UTR中或转录起始位点的上游)的另外的序列可以减少或甚至消除对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的内源基因的表达。可替代地或另外,对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的天然基因可以使其内源启动子全部或部分地被较弱的或不同地调节的启动子或非启动子序列置换。
在一些实例中,引入到藻类宿主微生物中以产生高效基因组编辑细胞系的核酸分子编码相对于对应的野生型酶突变的Cas9酶,使得突变的Cas9酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。例如,来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化为切口酶(切割单链的酶)。使Cas9成为切口酶的突变的其它实例包含但不限于H840A、N854A和N863A。在一些实施例中,Cas9切口酶可以与一个或多个引导序列(例如,两个引导序列)组合使用,所述引导序列分别靶向DNA靶的有义链和反义链。此组合允许两条链被切割并用于诱导NHEJ。两种切口酶靶(在紧密接近但靶向DNA的不同链内)可以用于诱导诱变的NHEJ。使用在交错位置处切割相对菌株的酶对基因座的此类靶向还可以减少脱靶切割,因为两条链必须被精确地且特异性地切割以实现基因组突变。
在另外的实例中,可以在微生物中表达在其切割DNA的能力方面受损的突变体Cas9酶,其中还引入靶向靶向基因的转录或翻译起始位点上游的序列的一个或多个引导RNA。在这种情况下,Cas酶可以结合靶序列并阻断靶向基因的转录(Qi等人(2013),《细胞》152:1173-1183)。这种基因表达的CRISPR干扰可以被称为RNAi并且还在Larson等人(2013)《自然实验手册(Nat.Protoc.)》8:2180-2196中进行了详细描述。在一些情况下,Cas多肽(如Cas9多肽)是融合多肽,包括例如:i)Cas9多肽(其可以任选地是如上所述的变体Cas9多肽);以及b)共价连接的异源多肽(也被称为“融合配偶体”)。
宿主微生物可以用例如载体构建体进行基因工程化(例如,转导或转化或转染),所述载体构建体可以是例如用于同源重组的载体,所述载体包含与宿主微生物的TrifuncA、TrifuncB、ACO、PXA和/或ICL的一部分同源或与其邻近的区域同源的核酸序列,或者可以是用于表达以下中的任一个或组合的表达载体:Cas蛋白(例如,Cas9蛋白)、CRISPR嵌合引导RNA、crRNA和/或tracrRNA、RNAi构建体(例如,shRNA、siRNA或微RNA)、反义RNA或核酶。载体可以是例如质粒、病毒颗粒、噬菌体等形式。用于表达用于基因组编辑的多肽或RNA的载体也可以被设计用于整合到宿主中,例如通过同源重组。一种含有如本文所述的多核苷酸序列的载体,例如与对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路(包含对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路序列的蛋白质进行编码的基因的上游和下游的序列)的蛋白质进行编码的宿主基因序列具有同源性的序列,以及任选地可选择标记或报告基因,可以用于转化适当的宿主以使TrifuncA和/或TrifuncB基因,并且任选地ACO1、PXA1和/或ICL基因的弱化。
在一些实例中,本文提供的突变体藻类或不等鞭毛体微生物可以包含用于使对来自β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的基因的表达弱化的核酸构建体,例如对与迦得拟微球藻TrifuncB(SEQ ID NO:10)、TrifuncA(SEQ ID NO:1)、PXA1(SEQ ID NO:20)、ACO1(SEQ ID NO:22)或ICL(SEQ ID No:24)的任何氨基酸序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的多肽进行编码的基因。例如,突变体藻类或不等鞭毛体微生物可以包含用于表达RNAi分子、核酶或反义分子的构建体,所述构建体减少对TrifuncA、TrifuncB、PXA、ACO和/或ICL进行编码的基因的表达。例如,可以将包含基因的转录区的全部或一部分的反义RNA构建体引入到微生物中以减少基因表达(Shroda等人(1999)《植物细胞(The PlantCell)》11:1165-78;Ngiam等人(2000)《应用与环境微生物学(Appl.Environ.Microbiol.)》66:775-782;Ohnuma等人(2009)《原生质(Protoplasma)》236:107-112;Lavaud等人(2012)《公共科学图书馆:综合(PLoS One)》7:e36806)。可替代地或另外,靶向对来自线粒体β氧化通路、过氧化物酶体β氧化通路和/或乙醛酸通路的蛋白质进行编码的基因(如TrifuncB、TrifuncA、PXA、ACO和/或ICL)的一种或多种RNAi构建体(例如,对短发夹RNA进行编码的构建体)可以被引入到藻类微生物中以用于减少一个或多个基因的表达(参见例如,Cerruti等人(2011)《真核細胞》(2011)10:1164-1172;Shroda等人(2006)《当代基因学(Curr.Genet.)》49:69-84)。在一些实例中,此类突变体藻类或不等鞭毛体微生物可以具有减少的但未消除的靶基因的表达,并且可以具有例如约25%到约200%或更多的脂质产生的增加。
因此,本文提供了一种用于制备突变体藻类或不等鞭毛体微生物的方法,所述方法包含将用于表达RNAi分子、微RNA、反义分子或核酶中的一种或多种的重组核酸分子引入到对照藻类微生物中,其中所述RNAi分子、所述反义分子或所述核酶靶向所述藻类微生物的TrifuncA或TrifuncB基因。与对照藻类或不等鞭毛体微生物相比,突变体藻类或不等鞭毛体微生物通常显示出增加的脂质产生。在其它实施例中,本文提供了一种用于制备双突变体藻类或不等鞭毛体微生物的方法,所述方法包含将用于表达RNAi分子、微RNA、反义分子或核酶中的一种或多种的重组核酸分子引入到突变体藻类或不等鞭毛体微生物中,其中所述突变体藻类或不等鞭毛体微生物包含导致线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化的突变,并且其中所述RNAi分子、所述反义分子或所述核酶靶向所述藻类微生物的所述过氧化物酶体β氧化通路的基因或乙醛酸通路的基因。与突变体藻类微生物相比,此类突变体藻类或不等鞭毛体微生物通常显示出进一步增加的脂质产生。在一些实例中,所述双突变体藻类微生物可以包含用于表达靶向所述藻类微生物的所述过氧化物酶体β氧化通路的基因或所述乙醛酸通路的基因的所述RNAi分子、微RNA、反义分子或核酶的重组核酸分子以及用于表达靶向TrifuncA基因或TrifuncB基因的另一个RNAi分子、微RNA、反义分子或核酶的另一个重组核酸分子。在说明性实施例中,过氧化物酶体β氧化通路蛋白是ACO1或PXA1,并且所述乙醛酸通路蛋白是ICL。
核酶是以位点特异性方式切割核酸的RNA-蛋白质复合物。核酶具有拥有内切核酸酶活性的特异性催化结构域。例如,美国专利第5,354,855号报道了某些核酶可以充当内切核酸酶,其序列特异性大于已知的核糖核酸酶的序列特异性,并且接近DNA限制酶的序列特异性。催化性RNA构建体(核酶)可以被设计成与对本文提供的基因进行编码的mRNA碱基配对以切割mRNA靶。在一些实例中,核酶序列可以整合在反义RNA构建体内以介导靶标的切割。可以考虑各种类型的核酶,其设计和用途是本领域已知的并且例如在Haseloff等人(1988)《自然(Nature)》334:585-591中进行描述。
借助于互补碱基对相互作用与位点退火,将核酶靶向给定序列。这种靶向需要两个同源性段。这些同源序列的段侧接上文所定义的催化性核酶结构。同源序列的每个段的长度可以为7到15个核苷酸不等。用于定义同源序列的唯一要求是,在靶RNA上,其被作为切割位点的特定序列分开。对于锤头状核酶,切割位点是靶RNA上的二核苷酸序列,例如尿嘧啶(U),然后是腺嘌呤、胞嘧啶或尿嘧啶(A、C或U)(Thompson等人(1995),《核酸研究》23:2250-68)。此二核苷酸在任何给定RNA中存在的频率在统计学上是16个中的3个。因此,对于给定的1,000个碱基的靶信使RNA,187个二核苷酸切割位点在统计学上是可能的。
已经详细讨论了核酶引导的RNA切割活性的一般设计和优化(Haseloff和Gerlach(1988)《自然》334:585-591;Symons(1992)《生物化学年鉴(Ann Rev Biochem)》61:641-71;Chowrira等人(1994)《生物化学杂志》269:25856-64;Thompson等人(1995)同上),所有所述文献通过引用整体并入。设计和测试用于有效切割靶RNA的核酶是本领域的技术人员众所周知的方法。用于设计和测试核酶的科学方法的实例是由Chowrira等人(1994)同上以及Lieber和Strauss(1995)《分子细胞生物学(Mol Cell Biol.)》15:540-51进行描述,每个所述文献通过引用并入。用于下调给定基因的有效和优选序列的标识是制备和测试给定序列的问题,并且是本领域的技术人员已知的常规实践的“筛选”方法。
RNAi构建体的用途在上文所引用的文献中以及例如US2005/0166289和WO 2013/016267中进行了讨论。将与靶基因具有同源性的双链RNA递送到细胞或通过RNAi构建体(例如,RNAi短发夹(sh)构建体(shRNA))的表达在细胞中产生。构建体可以包含与靶基因(即,TrifuncA、TrifuncB、ACO、PXA和/或ICL基因)相同的序列,或与靶基因的序列至少70%、80%、90%、95%或在95%与100%之间相同的序列。构建体可以具有与靶基因同源的序列的至少20个、至少30个、至少40个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个或至少1000个碱基。可以使用选择用于RNAi构建体(如产生shRNA的构建体)的连续或诱导型表达的启动子来工程化表达载体。
用于基因弱化的重组核酸分子,例如核酶、RNAi或反义构建体可以包含与待工程化的微生物的靶基因(即,TrifuncA、TrifuncB、PXA、ACO和/或ICL基因)的序列的至少一部分具有至少80%,如至少85%、至少90%、至少95%或至少99%同一性或互补性的至少15个、至少20个、至少30个、至少40个、至少50个或至少60个核苷酸。用于基因弱化的重组核酸分子,例如核酶、RNAi或反义构建体可以包含与天然存在的靶基因(如对与内源靶基因(即,TrifuncA、TrifuncB、PXA、ACO和/或ICL基因)具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%、至少90%或至少95%序列同一性的多肽进行编码的基因)的序列具有至少80%,如至少95%或约100%同一性或互补性的至少15个、至少20个、至少30个、至少40个、至少50个或至少60个核苷酸。例如,用于基因弱化的重组核酸分子,例如核酶、RNAi或反义构建体可以包含与天然存在的靶基因(例如,TrifuncA、TrifuncB、PXA、ACO和/或ICL基因)的序列具有至少80%同一性或互补性的至少15个、至少20个、至少30个、至少40个、至少50个或至少60个核苷酸。核苷酸序列可以是例如,约30个核苷酸到约3千碱基或更大,例如长度为30-50个核苷酸、长度为50到100个核苷酸、长度为100到500个核苷酸、长度为500个核苷酸到1kb、长度为1kb到2kb或2到5kb。例如,反义序列的长度可以为约100个核苷酸到约1kb。例如,用于基因弱化的重组核酸分子,例如核酶、RNAi或反义构建体可以包含与对靶蛋白(即,TrifuncA、TrifuncB、PXA、ACO和/或ICL)进行编码的内源基因具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%同一性或互补性的至少15个、至少20个、至少30个、至少40个、至少50个、至少60个或至少100个核苷酸。
反义RNA、RNAi或核酶构建体中使用的启动子可以是在宿主藻类微生物中起作用并且适合于将靶基因的表达减少到期望量所需的表达水平的任何启动子。在藻类和不等鞭毛体中起作用的启动子是本领域已知的。可以使用任何可行的方法(包含本文公开的任何方法)将构建体转化为藻类。一种用重组核酸分子转化的突变体藻类微生物,所述重组核酸分子用于使对来自线粒体β氧化通路、过氧化物酶体β氧化通路和/或乙醛酸通路的蛋白质进行编码的基因的表达弱化,如但不限于反义、RNAi或核酶构建体,所述突变体藻类微生物可以具有如本文所述的突变体的特性,包含例如与不包含导致弱化的基因表达的一个或多个重组核酸分子的宿主微生物相比增加的脂质产生。
本身形成本发明的实施例的本发明的相关方面是被设计用于使对TrifuncA、TrifuncB、ACO、PXA和/或ICL进行编码的基因表达弱化的重组核酸分子。在各个实例中,重组核酸分子可以是或可以包括对CRISPR系统的引导RNA进行编码的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体,例如具有一个或多个核苷酸序列的构建体,所述一个或多个核苷酸序列与对来自如本文公开的线粒体β氧化通路、过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的天然存在的基因和/或在衍生所述基因的藻类微生物的基因组中其邻近的序列具有同源性,如基因的内含子的至少一部分、5'UTR的至少一部分、启动子区的至少一部分和/或3'UTR的至少一部分。例如,重组核酸分子可以包含对蛋白质进行编码的基因的至少一部分,所述蛋白质具有与编码与迦得拟微球藻TrifuncB(SEQID NO:10)、TrifuncA(SEQ ID NO:1)、PXA1(SEQ ID NO:20)、ACO1(SEQ ID NO:22)或ICL(SEQ ID NO:24)的任何氨基酸序列的至少50%、至少75%、至少80%、至少90%、至少95%或约100%的连续段具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一性的多肽,和/或具有与迦得拟微球藻TrifuncB(SEQ ID NO:11)、TrifuncA(SEQID NO:2)、PXA1(SEQ ID NO:21)、ACO1(SEQ ID NO:23)或ICL(SEQ ID No:25)的任何编码序列具有至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%同一性的编码区的天然存在的基因的至少一部分同源的序列。进一步地,本文提供了用于同源重组的重组核酸分子,所述重组核酸分子包含来自藻类或不等鞭毛体微生物的基因组的TrifuncB、TrifuncA、PXA1、ACO1或ICL基因座的至少一个序列,所述至少一个序列与异源核酸序列并置,所述异源核酸序列在非限制性实例中可以是可选择标记或可检测标记基因。在一些实例中,用于同源重组的构建体包含来自藻类的基因组的TrifuncB、TrifuncA、PXA1、ACO1或ICL基因座的两个核酸序列,其中所述两个序列侧接用于插入到TrifuncB、TrifuncA、PXA1、ACO1或ICL基因座中的异源序列。另外,本文提供了反义、核酶或RNAi构建体,其包含对TrifuncB、TrifuncA、PXA1、ACO1或ICL蛋白进行编码的天然存在的基因的至少一部分,例如与SEQ ID NO:10、1、20、22或24中的任一个具有至少至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%同一性的多肽,其中启动子(如异源启动子)可操作地连接到TrifuncB、TrifuncA、PXA1、ACO1或ICL基因序列并且TrifuncB、TrifuncA、PXA1、ACO1或ICL基因序列处于反义朝向。在一个实施例中,突变在Cas9 PAM序列上游的25个碱基对内。在示例性实施例中,突变在TrifuncB基因的第二外显子中。TrifuncB的第二外显子的这种突变可以是例如用CRISPR/基于Cas的RNA引导的DNA内切核酸酶进行的插入。
增加的脂质产生
本文提供的突变体藻类微生物通常表现出增加的脂质产生。测量由微生物产生的脂质的量的方法在本领域中是众所周知的并且在本文的实例中说明。根据Folch等人(1957)《生物化学杂志》226:497-509;Bligh和Dyer(1959)《生理生化杂志(Can.J.Biochem.Physiol.》37:911-917;或Matyash等人(2008)《脂质研究杂志(J.LipidRes.)》49:1137-1146确定总的可提取脂质,例如并且还可以使用傅立叶变换红外光谱(Fourier transform infrared spectroscopy)(FT-IR)评估以脂质存在的生物质的百分比(Pistorius等人(2008)《生物技术和生物工程(Biotechnol&Bioengin.)》103:123-129)。在例如US 8,207,363和WO 2011127118中提供了用于FAME和TAG的重量分析的另外的参考文献,每个参考文献通过引用整体并入本文。一旦已知突变体藻类或不等鞭毛体微生物和对照藻类或不等鞭毛体微生物中脂质的量,就可以例如通过确定体积脂质生产力来确定每种微生物的脂质产生,所述体积脂质生产力可以评估为每体积每天或每面积每天产生的脂质的量。如此,脂质产生的增加可以是脂质合成增加或脂质代谢减少的结果。不受理论限制,据信由本文提供的突变体藻类和不等鞭毛体微生物表现出的脂质产生增加是脂质代谢减少的结果。因此,更多的总碳被分配到脂质中,并且随着时间的推移,更多的脂质积累在突变体藻类或不等鞭毛体微生物中。
可以通过测量总有机碳(TOC)或通过其它方法,如测量无灰干重(AFDW)来评估生物质。用于测量TOC的方法是本领域已知的(例如,US 8,835,149)并且在本文中提供。测量AFDW的方法也是众所周知的,并且可以例如在US 8,940,508中找到,所述文献通过引用整体并入本文。
将本文提供的具有增加的脂质产生的突变体的特性与对照藻类微生物的相同特性进行比较,所述对照藻类微生物可以是与突变体相同物种的野生型生物体,优选地突变体的祖代菌株。可替代地,对照藻类或不等鞭毛体微生物可以是与突变体藻类或不等鞭毛体微生物基本上相同的微生物,不同之处在于对照藻类或不等鞭毛体微生物不具有存在于突变体藻类或不等鞭毛体微生物中的突变。例如,对照藻类或不等鞭毛体微生物可以是经过基因工程化的微生物或经典突变的生物体,其已经被进一步突变或工程化以产生如本文公开的具有增加的脂质生产力的突变体。
在一些实例中,对照微生物可以是与突变体微生物基本上相同的微生物,不同之处在于对照微生物不具有对TrifuncA和/或TrifuncB蛋白,并且任选地过氧化物酶体β氧化通路或乙醛酸通路蛋白(如ACO、PXA和/或ICL蛋白)进行编码的基因中的突变。还可以将具有破坏的、弱化的或以其它方式直接或间接基因操纵的一个或多个基因(导致TrifuncA和/或TrifuncB基因,并且任选地ACO、PXA和/或ICL基因的改变的结构或表达)的突变体的特性与不具有破坏的、弱化的或以其它方式直接或间接基因操纵的对TrifuncA和/或TrifuncB,并且任选地ACO、PXA和/或ICL(无论微生物是否是“野生型”)进行编码的一个或多个基因的对照微生物的相同特性进行比较。例如,对照藻类或不等鞭毛体微生物可以是在除了TrifuncA和/或TrifuncB基因并且任选地ACO、PXA和/或ICL基因之外的基因中突变的突变体藻类或不等鞭毛体微生物或藻类或不等鞭毛体微生物。在一些实例中,对照微生物是野生型微生物。
在一些实施例中,当在对照藻类或不等鞭毛体微生物产生生物质的相同条件下生长时,本文提供的突变体藻类或不等鞭毛体微生物相对于对照藻类或不等鞭毛体微生物具有增加的FAME生产力。当在其中突变体藻类或不等鞭毛体微生物的培养物和对照藻类或不等鞭毛体微生物的培养物两者均产生生物质的条件下培养突变体藻类或不等鞭毛体微生物和对照藻类或不等鞭毛体微生物两者时,本文提供的任何突变体藻类或不等鞭毛体微生物产生的FAME可以比对照藻类或不等鞭毛体微生物产生的FAME高例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少120%、至少140%、至少160%、至少180%或至少200%。在某些实例中,突变体藻类或不等鞭毛体微生物产生的FAME(其比对照藻类或不等鞭毛体微生物产生的FAME更大)可以介于范围的低端上的5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%和100%与范围的高端上的20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%和200%之间。
相对于对照微生物,具有增加的脂质产生的突变体可以具有增加的碳与脂质的分配,这种增加的分配可以表示为碳与总可提取脂质、与总中性脂质、与甘油三酯和/或与FAME衍生的脂质的分配。例如,本文提供的突变体藻类或不等鞭毛体微生物的所产生的FAME衍生的脂质(“FAME”)的量与所产生的生物质(例如,TOC或无灰干重(AFDW))的比率可以高于对照藻类或不等鞭毛体微生物的比率。当在其中突变体藻类微生物的培养物和对照藻类微生物的培养物两者均产生生物质的条件下培养突变体藻类或不等鞭毛体微生物和对照藻类或不等鞭毛体微生物两者时,本文提供的突变体藻类或不等鞭毛体微生物的FAME/TOC可以比对照藻类或不等鞭毛体微生物的FAME/TOC高例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少120%、至少140%、至少160%、至少180%或至少200%。在其它实例中,突变体藻类微生物的FAME/TOC(其比对照藻类或不等鞭毛体微生物的FAME/TOC高)可以介于范围的低端上的5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%和100%与范围的高端上的20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%和200%之间。
在其它实例中,当在其中突变体藻类或不等鞭毛体微生物培养物产生的生物质(例如,TOC)是对照藻类或不等鞭毛体微生物培养物的生物质的至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%的条件下培养时,在对照培养物和突变体培养物两者均产生生物质的条件下,本文提供的突变体的FAME/TOC可以是至少0.10、至少0.15、至少0.20、至少0.25、至少0.30、至少0.35、至少0.40、至少0.45、至少0.50、至少0.55、至少0.60、至少0.65、至少0.7或至少0.75。
在这些实施例中,在其中突变体和对照藻类或不等鞭毛体微生物两者均产生生物质的培养条件下,在本文提供的突变体藻类或不等鞭毛体微生物相对于对照藻类或不等鞭毛体微生物产生更高量的FAME或表现出更高的Fame/TOC的情况下,所述突变体藻类微生物可以产生至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少120%、至少140%、至少160%、至少180%或至少200%的由对照藻类或不等鞭毛体微生物在每日的基础上产生的生物质。
在一些具体实例中,本文提供的突变体藻类或不等鞭毛体微生物相对于对照藻类微生物和至少50%的生物质但少于150%或少于200%的由对照藻类微生物产生的生物质产生更高量的FAME。相对于对照藻类微生物,突变体藻类或不等鞭毛体微生物可以产生例如多至少25%的FAME,并且产生的生物质是对照藻类微生物的生物质的至少50%。在另外的实例中,在其中对照藻类或不等鞭毛体微生物产生生物质的条件下,相对于对照藻类或不等鞭毛体微生物,突变体藻类或不等鞭毛体微生物可以产生多50%的FAME,并且具有是对照藻类或不等鞭毛体微生物的生物质的至少50%。相对于对照藻类或不等鞭毛体微生物,突变体在一些实例中可以产生多小于400%的脂质,同时突变体积累的生物质是对照藻类或不等鞭毛体微生物的生物质的至少50%。
在其它具体实例中,当在其中对照微生物和突变体微生物两者均产生生物质的条件下培养时,本文提供的突变体藻类或不等鞭毛体微生物可以产生多至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少95%或至少100%的FAME,同时产生至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%的由对照藻类或不等鞭毛体微生物产生的TOC,并且突变体微生物的FAME/TOC比对照微生物的FAME/TOC高至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%或至少75%。突变体藻类或不等鞭毛体微生物的FAME/TOC可以为例如至少0.30或至少0.35。在另外的实施例中,在其中对照微生物和突变体微生物两者均产生生物质的条件下培养时,本文提供的突变体藻类或不等鞭毛体微生物可以产生至少50%、至少55%、至少60%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少95%或至少100%的由对照藻类或不等鞭毛体微生物产生的TOC,并且突变体藻类或不等鞭毛体微生物的FAME/TOC比对照藻类或不等鞭毛体微生物的FAME/TOC大至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少95%或至少100%。突变体微生物的FAME/TOC可以为例如至少0.35、至少0.40或至少0.45。
在又另外的具体实例中,当在其中野生型和突变体藻类微生物两者均产生生物质的条件下培养时,相比于对照藻类微生物,本文提供的突变体藻类微生物可以产生多至少85%、至少90%、至少95%、至少100%、至少105%、至少110%、至少115%、至少120%、至少125%、至少130%、至少135%、至少140%、至少145%或至少150%的FAME,同时产生至少70%、至少75%、至少80%或至少85%的由对照藻类微生物产生的TOC,并且突变体藻类微生物的FAME/TOC比对照藻类微生物大至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%或至少180%。
当在其中对照藻类微生物培养物产生生物质的相同条件下培养突变体藻类微生物和对照藻类微生物两者时,相对于对照藻类微生物具有增加的脂质生产力的本文提供的突变体藻类微生物的任何实施例可以具有例如在至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天、至少15天、至少20天、至少25天、至少30天、至少35天、至少40天、至少45天、至少50天、至少60天、至少70天、至少80天、至少90天或至少100天,和/或少于1天、少于2天、少于3天、少于4天、少于5天、少于6天、少于7天、少于8天、少于9天、少于10天、少于11天、少于12天、少于13天、少于14天、少于15天、少于20天、少于25天、少于30天、少于35天、少于40天、少于45天、少于50天、少于60天、少于70天、少于80天、少于90天、少于100天、少于120天或少于180天的培养时间段之后进行的脂质测量。在任何实施例中,可以对突变体和对照藻类微生物进行脂质测量,无论是以分批、半连续或连续培养进行培养持续上述时间长度。在一些实例中,在其中突变体和对照藻类微生物两者均产生生物质并主动分裂的培养条件下,本文提供的突变体藻类微生物相对于对照藻类微生物具有增加的脂质生产力。与对照藻类微生物相比,本文提供的任何突变体藻类微生物具有增加的脂质生产力的培养条件可以是相对于对照藻类微生物充满氮的培养条件,也就是说,相对于对照藻类微生物,培养条件可以是足够的氮,使得另外的氮不会增加微生物的生长速率(其中所有其它培养条件和成分保持不变)。本文提供的任何实施例的培养条件还可以是光合自养的,其中所述培养条件仅含有无机碳。
本发明的突变体藻类微生物导致增加的总脂质产生。如本文的实例中所展示的,此类增加的脂质产生可以包含具有特定谱的FAME的增加。例如,在某些实例中,本文提供的突变体藻类微生物表现出增加的脂质产生,其中FAME谱具有16碳脂肪酸的增加,如16:0和/或16:1脂肪酸,和/或20碳脂肪酸的减少,如与从对照藻类微生物分离的脂质的脂肪酸谱相比的20:4和/或20:5脂肪酸。技术人员将标识可以用于表征脂质谱的方法,如本文的实例部分中所展示的,如薄层色谱法、液相色谱法(包含HPLC)、气相色谱法和/或质谱法。因此,本文提供为本发明的另一个实施例的是使用本文提供的任何突变体藻类微生物产生的脂质组合物。以下提供了用于产生和分离此类脂质的方法。在具体实例中,由本文的突变体藻类微生物提供的脂质谱可以包含16碳脂肪酸的至少5%、10%、15%、20%或25%的增加,如16:0和/或16:1脂肪酸,和/或20碳脂肪酸的至少5%、10%、15%、20%或25%的减少,如20:4和/或20:5脂肪酸。在相关的具体实例中,由本文中的突变体藻类微生物提供的脂质谱可以包含16碳脂肪酸(如16:0和/或16:1脂肪酸)的介于范围的低端上的2.5%、5%和10%与范围的高端上的5%、10%、15%、20%或25%之间的增加,和/或20碳脂肪酸(如20:4和/或20:5脂肪酸)的介于范围的低端上的2.5%、5%和10%与范围的高端上的5%、10%、15%、20%或25%之间的减少。
产生脂质的方法
在某些实施例中,本文提供了通过以下方式产生脂质的方法:在有效条件下(即,在合适的培养基中并且持续足够的时间)培养本文提供的突变体或重组藻类微生物以产生脂质;以及从培养基或微生物或两者分离至少一种脂质。培养物可以是光合自养的培养物。培养可以以分批、半连续或连续模式进行。
如本文公开的本发明的任何突变体藻类微生物可以用于产生本文提供的脂质的方法中。通常在产生本文提供的脂质的方法中使用的突变体微生物是重组或突变体藻类微生物,所述重组或突变体藻类微生物包含如本文提供的线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)基因中的突变,所述突变分别导致线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化。突变体或重组藻类微生物可以另外包含在过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白中的突变,其中所述突变导致过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白的表达弱化。过氧化物酶体β氧化通路蛋白可以包含例如,酰基-CoA氧化酶或PXA1。乙醛酸通路蛋白可以是例如异柠檬酸裂解酶。
突变体藻类微生物可以在任何合适的一个或多个容器(包含烧瓶或生物反应器)中培养,其中藻类可以暴露于人工或自然光(或补充有人工光的自然光)。
培养是指通过使用所选和/或受控条件来有意促进一个或多个细胞的生长(例如,细胞大小、细胞含量和/或细胞活性的增加)和/或繁殖(例如,通过有丝分裂的细胞数量的增加)。生长和繁殖两者的组合可以被称为增殖。本文提供的微生物可以培养持续至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天或至少十五天,或至少一周、二周、三周、四周、五周、六周、七周、八周、九周或十周或更长时间。
可以用于培养重组微生物的所选和/或受控条件的非限制性实例可以包含使用限定的培养基(具有已知特征,如pH、离子强度和/或碳源)、指定温度、氧张力、二氧化碳水平、生物反应器中的生长等或其组合。在一些实施例中,微生物或宿主细胞可以使用光和还原碳源两者混合营养地生长。可替代地,微生物或宿主细胞可以光养培养。当光养生长时,藻类菌株可以有利地使用光作为能源。无机碳源(如CO2或碳酸氢盐)可以用于由微生物合成的生物分子。如本文所使用的,“无机碳”包含不能被生物用作可持续能源的含碳化合物或分子。通常,“无机碳”可以是CO2(二氧化碳)、碳酸、碳酸氢盐(bicarbonate salt)、碳酸盐、碳酸氢盐(hydrogen carbonate salt)等或其组合的形式,其不能被进一步氧化以得到可持续的能量,也不能用作生物体的还原力(reducing power)的来源。光合自养生长的微生物可以在培养基上生长,其中无机碳基本上是唯一碳源。例如,在其中无机碳基本上是唯一碳源的培养物中,可以在培养基中提供的任何有机(还原)碳分子或有机碳化合物不能由细胞吸收和/或代谢为能量和/或不以足以为细胞培养物的生长和增殖提供可持续能量的量存在。
固体和液体生长培养基通常可以从多种来源获得,如制备适用于多种微生物菌株的特定培养基的说明一样。例如,各种淡水和盐水培养基可以包含在Barsanti(2005)《藻类:解剖学、生物化学和生物技术(Algae:Anatomy,Biochemistry&Biotechnology)》,CRC出版社(CRC Press),用于培养藻类的培养基和方法中所描述的那些淡水和盐水培养基。还可以在各个藻类培养物保藏网站处发现藻类培养基配方,作为非限制性实例包含藻类的UTEX培养物保藏(www.sbs.utexas.edu/utex/media.aspx);藻类和原生动物(Protozoa)的培养物保藏(www.ccap.ac.uk);以及大教堂植物学(Katedra Botaniky)(botany.natur.cuni.cz/algo/caup-media.html)。
在本发明的一些实施例中,具有增加的脂质生产力的微生物可以在配备有人工光源和/或具有一个或多个壁的“光生物反应器”中进行培养,所述一个或多个壁对于光(包含阳光)是足够透明的以使得、促进和/或维持可接受的微生物生长和增殖。为了产生脂肪酸产物或甘油三酯,光合微生物或宿主细胞可以另外或可替代地在摇瓶、试管、小瓶、微量滴定皿(microtiter dishes)、皮氏培养皿(petri dishes)等或其组合中进行培养。
另外或可替代地,本文提供的突变体藻类微生物可以在池塘、水道、海基型生长容器、沟渠、水沟、航道等或其组合中生长。在此类系统中,温度可以不受调节,或与标准生物反应器一样,可以采用各种加热或冷却方法或装置,可以向培养物提供无机碳源(如但不限于CO2、碳酸氢盐、碳酸盐等),包含但不限于空气、富含CO2的空气、烟道气等或其组合。在提供烟道气和/或除了CO2之外还可能含有CO(一氧化碳)的其它无机源时,可能需要预处理此类来源,使得引入(光)生物反应器的CO水平不构成关于微生物的生长、增殖和/或存活的危险和/致命剂量。
所述方法包含培养本文提供的突变体藻类微生物,如相对于对照细胞具有增加的脂质生产力和/或增加的脂质分配同时在相同培养条件下产生至少50%、60%、70%、75%、80%、90%、95%或100%百分比的由对照细胞产生的生物质,以产生生物质或脂质的突变体微生物。可以通过本领域的普通技术人员已知的回收方式从培养物中回收脂质,例如通过全培养物提取,例如使用有机溶剂或通过首先分离从中提取脂质的生物质(参见例如,Grima等人(2003)《生物技术进展(Biotechnol.Advances)》20:491-515)。在一些情况下,脂肪酸产物的回收可以通过细胞的均质化来增强(Gunerken等人(2015)《生物技术进展》33:243-260)。例如,可以通过在升高的温度和/或压力下用溶剂提取藻类来从藻类中分离脂质(如脂肪酸、脂肪酸衍生物和/或甘油三酯),如标题为“从藻类中溶剂提取产物”的共同未决的、共同转让的美国专利第9,243,207号中所描述的,所述美国专利通过引用整体并入本文。
可以例如通过离心或过滤收获生物质。可以干燥和/或冷冻生物质。可以从生物质(例如,各种脂质或一种或多种蛋白)中分离另外的产物。
作为具体的非限制性实例,可以使用氯仿:甲醇:水、二氯甲烷:甲醇的危险性较低的溶剂混合物、丙-2-醇:环己烷:水的替代性溶剂混合物、使用KOH在乙醇中的直接皂化或超临界CO2提取的单相三元系统进行脂质提取(Li等人,(2014),“对比研究:不同脂质提取方法对当前微藻类脂质研究的影响(A comparative study:the impact of differentlipid extraction methods on current microalgal lipid research)”《微生物细胞工厂(Microbial Cell Factories)》13:14)。这些提取方法是四爿藻属的代表性提取方法。技术人员将理解,此类方法的修饰或不同的方法可以用于从其它藻类微生物中分离脂质。
在一些实施例中,本文提供的产生脂质的方法可以包含在其中微生物的FAME与TOC(FAME/TOC)比率维持介于约0.3与约0.8之间的条件下培养微生物,以及从微生物、培养基或两者中分离脂质。例如,可以培养微生物使得FAME/TOC维持介于约0.3与约0.8之间、介于约0.4与约0.7之间、介于约0.4与约0.6之间或介于约0.45与约0.55之间。比率可以维持介于约0.3与约0.8之间,例如介于约0.4与约0.8之间、介于约0.4与约0.7之间、介于约0.4与约0.6之间或介于约0.45与约0.55之间持续至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少15天、至少20天、至少30天或至少60天。在这些方法中,可以在连续或半连续条件下培养微生物。例如,微生物可以是突变体藻类微生物,所述突变体藻类微生物具有弱化的对与迦得拟微球藻TrifuncB(SEQ ID NO:10)、TrifuncA(SEQ ID NO:1)、PXA1(SEQ ID NO:20)、ACO1(SEQ ID NO:22)或ICL(SEQ ID No:24)的任何氨基酸序列具有至少55%、至少65%、至少75%或至少85%同一性的多肽进行编码的基因表达。FAME/TOC可以例如通过存在于培养基中的氮源的类型和浓度进行调节。
另外的实施例
在另一个实施例中,本文提供了突变体藻类微生物在培养基中的悬浮液,其中培养基可以包含抗生素或冷冻防腐剂和/或是充满氮的,并且其中所述突变体藻类微生物可以是本文提供的任何突变体微生物。在一个实施例中,悬浮液可以包含具有TrifuncB和/或TrifuncA基因中的突变的突变体藻类微生物,所述突变导致弱化的具有或不具有对来自过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的基因中的突变的基因表达,所述突变导致在相同条件下培养时与突变体藻类微生物相同物种的对照藻类微生物相比过氧化物酶体或乙醛酸通路基因的表达弱化并且脂质产生增加。
在其中本发明的突变体藻类微生物悬浮于冷冻防腐剂中的实例中,本文提供了冷冻保存的突变体藻类微生物。此外,在某些实施例中,本文提供了容器(如定位在低于0℃的容器内的冷冻管)中的冷冻防腐剂中的突变体藻类微生物。例如,冷冻管可以在低于-50℃、-60℃、-70℃或-75℃或-80℃的温度下储存在液氮中。突变体藻类微生物可以悬浮于冷冻防腐剂中,如但不限于培养基中的5%甲醇或
Figure BDA0002872016850000691
冷冻防腐剂试剂B(加利福尼亚州卡尔斯巴德的赛默飞世尔科技公司(ThermoFisher,Carlsbad,CA))中。
在另一个实施例中,本文提供了包含本发明的突变体藻类微生物的固体培养基。例如,本文提供了在其上包含本发明的任何突变体藻类微生物的琼脂培养基,如琼脂斜面。
在另一个实施例中,本文提供了包含本发明的任何突变体藻类微生物的生物质。在一些实例中,生物质可以包含抗生素,如合成的抗生素。在一个实施例中,生物质可以包含具有TrifuncB和/或TrifuncA基因中的突变的突变体藻类微生物,所述突变导致弱化的具有或不具有对来自过氧化物酶体β氧化通路或乙醛酸通路的蛋白质进行编码的基因中的突变的基因表达,所述突变导致在相同条件下培养时与突变体藻类微生物相同物种的对照藻类微生物相比过氧化物酶体或乙醛酸通路基因的表达弱化并且脂质产生增加。
本文公开的任何突变体藻类均可以被设计成通过任何数量的生物防护技术或其组合而不被要求在选择环境之外生活和增殖。藻类微生物可以通过以下方式进行控制:在其中包含防止在选择环境之外增殖的突变;或对突变体藻类微生物施加选择的行为或时间或区域控制的任何组合,所述组合充当用于控制在选择环境之外存活的方法。因此,在另一个实施例中,本文提供了一种用于制备本文的任何突变体藻类微生物(可生物防护的突变体藻类微生物)的方法。在某些实施例中,使本文提供的突变体藻类微生物突变,使得所述突变体藻类微生物依赖于非天然存在的氨基酸(《自然》,518,《特辑》7537,第55-60页(2015))。在其它实例中,所述方法可以包含将对用于生物防护的基因进行编码的外源非藻类核酸插入到本发明的突变体藻类微生物中。突变体藻类微生物可以包含本文提供的任何突变体藻类微生物,其通常包含使TrifuncA和/或TrifuncB的表达弱化并导致脂质产生增加的突变。
在相关的实施例中,本文提供了一种可生物防护的突变体藻类微生物,其包含TrifuncA和/或TrifuncB基因中的突变,所述突变导致本文提供的TrifuncA和/或TrifuncB的表达的弱化和增加的脂质产生,以及用于生物防护的外源基因。引入到突变体藻类微生物中的用于生物防护的外源基因可以是“自杀基因(suicide gene)”,如果突变体藻类微生物从选择环境(如实验室环境或脂质产生环境,如商业脂质产生环境)逃逸,则所述自杀基因将杀死突变体藻类微生物。在某些实施例中,生物防护基因是毒素基因(参见例如,美国专利第8,975,061号,Bielinski等人,“毒素和抗毒素基因的调节用于生物防护(Regulation of Toxin and Antitoxin Genes for Biological Containment)”)。因此,本发明包含本文提供的突变体藻类微生物,其进一步包含外源毒素基因(即,在藻类中非天然存在的并且对藻类有毒的毒素基因)。
在一个实施例中,毒素基因是II型毒素基因,例如源自真细菌或古细菌物种,并且任选地可以源自蓝藻细菌物种,例如任何前述蓝藻细菌物种,并且可以相对于重组原核宿主是同源或异源的。在一些另外的实施例中,毒素可以是切割特异性RNA序列的内切核糖核酸酶。在一些另外的实施例中,毒素基因的核苷酸序列可以被设计成排除使经过编码的RNA易受毒素切割的影响的内切核酸酶识别序列。
在一些替代性实施例中,外源毒素基因可以编码以下的毒素:CcdB毒素家族、RelE毒素家族、MazF毒素家族、ParE毒素家族、PIN毒素家族、Ahal毒素家族、MNT毒素家族、Doc毒素家族、VapC毒素家族、ζ毒素家族、HipA毒素家族或HigB毒素家族。例如,II型毒素可以是CcdB、RelE、MazF、ParE、PIN、Ahal、MNT、Doc、VapC、ζ、HipA、HigB、ChpI、StbE、Txe、YafQ或YoeB毒素,或这些毒素中的任一种的直向同源物或同系物,或其它II型毒素。
外源毒素基因的表达可以由可操作地连接到毒素基因的异源启动子驱动。在说明性实施例中,启动子是可调节启动子,如由存在于细胞培养物或细胞环境中的化合物调节的启动子,作为非限制性实例,如糖、有机酸、脂肪酸、氨基酸或氨基酸类似物、脂质、烃、磷酸盐、硝酸盐、铵、金属、群体敏感化合物(quorum-sensing compound)、内酯、维生素、分泌的蛋白质或肽或其任何组合。
技术人员将认识到,存在用于控制突变体藻类微生物中的外源毒素基因的表达的不同机制,使得其对于生物防护是有效的。例如,毒素基因的表达可以处于天然存在的环境中存在或不存在的调节因子的控制下。例如,毒素基因可以处于由在天然环境中存在的化合物诱导的调节元件的控制下。因此,可以防止突变体藻类微生物从其受控环境中逃逸,因为如果所述微生物逃逸其受控环境,则毒素基因将被表达。在另一个实施例中,毒素基因的表达可以处于天然环境中不存在的化合物的控制下。因此,毒素基因的表达可以通过化合物的存在来抑制。用于培养此类突变体藻类微生物的受控环境可以包含化合物,由此抑制毒素的表达。突变体微生物从受控环境的逃逸将导致毒素的表达并且将杀死藻类。
实例
以下培养基用于实例中:
PM074是通过向1升终体积的Instant Ocean盐溶液(35g/L)(佛罗里达州阿波普卡的水生生态系统(Aquatic Eco-Systems))添加1.3ml
Figure BDA0002872016850000721
F/2藻类饲料部分A(水生生态系统)和1.3ml
Figure BDA0002872016850000722
F/2藻类饲料部分B(水生生态系统)而制成的10X F/2的充满氮的(“仅硝酸盐”)培养基。脯氨酸A和脯氨酸B一起包含8.8mM NaNO3、0.361mMNaH2PO4.H2O、10X F/2痕量金属以及10X F/2维他命(Guillard(1975)“海洋无脊椎动物的培养(Culture of Marine Invertebrate Animals)”中的用于饲喂海洋无脊椎动物的浮游植物的培养(Culture of phytoplankton for feeding marine invertebrates)(编辑人:Smith W.L.和Chanley M.H.)普莱纽姆出版社(Plenum Press),纽约,美国,第26-60页)。
PM124培养基是补充有5mM铵和10mM HEPES pH 8.0的PM074。其是通过向PM074配方添加10ml的1M HEPES pH 8和5ml的NH4Cl而制成的(终体积为1L)。
实例1.
微拟球藻属中β氧化基因的敲除
产生了迦得拟微球藻的转基因藻类菌株,其中通过靶向诱变功能地消除或敲除涉及β氧化的基因。野生型迦得拟微球藻菌株被指定为WT-3730。为了产生具有增加的脂质含量的突变体藻类微生物,线粒体三功能蛋白β亚基或“亚基B”(TrifuncB)(羟酰基-CoA脱氢酶/3-酮酰基-CoA硫解酶/烯酰基-CoA水合酶(三功能蛋白)、β亚基、Naga_102524g1,对于氨基酸序列参见SEQ ID NO:10,并且对于cDNA序列参见SEQ ID NO:11),其催化线粒体中的β氧化的最后三个步骤(参见图1),以及涉及过氧化物酶体β氧化或乙醛酸通路的酶被靶向。使用CRISPR技术产生敲除突变体。
为了产生敲除突变体,开发了高效微拟球藻Cas9编辑器系(迦得拟微球藻菌株GE-6791),如于2015年12月31日提交的发明人姓名为John Verruto和Eric Moellering的US2017/0073695“用于高效体内基因组编辑的组合物和方法(Compositions and Methodsfor High Efficiency In Vivo Genome Editing)”公开的,所述文献通过引用整体并入本文。将表达对酿脓链球菌Cas9核酸酶进行编码的基因的工程化菌株GE-6791用作用嵌合的引导RNA和供体DNA进行转化以进行插入敲除的宿主。微拟球藻菌株GE-6791表现了引入的Cas9基因在生长培养物的细胞群体的接近100%中的表达。使用载体pSGE-6206(SEQ IDNO:26)来转化野生型迦得拟微球藻菌株WT-3730并且包含以下三种元素:1)Cas9表达盒,其含有来自针对迦得拟微球藻进行密码子优化的酿脓链球菌的Cas9基因(SEQ ID NO:27),其包含对N-末端核定位信号进行编码的序列,随后是FLAG标签和肽连接子(一起以SEQ IDNO:28提供),由迦得拟微球藻RPL24启动子(SEQ ID NO:29)驱动并且由迦得拟微球藻双向终止子2(SEQ ID NO:30)终止;2)可选择标记表达盒,其包含来自针对迦得拟微球藻进行密码子优化的土曲霉菌的杀稻瘟菌素S脱氨酶(blasticidin S deaminase)基因(SEQ ID NO:31),由迦得拟微球藻TCTP启动子(SEQ ID NO:32)驱动并且随后是EIF3终止子(SEQ ID NO:33);以及3)GFP报道基因表达盒,其含有针对迦得拟微球藻进行密码子优化的TurboGFP基因(俄罗斯莫斯科的艾洛根公司(Evrogen))(SEQ ID NO:34),由迦得拟微球藻4A-III启动子(SEQ ID NO:35)驱动并且随后是迦得拟微球藻双向终止子5(SEQ ID NO:36)。转化基本上如在发布的US2014/0220638(于2013年12月6日提交的“具有锁定的高光适应性表型的藻类突变体(Algal mutants having a locked-in high light acclimated phenotype)”,所述文献通过引用整体并入本文)中所公开的。
将转化混合物铺板于含有100mg/L的杀稻瘟菌素的PM074琼脂培养基上。将所得菌落贴到选择培养基上以进行分析和存档。从斑块中提取少量生物质,并将其完全重悬于300μl 1x Instant Ocean盐溶液(佛罗里达州阿波普卡的水生生态系统)中。注意不要添加过多的生物质,使得获得浅绿色的悬浮液。通过流式细胞术,使用BD Accuri C6流式细胞仪(加利福尼亚州圣地亚哥的屋宇署生物科学(BD Biosciences)),使用488nm激光和530/10nm滤光片测量每个细胞的GFP荧光来直接分析此悬浮液。使用缓慢射流设置记录每个样品的10,000-30,000个事件。将具有移动到比野生型细胞所显示的荧光水平更高的荧光水平的单荧光峰并且还通过蛋白质印迹显示Cas9蛋白表达的菌株(指定为菌株GE-6791)选择作为Cas9编辑器菌株并且用于如本文公开的通过CRISPR/Cas9基因组编辑的突变体产生。
使用Cas9介导的基因组编辑,靶向对基因进行编码的TrifuncB(SEQ ID NO:11)以进行破坏。简言之,潮霉素(Hygromycin)抗性表达盒(SEQ ID NO:37)被靶向成插入到TrifuncB基因的第二外显子中(图2)。为了靶向TrifuncB基因以进行破坏,制备用于产生引导RNA的DNA构建体(加利福尼亚州拉荷亚的SGI-DNA),其中DNA分子包含在T7启动子下游工程化的嵌合引导的序列。嵌合的引导序列包含与第二外显子TrifuncB基因序列(其包含酿脓链球菌Cas9PAM序列(NGG))内的序列同源的23bp靶序列(SEQ ID NO:38),并且还包含反式激活CRISPR RNA(tracr)序列。如在US 2017/0073695(参见例如,实例2、5、9和10)中所公开的,通过首先制备由互补DNA寡核苷酸构成的DNA模板来合成嵌合引导序列,所述寡核苷酸被退火以产生双链DNA模板,其中靶序列和tracr序列在T7启动子序列的下游。根据制造商的说明书,使用MEGAshortscriptTMT7试剂盒(加利福尼亚州卡尔斯巴德的生命技术公司(Life Technologies),#AM1354M),将包含T7启动子的双链DNA引导模板用于体外转录反应以合成引导RNA。根据制造商的方案,使用Zymo-SpinTMV-E柱(兹莫研究公司(ZymoResearch),#C1024-25)纯化所得RNA。
用于插入到靶向TrifuncB基因座(SEQ ID NO:12)中的供体片段包含可选择标记盒,其包含在迦得拟微球藻EIF3启动子(SEQ ID NO:40)下游的潮霉素抗性基因(HygR,SEQID NO:39),并且随后是迦得拟微球藻双向终止子2(SEQ ID NO:30),其中整个启动子-潮霉素抗性基因-终止子序列侧接有5'(SEQ ID NO:41)和3'(SEQ ID NO:42)末端的27个碱基对标识序列,以产生被称为“Hyg抗性盒供体片段”(SEQ ID NO:43)的DNA片段。
为了靶向敲除TrifuncB基因座,使用5μg靶向TrifuncB基因的纯化的嵌合引导RNA和1μg可选择供体DNA(SEQ ID NO:43),通过电穿孔转化Cas9编辑器系GE-6791,基本上如在US 2014/0220638中所描述的。在电穿孔之后,将细胞铺板于含有潮霉素的PM124琼脂培养基上以选择掺入潮霉素抗性盒的转化体。将转化体贴到新鲜的板上,并且通过菌落PCR进行筛选,以将供体片段插入到TrifuncB基因中。
另外,进行了涉及β氧化的三个其它基因的单一敲除(参见图1):PXA1(过氧化物酶体ABC型酰基辅酶A转运蛋白,Naga_101131g2、Naga_101730g1和Naga_102509g1,对于氨基酸序列参见SEQ ID NO:20,并且对于cDNA序列参见SEQ ID NO:21);ACO1(酰基-CoA氧化酶1,过氧化物酶体酶,对于氨基酸序列参见SEQ ID NO:22,并且对于cDNA序列参见SEQ IDNO:23);以及ICL(异柠檬酸裂解酶,Naga_100025g12,乙醛酸通路的酶,对于氨基酸序列参见SEQ ID NO:24,并且对于cDNA序列参见SEQ ID NO:25)。从这些基因表达的蛋白质涉及过氧化物酶体β氧化和乙醛酸通路的各个步骤,包含i)将酰基-CoA输入到过氧化物酶体(PXA1)中的酰基-CoA转运蛋白;ii)过氧化物酶体β氧化(ACO1)中的酶步骤;以及iii)过氧化物酶体β氧化下游的基因,其是乙醛酸通路的一部分并且是乙酰基-CoA重新组装成碳代谢(ICL)所需要的。使用Cas9介导的基因组编辑,靶向这些基因以进行破坏,并且以类似于用于破坏上文公开的TrifuncB的方式产生。为了靶向这些基因以进行破坏,制备用于产生引导RNA的DNA构建体(加利福尼亚州拉荷亚的SGI-DNA),其中DNA分子包含在T7启动子下游工程化的嵌合引导的序列。嵌合的引导序列包含与在酿脓链球菌Cas9 PAM序列(NGG)上游的每个基因序列(PXA1的SEQ ID NO:44;ACO1的SEQ ID NO:45;以及ICL的SEQ ID NO:46)内的单独序列同源的23bp靶序列,并且还包含反式激活CRISPR(tracr)序列。通过首先制备由互补DNA寡核苷酸构成的DNA模板来合成嵌合的引导序列,所述寡核苷酸被退火以产生双链DNA模板,根据制造商的说明使用MEGAshortscriptTM T7试剂盒(生命技术公司,#AM1354M)将其用于体外转录反应以合成引导RNA。根据制造商的方案,使用Zymo-SpinTMV-E柱(兹莫研究公司,#C1024-25)纯化所得RNA。用于插入到靶向基因座中的供体片段包含Hyg可选择标记盒,其包含5'和3'末端上的27个碱基对标识序列(SEQ ID NO:43)。
为了进行菌落PCR筛选,将来自待筛选菌落的少量细胞悬浮于100μl的5%Chelex100树脂(美国伯乐公司(BioRad))/TE溶液中,并且将悬浮液在99℃下煮沸持续10分钟,之后将试管短暂旋转。向PCR反应混合物添加一微升裂解物上清液,其中PCR混合物和反应根据来自制造商的QIAGEN快速循环PCR主混合方案(手册可在qiagen.com获得;Qiagen GmbH,德国)设置并执行。用于检测供体片段插入到TrifuncB的靶基因座中的引物是SEQ ID NO:47和SEQ ID NO:48。用于检测供体片段插入到PXA1的靶基因座中的引物是SEQ ID NO:49和SEQ ID NO:50。用于检测供体片段插入到ACO1的靶基因座中的引物是SEQ ID NO:51和SEQID NO:52。用于检测供体片段插入到ICL的靶基因座中的引物是SEQ ID NO:53和SEQ IDNO:54。基于基于PCR的菌落筛选,在生产力测定中测试了TrifuncB的三种敲除菌株(TrifuncB-6、TrifuncB-9和TrifuncB-42)以及PXA1、ACO1和ICL中的每一个的一种敲除菌株。
在充满氮培养基PM074中在分批生产力测定中评估这三种经过验证的TrifuncB敲除系(TrifuncB-6、TrifuncB-9和TrifuncB-42),所述培养基包含8.8mM硝酸盐作为唯一氮源,所述氮源在不存在任何可以支持藻类生长的还原碳源的情况下可用于细胞(即,生产力测定是在光合自养条件下进行的)。接种后,在分批测定中,将工程化TrifuncB敲除菌株TrifuncB-6、TrifuncB-9和TrifuncB-42以及野生型菌株WT-3730在含有175ml的PM074培养基的75cm2矩形组织培养烧瓶中以一式三份的培养物生长持续七天。在这些条件下,大约在第3天,培养基中的氮开始变得有限,在整个测定的其余时间内,培养基中的氮浓度持续下降。将烧瓶以其最窄的“宽度”尺寸相对于LED灯定位。用不透明的白色塑料遮盖培养烧瓶,以提供21.1cm2的矩形开口,以使辐照度到达培养物。将入射辐照度编程到16小时光:8小时黑暗循环中,其中在4小时的时段内辐照度从0线性斜升到1200uE,并且然后辐照度从1200线性斜降到0uE。每天向培养物添加去离子H2O以置换蒸发损失。通过设定为25℃的水浴调节培养物的温度。在第0天以0.5的OD730接种培养物并且在第3、5和7天取出样品(5ml),以用于评估细胞密度、作为脂质量度的脂肪酸甲酯(FAME)和总有机碳(TOC)。在光循环结束前30分钟进行采样。
在这些测定中,通过测量表示脂质的脂肪酸甲酯(FAME)以及表示生物质的总有机碳(TOC)来评估碳与脂质表型的分配;使用FAME/TOC的比率来评估菌株相对于野生型3730菌株是否具有增加的碳与脂质的分配。
对使用GeneVac HT-4X干燥的2mL培养物样品进行FAME分析。向每个干燥的沉淀物添加以下物质:500μL含500mM KOH的甲醇溶液、200μL的含有0.05%丁基化羟基甲苯的四氢呋喃、40μL的2mg/ml C11:0游离脂肪酸/C13:0甘油三酯/C23:0脂肪酸甲酯内标混合物和500μL玻璃珠(直径425–600μm)。将小瓶用敞口的PTFE隔膜衬里的盖子盖住,并置于SPEXGenoGrinder中以1.65krpm持续7.5分钟。然后将样品在80℃下加热五分钟并使其冷却。为了进行衍生化,在80℃下加热30分钟之前,向样品添加500μL的含10%三氟化硼的甲醇溶液。在添加2mL庚烷和500μL的5M NaCl之前,使试管冷却。将样品以2K rpm涡旋五分钟,并且最后以1K rpm离心三分钟。使用Gerstel MPS自动进样器对庚烷层进行采样。定量使用80μg的C23:0FAME内标。在Agilent 7890A气相色谱系统上,使用J&W Scientific 127-3212DB-FFAP、10m×100μm×100nm柱和FID检测器,在260℃下运行样品。使用H2作为具有恒定流量控制的载体,流速为500微升/分钟。将烘箱设定为100℃持续0.98分钟,然后以15.301℃/分钟到230℃并且保持1.66分钟。入口含有4mm玻璃棉填充衬里(Agilent P/N5183-4647),并且设定为250℃并使用40:1的分流比。注射体积为900nL。通过用去离子水将2mL细胞培养物稀释到20mL的总体积来确定总有机碳(TOC)。将每次测量三次注射注射到Shimadzu TOC-Vcsj分析仪,以确定总碳(TC)和总无机碳(TIC)。将燃烧炉设定为720℃,并且通过从TC中减去TIC来确定TOC。4点校准范围为2ppm到200ppm,其与非稀释培养物的20-2000ppm相对应,其中相关系数r2>0.999。
如在图3中观察到的,当与野生型3730相比时,在TrifuncB敲除系中FAME/TOC值显著增加,在这些实验中的一些时间点上高达约30%的增加。除了FAME/TOC的增加之外,还观察到脂肪酸谱在TrifuncB敲除菌株中发生改变,其中当与野生型相比时,16:0和16:1增加,但20:4和20:5脂肪酸减少(图4)。
测试了含有过氧化物酶体转运蛋白PXA1、过氧化物酶体酶ACO1或乙醛酸循环酶ICL的单个敲除的三种菌株的脂质生产力和与脂质分配的增加。值得注意的是,在这些基因的单独敲除的情况下,没有发现可区分的表型。
实例2.
半连续生产力测定中的TrifuncB敲低突变体
在半连续生产力测定(SCPA)中测定TrifuncB-KO菌株GE-8256(转化体TrifuncB-42)、野生型菌株3730以及用包含在培养物(3730KAN)中的抗生素卡那霉素(kanamycin)生长的野生型菌株3730,其中测定培养基PM074不包含藻类的还原碳源。
使用起子培养物接种225cm2矩形组织培养烧瓶,在接种之后,每个培养烧瓶含有最终总体积为550ml的培养物。接种培养物,使得每个550ml培养物具有0.9的初始OD730。典型的接种体积为大约200ml规模放大培养物(scale-up culture),向大约350ml测定培养基添加所述培养物,所述测定培养基是PM074(充满氮培养基)。培养基不包含可以由藻类用于生长或掺入生物分子中的还原碳(“有机碳”)源,因此测定条件是光合自养的。每个菌株启动三种培养物。烧瓶包含搅拌棒并具有塞子,所述塞子具有与注射器过滤器连接的插入管,以用于递送通过培养物鼓泡的富含CO2的空气(1%CO2,流速,300ml每分钟)。将烧瓶置于所编程的水浴中,以在测定时间段期间在设定为575rpm的搅拌板上维持25℃的恒定温度。用不透明的白色塑料遮盖培养烧瓶,以提供31.5cm2的矩形开口,以使辐照度到达培养物。将烧瓶的宽度(最窄尺寸)对准LED灯组,所述灯组被编程有光/暗(二十四小时的)循环以及光轮廓,所述光轮廓增加直到“太阳中午”并且然后下降到光周期结束。光轮廓被设计成模拟加利福尼亚州南部的春日:14小时光:10小时黑暗,其中光峰值为大约2000μE。
当光强度处于其峰值时,通过去除30%的体积(165ml)并且用同一体积的测定培养基(PM074)加上另外的10ml去离子水置换培养物以补充蒸发(包含在补充培养基中),每天在中天稀释所述培养物。半连续测定通常进行10-14天。仅针对已经达到稳定状态的培养物计算每日脂质和生物质生产力(其中生长的增加等于测定的稀释因子)。
图5A提供了在半连续测定中,由TrifuncB-KO菌株GE-8256产生的FAME的每日量。TrifuncB-KO菌株8256在每日基础上积累的TOC的量类似于野生型培养物(图5C)。在这些测定中,在半连续充满氮培养物中进一步证实在分批测定(实例1)中观察到的增加的FAME/TOC表型,其中观察到TrifuncB-KO菌株GE-8256的FAME:TOC比率比野生型菌株增加大约13%(图5B)。
实例3.
具有过氧化物酶体β氧化的基因的TrifuncB的双敲除
产生了转基因迦得拟微球藻藻类菌株,其中对基因进行编码的线粒体三功能蛋白亚基B(TrifuncB)和对涉及过氧化物酶体β氧化或乙醛酸通路的蛋白质进行编码的第二基因两者均通过靶向诱变功能地消除或“敲除”。所采用的诱变方法是Cas9介导的基因编辑。如实例1所提供的,所靶向的基因涉及过氧化物酶体β氧化通路(图1)或β氧化后碳通路(例如,乙醛酸通路)的步骤并且包含PXA1(过氧化物酶体转运蛋白)、ACO1(过氧化物酶体酰基-CoA氧化酶)和ICL(乙醛酸通路酶异柠檬酸裂解酶)。
为了产生双敲除,用最小吉欧霉素(zeocin)抗性盒进一步转化TrifuncB敲除突变体菌株(GE-8256),所述抗性盒包括侧接有来自硅藻物种三角褐指藻(SEQ ID NO:56)的GAPDH启动子的博来霉素(Bleomycin)抗性基因(BleR,SEQ ID NO:55)和来自硅藻物种假微型海链藻(SEQ ID NO:57)的α微管蛋白终止子,并且使用如实例1所提供的用于Cas9介导的基因组修饰的嵌合引导RNA靶向整合到上述基因(PXA1、ACO1和ICL)中。这导致“双敲除”菌株,其中TrifuncB基因敲除与ACO1、PXA1或ICL基因中的敲除组合。因此,产生了线粒体β氧化通路以及过氧化物酶体β氧化通路或β氧化后碳通道乙醛酸通路被功能地破坏的菌株(参见图1)。
在实例2中所描述的半连续测定中,将三种双突变体菌株(GE-8904、TrifuncB-KO/ICL-KO;GE-8905、TrifuncB-KO/PXA1-KO;和GE-8907、TrifuncB-KO/ACO1-KO)连同TrifuncB单突变体菌株(GE-8256)和野生型菌株(WT-3730)一起运行。如从图6A-C可以看到,相对于仅TrifuncB基因被敲除的菌株,向TrifuncB敲除菌株添加任何过氧化物酶体通路基因或ICL基因中的敲除导致FAME/TOC的进一步增加(即,碳与脂质的分配的进一步增加)和脂质生产力的进一步增加。将ACO1敲除与TrifuncB敲除组合具有最大效果,PXA1的敲除与TrifuncB的敲除组合具有中间效果,并且ICL的敲除加上TrifuncB的敲除具有观察到的增加的最低水平。
此实例详述了其中线粒体和过氧化物酶体β氧化基因中的敲除突变的组合使两种β氧化通路去功能化或使其无功能的方法和菌株。这导致双突变体中的碳分配增加,如通过相对于在分批或半连续培养条件下测定的野生型菌株和单突变菌株两者而言更高的FAME/TOC值所证明的。在上文提供的实例中,两种不同的过氧化物酶体β氧化基因中的敲除与TrifuncB敲除组合,但其它实施例将包含线粒体β氧化突变(例如,在TrifuncA亚基(在迦得拟微球藻、Naga_100466g3和NG_scf06(299664-304033),对于氨基酸序列参见SEQ ID NO:1,并且对于cDNA序列参见SEQ ID NO:2)、线粒体酰基-CoA脱氢酶等中)与过氧化物酶体β氧化基因(对于靶向的可能基因参见图1)中的突变的任何组合,使得每个通路具有较少功能或无功能。进一步地,还证明了线粒体β氧化基因和乙醛酸通路基因中的突变的组合增加了藻类菌株中碳与脂质的分配。
本领域的技术人员可以在当前公开的发明的范围和精神内设想许多修改和其它实施例。的确,在不改变所公开的发明的基本方面的情况下,本领域的技术人员可以对所描述的材料、方法、附图、实验实例和实施例进行改变。任何公开的实施例可以与任何其它公开的实施例组合使用。
公开的实施例、实例和实验并不旨在限制本公开的范围或表示以下实验是所进行的全部或仅有的实验。已经做出努力以确保关于所使用的数字(例如,量、温度等)的准确性,但是应当考虑一些实验误差和偏差。应当理解,可以在不改变实验旨在说明的基本方面的情况下进行如所描述的方法中的变化。
序列
SEQ ID NO:1
蛋白质
迦得拟微球藻
TrifuncA氨基酸序列
MLRLASARASLRLNGLGAFQGTATCPSFLKRASLSTRGQYFAPVEVKDGVAIIRIDGPGKMNTIDDNFRQEIDALWTDKVANDASVKAAVIISAKPDNFIAGADIKFIDSVEDFASLKDVCLKGHATFQKIRKANKPLVAAIHGPALGGGLEVALYCDYRIVTSSPKTVLGLPEVKLGLLPGFGGTQNLHPIVGLQAALDMTLTGKNIRPDKAKKMGLADVVVDPAALETVAVETARALAEGSLKGKRKGKGLLQKVLEDTSMGRSIVYGQTEKMVAKNTGGHYPAPTAILDTIKYGFTHSKPQALEYEATRFAELAATSVSAALRGIFTGTTALKQSKYGKPANPVETVAVVGAGLMGAGIAQVTAEKGYRVLLKDKDLAGVSRGEKYISDNLKGKMKKKRMTKYAYDTTTSRVVGLTDESANWGKQFGKADMVIEAVFEDLSLKHKVIQQLEEHLPPHAVFASNTSAIPIARIAEASQRPENVIGMHYFSPVPQMPLLEIIPHKGTSKEAAAAAFEVGKKQGKTVIFVKDVPGFYVNRCLGPYLVETGALMEAGVPLEQLDKAIKAYGFPVGPITLADEVGVDVAAHVQAFLSKADLGVRMGGSDGPILDALLKAKLLGRKAGKGFYTYPAGGKKEKGPKTLNPEATSLVQKHVKGESKLTDEEVQNRLVSRFVNEAVFALQDGVIASPVEGDIGAVFGIGFPPFLGGPFRLIDALGAGKYCSMLEGFAGKYGEQFAPAPLLVEHAKSGKKFHQ
SEQ ID NO:2
DNA
迦得拟微球藻
TrifuncA cDNA
ATGCTCCGCTTGGCGTCGGCACGGGCATCGCTGCGGCTGAATGGCTTGGGTGCTTTTCAAGGCACCGCCACGTGCCCCTCCTTCTTGAAACGCGCCAGTCTCTCCACGCGCGGGCAGTATTTCGCGCCCGTGGAAGTGAAGGACGGGGTCGCAATCATTCGTATTGATGGGCCGGGGAAGATGAACACGATTGACGACAATTTTCGCCAAGAGATCGATGCATTGTGGACGGACAAGGTTGCAAATGACGCGAGTGTCAAGGCGGCCGTGATAATTTCTGCAAAGCCCGACAATTTCATCGCAGGAGCCGATATCAAATTCATCGACTCGGTGGAAGACTTCGCGAGCCTTAAAGACGTCTGCCTCAAGGGACACGCCACCTTCCAGAAGATTCGAAAGGCCAACAAGCCCTTGGTTGCC
GCCATTCATGGGCCCGCCCTTGGCGGCGGTCTGGAAGTGGCCCTGTACTGCGACTACCGCATCGTCACCTCCTCCCCCAAGACGGTGCTGGGTCTCCCCGAGGTGAAGCTCGGCCTCTTGCCGGGCTTCGGGGGCACTCAGAACCTCCACCCTATCGTCGGCTTGCAGGCGGCCCTGGACATGACGCTGACAGGGAAGAACATCCGCCCGGACAAGGCCAAGAAGATGGGCCTGGCGGACGTGGTGGTGGACCCCGCCGCGTTGGAGACCGTGGCGGTTGAGACGGCCCGCGCCTTGGCCGAGGGTTCGCTGAAAGGGAAGAGGAAGGGCAAGGGGCTCCTCCAGAAGGTTCTGGAAGACACCTCGATGGGACGGTCGATCGTGTACGGGCAGACGGAGAAGATGGTTGCCAAGAACACG
GGTGGCCATTATCCCGCACCGACGGCGATATTGGATACGATCAAGTACGGTTTCACCCACAGCAAGCCCCAAGCCCTAGAGTACGAGGCGACGCGCTTTGCGGAGCTGGCGGCCACGAGTGTGAGCGCCGCCCTGCGAGGCATTTTCACGGGCACGACTGCCCTGAAACAAAGCAAGTACGGGAAGCCCGCTAATCCCGTGGAGACGGTGGCTGTGGTGGGTGCAGGATTGATGGGCGCGGGTATTGCCCAGGTGACGGCGGAGAAAGGGTACCGGGTGCTCCTGAAGGACAAGGACCTCGCCGGGGTCAGTCGCGGCGAGAAATACATTTCGGACAACTTAAAGGGAAAGATGAAGAAGAAGAGGATGACGAAGTACGCCTACGACACCACCACCAGCCGGGTGGTGGGTTTGACGGAC
GAGAGCGCGAACTGGGGGAAGCAATTTGGGAAGGCGGACATGGTGATAGAGGCAGTCTTCGAGGACCTGAGCCTCAAGCATAAGGTCATTCAGCAGTTGGAGGAGCATTTGCCTCCCCACGCCGTCTTTGCCAGCAACACCAGCGCTATCCCCATCGCTCGGATTGCCGAGGCGAGCCAGCGACCGGAGAATGTGATTGGCATGCATTATTTCTCCCCGGTGCCCCAGATGCCTCTTCTCGAGATCATTCCGCACAAAGGGACCAGCAAAGAGGCCGCGGCGGCTGCTTTCGAAGTGGGGAAGAAACAGGGCAAAACGGTGATTTTCGTGAAAGACGTGCCAGGCTTTTACGTGAATCGGTGCCTGGGGCCCTACCTGGTGGAGACGGGGGCGCTCATGGAAGCCGGCGTGCCCCTCGAA
CAGCTGGACAAGGCCATCAAGGCCTACGGTTTCCCCGTGGGGCCCATCACCCTCGCCGACGAGGTCGGAGTCGACGTCGCGGCCCATGTTCAAGCCTTCCTATCCAAAGCCGACTTGGGCGTGCGAATGGGCGGGAGCGACGGACCGATTCTGGACGCGTTGCTGAAGGCCAAGCTTTTGGGCCGTAAGGCCGGCAAAGGCTTCTATACGTACCCCGCGGGGGGGAAAAAGGAGAAAGGGCCCAAGACTTTGAATCCGGAAGCCACGTCTTTGGTCCAGAAACACGTGAAAGGGGAGAGCAAGCTCACGGACGAGGAGGTGCAGAACCGGCTGGTCTCACGCTTTGTCAACGAGGCAGTCTTCGCCCTCCAAGATGGAGTGATCGCCTCCCCCGTCGAGGGCGACATTGGCGCCGTCTTT
GGGATCGGATTCCCGCCTTTCCTGGGGGGTCCTTTCCGCCTGATCGACGCATTGGGAGCAGGGAAGTACTGTTCCATGCTGGAGGGCTTTGCCGGCAAATACGGGGAGCAATTCGCCCCCGCGCCACTCCTGGTCGAGCACGCAAAGAGCGGGAAGAAGTTCCACCAGTAG
SEQ ID NO:3
DNA
迦得拟微球藻
TrifuncA gDNA序列
ATGCTCCGCTTGGCGTCGGCACGGGCATCGCTGCGGCTGAATGGCTTGGGTGCTTTTCAAGGTAAGTCTCGCGGTTTTCCTCGAGCCCTCGCTCTCAGAGCTCAACTGCTACAAGGCATACCATTCCTTGTTCTTACAGGCAGGGGAGCATGAGTCGTTTGTATTGCTTTGACTTAAAGACGGCCTGATCACCGTCCATGCGTGAATTTTATAATCGTCGGCTCGTCTTCCATTTTGATGTTGCATGTATCTTGGGTGGACCGTTTCCTGGTCGTACTCCTCCGCTTCAACTACTTCCCCCTCCTCCCCTTGTTCTCGGTGGGCTCCCCTTGGTCCCATGCAATGATTAGAATATGCGTCAACATTCATGTCTACCGTCTCAGGATCAGCATGCGCGCTCACACTGCCATCATTACGTCTTCTTTTGACCCGTAACAGGCACCGCCACGTGCCCCTCCTTCTTGAAACGCGCCAGTCTCTCCACGCGCGGGCAGTATTTCGCGCCCGTGGAAGTGAAGGACGGGGTCGCAATCATTCGTATTGATGGGCCGGGGAAGATGAACACGATTGACGACAATTTTCGCCAAGAGATCGATGCATTGTGGACGGTAATGTCATGGGAAAGACAAGGGATCGAGACGGGAAGGGGCACACTCCAGCGGTTCCTTGACCTTACGACCCCCTGGCTGAACGATTCCTTCTCTCTTATATATACAGGACAAGGTTGCAAATGACGCGAGTGTCAAGGCGGCCGTGATAATTTCTGCAAAGCCCGACAATTTCATCGCAGGAGCCGATATCAAATTCATCGACTCGGTGGAAGACTTCGCGAGCCTTAAAGACGGTATGTGCGCCTGACTAGACACGTTCCCCGTGCTCGAATGTCCTTTCCACGTCCTTGCAAGGCTGCTGCTTGTGTGCGCTTGAATATGGGCCGGCACCTGGTGCCTGTGGCCTGGTGGTGTCTCATTGGGGACCTATGACCCTTGTGACTGCCTCACACACTCTGCGGCCGAGGGCATCGCCACGGAGAGGGTTTCCCTCTGCCAACAAGAGAAACGACCACGCCTTCAACGCACAGCTTTCACTCATCCTCTTTCTTGCTTTCCCACTCTCCATCCGGCTTGTCCCCCCCTCTCTCGGTCAGTCTGCCTCAAGGGACACGCCACCTTCCAGAAGATTCGAAAGGCCAACAAGCCCTTGGTTGCCGCCATTCATGGGCCCGCCCTTGGCGGCGGTCTGGAAGTGGCCCTGTACTGCGACTACCGCATCGTCACCTCCTCCCCCAAGACGGTGCTGGGTCTCCCCGAGGTGAAGCTCGGCCTCTTGCCGGGCTTCGGGGGCACTCAGAACCTCCACCCTATCGTCGGCTTGCAGGCGGCCCTGGACATGACGCTGACAGGTGCGGGGGGGGAGGGTGGGAAGGAAGGAAGGAGGGAGGGAGGGAGGGAGGGAGGGAGGGAGGAAGGGAAAAAGGCGGGATCGTCGGACGGGAGGGTCAGGAGATAACGGTGGCGGGATGCCAGCATGTGTTCCCAACGTCCAGAGCTTTCCTATCCCGTATACCATGCAAGTCATCCTCCTTTAATGTCACTTTGTCACCTCCACATCGCAGGGAAGAACATCCGCCCGGACAAGGCCAAGAAGATGGGCCTGGCGGACGTGGTGGTGGACCCCGCCGCGTTGGAGACCGTGGCGGTTGAGACGGCCCGCGCCTTGGCCGAGGGTTCGCTGAAAGGGAAGAGGAAGGGCAAGGGGCTCCTCCAGAAGGTTCTGGAAGACACCTCGATGGGACGGTCGATCGTGTACGGGCAGACGGAGAAGATGGTTGCCAAGAACACGGGTGGCCATTATCCCGCACCGACGGCGATATTGGGTGCGTTCAGACGGGGTTTTTTAAAAATCAAAAAATAACGGATGTGTTGCGCGTGGACTCACGATTTTCCATCATCACCTCTGATTCCCTCGTGTGTCCAGATACGATCAAGTACGGTTTCACCCACAGCAAGCCCCAAGCCCTAGAGTACGAGGCGACGCGCTTTGCGGAGCTGGCGGCCACGAGTGTGAGCGCCGCCCTGCGAGGCATTTTCACGGGCACGACTGCCCTGAAACAAAGCAAGTACGGGAAGCCCGCTAATCCCGTGGAGACGGTGGCTGTGGTGGGTGCAGGATTGATGGGCGCGGGTATTGCCCAGGTGACGGCGGAGAAAGGGTAAGGAGGGGGGAGGGAGAAAGGGAGGGAGGGAGGGGAGAGGACAAGAGCAAGAAGGCGATTATGTCGCGCATAAAGAAGAATGAGGTTGTTGATGGACAGTGTAGGGAGGGAGAGAGGGAGGAAGGGAAGGAGGAAGGGAGGGAGGAAGGGAGGGAGGGAGGGAGGGAGGGAGGGGCAGGGTTTGGGCGGAGCTTGGTGGGTTTGTTGGTGCGTGAAGGGTTATGTTTCCTGTCTCTTCGTATCGGAAATCTCCCTGCTCCCTTCGAGTCACGAAATAGCGCATGACCCGCTTCCCCTCGTTCAGGTACCGGGTGCTCCTGAAGGACAAGGACCTCGCCGGGGTCAGTCGCGGCGAGAAATACATTTCGGACAACTTAAAGGGAAAGATGAAGAAGAAGAGGATGACGAAGTACGCCTACGACACCACCACCAGCCGGGTGGTGGGTTTGACGGACGAGAGCGCGAACTGGGGGAAGCAATTTGGGAAGGCGGACATGGTGATAGAGGCAGTCTTCGAGGACCTGAGCCTCAAGCATAAGGTCATTCAGCAGTTGGAGGAGCATTTGCCTCCCCACGCCGTCTTTGCCAGCAACACCAGCGCTATCCCCATCGCTCGGATTGCCGAGGCGAGCCAGCGACCGGAGAATGTGATTGGCATGCATTATTTCTCCCCGGTGCCCCAGATGCCTCTTCTCGAGATCATTCCGCACAAAGGGACCAGCAAAGAGGCCGCGGCGGCTGCTTTCGAAGTGGGGAAGAAACAGGGCAAAACGGTGATTTTCGTGAAAGACGTGCCAGGCTTTTACGTGAATCGGTGCCTGGGGCCCTACCTGGTGGAGACGGGGGCGCTCATGGAAGGTGCGTTGGTTGCGAGTCTGGGGATCGGTTGTCTCGCGTGGTTACTCTCGCCACGTTTGAAAATTTGAACCTTTGACAGTGCACACTTACTTACCTTTTGATTCTCATTATTTCCTCGCGTTGTTCCACCGGGACCCAGCCGGCGTGCCCCTCGAACAGCTGGACAAGGCCATCAAGGCCTACGGTTTCCCCGTGGGGCCCATCACCCTCGCCGACGAGGTCGGAGTCGACGTCGCGGCCCATGTTCAAGCCTTCCTATCCAAAGCCGACTTGGGCGTGCGAATGGGCGGGAGCGACGGACCGATTCTGGACGCGTTGCTGAAGGCCAAGCTTTTGGGCCGTAAGGCCGGCAAAGGCTTCTATACGTACCCCGCGGGGGGGAAAAAGGAGAAAGGGCCCAAGACTTTGAATCCGGAAGCCACGTCTTTGGTCCAGAAACACGTGAAAGGGGAGAGCAAGCTCACGGACGAGGAGGTGCAGAACCGGCTGGTCTCACGCTTTGTCAACGAGGCAGTCTTCGCCCTCCAAGATGGAGTGATCGCCTCCCCCGTCGAGGGCGACATTGGCGCCGTCTTTGGGATCGGATTCCCGCCTTTCCTGGGGGGTCCTTTCCGCCTGATCGACGCATTGGGAGCAGGGAAGTACTGTTCCATGCTGGAGGGCTTTGCCGGCAAATACGGGGAGCAATTCGCCCCCGCGCCACTCCTGGTCGAGCACGCAAAGAGCGGGAAGAAGTTCCACCAGTAG
SEQ ID NO:4
蛋白质
大洋洲海链藻
三功能蛋白A
MILSSAVQRAILSQSRAAAGAARQINSLSRRPASALAACQGGASSATGVVSIGDAHAADFNNHPRRRRAFSTAAVRDEPAPSPTPSEHTAADSSEKSFVPSPGRKYRFFRNVEVTPAGVAVIRFDNREKKVNTLSFELMHEAKAMWDAEVHANADVKSVVFTSAKESGFVAGADIFDISSVEDKSTLVPVIEEALDFFLHMKSKGAPMVAAIHGPALGGGLEWALWCDYRICTDSSSTKMGLPEVKLGLLPGFGGTQNLPALVGVQGAIDIMLTGKDIRPKKAKQMGLVDLVVAPQSLEAVAIETAEGLANGTVRKSGPKKKSLVNRLVEDTPPGRHVMWNQVKKMVDKNTAGNYPAPYEIIDCVKYGLANPDGLGKYKHEREGFAKLAATSESESLIGIFDGMNKLKKHDSDASPVPVRKVAVMGAGLMGAGIAQVTAEKGYDVLLKDRDDASLGRGVSYMTDNWSKKTKRRRMTQYQNNLNQSRVTPLSDATPSWPRHFAGADLVIEAVFENLELKRKIISQVEEVTPDHCVFATNTSAIPIADIAAPGPEVSRPQNVVGMHYFSPVPSMPLLEIIPHEGTSEEATATAFAVGTKQGKTCVVVKDVPGFYVNRCLGPVLVETSALVKEGVPLEKMDKAMKSFGMPVGPITLMDEVGIDVGSKVASYLSGADLDVRMTGGDISLMSTMVDKGWLGKKSGKGFYTYSGKKGKKIGPEMRAFLTEFTGGATSDLAETDIQDRITARLVNEAAKCLEDGIIADPVAGDIGLVFGIGFAPFRGGPFRYLDTVGVTSFVDRMNGFADAHGGQFEPCQLLKDYAASGKRFH
SEQ ID NO:5
蛋白质
假微型海链藻
三功能蛋白A
MWESDVHGNDSVKSIVFTSAKETGFIAGADIFDISQVEDKAQLVPVIEEALNFFLKMKSKGVPMVAAIHGPALGGGLEWALWCDYRICTDSSSTKLGLPEVKLGLLPGFGGTQNLPKLVGIQGGMDMMLTGKDIRPPKAKKMGLVDLVVAPQSLESVAIQSAEGLANGTVKKSKPKEKSLMNRLIEDTPPGQYLMWDKVKKMVDKNTGGNYPAPYAIIDCVKYGLAHPSGNDKFKHEREEFAKLAATKESEALIGIFDGMNQMKKLSSSAAPIDVKKVAVMGAGLMGAGIAQVTAEKGYDVLLKDRDAASLGRGLSYMTENWEKKHKRKRMTTYQLNLNTSRVTPLADDTESWKRHFAGADLVIEAVFENLDLKRKIVQQVEEVTSDHCVFATNTSAIPIADIAAPGPDIKRPENIVGMHYFSPVPSMPLLEIIPHAGTSDEALATAFAVGTKQGKTCVVVKDVPGFYVNRCLGPILVEVSALVKEGVPLETLDKAMKKFGMPVGPITLIDEVGVDVAAKVSTFLSDADLGVRMGGGDLSLMTNMVEKGWLGRKSNQGFYTYAGKKGKTIGSEVTAYLKEFTGGKVSNLSEKDIQDRIASRLVNEAAKCLEDDIIENPVAGDIGLVFGIGFAPFKGGPFRYLDAVGVSSYVDRMNGFADTLGEQFEPCQLLKDYATSGKKFHG
SEQ ID NO:6
蛋白质
三角褐指藻
三功能蛋白A
MAEEAKKLWKDEIASNSDVKAVVFSSAKPDMFIAGADIFDIKAVENKQDLIPFIADGVKFFQDMRGKGVPLVAAIDGPALGGGLEWALWCDYRICTDSSKTKMGLPEVKLGLLPGFGGTQNLHPVVGLQNAMDMMLTGKDIRPHQAKKMGLVDLVVAQASLERVAIDSAAALANGSLKAKRKSKSMFNKILEDNSIGRNVIWNQIDKMVQKNTNGKYPAPYAIIDCVKFGLDNPSQKYQHEREEFAKLAATPESEALIGIFDGMTQMKKHSFGADAAIPVKTVAVMGAGLMGAGIAQVTAEKGIKVLLKDRNDEAVGRGQSYMTENWSKKLKRKRMTQYQYNLNTSNVTALTDDSPTWQRHFGNADMVIEAVFEDLDLKRKIVANVESVTKDHCIFATNTSAIPIADIAQGASRPENIIGMHYFSPVPSMPLLEIIPHTGTSDTATATAFEIGSKQGKTCIVVKDVPGFYVNRCLGPYLVEVSALVRDGVPLEALDKSLKNFGMPVGPITLADEVGIDVSSHVAKFLSNADLGVRMEGGDVSLMEQMIGKGWLGKKSGQGFYTYKGKKKTINEEVQKYVKDFATRDLKLDEKEIQDRIVSRFVNEAAKCLEDEIIENPVVGDIGLVFGTGFAPFRGGPFRYLDQVGVASYVDRMNTFTDKYGPQFEPCQLLKDYAATDKKFHKR
SEQ ID NO:7
蛋白质
圆柱拟脆杆藻
三功能蛋白A
MTAFYSARYQSTASSAVLEEKPTDPSPSAAAASSTATNNEEGSKLFVPTADRKYEYFTNVEFTKEGVAIIRFDCPNKVNTISFALSDEARQLWKGEIENNSDVKAVVFSSAKPDMFIAGADIFDIKRIENKNDLVGLIEEGVTFFQHMREKKVPLVCAINGPALGGGLEWAMWCDYRVCSDSPKTKLGLPEVKLGLLPGFGGTQNLHELVGLQNAMDMMLTGKDIRPHKAKKMGLVDLVVSSQSVEKDAIQSAVDIINGKLKPKKKAKSLMNRLLEDTSIGQKIIWNQINKMVQKNTNGNYPAPNAIIRCVQHGIANRSTRFENEREEFAKLAATDESEALIGIFDGMTQMKKNPFDNTVAVPVKTVAVMGAGLMGAGIAQITAEKGMSVLLKDRNDAAIERGGSYMRDNWDKKLKRKRMTKFQHNLNSSNVVGLTDDNPNLVEKHFGNTDMIIEAVFEDLDLKRKIVADIEKITPDHCVFATNTSAIPIGAIAEGSKRPENIIGMHYFSPVPSMPLLEIIPHEGTNEATRATAFNVGTKQGKTCIVVKDVPGFYVNRCLGPFLVEVSALIRDGVSLEKLDRSVLDFGMPVGPVTLADEVGIDVTSHVATFLSKADLGVRMDGGDITLMEKMIDKGWLGKKSGQGFYTYSNKKKGKTISPEVQAYVKTFVKQDLNLDKEEIQNRIISRFVNEAAKCLEDEIIDNPVVGDIGLVFGTGFAPFRGGPFRYLDQIGVANYVDMMNSFADKYGGQFEPCQLLKDYAATDKKFYNN
SEQ ID NO:8
蛋白质
抑食金球藻
三功能蛋白A
MSSLLRYSARQVAVAGRRRLSAQPVASEGSRSWEFFAGDPEVTADGVAIVRLDAKKAKMNTLNPALQAEAQEMWSELMEARGNDVKAAVFISAKPDNFIAGADISMLAAKKASGDEDSLEAICLSGHTMFAELKATNIPIVAAIHGACLGGGLEWALKCDYRVASTSPKTKLGLPEVKLGLLPGWGGTYALPKLIGLTEALPMILQGKEVKADKAKKLGLVDAVCDPAALERLAVAKAAALGNGSLKLKEKKKSWMRWATEDVSFGRDFVFKKAKETVDKTTRGKYPAAYEIMDCVKHGLGKSPEEAFAFEAKAFVRLAKTPESSALIGLFDGITASKKNRYGNASDPATLKALDTVAVLGAGLMGAGIAQVSAEKGLNVLLKDASPEGLAKGVDYVGGNLAKKVKRRRMTDYTRNTITSKVMGYHDGPGGGGDAAWLRKAATADVVVEAVFEDLDLKHKVFQSVEPLVSEACVLATNTSAIPIAKVAAGAAKPERVLGMHYFSPVPQMQLLEIIPHAGTDPKAMAAAFAVGIKQGKFCIEVKDVPGFYVNRCLAPMMAELAPLFQDGVEPKQLDEAILDLGMPVGPVTLIDEVGADVGLHVQRTMLADETMGGRMAGADPAMLQAVVDKGWLGRKSGKGFFVYDGKKKTPNAEANAYVESEVKRRDAGLSVETIQDRYLTRFVNEAAVCLQEGILKTPADGDLGAVFGVGFLPFTGGPFRMLDAVGAATYVDKMNRLADEYGDRFAPCDLLVDHANSGKKFYPSK
SEQ ID NO:9
蛋白质
长囊水云
三功能蛋白A
MPMEDPASVESTSDKSPRFFQPVEKLDNGVAIIRIDGPEKMNTISGDFRQEIEDIWSGQIAEDPSVKAVVFISGKPDNYIAGADIRMISATEDKADLKQICMDGHATFDILAKKGIPVIAAINGACLGGGLEWALHCDYRLATTSPKTVLGLPEVKLGLLPGWGGTQLLHPLVGLQAALDMILTGKNIRPHKALKMGLVDQLVDAASLEAVAVEAAASLADGSLKSKRKPKALMNKIIEDTPMGRSIMWKKVGEKVAKSTGGNYPNATAIVDCIKFGLSSSKQAALEYEAQRFSEMAATPESESLIGLFEGSTALKKNRFGKPAKKVEKVAVLGAGLMGAGIAQVSAEKGMTVLLKDRDSASVGKGTSYIMDNAAAKLKKRRMTKYEMDTVGSRVIPLTDEGDLWKRHFGSAEMVIEAVPENLDLKHRVIQQAEQFLPEDCVFATNTSALPIRDIAKASKRPQNVVGMHYFSPVPMMPLLEIIPHDGTSDAAAAAAVDVGGRQGKTCIVVKDVPGFYVNRCLGPFLVETCALVEAGVGLEQLDKVMKSYGLPVGPITLADEVGIDIGFHVQSFLSEADMGVRMTGGNVAVMGDMVEKGFLGRKSGKGFYLYPKGKKGNKGGKELNPEAVSLIKAHQAAGGAGASLANDVIQDRMMCRFVNEAALCLQEGIISSPVDGDIGAVFGMGFPPFRGGPFRLLDQRGAGAYADMMNRLADEHGEQFRPCQLLMDHARGDKKFHTSEQ ID NO:10
蛋白质
迦得拟微球藻
TrifuncB蛋白序列
MDTGCTIVVERMLRSSTLLRGLASKAAGAGKKPTVVFVDGARIPFAQSSTVYNDYLGVDLQKFAYKGLVDKTALDPKEIDYILGGNVIQEVRTSNIAREAAMAAGLPTDIPAHTVVLACISSNVGICSAAEKVLTEHASLVLALITLPKAMKKGPLGVFKHLAKLNFKDLGLETPAIANYTTGEVMGHSSDRLSAKFGVSRREQDEFAALSHQRAAKAHKDGIYKDEIIPVDGNTGENGIKGESTADTLAKLKPAFVKPHGTHTAANSSFLSDGASASLIASEEKALSLGLKPKAFLRAWEFVAVDPFEQLLLGPTYATAKVLSAAGLTLADIDVIEIHEAFAGQVLSNIRAMGSDKFAQEYLNRSTKVGDIDMAKTNLHGGSLSLGHPFAATGNRLVTTAANRLHREGGRYALVTACADGGLGHACIIEKYE
SEQ ID NO:11
DNA
迦得拟微球藻
TrifuncB cDNA序列
ATGCCTTCGACAGTATTTGACGCCTTTGTTGTGGCATTGAGTGCAGGATGCGCGCGGGACTTTGGCTGCACAATTGTCGTGGAGAGAATGCTGCGGTCCTCTACGCTCCTCCGGGGCTTGGCGTCCAAAGCCGCCGGCGCCGGGAAGAAACCCACCGTTGTATTCGTCGACGGAGCTCGCATCCCTTTCGCCCAATCCTCCACCGTGTACAACGACTACCTGGGCGTGGACCTACAGAAATTCGCCTACAAGGGTCTGGTGGATAAAACGGCGTTGGACCCGAAGGAAATCGACTACATCCTGGGCGGGAACGTTATCCAAGAAGTCCGTACCAGCAACATCGCCAGGGAAGCCGCCATGGCCGCTGGCCTCCCCACCGACATCCCCGCCCACACCGTCGTCCTGGCCTGTATTTCCTCC
AACGTGGGCATCTGCTCCGCCGCGGAGAAAGTCTTGACTGAGCACGCCAGCCTGGTCTTGGTGGGGGGGGTGGAGACCTTCTCGGACGTGCCTATCCGCCTCACCCGCCCCCTCCGCCAGGCCCTCATAACCCTGCCCAAGGCGATGAAGAAGGGCCCTCTGGGCGTCTTCAAGCACCTGGCGAAGCTCAACTTCAAGGATCTGGGCTTGGAGACCCCCGCCATCGCCAACTACACCACCGGGGAGGTGATGGGCCACTCCTCGGACCGACTTTCGGCAAAATTCGGGGTTTCTCGGCGGGAACAGGACGAATTTGCGGCCCTCTCTCACCAACGCGCAGCCAAGGCGCACAAGGACGGCATCTACAAGGACGAGATCATCCCCGTGGACGGCAATACGGGCGAGAACGGGATCAAGGGC
GAGTCTACCGCAGATACCCTCGCCAAGCTCAAACCGGCCTTTGTGAAGCCTCACGGCACCCACACCGCCGCCAACAGCTCCTTCCTCTCGGACGGCGCCTCGGCTTCCCTGGAGTACCTGAACCGATCCACCAAGGTGGGCGACATCGACATGGCAAAGACCAATCTGCACGGAGGCTCCCTCTCCCTCGGCCACCCCTTCGCCGCTACCGGAAACCGATTGGTGACGACGGCGGCGAATCGCCTGCACCGGGAGGGAGGGAGGTACGCCCTGGTCACTGCCTGCGCGGATGGCGGTTTGGGCCACGCCTGTATCATCGAGAAATATGAGTGA
SEQ ID NO:12
DNA
迦得拟微球藻
TrifuncB gDNA序列
ATGCCTTCGACAGTATTTGACGCCTTTGTTGTGGCATTGAGTGCAGGATGCGCGCGGGACTTTGGTAAATATGGACTTAGTTTCACCATCGTGTTCCAAGCATGAAGTGGCGGCTCTCCCCCCTCGAATACGTCGGCTAGGACGTGGGGCCTCTTCCCCTTCCTGATCATTCGCTTTACCCCTTTCGTCTTCACACACATGGACACAGGCTGCACAATTGTCGTGGAGAGAATGCTGCGGTCCTCTACGCTCCTCCGGGGCTTGGCGTCCAAAGCCGCCGGCGCCGGGAAGAAACCCACCGTTGTATTCGTCGACGGAGCTCGCATCCCTTTCGCCCAATCCTCCACCGTGTACAACGACTACCTGGGCGTGGACCTACAGAAATTCGCCTACAAGGGTCTGGTGGATAAAACGGCGTTGGACCCGAAGGAAATCGACTACATCCTGGGCGGGAACGGTAAGCCTGAAGCAAGGGGGGGGGGGAGATCGTGCTGGCATGTATACTCAAAGATCAAGCCCTCTCAATGATAATCACGAGTTTTCCTGCTCGGGCCTTGTCCAATGATACTCACTAACTCCCGGCCCTTTTCTCCGCTCGAAGGATGATGGGGAGGGAAGTGATGAGGACGGAGGAGTCTCACAACCGTGTGATGGGGAGGGACGAGAGAGGGCAACCCCCGAGGCCTCAAGCCTCGCTCGTGCCGGTCCTGGTCCGCTTCCGCCTTCTCAAGGCTTACATCCTTTCCCTTCCTCCCTCCCTTCTTCCCTCCCCCCCTCCTTCCCTCCCTCCCCATCTCAGTTATCCAAGAAGTCCGTACCAGCAACATCGCCAGGGAAGCCGCCATGGCCGCTGGCCTCCCCACCGACATCCCCGCCCACACCGTCGTCCTGGCCTGTATTTCCTCCAACGTGGGCATCTGCTCCGCCGCGGGTAGGTCCTCCCTCCCCGTCCTCCGGCCCGAAGCCCTGTCTTTGCCTGCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTGCCTGCCTCGCTCCTCCCCTCCTCTCTCCCCTCCAAGCTCAGAGGAAATCTTGATTCCCCTTCCCCCCTTCCTTTCTCCCTCGCTCCCTCCCTCCCTCCCTCCCCAGAGAAAGTCTTGACTGAGCACGCCAGCCTGGTCTTGGTGGGGGGGGTGGAGACCTTCTCGGACGTGCCTATCCGCCTCACCCGCCCCCTCCGCCAGGCCCTCATAACCCTGCCCAAGGCGATGAAGAAGGGCCCTCTGGGCGTCTTCAAGCACCTGGCGAAGCTCAACTTCAAGGTGCGTGTTGTCTTCTCCTTAAGCTGTTCGGGTCAGACCTCCCCCCCCTTCCTTTCCCATCACCGATTTTGCTCAAACACATGTACCAAGGAGAGGTTGTGAAGGATGGTTACTGGAGAGGCATATTTTTTCATGGAGTCGCCCTCCTTTCTTCCATTCTCTTCCTCCGCCTCTCCCTCCTCCCCATGCCTTTGTTCATCTTCCCTCCCTTCCTCCCTCCTTCCCTCCTTCCCCTGCTAGGATCTGGGCTTGGAGACCCCCGCCATCGCCAACTACACCACCGGGGAGGTGATGGGCCACTCCTCGGACCGACTTTCGGCAAAATTCGGGGTTTCTCGGCGGGAACAGGGTAGGGGGGGAGGGAGAGGGAAGGGAGCTAGGGAGAAGCAGAGGGACGAGAAGAGGGGCCGGGGGGGGGCGGGGGTTATTACTCACCACACGTCCCTATGGATGTTTCTCGCTTCCTCTTGACGCGCAGACGAATTTGCGGCCCTCTCTCACCAACGCGCAGCCAAGGCGCACAAGGACGGCATCTACAAGGACGTGCGTCCTCCCTCCCTCCTTCCCTCCCTCCTTCCCTCCTACCTTCCCTTCTACCTTCCCTCCCTGCTTCCTATTTCGCCATTTATCGTGCAGCGCAGTCGTTCGTGCCCTCAGGTCACCTCCTCCCTTCCTCCCTCCCTCCCTCCCTCCCTCCCTCCCTCAGGAGATCATCCCCGTGGACGGCAATACGGGCGAGAACGGGATCAAGGGCGAGTCTACCGCAGATACCCTCGCCAAGCTCAAACCGGCCTTTGTGAAGCCTCACGGCACCCACACCGCCGCCAACAGCTCCTTCCTCTCGGACGGCGCCTCGGCTTCCCTGGTGAGGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCATTCCTTCAGGAGTACCTGAACCGATCCACCAAGGTGGGCGACATCGACATGGCAAAGACCAATCTGCACGGAGGCTCCCTCTCCCTCGGCCACCCCTTCGCCGCTACCGGTAGGGAGGGAGGGAGGGAGGGAGGGACAGATGATCCCCGACGAAATAGTTGTTGGCTTCCTCGTTCAGCCCGTCATGGCGTATCGGCACTTCCTTGTGATTTTCTTCCACGCTCATCGTCTTTCATCGATGCGGCCATGCGCGTGCGTCCCTGCTGTCTGTCCCCCAACCCTTCTCCCTCCGTTCTCATCACATTTGATCAAAGTATTCCCTTTGTTTATGGAGCTTACCTTGCCATTCCTCTCTCTTTGTCGGGGGAAAAATCCAAATCCTCCAAATCCATCAGGAAACCGATTGGTGACGACGGCGGCGAATCGCCTGCACCGGGAGGGAGGGAGGTACGCCCTGGTCACTGCCTGCGCGGATGGCGGTTTGGGCCACGCCTGTATCATCGAGAAATATGAGTGA
SEQ ID NO:13
蛋白质
假微型海链藻CCMP1335 TrifuncB
MITARLLKQGMSSPSSSSSSSRLAAITSRAATSLVTSNSFSTTSTKLKNPKTNVVIVDGIRLPFAQTTTI
YQDQLAVDLQRLAYQGLITKTALDKKDVDYVMAGTVIQEVRTSNLAREAAINAGFPASIGAHTVAMACIS
SSVAITSAAEKILSGHASIVIAGGAETFSDVPIRLTRPIRQKLITMPKAMKKGGALGAIRHLTKGLKMKD
ISLETPAIANYTTGEVMGVSSDRLSAKFGITRLEQDEFTTDGLPRVVVSSWYDGEIVPYKGSTEENGIKA
DSTIESVSKLKPAFVKPHGTHTAANSSFLTDGASASLIMSEERALELGYKPLAYLRDWSFKACDPFEELL
LGPTYCSQEVLSRNNLNLETDIGVFEIHEAFAGQILSNLTAMNSQKFADEKFGGKKVGEIDMRKMNTKGG
SLALGHPFGATGSRLVTTASRRLQLENQRFALIAACADGGLGHACILERYDN
SEQ ID NO:14
蛋白质
三角褐指藻CCAP 1055/1TrifuncB
MLSTSVRAISRGSPLVQTAARRSLASLALTPNDPVVVVSGVRLPFAMTSTIYEDQLAVDLQRLAIQGLLT
QTALPKSEVDYVIAGNVIQEVRTSNIAREASINAGLPLHVGAHTIAQACISANAAICAGAEKILTGHASV
VIAGGCETFSDVPIRLTRPIRQKLITMNKAMKKGGMVGGISHLLKGLSLKDVSVETPAIANYTTGEVMGV
SSDRLAAKFGVSRHDQDAFTVRSHTMAAKAHTDGFYKNEVVPYKGSTQENGIKGDSTIESVAKLKPAFVK
PHGTHTAANSSFLTDGAAATLIMSESKAKELGYKPLAYLRDWSFKACDPFEELLLGPTYCSQEILARNKL
QMSDMGVLEIHEAFAGQILANLTAMESQTFADKNFGGKIVGKVDVDKMNTKGGSLALGHPFGATGSRLVS
TASRRLQHEGARFALLAACADGGMGHACLLERYDNDN
SEQ ID NO:15
蛋白质
圆柱拟脆杆藻CCMP1102 TrifuncB
MISSQKLVRPLLTAQRRLFSLRPIAGGRDVVIVSGVRLPFAQASTIYQDEMAVDLQRLAIKGLIDQTALP
KDAIDYVVCGNVIQEVKTSNIAREAAINAGLPYNIPSHTIAQACISANAAIATGAAAIQSGHADVVIAGG
VETFSDVPIRLSRPIRQKLITLPKAMKKGGPIGAVRHMLKGLKMKDLSLETPAIANFTTGEVMGVSSDKL
SAKFGISRQEQDEFTVRSHTLAHKAHDDGFYKDEIIPYRGSIAENGIKGNSSYESVSKLKAAFVKPNGTH
TAANSSFLTDGAAATLIMSEEKAKELGYKPLAYLRDWSFKSCDPWEELLLGPTYCTQDILQRNSMSINDF
GVFEIHEAFAGQILSNLAAMDSDIFAKEKGWSKKVGAIDFDKMNIKGGSLSIGHPFGATGSRLVTTAARR
LQEEGQQFALIAACADGGLGHACLLERYDN
SEQ ID NO:16
蛋白质
赫氏颗石藻CCMP1516 TrifuncB
MLQLSTRLRAVRPAIVRARARSTAASTGQKKVVLVDGCRIPFQPSRGEYFDLMSYDLTRLAMHGLLTKTA
VDPKAIDYVLWGKVIQEPKTSNIARDAAFAAGIPRGVPAHTVTQACISSNQAICTGASQILSGQAEVVLA
GGVETFSDAPIRYSRPIRKKLIKMSKAKSPGQMASIFFKGLKMKDLAPEQPAIANFLTGEVMGHNADRLS
DRFGVSRREQEEFALRSHLNAANAHADGFYDGEVIAGPGGKTLEDGPRADSSLEKMATLKPAFVKPHGTV
TAASASPFTDGASATLLMSDGKASELGLSPKAELLAYAFVACDPFEELLLGPTYGASKVLRMAGLSLKDI
DVIEFHEAFAGQVLSNLVAMDSDKFFAENLPGVDKVGSVDMTKLNTKGGSLSIGHPFGATGARLVTTAAN
RLVKEGGTYALVAACADGGLGHACILKRYGA
SEQ ID NO:17
蛋白质
赫氏颗石藻CCMP1516 TrifuncB
MLQLSTRLRAVRPAIVRARARSTAASTGQKKVVLVDGCRIPFQPSRGEYFDLMSYDLTRLAMHGLLTKTA
VDPKAIDYVLWGKVIQEPKTSNIARDAAFAAGIPRGVPAHTVTQACISSNQAICTGASQILSGQAEVVLA
GGVETFSDAPIRYSRPIRKKLIKMSKAKSPGQMASIFFKGLKMKDLAPEQPAIANFLTGEVMGHNADRLS
DRFGVSRREQEEFALRSHLNAANAHADGFYDGEVIAGPGGKTLEDGPRADSSLEKMATLKPAFVKPHGTV
TAASASPFTDGASATLLMSDGKASELGLSRKAELLAYAFVAWDPLEELLLGPTYGASKVLRMPGLSLKDI
DVIEFHEAFAGQVLSNLVAMDSDKFFAENLPGVDKVGSVDMTKLNTKGGSLSIGHPFGATGARLVTTAAN
RLVKEGGTYALVAACADGGLGHACILKRYGA
SEQ ID NO:18
蛋白质
抑食金球藻TrifuncB
MLGLKSLSSRALSSRARSLSTGGKNVVIVDGVRIPFALSQTIYQDVMAVDLAKMSLTGLMQKTGLDASLV
DYVLYGTVIQESRTSNIAREAAMHAGYPIDVPAHTVTLACVSSNAAICQGAEKILAGQADVVVAGGCETF
SDVPIRYSRPVRKRLLGAAKALKKGPAGALGLLKGLKLKDLAPEAPSISNFTTGEVMGHSSDRLAAKFGI
SRKDQDDYTLMSHTRAQQAHDDGLYAEELVPGVQGADLSENGIKAGSTPEKLAKLKPAFIKNETGTHTAA
NSSFLTDGAAATLVMSEEKALALGFKPKAYLRHWTFAAVDPFEELLLGPTYAVSKVLNDAKLDLKDVGVV
EMHEAFAGQVLSNFAAMNSDKFAADFLPNRTQKLGEMDFAKVNTQGGSLSLGHPFGATGSRIVTTASNRL
QRSGEQFALVAACADGGIGHSCLLERYPN
SEQ ID NO:19
蛋白质
长囊水云
乙酰基-CoA乙酰基转移酶亚基,推定的线粒体前体乙酰基-CoA
MVHQGVTATMRSARAAMVSSRAAAAAAARASCGRRANSSSASSSSSSSSRKPVFVDGARIPFVLSGTTYK
DLLAVDLGKLALRGLLNRNPELDPKDVDYLLFGTVIQESRTSNIAREAGMGAGIPVSVPSHTVSQACISA
NQAMCNGAEKILAGTADVVLAGGVETFSDLPIRFSRPIRNRLLNLGKAKKKGLPGVLGLLKGLKLKDIAP
ETPAIANYTTGEVMGHSSDRLSGRFGISRQEQDEFALRSHQNAAKAHADGIYDQEIIPVDGSTDENGVKG
ESTLEKLGSLKPAFVKPHGTHTAANSSFLSDGASAALIMSEGRALEMGLAPRSSFKSWAFVALDPFEDLL
LGPAFGAAKVLDDAGLTLSDIDVFEIHEAFAGQVLSNLAAMNSTDFAQKSMGRSAKLGEVPMEKLNIHGG
SLSLGHPFGATGVRLVATATNRLHREGGRYALVAACADGGLGHACIVERYDS
SEQ ID NO:20
蛋白质
迦得拟微球藻
PXA氨基酸
MAPSFSHRGQKRHDNVVSAFFNSFMSAGEQKFTVVSSLFSSGLFLVALALVKQLSSLQEQEEKVAASLERQDPSKEGGSLAAPLPQPDGRCQTPQPPPPSPPPSASPSSFSATSTARTRSPNADALTRSGRDAAGHGERGSGGMRRPGGPPLPQEGQRVALDDEFGRQLLSLLHKLIPSWKTREAACLGGMVFLLLARSACDLRMINLVVGAEKAIVLGNRPAFRISLARFLRFMVPVACVNALLKYTTRELSLGLRQRLTEHLQSKYMKGFTFYSMAVMEGHAREIEQLMTVDVDKFSLCITELASNLLKPTLDILLYATKLQTSVGPLIPLAMASYLFSSGTALTRLRRPAAEYTAAIQRREGDYRFVTNRMVAHAEEIAFYDGVGREKNYLQQIFGSLLGTIRRGSRFRHAMDILDS
VMAKYIATALGWVLLNRAAQQQKQEALPVPSPALPPSPAASSYDSFHQSARMMFNFAQALSAIVLAGREATRLAGYTSRVTRLERLIDDLEREDEARSTASEFLEKKDVIELQGVPIVAPVVGNGRKDSDGGRGGRKGREGGRVRRLTSPLTLRIEPGMHVLVTGPNGSGKSSLFRMICGLWPVSEGRLIKPPRSQLFYIPQRPYLPLGSLRDQVIYPHSQAEMAALGRTDADVLALLDEVQLSFLAPPRVVGPESNASDALPSLPSSLPSSLPSSLPPSFPSFSSLAQVLTRPSPTTPEEEEGREGGREGGREGGLERVCDWGETLSGGEKQRLAFARLYYHRPRFAILDECTSAVSSDVEDHLYRQAQALGITLLTVAHRQALWKHHEYLLMLDGKGGWSFRPMQTLEPEAAEGDGDI
KYT
SEQ ID NO:21
DNA
迦得拟微球藻
PXA编码序列
ATGGCCCCTTCCTTCTCCCATCGCGGTCAAAAACGGCACGACAATGTGGTTTCTGCTTTTTTCAACTCCTTTATGTCCGCTGGCGAGCAAAAATTCACGGTGGTCTCATCTCTTTTCTCGAGCGGGTTGTTCCTAGTTGCCTTAGCCCTCGTGAAACAGCTGTCGAGCCTACAAGAGCAAGAAGAAAAGGTTGCTGCGTCCCTAGAACGCCAAGACCCAAGCAAGGAAGGAGGAAGTCTGGCGGCACCCTTGCCCCAGCCTGACGGCAGGTGCCAGACCCCCCAGCCTCCCCCTCCCTCACCCCCACCCTCCGCCTCGCCCTCCTCCTTCTCAGCGACCTCCACAGCCCGGACTAGGAGTCCCAATGCCGATGCTTTGACGAGGTCGGGGAGGGATGCTGCCGGCCATGGAGAAAGAGGG
AGCGGGGGCATGAGGAGACCAGGCGGCCCTCCGCTACCGCAGGAAGGGCAGAGGGTGGCTCTGGACGATGAATTCGGAAGGCAGCTCTTAAGCCTTCTCCACAAATTAATCCCCAGCTGGAAGACGCGTGAAGCCGCCTGCCTAGGAGGCATGGTTTTCCTCCTCCTGGCTCGCAGCGCCTGTGACTTGCGAATGATAAACCTGGTGGTGGGGGCGGAGAAGGCGATCGTGTTGGGCAATCGGCCCGCCTTCAGGATCTCTTTGGCGCGCTTTTTAAGATTCATGGTGCCTGTGGCCTGTGTGAATGCCCTGCTCAAGTACACAACGAGAGAGCTCTCTCTTGGCCTCCGTCAACGACTCACAGAGCATCTTCAGTCTAAATACATGAAAGGCTTTACCTTCTACTCTATGGCGGTCATG
GAAGGGCATGCGAGGGAAATCGAGCAGCTTATGACCGTGGACGTGGACAAGTTCTCCCTGTGCATTACGGAGCTGGCCTCAAACCTCCTAAAGCCAACCCTTGATATTCTTCTTTACGCAACAAAATTACAAACCTCGGTCGGTCCTCTGATCCCGTTAGCCATGGCTAGCTACCTCTTCTCCTCTGGCACAGCCTTGACGCGCCTGCGAAGACCTGCCGCAGAGTATACGGCCGCGATCCAACGGCGCGAGGGCGACTACAGATTTGTGACGAATAGAATGGTCGCGCACGCCGAAGAGATCGCTTTCTACGATGGAGTGGGGAGGGAAAAAAACTACCTGCAGCAGATCTTCGGTTCTTTGTTGGGAACGATCCGGCGCGGCTCCCGGTTCCGCCACGCGATGGACATCCTCGATAGT
GTCATGGCCAAGTACATAGCCACCGCTCTTGGCTGGGTGCTTTTGAATCGCGCGGCTCAGCAACAGAAACAAGAAGCGCTTCCTGTCCCCTCTCCCGCCCTCCCACCCTCCCCCGCTGCCTCTTCCTACGACTCTTTCCATCAATCCGCTCGCATGATGTTCAACTTTGCACAGGCCCTCTCCGCCATCGTCCTGGCGGGCAGGGAGGCGACGCGTCTGGCAGGCTATACCTCTCGGGTCACGCGCCTCGAACGCCTCATTGATGACCTGGAGCGCGAAGACGAAGCAAGATCCACCGCATCGGAGTTTTTGGAGAAGAAAGATGTGATAGAGCTCCAGGGTGTGCCCATCGTCGCTCCGGTCGTCGGCAATGGCCGCAAGGACAGCGACGGCGGGAGGGGAGGGAGAAAAGGAAGGGAA
GGAGGGAGGGTACGGCGATTGACATCTCCTCTGACCCTGAGAATTGAGCCAGGCATGCACGTCCTCGTCACAGGACCGAATGGAAGTGGGAAATCGTCTCTTTTCCGAATGATCTGTGGCCTCTGGCCTGTCTCCGAAGGGCGCCTCATCAAACCTCCTCGATCCCAGCTCTTCTACATACCCCAACGACCCTACCTCCCGCTTGGAAGCTTGCGGGATCAGGTGATTTACCCTCACTCCCAGGCCGAGATGGCGGCACTAGGGAGGACGGATGCAGATGTGCTGGCGCTTTTGGATGAGGTTCAACTCTCCTTCCTTGCCCCCCCCCGGGTGGTAGGACCGGAGAGCAACGCCAGCGATGCTCTGCCCTCCCTCCCTTCCTCCCTCCCTTCCTCCCTCCCTTCCTCCCTTCCTCCCTCC
TTTCCGTCTTTCTCCTCCTTGGCCCAAGTCCTCACCCGGCCATCGCCTACGACCCCGGAAGAGGAGGAAGGGAGGGAGGGAGGGAGGGAGGGAGGGAGGGAGGGAGGGTTGGAGCGAGTCTGCGACTGGGGCGAGACATTGTCGGGGGGCGAGAAGCAGCGGCTGGCTTTTGCCCGTCTCTATTACCACCGACCGCGCTTTGCCATCTTGGACGAGTGCACGAGCGCCGTGTCGAGCGATGTGGAGGACCATCTGTACAGACAGGCGCAGGCACTCGGCATCACCTTGCTCACAGTGGCGCATCGGCAGGCCTTGTGGAAACATCATGAATATCTGCTGATGCTGGATGGGAAAGGGGGCTGGTCTTTTAGGCCCATGCAGACACTGGAACCGGAAGCTGCCGAAGGGGACGGAGATATA
AAGTACACCTGA
SEQ ID NO:22
蛋白质
迦得拟微球藻
酰基-CoA氧化酶氨基酸
MTTANARLSRLKDHLAETGAVARAPISSSAINATPFAARTTHTMERMARERAKASFPVRDMTYFLDGGRSMTEVKEGMMADLAANPVFTDPEWNDLNRDQIRERTISRLRAAYKLLIRDGADVSRRNARLEIHALHDLGWYVRQGVHFGLFMGALAGQGSDEQRAEWLPRTMMCEIYGCFGMTELGHGSFLRGLETTAMYDKDTQEFVINSPTDTSTKWWIGAAGQTATHSVVFARLLLPSGDDMGVHNFIIPLRDMETHLPLPGIHIGDLGAKMGLNGIDNGWMQFDHVRVPRDNMLCRYAQVTPEGKYIRPPRKEMAYGALIGTRAALVKTAVDFQKKALMIGIRYTALRTQGVVEEGQREETAIIDYPIHRDKLLKLLAAAYAWHFQAAYVLHLNDSLEEGLEAGDLSILKDVHGTMAGLKAFGTWFTYNTIEACRQVCGGHGYSKYNGLSNTLQDFAVMCTWEGDNTVMALQTARYLVRSYEKAKRGGETLAGSVSYLQDAHPPAWRARSAEDLMNMEVQMEAWRALLAAKVSRASERVLARQAALRGNEAQAFNEHQVELFECAKTHVYFNVAARFAEAVVEAGTTHPALAPVLARLCHLFSLSSLLEDEASLLASGFASAGQMQLIREAVGALLLALRPDAVALVDAFNYSDEVLNSHLGTANGDIYTGYLQQVQRLVPENKLAVAPYIMREVKPLMQGADLISTDEEED*
SEQ ID NO:23
DNA
迦得拟微球藻
酰基-CoA氧化酶cDNA
ATGACGACCGCCAATGCCCGTTTGTCGAGGCTCAAAGATCATTTAGCAGAGACGGGGGCTGTGGCGCGCGCGCCGATTAGCTCCTCTGCCATCAATGCCACGCCTTTTGCGGCGAGGACGACGCATACCATGGAGCGCATGGCAAGGGAACGAGCCAAGGCCTCCTTCCCCGTCCGAGACATGACGTACTTCTTGGACGGCGGGAGGAGCATGACCGAGGTCAAGGAGGGCATGATGGCGGACTTGGCGGCGAATCCGGTCTTTACGGACCCAGAATGGAACGACTTGAACAGAGATCAGATCCGTGAACGCACCATCTCTCGACTGAGAGCTGCGTACAAGCTCCTGATCCGAGACGGTGCCGATGTCAGCCGCCGGAATGCCCGGCTTGAGATTCACGCCCTCCATGACTTGGGGTGGTACGTGCGGCAGGGTGTGCATTTCGGCCTCTTTATGGGCGCCTTGGCCGGGCAGGGGAGCGACGAACAACGCGCTGAGTGGCTGCCCAGGACCATGATGTGTGAGATCTACGGGTGCTTCGGGATGACGGAGTTGGGGCACGGCTCATTCTTGCGGGGCCTGGAGACCACAGCGATGTACGACAAGGACACGCAAGAATTTGTAATCAATTCCCCCACTGACACAAGCACCAAATGGTGGATCGGTGCGGCCGGGCAGACGGCCACACATTCGGTGGTTTTCGCCCGCCTCCTCCTTCCCTCAGGGGACGACATGGGTGTGCACAACTTCATCATACCCCTCCGGGATATGGAAACGCACTTGCCCCTCCCTGGCATCCACATTGGCGATTTGGGGGCCAAGATGGGCTTGAATGGCATCGACAACGGGTGGATGCAATTTGACCACGTCCGCGTGCCCCGGGACAACATGCTTTGTCGCTACGCACAGGTCACCCCGGAGGGGAAATACATCCGTCCTCCCAGGAAGGAGATGGCTTACGGCGCTCTCATCGGCACTCGGGCGGCTCTGGTCAAGACAGCCGTGGACTTTCAAAAAAAGGCCCTCATGATCGGGATCCGCTACACCGCCCTCCGGACACAGGGCGTGGTGGAGGAAGGCCAAAGGGAAGAGACCGCCATCATCGACTACCCCATCCACCGGGACAAACTCCTGAAACTCTTGGCGGCCGCCTACGCCTGGCACTTCCAAGCCGCCTACGTTCTCCACCTGAACGATTCCTTGGAGGAGGGGCTCGAGGCGGGGGACCTCTCCATCCTCAAGGATGTGCATGGGACCATGGCTGGCCTCAAGGCTTTCGGAACCTGGTTCACGTACAACACGATCGAGGCCTGCCGGCAAGTGTGCGGGGGCCACGGGTACAGCAAGTACAACGGCCTCTCCAACACCCTCCAGGACTTTGCTGTCATGTGCACCTGGGAGGGCGACAACACCGTGATGGCTCTACAGACGGCGCGGTATCTAGTTCGGTCCTACGAGAAGGCGAAGCGGGGGGGCGAGACCCTGGCAGGCTCCGTCTCATACCTGCAGGATGCGCATCCCCCGGCTTGGCGGGCGAGGTCTGCGGAGGACTTGATGAACATGGAAGTGCAGATGGAGGCCTGGCGGGCCCTCCTAGCCGCCAAGGTCTCCAGAGCCTCAGAGCGGGTCTTGGCAAGGCAGGCGGCGTTGCGGGGGAACGAGGCGCAGGCCTTCAACGAGCATCAGGTGGAGCTTTTCGAGTGCGCCAAGACCCATGTCTACTTCAATGTGGCGGCGCGGTTTGCCGAGGCGGTCGTGGAGGCCGGCACCACCCACCCCGCCCTGGCCCCTGTCCTCGCCCGCCTCTGCCACCTCTTCTCTCTCTCGAGCCTTCTAGAAGACGAAGCCTCCCTGCTCGCCAGCGGTTTCGCCTCCGCGGGGCAGATGCAGCTCATTCGCGAGGCCGTGGGCGCCCTCCTCCTCGCCCTCCGCCCGGACGCGGTGGCCCTTGTCGACGCCTTCAACTATTCCGACGAAGTTTTGAACTCACATTTAGGCACCGCCAACGGCGATATTTATACGGGCTACCTCCAACAGGTGCAGCGCCTCGTCCCTGAGAACAAGCTGGCCGTCGCCCCCTACATCATGAGGGAGGTGAAGCCTTTAATGCAAGGAGCAGACCTGATCTCCACGGACGAGGAGGAGGACTGA
SEQ ID NO:24
蛋白质
迦得拟微球藻
异柠檬酸裂解酶
MYWKRTCCDCLGLHFRTLILDLFPCSAGALHSNPYRLSVRKPIKITITTRTMEETRLYHEDVAATEHFFRNPRFAQTVRPYSAQDVVALRSSLLVEPASNRQAQKLWSLLTGLAGQGKCSYTFGALDPVQVVQMAPHVSTIYVSGWQCSSTASTSNEPGPDFADYPMDTVPNKVHQLFSAQLFHDRRQQEARARMTDASKVAEPPVDYLRPIIADGDTGHGGLTAVMKLTKMFIERGAAGIHFEDQKPGTKKCGHMGGKVLVSVQEHIDRLTAARLQADVMGAQTIIVARTDGEAASLLDTNIDARDHPFILGATVPGTRALNEVVAEARAQGVTGAELDRITDQWTAAANLRRFPEAVCDALSTLPNPAPKLAVWKAQAYNLSLPQARALAKELMGREVYFDWEAPRSREGYYRIKGGVDYCVARAVAYAPHADLIWMETAKPDLSEAREFAQGVRAAVPGKMLAYNLSPSFNWDVAGLSPQEMEHFNSSLAAMGFVWQFITLAGFHANGLMTTMFAREYGKRGVVAYVEMIQRKEREQEVDMLTHQKWSGAALLDKQMQTVTGGMSSTSSMGKGVTEAQFGAKGPGAAGVSSGAGAARAGAISRL
SEQ ID NO:25
DNA
迦得拟微球藻
异柠檬酸裂解酶cDNA
ATGTATTGGAAGAGGACGTGTTGTGACTGTCTAGGGCTTCATTTCCGGACCCTCATTCTCGACCTCTTCCCTTGCTCTGCTGGCGCCCTTCATTCCAACCCTTACAGACTTTCGGTGCGCAAGCCGATCAAGATCACAATCACCACAAGGACAATGGAGGAAACACGCCTATATCATGAAGATGTTGCTGCGACAGAGCATTTTTTCCGCAACCCGCGCTTTGCCCAAACTGTTCGGCCCTATTCGGCGCAGGACGTCGTCGCACTCCGGTCCAGCCTCCTGGTCGAACCTGCCTCCAATCGACAGGCCCAGAAGCTCTGGTCCCTCCTGACCGGGCTGGCCGGTCAAGGAAAGTGCTCGTACACCTTCGGCGCCCTCGACCCCGTTCAGGTGGTGCAGATGGCCCCCCACGTCTCCACCATTTACGTGAGTGGCTGGCAGTGCTCCTCCACGGCCTCCACTAGCAACGAGCCCGGCCCAGACTTTGCAGATTACCCCATGGACACGGTCCCCAACAAGGTGCACCAACTCTTCTCCGCCCAACTCTTCCACGACCGCCGCCAGCAAGAGGCGCGAGCCCGCATGACGGACGCGAGCAAGGTGGCGGAACCCCCTGTCGACTACCTCCGGCCCATCATCGCCGACGGCGACACGGGCCACGGCGGTCTGACCGCGGTGATGAAGCTGACCAAGATGTTCATTGAGCGAGGGGCGGCGGGGATTCACTTCGAGGATCAGAAACCAGGCACTAAGAAGTGCGGGCACATGGGCGGGAAGGTGTTGGTGTCCGTCCAAGAGCACATTGACCGGTTGACAGCCGCACGGCTGCAGGCGGACGTGATGGGGGCGCAAACCATCATTGTGGCGCGTACTGACGGGGAGGCGGCCAGTCTTTTGGACACCAACATCGACGCGCGCGACCATCCTTTCATCTTGGGGGCCACGGTCCCTGGCACCCGCGCCCTGAATGAGGTGGTGGCCGAGGCGAGGGCCCAGGGGGTGACGGGCGCGGAGTTGGACCGCATTACGGACCAATGGACGGCGGCCGCCAATTTGCGTCGCTTTCCGGAAGCTGTCTGCGACGCCTTGTCCACGCTACCCAATCCGGCCCCGAAGCTCGCCGTCTGGAAGGCTCAGGCCTACAACCTCTCCCTGCCGCAGGCGCGTGCGCTCGCGAAGGAACTGATGGGCCGGGAGGTGTACTTCGACTGGGAGGCGCCGCGTTCCCGCGAGGGGTATTACCGCATCAAGGGTGGGGTGGACTACTGTGTAGCCCGGGCGGTGGCGTACGCGCCGCACGCGGATTTGATTTGGATGGAGACGGCGAAACCGGATCTTTCCGAAGCTAGGGAGTTCGCTCAAGGGGTGCGGGCGGCCGTGCCTGGTAAGATGCTCGCCTACAACCTCTCTCCTTCCTTTAACTGGGACGTGGCCGGCTTGTCCCCGCAGGAGATGGAGCATTTCAACTCGTCCCTGGCGGCCATGGGCTTCGTCTGGCAGTTCATTACCTTGGCGGGCTTCCACGCGAACGGGCTCATGACCACCATGTTTGCGCGCGAGTACGGAAAGCGGGGGGTGGTGGCCTACGTGGAGATGATCCAGCGGAAGGAGCGGGAGCAGGAGGTGGACATGCTCACCCACCAGAAGTGGTCAGGAGCCGCGTTACTCGACAAGCAGATGCAGACGGTGACGGGCGGCATGTCCTCCACGTCCTCCATGGGCAAGGGCGTGACAGAGGCCCAGTTTGGCGCCAAGGGACCGGGAGCGGCCGGTGTCTCATCGGGAGCAGGAGCGGCGCGTGCGGGGGCGATTTCTCGGTTGTAA
SEQ ID NO:26
DNA
人工序列
pSGE-6206载体
gcggccgccgtatggtcgacggttgctcggatggggggggcggggagcgatggagggaggaagatcaggtaaggtctcgacagactagagaagcacgagtgcaggtataagaaacagcaaaaaaaagtaatgggcccaggcctggagagggtatttgtcttgtttttctttggccaggaacttgttctcctttcttcgtttctaggaccccgatccccgctcgcatttctctcttcctcagccgaagcgcagcggtaaagcatccattttatcccaccgaaagggcgctcccagccttcgtcgagcggaaccggggttacagtgcctcaaccctcccagacgtagccagagggaagcaactccctgatgccaaccgctgtgggctgcccatcggaatctttgacaattgccttgatccccgggtgcaagtcaagcagcacctgccgacatcgcccgcacggagacagaatgccgcggttttcgttcccgatggccactatgcacgtcagatttccggcagcagccgcagcggccgttccgaggaccacgagctccgcgcatggccctccggtgaaatgatatacattcacgccggtaaagatccgaccgtcggacgagagggctgcactggccaccgagtagtcctcgctaataggtatgctgttgatggtcgcagttgcacgttcgatcagcgtggattcctcttgggataaaggcttggccatcgagctcggtacccggggatccatgattgttgtattatgtacctatgtttgtgatgagacaataaatatgagaagagaacgttgcggccacttttttctccttccttcgcgtgctcatgttggtggtttgggaggcagaagatgcatggagcgccacacattcggtaggacgaaacagcctcccccacaaagggaccatgggtagctaggatgacgcacaagcgagttcccgctctcgaagggaaacccaggcatttccttcctcttttcaagccacttgttcacgtgtcaacacaattttggactaaaatgcccctcggaactcggcaggcctccctctgctccgttgtcctggtcgccgagaacgcgagaccgtgccgcatgccatcgatctgctcgtctgtactactaatcgtgtgcgtgttcgtgcttgtttcgcacgaaattgtcctcgttcggccctcacaacggtggaaatcggtgctagaataaagtgaggtggcttatttcaatggcggccgtcatcatgcgggatcaactgaagtacggcgggttctcgagatttcatcgtgctcgtccagagcaggtgttttgcctgcagctcttcatgtttaggggtcatgatttcatctgatatgccgtaagaaaaccaatattcacttctcaattttccatggaaaggtgaaggcctaggttgtgtgcgaggcaacgactggggagggatcgcaacattcttgctaacctcccctctatcttggccgctgtgaatcggcatatttaccgggctgaattgagaaagtgttttgagggaattaaaaggtggctgtcttgcaagcttggcttcagtgcctgcttaattcgaaccgatccagcttgtgatgaggccttcctaagcctggtagtcagaagcgacatggcgctataaatttcgtctcagttggagagtagaaaagcatgattcgaacacggttttcaactgccaaagatatctccattgtttccttcaatctgtacacctgcacggtgcaccagttggtacggcatattatggtttaataagcatacatcatatgaatacaattcagcttaaatttatcatacaaagatgtaagtgcagcgtgggtctgtaacgatcgggcgtaatttaagataatgcgagggaccgggggaggttttggaacggaatgaggaatgggtcatggcccataataataatatgggtttggtcgcctcgcacagcaaccgtacgtgcgaaaaaggaacagatccatttaataagttgaacgttattctttcctatgcaatgcgtgtatcggaggcgagagcaagtcataggtggctgcgcacaataattgagtctcagctgagcgccgtccgcgggtggtgtgagtggtcatcctcctcccggcctatcgctcacatcgcctctcaatggtggtggtggggcctgatatgacctcaatgccgacccatattaaaacccagtaaagcattcaccaacgaacgaggggctcttttgtgtgtgttttgagtatgattttacacctctttgtgcatctctctggtcttccttggttcccgtagtttgggcatcatcactcacgcttccctcgaccttcgttcttcctttacaaccccgacacaggtcagagttggagtaatcaaaaaaggggtgcacgaatgagatacattagattttgacagatatccttttactggagagggttcaagggatcaaatgaacagcgggcgttggcaatctagggagggatcggaggttggcagcgagcgaaagcgtgtccatccttttggctgtcacacctcacgaaccaactgttagcaggccagcacagatgacatacgagaatctttattatatcgtagaccttatgtggatgacctttggtgctgtgtgtctggcaatgaacctgaaggcttgatagggaggtggctcccgtaaaccctttgtcctttccacgctgagtctcccccgcactgtcctttatacaaattgttacagtcatctgcaggcggtttttctttggcaggcaaagatgcccaagaaaaagcggaaggtcggcgactacaaggatgacgatgacaagttggagcctggagagaagccctacaaatgccctgagtgcggaaagagcttcagccaatctggagccttgacccggcatcaacgaacgcatacacgagacaagaagtactccatcgggctggacatcgggacgaactccgtgggatgggccgtgatcacagacgaatacaaggtgccttccaagaagttcaaggtgctggggaacacggacagacactccatcaagaagaacctcatcggggccttgctcttcgactccggagaaaccgccgaagcaacgcgattgaaaagaaccgccagaagacgatacacacgacggaagaaccgcatctgctacctccaggagatcttcagcaacgagatggccaaggtggacgactcgttctttcatcgcctggaggagagcttcctggtggaggaagacaagaaacatgagcgccacccgatcttcgggaacatcgtggacgaagtggcctaccacgagaaataccccacgatctaccacttgcgcaagaaactcgtggactccacggacaaagcggacttgcggttgatctacttggccttggcccacatgatcaaatttcggggccacttcctgatcgagggcgacttgaatcccgacaattccgacgtggacaagctcttcatccagctggtgcagacctacaaccagctcttcgaggagaaccccatcaatgcctccggagtggacgccaaagccatcttgtccgcccgattgtccaaatccagacgcttggagaacttgatcgcacaacttcctggcgagaagaagaacggcctcttcggcaacttgatcgcgctgtcgctgggattgacgcctaacttcaagtccaacttcgacttggccgaggacgccaagttgcaactgtccaaggacacctacgacgacgacctcgacaacctgctggcccaaattggcgaccaatacgcggacttgtttttggcggccaagaacttgagcgacgccatcttgttgagcgacatcttgcgcgtgaatacggagatcaccaaagcccctttgtccgcctctatgatcaagcggtacgacgagcaccaccaagacttgaccctgttgaaagccctcgtgcggcaacaattgcccgagaagtacaaggagatcttcttcgaccagtccaagaacgggtacgccggctacatcgacggaggagcctcccaagaagagttctacaagttcatcaagcccatcctggagaagatggacggcaccgaggagttgctcgtgaagctgaaccgcgaagacttgttgcgaaaacagcggacgttcgacaatggcagcatcccccaccaaatccatttgggagagttgcacgccatcttgcgacggcaagaggacttctacccgttcctgaaggacaaccgcgagaaaatcgagaagatcctgacgttcagaatcccctactacgtgggacccttggcccgaggcaattcccggtttgcatggatgacgcgcaaaagcgaagagacgatcaccccctggaacttcgaagaagtggtcgacaaaggagcatccgcacagagcttcatcgagcgaatgacgaacttcgacaagaacctgcccaacgagaaggtgttgcccaagcattcgctgctgtacgagtacttcacggtgtacaacgagctgaccaaggtgaagtacgtgaccgagggcatgcgcaaacccgcgttcctgtcgggagagcaaaagaaggccattgtggacctgctgttcaagaccaaccggaaggtgaccgtgaaacagctgaaagaggactacttcaagaagatcgagtgcttcgactccgtggagatctccggcgtggaggaccgattcaatgcctccttgggaacctaccatgacctcctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgaccctgttcgaggaccgagagatgatcgaggaacggttgaaaacgtacgcccacttgttcgacgacaaggtgatgaagcagctgaaacgccgccgctacaccggatggggacgattgagccgcaaactgattaatggaattcgcgacaagcaatccggaaagaccatcctggacttcctgaagtccgacgggttcgccaaccgcaacttcatgcagctcatccacgacgactccttgaccttcaaggaggacatccagaaggcccaagtgtccggacaaggagactccttgcacgagcacatcgccaatttggccggatcccccgcaatcaaaaaaggcatcttgcaaaccgtgaaagtggtcgacgaactggtgaaggtgatgggacggcacaagcccgagaacatcgtgatcgaaatggcccgcgagaaccaaaccacccaaaaaggacagaagaactcccgagagcgcatgaagcggatcgaagagggcatcaaggagttgggctcccagatcctgaaggagcatcccgtggagaatacccaattgcaaaacgagaagctctacctctactacctccagaacgggcgggacatgtacgtcgaccaagagctggacatcaaccgcctctccgactacgatgtggatcatattgtgccccagagcttcctcaaggacgacagcatcgacaacaaggtcctgacgcgcagcgacaagaaccggggcaagtctgacaatgtgccttccgaagaagtcgtgaagaagatgaagaactactggcggcagctgctcaacgccaagctcatcacccaacggaagttcgacaacctgaccaaggccgagagaggaggattgtccgagttggacaaagccggcttcattaaacgccaactcgtggagacccgccagatcacgaagcacgtggcccaaatcttggactcccggatgaacacgaaatacgacgagaatgacaagctgatccgcgaggtgaaggtgatcacgctgaagtccaagctggtgagcgacttccggaaggacttccagttctacaaggtgcgggagatcaacaactaccatcacgcccatgacgcctacctgaacgccgtggtcggaaccgccctgatcaagaaataccccaagctggagtccgaattcgtgtacggagattacaaggtctacgacgtgcggaagatgatcgcgaagtccgagcaggagatcggcaaagccaccgccaagtacttcttttactccaacatcatgaacttcttcaagaccgagatcacgctcgccaacggcgagatccgcaagcgccccctgatcgagaccaacggcgagacgggagagattgtgtgggacaaaggaagagattttgccacagtgcgcaaggtgctgtccatgcctcaggtgaacatcgtgaagaagaccgaggtgcaaacaggagggttttccaaagagtccattttgcctaagaggaattccgacaagctcatcgcccgcaagaaggactgggaccccaagaagtacgggggcttcgactcccccacggtggcctactccgtgttggtggtggccaaagtggagaaagggaagagcaagaagctgaaatccgtgaaggagttgctcggaatcacgatcatggaacgatcgtcgttcgagaaaaaccccatcgacttcctcgaagccaaagggtacaaagaggtgaagaaggacctgatcatcaagctgcccaagtactccctgttcgagctggagaacggccgcaagcggatgctggcctccgccggggaactgcagaaagggaacgaattggccttgccctccaaatacgtgaacttcctctacttggcctcccattacgaaaagctcaaaggatcccctgaggacaatgagcagaagcaactcttcgtggaacaacacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagcgcgtgatcctcgccgacgccaacctggacaaggtgctctccgcctacaacaagcaccgcgacaagcctatccgcgagcaagccgagaatatcattcacctgtttaccctgacgaatttgggagcccctgccgcctttaaatactttgacaccaccatcgaccgcaaaagatacacctccaccaaggaagtcttggacgccaccctcatccaccagtccatcacgggcctctacgagacgcgcatcgacctctcccaattgggcggcgactaaagtgatgcggcctttaggaaacaccacaaaagtaattgacaatctcaggaacgatctgcgtgtttacagcttcccaaataacaattataccacgtaccaaaaggggtttaatgtatctcacaaattcttctaataggtacagcttctcaaattgggtgtatgatgtgacacttcgtctcacacacgtcacgataattcagcgtatggcttcccttcatcacattcacgcaaacttctacacaaccctgggcatatttcttgtgttggcaacactcccgaaatcgattctgcacacaatggttcattcaatgattcaagtacgttttagacggactaggcagtttaattaaaaacatctatcctccagatcaccagggccagtgaggccggcataaaggacggcaaggaaagaaaagaaagaaagaaaaggacacttatagcatagtttgaagttataagtagtcgcaatctgtgtgcagccgacagatgctttttttttccgtttggcaggaggtgtagggatgtcgaagaccagtccagctagtatctatcctacaagtcaatcatgctgcgacaaaaatttctcgcacgaggcctctcgataaacaaaactttaaaagcacacttcattgtcatgcagagtaataactcttccgcgtcgatcaatttatcaatctctatcatttccgcccctttccttgcatagagcaagaaaagcgacccggatgaggataacatgtcctgcgccagtagtgtggcattgcctgtctctcatttacacgtactgaaagcataatgcacgcgcataccaatatttttcgtgtacggagatgaagagacgcgacacgtaagatcacgagaaggcgagcacggttgccaatggcagacgcgctagtctccattatcgcgttgttcggtagcttgctgcatgtcttcagtggcactatatccactctgcctcgtcttctacacgagggccacatcggtgcaagttcgaaaaatcatatctcaatcttcagatcctttccagaaacggtgctcaggcgggaaagtgaaggttttctactctagtggctaccccaattctctccgactgtcgcagacggtccttcgttgcgcacgcaccgcgcactacctctgaaattcgacaaccgaagttcaattttacatctaacttctttcccattctctcaccaaaagcctagcttacatgttggagagcgacgagagcggcctgcccgccatggagatcgagtgccgcatcaccggcaccctgaacggcgtggagttcgagctggtgggcggcggagagggcacccccgagcagggccgcatgaccaacaagatgaagagcaccaaaggcgccctgaccttcagcccctacctgctgagccacgtgatgggctacggcttctaccacttcggcacctaccccagcggctacgagaaccccttcctgcacgccatcaacaacggcggctacaccaacacccgcatcgagaagtacgaggacggcggcgtgctgcacgtgagcttcagctaccgctacgaggccggccgcgtgatcggcgacttcaaggtgatgggcaccggcttccccgaggacagcgtgatcttcaccgacaagatcatccgcagcaacgccaccgtggagcacctgcaccccatgggcgataacgatctggatggcagcttcacccgcaccttcagcctgcgcgacggcggctactacagctccgtggtggacagccacatgcacttcaagagcgccatccaccccagcatcctgcagaacgggggccccatgttcgccttccgccgcgtggaggaggatcacagcaacaccgagctgggcatcgtggagtaccagcacgccttcaagaccccggatgcagatgccggtgaagaataagggtgggaaggagtcggggagggtcctggcagagcggcgtcctcatgatgtgttggagacctggagagtcgagagcttcctcgtcacctgattgtcatgtgtgtataggttaagggggcccactcaaagccataaagacgaacacaaacactaatctcaacaaagtctactagcatgccgtctgtccatctttatttcctggcgcgcctatgcttgtaaaccgttttgtgaaaaaatttttaaaataaaaaaggggacctctagggtccccaattaattagtaatataatctattaaaggtcattcaaaaggtcatccagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaaga
SEQ ID NO:27
DNA
人工序列
针对微拟球藻进行密码子优化的酿脓链球菌CAS9基因
gacaagaagtactccatcgggctggacatcgggacgaactccgtgggatgggccgtgatcacagacgaatacaaggtgccttccaagaagttcaaggtgctggggaacacggacagacactccatcaagaagaacctcatcggggccttgctcttcgactccggagaaaccgccgaagcaacgcgattgaaaagaaccgccagaagacgatacacacgacggaagaaccgcatctgctacctccaggagatcttcagcaacgagatggccaaggtggacgactcgttctttcatcgcctggaggagagcttcctggtggaggaagacaagaaacatgagcgccacccgatcttcgggaacatcgtggacgaagtggcctaccacgagaaataccccacgatctaccacttgcgcaagaaactcgtggactccacggacaaagcggacttgcggttgatctacttggccttggcccacatgatcaaatttcggggccacttcctgatcgagggcgacttgaatcccgacaattccgacgtggacaagctcttcatccagctggtgcagacctacaaccagctcttcgaggagaaccccatcaatgcctccggagtggacgccaaagccatcttgtccgcccgattgtccaaatccagacgcttggagaacttgatcgcacaacttcctggcgagaagaagaacggcctcttcggcaacttgatcgcgctgtcgctgggattgacgcctaacttcaagtccaacttcgacttggccgaggacgccaagttgcaactgtccaaggacacctacgacgacgacctcgacaacctgctggcccaaattggcgaccaatacgcggacttgtttttggcggccaagaacttgagcgacgccatcttgttgagcgacatcttgcgcgtgaatacggagatcaccaaagcccctttgtccgcctctatgatcaagcggtacgacgagcaccaccaagacttgaccctgttgaaagccctcgtgcggcaacaattgcccgagaagtacaaggagatcttcttcgaccagtccaagaacgggtacgccggctacatcgacggaggagcctcccaagaagagttctacaagttcatcaagcccatcctggagaagatggacggcaccgaggagttgctcgtgaagctgaaccgcgaagacttgttgcgaaaacagcggacgttcgacaatggcagcatcccccaccaaatccatttgggagagttgcacgccatcttgcgacggcaagaggacttctacccgttcctgaaggacaaccgcgagaaaatcgagaagatcctgacgttcagaatcccctactacgtgggacccttggcccgaggcaattcccggtttgcatggatgacgcgcaaaagcgaagagacgatcaccccctggaacttcgaagaagtggtcgacaaaggagcatccgcacagagcttcatcgagcgaatgacgaacttcgacaagaacctgcccaacgagaaggtgttgcccaagcattcgctgctgtacgagtacttcacggtgtacaacgagctgaccaaggtgaagtacgtgaccgagggcatgcgcaaacccgcgttcctgtcgggagagcaaaagaaggccattgtggacctgctgttcaagaccaaccggaaggtgaccgtgaaacagctgaaagaggactacttcaagaagatcgagtgcttcgactccgtggagatctccggcgtggaggaccgattcaatgcctccttgggaacctaccatgacctcctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgaccctgttcgaggaccgagagatgatcgaggaacggttgaaaacgtacgcccacttgttcgacgacaaggtgatgaagcagctgaaacgccgccgctacaccggatggggacgattgagccgcaaactgattaatggaattcgcgacaagcaatccggaaagaccatcctggacttcctgaagtccgacgggttcgccaaccgcaacttcatgcagctcatccacgacgactccttgaccttcaaggaggacatccagaaggcccaagtgtccggacaaggagactccttgcacgagcacatcgccaatttggccggatcccccgcaatcaaaaaaggcatcttgcaaaccgtgaaagtggtcgacgaactggtgaaggtgatgggacggcacaagcccgagaacatcgtgatcgaaatggcccgcgagaaccaaaccacccaaaaaggacagaagaactcccgagagcgcatgaagcggatcgaagagggcatcaaggagttgggctcccagatcctgaaggagcatcccgtggagaatacccaattgcaaaacgagaagctctacctctactacctccagaacgggcgggacatgtacgtcgaccaagagctggacatcaaccgcctctccgactacgatgtggatcatattgtgccccagagcttcctcaaggacgacagcatcgacaacaaggtcctgacgcgcagcgacaagaaccggggcaagtctgacaatgtgccttccgaagaagtcgtgaagaagatgaagaactactggcggcagctgctcaacgccaagctcatcacccaacggaagttcgacaacctgaccaaggccgagagaggaggattgtccgagttggacaaagccggcttcattaaacgccaactcgtggagacccgccagatcacgaagcacgtggcccaaatcttggactcccggatgaacacgaaatacgacgagaatgacaagctgatccgcgaggtgaaggtgatcacgctgaagtccaagctggtgagcgacttccggaaggacttccagttctacaaggtgcgggagatcaacaactaccatcacgcccatgacgcctacctgaacgccgtggtcggaaccgccctgatcaagaaataccccaagctggagtccgaattcgtgtacggagattacaaggtctacgacgtgcggaagatgatcgcgaagtccgagcaggagatcggcaaagccaccgccaagtacttcttttactccaacatcatgaacttcttcaagaccgagatcacgctcgccaacggcgagatccgcaagcgccccctgatcgagaccaacggcgagacgggagagattgtgtgggacaaaggaagagattttgccacagtgcgcaaggtgctgtccatgcctcaggtgaacatcgtgaagaagaccgaggtgcaaacaggagggttttccaaagagtccattttgcctaagaggaattccgacaagctcatcgcccgcaagaaggactgggaccccaagaagtacgggggcttcgactcccccacggtggcctactccgtgttggtggtggccaaagtggagaaagggaagagcaagaagctgaaatccgtgaaggagttgctcggaatcacgatcatggaacgatcgtcgttcgagaaaaaccccatcgacttcctcgaagccaaagggtacaaagaggtgaagaaggacctgatcatcaagctgcccaagtactccctgttcgagctggagaacggccgcaagcggatgctggcctccgccggggaactgcagaaagggaacgaattggccttgccctccaaatacgtgaacttcctctacttggcctcccattacgaaaagctcaaaggatcccctgaggacaatgagcagaagcaactcttcgtggaacaacacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagcgcgtgatcctcgccgacgccaacctggacaaggtgctctccgcctacaacaagcaccgcgacaagcctatccgcgagcaagccgagaatatcattcacctgtttaccctgacgaatttgggagcccctgccgcctttaaatactttgacaccaccatcgaccgcaaaagatacacctccaccaaggaagtcttggacgccaccctcatccaccagtccatcacgggcctctacgagacgcgcatcgacctctcccaattgggcggcgac
SEQ ID NO:28
DNA
人工序列
编码NLS、FLAG标签、连接子
atgcccaagaaaaagcggaaggtcggcgactacaaggatgacgatgacaagttggagcctggagagaagccctacaaatgccctgagtgcggaaagagcttcagccaatctggagccttgacccggcatcaacgaacgcatacacga
SEQ ID NO:29
DNA
迦得拟微球藻
RPL24启动子
aataagcatacatcatatgaatacaattcagcttaaatttatcatacaaagatgtaagtgcagcgtgggtctgtaacgatcgggcgtaatttaagataatgcgagggaccgggggaggttttggaacggaatgaggaatgggtcatggcccataataataatatgggtttggtcgcctcgcacagcaaccgtacgtgcgaaaaaggaacagatccatttaataagttgaacgttattctttcctatgcaatgcgtgtatcggaggcgagagcaagtcataggtggctgcgcacaataattgagtctcagctgagcgccgtccgcgggtggtgtgagtggtcatcctcctcccggcctatcgctcacatcgcctctcaatggtggtggtggggcctgatatgacctcaatgccgacccatattaaaacccagtaaagcattcaccaacgaacgaggggctcttttgtgtgtgttttgagtatgattttacacctctttgtgcatctctctggtcttccttggttcccgtagtttgggcatcatcactcacgcttccctcgaccttcgttcttcctttacaaccccgacacaggtcagagttggagtaatcaaaaaaggggtgcacgaatgagatacattagattttgacagatatccttttactggagagggttcaagggatcaaatgaacagcgggcgttggcaatctagggagggatcggaggttggcagcgagcgaaagcgtgtccatccttttggctgtcacacctcacgaaccaactgttagcaggccagcacagatgacatacgagaatctttattatatcgtagaccttatgtggatgacctttggtgctgtgtgtctggcaatgaacctgaaggcttgatagggaggtggctcccgtaaaccctttgtcctttccacgctgagtctcccccgcactgtcctttatacaaattgttacagtcatctgcaggcggtttttctttggcaggcaaag
SEQ ID NO:30
DNA
迦得拟微球藻
双向终止子2
agtgatgcggcctttaggaaacaccacaaaagtaattgacaatctcaggaacgatctgcgtgtttacagcttcccaaataacaattataccacgtaccaaaaggggtttaatgtatctcacaaattcttctaataggtacagcttctcaaattgggtgtatgatgtgacacttcgtctcacacacgtcacgataattcagcgtatggcttcccttcatcacattcacgcaaacttctacacaaccctgggcatatttcttgtgttggcaacactcccgaaatcgattctgcacacaatggttcattcaatgattcaa
SEQ ID NO:31
DNA
人工序列
针对迦得拟微球藻进行密码子优化的土曲霉菌BLAST基因
atggccaagcctttatcccaagaggaatccacgctgatcgaacgtgcaactgcgaccatcaacagcatacctattagcgaggactactcggtggccagtgcagccctctcgtccgacggtcggatctttaccggcgtgaatgtatatcatttcaccggagggccatgcgcggagctcgtggtcctcggaacggccgctgcggctgctgccggaaatctgacgtgcatagtggccatcgggaacgaaaaccgcggcattctgtctccgtgcgggcgatgtcggcaggtgctgcttgacttgcacccggggatcaaggcaattgtcaaagattccgatgggcagcccacagcggttggcatcagggagttgcttccctctggctacgtctgggagggttga
SEQ ID NO:32
DNA
迦得拟微球藻
TCTP启动子
cgtgcaggtgtacagattgaaggaaacaatggagatatctttggcagttgaaaaccgtgttcgaatcatgcttttctactctccaactgagacgaaatttatagcgccatgtcgcttctgactaccaggcttaggaaggcctcatcacaagctggatcggttcgaattaagcaggcactgaagccaagcttgcaagacagccaccttttaattccctcaaaacactttctcaattcagcccggtaaatatgccgattcacagcggccaagatagaggggaggttagcaagaatgttgcgatccctccccagtcgttgcctcgcacacaacctaggccttcacctttccatggaaaattgagaagtgaatattggttttcttacggcatatcagatgaaatcatgacccctaaacatgaagagctgcaggcaaaacacctgctctggacgagcacgatgaaatctcgagaacccgccgtacttcagttgatcccgcatgatgacggccgccattgaaataagccacctcactttattctagcaccgatttccaccgttgtgagggccgaacgaggacaatttcgtgcgaaacaagcacgaacacgcacacgattagtagtacagacgagcagatcgatggcatgcggcacggtctcgcgttctcggcgaccaggacaacggagcagagggaggcctgccgagttccgaggggcattttagtccaaaattgtgttgacacgtgaacaagtggcttgaaaagaggaaggaaatgcctgggtttcccttcgagagcgggaactcgcttgtgcgtcatcctagctacccatggtccctttgtgggggaggctgtttcgtcctaccgaatgtgtggcgctccatgcatcttctgcctcccaaaccaccaacatgagcacgcgaaggaaggagaaaaaagtggccgcaacgttctcttctcatatttattgtctcatcacaaacataggtacataatacaacaatc
SEQ ID NO:33
DNA
迦得拟微球藻
EIF3终止子
Ggcactgtaaccccggttccgctcgacgaaggctgggagcgccctttcggtgggataaaatggatgctttaccgctgcgcttcggctgaggaagagagaaatgcgagcggggatcggggtcctagaaacgaagaaaggagaacaagttcctggccaaagaaaaacaagacaaataccctctccaggcctgggcccattacttttttttgctgtttcttatacctgcactcgtgcttctctagtctgtcgagaccttacctgatcttcctccctccatcgctccccgccccccccatccgagcaaccgtcgaccatacg
SEQ ID NO:34
DNA
人工序列
针对迦得拟微球藻进行密码子优化的TurboGFP基因
atgttggagagcgacgagagcggcctgcccgccatggagatcgagtgccgcatcaccggcaccctgaacggcgtggagttcgagctggtgggcggcggagagggcacccccgagcagggccgcatgaccaacaagatgaagagcaccaaaggcgccctgaccttcagcccctacctgctgagccacgtgatgggctacggcttctaccacttcggcacctaccccagcggctacgagaaccccttcctgcacgccatcaacaacggcggctacaccaacacccgcatcgagaagtacgaggacggcggcgtgctgcacgtgagcttcagctaccgctacgaggccggccgcgtgatcggcgacttcaaggtgatgggcaccggcttccccgaggacagcgtgatcttcaccgacaagatcatccgcagcaacgccaccgtggagcacctgcaccccatgggcgataacgatctggatggcagcttcacccgcaccttcagcctgcgcgacggcggctactacagctccgtggtggacagccacatgcacttcaagagcgccatccaccccagcatcctgcagaacgggggccccatgttcgccttccgccgcgtggaggaggatcacagcaacaccgagctgggcatcgtggagtaccagcacgccttcaagaccccggatgcagatgccggtgaagaataa
SEQ ID NO:35
DNA
迦得拟微球藻
4A-III启动子
ggcataaaggacggcaaggaaagaaaagaaagaaagaaaaggacacttatagcatagtttgaagttataagtagtcgcaatctgtgtgcagccgacagatgctttttttttccgtttggcaggaggtgtagggatgtcgaagaccagtccagctagtatctatcctacaagtcaatcatgctgcgacaaaaatttctcgcacgaggcctctcgataaacaaaactttaaaagcacacttcattgtcatgcagagtaataactcttccgcgtcgatcaatttatcaatctctatcatttccgcccctttccttgcatagagcaagaaaagcgacccggatgaggataacatgtcctgcgccagtagtgtggcattgcctgtctctcatttacacgtactgaaagcataatgcacgcgcataccaatatttttcgtgtacggagatgaagagacgcgacacgtaagatcacgagaaggcgagcacggttgccaatggcagacgcgctagtctccattatcgcgttgttcggtagcttgctgcatgtcttcagtggcactatatccactctgcctcgtcttctacacgagggccacatcggtgcaagttcgaaaaatcatatctcaatcttcagatcctttccagaaacggtgctcaggcgggaaagtgaaggttttctactctagtggctaccccaattctctccgactgtcgcagacggtccttcgttgcgcacgcaccgcgcactacctctgaaattcgacaaccgaagttcaattttacatctaacttctttcccattctctcaccaaaagcctagcttac
SEQ ID NO:36
DNA
迦得拟微球藻
双向终止子5
gggtgggaaggagtcggggagggtcctggcagagcggcgtcctcatgatgtgttggagacctggagagtcgagagcttcctcgtcacctgattgtcatgtgtgtataggttaagggggcccactcaaagccataaagacgaacacaaacactaatctcaacaaagtctactagcatgccgtctgtccatctttatttcct
SEQ ID NO:37
DNA
人工序列
HygR盒
tcataatcaaagatgagccagccacgaagctaccggagaattctgtaagaaaaatgtttaaagttgaaaatgctaacagtgaagtgatatccttttttaatggagtgttgaggtgaagtctagcatcgtaggggaaaacaggattctgtgtcttccattctactccttgataaagcgaagaaatccgacaaaaccaaagagattgttcaagtttaagatttgtaagcgtacaactatgaacttcttctctttgtaggcctgagtggtcgtatgcatacgattcatgaagtgaatcagtatcgctggattttgcttaggagtaaagcacaactaagaaaatatgctgcctggcaggcatcctgagacatgaggcaagcgacgtagcaattgaatcctaatttaagccagggcatctgtatgactctgttagttaattgatgaaccaatgagctttaaaaaaaaatcgttgcgcgtaatgtagttttaattctccgccttgaggtgcggggccatttcggacaaggttctttggacggagatggcagcatgtgtcccttctccaaattggtccgtgtggtagttgagatgctgccttaaaattctgctcggtcatcctgccttcgcattcactcctttcgagctgtcgggttcctcacgaggcctccgggagcggattgcgcagaaaggcgacccggagacacagagaccatacaccgactaaattgcactggacgatacggcatggcgacgacgatggccaagcattgctacgtgattattcgccttgtcattcagggagaaatgatgacatgtgtgggacggtctttacatgggaagagggcatgaaaataacatggcctggcgggatggagcgtcacacctgtgtatgcgttcgatccacaagcaactcaccatttgcgtcggggcctgtctccaatctgctttaggctacttttctctaatttagcctattctatacagacagagacacacagggatcatggggaagaaaccggaactgaccgctacgtccgtggagaaattccttattgagaagttcgactctgtctccgacttgatgcaactgagcgagggagaggagagtagggcgttctcgtttgacgtagggggtcggggatacgtgttgagggttaatagttgtgcggacgggttctacaaggatcggtatgtctaccgtcatttcgcctccgccgctctccccataccagaggtactggacattggggagtttagcgaatctctcacgtactgcatctcgcgccgagcccagggagtgacgttgcaagatctgcccgaaactgaattgcctgccgttttgcaacccgtggccgaggccatggacgcgatcgctgccgcagatctgtctcagacgtccggctttggaccttttgggccccagggcatcgggcagtacacgacctggcgagacttcatctgcgccattgccgatcctcacgtctatcattggcagacagtcatggatgacaccgtgtctgcatccgtggcccaagcactggacgaactcatgttgtgggccgaggattgccctgaggtcaggcacctggtgcacgcggatttcggcagcaataacgtacttacagacaatggtcggattactgctgtcatcgactggtccgaagcgatgtttggtgatagccaatacgaagtggcgaacatattcttctggcgtccctggttggcgtgcatggagcagcagacacgctactttgaacggaggcacccggagctggccggctccccacgactccgcgcctatatgttgcgtatcggactcgatcagctttaccagtctctcgtcgacggcaacttcgacgacgccgcgtgggcgcagggccgctgcgacgcgatagtccgcagcggggctgggacggtgggtcggacccaaatcgcacgccggtcggctgcggtgtggacagacggctgtgttgaggtgcttgcggactcgggcaaccgtaggccgagcacccgaccgcgtgcaaaggagtgattgaatcattgaatgaaccattgtgtgcagaatcgatttcgggagtgttgccaacacaagaaatatgcccagggttgtgtagaagtttgcgtgaatgtgatgaagggaagccatacgctgaattatcgtgacgtgtgtgagacgaagtgtcacatcatacacccaatttgagaagctgtacctattagaagaatttgtgagatacattaaaccccttttggtacgtggtataattgttatttgggaagctgtaaacacgcagatcgttcctgagattgtcaattacttttgtggtgtttcctaaaggccgcatcact
SEQ ID NO:38
DNA
迦得拟微球藻
靶向TrifuncB的靶引导序列(加下划线的PAM序列)
GGCTTGGCGTCCAAAGCCGCCGG
SEQ ID NO:39
DNA
人工序列
针对微拟球藻进行密码子优化的潮霉素抗性基因
atggggaagaaaccggaactgaccgctacgtccgtggagaaattccttattgagaagttcgactctgtctccgacttgatgcaactgagcgagggagaggagagtagggcgttctcgtttgacgtagggggtcggggatacgtgttgagggttaatagttgtgcggacgggttctacaaggatcggtatgtctaccgtcatttcgcctccgccgctctccccataccagaggtactggacattggggagtttagcgaatctctcacgtactgcatctcgcgccgagcccagggagtgacgttgcaagatctgcccgaaactgaattgcctgccgttttgcaacccgtggccgaggccatggacgcgatcgctgccgcagatctgtctcagacgtccggctttggaccttttgggccccagggcatcgggcagtacacgacctggcgagacttcatctgcgccattgccgatcctcacgtctatcattggcagacagtcatggatgacaccgtgtctgcatccgtggcccaagcactggacgaactcatgttgtgggccgaggattgccctgaggtcaggcacctggtgcacgcggatttcggcagcaataacgtacttacagacaatggtcggattactgctgtcatcgactggtccgaagcgatgtttggtgatagccaatacgaagtggcgaacatattcttctggcgtccctggttggcgtgcatggagcagcagacacgctactttgaacggaggcacccggagctggccggctccccacgactccgcgcctatatgttgcgtatcggactcgatcagctttaccagtctctcgtcgacggcaacttcgacgacgccgcgtgggcgcagggccgctgcgacgcgatagtccgcagcggggctgggacggtgggtcggacccaaatcgcacgccggtcggctgcggtgtggacagacggctgtgttgaggtgcttgcggactcgggcaaccgtaggccgagcacccgaccgcgtgcaaaggagtga
SEQ ID NO:40
DNA
迦得拟微球藻
EIF3启动子
tcataatcaaagatgagccagccacgaagctaccggagaattctgtaagaaaaatgtttaaagttgaaaatgctaacagtgaagtgatatccttttttaatggagtgttgaggtgaagtctagcatcgtaggggaaaacaggattctgtgtcttccattctactccttgataaagcgaagaaatccgacaaaaccaaagagattgttcaagtttaagatttgtaagcgtacaactatgaacttcttctctttgtaggcctgagtggtcgtatgcatacgattcatgaagtgaatcagtatcgctggattttgcttaggagtaaagcacaactaagaaaatatgctgcctggcaggcatcctgagacatgaggcaagcgacgtagcaattgaatcctaatttaagccagggcatctgtatgactctgttagttaattgatgaaccaatgagctttaaaaaaaaatcgttgcgcgtaatgtagttttaattctccgccttgaggtgcggggccatttcggacaaggttctttggacggagatggcagcatgtgtcccttctccaaattggtccgtgtggtagttgagatgctgccttaaaattctgctcggtcatcctgccttcgcattcactcctttcgagctgtcgggttcctcacgaggcctccgggagcggattgcgcagaaaggcgacccggagacacagagaccatacaccgactaaattgcactggacgatacggcatggcgacgacgatggccaagcattgctacgtgattattcgccttgtcattcagggagaaatgatgacatgtgtgggacggtctttacatgggaagagggcatgaaaataacatggcctggcgggatggagcgtcacacctgtgtatgcgttcgatccacaagcaactcaccatttgcgtcggggcctgtctccaatctgctttaggctacttttctctaatttagcctattctatacagacagagacacacagggatc
SEQ ID NO:41
DNA
合成的
5'ID序列
tccacagcccgaacccatgagagagaa
SEQ ID NO:42
DNA
合成的
3'ID序列
gcccgaatcgagttgatggcccgcaaa
SEQ ID NO:43
DNA
人工序列
具有侧接ID序列的HygR盒
tccacagcccgaacccatgagagagaatcataatcaaagatgagccagccacgaagctaccggagaattctgtaagaaaaatgtttaaagttgaaaatgctaacagtgaagtgatatccttttttaatggagtgttgaggtgaagtctagcatcgtaggggaaaacaggattctgtgtcttccattctactccttgataaagcgaagaaatccgacaaaaccaaagagattgttcaagtttaagatttgtaagcgtacaactatgaacttcttctctttgtaggcctgagtggtcgtatgcatacgattcatgaagtgaatcagtatcgctggattttgcttaggagtaaagcacaactaagaaaatatgctgcctggcaggcatcctgagacatgaggcaagcgacgtagcaattgaatcctaatttaagccagggcatctgtatgactctgttagttaattgatgaaccaatgagctttaaaaaaaaatcgttgcgcgtaatgtagttttaattctccgccttgaggtgcggggccatttcggacaaggttctttggacggagatggcagcatgtgtcccttctccaaattggtccgtgtggtagttgagatgctgccttaaaattctgctcggtcatcctgccttcgcattcactcctttcgagctgtcgggttcctcacgaggcctccgggagcggattgcgcagaaaggcgacccggagacacagagaccatacaccgactaaattgcactggacgatacggcatggcgacgacgatggccaagcattgctacgtgattattcgccttgtcattcagggagaaatgatgacatgtgtgggacggtctttacatgggaagagggcatgaaaataacatggcctggcgggatggagcgtcacacctgtgtatgcgttcgatccacaagcaactcaccatttgcgtcggggcctgtctccaatctgctttaggctacttttctctaatttagcctattctatacagacagagacacacagggatcatggggaagaaaccggaactgaccgctacgtccgtggagaaattccttattgagaagttcgactctgtctccgacttgatgcaactgagcgagggagaggagagtagggcgttctcgtttgacgtagggggtcggggatacgtgttgagggttaatagttgtgcggacgggttctacaaggatcggtatgtctaccgtcatttcgcctccgccgctctccccataccagaggtactggacattggggagtttagcgaatctctcacgtactgcatctcgcgccgagcccagggagtgacgttgcaagatctgcccgaaactgaattgcctgccgttttgcaacccgtggccgaggccatggacgcgatcgctgccgcagatctgtctcagacgtccggctttggaccttttgggccccagggcatcgggcagtacacgacctggcgagacttcatctgcgccattgccgatcctcacgtctatcattggcagacagtcatggatgacaccgtgtctgcatccgtggcccaagcactggacgaactcatgttgtgggccgaggattgccctgaggtcaggcacctggtgcacgcggatttcggcagcaataacgtacttacagacaatggtcggattactgctgtcatcgactggtccgaagcgatgtttggtgatagccaatacgaagtggcgaacatattcttctggcgtccctggttggcgtgcatggagcagcagacacgctactttgaacggaggcacccggagctggccggctccccacgactccgcgcctatatgttgcgtatcggactcgatcagctttaccagtctctcgtcgacggcaacttcgacgacgccgcgtgggcgcagggccgctgcgacgcgatagtccgcagcggggctgggacggtgggtcggacccaaatcgcacgccggtcggctgcggtgtggacagacggctgtgttgaggtgcttgcggactcgggcaaccgtaggccgagcacccgaccgcgtgcaaaggagtgattgaatcattgaatgaaccattgtgtgcagaatcgatttcgggagtgttgccaacacaagaaatatgcccagggttgtgtagaagtttgcgtgaatgtgatgaagggaagccatacgctgaattatcgtgacgtgtgtgagacgaagtgtcacatcatacacccaatttgagaagctgtacctattagaagaatttgtgagatacattaaaccccttttggtacgtggtataattgttatttgggaagctgtaaacacgcagatcgttcctgagattgtcaattacttttgtggtgtttcctaaaggccgcatcactgcccgaatcgagttgatggcccgcaaa
SEQ ID NO:44
DNA
迦得拟微球藻
靶向PXA1的靶引导序列(在基因的非编码链上,PAM加下划线)
GGGGTCTGGCACCTGCCGTCAGG
SEQ ID NO:45
DNA
迦得拟微球藻
靶向ACO1的靶引导序列(PAM加下划线)
GGCGAGGACGACGCATACCATGG
SEQ ID NO:46
DNA
迦得拟微球藻
靶向ICL的靶引导序列(在基因的非编码链上,PAM加下划线)
GGCAGGTTCGACCAGGAGGCTGG
SEQ ID NO:47
DNA
迦得拟微球藻
用于检测TrifuncB基因座处的供体片段插入的正向引物
GGCTTGGCGTCCAAAGCCGCCGG
SEQ ID NO:48
DNA
迦得拟微球藻
用于检测TrifuncB基因座处的供体片段插入的反向引物
GGCGAATTTCTGTAGGTCCACG
SEQ ID NO:49
DNA
迦得拟微球藻
用于检测PXA1基因座处的供体片段插入的正向引物
GCTTGTGTAGGTCGTGACCTGGAAGGC
SEQ ID NO:50
DNA
迦得拟微球藻
用于检测PXA1基因座处的供体片段插入的反向引物
CCGACCTCGTCAAAGCATCGGC
SEQ ID NO:51
DNA
迦得拟微球藻
用于检测AOC1基因座处的供体片段插入的正向引物
TCAAAGATCATTTAGCAGAGA
SEQ ID NO:52
DNA
迦得拟微球藻
用于检测AOC1基因座处的供体片段插入的反向引物
AGTCGAGAGATGGTGCGTTCA
SEQ ID NO:53
DNA
迦得拟微球藻
用于检测ICL基因座处的供体片段插入的正向引物
GGACTTTCCATGCGACATAGCTTTC
SEQ ID NO:54
DNA
迦得拟微球藻
用于检测ICL基因座处的供体片段插入的反向引物
CATCTGCACCACCTGAACGG
SEQ ID NO:55
DNA
人工的
针对微拟球藻进行密码子优化的博来霉素抗性基因
ATGGCCAAGCTGACCAGCGCCGTTCCGGTGCTCACCGCGCGCGACGTCGCCGGAGCGGTCGAGTTCTGGACCGACCGGCTCGGGTTCTCCCGGGACTTCGTGGAGGACGACTTCGCCGGTGTGGTCCGGGACGACGTGACCCTGTTCATCAGCGCGGTCCAGGACCAGGTGGTGCCGGACAACACCCTGGCCTGGGTGTGGGTGCGCGGCCTGGACGAGCTGTACGCCGAGTGGTCGGAGGTCGTGTCCACGAACTTCCGGGACGCCTCCGGGCCGGCCATGACCGAGATCGGCGAGCAGCCGTGGGGGCGGGAGTTCGCCCTGCGCGACCCGGCCGGCAACTGCGTGCACTTCGTGGCCGAGGAGCAGGACTAA
SEQ ID NO:56
DNA
三角褐指藻
GAPDH启动子
GGATTTGCCTCCCATGCGCGGAAAGTTTGCACAGAGCCAGCTACAGCAATGTCAATTTCTTTTGCAGTGGTTGGCACGGGTTGATGGGCTGCACTATCGATATTGCTGTCAATGGCTGTGCTTTGGTTTGACATCGGTGCTGTGCGACGTTTGGCCATGCGCTCGGCCATTCTGTTTTTTCGAATATGCAAAGTTGTCTCTTCCCGAGATCGACGACCGTCTTCAGCTGACACGGTCTTCTTAAATGACGCATCACGACGAGGAACTAAAGCCGCCCAGGTATACAATTGTGGCATTAGAGACTGAATACAATGCCTCGAATAGCGGAGATACTAAGGGCCGTTATTTCGTACCTGCGGCGACTAGGGTCATGATTGTATCTCTAAGAACAACAAGGGAAATTTCTGATCAAGGTCGACGGGTAAAAGGCGGAACAAGAATAAAAGGATGGTGATACGGAACAGAGCAACGCTACAGAAAAGTGAGGATCGCCAACCATCAAGTTGTGGCGATGCGATACTTTTTGCGATAACGTCTCGCGCTCTATGATTTTCTTTGTTATATTAATTTGTTCAACATGAGCTAATTAACCGAAACCTTATGCCTCAACTGCCGACTCAGCACAAGTACCTAACTTTGCAAGGTTTTGTCGTATACGTCTGTCCATAGAACGTTGACTAATGTAAGAGGAAGATTTTTGTGGACGTTGTGCGCTTGACATCCATTGGTTGATGTGGTTTTGCTGATGTCACGGCATCCTGAGTCCCCTAACGTTTCACTTGGCGCCTCGCAGCTGTTTGCAGTTCGCTCGGTATCTTTTTCTAGGATCTTCCGCAGATTTGAAGTTCGCATCGAAACCATTCCTGTCGTGGAAAAAAGGCCTGGATCGCATCTTGCAGGTGCAACGCTAATTCTTCTCCATTCATAAAAACAGAACTCGTAGAAAACGATTCAAATCTTTTTTCGCCTTTCTAAACATCAGTAATTCTATCAAATTCTA
SEQ ID NO:57
DNA
假微型海链藻
α微管蛋白终止子
TCACTCTGTCGCGCTGTTGGCGCCACTACTTTGGGGGTACGAGTTTAGGCTGCCTTGGCTGGGATAAAGAATGATAAGTTTACATAATTTGTATTGGAAATCCATCGAGTTTTGGATTCAGTTGACGTCTCCTGCGTTACTATGTCTTCATTCTCTCCAGTATCAATGCCTATGGTTCGTCGACATTGAGCACATTTCTTTCATCAGCGCGATGCATGCAATCATCACTTCGCAATCTTGACAAACATCCTCAATGATTCCTCCACCTCTCCCAACAAAGTCAATGCATTCATCCTTGGATCTTCTCCTCCACCGAACGGCCGTGAAGCCGACTCCATTAGTGCATCCAGTCCATCAAAATACCGTATGAATTCCCGAAAAGATTCACTTGCCAAGTACTGTTTGTCATCCTCCTCTTCAGGTATCTCATCAATGAGTGCATTTGCAGCTATACGAATCTTTGACTCGGAAATCAATCC
序列表
<110> 合成基因组股份有限公司(SYNTHETIC GENOMICS, INC.)
MOELLERING , Eric R.
CARLSON , Tom
<120> 具有增加的脂质产生的微生物和组合物及其制备和使用方法
<130> SGI2190-1WO
<150> US 62/702,253
<151> 2018-07-23
<160> 57
<170> PatentIn版本3.5
<210> 1
<211> 756
<212> PRT
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncA氨基酸序列
<400> 1
Met Leu Arg Leu Ala Ser Ala Arg Ala Ser Leu Arg Leu Asn Gly Leu
1 5 10 15
Gly Ala Phe Gln Gly Thr Ala Thr Cys Pro Ser Phe Leu Lys Arg Ala
20 25 30
Ser Leu Ser Thr Arg Gly Gln Tyr Phe Ala Pro Val Glu Val Lys Asp
35 40 45
Gly Val Ala Ile Ile Arg Ile Asp Gly Pro Gly Lys Met Asn Thr Ile
50 55 60
Asp Asp Asn Phe Arg Gln Glu Ile Asp Ala Leu Trp Thr Asp Lys Val
65 70 75 80
Ala Asn Asp Ala Ser Val Lys Ala Ala Val Ile Ile Ser Ala Lys Pro
85 90 95
Asp Asn Phe Ile Ala Gly Ala Asp Ile Lys Phe Ile Asp Ser Val Glu
100 105 110
Asp Phe Ala Ser Leu Lys Asp Val Cys Leu Lys Gly His Ala Thr Phe
115 120 125
Gln Lys Ile Arg Lys Ala Asn Lys Pro Leu Val Ala Ala Ile His Gly
130 135 140
Pro Ala Leu Gly Gly Gly Leu Glu Val Ala Leu Tyr Cys Asp Tyr Arg
145 150 155 160
Ile Val Thr Ser Ser Pro Lys Thr Val Leu Gly Leu Pro Glu Val Lys
165 170 175
Leu Gly Leu Leu Pro Gly Phe Gly Gly Thr Gln Asn Leu His Pro Ile
180 185 190
Val Gly Leu Gln Ala Ala Leu Asp Met Thr Leu Thr Gly Lys Asn Ile
195 200 205
Arg Pro Asp Lys Ala Lys Lys Met Gly Leu Ala Asp Val Val Val Asp
210 215 220
Pro Ala Ala Leu Glu Thr Val Ala Val Glu Thr Ala Arg Ala Leu Ala
225 230 235 240
Glu Gly Ser Leu Lys Gly Lys Arg Lys Gly Lys Gly Leu Leu Gln Lys
245 250 255
Val Leu Glu Asp Thr Ser Met Gly Arg Ser Ile Val Tyr Gly Gln Thr
260 265 270
Glu Lys Met Val Ala Lys Asn Thr Gly Gly His Tyr Pro Ala Pro Thr
275 280 285
Ala Ile Leu Asp Thr Ile Lys Tyr Gly Phe Thr His Ser Lys Pro Gln
290 295 300
Ala Leu Glu Tyr Glu Ala Thr Arg Phe Ala Glu Leu Ala Ala Thr Ser
305 310 315 320
Val Ser Ala Ala Leu Arg Gly Ile Phe Thr Gly Thr Thr Ala Leu Lys
325 330 335
Gln Ser Lys Tyr Gly Lys Pro Ala Asn Pro Val Glu Thr Val Ala Val
340 345 350
Val Gly Ala Gly Leu Met Gly Ala Gly Ile Ala Gln Val Thr Ala Glu
355 360 365
Lys Gly Tyr Arg Val Leu Leu Lys Asp Lys Asp Leu Ala Gly Val Ser
370 375 380
Arg Gly Glu Lys Tyr Ile Ser Asp Asn Leu Lys Gly Lys Met Lys Lys
385 390 395 400
Lys Arg Met Thr Lys Tyr Ala Tyr Asp Thr Thr Thr Ser Arg Val Val
405 410 415
Gly Leu Thr Asp Glu Ser Ala Asn Trp Gly Lys Gln Phe Gly Lys Ala
420 425 430
Asp Met Val Ile Glu Ala Val Phe Glu Asp Leu Ser Leu Lys His Lys
435 440 445
Val Ile Gln Gln Leu Glu Glu His Leu Pro Pro His Ala Val Phe Ala
450 455 460
Ser Asn Thr Ser Ala Ile Pro Ile Ala Arg Ile Ala Glu Ala Ser Gln
465 470 475 480
Arg Pro Glu Asn Val Ile Gly Met His Tyr Phe Ser Pro Val Pro Gln
485 490 495
Met Pro Leu Leu Glu Ile Ile Pro His Lys Gly Thr Ser Lys Glu Ala
500 505 510
Ala Ala Ala Ala Phe Glu Val Gly Lys Lys Gln Gly Lys Thr Val Ile
515 520 525
Phe Val Lys Asp Val Pro Gly Phe Tyr Val Asn Arg Cys Leu Gly Pro
530 535 540
Tyr Leu Val Glu Thr Gly Ala Leu Met Glu Ala Gly Val Pro Leu Glu
545 550 555 560
Gln Leu Asp Lys Ala Ile Lys Ala Tyr Gly Phe Pro Val Gly Pro Ile
565 570 575
Thr Leu Ala Asp Glu Val Gly Val Asp Val Ala Ala His Val Gln Ala
580 585 590
Phe Leu Ser Lys Ala Asp Leu Gly Val Arg Met Gly Gly Ser Asp Gly
595 600 605
Pro Ile Leu Asp Ala Leu Leu Lys Ala Lys Leu Leu Gly Arg Lys Ala
610 615 620
Gly Lys Gly Phe Tyr Thr Tyr Pro Ala Gly Gly Lys Lys Glu Lys Gly
625 630 635 640
Pro Lys Thr Leu Asn Pro Glu Ala Thr Ser Leu Val Gln Lys His Val
645 650 655
Lys Gly Glu Ser Lys Leu Thr Asp Glu Glu Val Gln Asn Arg Leu Val
660 665 670
Ser Arg Phe Val Asn Glu Ala Val Phe Ala Leu Gln Asp Gly Val Ile
675 680 685
Ala Ser Pro Val Glu Gly Asp Ile Gly Ala Val Phe Gly Ile Gly Phe
690 695 700
Pro Pro Phe Leu Gly Gly Pro Phe Arg Leu Ile Asp Ala Leu Gly Ala
705 710 715 720
Gly Lys Tyr Cys Ser Met Leu Glu Gly Phe Ala Gly Lys Tyr Gly Glu
725 730 735
Gln Phe Ala Pro Ala Pro Leu Leu Val Glu His Ala Lys Ser Gly Lys
740 745 750
Lys Phe His Gln
755
<210> 2
<211> 2271
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncA cDNA
<400> 2
atgctccgct tggcgtcggc acgggcatcg ctgcggctga atggcttggg tgcttttcaa 60
ggcaccgcca cgtgcccctc cttcttgaaa cgcgccagtc tctccacgcg cgggcagtat 120
ttcgcgcccg tggaagtgaa ggacggggtc gcaatcattc gtattgatgg gccggggaag 180
atgaacacga ttgacgacaa ttttcgccaa gagatcgatg cattgtggac ggacaaggtt 240
gcaaatgacg cgagtgtcaa ggcggccgtg ataatttctg caaagcccga caatttcatc 300
gcaggagccg atatcaaatt catcgactcg gtggaagact tcgcgagcct taaagacgtc 360
tgcctcaagg gacacgccac cttccagaag attcgaaagg ccaacaagcc cttggttgcc 420
gccattcatg ggcccgccct tggcggcggt ctggaagtgg ccctgtactg cgactaccgc 480
atcgtcacct cctcccccaa gacggtgctg ggtctccccg aggtgaagct cggcctcttg 540
ccgggcttcg ggggcactca gaacctccac cctatcgtcg gcttgcaggc ggccctggac 600
atgacgctga cagggaagaa catccgcccg gacaaggcca agaagatggg cctggcggac 660
gtggtggtgg accccgccgc gttggagacc gtggcggttg agacggcccg cgccttggcc 720
gagggttcgc tgaaagggaa gaggaagggc aaggggctcc tccagaaggt tctggaagac 780
acctcgatgg gacggtcgat cgtgtacggg cagacggaga agatggttgc caagaacacg 840
ggtggccatt atcccgcacc gacggcgata ttggatacga tcaagtacgg tttcacccac 900
agcaagcccc aagccctaga gtacgaggcg acgcgctttg cggagctggc ggccacgagt 960
gtgagcgccg ccctgcgagg cattttcacg ggcacgactg ccctgaaaca aagcaagtac 1020
gggaagcccg ctaatcccgt ggagacggtg gctgtggtgg gtgcaggatt gatgggcgcg 1080
ggtattgccc aggtgacggc ggagaaaggg taccgggtgc tcctgaagga caaggacctc 1140
gccggggtca gtcgcggcga gaaatacatt tcggacaact taaagggaaa gatgaagaag 1200
aagaggatga cgaagtacgc ctacgacacc accaccagcc gggtggtggg tttgacggac 1260
gagagcgcga actgggggaa gcaatttggg aaggcggaca tggtgataga ggcagtcttc 1320
gaggacctga gcctcaagca taaggtcatt cagcagttgg aggagcattt gcctccccac 1380
gccgtctttg ccagcaacac cagcgctatc cccatcgctc ggattgccga ggcgagccag 1440
cgaccggaga atgtgattgg catgcattat ttctccccgg tgccccagat gcctcttctc 1500
gagatcattc cgcacaaagg gaccagcaaa gaggccgcgg cggctgcttt cgaagtgggg 1560
aagaaacagg gcaaaacggt gattttcgtg aaagacgtgc caggctttta cgtgaatcgg 1620
tgcctggggc cctacctggt ggagacgggg gcgctcatgg aagccggcgt gcccctcgaa 1680
cagctggaca aggccatcaa ggcctacggt ttccccgtgg ggcccatcac cctcgccgac 1740
gaggtcggag tcgacgtcgc ggcccatgtt caagccttcc tatccaaagc cgacttgggc 1800
gtgcgaatgg gcgggagcga cggaccgatt ctggacgcgt tgctgaaggc caagcttttg 1860
ggccgtaagg ccggcaaagg cttctatacg taccccgcgg gggggaaaaa ggagaaaggg 1920
cccaagactt tgaatccgga agccacgtct ttggtccaga aacacgtgaa aggggagagc 1980
aagctcacgg acgaggaggt gcagaaccgg ctggtctcac gctttgtcaa cgaggcagtc 2040
ttcgccctcc aagatggagt gatcgcctcc cccgtcgagg gcgacattgg cgccgtcttt 2100
gggatcggat tcccgccttt cctggggggt cctttccgcc tgatcgacgc attgggagca 2160
gggaagtact gttccatgct ggagggcttt gccggcaaat acggggagca attcgccccc 2220
gcgccactcc tggtcgagca cgcaaagagc gggaagaagt tccaccagta g 2271
<210> 3
<211> 3820
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncA gDNA序列
<400> 3
atgctccgct tggcgtcggc acgggcatcg ctgcggctga atggcttggg tgcttttcaa 60
ggtaagtctc gcggttttcc tcgagccctc gctctcagag ctcaactgct acaaggcata 120
ccattccttg ttcttacagg caggggagca tgagtcgttt gtattgcttt gacttaaaga 180
cggcctgatc accgtccatg cgtgaatttt ataatcgtcg gctcgtcttc cattttgatg 240
ttgcatgtat cttgggtgga ccgtttcctg gtcgtactcc tccgcttcaa ctacttcccc 300
ctcctcccct tgttctcggt gggctcccct tggtcccatg caatgattag aatatgcgtc 360
aacattcatg tctaccgtct caggatcagc atgcgcgctc acactgccat cattacgtct 420
tcttttgacc cgtaacaggc accgccacgt gcccctcctt cttgaaacgc gccagtctct 480
ccacgcgcgg gcagtatttc gcgcccgtgg aagtgaagga cggggtcgca atcattcgta 540
ttgatgggcc ggggaagatg aacacgattg acgacaattt tcgccaagag atcgatgcat 600
tgtggacggt aatgtcatgg gaaagacaag ggatcgagac gggaaggggc acactccagc 660
ggttccttga ccttacgacc ccctggctga acgattcctt ctctcttata tatacaggac 720
aaggttgcaa atgacgcgag tgtcaaggcg gccgtgataa tttctgcaaa gcccgacaat 780
ttcatcgcag gagccgatat caaattcatc gactcggtgg aagacttcgc gagccttaaa 840
gacggtatgt gcgcctgact agacacgttc cccgtgctcg aatgtccttt ccacgtcctt 900
gcaaggctgc tgcttgtgtg cgcttgaata tgggccggca cctggtgcct gtggcctggt 960
ggtgtctcat tggggaccta tgacccttgt gactgcctca cacactctgc ggccgagggc 1020
atcgccacgg agagggtttc cctctgccaa caagagaaac gaccacgcct tcaacgcaca 1080
gctttcactc atcctctttc ttgctttccc actctccatc cggcttgtcc ccccctctct 1140
cggtcagtct gcctcaaggg acacgccacc ttccagaaga ttcgaaaggc caacaagccc 1200
ttggttgccg ccattcatgg gcccgccctt ggcggcggtc tggaagtggc cctgtactgc 1260
gactaccgca tcgtcacctc ctcccccaag acggtgctgg gtctccccga ggtgaagctc 1320
ggcctcttgc cgggcttcgg gggcactcag aacctccacc ctatcgtcgg cttgcaggcg 1380
gccctggaca tgacgctgac aggtgcgggg ggggagggtg ggaaggaagg aaggagggag 1440
ggagggaggg agggagggag ggaggaaggg aaaaaggcgg gatcgtcgga cgggagggtc 1500
aggagataac ggtggcggga tgccagcatg tgttcccaac gtccagagct ttcctatccc 1560
gtataccatg caagtcatcc tcctttaatg tcactttgtc acctccacat cgcagggaag 1620
aacatccgcc cggacaaggc caagaagatg ggcctggcgg acgtggtggt ggaccccgcc 1680
gcgttggaga ccgtggcggt tgagacggcc cgcgccttgg ccgagggttc gctgaaaggg 1740
aagaggaagg gcaaggggct cctccagaag gttctggaag acacctcgat gggacggtcg 1800
atcgtgtacg ggcagacgga gaagatggtt gccaagaaca cgggtggcca ttatcccgca 1860
ccgacggcga tattgggtgc gttcagacgg ggttttttaa aaatcaaaaa ataacggatg 1920
tgttgcgcgt ggactcacga ttttccatca tcacctctga ttccctcgtg tgtccagata 1980
cgatcaagta cggtttcacc cacagcaagc cccaagccct agagtacgag gcgacgcgct 2040
ttgcggagct ggcggccacg agtgtgagcg ccgccctgcg aggcattttc acgggcacga 2100
ctgccctgaa acaaagcaag tacgggaagc ccgctaatcc cgtggagacg gtggctgtgg 2160
tgggtgcagg attgatgggc gcgggtattg cccaggtgac ggcggagaaa gggtaaggag 2220
gggggaggga gaaagggagg gagggagggg agaggacaag agcaagaagg cgattatgtc 2280
gcgcataaag aagaatgagg ttgttgatgg acagtgtagg gagggagaga gggaggaagg 2340
gaaggaggaa gggagggagg aagggaggga gggagggagg gagggagggg cagggtttgg 2400
gcggagcttg gtgggtttgt tggtgcgtga agggttatgt ttcctgtctc ttcgtatcgg 2460
aaatctccct gctcccttcg agtcacgaaa tagcgcatga cccgcttccc ctcgttcagg 2520
taccgggtgc tcctgaagga caaggacctc gccggggtca gtcgcggcga gaaatacatt 2580
tcggacaact taaagggaaa gatgaagaag aagaggatga cgaagtacgc ctacgacacc 2640
accaccagcc gggtggtggg tttgacggac gagagcgcga actgggggaa gcaatttggg 2700
aaggcggaca tggtgataga ggcagtcttc gaggacctga gcctcaagca taaggtcatt 2760
cagcagttgg aggagcattt gcctccccac gccgtctttg ccagcaacac cagcgctatc 2820
cccatcgctc ggattgccga ggcgagccag cgaccggaga atgtgattgg catgcattat 2880
ttctccccgg tgccccagat gcctcttctc gagatcattc cgcacaaagg gaccagcaaa 2940
gaggccgcgg cggctgcttt cgaagtgggg aagaaacagg gcaaaacggt gattttcgtg 3000
aaagacgtgc caggctttta cgtgaatcgg tgcctggggc cctacctggt ggagacgggg 3060
gcgctcatgg aaggtgcgtt ggttgcgagt ctggggatcg gttgtctcgc gtggttactc 3120
tcgccacgtt tgaaaatttg aacctttgac agtgcacact tacttacctt ttgattctca 3180
ttatttcctc gcgttgttcc accgggaccc agccggcgtg cccctcgaac agctggacaa 3240
ggccatcaag gcctacggtt tccccgtggg gcccatcacc ctcgccgacg aggtcggagt 3300
cgacgtcgcg gcccatgttc aagccttcct atccaaagcc gacttgggcg tgcgaatggg 3360
cgggagcgac ggaccgattc tggacgcgtt gctgaaggcc aagcttttgg gccgtaaggc 3420
cggcaaaggc ttctatacgt accccgcggg ggggaaaaag gagaaagggc ccaagacttt 3480
gaatccggaa gccacgtctt tggtccagaa acacgtgaaa ggggagagca agctcacgga 3540
cgaggaggtg cagaaccggc tggtctcacg ctttgtcaac gaggcagtct tcgccctcca 3600
agatggagtg atcgcctccc ccgtcgaggg cgacattggc gccgtctttg ggatcggatt 3660
cccgcctttc ctggggggtc ctttccgcct gatcgacgca ttgggagcag ggaagtactg 3720
ttccatgctg gagggctttg ccggcaaata cggggagcaa ttcgcccccg cgccactcct 3780
ggtcgagcac gcaaagagcg ggaagaagtt ccaccagtag 3820
<210> 4
<211> 826
<212> PRT
<213> 大洋洲海链藻(Thalassiosira oceanica)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 4
Met Ile Leu Ser Ser Ala Val Gln Arg Ala Ile Leu Ser Gln Ser Arg
1 5 10 15
Ala Ala Ala Gly Ala Ala Arg Gln Ile Asn Ser Leu Ser Arg Arg Pro
20 25 30
Ala Ser Ala Leu Ala Ala Cys Gln Gly Gly Ala Ser Ser Ala Thr Gly
35 40 45
Val Val Ser Ile Gly Asp Ala His Ala Ala Asp Phe Asn Asn His Pro
50 55 60
Arg Arg Arg Arg Ala Phe Ser Thr Ala Ala Val Arg Asp Glu Pro Ala
65 70 75 80
Pro Ser Pro Thr Pro Ser Glu His Thr Ala Ala Asp Ser Ser Glu Lys
85 90 95
Ser Phe Val Pro Ser Pro Gly Arg Lys Tyr Arg Phe Phe Arg Asn Val
100 105 110
Glu Val Thr Pro Ala Gly Val Ala Val Ile Arg Phe Asp Asn Arg Glu
115 120 125
Lys Lys Val Asn Thr Leu Ser Phe Glu Leu Met His Glu Ala Lys Ala
130 135 140
Met Trp Asp Ala Glu Val His Ala Asn Ala Asp Val Lys Ser Val Val
145 150 155 160
Phe Thr Ser Ala Lys Glu Ser Gly Phe Val Ala Gly Ala Asp Ile Phe
165 170 175
Asp Ile Ser Ser Val Glu Asp Lys Ser Thr Leu Val Pro Val Ile Glu
180 185 190
Glu Ala Leu Asp Phe Phe Leu His Met Lys Ser Lys Gly Ala Pro Met
195 200 205
Val Ala Ala Ile His Gly Pro Ala Leu Gly Gly Gly Leu Glu Trp Ala
210 215 220
Leu Trp Cys Asp Tyr Arg Ile Cys Thr Asp Ser Ser Ser Thr Lys Met
225 230 235 240
Gly Leu Pro Glu Val Lys Leu Gly Leu Leu Pro Gly Phe Gly Gly Thr
245 250 255
Gln Asn Leu Pro Ala Leu Val Gly Val Gln Gly Ala Ile Asp Ile Met
260 265 270
Leu Thr Gly Lys Asp Ile Arg Pro Lys Lys Ala Lys Gln Met Gly Leu
275 280 285
Val Asp Leu Val Val Ala Pro Gln Ser Leu Glu Ala Val Ala Ile Glu
290 295 300
Thr Ala Glu Gly Leu Ala Asn Gly Thr Val Arg Lys Ser Gly Pro Lys
305 310 315 320
Lys Lys Ser Leu Val Asn Arg Leu Val Glu Asp Thr Pro Pro Gly Arg
325 330 335
His Val Met Trp Asn Gln Val Lys Lys Met Val Asp Lys Asn Thr Ala
340 345 350
Gly Asn Tyr Pro Ala Pro Tyr Glu Ile Ile Asp Cys Val Lys Tyr Gly
355 360 365
Leu Ala Asn Pro Asp Gly Leu Gly Lys Tyr Lys His Glu Arg Glu Gly
370 375 380
Phe Ala Lys Leu Ala Ala Thr Ser Glu Ser Glu Ser Leu Ile Gly Ile
385 390 395 400
Phe Asp Gly Met Asn Lys Leu Lys Lys His Asp Ser Asp Ala Ser Pro
405 410 415
Val Pro Val Arg Lys Val Ala Val Met Gly Ala Gly Leu Met Gly Ala
420 425 430
Gly Ile Ala Gln Val Thr Ala Glu Lys Gly Tyr Asp Val Leu Leu Lys
435 440 445
Asp Arg Asp Asp Ala Ser Leu Gly Arg Gly Val Ser Tyr Met Thr Asp
450 455 460
Asn Trp Ser Lys Lys Thr Lys Arg Arg Arg Met Thr Gln Tyr Gln Asn
465 470 475 480
Asn Leu Asn Gln Ser Arg Val Thr Pro Leu Ser Asp Ala Thr Pro Ser
485 490 495
Trp Pro Arg His Phe Ala Gly Ala Asp Leu Val Ile Glu Ala Val Phe
500 505 510
Glu Asn Leu Glu Leu Lys Arg Lys Ile Ile Ser Gln Val Glu Glu Val
515 520 525
Thr Pro Asp His Cys Val Phe Ala Thr Asn Thr Ser Ala Ile Pro Ile
530 535 540
Ala Asp Ile Ala Ala Pro Gly Pro Glu Val Ser Arg Pro Gln Asn Val
545 550 555 560
Val Gly Met His Tyr Phe Ser Pro Val Pro Ser Met Pro Leu Leu Glu
565 570 575
Ile Ile Pro His Glu Gly Thr Ser Glu Glu Ala Thr Ala Thr Ala Phe
580 585 590
Ala Val Gly Thr Lys Gln Gly Lys Thr Cys Val Val Val Lys Asp Val
595 600 605
Pro Gly Phe Tyr Val Asn Arg Cys Leu Gly Pro Val Leu Val Glu Thr
610 615 620
Ser Ala Leu Val Lys Glu Gly Val Pro Leu Glu Lys Met Asp Lys Ala
625 630 635 640
Met Lys Ser Phe Gly Met Pro Val Gly Pro Ile Thr Leu Met Asp Glu
645 650 655
Val Gly Ile Asp Val Gly Ser Lys Val Ala Ser Tyr Leu Ser Gly Ala
660 665 670
Asp Leu Asp Val Arg Met Thr Gly Gly Asp Ile Ser Leu Met Ser Thr
675 680 685
Met Val Asp Lys Gly Trp Leu Gly Lys Lys Ser Gly Lys Gly Phe Tyr
690 695 700
Thr Tyr Ser Gly Lys Lys Gly Lys Lys Ile Gly Pro Glu Met Arg Ala
705 710 715 720
Phe Leu Thr Glu Phe Thr Gly Gly Ala Thr Ser Asp Leu Ala Glu Thr
725 730 735
Asp Ile Gln Asp Arg Ile Thr Ala Arg Leu Val Asn Glu Ala Ala Lys
740 745 750
Cys Leu Glu Asp Gly Ile Ile Ala Asp Pro Val Ala Gly Asp Ile Gly
755 760 765
Leu Val Phe Gly Ile Gly Phe Ala Pro Phe Arg Gly Gly Pro Phe Arg
770 775 780
Tyr Leu Asp Thr Val Gly Val Thr Ser Phe Val Asp Arg Met Asn Gly
785 790 795 800
Phe Ala Asp Ala His Gly Gly Gln Phe Glu Pro Cys Gln Leu Leu Lys
805 810 815
Asp Tyr Ala Ala Ser Gly Lys Arg Phe His
820 825
<210> 5
<211> 683
<212> PRT
<213> 假微型海链藻(Thalassiosira pseudonana)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 5
Met Trp Glu Ser Asp Val His Gly Asn Asp Ser Val Lys Ser Ile Val
1 5 10 15
Phe Thr Ser Ala Lys Glu Thr Gly Phe Ile Ala Gly Ala Asp Ile Phe
20 25 30
Asp Ile Ser Gln Val Glu Asp Lys Ala Gln Leu Val Pro Val Ile Glu
35 40 45
Glu Ala Leu Asn Phe Phe Leu Lys Met Lys Ser Lys Gly Val Pro Met
50 55 60
Val Ala Ala Ile His Gly Pro Ala Leu Gly Gly Gly Leu Glu Trp Ala
65 70 75 80
Leu Trp Cys Asp Tyr Arg Ile Cys Thr Asp Ser Ser Ser Thr Lys Leu
85 90 95
Gly Leu Pro Glu Val Lys Leu Gly Leu Leu Pro Gly Phe Gly Gly Thr
100 105 110
Gln Asn Leu Pro Lys Leu Val Gly Ile Gln Gly Gly Met Asp Met Met
115 120 125
Leu Thr Gly Lys Asp Ile Arg Pro Pro Lys Ala Lys Lys Met Gly Leu
130 135 140
Val Asp Leu Val Val Ala Pro Gln Ser Leu Glu Ser Val Ala Ile Gln
145 150 155 160
Ser Ala Glu Gly Leu Ala Asn Gly Thr Val Lys Lys Ser Lys Pro Lys
165 170 175
Glu Lys Ser Leu Met Asn Arg Leu Ile Glu Asp Thr Pro Pro Gly Gln
180 185 190
Tyr Leu Met Trp Asp Lys Val Lys Lys Met Val Asp Lys Asn Thr Gly
195 200 205
Gly Asn Tyr Pro Ala Pro Tyr Ala Ile Ile Asp Cys Val Lys Tyr Gly
210 215 220
Leu Ala His Pro Ser Gly Asn Asp Lys Phe Lys His Glu Arg Glu Glu
225 230 235 240
Phe Ala Lys Leu Ala Ala Thr Lys Glu Ser Glu Ala Leu Ile Gly Ile
245 250 255
Phe Asp Gly Met Asn Gln Met Lys Lys Leu Ser Ser Ser Ala Ala Pro
260 265 270
Ile Asp Val Lys Lys Val Ala Val Met Gly Ala Gly Leu Met Gly Ala
275 280 285
Gly Ile Ala Gln Val Thr Ala Glu Lys Gly Tyr Asp Val Leu Leu Lys
290 295 300
Asp Arg Asp Ala Ala Ser Leu Gly Arg Gly Leu Ser Tyr Met Thr Glu
305 310 315 320
Asn Trp Glu Lys Lys His Lys Arg Lys Arg Met Thr Thr Tyr Gln Leu
325 330 335
Asn Leu Asn Thr Ser Arg Val Thr Pro Leu Ala Asp Asp Thr Glu Ser
340 345 350
Trp Lys Arg His Phe Ala Gly Ala Asp Leu Val Ile Glu Ala Val Phe
355 360 365
Glu Asn Leu Asp Leu Lys Arg Lys Ile Val Gln Gln Val Glu Glu Val
370 375 380
Thr Ser Asp His Cys Val Phe Ala Thr Asn Thr Ser Ala Ile Pro Ile
385 390 395 400
Ala Asp Ile Ala Ala Pro Gly Pro Asp Ile Lys Arg Pro Glu Asn Ile
405 410 415
Val Gly Met His Tyr Phe Ser Pro Val Pro Ser Met Pro Leu Leu Glu
420 425 430
Ile Ile Pro His Ala Gly Thr Ser Asp Glu Ala Leu Ala Thr Ala Phe
435 440 445
Ala Val Gly Thr Lys Gln Gly Lys Thr Cys Val Val Val Lys Asp Val
450 455 460
Pro Gly Phe Tyr Val Asn Arg Cys Leu Gly Pro Ile Leu Val Glu Val
465 470 475 480
Ser Ala Leu Val Lys Glu Gly Val Pro Leu Glu Thr Leu Asp Lys Ala
485 490 495
Met Lys Lys Phe Gly Met Pro Val Gly Pro Ile Thr Leu Ile Asp Glu
500 505 510
Val Gly Val Asp Val Ala Ala Lys Val Ser Thr Phe Leu Ser Asp Ala
515 520 525
Asp Leu Gly Val Arg Met Gly Gly Gly Asp Leu Ser Leu Met Thr Asn
530 535 540
Met Val Glu Lys Gly Trp Leu Gly Arg Lys Ser Asn Gln Gly Phe Tyr
545 550 555 560
Thr Tyr Ala Gly Lys Lys Gly Lys Thr Ile Gly Ser Glu Val Thr Ala
565 570 575
Tyr Leu Lys Glu Phe Thr Gly Gly Lys Val Ser Asn Leu Ser Glu Lys
580 585 590
Asp Ile Gln Asp Arg Ile Ala Ser Arg Leu Val Asn Glu Ala Ala Lys
595 600 605
Cys Leu Glu Asp Asp Ile Ile Glu Asn Pro Val Ala Gly Asp Ile Gly
610 615 620
Leu Val Phe Gly Ile Gly Phe Ala Pro Phe Lys Gly Gly Pro Phe Arg
625 630 635 640
Tyr Leu Asp Ala Val Gly Val Ser Ser Tyr Val Asp Arg Met Asn Gly
645 650 655
Phe Ala Asp Thr Leu Gly Glu Gln Phe Glu Pro Cys Gln Leu Leu Lys
660 665 670
Asp Tyr Ala Thr Ser Gly Lys Lys Phe His Gly
675 680
<210> 6
<211> 684
<212> PRT
<213> 三角褐指藻(Phaeodactylum tricornutum)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 6
Met Ala Glu Glu Ala Lys Lys Leu Trp Lys Asp Glu Ile Ala Ser Asn
1 5 10 15
Ser Asp Val Lys Ala Val Val Phe Ser Ser Ala Lys Pro Asp Met Phe
20 25 30
Ile Ala Gly Ala Asp Ile Phe Asp Ile Lys Ala Val Glu Asn Lys Gln
35 40 45
Asp Leu Ile Pro Phe Ile Ala Asp Gly Val Lys Phe Phe Gln Asp Met
50 55 60
Arg Gly Lys Gly Val Pro Leu Val Ala Ala Ile Asp Gly Pro Ala Leu
65 70 75 80
Gly Gly Gly Leu Glu Trp Ala Leu Trp Cys Asp Tyr Arg Ile Cys Thr
85 90 95
Asp Ser Ser Lys Thr Lys Met Gly Leu Pro Glu Val Lys Leu Gly Leu
100 105 110
Leu Pro Gly Phe Gly Gly Thr Gln Asn Leu His Pro Val Val Gly Leu
115 120 125
Gln Asn Ala Met Asp Met Met Leu Thr Gly Lys Asp Ile Arg Pro His
130 135 140
Gln Ala Lys Lys Met Gly Leu Val Asp Leu Val Val Ala Gln Ala Ser
145 150 155 160
Leu Glu Arg Val Ala Ile Asp Ser Ala Ala Ala Leu Ala Asn Gly Ser
165 170 175
Leu Lys Ala Lys Arg Lys Ser Lys Ser Met Phe Asn Lys Ile Leu Glu
180 185 190
Asp Asn Ser Ile Gly Arg Asn Val Ile Trp Asn Gln Ile Asp Lys Met
195 200 205
Val Gln Lys Asn Thr Asn Gly Lys Tyr Pro Ala Pro Tyr Ala Ile Ile
210 215 220
Asp Cys Val Lys Phe Gly Leu Asp Asn Pro Ser Gln Lys Tyr Gln His
225 230 235 240
Glu Arg Glu Glu Phe Ala Lys Leu Ala Ala Thr Pro Glu Ser Glu Ala
245 250 255
Leu Ile Gly Ile Phe Asp Gly Met Thr Gln Met Lys Lys His Ser Phe
260 265 270
Gly Ala Asp Ala Ala Ile Pro Val Lys Thr Val Ala Val Met Gly Ala
275 280 285
Gly Leu Met Gly Ala Gly Ile Ala Gln Val Thr Ala Glu Lys Gly Ile
290 295 300
Lys Val Leu Leu Lys Asp Arg Asn Asp Glu Ala Val Gly Arg Gly Gln
305 310 315 320
Ser Tyr Met Thr Glu Asn Trp Ser Lys Lys Leu Lys Arg Lys Arg Met
325 330 335
Thr Gln Tyr Gln Tyr Asn Leu Asn Thr Ser Asn Val Thr Ala Leu Thr
340 345 350
Asp Asp Ser Pro Thr Trp Gln Arg His Phe Gly Asn Ala Asp Met Val
355 360 365
Ile Glu Ala Val Phe Glu Asp Leu Asp Leu Lys Arg Lys Ile Val Ala
370 375 380
Asn Val Glu Ser Val Thr Lys Asp His Cys Ile Phe Ala Thr Asn Thr
385 390 395 400
Ser Ala Ile Pro Ile Ala Asp Ile Ala Gln Gly Ala Ser Arg Pro Glu
405 410 415
Asn Ile Ile Gly Met His Tyr Phe Ser Pro Val Pro Ser Met Pro Leu
420 425 430
Leu Glu Ile Ile Pro His Thr Gly Thr Ser Asp Thr Ala Thr Ala Thr
435 440 445
Ala Phe Glu Ile Gly Ser Lys Gln Gly Lys Thr Cys Ile Val Val Lys
450 455 460
Asp Val Pro Gly Phe Tyr Val Asn Arg Cys Leu Gly Pro Tyr Leu Val
465 470 475 480
Glu Val Ser Ala Leu Val Arg Asp Gly Val Pro Leu Glu Ala Leu Asp
485 490 495
Lys Ser Leu Lys Asn Phe Gly Met Pro Val Gly Pro Ile Thr Leu Ala
500 505 510
Asp Glu Val Gly Ile Asp Val Ser Ser His Val Ala Lys Phe Leu Ser
515 520 525
Asn Ala Asp Leu Gly Val Arg Met Glu Gly Gly Asp Val Ser Leu Met
530 535 540
Glu Gln Met Ile Gly Lys Gly Trp Leu Gly Lys Lys Ser Gly Gln Gly
545 550 555 560
Phe Tyr Thr Tyr Lys Gly Lys Lys Lys Thr Ile Asn Glu Glu Val Gln
565 570 575
Lys Tyr Val Lys Asp Phe Ala Thr Arg Asp Leu Lys Leu Asp Glu Lys
580 585 590
Glu Ile Gln Asp Arg Ile Val Ser Arg Phe Val Asn Glu Ala Ala Lys
595 600 605
Cys Leu Glu Asp Glu Ile Ile Glu Asn Pro Val Val Gly Asp Ile Gly
610 615 620
Leu Val Phe Gly Thr Gly Phe Ala Pro Phe Arg Gly Gly Pro Phe Arg
625 630 635 640
Tyr Leu Asp Gln Val Gly Val Ala Ser Tyr Val Asp Arg Met Asn Thr
645 650 655
Phe Thr Asp Lys Tyr Gly Pro Gln Phe Glu Pro Cys Gln Leu Leu Lys
660 665 670
Asp Tyr Ala Ala Thr Asp Lys Lys Phe His Lys Arg
675 680
<210> 7
<211> 771
<212> PRT
<213> 圆柱拟脆杆藻(Fragilariopsis cylindrus)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 7
Met Thr Ala Phe Tyr Ser Ala Arg Tyr Gln Ser Thr Ala Ser Ser Ala
1 5 10 15
Val Leu Glu Glu Lys Pro Thr Asp Pro Ser Pro Ser Ala Ala Ala Ala
20 25 30
Ser Ser Thr Ala Thr Asn Asn Glu Glu Gly Ser Lys Leu Phe Val Pro
35 40 45
Thr Ala Asp Arg Lys Tyr Glu Tyr Phe Thr Asn Val Glu Phe Thr Lys
50 55 60
Glu Gly Val Ala Ile Ile Arg Phe Asp Cys Pro Asn Lys Val Asn Thr
65 70 75 80
Ile Ser Phe Ala Leu Ser Asp Glu Ala Arg Gln Leu Trp Lys Gly Glu
85 90 95
Ile Glu Asn Asn Ser Asp Val Lys Ala Val Val Phe Ser Ser Ala Lys
100 105 110
Pro Asp Met Phe Ile Ala Gly Ala Asp Ile Phe Asp Ile Lys Arg Ile
115 120 125
Glu Asn Lys Asn Asp Leu Val Gly Leu Ile Glu Glu Gly Val Thr Phe
130 135 140
Phe Gln His Met Arg Glu Lys Lys Val Pro Leu Val Cys Ala Ile Asn
145 150 155 160
Gly Pro Ala Leu Gly Gly Gly Leu Glu Trp Ala Met Trp Cys Asp Tyr
165 170 175
Arg Val Cys Ser Asp Ser Pro Lys Thr Lys Leu Gly Leu Pro Glu Val
180 185 190
Lys Leu Gly Leu Leu Pro Gly Phe Gly Gly Thr Gln Asn Leu His Glu
195 200 205
Leu Val Gly Leu Gln Asn Ala Met Asp Met Met Leu Thr Gly Lys Asp
210 215 220
Ile Arg Pro His Lys Ala Lys Lys Met Gly Leu Val Asp Leu Val Val
225 230 235 240
Ser Ser Gln Ser Val Glu Lys Asp Ala Ile Gln Ser Ala Val Asp Ile
245 250 255
Ile Asn Gly Lys Leu Lys Pro Lys Lys Lys Ala Lys Ser Leu Met Asn
260 265 270
Arg Leu Leu Glu Asp Thr Ser Ile Gly Gln Lys Ile Ile Trp Asn Gln
275 280 285
Ile Asn Lys Met Val Gln Lys Asn Thr Asn Gly Asn Tyr Pro Ala Pro
290 295 300
Asn Ala Ile Ile Arg Cys Val Gln His Gly Ile Ala Asn Arg Ser Thr
305 310 315 320
Arg Phe Glu Asn Glu Arg Glu Glu Phe Ala Lys Leu Ala Ala Thr Asp
325 330 335
Glu Ser Glu Ala Leu Ile Gly Ile Phe Asp Gly Met Thr Gln Met Lys
340 345 350
Lys Asn Pro Phe Asp Asn Thr Val Ala Val Pro Val Lys Thr Val Ala
355 360 365
Val Met Gly Ala Gly Leu Met Gly Ala Gly Ile Ala Gln Ile Thr Ala
370 375 380
Glu Lys Gly Met Ser Val Leu Leu Lys Asp Arg Asn Asp Ala Ala Ile
385 390 395 400
Glu Arg Gly Gly Ser Tyr Met Arg Asp Asn Trp Asp Lys Lys Leu Lys
405 410 415
Arg Lys Arg Met Thr Lys Phe Gln His Asn Leu Asn Ser Ser Asn Val
420 425 430
Val Gly Leu Thr Asp Asp Asn Pro Asn Leu Val Glu Lys His Phe Gly
435 440 445
Asn Thr Asp Met Ile Ile Glu Ala Val Phe Glu Asp Leu Asp Leu Lys
450 455 460
Arg Lys Ile Val Ala Asp Ile Glu Lys Ile Thr Pro Asp His Cys Val
465 470 475 480
Phe Ala Thr Asn Thr Ser Ala Ile Pro Ile Gly Ala Ile Ala Glu Gly
485 490 495
Ser Lys Arg Pro Glu Asn Ile Ile Gly Met His Tyr Phe Ser Pro Val
500 505 510
Pro Ser Met Pro Leu Leu Glu Ile Ile Pro His Glu Gly Thr Asn Glu
515 520 525
Ala Thr Arg Ala Thr Ala Phe Asn Val Gly Thr Lys Gln Gly Lys Thr
530 535 540
Cys Ile Val Val Lys Asp Val Pro Gly Phe Tyr Val Asn Arg Cys Leu
545 550 555 560
Gly Pro Phe Leu Val Glu Val Ser Ala Leu Ile Arg Asp Gly Val Ser
565 570 575
Leu Glu Lys Leu Asp Arg Ser Val Leu Asp Phe Gly Met Pro Val Gly
580 585 590
Pro Val Thr Leu Ala Asp Glu Val Gly Ile Asp Val Thr Ser His Val
595 600 605
Ala Thr Phe Leu Ser Lys Ala Asp Leu Gly Val Arg Met Asp Gly Gly
610 615 620
Asp Ile Thr Leu Met Glu Lys Met Ile Asp Lys Gly Trp Leu Gly Lys
625 630 635 640
Lys Ser Gly Gln Gly Phe Tyr Thr Tyr Ser Asn Lys Lys Lys Gly Lys
645 650 655
Thr Ile Ser Pro Glu Val Gln Ala Tyr Val Lys Thr Phe Val Lys Gln
660 665 670
Asp Leu Asn Leu Asp Lys Glu Glu Ile Gln Asn Arg Ile Ile Ser Arg
675 680 685
Phe Val Asn Glu Ala Ala Lys Cys Leu Glu Asp Glu Ile Ile Asp Asn
690 695 700
Pro Val Val Gly Asp Ile Gly Leu Val Phe Gly Thr Gly Phe Ala Pro
705 710 715 720
Phe Arg Gly Gly Pro Phe Arg Tyr Leu Asp Gln Ile Gly Val Ala Asn
725 730 735
Tyr Val Asp Met Met Asn Ser Phe Ala Asp Lys Tyr Gly Gly Gln Phe
740 745 750
Glu Pro Cys Gln Leu Leu Lys Asp Tyr Ala Ala Thr Asp Lys Lys Phe
755 760 765
Tyr Asn Asn
770
<210> 8
<211> 766
<212> PRT
<213> 抑食金球藻(Aureococcus anophagefferens)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 8
Met Ser Ser Leu Leu Arg Tyr Ser Ala Arg Gln Val Ala Val Ala Gly
1 5 10 15
Arg Arg Arg Leu Ser Ala Gln Pro Val Ala Ser Glu Gly Ser Arg Ser
20 25 30
Trp Glu Phe Phe Ala Gly Asp Pro Glu Val Thr Ala Asp Gly Val Ala
35 40 45
Ile Val Arg Leu Asp Ala Lys Lys Ala Lys Met Asn Thr Leu Asn Pro
50 55 60
Ala Leu Gln Ala Glu Ala Gln Glu Met Trp Ser Glu Leu Met Glu Ala
65 70 75 80
Arg Gly Asn Asp Val Lys Ala Ala Val Phe Ile Ser Ala Lys Pro Asp
85 90 95
Asn Phe Ile Ala Gly Ala Asp Ile Ser Met Leu Ala Ala Lys Lys Ala
100 105 110
Ser Gly Asp Glu Asp Ser Leu Glu Ala Ile Cys Leu Ser Gly His Thr
115 120 125
Met Phe Ala Glu Leu Lys Ala Thr Asn Ile Pro Ile Val Ala Ala Ile
130 135 140
His Gly Ala Cys Leu Gly Gly Gly Leu Glu Trp Ala Leu Lys Cys Asp
145 150 155 160
Tyr Arg Val Ala Ser Thr Ser Pro Lys Thr Lys Leu Gly Leu Pro Glu
165 170 175
Val Lys Leu Gly Leu Leu Pro Gly Trp Gly Gly Thr Tyr Ala Leu Pro
180 185 190
Lys Leu Ile Gly Leu Thr Glu Ala Leu Pro Met Ile Leu Gln Gly Lys
195 200 205
Glu Val Lys Ala Asp Lys Ala Lys Lys Leu Gly Leu Val Asp Ala Val
210 215 220
Cys Asp Pro Ala Ala Leu Glu Arg Leu Ala Val Ala Lys Ala Ala Ala
225 230 235 240
Leu Gly Asn Gly Ser Leu Lys Leu Lys Glu Lys Lys Lys Ser Trp Met
245 250 255
Arg Trp Ala Thr Glu Asp Val Ser Phe Gly Arg Asp Phe Val Phe Lys
260 265 270
Lys Ala Lys Glu Thr Val Asp Lys Thr Thr Arg Gly Lys Tyr Pro Ala
275 280 285
Ala Tyr Glu Ile Met Asp Cys Val Lys His Gly Leu Gly Lys Ser Pro
290 295 300
Glu Glu Ala Phe Ala Phe Glu Ala Lys Ala Phe Val Arg Leu Ala Lys
305 310 315 320
Thr Pro Glu Ser Ser Ala Leu Ile Gly Leu Phe Asp Gly Ile Thr Ala
325 330 335
Ser Lys Lys Asn Arg Tyr Gly Asn Ala Ser Asp Pro Ala Thr Leu Lys
340 345 350
Ala Leu Asp Thr Val Ala Val Leu Gly Ala Gly Leu Met Gly Ala Gly
355 360 365
Ile Ala Gln Val Ser Ala Glu Lys Gly Leu Asn Val Leu Leu Lys Asp
370 375 380
Ala Ser Pro Glu Gly Leu Ala Lys Gly Val Asp Tyr Val Gly Gly Asn
385 390 395 400
Leu Ala Lys Lys Val Lys Arg Arg Arg Met Thr Asp Tyr Thr Arg Asn
405 410 415
Thr Ile Thr Ser Lys Val Met Gly Tyr His Asp Gly Pro Gly Gly Gly
420 425 430
Gly Asp Ala Ala Trp Leu Arg Lys Ala Ala Thr Ala Asp Val Val Val
435 440 445
Glu Ala Val Phe Glu Asp Leu Asp Leu Lys His Lys Val Phe Gln Ser
450 455 460
Val Glu Pro Leu Val Ser Glu Ala Cys Val Leu Ala Thr Asn Thr Ser
465 470 475 480
Ala Ile Pro Ile Ala Lys Val Ala Ala Gly Ala Ala Lys Pro Glu Arg
485 490 495
Val Leu Gly Met His Tyr Phe Ser Pro Val Pro Gln Met Gln Leu Leu
500 505 510
Glu Ile Ile Pro His Ala Gly Thr Asp Pro Lys Ala Met Ala Ala Ala
515 520 525
Phe Ala Val Gly Ile Lys Gln Gly Lys Phe Cys Ile Glu Val Lys Asp
530 535 540
Val Pro Gly Phe Tyr Val Asn Arg Cys Leu Ala Pro Met Met Ala Glu
545 550 555 560
Leu Ala Pro Leu Phe Gln Asp Gly Val Glu Pro Lys Gln Leu Asp Glu
565 570 575
Ala Ile Leu Asp Leu Gly Met Pro Val Gly Pro Val Thr Leu Ile Asp
580 585 590
Glu Val Gly Ala Asp Val Gly Leu His Val Gln Arg Thr Met Leu Ala
595 600 605
Asp Glu Thr Met Gly Gly Arg Met Ala Gly Ala Asp Pro Ala Met Leu
610 615 620
Gln Ala Val Val Asp Lys Gly Trp Leu Gly Arg Lys Ser Gly Lys Gly
625 630 635 640
Phe Phe Val Tyr Asp Gly Lys Lys Lys Thr Pro Asn Ala Glu Ala Asn
645 650 655
Ala Tyr Val Glu Ser Glu Val Lys Arg Arg Asp Ala Gly Leu Ser Val
660 665 670
Glu Thr Ile Gln Asp Arg Tyr Leu Thr Arg Phe Val Asn Glu Ala Ala
675 680 685
Val Cys Leu Gln Glu Gly Ile Leu Lys Thr Pro Ala Asp Gly Asp Leu
690 695 700
Gly Ala Val Phe Gly Val Gly Phe Leu Pro Phe Thr Gly Gly Pro Phe
705 710 715 720
Arg Met Leu Asp Ala Val Gly Ala Ala Thr Tyr Val Asp Lys Met Asn
725 730 735
Arg Leu Ala Asp Glu Tyr Gly Asp Arg Phe Ala Pro Cys Asp Leu Leu
740 745 750
Val Asp His Ala Asn Ser Gly Lys Lys Phe Tyr Pro Ser Lys
755 760 765
<210> 9
<211> 739
<212> PRT
<213> 长囊水云(Ectocarpus siliculosus)
<220>
<221> misc_feature
<223> 三功能蛋白A
<400> 9
Met Pro Met Glu Asp Pro Ala Ser Val Glu Ser Thr Ser Asp Lys Ser
1 5 10 15
Pro Arg Phe Phe Gln Pro Val Glu Lys Leu Asp Asn Gly Val Ala Ile
20 25 30
Ile Arg Ile Asp Gly Pro Glu Lys Met Asn Thr Ile Ser Gly Asp Phe
35 40 45
Arg Gln Glu Ile Glu Asp Ile Trp Ser Gly Gln Ile Ala Glu Asp Pro
50 55 60
Ser Val Lys Ala Val Val Phe Ile Ser Gly Lys Pro Asp Asn Tyr Ile
65 70 75 80
Ala Gly Ala Asp Ile Arg Met Ile Ser Ala Thr Glu Asp Lys Ala Asp
85 90 95
Leu Lys Gln Ile Cys Met Asp Gly His Ala Thr Phe Asp Ile Leu Ala
100 105 110
Lys Lys Gly Ile Pro Val Ile Ala Ala Ile Asn Gly Ala Cys Leu Gly
115 120 125
Gly Gly Leu Glu Trp Ala Leu His Cys Asp Tyr Arg Leu Ala Thr Thr
130 135 140
Ser Pro Lys Thr Val Leu Gly Leu Pro Glu Val Lys Leu Gly Leu Leu
145 150 155 160
Pro Gly Trp Gly Gly Thr Gln Leu Leu His Pro Leu Val Gly Leu Gln
165 170 175
Ala Ala Leu Asp Met Ile Leu Thr Gly Lys Asn Ile Arg Pro His Lys
180 185 190
Ala Leu Lys Met Gly Leu Val Asp Gln Leu Val Asp Ala Ala Ser Leu
195 200 205
Glu Ala Val Ala Val Glu Ala Ala Ala Ser Leu Ala Asp Gly Ser Leu
210 215 220
Lys Ser Lys Arg Lys Pro Lys Ala Leu Met Asn Lys Ile Ile Glu Asp
225 230 235 240
Thr Pro Met Gly Arg Ser Ile Met Trp Lys Lys Val Gly Glu Lys Val
245 250 255
Ala Lys Ser Thr Gly Gly Asn Tyr Pro Asn Ala Thr Ala Ile Val Asp
260 265 270
Cys Ile Lys Phe Gly Leu Ser Ser Ser Lys Gln Ala Ala Leu Glu Tyr
275 280 285
Glu Ala Gln Arg Phe Ser Glu Met Ala Ala Thr Pro Glu Ser Glu Ser
290 295 300
Leu Ile Gly Leu Phe Glu Gly Ser Thr Ala Leu Lys Lys Asn Arg Phe
305 310 315 320
Gly Lys Pro Ala Lys Lys Val Glu Lys Val Ala Val Leu Gly Ala Gly
325 330 335
Leu Met Gly Ala Gly Ile Ala Gln Val Ser Ala Glu Lys Gly Met Thr
340 345 350
Val Leu Leu Lys Asp Arg Asp Ser Ala Ser Val Gly Lys Gly Thr Ser
355 360 365
Tyr Ile Met Asp Asn Ala Ala Ala Lys Leu Lys Lys Arg Arg Met Thr
370 375 380
Lys Tyr Glu Met Asp Thr Val Gly Ser Arg Val Ile Pro Leu Thr Asp
385 390 395 400
Glu Gly Asp Leu Trp Lys Arg His Phe Gly Ser Ala Glu Met Val Ile
405 410 415
Glu Ala Val Pro Glu Asn Leu Asp Leu Lys His Arg Val Ile Gln Gln
420 425 430
Ala Glu Gln Phe Leu Pro Glu Asp Cys Val Phe Ala Thr Asn Thr Ser
435 440 445
Ala Leu Pro Ile Arg Asp Ile Ala Lys Ala Ser Lys Arg Pro Gln Asn
450 455 460
Val Val Gly Met His Tyr Phe Ser Pro Val Pro Met Met Pro Leu Leu
465 470 475 480
Glu Ile Ile Pro His Asp Gly Thr Ser Asp Ala Ala Ala Ala Ala Ala
485 490 495
Val Asp Val Gly Gly Arg Gln Gly Lys Thr Cys Ile Val Val Lys Asp
500 505 510
Val Pro Gly Phe Tyr Val Asn Arg Cys Leu Gly Pro Phe Leu Val Glu
515 520 525
Thr Cys Ala Leu Val Glu Ala Gly Val Gly Leu Glu Gln Leu Asp Lys
530 535 540
Val Met Lys Ser Tyr Gly Leu Pro Val Gly Pro Ile Thr Leu Ala Asp
545 550 555 560
Glu Val Gly Ile Asp Ile Gly Phe His Val Gln Ser Phe Leu Ser Glu
565 570 575
Ala Asp Met Gly Val Arg Met Thr Gly Gly Asn Val Ala Val Met Gly
580 585 590
Asp Met Val Glu Lys Gly Phe Leu Gly Arg Lys Ser Gly Lys Gly Phe
595 600 605
Tyr Leu Tyr Pro Lys Gly Lys Lys Gly Asn Lys Gly Gly Lys Glu Leu
610 615 620
Asn Pro Glu Ala Val Ser Leu Ile Lys Ala His Gln Ala Ala Gly Gly
625 630 635 640
Ala Gly Ala Ser Leu Ala Asn Asp Val Ile Gln Asp Arg Met Met Cys
645 650 655
Arg Phe Val Asn Glu Ala Ala Leu Cys Leu Gln Glu Gly Ile Ile Ser
660 665 670
Ser Pro Val Asp Gly Asp Ile Gly Ala Val Phe Gly Met Gly Phe Pro
675 680 685
Pro Phe Arg Gly Gly Pro Phe Arg Leu Leu Asp Gln Arg Gly Ala Gly
690 695 700
Ala Tyr Ala Asp Met Met Asn Arg Leu Ala Asp Glu His Gly Glu Gln
705 710 715 720
Phe Arg Pro Cys Gln Leu Leu Met Asp His Ala Arg Gly Asp Lys Lys
725 730 735
Phe His Thr
<210> 10
<211> 433
<212> PRT
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncB cDNA序列
<400> 10
Met Asp Thr Gly Cys Thr Ile Val Val Glu Arg Met Leu Arg Ser Ser
1 5 10 15
Thr Leu Leu Arg Gly Leu Ala Ser Lys Ala Ala Gly Ala Gly Lys Lys
20 25 30
Pro Thr Val Val Phe Val Asp Gly Ala Arg Ile Pro Phe Ala Gln Ser
35 40 45
Ser Thr Val Tyr Asn Asp Tyr Leu Gly Val Asp Leu Gln Lys Phe Ala
50 55 60
Tyr Lys Gly Leu Val Asp Lys Thr Ala Leu Asp Pro Lys Glu Ile Asp
65 70 75 80
Tyr Ile Leu Gly Gly Asn Val Ile Gln Glu Val Arg Thr Ser Asn Ile
85 90 95
Ala Arg Glu Ala Ala Met Ala Ala Gly Leu Pro Thr Asp Ile Pro Ala
100 105 110
His Thr Val Val Leu Ala Cys Ile Ser Ser Asn Val Gly Ile Cys Ser
115 120 125
Ala Ala Glu Lys Val Leu Thr Glu His Ala Ser Leu Val Leu Ala Leu
130 135 140
Ile Thr Leu Pro Lys Ala Met Lys Lys Gly Pro Leu Gly Val Phe Lys
145 150 155 160
His Leu Ala Lys Leu Asn Phe Lys Asp Leu Gly Leu Glu Thr Pro Ala
165 170 175
Ile Ala Asn Tyr Thr Thr Gly Glu Val Met Gly His Ser Ser Asp Arg
180 185 190
Leu Ser Ala Lys Phe Gly Val Ser Arg Arg Glu Gln Asp Glu Phe Ala
195 200 205
Ala Leu Ser His Gln Arg Ala Ala Lys Ala His Lys Asp Gly Ile Tyr
210 215 220
Lys Asp Glu Ile Ile Pro Val Asp Gly Asn Thr Gly Glu Asn Gly Ile
225 230 235 240
Lys Gly Glu Ser Thr Ala Asp Thr Leu Ala Lys Leu Lys Pro Ala Phe
245 250 255
Val Lys Pro His Gly Thr His Thr Ala Ala Asn Ser Ser Phe Leu Ser
260 265 270
Asp Gly Ala Ser Ala Ser Leu Ile Ala Ser Glu Glu Lys Ala Leu Ser
275 280 285
Leu Gly Leu Lys Pro Lys Ala Phe Leu Arg Ala Trp Glu Phe Val Ala
290 295 300
Val Asp Pro Phe Glu Gln Leu Leu Leu Gly Pro Thr Tyr Ala Thr Ala
305 310 315 320
Lys Val Leu Ser Ala Ala Gly Leu Thr Leu Ala Asp Ile Asp Val Ile
325 330 335
Glu Ile His Glu Ala Phe Ala Gly Gln Val Leu Ser Asn Ile Arg Ala
340 345 350
Met Gly Ser Asp Lys Phe Ala Gln Glu Tyr Leu Asn Arg Ser Thr Lys
355 360 365
Val Gly Asp Ile Asp Met Ala Lys Thr Asn Leu His Gly Gly Ser Leu
370 375 380
Ser Leu Gly His Pro Phe Ala Ala Thr Gly Asn Arg Leu Val Thr Thr
385 390 395 400
Ala Ala Asn Arg Leu His Arg Glu Gly Gly Arg Tyr Ala Leu Val Thr
405 410 415
Ala Cys Ala Asp Gly Gly Leu Gly His Ala Cys Ile Ile Glu Lys Tyr
420 425 430
Glu
<210> 11
<211> 1173
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncB cDNA序列
<400> 11
atgccttcga cagtatttga cgcctttgtt gtggcattga gtgcaggatg cgcgcgggac 60
tttggctgca caattgtcgt ggagagaatg ctgcggtcct ctacgctcct ccggggcttg 120
gcgtccaaag ccgccggcgc cgggaagaaa cccaccgttg tattcgtcga cggagctcgc 180
atccctttcg cccaatcctc caccgtgtac aacgactacc tgggcgtgga cctacagaaa 240
ttcgcctaca agggtctggt ggataaaacg gcgttggacc cgaaggaaat cgactacatc 300
ctgggcggga acgttatcca agaagtccgt accagcaaca tcgccaggga agccgccatg 360
gccgctggcc tccccaccga catccccgcc cacaccgtcg tcctggcctg tatttcctcc 420
aacgtgggca tctgctccgc cgcggagaaa gtcttgactg agcacgccag cctggtcttg 480
gtgggggggg tggagacctt ctcggacgtg cctatccgcc tcacccgccc cctccgccag 540
gccctcataa ccctgcccaa ggcgatgaag aagggccctc tgggcgtctt caagcacctg 600
gcgaagctca acttcaagga tctgggcttg gagacccccg ccatcgccaa ctacaccacc 660
ggggaggtga tgggccactc ctcggaccga ctttcggcaa aattcggggt ttctcggcgg 720
gaacaggacg aatttgcggc cctctctcac caacgcgcag ccaaggcgca caaggacggc 780
atctacaagg acgagatcat ccccgtggac ggcaatacgg gcgagaacgg gatcaagggc 840
gagtctaccg cagataccct cgccaagctc aaaccggcct ttgtgaagcc tcacggcacc 900
cacaccgccg ccaacagctc cttcctctcg gacggcgcct cggcttccct ggagtacctg 960
aaccgatcca ccaaggtggg cgacatcgac atggcaaaga ccaatctgca cggaggctcc 1020
ctctccctcg gccacccctt cgccgctacc ggaaaccgat tggtgacgac ggcggcgaat 1080
cgcctgcacc gggagggagg gaggtacgcc ctggtcactg cctgcgcgga tggcggtttg 1140
ggccacgcct gtatcatcga gaaatatgag tga 1173
<210> 12
<211> 3517
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TrifuncB gDNA序列
<220>
<221> misc_feature
<222> (2249)..(2997)
<223> n是a、c、g或t
<400> 12
atgccttcga cagtatttga cgcctttgtt gtggcattga gtgcaggatg cgcgcgggac 60
tttggtaaat atggacttag tttcaccatc gtgttccaag catgaagtgg cggctctccc 120
ccctcgaata cgtcggctag gacgtggggc ctcttcccct tcctgatcat tcgctttacc 180
cctttcgtct tcacacacat ggacacaggc tgcacaattg tcgtggagag aatgctgcgg 240
tcctctacgc tcctccgggg cttggcgtcc aaagccgccg gcgccgggaa gaaacccacc 300
gttgtattcg tcgacggagc tcgcatccct ttcgcccaat cctccaccgt gtacaacgac 360
tacctgggcg tggacctaca gaaattcgcc tacaagggtc tggtggataa aacggcgttg 420
gacccgaagg aaatcgacta catcctgggc gggaacggta agcctgaagc aagggggggg 480
gggagatcgt gctggcatgt atactcaaag atcaagccct ctcaatgata atcacgagtt 540
ttcctgctcg ggccttgtcc aatgatactc actaactccc ggcccttttc tccgctcgaa 600
ggatgatggg gagggaagtg atgaggacgg aggagtctca caaccgtgtg atggggaggg 660
acgagagagg gcaacccccg aggcctcaag cctcgctcgt gccggtcctg gtccgcttcc 720
gccttctcaa ggcttacatc ctttcccttc ctccctccct tcttccctcc ccccctcctt 780
ccctccctcc ccatctcagt tatccaagaa gtccgtacca gcaacatcgc cagggaagcc 840
gccatggccg ctggcctccc caccgacatc cccgcccaca ccgtcgtcct ggcctgtatt 900
tcctccaacg tgggcatctg ctccgccgcg ggtaggtcct ccctccccgt cctccggccc 960
gaagccctgt ctttgcctgc cctccctccc tccctccctc cctccctccc tccctccctc 1020
cctccctccc tccctccctc cctccctccc tccctccctc cctccctccc tccctccctc 1080
cctccctccc tccctgcctg cctcgctcct cccctcctct ctcccctcca agctcagagg 1140
aaatcttgat tccccttccc cccttccttt ctccctcgct ccctccctcc ctccctcccc 1200
agagaaagtc ttgactgagc acgccagcct ggtcttggtg gggggggtgg agaccttctc 1260
ggacgtgcct atccgcctca cccgccccct ccgccaggcc ctcataaccc tgcccaaggc 1320
gatgaagaag ggccctctgg gcgtcttcaa gcacctggcg aagctcaact tcaaggtgcg 1380
tgttgtcttc tccttaagct gttcgggtca gacctccccc cccttccttt cccatcaccg 1440
attttgctca aacacatgta ccaaggagag gttgtgaagg atggttactg gagaggcata 1500
ttttttcatg gagtcgccct cctttcttcc attctcttcc tccgcctctc cctcctcccc 1560
atgcctttgt tcatcttccc tcccttcctc cctccttccc tccttcccct gctaggatct 1620
gggcttggag acccccgcca tcgccaacta caccaccggg gaggtgatgg gccactcctc 1680
ggaccgactt tcggcaaaat tcggggtttc tcggcgggaa cagggtaggg ggggagggag 1740
agggaaggga gctagggaga agcagaggga cgagaagagg ggccgggggg gggcgggggt 1800
tattactcac cacacgtccc tatggatgtt tctcgcttcc tcttgacgcg cagacgaatt 1860
tgcggccctc tctcaccaac gcgcagccaa ggcgcacaag gacggcatct acaaggacgt 1920
gcgtcctccc tccctccttc cctccctcct tccctcctac cttcccttct accttccctc 1980
cctgcttcct atttcgccat ttatcgtgca gcgcagtcgt tcgtgccctc aggtcacctc 2040
ctcccttcct ccctccctcc ctccctccct ccctccctca ggagatcatc cccgtggacg 2100
gcaatacggg cgagaacggg atcaagggcg agtctaccgc agataccctc gccaagctca 2160
aaccggcctt tgtgaagcct cacggcaccc acaccgccgc caacagctcc ttcctctcgg 2220
acggcgcctc ggcttccctg gtgagggann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2280
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2340
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2940
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnntca 3000
ttccttcagg agtacctgaa ccgatccacc aaggtgggcg acatcgacat ggcaaagacc 3060
aatctgcacg gaggctccct ctccctcggc caccccttcg ccgctaccgg tagggaggga 3120
gggagggagg gagggacaga tgatccccga cgaaatagtt gttggcttcc tcgttcagcc 3180
cgtcatggcg tatcggcact tccttgtgat tttcttccac gctcatcgtc tttcatcgat 3240
gcggccatgc gcgtgcgtcc ctgctgtctg tcccccaacc cttctccctc cgttctcatc 3300
acatttgatc aaagtattcc ctttgtttat ggagcttacc ttgccattcc tctctctttg 3360
tcgggggaaa aatccaaatc ctccaaatcc atcaggaaac cgattggtga cgacggcggc 3420
gaatcgcctg caccgggagg gagggaggta cgccctggtc actgcctgcg cggatggcgg 3480
tttgggccac gcctgtatca tcgagaaata tgagtga 3517
<210> 13
<211> 472
<212> PRT
<213> 假微型海链藻(Thalassiosira pseudonana)
<220>
<221> misc_feature
<223> CCMP1335 TrifuncB
<400> 13
Met Ile Thr Ala Arg Leu Leu Lys Gln Gly Met Ser Ser Pro Ser Ser
1 5 10 15
Ser Ser Ser Ser Ser Arg Leu Ala Ala Ile Thr Ser Arg Ala Ala Thr
20 25 30
Ser Leu Val Thr Ser Asn Ser Phe Ser Thr Thr Ser Thr Lys Leu Lys
35 40 45
Asn Pro Lys Thr Asn Val Val Ile Val Asp Gly Ile Arg Leu Pro Phe
50 55 60
Ala Gln Thr Thr Thr Ile Tyr Gln Asp Gln Leu Ala Val Asp Leu Gln
65 70 75 80
Arg Leu Ala Tyr Gln Gly Leu Ile Thr Lys Thr Ala Leu Asp Lys Lys
85 90 95
Asp Val Asp Tyr Val Met Ala Gly Thr Val Ile Gln Glu Val Arg Thr
100 105 110
Ser Asn Leu Ala Arg Glu Ala Ala Ile Asn Ala Gly Phe Pro Ala Ser
115 120 125
Ile Gly Ala His Thr Val Ala Met Ala Cys Ile Ser Ser Ser Val Ala
130 135 140
Ile Thr Ser Ala Ala Glu Lys Ile Leu Ser Gly His Ala Ser Ile Val
145 150 155 160
Ile Ala Gly Gly Ala Glu Thr Phe Ser Asp Val Pro Ile Arg Leu Thr
165 170 175
Arg Pro Ile Arg Gln Lys Leu Ile Thr Met Pro Lys Ala Met Lys Lys
180 185 190
Gly Gly Ala Leu Gly Ala Ile Arg His Leu Thr Lys Gly Leu Lys Met
195 200 205
Lys Asp Ile Ser Leu Glu Thr Pro Ala Ile Ala Asn Tyr Thr Thr Gly
210 215 220
Glu Val Met Gly Val Ser Ser Asp Arg Leu Ser Ala Lys Phe Gly Ile
225 230 235 240
Thr Arg Leu Glu Gln Asp Glu Phe Thr Thr Asp Gly Leu Pro Arg Val
245 250 255
Val Val Ser Ser Trp Tyr Asp Gly Glu Ile Val Pro Tyr Lys Gly Ser
260 265 270
Thr Glu Glu Asn Gly Ile Lys Ala Asp Ser Thr Ile Glu Ser Val Ser
275 280 285
Lys Leu Lys Pro Ala Phe Val Lys Pro His Gly Thr His Thr Ala Ala
290 295 300
Asn Ser Ser Phe Leu Thr Asp Gly Ala Ser Ala Ser Leu Ile Met Ser
305 310 315 320
Glu Glu Arg Ala Leu Glu Leu Gly Tyr Lys Pro Leu Ala Tyr Leu Arg
325 330 335
Asp Trp Ser Phe Lys Ala Cys Asp Pro Phe Glu Glu Leu Leu Leu Gly
340 345 350
Pro Thr Tyr Cys Ser Gln Glu Val Leu Ser Arg Asn Asn Leu Asn Leu
355 360 365
Glu Thr Asp Ile Gly Val Phe Glu Ile His Glu Ala Phe Ala Gly Gln
370 375 380
Ile Leu Ser Asn Leu Thr Ala Met Asn Ser Gln Lys Phe Ala Asp Glu
385 390 395 400
Lys Phe Gly Gly Lys Lys Val Gly Glu Ile Asp Met Arg Lys Met Asn
405 410 415
Thr Lys Gly Gly Ser Leu Ala Leu Gly His Pro Phe Gly Ala Thr Gly
420 425 430
Ser Arg Leu Val Thr Thr Ala Ser Arg Arg Leu Gln Leu Glu Asn Gln
435 440 445
Arg Phe Ala Leu Ile Ala Ala Cys Ala Asp Gly Gly Leu Gly His Ala
450 455 460
Cys Ile Leu Glu Arg Tyr Asp Asn
465 470
<210> 14
<211> 457
<212> PRT
<213> 三角褐指藻(Phaeodactylum tricornutum)
<220>
<221> misc_feature
<223> CCAP 1055/1 TrifuncB
<400> 14
Met Leu Ser Thr Ser Val Arg Ala Ile Ser Arg Gly Ser Pro Leu Val
1 5 10 15
Gln Thr Ala Ala Arg Arg Ser Leu Ala Ser Leu Ala Leu Thr Pro Asn
20 25 30
Asp Pro Val Val Val Val Ser Gly Val Arg Leu Pro Phe Ala Met Thr
35 40 45
Ser Thr Ile Tyr Glu Asp Gln Leu Ala Val Asp Leu Gln Arg Leu Ala
50 55 60
Ile Gln Gly Leu Leu Thr Gln Thr Ala Leu Pro Lys Ser Glu Val Asp
65 70 75 80
Tyr Val Ile Ala Gly Asn Val Ile Gln Glu Val Arg Thr Ser Asn Ile
85 90 95
Ala Arg Glu Ala Ser Ile Asn Ala Gly Leu Pro Leu His Val Gly Ala
100 105 110
His Thr Ile Ala Gln Ala Cys Ile Ser Ala Asn Ala Ala Ile Cys Ala
115 120 125
Gly Ala Glu Lys Ile Leu Thr Gly His Ala Ser Val Val Ile Ala Gly
130 135 140
Gly Cys Glu Thr Phe Ser Asp Val Pro Ile Arg Leu Thr Arg Pro Ile
145 150 155 160
Arg Gln Lys Leu Ile Thr Met Asn Lys Ala Met Lys Lys Gly Gly Met
165 170 175
Val Gly Gly Ile Ser His Leu Leu Lys Gly Leu Ser Leu Lys Asp Val
180 185 190
Ser Val Glu Thr Pro Ala Ile Ala Asn Tyr Thr Thr Gly Glu Val Met
195 200 205
Gly Val Ser Ser Asp Arg Leu Ala Ala Lys Phe Gly Val Ser Arg His
210 215 220
Asp Gln Asp Ala Phe Thr Val Arg Ser His Thr Met Ala Ala Lys Ala
225 230 235 240
His Thr Asp Gly Phe Tyr Lys Asn Glu Val Val Pro Tyr Lys Gly Ser
245 250 255
Thr Gln Glu Asn Gly Ile Lys Gly Asp Ser Thr Ile Glu Ser Val Ala
260 265 270
Lys Leu Lys Pro Ala Phe Val Lys Pro His Gly Thr His Thr Ala Ala
275 280 285
Asn Ser Ser Phe Leu Thr Asp Gly Ala Ala Ala Thr Leu Ile Met Ser
290 295 300
Glu Ser Lys Ala Lys Glu Leu Gly Tyr Lys Pro Leu Ala Tyr Leu Arg
305 310 315 320
Asp Trp Ser Phe Lys Ala Cys Asp Pro Phe Glu Glu Leu Leu Leu Gly
325 330 335
Pro Thr Tyr Cys Ser Gln Glu Ile Leu Ala Arg Asn Lys Leu Gln Met
340 345 350
Ser Asp Met Gly Val Leu Glu Ile His Glu Ala Phe Ala Gly Gln Ile
355 360 365
Leu Ala Asn Leu Thr Ala Met Glu Ser Gln Thr Phe Ala Asp Lys Asn
370 375 380
Phe Gly Gly Lys Ile Val Gly Lys Val Asp Val Asp Lys Met Asn Thr
385 390 395 400
Lys Gly Gly Ser Leu Ala Leu Gly His Pro Phe Gly Ala Thr Gly Ser
405 410 415
Arg Leu Val Ser Thr Ala Ser Arg Arg Leu Gln His Glu Gly Ala Arg
420 425 430
Phe Ala Leu Leu Ala Ala Cys Ala Asp Gly Gly Met Gly His Ala Cys
435 440 445
Leu Leu Glu Arg Tyr Asp Asn Asp Asn
450 455
<210> 15
<211> 450
<212> PRT
<213> 圆柱拟脆杆藻(Fragilariopsis cylindrus)
<220>
<221> misc_feature
<223> CCMP1102 TrifuncB
<400> 15
Met Ile Ser Ser Gln Lys Leu Val Arg Pro Leu Leu Thr Ala Gln Arg
1 5 10 15
Arg Leu Phe Ser Leu Arg Pro Ile Ala Gly Gly Arg Asp Val Val Ile
20 25 30
Val Ser Gly Val Arg Leu Pro Phe Ala Gln Ala Ser Thr Ile Tyr Gln
35 40 45
Asp Glu Met Ala Val Asp Leu Gln Arg Leu Ala Ile Lys Gly Leu Ile
50 55 60
Asp Gln Thr Ala Leu Pro Lys Asp Ala Ile Asp Tyr Val Val Cys Gly
65 70 75 80
Asn Val Ile Gln Glu Val Lys Thr Ser Asn Ile Ala Arg Glu Ala Ala
85 90 95
Ile Asn Ala Gly Leu Pro Tyr Asn Ile Pro Ser His Thr Ile Ala Gln
100 105 110
Ala Cys Ile Ser Ala Asn Ala Ala Ile Ala Thr Gly Ala Ala Ala Ile
115 120 125
Gln Ser Gly His Ala Asp Val Val Ile Ala Gly Gly Val Glu Thr Phe
130 135 140
Ser Asp Val Pro Ile Arg Leu Ser Arg Pro Ile Arg Gln Lys Leu Ile
145 150 155 160
Thr Leu Pro Lys Ala Met Lys Lys Gly Gly Pro Ile Gly Ala Val Arg
165 170 175
His Met Leu Lys Gly Leu Lys Met Lys Asp Leu Ser Leu Glu Thr Pro
180 185 190
Ala Ile Ala Asn Phe Thr Thr Gly Glu Val Met Gly Val Ser Ser Asp
195 200 205
Lys Leu Ser Ala Lys Phe Gly Ile Ser Arg Gln Glu Gln Asp Glu Phe
210 215 220
Thr Val Arg Ser His Thr Leu Ala His Lys Ala His Asp Asp Gly Phe
225 230 235 240
Tyr Lys Asp Glu Ile Ile Pro Tyr Arg Gly Ser Ile Ala Glu Asn Gly
245 250 255
Ile Lys Gly Asn Ser Ser Tyr Glu Ser Val Ser Lys Leu Lys Ala Ala
260 265 270
Phe Val Lys Pro Asn Gly Thr His Thr Ala Ala Asn Ser Ser Phe Leu
275 280 285
Thr Asp Gly Ala Ala Ala Thr Leu Ile Met Ser Glu Glu Lys Ala Lys
290 295 300
Glu Leu Gly Tyr Lys Pro Leu Ala Tyr Leu Arg Asp Trp Ser Phe Lys
305 310 315 320
Ser Cys Asp Pro Trp Glu Glu Leu Leu Leu Gly Pro Thr Tyr Cys Thr
325 330 335
Gln Asp Ile Leu Gln Arg Asn Ser Met Ser Ile Asn Asp Phe Gly Val
340 345 350
Phe Glu Ile His Glu Ala Phe Ala Gly Gln Ile Leu Ser Asn Leu Ala
355 360 365
Ala Met Asp Ser Asp Ile Phe Ala Lys Glu Lys Gly Trp Ser Lys Lys
370 375 380
Val Gly Ala Ile Asp Phe Asp Lys Met Asn Ile Lys Gly Gly Ser Leu
385 390 395 400
Ser Ile Gly His Pro Phe Gly Ala Thr Gly Ser Arg Leu Val Thr Thr
405 410 415
Ala Ala Arg Arg Leu Gln Glu Glu Gly Gln Gln Phe Ala Leu Ile Ala
420 425 430
Ala Cys Ala Asp Gly Gly Leu Gly His Ala Cys Leu Leu Glu Arg Tyr
435 440 445
Asp Asn
450
<210> 16
<211> 451
<212> PRT
<213> 赫氏颗石藻(Emiliania huxleyi)
<220>
<221> misc_feature
<223> CCMP1516 TrifuncB
<400> 16
Met Leu Gln Leu Ser Thr Arg Leu Arg Ala Val Arg Pro Ala Ile Val
1 5 10 15
Arg Ala Arg Ala Arg Ser Thr Ala Ala Ser Thr Gly Gln Lys Lys Val
20 25 30
Val Leu Val Asp Gly Cys Arg Ile Pro Phe Gln Pro Ser Arg Gly Glu
35 40 45
Tyr Phe Asp Leu Met Ser Tyr Asp Leu Thr Arg Leu Ala Met His Gly
50 55 60
Leu Leu Thr Lys Thr Ala Val Asp Pro Lys Ala Ile Asp Tyr Val Leu
65 70 75 80
Trp Gly Lys Val Ile Gln Glu Pro Lys Thr Ser Asn Ile Ala Arg Asp
85 90 95
Ala Ala Phe Ala Ala Gly Ile Pro Arg Gly Val Pro Ala His Thr Val
100 105 110
Thr Gln Ala Cys Ile Ser Ser Asn Gln Ala Ile Cys Thr Gly Ala Ser
115 120 125
Gln Ile Leu Ser Gly Gln Ala Glu Val Val Leu Ala Gly Gly Val Glu
130 135 140
Thr Phe Ser Asp Ala Pro Ile Arg Tyr Ser Arg Pro Ile Arg Lys Lys
145 150 155 160
Leu Ile Lys Met Ser Lys Ala Lys Ser Pro Gly Gln Met Ala Ser Ile
165 170 175
Phe Phe Lys Gly Leu Lys Met Lys Asp Leu Ala Pro Glu Gln Pro Ala
180 185 190
Ile Ala Asn Phe Leu Thr Gly Glu Val Met Gly His Asn Ala Asp Arg
195 200 205
Leu Ser Asp Arg Phe Gly Val Ser Arg Arg Glu Gln Glu Glu Phe Ala
210 215 220
Leu Arg Ser His Leu Asn Ala Ala Asn Ala His Ala Asp Gly Phe Tyr
225 230 235 240
Asp Gly Glu Val Ile Ala Gly Pro Gly Gly Lys Thr Leu Glu Asp Gly
245 250 255
Pro Arg Ala Asp Ser Ser Leu Glu Lys Met Ala Thr Leu Lys Pro Ala
260 265 270
Phe Val Lys Pro His Gly Thr Val Thr Ala Ala Ser Ala Ser Pro Phe
275 280 285
Thr Asp Gly Ala Ser Ala Thr Leu Leu Met Ser Asp Gly Lys Ala Ser
290 295 300
Glu Leu Gly Leu Ser Pro Lys Ala Glu Leu Leu Ala Tyr Ala Phe Val
305 310 315 320
Ala Cys Asp Pro Phe Glu Glu Leu Leu Leu Gly Pro Thr Tyr Gly Ala
325 330 335
Ser Lys Val Leu Arg Met Ala Gly Leu Ser Leu Lys Asp Ile Asp Val
340 345 350
Ile Glu Phe His Glu Ala Phe Ala Gly Gln Val Leu Ser Asn Leu Val
355 360 365
Ala Met Asp Ser Asp Lys Phe Phe Ala Glu Asn Leu Pro Gly Val Asp
370 375 380
Lys Val Gly Ser Val Asp Met Thr Lys Leu Asn Thr Lys Gly Gly Ser
385 390 395 400
Leu Ser Ile Gly His Pro Phe Gly Ala Thr Gly Ala Arg Leu Val Thr
405 410 415
Thr Ala Ala Asn Arg Leu Val Lys Glu Gly Gly Thr Tyr Ala Leu Val
420 425 430
Ala Ala Cys Ala Asp Gly Gly Leu Gly His Ala Cys Ile Leu Lys Arg
435 440 445
Tyr Gly Ala
450
<210> 17
<211> 451
<212> PRT
<213> 赫氏颗石藻(Emiliania huxleyi)
<220>
<221> misc_feature
<223> CCMP1516 TrifuncB
<400> 17
Met Leu Gln Leu Ser Thr Arg Leu Arg Ala Val Arg Pro Ala Ile Val
1 5 10 15
Arg Ala Arg Ala Arg Ser Thr Ala Ala Ser Thr Gly Gln Lys Lys Val
20 25 30
Val Leu Val Asp Gly Cys Arg Ile Pro Phe Gln Pro Ser Arg Gly Glu
35 40 45
Tyr Phe Asp Leu Met Ser Tyr Asp Leu Thr Arg Leu Ala Met His Gly
50 55 60
Leu Leu Thr Lys Thr Ala Val Asp Pro Lys Ala Ile Asp Tyr Val Leu
65 70 75 80
Trp Gly Lys Val Ile Gln Glu Pro Lys Thr Ser Asn Ile Ala Arg Asp
85 90 95
Ala Ala Phe Ala Ala Gly Ile Pro Arg Gly Val Pro Ala His Thr Val
100 105 110
Thr Gln Ala Cys Ile Ser Ser Asn Gln Ala Ile Cys Thr Gly Ala Ser
115 120 125
Gln Ile Leu Ser Gly Gln Ala Glu Val Val Leu Ala Gly Gly Val Glu
130 135 140
Thr Phe Ser Asp Ala Pro Ile Arg Tyr Ser Arg Pro Ile Arg Lys Lys
145 150 155 160
Leu Ile Lys Met Ser Lys Ala Lys Ser Pro Gly Gln Met Ala Ser Ile
165 170 175
Phe Phe Lys Gly Leu Lys Met Lys Asp Leu Ala Pro Glu Gln Pro Ala
180 185 190
Ile Ala Asn Phe Leu Thr Gly Glu Val Met Gly His Asn Ala Asp Arg
195 200 205
Leu Ser Asp Arg Phe Gly Val Ser Arg Arg Glu Gln Glu Glu Phe Ala
210 215 220
Leu Arg Ser His Leu Asn Ala Ala Asn Ala His Ala Asp Gly Phe Tyr
225 230 235 240
Asp Gly Glu Val Ile Ala Gly Pro Gly Gly Lys Thr Leu Glu Asp Gly
245 250 255
Pro Arg Ala Asp Ser Ser Leu Glu Lys Met Ala Thr Leu Lys Pro Ala
260 265 270
Phe Val Lys Pro His Gly Thr Val Thr Ala Ala Ser Ala Ser Pro Phe
275 280 285
Thr Asp Gly Ala Ser Ala Thr Leu Leu Met Ser Asp Gly Lys Ala Ser
290 295 300
Glu Leu Gly Leu Ser Arg Lys Ala Glu Leu Leu Ala Tyr Ala Phe Val
305 310 315 320
Ala Trp Asp Pro Leu Glu Glu Leu Leu Leu Gly Pro Thr Tyr Gly Ala
325 330 335
Ser Lys Val Leu Arg Met Pro Gly Leu Ser Leu Lys Asp Ile Asp Val
340 345 350
Ile Glu Phe His Glu Ala Phe Ala Gly Gln Val Leu Ser Asn Leu Val
355 360 365
Ala Met Asp Ser Asp Lys Phe Phe Ala Glu Asn Leu Pro Gly Val Asp
370 375 380
Lys Val Gly Ser Val Asp Met Thr Lys Leu Asn Thr Lys Gly Gly Ser
385 390 395 400
Leu Ser Ile Gly His Pro Phe Gly Ala Thr Gly Ala Arg Leu Val Thr
405 410 415
Thr Ala Ala Asn Arg Leu Val Lys Glu Gly Gly Thr Tyr Ala Leu Val
420 425 430
Ala Ala Cys Ala Asp Gly Gly Leu Gly His Ala Cys Ile Leu Lys Arg
435 440 445
Tyr Gly Ala
450
<210> 18
<211> 449
<212> PRT
<213> 抑食金球藻(Aureococcus anophagefferens)
<220>
<221> misc_feature
<223> TrifuncB
<400> 18
Met Leu Gly Leu Lys Ser Leu Ser Ser Arg Ala Leu Ser Ser Arg Ala
1 5 10 15
Arg Ser Leu Ser Thr Gly Gly Lys Asn Val Val Ile Val Asp Gly Val
20 25 30
Arg Ile Pro Phe Ala Leu Ser Gln Thr Ile Tyr Gln Asp Val Met Ala
35 40 45
Val Asp Leu Ala Lys Met Ser Leu Thr Gly Leu Met Gln Lys Thr Gly
50 55 60
Leu Asp Ala Ser Leu Val Asp Tyr Val Leu Tyr Gly Thr Val Ile Gln
65 70 75 80
Glu Ser Arg Thr Ser Asn Ile Ala Arg Glu Ala Ala Met His Ala Gly
85 90 95
Tyr Pro Ile Asp Val Pro Ala His Thr Val Thr Leu Ala Cys Val Ser
100 105 110
Ser Asn Ala Ala Ile Cys Gln Gly Ala Glu Lys Ile Leu Ala Gly Gln
115 120 125
Ala Asp Val Val Val Ala Gly Gly Cys Glu Thr Phe Ser Asp Val Pro
130 135 140
Ile Arg Tyr Ser Arg Pro Val Arg Lys Arg Leu Leu Gly Ala Ala Lys
145 150 155 160
Ala Leu Lys Lys Gly Pro Ala Gly Ala Leu Gly Leu Leu Lys Gly Leu
165 170 175
Lys Leu Lys Asp Leu Ala Pro Glu Ala Pro Ser Ile Ser Asn Phe Thr
180 185 190
Thr Gly Glu Val Met Gly His Ser Ser Asp Arg Leu Ala Ala Lys Phe
195 200 205
Gly Ile Ser Arg Lys Asp Gln Asp Asp Tyr Thr Leu Met Ser His Thr
210 215 220
Arg Ala Gln Gln Ala His Asp Asp Gly Leu Tyr Ala Glu Glu Leu Val
225 230 235 240
Pro Gly Val Gln Gly Ala Asp Leu Ser Glu Asn Gly Ile Lys Ala Gly
245 250 255
Ser Thr Pro Glu Lys Leu Ala Lys Leu Lys Pro Ala Phe Ile Lys Asn
260 265 270
Glu Thr Gly Thr His Thr Ala Ala Asn Ser Ser Phe Leu Thr Asp Gly
275 280 285
Ala Ala Ala Thr Leu Val Met Ser Glu Glu Lys Ala Leu Ala Leu Gly
290 295 300
Phe Lys Pro Lys Ala Tyr Leu Arg His Trp Thr Phe Ala Ala Val Asp
305 310 315 320
Pro Phe Glu Glu Leu Leu Leu Gly Pro Thr Tyr Ala Val Ser Lys Val
325 330 335
Leu Asn Asp Ala Lys Leu Asp Leu Lys Asp Val Gly Val Val Glu Met
340 345 350
His Glu Ala Phe Ala Gly Gln Val Leu Ser Asn Phe Ala Ala Met Asn
355 360 365
Ser Asp Lys Phe Ala Ala Asp Phe Leu Pro Asn Arg Thr Gln Lys Leu
370 375 380
Gly Glu Met Asp Phe Ala Lys Val Asn Thr Gln Gly Gly Ser Leu Ser
385 390 395 400
Leu Gly His Pro Phe Gly Ala Thr Gly Ser Arg Ile Val Thr Thr Ala
405 410 415
Ser Asn Arg Leu Gln Arg Ser Gly Glu Gln Phe Ala Leu Val Ala Ala
420 425 430
Cys Ala Asp Gly Gly Ile Gly His Ser Cys Leu Leu Glu Arg Tyr Pro
435 440 445
Asn
<210> 19
<211> 472
<212> PRT
<213> 长囊水云病毒(Ectocarpus siliculosus virus)
<220>
<221> misc_feature
<223> 乙酰基-CoA乙酰基转移酶亚基,推定的线粒体前体乙酰基-CoA
<400> 19
Met Val His Gln Gly Val Thr Ala Thr Met Arg Ser Ala Arg Ala Ala
1 5 10 15
Met Val Ser Ser Arg Ala Ala Ala Ala Ala Ala Ala Arg Ala Ser Cys
20 25 30
Gly Arg Arg Ala Asn Ser Ser Ser Ala Ser Ser Ser Ser Ser Ser Ser
35 40 45
Ser Arg Lys Pro Val Phe Val Asp Gly Ala Arg Ile Pro Phe Val Leu
50 55 60
Ser Gly Thr Thr Tyr Lys Asp Leu Leu Ala Val Asp Leu Gly Lys Leu
65 70 75 80
Ala Leu Arg Gly Leu Leu Asn Arg Asn Pro Glu Leu Asp Pro Lys Asp
85 90 95
Val Asp Tyr Leu Leu Phe Gly Thr Val Ile Gln Glu Ser Arg Thr Ser
100 105 110
Asn Ile Ala Arg Glu Ala Gly Met Gly Ala Gly Ile Pro Val Ser Val
115 120 125
Pro Ser His Thr Val Ser Gln Ala Cys Ile Ser Ala Asn Gln Ala Met
130 135 140
Cys Asn Gly Ala Glu Lys Ile Leu Ala Gly Thr Ala Asp Val Val Leu
145 150 155 160
Ala Gly Gly Val Glu Thr Phe Ser Asp Leu Pro Ile Arg Phe Ser Arg
165 170 175
Pro Ile Arg Asn Arg Leu Leu Asn Leu Gly Lys Ala Lys Lys Lys Gly
180 185 190
Leu Pro Gly Val Leu Gly Leu Leu Lys Gly Leu Lys Leu Lys Asp Ile
195 200 205
Ala Pro Glu Thr Pro Ala Ile Ala Asn Tyr Thr Thr Gly Glu Val Met
210 215 220
Gly His Ser Ser Asp Arg Leu Ser Gly Arg Phe Gly Ile Ser Arg Gln
225 230 235 240
Glu Gln Asp Glu Phe Ala Leu Arg Ser His Gln Asn Ala Ala Lys Ala
245 250 255
His Ala Asp Gly Ile Tyr Asp Gln Glu Ile Ile Pro Val Asp Gly Ser
260 265 270
Thr Asp Glu Asn Gly Val Lys Gly Glu Ser Thr Leu Glu Lys Leu Gly
275 280 285
Ser Leu Lys Pro Ala Phe Val Lys Pro His Gly Thr His Thr Ala Ala
290 295 300
Asn Ser Ser Phe Leu Ser Asp Gly Ala Ser Ala Ala Leu Ile Met Ser
305 310 315 320
Glu Gly Arg Ala Leu Glu Met Gly Leu Ala Pro Arg Ser Ser Phe Lys
325 330 335
Ser Trp Ala Phe Val Ala Leu Asp Pro Phe Glu Asp Leu Leu Leu Gly
340 345 350
Pro Ala Phe Gly Ala Ala Lys Val Leu Asp Asp Ala Gly Leu Thr Leu
355 360 365
Ser Asp Ile Asp Val Phe Glu Ile His Glu Ala Phe Ala Gly Gln Val
370 375 380
Leu Ser Asn Leu Ala Ala Met Asn Ser Thr Asp Phe Ala Gln Lys Ser
385 390 395 400
Met Gly Arg Ser Ala Lys Leu Gly Glu Val Pro Met Glu Lys Leu Asn
405 410 415
Ile His Gly Gly Ser Leu Ser Leu Gly His Pro Phe Gly Ala Thr Gly
420 425 430
Val Arg Leu Val Ala Thr Ala Thr Asn Arg Leu His Arg Glu Gly Gly
435 440 445
Arg Tyr Ala Leu Val Ala Ala Cys Ala Asp Gly Gly Leu Gly His Ala
450 455 460
Cys Ile Val Glu Arg Tyr Asp Ser
465 470
<210> 20
<211> 843
<212> PRT
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> PXA氨基酸
<400> 20
Met Ala Pro Ser Phe Ser His Arg Gly Gln Lys Arg His Asp Asn Val
1 5 10 15
Val Ser Ala Phe Phe Asn Ser Phe Met Ser Ala Gly Glu Gln Lys Phe
20 25 30
Thr Val Val Ser Ser Leu Phe Ser Ser Gly Leu Phe Leu Val Ala Leu
35 40 45
Ala Leu Val Lys Gln Leu Ser Ser Leu Gln Glu Gln Glu Glu Lys Val
50 55 60
Ala Ala Ser Leu Glu Arg Gln Asp Pro Ser Lys Glu Gly Gly Ser Leu
65 70 75 80
Ala Ala Pro Leu Pro Gln Pro Asp Gly Arg Cys Gln Thr Pro Gln Pro
85 90 95
Pro Pro Pro Ser Pro Pro Pro Ser Ala Ser Pro Ser Ser Phe Ser Ala
100 105 110
Thr Ser Thr Ala Arg Thr Arg Ser Pro Asn Ala Asp Ala Leu Thr Arg
115 120 125
Ser Gly Arg Asp Ala Ala Gly His Gly Glu Arg Gly Ser Gly Gly Met
130 135 140
Arg Arg Pro Gly Gly Pro Pro Leu Pro Gln Glu Gly Gln Arg Val Ala
145 150 155 160
Leu Asp Asp Glu Phe Gly Arg Gln Leu Leu Ser Leu Leu His Lys Leu
165 170 175
Ile Pro Ser Trp Lys Thr Arg Glu Ala Ala Cys Leu Gly Gly Met Val
180 185 190
Phe Leu Leu Leu Ala Arg Ser Ala Cys Asp Leu Arg Met Ile Asn Leu
195 200 205
Val Val Gly Ala Glu Lys Ala Ile Val Leu Gly Asn Arg Pro Ala Phe
210 215 220
Arg Ile Ser Leu Ala Arg Phe Leu Arg Phe Met Val Pro Val Ala Cys
225 230 235 240
Val Asn Ala Leu Leu Lys Tyr Thr Thr Arg Glu Leu Ser Leu Gly Leu
245 250 255
Arg Gln Arg Leu Thr Glu His Leu Gln Ser Lys Tyr Met Lys Gly Phe
260 265 270
Thr Phe Tyr Ser Met Ala Val Met Glu Gly His Ala Arg Glu Ile Glu
275 280 285
Gln Leu Met Thr Val Asp Val Asp Lys Phe Ser Leu Cys Ile Thr Glu
290 295 300
Leu Ala Ser Asn Leu Leu Lys Pro Thr Leu Asp Ile Leu Leu Tyr Ala
305 310 315 320
Thr Lys Leu Gln Thr Ser Val Gly Pro Leu Ile Pro Leu Ala Met Ala
325 330 335
Ser Tyr Leu Phe Ser Ser Gly Thr Ala Leu Thr Arg Leu Arg Arg Pro
340 345 350
Ala Ala Glu Tyr Thr Ala Ala Ile Gln Arg Arg Glu Gly Asp Tyr Arg
355 360 365
Phe Val Thr Asn Arg Met Val Ala His Ala Glu Glu Ile Ala Phe Tyr
370 375 380
Asp Gly Val Gly Arg Glu Lys Asn Tyr Leu Gln Gln Ile Phe Gly Ser
385 390 395 400
Leu Leu Gly Thr Ile Arg Arg Gly Ser Arg Phe Arg His Ala Met Asp
405 410 415
Ile Leu Asp Ser Val Met Ala Lys Tyr Ile Ala Thr Ala Leu Gly Trp
420 425 430
Val Leu Leu Asn Arg Ala Ala Gln Gln Gln Lys Gln Glu Ala Leu Pro
435 440 445
Val Pro Ser Pro Ala Leu Pro Pro Ser Pro Ala Ala Ser Ser Tyr Asp
450 455 460
Ser Phe His Gln Ser Ala Arg Met Met Phe Asn Phe Ala Gln Ala Leu
465 470 475 480
Ser Ala Ile Val Leu Ala Gly Arg Glu Ala Thr Arg Leu Ala Gly Tyr
485 490 495
Thr Ser Arg Val Thr Arg Leu Glu Arg Leu Ile Asp Asp Leu Glu Arg
500 505 510
Glu Asp Glu Ala Arg Ser Thr Ala Ser Glu Phe Leu Glu Lys Lys Asp
515 520 525
Val Ile Glu Leu Gln Gly Val Pro Ile Val Ala Pro Val Val Gly Asn
530 535 540
Gly Arg Lys Asp Ser Asp Gly Gly Arg Gly Gly Arg Lys Gly Arg Glu
545 550 555 560
Gly Gly Arg Val Arg Arg Leu Thr Ser Pro Leu Thr Leu Arg Ile Glu
565 570 575
Pro Gly Met His Val Leu Val Thr Gly Pro Asn Gly Ser Gly Lys Ser
580 585 590
Ser Leu Phe Arg Met Ile Cys Gly Leu Trp Pro Val Ser Glu Gly Arg
595 600 605
Leu Ile Lys Pro Pro Arg Ser Gln Leu Phe Tyr Ile Pro Gln Arg Pro
610 615 620
Tyr Leu Pro Leu Gly Ser Leu Arg Asp Gln Val Ile Tyr Pro His Ser
625 630 635 640
Gln Ala Glu Met Ala Ala Leu Gly Arg Thr Asp Ala Asp Val Leu Ala
645 650 655
Leu Leu Asp Glu Val Gln Leu Ser Phe Leu Ala Pro Pro Arg Val Val
660 665 670
Gly Pro Glu Ser Asn Ala Ser Asp Ala Leu Pro Ser Leu Pro Ser Ser
675 680 685
Leu Pro Ser Ser Leu Pro Ser Ser Leu Pro Pro Ser Phe Pro Ser Phe
690 695 700
Ser Ser Leu Ala Gln Val Leu Thr Arg Pro Ser Pro Thr Thr Pro Glu
705 710 715 720
Glu Glu Glu Gly Arg Glu Gly Gly Arg Glu Gly Gly Arg Glu Gly Gly
725 730 735
Leu Glu Arg Val Cys Asp Trp Gly Glu Thr Leu Ser Gly Gly Glu Lys
740 745 750
Gln Arg Leu Ala Phe Ala Arg Leu Tyr Tyr His Arg Pro Arg Phe Ala
755 760 765
Ile Leu Asp Glu Cys Thr Ser Ala Val Ser Ser Asp Val Glu Asp His
770 775 780
Leu Tyr Arg Gln Ala Gln Ala Leu Gly Ile Thr Leu Leu Thr Val Ala
785 790 795 800
His Arg Gln Ala Leu Trp Lys His His Glu Tyr Leu Leu Met Leu Asp
805 810 815
Gly Lys Gly Gly Trp Ser Phe Arg Pro Met Gln Thr Leu Glu Pro Glu
820 825 830
Ala Ala Glu Gly Asp Gly Asp Ile Lys Tyr Thr
835 840
<210> 21
<211> 2532
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> PXA编码序列
<400> 21
atggcccctt ccttctccca tcgcggtcaa aaacggcacg acaatgtggt ttctgctttt 60
ttcaactcct ttatgtccgc tggcgagcaa aaattcacgg tggtctcatc tcttttctcg 120
agcgggttgt tcctagttgc cttagccctc gtgaaacagc tgtcgagcct acaagagcaa 180
gaagaaaagg ttgctgcgtc cctagaacgc caagacccaa gcaaggaagg aggaagtctg 240
gcggcaccct tgccccagcc tgacggcagg tgccagaccc cccagcctcc ccctccctca 300
cccccaccct ccgcctcgcc ctcctccttc tcagcgacct ccacagcccg gactaggagt 360
cccaatgccg atgctttgac gaggtcgggg agggatgctg ccggccatgg agaaagaggg 420
agcgggggca tgaggagacc aggcggccct ccgctaccgc aggaagggca gagggtggct 480
ctggacgatg aattcggaag gcagctctta agccttctcc acaaattaat ccccagctgg 540
aagacgcgtg aagccgcctg cctaggaggc atggttttcc tcctcctggc tcgcagcgcc 600
tgtgacttgc gaatgataaa cctggtggtg ggggcggaga aggcgatcgt gttgggcaat 660
cggcccgcct tcaggatctc tttggcgcgc tttttaagat tcatggtgcc tgtggcctgt 720
gtgaatgccc tgctcaagta cacaacgaga gagctctctc ttggcctccg tcaacgactc 780
acagagcatc ttcagtctaa atacatgaaa ggctttacct tctactctat ggcggtcatg 840
gaagggcatg cgagggaaat cgagcagctt atgaccgtgg acgtggacaa gttctccctg 900
tgcattacgg agctggcctc aaacctccta aagccaaccc ttgatattct tctttacgca 960
acaaaattac aaacctcggt cggtcctctg atcccgttag ccatggctag ctacctcttc 1020
tcctctggca cagccttgac gcgcctgcga agacctgccg cagagtatac ggccgcgatc 1080
caacggcgcg agggcgacta cagatttgtg acgaatagaa tggtcgcgca cgccgaagag 1140
atcgctttct acgatggagt ggggagggaa aaaaactacc tgcagcagat cttcggttct 1200
ttgttgggaa cgatccggcg cggctcccgg ttccgccacg cgatggacat cctcgatagt 1260
gtcatggcca agtacatagc caccgctctt ggctgggtgc ttttgaatcg cgcggctcag 1320
caacagaaac aagaagcgct tcctgtcccc tctcccgccc tcccaccctc ccccgctgcc 1380
tcttcctacg actctttcca tcaatccgct cgcatgatgt tcaactttgc acaggccctc 1440
tccgccatcg tcctggcggg cagggaggcg acgcgtctgg caggctatac ctctcgggtc 1500
acgcgcctcg aacgcctcat tgatgacctg gagcgcgaag acgaagcaag atccaccgca 1560
tcggagtttt tggagaagaa agatgtgata gagctccagg gtgtgcccat cgtcgctccg 1620
gtcgtcggca atggccgcaa ggacagcgac ggcgggaggg gagggagaaa aggaagggaa 1680
ggagggaggg tacggcgatt gacatctcct ctgaccctga gaattgagcc aggcatgcac 1740
gtcctcgtca caggaccgaa tggaagtggg aaatcgtctc ttttccgaat gatctgtggc 1800
ctctggcctg tctccgaagg gcgcctcatc aaacctcctc gatcccagct cttctacata 1860
ccccaacgac cctacctccc gcttggaagc ttgcgggatc aggtgattta ccctcactcc 1920
caggccgaga tggcggcact agggaggacg gatgcagatg tgctggcgct tttggatgag 1980
gttcaactct ccttccttgc ccccccccgg gtggtaggac cggagagcaa cgccagcgat 2040
gctctgccct ccctcccttc ctccctccct tcctccctcc cttcctccct tcctccctcc 2100
tttccgtctt tctcctcctt ggcccaagtc ctcacccggc catcgcctac gaccccggaa 2160
gaggaggaag ggagggaggg agggagggag ggagggaggg agggagggtt ggagcgagtc 2220
tgcgactggg gcgagacatt gtcggggggc gagaagcagc ggctggcttt tgcccgtctc 2280
tattaccacc gaccgcgctt tgccatcttg gacgagtgca cgagcgccgt gtcgagcgat 2340
gtggaggacc atctgtacag acaggcgcag gcactcggca tcaccttgct cacagtggcg 2400
catcggcagg ccttgtggaa acatcatgaa tatctgctga tgctggatgg gaaagggggc 2460
tggtctttta ggcccatgca gacactggaa ccggaagctg ccgaagggga cggagatata 2520
aagtacacct ga 2532
<210> 22
<211> 716
<212> PRT
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 酰基-CoA氧化酶氨基酸
<400> 22
Met Thr Thr Ala Asn Ala Arg Leu Ser Arg Leu Lys Asp His Leu Ala
1 5 10 15
Glu Thr Gly Ala Val Ala Arg Ala Pro Ile Ser Ser Ser Ala Ile Asn
20 25 30
Ala Thr Pro Phe Ala Ala Arg Thr Thr His Thr Met Glu Arg Met Ala
35 40 45
Arg Glu Arg Ala Lys Ala Ser Phe Pro Val Arg Asp Met Thr Tyr Phe
50 55 60
Leu Asp Gly Gly Arg Ser Met Thr Glu Val Lys Glu Gly Met Met Ala
65 70 75 80
Asp Leu Ala Ala Asn Pro Val Phe Thr Asp Pro Glu Trp Asn Asp Leu
85 90 95
Asn Arg Asp Gln Ile Arg Glu Arg Thr Ile Ser Arg Leu Arg Ala Ala
100 105 110
Tyr Lys Leu Leu Ile Arg Asp Gly Ala Asp Val Ser Arg Arg Asn Ala
115 120 125
Arg Leu Glu Ile His Ala Leu His Asp Leu Gly Trp Tyr Val Arg Gln
130 135 140
Gly Val His Phe Gly Leu Phe Met Gly Ala Leu Ala Gly Gln Gly Ser
145 150 155 160
Asp Glu Gln Arg Ala Glu Trp Leu Pro Arg Thr Met Met Cys Glu Ile
165 170 175
Tyr Gly Cys Phe Gly Met Thr Glu Leu Gly His Gly Ser Phe Leu Arg
180 185 190
Gly Leu Glu Thr Thr Ala Met Tyr Asp Lys Asp Thr Gln Glu Phe Val
195 200 205
Ile Asn Ser Pro Thr Asp Thr Ser Thr Lys Trp Trp Ile Gly Ala Ala
210 215 220
Gly Gln Thr Ala Thr His Ser Val Val Phe Ala Arg Leu Leu Leu Pro
225 230 235 240
Ser Gly Asp Asp Met Gly Val His Asn Phe Ile Ile Pro Leu Arg Asp
245 250 255
Met Glu Thr His Leu Pro Leu Pro Gly Ile His Ile Gly Asp Leu Gly
260 265 270
Ala Lys Met Gly Leu Asn Gly Ile Asp Asn Gly Trp Met Gln Phe Asp
275 280 285
His Val Arg Val Pro Arg Asp Asn Met Leu Cys Arg Tyr Ala Gln Val
290 295 300
Thr Pro Glu Gly Lys Tyr Ile Arg Pro Pro Arg Lys Glu Met Ala Tyr
305 310 315 320
Gly Ala Leu Ile Gly Thr Arg Ala Ala Leu Val Lys Thr Ala Val Asp
325 330 335
Phe Gln Lys Lys Ala Leu Met Ile Gly Ile Arg Tyr Thr Ala Leu Arg
340 345 350
Thr Gln Gly Val Val Glu Glu Gly Gln Arg Glu Glu Thr Ala Ile Ile
355 360 365
Asp Tyr Pro Ile His Arg Asp Lys Leu Leu Lys Leu Leu Ala Ala Ala
370 375 380
Tyr Ala Trp His Phe Gln Ala Ala Tyr Val Leu His Leu Asn Asp Ser
385 390 395 400
Leu Glu Glu Gly Leu Glu Ala Gly Asp Leu Ser Ile Leu Lys Asp Val
405 410 415
His Gly Thr Met Ala Gly Leu Lys Ala Phe Gly Thr Trp Phe Thr Tyr
420 425 430
Asn Thr Ile Glu Ala Cys Arg Gln Val Cys Gly Gly His Gly Tyr Ser
435 440 445
Lys Tyr Asn Gly Leu Ser Asn Thr Leu Gln Asp Phe Ala Val Met Cys
450 455 460
Thr Trp Glu Gly Asp Asn Thr Val Met Ala Leu Gln Thr Ala Arg Tyr
465 470 475 480
Leu Val Arg Ser Tyr Glu Lys Ala Lys Arg Gly Gly Glu Thr Leu Ala
485 490 495
Gly Ser Val Ser Tyr Leu Gln Asp Ala His Pro Pro Ala Trp Arg Ala
500 505 510
Arg Ser Ala Glu Asp Leu Met Asn Met Glu Val Gln Met Glu Ala Trp
515 520 525
Arg Ala Leu Leu Ala Ala Lys Val Ser Arg Ala Ser Glu Arg Val Leu
530 535 540
Ala Arg Gln Ala Ala Leu Arg Gly Asn Glu Ala Gln Ala Phe Asn Glu
545 550 555 560
His Gln Val Glu Leu Phe Glu Cys Ala Lys Thr His Val Tyr Phe Asn
565 570 575
Val Ala Ala Arg Phe Ala Glu Ala Val Val Glu Ala Gly Thr Thr His
580 585 590
Pro Ala Leu Ala Pro Val Leu Ala Arg Leu Cys His Leu Phe Ser Leu
595 600 605
Ser Ser Leu Leu Glu Asp Glu Ala Ser Leu Leu Ala Ser Gly Phe Ala
610 615 620
Ser Ala Gly Gln Met Gln Leu Ile Arg Glu Ala Val Gly Ala Leu Leu
625 630 635 640
Leu Ala Leu Arg Pro Asp Ala Val Ala Leu Val Asp Ala Phe Asn Tyr
645 650 655
Ser Asp Glu Val Leu Asn Ser His Leu Gly Thr Ala Asn Gly Asp Ile
660 665 670
Tyr Thr Gly Tyr Leu Gln Gln Val Gln Arg Leu Val Pro Glu Asn Lys
675 680 685
Leu Ala Val Ala Pro Tyr Ile Met Arg Glu Val Lys Pro Leu Met Gln
690 695 700
Gly Ala Asp Leu Ile Ser Thr Asp Glu Glu Glu Asp
705 710 715
<210> 23
<211> 2151
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 酰基-CoA氧化酶cDNA
<400> 23
atgacgaccg ccaatgcccg tttgtcgagg ctcaaagatc atttagcaga gacgggggct 60
gtggcgcgcg cgccgattag ctcctctgcc atcaatgcca cgccttttgc ggcgaggacg 120
acgcatacca tggagcgcat ggcaagggaa cgagccaagg cctccttccc cgtccgagac 180
atgacgtact tcttggacgg cgggaggagc atgaccgagg tcaaggaggg catgatggcg 240
gacttggcgg cgaatccggt ctttacggac ccagaatgga acgacttgaa cagagatcag 300
atccgtgaac gcaccatctc tcgactgaga gctgcgtaca agctcctgat ccgagacggt 360
gccgatgtca gccgccggaa tgcccggctt gagattcacg ccctccatga cttggggtgg 420
tacgtgcggc agggtgtgca tttcggcctc tttatgggcg ccttggccgg gcaggggagc 480
gacgaacaac gcgctgagtg gctgcccagg accatgatgt gtgagatcta cgggtgcttc 540
gggatgacgg agttggggca cggctcattc ttgcggggcc tggagaccac agcgatgtac 600
gacaaggaca cgcaagaatt tgtaatcaat tcccccactg acacaagcac caaatggtgg 660
atcggtgcgg ccgggcagac ggccacacat tcggtggttt tcgcccgcct cctccttccc 720
tcaggggacg acatgggtgt gcacaacttc atcatacccc tccgggatat ggaaacgcac 780
ttgcccctcc ctggcatcca cattggcgat ttgggggcca agatgggctt gaatggcatc 840
gacaacgggt ggatgcaatt tgaccacgtc cgcgtgcccc gggacaacat gctttgtcgc 900
tacgcacagg tcaccccgga ggggaaatac atccgtcctc ccaggaagga gatggcttac 960
ggcgctctca tcggcactcg ggcggctctg gtcaagacag ccgtggactt tcaaaaaaag 1020
gccctcatga tcgggatccg ctacaccgcc ctccggacac agggcgtggt ggaggaaggc 1080
caaagggaag agaccgccat catcgactac cccatccacc gggacaaact cctgaaactc 1140
ttggcggccg cctacgcctg gcacttccaa gccgcctacg ttctccacct gaacgattcc 1200
ttggaggagg ggctcgaggc gggggacctc tccatcctca aggatgtgca tgggaccatg 1260
gctggcctca aggctttcgg aacctggttc acgtacaaca cgatcgaggc ctgccggcaa 1320
gtgtgcgggg gccacgggta cagcaagtac aacggcctct ccaacaccct ccaggacttt 1380
gctgtcatgt gcacctggga gggcgacaac accgtgatgg ctctacagac ggcgcggtat 1440
ctagttcggt cctacgagaa ggcgaagcgg gggggcgaga ccctggcagg ctccgtctca 1500
tacctgcagg atgcgcatcc cccggcttgg cgggcgaggt ctgcggagga cttgatgaac 1560
atggaagtgc agatggaggc ctggcgggcc ctcctagccg ccaaggtctc cagagcctca 1620
gagcgggtct tggcaaggca ggcggcgttg cgggggaacg aggcgcaggc cttcaacgag 1680
catcaggtgg agcttttcga gtgcgccaag acccatgtct acttcaatgt ggcggcgcgg 1740
tttgccgagg cggtcgtgga ggccggcacc acccaccccg ccctggcccc tgtcctcgcc 1800
cgcctctgcc acctcttctc tctctcgagc cttctagaag acgaagcctc cctgctcgcc 1860
agcggtttcg cctccgcggg gcagatgcag ctcattcgcg aggccgtggg cgccctcctc 1920
ctcgccctcc gcccggacgc ggtggccctt gtcgacgcct tcaactattc cgacgaagtt 1980
ttgaactcac atttaggcac cgccaacggc gatatttata cgggctacct ccaacaggtg 2040
cagcgcctcg tccctgagaa caagctggcc gtcgccccct acatcatgag ggaggtgaag 2100
cctttaatgc aaggagcaga cctgatctcc acggacgagg aggaggactg a 2151
<210> 24
<211> 607
<212> PRT
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 异柠檬酸裂解酶
<400> 24
Met Tyr Trp Lys Arg Thr Cys Cys Asp Cys Leu Gly Leu His Phe Arg
1 5 10 15
Thr Leu Ile Leu Asp Leu Phe Pro Cys Ser Ala Gly Ala Leu His Ser
20 25 30
Asn Pro Tyr Arg Leu Ser Val Arg Lys Pro Ile Lys Ile Thr Ile Thr
35 40 45
Thr Arg Thr Met Glu Glu Thr Arg Leu Tyr His Glu Asp Val Ala Ala
50 55 60
Thr Glu His Phe Phe Arg Asn Pro Arg Phe Ala Gln Thr Val Arg Pro
65 70 75 80
Tyr Ser Ala Gln Asp Val Val Ala Leu Arg Ser Ser Leu Leu Val Glu
85 90 95
Pro Ala Ser Asn Arg Gln Ala Gln Lys Leu Trp Ser Leu Leu Thr Gly
100 105 110
Leu Ala Gly Gln Gly Lys Cys Ser Tyr Thr Phe Gly Ala Leu Asp Pro
115 120 125
Val Gln Val Val Gln Met Ala Pro His Val Ser Thr Ile Tyr Val Ser
130 135 140
Gly Trp Gln Cys Ser Ser Thr Ala Ser Thr Ser Asn Glu Pro Gly Pro
145 150 155 160
Asp Phe Ala Asp Tyr Pro Met Asp Thr Val Pro Asn Lys Val His Gln
165 170 175
Leu Phe Ser Ala Gln Leu Phe His Asp Arg Arg Gln Gln Glu Ala Arg
180 185 190
Ala Arg Met Thr Asp Ala Ser Lys Val Ala Glu Pro Pro Val Asp Tyr
195 200 205
Leu Arg Pro Ile Ile Ala Asp Gly Asp Thr Gly His Gly Gly Leu Thr
210 215 220
Ala Val Met Lys Leu Thr Lys Met Phe Ile Glu Arg Gly Ala Ala Gly
225 230 235 240
Ile His Phe Glu Asp Gln Lys Pro Gly Thr Lys Lys Cys Gly His Met
245 250 255
Gly Gly Lys Val Leu Val Ser Val Gln Glu His Ile Asp Arg Leu Thr
260 265 270
Ala Ala Arg Leu Gln Ala Asp Val Met Gly Ala Gln Thr Ile Ile Val
275 280 285
Ala Arg Thr Asp Gly Glu Ala Ala Ser Leu Leu Asp Thr Asn Ile Asp
290 295 300
Ala Arg Asp His Pro Phe Ile Leu Gly Ala Thr Val Pro Gly Thr Arg
305 310 315 320
Ala Leu Asn Glu Val Val Ala Glu Ala Arg Ala Gln Gly Val Thr Gly
325 330 335
Ala Glu Leu Asp Arg Ile Thr Asp Gln Trp Thr Ala Ala Ala Asn Leu
340 345 350
Arg Arg Phe Pro Glu Ala Val Cys Asp Ala Leu Ser Thr Leu Pro Asn
355 360 365
Pro Ala Pro Lys Leu Ala Val Trp Lys Ala Gln Ala Tyr Asn Leu Ser
370 375 380
Leu Pro Gln Ala Arg Ala Leu Ala Lys Glu Leu Met Gly Arg Glu Val
385 390 395 400
Tyr Phe Asp Trp Glu Ala Pro Arg Ser Arg Glu Gly Tyr Tyr Arg Ile
405 410 415
Lys Gly Gly Val Asp Tyr Cys Val Ala Arg Ala Val Ala Tyr Ala Pro
420 425 430
His Ala Asp Leu Ile Trp Met Glu Thr Ala Lys Pro Asp Leu Ser Glu
435 440 445
Ala Arg Glu Phe Ala Gln Gly Val Arg Ala Ala Val Pro Gly Lys Met
450 455 460
Leu Ala Tyr Asn Leu Ser Pro Ser Phe Asn Trp Asp Val Ala Gly Leu
465 470 475 480
Ser Pro Gln Glu Met Glu His Phe Asn Ser Ser Leu Ala Ala Met Gly
485 490 495
Phe Val Trp Gln Phe Ile Thr Leu Ala Gly Phe His Ala Asn Gly Leu
500 505 510
Met Thr Thr Met Phe Ala Arg Glu Tyr Gly Lys Arg Gly Val Val Ala
515 520 525
Tyr Val Glu Met Ile Gln Arg Lys Glu Arg Glu Gln Glu Val Asp Met
530 535 540
Leu Thr His Gln Lys Trp Ser Gly Ala Ala Leu Leu Asp Lys Gln Met
545 550 555 560
Gln Thr Val Thr Gly Gly Met Ser Ser Thr Ser Ser Met Gly Lys Gly
565 570 575
Val Thr Glu Ala Gln Phe Gly Ala Lys Gly Pro Gly Ala Ala Gly Val
580 585 590
Ser Ser Gly Ala Gly Ala Ala Arg Ala Gly Ala Ile Ser Arg Leu
595 600 605
<210> 25
<211> 1824
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 异柠檬酸裂解酶cDNA
<400> 25
atgtattgga agaggacgtg ttgtgactgt ctagggcttc atttccggac cctcattctc 60
gacctcttcc cttgctctgc tggcgccctt cattccaacc cttacagact ttcggtgcgc 120
aagccgatca agatcacaat caccacaagg acaatggagg aaacacgcct atatcatgaa 180
gatgttgctg cgacagagca ttttttccgc aacccgcgct ttgcccaaac tgttcggccc 240
tattcggcgc aggacgtcgt cgcactccgg tccagcctcc tggtcgaacc tgcctccaat 300
cgacaggccc agaagctctg gtccctcctg accgggctgg ccggtcaagg aaagtgctcg 360
tacaccttcg gcgccctcga ccccgttcag gtggtgcaga tggcccccca cgtctccacc 420
atttacgtga gtggctggca gtgctcctcc acggcctcca ctagcaacga gcccggccca 480
gactttgcag attaccccat ggacacggtc cccaacaagg tgcaccaact cttctccgcc 540
caactcttcc acgaccgccg ccagcaagag gcgcgagccc gcatgacgga cgcgagcaag 600
gtggcggaac cccctgtcga ctacctccgg cccatcatcg ccgacggcga cacgggccac 660
ggcggtctga ccgcggtgat gaagctgacc aagatgttca ttgagcgagg ggcggcgggg 720
attcacttcg aggatcagaa accaggcact aagaagtgcg ggcacatggg cgggaaggtg 780
ttggtgtccg tccaagagca cattgaccgg ttgacagccg cacggctgca ggcggacgtg 840
atgggggcgc aaaccatcat tgtggcgcgt actgacgggg aggcggccag tcttttggac 900
accaacatcg acgcgcgcga ccatcctttc atcttggggg ccacggtccc tggcacccgc 960
gccctgaatg aggtggtggc cgaggcgagg gcccaggggg tgacgggcgc ggagttggac 1020
cgcattacgg accaatggac ggcggccgcc aatttgcgtc gctttccgga agctgtctgc 1080
gacgccttgt ccacgctacc caatccggcc ccgaagctcg ccgtctggaa ggctcaggcc 1140
tacaacctct ccctgccgca ggcgcgtgcg ctcgcgaagg aactgatggg ccgggaggtg 1200
tacttcgact gggaggcgcc gcgttcccgc gaggggtatt accgcatcaa gggtggggtg 1260
gactactgtg tagcccgggc ggtggcgtac gcgccgcacg cggatttgat ttggatggag 1320
acggcgaaac cggatctttc cgaagctagg gagttcgctc aaggggtgcg ggcggccgtg 1380
cctggtaaga tgctcgccta caacctctct ccttccttta actgggacgt ggccggcttg 1440
tccccgcagg agatggagca tttcaactcg tccctggcgg ccatgggctt cgtctggcag 1500
ttcattacct tggcgggctt ccacgcgaac gggctcatga ccaccatgtt tgcgcgcgag 1560
tacggaaagc ggggggtggt ggcctacgtg gagatgatcc agcggaagga gcgggagcag 1620
gaggtggaca tgctcaccca ccagaagtgg tcaggagccg cgttactcga caagcagatg 1680
cagacggtga cgggcggcat gtcctccacg tcctccatgg gcaagggcgt gacagaggcc 1740
cagtttggcg ccaagggacc gggagcggcc ggtgtctcat cgggagcagg agcggcgcgt 1800
gcgggggcga tttctcggtt gtaa 1824
<210> 26
<211> 11263
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> pSGE-6206载体
<400> 26
gcggccgccg tatggtcgac ggttgctcgg atgggggggg cggggagcga tggagggagg 60
aagatcaggt aaggtctcga cagactagag aagcacgagt gcaggtataa gaaacagcaa 120
aaaaaagtaa tgggcccagg cctggagagg gtatttgtct tgtttttctt tggccaggaa 180
cttgttctcc tttcttcgtt tctaggaccc cgatccccgc tcgcatttct ctcttcctca 240
gccgaagcgc agcggtaaag catccatttt atcccaccga aagggcgctc ccagccttcg 300
tcgagcggaa ccggggttac agtgcctcaa ccctcccaga cgtagccaga gggaagcaac 360
tccctgatgc caaccgctgt gggctgccca tcggaatctt tgacaattgc cttgatcccc 420
gggtgcaagt caagcagcac ctgccgacat cgcccgcacg gagacagaat gccgcggttt 480
tcgttcccga tggccactat gcacgtcaga tttccggcag cagccgcagc ggccgttccg 540
aggaccacga gctccgcgca tggccctccg gtgaaatgat atacattcac gccggtaaag 600
atccgaccgt cggacgagag ggctgcactg gccaccgagt agtcctcgct aataggtatg 660
ctgttgatgg tcgcagttgc acgttcgatc agcgtggatt cctcttggga taaaggcttg 720
gccatcgagc tcggtacccg gggatccatg attgttgtat tatgtaccta tgtttgtgat 780
gagacaataa atatgagaag agaacgttgc ggccactttt ttctccttcc ttcgcgtgct 840
catgttggtg gtttgggagg cagaagatgc atggagcgcc acacattcgg taggacgaaa 900
cagcctcccc cacaaaggga ccatgggtag ctaggatgac gcacaagcga gttcccgctc 960
tcgaagggaa acccaggcat ttccttcctc ttttcaagcc acttgttcac gtgtcaacac 1020
aattttggac taaaatgccc ctcggaactc ggcaggcctc cctctgctcc gttgtcctgg 1080
tcgccgagaa cgcgagaccg tgccgcatgc catcgatctg ctcgtctgta ctactaatcg 1140
tgtgcgtgtt cgtgcttgtt tcgcacgaaa ttgtcctcgt tcggccctca caacggtgga 1200
aatcggtgct agaataaagt gaggtggctt atttcaatgg cggccgtcat catgcgggat 1260
caactgaagt acggcgggtt ctcgagattt catcgtgctc gtccagagca ggtgttttgc 1320
ctgcagctct tcatgtttag gggtcatgat ttcatctgat atgccgtaag aaaaccaata 1380
ttcacttctc aattttccat ggaaaggtga aggcctaggt tgtgtgcgag gcaacgactg 1440
gggagggatc gcaacattct tgctaacctc ccctctatct tggccgctgt gaatcggcat 1500
atttaccggg ctgaattgag aaagtgtttt gagggaatta aaaggtggct gtcttgcaag 1560
cttggcttca gtgcctgctt aattcgaacc gatccagctt gtgatgaggc cttcctaagc 1620
ctggtagtca gaagcgacat ggcgctataa atttcgtctc agttggagag tagaaaagca 1680
tgattcgaac acggttttca actgccaaag atatctccat tgtttccttc aatctgtaca 1740
cctgcacggt gcaccagttg gtacggcata ttatggttta ataagcatac atcatatgaa 1800
tacaattcag cttaaattta tcatacaaag atgtaagtgc agcgtgggtc tgtaacgatc 1860
gggcgtaatt taagataatg cgagggaccg ggggaggttt tggaacggaa tgaggaatgg 1920
gtcatggccc ataataataa tatgggtttg gtcgcctcgc acagcaaccg tacgtgcgaa 1980
aaaggaacag atccatttaa taagttgaac gttattcttt cctatgcaat gcgtgtatcg 2040
gaggcgagag caagtcatag gtggctgcgc acaataattg agtctcagct gagcgccgtc 2100
cgcgggtggt gtgagtggtc atcctcctcc cggcctatcg ctcacatcgc ctctcaatgg 2160
tggtggtggg gcctgatatg acctcaatgc cgacccatat taaaacccag taaagcattc 2220
accaacgaac gaggggctct tttgtgtgtg ttttgagtat gattttacac ctctttgtgc 2280
atctctctgg tcttccttgg ttcccgtagt ttgggcatca tcactcacgc ttccctcgac 2340
cttcgttctt cctttacaac cccgacacag gtcagagttg gagtaatcaa aaaaggggtg 2400
cacgaatgag atacattaga ttttgacaga tatcctttta ctggagaggg ttcaagggat 2460
caaatgaaca gcgggcgttg gcaatctagg gagggatcgg aggttggcag cgagcgaaag 2520
cgtgtccatc cttttggctg tcacacctca cgaaccaact gttagcaggc cagcacagat 2580
gacatacgag aatctttatt atatcgtaga ccttatgtgg atgacctttg gtgctgtgtg 2640
tctggcaatg aacctgaagg cttgataggg aggtggctcc cgtaaaccct ttgtcctttc 2700
cacgctgagt ctcccccgca ctgtccttta tacaaattgt tacagtcatc tgcaggcggt 2760
ttttctttgg caggcaaaga tgcccaagaa aaagcggaag gtcggcgact acaaggatga 2820
cgatgacaag ttggagcctg gagagaagcc ctacaaatgc cctgagtgcg gaaagagctt 2880
cagccaatct ggagccttga cccggcatca acgaacgcat acacgagaca agaagtactc 2940
catcgggctg gacatcggga cgaactccgt gggatgggcc gtgatcacag acgaatacaa 3000
ggtgccttcc aagaagttca aggtgctggg gaacacggac agacactcca tcaagaagaa 3060
cctcatcggg gccttgctct tcgactccgg agaaaccgcc gaagcaacgc gattgaaaag 3120
aaccgccaga agacgataca cacgacggaa gaaccgcatc tgctacctcc aggagatctt 3180
cagcaacgag atggccaagg tggacgactc gttctttcat cgcctggagg agagcttcct 3240
ggtggaggaa gacaagaaac atgagcgcca cccgatcttc gggaacatcg tggacgaagt 3300
ggcctaccac gagaaatacc ccacgatcta ccacttgcgc aagaaactcg tggactccac 3360
ggacaaagcg gacttgcggt tgatctactt ggccttggcc cacatgatca aatttcgggg 3420
ccacttcctg atcgagggcg acttgaatcc cgacaattcc gacgtggaca agctcttcat 3480
ccagctggtg cagacctaca accagctctt cgaggagaac cccatcaatg cctccggagt 3540
ggacgccaaa gccatcttgt ccgcccgatt gtccaaatcc agacgcttgg agaacttgat 3600
cgcacaactt cctggcgaga agaagaacgg cctcttcggc aacttgatcg cgctgtcgct 3660
gggattgacg cctaacttca agtccaactt cgacttggcc gaggacgcca agttgcaact 3720
gtccaaggac acctacgacg acgacctcga caacctgctg gcccaaattg gcgaccaata 3780
cgcggacttg tttttggcgg ccaagaactt gagcgacgcc atcttgttga gcgacatctt 3840
gcgcgtgaat acggagatca ccaaagcccc tttgtccgcc tctatgatca agcggtacga 3900
cgagcaccac caagacttga ccctgttgaa agccctcgtg cggcaacaat tgcccgagaa 3960
gtacaaggag atcttcttcg accagtccaa gaacgggtac gccggctaca tcgacggagg 4020
agcctcccaa gaagagttct acaagttcat caagcccatc ctggagaaga tggacggcac 4080
cgaggagttg ctcgtgaagc tgaaccgcga agacttgttg cgaaaacagc ggacgttcga 4140
caatggcagc atcccccacc aaatccattt gggagagttg cacgccatct tgcgacggca 4200
agaggacttc tacccgttcc tgaaggacaa ccgcgagaaa atcgagaaga tcctgacgtt 4260
cagaatcccc tactacgtgg gacccttggc ccgaggcaat tcccggtttg catggatgac 4320
gcgcaaaagc gaagagacga tcaccccctg gaacttcgaa gaagtggtcg acaaaggagc 4380
atccgcacag agcttcatcg agcgaatgac gaacttcgac aagaacctgc ccaacgagaa 4440
ggtgttgccc aagcattcgc tgctgtacga gtacttcacg gtgtacaacg agctgaccaa 4500
ggtgaagtac gtgaccgagg gcatgcgcaa acccgcgttc ctgtcgggag agcaaaagaa 4560
ggccattgtg gacctgctgt tcaagaccaa ccggaaggtg accgtgaaac agctgaaaga 4620
ggactacttc aagaagatcg agtgcttcga ctccgtggag atctccggcg tggaggaccg 4680
attcaatgcc tccttgggaa cctaccatga cctcctgaag atcatcaagg acaaggactt 4740
cctggacaac gaggagaacg aggacatcct ggaggacatc gtgctgaccc tgaccctgtt 4800
cgaggaccga gagatgatcg aggaacggtt gaaaacgtac gcccacttgt tcgacgacaa 4860
ggtgatgaag cagctgaaac gccgccgcta caccggatgg ggacgattga gccgcaaact 4920
gattaatgga attcgcgaca agcaatccgg aaagaccatc ctggacttcc tgaagtccga 4980
cgggttcgcc aaccgcaact tcatgcagct catccacgac gactccttga ccttcaagga 5040
ggacatccag aaggcccaag tgtccggaca aggagactcc ttgcacgagc acatcgccaa 5100
tttggccgga tcccccgcaa tcaaaaaagg catcttgcaa accgtgaaag tggtcgacga 5160
actggtgaag gtgatgggac ggcacaagcc cgagaacatc gtgatcgaaa tggcccgcga 5220
gaaccaaacc acccaaaaag gacagaagaa ctcccgagag cgcatgaagc ggatcgaaga 5280
gggcatcaag gagttgggct cccagatcct gaaggagcat cccgtggaga atacccaatt 5340
gcaaaacgag aagctctacc tctactacct ccagaacggg cgggacatgt acgtcgacca 5400
agagctggac atcaaccgcc tctccgacta cgatgtggat catattgtgc cccagagctt 5460
cctcaaggac gacagcatcg acaacaaggt cctgacgcgc agcgacaaga accggggcaa 5520
gtctgacaat gtgccttccg aagaagtcgt gaagaagatg aagaactact ggcggcagct 5580
gctcaacgcc aagctcatca cccaacggaa gttcgacaac ctgaccaagg ccgagagagg 5640
aggattgtcc gagttggaca aagccggctt cattaaacgc caactcgtgg agacccgcca 5700
gatcacgaag cacgtggccc aaatcttgga ctcccggatg aacacgaaat acgacgagaa 5760
tgacaagctg atccgcgagg tgaaggtgat cacgctgaag tccaagctgg tgagcgactt 5820
ccggaaggac ttccagttct acaaggtgcg ggagatcaac aactaccatc acgcccatga 5880
cgcctacctg aacgccgtgg tcggaaccgc cctgatcaag aaatacccca agctggagtc 5940
cgaattcgtg tacggagatt acaaggtcta cgacgtgcgg aagatgatcg cgaagtccga 6000
gcaggagatc ggcaaagcca ccgccaagta cttcttttac tccaacatca tgaacttctt 6060
caagaccgag atcacgctcg ccaacggcga gatccgcaag cgccccctga tcgagaccaa 6120
cggcgagacg ggagagattg tgtgggacaa aggaagagat tttgccacag tgcgcaaggt 6180
gctgtccatg cctcaggtga acatcgtgaa gaagaccgag gtgcaaacag gagggttttc 6240
caaagagtcc attttgccta agaggaattc cgacaagctc atcgcccgca agaaggactg 6300
ggaccccaag aagtacgggg gcttcgactc ccccacggtg gcctactccg tgttggtggt 6360
ggccaaagtg gagaaaggga agagcaagaa gctgaaatcc gtgaaggagt tgctcggaat 6420
cacgatcatg gaacgatcgt cgttcgagaa aaaccccatc gacttcctcg aagccaaagg 6480
gtacaaagag gtgaagaagg acctgatcat caagctgccc aagtactccc tgttcgagct 6540
ggagaacggc cgcaagcgga tgctggcctc cgccggggaa ctgcagaaag ggaacgaatt 6600
ggccttgccc tccaaatacg tgaacttcct ctacttggcc tcccattacg aaaagctcaa 6660
aggatcccct gaggacaatg agcagaagca actcttcgtg gaacaacaca agcactacct 6720
ggacgagatc atcgagcaga tcagcgagtt ctccaagcgc gtgatcctcg ccgacgccaa 6780
cctggacaag gtgctctccg cctacaacaa gcaccgcgac aagcctatcc gcgagcaagc 6840
cgagaatatc attcacctgt ttaccctgac gaatttggga gcccctgccg cctttaaata 6900
ctttgacacc accatcgacc gcaaaagata cacctccacc aaggaagtct tggacgccac 6960
cctcatccac cagtccatca cgggcctcta cgagacgcgc atcgacctct cccaattggg 7020
cggcgactaa agtgatgcgg cctttaggaa acaccacaaa agtaattgac aatctcagga 7080
acgatctgcg tgtttacagc ttcccaaata acaattatac cacgtaccaa aaggggttta 7140
atgtatctca caaattcttc taataggtac agcttctcaa attgggtgta tgatgtgaca 7200
cttcgtctca cacacgtcac gataattcag cgtatggctt cccttcatca cattcacgca 7260
aacttctaca caaccctggg catatttctt gtgttggcaa cactcccgaa atcgattctg 7320
cacacaatgg ttcattcaat gattcaagta cgttttagac ggactaggca gtttaattaa 7380
aaacatctat cctccagatc accagggcca gtgaggccgg cataaaggac ggcaaggaaa 7440
gaaaagaaag aaagaaaagg acacttatag catagtttga agttataagt agtcgcaatc 7500
tgtgtgcagc cgacagatgc tttttttttc cgtttggcag gaggtgtagg gatgtcgaag 7560
accagtccag ctagtatcta tcctacaagt caatcatgct gcgacaaaaa tttctcgcac 7620
gaggcctctc gataaacaaa actttaaaag cacacttcat tgtcatgcag agtaataact 7680
cttccgcgtc gatcaattta tcaatctcta tcatttccgc ccctttcctt gcatagagca 7740
agaaaagcga cccggatgag gataacatgt cctgcgccag tagtgtggca ttgcctgtct 7800
ctcatttaca cgtactgaaa gcataatgca cgcgcatacc aatatttttc gtgtacggag 7860
atgaagagac gcgacacgta agatcacgag aaggcgagca cggttgccaa tggcagacgc 7920
gctagtctcc attatcgcgt tgttcggtag cttgctgcat gtcttcagtg gcactatatc 7980
cactctgcct cgtcttctac acgagggcca catcggtgca agttcgaaaa atcatatctc 8040
aatcttcaga tcctttccag aaacggtgct caggcgggaa agtgaaggtt ttctactcta 8100
gtggctaccc caattctctc cgactgtcgc agacggtcct tcgttgcgca cgcaccgcgc 8160
actacctctg aaattcgaca accgaagttc aattttacat ctaacttctt tcccattctc 8220
tcaccaaaag cctagcttac atgttggaga gcgacgagag cggcctgccc gccatggaga 8280
tcgagtgccg catcaccggc accctgaacg gcgtggagtt cgagctggtg ggcggcggag 8340
agggcacccc cgagcagggc cgcatgacca acaagatgaa gagcaccaaa ggcgccctga 8400
ccttcagccc ctacctgctg agccacgtga tgggctacgg cttctaccac ttcggcacct 8460
accccagcgg ctacgagaac cccttcctgc acgccatcaa caacggcggc tacaccaaca 8520
cccgcatcga gaagtacgag gacggcggcg tgctgcacgt gagcttcagc taccgctacg 8580
aggccggccg cgtgatcggc gacttcaagg tgatgggcac cggcttcccc gaggacagcg 8640
tgatcttcac cgacaagatc atccgcagca acgccaccgt ggagcacctg caccccatgg 8700
gcgataacga tctggatggc agcttcaccc gcaccttcag cctgcgcgac ggcggctact 8760
acagctccgt ggtggacagc cacatgcact tcaagagcgc catccacccc agcatcctgc 8820
agaacggggg ccccatgttc gccttccgcc gcgtggagga ggatcacagc aacaccgagc 8880
tgggcatcgt ggagtaccag cacgccttca agaccccgga tgcagatgcc ggtgaagaat 8940
aagggtggga aggagtcggg gagggtcctg gcagagcggc gtcctcatga tgtgttggag 9000
acctggagag tcgagagctt cctcgtcacc tgattgtcat gtgtgtatag gttaaggggg 9060
cccactcaaa gccataaaga cgaacacaaa cactaatctc aacaaagtct actagcatgc 9120
cgtctgtcca tctttatttc ctggcgcgcc tatgcttgta aaccgttttg tgaaaaaatt 9180
tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata atctattaaa 9240
ggtcattcaa aaggtcatcc agacgaaagg gcctcgtgat acgcctattt ttataggtta 9300
atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 9360
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 9420
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 9480
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 9540
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 9600
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 9660
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 9720
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 9780
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 9840
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 9900
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 9960
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 10020
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 10080
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 10140
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 10200
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 10260
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 10320
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 10380
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 10440
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 10500
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 10560
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 10620
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 10680
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 10740
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 10800
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 10860
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 10920
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 10980
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 11040
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 11100
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 11160
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 11220
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 11263
<210> 27
<211> 4101
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 针对微拟球藻进行密码子优化的酿脓链球菌CAS9基因
<400> 27
gacaagaagt actccatcgg gctggacatc gggacgaact ccgtgggatg ggccgtgatc 60
acagacgaat acaaggtgcc ttccaagaag ttcaaggtgc tggggaacac ggacagacac 120
tccatcaaga agaacctcat cggggccttg ctcttcgact ccggagaaac cgccgaagca 180
acgcgattga aaagaaccgc cagaagacga tacacacgac ggaagaaccg catctgctac 240
ctccaggaga tcttcagcaa cgagatggcc aaggtggacg actcgttctt tcatcgcctg 300
gaggagagct tcctggtgga ggaagacaag aaacatgagc gccacccgat cttcgggaac 360
atcgtggacg aagtggccta ccacgagaaa taccccacga tctaccactt gcgcaagaaa 420
ctcgtggact ccacggacaa agcggacttg cggttgatct acttggcctt ggcccacatg 480
atcaaatttc ggggccactt cctgatcgag ggcgacttga atcccgacaa ttccgacgtg 540
gacaagctct tcatccagct ggtgcagacc tacaaccagc tcttcgagga gaaccccatc 600
aatgcctccg gagtggacgc caaagccatc ttgtccgccc gattgtccaa atccagacgc 660
ttggagaact tgatcgcaca acttcctggc gagaagaaga acggcctctt cggcaacttg 720
atcgcgctgt cgctgggatt gacgcctaac ttcaagtcca acttcgactt ggccgaggac 780
gccaagttgc aactgtccaa ggacacctac gacgacgacc tcgacaacct gctggcccaa 840
attggcgacc aatacgcgga cttgtttttg gcggccaaga acttgagcga cgccatcttg 900
ttgagcgaca tcttgcgcgt gaatacggag atcaccaaag cccctttgtc cgcctctatg 960
atcaagcggt acgacgagca ccaccaagac ttgaccctgt tgaaagccct cgtgcggcaa 1020
caattgcccg agaagtacaa ggagatcttc ttcgaccagt ccaagaacgg gtacgccggc 1080
tacatcgacg gaggagcctc ccaagaagag ttctacaagt tcatcaagcc catcctggag 1140
aagatggacg gcaccgagga gttgctcgtg aagctgaacc gcgaagactt gttgcgaaaa 1200
cagcggacgt tcgacaatgg cagcatcccc caccaaatcc atttgggaga gttgcacgcc 1260
atcttgcgac ggcaagagga cttctacccg ttcctgaagg acaaccgcga gaaaatcgag 1320
aagatcctga cgttcagaat cccctactac gtgggaccct tggcccgagg caattcccgg 1380
tttgcatgga tgacgcgcaa aagcgaagag acgatcaccc cctggaactt cgaagaagtg 1440
gtcgacaaag gagcatccgc acagagcttc atcgagcgaa tgacgaactt cgacaagaac 1500
ctgcccaacg agaaggtgtt gcccaagcat tcgctgctgt acgagtactt cacggtgtac 1560
aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc gcaaacccgc gttcctgtcg 1620
ggagagcaaa agaaggccat tgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680
aaacagctga aagaggacta cttcaagaag atcgagtgct tcgactccgt ggagatctcc 1740
ggcgtggagg accgattcaa tgcctccttg ggaacctacc atgacctcct gaagatcatc 1800
aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860
accctgaccc tgttcgagga ccgagagatg atcgaggaac ggttgaaaac gtacgcccac 1920
ttgttcgacg acaaggtgat gaagcagctg aaacgccgcc gctacaccgg atggggacga 1980
ttgagccgca aactgattaa tggaattcgc gacaagcaat ccggaaagac catcctggac 2040
ttcctgaagt ccgacgggtt cgccaaccgc aacttcatgc agctcatcca cgacgactcc 2100
ttgaccttca aggaggacat ccagaaggcc caagtgtccg gacaaggaga ctccttgcac 2160
gagcacatcg ccaatttggc cggatccccc gcaatcaaaa aaggcatctt gcaaaccgtg 2220
aaagtggtcg acgaactggt gaaggtgatg ggacggcaca agcccgagaa catcgtgatc 2280
gaaatggccc gcgagaacca aaccacccaa aaaggacaga agaactcccg agagcgcatg 2340
aagcggatcg aagagggcat caaggagttg ggctcccaga tcctgaagga gcatcccgtg 2400
gagaataccc aattgcaaaa cgagaagctc tacctctact acctccagaa cgggcgggac 2460
atgtacgtcg accaagagct ggacatcaac cgcctctccg actacgatgt ggatcatatt 2520
gtgccccaga gcttcctcaa ggacgacagc atcgacaaca aggtcctgac gcgcagcgac 2580
aagaaccggg gcaagtctga caatgtgcct tccgaagaag tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctcaa cgccaagctc atcacccaac ggaagttcga caacctgacc 2700
aaggccgaga gaggaggatt gtccgagttg gacaaagccg gcttcattaa acgccaactc 2760
gtggagaccc gccagatcac gaagcacgtg gcccaaatct tggactcccg gatgaacacg 2820
aaatacgacg agaatgacaa gctgatccgc gaggtgaagg tgatcacgct gaagtccaag 2880
ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940
catcacgccc atgacgccta cctgaacgcc gtggtcggaa ccgccctgat caagaaatac 3000
cccaagctgg agtccgaatt cgtgtacgga gattacaagg tctacgacgt gcggaagatg 3060
atcgcgaagt ccgagcagga gatcggcaaa gccaccgcca agtacttctt ttactccaac 3120
atcatgaact tcttcaagac cgagatcacg ctcgccaacg gcgagatccg caagcgcccc 3180
ctgatcgaga ccaacggcga gacgggagag attgtgtggg acaaaggaag agattttgcc 3240
acagtgcgca aggtgctgtc catgcctcag gtgaacatcg tgaagaagac cgaggtgcaa 3300
acaggagggt tttccaaaga gtccattttg cctaagagga attccgacaa gctcatcgcc 3360
cgcaagaagg actgggaccc caagaagtac gggggcttcg actcccccac ggtggcctac 3420
tccgtgttgg tggtggccaa agtggagaaa gggaagagca agaagctgaa atccgtgaag 3480
gagttgctcg gaatcacgat catggaacga tcgtcgttcg agaaaaaccc catcgacttc 3540
ctcgaagcca aagggtacaa agaggtgaag aaggacctga tcatcaagct gcccaagtac 3600
tccctgttcg agctggagaa cggccgcaag cggatgctgg cctccgccgg ggaactgcag 3660
aaagggaacg aattggcctt gccctccaaa tacgtgaact tcctctactt ggcctcccat 3720
tacgaaaagc tcaaaggatc ccctgaggac aatgagcaga agcaactctt cgtggaacaa 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gcgcgtgatc 3840
ctcgccgacg ccaacctgga caaggtgctc tccgcctaca acaagcaccg cgacaagcct 3900
atccgcgagc aagccgagaa tatcattcac ctgtttaccc tgacgaattt gggagcccct 3960
gccgccttta aatactttga caccaccatc gaccgcaaaa gatacacctc caccaaggaa 4020
gtcttggacg ccaccctcat ccaccagtcc atcacgggcc tctacgagac gcgcatcgac 4080
ctctcccaat tgggcggcga c 4101
<210> 28
<211> 147
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 编码NLS、FLAG标签、连接子
<400> 28
atgcccaaga aaaagcggaa ggtcggcgac tacaaggatg acgatgacaa gttggagcct 60
ggagagaagc cctacaaatg ccctgagtgc ggaaagagct tcagccaatc tggagccttg 120
acccggcatc aacgaacgca tacacga 147
<210> 29
<211> 1000
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> RPL24启动子
<400> 29
aataagcata catcatatga atacaattca gcttaaattt atcatacaaa gatgtaagtg 60
cagcgtgggt ctgtaacgat cgggcgtaat ttaagataat gcgagggacc gggggaggtt 120
ttggaacgga atgaggaatg ggtcatggcc cataataata atatgggttt ggtcgcctcg 180
cacagcaacc gtacgtgcga aaaaggaaca gatccattta ataagttgaa cgttattctt 240
tcctatgcaa tgcgtgtatc ggaggcgaga gcaagtcata ggtggctgcg cacaataatt 300
gagtctcagc tgagcgccgt ccgcgggtgg tgtgagtggt catcctcctc ccggcctatc 360
gctcacatcg cctctcaatg gtggtggtgg ggcctgatat gacctcaatg ccgacccata 420
ttaaaaccca gtaaagcatt caccaacgaa cgaggggctc ttttgtgtgt gttttgagta 480
tgattttaca cctctttgtg catctctctg gtcttccttg gttcccgtag tttgggcatc 540
atcactcacg cttccctcga ccttcgttct tcctttacaa ccccgacaca ggtcagagtt 600
ggagtaatca aaaaaggggt gcacgaatga gatacattag attttgacag atatcctttt 660
actggagagg gttcaaggga tcaaatgaac agcgggcgtt ggcaatctag ggagggatcg 720
gaggttggca gcgagcgaaa gcgtgtccat ccttttggct gtcacacctc acgaaccaac 780
tgttagcagg ccagcacaga tgacatacga gaatctttat tatatcgtag accttatgtg 840
gatgaccttt ggtgctgtgt gtctggcaat gaacctgaag gcttgatagg gaggtggctc 900
ccgtaaaccc tttgtccttt ccacgctgag tctcccccgc actgtccttt atacaaattg 960
ttacagtcat ctgcaggcgg tttttctttg gcaggcaaag 1000
<210> 30
<211> 317
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 双向终止子2
<400> 30
agtgatgcgg cctttaggaa acaccacaaa agtaattgac aatctcagga acgatctgcg 60
tgtttacagc ttcccaaata acaattatac cacgtaccaa aaggggttta atgtatctca 120
caaattcttc taataggtac agcttctcaa attgggtgta tgatgtgaca cttcgtctca 180
cacacgtcac gataattcag cgtatggctt cccttcatca cattcacgca aacttctaca 240
caaccctggg catatttctt gtgttggcaa cactcccgaa atcgattctg cacacaatgg 300
ttcattcaat gattcaa 317
<210> 31
<211> 399
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 针对迦得拟微球藻进行密码子优化的土曲霉菌BLAST基因
<400> 31
atggccaagc ctttatccca agaggaatcc acgctgatcg aacgtgcaac tgcgaccatc 60
aacagcatac ctattagcga ggactactcg gtggccagtg cagccctctc gtccgacggt 120
cggatcttta ccggcgtgaa tgtatatcat ttcaccggag ggccatgcgc ggagctcgtg 180
gtcctcggaa cggccgctgc ggctgctgcc ggaaatctga cgtgcatagt ggccatcggg 240
aacgaaaacc gcggcattct gtctccgtgc gggcgatgtc ggcaggtgct gcttgacttg 300
cacccgggga tcaaggcaat tgtcaaagat tccgatgggc agcccacagc ggttggcatc 360
agggagttgc ttccctctgg ctacgtctgg gagggttga 399
<210> 32
<211> 999
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> TCTP启动子
<400> 32
cgtgcaggtg tacagattga aggaaacaat ggagatatct ttggcagttg aaaaccgtgt 60
tcgaatcatg cttttctact ctccaactga gacgaaattt atagcgccat gtcgcttctg 120
actaccaggc ttaggaaggc ctcatcacaa gctggatcgg ttcgaattaa gcaggcactg 180
aagccaagct tgcaagacag ccacctttta attccctcaa aacactttct caattcagcc 240
cggtaaatat gccgattcac agcggccaag atagagggga ggttagcaag aatgttgcga 300
tccctcccca gtcgttgcct cgcacacaac ctaggccttc acctttccat ggaaaattga 360
gaagtgaata ttggttttct tacggcatat cagatgaaat catgacccct aaacatgaag 420
agctgcaggc aaaacacctg ctctggacga gcacgatgaa atctcgagaa cccgccgtac 480
ttcagttgat cccgcatgat gacggccgcc attgaaataa gccacctcac tttattctag 540
caccgatttc caccgttgtg agggccgaac gaggacaatt tcgtgcgaaa caagcacgaa 600
cacgcacacg attagtagta cagacgagca gatcgatggc atgcggcacg gtctcgcgtt 660
ctcggcgacc aggacaacgg agcagaggga ggcctgccga gttccgaggg gcattttagt 720
ccaaaattgt gttgacacgt gaacaagtgg cttgaaaaga ggaaggaaat gcctgggttt 780
cccttcgaga gcgggaactc gcttgtgcgt catcctagct acccatggtc cctttgtggg 840
ggaggctgtt tcgtcctacc gaatgtgtgg cgctccatgc atcttctgcc tcccaaacca 900
ccaacatgag cacgcgaagg aaggagaaaa aagtggccgc aacgttctct tctcatattt 960
attgtctcat cacaaacata ggtacataat acaacaatc 999
<210> 33
<211> 318
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> EIF3终止子
<400> 33
ggcactgtaa ccccggttcc gctcgacgaa ggctgggagc gccctttcgg tgggataaaa 60
tggatgcttt accgctgcgc ttcggctgag gaagagagaa atgcgagcgg ggatcggggt 120
cctagaaacg aagaaaggag aacaagttcc tggccaaaga aaaacaagac aaataccctc 180
tccaggcctg ggcccattac ttttttttgc tgtttcttat acctgcactc gtgcttctct 240
agtctgtcga gaccttacct gatcttcctc cctccatcgc tccccgcccc ccccatccga 300
gcaaccgtcg accatacg 318
<210> 34
<211> 702
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 针对迦得拟微球藻进行密码子优化的TurboGFP基因
<400> 34
atgttggaga gcgacgagag cggcctgccc gccatggaga tcgagtgccg catcaccggc 60
accctgaacg gcgtggagtt cgagctggtg ggcggcggag agggcacccc cgagcagggc 120
cgcatgacca acaagatgaa gagcaccaaa ggcgccctga ccttcagccc ctacctgctg 180
agccacgtga tgggctacgg cttctaccac ttcggcacct accccagcgg ctacgagaac 240
cccttcctgc acgccatcaa caacggcggc tacaccaaca cccgcatcga gaagtacgag 300
gacggcggcg tgctgcacgt gagcttcagc taccgctacg aggccggccg cgtgatcggc 360
gacttcaagg tgatgggcac cggcttcccc gaggacagcg tgatcttcac cgacaagatc 420
atccgcagca acgccaccgt ggagcacctg caccccatgg gcgataacga tctggatggc 480
agcttcaccc gcaccttcag cctgcgcgac ggcggctact acagctccgt ggtggacagc 540
cacatgcact tcaagagcgc catccacccc agcatcctgc agaacggggg ccccatgttc 600
gccttccgcc gcgtggagga ggatcacagc aacaccgagc tgggcatcgt ggagtaccag 660
cacgccttca agaccccgga tgcagatgcc ggtgaagaat aa 702
<210> 35
<211> 822
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 4A-III启动子
<400> 35
ggcataaagg acggcaagga aagaaaagaa agaaagaaaa ggacacttat agcatagttt 60
gaagttataa gtagtcgcaa tctgtgtgca gccgacagat gctttttttt tccgtttggc 120
aggaggtgta gggatgtcga agaccagtcc agctagtatc tatcctacaa gtcaatcatg 180
ctgcgacaaa aatttctcgc acgaggcctc tcgataaaca aaactttaaa agcacacttc 240
attgtcatgc agagtaataa ctcttccgcg tcgatcaatt tatcaatctc tatcatttcc 300
gcccctttcc ttgcatagag caagaaaagc gacccggatg aggataacat gtcctgcgcc 360
agtagtgtgg cattgcctgt ctctcattta cacgtactga aagcataatg cacgcgcata 420
ccaatatttt tcgtgtacgg agatgaagag acgcgacacg taagatcacg agaaggcgag 480
cacggttgcc aatggcagac gcgctagtct ccattatcgc gttgttcggt agcttgctgc 540
atgtcttcag tggcactata tccactctgc ctcgtcttct acacgagggc cacatcggtg 600
caagttcgaa aaatcatatc tcaatcttca gatcctttcc agaaacggtg ctcaggcggg 660
aaagtgaagg ttttctactc tagtggctac cccaattctc tccgactgtc gcagacggtc 720
cttcgttgcg cacgcaccgc gcactacctc tgaaattcga caaccgaagt tcaattttac 780
atctaacttc tttcccattc tctcaccaaa agcctagctt ac 822
<210> 36
<211> 200
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 双向终止子5
<400> 36
gggtgggaag gagtcgggga gggtcctggc agagcggcgt cctcatgatg tgttggagac 60
ctggagagtc gagagcttcc tcgtcacctg attgtcatgt gtgtataggt taagggggcc 120
cactcaaagc cataaagacg aacacaaaca ctaatctcaa caaagtctac tagcatgccg 180
tctgtccatc tttatttcct 200
<210> 37
<211> 2346
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> HygR盒
<400> 37
tcataatcaa agatgagcca gccacgaagc taccggagaa ttctgtaaga aaaatgttta 60
aagttgaaaa tgctaacagt gaagtgatat ccttttttaa tggagtgttg aggtgaagtc 120
tagcatcgta ggggaaaaca ggattctgtg tcttccattc tactccttga taaagcgaag 180
aaatccgaca aaaccaaaga gattgttcaa gtttaagatt tgtaagcgta caactatgaa 240
cttcttctct ttgtaggcct gagtggtcgt atgcatacga ttcatgaagt gaatcagtat 300
cgctggattt tgcttaggag taaagcacaa ctaagaaaat atgctgcctg gcaggcatcc 360
tgagacatga ggcaagcgac gtagcaattg aatcctaatt taagccaggg catctgtatg 420
actctgttag ttaattgatg aaccaatgag ctttaaaaaa aaatcgttgc gcgtaatgta 480
gttttaattc tccgccttga ggtgcggggc catttcggac aaggttcttt ggacggagat 540
ggcagcatgt gtcccttctc caaattggtc cgtgtggtag ttgagatgct gccttaaaat 600
tctgctcggt catcctgcct tcgcattcac tcctttcgag ctgtcgggtt cctcacgagg 660
cctccgggag cggattgcgc agaaaggcga cccggagaca cagagaccat acaccgacta 720
aattgcactg gacgatacgg catggcgacg acgatggcca agcattgcta cgtgattatt 780
cgccttgtca ttcagggaga aatgatgaca tgtgtgggac ggtctttaca tgggaagagg 840
gcatgaaaat aacatggcct ggcgggatgg agcgtcacac ctgtgtatgc gttcgatcca 900
caagcaactc accatttgcg tcggggcctg tctccaatct gctttaggct acttttctct 960
aatttagcct attctataca gacagagaca cacagggatc atggggaaga aaccggaact 1020
gaccgctacg tccgtggaga aattccttat tgagaagttc gactctgtct ccgacttgat 1080
gcaactgagc gagggagagg agagtagggc gttctcgttt gacgtagggg gtcggggata 1140
cgtgttgagg gttaatagtt gtgcggacgg gttctacaag gatcggtatg tctaccgtca 1200
tttcgcctcc gccgctctcc ccataccaga ggtactggac attggggagt ttagcgaatc 1260
tctcacgtac tgcatctcgc gccgagccca gggagtgacg ttgcaagatc tgcccgaaac 1320
tgaattgcct gccgttttgc aacccgtggc cgaggccatg gacgcgatcg ctgccgcaga 1380
tctgtctcag acgtccggct ttggaccttt tgggccccag ggcatcgggc agtacacgac 1440
ctggcgagac ttcatctgcg ccattgccga tcctcacgtc tatcattggc agacagtcat 1500
ggatgacacc gtgtctgcat ccgtggccca agcactggac gaactcatgt tgtgggccga 1560
ggattgccct gaggtcaggc acctggtgca cgcggatttc ggcagcaata acgtacttac 1620
agacaatggt cggattactg ctgtcatcga ctggtccgaa gcgatgtttg gtgatagcca 1680
atacgaagtg gcgaacatat tcttctggcg tccctggttg gcgtgcatgg agcagcagac 1740
acgctacttt gaacggaggc acccggagct ggccggctcc ccacgactcc gcgcctatat 1800
gttgcgtatc ggactcgatc agctttacca gtctctcgtc gacggcaact tcgacgacgc 1860
cgcgtgggcg cagggccgct gcgacgcgat agtccgcagc ggggctggga cggtgggtcg 1920
gacccaaatc gcacgccggt cggctgcggt gtggacagac ggctgtgttg aggtgcttgc 1980
ggactcgggc aaccgtaggc cgagcacccg accgcgtgca aaggagtgat tgaatcattg 2040
aatgaaccat tgtgtgcaga atcgatttcg ggagtgttgc caacacaaga aatatgccca 2100
gggttgtgta gaagtttgcg tgaatgtgat gaagggaagc catacgctga attatcgtga 2160
cgtgtgtgag acgaagtgtc acatcataca cccaatttga gaagctgtac ctattagaag 2220
aatttgtgag atacattaaa ccccttttgg tacgtggtat aattgttatt tgggaagctg 2280
taaacacgca gatcgttcct gagattgtca attacttttg tggtgtttcc taaaggccgc 2340
atcact 2346
<210> 38
<211> 23
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 靶向TrifuncB的靶引导序列
<400> 38
ggcttggcgt ccaaagccgc cgg 23
<210> 39
<211> 1029
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 针对微拟球藻进行密码子优化的潮霉素抗性基因
<400> 39
atggggaaga aaccggaact gaccgctacg tccgtggaga aattccttat tgagaagttc 60
gactctgtct ccgacttgat gcaactgagc gagggagagg agagtagggc gttctcgttt 120
gacgtagggg gtcggggata cgtgttgagg gttaatagtt gtgcggacgg gttctacaag 180
gatcggtatg tctaccgtca tttcgcctcc gccgctctcc ccataccaga ggtactggac 240
attggggagt ttagcgaatc tctcacgtac tgcatctcgc gccgagccca gggagtgacg 300
ttgcaagatc tgcccgaaac tgaattgcct gccgttttgc aacccgtggc cgaggccatg 360
gacgcgatcg ctgccgcaga tctgtctcag acgtccggct ttggaccttt tgggccccag 420
ggcatcgggc agtacacgac ctggcgagac ttcatctgcg ccattgccga tcctcacgtc 480
tatcattggc agacagtcat ggatgacacc gtgtctgcat ccgtggccca agcactggac 540
gaactcatgt tgtgggccga ggattgccct gaggtcaggc acctggtgca cgcggatttc 600
ggcagcaata acgtacttac agacaatggt cggattactg ctgtcatcga ctggtccgaa 660
gcgatgtttg gtgatagcca atacgaagtg gcgaacatat tcttctggcg tccctggttg 720
gcgtgcatgg agcagcagac acgctacttt gaacggaggc acccggagct ggccggctcc 780
ccacgactcc gcgcctatat gttgcgtatc ggactcgatc agctttacca gtctctcgtc 840
gacggcaact tcgacgacgc cgcgtgggcg cagggccgct gcgacgcgat agtccgcagc 900
ggggctggga cggtgggtcg gacccaaatc gcacgccggt cggctgcggt gtggacagac 960
ggctgtgttg aggtgcttgc ggactcgggc aaccgtaggc cgagcacccg accgcgtgca 1020
aaggagtga 1029
<210> 40
<211> 1000
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> EIF3启动子
<400> 40
tcataatcaa agatgagcca gccacgaagc taccggagaa ttctgtaaga aaaatgttta 60
aagttgaaaa tgctaacagt gaagtgatat ccttttttaa tggagtgttg aggtgaagtc 120
tagcatcgta ggggaaaaca ggattctgtg tcttccattc tactccttga taaagcgaag 180
aaatccgaca aaaccaaaga gattgttcaa gtttaagatt tgtaagcgta caactatgaa 240
cttcttctct ttgtaggcct gagtggtcgt atgcatacga ttcatgaagt gaatcagtat 300
cgctggattt tgcttaggag taaagcacaa ctaagaaaat atgctgcctg gcaggcatcc 360
tgagacatga ggcaagcgac gtagcaattg aatcctaatt taagccaggg catctgtatg 420
actctgttag ttaattgatg aaccaatgag ctttaaaaaa aaatcgttgc gcgtaatgta 480
gttttaattc tccgccttga ggtgcggggc catttcggac aaggttcttt ggacggagat 540
ggcagcatgt gtcccttctc caaattggtc cgtgtggtag ttgagatgct gccttaaaat 600
tctgctcggt catcctgcct tcgcattcac tcctttcgag ctgtcgggtt cctcacgagg 660
cctccgggag cggattgcgc agaaaggcga cccggagaca cagagaccat acaccgacta 720
aattgcactg gacgatacgg catggcgacg acgatggcca agcattgcta cgtgattatt 780
cgccttgtca ttcagggaga aatgatgaca tgtgtgggac ggtctttaca tgggaagagg 840
gcatgaaaat aacatggcct ggcgggatgg agcgtcacac ctgtgtatgc gttcgatcca 900
caagcaactc accatttgcg tcggggcctg tctccaatct gctttaggct acttttctct 960
aatttagcct attctataca gacagagaca cacagggatc 1000
<210> 41
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 5'ID序列
<400> 41
tccacagccc gaacccatga gagagaa 27
<210> 42
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 3'ID序列
<400> 42
gcccgaatcg agttgatggc ccgcaaa 27
<210> 43
<211> 2400
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 具有侧接ID序列的HygR盒
<400> 43
tccacagccc gaacccatga gagagaatca taatcaaaga tgagccagcc acgaagctac 60
cggagaattc tgtaagaaaa atgtttaaag ttgaaaatgc taacagtgaa gtgatatcct 120
tttttaatgg agtgttgagg tgaagtctag catcgtaggg gaaaacagga ttctgtgtct 180
tccattctac tccttgataa agcgaagaaa tccgacaaaa ccaaagagat tgttcaagtt 240
taagatttgt aagcgtacaa ctatgaactt cttctctttg taggcctgag tggtcgtatg 300
catacgattc atgaagtgaa tcagtatcgc tggattttgc ttaggagtaa agcacaacta 360
agaaaatatg ctgcctggca ggcatcctga gacatgaggc aagcgacgta gcaattgaat 420
cctaatttaa gccagggcat ctgtatgact ctgttagtta attgatgaac caatgagctt 480
taaaaaaaaa tcgttgcgcg taatgtagtt ttaattctcc gccttgaggt gcggggccat 540
ttcggacaag gttctttgga cggagatggc agcatgtgtc ccttctccaa attggtccgt 600
gtggtagttg agatgctgcc ttaaaattct gctcggtcat cctgccttcg cattcactcc 660
tttcgagctg tcgggttcct cacgaggcct ccgggagcgg attgcgcaga aaggcgaccc 720
ggagacacag agaccataca ccgactaaat tgcactggac gatacggcat ggcgacgacg 780
atggccaagc attgctacgt gattattcgc cttgtcattc agggagaaat gatgacatgt 840
gtgggacggt ctttacatgg gaagagggca tgaaaataac atggcctggc gggatggagc 900
gtcacacctg tgtatgcgtt cgatccacaa gcaactcacc atttgcgtcg gggcctgtct 960
ccaatctgct ttaggctact tttctctaat ttagcctatt ctatacagac agagacacac 1020
agggatcatg gggaagaaac cggaactgac cgctacgtcc gtggagaaat tccttattga 1080
gaagttcgac tctgtctccg acttgatgca actgagcgag ggagaggaga gtagggcgtt 1140
ctcgtttgac gtagggggtc ggggatacgt gttgagggtt aatagttgtg cggacgggtt 1200
ctacaaggat cggtatgtct accgtcattt cgcctccgcc gctctcccca taccagaggt 1260
actggacatt ggggagttta gcgaatctct cacgtactgc atctcgcgcc gagcccaggg 1320
agtgacgttg caagatctgc ccgaaactga attgcctgcc gttttgcaac ccgtggccga 1380
ggccatggac gcgatcgctg ccgcagatct gtctcagacg tccggctttg gaccttttgg 1440
gccccagggc atcgggcagt acacgacctg gcgagacttc atctgcgcca ttgccgatcc 1500
tcacgtctat cattggcaga cagtcatgga tgacaccgtg tctgcatccg tggcccaagc 1560
actggacgaa ctcatgttgt gggccgagga ttgccctgag gtcaggcacc tggtgcacgc 1620
ggatttcggc agcaataacg tacttacaga caatggtcgg attactgctg tcatcgactg 1680
gtccgaagcg atgtttggtg atagccaata cgaagtggcg aacatattct tctggcgtcc 1740
ctggttggcg tgcatggagc agcagacacg ctactttgaa cggaggcacc cggagctggc 1800
cggctcccca cgactccgcg cctatatgtt gcgtatcgga ctcgatcagc tttaccagtc 1860
tctcgtcgac ggcaacttcg acgacgccgc gtgggcgcag ggccgctgcg acgcgatagt 1920
ccgcagcggg gctgggacgg tgggtcggac ccaaatcgca cgccggtcgg ctgcggtgtg 1980
gacagacggc tgtgttgagg tgcttgcgga ctcgggcaac cgtaggccga gcacccgacc 2040
gcgtgcaaag gagtgattga atcattgaat gaaccattgt gtgcagaatc gatttcggga 2100
gtgttgccaa cacaagaaat atgcccaggg ttgtgtagaa gtttgcgtga atgtgatgaa 2160
gggaagccat acgctgaatt atcgtgacgt gtgtgagacg aagtgtcaca tcatacaccc 2220
aatttgagaa gctgtaccta ttagaagaat ttgtgagata cattaaaccc cttttggtac 2280
gtggtataat tgttatttgg gaagctgtaa acacgcagat cgttcctgag attgtcaatt 2340
acttttgtgg tgtttcctaa aggccgcatc actgcccgaa tcgagttgat ggcccgcaaa 2400
<210> 44
<211> 23
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 靶向PXA1的靶引导序列
<400> 44
ggggtctggc acctgccgtc agg 23
<210> 45
<211> 23
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 靶向ACO1的靶引导序列
<400> 45
ggcgaggacg acgcatacca tgg 23
<210> 46
<211> 23
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 靶向ICL的靶引导序列
<400> 46
ggcaggttcg accaggaggc tgg 23
<210> 47
<211> 23
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测TrifuncB基因座处的供体片段插入的正向引物
<400> 47
ggcttggcgt ccaaagccgc cgg 23
<210> 48
<211> 22
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测TrifuncB基因座处的供体片段插入的反向引物
<400> 48
ggcgaatttc tgtaggtcca cg 22
<210> 49
<211> 27
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测PXA1基因座处的供体片段插入的正向引物
<400> 49
gcttgtgtag gtcgtgacct ggaaggc 27
<210> 50
<211> 22
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测PXA1基因座处的供体片段插入的反向引物
<400> 50
ccgacctcgt caaagcatcg gc 22
<210> 51
<211> 21
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测AOC1基因座处的供体片段插入的正向引物
<400> 51
tcaaagatca tttagcagag a 21
<210> 52
<211> 21
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测AOC1基因座处的供体片段插入的反向引物
<400> 52
agtcgagaga tggtgcgttc a 21
<210> 53
<211> 25
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测ICL基因座处的供体片段插入的正向引物
<400> 53
ggactttcca tgcgacatag ctttc 25
<210> 54
<211> 20
<212> DNA
<213> 迦得拟微球藻(Nannochloropsis gaditana)
<220>
<221> misc_feature
<223> 用于检测ICL基因座处的供体片段插入的反向引物
<400> 54
catctgcacc acctgaacgg 20
<210> 55
<211> 375
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 针对微拟球藻进行密码子优化的博来霉素抗性基因
<400> 55
atggccaagc tgaccagcgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 60
gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 120
gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 180
aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 240
gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 300
ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 360
gaggagcagg actaa 375
<210> 56
<211> 1000
<212> DNA
<213> 三角褐指藻(Phaeodactylum tricornutum)
<220>
<221> misc_feature
<223> GAPDH启动子
<400> 56
ggatttgcct cccatgcgcg gaaagtttgc acagagccag ctacagcaat gtcaatttct 60
tttgcagtgg ttggcacggg ttgatgggct gcactatcga tattgctgtc aatggctgtg 120
ctttggtttg acatcggtgc tgtgcgacgt ttggccatgc gctcggccat tctgtttttt 180
cgaatatgca aagttgtctc ttcccgagat cgacgaccgt cttcagctga cacggtcttc 240
ttaaatgacg catcacgacg aggaactaaa gccgcccagg tatacaattg tggcattaga 300
gactgaatac aatgcctcga atagcggaga tactaagggc cgttatttcg tacctgcggc 360
gactagggtc atgattgtat ctctaagaac aacaagggaa atttctgatc aaggtcgacg 420
ggtaaaaggc ggaacaagaa taaaaggatg gtgatacgga acagagcaac gctacagaaa 480
agtgaggatc gccaaccatc aagttgtggc gatgcgatac tttttgcgat aacgtctcgc 540
gctctatgat tttctttgtt atattaattt gttcaacatg agctaattaa ccgaaacctt 600
atgcctcaac tgccgactca gcacaagtac ctaactttgc aaggttttgt cgtatacgtc 660
tgtccataga acgttgacta atgtaagagg aagatttttg tggacgttgt gcgcttgaca 720
tccattggtt gatgtggttt tgctgatgtc acggcatcct gagtccccta acgtttcact 780
tggcgcctcg cagctgtttg cagttcgctc ggtatctttt tctaggatct tccgcagatt 840
tgaagttcgc atcgaaacca ttcctgtcgt ggaaaaaagg cctggatcgc atcttgcagg 900
tgcaacgcta attcttctcc attcataaaa acagaactcg tagaaaacga ttcaaatctt 960
ttttcgcctt tctaaacatc agtaattcta tcaaattcta 1000
<210> 57
<211> 479
<212> DNA
<213> 假微型海链藻(Thalassiosira pseudonana)
<220>
<221> misc_feature
<223> α微管蛋白终止子
<400> 57
tcactctgtc gcgctgttgg cgccactact ttgggggtac gagtttaggc tgccttggct 60
gggataaaga atgataagtt tacataattt gtattggaaa tccatcgagt tttggattca 120
gttgacgtct cctgcgttac tatgtcttca ttctctccag tatcaatgcc tatggttcgt 180
cgacattgag cacatttctt tcatcagcgc gatgcatgca atcatcactt cgcaatcttg 240
acaaacatcc tcaatgattc ctccacctct cccaacaaag tcaatgcatt catccttgga 300
tcttctcctc caccgaacgg ccgtgaagcc gactccatta gtgcatccag tccatcaaaa 360
taccgtatga attcccgaaa agattcactt gccaagtact gtttgtcatc ctcctcttca 420
ggtatctcat caatgagtgc atttgcagct atacgaatct ttgactcgga aatcaatcc 479

Claims (68)

1.一种突变体微生物,相比于与所述突变体微生物相同物种的对照微生物,其在每体积每天的基础上产生更多的可脂肪酸甲酯衍生的脂质(FAME脂质),其中所述突变体微生物包括导致线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化的突变。
2.一种突变体微生物,其包括线粒体三功能蛋白亚基B(TrifuncB)基因和/或线粒体三功能蛋白亚基A(TrifuncA)基因中的突变,其中当在相同条件下培养时,所述突变使所述TrifuncB基因和/或所述TrifuncA基因的表达弱化,并且与除了所述突变之外在基因上与所述突变体微生物相同的对照微生物相比,所述突变导致体积脂质生产力增加。
3.一种突变体微生物,其表现出比在相同条件下培养的同一物种的野生型微生物的可脂肪酸甲酯衍生的脂质与总有机碳(FAME/TOC)比率高至少15%的FAME/TOC比率,其中所述突变体微生物具有弱化的线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达。
4.根据权利要求1、2或3所述的突变体微生物,其中所述突变导致TrifuncB的表达弱化。
5.根据权利要求1、2或3所述的突变体微生物,其进一步包括对过氧化物酶体β氧化通路蛋白进行编码的基因或对乙醛酸通路蛋白进行编码的基因中的突变,其中所述突变导致所述过氧化物酶体β氧化通路蛋白或所述乙醛酸通路蛋白的表达弱化。
6.根据权利要求5所述的突变体微生物,其中所述过氧化物酶体β氧化通路蛋白是酰基-CoA氧化酶1(ACO1)或过氧化物酶体ABC型酰基-辅酶A转运蛋白(PXA1)。
7.根据权利要求5所述的突变体微生物,其中所述乙醛酸通路蛋白是异柠檬酸裂解酶(ICL)。
8.根据权利要求1或2所述的突变体微生物,其中所述突变体微生物显示出比所述对照微生物更高的可脂肪酸甲酯衍生的脂质与总有机碳的比率(FAME/TOC比率)。
9.根据权利要求8所述的突变体微生物,其中所述突变体微生物表现出比所述对照微生物的FAME/TOC比率高至少15%的FAME/TOC比率。
10.根据权利要求4或5所述的突变体微生物,其中所述突变体微生物表现出比所述对照微生物的FAME/TOC比率高至少30%的FAME/TOC比率。
11.根据权利要求10所述的突变体微生物,其中所述突变体微生物表现出比所述对照微生物的FAME/TOC比率高至少40%的FAME/TOC比率,其中所述弱化的过氧化物酶体β氧化通路蛋白是酰基-CoA氧化酶1(ACO1)或过氧化物酶体ABC型酰基辅酶A转运蛋白(PXA1)。
12.根据权利要求11所述的突变体微生物,其中所述突变体微生物表现出比所述对照微生物的FAME/TOC比率高至少50%的FAME/TOC比率,其中所述弱化的过氧化物酶体β氧化通路蛋白是ACO1。
13.根据权利要求1或2所述的突变体微生物,其中所述突变是敲除突变。
14.根据权利要求1或2所述的突变体藻类微生物,其中所述突变是敲低突变。
15.根据权利要求1或2所述的突变体微生物,其中所述突变体微生物包括用于表达至少一个反义分子、至少一个RNAi分子或用于使TrifuncB基因或TrifuncA基因的表达弱化的至少一种核酶的重组核酸分子。
16.根据权利要求1所述的突变体藻类微生物,其中外源DNA存在于所述TrifuncB基因或所述TrifuncA基因中,由此使所述基因的表达弱化。
17.根据权利要求2所述的突变体藻类微生物,其中外源DNA存在于所述TrifuncB基因或所述TrifuncA基因中,由此使所述基因的表达弱化。
18.根据权利要求16或17所述的突变体藻类微生物,其中所述外源DNA包括未在对照藻类微生物的基因组中发现的标记基因。
19.根据权利要求1或2所述的突变体微生物,其中所述突变在Cas PAM序列上游的25个碱基对内。
20.根据权利要求1或2所述的突变体微生物,其中所述突变体微生物包括对Cas蛋白进行编码的核酸序列。
21.根据权利要求5所述的突变体微生物,其中对过氧化物酶体β氧化通路蛋白进行编码的所述基因中的所述突变是酰基-CoA氧化酶1(ACO1)基因的敲除突变。
22.根据权利要求21所述的突变体微生物,其中所述TrifuncB基因和/或所述TrifuncA基因中的所述突变是敲除突变。
23.根据权利要求5所述的突变体微生物,其中对过氧化物酶体β氧化通路蛋白进行编码的所述基因中的所述突变是所述过氧化物酶体ABC型酰基-辅酶A转运蛋白(PXA1)基因的敲除突变。
24.根据权利要求23所述的突变体微生物,其中所述TrifuncB基因和/或所述TrifuncA基因中的所述突变是敲除突变。
25.根据权利要求5所述的突变体微生物,其中对乙醛酸通路蛋白进行编码的所述基因中的所述突变是所述异柠檬酸裂解酶(ICL)基因中的敲除突变。
26.根据权利要求25所述的突变体微生物,其中所述TrifuncB基因中的所述突变是敲除突变。
27.根据权利要求1、2或3所述的突变体微生物,其中相对于所述对照微生物,所述突变体微生物在每体积每天的基础上比在充满氮的培养条件下的所述对照微生物产生更多的FAME脂质。
28.根据权利要求1所述的突变体藻类微生物,其中在分批、半连续或连续培养中,所述突变体微生物显示出比所述对照微生物更高的FAME生产力。
29.根据权利要求1、2或3所述的突变体藻类微生物,其中在光合自养的培养条件下,所述突变体微生物显示出比所述对照微生物更高的FAME生产力。
30.根据权利要求1、2或3所述的突变体藻类微生物,其中所述突变体微生物是藻类微生物。
31.根据权利要求30所述的突变体藻类微生物,其中所述突变体藻类微生物是一种曲壳藻(Achnanthes)、茧形藻(Amphiprora)、双眉藻(Amphora)、纤维藻(Ankistrodesmus)、星胞藻(Asteromonas)、黄金色藻(Boekelovia)、波利氏藻(Bolidomonas)、包特氏菌(Borodinella)、气球藻(Botrydium)、葡萄藻(Botryococcus)、荀球藻(Bracteococcus)、角毛藻(Chaetoceros)、四鞭藻(Carteria)、衣藻(Chlamydomonas)、绿球藻(Chlorococcum)、绿梭藻(Chlorogonium)、小球藻(Chlorella)、蓝隐藻(Chroomonas)、金球藻(Chrysosphaera)、球钙板藻(Cricosphaera)、隐甲藻(Crypthecodinium)、隐藻(Cryptomonas)、小环藻(Cyclotella)、链带藻(Desmodesmus)、杜氏藻(Dunaliella)、后棘藻(Elipsoidon)、球石藻(Emiliania)、独球藻(Eremosphaera)、衣迪斯藻(Ernodesmius)、眼虫藻(Euglena)、真眼点藻(Eustigmatos)、伏氏藻(Franceia)、脆杆藻(Fragilaria)、拟脆杆藻(Fragilaropsis)、丽丝藻(Gloeothamnion)、红球藻(Haematococcus)、菱板藻(Hantzschia)、异弯藻(Heterosigma)、膜胞藻(Hymenomonas)、等鞭金藻(Isochrysis)、鳞孔藻(Lepocinclis)、微芒藻(Micractinium)、蒜头藻(Monodus)、单针藻(Monoraphidium)、微球藻(Nannochloris)、微拟球藻(Nannochloropsis)、舟形藻(Navicula)、新绿藻(Neochloris)、肾鞭藻(Nephrochloris)、肾爿藻(Nephroselmis)、菱形藻(Nitzschia)、棕鞭藻(Ochromonas)、鞘藻(Oedogonium)、卵囊藻(Oocystis)、蚝球藻(Ostreococcus)、拟小球藻(Parachlorella)、雪衣藻(Parietochloris)、杜氏亚属盐藻(Pascheria)、巴夫藻(Pavlova)、普莱格门(Pelagomonas)、褐指藻(Phoeodactylum)、噬菌体(Phagus)、皮级微绿藻(Picochlorum)、扁藻(Platymonas)、颗石藻(Pleurochrysis)、宽球藻(Pleurococcus)、原壁菌(Prototheca)、假小球藻(Pseudochlorella)、拟新绿藻(Pseudoneochloris)、假十字趾藻(Pseudostaurastrum)、塔胞藻(Pyramimonas)、葡串藻(Pyrobotrys)、栅列藻(Scenedesmus)、裂衣藻(Schizochlamydella)、骨条藻(Skeletonema)、水绵藻(Spyrogyra)、裂丝藻(Stichococcus)、四球藻(Tetrachlorella)、四爿藻(Tetraselmis)、海链藻(Thalassiosira)、黄丝藻(Tribonema)、无隔藻(Vaucheria)、鲜绿球藻(Viridiella)、魏氏藻(Vischeria)和团藻(Volvox)。
32.根据权利要求30所述的突变体藻类微生物,其中所述突变体藻类微生物是不等鞭毛体(heterokont)藻类。
33.根据权利要求32所述的突变体藻类微生物,其中所述突变体藻类微生物是黄绿藻(Eustigmatophyte)或硅藻(diatom)。
34.根据权利要求30所述的突变体藻类微生物,其中所述突变体藻类微生物是一种微拟球藻。
35.根据权利要求34所述的突变体藻类微生物,其中所述突变体藻类微生物是迦得拟微球藻(Nannochloropsis gaditana)。
36.一种生物质,其包括根据权利要求1、2或3中任一项所述的突变体微生物。
37.一种悬浮液,其包括突变体微生物和培养基,其中所述突变体微生物包括根据权利要求1、2、4或5所述的藻类突变体微生物中的任何藻类突变体微生物。
38.根据权利要求37所述的悬浮液,其中所述培养基包括一种或多种抗生素。
39.一种根据权利要求1、2或3中任一项所述的突变体微生物的裂解物。
40.一种冷冻保存的突变体藻类微生物,其中所述突变体藻类微生物是悬浮在包括冷冻防腐剂的培养基中的根据权利要求1、2、4或5中任一项所述的突变体藻类微生物。
41.一种产生脂质的方法,所述方法包括在培养基中培养根据权利要求1、2或3中任一项所述的突变体微生物以及从所述微生物、所述培养基或两者中分离脂质。
42.根据权利要求41所述的方法,其中所述培养是分批的、连续的或半连续的。
43.根据权利要求42所述的方法,其中培养条件是半连续的或连续的。
44.根据权利要求41所述的方法,其中所述培养条件是充满氮的。
45.根据权利要求41所述的方法,其中所述突变体微生物是藻类微生物,并且所述培养条件是光合自养的。
46.一种脂质组合物,其通过从根据权利要求1、2或3中任一项所述的突变体微生物中分离脂质而产生,其中与从对照微生物中分离的脂质的脂肪酸谱相比,16:0和16:1脂肪酸增加并且20:5脂肪酸减少。
47.一种用于制备突变体微生物的方法,所述方法包括使用以下中的一种或多种将重组核酸分子插入到线粒体三功能蛋白亚基B(TrifuncB)基因或线粒体三功能蛋白亚基A(TrifuncA)基因中:同源重组、成簇规律间隔短回文重复序列(CRISPR)/基于Cas的RNA引导的DNA内切核酸酶、转录激活因子样效应因子核酸酶(TALEN)、锌指核酸酶(ZFN)或大范围核酸酶,其中所述突变导致所述TrifuncB蛋白或所述TrifuncA蛋白的表达弱化,并且其中相比于与所述突变体微生物或重组微生物相同物种的对照野生型微生物,所述突变体在每体积每天的基础上产生更多的可脂肪酸甲酯衍生的脂质(FAME脂质)和/或表现出增加的可脂肪酸甲酯衍生的脂质与总有机碳(FAME/TOC)比率。
48.根据权利要求47所述的方法,其中所述CRISPR/基于Cas的RNA引导的DNA内切核酸酶的使用包括将序列插入在所述TrifuncB基因的第二外显子中。
49.根据权利要求47所述的用于制备突变体微生物的方法,其中所述方法进一步包括使用以下中的一种或多种将重组核酸分子插入到对过氧化物酶体β氧化通路蛋白进行编码的基因或乙醛酸通路基因中:同源重组、成簇规律间隔短回文重复序列(CRISPR)/基于Cas的RNA引导的DNA内切核酸酶、转录激活因子样效应因子核酸酶(TALEN)、锌指核酸酶(ZFN)或大范围核酸酶,其中所述突变导致所述过氧化物酶体β氧化通路蛋白的表达弱化。
50.根据权利要求47到49中任一项所述的方法,其中所述方法包括在所述微生物中表达靶向核酸酶。
51.一种用于制备突变体微生物的方法,所述方法包括将用于表达RNAi分子、微RNA、反义分子或核酶中的一种或多种的重组核酸分子引入到对照藻类微生物中,其中所述RNAi分子、所述反义分子或所述核酶靶向所述微生物的TrifuncA基因或TrifuncB基因,并且其中与所述对照微生物相比,所述突变体微生物显示出增加的脂质产生。
52.一种用于制备双突变体微生物的方法,所述方法包括将用于表达RNAi分子、微RNA、反义分子或核酶中的一种或多种的重组核酸分子引入到突变体微生物中,其中所述突变体藻类微生物包括导致线粒体三功能蛋白亚基B(TrifuncB)和/或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化的突变,并且其中所述RNAi分子、所述反义分子或所述核酶靶向所述微生物的过氧化物酶体β氧化通路的基因或乙醛酸通路的基因,由此证明与所述突变体微生物相比,脂质产生进一步增加。
53.根据权利要求52所述的方法,其中双突变体微生物包括用于表达靶向所述微生物的所述过氧化物酶体β氧化通路的基因或所述乙醛酸通路的基因的所述RNAi分子、微RNA、反义分子或核酶的重组核酸分子以及用于表达靶向TrifuncA基因或TrifuncB基因的另一个RNAi分子、微RNA、反义分子或核酶的另一个重组核酸分子。
54.根据权利要求51或52所述的方法,其中所述重组核酸分子在所述微生物中表达短干扰RNA(siRNA)。
55.根据权利要求51或52所述的方法,其中所述重组核酸分子在所述微生物中表达微RNA。
56.根据权利要求52所述的方法,其中所述过氧化物酶体β氧化通路或乙醛酸通路蛋白选自由以下组成的组:酰基-CoA氧化酶1(ACO1)、过氧化物酶体ABC转运蛋白(PXA1)和异柠檬酸裂解酶(ICL)。
57.根据权利要求47到56中任一项所述的方法,其中所述突变体微生物是藻类微生物。
58.根据权利要求57所述的方法,其中所述藻类微生物是一种曲壳藻、茧形藻、双眉藻、纤维藻、星胞藻、黄金色藻、波利氏藻、包特氏菌、气球藻、葡萄藻、荀球藻、角毛藻、四鞭藻、衣藻、绿球藻、绿梭藻、小球藻、蓝隐藻、金球藻、球钙板藻、隐甲藻、隐藻、小环藻、链带藻、杜氏藻、后棘藻、球石藻、独球藻、衣迪斯藻、眼虫藻、真眼点藻、伏氏藻、脆杆藻、拟脆杆藻、丽丝藻、红球藻、菱板藻、异弯藻、膜胞藻、等鞭金藻、鳞孔藻、微芒藻、蒜头藻、单针藻、微球藻、微拟球藻、舟形藻、新绿藻、肾鞭藻、肾爿藻、菱形藻、棕鞭藻、鞘藻、卵囊藻、蚝球藻、拟小球藻、雪衣藻、杜氏亚属盐藻、巴夫藻、普莱格门、褐指藻、噬菌体、皮级微绿藻、扁藻、颗石藻、宽球藻、原壁菌、假小球藻、拟新绿藻、假十字趾藻、塔胞藻、葡串藻、栅列藻、裂衣藻、骨条藻、水绵藻、裂丝藻、四球藻、四爿藻、海链藻、黄丝藻、无隔藻、鲜绿球藻、魏氏藻和团藻。
59.根据权利要求57所述的方法,其中所述突变体藻类微生物是不等鞭毛体藻类。
60.根据权利要求59所述的方法,其中所述突变体藻类微生物是黄绿藻或硅藻。
61.根据权利要求60所述的方法,其中所述突变体藻类微生物是一种微拟球藻。
62.根据权利要求61所述的方法,其中所述突变体藻类微生物是迦得拟微球藻。
63.一种用于制备可生物防护的(biocontainable)突变体藻类微生物的方法,所述方法包括将对用于生物防护的基因进行编码的外源非藻类核酸插入到突变体藻类微生物中,其中所述突变体藻类微生物包括导致线粒体三功能蛋白亚基B(TrifuncB)或线粒体三功能蛋白亚基A(TrifuncA)的表达弱化的突变。
64.根据权利要求63所述的方法,其中所述突变体藻类微生物包括TrifuncB敲除突变。
65.根据权利要求64所述的方法,其中所述突变体藻类微生物进一步包括对过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白进行编码的基因中的突变,其中所述突变导致过氧化物酶体β氧化通路蛋白或乙醛酸通路蛋白的表达弱化。
66.根据权利要求65所述的方法,其中所述过氧化物酶体β氧化通路蛋白或所述乙醛酸通路蛋白是酰基-CoA氧化酶1(ACO1)、过氧化物酶体ABC型酰基-辅酶A转运蛋白(PXA1)或异柠檬酸裂解酶(ICL)。
67.根据权利要求63到66中任一项所述的方法,其中相比于与所述突变体藻类微生物相同物种的对照藻类微生物,所述可生物防护的突变体藻类微生物在每体积每天的基础上产生更多的可脂肪酸甲酯衍生的脂质(FAME脂质)和/或表现出增加的可脂肪酸甲酯衍生的脂质与总有机碳(FAME/TOC)比率。
68.根据权利要求63到67中任一项所述方法,其中所述生物防护基因是毒素基因。
CN201980044488.9A 2018-07-23 2019-07-22 具有增加的脂质产生的微生物和组合物及其制备和使用方法 Pending CN112384619A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862702253P 2018-07-23 2018-07-23
US62/702,253 2018-07-23
PCT/US2019/042768 WO2020023353A1 (en) 2018-07-23 2019-07-22 Microorganisms having increased lipid production, and compositions and methods of making and using the same

Publications (1)

Publication Number Publication Date
CN112384619A true CN112384619A (zh) 2021-02-19

Family

ID=69162608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980044488.9A Pending CN112384619A (zh) 2018-07-23 2019-07-22 具有增加的脂质产生的微生物和组合物及其制备和使用方法

Country Status (7)

Country Link
US (1) US11046979B2 (zh)
EP (1) EP3827080A4 (zh)
CN (1) CN112384619A (zh)
AU (1) AU2019310022A1 (zh)
IL (1) IL280282A (zh)
MX (1) MX2021000906A (zh)
WO (1) WO2020023353A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108026504A (zh) * 2015-07-14 2018-05-11 合成基因组股份有限公司 脂质产率增加的微生物

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024097353A1 (en) * 2022-11-04 2024-05-10 Viridos, Inc. Recombinant algae having high biomass and lipid productivity

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130102040A1 (en) * 2011-10-17 2013-04-25 Colorado School Of Mines Use of endogenous promoters in genetic engineering of nannochloropsis gaditana
US20170058303A1 (en) * 2015-07-14 2017-03-02 Synthetic Genomics, Inc. Microorganisms having increased lipid productivity
US20170073695A1 (en) * 2014-12-31 2017-03-16 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
US20170121742A1 (en) * 2015-11-02 2017-05-04 Synthetic Genomics, Inc. Algal mutants with increased lipid productivity
US20180186842A1 (en) * 2016-12-30 2018-07-05 Synthetic Genomics, Inc. High productivity algal mutants having reduced photosynthetic antenna

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9868959B2 (en) * 2010-12-13 2018-01-16 J. Craig Venter Institute Engineered microalgae with enhanced lipid production
WO2016073079A2 (en) 2014-09-26 2016-05-12 Yale University Compositions and methods for biocontainment of microorganisms

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130102040A1 (en) * 2011-10-17 2013-04-25 Colorado School Of Mines Use of endogenous promoters in genetic engineering of nannochloropsis gaditana
US20170073695A1 (en) * 2014-12-31 2017-03-16 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing
US20170058303A1 (en) * 2015-07-14 2017-03-02 Synthetic Genomics, Inc. Microorganisms having increased lipid productivity
US20170121742A1 (en) * 2015-11-02 2017-05-04 Synthetic Genomics, Inc. Algal mutants with increased lipid productivity
US20180186842A1 (en) * 2016-12-30 2018-07-05 Synthetic Genomics, Inc. High productivity algal mutants having reduced photosynthetic antenna

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ELISA CORTEGGIANI CARPINELLI等: "Chromosome Scale Genome Assembly and Transcriptome Profiling of Nannochloropsis gaditana in Nitrogen Depletion", MOLECULAR PLANT, pages 323 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108026504A (zh) * 2015-07-14 2018-05-11 合成基因组股份有限公司 脂质产率增加的微生物

Also Published As

Publication number Publication date
WO2020023353A1 (en) 2020-01-30
AU2019310022A1 (en) 2021-02-04
IL280282A (en) 2021-03-01
EP3827080A1 (en) 2021-06-02
MX2021000906A (es) 2021-03-31
US11046979B2 (en) 2021-06-29
US20200024623A1 (en) 2020-01-23
EP3827080A4 (en) 2022-04-20

Similar Documents

Publication Publication Date Title
CN108368491B (zh) 具有提高的脂质生产率的藻类突变体
US8709766B2 (en) Use of endogenous promoters in genetic engineering of Nannochloropsis gaditana
US11332764B2 (en) Microorganisms having increased lipid productivity
CN111527101A (zh) 用于改善生长的光合生物基因调节
EP3344776B1 (en) Rekombinant algal microorganism with increased productivity
CN112384619A (zh) 具有增加的脂质产生的微生物和组合物及其制备和使用方法
CN111433220A (zh) 通过基因修饰含trp结构域的蛋白来提高藻类脂质生产力
US11098328B2 (en) Algal lipid productivity via genetic modification of a signaling protein
US20170191094A1 (en) Expression of type i fatty acid synthase genes in eukaryotic algae
CN116536290A (zh) 天冬氨酸蛋白酶1及其编码基因在调控小麦光合作用、产量及蛋白含量中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination