CN108026504A - 脂质产率增加的微生物 - Google Patents

脂质产率增加的微生物 Download PDF

Info

Publication number
CN108026504A
CN108026504A CN201680052590.XA CN201680052590A CN108026504A CN 108026504 A CN108026504 A CN 108026504A CN 201680052590 A CN201680052590 A CN 201680052590A CN 108026504 A CN108026504 A CN 108026504A
Authority
CN
China
Prior art keywords
mutant microbial
seq
mutant
microorganism
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680052590.XA
Other languages
English (en)
Other versions
CN108026504B (zh
Inventor
I·阿加维
E·R·莫里林
L·索里亚戈
M·阿奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Viridos Inc
Original Assignee
Synthetic Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Synthetic Genomics Inc filed Critical Synthetic Genomics Inc
Publication of CN108026504A publication Critical patent/CN108026504A/zh
Application granted granted Critical
Publication of CN108026504B publication Critical patent/CN108026504B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/405Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/12Unicellular algae; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6463Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Cell Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了突变微生物,其在氮充足条件下比它们所来源的野生型微生物具有更高的脂质产率,同时生物质水平在野生型生物质产率的大约50%以内。在氮充足条件下特定突变体生成野生型所生成的至少两倍的FAME脂质,同时生成野生型细胞所生成的至少75%的生物质。还提供了使用所述突变株生成脂质的方法。

Description

脂质产率增加的微生物
相关申请案的交叉引用
本申请根据美国法典第35篇第119(e)条要求2015年7月14日提交的美国序列号62/192,510和2016年4月4日提交的美国序列号62/318,161的优先权益,其全部内容通过引用整体并入本文。
通过引用方式并入序列表
所附序列表中的材料据此通过引用并入申请案中。所附序列表文本文件,名称为SGI1920_2WO_Sequence_Listing.txt,创建于2016年7月14日且为229kb。可以在使用Window OS的计算机上使用Microsoft Word访问该文件。
发明背景
本发明涉及脂质产率增加的突变微生物,如藻类和异鞭毛类,及其在生产脂质中的用途。
许多微生物如藻类、网粘菌纲(labyrinthulomycetes)(“壶菌(chytrids)”)和产油酵母响应于营养胁迫,例如氮饥饿而诱导脂质生物合成。在氮贫化的条件下,此类微生物使化合物生物合成从蛋白质重新定向为储存脂质,通常为三酰基甘油酯脂质(“TAG”)。因氮贫化同时降低细胞生长,所以在细胞变得太过代谢受损而不能维持高水平的生产之前,最佳的脂质生物合成被限于相对较短的窗口。
微藻来源的生物柴油长期以来被视为传统石油类燃料的可行替代品。然而,尽管进行了几十年的生物学研究,但剥夺菌株的必需大量营养元素如氮、磷或硅,以获得高脂质产量-宿主微生物的生长受损的情况-依然是惯用做法。在工程改造藻类菌株以积聚脂质,同时保持生长方面取得很小进展,因为对脂质积聚基础的代谢调节仅有初步了解(Courchesne等人(2009).J.Biotechnol.141:31-41;Goncalves等人(2016)PlantBiotechnol.J.doi:1111/12523)。
为了在营养充足生长期间通过增加脂质生物合成来提高脂质产率的各种尝试已集中在操纵编码用于氮同化或脂质代谢的酶的基因以及编码脂质储存中所涉及的多肽的基因。例如,US2014/0162330公开了三角褐指藻(Phaeodactylum tricornutum)菌株,其中已经通过基于RNAi的敲减减弱了硝酸还原酶(NR)基因;Trentacoste等人((2013)Proc.Natl.Acad.Sci.USA 110:19748-19753)公开了用靶向预计会涉及脂质异化的Thaps3_264297基因的RNAi构建体转化的硅藻;并且WO2011127118公开了用编码油质蛋白(脂质储存蛋白)的基因以及编码二酰甘油转移酶(DGAT)基因的基因转化衣藻(Chlamydomonas)。虽然在每种情况下基于显微镜检查或用亲脂性染料染色断言脂质产量增加,但未提供按所操纵细胞对脂质的量化,也未测定随时间推移生物质和脂质产率之间的关系。
WO 2011/097261和US 2012/0322157报告称,名为“SN03”的编码抑制蛋白(arrestin)的基因在衣藻中过表达时,在营养充足条件下在增加脂质产量上有作用。然而,观察到SN03基因的过表达会导致未量化的不明极性脂质的出现,并且不会引起甘油三酯(TAG)的增加。鉴定为可能调节胁迫诱导的脂质生物合成的另一多肽已由Boyle等人((2012)J.Biol.Chem.287:15811-15825)进行了描述。敲除衣藻中编码“SQUAMOUSA”结构域多肽的NRR1基因导致在氮贫化情况下相对于野生型细胞而言脂质生物合成减少;然而未得到展示出脂质产量增加的突变体。US 2010/0255550推荐在藻类细胞中过表达假定转录因子(“TF1、TF2、TF3、TF4和TF5”)以增加脂质产量,但是未公开脂质产量提高的突变体。
Daboussi等人2014(Nature Comm.5:3881)报告称,破坏三角褐指藻中据信会为昆布多糖(储存碳水化合物)合成提供前体的UGP酶基因,导致脂质积聚增加。然而,显示无生物化学数据表明昆布多糖含量受影响并且未报告脂质和生物质产率。类似地,几个组已经报告衣藻无淀粉突变体中的脂质积聚增加(Wang等人2009Eukaryotic Cell8:1856-1868;Li等人2010Metab Eng.12:387-391),但实际测量脂质产率的连续报告断定这些菌株在光营养条件下生长时生长受损(Siaut等人2011BMC Biotechnol.11:7;Davey等人2014Eukaryot Cell13:392-400)。这些报告断定实际上由野生型亲本菌株达到最高脂质产率(按TAG/升/天测量)。
发明概述
本文提供了组成型脂质生产水平升高的藻类突变体。如实例中所展示的,对加的斯微拟球藻(Nannochloropsis gaditana)响应于N-剥夺的早期转录曲线的分析揭示了脂质生物合成的一种新型负调节因子ZnCys-2845,即真菌Zn(II)2Cys6基因家族的转录因子。使用Cas9介导的诱变和RNAi技术,产生ZnCys减弱菌株,其能够将其总碳含量的大约45%分配给脂质并且能够在连续生长系统中持续生长,导致脂质产率翻倍。
本发明的第一方面是一种突变微生物,所述突变微生物生成比对照微生物所生成的多至少25%的脂质,同时生成在相同条件下培养的所述对照微生物所生成的不少于45%的生物质,其中所述培养条件支持对照微生物生成生物质。例如,本文所提供的突变微生物可以生成比在与突变微生物相同的条件下培养的对照微生物所生成的多至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的脂质,所述条件可以是分批、半连续或连续培养条件,并且在不同实施方案中是对照微生物积聚生物质的培养条件。在一些实例中,对照微生物可以是野生型微生物,即由其直接或间接得到突变微生物的野生型微生物。在不同实施方案中,突变微生物可以生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%或至少120%的脂质,其中在突变体生成更多脂质的培养条件下,对照微生物生成生物质,例如,在培养过程中或每天生成生物质。在不同实例中,本文所提供的突变微生物生成在相同条件下培养的野生型微生物所生成的至少50%的生物质和至少130%、至少150%、至少140%、至少155%、至少160%、至少170%、至少175%、至少180%、至少185%、至少190%、至少195%、至少200%、至少210%或至少215%的量的脂质,在所述条件下野生型微生物积聚生物质。例如,培养条件相对于对照或野生型微生物而言可以是氮充足的。
在至少3天、至少5天、至少7天、至少8天、至少10天、至少12天、至少15天、至少20天、至少30天或至少60天的培养期内,本文所提供的突变微生物可以比对照或野生型微生物生成多至少25%的FAME脂质,同时生成多达对照或野生型微生物所生成的至少45%或至少约50%的生物质。例如,在至少3天、至少5天、至少7天、至少10天、至少12天、至少15天、至少20天、至少30天或至少60天的培养期内,FAME平均日产率可比对照或野生型微生物的FAME平均日产率高至少50%,而生物质(例如,TOC)平均日产率可为对照或野生型微生物的生物质平均日产率的至少45%或至少约50%。在特定实例中,在至少7天、至少8天或至少10天的培养期内,本文所提供的突变微生物可以比对照或野生型微生物生成多至少50%的FAME脂质,同时生成多达对照微生物所生成的至少60%的生物质,其中在所述至少7天、至少8天或至少10天培养期内的任一天,突变体生成的FAME日量都不低于对照或野生型微生物所生成的FAME日量。在其它实例中,在至少7天、至少8天或至少10天的培养期内,本文所提供的突变微生物的FAME平均日产率可比对照或野生型微生物的FAME平均日产率高至少50%,生物质平均日产率可为对照微生物的生物质平均日产率的至少50%,其中在所述至少7天、至少8天或至少10天培养期内的任一天,突变体生成的FAME日量都不低于对照或野生型微生物所生成的FAME日量。
例如,在对照微生物生成生物质的相同培养条件下培养所述突变微生物和对照微生物时,本文所提供的突变微生物可以比对照微生物生成更多的FAME衍生化脂质(“FAME脂质”或“FAME”),同时生成对照微生物所生成的不少于45%的生物质。在对照微生物生成生物质的相同培养条件下培养所述突变微生物和对照微生物时,本文所提供的突变微生物可比对照微生物具有更高的FAME平均日产率,同时表现出对照微生物的至少45%的生物质平均日产率。在不同实例中,在对照微生物的培养物生成生物质的相同培养条件下培养所述突变微生物和对照微生物时,本文所提供的突变微生物生成多至少50%的FAME脂质,同时生成对照微生物所生成的不少于约50%、不少于约60%或不少于约70%的生物质,所述培养条件相对于对照微生物而言可以是氮充足的培养条件。在不同实施方案中对照微生物可以是野生型微生物,即由其直接或间接得到突变微生物的野生型微生物。
在一些实例中,突变体比对照或野生型微生物生成更多的脂质的培养条件可以是培养基中铵的浓度小于约2.5mM,例如小于约2mM、小于约1.5mM、小于约1mM或小于或等于约0.5mM的培养条件。在一些实例中,培养基可以不包括添加的铵或基本上不包括铵。在一些实例中,培养基可以不包括添加的微生物还原态氮源,例如,未添加可以被微生物代谢的铵、尿素或氨基酸。在一些实例中,培养基可包括氮源,例如但不限于,硝酸盐。可选地或另外,培养基可包括尿素。在一些实例中,培养基相对于由其得到突变微生物的种类的野生型微生物而言是营养充足的。
在不同实施方案中,突变微生物可为光合微生物并且在光合自养培养条件下突变微生物可比对照微生物生成多至少25%的FAME脂质,同时生成对照或野生型微生物所生成的至少45%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的量的生物质。例如,本文所提供的突变微生物可为藻类,如真核微藻,并且当使用无机碳作为培养物中基本上唯一的碳源培养对照微生物时,突变微生物可比对照或野生型微生物生成多至少25%的FAME脂质,同时生成对照微生物所生成的至少45%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的量的生物质。对照微生物可为,例如野生型微生物。
本文所提供的突变微生物可比对照或野生型微生物生成更多的FAME脂质,同时生成对照或野生型微生物所生成的至少45%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的量的生物质的培养条件包括对照或野生型微生物生成生物质的分批、连续或半连续培养条件中的任一种。在不同实施方案中,在至少3天、至少4天、至少5天、至少7天、至少8天、至少10天或至少12天的培养期内,本文所提供的突变微生物可比对照或野生型微生物生成多至少50%的FAME脂质,同时生成多达对照或野生型微生物所生成的至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的生物质。在一些实施方案中,在培养期内,例如,在至少3天、至少4天、至少5天、至少7天、至少10天或至少12天的培养期内,突变微生物的FAME平均日产率比对照或野生型微生物的FAME平均日产率高至少50%,而生物质平均日产率(例如,TOC产率)高达对照或野生型微生物的生物质平均日产率的至少45%、至少约50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。
在一些实例中,在至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天或至少13天的培养期内,例如,在至少5天、至少10天、至少15天、至少20天或至少30天的培养期内,其中在突变和对照微生物两者均生成生物质的相同条件下培养突变和对照微生物,本文所提供的突变微生物可生成多至少50%的FAME脂质,同时生成野生型或对照微生物所生成的至少约75%的量的生物质。例如,在对照和突变微生物培养物两者均生成生物质的条件下,相对于培养了至少5天、至少6天、至少7天或至少8天的野生型或对照微生物而言,突变微生物可展示出高至少60%、至少70%、至少80%、至少90%、至少100%或至少110%或至少120%的FAME产率并且在生物质(例如,TOC)产率上表现出不超过35%、30%、25%、20%、15%、10%、5%、2%或1%的下降。例如,在对照和突变微生物培养物两者均生成生物质的条件下,本文所提供的突变体的FAME平均日产率可比野生型或对照微生物的FAME平均日产率高至少60%、至少70%、至少80%、至少90%、至少100%或至少110%并且生物质(例如,TOC)平均日产率可为对照微生物的生物质平均日产率的至少约50%、至少约60%、至少约70%或至少约80%。在不同实施方案中,在对照和突变微生物两者均每天生成生物质的条件下,本文所提供的突变体的FAME平均日产率可比野生型或对照微生物的FAME平均日产率高至少60%、至少70%、至少80%、至少90%、至少100%或至少110%并且生物质(例如,TOC)平均日产率可为对照微生物的生物质平均日产率的至少约50%、至少约60%、至少约70%或至少约80%。在一些实例中,突变微生物可比野生型或对照微生物生成多至少100%或多至少120%的FAME脂质,同时生成为在相对于对照微生物而言是氮充足的相同条件下培养的对照型微生物所生成的至少约75%或至少约80%的生物质。在其它实例中突变微生物可比野生型或对照微生物生成多至少75%、至少80%或至少85%的FAME脂质,同时生成与在野生型或对照微生物生成生物质的相同条件下培养的野生型微生物所生成的大约同样多的生物质,例如,对照微生物所生成的10%以内或5%以内的量的生物质。在不同实例中,培养至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天或至少13天,例如培养至少5天、至少10天、至少15天、至少20天或至少30天的FAME平均日产率可比野生型或对照微生物的FAME平均日产率高至少80%,并且生物质平均日产率可以与在野生型或对照微生物生成生物质的相同条件下培养的对照或野生型微生物的生物质平均日产率大致相同,例如,在对照微生物的生物质产率的10%以内、5%以内或2%以内。突变微生物比野生型或对照微生物生成多至少80%的FAME脂质,同时生成至少与野生型微生物所生成的同样多的生物质的条件相对于野生型或对照微生物可以是营养充足的,并且相对于野生型或对照微生物可以是氮充足的。在不同实施方案中,突变微生物可为光合微生物,例如藻类,并且突变藻类具有更高FAME产率,同时生成为对照微生物所生成的至少50%的TOC的培养条件为光合自养条件。
在突变微生物比对照微生物生成多至少45%的FAME脂质和生成多达对照微生物所生成的至少50%的生物质的培养条件下,本文所提供的突变微生物可具有比对照微生物的FAME/TOC比率高至少30%的FAME脂质(FAME)/总有机碳(TOC)比率。本文所提供的突变微生物的FAME/TOC比率可以,例如,比在相同条件下培养的对照或野生型微生物的FAME/TOC比率高30%、高至少40%、高至少50%、高至少60%、高至少70%、高至少80%、高至少90%、高至少100%、高至少110%、高至少120%、高至少130%、高至少140%、高至少150%或高至少200%,在所述条件下对照或野生型生物生成生物质,所述条件相对于野生型微生物可以是氮充足的。在不同实施方案中,突变体的FAME/TOC比率为至少0.3、至少0.4、至少0.5、至少0.6、至少0.7或至少0.8,而突变微生物培养物正积聚TOC。例如,在突变微生物和对照微生物两者均积聚生物质,例如每天都积聚生物质的相同培养条件下培养突变微生物和对照微生物时,对于至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少15天、至少20天、至少25天、至少30天或至少60天的培养,本文所提供的突变微生物可比对照微生物具有高至少25%的脂质产率,同时表现出对照微生物不低于45%或不低于约50%的生物质平均日产率,并且还可具有比野生型微生物的FAME/TOC比率高至少30%、至少50%、至少70%或至少90%的FAME脂质(FAME)/总有机碳(TOC)比率。在不同实施方案中,在至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少15天、至少20天、至少25天、至少30天或至少60天的培养期内,突变体的FAME/TOC比率为至少0.3、至少0.4、至少0.5、至少0.6、至少0.7、至少0.8,或介于约0.35和0.85之间,或介于约0.4和约0.8之间,同时突变微生物生成对照微生物所生成的至少50%的TOC,其中在相同条件下培养突变和对照微生物并且突变体比对照微生物生成更多的脂质,并且突变微生物和对照微生物两者均生成生物质。
因此,本发明的另一方面是一种突变微生物,当在突变微生物和对照微生物培养物两者均积聚TOC的基本上相同的条件下培养突变微生物和对照微生物时,所述突变微生物表现出比对照微生物所表现出的FAME/TOC比率高的FAME/TOC比率。在不同实例中,在对照微生物和突变微生物两者均生成生物质的相同条件下培养突变微生物和对照微生物时,突变微生物具有比对照微生物所表现出的FAME/TOC比率高的FAME/TOC比率,并且突变微生物培养物生成为野生型微生物培养物的至少约50%、至少60%、至少70%、至少80%、至少90%、至少95%或大约或基本上相同的量的TOC。在突变微生物生成为野生型微生物培养物的至少约50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上相同的量的TOC的培养期间,本文所提供的突变微生物的FAME/TOC比率可以,例如,比对照或野生型微生物的FAME/TOC比率高至少30%、高至少40%、高至少50%、高至少60%、高至少70%、高至少80%、高至少90%、高至少100%、高至少110%、高至少120%、高至少130%、高至少140%或高至少150%。例如,突变微生物的生物质平均日产率可为对照或野生型微生物培养物的生物质平均日产率的至少约50%、至少60%、至少70%、至少80%、至少90%、至少95%,同时具有比在相同时期内平均的对照或野生型微生物的FAME/TOC比率高至少30%、高至少40%、高至少50%、高至少60%、高至少70%、高至少80%、高至少90%、高至少100%、高至少110%、高至少120%、高至少130%、高至少140%或高至少150%的FAME/TOC比率。
本文所提供的突变微生物,例如,诸如本文描述的任一种,生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%或至少120%的脂质的突变微生物,可比对照微生物具有更高的碳:氮(C:N)比,其中所述条件支持对照微生物积聚生物质。例如,在突变和对照微生物两者均积聚生物质的条件下培养突变微生物和对照微生物时,C:N比可以是对照微生物的C:N比的约1.5至约2.5倍,并且突变体比对照微生物生成多至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的脂质和对照微生物的至少50%、至少60%、至少70%、至少80%或至少85%的TOC。本文所提供的突变微生物,例如,诸如本文描述的任一种,生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%或至少120%的脂质的突变微生物,可比对照微生物具有更高的碳:氮(C:N)比,其中所述条件支持对照微生物每天积聚生物质。例如,在突变和对照微生物两者均每天积聚生物质的条件下培养突变微生物和对照微生物时,C:N比可以是对照微生物的C:N比的约1.5至约2.5倍,并且突变体比对照微生物生成多至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的脂质和对照微生物的至少50%、至少60%、至少70%、至少80%或至少85%的TOC。在一些实施方案中,在突变体比对照微生物生成多至少50%的脂质,同时生成多达对照微生物所生成的至少50%的生物质的培养期间,本文所提供的突变体的C:N比介于约7和约20之间,或介于约8和约17之间,或介于约10和约15之间。本文任一实施方案或实例中的对照微生物可为野生型微生物。
可选地或另外,本文所提供的突变微生物,例如,诸如本文描述的任一种,生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%或至少120%的脂质的突变微生物,与对照微生物相比时可具有降低的蛋白质含量,其中所述条件支持对照微生物积聚生物质(例如,其中所述条件支持对照微生物每天积聚生物质)。例如,本文所提供的突变微生物相对于对照微生物而言蛋白质含量可降低至少10%、至少20%、至少30%、至少40%、至少45%或至少50%。在突变微生物生成多达对照微生物所生成的至少65%、至少70%、至少75%、至少80%的生物质的相同培养条件下,突变微生物可将其总碳的至少35%、至少40%或至少约45%分配给脂质,同时比对照微生物生成多至少50%的脂质。
进一步地,在一些实施方案中,突变微生物如本文所提供的任一种可具有减弱的编码蛋白质的基因的表达,所述基因的表达影响其它基因,例如,至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个另外的基因的表达。例如,在显示突变表型(如本文所公开的)的条件下,本文所提供的突变体可具有至少10个相对于野生型微生物上调的基因和至少10个相对于野生型微生物下调的基因。在表达突变表型(例如,相对于野生型微生物的脂质产量更高)的条件下,本文所提供的突变体可具有至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个相对于野生型微生物上调的基因和至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个相对于野生型微生物下调的基因。在一些实施方案中,编码涉及蛋白质合成的多肽的基因在本文所提供的突变体中可上调,例如,编码核糖体多肽或在蛋白质翻译中起作用的其它多肽的基因,包括但不限于,属于基因本体(GO)类别如“翻译”、“核糖体”和/或“翻译起始调控”的那些。可选地或与上调编码涉及蛋白质合成的多肽的基因组合,在本文所提供的突变体中编码涉及氮同化的多肽的一个或多个基因可下调,所述基因如亚硝酸还原酶、谷氨酰胺合成酶、铵转运体和/或涉及钼辅因子生物合成的酶中的一种或多种。可选地或与以上任一种组合,本文所提供的突变体可表现出与脂质生物合成有关的一个或多个基因上调,所述基因包括但不限于去饱和酶、延伸酶、脂滴表面蛋白和/或特定脂肪酶、酰基转移酶和甘油醛-3-磷酸脱氢酶。
如本文所描述的突变体可以是通过传统诱变获得的突变体或者可以是经基因工程改造的突变体。在不同实施方案中,如本文所公开的突变微生物已经通过向微生物中引入一个或多个基因构建体(一个或多个核酸分子)而产生。在一些实例中,引入微生物中的一个或多个基因构建体设计为减弱原生基因的表达。
在不同实例中,如本文所公开的突变体可具有减弱的真菌型Zn(2)Cys(6)转录因子表达,所述转录因子即编码具有Zn(2)Cys(6)结构域,例如具有编码属于pfam PF00172的cd00067“GAL4”结构域或“Zn clus”结构域的氨基酸序列的多肽的基因。例如,对于培养至少3天、至少5天、至少7天、至少10天、至少12天、至少13天、至少15天、至少20天、至少25天或至少30天,相对于对照微生物而言FAME产量增加至少25%且生物质产量减少不超过50%的突变微生物如本文所公开的任一种可具有减弱的编码归为pfam PF00172的多肽的基因表达。可选地或另外,在对照微生物生成生物质的条件下具有比对照微生物的FAME/TOC比率高至少30%的FAME/TOC比率的突变微生物如本文公开的任一种可以是编码下述多肽的基因表达减弱的突变微生物,所述多肽具有Zn(2)Cys(6)结构域,例如具有编码属于pfamPF00172或表征为cd00067“GLA4”结构域的结构域的氨基酸序列。在一些实例中,Zn(2)Cys(6)结构域与SEQ ID NO:3可具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。
因此,本发明的另一方面是编码具有Zn(2)Cys(6)结构域的多肽的基因表达减弱的突变微生物,其中相对于编码具有ZnCys结构域的多肽的基因表达未减弱的对照微生物而言,所述突变微生物向脂质的碳分配增加。例如,在对照微生物培养物经历TOC增加的相同条件下培养突变微生物和对照微生物时,本文所提供的具有Zn(2)Cys(6)结构域的多肽的表达减弱的突变微生物相对于对照细胞可具有增加的FAME/TOC比率。在一些实例中,在对照微生物培养物经历TOC增加的相同条件下培养突变微生物和对照微生物时,与对照微生物的FAME/TOC比率相比,如本文所提供的突变微生物的FAME/TOC比率可增加至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%或至少150%。可选地或另外,在对照微生物经历TOC增加的相同条件下培养突变微生物和对照微生物时,如本文所提供的编码具有Zn(2)Cys(6)结构域的多肽的基因表达减弱的突变微生物可具有相对于对照微生物增加的FAME脂质产量,同时展示出TOC产量相对于对照微生物减少不超过45%。例如,在对照微生物经历TOC增加的相同条件下培养突变微生物和对照微生物时,如本文所提供的编码具有Zn(2)Cys(6)结构域的多肽的基因表达减弱的突变微生物可生成相对于对照微生物多至少25%或至少50%的FAME脂质或多至少75%的FAME脂质,同时展示出TOC产量相对于对照微生物减少不超过50%。在不同实施方案中,在至少3天、至少5天、至少7天、至少10天、至少12天、至少13天、至少15天、至少20天或至少30天的培养期内,所述突变微生物可显示出更高的脂质产率和/或对脂质的碳分配。例如,所述至少5天、至少7天、至少10天、至少12天、至少15天、至少20天或至少30天培养期的每一天,突变微生物可具有更高的脂质产率。
在一些示例性实施方案中,具有Zn(2)Cys(6)结构域的多肽的氨基酸序列与SEQID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ IDNO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:17中的任一个至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%相同。在一些实例中,如本文所提供的突变微生物的编码下述多肽的基因的表达可减弱,所述多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11或SEQ ID NO:17具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。例如,如本文所提供的突变微生物的编码下述多肽的基因的表达可减弱,所述多肽与SEQ ID NO:2或SEQ ID NO:17或SEQ IDNO:2的至少N端517个氨基酸或SEQ ID NO:17的至少N端540个氨基酸具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。在另外的实例中,如本文所提供的突变微生物的编码下述多肽的基因的表达减弱,所述多肽包括与SEQID NO:2、SEQ ID NO:17、SEQ ID NO:18或SEQ ID NO:19中的任一个或与SEQ ID NO:20的氨基酸1-200具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。在一些实例中,如本文所提供的突变微生物的编码下述多肽的基因的表达可减弱,所述多肽与SEQ ID NO:2或SEQ ID NO:17具有至少至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。可选地或另外,如本文所提供的突变微生物的具有下述编码序列的基因的表达可减弱,所述编码序列与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。在不同实施方案中所述微生物为硅藻或黄绿藻(eustigmatophyte),并且在一些实例中可为微拟球藻属(Nannochloropsis)的种。
可选地或除以上任一种外,如本文所提供的突变微生物的编码具有Zn(2)Cys(6)结构域且还包括PAS3结构域的多肽的基因的表达可减弱。在一些实例中PAS3结构域包含与SEQ ID NO:21-25中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。表达减弱的基因另外可编码还包括与SEQ ID NO:18-20中的任一个的至少200个氨基酸具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列的多肽。在不同实施方案中,表达减弱的基因可以是编码具有至少…多肽的基因。
编码具有Zn(2)Cys(6)结构域的多肽的减弱基因可以是相对于野生型基因而言具有插入、缺失和/或一个或多个碱基变化的基因。插入、缺失或一个或多个碱基变化可以是在基因的编码区、内含子、3’非翻译区或5’非翻译区内,或者可在基因的5’非翻译区上游,例如在基因的启动子区内,其中所述突变体生成更少的对应于该基因的RNA和/或生成更少的编码多肽。可选地或另外,本文所提供的突变微生物可包括反义构建体、RNAi构建体、作为CRISPR系统的一部分的向导RNA(gRNA),或靶向编码具有Zn(2)Cys(6)结构域的多肽的基因的核酶,导致该基因的表达降低。
如本文所提供的突变微生物可为任何真核微生物,并且在一些实例中为异鞭毛类或藻类。例如,所述突变微生物可为网粘菌类,例如,以下种:网粘菌属(Labryinthula)、类网粘菌属(Labryinthuloides)、破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium)、不动壶菌属(Aplanochytrium)、橙黄壶菌属(Aurantiochytrium)、椭圆壶菌属(Oblongichytrium)、日本壶菌属(Japonochytrium)、戴普罗弗菌属(Diplophrys)或吾肯氏壶菌属(Ulkenia)。可选地,突变微生物可为藻类,例如,属于以下任一属的种:曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、波利氏藻属(Bolidomonas)、包特氏藻属(Borodinella)、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、片球藻属(Bracteococcus)、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属、绿球藻属(Chlorococcum)、长绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、球隹丐板藻属(Cricosphaera)、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、链带藻属(Desmodesmus)、杜氏藻属(Dunaliella)、后棘藻属(Elipsoidon)、圆石藻属(Emiliania)、独球藻属(Eremosphaera)、衣迪斯藻属(Ernodesmius)、眼虫藻属(Euglena)、真眼点藻属(Eustigmatos)、披剌藻属(Franceia)、脆杆藻属(Fragilaria)、拟脆杆藻属(Fragilaropsis)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、菱板藻属(Hantzschia)、异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微星藻属(Micractinium)、蒜头藻属(Monodus)、单针藻属(Monoraphidium)、微球藻属(Nannochloris)、微拟球藻属、舟形藻属(Navicula)、新绿藻属(Neochloris)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、虫毛球藻属(Ostreococcus)、拟小球藻属(Parachlorella)、雪衣藻属(Parietochloris)、杜氏亚属盐藻属(Pascheria)、巴夫藻属(Pavlova)、普莱格门(Pelagomonas)、褐指藻属(Phceodactylum)、菌体属(Phagus)、微微型绿藻属(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、肋球藻属(Pleurococcus)、原壁菌属(Prototheca)、拟绿球藻属(Pseudochlorella)、拟新绿藻属(Pseudoneochloris)、拟角星鼓藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、桑椹藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、裂衣藻属(Schizochlamydella)、骨条藻属(Skeletonema)、水绵藻属(Spyrogyra)、裂丝藻属(Stichococcus)、四球藻属(Tetrachlorella)、扁藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、鲜绿球藻属(Viridiella)、魏氏藻属(Vischeria)和团藻属(Volvox)。在一些实施方案中,突变微生物为硅藻或黄绿藻。在一些实施方案中,突变微生物为微拟球藻属的种。
本发明的另一方面是生成脂质的方法,其包括培养如本文所提供的突变微生物以及从微生物、培养基或两者中分离脂质。可在包含少于约5mM铵、少于约2.5mM铵、少于或等于约1mM铵或少于或等于约0.5mM铵的培养基中培养所述突变微生物。所述培养基可包括,例如,约0至约2.5mM铵、约0.1至约2.5mM铵、约0.5至约2.5mM铵、约0至约1mM铵、约0.1至约1mM铵或约0.2至约1mM铵。可在包括硝酸盐的培养基中培养所述微生物,在一些实例中硝酸盐可以是培养基中基本上唯一的氮源或者在除可以低于5mM、低于2.5mM、低于2mM,或低于1mM的浓度存在的铵以外,也可以存在。可选地或另外,培养基可包含尿素,在一些实例中尿素可以是培养基中基本上唯一的氮源。可以在分批、连续或半连续模式下培养突变微生物。在一些实施方案中突变微生物可为光合微生物,例如藻类,并且可以光合自养培养。
本发明的再另一方面是一种生成脂质的方法,其包括在在微生物的FAME/TOC比率保持在约0.3和约0.8之间的条件下培养微生物,以及从微生物、培养基或两者中分离脂质。例如,可以培养微生物,使得FAME/TOC比率保持在约0.3和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间或约0.45和约0.55之间。可使该比率保持在约0.3和约0.8之间,例如约0.4和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间或约0.45和约0.55之间至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少15天、至少20天、至少30天或至少60天。可在分批、连续或半连续模式下培养微生物。生成脂质的方法可包括在微生物的FAME/TOC比率保持在约0.3和约0.8之间,约0.3和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间或约0.45和约0.55之间的条件下培养突变微生物如本文提供的任一种。例如,所述微生物可以是Zn(2)Cys(6)调控基因的表达减弱的突变微生物,所述调控基因例如但不限于编码与包含选自SEQ ID NO:2和SEQ ID NO:5-17的氨基酸序列的多肽具有至少55%、至少65%、至少75%或至少85%同一性的多肽的基因。可选地或另外,所述微生物可以是具有下述编码序列的基因的表达减弱的突变微生物,所述编码序列与SEQ ID NO:1或SEQ ID NO:71-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。在上述生成脂质的方法中的任一种中,突变微生物可为藻类,并且培养可以是在光合自养条件,即无机碳是培养基中基本上唯一的碳源的条件下。
本发明的再另一方面是一种包含编码下述多肽的核酸序列的核酸分子,所述多肽包括与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。与选自SEQID NO:2和SEQ ID NO:5-17的核酸序列具有至少60%同一性的多肽可包括编码Zn(2)Cys(6)结构域的氨基酸序列。在不同实例中的核酸分子可以是或包含缺乏在自然存在的基因中存在的一个或多个内含子,或可选地,可包括在自然存在的基因中不存在的一个或多个内含子的cDNA。在不同实例中的核酸分子可具有与自然存在的基因并非100%相同的序列。在不同实例中的核酸分子可包含与编码下述多肽的序列可操作连接的异源启动子,所述多肽包括与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16或SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列,和/或所述核酸分子可包含包括编码下述多肽的序列的载体,所述多肽包括与SEQ ID NO:2、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ IDNO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。
本发明的另一方面是设计用于减弱编码含有Zn(2)Cys(6)结构域的多肽的基因的表达的构建体。在不同实例中,该构建体可以是或包含编码CRISPR系统的向导RNA的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体,例如在该基因所来源的原生基因组中具有一个或多个与本文所公开的自然存在的Zn(2)Cys(6)结构域编码基因具有同源性的核苷酸序列和/或与之相邻的序列的构建体。例如,所述构建体可包括编码具有Zn(2)Cys(6)结构域的多肽的基因的至少一部分,例如与编码下述多肽的基因的至少一部分同源的序列,所述多肽包括与SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。可选地或另外,所述构建体可包括与SEQ ID NO:1或SEQ ID NO:71-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列。
所述构建体可包括,例如,编码具有Zn(2)Cys(6)结构域的多肽的基因的编码区的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽的基因的内含子的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽的基因的5’UTR的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽的基因的启动子区的至少一部分,和/或编码具有Zn(2)Cys(6)结构域的多肽的基因的3’UTR的至少一部分。在一些实例中,所述构建体可为RNAi、核酶或反义构建体并且可包括有义或反义方向上来自编码具有Zn(2)Cys(6)结构域的多肽的基因的转录区的序列。在另外的实例中构建体可设计用于体外或体内表达设计为靶向编码具有Zn(2)Cys(6)结构域的多肽的基因的向导RNA(例如,CRISPR系统的),并且可包括与编码具有Zn(2)Cys(6)结构域的多肽的基因的一部分,例如,编码具有Zn(2)Cys(6)结构域的多肽的基因的内含子、5’UTR、启动子区和/或3’UTR同源的序列。在另外的实例中,用于减弱编码含Zn(2)Cys(6)结构域的多肽的基因表达的构建体可以是CRISPR系统或CRISPRi系统的向导RNA或者可以是反义寡核苷酸,其中与编码具有Zn(2)Cys(6)结构域的多肽的基因的转录区同源的序列处于反义方向上。
连同附图一起阅读以下对本发明的详细描述时,本发明的这些和其它目的和特征将变得更完全地显而易见。
附图简述
图1A-1B,A)提供了显示在N充足(+N)和贫化(-N)的条件下生长的野生型微拟球藻培养物的脂质(FAME)积聚的图表。3小时时间点的样品进行转录组学分析(RNA-seq)。B)提供了与提供有N充足的培养基的细胞相比,在转移到-N培养基的细胞中差异性表达基因的图。绘出相比于充足细胞在-N处理细胞中,基因(表示为点)与倍数变化(log2)的图。假定转录因子表示为X。存在于y-轴右侧的基因上调而在y-轴左侧的基因下调。图上仅展示了错误发现率(FDR)小于或等于0.01的基因。
图2是用于向加的斯微拟球藻(N.gaditana)编辑系中引入Cas9基因的载体pSGE-6206的示意图。
图3A-3C,A)提供了用于在微拟球藻中产生Cas9表达菌株Ng-CAS9+的载体的图;B)是来自Accuri C6流式细胞仪的显示相比于野生型菌株(左侧峰,黑色),Ng-Cas9编辑菌株(右侧峰,红色)中的GFP荧光的叠加直方图;C)是用在Ng-CAS9+系中展示出Cas9表达,在野生型对照中无本底的抗FLAG抗体所做蛋白质印迹(western blot)的图像。
图4A-4C,A)提供了用于Cas9靶位点处的基因破坏的供体片段的图解。供体片段构建体包括受EIF3启动子驱动并且后面是反方向的GNPDA终止子的HygR(潮霉素抗性)基因。B)Cas9介导潮霉素抗性(HygR)盒插入ZnCys基因座内的示意图。HygR盒由驱动后面是终止子(T)的HygR基因的启动子(Prom)组成。使用侧接插入物(箭头)的引物,通过PCR鉴定所得突变基因型(ZnCys-KO)。该图解未按比例。C)用设计为靶向ZnCys基因座的向导RNA转化的几个Hyg抗性集落的PCR基因分型。3Kb条带的存在指示插入到预期基因座内,而0.5Kb条带指示完好的野生型基因座。
图5是加的斯微拟球藻ZnCys-2845基因的示意性描述。方框指示Zn(2)Cys(6)结构域的位置,其是RNAi构建体所靶向的区域。用箭头示出了BASH-3、敲除和BASH-12突变体中供体片段的插入位置。还示出了假定单份核定位信号序列(NLS)的一般位置。该图未按比例。
图6A-6B,A)提供了分批生长评估的入射辐照度曲线,和B)半连续产率测定。
图7A-7H,A)是描绘由培养的奇数日所取样品测定的,在分批模式下于仅含硝酸盐的培养基中培养的野生型和ZnCys-2845敲除加的斯微拟球藻细胞的FAME产率的图表;B)是描绘分批产率测定第3-7天的TOC产率的图表。C)是描绘由培养的奇数日所取样品计算的FAME/TOC比率的图表;D)是描绘在分批测定第7天,从野生型WT-3730和ZnCys 2845敲除菌株GE-8564分离的脂质中存在的不同链长度的脂肪酸的量的柱状图;E)是描绘在分批测定第7天,从野生型和ZnCys 2845敲除菌株GE-8564分离的TAG水平的柱状图;F)是在仅含硝酸盐(氮充足)的培养基中培养的野生型加的斯微拟球藻细胞的电子显微照片,G)是在仅含硝酸盐的培养基中培养的加的斯微拟球藻ZnCys敲除突变体GE-8564细胞的电子显微照片,H)是在氮贫化的培养基中培养的野生型加的斯微拟球藻细胞的电子显微照片。图表中的误差线表示三份培养物(生物学重复)的平均值的标准偏差。图表中所用的符号:星号表示在硝酸盐+铵培养基PM124中培养的野生型WT-3730,黑色菱形表示在硝酸盐+铵培养基PM124中培养的敲除突变体GE-8564,X表示在仅含硝酸盐的培养基PM074中培养的野生型WT-3730,而黑色圆圈表示在仅含硝酸盐的培养基PM074中培养的敲除突变体GE-8564。N:核;Ch:叶绿体;LD:脂滴;M:线粒体。
图8A-8C,提供了展示在5天分批模式测定中通过补充NH4 +抑制ZnCys-KO的脂质积聚表型的图表。A)每天的FAME(mg/L),B)每天的TOC(mg/L),和C)在分批模式下于补充了NH4 +(SM-NH4 +/NO3 -)的培养基上生长的ZnCys-KO(圆圈)和WT(菱形)每天的FAME/TOC值。误差线是2个生物学重复(n=2)的标准偏差。
图9是加的斯微拟球藻ZnCys-2845的PAS3结构域序列与海洋微拟球藻(N.oceanica)、眼点微拟球藻(N.oculata)、盐生微拟球藻(N.salina)和颗粒微拟球藻(N.granulata)的ZnCys-2845直系同源物的PAS3结构域序列的比对。
图10是ZnCys-2845基因编码的加的斯微拟球藻多肽序列与ZnCys-2845基因的直系同源基因编码的海洋微拟球藻多肽序列,以及颗粒微拟球藻、眼点微拟球藻和盐生微拟球藻中的直系同源基因编码的多肽的部分N端序列的比对。
图11A-11C提供了描绘在培养基包括作为唯一氮源的尿素的半连续测定中加的斯微拟球藻野生型菌株和GE-8564敲除菌株的产率的图表。A)显示在测定13天内每天的FAME产率;B)显示在测定13天内每天的TOC产率;及C)提供测定每一天的FAME/TOC比率。图表中的误差线表示三份独立培养物(生物学重复)的标准偏差。图表中所用的符号:正方形表示在仅含尿素的培养基PM125中培养的野生型WT-3730,三角形表示在仅含硝酸盐的培养基PM074中培养的野生型WT-3730,圆圈表示在仅含尿素的培养基PM125中培养的ZnCys-2845敲除突变体GE-8564,且菱形表示在仅含硝酸盐的培养基PM074中培养的ZnCys-2845敲除突变体GE-8564。
图12A-B A)是对ZnCys-2845基因的示意性描绘,显示为方框和箭头的核定位信号序列(NLS)、Zn(2)Cys(6)结构域(Zn)和PAS3结构域的位置描绘了CRISPR靶向突变的位点,B)显示相应CRISPR靶向突变体的相对转录水平(A中示出了用于转录评估的引物的位置)。归一化表达水平是相对于设为1.0的平均野生型水平。
图13A-13C,A)是描绘在分批模式下于仅含硝酸盐的培养基中培养的野生型和ZnCys-2845敲除加的斯微拟球藻细胞的FAME产率的图表;B)是描绘筛选奇数日(第1-3天和第3-5天)的TOC值的图表;C)是提供第3、5和7天计算的培养物的FAME/TOC比率的图表。图表中所用的符号:空心圆圈表示野生型WT-3730,+号表示敲除突变体GE-13108、“BASH2”;星号表示敲除突变体GE-13109、“BASH3”;X表示敲除突变体GE-13112、“BASH12”;空心三角形表示ZnCys-2845敲除突变体GE-8564;并且破折号表示RNAi-7菌株GE-13103。误差线表示两份单独培养物的两个计算产率值的标准偏差。
图14A-14C,A)提供了ZnCys基因座的模块结构和显著特征。缩写:NLS,核定位序列;Zn2Cys6,Zn(II)2Cys6双核集群结构域(Pfam id:PF00172)。用黑色箭头指出了原始ZnCys-KO突变体中插入的大致位置。有图案的箭头指出了在假定5’UTR(BASH-3(菌株GE-13109)距预测起始位点约65bp)和3’UTR区域(BASH-12(菌株GE-13112),距预测终止密码子大约30bp)中,成功Cas9插入突变体的位置。图B中黑色水平箭头显示了用于评估基因表达水平的qRT-PCR引物的大致位置。设计用于使跨越保守性Zn2Cys6结构域的ZnCys沉默的RNAi发夹与虚线双箭头指示的序列同源。该图未按比例。B)通过qRT-PCR测定的(图上从左至右,野生型(WT)ZnCys-BASH-3、ZnCys-BASH-12、ZnCys-RNAi-7和ZnCys-KO),相对于野生型(WT),ZnCys减弱系(图上从左至右,野生型(WT)ZnCys-BASH-3、ZnCys-BASH-12、ZnCys-RNAi-7和ZnCys-KO)中ZnCys基因座的稳态mRNA水平。将表达水平归一化为管家基因并且相对于野生型使用ΔΔCT方法计算。误差线是3次技术重复的标准误差。C)在分批模式下于硝酸盐充足的培养基(SM-NO3-)中评估的ZnCys突变系的TOC产率和FAME/TOC值。图15中示出了用于计算FAME/TOC和生物质产率均值的单个数据点。误差线是两次生物学重复的标准偏差。
图15A-15B,A)在硝酸盐充足的培养基中生长的ZnCys减弱系(ZnCys-BASH-3(GE-13109)、ZnCys-BASH-12(GE-13112)、ZnCys-RNAi-7(GE-13103))所生成的FAME(mg/L)的分批模式评估及B)对应于筛选第3、5和7天的TOC(mg/L)测量的分批模式评估。
图16A-16D提供了描绘在用于每天稀释的培养基包括作为唯一氮源的硝酸盐的半连续测定中,加的斯微拟球藻野生型菌株和GE-8564敲除菌株的产率的图表和表格。A)显示在测定13天内的FAME日产率(mg/L培养物);B)提供按g/m2/天计的培养物日产率(括号内提供了三份培养物的标准偏差),连同每份培养物的平均日产率;C)显示在测定13天内的TOC日产率(mg/L培养物);并且D)提供测定每一天的FAME/TOC比率。图表中所用的符号:菱形表示在仅含硝酸盐的培养基中预培养的野生型WT-3730;X表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13108“BASH2”;三角形表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13109“BASH3”;正方形表示在酸盐+铵培养基中预培养的敲除突变体GE-13112“BASH12”;空心圆圈表示在酸盐+铵培养基中预培养的敲除突变体GE-13103“RNAi-7”;实心圆圈表示在仅含硝酸盐的培养基中预培养的敲除突变体GE-13103“RNAi-7”;并且破折号表示在酸盐+铵培养基中预培养的敲除突变体GE-8564。图表中的误差线表示三份独立培养物(生物学重复)的标准偏差。
图17A-17B.在半连续模式下于含NO3 -的培养基中生长8天的ZnCys突变体的产率评估。A)与其亲本系Ng-CAS9+和WT相比,ZnCys突变体(ZnCys-RNAi-7、ZnCys-BASH-12和ZnCys-BASH-3)的A)每日FAME和B)TOC(mg/L)测量。培养物在半连续模式下以30%的日稀释率在SM-NO3 -上生长。误差线表示3次生物学重复(n=3)的标准偏差。
图18提供了在图17中描绘了其FAME和TOC日产率的测定中,相比于其亲本系Ng-CAS9+(GE-6791)和野生型,ZnCys突变体(ZnCys-RNAi-7(GE-13103)、ZnCys-BASH-12(GE-13112)和ZnCys-BASH-3(GE-13109))的FAME和TOC产率(g/m2/天)的柱状图。产率值是每天测量的8-日平均值(n=3)。
图19提供了描绘在图16A-D中提供了其FAME和TOC日产率的半连续测定中,细胞的日氮含量(mg/L培养物,仅团块)的图表。图表中所用的符号:菱形表示在仅含硝酸盐的培养基中预培养的野生型WT-3730;X表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13108“BASH2”;三角形表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13109“BASH3”;正方形表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13112“BASH12”;空心圆圈表示在硝酸盐+铵培养基中预培养的敲除突变体GE-13103“RNAi-7”;实心圆圈表示在仅含硝酸盐的培养基中预培养的敲除突变体GE-13103“RNAi-7”;并且破折号表示在硝酸盐+铵培养基中预培养的敲除突变体GE-8564。图表中的误差线表示三份独立培养物(生物学重复)的标准偏差。
图20提供了描绘在使用仅含硝酸盐的培养基的半连续测定中,加的斯微拟球藻野生型菌株WT-3730和RNAi突变体GE-13103的培养物的总氮和FAME水平的图表,其中在包括硝酸盐和铵的PM124培养基中或在仅包括硝酸盐的PM074培养基中单独预培养GE-13103敲除菌株。在仅包括硝酸盐的PM074培养基中预培养野生型菌株WT-3730。实心菱形和实心三角形分别表示在PM124和PM074中预培养的GE-13103培养物(细胞+培养基)的总氮含量。空心菱形和空心三角形分别表示在PM124和PM074中预培养的GE-13103培养物的FAME含量。实心正方形表示在仅含硝酸盐的培养基中预培养的WT-3730培养物的FAME含量。图表上标注了三天产率测定计算的铵量。
图21A-21F,提供了描绘在培养基包括三种不同浓度的铵的半连续测定中,加的斯微拟球藻野生型菌株WT-3730和GE-13103敲除菌株的产率的图表和表格。A)描绘在半连续测定中培养物中的FAME产率(mg/L),其中整个测定过程所用的培养基的铵水平为2.5、1.0或0.5mM;B)提供FAME日产率(g/m2/天)(括号内提供了三份培养物的标准偏差),连同在半连续测定中每种培养条件的的平均日产率,其中整个测定过程所用的培养基的铵水平为2.5、1.0或0.5mM;C)描绘半连续测定中的TOC产率(mg/L),其中整个测定过程所用的培养基的铵水平为2.5、1.0或0.5mM;D)提供TOC日产率(g/m2/天)(括号内提供了对于每个铵浓度而言三份培养物的标准偏差),连同在半连续测定中每种培养条件的的平均日产率,其中整个测定过程所用的培养基的铵水平为2.5、1.0或0.5mM;E)描绘半连续测定中的日FAME/TOC比率,其中整个测定过程所用的培养基的铵水平为2.5、1.0或0.5mM;并且F)提供通过流式细胞术测定的用于A-E中分析FAME和TOC产率的培养物的每日细胞计数。图表中所用的符号:圆圈:在仅含硝酸盐的培养基中培养的WT-3730;正方形:在含硝酸盐,也包括2.5mM铵的培养基中培养的RNAi敲除菌株GE-13103;三角形:在含硝酸盐,也包括1.0mM铵的培养基中培养的RNAi敲除菌株GE-13103;X:在含硝酸盐,也包括0.5mM铵的培养基中培养的RNAi敲除菌株GE-13103。图表中的误差线表示三份独立培养物(生物学重复)的标准偏差。
图22A-22D,在半连续模式下于含硝酸盐的培养基上生长的ZnCys-KO和ZnCys-RNAi-7的产率评估。A)每日FAME(mg/L),B)每日TOC(mg/L),及C)由细胞N含量得到的C/N值。D)提供比较整个13天测定所计算的野生型和ZnCys-RNAi-7的FAME和E)TOC产率(g/m2/天)的柱状图。以每天30%稀释方案ZnCys-KO未能达到稳态并且随着运行的进展基本上被洗掉,因此对于该系未计算脂质和生物质产率值(N/A,不可用)。除NO3 -外还包括NH4 +的培养基中ZnCys-KO按比例增加以获得足够生物质用于测定。
图23是描绘野生型微拟球藻菌株WT-3730及两个ZnCys敲减突变体GE-13112(BASH12)和GE-13130(RNAi)的生物分子组成的柱状图。
图24描绘了来自于在分批模式下于仅含硝酸盐的培养基(NO3,浅绿色)或包括铵和硝酸盐的培养基(NH4,深绿色)上生长的ZnCys-KO、硝酸还原酶敲除突变体(NR-KO)、RNAi-7和野生型的三份生物学重复,按编码涉及N-同化的蛋白质的基因的转录倍数变化的欧几里得距离(Euclidian distance)的分级群集。红色指示表达增加而蓝色指示表达减少,黑色为中立(既不增加也不降低)。
图25提供了对于在分批模式下于仅含硝酸盐的培养基上生长的复制培养物(WT、ZnCys-KO及示为RNAi-7的ZnCys-RNAi-7)而言,FAS循环(KAR1、KAS1/3、HAD和ENR)中的酶,即乙酰-CoA羧化酶(ACC酶)、谷氨酸合成酶(GOGAT2)和硝酸还原酶(NR)的免疫印迹分析的图像。显示了用于印迹的蛋白质凝胶的考马斯亮蓝染色(CBB)作为上样参考。
发明详述
定义
除非另有定义,否则本文使用的所有技术和科学术语具有本发明所属领域中普通技术人员通常所理解的相同含义。如有冲突,以本申请包括的定义为准。除非上下文另有要求,单数术语应包括复数并且复数术语应包括单数。除非另有特别说明,否则本申请中提供的所有范围均包括该范围上下端的值。
本文提到的所有出版物、专利和其它参考文献通过引用整体并入本文用于所有目的,如同特别单独地指出通过引用并入每个单独的出版物或专利申请一样。
如本文中的短语“A和/或B”中使用的术语“和/或”旨在包括“A和B”、“A或B”、“A”和“B”。
“约”意指在规定值的10%以内,或在规定值的5%以内,或在一些情况下意指在规定值的2.5%以内,或,“约”可意指四舍五入到最接近的有效数位。
术语“基因”广泛地用于指编码多肽或表达的RNA的核酸分子(通常为DNA,但任选为RNA)的任一区段。因此,基因包括编码表达的RNA的序列(其可包括多肽编码序列或,例如功能RNA,如核糖体RNA、tRNA、反义RNA、微RNA、短发夹RNA、核酶等)。基因还可包含其表达所需或影响其表达的调控序列,以及在其自然状态下于蛋白质或RNA编码序列相关的序列,例如,内含子序列、5’或3’非翻译序列等。在一些实例中,“基因”可仅指DNA或RNA分子的蛋白质编码部分,其可以包括或可以不包括内含子。基因长度优选大于50个核苷酸,更优选长度大于100个核苷酸,并且长度可以,例如介于50个核苷酸和500,000个核苷酸之间,例如长度介于100个核苷酸和100,000个核苷酸之间或长度介于约200个核苷酸和约50,000个核苷酸之间,或长度介于约200个核苷酸和约20,000个核苷酸之间。基因可从各种来源得到,包括由目标来源克隆或由已知或预测的序列信息合成。
术语“核酸”或“核酸分子”是指一段DNA或RNA(例如,mRNA),并且还包括具有经修饰的主链(例如,肽核酸、锁核酸)或经修饰的或非自然存在的核碱基的核酸。核酸分子可为双链或单链;包含基因或其一部分的单链核酸分子可为编码(有义)链或非编码(反义)链。
核酸分子可“得自”指定来源,其包括来自指定来源的核酸区段的分离物(整体或部分)。核酸分子也可通过例如直接克隆、PCR扩增或由指定多核苷酸来源人工合成或基于与指定多核苷酸来源(其可为,例如一个生物物种)相关的序列得自指定来源。得自特定来源或物种的基因或核酸分子还包括相对于源核酸分子具有序列修饰的基因或核酸分子。例如,得自一个来源的基因或核酸分子(例如,特定参考基因)可包括相对于源基因或核酸分子而言非预期的或故意引入的一个或多个突变,并且如果故意引入一个或多个突变,包括取代、缺失或插入,则可通过细胞或核酸的随机或靶向突变,通过扩增或其它基因合成或分子生物学技术,或通过化学合成或其组合来引入序列改变。得自编码功能RNA或多肽的参考基因或核酸分子的基因或核酸分子可编码与参考或源功能RNA或多肽或与其功能片段具有至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%序列同一性的功能RNA或多肽。例如,得自编码功能RNA或多肽的参考基因或核酸分子的基因或核酸分子可编码与参考或源功能RNA或多肽或与其功能片段具有至少85%、至少90%或至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的功能RNA或多肽。
如本文中所用,“分离的”核酸或蛋白质从其自然环境或核酸或蛋白质在自然界中所存在的环境中移除。例如,分离的蛋白质或核酸分子从在其原生或自然环境中与之相关的细胞或生物体中移除。在一些情况下,分离的核酸或蛋白质可以是部分或基本上纯化的,但是对于分离不要求特定纯化水平。因此,例如,分离的核酸分子可以是已经从其在自然界中所整合到的染色体、基因组或附加体上切除,或已经远离在自然界中与之相关的染色体、基因组或附加体的其它序列合成,或已经远离在自然界中与之并列的其它序列合成的核酸序列。
“纯化”核酸分子或核苷酸序列,或蛋白质或多肽序列,基本上不含细胞物质和细胞组分。纯化核酸分子或蛋白质可基本上不含化学药品,例如除缓冲液或溶剂外。“基本上不含”并非旨在意指除新型核酸分子以外的其它组分不可检测。
术语“自然存在的”和“野生型”是指在自然界中发现的形式。例如,自然存在的或野生型核酸分子、核苷酸序列或蛋白质可存在于自然来源并从中分离,并且未通过人类操纵有意修饰。
如本文中所用,“减弱”意指相对于没有引起表达或活性减弱的操纵或突变的对照而言,量、程度、强烈程度或强度降低。基因表达减弱可指所讨论的基因的转录,或编码的蛋白质的翻译、折叠或组装的量和/或速率降低。作为非限制性实例,减弱基因可以是生物体突变或破坏的内源基因(例如,受局部或完全缺失、截短、移码或插入突变破坏的基因),其未编码完整的功能开放阅读框或者由于基因调控序列的改变或破坏而表达降低。减弱基因也可以是被降低基因表达的构建体所靶向的基因,例如,反义RNA、微RNA、RNAi分子或核酶。减弱的基因表达可以是被消除,例如,降低至不显著或不可检测的量的基因表达,或者可以是相对于对照微生物的基因表达降低任意量,例如降低对照微生物的基因表达水平的约1%至约99%,或约5%至约95%的基因表达。减弱的基因表达也可以是产生并非完全为功能性或为非功能性的RNA或蛋白质的基因表达,例如,减弱的基因表达可以是产生截短RNA和/或多肽的基因表达。
“外源核酸分子”或“外源基因”是指已经引入(“转化”)到细胞内的核酸分子或基因。转化细胞可称为重组细胞,可向其中引入另外的外源基因。经核酸分子转化的细胞的后代也称为“经转化”。相对于转化的细胞,外源基因可来自不同物种(因此为“异源”)或相同物种(因此为“同源”)。“内源”核酸分子、基因或蛋白质是原生核酸分子、基因或蛋白质,因其存在于宿主中,或是由宿主自然生成的。
术语“原生”在本文中用于指因其自然存在于宿主中的核酸序列或氨基酸序列。术语“非原生”在本文中用于指并非自然存在于宿主中的核酸序列或氨基酸序列。已经从细胞中移除,进行了实验室操纵并引入或重新引入到宿主细胞内,使其在序列或基因组中的位置上相对于其在未经操纵的生物体内的位置不同(即,与在未经操纵的生物体内未与之并列或可操作连接的序列并列或可操作连接)的核酸序列或氨基酸序列被视为“非原生”。因此非原生基因包括宿主微生物内源的,与已经重组到宿主基因组内的一个或多个异源调控序列可操作连接的基因。
“重组”或“经工程改造的”核酸分子是已经通过人类操纵改变的核酸分子。作为非限制性实例,重组核酸分子包括下述任何核酸分子,其:1)例如使用化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于复制、聚合、酶切(核酸外切或核酸内切)、连接、反转录、转录、碱基修饰(包括,例如甲基化)、核酸分子整合或重组(包括同源和定点重组)的酶),已经在体外部分或完全合成或修饰;2)包括在自然界中未结合的结合核苷酸序列;3)已经使用分子克隆技术工程改造,使其相对于自然存在的核酸分子序列缺乏一个或多个核苷酸;和/或4)已经使用分子克隆技术操纵,使其相对于自然存在的核酸序列具有一个或多个序列变化或重排。作为非限制性实例,cDNA为重组DNA分子,正如已经通过体外聚合酶反应生成的,或接头已经与之附连的,或已经整合到载体如克隆载体或表达载体中的任意核酸分子。
如本文中所用的术语“重组蛋白”是指通过基因工程生成的蛋白质,而不管核酸序列是否与野生型蛋白质不同。
当适用于生物体时,术语重组、工程改造或基因工程改造是指已经通过向生物体内引入异源或外源重组核酸序列进行操纵的生物体,并且包括基因敲除、靶向突变、基因置换和启动子置换、缺失或插入,以及向生物体引入转基因或合成基因。重组或经基因工程改造的生物体也可以是已经向其中引入了用于基因“敲减”的构建体的生物体。此类构建体包括但不限于RNAi、微RNA、shRNA、siRNA、反义和核酶构建体。还包括已经通过大范围核酸酶(meganucleases)、锌指核酸酶、TALEN或cas/CRISPR系统的活性改变了其基因组的生物体。异源或重组核酸分子可整合到重组/经基因工程改造的生物体的基因组内或在其它情况下,可以不整合到宿主基因组内。如本文中所用,“重组微生物”或“重组宿主细胞”包括本发明重组微生物的后代或衍生物。因为某些修饰由于突变或环境影响可在连续世代中出现,所以此类后代或衍生物实际上可能与亲本细胞不同,但是仍然包括在本文所用术语的范围之内。
术语“启动子”是指能够结合细胞中的RNA聚合酶并引发下游(3'方向)编码序列转录的核酸序列。启动子包括引发以高于本底的可检测水平转录所必需的最小数量的碱基或元件。启动子可包括转录起始位点以及负责结合RNA聚合酶的蛋白质结合域(共有序列)。真核启动子常常但非总是含有“TATA”盒和“CAT”盒。原核启动子可含-10和-35个原核启动子共有序列。本领域中已知大量来自多种不同来源的启动子,包括组成型、诱导型和阻抑型启动子。代表性来源包括例如,藻类、病毒、哺乳动物、昆虫、植物、酵母和细菌细胞类型,并且来自这些来源的合适启动子易于获得,或者可基于线上公开可用的,或例如,来自贮藏所如ATCC以及其它商业或个体来源的序列合成制备。启动子可为单向(引发一个方向上的转录)或双向(引发任一方向上的转录)。启动子可为组成型启动子、阻抑型启动子或诱导型启动子。除RNA聚合酶结合以引发转录的基因近端启动子外,启动子区可包括在基因上游的附加序列,其可在转录起始位点的1kb、2kb、3kb、4kb、5kb或更大范围内,其中附加序列可影响下游基因的转录速率且任选地影响启动子对发育、环境或生物化学(例如,代谢)条件的反应性。
术语“异源”在关于多核苷酸、基因、核酸、多肽或酶使用时,是指来自除宿主生物物种以外的来源或得自除宿主生物物种以外的来源的多核苷酸、基因、核酸、多肽或酶。相反“同源”多核苷酸、基因、核酸、多肽或酶在本文中用于指得自宿主生物物种的多核苷酸、基因、核酸、多肽或酶。提到基因调控序列或用于保持或操纵基因序列的辅助核酸序列(例如,启动子、5’非翻译区、3’非翻译区、聚A添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源区、重组位点等)时,“异源”意指调控序列或辅助序列和在构建体、基因组、染色体或附加体中与调控或辅助核酸序列并列的基因并非自然缔合。因此,与在其自然状态下(例如,在非基因工程改造的生物体的基因组中)未与其可操作连接的基因可操作连接的启动子本文称为“异源启动子”,虽然该启动子可得自和与之连接的基因相同的物种(或在一些情况下,得自相同生物体)。
如本文中所用,术语“蛋白质”或“多肽”旨在涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或更多个氨基酸的任意一条或多条链,而不是指特定长度的产物。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指一条或多条两个或更多个氨基酸的链的任何其它术语包括在“多肽”的定义内,并且术语“多肽”可用于代替这些术语中的任一个或与之互换使用。
通常在基因或物种名称后的括号内提供的基因和蛋白质登录号,是由美国国立卫生研究院(United States National Institutes of Health)维护的国家生物技术信息中心(NCBI)网站(ncbi.nlm.nih.gov)上公开可用的序列记录的唯一标识符。“GenInfo标识”(GI)序列识别号是核苷酸或氨基酸序列特有的。如果序列以任何方式改变,则指定新的GI编号。可使用序列修订历史工具(Sequence Revision History)追踪特定GenBank记录中出现的序列的各个GI编号、版本号和更新日期。基于登录号和GI编号搜索并获得核酸或基因序列或蛋白质序列在(例如)细胞生物学、生物化学、分子生物学和分子遗传学中众所周知。
如本文中所用,关于核酸或多肽序列的术语“百分比同一性”或“同源性”定义为在比对序列的最大百分比同一性并且在必要时,引入空位以达到最大百分比同源性之后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。N端或C端的插入或缺失不应视为影响同源性,并且多肽序列中小于约50个、小于约40个、小于约30个、小于约20个或小于约10个氨基酸残基的内部缺失和/或插入不应视为影响同源性。可以使用为序列相似性搜索定制的程序blastp、blastn、blastx、tblastn和tblastx采用的算法,通过BLAST(基本局部比对搜索工具)分析来测定核苷酸或氨基酸序列水平的同源性或同一性(Altschul(1997),Nucleic Acids Res.25,3389-3402,及Karlin(1990),Proc.Natl.Acad.Sci.USA87,2264-2268)。BLAST程序所用的方法是先考虑查询序列和数据库序列之间有和无空位的相似区段,然后评价所识别的所有匹配的统计显著性,最后仅汇总那些满足预选显著性阈值的匹配。对序列数据库相似性搜索中的基本问题的讨论,参见Altschul(1994),NatureGenetics 6,119-129。直方图、描述、比对、期望(即,用于报告针对数据库序列的匹配的统计显著性阈值)、截止、矩阵和过滤(低复杂度)的搜索参数可为默认设置。blastp、blastx、tblastn和tblastx使用的默认评分矩阵是BLOSUM62矩阵(Henikoff(1992),Proc.Natl.Acad.Sci.USA 89,10915-10919),其被推荐用于长度超过85个(核苷酸碱基或氨基酸)的查询序列。
对于设计用于比较核苷酸序列的blastn,可按M(即,一对匹配残基的奖励分)与N(即,错配残基的罚分)的比率来设置评分矩阵,其中M和N的默认值可分别为+5和-4。四个blastn参数可调节,如下:Q=10(空位产生罚分);R=10(空位延伸罚分);wink=1(沿查询在每个winkth位置产生字命中);和gapw=16(设置其中产生空位比对的窗口宽度)。用于氨基酸序列比较的等效Blastp参数设置可以是:Q=9;R=2;wink=1;和gapw=32。可在GCG包10.0版中进行的序列之间的Bestfit比较可以使用DNA参数GAP=50(空位产生罚分)和LEN=3(空位延伸罚分),并且蛋白质比较中的等效设置可以是GAP=8和LEN=2。前述参数设置仅为示例性的并且可以使用其它参数设置。
因此,当提及本发明的多肽或核酸序列时,包括与全长多肽或核酸序列或其片段(包含整个蛋白质的至少50个、至少75个、至少100个、至少125个、至少150个、至少200个或多于200个氨基酸残基的连续序列)具有至少40%、至少45%、至少50%、至少55%、至少70%、至少65%、至少70%、至少75%、至少80%或至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列同一性的序列同一性;此类序列的变体,例如,其中至少一个氨基酸残基已经插入到所公开的含有插入和取代的序列的N端和/或C端和/或内部。所涵盖的变体可以另外或可选地包括含有通过例如同源重组或定点或PCR诱变产生的预定突变的变体,以及其它物种的相应多肽或核酸,包括但不限于本文所描述的多肽或核酸、含有插入和取代的多肽或核酸家族的等位基因或其它自然存在的变体;和/或其中多肽由除自然存在的氨基酸以外含有插入和取代的部分(例如,可检测部分如酶)通过取代、化学、酶促或其它释放手段共价修饰的衍生物。
如本文中所用,短语“保守性氨基酸取代”或“保守性突变”是指一个氨基酸由另一个具有共同性质的氨基酸置换。定义个别氨基酸之间的共同性质的功能性方式是分析同源生物体的相应蛋白质之间的氨基酸变化的归一化频率(Schulz(1979)Principles ofProtein Structure,Springer-Verlag)。根据此类分析,可以定义氨基酸分类,其中一类中的氨基酸优先彼此交换,并且因此在其对蛋白质整体结构的影响方面彼此最为相似(Schulz(1979)Principles of Protein Structure,Springer-Verlag)。以这种方式定义的氨基酸分类的实例包括:“带电/极性类”,包括Glu、Asp、Asn、Gln、Lys、Arg和His;“芳香族或环状类”,包括Pro、Phe、Tyr合Trp;以及“脂肪族类”,包括Gly、Ala、Val、Leu、Ile、Met、Ser、Thr和Cys。在每个分类中,还可以鉴定亚类。例如,带电/极性氨基酸类可以再划分成亚类,包括:“带正电的亚类”,包含Lys、Arg和His;“带负电的亚类”,包含Glu和Asp;和“极性亚类”,包含Asn和Gln。在另一个实例中,芳香族或环状类可以再划分成亚类,包括:“氮环亚类”,包含Pro、His和Trp;和“苯基亚类”,包含Phe和Tyr。在另一个实例中,脂肪族类可以再划分成亚类,包括:“大型脂肪族非极性亚类”,包含Val、Leu和Ile;“脂肪族弱极性亚类”,包含Met、Ser、Thr和Cys;和“小残基亚类”,包含Gly和Ala。保守性突变的实例包括以上亚类中的氨基酸的氨基酸取代,例如但不限于:Lys取代Arg或反之亦然,使得可以保持正电荷;Glu取代Asp或反之亦然,使得可以保持负电荷;Ser取代Thr或反之亦然,使得可以保持游离-OH;以及Gln取代Asn或反之亦然,使得可以保持游离-NH2。“保守性变体”是一种多肽,其包括一个或多个经具有共同性质(例如,属于上述相同氨基酸分类或亚类)的氨基酸取代的氨基酸以置换参考多肽(例如,公开案或序列数据库中公开了其序列或已经通过核酸测序测定了其序列的多肽)中的一或多个氨基酸。
如本文中所用,“表达”包括至少在RNA生成水平上的基因表达,并且“表达产物”包括经表达的基因的所得产物,例如多肽或功能性RNA(例如,核糖体RNA、tRNA、向导RNA、反义RNA、微RNA、shRNA、核酶等)。术语“表达增加”包括有利于mRNA生成增加和/或多肽表达增加的基因表达变化。[基因产物的]“产量增加”包括与多肽的原产量或酶活性相比,多肽表达量、多肽的酶活性水平增加或两者的组合。
本发明的一些方面包括特定多核苷酸序列的表达的部分、基本上或完全缺失、沉默、失活或下调。可以使基因部分、基本上或完全缺失、沉默、失活,或可以下调其表达以便影响其编码的多肽所执行的活性,例如酶的活性。可以通过插入核酸序列来使基因部分、基本上或完全缺失、沉默、失活或下调,所述核酸序列破坏基因的功能和/或表达(例如病毒插入、转座子诱变、大范围核酸酶工程改造、同源重组或本领域中已知的其它方法)。术语“消除”和“敲除”可以与术语“缺失”、“部分缺失”、“基本上缺失”或“完全缺失”互换使用并且是指基本上消除基因的表达,例如,使表达水平降低到对照水平的10%以下、5%以下、2%以下或1%或不可检测的水平。术语“减弱”和“敲减”可用于描述相对于野生型表达水平,导致基因表达水平更低,或在一些情况下,例如通过使编码的多肽的功能结构域突变,导致基因产物活性降低的突变和操纵。减弱可以是完全减弱(例如,“敲除”)或者可以是部分减弱,其中,例如使RNA或蛋白质水平从对照水平的1-99.5%降低或“敲减”(例如)到RNA或蛋白质表达可检测,但相对于对照而言降低的水平。在某些实施方案中,可以通过定点同源重组以敲除特定的目标基因来对目标微生物进行工程改造。在其它实施方案中,可以使用RNAi或反义DNA(asDNA)构建体来使特定的目标基因部分、基本上或完全沉默、失活或下调。
某些核酸分子或特定多核苷酸序列的这些插入、缺失或其它修饰可以理解成涵盖“基因修饰”或“转化”,以致可以将微生物或宿主细胞的所得菌株理解成“经基因修饰”、“经基因工程改造”或“经转化”。
如本文中所用,“上调”包括目标基因或核酸分子的表达或酶活性的增加,例如与未上调的其它方面都相同的基因或酶的表达或活性相比,基因表达或酶活性增加。
如本文中所用,“下调”包括目标基因或核酸分子的表达或酶活性的降低,例如与未下调的其它方面都相同的基因或酶的表达或活性相比,基因表达或酶活性降低。
如本文中所用,“突变体”是指在基因中具有突变的生物体,所述突变是传统诱变的结果,例如,使用γ辐射、UV或化学诱变剂。如本文中所用的“突变体”还指由于基因工程改造而具有改变的基因结构或表达的重组细胞,作为非限制性实例,基因工程改造许多包括过表达,包括在不同的暂时性、生物或环境调控下和/或达到不同于自然发生的程度的基因表达和/在重组细胞中不自然表达的基因的表达;同源重组,包括敲除和敲入(例如,用编码比野生型多肽具有更高或更低的活性的多肽和/或显性负性多肽的基因置换基因);经由RNAi、反义RNA或核酶等减弱基因;及使用大范围核酸酶、TALEN和/或CRISPR技术等进行基因组工程改造。因此突变体不是自然存在的生物体。目标突变生物体通常将具有不同于缺乏突变的相应野生型或祖代菌株的表型,其中所述表型可通过生长测定、产物分析、光合特性、生物化学测定等进行评估。当提及基因时“突变体”意指相对于原生或野生型基因而言,该基因具有至少一个碱基(核苷酸)变化、缺失或插入。突变(一个或多个核苷酸的变化、缺失和/或插入)可在基因的编码区内或可在内含子、3’UTR、5’UTR或启动子区内,例如在转录起始位点的2kb以内或在翻译起始位点的3kb以内。作为非限制性实例,突变基因可以是在启动子区内具有可以增加或降低基因表达的插入的基因;可以是具有导致生成非功能性蛋白、截短蛋白、显性负性蛋白或无蛋白质生成的缺失的基因;可以是具有导致所编码的蛋白质的氨基酸变化或导致基因转录物异常剪接等的一个或多个点突变的基因。
术语“Pfam”是指由Pfam财团维护并且在若干个受赞助的万维网站可用的蛋白质结构域和蛋白质家族的大型集合,所述网站包括:pfam.xfam.org/(EuropeanBioinformatics Institute(EMBL-EBI)。Pfam的最新版本是Pfam 30.0(2016年6月)。Pfam结构域和家族使用多重序列比对和隐马尔可夫模型(hidden Markov model;HMM)来鉴定。Pfam-A家族或结构域分配是使用蛋白质家族的代表性成员和以种子比对为基础的剖面隐马尔可夫模型通过编排的种子比对产生的高质量分配。(除非另有说明,否则查询蛋白质与Pfam结构域或家族的匹配是Pfam-A匹配。)然后使用鉴定的所有属于该家族的序列自动生成该家族的完全比对(Sonnhammer(1998)Nucleic Acids Research 26,320-322;Bateman(2000)Nucleic Acids Research 26,263-266;Bateman(2004)Nucleic Acids Research32,Database Issue,D138-D141;Finn(2006)Nucleic Acids Research Database Issue34,D247-251;Finn(2010)Nucleic Acids Research Database Issue 38,D211-222)。通过例如使用上述参考网站访问Pfam数据库,可以使用HMMER同源性搜寻软件(例如,HMMER2、HMMER3或更高版本,hmmer.org)针对HMM查询蛋白质序列。将所查询的蛋白质识别为属于pfam家族(或具有特定Pfam结构域)的显著匹配是其中二进制分数高于或等于Pfam结构域的采集阈值的匹配。还可以使用期望值(e值)作为Pfam中是否包含所查询的蛋白质的标准或用于确定所查询的蛋白质是否具有特定Pfam结构域,其中低e值(远小于1.0,例如小于0.1,或小于或等于0.01)表示匹配归因于偶然性的机率较低。
“cDNA”是包含mRNA分子的至少一部分核苷酸序列的DNA分子,除了DNA分子以核碱基胸腺密度或T代替mRNA分子中出现的尿嘧啶核苷或U外。cDNA可为双链或单链并且可为,例如,mRNA序列的互补序列。在优选实例中,cDNA不包括cDNA所对应的自然存在的基因(即,如同其出现在生物体基因组中时的基因)中存在的一个或多个内含子序列。例如,cDNA可具有来自于自然存在的基因的内含子上游的序列,其与自然存在的基因的内含子下游的序列并列,其中在自然界中上游和下游序列在DNA分子中未并列(即,所述序列在自然存在的基因中未并列)。cDNA可以通过mRNA分子的反转录生成,或者可以合成,例如通过化学合成和/或通过使用一种或多种限制酶、一种或多种连接酶、一种或多种聚合酶(包括但不限于,可用于聚合酶链反应(PCR)高温耐受性聚合酶)、一种或多种重组酶等,基于对cDNA序列的了解来合成,其中对cDNA序列的了解可任选地基于对来自基因组序列编码区的鉴定或由多个部分cDNA序列编译。
提到“基本上同样的”或“基本上相同的”性质,而没有对内涵意义进一步解释,旨在意指所述性质在参考值的10%以内,且优选在5%以内,并且可在2.5%以内、1%以内或0.5%以内。未阐述“基本上”在特定上下文中的内涵意义时,使用该术语以包括微小和无关偏差,其对于本发明上下文中认为重要的特征而言并非是实质性的。
虽然与本文描述的那些类似或等效的方法和材料可用于本发明的实践或试验中,但下面描述了合适的方法和材料。所述材料、方法和实例仅为说明性而非旨在限制。从详细描述和权利要求看,本发明的其它特征和优点将显而易见。
“对照细胞”或“对照微生物”是与所提及的经操纵的、重组或突变细胞基本上相同的细胞或微生物,除了对照细胞不具有经操纵的、重组或突变细胞的修饰外。对照细胞可为野生型细胞,例如由其直接或间接得到经操纵的、重组或突变细胞的菌株的野生型细胞。
如本文中所用,“相同条件”或“相同培养条件”意指基本上相同的条件,即,所提及的条件之间的任何差异较小并且与对于本发明而言是实质性的微生物功能或性质,例如脂质产量或生物质产量无关。
“氮充足的”条件,对于特定细胞类型而言,是细胞不会因氮不足而经历生长缺陷的条件。
如本文中所用,“脂质”是指脂肪、蜡、脂肪酸、脂肪酸衍生物如脂肪醇、蜡酯、链烷和链烯、甾醇、甘油单酯、甘油二酯、甘油三酯、磷脂、鞘脂、糖脂(saccharolipid)和甘油脂。“FAME脂质”或“FAME”是指具有可衍生化为脂肪酸甲酯的酰基部分的脂质,例如,单酰基甘油酯、二酰基甘油酯、三酰基甘油酯、蜡酯,及膜脂例如磷脂、半乳糖脂等。脂质产率可按指定时间段内(例如,每天)以毫克/升(mg/L)计的FAME产率来评估并且对于藻类而言,可报告为面积产率,例如克/米2/天(g/m2/天)。在本文提供的半连续测定中,通过考虑入射辐照面积(SCPA瓶架孔径为11/2”x33/8”,或0.003145m2)和培养物体积(550ml),将mg/L/天的值转化为g/m2/天。为获得以g/m2/天计的产率值,用mg/L/天的值乘以日稀释率(30%)和转换系数0.175。将脂质或其子类(例如,TAG或FAME)表示为百分比时,除非另有说明,否则该百分比为重量百分比。
“生物质”是指不管是活细胞还是死细胞的细胞物质,并且可以例如按抽吸的团块重量来评估,但是更优选使用本领域已知的方法评估干重(例如,培养样品或团块细胞的冻干物(lyophilate))、无灰干重(AFDW)或总有机碳量(TOC)。在容许生长的条件下,在培养物生长期间生物质增加并且可称为,例如,在分批培养物中的“生物质积聚”。在经历稳定或定期稀释的连续或半连续培养物中,所生成的将会在培养物中积聚的生物质在培养物稀释期间被去除。因此,这些培养物的生物质日产率(生物质的增量)也可称为“生物质积聚量”。生物质产率可按指定时间段内(例如,每天)以毫克/升(mg/L)计的TOC产率来评估并且对于藻类而言,可报告为克/米2/天(g/m2/天)。在本文提供的半连续测定中,通过考虑入射辐照面积(SCPA瓶架孔径为11/2”x33/8”,或0.003145m2)和培养物体积(550ml),将mg/L的值转化为g/m2/天。为获得以g/m2/天计的产率值,用mg/L的值乘以日稀释率(30%)和转换系数0.175。将生物质表示为百分比时,除非另有说明,否则该百分比为重量百分比。
在本发明的上下文中,“氮源”是可以被受试微生物吸收和代谢并且掺入到生物分子中用于生长的氮源。例如,包括无法被微生物吸收和/或代谢用于生长的氮的化合物(例如,含氮生物缓冲液如Hepes、Tris等)在本发明的上下文中未视为氮源。
如本文中所用,“还原氮”是呈铵、氨水、尿素或氨基酸化学形式的氮,其可以被正在培养的微生物代谢以提供用于掺入到生物分子中的氮源,从而支持生长。例如,除铵/氨水和尿素外,还原氮还可包括各种氨基酸,其中氨基酸可用作受试微生物的氮源。氨基酸的实例可包括但不限于谷氨酸、谷氨酰胺、组氨酸、赖氨酸、精氨酸、天冬酰胺、丙氨酸和甘氨酸。在氮源上下文中可存在于微生物培养基中的“非还原氮”是指在被微生物同化为有机化合物之前必须还原的硝酸盐或亚硝酸盐。
“[培养基中的]唯一氮源”与“基本上唯一的氮源”可互换使用并且表明未有意地向培养基中添加其它氮源和/或不存在足以显著增加在所提到的培养基中培养的微生物或细胞的生长的量的其它氮源。本申请全篇,为简洁起见,使用术语“仅含硝酸盐”和“仅含尿素”来分别表征其中硝酸盐是微生物可用于支持生长的基本上唯一的氮源或尿素是微生物可用于支持生长的唯一氮源的培养基。
类似地,“[培养基中的]唯一碳源”与“基本上唯一的碳源”可互换使用并且表明无机碳是培养基中基本上唯一的碳源时,不存在足以显著增加在所提到的培养基中培养的微生物或细胞的产率或生长的量的其它碳源,或者可存在的任何其它碳源未大量掺入到微生物或细胞所生成的生物分子如脂质内。“无机碳”是指二氧化碳、碳酸酯和碳酸盐及碳酸。
本文公开了操纵、测定、培养和分析微生物的方法。本文阐述的发明还利用标准方法、技术和试剂进行细胞培养、微生物转化、基因工程和本领域已知的生物化学分析。
所有标题都是为了方便读者而不是以任何方式限制本发明。
脂质产率增加的突变微生物
本发明提供了突变微生物,在对照微生物培养物生成生物质的相同条件下培养突变微生物和对照微生物两者时,突变微生物具有对照微生物的至少45%的生物质产率和相对于对照微生物更高的脂质产率(例如,优选在培养期内平均的更高的日产率)。例如,可按无灰干重(AFDW)产量或产率(即,每天生成的量)或总有机碳(TOC)产率来评估生物质产率。在支持对照微生物生长的条件下,即在对照微生物培养物生成生物质的条件下培养突变微生物和对照微生物时,在至少3天的培养期内,例如,在至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天、至少15天、至少20天、至少30天或至少60天的培养期内,本文所提供的突变微生物可展示出比对照微生物更高的脂质产率和对照微生物的至少45%的生物质产率。在一些实例中,本文所提供的突变微生物相对于对照微生物生成至少45%的生物质并生成更多脂质的培养期可少于180天、少于120天或少于90天。在一些实例中,在突变和对照微生物两者均生成生物质并且每天突变体生成对照微生物所生成的至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少105%、至少110%或至少120%的生物质的培养条件下,本文所提供的突变微生物相对于对照微生物生成更高量的脂质。在一些实例中,本文所提供的突变微生物相对于对照微生物生成更高量的脂质和对照微生物所生成的至少45%的生物质,但少于300%或少于325%或少于200%的生物质。在一些实例中,在突变和对照微生物两者均生成生物质并且活跃分裂的培养条件下,本文所提供的突变微生物相对于对照微生物生成更高量的脂质。
测量微生物所生成的脂质的量的方法是本领域众所周知的并且在本文的实例中有提供。可根据例如Folch等人(1957)J.Biol.Chem.226:497-509;Bligh和Dyer(1959)Can.J.Biochem.Physiol.37:911-917;或Matyash等人(2008)J.Lipid Res.49:1137-1146来测定可提取的总脂质,并且作为脂质呈现的生物质百分比也可以使用傅里叶变换红外光谱法(FT-IR)进行评估(Pistorius等人(2008)Biotechnol&Bioengin.103:123-129)。例如在各自通过引用整体并入本文的US8,207,363和WO 2011127118中提供了FAME和TAG重量分析的其它参考资料。FAME分析方法也可以例如作为American Oil Chemists’SocietyMethods Ce 1b-89and Ce 1-62(aocs.org/Methods/)被找到。
可通过测量总有机碳量(TOC)或通过其它方法,例如测量无灰干重(AFDW)来评估生物质。测量TOC的方法在本领域中已知(例如,US 8,835,149)并且本文有提供。测量AFDW的方法也众所周知并且可以,例如在通过引用整体并入本文的US 8,940,508中找到。
在至少3、4、5、6、7、8、9、10、11、12、13、14、15、20、30或60天的培养期内,在此期间突变和对照微生物两者均生成生物质,突变微生物可例如比对照微生物生成多至少25%的脂质和生成多达对照微生物所生成的至少45%的生物质。例如,在至少3、4、5、6、7、8、9、10、11、12、13、14、15、20、30或60天的培养期内,脂质平均日产率可比对照微生物的脂质平均日产率高至少25%并且生物质平均日产率可高达对照微生物的生物质产率的至少45%。在另外的实例中,在对照微生物生成生物质的条件下,突变微生物可生成比对照微生物所生成的多至少约50%的脂质和生成多达对照微生物所生成的至少45%的生物质,即相对于对照微生物,可表现出不超过55%的脂质减少。在至少3、4、5、6、7、8、9、10、11、12、13、14、15、20、30或60天的培养期内,突变体在一些实例中可比对照微生物生成多不到400%或不到300%的脂质,同时积聚多达对照微生物所积聚的至少45%的生物质。
本文所提供的突变体生成多至少25%或至少约50%的FAME,同时生成为对照微生物的至少50%的量的TOC的培养条件,可以是营养充足的,并且相对于对照微生物可以是氮充足的,即,所述培养条件相对于对照微生物在营养上是足够的,以致附加营养不会提高微生物的生长速率(其中所有其它培养条件和成分仍然相同)。例如,所述培养条件相对于对照微生物在氮上是足够的,以致附加氮不会提高微生物的生长速率(其中所有其它培养条件和成分仍然相同)。可选地,在一些实施方案中,本文所提供的突变体生成多至少25%或至少约50%的FAME(其可为FAME平均日产率),同时生成为对照微生物的至少45%的量的TOC(例如,TOC平均日产率)的培养条件可包括支持生物质生成,但速率比完全氮充足的培养基低的氮。例如,所述培养条件可允许以完全氮充足的培养基中至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的生物质生成速率生成生物质(TOC或AFDW)。
在支持与对照微生物在氮充足条件下的生物质水平同等的生物质产量的条件下,本文公开的突变微生物可生成比对照微生物所生成的多至少25%的脂质,例如多25%的FAME,同时生成对照微生物的生物质的至少45%。例如,在氮充足条件下对照微生物的生物质产量可在对照微生物的生物质产量的20%以内或15%以内。可选地或另外,本文所提供的突变体可生成对照微生物的生物质至少45%,同时比对照微生物生成多至少25%的脂质,其中在相对于对照微生物而言氮充足的条件下培养突变和对照微生物。在不同实例中,在包括硝酸盐或尿素中的一种或多种,并且在一些实例中还可任选包括少于约5mM铵,例如少于约2.5mM铵、少于约2mM铵、少于约1.5mM铵、少于约1mM铵、约0.5mM铵或少于0.5mM铵的培养基中,在相同时间段内突变体可生成对照细胞至少45%的生物质和比对照细胞多至少25%的脂质。
在特定的非限制性实例中,微生物可为藻类或异鞭毛类微生物并且在包括少于约5mM、少于约4.5mM、少于约4mM、少于约3.5mM、少于约3mM、少于约2.5mM、少于约1mM或少于约0.5mM铵的培养基中,可生成多至少25%的FAME,同时生成为对照藻类或异鞭毛类微生物所生成的至少45%的量的TOC。例如,铵浓度范围可为约0至约5mM、约0至约4.0mM、约0至约3mM、约0至约2.5mM、约0至约2.0mM、约0至约1.5mM、约0至约1.0mM或约0至约0.5mM的浓度。铵浓度范围可为约0.5至约5mM、约0.5至约4mM、约0.5至约3mM、0.5至约2.5mM、约0.5至约2.0mM、约0.5至约1.5mM、约0.5至约1mM或约1至约5mM、约1至约2.5mM或约0.1至约1mM、约0.1至约1.5mM或约0.1至约2mM的浓度。在其它实例中,铵浓度范围可为约1mM至约2.5mM或约0.2至约1.5mM的浓度。
在一些实例中,突变微生物可为藻类或异鞭毛类细胞,其在包括约2.5mM铵或更少、约2.0mM铵或更少、约1.5mM铵或更少、约1.0mM铵或更少、约0.5mM铵或更少,或基本上不包括铵,并且可任选包括,例如至少1.0mM、至少2.0mM、至少3.0mM、至少4.0mM、至少5.0mM、至少6.0mM、至少7.0mM、至少8.0mM或至少10.0mM硝酸盐和/或尿素的培养基中,生成多至少25%的FAME,同时生成对照微生物所生成的至少45%的量的TOC。在其它非限制性实例中,微生物可为藻类或异鞭毛类细胞并且在包括少于约5mM、少于约2.5mM、少于约1mM或少于约0.5mM铵的培养基中可生成多至少50%的FAME,同时生成对照微生物所生成的至少45%的量的TOC。例如,微生物可为藻类或异鞭毛类细胞,其在包括约2.5mM铵或更少、约1.0mM铵或更少、约0.5mM铵或更少,或基本上不包括铵,并且可包括例如至少1.0mM、至少2.0mM、至少3.0mM、至少4.0mM、至少5.0mM、至少6.0mM、至少7.0mM、至少8.0mM或至少10.0mM硝酸盐和/或尿素的培养基中,生成多至少50%的FAME,同时生成对照微生物所生成的至少45%的量的TOC。
本文提供的突变微生物相对于在对照微生物和突变微生物两者均生成生物质的相同条件下培养的对照微生物,可具有更高的脂质碳分配。相对于对照微生物,脂质碳分配增加的突变体对可提取的总脂质、总中性脂质、甘油三酯和/或FAME衍生化脂质可具有增加的碳分配。例如,本文所提供的突变微生物可比对照微生物具有高至少50%的生成的FAME衍生化脂质(“FAME”)的量与生成的生物质(例如,TOC或无灰干重(AFDW))的比率。脂质和生物质产量和/或产率可以,例如通过本领域所知和本文实例中展示的重量分析进行评估。例如,在突变微生物的培养物和对照微生物的培养物两者均生成生物质的条件下培养突变微生物和对照微生物时,本文所提供的突变微生物可具有比对照微生物的FAME/TOC比率高至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%、至少200%或至少250%的FAME/TOC比率。在一些实例中,相对于在相同条件下培养的对照微生物的FAME/TOC比率,本文所提供的突变微生物的FAME/TOC比率可增加少于约300%。
在不同实例中,在对照培养物生成生物质(例如,TOC)并且突变培养物生成对照培养物所生成的至少45%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的量的生物质的条件下培养突变微生物和对照微生物两者时,本文所提供的突变微生物可具有比对照微生物的FAME/TOC比率高至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%、至少200%或至少250%的生成的FAME与生成的TOC的量的比率。在不同实例中,在突变微生物培养物生成多达在对照和突变培养物两者均生成生物质的条件下对照微生物培养物的至少45%、至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%或至少95%的生物质(例如,TOC)的条件下培养时,本文所提供的突变体的FAME/TOC比率可为至少0.30、至少0.35、至少0.40、至少0.45、至少0.50、至少0.55、至少0.60、至少0.65、至少0.7或至少0.75。在不同实例中,在突变培养物生成多达对照微生物培养物在氮充足条件下培养时的至少约50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%或至少100%的生物质(例如,TOC)的条件下培养时,本文所提供的突变体的FAME/TOC比率可为至少0.30、至少0.35、至少0.40、至少0.45、至少0.50、至少0.55、至少0.60、至少0.65、至少0.7或至少0.75。
在一些实例中,在对照和突变微生物两者均生成生物质的条件下培养时,本文所提供的突变微生物可生成多至少50%的FAME,同时生成对照细胞(如野生型细胞)所生成的至少80%、至少85%或至少90%的TOC,并且突变微生物的FAME/TOC比率比对照微生物的FAME/TOC高至少40%、至少50%、至少60%、至少70%或至少75%。突变微生物的FAME/TOC比率可为,例如,至少0.30、至少0.35或至少0.40。培养条件可包括,例如,包括少于5mM、少于2.5mM、少于2mM、少于1.5mM、少于1.0mM或少于0.5mM铵并且可包括至少2mM、至少4mM或至少6mM尿素或硝酸盐的培养基。在另外的实例中,在野生型和突变微生物两者均生成生物质的条件下培养时,本文所提供的突变微生物可生成多至少60%、至少70%或至少80%的FAME,同时生成对照细胞(如野生型细胞)所生成的至少85%、至少90%或至少95%的TOC,并且突变微生物的FAME/TOC比率比对照微生物的FAME/TOC比率高至少50%、至少60%、至少70%或至少75%。突变微生物的FAME/TOC比率可为,例如,至少0.35、至少0.40或至少0.45。培养条件可包括,例如,包括少于2.5mM、少于1.0mM或少于0.5mM铵并且可包括至少2mM、至少4mM或至少6mM尿素或硝酸盐的培养基。在一些实例中培养条件基本上不包括铵,而在一些实例中可基本上不包括作为氮源的还原氮。
在其它实例中,在野生型和突变微生物两者均生成生物质的条件下培养时,本文所提供的突变微生物可生成多至少85%、至少90%、至少95%、至少100%、至少105%、至少110%或至少115%的FAME,同时生成对照细胞(如野生型细胞)所生成的至少70%、至少75%、至少80%或至少85%的TOC,并且突变微生物的FAME/TOC比率比对照微生物的FAME/TOC比率高至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%或至少180%。可按培养期内,例如至少3天、至少5天、至少10天、至少20天、至少30天或至少60天的培养期内,或介于3天和60天之间,或介于3天和30天之间,例如介于3天和15天之间或介于5天和15天之间的培养期内的FAME平均日产率来评估FAME和TOC产量。突变微生物的FAME/TOC比率可为,例如至少0.50、至少0.55、至少0.60、至少0.65、至少0.70或至少0.75。培养条件可包括,例如,包括少于2.5mM、少于1.0mM或少于0.5mM铵并且可包括至少2mM、至少4mM或至少6mM尿素或硝酸盐的培养基。
在另外的实例中,在相同条件下培养突变微生物和野生型或对照微生物时,突变微生物可生成野生型或对照微生物所生成的至少约70%的生物质和比野生型或对照微生物所生成的多至少90%的脂质。可按培养期内,例如至少3天、至少5天、至少10天、至少20天、至少30天或至少60天的培养期内的FAME平均日产率来评估FAME和TOC产量。例如,野生型和对照微生物可在分批、半连续或连续培养下培养至少3、4、5、6、7、8、9、10、11、12、13、14、15、20、30或60天。在一些实例中,培养基中的铵浓度可低于约5mM或低于约2.5mM。在一些实例中,培养基可包括至少2mM硝酸盐或至少2mM尿素。在相同条件下培养突变微生物和野生型或对照微生物时,在一些实例中,突变微生物可生成野生型或对照微生物所生成的至少约75%或至少约80%的生物质和比野生型或对照微生物所生成的多至少100%或至少110%的脂质。FAME/TOC比率可以比在相同条件下培养的野生型微生物的FAME/TOC比率高至少80%、至少100%、至少120%或至少150%。在一些实例中,在相同条件下培养突变微生物和野生型或对照微生物时,突变微生物可生成野生型或对照微生物所生成的至少约70%或至少约75%的生物质和比野生型或对照微生物所生成的多至少100%或至少120%的FAME脂质,并且突变微生物可具有比在相同条件下培养的野生型微生物的FAME/TOC比率高至少100%或至少120%的FAME/TOC比率。
在不同实施方案中,本文所提供的突变微生物,例如,诸如本文描述的任一种,生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%、至少120%、至少125%或至少130%的脂质的突变微生物,可比对照微生物具有更高的碳:氮(C:N)比,其中所述条件支持对照微生物每天积聚生物质。例如,在突变体和对照微生物两者均积聚生物质的条件下培养突变微生物和对照微生物时,C:N比可以是对照微生物的C:N比的约1.5至约2.5倍,并且突变体比对照微生物生成多至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的脂质和对照微生物的至少50%、至少60%、至少70%、至少80%或至少85%的TOC。在一些实施方案中,在突变体比对照微生物生成多至少50%的脂质,同时生成多达对照微生物所生成的至少50%的生物质的培养期间,本文所提供的突变体的C:N比介于约7和约20之间或介于约8和约17之间,或介于约10和约15之间。在本文任一实施方案或实例中的对照微生物可为野生型微生物。
可选地或另外,本文所提供的突变微生物,例如,诸如本文描述的任一种,生成至少约50%的生物质和比在相同条件下培养的对照微生物所生成的多至少约50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%或至少120%的脂质的突变微生物,与对照微生物相比时可具有降低的蛋白质含量,其中所述条件支持对照微生物每天积聚生物质。例如,在一些实施方案中,如本文所提供的突变微生物相对于对照微生物,可具有至少10%、至少20%、至少30%、至少40%、至少45%或至少50%的蛋白质含量降低。
在不同实施方案中,本文所提供的突变微生物可具有减弱的编码蛋白质的基因的表达,所述基因的表达影响其它基因,例如,至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个另外的基因的表达。例如,在表达突变表型(脂质产量更高)的条件下,本文所提供的突变体可具有至少10个相对于野生型微生物上调的基因和至少10个相对于野生型微生物下调的基因。在表达突变表型(例如,相对于野生型微生物的脂质产量更高)的条件下,本文所提供的突变体可具有至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个相对于野生型微生物上调的基因和至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或至少100个相对于野生型微生物下调的基因。在一些实施方案中,编码涉及蛋白质合成的多肽的基因在本文所提供的突变体中可上调,例如,编码核糖体多肽或在翻译中起作用的其它多肽的基因,包括但不限于,属于基因本体(GO)类别如“翻译”、“核糖体”、“核糖体结构组成部分”、“真核生物翻译起始因子3复合物”、“翻译起始因子活性”、“翻译起始”、“小核糖体亚基”、“翻译起始前复合物”、翻译起始调控、“真核43S起始前复合物”和“真核48S起始前复合物”的那些。可选地或与上调编码涉及蛋白质合成的多肽的基因组合,在本文所提供的突变体中编码涉及氮同化的多肽的各个基因中的任一个均可下调,例如钼辅因子生物合成蛋白、硝酸盐转运体、硝酸还原酶、亚硝酸还原酶、谷氨酸合成酶、谷氨酰胺合成酶、谷氨酸脱氢酶和铵转运体。可选地或与以上任一种组合,本文所提供的突变体可表现出与脂质生物合成有关的某些基因上调,所述基因包括但不限于脂滴表面蛋白和/或一种或多种去饱和酶、延伸酶、脂肪酶、酰基转移酶和/或甘油醛-3-磷酸脱氢酶。
将本文所提供的脂质产量增加的突变体的性质与对照微生物的相同性质做比较,所述对照微生物可以是与突变体相同物种的野生型微生物,优选为脂质高产突变体的祖代菌株。可选地,对照微生物可以是与突变微生物基本上相同的微生物,除对照微生物没有产生更高脂质产率的突变外。例如,对照微生物可以是基因工程改造微生物或传统突变微生物,其已经进一步突变或工程改造以产生脂质产率增加和/或脂质分配增加的突变体。
在一些实例中,对照微生物可以是与突变微生物基本上相同的微生物,除对照微生物没有基因突变或调控脂质诱导的基因(即,在突变微生物具有祖代菌株至少约一半的生物质产率的条件下,其突变引起脂质产量增加的基因)的表达未减弱外。还将具有经破坏、减弱或以其它方式直接或间接地基因操纵的基因(导致脂质诱导调控基因的结构或表达改变)的脂质高产突变体的性质与对照细胞的相同性质做比较,对照细胞没有经破坏、减弱或以其它方式直接或间接地基因操纵的脂质诱导调控基因(导致脂质诱导调控基因的结构或表达改变)(无论细胞是否为“野生型”)。例如,对照细胞可为重组细胞或在除脂质诱导调控基因以外的基因内突变的细胞等,所述基因的影响正在评估。
考虑用于本发明的异鞭毛类包括但不限于硅藻(Bacillariophyte)、黄绿藻、Labrinthulid和破囊壶菌(Thraustochytrid),例如以下种:网粘菌、类网粘菌、破囊壶菌属、裂殖壶菌属、不动壶菌属、橙黄壶菌属、椭圆壶菌属、日本壶菌属、戴普罗弗菌属或吾肯氏壶菌属。
具有本文公开的性质的突变微生物,例如调控脂质生物合成的基因,例如加的斯微拟球藻的ZnCys-2845基因及其直系同源物的表达减弱的突变微生物,在不同实例中,可以是任何真核微藻类菌株,例如以下任一属的任一种:曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、波利氏藻属、包特氏藻属、气球藻属、葡萄藻属、片球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、长绿梭藻属、小球藻属、蓝隐藻属、金球藻属、球隹丐板藻属、隐甲藻属、隐藻属、小环藻属、链带藻属、杜氏藻属、后棘藻属、圆石藻属、独球藻属、衣迪斯藻属、眼虫藻属、真眼点藻属、披剌藻属、脆杆藻属、拟脆杆藻属、丽丝藻属、红球藻属、菱板藻属、异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微星藻属、蒜头藻属、单针藻属、微球藻属、微拟球藻属、舟形藻属、新绿藻属、肾鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、虫毛球藻属、拟小球藻属、雪衣藻属、杜氏亚属盐藻属、巴夫藻属、普莱格门、褐指藻属、菌体属、微微型绿藻属、扁藻属、颗石藻属、肋球藻属、原壁菌属、拟绿球藻属、拟新绿藻属、拟角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、裂衣藻属、骨条藻属、水绵藻属、裂丝藻属、四球藻属、扁藻属、海链藻属、黄丝藻属、无隔藻属、鲜绿球藻属、魏氏藻属和团藻属。特别合适的种的非限制性实例包括,例如,异鞭毛藻类,例如但不限于硅藻,例如,以下任一属的种:双眉藻属、角毛藻属、小环藻属、脆杆藻属、拟脆杆藻属、菱板藻属、舟形藻属、菱形藻属、褐指藻属或海链藻属,或黄绿藻,例如小绿藻属(Chloridella)、Chlorobptrys、椭球藻属(Ellipsoidion)、真眼点藻属、角绿藻属(Goniochloris)、拟单胞藻属(Monodopsis)、蒜头藻属、微拟球藻、假拟小椿藻属(Pseudocharaciopsis)、拟角星鼓藻属(Pseudostaruastrum)、假骈列藻属(Pseudotetraedriella)或魏氏藻属。在一些实例中,突变藻类细胞是椭球藻属、真眼点藻属、蒜头藻属、微拟球藻属、假星鼓藻属、假骈列藻属或魏氏藻属的种。在一些实例中,突变藻类细胞是微拟球藻属的种,例如加的斯微拟球藻、颗粒微拟球藻、湖泊微拟球藻(N.limnetica)、海洋微拟球藻、眼点微拟球藻(N oculata)或盐生微拟球藻。
所述突变体可以是调控基因表达减弱的自发突变体、传统来源的突变体或经工程改造的突变体。例如,突变微生物如本文描述的任一种,可以是通过传统诱变或基因工程获得的突变体。在特定实施方案中,本文所提供的突变微生物是经基因工程改造的突变体,例如,已经向其中引入了至少一个外源核酸分子,例如已经向其中引入了至少一个重组核酸分子的微生物,其中所述突变微生物经基因工程改造为包括外源核酸分子和/或实现微生物基因组的至少一种改变的外源核酸分子。
在不同实例中,突变微生物为藻类或异鞭毛类并且编码下述多肽的基因的表达减弱,所述多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性,和/或所述基因具有与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的编码区。可选地或另外,突变微生物为藻类或异鞭毛类并且编码下述多肽的基因的表达减弱,所述多肽具有与SEQ ID NO:20的氨基酸1-200或与SEQ ID NO:18或SEQ ID NO:19具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。突变微生物在某些实施方案中还可包括与SEQ ID NO:21-25中任一个具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的结构域。所述结构域可为PAS3结构域。可通过任何基因减弱方法,例如本文公开的任一种或其等效方法,将突变微生物工程改造以减弱至少一个编码本文所述多肽的基因的表达。
由表达被减弱的基因编码的多肽可为Zn(II)2Cys6真菌型DNA结合域蛋白家族的转录因子蛋白。由表达被减弱的基因编码的多肽可包括Zn(2)Cys(6)结构域,NCBI保守结构域数据库(ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)归类为保守结构域cd00067,称为转录因子如GAL4中存在的“GAL4样Zn2Cys6双核集群DNA结合域”,也表征为smart00066:“GAL4样Zn(II)2Cys6(或C6锌)双核集群DNA结合域”。该结构域,本文也可称为Zn2Cys6、Zn2CyS6或Zn(2)Cys(6)结构域或简称为ZnCys结构域,出现在SEQ ID NO:2的氨基酸190-219处,也表征为pfam PF00172(“Zn Clus”或“真菌Zn(2)-Cys(6)双核集群结构域”),该家族的收集截止值为20.8。在一些实施方案中,本文所提供的突变体具有减弱的编码下述多肽的基因的表达,所述多肽具有与SEQ ID NO:3具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的Zn(2)Cys(6)结构域。
可选地或另外,表达减弱的基因可编码具有PAS_3结构域(pfam08447,具有25.6的收集截止值)的多肽,PAS_3结构域也称为“PAS折叠结构域”或简称为PAS结构域,例如,与SEQ ID NO:19-23中的任一个具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的PAS结构域。
调控脂质生成的基因表达减弱的突变微生物可为“敲除”突变体,例如,其中破坏了多肽的阅读框,使得未生成功能蛋白。例如,所述基因可包括阅读框内导致不产生功能蛋白的插入、缺失或突变。所述插入、缺失或突变可通过各种方式产生,例如,同源重组构建体,任选地与供体DNA片段结合采用向导RNA的RNA向导内切核酸酶,等等。在其它实例中,突变微生物可为“敲减”突变体,其中所述基因的表达相对于野生型细胞降低。例如,靶基因的转录水平,相对于对照微生物如野生型微生物中的转录水平可降低约5%至约95%或约10%至约90%,所述靶基因可以是,例如,编码Zn(2)-C6真菌型DNA结合域蛋白的基因。敲减可以是其中在基因的非编码区内出现了突变、插入或缺失的突变体或者可以通过使细胞中降低靶基因表达的构建体,例如核酶、RNAi或反义构建体表达来实现。在一些实施方案中,可通过向基因的非编码区,例如5’UTR或3’UTR插入DNA片段来实现基因减弱。插入DNA片段可任选地通过使用RNA向导内切核酸酶,例如cas蛋白。调控脂质生成的基因表达减弱的突变微生物可包括,例如以下的一种或多种:用于表达RNAi的RNAi构建体或一个或多个RNAi分子,用于表达反义RNA的反义构建体或一个或多个反义分子,用于表达核酶的核酶构建体或一种或多种核酶,一种或多种向导RNA,用于表达向导RNA的一种或多种构建体,用于cas介导的插入的一个或多个供体片段,一个或多个同源重组构建体,编码cas酶的一个或多个基因,或cas酶,编码TALEN的一个或多个基因,或一种或多种TALEN,或一种或多种大范围核酸酶。
因此,本文提供了编码Zn(II)2Cys6家族的多肽的基因表达减弱的微生物,所述多肽即包括“GAL4样Zn2Cys6双核集群DNA结合域”(NCBI保守结构域cd00067)和/或归为pfamPF00172(“Zn Clus”或“真菌Zn(2)-Cys(6)双核集群结构域”)的多肽,二进制分数高于该家族的采集截止值20.8。可选地或另外,本文所提供的突变微生物可具有减弱的编码多肽的基因表达,所述多肽包括可表征为PF08447或PF00989的PAS结构域(例如,“PAS3结构域”或“PAS折叠结构域”)。在突变体和对照微生物两者均生成生物质并且突变微生物生成对照微生物所生成的至少50%的生物质的培养条件下,所述突变体可比对照微生物生成多的脂质。例如,在突变体和对照微生物两者均生成生物质并且突变微生物生成对照微生物所生成的至少50%的生物质的培养条件下,突变微生物可比对照微生物生成多至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%或至少120%的脂质。在不同实施方案中,培养至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天或至少12天,编码Zn(II)2Cys6家族的和/或具有PAS结构域的多肽的基因的表达减弱的微生物每天生成多至少50%的脂质和对照微生物所生成的至少50%的生物质。突变体可包括上文描述的任何性质,包括但不限于,在突变体比对照微生物生成多的脂质的条件下FAME/TOC比率增加。突变体生成更高量的脂质,同时生成为对照微生物所生成的至少50%的生物质的培养条件可包括少于2.5mM、少于1.5mM、少于1mM或约0.5mM或更少的铵。突变体生成更高量的脂质,同时生成为对照微生物所生成的至少50%的生物质的培养条件可包括含硝酸盐,例如至少2、3、4或5mM硝酸盐的培养基。可选地或另外,培养基可包括含尿素,例如至少2、3、4或5mM尿素的培养基。在一些实例中,培养基可提供硝酸盐作为突变体和对照微生物可用的基本上唯一的氮源。对照微生物可以是与突变体相同物种的野生型微生物,例如可以是由其得到突变体的野生型菌株。所述微生物可为藻类或异鞭毛类,并且在一些实例中为异鞭毛藻类,例如但不限于硅藻或黄绿藻。在不同实例中可按FAME脂质来测量脂质,并且可按例如TOC来测量生物质。
可选地或另外,在对照培养物生成生物质(例如,TOC)并且突变体培养物生成对照培养物所生成的至少45%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的量的生物质的条件下培养突变微生物和对照微生物时,本文所提供的编码Zn(II)2Cys6家族的多肽的基因表达减弱的突变微生物可展示出比对照微生物的FAME/TOC比率高至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%、至少180%、至少190%、至少200%或至少250%的FAME/TOC比率。在示例性实施方案中,ZnCys减弱菌株可表现出对照菌株(例如,野生型菌株)约两倍的脂质产率,同时在半连续或连续培养系统中将其大约35-70%的碳分配给脂质,例如,同时将其约40%至约65%的碳分配给脂质,例如将其约45%、50%、60%或65%的碳分配给脂质。进一步另外地或可选地,本文所提供的突变微生物,例如,具有减弱的编码Zn(II)2Cys6家族的多肽的基因的表达,生成在相同条件下培养的对照微生物所生成的至少约50%的生物质和比对照微生物所生成的多至少约50%的脂质的突变微生物,可比对照微生物具有更高的碳:氮(C:N)比,其中所述条件支持对照微生物每天积聚生物质。例如,在突变体和对照微生物两者均积聚生物质的条件下培养突变微生物和对照微生物时,C:N比可为对照微生物的C:N比的约1.5至约2.5,并且突变体比对照微生物生成多至少50%、至少60%、至少70%、至少80%、至少90%或至少100%的脂质和对照微生物的至少50%、至少60%、至少70%、至少80%或至少85%的TOC。
在比对照微生物具有更高的脂质产率的突变体中表达减弱的基因可以是编码Zn(II)2Cys6家族的多肽的基因,所述多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。可选地或另外,表达减弱的基因可编码具有PAS3结构域(pfam08447),例如与SEQ ID NO:19-23中的任一个具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的PAS3结构域的多肽。
可通过靶向目标微生物的编码包括如本文所公开的Zn2Cys6结构域和/或如本文所公开的PAS3结构域的多肽的内源基因来设计本文所提供的突变微生物。在目标微生物中可通过生物信息学方法、分子生物学技术及其组合来鉴定此类基因。例如,可以使用RNA印迹杂交,通过杂交或PCR筛选cDNA文库,例如使用简并探针和/或启动子来鉴定编码包括Zn2Cys6结构域和/或PAS3结构域的多肽的基因。可通过执行序列匹配(blast程序)或分析所编码的氨基酸序列的结构域结构的许多程序中的任一种来搜索公共或私有数据库中可用的基因组序列。例如,hmmer.org提供了用于分析基因所编码的结构和功能结构域的软件,该软件可用于扫描基因组序列,包括,例如hmmsearch和hmmscan。此类搜索可在线进行。通过构建系统树以确定蛋白质间的关系,也可以使用诸如MUSCLE和hmmalign程序搜索蛋白质如本文所公开的蛋白质的直系同源物(例如,ZnCys-2845和直系同源物)。另外,基于序列的搜索,包括blastp、blastn和tblastn(针对翻译的核苷酸序列查询蛋白质序列)。基因打靶可利用从目标微生物的基因组获得的序列。为了靶向基因进行减弱没有必要分解基因的完整结构。例如,使用本文公开的方法,包括但不限于,cas/CRISPR基因组编辑、RNAi构建体、反义构建体、同源重组构建体和核酶构建体,仅一部分基因序列可用于基因减弱构建体和技术中。
基因减弱
调控脂质生物合成的基因表达减弱的突变微生物可以是通过任何可行方法产生的突变体,包括但不限于UV辐射、γ辐射或化学诱变,及例如,使用本文公开的测定法或通过用亲脂性染料如尼罗红(Nile Red)或BODIPY染色(例如,Cabanelas等人(2015)Bioresource Technology 184:47-52)来筛选脂质产量增加的突变体。产生微生物菌株的突变体的方法是众所周知的。
如本文所提供的生成多至少25%的脂质,同时生成祖代细胞的至少50%的生物质的突变体也可以是经基因工程改造的突变体,例如下述突变体,其中调控基因如Zn(2)-C(6)真菌型DNA结合域蛋白(例如,ZnCys-2845或其直系同源物,例如编码与SEQ ID NO:2或SEQ ID NO:5-18中的任一个具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的多肽的基因)已经通过同源重组而靶向进行敲除或基因置换(例如用编码相对于野生型多肽活性降低的多肽的基因的突变形式置换)。例如,可通过定点同源重组来工程改造目标微生物菌株以向基因组基因座中插入序列并由此改变基因和/或其表达,其中作为非限制性实例,插入可以是在基因的编码区内,在基因的内含子内,在基因的3’UTR内,在基因的5’UTR内,或在转录起始位点上游,即在基因的启动子内。
例如,通过同源重组进行的基因敲除或置换可以是通过转化同源重组核酸构建体,即包括与要改变的基因组区域同源的序列的核酸(例如,DNA)片段,其中所述同源序列被外源序列中断,通常但不一定是允许选择整合构建体的选择性标记基因。外源序列或突变基因序列任一侧的基因组同源侧翼序列长度可为例如,至少20个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1,000个、至少1,200个、至少1,500个、至少1,750或至少2,000个核苷酸。其中靶基因序列侧接外源序列的基因敲除或基因“敲入”构建体可以在载体中提供,所述载体可任选地,例如通过在要进行同源重组的区域外部的位点裂解而线性化,或者可作为未处于载体背景下的线性片段提供,例如,敲除或敲入构建体可以是分离或合成的片段,包括但不限于PCR产物。在一些情况下,可使用分裂标记系统通过同源重组产生基因敲除,其中可引入两个DNA片段,其可以再生选择性标记并经由交叉事件破坏目标基因座(Jeong等人(2007)FEMS Microbiol Lett 273:157-163)。
一方面,本发明提供了经基因修饰的生物体,例如,具有一个或多个基因修饰以减弱脂质调控基因如编码Zn(2)-C(6)真菌型DNA结合域蛋白的基因的表达的微生物,所述蛋白另外可与SEQ ID NO:2或SEQ ID NO:5-18中的任一个具有至少55%同一性。如本文中所用,“减弱脂质调控基因的表达”意指以降低全功能脂质调控蛋白的功能的任何方式降低或消除该基因的表达。如本文中所用,“脂质调控基因”是指在生物体或细胞内的表达减弱导致相对于对照生物体或细胞而言所述生物体或细胞内至少50个、至少100个、至少200个或至少300个基因的调控改变并且导致所述生物体或细胞的脂质产率改变的基因。在一个示例性实施方案中,脂质调控基因是编码Zn(2)-C(6)真菌型DNA结合域蛋白的基因。减弱脂质调控基因的方式包括,例如同源重组构建体;CRISPR系统,包括一个或多个向导RNA,cas酶例如但不限于Cas9酶或编码cas酶的基因,及任选地,用于插入靶位点的一个或多个供体片段;RNAi构建体;shRNA;反义RNA构建体;核酶构建体;TALEN或编码TALEN的基因、锌指核酸酶或编码锌指核酸酶的基因;及大范围核酸酶或编码锌指核酸酶的基因。
例如,经工程改造以具有减弱的脂质调控基因的表达的重组微生物可具有被破坏的脂质调控基因,其包括降低或消除该基因的表达的至少一个插入、突变或缺失,使得不产生全功能脂质调控基因或产生的量比不包括被破坏的脂质调控基因的对照微生物所产生的低。被破坏的脂质调控基因可以是通过,例如同源重组介导的插入或基因置换和/或通过大范围核酸酶、锌指核酸酶(Perez-Pinera等人(2012)Curr.Opin.Chem.Biol.16:268-277)、TALEN(WO 2014/207043;WO2014/076571)或CRISPR系统的cas蛋白(例如,Cas9蛋白)的活性所破坏的。
除cas核酸酶多肽或复合物外,Hsu等人(Cell 157:1262-1278,2014)最近审查的CRISPR系统还包括常常称为“crRNA”,通过与靶位点序列的互补性而与基因组靶位点相互作用的靶向RNA,与cas多肽复合的反式激活(“tracr”)RNA并且还包括结合(通过互补性)靶向crRNA的区域。
本发明考虑使用两个可以共同转化到表达cas蛋白或经cas蛋白转染以进行基因组编辑的宿主菌株内(或在宿主菌株内表达)的RNA分子(“crRNA”和“tracrRNA”),或使用包括与靶序列互补的序列以及与cas蛋白相互作用的序列的单个向导RNA。即,在一些策略中如本文中所用的CRISPR系统可包含两个单独的RNA分子(“tracr-RNA”和“靶标RNA”或“crRNA”,参见下文)并且本文称为“双RNA分子CRISPR系统”、“双RNA向导系统”或“分裂向导RNA系统”。可选地,如实例中所述,DNA靶向RNA也可包括用于与cas蛋白相互作用的反式激活序列(除靶同源(“cr”)序列外),即,DNA靶向RNA可为单个RNA分子并且本文称为“嵌合向导RNA”、“单向导RNA”或“sgRNA”。术语“DNA靶向RNA”和“gRNA”是包容性的,是指双RNA向导系统和单分子DNA靶向RNA(即sgRNA)两种。单分子向导RNA和双RNA向导系统两者在文献中均有详细描述并且例如,在美国专利申请公布第US 2014/0068797号中,其通过引用整体并入本文,并且本文对两者均有考虑。
任何cas蛋白均可用于本文的方法中,例如但不限于:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Csel、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4及其同源物或其修饰形式。cas蛋白可为Cas9蛋白,作为非限制性实例,例如酿脓葡萄球菌(Staphylococcus pyogenes)、嗜热葡萄糖球菌(S.thermophilus)、肺炎葡萄糖球菌(S.pneumonia)、金黄色葡萄球菌(S.aureus)或脑膜炎奈瑟球菌(Neisseriameningitidis)的Cas9蛋白。还考虑了美国专利申请公布第US 2014/0068797号中如SEQ IDNO:1-256和795-1346所提供的Cas9蛋白,和可以组合来自一种以上cas9蛋白的结构域的嵌合Cas9蛋白,以及鉴定的Cas9蛋白的变体和突变体。在另外的实例中,用于基因组修饰的cas蛋白可以是使用单RNA向导系统的Cpf1蛋白,例如但不限于氨基酸球菌属(Acidaminococcus)或毛螺旋菌科(Lachnospiraceae)的Cpf1蛋白(参见例如Fagerlund等人(2015)Genome Biol.15:261;Zetsche等人(2015)Cell 163:1-13);和欧洲专利申请EP3009511),以及C2c1、C2c2、C2c3RNA向导核酸酶(Shmakov等人(2015)Molecular Cell60:1-13)。
Cas核酸酶活性裂解靶DNA以产生双链断裂。然后这些断裂被细胞以两种方式之一修复:非同源末端连接或同源介导修复。在非同源末端连接(NHEJ)中,通过断裂末端相互直接连接来修饰双链断裂。在这种情况下,虽然一些核酸物质可能丢失(导致缺失)或改变(常常导致突变),但是没有新的核酸物质插入所述位点。在同源介导修复中,可与裂解的靶DNA序列具有同源性的供体多核苷酸(有时称为“供体DNA”或“编辑DNA”)用作修复裂解的靶DNA序列的模板,导致遗传信息从供体多核苷酸转移到靶DNA。因而,新的核酸物质可插入/拷贝到所述位点。由于NHEJ和/或同源介导修复(例如使用供体DNA分子)引起的靶DNA的修饰可导致,例如基因修正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。
在一些情况下,通过定点修饰多肽(例如,cas核酸酶、锌指核酸酶、大范围核酸酶或TALEN)裂解DNA可用于通过以下方式使核酸物质从靶DNA序列中缺失:裂解靶DNA序列并且使细胞在不存在外源提供的供体多核苷酸的情况下修复序列。此类NHEJ事件可在裂解末端重新连接的位点处产生突变(“错修复”),这可导致基因破坏。
可选地,如果DNA靶向RNA连同供体DNA一起供体施用于表达cas核酸酶的细胞,则可以使用主题方法向靶DNA序列添加,即插入或置换核酸物质(例如,通过插入诱变“敲除”,或“敲入”编码蛋白质(选择标记和/或任何目标蛋白质)的核酸、siRNA、miRNA等,以修饰核酸序列(例如,引入突变)等)。
在特定实施方案中,供体DNA可包括基因调控序列(例如,启动子),可以使用CRISPR靶向将其插入基因编码区的上游和基因假定近端启动子区的上游,例如,脂质调控基因编码区的起始ATG上游至少50bp、至少100bp、至少120bp、至少150bp、至少200bp、至少250bp、至少300bp、至少350bp、至少400bp、至少450bp或至少500bp。供体DNA可包括可干扰原生启动子的序列,例如选择标记或任何方便序列。插入脂质调控开放阅读框的起始ATG上游(例如,脂质调控基因转录起始位点的5’UTR内或上游)的附加序列可降低或甚至消除内源脂质调控基因的表达。可选地或另外,原生脂质调控基因的内源性启动子可完全或部分被弱启动子或受不同调控的启动子或非启动子序列置换。
在一些实例中,引入宿主细胞中用于产生高效基因组编辑细胞系的核酸分子编码相对于相应野生型酶所突变成的cas9酶,使得突变cas9酶缺乏裂解含靶序列的靶多核苷酸的一条或两条链的能力。例如,来自酿脓葡萄球菌的Cas9的RuvC I催化结构域内的天冬氨酸取代为丙氨酸(D10A)使Cas9由裂解双链的核酸酶转化为切口酶(一种裂解单链的酶)。致使Cas9成为切口酶的突变的其它实例包括但不限于H840A、N854A和N863A。在一些实施方案中,Cas9切口酶可与向导序列,例如分别靶向DNA靶标的有义链和反义链的两个向导序列组合使用。这种组合允许切割双链并用于诱导NHEJ。可以使用两个切口酶靶标(紧密靠近但靶向DNA的不同链)诱导诱变NHEJ。这样使用错位裂解相反链的酶来靶向基因座也可减少非靶向裂解,因为必须精确特定地裂解双链才能实现基因组突变。
在另外的实例中,裂解DNA的能力受损的突变cas9酶可在细胞内表达,其中还引入了靶向靶基因转录或翻译起始位点上游的序列的一个或多个向导RNA。在这种情况下,cas酶可结合靶序列并阻断靶基因的转录(Qi等人(2013)Cell 152:1173-1183)。这种对基因表达的CRISPR干扰可称为RNAi并且在Larson等人(2013)Nat.Protoc.8:2180-2196中有详细描述。
在一些情况下,cas多肽如Cas9多肽为融合多肽,其包含,例如:i)Cas9多肽(可任选地为如上所述的变体Cas9多肽);和b)共价连接的异源多肽(也称为“融合配偶体”)。异源核酸序列可与另一核酸序列连接(例如,通过基因工程)以产生编码嵌合多肽的嵌合核苷酸序列。在一些实施方案中,通过使Cas9多肽与提供亚细胞定位的异源序列融合产生Cas9融合多肽(即,异源序列为亚细胞定位序列,例如用于靶向细胞核的核定位信号序列(NLS);用于靶向线粒体的线粒体定位信号序列;用于靶向叶绿体的叶绿体定位信号序列;ER滞留信号序列;等等)。在一些实施方案中,异源序列可提供标签(即,异源序列为可检测标记)以易于追踪和/或纯化(例如,荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;血凝素(HA)标签;FLAG标签;Myc标签;等等)。
可用例如载体构建体来基因工程改造(例如,转导或转化或转染)宿主细胞,载体构建体可以是,例如用于同源重组的包括与宿主细胞脂质调控基因座的一部分或与之相邻的区域同源的核酸序列的载体,或者可以是用于表达以下任一种或组合的表达载体:cas蛋白(例如,cas9蛋白)、CRISPR嵌合向导RNA、crRNA和/或tracrRNA、RNAi构建体(例如,shRNA)、反义RNA或核酶。所述载体可以例如呈质粒、病毒粒子、噬菌体等形式。还可以设计用于表达多肽或RNA以进行基因组编辑的载体用于(例如)通过同源重组整合到宿主中。含本文所描述的多核苷酸序列,例如与宿主脂质调控基因序列(包括脂质调控因子编码序列上游和下游的序列)具有同源性的序列,以及任选地,选择标记或报告基因的载体,可用于转化适当宿主以引起脂质调控基因的减弱。
在一些实例中,重组微生物的脂质调控基因的表达可降低但未消除,并且重组微生物的脂质产量可以例如从约25%增加到约200%或更多。如本文所提供的经基因修饰的微生物,在一些实例中可包括用于减弱脂质调控基因的表达的核酸构建体,所述脂质调控基因例如编码与SEQ ID NO:2或SEQ ID NO:5-18中的任一个具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的多肽的基因。例如,宿主微生物可包括用于表达RNAi分子、核酶或反义分子的构建体,其降低编码与SEQ ID NO:2或SEQ ID NO:5-18中的任一个具有至少55%同一性的多肽的脂质调控基因的表达。在一些实例中,如本文所提供的重组微生物可包括至少一个引入的(外源或非原生)构建体,用于降低脂质调控基因的表达。
在一些实例中,使用本领域已知的方法,例如RNA-Seq或反转录-PCR(RT-PCR),选择经工程改造的菌株用于表达相对于对照细胞降低但未消除的脂质调控基因,对照细胞不包括用于减弱脂质调控基因表达的基因修饰。
本文所提供的经基因工程改造的菌株可经工程改造为包括通过降低编码脂质调控因子的基因的mRNA的量、稳定性或可译性而减弱基因表达的构建体。例如,可使用本领域已知的方法,用靶向脂质调控基因的mRNA的反义RNA、RNAi或核酶构建体转化微生物如藻类或异鞭毛类菌株。例如,包括基因的整个或一部分转录区的反义RNA构建体可引入到微生物中以降低基因表达(Shroda等人(1999)The Plant Cell 11:1165-78;Ngiam等人(2000)Appl.Environ.Microbiol.66:775-782;Ohnuma等人(2009)Protoplasma 236:107-112;Lavaud等人(2012)PLoS One 7:e36806)。可选地或另外,靶向具有Zn(2)Cys(6)结构域的基因的RNAi构建体(例如,编码短发夹RNA的构建体)可引入到微生物如藻类或异鞭毛类中以降低脂质调控基因的表达(参见,例如Cerruti等人(2011)Eukaryotic Cell(2011)10:1164-1172;Shroda等人(2006)Curr.Genet.49:69-84)。
核酶是以位点特异性方式裂解核酸的RNA-蛋白质复合物。核酶具有有内切核酸酶活性的特异性催化结构域。例如,美国专利第5,354,855号报告称,某些核酶可充当内切核酸酶,其序列特异性比已知核糖核酸酶的序列特异性高并且接近DNA限制酶的序列特异性。催化RNA构建体(核酶)可设计成与编码本文所提供的基因的mRNA碱基配对以裂解mRNA靶标。在一些实例中,核酶序列可整合在反义RNA构建体内以介导靶标的裂解。可以考虑不同类型的核酶,其设计和用途在本领域中已知并且例如,在Haseloff等人(1988)Nature 334:585-591中有描述。
通过互补碱基对相互作用,依靠向位点的退火使核酶靶向指定序列。对于这种靶向而言需要两个同源段。这些同源序列段侧接以上定义的催化性核酶结构。每个同源序列段在长度上可在7至15个核苷酸间变化。定义同源序列的唯一要求是,在靶RNA上,它们被是裂解位点的特异性序列分开。对于锤头状核酶而言,裂解位点是二核苷酸序列,在靶RNA上为尿嘧啶(U),后面是腺嘌呤、胞嘧啶或尿嘧啶(A、C或U)(Thompson等人,(1995)Nucl AcidsRes 23:2250-68)。任何指定RNA中出现这种二核苷酸的频率在统计上为16个中有3个。因此,对于1,000碱基的指定靶信使RNA而言,187个二核苷酸裂解位点在统计上是可能的。
已经详细讨论了核酶定向RNA裂解活性的一般设计和优化(Haseloff和Gerlach(1988)Nature 334:585-591;Symons(1992)Ann Rev Biochem 61:641-71;Chowrira等人(1994)J Biol Chem269:25856-64;Thompson等人(1995)同上),其全部通过引用整体并入。设计和测试用于有效裂解靶RNA的核酶是本领域技术人员众所周知的过程。各自通过引用并入的Chowrira等人,(1994)同上及Lieber和Strauss(1995)Mol Cell Biol.15:540-51描述了设计和测试核酶的科学方法的实例。鉴定用于下调指定基因的操作性和优选序列是制备和测试指定序列的问题,并且是本领域技术人员已知的按常规实践的“筛选”方法。
在以上引用的文献中以及在例如US2005/0166289和WO2013/016267中描述了RNAi构建体的用途。通过RNAi构建体,例如RNAi短发夹(sh)构建体的表达使与靶基因具有同源性的双链RNA递送至细胞内或在细胞中产生。所述构建体可包括与靶基因相同,或与靶基因的序列至少70%、80%、90%、95%,或95%至100%相同的序列。所述构建体可具有至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1kb与靶基因同源的序列。可使用选择用于连续或诱导型表达RNAi构建体(例如产生shRNA的构建体)的启动子工程改造表达载体。
用于基因减弱的核酸构建体,例如核酶、RNAi或反义构建体可包括至少15个、至少20个、至少30个、至少40个、至少50个或至少60个与待工程改造的微生物的内源性脂质调控基因的一部分序列具有至少80%同一性,例如至少85%、至少90%、至少95%或至少99%互补性的核苷酸。用于基因减弱的核酸构建体,例如核酶、RNAi或反义构建体可包括至少15个、至少20个、至少30个、至少40个、至少50个或至少60个与自然存在的基因的序列具有至少80%,例如至少95%或约100%同一性或互补性的核苷酸,所述基因例如编码与内源性脂质调控基因具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%、至少90%或至少95%序列同一性的多肽的基因。例如,用于基因减弱的核酸构建体,例如核酶、RNAi或反义构建体可包括至少15个、至少20个、至少30个、至少40个、至少50个或至少60个与自然存在的脂质调控基因(例如本文提供的任一种)的序列具有至少80%同一性或互补性的核苷酸。所述核苷酸序列的可为,例如约30个核苷酸至约3千碱基或更多,例如,长度为30-50个核苷酸,长度为50至100个核苷酸,长度为100至500个核苷酸,长度为500个核苷酸至1kb,长度为1kb至2kb,或2至5kb。例如,反义序列长度可为约100个核苷酸至约1kb。例如,用于基因减弱的核酸构建体,例如核酶、RNAi或反义构建体可包括至少15个、至少20个、至少30个、至少40个、至少50个、至少60个或至少100个与内源性脂质调控基因或其一部分具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%或至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%或至少95%同一性或互补性的核苷酸。
反义、RNAi或核酶构建体中使用的启动子可以是在宿主生物中具功能性并且适于将靶基因的表达降低到预期量所需的表达水平的任何启动子。藻类和异鞭毛类中具功能性的启动子在本领域中已知并且在本文中公开。可使用任何可行方法,包括本文公开的任何方法,将构建体转化到藻类中。经用于减弱脂质调控基因表达的核酸分子(例如但不限于反义、RNAi或核酶构建体)转化的重组生物或微生物,可具有如本文描述的脂质调控突变体的性质,包括例如,相对于不包括引起基因表达减弱的外源核酸分子的宿主生物或微生物,叶绿素减少、光合效率提高及培养物中的产率增加。
在另外的实例中,例如本文实施例中公开的,降低但不消除靶基因表达的基因减弱可通过使用同源重组或CRISPR/Cas9基因组编辑实现,其中使供体片段靶向插入基因的非编码区内。例如,可通过使用适当的向导RNA使选择标记盒或其它供体片段靶向需要其表达降低的基因的5’UTR、3’UTR或内含子。因此,本发明的另一方面是一种减弱基因表达的方法,其包括将核酸片段插入到翻译起始位点上游或翻译终止位点下游的位点,其中所述基因的表达水平降低。作为非限制性实例,可向基因翻译起始位点上游长达2kb或基因终止密码子下游长达2kb的区域引入供体片段插入。例如,靶向翻译起始位点上游约5bp至2kb之间,或翻译起始位点上游约10bp至1.5kb之间,或翻译起始位点上游约10bp至约1.2kb之间,或翻译起始位点上游约20bp至约1kb之间的位点的插入。可选地或另外,可靶向基因的3’UTR插入。可选地或另外,靶向翻译终止位点(终止密码子)下游约5bp至2kb,或终止密码子下游约10bp至1.5kb,或终止密码子下游约10bp至约1.2kb,或终止密码子下游约20bp至约1kb的位点的插入。不受任何特定机理限制,此类插入可降低基因的转录速率或者可降低所得转录物的稳定性。
核酸分子和构建体
本文还提供了编码下述多肽的核酸分子,所述多肽包括与SEQ ID NO:2、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列。可选地或另外,本文所提供的核酸分子可包括与SEQ ID NO:1或SEQ IDNO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列。与选自SEQ ID NO:2和SEQ IDNO:5-17或由SEQ ID NO:1或SEQ ID NO:72-84中的任一个编码的氨基酸序列具有至少60%同一性的多肽可包括编码Zn(2)Cys(6)结构域,例如属于pfam PF00172的结构域的氨基酸序列。例如,由所述核酸分子编码的多肽可包括具有与SEQ ID NO:3具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列的Zn(2)Cys(6)结构域。可选地或另外,由本文所提供的核酸分子编码的多肽还可任选地包括PAS(或PAS3)结构域。例如,由本文所提供的核酸分子编码的多肽可包括与SEQ ID NO:21-SEQ ID NO:25中的任一个具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的PAS结构域。
在不同实例中的核酸分子可以是或包含缺乏在自然存在的基因中存在的一个或多个内含子,或可选地,可包括在自然存在的基因中不存在的一个或多个内含子的cDNA。在不同实例中的核酸分子可具有与自然存在的基因并非100%相同的序列。例如,核酸分子可包括相对于自然存在的基因,降低所编码的多肽的活性或降低该基因所编码的mRNA或蛋白质的表达的突变。
在不同实例中的核酸分子可包含与编码下述多肽的序列可操作连接的异源启动子,所述多肽包括与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列,和/或所述核酸分子可包含与下述序列可操作连接的异源启动子,所述序列与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。可选地或另外,核酸分子可包含包括编码下述多肽的序列的载体,所述多肽包括与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列和/或与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性。
本发明的另一方面是设计用于减弱编码Zn(2)Cys(6)DNA结合域多肽的表达的构建体。在不同实例中,所述构建体可以是或包含编码CRISPR系统的向导RNA的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体,例如具有与本文所公开的自然存在的Zn(2)Cys(6)结构域编码基因和/或由其得到所述基因的原生基因组中与之相邻的序列具有同源性的一个或多个核苷酸序列的构建体。例如,所述构建体可包括编码具有Zn(2)Cys(6)结构域的多肽的基因的至少一部分,例如与编码下述多肽的基因的至少一部分同源的序列,所述多肽包括与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列或者可包括与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的核酸序列的至少一部分。
用于基因减弱的构建体可包括,例如,编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的编码区的至少一部分,或与SEQ ID NO:1或SEQ ID NO:72-84中的任一个具有至少50%同一性的基因的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的内含子的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的5’UTR的至少一部分,编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的启动子区的至少一部分,和/或编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的3’UTR的至少一部分。在一些实例中,所述构建体可为RNAi、核酶或反义构建体并且可包括有义或反义方向上,来自编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的转录区的序列。
在另外的实例中,可设计构建体用于体外或体内表达向导RNA(例如,CRISPR系统的),所述向导RNA设计为靶向具有与SEQ ID NO:1或SEQ ID NO:72-84中的任一个的至少一部分具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的序列或编码具有Zn(2)Cys(6)结构域的多肽或与SEQID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因,并且所述构建体可包括与编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的一部分同源的序列,所述部分包括例如,编码具有Zn(2)Cys(6)结构域的多肽或与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的内含子、5’UTR、启动子区和/或3’UTR。在另外的实例中,用于减弱编码含Zn(2)Cys(6)结构域的多肽的基因表达的构建体可为向导RNA或反义寡核苷酸,其中在反义方向上,所述序列与编码具有Zn(2)Cys(6)结构域的多肽的基因的转录区具有同源性。
还提供了用于减弱Zn(2)Cys(6)基因或编码与SEQ ID NO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的表达的向导RNA,及编码此类向导RNA的DNA构建体。向导RNA可为嵌合或单向导RNA或可为包括tracr配偶序列(mate sequence)但需要附加tracr RNA才能实现基因组编辑的向导RNA。在不同实施方案中,本文提供了与SEQ IDNO:1或SEQ ID NO:72-84中的任一个的至少一部分具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的核酸分子,其中所述核酸分子编码CRISPR系统的向导RNA,作为非限制性实例,所述CRISPR系统可为Cas9/CRISPR系统或Cpf1CRISPR系统。所述核酸分子可包括,例如自然存在的Zn(2)Cys(6)基因,例如SEQ ID NO:1或SEQ ID NO:72-84中的任一个的序列的至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24或至少25个核苷酸。在示例性实施方案中,向导RNA或编码向导RNA的核酸序列可包括SEQ ID NO:51-62中的任一个或与其中任一个具有至少88%或93%同一性的序列。
另外,本文提供了反义、核酶或RNAi构建体,其包括编码Zn(2)Cys(6)或与SEQ IDNO:2和SEQ ID NO:5-17中的任一个具有至少60%同一性的多肽的基因的至少一部分,其中启动子,例如异源启动子,与Zn(2)Cys(6)基因序列可操作地连接并且Zn(2)Cys(6)基因序列为反义方向。
进一步地,本文提供了用于同源重组的构建体,其包括来自藻类基因组的Zn(2)Cys(6)基因座的至少一个序列,与在非限制性实例中可为选择标记或可检测标记基因的异源核酸序列并列。在一些实例中,用于同源重组的构建体包括两个来自藻类基因组的Zn(2)Cys(6)基因座的核酸序列,其中所述两个序列侧接用于插入Zn(2)Cys(6)基因座内的异源序列。
本领域的技术人员将认识到,许多转化方法均可用于微生物的基因转化,并且因此,可配置用于本发明的方法。“稳定转化”旨在意指引入生物体内的核酸构建体整合到生物体的基因组内或者是稳定附加型构建体的一部分并且能够被其后代遗传。“瞬时转化”旨在意指将多核苷酸引入生物体内而不整合到基因组内或以其它方式确立并且被连续世代稳定遗传。
基因转化可导致来自细胞核或质体的转基因、构建体的稳定插入和/或表达,并且在一些情况下可导致转基因的瞬时表达。所述转化方法也可用于引入向导RNA或编辑DNA。对于属于绿藻、红藻和褐藻、硅藻、眼虫藻(euglenid)和甲藻(dianoflagellate)的至少~22个种的30多种不同微藻菌株,已经报告微藻的基因转化成功(参见,例如Radakovits等人,Eukaryotic Cell,2010;和Gong等人,J.Ind.Microbiol.Biotechnol.,2011)。此类有用的转化方法的非限制性实例包括,例如Dunahay,Biotechniques,15(3):452-460,1993;Kindle,Proc.Natl.Acad.Sci.U.S.A.,1990;Michael和Miller,Plant J.,13,427-435,1998所报告的,在玻璃珠或碳化硅晶须的存在下搅动细胞。电穿孔技术已成功用于几个微藻种类的基因转化,包括微拟球藻属某种(参见例如,Chen等人,J.Phycol.,44:768-76,2008)、小球藻属某种(参见例如,Chen等人,Curr.Genet.,39:365-370,2001;Chow和Tung,Plant Cell Rep.第18卷,第9期,778-780,1999)、衣藻属某种(Shimogawara等人,Genetics,148:1821-1828,1998)、杜氏藻属某种(Sun等人,Mol.Biotechnol.,30(3):185-192,2005)。微弹轰击法,也称为微粒轰击法、基因枪转化法或基因枪轰击法,已成功用于几种藻类,包括例如硅藻类如褐指藻(Apt等人,Mol.Gen.Genet.,252:572-579,1996)、小环藻和舟形藻(Dunahay等人,J.Phycol.,31:1004-1012,1995)、细柱藻(Cylindrotheca)(Fischer等人,J.Phycol.,35:113-120,1999)和角毛藻类(Chaetoceros)(Miyagawa-Yamaguchi等人,Phycol.Res.59:113-119,2011),以及绿藻类例如小球藻(El-Sheekh,Biologia Plantarum,第42卷,第2期:209-216,1999)和团藻类(Jakobiak等人,Protist,155:381-93,2004)。另外,土壤杆菌(Agrobacterium)介导的基因转移技术也可用于微藻的基因转化,正如例如Kumar,Plant Sci.,166(3):731-738,2004和Cheney等人,J.Phycol.,第37卷,增刊11,2001所报告的那样。
本文所描述的转化载体或构建体通常将包含赋予靶宿主细胞,例如藻类细胞可选择或可取胜的表型的标记基因或者可与包括标记的构建体一起共同转化。已经成功开发了许多选择标记用于有效分离藻类的基因转化株。常见选择标记包括抗生素抗性、荧光标记和生物化学标记。几种不同的抗生素抗性基因已成功用于选择微藻转化株,包括灭瘟素(blastocydin)、博来霉素(bleomycin)(参见例如,Apt等人,1996,同上;Fischer等人,1999,同上,Fuhrmann等人,Plant J.,19,353-61,1999,Lumbreras等人,Plant J.,14(4):441-447,1998;Zaslavskaia等人,J.Phycol.,36:379-386,2000)、大观霉素(spectinomycin)(Cerutti等人,Genetics,145:97-110,1997;Doetsch等人,Curr.Genet.,39,49-60,2001;Fargo,Mol.Cell.Biol.,19:6980-90,1999)、链霉素(streptomycin)(Berthold等人,Protist,153:401-412,2002)、巴龙霉素(paromomycin)(Jakobiak等人,Protist,同上;Sizova等人,Gene,277:221-229,2001)、诺尔丝菌素(nourseothricin)(Zaslavskaia等人,2000,同上)、G418(Dunahay等人,1995,同上,Poulsen和Kroger,FEBSLett.,272:3413-3423,2005,Zaslavskaia等人,2000,同上)、潮霉素(Berthold等人,2002,同上)、氯霉素(chloramphenicol)(Poulsen和Kroger,2005,同上)及许多其它的。另外的用于微藻例如衣藻的选择标记可以是提供卡那霉素(kanamycin)抗性和阿米卡星(amikacin)抗性(Bateman,Mol.Gen.Genet.263:404-10,2000)、zeomycin和腐草霉素(phleomycin)(例如,ZEOCINTM腐草霉素D1)抗性(Stevens,Mol.Gen.Genet.251:23-30,1996)及巴龙霉素和新霉素(neomycin)抗性(Sizova等人,2001,同上)的标记。已经使用的其它荧光或显色标记包括荧光素酶(Falciatore等人,J.Mar.Biotechnol.,1:239-251,1999;Fuhrmann等人,Plant Mol.Biol.,2004;Jarvis和Brown,Curr.Genet.,19:317-322,1991)、β-葡糖醛酸酶(Chen等人,2001,同上;Cheney等人,2001,同上;Chow和Tung,1999,同上;El-Sheekh,1999,同上;Falciatore等人,1999,同上;Kubler等人,J.Mar.Biotechnol.,1:165-169,1994)、β-半乳糖苷酶(Gan等人,J.Appl.Phycol.,15:345-349,2003;Jiang等人,Plant Cell Rep.,21:1211-1216,2003;Qin等人,High Technol.Lett.,13:87-89,2003)和绿色荧光蛋白(GFP)(Cheney等人,2001,同上;Ender等人,Plant Cell,2002,Franklin等人,Plant J.,2002;56,148,210)。
本领域的技术人员将容易认识到可根据本发明为微藻类的转化系统有用地配置各种已知的启动子序列。例如,常用于驱动微藻中的转基因表达的启动子包括已经用于甲藻和绿藻(chlorophyta)中的花椰菜花叶病毒启动子35S(CaMV35S)的各种形式(Chow等人,Plant Cell Rep.,18:778-780,1999;Jarvis和Brown,Curr.Genet.,317-321,1991;Lohuis和Miller,Plant J.,13:427-435,1998)。还已报告来自猿猴病毒的SV40启动子在几种藻类中有活性(Gan等人,J.Appl.Phycol.,151345-349,2003;Qin等人,Hydrobiologia 398-399,469-472,1999)。来自衣藻的RBCS2(二磷酸核酮糖羧化酶,小亚基)(Fuhrmann等人,Plant J.,19:353-361,1999)和PsaD(光系统I复合物的丰富蛋白;Fischer和Rochaix,FEBSLett.581:5555-5560,2001)的启动子也可有用。HSP70A/RBCS2和HSP70A/β2TUB(微管蛋白)的融合启动子(Schroda等人,Plant J.,21:121-131,2000)也可用于提高转基因的表达,其中HSP70A启动子在置于其它启动子上游时可用作转录激活因子。在例如硅藻中,在编码硅藻岩藻黄质-叶绿素a/b结合蛋白的fcp基因(Falciatore等人,Mar.Biotechnol.,1:239-251,1999;Zaslavskaia等人,J.Phycol.36:379-386,2000)或编码黄绿藻紫黄质-叶绿素a/b结合蛋白的vcp基因(参见美国专利第8,318,482号)的启动子控制下,也可实现目标基因的高水平表达。如果需要这样,诱导型启动子可提供基因在转基因微藻中快速且受严格控制的表达。例如,编码硝酸还原酶的NR基因的启动子区可用作此类诱导型启动子。NR启动子活性通常受铵阻抑并且当用硝酸盐代替铵时受诱导(Poulsen和Kroger,FEBS Lett 272:3413-3423,2005),因此当微藻细胞在铵/硝酸盐的存在下生长时,可切断或开启基因表达。可用于本文公开的构建体和转化系统中的其它藻类启动子包括美国专利第8,883,993号;美国专利申请公布第US 2013/0023035号;美国专利申请公布第US 2013/0323780号;和美国专利申请公布第US 2014/0363892号中公开的那些。
宿主细胞可以是未转化细胞或已经用至少一个核酸分子转化的细胞。例如,经工程改造为脂质调控基因的表达减弱的藻类宿主细胞还可包括可赋予任何所需性状的一个或多个基因,所述形状例如但不限于目标生物分子,如一种或多种蛋白质、色素、醇或脂质的产量增加。
生成脂质的方法
本文还提供了通过培养本文所提供的突变微生物生成脂质的方法,所述突变微生物具有相对于对照细胞增加的脂质产率,同时生成在相同培养条件下对照细胞所生成的至少45%的生物质。所述方法包括在合适的培养基中培养本文所提供的突变微生物并且从培养物中回收生物质或至少一种脂质。在一些实例中,所述微生物可为藻类,并且培养物可为光合自养培养物。培养可以是分批、半连续或连续模式。
在一些实例中,可以在包含少于约5mM铵,例如少于约2.5mM铵、少于约2mM铵、少于约1.5mM铵、少于或等于约1mM铵或少于或等于约0.5mM铵的培养基中培养突变微生物。培养基可包括,例如约0至约2.5mM铵、约0.1至约2.5mM铵、约0.5至约2.5mM铵、约0至约1.5mM铵、约0.1至约1mM铵或约0.2至约1mM铵。可以在包括硝酸盐的培养基中培养微生物,在一些实例中培养基可以是培养基中基本上唯一的氮源或者可以在除了少于5mM铵、少于2.5mM铵、少于1.0mM铵或少于或等于约0.5mM铵以外存在。可选地或另外,培养基可包含尿素,在一些实例中尿素可以是培养基中基本上唯一的氮源。
本发明的再一方面是一种生成脂质的方法,其包括在微生物的FAME/TOC比率保持在约0.3和约0.8之间的条件下培养微生物,以及从所述微生物、培养基或两者中分离脂质。例如,可以培养所述微生物使得FAME/TOC比率保持在约0.3和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间,或约0.45和约0.55之间。所述比率可保持在约0.3和约0.8之间,例如在约0.4和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间,或约0.45和约0.55之间至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少15天、至少20天、至少30天或至少60天。在这些方法中,可以在连续或半连续条件下培养微生物。所述生成脂质的方法可包括在微生物的FAME/TOC比率保持在约0.3和约0.8之间,约0.3和约0.8之间,约0.4和约0.7之间,约0.4和约0.6之间或约0.45和约0.55之间的条件下培养突变微生物例如本文所提供的任一种。例如,所述微生物可以是编码下述多肽的基因的表达减弱的突变微生物,所述多肽与包含选自SEQ ID NO:2和SEQ IDNO:5-17的氨基酸序列的多肽具有至少55%、至少65%、至少75%或至少85%同一性。FAME/TOC比率可以例如受培养基中存在的氮源的类型和浓度调节。例如,所述方法可包括在包括硝酸盐和少于2.5mM铵或少于1.0mM铵的培养基中,培养微生物,例如本文所公开的突变微生物。
本文提供的方法中的培养条件优选为对照微生物(即,没有导致更高脂质产率的突变的微生物)每天生成生物质,例如至少5天、至少8天、至少10天或至少12天每天生成生物质的条件,并且在不同实施方案中所述生成脂质的方法引起突变微生物比对照微生物生成多至少50%的脂质,同时相对于对照微生物在生物质(例如,TOC)积聚上表现出不超过35%、30%、25%、20%、15%、10%、5%、2%或1%的降低。例如,所述生成脂质的方法可包括在合适的培养基中培养本文所提供的突变微生物以生成脂质并且从培养物中回收生物质或至少一种脂质,其中在突变微生物和对照微生物两者每天生成生物质的条件下,突变微生物比对照微生物生成多至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%、至少120%的脂质,同时生成对照微生物所生成的至少65%、70%、75%、880%、85%、90%、95%、98%或99%的生物质。在一些实例中,所述微生物可为藻类,并且培养物可为光合自养培养物。培养可以是分批、半连续或连续模式。
产脂微生物可在任何合适的容器内培养,包括烧瓶或生物反应器,在其中藻类可暴露于人造光或自然光(或补充了人造光的自然光)。包含对低光照的反应失去调节的突变藻类的培养物可在光/暗循环下培养,光/暗循环可以是,例如自然或编程的光/暗循环,并且作为说明性实例,可提供12小时光照与12小时黑暗,14小时光照与10小时黑暗,16小时光照与8小时黑暗等。
培养是指通过使用选定和/或受控条件,有意促进一个或多个细胞的生长(例如,细胞大小、细胞内容物和/或细胞活性的增加)和/或繁殖(例如,细胞数量经由有丝分裂增加)。生长和繁殖两者的组合可称为增殖。本文所提供的微生物可培养至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天或至少15天,或至少1周、2周、3周、4周、5周、6周、7周、8周、9周或10周,或更长时间。
可用于培养重组微生物的选定和/或受控条件的非限制性实例可包括使用限定的培养基(具有已知的特征如pH、离子强度和/或碳源)、指定温度、氧张力、二氧化碳水平、在生物反应器中的生长等或其组合。在一些实施方案中,可使用光照和还原碳源使微生物或宿主细胞兼养性生长。可选地,微生物或宿主细胞可光合自养性培养。光合自养性生长时,藻类菌株可有利地使用光照作为能源。无机碳源,如CO2或重碳酸盐可由微生物用于合成生物分子。如本文中所用,“无机碳”包括无法被生物体用作可持续能源的含碳化合物或分子。通常“无机碳”可呈CO2(二氧化碳)、碳酸、重碳酸盐、碳酸盐、碳酸氢盐等或其组合的形式,其无法被生物体进一步氧化用于可持续能量也无法用作还原力的来源。光合自养性生长的微生物可以在其中无机碳是基本上唯一的碳源的培养基上生长。例如,在其中无机碳是基本上唯一的碳源的培养基中,培养基中可提供的任何有机(还原)碳分子或有机碳化合物无法被细胞吸收和/或代谢用作能量和/或未以足以为细胞培养物的生长和增殖提供可持续能量的量存在。
根据本发明的方法可用的微生物和宿主细胞可在全世界不同地方和环境中找到。用于脂质和/或其它产物的最佳繁殖和产生的特定生长培养基可以不同并且可优化以促进产物如脂质、蛋白质、色素、抗氧化剂等的生长、繁殖或生成。在一些情况下,由于存在一些抑制性组分或缺乏特定微生物菌株或宿主细胞的一些必需营养需求,某些微生物菌株可能无法在特定生长培养基中生长。
固体和液体生长培养基通常可从各种来源获得,正如制备适于各种微生物菌株的特定培养基的说明书一样。例如,各种新鲜的水和盐水培养基可包括Barsanti(2005)Algae:Anatomy,Biochemistry&Biotechnology,CRC Press for media and methods forculturing algae中描述的那些。藻类培养基配方也可在各个藻类培养物保藏所的网站上找到,作为非限制性实例,包括UTEX Culture Collection of Algae(www.sbs.utexas.edu/utex/media.aspx);Culture Collection of Algae and Protozoa(www.ccap.ac.uk);及Katedra Botaniky(botany.natur.cuni.cz/algo/caup-media.html)。
培养方法可任选地包括诱导一个或多个基因表达和/或调控微生物中的代谢途径。诱导表达可包括向培养物中添加营养素或化合物,从培养基中去除一种或多种组分,增加或降低光照和/或温度,和/或促进目标基因表达的其它操纵。此类操纵很大程度上可取决于与目标基因可操作连接的(异源)启动子的特性。
在本发明的一些实施方案中,脂质产率增加的微生物可在装备有人造光源和/或具有对光(包括阳光)足够透明的一个或多个壁的“光生物反应器”中培养,以实现、促进和/保持可接受的微生物生长和增殖。为了生成脂肪酸产物或甘油三酯,光合微生物或宿主细胞可另外或可选地在摇瓶、试管、小瓶、微量滴定盘、皮氏培养皿(petri dishes)等或其组合中培养。
另外或可选地,突变或重组光合微生物或宿主细胞可在水池、导管、海基型生长容器、沟渠、水管、通道等或其组合中生长。在此类系统中,可以不调节温度,或者可采用各种加热或冷却方法或装置。如同标准生物反应器一样,可向培养物中供给无机碳源(例如但不限于,CO2、重碳酸盐、碳酸盐等),包括但不限于空气、富含CO2的空气、废气等或其组合。供给除CO2以外还可含有CO的废气和/或其它无机物来源时,可能必须预处理此类来源,使得引入(光)生物反应器的CO水平对于微生物的生长、增殖和/或存活不会构成危险和/或致死剂量。
突变微生物可包括编码多肽的一个或多个非原生基因以生成产物,例如但不限于脂质。
所述方法包括培养本文所提供的突变微生物,例如本文所提供的相对于对照细胞而言脂质产率增加,同时生成对照细胞在相同培养条件下所生成的至少50%的生物质的突变微生物以生成生物质或脂质。可通过本领域的普通技术人员已知的回收方式,例如使用有机溶剂,通过全培养物提取或通过首先分离从中提取脂质的生物质来从培养物中回收脂质(参见例如,Hussein等人Appl.Biochem.Biotechnol.175:3048-3057;Grima等人(2003)Biotechnol.Advances 20:491-515)。在一些情况下,可通过细胞匀化提高脂肪酸产物的回收(Gunerken等人(2015)Biotechnol.Advances 33:243-260)。例如,可通过在高温和/或高压下用溶剂进行藻类提取,从藻类中分离脂质例如脂肪酸、脂肪酸衍生物和/或甘油三酯,正如2012年2月29日提交的标题为“Solvent Extraction of Products from Algae”的共同代决、共同转让的美国专利申请第13/407,817号中所描述的,其通过引用整体并入本文。
例如可通过离心或过滤收获生物质。生物质可干燥和/或冷冻。其它产物可与生物质分离,例如,各种脂质或一种或多种蛋白质。本发明还包括藻类生物质,其包含脂质调控突变体的生物质,所述突变体例如本文所公开的任一种,例如但不限于在编码与包含选自SEQ ID NO:2和SEQ ID NO:5-17的氨基酸序列的多肽具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同一性的多肽的基因中包括突变的脂质调控突变体。
附加实施方案
可选地或除前述任一实施方案外,本发明还提供了以下实施方案:
实施方案1是一种突变微生物,其生成比在对照微生物生成生物质的基本上相同的条件下培养的对照微生物所生成的多至少25%的脂质和多至少45%的生物质,任选地其中满足以下的任一项或多项:
(a)所述对照微生物为野生型微生物;
(b)在至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天、至少15天、至少20天、至少30天或至少60天的培养期内,所述突变微生物生成多达至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%的生物质,这可以按照每天的平均生物质(例如,TOC)产率进行评估;
(c)在至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天、至少13天、至少14天、至少15天、至少20天、至少30天或至少60天的培养期内,所述突变微生物生成比对照微生物所生成的多至少25%、至少30%、至少55%、至少40%、至少45%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%、至少115%、至少120%、至少150%的脂质,或多至少200%的脂质,这可以按照每天的平均脂质(例如,FAME)产率进行评估;
(d)所述对照微生物生成生物质的基本上相同的条件包括含少于约5mM、少于约4mM、少于约3mM、少于2.5mM铵、少于2mM铵、少于1.5mM铵、少于或等于约1mM铵或少于或等于约0.5mM铵的培养基;
(e)所述对照微生物生成生物质的基本上相同的条件包括含硝酸盐或尿素的培养基;和/或
(f)所述微生物为异鞭毛类或藻类。
实施方案2是根据实施方案1所述的突变微生物,其中突变体具有减弱的调控基因的表达,其中所述调控基因编码与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的多肽和/或所述调控基因编码包括Zn(2)Cys(6)结构域的多肽,任选地其中所述多肽还包括PAS3结构域。
实施方案3是根据实施方案1或实施方案2所述的突变微生物,其中所述突变体为自发突变体、传统来源的突变体或经工程改造的突变体,任选地其中所述突变是经工程改造的突变体,其:
(a)具有被破坏的基因,任选地所述基因在非编码区被破坏;
(b)缺失整个或一部分基因;
(c)包括靶向基因的反义构建体、RNAi构建体或核酶构建体;
(d)包括插入,任选地其中所述插入通过CRISPR/cas基因组编辑所产生;和/或
(e)包括通过CRISPR/cas基因组编辑所产生的突变。
实施方案4是根据实施方案1-3中任一项所述的突变微生物,其中:
(a)在对照和突变微生物两者均生成生物质的条件下培养时,所述突变体生成多至少50%或至少80%或至少100%的FAME(例如,每天的平均产率),同时生成对照细胞所生成的至少85%或至少90%或至少95%的TOC,例如每天的TOC产率;和/或
(b)在对照和突变微生物两者均生成生物质的条件下培养时,所述突变微生物的FAME/TOC比率比对照微生物的FAME/TOC高至少40%、至少50%、至少60%、至少70%或至少75%,同时生成对照细胞(例如野生型细胞)所生成的至少85%或至少90%的TOC;和/或
(c)在对照和突变微生物两者均生成生物质的条件下培养时,所述突变微生物的FAME/TOC比率为至少0.30、至少0.35、至少0.40、至少0.5或介于约0.3和约0.8之间;和/或
(d)其中对于至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、至少11天、至少12天或至少13天的培养期,FAME/TOC比率保持在约0.3和约0.7之间,在培养期间所述突变微生物生成在对照微生物积聚生物质的相同条件下培养的对照微生物所生成的至少50%、至少60%、至少70%或至少75%、至少80%或至少85%的生物质。
实施方案6是根据实施方案1-3中任一项所述的突变微生物,其中:
(a)在野生型和突变微生物两者均生成生物质的条件下培养时,所述突变体生成多至少85%、至少90%、至少95%、至少100%、至少105%、至少110%或至少115%的FAME(例如,按每天的平均数计),同时生成对照微生物(例如野生型细胞)所生成的(例如,按每天的平均数计)至少70%、至少75%、至少80%或至少85%的TOC;和/或
(b)在野生型和突变微生物两者均生成生物质的条件下培养时,所述突变微生物的FAME/TOC比率比对照微生物的FAME/TOC比率高至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、至少160%、至少170%或至少180%;和/或
(c)在野生型积聚生物质的条件下培养时,所述突变微生物的FAME/TOC比率为至少0.50、至少0.55、至少0.60、至少0.65、至少0.70或至少0.75并且所述突变微生物生成对照微生物所生成的至少70%、至少75%、至少80%或至少85%的TOC。
实施方案7是根据实施方案1-6中任一项所述的突变微生物,其中:
(a)突变微生物生成更多脂质的培养条件为分批、半连续或连续培养;和/或
(b)整个培养期内突变体的脂质日产率比对照微生物的脂质日产率高。
实施方案8是根据实施方案1-7中任一项所述的突变微生物,其中所述突变微生物在基因的非编码区内包含降低基因表达的突变,任选地其中所述突变为插入。
实施方案9是根据实施方案1-7中任一项所述的突变微生物,其中所述突变微生物包含降低基因表达的构建体,其中所述构建体编码RNAi、反义转录物或核酶。
实施方案10是根据实施方案1-9中任一项所述的突变微生物,其中所述突变微生物为网粘菌类,
(a)任选地其中所述突变微生物是属于以下任一属的种:网粘菌属、类网粘菌属、破囊壶菌属、裂殖壶菌属、不动壶菌属、橙黄壶菌属、椭圆壶菌属、日本壶菌属、戴普罗弗菌属或吾肯氏壶菌属;
或其中所述突变微生物为藻类,
(b)任选地属于以下任一属的种:曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、波利氏藻属、包特氏藻属、气球藻属、葡萄藻属、片球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、长绿梭藻属、小球藻属、蓝隐藻属、金球藻属、球隹丐板藻属、隐甲藻属、隐藻属、小环藻属、链带藻属、杜氏藻属、后棘藻属、圆石藻属、独球藻属、衣迪斯藻属、眼虫藻属、真眼点藻属、披剌藻属、脆杆藻属、拟脆杆藻属、丽丝藻属、红球藻属、菱板藻属、异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微星藻属、蒜头藻属、单针藻属、微球藻属、微拟球藻属、舟形藻属、新绿藻属、肾鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、虫毛球藻属、拟小球藻属、雪衣藻属、杜氏亚属盐藻属、巴夫藻属、普莱格门、褐指藻属、菌体属、微微型绿藻属、扁藻属、颗石藻属、肋球藻属、原壁菌属、拟绿球藻属、拟新绿藻属、拟角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、裂衣藻属、骨条藻属、水绵藻属、裂丝藻属、四球藻属、扁藻属、海链藻属、黄丝藻属、无隔藻属、鲜绿球藻属、魏氏藻属和团藻属。
实施方案11是构成根据实施方案1-10中任一项所述的突变微生物的生物质。
实施方案12是一种核酸分子,其包含编码与SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的多肽的序列;
其中满足以下任一项或多项:
(a)所述多肽包括编码Zn(2)Cys(6)结构域的氨基酸序列,任选地其中所述Zn(2)Cys(6)结构域与SEQ ID NO:3具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性;所述多肽包括编码PAS结构域的氨基酸序列,任选地其中所述PAS结构域与SEQ ID NO:21-SEQ ID NO:25中的任一个具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性;
(b)在不同实例中所述核酸分子包含缺乏在自然存在的基因中存在的一个或多个内含子的cDNA或者是包括在自然存在的基因中不存在的一个或多个内含子的基因构建体;
(c)在不同实例中所述核酸分子可具有并非与自然存在的基因100%相同的序列;
(d)所述核酸分子与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性;
(e)所述核酸分子包含与所述序列可操作连接的异源启动子;和/或
(f)所述核酸分子包含载体。
实施方案13是一种用于减弱编码下述多肽的基因的表达的核酸分子构建体,所述多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性;
编码CRISPR系统的向导RNA的序列、RNAi构建体、反义构建体、核酶构建体,或用于同源重组的构建体,例如具有与本文所公开的自然存在的编码Zn(2)Cys(6)结构域的基因具有同源性的一个或多个核苷酸序列和/或在由其得到所述基因的原生基因组中与之相邻的序列的构建体。
实施方案14是向微生物中工程改造细胞以增加脂质产量以产生比祖代微生物具有更高的脂质产率的突变微生物的方法,其包括减弱编码下述多肽的基因的表达,所述多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16或SEQ ID NO:17具有至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性,所述基因任选为编码下述多肽的基因,所述多肽具有与SEQ ID NO:21-25中的任一个具有至少55%、至少60%、至少65%、至少70%或至少75%、至少80%、至少85%、至少90%或至少95%同一性的氨基酸序列,任选地其中减弱所述基因的表达包括向微生物中引入根据实施方案13所述的核酸分子。
实施方案15是生成脂质的方法,其包括培养根据实施方案1-10中任一项所述的突变体以生成脂质,任选地其中满足以下任一项或多项:
(a)培养基包括硝酸盐或尿素;
(b)培养基包括少于5mM、少于4mM、少于3mM、少于2.5mM铵、少于2mM铵、少于或等于约1.5mM铵、少于或等于约1mM铵或少于或等于约0.5mM铵;
(c)培养为分批、半连续或连续培养;
(d)培养期为至少5、7、8、9、10、11、12、13天,至少15、20、30、40、50或60天;
(e)所述突变体为藻类突变体并且所述培养物为光合自养型;
(f)所述突变体在培养期间生成多至少25%的脂质,例如多至少50%的脂质,优选FAME脂质,和对照微生物的至少65%的生物质;
(g)所述突变体在培养期的每一天生成更多脂质,优选FAME脂质;和/或
(h)所述突变体在培养期的每一天积聚生物质。
实施方案16是生成脂质的方法,其包括在整个培养期内FAME/TOC比率保持在约0.3和约0.8之间的条件下培养微生物,任选地其中满足以下任一项或多项:
(a)培养基包括硝酸盐或尿素;
(b)培养基包括少于5mM、少于4mM、少于3mM、少于2.5mM铵、少于2mM铵、少于或等于约1.5mM铵、少于或等于约1mM铵或少于或等于约0.5mM铵;
(c)培养为分批、半连续或连续培养;
(d)培养期为至少5、7、8、9、10、11、12、13天,至少15、20、30、40、50或60天;
(e)所述微生物为藻类微生物并且所述培养物为光合自养型;
(f)所述微生物在培养期的每一天积聚生物质;和/或
(g)所述微生物是根据实施方案1-1中任一项所述的突变微生物。
实施例
实施例中所用的培养基
实施例中使用以下培养基。
PM066培养基(实施例1)包括8.8mM作为唯一氮源的硝酸盐。PM066培养基包括10mM硝酸盐(NO3)和0.417mM磷酸盐(PO4)连同速溶海盐中的微量金属和维生素。通过将5.71ml的1.75M NaNO3储备溶液(148.7g/L)和5.41ml的77mM K2HPO4·3H2O储备溶液(17.57g/L)连同4ml螯合金属储备溶液和4ml维生素储备溶液一起添加到981ml的速溶海盐溶液(35g/L)中制成PM066培养基。通过向400ml水中添加2.18g Na2EDTA·2H2O、1.575g FeCl3·6H2O、500μl的39.2mM储备溶液(0.98g/100ml)CuSO4·5H2O、500μl的77.5mM储备溶液(2.23g/100ml)ZnSO4·7H2O、500μl的42.0mM储备溶液(1.00g/100ml)CoCl2·6H2O、500μl的910.0mM储备溶液(18.0/100ml)MnCl2·4H2O、500μ1的26.0mM储备溶液(0.63g/100ml)Na2MoO4·2H2O,使得达到500ml最终体积,并过滤灭菌制备螯合金属储备溶液。通过向400ml水中添加0.05g硫胺HC1、500μ1的0.37mM氰钴胺储备溶液(0.05g/100ml)和2.5ml的0.41mM生物素储备溶液(0.01g/100ml),使得达到500ml最终体积,并过滤灭菌制备维生素储备溶液。
PM067培养基不包括氮源(无硝酸盐、铵或尿素)和0.417mM磷酸盐(PO4)连同速溶海盐中的微量金属和维生素。通过将5.41ml的77mM K2HPO4 3H2O储备溶液(17.57g/L)连同4ml螯合金属储备溶液和4ml维生素储备溶液一起添加到987ml的速溶海盐溶液(35g/L)中制成PM067培养基。通过向400ml水中添加2.18g Na2EDTA·2H2O、1.575g FeCl3·6H2O、500μl的39.2mM储备溶液(0.98g/100ml)CuSO45H2O、500μl的77.5mM储备溶液(2.23g/100ml)ZnSO4·7H2O、500μl的42.0mM储备溶液(1.00g/100ml)CoCl2·6H2O、500μl的910.0mM储备溶液(18.0/100ml)MnCl2·4H2O、500μ1的26.0mM储备溶液(0.63g/100ml)Na2MoO4·2H2O,使得达到500ml最终体积,并过滤灭菌制备螯合金属储备溶液。通过向400ml水中添加0.05g硫胺HC1、500μ1的0.37mM氰钴胺储备溶液(0.05g/100ml)和2.5ml的0.41mM生物素储备溶液(0.01g/100ml),使得达到500ml最终体积,并过滤灭菌制备维生素储备溶液。
PM074是氮充足(“仅含氮”)的培养基(包括作为基本上唯一的氮源的硝酸盐),其是通过向最终体积1升的速溶海盐溶液(35g/L)(Aquatic Eco Systems,Apopka,FL)中添加1.3mlF/2藻类饲料部分A(Aquatic Eco-Systems)和1.3mlF/2藻类饲料部分B(Aquatic Eco-Systems)制成的10X F/2。Proline A和Proline B一起包括8.8mM NaNO3、0.361mM NaH2PO4.H2O、10X F/2微量金属和10X F/2维生素(Guillard(1975)Culture of phytoplankton for feeding marine invertebrates,于“Culture ofMarine Invertebrate Animals.”(编辑:Smith W.L.和Chanley M.H.)Plenum Press,NewYork,USA.第26-60页中)。
PM123培养基是补充了额外Proline B的PM074培养基,使得硝酸盐的浓度从大约8.8mM增加到大约15mM。这也是“仅含硝酸盐”的培养基。
PM124培养基是补充了5mM铵和10mM HEPES pH 8.0的PM074。其是通过向PM074配方中添加10ml的1M HEPES pH 8和5ml的NH4C1制成的(最终体积为1L)。在一些实例中,通过调节PM074的铵浓度并添加额外Hepes缓冲液制成具有受控铵水平的额外培养基。
PM125培养基(实施例5):包括7.5mM作为细胞可用的唯一氮源的尿素。向1x速溶海盐中添加(同时混合):3.75ml 2M尿素储备溶液、0.32ml 1M NaH2PO4储备溶液、4ml螯合金属储备溶液和4ml维生素储备溶液(见上文)。通过≤0.1μM过滤器为该培养基过滤灭菌并储存在室温下。
实施例1.
鉴定在氮饥饿期间下调的锌-Cys结构域多肽。
各种微拟球藻菌株在氮剥夺期间积聚高水平的三酰基甘油(TAG)储存脂质并且已经报道了TAG产量增加之间的相关性及TAG积聚与不同代谢途径中导致TAG合成的基因表达上假定的根本变化之间的相关性(Radakovits等人(2012)Nat Commun 3:686;Li等人(2014)The Plant Cell 26:1645-1665;Corteggiani Carpinelli等人(2014)Mol Plant7:1645-1665)。为鉴定编码影响脂质生物合成和积聚的调控因子的基因,分析了经受N-剥夺(-N)的微拟球藻细胞的早期转录反应。进行对比转录组学实验,其中将氮饥饿下(期间微拟球藻诱导储存脂质生物合成)加的斯微拟球藻细胞基因的RNA转录物水平与在除生长培养基中的氮量无限制外的相同条件下生长的相同加的斯微拟球藻菌株的RNA转录物水平做比较。
野生型加的斯微拟球藻(WT-3730)细胞在营养充足的培养基上在达到光照限制(O.D.为1.25)的16小时光照(120μE)/8小时黑暗循环下生长并且在光周期开始时离心并重新悬浮在氮充足的培养基PM066或缺乏氮源的培养基(“氮贫化”或“-N”培养基PM067)中并且在提供的光照条件下孵育。细胞重新悬浮在氮充足(+N)或氮贫化的(-N)培养基中之后,从在不同时间间隔取出的样品中分离RNA。由整个测定期间所取的样品测定脂质积聚量。脂质积聚量(如实施例4中所述,按FAME测量)在3小时时间点的氮贫化和氮充足培养物之间不能区别,但在10小时氮贫化培养物中的FAME积聚量是氮充足培养物中的FAME积聚量的两倍(图1A)。在三次生物学重复中进行处理。在转录变化应先于代谢变化的假设下,选择3小时时间点进行mRNA测序。对每次处理的两份样品进行测序。
通过离心各10mL的藻类细胞培养物(4000xg,5分钟)并轻轻倒出上清液来分离RNA。使团块重新悬浮在1.8mL缓冲液A中(5mL TLE研磨缓冲液、5mL苯酚、1mL 1-溴-3-氯丙烷和20μL巯基乙醇,其中TLE研磨缓冲液包括9mL的1M Tris pH 8、5mL的10%SDS、0.6mL的7.5M LiCl和450μl的0.5M EDTA,最终体积为50mL)并转移到2mL装有大约0.5mL的200μm锆珠的微量离心管中。在4℃下用力涡旋该管5分钟,然后在11.8x g下离心2分钟。然后去除水层并吸移到新的2mL管中,向其中添加1mL 25:24:1苯酚萃取缓冲液(25mL苯酚pH 8.1;24mL1-溴-3-氯丙烷和1mL异戊醇)。用力振荡该管并在11.8x g下离心2分钟。离心后,去除水层并吸移到新的2mL管中,向其中添加1ml 1-溴-3-氯丙烷。振荡该管并在11.8x g下再次离心2分钟。将水层移至新管中并添加0.356体积的7.5M LiCl。将管倒置10-12次并储存在-20℃下过夜。第二天,使样品达到室温,无需混合并且在16,000x g下离心30分钟。去除上清液并用1mL冰冷的80%乙醇洗涤团块。在16,000x g下离心该管30分钟并在去除上清液之后使其风干。最后,使RNA团块重新悬浮在50μl超纯水中。使用Agilent 2100生物分析仪和RNA6000LabChip根据生产商说明,通过芯片级凝胶电泳评估RNA质量。
利用TruSeq Stranded mRNA Sample Prep试剂盒(Illumina,San Diego,CA),按照生产商说明由分离的RNA制备新一代测序文库。使用合成测序法(Illumina MiSeq)为TruSeq文库测序以使用mRNA-Seq程序(在Mortazavi等人(2008)Nature Methods 5:621-628中有描述)生成100bp配对末端读序(reads)。使用TopHat(tophat.cbcb.umd.edu/)将可映射读序与加的斯微拟球藻参考基因组序列进行比对。使用Cufflinks软件的Cuffdiff组件(cufflinks.cbcb.umd.edu)为每个标注基因计算表达水平。在Trapnell等人(2012)Nature Protocols 7:562-578中描述了TopHat和Cufflinks。使用R package edgeR进行差异性表达分析(McCarthy等人(2012)Nucl.Acids Res.40:doi:10/1093/nar/gks042))。对于每份样品中的每个基因而言使用标准参数报告表达水平,单位为片段/千碱基/百万个(FPKM)。FPKM是对相对转录水平的度量,其对于转录物长度的差异归一化。
在3小时时对-N和+N培养物转录组的全局分析揭示1064个差异表达基因在表达上具有大于1倍的差异且错误发现率(FDR)小于0.01。在图1B的图中将这些基因描绘为点和X。这些基因中,在-N条件下363个上调(图右侧)和701个下调(图左侧)。将差异表达基因的列表与假定微拟球藻转录因子的生物信息学编排列表做比较,后者是先前使用植物转录因子数据库作为参考,通过利用含有DNA结合域和经表征的转录因子典型的其它保守性pfam结构域的蛋白质的微拟球藻基因组而生成的(Perez-Rodriguez等人(2010)Nucl.AcidsRes.38:D822-D827;Jin等人(2013)Nucl.Acids Res.42:D1182-D1187)。我们发现图1B中表示为X且在表1中列出,仅在下调转录因子组中表示的20个转录因子。在3小时时间点未发现转录因子上调。加的斯微拟球藻基因标识基于Corteggiani Carpinelli等人,Mol Plant7,323-335(2014)中描述的基因组序列。
表1.Cas9靶向敲除的转录因子
FDR,错误发现率
Y,成功插入选择盒;
N,正如通过PCR基因分型测定,未成功插入
实施例2
微拟球藻中转录因子基因的敲除
通过在微拟球藻中开发高效Cas9表达编辑系,靶向发现在氮剥夺下受差异性调节的全部20个转录因子基因(表1)进行插入敲除诱变(参见2015年12月31日提交的WO 2016/109840和相应的美国申请案14/986,492,其通过引用整体并入本文)。如US 14/986,492中所描述,表达编码酿脓葡萄球菌Cas9核酸酶的基因的高效微拟球藻Cas9编辑系,即加的斯微拟球藻菌株GE-6791,用作用嵌合向导RNA和供体DNA转化的宿主进行插入敲除。
为产生高效微拟球藻Cas9编辑系,工程改造微拟球藻菌株并且在生长培养物基本上100%的细胞群中分离表现出引入的cas9基因表达的微拟球藻菌株。用于转化野生型加的斯微拟球藻菌株WT-3730的载体pSGE-6206(图2;SEQ ID NO:26)包括以下三个元件:1)Cas9表达盒,其含有来自酿脓葡萄球菌的对于加的斯微拟球藻(SEQ ID NO:27)密码子优化,还包括编码N端FLAG标签(SEQ ID NO:28)、核定位信号序列(SEQ ID NO:29)和肽接头(整个FLAG、NLS和如SEQ ID NO:30所提供的接头序列),受加的斯微拟球藻RPL24启动子(SEQ ID NO:31)驱动并且末端为加的斯微拟球藻双向终止子2或“FRD”终止子(SEQ ID NO:32)的Cas9基因;2)选择标记表达盒,其含有来自土曲霉(Aspergillus terreus)的对于加的斯微拟球藻(SEQ ID NO:33)密码子优化,受加的斯微拟球藻TCTP启动子(SEQ ID NO:34)驱动并且后面是EIF3终止子(SEQ ID NO:35)的杀稻瘟菌素脱氨酶(“blast”或“BSD”)基因;和3)GFP报告因子表达盒,其含有对于加的斯微拟球藻(SEQ ID NO:36)密码子优化,受加的斯微拟球藻4A-III启动子(SEQ ID NO:37)驱动并且后面是加的斯微拟球藻双向终止子5或“GNPDA”终止子(SEQ ID NO:38)的TurboGFP基因(Evrogen,Moscow,Russia)。根据GibsonHiFi 1Step试剂盒(Synthetic Genomics,La Jolla,CA)将Cas9表达构建体组装到最小pUC载体骨架中,该质粒经确认的DNA序列如SEQ ID NO:26所提供。
通过电穿孔将ZraI线性化Cas9表达构建体(图3A)转化到微拟球藻细胞中。在0.2cm小杯中使用以Gene Pulser II(Biorad,Carlsbad,CA,USA)输送的7,000V/cm场强转化1x 109个细胞。将转化混合物平板接种到含有100mg/L杀稻瘟菌素的PM074琼脂培养基中。将所得集落贴补到选择培养基上进行分析和归档。从斑点上取少量生物质并完全重新悬浮在300μl的1x速溶海盐溶液(Aquatic Eco Systems;Apopka,FL)中。注意不要添加太多生物质,以致获得浅绿色重悬浮液。使用BD Accuri C6流式细胞仪通过流式细胞术直接分析该悬浮液,使用488nm激光和530/10nm滤波器测量每个细胞的GFP荧光。使用缓慢流体学设置为每份样品记录10,000-30,000个事件。单个荧光峰转移到高于野生型细胞所展示(图3B)的荧光水平并且使用抗FLAG抗体(Sigma#A9469)通过蛋白质印迹法展示出cas9蛋白质表达(图3C)的菌株(命名为菌株GE-6791),被选择作为cas9编辑菌株并且通过本文所描述的cas9/CRISPR基因组编辑用于产生突变体。发现Ng-Cas9编辑系在FAME和TOC产率上与野生型等效(参见例如图18)。
在Ng-Cas9编辑系中产生靶向插入突变体
在Cas9编辑系中,发现在氮饥饿下下调的20个经鉴定的转录因子(表1)全部被靶向敲除。向导RNA(用于敲除23个转录因子中的每一个的靶序列,参见表2)根据(Cho等人(2013)Nature Biotechnol.31:230-232)在体外合成并且在实施例3中有描述,并且与PCR扩增的表达盒(pHygR,SEQ ID NO:45)共同电穿孔,所述表达盒含有受内源EIF3_启动子(SEQ ID NO:46)驱动并且后面是反方向的加的斯微拟球藻NADH依赖性富马酸还原酶双向终止子(SEQ ID NO:32)的密码子优化潮霉素抗性基因(HygR,SEQ ID NO:44)。向小杯中添加各自大约1μg的靶向特定转录因子的向导RNA和pHygR供体片段(图4A)并且如上所述进行电穿孔。一般而言,通过选择前一半外显子编码序列中的向导RNA靶基因座来产生失去功能的“敲除”突变体。HygR转化株的选择同上,除了向琼脂板添加500mg/L潮霉素代替杀稻瘟菌素外。通过NHEJ介导修复向导RNA所靶向的基因座中受Cas9催化的双链DNA断裂进行的pHygR片段的靶向插入,使用任一侧上侧接向导RNA靶位点~200bp的引物通过集落PCR进行评估(表3)。使用这些引物,PCR扩增野生型基因座将产生~400bp产物,而pHygR靶向插入突变体将产生~2800bp产物—说明插入了2400bp pHygR片段。对于所有突变体而言PCR产物经序列确认,允许确定插入方向和检测染色体和/或插入DNA的任何损失,或NHEJ介导的dsDNA断裂修复过程中产生的小插入物的获得(插入过程及示例性集落PCR结果的图解,参见图4B和图4C)。
通过PCR基因分型确认,20个靶向转录因子(表1)中有18个在预期基因座处被破坏。基于观察到的高总体编辑效率,可能剩余的2个基因座对于活力而言是必需的。为检验敲除对脂质诱导的影响,如下面实施例4中所详细描述的,通过评估7天培养的多个时间点的FAME和TOC水平,针对脂质和生物质产率筛选每个基因座两个独立突变体。
表2.用于Cas9介导的诱变的向导RNA序列和筛选引物
表3.用于Cas9介导的诱变的筛选引物
实施例3
ZnCys-2845敲除突变体
通过首先制备用于产生向导RNA的DNA构建体来靶向破坏ZnCys-2845基因(Naga_100104gl8,表1第2行),其中所述构建体包括T7启动子下游经工程改造的嵌合向导序列。嵌合向导序列包括与就在酿脓葡萄球菌cas9PAM序列(NGG)上游的ZnCys-2845基因序列内的序列同源的18bp靶序列(SEQ ID NO:39),并且还包括反式激活CRISPR(tracr)序列。通过首先制备由包括T7启动子序列(SEQ ID N0:40和SEQ ID NO:41,由SGI-DNA,La Jolla,CA制备)的互补DNA寡核苷酸构成的DNA模板来合成嵌合向导序列,互补DNA寡核苷酸并入了T7启动子序列并且退火以产生双链DNA模板,使用MEGAshortscriptTMT7试剂盒(LifeTechnologies#AM1354M)根据生产商的说明将双链DNA模板用于体外转录反应中以合成向导RNA。使用Zymo-SpinTMV-E柱(Zymo Research#C1024-25)根据生产商的方案纯化所得RNA。
用于插入靶向ZnCys-2845基因座(SEQ ID NO:44)的供体片段包括选择标记盒,其包括在加的斯微拟球藻EIF3启动子(SEQ ID NO:46)下游并且后面是加的斯微拟球藻双向终止子2(SEQ ID NO:32)的潮霉素抗性基因(HygR,SEQ ID NO:45),整个启动子-潮霉素抗性基因-终止子序列侧面是5’(SEQ ID NO:47 5’ID)和3’(SEQ ID NO:48 3’ID)末端上27个碱基对的标识序列以得到称为“Hyg抗性盒”(SEQ ID NO:44,HygR盒)的DNA片段。
为了靶向敲除ZnCys-2845(Naga_100104g18)基因座,使用5μg靶向ZnCys-2845基因的纯化嵌合向导RNA和1μg可选供体DNA(Hyg抗性盒;SEQ ID NO:44,如图4A所示),基本上如US2014/0220638中所描述的那样,通过电穿孔转化Cas9编辑系GE-6791。电穿孔后,将细胞平板接种在含潮霉素的PM124琼脂培养基上以选择并入了潮霉素抗性盒的转化株。将转化株贴补到新鲜板上并通过集落PCR对供体片段向ZnCys-2845基因的插入进行筛选。
对于集落PCR筛选,使少量来自待筛选的集落的细胞悬浮在100μl的5%Chelex100树脂(BioRad)/TE溶液中并且使悬浮液在99℃下煮沸10分钟,之后短暂地旋转该管。将1μl裂解物上清液添加到PCR反应混合物中,其中设置了PCR混合物和反应并且根据来自生产商的QIAGEN快速循环PCR主要混合方案(qiagen.com上可用的手册)进行。用于检测供体片段向ZnCys-2845基因的靶基因座内插入的引物是SEQ ID NO:49和SEQ ID N0:50。根据基于PCR的集落筛选,在产率测定中测试了两个敲除菌株,即GE-8564和GE-8565。
如下所述,在基因组基因座Naga_100104g18的编码区内带有HygR盒的突变体有供体盒插入编码预测Zn(II)2Cys6双核集群结构域蛋白(Pfam PF00173,参见图5)的基因内并且被称为ZnCys-2845。正如按FAME/TOC所评估的,这些突变体相对于野生型在脂质积聚上表现出显著增加(实施例4,图7C)。如下所述,根据显著脂滴的出现(图7F-H),进一步确认这些ZnCys-2845敲除(KO)突变体中的脂质积聚表型与在氮饥饿的野生型细胞中观察到的类似。
实施例4
分批产率测定中的ZnCys-2845敲除突变体
为测定ZnCys-2845基因敲除对生长和脂质产量的影响,在分批产率测定中在氮充足的培养基PM123中培养ZnCys-2845敲除菌株GE-8564和野生型祖代菌株WT-3730,所述培养基包括15mM作为细胞可用的唯一氮源的硝酸盐,即该培养基没有还原氮源。因为已经确定ZnCys-2845突变体在缺乏还原氮的情况下不生长,所以从在除了8.8mM硝酸盐外还包括5mM铵的PM124培养基中生长的种子(增长(scale-up))培养物接种生产培养物至初始OD730为0.5。
接种后,在分批测定中使ZnCys敲除菌株GE-8564和野生型菌株WT-3730在装有175ml的PM123培养基的75cm2矩形组织培养瓶中生长7天,培养物一式三份,所述培养基包括15mM作为唯一氮源的硝酸盐。将烧瓶放置成其最窄“宽度”尺寸逆着LED光。用不透明的白色塑料掩盖培养瓶以提供21.1cm2矩形开孔以便辐照到达培养物。入射辐照编程为16小时光照:8小时黑暗循环,4小时内辐照度从0线性增加至1200uE,之后辐照度保持在1200uE下6小时,然后在4小时期限内辐照度从1200线性下降至0uE(间隔15分钟增加)(图6A)。每天向培养物中添加去离子H2O以代替蒸发损失。通过设为25℃的水浴调节培养物的温度。在第0天按0.5的OD730接种培养物并且在第3、5和7天取出样品(5ml)用于评估细胞密度、作为脂质量度的脂肪酸甲酯(FAME)和总有机碳(TOC)。在光循环结束前30分钟进行取样。对2mL样品进行FAME分析,样品使用GeneVac HT-4X干燥。向每个干燥团块添加以下物质:500μL于甲醇中的500mM KOH、200μL含0.05%丁羟甲苯的四氢呋喃、40μL的2mg/ml C11:0游离脂肪酸/C13:0甘油三酯/C23:0脂肪酸甲酯内部标准混合物和500μL玻璃珠(425-600μm直径)。用开顶式PTFE隔膜衬里帽盖上小瓶并置于1.65krpm的SPEX GenoGrinder中7.5分钟。然后在80℃下加热样品5分钟并使其冷却。为了衍生化,向样品中添加500μL于甲醇中的10%三氟化硼,之后在80℃下加热30分钟。使管冷却,之后添加2mL庚烷和500μL的5M NaCl。使样品在2Krpm下涡旋5分钟并且最后在1K rpm下离心3分钟。使用Gerstel MPS自动取样器对庚烷层取样。定量使用80μg的C23:0FAME内部标准品。使用Agilent127-3212DB-FFAP、10mx100μmx100nm柱和FID检测器在260℃下使样品在Agilent 7890A气相色谱系统上运行。流量为500μL/分钟,使用H2作为具有恒定流量控制的载体。将烘箱设置在90℃下0.98分钟,然后15.301℃/分钟增加至230℃并且保持1.66分钟。入口含有4mm玻璃棉包装衬垫(Agilent P/N 5183-4647),并且设为250℃并使用40:1的分流比。注射体积为900nL。
通过用去离子(DI)水将2mL细胞培养物稀释至20mL总体积测定总有机碳(TOC)。每次测量三份注射物注入Shimadzu TOC-Vcsj分析仪中用于测定总碳(TC)和总无机碳(TIC)。燃烧炉设为720℃,并且通过从TC中减去TIC而确定TOC。4点标定范围为2ppm至200ppm,与非稀释培养物的20-2000ppm相对应,相关系数r2>0.999。
表4-6中示出了这些分析的结果。为野生型和敲除GE-8564突变体提供的值是三份培养物具有标准偏差(sd)的平均值。“增量%”栏是指ZnCys敲除突变体相对于野生型值的百分比增量。
表4.在用仅含硝酸盐的培养基的分批测定中ZnCys-2845敲除突变体和野生型培养物生成的脂质(FAME)。
表5.在用仅含硝酸盐的培养基的分批测定中ZnCys-2845敲除突变体和野生型培养物生成的生物质(TOC)。
表6.在用仅含硝酸盐的培养基的分批测定中ZnCys-2845敲除突变体和野生型菌株的FAME/TOC比率。
使用除8.8mM硝酸盐外还包括5mM铵的PM124培养基,对ZnCys-2845cas9敲除突变体GE-8564进行相同的分批产率测定。如所述取出样品并且分析如以上所提供的FAME和TOC。“差异%”栏是指ZnCys敲除突变体相对于野生型值的百分比差异。
表7.在用硝酸盐加铵培养基的分批测定中ZnCys-2845敲除突变体和野生型培养物生成的FAME。
表8.在用硝酸盐加铵培养基的分批测定中ZnCys-2845敲除突变体和野生型培养物生成的生物质(TOC)。
表9.在用硝酸盐加铵培养基的分批测定中ZnCys-2845敲除突变体和野生型菌株的FAME/TOC比率。
图7A-D中的图表显示了这项分析的结果。图7A展示在仅包括作为氮源的硝酸盐的培养基中生长的ZnCys-2845敲除菌株GE-8564的培养物(图表中描绘为圆圈的一式三份培养物的平均值)在试验的每一天比野生型培养物具有更高的FAME含量。正如表4中可见,按体积计这些FAME值远高于野生型。虽然仅含硝酸盐的培养基中的ZnCys-2845敲除突变体培养物的FAME含量在培养第3天(测定第一天)以及在第5和7天处于较高水平(表4和图7A),但是在第3和7天之间每天的FAME增量对于ZnCys-2845敲除菌株而言比野生型菌株少。图7B展示在这个时期,在仅含硝酸盐的培养基中培养的ZnCys-2845基因破坏突变体(圆圈)与野生型(X)相比其总有机碳增加极少,正如通过TOC积聚评估的那样,野生型显示出稳定生长(也如表5所见)。因此,ZnCys-2845敲除菌株,在包括作为唯一氮源的硝酸盐的培养基中培养时,表现得就像处于氮饥饿中一样,脂质产量增加,但生物质积聚也减少。图7C证实了这一点,展示在一周的产率测定过程中,ZnCys-2845敲除菌株GE-8564的FAME/TOC比率升高超过野生型(为野生型FAME/TOC比率的大约三倍,表6),大于60%(且高达至少约80%)的TOC分配给FAME脂质。图7D显示相对于氮充足条件下的野生型(斜条纹柱),C16和C18脂肪酸在敲除菌株GE-8564中(黑色柱)过度生成,而在野生型细胞中C20脂肪酸对于其丰度而言未被充分表示,正如对于储存脂质(即,甘油三酯)的选择性过度生成所预计的那样。GE-8564敲除菌株的脂肪酸曲线与氮饥饿下的野生型细胞的脂肪酸曲线(虚线柱)非常相似。
通过对提取的脂质的分析确定TAG生成的直接证明。通过HPLC鉴定并量化来自在分批测定第7天在仅含硝酸盐的PM074培养基中取得的样品的敲除突变体GE-8564和野生型祖代菌株WT-3730提取的脂质。对于脂质的HPLC分析,各2mL培养物样品以最大速度离心5分钟,去除上清液,并且使团块重新悬浮在400μL的H2O中。将细胞悬浮液(大约500μL)转移到4mL带有特氟隆衬里帽的玻璃小瓶中。向每份细胞悬浮液添加500μL玻璃珠(212-300μm直径),之后添加50μL的50%H2SO4和100μL的5M NaCl。在1krpm下进行珠粒敲打5分钟,然后向每份样品添加2mL己烷,并在1krpm下重复珠粒敲打5分钟。将样品装载到多管涡旋器中并且在1krpm下振荡30分钟,然后在2.5krpm下涡旋30秒。将500μL有机层转移到HPLC小瓶中,并向每个小瓶添加50μL内部标准溶液(1mg/mL于甲苯中的6-酮胆甾烷醇)。标准品来自NuCheck、Sigma-Aldrich或Supelco。在HPLC分析之前为小瓶加帽并短暂涡旋(在2.5krpm下5秒)。以2mL/分钟的流量在Chromegasphere SI-60 150mm x 4.6mm x 10μm柱(ESIndustries)上运行HPLC,柱室设为40℃。注射体积为25μL,吸取和喷射速度为200μL/分钟。洗脱液A为己烷且洗脱液B是己烷、异丙醇、乙酸乙酯和10%于异丙醇中的甲酸的80:10:10:1混合物,按如下梯度程序运行:0.0分钟时2%B;1.0分钟时2%B;5.0分钟时25%B;5.5分钟时98%B;8.99分钟时98%B;9.00分钟时2%B;停止时间:9.0分钟;之后的时间4分钟。检测器是30℃和3.5巴N2的ELSD,增量为5。
图7E显示仅含硝酸盐的培养基中的ZnCys-2845敲除细胞内的TAG量是野生型细胞的TAG量的5倍以上,即,观察到的FAME脂质增加可归因于TAG增加。电子显微镜检查还显示氮饥饿反应特有的明显脂质积聚。图7F显示了在氮充足条件(仅含硝酸盐的培养基)下生长的野生型细胞,具有明显的细胞核(N)、叶绿体(Ch)和线粒体(M),以及一些小脂滴(LD)。图7G显示了在仅含硝酸盐的培养基中生长的ZnCys敲除突变体,其中明显的脂滴(LD)是可见的最大细胞结构,细胞形态与图7H所示的氮饥饿野生型细胞非常相似。因此,ZnCys-2845多肽充当脂质生物合成的负调控因子,因为减弱ZnCys-2845基因的表达引起脂质产量增加。
然而,在仅含硝酸盐的培养基中培养的ZnCys-2845敲除菌株所表现出的FAME增加,在ZnCys-2845敲除菌株在还包括铵的培养基中生长时不明显(表7)。在这种情况下,生成的FAME的量与在硝酸盐加铵培养基中生长的野生型细胞所生成的非常相似,在运行将近结束时,敲除突变体的脂质产量相对于野生型稍有增加,这可能表明铵从分批培养物中损耗(表7)。图8A显示在仅含铵的培养基中培养的野生型(菱形)和ZnCys-2845敲除菌株(圆圈)所生成的FAME的量在一周分批测定中几乎相同,正如图8B所示的TOC积聚一样(从表8也明显看出)。野生型和ZnCys-2845敲除菌株的FAME/TOC值相应地类似(图8C,表9)。
因此,当培养基中的铵充足时ZnCys-2845基因破坏突变体表现与野生型菌株一样(表7-9和图8A-8C),但是当硝酸盐是存在的唯一氮源时通过诱导储存脂质生物合成,似乎在硝酸盐同化作用上受损,表现得好像细胞处于氮贫化培养基中一样(图7A-H)。
实施例5
ZnCys-2845蛋白的生物信息学分析:结构域和直系同源物
如实施例1中所述,在N充足和N贫化样品之间差异性表达的基因座Naga100104g18处的ZnCys-2845基因是编码出现在生物信息学生成的微拟球藻假定转录因子列表上的多肽(SEQ ID NO:2)的基因(如SEQ ID NO:1所提供的cDNA序列)。观察到该多肽具有一些转录因子特有的锌(2)Cys(6)结构域并且因此被归类为Zn(2)-C(6)真菌型DNA结合域蛋白。除Zn(2)-Cys(6)结构域外,微拟球藻多肽ZnCys-2845还含有不同的核定位序列,其置信度评分为1.0(等于100%置信度),与将其表征为转录因子一致(图5)。
ZnCys-2845是通过转录组学分析在脂质诱导期间受差异性调控的基因鉴定的并且由于从氨基酸190延伸到219的Zn(2)-Cys(6)双核集群结构域(SEQ ID NO:3)而标注为假定转录因子的1065个氨基酸的蛋白质(SEQ ID NO:2)。所述蛋白质归为Pfam PF00172(“Zn_Clus”或“真菌Zn(2)-Cys(6)双核集群结构域”),二进制分数为25.2(该家族的采集截止值为20.8)且e值为1.1e-05。因此,ZnCys-2845是Zn(II)2Cys6真菌型DNA结合域蛋白家族的成员。该家族的成员含有非常保守的基序CysX2CysX6CysX5-12CysX2CysX6-8Cys(半胱氨酸残基后面是2个具有任何同一性的氨基酸残基,后面是第二个半胱氨酸残基,后面是6个具有任何同一性的氨基酸残基,后面是第三个半胱氨酸残基,后面是5-12个具有任何同一性的氨基酸残基,后面是第四个半胱氨酸残基,后面是2个具有任何同一性的氨基酸残基,后面是第五个半胱氨酸残基,后面是6-8个具有任何同一性的氨基酸残基,后面是第六个半胱氨酸残基;SEQ ID NO:4)。已经证明半胱氨酸残基可以结合两个锌原子,其配合DNA结合所涉及的结构域的折叠。该结构域的其它标识包括保守性结构域数据库(cdd)结构域cd00067、interpro蛋白质结构域数据库结构域IPR001138、SMART蛋白质结构域‘GAL4’和PROSITE蛋白质结构域PS00463。
最初认为这类“ZnCys”转录因子专门是真菌的,但最近在囊泡藻界(chromalveolates),尤其是不等鞭毛类/异鞭毛类(包括非光合型网粘菌纲或“壶菌”)和定鞭藻类(例如赫氏圆石藻(E.huxleyi))中已经鉴定了成员。该家族中首例且经最佳研究的蛋白质是Gal4p,即半乳糖异化中涉及的基因的酵母转录激活因子(Leverentz和Reece(2006)Biochem Soc Transac 34:794-797;Breunig(2000)Food Technol.Biotechnol.38:287-293)。术语“Zn(2)-C(6)真菌型DNA结合域蛋白”、“Zn(II)2Cys6真菌型DNA结合域蛋白”、“Zn(2)-Cys(6)结构域多肽”、“Zn(2)Cys(6)蛋白/多肽”和“Zn2Cys6蛋白/多肽”在本文中可互换使用。
基因组数据库检查揭示了植物和真菌中编码具有Zn(2)-Cys(6)结构域的多肽的基因。有趣的是,发现几个异鞭毛种类包括Zn(2)-Cys(6)结构域多肽,包括例如来自裂殖壶菌属和不动壶菌属的网粘菌类和硅藻类,包括舟形藻属、小环藻属、海链藻属、褐指藻属、拟脆杆藻属的成员。
表10.加的斯微拟球藻脂质调控因子ZnCys-2845的假定直系同源物
通过使用hmmsearch(hmmer.org)和匹配分数的可信截止值扫描专有微拟球藻基因组的预测蛋白质组与PF00172HMM模型的匹配发现了海洋微拟球藻基因(如SEQ ID NO:84所提供的编码序列,编码如SEQ ID NO:17所提供的多肽);然而,通过扫描从singlecellcenter.org/en/NannoRegulationDatabase/Download/S11.zip下载的微拟球藻基因组未发现另外的微拟球藻直系同源物,这可能是由于该基因组的蛋白质组不完整。通过针对微拟球藻菌株和物种的公共基因组组件的BLAST(tblastn)发现了加的斯微拟球藻ZnCys-2845蛋白质(SEQ ID NO:2)另外的假定直系同源物,所述微拟球藻菌株和物种包括加的斯微拟球藻菌株CCMP526、海洋微拟球藻菌株IMET1、海洋微拟球藻菌株CCMP531、眼点微拟球藻菌株CCMP525、盐生微拟球藻菌株CCMP537和颗粒微拟球藻菌株CCMP529。然而,在每种情况下观察到比对匹配在PF00172Zn_Clus结构域中中断,以致发现所有序列都不完整,缺乏编码区的5’末端和蛋白质的N端序列。在经过分析和进一步检查的微拟球藻基因组中明确鉴定了另外的保守性区域,其来自ZnCys-2845多肽,长度为大约170个氨基酸(SEQID NO:27的位置345-51)。使用NCBI的delta-blast工具评价其它微拟球藻类中加的斯微拟球藻WT-3730ZnCys-2845(SEQ ID NO:2)假定直系同源物之间的高度保守性区域。
在许多信号传导蛋白中都发现了这个结构域,即PAS3_折叠结构域(pfamPF08447),其中它起到信号传感器的作用。使用这种方法,可以在搜索的6个微拟球藻基因组的每一个中明确鉴定出与ZnCys-28345的假定匹配。不幸的是,所有情况下的比对匹配似乎都在与PF00172Zn_Clus结构域的假定匹配中中断。然而,从blast比对中,观察到来自ZnCys-28345的大约170个氨基酸的区域(位置345-517)并且在所有菌株(单拷贝)中均可明确鉴定。图9中提供了来自微拟球藻的经鉴定的ZnCys-2845直系同源物中的PAS3结构域的比对,其中不同微拟球藻种类之间结构域序列的高度保守性明显。ZnCys-2845的PAS3结构域(在图12A中的基因图解中标识)从SEQ ID NO:2的氨基酸345延伸到氨基酸517,并且如SEQ ID NO:21所提供。SEQ ID NO:21还表示加的斯微拟球藻菌株CCMP526的PAS3结构域的序列。海洋微拟球藻菌株WT-5473、海洋微拟球藻菌株IMET1和海洋微拟球藻菌株CCMP531ZnCys-2845直系同源物的PAS3结构域的序列如SEQ ID NO:22所提供。海洋微拟球藻ZnCys-2845直系同源物PAS3结构域(SEQ ID NO:22)在序列上与加的斯微拟球藻PAS3结构域(SEQ ID NO:21)86%相同。盐生微拟球藻菌株CCMP537ZnCys-2845直系同源物的PAS3结构域如SEQ ID NO:23所提供,其与加的斯微拟球藻ZnCys-2845PAS3结构域(SEQ ID NO:21)98%相同。眼点微拟球藻菌株CCMP539ZnCys-2845直系同源物的PAS3结构域如SEQ IDNO:24所提供,并且它与加的斯微拟球藻ZnCys-2845的PAS3结构域(SEQ ID NO:21)展示出86%序列同一性。如以上所提供的,颗粒微拟球藻菌株CCMP529的ZnCys-2845直系同源物的PAS3结构域如SEQ ID NO:22所提供,其与加的斯微拟球藻ZnCys-2845的PAS3结构域(SEQID NO:21)大约86%相同。
图10中提供了加的斯微拟球藻ZnCys-2845基因编码的氨基酸序列和ZnCys-2845基因的海洋微拟球藻菌株WT-5473直系同源物编码的氨基酸序列(SEQ ID NO:17)的比对,两者均通过内部基因组测序和基因定位确定。进一步检查另外三个微拟球藻种类(颗粒微拟球藻菌株CCMP529、眼点微拟球藻菌株CCMP539和盐生微拟球藻菌株CCMP537)的基因组序列以试图将特征在于PAS3结构域的假定ZnCys-28545直系同源物的蛋白质编码序列缝合在一起。编排6个微拟球藻基因组以找到从PAS3结构域向外延伸的同源性区域。利用Blastn鉴定与为了使同源性达到最大限度而引入的空位连接在一起的同源序列。
海洋微拟球藻的Zn(2)-Cys(6)结构域与加的斯微拟球藻的Zn(2)-Cys(6)结构域(SEQ ID NO:3)相同。所述两个基因(加的斯微拟球藻ZnCys-2845和海洋微拟球藻直系同源物)编码的多肽在推断的整个多肽序列上具有56%同一性,并且在加的斯微拟球藻ZnCys-2845(SEQ ID NO:2)的前517个氨基酸上具有71%同一性,后者是从蛋白质的N-末端延伸通过Zn(2)-Cys(6)结构域和PAS3结构域的一部分氨基酸序列(参见图5)。盐生微拟球藻ZnCys-2845同源序列(SEQ ID NO:20)编码的氨基酸1-200与加的斯微拟球藻ZnCys-2845(SEQ ID NO:2)的相应氨基酸序列具有大约98%同一性;而颗粒微拟球藻(SEQ ID NO:18)的假定直系同源物的不完整多肽序列与加的斯微拟球藻ZnCys-2845(SEQ ID NO:2)大约61%相同并且眼点微拟球藻(SEQ ID NO:19)的假定直系同源物的不完整多肽序列与加的斯微拟球藻ZnCys-2845(SEQ ID NO:2)大约61%相同。这些部分多肽序列不包括微拟球藻直系同源物的PAS3结构域,如上所述,其与加的斯微拟球藻ZnCys-2845(SEQ ID NO:21)的PAS3结构域具有高得多的同一性%。
实施例6
在使用氮源的半连续生产系统中ZnCys-2845敲除突变体的生长和脂质生物合成
为确定ZnCys-2845基因破坏敲除突变体是否可以利用其它氮源,设置了半连续产率测定,其中培养基包括作为唯一氮源的尿素。
对于培养基包括作为唯一氮源的尿素的测定而言,使ZnCys-2845敲除菌株GE-8564和野生型菌株WT-3730的种子培养物(也称为“起始培养物”或“增长培养物”)在包括7.5mM作为唯一氮源的尿素的PM125培养基中生长。对于在仅含硝酸盐的培养基(PM074)中培养野生型细胞的测定而言,使野生型细胞在包括仅含硝酸盐的PM074培养基的培养物中增长。使GE-8564ZnCys-2845敲除突变体在包括PM124培养基的培养物中增长,对于测定培养基中仅包括作为氮源的硝酸盐的半连续测定而言,PM124培养基包括硝酸盐(8.8mM)和铵(5mM)。
使用增长培养物接种225cm2矩形组织培养瓶,接种后每个培养瓶装有最终总体积550ml的培养物。接种培养物,使得每份550ml培养物的初始OD730为0.9。典型接种物体积为大约200ml增长培养物添加到大约350ml测定培养基中,培养基是PM074(仅含硝酸盐的培养基)或PM125(仅含尿素的培养基)。每天中午,当光强度达到其峰值时,通过去除体积的30%(165ml)并用相同体积的测定培养基(PM074或PM125)更换再加上10ml去离子水以补充蒸发(包括在补充培养基中)来稀释培养物。半连续测定通常运行10-14天。仅为已经达到稳态的培养物(其中生长的增加量等于测定的稀释因子)计算脂质和生物质日产率。
每种菌株引进三份培养物。烧瓶包括搅拌棒并且具有塞子,塞子插有与注射器过滤器连接的管,用于递送起泡通过培养物的富含CO2的空气(1%CO2,流量,300ml/分钟)。将烧瓶置于在测定期间于设为575rpm的搅拌盘上编程为保持25℃的恒定温度的水浴中。用不透明的白色塑料掩盖培养瓶以提供31.5cm2矩形开孔以便辐照到达培养物。使烧瓶的宽度(最窄尺寸)对准LED光源,以光/暗循环和增加直至“太阳正午”,然后下降至光周期结束的光曲线为LED光源编程。所述光曲线设计为模拟南加利福尼亚的春日:14小时光照:10小时黑暗,光照峰值达到大约2000μE(图6B)。烧瓶包括搅拌棒并且具有塞子,塞子插有与注射器过滤器连接的管,用于递送富含CO2的空气(1%CO2,流量,300ml/分钟)。将烧瓶置于在测定期间于设为575rpm的搅拌盘上编程为保持25℃的恒定温度的水浴中。
每天中午,当光强度达到其峰值时,通过去除体积的30%(165ml)并用相同体积的测定培养基更换再加上10ml去离子水以补充蒸发来稀释培养物。根据经验确定30%稀释率为微拟球藻最多产的稀释率,因为每天稀释50、30和15%分别产生6.5、9和8g/m2/天的平均TOC产率。半连续测定通常运行7-14天。由已经达到稳态固定作物TOC和FAME密度的培养物计算脂质(FAME)和生物质(TOC)日产率。通过用FAME和TOC体积量乘以30%稀释率计算FAME和TOC体积产率(mg/L/天)。通过培养物的总产率除以允许辐照通过的孔径尺寸计算面积产率(g/m2/天)。
图11A显示ZnCys-2845敲除突变体GE-8564,在硝酸盐是唯一氮源的半连续测定中培养时(菱形),在测定开始时显示出巨大的脂质生成诱导,随后在测定第3天后急剧下降,使得到测定第10天脂质产量降到低于非诱导野生型培养物的脂质产量,之后下降到甚至更低的水平。这种模式与实施例4的分批测定结果一致,其表明ZnCys-2845敲除突变体GE-8564在仅含硝酸盐的培养基中被诱导生成脂质。
相反,在仅含尿素的培养基(图11A,圆圈)中培养的ZnCys-2845基因破坏的GE-8564突变体的培养物具有一贯比在仅含硝酸盐的培养基(三角形)或仅含尿素的培养基(正方形)中培养的野生型菌株更高的FAME日产率,两种培养基是未诱导野生型菌株生成脂质的条件(有整个测定中这些培养物的FAME/TOC比率为证,参见图11C和下面的表14)。表11提供了按面积计半连续测定中所有菌株生成的FAME日量,还提供了两者均在仅含尿素的培养基中培养时,敲除突变体GE-8564菌株生成的FAME的量比野生型FAME水平增加的百分比。表12中提供了每种菌株的平均面积FAME产率,表示为g/m2/天。两种菌株在仅含尿素的培养基中培养时,在13天测定过程中敲除突变体菌株GE-8564的FAME产率比野生型菌株的增量平均为58%。还可以看到,在仅含尿素的培养基中培养的野生型细胞显示FAME产率比仅含硝酸盐的培养基中的野生型细胞平均低16%。仅含硝酸盐的培养基中的GE-8564敲除突变体在测定的前8天相对于野生型显示出FAME产量增加,然后在测定进行时经历FAME日产量下降,与氮贫化反应一致。
表11.半连续测定中用硝酸盐或尿素作为氮源培养的ZnCys敲除和野生型菌株生成的FAME(g/m2/天)
表12提供了在13天半连续培养中培养物的平均FAME日产率。在仅含尿素的培养基中生长的ZnCys敲除GE-8564的平均FAME日产率比在硝酸盐培养基(最右侧柱)中生长的野生型菌株(WT-3730)的平均FAME日产率高32%。仅含硝酸盐的培养基中的ZnCys-2435敲除菌株的高FAME产率值是由于培养的前7天FAME产量极高。然而到培养第5天FAME日产率已经在下降,之后下降到远低于在仅含硝酸盐的培养基中培养的野生型(图11A)。
表12.在仅含尿素或仅含硝酸盐的培养基中的半连续培养物的平均FAME日产率
图11B显示在半连续测定中于仅含硝酸盐的培养基中培养的ZnCys-2845敲除突变体GE-8564(菱形)在测定过程中展示出生物质产量急剧下降,到测定结束时降低到仅为硝酸盐培养基中培养的野生型细胞所生成的生物质的一小部分。相反,在这项半连续产率测定中,相对于在硝酸盐培养基中培养的野生型菌株(三角形),在尿素培养基中培养的ZnCys-2845基因破坏突变体(圆圈)中的生物质(TOC)产率几乎没有下降,并且ZnCys-2845敲除突变体甚至展示出比在尿素培养基中培养的野生型(正方形)略佳的产率,三者全部在整个测定过程中保持相当一致。
表13提供了这些半连续培养物的TOC含量和在仅含硝酸盐的培养基中培养的ZnCys-2845敲除突变体相对于在仅含硝酸盐的培养基中培养的野生型细胞之间生成的TOC日量的百分比差异,及在尿素培养基中培养的ZnCys-2845敲除突变体相对于在尿素培养基中培养的野生型细胞之间生成的日TOC的百分比差异。在表13中,可以看到在所述测定进行时在仅含硝酸盐的培养基中培养的ZnCys-2845敲除突变体中,每天生成的生物质的量的减少。其它培养物,包括在尿素培养基中培养的相对于尿素培养基中的野生型在FAME日产率上增加58%的ZnCys-2845敲除突变体的生物质产量水平,在13天测定期间保持相当一致,并且比在尿素培养基中培养的野生型菌株具有略佳的平均TOC产率。因此,在包括作为唯一氮源的尿素的培养基中培养时,ZnCys-2845敲除突变体能够积聚与野生型菌株至少相等水平的生物质,同时展示出高近60%的FAME日产率。
表13.在半连续测定中在硝酸盐或尿素中生长的菌株所生成的生物质(g/m2/天TOC)
事实上,尽管仅含尿素的培养基中的ZnCys-2845敲除突变体相对于氮充足(仅含硝酸盐)的培养基中的野生型细胞的脂质产量增加(图11A和表11),但整个测定过程中含尿素的培养基中的ZnCys敲除突变体所生成的TOC平均量为硝酸盐培养基中培养的野生型细胞的TOC平均量的至少90%,即仅比氮充足的野生型细胞的TOC平均量低约10%。
图11C显示了半连续测定中培养物的日FAME:TOC比率。这些比率对于所有样品而言保持相当一致,除了在仅含硝酸盐的培养基(菱形)中培养的ZnCys-2845基因破坏突变体(“ZnCys-KO”)外,其从培养第1天到第8天显示FAME:TOC比率上升,之后该比率开始下降。在仅含硝酸盐的培养基中培养的ZnCys-2845基因破坏突变体的这些FAME:TOC比率远远高于在仅含硝酸盐和仅含尿素的培养基中培养的野生型和在仅含尿素的培养基中培养的ZnCys-2845敲除突变体的FAME:TOC比率并且表明对氮贫化的典型脂质诱导反应。表14中提供了突变体和野生型半连续测定培养物的FAME:TOC比率。
表14.硝酸盐或尿素中培养的培养物的FAME/TOC比率。
仅在尿素中培养的ZnCys-2845基因破坏突变体相对于在仅含硝酸盐或仅含尿素的培养基中培养的野生型细胞显示出一贯更高的FAME:TOC比率,但FAME:TOC比率在整个培养期内相当稳定,在0.3至低于0.5的范围内,表示比野生型平均增加约45%。因此,当尿素用作测定中的唯一的还原氮源时,ZnCys-2845基因破坏突变体展示出向脂质显著增加的碳分配(表14,图11C),总体碳同化没有实质性损失(表13,图11B),导致相对于在测定过程中在相同(仅含尿素)的条件下培养的野生型细胞,每天生成的FAME增加大约57%而生成的TOC仅减少大约6%。
实施例7
Cas9ZnCys-2845敲除构建体
因为ZnCys-2845敲除系在分批生长中表现出显著的TOC产率缺陷,伴随有向脂质的碳分配增加(实施例4,图7B),我们接着研究了改变ZnCys-2845表达的减弱程度是否会产生脂质和TOC产率更好优化的工程改造菌株。使用Cas9/CRISPR基因组工程将另外的突变体菌株经工程改造为ZnCys-2845基因的表达减少。将12个嵌合向导RNA设计为靶向ATG上游、基因内含子内、基因3’末端内但仍然在编码序列内,或在基因的3’非翻译区内的序列(图12A)。这里描述为“Bash敲减构建体”或简单地描述为“Bash构建体”的这些构建体,因为将其设计为将供体片段插入到基因区域内期望插入以允许靶基因以比在野生型中更低的水平表达的位点中。(相应地,包括此类插入的菌株称为“Bash菌株”、“Basher”或“Bash敲减突变体”。)表15中提供了12个与ZnCys-2845基因(靶位点序列)具有同源性的18-核苷酸序列。
表15:用于减弱ZnCys-2845表达的靶标和嵌合向导序列
嵌合向导DNA构建体作为两条互补链合成,两条互补链退火生成具有位于向导序列上游的T7启动子的双链构建体(除tracr序列外还包括18个核苷酸的靶序列),并且用于通过体外转录生成嵌合向导RNA并且如实施例3所述进行纯化。SEQ ID NO:42是用于生成向导RNA的一般“有义”链的实例并且SEQ ID NO:43是会退火为用于通过体外转录生成向导RNA的有义链(其中再次用18个核苷酸表示靶序列)的一般“互补”链的实例。
在本实验中,每个嵌合向导RNA单独地连同包括如实施例3中所描述的Hyg抗性(“HygR”)盒(图4A,SEQ ID NO:44)的供体片段一起转化到微拟球藻编辑菌株GE-6791中。使用与ZnCys-2845基因的靶区域相邻的引物,通过所描述的集落PCR选择和筛选潮霉素抗性集落。使用引物MA-ZnCys-FP(SEQ ID NO:49)和MA-ZnCys-RP(SEQ ID NO:50)确认敲除(GE-8564)和供体片段插入内含子中;使用引物MA-5'Bash-ZnCys-FP(SEQ ID NO:63)和MA-5'Bash-ZnCys-RP(SEQ ID NO:64)确认供体片段插入到ZnCys-2845基因的5’区域;并且使用引物MA-3'Bash-ZnCys-FP(SEQ ID NO:65)和MA-3'Bash-ZnCys-RP(SEQ ID NO:66)确认供体片段插入到ZNCys-2845基因的3’区域。12个向导RNA中有11个产生通过集落PCR看来似乎有Hyg基因插入靶基因座的分离物(未观察到插入5’UTR靶位点-1)。
对从敲除系分离的RNA进行定量反转录-PCR(qRT-PCR)以确定实际上ZnCys-2845基因的表达在这些系中是否会降低。ZnCys-2845Bash敲减菌株在标准的氮充足条件下(PM074(仅含硝酸盐的)培养基)生长并且在稳定早期收获。使用以上实施例1中提供的方法,从ZnCys-2845Bash敲减细胞分离总RNA。使用BioRad的iScriptTM ReverseTranscription Supermix试剂盒根据生产商的方案将RNA转化为cDNA。对于PCR,SsofastEvaGreen Supermix(Bio-Rad,Hercules,CA)连同基因特异性引物一起使用。在与CFX实时系统(BioRad)耦联的C1000热循环仪上进行PCR反应。引物和cDNA浓度是根据生产商的推荐。用于扩增ZnCys-2845转录物的序列的引物是SEQ ID NO:67和SEQ ID NO:68。针对在不同培养条件下具有一致表达水平的管家基因(1T5001704;SEQ ID NO:69)归一化每份样品的转录物水平并且使用ddCT方法,使用BioRad的CFX Manager软件计算相对表达水平。
图12B显示几个菌株的ZnCys-2845转录物水平降低。这些中,选择靶向ZnCys-2845基因5’末端的菌株GE-13108(ZnCys-2845Bash-2)和GE-13109(ZnCys-2845Bash-3)和靶向ZnCys-2845基因3’末端的菌株GE-13112(ZnCys-2845Bash-12)进行产率测定。
实施例8
RNAi敲减构建体
在确定降低ZnCys-2845基因的表达是否会使细胞比Cas9敲除积聚更多的碳,同时仍然生成相对于野生型增加的量的脂质的另一种策略中,设计了干扰RNA(RNAi)构建体用于在微拟球藻细胞中表达。该构建体包括设计为形成发夹的序列,发夹包括与ZnCys-2845基因的区域(SEQ ID N0:70)同源的序列,后面是环序列,然后后面是受加的斯微拟球藻EIF3启动子(SEQ ID NO:46)驱动的ZnCys-2845基因同源序列的反向序列并且后面是加的斯微拟球藻“终止子9”(SEQ ID NO:71)。该构建体还包括在微拟球藻4AIII启动子(SEQ IDNO:37)的控制下,对于微拟球藻经密码子优化并且后面是“终止子5”(SEQ ID NO:38)的编码GFP的基因(SEQ ID NO:36),以及受TCTP启动子(SEQ ID NO:34)驱动并且以EIF3终止子(SEQ ID NO:35)终止的赋予潮霉素抗性的基因(SEQ ID NO:45)。该构建体线性化并且通过所描述的电穿孔转化到野生型加的斯微拟球藻WT-3730中。
筛选存在RNAi构建体的潮霉素抗性集落并且对于ZnCys-2845转录物水平的敲减,通过实施例7中描述的qRT-PCR进一步筛选阳性菌株。
实施例9
分批测定中的敲减构建体
在实施例4中描述的分批产率测定中,通过使培养物在培养基PM124(其包括作为氮源的NH4和NO3)中增长并且通过在包括作为唯一氮源的硝酸盐的PM123培养基中进行测定来测试ZnCys-2845RNAi菌株GE-13103和ZnCys-2845敲减“basher”菌株GE-13108、GE-13109和GE-13112。ZnCys-2845敲除菌株GE-8564和野生型背景菌株相同测定中作为对照运行。
表16-18中提供的和图13A-C显示的结果令人吃惊。用硝酸盐作为唯一氮源培养时在所有取样天数,所有基因减弱突变体,包括原始敲除突变体GE-8564(三角形),生成大于野生型(圆圈)的量的FAME(图13A,表16中提供的数据)。然而,虽然原始敲除菌株GE-8564(三角形)相对于野生型具有显著降低的总有机碳积聚率(图13B),但是在这些情况下,减弱的敲减菌株-ZnCys-2845基因表达降低的“bash”菌株和RNAi菌株-具有与野生型接近(例如在GE-13112的情况下(表示为X))或基本上相同的TOC积聚率(图13B,表17中提供的数据)。显著地,这些ZnCys-2845敲减突变体展示出相对于野生型显著提高的FAME/TOC比率(图13C和表18),虽然没有ZnCys-2845敲除突变体GE-8564的FAME/TOC比率那么高,即这些敲减减弱菌株中向脂质的碳分配介于野生型和ZnCys-2845敲除菌株中间。
表16.在用含NO3的培养基的分批测定中与野生型相比ZnCys-2845敲减菌株的FAME产率(mg/L培养物)
表17.在用含NO3的培养基的分批测定中与野生型相比ZnCys-2845敲减菌株的TOC产率(mg/L培养物)
表18.在用含NO3的培养基的分批测定中与野生型相比ZnCys-2845敲减菌株的FAME/TOC比率
图14A提供了ZnCys-2845基因的图解并且图14B提供了显示使用实施例7中提供的方法通过PCR定量的,在具有插入BASH突变(“basher”菌株GE-13109和GE-13112)、RNAi构建体(ZnCys-2845RNAi菌株GE-13103)或敲除(KO)突变(ZnCys-2845敲除突变体GE-8564)的培养菌株中的归一化ZnCys-2845RNA水平的图表。ZnCys BASH-3菌株GE-13109展示出ZnCys-2845转录物水平降低大约20%,ZnCys BASH-12菌株GE-13112展示出ZnCys-2845转录物水平降低大约50%,并且ZnCys-2845RNAi分离物(GE-13103)展示出ZnCys-2845转录物水平降低大约70%。图14C提供了在如上所述的仅含硝酸盐的培养基中基于分批测定每个菌株的FAME/TOC比率和TOC产率的图表,除了在图14C的测定中,未在铵的存在下而在仅含硝酸盐的培养基中预培养ZnCys-2845敲除菌株GE-8564)外。正如图14C中所汇总的,在无硝酸盐的分批生长中,三个ZnCys-2845基因减弱系全部表现出向脂质的碳分配增加,在介于野生型和ZnCys敲除(菌株GE-8564)FAME/TOC比率中间的FAME/TOC比率下明显(还参见表18)。敲减突变体中的TOC积聚与野生型几乎相当(ZnCys RNAi-7菌株GE-13103最多受损仅仅约20%),显示出比在ZnCys-2845敲除突变体中显示的减少的实质性改善,ZnCys-2845敲除突变体展示出平均TOC日产率降低大约85%(图14C)。图15A和15B的图表中提供了从中得到图14C的数据的分批测定的日FAME和TOC值。
实施例10
半连续产率测定中的ZnCys-2845敲减突变体
然后在实施例6描述的半连续产率测定中测定ZnCys-2845RNAi菌株GE-13103、BASH2菌株GE-13108、BASH3菌株GE-13109和BASH12菌株GE-13112,除了在这种情况下测定培养基PM074包括作为唯一氮源的硝酸盐并且在除8.8mM硝酸盐外还包括5mM铵的PM124培养基中预培养敲减菌株外。对于GE-13103ZnCys-2845RNAi菌株而言,以两种方式测定产率:使用包括仅含硝酸盐的PM074培养基的起始培养物接种第一组半连续测定培养物,并且使用除8.8mM硝酸盐外还包括5mM铵(PM124培养基)的起始培养物接种第二组GE-13103半连续测定培养物。
使用起始培养物接种225cm2矩形组织培养瓶,接种后每个培养瓶装有最终总体积550ml的培养物。接种培养物,使得每份550ml培养物的初始OD730为0.9。典型接种物体积为大约200ml增长培养物添加到大约350ml测定培养基中,培养基是PM074(仅含硝酸盐的培养基)。每天中午,当光强度达到其峰值时,通过去除体积的30%(165ml)并用相同体积的测定培养基(PM074)更换再加上10ml去离子水以补充蒸发(包括在补充培养基中)来稀释培养物。因此,由培养基(PM124培养基)中包括5mM铵的增长ZnCys-2845RNAi培养物接种的测定培养物一开始具有大量的铵(例如,约2mM铵或更少),在测定过程中逐渐下降并且被进一步稀释。半连续测定通常运行10-14天。仅为已经达到稳态的培养物(其中生长的增加量等于测定的稀释因子)计算脂质和生物质日产率。
半连续测定过程中,对于所有培养物而言用仅含硝酸盐的培养基(PM074)每天稀释30%。在这些测定中,与氮充足条件中的野生型细胞(菱形)相比,在半连续测定中于仅含硝酸盐的培养基中增长的GE-13103RNAi敲减细胞(经填充的圆圈,图16A)每天生成多得多的脂质。当增长培养基除硝酸盐外还包括铵时(图16A中的空心圆圈),GE-13103菌株每天生成的脂质的量甚至更高。BASH2菌株GE-13108(X)、BASH3菌株GE-13109(三角形)和BASH12菌株GE-13112(正方形)在半连续测定中也比野生型菌株生成多得多的FAME。
图16B提供了在培养基(PM074培养基)中包括作为唯一氮源的硝酸盐的半连续测定中敲减菌株所生成的FAME日量。包括GE-13108(5’Bash2)、GE-13109(5’Bash3)、GE-13112(3’Bash12)和GE-13103(RNAi-7)在内的敲减菌株在硝酸盐加铵培养基PM124中预培养。RNAi敲减菌株GE-13103也在仅含硝酸盐的培养基(PM074)中预培养之后,随同在仅含硝酸盐的培养基(PM074)(其对于野生型菌株而言是氮充足的培养基)中预培养的野生型菌株WT-3730一起测定。在作为用于半连续测定的培养基的仅含硝酸盐的培养基(PM074)中单独培养敲除菌株GE-8564。图16B的表展示在使用其中硝酸盐是基本上唯一的氮源的培养基(PM074)定期稀释在半连续测定中培养时,全部敲减菌株具有比野生型菌株高的产率。在这项测定中,敲减菌株GE-13112(BASH12)展示生成平均日量比野生型高83%的FAME,并且敲减菌株GE-13109(BASH3)展示生成平均日量比依赖硝酸盐的野生型高81%的FAME。在测定过程中,敲减菌株GE-13108(BASH2)展示生成平均日量比用相同培养基(PM074)稀释的野生型高88%的FMAE。因此靶向ZnCys-2845基因的非编码区的所有插入敲减突变体展示出面积FAME产率比仅含硝酸盐的培养基中的野生型细胞高至少70%(和高大约80%-90%)的大幅增长,与野生型菌株相比GE-13108(BASH2)、GE-13112(BASH12)和RNAi-7GE-13103菌株中TOC产率仅最少降低大约5-15%(图16C)。在仅含硝酸盐的培养基中预培养的RNAi-7菌株GE-13103比相同条件下培养的野生型每天平均生成多107%的FAME。在包括铵加硝酸盐的培养基中预培养的RNAi-7菌株GE-13103比相同条件下培养的野生型每天平均生成多122%的FMAE。因此,不管预培养基中的氮源如何,在用仅含硝酸盐的培养基定期稀释培养物的半连续测定中GE-13103基因减弱突变体生成至少为野生型所生成的两倍的脂质。虽然增量不像敲减突变体那么高(比两者均在仅含硝酸盐的培养基中培养时高大约40%),但是在测定中敲除突变体GE-8564也比野生型生成略多的FAME。在仅含硝酸盐的培养基中培养的敲除突变体GE-8564生成的FAME的量在培养约第6天开始明显下降,反映了生物质的大量损失(表20)。
敲减菌株在FAME产率上的这些提高在表19中呈现为培养持续期间平均超过野生型的百分比增量。在培养过程中所有敲减菌株(GE-13103、GE-13108、GE-13109和GE13112)相对于野生型均有FAME产率(即,g/m2/天)增加,整个培养过程中范围为81%至122%,在培养的前四天看到甚至更高的产率增加,范围为100%(即,野生型产率的两倍)至160%。在半连续培养过程中RNAi敲减菌株GE-13103相对于野生型具有最大的产率增加,提高大约100%(在PM074中预培养时)和提高大约120%(在PM124中预培养时)。
表19.敲减和敲除菌株的FAME产率(g/m2/天)
在敲减培养物GE-13109(5’Bash-3)和GE13112(3’Bash-12)中,敲减菌株每天积聚的TOC的量仅略微至适当低于的野生型积聚的TOC,虽然在仅含硝酸盐的培养基中培养的GE-13108(5’Bash-2)和敲除菌株GE-8564中明显更低(图16C和表20)。然而,11天内表现出FAME产率增加大约100%(并且用铵预培养时增加大约120%)的RNAi敲减菌株(GE-13103)的TOC产率相对于野生型仅降低约18%,并且BASH-12和BASH-4敲减突变体菌株GE-13112和GE-13109(其在11天内展示出FAME产率增加至少80%)的TOC产率仅降低5%或更少。
表20.敲减和敲除菌株的平均TOC产率
在硝酸盐培养基中的半连续测定中ZnCys-2845敲减和敲除培养物与野生型(实心菱形)相比全部展示出FAME/TOC比率增加(图16D和表21)。在仅含硝酸盐的培养基中增长时,RNAi敲减菌株GE-13103(实心圆圈)相对于野生型展示出FAME/TOC比率增加大于100%,大约增加150%并且在硝酸盐加铵培养基中增长的相同GE-13103菌株(空心圆圈)在半连续产率测定中展示出FAME/TOC比率增加153%(表21)。
表21.敲减和敲除菌株的FAME/TOC比率
这些经基因工程改造的敲减细胞能够比野生型向脂质分配更多的碳(图16D)。在ZnCys RNAi减弱菌株GE13103中增加的FAME/TOC比率特别显著,因为在整个测定中相对于野生型其仅具有适度的TOC减少(介于约15%和约20%之间,表20)加上FMAE增加(增加大于100%,增加大约120%,表19)。
图17A和17B中提供了在单独的半连续测定中使用仅含硝酸盐的培养基测定的野生型、Cas9编辑系GE-6791和ZnCys-2845敲减系GE-13112(BASH-12A)、GE-13109(BASH-3A)和GE-13108(BASH-2A)的体积FAME和TOC产率的图表(表22和表23中提供的数据),并且在图18的图表中汇总了这项测定中野生型菌株和Cas9编辑系(作为对照)及BASH-3、BASH-12和RNAi突变体(全部在仅含硝酸盐的培养基中预培养)的平均面积(g/m2/天)TOC和FAME产率,其中可以看到RNAi菌株具有所测突变体的最高FAME产率。
表22.在使用仅含硝酸盐的培养基的半连续测定中敲减菌株的平均FAME日产率
表23.在使用仅含硝酸盐的培养基的半连续测定中敲减菌株的平均FAME日产率
在培养期开始时,在已经于含有硝酸盐和铵的混合物的培养基中预培养的ZnCysRNAi减弱培养物中,FAME/TOC增量明显小于已经于仅含硝酸盐的培养基中预培养的ZnCysRNAi减弱培养物(图16D)。因此似乎在硝酸盐加铵培养基中预培养的菌株包括来自引入测定培养物中的预培养物的还原氮(铵),并且这种残留的铵在某种程度上抑制脂质生物合成。这种影响到测定第5天消失(参见图16A,空心圆圈(在培养基中用铵预培养的RNAi菌株)与实心圆圈(在培养基中仅用硝酸盐预培养的RNAi菌株)),到那时ZnCys RNAi减弱菌株的脂质生成速率在已经接种了包括铵和硝酸盐的种子培养物的培养物与已经接种了仅包括作为氮源的硝酸盐的种子培养物的培养物之间无显著差异。此时可能已经在包括铵的培养基中预培养的培养物用尽了其还原氮源并且在与尚未在含铵培养基中预培养的培养物大致相同的程度上诱导脂质生物合成。对培养物中存在的氮的分析支持这种解释。对于细胞团块的总氮(TN)分析,离心10ml培养物样品,从团块中去除培养基,并且使每个团块重新悬浮在1ml超纯H2O中,然后将其转移到22ml小瓶中,向其中添加19ml超纯H2O。使用ShimadzuTOC-VCSH/VNM-1分析仪进行总氮分析。图19显示在已经接种了培养基中包括铵的预培养物的GE-13103培养物(空心圆圈)中,细胞团块中总氮的量明显比已经接种了仅包括硝酸盐(NO3)的预培养物的培养物(例如,实心圆圈)中更高。因此,似乎ZnCys RNAi减弱细胞,虽然能够利用硝酸盐生长(有持续的TOC积聚为证,例如图16C),但是只要存在低浓度的铵,例如低于约2mM或低于约1.5mM,仍然诱导脂质生物合成。
在如上所述的半连续产率测定中研究了半连续测定期间ZnCys-2845RNAi菌株GE-13103培养物中存在的铵量之间的关系,其中如以上实施例中所述,分析每日样品全培养物(培养基加细胞)的氮含量以及FAME含量。
图20用图表示出了在半连续培养的连续几天,培养物中存在的FAME和氮的量。通过将2ml培养物样品移至22ml小瓶中,向其中添加18ml超纯H2O,并且使用Shimadzu TOC-VCSH/VNM-1分析仪分析样品来测定全培养物总氮(TN)。从样品总氮中减去可以计算在PM074培养基内的硝酸盐的量以得出作为图19所示的铵存在的氮的量。因为PM124起始培养物中存在的铵逐渐被接种了PM124(NH4+NO3)起始培养物的培养物稀释,所以可以看到对于这种样品而言,当铵浓度(实心菱形)下降时FAME产量(空心菱形)上升。培养物中低于约2.5mM且特别是低于约2mM的铵水平,似乎会导致对RNAi减弱菌株(空心菱形)中FAME生成的诱导。
实施例11
ZnCys-2845减弱突变体的产率与可用NH4浓度之间的关系
在如实施例10中描述的半连续测定中进一步研究了ZnCys-2845RNAi菌株GE-13103中氮利用率与FAME产率之间的关系,除了在将铵浓度保持在三个不同水平下恒定的三份单独培养基中进行半连续测定外。该测定中还包括了野生型加的斯微拟球藻(WT-3730),其中野生型菌株在不包括铵(但是包括8.8mM作为唯一氮源的硝酸盐)的标准PM074培养基中培养。
在这项实验中,使用包括除8.8mM硝酸盐外还含有0.5mM、1.0mM或2.5mM铵的培养基的起始培养物接种测定瓶,测定瓶包括含相应量的铵(除8.8mM硝酸盐外)的培养基。达到稳态之后,每天用补充了铵的培养基稀释培养物,以便由包括0.5mM铵的种子培养物接种其中测定培养基包括0.5mM铵的一组一式三份的培养物并且在整个测定期间每天用含0.5mM铵的培养基稀释,由包括1.0mM铵的种子培养物接种另一组一式三份的培养物并且在整个测定期间包括1.0mM,并且由包括2.5mM铵的种子培养物接种第三组一式三份的培养物并且在整个测定期间包括2.5mM铵。在每种情况下,培养基均为包括8.8mM作为可被微生物使用的唯一氮源的硝酸盐,补充了适量NH4Cl以及5mM Hepes(pH 7.5)的PM074。结果可见于表22-24。测定所有样品,一式三份,并且提供的值是三份培养物的平均值。
图21A示出了对于保持在0.5mM、1.0mM或2.5mM铵的培养物而言(实心菱形和三角形,表示RNAi符号),在半连续培养的连续几天,培养物中存在的FAME的量。清晰可见,培养物的铵浓度从2.5mM(正方形)减少到1.0mM(三角形)使FAME产率增加,当铵浓度保持在0.5mM时(X),FAME产率甚至进一步增加(也参见表24)。
表24.培养物的每日FAME含量(mg/L):三个FAME值的平均值(sd)
图21B的表中提供了FAME产率。相对于仅含硝酸盐的培养基中(其不会诱导野生型菌株中的脂质生成)的野生型FAME产率,2.5mM NH4培养基中GE13103敲减菌株的FAME产率降低约15%。然而在较低铵浓度下,敲减突变体在测定过程中显示出比野生型菌株更高的FAME产率。例如,在铵浓度为1mM的培养基中,敲减突变体菌株展示出FAME产率每天平均增加22%,而在0.5mM铵时,GE-13103相对于野生型菌株展示出FAME产率每天平均增加77%,即,GE-13103敲减菌株在极低的铵浓度下生成几乎多达野生型所生成的两倍的FAME脂质。
然而,图21C显示培养基的铵浓度降低到2.5mM NH4以下对GE13103敲减突变体的TOC积聚没无重大影响(表25)。
表25.每日TOC含量(g/m2/天):三个值的平均值(sd)
例如,在0.5mM铵中培养的敲减突变体菌株的平均TOC日产率与氮充足(仅含硝酸盐)的条件下的野生型的平均TOC日产率基本上相同(图21D)。因此,在至少10天的培养期内相对于氮充足条件中的野生型细胞,GE-13103敲减突变体展示出多至少75%的脂质产率,而未展示出生物质产率降低。如图21F所示,正如通过流式细胞术测定的细胞计数,对于整个测定中的指定铵浓度而言保持合理一致,表明在整个半连续测定中在所有条件下,包括其中诱导低铵培养物进行脂质生物合成的条件,细胞分裂活跃,正如含1mM铵和0.5mM铵的培养物升高的FAME/TOC比率所指示那样(正如图21E中所展示那样)。
图21E中示出了在具有不同铵浓度的培养基中培养的GE-13103敲减突变体的FAME/TOC比率。当铵浓度介于约1mM和约2.5mM之间时,FAME/TOC比率保持在约0.3和0.4之间,但是当铵浓度从约1.0mM降低到约0.5mM时进一步增加,在培养基中使用0.5mM铵的整个测定中保持接近0.5,例如在介于约4.0和约6.0之间的范围内,并且在介于约4.5和约5.5的区域内(参见表26)。
表26.FAME/TOC比率:三个重复的FAME/TOC值的平均值(sd)
因此,通过减弱此处所提供的调控脂质生物合成的基因的表达而获得的菌株能够活跃地分裂,同时比野生型生成多得多的脂质。在整个测定中维持升高的脂质生成水平而TOC积聚不下降的能力(图22),表明本文提供的突变体可以例如在连续和半连续培养物中提供持续高水平的脂质生成。
实施例12
ZnCys突变体的蛋白质、碳水化合物和脂质含量的分析
在以上实验中(例如,实施例4),两者均在铵的存在下培养时(图8A-C),发现敲除突变体菌株GE-8564的FAME和TOC产率与野生型菌株基本上相等,表明硝酸盐同化的瓶颈导致仅在硝酸盐用作唯一氮源时观察到的脂质产量增加的显著表型。观察到ZnCys-2845敲减突变体表现出FAME产率大幅增加(表16和图13A以及图16A和16B)及约1%至约33%的最低限度的TOC减少(表17和图13B;图16C)。图17A和17B的图表中,分别示出了包括野生型、ZnCys-2845BASH-3、ZnCys-2845BASH-12和ZnCys-2845RNAi菌株GE-13103的半连续测定的FAME和TOC产率。与野生型菌株和Cas9祖系相比,ZnCys BASH-3、ZnCys BASH-12和ZnCysRNAi全部表现出FAME面积产率增加(对于ZnCys RNAi-7而言高达103%)和大约5-15%的仅最低限度的TOC减少(图18)。为确定碳如何分配给主要类别的生物分子,使菌株在实施例10中描述的半连续测定系统中生长,其中PM074稀释培养基包括作为唯一氮源的硝酸盐。在这项测定中RNAi系展示出FAME产率增加而敲除系无法维持生长(图22A-D)。评估来自这些培养物的菌株的碳水化合物、脂质和蛋白质,其合起来占TOC的约75%。
对于脂质的HPLC分析,各2ml培养物样品以最大速度离心5分钟,去除上清液,并且使团块重新悬浮在400μL的H2O中。将细胞悬浮液(大约500μL)转移到4ml带有特氟隆衬里帽的玻璃小瓶中。向每份细胞悬浮液添加500μL玻璃珠(212-300μm直径),之后添加50μL的50%H2SO4和100μL的5M NaCl。在1krpm下进行珠粒敲打5分钟,然后向每份样品添加2ml己烷,并在1krpm下重复珠粒敲打5分钟。将样品装载到多管涡旋器中并且在1krpm下振荡30分钟,然后在2.5krpm下涡旋30秒。将500μL有机层转移到HPLC小瓶中,并向每个小瓶添加50μL内部标准溶液(1mg/ml于甲苯中的6-酮胆甾烷醇)。标准品来自NuCheck、Sigma-Aldrich或Supelco。在HPLC分析之前为小瓶加帽并短暂涡旋(在2.5krpm下5秒)。以2ml/分钟的流量在Chromegasphere SI-60 150mm x 4.6mm x 10μm柱(ES Industries)上运行HPLC,柱室设为40℃。注射体积为25μL,吸取和喷射速度为200μL/分钟。洗脱液A为己烷且洗脱液B是己烷、异丙醇、乙酸乙酯和10%于异丙醇中的甲酸的80:10:10:1混合物,按如下梯度程序运行:0.0分钟时2%B;1.0分钟时2%B;8.0分钟时35%B;8.5分钟时98%B;11.5分钟时98%B;11.6分钟时2%B;停止时间:11.6分钟;之后的时间5分钟。检测器是30℃和3.5巴N2的ELSD,增量为5。
离心三次,接着用PBS洗涤后,对~0.7mg TOC当量的在磷酸盐缓冲盐水(PBS)中浓缩至0.5ml的细胞培养物进行总碳水化合物分析。通过添加0.5ml去离子H2O和1ml 6N HCl及作为内部标准品,各自最终浓度为50μg/ml的U-13C-葡萄糖和-半乳糖,使用酸水解将碳水化合物转化为其组成单体。在带有PTEE衬里帽的玻璃小瓶中在105℃下加热样品1小时。100μl经室温冷却、3,000g离心(1分钟)的样品等分试样在EZ-2Genevac(Stoneridge,NY)中干燥并用MSTFA/TMCS衍生化并且根据Ruiz-Matute等人(2011)J.Chromatogr B AnalytTechnol Biomed Life Sci 879:1226-1240通过GC-MS分析。使用13C标记的内部标准品量化主要碳水化合物单体(葡萄糖和半乳糖)的浓度,并估计低丰度糖类(阿拉伯糖、鼠李糖、木糖和甘露糖)的浓度。将这些汇总以得到按ug/ml计的总糖浓度,用0.45的倍增因数(即,碳占碳水化合物质量的~45%)将其转化为总碳水化合物的碳含量。该值除以在浓缩细胞培养物的相同等分试样中检测到的TOC的量以估计分配给碳水化合物的碳的百分比。
通过使用改良方法根据来自Phenomenex(Torrance,CA)的EZ:faast试剂盒衍生化全氨基酸水解产物来进行总氨基酸分析。简单地说,向0.5ml浓缩细胞(如以上对于碳水化合物分析所述)添加800ul含200μl/ml巯基乙酸的6N HC1、10ul对-巯基乙醇和200ul的2mM正缬氨酸(内部标准品)并且在110℃下孵育涡旋样品24小时。冷却至室温的样品在1,500g下离心1分钟并将50μl等分试样转移到新的2ml GC小瓶中。等分试样经衍生化并根据EZ-faast手册和(8)通过GC-MS分析。这种方法允许量化Ala、Gly、Val、Leu、Ile、Pro、Asp+Asn、Met、Glu+Gln、Phe、Lys、Tyr和Cys;Trp、Thr、Ser、Arg和His除外。将每种检测到的水解氨基酸的体积浓度转化为以该量存在的碳含量。将这些值汇总并归一化为如以上对于总碳水化合物所述的TOC以给出分配给蛋白质的碳的估计值。
结果见于图23,其中可以看到两种减弱ZnCys突变体ZnCys-BASH-12和ZnCys RNAi与野生型菌株相比有大约45-50%的蛋白质减少,伴随菌株中大约90-125%的脂质增加。一致地,观察到ZnCys敲除菌株具有最高的C:N比,而ZnCys RNAi显示出更多中间水平(图22C),表明可能存在使脂质产率达到最大的阈值C:N值。ZnCys敲除菌株似乎超过该阈值,将如此多的碳分配给脂质以致总体生物质和脂质产率受到负面影响。相反,在这组基因减弱突变体中,ZnCys RNAi对于脂质产率而言似乎具有在约10-15范围内的最佳C:N值。
表27.野生型和ZnCys敲减菌株的蛋白质、碳水化合物和脂质(FAME)%组成
BASH-12菌株GE-1112将其大约38%的碳分配给FAME脂质,并将其大约22%的碳分配给蛋白质,而RNAi菌株GE-13103将其大约43%的碳分配给脂质,并将其大约20%的碳分配给蛋白质。这与仅含硝酸盐的培养基中的野生型细胞不同,所述野生型细胞将大约20%的碳分配给脂质,并将大约40%的碳分配给蛋白质。(在突变体和野生型细胞中,大约10-15%的碳分配给碳水化合物。)因此ZnCys基因减弱(“敲减”)突变体向脂质的碳分配增加90-120%(相对于野生型的脂质产率加倍),主要以向蛋白质的碳分配为代价,其相对于在相同条件下培养的野生型细胞中向蛋白质的碳分配,降低约40-50%。
实施例13
ZnCys-2845敲除和敲减突变体的转录组学分析
当培养基补充了铵时ZnCys-2845敲除菌株GE-8564积聚与野生型细胞基本上相同水平的FAME和TOC的能力(表7-9,图8),表明突变体在硝酸盐同化方面受损。为进一步研究这些突变体中的氮同化,通过qRT-PCR测定关键N-同化基因的稳态mRNA水平以更好地理解在诱导(仅含硝酸盐的培养基)和非诱导(补充铵)条件下突变体中的N缺乏。
使用实施例2中描述的相同Cas9编辑系工程改造硝酸还原酶突变体。简单地说,设计具有加的斯微拟球藻硝酸还原酶基因Naga_100699g1的一部分编码区的靶序列的向导RNA。如实施例3公开那样合成向导RNA(具有靶序列SEQ ID NO:193),并且连同实施例2中所述的供体片段(SEQ ID NO:44)一起转化到Cas9编辑系中。所得硝酸还原酶敲除菌株(NR-KO)用作不能同化硝酸盐的对照,因为当硝酸盐是唯一氮源时功能性硝酸还原酶是同化氮所必需的。实际上,NR-KO菌株在仅含硝酸盐的培养基中培养时处于氮饥饿。
通过qRT-PCR评估关键N-同化基因的稳态mRNA水平以更好地理解在诱导(NO3 -)和非诱导(NH4 +)条件下突变体中的N缺乏,其中通过Cas9介导的诱变产生的硝酸还原酶突变体(NR-KO)用作依赖NO3 -生长的N饥饿对照。依赖包括铵的培养基生长时,对于N同化基因集合而言所有菌株共有类似的基因表达谱,关于在用含铵培养基培养时的生物质和FAME积聚,与其野生型表型一致(图24,2-5列所示的ZnCys敲除、ZnCys RNAi敲减、野生型和NR敲除的铵转录曲线)。
表28.通过定量实时PCR测量的转录物的引物序列
然而,依赖作为唯一氮源的硝酸盐生长时,NR-KO显示出与ZnCys突变系截然不同的表达谱(图24,第1列与第6和7列比较显示ZnCys-2845敲除和RNAi敲减突变体的转录谱)。与先前关于缺N加的斯微拟球藻的报告一致(Radakovitz等人2012),涉及N同化的许多基因在NR-KO中剧烈上调(用红色示出),包括两种铵转运体(AMT1和AMT2)、谷氨酸合成酶(GOGAT1)、NO3 -转运体(NRT2)和亚硝酸还原酶(NiR)。有趣的是,对于ZnCys突变体未观察到这种反应。事实上,经ZnCys-2845敲除和ZnCys-2845RNAi敲减工程改造的突变体的基因表达谱更加类似于这些条件下的野生型,尽管在ZnCys-2845敲除中相对于野生型,NiR和NRT2显著下调,从而提供了对细胞的N缺乏的可能解释(图22C)。通过蛋白质印迹对蛋白质水平的分析显示,在ZnCys-2845敲除菌株GE-8564的提取物中未能检测到硝酸还原酶,而在ZnCys-2845RNAi敲减菌株GE-13103提取物以及野生型提取物中检测到信号(图25)。同样,在GE-8564中对于氮同化酶谷氨酰胺酮戊二酸氨基转移酶(GOGAT1)观察到极弱的信号,而对于GE-13103更加明显。
还使用针对ACC酶和脂肪酸合成(FAS)途径组分的特异性肽抗体评估了质体脂质生物合成器中的蛋白质水平变化(图25)。为了产生抗体,合成两种肽(表29中的#1和#2)并注入兔子体内。示出末端半胱氨酸用于参考。
表29.用于生成检测加的斯微拟球藻中的脂肪酸生物合成酶的抗体的肽序列
与野生型相比,在ZnCys突变体中这些酶的水平没有明显更高,并且在该情况下NR-KO、ACC酶和KAR1减少。这些数据表明鉴于在ZnCys-2845RNAi敲减菌株GE-13103中观察到的FAME产率增加~100%,在N充足条件下质体脂质生物合成器已经以能够使得向脂肪酸的流量至少加倍的容量存在。这个结论与对于缺N微拟球藻所观察到的转录变化一致,其中涉及向脂质生物合成提供碳前体的途径似乎比“核心”脂质生物合成途径更具差异性地表达(Radakovitz等人2012,Carpinelli等人2014,Li等人2014)。
为了进一步了解允许ZnCys-2845减弱系组成性地生成脂质并维持生长的机制,我们分析了稳态生长条件期间ZnCys-2845RNAi菌株GE-13103的全局转录谱(例如,图17)。使用2倍截止值和FDR<0.05,发现在仅含硝酸盐的培养基中1118个基因在ZnCys-RNAi-7和野生型之间差异性表达。其中,在突变体中790个上调而328个下调。通过“分子功能”、“生物学过程”或“细胞组分”对富集基因本体(GO)类别的下调基因集合的分析揭示,涉及光合作用和捕光的基因在突变体中相对于野生型有过多的代表(表30)。
表30.对应于ZnCys_RNAi-7中下调的基因的有过多代表的基因本体类别
+BP,生物学过程;CC,细胞组分;MF,分子功能
++DE,差异性表达的基因
+++FDR,错误发现率
对上调基因集合进行的相同分析揭示,在减弱ZnCys-2845RNAi菌株GE-13103中蛋白质合成的组分显著富集(表31)。考虑到我们对生物质组成的分析表明GE-13103中的总蛋白质含量降低大约45%(图23),翻译器的上调和光合装置的下调很可能是对该缺乏的反应。
表31.对应于ZnCys-2845RNAi菌株GE-13103中上调的基因的有过多代表的基因本体(GO)类别
+BP,生物学过程;CC,细胞组分;MF,分子功能
++DE,差异性表达的基因
+++FDR,错误发现率
与我们的qRT-PCR发现一致(图24),对N同化基因的分析揭示了可以解释突变体中低N-水平的几个关键下调基因,包括亚硝酸还原酶、两种谷氨酰胺合成酶(GS1和GS2)、铵转运体(AMT1)和涉及钼辅因子生物合成(MoeA/CNX1)(硝酸还原酶活性所必需的辅因子)的关键酶(表29)。
表32.涉及N同化的差异性表达基因的平均转录物水平和倍数变化
+FPKM,每百万个映射读序每千碱基的转录物的片段数
++FC,相对于野生型在ZnCys-RNAi-7中的基因的倍数变化
+++FDR,错误发现率
GO类别分析未发现涉及脂质生物合成的基因的统计学富集。然而,在手工编排该列表时,使用与以上相同的过滤标准将与甘油脂质生物合成有关的26个基因鉴定为上调(表30)。这些基因包括6种脂肪酸去饱和酶、延伸酶、脂肪酶和未知底物特异性的酰基转移酶及被认为是脂滴主要结构组分的脂滴表面蛋白(LDSP)(Vieler等人(2012)PlantPhysiol.158:1562-1569)。
表33.涉及甘油脂质生物合成的差异性表达基因的平均转录物水平和倍数变化
+FPKM,每百万个映射读序每千碱基的转录物的片段数
++FC,相对于野生型在ZnCys-RNAi-7中的基因的倍数变化
+++FDR,错误发现率(对于基因而言以FDR<0.05显示转录物水平)
与我们的ACC酶和FAS的蛋白质印迹数据一致(图25),未发现编码这些酶的转录物相对于野生型在突变体中差异性表达,也未观察到编码二酰基甘油酰基转移酶(DGAT)的基因的差异性调控或导致TAG生物合成的其它酶促步骤。
虽然已经参考以上实施例描述了本发明,但应理解修改和变型涵盖在本发明的精神和范围内。因此,本发明仅受以下权利要求的限制。
序列表
<110> 合成基因组股份有限公司
I·阿加维
E·R·莫里林
L·索里亚戈
M·阿奎
<120> 脂质产率增加的微生物
<130> SGI1920-2
<150> US 62/192,510
<151> 2015-07-14
<150> US 62/318,161
<151> 2016-04-04
<160> 193
<170> PatentIn 3.5版
<210> 1
<211> 3198
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845蛋白质编码序列(cDNA)
<400> 1
atgaccacct tcttgaatcc aggcccggca agggagaaac tcgtgggcag tggcgtcttt 60
ttcgaaggca gcatcggggt cgtcgggcac gagtcaggcg ggggagttgg gagccaggac 120
gagatggaca cggaccattt caacgagcta gaccacatat tcgacttgtc gtacagcgcg 180
gaacaggacc cttttggctc gggcagcggg cacgcgcaga gtcagggcac tgggtatggg 240
catccgcccc agacgcagct cgggggcgcc agtctcttga tgccccaccc acacaacagc 300
catggcgcga tcagccacga cggctctcgc atgcacaacg atggcatgga ttggcgcgcg 360
aaggatgagg actgctcgta ccacaccgcc gtggacgcca gctgccacat cgacagtagc 420
taccaccatg ttgatgcctc aggccactcc atggtcgacg cctcgggtca cagcacgata 480
gacgcgtcgg gccacgactc cctcatcgac tcaagcggcc attacgacga ctatctggcg 540
cacaaggggg acgcccgcta catggagcac agttgtgaag cctgcaagcg ctcgaagaaa 600
cgatgcaacc gccgcaaccc ctgccagatc tgcacctcca ggggcatcaa gtgtgtgccg 660
caaatccggg gtcctgggcg ccccccgggc agtaaaagca gtcggggctg cacctccttg 720
tcactgagca gctcacggca tggaagctcc aggggtgaca tacgcgccgc gaacggaagc 780
gggcagagcc acaacagcag tgccacgaca tcggccgcct cctccacctc ctcctccttg 840
tcccgctccc tctccgggaa tggcctactc caacagggcc aggagttggc cgtcggcgcc 900
cggcggcact ctcccccccg cgacccctgg cactgtcgct ttttcttcga ggccgcccgc 960
cactgcaaag aggccttcct gcggacgtgg cacgataacg agctggacac cgccaagtgc 1020
atcatgctca ggaatttgtg gacgaaagtc tcgtcgcaac tggcctctgg cacggatatg 1080
acctttggga tctgcgacca gctgcaagag gtggtggggc ccgcccccac gggctctggt 1140
cccatggccg ggagccccgc cacgcgctcc aagagccacg cggcgcagca ggcgcaactc 1200
ctcacgcacc ccggttcgaa agaggccatg ggccctcact gcctgcccct ggacttgcga 1260
agaatggagg acggcgtctc catgctgtgc ggcttcatgt tcttgcagga cgagcttttc 1320
gtctacacgg acgagcgttt cgcggccacc ttcatgacgc gggaagaggt ggagtccaag 1380
gtcggctccc tcgcggtgct gcccatcctc ctgctcgcgg agatcttcca ccccgacgac 1440
ctccctgaca tctacgcggc catcggtgct tactggtttt ctcgccgctc ctctaccacg 1500
tcagagagcg ggagcagcag cagcagcagc acaaacagca gtgtcagcag tgcggggagt 1560
cgggagtcgg cggcctcggc cacaggcacc ccggaggcgt cctggatctg caaatgcatc 1620
gacaaggcga acacggaagt gacggccttc gtgcgcttcc gctctttcgt cgcacctgcg 1680
gagggctacc ccggggcggc catgctctcc atcctgccct taaaaccgag caagtatctc 1740
gcggacccgg acactaaggg gagtgtcagg tctggggtgt cgtcgcgctt gcagatgagg 1800
gacaccttcg gagccttgcc cacagccctg ccggagcaag acgacgagga ccttggcgac 1860
gatttggtcg ggcggcgacc gtcggtggat cgcatggagg gcctggggcc cggggccggg 1920
gagggccagg accctgagag cgacgacgcc ttattccggc cccttcggag gggcatgacc 1980
gtgctctcgg atgagacgag cgggccgcag gctgtgcctg tcgcaaagca ggtttcagac 2040
cccggcgtac agcaccagga tcacgcctgc tacagccagc ctaccataca catatcccag 2100
ctgtcgagcg cccttcggag cacggtgggc ttgtcgtggg ggggggaggg gaccgaccgc 2160
agtggggaat cttttccatc gtcgcagttc tcctcccatg ctcagacgca aggtggacaa 2220
tcatcttctg gtctcccgca agatggcaaa agctgtggtg gttaccctgc ctcggatgat 2280
ggtcgtgggg gggacatgac ggacggggtt ctgcccattg cacaacttac caaggcccaa 2340
attttccttc tgcaagaaga gggtggtgtt tctggtcgag acctccccgc tgccggcgac 2400
aattcatcat atggcgattt agccagcggg agagagggcc aagggggtcg ccgtcatcaa 2460
cgaaaggaac aagagtcgcg gaagcaccct gaccctcggg atggacacac cctccctgca 2520
agtggattga cgatggacga ggaggataca ggaagcgtgg ttacagactt tgagatttac 2580
ggctccagtc ccagtccgga gcccggccag tcccttaata cttcctcacg aggctcggca 2640
aggttgcaga tgcaggcctc gagccagggg gggcaccaaa cgtactttgg acgacacgag 2700
cacatggaaa agcaaaatcg agaggaggtg cagcgactgc cgatggctcc accctctgta 2760
agtttcgccc aggcggggga gctatccagt gatcgacgag cgagttgcgc gggcttgagc 2820
atcctaggcg gacctgctgg gaaagtggaa ggctccaggg gatccctgag ccacagtaag 2880
agtaacaacg acctggacat atcgtgtcat gggcccgccg atcccaacgg ctacggtggg 2940
ttgcagtgga cgccggctcc actggcgtct ctgctggggg ccaagggcct actagaggcg 3000
gggaacgggg tgggcgatca cgcgatctcg tcggttcacg ccaatcaggg gcctgcccac 3060
cagaagcgtc ggacgagccg cgcggggtcg cggaccgttc ctgccaacaa tggtggcgat 3120
aataccgcgg ggagcgcagc gatcgcgggc gcgaaggatg aagaggcgga gccaggcttt 3180
cttgcccgct ctttgtga 3198
<210> 2
<211> 1065
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845蛋白质序列
<400> 2
Met Thr Thr Phe Leu Asn Pro Gly Pro Ala Arg Glu Lys Leu Val Gly
1 5 10 15
Ser Gly Val Phe Phe Glu Gly Ser Ile Gly Val Val Gly His Glu Ser
20 25 30
Gly Gly Gly Val Gly Ser Gln Asp Glu Met Asp Thr Asp His Phe Asn
35 40 45
Glu Leu Asp His Ile Phe Asp Leu Ser Tyr Ser Ala Glu Gln Asp Pro
50 55 60
Phe Gly Ser Gly Ser Gly His Ala Gln Ser Gln Gly Thr Gly Tyr Gly
65 70 75 80
His Pro Pro Gln Thr Gln Leu Gly Gly Ala Ser Leu Leu Met Pro His
85 90 95
Pro His Asn Ser His Gly Ala Ile Ser His Asp Gly Ser Arg Met His
100 105 110
Asn Asp Gly Met Asp Trp Arg Ala Lys Asp Glu Asp Cys Ser Tyr His
115 120 125
Thr Ala Val Asp Ala Ser Cys His Ile Asp Ser Ser Tyr His His Val
130 135 140
Asp Ala Ser Gly His Ser Met Val Asp Ala Ser Gly His Ser Thr Ile
145 150 155 160
Asp Ala Ser Gly His Asp Ser Leu Ile Asp Ser Ser Gly His Tyr Asp
165 170 175
Asp Tyr Leu Ala His Lys Gly Asp Ala Arg Tyr Met Glu His Ser Cys
180 185 190
Glu Ala Cys Lys Arg Ser Lys Lys Arg Cys Asn Arg Arg Asn Pro Cys
195 200 205
Gln Ile Cys Thr Ser Arg Gly Ile Lys Cys Val Pro Gln Ile Arg Gly
210 215 220
Pro Gly Arg Pro Pro Gly Ser Lys Ser Ser Arg Gly Cys Thr Ser Leu
225 230 235 240
Ser Leu Ser Ser Ser Arg His Gly Ser Ser Arg Gly Asp Ile Arg Ala
245 250 255
Ala Asn Gly Ser Gly Gln Ser His Asn Ser Ser Ala Thr Thr Ser Ala
260 265 270
Ala Ser Ser Thr Ser Ser Ser Leu Ser Arg Ser Leu Ser Gly Asn Gly
275 280 285
Leu Leu Gln Gln Gly Gln Glu Leu Ala Val Gly Ala Arg Arg His Ser
290 295 300
Pro Pro Arg Asp Pro Trp His Cys Arg Phe Phe Phe Glu Ala Ala Arg
305 310 315 320
His Cys Lys Glu Ala Phe Leu Arg Thr Trp His Asp Asn Glu Leu Asp
325 330 335
Thr Ala Lys Cys Ile Met Leu Arg Asn Leu Trp Thr Lys Val Ser Ser
340 345 350
Gln Leu Ala Ser Gly Thr Asp Met Thr Phe Gly Ile Cys Asp Gln Leu
355 360 365
Gln Glu Val Val Gly Pro Ala Pro Thr Gly Ser Gly Pro Met Ala Gly
370 375 380
Ser Pro Ala Thr Arg Ser Lys Ser His Ala Ala Gln Gln Ala Gln Leu
385 390 395 400
Leu Thr His Pro Gly Ser Lys Glu Ala Met Gly Pro His Cys Leu Pro
405 410 415
Leu Asp Leu Arg Arg Met Glu Asp Gly Val Ser Met Leu Cys Gly Phe
420 425 430
Met Phe Leu Gln Asp Glu Leu Phe Val Tyr Thr Asp Glu Arg Phe Ala
435 440 445
Ala Thr Phe Met Thr Arg Glu Glu Val Glu Ser Lys Val Gly Ser Leu
450 455 460
Ala Val Leu Pro Ile Leu Leu Leu Ala Glu Ile Phe His Pro Asp Asp
465 470 475 480
Leu Pro Asp Ile Tyr Ala Ala Ile Gly Ala Tyr Trp Phe Ser Arg Arg
485 490 495
Ser Ser Thr Thr Ser Glu Ser Gly Ser Ser Ser Ser Ser Ser Thr Asn
500 505 510
Ser Ser Val Ser Ser Ala Gly Ser Arg Glu Ser Ala Ala Ser Ala Thr
515 520 525
Gly Thr Pro Glu Ala Ser Trp Ile Cys Lys Cys Ile Asp Lys Ala Asn
530 535 540
Thr Glu Val Thr Ala Phe Val Arg Phe Arg Ser Phe Val Ala Pro Ala
545 550 555 560
Glu Gly Tyr Pro Gly Ala Ala Met Leu Ser Ile Leu Pro Leu Lys Pro
565 570 575
Ser Lys Tyr Leu Ala Asp Pro Asp Thr Lys Gly Ser Val Arg Ser Gly
580 585 590
Val Ser Ser Arg Leu Gln Met Arg Asp Thr Phe Gly Ala Leu Pro Thr
595 600 605
Ala Leu Pro Glu Gln Asp Asp Glu Asp Leu Gly Asp Asp Leu Val Gly
610 615 620
Arg Arg Pro Ser Val Asp Arg Met Glu Gly Leu Gly Pro Gly Ala Gly
625 630 635 640
Glu Gly Gln Asp Pro Glu Ser Asp Asp Ala Leu Phe Arg Pro Leu Arg
645 650 655
Arg Gly Met Thr Val Leu Ser Asp Glu Thr Ser Gly Pro Gln Ala Val
660 665 670
Pro Val Ala Lys Gln Val Ser Asp Pro Gly Val Gln His Gln Asp His
675 680 685
Ala Cys Tyr Ser Gln Pro Thr Ile His Ile Ser Gln Leu Ser Ser Ala
690 695 700
Leu Arg Ser Thr Val Gly Leu Ser Trp Gly Gly Glu Gly Thr Asp Arg
705 710 715 720
Ser Gly Glu Ser Phe Pro Ser Ser Gln Phe Ser Ser His Ala Gln Thr
725 730 735
Gln Gly Gly Gln Ser Ser Ser Gly Leu Pro Gln Asp Gly Lys Ser Cys
740 745 750
Gly Gly Tyr Pro Ala Ser Asp Asp Gly Arg Gly Gly Asp Met Thr Asp
755 760 765
Gly Val Leu Pro Ile Ala Gln Leu Thr Lys Ala Gln Ile Phe Leu Leu
770 775 780
Gln Glu Glu Gly Gly Val Ser Gly Arg Asp Leu Pro Ala Ala Gly Asp
785 790 795 800
Asn Ser Ser Tyr Gly Asp Leu Ala Ser Gly Arg Glu Gly Gln Gly Gly
805 810 815
Arg Arg His Gln Arg Lys Glu Gln Glu Ser Arg Lys His Pro Asp Pro
820 825 830
Arg Asp Gly His Thr Leu Pro Ala Ser Gly Leu Thr Met Asp Glu Glu
835 840 845
Asp Thr Gly Ser Val Val Thr Asp Phe Glu Ile Tyr Gly Ser Ser Pro
850 855 860
Ser Pro Glu Pro Gly Gln Ser Leu Asn Thr Ser Ser Arg Gly Ser Ala
865 870 875 880
Arg Leu Gln Met Gln Ala Ser Ser Gln Gly Gly His Gln Thr Tyr Phe
885 890 895
Gly Arg His Glu His Met Glu Lys Gln Asn Arg Glu Glu Val Gln Arg
900 905 910
Leu Pro Met Ala Pro Pro Ser Val Ser Phe Ala Gln Ala Gly Glu Leu
915 920 925
Ser Ser Asp Arg Arg Ala Ser Cys Ala Gly Leu Ser Ile Leu Gly Gly
930 935 940
Pro Ala Gly Lys Val Glu Gly Ser Arg Gly Ser Leu Ser His Ser Lys
945 950 955 960
Ser Asn Asn Asp Leu Asp Ile Ser Cys His Gly Pro Ala Asp Pro Asn
965 970 975
Gly Tyr Gly Gly Leu Gln Trp Thr Pro Ala Pro Leu Ala Ser Leu Leu
980 985 990
Gly Ala Lys Gly Leu Leu Glu Ala Gly Asn Gly Val Gly Asp His Ala
995 1000 1005
Ile Ser Ser Val His Ala Asn Gln Gly Pro Ala His Gln Lys Arg
1010 1015 1020
Arg Thr Ser Arg Ala Gly Ser Arg Thr Val Pro Ala Asn Asn Gly
1025 1030 1035
Gly Asp Asn Thr Ala Gly Ser Ala Ala Ile Ala Gly Ala Lys Asp
1040 1045 1050
Glu Glu Ala Glu Pro Gly Phe Leu Ala Arg Ser Leu
1055 1060 1065
<210> 3
<211> 30
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845的Zn(2)-Cys(6)双核集群结构域
<400> 3
His Ser Cys Glu Ala Cys Lys Arg Ser Lys Lys Arg Cys Asn Arg Arg
1 5 10 15
Asn Pro Cys Gln Ile Cys Thr Ser Arg Gly Ile Lys Cys Val
20 25 30
<210> 4
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Zn(2)-Cys(6)双核集群结构域的保守性基序
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (5)..(10)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (12)..(12)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (14)..(15)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (17)..(17)
<223> Xaa可为任何自然存在的氨基酸
<400> 4
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Cys Xaa Cys Xaa Xaa Cys
1 5 10 15
Xaa Cys
<210> 5
<211> 696
<212> PRT
<213> 三角褐指藻
<400> 5
Met Asn Glu Asp Ser Thr Glu Asp Pro Asp Asp Gly Ser Val Ala Leu
1 5 10 15
Cys Ala Ser Cys Asp Arg Cys Arg Ser Arg Lys Thr Lys Cys Asp Gly
20 25 30
Gln Arg Pro Cys Gly Asn Cys Leu Ala Lys Tyr Met Lys Lys Asn Lys
35 40 45
Leu Ser Ser Ala Asp Gly Ile Asp Phe Thr Glu Cys Glu Cys Val Tyr
50 55 60
Ser Pro Ala Lys Arg Arg Gly Pro Ile Pro Gly Arg Thr Ala Gly Gln
65 70 75 80
Ala Arg Lys Ala Thr Glu Leu Gln His His Gln Gln Gln Gln Pro Asn
85 90 95
Asp Trp Pro Gln Asn Tyr His Asn Asn Pro Ser Thr Gly Val Asn Leu
100 105 110
Asn Gly Thr Gly Leu Asp Ala Gln Met Thr Ala Ala Leu Phe Ser Gly
115 120 125
Gln Thr Glu Gln Ala Ser Leu Gln Gln Lys Leu Asn Phe Leu Gln Ser
130 135 140
Leu Gln Asn Gln Asp Glu Asp His Leu Met Met Gln Gln Gln Gln Gln
145 150 155 160
Gln His Gln Met Asp Glu Pro Ala Asn Arg Arg Val Lys Arg Glu Asp
165 170 175
Ala Gly Gln Asn Thr Ser Thr Asn Gly Ile Pro Arg Thr Ile Thr Thr
180 185 190
His Thr His Leu Leu Glu Arg Ser Asn Pro Asp Gly Ala Arg Leu Arg
195 200 205
Ala Tyr Tyr Gln Leu Ser Ile Asp Glu Leu Tyr Arg Leu Pro Pro Ile
210 215 220
Pro Thr Asp Glu Glu Tyr Cys Ala Arg Leu Asn Val Pro Gly Met Thr
225 230 235 240
Pro Gln Met Ile Pro Gly Pro His Leu Ala Ala Leu Ser Ala Ala Arg
245 250 255
Phe Ala Glu Ile Ala Leu Gly Ala Leu Val His Asn Glu Val Ser Leu
260 265 270
Ala Met Glu Leu Cys Asn Ala Val Val His Cys Leu Arg Glu Ser Val
275 280 285
Gln Glu Pro Val Gln Thr Pro Val Met Phe Glu Val Ala Lys Ala Tyr
290 295 300
Phe Leu Leu Gly Val Phe Arg Ala Cys Arg Gly Asp Met Glu Arg Tyr
305 310 315 320
Phe Lys Tyr Arg Arg Val Cys Met Thr Tyr Leu Ala Lys Leu Glu Asn
325 330 335
Asp Asp Lys Thr Ala Val Leu Leu Ala Ala Val Ala Tyr Leu Asp Ser
340 345 350
Trp Ala Pro Tyr Ala Thr Gln Thr Glu Leu Lys Tyr Asp Val Lys Leu
355 360 365
Asp Ala Gly Ala Ile Ala Ser Asp Pro Lys Asn Gln Asn Trp Ile Gln
370 375 380
Gly Ala Pro Pro Val Tyr Leu Asn Asn Glu Ala Pro Leu His Ala Arg
385 390 395 400
Ala Leu Asp Ala Leu Ala Cys Ala Val Arg Thr Cys Cys Asp Gln Ala
405 410 415
Asn Ser Arg Phe Ala Leu Ile Ser Lys Glu Ala Asn Ile Glu Gly Leu
420 425 430
Asp Thr Ile Pro Ser Glu Ser Ile Ser Ser Ala Thr Tyr Asn Ala Val
435 440 445
Leu Ser His Glu Asn Glu Leu Cys Ser Arg Asn Ile Val Leu Ser Ala
450 455 460
Tyr Thr Leu Met Gln Gln His Glu Ser Thr Asp Ser Ser Arg His Lys
465 470 475 480
Asn Glu Gly Gln His Met Val Ile Ser Ala Met Asp Ala Phe Leu Glu
485 490 495
Asn Ser Asp Glu Asp Gly Asn Gly Gly Phe Thr Asp Ser Gln Ile Gln
500 505 510
Ser Leu Leu Ser Val Cys Asn Thr Ala Ile Glu Asn Pro Phe Leu Leu
515 520 525
His His Ala Gly Pro Thr Tyr His Met Val Ser Asn Ala Ala Val Leu
530 535 540
Leu Cys His Leu Leu Asn Gly Leu His Met Ala Lys Met Asn Gly Gln
545 550 555 560
Asp Phe Gly Arg Met Glu Gln Ser Met Phe Glu Glu Val Phe Asp Ala
565 570 575
Phe Ile Ser Ile Arg Lys Leu Leu Thr Ile His Arg Arg Lys Leu Pro
580 585 590
Val Lys Leu Arg Cys His Ala Ile Pro Arg Pro Ser Met Asp Gly Leu
595 600 605
Lys Glu Gly Gln Pro Leu Ile Asp Leu Gly Glu Thr Ile Leu Cys Ala
610 615 620
Cys Arg Gly Cys Gln Gly Phe Val Leu Met Ala Cys Ser Pro Cys Val
625 630 635 640
Ala Ala Glu Arg Ala Gln Ala Ala Gln His Asp Leu Ser Val Glu Ala
645 650 655
Ala Lys Glu Ala Glu Ala Ile Glu Met Gly Glu Leu Asp Asn Glu Leu
660 665 670
Asp Asn Leu Gly Ala Glu Phe Asp Met Asp Asp Asp Met Leu Leu Gly
675 680 685
Met Ile Ser Asn Leu Ile Ser Ser
690 695
<210> 6
<211> 248
<212> PRT
<213> 舟形藻类
<400> 6
Met Ala Cys Thr Ala Cys His Leu Ala Lys Arg Lys Cys Asp Lys Lys
1 5 10 15
Ser Pro Cys Ser Arg Cys Ile Ser Lys Ser Leu Glu Cys Ile Pro His
20 25 30
Ile Ser Arg Gln Gly Lys Lys Lys Val Arg Arg Val Glu Glu Lys Lys
35 40 45
Asp Asp Gly Leu Asp Arg Leu Leu Leu Glu Gln Leu Thr Gly Thr Glu
50 55 60
Pro Val Gln Gly His Thr His His Phe Gly Leu Lys Tyr Leu Val Arg
65 70 75 80
Ser Trp Ile Ser Phe Ala Phe Lys Arg Arg Ser Phe Phe Leu Met Gln
85 90 95
Arg Gly Cys Ala Leu Ala Ile Lys Val Gly Phe Ser Met Asp Glu Ile
100 105 110
Phe Cys Glu Gln Ser Asn Ser Arg Glu Met Asp Phe Leu Lys Asn Ile
115 120 125
Ile Leu Val Pro Lys Glu Ala Gln His Leu Tyr Val Pro Thr Pro Leu
130 135 140
Gln Trp Thr Glu Ile Pro Glu Arg Leu Leu Arg Asn Thr Asp Thr Ile
145 150 155 160
Gly Ser Ser Gly Asn Arg Glu Gly Arg Trp Ile Trp Met Arg Glu Met
165 170 175
Ile Lys Gly Glu Ser Arg Tyr Leu Val Ser Glu Ala Phe Glu Arg Asp
180 185 190
Val Ala Pro Trp Ser Ser Leu His Lys Ala Trp Glu Asp Asn Arg Gly
195 200 205
Ala Val Ile Asp Leu Phe Val Ile Glu Glu Asp Lys His Lys His Thr
210 215 220
Lys Ser Phe Ala His Gln Ile Ser Leu Tyr Lys Glu Gln Ala Val Asn
225 230 235 240
Gly Glu Gly Asn Arg Leu Thr Arg
245
<210> 7
<211> 333
<212> PRT
<213> 舟形藻类
<400> 7
Met Val Cys Ile Gly Cys His Glu Ser Lys Arg Lys Cys Asp Lys Gln
1 5 10 15
Thr Pro Cys Ser Arg Cys Leu Lys Leu Gly Ile Pro Cys Ile Pro His
20 25 30
Leu Ser Gln Gln Gly Lys Arg Lys Arg Gly Ser Pro Asp Glu Thr Pro
35 40 45
Glu Asp Val Thr Ile Leu Arg Gln Val Ser Leu Pro Lys Asp His Tyr
50 55 60
Gly Leu Cys His Leu Ile Arg Ser Trp Ile Ser Ile Ala Phe Val Arg
65 70 75 80
Arg Ser Phe Pro Leu Leu Asn Lys Ala Thr Thr Met Ala Asn Gln Leu
85 90 95
Gly Val Thr Met Asp Glu Ile Met Ser Arg Ser Met Thr Gln Gln Gly
100 105 110
Met His Trp Leu Gly Pro Val Val Ala Thr Pro Gln Ser Glu Gln Met
115 120 125
Ala Gly Gly Pro Arg Leu Gln Trp Asn Glu Leu Pro Glu Gly Leu Leu
130 135 140
Val Ala Thr Arg Thr Leu His Ser Val Asp Cys Glu Ala Arg Trp Ile
145 150 155 160
Trp Ile Arg Glu Leu Ser Gln Gly Arg Ser Arg Tyr Leu Val Thr Gln
165 170 175
Ala Phe Glu Arg Asp Ile Ala Thr Trp Ala Leu Val Gln Ser Thr Trp
180 185 190
Asn Glu Asn Arg Ile Ser Val Val Asp Leu Phe Leu Asp Gly Ala Ala
195 200 205
Arg Glu Lys His Ala Lys Ser Val Ala His Gln Tyr Ser Leu His Ala
210 215 220
Lys Pro Pro Thr Pro His Ser Ala Arg Cys Ser Arg Gln Arg Ser Gln
225 230 235 240
Val Lys Leu Arg Asn Gly Asp Met Ile Ser Val Glu Glu Ile Ser Cys
245 250 255
Met Asp Phe Val His Met Asp Leu Ser Tyr His Phe Val Glu Tyr Val
260 265 270
Pro Val Cys Ile Gln Pro Ile Arg Ser Gln Ala Cys Ile Gln Asn Lys
275 280 285
Val Gln Ser Thr Gln Ser Leu Phe Gln Glu Met Ser Lys Val Met Trp
290 295 300
Asp Asp Tyr Pro Leu Met Val Asn Val Asp Asp Ile Pro Ala Glu Gly
305 310 315 320
Asn Glu Leu Asp Gln Ile Leu Gln Leu Leu Asn Gly Gly
325 330
<210> 8
<211> 729
<212> PRT
<213> 舟形藻类
<400> 8
Met Glu Asp Phe Asn Asn Asn Asn Thr Gln Gln Ala Asp Asp Glu Lys
1 5 10 15
Leu Cys Ala Ser Cys Asp Arg Cys Arg Ser Arg Lys Thr Lys Cys Asp
20 25 30
Gly Lys Arg Pro Cys Gly Asn Cys Val Ala Lys Tyr Met Lys Lys Tyr
35 40 45
Lys Val Met Ser Val Glu Gly Val Pro Glu Ser Ala Phe Glu Cys Val
50 55 60
Tyr Ser Pro Ala Lys Arg Arg Gly Pro Val Pro Gly Arg Thr Pro Ser
65 70 75 80
Gln Ala Arg Ser Leu Asn Asp Val Thr Gly Gly Asn Met Asn Val Asn
85 90 95
Met Thr Gly Gly Asn Asn Phe Asp Trp Asn Met Asp Leu Met Ser Gln
100 105 110
Gln Gln Gln Gln Gln His His Gln Gln Gln Gln Gln Pro Met Met Ser
115 120 125
Ser Leu Ile Gly Gly Leu Asp Gly Asn Asn Ile Leu Asn Gln Phe Asn
130 135 140
Leu Met Arg Gln Met Gln Leu Gln Gln Gln Leu Pro Leu Gln Pro Gln
145 150 155 160
Gln Met Ala Met Gln Gln His Met Met Asp Thr Ser Glu Val Gly Glu
165 170 175
Arg Ser Ala Arg Arg Met Lys Met Glu Asp Val Pro Ser Ala Pro Gly
180 185 190
Gly Val Pro Arg Thr Val Ser Asp His Thr His Leu Leu Asp Arg Asn
195 200 205
Asp Pro Asp Gly Ser Arg Leu Phe Ser Tyr Phe Lys Leu Ser Ile Asp
210 215 220
Glu Leu Phe Arg Leu Pro Pro Thr Pro Thr Asp Glu Glu Tyr Cys Leu
225 230 235 240
Arg Leu Asn Ile Pro Gly Met Thr Pro Arg Met Ile Pro Gly Thr His
245 250 255
Leu Ala Ala Leu Ser Ala Ala Arg Phe Ala Glu Ile Ala Leu Gly Ala
260 265 270
Met Val His Asn Glu Ile Ser Leu Ala Met Glu Leu Cys Asn Ala Val
275 280 285
Val His Cys Leu Arg Glu Ser Val Lys Glu Pro Val Gln Thr Pro Ile
290 295 300
Met Leu Glu Val Ser Lys Ala Tyr Phe Leu Leu Gly Val Phe Arg Ala
305 310 315 320
Cys Arg Gly Asp Met Ala Arg Tyr Phe Lys Tyr Arg Arg Val Cys Met
325 330 335
Thr Tyr Leu Gly Lys Leu Glu Asn Ser Ser Arg Thr Ala Thr Leu Thr
340 345 350
Ser Ala Ile Ser Tyr Leu Asp Ala Trp Ala Tyr Met Ile Tyr Asn Gly
355 360 365
Asn Glu Lys Gln Val Pro Asp Val Asp Arg Thr Leu Pro Pro Pro Ser
370 375 380
Gly Cys Ala Thr Asn Gly Met Ile Asn Pro Ile Glu Ala Lys Tyr Asn
385 390 395 400
Thr Lys Thr Ser Val Pro Ala Val Val Ser Asp Pro Lys Asn Lys Asn
405 410 415
Trp Ile Gln Gly Ala Pro Pro Val Tyr Leu Asn Asn Glu Ala Pro Pro
420 425 430
His Ala Arg Ser Leu Asp Ala Leu Ala Cys Ala Val Arg Ser Cys Cys
435 440 445
Asp Gln Ala Asn Ser Arg Phe Ala Gln Met Met Lys Thr Glu Gly Asn
450 455 460
Pro Ser Asp Asn Thr Met Ile Pro Gln Ser Thr Ile Ile Thr Pro Thr
465 470 475 480
Ala Thr Ala Val Met Asn His Glu Asn Glu Leu Cys Ser Arg Asn Met
485 490 495
Val Leu Ser Ala Tyr Thr Leu Met Gln Gln Gln Glu Ser Ser Thr Lys
500 505 510
Gly Arg His His Ser Glu Gly His Gln Met Val Ile Ser Ala Met Asp
515 520 525
Ala Phe Leu Glu Asn Ser Asp Glu Asp Gly Gly Thr Gly Phe Thr Asp
530 535 540
Ser Gln Ile Gln Ser Leu Leu Ser Val Cys Asn Thr Ala Ile Ala Asn
545 550 555 560
Pro Phe Leu Leu His His Ala Gly Pro Thr Tyr His Met Val Thr Asn
565 570 575
Ala Thr Ile Leu Leu Cys His Leu Leu Asn Ala Met His Ala Met Lys
580 585 590
Gln Ser Gly Gln Val Glu Asp Met Glu Val Ala Met Phe Glu Glu Val
595 600 605
Leu Asp Thr Phe Ile Ala Ile Arg Lys Leu Leu Thr Ile His Arg Arg
610 615 620
Lys Leu Pro Val Lys Leu Arg Cys His Gly Ile Pro Arg Pro Gln Leu
625 630 635 640
Thr Asn Thr Asp Ala Ser Ala Pro Ile Val Asp Leu Gly Glu Thr Phe
645 650 655
Leu Cys Ala Cys Arg Gly Cys Gln Gly Phe Val Leu Met Ala Cys Ser
660 665 670
Pro Cys Val Ala Ala Glu Arg Ala Arg Asp Ala Thr Lys Arg Met Glu
675 680 685
Met Glu Leu Gln His Glu Ala Gln Ala Ile Glu Met Gly Glu Leu Asp
690 695 700
Thr Asp Ile Asp Asn Ile Gly Ala Glu Phe Asp Leu Asp Asp Asp Ala
705 710 715 720
Leu Leu Ser Met Ile Ser Ser Leu Ile
725
<210> 9
<211> 723
<212> PRT
<213> 小环藻类
<400> 9
Met Asp Asp Thr Val Ala Ala Glu Glu Ala Lys Glu Ala Thr Asp Leu
1 5 10 15
Gln Ser Ser Asp Ser Lys Pro Thr Ser Pro Ser Ser Thr Pro Leu Asn
20 25 30
Arg Asp Ser Thr Ser Leu Cys Ser Ser Cys Asp Pro Cys Arg Ala Arg
35 40 45
Lys Thr Lys Cys Asp Gly Leu Arg Pro Cys Arg Ala Cys Ile Ser Lys
50 55 60
His Val Lys Lys His Lys Leu Ser Ser Tyr Glu Gly Ile Thr Ala Glu
65 70 75 80
Asp Cys Gly Cys Thr Tyr Ser Val Ala Lys Arg Arg Gly Pro Val Pro
85 90 95
Gly Phe Lys Asn Ala Lys Asp Glu Lys Gly Asp Gly Asn Leu Ser Thr
100 105 110
Ser Lys Lys Arg Gly Pro Thr Gln Asp Gly Thr Leu His Ser Tyr Pro
115 120 125
Pro Lys Lys Lys Lys Glu Lys Arg Ser Val Asp Val Leu Ala Arg Phe
130 135 140
Pro His Ser Ala Ala Gln Asp Ala Met Ala Ala Ala Ser Asp Ser Ala
145 150 155 160
Arg Gln Gln Leu Gly Phe Ile Glu Arg Leu Gln Gln Gln Gln Gln Glu
165 170 175
Phe Gln Arg Gln Gln Gln Gln Gln Met Gln Met Gln Gln Met Ala Gln
180 185 190
Ala Gln Asn Ala Gln Ala Met Pro Phe Met Ser Arg Asp Gly Asp Asn
195 200 205
Ser Ala Ile Ser Arg Gln Met Asn Asn Asn Tyr Asn Glu Gln Val Ser
210 215 220
Gly His Lys Pro Ser Gln Gln Phe Ser Ser Thr Glu Gln Thr Ser Ala
225 230 235 240
Val Gly Cys Glu Lys Thr Thr Val Arg Glu Leu Leu His Val Leu Asp
245 250 255
Pro Lys Asp Pro Leu Gly Ser Arg Phe Arg Ala Cys Tyr Gly Ile Ser
260 265 270
Phe Gly Ser Ile Phe Gly Leu Pro Pro Ile Leu Thr Tyr Asp Glu Tyr
275 280 285
Cys Arg Gln Phe Thr Pro Thr Ile Ala Ser Thr Ser Met Pro Lys Tyr
290 295 300
Asp Val Ala Ala Leu Gln Ala Ala Gln Phe Ala Glu Leu Ala Leu Gly
305 310 315 320
Ala Leu Ala Asp Gly Asp Arg Cys Met Met Phe Ala Leu Ile Asn Ala
325 330 335
Ser Ile Phe Cys Leu Gln Asp Thr Val Lys Glu Pro Val His Arg Ser
340 345 350
Cys Gln Phe Glu Leu Ala Lys Ala Phe Phe Phe His Ser Leu Ile Arg
355 360 365
Cys His Asn Gly Asp Met Glu Arg Tyr Phe Lys Tyr Arg Arg Ala Ala
370 375 380
Met His Thr Leu Ala His Leu Asp Gly Tyr Pro Asn Val Glu Thr Leu
385 390 395 400
Met Ala Ala Val Gly Phe Gln Asp Ala Leu Ala Phe Met Leu Tyr Asn
405 410 415
Gly Cys Asp Asp Asp Val Pro Asp Ile Asp Ser Asp Tyr Pro Gln Val
420 425 430
Leu Asp Arg Phe Asp Thr Lys Glu Ser Ser Ser Val Ser Phe Thr Pro
435 440 445
Ser Lys Leu Ala Ser Asp Pro Thr Asn Lys Thr Trp Ile Thr Gly Pro
450 455 460
Pro Met Phe Ser Ser Glu Ser Ser Ala Pro Leu Lys Ser Arg Ile Leu
465 470 475 480
Asp Ile Leu Ala Cys Ala Thr Arg Ser Phe Val Glu Glu Ser Gln Phe
485 490 495
Lys Lys Glu Ile Lys Ser Val Glu Thr Ser Thr Arg Lys Arg Arg Asn
500 505 510
Phe Ile Thr Ala Glu Asp Lys Arg Ile Lys Tyr Lys Ile Cys Leu Gly
515 520 525
His Leu Asn Glu Ala Gly Arg Leu Leu Ala Val Ala Asn Cys Lys Ser
530 535 540
Ser Ser Ser Ser Ile Tyr Asp Val Tyr His Val Leu Val Met Ala Phe
545 550 555 560
Arg Val Met Ile His Glu Asp Thr Ser Glu Pro Glu Glu Ser Gln Val
565 570 575
Gln Asn Ala Phe His Val Leu Lys Ala Ile Ile Arg Gln Pro Ser Leu
580 585 590
Leu Asn Ile Gly Pro Ile Asn Ile Phe Val His Lys Cys Val Ile Phe
595 600 605
Val Ala Arg Leu Ile Asn Lys Ser His Lys Ala Gly Leu Glu Asp Gln
610 615 620
Ser Ala Arg Asp Leu Phe Glu Glu Ser Ile Asp Leu Tyr His Ala Ser
625 630 635 640
Arg Thr Ile Leu Asn Ile His Asn Ser Lys Leu Pro Asp Gln Leu Arg
645 650 655
Cys His Glu Ile Pro Arg Pro Lys Ser Ile Thr Ala Lys Glu Cys Asp
660 665 670
Thr Ile Ile Thr Leu Gly Asp Glu Ser Met Met Pro His Arg Met Ala
675 680 685
Ser Val Lys Glu Glu Thr Ser Ala Ser Thr Ser Asp Thr Glu Lys Glu
690 695 700
Cys His Ile Asn Asp Lys Ala Phe Leu Val Phe Leu Ser Gly Leu Tyr
705 710 715 720
Leu Ala Arg
<210> 10
<211> 1515
<212> PRT
<213> 小环藻类
<400> 10
Met His Phe Ser Ala Gln Pro Pro Gln Gly Asn Gly Asp Met Ala Gln
1 5 10 15
Leu Asp Gly Val Ser Thr Ala Ser Lys Lys Thr Arg Ala Cys Thr Glu
20 25 30
Cys His Arg Ala Lys Ser Lys Cys Val Phe Ser Glu Glu Gly Gln Glu
35 40 45
Lys Cys Asp Arg Cys Phe Arg Leu Asn Lys Asp Cys Val Pro His Leu
50 55 60
Ser Arg Gln Gly Gln Arg Lys Lys Lys Ser Glu Lys Gly Met Met Lys
65 70 75 80
Ser Ser Val Ala Thr Ser Leu Ala Glu Val Ser Lys Gly Ser Asn Val
85 90 95
Ala Ser Lys Ala Pro Met Ser Gly Glu Ser Lys Ser Thr Ser Pro Phe
100 105 110
Phe Pro Asp Asn Ala Val Glu Gly Asn Arg Pro Phe Ser Phe His Ala
115 120 125
Ala Ser Gln Asp Thr Ser Leu Asn Arg Leu Ala Ala Thr Ala Thr Gly
130 135 140
Gly Pro Ser Met Ser Gln Met Ala Pro Leu Ala Lys Phe Ile Pro Gln
145 150 155 160
Lys His Met Phe Ser Ser Asn His Pro Thr Phe His Asn Thr Gly Pro
165 170 175
Cys Gly Leu Tyr Glu Ala Arg Leu Arg Arg Thr Gln Ala Gly Thr Ala
180 185 190
Leu Pro Val Asp Gln Thr Asn Ile Thr Val Thr Glu Gln Arg Gln Ala
195 200 205
Ala Met Ser Met Phe Ser Asn Ser Asp Arg Thr Ile Thr Asp Ser Thr
210 215 220
His Gln Gly Val Thr Phe Arg Glu Asp Leu Ser Ser Ser Arg Ser Leu
225 230 235 240
Pro Leu Arg Glu Trp Met Lys Cys Ala Leu Asn Ser Asn Lys Ile Arg
245 250 255
Asp Ser Ser Gly Ser Ser Pro Ile Ser Ser Lys Tyr Ile Ala Ser Cys
260 265 270
Leu Lys Ile Ala Leu Ser Leu Ala Lys Gln Ile Ser Asp Ala Glu Val
275 280 285
Thr Ser Ser Arg Glu Ile Leu Gln Trp Leu Pro Arg Asp Ser Ile Asp
290 295 300
Trp Pro Gln Tyr Ile Thr Val Lys Leu Thr Gly Asn Glu Thr Gln Val
305 310 315 320
Pro Pro His Asp Ala Arg Thr Gly Ser Leu Asp His Ser Ser Val Ala
325 330 335
Asp Asp Glu Leu Asp Met Leu Glu Ala Leu Leu Asp Ser Ile Cys Glu
340 345 350
Glu Asn Glu Val Asp Thr Thr Asp Val Phe Asp Ile Tyr Ser Ala Ala
355 360 365
Ile Leu Leu Asp Tyr Ser Lys Asn Ser Asp Asp Gly Val Asp Pro Leu
370 375 380
Ser Phe Pro Gly Gln Glu Tyr Arg Ile His Ala Leu Gly Leu Val Phe
385 390 395 400
Cys Glu Leu Phe Ser Gly Gly Arg Val Pro Ser Thr Glu Leu Val Ser
405 410 415
Asp Gly Leu Cys Gln Asp Asp Val Val Thr Pro Ala Ile Ser Glu Arg
420 425 430
Leu Glu Phe Thr Gly Met Leu Lys Leu Glu Pro Asn Glu Asn Asp Ile
435 440 445
Tyr Lys Asp Thr Ser Cys Lys Tyr Val Gly Thr Arg Lys Lys Thr Arg
450 455 460
Glu Leu Asp Glu Ser Leu His Ser Ser Ile Glu Ser Leu Arg Arg Leu
465 470 475 480
Gly Ile Ser Cys Pro Leu Cys Asp Leu Ile Phe Asn Ile Leu Asp Ser
485 490 495
Ile Asn Gly Asp Leu Gly Arg Asp Asp Ser Tyr Arg Lys Met Ser Asp
500 505 510
Val Ala Ile Asp Leu Gln Asn Met Val Asp Lys Pro Lys Thr Phe Leu
515 520 525
Asn Asp Leu Asp Val Ile Thr Leu Ser Ser Thr Gly Leu Gln Leu Thr
530 535 540
Asp Asn Leu Phe Met Arg Asp Glu Glu Val Ala Leu Leu Gln His Ala
545 550 555 560
Tyr Tyr Arg Ser Thr Leu Gly Ser Ser Glu Phe Ala Val Ile Thr Gly
565 570 575
Gly Ser Gly Thr Gly Lys Ser His Leu Ala Phe Arg Leu Gly Ser His
580 585 590
Ile Thr Ser His Gly Gly Ile Phe Leu Ser Val Lys Phe Asn Gln Met
595 600 605
Lys Gln Ala Asp Pro Tyr Ser Ala Leu Val Ser Ala Phe Asn Glu Tyr
610 615 620
Phe Asn Asn Phe Thr Met Thr Lys Gln Leu Asp Ser Met Lys Arg Ile
625 630 635 640
Ala Ser Lys Leu Arg Asp Glu Leu Gly Gln Asp Ala Leu Leu Leu Ala
645 650 655
Lys Val Ile Pro Asn Leu Ala Glu Val Leu Asp Phe Ala Ala Val Asp
660 665 670
Thr Ala Phe Asp Gly Asp Cys Val Asn Gly His Glu Lys Met His Tyr
675 680 685
Ile Leu Val Cys Phe Val Glu Val Met Ser Ala Cys Ser His Val Thr
690 695 700
Leu Thr Leu Phe Leu Asp Asp Leu Gln Trp Ala Asp Ala Phe Ser Leu
705 710 715 720
Ser Val Leu Gln Gln Ile Met Ile Met Pro Asp Glu His Lys Gln Phe
725 730 735
Phe Phe Val Gly Cys Tyr Arg Asp Asp Gln Met Glu Asp Asp His Pro
740 745 750
Phe Lys Lys Met Ile Ser Arg Cys Gly Asp Phe Gly Val Arg Leu Thr
755 760 765
Met Val Tyr Leu Glu Cys Met Asp Lys Asp Gly Met Asn Thr Met Ile
770 775 780
Ser Glu Leu Leu Cys Leu Pro Pro Arg Leu Val Lys Ser Leu Ser Glu
785 790 795 800
Leu Val Tyr Ser Lys Thr Lys Gly Asn Pro Leu Phe Leu Ser Arg Leu
805 810 815
Leu Ile Ser Leu Asn Lys Asp Gly Leu Leu Asn Leu Ser Leu Gly Arg
820 825 830
Arg Arg Trp Val Trp Asp Glu Lys Gln Ile Gln Ser Lys Glu Leu Pro
835 840 845
Asp Asp Val Ala Ser Phe Phe Ser Ser Arg Val Gly Lys Leu Ser Pro
850 855 860
Glu Val Gln Ala Ala Leu Gln Val Leu Ser Cys Phe Gly Ser Val Asn
865 870 875 880
Thr Tyr Glu Leu Ser Ile Leu Glu Ser Gly Leu Ser Leu Asn Val Val
885 890 895
Lys Pro Leu Glu Arg Ala Val Asn Glu Gly Phe Val Ser Lys Asn Gly
900 905 910
Asn Asp Tyr Arg Phe Ser His Asp Lys Ile His Glu Ala Val Tyr Gly
915 920 925
Met Val Glu Leu Glu Glu Arg Arg Phe Gln His Leu Asn Tyr Ala Ile
930 935 940
Ser Leu Val Lys Phe Ala Leu Gly Gln Asp Asp Ser Ile Ile Phe Thr
945 950 955 960
Ala Ile Gly Gln Ala Asn Leu Ala Gly Pro Ser Ile Thr Thr Asp Ala
965 970 975
Leu Gln Ser Ala Glu Phe Ala Arg Cys Asn Met Val Ala Gly Lys Lys
980 985 990
Ala Met Ser Leu Ser Asp Phe Ser Cys Ala Ala Ile Cys Phe Ser Lys
995 1000 1005
Gly Leu Ser Phe Leu Asp Glu Asn Arg Trp Ser Asp Tyr Tyr Asn
1010 1015 1020
Leu Ser Leu Glu Leu Phe Glu Leu Ala Ala Lys Cys Ala Leu Val
1025 1030 1035
Leu Gly Asp Phe Ala Ser Leu Ala Thr Met Ser Glu Gln Val Glu
1040 1045 1050
Lys His Ser Arg Cys Phe Glu Asp Lys Leu Glu Val Ser Phe Leu
1055 1060 1065
Val Met Cys Ser Leu Ala Tyr Ala Ser Lys Ile Ser Asp Ser Val
1070 1075 1080
His Ile Gly Leu Ser Ile Leu Ser Gln Leu Gly His Glu Leu Pro
1085 1090 1095
Thr Asn Phe Thr Arg Ala Glu Ile Ile Phe His Ile Glu Gln Thr
1100 1105 1110
Lys Thr Val Leu His Ser Ile Ser Asp Lys Asp Leu Met Phe Tyr
1115 1120 1125
Lys Lys Met Thr Asp Pro Lys His Ile Met Ala Met Arg Cys Leu
1130 1135 1140
Ala Lys Leu Glu Leu Ile Val Leu Gln Ile Asn Pro Asp Leu Gln
1145 1150 1155
Pro Ile Ile Thr Leu Lys Met Val Asn Met Thr Met Asp Leu Gly
1160 1165 1170
Val Ser His Met Ser Ser Val Gly Met Ala Tyr Phe Ala Gly Leu
1175 1180 1185
Val Ala Lys Leu Asp Glu Ile Gln Asp Gly Ile Arg Phe Ala Arg
1190 1195 1200
Leu Ala Lys Met Leu Leu Asp Lys Ser Gly Ser Lys Glu Ile Thr
1205 1210 1215
Gly Asp Val Ile Phe Thr Thr Ser Glu Val Leu Cys Phe His Glu
1220 1225 1230
Pro Leu Gln Ser Val Asn Glu Tyr Arg Phe Tyr Gly Gln Thr Thr
1235 1240 1245
Ala Leu Ala Ala Gly Asp Met Tyr Phe Ala Cys Val Leu Lys Met
1250 1255 1260
Ser Asn Cys Gly Thr Met Leu Trp Met Gly Ser Asn Leu Leu Ser
1265 1270 1275
Val Lys Asp Ala Phe Val Gln Val Ala Arg Tyr Leu Lys Ala Lys
1280 1285 1290
Asn His Leu Ser Thr Tyr Asn Leu Leu Leu Leu Ser Lys Arg Ser
1295 1300 1305
Ile Leu Met Leu Met Gly Leu Ala Asp Glu Asp Glu Pro Leu Thr
1310 1315 1320
Val Asp Gln Leu Thr Asn Pro Tyr Gln Leu Lys Tyr Phe Tyr Phe
1325 1330 1335
Gln Lys Met Phe Gln Ser Phe Val Phe Asn Arg Asn Asp Asp Met
1340 1345 1350
Lys Gln Tyr Thr Glu Lys Phe Leu Gln Phe Lys Met Pro Ser Trp
1355 1360 1365
Leu Leu Leu Ser Val His Ala Arg His Glu Phe Tyr Val Gly Leu
1370 1375 1380
Ile Ser Phe Gln Ile Tyr Arg Glu Ser Gly Ile Ser Leu Trp Phe
1385 1390 1395
Glu Arg Gly Gln Gln Cys Lys Ser Lys Val Gln Leu Trp Lys Glu
1400 1405 1410
Gln Gly Ser Val Trp Asn Phe Glu His Lys Leu Tyr Leu Leu Gln
1415 1420 1425
Ala Glu Glu Tyr Tyr Cys Asn Asp Asp Phe Glu Arg Ala Gly Glu
1430 1435 1440
Ser Phe Lys Asn Ser Ile Thr Ser Ala Lys Ser His Lys Phe Leu
1445 1450 1455
Asn Asp Glu Ala Leu Ala Cys Glu Leu Ala Ala Asn Phe Tyr Leu
1460 1465 1470
Gly Thr Gly Asp Leu Thr Ser Ser Met Lys Tyr Phe Arg Leu Ala
1475 1480 1485
His Asp Lys Tyr Asn Glu Trp Gly Ala Leu Gly Lys Ala Ala Gln
1490 1495 1500
Leu Val Thr Phe Met Thr Glu Lys Phe Ala Ser Cys
1505 1510 1515
<210> 11
<211> 873
<212> PRT
<213> 小环藻类
<400> 11
Met Thr Asn His Phe Asp Asn Asn Gln Trp Ser Ser Pro Ser Pro Pro
1 5 10 15
Met Met Glu Ala His Asp Asp Asn Gln His Gln Gln His Glu Gly Gly
20 25 30
Val Leu Leu Cys Ala Ser Cys Asp Arg Cys Arg Ala Arg Lys Thr Lys
35 40 45
Cys Asp Gly Met Arg Pro Cys Gly Asn Cys Lys Thr Lys Tyr Met Lys
50 55 60
Ser Lys Lys Leu Asp Ser Val Glu Gly Ile Asp Leu Ala Glu Phe Asp
65 70 75 80
Cys Ile Tyr Ser Pro Ala Lys Arg Arg Gly Pro Val Pro Gly Lys Ser
85 90 95
Ala Thr Arg Lys Ala Ser Glu Met Met Ser Tyr Ser Asn Pro Asp Val
100 105 110
Met His Phe Gly Ala Gly Gly Gly Gly Thr Gln Gly Gly Gly Tyr His
115 120 125
Ser Gln Val Gly Phe Asp Gly Thr Met Asn Thr Gly Gly Gly Phe Asn
130 135 140
Pro Gln Gln Gln Gln Gln Leu Gln Gln Phe Asn Asn Asn Ser Ser Ala
145 150 155 160
Gln Phe Ser Ala Glu Glu Leu Lys Gln Met Leu Leu Leu Gln Gln Gln
165 170 175
Leu Leu Leu Gln Gln Gln Glu Met Gln Met Gln Gln Gln Gln Gln His
180 185 190
Gln Gln Gly Leu Leu Gln Gln Leu Thr Asn Val Ala Gly Gly Gly Asn
195 200 205
Ile Asn Ile Ala Asn Thr Leu Arg Arg Ala Ser Met Asn Gly Gly Ile
210 215 220
Thr Ala Asn Gly Glu Thr Met Gly Ala Met Asn Asn Asp Val Gly Ser
225 230 235 240
Val Asp Arg Ser Gly Met Gly Gly Asn Asn Gly His Val Asp Glu Gln
245 250 255
Ser Leu Gln Leu Ile Gln Gln Tyr Gln Asn Gln Leu Asn Ile Gly Ser
260 265 270
Asn His Gly Met Thr Ser Gly Asn Ala Ser Ile Ile Gly Ser Val Val
275 280 285
Gly Gly Leu Pro Val Gln Pro Ser Pro Met Pro Ser Gln Gln Tyr Val
290 295 300
Gln Glu Gln Gln Pro Ala Lys Arg Ala His Arg Ile Asp Ser Ala Met
305 310 315 320
Ser Ser Asn Asn Asp Gly Thr Leu Pro Lys Ser Val Ile Ser His Leu
325 330 335
Pro Leu Leu Asp Arg His Asp Gly Asp Gly Asn Val Leu Arg Ala Tyr
340 345 350
Tyr Asp Leu Ser Val Asn Asp Ile Leu Asn Leu Pro Pro Ile Pro Ser
355 360 365
Asp Glu Glu Tyr Cys Ser Arg Leu Ala Arg Asn Asn Tyr His Cys Leu
370 375 380
Pro Ser Asn Leu Pro Thr Tyr Asp His Ser Ala Leu Gln Ala Ala Arg
385 390 395 400
Phe Ala Glu Leu Ala Leu Gly Ala Leu Ala Asn Asn Gln Ile Pro Leu
405 410 415
Ala Leu Glu Leu Ser Asn Ala Ser Val Met Cys Met Arg Asn Cys Ala
420 425 430
Glu Glu Pro Ser Asp Glu Ser Cys Met Tyr Glu Val Ala Arg Ala Tyr
435 440 445
Leu Leu His Gly Ile Phe Arg Ser Phe Arg Gly Asp Phe Val Arg Tyr
450 455 460
Phe Lys Tyr Arg Arg Val Cys Met Thr His Val Gly Gln Leu Ala Asn
465 470 475 480
Thr Pro His Val Glu Ala Leu Leu Ala Ala Val Ser Phe His Asp Ala
485 490 495
Leu Ala Tyr Met Met His Asn Ala Lys Glu Glu Ser Leu Pro Asp Ile
500 505 510
Asp Gln Val Leu Pro Arg Leu Asn Pro Gly Asn Cys Asp Phe Asp Asp
515 520 525
Ser Asp Glu Val Glu Ala Lys Tyr Gly Ile Ser Thr Asn Ala Lys Ser
530 535 540
Val Ala Ser Asp Pro Asn Asn Gln Met Trp Ile Gln Gly Ala Pro Pro
545 550 555 560
Val Phe Leu Asn Asn Glu Ala Asn Leu Ala Asn Arg Ser Leu Asp Gly
565 570 575
Leu Ala Cys Ala Ile Arg Ser Cys Cys Asp His Ala Asn Ser Gln Phe
580 585 590
Glu Glu Met Ala Lys Ala Val Gly Ala Asp Phe Val Gly Gly Ser Gly
595 600 605
Ser Cys Gly Met Ser Ala Thr Thr Lys Ala Val Thr Ala Asn Glu Asn
610 615 620
Glu Leu Cys Ser Arg Asn Ile Val Leu Ser Ala Arg Thr Leu Leu Asp
625 630 635 640
Gln Tyr Asn Gly Val Ser His Glu Lys Ala Lys Lys His Gly Leu Gln
645 650 655
Met Leu Ala Leu Ala Met Glu Ala Phe Leu Glu Asn Ser Gly Glu Ser
660 665 670
Asp Gly Val Gly Gly Phe Thr Asp Lys Gln Ile Lys Asn Leu Leu Thr
675 680 685
Val Cys Asp Thr Ile Val Lys Asn Pro Leu Leu Leu His Ala Pro Gly
690 695 700
Pro Val Tyr His Met Met Thr Asn Ser Ala Ile Met Leu Cys His Leu
705 710 715 720
Leu Asn Gly Met His Ala Asn Cys Gly Glu Gly Ser Asn Ser Ser Gly
725 730 735
Lys Ser Gly Ile Glu Glu Val Leu Phe Asp Glu Val Leu Asp Ser Phe
740 745 750
Met Ala Thr Arg Lys Ile Leu Asn Ala His Arg Lys Ser Leu Pro Val
755 760 765
Lys Leu Arg Cys His Gly Ile Pro Arg Pro Asn Val Gly Pro Phe Lys
770 775 780
Lys Ser Asp Pro Glu Ala Pro Phe Val Asp Leu Gly Glu Thr Leu Leu
785 790 795 800
Cys Ala Cys Arg Gly Cys Gln Gly Phe Val Leu Met Gly Cys Ser Pro
805 810 815
Cys Val Ala Ala Glu Arg Ser Ala Ala Ala Ala Lys Ala Gln His Ala
820 825 830
His Ser Ser Ser Thr Asn Gly Asn Tyr Asn Glu Asp Glu Phe Glu Arg
835 840 845
Glu Leu Gln Asp Met Gly Ala Phe Asp Met Asp Asp Asp Ala Leu Leu
850 855 860
Asn Val Leu Ser Arg Phe Val Gln Asn
865 870
<210> 12
<211> 379
<212> PRT
<213> 假微型海链藻
<400> 12
Met Ala Thr Thr Thr Glu Val Gln Lys His Ala Val Ser Ala Pro Leu
1 5 10 15
Pro Ala Ser Ala Ala Thr Thr Thr Thr Gly Gly Gly Asn Asn Glu Ser
20 25 30
Thr Val Leu Cys Ala Ser Cys Asp Arg Cys Arg Ala Arg Lys Thr Lys
35 40 45
Cys Asn Gly Ala His Pro Cys Ser Gly Cys Val Ser Lys Tyr Met Lys
50 55 60
Lys His Lys Leu Glu Ser Phe Asp Gly Ile Asp His Ala Leu Val Glu
65 70 75 80
Cys His Tyr Ser Val Ala Arg Lys Arg Gly Pro Gln Pro Gly Ser Ser
85 90 95
Lys Ser Pro Thr Ala Pro Arg Gly Ser Ile Pro Ala Asp Gly Thr Thr
100 105 110
Ile Tyr Gln Gln Pro Ala Lys Lys Lys Pro Lys Lys Ala Lys Gln Ala
115 120 125
Ala Pro Met Met His Asp Leu Ala Ala Met Ala Ser Ala Phe Gly Gly
130 135 140
Gly Asn Leu Gly Gln Met Pro Leu Pro Leu Asp Pro Ala Ala Ala Ala
145 150 155 160
Leu Gln Gln Gln Ile Leu Ser Ser Leu Gly Ala Ile Gly Leu Gly Leu
165 170 175
Tyr Ala Asn Phe Thr Ala Gly Gly Gly Ser Ala Met Thr Ala Ala Ser
180 185 190
Asn Asn Ala Arg Gln Gln Leu Ala Ala Val Glu Ser Leu Leu Ser Asn
195 200 205
Asn Lys Ser Asp Val Asp Ser Val Thr Asn Pro Leu Ser Ser Glu Glu
210 215 220
Glu Ala His Phe Arg Ala Cys Tyr Thr Leu Ser Val Gly Ser Leu Phe
225 230 235 240
Gly Leu Pro Asp Val Leu Lys Lys Glu Asp Tyr Phe Pro Lys Tyr Asp
245 250 255
Val Ala Val Leu Gln Ala Ala Arg Phe Ala Glu Leu Ala Ile Gly Ala
260 265 270
Leu Val Asp Gly Asn Gly Ser Lys Met Thr Lys Leu Ala Asn Ala Thr
275 280 285
Val Leu Cys Leu Lys Glu Ala Ala Gln Glu Pro Val His Pro Ser Cys
290 295 300
Lys Phe Asp Val Ala Arg Ala Tyr Phe Phe Leu Ala Ile Cys Glu Leu
305 310 315 320
Asn Ile Gly Asp Val Glu Gly Tyr Leu Lys Tyr Arg Arg Glu Ser Met
325 330 335
Arg Arg Leu Ser Glu Met Asn Asp Ala Ser Gly Ala Asp Thr Leu Leu
340 345 350
Ala Ala Met Ser Leu Gln Asp Ser Phe Val Tyr Ile Leu Tyr Lys Gly
355 360 365
Leu Asp Asp Thr Leu Pro Asn Ile Asp Ser Ala
370 375
<210> 13
<211> 896
<212> PRT
<213> 假微型海链藻
<400> 13
Met Ser Thr Asp Asp Asn Asn Ile Met Pro Glu Asp Trp Gln Asn Asn
1 5 10 15
Pro Pro Pro Leu Pro Gln Asp Asn Trp Gln Asn Asn Glu Gln Thr Ser
20 25 30
Asn Tyr Asp Asn Gly Asn Ser Asn Gly Gly Gln Tyr Ser Thr His His
35 40 45
Gln Gln Gln Pro Pro Gln Glu Gln Val Asn Arg Ala Gln Ser Ser Tyr
50 55 60
Asn Asn Gln Tyr Ser Thr Ser Gln Tyr Asn Ser Asn Gln Gln Gln Glu
65 70 75 80
Gln His Tyr Gln Gln Gln Gln Gln Gln Gln Gln Leu Gln Leu Cys Ala
85 90 95
Ser Cys Asp Arg Cys Arg Ala Arg Lys Thr Lys Cys Asp Gly Glu Arg
100 105 110
Pro Cys Gly Asn Cys Val Asn Lys Leu Lys Lys Lys Leu Lys Leu Asp
115 120 125
Asn Val Asp Gly Ile Asp Ile Ala Glu Phe Asp Cys Val Tyr Ser Pro
130 135 140
Ala Lys Arg Arg Gly Pro Ile Pro Gly Lys Thr Gly Gln Ser Arg Lys
145 150 155 160
Ser Ser Glu Met Met Tyr Gln Gln Pro Gln Gln Arg Gly Gly Gly Tyr
165 170 175
Leu Gly Ser Gly Gly Gly Gly Gly Tyr Pro Gln Gln Gln His Gly Leu
180 185 190
Gln Gly Gly Gly Tyr Asn Phe Gly Gly Gly Gln Gln Gln Gln Gln Gln
195 200 205
Gln Gln Trp Ile Asn Ser Asn Asn Asn Gln Gly Ser Gln Phe Ser Ser
210 215 220
Glu Glu Leu Lys Gln Met Leu Ser Leu Gln Gln Gln Leu Leu Ile Gln
225 230 235 240
Gln Gln Gln Met Gln Gln Gln Gln Gln Gln Gln Gly Met Leu Gln Gln
245 250 255
Leu Ala Thr Val Thr Ser Gly Val Gly Ser Ser Gly Ile Gly Gly Ala
260 265 270
Gly Gly Ile Gly Gly Met Gly Asn Thr Asn Asn Val Gln Val Glu Asn
275 280 285
Gly Ala Leu Gln Leu Leu Gln Gln Tyr Gln Gln Gln Leu Asn Ser Gly
290 295 300
Asn Asn Thr Leu Gly Ser Ser Gly Ser Ile Asn Met Gly Leu Gly Ser
305 310 315 320
Gln Pro Ser Pro Met Pro Ser Ser Ser Tyr Asn Gln Glu Gln Gln Gln
325 330 335
Gln Pro Thr Lys Arg Ala His Arg Leu Glu Pro Val Leu Ser Asn Ala
340 345 350
Asn Ser Thr Asn Leu Pro Asn Ser Val Ala Ser His Leu Pro Leu Leu
355 360 365
Ser Leu His Asn Pro Asp Gly Asn Val Leu Arg Ser Tyr Tyr Gln Leu
370 375 380
Ser Val Asn Asp Leu Leu Asn Leu Pro Pro Ile Pro Ser Asp Glu Asp
385 390 395 400
Tyr Cys Thr Ile Leu Ser Gln Asn Asn Tyr Asn Cys Leu Pro Ser Asn
405 410 415
Leu Pro Thr Tyr Asp Gln Ser Ala Leu Gln Ala Ala Arg Phe Ala Glu
420 425 430
Leu Ala Leu Gly Ala Leu Ala Asn Asn Gln Val Pro Leu Ala Leu Glu
435 440 445
Leu Ser Asn Ala Ser Val Met Cys Met Arg Asn Cys Val Glu Glu Pro
450 455 460
Ser His Lys Ser Cys Ile Tyr Asp Val Ala Arg Ala Tyr Leu Leu His
465 470 475 480
Gly Ile Phe Arg Ser Phe Arg Gly Asp Phe Val Arg Tyr Phe Lys Tyr
485 490 495
Arg Arg Val Cys Met Ser His Leu Ser Gln Leu Asn Asn Glu Pro Asn
500 505 510
Val Glu Ala Leu Leu Ala Ala Ile Ser Tyr His Asp Ala Leu Ala Tyr
515 520 525
Met Met His Asn Ala Ser Glu Asp Ala Leu Pro Asp Ile Asp Glu Val
530 535 540
Leu Pro Arg Leu Asn Asp Cys Gly Lys Asn Asp Ser Gly Cys Asp Ile
545 550 555 560
Glu Ala Lys Tyr Gly Ile Ser Thr Asn Ala Ser Ser Val Val Thr Asn
565 570 575
Ala Asn Asn Gln Met Trp Met Gln Gly Ala Pro Pro Val Phe Leu Asn
580 585 590
Asn Glu Ala Ser Leu Val Asn Arg Ser Leu Asp Ala Leu Ala Cys Ala
595 600 605
Val Arg Ser Cys Cys Asp Gln Ala Asn Ser Ser Phe Glu Glu Met Ala
610 615 620
Lys Glu Ala Gly Val Asp Leu Pro Ala Gly Gly Gly Ser Cys Gly Thr
625 630 635 640
Ser Ala Thr Thr Gln Ala Val Met Ala Asn Glu Asn Glu Leu Cys Ser
645 650 655
Arg Asn Ile Val Leu Ser Ala Gln Thr Leu Leu Ser Gln His Ala Gly
660 665 670
Thr Ser His Glu Lys Ser Lys Lys His Gly Leu Val Met Val Ala Thr
675 680 685
Ala Met Glu Ala Phe Leu Glu Asn Gly Gly Gly Asp Glu Glu Gly Met
690 695 700
Gly Gly Phe Thr Asp Lys Gln Ile Lys Asn Leu Leu Ala Val Cys Asn
705 710 715 720
Thr Ile Val Lys Asn Pro Leu Leu Leu Phe Ala Pro Gly Pro Thr Tyr
725 730 735
His Met Val Ser Asn Val Ala Ile Leu Leu Cys His Leu Leu Asn Gly
740 745 750
Ile His Ala Asn Cys Gly Gly Ser Ser Gly Asn Ala Lys Ser Gly Met
755 760 765
Glu Glu Val Leu Phe Asp Glu Val Leu Asp Ala Phe Met Ala Ile Arg
770 775 780
Lys Leu Leu Asn Leu His Arg Lys Asn Leu Pro Val Lys Leu Arg Cys
785 790 795 800
His Gly Ile Pro Arg Pro Lys Leu Gly Pro Phe Lys Lys Ser Asp Pro
805 810 815
Glu Thr Pro Phe Ile Asp Leu Gly Asp Thr Leu Met Cys Val Cys Arg
820 825 830
Gly Cys Gln Gly Phe Val Leu Met Gly Cys Ser Pro Cys Val Ala Ala
835 840 845
Glu Arg Ser Ala Ser Ser Ala Arg Met His Ala Asn Gln Ser Glu Asp
850 855 860
Asp Asp Asp Glu Phe Glu Arg Glu Leu Gly Gln Leu Asp Asp Phe Asn
865 870 875 880
Leu Asp Asp Asp Ala Leu Leu Ser Leu Leu Ser Arg Ile Val Gln Asn
885 890 895
<210> 14
<211> 689
<212> PRT
<213> 假微型海链藻
<400> 14
Met Ser Gln Thr Ser Asn Thr Glu Pro Lys Gly Ala Lys Arg Lys Thr
1 5 10 15
Gln Ala Cys Thr Glu Cys His Lys Ser Lys Ser Lys Cys Thr Tyr Pro
20 25 30
Asp Pro Thr Thr Thr Ala Ala Gly Gly Thr Ala Lys Leu Cys Cys Asn
35 40 45
Arg Cys Ile Arg Leu Gly Arg Asp Cys Ile Pro His Ile Ser Gln Gln
50 55 60
Gly Lys Arg Asn Lys Lys Thr Glu Glu Glu Thr Met Lys Asn Glu Lys
65 70 75 80
Arg Val Asn Glu Asp Asp Met Gln Asp Gly Leu Cys Lys Ser Thr Met
85 90 95
Cys Ala Ala Ala Ile Gly Asn Gln Asp Lys Ile Leu Lys Glu Asn Asn
100 105 110
Leu Ser Leu Glu Leu Pro Arg His Ile Thr Asn Ser Met Ala Gly Gln
115 120 125
Phe Pro Ala Gly Gly Gly Gly Gly Met Met Gly Gly Gln Phe Ala Gly
130 135 140
Arg Ser Gly Ala Gly Ile Leu His Pro Ala Asp Ile Leu Ser Gly Gly
145 150 155 160
Met Asn Ser Ser Gln Leu Ser Leu Met Leu Asn His Phe Ser Gly Thr
165 170 175
Ser Gly Gly Gln Ser Asp Thr Met Ser Thr Leu Asn Asn Ile Met Ser
180 185 190
Ser Ser Ala Met Gly Ala Thr Gly Pro Pro Pro Ser Val Asp Ala Leu
195 200 205
Leu Met Leu Ala Ser Arg Ser Thr Ser Ile Gly Ser Asn Ser Gly Val
210 215 220
Asn Leu Gly Gly Thr Ala Ser Ala Ala Pro Ala Leu Pro Gly Thr Ser
225 230 235 240
Gln His Leu Ile Gln Gln Trp Gln His Gln Gln Asn Gln Leu Arg Tyr
245 250 255
Ala Val Met Gly Gly Met Gln Thr Ala Thr Met Met Gly Met Thr Gln
260 265 270
Ala Ser Gly Asp Gly Ser Ala Thr Gly Asn Gln Leu Asp Ser Ala Ile
275 280 285
Ile Thr Lys Lys Glu Arg Thr Ser Ser Phe Gly Ser Glu Asn Asp Gln
290 295 300
Pro Lys Asn Lys Lys Gln Lys Ala Ile Gln Glu Ala Lys Glu Trp Cys
305 310 315 320
Ala Gly Gly Gly Gly Asp Asp Gln Lys Gln Ser Val Leu Glu Ala Leu
325 330 335
Ala Ala Ala Thr Lys Asn Glu Thr Thr Pro Lys Phe Val Pro Pro His
340 345 350
Ile His Tyr Pro Pro Val Ser Leu Leu Ala Glu Thr Thr Thr Thr Ala
355 360 365
Ile Asn Asp Asn Ala Ser Ser Ser Ala Ala Ala Ala Ala Asp Asn Thr
370 375 380
Thr Asp Thr Gln Glu Ser Gln Leu Arg Arg Ser Ser Tyr Asn Ala Gln
385 390 395 400
Phe Val Thr Pro Glu Asp Ala Ile Gly Asn His Ile Thr Gly Gln Lys
405 410 415
Leu Pro Cys Leu Gln Asn His Tyr Gly Leu Gln Cys Gln Ile Arg Glu
420 425 430
Trp Ile Ser Met Ala Leu Val Arg Arg Ser Phe Ala Leu Leu Ser Lys
435 440 445
Ala Ser Ser Leu Ala Asn Arg Cys Gly Ile Ser Met Asp Arg Ile Phe
450 455 460
Cys Gly Val Val Glu Glu Val Glu Lys Lys Gly Gly Ala Glu Lys Lys
465 470 475 480
Thr Lys Gly Gly Cys Lys Met Asn Val Gly Gly Lys Met Asn Tyr Leu
485 490 495
Leu Ser Val Phe Leu Glu Pro Arg Thr Ala Gln Val Val Pro Met Glu
500 505 510
Gln Pro Phe Glu Arg Asn Leu Leu Cys Trp Arg His Ile Ser Gln Ile
515 520 525
Phe Glu Asp Asn Leu Ala Asp Gly Phe Ser Leu Met Phe Ala Lys Glu
530 535 540
Asp Phe Arg Arg Phe Leu Ala Cys Tyr Ala His Gln Ile Ser Ser Gln
545 550 555 560
Pro Ser Ala Glu Ser Pro Ile Arg Pro Val Tyr Ala Pro Lys Ile Thr
565 570 575
Val Arg Leu Leu Ser Arg Asp Trp Gly Gln Thr Glu Ala Val Thr Glu
580 585 590
Glu Met Ile Glu Gly Val Gly Lys Asn Glu Ala Glu Thr Thr Glu Met
595 600 605
Asp Ala Leu Phe Val Val Val Pro Thr Met Asp Lys Val Thr Tyr Tyr
610 615 620
Leu Glu Leu Phe His Pro Asn Leu Glu Ser Asp Ala Lys Asp Cys Glu
625 630 635 640
Ala Asp Asp Asn Asp Glu Gly Thr Glu Thr Pro Glu Ser Asn Pro Pro
645 650 655
Ala Leu Asp Thr Val Met Glu Gly Glu Asp Trp Gln Gly Ile Asp Glu
660 665 670
Ile Leu Ala Ser Gly Asp Asp Met Asp Ala Leu Met Lys Ala Leu Leu
675 680 685
Asp
<210> 15
<211> 410
<212> PRT
<213> 圆柱拟脆杆藻
<400> 15
Met Gly Thr Ser Ala Asn Arg Ala Cys Thr Glu Cys His Lys Ala Lys
1 5 10 15
Val Lys Cys Val Arg Asp Asp Asp Gly Asn Ile Ile Cys Lys Arg Cys
20 25 30
Glu Arg Ile Gly Leu Lys Cys Val Glu His Ile Ser Arg Gln Gly Gln
35 40 45
Gly Thr Arg Arg Arg Lys Lys Val Lys Lys Glu Thr Thr Thr Ala Thr
50 55 60
Gly Ala Ala Asn Lys Asn Asn Glu Asp Lys Thr Val Asp Glu Ala Leu
65 70 75 80
Ala Ile Thr Ile Ala Leu Ser Ser Pro Ser Pro Met Pro Ser Cys Pro
85 90 95
Val Ser Gly Gly Ser Asn Ile Val Phe Ser Gly Asn Gly Asn Val Asn
100 105 110
Gly Val Pro Ser Ser Ala Cys Asn Ala Leu Thr Ala Met Asn Gly Gln
115 120 125
Ala Met Thr Asn Asn Lys Glu Gly Leu Cys Asn Gly Met Ala Ser Leu
130 135 140
Gln Val Glu Asp Ser Ile Ile Cys Lys Ser Ile Thr Asn Gly Leu Gly
145 150 155 160
Lys Glu His Tyr Gly Ile His His Leu Ile Arg Met Trp Val Ala Leu
165 170 175
Ser Phe Thr Arg Arg Ser Phe Ser Leu Leu Ala Arg Ala Ser Phe Ile
180 185 190
Ala Ser Arg Met Gly Ile Ser Met Asp Glu Ile Ile Ser Asn Gln Ser
195 200 205
Asn Phe Ala Ile Asp Ser Gly Ser Gln Pro Met Tyr Phe Leu Gly Arg
210 215 220
Asp Ile Leu Val Pro Lys Ser Gln Arg Lys Thr Ile Gly Leu Pro Leu
225 230 235 240
Asn Ile Glu Glu Ile Pro Trp Asp Leu Leu Glu Ala Val Gln Ile Asp
245 250 255
Pro Val Arg Pro Asp Glu Thr Phe Arg Asn Arg Trp Cys Ala Ile Arg
260 265 270
Met Thr Val Gln Gly Thr Ser Arg Phe Leu Thr Ser Pro Leu Phe Ser
275 280 285
Arg Asp Phe Ser Ser Val Asp Glu Ile Asn Lys Val Trp Asp Glu Asn
290 295 300
Lys Pro Asn Lys Glu Val Val Asp Leu Trp Met Pro Lys Ser Glu Lys
305 310 315 320
Gly Asn Ile Asn Asn Asp Asn Asn Asn Asn Asn Asn Ser Ser Asp Arg
325 330 335
Asn Ser Gln Tyr Gly Gly Thr Thr Ser Ser Ala Lys Lys Arg Asp Ile
340 345 350
Ile Asp Val Ala Gly Gly Thr Ser Asn Asn Glu Ile Glu Ser Asp Val
355 360 365
Cys Asp Pro Ile Met His Asp Asp Gly Ile Glu Phe Thr Asp Leu Val
370 375 380
Val Thr Glu Glu Met Gln Glu Phe Phe Gln Leu Leu Ala Gly Asp Gln
385 390 395 400
Arg Val Gln Ala Asp Leu Asn Ser Leu Phe
405 410
<210> 16
<211> 805
<212> PRT
<213> 圆柱拟脆杆藻
<400> 16
Met Thr Thr Ser Thr Arg Leu Arg Gly Lys Arg Gly Lys Lys Asp Ser
1 5 10 15
Arg Asn Asp Ala Val Ala Thr Ser Asp Asn Gly Val Ala Met Thr Thr
20 25 30
Ala Asn Ala Val Val Val Val Asn Asp Glu Lys Asn Lys Gln Asp Asn
35 40 45
Tyr Asn Asn Glu Gly Asp Pro Val Glu Phe Lys Val Arg Val Glu Leu
50 55 60
Glu Val Glu Ala Pro Ile Asn Glu Gln Lys Ala Val Asp Asn Asn Glu
65 70 75 80
Lys Lys Lys Ser Ser Ala Glu Thr Thr Lys Ala Glu Ala Ala Val Val
85 90 95
Asn Ser Asp Glu Asp Val Asn Asp Asp Val Asn Asp Asp Val Asn Asp
100 105 110
Gly Glu Asp Asp Ala Val Val Val Val Lys Asn Ser Lys Glu Asn Asn
115 120 125
Asp Asp Asp Asn Asp Ser Asp Thr Lys Lys Met Gln Asp Ala Thr Lys
130 135 140
Lys Lys Met Ala Pro His Gln Asp Asp Ala Cys Val Val Glu Val Val
145 150 155 160
Gln Val Ser Asp Arg Pro Ser Phe Leu Gly Gly Thr Val Leu Lys Arg
165 170 175
Asp Thr Val Gly Leu Gly Leu Arg Tyr Lys Thr Glu Lys Glu Lys Glu
180 185 190
Lys Val His Glu Asn Asp Ile Leu Phe Ser Ser Val Asp Leu Gly Leu
195 200 205
Gln Ser Gly Ser Gly Gly Ser Ser Ser Ser Gln Phe Leu Asn His Thr
210 215 220
Asp His Ser Gly Asn Lys Lys Leu Gln Ser Ile Ile Lys Ala Arg Lys
225 230 235 240
Ser Asn Tyr Phe Val Asn Asp Val Thr Asn Ile Asp Ser Cys Ser Ile
245 250 255
Ala Val Asn Glu Glu Glu Arg Thr Lys Ile Ala Lys Glu Ile Phe His
260 265 270
Glu Ile Thr Thr Thr Thr Thr Thr Thr Gly Lys Asp Val Gly Ile Gly
275 280 285
Val Gly Arg Phe Leu Asn Phe Lys Ser Met Thr Lys Ala Lys Tyr Glu
290 295 300
Asn Leu Gly Cys Asp Phe Val Trp Glu Ile Met Asp Glu Ile Thr Ser
305 310 315 320
Ile Ile Lys Ile Cys Gln Thr Met Asn Tyr Ile Phe Met Ser Asp Gln
325 330 335
Glu Arg Thr Glu Arg Ser Leu Ala Ile Glu Thr Gln Gln Lys Gln Gln
340 345 350
Gln Asn Asp Tyr Arg Asn Glu Arg Gln Gln Lys Asn Gly Lys Thr Leu
355 360 365
Ser Ser Ser Asp Lys Lys Ser Lys Thr Lys Lys Ser Thr Lys Gln Asn
370 375 380
Lys Ile Leu Leu Gln Gln Arg Gln Gln Glu Gln Glu Gln Arg Glu Asn
385 390 395 400
Ala Gln Ile Gln Glu Gln Gln Leu Gln Gln Gln Gln Gln Gln Gln Gln
405 410 415
Gln Cys Gln Gln Val Gln Met Arg Ile Tyr Gln Leu Gln Gln Gln Leu
420 425 430
Gln Gln Gln Gln Val Tyr Tyr Pro Pro Thr Pro Leu Ile Gln Gln Tyr
435 440 445
Pro Thr Ala Met Pro Met Pro Met Pro Leu Ser Ser Pro Ser Pro Leu
450 455 460
Leu Pro Lys Asp Gly Lys Lys Lys Lys Thr Lys Gly Glu Lys Arg Lys
465 470 475 480
Ala Pro Val Pro Ala Ala Met Ala Ser Glu Arg Ser Gly Ile Ile Glu
485 490 495
Gly Arg Val Ile Val Asp Thr Ile Val Gly Gly Asp Ser Asp Glu His
500 505 510
Ile Gly Asn Glu Asn Leu Val Lys Leu Ile Val Lys Lys Lys Ser Glu
515 520 525
Tyr Asp Tyr Ile Glu Val Lys Asp Ile Lys Lys Leu Gly Ile Ala Arg
530 535 540
Val Arg Gln Asn Val Ser Leu Asn Ile Val Lys Ser Ile Val Lys Glu
545 550 555 560
Asn Gly Gly Arg Phe Leu Phe Arg Arg Lys Lys Asp Val Asp Asp Asp
565 570 575
Leu Leu Glu Thr Pro Thr Val Glu Ala Thr Ile Ala Val Ile Lys Asp
580 585 590
Gly Glu Asp Ala Ile Ala Arg Ala Glu Ala Ala Leu Arg Gly Glu Lys
595 600 605
Thr Pro Thr Lys Thr Ser Asn Asp Ile Glu Asp Glu Asp Glu Asp Asp
610 615 620
Asn Ile Lys Asn Glu Asp Ser Gly Pro Val Val Trp Glu Glu Leu Lys
625 630 635 640
Asp Glu Ser Met Ile Gln Ala Ile Val Trp Arg Cys Met Lys Asp Ile
645 650 655
Tyr Glu Leu Ala Asp Glu Asn Lys Thr Glu Ile Leu Glu Lys Arg Lys
660 665 670
Glu Ala Lys Lys Glu Arg Lys Arg Leu His Glu Tyr Asp His Asp Asp
675 680 685
Glu Ser Ala Gly Pro Ala Ala Ala Ala Thr Ala Arg Lys Lys Gln Ala
690 695 700
Val Glu Glu Asp Pro Ser Gly Arg Lys Asn Lys Ser Cys Asp Phe Cys
705 710 715 720
Arg Asp Lys Lys Leu Lys Cys Asn Arg Thr Ser Pro Cys Glu Asn Cys
725 730 735
Thr Thr Lys Tyr Met Lys Asp His Asn Leu Thr Ser Glu Glu Val Glu
740 745 750
Glu Ser Lys Ile Ala Asn Ser Ile Asn Ala Val Ala Val Val Ala Lys
755 760 765
Val Glu Glu Ala Lys Lys Leu Glu Ser Met Pro Glu Thr Lys Arg Pro
770 775 780
Arg Thr Arg Ser Ile Phe His Phe Leu Val Phe Leu Ile Leu Glu Cys
785 790 795 800
Ser Val Pro Met Glu
805
<210> 17
<211> 1039
<212> PRT
<213> 海洋微拟球藻藻
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物
<220>
<221> misc_feature
<223> 菌株5473
<400> 17
Met Thr Thr Leu Leu Gly Gln Pro Pro Ser Ser Leu Gly Ala Met Gly
1 5 10 15
Ser Ala Phe Tyr Asp Glu Asp Ala Gln Ser Val Val Ala Leu Gly Gln
20 25 30
His Ala Ala Gly Ser Gly Thr Glu Asp Glu Met Asp Thr Asp His Phe
35 40 45
Asp Glu Leu Asp Arg Ile Ile Phe Asp Met Pro Tyr Val Ser Glu Gln
50 55 60
Asp Pro Leu Ser Ser Cys Ser Val Gly Gly Gln Ser Gln Gly Gln Thr
65 70 75 80
Asn Gly Gln Gly His Gly His Gln Glu Arg Gly Ala Ser Gln His Gly
85 90 95
Gly Ala Gly Leu Leu Met Pro Asn Pro His Asn Gly His Ile His Gly
100 105 110
Asp Gly Gly His His Ile Asn His Asn Asn His Gly Ser Val Arg Gly
115 120 125
Gly Gly Met Asp Trp His Ala Lys Glu Glu Asp Ala Ser Tyr His Thr
130 135 140
Ala Val Asp Ser Ser Cys His Thr Asp Arg Ser Tyr His Arg Val Asp
145 150 155 160
Ala Ser Gly His Ser Met Ile Asp Ala Ser Ser His Ser Met Met Asp
165 170 175
Ala Ser Gly His Glu Ser Leu Ile Asp Ser Ser Gly His Tyr Asp Asp
180 185 190
Phe Ala Ala His Lys Gly Asp Pro Arg Tyr Met Glu His Ser Cys Glu
195 200 205
Ala Cys Lys Arg Ser Lys Lys Arg Cys Asn Arg Arg Asn Pro Cys Gln
210 215 220
Ile Cys Thr Ser Arg Gly Ile Lys Cys Val Pro Gln Ile Arg Gly Pro
225 230 235 240
Gly Arg Pro Pro Gly Ser Lys Ser Ser Arg Gly Ser Ser Ser Ser Ser
245 250 255
Ser Leu Thr Leu Gly Ser Ser Arg His Gly Gly Ser Arg Gly Asp Val
260 265 270
Arg Ser Ser Leu Asn Ser Thr Gln His Ser Thr Asn Ser Ser Ala Thr
275 280 285
Thr Ser Ala Ala Ser Ser Thr Ala Ser Ser Leu Ser Arg Ser Leu Ser
290 295 300
Gly Asn Gly Leu Leu Gln Gln Glu Gln Asp Leu Val Val Val Ala Ala
305 310 315 320
Ala Ala Ser Thr Arg Gln Ser Pro Pro Arg Asp Pro Trp His Cys Arg
325 330 335
Phe Phe Phe Glu Ala Ala Arg His Cys Lys Glu Ala Phe Leu Lys Ala
340 345 350
Trp His Asp Asn Glu Leu Asp Thr Ser Lys Cys Ile Met Leu Arg Asn
355 360 365
Leu Trp Thr Lys Thr Ser Ser Ile Leu Ala Ser Gly Val Asp Met Thr
370 375 380
Phe Gly Ile Cys Asp Gln Leu Gln Glu Val Val Gly Pro Ala Pro Thr
385 390 395 400
Gly Ser Gly Pro Ile Ala Cys Ser Pro Ala Thr Arg Ser Lys Ser Gln
405 410 415
Ala Ala Gln Gln Ala Gln Leu Leu Ser His Pro Gly Ser Lys Glu Gly
420 425 430
Met Gly Pro Trp Asn Leu Pro Asp Asp Leu Arg Lys Met Asp Asp Gly
435 440 445
Val Ser Met Leu Cys Gly Phe Met Phe Ile Gln Asp Glu Leu Phe Val
450 455 460
Phe Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu Val
465 470 475 480
Glu Gly Lys Val Glu Ser Phe Ala Val Leu Pro Ile Leu Leu Leu Ala
485 490 495
Glu Ile Phe His Pro Asp Asp Leu Pro Asp Val Tyr Ala Ala Ile Gly
500 505 510
Ala His Trp Phe Arg Arg Arg Pro Ser Ser Gly Val Gly Val Gly Gly
515 520 525
Ser Asn Gly Ser Ile Ser Ser Met Asn Ser Ser Ser Gly Ser Thr Ser
530 535 540
Ser Arg Asp Ser Ala Ser Pro Gly Pro Val Ser Arg Glu Val Pro Glu
545 550 555 560
Ala Ala Trp Ile Cys Lys Cys Ile Asp Lys Arg Asn Thr Glu Ile Thr
565 570 575
Ala Leu Val Arg Phe Arg Ser Phe Ala Ala Pro Thr Glu Gly Tyr Ala
580 585 590
Gly Ala Ala Met Leu Ser Ile Leu Pro Leu Thr Arg Ser Lys Tyr Ile
595 600 605
Ala Asp Pro Asp Val Gln Thr Asn Met Arg Ser Gly Val Ser Ser Arg
610 615 620
His His Leu Arg Asp Thr Phe Gly Ala Leu Pro Thr Ala Leu Pro Glu
625 630 635 640
His Asp Asp Glu Asp Asp Asp Asp Glu His His His Leu Val Leu Glu
645 650 655
Arg Arg Gly Glu Arg Val Gly Ala Ser Gly His Gly Gln Asp Leu Leu
660 665 670
Asn Glu Glu Glu Asp Asp Glu Ile Phe Leu Asp Ala His Gly Asp Asp
675 680 685
Ala Met Phe Arg Pro Leu Arg Arg Gly Met Thr Val Leu Ser Ala Glu
690 695 700
Thr Ser Gly Pro Gln Pro Val Pro Leu Ser Lys His Ala Ser Asp Pro
705 710 715 720
Leu Pro His His Asn Glu His His Phe His Ser Gln Pro Gln His Thr
725 730 735
Ser Ser His Leu Ser Ser Leu Ser Ser Met Ala Ser His Gln Thr Gly
740 745 750
Val Ser Trp Gly Gly Gly Arg Ile Ser Glu Cys Leu Gly Asn Gln Asn
755 760 765
Arg Ser Ala Ser Gln Phe Tyr Asn Thr Val Gln His Gln Glu Arg Pro
770 775 780
Lys Arg Glu Gln Glu Glu Pro His Gln Gln His Arg Glu Glu Gln Gln
785 790 795 800
Gln His Arg Leu Pro Gly Asn Asn Ser Leu Asp Gly Ser Ser Ser His
805 810 815
Gly Gly Ala Met Asp Gln Asp Leu Pro Thr Val Gln Leu Thr Gln Ala
820 825 830
Gln Leu Phe Leu Leu Gln Gly Gly Thr Gly Ser Gly Ile Gly Leu Phe
835 840 845
Lys Asp Ile Gln Gln Glu Gln Gln His Met Cys Asn Gln Ile Ser Pro
850 855 860
Asp Gly Val Thr Ala Ala Glu Glu Ser Ala Glu Arg Val Ala Thr Glu
865 870 875 880
Leu Tyr Gly Ser Ser Pro Ser Pro Glu Pro His Leu Leu Gly His Ser
885 890 895
Arg His Ser Pro Thr Gln Arg Ala Gln Gln Gln Gln Gln Gln Gln Lys
900 905 910
Arg Gln Gln Glu Arg Gln Gln Glu Asp Gln Gln Gln Glu Gln Gly His
915 920 925
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gly Met Val Leu Pro Leu
930 935 940
Pro His Leu Pro Gly Met Val Pro Ser Leu Val Arg Thr Val Ser Ser
945 950 955 960
Ser Ala Met Leu Gly Ala Arg Pro Thr Thr Ile Ser Gln Gly Lys Asp
965 970 975
Glu Gly Gly Arg Gly Gly Ala Leu Ser His Ser Asn Ser Ser Thr Asp
980 985 990
Leu Asp Met Ser Cys His Gly Pro Ala Asp Pro Asn Gly Tyr Gly Gly
995 1000 1005
Leu His Trp Thr Pro Ala Pro Leu Ala Ser Phe Leu Gly Val Ser
1010 1015 1020
Ser Trp Gly Ser Arg Arg Gly Ser Arg Lys Glu Glu Arg Ser Lys
1025 1030 1035
Asp
<210> 18
<211> 364
<212> PRT
<213> 颗粒微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物
<220>
<221> misc_feature
<223> 部分序列
<220>
<221> misc_feature
<222> (211)..(211)
<223> Xaa可为任何自然存在的氨基酸
<400> 18
Met Thr Thr Leu Ile Gly Gln Pro Pro Pro Ser Leu Arg Ala Met Gly
1 5 10 15
Ser Ala Phe Tyr Asp Glu Asp Ala Gln Ser Val Val Ala Leu Ser Gln
20 25 30
His Ala Ser Gly Ser Gly Thr Glu Asp Glu Met Asp Thr Asp His Phe
35 40 45
Asp Glu Leu Asp Arg Ile Ile Phe Asp Met Pro Tyr Val Ala Asp Gln
50 55 60
Asp Pro Phe Ser Ser Gly Ser Gly Gly Gly Gln Ser Gln Gly Gln Thr
65 70 75 80
Asn Gly Gln Gly His Gly His Gln Gln Arg Gly Gly Ala Ser Gln His
85 90 95
Gly Gly Ala Gly Leu Leu Met Pro Thr Pro His Asn Gly His Thr His
100 105 110
Gly Asp Gly Gly His His Ser Asn His Ser Asn His Gly Ser Ala Arg
115 120 125
Gly Gly Gly Ile Asp Trp His Val Lys Glu Glu Asp Ala Ser Tyr His
130 135 140
Thr Ala Val Asp Ser Ser Cys His Ile Asp Arg Ser Tyr His Arg Val
145 150 155 160
Asp Val Ser Gly His Ser Met Ile Asp Ala Ser Gly His Ser Met Met
165 170 175
Asp Ala Ser Gly His Glu Ser Leu Ile Asp Ser Ser Gly His Tyr Asp
180 185 190
Asp Phe Ala Ala His Lys Gly Asp Pro Arg Tyr Met Glu His Ser Cys
195 200 205
Glu Ala Xaa Pro Cys Gln Ile Cys Thr Ser Arg Gly Ile Lys Cys Val
210 215 220
Pro Gln Ile Arg Gly Pro Gly Arg Pro Pro Gly Ser Lys Ser Ser Arg
225 230 235 240
Gly Ser Ser Ser Ser Ser Ser Leu Ala Leu Ser Ser Ser Arg His Gly
245 250 255
Gly Ser Arg Gly Asp Val Arg Ser Ser Leu Asn Ser Thr Gln His Ser
260 265 270
Thr Asn Ser Ser Ala Thr Thr Ser Ala Ala Ser Ser Thr Ala Ser Ser
275 280 285
Leu Ser Arg Ser Leu Ser Gly Asn Gly Leu Leu Gln Gln Glu Gln Glu
290 295 300
Leu Ala Ala Val Ala Ala Gly Ala Ala Arg Gln Ser Pro Pro Arg Asp
305 310 315 320
Pro Trp His Cys Arg Phe Phe Phe Glu Ala Ala Arg His Cys Lys Glu
325 330 335
Ala Phe Leu Lys Ala Trp His Asp Asn Glu Leu Asp Thr Ser Lys Cys
340 345 350
Ile Met Leu Arg Tyr Val Leu Thr Ser Phe Gly Asp
355 360
<210> 19
<211> 333
<212> PRT
<213> 眼点微拟球藻藻
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物
<220>
<221> misc_feature
<223> 部分序列
<220>
<221> misc_feature
<222> (65)..(65)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (176)..(176)
<223> Xaa可为任何自然存在的氨基酸
<220>
<221> misc_feature
<222> (316)..(316)
<223> Xaa可为任何自然存在的氨基酸
<400> 19
Met Thr Thr Leu Leu Gly Gln Pro Pro Pro Ser Leu Arg Ala Met Gly
1 5 10 15
Ser Ala Phe Tyr Asp Glu Asp Ala Gln Ser Val Val Ala Leu Ser Gln
20 25 30
His Ala Ala Gly Ser Gly Thr Glu Asp Glu Met Asp Thr Asp His Phe
35 40 45
Asp Glu Leu Asp Arg Ile Ile Phe Asp Met Pro Tyr Val Ala Glu Gln
50 55 60
Xaa Leu Leu Met Pro Thr Pro His Asn Gly His Thr His Gly Asp Gly
65 70 75 80
Gly Tyr His Ser Asn His Ser Asn His Gly Ser Ala Arg Gly Gly Gly
85 90 95
Met Asp Trp His Val Lys Glu Glu Asp Ala Ser Tyr His Thr Ala Val
100 105 110
Asp Ser Ser Cys His Ile Asp Arg Ser Tyr His Arg Val Asp Ala Ser
115 120 125
Gly His Ser Met Ile Asp Ala Ser Gly His Ser Met Met Asp Ala Ser
130 135 140
Gly His Glu Ser Leu Ile Asp Ser Ser Gly His Tyr Asp Asp Phe Ala
145 150 155 160
Ala His Lys Gly Asp Pro Arg Tyr Met Glu His Ser Cys Glu Ala Xaa
165 170 175
Pro Cys Gln Ile Cys Thr Ser Arg Gly Ile Lys Cys Val Pro Gln Ile
180 185 190
Arg Gly Pro Gly Arg Pro Pro Gly Ser Lys Ser Ser Arg Gly Ser Ser
195 200 205
Ser Ser Ser Ser Leu Ala Leu Ser Ser Ser Arg His Gly Gly Ser Arg
210 215 220
Gly Asp Val Arg Ser Ser Leu Asn Asn Thr Gln His Ser Thr Asn Ser
225 230 235 240
Ser Ala Thr Thr Ser Ala Ala Ser Ser Thr Ala Ser Ser Leu Ser Arg
245 250 255
Ser Leu Ser Gly Asn Gly Leu Leu Gln Gln Glu Gln Glu Leu Ala Ala
260 265 270
Val Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Gln Ser Pro Pro Arg
275 280 285
Asp Pro Trp His Cys Arg Phe Phe Phe Glu Ala Ala Arg His Cys Lys
290 295 300
Glu Ala Phe Leu Lys Ala Trp His Asp Asn Glu Xaa Lys Ala Trp His
305 310 315 320
Asp Asn Glu Leu Asp Thr Ser Lys Cys Ile Met Leu Arg
325 330
<210> 20
<211> 255
<212> PRT
<213> 盐生微拟球藻藻
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物
<400> 20
Met Thr Thr Phe Leu Asn Pro Gly Pro Ala Arg Glu Lys Leu Val Gly
1 5 10 15
Ser Gly Val Phe Phe Glu Asp Ser Ile Gly Leu Val Gly His Glu Ser
20 25 30
Gly Gly Gly Val Gly Ser Gln Asp Glu Met Asp Thr Asp His Phe Asn
35 40 45
Glu Leu Asp His Ile Phe Asp Leu Ser Tyr Ser Ala Glu Gln Asp Pro
50 55 60
Phe Gly Ser Gly Ser Gly His Ala Gln Ser Gln Gly Thr Gly Tyr Gly
65 70 75 80
His Pro Pro Gln Thr Gln Leu Gly Gly Ala Gly Leu Leu Met Pro His
85 90 95
Pro His Asn Ser His Gly Ala Thr Ser His Asp Gly Ser Arg Met His
100 105 110
Asn Asp Gly Met Asp Trp Arg Ala Lys Asp Glu Asp Cys Ser Tyr His
115 120 125
Thr Ala Val Asp Ala Ser Cys His Ile Asp Ser Ser Tyr His His Val
130 135 140
Asp Ala Ser Gly His Ser Met Val Asp Ala Ser Gly His Ser Thr Ile
145 150 155 160
Asp Ala Ser Gly His Asp Ser Leu Ile Asp Ser Ser Gly His Tyr Asp
165 170 175
Asp Tyr Leu Ala His Lys Gly Asp Ala Arg Tyr Met Glu His Ser Cys
180 185 190
Glu Ala Cys Lys Arg Ser Lys Val Arg Arg Val Ala Thr Ser Leu Trp
195 200 205
Arg Ala Gln Pro Arg Arg Tyr Phe His Ala Leu Pro His Gln Ser His
210 215 220
Phe Val Leu Leu Asn Pro Lys Phe Cys Val Leu Arg Asn Ile Val Ala
225 230 235 240
Cys Pro Thr Ala Pro His Ser Ser Leu Tyr Phe His Ile Pro Ser
245 250 255
<210> 21
<211> 173
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845的PAS3结构域
<400> 21
Asn Leu Trp Thr Lys Val Ser Ser Gln Leu Ala Ser Gly Thr Asp Met
1 5 10 15
Thr Phe Gly Ile Cys Asp Gln Leu Gln Glu Val Val Gly Pro Ala Pro
20 25 30
Thr Gly Ser Gly Pro Met Ala Gly Ser Pro Ala Thr Arg Ser Lys Ser
35 40 45
His Ala Ala Gln Gln Ala Gln Leu Leu Thr His Pro Gly Ser Lys Glu
50 55 60
Ala Met Gly Pro His Cys Leu Pro Leu Asp Leu Arg Arg Met Glu Asp
65 70 75 80
Gly Val Ser Met Leu Cys Gly Phe Met Phe Leu Gln Asp Glu Leu Phe
85 90 95
Val Tyr Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu
100 105 110
Val Glu Ser Lys Val Gly Ser Leu Ala Val Leu Pro Ile Leu Leu Leu
115 120 125
Ala Glu Ile Phe His Pro Asp Asp Leu Pro Asp Ile Tyr Ala Ala Ile
130 135 140
Gly Ala Tyr Trp Phe Ser Arg Arg Ser Ser Thr Thr Ser Glu Ser Gly
145 150 155 160
Ser Ser Ser Ser Ser Ser Thr Asn Ser Ser Val Ser Ser
165 170
<210> 22
<211> 173
<212> PRT
<213> 海洋微拟球藻藻
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物的PAS3结构域
<220>
<221> misc_feature
<223> 菌株IMET1
<400> 22
Asn Leu Trp Thr Lys Thr Ser Ser Ile Leu Ala Ser Gly Val Asp Met
1 5 10 15
Thr Phe Gly Ile Cys Asp Gln Leu Gln Glu Val Val Gly Pro Ala Pro
20 25 30
Thr Gly Ser Gly Pro Ile Ala Cys Ser Pro Ala Thr Arg Ser Lys Ser
35 40 45
Gln Ala Ala Gln Gln Ala Gln Leu Leu Ser His Pro Gly Ser Lys Glu
50 55 60
Gly Met Gly Pro Trp Asn Leu Pro Asp Asp Leu Arg Lys Met Asp Asp
65 70 75 80
Gly Val Ser Met Leu Cys Gly Phe Met Phe Ile Gln Asp Glu Leu Phe
85 90 95
Val Phe Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu
100 105 110
Val Glu Gly Lys Val Glu Ser Phe Ala Val Leu Pro Ile Leu Leu Leu
115 120 125
Ala Glu Ile Phe His Pro Asp Asp Leu Pro Asp Val Tyr Ala Ala Ile
130 135 140
Gly Ala His Trp Phe Arg Arg Arg Pro Ser Ser Gly Val Gly Val Gly
145 150 155 160
Gly Ser Asn Gly Ser Ile Ser Ser Met Asn Ser Ser Ser
165 170
<210> 23
<211> 173
<212> PRT
<213> 盐生微拟球藻藻
<220>
<221> misc_feature
<223> 菌株CCMP
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物的PAS3结构域
<400> 23
Asn Leu Trp Thr Lys Val Ser Ser Gln Leu Ala Ser Gly Thr Asp Met
1 5 10 15
Thr Phe Gly Ile Cys Asp Gln Leu Gln Glu Val Val Gly Pro Ala Pro
20 25 30
Thr Gly Ser Gly Pro Met Ala Gly Ser Pro Ala Thr Arg Ser Lys Ser
35 40 45
His Ala Ala Gln Gln Ala Gln Leu Leu Thr His Pro Gly Ser Lys Glu
50 55 60
Ala Met Gly Pro His Cys Leu Pro Leu Asp Leu Arg Arg Met Glu Asp
65 70 75 80
Gly Val Ser Met Leu Cys Gly Phe Met Phe Leu Gln Asp Glu Leu Phe
85 90 95
Val Tyr Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu
100 105 110
Val Glu Ser Lys Val Gly Ser Leu Ala Val Leu Pro Ile Leu Leu Leu
115 120 125
Ala Glu Ile Phe His Pro Asp Asp Leu Pro Asp Ile Tyr Ala Ala Ile
130 135 140
Gly Ala Tyr Trp Phe Ser Arg Arg Ser Ser Thr Met Ser Asp Ser Gly
145 150 155 160
Ser Ser Ser Ser Ser Thr Ser Ser Ser Val Ser Ser Ala
165 170
<210> 24
<211> 173
<212> PRT
<213> 眼点微拟球藻藻
<220>
<221> misc_feature
<223> 菌株CCMP525
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物的PAS3结构域
<400> 24
Asn Leu Trp Thr Lys Thr Ser Ser Val Leu Ala Ser Gly Val Asp Met
1 5 10 15
Thr Phe Gly Ile Cys Glu Gln Leu Gln Glu Val Val Gly Pro Ala Pro
20 25 30
Thr Gly Thr Gly Pro Ile Ala Cys Ser Pro Ala Thr Arg Ser Lys Ser
35 40 45
Gln Ala Val Gln Gln Ala Gln Leu Leu Thr His Pro Gly Ser Lys Glu
50 55 60
Gly Met Gly Pro Trp Asn Leu Pro Asp Asp Leu Arg Lys Met Asp Asp
65 70 75 80
Gly Val Ser Met Leu Cys Gly Phe Met Phe Ile Gln Asp Glu Leu Phe
85 90 95
Val Tyr Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu
100 105 110
Val Glu Gly Lys Val Glu Ser Phe Ala Val Leu Pro Ile Leu Leu Leu
115 120 125
Ala Glu Ile Phe His Pro Asp Asp Leu Pro Asp Val Tyr Ala Ala Ile
130 135 140
Gly Ala His Trp Phe Arg Arg Arg Pro Ser Ser Gly Gly Gly Val Gly
145 150 155 160
Gly Ser Asn Gly Ser Ile Ser Ser Met Thr Ser Asn Gly
165 170
<210> 25
<211> 173
<212> PRT
<213> 颗粒微拟球藻
<220>
<221> misc_feature
<223> 菌株CCMP529
<220>
<221> misc_feature
<223> ZnCys-2845直系同源物的PAS3结构域
<400> 25
Asn Leu Trp Thr Lys Thr Ser Ser Val Leu Ala Ser Gly Val Asp Met
1 5 10 15
Thr Phe Gly Ile Cys Asp Gln Leu Gln Glu Val Val Gly Pro Ala Pro
20 25 30
Thr Gly Ser Gly Pro Ile Ala Cys Ser Pro Ala Thr Arg Ser Lys Ser
35 40 45
Gln Ala Ala Gln Gln Ala Gln Leu Leu Ser His Pro Gly Ser Lys Glu
50 55 60
Gly Met Gly Pro Trp Asn Leu Pro Asp Asp Leu Arg Lys Met Asp Asp
65 70 75 80
Gly Val Ser Met Leu Cys Gly Phe Met Phe Ile Gln Asp Glu Leu Phe
85 90 95
Val Tyr Thr Asp Glu Arg Phe Ala Ala Thr Phe Met Thr Arg Glu Glu
100 105 110
Val Glu Gly Lys Val Glu Ser Phe Ala Val Leu Pro Ile Leu Leu Leu
115 120 125
Ala Glu Ile Phe His Pro Asp Asp Leu Pro Asp Val Tyr Ala Ala Ile
130 135 140
Gly Ala His Trp Phe Arg Arg Arg Pro Ser Ser Gly Val Gly Val Gly
145 150 155 160
Gly Ser Asn Gly Ser Ile Ser Ser Met Asn Ser Ser Ser
165 170
<210> 26
<211> 11263
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 载体pSGE-6206
<400> 26
gcggccgccg tatggtcgac ggttgctcgg atgggggggg cggggagcga tggagggagg 60
aagatcaggt aaggtctcga cagactagag aagcacgagt gcaggtataa gaaacagcaa 120
aaaaaagtaa tgggcccagg cctggagagg gtatttgtct tgtttttctt tggccaggaa 180
cttgttctcc tttcttcgtt tctaggaccc cgatccccgc tcgcatttct ctcttcctca 240
gccgaagcgc agcggtaaag catccatttt atcccaccga aagggcgctc ccagccttcg 300
tcgagcggaa ccggggttac agtgcctcaa ccctcccaga cgtagccaga gggaagcaac 360
tccctgatgc caaccgctgt gggctgccca tcggaatctt tgacaattgc cttgatcccc 420
gggtgcaagt caagcagcac ctgccgacat cgcccgcacg gagacagaat gccgcggttt 480
tcgttcccga tggccactat gcacgtcaga tttccggcag cagccgcagc ggccgttccg 540
aggaccacga gctccgcgca tggccctccg gtgaaatgat atacattcac gccggtaaag 600
atccgaccgt cggacgagag ggctgcactg gccaccgagt agtcctcgct aataggtatg 660
ctgttgatgg tcgcagttgc acgttcgatc agcgtggatt cctcttggga taaaggcttg 720
gccatcgagc tcggtacccg gggatccatg attgttgtat tatgtaccta tgtttgtgat 780
gagacaataa atatgagaag agaacgttgc ggccactttt ttctccttcc ttcgcgtgct 840
catgttggtg gtttgggagg cagaagatgc atggagcgcc acacattcgg taggacgaaa 900
cagcctcccc cacaaaggga ccatgggtag ctaggatgac gcacaagcga gttcccgctc 960
tcgaagggaa acccaggcat ttccttcctc ttttcaagcc acttgttcac gtgtcaacac 1020
aattttggac taaaatgccc ctcggaactc ggcaggcctc cctctgctcc gttgtcctgg 1080
tcgccgagaa cgcgagaccg tgccgcatgc catcgatctg ctcgtctgta ctactaatcg 1140
tgtgcgtgtt cgtgcttgtt tcgcacgaaa ttgtcctcgt tcggccctca caacggtgga 1200
aatcggtgct agaataaagt gaggtggctt atttcaatgg cggccgtcat catgcgggat 1260
caactgaagt acggcgggtt ctcgagattt catcgtgctc gtccagagca ggtgttttgc 1320
ctgcagctct tcatgtttag gggtcatgat ttcatctgat atgccgtaag aaaaccaata 1380
ttcacttctc aattttccat ggaaaggtga aggcctaggt tgtgtgcgag gcaacgactg 1440
gggagggatc gcaacattct tgctaacctc ccctctatct tggccgctgt gaatcggcat 1500
atttaccggg ctgaattgag aaagtgtttt gagggaatta aaaggtggct gtcttgcaag 1560
cttggcttca gtgcctgctt aattcgaacc gatccagctt gtgatgaggc cttcctaagc 1620
ctggtagtca gaagcgacat ggcgctataa atttcgtctc agttggagag tagaaaagca 1680
tgattcgaac acggttttca actgccaaag atatctccat tgtttccttc aatctgtaca 1740
cctgcacggt gcaccagttg gtacggcata ttatggttta ataagcatac atcatatgaa 1800
tacaattcag cttaaattta tcatacaaag atgtaagtgc agcgtgggtc tgtaacgatc 1860
gggcgtaatt taagataatg cgagggaccg ggggaggttt tggaacggaa tgaggaatgg 1920
gtcatggccc ataataataa tatgggtttg gtcgcctcgc acagcaaccg tacgtgcgaa 1980
aaaggaacag atccatttaa taagttgaac gttattcttt cctatgcaat gcgtgtatcg 2040
gaggcgagag caagtcatag gtggctgcgc acaataattg agtctcagct gagcgccgtc 2100
cgcgggtggt gtgagtggtc atcctcctcc cggcctatcg ctcacatcgc ctctcaatgg 2160
tggtggtggg gcctgatatg acctcaatgc cgacccatat taaaacccag taaagcattc 2220
accaacgaac gaggggctct tttgtgtgtg ttttgagtat gattttacac ctctttgtgc 2280
atctctctgg tcttccttgg ttcccgtagt ttgggcatca tcactcacgc ttccctcgac 2340
cttcgttctt cctttacaac cccgacacag gtcagagttg gagtaatcaa aaaaggggtg 2400
cacgaatgag atacattaga ttttgacaga tatcctttta ctggagaggg ttcaagggat 2460
caaatgaaca gcgggcgttg gcaatctagg gagggatcgg aggttggcag cgagcgaaag 2520
cgtgtccatc cttttggctg tcacacctca cgaaccaact gttagcaggc cagcacagat 2580
gacatacgag aatctttatt atatcgtaga ccttatgtgg atgacctttg gtgctgtgtg 2640
tctggcaatg aacctgaagg cttgataggg aggtggctcc cgtaaaccct ttgtcctttc 2700
cacgctgagt ctcccccgca ctgtccttta tacaaattgt tacagtcatc tgcaggcggt 2760
ttttctttgg caggcaaaga tgcccaagaa aaagcggaag gtcggcgact acaaggatga 2820
cgatgacaag ttggagcctg gagagaagcc ctacaaatgc cctgagtgcg gaaagagctt 2880
cagccaatct ggagccttga cccggcatca acgaacgcat acacgagaca agaagtactc 2940
catcgggctg gacatcggga cgaactccgt gggatgggcc gtgatcacag acgaatacaa 3000
ggtgccttcc aagaagttca aggtgctggg gaacacggac agacactcca tcaagaagaa 3060
cctcatcggg gccttgctct tcgactccgg agaaaccgcc gaagcaacgc gattgaaaag 3120
aaccgccaga agacgataca cacgacggaa gaaccgcatc tgctacctcc aggagatctt 3180
cagcaacgag atggccaagg tggacgactc gttctttcat cgcctggagg agagcttcct 3240
ggtggaggaa gacaagaaac atgagcgcca cccgatcttc gggaacatcg tggacgaagt 3300
ggcctaccac gagaaatacc ccacgatcta ccacttgcgc aagaaactcg tggactccac 3360
ggacaaagcg gacttgcggt tgatctactt ggccttggcc cacatgatca aatttcgggg 3420
ccacttcctg atcgagggcg acttgaatcc cgacaattcc gacgtggaca agctcttcat 3480
ccagctggtg cagacctaca accagctctt cgaggagaac cccatcaatg cctccggagt 3540
ggacgccaaa gccatcttgt ccgcccgatt gtccaaatcc agacgcttgg agaacttgat 3600
cgcacaactt cctggcgaga agaagaacgg cctcttcggc aacttgatcg cgctgtcgct 3660
gggattgacg cctaacttca agtccaactt cgacttggcc gaggacgcca agttgcaact 3720
gtccaaggac acctacgacg acgacctcga caacctgctg gcccaaattg gcgaccaata 3780
cgcggacttg tttttggcgg ccaagaactt gagcgacgcc atcttgttga gcgacatctt 3840
gcgcgtgaat acggagatca ccaaagcccc tttgtccgcc tctatgatca agcggtacga 3900
cgagcaccac caagacttga ccctgttgaa agccctcgtg cggcaacaat tgcccgagaa 3960
gtacaaggag atcttcttcg accagtccaa gaacgggtac gccggctaca tcgacggagg 4020
agcctcccaa gaagagttct acaagttcat caagcccatc ctggagaaga tggacggcac 4080
cgaggagttg ctcgtgaagc tgaaccgcga agacttgttg cgaaaacagc ggacgttcga 4140
caatggcagc atcccccacc aaatccattt gggagagttg cacgccatct tgcgacggca 4200
agaggacttc tacccgttcc tgaaggacaa ccgcgagaaa atcgagaaga tcctgacgtt 4260
cagaatcccc tactacgtgg gacccttggc ccgaggcaat tcccggtttg catggatgac 4320
gcgcaaaagc gaagagacga tcaccccctg gaacttcgaa gaagtggtcg acaaaggagc 4380
atccgcacag agcttcatcg agcgaatgac gaacttcgac aagaacctgc ccaacgagaa 4440
ggtgttgccc aagcattcgc tgctgtacga gtacttcacg gtgtacaacg agctgaccaa 4500
ggtgaagtac gtgaccgagg gcatgcgcaa acccgcgttc ctgtcgggag agcaaaagaa 4560
ggccattgtg gacctgctgt tcaagaccaa ccggaaggtg accgtgaaac agctgaaaga 4620
ggactacttc aagaagatcg agtgcttcga ctccgtggag atctccggcg tggaggaccg 4680
attcaatgcc tccttgggaa cctaccatga cctcctgaag atcatcaagg acaaggactt 4740
cctggacaac gaggagaacg aggacatcct ggaggacatc gtgctgaccc tgaccctgtt 4800
cgaggaccga gagatgatcg aggaacggtt gaaaacgtac gcccacttgt tcgacgacaa 4860
ggtgatgaag cagctgaaac gccgccgcta caccggatgg ggacgattga gccgcaaact 4920
gattaatgga attcgcgaca agcaatccgg aaagaccatc ctggacttcc tgaagtccga 4980
cgggttcgcc aaccgcaact tcatgcagct catccacgac gactccttga ccttcaagga 5040
ggacatccag aaggcccaag tgtccggaca aggagactcc ttgcacgagc acatcgccaa 5100
tttggccgga tcccccgcaa tcaaaaaagg catcttgcaa accgtgaaag tggtcgacga 5160
actggtgaag gtgatgggac ggcacaagcc cgagaacatc gtgatcgaaa tggcccgcga 5220
gaaccaaacc acccaaaaag gacagaagaa ctcccgagag cgcatgaagc ggatcgaaga 5280
gggcatcaag gagttgggct cccagatcct gaaggagcat cccgtggaga atacccaatt 5340
gcaaaacgag aagctctacc tctactacct ccagaacggg cgggacatgt acgtcgacca 5400
agagctggac atcaaccgcc tctccgacta cgatgtggat catattgtgc cccagagctt 5460
cctcaaggac gacagcatcg acaacaaggt cctgacgcgc agcgacaaga accggggcaa 5520
gtctgacaat gtgccttccg aagaagtcgt gaagaagatg aagaactact ggcggcagct 5580
gctcaacgcc aagctcatca cccaacggaa gttcgacaac ctgaccaagg ccgagagagg 5640
aggattgtcc gagttggaca aagccggctt cattaaacgc caactcgtgg agacccgcca 5700
gatcacgaag cacgtggccc aaatcttgga ctcccggatg aacacgaaat acgacgagaa 5760
tgacaagctg atccgcgagg tgaaggtgat cacgctgaag tccaagctgg tgagcgactt 5820
ccggaaggac ttccagttct acaaggtgcg ggagatcaac aactaccatc acgcccatga 5880
cgcctacctg aacgccgtgg tcggaaccgc cctgatcaag aaatacccca agctggagtc 5940
cgaattcgtg tacggagatt acaaggtcta cgacgtgcgg aagatgatcg cgaagtccga 6000
gcaggagatc ggcaaagcca ccgccaagta cttcttttac tccaacatca tgaacttctt 6060
caagaccgag atcacgctcg ccaacggcga gatccgcaag cgccccctga tcgagaccaa 6120
cggcgagacg ggagagattg tgtgggacaa aggaagagat tttgccacag tgcgcaaggt 6180
gctgtccatg cctcaggtga acatcgtgaa gaagaccgag gtgcaaacag gagggttttc 6240
caaagagtcc attttgccta agaggaattc cgacaagctc atcgcccgca agaaggactg 6300
ggaccccaag aagtacgggg gcttcgactc ccccacggtg gcctactccg tgttggtggt 6360
ggccaaagtg gagaaaggga agagcaagaa gctgaaatcc gtgaaggagt tgctcggaat 6420
cacgatcatg gaacgatcgt cgttcgagaa aaaccccatc gacttcctcg aagccaaagg 6480
gtacaaagag gtgaagaagg acctgatcat caagctgccc aagtactccc tgttcgagct 6540
ggagaacggc cgcaagcgga tgctggcctc cgccggggaa ctgcagaaag ggaacgaatt 6600
ggccttgccc tccaaatacg tgaacttcct ctacttggcc tcccattacg aaaagctcaa 6660
aggatcccct gaggacaatg agcagaagca actcttcgtg gaacaacaca agcactacct 6720
ggacgagatc atcgagcaga tcagcgagtt ctccaagcgc gtgatcctcg ccgacgccaa 6780
cctggacaag gtgctctccg cctacaacaa gcaccgcgac aagcctatcc gcgagcaagc 6840
cgagaatatc attcacctgt ttaccctgac gaatttggga gcccctgccg cctttaaata 6900
ctttgacacc accatcgacc gcaaaagata cacctccacc aaggaagtct tggacgccac 6960
cctcatccac cagtccatca cgggcctcta cgagacgcgc atcgacctct cccaattggg 7020
cggcgactaa agtgatgcgg cctttaggaa acaccacaaa agtaattgac aatctcagga 7080
acgatctgcg tgtttacagc ttcccaaata acaattatac cacgtaccaa aaggggttta 7140
atgtatctca caaattcttc taataggtac agcttctcaa attgggtgta tgatgtgaca 7200
cttcgtctca cacacgtcac gataattcag cgtatggctt cccttcatca cattcacgca 7260
aacttctaca caaccctggg catatttctt gtgttggcaa cactcccgaa atcgattctg 7320
cacacaatgg ttcattcaat gattcaagta cgttttagac ggactaggca gtttaattaa 7380
aaacatctat cctccagatc accagggcca gtgaggccgg cataaaggac ggcaaggaaa 7440
gaaaagaaag aaagaaaagg acacttatag catagtttga agttataagt agtcgcaatc 7500
tgtgtgcagc cgacagatgc tttttttttc cgtttggcag gaggtgtagg gatgtcgaag 7560
accagtccag ctagtatcta tcctacaagt caatcatgct gcgacaaaaa tttctcgcac 7620
gaggcctctc gataaacaaa actttaaaag cacacttcat tgtcatgcag agtaataact 7680
cttccgcgtc gatcaattta tcaatctcta tcatttccgc ccctttcctt gcatagagca 7740
agaaaagcga cccggatgag gataacatgt cctgcgccag tagtgtggca ttgcctgtct 7800
ctcatttaca cgtactgaaa gcataatgca cgcgcatacc aatatttttc gtgtacggag 7860
atgaagagac gcgacacgta agatcacgag aaggcgagca cggttgccaa tggcagacgc 7920
gctagtctcc attatcgcgt tgttcggtag cttgctgcat gtcttcagtg gcactatatc 7980
cactctgcct cgtcttctac acgagggcca catcggtgca agttcgaaaa atcatatctc 8040
aatcttcaga tcctttccag aaacggtgct caggcgggaa agtgaaggtt ttctactcta 8100
gtggctaccc caattctctc cgactgtcgc agacggtcct tcgttgcgca cgcaccgcgc 8160
actacctctg aaattcgaca accgaagttc aattttacat ctaacttctt tcccattctc 8220
tcaccaaaag cctagcttac atgttggaga gcgacgagag cggcctgccc gccatggaga 8280
tcgagtgccg catcaccggc accctgaacg gcgtggagtt cgagctggtg ggcggcggag 8340
agggcacccc cgagcagggc cgcatgacca acaagatgaa gagcaccaaa ggcgccctga 8400
ccttcagccc ctacctgctg agccacgtga tgggctacgg cttctaccac ttcggcacct 8460
accccagcgg ctacgagaac cccttcctgc acgccatcaa caacggcggc tacaccaaca 8520
cccgcatcga gaagtacgag gacggcggcg tgctgcacgt gagcttcagc taccgctacg 8580
aggccggccg cgtgatcggc gacttcaagg tgatgggcac cggcttcccc gaggacagcg 8640
tgatcttcac cgacaagatc atccgcagca acgccaccgt ggagcacctg caccccatgg 8700
gcgataacga tctggatggc agcttcaccc gcaccttcag cctgcgcgac ggcggctact 8760
acagctccgt ggtggacagc cacatgcact tcaagagcgc catccacccc agcatcctgc 8820
agaacggggg ccccatgttc gccttccgcc gcgtggagga ggatcacagc aacaccgagc 8880
tgggcatcgt ggagtaccag cacgccttca agaccccgga tgcagatgcc ggtgaagaat 8940
aagggtggga aggagtcggg gagggtcctg gcagagcggc gtcctcatga tgtgttggag 9000
acctggagag tcgagagctt cctcgtcacc tgattgtcat gtgtgtatag gttaaggggg 9060
cccactcaaa gccataaaga cgaacacaaa cactaatctc aacaaagtct actagcatgc 9120
cgtctgtcca tctttatttc ctggcgcgcc tatgcttgta aaccgttttg tgaaaaaatt 9180
tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata atctattaaa 9240
ggtcattcaa aaggtcatcc agacgaaagg gcctcgtgat acgcctattt ttataggtta 9300
atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga aatgtgcgcg 9360
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 9420
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 9480
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 9540
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 9600
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 9660
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 9720
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 9780
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 9840
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 9900
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 9960
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 10020
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 10080
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 10140
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 10200
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 10260
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 10320
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 10380
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 10440
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 10500
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 10560
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 10620
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 10680
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 10740
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 10800
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 10860
aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg 10920
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 10980
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 11040
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 11100
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 11160
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 11220
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga aga 11263
<210> 27
<211> 4101
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 来自酿脓葡萄球菌对于微拟球藻经密码子优化的Cas9
<400> 27
gacaagaagt actccatcgg gctggacatc gggacgaact ccgtgggatg ggccgtgatc 60
acagacgaat acaaggtgcc ttccaagaag ttcaaggtgc tggggaacac ggacagacac 120
tccatcaaga agaacctcat cggggccttg ctcttcgact ccggagaaac cgccgaagca 180
acgcgattga aaagaaccgc cagaagacga tacacacgac ggaagaaccg catctgctac 240
ctccaggaga tcttcagcaa cgagatggcc aaggtggacg actcgttctt tcatcgcctg 300
gaggagagct tcctggtgga ggaagacaag aaacatgagc gccacccgat cttcgggaac 360
atcgtggacg aagtggccta ccacgagaaa taccccacga tctaccactt gcgcaagaaa 420
ctcgtggact ccacggacaa agcggacttg cggttgatct acttggcctt ggcccacatg 480
atcaaatttc ggggccactt cctgatcgag ggcgacttga atcccgacaa ttccgacgtg 540
gacaagctct tcatccagct ggtgcagacc tacaaccagc tcttcgagga gaaccccatc 600
aatgcctccg gagtggacgc caaagccatc ttgtccgccc gattgtccaa atccagacgc 660
ttggagaact tgatcgcaca acttcctggc gagaagaaga acggcctctt cggcaacttg 720
atcgcgctgt cgctgggatt gacgcctaac ttcaagtcca acttcgactt ggccgaggac 780
gccaagttgc aactgtccaa ggacacctac gacgacgacc tcgacaacct gctggcccaa 840
attggcgacc aatacgcgga cttgtttttg gcggccaaga acttgagcga cgccatcttg 900
ttgagcgaca tcttgcgcgt gaatacggag atcaccaaag cccctttgtc cgcctctatg 960
atcaagcggt acgacgagca ccaccaagac ttgaccctgt tgaaagccct cgtgcggcaa 1020
caattgcccg agaagtacaa ggagatcttc ttcgaccagt ccaagaacgg gtacgccggc 1080
tacatcgacg gaggagcctc ccaagaagag ttctacaagt tcatcaagcc catcctggag 1140
aagatggacg gcaccgagga gttgctcgtg aagctgaacc gcgaagactt gttgcgaaaa 1200
cagcggacgt tcgacaatgg cagcatcccc caccaaatcc atttgggaga gttgcacgcc 1260
atcttgcgac ggcaagagga cttctacccg ttcctgaagg acaaccgcga gaaaatcgag 1320
aagatcctga cgttcagaat cccctactac gtgggaccct tggcccgagg caattcccgg 1380
tttgcatgga tgacgcgcaa aagcgaagag acgatcaccc cctggaactt cgaagaagtg 1440
gtcgacaaag gagcatccgc acagagcttc atcgagcgaa tgacgaactt cgacaagaac 1500
ctgcccaacg agaaggtgtt gcccaagcat tcgctgctgt acgagtactt cacggtgtac 1560
aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc gcaaacccgc gttcctgtcg 1620
ggagagcaaa agaaggccat tgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680
aaacagctga aagaggacta cttcaagaag atcgagtgct tcgactccgt ggagatctcc 1740
ggcgtggagg accgattcaa tgcctccttg ggaacctacc atgacctcct gaagatcatc 1800
aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860
accctgaccc tgttcgagga ccgagagatg atcgaggaac ggttgaaaac gtacgcccac 1920
ttgttcgacg acaaggtgat gaagcagctg aaacgccgcc gctacaccgg atggggacga 1980
ttgagccgca aactgattaa tggaattcgc gacaagcaat ccggaaagac catcctggac 2040
ttcctgaagt ccgacgggtt cgccaaccgc aacttcatgc agctcatcca cgacgactcc 2100
ttgaccttca aggaggacat ccagaaggcc caagtgtccg gacaaggaga ctccttgcac 2160
gagcacatcg ccaatttggc cggatccccc gcaatcaaaa aaggcatctt gcaaaccgtg 2220
aaagtggtcg acgaactggt gaaggtgatg ggacggcaca agcccgagaa catcgtgatc 2280
gaaatggccc gcgagaacca aaccacccaa aaaggacaga agaactcccg agagcgcatg 2340
aagcggatcg aagagggcat caaggagttg ggctcccaga tcctgaagga gcatcccgtg 2400
gagaataccc aattgcaaaa cgagaagctc tacctctact acctccagaa cgggcgggac 2460
atgtacgtcg accaagagct ggacatcaac cgcctctccg actacgatgt ggatcatatt 2520
gtgccccaga gcttcctcaa ggacgacagc atcgacaaca aggtcctgac gcgcagcgac 2580
aagaaccggg gcaagtctga caatgtgcct tccgaagaag tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctcaa cgccaagctc atcacccaac ggaagttcga caacctgacc 2700
aaggccgaga gaggaggatt gtccgagttg gacaaagccg gcttcattaa acgccaactc 2760
gtggagaccc gccagatcac gaagcacgtg gcccaaatct tggactcccg gatgaacacg 2820
aaatacgacg agaatgacaa gctgatccgc gaggtgaagg tgatcacgct gaagtccaag 2880
ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940
catcacgccc atgacgccta cctgaacgcc gtggtcggaa ccgccctgat caagaaatac 3000
cccaagctgg agtccgaatt cgtgtacgga gattacaagg tctacgacgt gcggaagatg 3060
atcgcgaagt ccgagcagga gatcggcaaa gccaccgcca agtacttctt ttactccaac 3120
atcatgaact tcttcaagac cgagatcacg ctcgccaacg gcgagatccg caagcgcccc 3180
ctgatcgaga ccaacggcga gacgggagag attgtgtggg acaaaggaag agattttgcc 3240
acagtgcgca aggtgctgtc catgcctcag gtgaacatcg tgaagaagac cgaggtgcaa 3300
acaggagggt tttccaaaga gtccattttg cctaagagga attccgacaa gctcatcgcc 3360
cgcaagaagg actgggaccc caagaagtac gggggcttcg actcccccac ggtggcctac 3420
tccgtgttgg tggtggccaa agtggagaaa gggaagagca agaagctgaa atccgtgaag 3480
gagttgctcg gaatcacgat catggaacga tcgtcgttcg agaaaaaccc catcgacttc 3540
ctcgaagcca aagggtacaa agaggtgaag aaggacctga tcatcaagct gcccaagtac 3600
tccctgttcg agctggagaa cggccgcaag cggatgctgg cctccgccgg ggaactgcag 3660
aaagggaacg aattggcctt gccctccaaa tacgtgaact tcctctactt ggcctcccat 3720
tacgaaaagc tcaaaggatc ccctgaggac aatgagcaga agcaactctt cgtggaacaa 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gcgcgtgatc 3840
ctcgccgacg ccaacctgga caaggtgctc tccgcctaca acaagcaccg cgacaagcct 3900
atccgcgagc aagccgagaa tatcattcac ctgtttaccc tgacgaattt gggagcccct 3960
gccgccttta aatactttga caccaccatc gaccgcaaaa gatacacctc caccaaggaa 4020
gtcttggacg ccaccctcat ccaccagtcc atcacgggcc tctacgagac gcgcatcgac 4080
ctctcccaat tgggcggcga c 4101
<210> 28
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 编码FLAG标签
<400> 28
gactacaagg atgacgatga caag 24
<210> 29
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 编码NLS
<400> 29
cccaagaaaa agcggaaggt cggc 24
<210> 30
<211> 147
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 编码肽接头
<400> 30
atgcccaaga aaaagcggaa ggtcggcgac tacaaggatg acgatgacaa gttggagcct 60
ggagagaagc cctacaaatg ccctgagtgc ggaaagagct tcagccaatc tggagccttg 120
acccggcatc aacgaacgca tacacga 147
<210> 31
<211> 1000
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> RPL24启动子
<400> 31
aataagcata catcatatga atacaattca gcttaaattt atcatacaaa gatgtaagtg 60
cagcgtgggt ctgtaacgat cgggcgtaat ttaagataat gcgagggacc gggggaggtt 120
ttggaacgga atgaggaatg ggtcatggcc cataataata atatgggttt ggtcgcctcg 180
cacagcaacc gtacgtgcga aaaaggaaca gatccattta ataagttgaa cgttattctt 240
tcctatgcaa tgcgtgtatc ggaggcgaga gcaagtcata ggtggctgcg cacaataatt 300
gagtctcagc tgagcgccgt ccgcgggtgg tgtgagtggt catcctcctc ccggcctatc 360
gctcacatcg cctctcaatg gtggtggtgg ggcctgatat gacctcaatg ccgacccata 420
ttaaaaccca gtaaagcatt caccaacgaa cgaggggctc ttttgtgtgt gttttgagta 480
tgattttaca cctctttgtg catctctctg gtcttccttg gttcccgtag tttgggcatc 540
atcactcacg cttccctcga ccttcgttct tcctttacaa ccccgacaca ggtcagagtt 600
ggagtaatca aaaaaggggt gcacgaatga gatacattag attttgacag atatcctttt 660
actggagagg gttcaaggga tcaaatgaac agcgggcgtt ggcaatctag ggagggatcg 720
gaggttggca gcgagcgaaa gcgtgtccat ccttttggct gtcacacctc acgaaccaac 780
tgttagcagg ccagcacaga tgacatacga gaatctttat tatatcgtag accttatgtg 840
gatgaccttt ggtgctgtgt gtctggcaat gaacctgaag gcttgatagg gaggtggctc 900
ccgtaaaccc tttgtccttt ccacgctgag tctcccccgc actgtccttt atacaaattg 960
ttacagtcat ctgcaggcgg tttttctttg gcaggcaaag 1000
<210> 32
<211> 317
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 双向终止子2
<400> 32
agtgatgcgg cctttaggaa acaccacaaa agtaattgac aatctcagga acgatctgcg 60
tgtttacagc ttcccaaata acaattatac cacgtaccaa aaggggttta atgtatctca 120
caaattcttc taataggtac agcttctcaa attgggtgta tgatgtgaca cttcgtctca 180
cacacgtcac gataattcag cgtatggctt cccttcatca cattcacgca aacttctaca 240
caaccctggg catatttctt gtgttggcaa cactcccgaa atcgattctg cacacaatgg 300
ttcattcaat gattcaa 317
<210> 33
<211> 399
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 来自土曲霉的对于加的斯微拟球藻密码子优化的blast基因
<400> 33
atggccaagc ctttatccca agaggaatcc acgctgatcg aacgtgcaac tgcgaccatc 60
aacagcatac ctattagcga ggactactcg gtggccagtg cagccctctc gtccgacggt 120
cggatcttta ccggcgtgaa tgtatatcat ttcaccggag ggccatgcgc ggagctcgtg 180
gtcctcggaa cggccgctgc ggctgctgcc ggaaatctga cgtgcatagt ggccatcggg 240
aacgaaaacc gcggcattct gtctccgtgc gggcgatgtc ggcaggtgct gcttgacttg 300
cacccgggga tcaaggcaat tgtcaaagat tccgatgggc agcccacagc ggttggcatc 360
agggagttgc ttccctctgg ctacgtctgg gagggttga 399
<210> 34
<211> 999
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> TCTP启动子
<400> 34
cgtgcaggtg tacagattga aggaaacaat ggagatatct ttggcagttg aaaaccgtgt 60
tcgaatcatg cttttctact ctccaactga gacgaaattt atagcgccat gtcgcttctg 120
actaccaggc ttaggaaggc ctcatcacaa gctggatcgg ttcgaattaa gcaggcactg 180
aagccaagct tgcaagacag ccacctttta attccctcaa aacactttct caattcagcc 240
cggtaaatat gccgattcac agcggccaag atagagggga ggttagcaag aatgttgcga 300
tccctcccca gtcgttgcct cgcacacaac ctaggccttc acctttccat ggaaaattga 360
gaagtgaata ttggttttct tacggcatat cagatgaaat catgacccct aaacatgaag 420
agctgcaggc aaaacacctg ctctggacga gcacgatgaa atctcgagaa cccgccgtac 480
ttcagttgat cccgcatgat gacggccgcc attgaaataa gccacctcac tttattctag 540
caccgatttc caccgttgtg agggccgaac gaggacaatt tcgtgcgaaa caagcacgaa 600
cacgcacacg attagtagta cagacgagca gatcgatggc atgcggcacg gtctcgcgtt 660
ctcggcgacc aggacaacgg agcagaggga ggcctgccga gttccgaggg gcattttagt 720
ccaaaattgt gttgacacgt gaacaagtgg cttgaaaaga ggaaggaaat gcctgggttt 780
cccttcgaga gcgggaactc gcttgtgcgt catcctagct acccatggtc cctttgtggg 840
ggaggctgtt tcgtcctacc gaatgtgtgg cgctccatgc atcttctgcc tcccaaacca 900
ccaacatgag cacgcgaagg aaggagaaaa aagtggccgc aacgttctct tctcatattt 960
attgtctcat cacaaacata ggtacataat acaacaatc 999
<210> 35
<211> 318
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> EIF3终止子
<400> 35
ggcactgtaa ccccggttcc gctcgacgaa ggctgggagc gccctttcgg tgggataaaa 60
tggatgcttt accgctgcgc ttcggctgag gaagagagaa atgcgagcgg ggatcggggt 120
cctagaaacg aagaaaggag aacaagttcc tggccaaaga aaaacaagac aaataccctc 180
tccaggcctg ggcccattac ttttttttgc tgtttcttat acctgcactc gtgcttctct 240
agtctgtcga gaccttacct gatcttcctc cctccatcgc tccccgcccc ccccatccga 300
gcaaccgtcg accatacg 318
<210> 36
<211> 702
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 对于加的斯微拟球藻经密码子优化的TurboGFP基因
<400> 36
atgttggaga gcgacgagag cggcctgccc gccatggaga tcgagtgccg catcaccggc 60
accctgaacg gcgtggagtt cgagctggtg ggcggcggag agggcacccc cgagcagggc 120
cgcatgacca acaagatgaa gagcaccaaa ggcgccctga ccttcagccc ctacctgctg 180
agccacgtga tgggctacgg cttctaccac ttcggcacct accccagcgg ctacgagaac 240
cccttcctgc acgccatcaa caacggcggc tacaccaaca cccgcatcga gaagtacgag 300
gacggcggcg tgctgcacgt gagcttcagc taccgctacg aggccggccg cgtgatcggc 360
gacttcaagg tgatgggcac cggcttcccc gaggacagcg tgatcttcac cgacaagatc 420
atccgcagca acgccaccgt ggagcacctg caccccatgg gcgataacga tctggatggc 480
agcttcaccc gcaccttcag cctgcgcgac ggcggctact acagctccgt ggtggacagc 540
cacatgcact tcaagagcgc catccacccc agcatcctgc agaacggggg ccccatgttc 600
gccttccgcc gcgtggagga ggatcacagc aacaccgagc tgggcatcgt ggagtaccag 660
cacgccttca agaccccgga tgcagatgcc ggtgaagaat aa 702
<210> 37
<211> 822
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 4A-III启动子
<400> 37
ggcataaagg acggcaagga aagaaaagaa agaaagaaaa ggacacttat agcatagttt 60
gaagttataa gtagtcgcaa tctgtgtgca gccgacagat gctttttttt tccgtttggc 120
aggaggtgta gggatgtcga agaccagtcc agctagtatc tatcctacaa gtcaatcatg 180
ctgcgacaaa aatttctcgc acgaggcctc tcgataaaca aaactttaaa agcacacttc 240
attgtcatgc agagtaataa ctcttccgcg tcgatcaatt tatcaatctc tatcatttcc 300
gcccctttcc ttgcatagag caagaaaagc gacccggatg aggataacat gtcctgcgcc 360
agtagtgtgg cattgcctgt ctctcattta cacgtactga aagcataatg cacgcgcata 420
ccaatatttt tcgtgtacgg agatgaagag acgcgacacg taagatcacg agaaggcgag 480
cacggttgcc aatggcagac gcgctagtct ccattatcgc gttgttcggt agcttgctgc 540
atgtcttcag tggcactata tccactctgc ctcgtcttct acacgagggc cacatcggtg 600
caagttcgaa aaatcatatc tcaatcttca gatcctttcc agaaacggtg ctcaggcggg 660
aaagtgaagg ttttctactc tagtggctac cccaattctc tccgactgtc gcagacggtc 720
cttcgttgcg cacgcaccgc gcactacctc tgaaattcga caaccgaagt tcaattttac 780
atctaacttc tttcccattc tctcaccaaa agcctagctt ac 822
<210> 38
<211> 200
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 双向终止子5
<400> 38
gggtgggaag gagtcgggga gggtcctggc agagcggcgt cctcatgatg tgttggagac 60
ctggagagtc gagagcttcc tcgtcacctg attgtcatgt gtgtataggt taagggggcc 120
cactcaaagc cataaagacg aacacaaaca ctaatctcaa caaagtctac tagcatgccg 180
tctgtccatc tttatttcct 200
<210> 39
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 与ZnCys-2845基因内的序列同源并且在cas9 PAM序列上游的18bp序列
<400> 39
agtaggccat tcccggag 18
<210> 40
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 靶向ZnCys-2845的嵌合向导(敲除),第一条链
<400> 40
taatacgact cactatagga gtaggccatt cccggaggtt ttagagctag aaatagcaag 60
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 靶向ZnCys-2845的嵌合向导(敲除),相反链
<400> 41
aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60
cttgctattt ctagctctaa aacctccggg aatggcctac tcctatagtg agtcgtatta 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 通过体外转录生成嵌合向导的构建体的一般第一条链
<220>
<221> misc_feature
<222> (20)..(37)
<223> n为a、c、g或t
<400> 42
taatacgact cactataggn nnnnnnnnnn nnnnnnngtt ttagagctag aaatagcaag 60
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcttttttt 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 通过体外转录生成嵌合向导的构建体的一般相反链
<220>
<221> misc_feature
<222> (84)..(101)
<223> n为a、c、g或t
<400> 43
aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc cttattttaa 60
cttgctattt ctagctctaa aacnnnnnnn nnnnnnnnnn ncctatagtg agtcgtatta 120
<210> 44
<211> 2400
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 具有HygR盒的供体片段
<400> 44
tccacagccc gaacccatga gagagaatca taatcaaaga tgagccagcc acgaagctac 60
cggagaattc tgtaagaaaa atgtttaaag ttgaaaatgc taacagtgaa gtgatatcct 120
tttttaatgg agtgttgagg tgaagtctag catcgtaggg gaaaacagga ttctgtgtct 180
tccattctac tccttgataa agcgaagaaa tccgacaaaa ccaaagagat tgttcaagtt 240
taagatttgt aagcgtacaa ctatgaactt cttctctttg taggcctgag tggtcgtatg 300
catacgattc atgaagtgaa tcagtatcgc tggattttgc ttaggagtaa agcacaacta 360
agaaaatatg ctgcctggca ggcatcctga gacatgaggc aagcgacgta gcaattgaat 420
cctaatttaa gccagggcat ctgtatgact ctgttagtta attgatgaac caatgagctt 480
taaaaaaaaa tcgttgcgcg taatgtagtt ttaattctcc gccttgaggt gcggggccat 540
ttcggacaag gttctttgga cggagatggc agcatgtgtc ccttctccaa attggtccgt 600
gtggtagttg agatgctgcc ttaaaattct gctcggtcat cctgccttcg cattcactcc 660
tttcgagctg tcgggttcct cacgaggcct ccgggagcgg attgcgcaga aaggcgaccc 720
ggagacacag agaccataca ccgactaaat tgcactggac gatacggcat ggcgacgacg 780
atggccaagc attgctacgt gattattcgc cttgtcattc agggagaaat gatgacatgt 840
gtgggacggt ctttacatgg gaagagggca tgaaaataac atggcctggc gggatggagc 900
gtcacacctg tgtatgcgtt cgatccacaa gcaactcacc atttgcgtcg gggcctgtct 960
ccaatctgct ttaggctact tttctctaat ttagcctatt ctatacagac agagacacac 1020
agggatcatg gggaagaaac cggaactgac cgctacgtcc gtggagaaat tccttattga 1080
gaagttcgac tctgtctccg acttgatgca actgagcgag ggagaggaga gtagggcgtt 1140
ctcgtttgac gtagggggtc ggggatacgt gttgagggtt aatagttgtg cggacgggtt 1200
ctacaaggat cggtatgtct accgtcattt cgcctccgcc gctctcccca taccagaggt 1260
actggacatt ggggagttta gcgaatctct cacgtactgc atctcgcgcc gagcccaggg 1320
agtgacgttg caagatctgc ccgaaactga attgcctgcc gttttgcaac ccgtggccga 1380
ggccatggac gcgatcgctg ccgcagatct gtctcagacg tccggctttg gaccttttgg 1440
gccccagggc atcgggcagt acacgacctg gcgagacttc atctgcgcca ttgccgatcc 1500
tcacgtctat cattggcaga cagtcatgga tgacaccgtg tctgcatccg tggcccaagc 1560
actggacgaa ctcatgttgt gggccgagga ttgccctgag gtcaggcacc tggtgcacgc 1620
ggatttcggc agcaataacg tacttacaga caatggtcgg attactgctg tcatcgactg 1680
gtccgaagcg atgtttggtg atagccaata cgaagtggcg aacatattct tctggcgtcc 1740
ctggttggcg tgcatggagc agcagacacg ctactttgaa cggaggcacc cggagctggc 1800
cggctcccca cgactccgcg cctatatgtt gcgtatcgga ctcgatcagc tttaccagtc 1860
tctcgtcgac ggcaacttcg acgacgccgc gtgggcgcag ggccgctgcg acgcgatagt 1920
ccgcagcggg gctgggacgg tgggtcggac ccaaatcgca cgccggtcgg ctgcggtgtg 1980
gacagacggc tgtgttgagg tgcttgcgga ctcgggcaac cgtaggccga gcacccgacc 2040
gcgtgcaaag gagtgattga atcattgaat gaaccattgt gtgcagaatc gatttcggga 2100
gtgttgccaa cacaagaaat atgcccaggg ttgtgtagaa gtttgcgtga atgtgatgaa 2160
gggaagccat acgctgaatt atcgtgacgt gtgtgagacg aagtgtcaca tcatacaccc 2220
aatttgagaa gctgtaccta ttagaagaat ttgtgagata cattaaaccc cttttggtac 2280
gtggtataat tgttatttgg gaagctgtaa acacgcagat cgttcctgag attgtcaatt 2340
acttttgtgg tgtttcctaa aggccgcatc actgcccgaa tcgagttgat ggcccgcaaa 2400
<210> 45
<211> 1029
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 潮霉素抗性基因
<400> 45
atggggaaga aaccggaact gaccgctacg tccgtggaga aattccttat tgagaagttc 60
gactctgtct ccgacttgat gcaactgagc gagggagagg agagtagggc gttctcgttt 120
gacgtagggg gtcggggata cgtgttgagg gttaatagtt gtgcggacgg gttctacaag 180
gatcggtatg tctaccgtca tttcgcctcc gccgctctcc ccataccaga ggtactggac 240
attggggagt ttagcgaatc tctcacgtac tgcatctcgc gccgagccca gggagtgacg 300
ttgcaagatc tgcccgaaac tgaattgcct gccgttttgc aacccgtggc cgaggccatg 360
gacgcgatcg ctgccgcaga tctgtctcag acgtccggct ttggaccttt tgggccccag 420
ggcatcgggc agtacacgac ctggcgagac ttcatctgcg ccattgccga tcctcacgtc 480
tatcattggc agacagtcat ggatgacacc gtgtctgcat ccgtggccca agcactggac 540
gaactcatgt tgtgggccga ggattgccct gaggtcaggc acctggtgca cgcggatttc 600
ggcagcaata acgtacttac agacaatggt cggattactg ctgtcatcga ctggtccgaa 660
gcgatgtttg gtgatagcca atacgaagtg gcgaacatat tcttctggcg tccctggttg 720
gcgtgcatgg agcagcagac acgctacttt gaacggaggc acccggagct ggccggctcc 780
ccacgactcc gcgcctatat gttgcgtatc ggactcgatc agctttacca gtctctcgtc 840
gacggcaact tcgacgacgc cgcgtgggcg cagggccgct gcgacgcgat agtccgcagc 900
ggggctggga cggtgggtcg gacccaaatc gcacgccggt cggctgcggt gtggacagac 960
ggctgtgttg aggtgcttgc ggactcgggc aaccgtaggc cgagcacccg accgcgtgca 1020
aaggagtga 1029
<210> 46
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> EIF3启动子
<400> 46
tcataatcaa agatgagcca gccacgaagc taccggagaa ttctgtaaga aaaatgttta 60
aagttgaaaa tgctaacagt gaagtgatat ccttttttaa tggagtgttg aggtgaagtc 120
tagcatcgta ggggaaaaca ggattctgtg tcttccattc tactccttga taaagcgaag 180
aaatccgaca aaaccaaaga gattgttcaa gtttaagatt tgtaagcgta caactatgaa 240
cttcttctct ttgtaggcct gagtggtcgt atgcatacga ttcatgaagt gaatcagtat 300
cgctggattt tgcttaggag taaagcacaa ctaagaaaat atgctgcctg gcaggcatcc 360
tgagacatga ggcaagcgac gtagcaattg aatcctaatt taagccaggg catctgtatg 420
actctgttag ttaattgatg aaccaatgag ctttaaaaaa aaatcgttgc gcgtaatgta 480
gttttaattc tccgccttga ggtgcggggc catttcggac aaggttcttt ggacggagat 540
ggcagcatgt gtcccttctc caaattggtc cgtgtggtag ttgagatgct gccttaaaat 600
tctgctcggt catcctgcct tcgcattcac tcctttcgag ctgtcgggtt cctcacgagg 660
cctccgggag cggattgcgc agaaaggcga cccggagaca cagagaccat acaccgacta 720
aattgcactg gacgatacgg catggcgacg acgatggcca agcattgcta cgtgattatt 780
cgccttgtca ttcagggaga aatgatgaca tgtgtgggac ggtctttaca tgggaagagg 840
gcatgaaaat aacatggcct ggcgggatgg agcgtcacac ctgtgtatgc gttcgatcca 900
caagcaactc accatttgcg tcggggcctg tctccaatct gctttaggct acttttctct 960
aatttagcct attctataca gacagagaca cacagggatc 1000
<210> 47
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 5'ID序列
<400> 47
tccacagccc gaacccatga gagagaa 27
<210> 48
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 3'ID序列
<400> 48
gcccgaatcg agttgatggc ccgcaaa 27
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> MA-ZnCys-FP
<400> 49
acctccttgt cactgagcag 20
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> MA-ZnCys-RP
<400> 50
gatcccaaag gtcatatccg t 21
<210> 51
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-(-1) CRISPR靶序列
<400> 51
ctgtcaaatc aacaaaac 18
<210> 52
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 52
agctcagata tcttccag 18
<210> 53
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-2 CRISPR靶序列
<400> 53
atcttccagt ggtgggcg 18
<210> 54
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-3 CRISPR靶序列
<400> 54
gggactgtcc cattgtgc 18
<210> 55
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-4 CRISPR靶序列
<400> 55
tctgtctaaa tcagcaca 18
<210> 56
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-6 CRISPR靶序列
<400> 56
gccaagtgca tcatgctc 18
<210> 57
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-7 CRISPR靶序列
<400> 57
gctcaggtac gcatctca 18
<210> 58
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-8 CRISPR靶序列
<400> 58
attggaatca attttgaa 18
<210> 59
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-9 CRISPR靶序列
<400> 59
gctgttcatc acaaagag 18
<210> 60
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-10 CRISPR靶序列
<400> 60
ctctttgtga tgaacagc 18
<210> 61
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-11 CRISPR靶序列
<400> 61
cgtcggttca cgccaatc 18
<210> 62
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> Bash-12 CRISPR靶序列
<400> 62
aactcgctcg tcgatcac 18
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物MA-5'Bash-ZnCys-FP
<400> 63
tagcagagca ggctcatcac 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物MA-5'Bash-ZnCys-RP
<400> 64
gaatatgtgg tctagctcgt 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物MA-3'Bash-ZnCys-FP
<400> 65
atggctccac cctctgtaag 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物MA-3'Bash-ZnCys-RP
<400> 66
ctgactacag ctagcacgat 20
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物ZnCys-2845:正向引物
<400> 67
atacaggaag cgtggttaca g 21
<210> 68
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物ZnCys-2845反向引物
<400> 68
gaagtattaa gggactggcc g 21
<210> 69
<211> 849
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 1T5001704管家基因
<400> 69
atgtcacggt cgcggtcctg ttccgaagct tctgcggcct cttcgtcatc ggcagcagca 60
gcgtcttcga ctcacgcccc ttcttcgcgc ggagcttcgg tggccgacgg tgctgcaagg 120
gagcgagaag ataatggcaa acgcctgagg tcaccgagcc ctgccggtgg tgaagcttct 180
ggttccgagg aagcggaaga ggatgatgag cccgccaaat tgcatgtttc tggtctaaca 240
agaaacgtga cagaggagca tctcaacgag atattcgcca catttgggaa gctgtcgcgt 300
gtggaactgg tacttgaccg acgagtgggc ttatcgcggg gcttcgccta tgttgagtac 360
gatcatcgga aggacgctga ggaagcccag ctgtacatgg acggtggtca gcttgacggc 420
gcacctttga aagtgaactt tgtgcttttg ggcggagccg cagccgatct cctgtatccc 480
gtggcggtgg tcgagaaagg gacctttacg atcgcaatgg cggtccgccg gagaggaggg 540
gcgggggagc tcaatgggag gggcggcggg gccggtctcg ttctccgcct cgggggggtc 600
gacacgaccg aggtcggttg ccgccagggc ggtttactcg aggagagcgc ggacgcagcc 660
ccccctaccg tcgccagcca gaccctcgcg gctggtcgcc gccacggcgc gggccgggtg 720
ggcgggcatc tccgcctcgg gccgcggtcg cagccggagc agccgctcct cacgcagccg 780
ttcctagatg gagggggcgg cgccaacagg gaaggcaagc aggagtctca cccgccgctt 840
gaggcttga 849
<210> 70
<211> 408
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> ZnCys-2845基因的区域
<400> 70
gtttaaacga tcagccacga cggctctcgc atgcacaacg atggcatgga ttggcgcgcg 60
aaggatgagg actgctcgta ccacaccgcc gtggacgcca gctgccacat cgacagtagc 120
taccaccatg ttgatgcctc aggccactcc atggtcgacg cctcgggtca cagcacgata 180
gacgcgtcgg gccacgactc cctcatcgac tcaagcggcc attacgacga ctatctggcg 240
cacaaggggg acgcccgcta catggagcac agttgtgaag cctgcaagcg ctcgaagaaa 300
cgatgcaacc gccgcaaccc ctgccagatc tgcacctcca ggggcatcaa gtgtgtgccg 360
caaatccggg gtcctgggcg ccccccgggc agtaaaagca gtcggggc 408
<210> 71
<211> 163
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 终止子 9
<400> 71
gagtcaaggg ggaaggtgca tagtgtgcaa caacagcatt aacgtcaaag aaaactgcac 60
gttcaagccc gcgtgaacct gccggtcttc tgatcgccta catatagcag atactagttg 120
tacttttttt tccaaaggga acattcatgt atcaatttga aat 163
<210> 72
<211> 2091
<212> DNA
<213> 三角褐指藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:5的ZnCys多肽
<400> 72
atgaacgaag acagtaccga agacccggat gatggcagtg tggcgctctg tgcatcatgc 60
gatcgttgcc gctcgcgaaa gaccaagtgt gacggccagc gcccctgtgg aaactgcttg 120
gccaagtaca tgaagaagaa taaactcagt agcgcggatg gaatcgattt taccgagtgt 180
gagtgtgtct attcacccgc taagcgtcgt ggccctattc cgggtcgtac cgctggccaa 240
gctcggaagg ccaccgagct gcaacatcac caacagcagc agccgaatga ttggcctcaa 300
aattatcaca acaacccttc gactggggtg aacttgaacg ggacaggatt ggacgcccaa 360
atgactgctg ctttattttc cggccaaacc gaacaggcgt cgttgcagca aaaactgaac 420
tttttgcagt cactgcaaaa tcaagacgaa gatcatctca tgatgcaaca gcagcagcag 480
cagcatcaga tggacgagcc tgccaatcga cgagtgaaac gtgaagatgc tggacagaat 540
accagcacga acgggattcc tcgcactatc accacccaca cgcacctttt ggaacgctcc 600
aatccagatg gagcccgtct tcgtgcgtac taccagctat cgatcgacga actctatcgt 660
ttgcctccga taccgacgga cgaagaatac tgtgcccgcc ttaacgttcc ggggatgacg 720
cctcaaatga tcccaggtcc acatctggcc gccctgagtg ccgcacgctt tgctgagatc 780
gcgctcggcg cacttgttca caacgaagtg tcgttagcga tggaattgtg taatgcagtt 840
gttcactgct tgcgggaatc cgtacaggaa cccgtgcaga caccagtgat gttcgaagtt 900
gccaaggcgt actttttgct cggcgttttc cgtgcctgtc gcggagacat ggaacggtat 960
ttcaaatatc gccgggtctg tatgacgtat ttggcgaagc tggagaacga tgataaaacg 1020
gcggtgctcc ttgccgcagt ggcctacttg gactcttggg ctccgtacgc tactcagact 1080
gagctcaagt atgatgtcaa gttggatgct ggtgccattg ctagcgatcc caagaatcaa 1140
aactggattc aaggtgctcc gccggtgtac ctgaataatg aggccccgtt gcatgcacgg 1200
gctttggatg ctttggcttg tgccgttcgc acttgttgcg atcaagccaa cagccgtttc 1260
gctcttatta gcaaggaggc taatatcgaa ggtctggaca cgattccttc cgaatccatt 1320
tcttctgcaa cgtacaatgc agttctatcg cacgagaatg agctctgcag tcgcaatatt 1380
gttctttcag cgtacactct gatgcaacag cacgaatcta ctgacagttc tcgacacaaa 1440
aacgagggac agcacatggt catttctgcg atggacgcgt ttctggaaaa tagtgacgaa 1500
gatggcaatg gtggattcac cgacagtcag attcagagtt tgctttctgt ttgtaacact 1560
gcgattgaga atccgttcct cttgcaccat gctggtccaa catatcacat ggtgtccaac 1620
gcggccgtac tattgtgtca tttattaaac ggccttcata tggccaagat gaacggtcaa 1680
gatttcggtc ggatggaaca gtccatgttt gaagaagtct ttgacgcttt tatatcgatt 1740
cgcaaactct tgacgattca tcgacgtaaa ctaccggtca aactgcgttg ccatgctatt 1800
ccgagaccaa gcatggacgg tttaaaggaa gggcagccgt taattgattt gggggaaaca 1860
attctttgtg cgtgccgtgg atgccagggt tttgtcctta tggcttgcag tccctgtgta 1920
gcggcggagc gtgcccaggc ggcgcaacat gatttgtcag tcgaagcggc gaaggaagcc 1980
gaagcgattg aaatgggcga gctcgacaac gaattggaca acttgggagc ggaatttgat 2040
atggacgacg atatgttgtt gggaatgatt agcaatctca tttcaagttg a 2091
<210> 73
<211> 744
<212> DNA
<213> 舟形藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:6的ZnCys多肽
<400> 73
atggcttgca cggcgtgtca tcttgccaaa cgaaaatgcg acaagaaatc gccatgctcg 60
cgctgtatca gcaaatcgct cgaatgcatt cctcacattt cccgtcaagg gaaaaagaag 120
gtccggcggg tcgaagagaa gaaagatgac ggtcttgatc gtttgcttct cgagcagttg 180
acggggaccg aaccagtgca aggtcataca caccatttcg gattgaagta tttggttcgg 240
tcttggattt cgtttgcgtt caaacggcgg agctttttcc tgatgcaacg aggatgtgca 300
ctggcaataa aagttggctt ttcgatggat gagatattct gcgaacaatc taattctcgc 360
gaaatggatt ttctcaaaaa tattatttta gtacccaagg aagcgcagca tttgtatgtc 420
ccgacaccac ttcagtggac ggaaattccc gaacgccttc tcaggaacac ggatacaata 480
ggctcgtctg gaaacagaga gggtcggtgg atatggatgc gggagatgat caagggagaa 540
tctcggtatc ttgtatcgga agcatttgaa cgagacgttg caccctggag ctcactgcac 600
aaggcgtggg aagacaaccg gggggctgtg attgacctat tcgtcattga agaagataag 660
cacaagcaca ccaagtcatt cgcacatcaa atttcgctct acaaagaaca agccgtcaac 720
ggggaaggaa accgcttgac tcgt 744
<210> 74
<211> 1002
<212> DNA
<213> 舟形藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:7的ZnCys多肽
<400> 74
atggtttgta ttggttgtca cgaatcgaaa cgcaagtgtg ataagcaaac tccgtgttcg 60
cgttgcctga aactaggaat tccttgcatc cctcaccttt cgcagcaagg caaacgcaag 120
agaggttcgc ccgacgagac accagaagat gtgacgattt tgcgccaagt ttccttgccg 180
aaagatcact atggtttgtg ccatttgatt cgttcgtgga tatcgattgc ctttgtacga 240
cggagctttc ctttgcttaa caaagccacg acaatggcca atcaattggg cgtcacgatg 300
gacgaaatca tgagtcgttc gatgacccag cagggcatgc attggctggg tccggtcgta 360
gcgaccccgc aatccgaaca aatggcgggt ggtccacgct tgcaatggaa cgaactgccc 420
gagggtctct tggtggcgac acgcacgctt catagtgttg actgcgaagc acggtggatt 480
tggattcgcg aattgagtca agggcgttct cgttatttgg tgacgcaagc ctttgaacga 540
gatatcgcta catgggcact ggtgcaaagc acgtggaatg agaaccgcat ttcggtcgtc 600
gatctctttt tggacggtgc ggctcgtgaa aaacacgcca aatcagtggc gcatcagtat 660
tcgctgcatg cgaagcctcc gacgccgcac agtgcgcgct gcagtcgcca acgcagtcag 720
gtaaaactgc gcaacggaga catgatttca gtggaagaaa tttcctgcat ggatttcgtc 780
catatggatt tgtcgtacca ttttgtggaa tacgtcccgg tgtgtataca accgattcgc 840
tcccaagctt gtatccagaa caaagtccag agcacgcagt cgttatttca agaaatgtcc 900
aaggtcatgt gggatgatta tcctctcatg gtgaatgtcg atgatattcc ggcggaagga 960
aacgagctgg atcagattct gcaattgtta aatggaggtt aa 1002
<210> 75
<211> 512
<212> DNA
<213> 舟形藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:8的ZnCys多肽
<400> 75
atggaagact tcaacaacaa caacacgcaa caagccgatg atgaaaagtt gtgtgcaagt 60
tgcgatcgct gccgatcgcg taaaacgaaa tgcgatggga aacgtccctg tggaaactgt 120
gtggcaaagt acatgaagaa gtacaaagtc atgagtgtcg aaggcgtacc cgaatctgcc 180
tttgagtgcg tctattcacc ggccaagcgt cgcggccccg tccctggacg tacgccttcg 240
caagctcgtt ccttgaacga tgtaacgggt ggcaacatga atgtgaacat gacgggtggg 300
aataactttg attggaacat ggatctcatg tcgcaacaac aacagcagca gcaccaccaa 360
caacaacaac aaccaatgat gtcatcgtta attggtggat tggatgggaa caacattttg 420
aatcagttca atttgatgcg acaaatgcaa cttcagcagc aattgccgct ccagccacaa 480
caaatggcaa tgcagcagca catgatggac ac 512
<210> 76
<211> 2172
<212> DNA
<213> 小环藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:9的ZnCys多肽
<220>
<221> misc_feature
<222> (447)..(447)
<223> n为a、c、g或t
<400> 76
atggacgaca ccgtcgccgc agaggaagca aaagaagcaa ccgacctaca gtcatccgac 60
tccaaaccca cttccccatc atcgacaccc ctcaatcgcg attccaccag cctctgctcc 120
tcctgtgatc cctgccgcgc tcgtaagacg aaatgcgatg gtcttcgccc ctgccgcgcg 180
tgcatcagca agcatgtcaa gaaacataag ctgtcgtctt acgaggggat taccgccgaa 240
gattgcggat gcacctattc cgtagccaaa cggaggggtc cggtgcctgg ctttaagaat 300
gcgaaggacg aaaagggcga tgggaattta tcgacatcga agaagagagg tcccacgcaa 360
gacgggacgt tgcattctta ccctcccaaa aagaagaaag agaagagaag tgttgatgtt 420
ctagcacgat ttcctcactc ggctgcncag gatgcgatgg ctgccgcttc ggacagcgcg 480
aggcaacaac ttgggttcat tgaacggctg cagcaacaac agcaggagtt tcagcgtcaa 540
cagcagcagc agatgcaaat gcaacagatg gcacaagcac aaaatgctca ggccatgcct 600
ttcatgtctc gggacggtga caacagcgct atttcgcgcc aaatgaataa taattataat 660
gagcaggtct ctgggcataa gccgtcgcag cagttttcgt ccactgaaca aacatctgca 720
gtgggttgcg agaaaaccac ggtgcgcgaa ctgcttcacg tcctcgaccc aaaagatccg 780
ctgggatcac gattccgcgc atgctacggc atctcctttg gatcaatatt tggacttcct 840
ccaattctta cctatgacga atactgtcgt cagttcactc caacgattgc ttcaacttca 900
atgccaaaat acgacgtagc ggcacttcaa gcggcacaat ttgcagagct tgccttgggt 960
gccctcgctg atggagaccg ttgcatgatg ttcgccttaa ttaatgctag catattttgt 1020
cttcaggata cggtgaagga acctgttcat cgtagctgcc aattcgagct cgcaaaggct 1080
ttcttcttcc attccttaat tagatgtcac aatggggata tggagcggta tttcaagtat 1140
cgacgtgcag ctatgcacac tttggctcac ttggatgggt atcccaatgt tgaaacactg 1200
atggctgccg ttggatttca agacgcactg gcattcatgc tctacaatgg atgtgatgat 1260
gatgtaccgg acattgatag tgactatcct caagtgttag atcgattcga taccaaggaa 1320
tcgagcagcg tatccttcac accctcgaaa ctcgcatcag atcccacgaa taagacctgg 1380
atcactggcc ccccgatgtt ttcctcggag agttccgccc cacttaaaag tcgtattcta 1440
gatattctgg cctgtgcaac tcgatcgttt gttgaagagt ctcagttcaa gaaggagatc 1500
aaaagcgttg aaacgagcac tcgcaaacgt aggaatttca taactgcaga agacaagagg 1560
attaagtata aaatttgtct cggtcatcta aacgaggctg gaagactgct ggctgtagca 1620
aattgcaagt catcctccag ttccatttac gatgtgtacc atgtactggt tatggctttt 1680
cgtgtgatga ttcatgaaga tacttcggag ccggaagaat cacaagtcca aaatgcattt 1740
catgttttga aagctatcat cagacaacca agcctattga atattggccc cattaatata 1800
tttgtccaca aatgcgtaat ttttgtagca cgccttatca acaagtcgca taaggcagga 1860
ctcgaggatc aatcggcaag ggacctcttt gaagaatcaa ttgatttgta ccatgcctcc 1920
agaactattc tcaatataca caatagtaaa ctccccgacc aacttcgatg ccacgaaatt 1980
ccgaggccga aatccatcac tgcgaaagaa tgtgacacaa tcattacgtt aggcgacgag 2040
tcgatgatgc cccacaggat ggccagtgtg aaggaggaaa ccagcgcttc cacatctgac 2100
actgaaaagg aatgccacat caacgataaa gcctttttgg tgtttttgag tggtctatat 2160
cttgcgcgtt aa 2172
<210> 77
<211> 4548
<212> DNA
<213> 小环藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:10的ZnCys多肽
<400> 77
atgcatttct ctgcgcagcc gccccagggg aacggggaca tggcccagct cgacggcgta 60
tccacagcct ccaaaaagac tcgcgcctgc acggaatgcc acagagccaa gagcaaatgt 120
gtcttttccg aagagggcca agaaaagtgt gatcgatgct tcaggttgaa caaggattgc 180
gtgcctcatt tatcgaggca gggccagagg aagaagaaaa gcgagaaagg tatgatgaaa 240
tcctccgtgg ccacctcgtt ggcggaggtc tcgaaaggga gcaacgtcgc cagtaaagcc 300
ccgatgtctg gcgaaagcaa aagtacaagc ccctttttcc cagacaacgc agtggaaggc 360
aaccggccct tttcattcca cgccgctagt caggatacgt cattgaacag gcttgctgca 420
acggcaactg gaggtccgtc aatgagccaa atggctcctc tagcaaaatt cattcctcaa 480
aagcacatgt tctcatccaa tcaccccact tttcataata ctggcccatg cggtctctac 540
gaagcccggc tcaggaggac tcaagccggc actgccttac cggtggatca aacaaacata 600
actgtcacag agcaacggca agccgcaatg tcaatgtttt ctaatagtga tagaaccata 660
acggactcga cccatcaagg cgtcacattt cgtgaggact tgtcgtcgtc caggtcattg 720
ccactgagag agtggatgaa atgtgcactc aattcgaaca aaatccgtga cagcagcggg 780
agcagtccta tttcttccaa gtatattgca tcttgcctca aaatcgcact ctcgttggct 840
aaacaaatca gtgatgcaga ggttacttct tcgcgagaga tacttcaatg gctgcctcgc 900
gacagtatag attggccaca gtatattaca gtgaaattga caggaaatga aactcaagtt 960
cctccccatg atgctcggac tggatcttta gaccattcat ccgtggcgga tgatgagttg 1020
gacatgctcg aagcactttt ggactcaatc tgcgaagaaa atgaagtgga tacaacagat 1080
gttttcgata tttattcggc tgcaattctg ctggattata gcaaaaatag cgatgatggg 1140
gttgatcctc tttcgtttcc cgggcaagaa tatcgaatcc atgcccttgg actggtgttt 1200
tgcgaactgt tttcaggtgg acgagtcccg tccactgaac tagtgtcgga tggcctttgt 1260
caggacgatg tagtcacccc agcgatttct gaaaggttgg agtttacagg tatgctgaag 1320
ctcgagccaa acgagaacga catttacaag gacacaagct gcaaatatgt aggcacaaga 1380
aaaaaaacac gtgagcttga cgaatcgttg cactcgtcca ttgagtcact caggcggctt 1440
ggcatttcct gcccactgtg tgacttgatc ttcaacatac tagattccat caacggagac 1500
ttgggcagag atgactcgta ccgaaaaatg tcagacgtag ctatcgattt gcaaaacatg 1560
gtagacaaac caaaaacatt cctcaatgat ctcgatgtta ttactttatc gtcgacgggc 1620
ttgcaattga cggacaactt attcatgcga gatgaggagg tcgccttgct gcaacacgct 1680
tattatcgtt ccacattggg gtcgtctgag tttgctgtca tcactggcgg gtcggggaca 1740
gggaagtcac atttagcctt tcgtctaggc agtcacataa catctcatgg tggtatattc 1800
ctctccgtaa agttcaatca aatgaaacag gccgaccctt actcagcttt agtttcagcg 1860
ttcaatgagt atttcaacaa tttcacgatg acgaagcagt tagactcgat gaaacggatc 1920
gctagcaagc tgcgagatga actgggacaa gacgcacttc ttttagcgaa agtcattccc 1980
aatttagcag aggttcttga ttttgctgcg gttgatacag cctttgatgg agactgtgta 2040
aatgggcacg agaagatgca ttatatatta gtgtgttttg tcgaagtcat gtctgcttgt 2100
tcacacgtga cattgaccct gtttcttgac gatcttcaat gggcagatgc cttctcattg 2160
tcagtactcc aacagataat gattatgcct gatgagcaca aacaattctt ctttgtagga 2220
tgctatcgag acgaccagat ggaagatgac catccgttca agaaaatgat cagcagatgc 2280
ggtgattttg gtgtcaggct gacgatggtt tatttagaat gcatggacaa ggacggaatg 2340
aacacaatga tttcagaatt gctttgccta ccccctcggc tggtcaagag tctatctgag 2400
ttggtttact caaagacgaa aggaaaccca ttgttcttat cgcggttgtt gatatcgttg 2460
aataaggatg ggctgctcaa tctgagtctg ggccgccgcc gttgggtatg ggacgaaaaa 2520
cagattcaat cgaaagagtt gcctgatgat gtagcatcat tcttttctag cagggtgggc 2580
aagctatcac cagaggttca ggcagcgctt caggttttat catgttttgg ctctgttaac 2640
acgtacgaat tatcaatact cgagtcaggc cttagcctga atgtagtcaa accacttgaa 2700
agagccgtaa atgaaggatt cgtctccaag aatggcaatg attaccgttt ttctcatgac 2760
aagattcacg aagcggtcta tggtatggtt gagttagaag agcgtcgctt ccagcatcta 2820
aactacgcga ttagtttggt caagttcgca ttgggacaag atgatagcat catttttacc 2880
gctattggcc aagctaatct cgctggccca tcgattacta ctgatgcact tcagtctgct 2940
gaatttgcga ggtgcaatat ggtagcgggg aaaaaagcaa tgagtctgtc agatttctcg 3000
tgtgcagcga tttgcttcag caagggctta tcatttctgg acgaaaatcg ttggagtgat 3060
tactataacc ttagccttga actgtttgag ttggcagcca aatgtgcgct ggtgctcgga 3120
gactttgcca gtcttgccac gatgtctgaa caggttgaaa aacatagccg ttgtttcgaa 3180
gacaaactcg aggtgtcttt cttggttatg tgttcattgg catatgcatc taaaatctcg 3240
gattctgtcc atattggttt atcaattctt tcccaacttg gtcatgaatt acccacaaat 3300
tttactcgag cggagatcat ctttcacatc gaacaaacta aaacagttct tcactccatt 3360
tctgataaag acctaatgtt ctacaagaaa atgactgacc ctaaacacat catggcaatg 3420
aggtgtttgg ctaagttgga acttattgtg ctacagatca atccagattt gcaacctatc 3480
ataactttga aaatggtcaa catgaccatg gatctcgggg tgtcacacat gtcttcagtt 3540
ggaatggcct actttgctgg acttgttgct aaactagatg aaatccaaga cggcattcga 3600
tttgcaagac ttgcaaaaat gttgcttgac aaaagtgggt ccaaagagat cacaggagat 3660
gtcatcttta caacatcaga agttctctgc tttcatgagc cattacagag tgtcaacgag 3720
tatcgttttt acggacaaac tactgcattg gcagcaggtg acatgtactt tgcatgtgtg 3780
ctcaagatgt cgaattgtgg gacgatgctc tggatgggat caaatctcct gagtgtgaaa 3840
gatgcctttg ttcaggttgc tcgctactta aaagcgaaga accacttgtc aacgtacaat 3900
ctcttgctac tctcaaagcg tagtattttg atgctcatgg ggctagcaga tgaagatgaa 3960
cccctcactg ttgatcaact gaccaatccc taccaactga agtattttta ttttcaaaaa 4020
atgtttcaat ccttcgtatt taatcgaaat gatgatatga aacaatacac tgagaaattc 4080
ttgcaattca agatgccctc gtggttattg ctctcagtcc atgcgagaca tgagttttac 4140
gtaggcctta tttcatttca gatttaccgt gagtctggta tctctttgtg gtttgagagg 4200
ggccaacagt gcaagtcaaa agtgcaacta tggaaagagc aaggatcagt gtggaatttt 4260
gaacataaac tctatttgtt acaggccgaa gaatattatt gcaacgatga cttcgagagg 4320
gctggagaat ctttcaagaa ttcgataaca tctgctaagt cacacaaatt cttaaatgat 4380
gaagctctgg cttgtgagct tgctgcaaac ttctatcttg gcaccggtga tttaacatct 4440
tcgatgaaat attttcgcct cgcccatgat aagtacaatg aatggggtgc tcttggtaag 4500
gctgcacaac tggttacatt catgacagaa aagtttgcca gctgttga 4548
<210> 78
<211> 2622
<212> DNA
<213> 小环藻类
<220>
<221> misc_feature
<223> 编码SEQ ID NO:11的ZnCys多肽
<400> 78
atgacaaacc atttcgacaa caaccaatgg tccagcccct caccccccat gatggaagcc 60
cacgacgaca atcagcatca gcaacacgaa ggaggcgttc tcctctgcgc ctcgtgcgat 120
cgctgtcgtg cacgtaagac gaagtgcgat ggaatgagac cttgtgggaa ttgtaaaacc 180
aagtacatga agtctaagaa gctggacagc gtggaaggaa tcgaccttgc cgaattcgac 240
tgcatctact ctcccgccaa acgccgcggt cccgtccctg gcaaaagcgc tacgcgcaag 300
gcctccgaaa tgatgtctta cagcaaccca gatgtcatgc actttggagc cgggggagga 360
ggcacccaag gagggggata tcattctcaa gtgggattcg acggaaccat gaatactgga 420
gggggattca atccgcagca gcagcagcag cttcagcaat tcaacaacaa ttcaagtgct 480
caattttcgg cggaagaatt gaaacagatg cttcttcttc agcaacagtt gttgttgcag 540
caacaagaga tgcagatgca gcagcagcaa cagcatcagc agggtttgtt gcagcagttg 600
actaatgtgg cgggaggggg gaacatcaat attgctaaca ctctaaggcg ggcgagcatg 660
aatgggggga ttactgcaaa tggcgagaca atgggagcaa tgaacaacga tgttggttcc 720
gtggacaggt caggcatggg aggaaacaat gggcacgtgg atgagcagtc actccaactc 780
attcagcaat atcagaatca gttgaatatc gggtcaaatc atggcatgac atcaggcaat 840
gcgtctatca ttggctctgt tgtcggagga ttgccagtgc agccatctcc tatgccttct 900
caacagtatg ttcaagagca gcagccagct aagcgtgctc accgtattga ttctgccatg 960
tctagcaata acgatggcac tcttccaaag tctgtgatta gccatctccc tctcctcgac 1020
cgtcatgacg gagacggcaa tgtccttcga gcctactacg acctcagtgt gaatgatatc 1080
ctcaacctcc cccccatccc ctcagatgaa gaatactgca gtcgtcttgc ccgcaataat 1140
tatcactgcc tacccagtaa tcttcccacc tatgatcact cagcgttaca agccgcacga 1200
tttgcggaac tagccttggg agcactcgcg aacaatcaga ttcccttggc gctagagttg 1260
agcaacgcct ctgtcatgtg catgaggaat tgtgcagagg aaccaagtga tgagagttgt 1320
atgtatgagg ttgcgcgggc gtatttgctg catggaattt ttaggagttt caggggagac 1380
ttcgtcaggt atttcaaata tcgacgagtt tgcatgacgc atgttgggca gttggcgaac 1440
acaccacatg tggaggcact ccttgccgcg gtgtctttcc acgatgcact cgcgtatatg 1500
atgcataacg ccaaggaaga atctcttccg gatattgatc aggtcttgcc gcgtctaaat 1560
cccggcaact gtgattttga cgacagtgat gaagttgagg ctaaatatgg catctcgact 1620
aatgccaaat cggtcgcttc agaccctaac aatcaaatgt ggattcaagg tgcgcctcct 1680
gtgtttctga ataacgaagc aaatctagcc aatcggtcat tggacggact ggcatgcgca 1740
atccgttctt gttgtgatca tgcaaattca caattcgaag aaatggcaaa agctgtcggg 1800
gctgactttg ttggcggatc tggttcttgc ggaatgtccg ctacaactaa ggctgttacg 1860
gcaaatgaaa atgagctctg tagtcgaaat attgtgttgt cggctcgtac tctcctcgac 1920
cagtataatg gggtcagtca cgaaaaagcc aaaaaacatg ggctccaaat gttagcgtta 1980
gcgatggaag cattcttgga aaactctggg gaaagtgatg gtgttggagg gttcactgac 2040
aagcagatca agaacttgct tactgtgtgt gatactattg ttaagaatcc attacttctg 2100
catgctcctg gtcccgtata tcacatgatg acgaattcgg ctatcatgct ttgtcatctt 2160
ttgaatggca tgcatgcgaa ttgtggagaa ggatcaaact cgtcgggcaa atcaggcatc 2220
gaagaagttc tgtttgatga agtcctcgat tcattcatgg caacgaggaa gatattgaac 2280
gcccatcgaa aatccctacc agtaaaactc cgttgccatg gcatcccacg accaaatgtc 2340
ggacccttca aaaagtctga ccccgaagct ccatttgtag accttggcga aacattgctc 2400
tgtgcttgca gaggatgtca aggattcgta ttgatgggat gcagtccttg cgttgctgct 2460
gagagatcgg ctgcagcggc caaagcacaa catgcacatt cgtcttctac aaatggcaat 2520
tacaatgaag atgagtttga gagagaatta caagacatgg gagcttttga tatggacgat 2580
gatgccctgt tgaatgtcct ttctcggttt gtacagaact ag 2622
<210> 79
<211> 1137
<212> DNA
<213> 假微型海链藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:12的ZnCys多肽
<400> 79
atggcaacaa ctactgaagt acaaaaacat gcagtctctg ctcctctccc cgcatcagca 60
gcaacaacta caacaggagg aggaaataat gaatccaccg tcctttgcgc atcatgtgat 120
cgctgtcgtg ctcgtaaaac gaagtgcaac ggcgctcatc cttgctcggg atgtgtttca 180
aagtacatga agaagcacaa gttggaaagc tttgatggga ttgatcatgc attggttgaa 240
tgtcactata gtgttgcgag aaaaagaggg cctcaacctg gttccagtaa gagcccaact 300
gcgcccagag gatcaattcc ggcggatggg acgacgatct accaacagcc tgccaagaag 360
aagccaaaga aagcgaagca ggcagctcca atgatgcacg atttggctgc catggcaagt 420
gcatttggag gaggaaacct tgggcagatg cctcttcctc ttgaccctgc tgccgcggct 480
ttgcaacagc agattctttc cagtctagga gctatcggtc tggggctcta tgcgaacttt 540
accgctggtg gtggcagtgc gatgactgca gcttcgaata acgcaaggca gcagttggca 600
gctgtggaat cgttgttgtc aaacaacaag tccgatgtgg acagtgtcac gaatccatta 660
tccagcgaag aagaggctca tttccgtgca tgttacactc tctccgttgg cagtctcttt 720
ggtcttcctg atgttcttaa gaaggaagac tacttcccga agtacgacgt ggctgtcttg 780
caagctgctc gctttgcaga attggcaatc ggagcgttgg tcgacggaaa tggttccaag 840
atgaccaagt tggccaatgc aactgttttg tgtctgaagg aagccgcgca agagcctgtc 900
cacccgagct gcaagtttga tgttgcaagg gcatacttct tcctcgctat ttgtgagctc 960
aacattggtg acgtggaagg gtacttgaag tacagaaggg agagtatgag acgtctgtcc 1020
gagatgaatg atgcctctgg agccgatact cttttggcag caatgtccct tcaggactcg 1080
ttcgtgtaca ttctttacaa gggcttggat gatacccttc ctaacatcga ttctgca 1137
<210> 80
<211> 2691
<212> DNA
<213> 假微型海链藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:13的ZnCys多肽
<400> 80
atgagcaccg acgacaacaa catcatgcca gaagactggc agaataatcc acctcccctg 60
ccacaggaca attggcagaa taatgagcag acaagcaact acgacaacgg caacagcaat 120
ggagggcagt acagcacgca tcatcaacaa caaccaccgc aggagcaggt gaaccgtgct 180
caatcgtcgt acaacaatca atacagcacc tcccaataca actccaacca acaacaagaa 240
caacactacc aacagcagca gcaacaacag cagcttcaac tatgcgcctc gtgcgatcga 300
tgccgcgctc gaaaaacgaa atgcgatgga gaacgaccgt gtgggaactg tgtcaataag 360
ctcaagaaga agttgaagct tgacaacgtg gacggaatcg acattgccga attcgactgt 420
gtttactccc ccgccaaacg acgtggcccc atccccggta agacggggca gtctcgtaaa 480
tcgagtgaaa tgatgtatca gcagccgcag cagaggggag gaggatatct cggtagtggg 540
gggggaggag gataccccca gcagcagcat ggtctgcaag ggggagggta taattttggg 600
ggaggacagc agcagcaaca acaacaacag tggatcaaca gcaacaacaa ccaaggaagt 660
caattctcct ccgaagaatt gaaacaaatg ctatcactcc aacagcagct tctcattcaa 720
cagcagcaaa tgcagcaaca gcaacaacag caggggatgc ttcaacagtt ggctactgtg 780
acgagtggtg ttggaagtag tggtattgga ggggcaggtg gtattggagg aatggggaac 840
accaacaatg tccaggtgga aaatggagca ttgcagcttc ttcagcagta tcaacagcag 900
ttgaacagtg gaaacaacac gctgggtagt agtggaagca tcaacatggg actgggatct 960
caaccctctc ccatgccgtc atcctcctac aatcaagaac aacaacagca acctaccaaa 1020
cgtgcccatc gccttgagcc tgtactatcc aacgccaact ccaccaatct ccccaactcg 1080
gtcgcctcac acctccccct cctctccctc cacaaccccg acggcaacgt cctccgctcc 1140
tactaccaac tcagcgtcaa cgatctcctc aacctccccc ccatccccag cgacgaagac 1200
tactgcacca tcctctctca aaataactac aactgcctcc cgagcaatct tcccacctac 1260
gaccaatcgg cattgcaagc ggcgcggttt gcagagttgg cattgggagc gttggcgaac 1320
aatcaggttc cgttggcttt ggagttgagt aatgcttcgg taatgtgtat gagaaattgt 1380
gtggaggagc cgagtcacaa gagttgtatc tatgatgtgg cgagggcgta tttgttgcat 1440
gggatattta ggagttttag gggagacttt gtgaggtatt tcaagtatcg cagggtatgc 1500
atgagtcatc tttcgcagtt gaataacgaa cccaacgtgg aagctctcct cgctgccatt 1560
tcctatcacg atgccctcgc atacatgatg cacaacgcaa gtgaagatgc cctccccgac 1620
attgacgaag tattgcctcg tctcaacgac tgcggtaaga acgattctgg ctgtgacatt 1680
gaggccaagt acggcatttc caccaatgct tcgtccgttg taacaaacgc caacaaccaa 1740
atgtggatgc agggtgctcc tcccgtcttc ttgaacaatg aagccagtct cgtcaatcgt 1800
tcgttagatg ccttggcttg cgctgtccgt tcgtgctgtg atcaagccaa ttccagcttt 1860
gaggagatgg cgaaggaagc aggagttgat ttgcctgcag ggggaggatc ttgtggaacg 1920
agtgctacca cgcaagctgt gatggcgaat gaaaacgagt tgtgcagtcg caacattgtg 1980
ctttcggctc agactcttct cagtcagcat gcgggcacga gtcacgagaa gagtaagaag 2040
catgggcttg tcatggtagc tacggcaatg gaagcctttt tggagaatgg gggaggagat 2100
gaggaaggaa tgggaggttt caccgacaag cagattaaga acttgttggc tgtgtgtaat 2160
acgattgtca agaatccgtt gctactcttt gcgcctggac cgacgtatca tatggttagc 2220
aacgtggcga ttttgttgtg ccatctgttg aatggaatac atgccaactg tggagggtct 2280
tctggcaatg ccaaatctgg gatggaagaa gttctatttg atgaggtact tgatgctttc 2340
atggcaataa ggaagctatt gaacctccac cgaaagaatc ttccagtcaa actccgctgt 2400
catggcattc ctcgccccaa attgggacct ttcaaaaagt cggatcccga gacacccttt 2460
attgatttgg gcgatacttt aatgtgtgtt tgtcggggtt gtcagggctt tgtgctcatg 2520
ggatgctcgc cttgtgtggc tgcagagaga tcggcatcct cggcaaggat gcatgccaat 2580
caaagtgaag atgacgacga tgagtttgaa cgggaacttg gacaattgga cgatttcaac 2640
ctggacgacg atgctttgtt gagtctgctt tctcgcatcg ttcagaattg a 2691
<210> 81
<211> 2070
<212> DNA
<213> 假微型海链藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:14的ZnCys多肽
<400> 81
atgtcccaaa caagcaacac cgaacccaaa ggcgccaaac gcaaaaccca agcatgcacc 60
gaatgccaca agtccaaatc caaatgcacc tatcccgatc ccaccacaac cgccgccggc 120
ggcaccgcta aactgtgttg caatcgttgc atacggctgg gacgagactg cattcctcac 180
atctcacagc agggcaagag gaacaaaaag accgaggagg agacgatgaa gaatgagaag 240
agagtgaacg aagatgatat gcaagatggc ttatgcaagt cgaccatgtg tgctgccgcg 300
attggtaatc aagataagat tttgaaggag aataatctga gcttggaatt gcccagacat 360
attaccaatt caatggctgg tcagtttcct gctggtggag gtggaggtat gatgggtggt 420
cagtttgccg ggagaagtgg tgcgggtata cttcaccctg cggatattct atcgggtggg 480
atgaattcga gtcagttgag tctaatgttg aatcatttca gtggtactag tggaggtcag 540
agcgatacaa tgtcgacact gaataatatc atgtcttcat ctgcaatggg agctacggga 600
cctccacctt cggtagatgc attgctcatg ttggcttctc gtagtactag tattgggagc 660
aacagtggag tgaacttggg ggggacagca tcagcagcac ccgctttgcc ggggacaagt 720
cagcatctca ttcaacaatg gcaacatcag caaaaccaac ttcgttatgc tgtcatgggg 780
ggtatgcaga ctgcgactat gatgggcatg actcaggcat ctggagatgg cagtgctact 840
ggaaatcagt tggatagtgc cattattacg aaaaaggaac gcacttcatc atttggcagc 900
gagaatgatc agccgaagaa taagaagcaa aaggcgatcc aggaggcgaa ggagtggtgt 960
gctggtggag gtggcgacga tcagaaacaa tcagtgctgg aagcattggc tgctgctacg 1020
aaaaatgaaa cgacgccaaa gttcgtgcca cctcacattc attaccctcc cgtatccctc 1080
cttgccgaga ccaccaccac tgctatcaac gacaacgctt cttcttctgc agcagcagca 1140
gcagataaca ctacagacac tcaagaaagc caactccgac gttcgtccta caacgctcaa 1200
ttcgtcacac ccgaagatgc aatcggcaat cacataactg gtcaaaagct cccatgtctc 1260
caaaatcact atgggcttca atgtcaaatc cgtgaatgga tctcaatggc tttagtacga 1320
cgaagctttg cattgttaag caaggcgtcg tctttggcga atcgatgtgg tattagtatg 1380
gataggatat tttgtggggt tgtagaggaa gtggagaaga agggtggcgc tgaaaagaaa 1440
acgaaggggg gttgcaagat gaacgttggt gggaagatga actatctgct ttctgtcttt 1500
ctggagccaa ggactgcaca ggttgttccc atggaacagc cttttgagcg aaacttattg 1560
tgttggcgtc acatctctca aatctttgag gacaacctgg cagatggctt ctctttgatg 1620
tttgcaaaag aggactttcg tagatttttg gcttgttatg ctcatcagat ttcatcgcaa 1680
ccgagcgcag agagtcctat tcgtccagta tatgcaccga agattactgt tcgtttgttg 1740
agcagggatt ggggccagac ggaagctgtg acggaggaaa tgatcgaggg tgtgggtaag 1800
aacgaagcgg agactactga aatggacgct ctctttgtcg tcgttccaac aatggacaag 1860
gttacatact acttggagct gtttcatccc aaccttgagt cggatgcgaa ggattgcgag 1920
gccgatgata atgacgaggg aactgaaact cccgagtcca accctcccgc cttggatacc 1980
gtcatggagg gcgaagattg gcaaggaatc gatgagattt tggccagtgg tgatgacatg 2040
gatgctttga tgaaggcatt gttggattaa 2070
<210> 82
<211> 1233
<212> DNA
<213> 圆柱拟脆杆藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:15的ZnCys多肽
<400> 82
atggggacgt ctgctaatag agcctgtact gaatgccata aggctaaggt caagtgtgtc 60
agggatgatg atggaaacat aatatgcaaa cgatgtgaaa gaattggact gaaatgcgtc 120
gaacatatct ctagacaagg acaaggtaca agacgccgaa aaaaggtaaa gaaggaaaca 180
acgacggcga cgggagcggc aaataaaaac aatgaagata agacggtaga tgaagctcta 240
gcgatcacga tagcactatc ttctccaagt cccatgccct cgtgtccagt atctggtgga 300
tcaaacatcg tgttcagcgg taatggtaac gttaacggcg ttccatcgtc cgcatgcaat 360
gcacttacgg ctatgaatgg acaagctatg accaacaaca aagagggact atgtaatggt 420
atggcttcgt tacaagttga agatagtatt atctgtaaga gtattactaa tggattaggt 480
aaagaacatt atgggattca tcatctaatc cgtatgtggg ttgcattatc atttacacgt 540
cgaagttttt cattacttgc ccgtgcgtca tttattgcat ccagaatggg gatttcgatg 600
gacgaaatta tatcgaatca atcgaatttt gctatcgatt ctggttcaca accgatgtac 660
ttcttgggga gagatatatt ggtaccgaag agtcaaagaa agacgatcgg tcttccactt 720
aatatcgaag aaattccctg ggatcttctc gaagctgttc agatcgatcc ggtacgtcct 780
gatgagacct tccgtaatcg atggtgtgct attcgaatga cagtacaggg cacttcccga 840
ttcttgacat cccctctttt ttctagagac ttttcttctg ttgacgaaat caataaggtt 900
tgggacgaaa acaaaccaaa taaagaagtt gttgatctat ggatgccaaa gtctgaaaag 960
gggaatatta ataatgataa taataataat aataattcct cggaccgtaa tagtcaatat 1020
ggaggaacaa catcaagtgc caagaaacgc gacattattg atgtagcagg aggcacatca 1080
aataatgaaa ttgaaagcga tgtttgcgat cccatcatgc atgatgatgg tatcgaattt 1140
actgatttgg ttgttacaga agaaatgcag gaattttttc aattacttgc tggtgatcaa 1200
agagtgcaag cagatctgaa tagtctattc tag 1233
<210> 83
<211> 2418
<212> DNA
<213> 圆柱拟脆杆藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:16的ZnCys多肽
<400> 83
atgactacta gtactagatt aagaggcaaa agggggaaaa aagattcgag aaatgatgcc 60
gtcgccacca gcgacaacgg cgtagctatg acaacggcga atgctgtagt agtggtcaac 120
gatgagaaga ataagcaaga taattataac aacgaaggcg atccagttga atttaaagtt 180
agagtagaat tagaagtaga agctcccatc aatgaacaaa aagctgtcga taataatgag 240
aagaagaaga gcagtgccga gactactaag gctgaggctg ctgttgtgaa ttcagatgag 300
gatgtaaatg atgatgtaaa tgatgatgta aatgatggag aggacgatgc agtcgttgta 360
gtaaagaaca gtaaagaaaa caatgacgat gacaatgata gtgataccaa aaagatgcag 420
gacgcaacga agaagaagat ggcgcctcat caagatgatg cttgtgtagt tgaagttgtt 480
caagtttctg acagaccatc atttcttggt gggactgtat taaaacgtga tactgttgga 540
ttaggattac gatataaaac agaaaaagaa aaagagaaag tacatgaaaa tgatattcta 600
ttttcaagtg ttgatcttgg tttacaatca ggatcaggag gatcatcttc tagtcaattt 660
ttgaatcata cagatcatag tggtaataag aaattacaat ctataatcaa ggcaagaaaa 720
tcaaattatt ttgtgaatga tgttactaat attgattcat gtagtattgc agtaaatgaa 780
gaagaacgta ctaaaattgc aaaagaaatc tttcatgaaa taacaacaac aacaacaaca 840
actggtaaag atgtaggtat tggtgttggt cgatttttaa attttaaatc aatgactaaa 900
gcaaagtatg agaatttagg ttgtgatttt gtatgggaaa ttatggatga aataacatca 960
ataataaaaa tatgtcaaac tatgaattat atctttatgt ccgatcaaga acgtactgaa 1020
cgtagtcttg caatagaaac acagcaaaaa caacaacaaa atgactatcg gaatgaacga 1080
caacaaaaga atgggaagac tttatcatca tctgataaaa agtcgaaaac gaaaaagtca 1140
acaaaacaaa ataaaattct tttacaacaa cgtcaacaag aacaagaaca acgtgaaaac 1200
gctcagatac aagaacaaca gcttcaacaa caacaacaac aacaacaaca atgtcaacaa 1260
gttcagatgc gaatatacca attacagcaa cagttacagc agcagcaagt gtattaccct 1320
ccaacaccgc ttattcaaca gtatccgacg gcaatgccaa tgccaatgcc attatcaagt 1380
ccttcaccac tactaccaaa agacggtaag aagaagaaga cgaagggaga gaagagaaag 1440
gcaccagttc cagcagcaat ggcaagtgaa agaagtggta ttattgaagg ccgtgttatt 1500
gttgatacta ttgttggtgg tgatagtgat gaacacattg ggaatgaaaa tttagttaaa 1560
ttaattgtca agaaaaaatc agaatatgat tatattgaag ttaaggatat aaaaaagtta 1620
ggtatagcaa gagtacgtca aaatgtatca ttgaatatag tcaaatctat tgttaaagaa 1680
aatggtggcc gattcttatt ccgtagaaag aaagacgttg atgatgattt gttagagact 1740
cctacagtag aggcgacgat cgctgtaatt aaagatggag aagatgctat agcaagagca 1800
gaagcagcat tacgaggaga aaaaacacca acgaagacgt cgaacgatat tgaggatgag 1860
gatgaggatg ataacatcaa aaatgaagat tctggtcctg ttgtttggga ggaattgaaa 1920
gatgaaagta tgatacaagc gattgtatgg agatgtatga aagatatata tgaattagct 1980
gacgaaaata agacagagat attagaaaag agaaaggaag caaaaaagga aagaaaacgt 2040
ttacatgaat atgatcatga tgatgaatca gcaggcccag cagcagcagc aaccgcacgg 2100
aaaaaacaag cagtagagga agatccatct ggtcgtaaga ataaaagttg tgatttttgt 2160
cgtgataaaa aactgaaatg caatcgtaca agcccttgtg aaaactgtac tacaaagtac 2220
atgaaggatc acaatttgac tagtgaggaa gtcgaagaat ccaaaattgc caatagtatt 2280
aatgcggtag cggtggtcgc aaaagttgaa gaagcaaaga aactggaatc aatgccagaa 2340
acgaagcgtc ctcgtacgag aagtatattc cattttttag tatttttaat actagaatgt 2400
tccgtgccga tggagtaa 2418
<210> 84
<211> 3120
<212> DNA
<213> 海洋微拟球藻藻
<220>
<221> misc_feature
<223> 编码SEQ ID NO:17的ZnCys多肽
<400> 84
atgacgaccc tccttggaca gcccccctcc tcgttggggg cgatggggag tgcattttac 60
gatgaggacg ctcagagcgt cgtggccctc ggccaacacg ctgcaggcag tggcacggag 120
gacgagatgg atacagacca tttcgatgag ttggaccgca tcatcttcga catgccgtac 180
gtgtcagagc aggatccctt gagcagctgt agcgtcggag ggcagtcgca agggcaaacc 240
aacgggcagg gccatgggca ccaagagcgg ggggcgtcac agcacggggg cgcgggtctc 300
ttgatgccta acccccacaa tggccacatc cacggtgatg ggggtcacca cataaatcac 360
aacaaccatg gaagcgtccg agggggaggg atggactggc acgcgaagga ggaggacgcc 420
tcatatcata ctgcggtgga ctccagctgt cacactgacc ggagctacca tcgtgtggat 480
gcctcggggc attccatgat cgacgcctcc agccatagca tgatggatgc atcggggcac 540
gagtccctga ttgattcgag tgggcattac gacgacttcg ccgcgcacaa gggcgacccc 600
agatatatgg agcacagctg cgaggcctgc aagcgatcca agaaacgctg taaccgtcgc 660
aacccctgcc aaatatgcac ctcccgaggc atcaagtgcg tgccccaaat ccgcggaccc 720
ggtcgtcctc caggcagtaa gagcagcaga ggctcctcct cctcttcctc cctcactctg 780
ggcagttccc gccatggtgg ctcccgggga gatgtgcgct cttccctcaa cagcacccag 840
catagcacca acagcagtgc caccacctcc gccgcatctt ccactgcctc ctccctctct 900
cgctctttgt ctggtaacgg gttgttacag caagagcagg acttggtggt agtggctgct 960
gctgcttcta cgagacaatc ccctccaagg gacccttggc actgtcgatt cttcttcgag 1020
gcggcgcggc attgcaagga ggcgtttctg aaggcctggc atgacaatga gttggatacg 1080
tccaagtgta ttatgctcag gaacctctgg accaagacgt cctccatcct cgcctcaggg 1140
gtcgacatga ccttcggtat ctgtgaccag ctccaagaag tggttgggcc cgccccaacg 1200
ggctcgggcc cgattgcctg tagtcctgcg acgagaagca agagccaggc ggcgcaacaa 1260
gcccagctct tgtcgcaccc ggggtcgaag gagggaatgg gtccttggaa tctgcccgat 1320
gatttgagga agatggatga tggagtgtcg atgttgtgtg ggttcatgtt tatccaggac 1380
gagttgttcg tgtttacaga cgagaggttc gccgctacat tcatgacacg cgaggaggtg 1440
gaggggaagg tggagagctt cgcagtgttg ccgatactgt tgttggcgga gatattccac 1500
cctgacgacc tacctgatgt ttatgcagca attggcgcgc attggtttag gcggcggccg 1560
agctctggtg taggggtggg gggaagtaat gggagtatca gcagcatgaa cagcagtagc 1620
ggtagtacga gcagtaggga ctcggcaagc ccggggccag tgtctcggga ggtacctgag 1680
gcggcttgga tttgcaaatg cattgataag cggaatacgg agataacggc cttggtgcgg 1740
tttcggtcat ttgcggcacc gacggagggt tacgcgggtg cggctatgtt atcgatcttg 1800
ccgttgacaa gaagcaagta tattgcggat ccggatgtac agacgaacat gaggtcgggg 1860
gtgtcgtcga ggcaccactt gagggataca tttggggcat tgcctactgc tttgccggag 1920
cacgatgacg aagacgatga cgacgagcat caccatctgg tgttagaaag gagaggggaa 1980
agagtggggg cgtcggggca tggccaggat ttgttaaatg aggaggagga cgatgaaatt 2040
tttttggatg cacacggtga cgacgctatg ttccggccct tgcggcgggg gatgacggtg 2100
ttgtcggctg agacgagcgg tcctcaaccg gtgcctcttt ccaagcatgc ctctgaccct 2160
ctacctcatc acaacgagca ccacttccac agccagcccc agcacacctc ttctcatttg 2220
tctagtttga gtagcatggc gtcgcatcag acaggcgtgt cgtggggggg tggaaggatt 2280
tctgaatgcc tggggaacca aaaccgcagc gcctcgcaat tctacaacac agtgcagcat 2340
caagagcggc ctaagcggga gcaagaggag ccgcaccagc agcaccgtga agaacaacag 2400
caacatcgcc ttccaggcaa caatagcttg gacgggagca gcagccacgg aggcgccatg 2460
gaccaagacc tccctactgt tcagctgacc caggcgcagc tcttcctctt gcaggggggc 2520
actggcagtg gcatcggttt atttaaagat atacagcagg agcagcagca catgtgcaac 2580
cagatttcgc cagacggcgt gacagcagcg gaggagagcg cagagagagt cgctactgag 2640
ctgtacggtt cgagtcccag tccggagccg cacctccttg gccattcccg tcacagccca 2700
acgcaacgtg cacagcagca gcagcagcag cagaaaaggc aacaagaacg ccagcaagaa 2760
gatcagcaac aagaacaagg acatcaacag cagcaacagc agcaacagca gcaggggatg 2820
gtgctgcccc tgccacacct gcctgggatg gtgccgtcgc ttgtccgcac cgtgagcagc 2880
agcgccatgt tgggtgcccg ccccacaacc atatcccaag gaaaggacga agggggacgt 2940
ggaggggcgt tgagtcacag caatagcagc accgacctgg atatgtcttg tcatggcccg 3000
gcggatccga atgggtatgg tggattgcat tggacgccgg cgccattggc ttcttttttg 3060
ggggtttcct cttggggatc aaggcgtggc tcaaggaagg aggagagatc taaagattag 3120
<210> 85
<211> 8315
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 敲减构建体
<400> 85
gcggccgccg tatggtcgac ggttgctcgg atgggggggg cggggagcga tggagggagg 60
aagatcaggt aaggtctcga cagactagag aagcacgagt gcaggtataa gaaacagcaa 120
aaaaaagtaa tgggcccagg cctggagagg gtatttgtct tgtttttctt tggccaggaa 180
cttgttctcc tttcttcgtt tctaggaccc cgatccccgc tcgcatttct ctcttcctca 240
gccgaagcgc agcggtaaag catccatttt atcccaccga aagggcgctc ccagccttcg 300
tcgagcggaa ccggggttac agtgcctcac tcctttgcac gcggtcgggt gctcggccta 360
cggttgcccg agtccgcaag cacctcaaca cagccgtctg tccacaccgc agccgaccgg 420
cgtgcgattt gggtccgacc caccgtccca gccccgctgc ggactatcgc gtcgcagcgg 480
ccctgcgccc acgcggcgtc gtcgaagttg ccgtcgacga gagactggta aagctgatcg 540
agtccgatac gcaacatata ggcgcggagt cgtggggagc cggccagctc cgggtgcctc 600
cgttcaaagt agcgtgtctg ctgctccatg cacgccaacc agggacgcca gaagaatatg 660
ttcgccactt cgtattggct atcaccaaac atcgcttcgg accagtcgat gacagcagta 720
atccgaccat tgtctgtaag tacgttattg ctgccgaaat ccgcgtgcac caggtgcctg 780
acctcagggc aatcctcggc ccacaacatg agttcgtcca gtgcttgggc cacggatgca 840
gacacggtgt catccatgac tgtctgccaa tgatagacgt gaggatcggc aatggcgcag 900
atgaagtctc gccaggtcgt gtactgcccg atgccctggg gcccaaaagg tccaaagccg 960
gacgtctgag acagatctgc ggcagcgatc gcgtccatgg cctcggccac gggttgcaaa 1020
acggcaggca attcagtttc gggcagatct tgcaacgtca ctccctgggc tcggcgcgag 1080
atgcagtacg tgagagattc gctaaactcc ccaatgtcca gtacctctgg tatggggaga 1140
gcggcggagg cgaaatgacg gtagacatac cgatccttgt agaacccgtc cgcacaacta 1200
ttaaccctca acacgtatcc ccgaccccct acgtcaaacg agaacgccct actctcctct 1260
ccctcgctca gttgcatcaa gtcggagaca gagtcgaact tctcaataag gaatttctcc 1320
acggacgtag cggtcagttc cggtttcttc cccatcgagc tcggtacccg gggatccatg 1380
attgttgtat tatgtaccta tgtttgtgat gagacaataa atatgagaag agaacgttgc 1440
ggccactttt ttctccttcc ttcgcgtgct catgttggtg gtttgggagg cagaagatgc 1500
atggagcgcc acacattcgg taggacgaaa cagcctcccc cacaaaggga ccatgggtag 1560
ctaggatgac gcacaagcga gttcccgctc tcgaagggaa acccaggcat ttccttcctc 1620
ttttcaagcc acttgttcac gtgtcaacac aattttggac taaaatgccc ctcggaactc 1680
ggcaggcctc cctctgctcc gttgtcctgg tcgccgagaa cgcgagaccg tgccgcatgc 1740
catcgatctg ctcgtctgta ctactaatcg tgtgcgtgtt cgtgcttgtt tcgcacgaaa 1800
ttgtcctcgt tcggccctca caacggtgga aatcggtgct agaataaagt gaggtggctt 1860
atttcaatgg cggccgtcat catgcgggat caactgaagt acggcgggtt ctcgagattt 1920
catcgtgctc gtccagagca ggtgttttgc ctgcagctct tcatgtttag gggtcatgat 1980
ttcatctgat atgccgtaag aaaaccaata ttcacttctc aattttccat ggaaaggtga 2040
aggcctaggt tgtgtgcgag gcaacgactg gggagggatc gcaacattct tgctaacctc 2100
ccctctatct tggccgctgt gaatcggcat atttaccggg ctgaattgag aaagtgtttt 2160
gagggaatta aaaggtggct gtcttgcaag cttggcttca gtgcctgctt aattcgaacc 2220
gatccagctt gtgatgaggc cttcctaagc ctggtagtca gaagcgacat ggcgctataa 2280
atttcgtctc agttggagag tagaaaagca tgattcgaac acggttttca actgccaaag 2340
atatctccat tgtttccttc aatctgtaca cctgcacggt gcaccagttg gtacggcata 2400
ttatggttta aagttgaaaa tgctaacagt gaagtgatat ccttttttaa tggagtgttg 2460
aggtgaagtc tagcatcgta ggggaaaaca ggattctgtg tcttccattc tactccttga 2520
taaagcgaag aaatccgaca aaaccaaaga gattgttcaa gtttaagatt tgtaagcgta 2580
caactatgaa cttcttctct ttgtaggcct gagtggtcgt atgcatacga ttcatgaagt 2640
gaatcagtat cgctggattt tgcttaggag taaagcacaa ctaagaaaat atgctgcctg 2700
gcaggcatcc tgagacatga ggcaagcgac gtagcaattg aatcctaatt taagccaggg 2760
catctgtatg actctgttag ttaattgatg aaccaatgag ctttaaaaaa aaatcgttgc 2820
gcgtaatgta gttttaattc tccgccttga ggtgcggggc catttcggac aaggttcttt 2880
ggacggagat ggcagcatgt gtcccttctc caaattggtc cgtgtggtag ttgagatgct 2940
gccttaaaat tctgctcggt catcctgcct tcgcattcac tcctttcgag ctgtcgggtt 3000
cctcacgagg cctccgggag cggattgcgc agaaaggcga cccggagaca cagagaccat 3060
acaccgacta aattgcactg gacgatacgg catggcgacg acgatggcca agcattgcta 3120
cgtgattatt cgccttgtca ttcagggaga aatgatgaca tgtgtgggac ggtctttata 3180
tgggaagagg gcatgaaaat aacatggcct ggcgggatgg agcgtcacac ctgtgtatgc 3240
gttcgatcca caagcaactc accatttgcg tcggggcctg tctccaatct gctttaggct 3300
acttttctct aatttagcct attctataca gacagagaca cacagggatc gtttaaacga 3360
tcagccacga cggctctcgc atgcacaacg atggcatgga ttggcgcgcg aaggatgagg 3420
actgctcgta ccacaccgcc gtggacgcca gctgccacat cgacagtagc taccaccatg 3480
ttgatgcctc aggccactcc atggtcgacg cctcgggtca cagcacgata gacgcgtcgg 3540
gccacgactc cctcatcgac tcaagcggcc attacgacga ctatctggcg cacaaggggg 3600
acgcccgcta catggagcac agttgtgaag cctgcaagcg ctcgaagaaa cgatgcaacc 3660
gccgcaaccc ctgccagatc tgcacctcca ggggcatcaa gtgtgtgccg caaatccggg 3720
gtcctgggcg ccccccgggc agtaaaagca gtcggggctg cacctccttg tcactgagca 3780
gctcacggca tggaagctcc aggggtgaca tacgcgccgc gaacggaagc gggcagagcc 3840
acaacagcag tgccacgaac cgccccgact gcttttactg cccggggggc gcccaggacc 3900
ccggatttgc ggcacacact tgatgcccct ggaggtgcag atctggcagg ggttgcggcg 3960
gttgcatcgt ttcttcgagc gcttgcaggc ttcacaactg tgctccatgt agcgggcgtc 4020
ccccttgtgc gccagatagt cgtcgtaatg gccgcttgag tcgatgaggg agtcgtggcc 4080
cgacgcgtct atcgtgctgt gacccgaggc gtcgaccatg gagtggcctg aggcatcaac 4140
atggtggtag ctactgtcga tgtggcagct ggcgtccacg gcggtgtggt acgagcagtc 4200
ctcatccttc gcgcgccaat ccatgccatc gttgtgcatg cgagagccgt cgtggctgat 4260
cgtttaaacg agtcaagggg gaaggtgcat agtgtgcaac aacagcatta acgtcaaaga 4320
aaactgcacg ttcaagcccg cgtgaacctg ccggtcttct gatcgcctac atatagcaga 4380
tactagttgt actttttttt ccaaagggaa cattcatgta tcaatttgaa ataaacatct 4440
atcctccaga tcaccagggc cagtgaggcc ggcataaagg acggcaagga aagaaaagaa 4500
agaaagaaaa ggacacttat agcatagttt gaagttataa gtagtcgcaa tctgtgtgca 4560
gccgacagat gctttttttt tccgtttggc aggaggtgta gggatgtcga agaccagtcc 4620
agctagtatc tatcctacaa gtcaatcatg ctgcgacaaa aatttctcgc acgaggcctc 4680
tcgataaaca aaactttaaa agcacacttc attgtcatgc agagtaataa ctcttccgcg 4740
tcgatcaatt tatcaatctc tatcatttcc gcccctttcc ttgcatagag caagaaaagc 4800
gacccggatg aggataacat gtcctgcgcc agtagtgtgg cattgcctgt ctctcattta 4860
cacgtactga aagcataatg cacgcgcata ccaatatttt tcgtgtacgg agatgaagag 4920
acgcgacacg taagatcacg agaaggcgag cacggttgcc aatggcagac gcgctagtct 4980
ccattatcgc gttgttcggt agcttgctgc atgtcttcag tggcactata tccactctgc 5040
ctcgtcttct acacgagggc cacatcggtg caagttcgaa aaatcatatc tcaatcttca 5100
gatcctttcc agaaacggtg ctcaggcggg aaagtgaagg ttttctactc tagtggctac 5160
cccaattctc tccgactgtc gcagacggtc cttcgttgcg cacgcaccgc gcactacctc 5220
tgaaattcga caaccgaagt tcaattttac atctaacttc tttcccattc tctcaccaaa 5280
agcctagctt acatgttgga gagcgacgag agcggcctgc ccgccatgga gatcgagtgc 5340
cgcatcaccg gcaccctgaa cggcgtggag ttcgagctgg tgggcggcgg agagggcacc 5400
cccgagcagg gccgcatgac caacaagatg aagagcacca aaggcgccct gaccttcagc 5460
ccctacctgc tgagccacgt gatgggctac ggcttctacc acttcggcac ctaccccagc 5520
ggctacgaga accccttcct gcacgccatc aacaacggcg gctacaccaa cacccgcatc 5580
gagaagtacg aggacggcgg cgtgctgcac gtgagcttca gctaccgcta cgaggccggc 5640
cgcgtgatcg gcgacttcaa ggtgatgggc accggcttcc ccgaggacag cgtgatcttc 5700
accgacaaga tcatccgcag caacgccacc gtggagcacc tgcaccccat gggcgataac 5760
gatctggatg gcagcttcac ccgcaccttc agcctgcgcg acggcggcta ctacagctcc 5820
gtggtggaca gccacatgca cttcaagagc gccatccacc ccagcatcct gcagaacggg 5880
ggccccatgt tcgccttccg ccgcgtggag gaggatcaca gcaacaccga gctgggcatc 5940
gtggagtacc agcacgcctt caagaccccg gatgcagatg ccggtgaaga ataagggtgg 6000
gaaggagtcg gggagggtcc tggcagagcg gcgtcctcat gatgtgttgg agacctggag 6060
agtcgagagc ttcctcgtca cctgattgtc atgtgtgtat aggttaaggg ggcccactca 6120
aagccataaa gacgaacaca aacactaatc tcaacaaagt ctactagcat gccgtctgtc 6180
catctttatt tcctggcgcg cctatgcttg taaaccgttt tgtgaaaaaa tttttaaaat 6240
aaaaaagggg acctctaggg tccccaatta attagtaata taatctatta aaggtcattc 6300
aaaaggtcat ccagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 6360
ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct 6420
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 6480
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 6540
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 6600
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 6660
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 6720
tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc 6780
ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 6840
catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 6900
aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 6960
ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 7020
gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 7080
aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 7140
gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 7200
gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 7260
gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 7320
gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 7380
gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 7440
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 7500
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 7560
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 7620
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 7680
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 7740
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 7800
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 7860
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 7920
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 7980
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 8040
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 8100
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 8160
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 8220
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 8280
gagcgcagcg agtcagtgag cgaggaagcg gaaga 8315
<210> 86
<211> 111
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> SNARE终止子(反方向)
<400> 86
tatgcttgta aaccgttttg tgaaaaaatt tttaaaataa aaaaggggac ctctagggtc 60
cccaattaat tagtaatata atctattaaa ggtcattcaa aaggtcatcc a 111
<210> 87
<211> 17
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含CCT结构域的蛋白质的基因的向导RNA的靶序列
<400> 87
ttccgaagta ctggttc 17
<210> 88
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 靶向编码Zn(2)-C6真菌型DNA结合域蛋白(ZnCys-2845)的基因的向导RNA的靶序列
<400> 88
agtaggccat tcccggag 18
<210> 89
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码锌指、TAZ型蛋白的基因的向导RNA的靶序列
<400> 89
tgtggcagac gccgacgg 18
<210> 90
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码RpoD家族RNA聚合酶σ因子SigA蛋白的基因的向导RNA的靶序列
<400> 90
gtactgcctg acaaactagg 20
<210> 91
<211> 17
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含真菌Zn(2)-Cys(6)双核集群结构域的蛋白质的基因的向导RNA的靶序列
<400> 91
tgagcagtcg tacgaaa 17
<210> 92
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含CCCH型锌指的蛋白质的基因的向导RNA的靶序列
<400> 92
cgaagtcaac catggggc 18
<210> 93
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码翼螺旋-转角-螺旋转录抑制因子DNA结合蛋白的基因的向导RNA的靶序列
<400> 93
tcctgtgact tgacggtg 18
<210> 94
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码SANT/Myb结构域蛋白的基因的向导RNA的靶序列
<400> 94
ggcaatacaa gcagtggaag 20
<210> 95
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码CCT基序家族蛋白的基因的向导RNA的靶序列
<400> 95
ctgatctcga gatggctg 18
<210> 96
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含真菌特异性转录因子结构域的蛋白质的基因的向导RNA的靶序列
<400> 96
gtgaagattg gtcccact 18
<210> 97
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码Myb样DNA结合shaqkyf类家族蛋白的基因的向导RNA的靶序列
<400> 97
ggacgctacg accgtgcggg 20
<210> 98
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码核酸结合蛋白的基因的向导RNA的靶序列
<400> 98
ctgcaccaga cacaaatt 18
<210> 99
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码转录激活因子6的基因的向导RNA的靶序列
<400> 99
gggaaatatt aagactggag 20
<210> 100
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含真菌Zn(2)-Cys(6)双核集群结构域的蛋白质的基因的向导RNA的靶序列
<400> 100
tcacgggaga tgtcctgt 18
<210> 101
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码Zn(2)-C6真菌型转录因子的基因的向导RNA的靶序列
<400> 101
aggactctcc tcagctga 18
<210> 102
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码翼螺旋-转角-螺旋转录抑制因子的基因的向导RNA的靶序列
<400> 102
tcttcatctg cgacaacg 18
<210> 103
<211> 18
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含真菌Zn(2)-Cys(6)双核集群结构域的蛋白质的基因的向导RNA的靶序列
<400> 103
acgtccgaat ataccgaa 18
<210> 104
<211> 19
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含Myb样dna结合域的蛋白的基因的向导RNA的靶序列
<400> 104
gtagaacaag cgttagacc 19
<210> 105
<211> 19
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码含真菌Zn(2)-Cys(6)双核集群结构域的蛋白质的基因的向导RNA的靶序列
<400> 105
cgccaccctc gcacgtgtc 19
<210> 106
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 靶向编码Aureochrome 1样蛋白的基因的向导RNA的靶序列
<400> 106
ggcaccatcc ccaccggttt 20
<210> 107
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 来自编码含CCT结构域的蛋白的基因的有义引物
<400> 107
aagtgcgcaa gacgctccag 20
<210> 108
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 来自编码含CCT结构域的蛋白的基因的反义引物
<400> 108
gatcccaaag gtcatatccg t 21
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 109
acctccttgt cactgagcag 20
<210> 110
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 110
gatcccaaag gtcatatccg t 21
<210> 111
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 111
actctgtgct accaattgct g 21
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 112
cgtcagcaaa tcttgcacca 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 113
gagatgctgt ccgagacacg 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 114
gtatctcgga cagggcactg 20
<210> 115
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 115
atccatgtaa agacgatgtg c 21
<210> 116
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 116
tgatatcaca tgctcaaggt c 21
<210> 117
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 117
agatgaggat caagcaccga gcca 24
<210> 118
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 118
ggaagaaata gtagttgcgt g 21
<210> 119
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 119
aggcgctctg attgctgtgg c 21
<210> 120
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 120
tcttccacgt cggatggcca g 21
<210> 121
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 121
attgtggagg gtaacaaact acg 23
<210> 122
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 122
tgagtcccgt ggagaggagt cg 22
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 123
aggttccaat ggaggccgca 20
<210> 124
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 124
cactttcctt cgtacgctca gc 22
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 125
ctcgaggtag gtggtgaaag 20
<210> 126
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 126
gtgattcgca tggacgaac 19
<210> 127
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 127
atgggtacgg acttgttcg 19
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 128
acagcgatac ggacagtgac 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 129
gacgttgcat gagaaaggag 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 130
gatgcacagg tgcttgttag 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 131
tgcaaagcct atttccgacg 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 132
ctcattcgtg aggtgaccat 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 133
gagcaaactg acattgatac 20
<210> 134
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 134
gtaccacaca tacacatg 18
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 135
cacatccacc atcattccac 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 136
gagtgttccc agtgagccag 20
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 137
ctgacaagaa gatggacatg 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 138
ctttagttat acgtctgaag 20
<210> 139
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 139
gagaggatag ttctcagag 19
<210> 140
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 140
gtcccacaat ctattgtg 18
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 141
atgagtactt gcgcgctttg 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 142
gcatgcctcc gtcacagagt 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 143
atccattgag catgccgacg 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 144
gcaacatgtt aatgcatcgt 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 145
tcgtcctcga actcttcctc 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 146
cgggaacaac caaggtgtaa 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 147
tagcagagca ggctcatcac 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 148
gaatatgtgg tctagctcgt 20
<210> 149
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 149
atggctccac cctctgtaag 20
<210> 150
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 引物
<400> 150
ctgactacag ctagcacgat 20
<210> 151
<211> 25
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 引物
<400> 151
aagactttgg aggatgtctg agtgg 25
<210> 152
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<223> 引物
<400> 152
acgaagctac atccagtgca agg 23
<210> 153
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NAR1基因,有义引物
<400> 153
gccaacctgc cagtaaaatt c 21
<210> 154
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NAR1基因,反义引物
<400> 154
agagcgggat tctgttcttg 20
<210> 155
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Amt2基因,有义引物
<400> 155
agaacgtggg taagatgcaa c 21
<210> 156
<211> 19
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Amt2基因,反义引物
<400> 156
accagccaaa ccagagaag 19
<210> 157
<211> 22
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GS2基因,有义引物
<400> 157
ggcataccta ttcatccgct ag 22
<210> 158
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GS2基因,反义引物
<400> 158
caaatgacca agcaccaact c 21
<210> 159
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NAR2基因,有义引物
<400> 159
gcgaggcatc ttgtgaattg 20
<210> 160
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NAR2基因,反义引物
<400> 160
acggagtgtt caaatcccag 20
<210> 161
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GS1基因,有义引物
<400> 161
catggactca ttctcctacg g 21
<210> 162
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GS1基因,反义引物
<400> 162
atcctcgaaa tatccgcacc 20
<210> 163
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GOGAT1基因,有义引物
<400> 163
tggatgcaaa cgagatgcta g 21
<210> 164
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GOGAT1基因,反义引物
<400> 164
aggaaagcgg gaatagtgtg 20
<210> 165
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GDH基因,有义引物
<400> 165
gggactcgtt ggaaggtaag 20
<210> 166
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GDH基因,反义引物
<400> 166
catttccaca agtttctccg c 21
<210> 167
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GOGAT2基因,有义引物
<400> 167
aagggaatgt cttggaaccg 20
<210> 168
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> GOGAT2基因,反义引物
<400> 168
agtgggtaga cagtggagag 20
<210> 169
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NRT2基因,有义引物
<400> 169
agtgctatgg agttttgcgg 20
<210> 170
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NRT2基因,反义引物
<400> 170
agtgggtaga cagtggagag 20
<210> 171
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NiR基因,有义引物
<400> 171
gccgatcctt tcttgcaaac 20
<210> 172
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NiR基因,反义引物
<400> 172
agcgttcaat caggtccaag 20
<210> 173
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NR基因,有义引物
<400> 173
gctatattgg agaatccggc g 21
<210> 174
<211> 22
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> NR基因,反义引物
<400> 174
gggaacgtca acagtgatag tg 22
<210> 175
<211> 19
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Amt1基因,有义引物
<400> 175
ccttcggtgc ctatttcgg 19
<210> 176
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Amt1基因,反义引物
<400> 176
catgtcgctg gtataggatg c 21
<210> 177
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> UreT基因,有义引物
<400> 177
atggcagtag aaatggaccc 20
<210> 178
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> UreT基因,有义引物
<400> 178
agtaagagaa cgaaaagggc g 21
<210> 179
<211> 21
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 有义引物,未知功能的基因
<400> 179
ctctcctatt gctttccctc g 21
<210> 180
<211> 22
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 反义引物,未知功能的基因
<400> 180
ctaccaacac ctctacactt cc 22
<210> 181
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 乙酰-CoA羧化酶肽1
<400> 181
Phe Lys Phe Ala Asp Thr Pro Asp Glu Glu Ser Pro Leu Arg
1 5 10
<210> 182
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 乙酰-CoA羧化酶肽2
<400> 182
Ala Glu Asn Phe Lys Glu Asp Pro Leu Arg Arg Asp Met Arg
1 5 10
<210> 183
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 3-羟酰ACP脱水酶肽1
<400> 183
Thr Ala Asn Glu Pro Gln Phe Thr Gly His Phe Pro Glu Arg
1 5 10
<210> 184
<211> 13
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 3-羟酰ACP脱水酶肽2
<400> 184
Ile Asp Gly Val Phe Arg Lys Pro Val Val Pro Gly Asp
1 5 10
<210> 185
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 烯酰-ACP还原酶肽1
<400> 185
Pro Glu Asp Val Pro Glu Ala Val Lys Thr Asn Lys Arg Tyr
1 5 10
<210> 186
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 烯酰-ACP还原酶肽2
<400> 186
Ala Ile Gly Gly Gly Glu Lys Gly Lys Lys Thr Phe Ile Glu
1 5 10
<210> 187
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> β-酮脂酰-ACP还原酶肽1
<400> 187
Val Ala Ile Lys Ala Asp Met Ser Lys Pro Glu Glu Val Glu
1 5 10
<210> 188
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> β-酮脂酰-ACP还原酶肽2
<400> 188
Ser Asp Met Thr Glu Lys Leu Asp Leu Asp Gly Ile Lys Lys
1 5 10
<210> 189
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> β-酮脂酰-ACP合成酶1肽1
<400> 189
Tyr Met Arg Gly Ser Lys Gly Gln Ile Tyr Met Lys Glu Lys
1 5 10
<210> 190
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> β-酮脂酰-ACP合成酶1肽 2
<400> 190
Asp Ala Lys Pro Tyr Phe Lys Asp Arg Lys Ser Ala Val Arg
1 5 10
<210> 191
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Β-酮脂酰-ACP合成酶3肽1
<400> 191
Met Gly Lys Arg Ser Thr Ala Ser Ser Thr Gly Leu Ala Tyr
1 5 10
<210> 192
<211> 14
<212> PRT
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> Β-酮脂酰-ACP合成酶3肽2
<400> 192
Pro Pro Ser Ile Arg Glu Val Thr Pro Tyr Lys Gly Lys Tyr
1 5 10
<210> 193
<211> 20
<212> DNA
<213> 加的斯微拟球藻
<220>
<221> misc_feature
<223> 向导RNA的靶序列,硝酸还原酶基因
<400> 193
gggttggatg gaaaaaggca 20

Claims (105)

1.一种突变微生物,在对照微生物积聚生物质的相同条件下培养所述突变微生物和对照微生物时,所述突变微生物比对照微生物生成多至少25%的脂肪酸甲酯衍生化脂质(FAME脂质)和生成所述对照微生物所积聚的至少50%的量的生物质。
2.根据权利要求1所述的突变微生物,其中所述突变微生物为传统来源的突变体或经基因工程改造的突变体。
3.根据权利要求1所述的突变微生物,其中所述培养条件相对于所述对照微生物而言是营养充足的。
4.根据权利要求1所述的突变微生物,其中所述培养条件包括含少于2.5mM铵的培养基。
5.根据权利要求4所述的突变微生物,其中所述培养条件包括含少于1mM铵的培养基。
6.根据权利要求5所述的突变微生物,其中所述培养条件包括含少于或等于约0.5mM铵的培养基。
7.根据权利要求1-6中任一项所述的突变微生物,其中所述培养条件包括含硝酸盐的培养基。
8.根据权利要求7所述的突变微生物,其中所述培养条件包括含至少2mM硝酸盐的培养基。
9.根据权利要求1-6中任一项所述的突变微生物,其中所述培养条件包括含尿素的培养基。
10.根据权利要求9所述的突变微生物,其中所述培养条件包括含至少2mM尿素的培养基。
11.根据权利要求1所述的突变微生物,其中在至少3天的培养期内所述突变微生物比对照微生物生成多至少25%的FAME脂质,同时积聚了所述对照微生物所积聚的至少50%的量的生物质。
12.根据权利要求11所述的突变微生物,其中所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少50%的量的生物质。
13.根据权利要求11所述的突变微生物,其中所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少70%的量的生物质。
14.根据权利要求12所述的突变微生物,其中在至少5天的培养期内所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少70%的量的生物质。
15.根据权利要求13所述的突变微生物,其中在至少7天的培养期内所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少70%的量的生物质。
16.根据权利要求14所述的突变微生物,其中在至少10天的培养期内所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少70%的量的生物质。
17.根据权利要求15所述的突变微生物,其中在至少12天的培养期内所述突变微生物比对照微生物生成多至少50%的FAME脂质,同时积聚了所述对照微生物所积聚的至少70%的量的生物质。
18.根据权利要求17所述的突变微生物,其中所述突变微生物积聚了所述对照微生物所积聚的至少80%的量的生物质。
19.根据权利要求17所述的突变微生物,其中所述突变微生物积聚了所述对照微生物所积聚的至少90%的量的生物质。
20.根据权利要求18所述的突变微生物,其中所述突变微生物积聚了所述对照微生物所积聚的至少95%的量的生物质。
21.根据权利要求17所述的突变微生物,其中所述突变微生物比所述对照微生物生成多至少60%的FAME脂质。
22.根据权利要求21所述的突变微生物,其中所述突变微生物比所述野生型微生物生成多至少75%的FAME脂质。
23.根据权利要求22所述的突变微生物,其中所述突变微生物比所述对照微生物生成多至少100%的FAME脂质。
24.根据权利要求1所述的突变微生物,其中所述对照微生物为野生型微生物。
25.根据权利要求1所述的突变微生物,其中所述突变微生物具有减弱的编码Zn(2)-Cys(6)真菌型DNA结合域蛋白的基因的表达。
26.根据权利要求1所述的突变微生物,其中所述突变微生物为藻类或异鞭毛类。
27.一种突变微生物,其比对照微生物生成多至少100%的FAME脂质,同时积聚了在所述对照微生物积聚生物质的相同条件下培养的对照微生物所积聚的至少80%的量的生物质。
28.一种突变微生物,其比对照微生物生成多至少80%的FAME脂质,同时积聚了与在所述对照微生物积聚生物质的相同条件下培养的对照微生物所积聚的至少同样多的生物质。
29.根据权利要求27所述的突变微生物,其中所述培养基包含少于2.5mM铵。
30.根据权利要求29所述的突变微生物,其中所述培养基包含少于1mM铵。
31.根据权利要求30所述的突变微生物,其中所述培养基包含0.5mM或更少的铵。
32.根据权利要求29所述的突变微生物,其中所述培养基包含硝酸盐。
33.根据权利要求32所述的突变微生物,其中所述培养基中硝酸盐的浓度为至少2mM。
34.根据权利要求29所述的突变微生物,其中所述培养基包含尿素。
35.根据权利要求34所述的突变微生物,其中所述培养基中尿素的浓度为至少2mM。
36.根据前述权利要求中任一项所述的突变微生物,其中所述培养条件为分批、连续或半连续的。
37.根据权利要求36所述的突变微生物,其中在所述突变微生物生成多至少25%的脂质和生成所述对照微生物所生成的至少50%的生物质的培养条件下,所述微生物的C:N比率为对照微生物C:N比率的至少1.5倍。
38.一种突变微生物,在对照微生物积聚生物质的相同条件下培养所述突变微生物和对照微生物时,所述突变微生物表现出比对照微生物的FAME/TOC比率高至少30%的FAME/TOC比率,同时积聚了所述对照微生物所积聚的至少50%的生物质。
39.根据权利要求38所述的突变微生物,其中所述突变体比所述对照微生物生成多至少60%的FAME脂质。
40.根据权利要求39所述的突变微生物,其中所述突变体比所述对照微生物生成多至少80%的FAME脂质。
41.根据权利要求40所述的突变微生物,其中所述突变体比所述对照微生物生成多至少100%的FAME脂质。
42.根据权利要求38所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少40%的FAME/TOC比率。
43.根据权利要求42所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少50%的FAME/TOC比率。
44.根据权利要求43所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少100%的FAME/TOC比率。
45.根据权利要求44所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少150%的FAME/TOC比率。
46.一种突变微生物,在对照微生物积聚生物质的相同条件下培养所述突变微生物和对照微生物时,所述突变微生物表现出为对照微生物C:N比率的至少1.5倍的C:N比率,同时积聚了所述对照微生物所积聚的至少50%的生物质和比所述对照微生物所积聚的多至少25%的脂质。
47.根据权利要求46所述的突变微生物,其中所述突变体表现出为对照微生物C:N比率的至少1.5倍的C:N比率,同时至少5天、至少7天、至少8天、至少10天或至少12天积聚了所述野生型微生物所积聚的至少50%的生物质和比所述野生型微生物所积聚的多至少25%的脂质。
48.根据权利要求46所述的突变微生物,其中所述突变体具有减弱的编码含Zn(2)Cys(6)DNA结合域的多肽的基因的表达。
49.根据权利要求46所述的突变微生物,其中所述突变微生物为藻类或异鞭毛类。
50.一种编码Zn(2)-C6真菌型DNA结合域多肽的基因的表达减弱的突变微生物,其中所述突变微生物表现出比编码具有Zn(2)-C6真菌型DNA结合域的多肽的基因的表达未减弱的对照微生物所表现的FAME/TOC比率高的FAME/TOC比率。
51.根据权利要求48所述的突变微生物,其中所述Zn(2)-C6真菌型DNA结合域多肽与SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQIDNO:7、SEQIDNO:8、SEQIDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ IDNO:16或SEQ ID NO:17具有至少50%同一性。
52.根据权利要求51所述的突变微生物,其中所述多肽包含与SEQ ID NO:21-25中的任一个具有至少65%同一性的氨基酸序列。
53.根据权利要求48所述的突变微生物,其中所述突变微生物的Zn(2)-C6真菌型DNA结合域多肽的转录物水平相对于所述对照微生物而言降低约10%至约95%。
54.根据权利要求51所述的突变微生物,其中所述突变微生物在编码Zn(2)-C6真菌型DNA结合域多肽的所述基因的非编码区内包含插入。
55.根据权利要求46所述的突变微生物,其中在所述培养基包含少于2.5mM铵的条件下,所述突变微生物具有相对于对照微生物增加的FAME/TOC比率。
56.根据权利要求55所述的突变微生物,其中所述突变微生物表现出比所述对照微生物的FAME/TOC比率高至少30%的FAME/TOC比率。
57.根据权利要求56所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少50%的FAME/TOC比率。
58.根据权利要求57所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少100%的FAME/TOC比率。
59.根据权利要求58所述的突变微生物,其中所述突变微生物表现出比对照微生物的FAME/TOC比率高至少150%的FAME/TOC比率。
60.根据权利要求48所述的突变微生物,其中在所述突变微生物和所述对照微生物积聚生物质的条件下在至少3天的时期内,所述突变微生物比所述对照微生物生成多至少50%的FAME脂质和生成所述对照微生物所生成的至少50%的量的生物质。
61.根据权利要求51所述的突变微生物,其中所述多肽与包含选自SEQ ID NO:2或SEQID NO:5-17中的任一个的氨基酸序列的多肽具有至少65%同一性。
62.根据权利要求48所述的突变微生物,其中所述多肽与包含选自SEQ ID NO:2或SEQID NO:5-17中的任一个的氨基酸序列的多肽具有至少80%同一性。
63.根据权利要求50所述的突变微生物,其中所述多肽还包含PAS3结构域。
64.根据权利要求63所述的突变微生物,其中所述PAS3结构域与SEQ ID NO:21-SEQ IDNO:25中的任一个具有至少65%同一性。
65.根据权利要求52中任一项所述的突变微生物,其中所述PAS3结构域与SEQ ID NO:21-SEQ ID NO:25中的任一个具有至少80%同一性。
66.根据权利要求50所述的突变微生物,其中编码具有Zn(2)Cys(6)结构域的所述多肽的所述基因包括导致编码具有锌Cys结构域的所述多肽的基因的表达降低的插入、缺失或碱基变化突变。
67.根据权利要求50所述的突变微生物,其中所述突变微生物包含反义构建体、RNAi构建体或靶向编码具有ZnCys结构域的所述多肽的所述基因的核酶。
68.根据权利要求50所述的突变微生物,其中所述微生物为异鞭毛类或藻类。
69.根据权利要求68所述的突变微生物,其中所述微生物为网粘菌类。
70.根据权利要求69所述的突变微生物,其中所述微生物为以下种类:网粘菌属、类网粘菌属、破囊壶菌属、裂殖壶菌属、不动壶菌属、橙黄壶菌属、椭圆壶菌属、日本壶菌属、戴普罗弗菌属或吾肯氏壶菌属。
71.根据权利要求68所述的突变微生物,其中所述微生物为藻类。
72.根据权利要求71所述的突变微生物,其中所述微生物为以下种类:曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、波利氏藻属、包特氏藻属、气球藻属、葡萄藻属、片球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、长绿梭藻属、小球藻属、蓝隐藻属、金球藻属、球隹丐板藻属、隐甲藻属、隐藻属、小环藻属、链带藻属、杜氏藻属、后棘藻属、圆石藻属、独球藻属、衣迪斯藻属、眼虫藻属、真眼点藻属、披剌藻属、脆杆藻属、拟脆杆藻属、丽丝藻属、红球藻属、菱板藻属、异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微星藻属、蒜头藻属、单针藻属、微球藻属、微拟球藻属、舟形藻属、新绿藻属、肾鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、虫毛球藻属、拟小球藻属、雪衣藻属、杜氏亚属盐藻属、巴夫藻属、普莱格门、褐指藻属、菌体属、微微型绿藻属、扁藻属、颗石藻属、肋球藻属、原壁菌属、拟绿球藻属、拟新绿藻属、拟角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、裂衣藻属、骨条藻属、水绵藻属、裂丝藻属、四球藻属、扁藻属、海链藻属、黄丝藻属、无隔藻属、鲜绿球藻属、魏氏藻属和团藻属。
73.一种突变微生物,在对照微生物积聚生物质的相同条件下培养所述突变微生物和对照微生物时,所述突变微生物生成比对照微生物所生成的多至少25%的脂质,同时生成所述对照微生物所生成的至少50%的生物质,其中相对于所述对照微生物,所述突变微生物的蛋白质含量降低至少10%、至少20%、至少30%、至少40%或至少50%。
74.一种生成脂质的方法,其包括培养根据权利要求1所述的突变微生物以及从所述微生物、所述培养基或两者中分离脂质。
75.根据权利要求74所述的方法,其中在包含少于约2.5mM铵的培养基中培养所述突变或重组微生物。
76.根据权利要求75所述的方法,其中在包含少于约1mM铵的培养基中培养所述突变或重组微生物。
77.根据权利要求75所述的方法,其中所述培养基包含硝酸盐。
78.根据权利要求77所述的方法,其中所述培养基包含至少约2mM硝酸盐。
79.根据权利要求78所述的方法,其中所述培养基包含至少约5mM硝酸盐。
80.根据权利要求75所述的方法,其中所述培养基包含尿素。
81.根据权利要求80所述的方法,其中所述培养基包含至少约2mM尿素。
82.根据权利要求81所述的方法,其中所述培养基包含至少约5mM尿素。
83.一种生成脂质的方法,其包括在所述微生物的FAME/TOC比率保持在0.3和0.9之间的条件下培养根据权利要求1-73中任一项所述的微生物,以及从所述微生物、所述培养基或两者中分离脂质。
84.根据权利要求83所述的方法,其中所述FAME/TOC比率介于约0.4和约0.8之间。
85.根据权利要求84所述的方法,其中所述FAME/TOC比率介于约0.4和约0.7之间。
86.根据权利要求85所述的方法,其中所述FAME/TOC比率介于约0.4和约0.6之间。
87.根据权利要求86所述的方法,其中所述FAME/TOC比率介于约0.45和约0.55之间。
88.根据权利要求74-87中任一项所述的方法,其中所述突变微生物具有减弱的编码调节脂质生成的多肽的基因的表达。
89.根据权利要求88所述的方法,其中所述突变微生物具有减弱的编码多肽的基因的表达,所述多肽与包含选自SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:113、SEQ IDNO:14、SEQ ID NO:15、SEQ ID NO:16和SEQ ID NO:17的氨基酸序列的多肽具有至少50%同一性。
90.根据权利要求75所述的方法,其中所述突变微生物具有减弱的编码与SEQ ID NO:2具有至少60%同一性的多肽的基因的表达。
91.根据权利要求76所述的方法,其中所述突变微生物具有减弱的编码与SEQ ID NO:2具有至少80%同一性的多肽的基因的表达。
92.一种用于表达向导RNA的DNA分子,其包含与包含向导序列的DNA序列可操作连接的启动子,所述向导序列包含SEQ ID NO:51-62中的任一个。
93.根据权利要求92所述的DNA分子,其中所述启动子为细菌启动子、噬菌体启动子或藻类启动子。
94.一种向导RNA,其包含SEQ ID NO:51-62中的任一个。
95.根据权利要求94所述的向导RNA,其中所述向导为嵌合型向导。
96.根据权利要求94所述的向导RNA,其中所述向导不包括tracr序列。
97.一种用于同源重组的核酸分子构建体,其包含来自或邻近编码多肽的自然存在的藻类基因的核苷酸序列,所述多肽具有与SEQ ID NO:2或SEQ ID NO:17具有至少55%同一性的氨基酸序列。
98.根据权利要求87所述的核酸分子构建体,其中所述多肽具有与SEQ ID NO:2或SEQID NO:17具有至少65%同一性的氨基酸序列。
99.根据权利要求88所述的核酸分子构建体,其中所述多肽具有与SEQ ID NO:2或SEQID NO:17具有至少85%同一性的氨基酸序列。
100.一种用于表达反义RNA、shRNA、微RNA或核酶的核酸分子构建体,其包含与编码多肽的自然存在的基因的至少一部分互补的核苷酸序列,所述多肽具有与SEQ ID NO:2或SEQID NO:17具有至少55%同一性的氨基酸序列。
101.根据权利要求90所述的核酸分子构建体,其中所述多肽具有与SEQ ID NO:2或SEQID NO:17具有至少65%同一性的氨基酸序列。
102.根据权利要求91所述的核酸分子构建体,其中所述多肽具有与SEQ ID NO:2或SEQID NO:17具有至少85%同一性的氨基酸序列。
103.一种编码CRISPR系统的向导RNA的核酸分子,其中所述向导RNA包含编码多肽的自然存在的藻类基因的至少一部分,所述多肽具有与SEQ ID NO:2或SEQ ID NO:17具有至少55%同一性的氨基酸序列。
104.根据权利要求93所述的核酸分子,其中所述多肽具有与SEQ ID NO:2或SEQ IDNO:17具有至少65%同一性的氨基酸序列。
105.根据权利要求94所述的核酸分子,其中所述多肽具有与SEQ ID NO:2或SEQ IDNO:17具有至少85%同一性的氨基酸序列。
CN201680052590.XA 2015-07-14 2016-07-14 脂质产率增加的微生物 Active CN108026504B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562192510P 2015-07-14 2015-07-14
US62/192,510 2015-07-14
US201662318161P 2016-04-04 2016-04-04
US62/318,161 2016-04-04
PCT/US2016/042364 WO2017011707A1 (en) 2015-07-14 2016-07-14 Microorganisms having increased lipid productivity

Publications (2)

Publication Number Publication Date
CN108026504A true CN108026504A (zh) 2018-05-11
CN108026504B CN108026504B (zh) 2022-07-05

Family

ID=57758120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680052590.XA Active CN108026504B (zh) 2015-07-14 2016-07-14 脂质产率增加的微生物

Country Status (7)

Country Link
US (4) US10227619B2 (zh)
EP (1) EP3322799B1 (zh)
CN (1) CN108026504B (zh)
AU (1) AU2016293527B2 (zh)
ES (1) ES2873198T3 (zh)
PT (1) PT3322799T (zh)
WO (1) WO2017011707A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349566A (zh) * 2020-03-26 2020-06-30 佛山蓝强生物科技有限公司 一株利用海水培养的魏氏藻及其用途

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3322799B1 (en) 2015-07-14 2021-03-31 Synthetic Genomics, Inc. Microorganisms having increased lipid productivity
MX2020005939A (es) * 2017-12-08 2020-08-24 Synthetic Genomics Inc Mejoramiento de la productividad de lipidos de algas a traves de la modificacion genetica de una proteina que contiene un dominio tpr.
JP7295864B2 (ja) 2017-12-29 2023-06-21 シンセティック ジェノミクス インコーポレーテッド 成長を改善するための光合成生物の遺伝子調節方法
AU2019310022A1 (en) * 2018-07-23 2021-02-04 Synthetic Genomics, Inc. Microorganisms having increased lipid production, and compositions and methods of making and using the same
CN109112168B (zh) * 2018-08-24 2020-06-16 暨南大学 一种利用黄丝藻综合炼制生物产品、生物柴油和生物材料的方法

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101805743A (zh) * 2010-03-26 2010-08-18 郑州大学 一种提高光合作用效率转基因盐藻的制备方法
CN102033114A (zh) * 2010-10-12 2011-04-27 四川大学 一种快速简便分析传统酿造用大曲微生物群落结构的方法
WO2012082731A2 (en) * 2010-12-13 2012-06-21 J. Craig Venter Institute Engineered microalgae with enhanced lipid production
CN102517372A (zh) * 2011-12-09 2012-06-27 厦门大学 一种微藻胞内油脂含量的快速测定方法
CN102869768A (zh) * 2010-03-02 2013-01-09 麻省理工学院 生产脂肪酸和脂肪酸衍生物的微生物工程
AU2012236994A1 (en) * 2011-04-01 2013-10-17 Neste Oyj A method for recovering lipids from a microorganism
US20140106417A1 (en) * 2012-10-16 2014-04-17 Jane C Schneider Dgat genes and methods of use for triglyceride production in recombinant microorganisms
CN104271743A (zh) * 2011-12-27 2015-01-07 联邦科学技术研究组织 产生脂质的方法
US20150087014A1 (en) * 2013-09-24 2015-03-26 Exxonmobil Research And Engineering Company Methods of selecting algae strains for productivity and robustness
US20150183838A1 (en) * 2013-12-31 2015-07-02 Synthetic Genomics, Inc. Biomass productivity regulator
CN104837995A (zh) * 2012-12-06 2015-08-12 合成基因组股份有限公司 具有不易变化的高光适应表型的藻类突变体
CN105745324A (zh) * 2013-10-04 2016-07-06 合成基因组股份有限公司 用于调节生物质生产率的组合物和方法
US20170058303A1 (en) * 2015-07-14 2017-03-02 Synthetic Genomics, Inc. Microorganisms having increased lipid productivity
US20170121742A1 (en) * 2015-11-02 2017-05-04 Synthetic Genomics, Inc. Algal mutants with increased lipid productivity
CN108138198A (zh) * 2015-09-04 2018-06-08 合成基因组股份有限公司 为提高的产率而改造的微生物
US20190169627A1 (en) * 2017-12-05 2019-06-06 Synthetic Genomics, Inc. Algal lipid productivity via genetic modification of a signaling protein
US20200024623A1 (en) * 2018-07-23 2020-01-23 Synthetic Genomics, Inc. Microorganisms having increased lipid production, and compositions, and methods of making and using the same
CN111433220A (zh) * 2017-12-08 2020-07-17 合成基因组股份有限公司 通过基因修饰含trp结构域的蛋白来提高藻类脂质生产力
EP3788159A1 (en) * 2018-05-04 2021-03-10 Berner Fachhochschule A method for the microbial production of fatty acids and lipids
CN113166774A (zh) * 2018-12-19 2021-07-23 合成基因组股份有限公司 藻类基因的诱导表达

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100255550A1 (en) 2008-09-15 2010-10-07 Board Of Trustees Of Michigan State University Regulatory Factors Controlling Oil Biosynthesis In Microalgae And Their Use
US9428779B2 (en) 2010-02-03 2016-08-30 Sapphire Energy, Inc. Transformation of algae for increasing lipid production
WO2011127118A1 (en) 2010-04-06 2011-10-13 Algenetix, Inc. Methods of producing oil in non-plant organisms
WO2013016267A2 (en) 2011-07-22 2013-01-31 Donald Danforth Plant Science Center Plants and algae capable of modulating antenna size based on light intensity
IN2013CH05134A (zh) 2013-11-12 2015-05-29 Roshan Viswanath Makam
AU2015286221B2 (en) 2014-07-07 2022-05-19 Nuseed Global Innovation Ltd Processes for producing industrial products from plant lipids
AU2015373893B2 (en) * 2014-12-31 2021-07-29 Synthetic Genomics, Inc. Compositions and methods for high efficiency in vivo genome editing

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102869768A (zh) * 2010-03-02 2013-01-09 麻省理工学院 生产脂肪酸和脂肪酸衍生物的微生物工程
CN101805743A (zh) * 2010-03-26 2010-08-18 郑州大学 一种提高光合作用效率转基因盐藻的制备方法
CN102033114A (zh) * 2010-10-12 2011-04-27 四川大学 一种快速简便分析传统酿造用大曲微生物群落结构的方法
WO2012082731A2 (en) * 2010-12-13 2012-06-21 J. Craig Venter Institute Engineered microalgae with enhanced lipid production
AU2012236994A1 (en) * 2011-04-01 2013-10-17 Neste Oyj A method for recovering lipids from a microorganism
CN102517372A (zh) * 2011-12-09 2012-06-27 厦门大学 一种微藻胞内油脂含量的快速测定方法
CN104271743A (zh) * 2011-12-27 2015-01-07 联邦科学技术研究组织 产生脂质的方法
US20140106417A1 (en) * 2012-10-16 2014-04-17 Jane C Schneider Dgat genes and methods of use for triglyceride production in recombinant microorganisms
CN111321081A (zh) * 2012-12-06 2020-06-23 合成基因组股份有限公司 具有不易变化的高光适应表型的藻类突变体
CN104837995A (zh) * 2012-12-06 2015-08-12 合成基因组股份有限公司 具有不易变化的高光适应表型的藻类突变体
US20150087014A1 (en) * 2013-09-24 2015-03-26 Exxonmobil Research And Engineering Company Methods of selecting algae strains for productivity and robustness
CN105745324A (zh) * 2013-10-04 2016-07-06 合成基因组股份有限公司 用于调节生物质生产率的组合物和方法
CN105814190A (zh) * 2013-12-31 2016-07-27 合成基因组股份有限公司 生物质生产率调节剂
US20150183838A1 (en) * 2013-12-31 2015-07-02 Synthetic Genomics, Inc. Biomass productivity regulator
US20170058303A1 (en) * 2015-07-14 2017-03-02 Synthetic Genomics, Inc. Microorganisms having increased lipid productivity
CN108138198A (zh) * 2015-09-04 2018-06-08 合成基因组股份有限公司 为提高的产率而改造的微生物
US20170121742A1 (en) * 2015-11-02 2017-05-04 Synthetic Genomics, Inc. Algal mutants with increased lipid productivity
CN108368491A (zh) * 2015-11-02 2018-08-03 合成基因组股份有限公司 具有提高的脂质生产率的藻类突变体
US20190169627A1 (en) * 2017-12-05 2019-06-06 Synthetic Genomics, Inc. Algal lipid productivity via genetic modification of a signaling protein
CN111433219A (zh) * 2017-12-05 2020-07-17 合成基因组股份有限公司 通过基因修饰信号传导蛋白提高藻类脂质生产力
CN111433220A (zh) * 2017-12-08 2020-07-17 合成基因组股份有限公司 通过基因修饰含trp结构域的蛋白来提高藻类脂质生产力
EP3788159A1 (en) * 2018-05-04 2021-03-10 Berner Fachhochschule A method for the microbial production of fatty acids and lipids
US20200024623A1 (en) * 2018-07-23 2020-01-23 Synthetic Genomics, Inc. Microorganisms having increased lipid production, and compositions, and methods of making and using the same
CN112384619A (zh) * 2018-07-23 2021-02-19 合成基因组股份有限公司 具有增加的脂质产生的微生物和组合物及其制备和使用方法
CN113166774A (zh) * 2018-12-19 2021-07-23 合成基因组股份有限公司 藻类基因的诱导表达

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
CORTEGGIANI CARPINELLI,E.等: ""Zn(2)-C6 fungal-type DNA-binding domain protein [Nannochloropsis gaditana]"", 《GENBANK DATABASE》 *
ELISA CORTEGGIANI CARPINELLI等: ""Chromosome Scale Genome Assembly and Transcriptome Profiling of Nannochloropsis gaditana in Nitrogen Depletion"", 《MOLECULAR PLANT》 *
GIULIANA DIPPOLITO等: "Potential of lipid metabolism in marine diatoms for biofuel production", 《BIOTECHNOLOGY FOR BIOFUELS》 *
IMAD AJJAWI等: ""Lipid production in Nannochloropsis gaditana is doubled by decreasing expression of a single transcriptional regulator"", 《NATURE BIOTECHENOLOGY》 *
IMAD AJJAWI等: "Lipid production in Nannochloropsis gaditana is doubled by decreasing expression of a single transcriptional regulator", 《NATURE BIOTECHNOLOGY》 *
JOHN VERRUTO等: "Unrestrained markerless trait stacking in Nannochloropsis gaditana through combined genome editing and marker recycling technologies", 《PNAS》 *
MAHMOUD GARGOURI等: "Identification of regulatory network hubs that control lipid metabolism in Chlamydomonas reinhardtii", 《JOURNAL OF EXPERIMENTAL BOTANY》 *
NANETTE R. BOYLE等: ""Three Acyltransferases and Nitrogen-responsive Regulator Are Implicated in Nitrogen Starvation-induced Triacylglycerol Accumulation in Chlamydomonas"", 《THE JOURNAL OF BIOLOGICAL CHEMISTRY》 *
夏金兰: ""两株微藻的分离鉴定及 Fe3+对其生长和脂质积累的影响"", 《武汉大学学报(理学版)》 *
杨宇等: ""脂质组学在微生物领域中的研究进展"", 《第二军医大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111349566A (zh) * 2020-03-26 2020-06-30 佛山蓝强生物科技有限公司 一株利用海水培养的魏氏藻及其用途

Also Published As

Publication number Publication date
AU2016293527B2 (en) 2022-01-13
AU2016293527A1 (en) 2018-02-22
CN108026504B (zh) 2022-07-05
US20210040515A1 (en) 2021-02-11
ES2873198T3 (es) 2021-11-03
US20170058303A1 (en) 2017-03-02
US10227619B2 (en) 2019-03-12
US20190233855A1 (en) 2019-08-01
EP3322799B1 (en) 2021-03-31
WO2017011707A1 (en) 2017-01-19
US11332764B2 (en) 2022-05-17
EP3322799A4 (en) 2019-02-20
US10563232B2 (en) 2020-02-18
EP3322799A1 (en) 2018-05-23
US20200172943A1 (en) 2020-06-04
PT3322799T (pt) 2021-06-02

Similar Documents

Publication Publication Date Title
CN108026504A (zh) 脂质产率增加的微生物
CN108368491B (zh) 具有提高的脂质生产率的藻类突变体
CN103068966B (zh) 光合作用产物的生产性得以提高的藻类、及其利用
CN111235169A (zh) 一种GTP环化水解酶I基因folE及应用
CN113046355A (zh) 一种新型中温原核Argonaute蛋白PbAgo表征及应用
KR20200010285A (ko) 증가된 nadph를 유도하는 생합성 경로의 게놈 공학
CN112384619A (zh) 具有增加的脂质产生的微生物和组合物及其制备和使用方法
CN112522260A (zh) Crispr系统及其在制备ttn基因突变的扩张型心肌病克隆猪核供体细胞中的应用
CN114958762B (zh) 一种构建神经组织特异过表达人源snca的帕金森病模型猪的方法及应用
JP2021505158A (ja) Tprドメイン含有タンパク質の遺伝子改変を介した藻類脂質生産性の改善方法
CN114525304B (zh) 一种基因编辑的方法
CN114807202A (zh) 噬菌体辅助的纤维寡糖转运蛋白连续定向进化系统和方法
CN105814190A (zh) 生物质生产率调节剂
CN110139676A (zh) 使用病毒的基因编辑方法
CN114480470A (zh) 高通量制备模式生物基因编辑突变体的方法及相关质粒
CN114958760A (zh) 一种构建阿尔兹海默症模型猪的基因编辑技术及其应用
US20130333074A1 (en) Enhancer of cell division
CN112522255B (zh) CRISPR/Cas9系统及其在构建胰岛素受体底物基因缺陷的猪源重组细胞中的应用
JP2021505144A (ja) シグナル伝達タンパク質の遺伝子改変を介した藻類脂質生産性の改善方法
CN112522256B (zh) CRISPR/Cas9系统及其在构建抗肌萎缩蛋白基因缺陷的猪源重组细胞中的应用
CN112680453B (zh) Crispr系统及其在构建stxbp1突变的癫痫性脑病克隆猪核供体细胞中的应用
CN112522257B (zh) 用于制备rrip四个基因联合敲除的重症免疫缺陷猪源重组细胞的系统
CN112522258B (zh) Il2rg基因和ada基因联合敲除的重组细胞及其在制备免疫缺陷猪模型中的应用
CN112522309B (zh) 重症免疫缺陷猪源重组细胞及其制备方法和试剂盒
CN112522202B (zh) 制备addi四个基因联合敲除的重症免疫缺陷猪源重组细胞的方法及其专用试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant