CN110914425A - 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台 - Google Patents

用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台 Download PDF

Info

Publication number
CN110914425A
CN110914425A CN201880047656.5A CN201880047656A CN110914425A CN 110914425 A CN110914425 A CN 110914425A CN 201880047656 A CN201880047656 A CN 201880047656A CN 110914425 A CN110914425 A CN 110914425A
Authority
CN
China
Prior art keywords
saccharopolyspora
strain
library
phenotypic performance
strains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880047656.5A
Other languages
English (en)
Inventor
B·梅森
A·戈拉诺夫
P·凯利
Y·基姆
S·莫迪
N·帕苏马尔蒂
B·米基特斯
P·埃涅尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zymergen Inc
Original Assignee
Zymergen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zymergen Inc filed Critical Zymergen Inc
Publication of CN110914425A publication Critical patent/CN110914425A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1079Screening libraries by altering the phenotype or phenotypic trait of the host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination

Abstract

本发明提供了一种用于糖多孢菌属的HTP微生物基因组工程改造平台,其以计算方式驱动并整合了分子生物学、自动化和先进机器学习方案。这一集成平台利用了一套HTP分子工具集来创建HTP基因设计文库,所述基因设计文库尤其来源于科学见解和迭代模式识别。

Description

用于改良刺糖多孢菌的高通量(HTP)基因组工程改造平台
相关申请的交叉参考
本申请要求2017年6月6日提交的美国临时专利申请序列号62/515,934的优先权,其以全文引用的方式并入本文中。
关于序列表的陈述
以文本格式代替纸本拷贝提供与本申请相关的序列表,并且在此以引用的方式并入本说明书中。含有序列表的文本文件的名称是ZYMR_013_01WO_SeqList_ST25.txt。文本文件约185KB,创建于2018年6月6日,并且以电子方式通过EFS-Web提交。
技术领域
本公开涉及高通量(HTP)微生物基因组工程。所公开的HTP基因组工程改造平台由计算机驱动并整合了分子生物学、自动化和先进机器学习方案。这一集成平台利用了一套HTP分子工具集创建HTP基因设计文库,所述基因设计文库尤其利用科学见解和迭代模式识别得到。确切地说,所教示平台能够在此前难以处理的微生物物种中进行HTP微生物基因组工程改造。
背景技术
人类利用微生物细胞生物合成路径产生所关注的产物的能力已有一千年,所述产物的最古老实例包括乙醇、醋、奶酪和酵母乳。这些产物在当今仍然存在巨大的需求并且还伴随着微生物所能产生的产物谱系的不断增大。基因工程技术的出现使得科学家能够设计出多种生物体内的新颖生物合成路径并对其进行编程,从而产生广泛范围的工业、医疗和消费产品。的确,微生物细胞培养物现在用于产生小分子、抗生素、疫苗、杀虫剂、酶、燃料和工业化学品范围内的产物。
鉴于现代工业微生物产生的产物多种多样,因此工程师们承受着提高所指定微生物能够产生目标产物的速度和效率的巨大压力是不足为奇的。
已经使用多种方法,通过“改良”所涉及的微生物来改善基于生物学的工业过程的经济性。举例来说,许多医药和化学工业依赖于微生物菌株改良程序,其中使微生物培养物的亲代菌株通过暴露于化学品或UV辐射而连续发生突变并随后根据性能增强(如生产率、产量和效价)进行筛选。广泛地重复这种诱变过程直到菌株展现产物性能的适当增强为止。接着使用后续“改良”菌株进行商业生产。
如上文所提及,通过诱变来鉴别改良的工业微生物菌株费时并且效率底下。所述过程就其本质来说是偶然的并且依赖于一次意外的在产物输出上具有所期望结果的突变。
传统的微生物菌株改良程序不仅效率低下,而且所述过程还会提高工业菌株的有害诱变负荷程度。经历这些类型的程序的工业菌株中的突变积累会变得明显并可能导致性能改良速率出现最终的停滞。
这对于许多研究人员视为“难以处理的”的微生物,即传统菌株工程改造工具不可用或根本地不起作用的那些生物体尤其成问题。一种此类群组,糖多孢菌属(Saccharopolyspora spp.)为非常难以工程改造的生物体。这是因为与已进行大量研究并且可容易利用基因组工程改造工具的模型系统微生物相比,糖多孢菌属的许多重要工具有待产生、测试和/或改良。
因此,对于试图出于生产目的改良微生物的研究人员来说,糖多孢菌属面临独特挑战。这些挑战已对糖多孢菌属的基因组工程领域造成阻碍,并妨碍研究人员充分利用这种微生物系统的潜力。
因此,所属领域中对工程改造工业微生物的新方法存在着巨大的需求,所述新方法不受扰于传统菌株改良程序所固有的前述缺点并且大大加快了发现和合并有益突变的过程。
另外,急需一种借以“修复”工业菌株的方法,所述工业菌株已利用微生物菌株改良领域中当前所用的过时有害方法开发出。
此外,所属领域极度能够在传统上难以处理的微生物物种中执行HTP基因组工程改造过程的工具及方法。一种当前无法利用HTP基因组工程改造过程的此类微生物物种属为糖多孢菌属。
发明内容
本公开提供了一种高通量(HTP)微生物基因组工程改造平台,其不存在与传统微生物菌株改良程序相关的多种问题。
另外,本文教示的HTP平台能够修复工业微生物,所述工业微生物通过数十年的基于随机诱变的菌株改良程序已经积累了非有益突变。
本文所述的HTP平台提供新颖微生物工程改造工具及方法,其使得研究人员可在传统上难以处理的微生物生物体中执行HTP基因组工程改造。例如,所教示平台为其类别中实现在糖多孢菌属中进行HTP基因组工程改造的第一个。迄今为止,这种生物体群组仍不适合于HTP基因组工程改造。因此,所公开的平台将对这种生物体系统中的基因组工程改造进行变革。
所公开的HTP基因组工程改造平台由计算机驱动并整合了分子生物学、自动化和先进机器学习方案。这一集成平台利用了一套HTP分子工具集创建HTP基因设计文库,所述基因设计文库尤其利用科学见解和迭代模式识别得到。
所教示的HTP基因设计文库通过提供用于在微生物中测试的特定基因组变异文库来充当基因组工程改造过程的驱动器。利用特定文库或文库组合加以工程改造的微生物是根据所得结果(例如所关注产物的产生),按照HTP方式高效筛选。利用HTP基因设计文库界定用于在微生物中测试的特定基因组变异并接着随后筛选具有所述变异的宿主微生物基因组的这种方法是按高效的迭代方式实施。在一些方面中,基因组工程活动的迭代循环数或“轮数”可以是至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或更多个迭代/循环/轮数。
因此,在一些方面中,本公开教示了执行至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000或更多“轮”HTP基因工程(例如多轮SNP交换、PRO交换、STOP交换或其组合)的方法。
在一些实施例中,本公开教示了一种线性方法,其中每一轮后续HTP基因工程是基于前一轮基因工程中所鉴别的基因变异。在其它实施例中,本公开教示了一种非线性方法,其中每一轮后续HTP基因工程是基于任何前一轮基因工程(包括此前进行的分析,和单独的HTP基因工程学分支)中所鉴别的基因变异。
这些迭代循环的数据成就了大规模数据分析和模式识别,从而被集成平台利用以知悉后续多轮HTP基因设计文库建构。因此,所教示平台中使用的HTP基因设计文库是高度动态工具,其受益于大规模数据模式识别算法并通过每轮迭代微生物工程改造而变得信息更丰富。
在一些实施例中,本公开的基因设计文库包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、1000或更多个个别基因变化(例如PRO交换文库中存在至少X数目个启动子:基因组合)。
在一些实施例中,本公开提供了描述对微生物菌株应用HTP菌株改良方法的说明性实例和文字。在一些实施例中,本公开的菌株改良方法适用于任何宿主细胞。
在一些实施例中,本公开教示了一种使微生物进化以获得所期望表型的高通量(HTP)基因组工程改造的方法,其包含:a)获得具有扰乱基因组的初始多种糖多孢菌微生物的基因组作为初始HTP基因设计糖多孢菌菌株文库,其中所述多种糖多孢菌微生物具有相同基因组菌株背景,以由此形成初始HTP基因设计,并且其中所述糖多孢菌菌株文库包含包含具有独特基因变异的个别糖多孢菌菌株;b)根据所述所期望表型筛选和选择初始HTP基因设计微生物菌株文库中的个别微生物菌株;c)提供各自包含独特基因变异组合的后续多种微生物,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异,由此创建后续HTP基因设计微生物菌株文库;d)根据所述所期望表型筛选和选择所述后续HTP基因设计微生物菌株文库中的个别微生物菌株;e)按照线性或非线性方式重复步骤c)-d)一次或多次,直到微生物已获得所期望表型为止,其中每次后续迭代创建了新的HTP基因设计微生物菌株文库,所述新的HTP基因设计微生物菌株文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异是选自前一HTP基因设计微生物菌株文库中的至少两种个别微生物菌株的基因变异组合。
当组合基因变异时,可考虑或不考虑含有基因变异的基因的功能和/或特性。在一些实施例中,不考虑含有基因变异的基因的功能和/或特性。例如,选择同一基因或具有相似功能/结构的基因的基因变异供组合。在一些实施例中,在组合基因变异之前,不考虑含有基因变异的基因的功能和/或特性。在任一情况下,可进行随后的筛选和选择步骤以鉴别具有所期望表型的经工程改造的糖多孢菌菌株(如所关注产物的改良产生)。
在一些实施例中,基因变异在涉及所关注产物的直接合成或代谢的一个或多个基因座处,或涉及合成或代谢的调节的基因座处。在一些实施例中,基因变异在不涉及所关注产物的直接合成或代谢,及不涉及合成或代谢的调节的一个或多个基因座处。在一些实施例中,随机挑选基因变异进行组合,而不存在优选的其功能或特定基因组组合结构的任何特定假设。例如,在一些实施例中,组合的目的并非在含有DNA模块的重复区段(如编码聚酮或非核糖体肽的基因中的重复区段)的基因组区域处取代DNA模块。
在一些实施例中,在其中组合来自不同来源的基因变异的上述方法的步骤(c)中,可使用多种技术。在一些实施例中,使用同源重组质粒系统。在一些实施例中,通过以下产生步骤(c)中各自包含独特基因变异组合的糖多孢菌微生物:1)将质粒引入到属于初始HTP基因设计糖多孢菌菌株文库的个别糖多孢菌菌株中,其中所述质粒包含(i)选择标记;(ii)反向选择标记;(iii)与基本糖多孢菌菌株的基因组基因座具有同源性的DNA片段;及质粒骨架序列,其中所述DNA片段具有源自也属于初始HTP基因设计糖多孢菌菌株文库的另一个别糖多孢菌菌株的基因变异;2)基于基因组中存在选择标记选择具有整合事件的糖多孢菌菌株;3)基于不存在反向选择标记基因选择质粒骨架环出(loop out)的糖多孢菌菌株。
在一些实施例中,本公开方法不仅能够在具有基因组模块性的这些区域处执行靶向基因组编辑,还实现在整个基因组中,在任何基因组背景下执行靶向基因组编辑。因此,本公开的靶向基因组编辑可在任何区域处编辑刺糖多孢菌基因组,并且不局限于仅在具有模块性的区域处进行编辑。
在一些实施例中,质粒不包含温度敏感型。
在一些实施例中,在不复制整合质粒的情况下执行选择步骤3)。
在一些实施例中,本公开教示了初始HTP基因设计微生物菌株文库是选自由以下组成的群组的至少一种:启动子交换微生物菌株文库、SNP交换微生物菌株文库、起始/终止密码子微生物菌株文库、优化序列微生物菌株文库、终止子交换微生物菌株文库、转座子诱变多样性文库、核糖体结合位点微生物菌株文库、抗代谢物选择/发酵产物抗性微生物库或其任何组合。在一些实施例中,所述微生物文库是糖多孢菌属文库。
在一些实施例中,本公开教示了制备各自包含独特基因变异组合的后续多种微生物的方法,其中组合的基因变异各自源于初始HTP基因设计微生物菌株文库或前一步骤的HTP基因设计微生物菌株文库。
在一些实施例中,后续多种微生物中的基因变异组合将包含初始HTP基因设计微生物菌株文库或前一步骤的HTP基因设计微生物菌株文库中的基因变异的所有可能组合的子集。
在一些实施例中,本公开教示了后续HTP基因设计微生物菌株文库是初始HTP基因设计微生物菌株文库或前一步骤的HTP基因设计微生物菌株文库中的基因变异所衍生的完整组合微生物菌株文库。
举例来说,如果先前HTP基因设计微生物菌株文库仅具有基因变异A、B、C和D,那么所述变异的部分组合可以包括包含三种微生物的后续HTP基因设计微生物菌株文库,所述三种微生物各自包含独特的基因变异组合AB、AC或AD(展现突变的顺序不重要)。前一步骤的HTP基因设计文库的基因变异所衍生的完整组合微生物菌株文库将包括六种各自包含独特的基因变异组合AB、AC、AD、BC、BD或CD的微生物。
在一些实施例中,本公开方法教示了利用至少一种选自由以下组成的群组的方法扰动基因组:随机诱变、靶向序列插入、靶向序列缺失、靶向序列置换、转座子诱变或其任何组合。
在本公开所公开方法的一些实施例中,初始多种微生物包含源于工业生产株微生物的独特基因变异。在一些实施例中,微生物是糖多孢菌属。
在本公开所公开方法的一些实施例中,初始多种微生物包含表示为S1Gen1的工业生产株微生物和由其衍生的表示为SnGenn的任何数目个后续微生物后代。在一些实施例中,微生物是糖多孢菌属。
在一些实施例中,本公开教示了一种产生SNP交换微生物菌株文库的方法,其包含以下步骤:a)提供参考微生物菌株和第二微生物菌株,其中第二微生物菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于参考微生物菌株中;b)扰动参考微生物菌株或第二微生物菌株的基因组,由此创建包含多种个别微生物菌株的初始SNP交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自参考微生物菌株与第二微生物菌株之间的多种已鉴别基因变异的单一基因变异。在一些实施例中,微生物菌株是糖多孢菌菌株。
在SNP交换文库的一些实施例中,扰动参考微生物菌株的基因组以添加第二微生物菌株中所发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
在本公开的SNP交换文库方法的一些实施例中,扰动第二微生物菌株的基因组以去除参考微生物菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
在一些实施例中,SNP交换文库中的基因变异将包含参考微生物菌株与第二微生物菌株之间的所有已鉴别基因变异的子集。
在一些实施例中,SNP交换文库的基因变异将包含参考微生物菌株与第二微生物菌株之间经鉴别的所有已鉴别基因变异。
在一些实施例中,本公开教示了一种修复和改良工业微生物菌株的表型性能的方法,其包含以下步骤:a)提供亲代谱系微生物菌株和由其衍生的工业微生物菌株,其中工业微生物菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于亲代谱系微生物菌株中;b)扰动亲代谱系微生物菌株或工业微生物菌株的基因组,由此创建包含多种个别微生物菌株的初始SNP交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自亲代谱系微生物菌株与工业微生物菌株之间的多种已鉴别基因变异的单一基因变异;c)针对优于参考微生物菌株的表型性能改良来筛选和选择初始SNP交换微生物菌株文库中的个别微生物菌株,由此鉴别出赋予所述微生物菌株表型性能改良的独特基因变异;d)提供各自包含独特基因变异组合的后续多种微生物,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异,由此创建后续SNP交换微生物菌株文库;e)针对优于参考微生物菌株的表型性能改良来筛选和选择后续SNP交换微生物菌株文库中的个别微生物菌株,由此鉴别出赋予所述微生物菌株另外表型性能改良的独特基因变异组合;和f)按线性或非线性方式重复步骤d)-e)一次或多次,直到微生物菌株相较于工业微生物菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了新的SNP交换微生物菌株文库,所述文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异是选自前一SNP交换微生物菌株文库的至少两种个别微生物菌株的基因变异组合。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了修复和改良工业微生物菌株的表型性能的方法,其中扰动亲代谱系微生物菌株的基因组以添加工业微生物菌株中所发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了修复和改良工业微生物菌株的表型性能的方法,其中扰动工业微生物菌株的基因组以去除亲代谱系微生物菌株中未发现的已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了一种产生启动子交换微生物菌株文库的方法,所述方法包含以下步骤:a)提供对于基本微生物菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在基本微生物菌株中展现不同表达谱的多个启动子;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始启动子交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于基本微生物菌株为内源的靶基因中的一个的来自启动子梯的启动子之一。在一些实施例中,微生物菌株是糖多孢菌菌株。在一些实施例中,启动子梯包含具有序列SEQ ID No.1到SEQ ID No.69的启动子或其组合。
在一些实施例中,本公开教示了一种进行基因组工程改造以使微生物进化从而获得所期望表型的启动子交换方法,所述方法包含以下步骤:a)提供对于基本微生物菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在基本微生物菌株中展现不同表达谱的多个启动子;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始启动子交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于基本微生物菌株为内源的靶基因中的一个的来自启动子梯的启动子之一;c)针对所期望表型筛选和选择初始启动子交换微生物菌株文库中的个别微生物菌株;d)提供各自包含独特基因变异组合的后续多种微生物,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异,由此创建后续启动子交换微生物菌株文库;e)针对所期望表型筛选和选择后续启动子交换微生物菌株文库中的个别微生物菌株;f)按线性或非线性方式重复步骤d)-e)一次或多次,直到微生物已获得所期望表型为止,其中每次后续迭代创建了新的启动子交换微生物菌株文库,所述文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异是选自前一启动子交换微生物菌株文库中的至少两种个别微生物菌株的基因变异组合。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了一种产生终止子交换微生物菌株文库的方法,所述方法包含以下步骤:a)提供对于基本微生物菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在基本微生物菌株中展现不同表达谱的多种终止子;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始终止子交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含对于基本微生物菌株为内源的靶基因中的一个,所述靶基因中的一个可操作地连接到来自终止子梯的一种或多种终止子。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了一种进行基因组工程改造以使微生物进化从而获得所期望表型的终止子交换方法,所述方法包含以下步骤:a)提供对于基本微生物菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在基本微生物菌株中展现不同表达谱的多种终止子;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始终止子交换微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含对于基本微生物菌株为内源的靶基因中的一个,所述靶基因中的一个可操作地连接到来自终止子梯的一种或多种终止子;c)针对所期望表型筛选和选择初始终止子交换微生物菌株文库中的个别微生物菌株;d)提供各自包含独特基因变异组合的后续多种微生物,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异,由此创建后续终止子交换微生物菌株文库;e)针对所期望表型筛选和选择后续终止子交换微生物菌株文库中的个别微生物菌株;f)按线性或非线性方式重复步骤d)-e)一次或多次,直到微生物已获得所期望表型为止,其中每次后续迭代创建了新的终止子交换微生物菌株文库,所述文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异是选自前一终止子交换微生物菌株文库中的至少两种个别微生物菌株的基因变异组合。在一些实施例中,微生物菌株是糖多孢菌菌株。在一些实施例中,终止子梯包含具有序列SEQ ID No.70到SEQ ID No.80的终止子或其组合。
在一些实施例中,本公开教示了一种进行基因组工程改造而使微生物进化以获得所期望表型的转座子诱变方法,所述方法包含以下步骤:a)提供转座酶和DNA有效载荷序列。在一些实施例中,转座酶在糖多孢菌属中发挥功能。在一些实施例中,转座酶源于EZ-Tn5转座子系统。在一些实施例中,DNA有效载荷序列侧接可被所述转座酶识别的镶嵌元件(ME)。在一些实施例中,DNA有效载荷可以是功能缺失(LoF)转座子或功能获得(GoF)转座子。在一些实施例中,DNA有效载荷包含选择标记。在一些实施例中,DNA有效载荷包含反向选择标记。在一些实施例中,反向选择标记用于促进含有可选标记的DNA有效载荷的环出。在一些实施例中,GoF转座子包含GoF元件。在一些实施例中,GoF转座子包含启动子序列和/或溶解性标签序列。在一些实施例中,所述方法进一步包含b)使转座酶与DNA有效载荷序列组合以形成复合物,和c)将转座酶-DNA有效载荷复合物转化为微生物菌株,从而使得DNA有效载荷序列随机整合于微生物菌株基因组中。包含随机整合的DNA有效载荷的菌株形成初始转座子诱变多样性文库。在一些实施例中,所述方法进一步包含d)针对所期望表型筛选和选择初始转座子诱变多样性文库中的个别微生物菌株。在一些实施例中,所述方法进一步包含e)提供各自包含独特基因变异组合的后续多种微生物,由此创建后续转座子诱变多样性文库,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异。在一些实施例中,所述方法进一步包含f)针对所期望表型筛选和选择后续转座子诱变多样性文库中的个别微生物菌株。在一些实施例中,所述方法进一步包含g)按线性或非线性方式重复步骤e)-f)一次或多次,直到微生物已获得所期望表型为止,其中每次后续迭代创建了新的转座子诱变多样性文库,所述文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异为选自前一转座子诱变多样性文库的至少两种个别微生物菌株的基因变异组合。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了一种产生核糖体结合位点(RBS)交换微生物菌株文库的方法。在一些实施例中,所述方法包含以下步骤:a)提供多种对于基本微生物菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在基本微生物菌株中展现不同表达谱的多个核糖体结合位点;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始RBS微生物菌株文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于基本微生物菌株为内源的靶基因中的一个的来自RBS梯的RBS之一。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了一种进行基因组工程改造而使微生物进化以获得所期望表型的核糖体结合位点(RBS)交换方法,所述方法包含以下步骤:a)提供多种对于基本微生物菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在基本微生物菌株中展现不同表达谱的多个RBS;b)对基本微生物菌株的基因组进行工程改造,由此创建包含多种个别微生物菌株的初始RBS文库,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于基本微生物菌株为内源的靶基因中的一个的来自RBS梯的RBS之一;c)针对所期望表型筛选和选择初始RBS文库中的个别微生物菌株;d)提供各自包含独特基因变异组合的后续多种微生物,所述基因变异选自前一步骤中所筛选的至少两种个别微生物菌株中所存在的基因变异,由此创建后续RBS文库;e)针对所期望表型筛选和选择后续RBS文库中的个别微生物菌株;f)按线性或非线性方式重复步骤d)-e)一次或多次,直到微生物已获得所期望表型为止,其中每次后续迭代创建了新的RBS文库,所述文库包含具有独特基因变异的个别微生物菌株,所述独特基因变异是选自前一RBS文库中的至少两种个别微生物菌株的基因变异组合。在一些实施例中,微生物菌株是糖多孢菌菌株。在一些实施例中,终止子梯包含具有序列SEQ ID No.97到SEQID No.127的终止子或其组合。
在一些实施例中,本公开教示了一种产生抗代谢物/发酵产物抗性文库的方法。在一些实施例中,所述方法包含以下步骤:a)提供参考微生物菌株和第二微生物菌株,其中第二微生物菌株包含多种可鉴别的基因变异,所述基因变异可为任何类型,包括(但不限于)单核苷酸多态性、DNA插入和DNA缺失,所述基因变异不存在于参考微生物菌株中;和b)在由所述微生物产生的一种或多种预先确定的产物存在下选择更多抗性菌株。在一些实施例中,所述方法进一步包含c)分析所选菌株性能(例如,菌株中所产生的一种或多种产物的产量)并通过HTP筛选选择与参考微生物菌株相比具有改良性能的菌株。在一些实施例中,所述方法进一步包含d)鉴别引起改良性能的突变的位置和/或序列。具有经确认的改良性能的这些所选菌株形成初始抗代谢物/发酵产物文库。此类文库包含多种个别微生物菌株,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自多种可鉴别的基因变异的单一基因变异。在一些实施例中,微生物菌株是糖多孢菌菌株。在一些实施例中,由微生物菌株产生的预先确定的产物为参与刺糖菌素合成路径的任何分子或可影响刺糖菌素产生的任何分子。在一些实施例中,所述预先确定的产物包括(但不限于)刺糖菌素A、刺糖菌素B、刺糖菌素C,刺糖菌素D、刺糖菌素E、刺糖菌素F、刺糖菌素G、刺糖菌素H、刺糖菌素I、刺糖菌素J、刺糖菌素K、刺糖菌素L、刺糖菌素M、刺糖菌素N、刺糖菌素O、刺糖菌素P、刺糖菌素Q、刺糖菌素R、刺糖菌素S、刺糖菌素T、刺糖菌素U、刺糖菌素V、刺糖菌素W、刺糖菌素X、刺糖菌素Y、正亮氨酸、正缬氨酸、假糖苷配基(例如,PSA、PSD、PSJ、PSL等,针对不同刺糖菌素化合物)以及α-甲基-甲硫氨酸(aMM)。
在一些实施例中,本公开教示了以迭代方式如下改良候选微生物菌株的设计:(a)访问用训练集填充的预测模型,所述训练集包含(1)代表了相对于一种或多种背景微生物菌株的基因变化的输入以及(2)相应性能度量;(b)将测试输入应用于代表基因变化的预测模型,所述测试输入对应于并入那些基因变化的候选微生物菌株;(c)至少部分地基于预测模型来预测候选微生物菌株的表型性能;(d)至少部分地基于其预测性能来选择候选微生物菌株的第一子集;(e)获得候选微生物菌株的第一子集的实测表型性能;(f)至少部分地基于其实测表型性能来实现候选微生物菌株的第二子集的选择;(g)向预测模型的训练集中添加(1)对应于候选微生物菌株的所选第二子集的输入以及(2)候选微生物菌株的所选第二子集的相应实测性能;以及(h)重复(b)-(g)直到至少一种候选微生物菌株的实测表型性能满足性能度量标准为止。在一些情况下,在测试输入首次应用于预测模型期间,测试输入所代表的基因变化包含相对于一种或多种背景微生物菌株的基因变化;且在测试输入的后续应用期间,测试输入所代表的基因变化包含相对于候选微生物菌株的此前所选第二子集内的候选微生物菌株的基因变化。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,第一子集的选择可以基于上位效应。这可以如下实现:在第一子集的首次选择期间:测定一种或多种背景微生物菌株的性能度量之间的差异程度,所述性能度量响应于代表基因变化的多种相应输入对一种或多种背景微生物菌株的应用;以及至少部分地基于一种或多种背景微生物菌株的性能度量的差异程度来选择至少两种候选微生物菌株纳入第一子集,所述性能度量响应于并入所述至少两种候选微生物菌株中的基因变化的应用。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本发明教示了在候选微生物菌株的迭代改良中应用上位效应,所述方法包含:获得代表实测性能的数据,所述实测性能响应于至少一种背景微生物菌株所产生的相应基因变化;至少部分地基于至少两种基因变化的相应响应性性能度量之间的差异程度来实现至少两种基因变化的选择,其中差异程度是指所述至少两种基因变化通过不同生物学路径影响其相应响应性性能度量的程度;以及设计出相对于背景微生物菌株的基因变化,包括所选基因变化。在一些情况下,供设计至少两种所选基因变化用的背景微生物菌株与所得数据代表实测响应性性能的至少一种背景微生物菌株相同。在一些实施例中,微生物菌株是糖多孢菌菌株。
在一些实施例中,本公开教示了仅利用单一类型的微生物基因文库进行的HTP菌株改良方法。举例来说,在一些实施例中,本公开教示了仅利用SNP交换文库进行的HTP菌株改良方法。在其它实施例中,本公开教示了仅利用PRO交换文库进行的HTP菌株改良方法。在一些实施例中,本公开教示了仅利用STOP交换文库进行的HTP菌株改良方法。在一些实施例中,本公开教示了仅利用起始/终止密码子交换文库进行的HTP菌株改良方法。在一些实施例中,本公开教示了仅利用转座子诱变多样性文库进行的HTP菌株改良方法。在一些实施例中,本公开教示了仅利用核糖体结合位点微生物菌株文库进行的HTP菌株改良方法。在一些实施例中,本公开教示了仅利用抗代谢物选择/发酵产物抗性微生物文库进行的HTP菌株改良方法。在一些实施例中,微生物菌株是糖多孢菌菌株。
在其它实施例中,本公开教示了利用两种或更多种类型的微生物基因文库进行的HTP菌株改良方法。举例来说,在一些实施例中,本公开教示了将SNP交换与PRO交换文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将SNP交换与STOP交换文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将PRO交换与STOP交换文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将SNP交换文库与转座子诱变多样性文库、核糖体结合位点微生物菌株文库和/或抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将PRO交换文库与转座子诱变多样性文库、核糖体结合位点微生物菌株文库和/或抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将STOP交换文库与转座子诱变多样性文库、核糖体结合位点微生物菌株文库和/或抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将终止子交换文库与转座子诱变多样性文库、核糖体结合位点微生物菌株文库和/或抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将转座子诱变多样性文库与核糖体结合位点微生物菌株文库和/或抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。在一些实施例中,本公开教示了将核糖体结合位点微生物菌株文库与抗代谢物选择/发酵产物抗性微生物文库组合的HTP菌株改良方法。
在其它实施例中,本公开教示了利用多种类型的微生物基因文库进行的HTP菌株改良方法。在一些实施例中,将微生物基因文库组合以产生组合突变(例如应用于一种或多种基因的启动子/终止子组合梯)。在又其它实施例中,可以将本公开的HTP菌株改良方法与一种或多种传统的菌株改良方法组合。
在一些实施例中,本公开的HTP菌株改良方法产生改良的宿主细胞。即,本公开教示了改良一种或多种宿主细胞特性的方法。在一些实施例中,改良的宿主细胞特性选自由以下组成的群组:由宿主细胞产生的所关注产物的体积生产率、比生产率、产量或力价。在一些实施例中,改良的宿主细胞特性是体积生产率。在一些实施例中,改良的宿主细胞特性是比生产率。在一些实施例中,改良的宿主细胞特性是产量。
在一些实施例中,本公开的HTP菌株改良方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历HTP菌株改良方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。在一些实施例中,本公开的HTP菌株改良方法选自由以下组成的群组:SNP交换、PRO交换、STOP交换、转座子诱变多样性文库、核糖体结合位点微生物菌株文库、抗代谢物选择/发酵产物抗性微生物文库和其组合。
因此,在一些实施例中,本公开的SNP交换方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历SNP交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。
因此,在一些实施例中,本公开的PRO交换方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历PRO交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。
在一些实施例中,本公开的终止子交换方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历PRO交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。
在一些实施例中,本公开的转座子诱变方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历PRO交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。
在一些实施例中,本公开的使用核糖体结合位点文库的方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历PRO交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。在一些实施例中,本公开的抗代谢物选择/发酵产物抗性方法所产生的宿主细胞在至少一种宿主细胞特性上相对于未经历PRO交换方法的对照宿主细胞展现1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%、150%、200%、250%、300%或更大的改良(例如所关注生物分子的产量或生产率提高X%,涵盖其间的任何范围和子范围)。
本公开还提供一种在两种或更多种微生物菌株中快速合并基因变化和在糖多孢菌属中产生遗传多样性的方法。在一些实施例中,所述方法是基于原生质体融合。在一些实施例中,当微生物菌株中的至少一种含有“标记”突变时,所述方法包含以下步骤:(1)从用于合并的经工程改造的菌株池中选择亲代菌株;(2)由待合并的菌株制备原生质体(例如,去除细胞壁等);和(3)融合所关注菌株;(4)回收细胞;(5)选择携带“标记”突变的细胞;和(6)针对其它亲代菌株出现的突变的存在对生长细胞进行基因分型。任选地,所述方法进一步包含以下步骤:(7)移除质粒形成“标记”突变。在一些实施例中,当微生物菌株均不含“标记”突变时,所述方法包含以下步骤:(1)从用于合并的经工程改造的菌株池中选择亲代菌株;(2)由待合并的菌株制备原生质体(例如,去除细胞壁等);和(3)融合所关注菌株;(4)回收细胞;(5)针对来自第一亲代菌株的突变的存在选择细胞;和(6)针对其它亲代菌株出现的突变的存在选择细胞。在一些实施例中,基于与来自第一亲代菌株和/或其它亲代菌株的突变相关的表型而选择菌株。在一些实施例中,基于基因分型而选择菌株。在一些实施例中,在高通量程序中进行基因分型步骤。
在一些实施例中,在步骤(3)中,为了增加产生适用(新颖)突变体组合的胜率,可使用较少的具有“标记”突变的染色的细胞,由此增加这些“标记”细胞将与携带不同突变的细胞相互作用并融合的几率。在一些实施例中,在步骤(4)中,将细胞涂铺于经渗透稳定的培养基上,而不使用琼脂覆层,其简化程序并使得自动化更容易。渗透稳定剂使得允许可能含有反向选择标记基因(例如,sacB基因)的细胞生长。原生质体化细胞对处理极为敏感并容易被杀伤。这个步骤确保足够细胞被回收。这个步骤运作地越好,就有越多的物质可用于下游分析。在一些实施例中,在步骤(5)中,通过将合适抗生素上覆于生长细胞上来完成所述步骤。在亲代细胞均不携带“标记”突变的情况下,可通过其它手段对菌株进行基因分型以鉴别所关注菌株。这个步骤可以是任选的,但其确保富集最可能已经历细胞融合的细胞。可“标记”多个基因座,并且这样以来,可较快产生所关注组合,但如果希望具有“无痕”菌株,随后可能需要去除多个质粒。在一些实施例中,在步骤(6)中,待基因分型的菌落数取决于交叉复杂性以及选择方案。在一些实施例中,步骤(7)是任选的并建议用于另外校验或客户端递送。在一些实施例中,在菌株的工程改造循环结束时,需要去除所有质粒残余物。进行其的时间和频率由用户判断。在一些实施例中,可反向选择的sacB基因的存在使这个步骤较为简单。在一些实施例中,染色中的至少一种具有“标记”突变。在一些实施例中,在单一合并步骤期间融合的菌株数可为两种或更多种,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500或更多种。在一些实施例中,用于融合的菌株中的一种或多种可通过所关注基因座处的选择标记来标注。
本公开还提供报告蛋白和供用于糖多孢菌属中的相关分析。在一些实施例中,报告蛋白选自由以下组成的群组:Dasher GFP(SEQ ID No.81)、Paprika RFP(SEQ ID No.82)和酶,β-葡糖醛酸酶(gusA)(SEQ ID No.83)。在一些实施例中,编码这些报告基因的核苷酸序列针对大肠杆菌或糖多孢菌属经密码子优化。在一些实施例中,本公开的荧光蛋白具有不与糖多孢菌属中所观察到的内源荧光的光谱重叠的光谱。在一些实施例中,报告蛋白用于测定糖多孢菌属中所关注基因的活性。在一些实施例中,报告蛋白用于测定糖多孢菌属中所关注启动子序列的强度。此类启动子可以是天然的、合成的或其组合。天然启动子对于糖多孢菌属可为原生的,或对于糖多孢菌属可为异源的。
在一些实施例中,报告蛋白用于测定糖多孢菌属中所关注终止序列的强度。在一些实施例中,报告蛋白用于测定糖多孢菌属中所关注起始密码子或终止密码子的强度。在一些实施例中,报告蛋白用于测定糖多孢菌属中所关注核糖体结合位点序列的强度。在一些实施例中,报告蛋白用作确定序列是否已从糖多孢菌属的基因组环出的标记。
本公开还提供用于在糖多孢菌属中供插入基因元件的中性整合位点(NIS)。这些中性整合位点为其中个别基因或多基因盒可稳定并高效地整合于糖多孢菌属菌株的基因组中的基因座。将序列整合于这些位点中对菌株的生长没有影响或影响有限。在一些实施例中,中性整合位点选自由具有序列SEQ ID No.132到SEQ ID No.142的基因座组成的群组。在一些实施例中,独特基因序列(即水印)可以插入到NIS中以标记菌株或谱系(例如,出于专有原因)。
在一些实施例中,将一个或多个基因元件插入到糖多孢菌属的本文所述的单一中性整合位点中。在一些实施例中,将一个或多个基因元件插入到糖多孢菌属的本文所述的两个或更多个中性整合位点中,诸如2、3、4、5、6、7、8、9、10或11个中性整合位点。在一些实施例中,具有插入到一个或多个中性整合位点中的一个或多个基因元件的糖多孢菌属菌株与不具有插入的参考菌株生长相当。在一些实施例中,与不具有插入的参考菌株相比,具有插入到一个或多个中性整合位点中的一个或多个基因元件的糖多孢菌属菌株具有改良性能(例如,一个或多个所关注分子(如刺糖菌素)的改良产量)。在一些实施例中,与参考菌株相比,具有插入到一个或多个中性整合位点中的一个或多个基因元件的糖多孢菌属菌株形成多样性文库,其可进一步与本公开中所述的其它菌株文库组合以形成并选择具有改良性能的新菌株。在一些实施例中,具有插入到一个或多个中性整合位点中的一个或多个基因元件的糖多孢菌属菌株可进一步诱变并针对具有所需表型的另外新菌株进行选择。
本公开还提供将遗传物质从供体微生物细胞转移到糖多孢菌微生物的受体细胞的方法。在一些实施例中,其中所述方法包含以下步骤:(1)将受体细胞继代培养到指数中期(任选的);(2)将供体细胞继代培养到指数中期(任选的);(3)合并供体和受体细胞;(4)将供体和受体细胞混合物涂铺于接合培养基上;(5)培育板以使细胞接合;(6)施加针对供体细胞的抗生素选择;(7)施加针对未整合的受体细胞的抗生素选择;和(8)进一步培育板以使整合受体细胞生长。在一些实施例中,供体微生物细胞是大肠杆菌细胞。在一些实施例中,受体微生物细胞是糖多孢菌属细胞,如刺糖多孢菌。
在一些实施例中,利用以下条件中的至少两个、三个、四个、五个、六个、七个或更多个:(1)洗涤受体细胞;(2)在约30℃的温度下接合供体细胞和受体细胞;(3)在接合之前,将受体细胞继代培养至少约48小时;(4)用于接合的供体细胞:受体细胞的比率是约1:0.6到1:1.0;(5)将供体细胞和受体细胞混合之后约15至24小时,将用于针对供体细胞的选择的抗生素药物递送到混合物;(6)将供体细胞和受体细胞混合之后约40至48小时,将用于针对受体细胞的选择的抗生素药物递送到混合物;(7)将涂铺有供体和受体细胞混合物的接合培养基干燥至少约3小时到10小时;(8)接合培养基包含至少约3g/L葡萄糖;(9)供体细胞的浓度为约OD600=0.4;和(10)受体细胞的浓度为约OD540=13.0。
在一些实施例中,用于针对供体细胞的选择的抗生素药物是供体细胞对其敏感,而受体细胞对其具有抗性的药物。在一些实施例中,用于针对受体细胞的选择的抗生素药物是供体细胞对其具有抗性,而受体细胞对其敏感的药物。
在一些实施例中,用于针对受体细胞的选择的抗生素药物是萘啶酸,并且浓度是约50到约150μg/ml。在一些实施例中,用于针对供体细胞的选择的抗生素药物是奇霉素,并且浓度是约10到约300μg/ml。
在一些实施例中,用于针对供体细胞的选择的抗生素药物是萘啶酸,并且浓度是约100μg/ml。
在一些实施例中,用于针对受体细胞的选择的抗生素药物是安普霉素,并且浓度是约50到约250μg/ml。
在一些实施例中,用于针对受体细胞的选择的抗生素药物是安普霉素,并且浓度是约100μg/ml。
在一些实施例中,所述方法以高通量过程执行。在一些实施例中,所述方法在48孔Q型托盘上执行。
在一些实施例中,高通量过程是自动化的。
在一些实施例中,供体细胞和受体细胞的混合物是液体混合物,并利用摇摆运动将足够体积的液体混合物涂铺于培养基上,其中所述液体混合物分散在培养基的整个区域上。
在一些实施例中,所述方法包含通过用酵母针进行菌落挑选来转移接合后体,以供用供体细胞所提供的整合DNA进行后续受体细胞接种来转移接合后体的自动化过程。
在一些实施例中,菌落挑选以升沉运动或搅拌运动执行。
在一些实施例中,接合培养基是包含约3至10g/L葡萄糖的改良型ISP4培养基。
在一些实施例中,混合物中的供体细胞或受体细胞的总数是约5×106到约9×106。在一些实施例中,用于接合的供体细胞的浓度是约OD 0.1到约OD 0.6。
在一些实施例中,用以下条件中的至少两个、三个、四个、五个、六个或七个来执行所述方法:(1)在接合之前,洗涤受体细胞;(2)在约30℃的温度下接合供体细胞和受体细胞;(3)在接合之前,将受体细胞继代培养至少约48小时;(4)用于接合的供体细胞:受体细胞比率是约1:0.8;(5)将供体细胞和受体细胞混合之后约20小时,将用于针对供体细胞的选择的抗生素药物递送到混合物;(6)混合物中供体细胞的量或受体细胞的量是约7×106;和(7)接合培养基包含约6g/L葡萄糖。
本公开还提供在糖多孢菌菌株中进行靶基因组编辑,产生在靶基因组基因座处含有基因变异的无痕糖多孢菌菌株的方法。在一些实施例中,所述方法包含a)将质粒引入糖多孢菌菌株中,所述质粒包含:(i)选择标记、(ii)反向选择标记、(iii)含有待整合于靶基因座处的糖多孢菌基因组中的基因变异的DNA片段,所述DNA片段具有侧接所需基因变异的靶基因组基因座的同源臂和(iv)质粒骨架序列。
在一些实施例中,在糖多孢菌菌株中进行靶基因组编辑的方法进一步包含b)基于基因组中存在选择标记选择已经历初始同源重组并具有整合于靶基因座中的基因变异的糖多孢菌菌株;和c)基于不存在反向选择标记选择具有整合于靶基因座中的基因变异,但经历使质粒骨架环出的另外的同源重组的糖多孢菌菌株。在一些实施例中,选择步骤b)和选择步骤c)同时执行。在一些实施例中,选择步骤b)和选择步骤c)依次执行。归因于选择,含有基因变异的DNA片段整合于所选糖多孢菌菌株的靶基因座处的糖多孢菌基因组中,而选择标记、反向选择标记和/或质粒骨架序列从所选糖多孢菌菌株的基因组环出。
靶基因组基因座可包含糖多孢菌基因组的任何区域。在一些实施例中,靶基因组基因座包含不含编码DNA模组的重复区段的基因组区域。
在一些实施例中,用于靶基因组编辑的质粒不包含温度敏感型复制子。
在一些实施例中,用于靶基因组编辑的质粒不包含复制起点。
在一些实施例中,在不复制整合质粒的情况下执行选择步骤(c)。
在一些实施例中,质粒是单一同源重组载体。在一些实施例中,质粒是双重同源重组载体。
在一些实施例中,反向选择标记是sacB基因或pheS基因。
在一些实施例中,sacB基因或pheS基因针对刺糖多孢菌经密码子优化。
在一些实施例中,sacB基因包含序列SEQ ID No.146。在一些实施例中,pheS基因包含序列SEQ ID No.147或SEQ ID No.148。
在一些实施例中,通过转化将质粒引入糖多孢菌菌株中。
在一些实施例中,所述转化是原生质体转化。
在一些实施例中,通过接合将质粒引入糖多孢菌菌株中,其中糖多孢菌菌株是受体细胞,并且包含质粒的供体细胞将质粒转移到糖多孢菌菌株。在一些实施例中,接合是基于包含质粒的大肠杆菌供体细胞。在一些实施例中,靶基因座是糖多孢菌菌株中与所关注化合物的产生相关的基因座。在一些实施例中,所关注化合物是刺糖菌素。
所得糖多孢菌菌株具有经编辑的基因组,可具有一个或多个所需性状,如所关注化合物之改良产量。在一些实施例中,与不具有基因组编辑的对照菌株相比,所得糖多孢菌菌株具有增加的所关注化合物的产生。
在一些实施例中,所述方法以高通量程序执行。
所述上述高通量(HTP)方法可涉及利用自动化设备(例如液体处置机或板处置机)的至少一个零件执行所述方法的至少一个步骤。本公开的HTP方法提供基因组工程改造微生物(例如,糖多孢菌物种)的较快和劳动密集度不高的方法,因为所述方法可以较少人力资源大规模进行。例如,在一些实施例中,本公开的任何方法在48孔板、96孔板、192孔板、384孔板等上执行,以使得同时(而非逐个地)产生和/或测试多种菌株。与不使用自动化设备的其它方法相比,所述方法节省大量时间。在一些实施例中,当在本公开方法中使用相同或更少人力资源时,与不使用自动化设备的其它方法相比,所述方法快约10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍、150倍、200倍、250倍、300倍或更多倍。
附图说明
图1描绘了用于增加多样性池中的变异的本公开DNA重组方法。DNA区段(如来自相关物种的基因组区域)可以通过物理或酶/化学方式切割。使所切的DNA区域解链并允许其再粘接,以便重叠的基因区域引发聚合酶延伸反应。进行后续的解链/延伸反应,直到产物再组装成嵌合DNA为止,所述嵌合DNA包含来自一种或多种起始序列的元件。
图2概述了用于产生新宿主生物体的本公开方法,所述新宿主生物体具有所选序列修饰(例如交换的100个SNP)。简单来说,所述方法包含(1)设计出所期望的DNA插入序列且通过在组装反应中合并一个或多个合成寡核苷酸来产生所述DNA插入序列;(2)将DNA插入序列克隆到转化质粒中;(3)将完成的质粒转移到所期望的生产菌株中,其在生产菌株中整合到宿主菌株基因组中;以及(4)选择标记和其它非所需DNA元件环出宿主菌株。每个DNA组装步骤可以涉及另外的质量控制(QC)步骤,如将质粒克隆到大肠杆菌细菌中用于扩增和测序。
图3描绘了本公开的转化质粒的组装和其在宿主生物体中的整合。插入DNA是通过在组装反应中合并一个或多个合成寡核苷酸来产生。含有所期望序列的DNA插入序列侧接与基因组的目标区域同源的DNA区域。这些同源区域促进了基因组整合,并且一经整合,则形成顺向重复区域,所述顺向重复区域是为了在后续步骤中使载体骨架DNA环出而设计。所组装的质粒含有插入DNA且任选地含有一个或多个选择标记。
图4描绘了使DNA的选定区域从宿主菌株中环出的程序。所插入DNA和宿主基因组的直接重复区域可以在重组事件中“环出”。选择标记反向选择的细胞含有顺向重复区域所侧接的环DNA的缺失。
图5描绘了本公开的菌株改良方法的一个实施例。测试含有基因修饰(基因设计)的宿主菌株序列在不同菌株背景下的菌株性能改良(菌株建构)。分析(命中ID和分析)展现有益突变的菌株且将数据存储于文库中用于进一步分析(例如SNP交换文库、PRO交换文库以及其组合等等)。本公开的选择规则基于来自一个或多个文库的元件组合在另外迭代分析中的预测结果来产生新宿主菌株序列的建议。
图6A到图6B描绘了本公开的一个实施例中的DNA组装、转化和菌株筛选步骤。图6A描绘了建构DNA片段、将所述DNA片段克隆到载体中、使所述载体在宿主菌株中转化以及通过反向选择来使选择序列环出的步骤。图6B描绘了用于高通量培养、筛选和评估所选宿主菌株的步骤。此图还描绘了在培养槽中培养、筛选和评估所选菌株的任选步骤。
图7描绘了本公开的自动化系统的一个实施例。本公开教示了自动化机器人系统的使用,所述机器人系统具有能够对宿主生物体进行克隆、转化、培养、筛选和/或测序的各种模块。
图8描绘了本公开的宿主菌株改良程序的一个实施例的概述。
图9是刺糖多孢菌的基因组的图示,其包含约840万个碱基对(获自盖姆(Galm)和斯帕克斯(Sparks),“天然产物衍生的杀虫剂:乙基多杀菌素的发现和开发(Naturalproduct derived insecticides:discovery and development of spinetoram)”工业微生物与生物技术杂志(J.Ind Microbiol Biotechnol.)2015,DOI 10.1007/s10295-015-1710-x),所述参考文献以全文引用的方式并入用于所有目的。
图10描绘棒状杆菌中的本公开的转化实验。将0.5kb到5.0kb范围内的DNA插入序列对准插入微生物菌株基因组的不同区域(显示为相对位置1-24)中。浅颜色表示成功整合,而较深颜色表示插入失败。
图11描绘了根据本公开方法的首轮SNP交换实验。(1)将来自C的所有SNP个别地且/或组合地克隆到基本A菌株中(A“向上波动”到C)。(2)来自C的所有SNP个别地且/或组合地从商业菌株C中去除(C“向下波动”到A)。(3)将来自B的所有SNP个别地且/或组合地克隆到基本A菌株中(A向上波动到B)。(4)来自B的所有SNP个别地且/或组合地从商业菌株B中去除(B向下波动到A)。(5)将C独有的所有SNP个别地且/或组合地克隆到商业B菌株中(B向上波动到C)。(6)将C独有的所有SNP个别地且/或组合地从商业菌株C中去除(C向下波动到B)。
图12A到图12D说明了参与刺糖菌素合成的示例性基因目标,其可用于启动子交换方法。图12A是刺糖菌素生物合成基因簇的图示,其包括存在于其它基因组基因座处的基因。图12B是刺糖菌素聚酮骨架的生物合成组装。图12C表示形成最终刺糖菌素A和D分子的交联和裁剪反应。图12D表示伴随之后经由3'-O-乙基化和5,6-双键还原,合成转化成乙基多杀菌素(spinetoram)来基于发酵制造刺糖菌素J。所有图式均获自盖姆(Galm)和斯帕克斯(Sparks),2015。
图13说明了针对已鉴别基因目标用于执行启动子交换方法的示例性启动子文库。PRO交换(即,启动子交换)方法中所用的启动子为见于实例4和表1中的启动子。路径目标的非限制性实例描绘在左框中,并且启动子梯的成员的不同表达强度描绘在中框中。如可以看到,启动子提供由强到弱范围内的表达强度“梯”。
图14说明了启动子交换基因结果取决于所靶向的特定基因。
图15描绘了示例性HTP启动子交换数据,其显示了在接种培养基(非生产条件_呈现为相对于PermE*(一种先前表征于刺糖多孢菌中的非原生启动子)的倍数变化)中生长48小时的启动子菌株的平均荧光。相对强度跨越大约50倍的动态范围。梯中五个最强启动子中有三种原生启动子,并且P1比PermE*强大约5倍并比次强启动子强~2倍。此外,合成启动子的相对强度与关于链霉菌的文献中所报告的结果相似。A和B表示不同的刺糖多孢菌菌株。X轴表示不同启动子,并且Y轴包括如通过荧光所测量的每个启动子的相对强度。可利用所教示的PRO交换分子工具来优化和/或增加任何所关注化合物的产生。所属领域的技术人员会了解如何选择编码所期望化合物产量的靶基因且接着使用所教示的PRO交换程序。所属领域的技术人员容易了解,本文所教示的举例说明赖氨酸产量增加的证明数据以及本申请中所呈现的详细公开内容使得PRO交换分子工具在HTP基因组工程学中能够成为广泛适用的进步。
图16是齐默尔根96孔板模型(生产相关条件)中所生长的启动子梯菌株(菌株A和菌株B)中所测量的对数变换归一化荧光的汇总。这些菌株具有整合于主基因组中的不同启动子>GFP表达盒。阴影框指示在第一轮启动子评估期间被评估的并在随后的实验中表示内部对照的菌株。较低杠指示平均荧光基线。
图17描绘了用表8中所述的启动子P21和P1工程改造的菌株中的改良刺糖菌素J+L效价。确切地说,7000225635在菌株_B_3g05097中含有P1启动子;7000206640在菌株_B_3g00920中含有P21启动子;7000206509在菌株_B_3g02509中含有P1启动子;7000206745在菌株_B_3g07456中含有P21启动子;7000206752在菌株_B_3g07766中含有P21启动子;并且7000235481在菌株_B_3g04679中含有P21启动子。每个菌株ID表示指定基因处的启动子交换(伴随以上所示的基因型),并且因此每个菌株ID是指特定菌株基因型。每个点表示高通量分析中所测试的菌株的孔或样品(即,其为同一菌株上所收集的所有个别数据点)。当在刺糖菌素产量的高通量分析中进行测试时,所选启动子交换菌株相对于亲代菌株(700153593)显示有所改良。通过使用接合以引入含有可选标记、启动子-基因对和待在中性位点整合于基因组中的同源区的质粒来工程改造菌株(对于所述方法的更多详情,参见本公开中的可反向选择标记章节)。
图18说明了相对菌株性能在考虑中的输入数据中的分布的实例,其在棒状杆菌中通过使用本公开中所述的方法进行。然而,相似程序已针对糖多孢菌进行定制并由本发明人成功执行。相对性能为零表示经工程改造的菌株与板内基本菌株的性能同样好。本文所述的方法经设计可鉴别性能可能明显高于零的菌株。
图19描绘了本公开的一个实施例的DNA组装和转化步骤。流程图描绘了建构DNA片段、将所述DNA片段克隆到载体中、使所述载体在宿主菌株中转化以及通过反向选择来使选择序列环出的步骤。
图20描绘了用于高通量培养、筛选和评估所选宿主菌株的步骤。此图还描绘了在培养槽中培养、筛选和评估所选菌株的任选步骤。
图21描绘了说明性启动子的表达谱,其展现出根据本公开的启动子梯的调控表达范围。启动子A表达在细菌培养物的停滞期达到峰值,而启动子B和C分别在指数期和稳定期达到峰值。
图22描绘了说明性启动子的表达谱,其展现出根据本公开的启动子梯的调控表达范围。启动子A表达在添加所选底物后立即达到峰值,但随着底物浓度降低而快速返回到不可检测的水平。启动子B表达在添加所选底物后立即达到峰值且缓慢降回到不可检测的水平且底物出现相应的减少。启动子C表达在所选底物添加后达到峰值,并且在整个培养期间保持高度表达,即使在底物已消耗之后。
图23描绘了说明性启动子的表达谱,其展现出根据本公开的启动子梯的组成性表达水平的范围。启动子A展现了最低表达,继之分别为启动子B和C的表达水平增加。
图24图示了用于改良菌株的本公开LIMS系统的一个实施例。
图25图示了本公开LIMS系统的实施例的云计算实施方案。
图26描绘了本公开的迭代预测菌株设计工作流程的一个实施例。
图27图示了根据本公开的实施例的计算机系统的一个实施例。
图28描绘了根据本公开的一个实施例的与DNA组装相关的工作流程。这一流程分成4个阶段:部件产生、质粒组装、质粒QC,和质粒制备用于转化。在部件产生期间,从寡核苷酸测序供应商订购实验室信息管理系统(Laboratory Information Management System,LIMS)所设计的寡核苷酸,并且用于在宿主生物体中通过PCR扩增目标序列。对这些PCR部件进行清洁以去除污染物且利用片段分析、通过片段尺寸观察值与理论值的比较进行的计算机模拟品质控制和DNA量化来评估成功性。使所述部件连同组装载体一起在酵母中转化且通过同源重组组装成质粒。从酵母中分离出所组装的质粒且在大肠杆菌中转化用于后续组装品质控制和扩增。在质粒组装品质控制期间,分离出每种质粒的若干个复制品,使用滚环扩增(RCA)进行扩增,并且利用酶消化和片段分析来评估正确组装。对在QC流程期间所鉴别的正确组装的质粒进行命中挑选以产生永久性储备液且对质粒DNA进行萃取且量化,随后在目标宿主生物体中转化。
图29是流程图,其根据本公开实施例说明在选择用于设计微生物菌株的突变时考虑上位效应。
图30说明了用于经由原生质体融合合并两种糖多孢菌属菌株的方案的一个实例。
图31A到图31D显示dasherGFP和paprikaRFP荧光光谱(分别呈图31A和图31B)和GFP和RFP菌株的混合(1:1)培养物的相对荧光(分别呈图31C和图31D)的示意图。dasherGFP的荧光激发和发射光谱不同于paprikaRFP,使得GFP或RFP荧光可由均表达两个报告子的样品(底图区,混合物(1:1))测量,而不会受到来自另一报告子的显著干扰。左下:ermE*>RFP、ermE*>GFP菌株和两种菌株的1:1混合物的相对GFP荧光。在RFP菌株中,相对于由ermE*>GFP菌株测量的可检测荧光,GFP通道中存在极少甚至没有可检测荧光,并且混合培养物产生(如所预期)呈单独的GFP菌株大约1/2的信号。右下:类似地,当使用RFP荧光的最佳参数(右上)时,针对ermE*>RFP菌株检测到强荧光信号,但针对ermE*>GFP菌株和1:1混合物,观察到极少甚至没有信号,同样,产生的荧光信号呈ermE*>RFP菌株的荧光信号的大约1/2。因此,荧光报告子DasherGFP和PaprikaRFP在刺糖多孢菌中起作用并具有不同荧光标志。DasherGFP的荧光激发和发射光谱不同于PaprikaRFP,使得GFP或RFP荧光可由均表达两个报告子的样品(底图区,混合物(1:1))测量,而不会受到来自另一报告子的显著干扰。
图32显示了示意图,其描绘了功能性转录终止子和无终止子(NoT)对照的双顺反子、双报告子测试盒和预期相对荧光的设计。终止子测试盒由串联排列的两种荧光、报告蛋白-dasherGFP(GFP)和paprikaRFP(RFP)组成。这些报告子的双顺反子表达由ermE*启动子驱动。下游报告子(RFP)的表达由上游核糖体结合位点(RBS)实现。当存在非功能性终止序列时,RFP和GFP的表达与当不存在终止子时(NoT对照)所观察到的表达相似。然而,当功能性转录终止子插入GFP和RFP基因之间时,RFP的表达衰减。相对于归一化之后的GFP(使用NoT对照的荧光),衰减百分比指示终止序列的强度。
图33显示终止子功能性测试的结果。杠表示在液体培养物中生长48小时之后,刺糖多孢菌终止子(T1-T12)或无终止子(NoT)盒菌株的相对GFP或RFP荧光的平均值(+1个标准差)。在96孔分析板中在帝肯Infinite M1000 Pro(生命科学)板读取器上测量复制培养物的荧光。荧光归一化到OD(OD540)并报告为相对荧光(作为NoT对照培养物的GFP或RFP荧光的比例)。相对于NoT,GFP荧光减弱反映终止序列对上游基因(dasherGFP)的表达的影响,可能通过影响mRNA的稳定性。菌株中相对于GFP,RFP荧光减弱反映终止子的强度-其終止转录的能力。在所测试序列中,T1表现最好,引起相对于GFP,RFP的表达减少大约86%,而GFP表达减少<30%。相比之下,T2、T4和T8呈现为没有转录终止子的功能性,因为其未能减弱RFP的表达。杠表示平均值+/-1SD。
图34显示针对终止子中的每一个和两种菌株背景,相对归一化GFP对相对归一化RFP荧光的相关性绘图。所述虚线呈现1:1相关性。线下的点指示其中GFP>RFP(指示RFP荧光减弱)的菌株。线下的距离(红色阴影)指示相对终止子强度。密集省略号指示90%置信区间。这一绘图实现观测相对终止子强度。
图35说明gusA报告子在刺糖多孢菌中起作用。杠指示在培育来自两种不同亲代菌株(A和B)中产生的ermE*>gusA菌株的无细胞溶解产物之后,平均gusA活性(+/-1个标准差),如由405nm下的吸光度指示。405nm下的吸光度与由作用于4-硝基苯基β-D-葡萄糖苷酸底物的gusA的酶促活性产生的黄色成比例。
图36示出刺糖多孢菌的内源荧光。所述图式呈现用PBS洗涤之后,通过培养物刺糖多孢菌细胞的荧光扫描测量的相对荧光。曲线表示350到690nm以20nm为间隔的由激发产生的荧光。荧光在500nm以下相对较强,但随增加的激发波长而降低。在与DasherGFP和PaprikaRFP相关的范围内,内源荧光极小。对于这些实验,在505nm下激发DasherGFP,并在525-545nm之间采集发射。这与~510nm处开始的曲线最相当。在564nm下激发PaprikaRFP,并在585-610nm之间采集荧光。在这一范围内几乎未观察到内源荧光。
图37示出pCM32、pSE101和pSE211的质粒图谱。(1)pCM32的质粒图谱(左)和含有pCM32切除酶(xis)、整合酶(int)和附着位点(attP)的接合质粒。加框部分指示克隆于接合载体中以测试整合的质粒区域(陈(Chen)等人,微生物学和生物技术(AppliedMicrobiology and Biotechnology).PMID 26260388DOI:10.1007/s00253-015-6871-z);(2)红色糖多孢菌质粒pSE101的线性图。整合酶(int)和附着位点(attP)显示在所述图的左端(提伯力(Te Poele)等人,(2008)放线菌整合性和接合性元件(Actinomyceteintegrative and conjugative elements)安东尼·范·列文虎克(Antonie VanLeeuwenhoek)94,127-143.);(3)红色糖多孢菌质粒pSE211的线性图。整合酶(int)和附着位点(attP)显示在所述图的左端(提伯力等人)。
图38显示针对刺糖多孢菌基因组的pCM32附着位点的核苷酸blast(Blastn)的结果。刺糖多孢菌中发现大于99%一致性(149/150bp)的位点。
图39显示针对刺糖多孢菌基因组的pSE101附着位点的核苷酸blast(Blastn)的结果。刺糖多孢菌中发现在核心76核苷酸中具有大于94%一致性(104/111bp)和100%一致性的位点。
图40显示针对刺糖多孢菌基因组的pSE211附着位点的核苷酸blast(Blastn)的结果。刺糖多孢菌中发现在核心76核苷酸中具有大于88%一致性(122/138bp)和100%一致性的位点。
图41A显示红色糖多孢菌复制质粒(AICE)pSE101和pSE211的线性图(获自提伯力等人,(2008)放线菌整合性和接合性元件东尼·范·列文虎克94,127-143.),其为刺糖多孢菌中所用的自复制质粒。具有对角线的箭头表示认为参与DNA复制的基因。图41B显示含有红色糖多孢菌染色体复制起点的示例性复制质粒的示意图。为了测试红色糖多孢菌复制起点是否可在刺糖多孢菌中维持质粒复制,红色糖多孢菌复制起点将克隆于含有卡那霉素抗性基因、大肠杆菌复制起点(pBR322)和转移起点(oriT)的质粒中以实现通过接合递送质粒。
图42显示质粒设计、用于评估功能性的分析和RBS文库筛选结果的示意图。设计和构建32种整合质粒(31种含有RBS和无RBS对照)。通过将每个RBS无痕克隆于ermE*启动子和基因编码果聚糖蔗糖酶(sacB)之间的刺糖多孢菌整合骨架中来构建其。使所得菌株在液体培养物中生长48小时并将连续稀释液涂铺于TSA和TSA+5%蔗糖全向托盘(Omni Tray)上。如果RBS具有功能,那么当生长在蔗糖上时,sacB表达,产生毒性(不存在生长)。通过比较含有RBS的菌株和阳性(含有sacB RBS的菌株)和阴性(无RBS)对照的生长,能够测定RBS的相对强度。使用这一分析,鉴别出19个功能,16个“功能性”和3个“功能性较低”RBS。这些分析的结果示于下图43A到图43E中。
图43A到图43E描绘蔗糖敏感性分析的RBS功能分析结果-比较刺糖多孢菌RBS环入菌株在TSA+Kan100对TSA+Kan100+5%蔗糖上的生长。
图44描绘了用于刺糖多孢菌中的转座子诱变的质粒的线性图。显示功能缺失(LoF)转座子、功能获得(GoF)转座子和功能获得(GoF)可再循环转座子。
图45描绘了在用于鉴别可能存在的中性整合位点的整个刺糖多孢菌基因组中的平均基因表达的热图的区段的实例。
图46描绘了显示产物(例如,刺糖菌素J/L)的存在以槽中浓度的1/100抑制刺糖多孢菌生长的实例。
图47描绘了在刺糖菌素J/L存在下,菌株的选择产生比在刺糖菌素J/L存在下比亲代生长得要好的分离物。
图48A和图48B显示在HTP板发酵模型中比亲代性能要好的产生刺糖菌素J/L(图48A)和aMM(图48B)的菌株的选择。
图49A到图49C描绘了使用sacB或pheS作为反向选择标记产生无痕刺糖多孢菌菌株的过程。图49A显示使用同源重组将质粒引入刺糖多孢菌基因组中。图49B显示使用正向选择选择单交叉整合事件。图49C显示使用负向选择获得已再组合而缺失质粒骨架的菌株,由此产生无痕经工程改造的菌株。
图50论证sacB将刺糖多孢菌的敏感性赋予各别反向选择剂蔗糖。在5%下测试具有或不含sacB基因的菌株的蔗糖敏感性。在六个复制物中将培养物系列稀释液点样于TSA/Kan100和TSA或TSA/含有5%蔗糖的Kan100上。其引起在含有5%蔗糖的选择性培养基上表达所述基因的菌株的限制性生长。图式中的“*”指示不加选择继代培养这一菌株。
图51论证了pheS将刺糖多孢菌的敏感性赋予菌株A中的各别反向选择剂4CP。在2g/L下测试菌株A/PheS(SS)和菌株A/Phe(SE)的4CP敏感性。在六个复制物中将培养物系列稀释液点样于TSA/Kan100和TSA/含有4CP的Kan100上。SE表示来自红色糖多孢菌的pheS基因,并且SS表示来自刺糖多孢菌的pheS基因。两周培育之后,表达PheS的菌株A衍生物在TSA/Kan100-4CP上生长受抑制但在TSA/Kan100上不受影响。这表明PheS(SS)和PheS(SE)具有充当刺糖多孢菌中的反向选择标记的潜力。
图52显示使用sacB作为反向选择标记的HTP中经工程改造的菌株的菌株QC结果。制得62种经工程改造的菌株A和14种经工程改造的菌株B。
图53棒状杆菌中进行的使用相关度计算的相似度矩阵。然而,相似程序已针对糖多孢菌进行定制并由本发明人成功执行。所述矩阵图示了SNP变异体之间的功能相似度。功能相似度低的SNP的合并预期具有改良菌株性能的较高可能性,而较高功能相似度的SNP的合并则相反。
图54A到图54B描绘棒状杆菌中进行的上位定位实验的结果。然而,相似程序已针对糖多孢菌进行定制并由本发明人成功执行。功能相似度低的SNP与PRO交换的组合使得菌株性能改良。图54A描绘根据所有SNP/PRO交换的功能相似度聚类的树状图。图54B描绘如通过产物产量所测量的所合并SNP的宿主菌株性能。较大的聚类距离与宿主菌株的合并性能的改良相关。
图55显示使用实验设计(DOE)方法的被视为改良接合效率的因素。
图56A到图56B显示HTP形式中的大肠杆菌S17+SS015供体细胞的生长(图56A),以及使用HTP形式中的大肠杆菌S17+SS015供体细胞的接合实验的结果(图56B)。
图57显示使用HTP接合方案中所述的检测的Qpix参数鉴别的菌落。
图58显示在以HTP形式生长之后,从斑块接种的刺糖多孢菌培养物的生长。
图59显示经由基于DOE的优化过程完成的接合实验的结果。
图60显示根据JMP分配建模分析,经测定涉及接合效率的条件。
图61描绘用如本文所述的SNP交换工程改造的菌株中的改良刺糖菌素J+L效价。通过与早期(诱变前)菌株谱系相比,鉴别晚期菌株中所存在的SNP并从晚期菌株(7000153593)去除这些SNP来工程改造SNP交换(SNPSWP)菌株。当在针对刺糖菌素产量的高通量分析中测试时,所选SNPSWP菌株显示相对于亲代菌株(7000153593)的改良。在这种情况下,7000153593是“晚期菌株”和所得SNPSWP的亲代菌株。“晚期菌株”是因SNP交换的成分依赖于早期和晚期谱系而提及。
图62描绘了经如本文所述的终止子工程改造的菌株中的改良刺糖菌素J+L效价。通过将表9中所列的约25bp的终止子引入多种基因目标的前方来工程改造终止子插入菌株。当在针对刺糖菌素产量的高通量分析中测试时,所选终止子插入菌株显示相对于亲代菌株(7000153593)的改良。
图63描绘了经如本文所述的RBS序列工程改造的菌株中的改良刺糖菌素J+L效价。通过将表11中所列的约0到15bp RBS引入核心生物合成基因目标的前方来工程改造RBS交换(RBSSWP)菌株。当在针对刺糖菌素产量的高通量分析中测试时,所选RBSSWP菌株显示相对于亲代菌株(7000153593)的改良。
图64A到图64C描绘了克隆多个骨架以包括不同选择标记和基因元件构形以控制表达(终止子和启动子),其可改变不同菌株背景下的菌株工程改造功效。在某些情况下,骨架在不同整合位点处克隆有同源臂以测试基因组位点对骨架功效的影响,启动子pD1-7、Perm2和Perm8和终止子A_T是先前表征启动子;这一工作中列举的其它基因元件。
图65描绘了用于评估应用终止子文库来敲落(减弱或防止)基因表达的表达盒。
图66A到图66B描绘了在启动子和GFP的编码序列之间插入终止子会引起GFP表达(荧光)减弱。显示具有终止子敲落GFP测试盒的基因组整合的菌株的归一化GFP荧光(平均值+/-95%置信区间)。图66A显示具有插入在强启动子(SEQ ID No.25)和GFP之间的T1、T3、T5、T11和T12(SEQ ID No.70、72、74、79和80)的菌株的表达。“无”(左列)指示无终止子对照菌株。图66B具有插入在中强启动子(SEQ ID No.33)和GFP之间的T1、T3、T5和T12(SEQ IDNo.70、72、74和80)的菌株的表达。“无”(左列)指示无终止子对照菌株。标准差由水平短划线指示,通常在菱形上方和下方被观察到。所述图式的右侧处的圆形指示基于所有对的图凯-克莱默(Tukey-Kramer)HSD测试的各组之间的显著性差异(不重叠/相交圆形指示彼此显著不同的各组)。
图67描绘了具有整合在指定中性位点处的SNP交换有效载荷的经菌株B衍生的菌株的产物效价(刺糖菌素J+L)。整合在位点1、2、3、4、6、9和10处的菌株具有相似产物效价,并且与预期效价(菌株B的平均效价;所述图式上的较高杠)不同。中性位点7处的整合呈现对产物效价具有不利影响。平均菱形指示群组平均值和95%置信区间。标准差由水平短划线指示,通常在菱形上方和下方被观察到。所述图式的右侧处的圆形指示基于所有对的图凯-克莱默HSD测试的各组之间的显著性差异(不重叠/相交圆形指示彼此显著不同的各组)。
图68描绘了当整合在指定中性位点时,GFP表达的比较结果。数据代表WT和经B衍生的菌株的归一化荧光,所述经B衍生的菌株具有整合在指定中性位点处的GFP表达盒(驱动GFP(SEQ ID No.81)的表达的强启动子(SEQ ID No.25))。P1对照指示整合在先前报告的中性位点处的这一盒的荧光。在大多数位点处表达相似。仅NS7与所评估的其它中性位点(NS2、NS3、NS4、NS6和NS10)显著不同。标准差由水平短划线指示,通常在菱形上方和下方被观察到。所述图式的右侧处的圆形指示基于所有对的图凯-克莱默HSD测试的各组之间的显著性差异(不重叠/相交圆形指示彼此显著不同的各组)。
图69描绘了测试经抗代谢物选择工程改造的菌株的刺糖菌素生产性能。所有菌株均显示相对于亲代,刺糖菌素生产性能有所降低。这种方法需要优化以鉴别菌株。
具体实施方式
定义
尽管相信所属领域的技术人员充分理解以下术语,但仍阐述以下定义以促进对本公开所公开标的物的解释。
术语“一(a/an)”是指所述实体中的一个或多个,即可以指多个提及物。因而,术语“一”、“一个或多个”和“至少一个”在本文中可互换地使用。另外,通过不定冠词“一(a/an)”提及“一个要素”并不排除存在多于一个要素的可能性,除非上下文明确要求存在一个并仅存在一个要素。
如本文所用,术语“细胞生物体”、“微生物(microorganism/microbe)”应在广义上理解。这些术语可互换地使用并且包括(但不限于)两种原核生物结构域:细菌和古细菌,以及某些真核生物真菌和原生生物。在一些实施例中,本公开提及本公开所存在的清单/表格和图式中的“微生物”或“细胞生物体”或“微生物”。这种表征不仅可以指所述表格和图式的已鉴别类属,而且指已鉴别的类种,以及所述表格或图式中的各种新颖和最新鉴别或设计的任何生物体株系。对于这些术语在本说明书的其它部分(如实例)中的叙述来说,相同表征保持成立。
术语“原核生物”在所属领域内已认知并指不含核或其它细胞器的细胞。原核生物通常按照两种结构域之一归类:细菌和古细菌。古细菌和细菌域生物体之间的决定性差异是基于16S核糖体RNA中的核苷酸碱基序列的基本差异。
术语“古细菌”是指疵壁菌门(Mendosicutes)的生物体类别,其通常发现于异常环境中且根据若干个准则而与原核生物的其余部分区分开来,所述若干个准则包括核糖体蛋白的数目和细胞壁中的胞壁酸的缺乏。基于ssrRNA分析,古细菌由系统发生学截然不同的两种群组组成:嗜泉古菌界(Crenarchaeota)和广古生菌界(Euryarchaeota)。古细菌基于其生理学可以按三种类型组织:产甲烷菌(产生甲烷的原核生物);极端嗜盐菌(extremehalophiles)(在极高浓度的盐(NaCl)存在下活着的原核生物);和极端(超)嗜热菌(extreme(hyper)thermophilus)(在极高温度下活着的原核生物)。除有别于细菌的统一古细菌特点(即,细胞壁中没有胞壁质、酯连型膜脂质等)之外,这些原核生物还展现了使其适应其特定栖息地的独特结构或生物化学属性。嗜泉古菌界主要由极端嗜热性硫依赖性原核生物组成且广古生菌界含有产甲烷菌和极端嗜盐菌。
“细菌”或“真细菌”是指原核生物体的结构域。细菌包括如下至少11种不同群组:(1)革兰氏阳性(革兰+)细菌,其存在两大亚门:(1)高G+C群组(放线菌、分枝杆菌、微球菌等),(2)低G+C群组(芽孢杆菌、梭菌、乳杆菌、葡萄球菌、链球菌、霉浆菌);(2)变形菌,例如紫色光合成+非光合成革兰氏阴性细菌(包括最“常见”的革兰氏阴性细菌);(3)蓝细菌,例如有氧光养型;(4)螺旋菌和相关菌种;(5)浮霉状菌;(6)拟杆菌、黄杆菌;(7)衣原体;(8)绿色硫细菌;(9)绿色非硫细菌(也是无氧光养生物);(10)耐放射性微球菌和相关菌种;(11)栖热孢菌和嗜热性热袍菌(Thermosipho thermophiles)。
术语“经基因修饰的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换地使用且是指已经利用本公开的克隆和转化方法经基因修饰的宿主细胞。因此,所述术语包括宿主细胞(例如细菌、酵母细胞、真菌细胞、CHO、人类细胞等),相较于其所来源的天然存在的生物体,所述宿主细胞已经遗传改变、修饰或工程改造,以便其展现经改变、修饰或不同的基因型和/或表型(例如当基因修饰影响微生物的编码核酸序列时)。应了解,在一些实施例中,所述术语不仅指所讨论的特定重组宿主细胞,而且指这种宿主细胞的后代或潜在后代。
术语“野生型微生物”或“野生型宿主细胞”描述自然界中存在的细胞,即尚未经基因修饰的细胞。
术语“基因工程”可以指对宿主细胞基因组的任何操控(例如核酸的插入、缺失、突变或置换)。
术语“对照”或“对照宿主细胞”是指适当的比较宿主细胞,用于测定基因修饰或实验处理的影响。在一些实施例中,对照宿主细胞是野生型细胞。在其它实施例中,对照宿主细胞在基因上除了基因修饰之外,与经基因修饰的宿主细胞相同,从而有别于处理宿主细胞。在一些实施例中,本公开教示了使用亲代菌株作为对照宿主细胞(例如使用S1菌株作为菌株改良程序的基础)。在其它实施例中,宿主细胞可以是基因相同的细胞,其缺乏处理宿主细胞中所测试的特定启动子或SNP。
如本文所用,术语“生产菌株”或“生产微生物”是指来自野生型或对照宿主细胞生物体的包含改良生产菌株性能的一种或多种基因差异的宿主细胞(例如,其使得所述菌株成为用于商业制造一种或多种化合物的较好候选者)。在一些实施例中,生产菌株将是商业生产中当前所用的菌株。在一些实施例中,生产菌株将为已经历一轮或多轮突变/基因工程改造以改良菌株特性的生物体。
如本文所用,术语“等位基因”意指基因的一种或多种替代形式中的任一种,其所有等位基因涉及至少一种性状或特征。在二倍体细胞中,所指定基因的两个等位基因占据一对同源染色体上的相应基因座。
如本文所用,术语“基因座(locus)”(基因座(loci)的复数形式)意指发现有例如基因或基因标记的染色体上的特定位置或位点。
如本文中所使用,术语“以基因方式连接”是指在育种期间,两种或更多种性状以高比率共同遗传,使得其难以通过杂交来分离。
如本文所用,“重组”或“重组事件”是指染色体交换或独立分类。
如本文所用,术语“表型”是指个别细胞、细胞培养物、生物体或生物体群组的可观察特征,其由那个个体的基因组成(即基因型)与环境之间的相互相用产生。
如本文所用,术语“嵌合”或“重组”当描述核酸序列或蛋白质序列时,是指使至少两个异源聚核苷酸或两个异源多肽连接成单一大分子或使至少一种天然核酸或蛋白质序列的一个或多个元件重排的核酸或蛋白质序列。举例来说,术语“重组”可以是指两个以其它方式分离的序列区段例如通过化学合成或通过基因工程技术操控所分离的核酸区段而发生的人工组合。
如本文所用,“合成核苷酸序列”或“合成聚核苷酸序列”是已知不存在于自然界中或天然不存在的核苷酸序列。一般来说,与任何其它天然存在的核苷酸序列相比,这类合成核苷酸序列将包含至少一种核苷酸差异。
如本文所用,术语“核酸”是指具有任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)聚合物形式,或其类似物。这一术语是指分子的初级结构,并且因此包括双链和单链DNA,以及双链和单链RNA。其还包括经修饰的核酸,如甲基化和/或封端核酸、含有经修饰的碱基、主链修饰的核酸和其类似物。术语“核酸”和“核苷酸序列”可互换地使用。
如本文所用,术语“基因”是指与生物功能相关的任何DNA区段。因此,基因包括(但不限于)编码序列和/或其表达所需的调节序列。基因还可以包括未表达的DNA区段,其例如形成其它蛋白质的识别序列。基因可以从多种来源获得,包括从所关注的来源克隆或利用已知或预测的序列信息合成,并且可以包括经设计具有所期望参数的序列。
如本文所用,术语“同源”或“同源物”或“直系同源物”在所属领域中已知并且是指具有共同祖先或家族成员并且基于序列一致性程度测定的相关序列。术语“同源性”、“同源”、“基本上相似”和“基本上对应”在本文中可互换地使用。其是指核酸片段,其中一个或多个核苷酸碱基的变化不影响所述核酸片段介导基因表达或产生某种表型的能力。这些术语也指本公开的核酸片段的修饰,如相对于初始、未经修饰的片段,基本上不改变所得核酸片段的功能特性的一个或多个核苷酸的缺失或插入。因此应理解,如所属领域的技术人员将了解,本公开涵盖除所述特定示例性序列之外的序列。这些术语描述了一种物种、亚种、变种、栽培品种或品系中所发现的基因与另一种物种、亚种、变种、栽培品种或品系中的相应或等效基因之间的关系。出于本公开的目的,对同源序列进行比较。“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以多种方式中的任一种表示,包括(但不限于):(a)序列一致性程度和/或(b)相同或相似的生物功能。优选(a)和(b)均有指示。可以使用所属领域中容易获得的软件程序测定同源性,如现代分子生物学实验技术(Current Protocols in Molecular Biology)(F.M.奥斯贝(F.M.Ausubel)等人编,1987)副刊30,章节7.718,表7.71中所论述的那些软件程序。一些比对程序是MacVector(牛津分子有限公司(Oxford Molecular Ltd),英国牛津(Oxford,U.K.))、ALIGN Plus(科学和教育软件(Scientific and Educational Software),宾夕法尼亚州(Pennsylvania))以及AlignX(Vector NTI,英杰公司(Invitrogen),加利福尼亚州卡尔斯巴德(Carlsbad,CA))。另一种比对程序是使用默认参数的Sequencher(基因代码,密歇根州安娜堡(AnnArbor,Michigan))。
如本文所用,术语“内源”或“内源基因”是指天然存在的基因,在其所处位置发现其天然地存在于宿主细胞基因组内。在本公开的上下文中,异源启动子可操作地连接到内源基因意指通过遗传方式将异源启动子序列插入现有基因的前方,处于那个基因天然存在的位置。如本文所述的内源基因可以包括天然存在的基因的等位基因,所述等位基因已经根据本公开的任何方法发生突变。
如本文所用,术语“外源”与术语“异源”可互换地使用且指来自不同于其原生来源的一些来源的物质。举例来说,术语“外源蛋白质”或“外源基因”是指来自非原生来源或位置且已经通过人工方式提供到生物系统中的蛋白质或基因。
如本文所用,术语“核苷酸变化”是指例如核苷酸取代、缺失和/或插入,如所属领域中充分了解。举例来说,突变所含的变异产生了静默取代、添加或缺失,但不改变所编码蛋白质的特性或活性或蛋白质制造方式。
如本文所用,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或插入,如所属领域中充分了解。
如本文所用,术语核酸或多肽的“至少一部分”或“片段”意指具有这类序列的最小尺寸特征的部分,或全长分子的任何较大片段,最多是并且包括全长分子。本公开的聚核苷酸片段可以编码基因调节元件的生物活性部分。基因调节元件的生物活性部分能够通过分离本公开的聚核苷酸之一的包含基因调节元件的一部分并且如本文中所述评估活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,最多是全长多肽。待使用的所述部分的长度将取决于特定应用。适用作杂交探针的核酸的一部分可以短到12个核苷酸;在一些实施例中,其是20个核苷酸。适用作抗原决定基的多肽的一部分可以短到4个氨基酸。发挥全长多肽功能的多肽的一部分通常将长于4个氨基酸。
变异型聚核苷酸还涵盖来源于诱变和重组诱发程序(如DNA改组)的序列。这类DNA改组的策略在所属领域中已知。参见例如施特默尔(Stemmer)(1994)PNAS 91:10747-10751;施特默尔(1994),自然370:389-391;凯默瑞(Crameri)等人(1997)自然生物技术15:436-438;穆尔(Moore)等人(1997),分子生物学杂志272:336-347;张(Zhang)等人(1997)PNAS 94:4504-4509;凯默瑞等人(1998),自然391:288-291;以及美国专利第5,605,793号和第5,837,458号。
就PCR扩增本文所公开的聚核苷酸来说,可以设计用于PCR反应中的寡核苷酸引物以由从所关注的任何生物体提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在所属领域中通常已知并且公开于萨布鲁克(Sambrook)等人(2001),分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,NewYork))。还参见英尼斯(Innis)等人编(1990),PCR方案:方法和应用指南(PCR Protocols:AGuide to Methods and Applications)(学术出版社,纽约);英尼斯和吉尔凡(Gelfand)编(1995),PCR策略(PCR Strategies)(学术出版社,纽约);以及英尼斯和吉尔凡编(1999),PCR方法手册(PCR Methods Manual)(学术出版社,纽约)。已知的PCR方法包括(但不限于)使用成对引物、巢式引物、单一特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物和其类似物的方法。
如本文所用,术语“引物”是指一种寡核苷酸,其当放置在诱导引物延伸产物合成的条件下时(即,在核苷酸和聚合药剂(如DNA聚合酶)存在下且在适合温度和pH下),能够与扩增目标粘接,从而允许DNA聚合酶附著,借此充当DNA合成的起始点。(扩增)引物优选单股以获得最大的扩增效率。引物优选寡脱氧核苷酸。引物长度必须足以在聚合药剂存在下引发延伸产物的合成。引物的确切长度将取决于多种因素,包括引物的温度和组成(A/T相对于G/C含量)。一对双向引物由一个正向和一个反向引物组成,如DNA扩增(如PCR扩增)领域中所常用。
如本文所用,“启动子”是指能够控制编码序列或功能RNA表达的DNA序列。在一些实施例中,启动子序列由近端和更远端上游元件组成,后者元件通常称为强化子。因此,“强化子”是能够刺激启动子活性的DNA序列,并且可以是启动子的固有元件或为了增强启动子的含量或组织特异性而插入的异源元件。启动子可完全来源于原生基因,或由来源于自然界中所发现的不同启动子的不同元件组成,或甚至包含合成DNA区段。所属领域的技术人员应了解,不同启动子可以引导基因在不同组织或细胞类型中或在不同的发育阶段或响应于不同的环境条件来表达。另外认识到,由于在大多数情况下,调节序列的确切边界尚未完全界定,因此一些变异的DNA片段可以具有相同的启动子活性。
如本文所用,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”以及“重组DNA构建体”在本文中可互换地使用。重组构建体包含核酸片段的人工组合,例如自然界中未一同发现的调节和编码序列。举例来说,嵌合构建体可以包含来源于不同来源的调节序列和编码序列,或来源于相同来源的调节序列和编码序列,但其以与自然界中所发现不同的方式排列。这类构建体可以单独使用或可以与载体结合使用。如所属领域的技术人员众所周知,如果使用载体,那么载体的选择取决于用于使宿主细胞转化的方法。举例来说,可以使用质粒载体。所属领域的技术人员深知,为了成功地转化、选择和繁殖包含本公开的任一个经分离核酸片段的宿主细胞,基因元件必须存在于载体上。所属领域的技术人员还将认识到不同的独立转型事件将引起不同的表达水平和模式(琼斯(Jones)等人,(1985),EMBO J 4:2411-2418;德阿尔梅达(De Almeida)等人,(1989),分子基因遗传学(Mol.Gen.Genetics)218:78-86),并且因此必须对多个事件进行筛选以便获得呈现所期望表达水平和模式的株系。这类筛选可以通过DNA的南方分析、mRNA表达的北方分析、蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体和其类似物,其自主地复制并且能整合到宿主细胞的染色体中。载体还可以是非自主复制的裸RNA聚核苷酸、裸DNA聚核苷酸、由同一链内的DNA和RNA组成的聚核苷酸、聚赖氨酸接合的DNA或RNA、肽接合的DNA或RNA、脂质体接合的DNA或其类似物。如本文所用,术语“表达”是指功能性最终产物(例如mRNA或蛋白质(前体或成熟物))的产生。
在本文中,“可操作地连接”意指根据本公开的启动子聚核苷酸与其它寡核苷酸或聚核苷酸的依序排列,从而引起所述其它聚核苷酸的转录。
如本文所用,术语“所关注产物”或“生物分子”是指由原料中的微生物产生的任何产物。在一些情况下,所关注的产物可以是小分子、酶、肽、氨基酸、、合成化合物、燃料、乙醇等。举例来说,所关注的产物或生物分子可以是任何初级或次级细胞外代谢物。初级代谢物尤其可以是乙醇、柠檬酸、乳酸、谷氨酸、谷氨酸盐、赖氨酸、刺糖菌素、乙基多杀菌素、苏氨酸、色氨酸和其它氨基酸、维生素、多糖等。次级代谢物尤其可以是抗生素化合物,如青霉素,或免疫抑制剂,如环孢菌素A(cyclosporin A);植物激素,如赤霉素;抑制素药物,如洛伐他汀(lovastatin);杀真菌剂,如灰黄霉素(griseofulvin)等。所关注的产物或生物分子也可以是微生物产生的任何细胞内组分,如:微生物酶,包括:催化酶、淀粉酶、蛋白酶、果胶酶、葡萄糖异构酶、纤维素酶、半纤维素酶、脂肪酶、乳糖酶、链激酶和其它多种。细胞内组分还可以包括重组蛋白,如:胰岛素、B型肝炎疫苗、干扰素、粒细胞群落刺激因子、链激酶和其它。
术语“碳源”通常是指适用作供细胞生长用的碳源的物质。碳源包括(但不限于)生物质水解产物、淀粉、蔗糖、纤维素、半纤维素、木糖和木质素,以及这些底物的单体组分。碳源可以包含各种形式的各种有机化合物,包括(但不限于)聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括例如各种单糖,如葡萄糖、右旋糖(D-葡萄糖)、麦芽糖、寡糖、多糖、饱和或不饱和脂肪酸、丁二酸盐、乳酸盐、乙酸盐、乙醇等,或其混合物。光合成生物体可以另外产生光合成产物形式的碳源。在一些实施例中,碳源可以选自生物质水解产物和葡萄糖。
术语“原料”定义为供应给微生物或发酵工艺的原材料或原材料混合物,利用所述工艺能够制备其它产物。举例来说,碳源,如生物质或来源于生物质的碳化合物,是供微生物在发酵工艺中产生所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)的原料。然而,原料可以含有不同于碳源的营养物。
术语“体积生产率”或“生产速率”定义为每体积培养基每单位时间形成的产物的量。体积生产率可以用克/升/小时(g/L/h)报告。
术语“比生产率”定义为产物的形成速率。比生产率在本文中进一步定义为以克产物/克细胞干重(CDW)/小时(g/g CDW/h)表示的比生产率。对指定微生物使用CDW与OD600的关系,比生产率还能够用克产物/升培养基/600nm培养液光学密度(OD)/小时(g/L/h/OD)表示。
术语“产量”定义为每单位重量的原材料所得的产物的量且可以用g产物/g底物(g/g)表示。产量可以用理论产量的百分比表示。“理论产量”定义为按指定量的底物计,能够产生的产物的最大量,如根据用于制备产物的代谢途径的化学计量学所指定。
术语“力价”或“效价”定义为溶液的浓度或溶液中的物质的浓度。举例来说,所关注产物(例如小分子、肽、合成化合物、燃料、乙醇等)在发酵液中的力价描述为溶液中的所关注产物克数/升发酵液(g/L)。
术语“总效价”定义为工艺中所产生的全部所关注产物的总和,包括(但不限于)溶液中的所关注产物、气相(如果适用)中的所关注产物,以及从工艺中去除且相对于工艺中的初始体积或工艺中的操作体积所回收的任何所关注产物。
如本文所用,术语“HTP基因设计文库”或“文库”是指根据本公开的基因扰动的集合。在一些实施例中,本发明的文库可以表现为i)数据库或其它计算机文件中的序列信息的集合;ii)编码前述系列的基因元件的基因构建体的集合;或iii)包含所述基因元件的宿主细胞菌株。在一些实施例中,本公开的文库可以指个别元件的集合(例如用于PRO交换文库的启动子的集合,或用于STOP交换文库的终止子的集合)。在其它实施例中,本公开的文库也可以指基因元件的组合,如启动子::基因、基因:终止子或甚至启动子:基因:终止子的组合。在一些实施例中,本公开的文库进一步包含与文库中的每个成员应用于宿主生物体中的效果相关的元数据。举例来说,如本文所用的文库可以包括启动子::基因序列组合的集合,以及那些组合对特定物种的一种或多种表型所产生的影响,从而在未来的启动子交换中利用所述组合来改良未来预测值。
如本文所用,术语“SNP”是指小核多态性。在一些实施例中,本公开的SNP应广义理解,并且包括单核苷酸多态性、序列插入、缺失、倒位和其它序列置换。如本文所用,术语“非同义”或“非同义SNP”是指引起宿主细胞蛋白中的代码变化的突变。在一些实施例中,本公开的SNP包含一种或多种基因的另外拷贝(例如,编码用于生物合成酶基因的一种或多种聚核苷酸的拷贝)。
“高通量(HTP)”基因组工程改造方法可能涉及使用自动化设备(例如液体处置机或板处置机)的至少一个零件执行所述方法的至少一个步骤。
“无痕基因组编辑”或“无痕基因置换”是指编辑指定物种的特定基因组序列,而无需在完成所需基因组编辑之后,将任何标记序列或任何质粒骨架序列引入所述物种的基因组中的方法。基因组编辑可为基因组的一种或多种核酸的取代、缺失和/或添加。
传统的菌株改良方法
传统的菌株改良方法可以广泛地分类为两类方法:定向菌株工程和随机诱变。
菌株改良的定向工程改造方法涉及对特定生物体的少数基因元件进行计划性扰动。这些方法通常集中于调节特定生物合成或发育程序,并且依赖于对影响所述路径的基因和代谢因素的先验了解。在其最简单的实施例中,定向工程涉及将一种生物体的特征化性状(例如能够产生可测量表型的基因、启动子或其它基因元件)转移到相同或不同物种的另一生物体。
菌株工程改造的随机方法涉及对亲代菌株进行随机诱变,以及为了鉴别性能改良而设计的广泛筛选。产生这些随机突变的方法包括暴露于紫外辐射,或诱变化学品,如甲烷磺酸乙酯。虽然是随机且大部分不可预测的,但是这种传统的菌株改良方法具有优于更多定向基因操控术的多项优势。首先,许多工业生物体就其基因和代谢谱系来说具有(且保持)不良的特征,以致替代的定向改良方法困难(如果并非不可能)。
其次,即使在表征相对充分的系统中,也难以预测引起工业性能改良的基因型变化,并且所述基因型变化有时仅以上位表型表现自身,这要求在许多基因中具有已知和未知功能的累积突变。
另外,多年来,在指定工业生物体中产生定向基因组突变所需的的基因工具不可获得,或使用非常缓慢和/或困难。
然而,传统菌株改良程序的扩展应用在指定菌株谱系中产生的增益逐渐减少,并且最终导致提升菌株效率的可能性耗竭。有益随机突变是相对罕见的事件,并且需要较大筛选池和高突变率。这不可避免地引起许多中性和/或有害(或部分有害)突变在“已改良”菌株中的无意积累,最终阻碍了未来效率增加。
传统累积改良方法的另一种局限是,关于任何特定突变对任何菌株度量标准的影响的已知信息很少到没有。这在根本上限制了研究人员将有益突变组合和合并或去除中性或有害诱变“包袱”的能力。
存在着将诱变谱系内的菌株之间的突变随机重组的其它方法和技术。举例来说,用于迭代序列重组的一些形式和实例(有时称为DNA改组、进化或分子育种)已经描述于美国专利申请第08/198,431号(1994年2月17日提交)、第PCT/US95/02126号(1995年2月17日提交)、第08/425,684号(1995年4月18日提交)、第08/537,874号(1995年10月30日提交)、第08/564,955号(1995年11月30日提交)、第08/621,859号(1996年3月25日提交)、第08/621,430号(1996年3月25日提交)、第PCT/US96/05480号(1996年4月18日提交)、第08/650,400号(1996年5月20日提交)、第08/675,502号(1996年7月3日提交)、第08/721,824号(1996年9月27日提交)和第08/722,660号(1996年9月27日提交);施特默尔,科学270:1510(1995);施特默尔等人,基因164:49-53(1995);施特默尔,生物技术13:549-553(1995);施特默尔,美国国家科学院院刊91:10747-10751(1994);施特默尔,自然370:389-391(1994);凯默瑞等人,自然·医学2(1):1-3(1996);凯默瑞等人,自然·生物技术14:315-319(1996),所述文献各自以全文引用的方式并入本文中用于所有目的。
这些包括促进跨越突变型菌株的基因组重组的技术,如原生质体融合和全基因组改组。对于一些工业微生物(如酵母和丝状真菌)来说,还能够利用天然配对循环进行成对基因组重组。以此方式,能够通过与亲代菌株产生‘回复交换’突变体且合并有益突变来去除有害突变。此外,能够潜在地将来自两种不同菌株谱系的有益突变组合,从而相对于使单一菌株谱系自身发生突变而可能获得的改良可能性,产生另外的改良可能性。
为了提供超越传统菌株改良程序的另外改良,本公开阐述了由计算机驱动并整合了分子生物学、自动化、数据分析和机器学习方案的独特HTP基因组工程改造平台。这一集成平台是利用一套HTP分子工具集,所述工具集用于构建HTP基因设计文库。这些基因设计文库将详细说明如下。
所教示的HTP平台和其独特微生物基因设计文库在根本上转变了微生物菌株开发和进化的范例。举例来说,基于诱变来开发工业微生物菌株的传统方法最终将产生背负沉重诱变负荷的微生物,所述负荷是在多年的随机诱变期间积累起来的。
解决这个问题(即去除这些微生物所积累的基因包袱)的能力已困惑微生物研究人员数十年。然而,利用本文公开的HTP平台,能够“修复”这些工业菌株且能够鉴别出和去除有害的基因突变。鉴别为有益的基因突变宜能够保持,并且在一些情况下能够据以改良。所得微生物菌株相较于其亲代菌株展现了优良的表型性状(例如所关注的化合物产量提高)。
另外,本文教示的HTP平台能够鉴别、表征和量化个别突变对微生物菌株性能的影响。这个信息,即所指定基因变化x对宿主细胞表型y(例如所关注的化合物或产物的产量)的影响,能够产生且接着存储于下文论述的微生物HTP基因设计文库中。即,每种基因排列的序列信息和其对宿主细胞表型的影响存储于一种或多种数据库中,并且可供后续分析使用(例如上位定位,如下文所论述)。本公开还教示了在物理上保存/存储有价值的基因排列的方法,所述基因排列呈基因插入构建体形式或呈含有所述基因排列的一种或多种宿主细胞生物体形式(例如参见下文论述的文库)。
当将这些HTP基因设计文库结合到与复杂数据分析和机器学习程序集成的迭代程序中时,一种用于改良宿主细胞的显著不同方法便问世了。因此,所教示的平台在根本上不同于此前论述的开发宿主细胞菌株的传统方法。所教示的HTP平台不受扰于与此前方法相关的许多缺点。参照下文论述的HTP分子工具集和所来源的基因设计文库将显而易知这些和其它优势。
基因设计及微生物工程:利用一套HTP分子工具和HTP基因设计文库进行菌株改良的系统组合方法
如前所述,本公开提供了通过迭代系统性引入和去除跨越菌株的基因变化对微生物生物体进行工程改造的新颖HTP平台和基因设计策略。所述平台由一套分子工具提供支持,其能够产生HTP基因设计文库且允许对所指定的宿主菌株高效实施基因变异。
本公开的HTP基因设计文库充当可以引入特定微生物菌株背景中的可能基因变异的来源。以此方式,HTP基因设计文库是基因多样性的存储库,或基因扰动的集合,其能应用于对所指定的微生物菌株进行初始或进一步的工程改造。规划针对宿主菌株实施的基因设计的技术描述于申请中的美国专利申请第15/140,296号中,其名称为“用于提高经工程改造的核苷酸序列的大规模产量的微生物菌株设计系统和方法(Microbial Strain DesignSystem and Methods for Improved Large Scale Production of EngineeredNucleotide Sequences)”,所述申请以全文引用的方式并入本文中。
此平台中所用的HTP分子工具集尤其可以包括:(1)启动子交换(PRO交换)、(2)SNP交换、(3)起始/终止密码子交换、(4)STOP交换、(5)序列优化、(6)转座子诱变多样性文库、(7)核糖体结合位点(RBS)多样性文库和(8)抗代谢物选择/发酵产物抗性文库。本公开的HTP方法还教示了指导HTP工具集的合并/组合使用的方法,包括(9)上位定位方案。如前所述,单独或组合的这套分子工具能够产生HTP基因设计宿主细胞文库。
如将证明,在所教示的HTP微生物工程改造平台的背景下使用前述HTP基因设计文库能够鉴别和合并有益的“致病”突变或基因区段并且还能够鉴别和去除消极或有害突变或基因区段。这种新方法能够对菌株性能进行快速改良,而传统的随机诱变或定向基因工程则无法实现快速改良。去除基因负荷或将有益变化合并到无基因负荷的菌株中还向能够实现进一步改良的另外随机诱变提供新的稳固起点。
在一些实施例中,本公开教示了当鉴别出跨越诱变菌株谱系的不同离散分支的正交有益变化时,还能够将其快速地合并到性能更佳的菌株中。还能够将这些突变合并到不是诱变谱系一部分的菌株中,如通过定向基因工程获得改良的菌株。
在一些实施例中,本公开与已知的菌株改良方法不同之处在于,其分析了跨越多个不同基因组区域的突变的全基因组组合影响,包括已表达和未表达的基因元件,并且利用所聚集的信息(例如实验结果)预测预期会产生菌株增强的突变组合。
在一些实施例中,本公开教示:i)能够通过本发明得到改良的工业微生物和其它宿主细胞;ii)产生多样性池用于下游分析;iii)用于对较大变异体池进行高通量筛选和测序的方法和硬件;iv)用于机器学习计算分析和预测全基因组突变的协同作用的方法和硬件;以及v)高通量菌株工程改造方法。
以下分子工具和文库结合说明性微生物实例来论述。所属领域中的技术人员将认识到,本公开的HTP分子工具与任何宿主细胞(包括真核生物细胞和更高级的生命形式)相容。
现将论述已鉴别的HTP分子工具集中的每一种,其能够产生微生物工程改造平台中所用的各种HTP基因设计文库。
1.启动子交换:用于衍生启动子交换微生物菌株文库的分子工具
在一些实施例中,本公开教示了选择具有最佳表达特性的启动子以对整体宿主菌株表型(例如产量或生产率)产生有益作用的方法。
举例来说,在一些实施例中,本公开教示了鉴别一个或多个启动子和/或在宿主细胞内产生一个或多个启动子的变异体的方法,所述启动子展现一系列表达强度(例如下文论述的启动子梯)或优良调节特性(例如针对所选基因的更紧密调控)。已鉴别和/或产生的这些启动子的特定组合可以归入同类作为启动子梯,其更详细地解释于下文。
接着使所讨论的启动子梯与所关注的指定基因关联。因此,如果具有启动子P1-P8(表示已经鉴别和/或产生以展现一系列表达强度的八个启动子)并使启动子梯与微生物中的所关注单一基因关联(即,通过使所指定启动子可操作地连接到指定靶基因来对微生物进行基因工程改造),那么能够通过表征由每种组合尝试产生的每种经工程改造菌株来确认八个启动子的每种组合的作用,条件是除与靶基因关联的特定启动子之外,经工程改造的微生物具有原本相同的基因背景。
通过这一过程加以工程改造的所得微生物形成HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每种成员菌株代表了在原本相同基因背景下可操作地连接到特定靶基因的指定启动子,所述文库称为“启动子交换微生物菌株文库”。
另外,HTP基因设计文库可以指遗传扰动的集合,在这种情况下,所指定启动子x可操作地连接到所指定基因y,所述集合称为“启动子交换文库”。
另外,能够使用包含表1中之启动子的相同启动子梯对微生物进行工程改造,其中所述启动子中的每一种可操作地连接到不同基因目标。这个程序将得到微生物,除与所关注靶基因可操作地连接的特定启动子以外,所述微生物原本假定在遗传上一致。可以对这些微生物进行适当筛选和表征并产生另一个HTP基因设计文库。表征HTP基因设计文库中的微生物菌株产生的信息和数据可以存储于任何数据存储构建体中,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。此数据/信息可以是例如所指定启动子当可操作地连接到所指定基因目标时的作用。此数据/信息还能够是通过使本公开启动子中的两种或更多种可操作地连接到所指定基因目标而产生的组合效应的更宽集合。
启动子和靶基因的前述实例仅具说明性,原因是所述概念可以应用于基于一系列表达强度的呈现而已经归入同类的任何指定数目个启动子和任何指定数目个靶基因。所属领域中的技术人员还将认识到两个或更多个启动子能够可操作地连接于任何基因目标的前方。因此,在一些实施例中,本公开教示了启动子交换文库,其中来自启动子梯的1、2、3或更多个启动子可操作地连接到一种或多种基因。
概括地说,利用各个启动子驱动各种基因在生物体中的表达是一种优化所关注的性状的强大工具。本发明人所开发的启动子交换分子工具是使用启动子序列梯,其已经证明可改变至少一个基因座在至少一种条件下的表达。接着利用高通量基因组工程学将此梯系统性地应用于生物体中的一组基因。基于多种方法中的任一种方法确定这组基因影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于此前测定的有益遗传多样性而进行的算法选择。在一些实施例中,基因的选择可以包括所指定宿主中的所有基因。在其它实施例中,基因的选择可以是所指定宿主中的所有基因的随机选择的子集。
接着对含有连接到基因的启动子序列的生物体的所得HTP基因设计微生物菌株文库在高通量筛选模型中的性能进行评定,并确定引起性能增强的启动子-基因连接并将信息存储于数据库中。基因扰动的集合(即,所指定的启动子x可操作地连接到所指定基因y)形成“启动子交换文库”,其可以用作微生物工程处理中所用的潜在基因变异的来源。随着时间逝去,当针对宿主细胞背景的更大多样性实施基因扰动的更大集合时,每个文库作为实验上被证实的数据的主体而变得更强大,其能用于根据所关注的任何背景更精确地且可预测地设计出定向变化。
生物体中的基因转录水平是影响生物体行为的控制关键点。转录与转译(蛋白质表达)紧密关联,并且哪种蛋白质以什么数量表达决定了生物体行为。细胞表达数千种不同类型的蛋白质,并且这些蛋白质以多种复杂的方式发生相互作用以产生功能。通过系统性地改变蛋白质集合的表达水平,能够使功能改变,由于复杂性,因此难以预测功能改变的方式。有些变异可以增强性能且因此与用于评估性能的机制关联,这项技术能够产生功能改良的生物体。
在小分子合成路径的背景下,酶通过其小分子底物和产物,在始于底物且终于所关注小分子的直链或支链中发生相互作用。由于这些相互作用依序关联,因此这一系统展现分布式控制,并且增强一种酶的表达仅能增加路径通量直到另一种酶变成速率限制型为止。
代谢控制分析(MCA)是一种利用实验数据和第一原理确定哪种酶具有速率限制性的方法。然而,MCA受到限制,原因是其在每种表达水平变化之后需要广泛的实验以确定新的速率限制酶。在这种情形下,启动子交换是有利的,原因是通过将启动子梯应用于路径中的每种酶,发现限制酶,并且同一件事可以随后进行多轮以发现变成速率限制型的新酶。另外,由于功能读数最好是所关注小分子的产量,因此确定哪种酶具限制性的实验与提高产量的工程学相同,从而缩短开发时间。在一些实施例中,本公开教示了将PRO交换应用于编码多单元酶的个别亚基的基因。在又其它实施例中,本公开教示了对负责调节个别酶或整个生物合成路径的基因应用PRO交换技术的方法。
在一些实施例中,本公开的启动子交换工具可以用于鉴别所选基因目标的最佳表达。在一些实施例中,启动子交换的目标可以是增强靶基因的表达,以减少代谢或遗传路径中的瓶颈。在其它实施例中,启动子交换的目标可以是减少靶基因的表达,以便在所述靶基因的表达不需要时,避免宿主细胞中不必要的能量消耗。
在其它细胞系统(如转录、转运或信号传导)的背景下,可以利用各种合理方法先验地竭力发现哪种蛋白质是表达变化的目标和那种变化应该是什么变化。这些合理方法减少了扰动数目,所述扰动必须加以测试以发现改良性能的扰动,但是这样做的成本相当大。基因缺失研究鉴别出其存在对特定功能具关键作用的蛋白质,并且接着可以过度表达重要基因。由于蛋白质相互作用的复杂性,因此这对于增强性能而言通常无效。已经开发出不同类型的模型,其试图利用第一原理描述转录或信号传导行为与细胞中的蛋白质含量的关系。这些模型通常表明其中表达变化的目标可以产生不同或改良的功能。这些模型所基于的假设过分简单化且参数难以测量,因此其所产生的预测通常不正确,尤其对于非模型生物体来说。在基因缺失与建模的情况下,确定如何影响某种基因所需的实验不同于产生使性能改良的变化的后续工作。启动子交换避开了这些挑战,原因是突显了特定扰动的重要性的所构建菌株也已经是改良的菌株。
因此,在特定实施例中,启动子交换是一种多步骤方法,其包含:
1.选择一组“x”个启动子充当“梯”。理想的是,这些启动子已经显示可引起跨越多个基因组基因座的高度可变化表达,但唯一的要求是其以某种方式扰动基因表达。
2.针对目标选择一组“n”个基因。这一集合可以是基因组中的每个开放阅读框架(ORF)或ORF的子集。可以利用关于功能相关ORF的注释、根据与此前证实的有益扰动的关系(此前启动子交换或此前SNP交换)、通过基于此前所产生的扰动之间的上位相互作用而进行的算法选择、基于与针对目标的有益ORF有关的假设的其它选择准则或通过随机选择来选择所述子集。在其它实施例中,“n”个靶基因可以包含非蛋白质编码基因,包括非编码RNA。
3.快速且在一些实施例中并行执行以下基因修饰的高通量菌株工程:当原生启动子存在于靶基因n的前方且其序列已知时,用所述梯中的x个启动子中的每一种置换原生启动子。当原生启动子不存在或其序列未知时,将所述梯中的x个启动子中的每一种插入基因n的前方(参见例如图13和14)。因此,在一些实施例中,SNP交换文库可以是启动子插入文库,其中与新添加的启动子一起测试不含启动子或具有弱启动子的基因元件。用于启动子SWP文库修饰的所述基因包括(但不限于):(1)所关注化合物(如刺糖菌素)的核心生物合成路径中的基因;(2)涉及所关注化合物的前体池可用性的基因,如直接参与池可用性的前体合成或调节的基因;(3)涉及辅因子利用的基因;(4)用转录调控因子编码的基因;(5)编码营养物可用性的转运子的基因;和(6)产物输出子等。以这种方式构建菌株“文库”(也称为HTP基因设计文库),其中所述文库的每个成员是可操作地连接到n目标的x启动子在原本相同的基因背景下的例子。如此前所述,可以插入启动子组合,从而在构建文库时,扩大组合可能性的范围。
4.在依据一种或多种度量标准的菌株性能指示所优化的性能的背景下,高通量筛选菌株文库。
尤其可以扩展此基本方法以提供菌株性能的进一步改良:(1)将多个有益扰动合并到单一菌株背景中,按互动式程序进行,一次一个;或作为多个变化在单一步骤中进行。多个扰动可以是一组特定的定义变化或部分随机化的变化组合文库。举例来说,如果目标集是路径中的每种基因,那么使扰动文库在此前菌株文库的改良成员中依序再生能够优化路径中的每个基因的表达水平,不论哪种基因在任一次指定的迭代时具有速率限制性;(2)将由文库的个别和组合产生所得到的性能数据馈送到算法中,所述算法使用那个数据基于每个扰动的相互作用来预测最佳的扰动集;以及(3)实施上述两种方法的组合(参见图13)。
上文所论述的分子工具或技术的特征为启动子交换,但不限于启动子且可以包括系统性地改变目标集表达水平的其它序列变化。用于改变一组基因的表达水平的其它方法可以包括:a)核糖体结合位点梯(或真核生物中的克扎克序列(Kozak sequences));b)用其它起始密码子中的每一种置换每个目标的起始密码子(例如,下文论述的起始/终止密码子交换);c)使各种mRNA稳定化或去稳定化序列连接到转录物的5'或3'端或任何其它位置;d)使各种蛋白质稳定化或去稳定化序列在蛋白质中的任何位置连接。
所述方法举工业微生物为例说明于本公开中,但适用于可以在基因突变体群体中鉴别出所期望性状的任何生物体。举例来说,这可以用于改良CHO细胞、酵母、昆虫细胞、藻类以及多细胞生物体(如植物)的性能。
2.SNP交换:用于衍生SNP交换微生物菌株文库的分子工具
在某些实施例中,SNP交换不是改良微生物菌株的随机诱变方法,而是涉及系统性地引入或去除跨越菌株的个别小核多态性核苷酸突变(即SNP)(因此称为“SNP交换”)。
通过这一过程加以工程改造的所得微生物形成HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每个成员菌株代表了所指定SNP在原本相同基因背景下的存在或不存在,所述文库称为“SNP交换微生物菌株文库”。
另外,HTP基因设计文库可以指遗传扰动的集合,在这种情况下,所指定的SNP存在或所指定的SNP不存在,所述集合称为“SNP交换文库”。
在一些实施例中,SNP交换涉及重新构建具有目标SNP“构建模块”与已鉴别的有益性能作用的最佳组合的宿主生物体。因此,在一些实施例中,SNP交换涉及将多个有益突变合并到单一菌株背景中,以迭代程序一次一个进行;或作为多个变化在单个步骤中进行。多个变化可以是一组特定的定义变化或部分随机化的突变组合文库。
在其它实施例中,SNP交换还涉及从菌株中去除鉴别为有害的多个突变,按迭代程序一次一个进行;或作为多个变化在单个步骤中进行。多个变化可以是一组特定的定义变化或部分随机化的突变组合文库。在一些实施例中,本公开的SNP交换方法包括添加有益SNP和去除有害和/或中性突变。
SNP交换是一种在经历诱变和选择以改良所关注性状的菌株谱系中鉴别和利用有益和有害突变的强大工具。SNP交换是利用高通量基因组工程技术系统地确定诱变谱系中的个别突变的影响。测定跨越诱变谱系中的一代或多代的菌株的基因组序列,所述诱变谱系具有已知的性能改良。接着系统地利用高通量基因组工程学在早期谱系菌株再现已改良菌株的突变,和/或使后期菌株中的突变恢复为早期菌株序列。接着评估这些菌株的性能且可以确定每种个别突变对改良的所关注表型的贡献。如前所述,对此方法所得的微生物菌株进行分析/表征且形成SNP交换基因设计文库的基础,所述文库可以告知跨越宿主菌株的微生物菌株改良。
有害突变的去除可以提供直接的性能改良,并且在未接受诱变负荷的菌株背景下合并有益突变可以快速并大大改良菌株性能。通过SNP交换方法所产生的各种微生物菌株形成了HTP基因设计SNP交换文库,其是包含各种所添加/缺失/或合并SNP的微生物菌株,但是具有原本相同的基因背景。
如此前所论述,供性能改良用的随机诱变筛选是一种改良工业菌株的常用技术,并且当前用于大规模制造的许多菌株已经使用此程序以迭代方式开发历时多年,有时数十年。产生基因组突变的随机方法(如暴露于UV辐射或化学诱变剂,如甲烷磺酸乙酯)是用于改良工业菌株的优选方法,原因是:1)工业生物体在遗传或代谢上可能受到不充分的表征,使得定向改良方法的目标选择困难或不可能;2)即使在表征相对充分的系统中,也难以预测引起工业性能改良的变化且可能需要扰动无已知功能的基因;以及3)在所指定工业生物体中产生定向基因组突变的基因工具无法获得或非常缓慢和/或难以使用。
然而,尽管此程序存在前述效益,但是也存在多项已知缺点。有益突变是相对罕见的事件,并且为了在固定的筛选能力下发现这些突变,突变率必须足够的高。这通常引起非所需的中性突变和部分有害的突变连同有益变化一起并入菌株中。随着时间逝去,此‘诱变负荷’积累,产生在总体稳定性和关键性状(如生长速率)上具有缺陷的菌株。最终,‘诱变负荷’越来越难以或不可能通过随机诱变获得性能的进一步改良。不使用适合的工具不可能将菌株谱系的离散和并联分支中所发现的有益突变合并。
SNP交换是一种克服这些限制的方法,其通过系统地再现或恢复当比较诱变谱系内的菌株时所观察到的一些或所有突变来实现。以此方式,能够鉴别和合并有益(‘致病’)突变,并且/或能够鉴别和去除有害突变。这允许对菌株性能进行快速改良,而通过进一步随机诱变或靶向基因工程则无法实现。
去除基因负荷或将有益变化合并到无基因负荷的菌株中还向能够实现进一步改良的另外随机诱变提供新的稳固起点。
另外,当跨越诱变菌株谱系的各种离散分支鉴别正交有益变化时,能够将其快速地合并到性能更佳的菌株中。还能够将这些突变合并到不是诱变谱系一部分的菌株中,如通过定向基因工程获得改良的菌株。
存在着将诱变谱系内的菌株之间的突变随机重组的其它方法和技术。这些包括促进跨越突变型菌株的基因组重组的技术,如原生质体融合和全基因组改组。对于一些工业微生物(如酵母和丝状真菌)来说,还能够利用天然配对循环进行成对基因组重组。以此方式,能够通过与亲代菌株产生‘回复交换’突变体且合并有益突变来去除有害突变。
传统方法可以与本文中所公开的SNP交换方法一起使用以将随机突变发现与系统性引入或去除跨越菌株的个别突变结合。
在一些实施例中,本公开教示了用于鉴别多样性池的生物体中所存在的SNP序列多样性的方法。多样性池可以是分析所用微生物的指定种数n,其中所述微生物的基因组代表“多样性池”。
在特定方面中,多样性池可以是原始亲代菌株(S1),其在特定时间点具有“基线”或“参考”基因序列(S1Gen1),并且接着是任何数目个衍生/开发自所述S1菌株的后续子代菌株(S2-n),其具有不同于S1基线基因组的基因组(S2-nGen2-n)。
举例来说,在一些实施例中,本公开教示了对多样性池中的微生物基因组进行测序以鉴别每种菌株中存在的SNP。在一个实施例中,多样性池中的菌株是历史上的微生物生产菌株。因此,本公开的多样性池可以包括例如工业参考菌株,和通过传统菌株改良程序所产生的一种或多种突变型工业菌株。
在一些实施例中,多样性池内的SNP是参照“参考菌株”测定。在一些实施例中,参考菌株是野生型菌株。在其它实施例中,参考菌株是经历任何诱变之前的原始工业菌株。参考菌株可以由从业者定义且不一定是原始野生型菌株或原始工业菌株。基本菌株仅代表被视为“基本”、“参考”或原始基因背景的菌株,由此与由所述参考菌株衍生或开发的后续菌株比较。
鉴别出多样性池中的所有SNP后,本公开教示了用SNP交换方法和筛选方法描绘(即,量化和表征)个别和/或群组中的SNP的效应(例如所关注的表型的产生)。
在一些实施例中,本公开的SNP交换方法包含将突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一种或多种SNP引入参考菌株(S1Gen1)或野生型菌株的步骤(“向上波动”)。
在其它实施例中,本公开的SNP交换方法包含将突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一种或多种SNP去除的步骤(“向下波动”)。
在一些实施例中,根据本公开的一个或多个准则(例如所关注的化学品或产物的产生)对包含一种或多种SNP变化(引入或去除)的每种所产生菌株进行培养和分析。使得自每种所分析宿主菌株的数据与存在于宿主菌株中的特定SNP或SNP群组关联或相关,并且记录下来供未来使用。因此,本公开能够产生高度注释的大型HTP基因设计微生物菌株文库,所述菌株文库能够鉴别所指定SNP对任何数目个所关注微生物基因或表型性状的影响。将这些HTP基因设计文库中所存储的信息告知HTP基因组工程改造平台的机器学习算法且指导所述程序的未来迭代,最终产生具有高度所期望特性/性状的进化微生物生物体。
在一些实施例中,本文所述的方法以正向遗传学程序执行。例如,在一些实施例中,含有SNP或另一类型的基因变异的基因的功能和/或特性尚未知晓,或在确定何种SNP或其它基因变异交换或组合时未加考虑。替代地,未考虑已知或预测的基因功能来进行基因变异的组合,但所述组合可能受先前菌株性能的人类或机器学习分析影响。在不希望受任何单一理论束缚的情况下,本发明人认为功能上不可知的筛选是有效的,因为其不受人类预想和期望限制。因此,在一些实施例中,本公开方法的使得可发现基因变异的有价值的组合,其并未视为(并且可能甚至不赞成为)基因工程改造的“智能设计”方法。
在一些实施例中,本文所述的方法以反向遗传学程序执行。例如,在一些实施例中,含有SNP或另一类型的基因变异的基因的功能和/或特性已经知晓,并在SNP或另一类型的基因变异交换时考虑在内。例如,在一些实施例中,尤其选择和组合参与所关注化合物(例如,刺糖菌素)的合成、转化和/或降解的基因中的基因变异,伴随为何所述组合可产生具有所需表型的改良菌株的至少一些假设。所述基因功能和/或身份信息包括(但不限于):(1)所关注化合物(如刺糖菌素)的核心生物合成路径中的基因;(2)涉及所关注化合物的前体池可用性的基因,如直接参与池可用性的前体合成或调节的基因;(3)涉及辅因子利用的基因;(4)转录调控因子编码的基因;(5)编码营养物可用性的转运子的基因;和(6)产物输出子等。
在一些实施例中,当组合基因变异时,本文所述的方法可以混合程序进行,其中考虑至少一种基因或基因变异的功能和/或特性,而不考虑含有另一基因变异的至少一种基因的功能和/或特性。
某些基因含有编码DNA模块的重复区段。例如,发现聚酮和非核糖体肽具有模块性(参见,US2017/0101659,其以全文引用的方式并入本文中)。所述蛋白质中的功能蛋白域以重复方式排列(模块1-模块2-模块3…),在基因组上产生DNA的重复区段。在一些实施例中,待组合的至少一种基因变异不在含有编码DNA模块的重复区段的基因组区域内。在一些实施例中,基因变异的组合不涉及此类基因中编码DNA模块的重复区段的取代、缺失或添加。本公开方法不仅能够在具有基因组模块性的这些区域处执行靶向基因组编辑,还实现在整个基因组中,在任何基因组背景下执行靶向基因组编辑。因此,本公开的靶向基因组编辑可在任何区域处编辑刺糖多孢菌基因组,并且不局限于仅在具有模块性的区域处进行编辑。
3.起始/终止密码子交换:用于衍生起始/终止密码子微生物菌株文库的分子工具
在一些实施例中,本公开教示了交换起始和终止密码子变异体的方法。举例来说,酿酒酵母和哺乳动物的典型终止密码子分别是TAA(UAA)和TGA(UGA)。单子叶植物的典型终止密码子是TGA(UGA),而昆虫和大肠杆菌通常使用TAA(UAA)作为终止密码子(达尔芬(Dalphin)等人(1996),核酸研究(Nucl.Acids Res.)24:216-218)。在其它实施例中,本公开教示了使用TAG(UAG)终止密码子。
本公开类似地教示了交换起始密码子。在一些实施例中,本公开教示了使用大部分生物体(尤其真核生物)所使用的ATG(AUG)起始密码子。在一些实施例中,本公开教示了原核生物大部分使用ATG(AUG),继之为GTG(GUG)和TTG(UUG)。
在其它实施例中,本发明教示了用TTG置换ATG起始密码子。在一些实施例中,本发明教示了用GTG置换ATG起始密码子。在一些实施例中,本发明教示了用ATG置换GTG起始密码子。在一些实施例中,本发明教示了用TTG置换GTG起始密码子。在一些实施例中,本发明教示了用ATG置换TTG起始密码子。在一些实施例中,本发明教示了用GTG置换TTG起始密码子。
在其它实施例中,本发明教示了用TAG置换TAA终止密码子。在一些实施例中,本发明教示了用TGA置换TAA终止密码子。在一些实施例中,本发明教示了用TAA置换TGA终止密码子。在一些实施例中,本发明教示了用TAG置换TGA终止密码子。在一些实施例中,本发明教示了用TAA置换TAG终止密码子。在一些实施例中,本发明教示了用TGA置换TAG终止密码子。
4.终止密码子交换:用于衍生优化序列微生物菌株文库的分子工具
在一些实施例中,本公开教示了通过优化细胞基因转录来提高宿主细胞生产率的方法。基因转录是若干种不同生物学现象的结果,包括转录起始(RNAp募集和转录复合物形成)、伸长(链合成/延伸),和转录终止(RNAp脱离和终止)。虽然已经倾注了大量注意力以通过基因的转录调节(例如通过改变启动子,或诱导调节性转录因子)来控制基因表达,但是通过基因终止序列的调节获得转录调节的成果相对较少。
转录影响基因表达水平的最明显方式是通过Pol II起始速率,其可以通过启动子或强化子浓度与反式活化因子的组合来调节(卡顿加JT(Kadonaga,JT),2004,“序列特异性DNA结合因子对RNA聚合酶II转录的调节(Regulation of RNA polymerase IItranscription by sequence-specific DNA binding factors)”,细胞,2004年1月23日;116(2):247-57)。在真核生物中,伸长率也可以通过影响替代性拼接来决定基因表达模式(克拉默P.(Cramer P.)等人,1997“启动子结构与转录物替代性拼接之间的功能联系(Functional association between promoter structure and transcript alternativesplicing)”,美国国家科学院院刊,1997年10月14日;94(21):11456-60)。基因上的终止失效可以通过减少启动子至Pol II的可及性来消弱下游基因的表达(格莱吉IH(Greger IH)等人,2000“酿酒酵母的GAL7启动子的转录干扰和起始之间的平衡(Balancingtranscriptional interference and initiation on the GAL7 promoter ofSaccharomyces cerevisiae)”,美国国家科学院院刊,2000年7月18日;97(15):8415-20)。这种过程(称为转录干扰)与低级真核生物尤其相关,因为其通常具有紧密间隔的基因。
终止序列还能够影响所述序列所属的基因的表达。举例来说,研究表明,真核生物中的低效转录终止引起未拼接的前mRNA积累(参见韦斯特S.(West,S.)和普洛德弗N.J.(Proudfoot,N.J.),2009“转录终止使人类细胞中的蛋白质表达增强(TranscriptionalTermination Enhances Protein Expression in Human Cells)”,分子细胞,2009年2月13日;33(3-9);354-364)。其它研究也已表明,3'端处理可以通过低效终止来延迟(韦斯特S等人,2008“哺乳动物RNA聚合酶II转录终止的分子剥离(Molecular dissection ofmammalian RNA polymerase II transcriptional termination)”,分子细胞,2008年3月14日;29(5):600-10)。转录终止还能够通过使转录物从合成位点释放来影响mRNA稳定性。
原核生物中的转录终止
在原核生物中,称为Rho非依赖性和Rho依赖性终止的两种主要机制介导转录终止。Rho非依赖性终止信号不需要外来的转录终止因子,原因是由这些序列转录的RNA中的茎-环结构的形成连同一系列尿苷(U)残基一起促进了RNA链从转录复合物中的释放。另一方面,Rho依赖性终止需要mRNA上存在称为Rho的转录终止因子和顺式作用元件。Rho的初始结合位点(Rho利用(rut)位点)是延伸的(约70个核苷酸,有时为80-100个核苷酸)单股区域,其特征是高胞苷/低鸟苷含量和所合成的RNA中的位于实际终止序列上游的二级结构相对稀少。当遇到聚合酶暂停位点时,发生终止,并且通过Rho的解螺旋酶活性来释放转录物。
终止子交换(STOP交换)
在一些实施例中,本公开教示了选择具有最佳表达特性的选择终止序列(“终止子”)以对整体宿主菌株生产率产生有益作用的方法。
举例来说,在一些实施例中,本公开教示了鉴别一种或多种终止子和/或在宿主细胞内产生一种或多种终止子的变异体的方法,其展现了一系列表达强度(例如下文论述的终止子梯)。已鉴别和/或产生的这些终止子的特定组合可以归入同类作为终止子梯,其更详细地解释于下文。
接着使所讨论的终止子梯与所关注的指定基因关联。因此,如果具有终止子T1-T8(表示已经鉴别和/或产生以便在与一个或多个启动子组合时展现一系列表达强度的八个终止子)且使终止子梯与所关注的单一基因在宿主细胞中关联(即,通过所指定终止子可操作地连接到所指定靶基因的3'端而对宿主细胞进行基因工程改造),接着可以通过表征由每种组合尝试产生的每种工程改造菌株来确认终止子的每种组合的影响,条件是除与靶基因相关的特定启动子之外,经工程改造的宿主细胞具有另外相同的基因背景。通过这一过程加以工程改造的所得宿主细胞形成了HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每个成员菌株代表所指定的终止子在原本相同的基因背景下可操作地连接到特定靶基因,所述文库称为“终止子交换微生物菌株文库”或“STOP交换微生物菌株文库”。
另外,HTP基因设计文库可以指基因扰动的集合,在这种情况下为可操作地连接到所指定基因y的所指定终止子x,所述集合称为“终止子交换文库”或“STOP交换文库”。
另外,能够使用包含启动子T1-T8的相同终止子梯对微生物进行工程改造,其中八个启动子中的每一种可操作地连接到10个不同基因目标。此程序得到80种宿主细胞菌株,除可操作地连接到所关注靶基因的特定终止子之外,所述菌株原本假定在遗传上一致。可以对这些80种宿主细胞菌株进行适当筛选和表征并产生另一个HTP基因设计文库。表征HTP基因设计文库中的微生物菌株产生的信息和数据可以存储于任何数据库中,包括(但不限于)关系型数据库、面向对象数据库或高度分布式NoSQL数据库。此数据/信息可以包括例如所指定终止子(例如T1-T8)当可操作地连接到所指定基因目标时的作用。此数据/信息还能够是通过使启动子T1-T8中的两种或更多种可操作地连接到所指定基因目标而产生的组合效应的更宽集合。
八个启动子和10种靶基因的前述实例仅具说明性,原因是所述概念可以应用于基于一系列表达强度的呈现而已经归入同类的任何指定数目个启动子和任何指定数目个靶基因。
概括地说,利用各种终止子调节各种基因在生物体中的表达是一种优化所关注的性状的强大工具。本发明人所开发的终止子交换分子工具是使用终止序列梯,其已经证明可改变至少一个基因座在至少一种条件下的表达。接着利用高通量基因组工程学将此梯系统性地应用于生物体中的一组基因。基于多种方法中的任一种方法确定这组基因影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于此前测定的有益遗传多样性而进行的算法选择。
接着对含有连接到基因的终止序列的生物体的所得HTP基因设计微生物菌株文库在高通量筛选模型中的性能进行评定,并确定引起性能增强的启动子-基因连接并将信息存储于数据库中。遗传扰动的集合(即,所指定的终止子x连接到所指定基因y)形成“终止子交换文库”,其可以用作微生物工程处理中所用的潜在基因变异的来源。随着时间逝去,当针对微生物背景的更大多样性实施基因扰动的更大集合时,每个文库作为实验上被证实的数据的主体而变得更强大,其能用于根据所关注的任何背景更精确地且可预测地设计出定向变化。即,在一些实施例中,本公开教示了基于此前实验结果将一个或多个基因变化引入宿主细胞,所述此前实验结果嵌入与本发明的任何基因设计文库有关的元数据内。
因此,在特定实施例中,终止子交换是一种多步骤方法,其包含:
1.选择一组“x”个终止子充当“梯”。理想的是,这些终止子已经显示可引起跨越多个基因组基因座的高度可变化表达,但唯一的要求是其以某种方式扰动基因表达。
2.针对目标选择一组“n”个基因。此集合可以是基因组中的每个ORF或ORF的子集。可以利用关于功能相关ORF的注释、根据与此前证实的有益扰动的关系(此前启动子交换、STOP交换或SNP交换)、通过基于此前所产生的扰动之间的上位相互作用而进行的算法选择、基于与针对目标的有益ORF有关的假设的其它选择准则或通过随机选择来选择所述子集。在其它实施例中,“n”个靶基因可以包含非蛋白质编码基因,包括非编码RNA。
3.快速且并行执行以下基因修饰的高通量菌株工程:当原生终止子存在于靶基因n的3'端且其序列已知时,用所述梯中的x个终止子中的每一种置换原生终止子。当原生终止子不存在或其序列未知时,将所述梯中的x个终止子中的每一种插入基因终止密码子之后。
以这种方式构建菌株“文库”(也称为HTP基因设计文库),其中文库的每个成员是连接到n目标的x终止子在原本相同的基因背景下的例子。如此前所述,可以插入终止子组合,从而在构建文库时,扩大组合可能性的范围。
4.在依据一种或多种度量标准的菌株性能指示所优化的性能的背景下,高通量筛选菌株文库。
尤其可以扩展此基本方法以提供菌株性能的进一步改良:(1)将多个有益扰动合并到单一菌株背景中,按互动式程序进行,一次一个;或作为多个变化在单一步骤中进行。多个扰动可以是一组特定的定义变化或部分随机化的变化组合文库。举例来说,如果目标集是路径中的每种基因,那么使扰动文库在此前菌株文库的改良成员中依序再生能够优化路径中的每个基因的表达水平,不论哪种基因在任一次指定的迭代时具有速率限制性;(2)将由文库的个别和组合产生所得到的性能数据馈送到算法中,所述算法使用那个数据基于每个扰动的相互作用来预测最佳的扰动集;以及(3)实施上述两种方法的组合。
所述方法举工业微生物为例说明于本公开中,但适用于可以在基因突变体群体中鉴别出所期望性状的任何生物体。举例来说,这可以用于改良CHO细胞、酵母、昆虫细胞、藻类以及多细胞生物体(如植物)的性能。
在一些实施例中,提供一组终止序列,其可用于形成根据本公开的终止子交换文库。这组终止序列包括表3中所述的终止序列和其任何功能变异体,如与SEQ ID No.70到SEQ ID No.80具有至少70%、75%、80%、85%、90%、95%、99%或更高一致性的终止序列。
5.转座子诱变多样性文库:用于衍生转座子诱变多样性文库的分子工具
本公开中所述的某些工具涉及微生物菌株中的基因的现有多态性,但不产生可以适用于改良微生物菌株性能的新颖突变。本公开教示了一种转座子诱变系统,其随机产生突变,从所述突变中可以进一步筛选出引起宿主菌株特征改良的那些突变,所述特征改良继而对总宿主菌株表型(例如产量或生产率)产生有益作用。
例如,在一些实施例中,本公开教示了在宿主细胞中产生和鉴别突变的方法,所述突变在宿主细胞中展现一种或多种基因的一系列表达谱。此过程中产生的任何特定突变可以归入同类作为转座子诱变多样性文库,其在下文更详细地加以解释。
通过这一过程加以工程改造的所得微生物形成HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每个成员菌株代表了在原本相同基因背景下由转座子诱变产生的指定突变,所述文库称为“转座子诱变多样性文库”。
此外,HTP基因设计文库可指基因扰动(在这种情况下,由转座子诱变产生的指定突变)的集合。
此外,还提供除了由转座子诱变产生的特定突变外,原本假定在遗传上一致的微生物。可以对这些微生物进行适当筛选和表征并产生另一个HTP基因设计文库。表征HTP基因设计文库中的微生物菌株产生的信息和数据可以存储于任何数据存储构建体中,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这种数据/信息可以是例如对宿主细胞生长或宿主细胞中的分子产生造成的突变效应。这种数据/信息还可以是两种或更多种突变所引起的较宽组合效应集合。
由转座子诱变产生的突变的前述实例仅具说明性,原因是所述概念可以应用于基于表达谱范围的呈现和其对任何指定数目的基因的影响而已经归入同类的任何指定数目的突变。所属领域的技术人员还将认识到由转座子诱变产生的突变可与任何其它突变合并。因此,在一些实施例中,本公开教示了其中合并有1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个突变的文库。
概括地说,利用由生物体中转座子诱变产生的多种突变是优化所关注性状的强大工具。由本发明人开发的转座子诱变多样性文库的分子工具使用具有不同表达谱的突变的集合。然后利用高通量基因组工程将这种集合系统地应用于生物体。基于多种方法中的任一种方法确定这组突变影响所关注性状的可能性较高。在一些实施例中,所述文库含有饱和数目的突变(例如,理论上,微生物的基因组中的每种基因被命中至少一次)。在一些实施例中,未测定转座子诱变文库中的突变的基因组位置,因此所述文库含有在微生物基因组中随机分布的突变。在一些实施例中,转座子诱变文库中的突变是基于相关表型而选择。在一些实施例中,表征转座子诱变文库中的突变并测定突变的基因组位置,并鉴别经突变中断的基因。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于此前测定的有益遗传多样性而进行的算法选择。在一些实施例中,基因的选择可包括指定宿主中的所有基因。在其它实施例中,突变的选择可以是所指定宿主中的所有基因的随机选择的子集。在其它实施例中,突变的选择可以是参与所指定分子,如糖多孢菌属中的刺糖菌素的合成中的所有基因的子集。
随后在高通量筛选模型中评定含有由转座子诱变产生的突变的生物体的所得HTP基因设计微生物菌株文库的性能,并确定引起性能提高的突变并将信息存储在数据库中。基因扰动((即,突变)集合形成“转座子诱变文库”,其可以用作用于微生物工程处理中的潜在基因变异的来源。随着时间逝去,当针对宿主细胞背景的更大多样性实施基因扰动的更大集合时,每个文库作为实验上被证实的数据的主体而变得更强大,其能用于根据所关注的任何背景更精确地且可预测地设计出定向变化。
在一些实施例中,本公开的转座子诱变多样性文库可用于鉴别基因目标的最优表达。在一些实施例中,目标可以是增因的活性,以减少代谢或遗传路径中的瓶颈。在其它实施例中,目标可以是减少靶基因的活性,以便在不需要所述靶基因表达时,避免宿主细胞中发生不必要的能量消耗。
因此,在特定实施例中,使用转座子诱变多样性文库的方法是多步骤过程,其包含:
1.选择转座子系统以供诱变并将系统施用于指定微生物菌株中以产生由转座子所引起的突变。所述系统理想地显示使得转座子随机整合到所选微生物菌株(如糖多孢菌菌株)的基因组中。此类整合在一定程度上扰动基因表达。
2.进行高通量菌株工程改造以快速选择其基因组中整合有转座子的菌株。以这种方式构建出菌株的“文库”(还称为HTP基因设计文库),其中所述文库的每个成员是包含转座子突变的菌株,原本基因背景相同。如此前所述,可以合并突变组合,从而在构建文库时,扩大组合可能性的范围。
3.在依据一种或多种度量标准的菌株性能指示所优化的性能的背景下,高通量筛选菌株文库。
尤其可以扩展此基本方法以提供菌株性能的进一步改进:(1)将多个有益扰动合并到单一菌株背景中,以迭代程序一次一个进行;或作为多个变化在单一步骤中进行。多个扰动(突变)可以是所定义变化的特定集合或部分随机化的组合性变化文库,不论基因功能已被突变修改;(2)将文库的个别和组合产生所得到的性能数据输入算法,所述算法利用那个数据、基于每个扰动的相互作用预测最优的扰动集合;和(3)实施上述两种方法的组合。
在一些实施例中,转座酶在糖多孢菌属中发挥功能。在一些实施例中,转座酶源于EZ-Tn5转座子系统。在一些实施例中,DNA有效载荷序列侧接可被所述转座酶识别的镶嵌元件(ME)。在一些实施例中,DNA有效载荷可以是功能缺失(LoF)转座子或功能获得(GoF)转座子。
在一些实施例中,DNA有效载荷包含选择标记。在一些实施例中,可用于本公开的转座子诱变过程中的可选标记包括(但不限于):赋予对安普霉素抗性的aac(3)IV(SEQ IDNo.151)、赋予庆大霉素抗性的aacC1(SEQ ID No.152)、赋予对新霉素B抗性的aacC8(SEQID No.153)、赋予对奇霉素/链霉素抗性的aadA(SEQ ID No.154)、赋予对博莱霉素抗性的ble(SEQ ID No.155)、赋予对氯霉素抗性的cat(SEQ ID No.156)、赋予对红霉素抗性的ermE(SEQ ID No.157)、赋予对潮霉素抗性的hyg(SEQ ID No.158)和赋予对卡那霉素抗性的neo(SEQ ID No.159)。在一些实施例中,选择标记用于筛选含有转座子的糖多孢菌细胞。
在一些实施例中,DNA有效载荷包含反向选择标记。在一些实施例中,反向选择标记用于促进含有可选标记的DNA有效载荷的环出。在一些实施例中,可用于本公开的转座子诱变过程中的反向选择标记包括(但不限于):SEQ ID No.160(amdSYM)、SEQ ID No.161(tetA)、SEQ ID No.162(lacY)、SEQ ID No.163(sacB)、SEQ ID No.164(pheS,红色糖多孢菌)、SEQ ID No.165(pheS,棒状杆菌)。
在一些实施例中,本公开的方法不仅能够在具有基因组模块性的这些区域处执行靶向的基因组编辑,还实现在整个基因组中,在任何基因组背景下执行靶向的基因组编辑。因此,本公开的靶向基因组编辑可在任何区域处编辑刺糖多孢菌基因组,并且不局限于仅在具有模块性的区域处进行编辑。
在一些实施例中,GoF转座子包含GoF元件。在一些实施例中,GoF转座子包含启动子序列和/或溶解性标签序列(例如,SEQ ID No.166)。
在一些实施例中,本公开的转座子诱变文库在命中每种基因至少一次时具有95%置信度。在一些实施例中,通过筛选出呈生物体中的基因数目大约3×的多种分离株来获得所述文库。对于含有~8000个经注释的基因的刺糖多孢菌,期望呈~24,000个成员的诱变文库大小以涵盖所述基因组。
在一些实施例中,高通量筛选菌株的转座子诱变文库产生与参考菌株相比具有改良性能的菌株集合。在一些实施例中,这些收集菌株中的突变归因于转座子诱变,其引起这些收集菌株的改良性能合并以产生具有富集的所关注目标的新菌株。在一些实施例中,具有富集的所关注目标的所述新菌株可以与本公开的其它菌株(例如,SNP交换或启动子交换文库中的具有改良性能的菌株)组合以供进一步的定向基因工程。
6.核糖体结合位点(RBS)多样性文库:用于衍生RBS微生物菌株文库的分子工具
在一些实施例中,本公开教示了选择具有最佳表达特性的核糖体结合位点(RBS)以对整体宿主菌株表型(例如产量或生产率)产生有益作用的方法。
举例来说,在一些实施例中,本公开教示了鉴别一种或多种RBS和/或在宿主细胞内产生一种或多种RBS的变异体的方法,所述RBS展现一系列表达强度(例如下文论述的RBS梯)或优良调节特性(例如针对所选基因的更紧密调控)。已鉴别和/或产生的这些RBS的特定组合可以归入同类作为RBS梯,其更详细地解释于下文。
在一些实施例中,接着使相关RBS梯与所关注的指定基因关联。因此,如果具有RBS1到RBS31(表示已经鉴别和/或产生以展现一系列表达强度的31个RBS,SEQ ID No.97到SEQ ID No.127)并使RBS梯与微生物中的所关注单一基因关联(即,通过使所指定RBS可操作地连接到指定靶基因来对微生物进行基因工程改造),那么能够通过表征由每种组合尝试产生的每种经工程改造菌株来确认31个RBS的每种组合的作用,条件是除与靶基因关联的特定RBS之外,经工程改造的微生物具有原本相同的基因背景。
通过这一过程加以工程改造的所得微生物形成HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每种成员菌株代表了在原本相同基因背景下可操作地连接到特定靶基因的指定RBS,所述文库称为“RBS文库”。
此外,HTP基因设计文库可指基因扰动(在这种情况下,指定RBS x可操作地连接到指定基因y(并任选地还连接到指定启动子z))的集合。
另外,能够使用包含表11中的RBS的相同RBS梯对微生物进行工程改造,其中RBS中的每一个可操作地连接到不同基因目标。这个程序将得到微生物,除与所关注靶基因可操作地连接的特定RBS以外,所述微生物原本假定在遗传上一致。可以对这些微生物进行适当筛选和表征并产生另一个HTP基因设计文库。表征HTP基因设计文库中的微生物菌株产生的信息和数据可以存储于任何数据存储构建体中,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这个数据/信息可以是例如所指定RBS当可操作地连接到所指定基因目标时的作用。这个数据/信息还能够是通过使本公开的RBS中的两个或更多个与指定基因目标可操作地连接而产生的组合作用的更宽集合。
RBS和靶基因的前述实例仅具说明性,原因是所述概念可以应用于基于一系列表达强度的呈现而已经归入同类的任何指定数目的RBS和任何指定数目的靶基因。所属领域中的技术人员还将认识到两个或更多个RBS能够可操作地连接于任何基因目标的前方。因此,在一些实施例中,本公开教示了其中来自RBS梯的1、2、3或更多个RBS可操作地连接到一种或多种基因的RBS文库。
概括地说,利用各种RBS来驱动各种基因在生物体中的表达是一种优化所关注性状的强大工具。本发明人所开发的RBS文库分子工具是使用RBS序列梯,其已经证明可改变至少一个基因座在至少一种条件下的表达。接着利用高通量基因组工程学将此梯系统性地应用于生物体中的一组基因。基于多种方法中的任一种方法确定这组基因影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于此前测定的有益遗传多样性而进行的算法选择。在一些实施例中,基因的选择可以包括所指定宿主中的所有基因。在其它实施例中,基因的选择可以是所指定宿主中的所有基因的随机选择的子集。
接着对含有连接到基因的RBS序列的生物体的所得HTP基因设计微生物菌株文库在高通量筛选模型中的性能进行评定,并确定引起性能增强的RBS-基因连接并将信息存储于数据库中。基因扰动的集合(即,指定RBS x可操作地连接到指定基因y)形成“RBS多样性文库”,其可以用作用于微生物工程改造处理中的潜在基因变异的来源。随着时间逝去,当针对宿主细胞背景的更大多样性实施基因扰动的更大集合时,每个文库作为实验上被证实的数据的主体而变得更强大,其能用于根据所关注的任何背景更精确地且可预测地设计出定向变化。
生物体中的基因转录水平是影响生物体行为的控制关键点。转录与转译(蛋白质表达)紧密关联,并且哪种蛋白质以什么数量表达决定了生物体行为。细胞表达数千种不同类型的蛋白质,并且这些蛋白质以多种复杂的方式发生相互作用以产生功能。通过系统性地改变蛋白质集合的表达水平,能够使功能改变,由于复杂性,因此难以预测功能改变的方式。有些变异可以增强性能且因此与用于评估性能的机制关联,这项技术能够产生功能改良的生物体。
在小分子合成路径的背景下,酶通过其小分子底物和产物,在始于底物且终于所关注小分子的直链或支链中发生相互作用。由于这些相互作用依序关联,因此这一系统展现分布式控制,并且增强一种酶的表达仅能增加路径通量直到另一种酶变成速率限制型为止。
代谢控制分析(MCA)是一种利用实验数据和第一原理确定哪种酶具有速率限制性的方法。然而,MCA受到限制,原因是其在每种表达水平变化之后需要广泛的实验以确定新的速率限制酶。在这种情形下,RBS文库是有利的,原因是通过将RBS梯应用于路径中的每种酶,发现限制酶,并且同一件事可以随后进行多轮以发现变成速率限制型的新酶。另外,由于功能读数最好是所关注小分子的产量,因此确定哪种酶具限制性的实验与提高产量的工程学相同,从而缩短开发时间。在一些实施例中,本公开教示了将RBS文库应用于编码多单元酶的个别亚基的基因。在又其它实施例中,本公开教示对负责调控个别酶或整个生物合成路径的基因应用RBS文库技术的方法。
在一些实施例中,本公开的RBS文库可用于鉴别所选基因目标的最优表达。在一些实施例中,RBS文库的目标可以是增强靶基因的表达,以减少代谢或遗传路径中的瓶颈。在其它实施例中,RBS文库的目标可以是减少靶基因的表达,以便在不需要所述靶基因表达时,避免宿主细胞中发生不必要的能量消耗。
在其它细胞系统(如转录、转运或信号传导)的情形下,可以使用各种合理方法先验地尝试且找出哪种蛋白质是表达变化的目标和那种变化应该是什么变化。这些合理方法减少了扰动数目,所述扰动必须加以测试以发现改良性能的扰动,但是这样做的成本相当大。基因缺失研究鉴别出其存在对特定功能具关键作用的蛋白质,并且接着可以过度表达重要基因。由于蛋白质相互作用的复杂性,因此这对于增强性能而言通常无效。已经开发出不同类型的模型,其试图利用第一原理描述转录或信号传导行为与细胞中的蛋白质含量的关系。这些模型通常表明其中表达变化的目标可以产生不同或改良的功能。这些模型所基于的假设过分简单化且参数难以测量,因此其所产生的预测通常不正确,尤其对于非模型生物体来说。在基因缺失与建模的情况下,确定如何影响某种基因所需的实验不同于产生使性能改良的变化的后续工作。RBS文库方法避开了这些挑战,原因是突显了特定扰动的重要性的所构建菌株也已经是改良的菌株。
因此,在特定实施例中,使用RBS文库的方法是多步骤过程,其包含:
1.选择一组“x”个RBS以充当“梯”。理想的是,这些RBS已经显示引起跨越多个基因组基因座的高度可变化表达,但唯一的要求是其一定程度上扰动基因表达。
2.针对目标选择一组“n”个基因。这一集合可以是基因组中的每个开放阅读框架(ORF)或ORF的子集。可以利用关于功能相关ORF的注释、根据与此前证实的有益扰动的关系(此前RBS收集或此前SNP交换)、通过基于此前所产生的扰动之间的上位相互作用而进行的算法选择、基于与针对目标的有益ORF有关的假设的其它选择准则或通过随机选择来选择所述子集。在其它实施例中,“n”个靶基因可以包含非蛋白质编码基因,包括非编码RNA。
3.快速且在一些实施例中并行执行以下基因修饰的高通量菌株工程:当原生RBS存在于靶基因n的前方并且其序列已知时,用所述梯中的x个RBS中的每一种置换原生RBS。当原生RBS不存在或其序列未知时,将所述梯中的x个RBS中的每一个插入基因n的前方。以这种方式构建菌株“文库”(也称为HTP基因设计文库),其中文库的每个成员是可操作地连接到n目标的x RBS在原本相同的基因背景下的例子。如此前所述,可以合并RBS组合,从而在构建文库时,扩大组合可能性的范围。
4.在依据一种或多种度量标准的菌株性能指示所优化的性能的背景下,高通量筛选菌株文库。
尤其可以扩展此基本方法以提供菌株性能的进一步改良:(1)将多个有益扰动合并到单一菌株背景中,按互动式程序进行,一次一个;或作为多个变化在单一步骤中进行。多个扰动可以是一组特定的定义变化或部分随机化的变化组合文库。举例来说,如果目标集是路径中的每种基因,那么使扰动文库在此前菌株文库的改良成员中依序再生能够优化路径中的每个基因的表达水平,不论哪种基因在任一次指定的迭代时具有速率限制性;(2)将由文库的个别和组合产生所得到的性能数据馈送到算法中,所述算法使用那个数据基于每个扰动的相互作用来预测最佳的扰动集;以及(3)实施上述两种方法的组合。
所述方法举工业微生物为例说明于本公开中,但适用于可以在基因突变体群体中鉴别出所期望性状的任何生物体。举例来说,这可以用于改良CHO细胞、酵母、昆虫细胞、藻类以及多细胞生物体(如植物)的性能。
在一些实施例中,本公开的RBS文库可用作遗传多样性的来源。在一些实施例中,当引入到糖多孢菌菌株中时,本公开的RBS梯引起菌株的性能改良。在一些实施例中,所述改良菌株可以与本公开的具有另外基因多样性的其它菌株(例如,SNP交换或启动子交换文库中的具有改良性能的菌株)进一步合并以产生具有富集的所关注目标的新菌株。在一些实施例中,具有富集的所关注目标的所述菌株可用于进一步的定向菌株工程。
7.抗代谢物选择/发酵产物抗性文库:用于衍生多态性微生物菌株文库的分子工具
为了改良由微生物产生所需化合物,通常需要解决最终产物抑制问题。作为发酵过程的一部分,微生物产生多种化合物。有时所述化合物的积聚会严重抑制微生物的生长和生理学。为了改良发酵并延长期间微生物可合成所需代谢物的时间,必须解决a)最终产物的可能存在的毒性,和b)形成所需最终产物所需的分子路径的反馈抑制。
(a)在一些实施例中,本公开教示了在宿主细胞中产生和鉴别突变的方法,所述突变在宿主细胞中展现一种或多种基因的一系列表达谱,确切地说引起对宿主细胞中的指定代谢物或发酵产物改良抗性的突变,由此改良宿主细胞的性能。这一过程中鉴别的任何特定突变可以归入同类作为抗代谢物选择/发酵产物抗性文库,其更详细地解释于下文。
通过这一过程加以工程改造的所得微生物形成HTP基因设计文库。
HTP基因设计文库可以指通过这种过程形成的真实实体微生物菌株集合,其中每种成员菌株代表了在原本相同基因背景下在所述过程中鉴别到的指定突变,所述文库称为“抗代谢物选择/发酵产物抗性文库”。
此外,HTP基因设计文库可指基因扰动(在这种情况下,由本文所述的过程产生的指定突变)的集合。
此外,还提供原本假定在遗传上一致,除了引起对指定代谢物或发酵产物抗性的特定突变的微生物。可以对这些微生物进行适当筛选和表征并产生另一个HTP基因设计文库。表征HTP基因设计文库中的微生物菌株产生的信息和数据可以存储于任何数据存储构建体中,包括关系型数据库、面向对象数据库或高度分布式NoSQL数据库。这种数据/信息可以是例如对宿主细胞生长或宿主细胞中的分子产生造成的突变效应。这种数据/信息还可以是两种或更多种突变所引起的较宽组合效应集合。
由所述过程产生的突变的前述实例仅具说明性,原因是所述概念可以应用于基于表达谱范围的呈现和其对任何指定数目的基因的影响而已经归入同类的任何指定数目的突变。所属领域的技术人员还将认识到由本文所述的过程产生的突变可与任何其它突变合并。因此,在一些实施例中,本公开教示了其中合并有1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个突变的文库。
概括地说,利用生物体中产生对指定代谢物或发酵产物抗性的各种突变是优化所关注性状的强大工具。所述分子工具使用对指定代谢物或发酵产物抗性的突变的集合。在一些实施例中,所述突变引起菌株中的性能改良,如产量增加或产生一种或多种指定分子,如刺糖菌素。然后利用高通量基因组工程将这种集合系统地应用于生物体。基于多种方法中的任一种方法确定这组突变影响所关注性状的可能性较高。这些方法可以包括基于已知功能或对所关注性状的影响而进行的选择,或基于此前测定的有益遗传多样性而进行的算法选择。在一些实施例中,基因的选择可包括指定宿主中的所有基因。在其它实施例中,突变的选择可以是所指定宿主中的所有基因的随机选择的子集。在其它实施例中,突变的选择可以是参与所指定分子,如糖多孢菌属中的刺糖菌素的合成中的所有基因的子集。
接着对含有产生对指定代谢物或发酵产物抗性的突变的生物体的所得HTP基因设计微生物菌株文库在高通量筛选模型中的性能进行评定,并确定引起性能增强的突变并将信息存储于数据库中。基因扰动的集合(即,突变)形成“抗代谢物选择/发酵产物抗性文库”,其可以用作用于微生物工程改造处理中的潜在基因变异的来源。随着时间逝去,当针对宿主细胞背景的更大多样性实施基因扰动的更大集合时,每个文库作为实验上被证实的数据的主体而变得更强大,其能用于根据所关注的任何背景更精确地且可预测地设计出定向变化。
在一些实施例中,本公开的抗代谢物选择/发酵产物抗性多样性文库可用于鉴别基因目标的最优表达。在一些实施例中,目标可以是增加靶基因的活性,以减少代谢或遗传路径中的瓶颈。在其它实施例中,目标可以是减少靶基因的活性,以便在不需要所述靶基因表达时,避免宿主细胞中发生不必要的能量消耗。
因此,在特定实施例中,施用抗代谢物选择/发酵产物抗性文库的方法是多步骤过程,其包含:
1.进行高通量菌株工程,以快速选择对宿主菌株中的一种或多种指定代谢物或发酵产物具有抗性的菌株。所述系统理想地显示鉴别具有所有类型的多态性的菌株,不管所述多态性是否涉及指定代谢物或发酵产物的合成。
2.进行高通量菌株工程,以快速选择实际上具有改良性能(例如,产量增加或产生指定代谢物或发酵产物)的菌株。以这种方式构建出菌株的“文库”(还称为HTP基因设计文库),其中所述文库的每个成员是包含一种或多种有益多态性的菌株,原本基因背景相同。如此前所述,可以合并多态性组合,从而在构建文库时,扩大组合可能性的范围。
3.在依据一种或多种度量标准的菌株性能指示所优化的性能的背景下,高通量筛选菌株文库。
在一些实施例中,所述方法还包含确定如上文所述的初始选择步骤1的策略的步骤,如选择引起细胞生长抑制的优选代谢物/发酵产物、代谢物/发酵产物的适当浓度。
在一些实施例中,本公开的抗代谢物选择/发酵产物抗性文库可用作遗传多样性的来源。在一些实施例中,通过本公开方法鉴别的引起改良的对代谢物或发酵产物抗性的突变引起菌株性能改良。在一些实施例中,所述改良菌株可以与本公开的具有另外基因多样性的其它菌株(例如,SNP交换或启动子交换文库或转座子诱变文库中的具有改良性能的菌株)进一步合并以产生具有富集的所关注目标的新菌株。在一些实施例中,具有富集的所关注目标的所述菌株可用于进一步的定向菌株工程。
8.序列优化:用于衍生优化序列微生物菌株文库的分子工具
在一个实施例中,本公开的方法包含对宿主生物体所表达的一种或多种基因进行密码子优化。用于优化密码子以改善各种宿主中的表达的方法在所属领域中已知且描述于文献(参见美国专利申请公开第2007/0292918号,所述申请以全文引用的方式并入本文中)中。可以制备含有由特定原核生物或真核生物宿主优选的密码子的优化编码序列(也参见莫雷(Murray)等人(1989),核酸研究(Nucl.Acids Res.)17:477-508),例如提高转译速率或产生具有期望特性的重组RNA转录物,如半衰期比由非优化序列产生的转录物长。
蛋白质表达由大量因素控制,包括影响转录、mRNA处理以及转译稳定性和起始的那些因素。优化因此可以解决任何特定基因的多个序列特点中的任一个。作为一个特定实例,稀有密码子诱导的转译暂停能够引起蛋白质表达减少。稀有密码子诱导的转译暂停包括所关注聚核苷酸中的很少用于宿主生物体中的密码子的存在因其在可利用的tRNA池中的稀缺性而可能对蛋白质转译产生负面影响。
交替转译起始还会引起异源蛋白质表达减少。交替转译起始可以包括合成聚核苷酸序列,其不经意间含有能够充当核糖体结合位点(RBS)的基元。这些位点可以起始所截断蛋白质从基因内部位点的转译。一种减少产生所截断蛋白质(其在提纯期间可能难以去除)的可能性的方法包括将推定的内部RBS序列从优化的聚核苷酸序列中排除。
重复诱导的聚合酶打滑会引起异源蛋白质表达减少。重复诱导的聚合酶打滑涉及核苷酸序列重复,其已经表明可引起DNA聚合酶打滑或停顿,从而会引起移框突变。这类重复还能够引起RNA聚合酶打滑。在具有高G+C含量偏好的生物体中,可以存在由G或C核苷酸重复组成的较高程度的重复。因此,一种减少诱导RNA聚合酶打滑的可能性的方法包括改变G或C核苷酸的延长重复。
干扰二级结构还会引起异源蛋白质表达减少。二级结构能够隔离RBS序列或起始密码子且已经与蛋白质表达的减少相关。茎环结构还会涉及转录暂停和减弱。优化的聚核苷酸序列可以在核苷酸序列的RBS和基因编码区中含有最少的二级结构以实现转录和转译的改善。
举例来说,优化程序可以始于鉴别由宿主表达的所期望氨基酸序列。由所述氨基酸序列可以设计候选聚核苷酸或DNA序列。在合成DNA序列的设计期间,可以对密码子使用频率与宿主表达生物体的密码子使用进行比较且可以从合成序列中去除罕见的宿主密码子。另外,可以修饰合成候选DNA序列以便去除非期望的酶限制位点和添加或去除任何所期望的信号序列、连接子或未转译区域。可以分析合成DNA序列中的可能会干扰转译过程的二级结构的存在,如G/C重复和茎环结构。
9.上位定位-能够实现有益基因合并的预测分析工具
在一些实施例中,本公开教示了用于预测有益基因变异且将其合并到宿主细胞中的上位定位方法。基因变异可以利用前述HTP分子工具集(例如启动子交换、SNP交换、起始/终止密码子交换、序列优化)中的任一种产生且根据所衍生的HTP基因设计微生物菌株文库的表征已知那些基因变异的效应。因此,如本文所用,术语上位定位包括鉴别可能会引起宿主性能增强的基因变异组合(例如有益SNP或有益启动子/靶基因关联)的方法。
在实施例中,本公开的上位定位方法是基于如下构思:相较于来自同一功能群组的突变的组合,来自两种不同功能群组的有益突变的组合更可能改良宿主性能。参见例如考斯坦佐(Costanzo),细胞的基因前景(The Genetic Landscape of a Cell),科学,第327卷,第5964期,2010年1月22日,第425-431页(以全文引用的方式并入本文中)。
来自同一功能群组的突变更可能通过相同机制来运作,并且因此更可能对总体宿主性能展现负上位或中性上位效应。相比之下,来自不同功能群组的突变更可能通过独立机制来运作,从而能够引起宿主性能改善且在一些情况下产生协同效应。
因此,在一些实施例中,本公开教示了分析SNP突变以鉴别经预测属于不同功能群组的SNP的方法。在一些实施例中,SNP功能群组相似度是通过计算突变相互作用曲线的余弦相似度(类似于相关系数,参见图54A)来测定。本公开还通过突变相似度矩阵(参见图53)或树状图(参见图54A)来说明SNP的比较。
因此,上位定位程序提供了一种对在一种或多种基因背景下所施加的多种多样的基因突变进行分组和/或评级的方法,目的是将所述突变高效且有效地合并到一个或多个基因背景中。
在各方面中,进行合并的目标是产生新颖菌株,所述新颖菌株针对目标生物分子的产生经优化。通过所教示的上位定位程序,可以鉴别突变的功能分类,并且此功能分类能够实现使不期望的上位效应最小化的合并策略。
如此前所解释,供工业发酵使用的微生物的优化是一个重要的难题,其广泛牵涉到经济、社会和自然界。传统上,已经通过随机诱变的缓慢和不确定方法进行微生物工程改造。这类方法利用细胞的天然进化能力来适应人工强加的选择压力。这类方法还受到以下限制:有益突变的稀有性、潜在健康前景的稳固性,并且更通常来说,未充分利用细胞和分子生物学的现有技术水平。
现代方法利用了在机制层面对细胞功能的新了解并利用新的分子生物学工具对特定的表型末端进行靶向基因操控。在实践中,这类合理方法因生物学的潜在复杂性而发生混淆。对致病机制的了解不充分,尤其当尝试将各自具有所观察到的有益效应的两个或更多个变化组合时。有时,基因变化的这类合并产生积极结果(根据所期望表型活性的增强所测量),但是净积极结果可能低于预期并在一些情况下高于预期。在其他情况下,这类组合产生净中性效果或净消极效果。这种现象称为上位,并是微生物工程(一般是基因工程)的基本挑战之一。
如前所述,本公开的HTP基因组工程改造平台解决了与传统微生物工程改造方法相关的许多问题。本公开HTP平台利用自动化技术一次执行数百或数千个基因突变。在特定方面中,不同于上述合理方法,所公开的HTP平台能够并行构建数千个突变体以更有效地探究相关基因组空间的较大子集,如美国申请第15/140,296号(名称为:用于改良经工程改造的核苷酸序列的大规模生产的微生物菌株设计系统和方法,所述申请以全文引用的方式并入本文中)中所公开。通过尝试“所有事物”,本公开的HTP平台避开了我们的有限生物学了解所引起的困难。
然而,同时,本公开的HTP平台面对的问题是根本上局限于基因组空间的组合爆发性规模,以及计算机技术解释所产生的数据集的有效性(鉴于基因相互作用的复杂性)。需要以使产生所期望结果的组合的非随机选择最大化的方式探究广大组合空间的子集的技术。
在酶优化的情况下,在某种程度上相似的HTP方法已证明是有效的。在这一小生境问题中,所关注的基因组序列(约1000个碱基)编码物理构形有些复杂的蛋白质链。确切的构形是利用其组成性原子组分之间的整体电磁相互作用来确定。短基因组序列与物理上受约束的折叠问题的这种组合使得其自身特别渴望优化策略。即,可以使序列在每个残基处发生个别的突变并使所得突变体改组,从而按照与序列活跃性响应模型相容的分辨率有效地对局部序列空间取样。
然而,针对生物分子进行完整基因组优化时,这类以残基为中心的方法因一些重要原因而不充分。第一个原因是与生物分子的基因组优化有关的相关序列空间呈指数级增加。第二个原因是生物分子合成中的调节、表达和代谢相互作用的复杂性增加。本发明人已经通过所教示的上位定位程序解决了这些问题。
用于对一组突变之间的上位相互作用建立模型以便更高效并有效地将所述突变合并到一种或多种基因背景中的所教示方法在所属领域中具有开创性并且是非常需要的。
描述上位定位程序时,术语“更高效”和“更有效”是指相对于特定表型目标,避免合并菌株间的不期望上位相互作用。
由于所述方法已经大体详述如上,因此现将描述更具体的工作流程实例。
第一,以M个突变的文库和一种或多种基因背景(例如亲代细菌菌株)开始。在此所述的方法既非专门针对文库的选择、亦非专门针对基因背景的选择。但在特定实施方案中,突变文库可以排他地或组合性地包括:SNP交换文库、启动子交换文库,或本文所述的任何其它突变文库。
在一个实施方案中,仅提供单一基因背景。在这种情况下,首先利用此单一背景产生不同基因背景(微生物突变体)的集合。这可以如下实现:将初始突变文库(或其一些子集)应用于所指定的背景,例如将特定SNP的HTP基因设计文库或特定启动子的HTP基因设计文库应用于所指定的基因背景,从而在相同的基因背景下产生微生物突变体的群体(或许100个或1,000个),例外之处为其中并入了来自所指定的HTP基因设计文库的特定基因变异。如下详述,这一实施例可以产生文库或成对文库的组合。
在另一个实施方案中,可以简单地得到不同的已知基因背景的集合。如下详述,这一实施例可以产生组合文库的子集。
在一个特定实施方案中,为了使这种方法的有效性最大化,测定基因背景的数目和这些背景之间的基因多样性(根据突变数目或序列剪辑距离或其类似方面所测量)。
基因背景可以是天然的、原生的或野生型菌株或突变的经工程改造的菌株。N种不同背景菌株可以由向量b表示。在一个实例中,背景b可以代表如下形成的工程背景:将N个初始突变m0=(m1、m2、…mN)施加于野生型背景菌株b0以形成N种突变型背景菌株b=m0 b0=(m1b0、m2b0、…mN b0),其中mib0表示突变mi施加于背景菌株b0
在任一种情况(即,单一提供的基因背景,或基因背景的集合)下,结果是N种不同基因背景的集合。测量每种背景的相关表型。
第二,将M突变m1的集合中的每个突变施加于N种背景菌株的集合b内的每种背景,以形成M x N个突变体的集合。在其中N个背景本身通过施加初始突变集合m0而获得(如上文所述)的实施方案中,所得突变体集合有时称为组合文库或成对文库。在其中已经明确提供已知背景集合的另一个实施方案中,所得突变体集合可以称为组合文库的子集。类似于工程改造背景的载体的产生,在实施例中,输入界面202接收突变向量m1和背景向量b,以及指定的运算,如向量积。
继续以上述工程改造背景为例,形成MxN组合文库可以由m1 x m0 b0形成的矩阵(m1应用于b=m0 b0的N个背景的向量积)表示,其中m1中的每个突变施加于b内的每种背景菌株。所得MxN矩阵中的每个第i行表示m1内的第i个突变施加于背景集合b内的所有菌株。在一个实施例中,m1=m0和矩阵表示将相同突变成对施加于初始菌株b0。在这种情况下,矩阵围绕其对角线(M=N)是对称的,并且在任何分析中可以忽略对角线,因为其表示相同突变施加两次。
在实施例中,形成MxN矩阵可以通过向输入界面202中输入混合表达式m1 x m0b0来实现。表达式的分量向量可以与明确指定的其元件一起、根据一种或多种DNA规格直接输入,或读出到文库206以便在解译器204解译期间实现向量的撷取。如美国专利申请第15/140,296号(名称为“用于改良经工程改造的核苷酸序列的大规模生产的微生物菌株设计系统和方法”)中所述,LIMS系统200通过解译器204、执行引擎207、发订单引擎208和工厂210产生由输入表达式指定的微生物菌株。
第三,参照图29,分析设备214测量了MxN组合文库矩阵内的每种突变体的表型响应(4202)。因而,响应的集合可以理解为M x N响应矩阵R。R中的每个元素可以表示为rij=y(mi,mj),其中y表示工程集b内的背景菌株bj的响应(性能),如通过突变mi而发生突变。为了简单和实用性起见,我们采用成对突变,其中m1=m0。在突变集合表示成对突变文库的情况下(如本文),所得矩阵也可以称为基因相互作用矩阵或更具体地说,突变相互作用矩阵。
所属领域的技术人员将认识到,在一些实施例中,与上位效应和预测菌株设计有关的运算完全可以通过LIMS系统200的自动化方式进行,例如通过分析设备214或通过人工建构,或通过自动化方式与人工方式的组合。当运算并非完全自动进行时,LIMS系统200的元件(例如分析设备214)可以例如接收人工执行运算的结果,而非通过其自身的运算能力而产生结果。如本文在别处所述,LIMS系统200的组件(如分析设备214)可以完全或部分地通过一种或多种计算机系统来建构。在一些实施例中,尤其在与预测菌株设计有关的运算是利用自动化方式与人工方式的组合来执行的情况下,分析设备214不仅可以包括计算机硬件、软件或固件(或其组合),而且包括由操作人员操作的设备,如下表5中所列的设备,例如在“评估性能”类别下所列的设备。
第四,分析设备212将响应矩阵归一化。归一化由以下组成:调节实测响应值的人工过程和/或在这个实施例中为自动化过程以便去除偏好和/或分离出此方法所特有的效果的相关部分。就图29来说,第一步骤4202可以包括获得归一化的实测数据。一般来说,在针对预测菌株设计和上位定位的权利要求书中,术语“性能测量”或“实测性能”或其类似术语可以用于描述一种度量标准,其反映了实测数据(不论未处理或以某种方式处理),例如归一化数据。在一个特定实施方案中,归一化可以通过从实测响应值中减去此前测量的背景响应来执行。在那种实施方案中,所得响应元素可以形成为rij=y(mi,mj)-y(mj),其中y(mj)是因向亲代菌株b0施加初始突变mj引起工程集b内的工程背景菌株bj的响应。应注意归一化响应矩阵内的每一行是作为其相应突变的响应分布来处理。即,第i行描述了施加于j=1到N的所有背景菌株bj的相应突变mi的相对效应。
就成对突变的实例来说,由两种突变引起的菌株的组合性能/响应可以大于、小于或等于每一种突变个别引起的菌株的性能/响应。这种效应称为“上位”且在一些实施例中,可以用eij=y(mi,mj)-(y(mi)+y(mj))表示。这种数学表示可以存在变化形式,并可以取决于例如个别变化在生物学上发生相互作用的程度。如上文所提及,来自同一功能群组的突变更可能通过相同机制来运作,并因此更可能对总体宿主性能展现负上位或中性上位效应。相比之下,来自不同功能群组的突变更可能通过独立机制来运作,从而能够通过例如减少冗余突变效应来改良宿主性能。因此,产生差异响应的突变比产生相似响应的突变更可能按叠加方式组合。由此引起在下一步骤中计算相似度。
第五,分析设备214测量了响应间的相似度,在成对突变实例中,这是响应矩阵内的第i个突变与第j(例如初始)突变的效应之间的相似度(4204)。请记住:R中的第i行表示第i个突变mi施加于N种背景菌株的性能效应,其中的每一种本身可以是如上文所述的工程改造突变的结果。因此,第i个和第j个突变的效应之间的相似度可以分别由第i行ρi与第j行ρj之间的相似度sij表示,以形成相似度矩阵S,其实例说明于图53中。相似度可以使用多种已知技术测量,如交叉相关或绝对余弦相似度,例如sij=abs(cos(ρij))。
作为度量标准(如余弦相似度)的一个替代或补充方案,可以对响应曲线进行聚类以测定相似度。聚类可以使用基于距离的聚类算法(例如k均值、分层凝聚等)、结合适合的距离测量(例如欧几里德(Euclidean)、汉明(Hamming)等)来进行。或者,可以使用基于相似度的聚类算法(例如光谱、最小切割等)、通过适合的相似度测量(例如余弦、相关度等)来执行聚类。当然,可以通过任何数目个标准函数运算(例如指数函数)来使距离测量对应于相似度测量且反之亦然。在一个实施方案中,分层凝聚聚类可以结合绝对余弦相似度来使用。(参见图54A)。
举聚类为例,假设C是突变mi按照k个不同簇的聚类。假设C是簇成员矩阵,其中cij是突变i属于簇j的程度(0与1之间的值)。接着利用Ci×Cj(C的第i行与第j行的点积)得到突变i与j之间的基于簇的相似度。一般来说,基于簇的相似度矩阵由CCT给定(即,C乘以C转置矩阵)。在硬聚类(突变恰好属于一个簇)的情况下,两个突变之间的相似度是1(如果其属于同一簇)和0(如果不)。
如考斯坦佐(Costanzo),细胞的基因前景,科学,第327卷,第5964期,2010年1月22日,第425-431页(以全文引用的方式并入本文中)所述,突变响应曲线的这种聚类是指细胞潜在功能组织的大致定位。即,聚为同类的突变倾向于与潜在的生物过程或代谢途径相关。这类突变在本文中称为“功能群”。这种方法的关键观察结果在于,如果两个突变通过相同的生物过程或途径来运作,那么所观察到的效应(和值得注意的是所观察到的效益)可能是冗余的。反之,如果两个突变通过远端机制来运作,那么有益效应不大可能是冗余的。
第六,基于上位效应,分析设备214选择产生差异响应的突变对,例如其余弦相似度度量标准低于相似度阈值,或其响应属于充分分隔的簇中(例如图53和图54A),如图29(4206)所示。优于相似对,所选突变对应该基于其差异性而合并到背景菌株中。优于相似对,所选突变对应该基于其差异性而合并到背景菌株中。
基于所选突变对产生充分差异响应,可以利用LIMS系统(例如解译器204、执行引擎207、下单器208和工厂210)设计具有那些所选突变的微生物菌株(4208)。在实施例中,如下文所述和本文别处所述,上位效应可以内置于预测模型中或结合预测模型使用以赋予菌株选择权重或过滤菌株选择。
假定可以通过一些优选的预测模型估计假想菌株的性能(也称为分数),所述假想菌株是通过将来自文库的突变集合合并到特定背景中来获得。教示方法中所用的代表性预测模型提供于标题为“预测菌株设计(Predictive Strain Design)”的下述章节中,所述章节见于更大章节:“全基因组基因设计准则的计算分析和效果预测(ComputationalAnalysis and Prediction of Effects of Genome-Wide Genetic Design Criteria)”。
当使用预测菌株设计技术(如线性回归)时,分析设备214可以将模型约束到具有低相似度测量值的突变,例如通过过滤回归结果以便仅保留具有充分差异性的突变。或者,可以利用相似度矩阵赋予预测模型权重。举例来说,一些实施例可以利用加权的最小二乘法回归,其使用相似度矩阵来表征所提出的突变的相互依赖性。举例来说,可以通过将“内核”策略应用于回归模型来执行加权。(就“内核策略”是多种机器学习建模方法的通用策略来说,这种再加权策略不限于线性回归。)
所属领域的技术人员已知这类方法。在实施例中,内核是具有元素1-w*sij的矩阵,其中1是恒等矩阵的元素,并且w是0与1之间的实值。当w=0时,此简化为标准回归模型。在实践中,当针对成对组合构建体和其关联效应y(mi,mj)评估时,w值将与预测模型的精确度(r2值或均方根误差(RMSE))相关。在一个简单的实施方案中,w定义为w=1-r2。在这种情况下,当模型完全可预测时,w=1-r2=0且合并仅基于预测模型且上位定位程序不起作用。另一方面,当预测模型根本不能预测时,w=1-r2=1且合并仅基于上位定位程序。在每次迭代期间,可以评估精确度以确定模型性能是否改良。
应该明确,本文所述的上位定位程序不取决于分析设备214使用哪种模型。鉴于这种预测模型,有可能对通过组合合并可近接突变文库的所有假想菌株评分和评级。
在一些实施例中,为了考虑上位效应,分析设备214可以利用差异突变响应曲线来增加与得自预测模型的每种假想菌株相关的分数和等级。这种程序可以广泛地被认为是分数的再加权,从而有利于具有差异响应曲线的候选菌株(例如从多种多样的簇中抽取的菌株)。在一个简单的实施方案中,菌株的分数可以因不满足差异性阈值或从同一簇(具有适合权重)中抽取的组成性突变的数目而降低。在一个简单的实施方案中,菌株的分数可以因不满足差异性阈值或从同一簇(具有适合权重)中抽取的组成性突变的数目而降低。可以利用这些强化分数对假想菌株再评级。在实践中,这类再加权计算可以结合初始分数评估来进行。
结果得到假想菌株的集合,其分数和等级经强化以更有效地避免令人混淆的上位相互作用。此时可以构建假想菌株,或可以将其传送到另一计算方法供后续分析或使用。
所属领域的技术人员将认识到,如本文所述的上位定位和迭代预测菌株设计不限于仅使用成对突变,而是可以扩展到将许多更多的突变同时施加到背景菌株。在另一个实施例中,可以将另外突变依序施加到已经利用根据本文所述的预测方法所选的突变发生突变的菌株。在另一个实施例中,上位效应如下推测:将相同的基因突变施加到彼此稍微不同的多种菌株背景,并记录经改造的菌株背景间的正响应曲线的任何显著差异。
接合HTP的接合以引入外源DNA
本公开还提供将遗传物质从供体微生物细胞转移到糖多孢菌微生物的受体细胞的方法。供体微生物细胞可以是任何适合的供体细胞,包括(但不限于)大肠杆菌细胞。所述受体微生物细胞可为糖多孢菌物种,如刺糖多孢菌菌株。
一般来说,所述方法包含以下步骤:(1)将受体细胞继代培养到指数中期(任选的);(2)将供体细胞继代培养到指数中期(任选的);(3)合并供体和受体细胞;(4)将供体和受体细胞混合物涂铺于接合培养基上;(5)培育板以使细胞接合;(6)施加针对供体细胞的抗生素选择;(7)施加针对未整合的受体细胞的抗生素选择;和(8)进一步板以使整合受体细胞生长。
本申请的发明人发现了引起刺糖多孢菌中外源DNA接合的频率出人意料地增加的可经优化的条件。所述条件包括(但不限于):(1)洗涤受体细胞(例如,接合之前);(2)供体细胞和受体细胞在相对较低温度下结合;(3)在接合之前将受体细胞继代培养延长时段;(4)用于接合的供体细胞:受体细胞的适当比率;(5)将用于针对供体细胞的选择的抗生素药物递送到接合混合物的适当时间安排;(6)将用于针对受体细胞的选择的抗生素药物递送到接合混合物的适当时间安排;(7)干燥涂铺有供体和受体细胞混合物的接合培养基的适当时间安排;(8)高浓度葡萄糖;(9)供体细胞的适当浓度;和(10)受体的适当浓度。
在一些实施例中,利用引起接合增加的以下条件中的至少两个、三个、四个、五个、六个、七个或更多个:
(1)洗涤受体细胞;
(2)供体细胞和受体细胞在约25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃的温度下(如在30℃下)接合;
(3)接合之前,将受体细胞继代培养至少约40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55小时,如约48小时;
(4)用于接合的供体细胞:受体细胞比率是约1:0.5、1:0.6、1:0.7、1:08、1:0.9、1:1.0、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.81:1.9或1:2.0(如约1:0.6到1:1.0);
(5)在供体细胞和受体细胞混合之后约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30小时(如之后约24小时),将用于针对供体细胞的选择的抗生素药物递送到混合物;
(6)在供体细胞和受体细胞混合之后约35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54或55小时(如约40到48小时),将用于针对受体细胞的选择的抗生素药物递送到混合物;
(7)将涂铺有供体和受体细胞混合物的接合培养基干燥至少约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时或15小时;
(8)接合培养基包含至少约0.5g/L、1g/L、1.5g/L、2g/L、2.5g/L、3g/L、3.5g/L、4g/L、4.5g/L、5g/L、5.5g/L、6g/L、6.5g/L、7g/L、7.5g/L、8g/L、8.5g/L、9g/L、9.5g/L、10g/L或更高葡萄糖;
(9)供体细胞的浓度是约OD600=0.1、0.15、0.2、0.25、0.30、0.31、0.32、0.33、0.34、0.35、0.36、0.37、0.38、0.39、0.4、0.41、0.42、0.43、0.44、0.45、0.46、0.47、0.48、0.49、0.50、0.51、0.52、0.53、0.54、0.55、0.56、0.57、0.58、0.59、0.60、0.65、0.70、0.75、0.80、0.85、0.90、0.95、1.0;和
(10)受体细胞的浓度是约OD540=1.0、2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0、10.5、11.0、11.5、12.0、12.5、13.0、13.5、14.0、14.5或15.0。
在一些实施例中,混合物中供体细胞或受体细胞的总数是约5×106、6×106、7×106、8×106或约9×106
在一些实施例中,供体细胞是大肠杆菌细胞,并且用于针对受体细胞的选择的抗生素药物是萘啶酸。在一些实施例中,萘啶酸的浓度是约50、60、70、80、90、100、110、120、130、140、150、60、170、180、190或200μg/ml。
在一些实施例中,用于针对受体细胞的选择的抗生素药物是安普霉素,并且浓度是约50、60、70、80、90、100、110、120、130、140、150、60、170、180、190、200、210、220、230、240、250、260、270、280、290、300μg/ml。
如本文所述的方法可以高通量过程执行。在一些实施例中,所述方法在48孔Q型托盘上执行。在一些实施例中,高通量过程是部分或完全自动化的。
在一些实施例中,供体细胞和受体细胞的混合物是液体混合物,并利用摇摆运动将足够体积的液体混合物涂铺于培养基上,其中所述液体混合物分散在培养基的整个区域上。
在一些实施例中,所述方法包含通过用酵母针进行菌落挑选来转移接合后体,以供用供体细胞所提供的整合DNA进行后续受体细胞接种的自动化过程。在一些实施例中,菌落挑选以升沉运动或搅拌运动执行。
在一些实施例中,用以下条件中的至少两个、三个、四个、五个、六个或七个来执行所述方法:(1)在接合之前,洗涤受体细胞;(2)在约30℃的温度下接合供体细胞和受体细胞;(3)在接合之前,将受体细胞继代培养至少约48小时;(4)用于接合的供体细胞:受体细胞比率是约1:0.8;(5)将供体细胞和受体细胞混合之后约20小时,将用于针对供体细胞的选择的抗生素药物递送到混合物;(6)混合物中供体细胞的量或受体细胞的量是约7×106;和(7)接合培养基包含约6g/L葡萄糖。
路径重构
本公开提供路径重构的方法。如本文所用,术语“路径重构”是指在微生物中建构一个或多个完全或部分最佳生物合成路径的过程。在一些实施例中,生物合成路径与一个或多个所关注产物,如刺糖菌素的合成相关。
路径重构的方法可利用本公开的一个或多个工具。在不希望受任何特定理论束缚的情况下,路径重构的方法可微调直接参与生物合成路径的一种或多种基因的活性或间接参与生物合成路径的一种或多种基因(例如,可间接影响所关注指定产物的生物合成的基因)的活性。在一些实施例中,为了微调参与生物合成路径的一种或多种基因,所述方法包含利用本公开的一个或多个基因多样性文库,其包括(但不限于)启动子梯文库、RBS梯文库、终止子文库、终止/起始密码子文库等。在一些实施例中,参与生物合成路径的一种或多种基因的活性经如本文中所公开的至少一个基因工具调整。在一些实施例中,可经由如本公开中所述的高通量系统筛选带有修饰基因的菌株,以鉴别与对照菌株(如未进行调整的菌株)相比,具有改良性能的菌株。
因此,微调参与生物合成路径的一、二、三、四、五、六、七、八、九、十或更多种基因。在一些实施例中,微调任何数目的基因。在一些实施例中,微调基因处于相同信号传导路径或合成路径中。在一些实施例中,微调基因处于不同信号传导路径或合成路径中。在一些实施例中,根据需要调整某些基因的活性,只要所述调整引起菌株性能改良即可。在一些实施例中,与对照菌株相比,上调一种或多种基因的活性。在一些实施例中,与对照菌株相比,下调一种或多种基因的活性。在一些实施例中,与对照菌株相比,改变一种或多种基因的表达的时间安排。在一些实施例中,与对照菌株相比,改变一种或多种基因的表达的位置。在一些实施例中,与对照菌株相比,调整参与速率测定步骤(RDS)或速率限制步骤的一种或多种基因的活性。在一些实施例中,合并一、二、三、四、五、六、七、八、九、十或更多种调整基因的基因座以伴随进一步微调生物合成路径产生菌株。
在一些实施例中,路径重构方法包含将遗传物质并入本公开的微生物基因组中。在一些实施例中,所述微生物是糖多孢菌属,如刺糖多孢菌,并将遗传物质并入微生物基因组中的特定位置(例如,“着陆垫”)。在一些实施例中,所述特定位置选自如本文所述的本公开中性整合位点(NIS)。
在一些实施例中,经由可自复制的载体将遗传物质引入到本公开微生物中。在一些实施例中,所述微生物是糖多孢菌属,如刺糖多孢菌,并经由如本文所述的本公开自复制质粒将遗传物质引入到微生物中。
顺从基因设计的生物体
所公开的HTP基因组工程改造平台虽然以工业微生物细胞培养物(例如糖多孢菌属)为例说明,但是适用于任何宿主细胞生物体,其中能够在基因突变体群体中鉴别出所期望的性状。
因此,如本文所用,术语“微生物”应在宽广的意义上理解。其包括(但不限于)两个原核生物结构域:细菌和古细菌,以及某些真核生物真菌和原生生物。然而,在某些方面中,本文教示的方法中可以使用“更高级”真核生物体,如昆虫、植物和动物。
适合的宿主细胞包括(但不限于):抗微生物糖多孢菌(Saccharopolysporaantimicrobia)、洞穴糖多孢菌(Saccharopolyspora cavernae)、宿务糖多孢菌(Saccharopolyspora cebuensis)、菊花糖多孢菌(Saccharopolyspora dendranthemae)、红色糖多孢菌(Saccharopolyspora erythraea)、黄色糖多孢菌(Saccharopolysporaflava)、加尔达糖多孢菌(Saccharopolyspora ghardaiensis)、嘉兰糖多孢菌(Saccharopolyspora gloriosae)、格氏糖多孢菌(Saccharopolyspora gregorii)、嗜盐糖多孢菌(Saccharopolyspora halophile)、耐盐糖多孢菌(Saccharopolysporahalotolerans)、披发糖多孢菌(Saccharopolyspora hirsute)、霍氏糖多孢菌(Saccharopolyspora hordei)、印度糖多孢菌(Saccharopolyspora indica)、江西糖多孢菌(Saccharopolyspora jiangxiensis)、盐湖糖多孢菌(Saccharopolyspora lacisalsi)、博他仑糖多孢菌(Saccharopolyspora phatthalungensis)、七角形糖多孢菌(Saccharopolyspora qijiaojingensis)、直杆糖多孢菌(Saccharopolysporarectivirgula)、玫瑰糖多孢菌(Saccharopolyspora rosea)、山东糖多孢菌(Saccharopolyspora shandongensis)、刺糖多孢菌(Saccharopolyspora spinosa)、针脊孢糖多孢菌(Saccharopolyspora spinosporotrichia)、塔氏糖多孢菌(Saccharopolyspora taberi)、高温糖多孢菌(Saccharopolyspora thermophile)、雷公藤糖多孢菌(Saccharopolyspora tripterygii)。
在一些实施例中,宿主细胞选自印第安糖多孢菌(Saccharopolysporaindianesis)(
Figure BDA0002371045810000731
BAA-2551TM)、红色糖多孢菌(沃克斯曼(Waksman))拉贝达(Labeda)(
Figure BDA0002371045810000732
31772TM)、红色糖多孢菌(沃克斯曼)拉贝达(
Figure BDA0002371045810000733
11912TM)、直杆糖多孢菌(克拉西尔尼科夫(Krasil'nikov)和阿格莱(Agre))科恩-文迪施(Korn-Wendisch)等人(
Figure BDA0002371045810000734
29034TM)、硬毛糖多孢菌(Saccharopolyspora hirsuta)亚种硬毛莱西和古德费洛(Laceyand Goodfellow)(
Figure BDA0002371045810000735
27875TM)、NEB#998(
Figure BDA0002371045810000736
98102TM)、硬毛糖多孢菌亚种柯本氏(kobensis)(岩崎(Iwasaki)等人)莱西(
Figure BDA0002371045810000737
20501TM)、直杆糖多孢菌(克拉西尔尼科夫和阿格莱)科恩-文迪施等人(
Figure BDA0002371045810000738
29035TM)、红色糖多孢菌(沃克斯曼)拉贝达(
Figure BDA0002371045810000739
11635D-5TM)
Figure BDA00023710458100007310
编号:11635D-5TM、塔氏糖多孢菌(拉贝达)科恩-文迪施等人(
Figure BDA00023710458100007311
49842TM)、硬毛糖多孢菌亚种硬毛莱西和古德费洛(
Figure BDA00023710458100007312
27876TM)、橙黄糖多孢菌(艾蒂安)等人(
Figure BDA00023710458100007313
51351TM)、格氏糖多孢菌古德费洛等人(
Figure BDA00023710458100007314
51265TM)、红色糖多孢菌(沃克斯曼)拉贝达(
Figure BDA0002371045810000741
11635TM)、直杆糖多孢菌(克拉西尔尼科夫和阿格莱)科恩-文迪施等人(
Figure BDA0002371045810000742
33515TM)、直杆糖多孢菌(克拉西尔尼科夫和阿格莱)科恩-文迪施等人(
Figure BDA0002371045810000743
15347TM)、刺糖多孢菌莫兹(Mertz)和姚(Yao)(
Figure BDA0002371045810000744
49460TM)、直杆糖多孢菌(克拉西尔尼科夫和阿格莱)科恩-文迪施等人(
Figure BDA0002371045810000745
21450TM)、霍氏糖多孢菌古德费洛等人(
Figure BDA0002371045810000746
49856TM)、直杆糖多孢菌(克拉西尔尼科夫和阿格莱)科恩-文迪施等人(
Figure BDA0002371045810000747
29681TM)、pIJ43[MCB1023](
Figure BDA0002371045810000748
39156TM)、pOJ31(
Figure BDA0002371045810000749
77416TM)和直杆糖多孢菌(21451)。
产生基因多样性池供基因设计和HTP微生物工程改造平台使用
在一些实施例中,本公开的方法的特征为基因设计。如本文所用,术语基因设计是指通过鉴别和选择特定基因的最佳变异体、基因的一部分、启动子、终止密码子、5'UTR、3'UTR、核糖体结合位点、终止子或其它DNA序列来重建或改变宿主生物体基因组,以设计和产生新的优良宿主细胞。
在一些实施例中,本公开的基因设计方法中的第一步骤是获得具有多种序列变异的初始基因多样性池群体,由此群体可以重建新的宿主基因组。
在一些实施例中,本文所教示的基因设计方法中的后续步骤将使用前述HTP分子工具集(例如SNP交换或启动子交换)中的一种或多种构建HTP基因设计文库,所述HTP基因设计文库接着通过提供用于在宿主细胞中测试的特定基因组变异文库来充当基因组工程学方法的驱动器。
利用来自现有野生型菌株的多样性池
在一些实施例中,本公开教示了用于鉴别所指定野生型群体的微生物间所存在的序列多样性的方法。因此,可以将分析所用的野生型微生物的指定种数n赋予多样性池,其中所述微生物基因组代表“多样性池”。
在一些实施例中,多样性池可以是所述野生型微生物间的天然基因变异所存在的现有多样性的结果。这种变异可以由所指定宿主细胞的菌株变异体产生或可以是作为完全不同物种的微生物所产生。基因变异可以包括菌株基因序列的任何差异,不论天然存在或不存在。在一些实施例中,基因变异可以包括SNP交换、PRO交换、起始/终止密码子交换、STOP调换、转座子诱变多样性文库、核糖体结合位点多样性文库、抗代谢物选择/发酵产物抗性文库以及其它。
利用来自现有工业菌株变异体的多样性池
在本公开的其它实施例中,多样性池是在传统菌株改良过程中所产生的菌株变异体(例如通过随机突变而产生且选用于多年来提高产量的一种或多种宿主生物体菌株)。因此,在一些实施例中,多样性池或宿主生物体可以包含历史性生产菌株的集合。
在特定方面,多样性池可以是原始亲代微生物菌株(S1),其在特定时间点具有“基线”基因序列(S1Gen1);且接着是衍生/开发自所述S1菌株的任何数目个后续子代菌株(S2、S3、S4、S5等,可归纳为S2-n),其相对于S1的基线基因组,具有不同基因组(S2-nGen2-n)。
举例来说,在一些实施例中,本公开教示了对多样性池中的微生物基因组进行测序以鉴别每种菌株中存在的SNP。在一个实施例中,多样性池中的菌株是历史上的微生物生产菌株。因此,本公开的多样性池可以包括例如工业基本菌株,和通过传统菌株改良程序所产生的一种或多种突变型工业菌株。
鉴别出多样性池中的所有SNP后,本公开教示了用SNP交换方法和筛选方法描绘(即,量化和表征)个别和群组中的SNP的效应(例如所关注的表型的产生)。因此,如前所述,所教示平台中的初始步骤可以获得具有多种序列变异(例如SNP)的初始基因多样性池群体。接着,所教示平台中的后续步骤可以使用一种或多种前述HTP分子工具集(例如SNP交换)构建HTP基因设计文库,其接着通过提供用于在微生物中测试的特定基因组变异文库来充当基因组工程学方法的驱动器。
在一些实施例中,本公开的SNP交换方法包含将突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一种或多种SNP引入基本菌株(S1Gen1)或野生型菌株的步骤。
在其它实施例中,本公开的SNP交换方法包括将在突变型菌株(例如来自S2-nGen2-n的菌株)中所鉴别的一种或多种SNP去除的步骤。
通过诱变来产生多样性池
在一些实施例中,所指定多样性池细胞群中的所关注突变能够利用使菌株发生突变的任何方式(包括诱变化学品或辐射)人工产生。术语“诱变”在本文中用于指一种诱导细胞核酸材料发生一种或多种基因修饰的方法。
术语“基因修饰”是指DNA的任何改变。代表性基因修饰包括核苷酸插入、缺失、取代以及其组合,并可以小如单个碱基或大如数万个碱基。因此,术语“基因修饰”涵盖核苷酸序列的倒位和其它染色体重排,借此改变包含染色体区域的DNA的位置或取向。染色体重排可以包含染色体内重排或染色体间重排。
在一个实施例中,本公开标的中所用的诱变方法基本上是随机的,以便基因修饰能够在待诱变的核酸材料内的任何可利用核苷酸位置发生。换句话说,在一个实施例中,诱变不展示在特定核苷酸序列处发生的偏好或频率增加。
本公开的方法可以使用任何诱变剂,包括(但不限于):紫外光、X射线辐射、γ辐射、N-乙基-N-亚硝基脲(ENU)、甲基亚硝基脲(MNU)、丙卡巴肼(procarbazine)(PRC)、三亚乙基三聚氰胺(TEM)、丙烯酰胺单体(AA)、苯丁酸氮芥(CHL)、美法仑(MLP)、环磷酰胺(CPP)、硫酸二乙酯(DES)、甲烷磺酸乙酯(EMS)、甲烷磺酸甲酯(MMS)、6-巯基嘌呤(6-MP)、丝裂霉素-C(MMC)、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、3H2O和氨基甲酸酯(UR)(参见例如林奇克(Rinchik),1991;马克(Marker)等人,1997;和拉塞尔(Russell),1990)。其它诱变剂已为所属领域中的技术人员所熟知,包括iephb.nw.ru/~spirov/hazard/mutagen_lst中所述的那些。
在一些实施例中,本公开中所述的一种或多种诱变策略可用以产生、筛选和合并所关注突变。在一些实施例中,本公开中所述的基因工具可用于形成基因多样性。例如,启动子交换方法、SNP交换方法、起始/终止密码子交换方法、终止子交换方法、转座子诱变方法、核糖体结合位点方法、抗代谢物选择/发酵产物抗性方法或其任何组合可以用作形成基因多样性的其它机会。
术语“诱变”还涵盖了用于改变(例如通过靶向突变)或调节细胞功能、借此增强诱变速率、品质或程度的方法。举例来说,可以改变或调节细胞,借此使其在DNA修复、诱变剂代谢、诱变剂敏感性、基因组稳定性或其组合方面出现功能异常或缺陷。因此,通常维持基因组稳定性的基因功能的干扰可以用于增强诱变。干扰的代表性目标包括(但不限于)DNA连接酶I(本特雷(Bentley)等人,2002)和酪蛋白激酶I(美国专利第6,060,296号)。
在一些实施例中,利用定点诱变(例如使用市购试剂盒(如Transformer定点诱变试剂盒(克隆科技公司))进行的引物定向诱变)在整个核酸序列中产生多种变化,以便产生编码裂解酶的本公开核酸。
暴露于一种或多种诱变剂后发生基因修饰的频率可以通过改变处理剂量和/或重复次数来调节,并且可以根据特定应用来定制。
因此,在一些实施例中,如本文所用,“诱变”包含所属领域中已知的用于诱导突变的所有技术,包括易错PCR诱变、寡核苷酸定向诱变、定点诱变、转座子诱变以及利用本文所述的任何技术进行的迭代序列重组。
产生多样性的单一基因座突变
在一些实施例中,本公开教示了通过引入、缺失或置换基因组DNA的所选部分来使细胞群发生突变。因此,在一些实施例中,本公开教示了使突变对准特定基因座的方法。在其它实施例中,本公开教示了利用基因编辑技术(如ZFN、TALENS或CRISPR)选择性地编辑目标DNA区域。
在其它实施例中,本公开教示了使宿主生物体外部的所选DNA区域发生突变并接着将突变序列插回到宿主生物体中。举例来说,在一些实施例中,本公开教示了使原生或合成启动子发生突变,以产生具有各种表达特性的一系列启动子变异体(参见下文的启动子梯)。在其它实施例中,本公开与单基因优化技术兼容,如ProSAR(福克斯(Fox)等人,2007,“通过ProSAR驱动型酶演变来改良催化功能(Improving catalytic function by ProSAR-driven enzyme evolution)”,自然生物技术(Nature Biotechnology)第25卷(3)338-343,所述文献以引用的方式并入本文中)。
在一些实施例中,DNA的所选区域是在试管内通过天然变异体的基因改组或用合成寡核苷酸改组、质粒-质粒重组、病毒质粒重组、病毒-病毒重组来产生。在其它实施例中,基因组区域是通过易错PCR产生(参见例如图1)。
在一些实施例中,在所选基因区域中产生突变是利用“再组装PCR”完成。简单来说,合成寡核苷酸引物(寡核苷酸)用于对所关注的核酸序列区段进行PCR扩增,以便寡核苷酸的序列叠覆两个区段的接合点。叠覆区域的长度通常是约10到100个核苷酸。所述区段各自用一组这样的引物扩增。接着根据组装方案“再组装”PCR产物。简单来说,在组装方案中,首先通过例如凝胶电泳或尺寸排阻色谱而从引物中提纯PCR产物。将提纯的产物混合在一起且在聚合酶和三磷酸脱氧核苷(dNTP's)和适当缓冲盐存在下、在缺乏另外引物的情况下(“自引导”)经历约1-10个变性、再粘接和延伸的循环。随后利用PCR以及基因侧接之引物扩增经完全再组装和改组的基因的产量。
在本公开的一些实施例中,突变的DNA区域(如上文所论述的那些)富集了突变序列,从而更有效地对多个突变范围(即,可能的突变组合)取样。在一些实施例中,通过mutS蛋白质亲和基质鉴别突变序列(瓦格纳(Wagner)等人,核酸研究23(19):3944-3948(1995);苏(Su)等人,美国国家科学院院刊,83:5057-5061(1986)),其中在组装反应之前进行活体外扩增亲和性提纯材料的优选步骤。接着将此扩增材料置于组装或再组装PCR反应中,如本申请的后续部分中所述。
启动子梯
启动子调节基因转录的速率且可以通过多种方式影响转录。举例来说,不论内部或外部细胞条件,组成型启动子均引导其关联基因按恒定速率转录,而可调节启动子视内部和/或外部细胞条件(例如生长速率、温度、对特定环境化学品的响应等)而增加或降低基因转录的速率。启动子可以从其正常细胞环境中分离出来且经工程改造可调节几乎任何基因的表达,从而能够有效修改细胞生长、产物产量和/或所关注的其它表型。
在一些实施例中,本公开教示了用于产生启动子梯文库以供下游基因设计方法使用的方法。举例来说,在一些实施例中,本公开教示了鉴别一个或多个启动子和/或在宿主细胞内产生一个或多个启动子的变异体的方法,其展现了一系列表达强度或优良的调节特性。已鉴别和/或产生的这些启动子的特定组合可一起归类为启动子梯,其更详细地解释于下文。
在一些实施例中,本公开教示了启动子梯的使用。在一些实施例中,本公开的启动子梯包含展现连续系列的表达谱的启动子。举例来说,在一些实施例中,通过鉴别响应于刺激而展现一系列表达强度的天然、原生或野生型启动子,或通过组成性表达来产生启动子梯(参见例如图13和图21-23)。这些已鉴别的启动子可以归入同类作为启动子梯。
在一些实施例中,启动子梯包含至少两个具有不同表达谱的启动子。在一些实施例中,启动子梯包含至少三个具有不同表达谱的启动子。在一些实施例中,启动子梯包含至少四个具有不同表达谱的启动子。在一些实施例中,启动子梯包含至少五个具有不同表达谱的启动子。在一些实施例中,启动子梯包含至少六个具有不同表达谱的启动子。在一些实施例中,启动子梯包含至少七个具有不同表达谱的启动子。
在其它实施例中,本公开教示了启动子梯的产生,所述启动子梯跨越不同条件展现了一系列表达谱。举例来说,在一些实施例中,本公开教示了启动子梯的产生,所述启动子梯具有遍布在发酵的不同阶段的表达峰(参见例如图21)。在其它实施例中,本公开教示了启动子梯的产生,其具有响应于特定刺激的不同表达峰动力学(参见例如图22)。所属领域的技术人员将认识到,本公开的调节性启动子梯可以代表任一种或多种调节曲线。
在一些实施例中,本公开的启动子梯经设计以可预测的方式、跨越响应的连续范围扰动基因表达。在一些实施例中,启动子梯的连续性质赋予菌株改良程序另外的预测能力。举例来说,在一些实施例中,所选代谢途径的交换启动子或终止序列可以产生宿主细胞性能曲线,其鉴别最佳表达率或表达谱;产生如下菌株,其中靶向基因不再是特定反应或基因级联的限制因素,同时还避免了在不适当情形下发生的不必要过度表达或错误表达。在一些实施例中,启动子梯如下产生:鉴别展现所期望曲线的天然、原生或野生型启动子。在其它实施例中,通过使天然存在的启动子发生突变以衍生多种突变启动子序列来产生启动子梯。测试这些突变启动子中的每一种对靶基因表达的影响。在一些实施例中,测试所编辑的启动子跨越多种条件的表达活性,以便记录/表征/注释每个启动子变异体的活性并存储于数据库中。随后将所得经编辑的启动子变异体组织成基于其表达强度而排列的启动子梯(例如高表达性变异体靠近顶部,并且减弱的表达靠近底部,因此产生术语“梯”)。
在一些实施例中,本公开教示了启动子梯是已鉴别的天然存在的启动子与突变变异体启动子的组合。
在一些实施例中,本公开教示了鉴别满足以下准则的天然、原生或野生型启动子的方法:1)呈现为组成性启动子梯;和2)可以由短DNA序列(理想的是,小于100个碱基对)编码。在一些实施例中,本公开的组成性启动子展现跨越两种所选生长条件(通常在工业培育期间所经历的条件间进行比较)的恒定基因表达。在一些实施例中,本公开的启动子将由约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个碱基对核心启动子组成。在一些实施例中,存在5'UTR。在一些实施例中,所述5'UTR长度介于约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多个碱基对之间。
在一些实施例中,选择前述已鉴别的天然存在的启动子序列中的一种或多种用于基因编辑。在一些实施例中,通过上文所述的任一种突变方法编辑天然启动子。在其它实施例中,本公开的启动子是通过合成具有所期望序列的新启动子变异体来编辑。
2015年12月07日提交的美国专利申请第62/264,232号和2016年12月7日提交的PCT WO 2017/100376的整个公开内容以全文引用的方式并入本文中用于所有目的。
本公开启动子的非详尽性清单提供于下表1中。
表1.本公开的所选启动子序列.
Figure BDA0002371045810000791
Figure BDA0002371045810000801
Figure BDA0002371045810000811
在一些实施例中,本公开的启动子展现与来自上表1的启动子至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%或75%的序列一致性。
终止子梯
在一些实施例中,本公开教示了通过在RNA编码元件末端的3'位置提供一种或多种转录终止序列来改良经基因工程改造的宿主菌株的方法。在一些实施例中,本公开教示了添加终止序列使所选基因在经基因工程改造的宿主中的RNA转录效率提高。在其它实施例中,本公开教示了添加终止序列使所选基因在经基因工程改造的宿主中的RNA转录效率降低。因此在一些实施例中,本公开的终止子梯包含展现一系列转录效率的一系列终止序列(例如一个弱终止子、一个普通终止子和一个强启动子)。
转录终止序列可以是任何核苷酸序列,其当以转录方式放置于编码开放阅读框架的核苷酸序列的下游时,促使开放阅读框架的转录终止。这类序列在所属领域中已知且可以具有原核、真核或噬菌体来源。终止序列的实例包括(但不限于)PTH终止子、pET-T7终止子、
Figure BDA0002371045810000812
终止子、pBR322-P4终止子、水疱性口炎病毒终止子、rrnB-T1终止子、rrnC终止子、TTadc转录终止子,以及酵母识别的终止序列,如Matα(α因子)转录终止子、原生α因子转录终止序列、ADR1转录终止序列、ADH2转录终止序列和GAPD转录终止序列。转录终止序列的非详尽性清单可以见于iGEM注册表,其可获得于:http://partsregistry.org/Terminators/Catalog。
在一些实施例中,转录终止序列可以具有聚合酶特异性或非特异性,然而,选用于本公开实施例中的转录终止子应该与所选启动子形成‘功能性组合’,这意味着终止序列应该能够通过在启动子起始的RNA聚合酶类型来终止转录。举例来说,在一些实施例中,本公开教示了真核RNA pol II启动子和真核RNA pol II终止子、T7启动子和T7终止子、T3启动子和T3终止子、酵母识别的启动子和酵母识别的终止序列等通常会形成功能性组合。所用转录终止序列的一致性也可以基于终止从所指定启动子转录的效率来选择。举例来说,异源转录终止序列可以转录方式提供于RNA编码元件的下游,以实现从所指定启动子开始的至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的终止效率。
在一些实施例中,从经工程改造的表达构建体开始的RNA转录的效率可以通过在RNA编码元件末端的3'位置提供呈包含两个或更多个发夹的二级结构形式的核酸序列来提高。不希望受到特定理论的束缚,二级结构使转录延伸复合物失去稳定且使得聚合酶从DNA模板中解离,借此使非功能序列的非生产性转录最小化且增加所期望RNA的转录。相应地,可以提供形成包含两个或更多个相邻发夹的二级结构的终止序列。一般来说,发夹可以由回文核苷酸序列形成,所述回文核苷酸序列可以自身折回而形成成对的茎区域,所述茎区域的臂通过单链环来连接。在一些实施例中,终止序列包含2、3、4、5、6、7、8、9、10个或更多个相邻发夹。在一些实施例中,相邻发夹相隔0、1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个不成对核苷酸。在一些实施例中,发夹茎包含4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个碱基对的长度。在某些实施例中,发夹茎长度是12到30个碱基对。在某些实施例中,终止序列包含两个或更多个中等尺寸的发夹,其具有包含约9到25个碱基对的茎区域。在一些实施例中,发夹包含1、2、3、4、5、6、7、8、9或10个核苷酸的成环区域。在一些实施例中,成环区域包含4-8个核苷酸。不希望受到特定理论的束缚,二级结构的稳定性可以与终止效率相关。发夹稳定性由其长度、其所含的错配或凸起数目以及成对区域的碱基组成决定。鸟嘌呤与胞嘧啶之间的配对具有三个氢键且比仅具有两个氢键的腺嘌呤-胸腺嘧啶对更稳定。形成发夹的回文核苷酸序列的G/C含量可以是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或更多。在一些实施例中,形成发夹的回文核苷酸序列的G/C含量是至少80%。在一些实施例中,终止序列来源于具有原核、真核或噬菌体来源的一种或多种转录终止序列。在一些实施例中,编码一系列4、5、6、7、8、9、10个或更多个腺嘌呤(A)的核苷酸序列提供于终止序列的3'。
在一些实施例中,本公开教示了一系列串联终止序列的使用。在一些实施例中,一系列2、3、4、5、6、7个或更多个中的第一转录终止序列可以直接放置于dsRNA编码元件的最后核苷酸的3'或与dsRNA编码元件的最后核苷酸的3'相隔至少1-5、5-10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50-100、100-150、150-200、200-300、300-400、400-500、500-1,000或更多个核苷酸的距离。串联转录终止序列之间的核苷酸数目可以变化,例如,转录终止序列可以相隔0、1、2、3、4、5、6、7、8、9、10、10-15、15-20、20-25、25-30、30-35、35-40、40-45、45-50或更多个核苷酸。在一些实施例中,转录终止序列可以基于其预测的二级结构(如根据结构预测算法所测定)来选择。结构预测程序在所属领域中是众所周知的且包括例如CLC主工作台。
所属领域中的技术人员将认识到本公开的方法与任何终止序列兼容。在一些实施例中,本公开教示了经注释的糖多孢菌属终止子的用途。在其它实施例中,本公开教示了使用iGEM注册表中所发现的转录终止序列,所述iGEM注册表可获得于:http://partsregistry.org/Terminators/Catalog。本公开的转录终止序列的非穷尽性清单提供于下表2中。
表2.本公开的终止序列的非详尽性清单.
Figure BDA0002371045810000831
Figure BDA0002371045810000841
本公开的另外的终止序列的非穷尽性清单提供于下表3中。所述终止序列中的每一个可称作异源终止子或异源终止子聚核苷酸。
表3.本公开的所选终止序列.
Figure BDA0002371045810000851
在一些实施例中,本公开的终止子展现出与来自上表3的终止子有至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%或75%序列一致性。
假设驱动型多样性池和爬山法
本公开教示了本公开的HTP基因组工程学方法不需要先验基因了解来实现宿主细胞性能的显著增加。的确,本公开教示了通过功能上不可知的若干种途经产生多样性池的方法,所述途经包括随机诱变和鉴别预先存在的宿主细胞变异体间的基因多样性(例如,如在野生型宿主细胞与工业变异体之间作出的比较)。
然而,在一些实施例中,本公开还教示了假设驱动型设计基因多样性突变的方法,所述多样性突变将用于下游HTP工程。即,在一些实施例中,本公开教示了所选突变的定向设计。在一些实施例中,将定向突变并入本公开的工程文库(例如SNP交换、PRO交换、STOP交换、转座子诱变多样性文库、核糖体结合位点多样性文库、抗代谢物选择/发酵产物抗性文库)中。
在一些实施例中,本公开教示了基于基因注释、假设(或证实)的基因功能或基因组内的位置来产生定向突变。本公开的多样性池可以包括基因中的假设涉及特定代谢或基因途径的突变,所述特定代谢或基因途径在文献中与宿主细胞的性能增强相关。在其它实施例中,本公开的多样性池还可以包括存在于操纵子中的与改良的宿主性能相关的基因突变。在又其它实施例中,本公开的多样性池还可以包括基于算法预测函数或其它基因注释的基因突变。
在一些实施例中,本公开教示了用于对假设驱动型突变的目标进行优先级排序的基于“壳”的方法。目标优先级排序的壳隐喻是基于如下假设:仅少数初始基因负责宿主细胞性能的大部分特定方面(例如单一生物分子的产生)。这些初始基因位于壳的核心处,继之为第二层的二级效应基因、第三壳中的三级效应以及...等。举例来说,在一个实施例中,壳的核心可能包括编码所选代谢路径(例如柠檬酸的产生)内的关键生物合成酶的基因。位于第二壳上的基因可以包含编码生物合成途径内的其它酶的基因,其负责产物转移或反馈信号传导。依据此说明性隐喻的第三层基因可能会包含调节基因,其负责调节生物合成途径的表达或用于调节宿主细胞内的一般碳通量。
本公开还教示了用于优化每种已鉴别突变所引起的性能增加的“爬山”方法。在一些实施例中,本公开教示了HTP多样性文库中的随机、天然或假设驱动型突变可以实现与宿主细胞性能相关的基因的鉴别。举例来说,本公开方法可以鉴别位于基因编码序列上或靠近基因编码序列的一种或多种有益SNP。此基因可能与宿主细胞性能相关,并可以将其鉴别类比为在生物体的组合性基因突变空间中发现性能“山”。
在一些实施例中,本公开教示了探究围绕以SNP突变体现的已鉴别山的组合空间的方法。即,在一些实施例中,本公开教示了扰动已鉴别的基因和相关调节序列以便优化由那个基因节点(即,爬山)获得的性能增加。因此,根据本公开的方法,首先可以在源于随机诱变的多样性文库中鉴别出基因,但是随后可以通过相同基因内的另一序列的定向突变加以改良供菌株改良程序使用。
还可以扩展爬山构思而超越围绕单一基因序列的组合空间的探究。在一些实施例中,特定基因中的突变可以揭露特定代谢或基因途径对于宿主细胞性能的重要性。举例来说,在一些实施例中,单一RNA降解基因中的突变引起宿主性能显著增加的发现可以用作使相关RNA降解基因发生突变的依据,这成为从宿主生物体提取另外性能增益的方式。所属领域中的技术人员将认识到上述定向基因设计的壳和爬山方法的变化形式。高通量筛选。
细胞培养和发酵
本公开的细胞可以在适当时经修改的传统营养培养基中培养用于任何所期望的生物合成反应或选择。在一些实施例中,本公开教示了在诱导型培养基中培养用于活化启动子。在一些实施例中,本公开教示了具有选择剂的培养基,所述选择剂包括转化体选择剂(例如抗生素),或选择适合于在抑制条件(例如高乙醇条件)下生长的生物体。在一些实施例中,本公开教示了使细胞培养物在中针对细胞生长优化的培养基中生长。在其它实施例中,本公开教示了使细胞培养物在针对产物产量优化的培养基中生长。在一些实施例中,本公开教示了使培养物在培养基中生长,所述培养基能够诱导细胞生长并且还含有最终产物产生所需的前体(例如高含量的糖类用于产生乙醇)。
培养条件(如温度、pH和其类似条件)是适合与选用于表达的宿主细胞联合使用的那些条件,并且对于所属领域的技术人员是显而易见的。如所提及,许多参考文献可供用于培养和产生许多细胞,包括细菌、植物、动物(包括哺乳动物)和古细菌来源的细胞。参见例如萨布鲁克(Sambrook),奥斯贝(Ausubel)(所有均见上文)以及伯杰(Berger),分子克隆技术指南(Guide to Molecular Cloning Techniques),酶学方法(Methods inEnzymology),第152卷,学术出版社有限公司(Academic Press,Inc.),加利福尼亚州圣地亚哥(San Diego,CA);以及弗瑞旭尼(Freshney)(1994),动物细胞的培养:基本技术手册(Culture of Animal Cells,a Manual of Basic Technique),第三版,纽约威立-利斯(Wiley-Liss,New York)和其中引用的参考文献;多伊尔(Doyle)和格里菲思(Griffiths)(1997),哺乳动物细胞培养:基本技术(Mammalian Cell Culture:EssentialTechniques),约翰·威利父子出版公司(John Wiley and Sons),NY;忽玛逊(Humason)(1979),动物组织技术(Animal Tissue Techniques),第四版,W.H.弗里曼公司(W.H.Freeman and Company);以及里奇埃德尔(Ricciardelle)等人,(1989),试管内细胞(In Vitro Cell),发育生物学(Dev.Biol.)25:1016-1024,所有文献均以引用的方式并入本文中。关于植物细胞培养和再生,参见派恩(Payne)等人(1992),液体系统中的植物细胞和组织培养(Plant Cell and Tissue Culture in Liquid Systems),约翰·威利父子公司(John Wiley&Sons,Inc.),纽约州纽约市;冈堡(Gamborg)和菲利浦(Phillips)(编)(1995),植物细胞、组织和器官培养:基本方法(Plant Cell,Tissue and Organ Culture;Fundamental Methods),施普林格实验室手册(Springer Lab Manual),施普林格出版社(Springer-Verlag)(柏林海德堡,纽约);琼斯(Jones)编(1984),植物基因转移和表达方案(Plant Gene Transfer and Expression Protocols),胡马纳出版社(Humana Press),新泽西州特图瓦市(Totowa,N.J.),以及植物分子生物学(Plant Molecular Biology)(1993)R.R.D.克洛(R.R.D.Croy)编,生物科学出版社(Bios Scientific Publishers),英国牛津(Oxford,U.K.)ISBN 0 12 198370 6,所有文献均以引用的方式并入本文中。细胞培养基一般性地阐述于阿特拉斯(Atlas)和帕克斯(Parks)(编),微生物培养基手册(The Handbookof Microbiological Media)(1993)CRC出版社,佛罗里达州波卡拉顿(Boca Raton,Fla.),所述文献以引用的方式并入本文中。用于细胞培养的另外信息见于可获得的商业文献中,如得自西格玛-奥德里奇公司(Sigma-Aldrich,Inc)(密苏里州圣路易(St Louis,Mo.))的生命科学研究细胞培养目录(Life Science Research Cell Culture Catalogue)(“西格马-LSRCCC”)以及例如也得自西格玛-奥德里奇公司(密苏里州圣路易)的植物培养目录和增刊(The Plant Culture Catalogue and supplement)(“西格马-PCCS”),所述文献都以引用的方式并入本文中。
待用的培养基必须以适合方式满足相应菌株的需求。用于各种微生物的培养基的描述存在于美国细菌学学会(American Society for Bacteriology)(美国华盛顿哥伦比亚特区,1981)的“通用细菌学方法手册(Manual of Methods for GeneralBacteriology)”中。
本公开另外提供一种发酵制备所关注产物的方法,其包含以下步骤:a)将根据本公开的微生物在适合培养基中培养,从而产生发酵液;和b)将a)和/或微生物细胞的发酵液中的所关注产物浓缩。
在一些实施例中,本公开教示了所产生的微生物可以如例如WO 05/021772所述连续地培养,或用分批法(分批培育)或分批进料或重复分批进料法不连续培养,以便产生所期望的有机化合物。关于已知培育方法的通用性质的概述可获得于Chmiel的教科书(Bioprozeβtechnik.1:Einführung in die Bioverfahrenstechnik(Gustav FischerVerlag,Stuttgart,1991))或Storhas的教科书(Bioreaktoren和periphereEinrichtungen(Vieweg Verlag,Braunschweig/Wiesbaden,1994))。
在一些实施例中,本公开的细胞是在分批或连续发酵条件下生长。
经典的分批发酵是一种封闭系统,其中在发酵开始时设定培养基的组成并在发酵期间不进行人工改变。分批系统的变化形式是分批进料发酵,其也可用于本公开中。在这种变化形式中,随着发酵进展,按增量添加底物。当代谢物抑制可能会抑制细胞代谢时并且在期望培养基中的底物的量有限的情况下,分批进料系统是适用的。分批和分批进料发酵是所属领域中常见并且众所周知的。
连续发酵是一种系统,其中将所定义的发酵培养基连续地添加到生物反应器中并同时移出等量的改良性培养基以供处理和收获所关注的期望生物分子产物。在一些实施例中,连续发酵通常使培养物在恒定的高密度下维持,其中细胞主要处于对数生长期。在一些实施例中,连续发酵通常使培养物维持稳定期或对数后期/稳定期生长。连续发酵系统力求维持稳态生长条件。
连续发酵工艺中用于调节营养物和生长因子的方法以及使产物形成速率最大化的技术在工业微生物学领域中是众所周知的。
举例来说,本公开的培养物的碳源的非限制性清单包括糖类和碳水化合物,例如葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、得自甜菜或甘蔗处理的含蔗糖溶液、淀粉、淀粉水解产物和纤维素;油和脂肪,例如大豆油、葵花油、花生油和椰子脂肪;脂肪酸,例如棕榈酸、硬脂酸和亚油酸;醇类,例如甘油、甲醇和乙醇;以及有机酸,例如乙酸或乳酸。
用于本公开的培养物的氮源的非限制性清单包括含有机氮化合物,如蛋白胨、酵母萃取物、肉萃取物、麦芽萃取物、玉米浆、大豆粉和尿素;或无机化合物,如硫酸铵、氯化铵、磷酸铵、碳酸铵和硝酸铵。氮源可以个别地使用或作为混合物使用。
用于本公开的培养物的可能磷源的非限制性清单包括磷酸、磷酸二氢钾或磷酸氢二钾或相应含钠盐。
培养基可以另外包含生长所需的盐,例如呈氯化物形式的盐,或金属(例如钠、钾、镁、钙和铁)硫酸盐,例如硫酸镁或硫酸铁。
最后,除上述物质之外,可以使用基本生长因子,如氨基酸,例如高丝氨酸和维生素,例如硫胺、生物素或泛酸。
在一些实施例中,培养物的pH可以利用任何酸或碱或缓冲盐(包括(但不限于)氢氧化钠、氢氧化钾、氨或氨水);或酸性化合物(如磷酸或硫酸)通过适合方式来控制。在一些实施例中,pH通常调节到6.0到8.5的值,优选6.5到8。
在一些实施例中,本公开的培养物可以包括消泡剂,例如脂肪酸聚二醇酯。在一些实施例中,本公开的培养物通过添加适合的选择性物质(例如抗生素)来调节以使培养物中的质粒稳定化。
在一些实施例中,在好氧条件下进行培养。为了维持这些条件,将氧气或含氧气气体混合物(例如空气)引入培养物中。同样可以使用富含过氧化氢的液体。适当时,在高压下,例如在0.03到0.2MPa的高压下进行发酵。培养物的温度通常是20℃到45℃并优选25℃到40℃,特别优选30℃到37℃。在分批或分批进料工艺中,培育优选持续至已经形成足以回收的量的所关注的期望产物(例如有机化合物)为止。此目的通常可以在10小时到160小时内实现。在连续工艺中,较长培育时间是可能的。微生物的活性使得所关注的产物在发酵培养基中和/或在所述微生物的细胞中浓缩(积累)。
在一些实施例中,在厌氧条件下进行培养。
筛选
在一些实施例中,本公开教示了高通量初始筛选。在其它实施例中,本公开还教示了基于稳定槽罐的对性能数据的验证(参见图6B)。
在一些实施例中,设计高通量筛选方法以预测菌株在生物反应器中的性能。如此前所述,选择适于生物体并反映生物反应器条件的培养条件。挑选个别群落并转移到96孔板中并培育适合的时间量。随后将细胞转移到新的96孔板中用于另外的种子培养或产生培养物。在可以进行多次测量的情况下,将培养物培育不同的时间长度。这些测量可以包括产物、生物质或其它特征的测量,从而预测菌株在生物反应器中的性能。使用高通量培养结果预测生物反应器性能。
在一些实施例中,使用基于槽罐的性能验证确认利用高通量筛选所分离的菌株的性能。使用实验室规模发酵反应器,针对相关菌株性能特征,如生产率或产量,筛选候选菌株。
产物回收和量化
根据所关注的产物产生进行筛选的方法已为所属领域的技术人员所知并在本说明书中论述。当筛选本公开的菌株时可以使用这类方法。
在一些实施例中,本公开教示了改良菌株的方法,所述菌株经设计可产生非分泌性细胞内产物。举例来说,本公开教示了提高细胞培养物的稳定性、产量、效率或总体期望度、从而产生细胞内酶、油、医药或其它有价值的小分子或肽的方法。非分泌性细胞内产物的回收或分离可以利用所属领域中众所周知的溶解和回收技术(包括本文所述的那些技术)实现。
举例来说,在一些实施例中,本公开的细胞可以利用离心、过滤、沉降或其它方法收获。所收获的细胞接着利用任何方便的方法破碎,包括冷冻-解冻循环、声波处理、机械破碎或使用细胞溶解剂,或所属领域的技术人员众所周知的其它方法。
所关注的所得产物(例如多肽)可以利用所属领域中已知的多种方法中的任一种回收/分离且任选地加以提纯。举例来说,可以利用传统程序从营养物培养基中分离出产物多肽,所述传统程序包括(但不限于):离心、过滤、萃取、喷雾干燥、蒸发、色谱(例如离子交换、亲和、疏水性相互作用、色谱焦聚和尺寸排阻),或沉淀。最后,可以在最后提纯步骤中使用高效液相色谱(HPLC)。(参见例如细胞内蛋白质的提纯(Purification ofintracellular protein),如帕瑞(Parry)等人,2001,生物化学杂志(Biochem.J.)353:117和洪(Hong)等人,2007,应用微生物学和生物技术(Appl.Microbiol.Biotechnol.)73:1331中所述,两种文献均以引用的方式并入本文中)。
除上文提及的参考文献之外,多种提纯方法在所属领域中是众所周知的,包括例如以下文献中所述的提纯方法:桑德纳(Sandana)(1997),蛋白质的生物分离(Bioseparation of Proteins),学术出版社有限公司(Academic Press,Inc.);博拉格(Bollag)等人(1996),蛋白质方法(Protein Methods)第2版,纽约州威立-利斯;沃克(Walker)(1996),蛋白质方案手册(The Protein Protocols Handbook),胡马纳出版社,新泽西州;哈里斯(Harris)和安格尔(Angal)(1990),蛋白质提纯应用:实用方法(ProteinPurification Applications:A Practical Approach),牛津IRL出版社,英国牛津;哈里斯和安格尔,蛋白质提纯方法:实用方法(Protein Purification Methods:A PracticalApproach),牛津IRL出版社,英国牛津;斯科普斯(Scopes)(1993),蛋白质提纯:原理和实践(Protein Purification:Principles and Practice)第3版,斯普林格出版社,纽约州;詹森(Janson)和赖登(Ryden)(1998),蛋白质提纯:原理、高分辨率方法和应用(ProteinPurification:Principles,High Resolution Methods and Applications),第二版,威立-VCH,纽约州;以及沃克(Walker)(1998),CD-ROM的蛋白质方案(Protein Protocols onCD-ROM),胡马纳出版社,新泽西州,所有文献以引用的方式并入本文中。
在一些实施例中,本公开教示了改良菌株的方法,所述菌株经设计可产生分泌性产物。举例来说,本公开教示了提高细胞培养物的稳定性、产量、效率或总体期望度,从而产生有价值的小分子或肽的方法。
在一些实施例中,可以利用免疫学方法检测和/或提纯由本公开的细胞产生的分泌性或非分泌性产物。在一种实例方法中,使用传统方法针对产物分子(例如针对胰岛素多肽或其免疫原性片段)产生的抗体固定于珠粒上,在使内切葡聚糖酶结合的条件下与细胞培养基混合,并沉淀。在一些实施例中,本公开教示了酶联免疫吸附分析(ELISA)的使用。
在其它相关实施例中,使用如以下文献中所公开的免疫色谱法:美国专利第5,591,645号、美国专利第4,855,240号、美国专利第4,435,504号、美国专利第4,980,298号,以及赛旺佩克(Se-Hwan Paek)等人,“一步免疫色谱快速分析方法的开发(Development ofrapid One-Step Immunochromatographic assay,Methods)”,22,53-60,2000),所述文献各自以引用的方式并入本文中。通用的免疫色谱法通过使用两种抗体来检测试样。第一抗体存在于测试溶液中或存在于由多孔膜制成的呈大致矩形形状的测试片末端的一部分处,其中将测试溶液滴落。这种抗体用胶乳颗粒或金胶体颗粒标记(这种抗体在下文中称为标记抗体)。当所滴落的测试溶液包括待检测的试样时,标记抗体识别试样以便与试样结合。试样与标记抗体的复合物通过毛细作用流向吸收剂,所述吸收剂由过滤纸制成并附着到与已包括标记抗体的末端相对的末端。在流动期间,试样与标记抗体的复合物被存在于多孔膜中部的第二抗体(其在下文中称为轻敲抗体)识别且捕获,并且因此,复合物以可见信号的形式出现在多孔膜的检测部件上且被检测到。
在一些实施例中,本公开的筛选方法是基于光度检测技术(吸收,荧光)。举例来说,在一些实施例中,检测可以基于荧光团检测剂(如结合到抗体的GFP)的存在。在其它实施例中,光度检测可以基于得自细胞培养的所期望产物的积累。在一些实施例中,可以通过UV检测到培养物或得自所述培养物的萃取物中的产物。
所属领域中的技术人员将认识到,本公开的方法可与产生任何期望的所关注生物分子产物的宿主细胞兼容。下表4呈现了本公开范围内所包括的产物类别、生物分子和宿主细胞的非限制性清单。这些实例是为了说明性目的而提供,并且不打算以任何方式限制本公开所公开的技术的适用性。
表4.-本公开的所关注宿主细胞和产物的非限制性清单.
Figure BDA0002371045810000921
Figure BDA0002371045810000931
Figure BDA0002371045810000941
在一些实施例中,宿主细胞是糖多孢菌属。在一些实施例中,糖多孢菌属是刺糖多孢菌菌株。糖多孢菌属中所产生的所关注产物提供在下表4.1中。
表4.1本公开的糖多孢菌属中所关注产物的非限制性清单
Figure BDA0002371045810000942
Figure BDA0002371045810000951
Figure BDA0002371045810000961
Figure BDA0002371045810000971
Figure BDA0002371045810000981
Figure BDA0002371045810000991
刺糖菌素是由两种糖多孢菌物种发酵产生的前所未有的一大类化合物。其核心结构是附接有两种糖的经聚酮衍生的四环巨环内酯。其显示出对许多商业上明显的物种的强效杀虫活性,所述物种引起对作物和其它植物的大规模破坏。其还显示出对家畜、伴侣动物和人类的重要体外寄生虫的活性,多杀菌素糖多孢菌是两种主要发酵因子,刺糖菌素A和D的限定组合。刺糖菌素A和刺糖菌素D均是刺糖多孢菌的两种最充足的发酵组分。结构-活性关系(SAR)已得到广泛地研究,引起产生半合成型第二代衍生物,乙基多杀菌素(克利斯特(Kirst),抗生素杂志(The Journal of Antibiotics)(2010)63,101-111)。现已从多种刺糖菌素发酵中分离并鉴别出多种结构上相关的化合物。其结构属于刺糖菌素A的糖苷配基或糖的单一型变化的数种一般类别。相对于刺糖菌素A,一些因子具有一个另外的或一个缺失的C-甲基,其将在形成聚酮构架期间的适当时候通过乙酸盐和丙酸盐的交换以生物合成方式出现。除了刺糖菌素D(6-甲基-刺糖菌素A)之外,其它经单一C-甲基修饰的因子包括刺糖菌素E(16-去甲基-刺糖菌素A)和刺糖菌素F(22-去甲基-刺糖菌素A)。两种糖的变体包括刺糖菌素H(2'-O-去甲基-刺糖菌素A)、刺糖菌素J(3′-O-去甲基-刺糖菌素A)、刺糖菌素B(4″-N-去甲基-刺糖菌素A)和刺糖菌素C(4″-二-N-去甲基-刺糖菌素A)。另一结构性变化是由不同糖,如L-奥萨氨糖(L-ossamine)置换氨基糖,D-福洛氨糖(D-forosamine)(刺糖菌素G)。近年来,已更准确地阐明多杀菌素生物合成路径:spnA、spnB、spnC、spnD和spnE负责I型聚酮合成酶;spnF、spnJ、spnL和spnM负责修饰聚酮合成酶产物(金(Kim)等人,“经酶催化的4+2环加成反应是生物合成刺糖菌素A的关键步骤(Enzyme-catalysed 4+2cycloadditionis a key step in the biosynthesis of spinosyn A)”.自然.2011,473:109-112);spnG、spnH、spnI和spnK负责鼠李糖连接和甲基化(金等人,“刺糖多孢菌中的刺糖菌素的生物合成:全甲基化鼠李糖的合成和SpnH、SpnI和SpnK的功能的表征(Biosynthesis ofspinosyn in Saccharopolyspora spinosa:synthesis of permethylated rhamnose andcharacterization of the functions of SpnH,SpnI and SpnK.)”美国化学会志(J AmChem Soc.)2010、132:2901-2903);spnP、spnO、spnN、spnQ、spnR和spnS负责福洛氨糖生物合成;gtt、gdh、epi和kre负责鼠李糖生物合成(马杜里(Madduri)等人“鼠李糖生物合成路径为刺糖多孢菌中的初级和次级代谢供应前体。(Rhamnose biosynthesis pathwaysupplies precursors for primary and secondary metabolism in Saccharopolysporaspinosa.)”细菌学杂志(J Bacteriol.)2001,183:5632-5638),并且除多杀菌素基因簇之外,四种基因ORF-L16、ORF-R1和ORF-R2对多杀菌素生物合成没有影响。这些基因在本文所述的基因工程方法的潜在目标当中。参与刺糖菌素合成的另外基因描述在美国专利号7,626,010、8,624,009中,其以全文引用的方式并入本文中用于所有目的。
乙基多杀菌素是经化学修饰的刺糖菌素J/L混合物。所述混合物包含两个主要因子3'-O-乙基-5,6-二氢刺糖菌素J和3'O-乙基刺糖菌素L。乙基多杀菌素具有比多杀菌素要宽的谱并且更强效,并在所述领域中具有改良残效。乙基多杀菌素的产生是基于人工神经网络(ANN)的策略的结果,其中分子设计采用模拟哺乳动物大脑中的神经连接的软件以识别模式,并可用于评估所提出的分子变体的活性。因此,发现鼠李糖部分上的某些烷基取代模式,尤其2',3',4'-三-O-乙基刺糖菌素A类似物将表示有前景的变体。此外,已表明,鼠李糖-3'-O-乙基化将表示相对于2'-或4'-O-乙基化活性增强的主要促成者。最终,产生乙基多杀菌素(斯帕克斯等人,2008,基于神经网络的QSAR和杀虫剂发现:乙基多杀菌素.(Neural network-based QSAR and insecticide discovery:spinetoram.)计算机辅助分子设计杂志(J Comput Aid Mol Des)22:393-401.doi:10.1007/s10822-008-9205-8)。
在一些实施例中,所关注产物是多杀菌素。多杀菌素是衍生自由刺糖多孢菌的发酵获得的天然产物家族的新颖作用模式杀虫剂。刺糖菌素以超过20种天然形式出现,并且在实验室中已产生超过200种合成形式(类多杀菌素(spinosoid))(杰拉德·沃森(Watson,Gerald)(2001年5月31日).“杀虫刺糖菌素对小直径蟑螂神经元的γ-氨基丁酸反应的作用(Actions of Insecticidal Spinosyns on gama-Aminobutyric Acid Responses forSmall-Diameter Cockroach Neurons)”.(Pesticide Biochemistry and Physiology).71:20-28,其以全文引用的方式併入本文中)。多杀菌素含有以下两种类多杀菌素的混合物:刺糖菌素A,主要组分,和刺糖菌素D(次要组分),比率大致为17:3。
在一些实施例中,可用于筛选突变型糖多孢菌菌株的分子包括(但不限于):1)参与刺糖菌素合成路径的分子(例如,刺糖菌素);2)参与SAM/甲硫氨酸路径的分子(例如,α-甲基甲硫氨酸(aMM)或正亮氨酸);3)参与赖氨酸生产路径的分子(例如,硫杂赖氨酸或α-丁酮酸盐和天冬氨酸羟肟酸盐的混合物);4)参与色氨酸路径的分子(例如,氮杂丝氨酸或5-氟吲哚);5)参与苏氨酸路径的分子(例如,β-羟基正缬氨酸);6)参与乙酰基-CoA生产路径的分子(例如,浅蓝菌素);和7)参与从头合成或补救嘌呤和嘧啶路径的分子(例如,嘌呤或嘧啶类似物)。
在一些实施例中,用于筛选的刺糖菌素浓度是约10μg/ml、20μg/ml、30μg/ml、40μg/ml、50μg/ml、60μg/ml、70μg/ml、80μg/ml、90μg/ml、100μg/ml、200μg/ml、300μg/ml、400μg/ml、500μg/ml、600μg/ml、700μg/ml、800μg/ml、900μg/ml、1mg/ml、2mg/ml、3mg/ml、4mg/ml、5mg/ml、6mg/ml、7mg/ml、8mg/ml、9mg/ml、10mg/ml或更大。
在一些实施例中,用于筛选的aMM浓度是约0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、2mM、3mM、4mM、5mM、6mM、7mM、8mM、9mM、10mM或更大。
在一些实施例中,用于筛选的分子的确切浓度可凭经验确定,其取决于所用菌株。一般来说,基本菌株将比已经工程改造的菌株更敏感。
针对糖多孢菌属的基因工具、资源、组成、方法和菌株可见于美国专利号6960453、6270768、5631155、5670364、5554519、5187088、5202242、6616953、5171740、6420177、8624009、7626010、5124258、5362634、6043064、4293651、4389486、6627427、5663067、5081023、6780633、6004787、6365399、5801032、8741603、4328307、4425430、7022526、5234828、5786181、5153128、8841092、4251511、9309524、6437151、5908764、8911970、5824513、6524841、7198922、6200813、9334514、5496931、7630836、5198360、6710189、6251636、7807418、6780620、6500960和7459294中,其中的每一个均以全文引用的方式并入本文中用于所有目的。
选择准则和目标
应用于本公开方法的选择准则将根据菌株改良程序的特定目标而变。本公开可以经调适以满足任何程序目标。举例来说,在一些实施例中,程序目标可以是最大化单次分批反应产量而无即刻时间限制。在其它实施例中,程序目标可以是生物合成产量的再平衡以产生特定产物,或产生特定的产物比率。在其它实施例中,程序目标可以是修饰产物的化学结构,如延长聚合物的碳链。在一些实施例中,程序目标可以是改良性能特征,如产量、效价、生产率、副产物消除、对过程偏移的耐受性、最佳生长温度和生长速率。在一些实施例中,程序目标是改良宿主性能,如根据微生物所产生的所关注产物的体积生产率、比生产率、产量或力价所度量。
在其它实施例中,就按输入量计的最终产物产量(例如每磅蔗糖所产生的乙醇的总量)而言,程序目标可以是优化商业菌株的合成效率。在其它实施例中,程序目标可以是优化合成速度,如根据例如分批完成率或连续培养系统的生产率所度量。在其它实施例中,程序目标可以是增强菌株对特定噬菌体的抗性,或以其它方式增强培养条件下的菌株活力/稳定性。
在一些实施例中,菌株改良项目可以接受超过一个目标。在一些实施例中,菌株项目的目标可以取决于品质、可靠性或总体盈利能力。在一些实施例中,本公开教示了进行相关所选突变或突变群组以具有上述一种或多种菌株特性的方法。
所属领域中的技术人员将认识到如何定制菌株选择准则以满足特定项目目标。举例来说,按照反应饱和度选择菌株单批最大产量可以适于鉴别具有高单批产量的菌株。跨越一系列温度和条件、基于产量一致性的选择可以适用于鉴别稳定性和可靠性增强的菌株。
在一些实施例中,初始高通量阶段的选择准则和基于槽罐的验证是相同的。在其它实施例中,基于槽罐的选择可以依据另外和/或不同的选择准则运作。举例来说,在一些实施例中,高通量菌株选择可以是基于单批反应完成产量,而基于槽罐的选择可以扩展以包括基于产量的针对反应速度的选择。
(a)在一些实施例中,所述选择方法涉及选择对糖多孢菌属的一种或多种特定代谢物和/或一种或多种发酵产物具有抗性的菌株。在一些实施例中,针对指定分子筛选包含多种基因多态性的菌株集合。菌株集合可为本公开中所述的任何菌株文库或其组合。进行选择所针对的分子可以是由菌株产生的任何最终产物、或影响菌株生长的中间产物或最终产物的产量。例如,在一些实施例中,分子可为所关注刺糖菌素,如上表4.1中的那些,或影响产生刺糖菌素的任何分子。基本上,在由产生的一种或多种预先确定的产物存在下选择更多抗性菌株。在一些实施例中,所述方法进一步包含c)分析所选菌株性能(例如,菌株中所产生的一种或多种产物的产量)并通过HTP筛选选择与参考微生物菌株相比具有改良性能的菌株。在一些实施例中,所述方法进一步包含d)鉴别引起改良性能的突变的位置和/或序列。具有经确认的改良性能的这些所选菌株形成初始抗代谢物/发酵产物抗性文库。此类文库包含多种个别微生物菌株,在所述多种个别微生物菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自多种可鉴别的基因变异的单一基因变异。在一些实施例中,微生物菌株是糖多孢菌菌株。在一些实施例中,由微生物菌株产生的预先确定的产物为参与刺糖菌素合成路径的任何分子或可影响刺糖菌素产生的任何分子。在一些实施例中,所述预先确定的产物包括(但不限于)刺糖菌素A、刺糖菌素B、刺糖菌素C,刺糖菌素D、刺糖菌素E、刺糖菌素F、刺糖菌素G、刺糖菌素H、刺糖菌素I、刺糖菌素J、刺糖菌素K、刺糖菌素L、刺糖菌素M、刺糖菌素N、刺糖菌素O、刺糖菌素P、刺糖菌素Q、刺糖菌素R、刺糖菌素S、刺糖菌素T、刺糖菌素U、刺糖菌素V、刺糖菌素W、刺糖菌素X、刺糖菌素Y、正亮氨酸、正缬氨酸、假糖苷配基(例如,PSA、PSD、PSJ、PSL等,针对不同刺糖菌素化合物)和/或α-甲基-甲硫氨酸(aMM)。
测序
在一些实施例中,本公开教示了本文所述生物体的全基因组测序。在其它实施例中,本公开还教示了质粒、PCR产物和其它寡核苷酸的测序作为对本公开方法的品质控制。大项目和小项目的测序方法已为所属领域的技术人员所熟知。
在一些实施例中,本公开的方法中可以使用供核酸测序用的任何高通量技术。在一些实施例中,本公开教示了全基因组测序。在其它实施例中,本公开教示了鉴别基因变异的扩增子测序超深度测序。在一些实施例中,本公开还教示了新颖的文库制备方法,包括片段化的同时添加标签(tagmentation)(参见WO/2016/073690)。DNA测序技术包含使用经标记的终止子或引物且在厚片或毛细管中进行凝胶隔离的经典双脱氧测序反应(桑格方法(Sanger method));使用可逆封端的经标记的核苷酸的边合成边测序、焦磷酸测序;454测序;与经标记的寡核苷酸探针文库进行等位基因特异性杂交;使用与经标记的克隆文库的等位基因特异性杂交、随后进行连接的边合成边测序;在聚合步骤期间并入经标记的核苷酸的实时监视;聚合酶克隆测序(polony sequencing);以及SOLiD测序。
在本公开的一个方面中,使用高通量测序方法,其包含对其上执行并行测序的固体表面上的个别分子进行空间分离的步骤。这类固体表面可以包括无孔表面(如Solexa测序,例如本特雷(Bentley)等人,自然,456:53-59(2008),或全面基因组学测序(CompleteGenomics sequencing),例如德尔马纳茨(Drmanac)等人,科学,327:78-81(2010));孔阵列,其可以包括珠粒或颗粒结合的模板(如用454,例如马古利斯(Margulies)等人,自然,437:376-380(2005)或离子激流测序(Ion Torrent sequencing),美国专利公开2010/0137143或2010/0304982);微机械加工的膜(如用SMRT测序,例如艾德(Eid)等人,科学,323:133-138(2009)),或珠粒阵列(如用SOLiD测序或聚合酶克隆测序,例如金等人,科学,316:1481-1414(2007))。
在另一个实施例中,本公开的方法包含在对固体表面上的分子进行空间分离之前或之后,将经分离的分子扩增。先前扩增可以包含基于乳液的扩增,如乳液PCR,或滚环扩增。还教示了基于Solexa的测序,其中对固体表面上的个别模板分子进行空间分离,随后通过桥式PCR对其并行扩增以形成单独的克隆群体或簇,并且接着测序,如以下文献中所述:本特雷等人(上文引用)和制造商说明书(例如TruSeqTM样品制备试剂盒和数据表,启迪公司(Illumina,Inc.),加利福尼亚州圣地亚哥(San Diego,Calif.),2010);且进一步如以下参考文献所述:美国专利第6,090,592号、第6,300,070号、第7,115,400号;和EP0972081B1,所述文献均以引用的方式并入本文。
在一个实施例中,安置于固体表面上且在固体表面上扩增的个别分子形成密度为每cm2至少个105个簇;或密度为每cm2至少5×105个;或密度为每cm2至少106个簇的簇。在一个实施例中,使用具有相对较高错误率的测序化学物质。在这类实施例中,这类化学物质所产生的平均品质分数是序列读段长度的单调下降函数。在一个实施例中,这类下降相当于0.5%的序列读段在位置1-75中具有至少一个错误;1%的序列读段在位置76-100中具有至少一个错误;且2%的序列读段在位置101-125中具有至少一个错误。
全基因组基因设计准则的计算分析和效果预测
在一些实施例中,本公开教示了对并入所指定宿主菌株中的特定基因变异的效果进行预测的方法。在其它方面中,本公开提供了用于产生所提出的基因变异的方法,所述基因变异应该并入所指定的宿主菌株中,以便所述宿主具有特定的表型性状或菌株参数。在指定的方面中,本公开提供可以用于设计新颖宿主菌株的预测模型。
在一些实施例中,本公开教示了分析每一轮筛选的执行结果的方法以及产生新的所提出的全基因组序列修饰的方法,所述全基因组序列修饰经预测可增强菌株在下一轮筛选中的性能。
在一些实施例中,本公开教示了所述系统基于此前筛选结果对宿主菌株产生所提出的序列修饰。在一些实施例中,本公开系统的建议是基于刚刚前一次筛选的结果。在其它实施例中,本公开系统的建议是基于一次或多次之前筛选的累积结果。
在一些实施例中,本公开系统的建议是基于此前开发的HTP基因设计文库。举例来说,在一些实施例中,本公开系统经设计可保存此前筛选的结果,并且将相同或不同宿主生物体的那些结果应用于不同项目。
在其它实施例中,本公开系统的建议是基于科学见解。举例来说,在一些实施例中,建议是基于基因的已知特性(来源如注释的基因数据库和相关文献)、密码子优化、转录打滑、uORF,或其它假设驱动序列和宿主优化。
在一些实施例中,所述系统或预测模型推荐的针对宿主菌株所提出的序列修饰是通过利用一种或多种所公开的分子工具集进行,所述分子工具集包含:(1)启动子交换、(2)SNP交换、(3)起点/终止密码子交换、(4)序列优化、(5)终止密码子交换和(5)上位定位。
本文所述的HTP基因工程改造平台相对于任何特定微生物或表型性状(例如特定化合物的产生)而言是不可知的。即,本文教示的平台和方法可以结合任何宿主细胞使用,以对所述宿主细胞进行工程改造,从而具有任何所期望表型性状。另外,由用于产生一种新颖宿主细胞的指定HTP基因工程改造方法中习得的课程可以作为在所教示方法期间出现的大量工艺参数的存储、表征和分析的结果,应用于任何数目个其它宿主细胞。
如上位定位章节中所提及,通过一些优选预测模型可以估计假想菌株的性能(也称为分数),所述假想菌株是通过将来自HTP基因设计文库的突变集合合并到特定背景中所得。鉴于这种预测模型,有可能对通过组合合并可近接突变文库的所有假想菌株评分和评级。下述章节概述了本公开HTP平台中所用的特定模型。
预测菌株设计
本文描述了一种预测菌株设计的方法,包括:描述基因变化和菌株性能、基于菌株中的变化组成来预测菌株性能、推荐预测性能高的候选设计以及过滤预测以针对二级考虑因素(例如与现有菌株的相似度、上位或预测置信度)进行优化的方法。
菌株设计模型的输入
在一个实施例中,为了易于说明,输入数据可以包含两种分量:(1)基因变化集和(2)相对菌株性能。所属领域的技术人员将认识到,这种模型能容易扩展以考虑多种输入,同时留意过度拟合的抵消性考虑。除基因变化之外,可以加以调整的一些输入参数(自变量)是细胞类型(属、种、株系、谱系学表征等)和据以对细胞进行发酵的工艺参数(例如环境条件、处理设备、修饰技术等)。
基因变化集可以来自此前论述的基因扰动集合,称为HTP基因设计文库。相对菌株性能可以基于任何指定的所关注参数或表型性状(例如所关注的化合物、小分子或产物的产生)来评估。
细胞类型可以用通用类别说明,如原核和真核系统、属、种、株系、组织培养物(相对于分散细胞)等。能够加以调整的工艺参数包括温度、压力、反应器配置和培养基组成。反应器配置的实例包括反应器体积,不论所述工艺是分批或连续的,并且如果是连续的,那么包括体积流量等。也可以指明其上存在细胞的载体结构(若存在)。培养基组成的实例包括电解质浓度、营养物、废产物、酸、pH和其类似方面。
从所选HTP基因设计文库获得基因变化集,以用于初始线性回归模型,随后用于产生预测菌株设计模型
为了建立预测菌株设计模型,首先选择相同微生物物种的菌株的基因变化。还提供每一基因变化的历史(例如显示这个菌株谱系中最近的修饰:“最后一个变化”)。因此,这种菌株性能与其亲代性能的比较代表关于“最后一个变化”突变的性能的数据点。
所建构的菌株性能评估
所教示模型的目标是基于引入菌株中的基因变化的组成来预测菌株性能。为了构建比较标准,首先通过计算每个分析板每种菌株的中值性能,相对于常见参考菌株来计算菌株性能。接着以同一板内的经工程改造的菌株与常见参考菌株之间的平均性能差异形式计算相对性能。将计算局限于板内比较可确保考虑中的样品都接受相同实验条件。
图18显示了其中相对菌株性能在考虑中的输入数据中的分布的一个实例。这在棒状杆菌中通过使用本公开中所述的方法进行。然而,相似程序已针对糖多孢菌进行定制并由本发明人成功执行。相对性能为零表示经工程改造的菌株的性能与板内基本或“参考”菌株同样好。所关注的是预测模型鉴别性能可能明显高于零的菌株的能力。另外,并且更一般来说,所关注的是任何所指定的菌株根据一些准则是否胜过其亲代。在实践中,准则可以是产物效价满足或超过高于亲代水平的某一阈值,尽管也可以改为利用或另外利用在所期望的方向上与亲代的统计显著差异。基本或“参考”菌株的作用简单地是充当供在板内或板之间进行比较的所添加归一化因子。
值得留意的构思是亲代菌株与参考菌株之间的差异。亲代菌株是用于当前一轮诱变的背景。参考菌株是在每个板中运作的对照菌株以促进比较,尤其是各板之间的比较,并且通常是如上文所提及的“基本菌株”。但是由于所述基本菌株(例如用于基准测试总体性能的野生型或工业菌株)就在所指定一轮的菌株改良中是诱变目标而言不一定是“基本的”,因此更具描述性的术语是“参考菌株”。
总之,基本/参考菌株通常是用于对所建构菌株的性能进行基准测试,而亲代菌株是用于对相关基因背景下的特定基因变化的性能进行基准测试。
通过线性回归对所建构菌株的性能进行评级
所公开的模型的目标是通过描述相对菌株性能与引入所建构菌株中的基因变化的组成的关系来对所建构菌株的性能进行评级。如本公开所论述,各种HTP基因设计文库提供了引入工程改造菌株中的可能基因变化(例如基因扰动/变异)的谱系。线性回归是当前所述示例性预测模型的基础。
随后基因变化和其对相对性能的影响是基于回归的建模的输入值。相对于常见基本菌株,对与菌株中所含的基因变化的组成有关的菌株性能进行评级。
表征所建构菌株的线性回归
线性回归由于易于实施和解译而成为一种用于所述HTP基因组工程改造平台的诱人方法。所得回归系数可以解释为因每种基因变化的存在所致的相对菌株性能的平均增加或降低。
举例来说,在一些实施例中,这种技术让我们得出结论:在不存在任何负上位相互作用的情况下,将原始启动子变成另一启动子使相对菌株性能改良平均约1、2、3、4、5、6、7、8、9、10个或更多个单位,并且因此是潜在高度期望的变化(注意:输入是无单位归一化值)。
所教示的方法因此使用线性回归模型对所建构的菌株进行描述/表征和评级,所建构的菌株的基因组中已引入来自各种所教示文库的各种基因扰动。
预测设计模型建立
使用所构建菌株的数据的上述线性回归模型可以用于对尚未建构的菌株进行性能预测。
所述程序可以概述如下:通过计算机模拟产生基因变化的所有可能构形→使用回归模型预测相对菌株性能→根据性能订购候选菌株设计。从而,通过利用回归模型预测迄今尚未建构的菌株的性能,所述方法实现了较高性能菌株的产生,同时执行更少的实验。
产生构形
当构建模型来预测迄今尚未建构的菌株的性能时,第一步骤是产生设计候选物的序列。此如下进行:固定菌株中的基因变化的总数,并且接着界定基因变化的所有可能组合。举例来说,可以将潜在基因变化/扰动的总数设定为29(例如29种可能SNP,或29种不同启动子,或其任何组合,只要基因扰动的范围是29)且接着决定设计29种潜在基因变化的所有可能的3员组合,从而产生3,654种候选菌株设计。
为了向前述3,654种候选菌株提供背景,设想可以使用n!/((n-r)!*r!)、由n个可能成员计算尺寸r的非冗余分组数目。如果r=3,n=29,则得到3,654。因此,如果设计出29种潜在变化的所有可能的3员组合,那么获得3,654种候选菌株。
预测新菌株设计的性能
使用以组合构形作为输入值所构建的上述线性回归,接着可以预测每种候选设计的预期相对性能。例如,前100种预测菌株设计的变化组成可以概括于2维图中,其中x轴列出潜在基因变化(29种可能基因变化)的池,并且y轴展示等级次序。黑色细胞可用于表示候选设计中存在特定变化,而白色细胞可用于表示那种变化不存在。
当使用新观察结果以迭代方式再训练和再拟合模型时,预测精确度应该随时间增加。本发明人的研究结果说明可借以对预测模型以迭代方式进行再训练和改良的方法。模型预测品质可以通过若干种方法评估,包括指示预测值与观察值之间的关联强度的相关系数,或度量平均模型误差的均方根误差。通过使用选定的度量标准进行模型评估,所述系统可以界定应该对模型再训练时所用的规则。
对以上模型的几个未陈述假设包括:(1)不存在上位相互作用;以及(2)用于建构预测模型的基因变化/扰动全部是在与所提议的基因变化组合相同的背景中作出。
根据二级特点进行过滤
上述说明性实例集中于基于所预测的宿主细胞性能的线性回归预测。在一些实施例中,本公开的线性回归方法还能够应用于非生物分子因素,如饱和生物质、抗性或其它可测量的宿主细胞特点。因此,本公开的方法还教示了在对待建构的候选物进行优先级排序时,考虑所预测性能外的其它特点。假设存在另外的相关数据,那么所述回归模型中也包括非线性项。
接近现有菌株
预测菌株类似于已建构的菌株可以节省时间和成本,尽管不是最佳预测候选物。
变化的多样性
构建前述模型时,由于上位相互作用的存在,因此不能确定基因变化真正具有叠加性(如根据线性回归所假定且如上述假设所提及)。因此,对基因变化差异性的了解可以用于提高正叠加作用的可能性。如果知道例如来自评级靠前的菌株的变化位于相同代谢路径且具有相似的性能特征,那么这个信息可以用于选择变化组成有差异的另一种评级靠前的菌株。如与上位定位有关的上述章节中所述,可以过滤所预测的最佳基因变化以使选择限于响应曲线有充分差异的突变。或者,线性回归可以是使用相似度矩阵进行权重预测的加权最小二乘法回归。
所预测性能的多样性
最后,可以选择设计所预测性能居中或不良的菌株,以便验证且随后改良预测模型。
迭代菌株设计优化
在实施例中,发订单引擎208将工厂订单提供给工厂210以制造并入最佳候选突变的微生物菌株。在反馈回路方式中,可以利用分析设备214分析结果,以确定哪种微生物展现所期望表型特性(314)。在分析阶段期间,评价经修饰的菌株培养物以确定其性能,即其所需表型特性的表达,包括在工业规模下的生产能力。举例来说,分析阶段尤其使用板的影像数据测量微生物群落生长作为群落健康的指标。使用分析设备214使基因变化与表型性能相关,并且将所得基因型-表型相关度数据保存在文库中,其可以存储于文库206中,以告知未来的微生物生产。
具体地说,实际产生足够高的实测性能的候选变化可以成行添加在数据库的表格(如上述表4)中。以这种方式,将最佳性能突变按照有监督的机器学习方式添加到预测菌株设计模型中。
LIMS基于由此前工厂运行所开发的相关度,以迭代方式执行设计/建构/测试/分析循环。在后续循环期间,单独或配合操作人员的分析设备214可以选择最佳候选物作为基本菌株输回到输入界面202中,从而使用相关度数据微调基因修饰以实现更佳的表型性能和更细的颗粒度。本公开实施例的实验室信息管理系统以这种方式执行了品质改良反馈回路。
总之,参照图26的流程图,迭代预测菌株设计工作流程可以描述如下:
●产生输入和输出变量(例如基因变化)的训练集作为输入和性能特点作为输出(3302)。可以由分析设备214基于此前的基因变化和并入那些基因变化的微生物菌株的相应实测性能来执行产生。
●开发基于训练集的初始模型(例如线性回归模型)(3304)。这可以由分析设备214执行。
●产生设计候选菌株(3306)
●在一个实施例中,分析设备214可以使相对于背景菌株所产生的基因变化的数目以变化组合的形式固定。为了体现这些变化,分析设备214可以向解译器204提供表示那些变化组合的一种或多种DNA规格表述。(这些基因变化或并入那些变化的微生物菌株可以称为“测试输入”。)解译器204解译一种或多种DNA规格,并且执行引擎207执行DNA规格以将已解决的输出填入DNA规格,所述输出代表了个别候选设计菌株以获得那些变化。
●基于所述模型,分析设备214预测每种候选设计菌株的预期性能(3308)。
●分析设备214选择有限数目的具有最高预测性能的候选设计,例如100种(3310)。
●如本文在别处针对上位定位所述,分析设备214通过例如过滤最佳设计以获得上位效应或将上位纳入预测模型中可以解释二级效应,如上位。
●基于发订单引擎208产生的工厂订单建构已过滤的候选菌株(在工厂210)(3312)。
●分析设备214测量所选菌株的实际性能,基于优良的实际性能选择有限数目的那些所选菌株(3314),并且将设计变化和其所得性能添加到预测模型中(3316)。在线性回归实例中,将设计变化和其相关性能的集合成行新添加在表4中。
●分析设备214接着以迭代方式返回到新设计候选菌株的产生(3306),并且继续迭代直到满足中止条件为止。中止条件可以包含例如满足性能度量标准的至少一种微生物菌株的实测性能,如产量、生长速率或效价。
在以上实例中,菌株设计的迭代优化是利用反馈和线性回归来执行机器学习。一般来说,机器学习可以描述为在利用有限数目个标记数据实例执行信息任务(如分类或回归)且接着对未知数据执行相同任务时优化性能准则,例如参数、技术或其它特点。在有监督的机器学习(如上述线性回归实例中的机器学习)中,机器(例如计算装置)例如通过鉴别训练数据所展现的图案、类别、统计学关系或其它属性来学习。学习结果接着用于预测新数据是否展现相同的模式、类别、统计学关系或其它属性。
当训练数据可获得时,本公开的实施例可以使用其它有监督的机器学习技术。在缺乏训练数据的情况下,实施例可以利用无监督的机器学习。或者,实施例可以利用半监督的机器学习,其使用少量的标记数据和大量的未标记数据。实施例也可以利用特点选择来选择最相关特点的子集以优化机器学习模型的性能。根据所选的机器学习方法的类型,作为线性回归的替代方案或除线性回归之外,实施例可以利用例如逻辑回归、神经网络、支持向量机(SVM)、决策树、隐式马尔可夫模型(hidden Markov models)、贝叶斯网络(Bayesiannetworks)、Gram Schmidt、基于强化的学习、基于簇的学习(包括分级聚类)、基因算法,和所属领域中已知的任何其它适合的机器学习。具体地说,实施例可以利用逻辑回归模型得到分类的概率(例如基因按照不同功能群的分类)以及分类本身。参见例如席维德(Shevade),使用稀疏逻辑回归进行基因选择的简单高效算法(A simple and efficientalgorithm for gene selection using sparse logistic regression),生物信息学(Bioinformatics),第19卷,第17期,2003,第2246-2253页;冷(Leng)等人,对暂时基因表达数据使用功能数据分析的分类(Classification using functional data analysis fortemporal gene expression data),生物信息学,第22卷,第1期,牛津大学出版社(OxfordUniversity Press)(2006),第68-76页,所有文献均以全文引用的方式并入本文。
实施例可以利用图形处理单元(GPU)加速架构,已发现其在执行机器学习任务方面越来越流行,尤其是称为深度神经网络(DNN)的形式。本公开的实施例可以利用基于GPU的机器学习,如以下文献中所述的机器学习:基于GPU的深度学习推理:性能和能力分析(GPU-Based Deep Learning Inference:A Performance and Power Analysis),英伟达白皮书(NVidia Whitepaper),2015年11月;达耳(Dahl)等人,用于QSAR预测的多任务神经网络(Multi-task Neural Networks for QSAR Predictions),多伦多大学计算机科学系(Dept.of Computer Science,Univ.of Toronto),2014年6月(arXiv:1406.1231[stat.ML]),所有文献均以全文引用的方式并入本文。适用于本公开实施例的机器学习技术也可以见于其它参考文献中:里伯莱奇特(Libbrecht)等人,机器学习在遗传学和基因组学中的应用(Machine learning applications in genetics and genomics),自然评论:遗传学(Nature Reviews:Genetics),第16卷,2015年6月;卡什亚普(Kashyap)等人,生物信息学中的大数据分析:机器学习视角(Big Data Analytics in Bioinformatics:AMachine Learning Perspective),乳胶类文件杂志(Journal of Latex Class Files),第13卷,第9期,2014年9月;普隆浦纳姆(Prompramote)等人,生物信息学中的机器学习(Machine Learning in Bioinformatics),生物信息学技术(BioinformaticsTechnologies)的第5章,第117-153页,施普林格(Springer),柏林海德堡(BerlinHeidelberg),2005,所有文献均以全文引用的方式并入本文。
迭代预测菌株设计:实例
下文提供了上文所概述的迭代预测菌株设计工作流程的实例应用。
制备训练输入和输出变量的初始集合。这种集合包含1864种具有所定义基因组成的独特工程改造菌株。每种菌株含有5种与15种之间的工程改造变化。训练集中存在总共336种独特基因变化。
开发初始预测计算机模型。实施方案使用广义线性模型(具有4阶多项式内核的核岭回归)。实施方案对两种不同表型(产量和生产率)建模。将这些表型以加权总和形式组合,以获得用于评级的单一分数,如下文所示。通过相对于所指定训练数据的k倍交叉验证来调整各种模型参数,例如正则化因子。
实施方案不合并相互作用效应的任何明确分析,如上文上位定位章节中所述。然而,如所属领域的技术人员会了解,所建构的广义线性模型可以捕捉内核的二阶、三阶和四阶项隐含的相互作用效应。
根据训练集训练模型。在训练之后,可展示出产量模型对训练数据的显著质量拟合。
随后产生候选菌株。这个实施例包括与将新的基因变化引入亲代菌株相关的串行建构约束条件。在此,不能简单地将候选物视为随所需变化数目而变。取而代之,作为起点,分析设备214选择此前所设计的已知具有高性能度量标准的菌株的集合(“种子菌株”)。分析设备214将基因变化个别地施加到种子菌株的每一种。所引入的基因变化不包括已经存在于种子菌株中的那些基因变化。出于各种技术、生物学或其它原因,明确需要或明确排除某些突变。
分析设备214基于所述模型预测候选菌株设计的性能。分析设备214基于针对两种所关注表型(产量和生产率)所预测的性能将候选物按“最佳”到“最差”评级。具体地说,分析设备214使用加权的总和对候选菌株评分。
分数=0.8*产量/最大(产量)+0.2*生产率/最大(生产率),
其中产量表示候选菌株的预测产量,
最大(产量)表示所有候选菌株的最大产量,
生产率表示候选菌株的生产率,并且
最大(生产率)表示所有候选菌株的最大产率。
分析设备214通过施加负载约束和操作约束而从候选物的评级清单产生最终的建议集合。在一些实施例中,负载极限可设置为指定数目,如48个计算机产生的候选设计菌株。
可以使用训练模型(上述)预测每一候选菌株的(产量和生产率的)预期性能。分析设备214可以使用上文给出的评分函数对候选菌株评级。可以随后施加负载和操作约束以得到48种候选菌株的过滤集合。接着基于由发订单引擎208产生的工厂订单建构经过滤的候选菌株(在工厂210)(3312)。订购可以是基于对应于候选菌株的DNA规格。
在实践中,建构方法具有预期的失败率,借此不能建构随机的菌株集合。
分析设备214还可以用于测量所选菌株的实际产量和生产率性能。分析设备214可以基于三个标准评价模型和所推荐的菌株:模型精确度;菌株性能的改良度;和与人类专家所产生的设计的等效性(或改良度)。
可以测量所推荐菌株的产量和生产率表型并与利用模型所预测的值进行比较。
接下来,分析设备214计算所推荐菌株的每一种相对于亲代菌株的性能变化百分比。
预测精确度可以通过若干种方法评估,包含指示预测值与观察值之间关联强度的相关系数,或度量平均模型误差的均方根误差。经过多轮实验,模型预测可能会发生漂移,并可以将新的基因变化添加到训练输入中以改善预测精确度。在这一实例中,将设计变化和其所得性能添加到预测模型中(3316)。
基因组设计和工程即服务
在本公开的实施例中,图25的LIMS系统软件3210可以按照图25的云计算系统3202建构,以使得多种用户能够设计和建构根据本公开实施例的微生物菌株。图25说明了根据本公开实施例的云计算环境3204。客户端计算机3206,如图25中所说明的那些计算机,通过网络3208(如因特网)接入LIMS系统。在实施例中,LIMS系统应用软件3210存在于云计算系统3202中。LIMS系统可以采用使用一个或多个处理器的一种或多种计算系统,所述计算系统的类型说明于图25中。云计算系统自身包括网络接口3212,其使LIMS系统应用程序3210通过网络3208连接到客户端计算机3206。网络接口3212可以包括应用软件编程接口(API)以使客户端计算机3206的客户应用程序能够访问LIMS系统软件3210。具体地说,通过API,客户端计算机3206可以访问LIMS系统200的组件,包括(但不限于)运行输入界面202、解译器204、执行引擎207、发订单引擎208、工厂210以及测试设备212和分析设备214的软件。软件即服务(SaaS)软件模块3214向客户端计算机3206提供LIMS系统软件3210即服务。云端管理模块3216管理客户端计算机3206对LIMS系统3210的访问。云端管理模块3216能够实现采用多租户应用程序、虚拟化的云端架构或所属领域中已知可服务多个用户的其它架构。
基因组自动化
本公开方法的自动化能够同时对多种测试菌株变异体中的目标产物进行高通量表型筛选和鉴别。
前述基因组工程预测建模平台是以如下事实为前提:以高通量方式构建数百和数千种突变型菌株。下述机器人和计算机系统是可借以执行这种高通量方法的结构性机构。
在一些实施例中,本公开教示了提高宿主细胞生产率或修复工业菌株的方法。作为这种方法的一部分,本公开教示了在板中组装DNA、建构新菌株、筛选培养物和在模型中筛选培养物用于槽罐发酵的方法。在一些实施例中,本公开教示了利用自动化机器人技术来辅助产生和测试新宿主菌株的一种或多种上述方法。
在一些实施例中,本公开教示了如图6A-B中所描绘的高通量菌株工程改造平台。
HTP机器人系统
在一些实施例中,本公开的自动化方法包含机器人系统。本文概述的系统通常针对96孔或384孔微量滴定板的使用,但是如所属领域的技术人员将了解,可以使用任何数目个不同板或配置。另外,本文概述的任一个或全部步骤可以自动进行;因此,例如,系统可以完全地或部分地自动化。
在一些实施例中,本公开的自动化系统包含一个或多个工作模块。举例来说,在一些实施例中,本公开的自动化系统包含DNA合成模块、载体克隆模块、菌株转化模块、筛选模块和测序模块(参见图7)。
如所属领域的技术人员将了解,自动化系统可以包括多种组件,包括(但不限于):液体处理器;一个或多个机器人臂;用于放置微量培养板的板处理器;板密封件、板穿孔机、自动化盖子处理器以去除和置换非交叉污染板上的孔盖;用一次性吸头进行样品分布的一次性吸头组合件;用于样品分布的可洗吸头组合件;96孔加载块;一体式热循环仪;冷却的试剂架;微量滴定板移液管位置(任选地冷却);用于板和吸头的堆叠塔;磁珠处理站;过滤系统;板振荡器;条形码阅读器和涂覆器;和计算机系统。
在一些实施例中,本公开的机器人系统包括实现了高通量移液的自动化液体和颗粒处理,以执行基因靶向和重组应用工艺中的所有步骤。这包括液体和颗粒操控,如抽吸、分配、混合、稀释、洗涤、精确体积转移;收回和丢弃移液管吸头;以及利用单次样品抽吸来重复吸移相同体积用于多次递送。这些操控是无交叉污染的液体、颗粒、细胞和生物体转移。仪器执行微量板样品向过滤器、膜和/或子板的自动化复制、高密度转移、全板连续稀释以及高容量操作。
在一些实施例中,本公开的定制自动化液体处理系统是帝肯(TECAN)机器(例如定制的TECAN Freedom Evo)。
在一些实施例中,本公开的自动化系统与用于多孔板、深孔板、方孔板、试剂槽、试管、小试管、微量离心管、冷冻管、过滤器、微阵列晶片、光纤、珠粒、琼脂糖和丙烯酰胺凝胶的平台兼容,并且将其它固相基质或平台容纳于可升级的模块化台板上。在一些实施例中,本公开的自动化系统含有至少一个模块化台板用于多位置工作表面,以便放置源样品和输出样品、试剂、样品和试剂稀释液、分析板、样品和试剂储集器、移液管吸头和活动的吸头洗涤站。
在一些实施例中,本公开的自动化系统包括高通量电穿孔系统。在一些实施例中,高通量电穿孔系统能够在96或384孔板中转化细胞。在一些实施例中,高通量电穿孔系统包括
Figure BDA0002371045810001151
高通量电穿孔系统、BTXTM
Figure BDA0002371045810001152
Gene Pulser MXcellTM或其它多孔电穿孔系统。
在一些实施例中,一体式热循环仪和/或热调节器用于稳定热交换器的温度,如对培育样品提供从0℃到100℃的精确温度控制的可控块或平台。
在一些实施例中,本公开的自动化系统与能够以机器人方式操控液体、颗粒、细胞和多细胞生物体的可更换机器头(单或多通道)兼容,所述机器头具有单个或多个磁性探针、亲和探针、复制器或吸移管管理器。多孔或多管式磁性分离器和过滤站按单个或多个样品格式操控着液体、颗粒、细胞和生物体。
在一些实施例中,本公开的自动化系统与照相视觉和/或光谱仪系统兼容。因此,在一些实施例中,本公开的自动化系统能够检测和记录进行中的细胞培养物的颜色和吸收变化。
在一些实施例中,本公开的自动化系统经设计可相对于多种硬件附件具有灵活性和可适应性,以允许所述系统执行多种应用。软件程序模块实现了方法的产生、修改和运行。系统的诊断模块实现了设置、仪器校准和马达操作。定制的工具、实验室器具以及液体和颗粒转移模式实现了不同应用的程序化执行。数据库实现了方法和参数的存储。机器人和计算机界面实现了仪器之间的通信。
因此,在一些实施例中,本公开教示了如图19中所描绘的高通量菌株工程改造平台。
所属领域中的技术人员将认识到,各种机器人平台能够执行本公开的HTP工程改造方法。下表5提供了能够执行如图19中所述的本公开HTP工程步骤中的每一步的科学设备的非排它性清单。
表5-与本公开HTP工程改造方法兼容的科学设备的非排它性清单.
Figure BDA0002371045810001153
Figure BDA0002371045810001161
Figure BDA0002371045810001171
Figure BDA0002371045810001181
计算机系统硬件
图27说明了根据本公开实施例的计算机系统800的实例,其可以用于执行非暂时性计算机可读媒体(例如存储器)中所存储的程序代码。计算机系统包括输入/输出子系统802,其可以用于介接人类用户和/或其它计算机系统,这取决于应用。I/O子系统802可以包括例如键盘、鼠标、图形用户界面、触摸屏,或用于输入的其它界面,以及例如LED或其它平面屏幕显示器,或用于输出的其它界面,包括应用程序界面(API)。本公开实施例的其它元件,如LIMS系统的组件,可以用计算机系统(如计算机系统800)实施。
程序代码可以存储于非暂时性媒体中,如辅助存储器810或主存储器808或这两者的永久性存储器中。主存储器808可以包括易失性存储器,如随机存取存储器(RAM),或非易失性存储器,如只读存储器(ROM),以及不同层次的高速缓存存储器用于更快地访问指令和数据。辅助存储器可以包括永久性存储器,如固态驱动器、硬盘驱动器或光盘。一个或多个处理器804从一个或多个非暂时性媒体中读取程序代码且执行所述代码以使计算机系统能够完成本文实施例所执行的方法。所属领域的技术人员将了解,处理器可以摄取原始码且将原始码解译或编译成处理器804的硬件门级所能理解的机器代码。处理器804可以包括用于处理计算密集型任务的图形处理单元(GPU)。特别是在机器学习中,一个或多个CPU 804可以将大量数据的处理分流到一个或多个GPU 804。
处理器804可以通过一个或多个通讯接口807(如网络接口卡、WiFi收发器等)与外部网络通信。总线805使I/O子系统802、处理器804、周边装置806、通信接口807、存储器808和永久性存储器810可通信地耦接。本公开的实施例不限于此代表性架构。替代实施例可以采用不同的配置和组件类型,例如用于输入-输出组件和存储器子系统的单独总线。
所属领域的技术人员将了解,本公开实施例中的一些或全部元件和其伴随操作可以完全或部分地通过一个或多个计算机系统来实施,所述计算机系统包括一个或多个处理器和一个或多个存储器系统,如计算机系统800的那些。具体地说,本文所述的LIMS系统200和任何机器人和其它自动化系统或装置的元件可以通过计算机实施。举例来说,一些元件和功能可以在本地实施且其它可以按通过不同服务器的网络分布方式(例如客户-服务器方式)实施。具体地说,可以使服务器一侧的操作按软件即服务(SaaS)方式供多个客户使用,如图25中所示。
术语组件在此背景中广泛地指软件、硬件或固件(或其任何组合)组件。组件通常是能够利用所指定的输入来产生适用数据或其它输出的功能组件。组件可以是或可以不是独立的。应用程序(也称为“应用”)可以包括一个或多个组件,或组件可以包括一个或多个应用程序。
一些实施例包括所述组件中的一些、全部或悉缺以及其它模块或应用组件。再者,各种实施例可以将这些组件中的两种或更多种合并成单一模块且/或使这些组件中的一种或多种的一部分功能与不同组件关联。
术语“存储器”可以是用于存储信息的任何装置或机构。根据本公开的一些实施例,存储器旨在涵盖(但不限于):易失性存储器、非易失性存储器和动态存储器中的任何类型。举例来说,存储器可以是随机存取存储器、存储器存储装置、光学存储器装置、磁性媒体、软盘、磁带、硬盘驱动器、SIMM、SDRAM、DIMM、RDRAM、DDR RAM、SODIMMS、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、光盘、DVD和/或类似物。根据一些实施例,存储器可以包括一个或多个磁盘驱动器、闪存驱动器、数据库、本地高速缓冲存储器、处理器高速缓存存储器、关系数据库、平面数据库、服务器、基于云端的平台和/或类似物。另外,所属领域的技术人员将了解,可以使用存储信息的许多其它装置和技术作为存储器。
存储器可以用于存储指令以便在处理器上运行一个或多个应用程序或模块。举例来说,存储器在一些实施例中可以用于容纳执行本申请中所公开的一种或多种模块和/或应用程序的功能所需的全部或一些指令。
基于基因设计预测的HTP微生物菌株工程:实例工作流程
在一些实施例中,本公开教示了基于本公开的计算分析系统的建议对新宿主生物体进行定向工程改造。
在一些实施例中,本公开与所有基因设计和克隆方法兼容。即,在一些实施例中,本公开教示了传统克隆技术的使用,如聚合酶链反应、限制酶消化、连接、同源重组、RT PCR以及所属领域中通常已知的其它技术,并且公开于例如:萨布鲁克(Sambrook)等人(2001),分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)(第3版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),纽约普莱恩维尤(Plainview,NewYork),所述文献以引用的方式并入本文中。
在一些实施例中,所克隆的序列可以包括来自本文所教示的任何HTP基因设计文库的可能性,例如:来自启动子交换文库的启动子、来自SNP交换文库的SNP、来自起始/终止密码子交换文库的起始或终止密码子、来自STOP交换文库的终止子,或来自序列优化文库的序列优化。
另外,特定构建体中应该包括的恰当序列组合可以通过上位定位功能知悉。
在其它实施例中,所克隆的序列还可包括基于合理设计(假设驱动型)的序列和/或基于其它来源(如科学出版物)的序列。
在一些实施例中,本公开教示了定向工程改造方法,包括如下步骤:i)产生定制的SNP特异性DNA;ii)组装SNP特异性质粒;iii)用SNP特异性DNA转化目标宿主细胞;和iv)使任何选择标记环出(参见图2)。
图6A描绘了本公开的菌株工程改造方法的通用工作流程,包括获取和组装DNA、组装载体、转化宿主细胞和去除选择标记。
建构特异性DNA寡核苷酸
在一些实施例中,本公开教示了插入和/或置换和/或改变和/或缺失宿主细胞生物体中的DNA区段。在一些方面中,本文教示的方法涉及建构将并入宿主生物体基因组中的所关注寡核苷酸(即,目标DNA区段)。在一些实施例中,本公开的目标DNA区段可以通过所属领域中已知的任何方法获得,包括:拷贝或从已知模板中切割、突变或DNA合成。在一些实施例中,本公开与用于产生目标DNA序列的市售基因合成产物(例如GeneArtTM、GeneMakerTM、GenScriptTM、AnagenTM、Blue HeronTM、EntelechonTM,GeNOsys有限公司,或QiagenTM)兼容。
在一些实施例中,目标DNA区段经设计以将SNP并入宿主生物体的所选DNA区域中(例如添加有益SNP)。在其它实施例中,DNA区段经设计以从宿主生物体的DNA中去除SNP(例如去除有害或中性SNP)。
在一些实施例中,本公开方法中所用的寡核苷酸可以使用所属领域中已知的任何酶或化学合成方法合成。寡核苷酸可以在固体载体上合成,所述固体载体如可控微孔玻璃(CPG)、聚苯乙烯珠粒,或由可以含有CPG的热塑性聚合物组成的膜。寡核苷酸还能够在并行的微米尺度上、按阵列方式、使用微流体(田(Tian)等人,分子生物系统(Mol.BioSyst.),5,714-722(2009))或提供两者组合的已知技术(参见雅各布森(Jacobsen)等人,美国专利申请第2011/0172127号)合成。
按阵列方式或通过微流体方式的合成优于传统固体载体合成之处在于通过减少试剂使用降低了成本。基因合成所需的规模低,因此通过阵列或通过微流体合成的寡核苷酸产物的规模是可接受的。然而,所合成的寡核苷酸的品质低于使用固体载体合成时(参见田(Tian),见下文;也参见施泰勒(Staehler)等人,美国专利申请第2010/0216648号)。
自从二十世纪八十年代首次描述了传统的四步亚磷酰胺化学方法以来,所述化学方法已经实现大量的进步(参见例如丝兹查勒(Sierzchala)等人,美国化学学会杂志(J.Am.Chem.Soc.),125,13427-13441(2003),其使用过氧基阴离子脱除保护基;早川(Hayakawa)等人,美国专利第6,040,439号,其关于替代保护基团;阿杂叶维(Azhayev)等人,四面体(Tetrahedron)57,4977-4986(2001),其关于通用载体;考兹洛维(Kozlov)等人,核苷、核苷酸和核酸(Nucleosides,Nucleotides,and Nucleic Acids),24(5-7),1037-1041(2005),其关于通过使用大孔隙CPG改良较长寡核苷酸的合成;以及丹哈(Damha)等人,NAR,18,3813-3821(1990),其关于改良的衍生化)。
不论合成的类型,所得寡核苷酸接着可以形成较小的结构单元用于较长的寡核苷酸。在一些实施例中,较小寡核苷酸可以使用所属领域中已知的方案连接在一起,如聚合酶链组装体(PCA)、连接酶链反应(LCR)和热力学平衡的由内而外合成(TBIO)(参见兹阿尔(Czar)等人,生物技术趋势(Trends in Biotechnology),27,63-71(2009))。在PCA中,在多个循环(通常约55个循环)中使跨越所期望较长产物的整个长度的寡核苷酸粘接且延长以最终获得全长产物。LCR使用连接酶将两个寡核苷酸连接,所述两个寡核苷酸均粘接到第三寡核苷酸。TBIO合成始于所期望产物的中心且通过使用重叠寡核苷酸而在两个方向上逐渐地延长,所述重叠寡核苷酸与位于基因的5'端的正向链同源且与位于基因的3'端的反向链非同源。
另一种合成较大双链DNA片段的方法是通过顶端链PCR(TSP)合并较小寡核苷酸。在此方法中,多种寡核苷酸跨越所期望产物的整个长度且含有相邻寡核苷酸的重叠区域。可以使用通用正向和反向引物执行扩增,并且通过多个循环的扩增来形成全长双链DNA产物。此产物接着可以经历任选的差错校正和进一步的扩增,产生所期望的双链DNA片段最终产物。
在TSP的一种方法中,经组合而形成所期望全长产物的较小寡核苷酸集合具有40-200个之间的碱基长度且彼此重叠至少约15-20个碱基。就实用目的来说,重叠区域的最小长度应该足以确保寡核苷酸的特异性粘接且具有足够高的解链温度(Tm),以便在所用反应温度下粘接。重叠可以延伸到所指定寡核苷酸被相邻寡核苷酸完全叠覆的点。重叠的量似乎对最终产物的品质无任何影响。组装体中的第一个和最后一个寡核苷酸结构单元应该含有正向和反向扩增引物的结合位点。在一个实施例中,第一个和最后一个寡核苷酸的末端序列含有互补的相同序列以允许使用通用引物。
组装/克隆定制质粒
在一些实施例中,本公开教示了构建载体的方法,所述载体能够将所期望的目标DNA区段(例如含有特定SNP)插入宿主生物体的基因组中。在一些实施例中,本公开教示了克隆载体的方法,所述载体包含目标DNA、同源臂和至少一个选择标记(参见图3)。
在一些实施例中,本公开与适合于转化到宿主生物体中的任何载体相容。在一些实施例中,本公开教示了与宿主细胞相容的穿梭载体的使用。在一个实施例中,本文所提供的方法中使用的穿梭载体是与大肠杆菌和/或糖多孢菌宿主细胞相容的穿梭载体。本文所提供的方法中使用的穿梭载体可以包含如本文所述用于选择和/或反向选择的标记。标记可以是所属领域中已知和/或本文提供的任何标记。穿梭载体可进一步包含适用于组装所述穿梭载体的任何调节序列和/或序列,如所属领域已知。穿梭载体可进一步包含任何复制起点,所述复制起点可以是在如本文所提供的宿主细胞(例如大肠杆菌或谷氨酸棒状杆菌)中繁殖所需要的。调节序列可以是所属领域中已知或本文提供的任何调节序列,例如宿主细胞的基因机器所用的启动子、起始、终止、信号、分泌和/或终止序列。在某些情况下,可以将目标DNA插入获自任何储存库或目录产物的载体、构建体或质粒中,如商业载体(参见例如DNA2.0定制版或
Figure BDA0002371045810001221
载体)。在某些情况下,可以将目标DNA插入获自任何储存库或目录产物的载体、构建体或质粒中,如商业载体(参见例如DNA2.0定制版或
Figure BDA0002371045810001222
载体)。
在一些实施例中,本公开的组装/克隆方法可以采用以下组装策略中的至少一种:i)II型传统克隆;ii)II S型介导或“金门控”克隆(参见例如恩格勒C.(Engler,C.),R.康德兹(R.Kandzia)和S.马里约内(S.Marillonnet),2008,“具有高通量能力的一锅一步精确克隆方法(A one pot,one step,precision cloning method with high-throughputcapability)”,公共科学图书馆综合卷(PLos One)3:e3647;科特纳I.(Kotera,I.)和T.长井(T.Nagai),2008,“使用DNA聚合酶抑制剂和IIS型限制酶对粗PCR产物的高通量单管式重组(A high-throughput and single-tube recombination of crude PCR productsusing a DNA polymerase inhibitor and type IIS restriction enzyme)”,生物技术杂志(J Biotechnol)137:1-7.;韦伯E.(Weber,E.),R.格鲁兹勒(R.Gruetzner),S.沃尔纳(S.Werner),C.恩格勒(C.Engler)和S.马里约内(S.Marillonnet),2011,通过金门控克隆组装设计者TAL效应子(Assembly of Designer TAL Effectors by Golden GateCloning),公共科学图书馆综合卷6:e19722);iii)
Figure BDA0002371045810001231
重组;iv)
Figure BDA0002371045810001232
克隆、核酸外切酶介导组装(艾斯兰迪斯(Aslanidis)和德迥(de Jong),1990,“PCR产物的连接非依赖性克隆(LIC-PCR)(Ligation-independent cloning of PCR products(LIC-PCR))”,核酸研究(Nucleic Acids Research),第18卷,第20 6069期);v)同源重组;vi)非同源末端连接;vii)吉布森组装(Gibson assembly)(吉布森(Gibson)等人,2009,“长达数百个千碱基的DNA分子的酶促组装(Enzymatic assembly of DNA molecules up to several hundredkilobases)”,自然方法(Nature Methods),6,343-345)或其组合。基于IIS型的模块化组装策略公开于PCT公开WO 2011/154147中,其公开内容以引用的方式并入本文中。
在一些实施例中,本公开教示了具有至少一个选择标记的克隆载体。各种选择标记基因在所属领域中已知,其通常编码抗生素抗性功能以便在原核细胞(例如针对安比西林(ampicillin)、卡那霉素(kanamycin)、四环素(tetracycline)、氯胺苯醇(chloramphenicol)、匀霉素(zeocin)、观霉素/链霉素(spectinomycin/streptomycin))或真核细胞(例如遗传霉素(geneticin)、新霉素(neomycin)、潮霉素(hygromycin)、嘌呤霉素(puromycin)、杀稻瘟菌素(blasticidin)、匀霉素)中、在选择性压力下进行选择。其它标记系统实现了所需或非所需细胞的筛选和鉴别,如众所周知的蓝/白斑筛选系统,其在细菌中用于在X-gal或萤光报导子(如成功转导的宿主细胞中所表达的绿色或红色荧光蛋白)存在下选择阳性克隆。另一类选择标记(其中大部分在原核生物系统中仅具功能性)是指可反向选择标记基因,通常也称为“死亡基因”,其表达杀死生产者细胞的毒性基因产物。这类基因的实例包括sacB、rpsL(strA)、tetAR、pheS、thyA、gata-1或ccdB,其功能描述于(雷拉特(Reyrat)等人,1998,“可反向选择标记:细菌遗传学和发病机理的未使用工具(Counterselectable Markers:Untapped Tools for Bacterial Genetics andPathogenesis)”,感染与免疫(Infect Immun.),66(9):4011-4017)。
反向选择标记
本公开还提供用于对糖多孢菌属进行基因工程改造的反向选择标记。在一些实施例中,糖多孢菌属是刺糖多孢菌。在一些实施例中,反向选择标记是编码果聚糖蔗糖酶(EC2.4.1.10)的果聚糖蔗糖酶(sacB)基因、苯丙氨酸tRNA合成酶(pheS)基因或其组合。
在一些实施例中,编码sacB或pheS基因的核苷酸序列针对糖多孢菌属(如刺糖多孢菌)经密码子优化。在一些实施例中,编码sacB的核苷酸序列包含SEQ ID No.146。在一些实施例中,编码sacB的核苷酸序列与SEQ ID No.146具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高同源性。在一些实施例中,编码pheS的核苷酸序列包含SEQ ID No.147或SEQ ID No.148。在一些实施例中,编码pheS的核苷酸序列与SEQ IDNo.147或SEQ ID No.148具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高同源性。
还提供用于糖多孢菌的基因组整合的质粒,其包含本公开的反向选择标记基因。在一些实施例中,质粒包含质粒骨干、除了反向选择标记基因之外的正向选择标记、同源左臂序列、同源右臂序列和DNA有效载荷(例如,待整合的编辑基因)。同源左臂序列、右臂序列实现靶向野生型基因座和DNA有效载荷之间的同源重组。在一些实施例中,反向选择标记是sacB基因或pheS基因。
还提供产生糖多孢菌的突变型菌株的方法。在一些实施例中,所述方法包含a)将本公开的包含反向选择标记基因的质粒引入到亲代糖多孢菌菌株中。这可通过使用同源重组或任何其它合适的过程进行。在一些实施例中,所述方法进一步包含b)使用正向选择(例如,基于质粒中的正向选择标记)用整合事件选择菌株。在一些实施例中,所述方法进一步包含使用负向选择(例如,基于反向选择标记基因)选择质粒骨架环出的菌株。在一些实施例中,与不具有整合DNA的亲代菌株相比,所得糖多孢菌菌株具有较好性能。在一些实施例中,反向选择标记是sacB基因或pheS基因。
果聚糖蔗糖酶(EC 2.4.1.10)是催化化学反应的酶
蔗糖+(2,6-β-D-果糖基)n
Figure BDA0002371045810001241
{\展示造型\可逆反应}\可逆反应葡萄糖+(2,6-β-D-果糖基)n+1
这种酶的两种底物是蔗糖和(2,6-β-D-果糖基)n,而其两种产物是葡萄糖和(2,6-β-D-果糖基)n+1。这种酶属于糖基转移酶家族,具体地说,己糖基转移酶家族。这种酶类的全称是蔗糖:2,6-β-D-果聚糖6-β-D-果糖基转移酶。其它常用名称包括蔗糖6-果糖基转移酶、β-2,6-果糖基转移酶和β-2,6-果聚糖:D-葡萄糖1-果糖基转移酶。
糖多孢菌菌株中的无痕靶基因组编辑
还提供糖多孢菌菌株,如刺糖多孢菌菌株中的靶基因组编辑的方法。所述方法产生在靶基因组基因座处含有基因变异的无痕糖多孢菌菌株。
在一些实施例中,所述方法包含(a)将基因组编辑质粒引入到糖多孢菌菌株中。所述基因组编辑质粒包含(1)选择标记;(2)反向选择标记;(3)带有待引入到基因组中的一个或多个所需基因变异的DNA片段;和(4)质粒骨架序列。在一些实施例中,带有一个或多个所需基因变异的DNA片段包含待整合于靶基因座处的糖多孢菌基因组中的一个或多个基因变异,和侧接所需基因变异的靶基因组基因座的同源臂。
在一些实施例中,所述方法进一步包含(b)基于基因组中存在选择标记选择已经历初始同源重组并具有整合于靶基因座中的基因变异的糖多孢菌菌株。
在一些实施例中,所述方法进一步包含(c)基于不存在反向选择标记选择具有整合于靶基因座中的基因变异,但经历使质粒骨架环出的另外的同源重组的糖多孢菌菌株。在一些实施例中,反向选择标记选自本公开中所述的那些标记。
在一些实施例中,在同一培养基上同时执行所述方法的步骤(b)和步骤(c)。在一些实施例中,在单独培养基上依次执行所述方法的步骤(b)和步骤(c)。
在一些实施例中,靶基因组基因座可包含糖多孢菌基因组的任何区域,包括不含编码DNA模组的重复区段的基因组区域。
在一些实施例中,基因组编辑质粒不包含在糖多孢菌菌株中起作用的温度敏感型复制子。
在一些实施例中,基因组编辑质粒不包含实现糖多孢菌菌株中的质粒的自复制的复制起点。
在一些实施例中,在不复制整合质粒的情况下执行选择步骤(c)。
在一些实施例中,使用如本公开中所述的接合方法将糖多孢菌菌株中的基因组编辑质粒引入到糖多孢菌菌株中。在一些实施例中,递送基因组编辑质粒的供体细胞是大肠杆菌细胞。在一些实施例中,受体细胞是刺糖多孢菌细胞。或者,在一些实施例中,基因组编辑质粒直接在糖多孢菌菌株中转化。
可使用多种同源重组质粒。在一些实施例中,基因组编辑质粒是单一同源重组载体。单一同源重组质粒可包含“插入盒”。插入同源重组盒包含与靶位点共有足够序列一致性的单一区域,所述靶位点促进单一同源重组交叉事件。在特定实施例中,插入盒进一步包含所关注聚核苷酸。当只有单交叉事件发生时,整个插入盒(和其中所含的质粒/载体)被整合在靶位点处。所述插入盒一般含于环状载体/质粒上。参见,美国公开2003/0131370、2003/0157076、2003/0188325和2004/0107452;托马斯(Thomas)等人(1987)细胞(Cell)51:503-512;和彭宁顿(Pennington)等人(1991)美国国家科学院院刊88:9498-9502,所述文献中的每一个以全文引用的方式并入本文中。
在一些实施例中,基因组编辑质粒是双重同源重组载体。例如,同源重组盒包含“置换载体”。置换同源重组盒包含与真核细胞中的靶位点的相应第一和第二区具有足够序列一致性的第一和第二区。发生双重同源重组交叉事件,第一和第二区内部的任何聚核苷酸被整合于靶位点处(即,盒的第一同源区和靶位点的相应第一区之间的同源重组;和重组盒的第二同源区和靶位点的相应第二区之间的同源重组)。参见,杨(Yang)等人(2014)应用和环境微生物学(Applied and Environmental Microbiology)80:3826-3834;波斯法(Posfai)等人(1999)核酸研究(Nucleic Acids Research)27(2):4409-4415;格拉夫(Graf)等人(2011)应用和环境微生物学77:5549-5552,所述文献中的每一个以全文引用的方式并入本文中。
原生质体产生方法
在一个实施例中,本文提供的方法和系统利用丝状真菌细胞产生原生质体。适用于制备原生质体的程序可以是所属领域中已知的任何程序,包括例如EP 238,023和耶尔顿(Yelton)等人(1984,美国国家科学院院刊81:1470-1474)中所述的那些程序。在一个实施例中,原生质体是通过用一种或多种溶胞酶或其混合物处理丝状真菌细胞培养物来产生。溶胞酶可以是β-葡聚糖酶和/或聚半乳糖醛酸苷酶。在一个实施例中,用于产生原生质体的酶混合物是VinoTaste浓缩物。酶处理之后,可以使用所属领域中已知的方法(例如离心)分离出原生质体。
可以改变预培育和实际原生质体产生步骤以优化原生质体数目和转化效率。举例来说,可以改变接种物尺寸、接种方法、预培育培养基、预培育时间、预培育温度、混合条件、洗涤缓冲液组成、稀释比率、溶胞酶处理期间的缓冲液组成、所用溶胞酶的类型和/或浓度、与溶胞酶一起培育的时间、原生质体洗涤程序和/或缓冲液、原生质体和/或聚核苷酸和/或转化试剂在实际转化期间的浓度、转化期间的物理参数、转化至所得转化体之后的程序。
本公开还提供一种基于原生质体融合,在两种或更多种微生物菌株中快速合并基因变化和在糖多孢菌属中产生遗传多样性的方法。在一些实施例中,当微生物菌株中的至少一种含有“标记”突变时,所述方法包含以下步骤:(1)从用于合并的经工程改造的菌株池中选择亲代菌株;(2)由待合并的菌株制备原生质体(例如,去除细胞壁等);和(3)融合所关注菌株;(4)回收细胞;(5)选择携带“标记”突变的细胞;和(6)针对其它亲代菌株出现的突变的存在对生长细胞进行基因分型。任选地,所述方法进一步包含以下步骤:(7)移除质粒形成“标记”突变。在一些实施例中,当微生物菌株均不含“标记”突变时,所述方法包含以下步骤:(1)从用于合并的经工程改造的菌株池中选择亲代菌株;(2)由待合并的菌株制备原生质体(例如,去除细胞壁等);和(3)融合所关注菌株;(4)回收细胞;(5)针对来自第一亲代菌株的突变的存在选择细胞;和(6)针对其它亲代菌株出现的突变的存在选择细胞。在一些实施例中,基于与来自第一亲代菌株和/或其它亲代菌株的突变相关的表型而选择菌株。在一些实施例中,基于基因分型而选择菌株。在一些实施例中,在高通量程序中进行基因分型步骤。
与传统方法相比,如本文所述的方法极其高效。例如,在糖多孢菌属中组合突变的传统方法是经由整合和反向选择在基本菌株中产生第一突变(~45天),由此产生突变型菌株(例如Mut1),并随后使用Mut1菌株作为受体,并再次经历45天工程改造过程用下一突变继续重复所述过程,由此产生具有两种突变的新菌株(例如Mut2)。然而,本公开方法仅需要约少于14天、15天、16天、17天、18天、19天、20天或21天即达成相同菌株。
在一些实施例中,在步骤(3)中,为了增加产生适用(新颖)突变体组合的胜率,可使用较少的具有“标记”突变的染色的细胞,由此增加这些“标记”细胞将与携带不同突变的细胞相互作用并融合的几率。在一些实施例中,具有“标记”突变的染色的细胞与具有“未标记”突变的染色的细胞的比率是约1:1.5、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20、1:25、1:30、1:35、1:40、1:45、1:50、1:55、1:60、1:65、1:70、1:75、1:80、1:85、1:90、1:95、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000或更高。
在一些实施例中,在步骤(4)中,将细胞涂铺于经渗透稳定的培养基上,而不使用琼脂覆层,其简化程序并使得自动化更容易。渗透稳定剂使得允许可能含有反向选择标记基因(例如,sacB基因)的细胞生长。原生质体化细胞对处理极为敏感并容易被杀伤。这个步骤确保足够细胞被回收。这个步骤运作地越好,就有越多的物质可用于下游分析。
在一些实施例中,在步骤(5)中,通过将合适抗生素上覆于生长细胞上来完成所述步骤。在亲代细胞均不携带“标记”突变的情况下,可通过其它手段对菌株进行基因分型以鉴别所关注菌株。这个步骤可以是任选的,但其确保富集最可能已经历细胞融合的细胞。可“标记”多个基因座,并且这样以来,可较快产生所关注组合,但如果希望具有“无痕”菌株,随后可能需要去除多个质粒。
在一些实施例中,在步骤(6)中,待基因分型的菌落数取决于交叉复杂性以及选择方案。
在一些实施例中,步骤(7)是任选的并建议用于另外校验或客户端递送。在一些实施例中,在菌株的工程改造循环结束时,需要去除所有质粒残余物。进行其的时间和频率由用户判断。在一些实施例中,可反向选择的sacB基因的存在使这个步骤较为简单。在一些实施例中,染色中的至少一种具有“标记”突变。在一些实施例中,在单一合并步骤期间融合的菌株数可为两种或更多种,如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500或更多。在一些实施例中,用于融合的菌株中的一种或多种可通过所关注基因座处的选择标记来标注。在一些实施例中,当亲代菌株之一包含“标记”基因突变,而另一亲代菌株中的基因突变未经标记时,未标记菌株与标记菌株的比率是约10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、150:1、200:1、250:1、300:1或更高。在一些实施例中,当亲代群具有超过5、6、7、8、9、10、15、20、25、30、35、40、45、50个或更多个未标记菌株时,使用相同比例的每一种。在一些实施例中,当使用未标记活菌株和标记死亡菌株时,活:死亡菌株的比率是约1:1或约1:2(活:死亡)。
本公开方法含有与先前所述方法(实用链霉菌遗传学(Practical StreptomycesGenetics),ISBN 0-7084-0623-8)相比的重要改良。所述改良包括(但不限于):
●产生原生质体的初始离心在较高速度(5000xg对1000xg)下进行较短时间(5min对10min)。这缩短了完成方案所需的时间。
●在一些实施例中,具有经改良组成的YEME培养基用于接纳使用具有sacB基因的菌株。典型YEME组成包括蔗糖,其对于具有sacB基因的菌株来说不耐受。经改良的YEME培养基用1M山梨糖醇取代蔗糖;
●在一些实施例中,不存在操作经消化细胞通过脱脂棉以使菌丝与原生质体分离的过滤步骤。在一些实施例中,酶处理之后未保留菌丝,因此不需要所述步骤;
●在一些实施例中,以实用链霉菌遗传学(ISBN 0-7084-0623-8)所建议的约1:5、1:6、1:7、1:8、1:9、1:10、1:15、1:20或更少的体积将原生质体再悬浮于所产生的,以去除后续自旋步骤并使得其较容易自动化;
●在一些实施例中,将融合原生质体回收在R2YE肉汤而不是顶层琼脂中。这极大地简化了自动化和处理。琼脂可固化并阻塞尖端并需要在所述方案期间保持温热。肉汤则不会具有这些复杂情况。这一改良不会显著降低原生质体活力。
●在一些实施例中,将原生质体回收在补充有0.5M山梨糖醇和0.5M甘露糖的R2YE培养基上。这一调配物需要时间和实验来进行开发。本发明人最初尝试仅使用1M或0.5M山梨糖醇,但其在使原生质体稳定方面并不有效并且细胞在1M山梨糖醇存在下生长缓慢。然而,本发明人发现,如果培养基补充有山梨糖醇和甘露糖(各0.5M),那么其作为渗透稳定培养基会起较好作用。
在一些实施例中,在步骤(2)中,通过溶菌酶处理去除细胞壁。在一些实施例中,使用约1mg/ml、2mg/ml、3mg/ml、4mg/ml、5mg/ml、6mg/ml、7mg/ml、8mg/ml、9mg/ml或10mg/ml溶菌酶的无菌P-缓冲液。在一些实施例中,在37℃下,总培育时间是约70min、75min、80min、85min、90min、95min或100min。在一些实施例中,通过评估其是否会被水裂解来验证所得原生质体。在一些实施例中,可以通过显微检查并通过在经渗透稳定的培养基上生长来测定水敏感性。
宿主细胞的转化
在一些实施例中,可以使用多种技术中的任一种将本公开的载体引入宿主细胞中,所述技术包括转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移(参见克里斯蒂P.J.(Christie,P.J.)和戈登J.E.(Gordon,J.E.),2014“农杆菌Ti质粒(TheAgrobacterium Ti Plasmids)”,微生物学谱(Microbiol SPectr.),2014;2(6);10.1128)。特定方法包括磷酸钙转染、DEAE-聚葡萄糖介导转染、脂质体转染或电穿孔(戴维斯L.(Davis,L.),迪波乐M.(Dibner,M.),巴特I.(Battey,I.),1986“分子生物学的基本方法(Basic Methods in Molecular Biology)”)。其它转化方法包括例如乙酸锂转化和电穿孔。参见例如杰兹(Gietz)等人,核酸研究(Nucleic Acids Res.),27:69-74(1992);伊藤(Ito)等人,细菌学杂志(J.Bacterol.)153:163-168(1983);和贝克尔(Becker)和加伦特(Guarente),酶学方法(Methods in Enzymology)194:182-187(1991)。在一些实施例中,转化的宿主细胞称为重组宿主菌株。
在一些实施例中,本公开教示了使用本公开的96孔板机器人平台和液体处理机器高通量转化细胞。
在一些实施例中,本公开教示了用如上文所述的一种或多种选择标记筛选已转化的细胞。在一个此类实施例中,将经包含卡那霉素抗性标记(KanR)的载体转化的细胞涂铺于含有有效量的卡那霉素抗生素的培养基上。推测加入卡那霉素的培养基上可见的菌落形成单位,以将载体盒并入其基因组中。所期望序列的插入可以通过PCR、限制酶分析和/或相关插入位点的测序来证实。
所选序列的环出
在一些实施例中,本公开教示了使DNA的所选区域从宿主生物体中环出的方法。环出方法可以如中岛(Nakashima)等人,2014“通过基因组编辑和基因静默进行的细菌细胞工程改造(Bacterial Cellular Engineering by Genome Editing and Gene Silencing)”,国际分子科学杂志(Int.J.Mol.Sci.)15(2),2773-2793中所述。在一些实施例中,本公开教示了使选择标记从阳性转化体中环出。环出缺失技术在所属领域中已知,并且描述于(替尔(Tear)等人,2014“不稳定人工基因特异性反向重复序列的切除介导了大肠杆菌中的无痕基因缺失(Excision of Unstable Artificial Gene-Specific inverted RepeatsMediates Scar-Free Gene Deletions in Escherichia coli)”,应用生物化学和生物技术(Appl.Biochem.Biotech.)175:1858-1867)。本文所提供的方法中使用的环出方法可以使用单一互换型同源重组或双重互换型同源重组执行。在一个实施例中,所选区域如本文所述环出可能需要使用如本文所述的单一互换型同源重组。
首先,将环出载体插入宿主生物体基因组内的所选目标区域中(例如通过同源重组、CRISPR或其它基因编辑技术)。在一个实施例中,单一互换型同源重组是在圆形质粒或载体与宿主细胞基因组之间使用,以便使圆形质粒或载体环入,如图3中所描绘。所插入的载体可以使用作为现有或邻近引入的宿主序列的顺向重复序列的序列设计,以便顺向重复序列侧接预定成环和缺失的DNA区域。一经插入,可以根据选择区域的缺失来反向选择含有环出质粒或载体的细胞(参见例如图4;缺乏针对选择基因的抗性)。
所属领域中的技术人员将认识到,环出程序的描述仅展示了使非所需区域从基因组中缺失的一种说明性方法。的确,本公开的方法与用于基因组缺失的任何方法兼容,包括(但不限于)通过CRISPR、TALENS、FOK或其它核酸内切酶进行的基因编辑。所属领域的技术人员还将了解通过同源重组技术能够置换基因组的非所需区域。
中性整合位点 外来基因并且甚至整个路径通常输入到盘生物体中,需要基于质粒的表达或针对基因组整合进行中性位点的鉴别。由于与基于质粒的表达相比,基因组整合更稳定并可预测,因此这通常是对于修饰,尤其对于工业微生物菌株的优选方法。
这些中性整合位点为其中个别基因或多基因盒可稳定并高效地整合于微生物菌株,如糖多孢菌属菌株的基因组中的基因座。将序列整合于这些位点中对菌株的生长没有影响或影响有限。如本文所用,“中性整合位点”是指原生存在于微生物细胞染色体上的基因或染色体基因座,细胞生长或细胞针对特定生物过程发挥所有功能的能力不需要所述位点的正常功能。当通过非通常存在于所述基因中的DNA序列的整合中断时,具有中断中性整合位点基因的细胞可高效地执行所述生物过程。
在一些实施例中,本公开在刺糖多孢菌中提供中性整合位点(NIS)。所述中性整合位点包括(但不限于)具有SEQ ID No.132到SEQ ID No.142中的任一个的序列的基因座。这些NIS在所有糖多孢菌属中可为保守的。因此,非刺糖多孢菌但与刺糖多孢菌中的NIS共有同源性的糖多孢菌属中的基因座也是潜在的中性整合位点。
所述中性整合位点具有多个效用。例如,具有相对较大尺寸的外源DNA片段可插入到本文所述的单一中性整合位点中。所述DNA片段尺寸可为至少5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、20kb、25kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb或更高,而不影响宿主细胞生长。
待整合于NIS中的DNA片段可以是任何所需序列。待整合的所述DNA片段可为宿主细胞引入新功能、增强宿主细胞的现有功能或降低可能对宿主细胞生长造成不利影响的任何因素的影响。例如,与不具有插入的参考菌株相比,具有插入到一个或多个中性整合位点中的一个或多个基因元件的糖多孢菌属菌株可具有改良性能(例如,一个或多个所关注分子(如刺糖菌素)的改良产量)。
在一些实施例中,待整合的DNA片段包含与宿主细胞同源和/或异源的序列。在一些实施例中,待整合的DNA片段包含在宿主细胞中起作用的所选启动子。在一些实施例中,待整合的DNA片段包含在宿主细胞中起作用的所选终止序列。在一些实施例中,启动子和终止序列可以是本公开中所述序列中的任一个或所述领域中已知的那些。
在一些实施例中,待整合的DNA片段包含一个或多个选择标记,其可用于选择包含整合DNA片段的细胞。在一些实施例中,待整合的DNA片段包含反向选择标记,其可用于促进整个或部分整合DNA片段的环出。
在一些实施例中,一个或多个外源基因可整合于如本公开中所述的糖多孢菌属的NIS中,以将新颖功能引入微生物物种中,如建立新颖路径。在一些实施例中,此类新颖路径是不存在于天然宿主细胞中的合成路径和/或信号传导转导路径。在一些实施例中,待整合的DNA片段含有整合酶的附着位点,允许进行生物合成路径或其组件的后续、高效、靶向整合。在一些实施例中,将DNA片段整合于本公开的NIS中,所述DNA片段包含编码一种或多种作为次级代谢物的生物合成路径的一部分的基因产物的全基因簇或基因簇的一部分。次级代谢物通常在植物取食防御和其它种间防御方面起重要作用。次级代谢物在复杂微生物环境中争夺营养物质和栖息场所方面可具有一定作用。在一些实施例中,次级代谢物具有针对竞争细菌、真菌酵母或其它生物体的生物活性。在一些实施例中,次级代谢物充当竞争者营养物质摄取酶的抑制剂或直接显示抗细菌或抗真菌活性。在一些实施例中,次级代谢物对抗竞争者防御机制而还有一些对抗竞争者攻击机制。众所周知,关于化学特征,次级代谢物显示难以置信的丰富多样性。因此,人类使用一些次级代谢物作为药剂、调味剂和消遣性药物。次级代谢物可划分成以下类别:小“小分子”,如β-内酰胺、生物碱、萜类、糖苷、天然酚、吩嗪、联二苯和二苯并呋喃;大“小分子”,其由较大模块化“分子厂”产生,如聚酮、复合糖苷、非核糖体肽和上述三种的混合物;以及非“小分子”(DNA、RNA、核糖体或多糖“经典”生物聚合物,如核糖体肽)。
在一些实施例中,本公开NIS可并入到载体中。“载体”是复制子,如质粒、噬菌体、细菌人工染色体(BAC)或粘质体,可将另一DNA区段(例如外来基因)并入所述载体以便引起连接区段复制,引起所引入的序列表达。载体可包含启动子和一个或多个控制元件(例如,强化子元件),其与所引入的序列异源但经宿主细胞识别并使用。在一些实施例中,载体可进一步并入不同微生物物种的基因组中,由此建立不同微生物物种中的NIS。例如,本公开中所述的刺糖多孢菌的NIS可并入到相关糖多孢菌物种的基因组中。
整合酶
称作“整合酶”的酶识别两个连接(att)位点(保守核苷酸序列通常位于宿主染色体中的tRNA基因中),连接两个DNA分子并催化DNA双链断裂。重新连接事件引起DNA分子之一整合到受体细胞的另一DNA中(格林德利N.D.(N.D.Grindley)、怀特森K.L.(K.L.Whiteson)、莱斯P.A.(P.A.Rice),2006.生物化学年鉴(Annu.Rev.Biochem.)75,567-605.)因此,整合酶可经由在保守位点识别和连接直接靶向DNA有效载荷的整合。
本公开提供用于靶向克隆和/或将DNA片段从供体生物体转移到宿主细胞中的组合物和方法。在一些实施例中,待修饰宿主细胞包含与可经指定整合酶识别的att位点具有一致性或具有同源性的序列。在一些实施例中,待修饰宿主细胞不包含与可经指定整合酶识别的att位点具有一致性或具有同源性的序列。在第二种情况下,与att位点具有一致性或具有同源性的序列可首先插入宿主细胞中的中性整合位点,如本公开中所述的NIS中。
在一些实施例中,整合酶是源自糖多孢菌物种。在一些实施例中,整合酶源自植物内生糖多孢菌、红色糖多孢菌或刺糖多孢菌。在一些实施例中,整合酶包含序列SEQ ID No85、87、89、91、93或其任何功能变异体。
整合酶识别源自糖多孢菌物种的att位点。在一些实施例中,att位点源自植物内生糖多孢菌、红色糖多孢菌或刺糖多孢菌。在一些实施例中,附着位点包含序列SEQ IDNo.167到171或其任何功能变异体。
在一些实施例中,待整合于宿主细胞的基因组中的DNA片段尺寸为至少5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、20kb、25kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb或更高。
本公开提供用于将外源DNA整合于宿主细胞(如糖多孢菌物种)的基因组中的载体。
在一些实施例中,所述载体包含编码切除酶(xis)、整合酶(int)和/或附着位点(attP)的序列。在一些实施例中,所述载体中的序列源自植物内生糖多孢菌。在一些实施例中,所述载体是基于pCM32,如陈等人(“糖多孢菌质粒pCM32的染色体整合的表征和其改良刺糖多孢菌中的刺糖菌素产量的应用(Characterization of the chromosomalintegration of Saccharopolyspora plasmid pCM32 and its application to improveproduction of spinosyn in Saccharopolyspora spinosa.)”应用微生物学和生物技术.PMID 26260388DOI:10.1007/s00253-015-6871-z)所述。在一些实施例中,所述载体中的序列源自红色糖多孢菌。在一些实施例中,所述载体是基于pSE101和/或pSE211,如提伯力等人(“放线菌整合性和接合性元件”安东尼·范·列文虎克94,127-143)所述。
在一些实施例中,本公开的载体识别刺糖多孢菌的基因组中的序列。在一些实施例中,可通过本公开整合酶识别的刺糖多孢菌的基因组中的序列具有选自SEQ ID No.167到171的序列或其任何功能变异体。在一些实施例中,源自植物内生糖多孢菌和/或红色糖多孢菌的att位点引入到刺糖多孢菌的基因组中。在一些实施例中,源自植物内生糖多孢菌和/或红色糖多孢菌的att位点引入到刺糖多孢菌的NIS,如本公开中所述的NIS中的任一个中。
使用整合酶的其它工具和方法描述在WO/2001/051639A2、WO/2013/189843A1、WO/2001/087936A2、WO/2001/083803A1、WO/2001/075116A2和美国专利第6569668号中,其各自以全文引用的方式并入本文中。
复制起点
本公开还提供用于可用于糖多孢菌物种,如刺糖多孢菌的自复制质粒系统的复制起点和复制元件。
在一些实施例中,自复制的起点和元件增加了可以在糖多孢菌属中执行的基因工程改造和筛选的类型。在一些实施例中,自复制起点源自来自红色糖多孢菌的推定染色体复制起点(SEQ ID No.94)。在一些实施例中,自复制起点源自来自红色糖多孢菌的复制质粒pSE101和pSE211的放线菌整合性和接合性元件(AICE)(分别呈SEQ ID No.95和SEQ IDNo.96)。在一些实施例中,本公开自复制起点组装在含有抗生素抗性标记,并存在或不存在自复制所需的其它基因(例如,在AICE情况下)的质粒中。组装质粒可以递送到糖多孢菌属,并且抗生素选择可用于选择具有自复制质粒的转化体。
在一些实施例中,本公开的自复制起点可以引入到糖多孢菌物种,如刺糖多孢菌中。在一些实施例中,包含复制起点的DNA片段具有相对较大尺寸,如至少5kb、6kb、7kb、8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、20kb、25kb、30kb、40kb、50kb、60kb、70kb、80kb、90kb、100kb或更高。
在一些实施例中,待引入到糖多孢菌物种中的包含复制起点的DNA片段可为宿主细胞引入新功能、增强宿主细胞的现有功能或降低可能对宿主细胞生长造成不利影响的任何因素的影响。例如,与不具有插入的参考菌株相比,具有插入到基因组中的一个或多个基因元件的糖多孢菌属菌株可具有改良性能(例如,一个或多个所关注分子(如刺糖菌素)的改良产量)。
在一些实施例中,待引入的包含复制起点的DNA片段包含与宿主细胞同源和/或异源的序列。在一些实施例中,待引入的包含复制起点的DNA片段包含在宿主细胞中起作用的所选启动子。在一些实施例中,待引入的DNA片段包含在宿主细胞中起作用的所选终止序列。在一些实施例中,启动子和终止序列可以是本公开中所述序列中的任一个或所述领域中已知的那些。
在一些实施例中,待引入的包含复制起点的DNA片段包含一个或多个选择标记,其可用于选择包含DNA片段的细胞。在一些实施例中,待引入的包含复制起点的DNA片段包含反向选择标记,其可用于促进整个或部分DNA片段的环出。
在一些实施例中,一种或多种外源基因可与复制起点一起引入到糖多孢菌属中,以将新颖功能引入微生物物种中,如建立新颖路径。在一些实施例中,此类新颖路径是不存在于天然宿主细胞中的合成路径和/或信号传导转导路径。在一些实施例中,DNA片段包含编码一种或多种作为次级代谢物的生物合成路径的一部分的基因产物的全基因簇或基因簇的一部分。
报告子
糖多孢菌是很大程度上难以处理的宿主属,对于其尚已建立极少分子生物学工具。这些工具对于开发工程改造工具和工程改造尝试极其重要。本公开还提供用于糖多孢菌物种,如刺糖多孢菌的报告蛋白和分析。因此,本公开提供缺少的报告子系统。
在一些实施例中,提供在糖多孢菌属中起作用的报告蛋白。在一些实施例中,所述报告蛋白是荧光蛋白和酶β-葡糖醛酸酶。在一些实施例中,所述荧光蛋白是绿色荧光蛋白和红色荧光蛋白。在一些实施例中,报告蛋白是Dasher GFP和Paprika RFP(ATUM,https://www.atum.bio/products/protein-paintbox?exp=2)和酶β-葡糖醛酸酶(gusA)(杰佛森(Jefferson)等人(1986).“作为基因融合标记的得自大肠杆菌的β-葡糖醛酸酶(Beta-Glucuronidase from Escherichia coli as a gene-fusion marker)”.美国国家科学院院刊(Proceedings of the National Academy of Sciences of the United States ofAmerica.)83(22):8447-51.)。
在一些实施例中,编码报告蛋白的基因经密码子优化。在一些实施例中,编码荧光蛋白的基因针对大肠杆菌经密码子优化。在一些实施例中,编码荧光蛋白的基因具有核苷酸序列SEQ ID No.81或SEQ ID No.82)。在一些实施例中,编码β-葡糖醛酸酶(gusA)的基因经密码子优化以供刺糖多孢菌中的表达,其例如具有核苷酸序列SEQ ID No.83。
在一些实施例中,编码荧光蛋白的基因经修饰以改变报告蛋白的荧光激发和发射光谱。
在一些实施例中,在单一糖多孢菌细胞中使用两个或更多个荧光蛋白。在一些实施例中,在单一糖多孢菌细胞中使用绿色荧光蛋白和红色荧光蛋白。在一些实施例中,绿色荧光报告蛋白和红色荧光报告蛋白的荧光激发和发射光谱彼此不同。
在一些实施例中,本公开的报告蛋白用于测定调节元件的基因表达活性。在一些实施例中,调节元件可为启动子、核糖体结合位点、起始/终止密码子、终止子、强化子、抑制子、单链RNA、双链RNA、类似元件或其任何组合。例如,当启动子可操作地连接到编码本公开报告子的序列并在微生物菌株中表达时,可通过荧光信号测定促进基因表达的启动子强度。类似地,当编码本公开报告子的序列可操作地连接到终止序列时,可通过荧光信号测定抑制基因表达的终止子强度。因此,在一些实施例中,报告子适用于测定一组启动子、核糖体结合位点、起始/终止密码子、终止子、强化子、抑制子、单股RNA、双股RNA和类似元件的强度,由此建立梯(文库)。在一些实施例中,本公开的报告蛋白可用作筛选工具。例如,可基于存在或不存在报告蛋白,如通过流式细胞术或在板上在激发光谱下观察来分选具有经报告蛋白“标记”的指定表型的菌株。
在一些实施例中,本公开的报告蛋白可以与内源或外源多肽融合并在糖多孢菌细胞中表达。在一些实施例中,报告蛋白可用于用户期望的任何方法中。
在一些实施例中,编码本公开的报告蛋白的基因可连接到终止序列。在一些实施例中,终止子具有序列SEQ ID No.149。
实例
以下实例是为了说明本公开的各种实施例而提供且不希望以任何方式限制本公开。所属领域的技术人员将认识到,其中的变化和其它用途涵盖于由权利要求书范围限定的本公开精神内。
下文提供目录简表仅为了帮助读者。此目录不希望限制本申请的实例或公开内容的范围。
表6-实例章节的目录.
Figure BDA0002371045810001361
Figure BDA0002371045810001371
实例1:糖多孢菌的HTP转化和SNP文库创建的说明
这一实例说明了本公开的HTP基因工程改造方法的实施例。宿主细胞用不同尺寸的多种SNP序列(皆靶向基因组的不同区域)转化。结果证明本公开的方法能够产生跨越宿主细胞的整个基因组的任何种类的快速基因变化。
A.转化载体的克隆
将从预先确定的糖多孢菌菌株(例如,刺糖多孢菌菌株)中随机选择多种SNP并使用酵母同源重组克隆技术克隆到糖多孢菌克隆载体中以组装载体,其中每个SNP侧接顺向重复区域,如上文在“组装/克隆定制质粒”章节中所述和如图3中所说明。
这一实例的SNP盒将经设计以包括范围为约0.5Kb、1Kb、2Kb和5Kb或任何其它所需长度的同源性定向重复臂长范围。此外,将针对靶向基因组的多个不同区域的同源重组设计SNP盒,如下文更详细地描述。参见图10的在棒状杆菌中论证的示例性转化实验。然而,相似程序已针对糖多孢菌进行定制并由本发明人成功执行。
刺糖多孢菌基因组尺寸为约8,581,920bp(参见图9),并含有约8,302个预测编码序列(CDS),参见潘(Pan)等人(细菌学杂志(JOURNAL OF BACTERIOLOGY),2011年6月,第3150-3151页,doi:10.1128/JB.00344-11)。基因组可以任意划分成相同大小的基因区域,并且SNP盒将经设计以靶向所述区域中的每一个。
每个DNA插入序列将通过使用商业来源的寡核苷酸和上述宿主菌株基因组DNA作为模板对同源区进行PCR扩增来产生。待引入基因组中的SNP将由寡核苷酸尾编码。PCR片段将使用在酵母中进行的同源重组组装成载体骨架。
每个SNP和同源臂克隆到载体中将根据图6A-B、图3和表5中所述的HTP工程改造工作流程进行。
B.已组装的克隆转化到大肠杆菌中
将首先使用标准热休克转化技术将载体转化到大肠杆菌中,以便鉴别恰当组装的克隆并扩增载体DNA用于糖多孢菌转化。
举例来说,将针对组装成功来测试所转化的大肠杆菌细菌。将培养得自每个大肠杆菌转化板的菌落并经由PCR测试其正确组装。将针对转化位置中的每一个并针对不同插入尺寸中的每一种重复这一过程。这一实验的结果将表示为从针对每种处理(插入尺寸和基因组位置)将测试的菌落中鉴别出的正确菌落的数目。
C.组装的克隆转化到糖多孢菌中
已验证的克隆将通过电穿孔转化到刺糖多孢菌宿主细胞中。对于每次转化,测定每微克DNA的菌落形成单位(CFU)数目,其随插入序列尺寸而变。还将随同源臂长度分析基因组整合。
还将相对于刺糖多孢菌转化体中的靶基因组位置分析基因组整合效率。
D.使选择标记环出
将经鉴别已成功整合插入盒的糖多孢菌培养物在培养基上培养以进行反向选择,以便使选择基因环出。这些结果将说明环出效率在.5kb到5kb的同源臂长度间或其它所需长度是否保持稳定。
为了进一步验证环出事件,将培养展现抗性的菌落并通过测序加以分析。
实例2:HTP基因组工程-建构SNP文库以修复/改良工业微生物菌株
这一实例说明了本公开的HTP菌株改良程序中的SNP交换文库的若干方面。具体地说,所述实例说明了修复当前现有的工业菌株的若干设想方法。这一实例描述了探究表型解空间的向上波动和向下波动方法,所述解空间因“基本”、“中间”和工业菌株之间可能存在的多个基因差异而产生。
A.多样性池中的SNP的鉴别
将对工业生产微生物菌株(本文称为“C”)进行使用本公开方法的示例性菌株改良程序。这一程序用的多样性池菌株由A、B和C表示。菌株A代表任何诱变之前的原始生产宿主菌株。菌株C代表当前工业菌株,其已经经历许多年的通过传统菌株改良程序进行的诱变和选择。菌株B代表“折中(middle ground)”菌株,其已经经历一些诱变,并且是菌株C的前体。
将对菌株A、B和C测序并分析其基因组在各菌株之间的基因差异。将鉴别所有非同义SNP。其中,某些SNP将是C独有的,某些将被B和C另外共有,并且某些SNP将是菌株B独有的。这些SNP将作为多样性池用于下游菌株改良循环。
B.SNP交换分析
将对实例2的部分A中从多样性池中鉴别出的SNP进行分析以确定其对宿主细胞性能的影响。对菌株性能的初轮“学习”将分解为如下文所述的六个步骤,并且图解于图11中。
首先,来自C的所有SNP将个别地和/或组合地克隆到基本A菌株中。这些转化体的用途将是鉴别有益SNP。
第二,来自C的所有SNP将个别地和/或组合地从商业菌株C中去除。这些转化体的用途将是鉴别中性和有害SNP。任选的另外步骤3-6也描述如下。从两个基因时间点(基本菌株A和工业菌株C)添加和去除SNP的第一和第二步骤在本文中称为“波动”,其包含“向上波动”(向基本菌株中添加SNP,第一步骤)和“向下波动”(从工业菌株中去除SNP,第二步骤)。波动概念延伸到SNP的进一步添加/去除。
第三,来自B的所有SNP将个别地和/或组合地克隆到基本A菌株中。这些转化体的用途将是鉴别有益SNP。若干种转化体还将充当第一步骤中所产生的转化体的验证数据。
第四,来自B的所有SNP将个别地和/或组合地从商业菌株B中去除。这些转化体的用途将是鉴别中性和有害SNP。若干种转化体还将充当第二步骤中所产生的转化体的验证数据。
第五,C独有(即,也不存在于B中)的所有SNP将个别地和/或组合地克隆到商业B菌株中。这些转化体的用途将是鉴别有益SNP。若干种转化体还将充当第一和第三步骤中所产生的转化体的验证数据。
第六,C独有的所有SNP将个别地和/或组合地从商业菌株C中去除。这些转化体的用途将是鉴别中性和有害SNP。若干种转化体还将充当第二和第四步骤中所产生的转化体的验证数据。
使用从这些步骤中的每一个收集的数据将每种SNP初步分类为有益、中性或有害的。
或者,在另一实例中,菌株A代表原始生产宿主菌株,其可已经具有一些,但并非过多的诱变。菌株C代表当前工业菌株,其已经经历许多年的通过传统菌株改良程序进行的诱变和选择。菌株B代表“折中”菌株,其为具有比菌株C要少得多的诱变,但比菌株A要多的诱变的老工业菌株。可采用与上文所述相似的步骤以产生数据并且所述步骤用于对每个SNP进行归类。在一些实施例中,代替在每种背景菌株中制得所有SNP,应理解,可首先选择某一组SNP并优先化用于进一步工程改造。
证明这一工程改造方法实用性的数据显示在图61中。与基本菌株相比,并使用上文所述的工程改造方法,在高级谱系菌株中鉴别到诱变SNP,以无痕方式将这些SNP从高级菌株去除。与亲代菌株(高级谱系菌株)比较在板分析中测试“SNP交换”菌株的聚酮生产率,并且与亲代菌株相比,一些菌株展现出改良。
C.利用上位定位确定有益SNP组合
通过本公开的上位定位方法对实例2的部分B中所鉴别的有益SNP进行分析,以便鉴别出当组合时可能会改良宿主性能的SNP。
将使用实例1的工程改造方法产生经工程改造的新菌株变异体以根据上位定位预测测试SNP组合。SNP合并可以依序发生,或者可以跨越多个分支发生,使得超过一种改良菌株可以存在有益SNP的子集。SNP合并将在多轮菌株改良中持续,直到产生含有有益SNP的最佳组合而无任何中性或有害SNP包袱的最终菌株为止。
实例3:HTP基因工程-建构SNP交换文库以改良糖多孢菌中在刺糖菌素产量方面的菌株性能
这个实例提供了实例2的SNP交换HTP设计菌株改良程序的一部分的说明性实施方案,目标是改良刺糖多孢菌生产刺糖菌素的生产产量和生产率。
这一实例的章节B进一步说明了本公开的HTP菌株改良程序的突变合并步骤。所述实例因此提供本公开的HTP菌株改良方法的第一、第二和第三轮合并的实验结果。
第二和第三轮合并中的突变源于单独的基因文库交换。这些结果因此也说明了HTP菌株程序执行多分支并行追踪的能力,并且有益突变的“存储器”可以嵌入与本公开的基因设计文库的各种形式相关的元数据中。
如上文所述,对所提供的基本参考菌株(菌株A)和第二种“经工程改造”的菌株(菌株C)的基因组进行测序,并且鉴别出所有基因差异。基本菌株是尚未经历诱变的刺糖多孢菌变异体。经工程改造的菌株也是刺糖多孢菌菌株,其已由基本菌株在数轮传统突变改良程序之后产生。
A.HTP工程和高通量筛选
根据本公开的克隆和转化方法,所鉴别的SNP中的每一种将个别地添加回到基本菌株中。将针对在为了评估产物效价性能而设计的小规模培养中的刺糖菌素产量来测试新产生的包含单一SNP的每种菌株。将使用工业规模培养用的培养基进行小规模培养。将利用标准比色分析,在碳耗竭的情况下对产物效价进行光学测量(即,代表单一分批产量)。将允许反应进行到终点并使用帝肯M1000板光谱仪测量光学密度。
B.第二轮HTP工程和高通量筛选-将SNP交换文库与所选PRO交换命中合并
本公开HTP方法的优点之一是其能够将HTP基因设计文库连同与每种SNP/启动子/终止子/转座子诱变/抗代谢物/起始密码子对宿主细胞表型的影响相关的信息一起存储。本发明人此前已进行过启动子交换实验,所述实验已鉴别出刺糖多孢菌中的若干启动子交换(参见例如实例4)。
本发明人将这一实例的基本菌株A修饰成还包括此前鉴别的基因多样性之一,如以下中的基因多样性:(1)启动子交换(PRO交换)文库、(2)SNP交换文库、(3)起始/终止密码子交换文库、(4)STOP交换文库、(5)序列优化文库、(6)转座子诱变多样性文库、(7)核糖体结合位点(RBS)多样性文库和(8)抗代谢物选择/发酵产物抗性文库。将初始筛选中所鉴别的最佳基因多样性再引入到这种新基本菌株中以产生新的基因多样性微生物文库。如同前一步骤,针对刺糖菌素产量来测试新产生的包含一种或多种基因多样性的每种菌株。还将通过测量刺糖菌素产量来测试所选候选菌株的生产率指标。
此第二轮SNP交换的结果将鉴别SNP,在包含启动子交换突变的基本菌株中,所述SNP能够提高基本菌株的刺糖菌素产量和生产率。
C.槽培养物验证
上述HTP步骤期间所鉴别的含有最佳SNP的菌株将在中等尺寸的测试发酵槽中培养。简单来说,将使每种菌株的少量培养物生长,并用于与将等量接种物在测试发酵槽中接种大培养物。接种物经归一化而含有相同的细胞密度。
将使所得槽培养物进行确定时间,随后收获。将利用在发酵期间的不同时点从槽中所取的样品中的底物和产物效价来计算产量和生产率测量值。将使用适当标准,通过高压液相色谱来分析样品中的特定小分子浓度。
实例4:HTP基因组工程-建构启动子交换文库以改良工业微生物菌株
前述实例已经证明了本公开的HTP菌株改良程序修复工业菌株的能力。实例2和3描述了SNP交换技术和文库的建构,从而探究各种基本、中间和工业菌株内的现有基因多样性。
这一实例说明了使用本公开的PRO交换技术进行HTP菌株改良程序的实施例。不同于实例3,这一实例教示了通过PRO交换文库产生法从头合成产生突变的方法。
A.鉴别用于启动子交换的目标
正如前述,启动子交换是多步骤方法,其包含选择一组“n”个基因作为目标的步骤。
本文所述的用于基因组工程改造的方法实现靶向基因组中的任何位置以供启动子交换。在这一实例中,本发明人已鉴别出经由本公开的启动子梯方法调节的基因,包括下文列举的核心生物合成路径基因。参见参见,图12A到图12D)。另外,与前体池、辅因子可用性、竞争次级代谢物、聚酮伴侣蛋白、针对次级代谢物生产的关键转录调控因子和西格玛因子、底物和产物转运蛋白相关的基因以及与产物形成具有未知关系的基因(路径外基因)是用于启动子交换以实现菌株改良的所有候选者。
表7.-刺糖多孢菌中参与刺糖菌素生产的可能基因
刺糖菌素合成路径基因 基因信息(序列、功能等)
spnA 聚酮合成酶加载和延伸模块1spnA
spnB 聚酮合成酶延伸模块2spnB
spnC 聚酮合成酶延伸模块3-4spnC
spnD 聚酮合成酶延伸模块5-7spnD
spnE 聚酮合成酶延伸模块8-10spnE
spnF 甲基转移酶样蛋白spnF
spnG 推定NDP-鼠李糖基转移酶spnG
spnH 推定O-甲基转移酶spnH
spnI 推定O-甲基转移酶spnI
spnJ 推定氧化还原酶spnJ
spnK 推定O-甲基转移酶spnK
spnL 甲基转移酶样蛋白spnL
spnM SpnM
spnN 推定NDP-己糖-3-酮还原酶spnN
spnO 推定NDP-己糖-23-脱水酶spnO
spnP 推定NDP-福洛氨基转移酶spnP
spnQ 推定NDP-己糖-34-脱水酶spnQ
spnR 推定转氨酶spnR
spnS 推定N-二甲基转移酶spnS
kre dTDP-4-脱氢鼠李糖还原酶kre
gdh dTDP-葡萄糖46-脱水酶gdh
epi dTDP-4-脱氢鼠李糖35-表异构酶epi
gtt 葡萄糖-1-磷酸胸苷酰转移酶1gtt
MetK S-腺苷甲硫氨酸合成酶MetK
PFK 焦磷酸--果糖6-磷酸1-磷酸转移酶PFK
rsmG 核糖体RNA小亚基甲基转移酶G rsmG
rpsL 30S核糖体蛋白S12 rpsL
gk 葡糖激酶
asb1 邻氨基苯甲酸合成酶组分1asb1
pntA NAD(P)转氢酶亚基α部分1pntA
pntB NAD(P)转氢酶亚基αpntB
mmsd 甲基丙二酸-半醛脱氢酶(酰化)
Acat 乙酰基-CoA乙酰基转移酶
glcP 葡萄呱喃糖
sucA 酮戊二酸脱氢酶E1组分
B.启动子梯的产生
实施启动子交换方法中的另一步骤是选择一组“x”个启动子充当“梯”。理想的是,这些启动子已经显示可引起跨越多个基因组基因座的高度可变化表达,但唯一的要求是其以某种方式扰动基因表达。
在特定实施例中,这些启动子梯如下创建:鉴别与所关注的靶基因相关的天然、原生或野生型启动子且接着使所述启动子发生突变以衍生出多种突变的启动子序列。测试这些突变启动子中的每一种对靶基因表达的影响。在一些实施例中,测试所编辑的启动子跨越多种条件的表达活性,以便记录/表征/注释每个启动子变异体的活性并存储于数据库中。随后将所得经编辑的启动子变异体组织成基于其表达强度而排列的“梯”(例如高表达性变异体靠近顶部,并且减弱的表达靠近底部,因此产生术语“梯”)。
在本公开的示例性实施例中,本发明人将针对刺糖菌素合成路径中的靶基因中的每一种创建启动子梯:ORF组合。
更广泛地说,基因工程改造尝试和代谢工程改造的主要目标在于改变宿主代谢、优化生物合成路径并引入或复制路径基因以便改良所需产物的产量。成效依赖于扰动和平衡所引入的生物合成基因簇或过表达非原生基因或基因拷贝内部(路径中)和外部(路径外)的基因表达的能力。本发明是允许扰动并调节刺糖多孢菌中的基因表达的基因工具。
工程改造改良表型通常需要多轮工程改造。这一梯的遗传多样性避开与使用重复DNA序列(例如脱靶重组的同源区)相关和针对转录衰减影响的工程改造挑战。因为这一梯中的序列的序列和来源多样性本发明避开了这些挑战。
其它更多的常见宿主(模型生物体;例如参见西格尔(Siegl)等人(2013,“用于微调放线菌中的基因表达的合成启动子文库的设计、构造和表征(Design,construction andcharacterization of a synthetic promoter library for fine-tuned geneexpression in actinomycetes.)”代谢工程(Metab Eng.)19:98-106)和塞盖兹(Seghezzi)等人(2011,“显示强链霉菌启动子的一些特定特征的合成启动子文库的构造(The construction of a library of synthetic promoters revealed some specificfeatures of strong Streptomyces promoters.)”应用微生物学与生物技术(ApplMicrobiol Biotechnol.)90(2):615-23.)也存在启动子梯,但刺糖多孢菌是很大程度上难以处理的宿主,并且对于这一生物体尚开发出极少基因工具。本发明呈现在刺糖多孢菌中开发并量化表征的第一启动子梯。另外,预计本文中所述的启动子将在邻近宿主中显示可预测动力学。
用于鉴别和选择推定原生启动子序列的方法利用可获得的数据。刺糖多孢菌的经组装和注释的参考基因组用于鉴别基因的经预测编码序列上游的基因间区域。RNASeq数据(在发酵期间取样并比较在两种菌株中的表达的重复时间序列)用于鉴别表达较强的基因和具有不同时间表达谱的基因。随后针对启动子-荧光蛋白表达盒构造而选择感兴趣的基因(GOI)上游的序列。通过量化和比较在发酵相关种子培养物条件和生产培养条件下生长的启动子梯菌株中的相对GFP荧光来间接评定启动子强度。可能的适用启动子列于下表8中。第一轮启动子评估产生启动子强度梯(图15)。通过后续评估,能够鉴别出另外的功能性启动子,包括比最初鉴别的启动子明显要强的一些启动子(图16)。
表8.启动子梯汇总:序列名称、来源、特征和测试状态
Figure BDA0002371045810001441
Figure BDA0002371045810001451
通过使用安置在启动子序列下游的荧光报告蛋白来表征文库中的启动子的表达强度。启动子-报告子序列整合于两种不同实验菌株的基因组中的中性整合位点中,并在不同生长方案下测量荧光,得到启动子强度的量化度量标准。这一启动子文库使得可调节刺糖多孢菌和相关宿主中的基因表达(增加、降低或改变时间动力学)并调节工程改造改良表型。本发明对于这一宿主的基因工程改造具有若干应用:1)供与PROSWP一起使用(齐默尔根技术);2)过表达原生基因的异源或重复拷贝;3)平衡表达生物合成或相关基因的多基因整合。工程改造选择启动子-基因对引起改良某些菌株中的刺糖菌素产量(图17)。
因此,本发明人至少提供以下启动子形成启动子文库:
(1)从刺糖多孢菌基因组新鉴别的原生启动子序列;
(2)供用于相关宿主生物体中的所述合成启动子序列(西格尔等人和塞盖兹等人);
(3)各个启动子序列的诱变文库;和
(4)由启动子的组合性再排列组成的混合启动子序列(在建)。
这些启动子显示一系列表达强度同时由显著核苷酸多样性组成(参见图15和图16)。这一启动子文库提供调节下游基因表达的一组DNA序列,所述基因可用于刺糖多孢菌和相关宿主中。本文所述的文库展现表达强度“梯”,例如其跨越约50到100倍动态范围(参见图15和图16),并另外显示一定范围的核苷酸多样性。总之,这一启动子文库可组合使用以精确调节用于各轮迭代工程改造的宿主基因组,进而改良任何可测量的表型。每个启动子类型、强度和独特序列为解决代谢工程改造中通常面对的未知和挑战提供机会。所述变化包括(但不限于):(1)不能准确预测启动子将如何在每个独特情形下起作用(其将如何影响指定基因的表达);(2)对于指定基因将最佳的表达水平;(3)不能预测时间动力学或调节扰动成功如何;和(4)将产生平衡或优化生物合成路径的表达水平。本文所述的启动子可与特定基因目标相互作用以赋予菌株基因型,进而改良刺糖多孢菌中的化学物质,如刺糖菌素的产量。
C.使来自所述梯的启动子与靶基因关联
实施启动子交换方法中的另一步骤是对各种菌株进行HTP工程改造,所述菌株包含来自启动子梯的与特定靶基因关联的指定启动子。
如果原生启动子存在于靶基因n的前方且其序列已知,那么可以用梯中的x个启动子中的每一个置换原生启动子。当原生启动子不存在或其序列未知时,那么可以将梯中的x个启动子中的每一个插入基因n的前方。以此方式构建菌株文库,其中文库中的每个成员在原本相同的基因背景下是可操作地连接到n目标的x启动子的例子(参见例如图13)。
D.对菌株进行HTP筛选
启动子交换方法中的最后步骤是对前述文库中的菌株进行HTP筛选。所衍生菌株中的每一种代表了在原本相同基因背景下的连接到n目标的x启动子的例子。
在根据一种或多种度量标准表征菌株性能的情况下,本发明人通过对每种菌株实施HTP筛选而能够根据所指定的度量标准确定什么样的启动子/靶基因关系最有益(例如优化所关注分子的产量)。参见图13。
在图17中所示出的示例性实施例中,本发明人已利用启动子交换方法来优化刺糖菌素的产量。上述Pro交换方法的应用描述于下文实例5中。
实例5:HTP基因组工程-建构PRO交换文库以改良菌株生产刺糖菌素的性能.
下述章节提供了本公开的PRO交换HTP设计菌株改良程序工具的说明性实施方案,如实例4中所述。在这个实例中,对刺糖多孢菌菌株执行本公开的PRO交换方法以便增加宿主细胞的刺糖菌素产量。
A.启动子交换
如实例4中所述执行启动子交换。使用所列启动子梯针对启动子交换靶向假设在刺糖菌素产量方面起一定作用的整个基因组中的基因(例如图13)。用于启动子交换的所述基因包括(但不限于):(1)所关注化合物(如刺糖菌素)的核心生物合成路径中的基因;(2)涉及所关注化合物的前体池可用性的基因,如直接参与池可获得性的前体合成或调节的基因;(3)涉及辅因子利用的基因;(4)转录调控因子编码的基因;(5)编码营养物可用性的转运子的基因;和(6)产物输出子等。
B.HTP工程和高通量筛选
如实例1和3中所述进行启动子交换的HTP工程改造。如实例3中所述进行所得启动子交换菌株的HTP筛选。针对启动子交换靶向不同功能性维度(范围为核生物合成簇到路径外)中的多种基因,并且显示与亲代菌株相比的改良菌株性能的数据呈现在图17中。
类似地,将对图13的左图上所述的从刺糖菌素生物合成路径选择的基因和整个基因组中的基因进行启动子交换以鉴别新的改良菌株,其将靶向用于使用上表8中所述的启动子进行启动子交换。
可视化时,启动子交换文库筛选结果用于鉴别与所度量的性能度量标准最紧密相关的基因目标。
所选菌株将在小板中再培养并如上文所述测试刺糖菌素产量。
实例6:上位定位-用于预测有益突变合并的算法工具
这一实例描述了预测建模技术的一个实施例,其用作本公开的HTP菌株改良程序的一部分。首先鉴别出潜在有益突变(通过使用如上文所述的基因设计文库)之后,本公开教示了在第二轮、第三轮、第四轮和随后另外多轮HTP菌株改良中合并有益突变的方法。在一些实施例中,本公开教示了突变合并可以基于所述突变中的每一种的个别性能。在其它实施例中,本公开教示了预测两个或更多个突变的可能性的方法,所述突变如果合并到单一宿主细胞中将展现叠加或协同效应。下述实例说明了本公开的预测工具的一个实施例。
将对选自实例3和5的SNP交换和启动子交换(PRO交换)文库的突变进行分析以鉴别将最可能引起菌株宿主性能改良的SNP/PRO交换组合。
如本公开的“上位定位”章节中所述,将使用余弦相似度矩阵对SNP交换文库序列进行互相比较。分析结果将产生每种SNP/PRO交换组合的功能相似度评分。所有SNP/PRO交换间的功能相似度的视觉表示描绘于图53的热图中。所得功能相似度评分还将用于呈现描绘每一种SNP/PRO交换之间的相似度距离的树状图(类似于图54A中的实例)。
相同或相似功能组的突变(即,功能相似度高的SNP/PRO交换)更可能通过相同机制来运作,并因此在组合时更可能对总体宿主性能展现负或中性上位效应。相比之下,来自不同功能组的突变更可能通过独立机理来运作,并且从而更可能对宿主性能产生有益的叠加或组合效应。
为了说明生物学途径对上位的影响,展现各种功能相似度的SNP和PRO交换将进行组合并针对宿主菌株进行测试。三种SNP/PRO交换组合将如实例1中所述工程改造到刺糖多孢菌的基因组中。
含有SNP/PRO交换组合的每一种宿主细胞的性能如实例3中所述加以测试,并将与对照宿主细胞的性能进行比较。
因此,所述上位性映射程序适用于预测/规划/告知有效和/或积极的所设计基因变化的合并。得自上位性映射程序的分析见解能够产生可以指导后续多轮微生物菌株开发的预测规则集。得自上位性文库的预测见解可以跨越微生物类型和靶分子类型使用。
实例7:HTP基因组工程改造-Pro交换突变合并和多因子组合性测试
前述实例已经说明了将少量的预选PRO交换突变与SNP交换文库合并的方法(实例3)。其它实例已经说明了用于选择最可能产生加性或协同的有益宿主细胞特性的突变合并的上位性方法(实例6)。这个实例说明了本公开HTP方法有效地探究巨大解空间的能力,所述解空间由多个基因/基因设计文库组合的组合性合并(例如PRO交换文库×SNP文库或PRO交换文库内的组合)所产生。
在本公开的HTP菌株改良方法的这个说明性应用中,实例5中的鉴别为对宿主性能具有正效应的启动子交换将与原始PRO交换文库以二阶组合方式合并。合并PRO交换突变的决定是基于每种突变对产量或生产率的总体影响,以及两种突变的组合会产生加性或协同效应的可能性。
A.PRO交换菌株工程改造中的合并轮
菌株将如前述实例1中所述进行转化。简单来说,已含有一个所需PRO交换突变的菌株将再次用第二个所需PRO交换突变转化。
用于探究单一和双重合并突变的解空间的HTP方法还能够应用于第三轮、第四轮和后续突变合并。
实例8:HTP基因组工程-建构终止子文库以改良工业宿主菌株
本实例将本公开的HTP方法应用于其它HTP基因设计文库,包括STOP交换。所述实例进一步说明了本公开能够将来自基本基因设计文库(例如PRO交换、SNP交换、STOP交换等)的元件组合以创建更复杂的基因设计文库(例如PRO-STOP交换文库,其并有启动子和终止子)。在一些实施例中,本公开教示了任何和所有可能的基因设计文库,包括源于此前公开的任何基因设计文库的组合的那些文库。
在这个实例中,将进行小规模实验以证明本发明的STOP交换方法对基因表达的影响。本公开的终止子将与如下文所述的两种原生刺糖多孢菌启动子之一成对,并将分析其影响萤光蛋白表达的能力。
组合性基因工程改造和代谢路径重构方法依赖于DNA元件(例如,启动子、核糖体结合位点、转录终止子)的文库,其可以组合采用或插入到精确位置处的宿主基因组中以便扰动基因表达并影响目标分子的产量或改变所需宿主表型。这些文库的改良理解和量化评定/表征是合乎需要的,因为其为改良基因变化的可预测性提供机会。在常见DNA文库类型中,转录终止子可以说是最不被人理解的。终止子在以下中起作用:(1)完成转录,但其还(2)影响mRNA半衰期(柯伦(Curran)等人,2015,“用于酵母中的改良异源基因表达的短合成终止子(Short Synthetic Terminators for Improved Heterologous Gene Expressionin Yeast.)”ACS合成生物学(ACS Synth.Biol.)4(7):824-832),并转而影响蛋白质表达。因此,终止子应被视为任何合成生物学工具包的重要组分。终止子文库或梯的创建需要基于两种准则评定和量化终止子性能的机制:(1)终止转录的能力;(2)影响mRNA半衰期和上游基因表达的能力。本公开提供稳健的,并且首先在刺糖多孢菌中进行这一操作的工具。
相似解决方案存在并已用于生物体生物体中(陈等人,2013,“582种天然和合成终止子的表征和其设计约束条件的量化(Characterization of 582natural and syntheticterminators and quantification of their design constraints.)”自然-方法(Nat.Methods)10,659-664;和尚布雷(Cambray)等人,2013,“内部转录终止子的测量和建模(Measurement and modeling of intrinsic transcription terminators.)”核酸研究41(9):5139-5148),但本公开在刺糖多孢菌中提供第一(1)用于评定终止子功能性的系统和分析;(2)已开发和表征的转录终止子文库。
为了鉴别推定终止子,来自刺糖多孢菌和红色糖多孢菌的基因组序列进入线上工具以预测核酸序列中的非rho依赖性终止子。选择经线上工具预测的出现在注释良好的基因下游(基因间区域中)的十二个终止序列(四个原生和八个异源序列,参见下表9)进行分析。
表9.所测试的推定终止子的序列、来源和尺寸.
Figure BDA0002371045810001501
为了测试这些推定终止子,利用双重报告子设计和分析。测试中所用的双重报告子设计和分析(其进一步描述于实例10中)实现快速评定推定转录终止序列的功能性和相对强度。所述分析使用具有不同光谱标签的两种荧光报告蛋白(dasherGFP和paprikaRFP;来自DNA2.0的IP-free序列)(图31A-D)以评定推定转录终止子的性能。所述系统使得用户可评定推定终止子的以下能力:1)终止转录和2)影响上游基因的表达。双重荧光报告子测试盒实现定量评定强度,和刺糖多孢菌的基因工程改造所需的推定终止序列的机制,通过所述机制会评估出对mRNA稳定性的影响。
通过利用ermE*启动子所驱动的两种荧光蛋白的双顺反子表达的设计实现量化评定这些性能标准(比伯(Bibb)等人,1985,“红霉素链霉菌的红霉素抗性基因(ermE)的启动子区的克隆和分析(Cloning and analysis of the promoter region of theerythromycin resistance gene(ermE)of Streptomyces erythraeus.)”基因38(1-3):215-226)。在两种报告子(GFP的下游和RBS和RFP的上游)之间克隆每个推定终止序列。在使用阳性对照(在报告子之间不含终止序列(NoT)的相同多顺反子盒;参见图33)的GFP和RFP荧光归一化之后,相对于上游报告子(GFP)的表达(荧光)测定下游报告子(RFP)的表达(荧光)。这一系统提供用于量化评定终止子文库的稳健机制,并对于鉴别和表征供用于刺糖多孢菌的基因工程改造中的推定终止序列的性能具有实用性。所述系统的优点在于应用具有不同荧光光谱的两种荧光报告子(图31A-D)。报告子允许在大动态范围(~50×)内量化荧光(每个报告子的蛋白质表达),而不受另一报告子的光谱干扰,并且因此不需要复杂信号校正(重叠荧光信号的解缠)。每个报告子的表达可以独立地进行测量。随后这些值允许通过比较相对于另一报告子的荧光(RFU)和由不含终止子的对照菌株产生的荧光来评定促成每个报告子表达的基因元件的性能。通过保持所有其它元件恒定,同时在两个报告子之间交换推定终止序列,能够间接评估出:(1)当存在不同终止子时,终止子对mRNA稳定性的影响(通过比较上游报告子(GFP)的相对荧光);(2)终止子终止转录的能力(通过在经不含终止子的对照菌株的荧光归一化之后,比较下游报告子(RFP)的相对荧光与上游报告子(GFP)的相对荧光)。这一系统使得可鉴别(1)功能性终止子和(2)影响或具有促进mRNA稳定性的特征的能力有所不同的终止子。
将候选终止子的核酸序列克隆于测试盒中并在已知中性整合位点处整合于刺糖多孢菌基因组中。使所得菌株在液体培养物(种子培养基)中生长48小时,用PBS洗涤并使用板读取器测量荧光(GFP和RFP)。将荧光归一化呈OD540下的吸光度。
基于所述分析,刺糖多孢菌中的具有一定范围的功能性或强度(停止下游基因转录或减弱上游基因转录的能力)的十一个转录终止序列(四个原生和七个异源序列(均来自红色糖多孢菌))的文库。这些序列长度在35到49个核苷酸范围内,并可容易并入工程改造设计(表3;表8;图32和图33)。结果是强度和对mRNA稳定性的影响不同的终止子的多样文库,其为工程提供较大和更多样的解空间和扰动和操控靶基因表达的机会(图34)。
本公开的转录终止序列的文库提供基因工程改造刺糖多孢菌所需的工具。转录终止序列具有若干工程改造应用:(1)作为启动子或基因整合的隔离子,以防止发生上游调节的非预期后果;(2)作为用于基因插入的转录终止子;和(3)用于通过其对mRNA稳定性的影响或通过在基因的编码序列的上游,在启动子和转译起始位点之间插入来调节表达和平衡路径。这一后一应用能够敲落或有效地防止下游基因表达。
为了评估这一终止子文库用于敲落或消除基因表达的应用,通过在两种不同启动子中之一(SEQ ID No.25和33)和荧光报告子(SEQ ID No.81)之间插入个别终止子(终止子文库的子集:SEQ ID No.70、72、74、79和80)(图65)。这些测试盒随后整合于菌株A中,并且所得菌株的GFP表达用于评估终止子插入对减弱GFP表达的影响(图66A-B)。图66A显示具有插入在强启动子(SEQ ID No.25)和GFP之间的T1、T3、T5、T11和T12(SEQ ID No.70、72、74、79和80)的菌株的表达。“无”(左列)指示无终止子对照菌株。图66B具有插入在中强启动子(SEQ ID No.33)和GFP之间的T1、T3、T5和T12(SEQ ID No.70、72、74和80)的菌株的表达。“无”(左列)指示无终止子对照菌株。标准差由水平短划线指示,通常在菱形上方和下方被观察到。所述图式的右侧处的圆形指示基于所有对的图凯-克莱默HSD测试的各组之间的显著性差异(不重叠/相交圆形指示彼此显著不同的各组)。
证明这一工程改造方法实用性的数据显示在图62中。终止子插入多种靶基因的上游以修饰基因表达,并且在针对聚酮生产率的板分析中与亲代菌株比较测试这些经工程改造的菌株。与亲代菌株相比,若干“终止子插入”菌株展现出改良。在一些实施例中,终止子插入(序列、终止子-基因组合或菌株)的集合称作“终止子插入微生物文库”。
实例9:快速合并基因变化并用于在糖多孢菌中产生基因多样性
这一实例说明快速合并基因变化并用于在刺糖多孢菌中产生基因多样性的方法。刺糖多孢菌菌株的工程改造是一个超长过程,其很大程度上归因于生物体缓慢生长和缺乏基因工具。这一问题在生产菌株中进一步加剧,其更可能具有降低的生长速率和降低的稳健性。例如,在本发明之前用于工程改造刺糖多孢菌的方法是通过接合引入外来DNA(松岛(Matsushima)等人,1994.基因,146 39-45)。所述过程是基于递送于宿主DNA中的质粒的单交叉。引入外来DNA和选择所关注菌株的过程会耗时14-21天。如果所述工程改造必须为“无痕”的,那么用于递送突变的质粒元件(例如,质粒骨架)必须在初始整合之后去除,仅留下“有效载荷”。所述“有效载荷”是所需突变,其可为单核苷酸多态性(SNP)、基因启动子变化、核糖体结合位点变化、基因终止子变化、多基因盒、尺寸为约1-10000bp的任何基因元件或任何尺寸缺失。递送质粒的元件的去除为工程改造过程再增加~20天。在一些情况下,不需要立即去除递送质粒的元件,中性位点处的全基因整合就是这种情况。在那些情况下,质粒和经质粒编码的可选(kanR)和可反向选择(sacB)标记保留在宿主染色体中,并且突变视为“标记”的。组合所述突变的传统方法是经由整合和反向选择在基本菌株中产生第一突变(~45天),由此产生突变型菌株(例如Mut1),并随后使用Mut1菌株作为受体,并再次经历45天工程改造过程用下一突变继续重复所述过程,由此产生具有两种突变的新菌株(例如Mut2)。为了添加第3突变,将再耗时最少45天等。
本公开教示了用于经由快速合并基因变化来加快宿主细胞的菌株改良程序的新方法。为了减少工程改造时间,本发明人设计(基于现有方法改良)用于快速合并经合理工程改造的突变的方法。所述新方法是基于所选菌株,如先前经工程改造的菌株,和/或具有“良好”突变的菌株的原生质体融合。
A.通用方法
用于合并突变的例示性程序示于图30中。作为起点,产生并选择具有含有所关注突变的基因组的亲代菌株。
在一些实施例中,期望具有经标记的那些突变中之一。产生并测试菌株后,可以使用本文概述的过程快速合并最佳突变。简单来说,由所关注菌株形成原生质体并随后以不同比率混合在一起,伴随与未标记菌株相比,在低得多的浓度下使用的“标记”菌株。融合之后,将所得菌株回收于针对所述过程经改良的培养基上,并对“标记”菌株施加选择,由此杀灭未接受“标记”突变的任何细胞。HTP菌株QC可快速确定其它混合突变中有哪些存在于由此选择的菌株中。期望大多数菌株含有其它突变中的至少一种,并且在一些情况下,多于一种。
这一过程通常会耗时7-10天以产生菌株,并且单一合并反应可产生若干不同基因型,其取决于混合菌株数目。例如,菌株M1、S1、S2和P1的四路融合可产生4种罕见的单一突变体和10种不同组合:M1 S1;M1 S2;M1 P1;S1 S2;S1 P1;S2 P1;M1 S1 S2;M1 S2 P1;S1S2 P1;M1 S1 S2 P1。此外,如果施加M1中的标记突变的选择,那么S1 S2;S1 P1;S2P1;S1S2 P1类型将消失。
例如,本文所述的方法可含有以下步骤:
(1)从经工程改造的菌株池中选择亲代菌株,随后所选菌株将合并。在一些实施例中,染色中的至少一种具有“标记”突变。亲代中所用的所关注菌株极大地增加了在后续步骤中产生适用菌株的几率
(2)由待合并菌株制备原生质体(例如,去除细胞壁等)。细胞需要生长于经渗透稳定的培养基和缓冲液中,所述培养基和缓冲液不同于现有技术。
(3)融合所关注菌株。在一些实施例中,为了增加产生适用(新颖)突变体组合的胜率,可使用较少的具有“标记”突变的染色的细胞,由此增加这些“标记”细胞将与携带不同突变的细胞相互作用并融合的几率。这是将细胞融合在一起并发生合并的步骤。这一步骤期间所用的菌株的确切分率将影响获得某些组合的可能性。
(4)回收细胞。在一些实施例中,将细胞涂铺于经渗透稳定的培养基上,而不使用琼脂覆层,其简化程序并使得自动化更容易。渗透稳定剂使得允许可能含有反向选择标记基因(例如,sacB基因)的细胞生长。原生质体化细胞对处理极为敏感并容易被杀伤。这个步骤确保足够细胞被回收。这个步骤运作地越好,就有越多的物质可用于下游分析。
(5)选择携带“标记”突变的细胞。这通过将合适抗生素上覆于生长细胞上来完成。在亲代细胞均不携带“标记”突变的情况下,可通过其它手段对菌株进行基因分型以鉴别所关注菌株。这个步骤可以是任选的,但其确保富集最可能已经历细胞融合的细胞。可“标记”多个基因座,并且这样以来,可较快产生所关注组合,但如果希望具有“无痕”菌株,随后可能需要去除多个质粒。
(6)针对其它亲代菌株出现的突变的存在对生长细胞进行基因分型。这一步骤查找待合并的其它突变的存在。待基因分型的菌落数将取决于交叉复杂性以及选择方案。
(7)(任选的)去除“标记”形成突变质粒。这是任选的并建议用于另外校验或客户端递送。在一些实施例中,在菌株的工程改造循环结束时,需要去除所有质粒残余物。进行其的时间和频率由用户判断。在一些实施例中,可反向选择的sacB基因的存在使这个步骤较为简单。
可以针对所需的所关注表型测试生成菌株。基因组上在基因上极为接近的突变将较难合并。应谨慎知晓选择何种突变合并以增加成功合并的几率。此外,如本文所述的步骤2、3和4对于成功是必不可少的,并且如果省略或未被恰当执行,方案结果将。
在一些实施例中,所述突变均被“标记”。例如,不存在基因连接到突变的标记。当合并其中每种菌株含有独特未标记突变的总共N(N≥3)种不同菌株时,本公开方法经由递归混洗事件和用于在不同基因组之间重组的最大化机会提供缩短的循环时间。在这种情况下,所述方法包含以下步骤:(1)从经工程改造的菌株池中选择亲代菌株,随后所选菌株将合并;(2)由待合并菌株制备原生质体(例如,去除细胞壁等);(3)融合所关注菌株。在这一步骤中,细胞融合在一起并发生合并;(4)回收细胞;(5)选择携带所关注突变中的至少一种的细胞。这可以通过基因分型或通过任何其它合适的手段进行以鉴别所关注突变;(6)选择携带其它亲代菌株出现的另外一种或多种所关注突变的细胞。
产生原生质体的方法包括(但不限于)基瑟(Kieser)等人(实用链霉菌遗传学,约翰英纳斯中心(John Innes Center),ISBN0708406238)中所述的方法。
B.结果
在一项实验中,有一种标记菌株和三种未标记菌株,每种均在距标记基因座不同距离处携带SNP突变。将在抗生素存在下选择融合原生质体,所述抗生素杀伤所有未标记菌株。随后将对每个SNP的基因座进行测序以验证基因交换。在不希望受任何特定理论束缚的情况下,如果基因座得到良好分离,那么交换可更频繁。
在用于产生源自不同菌株的融合原生质体的另一实验中,将1%标记菌株和99%未标记菌株混合并加以选择。相对刺糖菌素产量将在具有合并突变的所选菌株中测试,并与亲代菌株(标记和未标记亲代菌株)比较。结果将表明生成多样性:一些菌株将比亲代菌株表现得好,而一些菌株将表现得较差或表现相同。
在第三实例中,将观察到并显示由混洗产生的表型多样性。仅来自“标记”亲代的携带标记的细胞将在这一培养基上生长。菌落形态(浑浊不透明色,和产孢(白色)细胞)和菌落尺寸(大和小)的所观察到的差异指示混洗事件。所述细胞含有反向选择标记,如sacB标记,将回收于R2YE索布曼(Sorb/Man)培养基上。
实例10:报告蛋白和供用于刺糖多孢菌中的相关分析
刺糖多孢菌是很大程度上难以处理的宿主,支持开发针对这一生物体的工程改造工具和工程改造尝试所需的分子生物学工具极少。报告蛋白代表这一生物体所缺少的关键工具。
更广泛地说,本发明人的基因工程改造尝试和代谢工程改造的主要目标在于改变宿主代谢、优化生物合成路径并引入或复制路径基因以便改良所需产物的产量。成效依赖于扰动和平衡所引入的生物合成基因簇或过表达非原生基因或基因拷贝内部(路径中)和外部(路径外)的基因表达的能力。这些尝试需要开发和表征可以用于工程改造设计中的文库基因(DNA)元件(例如,启动子、核糖体结合位点、转录终止子)。报告蛋白和评估其表达的分析对于表征这些文库是必不可少的。
在这一实例中,本公开提供在刺糖多孢菌中论证和量化评估三个报告基因。本文中所述的三个报告基因包括两种荧光报告蛋白(Dasher GFP和Paprika RFP;ATUM,https://www.atum.bio/products/protein-paintbox?exp=2)和酶β-葡糖醛酸酶(gusA)(杰佛森等人(1986).“作为基因融合标记的得自大肠杆菌的β-葡糖醛酸酶”.美国国家科学院院刊83(22):8447-51.)。本发明首次呈现出这些标记物已成功地用作刺糖多孢菌中的分子工具。本公开还描述了使得可量化评估刺糖多孢菌中的GusA表达的比色分析的优化和应用。
编码DasherGFP(ATUM)和PaprikaRFP(ATUM)的核苷酸序列针对大肠杆菌经密码子优化(SEQ ID No.81和SEQ ID No.82)。编码β-葡糖醛酸酶(gusA)的核苷酸序列针对刺糖多孢菌经密码子优化(SEQ ID No.83)。
为了测试报告基因,将ermE*启动子(SEQ ID No.149)克隆在报告子编码序列的前方,并将所得构建体整合于刺糖多孢菌基因组中的已知中性位点中。使菌株在液体培养物(生长培养基)中生长48小时。用PBS洗涤培养物的等分试样,随后(1)在96孔板中使用帝肯Infinite M1000 Pro(生命科学)板读取器对复制培养物的等分试样进行荧光测量;(2)根据针对乳酸杆菌属的修改版OpenWetWare方案(http://www.openwetware.org/wiki/Beta-glucuronidase_protocols),在4-硝基苯基β-D-葡萄糖苷酸存在下在37℃下培育之后,无细胞萃取物的吸光度(OD405)。
在经工程改造而含有所述报告子的刺糖多孢菌菌株中测量报告子DasherGFP和PaprikaRFP的荧光。结果显示,两个报告子均在刺糖多孢菌中起作用,并且其具有不同荧光标签(参见图31A-D)。这是未预期的,因为尽管编码报告子DasherGFP和PaprikaRFP的核苷酸序列针对大肠杆菌得到优化,但其在刺糖多孢菌中引起蛋白质表达。如果选择不同报告基因,那么可能不会是这种情况。此外,所选荧光蛋白具有未与刺糖多孢菌中所观察到的内源荧光光谱重叠的光谱(图36)。
使用所开发的供用于乳酸杆菌属中的比色4-硝基苯基β-D-葡萄糖苷酸分析测量刺糖多孢菌中的优化β-葡糖醛酸酶(gusA)的GusA活性(杰佛森等人(1986).“作为基因融合标记的得自大肠杆菌的β-葡糖醛酸酶”.美国国家科学院院刊83(22):8447-51.)。结果表明,所开发的供用于乳酸杆菌属中的4-硝基苯基β-D-葡萄糖苷酸分析(包括细胞溶解和酶反应)也在刺糖多孢菌中起作用(图35)。
GusA分析方案简单来说描述如下:
1.进行生长培养直到OD600在0.6于1.0之间为止
2.通过添加以下制备10mL GUS缓冲液(测量10个样品):
●5mL磷酸钠缓冲液(pH=7)
●3mL H2O
●1mL氯化钾溶液
●1mL硫酸镁溶液
●35μL β-巯基乙醇
●20mg溶菌酶
3.通过离心集结1.5ml培养物持续1分钟。
4.再悬浮于1ml 100mM磷酸钠缓冲液,其含有:
●0.1M氯化钾溶液
●10mM硫酸镁溶液
●1M Na2CO3
●4-硝基苯基β-D-葡萄糖苷酸(4-NPG)储备溶液(10mg/mL于50mM磷酸钠缓冲液(pH=7)中),仅制1mL储备溶液!!!
●β-巯基乙醇
●10%曲拉通X-100(Triton X-100)(于水中)
5.通过离心再次集结。
6.再悬浮于750μL GUS缓冲液中。
7.简单涡旋以混合。
8.在37℃水浴中培育30min。
9.添加8μl 10%曲拉通-X。
10.简单涡旋并在冰上培育5min。
11.添加80μl 4-NPG溶液并开启定时器。
12.在37℃水浴中培育。
13.当颜色呈明显黄色(在10与30min之间)时,通过添加300μL 1M Na2CO3终止反应
14.记录时间。
15.在全速下离心反应1分钟。
16.测量上清液的OD405。
本发明使得可量化评估所述文库并还具有其它潜在应用(例如,用于开发生物传感器并筛选菌落、和用于论证基因编辑技术的标记和目标)。本文中所述的三个报告子是所开发的供用于刺糖多孢菌中的第一报告基因和量化分析。另外,其具有作为其它生物系统中的共同报告子的益处,并且因此,可使用已针对其检测经优化的已建立的方法和仪器。
实例11:HTP基因组工程-用于刺糖多孢菌中的靶向和高效基因组整合的基于整合酶的系统
整合外源DNA是用于改良菌株性能的有效方法,然而这在刺糖多孢菌中极低效,尤其对于大块DNA(>10kb)。在类似于刺糖多孢菌的宿主中复制和重构生物合成路径的能力对于代谢工程改造尝试至关重要,然而这些路径的尺寸使得这些尝试成本过高。
本实例描述用于将基因元件整合于刺糖多孢菌的基因组中的基于整合酶的系统。整合酶经由在保守位点(att位点;保守核苷酸序列通常位于宿主染色体中的tRNA基因内)识别和附着来引导DNA有效载荷的靶向整合。预计本发明所述的基于整合酶的系统将使得可递送大小为数十千碱基的基因有效载荷,由此实现高效引入来自异源生物体的外源DNA或复制来自刺糖多孢菌的原生基因。预计能够显示,以下所选整合酶中的一种或多种实现将DNA高效引入到基因组中的特异性位点:
表10.用于将基因元件整合于刺糖多孢菌的基因组中的整合酶
Figure BDA0002371045810001581
Figure BDA0002371045810001591
Figure BDA0002371045810001601
Figure BDA0002371045810001611
Figure BDA0002371045810001621
Figure BDA0002371045810001631
已显示pCM32整合酶在刺糖多孢菌起作用(陈等人,糖多孢菌质粒pCM32的染色体整合的表征和其改良刺糖多孢菌中的刺糖菌素产量的应用.应用微生物学和生物技术.PMID 26260388 DOI:10.1007/s00253-015-6871-z)。这并非出人意料,因为在刺糖多孢菌基因组中发现附着位点与pCM32附着位点具有99%一致性(图38)。陈等作者实现产生具有改良刺糖菌素效价的菌株的两种基因的靶向整合(参见专利申请CN 105087507A,其以全文引用的方式并入本文中)。
已描述pSE101和pSE211整合酶以及其附着位点。在刺糖多孢菌中发现pSE101和pSE211附着位点的核心(分别见图39和图40)。对这些整合酶系统进行测试但并未起作用。本发明人将测试改良系统和其它整合酶系统。
用于使用pCM32、pSE101和pSE211将序列整合于刺糖多孢菌中的载体描述在图37中。类似地,还可构建使用刺糖多孢菌的pSE101同源物或pSE101同源物的载体。将测试这些载体以研究其将外源DNA整合于刺糖多孢菌的基因组中的能力。
由本公开中所述的方法产生的含有整合外源DNA的刺糖多孢菌菌株可用作基本菌株以改良刺糖多孢菌的菌株性能。例如,所述菌株可以在HTP系统中与上述实例中所述的SNP交换文库、启动子交换文库和/或终止子文库组合以产生具有改良所需产物(如刺糖菌素)产量的新刺糖多孢菌菌株。
对表10中所述的整合酶系统进行测试但并未起作用。本发明人将测试改良系统和其它整合酶系统。
实例12.用于刺糖多孢菌的自复制质粒系统的复制起点
在本实例中,提供复制起点和复制元件(例如,质粒复制所需的基因编码酶)。这些基因元件可在刺糖多孢菌中提供复制功能性,因此其可实现构建针对刺糖多孢菌的自复制质粒系统。自复制质粒系统将增加可以在这一宿主中执行的基因工程改造和筛选的类型。
刺糖多孢菌当前缺少的一个重要分子基因工具是自复制质粒系统。质粒系统将以多种方式扩展刺糖多孢菌的工程改造能力。例如,其可(1)不需要通过用于测试代谢工程改造设计的同源重组成功整合(例如,可使用质粒系统引入基因复制或异源酶以确定对宿主表型的影响);(2)实现更快的文库(基因、启动子、终止子或核糖体结合位点)筛选;(3)其将通过允许用户在质粒系统上并在其控制下引入CRISPR系统部件促进基于CRISPR的基因组编辑。
已研究供用于刺糖多孢菌中的来自紧密相关物种的其它质粒,包括pWHM4,一种广泛用于红色糖多孢菌中的自复制质粒(瓦拉(Vara)等人,1989,“管理红色糖多孢菌(红霉素链霉菌)中的红霉素生物合成路径的脱氧糖部分的基因的克隆(Cloning of genesgoverning the deoxysugar portion of the erythromycin biosynthesis pathway inSaccharopolyspora erythraea(Streptomyces erythraeus))”.细菌学杂志171,5872-5881.);和pIJ101,一种来自青紫链霉菌的多拷贝宽宿主范围质粒(基瑟等人,1982,“pIJ101,多拷贝宽宿主范围链霉菌质粒:DNA克隆载体的功能分析和开发(a multi-copybroad host-range Streptomyces plasmid:functional analysis and development ofDNA cloning vectors.)”分子遗传学与基因组学(Mol Gen Genet)185:223-228),但据我们所知,尚未得到成功利用。
在一些实施例中,复制起点的来源包括红色糖多孢菌中所发现的推定染色体复制起点,和来自红色糖多孢菌的质粒pSE101和pSE211中的放线菌整合性和接合性元件(AICE)(提伯力等人,(2008)放线菌整合性和接合性元件.安东尼·范·列文虎克94,127-143),参见图41A。放线菌整合性和接合性元件(AICE)是放线菌,包括糖多孢菌属中常见的可移动基因元件。可发现这些元件整合于基因组中或作为自动、自复制质粒。
为了测试这些推定复制起点,组装含有抗生素抗性标记和推定复制起点的质粒+/-自复制所需的其它基因(例如,在AICE的情况下)。将组装质粒递送到刺糖多孢菌,并且抗生素选择用于选择具有所述质粒的转化体。PCR用于确认质粒的维持和稳定性。示例性质粒示于图41B中。对这些推定复制起点进行测试但并未起作用。本发明人将测试改良设计和其它推定复制起点。
实例13.HTP基因工程-建构核糖体结合位点(RBS)文库以改良糖多孢菌中在刺糖菌素产量方面的菌株性能
前述实例已经证明了本公开的HTP菌株改良程序修复工业菌株的能力。实例2和3描述了SNP交换技术和文库的建构,从而探究各种基本、中间和工业菌株内的现有基因多样性。
这一实例说明使用本公开的核糖体结合位点文库技术的HTP菌株改良程序的实施例。
A.鉴别用于施用RBS文库的目标
施用RBS文库是多步骤过程,其包含选择一组“n”个基因进行靶向的步骤。
本发明人已鉴别出一组经由本公开的启动子梯方法调节的可能路径基因(参见,实例4和图12A到图12D)。
B.创建RBS文库
更广泛地说,基因工程改造尝试和代谢工程改造的主要目标在于改变宿主代谢、优化生物合成路径并引入或复制路径基因以便改良所需产物的产量。成效依赖于扰动和平衡所引入的生物合成基因簇或过表达非原生基因或基因拷贝内部(路径中)和外部(路径外)的基因表达的能力。在刺糖多孢菌中存在有限可用的基因工具,包括经表征的RBS。本发明是基因工程改造工具,其实现用于整合和调节刺糖多孢菌中的蛋白质表达的多基因多顺反子操纵子的设计。
核糖体结合位点(RBS)是位于mRNA转录物上的起始密码子的上游的核苷酸的短序列,所述转录物负责募集核糖体并引发蛋白质转译。因此,其是转译和蛋白质表达的重要调控因子。然而,RBS也可与5'UTR(影响转录和/或转译速率的基因的启动子或编码区)中的邻近核苷酸相互作用。经由这些相互作用和所得二级结构,核糖体结合位点可“调节”基因表达。
RBS文库是合成生物学工具包的常见组分并已开发用于多种生物体。此外,已开发出用于预测合成RBS的工具,所述RBS将宜与所关注基因相互作用(莎莉丝(Salis)等人,“控制蛋白质表达的合成核糖体结合位点的自动化设计(Automated design of syntheticribosome binding sites to control protein expression.”自然·生物技术,2009;27:946-950.doi:10.1038/nbt.1568.)。然而,这是针对刺糖多孢菌所述和表征的第一所述文库和第一原生RBS。
为了鉴别推定原生RBS,选择多顺反子操纵子中的基因之间的起始密码子或基因间区上游的核苷酸序列。基于来自文献(罗(Luo)等人,“刺糖多孢菌SP06081和PR2菌株的比较蛋白质组分析显示差异表达蛋白与增加的多杀菌素产量相关。(Comparative proteomicanalysis of Saccharopolyspora spinosa SP06081 and PR2 strains reveals thedifferentially expressed proteins correlated with the increase of spinosadyield.)”蛋白质组科学(Proteome SCI.)2011,9:1-12)的蛋白质组数据,针对预期高度表达的基因,或针对与刺糖菌素产生相关的基因选择RBS。在分析时,基于PATRIC数据库(https://www.patricbrc.org/)中可用的注释进行预测。使用构成功能性度量标准的可反向选择的标记(sacB)在选择性培养基上的生长水平来分析RBS。
在这一实例中,本发明人创建了供用于刺糖多孢菌和相关宿主中的一组具有不同程度的转译活性的19个核糖体结合位点(RBS)的文库。所述文库由先前描述于刺糖多孢菌原生的先前尚未表征的不同宿主和序列中的合成序列构成:
表11.RBS序列、其来源、尺寸和相对功能的汇总
Figure BDA0002371045810001661
Figure BDA0002371045810001671
因此,本公开提供需要作为多基因多顺反子整合中的各基因之间的间隔子的功能性RBS序列的多样文库。这些RBS的序列多样性和强度变化为使用这些RBS通过在启动子和基因之间插入不同RBS来上调或下调基因表达提供机会。
C.使来自文库的RBS与靶基因结合
建构RBS文库中的另一步骤是HTP工程改造多种菌株,其包含来自RBS文库的与特定靶基因结合的指定RBS。
如果原生RBS存在于靶基因n的前方并且其序列已知时,那么可进行用所述文库中的RBS中的每一个置换原生RBS。当原生RBS不存在或其序列未知时,那么可以进行将所述文库中的RBS中的每一个插入基因n的前方。以这种方式构建菌株文库,其中所述文库的每个成员是可操作地连接到n目标的RBS在原本相同的基因背景下的例子。
D.对菌株进行HTP筛选
应用RBS文库的最后一个步骤是对前述文库中的菌株进行HTP筛选。所衍生菌株中的每一种代表了在原本相同的基因背景下的连接到n目标的RBS的例子。
在根据一种或多种度量标准表征菌株性能的情况下,本发明人通过对每种菌株实施HTP筛选而将能够根据所指定的度量标准确定什么样的RBS/靶基因关系最有益(例如优化所关注分子的产量)。
证明这一工程改造方法实用性的数据显示在图63中。核糖体结合位点插入多种靶基因的上游以调整转译效率,并且在针对聚酮生产率的板分析中与亲代菌株比较测试这些经工程改造的菌株。与亲代菌株相比,若干“RBS交换”菌株展现出改良。
实例14-HTP基因组工程-建构转座子诱变文库以改良糖多孢菌的菌株性能
这个实例描述了一种通过在刺糖多孢菌中进行体内转座子诱变来产生菌株文库的方法。可以筛选所得文库以鉴别展现改良表型(例如特定化合物(例如刺糖菌素)的效价)的菌株。菌株能够进一步用于多轮循环工程或解译促成菌株性能的基因型。所述文库中的菌株也可用于与具有不同基因扰动的其它菌株合并以产生具有增加的一种或多种所需化合物产量的改良菌株,类似于上文实例3中所用的SNP交换文库。
因此,本公开描述了一种使用刺糖多孢菌的EZ-Tn5转座体系统(艾匹萨特拜奥(Epicenter Bio))创建转座子诱变微生物菌株文库的方法。首先可将转座酶与侧接镶嵌元件(ME)序列的DNA有效载荷序列复合,并且所得蛋白质-DNA复合物可在细胞中转化。这将使得DNA有效载荷随机整合到生物体基因组DNA中。视所引入的有效载荷而定,能够产生功能缺失(LoF)文库或功能获得(GoF)文库。
功能缺失(LoF)转座子文库-可以改变有效载荷的序列以引起多种多样的表型应答。在功能缺失(LoF)文库的基本情况下,这种有效载荷包含允许选择成功的转座子整合事件的标记。
随机功能缺失突变可以使用Tn5转座酶系统(EZ-Tn5;
Figure BDA0002371045810001691
)在微生物中体内进行。EZ-Tn5转座酶系统是稳定的且能够通过电穿孔引入活微生物中。转座子系统一旦引入细胞中,即被宿主细胞中的Mg2+活化并将转座子随机插入宿主基因组DNA中。
功能获得(GoF)转座子文库-为了创建GoF文库,根据基本情况构建基因有效载荷的更复杂化身,通过并入附加的特征(如启动子元件、溶解性标签(在这种情况下,称为功能获得溶解性标签转座子))和/或可反向选择标记以促进含有可选标记的有效载荷的一部分环出,从而允许连续的转座子诱变(在这种情况下,称为功能获得可再循环转座子)。这些实施方案在一起能够创建各种文库以改良宿主表型。
本公开转座子的非限制性示例性构建体示于图44中,并且代表性功能缺失(LoF)转座子、功能获得(GoF)转座子、功能获得可再循环转座子和功能获得溶解性标签转座子的序列经提供分别呈SEQ ID No.128、SEQ ID No.129、SEQ ID No.130和SEQ ID No.131。这些转座子能够与转座酶复合并在细胞中转化。所得细胞将随机整合有DNA有效载荷,从而形成转座子诱变微生物菌株文库。可以根据本文所述的HTP程序进一步筛选文库并针对表型改良进行评估。可以根据本公开中所述的任何方法分离具有所需表型(由于转座子整合)的菌株用于进一步表征和进一步工程改造。
举例来说,能够针对亲代菌株筛选LoF转座子文库和GoF转座子文库,并可分析性能数据(刺糖菌素的效价)。这些文库中所产生的一些新菌株相较于亲代菌株将具有改良的性能。
本文所述的方法解决了两个主要问题。首先,即使在充分研究的生物体中,对大部分基因组概貌的了解仍不充分。还已经注意到,充分了解的基因元件可以未预期的方式相互作用。为此目的,本公开提供诱发表型扰动的有效基因工程改造方法。其次,在缓慢生长或遗传上顽抗的生物体的情况下,尤其是具有大基因组的那些生物体,对所有可能的基因目标执行靶向基因扰动可能受到时间或成本的制约。本公开提供了产生具有扰动的基因组的菌株的有效方式,其使所述菌株产生所需化合物的性能改良。因此,本公开通过使用体内转座子诱变容易并随机调节宿主生物体基因元件的方法解决了这些问题。以这种方式,具有不同突变(功能获得和功能缺失)的菌株文库可极快速地制备并可涉及新基因目标以进一步改良宿主表型。
实例15.用于在糖多孢菌中插入基因元件的中性整合位点
在刺糖多孢菌中工程改造基因复制和重构生物合成路径会受到已针对这一宿主表征的已知中性整合位点的数目的限制。若干中性位点可能存在于刺糖多孢菌基因组中,但到目前为止,仅已表征一个中性整合位点。先前已报导这一特定位点,obsA(US20100282624,其以全文引用的方式并入本文中),但另外位点的缺乏对进行多个连续基因变化的能力造成限制。另外中性整合位点将促进能够工程改造和测试多个组合性基因整合的能力和速度。
RNASeq数据(在发酵期间取样并比较在两种菌株中的表达的重复时间序列)用于鉴别在任一菌株中或在发酵期间的任何时间点处表达极少或未表达的多基因基因座。指导原理是在发酵期间的任何时间或在任一菌株中未表达的基因对于产量不大可能为必不可少的或至关重要的(参见图45)。因此整合于这些基因座中不大可能或较不可能对表型造成不利影响。一旦这些位点被鉴别,那么基因座位于参考基因组内,并设计整合构建体以在位点中心处引入单碱基对突变。
因此,本公开提供一组中性整合位点——例如其中个别基因或多基因盒可通过接合和同源性重组稳定并高效地整合于刺糖多孢菌的基因组中的基因座。为了被视为中性位点,有效载荷的基因整合将显示对生长和可预测表达水平的有限影响。已鉴别和当前探究的位点包括分散在整个基因组中的十一个基因座。每个位点均具有通过产生整合基因有效载荷的整合位点来增加扩展基因工程改造能力的潜力。可用位点数目与可包括在全因子、组合性基因整合设计中的并由此增强工程改造能力的因子数成比例。这些位点汇总在下表12中。
表12.每种亲代菌株的十一个推定中性整合位点、相关基因、所引入的突变和整合效率-集落形成单位(CFU)的汇总.
Figure BDA0002371045810001701
Figure BDA0002371045810001711
位点位于多基因基因座中,对于其观察到极少甚至无表达(转录;mRNA)。使用RNASeq数据的时间序列,比较两种不同菌株中的基因表达来对其进行鉴别。
为了评估整合效率,将单核苷酸多态性引入到每个位点的中心处。报告菌株A和B中的每个位点的接合效率(表12)。
相对于亲代菌株B,评估经菌株B衍生的所得菌株的产物效价(图67)。分析具有整合在指定中性位点处的SNP交换有效载荷的经菌株B衍生的菌株的产物效价(刺糖菌素J+L)。整合在位点1、2、3、4、6、9和10处的菌株具有相似产物效价,并且与预期效价(即,菌株B的平均效价;所述图式上的较高杠)不同。中性位点7处的整合呈现对产物效价具有不利影响。
为了进一步评估这些位点并比较整合有效载荷的表达,评估了在菌株A(WT)和B中的每个位点处整合之后,荧光报告子(SEQ ID No.81)在强启动子(SEQ ID No.25)的控制下的表达(图68)。在大多数位点处表达相似。仅NS7与所评估的其它中性位点(NS2、NS3、NS4、NS6和NS10)显著不同。
实例16.HTP基因组工程-建构抗代谢物选择/发酵产物抗性文库以改良糖多孢菌中的菌株性能
这一实例说明创建用于在糖多孢菌中产生基因多样性的抗代谢物选择/发酵产物抗性文库的实施例和将所述文库用于HTP基因工程改造的方法。
为了由微生物改良所需化合物的产量,通常需要并非直接适合于合理工程改造的分子调节的迂回形式。实例包括通过不同路径抑制最终产物。在这一实例中,使刺糖多孢菌经历抗代谢物(α-甲基甲硫氨酸)或发酵产物(刺糖菌素J/L),并分离在这些条件下具有改良生长的菌落。所述菌落的高通量筛选鉴别在板模型中具有比亲代菌株要好的发酵性能的分离物,其表明所述策略潜在地适用于改良菌株性能。
作为发酵过程的一部分,微生物产生多种化合物。有时所述化合物的积聚会严重抑制微生物的生长和生理学。乙醇产生是发酵产物抑制生长(毒性)的实例。在分子水平下,路径产物可通常抑制负责其产生的酶以努力使浪费降到最低。同时这有利于微生物进化和存活,这些反馈机制可严重妨碍工业发酵(发酵微生物学和生物技术(FermentationMicrobiology and Biotechnology),第三版,ISBN 9781439855799),其中目标在于根本上增加通过某些路径的通量和产物积聚。为了改良发酵并延长期间微生物可合成所需代谢物的时间,需要解决a)最终产物的可能存在的毒性,和b)形成所需最终产物所需的分子路径的反馈抑制。
刺糖多孢菌生长对其发酵产物的存在敏感。(图46)。假设如果改良了其产物耐受性,那么可改良菌株生产率。因此,进行以下概述的步骤以选择较好地能够使发酵产物存活的菌株。分离更多抗性菌株(图47)。引起关注地是,在针对刺糖菌素生产的板模型中,有两种分离物针对刺糖菌素J/L表现得比亲代好得多(图48A)。在针对刺糖菌素生产的板模型中,还分离出针对代谢物α-甲基-甲硫氨酸(aMM)表现得比亲代好得多的一种菌株(图48B)。
刺糖菌素生产需要NADPH和SAM作为辅因子。由于其中的任一个均可局限于刺糖菌素形成,并且每个辅因子可抑制负责其各自合成的酶,因此寻求通过SAM去除反馈抑制的途径。在大肠杆菌中,SAM可抑制MetA蛋白,其负责SAM前体的合成。大肠杆菌中的典型方法为使菌株在抗代谢物α-甲基-甲硫氨酸(aMM)存在下生长,其选用于对反馈调节不敏感的metA突变体(尤苏达(Ususda)和仓桥(Kurahashi),2005,应用环境微生物学(Appl Env.Micro),2005年6月,p3228-3234)。不存在在刺糖多孢菌中清除metA同系物,但由于刺糖多孢菌对aMM敏感,采取相似方法并选择抗性突变体,期望其具有增加的SAM积聚并可呈较好的刺糖菌素产量。为了由微生物改良所需化合物的产量,通常需要并非直接适合于合理工程改造的分子调节的迂回形式。实例包括通过不同路径抑制最终产物。
确切地说,使亲代刺糖多孢菌菌株经历抗代谢物(例如,α-甲基甲硫氨酸)或发酵产物(例如,刺糖菌素J/L)。首先确定刺糖多孢菌对选择剂和实验用条件和培养基的敏感性。没有关于所用浓度的适当起始点的话,所述实验可能完全失败。对于刺糖菌素J/L实验,其耗时数周和多次尝试来发现抑制生长但不会杀伤细胞的浓度。溶液为调整刺糖菌素浓度和用于接种的生物质的量的组合。aMM需要使用基本培养基,这在可继续进行选择之前必须首先进行鉴别和验证。这一步骤为成功选择策略打下基础。基本培养基具有以下所列组成:
成分(每1L):
■淀粉,可溶10.0g
■磷酸二钾1.0g
■硫酸镁七水合物1.0g
■氯化钠1.0g
■硫酸铵2.0g
■碳酸钙2.0g
■硫酸亚铁七水合物0.001g
一旦确定选择浓度,那么在上文所述的条件下进行对更多抗性分离物的选择。对于选择,液体中的选择需要多次培养物传代(7次传代,~40代)。平行维持多个独立培养物以增加符合所赋予选择的独立突变事件的机率。每次传代的持续期间和频率可以凭经验确定。选择策略决定针对何种性状而选择。较差设计可引起选择在所需工业条件下表现不好的菌株。将需要良好比对和/或抑制策略(二次筛选)来促进选择成功。在刺糖菌素J/L存在下,菌株选择的实例示于图47中。在刺糖菌素J/L存在下所选菌株明显比亲代菌株生长得好。
进一步验证所选菌株以证明这些分离物实际上比亲代菌株更具抗性。这一选择验证是策略起作用的良好指标,并可用作何时继续下一步骤的决策点。
随后,通过HTP筛选进一步分析所选菌株以确定所选特征是否有利于所需工业过程。由于细胞可以多种方式解决特定选择挑战,其大多数可能并非工业相关,因此HTP筛选在鉴别待进一步表征并用于合并的分离物方面是关键步骤。根据第一研究,呈现仅~2-5%所选分离物是所关注的。在HTP板发酵模型中性能比亲代菌株好的所选菌株的实例示于图48A(刺糖菌素J/L)和图48B(aMM)中。
任选地,可鉴别在所选菌株中产生改良性能的突变并可分离相关序列。这一将促进这些突变合并于如本文所述的其它所需菌株中。初始测试结果示于图69中。
实例17.HTP基因工程-使用sacB或pheS作为刺糖多孢菌中的反向选择标记以产生无痕突变型菌株
这一实例说明使用sacB或/和pheS作为反向选择标记产生“无痕”突变型糖多孢菌菌株的实施例。
如所属领域中先前所述,US20170101659A1论述了针对改良生产率,在聚酮合成酶基因基因座处,使用如温度敏感型复制起点和选择标记工程改造聚酮生产菌株。这一方法的详细要求和约束条件(包括依赖于PKS编码区的重复性质)以及所属领域中的有限其它实例阐明工程改造工业相关微生物(如刺糖多孢菌)的挑战。然而,基因组中的任何位置处的精确基因组编辑能够在刺糖多孢菌宿主菌株中进行预期改良,包括施用改良生物体表型,是至关重要的。另外,抗性标记再循环在存在有限抗性标记的单一菌株中实现叠加基因改良,并且对于促进这些微生物在制造应用中的定位(即,不含抗生素抗性)也是至关重要的。在本实例中,证明了使用sacB和/或pheS作为反向选择标记以及使用同源臂靶向基因组中的任何位置来实现无痕、无标记导向基因组编辑(参见图49A到图49C)。
sacB基因编码将蔗糖转化成左聚糖的果聚糖蔗糖酶,已知其对于许多微生物具有毒性(雷拉特(Reyrat)等人,“可反向选择的标记:细菌遗传学和发病机制的未被开发工具(Counterselectable Markers:Untapped Tools for Bacterial Genetics andPathogenesis)”,感染与免疫(Infect Immun.)1998年9月;66(9):4011-4017;和嘉格
Figure BDA0002371045810001741
等人,“枯草芽孢杆菌sacB基因的表达在革兰氏阳性细菌谷氨酸棒状杆菌中而非青紫链霉菌中引起蔗糖敏感性(Expression of the Bacillus subtilis sacB gene leadsto sucrose sensitivity in the gram-positive bacterium Corynebacteriumglutamicum but not in Streptomyces lividans.)”,细菌学杂志1992年8月;174(16):5462-5)。在不存在蔗糖下,sacB基因的载体以健康方式生长,在蔗糖存在下,仅缺失sacB基因的菌株可存活。这一概念很大程度上用于许多革兰氏阴性微生物,然而,革兰氏阳性微生物(除谷氨酸棒状杆菌和分枝杆菌属外)通常对左聚糖的作用具有抗性。本文中(图50)证明sacB基因在刺糖多孢菌中赋予2-3log蔗糖敏感度。因此,实验指示sacB可用作针对无标记菌株产生的刺糖多孢菌中的可反向选择标记。sacB基因序列针对刺糖多孢菌经密码子优化(SEQ ID No.143)。
pheS基因编码苯丙氨酸-tRNA合成酶的α亚基,使得细菌对4-氯苯丙氨酸(4CP)敏感(米亚克(Miyazaki),“用于改良大肠杆菌中的操作效率的PheS反向选择标记的分子工程改造(Molecular engineering of a PheS counterselection marker for improvedoperating efficiency in Escherichia coli.)”生物技术.2015年2月1;58(2):86-8.)。在不存在4-氯苯丙氨酸下,pheS基因的载体以健康方式生长,然而,在4-氯苯丙氨酸存在下,仅缺失pheS基因的菌株可存活。在本文中(图51)证明,源自红色糖多孢菌的pheS基因的突变形式在刺糖多孢菌中赋予4-氯苯丙氨酸敏感性,并可因此用作反向选择标记。测试米亚克2015中所述的具有突变的源自红色糖多孢菌和刺糖多孢菌的pheS基因,并发现功能性(分别呈SEQ ID No.144和SEQ ID No.145)。
以多种构形(图49A-C)设计菌株工程改造用载体骨架以改变菌株工程改造效率,其取决于背景菌株特征(例如基础菌株对选择和反向选择剂的抗性/敏感性)。这包括使用用不同启动子表达的一种或两种可反向选择基因以改变编码标记的表达。
这一工具施用于本公开的HTP系统以产生经工程改造的无痕刺糖多孢菌菌株,并且质量控制结果显示成功施用工具(图52)。因此,本文描述在刺糖多孢菌中使用sacB和pheS作为反向选择标记以及其基因编辑应用。可反向选择标记或负向选择标记的微生物表达引起在特定底物(对于sacB和pheS,分别蔗糖和4-氯苯丙氨酸)上限定生长,并且因此实现选择不含反向选择标记的微生物。sacB和pheS被描述为所述文献中其它宿主中的反向选择标记,但据所知,这是其在刺糖多孢菌中的用途的第一表征。在本文中,使用反向选择与同源重组的组合来在刺糖多孢菌中执行靶向无痕基因编辑,其是HTP基因工程的强有力工具。
实例18:糖多孢菌的HTP接合&将外源DNA引入到糖多孢菌中的说明
这一实例说明了本公开的HTP基因工程改造方法的实施例。确切地说,其展示了使用大肠杆菌作为供体生物体,用于种间接合糖多孢菌(例如,刺糖多孢菌)的高通量过程。这一过程使用自动化和自动化兼容的培养形式,通过单交叉同源重组引入遗传物质来实现糖多孢菌(例如,刺糖多孢菌)的基因修饰。
刺糖多孢菌是工业上相关宿主,并且本发明实现用于在这一待意识到的宿主中基因组工程改造的高度并行化尝试。结果证明本公开方法能够产生跨越宿主细胞的整个基因组的任何外源DNA的快速基因变化。
种间接合(也称为基因间接合)是用于糖多孢菌中的基因转移,确切地说,尤其避开其强效限制障壁的有效机制。然而,当前用于接合的方法已产生相对较低效率并需要人工程序来完成(即,通过人工操作者完成,伴随一次小于十次改良)。这一工件的目标在于改良刺糖多孢菌中的接合效率并开发出在刺糖多孢菌中实现高通量(HTP)基因组工程改造的自动化接合方案。解决这一问题迫使需要1)增加接合效率以产生呈HTP形式的接合后体和2)开发出用于培养、涂铺和菌落挑选的自动化方案。
在皮氏培养皿上使用来自标准接合程序的参数开始HTP接合方案的产生开发。在这一工作开始时开发使用皮氏培养皿的若干接合方案,并选择内部方案作为用于进一步开发的基础。尽管相较于其它方案,所述方案产生较低接合效率,但这一方案不需要将需要人工处理(例如,细胞刮削)的任何专门的步骤并且因此最适合于自动化。
选择采用整合方法,为增加接合效率同时开发用于同时自动化程序的方案进行研究。通过使用实验设计(DOE)方法优化用于在皮氏培养皿上进行接合的早期菌株方案来开始这一过程,并且这充当用于在分隔的48孔Q型托盘上执行接合并进行另外基于DOE的优化的基础。相较于标准皮氏培养皿,分隔的Q型托盘维持具有缩小的表面积(相对于皮氏培养皿减小8倍)的2D琼脂板形式并与自动化系统介接良好。48孔Q型托盘形式为开发使整个接合过程自动化的标准程序提供基础:供体培养、涂铺供体和受体细胞、针对接合后体的抗生素选择、接合后体菌落挑选、修补和培养。下文提供实验输入,包括研究用于改良接合的实验因子的大参数空间的实验方法的设计。
对于使用DOE改良接合效率的初始实验,选择使用决定性筛选设计策略,其对于评估组合的大量实验因子通常有效。重要的是,决定性筛选设计可鉴别管理模型的主要影响(不管因子相互作用),并且其还可鉴别定量因子的非线性效应。DOE是优化工具,并且用于接合的有限实验数据(即,产生非零接合后体的实验)表明,实现适合于HTP形式的方案将需要多轮优化。
因此,改良接合效率的工作采取三个一般阶段。在阶段I,工作使用的是未告知统计显著接合模型并经由迭代改良效率的实验结果。在鉴别重复产生菌落的一组接合条件后,在阶段II,尝试鉴别将进一步改良接合结果的新条件。在阶段III,使用基于这些条件的数据以开发用于优化接合的新的一组实验条件,其随后在不同操作者中用生物复制进行验证。
基于DOE的接合优化所考虑的因素归类成图55中详述的接合方案的四个主要部分,其包括培养受体菌株、培养供体菌株、共培养接合条件和选择接合后体。这些因素中的每一种考虑用于改良/优化并针对实验测试加以优先化。使用JMP软件版本11.2.1分析数据。除非另外说明,否则在统计显著性背景下报告结果。
接合的主要步骤是:
1)将受体细胞继代培养到指数中期
2)将供体细胞继代培养到指数中期
3)合并供体和受体细胞
4)将供体和受体细胞混合物涂铺于接合培养基上
5)培育板以使细胞接合
6)施加针对供体细胞的抗生素选择
7)施加针对未整合受体细胞的抗生素选择
8)进一步板以使整合受体细胞(接合后体)生长
在章节1中描述用于增加接合效率的实验和结果,并在章节2中描述开发自动化程序。
章节1:改良结合效率
实验1.
实验目标:使用DOE方法优化皮氏培养皿上的接合
实验设计:使用早期菌株方案的在皮氏培养皿上进行的接合产生低效率,并且预期移动到Q型托盘形式将归因于面积缩小而引起甚至更低的效率。因此寻求改良皮氏培养皿上的接合效率,使得转移到HTP形式的所述方案将具有最大成功机会。为了优化早期菌株方案,使用了DOE方法和假设对接合具有最强影响的变化实验条件:
●受体继代培育时间:24-48h
●萘啶酸浓度:14-50μg/ml
●安普霉素浓度:36-100μg/ml
●萘啶酸递送时间:2-24h
●安普霉素递送时间:16-48h
●期望供体浓度:105-108
●期望受体浓度:105-109
●供体:受体比率:6:1、1:100
●供体应激:无抗生素应激或用4μg/ml到8μg/ml萘啶酸处理供体细胞1.5小时
结果:
产生接合后体的条件示于表13中。
结果解释:
(1)条件3产生最大量接合后体,每个Q型托盘孔产生总共6个接合后体。
(2)实验数据的统计分析显示任何单一参数对接合效率无显著影响。然而,值得注意的是,产生菌落的所有条件均使用间隔≥24小时的供体和受体抗生素选择时间。
实验2.
实验目标:
●为了确定在皮氏培养皿上进行接合的早期菌株方案是否可用于在分隔的Q型托盘上进行接合
●为了测试向供体细胞施加抗生素应激是否改良接合效率
●为了测试针对接合后体正向选择的增加的安普霉素浓度是否改良接合效率
实验设计:
1)使用两种受体细胞浓度:
OD=12下,50μl刺糖多孢菌培养物,根据原始皮氏培养皿方案
OD=12下,5μl刺糖多孢菌培养物,考虑到Q型托盘孔的空间的减小
2)使用两种固定供体细胞浓度:
比原始皮氏培养皿方案小10倍,考虑到Q型托盘孔的空间的减小
3)研究供体应激的影响:
用4μg/ml萘啶酸处理一半供体细胞培养物1.5小时
一半供体细胞培养物保持未处理
4)针对接合后体的选择使用两种安普霉素浓度
62.5μg/ml琼脂最终浓度
100μg/ml琼脂最终浓度
5)多个孔中重复每种条件,得到统计显著数据
结果:产生接合后体的条件示于表14中。
结果解释:
1)条件E产生最大量接合后体,每个Q型托盘孔产生总共1.5个接合后体。
2)受体细胞浓度的下降降低接合效率。
3)安普霉素浓度和供体应激未影响接合效率。
4)总的来说,这些结果显示接合可在48孔Q型托盘上进行。
实验3.
实验目标:为了确定根据实验1的皮氏培养皿上进行的接合的优化参数是否可改良Q型托盘上的接合效率
实验设计:探寻将在皮氏培养皿上产生菌落的每一组条件测试用于Q型托盘上进行的接合。然而,由于Q型托盘孔面积上比皮氏培养皿小大约8倍,因此关注测试在单一Q型托盘孔上进行的接合的两种细胞浓度:
●皮氏培养皿实验中所用的大致相同的总细胞浓度。
●皮氏培养皿实验中所用的总细胞浓度的大约1/8。
结果:产生接合后体的条件示于表15中。
结果解释:
1)条件#8产生最大量接合后体,每个Q型托盘孔产生总共3.3个接合后体。值得注意的是,根据供体浓度调整的这一条件也在皮氏培养皿形式中产生最大量接合后体。
2)总的来说,优化皮氏培养皿条件使得在48孔Q型托盘上进行的接合得到改良。
实验4.
实验目标:运作在Q型托盘上进行的结合的DOE以优化用于接合的条件。
实验设计:根据上文实验结果。显而易见的是,接合可在48孔Q型托盘上进行。由于这些效率极低,探寻预期对接合具有最强影响的不同条件:
○受体继代培育时间:24-48h
○萘啶酸浓度:25-100μg/ml
○安普霉素浓度:50-200μg/ml
○期望供体浓度:105-106
○期望受体浓度:105-106
○供体:受体比率:3:1、1:1、1:3
○供体应激:无抗生素应激或用4μg/ml萘啶酸+4μg/ml安普霉素处理供体细胞1.5小时
结果:产生接合后体的条件示于表16中。
结果解释:
●每Q型托盘孔所产生的最大接合后体数是0.7个接合后体。
●这一低值可能已归因于在未充分干燥的情况下培育Q型托盘的事实。
●进行另外的DOE对于理解所测试参数是否受不一致实验条件影响将至关重要。
实验5.
实验目标:
1)使用根据实验2的条件#8作为局部最优来运作DOE,围绕这一条件改变实验参数。
2)为了测试与人工涂铺相比,使用帝肯自动化液体处理器进行涂铺是否影响接合效率(附注:直到这一实验为止,自动化和人工液体处理均已用于完成接合,但与人工涂铺相比,自动化液体处理是否产生较大或较小接合效率仍不明确)。
3)为了测试Q型托盘干燥对接合的影响。
实验设计:探寻将在皮氏培养皿上产生菌落的每一组条件测试用于Q型托盘上进行的接合。然而,由于Q型托盘孔面积上比皮氏培养皿小大约8倍,因此关注测试在单一Q型托盘孔上进行的接合的两种细胞浓度:
1)皮氏培养皿实验中所用的大致相同的总细胞浓度。
2)皮氏培养皿实验中所用的总细胞浓度的大约1/8。
结果:产生接合后体的条件示于表17中。
结果解释:
●条件12和7每个Q型托盘孔产生最大量接合后体,其中条件12每个Q型托盘孔产生总共8.4个接合后体。
●增加安普霉素浓度(200μg/ml)引起接合效率增加。
●附加干燥产生较高接合后体总数,尽管这些数据并非统计显著的。此外,附加干燥引起板变得开裂并且过薄,这对于下游程序,如菌落挑选将具有挑战性。
●与人工涂铺相比,自动化液体处理未影响接合效率。
●在实验计划中的此时,已鉴别每个Q型托盘孔产生≥5个菌落的多个条件。尽管未有构建接合的统计显著线性模型的数据,但这些条件表明,已查明可进一步通过探究新因素进行改良的某些实验条件。
实验6.
实验目标:
1)为了鉴别进一步改良接合效率和告知接合的统计学模型的新实验因素
2)为了围绕Q型托盘培养基组分运作DOE以确定用于接合的最佳培养基条件
实验设计:
选择以下条件进行改变:
●ISP4粉剂:27.8g/L-55.5g/L
●酵母提取物:0.5g/L-2g/L
●葡萄糖:1.5g/L-6g/L
●MgCl2:10mM-40mM
●另外琼脂:0g/L-7.5g/L
选择使用反映先前高效条件和另外新条件的实验条件测试这些不同培养基条件的影响
●根据实验5的条件#12;
●条件#8:使用较高萘啶酸和安普霉素浓度以促进涂铺程序;
●条件#8的变化形式,称为#8A,考虑供体细胞浓度变化性;
●由在15:1到1:5之间的不同供体:受体比率和基于先前结果的在105-106之间的总预期细胞浓度产生四种新条件。
结果:产生接合后体的条件示于表18中。
结果解释:
●高葡萄糖引起接合效率增加。未测定出所有其它培养基组分对接合效率具有显著影响。
●高萘啶酸浓度(100μg/ml)引起接合效率增加。
●利用JMP的非线性分配建模预测较低安普霉素浓度(100μg/ml)将增加接合效率。
●条件#12、#8A和#8依次产生最高接合后体数,其中条件#12每个Q型托盘孔产生个18接合后体。
实验7.
实验目标:为了再运作表现极好的条件并测试不同供体和受体浓度是否可改良这些条件的性能
实验设计:
1)选择根据实验5的条件#7、根据实验5的条件#12和根据实验6的条件#8作为基线条件。
2)选择在整个实验中使用量化变率从这些基线条件改变供体和受体浓度。由于方案使用OD作为细胞浓度的代表,因此各实验之间存在供体和受体浓度的固有变率。我们计算这一变差(CV)的量,并按比例改变供体和受体浓度。伴随低(成比例降低CV)、高(成比例增加CV)和基线供体和受体浓度的所有组合进行接合实验。
结果:产生接合后体的条件示于表19中。
结果解释:
1)低或高供体和受体浓度未改良接合效率。
2)伴随原始基线细胞浓度的条件#8和条件#12产生最高接合后体量,其中每个Q型托盘孔有~5个接合后体。
实验8
实验目标:
1)为了在实验6上重复来自培养基优化实验的条件#8A和#12以验证新培养基条件改良接合效率。
2)为了测试来自实验6的经调整反映JMP预测的条件#12(安普霉素浓度100μg/ml)改良接合效率(这一条件称为#12JA)
3)为了使用新培养基条件测试来自实验5的条件#7,因为条件7已证明在标准培养基上表现良好
实验设计:-基于新培养基条件和标准接合培养基条件运作条件#12、#12JA、#8A和#7,以进行比较。
结果:产生接合后体的条件示于表20中。
●结果解释:这一实验设计的最高接合后体数是针对条件#12JA,每个Q型托盘孔产生40个接合后体。
●验证新培养基条件改良接合效率。
●较低安普霉素浓度每个Q型托盘孔产生较高接合后体数,尽管没有足够数据评定统计显著性。
实验9
实验目标:为了通过使用不当密度/生长状态下的供体和受体细胞评估关于当前优化接合条件的敏感性。这将提供接合方案对细胞浓度或生长阶段的敏感程度的指标,因为这些的参数的变率预期将发生在各位点。
实验设计:
●使用条件#8和#12作为接合实验的基线条件。
●进行低、标准和高供体和受体细胞密度的所有组合的接合实验。
●以OD600=0.2使用低供体细胞培养物
●以OD600=0.4使用标准供体细胞培养物
●以OD600=0.8使用高供体细胞培养物
●呈OD540=9.6的低受体细胞培养物
●呈OD540=13.0的标准受体细胞培养物
●呈OD540=14高受体细胞培养物
●使用新优化培养基条件(基于实验6的来自实验的培养基3)。
结果:
1)使用低密度供体细胞引起总接合后体降低~60%。
2)使用高密度供体细胞引起总接合后体降低~50%。
3)使用低密度受体细胞引起总接合后体降低~80%。
4)使用高密度受体细胞产生0个总接合后体。
●结果解释:使用标准细胞密度的条件#12每个Q型托盘孔产生40个接合后体。
●不当供体和受体细胞浓度/生长阶段产生低得多的接合效率,适当受体培养条件尤为重要。
实验10
实验目标:
1)为了验证新操作者手工的优化条件
2)为了通过使用不当密度/生长状态下的供体和受体细胞评估关于当前优化接合条件的敏感性。
实验设计:
●使用伴随新优化培养基条件的条件#12JA
●进行低、标准和高供体和受体细胞密度的所有组合的接合实验。
●以OD600=0.3使用低供体细胞培养物
●以OD600=0.4使用标准供体细胞培养物
●以OD600=1.0使用高供体细胞培养物
●呈OD540=4.6的低受体细胞培养物
●呈OD540=8.0的标准受体细胞培养物
●呈OD540=10.6的高受体细胞培养物
结果:
●使用低密度供体细胞引起总接合后体增加~100%。
●使用高密度供体细胞引起总接合后体增加~70%。
●使用低密度受体细胞引起总接合后体降低~80%。
●使用高密度受体细胞引起总接合后体降低~80%。
结果解释:
1)通过新操作者完成的条件#12JA每个Q型托盘孔产生15个接合后体。这与先前结果相比有所下降,并可能归因于新操作者首次尝试所述程序。
2)受体细胞浓度/生长阶段的敏感性符合实验9中先前操作者所测定的实验结果。
3)使用不当供体细胞浓度/生长阶段的结果与来自实验9的数据不一致。使用不当供体细胞浓度引起接合效率从标准方案得到改良,然而这些数据在先前实验数据背景下具有不确定显著性。
4)受体细胞的显微检查适用于检验细胞状态。晚期对数细胞在液体培养物中呈现更具片段化。
Figure BDA0002371045810001831
Figure BDA0002371045810001832
Figure BDA0002371045810001841
Figure BDA0002371045810001842
Figure BDA0002371045810001843
Figure BDA0002371045810001851
Figure BDA0002371045810001852
Figure BDA0002371045810001853
Figure BDA0002371045810001854
章节2:自动化开发
实验11.高通量供体培养(自动化组件)
实验目标:为了以HTP接合形式使供体细胞生长
实验设计:
1)在96孔深孔正方形板(E&K EK-2440-ST)中测试大肠杆菌供体培养物的生长。通过基于过夜培养物的OD600的标准化接种体积接种培养物,使得具有最低OD读数的培养物对应于1:100接种。
2)测试生长用LB培养基的三种体积:250μl、500μl、750μl。
3)为了评定HTP生长对接合的影响,使用以这一HTP形式生长的大肠杆菌S17+SS015进行接合。
结果:细胞生长和接合数据示于图56A-B中。
结果解释:培养物在所有测试体积下稳健生长。此外,以500μl体积生长的培养物产生最高接合后体数,尽管差异并非统计显著的。500μl体积提供简单的液体处理并有足够的体积进行OD检查,并因此针对高通量供体生长而进行选择。
实验12.在HTP接合形式中涂铺细胞和抗生素(自动化组件)
实验目标:
1)为了以HTP形式涂铺细胞和抗生素
2)为了在整个接合方案中实现恒定涂铺,因为接合需要在供体和受体细胞顶部上层铺抗生素的多个涂铺步骤
实验设计:鉴别用于在分隔的48孔Q型托盘上涂铺细胞和抗生素的三个可能程序:
●点涂铺-以单点涂铺液体体积并使其在涂铺区域处干燥
●以微珠涂铺-以单点涂铺液体体积,随后使用微珠将液体分散到所述孔的整个区域上
●注满Q型托盘孔-涂铺足够的液体体积,使得利用摇摆运动,液体将分散到所述孔的整个区域上
结果:
●点涂铺引起不一致的细胞涂铺,并且另外,使用这一方法,涂铺细胞的疏水性使得其难以针对接合受体选择涂铺抗生素。点样抗生素量未分散到涂铺细胞的整个区域,并且在不人工破坏表面张力的情况下可能无法扩散。
●用微珠Plating产生恒定涂铺,但结果是受到污染。摇动每个孔中含有微珠的Q型托盘造成涂铺液体飞溅,并且有时微珠将在各孔之间交叉。另外,用微珠涂铺将需要相当大定制以与自动化系统介接。
●注满Q型托盘孔实现在整个接合程序中恒定涂铺,使得细胞和抗生素均匀地涂铺在孔区上。然而,板需要较长培养期以在涂铺培养物和抗生素之后完全干燥。
●另外,自动化解决方案将有待开发以来回摇动板来分散液体。
结果解释:
●基于涂铺试验,发现涂铺足够液体以注满Q型托盘孔是用于自动化接合的最有前景的程序。这一程序产生恒定均匀涂铺并可容易与自动化液体处理器介接。
●为了解决摇动Q型托盘分散液体的人工步骤,从VWR购买3D旋转器波(3DRotator Wave),并用定制部件调整其平台以适应Q型托盘尺寸。由于3D旋转器波可以轨道运动并也能在z平面中移动,因此其提供与当手动地进行板摇动时相同的运动。
实验13.接合后体挑选(自动化组件)
实验目标:
●为了开发用于检测接合板上的接合后体的标准程序
●为了将来自接合Q型托盘的菌落插补/印于选择性琼脂全向托盘上
实验设计:
1)使用Qpix 420和相应软件以鉴别接合板上的刺糖多孢菌接合后体。
2)用以下成像参数进行实验以检测接合后体:
●阈限
●曝光
●放大率
●倒置图像
●背景减除
3)用以下特征选择参数进行实验以包括检测可挑选接合后体:
1)密实度
2)轴比
3)最小直径
4)最大直径
5)最小邻近度
4)使用具有两种不同类型的针的挑选头测试:
1.酵母挑选针(X4377)
2.大肠杆菌挑选头(X4370)
5)尝试使用两种不同功能以接种于固体琼脂全向托盘上,以致力于产生大稳健斑块:
●单一浸渍
●搅拌
结果:
●发现在Q型托盘成像过程中倒置图像极适用于检测刺糖多孢菌接合后体。
●多个接合培养板成像之后,发现没有单一阈限和曝光值可用以准确鉴别刺糖多孢菌接合后体(参见图57)。由于每个板上的背景变化性(例如残余的死亡供体和受体细胞),因此需要调整每个板的阈限和曝光值。鉴别这些参数的使用范围值。
●发现使用大肠杆菌针转移接合后体并不起作用,这可能是因为这些针无法很好地挑选刺糖多孢菌细胞以足以允许进行后续接种。
●用酵母针进行菌落挑选对于板接种为奏效的。然而,挑选之后,挑选头并未从全向托盘完全分离并携带全向托盘连同在一起。绑定目标全向托盘之后,这不再成问题。
●浸渍功能对于接种为奏效的。搅拌功能也似乎用于接种的有前景的方法。不利的是,这些结果并非结论性的,因为用搅拌功能接种的全向托盘经历真菌污染。
结果解释:建立一组用于挑选刺糖多孢菌接合后体的一般参数,其可基于板变化使用装配有酵母针和浸渍接种功能的Qpix挑选头调整。这一方案引起刺糖多孢菌稳健生长而不存在可见大肠杆菌污染。
实验14
实验目标:为了将来自全向托盘的接合后体斑块挑选到96孔深孔板中进行培养和储存。
实验设计:
1.测试使用标准挑选条件将刺糖多孢菌斑块挑选到96孔深孔正方形板(E&K EK-2440-ST)中。
2.测试生长用DAS培养基2的三个体积:300μl、400μl、500μl。
结果:如图58中所示,仅使用400μl培养基接种的孔引起稳健生长。
结果解释:
1.关于300μl和500μl接种体积未引起接合后体培养物生长的原因并不明确。怀疑这与接种过程而不是培养基体积自身相关。
2.这一方案将需要一定另外的验证和优化以确保经挑选接合后体斑块稳健生长。
总结:图59汇总了经由基于DOE的优化过程完成的接合实验的结果。根据优化过程,统计学分析表明,最关键接合条件是药物选择浓度和培养基的葡萄糖浓度(参见图60)。实验分析进一步表明,受体培养物生长期也是关键接合条件。当受体培养物易于结合时光密度读数呈现为相对较好的指标,然而最新实验表明,细胞形态也适用于验证细胞状态。因此,除了光密度之外,应检查受体培养物的适当细胞形态。优化接合方案并未显示关于供体浓度和生长阶段的极大敏感性,并且因此所确立方案可能并不对供体细胞生长偏差敏感。当在HTP形式中研究多种菌株时,这将为适宜的。
本发明实现在糖多孢菌(例如,刺糖多孢菌)中改良接合效率的过程,伴随自动化接合方案以实现高通量(HTP)基因组工程改造。开发出了用于高通量接合的方案,其每个Q型托盘孔产生总体平均24个接合后体(通过两个独立操作者一式两份地运作)。产生最大接合后体数的接合条件包括:洗涤受体细胞;在30℃下接合;将受体菌株继代培养大约48小时,在接合之后20小时,用100μg/ml萘啶酸选择;在接合之后42小时,用100μg/ml安普霉素选择;使用具有6g/L葡萄糖的ISP4改良培养基;供体:受体比率~1:0.8,伴随总数为~7×106个细胞。
具有SEQ ID NO识别符的本公开序列
Figure BDA0002371045810001891
Figure BDA0002371045810001901
Figure BDA0002371045810001911
Figure BDA0002371045810001921
Figure BDA0002371045810001931
Figure BDA0002371045810001941
本公开的编号实施例
尽管随附条款,但本公开阐述以下编号实施例。
进行高通量基因组工程改造以使糖多孢菌属进化
1.一种使糖多孢菌属微生物进化以获得所期望表型的高通量(HTP)基因组工程改造方法,其包含:
a.扰动具有相同基因组菌株背景的初始多种糖多孢菌微生物的基因组,由此创建包含具有独特基因变异的个别糖多孢菌菌株的初始HTP基因设计糖多孢菌菌株文库;
b.针对所期望表型筛选和选择初始HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;
c.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述基因变异选自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的基因变异,由此创建后续HTP基因设计糖多孢菌菌株文库;
d.针对所期望表型筛选和选择后续HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;和
e.按照线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌微生物已获得所期望表型为止,其中每次后续迭代创建了新的HTP基因设计糖多孢菌菌株文库,所述新的HTP基因设计糖多孢菌菌株文库包含具有独特基因变异的个别糖多孢菌菌株,所述独特基因变异是选自前一HTP基因设计糖多孢菌菌株文库中的至少两种个别糖多孢菌菌株的基因变异组合。
1.1一种使糖多孢菌属微生物进化以获得所期望表型的高通量(HTP)基因组工程改造方法,其包含:
a.获得包含具有独特基因变异的个别糖多孢菌菌株的初始多种糖多孢菌微生物,由此创建初始HTP基因设计糖多孢菌菌株文库;
b.针对所期望表型筛选和选择初始HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;
c.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述基因变异选自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的基因变异,由此创建后续HTP基因设计糖多孢菌菌株文库;
d.针对所期望表型筛选和选择后续HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;和
e.按照线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌微生物已获得所期望表型为止,其中每次后续迭代创建了新的HTP基因设计糖多孢菌菌株文库,所述新的HTP基因设计糖多孢菌菌株文库包含具有独特基因变异的个别糖多孢菌菌株,所述独特基因变异是选自前一HTP基因设计糖多孢菌菌株文库中的至少两种个别糖多孢菌菌株的基因变异组合。
1.2根据条项1.1所述的HTP方法,其中通过扰动具有相同基因组菌株背景的初始多种糖多孢菌微生物的基因组来产生包含具有独特基因变异的个别糖多孢菌菌株的初始多种糖多孢菌微生物。
2.根据条项1到1.2所述的HTP基因组工程改造方法,其中在步骤(b)中组合基因变异之前,不考虑含有基因变异的基因的功能和/或特性。
3.根据条项1到2所述的HTP基因组工程改造方法,其中待组合的至少一种基因变异不在含有编码DNA模块的重复区段的基因组区域内。
4.根据技术方案1所述的HTP基因组工程改造方法,其中通过以下产生步骤(c)中各自包含独特基因变异组合的后续多种糖多孢菌微生物:
1)将质粒引入到属于初始HTP基因设计糖多孢菌菌株文库的个别糖多孢菌菌株中,其中所述质粒包含选择标记;反向选择标记;与基本糖多孢菌菌株的基因组基因座具有同源性的DNA片段;及质粒骨架序列,其中所述DNA片段具有源自也属于初始HTP基因设计糖多孢菌菌株文库的另一个别糖多孢菌菌株的基因变异;
2)基于所述基因组中存在所述选择标记选择具有整合事件的糖多孢菌菌株;
3)基于不存在反向选择标记基因选择质粒骨架环出的糖多孢菌菌株。
5.根据条项1到4中任一项所述的HTP方法,其中质粒不包含温度敏感型复制子。
6.根据条项1到5中任一项所述的HTP方法,其中在不复制整合质粒的情况下执行选择步骤(3)。
7.根据条项1到6中任一项所述的HTP基因组工程改造方法,其中初始HTP基因设计糖多孢菌菌株文库包含至少一个选自由以下组成的群组的文库:启动子交换微生物菌株文库、SNP交换微生物菌株文库、起始/终止密码子微生物菌株文库、优化序列微生物菌株文库、终止子交换微生物菌株文库、转座子诱变微生物菌株多样性文库、核糖体结合位点微生物菌株文库、抗代谢物/发酵产物抗性文库、终止插入微生物菌株文库和其任何组合。
8.根据条项1到7中任一项所述的HTP基因组工程改造方法,其中后续HTP基因设计糖多孢菌菌株文库是初始HTP基因设计微生物菌株文库的完整组合糖多孢菌菌株文库。
9.根据条项1到8中任一项所述的HTP基因组工程改造方法,其中后续HTP基因设计糖多孢菌菌株文库是初始HTP基因设计糖多孢菌菌株文库中的基因变异所衍生的完整组合糖多孢菌菌株文库的子集。
10.根据条项1到9中任一项所述的HTP基因组工程改造方法,其中菌株文库中的基因变异所衍生的后续HTP基因设计是前一HTP基因设计糖多孢菌菌株文库中的基因变异所衍生的完整组合微生物菌株文库。
11.根据条项1到10中任一项所述的HTP基因组工程改造方法,其中后续HTP基因设计糖多孢菌菌株文库是前一HTP基因设计糖多孢菌菌株文库中的基因变异所衍生的完整组合糖多孢菌菌株文库的子集。
12.根据条项1到11中任一项所述的HTP基因组工程改造方法,其中扰动所述基因组包含利用至少一种选自由以下组成的群组的方法:随机诱变、靶向序列插入、靶向序列缺失、靶向序列置换、转座子诱变和其任何组合。
13.根据条项1到12中任一项所述的HTP基因组工程改造方法,其中所述初始多种糖多孢菌微生物包含源自生产性糖多孢菌菌株的独特基因变异。
14.根据条项1到13中任一项所述的HTP基因组工程改造方法,其中所述初始多种糖多孢菌微生物包含表示为S1Gen1的生产菌株微生物和表示为SnGenn的由其衍生的任何数目个后续微生物后代。
15.根据条项1到14中任一项所述的HTP基因组工程改造方法,其中所述步骤c包含通过使用原生质体融合技术快速合并所述基因变异。
16.根据条项1到15中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含启动子交换微生物菌株文库。
17.根据条项16所述的HTP基因组工程改造方法,其中所述启动子交换微生物菌株文库包含至少一个具有选自SEQ ID No.1到69和172到175的核苷酸序列的启动子。
18.根据条项1到17中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含SNP交换微生物菌株文库。
19.根据条项1到18中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含终止子交换微生物菌株文库。
20.根据条项19所述的HTP基因组工程改造方法,其中所述终止子交换微生物菌株文库包含至少一个具有选自SEQ ID No.70到80的核苷酸序列的终止子。
21.根据条项1到20中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含转座子诱变微生物菌株多样性文库。
22.根据条项21所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含功能缺失(LoF)转座子和/或功能获得(GoF)转座子。
23.根据条项22所述的HTP基因组工程改造方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
24.根据条项1到23中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含核糖体结合位点微生物菌株文库。
25.根据条项24所述的HTP基因组工程改造方法,其中核糖体结合位点微生物菌株文库包含至少一个具有选自SEQ ID No.97到127的核苷酸序列的核糖体结合位点(RBS)。
26.根据条项1到25中任一项所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含抗代谢物/发酵产物抗性文库。
27.根据条项26所述的HTP基因组工程改造方法,其中所述抗代谢物/发酵产物抗性文库包含对参与糖多孢菌中的刺糖菌素合成的分子有抗性的糖多孢菌菌株。
产生SNP交换糖多孢菌菌株文库
28.一种用于产生SNP交换糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供参考糖多孢菌菌株和第二糖多孢菌菌株,其中所述第二糖多孢菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于所述参考糖多孢菌菌株中;和
b.扰动所述参考糖多孢菌菌株或所述第二糖多孢菌菌株的基因组,由此创建包含多种个别糖多孢菌菌株的初始SNP交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自所述参考糖多孢菌菌株与所述第二糖多孢菌菌株之间的所述多种已鉴别基因变异中的单一基因变异。
29.根据条项28所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中扰动所述参考糖多孢菌菌株的基因组以添加所述第二糖多孢菌菌株中所发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
30.根据条项28到29中任一项所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中扰动所述第二糖多孢菌菌株的基因组以去除所述参考糖多孢菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
31.根据条项28到30中任一项所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中具有独特基因变异的所得多种个别糖多孢菌菌株在一起包含所述参考糖多孢菌菌株和所述第二糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库。
32.根据条项28到31中任一项所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中具有独特基因变异的所得多种个别糖多孢菌菌株在一起包含所述参考糖多孢菌菌株和所述第二糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库的子集。
修复和改良生产性糖多孢菌菌株的表型性能
33.一种用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.提供亲代谱系糖多孢菌菌株和由其衍生的生产性糖多孢菌菌株,其中所述生产性糖多孢菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于所述亲代谱系糖多孢菌菌株中;
b.扰动所述亲代谱系糖多孢菌菌株或所述生产性糖多孢菌菌株的基因组,由此创建初始糖多孢菌菌株文库。其中所述初始文库中的每种菌株包含来自所述亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所述已鉴别基因变异的独特基因变异;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始SNP交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种微生物,所述基因变异来自前一步骤中所筛选的至少两种个别微生物菌株中所存在的所述变异,由此创建后续糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续菌株文库中的个别菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了新的糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
34.根据条项33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述初始糖多孢菌菌株文库是包含所述亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库。
35.根据条项33到34中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述初始糖多孢菌菌株文库是包含所述参考亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所述已鉴别基因变异的子集的完整组合文库的子集。
36.根据条项33到35中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是所述初始文库的完整组合文库。
37.根据条项33到36中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是所述初始文库的完整组合文库。
38.根据条项33到37中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是前一文库的完整组合文库。
39.根据条项33到38中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是前一文库的完整组合文库的子集。
40.根据条项33到39中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述亲代谱系糖多孢菌菌株的基因组以添加所述生产性糖多孢菌菌株中所发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
41.根据条项33到40中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述生产性糖多孢菌菌株的基因组以去除所述亲代谱系糖多孢菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
42.根据条项33到41中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述基因组包含利用至少一种选自由以下组成的群组的方法:随机诱变、靶向序列插入、靶向序列缺失、靶向序列置换和其组合。
43.根据条项33到42中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
44.根据条项33到43中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
45.根据条项33到44中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
46.根据条项33到45中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
47.根据条项46所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
48.根据条项46所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
49.根据条项33到48中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述已鉴别基因变异进一步包含来自启动子交换文库的人工启动子交换基因变异。
50.根据条项33到49中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其进一步包含对所述初始糖多孢菌菌株文库或后续糖多孢菌菌株文库的至少一种微生物菌株的基因组进行工程改造,以包含可操作地连接到内源糖多孢菌靶基因的来自启动子梯的一个或多个启动子。
51.根据条项33到50中任一项所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述菌株文库包含至少一个选自由以下组成的群组的文库:启动子交换微生物菌株文库、SNP交换微生物菌株文库、起始/终止密码子微生物菌株文库、优化序列微生物菌株文库、终止子交换微生物菌株文库、转座子诱变微生物菌株多样性文库、核糖体结合位点微生物菌株文库、抗代谢物/发酵产物抗性文库、终止插入微生物菌株文库和其任何组合。
52.根据条项51所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述菌株文库包含至少一个选自由以下组成的群组的文库:
1)包含具有选自SEQ ID No.1到69的序列的至少一个启动子的启动子交换微生物菌株文库;
2)包含具有选自SEQ ID No.70到80的序列的至少一个终止子的终止子交换微生物菌株文库;和
3)包含具有选自SEQ ID No.97到127的序列的至少一个RBS的核糖体结合位点(RBS)文库。
产生启动子交换糖多孢菌菌株文库并将其用于改良生产性糖多孢菌菌株的表型性能
53.一种用于产生启动子交换糖多孢菌菌株文库的方法,所述方法包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个启动子;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始启动子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述启动子梯的所述启动子中的一个或多个。
54.根据条项53所述的用于产生启动子交换糖多孢菌菌株文库的方法,其中所述多个启动子中的至少一个包含具有选自SEQ ID No.1到69的序列的启动子。
55.一种用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个启动子;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始启动子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述启动子梯的所述启动子中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始启动子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予所述表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述基因变异来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续启动子交换糖多孢菌菌株文库;
e.针对优于参考大肠杆菌菌株的所需表型性能改良来筛选和选择所述后续启动子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了糖多孢菌菌株的新的启动子交换糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一启动子交换糖多孢菌菌株文库的至少两种个别糖多孢菌菌株中的基因变异组合。
56.根据条项55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库。
57.根据条项55到56中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库。
58.根据条项55到57中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库的子集。
59.根据条项55到58中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是前一启动子交换糖多孢菌菌株文库的完整组合文库。
60.根据条项55-59中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是前一启动子交换糖多孢菌菌株文库的完整组合文库的子集。
61.根据条项55到60中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续启动子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
62.根据条项55到61中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续启动子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
63.根据条项55到62中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
64.根据条项55到63中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
65.根据条项64所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
66.根据条项65所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
67.根据条项55-66中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述启动子梯包含具有选自SEQ ID No.1到69的核苷酸序列的至少一个启动子。
产生终止子交换糖多孢菌菌株文库并将其用于改良生产性糖多孢菌菌株的表型性能
68.一种用于产生终止子交换糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个终止子;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始终止子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述终止子梯的所述终止子中的一个或多个。
69.一种用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个终止子;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始终止子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述终止子梯的所述终止子中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始终止子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续终止子交换糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续终止子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的终止子交换糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
70.根据条项69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是所述初始终止子交换糖多孢菌菌株文库的完整组合文库。
71.根据条项69到70中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是所述初始终止子交换糖多孢菌菌株文库的完整组合文库的子集。
72.根据条项69到71中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是前一终止子交换糖多孢菌菌株文库的完整组合文库。
73.根据条项69到72中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是前一终止子交换糖多孢菌菌株文库的完整组合文库的子集。
74.根据条项69到73中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续终止子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
75.根据条项69到74中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续终止子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
76.根据条项69到75中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
77.根据条项69到76中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
78.根据条项69到77中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
79.根据条项78所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
80.根据条项69到79中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述终止子梯包含具有选自SEQ ID No.70-80的核苷酸序列的至少一个终止子。
产生核糖体结合位点(RBS)交换糖多孢菌菌株文库并将其用于改良生产性糖多孢菌菌株的表型性能
81.一种用于产生核糖体结合位点(RBS)糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个RBS;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始RBS糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述RBS梯的所述RBS中的一个或多个。
82.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个RBS;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始RBS糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述RBS梯的所述RBS中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始RBS糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续RBS糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续RBS糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的RBS糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
83.根据条项82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是所述初始RBS糖多孢菌菌株文库的完整组合文库。
84.根据条项82到83中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是所述初始RBS糖多孢菌菌株文库的完整组合文库的子集。
85.根据条项82到84中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是前一RBS糖多孢菌菌株文库的完整组合文库。
86.根据条项82到85中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是前一RBS糖多孢菌菌株文库的完整组合文库的子集。
87.根据条项82到86中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续RBS糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
88.根据条项82到87中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e)直到与所述生产性糖多孢菌菌株的表型性能相比,后续RBS糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
89.根据条项82到88中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
90.根据条项82到89中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
91.根据条项82到90中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
92.根据条项91所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
93.根据条项82到92中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述RBS梯包含具有选自SEQ ID No.97到127的核苷酸序列的至少一个RBS。
产生转座子诱变糖多孢菌菌株文库并将其用于改良生产性糖多孢菌菌株的表型性能
94.一种用于产生转座子诱变糖多孢菌菌株多样性文库的方法,其包含
a)将转座子引入一种或多种基本糖多孢菌菌株的细胞群中;和
b)选择包含随机整合转座子的糖多孢菌菌株,由此创建包含多种个别糖多孢菌菌株的初始糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含一种或多种随机整合转座子。
95.根据条项94所述的方法,其进一步包含:
c).选择子序列糖多孢菌菌株文库,与所述基本糖多孢菌菌株的表型性能相比,其在测量的表型变量方面展现至少一次增加。
96.根据条项94到95中任一项所述的方法,其中使用转座子和转座酶蛋白的复合物将所述转座子引入到所述基本糖多孢菌菌株中,所述复合物允许所述转座子体内转位到所述糖多孢菌菌株的基因组中。
97.根据条项94到96中任一项所述的方法,其中所述转座酶蛋白源自EZ-Tn5转座体系统。
98.根据条项94到97中任一项所述的方法,其中所述转座子是功能缺失(LoF)转座子或功能获得(GoF)转座子。
99.根据条项94到98中任一项所述的方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
100.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.通过转座子诱变对基本微生物菌株的基因组进行工程改造,借此创建包含多种个别糖多孢菌菌株的初始转座子诱变糖多孢菌菌株文库,所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的每一种包含一种或多种转座子;
b.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始转座子诱变糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
c.提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续转座子诱变糖多孢菌菌株文库;
d.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续转座子诱变糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
e.按线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的转座子诱变糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
101.根据条项100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是所述初始转座子诱变糖多孢菌菌株文库的完整组合文库。
102.根据条项100到101中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是所述初始转座子诱变糖多孢菌菌株文库的完整组合文库的子集。
103.根据条项100到102中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是前一转座子诱变糖多孢菌菌株文库的完整组合文库。
104.根据条项100到103中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是前一转座子诱变糖多孢菌菌株文库的完整组合文库的子集。
105.根据条项100到104中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续转座子诱变糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
106.根据条项100到105中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续转座子诱变糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
107.根据条项100到106中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
108.根据条项100到107中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
109.根据条项108所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
110.根据条项109所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
111.根据条项100到110中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述转座子是功能缺失(LoF)转座子或功能获得(GoF)转座子。
112.根据条项111所述的方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
产生抗代谢物/发酵产物抗性糖多孢菌菌株文库并将其用于改良生产性糖多孢菌菌株的表型性能
113.一种用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其包含以下步骤:
a)选择对预先确定的代谢物和/或发酵产物具有抗性的糖多孢菌菌株,由此创建包含多种个别糖多孢菌菌株的初始糖多孢菌菌株文库,所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的至少一种产生对所述预先确定的代谢物和/或发酵产物的抗性;和
b)收集对所述预先确定的代谢物和/或所述发酵产物具有抗性的糖多孢菌菌株,以产生所述抗代谢物/发酵产物抗性糖多孢菌菌株文库。
114.根据条项113所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中所述预先确定的代谢物和/或发酵产物选自由以下组成的群组:参与刺糖菌素合成路径的分子、参与SAM/甲硫氨酸路径的分子、参与赖氨酸生产路径的分子、参与色氨酸路径的分子、参与苏氨酸路径的分子、参与乙酰基-CoA生产路径的分子和参与从头合成或补救嘌呤和嘧啶路径的分子。
115.根据条项113到114中任一项所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中:
1)参与刺糖菌素合成路径的所述分子是刺糖菌素,并且任选地,每种菌株对约50μg/m到约2mg/ml刺糖菌素J/L具有抗性;
2)参与SAM/甲硫氨酸路径的所述分子是α-甲基甲硫氨酸(aMM)或正亮氨酸,并且任选地每种菌株对约1mM到约5mMα-甲基甲硫氨酸(aMM)具有抗性;
3)参与赖氨酸生产路径的所述分子是硫杂赖氨酸或α-丁酮酸盐和天冬氨酸羟肟酸盐的混合物;
4)参与色氨酸路径的所述分子是氮杂丝氨酸或5-氟吲哚;
5)参与苏氨酸路径的所述分子是β-羟基正缬氨酸;
6)参与乙酰基-CoA生产路径的所述分子是浅蓝菌素,和
7)参与从头合成或补救嘌呤和嘧啶路径的所述分子是嘌呤或嘧啶类似物。
116.根据条项113到115中任一项所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其进一步包含以下步骤:
b).选择子序列糖多孢菌菌株文库,与所述基本糖多孢菌菌株的表型性能相比,其在测量的表型变量方面展现至少一次增加。
117.根据条项116所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中所述子序列糖多孢菌菌株文库中的每种菌株展现增加的刺糖菌素合成。
118.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a)提供包含多种个别糖多孢菌菌株的初始抗代谢物/发酵产物抗性糖多孢菌菌株文库,所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的每一种包含基因变异中的一种或多种,其中所述基因变异赋予对预先确定的代谢物或发酵产物的抗性;
b)针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
c)提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续抗代谢物/发酵产物抗性糖多孢菌菌株文库;
d)针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
e)按线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的抗代谢物/发酵产物抗性糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
119.根据条项118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库。
120.根据条项118到119中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库的子集。
121.根据条项118到120中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是前一抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库。
122.根据条项118到122中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是前一抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库的子集。
123.根据条项118到122中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续抗代谢物/发酵产物抗性糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
124.根据条项118到123中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续抗代谢物/发酵产物抗性糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
125.根据条项118到124中任一项所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
126.根据条项125所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
127.根据条项126所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
128.根据条项127所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
糖多孢菌宿主细胞和菌株文库
129.一种糖多孢菌宿主细胞,其包含可操作地连接到所述宿主细胞的内源基因的启动子,其中所述启动子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ IDNo.1-69组成的群组的序列。
130.根据条项129所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
131.根据条项129到130中任一项所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述启动子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞的表型性能具有所期望水平的改良的表型性能。
132.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含可操作地连接到所述宿主细胞的内源基因的启动子,其中所述启动子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ ID No.1-69组成的群组的序列。
133.一种糖多孢菌宿主细胞,其包含连接到所述宿主细胞的内源基因的终止子,其中所述终止子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ ID No.70-80组成的群组的序列。
134.根据条项133所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
135.根据条项133到134中任一项所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述启动子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞的表型性能具有所期望水平的改良的表型性能。
136.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含连接到所述宿主细胞的内源基因的终止子,其中所述终止子对于所述内源基因是异源的,其中所述终止子具有选自由SEQ ID No.70-80组成的群组的序列。
137.一种糖多孢菌宿主细胞,其包含可操作地连接到所述宿主细胞的内源基因的核糖体结合位点,其中所述核糖体结合位点对于所述内源基因是异源的,其中所述核糖体结合位点具有选自由SEQ ID No.97-127组成的群组的序列。
138.根据条项137所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
139.根据条项137到138中任一项所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述RBS的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞的表型性能具有所期望水平的改良的表型性能。
140.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含连接到所述宿主细胞的内源基因的核糖体结合位点,其中所述核糖体结合位点对于所述内源基因是异源的,其中所述核糖体结合位点具有选自由SEQ ID No.97-127组成的群组的序列。
141.一种糖多孢菌宿主细胞,其包含转座子,其中与不具有所述转座子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞的表型性能具有所期望水平的改良的表型性能。
142.根据条项141所述的糖多孢菌宿主细胞,其中所述转座子是功能缺失(LoF)转座子或功能获得(GoF)转座子。
143.根据条项142所述的糖多孢菌宿主细胞,其中所述功能获得(GoF)转座子包含启动子、反向选择标记和/或溶解性标签。
144.根据条项141到143中任一项所述的糖多孢菌宿主细胞,其中所述转座子包含选自由SEQ ID No.128-131组成的群组的序列。
145.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含具有选自由SEQ ID No.128-131组成的群组的序列的转座子,其中每种菌株中的所述转座子在不同基因组基因座处。
146.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含引起所述菌株对以下具有抗性的基因变异
1)参与刺糖菌素合成路径的分子,
2)参与SAM/甲硫氨酸路径的分子,
3)参与赖氨酸生产路径的分子,
4)参与色氨酸路径的分子,
5)参与苏氨酸路径的分子,
6)参与乙酰基-CoA生产路径的分子,和/或
7)参与从头合成或补救嘌呤和嘧啶路径的分子。
147.根据条项146所述的糖多孢菌菌株文库,其中:
1)参与刺糖菌素合成路径的所述分子是刺糖菌素;
2)参与SAM/甲硫氨酸路径的所述分子是α-甲基甲硫氨酸(aMM)或正亮氨酸;
3)参与赖氨酸生产路径的所述分子是硫杂赖氨酸或α-丁酮酸盐和天冬氨酸羟肟酸盐的混合物;
4)参与色氨酸路径的所述分子是氮杂丝氨酸或5-氟吲哚;
5)参与苏氨酸路径的所述分子是β-羟基正缬氨酸;
6)参与乙酰基-CoA生产路径的所述分子是浅蓝菌素;和
7)参与从头合成或补救嘌呤和嘧啶路径的所述分子是嘌呤或嘧啶类似物。
148.根据条项147所述的糖多孢菌菌株文库,其中所述分子是刺糖菌素J/L,并且其中每种菌株对约50μg/ml到约2mg/ml刺糖菌素J/L具有抗性。
149.根据条项147所述的糖多孢菌菌株文库,其中所述分子是α-甲基甲硫氨酸(aMM),其中每种菌株对约1mM到约5mM aMM具有抗性。
150.一种糖多孢菌菌株,其包含报告基因,其中所述报告基因选自由以下组成的群组:
a)编码绿色荧光报告蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达;
b)编码绿色荧光报告蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达;和
c)编码β-葡糖醛酸酶(gusA)蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达。
151.根据条项150所述的糖多孢菌菌株,其中:
a)所述绿色荧光报告蛋白具有氨基酸序列SEQ ID No.143;
b)所述红色荧光报告蛋白具有氨基酸序列SEQ ID No.144;和
c)所述gusA蛋白具有氨基酸序列SEQ ID No.145。
152.根据条项150所述的糖多孢菌菌株,其中:
a)编码所述绿色荧光报告蛋白的所述基因具有序列SEQ ID No.81;
b)编码所述红色荧光报告蛋白的所述基因具有序列SEQ ID No.82;和
c)编码所述gusA蛋白的所述基因具有序列SEQ ID No.83。
153.根据条项150到153中任一项所述的糖多孢菌菌株,其中所述菌株包含编码所述绿色荧光报告蛋白的所述基因和编码所述红色荧光报告蛋白的所述基因,其中所述绿色荧光报告蛋白和所述红色荧光报告蛋白的荧光激发和发射光谱彼此不同。
154.根据条项150到153中任一项所述的糖多孢菌菌株,其中所述菌株包含编码所述绿色荧光报告蛋白的所述基因和编码所述红色荧光报告蛋白的所述基因,其中所述绿色荧光报告蛋白和所述红色荧光报告蛋白的荧光激发和发射光谱与所述糖多孢菌菌株的内源荧光不同。
155.一种糖多孢菌菌株,其包含整合于所述糖多孢菌菌株的基因组中的一种或多种中性整合位点中的DNA片段,其中所述中性整合位点选自具有选自SEQ ID No.132-142的序列的基因组片段或与SEQ ID No.132-142中的任一个同源的基因组片段中的位置的群组。
156.根据条项155所述的糖多孢菌菌株,其中与不具有整合DNA片段的参考糖多孢菌菌株的所述表型性能相比,所述糖多孢菌菌株具有期望水平的改良表型性能。
157.根据条项156所述的糖多孢菌菌株,其中与不具有整合DNA片段的参考糖多孢菌菌株的所述表型性能相比,所述糖多孢菌菌株具有期望水平的改良刺糖菌素产生。
158.根据条项155到157中任一项所述的糖多孢菌菌株,其中整合DNA片段包含编码报告蛋白的序列。
159.根据条项155到158中任一项所述的糖多孢菌菌株,其中整合DNA片段包含转座子。
160.根据条项155到159中任一项所述的糖多孢菌菌株,其中整合DNA片段包含附着位点(attB),其可以由其对应整合酶识别。
用于将DNA片段整合于糖多孢菌菌株中的中性整合位点(NIS)
161.一种将DNA片段整合于糖多孢菌菌株的基因组中的方法,其中将所述DNA片段整合于所述糖多孢菌菌株的所述基因组中的中性整合位点中,其中所述中性整合位点选自具有选自SEQ ID No.132-142的序列的基因组片段或与SEQ ID No.132-142中的任一个同源的基因组片段中的位置的群组。
162.根据条项161所述的将DNA片段整合于糖多孢菌菌株的基因组中的方法,其中所述DNA片段包含附着位点(attB),其可以由其对应整合酶识别。
163.一种用于快速合并源自至少两种亲代糖多孢菌菌株的基因突变的方法,其包含以下步骤:
(1)提供至少两种亲代糖多孢菌菌株,其中每种菌株包含不存在于其它菌株中的独特基因组突变;
(2)由所述亲代菌株中的每一种制备原生质体;
(3)从所述亲代菌株融合所述原生质体以产生融合原生质体,其包含两种亲代糖多孢菌菌株的所述基因组,其中在每种亲代菌株的所述基因组之间发生同源重组;
(4)从步骤(3)中所产生的所述融合原生质体回收糖多孢菌细胞;和
(5)选择糖多孢菌细胞,其包含第一亲代糖多孢菌菌株的所述独特基因组突变;和
(6)针对第二亲代菌株的所述独特基因组突变的存在对步骤(5)中所获得的所述糖多孢菌细胞进行基因分型,
由此获得新糖多孢菌菌株,其包含源自两种亲代糖多孢菌菌株的所述独特基因组突变。
164.根据条项163所述的方法,其中所述独特基因组突变中的一种连接到可选标记,而另一所述独特基因组突变未连接到任何可选标记。
165.根据条项164所述的方法,其中在步骤(3)中,初始含有连接到所述可选标记的所述独特基因组突变的所述染色的原生质体:初始含有未连接到所述可选标记的所述独特基因组突变的所述染色的原生质体的比率小于1:1。
166.根据条项165所述的方法,其中比率是约1:10到约1:100或更小。
167.根据条项163到166中任一项所述的方法,其中在步骤(4)中,将原生质体细胞涂铺于经渗透稳定的培养基上,而不使用琼脂覆层。
168.根据条项163到167中任一项所述的方法,其中当所述独特基因组突变中的一种连接到可选标记以产生对所述选择药物的抗性时,通过将所述适当选择药物抗生素上覆于生长细胞上来完成步骤(5)。
169.根据条项163到168中任一项所述的方法,其中当所述独特基因组突变均未连接到可选标记时,通过基因分型完成步骤(5)。
170.根据条项163到170中任一项所述的方法,其中将源自超过两种菌株的基因突变在单一合并过程中随机合并。
171.根据条项163到171中任一项所述的方法,其中在步骤(2)中,初始通过在约5000xg速度下离心约5分钟来收集所述原生质体。
172.根据条项163到172中任一项所述的方法,其中所述方法不包含通过脱脂棉过滤所述原生质体。
173.根据条项163到173中任一项所述的方法,其中在R2YE培养基而不是顶层琼脂上回收所述融合原生质体。
174.根据条项173所述的方法,其中所述R2YE培养基包含0.5M山梨糖醇和0.5M甘露糖。
在糖多孢菌菌株中进行的靶基因组编辑
175.一种在糖多孢菌菌株中进行靶基因组编辑的方法,其包含:
a)将质粒引入到基本糖多孢菌菌株中,所述质粒包含选择标记、反向选择标记、与待编辑的所述糖多孢菌菌株的基因组基因座具有同源性的DNA片段和质粒骨架序列;
b)基于所述基因组中存在所述选择标记选择具有整合事件的糖多孢菌菌株;
c)基于不存在所述反向选择标记基因选择所述质粒骨架环出的糖多孢菌菌株,其中所述反向选择标记是sacB基因或pheS基因。
176.根据条项175所述的方法,其中与不进行编辑的所述亲代菌株相比,具有经编辑的基因组的所得糖多孢菌菌株具有较好性能。
177.根据条项176所述的方法,其中与不进行编辑的所述亲代菌株相比,所得糖多孢菌菌株具有增加的刺糖菌素产生。
178.根据条项175到177中任一项所述的方法,其中所述sacB基因针对刺糖多孢菌经密码子优化。
179.根据条项178所述的方法,其中所述sacB基因编码与由SEQ ID No.146编码的氨基酸序列具有90%序列一致性的氨基酸序列。
180.根据条项175到177中任一项所述的方法,其中所述pheS基因针对刺糖多孢菌经密码子优化。
181.根据条项180所述的方法,其中所述pheS基因编码与由SEQ ID No.147或SEQID No.148编码的氨基酸序列具有90%序列一致性的氨基酸序列。
使用接合将遗传物质从供体微生物细胞转移到糖多孢菌微生物的受体细胞
182.一种将遗传物质从供体微生物细胞转移到糖多孢菌微生物的受体细胞的方法,其中所述方法包含以下步骤:
1)任选地,将受体细胞继代培养到指数后期或稳定期;
2)任选地,将供体细胞继代培养到指数中期;
3)组合供体和受体细胞;
4)将供体和受体细胞混合物涂铺于接合培养基上;
5)培育板以使细胞接合;
6)施加针对供体细胞的抗生素选择;
7)施加针对未整合的受体细胞的抗生素选择;和
8)进一步培育板以使整合受体细胞生长。
183.根据条项182所述的方法,其中所述供体微生物细胞是大肠杆菌细胞。
184.根据条项182到183中任一项所述的方法,其中利用以下条件中的至少两个、三个、四个、五个、六个、七个或更多个:
1)在接合之前,洗涤受体细胞;
2)在约30℃的温度下接合供体细胞和受体细胞;
3)在接合之前,将受体细胞继代培养至少约48小时;
4)用于接合的供体细胞:受体细胞的比率是约1:0.6到1:1.0;
5)将所述供体细胞和所述受体细胞混合之后约15至24小时,将用于针对所述供体细胞的选择的抗生素药物递送到所述混合物;
6)将所述供体细胞和所述受体细胞混合之后约40至48小时,将用于针对所述受体细胞的选择的抗生素药物递送到所述混合物;
7)将涂铺有供体和受体细胞混合物的所述接合培养基干燥至少约3小时到10小时;
8)所述接合培养基包含至少约3g/L葡萄糖;
9)供体细胞的浓度是约OD600=0.1到0.6;
10)受体细胞的浓度是约OD540=5.0到15.0。
185.根据条项184所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是萘啶酸,并且浓度是约50到约150μg/ml。
186.根据条项185所述的方法,其中用于针对所述供体细胞的选择的所述抗生素药物是萘啶酸,并且浓度是约100μg/ml。
187.根据条项184所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是安普霉素,并且浓度是约50到约250μg/ml。
188.根据条项187所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是安普霉素,并且浓度是约100μg/ml。
189.根据条项182到188中任一项所述的方法,其中所述方法以高通量过程执行。
190.根据条项189所述的方法,其中所述方法在48孔Q型托盘上执行。
191.根据条项189所述的方法,其中所述高通量过程是自动化的。
192.根据条项191所述的方法,其中供体细胞和受体细胞的所述混合物是液体混合物,并利用摇摆运动将足够体积的所述液体混合物涂铺于所述培养基上,其中所述液体混合物分散在所述培养基的整个区域上。
193.根据条项191所述的方法,其中所述方法包含通过用酵母针进行菌落挑选来转移接合后体,以供用所述供体细胞所提供的整合DNA进行后续受体细胞接种的自动化过程。
194.根据条项193所述的方法,其中所述菌落挑选以升沉运动或搅拌运动执行。
195.根据条项184到194中任一项所述的方法,其中所述接合培养基是包含约3-10g/L葡萄糖的改良型ISP4培养基。
196.根据条项184到194中任一项所述的方法,其中所述混合物中供体细胞或受体细胞的总数是约5×106到约9×106
197.根据条项182到196中任一项所述的方法,其中利用以下条件中的至少四个执行所述方法:
1)在接合之前,洗涤受体细胞;
2)在约30℃的温度下接合供体细胞和受体细胞;
3)在接合之前,将受体细胞继代培养至少约48小时;
4)用于接合的供体细胞:受体细胞比率是约1:0.8;
5)将所述供体细胞和所述受体细胞混合之后约20小时,将用于针对所述供体细胞的选择的抗生素药物递送到所述混合物;
6)所述混合物中的所述供体细胞的量或所述受体细胞的量是约7×106;和
7)所述接合培养基包含约6g/L葡萄糖。
在糖多孢菌菌株中进行靶基因组编辑的无痕方法
198.一种在糖多孢菌菌株中进行靶基因组编辑,产生在靶基因组基因座处含有基因变异的无痕糖多孢菌菌株的方法,其包含:
a)将质粒引入糖多孢菌菌株中,所述质粒包含:
i.选择标记,
ii.反向选择标记,
iii.含有待整合于靶基因座处的所述糖多孢菌基因组中的基因变异的DNA片段,所述DNA片段具有侧接所需基因变异的所述靶基因组基因座的同源臂,
iv.质粒骨架序列;
b)基于所述基因组中存在所述选择标记选择已经历初始同源重组并具有整合于所述靶基因座中的所述基因变异的糖多孢菌菌株;和
c)基于不存在所述反向选择标记选择具有整合于所述靶基因座中的所述基因变异,但经历使所述质粒骨架环出的另外的同源重组的糖多孢菌菌株,
其中所述靶基因组基因座可包含所述糖多孢菌基因组的任何区域,包括不含编码DNA模组的重复区段的基因组区域。
199.根据条项198所述的方法,其中所述质粒不包含温度敏感型复制子。
200.根据条项198到199中任一项所述的方法,其中所述质粒不包含复制起点。
201.根据条项198到200中任一项所述的方法,其中在不复制整合质粒的情况下执行选择步骤(c)。
202.根据条项198到201中任一项所述的方法,其中所述质粒是单一同源重组载体。
203.根据条项198到202中任一项所述的方法,其中所述质粒是双重同源重组载体。
204.根据条项198到203中任一项所述的方法,其中所述反向选择标记是sacB基因或pheS基因。
205.根据条项204所述的方法,其中所述sacB基因或pheS基因针对刺糖多孢菌经密码子优化。
206.根据条项205所述的方法,其中所述sacB基因编码与由SEQ ID NO.146编码的氨基酸序列具有90%序列一致性的氨基酸序列。
207.根据条项205所述的方法,其中所述pheS基因编码与由SEQ ID NO.147或SEQID NO.148编码的氨基酸序列具有90%序列一致性的氨基酸序列。
208.根据条项198到207中任一项所述的方法,其中通过转化将所述质粒引入所述糖多孢菌菌株中。
209.根据条项198到208中任一项所述的方法,其中所述转化是原生质体转化。
210.根据条项198到209中任一项所述的方法,其中通过接合将所述质粒引入所述糖多孢菌菌株中,其中所述糖多孢菌菌株是受体细胞,并且包含所述质粒的供体细胞将所述质粒转移到所述糖多孢菌菌株。
211.根据条项198到210中任一项所述的方法,其中所述接合是基于包含所述质粒的大肠杆菌供体细胞。
212.根据条项198到211中任一项所述的方法,其中所述靶基因座是所述糖多孢菌菌株中与所关注化合物的产生相关的基因座。
213.根据条项198到212中任一项所述的方法,其中与不具有所述基因组编辑的对照菌株相比,所述所得糖多孢菌菌株具有增加的所关注化合物的产生。
214.根据条项212或213所述的方法,其中所述所关注化合物是刺糖菌素。
215.根据条项198到214中任一项所述的方法,其中所述方法作为高通量程序执行。
以引用的方式并入
本文中所引用的所有参考文献、论文、公开、专利、专利公开以及专利申请以全文引用的方式并入以用于所有目的。然而,本文引用的任何参考文献、论文、公开、专利、专利公开以及专利申请的提及不视为并且不应该视为承认或以任何形式表明其构成有效的现有技术或形成世界上任何国家的公共常识的一部分。
此外,2016年12月07日提交的国际申请第PCT/US2016/065464号(其要求2015年12月07日提交的美国临时申请第62/264,232号的优先权);2016年4月27日提交的美国非临时申请第15/140,296号;2017年4月27日提交的国际申请第PCT/US2017/29725号;2016年12月30日提交的美国非临时申请第15/396,230号;及2016年7月29日提交的美国临时申请第62/368,786号均以全文引用的方式并入本文中,包括所有描述、参考文献、图式及权利要求书以用于所有目的。
序列表
<110> 齐默尔根公司(Zymergen Inc.)
B•梅森(Mason, Benjamin)
A•戈拉诺夫(Goranov, Alexi)
P•凯利(Kelly, Peter)
Y•基姆(Kim, Youngnyun)
S•莫迪(Modi, Sheetal)
N•帕苏马尔蒂(Pasumarthi, Nihal)
B•米基特斯(Mijts, Benjamin)
P•埃涅尔特(Enyeart, Peter)
<120> 用于改良刺糖多孢菌的高通量(HTP)基因组工程改造平台
<130> ZYMR-013/01WO 327574-2059
<150> US 62/515,934
<151> 2017-06-06
<160> 175
<170> PatentIn version 3.5
<210> 1
<211> 141
<212> DNA
<213> 刺糖多孢菌
<400> 1
gccgcaccaa gcgagcaatg ccgccccggc ggtcccgacc gcgggacccc ggggcggtcg 60
cacgtccggg gcagcgggac ttgtcgatgg aacaggtacg gcctcaatag atcaggtacc 120
gatgaagggc tgttggaatc a 141
<210> 2
<211> 198
<212> DNA
<213> 刺糖多孢菌
<400> 2
ggaccgagcg ggaggcaacg cctcgcgaag gcgaccgggg agcaatcccc tccagttcgg 60
cggcggacgg gccgccaccc cgcaaggaca gtgttcttcc gggatcggcg gcccgctcgt 120
cacctacccg acaggactcc gcctggcaca acaagtcgta cggcggaaag ttaacaagtc 180
caggaggaca atccagtg 198
<210> 3
<211> 232
<212> DNA
<213> 刺糖多孢菌
<400> 3
gggactgttt gaaagtggct agcgtagcgg tgcgggtagc ggaacctcag aggccttctc 60
gctctgggat ccccgacatc atgaatgcca attcaccagg tcggggctgt cctcgcgaga 120
agacccctga gaacccgcgg cggtgcgagt tgagtcccac accgcaagcg gctaccgccg 180
cttataagac aggctctaac cgagtgaaag gcgctgagag ttgagcaccc tc 232
<210> 4
<211> 361
<212> DNA
<213> 刺糖多孢菌
<400> 4
tagaaactgt tcatcgactg gctccgcgtg gcggtgcgga tagcggaacc taaaattctc 60
gctgtgggat ccccgacatc atgaatgcca ttcacctagt cgggggtgtc ctcgcgagat 120
ggctcggcgt gtggggtgtc ctcgcaggac actgttgaga acccgcggcg gcggtgcgag 180
ttgcgcgcgt gggctaagcg gcttcgccgc ttgaaagaca aagacgtagc gggagtgagt 240
gccagggcgg gccgttgtcc gctttggcac tcgcgtccgt ttcgggggcc ggtggtcggc 300
ggactgcggg gttctggttc gatcttgggt cgtagctccg ggtaattccc ggggatctac 360
c 361
<210> 5
<211> 303
<212> DNA
<213> 刺糖多孢菌
<400> 5
tcgcccacag gacaggaaca cagcgtgtcg atgaaacgtc atactggtgt tggacgaaaa 60
cccagatgga gcagtaccga gcaaagtcga cttcgagtgg ggcatttcga gtgcggtcga 120
tgatcattga cgcgagtgga ccggggctca ttccccgcaa gctggtcttt cctgatcgat 180
tttgtgaccg acctcgtcga acgaacggcc gtactgtgtg tcaacctcgc gaatcgggcc 240
gctagcctgg tacctgagtg tgtctgtaaa tcacgagcat atggatcgag gcgaacgcca 300
gcc 303
<210> 6
<211> 253
<212> DNA
<213> 刺糖多孢菌
<400> 6
ctggcgaggt gccgaccata actcgatcta cacgagcgtg gacttgcaac gttgaccgtt 60
tacatccgtg tagatatcct cgtcggagtc cggccaggga gatggcgtct gcacgtcgac 120
gatgctgccc ggcggaccgc tttgccagcc gaaggatgag cgccgtgacg gtgtcgtcaa 180
ccaaaccggc ccgctgtgcg acgaggcggc ttcccgcccg cggcacgggg tcacgcacga 240
aaggagtgcg gcg 253
<210> 7
<211> 168
<212> DNA
<213> 刺糖多孢菌
<400> 7
tatccacgcg ctgtggttct cgtgggcacc ctctgcccac agcaaaagaa gatctttcgt 60
cgctgcgcag ttctagcgga aggatattgt gtagatgcgg atttctgatg taatttttct 120
tgacaagtga tgcggggcac cgcaccacac ggcgccggga ggccgaac 168
<210> 8
<211> 363
<212> DNA
<213> 刺糖多孢菌
<400> 8
ctgctcgcca tactcaacga cattcttccg tcactggaaa cgacgaaggc gatgtcgctg 60
cccgaaagtg tggctacaat acgggacctc ggcatcgtaa tgggctccgt caagaggcac 120
ggcgttgaac cagtggtcgc gattcccgaa ctggaagcgc cgttgcgtgc cataggcgaa 180
cgcaccggca tgatcccacg ggacaccatc catcactaca tacggtggaa tccgacgggg 240
cggcgtgagc gcatgtacac gggcgagccg atggagaagt tgctcatggc ctctgtgcgc 300
atcagtttgc ccaggctgag cgctgctgtc gatgtgtgca ccgctctgca caccgccgag 360
gcc 363
<210> 9
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 9
gcctttttgc cgaaatcgcg cggccagttc gtccaatgcg caagtcgcga tctccggcgg 60
cgcggtgcga agcggccgcg cggtgcaggt gaccccacag tctttccggg gcggttcttg 120
gcggggttcg gcgcgaaggg attcaagatc gttcttctga aacgtccaag acatcgatct 180
ttgtgccgct tttaacgtgt tcgactgcgt tgccgccctc cgcctcttgg cggaactggc 240
agtcttaagg tggaacctgt tggcacaatg aggtgccgtc aagcgtggag ctgcctgaag 300
<210> 10
<211> 322
<212> DNA
<213> 刺糖多孢菌
<400> 10
gcgaacgcaa gccatttcgg cgcgggccag gccgtgtcgg gtcgggctgg gtgcgggcgg 60
gcttacctgc gcaactctgg ctgtgcaagg gatcgcttat ccgccatgcc atcaggttga 120
ccagctctcc gagtgcagtc gtcggctgcc ggcagggcgt tgacatcggg cgctttgacg 180
ccagcggggt gaggtgatgt gtacaagcgc cgttgccgac gggtggatct tgctcgcggc 240
ttcggcgcag acaggttcgg cgaaaactac tcttgcgtgc tcggataatc cgtgctcgga 300
ttacatgcgg aggtggtcaa cg 322
<210> 11
<211> 149
<212> DNA
<213> 刺糖多孢菌
<400> 11
ctcaggatct ggacactaaa ttccatcttt tgggtgaaag ttgactggaa cgatttagaa 60
ggtgacggct ttgtgacggg gcattgctgt gaaatggttc tcacttatgt ttacgctcgt 120
ctgacgcggc ggtgaatgat ccgccgcgc 149
<210> 12
<211> 199
<212> DNA
<213> 刺糖多孢菌
<400> 12
acgacggagc gaccctaaca tcgacacacc ggtcgcctcc cgtgacagca cgaccgaaga 60
atctaaagct gcccttttta actagagaat tctgaacaaa aaggcaagat gtcaccctgg 120
tcacaatccg gccttccgcg cgcggcattg acgcggtaaa gtcccgggtc gccatcgaca 180
cgaggcaggg tgccctggc 199
<210> 13
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P21
<400> 13
tgtgcgggct ctaacacgtc ctagtatggt aggatgagca a 41
<210> 14
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PA9
<400> 14
ccgggcggct tcctcatgct tgacttgact aggataaagg g 41
<210> 15
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PA3
<400> 15
tagcagggct ccaaaactaa cgcctgatgt aggatcagat g 41
<210> 16
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PB4
<400> 16
gctgtaggct gttaatatat ttcggtgtgt aggatacggg c 41
<210> 17
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PB12
<400> 17
cgggatggct tatgaaggat tgtctcactt aggatagagc a 41
<210> 18
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PB1
<400> 18
cgtcagggct actctggcaa ccaagcgatt aggattgaag g 41
<210> 19
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子PC1
<400> 19
actttcggct aaaaagcaat tcattcaatt aggatggaag a 41
<210> 20
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P72
<400> 20
ctaattggct acgtcataga gagattcttt aggatgagaa a 41
<210> 21
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P-C4-1
<400> 21
ggcaactagg ttgacgtatt tttccgttag gcctagggtg agtg 44
<210> 22
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P-A5-19
<400> 22
tatgcgttgc ttgaccaaac ctatgtatag ggatagggtt ggtc 44
<210> 23
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P-C4-14
<400> 23
ccctcgctgg ttgacacagt tagtcagatt gcctacgatt tcgt 44
<210> 24
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子P-D1-7
<400> 24
aattgcccac ttgacgttga gagtgaagca atataggtta acct 44
<210> 25
<211> 242
<212> DNA
<213> 刺糖多孢菌
<400> 25
aaccactgcg acgagcggta tttgggggaa gtaaagaggt gacccacgac tcactgtcgg 60
tgatcgatat cgacccggaa acgacttgat aacgacgctc tgatcagcac aaataccccg 120
gatcgaagca cccaccccca ctgttactgt gatcagcgtc acatgatctc aggtttccga 180
tctccgtgtt ggttacgtag tgtcgctcct cggtcggccc cgaaccgatc agcaaggagc 240
gg 242
<210> 26
<211> 65
<212> DNA
<213> 刺糖多孢菌
<400> 26
cagcaaacct gtggaccatc accaacaccg aaacgtctaa tgggcaagtc aaccttcgcg 60
gcgaa 65
<210> 27
<211> 201
<212> DNA
<213> 刺糖多孢菌
<400> 27
tccggtggcc tggtcaaacg ccgccgggca cggcgtctgg tatctctgaa tgtgtgacga 60
tgacggcccc ctccccccac tcgctgttca acgatcttcc cttgcccggt acggtgagct 120
cggcgtggcg tgcgaggcac gcgatttccg ccggacaaat ccgaatcgct tgaacgcgta 180
acaccagggc tgctgtctgc g 201
<210> 28
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 28
gcggcaaacc gtcgcagaca ccccgaaacg tcgtgatcgt cctgccctac tgcccttgtg 60
aagatcgtct cggatcttcg ctcgtggtcc cacctccatt ccggtggcct ggtcaaacgc 120
cgccgggcac ggcgtctggt atctctgaat gtgtgacgat gacggccccc tccccccact 180
cgctgttcaa cgatcttccc ttgcccggta cggtgagctc ggcgtggcgt gcgaggcacg 240
cgatttccgc cggacaaatc cgaatcgctt gaacgcgtaa caccagggct gctgtctgcg 300
<210> 29
<211> 220
<212> DNA
<213> 刺糖多孢菌
<400> 29
ctgaatgcag ccgtaagtta ttggatcacc taggaatcgg gtcacttttc ccctgccgga 60
atgtgtgcct gcttacttag cgtgccttgt tcacctctcg ttcacttcga tggcggcgat 120
cgtccactcc gactccttag cgtccgtgtc gagcggccaa agcacgagcc tgcgcgaggc 180
tcggccgcgc aaccgcaggg tttccaactg gaggaacgaa 220
<210> 30
<211> 177
<212> DNA
<213> 刺糖多孢菌
<400> 30
acttttcccc tgccggaatg tgtgcctgct tacttagcgt gccttgttca cctctcgttc 60
acttcgatgg cggcgatcgt ccactccgac tccttagcgt ccgtgtcgag cggccaaagc 120
acgagcctgc gcgaggctcg gccgcgcaac cgcagggttt ccaactggag gaacgaa 177
<210> 31
<211> 200
<212> DNA
<213> 刺糖多孢菌
<400> 31
gtgattccgg ctagactgct actttgcgct gccctctttc cgtctgtcct gcaccggacc 60
gtaggatggt gggcgccatt gcacccttga cagctgtgtt agcggagtgt gacagcggat 120
acggaccccg tcggtcgcat tcgccgggca cctttcgccg acgcggctgt agccagttca 180
gagtcccgga aggacgcatc 200
<210> 32
<211> 299
<212> DNA
<213> 刺糖多孢菌
<400> 32
tgatcgaagc gtgatctctt gactggcggc gcgcgcgggt tcactctagt cctcaacgcg 60
gggctgggct gccgtcggtg tgccccctcg acagctggcg tgattccggc tagactgcta 120
ctttgcgctg ccctctttcc gtctgtcctg caccggaccg taggatggtg ggcgccattg 180
cacccttgac agctgtgtta gcggagtgtg acagcggata cggaccccgt cggtcgcatt 240
cgccgggcac ctttcgccga cgcggctgta gccagttcag agtcccggaa ggacgcatc 299
<210> 33
<211> 240
<212> DNA
<213> 刺糖多孢菌
<400> 33
cgctccgccg catcggttac ggcgcttgca ctcgactggc gagagtgcta aacacggtat 60
tggcactcag caaggttgag tgccaggtcg ggacggtgag gccgtctccg gcggtgccac 120
cagacggcgc cgccgcacgg tcgtccgtcg cgggcaccga gcctggccga gcacgagtcc 180
tgccgtgggg tgcgcaaacc caccaccgcg gcgtccagac aggtggagga ccacaccgca 240
<210> 34
<211> 242
<212> DNA
<213> 刺糖多孢菌
<400> 34
accggatcag cagttccacg ccgatctaat aaggaccaac tcggctcggc ggaagtccgg 60
taggagcgaa gttactgtcc tcagaggtct gaggtccagt ggaagaggcg acgaaacaag 120
gagattcgtc tctcaccgta aagagtgaaa aaatctagcg aggcggctga cggctttcgg 180
ttcgacttgc gagtcggcta ggttcgtgat cacgaactcc gattgaaggt cctaacagga 240
gt 242
<210> 35
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 35
ctccagccac agccggagca tctccctgat ctcgatcacc gaaacctccc ggtagctcat 60
tccgccaata cgagcggccg agcgaccgga aaccccgcag ccacgccggg cggtcccata 120
actggcaaac caccagccca gacggtccca tcagtggcaa acaggtggtc ccatgctcct 180
ggcaaaaccg gctctgaggt ggtcccttac tcctggcagc cgacaggcgt cgttgcgcag 240
tggcggacag ggcacggatg actcctatga ggtagtcgat tacgtgctac cgtctacgcc 300
<210> 36
<211> 359
<212> DNA
<213> 刺糖多孢菌
<400> 36
ggcggactaa gacttaggtc tacctaagcg cggtgcaact taacccagcg ttccgcgcgg 60
cacaagcacc ttgttcgaaa ccgggttcca ggtcacctgg aaacccattt gagaccggat 120
cgacgcactt tcccacgcct atacgggtat ctggcgaatg gcggaatctg actttgggtt 180
cggcagtgac ctggacttat atgtcgatgt gcgcatcagt cgacgtgata ctcgcgacta 240
accgcaggtg atttgccgaa cgggtctgcg tatttccctg cggcgagtta gggtgccctt 300
gcttgccttg aacattgctc tacctcatca ggactccttc gaagggaagt gagctgctc 359
<210> 37
<211> 433
<212> DNA
<213> 刺糖多孢菌
<400> 37
aaccactgcg acgagcggta tttgggggaa gtaaagaggt gacccacgac tcactgtcgg 60
tgatcgatat cgacccggaa acgacttgat aacgacgctc tgatcagcac aaataccccg 120
gatcgaagca cccaccccca ctgttactgt gatcagcgtc acatgatctc aggtttccga 180
tctccgtgtt ggttacgtag tgtcgctcct cggtcggccc cgaaccgatc agcaaggagc 240
ggaagcccgc agcgccgaac cctgtccagc aggcttccag accccgaaac gaagaacacc 300
ggacagggac gggggaccca acacccgggc tccccgaagc cctaggggtg aagccggctc 360
ccccgagccg gccgggctgc ctctcagccc gaacccgaca gctcacctcg caggcgcggc 420
aggagagagg aac 433
<210> 38
<211> 115
<212> DNA
<213> 刺糖多孢菌
<400> 38
gggcgcgccg caattcgatg acgttcatgc gccgtgtcgg ggaatcgccg gtggcggcgc 60
cagcagagac tgaacttact ggtggtgtgt ccaggaatcg gaggggcagt accga 115
<210> 39
<211> 496
<212> DNA
<213> 刺糖多孢菌
<400> 39
acttcggacc ccagtctctt tcccccgatt agcgcagcag cccctactcc cattggccag 60
gatttggaaa atgcgctgcg tatgtcgatc gccgttgacg tccaacggac ttccggcggc 120
aacaatagtg tgtcacggca ggaatgtcac gcgaccatcg aagatctttg ggtcgccgca 180
cctggtttca cgcgaacgag tgaaatgcgc gagctccgct cgatcggggt gggccggacc 240
tgtacggtga tcaccgttgg ttctgcgggg attcatgggg aagatttgcg ctggctgttt 300
gcctcctggc cggatagtta tagtcggtac cgccgcatgc ggcggtaacc gcgaattaac 360
tgacggctag tttgccgtct tttctctctg tgtgtttcct gctcggttcc agaaaattac 420
gagaaggtga acgttgcaga gatcaggcat accggtgttg ccaggtggcg caccaacatc 480
gcagcaggtt gggcag 496
<210> 40
<211> 202
<212> DNA
<213> 刺糖多孢菌
<400> 40
cactcgttcg cgtgaaacca ggtgcggcga cccaaagatc ttcgatggtc gcgtgacatt 60
cctgccgtga cacactattg ttgccgccgg aagtccgttg gacgtcaacg gcgatcgaca 120
tacgcagcgc attttccaaa tcctggccaa tgggagtagg ggctgctgcg ctaatcgggg 180
gaaagagact ggggtccgaa gt 202
<210> 41
<211> 379
<212> DNA
<213> 刺糖多孢菌
<400> 41
gaactctccg atcgcaattg aacacccggg aagcatgcca agaatcacag aaatctctga 60
tatcccccgg gaaacgccgc tttcgcaagc caaatcttag gccttccagg tgatggtagc 120
gatcttgaca agcgcgagca ggtcgttccc gctagcctgg gctctaccga gtcgggtgtg 180
ccgggtagat cgaggatttc tgagtcaatg agcgcttctc cttgctccgc tgtcctgatg 240
tcccgcaccg catcgaacca gggcaggaag gtgtaaggcg ccgagacagc acactgtccc 300
gctgggacgt cataacgcga ttcgccacgg gcatcgctca tctcctgaag gcaaggcgcg 360
aagactgatc gtcgcctgc 379
<210> 42
<211> 261
<212> DNA
<213> 刺糖多孢菌
<400> 42
gcgatcttga caagcgcgag caggtcgttc ccgctagcct gggctctacc gagtcgggtg 60
tgccgggtag atcgaggatt tctgagtcaa tgagcgcttc tccttgctcc gctgtcctga 120
tgtcccgcac cgcatcgaac cagggcagga aggtgtaagg cgccgagaca gcacactgtc 180
ccgctgggac gtcataacgc gattcgccac gggcatcgct catctcctga aggcaaggcg 240
cgaagactga tcgtcgcctg c 261
<210> 43
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> P21_突变合成启动子
<220>
<221> misc_feature
<222> (7)..(10)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (30)..(35)
<223> n为a、c、g或t
<400> 43
tgtgcgnnnn ctaacacgtc ctagtatggn nnnnngagca a 41
<210> 44
<211> 40
<212> DNA
<213> 刺糖多孢菌
<400> 44
cccggatcga agcacccacc cccactgtta ctgtgatcag 40
<210> 45
<211> 209
<212> DNA
<213> 刺糖多孢菌
<400> 45
aaccactgcg acgagcggta tttgggggaa gtaaagaggt gacccacgac tcactgtcgg 60
tgatcgatat cgacccggaa acgacttgat aacgacgctc tgatcagcac aaataccccg 120
gatcgaagca cccaccccca ctgttactgt gatcagcgtc acatgatctc aggtttccga 180
tctccgtgtt ggttacgtag tgtcgctcc 209
<210> 46
<211> 433
<212> DNA
<213> 刺糖多孢菌
<400> 46
aaccactgcg acgagcggta tttgggggaa gtaaagaggt gacccacgac tcactgtcgg 60
tgatcgatat cgacccggaa acgacttgat aacgacgctc tgatcagcac aaataccccg 120
gatcgaagca cccaccccca ctgttactgt gatcagcgtc acatgatctc aggtttccga 180
tctccgtgtt ggttacgtag tgtcgctcct cggtcggccc cgaaccgatc agcaaggagc 240
ggaagcccgc agcgccgaac cctgtccagc aggcttccag accccgaaac gaagaacacc 300
ggacagggac gggggaccca acacccgggc tccccgaagc cctaggggtg aagccggctc 360
ccccgagccg gccgggctgc ctctcagccc gaacccgaca gctcacctcg caggcgcggc 420
aggagagagg aac 433
<210> 47
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> P21-P1合成启动子
<400> 47
tgtgcgggct ctaacacgtc gaagtatggt aggatgagtg ttactgtgat cag 53
<210> 48
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> P1-P21合成启动子
<400> 48
cccggatcga agcacccggg ctctactgtt actgtgatgg taggatgagc aa 52
<210> 49
<211> 332
<212> DNA
<213> 刺糖多孢菌
<400> 49
gggcaggccc agcttctcgc cgcgccagtc gggccgcgcc tcggcggcct gctcgcgcgc 60
gtggttgaat gcgctcttcg ggccgtccag ccacgaaccg atgactcttc gcacgtcatc 120
cagggtacgt gcccctgcca tacggccagc ggagcatcac gctcggccgg tgcgcgcaac 180
cccgaccacc caaacgggcg gcagttaaca cccacgaaac attcaggtga cgacagggca 240
acacccctaa cataacgtgg actacgagcc ggcggtggaa cctttggcgt tgcgtcggtg 300
agctgtacga gtgcgtgaag gagccaccga gg 332
<210> 50
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 50
cacgagcgcg ctcgacggac cagctcaccg agaagtaggt cggagcaccg ttagcgggaa 60
aagtggggtt atcggcgttg cactaagcac gatggaccat ttgaggtaat gcgatgtagc 120
ccaaccggct ggttggcgtg ttgatgttgc ggttgaatgc cgcgttacgc gtcccgggca 180
aattcgactt aaatgtcgcc tgtatcacaa ttctgttact tctgacggac tgtcgcttag 240
agtacctctc cgggttcagc cagcgataaa tagtcgctgg ctccgtctgg ggggatggga 300
<210> 51
<211> 247
<212> DNA
<213> 刺糖多孢菌
<400> 51
cccggcaatt gttgggccca cagcaaaaat catgctcaag ggctcgccct gtaaccgggg 60
gacgattgtt tgtgggtggt gtgttgtggt gcgggtgccg ggtggttgtc ctcgcccggt 120
cgctgggttg tggtgtgtcg gcgcgctggt gggtcgcggt gcgggcatct agtggggcgg 180
aaggcctgat ttcggttgct gttggtggtg ttctgggttc tggcggcgtt ggggtcgggt 240
gggtgtg 247
<210> 52
<211> 230
<212> DNA
<213> 刺糖多孢菌
<400> 52
gctggcggag gggcacgagc gggcgatcgc agcgggtgcg acgccgctgc cgcagccgcc 60
cgaccagcag ggcgcgagct tccgcgtcta cgccgacccc gatggtcacc cgttctgcat 120
gtgcgcctgc gaggagtgag cgcgctctcc ggtcaggggc gcaagcagtc tgcttgcagg 180
agctagcact tgtggttatc gtcgttggtg accggagagg tgctagcccg 230
<210> 53
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 53
gcggcaaacc gtcgcagaca ccccgaaacg tcgtgatcgt cctgccctac tgcccttgtg 60
aagatcgtct cggatcttcg ctcgtggtcc cacctccatt ccggtggcct ggtcaaacgc 120
cgccgggcac ggcgtctggt atctctgaat gtgtgacgat gacggccccc tccccccact 180
cgctgttcaa cgatcttccc ttgcccggta cggtgagctc ggcgtggcgt gcgaggcacg 240
cgatttccgc cggacaaatc cgaatcgctt gaacgcgtaa caccagggct gctgtctgcg 300
<210> 54
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 54
tgtcgccgtg ggtagagtgt ctggacgagg aagacgtgag ctcgcaccca ggagatgggc 60
gccaccgcag cgccgggtga tcgagcaggt caaggggacc ccgttttgac cctctgagaa 120
cggggcaggt atctttgttt atcggacccg acacccatcg ggtcgatccg catgcccgtg 180
catgacgtgg tcgccagccg ctggttgaga ccgcgccagc gctgaggacg tgtggaactc 240
ctctcaacaa ccctctgggg tcgttcccat tggggcgcat cggcgccgaa aggccgagga 300
<210> 55
<211> 298
<212> DNA
<213> 刺糖多孢菌
<400> 55
acccgcgagg cgcccgaacc attgattgcg caaatttttc acaatccgcg ttcgtattac 60
gtcgcttggc cacgctccgc cgttacggag atagctcata gtcacccaaa agagcgatac 120
gatcatgttc aggtaacaac tcgatcggga tagatacccg attgatcgtc ccgctgaccc 180
gcttgggcgg ttacgctgcc cccgacgaca ccactttcgg tcgatcagtg gcgcggctga 240
ttggtcgaga gtcccggtgc cggtcggggg gcacgaccga ctccagggag gtagtgac 298
<210> 56
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 56
ctccagccac agccggagca tctccctgat ctcgatcacc gaaacctccc ggtagctcat 60
tccgccaata cgagcggccg agcgaccgga aaccccgcag ccacgccggg cggtcccata 120
actggcaaac caccagccca gacggtccca tcagtggcaa acaggtggtc ccatgctcct 180
ggcaaaaccg gctctgaggt ggtcccttac tcctggcagc cgacaggcgt cgttgcgcag 240
tggcggacag ggcacggatg actcctatga ggtagtcgat tacgtgctac cgtctacgcc 300
<210> 57
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 57
ggtggcactt accgatccgt cggggacgcg tccttcgagc cagtgcttcg gtacgccgcc 60
gagccagcgc accggatccg gttcgccggt gactacttcg cgccgctggg gcagatggag 120
gtagccgtga ccgcgggtaa agacgcggcc gaggcggtca tccgtgatcg cgcgggagcg 180
catcagcgtc gcttcggctc ggtcaaaccc aggtgaaccc cttgacctac ctcagggaag 240
cagcgatatt catacgtaga cggtagtcga ttaccgatca gataccaccc tggaggaaga 300
<210> 58
<211> 248
<212> DNA
<213> 刺糖多孢菌
<400> 58
ggccggattc ctcggcggac aggcgcagcc ccggctgatc gagaggatcg gggtgggggc 60
cgaggccgcg atcatcccgg cgttcatggg aggacatcgg tgtgctcacc gatcccgagc 120
gccgggtgtc gctgatcatg cgcgacggcg tgctggtgaa ggaccgcccg acggtgtgat 180
atttgcctgt taaccccgct ttcatcccag gtcaagcgcc tgcaatacag cgcgggaagc 240
atggtggc 248
<210> 59
<211> 250
<212> DNA
<213> 刺糖多孢菌
<400> 59
cggcgcgagc actccagcac cccgagccgg ggctcgtcgg agagcaacag cagcaaccgg 60
gcgtccaacg cgtcgagccc ctcagcattg ggagccatgt catatccctt gttcaggctg 120
accaataaag ccagcgattt ggatcaaata cttatcattt tgtgcagcga aatcaaatac 180
tgttgctcag gatgacctgc ccggcgcacg ctgaccccgt cactgcttcg gcgaaacagg 240
ggaggacatc 250
<210> 60
<211> 250
<212> DNA
<213> 刺糖多孢菌
<400> 60
tgagaccgga tcgacgcact ttcccacgcc tatacgggta tctggcgaat ggcggaatct 60
gactttgggt tcggcagtga cctggactta tatgtcgatg tgcgcatcag tcgacgtgat 120
actcgcgact aaccgcaggt gatttgccga acgggtctgc gtatttccct gcggcgagtt 180
agggtgccct tgcttgcctt gaacattgct ctacctcatc aggactcctt cgaagggaag 240
tgagctgctc 250
<210> 61
<211> 298
<212> DNA
<213> 刺糖多孢菌
<400> 61
tcgctttgac gcggacaccc cggccttttt gtcgctcgct agaggtaaaa acgacacacg 60
atcgagcgat taccttttgt gtaacactcc aaactcaacg gtttccccga cccgtttgtc 120
ctgatcaagc ggcagatgcg ggtgatcggg atcaggtcgg tccgcgtcgg tggccgcaga 180
gtgcgcgtta gcgtcccggc ggcacttgat ctcgcagatc aggctgcccg ctgcaggtgc 240
ttcccggcct tcgccggagc tgccgacaac aggtacgcca acgggccagg agctgatc 298
<210> 62
<211> 296
<212> DNA
<213> 刺糖多孢菌
<400> 62
caagaagccg aaaggcggcg aactctcggc ggcagataag aaaaacaaca aaacgatctc 60
atcgctacga tctgccgtcg agcgatgcat cgcacattta aagaattgga agatacttgc 120
caccgggtac cgaggacggc tcgctgaact ctccaacatc atccgcatcg tcacggcgct 180
cgaattctat cgactcggct ggtaactcac gtgaataacg ctcttcgtgt tcagcaaacc 240
tgtggaccat caccaacacc gaaacgtcta atgggcaagt caaccttcgc ggcgaa 296
<210> 63
<211> 300
<212> DNA
<213> 刺糖多孢菌
<400> 63
gcggcaaacc gtcgcagaca ccccgaaacg tcgtgatcgt cctgccctac tgcccttgtg 60
aagatcgtct cggatcttcg ctcgtggtcc cacctccatt ccggtggcct ggtcaaacgc 120
cgccgggcac ggcgtctggt atctctgaat gtgtgacgat gacggccccc tccccccact 180
cgctgttcaa cgatcttccc ttgcccggta cggtgagctc ggcgtggcgt gcgaggcacg 240
cgatttccgc cggacaaatc cgaatcgctt gaacgcgtaa caccagggct gctgtctgcg 300
<210> 64
<211> 226
<212> DNA
<213> 刺糖多孢菌
<400> 64
gggtgatcga gcaggtcaag gggaccccgt tttgaccctc tgagaacggg gcaggtatct 60
ttgtttatcg gacccgacac ccatcgggtc gatccgcatg cccgtgcatg acgtggtcgc 120
cagccgctgg ttgagaccgc gccagcgctg aggacgtgtg gaactcctct caacaaccct 180
ctggggtcgt tcccattggg gcgcatcggc gccgaaaggc cgagga 226
<210> 65
<211> 191
<212> DNA
<213> 刺糖多孢菌
<400> 65
acggccagcg gagcatcacg ctcggccggt gcgcgcaacc ccgaccaccc aaacgggcgg 60
cagttaacac ccacgaaaca ttcaggtgac gacagggcaa cacccctaac ataacgtgga 120
ctacgagccg gcggtggaac ctttggcgtt gcgtcggtga gctgtacgag tgcgtgaagg 180
agccaccgag g 191
<210> 66
<211> 177
<212> DNA
<213> 刺糖多孢菌
<400> 66
acttttcccc tgccggaatg tgtgcctgct tacttagcgt gccttgttca cctctcgttc 60
acttcgatgg cggcgatcgt ccactccgac tccttagcgt ccgtgtcgag cggccaaagc 120
acgagcctgc gcgaggctcg gccgcgcaac cgcagggttt ccaactggag gaacgaa 177
<210> 67
<211> 299
<212> DNA
<213> 刺糖多孢菌
<400> 67
tgatcgaagc gtgatctctt gactggcggc gcgcgcgggt tcactctagt cctcaacgcg 60
gggctgggct gccgtcggtg tgccccctcg acagctggcg tgattccggc tagactgcta 120
ctttgcgctg ccctctttcc gtctgtcctg caccggaccg taggatggtg ggcgccattg 180
cacccttgac agctgtgtta gcggagtgtg acagcggata cggaccccgt cggtcgcatt 240
cgccgggcac ctttcgccga cgcggctgta gccagttcag agtcccggaa ggacgcatc 299
<210> 68
<211> 266
<212> DNA
<213> 刺糖多孢菌
<400> 68
atcgggacac tacgccgcgc actcgcgtgc acggaccact gggctcgttt tcccggacaa 60
cccgaaacca cgcgccaatt tgccgacgca acgagaactg tgcgacacga cacatccgga 120
tcacacgatg gtgttaacga ggtgtttttt cttcggtttg cctggatatc tttcacgccg 180
agtacgcccc ctcccggctg aacttatggg gtgcgcagcc ggggaaggag cgctctgctt 240
catcccatcc aacaaggagc aacaaa 266
<210> 69
<211> 163
<212> DNA
<213> 刺糖多孢菌
<400> 69
ttatatgtcg atgtgcgcat cagtcgacgt gatactcgcg actaaccgca ggtgatttgc 60
cgaacgggtc tgcgtatttc cctgcggcga gttagggtgc ccttgcttgc cttgaacatt 120
gctctacctc atcaggactc cttcgaaggg aagtgagctg ctc 163
<210> 70
<211> 37
<212> DNA
<213> 刺糖多孢菌
<400> 70
cccgaacctt cgggggcggg ccctcttgct tttcaat 37
<210> 71
<211> 49
<212> DNA
<213> 刺糖多孢菌
<400> 71
cgggcaataa tacgtgcccg gacggtagtg cgagcacgag gtgggtacg 49
<210> 72
<211> 41
<212> DNA
<213> 刺糖多孢菌
<400> 72
agtttgtcga accggcggcg ttcgccggct ttaccttgcg c 41
<210> 73
<211> 42
<212> DNA
<213> 刺糖多孢菌
<400> 73
ggtttctcga accagtgctt tgcgtactgg ttgtcgttgc ag 42
<210> 74
<211> 37
<212> DNA
<213> 红色糖多孢菌
<400> 74
cggagccaga gggcgcctga gtgcctgttt ttgatcc 37
<210> 75
<211> 39
<212> DNA
<213> 红色糖多孢菌
<400> 75
aaacgccccc ggctccggcc gggggcgttt ttggttgtg 39
<210> 76
<211> 37
<212> DNA
<213> 红色糖多孢菌
<400> 76
agacgcagga ggtctcgtga ggggcttttc cgcgagc 37
<210> 77
<211> 35
<212> DNA
<213> 红色糖多孢菌
<400> 77
cgtgtgactt gtcccactcg gggtttttgt cgcga 35
<210> 78
<211> 39
<212> DNA
<213> 红色糖多孢菌
<400> 78
ggattcgtcc ggccgaggcc aatcggcttt tcggggccc 39
<210> 79
<211> 38
<212> DNA
<213> 红色糖多孢菌
<400> 79
gctttcgtcg gccgggaacg ccctggtgtt tcttaccg 38
<210> 80
<211> 38
<212> DNA
<213> 红色糖多孢菌
<400> 80
ttgggtggat tcacccctac cgggtgtttt tctcggct 38
<210> 81
<211> 711
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的报告基因DasherGFP
<400> 81
atgacggcat tgacggaagg tgcaaaactg tttgagaaag agatcccgta tatcaccgaa 60
ctggaaggcg acgtcgaagg tatgaaattt atcattaaag gcgagggtac cggtgacgcg 120
accacgggta ccattaaagc gaaatacatc tgcactacgg gcgacctgcc ggtcccgtgg 180
gcaaccctgg tgagcaccct gagctacggt gttcagtgtt tcgccaagta cccgagccac 240
atcaaggatt tctttaagag cgccatgccg gaaggttata cccaagagcg taccatcagc 300
ttcgaaggcg acggcgtgta caagacgcgt gctatggtta cctacgaacg cggttctatc 360
tacaatcgtg tcacgctgac tggtgagaac tttaagaaag acggtcacat tctgcgtaag 420
aacgttgcat tccaatgccc gccaagcatt ctgtatattc tgcctgacac cgttaacaat 480
ggcatccgcg ttgagttcaa ccaggcgtac gatattgaag gtgtgaccga aaaactggtt 540
accaaatgca gccaaatgaa tcgtccgttg gcgggctccg cggcagtgca tatcccgcgt 600
tatcatcaca ttacctacca caccaaactg agcaaagacc gcgacgagcg ccgtgatcac 660
atgtgtctgg tagaggtcgt gaaagcggtt gatctggaca cgtatcagta a 711
<210> 82
<211> 792
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的报告基因PaprikaRFP
<400> 82
atggtgagca agggtgagga actgattaaa gagaatatgc gcatgaagct gtacatggaa 60
ggcacggtga ataaccacca cttcaaatgc accagcgagg gtgagggtaa accgtatgaa 120
ggcacccaaa cgatgcgtat caaagttgtt gagggtggcc cgttgccgtt tgcgttcgac 180
attttagcga cgagctttat gtatggctct cgtacgttta tcaagtaccc gaagggtatt 240
ccggactttt tcaaacaatc ttttccagag ggtttcacct gggagcgcgt gactcgctac 300
gaagatggcg gcgtcgtgac cgttatgcag gatacctccc tggaagatgg ctgcctggtc 360
taccacgttc aggtccgtgg tgtcaatttc ccgagcaatg gtccggttat gcagaagaaa 420
accaagggtt gggaaccgaa caccgagatg ttgtatcctg cagatggtgg cctggaaggt 480
cgcagcgaca tggcattgaa actggtcggt ggcggccatc tgagctgtag cttcgtgacc 540
acgtatcgtt cgaagaagcc ggcgaagaac ctgaaaatgc cgggtattca cgcggttgac 600
caccgtctgg agcgcctgga agaatccgac aacgagatgt tcgtggtgca aagagaacat 660
gccgttgcgc gttattgtga tctgccgagc aagctgggcc ataagctgaa cagcggtctg 720
cgtagccgcg ctcaggccag caattccgcg gtcgatggta ccgctggtcc gggtagcacg 780
ggtagccgtt aa 792
<210> 83
<211> 1812
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的报告基因gusA
<400> 83
atgctgcgcc ccgtggaaac cccgacgcgc gaaatcaaga agctggacgg cctctgggcc 60
ttctccctgg accgggagaa ctgcgggatc gaccagcgct ggtgggagtc cgccctgcag 120
gagtcgcgcg ccatcgccgt gccggggagc ttcaacgacc agttcgcgga cgccgacatc 180
cgcaactacg cgggcaacgt gtggtaccag cgcgaggtct tcatcccgaa gggctgggcg 240
ggccagcgga tcgtcctgcg cttcgacgcc gtgacccact acggcaaggt ctgggtgaac 300
aaccaggagg tcatggaaca ccagggcggg tacaccccgt tcgaggccga cgtcaccccg 360
tacgtcatcg ccggcaagag cgtccgcatc accgtctgcg tcaacaacga gctgaactgg 420
cagacgatcc cccccggcat ggtcatcacc gacgagaacg ggaagaagaa gcagagctac 480
ttccacgact tcttcaacta cgccggcatc caccgctcgg tgatgctgta cacgaccccc 540
aacacctggg tcgacgacat cacggtggtg acccacgtcg cccaggactg caaccacgcc 600
agcgtggact ggcaggtggt ggccaacggc gacgtctccg tggagctccg cgacgcggac 660
cagcaggtcg tcgccaccgg ccaggggacc tcgggcaccc tgcaggtggt caacccgcac 720
ctctggcagc ccggcgaggg ctacctctac gagctgtgcg tcacggcgaa gtcgcagacc 780
gagtgcgaca tctaccccct gcgcgtcggc atccggtccg tggccgtcaa gggcgagcag 840
ttcctgatca accacaagcc cttctacttc accggcttcg gccgccacga ggacgccgac 900
ctccggggca agggcttcga caacgtcctg atggtccacg accacgcgct gatggactgg 960
atcggcgcca actcctaccg cacctcccac tacccctacg ccgaggagat gctcgactgg 1020
gccgacgagc acgggatcgt cgtgatcgac gagaccgccg ccgtcggctt caacctctcg 1080
ctcgggatcg gcttcgaagc ggggaacaag cccaaggagc tctactccga ggaagccgtc 1140
aacggcgaga cccagcaggc ccacctgcag gcgatcaagg agctgatcgc gcgcgacaag 1200
aaccacccga gcgtcgtcat gtggagcatc gccaacgaac cggacacgcg cccgcagggt 1260
gcgcgggaat acttcgcccc gctcgccgaa gccacccgca agctcgaccc cacgcgcccc 1320
atcacctgcg tcaacgtgat gttctgcgac gcgcacaccg acaccatctc cgacctgttc 1380
gacgtcctgt gcctgaaccg ctactacggc tggtacgtcc agtccgggga cctggagacg 1440
gcggaaaagg tgctggagaa ggagctcctg gcgtggcagg agaagctgca ccagcccatc 1500
atcatcacgg agtacggggt cgacaccctg gccggcctcc actccatgta cacggacatg 1560
tggagcgagg agtaccagtg cgcctggctg gacatgtacc accgcgtctt cgaccgcgtg 1620
agcgcggtcg tgggcgaaca ggtctggaac ttcgccgact tcgcgacgtc gcagggcatc 1680
ctgcgcgtgg ggggcaacaa gaagggcatc ttcacccgcg accgcaagcc caagtccgcc 1740
gccttcctcc tgcagaagcg gtggaccggg atgaacttcg gcgagaagcc ccagcagggg 1800
ggcaagcagt ga 1812
<210> 84
<211> 1740
<212> DNA
<213> 植物内生糖多孢菌
<400> 84
atgccgcgta agaaccgcga tgaaggcacc cgggcgccca acggcgcgag cagcatctac 60
aagggcaaag acggctactg gcacggccgc gtctggatgg gcaccaagga cgacggcagt 120
gaggaccgtc gccacaggtc agcgaagagc gaaacagagc tcctcaataa ggttcgcaag 180
ctcgaacggg agcgggacag cggcaaggtg cagaagcctg gccgcgcctg gaccgtcgag 240
aaatggctta cgcactgggt ggagaacatc gccgctccca ccgtgcggcc gaccacgatg 300
gtcggctacc gcgcctcggt gtataagcat ctgatccccg gcgtgggcaa gcaccggatc 360
gacaggttgc agccggaaca cctcgaaaag ctctacgcca agatgcagcg cgatggactc 420
aaggccgcga cagcgcacct cgcgcaccgg acggtgcggg tcgcgctgaa cgaggccaag 480
aagcgacgtc acatcaccga gaacccggcc aatatcgcga agccgcccag ggtggacgag 540
gaggagattg tcccgttcac ggtggatgaa gcccgccgga tcctcgcagc agctgcggag 600
acgcggaacg gcgctcgctt tgtcatcgcg ctgacccttg gcctgcgcag gggtgaagca 660
ctcgggttga agtggtcgga tctctcgatc acctggaagc acggatgccg gaaggggagc 720
gcgtgccggg tgggtcgccg agccgagcag tgcggcgagc gtcgcggcag cggcacgctc 780
gtcatccggc gcgcgattca gcagcaggtt tggcagcacg gttgctcaga ggacaagccg 840
tgcgaccacc gctacggcgc tcactgcccg cgccggcata gcggcggtgt ggtcgtgacc 900
gatgtgaagt ccagggcggg tcggcgaacc gtgggccttc cgcacccggt ggtggaagcg 960
ctcgaagagc accgcgcccg ccagcggaca gagcgggaga aggcgcgcaa cgagtgggac 1020
gacgccgatt gggtcttcac gaacaggtgg ggtcgcccgg ttcatccgac cgttgactac 1080
gacgcctgga aggcactgct cagggcagcg aacgtgcgca acgcgcggtt gcacgacgca 1140
cgccacaccg cggcgacgat gttgctggtg ttgaaggttc cgctgcctgc ggtcatggaa 1200
atcatgggct ggtcggaagc ctctatggcc aagcgctaca tgcacgtgcc gcacgagctc 1260
gtgaccgcga tcgcggacca ggtgggtgac ctggtgtggc ccgtcccaga gaccgaggag 1320
gaggcgccac cgcctgagga ggagtgggcg ctggacgcca accaggtggc ggcgatccgg 1380
aagctggccg gagctctccc gccgcagttg cgggagcagt tcgaggcgct gctgcccggc 1440
gacgacgagg acgacggccc gacttcggga gtggtcatcc ctgcgtaacc agtgcggcca 1500
gaacccggcc taacggggcc tactgagacg aaaactgaga ctggacatgc gagaggcccg 1560
gaagcgagat cgcttccggg cctctgacct gcggaggata cgggattcga acccgtgagg 1620
gctattaacc caacacgatt tccaattccg atggcgcgag tgccaggggg tagctgaacg 1680
tgccttttgc ctggtcagtg gcactacggc aacatcaggt gtggcttgat ccgtgcgcgt 1740
<210> 85
<211> 495
<212> PRT
<213> 植物内生糖多孢菌
<400> 85
Met Pro Arg Lys Asn Arg Asp Glu Gly Thr Arg Ala Pro Asn Gly Ala
1 5 10 15
Ser Ser Ile Tyr Lys Gly Lys Asp Gly Tyr Trp His Gly Arg Val Trp
20 25 30
Met Gly Thr Lys Asp Asp Gly Ser Glu Asp Arg Arg His Arg Ser Ala
35 40 45
Lys Ser Glu Thr Glu Leu Leu Asn Lys Val Arg Lys Leu Glu Arg Glu
50 55 60
Arg Asp Ser Gly Lys Val Gln Lys Pro Gly Arg Ala Trp Thr Val Glu
65 70 75 80
Lys Trp Leu Thr His Trp Val Glu Asn Ile Ala Ala Pro Thr Val Arg
85 90 95
Pro Thr Thr Met Val Gly Tyr Arg Ala Ser Val Tyr Lys His Leu Ile
100 105 110
Pro Gly Val Gly Lys His Arg Ile Asp Arg Leu Gln Pro Glu His Leu
115 120 125
Glu Lys Leu Tyr Ala Lys Met Gln Arg Asp Gly Leu Lys Ala Ala Thr
130 135 140
Ala His Leu Ala His Arg Thr Val Arg Val Ala Leu Asn Glu Ala Lys
145 150 155 160
Lys Arg Arg His Ile Thr Glu Asn Pro Ala Asn Ile Ala Lys Pro Pro
165 170 175
Arg Val Asp Glu Glu Glu Ile Val Pro Phe Thr Val Asp Glu Ala Arg
180 185 190
Arg Ile Leu Ala Ala Ala Ala Glu Thr Arg Asn Gly Ala Arg Phe Val
195 200 205
Ile Ala Leu Thr Leu Gly Leu Arg Arg Gly Glu Ala Leu Gly Leu Lys
210 215 220
Trp Ser Asp Leu Ser Ile Thr Trp Lys His Gly Cys Arg Lys Gly Ser
225 230 235 240
Ala Cys Arg Val Gly Arg Arg Ala Glu Gln Cys Gly Glu Arg Arg Gly
245 250 255
Ser Gly Thr Leu Val Ile Arg Arg Ala Ile Gln Gln Gln Val Trp Gln
260 265 270
His Gly Cys Ser Glu Asp Lys Pro Cys Asp His Arg Tyr Gly Ala His
275 280 285
Cys Pro Arg Arg His Ser Gly Gly Val Val Val Thr Asp Val Lys Ser
290 295 300
Arg Ala Gly Arg Arg Thr Val Gly Leu Pro His Pro Val Val Glu Ala
305 310 315 320
Leu Glu Glu His Arg Ala Arg Gln Arg Thr Glu Arg Glu Lys Ala Arg
325 330 335
Asn Glu Trp Asp Asp Ala Asp Trp Val Phe Thr Asn Arg Trp Gly Arg
340 345 350
Pro Val His Pro Thr Val Asp Tyr Asp Ala Trp Lys Ala Leu Leu Arg
355 360 365
Ala Ala Asn Val Arg Asn Ala Arg Leu His Asp Ala Arg His Thr Ala
370 375 380
Ala Thr Met Leu Leu Val Leu Lys Val Pro Leu Pro Ala Val Met Glu
385 390 395 400
Ile Met Gly Trp Ser Glu Ala Ser Met Ala Lys Arg Tyr Met His Val
405 410 415
Pro His Glu Leu Val Thr Ala Ile Ala Asp Gln Val Gly Asp Leu Val
420 425 430
Trp Pro Val Pro Glu Thr Glu Glu Glu Ala Pro Pro Pro Glu Glu Glu
435 440 445
Trp Ala Leu Asp Ala Asn Gln Val Ala Ala Ile Arg Lys Leu Ala Gly
450 455 460
Ala Leu Pro Pro Gln Leu Arg Glu Gln Phe Glu Ala Leu Leu Pro Gly
465 470 475 480
Asp Asp Glu Asp Asp Gly Pro Thr Ser Gly Val Val Ile Pro Ala
485 490 495
<210> 86
<211> 1525
<212> DNA
<213> 红色糖多孢菌
<400> 86
atgccccgca aacgccgccc agaaggcacc cgagccccca acggcgccag cagcatctac 60
tacagcgaga cggacggcta ctggcacggg cgcgtcacga tgggcgtccg cgacgacggc 120
aagcccgacc gtcgccacgt ccaagccaag accgagaccg aggtcatcga taaggtccgc 180
aagctcgaac gtgaccggga tagcggcaac gcgcggaagc ctggtcgcgc gtggacagtc 240
gagaagtggc tgactcactg ggtcgagaac atcgcggtgc actccgttcg gtacaagacg 300
cttcagggct accgaacggc ggtctacaag cacctgatcc ccggtatcgg cgcgcaccgg 360
atggaccgca tcgagccgga gcacttcgag cggttctacg ccaggatgca ggccgccggc 420
gccagtgcag ggaccgcaca tcaggtgcac cggactgcca aaacggcatt caacgaatac 480
ttccggcggc agcgcatcac cgggaacccc atcgccttcg tgaaagcgcc gcgcgtcgag 540
gaaaaggaag tggagccgtt cacgccgcag gaagccaaga gcatcatcac ggccgcgctc 600
aagcggcgca acggcgtgcg atacgtcgtc gccttggctc tcggttgtcg ccaaggcgaa 660
gccctggggt tcaagtggga ccgcctcgac cgcgggaacc ggctttaccg cgtacggcag 720
gcattgcagc ggcaggcttg gcaacacgga tgcgacgacc cgcacgcctg cggagcacga 780
cttcatcggg tggcgtgccc ggacaactgc acccagcatc gcaaccgcaa gagctgcatt 840
cgcgacgaga agggccacca ccgtccgtgc ccgccgaact gcaccaggca cgcgagcagt 900
tgcccgcagc ggcacggtgg tgggctcgtc gaggtcgacg tgaagtcgaa ggctggtcgc 960
cggagcttcg ttctgccaga tgaggtcttc gatctgctga tgcgccacga gcaggcgcag 1020
cagcgggagc gcaagcacgc cggtagcgag tggcaggagg ggggctgggt cttcacccag 1080
cccaacggcc ggccgatcga tccgcggcgc gactggggtg agtggaagga catcttgggg 1140
gaggcaggtg ttcgggatgc tcggctgcac gacgcgcgcc acactgcggc gacggtcctc 1200
atgctgctcc gcgttccaga ccgggccgtc caggatcaca tgggctggtc ctcgatccgg 1260
atgaaggagc gctacatgca cgtcaccgag gaactgcgac gagagatcgc cgatcagctc 1320
aacgggtact tctgggacgt caactgagac ggaaagtgag acgaaaagcg cctggtcagg 1380
gacctgtcga cggcgtttcc gctggtagtt tcggagccgc tgaggggact cgaacccctg 1440
accgtccgct tacaaggcgg gcgctctacc aactgagcta cagcggcgtg cgctacgtcg 1500
cgcgcgaaca tcgtaagcgt ccacc 1525
<210> 87
<211> 448
<212> PRT
<213> 红色糖多孢菌
<400> 87
Met Pro Arg Lys Arg Arg Pro Glu Gly Thr Arg Ala Pro Asn Gly Ala
1 5 10 15
Ser Ser Ile Tyr Tyr Ser Glu Thr Asp Gly Tyr Trp His Gly Arg Val
20 25 30
Thr Met Gly Val Arg Asp Asp Gly Lys Pro Asp Arg Arg His Val Gln
35 40 45
Ala Lys Thr Glu Thr Glu Val Ile Asp Lys Val Arg Lys Leu Glu Arg
50 55 60
Asp Arg Asp Ser Gly Asn Ala Arg Lys Pro Gly Arg Ala Trp Thr Val
65 70 75 80
Glu Lys Trp Leu Thr His Trp Val Glu Asn Ile Ala Val His Ser Val
85 90 95
Arg Tyr Lys Thr Leu Gln Gly Tyr Arg Thr Ala Val Tyr Lys His Leu
100 105 110
Ile Pro Gly Ile Gly Ala His Arg Met Asp Arg Ile Glu Pro Glu His
115 120 125
Phe Glu Arg Phe Tyr Ala Arg Met Gln Ala Ala Gly Ala Ser Ala Gly
130 135 140
Thr Ala His Gln Val His Arg Thr Ala Lys Thr Ala Phe Asn Glu Tyr
145 150 155 160
Phe Arg Arg Gln Arg Ile Thr Gly Asn Pro Ile Ala Phe Val Lys Ala
165 170 175
Pro Arg Val Glu Glu Lys Glu Val Glu Pro Phe Thr Pro Gln Glu Ala
180 185 190
Lys Ser Ile Ile Thr Ala Ala Leu Lys Arg Arg Asn Gly Val Arg Tyr
195 200 205
Val Val Ala Leu Ala Leu Gly Cys Arg Gln Gly Glu Ala Leu Gly Phe
210 215 220
Lys Trp Asp Arg Leu Asp Arg Gly Asn Arg Leu Tyr Arg Val Arg Gln
225 230 235 240
Ala Leu Gln Arg Gln Ala Trp Gln His Gly Cys Asp Asp Pro His Ala
245 250 255
Cys Gly Ala Arg Leu His Arg Val Ala Cys Pro Asp Asn Cys Thr Gln
260 265 270
His Arg Asn Arg Lys Ser Cys Ile Arg Asp Glu Lys Gly His His Arg
275 280 285
Pro Cys Pro Pro Asn Cys Thr Arg His Ala Ser Ser Cys Pro Gln Arg
290 295 300
His Gly Gly Gly Leu Val Glu Val Asp Val Lys Ser Lys Ala Gly Arg
305 310 315 320
Arg Ser Phe Val Leu Pro Asp Glu Val Phe Asp Leu Leu Met Arg His
325 330 335
Glu Gln Ala Gln Gln Arg Glu Arg Lys His Ala Gly Ser Glu Trp Gln
340 345 350
Glu Gly Gly Trp Val Phe Thr Gln Pro Asn Gly Arg Pro Ile Asp Pro
355 360 365
Arg Arg Asp Trp Gly Glu Trp Lys Asp Ile Leu Gly Glu Ala Gly Val
370 375 380
Arg Asp Ala Arg Leu His Asp Ala Arg His Thr Ala Ala Thr Val Leu
385 390 395 400
Met Leu Leu Arg Val Pro Asp Arg Ala Val Gln Asp His Met Gly Trp
405 410 415
Ser Ser Ile Arg Met Lys Glu Arg Tyr Met His Val Thr Glu Glu Leu
420 425 430
Arg Arg Glu Ile Ala Asp Gln Leu Asn Gly Tyr Phe Trp Asp Val Asn
435 440 445
<210> 88
<211> 2172
<212> DNA
<213> 红色糖多孢菌
<400> 88
acgtcaccca actcgccgcc acgctcgcct cgctcgcggc cctgctcgcc gaacagcagc 60
ccgccccgga acccgagccc gaaccggccg cccgcaggct gcccaaccgc gtgctgctca 120
cggtcgagga agcggccaag caactggggc tcggcaggac caagacctac gcgctggtgg 180
cgtctggcga gatcgaatct gtccggatcg gtcggctcag gcgcatcccg cgcaccgcca 240
tcgacgacta cgccgcccga ctcatcgccc agcagagcgc cgcctgaagg gaaccactat 300
ggaacaaaag cgcacccgaa accccaacgg tcgatcgacg atctacctcg ggaacgacgg 360
ctactggcac ggccgcgtca ccatgggcat cggcgacgac ggcaagcctg accggcgcca 420
cgtcaagcgc aaggacaagg acgaagttgt cgaggaggtc ggcaagctcg aacgggagcg 480
ggactccggc aacgtccgca agaagggcca gccgtggaca gtcgagcggt ggctgacgca 540
ctgggtggag agcatcgcgc cgctgacctg ccggtacaag accatgcggg gctaccagac 600
ggccgtgtac aagcacctca tccccggttt gggcgcgcac aggctcgatc ggatccagaa 660
ccatccggag tacttcgaga agttctacct gcgaatgatc gagtcgggac tgaagccggc 720
gacggctcac caggtacacc gcacggcgcg aacggctttc ggcgaggcgt acaagcgggg 780
acgcatccag aggaacccgg tttcgatcgc aaaggcacct cgggtggaag aggaggaggt 840
cgaaccgctt gaggtcgagg acatgcagct ggtcatcaag gccgccctgg aacgccgaaa 900
cggcgtccgc tacgtcatcg cactggctct cggaactcgg cagggcgaat cgctcgcgct 960
gaagtggccg cggctgaacc ggcagaagcg cacgctgcgg atcaccaagg cactccaacg 1020
tcagacgtgg aagcacgggt gctctgaccc gcatcggtgc ggcgcgacct accacaagac 1080
cgagccgtgc aaggcggcct gcaagcggca cacgcgagct tgtccgccgc catgcccgcc 1140
agcttgcacc gaacacgccc ggtggtgccc gcagcgaacc ggtggcgggc tggtcgaggt 1200
cgacgtcaag tcgagggctg gacgacggac cgtgacgctg cccgaccaac tgttcgactt 1260
gatcctcaag cacgaaaagc ttcagggggc cgaacgggag ctcgcgggca cggagtggca 1320
cgacggcgag tggatgttca cccagcccaa cggcaagccg atcgatccac gtcaggacct 1380
cgacgagtgg aaagcaatcc ttgttgaagc cggagtccgc gaggcgcggc tacatgacgc 1440
acggcacacc gccgcgactg tgctgttggt cctcggagtg cccgaccggg tcgtgatgga 1500
gctgatgggc tggtcgtccg tcaccatgaa gcagcggtac atgcacgtca tcgactccgt 1560
ccggaacgac gtagcggacc gcctgaacac ctacttctgg ggcaccaact gagacccaga 1620
ctgagaccca aaacgccccc gtcgagatcg acgggggcgt tttggcagct cttggtggtg 1680
gccaggggcg gggtcgaacc gccgaccttc cgcttttcag gcggacgctc gtaccaactg 1740
agctacctgg ccgttcgcgc ccggctcaaa gccgaaccgc tgtggcgacc cagacgggac 1800
tcgaacccgc gacctccgcc gtgacagggc ggcgcgctaa ccaactgcgc cactgggcca 1860
tgttctgttg ttgcgtaccc ccaacgggat tcgaacccgc gctaccgcct tgaaagggcg 1920
gcgtcctagg ccgctagacg atgggggctt ggccgattcg gaaccgaccc ggcctcgcct 1980
ccaaccggct ttccctttcg gggcgccccg ttgggagcag tgaaagctta cgacacaccc 2040
cccagcgccc cacaacgggg gggtccccaa acctcacgag cccccgcgcg gcccacgccc 2100
gccggtcacg tcggtcgcca ccatatgcca tctgaccagc cttttccatc gcctatcctc 2160
agtcggccca ct 2172
<210> 89
<211> 437
<212> PRT
<213> 红色糖多孢菌
<400> 89
Met Glu Gln Lys Arg Thr Arg Asn Pro Asn Gly Arg Ser Thr Ile Tyr
1 5 10 15
Leu Gly Asn Asp Gly Tyr Trp His Gly Arg Val Thr Met Gly Ile Gly
20 25 30
Asp Asp Gly Lys Pro Asp Arg Arg His Val Lys Arg Lys Asp Lys Asp
35 40 45
Glu Val Val Glu Glu Val Gly Lys Leu Glu Arg Glu Arg Asp Ser Gly
50 55 60
Asn Val Arg Lys Lys Gly Gln Pro Trp Thr Val Glu Arg Trp Leu Thr
65 70 75 80
His Trp Val Glu Ser Ile Ala Pro Leu Thr Cys Arg Tyr Lys Thr Met
85 90 95
Arg Gly Tyr Gln Thr Ala Val Tyr Lys His Leu Ile Pro Gly Leu Gly
100 105 110
Ala His Arg Leu Asp Arg Ile Gln Asn His Pro Glu Tyr Phe Glu Lys
115 120 125
Phe Tyr Leu Arg Met Ile Glu Ser Gly Leu Lys Pro Ala Thr Ala His
130 135 140
Gln Val His Arg Thr Ala Arg Thr Ala Phe Gly Glu Ala Tyr Lys Arg
145 150 155 160
Gly Arg Ile Gln Arg Asn Pro Val Ser Ile Ala Lys Ala Pro Arg Val
165 170 175
Glu Glu Glu Glu Val Glu Pro Leu Glu Val Glu Asp Met Gln Leu Val
180 185 190
Ile Lys Ala Ala Leu Glu Arg Arg Asn Gly Val Arg Tyr Val Ile Ala
195 200 205
Leu Ala Leu Gly Thr Arg Gln Gly Glu Ser Leu Ala Leu Lys Trp Pro
210 215 220
Arg Leu Asn Arg Gln Lys Arg Thr Leu Arg Ile Thr Lys Ala Leu Gln
225 230 235 240
Arg Gln Thr Trp Lys His Gly Cys Ser Asp Pro His Arg Cys Gly Ala
245 250 255
Thr Tyr His Lys Thr Glu Pro Cys Lys Ala Ala Cys Lys Arg His Thr
260 265 270
Arg Ala Cys Pro Pro Pro Cys Pro Pro Ala Cys Thr Glu His Ala Arg
275 280 285
Trp Cys Pro Gln Arg Thr Gly Gly Gly Leu Val Glu Val Asp Val Lys
290 295 300
Ser Arg Ala Gly Arg Arg Thr Val Thr Leu Pro Asp Gln Leu Phe Asp
305 310 315 320
Leu Ile Leu Lys His Glu Lys Leu Gln Gly Ala Glu Arg Glu Leu Ala
325 330 335
Gly Thr Glu Trp His Asp Gly Glu Trp Met Phe Thr Gln Pro Asn Gly
340 345 350
Lys Pro Ile Asp Pro Arg Gln Asp Leu Asp Glu Trp Lys Ala Ile Leu
355 360 365
Val Glu Ala Gly Val Arg Glu Ala Arg Leu His Asp Ala Arg His Thr
370 375 380
Ala Ala Thr Val Leu Leu Val Leu Gly Val Pro Asp Arg Val Val Met
385 390 395 400
Glu Leu Met Gly Trp Ser Ser Val Thr Met Lys Gln Arg Tyr Met His
405 410 415
Val Ile Asp Ser Val Arg Asn Asp Val Ala Asp Arg Leu Asn Thr Tyr
420 425 430
Phe Trp Gly Thr Asn
435
<210> 90
<211> 1521
<212> DNA
<213> 刺糖多孢菌
<400> 90
atgccacgca aacgccgccc ggaaggcacc cgggcaccca acggagccag cagcatctac 60
ctcggcaagg acggctactg gcacggccgc gtcaccgtcg gagttcgcga cgacggtaag 120
cccgaccgcc ctcacgtcca ggccaagacc gaggccgaag tcatcgacaa ggtgcgcaag 180
ctcgaacgcg atcgcgatgc ggggaaggtg cgaaagcctg gccgggcctg gaccgtcgag 240
aagtggctta cgcactgggt cgagaacatc gccgcgccat ccgtccgtta caagaccctt 300
cagggctacc gcacggcggt gtacaagcac ttgatccccg gcatcggcgc gcaccggatc 360
gaccgaattg aaccggagca cttcgagaag ctctacgcga agatgcagga atccggcgcg 420
aaagcgggaa ccgcgcacca ggtgcaccgc accgctcggg ccgcctttaa cgaagccttc 480
cggcgtcggc acctcaccga aagcccggtg cggttcgtga aagcgccgaa ggtcgaagaa 540
gaggaagtcg agcccttcac gccgaaggaa gcccagcaga tcattacggc cgcgctcaat 600
cgtcgaaacg gcgtgcgatt cgtgatcgct ctcgcactgg gctgccgcca gggtgaagcg 660
ctgggcttca agtgggaacg gctcgaccgg gaaaacaggc tctaccacgt tcggagggcg 720
cttcagcgtc aagcctggca acacggctgt gaagatccgc acaactgcgg tgcgaggttc 780
caccgggttg cttgcgccga gaactgcaag cggcaccgca atcggaagaa ctgcattcgc 840
aacgagaagg gacacgctcg accgtgcccg ccgaactgcg accgacacgc cagcagctgc 900
ccgaaacggc acggcggagg cctgcgcgag gtggatgtga agtcgaaggc tggccgccgg 960
cggttcgttc ttcctgacga gatcttcgac ctgctcatgc ggcatgagga agtccagcgg 1020
cacgaacggg ttcacgccgg taccgagtgg caggagggcg gctggatctt cacgcagccc 1080
aacggcaggc cgatcgatcc gcgccgcgat tggggcgagt ggaaggagat cctcgcggag 1140
gccggtgttc gggatgcccg gctgcacgac gcgcggcaca ccgcagcgac ggtgctcatg 1200
ctgctccgtg ttccggaccg ggccgttcag gaccacatgg gatggtcgtc gatccggatg 1260
aaagagcggt acatgcacgt caccgaggaa ctgcgccgcg agatcgccga tcagctgaat 1320
gggtatttct ggaaccccaa ctgagaccga aagtgagacg gatcgcgcct ggtcaccggg 1380
tgggcaggcg cgtttccgct ggtacggtcg gagccgctga ggggactcga acccctgacc 1440
gtccgcttac aaggcgggcg ctctaccaac tgagctacag cggcatgcac ttcgtcgtgc 1500
ggggacatcg taagcggcga t 1521
<210> 91
<211> 447
<212> PRT
<213> 刺糖多孢菌
<400> 91
Met Pro Arg Lys Arg Arg Pro Glu Gly Thr Arg Ala Pro Asn Gly Ala
1 5 10 15
Ser Ser Ile Tyr Leu Gly Lys Asp Gly Tyr Trp His Gly Arg Val Thr
20 25 30
Val Gly Val Arg Asp Asp Gly Lys Pro Asp Arg Pro His Val Gln Ala
35 40 45
Lys Thr Glu Ala Glu Val Ile Asp Lys Val Arg Lys Leu Glu Arg Asp
50 55 60
Arg Asp Ala Gly Lys Val Arg Lys Pro Gly Arg Ala Trp Thr Val Glu
65 70 75 80
Lys Trp Leu Thr His Trp Val Glu Asn Ile Ala Ala Pro Ser Val Arg
85 90 95
Tyr Lys Thr Leu Gln Gly Tyr Arg Thr Ala Val Tyr Lys His Leu Ile
100 105 110
Pro Gly Ile Gly Ala His Arg Ile Asp Arg Ile Glu Pro Glu His Phe
115 120 125
Glu Lys Leu Tyr Ala Lys Met Gln Glu Ser Gly Ala Lys Ala Gly Thr
130 135 140
Ala His Gln Val His Arg Thr Ala Arg Ala Ala Phe Asn Glu Ala Phe
145 150 155 160
Arg Arg Arg His Leu Thr Glu Ser Pro Val Arg Phe Val Lys Ala Pro
165 170 175
Lys Val Glu Glu Glu Glu Val Glu Pro Phe Thr Pro Lys Glu Ala Gln
180 185 190
Gln Ile Ile Thr Ala Ala Leu Asn Arg Arg Asn Gly Val Arg Phe Val
195 200 205
Ile Ala Leu Ala Leu Gly Cys Arg Gln Gly Glu Ala Leu Gly Phe Lys
210 215 220
Trp Glu Arg Leu Asp Arg Glu Asn Arg Leu Tyr His Val Arg Arg Ala
225 230 235 240
Leu Gln Arg Gln Ala Trp Gln His Gly Cys Glu Asp Pro His Asn Cys
245 250 255
Gly Ala Arg Phe His Arg Val Ala Cys Ala Glu Asn Cys Lys Arg His
260 265 270
Arg Asn Arg Lys Asn Cys Ile Arg Asn Glu Lys Gly His Ala Arg Pro
275 280 285
Cys Pro Pro Asn Cys Asp Arg His Ala Ser Ser Cys Pro Lys Arg His
290 295 300
Gly Gly Gly Leu Arg Glu Val Asp Val Lys Ser Lys Ala Gly Arg Arg
305 310 315 320
Arg Phe Val Leu Pro Asp Glu Ile Phe Asp Leu Leu Met Arg His Glu
325 330 335
Glu Val Gln Arg His Glu Arg Val His Ala Gly Thr Glu Trp Gln Glu
340 345 350
Gly Gly Trp Ile Phe Thr Gln Pro Asn Gly Arg Pro Ile Asp Pro Arg
355 360 365
Arg Asp Trp Gly Glu Trp Lys Glu Ile Leu Ala Glu Ala Gly Val Arg
370 375 380
Asp Ala Arg Leu His Asp Ala Arg His Thr Ala Ala Thr Val Leu Met
385 390 395 400
Leu Leu Arg Val Pro Asp Arg Ala Val Gln Asp His Met Gly Trp Ser
405 410 415
Ser Ile Arg Met Lys Glu Arg Tyr Met His Val Thr Glu Glu Leu Arg
420 425 430
Arg Glu Ile Ala Asp Gln Leu Asn Gly Tyr Phe Trp Asn Pro Asn
435 440 445
<210> 92
<211> 1669
<212> DNA
<213> 刺糖多孢菌
<400> 92
atgccacgca agcgccgccc ggaaggcacc cgggcaccca acggagccag cagcatctac 60
ctcggaaacg acggctactg gcacggccgc gtcacgatgg gaacccgtga cgacggccgc 120
cccgaccgac ggcatgtcca gggcaagacc gaggccgaag tcatagacaa agtgcgcaag 180
ctcgaacgcg accgcgacgc cggacggatg cgcaagcctg gccgggcctg gaccgtcgag 240
aagtggctga tgcactggct ggagcacatt gcgaagccat cggtccggcc gaaaaccgtc 300
gcccggtatc ggacttccgt cgagcaatac ctgattcctg gtctcggtgc gcaccgcatc 360
gaccgcttgc agccggagaa cattgagaag ctgtacgcaa aattgctcgc tcgcgggttg 420
gcgccgtcca ctgtgcacca tgttcaccgg actctgcgcg tcgctttcaa cgaggcgttc 480
aagcgggaac acatcacgaa aaacccggtc ctcgttgcga aagcgccgaa gctggtcgaa 540
ccggagatcg agccgttcac cgtggccgaa gcacaacgaa ttctcgatgt tgcacggaca 600
cggcggaatg gtgctcggtt cgcactcgcg ctcgcgctgg gaatgcgcca gggcgaagct 660
ctcggactca agtggtccga cctgcgaatc acctggcacc acgggtgcgc atccggactc 720
accgaagaac agcaggcggc catcgaaatg ctcgcgaagg tcgatccgca gcgatggaag 780
cggcctgacg attccgggtg cggattcaag gacgtggagg actgcccgca ggctcacccg 840
gccgcgacac tgaacattcg gcgcgcattg cagcgccaca cctggcaaca cgggtgcggt 900
gacaaaccga cgtgcggcaa gaaacggggc gcggactgcc cgcagcgtca tggcggcggc 960
ttggccatcg tcccggtgaa gtcgagggcg gggacgcgct cgatcagcgt gcctgagccg 1020
ctgattcatg cgttgctcga tcacgacgag gcgcaggatg aggaacggca cttggcccgg 1080
aacctgtggc acgacgatgg atggatgttc gctcagccca acgggaaggc gacggacccg 1140
agggccgact atggcgaatg gcgcgagctg ctggacgccg cgaaggttcg gccggcgcgg 1200
ctgcacgacg cgcggcacac cgccgcgacg atgttgctgg ttctcaaggt cgcaccacgg 1260
gcaatcatgg acgtgatggg ctggtcggag gcgtcgatgc tgacccgcta cgtccacgtg 1320
ccggacgaga tcaagcaggg catcgcgggc caggtcggcg gactgctgtg gaaggactgg 1380
cagcagcccg acgacggccc agacgacgag gacggcggca ccgccgggca ccctgtcccg 1440
gcctgacgtg cccactgcca gaggaggcgt ttgagccgga aactgagccg gaacgacacc 1500
aggcgctttc cgtgtccacg gaaagcgcct ggtgagagcg gagccgccta agggaatcga 1560
acccttgacc tacgcattac gagtgcgtcg ctctagccga ctgagctaag gcggcgttgc 1620
acggccaagt gtagcgggcc ggacctcgcc gtcgttcatg gccccgact 1669
<210> 93
<211> 481
<212> PRT
<213> 刺糖多孢菌
<400> 93
Met Pro Arg Lys Arg Arg Pro Glu Gly Thr Arg Ala Pro Asn Gly Ala
1 5 10 15
Ser Ser Ile Tyr Leu Gly Asn Asp Gly Tyr Trp His Gly Arg Val Thr
20 25 30
Met Gly Thr Arg Asp Asp Gly Arg Pro Asp Arg Arg His Val Gln Gly
35 40 45
Lys Thr Glu Ala Glu Val Ile Asp Lys Val Arg Lys Leu Glu Arg Asp
50 55 60
Arg Asp Ala Gly Arg Met Arg Lys Pro Gly Arg Ala Trp Thr Val Glu
65 70 75 80
Lys Trp Leu Met His Trp Leu Glu His Ile Ala Lys Pro Ser Val Arg
85 90 95
Pro Lys Thr Val Ala Arg Tyr Arg Thr Ser Val Glu Gln Tyr Leu Ile
100 105 110
Pro Gly Leu Gly Ala His Arg Ile Asp Arg Leu Gln Pro Glu Asn Ile
115 120 125
Glu Lys Leu Tyr Ala Lys Leu Leu Ala Arg Gly Leu Ala Pro Ser Thr
130 135 140
Val His His Val His Arg Thr Leu Arg Val Ala Phe Asn Glu Ala Phe
145 150 155 160
Lys Arg Glu His Ile Thr Lys Asn Pro Val Leu Val Ala Lys Ala Pro
165 170 175
Lys Leu Val Glu Pro Glu Ile Glu Pro Phe Thr Val Ala Glu Ala Gln
180 185 190
Arg Ile Leu Asp Val Ala Arg Thr Arg Arg Asn Gly Ala Arg Phe Ala
195 200 205
Leu Ala Leu Ala Leu Gly Met Arg Gln Gly Glu Ala Leu Gly Leu Lys
210 215 220
Trp Ser Asp Leu Arg Ile Thr Trp His His Gly Cys Ala Ser Gly Leu
225 230 235 240
Thr Glu Glu Gln Gln Ala Ala Ile Glu Met Leu Ala Lys Val Asp Pro
245 250 255
Gln Arg Trp Lys Arg Pro Asp Asp Ser Gly Cys Gly Phe Lys Asp Val
260 265 270
Glu Asp Cys Pro Gln Ala His Pro Ala Ala Thr Leu Asn Ile Arg Arg
275 280 285
Ala Leu Gln Arg His Thr Trp Gln His Gly Cys Gly Asp Lys Pro Thr
290 295 300
Cys Gly Lys Lys Arg Gly Ala Asp Cys Pro Gln Arg His Gly Gly Gly
305 310 315 320
Leu Ala Ile Val Pro Val Lys Ser Arg Ala Gly Thr Arg Ser Ile Ser
325 330 335
Val Pro Glu Pro Leu Ile His Ala Leu Leu Asp His Asp Glu Ala Gln
340 345 350
Asp Glu Glu Arg His Leu Ala Arg Asn Leu Trp His Asp Asp Gly Trp
355 360 365
Met Phe Ala Gln Pro Asn Gly Lys Ala Thr Asp Pro Arg Ala Asp Tyr
370 375 380
Gly Glu Trp Arg Glu Leu Leu Asp Ala Ala Lys Val Arg Pro Ala Arg
385 390 395 400
Leu His Asp Ala Arg His Thr Ala Ala Thr Met Leu Leu Val Leu Lys
405 410 415
Val Ala Pro Arg Ala Ile Met Asp Val Met Gly Trp Ser Glu Ala Ser
420 425 430
Met Leu Thr Arg Tyr Val His Val Pro Asp Glu Ile Lys Gln Gly Ile
435 440 445
Ala Gly Gln Val Gly Gly Leu Leu Trp Lys Asp Trp Gln Gln Pro Asp
450 455 460
Asp Gly Pro Asp Asp Glu Asp Gly Gly Thr Ala Gly His Pro Val Pro
465 470 475 480
Ala
<210> 94
<211> 643
<212> DNA
<213> 红色糖多孢菌
<400> 94
ggtcggatct cccggttact acaggcacaa tggccacggc tggccatgct tggtctggtc 60
aggtgtccca ctgttctcaa gccgcagccg ctcagccgac accgagcggt gtgcatggca 120
cctgaacgcg tcaggcagtg acatttgccc aagcgacatg cccgctcgtg aagcggggga 180
ctgtacgaga gtacgcagag gccttcaccc ggtcgaatcc ggggtgcctt cggccgcttc 240
gacgcgggct cggccagtag cctgccacac cgccgatctt ggcgcaccgc gatggggccg 300
cttgtcgccc gacgagcgcc ttgctagcgt gcgcccctgc gatccggccc ggcgaggtgg 360
gagtcaccgg gccccgcgag gtgtgcctga cctcggtcgc agccgtgctg ccaggcaggt 420
ggggcgttcc gggggaccca cagcggaacg atcgagtact ctgtcgtacc ttcgtacaca 480
gttgtggaca actctgtgga cacctgtgtg ggcaggtgca gtcagggact gacccgcaag 540
gcgcagcgct cgccgatccc gctcgtgact cgtcgagtgc ggtgtccggc ctgggcagca 600
gcgacgcagg tcattgcgca ggcgagggga ggggagcaca ccg 643
<210> 95
<211> 11001
<212> DNA
<213> 红色糖多孢菌
<400> 95
tctccggtcg cgtcttccgc agggtcggcg cgccgggcgg cgggccgggt ccgggcgcct 60
tcctcgtgcc ggcggtggac gcttacgatg ttcgcgcgcg acgtagcgca cgccgctgta 120
gctcagttgg tagagcgccc gccttgtaag cggacggtca ggggttcgag tcccctcagc 180
ggctccgaaa ctaccagcgg aaacgccgtc gacaggtccc tgaccaggcg cttttcgtct 240
cactttccgt ctcagttgac gtcccagaag tacccgttga gctgatcggc gatctctcgt 300
cgcagttcct cggtgacgtg catgtagcgc tccttcatcc ggatcgagga ccagcccatg 360
tgatcctgga cggcccggtc tggaacgcgg agcagcatga ggaccgtcgc cgcagtgtgg 420
cgcgcgtcgt gcagccgagc atcccgaaca cctgcctccc ccaagatgtc cttccactca 480
ccccagtcgc gccgcggatc gatcggccgg ccgttgggct gggtgaagac ccagcccccc 540
tcctgccact cgctaccggc gtgcttgcgc tcccgctgct gcgcctgctc gtggcgcatc 600
agcagatcga agacctcatc tggcagaacg aagctccggc gaccagcctt cgacttcacg 660
tcgacctcga cgagcccacc accgtgccgc tgcgggcaac tgctcgcgtg cctggtgcag 720
ttcggcgggc acggacggtg gtggcccttc tcgtcgcgaa tgcagctctt gcggttgcga 780
tgctgggtgc agttgtccgg gcacgccacc cgatgaagtc gtgctccgca ggcgtgcggg 840
tcgtcgcatc cgtgttgcca agcctgccgc tgcaatgcct gccgtacgcg gtaaagccgg 900
ttcccgcggt cgaggcggtc ccacttgaac cccagggctt cgccttggcg acaaccgaga 960
gccaaggcga cgacgtatcg cacgccgttg cgccgcttga gcgcggccgt gatgatgctc 1020
ttggcttcct gcggcgtgaa cggctccact tccttttcct cgacgcgcgg cgctttcacg 1080
aaggcgatgg ggttcccggt gatgcgctgc cgccggaagt attcgttgaa tgccgttttg 1140
gcagtccggt gcacctgatg tgcggtccct gcactggcgc cggcggcctg catcctggcg 1200
tagaaccgct cgaagtgctc cggctcgatg cggtccatcc ggtgcgcgcc gataccgggg 1260
atcaggtgct tgtagaccgc cgttcggtag ccctgaagcg tcttgtaccg aacggagtgc 1320
accgcgatgt tctcgaccca gtgagtcagc cacttctcga ctgtccacgc gcgaccaggc 1380
ttccgcgcgt tgccgctatc ccggtcacgt tcgagcttgc ggaccttatc gatgacctcg 1440
gtctcggtct tggcttggac gtggcgacgg tcgggcttgc cgtcgtcgcg gacgcccatc 1500
gtgacgcgcc cgtgccagta gccgtccgtc tcgctgtagt agatgctgct ggcgccgttg 1560
ggggctcggg tgccttctgg gcggcgtttg cggggcatgg atggttcctc tcggtggtcg 1620
gtttcgtggc tggttgtggg cgcgcggggt cgccgcgcga gagcgcggtg gggggttaga 1680
tccggagtta gatcggcgga ggcgagttag atatctaact cgggggttag atcgttctgc 1740
tgctgggctg acctgcggaa agttaggcaa gttagccgag ttacggggtt agcgcccagg 1800
ttgggagcag cctgggaggc tcccaactcg gggtgagcga gggtgccagg tggctaactc 1860
gtctaactcg tctagcgctt cgcccgggtc gccgagcggg ccgcgttcgg tggcgtggtg 1920
ggacgctggc ccctgtcccg ctaggcgcta gctcgctggt cggtgccggt ccgggccgct 1980
agcgctcccg ctaggtctag cgggtgtggg cgctaggtct agcggtgcgg agccggggtg 2040
tgggtacggc ggtgccggcg cggtcgaggg cgagcatgag gccgcggagt gcggccagtg 2100
cggcgaagcc accgagggcg agggtgcgca ccatcccgag ggtcaccgcg agcgcagcga 2160
tgaggatcac gggcagcacc gcccgccaca gcaggacggc taccgcggcg gcggtgagca 2220
gggcgagggc ggcgagcacg gccagcacgc ggccggtgat gtccagcggg gtcatcgtgg 2280
gtctcccggg tgtggttgtg ggcggtcggt tcgaacgggg tgggtggacg gtgcggactg 2340
cccggcaccg ccgcgcagag gtgtttccgg gcggggtgtt cacccggtcc acctgtccac 2400
ctgggcgggg ttgggcctgg tggcgggtgg tggagtgagt gggtgggcgc gtgggtggga 2460
atccacccgg aatcgcggcc tccacccctg atccaccggg catccacttg cccacttgtg 2520
gggcgttctc gcaggccgtg cccagtgggc cgggccagtg gatggccagt ggatatccac 2580
tggcccctgc cgggctcact ggcccgttca ctggcctcgc gcggcccggc ggtacggggt 2640
gagggggtag ccgtcccagc cgtcccaagc gtcccagtgc tggtcaggct gggacggctt 2700
gcaggcgtgg gacggctcgt gccgtcccag cagtgcgcgc cgctggggtc ggtgggacgg 2760
ctcgtgccgt cccagggcgt gttgccgtcc cgcgctgacc tgcggtggga cggctgggac 2820
ggctgggacg gcaccccctc ccaccccgat attgggccga ctgggcgacg tgacggcggt 2880
ggtcatgccg cgccccgggc caggcggtcg atgtaggcgg tgagcgcttc gacggggacg 2940
cggcgggcgt ggccgatgcg taccgagtcg acgtcgccgg acttgatgag cttgaacatc 3000
gtggtgcggc cgaccgacaa ccggcgggcg gcctgctcga cggtcagcag cagccgcgtt 3060
gcgtccccgg actcccgggg ccgggggagg gaagcggggg ccggtgtcga caaccccgga 3120
ttccgggggt gtcgggcggt gtgcgcgggg cgttccctcg ttccctgttg tggggtttgc 3180
gcaggtcgag ccgagggagt ggcggaggga acggggtagg gagaattccc tgcctccccg 3240
gcggttccct gccgggttcc ctgtgccgtg acggcggtcg ggcggtgggc ggtgtgcatg 3300
gcggctcctg tggggacgaa gttgacgaaa ttacgaactt tggcgctgac ctggggtttc 3360
gtggggagca aagttcgtag ctacgaactt tgctttcagg gtttgccctg gtcaggggca 3420
ttgttcgtaa gttcgtggtg ttcgtaggca atgaagatct cggtggcgcg gcctcccttc 3480
cggccctccg ggcggcgctg ggtcttggcg atggtgtggt cggcgatgag ctggtccagc 3540
agcgcttcga tgcgggtctt cctggcgttg ccctggaaga agcctgcggt gatctcggtg 3600
cgggtgcgtc cctgtggccc ggcctcgcgg atgtaggcgg cgagctgggc cagcgccggg 3660
tcggcttggc ggaacaccgc gcgggcggag tcgacggcgt agcggatgaa cgccgccgcg 3720
gcgaccaggt gcgcgggctg gatggtgggg gtgccgtcga gggcggcgtg gatgccggcc 3780
acccggaggc agttgggtgc ggcgcgggag aggaactgct cgatcggtcc atcttcggtg 3840
ctgaagccgc cgaactcgac gtagagccgc cgccacaggt aggcggcctc gtcgctgaag 3900
ccgagctgtc cgagcgtggc gccctggtcc aggcgtgccc gcaggtcgac cgccaggcgc 3960
tcgatcagcg ccggatcggc ccccgtgcct gccgggagga actgggtctg ggcgacgaag 4020
accgggagaa accggttgta ggtgcctccg gccatgtcgg agtggctgac cttggcgtgg 4080
aactcgccgg gggtgatgtg ggtcaggatg ccgacgtggg cgtcgcgcac gatgcgggcg 4140
gtgacgccga gggtggacag gttgccgccc tcccacgccg cgcgcagcgt cgccgagagg 4200
gtgttgccct cgcggcgcat ccgcgccatc accgaggccc actccggttc gaaggccagc 4260
agtcgccgat ccccggaagg cagcagtgcg cgggggcgcg gcttgccttt gccgggctcg 4320
gtcccgtccc cctcgtcttc gtcggcgaac gcctgggtca ggccctcgcc ggaggtcagg 4380
ccgctgtgga tgttggaggc cacgaacccg gaatcggcgg ccgtcaggag gcgtttggcg 4440
gccgaccagc ccgcgccctt gcggccgatg ccggtccggc cgatgaccat cggccacacc 4500
agcagcgggt gccggtcgtc gccgacccga atgtgtgggc gtccaccgag gtggaccccg 4560
gttccggcca gcagggaggc caggatgttg gtggggtcgg cctcgctggt cggctgcacc 4620
tggcggacca ggtcgccgag gaaggtctcg aacatcgcct catcgcgggc ggggagttcg 4680
gcgcgggcgc tggcgatctg agcgagcgct tggcgttcgg tttccgggtc cggcggcaac 4740
atcggtcccg tccctgtgcc gggagcctcc gggctcgctg tgggctggtc ggagtcggag 4800
accaggcgca gccgccgagg ctgttccgct ggggtggctg cggggtgttc gggcttgctc 4860
atgggctacc gctccgatgg gtcgtgagtg ctgttcagag gggttgggaa cccgggtccg 4920
cacccgggtt cacggcttct gcgccgcctt ctccggcggg ttctcgctgc cgttctcggt 4980
gatcttggtg aggttcttcc catgcaggtg agaagcggtg agaacccgga ggaatcgacc 5040
tcgattcgtg caggccaacc aggtggatcg aggccgatcg agtcccggtc gatcgacccc 5100
cgatccccgc tcggctgggt cgttgccggg tctccgggcg actactggcg gtgacgctgc 5160
ggcggtgctc gggtcgggtt cactgaggct ggaacagtgg ggggcgggaa tccgggtctt 5220
aaacccgcaa acccgcaaaa gggggtgtga cctggtgttt tgtggtgcgg gtttggtgcg 5280
ggtttgcggg tttggtgggc tgggtttggc gggtttgcgg gtttggtgac ggctgtggcg 5340
ggtttggctc cccctcctgt cccggcttct ttttcctggt cattggggtt ggttgcgggg 5400
tttgcgggtt tgcgggtttg ctacggcgct tggcgatgtg ccgggcggcg tgcccgtggt 5460
gacgggcagg gcgccggtca cgccgcgtag tgcgaacggt ctgcctcggg tccgcagccc 5520
gcgttcgctg gtggtttcgg gctcccaacc cgcgcggagt tgggagcacc cccgtcgaac 5580
gcggcgggtc ccggggcggc tggtctggag gggtgggaga cccggcccgg tggcggcggt 5640
tcaaggccca cacggggtgg gtggcgggat ggcgccaccg ggccggggtg gtcgggatcg 5700
gcggggagga ccggcgccgg tagtggcttc tggccccaca cggggtgggg tggcggttgc 5760
gctaccgggc cggggtttga gctgttcgcg aacctgtcgg gacgcttccg acagggcaaa 5820
acacgccctg tggctgcgac cagcaggaac agccgtttcc gctgttcccg gcgggtgtgc 5880
ctgcgaccag cggaaacagt gtgtttgcgc tgttccctgg gggtgtggcc gcgaccagcg 5940
ggaacgcccg ggctagttcg gccagatcgc gtccggctcg agctccaccg ggtgcaccgc 6000
cggggtgtcc cgtcccggtg ccggcgggcg ggtgaccgcc cggaccgcgt cggcccgggc 6060
ctgagccagg gcgtagcggc gccggtcgaa cgtcggccca ccggaggcgg ccagcaccgc 6120
cagcccgttc tccagccgct cgatcgcctt gcggggcgtc ttgcggtgga ccagggccac 6180
gaaccgagcc aggtcgtaga cctcggcgtc gcgcagctgc gcgtcggtca gcgggcaggc 6240
gtagagcacg gtcaccacgc catgcacggt caccttgggc acggtcatca cgcggccacc 6300
ccttccagct cgatgcgctc ggcgccggac aggccgccga tgagcgggtc cttcgggctg 6360
gagaccacct gtggcgtcgg ggcgccgcgc tcgatgtcgg cgcgggtgac caccgggtgg 6420
ttgcgggacc aagcgcccgc gatgcccagc atgcccgggg tggtgccgta gacctcggcc 6480
cagagctgct ggtaggtcga cgagaccacc cgcacgccgc gttcccactc gccgagcagc 6540
ccgagcaggg tgcccggcga gtgcgcccgg atgccccggg accgggccgc ttcggccagg 6600
tgctggcagg cggtcttctg cgaccagccc cgggctgtgc ggtactgccg cagtcgcacg 6660
ctcatgtgcc tcacgccctc gtcagtgcgc ggcgcggtgc gggcaccccg gggcggccgt 6720
agagctcggc gacccggcgg cggatcatca tcagcagcgc gtagtccccg ctgcccggct 6780
tgatgtcctc gatctcttcg cgggcgaggc agatgcggtt cgagccctcg tgcaggaagg 6840
tctccagcac catctcgtgt gcgtactggt cgttgccgag ttcgcgctcg tccagcaaca 6900
tcccgccgtt gacggcgatc cagaacacgg cctcgatgtc ttccagcgac accggcacgc 6960
tcatgctcac ctgcatcacg atcggggtgt cgttgtcctc gcggtgggtg gggatgaacg 7020
tcgcgtggtg gtcgccgacc atgccctgtg cccgctcggt gtgcagtcgc atcgtcacgc 7080
cacctccccc gcggtctcgt cacggtcgtc ggcggcggcc gactcggtgc cggtcacgaa 7140
cgcctcgtag gcggcctggc cgcactgctc caagtagatg ttcagggcgg agccctcgat 7200
tcggagggtg cccttgccgg taccgagctt gagggcgtcg agcttcccgg actcgatcgc 7260
ccggtagatg gtggccttgg agatgttcag caggtcggcg actgccttga ccttgaacac 7320
ctggttatcc tcgaagcgca tcgtttctcc atcggtttcg atgtgcgccc tggtcggtgt 7380
tgcagcactg accagggctt tttcttgtcc ggctgaggcg gttgaggcat ctgcaacaac 7440
cggaacgaga gcaacagtag cgacgagagt taagtgagtc aagtctctgt cgtgacttcc 7500
ttgagttgac gatcgcgtac ccttgctgac gtggcaaaac gcgaggtaga gaactctcag 7560
gcgccctacc gtcaggtcgc cgacgccatc cgcgcgagca tcacgaacgg gacgtacggg 7620
ccgggggaga agctccctac cggtaaggac ttggctgacg agtacggcgt ggctatcaac 7680
accgcccgca gcgcgctgga aatcctgcgg caggaggggc tgatcgctgt ccgccatggc 7740
caggggtcgt acgtcctcag ccagccggag tccggcggag ccgatgccga gaacgctgac 7800
gtgcccagcg tcgcggcggt gcatcaacag cttgcggaga tcaaccggcg actcgcggcg 7860
atcgaggaac gcctgaacga acttgcccgc tgacctgcca gcagctaccc ggcaactgca 7920
ccgaagaacg tcttgagcgc gccgaacgtg gtcttcacga actccgcgga ttcggtcggc 7980
tgctgcacga ccataaccac gaccacgatc agcacagccc aaccgaacag cttcgggagc 8040
accccgccgc cggtcttcat catcggaaac gactgcttgg ccatgacctt ctccctcgtt 8100
cagagtgttg actgctttcg ctgtcatgcc tcaagaatcg atcgactttg cgatgatggg 8160
gagatgagtc gcgggtgagt cggaggtgag tcgttcgact cacctggctc tgaccagggg 8220
gaacgccagg ggagggaccg tgcccgtaga ggaacccgaa gcaacgcctt tgaagcgcgc 8280
acgtctcgcg agtggcatgt cgcagatgga gacccgcacc aagctccgcg aagtccgacg 8340
tcgtcgcggc aagatgcccc cgaaagacgt gagcctgaag cggatgtaca cggagtggga 8400
gcagggtcgc gtccttccga ccgactggcg cgacgaacta tgcgaggtct tcgcgctccc 8460
gccagcggct ctaggcttcg tggacacggc gccgccgccg tctgcattgg acattccatc 8520
ggcgctggag atcaccagga tcgacgccga gatcgtcgaa atgttggagc agcagaccga 8580
ccactaccgt ctcatggacc ggaaggtcgg cgcggcgatc atcccgcaga ccgtcgcaca 8640
tgttgagcac atggagaagc tgttacgcac tgccctgcct ggaaagcact cccacctggc 8700
cgcggtcgca cttgcggagg gcgcagcctt ggcgggctgg caggcgctcg atgcaggtga 8760
cgtcacgaag gcgtggaacc tgcacgacgt cgcgaaagct gctgcccggc aaggtgaaga 8820
ccctgctgtg ttcgctcacg tgacggctca gcaggcgtac gcgcttctcg acgccggccg 8880
ggccaccgaa gcagtcgagc tagtccagta cgcacacacc cccgaaatcg cgcggcgtgt 8940
cccggctcgg cttcgtgcct ggcttgcagc tgcggaggcg gagtttctcg ctgccgctgg 9000
ccagcaccgc caggcgctca cgatgctcga tcaggcggcc gacgccctac ccgaaggcga 9060
caccgatccg gaactgcctt tcctgatgct gaacagcacg cacctcgccc gttggcgtgg 9120
tcactgcctc gccaggctag gcgctgacga ggcagtcgat gaccttacga gagccctgga 9180
gggtagtcag gtcttgtcct cgaagcgggc ggagtcgggc cttcgggtcg atctcgcctt 9240
agcgctgcgg aagcgtggcg acatcgaagg ttcgaaaacg catgcgcaga gagccgcgga 9300
actggcgggc agtacgggat cagcacgaca gcgcgcacgg atcgcgaagc tgctcgtgga 9360
ctagctcacc tgccgagagc caagtagtgg agaaggccga cgagggtgcc ggagttcttc 9420
acctttccct cgcggatcag gttgggcacg ttggccacgg ggacccactc gaacttgcct 9480
tcgttgacct ccgtggcgtc tccgaccagc tcagcgcccc ggccgagaaa gacgtggtga 9540
ggattgcgca gcatgcctac tgctggttcg aatgtgacta gtggttcgat ctttcgaggc 9600
ttatagccgg tttcctcgat cagctcccgc aacgctgtct cctgcgggtc ttccccctcg 9660
tcgatgatcc ctccggggag ctcccagttc cagatatccg gcgcgaaccg gtgccgccat 9720
gccatgagca catgctcttc tgcgtcgtcg agaagcacgg tcatcgcagg aggtggaaac 9780
cacacagtgt ggtgctcgaa gcgctctcct gaaggttgcg agatatcggc caagccgacg 9840
cgtacccacg cgctctcgta cacaggacgc tcaccatgca cggtccacgt gccctcttgg 9900
tcagccactg atcagccctt ctctcggact atcgaaagtt cgttctcttg gtgttccccg 9960
gtgcagctag cgagaacggt aggcgtctcg cctatgagcg acggtcacca cggtgacaag 10020
gatctgctcg tcgttgatcg agtacagggc tcggtattcg ccgcgacggg tgctgtgcag 10080
ttcctcgaat ggcgcatcga ggcgcttacc cagacggtgc gggttgtcag cgaccggccc 10140
cgtgaggtgg tcgtgcatcg ccatggccgc agccaagggg aggcggttca tctggcgcct 10200
ggcggcagcc gtgtagctga tcgtgtagct gcctcgtggg ctcattcgtt ggccgcgcgt 10260
gctcggaggt cctctgccat ctgatcagcg gaaaccgttc ggccggctgc catgtcggcg 10320
agtccttcgc ggaggtcccg tacgagctcg gagtcggaga gcacttcgat cgtttctcgc 10380
agccgatcga tctcgcccga cggcacgacg tcggcaacgt gctcgccatg cgcgatgacg 10440
ggcacgctct cgccacgttc ggcacgctgg acggcttcgt tccatgacgc caggccatcg 10500
gcggacacgc tcactggctg ctcgctcatg gtgttcattg tgcggcatcc tctcttcggt 10560
cgaccagcgc cgaaggctgg aacagggttt gtcagggagt gccctctagg agctagaccg 10620
ctggtgaggc cgtgaacgcc gctctagcgg cccctctaga tctagaggcc gtcacctcta 10680
gatctagagg gctccgtagc ggccctcagg ccgcctctga cgaaccgcgt gcgtcctgcc 10740
gaggcctggt ggggcgagta gcgccacagc cgggagatcg gcgctcaaga ggccctgaga 10800
tcgccacaga cgccgcgaag gcgtccaccc ggtaccagga ggccgggcaa ccgggttgtg 10860
ggccgcgccg cgctccgctt cgtcggctca gttcccggct cagttcgccc ccgtacaacc 10920
acccaaccac tgttccagca attgcgctga ccagcagttt tgtacgactt tgtgctgatg 10980
tgaaccacag accggagatc t 11001
<210> 96
<211> 17501
<212> DNA
<213> 红色糖多孢菌
<400> 96
ccgcattcgg acgccgcctt gttggaaggt gcgcgcactg gcaatcagtc gaacgtgcgt 60
tctatgcttt gcgtgctcgg tggtggggaa gaccgccggg ccccgcgggc cggtcactgc 120
accccattgg tggcgcggcc cgccctttac atcggggcgg ggttggtgac gagcagagat 180
gaccaatggt ggggtacccg ccggcctgtg ggcgagccca ggcctgtgtg ggtttacctg 240
ccgttggtct tcccgcctgc gcgggtggtc agcagggagg ttccgattgg tgtccgggcc 300
tacgggatcg acaacaccgc caccgtccct ggtgagctgc tggcgtggca gttgaccgcc 360
actggcgatt ggtgggctca gatccggctc accttgcaca accgcaacca gcgcggcgcg 420
ctggagaccg agctgtgggc gcccggagcc gccgtacgcc cgcggtagca ggtcaatggg 480
tatcgcggtc gccgctgcgc ccggcgcggg cgtgttcgac gctggcccgc aacgcctgca 540
tgaggtcgac ggcttcggtc tcgcgtggcg gtgggatgcc gggttcgaga gtgccgccgg 600
cgcgtttggc gtcgatgagt gcctggacct gttgctggta ggtgtcgtgg tagtcggccg 660
ggtcccagtc gatggccatg gcctcgatca actgcacagc catccgcaac tcctgctcgg 720
atgcaccgct gtggtcgggc aggctggcac cgagttcgcg gtgggggtcg cggacttcgt 780
cggcccagtg cagcaggtag accgcgagca cctcgtgttc ggccttgagc gcggcgaggt 840
actggcggtt gcgcatgacg aaggtggcga tccctgcccg gttggcggtg gccagggctt 900
cccggagcag gccgtagacc ttggtgtact gcggtccaga tggggcgagg tagtaggtgt 960
cgcggaagta gaccggggcg atctcgtcga ggtcgacgaa cccgacgatc tccagcgtcc 1020
gggagcggcc cggggcgatg tcctccagtt ccttcgggtc gacgatgacc cagccgtctt 1080
cggtggggta gcccttgacg acctcctcga aaggcacctc ctggccggtg cgctcgttga 1140
cccgcttctg ccgcacccgg tcaccggtgc cgcgctggac ctgatggaag cgaatcgtgt 1200
gccgctcgac cgcggtgaac aactgcaccg gcaccgacac cagaccgaaa cgacagcact 1260
ccaccccaca ccgcagacgc catcagcacc acctccctcc agccgacgtg accgacccca 1320
gcaccaactg accacgggaa ccagaggcag aggtcacccc ttggcaaaac ccccagcccg 1380
tcgagaagtc cgctctacgg cgatctcaga ggctcttgag aaagcatgtg cggtcgctcg 1440
tccagggcca ccggataagg gtcaccccgg gtcttgggcc ctgtgtcgca gcctcagcgg 1500
cgacgaggcc acccttctgc gtcagctagc catgccgcgt gccgggctcc taagcctccg 1560
cgcgaggtag cttcgatgca tggagctggt tccccgcgcc gccacgatcg cagagcactt 1620
cgtccgccca cttggtcggc gatggctgca cgtccaagct gtcgccgaac gcgcgcatga 1680
actgagccac gcagtgccgg ccgccgaccg ggacatgctc gtggcggctg cctggctgca 1740
cgacattgga tactcacccg agattggaca caccgggttc catccgctcg atggggcgcg 1800
gtacctgcaa gccgaggact ggcccgaggt gctggttaac ctcgtcgcgc accattccgg 1860
tgcgcggttc gaagcagcag agcgagggat ggcaggtgag ctagcagagt tcccgttcga 1920
cgactccccg ctgctcgaca ctcttgcgac tgccgacctc acgacgggac catccggcga 1980
acggctgacc tacgacgaac gcatggacga gatcctcagc cggtactcac ccgacgaccc 2040
ggtgtatcgc acgtggacca aggcgaggcc gatcatcgcg gaagccatcg cgcgtaccga 2100
ccgccgcctt gccggcagtc atccgatgta gggctcggtc cgcgcgtcgt cgagagcgtg 2160
gtcgatacgg agccgcatag acgggtggat attgaggccg ttgaggtccg ctgggggaac 2220
ccagcggacc tctttggttt cactgccgtc ctctcgcggc gtgccaccaa tccatcggcc 2280
ctcgaagcac agagagaact gctgacggac ctcaccgtcg tcataagcca tgacatggtg 2340
cgggttggtg tacgtgccaa cgagcctgac aacctcaatc gtcagcccgg tttcctcctg 2400
gacctcgcgg accacagtgt cggcgatgct ctctccagcg tcatgtccgc cgccgggtag 2460
agcccagagg tcgttatcca ctttgtggat cagcaagatc tcgccgcgct cgttcctcac 2520
cgcagccgtc acagacggca ccaccgagtt ggcctccggc gcgttcggat cgttgaagta 2580
gtccaccctt gccattcgtg cctcctacgt cggttcgggc gtggcctgct cccacacccg 2640
gtcaaaggac tccatgtagt gcttccacat ccgaccacca ggcaactcgc gaaggtgcat 2700
gacggggttc tgtccggcga gcgcgccgaa ggcatgtccg ttcacgagca actgtccgtc 2760
gaaccggtag agcgagttgt agaggatcgt tccgtgtgtc cgcacatcga ccttgggcag 2820
gcccgacacc tcgctcaggt aacggcgcat catctgcacg cggccttcga gcccacccgt 2880
ggtgccttcc tccatggctc gttggacgac tgcgggcgat ttctcatccc cgaccacgaa 2940
gcggaactga acgccttgtt cggccttctg tcggacgatc gggatgatgt tgtgctgctc 3000
gacaaggaac tgccccgaga agacgaggac ctccatcctc tccttcacgc cagcgatcag 3060
ctcgttccac agcgagtacg gcacgtccga acgtgtcggg tagaggtgga ccagctcggt 3120
ctgcttggtc ggctgcgtat ggaggtcgcc cgccaggtca ggccataggt gtacctcgtc 3180
gatgcttagc aaccccgcaa gcttcttccg cgtcgatcgg tgcggcttcc ggccgtcgtg 3240
ggtgatccac cgctcgacgg tcttgcggtc gacctgtaga cgttctgaaa cgtcctcgat 3300
cgtcagcccc gcagcgttga aagctgcacg taggcggtca ttcggcactc tgcccgctcc 3360
cctcgcggga cgttcccagg acggattggg acgttacccg gtcgatcaga acgtcttcaa 3420
gatccctgca aaggccgtgg gagcgtcccg cgaattgccg tgaactagag ccatcccagg 3480
agaaaccaac tccaacaacc ggcgccctcc agggcaacgg cggagagagc ttaaggagat 3540
ggcgatggcc aagagtccga ttccgatgat gaagaccggc ggcggtcttc taccgaagtt 3600
cgttggcgcg ctgctcacgc tggcgttcct cgccatggtg atcaagcagc ccgccgccgc 3660
ggccgagatg ctgaccggcg cgggcgcggc actcggcgcg gcggtggaag ggctcatgag 3720
cttcctgctg cagctcggaa agtagagagc gctcatggcg aagtcctgct acgtcgtgtc 3780
gctccccgac cgttcggcga gcattgccag gcgggcttcg aggtcggcca gctcagcgct 3840
gacgcggtcg acctcgaccc ggaggccgac gacggcttgg cgaacggcgt tgatctcccc 3900
tgcgacgtcg acgtcttccg tgcgatcacg gacctgcgcg ccaacgtgcc gcttgatcgt 3960
cacgaggccc gcgtctcgca ccagcttcac cgcggcgatc gccgtgttca ccgccacgtc 4020
gtagtgatcg gcgagctggc gatacggcgg cagtgaagcg ccaggagcga actcgtcagc 4080
ctcgatccga gcgatcaggt catcggcgac acgtcggcta gctgggcgtt tgtcttcgga 4140
ctcagcgctc gcactcacgt gatcagccta cccaaaacgt cttgagacat ccggttgaca 4200
aggccacccc caacccttaa tgtctcaaca catcaaggat gtctcaagac atcagagctt 4260
aggagaacga catggagtac ctggacttcg agccgtcggc agatgagctg gcgacctgcg 4320
aggcagagct ggaggactgg gagcggctgg ccgtacggga ctactgggcc gcggtcatcg 4380
ccgaagagtt gggagccccc gagccgcagg ctcggccgtc ggtgtggcgg tcgatgggcc 4440
cgggcgagcg ggagcgcttg cgccgcaccg cgcggcgggc ggccaacacc acgctgcgac 4500
tggtggccga caacgtcgcg gtcgagcagg gctcggcagc tcccaacttc ggggaggcgg 4560
cgtgatggcc ggcctcgagc ctgtcgacat cacggcgctg acacggacgt cgattccgct 4620
ggaggcggtg aaccgcttca acggcggaac ggtgtggagc acgtggggac agttccacct 4680
cgctccgtgc gactgccaca gcctctactg gtctgaccgc gacgtcttct acgtccgcga 4740
cggggagttc tacgcgtgcc cgctgtgggg gaccgagtga tggcgcggca gtggccgatc 4800
gtcaagacgg tgctgtggga cggcacgtgg gagttctgcc acggccacct cgacgggctg 4860
ccggtgttcg cctggcgcgg tcgcccttgc tcggtcccgt cccggctcga gctggccacc 4920
cgccgccagc tccggcagat gggcctgtgc cccggtgggg cggatccggt ggcgctgctg 4980
cggttccgcc accgccagcc ctaccggcgc gaagagcttg ccgagctgtt ccgcatcgac 5040
ctggccaagc ccaagcgcac cgccaccccc gcgcagcggg aagcgatcga gcgggcgctg 5100
accgcccgtc gtacgtgccc gacctgcccg cccgggcagc aggtcaagcc ctactacctg 5160
ccgacctcgg ccgggcagtg ctgggactgc tacctgcccg acaccgccgc ggcctgacga 5220
accacacagc accaacacga cccatcgcat caggagaacg agcgtcatgt ccgagccccg 5280
catccagatc ggcggcaaga cctacaccag cgagaactgg cacgagatcg ccgaggaccc 5340
gaacgtcacc ccggccaacg ggcaggtcgt caacgtcgcc cacggcgaca accacggcat 5400
ccaggccggc gccatccacg gcggcatcac cttcaaccgc aactgaccct cagggagaga 5460
tttcgtgtcc agcatcgacg acatccgcag cgtgctgtcg caggccaacc tccagtccgg 5520
cgaggtgatg gccaccctcg tcgagtccca gcgccacatc gaggccctgg ccaacatggt 5580
cgccaccgtc acccagggct cggacaacga gctggtgcag cgggccctgg ccaccttcgg 5640
cctcgcccgg acccagctct ccgaggtcgt cggcgtcatc cacgacggaa ccgaccacct 5700
cagcaactac cagcagaccc tctgaccccg ttcccccagc acaccaaccc cttcttcagg 5760
aggaagccgt catggccggt atcgaagacg tccgcgcgaa cctgtccgcc gccaccaccc 5820
aggccagcga agcgctctac gcgctcaagc aggccgcgct gaccatcaac gaggtccagc 5880
gcgtgctcga cgacaccgtg gccagcagcg cccgggagtc ggcccagcac gccatcagcg 5940
cgttccacca ggcgttcagc caggccgaac aggcccagga gctggtgatc tccggcaggg 6000
actcgatcga cacctacgcc gcccagctct aaccccaccc gcacatccac ccgctctgtc 6060
gagaacgcga ggagaacgaa ccgcaatgtc gagcatcgaa caggtccgcg ccgccatgca 6120
gtccgccacc taccgcaccg aacaggtcgt ggccgcgctg cagtcctccg cgctggagct 6180
ggaccagatc gacgccctgc tgcagaacgt cggccagggc agcagcaacg agcactacaa 6240
ccgcggcgcg ctggcgctga tccaggccac cgaaccgctg cggcaggccc tggagctggt 6300
gcgcaccggc gagaccgacc tcaacaccta cgccgcccag atctagccgc ccgcctgcga 6360
gtccgaaagg gaccaccacc gtgatccagc tcgccattac cagcttcggc tacctccacg 6420
gccccgcgcc ggaggccacc gccgtcatcg acctgcgcaa ccacctgcgc gacccccacg 6480
tcgaccccgc cttccgccag ctcaccggct tcgacctcgc cgtgcacgac aaggtcctgg 6540
ccgcgcccgg cgccgccaat atgcgcgtag ccctggcgga gttggccgcc gccctgctcc 6600
acaccgggag cgaaaagctc gtgaccatcg ccctgggctg cgccggcgga cgccaccgct 6660
ccgtcgtgct ggccaacgac ctggccaacg tcatgcgtgt ctgcggctgg cagggcgaac 6720
tcgaacaccg cgacatcgac aagcccgtca tccaccgcac caccaagtga gaggagcaca 6780
tccgatgagc ctgaggagtc ggaactggga ccgctcgccc gaaaccgagg gtgaccgccg 6840
cttccacgac ctgcgcgaca gcggctacac cggcccgatc gaccaggacg gaaaccccgt 6900
caccagcggc cgggacgccg acatcctccg ccgcatggcc gaggaacgcg gcgaaaccgt 6960
cgactggtga ccccgccccg gcccggcagc cgcaaccacc acgaagcacc tgccgggccg 7020
ggctccccac tgatccttcg aatctgcaag gagaagcccg atgctagacc ccgagaccgg 7080
cgacgtgacg gtcacgatcc ccgctgacct cgcggccaag ctgagcggcg cctacgaggc 7140
gtggcgcgcc gccctcgacg acgtcgacgc cagcggcgtc gacacggacc caacccatct 7200
ggctgccctg tggcgggccc gctcgcgtac cgagctggct ctcgccgatg tctacggcga 7260
gttggcctac tccgtcggcc cgttcgtgcc cctgatcaat gcggtgtttc gcggcgtcga 7320
cgcctgccga ggcgccgccg accgctacgt cgggatcgcc gaacgcctcg aagggagggc 7380
gtcgtgaatc gcgtcttctc gatgctgcga gtcgcggtcc gcttcacggg ctgggtggcg 7440
gtcccggtgc tgctgctggt ggcgctgtcg ctgctgtccg gcgtggtgcg cacgaccgcc 7500
ctgggcgcct tctgtgtggt cgtggcgctc aaggccgcga tgaccgtgct cgacctggtc 7560
ggcgagtacg ccccgaaccc ccgttacggc ttccgattgg aggtgaccgg tcgatgaccg 7620
cggcgaagag tgcctaccca gtgccggtgg acgagctgct gccgcaggcc cgccagctcg 7680
ccgacgacct gggcacgatc ccgccccgca accggctgat gtccgagctg aagatcgggg 7740
caccgaaggc caacgcactg ctggacaagc tcaaggccga cccggacccg gccacggccc 7800
gtccggcggg tctgcacctg gtggctgagg gccgggctct gcccgagtcg acgaccgagc 7860
cggacccggt cagcgacgcc cctgccgagc ctgccgcacc gaccccgtcg gttccggggg 7920
cggacccggc cacggtcgag gcgcacaccc cggcggcgga ggggtcgtcg gagcaggtca 7980
ctgcgcccgc agacccgggc acgcccccgg gcgaggtccg ggagcgcaag gcggtgtcga 8040
cgtggccggt gctgctgctg gcgctgccgg cgttcgtggc gatctggtcg ggctgggtgg 8100
gcctgggcgg gctcaccggg ttcgggatcg tgcacccgct tccggggatc tgggacgagt 8160
tcgaactcaa caccgcgatc acgctgccga tcggggtgga gacctacgcc gcctacgccc 8220
tgcgggtctg gctctccggg caggtcccgg cgcgagcccg ccacttcgcg aaggtctccg 8280
cgctgggctc gctggccctg ggcgcgctcg gacagatcgc ctaccacctg atgaccgcgg 8340
caggcatgac cgccgccccg tggtggatca ccaccatcgt cgcctgcctt cccgtggccg 8400
tgctcggcat gggcgccgcc ctgacccacc tgctgcacac ccccgacctg gaggtgaccc 8460
gatgaccacc cacgaccacg agccccagca cacccccgag gtcaccgaac ccgacaccga 8520
ggcgcaggtg ttccacctgc ccgtcgaacg cgccgagccc gccgacaccg caggtgccgg 8580
tgagggtgag ggtgaggtga tcgagggcga gatcgtcgag ccgccccagg ttgaccagcc 8640
cgagccccgc ggcaccgggt ccgcgctggc gcggacggag aagcgcgagc cgatccttcc 8700
cagttgggcc aaggactccc aggagttcgc cgacaccgca cggtgggcgc tgggctatgc 8760
cggacatacc gccgggtttc acgcggtgcg ctgcccggtc tacatcgccc gcatcatcgc 8820
ccgggtgccg cagggcacgc tgcggctgct gcgcgggctg gctcgatggt tgaccgacgc 8880
cgaaggccgc ccggtgcgca acgccgcggc ccgtcgcgag gacgccacgg agtacctgaa 8940
gctgtccacg cagcgcgacg ggcggatccg ctcccgcgcg gtcctcacgg ccgggctggg 9000
ggcggccggc atcgcggcgt tcctgctcgg ccgggcgatg ctgcccgagc tggtgcagtg 9060
gtcgatcgtg gccgccgcga tcggtgggct gggctggctc ggtgctccgg cggacaagcc 9120
gatcgccagc cgggcgatcg aggccacccg ggtgcccaag ctgaccagcg acgcggtgac 9180
ccgcgcgctg gctgcgctgg ggatttccca gatcaaccag gccatgggca agggtgggga 9240
gggcatcggc tacccgcggc cgatcagccg cgatggcaag ggctggcgcg ccgacatcga 9300
cctgccccac ggcgtgaccc cgggcgacat catggaccgc cgcgaaaagc tcgcgtccgg 9360
tctgcggcgc ccgaccggct gcgtgtggcc cgagtccgac aacgccgagc acgccggtcg 9420
gctggtgctg tgggtcggtg accaggacat gcgcaaggcc aaacagtccg cgtgggcgct 9480
gcgcaagggc gtgcaggtcg acctgttcca gccccagccg ttcggcaccg accagcgcgg 9540
ccggtgggtc gacctgcggc tgatgttcac cagcgtcgcg atcggcgcga ttccccgcat 9600
gggcaagacc ttcgccctgc gcgagctgct gctcatcgcc gccctggacc cgcgcgccga 9660
gctgcacacc tacgacctca agggcaccgg cgacctcgac ccgctggaga aggtcaccca 9720
cgcccacggt gtcggcgatg acgacctgga cctgcacctg gccgacatgc gggccgtgcg 9780
caccgagctg cggcgacggg ccaagctcat ccggcagttg gccaagcagg gcctcgcccc 9840
ggagaacaag gtcaccccgg agctggcctc cacgaagtcg ctgggcctgc acccgatcgt 9900
catcggcgtg gatgaatgcc aggtgtggtt cgagcacgcc aagtacggcg aggagttcga 9960
agagatctgc actgacctgg tgaaacgggg tccggcgctg ggaatcatca tcatgctggc 10020
cacccagcgc ccggacgcca agagcctgcc caccggcatc tcggcgaacg tctccacccg 10080
gttctgcctg aaggtgcagg gccagaccga aaacgacatg gtgctgggca cctcgaagta 10140
caagcagggc gtgcgggcca ccacgttcgc ctgggccgac aagggcatcg gttacctggt 10200
cggcgagggc tccgacgccc agatcgtgcg caccgtcgcc ggactcgacg gccccgccgc 10260
cgaaaaggtc gccgcctacg cccgccacct gcgcgagcag gccggaaccc tgtccggaca 10320
cgccatcggc gagaccgtca cgtccgatga ggaccaccgc cgggacacgc tgctggacga 10380
catcctcgcc gtgaccccgg aaaccgaggc gaaggtgtgg aacgagacca ccgtggcccg 10440
gctcgccgag ctgcgccccg aggtctacgg gagctgggaa gccgaccagc tctccgccgc 10500
gctcaagccc cacggcatcc gagccaaccg tcaggtgtgg ggcaccgacg agagcggcga 10560
gggccgcaac cgccgcggct tccaccgcga cgacatcacc aaaaccgtca ctgaacgtga 10620
ccgaggacgg gaagcgagct agcccccgcc gggtcgctag gtctagcggc cggccccgct 10680
agacctagcg gctccgctag caacccatct ccaccgccac cagcgcccta gtccctagcg 10740
gcgcctggcc aaacacgccc aaaaacgcct gctggaggca cctttgaccc ccgccgacct 10800
cgctaacacc agcctgaccc tgctcctcgg aatggtcacg ctctgttact cgctggtgtg 10860
tgtgatctgg ccgttcaagg actgccgcac ctgccgcggc accggccgcc tccgctcccc 10920
gttcctgcgc agctaccgcc tctgccccgc ctgcgaagcc accggcctgc ggctgcgcac 10980
cggacgcaaa gccgtcaacg ccctgcgccg cgtccaccgc cgcaaccgcg gccactgaac 11040
cggcaaccgg aaggacacca ccgtgatgca catcgtcggc agcgcccgct ccgccctgca 11100
ccagctcgga ctcaccagcg ccaagaccct ctgcggcaaa aagctccgcc agccagagga 11160
cggcgccgcg aagaacgccc cgctgtgccc ggagtgctac cgccgctccg gttggaccca 11220
cgacaagcgc cggcagtgaa caccctccag aaaggacaca tcgccatgag caggcatcgc 11280
ctcgaacccc gcaaccccaa caacgttcgc gaggtggtcg tcggctggga ctcgcccatg 11340
cggaccttct acgccgtcgt cgaagaccac agcggcgcca tcccggtcga cctcggcgac 11400
tccatcgagc ccgtgctccg tcccggggcc gtgctcgatg cggtccgccc ctacgccgcc 11460
atcccgcccg gcctcgacga cgagctgctg cgcgacgcgc tggccgaccc cggcatccgc 11520
gccgcctgac ccgaaccccg tccacgcggc cccgcccgcc attccgccac agaacccggg 11580
cggggccacc acccctcaaa gataggtaac cgtcatgttc gcagagatcg ccatccccgt 11640
ccttaccggc ggatgggccg ccgtcgccac cgccaccacc atcaactacc gacgccgcac 11700
gctgaccgac ccggtcaccg gcatcggcaa ccgcgccgcc ctctaccgca ccgcccgccg 11760
caccaccgcc cgcagcgggc tcgtcggact gctcatggtc gacctcgacc ggttcaagca 11820
gatcaacgac acccacggcc accccttcgg caaccgcgtc ctgaccgcca tcgccacccg 11880
cctgattgag aacacgctgc gcggggagcg cgcggtgcgg ctgcacggcg acgagttcgc 11940
gatctggctc ggacgcatca cctccaccgc ccgcgccgaa ggccgcgccc tccagatcgc 12000
cgacgccctc gccgaacccc tccagatcgg cggccgtcgg ctcgtggtgc ccggcagcgt 12060
cggcgtcgcc gtcgcccccg cccgcacccc actcggcgaa ctgctgaaca ccgccgacca 12120
gcacatgtac caggtcaagg ccacccacca cctgcccgca ctgcccgccg gcgagccgcg 12180
gcgcgcccgc gaccgggcca ccccgcccga ccacgccgcc tgaaacccga ccacacccac 12240
gacaggaggt gactccgcga tgaccgaccc gatccggctc gcgcactggc tgatcgagca 12300
cggcatgtac gtcttcccgc tgcgccccta ctccaagcgc ccgttcggca actgccgccg 12360
ctgcaaggac aaccgctgca cccagccgtg cccgtgcctg accgccgacc gtccctgcca 12420
cggctacctc gccgccacca accagcaccg ccgggcccgc cgctggttca cccgtatgcc 12480
ggcagccaac gtcggcatca gcaccgacct ctccgacacg gtcgtgctcg acctcgaccg 12540
caagcccaag gctcccgcag ccgccgcgca cgacgtgccc atcctcgtcg ccgacggatt 12600
gggagccctc gacgcaatca ccacgcacga gggcgccgac tggcccgaca ccctgaccat 12660
tgccaccccg tccgaagggc gacacctgta cttccgccgc cctgcggggt tggaggtcgc 12720
cagcgacgcc aacggccggg tcgggcacca gatcgacatc cgcgcccagg gtggctacgt 12780
cgtcgccccc ggctgccaga tcaccgcacc acccgaagac gtcttcggca cctacacccg 12840
cgtatcgacc acagtggaca tcgcaccgct gccggactgg ctgcgccctc gggtcacccc 12900
gccacccgcg acaccgaccg gaccggggaa ggctcccaac ctcgggcgaa tccgtcacgg 12960
ggacggtcat gagcccggtt actggaaaac ggtgtggaag agcgtgctcg acaaggtcga 13020
gtacgaggac ggcgagcgct ggaagttggt ctacaacgcc gcccgccgcc tggccaacct 13080
cgccgtgcac gacggcgccc cctggaccga gcacgaggtg ctcgacgagc tggaggccgc 13140
cgcgatccgc cgccgcgagc acaccggcaa acccaccgag cccgccaccg cacgccgcaa 13200
cgcccagcgc ggctgggacc gcggcaccca cgacggcccc gactccctga tcggcctggg 13260
cggcgcggca tgagcccgac atcccggaag gaatccctcg tgaccagccc acggcttctg 13320
gacctgttct gcggcgccgg cggcgccggc aagggctacg ccgacgccgg attcgacgtc 13380
gtcggcgtcg acatcgcccc ccagcccgac tacccgttcg agttccacca ggccgacgcg 13440
ctgaccttcc tcgccgccca cggcaccgag ttcgacgtcg tgcacgcctc gcctccgtgc 13500
caggcgtcca gcgcgttgac caagggcacc aaccgcggcc ggtcttaccc ccaattgatc 13560
ccccagaccc gcaccgccct ggtgcagctc ggggtgccgt gggtgatcga gaacgtcgcc 13620
ggcgccccga tccgcaagga cctcatgctc tgcggcgaga tgttcggcct cgccgtcctg 13680
cggcaccggt tcttcgagct gggcggctgg accacgccga gacccccgca ccccgcccac 13740
cgtggccggg tctccggaat gcgccacggc cagtggttca ccggccccta cttcgccgtc 13800
tacggcgacg gcggcggcaa aggcaccgtc gcccagtggc agcaggccat gggcatcacc 13860
tggaccgacg tccgcaagtc cctcgccgaa gccatcccgc ccgcctacac ccaccacctc 13920
ggcaccgcac tactggccgc ccgcgccgcc agccctgcgg cgacggccgc atgaccaccc 13980
gatccgcacc cgatggaggt gagcacgtga ccacacccgc tcagcagccc agcgacggcg 14040
ccgtcctgct cgacgaactg cacgccaccc tgaccaaatt cgtgatcctg cccagcccgc 14100
aggccatcga cgccgtggtg ctctggatcg ccgccaccca cgcccaaccc gcctgggccc 14160
acgccccccg cctggtcatc cgcgcccccg agaagcgctg cggcaagtcc cgactgctcg 14220
acatcgtcga aggcacctgc cacgagccgt tcctgaccgt caacgcctcc ccctccgccg 14280
tgtaccggtc gatcagcgac gacccgccca ccatgctcgt cgacgaggcc gacaccatct 14340
tcggccccga cgccggcacc aacgaagaag tccgcgggct gctcaacgcc ggacaccagc 14400
gcaaccgacc cgccaagcgc tacgacgccg catccggccg cgtcgagtcc atccccacct 14460
tcgccatggc cgcactagcc ggaatcggcg ccatgcccga caccatcgag gaccgcgccg 14520
tcatcgtgcg catgcggcgc cgcgcccccg gcgaaaccgt cgcgccctac cggcaccgcc 14580
gcgaccgccc acacctgacc gcgctcgcga agcggctcgc cgcctggctc cgcgcctcga 14640
tgcccgacct cgaacgcgcc gaacccgaca tgccgctgga ggaccgggcc gccgacacct 14700
gggaaccgct catcatcgtc gccgaccacg ccggcggcga ctggcctacc cgagcccgca 14760
acgccgcggt cgacctgctg gccgaagccg ccgacaacga ccaaggctcc ctgcggaccc 14820
ggctgctcgt cgactgccgc accgcattcg gtgaccaccc cacgctgtcc accaccgaac 14880
tgctgcgcca gctcaactcc gaccccgaag caccctggcc cacctacggc aagaccggac 14940
tcaacgccgc caagctctcc aagctgctcg ccgaattcga catccgctcc gccaacgtcc 15000
gcttccccga cggcacccag gccaagggct accagcgagc ccacttcttc gacgcctgga 15060
cccgctactg ccccgacgcc ccgcacgacc ggccagaggg ggtgccgtcc cagccgtccc 15120
aagcgtccca ccgcaggtca gagcgggacg gcttgaccct ctgggacggc atcagccgtc 15180
ccaacgacga acccgaccca gacctctggg acggcacaag ccgtcccacc gcaccgagcc 15240
gtcccagcct gacctgcatt gggacggctg ggacggctgg gacggacacc cctcccagca 15300
ctaacaccaa gggggccgca tgaccacgaa cgtcacccaa ctcgccgcca cgctcgcctc 15360
gctcgcggcc ctgctcgccg aacagcagcc cgccccggaa cccgagcccg aaccggccgc 15420
ccgcaggctg cccaaccgcg tgctgctcac ggtcgaggaa gcggccaagc aactggggct 15480
cggcaggacc aagacctacg cgctggtggc gtctggcgag atcgaatctg tccggatcgg 15540
tcggctcagg cgcatcccgc gcaccgccat cgacgactac gccgcccgac tcatcgccca 15600
gcagagcgcc gcctgaaggg aaccactatg gaacaaaagc gcacccgaaa ccccaacggt 15660
cgatcgacga tctacctcgg gaacgacggc tactggcacg gccgcgtcac catgggcatc 15720
ggcgacgacg gcaagcctga ccggcgccac gtcaagcgca aggacaagga cgaagttgtc 15780
gaggaggtcg gcaagctcga acgggagcgg gactccggca acgtccgcaa gaagggccag 15840
ccgtggacag tcgagcggtg gctgacgcac tgggtggaga gcatcgcgcc gctgacctgc 15900
cggtacaaga ccatgcgggg ctaccagacg gccgtgtaca agcacctcat ccccggtttg 15960
ggcgcgcaca ggctcgatcg gatccagaac catccggagt acttcgagaa gttctacctg 16020
cgaatgatcg agtcgggact gaagccggcg acggctcacc aggtacaccg cacggcgcga 16080
acggctttcg gcgaggcgta caagcgggga cgcatccaga ggaacccggt ttcgatcgca 16140
aaggcacctc gggtggaaga ggaggaggtc gaaccgcttg aggtcgagga catgcagctg 16200
gtcatcaagg ccgccctgga acgccgaaac ggcgtccgct acgtcatcgc actggctctc 16260
ggaactcggc agggcgaatc gctcgcgctg aagtggccgc ggctgaaccg gcagaagcgc 16320
acgctgcgga tcaccaaggc actccaacgt cagacgtgga agcacgggtg ctctgacccg 16380
catcggtgcg gcgcgaccta ccacaagacc gagccgtgca aggcggcctg caagcggcac 16440
acgcgagctt gtccgccgcc atgcccgcca gcttgcaccg aacacgcccg gtggtgcccg 16500
cagcgaaccg gtggcgggct ggtcgaggtc gacgtcaagt cgagggctgg acgacggacc 16560
gtgacgctgc ccgaccaact gttcgacttg atcctcaagc acgaaaagct tcagggggcc 16620
gaacgggagc tcgcgggcac ggagtggcac gacggcgagt ggatgttcac ccagcccaac 16680
ggcaagccga tcgatccacg tcaggacctc gacgagtgga aagcaatcct tgttgaagcc 16740
ggagtccgcg aggcgcggct acatgacgca cggcacaccg ccgcgactgt gctgttggtc 16800
ctcggagtgc ccgaccgggt cgtgatggag ctgatgggct ggtcgtccgt caccatgaag 16860
cagcggtaca tgcacgtcat cgactccgtc cggaacgacg tagcggaccg cctgaacacc 16920
tacttctggg gcaccaactg agacccagac tgagacccaa aacgcccccg tcgagatcga 16980
cgggggcgtt ttggcagctc ttggtggtgg ccaggggcgg ggtcgaaccg ccgaccttcc 17040
gcttttcagg cggacgctcg taccaactga gctacctggc cgttcgcgcc cggctcaaag 17100
ccgaaccgct gtggcgaccc agacgggact cgaacccgcg acctccgccg tgacagggcg 17160
gcgcgctaac caactgcgcc actgggccat gttctgttgt tgcgtacccc caacgggatt 17220
cgaacccgcg ctaccgcctt gaaagggcgg cgtcctaggc cgctagacga tgggggcttg 17280
gccgattcgg aaccgacccg gcctcgcctc caaccggctt tccctttcgg ggcgccccgt 17340
tgggagcagt gaaagcttac gacacacccc ccagcgcccc acaacggggg ggtccccaaa 17400
cctcacgagc ccccgcgcgg cccacgcccg ccggtcacgt cggtcgccac catatgccat 17460
ctgaccagcc ttttccatcg cctatcctca gtcggcccac t 17501
<210> 97
<211> 12
<212> DNA
<213> 刺糖多孢菌
<400> 97
aggaggtccc at 12
<210> 98
<211> 25
<212> DNA
<213> 刺糖多孢菌
<400> 98
ccaggaatcg gaggggcagt accga 25
<210> 99
<211> 25
<212> DNA
<213> 刺糖多孢菌
<400> 99
gcaacttcct ggagggaaac gccac 25
<210> 100
<211> 25
<212> DNA
<213> 刺糖多孢菌
<400> 100
tcgtcacggc agtgagggat tgggc 25
<210> 101
<211> 25
<212> DNA
<213> 刺糖多孢菌
<400> 101
cgaaatcccg gcgaggaagg gcgcg 25
<210> 102
<211> 28
<212> DNA
<213> 刺糖多孢菌
<400> 102
cgcctcggcc cccttcagga ggagacag 28
<210> 103
<211> 26
<212> DNA
<213> 刺糖多孢菌
<400> 103
ctccagacgc ccacgcaagg agaccc 26
<210> 104
<211> 19
<212> DNA
<213> 刺糖多孢菌
<400> 104
actagtaagg aggtccaac 19
<210> 105
<211> 15
<212> DNA
<213> 刺糖多孢菌
<400> 105
aagaggtata tatta 15
<210> 106
<211> 20
<212> DNA
<213> 刺糖多孢菌
<400> 106
ccaccgctgg aggtatccgg 20
<210> 107
<211> 13
<212> DNA
<213> 刺糖多孢菌
<400> 107
aggagagatc ggc 13
<210> 108
<211> 12
<212> DNA
<213> 刺糖多孢菌
<400> 108
aaagaggaga aa 12
<210> 109
<211> 15
<212> DNA
<213> 刺糖多孢菌
<400> 109
attaaagagg agaaa 15
<210> 110
<211> 19
<212> DNA
<213> 刺糖多孢菌
<400> 110
agaaggtgga ggtcacacc 19
<210> 111
<211> 16
<212> DNA
<213> 刺糖多孢菌
<400> 111
aagggctgtt ggaatc 16
<210> 112
<211> 18
<212> DNA
<213> 刺糖多孢菌
<400> 112
attgaggtcg agggtcgg 18
<210> 113
<211> 22
<212> DNA
<213> 刺糖多孢菌
<400> 113
ggcggtgaat gatccgccgc gc 22
<210> 114
<211> 20
<212> DNA
<213> 刺糖多孢菌
<400> 114
gacgaggaag aggcgccaca 20
<210> 115
<211> 16
<212> DNA
<213> 刺糖多孢菌
<400> 115
acgttacgct cgtcgc 16
<210> 116
<211> 19
<212> DNA
<213> 刺糖多孢菌
<400> 116
gggacgttac gctcgtcgc 19
<210> 117
<211> 21
<212> DNA
<213> 刺糖多孢菌
<400> 117
tcgtgacctc ggtgctgaac a 21
<210> 118
<211> 15
<212> DNA
<213> 刺糖多孢菌
<400> 118
aggaggaaca atcca 15
<210> 119
<211> 18
<212> DNA
<213> 刺糖多孢菌
<400> 119
ccgcaggaag tgagtgac 18
<210> 120
<211> 20
<212> DNA
<213> 刺糖多孢菌
<400> 120
cgtgacctcg gtgctgaaca 20
<210> 121
<211> 18
<212> DNA
<213> 刺糖多孢菌
<400> 121
aattcccggg gatctacc 18
<210> 122
<211> 17
<212> DNA
<213> 刺糖多孢菌
<400> 122
cgaggcgaac gccagcc 17
<210> 123
<211> 16
<212> DNA
<213> 刺糖多孢菌
<400> 123
gcgaaggaga gccccc 16
<210> 124
<211> 17
<212> DNA
<213> 刺糖多孢菌
<400> 124
ccgaaaggaa cgccgac 17
<210> 125
<211> 17
<212> DNA
<213> 刺糖多孢菌
<400> 125
gaggaaagga aaacgaa 17
<210> 126
<211> 18
<212> DNA
<213> 刺糖多孢菌
<400> 126
gaacggaagg gacgcctg 18
<210> 127
<211> 21
<212> DNA
<213> 刺糖多孢菌
<400> 127
cggcgggtcg gagaggagtg c 21
<210> 128
<211> 1048
<212> DNA
<213> 人工序列
<220>
<223> 转座子诱变有效载荷序列LoF
<400> 128
ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60
gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120
aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180
cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240
aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300
tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360
gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420
aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480
tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540
ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600
ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660
cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720
tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780
ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840
tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900
tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960
ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020
ggaggtacca gatgtgtata agagacag 1048
<210> 129
<211> 1352
<212> DNA
<213> 人工序列
<220>
<223> 转座子诱变有效载荷序列基因功能获得-启动子
<400> 129
ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60
gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120
aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180
cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240
aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300
tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360
gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420
aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480
tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540
ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600
ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660
cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720
tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780
ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840
tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900
tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960
ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020
ggaggtaccg gtaccagccc gacccgagca cgcgccggca cgcctggtcg atgtcggacc 1080
ggagttcgag gtacgcggct tgcaggtcca ggaaggggac gtccatgcga gtgtccgttc 1140
gagtggcggc ttgcgcccga tgctagtcgc ggttgatcgg cgatcgcagg tgcacgcggt 1200
cgatcttgac ggctggcgag aggtgcgggg aggatctgac cgacgcggtc cacacgtggc 1260
accgcgatgc tgttgtgggc acaatcgtgc cggttggtag gatccccacc caacgcaccc 1320
caggaggtcc catagatgtg tataagagac ag 1352
<210> 130
<211> 3068
<212> DNA
<213> 人工序列
<220>
<223> 转座子诱变有效载荷序列功能获得-反向选择
<400> 130
ctgtctctta tacacatctg gtaccagccc gacccgagca cgcgccggca cgcctggtcg 60
atgtcggacc ggagttcgag gtacgcggct tgcaggtcca ggaaggggac gtccatgcga 120
gtgtccgttc gagtggcggc ttgcgcccga tgctagtcgc ggttgatcgg cgatcgcagg 180
tgcacgcggt cgatcttgac ggctggcgag aggtgcgggg aggatctgac cgacgcggtc 240
cacacgtggc accgcgatgc tgttgtgggc acaatcgtgc cggttggtag gatccccacc 300
caacgcaccc caggaggtcc cataagaggt atatattacc ggaattgcca gctggggcgc 360
cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 420
tctgatggcg caggggatca agatctgatc aagagacagg atgaggatcg tttcgcatga 480
ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 540
atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 600
aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 660
acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 720
acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 780
tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 840
ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 900
agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 960
atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 1020
aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 1080
gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 1140
cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 1200
tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 1260
agttcttctg atgcgcggcc ggacccgcac acacccgctc cagacgccca cgcaaggaga 1320
cccatgaaca tcaagaagtt cgccaagcgg gcgaccgtcc tgaccttcac caccgccctg 1380
ctcgcgggcg gggccaccca ggccttcgcc aaggagaaca cccagaagcc ctacaaggag 1440
acgtacgggg tgtcgcacat cacccgccac gacatgctcc agatccccaa gcagcagcag 1500
agcgagaagt accaggtccc gcagttcgac cagtccacca tcaagaacat cgaatcggcc 1560
aagggcctcg acgtgtggga ctcctggccc ctgcagaacg ccgacggcac cgtggccgag 1620
tacaacgggt accacgtggt gttcgccctg gcgggctccc ccaaggacgc cgacgacacc 1680
tcgatctaca tgttctacca gaaggtcggc gacaacagca tcgactcctg gaagaacgcg 1740
ggccgcgtct tcaaggacag cgacaagttc gacgcgaacg acgagatcct gaaggagcag 1800
acccaggagt ggtccggctc cgccaccttc acgtccgacg gcaagatccg gctcttctac 1860
acggacttct ccggcacgca ctacgggaag cagagcctca ccacggcgca ggtcaacgtg 1920
tcgaagtccg acgacaccct caagatcaac ggcgtggagg accacaagac gatcttcgac 1980
ggcgacggca agacctacca gaacgtgcag cagttcatcg acgagggcaa ctacacgtcg 2040
ggcgacaacc acacgctgcg cgacccccac tacgtggagg acaaggggca caagtacctg 2100
gtcttcgagg ccaacaccgg caccgacaac ggctaccagg gcgaggaatc cctgttcaac 2160
aaggcgtact acggcggcag cacgaacttc ttccgcaagg agagccagaa gctccagcag 2220
tcggccaaga agcgggacgc cgagctcgcc aacggcgcgc tgggcatggt ggagctgaac 2280
gacgactaca cgctgaagaa ggtcatgaag ccgctcatca cctccaacac cgtgacggac 2340
gagatcgagc gggcgaacgt cttcaagatg aacggcaagt ggtacctgtt caccgactcc 2400
cgcggctcca agatgaccat cgacggcatc aactcgaacg acatctacat gctgggttac 2460
gtctccaaca gcctgaccgg gccgtacaag ccgctcaaca agaccggcct ggtgctccag 2520
atgggcctgg acccgaacga cgtcaccttc acctactccc acttcgcggt gccccaggcg 2580
aagggcaaca acgtggtcat cacctcgtac atgacgaacc ggggcttctt cgaggacaag 2640
aaggccacct tcgccccctc cttcctgatg aacatcaagg gcaagaagac ctccgtggtg 2700
aagaacagca tcctggagca gggccagctc accgtcaaca actgaggtac cagcccgacc 2760
cgagcacgcg ccggcacgcc tggtcgatgt cggaccggag ttcgaggtac gcggcttgca 2820
ggtccaggaa ggggacgtcc atgcgagtgt ccgttcgagt ggcggcttgc gcccgatgct 2880
agtcgcggtt gatcggcgat cgcaggtgca cgcggtcgat cttgacggct ggcgagaggt 2940
gcggggagga tctgaccgac gcggtccaca cgtggcaccg cgatgctgtt gtgggcacaa 3000
tcgtgccggt tggtaggatc cccacccaac gcaccccagg aggtcccata gatgtgtata 3060
agagacag 3068
<210> 131
<211> 1716
<212> DNA
<213> 人工序列
<220>
<223> 转座子诱变有效载荷序列功能获得-溶解性标签
<400> 131
ctgtctctta tacacatctc cggaattgcc agctggggcg ccctctggta aggttgggaa 60
gccctgcaaa gtaaactgga tggctttctt gccgccaagg atctgatggc gcaggggatc 120
aagatctgat caagagacag gatgaggatc gtttcgcatg attgaacaag atggattgca 180
cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac 240
aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt 300
tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc 360
gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg 420
aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc 480
tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc 540
ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat 600
ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc 660
cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca 720
tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga 780
ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat 840
tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc 900
tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gaatcgatag 960
ccgccccgca gggcgctccg caggccgctt ccggaccact ccggaagcgg ccgtgcggtc 1020
ggaggtacca tgtcccctat actaggttat tggaaaatta agggccttgt gcaacccact 1080
cgacttcttt tggaatatct tgaagaaaaa tatgaagagc atttgtatga gcgcgatgaa 1140
ggtgataaat ggcgaaacaa aaagtttgaa ttgggtttgg agtttcccaa tcttccttat 1200
tatattgatg gtgatgttaa attaacacag tctatggcca tcatacgtta tatagctgac 1260
aagcacaaca tgttgggtgg ttgtccaaaa gagcgtgcag agatttcaat gcttgaagga 1320
gcggttttgg atattagata cggtgtttcg agaattgcat atagtaaaga ctttgaaact 1380
ctcaaagttg attttcttag caagctacct gaaatgctga aaatgttcga agatcgttta 1440
tgtcataaaa catatttaaa tggtgatcat gtaacccatc ctgacttcat gttgtatgac 1500
gctcttgatg ttgttttata catggaccca atgtgcctgg atgcgttccc aaaattagtt 1560
tgttttaaaa aacgtattga agctatccca caaattgata agtacttgaa atccagcaag 1620
tatatagcat ggcctttgca gggctggcaa gccacgtttg gtggtggcga ccatcctcca 1680
aaatcggatc tggttccaga tgtgtataag agacag 1716
<210> 132
<211> 723
<212> DNA
<213> 刺糖多孢菌
<400> 132
atgaccacgt tgagcctgca cggggcgaca acgctgctgt acgccgcgcc ggtctcgacc 60
gagctgctgt cccagctgcc gttggacaac ctggccgcct acgtcgccac gatggccgcc 120
gacctggcgg ccagggaccg ggaacggctg gagcagggat tggcggcggc ggtcgagcgc 180
ggcgggccgt ggttcgagcg tgaccgctac gagctggccc ggtccctcgc gagggccgtc 240
caggtcgagc ccgaggcgtc cgggtcgagc tgagcccgga ccccggattc gaaggtttcc 300
cggccggtgg tgccagtccc gccgccccgt gtcgcacggg gtttgaacac cgccaccggc 360
cgggttccca accgatcagc ggaccgtttc ggaaccgccg ggaacagcac gaaccagctc 420
ccaaccccgg ggttgggagc aatcccggaa ccaggttccc ggccgccggg aagaagggtt 480
cttcacccct tctcacctgc atgggaagaa ccccgagaag cggcaccgga gaagcaccga 540
gaacccgccg agaacccctc tcccgaccga gccgatcgac cgggcgaccg agccgaccag 600
ccgggccgcc gcagccgacc gggcgaccga gccgaccagc cgggccgccg cagccgaccg 660
ggcgaccgag ccgaccagcc gggccgccgc agccgaccgg gcgaccgagc cggtgacctg 720
cat 723
<210> 133
<211> 1259
<212> DNA
<213> 刺糖多孢菌
<400> 133
tcacagcttc ctgaagtgct cgatgagccg ggagtagttg gcgttggcgc ggcccgcctc 60
gatcgccctg gagaccacgg cgacggtgta gcccgggagt tcgtcgtcga tgccccgcgc 120
ccggctctcg ctgactaggt cctcagccga cgacaggtgg tgttgcagcg ccccgaattc 180
caccgggtac tcgccgcgat cgacctcgtc gggccgggac accggcatcg gccgagatca 240
gtccgccccg gccgccgatg agttcgagcg tcgcacggta gcggtcgtgg gccgactcgg 300
cgccgccgaa gaacaccacg tcgtccgggt gcccgattac ctgagcgatc gtcatgatct 360
gcccgtgcag gtactccgcg cccgctgagg tgggccattc cgcgaccgct cgggcctcgg 420
ccgaggtgcc atccgtcagg ttgaccacgg tgtggccggc gagcgcgtcg cccgccgatt 480
ccaggagttc gcgcgcggtg ctgctgccct acaccgtgac gacgacgagc gggctggccg 540
cgacggcgtc atgaacggtc gcggcccgct gcgccccttg gcgaccaggt cgtccgcctt 600
cccgctcgtg cggttccaca ccgcggtcag tgtccggcgg ccaggaacgc gctcgcgagc 660
gcgaagccca tctcgcccaa accgatcacg gtcaccgccg gtcggctatc gatgttgctg 720
gtcatggctc atgccctcgc tcgccccaag atgatcgaga gcacgctagg gacttcgagc 780
gaacgcgagg tcaagacccc tgttcagccc ggtggcgtca ggcccaggga cttgatcagg 840
tcgtggatct cggcccggta gagcttgacc ggttccctgg tctgggggct caggcggccg 900
taggtttcca gcgaaaccgg cccgtgcatg cgacgccaga cgcgccggcc gccgtcgcgg 960
gctcactgcg gcagttcggg gaacgactcg cggacctcgt aggccaggcg cgcttcgaag 1020
tccgatcagt cgtggtcgcc gtcggcctgg cgggtgcccg cctgcggcca ggcagcggcc 1080
accaggccgg tgcggccagc gcaagcccgg tgcccggcct cggcggcgag cccgccgccg 1140
ggcggtgcct ggtagccggg gactggggcg ccatagatcc gcaaccccac aatccggcgc 1200
accacgtgca cgggcgtgcg cgtcgggctg tgatgcggtc gtgagctgcg atcggccat 1259
<210> 134
<211> 1687
<212> DNA
<213> 刺糖多孢菌
<400> 134
ctaccgcgcg aatgcgggat cgccgtccag cacgcgaatc gccgcacttg cttgcagtgc 60
aacgacattc agcacatggc cgaccgagtc gtgtagttcg gcggcgatcc ggtttcgctc 120
ggacaacgcc tcgacctgcc accgtaacca ctcgtgatcg gacggtccca gcagcgtccg 180
ggcgagccgc gccaacaccg cgccgacacc ctcgaccagg tggaaacccg cgacgatcaa 240
gcccaggccg accagcggcg cccatcaatg cccgatgccg aaagcccgga acggcgagat 300
gccgacgagc tcgggcggca gcgtcagcgc cggatcggcg agcagcagca ggatgaacgg 360
cggaacgatc agcgtcagca ggccgatgcc ggagccgagc gcgaggtgga cgacgagcca 420
gcagacggtc cgcaaccgat ccggccgggt ctcggcggcg ccggattccg gcagcccgag 480
cagggattcc gccgtggcat ccgacagcga ccgcgtcgcc ggcagcaacc cggtggccac 540
cccggcgagc acgacgaacg cgccttgcgc gagaccgacc gcgacaggcc gcaggccgag 600
cccgatgtcc gggcccagca gcgccccgag caccagcccg gacaccgcca ggtacgccag 660
cggccctgag gatcaggtgc acccatcgcc ggtacgtgga gcgcggtgaa gggtctgatc 720
aggcgggacg gcatggccac atcgtctctg cggaaccggc gcgcgatcgc aggttccgca 780
cggcttgcgg cgcgtcgccc gctggtacag gtagaccgac gacccgagca ccagctccca 840
gcacatccag ctcacgtaga acagcgcgcc gggccagtag cgcatcccgg cgatcgtgtt 900
cgacctgccg gagatcaggt tggggaggac cgtggcgagc tggccgggcc cccatgcatg 960
gatgaaaagc agcgcggcgc cgaaccagcc gccggcgagc agcagcccgc gcggcgtcgg 1020
acggccagcc aggccgggaa cccagcgcgg ccagatccgc ccgcaccggt ggacgacggc 1080
cagttacagc acgatgccga tcagcgcggc gggcacgacc agccaaccgc tggcgaagcc 1140
gtcccgcgcc gggtcggggt agtccagtcc gatggtgccg cccagcgccc agttggtctt 1200
gatcatcaga tagggcagcg cgaacacgag gccgagatat ccgagccagc gcgccggcgg 1260
cccggccggc ccgccgcagc gttcgcaggc ccggtgatct cccggacccg caggactgtc 1320
ccggacccgc aggactgtcg cctggaacag caggatcgcg ctcagcaacg cgaaggcgcg 1380
ggtggcgaac atcggccagc caggggaaag cccatcaggc cggacacccg cgacagtcga 1440
acaggatgcc gccggtggcc cagagcagca gcaggacggc cgcgccgttg atcatgatga 1500
gcatgcggcg aggtcgcaac ggcgacatca gcacggcggt gccgaccacg ccgaccgctg 1560
cggccagtgg tgtcgcccag cccgggagct cgaagaggac gaatccgcgc ggcaggacgt 1620
gccgcgattc gacggagagg aaggtcaggg tcggcgcgat cacggccgcc cgactcggct 1680
tgagcat 1687
<210> 135
<211> 1286
<212> DNA
<213> 刺糖多孢菌
<400> 135
gtgatcaacc gggacaccgc gtacttctgg gagggcgcgg cggccggtga gctgcgcatc 60
cagcgctgcg gccggtgcgg gctgctgcgg cacccgccgg ggccgatgtg cccggaatgc 120
ggcgccgcga cgcggacgca cctggtctcc gaagggctcg gcgaggtcta cagctccatc 180
gtccaccacc acccgctgat gccgggcaag gacctaccgc tggtcgtggc gctggtcgag 240
ctggacgaag gcgtgcgggt actgggcgag ctgctcggag tggccccgga ggacgtccgg 300
atcggccacc gggtggcggt cgacttccag cggatcgacg acgaactggt gctgccggga 360
tggaggctcc atgagtgacg gaataccggt ggcgctggct cggacgcggt cgctcgccga 420
gctgaccatc ggcgatgcgc tgccggagga gcgcatcgag gtatcgccga ccttcgtagc 480
acgtcagcgg cacggttcgg gcggcgttgc cggaggtcgc gcggtgagca cgatttcggg 540
cagcgcggcg atcgtcggga tcggtgcgac ggagttcttc aagggatccg ggcgcagcga 600
accgcaactg gccgccgagg ccgttcgggc cgccctcgcg gacgccgggc tggaaccgtc 660
cgatgtggat ggtctggtga ccttcaacat ggacaacaac accgaaaccg ccgtcgtcag 720
ggaactgggc atcccgagct gaccttcttc agccgcatcc actacggcga cggcgcggcc 780
tgcgcgactg tgcagcagac cgccacatgg ctgtcgccac cggcacggcc gacgtcgtgg 840
tctgctagcg ggcgttcaac gagcggtccg ggcgccggtt cgggcaggtg caggcggcgg 900
cagcaggcac gccgacctcg gcggggctgg acaacagctg gtcctacccg gtcggtggcc 960
acgcccggca cgcaggtcgc gatgttcgcc cgccgctacc tgcacaccta cggcgcgacc 1020
agcgaagact tcggccgcgt cgcggtggcc gaccgaaagt gcgccgcgac cagtcccaac 1080
gcctggttct accagcggcc gaccaccctg gccgatcacc aggcgtcgcg ctgggtcacc 1140
gagccgctgc ggttgctgga ctgctgccag gaaagcgacg gcggggtggc gatcgtggtg 1200
acgagccggg accgggccgc ggacctgcgg cactcgccgg ccgtggtggc ggcggcccag 1260
ggcagcggcg ccgaccagtt caccat 1286
<210> 136
<211> 1864
<212> DNA
<213> 刺糖多孢菌
<400> 136
tcaatgcgac gttaccgggc gggatggcgg attcacacct gtttcaaggg ttttccccgc 60
ggccccggct acctcggtcg gccgggtacg ccggggcggg tttgccacgg gtgcgggccc 120
cgagcgggcg gtactcgacg ccgaaggcat ccagccgggg caggtggtgg tcgaccaggc 180
ggcgccggac gtccgcgaag ccgcggtcgc ggctgctcca gggccaagat cccgcatccg 240
gtcgtgctcg gctccggtcg ccgcccggtc gtcgtagccg acgcacaaca accgcagggt 300
gccctggggc acgacgtagg cggcgttggc ggcgatgccg gtgtcgagcc ggtcgaggta 360
ttccgcgacc gctgcgccag ttccagtcga accccggcgg atcatcgttc cagcccgcga 420
tctgggtgcg cacggtgacc agcgtggcgt cggttaccgg gcgtacgaca acccgtcctg 480
tccgatgacc tccagcgtca cgccctgcga caccttcgcc gtgtggtcgg gtgcggcaag 540
gatctgcagg tcggagtgtg cgtgcatgtc gatgaaaccg ggcgcgagca ctaggccgtc 600
ggcgtcgatc gcgcgttttc cgctcaactg tgcgggttcg gcgatctcgg cgatccgccc 660
gcgctcgatc ccgacgtcgg cgcggtagcc aggcccgccg tctccgtcga cgacgctcgc 720
cccgtggacc acgatctcca tgccggaacc tccccgtgct aggagttctt gcgcagcggt 780
cgtcccaatt agaagaacgt gcgctccagg tcgatcacgg tgtcgtcgtc gatgaccggg 840
atcaggggtc acttgtcgaa aaccgtgcag ggatgggaga ggccaaagcc gatccagtcg 900
ccgatctgcg gatcggtgta ccgcatggtc aggagcgtgt gctggtcggc cagcgacgtc 960
acctcgcacg aaccggcggc cagctcccgg atctcgccct ccgcgccgcg gatcacctgc 1020
ggttccggca ggtcttggtc gaacgacacg tcccggcggc ccacggtcag cagcgccagg 1080
ccccgctcag gccgggaggt gacctgcgcc cacacccgca tcgcggggcg gaacggcgat 1140
tccgcgcccg ccagccggtg ctcgcggccg aacggcgagc ggacccggta gaaaccgtcg 1200
tcgtgcagca ggtatccgcc gctgcgcagc accggcacga ccggcagccc ggccggccac 1260
ggctcggtga acgcctcggc gacctggtcg aagtacgcgc tgccgccgca ggtgacgatc 1320
acctcgtcca ggcccgagaa gtggcccgcc tgggccagtt ccgccacgag gtcgcgcaac 1380
cgccccaggt atctgtccac agcggacagc gactgctcgc tgacgtcgtg ccccagcgcg 1440
ccctcgtagc cgccgacccg accagtcgca gcatcgggct ttccagcacc aggtcggcga 1500
tctcgcgcgc ctcggcgatc gtgcgcgcac cgggccgggc gccgtcgctg ccgagctcga 1560
ccagcacgtc gacctgccgg gacgcgccgt ggtgggccag tgcctcggcc atcagctgcg 1620
ctccgcgcac cgagtccacg aagcagctga actcgaattc ggggttggcg tccagttcgt 1680
cggccagcca ggccagcccg ctggggtcca gcagttggtt ggcgagcatg atccgctcga 1740
cgccgaaggc gcggtaaacc cgcagctggc tgacgttcgc cgcggtgatg ccccacgaac 1800
cggtagccgg tattgcgtaa aatgcaacat cggttgcgta gaatgccgga ttggtgtgta 1860
ccat 1864
<210> 137
<211> 1212
<212> DNA
<213> 刺糖多孢菌
<400> 137
ctagcccgct tccacgatgt cgatcgtgcg ggcgagcacg tggtgcgggt gcggctggtg 60
ggcgttgccc cattccacgg ccgccgaatg cccggcggtc gcgacgatca gcccgacggc 120
ccggtcctgc cgtggtccgc cgaggccgcc gtcttcggcg tggatgcccg ccgcgtactc 180
gccgctgcgg tgcggggcga tgctctgggc gaactgcgcg ccgcctcggg cacggtccat 240
gacgagctcg tgggtctcga ggccgcgcag cagctcgccg agcccctggt ggttgaggac 300
gacttccaca gtggacatca gccggtcacc ctttccaggt tgatcacgca cacgcccgag 360
cccggcacga acgggctcag gtagcgctgg ggtccgccgg tcaccgccca gtgggtgcca 420
tccggcagca cgatccggtc ggtggccagt acgtcggcct ccggtccggt gtagacggtc 480
atgcgggcgg tgacctgatc ggcgctgtcg gtgtcctcgg tcgaaccgcc cggggccagc 540
acgcagccgg ggatctcgtg ctcggtgggc ggcagcggat cgccgtagcg attggtgccc 600
gccggtctgg agaccgtgag tacctgcccc gccaggccct cggggatcac gggacgtcca 660
ggatcgcgct gccggtgccg acgctgaagg ccgcgccgag cccggctgcc ttccgtagcc 720
ggatgcgctg ttccctgctg agatccatgc cctgggggcc cccgctgtcg gtataggtcg 780
ccgcgtacgg gccgatcgtg gtcgaggccg caccgcccgg cgtgggcacc gccgctttgg 840
ccacctccag ggccaccgcg gtgacgtcgg gcggcacagg gtcgggcagc tcgccgatct 900
cgccgaggat cgccgcgagc gtccaggtgt ggatcgctgc gccggtctcg gccgagaccg 960
ggcggcccac cagcgcggcc agggtctcgg ctgtgaacag ctcggccatc acgtgcgccg 1020
cgttctccgg gccttggccg gggcgtccgt gccgggatcc tcatccccgc cggcctgacg 1080
tactccgagc tcggccggga gggtgcgcag ccgggccgcc gtcgcggcgt cgacctcggc 1140
cacgccatcg gtgaaccgca cacccaaatc gcgcacgtac aggccgggat gccgctggca 1200
ggtgaacttc ac 1212
<210> 138
<211> 1070
<212> DNA
<213> 刺糖多孢菌
<400> 138
ctaaaccggt ctgggcgaca cctcgcacca agcccagtca cgaatgaagg cctggcaggc 60
taccgcgaag cctgccaggc cgcttcggtt gtcggtcaga agtcgaaggc caccgaggtg 120
ggtgttcttg atgcagtcgt tgtcgaaggt ccgcgagtag ctgaccggcc tgccctcccg 180
cgtaccggtg gcggtcacct ccaccgggcg tcgcctccac cgggcgcgag atcatcgggc 240
agggggcgtc cggggattgc atgggaatgc tgtcggaatt cccccgaacc cccggcagca 300
gcacgcaggc gccagccgcg tccgggtacg agccaccagc agcgtcgcag gtgagcgtca 360
cgctcgaccg cgcactctgc ccccttcgtg gtggtcaccc cggagtaaaa ccgcagcttc 420
cgggtgattt gcactccccc caccccggct atccaccccg ccggatgtac tcgtccacac 480
tggacttctc tacggaaaac cccgcccgtg atggcaagtt cggcggttga cccccggggc 540
gatcgacctg ctgaagatgg acatcgaggg cgccgaggcc gacgcgctcg ccggaatcgg 600
cgatcacgac tgggccagga cccggcaggt cgtactcgaa gtacatgact tcgccggtgc 660
cccggcggcc gtgcgcacca cgctggcgga acgcggcttc accatcaccg cggaccggcc 720
ggagggcatg ctaggcgggc tgggtaccaa gaccgtttac gcacggcggt gaacgcggca 780
agatgcggat catcctgacc agcctgccct actactccca cctggtgccg gttgtggtcc 840
cggtggccca cgccctgcgg cgcgccgggc acaccgtcgc cgtcgcgacc gcaccgtaca 900
tggcctcgga actctcgcgg cactgcgtcg aacacctgcc gctgccgaac gtccaaaccc 960
tcgaacagct gctcgccgcc ccgcgttcgt caccagcccc ggcatgcccg gagcggaagg 1020
ggaagccgcc gaggacaccg cgcgcacccg cgagaatccc ggtccgctga 1070
<210> 139
<211> 999
<212> DNA
<213> 刺糖多孢菌
<400> 139
atggaacatc tgccgttcat cgcaacgctg cagccgagct cagctcggct gcggcgggca 60
accaagtccg ggcactgctg ctccagctgg aaagcccagg gcaccgcagg gttggagtgc 120
attcacggat ttccactgct gcagcgcgac gtgcgcgccg ctgagcggcg agccaaacgg 180
atcccggtgc cagaggcggc cgagcgggaa ccgtccgagt gcgtgtgact atgagccagt 240
cctttcgtcc tccggtgtcg tctgaatctc cgcgccgcta ttcagtgcca ccggtaaccc 300
cgcgcggcat atggatcgcg cggcacggcg gtcaccgagt ggtccacgtg cacctcgtgt 360
gcaccgaggg gtcctccacc tcaccactgg gcgttcaccg gacgttgtgc gatctgcggc 420
tgggcgacga ttgggttcac ttccgccgtg tggctccatt gccgagctgg ttgacggtgt 480
gcccgctgtg cttggccagt cccaggattt cgctggacct cgccttgcgc atcgagcggc 540
atctcatcag ccgcgaaccg ctgaccgccg cacggctgat ggatcgccaa gacgccaccg 600
gattgattcc ccgagttccg ttcaccgaca gtctggtatt cgaggtcgat cgacatgctc 660
gcgatggaac acccgtcatt cgtgctggaa caagcgcgag cgcagcagca gcaccgtacg 720
ctgctgcctc cggtgtacct cggcgacttc cgcacggcgc tatacagagc gatgccgaac 780
gtccggtacc acagttgtcc cgacgacggc gggatcgcgc acctattcat catcgacgcc 840
ggagctgccg actcgtgggt ggtctggtgg cagcgcgaag acggctccca caccattgcg 900
gaagccggcc cgtacgcgct ccgcgaccgc atcaaccaga tcgctggcga ttggttgatc 960
cacatcgcca ccaccgtgga gatcgcgcac atcgcgtga 999
<210> 140
<211> 1103
<212> DNA
<213> 刺糖多孢菌
<400> 140
ttagcgctcc atgaaaccgg tcaagccgcc cttgggctcg gaccactgct ccgcgacgtg 60
gtcgacgtgg cccggggttt cgccggaacg cagcgcagtc aacagcttct cgcacgcttc 120
ccgggggcct tcggcgacca cctcgacgcg gttcgcgggc cggttcgtgg cgctgcccac 180
caggccgagt tccagcgccc gggaacgcgt ccaccagcgg aagccgacgc cctgcacccg 240
cccgtgcacc catgcggtca gtcgtgcctg ttgcgaatcc gtcacgccgg gcatgatgcc 300
gcacggccgc tgcgcgcgcg gccctggctt gcgccgatca tcaccactgc ccgggcaccg 360
gtatgatccg ccacgattcg tggtagggcc gggtgttctg gggcatccgc gcagaccgcc 420
cgacgagccg acgagtgggg caccgtggac ccgatgttgc cggaagaccc ggacgcccgg 480
ccgaagcgcc tggtgatgct ggccgcatcg agcatcgccg tggccaccgt gttcgcgacg 540
accgccgcga tggtcgccgg cgcgcagcag cacgacgcgg cgacgccgga cttcacgctg 600
aagccgaccg ccacgtcccg gccggcctcg acgttctcca cgccgtcttc gttgctgccc 660
ccgccgccga tgagcagcga aacctcggat atctcgacga cctccagcag gtcgacttcg 720
tccgcttcga agagcagcga aacgctcacg gagatcccgc ctccgatgcc gccagagccg 780
cccccgcccc acactccgcc gcggccgacg aagaccacca cgacacccac gaccacgacg 840
accaccacca cgacgaccac gaccaccacg accacggagc cgaccgactc agagacctcc 900
ggcggtgacg actagtgacg ttggccgtgc acgcctgcca gtcgctgtgc tcgtggcacc 960
ggactcccaa gcagctcaac gggtttccgc tgctggcctg tcgcggctgc gggtcgcagt 1020
ggatccgcag cgagccgtgg acgcccatcg accacaccgg ccggatcccc gacgacgttc 1080
gggcggagct cgccgagcgc tga 1103
<210> 141
<211> 1191
<212> DNA
<213> 刺糖多孢菌
<400> 141
ttaggccgtc gcgggttcgg cttcgtccgt gcgggcccag cggttcggtt cacccgtgat 60
ggcgaggcag gtgaccgtga tcagcgcgcc gatcagcagg taggccgcga tcggccagga 120
cgccccgccg gaggtcgtga gcagcgcggt agccaccagc ggcgacaacc cgccgcccag 180
caccgaaccg ctctggtagc cgagggaaac acccgtgtag cggaccttcg tggcgaacag 240
tccggcgcag aacgccgcca tcggcccgaa aaccgccgcc gaaccggcat atcccagcgt 300
catggccagc acgatcagcg ccgggctcgc ggtgtccagc agccagaaca tcggaaatgc 360
gtacaacgcc cggaaaatcc cgccgccgag catcacctgg gtgcggcaga tgaggtccga 420
caggtgcgag aacagcagcc ctcagcagca gccaattcgc ccgcaaagct cgccctgact 480
ggctccgcct ggtggccgac gtcgaggcgg gccgcgtaaa cgttttgatc atctgggagc 540
cgtcccgagc gtcccggctg ttatctgcgt ggtcgacgct gctggaaacc tgccaacggc 600
tcggcgtact gatccacgtc accagccacc agcagaccta cgatctcgac aatccgcgcc 660
actggcgcac actcgccgaa gacggcgttg acgcggtgta cgaagccgag aagacgtagc 720
atcgcgtccg acggggcaca aagtcctccg cggcggccgg ccgaccgcac gggaaagtcc 780
tttacggcta ccgccgggtg tacgacccag agacgcgcgc attgggcgga aacgacttcg 840
acgccgacaa gctcgtgtct cgcgtcgccg agacggtgcg ccgcaccatc gctgacgcca 900
cgatcaacgt cgatgtgaac gtgcagcggg gggatggcgc caatgtctga ccggctccgc 960
gcctggctgc gcaccaccat ccctgcggca tggtccgcgc tcgtcgcgtg gctgatcgcg 1020
gccggcgtcc cggactggct caccggcccg ctcggcgcgg ccggtgacgt cctggtcgta 1080
ctcggcgccc tctacgcgct gttgcgctgg accgagccgc acatgccgcc gtggctgacc 1140
cggatactgc tcggctccaa cacaccaccc acctacccgc cgaccgagta g 1191
<210> 142
<211> 951
<212> DNA
<213> 刺糖多孢菌
<400> 142
atgaccggct tgacggtcga tccgctcgac ccggcggtgg tcccgctccg cgagggccgg 60
accgtcctgg gcgcggggtt cctggtcgca ccgggtgtgg tcgccacctg cgcccacgtg 120
gtcggcagag caacgccggt cgccgatttc ccgttgctgc gcggccacga ccacgccgtc 180
gaagtgctgt cgcaggacga cgacctggac gtcgcgatcc tgcggctggc ggacacacca 240
ccgggagcgc tgccggttcc ggcacgcaga ccgcgccgac gttggagctc gacgtgcggc 300
ccgcctggga gtcgccgcca ggtggtccga agatcgcgct ccgcccggga gatccggacc 360
agtcgctggc gccagaccag cgacggcctc tcggtgtggg acctgcggac cagaacgcag 420
gcgcacgcgt tccggctcgg ggtcaccgac ctggtcgtgt ccgccgacgg ctccgccgcc 480
gcgatgacgg accaggcgaa caactcgatc gggctggtcg acctgatcaa gatggattag 540
atcgcgccgc tgatcgcccc gggcctgaga ctcatcggga tgtccgtgcc gtacttgttc 600
gccaaggacg tcaccgcggt gcaggtccgt ttcggactac aagcacgcaa atcgctcaag 660
acgttcccgc tggacgggtt gtccgtggcc gatcgaccgg tcgtcacccg gacgggtccg 720
tggccacgac gatcaccggc gattcagttg ctttgatcga cctggagaac atggccccgt 780
tgccgccgct gatcggcaag gtcgacgaga tcgaggcctc tccggcggct acctgatctc 840
cgaggagacc ctggacttcc aggtctggaa cttgcaggaa cgccgcctgg tcaccgcgat 900
caccctcgac gacacggatt cgcggcgcgc cgtcgagaac ggcgatctca t 951
<210> 143
<211> 236
<212> PRT
<213> 人工序列
<220>
<223> 经密码子优化的报告基因DasherGFP
<400> 143
Met Thr Ala Leu Thr Glu Gly Ala Lys Leu Phe Glu Lys Glu Ile Pro
1 5 10 15
Tyr Ile Thr Glu Leu Glu Gly Asp Val Glu Gly Met Lys Phe Ile Ile
20 25 30
Lys Gly Glu Gly Thr Gly Asp Ala Thr Thr Gly Thr Ile Lys Ala Lys
35 40 45
Tyr Ile Cys Thr Thr Gly Asp Leu Pro Val Pro Trp Ala Thr Leu Val
50 55 60
Ser Thr Leu Ser Tyr Gly Val Gln Cys Phe Ala Lys Tyr Pro Ser His
65 70 75 80
Ile Lys Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Thr Gln Glu
85 90 95
Arg Thr Ile Ser Phe Glu Gly Asp Gly Val Tyr Lys Thr Arg Ala Met
100 105 110
Val Thr Tyr Glu Arg Gly Ser Ile Tyr Asn Arg Val Thr Leu Thr Gly
115 120 125
Glu Asn Phe Lys Lys Asp Gly His Ile Leu Arg Lys Asn Val Ala Phe
130 135 140
Gln Cys Pro Pro Ser Ile Leu Tyr Ile Leu Pro Asp Thr Val Asn Asn
145 150 155 160
Gly Ile Arg Val Glu Phe Asn Gln Ala Tyr Asp Ile Glu Gly Val Thr
165 170 175
Glu Lys Leu Val Thr Lys Cys Ser Gln Met Asn Arg Pro Leu Ala Gly
180 185 190
Ser Ala Ala Val His Ile Pro Arg Tyr His His Ile Thr Tyr His Thr
195 200 205
Lys Leu Ser Lys Asp Arg Asp Glu Arg Arg Asp His Met Cys Leu Val
210 215 220
Glu Val Val Lys Ala Val Asp Leu Asp Thr Tyr Gln
225 230 235
<210> 144
<211> 263
<212> PRT
<213> 人工序列
<220>
<223> 经密码子优化的报告基因PaprikaRFP
<400> 144
Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg Met Lys
1 5 10 15
Leu Tyr Met Glu Gly Thr Val Asn Asn His His Phe Lys Cys Thr Ser
20 25 30
Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys
35 40 45
Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Lys Gly Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Met Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Cys Leu Val Tyr His Val Gln Val Arg Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys Gly Trp
130 135 140
Glu Pro Asn Thr Glu Met Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly
145 150 155 160
Arg Ser Asp Met Ala Leu Lys Leu Val Gly Gly Gly His Leu Ser Cys
165 170 175
Ser Phe Val Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys
180 185 190
Met Pro Gly Ile His Ala Val Asp His Arg Leu Glu Arg Leu Glu Glu
195 200 205
Ser Asp Asn Glu Met Phe Val Val Gln Arg Glu His Ala Val Ala Arg
210 215 220
Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn Ser Gly Leu
225 230 235 240
Arg Ser Arg Ala Gln Ala Ser Asn Ser Ala Val Asp Gly Thr Ala Gly
245 250 255
Pro Gly Ser Thr Gly Ser Arg
260
<210> 145
<211> 603
<212> PRT
<213> 人工序列
<220>
<223> 经密码子优化的报告基因gusA
<400> 145
Met Leu Arg Pro Val Glu Thr Pro Thr Arg Glu Ile Lys Lys Leu Asp
1 5 10 15
Gly Leu Trp Ala Phe Ser Leu Asp Arg Glu Asn Cys Gly Ile Asp Gln
20 25 30
Arg Trp Trp Glu Ser Ala Leu Gln Glu Ser Arg Ala Ile Ala Val Pro
35 40 45
Gly Ser Phe Asn Asp Gln Phe Ala Asp Ala Asp Ile Arg Asn Tyr Ala
50 55 60
Gly Asn Val Trp Tyr Gln Arg Glu Val Phe Ile Pro Lys Gly Trp Ala
65 70 75 80
Gly Gln Arg Ile Val Leu Arg Phe Asp Ala Val Thr His Tyr Gly Lys
85 90 95
Val Trp Val Asn Asn Gln Glu Val Met Glu His Gln Gly Gly Tyr Thr
100 105 110
Pro Phe Glu Ala Asp Val Thr Pro Tyr Val Ile Ala Gly Lys Ser Val
115 120 125
Arg Ile Thr Val Cys Val Asn Asn Glu Leu Asn Trp Gln Thr Ile Pro
130 135 140
Pro Gly Met Val Ile Thr Asp Glu Asn Gly Lys Lys Lys Gln Ser Tyr
145 150 155 160
Phe His Asp Phe Phe Asn Tyr Ala Gly Ile His Arg Ser Val Met Leu
165 170 175
Tyr Thr Thr Pro Asn Thr Trp Val Asp Asp Ile Thr Val Val Thr His
180 185 190
Val Ala Gln Asp Cys Asn His Ala Ser Val Asp Trp Gln Val Val Ala
195 200 205
Asn Gly Asp Val Ser Val Glu Leu Arg Asp Ala Asp Gln Gln Val Val
210 215 220
Ala Thr Gly Gln Gly Thr Ser Gly Thr Leu Gln Val Val Asn Pro His
225 230 235 240
Leu Trp Gln Pro Gly Glu Gly Tyr Leu Tyr Glu Leu Cys Val Thr Ala
245 250 255
Lys Ser Gln Thr Glu Cys Asp Ile Tyr Pro Leu Arg Val Gly Ile Arg
260 265 270
Ser Val Ala Val Lys Gly Glu Gln Phe Leu Ile Asn His Lys Pro Phe
275 280 285
Tyr Phe Thr Gly Phe Gly Arg His Glu Asp Ala Asp Leu Arg Gly Lys
290 295 300
Gly Phe Asp Asn Val Leu Met Val His Asp His Ala Leu Met Asp Trp
305 310 315 320
Ile Gly Ala Asn Ser Tyr Arg Thr Ser His Tyr Pro Tyr Ala Glu Glu
325 330 335
Met Leu Asp Trp Ala Asp Glu His Gly Ile Val Val Ile Asp Glu Thr
340 345 350
Ala Ala Val Gly Phe Asn Leu Ser Leu Gly Ile Gly Phe Glu Ala Gly
355 360 365
Asn Lys Pro Lys Glu Leu Tyr Ser Glu Glu Ala Val Asn Gly Glu Thr
370 375 380
Gln Gln Ala His Leu Gln Ala Ile Lys Glu Leu Ile Ala Arg Asp Lys
385 390 395 400
Asn His Pro Ser Val Val Met Trp Ser Ile Ala Asn Glu Pro Asp Thr
405 410 415
Arg Pro Gln Gly Ala Arg Glu Tyr Phe Ala Pro Leu Ala Glu Ala Thr
420 425 430
Arg Lys Leu Asp Pro Thr Arg Pro Ile Thr Cys Val Asn Val Met Phe
435 440 445
Cys Asp Ala His Thr Asp Thr Ile Ser Asp Leu Phe Asp Val Leu Cys
450 455 460
Leu Asn Arg Tyr Tyr Gly Trp Tyr Val Gln Ser Gly Asp Leu Glu Thr
465 470 475 480
Ala Glu Lys Val Leu Glu Lys Glu Leu Leu Ala Trp Gln Glu Lys Leu
485 490 495
His Gln Pro Ile Ile Ile Thr Glu Tyr Gly Val Asp Thr Leu Ala Gly
500 505 510
Leu His Ser Met Tyr Thr Asp Met Trp Ser Glu Glu Tyr Gln Cys Ala
515 520 525
Trp Leu Asp Met Tyr His Arg Val Phe Asp Arg Val Ser Ala Val Val
530 535 540
Gly Glu Gln Val Trp Asn Phe Ala Asp Phe Ala Thr Ser Gln Gly Ile
545 550 555 560
Leu Arg Val Gly Gly Asn Lys Lys Gly Ile Phe Thr Arg Asp Arg Lys
565 570 575
Pro Lys Ser Ala Ala Phe Leu Leu Gln Lys Arg Trp Thr Gly Met Asn
580 585 590
Phe Gly Glu Lys Pro Gln Gln Gly Gly Lys Gln
595 600
<210> 146
<211> 1422
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的sacB基因
<400> 146
atgaacatca agaagttcgc caagcgggcg accgtcctga ccttcaccac cgccctgctc 60
gcgggcgggg ccacccaggc cttcgccaag gagaacaccc agaagcccta caaggagacg 120
tacggggtgt cgcacatcac ccgccacgac atgctccaga tccccaagca gcagcagagc 180
gagaagtacc aggtcccgca gttcgaccag tccaccatca agaacatcga atcggccaag 240
ggcctcgacg tgtgggactc ctggcccctg cagaacgccg acggcaccgt ggccgagtac 300
aacgggtacc acgtggtgtt cgccctggcg ggctccccca aggacgccga cgacacctcg 360
atctacatgt tctaccagaa ggtcggcgac aacagcatcg actcctggaa gaacgcgggc 420
cgcgtcttca aggacagcga caagttcgac gcgaacgacg agatcctgaa ggagcagacc 480
caggagtggt ccggctccgc caccttcacg tccgacggca agatccggct cttctacacg 540
gacttctccg gcacgcacta cgggaagcag agcctcacca cggcgcaggt caacgtgtcg 600
aagtccgacg acaccctcaa gatcaacggc gtggaggacc acaagacgat cttcgacggc 660
gacggcaaga cctaccagaa cgtgcagcag ttcatcgacg agggcaacta cacgtcgggc 720
gacaaccaca cgctgcgcga cccccactac gtggaggaca aggggcacaa gtacctggtc 780
ttcgaggcca acaccggcac cgacaacggc taccagggcg aggaatccct gttcaacaag 840
gcgtactacg gcggcagcac gaacttcttc cgcaaggaga gccagaagct ccagcagtcg 900
gccaagaagc gggacgccga gctcgccaac ggcgcgctgg gcatggtgga gctgaacgac 960
gactacacgc tgaagaaggt catgaagccg ctcatcacct ccaacaccgt gacggacgag 1020
atcgagcggg cgaacgtctt caagatgaac ggcaagtggt acctgttcac cgactcccgc 1080
ggctccaaga tgaccatcga cggcatcaac tcgaacgaca tctacatgct gggttacgtc 1140
tccaacagcc tgaccgggcc gtacaagccg ctcaacaaga ccggcctggt gctccagatg 1200
ggcctggacc cgaacgacgt caccttcacc tactcccact tcgcggtgcc ccaggcgaag 1260
ggcaacaacg tggtcatcac ctcgtacatg acgaaccggg gcttcttcga ggacaagaag 1320
gccaccttcg ccccctcctt cctgatgaac atcaagggca agaagacctc cgtggtgaag 1380
aacagcatcc tggagcaggg ccagctcacc gtcaacaact ga 1422
<210> 147
<211> 1068
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的红色糖多孢菌pheS基因
<400> 147
atgtccggtg cgaacgaccc ctacgacccc aagcaggtgg ccgcgctgtc cgccgaaacc 60
ctggaacggg cggtggccga cgcgcgggaa gccttcgaca aggccggtga cctcgacgaa 120
ctggccgccg ccaagccggc ccacctgggt gaacggagcc cgctgctgac ggcccggcgg 180
gagatcggtg ccctgccccc gaaggcccgc tccgacgcgg gtaagcgcgt gaacgaggcg 240
cgggaggcga tccagggcgc cttcgacgag cggcgggcgg ccctccaggc ggaacgcgac 300
gaacgggtgc tgcgcgaaga agccgtcgac gtcaccctcc cctgggaccg cgtgcccgtg 360
ggtgcgcgcc acccgatcac ccagctgatc gagcacgtgg ccgacacgtt cgtggccatg 420
ggttgggaag tcgccgaagg ccccgagctc gagaccgaat ggttcaactt cgacgccctg 480
aacttcggca aggaccaccc ggcgcgcacc atgcaggaca ccttctacgt cggtccgaag 540
gaatccggtc tcgtcctccg gacgcacacc agcccggccc aggtccgcgc cctgctggac 600
cgggaactgc cggtgtacgt ggtgtgcccc ggccgcacct tccggaccga cgagctggac 660
tccacgcaca cgccggtctt ccaccaggtg gaagggctcg ccgtggacaa gggtctcacg 720
atggcccacc tcaagggcac gctcgacgcg ttcgcgcgcg tcatgttcgg tcccgaatcc 780
aagacgcgcc tgcgcccgag cttcttcccg ttcgccgaac cctcgggtga agtcgacgtc 840
tggttcccgc agaagaaggg cggtcccggc tgggtcgaat ggggcggctg cggtatggtc 900
aacccgaacg tcctgcgcgc ctgcggtgtc gaccccgaaa cccacaccgg tttcggcttc 960
gggatgggtc tcgaacggac gctccagttc cgcaacggta tcccggacat gcgggacatg 1020
gtggaaggtg acgtgcagtt cacgcagccc ttcggtatcg actcctga 1068
<210> 148
<211> 1062
<212> DNA
<213> 人工序列
<220>
<223> 经密码子优化的刺糖多孢菌pheS基因
<400> 148
gtgtccggcg ccaacgaccc gtacgacccg aaggaagtgg cggcgctctc gccggagacg 60
ctggatcgcg cggtggtcga ggcgagcaag gcgttcgcca cggcgacgga cctggacgcg 120
ctcgccgtgg tgaagccggc gcatctcggc gatcgtagcc cgctgctcac cgcgcgtcgc 180
gaaatcggtg cgctgccgcc caaggcgcgc agcgaagcgg gcaagcgcgt gaatgaagcg 240
cgcgaggcca tccagtcggc gttcgacgag cgccgcgccg ccttgcaggc tgagcgcgat 300
gaacgggtcc tccgcgagga gaccgttgac gtgaccctgc cgtgggaccg ggtctccgcg 360
ggggcccgcc acccgatcac ccagctggct gaggatattg aagacacgtt cgtggcgatg 420
ggttgggagg tcgcggaggg gccggagttg gaagccgaat ggttcaattt cgacgccctg 480
aacttcggta aggatcatcc ggcgcgcacg atgcaggaca ccttctatgt cgcccccgaa 540
aactcggggc tggtcttgcg gacccacacg tccccgtcgc aggtccgggc cctcctggat 600
cgcgagctgc cggtttacgt ggtttgtccc ggccgtacct tccggacgga cgaattggat 660
gcgacccaca cgccggtctt tagccaagtt gaagggctgg cggttgacaa gggtctgagc 720
atggcccact tgaaggggac gctggatgcg tttgcgcggt cgatgttcgg tccggaatcg 780
aagacccggc tgcggccgtc gtacttcccg ttttcggagc cgagcgcgga aatggacgtg 840
tggttcccgg agaagaaggg gggcgcgggc tgggtggagt ggggagggtg tggtatggtc 900
aaccccaacg tgctccgcgc gtgcggcgtg gacccggagg tctacaccgg tttcggtttc 960
ggtatgggcc tggagcggac cctgatgttc cgcaacggca tcccggacat gcgggatatg 1020
gtcgaggggg atgtgcgttt cacgcagccg tttgggatct ga 1062
<210> 149
<211> 309
<212> DNA
<213> 红色糖多孢菌
<400> 149
agcttggtac cagcccgacc cgagcacgcg ccggcacgcc tggtcgatgt cggaccggag 60
ttcgaggtac gcggcttgca ggtccaggaa ggggacgtcc atgcgagtgt ccgttcgagt 120
ggcggcttgc gcccgatgct agtcgcggtt gatcggcgat cgcaggtgca cgcggtcgat 180
cttgacggct ggcgagaggt gcggggagga tctgaccgac gcggtccaca cgtggcaccg 240
cgatgctgtt gtgggcacaa tcgtgccggt tggtaggatc cccacccaac gcaccccagg 300
aggtcccat 309
<210> 150
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> GFP、RFP的终止序列
<400> 150
atcgatagcc gccccgcagg gcgctccgca ggccgcttcc ggaccactcc ggaagcggcc 60
gtgcggtcgg aggtacc 77
<210> 151
<211> 261
<212> PRT
<213> 人工序列
<220>
<223> 赋予对安普霉素抗性的选择标记基因aac(3)IV
<400> 151
Met Gln Tyr Glu Trp Arg Lys Ala Glu Leu Ile Gly Gln Leu Leu Asn
1 5 10 15
Leu Gly Val Thr Pro Gly Gly Val Leu Leu Val His Ser Ser Phe Arg
20 25 30
Ser Val Arg Pro Leu Glu Asp Gly Pro Leu Gly Leu Ile Glu Ala Leu
35 40 45
Arg Ala Ala Leu Gly Pro Gly Gly Thr Leu Val Met Pro Ser Trp Ser
50 55 60
Gly Leu Asp Asp Glu Pro Phe Asp Pro Ala Thr Ser Pro Val Thr Pro
65 70 75 80
Asp Leu Gly Val Val Ser Asp Thr Phe Trp Arg Leu Pro Asn Val Lys
85 90 95
Arg Ser Ala His Pro Phe Ala Phe Ala Ala Ala Gly Pro Gln Ala Glu
100 105 110
Gln Ile Ile Ser Asp Pro Leu Pro Leu Pro Pro His Ser Pro Ala Ser
115 120 125
Pro Val Ala Arg Val His Glu Leu Asp Gly Gln Val Leu Leu Leu Gly
130 135 140
Val Gly His Asp Ala Asn Thr Thr Leu His Leu Ala Glu Leu Met Ala
145 150 155 160
Lys Val Pro Tyr Gly Val Pro Arg His Cys Thr Ile Leu Gln Asp Gly
165 170 175
Lys Leu Val Arg Val Asp Tyr Leu Glu Asn Asp His Cys Cys Glu Arg
180 185 190
Phe Ala Leu Ala Asp Arg Trp Leu Lys Glu Lys Ser Leu Gln Lys Glu
195 200 205
Gly Pro Val Gly His Ala Phe Ala Arg Leu Ile Arg Ser Arg Asp Ile
210 215 220
Val Ala Thr Ala Leu Gly Gln Leu Gly Arg Asp Pro Leu Ile Phe Leu
225 230 235 240
His Pro Pro Glu Gly Gly Met Arg Arg Met Arg Cys Arg Ser Pro Val
245 250 255
Asp Trp Leu Ser Ser
260
<210> 152
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 赋予对庆大霉素抗性的选择标记基因aacC1
<400> 152
Met Leu Arg Ser Ser Asn Asp Val Thr Gln Gln Gly Ser Arg Pro Lys
1 5 10 15
Thr Lys Leu Gly Gly Ser Ser Met Gly Ile Ile Arg Thr Cys Arg Leu
20 25 30
Gly Pro Asp Gln Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly
35 40 45
Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gln His Gln Pro Asp Ser
50 55 60
Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala
65 70 75 80
Ala Phe Asp Gln Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu
85 90 95
Pro Arg Phe Glu Gln Pro Arg Ser Glu Ile Tyr Ile Tyr Asp Leu Ala
100 105 110
Val Ser Gly Glu His Arg Arg Gln Gly Ile Ala Thr Ala Leu Ile Asn
115 120 125
Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val
130 135 140
Gln Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu
145 150 155 160
Gly Ile Arg Glu Glu Val Met His Phe Asp Ile Asp Pro Ser Thr Ala
165 170 175
Thr
<210> 153
<211> 286
<212> PRT
<213> 人工序列
<220>
<223> 赋予对新霉素B抗性的选择标记基因aacC8
<400> 153
Met Asp Glu Lys Glu Leu Ile Glu Arg Ala Gly Gly Pro Val Thr Arg
1 5 10 15
Gly Arg Leu Val Arg Asp Leu Glu Ala Leu Gly Val Gly Ala Gly Asp
20 25 30
Thr Val Met Val His Thr Arg Met Ser Ala Ile Gly Tyr Val Val Gly
35 40 45
Gly Pro Gln Thr Val Ile Asp Ala Val Arg Asp Ala Val Gly Ala Asp
50 55 60
Gly Thr Leu Met Ala Tyr Cys Gly Trp Asn Asp Ala Pro Pro Tyr Asp
65 70 75 80
Leu Ala Glu Trp Pro Pro Ala Trp Arg Glu Ala Ala Arg Ala Glu Trp
85 90 95
Pro Ala Tyr Asp Pro Leu Leu Ser Glu Ala Asp Arg Gly Asn Gly Arg
100 105 110
Val Pro Glu Ala Leu Arg His Gln Pro Gly Ala Val Arg Ser Arg His
115 120 125
Pro Asp Ala Ser Phe Val Ala Val Gly Pro Ala Ala His Pro Leu Met
130 135 140
Asp Asp His Pro Trp Asp Asp Pro His Gly Pro Asp Ser Pro Leu Ala
145 150 155 160
Arg Leu Ala Gly Ala Gly Gly Arg Val Leu Leu Leu Gly Ala Pro Leu
165 170 175
Asp Thr Leu Thr Leu Leu His His Ala Glu Ala Arg Ala Glu Ala Pro
180 185 190
Gly Lys Arg Phe Val Ala Tyr Glu Gln Pro Val Thr Val Gly Gly Arg
195 200 205
Arg Val Trp Arg Arg Phe Arg Asp Val Asp Thr Ser Arg Gly Val Pro
210 215 220
Tyr Gly Arg Val Val Pro Glu Gly Val Val Pro Phe Thr Val Ile Ala
225 230 235 240
Gln Asp Met Leu Ala Ala Gly Ile Gly Arg Thr Gly Arg Val Ala Ala
245 250 255
Ala Pro Val His Leu Phe Glu Ala Ala Asp Val Val Arg Phe Gly Val
260 265 270
Glu Trp Ile Glu Ser Arg Met Gly Gly Ala Ala Gly Gly Ala
275 280 285
<210> 154
<211> 262
<212> PRT
<213> 人工序列
<220>
<223> 赋予对奇霉素、链霉素抗性的选择标记基因aadA
<400> 154
Met Arg Glu Ala Val Ile Ala Glu Val Ser Thr Gln Leu Ser Glu Val
1 5 10 15
Val Gly Val Ile Glu Arg His Leu Glu Pro Thr Leu Leu Ala Val His
20 25 30
Leu Tyr Gly Ser Ala Val Asp Gly Gly Leu Lys Pro His Ser Asp Ile
35 40 45
Asp Leu Leu Val Thr Val Thr Val Arg Leu Asp Glu Thr Thr Arg Arg
50 55 60
Ala Leu Ile Asn Asp Leu Leu Glu Thr Ser Ala Ser Pro Gly Glu Ser
65 70 75 80
Glu Ile Leu Arg Ala Val Glu Val Thr Ile Val Val His Asp Asp Ile
85 90 95
Ile Pro Trp Arg Tyr Pro Ala Lys Arg Glu Leu Gln Phe Gly Glu Trp
100 105 110
Gln Arg Asn Asp Ile Leu Ala Gly Ile Phe Glu Pro Ala Thr Ile Asp
115 120 125
Ile Asp Leu Ala Ile Leu Leu Thr Lys Ala Arg Glu His Ser Val Ala
130 135 140
Leu Val Gly Pro Ala Ala Glu Glu Leu Phe Asp Pro Val Pro Glu Gln
145 150 155 160
Asp Leu Phe Glu Ala Leu Asn Glu Thr Leu Thr Leu Trp Asn Ser Pro
165 170 175
Pro Asp Trp Ala Gly Asp Glu Arg Asn Val Val Leu Thr Leu Ser Arg
180 185 190
Ile Trp Tyr Ser Ala Val Thr Gly Lys Ile Ala Pro Lys Asp Val Ala
195 200 205
Ala Asp Trp Ala Met Glu Arg Leu Pro Ala Gln Tyr Gln Pro Val Ile
210 215 220
Leu Glu Ala Arg Gln Ala Tyr Leu Gly Gln Glu Glu Asp Arg Leu Ala
225 230 235 240
Ser Arg Ala Asp Gln Leu Glu Glu Phe Val His Tyr Val Lys Gly Glu
245 250 255
Ile Thr Lys Val Val Gly
260
<210> 155
<211> 126
<212> PRT
<213> 人工序列
<220>
<223> 赋予对博莱霉素抗性的选择标记基因ble
<400> 155
Met Thr Asp Gln Ala Thr Pro Asn Leu Pro Ser Arg Asp Phe Asp Ser
1 5 10 15
Thr Ala Ala Phe Tyr Glu Arg Leu Gly Phe Gly Ile Val Phe Arg Asp
20 25 30
Ala Gly Trp Met Ile Leu Gln Arg Gly Asp Leu Met Leu Glu Phe Phe
35 40 45
Ala His Pro Gly Leu Asp Pro Leu Ala Ser Trp Phe Ser Cys Cys Leu
50 55 60
Arg Leu Asp Asp Leu Ala Glu Phe Tyr Arg Gln Cys Lys Ser Val Gly
65 70 75 80
Ile Gln Glu Thr Ser Ser Gly Tyr Pro Arg Ile His Ala Pro Glu Leu
85 90 95
Gln Glu Trp Gly Gly Thr Met Ala Ala Leu Val Asp Pro Asp Gly Thr
100 105 110
Leu Leu Arg Leu Ile Gln Asn Glu Leu Leu Ala Gly Ile Ser
115 120 125
<210> 156
<211> 219
<212> PRT
<213> 人工序列
<220>
<223> 赋予对氯霉素抗性的选择标记基因cat
<400> 156
Met Glu Lys Lys Ile Thr Gly Tyr Thr Thr Val Asp Ile Ser Gln Trp
1 5 10 15
His Arg Lys Glu His Phe Glu Ala Phe Gln Ser Val Ala Gln Cys Thr
20 25 30
Tyr Asn Gln Thr Val Gln Leu Asp Ile Thr Ala Phe Leu Lys Thr Val
35 40 45
Lys Lys Asn Lys His Lys Phe Tyr Pro Ala Phe Ile His Ile Leu Ala
50 55 60
Arg Leu Met Asn Ala His Pro Glu Phe Arg Met Ala Met Lys Asp Gly
65 70 75 80
Glu Leu Val Ile Trp Asp Ser Val His Pro Cys Tyr Thr Val Phe His
85 90 95
Glu Gln Thr Glu Thr Phe Ser Ser Leu Trp Ser Glu Tyr His Asp Asp
100 105 110
Phe Arg Gln Phe Leu His Ile Tyr Ser Gln Asp Val Ala Cys Tyr Gly
115 120 125
Glu Asn Leu Ala Tyr Phe Pro Lys Gly Phe Ile Glu Asn Met Phe Phe
130 135 140
Val Ser Ala Asn Pro Trp Val Ser Phe Thr Ser Phe Asp Leu Asn Val
145 150 155 160
Ala Asn Met Asp Asn Phe Phe Ala Pro Val Phe Thr Met Gly Lys Tyr
165 170 175
Tyr Thr Gln Gly Asp Lys Val Leu Met Pro Leu Ala Ile Gln Val His
180 185 190
His Ala Val Cys Asp Gly Phe His Val Gly Arg Met Leu Asn Glu Leu
195 200 205
Gln Gln Tyr Cys Asp Glu Trp Gln Gly Gly Ala
210 215
<210> 157
<211> 381
<212> PRT
<213> 人工序列
<220>
<223> 赋予对红霉素抗性的选择标记基因ermE
<400> 157
Met Ser Ser Ser Asp Glu Gln Pro Arg Pro Arg Arg Arg Asn Gln Asp
1 5 10 15
Arg Gln His Pro Asn Gln Asn Arg Pro Val Leu Gly Arg Thr Glu Arg
20 25 30
Asp Arg Asn Arg Arg Gln Phe Gly Gln Asn Phe Leu Arg Asp Arg Lys
35 40 45
Thr Ile Ala Arg Ile Ala Glu Thr Ala Glu Leu Arg Pro Asp Leu Pro
50 55 60
Val Leu Glu Ala Gly Pro Gly Glu Gly Leu Leu Thr Arg Glu Leu Ala
65 70 75 80
Asp Arg Ala Arg Gln Val Thr Ser Tyr Glu Ile Asp Pro Arg Leu Ala
85 90 95
Lys Ser Leu Arg Glu Lys Leu Ser Gly His Pro Asn Ile Glu Val Val
100 105 110
Asn Ala Asp Phe Leu Thr Ala Glu Pro Pro Pro Glu Pro Phe Ala Phe
115 120 125
Val Gly Ala Ile Pro Tyr Gly Ile Thr Ser Ala Ile Val Asp Trp Cys
130 135 140
Leu Glu Ala Pro Thr Ile Glu Thr Ala Thr Met Val Thr Gln Leu Glu
145 150 155 160
Phe Ala Arg Lys Arg Thr Gly Asp Tyr Gly Arg Trp Ser Arg Leu Thr
165 170 175
Val Met Thr Trp Pro Leu Phe Glu Trp Glu Phe Val Glu Lys Val Asp
180 185 190
Arg Arg Leu Phe Lys Pro Val Pro Lys Val Asp Ser Ala Ile Met Arg
195 200 205
Leu Arg Arg Arg Ala Glu Pro Leu Leu Glu Gly Ala Ala Leu Glu Arg
210 215 220
Tyr Glu Ser Met Val Glu Leu Cys Phe Thr Gly Val Gly Gly Asn Ile
225 230 235 240
Gln Ala Ser Leu Leu Arg Lys Tyr Pro Arg Arg Arg Val Glu Ala Ala
245 250 255
Leu Asp His Ala Gly Val Gly Gly Gly Ala Val Val Ala Tyr Val Arg
260 265 270
Pro Glu Gln Trp Leu Arg Leu Phe Glu Arg Leu Asp Gln Lys Asn Glu
275 280 285
Pro Arg Gly Gly Gln Pro Gln Arg Gly Arg Arg Thr Gly Gly Arg Asp
290 295 300
His Gly Asp Arg Arg Thr Gly Gly Gln Asp Arg Gly Asp Arg Arg Thr
305 310 315 320
Gly Gly Arg Asp His Arg Asp Arg Gln Ala Ser Gly His Gly Asp Arg
325 330 335
Arg Ser Ser Gly Arg Asn Arg Asp Asp Gly Arg Thr Gly Glu Arg Glu
340 345 350
Gln Gly Asp Gln Gly Gly Arg Arg Gly Pro Ser Gly Gly Gly Arg Thr
355 360 365
Gly Gly Arg Pro Gly Arg Arg Gly Gly Pro Gly Gln Arg
370 375 380
<210> 158
<211> 332
<212> PRT
<213> 人工序列
<220>
<223> 赋予对潮霉素抗性的选择标记基因hyg
<400> 158
Met Thr Gln Glu Ser Leu Leu Leu Leu Asp Arg Ile Asp Ser Asp Asp
1 5 10 15
Ser Tyr Ala Ser Leu Arg Asn Asp Gln Glu Phe Trp Glu Pro Leu Ala
20 25 30
Arg Arg Ala Leu Glu Glu Leu Gly Leu Pro Val Pro Pro Val Leu Arg
35 40 45
Val Pro Gly Glu Ser Thr Asn Pro Val Leu Val Gly Glu Pro Asp Pro
50 55 60
Val Ile Lys Leu Phe Gly Glu His Trp Cys Gly Pro Glu Ser Leu Ala
65 70 75 80
Ser Glu Ser Glu Ala Tyr Ala Val Leu Ala Asp Ala Pro Val Pro Val
85 90 95
Pro Arg Leu Leu Gly Arg Gly Glu Leu Arg Pro Gly Thr Gly Ala Trp
100 105 110
Pro Trp Pro Tyr Leu Val Met Ser Arg Met Thr Gly Thr Thr Trp Arg
115 120 125
Ser Ala Met Asp Gly Thr Thr Asp Arg Asn Ala Leu Leu Ala Leu Ala
130 135 140
Arg Glu Leu Gly Arg Val Leu Gly Arg Leu His Arg Val Pro Leu Thr
145 150 155 160
Gly Asn Thr Val Leu Thr Pro His Ser Glu Val Phe Pro Glu Leu Leu
165 170 175
Arg Glu Arg Arg Ala Ala Thr Val Glu Asp His Arg Gly Trp Gly Tyr
180 185 190
Leu Ser Pro Arg Leu Leu Asp Arg Leu Glu Asp Trp Leu Pro Asp Val
195 200 205
Asp Thr Leu Leu Ala Gly Arg Glu Pro Arg Phe Val His Gly Asp Leu
210 215 220
His Gly Thr Asn Ile Phe Val Asp Leu Ala Ala Thr Glu Val Thr Gly
225 230 235 240
Ile Val Asp Phe Thr Asp Val Tyr Ala Gly Asp Ser Arg Tyr Ser Leu
245 250 255
Val Gln Leu His Leu Asn Ala Phe Arg Gly Asp Arg Glu Ile Leu Ala
260 265 270
Ala Leu Leu Asp Gly Ala Gln Trp Lys Arg Thr Glu Asp Phe Ala Arg
275 280 285
Glu Leu Leu Ala Phe Thr Phe Leu His Asp Phe Glu Val Phe Glu Glu
290 295 300
Thr Pro Leu Asp Leu Ser Gly Phe Thr Asp Pro Glu Glu Leu Ala Gln
305 310 315 320
Phe Leu Trp Gly Pro Pro Asp Thr Ala Pro Gly Ala
325 330
<210> 159
<211> 264
<212> PRT
<213> 人工序列
<220>
<223> 赋予对卡那霉素抗性的选择标记基因neo
<400> 159
Met Ile Glu Gln Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val
1 5 10 15
Glu Arg Leu Phe Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser
20 25 30
Asp Ala Ala Val Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe
35 40 45
Val Lys Thr Asp Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala
50 55 60
Ala Arg Leu Ser Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val
65 70 75 80
Leu Asp Val Val Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu
85 90 95
Val Pro Gly Gln Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys
100 105 110
Val Ser Ile Met Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro
115 120 125
Ala Thr Cys Pro Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala
130 135 140
Arg Thr Arg Met Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu
145 150 155 160
Glu His Gln Gly Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala
165 170 175
Arg Met Pro Asp Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys
180 185 190
Leu Pro Asn Ile Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp
195 200 205
Cys Gly Arg Leu Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala
210 215 220
Thr Arg Asp Ile Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe
225 230 235 240
Leu Val Leu Tyr Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe
245 250 255
Tyr Arg Leu Leu Asp Glu Phe Phe
260
<210> 160
<211> 1644
<212> DNA
<213> 人工序列
<220>
<223> 选择标记基因amdSYM
<400> 160
atgccccagt cctgggagga gctggcggcc gacaagcgcg cgcgcctcgc gaagacgatc 60
ccggacgagt ggaaggtcca gacgctgccc gcggaggact ccgtgatcga cttccccaag 120
aagtcgggga tcctctccga ggcggagctg aagatcaccg aagcctccgc ggccgacctg 180
gtcagcaagc tggcggccgg cgagctgacc agcgtcgaag tcaccctggc cttctgcaag 240
cgggcggcca tcgcgcagca gctcacgaac tgcgcccacg agttcttccc cgacgccgcc 300
ctcgcccagg cgcgcgagct ggacgagtac tacgccaagc acaagcgccc ggtggggccc 360
ctccacgggc tgccgatctc gctgaaggac cagctccggg tcaagggcta cgagacctcg 420
atggggtaca tctcgtggct gaacaagtac gacgagggcg actccgtcct gaccaccatg 480
ctgcggaagg ccggcgccgt cttctacgtc aagacctcgg tcccgcagac cctcatggtg 540
tgcgagacgg tgaacaacat catcggccgg accgtgaacc cccggaacaa gaactggtcc 600
tgcggcggct cctccggcgg ggagggggcc atcgtcggca tccgcggcgg cgtcatcggc 660
gtgggcaccg acatcggcgg ctccatccgg gtgcccgccg ccttcaactt cctctacggc 720
ctgcgcccgt cccacgggcg cctcccgtac gcgaagatgg ccaactccat ggagggccag 780
gagaccgtgc actcggtggt gggccccatc acccactcgg tcgaagacct gcgcctgttc 840
acgaagagcg tcctgggcca ggaaccgtgg aagtacgaca gcaaggtgat cccgatgccg 900
tggcgccagt ccgagtcgga catcatcgcc tccaagatca agaacggggg cctgaacatc 960
gggtactaca acttcgacgg caacgtgctc ccgcaccccc cgatcctgcg cggggtcgag 1020
accacggtgg ccgccctggc caaggccggc cacaccgtca cgccctggac cccgtacaag 1080
cacgacttcg gccacgacct catctcccac atctacgcgg cggacggcag cgccgacgtg 1140
atgcgcgaca tctcggcctc cggggaaccg gcgatcccca acatcaagga cctgctgaac 1200
cccaacatca aggccgtcaa catgaacgag ctgtgggaca cccacctgca gaagtggaac 1260
taccagatgg aatacctcga gaagtggcgc gaggccgagg agaaggcggg caaggagctg 1320
gacgcgatca tcgccccgat cacccccacc gcggcggtgc ggcacgacca gttccggtac 1380
tacggctacg cctcggtcat caacctcctg gacttcacct ccgtcgtcgt cccggtgacg 1440
ttcgcggaca agaacatcga caagaagaac gaatcgttca aggcggtctc ggagctggac 1500
gccctcgtgc aggaggagta cgacccggaa gcctaccacg gcgccccggt cgccgtccag 1560
gtgatcgggc gccgcctgtc ggaggagcgc accctcgcga tcgccgagga ggtgggcaag 1620
ctgctgggca acgtcgtgac gccc 1644
<210> 161
<211> 1215
<212> DNA
<213> 人工序列
<220>
<223> 反向选择标记tetA基因
<400> 161
atgaaccgca ccgtgatgat ggcgctcgtc atcatcttcc tcgacgccat gggcatcggc 60
atcatcatgc cggtcctgcc ggccctgctg cgggagttcg tgggcaaggc gaacgtggcg 120
gagaactacg gcgtcctcct cgcgctgtac gccatgatgc aggtgatctt cgcgccgctg 180
ctcggccggt ggtcggaccg catcggccgc cggccggtcc tgctgctctc gctcctcggg 240
gcgaccctgg actacgccct catggcgacg gcgtccgtcg tgtgggtcct ctacctgggc 300
cggctgatcg ccggcatcac gggcgccacc ggcgccgtcg cggcgtcgac gatcgccgac 360
gtcaccccgg aggagtcgcg cacccactgg ttcggcatga tgggcgcctg cttcggcggc 420
gggatgatcg ccggccccgt gatcggcggc ttcgccggcc agctctcggt gcaggccccc 480
ttcatgttcg ccgccgccat caacggcctg gccttcctgg tgtcgctgtt catcctgcac 540
gagacccaca acgccaacca ggtgtccgac gaactgaaga acgaaaccat caacgagacg 600
acctcgtcga tccgggagat gatctccccc ctgtccggcc tgctcgtggt cttcttcatc 660
atccagctga tcggccagat ccccgcgacc ctctgggtgc tgttcggcga ggaacgcttc 720
gcctgggacg gcgtgatggt gggggtgtcc ctcgcggtgt tcgggctcac ccacgcgctg 780
ttccagggcc tggcggcggg cttcatcgcc aagcacctgg gcgagcgcaa ggccatcgcc 840
gtcgggatcc tggccgacgg ctgcggcctg ttcctgctgg cggtgatcac ccagtcctgg 900
atggtctggc cggtcctgct gctcctggcc tgcggcggga tcaccctgcc ggcgctccag 960
ggcatcatct ccgtccgcgt cggccaggtc gcgcaggggc agctgcaggg cgtgctgacg 1020
tcgctcaccc acctcacggc cgtgatcggg ccgctcgtgt tcgccttcct gtactccgcg 1080
acccgcgaga cctggaacgg ctgggtgtgg atcatcggct gcggcctgta cgtcgtggcc 1140
ctcatcatcc tgcgcttctt ccaccccggc cgggtgatcc accccatcaa caagtccgac 1200
gtccagcagc ggatc 1215
<210> 162
<211> 1251
<212> DNA
<213> 人工序列
<220>
<223> 反向选择标记lacY基因
<400> 162
atgtactacc tgaagaacac caacttctgg atgttcggcc tgttcttctt cttctacttc 60
ttcatcatgg gcgcctactt cccgttcttc cccatctggc tgcacgacat caaccacatc 120
tcgaagtcgg acaccgggat catcttcgcg gccatctcgc tcttctcgct cctgttccag 180
ccgctcttcg ggctgctctc ggacaagctg ggcctccgca agtacctgct ctggatcatc 240
acgggcatgc tggtcatgtt cgcgccgttc ttcatcttca tcttcggccc cctcctgcag 300
tacaacatcc tggtggggtc gatcgtcggc gggatctacc tgggcttctg cttcaacgcc 360
ggggcgccgg ccgtcgaggc cttcatcgag aaggtctcgc gccggtcgaa cttcgagttc 420
gggcgcgccc ggatgttcgg ctgcgtgggc tgggccctct gcgcctccat cgtgggcatc 480
atgttcacga tcaacaacca gttcgtcttc tggctggggt ccggctgcgc cctcatcctc 540
gcggtgctgc tgttcttcgc caagaccgac gccccgagca gcgcgacggt cgcgaacgcc 600
gtgggggcga accactccgc cttctcgctc aagctcgcgc tggagctgtt ccggcagccc 660
aagctgtggt tcctgtcgct gtacgtcatc ggcgtcagct gcacgtacga cgtgttcgac 720
cagcagttcg ccaacttctt cacctcgttc ttcgccaccg gcgagcaggg cacccgggtc 780
ttcggctacg tgaccacgat gggggagctg ctcaacgcct cgatcatgtt cttcgccccc 840
ctgatcatca accgcatcgg cggcaagaac gccctcctcc tggccggcac catcatgtcc 900
gtccgcatca tcggctccag cttcgcgacc tccgccctgg aggtcgtgat cctgaagacc 960
ctgcacatgt tcgaggtccc gttcctcctg gtcggctgct tcaagtacat cacctcccag 1020
ttcgaggtcc gcttctcggc cacgatctac ctggtctgct tctgcttctt caagcagctg 1080
gcgatgatct tcatgagcgt cctcgcgggc aacatgtacg aaagcatcgg cttccagggc 1140
gcctacctgg tgctgggcct ggtggccctc ggcttcaccc tcatcagcgt cttcaccctc 1200
tccggcccgg gcccgctgtc cctgctccgc cgccaggtca acgaggtggc g 1251
<210> 163
<211> 1419
<212> DNA
<213> 人工序列
<220>
<223> 反向选择标记sacB基因
<400> 163
atgaacatca agaagttcgc caagcgggcg accgtcctga ccttcaccac cgccctgctc 60
gcgggcgggg ccacccaggc cttcgccaag gagaacaccc agaagcccta caaggagacg 120
tacggggtgt cgcacatcac ccgccacgac atgctccaga tccccaagca gcagcagagc 180
gagaagtacc aggtcccgca gttcgaccag tccaccatca agaacatcga atcggccaag 240
ggcctcgacg tgtgggactc ctggcccctg cagaacgccg acggcaccgt ggccgagtac 300
aacgggtacc acgtggtgtt cgccctggcg ggctccccca aggacgccga cgacacctcg 360
atctacatgt tctaccagaa ggtcggcgac aacagcatcg actcctggaa gaacgcgggc 420
cgcgtcttca aggacagcga caagttcgac gcgaacgacg agatcctgaa ggagcagacc 480
caggagtggt ccggctccgc caccttcacg tccgacggca agatccggct cttctacacg 540
gacttctccg gcacgcacta cgggaagcag agcctcacca cggcgcaggt caacgtgtcg 600
aagtccgacg acaccctcaa gatcaacggc gtggaggacc acaagacgat cttcgacggc 660
gacggcaaga cctaccagaa cgtgcagcag ttcatcgacg agggcaacta cacgtcgggc 720
gacaaccaca cgctgcgcga cccccactac gtggaggaca aggggcacaa gtacctggtc 780
ttcgaggcca acaccggcac cgacaacggc taccagggcg aggaatccct gttcaacaag 840
gcgtactacg gcggcagcac gaacttcttc cgcaaggaga gccagaagct ccagcagtcg 900
gccaagaagc gggacgccga gctcgccaac ggcgcgctgg gcatggtgga gctgaacgac 960
gactacacgc tgaagaaggt catgaagccg ctcatcacct ccaacaccgt gacggacgag 1020
atcgagcggg cgaacgtctt caagatgaac ggcaagtggt acctgttcac cgactcccgc 1080
ggctccaaga tgaccatcga cggcatcaac tcgaacgaca tctacatgct gggctacgtc 1140
tccaacagcc tgaccgggcc gtacaagccg ctcaacaaga ccggcctggt gctccagatg 1200
ggcctggacc cgaacgacgt caccttcacc tactcccact tcgcggtgcc ccaggcgaag 1260
ggcaacaacg tggtcatcac ctcgtacatg acgaaccggg gcttcttcga ggacaagaag 1320
gccaccttcg ccccctcctt cctgatgaac atcaagggca agaagacctc cgtggtgaag 1380
aacagcatcc tggagcaggg ccagctcacc gtcaacaac 1419
<210> 164
<211> 1068
<212> DNA
<213> 人工序列
<220>
<223> 源自红色糖多孢菌的反向选择标记pheS基因
<400> 164
atgtccggtg cgaacgaccc ctacgacccc aagcaggtgg ccgcgctgtc cgccgaaacc 60
ctggaacggg cggtggccga cgcgcgggaa gccttcgaca aggccggtga cctcgacgaa 120
ctggccgccg ccaagccggc ccacctgggt gaacggagcc cgctgctgac ggcccggcgg 180
gagatcggtg ccctgccccc gaaggcccgc tccgacgcgg gtaagcgcgt gaacgaggcg 240
cgggaggcga tccagggcgc cttcgacgag cggcgggcgg ccctccaggc ggaacgcgac 300
gaacgggtgc tgcgcgaaga agccgtcgac gtcaccctcc cctgggaccg cgtgcccgtg 360
ggtgcgcgcc acccgatcac ccagctgatc gagcacgtgg ccgacacgtt cgtggccatg 420
ggttgggaag tcgccgaagg ccccgagctc gagaccgaat ggttcaactt cgacgccctg 480
aacttcggca aggaccaccc ggcgcgcacc atgcaggaca ccttctacgt cggtccgaag 540
gaatccggtc tcgtcctccg gacgcacacc agcccggccc aggtccgcgc cctgctggac 600
cgggaactgc cggtgtacgt ggtgtgcccc ggccgcacct tccggaccga cgagctggac 660
tccacgcaca cgccggtctt ccaccaggtg gaagggctcg ccgtggacaa gggtctcacg 720
atggcccacc tcaagggcac gctcgacgcg ttcgcgcgcg tcatgttcgg tcccgaatcc 780
aagacgcgcc tgcgcccgag cttcttcccg ttcgccgaac cctcgggtga agtcgacgtc 840
tggttcccgc agaagaaggg cggtcccggc tgggtcgaat ggggcggctg cggtatggtc 900
aacccgaacg tcctgcgcgc ctgcggtgtc gaccccgaaa cccacaccgg tttcggcttc 960
gggatgggtc tcgaacggac gctccagttc cgcaacggta tcccggacat gcgggacatg 1020
gtggaaggtg acgtgcagtt cacgcagccc ttcggtatcg actcctga 1068
<210> 165
<211> 1038
<212> DNA
<213> 人工序列
<220>
<223> 源自棒状杆菌的反向选择标记pheS基因
<400> 165
atgagcgaga tccagctgac cgaggcctcg ctcaacgagg ccgccgacgc cgccatcaag 60
gccttcgacg gcgcgcagaa cctcgacgaa ctcgcggcgc tgcgccggga ccacctgggc 120
gacgccgccc ccatcccgca ggcccgccgc tccctcggga ccatcccgaa ggaccagcgc 180
aaggacgcgg gtcgcttcgt gaacatggcc ctcggtcgcg cggaaaagca cttcgcccag 240
gtcaaggtgg tgctcgaaga aaagcgcaac gcggaggtcc tcgagctcga acgggtggac 300
gtgaccgtcc cgaccacccg ggaacaggtg ggtgcgctcc acccgatcac catcctgaac 360
gaacagatcg cggacatctt cgtcggtatg ggctgggaaa tcgccgaagg tccggaggtg 420
gaggcggagt acttcaactt cgacgcgctc aacttcctcc ccgaccaccc cgcgcgcacg 480
ctccaggaca ccttccacat cgcgcccgag ggttcgcgcc aggtgctgcg gacgcacacc 540
tccccggtgc aggtccgcac catgctgaac cgcgaagtgc ccatctacat cgcgtgcccg 600
ggtcgggtgt tccgcacgga cgaactcgac gcgacccaca ccccggtctt ccaccagatc 660
gaggggctgg cggtcgacaa gggtctgacg atggcccacc tgcgcgggac gctggaccac 720
ctggccaagg agctgttcgg gccggaaacc aagacgcgca tgcgctccaa ctacttcccg 780
ttctcggagc cctccgcgga ggtcgacgtc tggttcccga acaagaaggg tggggccggc 840
tggatcgaat ggggcgggtg cggcatggtg aaccccaacg tcctccgcgc cgtgggtgtc 900
gacccggaag agtacaccgg gttcggcttc ggcatgggca tcgaacggac cctgcagttc 960
cgcaacggtc tgagcgacat gcgggacatg gtcgagggtg acatccggtt cacgctcccg 1020
ttcggcatcc aggcctga 1038
<210> 166
<211> 668
<212> DNA
<213> 人工序列
<220>
<223> GST溶解性标签
<400> 166
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggttcc 668
<210> 167
<211> 150
<212> DNA
<213> 植物内生糖多孢菌
<400> 167
gcgagaggcc cggaagcgag atcgcttccg ggcctctgac ctgcggagga tacgggattc 60
gaacccgtga gggctattaa cccaacacga tttccaattc cgatggcgcg agtgccaggg 120
ggtagctgaa cgtgcctttt gcctggtcag 150
<210> 168
<211> 45
<212> DNA
<213> 红色糖多孢菌
<400> 168
tcggagccgc tgaggggact cgaacccctg accgtccgct tacaa 45
<210> 169
<211> 52
<212> DNA
<213> 刺糖多孢菌
<400> 169
ggcagctctt ggtggtggcc aggggcgggg tcgaaccgcc gaccttccgc tt 52
<210> 170
<211> 48
<212> DNA
<213> 刺糖多孢菌
<400> 170
tcggagccgc tgaggggact cgaacccctg accgtccgct tacaaggc 48
<210> 171
<211> 76
<212> DNA
<213> 刺糖多孢菌
<400> 171
ggagccgcct aagggaatcg aacccttgac ctacgcatta cgagtgcgtc gctctagccg 60
actgagctaa ggcggc 76
<210> 172
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子Pmut-1
<400> 172
tgtgcggtgg ctaacacgtc ctagtatggt atcatgagca a 41
<210> 173
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子B2
<400> 173
tgtgcgctgg ctaacacgtc ctagtatggt atagtgagca a 41
<210> 174
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子D1
<400> 174
tgtgcggttc ctaacacgtc ctagtatggt actatgagca a 41
<210> 175
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 合成启动子D2
<400> 175
tgtgcggtgg ctaacacgtc ctagtatggt atcatgagca a 41

Claims (215)

1.一种使糖多孢菌属微生物进化以获得所期望表型的高通量(HTP)基因组工程改造方法,其包含:
a.扰动具有相同基因组菌株背景的初始多种糖多孢菌微生物的基因组,由此创建包含具有独特基因变异的个别糖多孢菌菌株的初始HTP基因设计糖多孢菌菌株文库;
b.针对所期望表型筛选和选择所述初始HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;
c.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述基因变异选自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续HTP基因设计糖多孢菌菌株文库;
d.针对所期望表型筛选和选择所述后续HTP基因设计糖多孢菌菌株文库中的个别糖多孢菌菌株;和
e.按照线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌微生物已获得所期望表型为止,其中每次后续迭代创建了新的HTP基因设计糖多孢菌菌株文库,所述新的HTP基因设计糖多孢菌菌株文库包含具有独特基因变异的个别糖多孢菌菌株,所述独特基因变异是选自前一HTP基因设计糖多孢菌菌株文库中的至少两种个别糖多孢菌菌株的基因变异组合。
2.根据权利要求1所述的HTP基因组工程改造方法,其中在步骤(b)中组合所述基因变异之前,不考虑含有所述基因变异的所述基因的功能和/或特性。
3.根据权利要求1所述的HTP基因组工程改造方法,其中待组合的至少一种基因变异不在含有编码DNA模块的重复区段的基因组区域内。
4.根据权利要求1所述的HTP基因组工程改造方法,其中通过以下产生步骤(c)中各自包含独特基因变异组合的所述后续多种糖多孢菌微生物:
1)将质粒引入到属于所述初始HTP基因设计糖多孢菌菌株文库的个别糖多孢菌菌株中,其中所述质粒包含选择标记;反向选择标记;与基本糖多孢菌菌株的基因组基因座具有同源性的DNA片段;及质粒骨架序列,其中所述DNA片段具有源自也属于所述初始HTP基因设计糖多孢菌菌株文库的另一个别糖多孢菌菌株的基因变异;
2)基于所述基因组中存在所述选择标记选择具有整合事件的糖多孢菌菌株;
3)基于不存在反向选择标记基因选择质粒骨架环出的糖多孢菌菌株。
5.根据权利要求4所述的HTP方法,其中所述质粒不包含温度敏感型复制子。
6.根据权利要求4所述的HTP方法,其中在不复制整合质粒的情况下执行选择步骤(3)。
7.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库包含至少一个选自由以下组成的群组的文库:启动子交换微生物菌株文库、SNP交换微生物菌株文库、起始/终止密码子微生物菌株文库、优化序列微生物菌株文库、终止子交换微生物菌株文库、转座子诱变微生物菌株多样性文库、核糖体结合位点微生物菌株文库、抗代谢物/发酵产物抗性文库、终止插入微生物菌株文库和其任何组合。
8.根据权利要求1所述的HTP基因组工程改造方法,其中所述后续HTP基因设计糖多孢菌菌株文库是所述初始HTP基因设计微生物菌株文库的完整组合糖多孢菌菌株文库。
9.根据权利要求1所述的HTP基因组工程改造方法,其中所述后续HTP基因设计糖多孢菌菌株文库是所述初始HTP基因设计糖多孢菌菌株文库中的所述基因变异所衍生的完整组合糖多孢菌菌株文库的子集。
10.根据权利要求1所述的HTP基因组工程改造方法,其中菌株文库中的所述基因变异所衍生的所述后续HTP基因设计是前一HTP基因设计糖多孢菌菌株文库中的所述基因变异所衍生的完整组合微生物菌株文库。
11.根据权利要求1所述的HTP基因组工程改造方法,其中所述后续HTP基因设计糖多孢菌菌株文库是前一HTP基因设计糖多孢菌菌株文库中的所述基因变异所衍生的完整组合糖多孢菌菌株文库的子集。
12.根据权利要求1所述的HTP基因组工程改造方法,其中扰动所述基因组包含利用至少一种选自由以下组成的群组的方法:随机诱变、靶向序列插入、靶向序列缺失、靶向序列置换、转座子诱变和其任何组合。
13.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始多种糖多孢菌微生物包含源自生产性糖多孢菌菌株的独特基因变异。
14.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始多种糖多孢菌微生物包含表示为S1Gen1的生产菌株微生物和表示为SnGenn的由其衍生的任何数目个后续微生物后代。
15.根据权利要求1所述的HTP基因组工程改造方法,其中所述步骤c包含通过使用原生质体融合技术快速合并所述基因变异。
16.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含启动子交换微生物菌株文库。
17.根据权利要求16所述的HTP基因组工程改造方法,其中所述启动子交换微生物菌株文库包含至少一个具有选自SEQ ID No.1到69和172到175的核苷酸序列的启动子。
18.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含SNP交换微生物菌株文库。
19.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含终止子交换微生物菌株文库。
20.根据权利要求19所述的HTP基因组工程改造方法,其中所述终止子交换微生物菌株文库包含至少一个具有选自SEQ ID No.70到80的核苷酸序列的终止子。
21.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含转座子诱变微生物菌株多样性文库。
22.根据权利要求21所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含功能缺失LoF转座子和/或功能获得GoF转座子。
23.根据权利要求22所述的HTP基因组工程改造方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
24.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含核糖体结合位点微生物菌株文库。
25.根据权利要求24所述的HTP基因组工程改造方法,其中核糖体结合位点微生物菌株文库包含至少一个具有选自SEQ ID No.97到127的核苷酸序列的核糖体结合位点RBS。
26.根据权利要求1所述的HTP基因组工程改造方法,其中所述初始HTP基因设计糖多孢菌菌株文库或所述后续HTP基因设计糖多孢菌菌株文库包含抗代谢物/发酵产物抗性文库。
27.根据权利要求26所述的HTP基因组工程改造方法,其中所述抗代谢物/发酵产物抗性文库包含对参与糖多孢菌中的刺糖菌素合成的分子有抗性的糖多孢菌菌株。
28.一种用于产生SNP交换糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供参考糖多孢菌菌株和第二糖多孢菌菌株,其中所述第二糖多孢菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于所述参考糖多孢菌菌株中;和
b.扰动所述参考糖多孢菌菌株或所述第二糖多孢菌菌株的基因组,由此创建包含多种个别糖多孢菌菌株的初始SNP交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种对应于选自所述参考糖多孢菌菌株与所述第二糖多孢菌菌株之间的所述多种已鉴别基因变异中的单一基因变异。
29.根据权利要求28所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中扰动所述参考糖多孢菌菌株的基因组以添加所述第二糖多孢菌菌株中所发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
30.根据权利要求28所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中扰动所述第二糖多孢菌菌株的基因组以去除所述参考糖多孢菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
31.根据权利要求28所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中具有独特基因变异的所得多种个别糖多孢菌菌株在一起包含所述参考糖多孢菌菌株和所述第二糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库。
32.根据权利要求28所述的用于产生SNP交换糖多孢菌菌株文库的方法,其中具有独特基因变异的所得多种个别糖多孢菌菌株在一起包含所述参考糖多孢菌菌株和所述第二糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库的子集。
33.一种用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.提供亲代谱系糖多孢菌菌株和由其衍生的生产性糖多孢菌菌株,其中所述生产性糖多孢菌菌株包含选自单核苷酸多态性、DNA插入和DNA缺失的多种已鉴别基因变异,所述已鉴别基因变异不存在于所述亲代谱系糖多孢菌菌株中;
b.扰动所述亲代谱系糖多孢菌菌株或所述生产性糖多孢菌菌株的基因组,由此创建初始糖多孢菌菌株文库,其中所述初始文库中的每种菌株包含来自所述亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所述已鉴别基因变异的独特基因变异;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始SNP交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种微生物,所述基因变异来自前一步骤中所筛选的至少两种个别微生物菌株中所存在的所述变异,由此创建后续糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续菌株文库中的个别菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了新的糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
34.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述初始糖多孢菌菌株文库是包含所述亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所有所述已鉴别基因变异的完整组合文库。
35.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述初始糖多孢菌菌株文库是包含所述参考亲代谱系糖多孢菌菌株与所述生产性糖多孢菌菌株之间的所述已鉴别基因变异的子集的完整组合文库的子集。
36.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是所述初始文库的完整组合文库。
37.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是所述初始文库的完整组合文库。
38.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是前一文库的完整组合文库。
39.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续糖多孢菌菌株文库是前一文库的完整组合文库的子集。
40.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述亲代谱系糖多孢菌菌株的基因组以添加所述生产性糖多孢菌菌株中所发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
41.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述生产性糖多孢菌菌株的基因组以去除所述亲代谱系糖多孢菌菌株中未发现的所述已鉴别单核苷酸多态性、DNA插入或DNA缺失中的一种或多种。
42.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中扰动所述基因组包含利用至少一种选自由以下组成的群组的方法:随机诱变、靶向序列插入、靶向序列缺失、靶向序列置换和其组合。
43.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
44.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
45.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
46.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
47.根据权利要求46所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
48.根据权利要求46所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
49.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述已鉴别基因变异进一步包含来自启动子交换文库的人工启动子交换基因变异。
50.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其进一步包含对所述初始糖多孢菌菌株文库或后续糖多孢菌菌株文库的至少一种微生物菌株的基因组进行工程改造,以包含可操作地连接到内源糖多孢菌靶基因的来自启动子梯的一个或多个启动子。
51.根据权利要求33所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述菌株文库包含至少一个选自由以下组成的群组的文库:启动子交换微生物菌株文库、SNP交换微生物菌株文库、起始/终止密码子微生物菌株文库、优化序列微生物菌株文库、终止子交换微生物菌株文库、转座子诱变微生物菌株多样性文库、核糖体结合位点微生物菌株文库、抗代谢物/发酵产物抗性文库、终止插入微生物菌株文库和其任何组合。
52.根据权利要求51所述的用于修复和改良生产性糖多孢菌菌株的表型性能的方法,其中所述菌株文库包含至少一个选自由以下组成的群组的文库:
1)包含具有选自SEQ ID No.1到69的序列的至少一个启动子的启动子交换微生物菌株文库;
2)包含具有选自SEQ ID No.70到80的序列的至少一个终止子的终止子交换微生物菌株文库;和
3)包含具有选自SEQ ID No.97到127的序列的至少一个RBS的核糖体结合位点RBS文库。
53.一种用于产生启动子交换糖多孢菌菌株文库的方法,所述方法包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个启动子;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始启动子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述启动子梯的所述启动子中的一个或多个。
54.根据权利要求53所述的用于产生启动子交换糖多孢菌菌株文库的方法,其中所述多个启动子中的至少一个包含具有选自SEQ ID No.1到69的序列的启动子。
55.一种用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和启动子梯,其中所述启动子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个启动子;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始启动子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述启动子梯的所述启动子中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始启动子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予所述表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述基因变异来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续启动子交换糖多孢菌菌株文库;
e.针对优于参考大肠杆菌菌株的所需表型性能改良来筛选和选择所述后续启动子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了糖多孢菌菌株的新的启动子交换糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一启动子交换糖多孢菌菌株文库的至少两种个别糖多孢菌菌株中的基因变异组合。
56.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库。
57.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库。
58.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是所述初始启动子交换糖多孢菌菌株文库的完整组合文库的子集。
59.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是前一启动子交换糖多孢菌菌株文库的完整组合文库。
60.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述后续启动子交换糖多孢菌菌株文库是前一启动子交换糖多孢菌菌株文库的完整组合文库的子集。
61.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续启动子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
62.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续启动子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
63.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
64.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
65.根据权利要求64所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
66.根据权利要求65所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
67.根据权利要求55所述的用于改良生产性糖多孢菌菌株的表型性能的启动子交换方法,其中所述启动子梯包含具有选自SEQ ID No.1到69的核苷酸序列的至少一个启动子。
68.一种用于产生终止子交换糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个终止子;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始终止子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述终止子梯的所述终止子中的一个或多个。
69.一种用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和终止子梯,其中所述终止子梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个终止子;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始终止子交换糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述终止子梯的所述终止子中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始终止子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌微生物,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续终止子交换糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续终止子交换糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的终止子交换糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
70.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是所述初始终止子交换糖多孢菌菌株文库的完整组合文库。
71.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是所述初始终止子交换糖多孢菌菌株文库的完整组合文库的子集。
72.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是前一终止子交换糖多孢菌菌株文库的完整组合文库。
73.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述后续终止子交换糖多孢菌菌株文库是前一终止子交换糖多孢菌菌株文库的完整组合文库的子集。
74.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续终止子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
75.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续终止子交换糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
76.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
77.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
78.根据权利要求77所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
79.根据权利要求78所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
80.根据权利要求69所述的用于改良生产性糖多孢菌菌株的表型性能的终止子交换方法,其中所述终止子梯包含具有选自SEQ ID No.70-80的核苷酸序列的至少一个终止子。
81.一种用于产生核糖体结合位点RBS糖多孢菌菌株文库的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个RBS;和
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始RBS糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述RBS梯的所述RBS中的一个或多个。
82.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.提供对于基本糖多孢菌菌株为内源的多种靶基因,和RBS梯,其中所述RBS梯包含在所述基本糖多孢菌菌株中展现不同表达谱的多个RBS;
b.对所述基本糖多孢菌菌株的基因组进行工程改造,由此创建包含多种个别糖多孢菌菌株的初始RBS糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含可操作地连接到对于所述基本糖多孢菌菌株为内源的所述靶基因中的一个的来自所述RBS梯的所述RBS中的一个或多个;
c.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始RBS糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
d.提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续RBS糖多孢菌菌株文库;
e.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续RBS糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
f.按线性或非线性方式重复步骤d)-e)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的RBS糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
83.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是所述初始RBS糖多孢菌菌株文库的完整组合文库。
84.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是所述初始RBS糖多孢菌菌株文库的完整组合文库的子集。
85.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是前一RBS糖多孢菌菌株文库的完整组合文库。
86.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续RBS糖多孢菌菌株文库是前一RBS糖多孢菌菌株文库的完整组合文库的子集。
87.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续RBS糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
88.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤d)-e),直到与所述生产性糖多孢菌菌株的表型性能相比,后续RBS糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
89.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
90.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤f)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
91.根据权利要求90所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
92.根据权利要求91所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
93.根据权利要求82所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述RBS梯包含具有选自SEQ ID No.97到127的核苷酸序列的至少一个RBS。
94.一种用于产生转座子诱变糖多孢菌菌株多样性文库的方法,其包含
a)将转座子引入一种或多种基本糖多孢菌菌株的细胞群中;和
b)选择包含随机整合转座子的糖多孢菌菌株,由此创建包含多种个别糖多孢菌菌株的初始糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现有独特基因变异,其中所述独特基因变异中的每一种包含一种或多种随机整合转座子。
95.根据权利要求94所述的方法,其进一步包含:
c).选择子序列糖多孢菌菌株文库,与所述基本糖多孢菌菌株的表型性能相比,其在测量的表型变量方面展现至少一次增加。
96.根据权利要求94所述的方法,其中使用转座子和转座酶蛋白的复合物将所述转座子引入到所述基本糖多孢菌菌株中,所述复合物允许所述转座子体内转位到所述糖多孢菌菌株的基因组中。
97.根据权利要求94所述的方法,其中所述转座酶蛋白源自EZ-Tn5转座体系统。
98.根据权利要求94所述的方法,其中所述转座子是功能缺失LoF转座子或功能获得GoF转座子。
99.根据权利要求94所述的方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
100.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a.通过转座子诱变对基本微生物菌株的基因组进行工程改造,借此创建包含多种个别糖多孢菌菌株的初始转座子诱变糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的每一种包含一种或多种转座子;
b.针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始转座子诱变糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
c.提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续转座子诱变糖多孢菌菌株文库;
d.针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续转座子诱变糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
e.按线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的转座子诱变糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
101.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是所述初始转座子诱变糖多孢菌菌株文库的完整组合文库。
102.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是所述初始转座子诱变糖多孢菌菌株文库的完整组合文库的子集。
103.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是前一转座子诱变糖多孢菌菌株文库的完整组合文库。
104.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续转座子诱变糖多孢菌菌株文库是前一转座子诱变糖多孢菌菌株文库的完整组合文库的子集。
105.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d),直到与所述生产性糖多孢菌菌株的表型性能相比,后续转座子诱变糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
106.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d),直到与所述生产性糖多孢菌菌株的表型性能相比,后续转座子诱变糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
107.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
108.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
109.根据权利要求108所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
110.根据权利要求109所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
111.根据权利要求100所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述转座子是功能缺失LoF转座子或功能获得GoF转座子。
112.根据权利要求111所述的方法,其中所述GoF转座子包含溶解性标签、启动子和/或反向选择标记。
113.一种用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其包含以下步骤:
a)选择对预先确定的代谢物和/或发酵产物具有抗性的糖多孢菌菌株,由此创建包含多种个别糖多孢菌菌株的初始糖多孢菌菌株文库,所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的至少一种产生对所述预先确定的代谢物和/或发酵产物的抗性;和
b)收集对所述预先确定的代谢物和/或所述发酵产物具有抗性的糖多孢菌菌株,以产生所述抗代谢物/发酵产物抗性糖多孢菌菌株文库。
114.根据权利要求113所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中所述预先确定的代谢物和/或发酵产物选自由以下组成的群组:参与刺糖菌素合成路径的分子、参与SAM/甲硫氨酸路径的分子、参与赖氨酸生产路径的分子、参与色氨酸路径的分子、参与苏氨酸路径的分子、参与乙酰基-CoA生产路径的分子和参与从头合成或补救嘌呤和嘧啶路径的分子。
115.根据权利要求114所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中:
1)参与刺糖菌素合成路径的所述分子是刺糖菌素,并且任选地,每种菌株对约50μg/m到约2mg/ml刺糖菌素J/L具有抗性;
2)参与SAM/甲硫氨酸路径的所述分子是α-甲基甲硫氨酸aMM或正亮氨酸,并且任选地每种菌株对约1mM到约5mMα-甲基甲硫氨酸aMM具有抗性;
3)参与赖氨酸生产路径的所述分子是硫杂赖氨酸或α-丁酮酸盐和天冬氨酸羟肟酸盐的混合物;
4)参与色氨酸路径的所述分子是氮杂丝氨酸或5-氟吲哚;
5)参与苏氨酸路径的所述分子是β-羟基正缬氨酸;
6)参与乙酰基-CoA生产路径的所述分子是浅蓝菌素,和
7)参与从头合成或补救嘌呤和嘧啶路径的所述分子是嘌呤或嘧啶类似物。
116.根据权利要求113所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其进一步包含以下步骤:
b).选择子序列糖多孢菌菌株文库,与所述基本糖多孢菌菌株的表型性能相比,其在测量的表型变量方面展现至少一次增加。
117.根据权利要求116所述的用于产生抗代谢物/发酵产物抗性糖多孢菌菌株文库的方法,其中所述子序列糖多孢菌菌株文库中的每种菌株展现增加的刺糖菌素合成。
118.一种用于改良生产性糖多孢菌菌株的表型性能的方法,其包含以下步骤:
a)提供包含多种个别糖多孢菌菌株的初始抗代谢物/发酵产物抗性糖多孢菌菌株文库,在所述多种个别糖多孢菌菌株的每种菌株内发现独特基因变异,其中所述独特基因变异中的每一种包含基因变异中的一种或多种,其中所述基因变异赋予对预先确定的代谢物或发酵产物的抗性;
b)针对优于参考糖多孢菌菌株的表型性能改良来筛选和选择所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予表型性能改良的独特基因变异;
c)提供各自包含独特基因变异组合的后续多种糖多孢菌菌株,所述独特基因变异组合来自前一步骤中所筛选的至少两种个别糖多孢菌菌株中所存在的所述基因变异,由此创建后续抗代谢物/发酵产物抗性糖多孢菌菌株文库;
d)针对优于所述参考糖多孢菌菌株的表型性能改良来筛选和选择所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库中的个别糖多孢菌菌株,由此鉴别出赋予另外表型性能改良的独特基因变异组合;和
e)按线性或非线性方式重复步骤c)-d)一次或多次,直到糖多孢菌菌株相较于所述生产性糖多孢菌菌株的表型性能展现所期望水平的改良表型性能为止,其中每次后续迭代创建了微生物菌株的新的抗代谢物/发酵产物抗性糖多孢菌菌株文库,其中所述新文库中的每种菌株包含基因变异,所述基因变异是选自前一文库的至少两种个别糖多孢菌菌株中的基因变异组合。
119.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库。
120.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是所述初始抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库的子集。
121.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是前一抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库。
122.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述后续抗代谢物/发酵产物抗性糖多孢菌菌株文库是前一抗代谢物/发酵产物抗性糖多孢菌菌株文库的完整组合文库的子集。
123.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续抗代谢物/发酵产物抗性糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少10%增加为止。
124.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中重复步骤c)-d)直到与所述生产性糖多孢菌菌株的表型性能相比,后续抗代谢物/发酵产物抗性糖多孢菌菌株文库的糖多孢菌菌株的所述表型性能在测量的表型变量方面展现至少一倍增加为止。
125.根据权利要求118所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能选自由以下组成的群组:所关注产物的体积生产率、所关注产物的比生产率、所关注产物的产量、所关注产物的效价和其组合。
126.根据权利要求125所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中步骤e)的所述改良表型性能是:所关注产物的生产增加或更有效,所述所关注产物选自由以下组成的群组:小分子、酶、肽、氨基酸、有机酸、合成化合物、燃料、乙醇、初级胞外代谢物、次级胞外代谢物、胞内组分分子和其组合。
127.根据权利要求126所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述所关注产物选自由以下组成的群组:刺糖菌素、多杀菌素、乙基多杀菌素、染料木素、胆碱氧化酶、香豆胺啶化合物、红霉素、伊佛霉素糖苷配基、HMG-CoA还原酶抑制剂、羧酸异构体、α-甲基甲硫氨酸、硫杂赖氨酸、α-丁酮酸盐、天冬氨酸羟肟酸盐、氮杂丝氨酸、5-氟吲哚、β-羟基正缬氨酸、浅蓝菌素、嘌呤、嘧啶和其类似物。
128.根据权利要求127所述的用于改良生产性糖多孢菌菌株的表型性能的方法,其中所述刺糖菌素是刺糖菌素A、刺糖菌素D、刺糖菌素J、刺糖菌素L或其组合。
129.一种糖多孢菌宿主细胞,其包含可操作地连接到所述宿主细胞的内源基因的启动子,其中所述启动子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ IDNo.1-69组成的群组的序列。
130.根据权利要求129所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
131.根据权利要求129所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述启动子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞具有所期望水平的改良的表型性能。
132.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含可操作地连接到所述宿主细胞的内源基因的启动子,其中所述启动子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ ID No.1-69组成的群组的序列。
133.一种糖多孢菌宿主细胞,其包含连接到所述宿主细胞的内源基因的终止子,其中所述终止子对于所述内源基因是异源的,其中所述启动子具有选自由SEQ ID No.70-80组成的群组的序列。
134.根据权利要求133所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
135.根据权利要求133所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述启动子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞具有所期望水平的改良的表型性能。
136.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含连接到所述宿主细胞的内源基因的终止子,其中所述终止子对于所述内源基因是异源的,其中所述终止子具有选自由SEQ ID No.70-80组成的群组的序列。
137.一种糖多孢菌宿主细胞,其包含可操作地连接到所述宿主细胞的内源基因的核糖体结合位点,其中所述核糖体结合位点对于所述内源基因是异源的,其中所述核糖体结合位点具有选自由SEQ ID No.97-127组成的群组的序列。
138.根据权利要求137所述的糖多孢菌宿主细胞,其中所述内源基因参与所述糖多孢菌宿主细胞中的刺糖菌素合成。
139.根据权利要求137所述的糖多孢菌宿主细胞,其中与不具有可操作地连接到所述内源基因的所述RBS的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞具有所期望水平的改良的表型性能。
140.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含连接到所述宿主细胞的内源基因的核糖体结合位点,其中所述核糖体结合位点对于所述内源基因是异源的,其中所述核糖体结合位点具有选自由SEQ ID No.97-127组成的群组的序列。
141.一种糖多孢菌宿主细胞,其包含转座子,其中与不具有所述转座子的参考糖多孢菌菌株的所述表型性能相比,糖多孢菌宿主细胞具有所期望水平的改良的表型性能。
142.根据权利要求141所述的糖多孢菌宿主细胞,其中所述转座子是功能缺失LoF转座子或功能获得GoF转座子。
143.根据权利要求142所述的糖多孢菌宿主细胞,其中所述功能获得GoF转座子包含启动子、反向选择标记和/或溶解性标签。
144.根据权利要求141所述的糖多孢菌宿主细胞,其中所述转座子包含选自由SEQ IDNo.128-131组成的群组的序列。
145.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含具有选自由SEQ ID No.128-131组成的群组的序列的转座子,其中每种菌株中的所述转座子在不同基因组基因座处。
146.一种糖多孢菌菌株文库,其中所述文库中的每种糖多孢菌菌株包含引起所述菌株对以下具有抗性的基因变异
1)参与刺糖菌素合成路径的分子,
2)参与SAM/甲硫氨酸路径的分子,
3)参与赖氨酸生产路径的分子,
4)参与色氨酸路径的分子,
5)参与苏氨酸路径的分子,
6)参与乙酰基-CoA生产路径的分子,和/或
7)参与从头合成或补救嘌呤和嘧啶路径的分子。
147.根据权利要求146所述的糖多孢菌菌株文库,其中:
1)参与刺糖菌素合成路径的所述分子是刺糖菌素;
2)参与SAM/甲硫氨酸路径的所述分子是α-甲基甲硫氨酸aMM或正亮氨酸;
3)参与赖氨酸生产路径的所述分子是硫杂赖氨酸或α-丁酮酸盐和天冬氨酸羟肟酸盐的混合物;
4)参与色氨酸路径的所述分子是氮杂丝氨酸或5-氟吲哚;
5)参与苏氨酸路径的所述分子是β-羟基正缬氨酸;
6)参与乙酰基-CoA生产路径的所述分子是浅蓝菌素;和
7)参与从头合成或补救嘌呤和嘧啶路径的所述分子是嘌呤或嘧啶类似物。
148.根据权利要求147所述的糖多孢菌菌株文库,其中所述分子是刺糖菌素J/L,并且其中每种菌株对约50μg/ml到约2mg/ml刺糖菌素J/L具有抗性。
149.根据权利要求147所述的糖多孢菌菌株文库,其中所述分子是α-甲基甲硫氨酸aMM,其中每种菌株对约1mM到约5mM aMM具有抗性。
150.一种糖多孢菌菌株,其包含报告基因,其中所述报告基因选自由以下组成的群组:
a)编码绿色荧光报告蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达;
b)编码绿色荧光报告蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达;和
c)编码β-葡糖醛酸酶(gusA)蛋白的基因,任选地,所述基因经密码子优化以在糖多孢菌中表达。
151.根据权利要求150所述的糖多孢菌菌株,其中:
a)所述绿色荧光报告蛋白具有氨基酸序列SEQ ID No.143;
b)所述红色荧光报告蛋白具有氨基酸序列SEQ ID No.144;和
c)所述gusA蛋白具有氨基酸序列SEQ ID No.145。
152.根据权利要求150所述的糖多孢菌菌株,其中:
a)编码所述绿色荧光报告蛋白的所述基因具有序列SEQ ID No.81;
b)编码所述红色荧光报告蛋白的所述基因具有序列SEQ ID No.82;和
c)编码所述gusA蛋白的所述基因具有序列SEQ ID No.83。
153.根据权利要求150所述的糖多孢菌菌株,其中所述菌株包含编码所述绿色荧光报告蛋白的所述基因和编码所述红色荧光报告蛋白的所述基因,其中所述绿色荧光报告蛋白和所述红色荧光报告蛋白的荧光激发和发射光谱彼此不同。
154.根据权利要求150所述的糖多孢菌菌株,其中所述菌株包含编码所述绿色荧光报告蛋白的所述基因和编码所述红色荧光报告蛋白的所述基因,其中所述绿色荧光报告蛋白和所述红色荧光报告蛋白的荧光激发和发射光谱与所述糖多孢菌菌株的内源荧光不同。
155.一种糖多孢菌菌株,其包含整合于所述糖多孢菌菌株的基因组中的一种或多种中性整合位点中的DNA片段,其中所述中性整合位点选自具有选自SEQ ID No.132-142的序列的基因组片段或与SEQ ID No.132-142中的任一个同源的基因组片段中的位置的群组。
156.根据权利要求155所述的糖多孢菌菌株,其中与不具有整合DNA片段的参考糖多孢菌菌株的所述表型性能相比,所述糖多孢菌菌株具有期望水平的改良表型性能。
157.根据权利要求156所述的糖多孢菌菌株,其中与不具有整合DNA片段的参考糖多孢菌菌株的所述表型性能相比,所述糖多孢菌菌株具有期望水平的改良刺糖菌素产生。
158.根据权利要求155所述的糖多孢菌菌株,其中整合DNA片段包含编码报告蛋白的序列。
159.根据权利要求155所述的糖多孢菌菌株,其中整合DNA片段包含转座子。
160.根据权利要求155所述的糖多孢菌菌株,其中整合DNA片段包含附着位点(attB),其能够由其对应整合酶识别。
161.一种将DNA片段整合于糖多孢菌菌株的基因组中的方法,其中将所述DNA片段整合于所述糖多孢菌菌株的所述基因组中的中性整合位点中,其中所述中性整合位点选自具有选自SEQ ID No.132-142的序列的基因组片段或与SEQ ID No.132-142中的任一个同源的基因组片段中的位置的群组。
162.根据权利要求161所述的将DNA片段整合于糖多孢菌菌株的基因组中的方法,其中所述DNA片段包含附着位点(attB),其能够由其对应整合酶识别。
163.一种用于快速合并源自至少两种亲代糖多孢菌菌株的基因突变的方法,其包含以下步骤:
(1)提供至少两种亲代糖多孢菌菌株,其中每种菌株包含不存在于其它菌株中的独特基因组突变;
(2)由所述亲代菌株中的每一种制备原生质体;
(3)从所述亲代菌株融合所述原生质体以产生融合原生质体,其包含两种亲代糖多孢菌菌株的所述基因组,其中在每种亲代菌株的所述基因组之间发生同源重组;
(4)从步骤(3)中所产生的所述融合原生质体回收糖多孢菌细胞;和
(5)选择糖多孢菌细胞,其包含第一亲代糖多孢菌菌株的所述独特基因组突变;和
(6)针对第二亲代菌株的所述独特基因组突变的存在对步骤(5)中所获得的所述糖多孢菌细胞进行基因分型,
由此获得新糖多孢菌菌株,其包含源自两种亲代糖多孢菌菌株的所述独特基因组突变。
164.根据权利要求163所述的方法,其中所述独特基因组突变中的一种连接到可选标记,而另一所述独特基因组突变未连接到任何可选标记。
165.根据权利要求164所述的方法,其中在步骤(3)中,初始含有连接到所述可选标记的所述独特基因组突变的所述染色的原生质体:初始含有未连接到所述可选标记的所述独特基因组突变的所述染色的原生质体的比率小于1:1。
166.根据权利要求165所述的方法,其中比率是约1:10到约1:100或更小。
167.根据权利要求163所述的方法,其中在步骤(4)中,将原生质体细胞涂铺于经渗透稳定的培养基上,而不使用琼脂覆层。
168.根据权利要求163所述的方法,其中当所述独特基因组突变中的一种连接到可选标记以产生对选择药物的抗性时,通过将所述适当选择药物抗生素上覆于生长细胞上来完成步骤(5)。
169.根据权利要求163所述的方法,其中当所述独特基因组突变均未连接到可选标记时,通过基因分型完成步骤(5)。
170.根据权利要求163所述的方法,其中将源自超过两种菌株的基因突变在单一合并过程中随机合并。
171.根据权利要求163所述的方法,其中在步骤(2)中,初始通过在约5000xg速度下离心约5分钟来收集所述原生质体。
172.根据权利要求163所述的方法,其中所述方法不包含通过脱脂棉过滤所述原生质体。
173.根据权利要求163所述的方法,其中在R2YE培养基而不是顶层琼脂上回收所述融合原生质体。
174.根据权利要求173所述的方法,其中所述R2YE培养基包含0.5M山梨糖醇和0.5M甘露糖。
175.一种在糖多孢菌菌株中进行靶基因组编辑的方法,其包含:
a)将质粒引入到基本糖多孢菌菌株中,所述质粒包含选择标记、反向选择标记、与待编辑的所述糖多孢菌菌株的基因组基因座具有同源性的DNA片段和质粒骨架序列;
b)基于所述基因组中存在所述选择标记选择具有整合事件的糖多孢菌菌株;
c)基于不存在所述反向选择标记基因选择所述质粒骨架环出的糖多孢菌菌株,其中所述反向选择标记是sacB基因或pheS基因。
176.根据权利要求175所述的方法,其中与不进行编辑的所述亲代菌株相比,具有经编辑的基因组的所得糖多孢菌菌株具有较好性能。
177.根据权利要求176所述的方法,其中与不进行编辑的所述亲代菌株相比,所得糖多孢菌菌株具有增加的刺糖菌素产生。
178.根据权利要求175所述的方法,其中所述sacB基因针对刺糖多孢菌经密码子优化。
179.根据权利要求178所述的方法,其中所述sacB基因编码与由SEQ ID NO.146编码的氨基酸序列具有90%序列一致性的氨基酸序列。
180.根据权利要求175所述的方法,其中所述pheS基因针对刺糖多孢菌经密码子优化。
181.根据权利要求180所述的方法,其中所述pheS基因编码与由SEQ ID No.147或SEQID No.148编码的氨基酸序列具有90%序列一致性的氨基酸序列。
182.一种将遗传物质从供体微生物细胞转移到糖多孢菌微生物的受体细胞的方法,其中所述方法包含以下步骤:
1)任选地,将受体细胞继代培养到指数后期或稳定期;
2)任选地,将供体细胞继代培养到指数中期;
3)组合供体和受体细胞;
4)将供体和受体细胞混合物涂铺于接合培养基上;
5)培育板以使细胞接合;
6)施加针对供体细胞的抗生素选择;
7)施加针对未整合的受体细胞的抗生素选择;和
8)进一步培育板以使整合受体细胞生长。
183.根据权利要求182所述的方法,其中所述供体微生物细胞是大肠杆菌细胞。
184.根据权利要求182所述的方法,其中利用以下条件中的至少两个、三个、四个、五个、六个、七个或更多个:
1)在接合之前,洗涤受体细胞;
2)在约30℃的温度下接合供体细胞和受体细胞;
3)在接合之前,将受体细胞继代培养至少约48小时;
4)用于接合的供体细胞:受体细胞的比率是约1:0.6到1:1.0;
5)将所述供体细胞和所述受体细胞混合之后约15至24小时,将用于针对所述供体细胞的选择的抗生素药物递送到所述混合物;
6)将所述供体细胞和所述受体细胞混合之后约40至48小时,将用于针对所述受体细胞的选择的抗生素药物递送到所述混合物;
7)将涂铺有供体和受体细胞混合物的所述接合培养基干燥至少约3小时到10小时;
8)所述接合培养基包含至少约3g/L葡萄糖;
9)供体细胞的浓度是约OD600=0.1到0.6;
10)受体细胞的浓度是约OD540=5.0到15.0。
185.根据权利要求184所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是萘啶酸,并且浓度是约50到约150μg/ml。
186.根据权利要求185所述的方法,其中用于针对所述供体细胞的选择的所述抗生素药物是萘啶酸,并且浓度是约100μg/ml。
187.根据权利要求184所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是安普霉素,并且浓度是约50到约250μg/ml。
188.根据权利要求187所述的方法,其中用于针对所述受体细胞的选择的所述抗生素药物是安普霉素,并且浓度是约100μg/ml。
189.根据权利要求182所述的方法,其中所述方法以高通量过程执行。
190.根据权利要求189所述的方法,其中所述方法在48孔Q型托盘上执行。
191.根据权利要求189所述的方法,其中所述高通量过程是自动化的。
192.根据权利要求191所述的方法,其中供体细胞和受体细胞的所述混合物是液体混合物,并利用摇摆运动将足够体积的所述液体混合物涂铺于所述培养基上,其中所述液体混合物分散在所述培养基的整个区域上。
193.根据权利要求191所述的方法,其中所述方法包含通过用酵母针进行菌落挑选来转移接合后体,以供用所述供体细胞所提供的整合DNA进行后续受体细胞接种的自动化过程。
194.根据权利要求193所述的方法,其中所述菌落挑选以升沉运动或搅拌运动执行。
195.根据权利要求184所述的方法,其中所述接合培养基是包含约3-10g/L葡萄糖的改良型ISP4培养基。
196.根据权利要求184所述的方法,其中所述混合物中供体细胞或受体细胞的总数是约5×106到约9×106
197.根据权利要求182所述的方法,其中利用以下条件中的至少四个执行所述方法:
1)在接合之前,洗涤受体细胞;
2)在约30℃的温度下接合供体细胞和受体细胞;
3)在接合之前,将受体细胞继代培养至少约48小时;
4)用于接合的供体细胞:受体细胞比率是约1:0.8;
5)将所述供体细胞和所述受体细胞混合之后约20小时,将用于针对所述供体细胞的选择的抗生素药物递送到所述混合物;
6)所述混合物中的所述供体细胞的量或所述受体细胞的量是约7×106;和
7)所述接合培养基包含约6g/L葡萄糖。
198.一种在糖多孢菌菌株中进行靶基因组编辑、产生在靶基因组基因座处含有基因变异的无痕糖多孢菌菌株的方法,其包含:
a)将质粒引入糖多孢菌菌株中,所述质粒包含:
i.选择标记,
ii.反向选择标记,
iii.含有待整合于靶基因座处的所述糖多孢菌基因组中的基因变异的DNA片段,所述DNA片段具有侧接所需基因变异的所述靶基因组基因座的同源臂,和
iv.质粒骨架序列;
b)基于所述基因组中存在所述选择标记选择已经历初始同源重组并具有整合于所述靶基因座中的所述基因变异的糖多孢菌菌株;和
c)基于不存在所述反向选择标记选择具有整合于所述靶基因座中的所述基因变异,但经历使所述质粒骨架环出的另外的同源重组的糖多孢菌菌株,
其中所述靶基因组基因座能够包含所述糖多孢菌基因组的任何区域,包括不含编码DNA模组的重复区段的基因组区域。
199.根据权利要求198所述的方法,其中所述质粒不包含温度敏感型复制子。
200.根据权利要求198所述的方法,其中所述质粒不包含复制起点。
201.根据权利要求198所述的方法,其中在不复制整合质粒的情况下执行选择步骤(c)。
202.根据权利要求198所述的方法,其中所述质粒是单一同源重组载体。
203.根据权利要求198所述的方法,其中所述质粒是双重同源重组载体。
204.根据权利要求198所述的方法,其中所述反向选择标记是sacB基因或pheS基因。
205.根据权利要求204所述的方法,其中所述sacB基因或pheS基因针对刺糖多孢菌经密码子优化。
206.根据权利要求205所述的方法,其中所述sacB基因编码与由SEQ ID NO.146编码的氨基酸序列具有90%一致性的氨基酸序列。
207.根据权利要求205所述的方法,其中所述pheS基因编码与由SEQ ID NO.147或SEQID NO.148编码的氨基酸序列具有90%序列一致性的氨基酸序列。
208.根据权利要求198所述的方法,其中通过转化将所述质粒引入所述糖多孢菌菌株中。
209.根据权利要求198所述的方法,其中所述转化是原生质体转化。
210.根据权利要求198所述的方法,其中通过接合将所述质粒引入所述糖多孢菌菌株中,其中所述糖多孢菌菌株是受体细胞,并且包含所述质粒的供体细胞将所述质粒转移到所述糖多孢菌菌株。
211.根据权利要求198所述的方法,其中所述接合是基于包含所述质粒的大肠杆菌供体细胞。
212.根据权利要求198所述的方法,其中所述靶基因座是所述糖多孢菌菌株中与所关注化合物的产生相关的基因座。
213.根据权利要求198所述的方法,其中与不具有所述基因组编辑的对照菌株相比,所述所得糖多孢菌菌株具有增加的所关注化合物的产生。
214.根据权利要求212或权利要求213所述的方法,其中所述所关注化合物是刺糖菌素。
215.根据权利要求198所述的方法,其中所述方法作为高通量程序执行。
CN201880047656.5A 2017-06-06 2018-06-06 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台 Pending CN110914425A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762515934P 2017-06-06 2017-06-06
US62/515,934 2017-06-06
PCT/US2018/036352 WO2018226893A2 (en) 2017-06-06 2018-06-06 A high-throughput (htp) genomic engineering platform for improving saccharopolyspora spinosa

Publications (1)

Publication Number Publication Date
CN110914425A true CN110914425A (zh) 2020-03-24

Family

ID=62749236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880047656.5A Pending CN110914425A (zh) 2017-06-06 2018-06-06 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台

Country Status (7)

Country Link
US (1) US20200115705A1 (zh)
EP (1) EP3635110A2 (zh)
JP (1) JP7350659B2 (zh)
KR (1) KR20200015606A (zh)
CN (1) CN110914425A (zh)
CA (1) CA3064619A1 (zh)
WO (1) WO2018226893A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022033011A1 (zh) * 2020-08-13 2022-02-17 江南大学 糖多孢菌及其在降低生物胺中的应用
WO2022033010A1 (zh) * 2020-08-13 2022-02-17 江南大学 糖多孢菌组合物及其在食品中的应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109979531B (zh) * 2019-03-29 2021-08-31 北京市商汤科技开发有限公司 一种基因变异识别方法、装置和存储介质
CN113795885A (zh) * 2019-05-08 2021-12-14 齐默尔根公司 缩小参数以设计在小规模下的微生物的实验及板模型以改进对在更大规模下的性能的预测
AU2020332376A1 (en) * 2019-08-22 2022-03-24 Inari Agriculture Technology, Inc. Methods and systems for assessing genetic variants
CN115516079A (zh) 2020-04-27 2022-12-23 巴斯夫欧洲公司 用于红霉素发酵生产的发酵培养基和方法
CN111548980B (zh) * 2020-06-16 2022-09-20 华东理工大学 一种重组红霉素工程菌及其构建方法和筛选方法和应用
EP4208532A1 (en) * 2020-09-03 2023-07-12 Melonfrost, Inc. Machine learning and control systems and methods for learning and steering evolutionary dynamics
WO2022082362A1 (zh) * 2020-10-19 2022-04-28 陈振暐 代谢酪氨酸的非病原性细菌基因表现系统及转化株、其用于制备降低尿毒素的组合物的用途以及利用其代谢酪氨酸的方法
WO2022235417A1 (en) * 2021-05-01 2022-11-10 John Mcdevitt System and method for improved carbon sequestration by means of improved genetic modification of algae
CN113249268B (zh) * 2021-06-25 2023-04-07 江南大学 一株降低生物胺的玫瑰糖多孢菌及其应用
US11530406B1 (en) 2021-08-30 2022-12-20 Sachi Bioworks Inc. System and method for producing a therapeutic oligomer
US20230085302A1 (en) * 2021-09-15 2023-03-16 Archer Daniels Midland Company Threonine Production Strain Having Attenuated Expression of the yafV Gene
CN113897324B (zh) * 2021-10-13 2023-07-28 云南师范大学 一种用作抗锰剂的JcVIPP1重组大肠杆菌及其构建方法
CN117286181B (zh) * 2023-11-24 2024-03-01 广东省农业科学院作物研究所 一种CRISPR/Cas9介导的四倍体广藿香高效靶向诱变的基因编辑系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000004190A1 (en) * 1998-07-15 2000-01-27 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
WO2002029032A2 (en) * 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
CN101223281A (zh) * 2005-07-18 2008-07-16 巴斯福股份公司 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途
US20090258420A1 (en) * 2005-08-01 2009-10-15 Herman Van Vlijmen Altered polypeptides, immunoconjugates thereof, and methods related thereto
CN101939445A (zh) * 2007-06-15 2011-01-05 纳幕尔杜邦公司 用于制备抗真菌病原体的植物的多核苷酸和方法
US20110053273A1 (en) * 2007-10-08 2011-03-03 Synthetic Genomics, Inc. Methods for cloning and manipulating genomes
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
US20130172215A1 (en) * 2011-12-28 2013-07-04 Dow Agrosciences Llc Identification and characterization of the spinactin biosysnthesis gene cluster from spinosyn producing saccharopolyspora spinosa
AU2015224510A1 (en) * 2010-08-30 2015-10-01 Dow Agrosciences Llc Activation tagging platform for maize, and resultant tagged population and plants

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4328307A (en) 1977-03-24 1982-05-04 Kowa Company, Ltd. Novel antibiotics, process for preparation thereof and biologically pure culture for use therein
US4206206A (en) 1977-03-24 1980-06-03 Kowa Company, Ltd. Antibiotics of the KA-6606 series and pharmaceutical compositions thereof
US4293651A (en) 1979-10-02 1981-10-06 The Upjohn Company Process for producing antibiotic using saccharopolyspora
US4251511A (en) 1979-10-02 1981-02-17 The Upjohn Company Antibiotic and fermentation process of preparing
DE3162169D1 (en) 1980-07-15 1984-03-15 Kowa Co Process for production of antibiotics, and novel antibiotics produced thereby
US4435504A (en) 1982-07-15 1984-03-06 Syva Company Immunochromatographic assay with support having bound "MIP" and second enzyme
GB8406752D0 (en) 1984-03-15 1984-04-18 Unilever Plc Chemical and clinical tests
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
CA1303983C (en) 1987-03-27 1992-06-23 Robert W. Rosenstein Solid phase assay
US4855240A (en) 1987-05-13 1989-08-08 Becton Dickinson And Company Solid phase assay employing capillary flow
US5187088A (en) 1988-08-26 1993-02-16 Takeda Chemical Industries, Ltd. Choline oxidase and method for producing the same
US5171740A (en) 1988-10-21 1992-12-15 Abbott Laboratories Coumamidine compounds
US5362634A (en) 1989-10-30 1994-11-08 Dowelanco Process for producing A83543 compounds
MA21697A1 (fr) 1988-12-19 1990-07-01 Dow Agrosciences Llc Composes de macrolides.
JP2787458B2 (ja) 1989-01-20 1998-08-20 旭化成工業株式会社 抗生物質l53―18aおよびその製造法
US5198360A (en) 1990-01-19 1993-03-30 Eli Lilly And Company Dna sequence conferring a plaque inhibition phenotype
US5234828A (en) 1990-03-16 1993-08-10 Suntory Limited Process for producing novel heat-resistant β-galactosyltransferase
DK0456986T3 (da) 1990-03-16 1996-04-29 Suntory Ltd Varmeresistent beta-galactosyltransferase, fremtillingsfremgangsmåde herfor og anvendelse heraf
US5124258A (en) 1990-09-12 1992-06-23 Merck & Co., Inc. Fermentation process for the preparation of ivermectin aglycone
US6060234A (en) 1991-01-17 2000-05-09 Abbott Laboratories Polyketide derivatives and recombinant methods for making same
US5824513A (en) 1991-01-17 1998-10-20 Abbott Laboratories Recombinant DNA method for producing erythromycin analogs
US6060296A (en) 1991-07-03 2000-05-09 The Salk Institute For Biological Studies Protein kinases
WO1993004169A1 (en) 1991-08-20 1993-03-04 Genpharm International, Inc. Gene targeting in animal cells using isogenic dna constructs
US5202242A (en) 1991-11-08 1993-04-13 Dowelanco A83543 compounds and processes for production thereof
US5591606A (en) 1992-11-06 1997-01-07 Dowelanco Process for the production of A83543 compounds with Saccharopolyspora spinosa
CA2156194C (en) 1993-03-12 2008-01-08 Jon S. Mynderse New a83543 compounds and process for production thereof
US6500960B1 (en) 1995-07-06 2002-12-31 Stanford University (Board Of Trustees Of The Leland Stanford Junior University) Method to produce novel polyketides
US6043064A (en) 1993-10-22 2000-03-28 Bristol-Myers Squibb Company Enzymatic hydroxylation process for the preparation of HMG-CoA reductase inhibitors and intermediates thereof
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) * 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
US5801032A (en) 1995-08-03 1998-09-01 Abbott Laboratories Vectors and process for producing high purity 6,12-dideoxyerythromycin A by fermentation
US5554519A (en) 1995-08-07 1996-09-10 Fermalogic, Inc. Process of preparing genistein
US6960453B1 (en) 1996-07-05 2005-11-01 Biotica Technology Limited Hybrid polyketide synthases combining heterologous loading and extender modules
US6271255B1 (en) 1996-07-05 2001-08-07 Biotica Technology Limited Erythromycins and process for their preparation
US5663067A (en) 1996-07-11 1997-09-02 New England Biolabs, Inc. Method for cloning and producing the SapI restriction endonuclease in E. coli
EP1717322B1 (en) * 1997-01-17 2012-07-18 Codexis Mayflower Holdings, LLC Evolution of whole cells and organisms by recursive sequence recombination
DE69837913T2 (de) 1997-04-01 2008-02-07 Solexa Ltd., Saffron Walden Verfahren zur vervielfältigung von nukleinsäure
US5908764A (en) 1997-05-22 1999-06-01 Solidago Ag Methods and compositions for increasing production of erythromycin
JPH1180185A (ja) 1997-09-05 1999-03-26 Res Dev Corp Of Japan オリゴヌクレオチドの化学合成法
US6420177B1 (en) 1997-09-16 2002-07-16 Fermalogic Inc. Method for strain improvement of the erythromycin-producing bacterium
EP0974657A1 (en) 1998-06-26 2000-01-26 Rijksuniversiteit te Leiden Reducing branching and enhancing fragmentation in culturing filamentous microorganisms
GB9814006D0 (en) 1998-06-29 1998-08-26 Biotica Tech Ltd Polyketides and their synthesis
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
CA2347412A1 (en) 1998-10-29 2000-05-11 Kosan Biosciences, Inc. Recombinant oleandolide polyketide synthase
US6780620B1 (en) 1998-12-23 2004-08-24 Bristol-Myers Squibb Company Microbial transformation method for the preparation of an epothilone
CA2411293A1 (en) 1999-01-28 2000-07-28 Pfizer Products Inc. Novel azalides and methods of making same
DE60025799T2 (de) 1999-04-05 2006-10-19 Sumitomo Chemical Co., Ltd. Verfahren zur Herstellung von optisch aktiven Aminosäuren
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6365399B1 (en) 1999-08-09 2002-04-02 Sumitomo Chemical Company, Limited Process for producing carboxylic acid isomer using Nocardia diaphanozonaria or Saccharopolyspora hirsuta
US6524841B1 (en) 1999-10-08 2003-02-25 Kosan Biosciences, Inc. Recombinant megalomicin biosynthetic genes and uses thereof
DE60026563D1 (de) 1999-10-25 2006-05-04 Kosan Biosciences Inc Herstellung von polyketiden
US6861513B2 (en) 2000-01-12 2005-03-01 Schering Corporation Everninomicin biosynthetic genes
US6569668B2 (en) 2000-04-04 2003-05-27 Schering Corporation Isolated nucleic acids from Micromonospora rosaria plasmid pMR2 and vectors made therefrom
AU2001261121A1 (en) 2000-05-02 2001-11-12 Kosan Biosciences, Inc. Overproduction hosts for biosynthesis of polyketides
WO2001087936A2 (en) 2000-05-17 2001-11-22 Schering Corporation Isolation of micromonospora carbonacea var africana pmlp1 integrase and use of integrating function for site-specific integration into micromonospora halophitica and micromonospora carbonacea chromosome
US6616953B2 (en) 2001-01-02 2003-09-09 Abbott Laboratories Concentrated spent fermentation beer or saccharopolyspora erythraea activated by an enzyme mixture as a nutritional feed supplement
US7630836B2 (en) 2001-05-30 2009-12-08 The Kitasato Institute Polynucleotides
US20030131370A1 (en) 2001-12-14 2003-07-10 Pfizer Inc. Disruption of the glutathione S-transferase-Omega-1 gene
US20030157076A1 (en) 2002-02-08 2003-08-21 Pfizer Inc. Disruption of the Akt2 gene
JP4765032B2 (ja) 2002-02-19 2011-09-07 ダウ・アグロサイエンス・エル・エル・シー 新規スピノシンを産生するポリケチド合成酵素
EP1361270A3 (en) 2002-03-30 2004-01-02 Pfizer Products Inc. Disruption of the REDK gene
US7459294B2 (en) 2003-08-08 2008-12-02 Kosan Biosciences Incorporated Method of producing a compound by fermentation
WO2005021772A1 (en) 2003-08-29 2005-03-10 Degussa Ag Process for the preparation of l-lysine
MX2008015213A (es) 2006-05-30 2008-12-09 Dow Global Technologies Inc Metodo de optimizacion de codon.
WO2008028050A2 (en) 2006-08-30 2008-03-06 Wisconsin Alumni Research Foundation Reversible natural product glycosyltransferase-catalyzed reactions, compounds and related methods
AU2009266989B2 (en) * 2008-07-03 2013-05-02 Pfenex, Inc. High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein
US8808986B2 (en) 2008-08-27 2014-08-19 Gen9, Inc. Methods and devices for high fidelity polynucleotide synthesis
US20100282624A1 (en) 2008-09-10 2010-11-11 Bormioli Rocco & Figlio S.P.A. Security capsule with breakable reservoir and cutter
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8783382B2 (en) 2009-01-15 2014-07-22 Schlumberger Technology Corporation Directional drilling control devices and methods
EP2398915B1 (en) 2009-02-20 2016-08-24 Synthetic Genomics, Inc. Synthesis of sequence-verified nucleic acids
US8426189B2 (en) 2009-04-29 2013-04-23 Fermalogic, Inc. Soybean-based fermentation media, methods of making and use
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
EP2395087A1 (en) 2010-06-11 2011-12-14 Icon Genetics GmbH System and method of modular cloning
US9334514B2 (en) 2010-10-29 2016-05-10 The Regents Of The University Of California Hybrid polyketide synthases
FR2968313B1 (fr) 2010-12-03 2014-10-10 Lesaffre & Cie Procede de preparation d'une levure industrielle, levure industrielle et application a la production d'ethanol a partir d'au moins un pentose
EP2998399A1 (en) * 2011-05-03 2016-03-23 Dow AgroSciences LLC Enhancing spinosyn production with oxygen binding proteins
US8741603B2 (en) 2011-05-03 2014-06-03 Agrigenetics Inc. Enhancing spinosyn production with oxygen binding proteins
EP2677034A1 (en) 2012-06-18 2013-12-25 LEK Pharmaceuticals d.d. Genome sequence based targeted cloning of DNA fragments
GB201312318D0 (en) 2013-07-09 2013-08-21 Isomerase Therapeutics Ltd Novel methods and compounds
CN105087507B (zh) 2014-05-14 2019-01-25 中国科学院上海生命科学研究院 一种整合酶及其在改造刺糖多孢菌中的应用
DK3215618T3 (da) 2014-11-05 2019-10-14 Illumina Inc Transposasesammensætninger til reduktion af insertionsbias
GB201421859D0 (en) * 2014-12-09 2015-01-21 Bactevo Ltd Method for screening for natural products
KR102356072B1 (ko) 2015-09-10 2022-01-27 에스케이하이닉스 주식회사 메모리 시스템 및 그 동작 방법
US11293029B2 (en) 2015-12-07 2022-04-05 Zymergen Inc. Promoters from Corynebacterium glutamicum
US11151497B2 (en) * 2016-04-27 2021-10-19 Zymergen Inc. Microbial strain design system and methods for improved large-scale production of engineered nucleotide sequences
US9988624B2 (en) * 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
KR102006320B1 (ko) * 2015-12-07 2019-08-02 지머젠 인코포레이티드 Htp 게놈 공학 플랫폼에 의한 미생물 균주 개량

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120252681A1 (en) * 1998-01-16 2012-10-04 Codexis Mayflower Holdings, Llc Evolution of whole cells and organisms by recursive sequence recombination
WO2000004190A1 (en) * 1998-07-15 2000-01-27 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
WO2002029032A2 (en) * 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
CN101223281A (zh) * 2005-07-18 2008-07-16 巴斯福股份公司 芽孢杆菌MetI基因提高微生物中甲硫氨酸产量的用途
US20090258420A1 (en) * 2005-08-01 2009-10-15 Herman Van Vlijmen Altered polypeptides, immunoconjugates thereof, and methods related thereto
CN101939445A (zh) * 2007-06-15 2011-01-05 纳幕尔杜邦公司 用于制备抗真菌病原体的植物的多核苷酸和方法
US20110053273A1 (en) * 2007-10-08 2011-03-03 Synthetic Genomics, Inc. Methods for cloning and manipulating genomes
AU2015224510A1 (en) * 2010-08-30 2015-10-01 Dow Agrosciences Llc Activation tagging platform for maize, and resultant tagged population and plants
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
US20150368639A1 (en) * 2011-04-14 2015-12-24 Ryan T. Gill Compositions, methods and uses for multiplex protein sequence activity relationship mapping
US20130172215A1 (en) * 2011-12-28 2013-07-04 Dow Agrosciences Llc Identification and characterization of the spinactin biosysnthesis gene cluster from spinosyn producing saccharopolyspora spinosa
CN103224905A (zh) * 2011-12-28 2013-07-31 陶氏益农公司 鉴定和表征来自生产多杀菌素的刺糖多孢菌的siponactin生物合成基因簇

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Z. H. JIN等: "Enhanced Production of Spinosad in Saccharopolyspora spinosa by Genome Shuffling", vol. 159, pages 655 - 663, XP002783820 *
胥文春;单幼兰;许颂宵;王虹;陈淑惠;尹一兵;: "肺炎链球菌绿色荧光蛋白报告质粒的构建及评价", 重庆医科大学学报, no. 12, 28 December 2008 (2008-12-28), pages 7 - 11 *
苏建亚, 沈晋良: "多杀菌素的生物合成", 中国生物工程杂志, no. 05, 25 May 2003 (2003-05-25), pages 55 - 59 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022033011A1 (zh) * 2020-08-13 2022-02-17 江南大学 糖多孢菌及其在降低生物胺中的应用
WO2022033010A1 (zh) * 2020-08-13 2022-02-17 江南大学 糖多孢菌组合物及其在食品中的应用

Also Published As

Publication number Publication date
JP2020524493A (ja) 2020-08-20
US20200115705A1 (en) 2020-04-16
KR20200015606A (ko) 2020-02-12
WO2018226893A3 (en) 2019-01-10
WO2018226893A2 (en) 2018-12-13
JP7350659B2 (ja) 2023-09-26
CA3064619A1 (en) 2018-12-13
EP3635110A2 (en) 2020-04-15

Similar Documents

Publication Publication Date Title
CN110914425A (zh) 用于改良刺糖多孢菌的高通量(htp)基因组工程改造平台
US11352621B2 (en) HTP genomic engineering platform
CA3105722C (en) Microbial strain improvement by a htp genomic engineering platform
US20200370058A1 (en) A htp genomic engineering platform for improving escherichia coli
CN110719956A (zh) 用于改良真菌菌株的高通量基因组工程改造平台
US11312951B2 (en) Systems and methods for host cell improvement utilizing epistatic effects
US20200102554A1 (en) High throughput transposon mutagenesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40017177

Country of ref document: HK