CN103975063A - 核酸组装系统 - Google Patents

核酸组装系统 Download PDF

Info

Publication number
CN103975063A
CN103975063A CN201280057858.0A CN201280057858A CN103975063A CN 103975063 A CN103975063 A CN 103975063A CN 201280057858 A CN201280057858 A CN 201280057858A CN 103975063 A CN103975063 A CN 103975063A
Authority
CN
China
Prior art keywords
polynucleotide
host cell
sequence
subgroup
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280057858.0A
Other languages
English (en)
Inventor
约翰尼斯·安德列什·劳博斯
伯纳德·迈瑞克
理查德·克尔曼
本·达尔克·登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN103975063A publication Critical patent/CN103975063A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast

Abstract

本发明涉及制备宿主细胞文库的方法,其中多个所述宿主细胞包含在靶基因座处的组装的多核苷酸,所述方法包括:(a)提供包含两个或更多个多核苷酸亚组的多个多核苷酸,其中:(i)每个多核苷酸亚组中的多个多核苷酸包含编码肽或多肽的序列和/或调节序列;(ii)每个多核苷酸亚组编码的多个肽或多肽,或每个多核苷酸亚组中包含的多个调节序列共享活性和/或功能;(iii)至少一个多核苷酸亚组包含至少两个不同的多核苷酸种类;(iv)每个多核苷酸亚组的多个多核苷酸包含能够与来自一个或更多个其他多核苷酸亚组的多个多核苷酸同源重组的序列;和(v)两个多核苷酸亚组中的多个多核苷酸包含能够与宿主细胞中的靶基因座同源重组的核苷酸序列;和(b)通过在宿主细胞体内同源重组在靶基因座处组装所述多个多核苷酸,从而产生宿主细胞文库,所述宿主细胞文库的多个包含在靶基因座处的组装的多核苷酸。组装的多核苷酸可被回收,从而制备核酸文库。

Description

核酸组装系统
技术领域
本发明涉及制备宿主细胞文库的方法。本发明还涉及制备核酸文库的方法和涉及制备具有期望性质的宿主细胞的方法。本发明进一步涉及根据这些方法制备的宿主细胞文库、核酸文库和具有期望性质的宿主细胞。
背景技术
生物体尤其是微生物,可用于生产生物和化学产品,所述化学产品有时比使用化学合成或石油基化学品具有更少的花费和更小的环境影响。一些微生物提供容易被遗传修饰的优势。通过对天然的或修饰的代谢通路操作和通过引入新的通路,微生物可被改造为生产感兴趣的产品。
在给定的通路中,很多多肽具有将底物经一系列中间产物转化成产物的活性。许多微生物具有类似的通路——如果不是一样的通路的话,但是当比较两种不同的生物体时,可以或多或少的效率在通路的平行步骤中实现特定类型的活性。例如,对于共享共同通路的两种生物体,对通路中平行活性负责的对应多肽可以不同的效率或不同的速度影响活性。因此,尽管相关的或不相关的生物体可具有类似的或相同的通路,不同微生物中每种活性受影响的效率或速度可能不同。
需要其中可利用这种天然变异和其他类型变异的方法。
发明内容
本文提供了用于优化经改造的微生物中一个或更多个通路的方法。特别是,该方法可通过经改造的微生物用于优化靶产物的生产。对于通路中的两种或更多种活性或功能,本文的方法提供携带生物体中活性/功能的多肽(和控制那些多肽表达的调节序列)的不同组合。
这些中,可鉴定和选择出能有效生产靶产物的组合,从而生产具有优化的靶产物生产的生物体。
关键地,这些组合在宿主细胞体内组装,使得本发明的方法提供快速有效的策略,用于产生可容易地筛选期望性质的遗传多样性。本发明因此提供其中可针对期望性质对宿主细胞文库进行筛选的方法。这种方法可包括测定由文库中宿主细胞生产的靶产物的量。
本发明中,提供许多多核苷酸亚组。这些多核苷酸亚组使得亚组中的每个多核苷酸能够与来自一个或更多个其他组的多核苷酸同源重组。另外,来自两个组的多核苷酸能够与宿主细胞中的靶位点同源重组。所以,本发明的方法允许产生组装的多核苷酸,典型地每个所述多核苷酸包含来自每个亚组的多核苷酸并且所述多核苷酸通过同源重组在靶基因座处被并入宿主细胞。
变异可被引进一个或更多个多核苷酸亚组。也就是说,多核苷酸亚组可包含两种或更多种不同的序列。因此,通过允许多核苷酸亚组经历同源重组,可产生组装的多核苷酸的变体。多核苷酸亚组在体内组装,使得产生包含组装的多核苷酸的变体的宿主细胞文库。
可筛选宿主细胞,以鉴定具有由含在该宿主细胞中的组装的多核苷酸赋予的期望性质的宿主细胞。例如,组装的多核苷酸可包含编码各种通路成员的序列。该方法可因此用于鉴定通路成员的变体组合,所述通路引起例如靶产物的有效生产。
根据本发明,因此提供制备宿主细胞文库的方法,其中多个所述宿主细胞包含在靶基因座处的组装的多核苷酸,该方法包括:
(a)提供包含两个或更多个多核苷酸亚组的多个多核苷酸,其中:
(i)每个多核苷酸亚组中的多个多核苷酸包含编码肽或多肽的序列和/或调节序列;
(ii)每个多核苷酸亚组编码的多个肽或多肽,或每个多核苷酸亚组中包含的多个调节序列共享活性和/或功能;
(iii)至少一个多核苷酸亚组包含至少两个不同的多核苷酸种类(polynucleotide species);
(iv)每个多核苷酸亚组的多个多核苷酸包含能够与来自一个或更多个其他多核苷酸亚组的多个多核苷酸同源重组的序列;和
(v)两个多核苷酸亚组中的多个多核苷酸包含能够与宿主细胞中的靶基因座同源重组的核苷酸序列;和
(b)通过在宿主细胞体内同源重组,在靶基因座处组装所述多个多核苷酸,
从而产生宿主细胞文库,其中多个所述宿主细胞包含在靶基因座处的组装的多核苷酸。
本发明还提供:
-制备组装的多核苷酸的文库的方法,该方法包括:
-根据本发明的方法制备宿主细胞文库;和
-从宿主细胞文库回收组装的多核苷酸,
从而制备组装的多核苷酸的文库;
-制备具有期望性质的宿主细胞的方法,该方法包括:
-根据本发明的方法制备宿主细胞文库;和
-筛选所述宿主细胞文库,
从而鉴定具有期望性质的宿主细胞;
-制备具有期望性质的宿主细胞的方法,该方法包括:
-根据本发明的方法制备组装的多核苷酸的文库;
-将所述文库转移至宿主细胞;和
-筛选所得宿主细胞,
从而鉴定具有期望性质的宿主细胞;和
-表达筛选丝状真菌转化体的方法,包括:
(a)分离通过根据本发明的方法制备的酵母宿主细胞文库的单菌落转化体;
(b)由酵母转化体的单菌落来制备DNA;
(c)将步骤(b)的制备物样品引入丝状真菌原生质体的分开的悬液中以获得其转化体,其中转化体含有来自所述酵母宿主细胞文库的一个或更多个拷贝的个体多核苷酸;
(d)使步骤(c)的个体丝状真菌转化体在选择性生长培养基上生长,从而允许所述丝状真菌转化体生长,同时抑制未转化的丝状真菌生长;和
(e)测量由个体多核苷酸编码的每种多肽的活性或性质
而且,本发明涉及根据本发明的方法制备的宿主细胞文库、核酸文库和具有期望性质的宿主细胞。
附图说明
图1显示组装变体核酸的例子,通过添加作为选择的用于重组通路并且整合选择性标记(在该情况下是KanMX)的多个片段,来将变异添加至通路,然后筛选从转化获得的所有菌株并且发现最佳组合和/或从所有获得的结果中学习,以改进最终的通路。
图2显示测试通路。HIS3用作转化后的选择性标记,通路中的所有其他部分容易根据表型打分并且可因此用于表明将变异添加至通路的原理。
图3显示可经同源重组整合进入酵母基因组的实施例X的盒。每个盒边缘上的浅灰色描绘用于体内同源重组的50-bp同源区域。
图4显示在凝胶上分析的PCR反应1和2的PCR反应。在每个条带的数量指表2中的数量。
图5显示在凝胶上分析的PCR反应2的PCR反应。在每个条带的数量指表2中的数量。
图6显示在凝胶上分析的PCR反应3的PCR反应和PCR反应3的EcoRV切割。在每个条带的数量指表2中的数量。
图7显示在凝胶上分析的EcoRV的PCR反应3切割。在每个条带的数量指表2中的数量。
序列表描述
SEQ ID NO:1至SEQ ID NO:14描述在表1中。
SEQ ID NO:15PCR展示与测试通路中的部分1(HIS3)具有同源性的片段“5’ADE1侧翼”的核酸序列。
SEQ ID NO:16展示与测试通路中的部分5(URA3)具有同源性的PCR片段“3’ADE1侧翼”的核酸序列。
SEQ ID NO:17展示HIS3表达盒的核酸序列。
SEQ ID NO:18展示LEU2表达盒的核酸序列。
SEQ ID NO:19展示Kanmx表达盒(G418抗性)的核酸序列。
SEQ ID NO:20展示ble表达盒(腐草霉素抗性)的核酸序列。
SEQ ID NO:21展示Nat1表达盒(诺尔斯菌素抗性)的核酸序列。
SEQ ID NO:22展示潮霉素抗性表达盒的核酸序列。
SEQ ID NO:23展示TRP1表达盒的核酸序列。
SEQ ID NO:24展示URA3表达盒的核酸序列。
SEQ ID NOs:25至42展示用于扩增实施例2中的设计的盒和整合侧翼的引物序列。
SEQ ID NOs:43至54展示用于形成实施例2中描述的通路变体的表达盒(启动子、开放阅读框和终止子)的序列。
SEQ ID NOs:55和56展示用于测定实施例2中的盒120或盒121的存在性的PCR反应引物。
SEQ ID NOs:57至63展示用于测定实施例2中的各种盒的存在性的PCR反应引物。
具体实施方式
在本说明书和所附权利要求书的通篇中,词语“包含”和“包括”(″comprise″,″include″,″having″)及其变体如“包含”(″comprises″,″comprising″)、“包括”(″includes″和″including″)应被解释为开放性的。也就是说,在上下文允许时,这些词语旨在表达可能包括未明确指出的其他要素或成分。
冠词(“a”和“an”)在本文中被用于表示一个或多于一个(即一个或至少一个)所述冠词的语法客体。例如,“要素”(“an element”)可表示一个要素或多于一个要素。
本发明提供了产生宿主细胞和核酸(尤其是组装的多核苷酸)的文库的方法。
这种文库可用于鉴定,例如被优化用来生产期望的靶产物的微生物。也就是说,本发明提供了优化或改进经改造的微生物中的一个或更多个通路的方法,并且本发明可用来优化或改进经改造的微生物对靶产物的生产。
对于通路中的活性/功能,本文的方法提供编码多肽的(携带生物体中的那些活性/功能的)多核苷酸的不同组合和/或控制由这些多核苷酸编码的多肽表达的调节序列的不同组合。这些中,可鉴定并选择引起靶产物的有效生产的组合,从而提供具有优化的期望靶产物生产的生物体。
本文描述的方法通过提供通路中至少一个位置的变异,来提供可能的通路的多种组合。这些方法可被称为“组合方法”。因此,本文描述的方法可用来改进或优化在经改造的生物体中的靶产物形成。如本文所使用的,术语“改进”和“优化”和类似的术语,是指下述方法,其中使用天然存在的和/或合成的多核苷酸(例如,改造的遗传多样性),借以改变代谢通路或其部分,以增加当与天然或参考活性比较时的期望终产物的速度、产率和/或生产效率。
对于这种改进或优化的本发明的方法,在本文中被进一步详细地描述。尤其,产生下述多核苷酸的亚组,所述一个或更多个亚组可包含变异。可产生来自亚组的多核苷酸的组合,该组合在体内组装并且在宿主细胞中表达。然后可对所得宿主细胞测试以测定哪种组合更有效或有力地生产靶产物。
如本文所使用的,术语“通路”,被宽泛地解释,并且可指一系列同时的、相继的或分开的化学反应,其通过将底物或起始元素经由一种或更多种中间产物转化成最终化合物或期望的产品的活性来实现。在某些实施方式中,活性有时是底物向中间产物或产物的转化(例如,通过酶的催化转化),有时是分子或配体的结合。如本文所使用的,术语“相同的通路”指来自相关或不相关生物体、具有相同数量和类型的活性并且产生相同终产物的通路。如本文所使用的,术语“类似的通路”指来自相关或不相关生物体、具有下述的一种或更多种的通路:不同数量的活性、不同类型的活性、使用相同的起始或中间产物分子,和/或产生相同终产物。
通路改进和优化可例如通过利用天然存在的遗传多样性和/或经改造的遗传多样性来获得。可通过测试来自不同生物体的亚组多核苷酸来利用天然存在的遗传多样性。可通过测试,例如已经被密码子-优化的或突变的亚组多核苷酸,来利用经改造的遗传多样性。对于密码子-优化的多样性,氨基酸密码子三联体可替换为其他密码子,和/或某些核苷酸序列可被添加、去除或替换。例如,天然密码子可替换为或多或少的优选的密码子。在某些实施方式中,可通过将相关或类似的活性替换为来自类似的但是不相同的通路的一个或更多个步骤,来优化通路。亚组中的多核苷酸还可被遗传改变,使得当编码时,实现与用作遗传改变的起始材料的天然对等物的活性不同的活性。如本领域已知的,通过人的手动操作而改变的核酸和/或氨基酸序列可被称为“改造的”遗传多样性。
代谢通路可视为将开始底物或元素转化成终产物的一系列的反应步骤。每个步骤可通过一种或更多种活性催化。在其中底物A被转化成终产物D的通路中,通过通路中的特异性活性,产生并转化了中间产物B和C。通路的每种特异性活性可考虑活性亚组的种类,并且编码该活性的多肽可考虑对应多肽亚组的种类。
任何肽、多肽或蛋白质,或由一种或更多种肽、多肽或蛋白质催化的活性可由多核苷酸亚组编码。代表性的蛋白质包括酶(例如,部分或所有的代谢通路)、抗体、血清蛋白(例如,白蛋白)、膜结合蛋白、激素(例如,生长激素、红细胞生成素、胰岛素等)、细胞因子等,并且包括天然存在的和外源表达的多肽。代表性的活性(例如,功能上相关联以在代谢通路中提供活性或活性组的酶或酶的组合)包括与期望的代谢通路相关的任何活性。如本文所使用的,术语“酶”可指下述蛋白质,其可用作催化剂来诱导其他化合物中的化学变化,从而从一种或更多种底物生产一种或更多种产品。
应当理解,本文列出的实施方式中描述的方法和组合物可用来:(i)优化生产期望的终产物的任何代谢通路,和/或(ii)优化代谢通路的活性亚组中的亚结构域。如本文所使用的,术语“蛋白质”指具有通过肽键连接的氨基酸序列的分子。该术语包括天然的和重组的融合蛋白、寡肽、肽、环肽、多肽和多肽衍生物,并且还包括其片段、衍生物、同系物和变体。蛋白质或多肽有时是胞内起源的(例如,位于宿主细胞体内的细胞核、细胞溶胶或细胞间隙中)而有时是体内细胞膜蛋白。在(上述的,和在改造和改变方法部分中进一步详细描述的)一些实施方式中,遗传修饰可产生靶活性的修饰(例如,增加、基本上增加、减少或基本上减少)。
随着生物体进化,在不同的环境中并且用不同的选择性压力,生物体的核酸和氨基酸序列也可进化并且偏离祖先类型。序列进化可产生可对具体环境中的具体的生物体天然优化的代谢通路,这有助于各自通路遗传多样性。核苷酸或氨基酸序列的改变有时可造成活性效率改变(例如,转化数量或反应能量输入/输出的量的增加或减少)。改变可能由于造成趋异进化生物体的不同的选择性压力而出现。可针对下述改变的活性,选择这些选择性压力,所述改变的活性使含有改变的序列的生物体在具体的环境中更好地发挥作用。这些改变增加类似的或相同的活性的遗传多样性。可通过来自具有类似或相同通路的生物体的相关活性的核酸和/或氨基酸序列比较,来鉴定类似或相同活性的进化改变。该进化驱动的遗传多样性在本文中被称为“天然多样性”。当与提供供体活性的生物体比较时,商业上有用的生物体可具有细胞机制(例如转录和/或例如翻译机制)差异。对于选择的宿主生物体可通过如下产生优化的代谢通路:组合来自不同的来源(例如,天然的或经改造的遗传多样性)的类似或相同活性,并且根据选择的标准鉴定出显示改进的那些组合(例如,反应速度的改变、反应产率的改变、反应的能量要求或反应效率的改变等等或其组合)。
除了代谢通路优化,本发明的方法也可用于优化个体亚组活性。因此,多肽表示的每个亚组活性可被进一步分成进一步的亚组。多肽结构域可表示所有或一部分的已知活性中心,接触残基等等。
还可合成和以各种组合组装下述寡核苷酸,以进一步优化个体活性亚组,所述寡核苷酸编码来自每一生物体的每个亚结构域的密码子优化版本的氨基酸。例如,常规的重组DNA方法(例如,克隆、PCR、文库构建等等)可用来产生每个活性亚组的多肽亚结构域文库。通过使用本领域技术人员可用的重组DNA技术,或允许自组装的具体的靶长度和结构的寡核苷酸,每种活性的各个区域可通过下述方法被进一步优化:将多肽亚结构域以各种组合方式组合在一起并且评估哪种亚结构域区域的组合产生期望的结果。
可例如针对其发酵过程中的商业效用或将被遗传操作的能力,选择宿主生物体。增加由商业上有用的生物体(例如,发酵过程中的微生物)生产的期望产物的生产效率可在起始材料转化和收益性方面产生有益的收益。
因此,根据本发明,提供制备宿主细胞文库的方法,所述宿主细胞文库包含在靶基因座处的组装的多核苷酸,所述方法包括:
(a)提供包含两个或更多个多核苷酸亚组的多个多核苷酸,其中:
(i)每个多核苷酸亚组中的多个多核苷酸包含编码肽或多肽的序列和/或调节序列;
(ii)由每个多核苷酸亚组编码的多个肽或多肽,或每个多核苷酸亚组中包含的多个调节序列共享活性和/或功能;
(iii)至少一个多核苷酸亚组包含至少两个不同的多核苷酸种类;
(iv)每个多核苷酸亚组的多个多核苷酸包含能够与来自一个或更多个其他多核苷酸亚组的多个多核苷酸同源重组的序列;和
(v)两个多核苷酸亚组中的多个多核苷酸包含能够与宿主细胞中的靶基因座同源重组核苷酸序列;和
(b)通过在宿主细胞体内同源重组在靶基因座处组装多核苷酸,
从而产生包含在靶基因座处的组装的多核苷酸的宿主细胞文库。
本发明中,提供许多多核苷酸亚组。多核苷酸亚组是这样的,其使得亚组中的多核苷酸能够与来自一个或更多个其他组的多核苷酸同源重组。另外,来自两个组的多核苷酸能够与宿主细胞中的靶位点同源重组。所以,本发明的方法允许产生组装的多核苷酸,每个所述组装的多核苷酸典型地包含来自每个亚组的多核苷酸并且所述组装的多核苷酸通过同源重组在靶基因座处被并入宿主细胞。关键地,组装的多核苷酸在宿主细胞体内被组装并且靶向靶基因座。典型地,任何亚组中没有多核苷酸包含作为复制起点的序列。
“多个”旨在表示两个或更多个。在本发明的方法中,下述是可能的:所有的多个多核苷酸能够同源重组、多核苷酸亚组的每个成员包含编码肽/多肽的序列或包含调节序列、亚组的每个成员共享活性/功能。但是,术语“多个”旨在表示可以是在多个多核苷酸中的不经历同源重组并且不与相同亚组中的其他多核苷酸共享功能或活性的多核苷酸。
根据本发明的方法涉及多核苷酸彼此和多核苷酸与靶基因座的重组。“重组”指其中核酸分子断裂并且接着连接成不同的核酸分子的过程。本发明的重组过程典型地涉及可来自相同或不同生物体的不同核酸分子的人工和有意的重组,从而创建重组核酸。
本发明的方法依靠同源重组和位点特异性重组的组合。
“同源重组”指具有含有类似核苷酸序列(即,同源序列)的、具有对应位点的核苷酸序列之间的反应,通过所述反应分子可相互作用(重组)以形成新的重组核酸序列。类似的核苷酸序列位点的每个在本文被称为“同源序列”。一般而言,随着同源序列长度增加,同源重组的频率增加。因此,尽管同源重组可在较不相同的两个核酸序列之间发生,但是随着两条序列之间的趋异增加,重组频率(或效率)下降。
可在待组合的两个分子的每个上使用一条同源序列,实现重组,从而产生“单交换”重组产物。或者,待重组的两个分子的每个上可有两条同源序列。供体上两条同源序列与靶上两条同源序列之间的重组产生“双交叉”重组产物。
具有多核苷酸亚组的多核苷酸可包括互补DNA(cDNA)。多核苷酸可基本上由cDNA组成,其指多核苷酸包括编码能编码多肽的mRNA的DNA序列;并且可包括没有启动子或没有调节由DNA编码的多肽或mRNA的量的其他特定功能的一条或更多条非编码核苷酸序列(例如,从克隆过程引入的一条或更多条侧翼序列)。多核苷酸可由cDNA组成。一些实施方式中,互补DNA可以是来自生物体的天然的(即,野生型)多核苷酸,并且可以是密码子-优化的或突变的多核苷酸。
本发明中的多核苷酸也可包括DNA或RNA类似物(例如,包含碱基类似物、糖类似物和/或非天然骨架等等的)。应当理解,术语“核酸”不涉及或意指多核苷酸链的具体长度,因此多核苷酸和寡核苷酸也包括在该定义中。脱氧核糖核苷酸包括脱氧腺苷、脱氧胞苷,脱氧鸟苷和脱氧胸苷。对于RNA,尿嘧啶碱基是尿苷。
典型地,适于用于本发明的多核苷酸亚组中的多核苷酸可通过本领域已知的任何扩增方法(例如,PCR、RT-PCR等等)产生。当使用典型地难以培养(例如,缓慢生长、需要专用培养条件等等)的生物体时,核酸扩增可尤其有益。如本文所使用的,术语“扩增(amplify、amplification、amplifying)”或“扩增反应”,指用于繁殖核酸靶序列拷贝的任何体外过程。扩增有时指靶核酸的“指数”式增加。但是,如本文所使用的,“扩增”也可指核酸的选择靶序列的数量的线性增加,但是不同于一次性单引物延伸步骤。在一些实施方式中,可进行也称为预扩增的限制扩增反应。预扩增是下述方法,其中由于进行少量的循环,例如10个循环而发生限制量的扩增。预扩增可允许一些扩增,但是在指数期之前停止扩增,并且典型地生产大约500个拷贝的期望的(一条或多条)核苷酸序列。使用预扩增还可限制标准PCR反应中与耗尽的反应物相关联的出错。在一些实施方式中,扩增和/或PCR可用来给组合文库中的核苷酸序列添加接头或“粘性末端”以促进组合通路的组装和/或促进将组装的通路插入核酸反应物的表达构建中。在一些实施方式中,核酸反应物有时被稳定整合进入宿主生物体的染色体中,或在某些实施方式中(例如,遗传修饰的生物体,其中宿主基因组的改变赋予选择性地保留或优先保留携带遗传修饰的期望生物体的能力),核酸反应物可缺失一部分宿主染色体。可针对它们引导生产期望的蛋白质或核酸分子的能力,选择这种核酸反应物(例如,改变的基因组赋予生物体可选择的特点的核酸或遗传修饰生物体)。需要时,可改变核酸反应物使得密码子编码:(i)相同氨基酸,其使用与天然序列中指定的tRNA不同的tRNA;或(ii)与正常氨基酸的不同的氨基酸,包括非常规的或非天然的氨基酸(包括可检测标记的氨基酸)。如本文所描述,术语“天然序列”指如在其天然环境中发现的未修饰的核苷酸序列(例如,如在生物体中发现的核苷酸序列)。
变异可被引进一个或更多个多核苷酸亚组。也就是说多核苷酸亚组可包含两条或更多条不同的序列。因此,通过使多核苷酸亚组经历同源重组,可产生组装的多核苷酸的变体。多核苷酸亚组在体内组装使得产生包含组装的多核苷酸的变体的宿主细胞文库。
可筛选宿主细胞以鉴定具有由该宿主细胞包含的组装的多核苷酸赋予的期望性质的宿主细胞。例如,组装的多核苷酸可包含编码各种通路成员的序列。该方法可因此用来鉴定引起例如靶产物有效生产的通路成员的变体组合。
亚组的数量是至少两个,例如三个、四个、五个、六个、七个、八个、九个、十个、十五个、二十个、二十五个、三十个、三十五个、四十个、四十五个或五十或更多个。但是,典型地,有约50个或更少,比如大约20个或更少的多核苷酸亚组。本发明的方法旨在产生包含多核苷酸的组装的宿主细胞,所述多核苷酸包含基本上来自所有多核苷酸亚组的一个多核苷酸。
亚组种类组合的数量取决于给定通路中的活性的数量和可从其中分离所述通路的生物体的数量。例如,使用在三个生物体中发现的三个活性亚组通路,在该例子中数学组合排列的数量是3的3次幂,或3的立方(例如,33),或27。对于其中活性分离自四个供体生物体的三个活性通路,排列的数量可能是34或81个可能的文库组合。
在某些实施方式中,文库中可能组合的数量因此可由式子(X)Y表示,其中X是活性亚组的数量和Y是从其中可以实现活性的形式(例如,种类)的数量。
可从下列非限制形式选择亚组中的多核苷酸种类:例如,来自生物体种类的多核苷酸的密码子-优化形式、来自生物体种类的多核苷酸的突变形式,和来自给定生物体种类的天然多核苷酸形式。
式子(X)Y不总是表示文库中可能组合的数量。不同的亚组可包括不同数量的可能成员(或“变体”)。例如,一个亚组可包括比另一个亚组更少的多核苷酸种类。例如,一个多核苷酸亚组可包括某些数量的来自不同生物体种类的天然多核苷酸和某些数量的经改造的多核苷酸(例如,突变、密码子-优化的版本),而另一亚组可包括,例如更少或更大数量的每一种。
如上阐释的,每个亚组包含核酸种群。多核苷酸亚组的至少一个包含至少两种或更多种不同的核酸。也就是说,在本发明的方法中,至少两个多核苷酸亚组中的至少两种多核苷酸是不同的。
这样,可引入变异使得可产生文库。更典型地,至少两个、三个、四个、五个或更多个多核苷酸亚组可包含至少两种不同的多核苷酸。可实施该方法,其中所有的多核苷酸亚组包含至少两种不同的多核苷酸。但是,更优选地,实施本发明的方法使得,除了包含能够与靶基因座同源重组的序列的两个多核苷酸亚组和包含编码标记基因的序列的任何多核苷酸亚组之外,所有多核苷酸亚组中的至少两个多核苷酸是不同的
两个多核苷酸组包含(通过同源重组)允许组装的多核苷酸在靶基因座处并入的序列。这通常导致在靶基因座处的一些序列被组装的序列替换。靶基因座可以是染色体基因座,即在宿主细胞的基因组内的染色体基因座,或染色体外基因座,例如质粒或人工染色体。
包含允许在靶基因座处并入的序列的两个多核苷酸亚组之一典型地包含下述多核苷酸,将所述多核苷酸设计成位于组装的多核苷酸的5’端。因此,包括允许在靶基因座处并入的序列的两个多核苷酸组的另一个通常包含下述多核苷酸,将所述多核苷酸设计成位于组装的多核苷酸3’端。因此,这两个亚组之一包含典型地能够与靶基因座的“5’”序列同源重组的多核苷酸,且另一亚组包含典型地能够与靶基因座的“3’”序列同源重组的多核苷酸。或者,这些序列可被称为“上游”(5’)和“下游”(3’)序列。
包含旨在确保组装的多核苷酸与靶基因座同源重组的序列的两个亚组还包含允许与另一亚组的一个或更多个序列同源重组的序列。但是,典型地,对于确保在靶基因座处并入的两个亚组中的多核苷酸来说不可能彼此重组。
包含旨在确保在靶基因座处同源重组的序列的两个亚组,任选地还可包含额外的序列,例如编码下述多肽的序列,所述多肽是使用本发明的方法将被优化的通路的成员。
典型地,旨在确保在靶基因座处并入的序列在亚组中不变。
本发明的方法中使用的每个亚组包含具有编码肽或多肽的序列和/或包含调节序列。多核苷酸或所得的肽/多肽中包含的序列典型地是相关的。也就是说,每个多核苷酸可包括共享活性和/或功能的序列或编码共享活性和/或功能的肽/多肽。例如,每个多核苷酸可编码给定酶的一种或更多种变体。可选地,每个多核苷酸可编码基本上具有相同功能的可选的多肽,例如,所编码的多肽可以是可选的标记基因或包含可选版本的调节序列。例如,亚组可包含具有下述可选启动子的多核苷酸,所述启动子在序列同一性水平上不相关,但是仍具有启动子的相同功能。
如上阐释的,由具体的多核苷酸亚组的多核苷酸编码的每种多肽可具有给定的活性或注解的活性。这种活性可以是将具体底物转化成具体产物的能力。因此,由亚组中的多核苷酸编码的一条多肽可以比其将第二底物转化成第二产物更高的效率,将第一底物转化成第一产物,但是其仍与在相同亚组中的下述另一多肽具有相同活性,所述另一多肽也将第二底物转化成第二产物。例如,(i)亚组中的一种多肽可优先将六碳底物转化成产物,但是以更低的效率也将五碳底物转化成产物,和(ii)亚组中的另一多肽可优先将相同五碳底物转化成相同的产物;这两种多肽共享将相同的五碳底物转化成相同产物的相同活性。活性可以是结合具体分子的能力。
如本文所使用的,术语“相同的活性”指基本上相同类型的活性(例如,将某些底物转化成某些产物的能力)而不管活性水平或效率,只要活性对于两种多核苷酸(或由那些多核苷酸编码的多肽)而言是可探测的。
由具体亚组中的这些多核苷酸编码的每种多肽可能够结合具体的分子(例如,底物、配体等等)。
具体的亚组中的多核苷酸或由这些多核苷酸编码的多肽可共享至少约60%的核酸或氨基酸序列同一性。即,具体多核苷酸亚组中的多核苷酸或由具体多核苷酸亚组编码的多肽可共享大约61%或更多、62%或更多、63%或更多、64%或更多、65%或更多、66%或更多、67%或更多、68%或更多、69%或更多、70%或更多、71%或更多、72%或更多、73%或更多、74%或更多、75%或更多、76%或更多、77%或更多、78%或更多、79%或更多、80%或更多、81%或更多、82%或更多、83%或更多、84%或更多、85%或更多、86%或更多、87%或更多、88%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、99%或更多的核酸或氨基酸序列同一性。
当每种由多核苷酸亚组编码的多肽将不同的底物转化成产物(例如,不同的或相同的产物),或将相同底物转化成不同的产物时,这样的两种多肽可具有不同的活性。两种多肽可结合不同的分子(例如,底物、配体)并且具有不同的活性。具有不同活性的两种多肽典型地不共享相同的活性。
不同的亚组中的多核苷酸或由多核苷酸编码的多肽可共享相同的活性。但是,更典型地,不同亚组中的多核苷酸/多肽不共享相同的活性。也就是说,由给定多核苷酸亚组编码的肽或多肽或给定多核苷酸亚组中包含的调节序列可具有与所有其他多核苷酸亚组中的那些不同的活性和/或功能。
由不同的亚组中的多核苷酸编码的多肽可共享相同的第二活性,例如待优化的通路中的相同活性或相同的副活性。
本发明在某种程度上可用来优化通路,其用于鉴定进行生物化学转化的优化的活性,其中步骤的精确序列可以是已知的或未知的。例如,认为纤维素降解需要许多相关酶的活性。本发明的方法可用来确定这些相关酶的最佳组合。在该情况下,本发明使用的不同多核苷酸亚组可典型地编码这些相关酶的变体。从由内切纤维素酶生产的暴露链的末端切割两个至四个单元,产生四糖或二糖(比如纤维二糖)的外切纤维素酶在纤维素降解中是重要的。有两种主要类型的外切纤维素酶[或纤维二糖水解酶(CBH)]——CBHI:从纤维素的还原末端持续作用:和CBHII:从纤维素的非还原末端持续作用。就本发明的目的而言,例如,可考虑CBHI和CBHII具有不同的活性,即典型地将含在不同的多核苷酸亚组中,尽管它们都是外切纤维素酶。因此,本发明可用于鉴定CBHI和CBHII变体的更优的组合。但是,在鉴定外切纤维素酶与其他纤维素降解酶组合的情况下,单个多核苷酸亚组可包含编码CBHI和CBHII变体的序列。
就本发明的目的而言,活性可归因于,例如已知生物化学活性的基础或基于生物信息学分析的注解。
每种活性可由多核苷酸编码的多肽实施。本发明中使用的多核苷酸可包括互补DNA(cDNA)。本发明中使用的多核苷酸可基本上由cDNA组成。cDNA可编码mRNA,其接着编码多肽。因此,每个活性亚组可用编码具有具体活性的多肽的多核苷酸亚组表示。任选地,肽或多肽的活性可仅仅在处理之后出现。例如,若干种酶仅仅当已发生进一步处理,比如切割、磷酸化之后有功能。
在本发明的方法中,至少一个多核苷酸亚组中的每种多核苷酸可包含编码标记基因的核苷酸序列。典型地,每种多核苷酸编码相同的标记基因。但是,可实施这样的方法,其中两个或更多个不同的标记基因被亚组中的多核苷酸编码。标记基因可用于鉴定已并入组装的多核苷酸的那些宿主细胞。
可使用任何合适的标记基因并且这些基因是公知的可用于测定核酸是否包括在细胞中。根据本发明制备的组装的多核苷酸可包含两种或更多种标记基因,其中一种在一种生物体中有效地发挥作用并且另一种在另一生物体中有效地发挥作用。
标记基因的例子,包括但不限于(1)编码对其它毒性化合物(例如,抗生素)提供抗性的产物的核酸区段;(2)编码在感受态细胞中在其他方面缺乏的产物(例如,必需产品、tRNA基因、营养缺陷型标记)的核酸区段;(3)编码抑制基因产物活性的产物的核酸区段;(4)编码可被容易鉴定的产物的核酸区段(例如,表型标记,比如抗生素抗性标记物(例如,β-内酰胺酶)、β-半乳糖苷酶、荧光或其他颜色标记,比如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和青色荧光蛋白(CFP)和细胞表面蛋白);(5)结合在其他方面对细胞存活和/或功能有害的产物的核酸区段;(6)在其他方面抑制如上面1-5描述的任何一种核酸区段的活性的核酸区段(例如,反义寡核苷酸);(7)结合修饰底物的产物(例如,限制性内切酶)的核酸区段;(8)可用于分离或鉴定期望分子(例如,特异性蛋白结合位点)的核酸区段;(9)编码在其他方面可能没有功能的特异性核苷酸序列(例如,用于分子亚群的PCR扩增)的核酸区段(10)当缺乏时,直接或间接对具体化合物赋予抗性或敏感性的核酸区段;(11)在感受态细胞中编码下述产物(例如,单纯疱疹胸苷激酶、胞嘧啶脱氨酶)的核酸区段,所述产物有毒或将相对无毒的化合物转化成有毒的化合物;(12)抑制包含它们的核酸分子的复制、分配或遗传力的核酸区段;和/或(13)编码条件性复制功能,例如,在某些宿主或宿主细胞菌株或在某些环境条件(例如,温度、营养条件等等)下复制的核酸区段。
典型地,本发明的方法用来产生宿主细胞文库,其中每个宿主细胞在一个或更多个靶基因座处具有至少一个组装的多核苷酸。
多核苷酸亚组被引入宿主细胞从而产生这种文库。可使用各种技术将多核苷酸亚组引入宿主细胞。用于将异源核酸引入各种生物体的非限制性例子包括:转化、转染、转导、电穿孔、超声介导的转化、粒子轰击等等。在一些情况下,虽然难以通过常规的方法转化,但载体分子的添加典型地可增加细胞中DNA的摄入。技术人员容易获得常规转化方法。
该方法可用于产生宿主细胞文库,其中文库中至少约50%的宿主细胞包含组装的多核苷酸,所述组装的多核苷酸包含来自每个多核苷酸亚组的一个多核苷酸。该方法可用于产生宿主细胞文库,其中至少约50%,例如至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%的宿主细胞在一个或更多个靶基因座处具有至少一个组装的多核苷酸。
根据本发明产生的宿主细胞文库可包括至少约20个至至少约1,000,000个不同的组装的多核苷酸,例如至少约100、至少约1,000、至少约10,000、至少约100,000、至少约500,000个组装的多核苷酸的变体。
根据本发明的方法制备的文库中,可能有许多拷贝数量的每种组装的多核苷酸。一般而言,这种文库中的个体宿主细胞可包括一个。但是,个体宿主细胞可包括两个或更多个核酸种类。可针对靶产物生产,分离并且测试个体宿主细胞,并且个体宿主细胞可在分离之后和测试之前增殖。
根据本发明产生的宿主细胞文库可包含基本上具有所有可能的亚组多核苷酸组合的组装的多肽。本发明的方法可用来产生宿主细胞文库,其包括至少约60%的所有可能的亚组多核苷酸组合(例如,大约61%或更多、62%或更多、63%或更多、64%或更多、65%或更多、66%或更多、67%或更多、68%或更多、69%或更多、70%或更多、71%或更多、72%或更多、73%或更多、74%或更多、75%或更多、76%或更多、77%或更多、78%或更多、79%或更多、80%或更多、81%或更多、82%或更多、83%或更多、84%或更多、85%或更多、86%或更多、87%或更多、88%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多或99%或更多所有可能亚组种类组合)。
在本发明的方法中,通常至少一个组装的多核苷酸包含生物通路的每个成员。优选地,生物通路确保在宿主细胞中生产感兴趣的化合物。
在本发明的方法中,每种组装的多核苷酸可包括来自多个多核苷酸亚组中每个的一个多核苷酸种类。每个组装的多核苷酸可包括来自给定供体生物体的超过一个多核苷酸亚组。也就是说,在具有多种活性的通路中,优化的通路可包括来自给定供体生物体的大于一个多核苷酸亚组。多核苷酸亚组中的多核苷酸可来自不同的供体生物体类型,其中不同的“类型”可指,例如不同的属、种或菌株。
每个组装的多核苷酸可包括串联连接的多核苷酸。这些多核苷酸可通过接头彼此分开。
感兴趣的化合物可以是初级代谢产物、次级代谢产物、肽或多肽或其可包括生物质(包含宿主细胞本身)。感兴趣的化合物可以是选自葡萄糖二酸、葡糖酸、戊二酸、己二酸、琥珀酸、酒石酸、草酸、醋酸、乳酸、甲酸、苹果酸、马来酸、丙二酸、柠檬酸、富马酸、衣康酸、乙酰丙酸、木质酸、乌头酸、抗坏血酸、曲酸、comeric酸、氨基酸、多不饱和脂肪酸、乙醇、1,3-丙-二醇、乙烯、丙酸醇、木糖醇、胡萝卜素、虾青素、番茄红素和叶黄素的有机化合物。可选地,发酵产物可以是β-内酰胺抗生素,比如青霉素G或青霉素V和其发酵衍生物、头孢菌素、环孢菌素或洛伐他汀。
感兴趣的化合物可以是选自寡肽、多肽、(药学上或工业上的)蛋白和酶的肽。在这些过程中,肽优选地从宿主细胞分泌,更优选地分泌进入培养基,使得例如通过离心或(超)过滤,可容易地通过分离宿主细胞生物质和包含肽的培养基来回收肽。
可用本发明的方法生产的具有工业上应用的蛋白质或(多)肽的例子包括酶,例如(例如,在去垢工业中使用的)脂酶、(尤其在去垢工业、酿造等等中使用的)蛋白酶、糖酶和细胞壁降解酶(比如,在水果处理、酿酒等等或在饲料中使用的淀粉酶、葡糖苷酶、纤维素酶、果胶酶、β-1,3/4-和β-1,6-葡聚糖酶、rhamnoga-lacturonases、甘露聚糖酶、木聚糖酶、支链淀粉酶、半乳聚糖酶、酯酶等等)、植酸酶、磷脂酶、糖苷酶(比如淀粉酶、β.-葡糖苷酶、阿拉伯呋喃糖酶、鼠李糖苷酶、apiosidases等等)、奶制品酶和产品(例如凝乳酶、酪蛋白)、多肽(例如聚赖氨酸等等、藻青素和其衍生物)。对哺乳动物,优选地人而言,具有治疗的、化妆品或诊断应用的多肽,包括但不限于包括其片段的胶原和明胶、胰岛素、血清白蛋白(HSA)、乳铁蛋白和免疫球蛋白。多肽可以是抗体或其一部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报道分子或转运蛋白、参与分泌过程的蛋白、参与折叠过程的蛋白、伴侣蛋白、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、胞内蛋白。胞内蛋白可以是酶比如,蛋白酶、神经酰胺酶、环氧化物水解酶、氨基肽酶、酰基酶、醛缩酶、羟化酶、氨基肽酶、脂酶。
在本发明的方法中,一个或更多个多核苷酸亚组典型地包含具有编码多肽变体的序列的多核苷酸或包含调节序列的变体。
变体可以是基因簇的成员。基因簇是用于编码相同或类似产品的一组两种或更多种基因。基因簇的例子是人β-珠蛋白基因簇,其包含编码类似蛋白质的五个功能基因和一个非功能基因。血红蛋白分子包含来自该基因簇的任何两个相同的蛋白质,这取决于它们的特异性作用。
变体可以是等位基因或多肽或调节序列的种类变体。
变体可以是人工变体。
变体可彼此共享至少约40%的序列同一性。但是,变体可共享至少约50%、至少约60%、至少约60%、至少约60%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。
序列同一性可在多核苷酸的水平上或在多核苷酸变体编码的多肽水平上计算。本文描述了测定序列同一性的方法。这种同一性旨在横跨所考虑的变体长度上进行测定,而不是对变体可能是其一部分的整个多核苷酸长度进行测定。
变体序列可通过分离或扩增从合适的来源制备,而没有任何进一步的修饰。但是,典型地为了改变(例如,增加或减少)由多核苷酸编码的多肽的活性,通过分离或扩增制备的多核苷酸可被遗传修饰以产生额外的变体。
在一些实施方式中,用来给生物体添加活性的核酸有时被遗传修饰,以优化编码期望活性(例如,多肽或蛋白质)的异源多核苷酸序列。如本文所使用的,术语“优化”可指通过优选的密码子使用来增加或增强表达的改变。术语优化也可指对氨基酸序列的修饰以增加多肽或蛋白质的活性,使得活性与多肽或蛋白质的“天然”版本相比展示更高的催化活性。
可使用本领域已知的方法对感兴趣的核苷酸序列遗传修饰。诱变技术尤其用于小规模(例如,1、2、5、10或更多核苷酸)的或大规模(例如,50、100、150、200、500或更多核苷酸)的遗传修饰。诱变允许技术人员以稳定的方式、天然地(例如,分离使用选择和筛选)或实验地通过使用化学品、辐射或错误DNA复制(例如,PCR诱变)来改变生物体的遗传信息。在一些实施方式中,可使用天然核苷酸序列作为参考序列并且修饰可产生期望的活性改变的核苷酸,通过全规模合成(whole scalesynthetic)的核酸合成,进行遗传修饰。诱变方法有时是特异性的或靶向特异性区域或核苷酸(例如,位点定向诱变、基于PCR的位点定向诱变,和体外诱变技术,比如置换和体内寡核苷酸位点定向诱变)。诱变方法就遗传修饰的布置(例如,化学诱变、插入元件(例如,插入或转座子元件)和基于错误PCR的方法)而言有时是非特异性的或随机的。
在一些实施方式中,有时对ORF核苷酸序列进行突变或修饰以改变用于编码氨基酸的三联体核苷酸序列(例如,氨基酸密码子三联体)。有时改变密码子三联体的ORF核苷酸序列的修饰用来改变最初序列中发现的密码子,以更好地匹配其中表达ORF或核酸反应物的生物体的优选的密码子使用。例如,密码子使用,和因此由来自细菌的核苷酸序列编码密码子三联体可与真核生物(比如,酵母或植物)的优选的密码子使用不同。优选的密码子使用在细菌种类之间也可不同。在某些实施方式中,有时ORF核苷酸序列被修饰,以消除密码子对和/或消除mRNA二级结构,所述mRNA二级结构可造成由ORF核苷酸序列编码的mRNA翻译期间的暂停。有时当mRNA中存在核酸二级结构时发生翻译暂停,有时由于存在通过造成核糖体暂停使翻译速度变慢的密码子对,发生翻译暂停。在一些实施方式中,使用更低丰度密码子三联体可减少由于将装载的tRNA负载进入核糖体翻译机制所需要的暂停时间减少而导致的翻译暂停。因此,为了增加细菌中的转录和翻译效率(例如,其中转录和翻译同时进行)或为了增加真核生物中的翻译效率(例如,其中转录和翻译在功能上是分开的),感兴趣的核苷酸序列的核苷酸序列可被改变,以更好地适于宿主和/或遗传修饰的微生物的转录和/或翻译机制。在某些实施方式中,通过使用减慢或暂停核糖体的较低丰度密码子减缓翻译的速度,可导致期望产物的产率更高,这是由于正确折叠的蛋白质增加和包涵体形成减少导致的。
通过测定核苷酸序列供体生物体的密码子分布并将密码子分布与受体或宿主生物体中密码子分布比较,可根据给定生物体的优选使用而改变和优化密码子。然后本文描述的技术(例如,位点定向诱变等等)可相应地用来改变密码子。
可手动,或使用技术人员商购的核酸分析软件进行密码子使用的比较。ORF的核苷酸序列的修饰也可用于纠正在不同的生物体中已经趋异的密码子三联体序列。例如,某些酵母(例如,热带假丝酵母(C.tropicalis)和麦芽糖假丝酵母(C.maltosa))使用氨基酸三联体CUG(例如,DNA序列中的CTG)编码丝氨酸。CUG典型地在大部分生物体中编码亮氨酸。为了保持所得多肽或蛋白质中的正确的氨基酸,必须改变CUG密码子以反映其中将表达核酸反应物的生物体。因此,如果来自细菌供体的ORF在上面提到的假丝酵母菌株中表达,异源核苷酸序列必须首先被改变或修饰成适当的亮氨酸密码子。因此,在一些实施方式中,ORF的核苷酸序列有时被改变或修饰以纠正在不同的生物体之间氨基酸密码子三联体进化中出现的差异。在一些实施方式中,如果编码的氨基酸是保守的或当与初始编码的氨基酸比较时为中性氨基酸改变,核苷酸序列可不改变具体的氨基酸密码子。
位点定向诱变是其中DNA分子中的特定核苷酸或特定核苷酸被突变或改变的程序。典型地使用克隆进入环形质粒载体的感兴趣的核苷酸序列进行位点定向诱变。位点定向诱变需要下述野生型序列,所述野生型序列是已知的并且用作遗传改变的平台。位点定向诱变有时被称为寡核苷酸定向诱变,因为可使用并入感兴趣的互补核苷酸序列中的具有期望的遗传修饰的寡核苷酸,来实施该技术。允许野生型序列和改变的核苷酸杂交,并且使用DNA聚合酶扩展和复制杂交过的核酸。双链核酸被引入宿主(例如,大肠杆菌)中并在体内进行另外数轮的复制。然后针对携带正确诱变处理的序列的那些细胞,选择和/或筛选携带突变的核苷酸序列的转化的细胞。盒诱变和基于PCR的位点定向诱变是位点定向诱变技术的进一步修饰。位点定向诱变也可在体内进行(例如,置换“突入突出(pop-in pop-out)”、用合成的寡核苷酸的体内位点定向诱变等等)。
可用含有期望的(一个或多个)突变的寡核苷酸引物,使用PCR进行基于PCR的诱变。该技术以与标准位点定向诱变类似的方式发挥作用,不同之处是热循环仪和PCR条件用于替换微生物宿主中克隆的复制和选择。因为基于PCR的诱变也使用环形质粒载体,使用标准电泳程序,可在足够轮数的热循环仪扩增之后,将包含并入的遗传修饰的扩增片段(例如,线性核酸分子)与包含模板序列的质粒分开。该方法的改进使用线性扩增方法和扩增整个质粒的一对诱变引物。程序利用大肠杆菌Dam甲基酶系统,所述系统使得体内复制的DNA对限制性内切酶Dpnl敏感。PCR合成的DNA没有被甲基化并且因此对Dpnl是抗性的。该方法允许模板质粒被消化,使得遗传修饰的PCR合成的质粒被分离并且被转化进入宿主细菌中,用于DNA修复和复制,从而促进随后的克隆和鉴定步骤。通过使用部分简并的引物,某些量的无序性(randomness)可被添加至基于PCR的位点定向诱变。
化学诱变通常涉及化学品,比如在本文作为非限制性例子提供的甲基磺酸乙酯(EMS)、亚硝酸、丝裂霉素C、N-甲基-N-亚硝基脲(MNU)、二环氧丁烷(DEB)、1,2,7,8-二环氧辛烷(DEO)、甲磺酸甲酯(MMS)、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、4-硝基喹啉1-氧(4-NQO)、2-甲氧基-6-氯-9(3-[乙基^-氯乙基-氨基丙基氨基^吖啶二盐酸(ICR-170)、2-氨基嘌呤(2AP)和羟胺(HA)。这些化学品可造成碱基对置换、移码突变、缺失、颠换突变、转换突变、错误复制等等。在一些实施方式中,诱变可在体内实施。有时诱变过程涉及使用宿主生物体DNA复制和修复机制,以并入和复制诱变处理的(一个或多个)碱基。
另一类型的化学诱变涉及碱基类似物的使用。碱基类似物的使用使得错误的碱基配对,这在下一轮复制中被纠正成为较之起始序列的错配的核苷酸。碱基类似物诱变将少量的非无序性引入随机诱变,因为可选择可在起始序列的某些核苷酸处并入的特定碱基类似物。错误配对的纠正典型地产生已知的替换。例如,溴-脱氧尿苷(BrdU)可并入DNA并且替换序列中的T。宿主DNA修复和复制机制有时可纠正缺陷,但是有时会用G错误匹配BrdU。然后下一轮的复制造成来自天然序列中最初A-T的G-C颠换。当UV光辐射两个相邻胸腺嘧啶残基之间的化学键时,通过形成胸苷二聚体造成紫外线(UV)诱导的诱变。宿主生物体的切除修复机制纠正DNA的损伤,但是偶尔损伤不正确地修复,这典型地导致C至T的转换。
DNA改组是使用来自突变体文库成员的DNA片段并且随机改组片段以产生新的突变体序列组合的方法。典型地使用DNasel,随后随机退火并使用自身引导的PCR再连接,来产生片段。来自随机片段退火的DNA突出端提供用于PCR过程的“引物”序列。改组可应用于通过任何上述诱变方法产生的文库。易错PCR和其衍生的滚环易错PCR使用增加的镁和锰浓度结合限制量的一个或两个核苷酸,以降低Taq聚合酶的保真度。当所得突变体序列与野生型起始序列相比时,在适当的条件下,错误速度可高至2%。扩增之后,突变体编码序列的文库必须克隆进合适的质粒。尽管点突变是易错PCR中最常见的突变类型,但是缺失和移码突变也是可能的。有许多商购的易错PCR试剂盒,包括来自Stratagene和Clontech的那些(例如,分别为万维网地址strategene.com和万维网地址clontech.com)。滚环易错PCR是下述易错PCR的变体,其中野生型序列首先克隆进入质粒,整个质粒然后在易错条件下扩增。如上所述的,也可使用遗传选择并在选择性培养基上筛选生物体或通过从独特环境中鉴定天然存在的变体,来分离具有改变活性的生物体。例如,2-脱氧-D-葡萄糖是毒性葡萄糖类似物。在该物质上酵母的生长产生是解除葡萄糖调节的突变体。使用2-脱氧-D-葡萄糖已经分离了许多突变体,包括运输突变体,和同时发酵葡萄糖和半乳糖,而不是首先发酵葡萄糖然后当葡萄糖耗尽时发酵半乳糖的突变体。类似的技术已经用于分离突变体微生物,所述突变体微生物可代谢实验室环境中的或来自独特环境的(例如,来自垃圾掩埋场的)塑料、(例如,来自浮油的)石油化学品等等。
因此,可通过修饰(例如通过点突变、缺失突变、插入突变、基于PCR的诱变等等来实现)编码序列的核苷酸序列,以改变、增强或增加、减少、基本上减少或消除编码的蛋白质或肽的活性,来改变多核苷酸的活性。有时,通过修饰的编码序列编码的蛋白质或肽以更低的量生产或可能以不可检测的水平生产,并且在其他实施方式中,由修饰的编码序列编码的产物或蛋白质以更高的水平生产(例如,有时密码子被修饰,从而它们与宿主生物体或经改造的生物体中优先使用的tRNA相容)。为了测定相对活性,来自突变ORF(或包含它的细胞)的产物的活性可与未修饰的ORF(或包含它的细胞)编码的产物或蛋白质的活性相比较。
在本发明的方法中,每个多核苷酸亚组中的多个多核苷酸包含编码肽或多肽的序列和/或调节序列。因此,亚组中的多核苷酸可包含下述元件的一个或更多个,例如:启动子元件、增强子元件、5′非翻译区域(5′UTR)或3′非翻译区域(3′UTR)。这些元件可出现在没有编码序列的地方。或者,它们与也出现在多核苷酸中的编码序列可操作地连接。
所以,多核苷酸亚组可包括调节元件和/或编码序列。因此,本发明的方法可用于测定,例如,用于结合给定编码序列的最佳启动子。因此,一个多核苷酸亚组可包含启动子并且“相邻的”亚组(在组装的多核苷酸中其与启动子亚组直接3’连接)可包含编码序列。这样,可测定启动子和编码序列的最佳组合。该方法可进一步结合其他的亚组,其中多核苷酸包含,例如5’UTR和3’UTR。
启动子元件典型地对DNA合成和/或RNA合成而言是需要的。启动子元件通常包含下述DNA区域,该DNA区域可通过提供用于对应于基因的RNA合成的起始位点,来促进具体的基因转录。在一些实施方式中,启动子一般位于它们调节的基因附近,位于基因的上游(例如,基因的5′),并且在和基因的有义链相同的DNA链上。
5′UTR可包括对其所源自的核苷酸序列而言内源的一个或更多个元件,并且有时包括一个或更多个外源性元件。5′UTR可源自,例如来自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)的任何合适的核酸,比如基因组DNA、质粒DNA、RNA或mRNA。基于选择表达系统(例如,选择生物体中的表达,或无细胞系统中的表达),技术人员可选择用于5′UTR的适当的元件。5′UTR有时包括对技术人员而言已知的下列元件的一个或更多个:增强子序列(例如,转录或翻译)、转录起始位点、转录因子结合位点、翻译调节位点、翻译起始位点、翻译因子结合位点、附加的蛋白结合位点、反馈调节试剂结合位点、Pribnow框、TATA框、-35元件、E-框(螺旋-环-螺旋结合元件)、核糖体结合位点、复制子、内部核糖体进入位点(IRES)、沉默基因元件等等。在一些实施方式中,启动子元件可被分离,使得对于适当的条件性调节而言必须的所有5′UTR元件包含在启动子元件片段中,或在启动子元件片段的有功能的子序列中。
多核苷酸亚组中的5′UTR可包括翻译增强子核苷酸序列。翻译增强子核苷酸序列通常位于核酸反应物的启动子和靶核苷酸序列之间。翻译增强子序列通常结合核糖体,有时是18S rRNA-结合核糖核苷酸序列(即,4OS核糖体结合序列)并且有时是内部核糖体进入序列(IRES)。IRES一般形成具有精确布置的RNA三级结构的RNA支架,所述RNA三级结构通过许多特定的分子间相互作用接触4OS核糖体亚单位。核糖体增强子序列的例子是已知的并且可由技术人员鉴定(例如,Mignone等,NucleicAcids Research33:D141-D146(2005);Paulous等,Nucleic Acids Research31:722-733(2003);Akbergenov等,Nucleic Acids Research32:239-247(2004);Mignone等,Genome Biology3(3):评述0004.1-0001.10(2002);GaIMe,Nucleic Acids Research30:3401-3411(2002);Shaloiko等,http地址www.interscience.wiley.com,DOI:10.1002/bit.20267;和Gallie等,NucleicAcids Research15:3257-3273(1987))。翻译增强子序列有时是真核序列,比如Kozak共享序列或其他序列(例如,螅体序列,GenBank登录号U07128)。翻译增强子序列有时是原核序列,比如Shine-Dalgarno共享序列。在某些实施方式中,翻译增强子序列是病毒核苷酸序列。翻译增强子序列有时来自植物病毒,例如比如烟草花叶病毒(TMV)、苜蓿花叶病毒(AMV);烟草蚀刻病毒(ETV);土豆病毒Y(PVY);芜菁花叶病毒(poty)病毒和豌豆种传花叶病毒的5′UTR。在某些实施方式中,来自TMV的大约67个碱基长度的Ω序列包括在核酸反应物中,作为翻译增强子序列(例如,没有鸟苷核苷酸并且包括25核苷酸长尾部(CAA)中心区域)。
3′UTR可包括对其所源自的核苷酸序列而言内源的一个或更多个元件并且有时包括一个或更多个外源性元件。3′UTR可源自,例如来自任何合适的生物体(例如,病毒、细菌、酵母、真菌、植物、昆虫或哺乳动物)的基因组DNA、质粒DNA、RNA或mRNA的任何合适的核酸,。基于选择的表达系统(例如,在选择的生物体中表达),技术人员可选择适当的3′UTR元件。有时3′UTR包括对技术人员而言已知的下列元件的一个或更多个:转录调节位点、转录起始位点、转录终止位点、转录因子结合位点、翻译调节位点、翻译终止位点、翻译起始位点、翻译因子结合位点、核糖体结合位点、复制子、增强子元件、沉默基因元件和多腺苷尾巴。3′UTR通常包括多腺苷尾巴并且有时没有,并且如果存在多腺苷尾巴,一个或更多个腺苷部分可被添加或从多腺苷尾巴中缺失(例如,大约5、大约10、大约15、大约20、大约25、大约30、大约35、大约40、大约45或大约50个腺苷部分可被添加或去除)。在一些实施方式中,5′UTR和/或3′UTR的修饰可用于改变(例如,增加、添加、减少或基本上消除)启动子的活性。
在本发明的方法中,在编码多肽的亚组中的每个多核苷酸可与启动子可操作地连接。但是,相同亚组中的每个多核苷酸可能不必与相同启动子操作连接。因此,亚组可包括具有不同启动子的多核苷酸。
多核苷酸可因此可操作地连接一个或更多个启动子。不同亚组中编码多肽的多核苷酸可以可操作地连接分开的启动子。因此,组装的多核苷酸可包括对于每个多核苷酸亚组而言可操作的特定启动子(例如,对于包含来自六个多核苷酸亚组每一个的多核苷酸的组装的核酸,典型地存在六个启动子,其中每个启动子与组装的多核苷酸的每个组成型多核苷酸可操作地连接)。在一些实施方式中,对于组装的多核苷酸中表示的两个或更多个多核苷酸亚组,与多核苷酸可操作地连接的启动子可以相同或不同。例如,在包含来自六个多核苷酸亚组每一个的多核苷酸的组装的多核苷酸中,可有六个启动子,每个启动子与多核苷酸可操作地连接,其中(i)所有启动子相同,(ii)所有启动子不同,(iii)一些启动子相同和一些启动子不同(例如,2个启动子相同和4个启动子不同)。
在本发明的方法中,多核苷酸亚组中的多核苷酸长度可从约50bp至约10kb。
在本发明的方法中,确保同源重组的序列长度可从约20bp至约500kb。
为了促进在靶基因座处的靶向整合并确保多核苷酸亚组的组装:(i)每个多核苷酸亚组的每个多核苷酸包含能够与来自一个或更多个其他多核苷酸亚组的每个多核苷酸同源重组的序列;和(ii)两个多核苷酸亚组的每个多核苷酸包含能够与宿主细胞中的靶序列同源重组的序列。
同源重组是下述一类遗传重组,其中在两个类似的或相同的DNA分子之间交换核苷酸序列。介导多核苷酸亚组之间的同源重组和与靶基因座的同源重组的序列长度可至少约20bp、至少约30bp、至少约50bp、至少约0.1kb、至少约0.2kb、至少约0.5kb、至少约1kb或至少约2kb。
如上阐释的,在本发明的方法中,组装的多核苷酸可在宿主细胞的基因组中的靶基因座处,例如在染色体位置处重组,或重组进入染色体外靶基因座。靶基因座可以是宿主细胞的基因组中的任何合适的基因座。染色体外靶基因座可以是质粒或人工染色体,比如酵母人工染色体,例如其中宿主细胞是酵母细胞。
组装的多核苷酸在靶基因座处的重组可导致组装的多核苷酸在靶基因座处插入,使得在该基因座处没有遗传材料丢失(但组装的多核苷酸将打断基因座)。但是,组装的多核苷酸在靶基因座处的重组可替换在靶基因座处的遗传材料。
一个或更多个多核苷酸亚组中的多核苷酸可包含一个或更多个位点特异性重组酶位点,例如,如此,可从宿主细胞回收组装的多核苷酸。位点特异性重组酶插入位点是在参与整合/重组反应的核酸分子上的由重组蛋白,比如Cre重组酶识别的序列。通过Cre重组酶识别的位点是loxP,其是34个碱基对序列,所述34个碱基对序列由在8个碱基对核心序列侧翼的两个13个碱基对反向重复序列(用作重组酶结合位点)组成。重组位点的其他例子包括attB、attP、attL和attR序列,和其突变体、片段、变体和其衍生物,所述重组位点被重组蛋白λlnt和辅助蛋白整合宿主因子(IHF)、FIS和切割酶(Xis)识别。
便利地,这些位点可位于包含能够与靶基因座同源重组的序列的多核苷酸亚组中。这样,整个组装的多核苷酸可,便利地从宿主细胞中回收。
在本发明的方法中,宿主细胞典型地是适于遗传操作且可以在用于工业生产靶产物的细胞密度下培养的那些生物体。合适的生物体可以是微生物,例如可在发酵设备中保持的生物体。
宿主细胞可以是原核、古细菌或真核生物体,或来自这种生物体的细胞。
适用于本发明的宿主细胞可包括下列特征的一个或更多个:好氧、厌氧、丝状、非丝状、单倍体、二倍体、营养缺陷型和/或非营养缺陷型。
适用于本发明的宿主细胞可以是原核微生物(例如,细菌)或非原核微生物。合适的宿主细胞可以是真核微生物(例如,酵母、真菌、变形虫和藻类)。合适的宿主细胞可来自非微生物来源,例如哺乳动物或昆虫细胞。
“真菌”在本文中被定义为真核微生物并包括真菌亚门的所有物种(Alexopoulos,C.J.,1962,In:Introductory Mycology,John Wiley&Sons,Inc.,New York)。术语“真菌”因此包括丝状真菌和酵母二者。“丝状真菌”在本文中被定义为包括真菌亚门和卵菌亚门的所有丝状形式的真核微生物(如由Hawksworth等人,1995所定义的,上文)。丝状真菌的特征在于,菌丝壁由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成。营养性生长是菌丝延长且碳分解代谢是专性好氧的。丝状真菌菌株包括但不限于下述菌株:Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium和Trichoderma。
“酵母”在本文中被定义为真核微生物并且包括主要以单细胞形式生长的真菌亚门的所有物种。酵母可通过单细胞菌体出芽生长或可通过生物体的分裂生长。
根据本发明的宿主细胞优选地是真菌宿主细胞,其中真菌如本文上面所定义。优选的真菌宿主细胞是如下面描述的在用于生产发酵产品的工业发酵工艺中使用的真菌。各种丝状真菌以及酵母用于这种工艺。优选的丝状真菌宿主细胞可选自下列属:Aspergillus、Trichoderma、Humicola、Acremonium、Fusarium、Rhizopus、Mortierella、Penicillium、Myceliophthora、Chrysosporium、Mucor、Sordaria、Neurospora、Podospora、Monascus、Agaricus、Pycnoporus、Schizophylum、Trametes和Phanerochaete。可用作宿主细胞(例如用作比较转化的和未转化的细胞的发酵特点的参考宿主细胞)的优选的真菌菌株包括,例如Aspergillus nigerCBS120.49、CBS513.88、Aspergillus oryzae ATCC16868、ATCC20423、IFO4177、ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、Aspergillus fumigatus AF293(CBS101355)、P.chrysogenumCBS455.95、Penicillium citrinum ATCC38065、Penicillium chrysogenumP2、Acremonium chrysogenum ATCC36225、ATCC48272、Trichodermareesei ATCC26921、ATCC56765、ATCC26921、Aspergillus sojaeATCC11906、Chrysosporium lucknowense ATCC44006和所有这些菌株的衍生物。尤其优选Aspergillus nigerCBS513.88和其衍生物作为丝状真菌宿主细胞。
任何合适的酵母可选择作为宿主细胞。优选的酵母宿主细胞可选自下列属:Saccharomyces(例如,S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Kluyveromyces、Candida(例如,C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Pichia(例如,P.pastoris)、Schizosaccharomyces、Hansenula、Kloeckera、Schwanniomyces和Yarrowia(例如,Y.lipolytica(之前归类为脂假丝酵母))。
任何合适的原核生物可选择作为宿主细胞。可选择革兰氏阴性或革兰氏阳性细菌。细菌的例子,包括但不限于杆细菌(例如,B.subtilis、B.megaterium)、不动杆菌、诺卡氏菌、黄色杆菌、埃希氏细菌(例如,大肠杆菌(例如,菌株DH1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over(例如,美国临时号09/518,188)))、链霉菌、Erwinia细菌、Klebsiella细菌、Serratia细菌(例如,S.marcessans)、Pseudomonas细菌(例如,P.aeruginosa)、Salmonella细菌(例如,S.typhimurium、S.typhi)。细菌也包括但不限于光合成细菌(例如,绿色非硫细菌(例如,Choroflexus细菌(例如,C.aurantiacus)、Chloronema细菌(例如,C.gigateum))、绿色硫细菌(例如,Chlorobium细菌(例如,C.limicola)、Pelodictyon细菌(例如,P.luteolum)、紫色硫细菌(例如,Chromatium细菌(例如,C.okenii)),和紫色非硫细菌(例如,Rhodospirillum细菌(例如,R.rubrum)、Rhodobacter细菌(例如,R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如,R.vanellii))。
来自非微生物生物体的细胞可用作宿主细胞。这种细胞的例子,包括但不限于昆虫细胞(例如,果蝇(例如,D.melanogaster)、Spodoptera(例如,S.frugiperda Sf9或Sf21细胞)和Trichoplusa(例如,High-Five细胞);线虫细胞(例如,C.elegans细胞);鸟类细胞;两栖类细胞(例如,非洲爪哇细胞);爬虫类细胞;和哺乳动物细胞(例如,NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑素瘤和HeLa细胞)。
适合用作本发明宿主细胞的微生物或细胞是可商购的。
真核细胞具有至少两个独立的路径(一个经同源重组(HR)和一个经非同源重组(NHR)),通过其核酸(特别是DNA)可整合进宿主基因组。酵母Saccharomyces cerevisiae是偏好同源重组(HR)的生物体。该生物体非同源重组与同源重组(NHR/HR)的比可从约0.07至0.007变化。
WO02/052026公开了具有提高的靶向DNA序列进入其基因组的效率的S.cerevisiae的突变体。这种突变体菌株缺少参与NHR的基因(KU70)。
与S.cerevisiae相反,大部分高级真核生物,比如丝状真菌细胞至哺乳动物细胞偏好NHR。丝状真菌中,NHR/HR比的范围在1和大于100之间。在这种生物体中,靶向整合频率相当低。
因此,为了改进在靶基因座处的多核苷酸组装的效率,优选地根据本发明方法中的宿主细胞中的同源重组(HR)的效率被提高。
因此,优选地,在根据本发明的方法中,优选地宿主细胞的同源重组(HR)效率提高,这优选地以诱导型方式进行。因为NHR和HR通路是互联的,可通过调制一个或两个通路增加HR的效率。HR组件表达的增加将提高HR的效率并且减小NHR/HR的比。NHR组件的表达的减少也将减小NHR/HR的比。根据本发明的载体-宿主系统的宿主细胞中HR效率的增加优选地描绘为NHR/HR比减小并且优选地相对于其中HR和/或NHR通路未经调控的亲本宿主细胞计算。可通过本领域技术人员可用的各种方法测量HR和NHR二者的效率。优选的方法包括测定单载体构建体在亲本和经调控的宿主细胞二者中靶向整合和异位整合的效率。可然后为两个细胞类型计算NHR/HR比。随后,可计算NHR/HR比的减小值。WO2005/095624中,广泛描述了该优选的方法。
通过提高HR通路的效率和/或通过降低NHR通路的效率,修饰亲本真核细胞,获得与亲本细胞相比具有降低的NHR/HR比的宿主细胞。优选地,NHR/HR比因而减小至少两倍,优选地至少4倍,更优选地至少10倍。优选地,与亲本宿主细胞相比,根据本发明的载体-宿主系统的宿主细胞中的NHR/HR比降低至少5%,更优选地至少10%,甚至更优选地至少20%,甚至更优选地至少30%,甚至更优选地至少40%,甚至更优选地至少50%,甚至更优选地至少60%,甚至更优选地至少70%,甚至更优选地至少80%,甚至更优选地至少90%和最优选地至少100%。
根据一种实施方式,通过提高HR组件的表达水平减少NHR/HR比。HR组件是本领域技术人员熟知的。“HR组件”在本文被定义为,参与控制多核苷酸进入宿主基因组的靶向整合的所有基因和元件,所述多核苷酸与整合靶向的宿主基因组的某预定位点具有一定同源性。
通过降低NHR组件的表达水平可减小NHR/HR比。“NHR组件”本文定义为,参与控制多核苷酸整合进入宿主基因组的所有基因和元件,而不管所述多核苷酸与宿主基因组序列的同源程度。NHR组件是本领域技术人员熟知的。优选的NHR组件是选自由用于参与NHR通路的酵母基因的根据本发明的载体-宿主系统的宿主细胞同系物或直向同源物组成的下述组的组分:KU70、KU80、RAD50、MRE11、XRS2、LIG4、LIF1、NEJ1和SIR4(van den Bosch等,2002,Biol.Chem.383:873-892和Allen等,2003,Mol.Cancer Res.1:913-920)。最优选的是KU70、KU80和LIG4之一以及KU70和KU80二者。可使用如本文描述的用于获得必需基因的缺乏的方法实现NHR组件表达水平降低。
因为可能地降低参与NHR组件的表达可产生不利的表型效果,优选地在根据本发明的载体-宿主系统的宿主细胞中,同源重组效率的提高是诱导型的。这可通过本领域技术人员已知的方法,例如通过使用NHR组件诱导型方法(例如通过将NHR组件布置在诱导型启动子之后)或通过使用NHR组件的瞬时破坏,或通过将编码NHR组件的基因放回基因组来实现。
本发明也涉及制备组装的多核苷酸的文库的方法,该方法包括:
-制备如本文描述的宿主细胞文库;和
-从宿主细胞文库回收组装的核酸,
从而制备组装的多核苷酸的文库。
本发明也提供可从这种文库获得的组装的多核苷酸。可使用任何合适的方式,例如使用溶胞作用,和任选地,本领域技术人员熟知的核酸纯化程序或用商购的细胞裂解和DNA纯化试剂和试剂盒,从宿主细胞分离组装的核苷酸序列。组装的多核苷酸序列可便利地通过扩增,比如PCR回收。回收可仅仅涉及溶胞作用,使得组装的核酸制备物为天然细胞制备物形式。
典型地,这种制备物可接着用于制备宿主细胞的进一步文库-也就是说,天然制备物可用于将组装的核酸引入宿主细胞的进一步环境(例如与用于产生第一文库的宿主细胞不同种类的宿主细胞)。组装的多核苷酸可包含额外的序列,使得可与其他宿主细胞中的靶基因座进行同源重组。
但是,组装的核酸可从样品(例如,从感兴趣的生物体或包含多个感兴趣的生物体的培养物,如酵母或细菌)中提取、分离、纯化或扩增。
如本文所使用的,术语“分离的”指核酸从其最初环境(例如,如果其是天然存在的,是天然环境,或如果是外源表达的,是宿主细胞)去除的核酸,并且因此“通过人工”从最初环境中改变。
一般以比来源样品中存在的组分量更少的非核酸组分(例如,蛋白质、脂质),提供分离的核酸。包含分离的样品核酸的组合物可基本上被分离(例如,大约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%的没有非核酸组分)。如本文所使用的,术语“纯化的”指所述提供的样品核酸,所述样品核酸比该样品核酸所源自的样品来源中的核酸包含更少核酸种类。包含样品核酸的组合物可基本上是纯化的(例如,大约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%的没有其他核酸种类)。这样可制备核酸文库。
本发明进一步提供制备具有期望性质的宿主细胞的方法,该方法包括:
-制备如本文描述的宿主细胞文库;和
-筛选所述宿主细胞文库,
从而鉴定具有期望性质的宿主细胞。
而且,本发明提供制备具有期望性质的宿主细胞的方法,该方法包括:
-制备如本文描述的组装的多核苷酸的文库;
-将所述文库转移至宿主细胞;和
-筛选所得宿主细胞,
从而鉴定具有期望性质的宿主细胞。
在这些方法中,在已经构建根据本发明的文库之后,可选择包含文库中组装的多肽的优化的宿主细胞。可筛选通过本发明的方法产生的初始宿主细胞文库。可选地,可根据本发明产生核酸文库并且所述核酸文库被转移进入宿主细胞中,所述宿主细胞接着被进一步筛选。
可使用任何合适的试验系统,其包括评估例如由文库种类产生的靶产物的相对的或实际量的系统。通常使用容易执行高-通量筛选的试验系统,以选择最有力地和/或有效地生产靶产物的文库种类。可在一段时间段进行试验,以测定最快生产产物的文库种类,并且鉴定生产最大产物量的文库种类。
可通过在优化靶分子产率的条件下培养宿主细胞,来筛选宿主细胞文库。一般而言,可优化的条件包括碳源的类型和量、氮源的类型和量、碳氮比、氧水平、生长温度、pH、生物质生产期的长度、靶产物积累期的长度和细胞收获时间。
其中可进行筛选试验的发酵条件可包括若干参数,包括但不限于温度、氧含量、养分含量(例如,葡萄糖含量)、pH、搅动水平(例如,每分钟的转数)、气流速度(例如,空气、氧气、氮气)、氧化还原电位、细胞密度(例如,光密度)、细胞活力等等。发酵条件的改变(例如,转换发酵条件)是一个或更多个发酵参数的改变、修饰或替换。例如,人们可通过升高或降低温度、增加或减少pH(例如,添加或去除酸、碱或二氧化碳)、增加或减少氧含量(例如,引入空气、氧、二氧化碳、氮)和/或添加或去除养分(例如,一个或更多个糖或糖的来源、生物质、维生素等等),或前述的组合,改变发酵条件。适于具体靶产品和宿主细胞的发酵条件是本领域技术人员熟知的并且使用的精确发酵条件取决于具体的靶产物和靶细胞。
本发明的方法可用于鉴定具有期望性质的宿主细胞。典型地,这将是下述性质,所述性质是相对于宿主微生物而言在经改造的微生物中被增加或改进的活性(例如,添加、增加、减少、抑制或去除的活性)。
增加的活性可能是在宿主微生物中不可检测的活性。增加的活性一般是与参考宿主细胞(例如包含与组装的多核苷酸中包括的通路相同通路的宿主细胞)相比,使用本发明选择的宿主细胞中增加的活性。
对于靶产物的生产,活性可增加至任何合适的水平,包括但不限于小于与参考宿主细胞相比,大约2倍(例如,大约10%增加至约99%增加;大约20%、30%、40%、50%、60%、70%、80%、90%增加)、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍增加,或大于大约10倍增加。
降低的或抑制的活性一般是与参考宿主细胞相比在使用本发明选择的宿主细胞中已被降低或抑制的,在宿主微生物中可检测的的活性。在一些实施方式中,活性可被降低至不可检测的水平或在某些实施方式中可被减少至可检测的水平。对于靶产物的生产,活性可减少至任何合适的水平,包括但不限于小于2倍(例如,大约10%减少至约99%减少;大约20%、30%、40%、50%、60%、70%、80%、90%减少)、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、或10倍、或大于大约10倍减少。
本发明进一步提供制备具有期望性质的宿主细胞的方法,该方法包括:
-制备如本文描述的宿主细胞文库;和
-筛选所述宿主细胞文库,
从而鉴定具有期望性质的宿主细胞。
而且,本发明提供制备具有期望性质的宿主细胞的方法,该方法包括:
-制备如本文描述的组装的多核苷酸的文库;
-将所述文库转移至宿主细胞;和
-筛选所得宿主细胞,
从而鉴定具有期望性质的宿主细胞。
本发明也提供了根据本文描述的方法制备的宿主细胞文库、核酸文库和具有期望性质的宿主细胞。本发明进一步提供获得自或衍生自这种宿主细胞的组装的核酸。因此,本发明提供了鉴定赋予细胞改进性质的组装的核酸的方法。改进的性质可以是生产期望的靶产物。
具有使用本发明的方法鉴定的期望性质的宿主细胞可接着用于生产靶产物。靶产物可在包含靶产物的培养的微生物中提供,并且培养的微生物可新鲜供应或冷冻在液体培养基中或可以是干燥的。新鲜或冷冻微生物可包含在适当的防潮容器中,如果必要的话,所述容器也可以是控温的。靶产物可在基本上无细胞的培养基中提供。在一些实施方式中,提供纯化自微生物的靶产物或修饰的靶产物,并且靶产物有时以基本上纯的形式提供。
当展示某种程度的相似性时,氨基酸或核苷酸序列被认为是同源的。同源的两条序列表示相同的进化起源。不论是密切相关还是更远相关,两条同源序列通过或高或低的“同一性百分数”或“相似度百分数”表示。尽管有争议,“同一性百分”或“相似度百分数”、“同源水平”或“同源百分数”经常交换使用。就本发明的目的而言,可使用数学算法实现两条序列之间的序列比较和同一性百分数的确定。技术人员将意识到这样的事实:数个不同的计算机程序可用于比对两条序列并在两条序列之间测定同源性(Kruskal,J.B.(1983)An overview of sequence comparison In D.Sankoffand J.B.Kruskal,(ed.),Time warps,string edits and macromolecules:thetheory and practice of sequence comparison,pp.1-44Addison Wesley)。
两个核酸或氨基酸序列之间的百分比同一性可使用用于两条序列比对的Needleman和Wunsch算法测定。(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已经在计算机程序NEEDLE中实施。就本发明的目的而言,使用来自EMBOSS包的NeeDLE程序(版本2.8.0或更高,EMBOSS:欧洲分子生物学开放软件套装(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics16,(6)276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,使用EBLOSUM62用于替换矩阵。对于核苷酸序列而言,可使用EDNAFULL。可指定其他矩阵。用于比对氨基酸序列的任选的参数是10的缺口开放罚分和0.5的缺口延伸罚分。技术人员将意识到,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两条序列的总体百分比同一性不显著改变。
同源或同一性是在包括任何缺口或延伸的全部比对区域上两条完整序列之间的相同匹配的百分数。两个比对的序列之间的同源性或同一性可如下计算:两条序列中显示相同氨基酸或核酸残基的比对中的相应位置的数目除以包括缺口的比对的总长度。本文定义的同一性可获得自NEEDLE并且在程序输出中标记为“IDENTITY”(同一性)。
两条比对的序列之间的同源性或同一性可如下计算:两条序列中显示相同氨基酸或核酸残基的比对中的对应位置的数目除以减去比对中缺口总数之后的比对的总长度。本文定义的同一性可通过使用NOBRIEF选项获得自NEEDLE并且在程序输出中标记为“longest-identity”(最长-同一性)。
也可通过在严格条件下进行的杂交试验测定序列同一性。如本文所使用的,术语“严格条件”指杂交和洗涤的条件。本领域技术人员已知严格条件并且可在Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.,6.3.1-6.3.6(1989)中找到。水性和非水性方法描述在该参考文献中并可被施用。严格杂交条件的例子是在6X氯化钠/柠檬酸钠(SSC)中大约45℃下杂交,随后在0.2×SSC、0.1%SDS中50℃下洗涤一次或更多次。严格杂交条件的另一例子是在6X氯化钠/柠檬酸钠(SSC)中大约45℃下杂交,随后在0.2X SSC、0.1%SDS中55℃下一个或更多个洗涤。严格杂交条件的其他例子是在6×氯化钠/柠檬酸钠(SSC)中大约45℃下杂交,随后在0.2×SSC、0.1%SDS中60℃下洗涤一次或更多次。通常,严格杂交条件是在6洗涤氯化钠/柠檬酸钠(SSC)中在大约45℃下杂交,随后在0.2洗涤SSC、0.1%SDS中65℃下洗涤一次或更多次。更通常地,严格条件是在0.5M磷酸钠、7%SDS中在65℃下,随后在0.2×SSC、1%SDS中在65℃下洗涤一次或更多次。
本文对作为现有技术给出的专利文档或其他材料的参考并不表示承认该文档或材料是已知的或其包含的信息是在任何权利要求的优先权日时的公知常识的一部分。
本文阐释的每篇参考文献的内容通过引用以它们的整体并入本文。
通过下列实施例进一步阐释本发明:
实施例
应当理解,尽管这些实施例表示本发明的优选的实施方式,但仅仅通过示例的方式给出。从上面的讨论和这些实施例中,本领域技术人员可获知本发明的必需特征,并且在不背离其精神和范围的情况下,可对本发明做出各种改变和修饰以使其适应各种用途和条件。因此,除了本文显示和描述的那些,从前述描述中,本发明的各种修饰对本领域技术人员是明显的。这种修饰也旨在落在所附权利要求的范围内。
实施例1
用体内核酸组装整合通路
1.1体内核酸组装的一般原则
体内核酸组装是使用S.cerevisiae的体内同源重组系统来为通路/代谢途径增加多样性的技术。其是新的手段/方法,其能够在一个步骤中实现某些代谢路径/通路的组装和优化。该技术保持需要连接的通路部分的同源性并且在必要时将多样性添加至通路。在一个转化中,制备具有多个通路变异的菌株集合。然后使该集合经历有效的筛选方法,以检测具有最佳通路变体的最佳性能菌株。在该实施例中,发明人描述所进行的实验,来说明所述方法。一般的概念也示意性地显示在图1中。
1.2制备并纯化用于转化的PCR片段
体内同源重组用于将完整的测试通路组装并整合进入Saccharomycescerevisiae CEN.PK2-1C菌株(MATa;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2)。在该实施例中,将在用于完整通路的重组的每个PCR-片段上的大概50bp的必要的同源序列,添加至用于扩增片段的引物(引物序列列举在表1中,SEQ ID NOs:1至14,转化的PCR产物列为SEQ ID NOs:15至24)。
完整整合的测试通路由重组进入基因组的7个分开的部分组成。通路边缘上的两个片段是5’和3’ADE1缺失侧翼(SEQ ID NOs:17和18),与测试通路具有重叠的同源性。这些对于经双交换将通路整合进基因组有作用。中间的5个部分是4个表达盒,标记HIS3用于在转化之后选择转化体。通路中从左(上游)向右(下游),第一部分是HIS3表达盒(用于选择),第二部分是LEU2表达盒,第三部分作为表达盒的有4种选择(赋予G418抗性的KanMX、Nat1诺尔斯菌素抗性、腐草霉素抗性和Hgm潮霉素抗性),第四部分是TRP1表达盒和第五部分是URA3表达盒。同源重组事件以示意图方式详细显示在图2中。
根据手册用Phusion聚合酶(Finnzymes)进行PCR反应。使用含有这些标记的标准质粒作为模板DNA扩增营养缺陷型(HIS3、LEU2、TRP1和URA3)和显性标记(KanMX、Nat1、腐草霉素和潮霉素)。使用分离自CenPK-1137d的染色体DNA扩增5’和3’ADE1缺失侧翼。用标准琼脂糖电泳技术检查PCR片段的大小。根据手册用来自Qiagen的PCR纯化试剂盒纯化PCR扩增的DNA片段。使用A260/A280在Nanodrop ND-1000分光光度计上测量DNA浓度。
1.3转化至S.cerevisiae
如Gietz和Woods描述的(2002;Transformation of the yeast by theLiAc/SS carrier DNA/PEG method.Methods in Enzymology350:87-96),进行S.cerevisiae的转化。用1ug的经扩增且纯化的每种PCR片段转化CEN.PK113-7D(MATa URA3HIS3LEU2TRP1MAL2-8SUC2),但例外之处是在中间部分使用的片段具有多种选择,这里使用添加至总计1ug的等量的任选片段。将转化混合物在YNB-琼脂(每升67克的DifcoTM酵母氮基w/o氨基酸、每升20克的右旋糖(Sigma)、20克的琼脂)上铺平板,所述YNB--琼脂包含每升20mg的腺嘌呤硫酸盐(Sigma)、每升20mg的L-色氨酸(FLUKA)、每升100mg的L-亮氨酸(Fluka)、每毫升50mg的尿嘧啶(Sigma)。在30℃下孵育数天之后,平板上出现菌落,而阴性对照(即,转化实验中没有添加DNA)产生空白平板。大部分菌落(大约80%-90%)显示红色表型,这表示在指定ADE1基因座处的成功整合。
1.4转化体的分析
通过将转化体影印接种(replica plating)至对通路的显性标记有选择性的平板,将转化平板用于进一步分析。为了显示片段在通路的第三部分中的分布,将转化体影印接种至G418、诺尔斯菌素、腐草霉素和潮霉素选择性平板。YEPD-琼脂(蛋白胨10.0g/l、酵母提取物10.0g/l、氯化钠5.0g/l、琼脂15.0g/l和2%葡萄糖)平板用于影印接种,将特定抗生素添加至平板,所述抗生素是G418(100μg/ml)或诺尔斯菌素(100μg/ml)或腐草霉素(15μg/ml)或潮霉素B(200μg/ml)。平板在30℃下孵育2-3天,对菌落计数并且检查它们在平板之一上的生长。
结果显示转化体中抗性标记的分布,大约24%能够在G418选择性平板上生长并且因此含有KanMX标记,大约14%能够在诺尔斯菌素选择性平板上生长并且因此含有Nat1标记,31%能够在腐草霉素选择性平板上生长并且因此含有腐草霉素标记和23%能够在潮霉素选择性平板上生长并且因此含有潮霉素抗性标记。剩余8%不能在所有平板上生长,从中发明人得出结论它们未正确整合通路。
1.5染色体DNA分离
将酵母细胞在旋转摇床中于包含2%葡萄糖的YEP-培养基中(在30℃和280rpm下过夜)生长。将1.5ml的这些培养物转移至Eppendorf管并且以最大速度离心1分钟。轻轻倒出上清液并且将球团再悬浮在200μl的YCPS(10mM Tris.HCl pH7.5中的0.1%SB3-14(Sigma Aldrich,荷兰);1mM EDTA)和1μl核糖核酸酶(RNase,来自牛胰腺的20mg/ml核糖核酸酶A,Sigma,荷兰)中。在65℃下将细胞悬液孵育10分钟。将悬液在Eppendorf离心机中以7000rpm离心1分钟。丢弃上清液。将球团小心地溶解在200μl CLS(25mM EDTA,2%SDS)和1μl核糖核酸酶A中。在65℃下孵育10分钟之后,在冰上冷却悬液。在添加70μl PPS(10M醋酸铵)之后,在Vortex混合器中彻底混合溶液。在离心(在以最大速度运行的Eppendorf离心机中5分钟)之后,上清液与200μl冰冷的异丙醇混合。DNA容易沉淀并且通过离心(5分钟,最大速度)产生球团。用400μl冰冷的70%乙醇洗涤球团。在室温下干燥球团并且溶解在50μl TE(10mM Tris.HCl pH7.5,1mM EDTA)中。
表1:用于扩增转化使用的片段的引物序列
实施例2
使用体内核酸组装来构建并找到改进的生产衣康酸的酵母菌株
2.1制备和纯化用于转化的PCR片段
用如实施例1中描述的方法,使用体内同源重组来将衣康酸通路变体组装并整合进Saccharomyces cerevisiae CEN.PK113-7D(MATa URA3HIS3LEU2TRP1MAL2-8SUC2)菌株。在本设计中,通过重组的9个分开的DNA片段形成衣康酸通路,并将衣康酸通路整合进基因组。在该实施例中,通过PCR扩增制备每个部分并且用于完整通路重组的每个PCR-片段之间的必要的同源序列是在每个片段侧翼的独特的50-bp序列。重组的衣康酸通路构建体的第一个和最后一个片段是给基因组基因座提供同源性的整合侧翼,在所述基因座中,设计通路以整合进基因组中。整合侧翼具有各自连接通路片段的第一片段内的50-bp同源序列;外侧序列是用于将侧翼整合进基因组的同源序列。中间部分的7个片段是表达盒(启动子、开放阅读框、终止子),7个中的6个是所设计的衣康酸通路变体中的推定功能性元件,7个中的一个是用于G418抗性的KanMX标记盒。扩增所设计的盒和整合侧翼的引物列为SEQ ID NOs:25至42。用于形成通路变体的表达盒(启动子、开放阅读框和终止子)的序列列为SEQ ID NOs:43至54。
通路边缘上的整合侧翼的功能作用是改进经双交换将通路整合进入基因组的效率。下面从左(上游)向右(下游)描述通路的中间部分的7个部分。左侧整合侧翼之后的第一部分是含有表达衣康酸转运蛋白Q0C8L2的S.cerevisiae ACT1启动子和S.cerevisiae ADH1终止子的盒117。第二部分是标记盒KanMX,用于在含G418的平板上选择转化体。第三部分具有2种整合选择:盒120,其含有表达mCAD3ORF(开放阅读框)的S.cerevisiae TDH3启动子、具有S.cerevisiae TDH1终止子;或盒121,其含有相同启动子和终止子但是表达mCAD2。对于通路中的第四部分有4种整合进入基因组的选择:盒133(表达ACO1ORF的S.cerevisiae FBA1启动子和S.cerevisiae GPM1终止子)、盒135(表达ACO3ORF的S.cerevisiae FBA1启动子和S.cerevisiae GPM1终止子)、盒144(表达ACO1的S.cerevisiae PRE3启动子和S.cerevisiae GPM1终止子)或盒146(表达ACO3的S.cerevisiae PRE3启动子和S.cerevisiae GPM1终止子)。这四种选择产生启动子强度的改变:FBA1启动子更强和PRE3更弱;并产生表达基因ACO1或ACO3的改变。第五部分是盒136(表达ORFPYC2的S.cerevisiae PGK1启动子和S.cerevisiae TPI1终止子)。对于第六部分,有2种选择:盒137(表达S.cerevisiae ORF CIT1的S.cerevisiaeTEF1启动子和S.cerevisiae PDC1终止子)或盒139(表达CIT1E.coli变体的S.cerevisiae TEF1启动子和S.cerevisiae PDC1终止子)。第七部分是盒140(表达ACDH67的S.cerevisiae ENO2启动子和S.cerevisiae TAL1终止子)。
理论上总共可从盒的该文库中形成2×4×2=16个不同的通路变体。同源重组事件可能产生16个不同的通路变体并且以示意图方式显示在图3中。
根据手册用Phusion聚合酶(Finnzymes)进行PCR反应以扩增DNA片段。使用含有片段的标准质粒作为模板DNA,扩增表达盒和显性标记KanMX。使用CEN.PK113-7D基因组DNA作为模板,通过PCR扩增来扩增5’和3’INT1缺失侧翼。用标准琼脂糖电泳技术检查PCR片段的大小。用Macherey-Nagel的96PCR磁珠试剂盒,根据手册纯化PCR扩增的DNA片段。使用GC biotech的Trinean96测量DNA浓度。
2.2转化至S.cerevisiae
根据Gietz和Woods(2002;Transformation of the yeast by the LiAc/SScarrier DNA/PEG method.Methods in Enzymology350:87-96)进行S.cerevisiae的转化。用400ng经扩增和纯化的每种PCR片段转化CEN.PK113-7D(MATa URA3HIS3LEU2TRP1MAL2-8SUC2),但例外之处是所使用的片段具有多种选择;对于文库片段,使用添加至总计400ng的等量的任选片段。将转化混合物在含G418(400μg/ml)的YEPhD-琼脂上(BBL Phytone蛋白胨20.0g/l,酵母提取物10.0g/l、氯化钠5.0g/l、琼脂15.0g/l和2%葡萄糖)铺平板。在30℃下孵育3天之后,平板上出现菌落,而阴性对照(即,转化实验中没有添加DNA)产生空白平板。
2.3用于衣康酸生产的MTP生长实验
挑取单菌落并且转移至包含含有400μg/ml G418的200μl YEPhD-琼脂的MTP琼脂孔。在30℃下平板孵育3天之后,通过用针工具转移在有标准盖的MTP板中的含在具有4%半乳糖的每孔200μL Verduyn培养基(Verduyn等,Yeast8:501-517,1992,其中(NH4)2SO4替换为2g/l尿素)中的一些菌落材料,来接种良好生长的菌落。在MTP摇瓶(INFORSHT Multitron)中在30℃下,550rpm和80%湿度下孵育MTP72小时。在该预培养阶段之后,通过将80μl的发酵液转移至含8%半乳糖的2.5mlVerduyn培养基(再次用尿素替换(NH4、)2SO4),开始生产期。在550rpm、30℃和80%湿度下的摇瓶中生长3天之后,以2750rpm在HeraeusMultifuge4中对平板离心10分钟。将上清液转移至MTP平板并且使用LC-MS方法测量上清液中的衣康酸水平。
2.4使用LC-MS的衣康酸分析
UPLC-MS/MS分析方法用于测定衣康酸。用梯度洗脱,Waters HSST3柱1.7μm,100mm*2.1mm用于将衣康酸与其他化合物分离。洗脱液A由包含0.1%甲酸的LC/MS级水组成,洗脱液B由包含0.1%甲酸的乙腈组成。流速是0.35ml/min,柱温度保持恒定在40℃。梯度开始于95%A,并且在10分钟内线性增加至30%B,保持30%B2分钟,然后立即变成95%A并且稳定5分钟。使用的注入体积是2ul。使用多反应监视(MRM),Waters Xevo API用于处于负离子化模式的电喷雾(ESI)。离子源温度保持在130℃,而去溶剂化温度是350℃,流速为500L/hr。
对于衣康酸,脱质子的分子用10eV片段化,导致特定片段丢失H2O和CO2。分析掺杂在空白发酵液中的参考化合物的标准物,以确认保留时间,计算各自离子的响应因子,并且用于计算发酵样品的浓度。在洗脱液A中适当稀释所有样品(5-100倍),以克服LC-MS分析期间的离子抑制和基质作用。用连接LTQ orbitrap(ThermoFisher)的如上所述的相同色谱系统,进行衣康酸的精确质量分析,以通过精确质量分析确认所分析化合物的元素组成。以恒速灌输模式,使用NaTFA混合物(ref)进行质量校准,以这种方式,在实验设定期间,所分析的精确质量可落在所分析的化合物的理论质量的2ppm内。
2.5衣康酸发酵实验的结果
表2显示在具有G418的MTP板上良好生长的菌株的衣康酸生产水平。衣康酸生产水平清楚地显示显著变化。完整设置用于用PCR的进一步表征;结果也显示在表2中。PCR反应用于测定哪个盒整合在菌株中。应用该数据来了解,生产水平和用于下述片段的通路中引入的盒变体之间的相关性,所述片段中引入变异。段落1.6和1.7描述染色体DNA分离和PCR的实验步骤。
2.6用YeaStar基因组DNA试剂盒 TM (ZYMO Research)分离染 色体DNA
在包含1ml YephD(2%葡萄糖)的24孔板中接种菌株并且在摇瓶中在30℃,550rpm和80%湿度下开始(ON)孵育。用Biochrom Ultrospec2000分光光度计测量OD660,以获得如试剂盒的手册中描述的正确量的细胞(1-5x107细胞)。如YeaStar基因组DNA试剂盒TM的手册中的方案II描述的进行分离。分离之后,用Nanodrop ND-1000(Thermo Scientific)检查DNA浓度,浓度是较低的为10ng/μl的量级,但是足够适用于PCR目的。
2.7衣康酸生产菌株中衣康酸盒变异的PCR和遗传表征
用Phusion聚合酶进行所有PCR反应,并根据手册设置所有PCR反应。在每个PCR反应中使用大概20至50ηg的染色体DNA作为模板。在每个个体引物的反应中使用0.2μM的引物浓度。分离自CEN.PK113-7D而没有特定盒的染色体DNA用作每个反应的阴性对照,表2中记为“neg”。最初盒或包含盒的菌株用作反应的阳性对照,表2中记为“pos”。用列为“SEQ ID NO:57”、“SEQ ID NO:58”和“SEQ ID NO:59”的引物进行表2中列出的菌株的第一个系列的PCR反应。这些PCR反应用于测定一个PCR反应中盒139或盒137的存在。引物SEQ ID NO:57是特异性针对盒137的并且用引物“SEQ ID NO:58”形成333bp的PCR产物。SEQ ID NO:58的引物是特异性针对盒139的并且用引物“SEQ ID NO:59”形成548bp的PCR产物。用引物的组合设置PCR反应并且在标准O.8%琼脂糖凝胶上的PCR分析显示仅仅盒139出现在菌株组中。图4显示来自凝胶上PCR反应分析的结果。该PCR反应称为PCR反应1并且每种条带的数量用来鉴定每种菌株并且与总结所有PCR和衣康酸产量的结果的表2中的数值相关。
用列出为“SEQ ID NO:60”、“SEQ ID NO:61”、“SEQ ID NO:62”和“SEQ ID NO:63”的引物进行列在表2中的每个菌株的第二个系列的PCR反应。这些PCR反应用于测定在一个PCR反应中是否存在盒133、盒135、盒144或盒146。SEQ ID NO:60与SEQ ID NO:63的引物组合是特异性针对盒133的并且形成577bp的PCR产物。SEQ ID NO:60与SEQID NO:61的引物组合是特异针对盒135的并且形成259bp的PCR产物。SEQ ID NO:61与SEQ ID NO:62的引物组合是特异针对盒146的并且形成430bp的PCR产物。SEQ ID NO:61与SEQ ID NO:63的引物组合是特异针对盒144的并且形成748bp的PCR产物。当所有引物的组合用在反应中时,标准0.8%琼脂糖凝胶上所分析的所得PCR产品显示盒133和盒144出现在菌株组中。图4和5显示来自凝胶上PCR反应的分析结果。该PCR反应被称为“PCR反应2”,每种条带的数量用于鉴定每种菌株并且与总结所有PCR和衣康酸产量的结果的表2中的数值相关。
用列为SEQ ID NO:55和SEQ ID NO:56的引物进行列在结果表中的菌株的最后系列的PCR反应。这些PCR反应用于测定PCR反应中是否存在盒120或盒121。引物都是特异性针对两个盒的并且形成881bp的PCR产物。当引物的组合用在反应中时,在标准0.8%琼脂糖凝胶上所分析的所得PCR产品显示所有菌株含有盒120或盒121。图6显示来自凝胶上PCR反应的分析结果。该PCR反应称为“PCR反应3”并且每种条带的数量用来鉴定每种菌株并且与总结所有PCR和衣康酸产量的结果的表2中的数值相关。
为了测定哪个盒整合在菌株中,限制酶EcoRV用于切割获得的PCR片段。盒121的序列含有EcoRV位点而盒120不包含EcoRV识别位点。用EcoRV切割盒121的PCR产物产生大小584bp的片段和大小297bp的片段,当用EcoRV孵育时,盒120的PCR产物仍保持相同大小。
将来自含有每个菌株PCR产物的5μl PCR反应混合物与2μl缓冲React2(Invitrogen)、12μl milliQ和1μl EcoRV(1000单位/μl,来自Invitrogen)组合。在37℃下孵育RE消化物2小时并且随后在标准0.8%琼脂糖凝胶上的分析,显示菌株含有如表2中所示的盒120或盒121。图6和7显示在凝胶上分析的用EcoRV切割的PCR反应的结果。这称为“EcoRV切割之后的PCR反应3”并且每种条带的数量用于鉴定每种菌株和对照,并且与总结所有PCR、用EcoRV切割的进一步遗传分析和衣康酸产量的结果的表2中的数值相关。
表2:衣康酸生产菌株的概括和引入的通路片段的特征。观察到 mCAD2和高衣康酸生产清楚的正相关。下文给出进一步的细节。
表2中提供16种生产菌株的引入的衣康酸的遗传特征。在该设置中,我们发现含有CAS139、CAS143、CAS144、CAS121和CAS120的菌株。未检测到盒CAS137、CAS135和CAS146。
衣康酸产量和盒120或盒121的存在之间有相互关系。具有盒121(mCAD2)的菌株清楚地显示显著更高的衣康酸生产并且在所测试的衣康酸生产菌株的前6个中是显性的。基于在该实验中观察到的衣康酸产量,不能区分盒133和盒144的偏好。没有观察到CAS135和CAS146,这表示与各自基因相关的启动子太弱或太强,难以导致衣康酸的合理生产,或导致无活力的或没有良好生长的细胞。没有观察到盒137。总体上,用该实施例我们已经显示使用“体内核酸组装”方法,来使用片段的混合物用单次转化产生组合的菌株多样性,这导致具有不同生产水平的一组衣康酸生产菌株。引入的通路片段的基因组特征,显示该方法可应用于选择具有不同操作序列的可选的通路基因和/或盒,例如转录强度不同的启动子序列。该方法可用于通路调谐和选择改进菌株,和随后去除贡献序列。

Claims (37)

1.制备宿主细胞文库的方法,其中多个所述宿主细胞包含在靶基因座处的组装的多核苷酸,所述方法包括:
(a)提供包含两个或更多个多核苷酸亚组的多个多核苷酸,其中:
(i)每个多核苷酸亚组中的多个多核苷酸包含编码肽或多肽的序列和/或调节序列;
(ii)每个多核苷酸亚组编码的多个肽或多肽,或每个多核苷酸亚组中包含的多个调节序列共享活性和/或功能;
(iii)至少一个多核苷酸亚组包含至少两个不同的多核苷酸种类;
(iv)每个多核苷酸亚组的多个多核苷酸包含能够与来自一个或更多个其他多核苷酸亚组的多个多核苷酸同源重组的序列;和
(v)两个多核苷酸亚组中的多个多核苷酸包含能够与宿主细胞中的靶基因座同源重组的核苷酸序列;和
(b)通过在宿主细胞中体内进行同源重组在所述靶基因座处组装所述多个多核苷酸,
从而产生宿主细胞文库,所述多个宿主细胞文库包含在所述靶基因座处组装的多核苷酸。
2.根据权利要求1所述的方法,其中有至少约四个多核苷酸亚组。
3.根据权利要求1或2所述的方法,其中有约20个或更少的多核苷酸亚组。
4.根据前述权利要求任一项所述的方法,其中在(v)中,所述两个多核苷酸亚组之一中的多个多核苷酸能够与所述靶基因座的5’序列同源重组并且所述两个多核苷酸亚组中另一个亚组的多个多核苷酸能够与所述靶基因座的3’序列同源重组。
5.根据前述权利要求任一项所述的方法,其中至少一个多核苷酸亚组中的多个多核苷酸包含编码标记基因的序列,所述序列有或没有(一条或多条)调节序列。
6.根据前述权利要求任一项所述的方法,其中至少两个多核苷酸亚组中的至少两个多核苷酸是不同的。
7.根据前述权利要求任一项所述的方法,其中除了包含能够与靶基因座同源重组的序列的所述两个多核苷酸亚组和包含编码标记基因的序列的任何多核苷酸亚组之外,所有多核苷酸亚组中的至少两个多核苷酸是不同的。
8.根据前述权利要求任一项所述的方法,其中文库中至少约50%的宿主细胞在一个或更多个靶基因座处具有至少一个组装的多核苷酸。
9.根据前述权利要求任一项所述的方法,其中所述文库中至少约70%的所述宿主细胞具有至少一个组装的多核苷酸,所述组装的多核苷酸包含来自每个多核苷酸亚组的一个多核苷酸。
10.根据前述权利要求任一项所述的方法,其中所述宿主细胞文库包括至少约1000个不同的组装的多核苷酸。
11.根据前述权利要求任一项所述的方法,其中至少一个组装的多核苷酸包含生物通路的每个成员。
12.根据权利要求11所述的方法,其中所述生物通路确保在宿主细胞中生产感兴趣的化合物。
13.根据权利要求12所述的方法,其中所述感兴趣的化合物是初级代谢产物、二级代谢产物、多肽或多肽的混合物。
14.根据前述权利要求任一项所述的方法,其中所述至少一个多核苷酸亚组编码多肽的变体和/或包括调节序列的变体。
15.根据权利要求14所述的方法,其中所述变体包含基因簇的成员。
16.根据权利要求14或15所述的方法,其中所述变体是等位基因或多肽或调节序列的种类变体。
17.根据权利要求14至16任一项所述的方法,其中所述变体是人工变体。
18.根据权利要求14至17任一项所述的方法,其中所述变体彼此都共享至少约50%的序列同一性。
19.根据前述权利要求任一项所述的方法,其中亚组中的编码多肽的多个多核苷酸与启动子可操作地连接。
20.根据权利要求19所述的方法,其中亚组中多个多核苷酸的每一个与一个启动子可操作地连接并且其中所述亚组包含至少两个不同的启动子。
21.根据前述权利要求任一项所述的方法,其中包含两个或更多个多核苷酸亚组的所述多个多核苷酸的每一个的长度是从约50bp至约10kbp。
22.根据前述权利要求任一项所述的方法,其中确保同源重组的所述序列的长度是从20bp至5kb。
23.根据前述权利要求任一项所述的方法,其中所述靶基因座是宿主细胞基因组中的基因座。
24.根据权利要求1至22任一项所述的方法,其中所述靶基因座是染色体外靶基因座。
25.根据权利要求24所述的方法,其中所述染色体外靶基因座是质粒或人工染色体。
26.根据前述权利要求任一项所述的方法,其中所述宿主细胞是原核或真核细胞。
27.根据权利要求26所述的方法,其中所述原核细胞是细菌细胞。
28.根据权利要求26所述的方法,其中所述真核宿主细胞是真菌细胞、酵母细胞、哺乳动物细胞或昆虫细胞。
29.根据权利要求28所述的方法,其中所述酵母细胞是S.cerevisiae细胞。
30.制备组装的多核苷酸的文库的方法,所述方法包括:
-根据权利要求1至29任一项所述的方法制备宿主细胞文库;和
-从所述宿主细胞文库回收所述组装的多核苷酸,
从而制备组装的多核苷酸的文库。
31.鉴定具有期望性质的宿主细胞的方法,所述方法包括:
-根据权利要求1至29任一项所述的方法制备宿主细胞文库;和
-筛选所述宿主细胞文库,
从而鉴定具有所述期望性质的宿主细胞。
32.制备具有期望性质的宿主细胞的方法,所述方法包括:
-根据权利要求30制备组装的多核苷酸的文库;
-将所述文库转移至宿主细胞;和
-筛选所得宿主细胞,
从而鉴定具有期望性质的宿主细胞。
33.根据权利要求1至29任一项所述的方法制备的宿主细胞文库。
34.根据权利要求30所述的方法制备的组装的多核苷酸的文库。
35.根据权利要求31或32所述方法制备的具有期望性质的宿主细胞。
36.得自根据权利要求34的文库或根据权利要求35的宿主细胞的组装的核酸。
37.表达筛选丝状真菌转化体的方法,其包括:
(a)分离根据权利要求1至29任一项所述的方法制备的酵母宿主细胞文库的单菌落转化体;
(b)从酵母转化体的所述单菌落制备DNA;
(c)将步骤(b)的制备物样品引入丝状真菌原生质体的分开的悬液中以获得其转化体,其中转化体含有来自所述酵母宿主细胞文库的一个或更多个拷贝的个体多核苷酸;
(d)使步骤(c)的所述个体丝状真菌转化体在选择性生长培养基上生长,从而允许所述丝状真菌转化体生长,同时抑制未转化的丝状真菌的生长:和
(e)测量由所述个体多核苷酸编码的每种多肽的活性或性质。
CN201280057858.0A 2011-11-23 2012-11-23 核酸组装系统 Pending CN103975063A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161563146P 2011-11-23 2011-11-23
US61/563,146 2011-11-23
EP11190372.0 2011-11-23
EP11190372 2011-11-23
PCT/EP2012/073532 WO2013076280A1 (en) 2011-11-23 2012-11-23 Nucleic acid assembly system

Publications (1)

Publication Number Publication Date
CN103975063A true CN103975063A (zh) 2014-08-06

Family

ID=48469164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280057858.0A Pending CN103975063A (zh) 2011-11-23 2012-11-23 核酸组装系统

Country Status (4)

Country Link
US (1) US20140303036A1 (zh)
EP (1) EP2783000A1 (zh)
CN (1) CN103975063A (zh)
WO (1) WO2013076280A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111440827A (zh) * 2020-05-22 2020-07-24 苏州泓迅生物科技股份有限公司 一种信息存储介质、信息存储方法及应用

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748226A (zh) 2011-08-24 2014-04-23 诺维信股份有限公司 获得丝状真菌宿主细胞的阳性转化体的方法
EP2748322A2 (en) 2011-08-24 2014-07-02 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
US9140965B2 (en) 2011-11-22 2015-09-22 Cubic Corporation Immersive projection system
DK2898076T3 (en) 2012-09-19 2018-06-14 Dsm Ip Assets Bv METHOD OF CELL MODIFICATION USING ESSENTIAL GENES AS MARKERS AND EVEN RECYCLING THESE
WO2015181310A2 (en) * 2014-05-28 2015-12-03 Dsm Ip Assets B.V. Itaconic acid and itaconate methylester and dimethylester production
WO2016110453A1 (en) * 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
US10604743B2 (en) 2015-03-16 2020-03-31 Dsm Ip Assets B.V. UDP-glycosyltransferases
US11344051B2 (en) 2015-04-03 2022-05-31 Dsm Ip Assets B.V. Steviol glycosides
CA2993744A1 (en) 2015-08-13 2017-02-16 Dsm Ip Assets B.V. Steviol glycoside transport
GB201516348D0 (en) 2015-09-15 2015-10-28 Labgenius Ltd Compositions and methods for polynucleotide assembly
EP4043558A3 (en) 2015-10-05 2022-11-16 DSM IP Assets B.V. Kaurenoic acid hydroxylases
US10787649B2 (en) 2016-07-13 2020-09-29 Dsm Ip Assets B.V. Malate dehyrogenases
AU2017350309A1 (en) 2016-10-27 2019-05-02 Dsm Ip Assets B.V. Geranylgeranyl pyrophosphate synthases
EP3551751A1 (en) 2016-12-08 2019-10-16 DSM IP Assets B.V. Kaurenoic acid hydroxylases
EP4155400A1 (en) 2017-06-27 2023-03-29 DSM IP Assets B.V. Udp-glycosyltransferases
WO2023028521A1 (en) * 2021-08-24 2023-03-02 Inscripta, Inc. Genome-wide rationally-designed mutations leading to enhanced cellobiohydrolase i production in s. cerevisiae

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011011292A2 (en) * 2009-07-20 2011-01-27 Verdezyne, Inc. Combinatorial methods for optimizing engineered microorganism function

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1217074A1 (en) 2000-12-22 2002-06-26 Universiteit Leiden Nucleic acid integration in eukaryotes
EP2172557B1 (en) 2004-04-02 2018-03-14 DSM IP Assets B.V. Filamentous fungal mutants with improved homologous recombination efficiency
MX2010003644A (es) * 2007-10-08 2010-06-23 Synthetic Genomics Inc Ensamble de acidos nucleicos grandes.
PL2478100T3 (pl) * 2010-04-09 2014-04-30 Eviagenics S A Sposoby wytwarzania mozaik genowych
WO2012045088A2 (en) * 2010-10-01 2012-04-05 The Board Of Trustees Of The University Of Illinois Combinatorial design of highly efficient heterologous pathways

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011011292A2 (en) * 2009-07-20 2011-01-27 Verdezyne, Inc. Combinatorial methods for optimizing engineered microorganism function

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CALIN C.GUET ET AL.: "Combinatorial Synthesis of Genetic Networks", 《SCIENCE》, vol. 296, no. 5572, 24 May 2002 (2002-05-24), pages 1466 - 1470, XP002679260 *
STEPHEN PICATAGGIO: "Potential impact of synthetic biology on the development of microbial systems for the production of renewable fuels and chemicals", 《CURRENT OPINION IN BIOTECHNOLOGY》, vol. 19, 27 May 2009 (2009-05-27), pages 325 - 329 *
ZENGYI SHAO ET AL.: "DNA assembler, an in vivo genetic method for rapid construction of biochemical pathways", 《NUCLEIC ACIDS RESEARCH》, vol. 37, no. 2, 12 December 2008 (2008-12-12), pages 16 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111440827A (zh) * 2020-05-22 2020-07-24 苏州泓迅生物科技股份有限公司 一种信息存储介质、信息存储方法及应用

Also Published As

Publication number Publication date
WO2013076280A1 (en) 2013-05-30
EP2783000A1 (en) 2014-10-01
US20140303036A1 (en) 2014-10-09

Similar Documents

Publication Publication Date Title
CN103975063A (zh) 核酸组装系统
US10865407B2 (en) Cloning method
US20220162647A1 (en) Method for inducing targeted meiotic recombinations
EP3491130B1 (en) An assembly system for a eukaryotic cell
US11913014B2 (en) S. pyogenes Cas9 mutant genes and polypeptides encoded by same
CN107849562A (zh) 基因组编辑系统及使用方法
AU2002227882B2 (en) Concatemers of differentially expressed multiple genes
Zhang et al. Self-excising Cre/mutant lox marker recycling system for multiple gene integrations and consecutive gene deletions in Aspergillus oryzae
Gao et al. A versatile system for fast screening and isolation of Trichoderma reesei cellulase hyperproducers based on DsRed and fluorescence-assisted cell sorting
CN110268057B (zh) 用于鉴定和表达基因簇的系统和方法
CN108064267A (zh) 真菌菌株及使用方法
CN104838003A (zh) Rasamsonia转化体
ES2328011T3 (es) Selecion de alto rendimiento de bibliotecas de adn expresadas en hongos filamentosos.
CA3177793A1 (fr) Utilisation d'une proteine de fusion pour induire des modifications genetiques par recombinaison meiotique ciblee
WO2001025468A1 (en) High-throughput screening of expressed dna libraries in filamentous fungi
US20220267783A1 (en) Filamentous fungal expression system
US20230348900A1 (en) High-throughput methods for the detection of ectopic integration of transforming dna
Jørgensen Unraveling the secondary metabolism of the biotechnological important filamentous fungus Trichoderma reesei (Teleomorph Hypocrea jecorina)
Hu et al. Construction of RNA silencing system of Penicillium brevicompactum and genetic manipulation of the regulator pbpcz in mycophenolic acid production
EP3225686B1 (en) Novel homing endonuclease derived from arabidopsis thaliana
Mitrovic et al. Discovery of fungal enzymes and pathways
CN103764828A (zh) 代谢进化方法
Shenouda et al. Heterologous Expression of Secondary Metabolite Genes in Trichoderma reesei for Waste Valorization. J. Fungi 2022, 8, 355
FR3032203A1 (fr) Procede pour induire des recombinaisons meiotiques ciblees

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140806

WD01 Invention patent application deemed withdrawn after publication