CN104204205A

CN104204205A - 克隆方法

Info

Publication number: CN104204205A
Application number: CN201380017487.8A
Authority: CN
Inventors: 约翰尼斯·安德列什·劳博斯; 赫尔曼·扬·佩尔; 伯纳德·迈瑞克
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2012-03-27
Filing date: 2013-03-27
Publication date: 2014-12-10
Anticipated expiration: 2033-03-27
Also published as: US10865407B2; US9738890B2; CN104204205B; WO2013144257A1; EP2831238B1; US20150050696A1; DK2831238T3; EP2831238A1; US20170314011A1

Abstract

本发明涉及用于制备两种或更多种标准化的表达盒的方法，所述方法包括：a.提供两组或更多组元件序列，每组元件序列一起构成至少一种功能性表达盒，各元件序列两侧侧翼为IIs型限制内切酶切割位点，之后是其识别位点，所述IIs型限制内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；b.提供至少两种骨架进入载体，各骨架进入载体按以下这种顺序包含：(i)限制酶切割位点与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物，任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装；以及c.使用基于经由所述切割位点使用限制酶消化和连接的方法，在至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒，从而制备两种或更多种标准化的表达盒。

Description

克隆方法

技术领域

本发明涉及用于制备标准化的表达盒的方法。本发明还涉及用于在宿主细胞中体内重组所述标准化的表达盒的方法。另外，本发明涉及用于将核酸序列整合在靶位点(target locus)的方法。本发明还涉及用于制备标准化的表达盒的系统，以及用于产生整合在靶位点的目的核酸构建体的系统。

背景技术

现代生物技术应用遗传改造来研发具有新型表型的以供在基于生物的转化过程中使用的生物体，所述转化过程应用在食品、饲料(feed)、医药、材料以及能源方面。这包括设计和产生正常情况下不会在目的生产宿主中发现或(在已知情况下)完全非天然的新型表型。应用的实例包括(但不限于)微生物产生化学前体、工业酶、抗生素以及生物燃料。

需要新型技术来设计更好、构筑更快且测试更多的DNA构建体，以用于更快并且更佳的菌株改造。这可以通过DNA构建的标准化、模块化以及自动化来着手进行。另外，再利用现有的元件或所谓的生物砖(biobrick)的能力将有助于更好地表征这些元件和降低构建体合成和/或组装的成本。所述生物砖可为例如启动子(P)、5’UTR(U)、信号序列(S)、开放阅读框架(O)、基因组序列(G)、终止子(T)以及其它功能或调节DNA元件。

科学家正仔细调查生物和改造工具来研发用于改造细胞的新型方法。复杂DNA盒可以被设计并且被需要来使改造细胞用于新型目的和高效的转化。因此，需要研发高通量低成本的DNA组装方法，以用于实际处理和探索更大组的设计。所需要的DNA盒可通过基因合成和连接来产生。然而，这通常是必需针对每种构建体进行重复的高成本的过程。已经提出再利用DNA构筑块和模块式盒来减少成本和时间。因此，对于基因组合的最佳使用和探索以及代谢途径的调谐(又称为合成生物学)来说，需要研发物理地组装含有大量呈多种排布的天然或人工基因的复杂DNA分子的新型方法。对于DNA盒的模块式构建来说，需要使用基本构筑块来物理组装和构筑这些盒的有效方法。当前可用的用于组装表达盒的方法由Wang T等人(2012)于Appl Microbiol Biotechnol(2012)93：1853-1863进行综述，并且包括如GoldenBraid(Sarrion-Perdigones A.(2012)，PLoS ONE 6(7)：e21622)和模块克隆(Modular Cloning)(Weber E.(2011)，PLoS ONE 6(2)：e16765以及EP2395087)。

然而，这些方法相当复杂，因为其包括连续的体外步骤或反复的重组(Wingler LM(2011)PNAS USA 108(37)：15135-15140)来用于体内组装多基因途径的文库。

虽然在过去的数年已经取得很大进展，但大的重组DNA分子的物理构建仍代表着对于每种应用来说都尚没有适合解决方案的主要瓶颈(Weber E.(2011)，PLoS ONE 6(2)：e16765以及EP2395087)。重组DNA分子传统上使用II型限制酶和连接酶来构建。虽然极为通用，但这种方法缓慢且冗长，并且仅允许产生相对小尺寸且仅含有数个基因的构建体。具体来说，这种方法受到以下事实的限制：对于大的构建体来说，设计克隆策略变得极其困难，因为所有可用的限制酶将在所述构建体中切割许多次。在过去的数年中，已经研发许多不同的方法来克服这些限制。这些方法包括基于重组酶的克隆、不依赖连接的克隆、基于同源重组和基于PCR组装的克隆。基于重组酶的克隆消除了来自限制位点多次出现在大的构建体中的问题，但受以下事实限制：重组位点留在最终的构建体中，从而妨碍蛋白质编码序列的无缝组装(Weber E.(2011)，PLoS ONE 6(2)：e 16765以及EP2395087)。此外，基于重组酶的克隆受以下事实限制：迄今为止，仅4个片段可同时在一个构建体中组装。

尽管所有这些技术具有其自身的优势，并且对于特定应用来说极其有用，但无一满足产生多遗传变体组合的任务所需的所有要求，所述多遗传变异组合的产生是成功设计和构建具有新型表型的生物体所需的。

用于DNA构建体组装的方法由Wang等人于2012年描述。多组分蛋白复合体的结构生物学、代谢工程学以及合成生物学的研究经常依赖于这些亚单元或酶在同一细胞中的有效过度表达。作为第一步，如果使用基于经典且常规的消化和连接的克隆方法，构建多个表达盒将为复杂且耗时的工作。已经研发了一些更有效的方法，包括(1)采用多相容质粒表达系统；(2)载体的基于稀有切点的设计(rare-cutter-based design)；(3)体外重组(不依赖于序列和连接的克隆，DNA分子在单一反应中的等温酶促组装)；以及(4)使用有效重组的酵母进行体内重组(体内组装重叠片段，反复重组用于外源表达盒的染色体整合)。

最近，已经研发基于IIs型限制酶的克隆方法((WO 2008/095927)，Engler等人.PLoS ONE 4(2009)e5553)描述了使用IIs型限制酶通过使10个未消化的输入质粒的混合物简单地经受限制-连接反应并且将所得混合物转化到感受态细胞中，一步并且在一个管中将至少九个独立的DNA片段一起组装到受体载体中的方案。这种方案称为“Golden Gate”克隆。

虽然合成生物学代表一个新的领域，但它利用遗传改造，并且因此应从现有成熟的技术如机械工程学来习得。复杂装置的成功工程化的重要考虑因素包括部件的标准化。对于合成生物学来说，标准化将允许从一个项目到下一个项目随意地再利用先前验证的模块，并且因此使得更有效地改造新生物学功能或生物体。标准化的一个重要方面在于可将预定值与各部分相关联，例如，启动子的限定活性(但应理解启动子活性可受附近序列中存在的增强子序列影响)或针对给定多肽的比酶活性。这是极为重要的，因为改造新功能或生物体将需要如此大量的部分一起工作，这样使得将需要针对许多项目进行测试的基因组合的数量有可能过大而在物理上不可能。这个要素是实现合成生物学的可能性所需要的必要要素。

发明内容

我们已经研发了一种体外/体内杂合方法，所述方法应用标准化的生物元件经由中间Golden Gate组装步骤(Engler C.(2008)PLoS ONE 3(11)：e3647)形成复杂DNA盒用于在目的宿主中进行表达，并且应用专门设计的用于在标准化的盒组装中进一步使用的进入载体(entry vector)。

使用这种新型有效两步法允许以高效的方式构建模块式DNA盒。另外，我们已经研发并且显示了测量启动子强度的小型途径表征法(mini-pathway characterization method)，其包括两个内部参照测量(参见实施例1)。在所述实施例中，GFP、LacZ以及RFP组合到一个途径中。所述方法还应用来表征终止子序列，并且可类似地用于表征信号序列，5’UTR或感兴趣的任何其它调节部分或突变、插入或缺失。

基于同源重组的方法是有用的，但要求模块之间共有最少量的序列，这限制了自由组合不同序列的标准模块的能力。然而，本发明的方法通过使用约9 bp(或更长)的标准化的连接物元件来用于体外组装或约25 bp(或更长)的标准化的连接物元件来用于体内组装，规避了这个问题。两种方法均可应用来组装表达盒，或研发敲除或插入序列，如下文中所解释的。此外，通过在连接物序列处有效使用利用标准化的引物的PCR法，可从含有标准化的连接物序列的骨架盒有效地回收模块式盒。连接物序列可含有IIS型限制酶识别位点，以在所要求位置处在所进行的步骤中进行准确切割，从而允许无缝体内同源重组，如果需要无缝体内同源重组来维持或恢复DNA构建体的功能性的话。

因此，本发明提供核酸分子的系统，所述系统可用于由期望数目优选至少3个片段来体内组装目的核酸盒，并且整合在靶位点处，其中至少一个片段含有功能性表达元件。功能性表达元件含有(但不限于)启动子DNA序列(pro)、开放阅读框架DNA序列(orf)、终止子DNA序列(ter)以及称为连接物(connector)的用于体内组装的左和右侧翼DNA序列(分别为lcon和rcon)。

DNA分子的系统含有一组至少2个或3个骨架(bbn)进入载体，其被设计成在进入载体中具有至少一个lcon和一个rcon序列，其可与元件载体一起应用在单锅(one-pot)Golden-Gate组装反应中，以产生功能性表达元件(M)和单一II型限制酶按功能性顺序的使用。例如，lcon-pro-orf-ter-rcon。

所述系统应可针对目的核酸构建体从许多表达元件的组装进行缩放，而同时避免对构建与构成目的核酸盒的片段或表达元件的数量一样多的骨架载体的需要。

本发明的核酸分子的系统允许组装数量比系统中所存在的骨架载体的数量少的表达元件，以及数量比系统中所存在的骨架载体的数量高的表达元件。本发明提供一种标准化的连接物核酸分子的系统，其可用于由期望数量的表达元件组装任何目的核酸盒。

因此，本发明提供用于制备两种或更多种标准化的表达盒的方法，所述方法包括：

a.提供两组或更多组元件序列，

每组元件序列一起构成至少一种功能性表达盒，

各元件序列的两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，

所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒；

b.提供至少两种骨架进入载体，

各骨架进入载体按以下这种顺序包含：(i)限制酶与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物(insert)，

任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；

以及

c.使用基于经由切割位点使用限制酶消化和连接的方法，在所述至少两种骨架进入载体中组装两组或更多组元件序列作为功能性表达盒，

从而制备两种或更多种标准化的表达盒。

本发明还提供：

用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法，所述方法包括：

a.根据以上所述的方法制备两种或更多种标准化的表达盒，其中：

i.RF和LF连接物序列包含同源重组序列；以及

ii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及

b.从包含LF和RF序列的骨架进入载体回收表达盒；以及

c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组；和

用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括：

a.根据以上所述的方法制备两种或更多种标准化的模块式(modular)表达盒，其中：

i.RF和LF连接物序列包含至少9个碱基对的同源序列；以及

ii.任何骨架进入载体上的RF和LF序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及

b.从通过LF和RF序列体外连接的骨架进入载体组装并且回收表达盒；以及

c.在宿主细胞中在靶位点处将所回收和组装的表达盒体内重组。

本发明进一步提供：

用于制备两种或更多种标准化的表达盒的系统，所述系统包括：

a.两组或更多组元件序列，

每组元件序列一起构成至少一种功能性表达盒，

各元件序列两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，

b.至少两种骨架进入载体，

各骨架进入载体按以下这种顺序包含：(i)限制酶与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物，

和

用于产生整合在靶位点处的目的核酸构建体的系统，所述系统包含：

a.如以上所述的系统；以及

b.至少两种整合序列，其中一种与第一表达盒和靶位点的侧翼序列重组，并且其中第二种与第二表达盒和靶位点另一侧的侧翼序列重组。

附图说明

图1提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水平0：制备或可获得在适合的载体中的一组的元件序列，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4-bp)，所述位点被选择成使得在使用Golden gate克隆组装后，形成功能性表达盒。在水平0，还制备或可获得一组骨架载体，其含有适于使用序列同源性进行组装的左和右连接物序列，以用于在水平2组装模块式盒。选择元件序列的亚组与骨架(bbn)载体。在水平1，使用Golden Gate克隆将它们进行组装，从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2在靶位点处进行整合的左和右侧翼，并且添加左或右连接物序列或左和右连接物序列二者。例如，经由在适合的bbn载体中进行克隆或经由PCR反应，其中con序列为所使用的引物的一部分。水平2：在适合的宿主细胞中发生功能性表达盒与整合侧翼(int)和含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。通常地，待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收，以供在水平2使用，或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。

选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中，添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3：例如经由PCR反应或其它方法从2B回收模块式盒(或部分)。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。

图2提供用于产生目的核酸构建体的2步克隆和转化系统的概况。水平0：制备或可获得在适合的载体中的一组元件序列，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4-bp)，所述位点被选择成使得在使用Golden gate克隆组装后，形成功能性表达盒。在水平0，还制备或可获得一组骨架载体，其含有适于使用序列同源性进行组装的左和右连接物序列，以用于在水平2组装模块式盒。选择元件序列的亚组连同骨架(bbn)载体。在水平1，使用Golden Gate克隆将它们进行组装，从而产生含有至少一起编码启动子、orf以及终止子的序列的功能性表达盒。还可选择用于在水平2步骤b在靶位点处进行整合的左和右侧翼，并且添加左或右连接物序列或者左和右连接物序列二者。例如，经由在适合的bbn载体中进行克隆或经由PCR反应，其中con序列为所使用的引物的一部分。

通常地，待组装的所有DNA部分可通过PCR反应从由水平1得到的载体中回收，以供在水平2步骤a中使用，或例如使用经由第二适合的IIs限制酶以及其设计在con载体外侧的识别位点切出这些片段并且切割在其间包含DNA序列的con载体的方法。

水平2步骤a：使用体外组装反应例如吉布森(Gibson)克隆将一个或更多个功能性表达盒和/或整合侧翼与连接物序列组装在一起，以形成模块式盒。接下来在水平2步骤b：在适合的宿主细胞中发生包括单独的或已经作为模块式盒的模块式盒、整合侧翼(int)以及含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。选项A与B提供用于在靶位点处组装模块式盒的方案。在选项B中，添加另外的左和右整合位点用于第二宿主。选项B之后是水平3。水平3：例如经由PCR反应或其它方法从2B回收模块式盒(或部分)。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。

图3示出水平1的组装选项(但不限于这些)，其中第iii项为使用优选地单一IIS型核酸内切酶和4 bp伸出序列(overhang)在切割和连接后组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分，或i.以及开放阅读框架为多个片段的形式，这例如是由于蛋白质的大小或模块式特征，例如具有独立的结构域的酶像PKS、NRPS、纤维素等，或仅仅由于大小或出于蛋白质改造目的，以产生orf部分的文库序列。第iv项示出orf分开成3片。第v项示出启动子中分开成这样的启动子，其中单独添加基因的5’UTR部分。应注意，这些为实例，并且基本上可设计以多部分的形式分开的DNA序列并且使用IIs型系统连接，以产生无痕的DNA序列。在所示情况下，在蛋白质的蛋氨酸起点使用AATG。此处，启动子序列的最后一个核苷酸始终被修饰为A。选择TAAA来桥接终止子，其中基因的终止密码子被修饰为TAA，并且终止子序列的第一位被修饰为A修饰或在5’延伸A。应注意，为有效使用Golden Gate(或其它依赖于IIS型的克隆系统)，优选(使得)所有序列不含用于切割的限制酶的识别位点。

图4针对骨架(bbn)载体变体的连接物(con)部分示出这些载体。第v项示出通常地应用来在水平1(图1和图2)用指定的(但不限于)给定4 bp连接物产生功能性表达盒的变体。第iv项和第ii项提供bbn载体变体，其中连接物中的一个被分别用于在靶位点处进行整合的左和右整合侧翼置换或与其组合。第ii项和第i项为变体，其中仅左或右连接物为骨架的一部分。这些通常地为仅可用在模块式盒的末端的，例如以与整合侧翼一起使用，并且在载体中储存这些。第vi项示出可在用于插入元件序列的IIs型限制位点内使用逆选择标记物用于Golden Gate克隆(或其它)。应注意，所述方法不限于使用Bsal作为IIs型限制酶，也不限于使用IIS限制酶，只要由限制得到的侧翼与待插入的单一或模块式元件或int/侧翼序列的侧翼相容即可。

图5示出在此文件中所描述的方法和系统在水平1的模块性。通过从水平0选择多个元件并且用在单锅Golden Gate(或其它)克隆反应中，产生待在水平2(图1或2)用作文库的功能性表达盒的文库，并且可能地可与图6的步骤2组合。

图6示出在此文件中所描述的方法和系统在水平2的模块性(针对图1)。功能性表达盒的文库可添加待经由体内组装和重组组装的一个或更多个模块，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。

图7示出在此文件中所描述的方法和系统在水平2的模块性(针对图2)。类似于图6，但在水平2步骤a具有中间体外步骤：功能性表达盒的文库可添加待经由体外组装而组装的一个或更多个模块。这个步骤可通过所得(并且可能回收的)多部分DNA序列的体内组装来进行，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。

图8示出并且在水平2(A)-(E)的多个变体(但不限于这些)中描述：具有独特至少25 bp连接物序列的相同的骨架(bbn)载体可被应用来体内产生敲除或整合构建体，如以下所述。水平1示出水平0的不同元件(但不限于其)可如何插入骨架载体(还参见图4)，可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所需要的一个或两个连接物序列的模块式元件。这些独特连接物使得可以有效地再利用这些元件载体并且允许按组合方式直接使用或作为文库使用，以产生例如涵盖多个基因的DNA伸展序列的敲除，或在文库中与int-L和int-R序列(水平2C)产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地，将应用功能性标记物盒与至少一个int-L和一个int-R序列(按所述顺序处于靶位点处，但不一定连接)。以下为数种策略(但不限于此)：(A)产生标记物的插入以置换靶位点处的orf；(B)产生标记物的插入以置换靶位点处的由int-L和int_R限定的所选择DNA部分；(C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int_R序列的组合可能性限定的所选择DNA部分，从而导致小至较大的DNA部分被置换，这取决于选择用于至少一种染色体、质粒或其它靶DNA的int-L与int-R序列的最大距离；(D)示出部分(B)可被改变来在靶位点处插入特定元件或其一部分。这可应用来以标准化的模块式方式，通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5’UTR或模块式部分。可行的实例为启动子调谐(promoter tuning)，或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生；(E)示出当使用多于一种的标记物和第二组与第一种不相容的连接物序列时，可一次进行多个动作。

应注意对于(D)，int-R需要与靶位点正确匹配，从而不扰乱原始阅读框架。

当然，图8的方法可与图1或图2组合来使一个或更多个模块式DNA盒插入一个或更多个靶位点，同时如图8所述、作为一个或更多个预定序列或作为文库方法(图5-7)将标记物插入在第二位置并且去除或插入DNA序列。

图9示出2步途径构筑法的一般方案，所述方法为一种快速、有效且灵活的方法，这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。

图10示出基于所获得的GFP结果，启动子表达强度的排序。所述方法的功效通过小的标准差示出，这表明了大量的正确转化株。

图11示出在针对各个启动子的lacZ和GFP报告子测定中获得的结果之间的相关性是可接受的，报道基因测定证实并且加强了针对各启动子获得的结果。

图12阐述终止子对GFP表达的影响。再次，各系列的4个测试菌落的小标准差指示高百分比的正确转化株。以最暗灰色描述的终止子的所发现大标准差是由没有GFP信号的转化株(不正确转化株的几个例外的一个)引起。

图13阐述在凝胶上针对衣康酸途径的组装分析的PCR反应的结果。PCR反应产生正确的带大小，从而指示基因组中途径的正确整合与组装。

图14示出质粒Te pep.bbn的示意图，所述质粒用于组装EBA328和EBA332表达盒。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区、lox66位点、由构巢曲霉(A.nidulans)gpdA启动子驱动的ble编码区的非功能5’部分(5’ble)，以及ccdB基因。

图15示出质粒pEBA1006的示意图，所述质粒与pEBA328_EBA332组合用于二分基因靶向法中，目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA ORF和起始ATG密码子上游的约1500个核苷酸。所述载体包含ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点、RePepA ORF的2500 bp 3’侧翼区以及pUC 19的骨架(Invitrogen，Breda，TheNetherlands)。通过用限制酶NotI消化去除大肠杆菌DNA，之后转化R.emersonii菌株。

图16示出质粒pEBA328的示意图，所述质粒用作PCR的模板，以使用吉布森克隆获得质粒pEBA328_EBA332。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区，由黄青霉(P.chrysogenum)Paf启动子、嗜热篮状菌(Talaromyces thermophilus)GH61编码区以及黄青霉penDE终止子组成的EBA328表达盒，lox66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(5’ble)。pEBA328为pEBA332的代表，其含有EBA332表达盒而非EBA328表达盒。EBA332表达盒由R.emersonii启动子2、绵毛嗜热丝孢菌(Thermomyces lanuginosa)GH61编码区以及构巢曲霉amdS终止子(TamdS)组成。

图17示出质粒pEBA328 EBA332的示意图，所述质粒与pEBA1006载体组合用于二分基因靶向法中，目标为在Rasamsonia emersonii中通过两个GH61表达盒置换RePepA ORF和起始ATG密码子上游的约1500个核苷酸。所述载体包含在RePepA ORF上游1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区，由黄青霉Paf启动子、嗜热篮状菌GH61编码区以及黄青霉penDE终止子组成的GH61表达盒EBA328，由R.emersonii启动子2、绵毛嗜热丝孢菌GH61编码区以及构巢曲霉amdS终止子(TamdS)组成的GH61表达盒EBA332，lox66位点、由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(5’ble)。通过用限制酶NotI消化去除大肠杆菌DNA，之后转化R.emersonii菌株。

图18示出质粒pEBA1001的示意图，所述质粒与pEBA1002载体组合用于二分基因靶向法中，目标为在Rasamsonia emersonii中使ReKu80 ORF缺失。所述载体包含2500 bp 5’上游侧翼区、lox66位点、由构巢曲霉gpdA启动子驱动的ble编码序列的5’部分以及pUC19的骨架(Invitrogen，Breda，The Netherlands)。通过用限制酶NotI消化去除大肠杆菌DNA，之后转化R.emersonii菌株。

图19示出质粒pEBA1002的示意图，所述质粒与pEBA1001载体组合用于二分基因靶向法中，目标为在Rasamsonia emersonii中使ReKu80 ORF缺失。所述载体包含ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点、ReKu80 ORF的2500 bp 3’下游侧翼区以及pUC19的骨架(Invitrogen，Breda，The Netherlands)。通过用限制酶NotI消化去除大肠杆菌DNA，之后转化R.emersonii菌株。

图20示出用于使R.emersonii的ReKu80基因缺失的策略。用于使ReKu80缺失的载体包含侧翼为loxP位点的重叠非功能性ble选择标记物片段(分开的(split)标记物)以及用于靶向的ReKu80基因的5’和3’同源区(1)。所述构建体通过三重同源重组(X)在基因组ReKu80位点以及重叠同源非功能性ble选择标记物片段处整合(2)并且置换基因组ReKu80基因拷贝(3)。随后，通过cre重组酶的瞬时表达去除选择标记物，从而在lox66与lox71位点之间引起重组，导致ble基因缺失，而剩余双重突变lox72位点留在基因组中(4)。使用这种总体策略，从基因组中去除ReKu80 ORF。

图21示出用于在真菌中瞬时表达cre重组酶的质粒pEBA513的示意图。pEBA513为pAMPF21衍生的载体，其含有AMA1区和CAT氯霉素抗性基因。描绘了cre重组酶基因(cre)表达盒，其含有黑曲霉(A.niger)glaA启动子(Pgla)、cre重组酶编码区以及niaD终止子。另外，示出了由构巢曲霉gpdA启动子(PgpdA)、hygB编码区以及黄青霉penDE终止子(TpenDE)组成的潮霉素抗性盒。

图22示出在2％玉米秸秆活性测定中测试的上清液的剂量应答曲线。将不同剂量的上清液的摇瓶发酵物与2％玉米秸秆一起孵育，并且在65℃下孵育72小时。使用NMR量化释放的糖。X轴：(稀释)上清液的蛋白浓度，将200μl上清液添加至800μl底物，得到1 ml的最终测定体积。Y轴：相对葡萄糖释放(ΔGlc，任意单位)：针对酶溶液中存在的残余糖(由空白测量)以及酸预处理的玉米秸秆中存在的残余糖，校准样品中测量的葡萄糖。空心圆：pEBA328_EBA332转化株；空心方块：2个空参考菌株的曲线；虚线：pEBA328_EBA332曲线拟合的95％置信区间。

图23示出选择标记物盒的使用。在选项1中，可共用一个或更多个启动子-开放阅读框架-终止子(POT)盒，其编码可选择标记物，以用于在宿主1中进行组装并且在宿主2中应用，例如POT₂。在选项2中，在内部侧翼之外的一个或更多个POT盒编码可选择标记物以用于在宿主1中组装，并且另外的在内部侧翼中的一个或更多个POT用于在宿主2中应用，例如POT₂用于宿主1，并且POT₃用于宿主2。

序列表说明

SEQ ID NO：1至30阐述启动子元件的序列如下：SEQ ID NO：1：启动子元件Sc.EN01.Pro；Seq ID NO：2：启动子元件Sc PDCI.pro；Seq ID NO：3：启动子元件Sc EN02.pro；Seq IDNO：4：启动子元件Sc FBA1.pro；Seq IDNO：5：启动子元件Sc PGI1.pro；Seq IDNO：6：启动子元件Sc PGK1.pro；Seq ID NO：7：启动子元件Sc GPM1.pro；Seq ID NO：8：启动子元件ScPMA1_1.pro；Seq ID NO：9：启动子元件Sc OYE2.pro；Seq ID N0：10：启动子元件Sc TAL1.pro；Seq ID NO：11：启动子元件Sc TDHI.pro；Seq IDNO：12：启动子元件Sc TDH3.pro；Seq ID NO：13：启动子元件Sc TEFI.pro；Seq ID NO：14：启动子元件Sc TPI1.pro；Seq ID NO：15：启动子元件ScACTI.pro；Seq ID NO：16：启动子元件Ag Tefl.pro；Seq ID NO：17：启动子元件Sc PRE3.pro；Seq ID NO：18：启动子元件Sc VPS68.pro；Seq ID NO：19：启动子元件KLLA0A09185g(乳酸克鲁维酵母(K.lactis)启动子1)；Seq IDN0：20：启动子元件KLLA0A11011g(乳酸克鲁维酵母启动子2)；Seq IDNO：21：启动子元件KLLA0B08998g(乳酸克鲁维酵母启动子3)；Seq IDNO：22：启动子元件KLLA0B14839g(乳酸克鲁维酵母启动子4)；Seq IDNO：23：启动子元件KLLA0B 14883g(乳酸克鲁维酵母启动子5)；Seq IDNO：24：启动子元件KLLA0C05566g(乳酸克鲁维酵母启动子6)；Seq IDNO：25：启动子元件KLLA0D00979g(乳酸克鲁维酵母启动子7)；Seq IDNO：26：启动子元件KLLA0D07634g(乳酸克鲁维酵母启动子8)；Seq IDNO：27：启动子元件KLLA0E01057g(乳酸克鲁维酵母启动子9)；Seq IDNO：28：启动子元件KLLA0F18260g(乳酸克鲁维酵母启动子10)；Seq IDNO：29：启动子元件KLLA0F20031g(乳酸克鲁维酵母启动子11)；以及SeqID NO：30：启动子元件KLLA0F20988g(乳酸克鲁维酵母启动子12)。

SEQ ID NO：31至35阐述ORF的序列如下：Seq ID NO：31：ORF元件vGFP；Seq ID NO：32：ORF元件RFP；Seq ID NO：33：ORF元件LacZ；SeqID NO：34：ORF元件GFPmut3；以及Seq ID NO：35：ORF元件GFP-pest。

SEQ ID NO：36至49阐述终止子序列如下：Seq ID NO：36：元件ADH1终止子；Seq ID NO：37：元件ADH2终止子；Seq ID NO：38：元件ENO1终止子；Seq ID NO：39：元件GPM1终止子；Seq ID NO：40：元件PDC1终止子；Seq ID NO：41：元件PGI1终止子；Seq ID NO：42：元件PGK1终止子；Seq ID NO：43：元件PMA1终止子；Seq ID NO：44：元件TAL1终止子；Seq ID NO：45：元件TDH1终止子；Seq ID NO：46：元件TDH3终止子；Seq ID NO：47：元件TEF1终止子；Seq ID NO：48：元件TEF2终止子；以及Seq ID NO：49：元件TPI1终止子。

SEQ ID NO：50阐述用于SEQ ID NO：1至49的所有元件的大肠杆菌载体的序列。

SEQ ID NO：51至63阐述连接物的序列(参见实施例)。

Seq ID NO：64至SEQ ID NO：85阐述骨架进入载体的序列(参见实施例)。

Seq ID NO：86阐述用于SEQ ID NO：64至85的所有骨架进入载体的大肠杆菌载体的序列。

SEQ ID NO：87至SEQ ID NO：112阐述PCR引物序列如下：Seq IDNO：87：con5 forw；Seq ID NO：88：cona rev；Seq ID NO：89：cona forw；Seq ID NO：90：conb rev；Seq ID NO：91：conb forw；Seq ID NO：92：conc rev；Seq ID NO：93：conc forw；Seq ID NO：94：conD rev；Seq ID NO：95：conDforw；Seq ID NO：96：conE rev；Seq ID NO：97：conE forw；Seq ID NO：98：conF rev；Seq ID NO：99：conF forw；Seq ID NO：100：conG rev；Seq IDNO：101：conG forw；Seq ID NO：102：conH rev；Seq ID NO：103：conH forw：Seq ID NO：104：conl rev；Seq ID NO：105：conl forw；Seq ID NO：106：conJrev；Seq ID NO：107：conJ forw；Seq ID NO：108：conK rev；Seq ID NO：109：conK fw；Seq ID NO：110：con3 rev；Seq IDNO：111：KanMX添加连接物上的5950正向引物；以及Seq ID NO：112：KanMX添加连接物b上的5951反向引物。

Seq ID NO：113阐述装备有连接物a和b的PCR片段KanMX标记物的序列。

SEQ ID：114阐述左侧翼INT1上的正向引物的序列。

SEQ ID NO：115阐述左侧翼INT1添加连接物5上的反向引物序列。

SEQ ID NO：116阐述具有用于在INT1进行整合的连接物5的左侧翼的序列。

SEQ ID NO：117阐述右侧翼INT1添加连接物3上的正向引物的序列。

SEQ ID NO：118阐述左侧翼INT1上的反向引物的序列。

SEQ ID NO：119阐述具有用于在INT1进行整合的连接物3的右侧翼的序列。

SEQ ID NO：120、121、122、123、124以及125阐述针对在酿酒酵母中(S.cerevisiae)产生衣康酸的代谢途径的构建而特定合成的开放阅读框架(参见表5)。

SEQ ID NO：126阐述R.emersonii RePepA(包括侧翼的基因组序列)的序列。

SEQ ID NO：127阐述R.emersonii RePepA(cDNA)的序列。

SEQ ID NO：128阐述R.emersonii RePepA(蛋白质)的序列。

SEQ ID NO：129阐述构巢曲霉gpdA启动子和ble编码区的5’部分的序列。

SEQ ID NO：130阐述ble编码区的3’部分和构巢曲霉TrpC终止子的序列。

SEQ ID NO：131阐述黄青霉Paf启动子的序列。

SEQ ID NO：132阐述嗜热篮状菌GH61的序列。

SEQ ID NO：133阐述黄青霉penDE终止子的序列。

SEQ ID NO：134阐述R.emersonii启动子2的序列。

SEQ ID NO：135阐述绵毛嗜热丝孢菌GH61的序列。

SEQ ID NO：136阐述构巢曲霉AmdS终止子的序列。

SEQ ID NO：137阐述正向吉布森引物的序列。

用于接合pEBA1013载体部分与EBA328表达盒的5’RePepA区-Ppaf。

SEQ ID NO：138阐述反向吉布森引物TpenDE的序列。

SEQ ID NO：139阐述用于接合EBA328与EBA332表达盒的正向吉布森引物TpenDE-Ppra的序列。

SEQ ID NO：140阐述反向吉布森引物Tamds的序列。

SEQ ID NO：141阐述用于接合EBA332表达盒与pEBA1013载体部分的正向吉布森引物Tamds-loxP-gpd-ble的序列。

SEQ ID NO：142阐述反向吉布森引物5′RePepA的序列。

SEQ ID NO：143阐述ReKu80(基因组序列，具有侧翼的编码区)的序列。

SEQ ID NO：144阐述ReKu80(cDNA)的序列。

SEQ ID NO：145阐述ReKu80(蛋白质)的序列。

发明详述

贯穿本说明书和随附权利要求书，词语“包含”、“包括”和“具有”以及变型应解释为包括性的。即，这些词语旨在传达在上下文允许的情况下，可包含未具体列举的其它元件或整体。

在本文中未使用数量词时用来指语法对象有一个或一个以上(即一个或至少一个)。举例来说，“元件”可意指一个元件或一个以上的元件。

本发明的系统包含具有高多样性和灵活性的限定组的部件，借此给定系统可容易地应用于许多不同的应用。值得注意的是，给定系统可用于包含不同数量的待组装成目的核酸盒的表达元件的应用。本发明的极大优势在于许多不同的表达元件可与数量比待组合的表达元件的数量小的骨架载体组合。因此，所述系统可根据许多不同的表达元件的组合和表达元件数量进行缩放，而无需用于使连接物适合于大量表达元件的额外的克隆工作。

因此根据本发明，提供一种用于制备两种或更多种标准化的模块式表达盒的方法，所述方法包括：

a.提供两组或更多组元件序列，

每组元件序列一起构成至少一种功能性表达盒，

b.提供至少两种骨架进入载体，

各骨架进入载体按以下这种顺序包含：(i)限制酶与其识别位点，和通常地至少约9 bp长的第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)同样通常地至少约9 bp长的第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物，

c.使用基于经由所述切割位点使用限制酶消化和连接的方法，在所述至少两种骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒，

从而制备两种或更多种标准化的表达盒。

所述标准化的表达盒可易于在体内重组。因此，本发明提供用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的模块式表达盒的方法，所述方法包括：

a.根据本文以上所述的方法制备两种或更多种标准化的模块式表达盒，其中：

i.RF和LF连接物序列包含通常地至少25个碱基对长的同源重组序列；以及

b.从包含LF和RF序列的骨架进入载体回收表达盒；以及

c.在宿主细胞中在靶位点处将所回收的表达盒彼此体内重组。

还提供用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括：

a.根据以上所述的方法制备两种或更多种标准化的模块式表达盒，其中：

i.RF和LF连接物序列包含至少9个碱基对的同源序列；以及

在本发明中，组装目的核酸构建体并且通常地整合在靶位点处。通常地，可将一系列表达盒整合在靶位点处。

根据本发明的方法涉及核酸分子彼此以及与靶位点的重组。重组是指其中核酸分子断裂并且然后接合至不同核酸分子的过程。本发明的重组过程通常地涉及可来自相同或不同生物体的不同核酸分子的人工和有意重组，从而产生重组核酸。

本发明的方法通常地依赖于同源重组反应。“同源重组”是指具有含有相似核苷酸序列(即，同源序列)的对应位点的核苷酸序列之间的反应，通过其分子可相互作用(重组)，从而形成新的重组核酸序列。相似核苷酸序列的位点在本文中各自称为“同源序列”。通常，同源重组的频率随着同源序列的长度增加而增加。因此，尽管同源重组可发生在不太一致的两个核酸序列之间，但重组频率(或效率)随着两个序列之间的相异性增加而下降。

可使用本发明的方法将一系列组装的表达盒整合在靶位点处(通常地通过同源重组)。

靶位点为期望整合组装的核酸的任何位置。位点可为染色体位点，即在宿主细胞的基因组内，或为染色体外位点，例如质粒或人工染色体。用于靶向所选择的靶位点的序列将通常地为靶位点侧翼的序列。核酸序列在靶位点处的整合可导致所述序列在没有序列丢失的情况下整合在靶位点处。或者，整合可伴随有序列从靶位点的丢失。因此，核酸序列在靶位点处的整合可导致编码序列的部分或完全缺失，例如这样使得一个或更多个基因被部分或完全敲除。

两种或更多种表达盒可根据本发明在2步法中按模块式方式进行组装(参见图1和图1.2)。

在水平1，将元件序列的组与含有允许组装功能盒的左和右连接物DNA序列的骨架DNA序列(LF和RF con序列)组装在一起，其通常地含有包括启动子、orf以及终止子序列的至少2个元件。

在水平2，发生至少一种表达盒、但通常地两种或更多种表达盒与用于靶向整合的5’DNA侧翼以及用于靶向整合的3’DNA侧翼的体内组装，并且在靶位点处发生整合。

另外，在水平3，可进行步骤来从宿主细胞获得组装的表达盒，以用于在宿主细胞外进行进一步处理和/或用来修饰另一宿主细胞，或作为DNA产物。这可通过以下方式来实现：提供用于与另外的序列进行整合的，被设计成允许在第二靶位点处、通常地在第二宿主细胞中进行整合的序列。

在图1中，水平2描述了模块式表达盒从功能性表达盒以及5’和‘3盒通过体内DNA重组在靶位点处的组装。图2描述了替代方案，其中水平2分成a和b，即首先进行体外组装步骤以获得模块式表达盒，其在水平2b在宿主中在靶位点处进一步体内重组成完整的模块式DNA表达盒。

在水平2a(图2)，可应用但不限于称为SLIC、吉布森以及CPEC的方法。这些方法是提供标准化的、无痕(scarless)的、(大部分)不依赖于序列的、多部分DNA组装的相关方法。由于起始材料和最终产物对于这三种方法是相同的，因此均可使用至少9 bp并且对于具体方法的效率来说可需要更长的相同同源连接物序列来加以应用(http：//j5.jbei.org/j5manual/pages/22.html)。

在水平1，通常地通过单一IIs型限制核酸内切酶来催化限制。然而，也可以应用多个IIs型限制核酸内切酶，或针对元件序列载体的IIs型限制核酸内切酶与产生伸出序列(overhang)的II型限制酶的组合，所述伸出序列与对用于组装功能性表达盒的元件或具有整合侧翼(int)的表达盒的左和右元件设计的那些相容。连接是通过连接酶来催化。

本发明的方法允许通过经由在片段两端形成的单链伸出序列、使用IIs型限制核酸内切酶来组装核酸片段构建体由元件序列组产生目的表达盒。在本发明中，可使用IIs型限制酶。IIs型限制核酸内切酶识别位点为限制核酸内切酶识别双链DNA并且在切割位点切割双链DNA的识别位点，所述切割位点在双链DNA的识别位点外。IIs型限制核酸内切酶进行切割，以使得产生3至6个核苷酸的伸出序列，这取决于具体IIs型限制核酸内切酶。通常地，在本发明的方法中，可使用产生4个核苷酸的伸出序列的酶。然而，还可使用产生更长单链伸出序列的IIs型核酸内切酶。在切割时形成伸出序列的核苷酸范围在本文中称为切割位点。由于切割位点的核苷酸不是识别位点的一部分，因此其可根据期望在不破坏IIs型限制核酸内切酶的切割活性的情况下进行选择。表5给出适于本发明的方法的IIs型限制核酸内切酶的实例。

对于实施本发明，可使用提供足以在其切割位点进行有效连接的“粘性”末端的任何IIs型限制酶。对所述酶的选择被提供在REBASE网页(rebase.neb.com/cgi-bin/asymmlist)和Szybalsky等人.(1991，Gene，100：13-26)的综述中。具有不对称识别位点的切割位点在识别位点之外并且在切割时提供至少三个、优选4个或更多个核苷酸残基伸出序列(例如BLi736I；BpuAI、VpaK321、SfaNI等)的II型限制酶(例如，此网页中示出的那些)可用在本发明中。

推荐识别位点含有至少4个、更优选至少6个或更多个碱基对，以便将在目的序列部分中发现所述位点的机会最小化。还可使用具有5 bp识别位点(例如SfaNI)的IIs型限制核酸酶。在消化片段的端点产生4 nt单链伸出序列的IIs型限制核酸内切酶在理论上可产生具有256种可能的序列的末端。具有甚至更长的识别位点、例如包含十个或更多个碱基对的IIs型限制酶已被工程化。天然IIs型酶中的最大识别位点是针对酶Sapl的，其具有7bp识别位点。一个优选解决方案是使用人工IIs型酶，其被改造以具有长的识别位点(Lippow等人，2009，Nucleic acides Res.，37：3061-3073)。例如，预期具有18 bp识别位点的IIs型酶仅至多切割每个真核基因组数次，并且将允许制作不必改变天然序列的任何核苷酸的最多进入模块。

水平2选项b(图1)：可包含具有左和右DNA侧翼的另外的骨架用于在水平3回收后的之后的在第二宿主中的整合。

可进行本发明的方法，其中在两种整合序列存在下进行重组步骤，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点的另一侧的侧翼序列重组。

或者，整合序列可由两种骨架进入载体来提供。因此，可进行本发明的方法，以使得在重组步骤中，第一表达盒包含与靶位点的侧翼序列重组的整合序列，并且第二表达盒包含与靶位点的另一侧的侧翼序列重组的整合序列。

整合序列可包含用于与第二靶位点、任选地与第一靶位点种类不同的宿主细胞中的位点进行重组的另外的序列。

整合序列将通常地允许在靶位点处经由同源重组来进行重组。也就是说，整合序列将通常地与靶位点处的序列具有足够的同源性，以使得能够经由同源重组在靶位点处整合两种或更多种表达盒。

介导组装的表达盒与靶位点之间的同源重组的序列的长度可为至少约20 bp、至少约30 bp、至少约50 bp、至少约0.1 kb、至少约0.2 kb、至少约0.5 kb、至少约1 kb或至少约2 kb。

或者，整合序列可为由位点特异性重组酶识别的序列。也就是说，整合序列可允许经由位点特异性重组在适合重组酶存在下进行整合。

在本发明的方法中，可提供整合序列，其提供在一个宿主细胞种类中与第一靶位点重组以及然后在第二宿主细胞种类中与靶位点的重组。可在所述整合序列之间常规地提供选择标记物(用于在第一宿主细胞种类中选择)。显然，一个必要是将所述标记物放置在位于表达盒一侧的两个整合位点之间。例如，整合位点可提供在表达盒的5’和3’端，其对于第一宿主细胞种类中的靶位点是特异的。选择标记物然后可被提供成邻近于一个整合位点、位于整合位点与表达盒一端之间。选择标记物将通常地适于在第一宿主细胞种类中进行选择。然后，可提供用于第二宿主细胞种类的另外的整合位点。这些整合位点中的一个将位于选择标记物与表达盒的一端之间。然后另一个将定位在表达盒的另一端与整合位点(对于第一宿主细胞种类特异)之间。

这种方法图解在图23中，其示出选择标记物盒的使用。在选项1中，可共用一个或更多个启动子-开放阅读框架-终止子(POT)盒，其编码可选择标记物以用于在宿主1中组装和在宿主2中应用，例如POT₂。在选项2中，在内部侧翼之外的一个或更多个POT盒编码可选择标记物，以用于在宿主1中组装，并且另外的在内部侧翼中的一个或更多个POT用于在宿主2中应用，例如POT₂用于宿主1，并且POT₃用于宿主2。

在本发明的方法中，可在靶位点处按预定顺序顺次(in series)组装并且重组一系列表达盒，例如至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20或更多个表达盒。

可进行所述方法以使得至少一个表达盒能够表达标记物。也就是说，至少一个表达载体可编码可充当标记物的多肽。

在本发明的方法中，可使用不根据本发明的方法产生的一个或更多个表达盒。

在本发明的方法中，提供至少两组元件序列。每组元件序列将通常地能够组装成表达盒。在本发明的背景下，表达盒旨在指示引导细胞机器制作RNA和蛋白质的核酸序列。通常地，表达盒将包含编码序列和控制所述编码序列的表达的序列。通常地，表达盒可至少包含启动子、开放阅读框架以及终止子序列。

术语“控制序列”在本文中定义为包括对于mRNA或多肽在体外或在宿主细胞内的产生必要或有利的所有成分。各控制序列对于编码多肽的核酸序列可为天然的或外源的。所述控制序列包括但不限于前导子、Shine-Delgarno序列、最优翻译启始序列(如Kozak，1991，J.Biol.Chem.266：19867-19870所述)、聚腺苷酸化序列、肽原序列、前肽原序列、启动子、信号序列以及转录终止信号。至少，控制序列通常地包含启动子以及转录终止信号(终止子或终止信号)。还可通常地存在翻译起始和停止信号。控制序列可根据其具体目的而加以优化。

术语“启动子”在本文中定义为结合RNA聚合酶并且引导聚合酶至编码生物化合物的核酸序列的正确下游转录起始位点从而启始转录的DNA序列。RNA聚合酶有效地催化与编码区的适合DNA链互补的信使RNA的组装。还应理解，术语“启动子”包括用于在转录成mRNA后翻译的5′非编码区(在启动子与翻译起点之间)、顺式作用转录控制元件如增强子，以及能够与转录因子相互作用的其它核苷酸序列。

通常地进行本发明的方法，使得表达盒的元件在骨架进入载体中进行组装，这样使得它们处于可操作连接。术语“可操作连接(operable linkage)”或“可操作连接(operably linked)”等在本文中定义为以下构型，其中控制序列被适当地放置在相对于DNA序列的编码序列的位置处，这样使得控制序列引导mRNA或多肽的产生。

因此，在本发明的背景下的元件为表达盒的任何组成部分。元件的组为可一起产生表达盒的元件的组。本发明的方法需要提供两组元件序列。这意味着提供足够的元件以使得可产生至少两种不同的表达盒。这暗含必须提供至少两种不同种类的至少一种元件。也就是说，出于本发明的目的，一种启动子与两种ORF以及两种终止信号相组合构成两组元件序列。

在本发明的方法中，通常地元件序列组中的至少两组包含启动子元件、开放阅读框架元件以及终止信号元件。

在根据本发明的方法中，元件组中的一组或更多组可包含“部分”元件序列，如UTR、信号肽以及分开的(split)开放阅读框架。

按一种形式提供每组元件序列以使得所述组可在骨架进入载体中组装成功能性表达盒。因此通常地，各元件在两侧侧翼为IIs型限制核酸内切酶切割位点，之后是其识别位点，所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得所述元件序列的组可组装成功能性表达盒。各元件序列和侧翼序列因此通常地按顺序从一端到另一端包含：IIs型限制核酸内切酶识别位点；其切割位点；元件序列；IIs型限制核酸内切酶切割位点；其识别位点。

因此，在合适载体中制备或提供的所述元件的组，其具有IIs型限制核酸内切酶识别位点和标准化的切割位点(优选4 bp)所述位点被选择成使得例如使用单锅法(如Golden gate克隆)组装后，形成功能性表达盒。

制备或提供骨架进入载体的组。这些载体含有适于使用序列同源性进行组装的左和右连接物序列，以用于在(参见图1和图2的水平1)组装模块式盒。

更详细来说，各骨架进入载体通常地按以下这种顺序包含：(i)限制酶切割位点与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的识别位点之间的插入物，任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列组装。

选择元件序列的亚组与骨架(bbn)进入载体。可例如使用Golden Gate克隆将它们进行组装，从而产生包含在骨架进入载体中的功能性表达盒。

在根据本发明的方法中，每组中的元件被限定成使得按预定顺序组装表达盒。另外，骨架进入载体中的连接物序列还被选择成使得表达盒可按预定顺序组装。

用于在靶位点处进行整合的左和右侧翼(参见图1和图2的水平2)可通过骨架进入载体本身来提供，或可作为另外的序列来添加。可经由PCR反应提供整合序列，其中它们是所用引物的一部分。

在水平2，在适合的宿主细胞中发生功能性表达盒与整合侧翼(int)和含有用于体内组装的连接物(con)序列的可能的其它DNA序列的体内组装并且在靶位点处重组。

通常地，可通过PCR反应从由水平1得到的载体回收待组装的所有DNA部分，以供在水平2使用，或例如使用经由适合的IIs限制酶以及其设计在con-载体外侧的识别位点切出这些片段的方法，并且切割在其间包含DNA序列的con-载体。

图1中的选项a和b均提供用于在靶位点处组装模块式盒的方案。在选项b中，添加另外的左和右整合位点用于第二宿主。选项b之后可以是水平3。

在水平3(参见图1和图2)，可例如经由PCR反应或其它方法从2b回收模块式盒(或部分)。所回收的DNA用于转化，并且随后在第二宿主在靶位点处整合模块式DNA盒。

在本发明的方法中，连接物序列使得能够在来自不同骨架进入载体的表达盒之间进行重组。所述序列的长度可改变，这取决于待进行的组装的类型，即体内或体外，和/或其中发生重组的种类。体内重组的连接物将通常地为约20bp至约500bp长，例如约25bp长(例如，在酵母的情况下)。例如，待在吉布森反应中体外重组的连接物长度可为约9bp、10bp、11bp、12bp、13bp、14bp、15bp或更长。

为了促进在所靶向的位点处的所靶向整合并且确保组装，提供用于整合的连接物序列。所述序列长度可为至少约20bp、至少约30bp、至少约50bp、至少约0.1 kb、至少约0.2kb至至少约0.5 kb、至少约1 kb、至少约2 kb，或至少约5kb。

图3示出水平1的组装选项(但不限于这些)，其中第iii项为在切割和连接后使用优选地单一IIs型核酸内切酶和4 bp伸出序列来组装功能性表达盒的优选方法。ii.示出开放阅读框架可分开成信号序列和开放阅读框架的独立部分，或i.以及多个片段形式的开放阅读框架，这例如是由于蛋白质的大小或模块式特征，例如具有独立的结构域的酶像PKS、NRPS、纤维素等，或仅仅由于大小或出于蛋白质工程目的，以便产生orf部分的文库序列。第iv项示出分开成3片以用于orf。第v项示出启动子分开成启动子，其中单独添加基因的5’UTR部分。应注意，这些为实例，并且基本上可设计多部分的分开DNA序列并且使用IIs型系统连接，以产生无痕的DNA序列。在所示情况下，在蛋白质的蛋氨酸起点使用AATG。此处，启动子序列的最后一个核苷酸始终修饰为A。选择TAAA来桥接终止子，其中在TAA修饰基因的终止密码子，并且终止子序列的第一位置用A修饰或在5’延伸A。应注意，为有效使用Golden Gate(或其它依赖于IIs型的克隆系统)，优选(使得)所有序列不含用于切割的限制酶的识别位点。

在本发明的方法中，可组装多个表达盒，每个盒包含生物途径成员。如本文所用，术语“途径”应广泛解释，并且可指一系列同时、连续或单独的化学反应，其通过经由一个或更多个中间物将底物或开始元件转化成终末化合物或期望产物的活性来实现。在某些实施方式中，活性有时是将底物转化为中间物或产物(例如，通过酶催化转化)并且有时是结合分子或配体。如本文所用，术语“一致途径”是指来自相关或不相关生物体的、具有相同数量和类型的活性并且产生相同的终末产物的途径。如本文所用，术语“相似途径”是指来自相关或不相关生物体的、具有以下一项或多项的途径：不同数量的活性、不同类型的活性、利用相同起始或中间分子，和/或产生相同终末产物。

根据前述权利要求中任一项所述的方法，其中在至少一组元件中的至少一种元件的变体被提供成使得产生至少一种标准化的模块式表达盒的变体。

以此方式，可例如通过利用天然存在的遗传多样性和/或改造的遗传多样性来实现途径改善和优化。可通过测试来自不同生物体的多核苷酸亚组来利用天然存在的遗传多样性。可通过测试例如已经密码子优化或突变的多核苷酸亚组来利用改造的遗传多样性。对于密码子优化的多样性，氨基酸密码子三联体可替换为其它密码子和/或可添加、去除或替换某些核苷酸序列。例如天然密码子可替换为更或更不优选的密码子。在某些实施方式中，可通过将相关或相似的活性替换为来自相似但不一致的途径的一个或多个步骤来优化途径。亚组中的多核苷酸还可遗传改变，以使得当编码时，实现不同于天然对应物的活性的活性，所述天然对应物用作起始材料用于遗传改变。本领域技术人员改变的核酸和/或氨基酸序列可称为“改造的”遗传多样性。

任何给定元件的所有变体可全部彼此共有至少约50％序列一致性。

代谢途径可视为一系列反应步骤，这些步骤将开始底物或元件转化成最终产物。各步骤可通过一种或更多种活性来催化。在其中底物A转化为终末产物D的途径中，中间物B和C产生并且通过所述途径中的特定活性转化。途径的各特定活性可视为一个种类的活性亚组，并且编码所述活性的多肽可视为一个种类的对应多肽亚组。

任何肽、多肽或蛋白质或通过一个或更多个肽、多肽或蛋白质催化的活性可通过多核苷酸亚组来编码。代表性蛋白质包括酶(例如代谢途径的部分或全部)、抗体、血清蛋白(例如白蛋白)、膜结合蛋白、激素(例如生长激素、红细胞生成素、胰岛素等)、细胞因子等，并且包括天然存在的与外源表达的多肽。代表性活性(例如，功能上相关联以在代谢途径中提供活性或活性组的酶或酶的组合)包括与期望代谢途径相关联的任何活性。如本文所用，术语“酶”可指充当催化剂以诱导其它化合物的化学变化、进而由一种或更多种底物产生一种或更多种产物的蛋白质。

应理解，在本文所呈现的实施方式中描述的方法和组合物可用于(i)优化产生期望终末产物的任何代谢途径；和/或(ii)优化代谢途径的活性亚组内的亚结构域。如本文所用，术语“蛋白质”指具有由肽键连接的氨基酸序列的分子。这个术语包括融合蛋白、寡肽、肽、环状肽、多肽以及多肽衍生物，无论是天然的还是重组的，并且还包括其片段、衍生物、同源物以及变体。蛋白质或多肽有时是胞内起源(例如体内位于宿主细胞的核内、细胞质内或间质间隙内)并且有时为体内细胞膜蛋白质。在一些实施方式中(以上所述，并且以下在改造与改变方法中进一步详细描述)，遗传修饰可导致靶标活性的改变(例如，增大、基本增大、下降或基本下降)。

在本发明的方法中，所用表达盒可构成生物学途径，该途径使得能够在宿主细胞中产生目的化合物。目的化合物为初级代谢物、次级代谢物、多肽或多肽的混合物。

因此，本发明的方法可在水平1以模块式形式使用(参见图5)。通过从水平0选择多个元件并且用在单锅Golden Gate(或其它)克隆反应中使用，产生待在水平2(图1或2)用作文库的功能性表达盒的文库，并且可与图6的步骤2组合。

所述方法可在水平2以模块式形式使用(例如，在如图1阐述的方法中)。因此，功能性表达盒的文库可被添加待经由体内组装和重组组装的一个或更多个模块，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库(参见图6)。任选地，可在水平3回收所述文库。

所述模块式方法水平2可在水平2以中间体外步骤来进行(例如在如图2所阐述的方法中)。因此，功能性表达盒的文库可添加待经由体外组装组装的一个或更多个模块(参见图7)。这个步骤可通过所得(并且可能回收的)多部分DNA序列的体内组装来进行，从而产生在靶位点处含有多样的模块式DNA盒的宿主细胞的文库。任选地，可在水平3回收所述文库。

在水平2(参见图8(A)-(E))的使用具有独特至少25 bp连接物序列的相同骨架(bbn)载体的多个变体可应用来体内产生敲除或整合构建体。水平1示出水平0的不同元件(但不限于此)可如何插入骨架载体(还参见图4)，可组装来产生侧翼为用于按规定顺序在水平2进行体内组装所要求的一个或两个连接物序列的模块式元件。这些独特连接物使得有可有效地再利用这些元件载体并且允许按组合方式直接或作为文库进行利用，以产生例如涵盖多个基因的DNA伸展序列的敲除，或在具有int-L和int-R序列的文库中使用(水平2C)，以产生在宿主细胞中具有减少的质粒、染色体或其它DNA片的宿主细胞的文库。通常地，将应用功能性标记物盒与至少一个int-L和一个int-R序列(按所述顺序处于靶位点处，但不一定连接)。

以下为数种策略(但不限于此)：(A)产生标记物的插入以置换靶位点处的orf；(B)产生标记物的插入以置换靶位点处的由int-L和int-R限定的所选择DNA部分；(C)产生标记物的插入以置换靶位点处的由作为文库添加的int-L和int-R序列的组合可能性限定的所选择DNA部分，从而导致小至较大的DNA部分被置换，这取决于选择用于至少一种染色体、质粒或其它靶标DNA的int-L与int-R序列最大距离；(D)示出部分(B)可被改变来在靶位点处插入特定元件或其部分。这可应用来以标准化的模块式方式，通过合理设计或作为文库方法交换蛋白质中的信号序列、启动子、5’UTR或模块式部分。可能的实例为启动子调谐，或另一种模块式蛋白像NRPS、PKS、纤维素酶以及其它模块式蛋白等的变体的产生；(E)示出当使用多于一种的标记物和第二组与第一组不相容的连接物序列时，可一次进行多个动作。

当然，图8所示的方法可与图1或图2所示的方法组合来使一个或更多个模块式DNA盒插入到一个或更多个靶位点，同时如图8所述、作为一个或更多个预定序列或作为文库方法(图5-7)，将标记物插入在第二位置并去除或插入DNA序列。

因此，本发明提供一般2步途径构筑法，其为快速、有效且灵活的方法，这是由于用于golden gate克隆的标准化的遗传元件与提供用于体内重组的同源性的标准化的连接物相组合。

本发明因此提供用于在靶位点处整合核酸序列的方法。

所述用于在靶位点处整合DNA序列的方法包括：

a.提供：(i)一组至少约200个碱基对长的至少两个左(int-L)和两个右(int-R)整合序列，用于同源重组至宿主细胞中的至少一个靶位点，其中：

所述左(int-L)序列侧翼为一个至少约25个碱基对的连接物序列；

所述右(int-R)序列侧翼为一个至少约25个碱基对的连接物序列；以及

(ii)至少一个表达盒，其在两侧侧翼为至少约25个碱基对的连接物序列；以及

b.通过在int-L和int-R序列的同源靶位点处重组来体内组装来自步骤(a)的至少三个序列的组，以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的靶位点处，

其中体内组装后，至少一个表达盒存在于靶位点处，任选地所述表达盒能够表达功能性标记物。

在所述方法中，至少一个表达盒可经由两种或更多种核酸序列在步骤(b)中组装，从而产生例如含有标记物多肽编码ORF的至少一个功能性表达盒。

所述方法可包括：

a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒，其中

i.所述int-L和int-R序列为启动子、orf或终止子序列的一部分；

ii.所述RF和LF连接物序列包含至少25个碱基对的同源重组序列；以及

iii.任何骨架进入载体上的RF和LF序列被选择成使得其可分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列通过体内重组进行组装；以及

b.从包含LF和RF序列的所述骨架进入载体回收表达盒；以及

c.在宿主细胞中在所述靶位点处将所回收的表达盒彼此体内重组。

用于在靶位点处整合DNA序列的方法可包括：选择两个或更多个int-L和两个或更多个int-R序列，用于在一个体内组装和重组反应中使用，从而产生多个宿主细胞，所述细胞具有通过所选择的int-L和int-R序列靶向至少2个允许的组合的DNA组合，其中：

i.至少两个int-L序列在所述靶标DNA序列处在至少一个int-R序列的左侧；或

ii.至少两个int-R序列在所述靶标DNA序列处在至少一个int-L序列的右侧。

在这些方法中，第二功能标记物盒可整合在第二靶位点处。因此所述方法可用于产生双重或三重突变体，或含有4、5、6、7、8、9、10或更多个突变的突变体。

所述方法可产生一起处于所述靶位点处的功能基因或功能基因组的功能性敲除或下调。也就是说，本发明可用于在靶位点处进行基因的缺失或敲除或敲低。

在本发明的所述方法中，至少一个int-R序列可与开放阅读框架的至少开始200个碱基对同源，并且在左侧功能性联接至待插入在开放阅读框架之前的DNA序列，从而使得开放阅读框架具有至少50个碱基对的修饰的5’UTR序列。这使得能够插入新的启动子和/或置换信号序列。

最优选为以下IIs型限制核酸内切酶：Bsal、Bbsl、BsmBI、Sapl、BspMI、Aarl、Esp31、Bpil以及Hgal。许多列举的限制核酸内切酶可从New EnglandBiolabs获得。这些酶的来源还可见以上所述的REBASE网页。

待用于本发明的连接酶的实例包括T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶，全部可从New England Biolabs商购获得。

适用于本发明的宿主细胞可包括以下特点中的一个或更多个：需氧菌、厌氧菌、丝状、非丝状、单倍体、二倍体、营养缺陷型和/或非营养缺陷型。

适用于本发明的宿主细胞可为原核微生物(例如细菌)或非原核微生物。适合的宿主细胞可为真核微生物(例如酵母、真菌、变形虫以及藻类)。适合的宿主细胞可来自非微生物来源，例如哺乳动物或昆虫细胞。

“真菌”在本文中定义为真核微生物并且包括所有真菌亚门的物种(Alexopoulos，C.J.，1962，见：Introductory Mycology，John Wiley&Sons，Inc.，New York)。术语真菌因此包括丝状真菌和酵母。“丝状真菌”在本文中定义为包括所有丝状形式的真菌亚门和卵菌门的真核微生物(如上文的Hawksworth等人，1995所定义)。丝状真菌的特征在于菌丝体壁由壳聚糖、纤维素、葡聚糖、甲壳质、甘露聚糖以及其它复杂的多糖构成。营养生长是通过菌丝伸长，并且碳分解代谢是强制好氧的。丝状真菌菌株包括但不限于以下菌株：枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、Filibasidium、铼孢属(Fusarium)、腐质霉属(Humicola)、稻痕菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、梨囊鞭菌属(Piromyces)、裂裙菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、草根霉属(Thielavia)、弯颈霉属(Tolypocladium)以及木霉属(Trichoderma)。

“酵母”在本文中定义为真核微生物，并且包括主要以单细胞形式生长的真菌亚门的所有物种。酵母可通过单细胞菌体的出芽生长或可通过生物体的裂体生长。

根据本发明的宿主细胞优选为真菌宿主细胞，其中真菌在本文中定义如上。优选的真菌宿主细胞为如下所述用于工业发酵过程以供生产发酵产物的真菌。很多种类的丝状真菌以及酵母用于所述过程中。优选的丝状真菌宿主细胞可选自以下属：曲霉属、木霉属、腐质霉属、枝顶孢属、铼孢属、根霉属(Rhizopus)、被孢霉属(Mortierella)、青霉属、毁丝霉属(Myceliophthora)、金孢子菌属(Chrysosporium)、毛霉属、类壳属(Sordaria)、脉孢菌属、粪壳菌属(Podospora)、红曲霉属(Monascus)、伞菌属(Agaricus)、密孔菌属(Pycnoporus)、裂榴菌属(Schizophylum)、栓菌属(Trametes)以及黄孢原毛平革菌属(Phanerochaete)。可用作宿主细胞、例如参考宿主细胞以便比较转化与未转化细胞的发酵特征的优选真菌菌株包括例如黑曲霉(Aspergillus niger)CBS120.49、CBS 513.88，米曲霉(Aspergillus oryzae)ATCC16868、ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892，烟曲菌(Aspergillus fumigatus)AF293(CBS101355)，黄青霉CBS 455.95、橘青霉(Penicillium citrinum)ATCC 38065、黄青霉P2，顶头孢霉(Acremonium chrysogenum)ATCC 36225、ATCC 48272，里氏木霉(Trichoderma reesei)ATCC 26921、ATCC 56765、ATCC 26921，酱油曲霉(Aspergillus sojae)ATCC 11906，Chrysosporiumlucknowense ATCC44006以及所有这些菌株的衍生物。特别优选作为丝状真菌宿主细胞的是黑曲霉CBS 513.88以及其衍生物。

任何适合的酵母可选择作为宿主细胞。优选的酵母宿主细胞可选自以下属：酵母属(Saccharomyces)(例如酿酒酵母、贝酵母(S.bayanus)、巴氏酵母(S.pastorianus)、卡氏酵母(S.carlsbergensis))、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)(例如C.revkaufi、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis))、毕赤酵母属(Pichia)(例如巴斯德毕赤酵母(P.pastoris))、裂殖酵母属(Schizosaccharomyces)、汉森酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)以及耶罗威亚酵母属(Yarrowia)(例如解脂耶罗威亚酵母(Y.lipolytica)(先前归类为解脂假丝酵母菌(Candida lipolytica))。

任何适合的原核生物可选择作为宿主细胞。可选择革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于杆状细菌(例如枯草芽孢杆菌(B.subtilis)、禾谷巨大芽孢杆菌(B.megaterium))、不动杆菌(Acinetobacterbacteria)、诺卡氏菌(Norcardia baceteria)、黄色杆菌(Xanthobacter bacteria)、弗氏埃希菌(Escherichia bacteria)(例如大肠杆菌(例如菌株DH 1 OB、Stbl2、DH5-α、DB3、DB3.1)、DB4，DB5、JDP682以及ccdA-over(例如美国申请No.09/518,188)))、链霉菌、欧文氏菌、克雷伯氏菌、沙雷氏菌(例如粘质沙雷氏菌(S.marcessans))、假单胞菌(例如铜绿假单胞菌(P.aeruginosa))、沙门氏菌(例如鼠沙门氏伤寒杆菌(S.typhimurium)、伤寒杆菌(S.typhi))。细菌还包括但不限于光合细菌(例如绿色非硫细菌(例如绿弯菌(例如C.aurantiacus)、绿丝菌(例如C.gigateum))，绿色硫菌(例如绿硫细菌(例如C.limicola)、突柄绿菌(例如P.luteolum))，紫色硫菌(例如紫硫细菌(例如傲氏着色菌(C.okenii)))以及紫色非硫菌(例如红螺菌(例如深红红螺菌(R.rubrum))、红细菌(例如类球红细菌(R.sphaeroides)、荚膜红细菌(R.capsulatus))以及红微菌(例如R.vanellii))。

来自非细菌生物的细胞可用作宿主细胞。所述细胞的实例包括但不限于昆虫细胞(例如果蝇(例如黑腹果蝇(D.melanogaster))、灰夜蛾(例如草地贪夜蛾(S.frugiperda)Sf9或Sf21细胞)以及粉斑蛾(例如High-Five细胞)；线虫细胞(例如秀丽隐杆线虫(C.elegans)细胞)；禽类细胞；两栖动物细胞(例如非洲爪蟾(Xenopus laevis)细胞)；爬虫类动物细胞；以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤以及HeLa细胞)。

在本发明中适用作宿主细胞的微生物或细胞可商购获得。

真核细胞具有至少两个独立的途径(一个经由同源重组(HR)，并且一个经由非同源重组(NHR))，通过这两个途径核酸(特别是DNA)可整合到宿主基因组中。酿酒酵母为优先同源重组(HR)的生物体。此生物体的非同源与同源重组的比率(NHR/HR)可在约0.07至0.007之间变化。

WO 02/052026公开酿酒酵母的突变体，其具有改善的DNA序列靶向到其基因组的效率。所述突变体株缺乏NHR中涉及的基因(KU70)。

与酿酒酵母不同，最高等的真核生物如丝状真菌细胞至哺乳动物细胞优先NHR。在丝状真菌中，NHR/HR比率在1与大于100之间的范围内。在所述生物体中，靶向的整合频率相当低。

这样，为改善多核苷酸在靶位点组装的效率，优选在根据本发明的方法中提高宿主细胞中同源重组(HR)的效率。

因此，优选地在根据本发明的方法中，宿主细胞的同源重组(HR)的效率被优选地诱导型地增大。

因为NHR与HR途径互相关联，因此HR的效率可通过调节一个或两个途径来增大。增大HR部件的表达将增大HR的效率，并且降低NHR/HR的比率。降低NHR部件的表达也将降低NHR/HR的比率。根据本发明的载体-宿主系统的宿主细胞中HR效率的增大优选描述为NHR/HR比率的降低，并且优选相对于亲本宿主细胞来进行计算，在所述亲本细胞中HR和/或NHR途径未经过调节。HR与NHR的效率可通过所属领域的技术人员可用的不同方法来测量。优选方法包括测定单一载体构建体在亲本与经过调节的宿主细胞中的靶向整合和异位整合的效率。然后可针对两种细胞类型技术NHR/HR的比率。随后，可计算NHR/HR比率的下降。在WO2005/095624中，全面描述了这种优选方法。

与亲本细胞相比，具有降低的NHR/HR比的宿主细胞可通过增大HR途径的效率和/或通过增大NHR途径的效率来修饰基本真核细胞来获得。优选地，NHR/HR比率因而降低至少两倍、优选至少4倍、更优选至少10倍。优选地，与亲本宿主细胞相比，在根据本发明的载体-宿主系统的宿主细胞中NHR/HR比率降低至少5％、更优选至少10％、甚至更优选至少20％、甚至更优选至少30％、甚至更优选至少40％、甚至更优选至少50％、甚至更优选至少60％、甚至更优选至少70％、甚至更优选至少80％、甚至更优选至少90％并且最优选至少100％。

根据一个实施方式，通过增大HR部件的表达水平降低NHR/HR的比率。HR部件为所属领域的技术人员所熟知。HR部件在本文中定义为在控制多核苷酸靶向整合到宿主的基因组中涉及的所有基因和元件，所述多核苷酸与宿主基因组的某预定位点具有一定同源性，其中整合是靶向的。

可通过降低NHR部件的表达水平来降低NHR/HR的比率。NHR部件在本文中定义为在控制多核苷酸整合到宿主的基因组中涉及的所有基因和元件，而不考虑所述多核苷酸与宿主的基因组序列的同源性程度。NHR部件为所属领域的技术人员所熟知。优选的NHR部件为选自以下的部件：在NHR途径中涉及的酵母基因的根据本发明的载体-宿主系统的宿主细胞的同源物或直向同源物：KU70、KU80、RAD50、MRE11、XRS2、LIG4、LIF1、NEJ1以及SIR4(van den Bosch等人，2002，Biol.Chem.383：873-892；以及Allen等人，2003，Mol.Cancer Res.1：913-920)。最优选为以下中的一个：KU70、KU80和LIG4，以及KU70与KU80二者。可使用如本文所述的用于获得必要基因的缺乏的方法实现NHR部件的表达水平的降低。

由于降低NHR中涉及的部件的表达有可导致不利表型作用，因此优选在根据本发明的载体-宿主系统的宿主细胞中，同源重组效率的增大是可诱导的。这可通过所属领域的技术人员已知的方法来实现，例如通过使用针对NHR部件的可诱导过程(例如，通过将NHR部件放置在可诱导启动子之后)或通过使用NHR部件的瞬时破坏，或通过将编码NHR部件的基因放回到基因组中。

在本发明中，可使用标记物基因(或选择标记物或标记物等)。可使用任何适合的标记物基因，并且熟知所述基因是用来确定核酸是否包含在细胞中。根据本发明制备的组装的多核苷酸可包含两种或更多种标记物基因，其中在一种标记物基因在一种生物体中有效地起作用，并且另一种标记物基因在另一生物体中有效地起作用。

标记物基因的实例包括但不限于(1)编码提供针对否则有毒的化合物的抗性的产物(例如抗生素)的核酸片段；(2)编码否则在受体细胞中缺少的产物(例如必要产物、tRNA基因、营养缺陷标记物)的核酸片段；(3)编码抑制基因产物的活性的产物的核酸片段；(4)编码可易于鉴别的产物(例如表型标记物，如抗生素抗性标记物(例如β-内酰胺酶)、β-半乳糖苷酶、荧光或其它有色标记物，如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和青色荧光蛋白(CFP)，以及细胞表面蛋白)的核酸片段；(5)结合否则对细胞存活和/或功能有害的产物的核酸片段；(6)以其它方式抑制的如以上1-5中所述的任何核酸片段的活性的核酸片段(例如反义寡核苷酸)；(7)结合修饰底物的产物(例如限制内切酶)的核酸片段；(8)可用于分离或鉴别期望分子(例如特定蛋白结合位点)的核酸片段；(9)编码否则可为非功能性的特定核苷酸序列(例如，分子亚群的PCR扩增)的核酸片段；(10)当不存在时直接或间接赋予对具体化合物的抗性或敏感性的核酸片段；(11)编码在受体细胞中的有毒或将相对无毒性的化合物转化为毒性化合物的产物(例如单纯疱疹-胸腺激酶、胞嘧啶脱氨酶)的核酸片段；(12)抑制含有其的核酸分子的复制、分割或遗传力的核酸片段；(13)编码条件性复制功能的核酸片段，例如在某些宿主或宿主细胞株中或在某些环境条件下(例如温度、营养条件等)进行复制；和/或优选为以下的必要基因：尚未示出非必要性的基因，更优选地，缺乏致使宿主细胞不能生存的基因。更优选地，必要基因为缺乏致使宿主细胞在所有条件下并且在任何培养基、特别是复杂(未定义)培养基上均不能生存的基因。在本发明的背景下必要基因可为当已使得另一(非必要)基因缺乏时使得宿主细胞不能生存的基因。

当显示出某一水平的相似性时，认为氨基酸或核苷酸序列是同源的。两个序列同源指示共同进化起源。两个同源序列是紧密相关还是更远地相关由分别为高或低的“同一性百分比”或“相似性百分比”来指示。虽然有争议，但应指出频繁地可互换地使用“同一性百分比”或“相似性百分比”、“同源程度”或“同源百分比”。出于本发明的目的，可使用数学算法完成两个序列之间的序列比较和同一性百分比的确定。所属领域的技术人员应意识到以下事实：数种不同的计算机程序可用于比对两个序列并且测定两个序列之间的同源性(Kruskal，J.B.(1983)An overview of sequencecomparison，见D.Sankoff和J.B.Kruskal，(编)，Time warps，string edits andmacromolecules：the theory and practice of sequence comparison，第1-44页Addison Wesley)。

可使用比对两个序列的Needleman和Wunsch算法测定两个核酸或氨基酸序列之间的同一性百分比(Needleman，S.B.和Wunsch，C.D.(1970)J.Mol.Biol.48，443-453)。所述算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已经在计算机程序NEEDLE中执行。出于本发明的目的，使用来自EMBOSS包的NEEDLE算法(2.8.0版或更高版，EMBOSS：欧洲分子生物学开放软件套件(The European Molecular BiologyOpen Software Suite)(2000)Rice，P.Longden，I.和Bleasby，A.Trends inGenetics 16，(6)第276-277页，http：//emboss.bioinformatics.nl/)。对于蛋白质序列，EBLOSUM62可用于取代矩阵。对于核苷酸序列，可使用EDNAFULL。可指定其它矩阵。用于比对氨基酸序列的任选参数为空位开放罚分10和空位扩展罚分0.5。所属领域的技术人员应理解所有这些不同参数将得到略微不同的结果，但当使用不同算法时两个序列的总同一性百分比不会显著改变。

同源性或同一性为两个完整序列之间的在包括任何空位或扩展的总比对区上的一致匹配的百分比。两个比对序列之间的同源性或同一性可计算如下：比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以包括空位的比对的总长度。如本文所定义的同一性可由NEEDLE获得并且在程序的输出中标记为“同一性(IDENTITY)”。

两个比对序列之间的同源性或同一性可计算如下：比对中在两个序列中示出一致氨基酸或核酸残基的对应位置的数量除以减去排列中的总空位数量后排列的总长度。如本文所定义的一致性可使用NOBRIEF选项由NEEDLE获得并且在程序的输出中标记为“最长同一性(longest-identity)”。

序列同一性还可通过在严谨条件下进行的杂交测定来确定。如本文所用，术语“严谨条件”是指杂交和洗涤条件。杂交条件为所属领域的技术人员所已知，并且可见Current Protocols in Molecular Biology，John Wiley&Sons，N.Y.，6.3.1-6.3.6(1989)。在所述文献中描述了水性和非水性方法，并且可使用任一种。严谨杂交条件的实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交，接着在0.2X SSC、0.1％SDS在50℃下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交，接着在0.2X SSC、0.1％SDS在55℃下洗涤一次或多次。严谨杂交条件的另一实例为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交，接着在0.2X SSC、0.1％SDS在60℃下洗涤一次或多次。通常，严谨杂交条件为在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交，接着在0.2X SSC、0.1％SDS在65℃下洗涤一次或多次。更通常，严谨条件为0.5 M磷酸钠、7％SDS、65℃，接着在0.2X SSC、0.1％SDS在65℃下洗涤一次或多次。

本文中对专利文献或作为现有技术给出的其它事物的引用不应视为承认文献或事物为已知的或其所含的信息为任一权利要求的优先权日时的一般常识的一部分。

本文阐述的各参考文献的公开内容是以引用的方式全部整合本文中。

通过以下实施例来进一步说明本发明。

实施例

概述

标准遗传技术如酶在宿主细胞中的过度表达以及宿主细胞的另外遗传修饰在所属领域中是已知的方法，如在Sambrook和Russel(2001)″Molecular Cloning：A Laboratory Manual(第三版)，Cold Spring HarborLaboratory，Cold Spring Harbor Laboratory Press；或F.Ausubel等人编，″Current protocols in molecular biology″，Green Publishing and WileyInterscience，New York(1987)中所述。

从酵母分离染色体DNA

使酵母细胞在旋转振荡器中在含2％葡萄糖的YEP培养基中生长(过夜、在30℃和280 rpm)。将1.5 ml这些培养物转移至埃彭道夫离心管(eppendorf tube)并且在最大速度下离心1分钟。倾倒出上清液并且使沉淀再悬浮在200μl YCPS(含0.1％SB3-14(Sigma Aldrich，荷兰)的10 mMTris.HCl pH 7.5、1 mM EDTA)以及1μl核糖核酸酶(20 mg/ml核糖核酸酶A，来自牛胰腺，Sigma，荷兰)中。将细胞悬浮液在65℃下孵育10分钟。将悬浮液在埃彭道夫离心机中在7000 rpm下离心1分钟。丢弃上清液。将沉淀小心溶解在200μl CLS(25mM EDTA、2％SDS)以及1μl核糖核酸酶A中。在65℃下孵育10分钟后，将悬浮液在冰上冷却。添加70μl PPS(10 M乙酸铵)之后，将溶液在旋涡混合器上彻底混合。离心(在埃彭道夫离心机中在最大速度下5分钟)后，将上清液与200μl冰冷异丙醇混合。DNA容易地沉积并且通过离心(5分钟，最大速度)来粒化。用400μl冰冷的70％乙醇洗涤沉淀。在室温下干燥沉淀并且溶解在50μl TE(10 mM Tris.HCl pH7.5，1mM EDTA)中。

用于Rasamsonia emersonii的一般方法

菌株

Rasamsonia(Talaromyces)emersonii菌株TEC-142于2009年7月1日保藏在CENTRAAL BUREAU VOOR SCHIMMELCULTURES，Uppsalalaan 8，邮箱85167，NL-3508 AD Utrecht，The Netherlands，保藏登记号为CBS 124902。TEC-142S为TEC-142的单一分离物。

其它适合的菌株如以上所述的菌株可同等地用在本发明的实施例中，以便示出本发明的作用和优势。例如TEC-101、TEC-142、TEC-192、TEC-201或TEC-210为适合的Rasamsonia菌株，其描述于WO2011/000949中。

培养基和溶液

马铃薯右旋糖琼脂，PDA(Fluka，目录号70139)：每升：马铃薯提取物4g；右旋糖20g；细菌培养用琼脂15g；pH5.4；在120℃下灭菌20分钟。

Rasamsonia琼脂培养基：每升：盐部分编号3 15g；纤维素30g；细菌培养用蛋白胨7.5g；谷粉15g；KH2PO4 5g；CaCl2.2aq 1g；细菌培养用琼脂20g；pH6.0；在120℃下灭菌20分钟。

盐部分组成：“盐部分编号3”符合WO98/37179表1的公开内容。与此表的组成的偏差为CaCl2.2aq 1.0g/l、KCl 1.8g/L、柠檬酸1aq 0.45g/L(螯合剂)。

用于Rasamsonia的摇瓶培养基

Rasamsonia培养基1：每升：葡萄糖20g；酵母提取物(Difco)20g；Clerol FBA3107(AF)4滴；MES 30g；pH6.0；在120℃下灭菌20分钟。

Rasamsonia培养基2：每升：盐部分编号3 10g；葡萄糖10g；KH2PO45g；NaH2PO4 2g；(NH4)2SO4 5g；MES 30g；pH5.4；在120℃下灭菌20分钟。

Rasamsonia培养基3：每升：盐部分编号3 10g；纤维素20g；KH2PO45g；NaH2PO4 2g；(NH4)2SO4 5g；MES 30g；pH5.4；在120℃下灭菌20分钟。

Rasamsonia培养基4：每升：盐部分编号3 10q；纤维素 15g；葡萄糖5g；KH2PO4 5g；NaH2PO4 2g；(NH4)2SO4 5g；MES 30g；pH5.4；在120℃下灭菌20分钟。

Rasamsonia的孢子分批制剂

使菌株在直径10cm的培养皿中在40℃下自Rasamsonia琼脂培养基上从贮备物生长5-7天。对于MTP发酵，使菌株在含有Rasamsonia琼脂培养基的96孔板中生长。将菌株贮备物在-80℃下储存在10％甘油中。

染色体DNA分离

使菌株在YGG培养基(每升：8g KCl、16g葡萄糖.H2O，20ml 10％酵母提取物、10ml 100x pen/strep、6.66g YNB+氨基酸、1.5g柠檬酸以及6gK2HPO4)中在42℃、250rpm下生长16小时，并且使用DNeasy植物小型试剂盒(Qiagen，Hilden，Germany)分离染色体DNA。

Rasamsonia的摇瓶生长方案

将孢子接种在含有20 ml Rasamsonia培养基1的100 ml摇瓶中，并且在45℃、250 rpm下在孵育振荡器中孵育1天(预培养物1)，将1或2 ml的生物质从预培养物1转移至含有20 ml Rasamsonia培养基2的100 ml摇瓶中，并且在如以上所述的条件下生长1天(预培养物2)。随后，将1或2 ml的生物质从预培养物2转移至含有20 ml Rasamsonia培养基3或4的100 ml摇瓶中，并且在如以上所述的条件下生长3天。

蛋白质分析

在还原条件下在NuPAGE 4-12％Bis-Tris凝胶(Invitrogen，Breda，荷兰)上制备蛋白质样品并且染色。将凝胶用InstantBlue(Expedeon，Cambridge，United Kingdom)、SimplyBlue safestain(Invitrogen，Breda，The Netherlands)或Sypro Ruby(Invitrogen，Breda，The Netherlands)根据制造商的说明书进行染色。

总蛋白含量

根据布拉德福(Bradford)法测定所回收上清液的蛋白含量。用布拉德福蛋白测定使用考马斯(Coomassie)蛋白试剂测定酶样品中的蛋白量。将25μl适当稀释的酶样品与1.2 ml考马斯试剂混合。在室温下10分钟后，使用分光光度计(Uvikon XL)测定混合物在595 nm下的吸光度。与BSA标准相比较来计算蛋白含量。

玉米秸秆测定

为了测量纤维素酶活性，进行玉米秸秆活性测定。在空菌株和转化株的上清液中(其中培养细胞的培养液的液体部分)测量纤维素酶活性。

制备预处理的玉米秸秆底物

如Schell，D.J.，Applied Biochemistry and Biotechnology(2003)，第105-108卷，第69-85页所述获得稀酸预处理的玉米秸秆。使用在190℃、1分钟停留时间以及在液相中1.45％(w/w)有效H2SO4酸浓度的稳态条件下操作的试验性规模的预处理反应器。

在2％未洗涤的酸预处理的玉米秸秆上测量纤维素酶活性

由于纤维素酶的葡萄糖释放不是组合物中酶的量的线性函数，换句话说，在固定的时间点两倍的酶量不会自动产生两倍的葡萄糖量。因此，在基于剂量应答的测定中评价了纤维素酶混合物的活性，其中剂量是基于每单位所测试纤维素混合物相等量的蛋白。

用未洗涤的酸预处理的玉米秸秆作为底物测量混合物的总纤维素酶活性。将冷冻的酶样品解冻，在pH 4.5的50 mM柠檬酸盐缓冲液中逐步按两倍进行范围从未稀释至高达32倍的一系列6个稀释。

将200μl样品转移至含有800μL于50 mM柠檬酸盐缓冲液(缓冲在pH4.5)中酸预处理玉米秸秆的2.5％(w/w)干物质的小瓶中。将另外200μl样品转移至含有800μl的50 mM柠檬酸盐缓冲液(缓冲在pH 4.5)的称为空白的小瓶中。另外，通过用200μl的50 mM柠檬酸盐缓冲液孵育800μl的在50 mM柠檬酸盐缓冲液(缓冲在pH 4.5)中酸预处理玉米秸秆的2.5％(w/w)干物质来测定玉米秸秆的糖背景值。所有小瓶均在65℃下孵育72 h。

孵育后，将100μl内标溶液(20 g/L马来酸，于D2O中40 g/L EDTA)添加至小瓶。将含有预处理的玉米秸秆的所有小瓶在5300 g下离心30分钟，并且随后将600μl上清液转移至含有400μl H2O/D2O 9∶1的新小瓶。

使用具有水抑制的脉冲程序，在27℃的温度下，在于500 MHz的质子频率下操作的Avance III Bruker上记录1D 1H-NMR光谱。相对于与6.30ppm的内标信号有关的4，4-二甲基-4-硅杂戊烷磺酸，基于5.20 ppm的信号进行葡萄糖量化(任意单位)。通过酶溶液中存在的残余糖(由空白测量)和酸预处理的玉米秸秆中存在的残余糖来校准在样品中测量的葡萄糖，来计算相对葡萄糖释放(ΔGlc)。

由于样品的蛋白质浓度是已知的，因此糖释放可描述为所测试的稀释样品的蛋白质mg/ml与在时间点72小时的相对葡萄糖释放的函数。

实施例1：酵母的标准化的途径构筑系统

1.1酵母的标准化的途径构筑系统的一般介绍

此方法使得能够以大的灵活性将基因/途径快速引入酵母(酿酒酵母)基因组中。水平一(参见图9)聚焦于使用称为“Golden Gate克隆”的方法(EnglerC.等人(2008)PLoS ONE 3(11)：e3647以及Engler C.等人(2009)PLoSONE 4(5)：e5553)，将所谓的标准化的遗传元件、启动子、开放阅读框架(ORF)以及终止子克隆到侧翼为标准化的50 bp连接物的功能性表达盒中。

标准化的50 bp连接物为骨架进入载体的一部分并且在水平二使用(参见图9)，其中标准化的50 bp连接物提供多个表达盒之间的必要同源性，使得其经由体内同源重组作为途径构筑并整合到酵母基因组中。

期望的遗传元件(例如启动子、开放阅读框架(ORF)以及终止子)的设计的标准化与标准化的连接物的使用相结合在克隆和转化过程中实现最大速度和灵活性。

图9为标准化的途径构筑方法的示意性图示。在本文所述的实施例中，使用所述方法来测定一组启动子和终止子对五种所选报道基因的表达的影响。

1.2设计遗传元件启动子、ORF以及终止子

根据标准设计各遗传元件，使得可以用IIs型限制酶Bsal将元件克隆到载体中，因而产生包含启动子、ORF以及终止子的功能性表达盒。

首先，通过引入点突变，使所有元件的内部Bsal位点去除。对于ORF，避免氨基酸序列变化。对于启动子和终止子，选择点突变以不影响(就我们所知)元件的功能性。各元件在两侧提供有4nt桥与Bsal识别位点的组合。Bsal识别位点放置成使得用IIs型限制酶切割产生标准化的4核苷酸伸出序列，其称为“桥”。以此方式，设计了30个启动子(SEQ ID NO：1至30)、5个ORF(报道基因；SEQ ID NO：31至35)以及14个终止子(SEQ ID NO：36至49)的组。下文更详细地描述针对各元件的具体规则，以针对启动子的规则开始，接着是ORF和终止子。

启动子的具体设计规则

-如以上所述，从启动子序列去除所有Bsal位点

-对于大部分启动子，标准化的大小设定为600个碱基对；例外为先前已示出更大或更短启动子为较佳选择或历史上已设定为某一长度的情况。

-序列

5’GGTCTCGGTGC+(启动子序列-最后bp)+AATGGGAGACC 3’

-在启动子的5’部分的GTGC(加下划线)为至骨架进入载体的4核苷酸序列桥(1.3中进行讨论)

-在启动子的3’部分的AATG(加下划线)为至ORF的4核苷酸序列桥，其中ATG为ORF的起始密码子并且AATG的第一个A为启动子序列的标准化的最后碱基对A

ORF的具体设计规则

-从ORF序列去除所有Bsal位点

-序列

5’GGTCTCGAATG+(ORF序列)+TAAAGGAGACC 3’

ORF序列没有终止和起始密码子(包括在4 nt桥中)

-在ORF的5’部分的AATG(加下划线)为至启动子序列的4核苷酸桥

-在ORF的3’部分的TAAA(加下划线)为至终止子序列的4核苷酸桥

终止子的具体设计规则

-从终止子序列去除所有Bsal位点

-序列

5’GGTCTCGTAAA+(终止子序列)+CCTCGGAGACC

-在终止子的5’部分的TAAA(加下划线)为至ORF序列的4核苷酸桥

-在终止子的3’部分的CCTC(加下划线)为至骨架进入载体的4核苷酸桥(在1.3中讨论)

通过DNA2.0(Menlo Park，CA USA)在具有大肠杆菌氨比西林抗性标记物的标准载体中合成并克隆所有遗传元件(启动子、ORF以及终止子)。DNA2.0使用的标准大肠杆菌克隆载体在SEQ ID NO：50中阐述。

1.3设计骨架进入载体

骨架进入载体构建成具有两个Bsal位点，其在切割后产生克隆至表达载体中(即组装的启动子、ORF以及终止子组合)的4核苷酸桥/粘性端。为改善Golden Gate克隆反应的效率，将用于在大肠杆菌中逆选择的ccdB基因定位在Bsal位点之间。这防止选择原始骨架载体。此外，骨架进入载体具有用于骨架质粒在大肠杆菌中的增殖的卡那霉素选择标记物，这与用于含有输入元件(启动子、ORF以及终止子)的载体的氨比西林标记物不同。因此，使用对卡那霉素的选择来防止对元件载体的不需要的选择。

骨架进入载体的另一重要特征为标准化的50bp序列，其称作“连接物”。连接物提供用于在标准化的途径构筑方法的水平2进行重组所必要的同源性。连接物侧翼为4nt桥，其方式使得在载体中克隆启动子、ORF以及终止子后，所产生的表达盒左和右侧翼为连接物。

称为连接物5、连接物A至连接物K以及连接物3(SEQ ID NO：51至63)的十三个独特50 bp连接物设计成对酵母基因组不含任何同源性的随机序列。这些连接物序列用来设计表1中所列的22个骨架载体。

表1：具有连接物的所有骨架进入载体和对应SEQ ID识别符

SEQ ID NO：64至85中所列的序列为通过DNA2.0合成并且克隆到标准大肠杆菌载体中以产生骨架载体的具体序列。用于克隆SEQ ID NO：64至85的大肠杆菌载体含有卡那霉素标记物，且其序列示于SEQ ID NO：86。

骨架载体实现两个重要的供能。一，其含有至启动子和终止子的桥，从而使得有可以在Golden Gate反应中使环闭合。二，其用连接物修饰表达盒，以用于体内重组步骤(称为水平2)。例如，在Sc 5A.bbn中用Golden Gate反应克隆表达盒将在表达盒的左部分装备连接物5并且在右部分装备连接物A。表1中所列的具有所设计连接物的骨架进入载体的组在DNA2.0(Menlo Park，CA USA)定制并合成。在下文总结骨架进入载体的所有特征。

总结骨架的具体设计

-大肠杆菌载体序列具有卡那霉素标记物(SEQ ID NO：86)

-两个Bsal位点，其在切割后产生与启动子的5’和终止子的3’上的桥相容的4 nt桥

-用定位在Bsal位点之间的ccdB序列逆选择

-连接物序列在桥左和右

-通过DNA2.0在载体中定制并克隆的实际序列的设计：5’L con-GTGCGGAGACC-ccdB序列-GGTCTCGCCTC-R con 3’

○ GTGC(加下划线)至启动子的5’部分的桥

○ CCTC(加下划线)至终止子3’部分的桥

○ “L con”和“R con”分别为左连接物序列和右连接物序列

1.4用Golden Gate克隆组装表达盒

按照Golden Gate克隆的出版物(Engler C.等人(2008)PLoS ONE 3(11)：e3647以及Engler C.等人(2009)PLoS ONE 4(5)：e5553)中所描述的进行组装。在单锅反应中，与三元件输入载体以及骨架进入载体组合添加Bsal和连接酶。最优选的反应条件为37℃下2分钟并且16℃下5分钟的50个循环的反应。通常地，通过对完整插入物测序来检查2个克隆。当示出两个克隆均不正确时，用测序来检查其它克隆。所有组装的表达盒的列表可见表2。

表2：用golden gate反应克隆到骨架进入载体中的所有表达盒的概况

组装编号	启动子元件	ORF 元件	终止子元件	骨架
					组装1	Sc ENO1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装2	Sc PDC1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装3	Sc ENO2.pro	vGFP	ADH1终止子	Sc 5a.bbn
组装4	Sc FBA1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装5	Sc PGl1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装6	Sc PGK1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装7	Sc GPM1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装8	Sc PMA1_1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装9	Sc OYE2.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装10	Sc TAL1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装11	Sc TDH1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装12	Sc TDH3.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装13	Sc TEF1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装14	Sc TPl1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装15	Sc ACT1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装16	Ag Tef1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装17	Sc PRE3.pro	vGFP	ADH1 终止子	Sc 5a.bbn
组装18	Sc VPS68.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装19	Sc ENO1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装20	Sc PDC1.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装21	Sc ENO2.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装22	Sc FBAI.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装23	Sc PGl1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装24	Sc PGK1.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装25	Sc GPM1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装26	Sc PMA1_1.pro	LacZ	ADH2 终止子	Sc bc.bbn

组装27	Sc OYE2.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装28	Sc TAL1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装29	Sc TDH1.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装30	Sc TDH3.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装31	Sc TEF1.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装32	Sc TPl1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装33	Sc ACT1.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装34	Ag Tef1.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装35	Sc PRE3.pro	LacZ	ADH2 终止子	Sc bc.bbn
					组装36	Sc VPS68.pro	LacZ	ADH2 终止子	Sc bc.bbn
组装37	Sc ENO1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装38	Sc PDCI.pro	RFP	ENO1 终止子	Sc c3.bbn
组装39	Sc ENO2.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装40	Sc FBA1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装41	Sc PGl1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装42	Sc PGK1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装43	Sc GPM1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装44	Sc PMA1_1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装45	Sc OYE2.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装46	Sc TAL1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装47	Sc TDH1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装48	Sc TDH3.pro	RFP	ENO1 终止子	Sc c3.bbn
组装49	Sc TEF1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装50	Sc TPl1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装51	Sc ACT1.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装52	Ag Tef1.pro	RFP	ENO1 终止子	Sc c3.bbn
组装53	Sc PRE3.pro	RFP	ENO1 终止子	Sc c3.bbn
					组装54	Sc VPS68.pro	RFP	ENO1 终止子	Sc c3.bbn
组装55	Sc ACT1.pro	vGFP	ADH1 终止子	Sc 5a.bbn
					组装56	Sc ACT1.pro	vGFP	ADH2 终止子	Sc 5a.bbn
组装57	Sc ACT1.pro	vGFP	ENO1 终止子	Sc 5a.bbn
					组装58	Sc ACT1.pro	vGFP	GPM1 终止子	Sc 5a.bbn
组装59	Sc ACT1.pro	vGFP	PDC1 终止子	Sc 5a.bbn
					组装60	Sc ACT1.pro	vGFP	PCI1 终止子	Sc 5a.bbn
组装61	Sc ACT1.pro	vGFP	PGK1 终止子	Sc 5a.bbn
					组装62	Sc ACT1.pro	vGFP	PMA1 终止子	Sc 5a.bbn
组装63	Sc ACT1.pro	vGFP	TAL1 终止子	Sc 5a.bbn
					组装64	Sc ACT1.pro	vGFP	TDH1 终止子	Sc 5a.bbn
组装65	Sc ACT1.pro	vGFP	TDH3 终止子	Sc 5a.bbn
					组装66	Sc ACT1.pro	vGFP	TEF1 终止子	Sc 5a.bbn
组装67	Sc ACT1.pro	vGFP	TEF2 终止子	Sc 5a.bbn
					组装68	Sc ACT1.pro	vGFP	TPI1 终止子	Sc 5a.bbn

组装69	Sc ENO1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装70	Sc PDC1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装71	Sc ENO2.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装72	Sc FBA1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装73	Sc PGl1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装74	Sc PGKI.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装75	Sc GPM1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装76	Sc PMA1_1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装77	Sc OYE2.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装78	Sc TAL1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装79	Sc TDH1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装80	Sc TDH3.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装81	Sc TEF1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装82	Sc TPI1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装83	Sc ACT1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装84	Ag Tef1.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装85	Sc PRE3.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
					组装86	Sc VPS68.pro	GFPmut3	ADH1 终止子	Sc 5a.bbn
组装87	Sc ENO1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装88	Sc PDCI.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装89	Sc ENO2.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装90	Sc FBA1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装91	Sc PGl1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装92	Sc PGKI.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装93	Sc GPM1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装94	Sc PMA1_1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装95	Sc OYE2.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装96	Sc TAL1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装97	Sc TDH1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装98	Sc TDH3.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装99	Sc TEF1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装100	Sc TPI1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装101	Sc ACT1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装102	Ag Tef1.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装103	Sc PRE3.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
					组装104	Sc VPS68.pro	GFP-pest	ADH1 终止子	Sc 5a.bbn
组装105	KLLA0A09185g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装106	KLLA0A11011g	vGFP	ADH1 终止子	Sc 5a.bbn
组装107	KLLA0B08998g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装108	KLLA0B14839g	vGFP	ADH1 终止子	Sc 5a.bbn
组装109	KLLA0B14883g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装110	KLLA0C05566g	vGFP	ADH1 终止子	Sc 5a.bbn

组装111	KLLA0D00979g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装112	KLLA0D07634g	vGFP	ADH1 终止子	Sc 5a.bbn
组装113	KLLA0E01057g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装114	KLLA0F18260g	vGFP	ADH1 终止子	Sc 5a.bbn
组装115	KLLA0F20031g	vGFP	ADH1 终止子	Sc 5a.bbn
					组装116	KLLA0F20988g	vGFP	ADH1 终止子	Sc 5a.bbn

1.5制备和纯化PCR片段用于转化

用一标准组的结合至连接物的引物进行自质粒对具有连接物序列的表达盒的扩增。引物阐述在SEQ ID NO：87至110中，并且按连接物和扩增的方向命名。例如，“con 5 fw”为连接物5上的正向引物。在此实验中，仅使用引物的亚组。表3示出用于在PCR反应中使用的对应PCR模板的引物。根据手册用Phusion聚合酶(Finnzymes)进行PCR反应。

表3：产生装备有在转化酿酒酵母中使用的连接物的表达盒的所有PCR反应的概况

显性标记物KanMX(赋予G418抗性)用于在酵母中选择。用添加连接物a的正向引物5950(SEQ ID NO：111)和添加连接物b的反向引物5951(SEQ ID NO：112)使用含有此标记物的标准质粒作为模板进行PCR扩增。因此将标记物盒放置在位置ab。所得PCR片段用在所有转化中(SEQ ID NO：113)。

对于实施例，将构建体整合到本文称为INT1的染色体XV的基因间区中。用正向引物02500(SEQ ID NO：114)和添加连接物5的反向引物05510(SEQ ID NO：115)PCR扩增用于整合到酿酒酵母的基因组的染色体INT1位点的左侧翼。具有连接物5的左侧翼序列阐述为SEQ ID NO：116。用添加连接物序列3的正向引物05511(SEQ ID NO：117)和反向引物02523(SEQ ID NO：118)PCR扩增用于整合到酿酒酵母的基因组的染色体INT1位点中的右侧翼。具有连接物3的右侧翼序列示于SEQ ID NO：119中。从CenPK-1137D分离的染色体DNA用作模板。在侧翼上所添加的连接物5和3提供与表达盒的同源性。转化过程中添加的所有DNA片段、整合侧翼、表达盒以及标记物盒能够经由连接物重组，并且完整组装的片段能够在INT1位点整合到基因组中。

用标准琼脂糖电泳技术来检查所有扩增的PCR片段的大小。用来自Qiagen的PCR纯化试剂盒根据手册来纯化PCR扩增的DNA片段。使用A260/A280在Nanodrop ND-1000分光光度计上测量DNA浓度。在纯化后未获得足够的PCR产物时，进行另外的PCR反应和纯化直到可获得足够量的DNA。

1.6转化片段至酿酒酵母

如Gietz和Woods(2002；Transformation of the yeast by the LiAc/SScarrier DNA/PEG method.Methods in Enzymology 350：87-96)所述进行酿酒酵母的转化。用1μg各扩增和纯化的PCR片段来转化CEN.PK1137D(MATaURA3 HIS3 LEU2 TRP1 MAL2-8 SUC2)。

表4示出所进行的转化的概况，和针对各转化添加的PCR片段。各转化将产生GFP、KanMX标记物、lacZ以及RFP整合到基因组上的INT1位点中的“报道基因途径”。

表4：转化和针对各的转化添加的片段的概况

转化程序之后，并且在回收时，将混合物铺板在含有G418(400μg/ml)的YEPhD琼脂(BBL植物蛋白胨20.0g/l、酵母提取物10.0 g/l、氯化钠5.0g/l、琼脂15.0 g/l以及2％葡萄糖)上。在30℃下孵育3天后，菌落出现在板上，而阴性对照(即，未在转化实验中添加DNA)产生空板。每个转化挑取四个菌落，并且转移至含有具有G418(200μg/ml)的240μl YEPhD琼脂的MTP。将MTP板在30℃下孵育3天。这些板用作进一步分析菌株的来源。

1.9MTP孵育后对转化株的报道基因测定

使酵母菌株在MTP中在标准条件下生长至对数期末期。对于所有测定和测量，将培养物稀释10倍。

用uQuant微孔板分光光度计(BioTek Instruments，Inc，US)在每孔含有200μl的10倍稀释的培养物的MTP板中测量OD600。对于LacZ测定，将70μl的10倍稀释的培养物用在测定中，所述方法如所用的酵母β-半乳糖苷酶测定试剂盒(Thermo Scientific)的手册中所述进行。在420 nm用uQuant读板仪测量吸收，作为lacZ测定的结果。用针对所测量的OD600的校准因子计算各培养物的最终lacZ活性。用Fluostar读板仪(BMG Labtech，US)测量GFP荧光(激发485 nm，发射538 nm，增益55)和RFP荧光(激发544 nm，发射620 nm，增益70)。

将结果进一步处理成图像。图10示出基于所获得的vGFP表达结果的启动子的排序。大约90％的转化株示出一致的结果，来自相同转化的转化株组中的报道基因的表达水平的结果具有低差异，从而示出了所述方法的功效。例外主要为没有表达任何报道基因的转化株。这些转化株从图上省去；其被视为标记物的随机整合株。对于各启动子，不同报道基因测定之间有良好的相关性。这在图11中针对lacZ和vGFP的表达示出。此规则的例外为其中遗传元件在报道基因途径中被使用两次的转化。例如，当启动子pACT1用于表达vGFP和RFP时，结果示出表达数据的更大变化，从而指示由于内部同源性导致的可能的不正确整合。图12示出终止子对GFP表达的影响。再次，观察到了每个终止子各系列的4个测试菌落内的小差异，从而指示正确转化株的高百分比。结果清楚地示出终止子可显著影响GFP的表达。

GFP的不稳定蛋白变体GFPmut和GFP-pest不如vGFP那样进行良好(低至极低GFP信号)，并且因此未携带在呈现的结果中。

可从这些结果得出以下结论：所述方法以高效率和功效实现了基因或完整途径到宿主的引入。

实施例2：在酿酒酵母中构筑用于衣康酸产生的代谢途径

2.1步骤1：由生物砖构筑表达构建体

如实施例1，启动子、开放阅读框架以及终止子为根据本专利中所述的标准规则设计的所有单独的DNA序列。通过DNA2.0在标准克隆载体中合成并且克隆序列。具体合成了SEQ ID NO：120、121、122、123、124以及125所有开放阅读框架的核苷酸序列，用于构建供在酿酒酵母产生衣康酸的代谢途径(对于细节，参见表5以及序列表)。开放阅读框架与实施例1所述启动子、终止子以及骨架载体的组一起用在golden gate反应中，从而产生如表6所示的盒。所形成的表达盒(盒117、盒120、盒133、盒136、盒124以及盒26)用作模板，以PCR扩增转化中所用的DNA片段。

表5：在酿酒酵母中构建至衣康酸的代谢途径中所涉及的ORF的说明

核酸	Id*	UniProt	生物体
				SEQ ID NO：120	ITE_01	Q0C8L2	土曲霉(A.terreus)
SEQ ID NO：121	CAD_01	mCAD3	土曲霉
				SEQ ID NO：122	ACO_01	A7A1I8	酿酒酵母
SEQ ID NO：123	PYC_01	P32327	酿酒酵母
				SEQ ID NO：124	CTP 01	Q04013	酿酒酵母
SEQ ID NO：125	QTP_01	P32332	酿酒酵母

2.2制备和纯化PCR片段用于转化

根据实施例1所述的方法进行衣康酸途径的组装和整合。用标准组的结合至连接物的引物进行自质粒对具有连接物序列的表达盒的扩增。引物阐述在SEQ ID NO：87至110中，并且按连接物和扩增的方向命名。例如，“con 5 fw”为连接物5上的正向引物。在此实验中，仅使用引物的亚组。

表6示出用于在PCR反应中的对应PCR模板的引物。根据手册用Phusion聚合酶(Finnzymes)进行PCR反应。

表6：用于产生在转化酿酒酵母中使用的装备有连接物的表达盒的所有盒、盒的内容物以及引物组合的概况

扩增显性标记物KanMX，使用含有所述片段的标准质粒作为模板DNA。通过PCR使用CEN.PK113-7D基因组DNA作为模板扩增5’和3’INT1缺失侧翼。所用的显性标记物、整合侧翼以及引物与实施例1所描述的相同。用标准琼脂糖电泳技术检查PCR片段的大小。根据手册，用Macherey-Nagel的磁性珠粒试剂盒纯化PCR扩增的DNA片段。使用GC biotech的测量DNA浓度。

2.3转化片段至酿酒酵母

如Gietz和Woods(2002；Transformation of the yeast by the LiAc/SScarrier DNA/PEG method.Methods in Enzymology 350：87-96)所述进行酿酒酵母的转化。

用高至1μg的各扩增和纯化的PCR片段转化CEN.PK1137D(MATaURA3 HIS3 LEU2 TRP1 MAL2-8 SUC2)。转化将产生“衣康酸途径”，其中衣康酸盒和KanMX标记物整合到基因组上的INT1位点中。将转化混合物铺板在含有G418(400μg/ml)的YEPhD-琼脂(BBL植物蛋白胨20.0g/l、酵母提取物10.0 g/l、氯化钠5.0 g/l、琼脂15.0 g/l以及2％葡萄糖)上。在30℃下孵育3天后，菌落出现在板上，而阴性对照(即，未在转化实验中添加DNA)产生空板。

2.4培养转化株

挑取转化的两个单一菌落并且转移至含有200μl YEPhD-琼脂的MTP琼脂孔，YEPhD-琼脂含有400μg/ml G418。将板在30℃下孵育3天后，通过用针具转移一些菌落材料将菌落接种MTP板中，所述板具有标准盖，每孔含有200μL Verduyn培养基(Verduyn等人.，Yeast 8：501-517，1992，其中(NH4)2SO4用2 g/l脲置换)，所述培养基具有基于淀粉的C源和在培养期间提供葡萄糖的释放的酶。作为对照，使空菌株CEN.PK1 137D在相同生长方案中生长。在MTP振荡器(INFORS HT Multitron)中在30℃、550 rpm以及80％湿度下孵育MTP 72小时。在此预培养阶段之后，通过将80μl的培养液转移至4 ml Verduyn培养基(同样用脲置换(NH4)2SO4)来开始产生阶段，所述培养基具有基于淀粉的C源和在培养期间提供葡萄糖的释放的酶。在振荡器中在550 rpm、30℃以及80％湿度下生长7天后，将板在HeraeusMultifuge 4中在2750 rpm下离心10分钟。用下文描述的LC-MS法测量上清液中的衣康酸水平。

2.5检测样品中的衣康酸

用于测定衣康酸和Krebs循环中的其它化合物的UPLC-MS/MS分析法。Waters HSS T3柱1.7μm、100 mm*2.1 mm用于通过梯度洗脱来分离衣康酸、丁二酸、柠檬酸、异柠檬酸、苹果酸以及富马酸。洗脱剂A由含有0.1％甲酸的LC/MS等级水组成，并且洗脱剂B由含有0.1％甲酸的乙腈组成。流速为0.35 ml/分钟并且柱温度保持恒定在40℃下。梯度始于95％A并且在10分钟内线性增加至30％B，在30％B保持2分钟，然后立即变化至95％A并且稳定5分钟。所用注射体积为2μl。

使用多反应监控(MRM)，Waters Xevo API用在负电离模式的电喷(ESI)中。离子源温度保持在130℃，而脱溶剂温度为350℃，流速为500 L/小时。

对于衣康酸和Krebs循环的其它化合物，用10 eV使去质子化的分子碎裂，从而由失去H2O和CO2产生特定片段。分析掺入空白发酵培养液中的参考化合物标准以确认停留时间，计算各离子的应答因子，并且用于计算发酵样品中的浓度。将样品在洗脱剂A中适当稀释(5-25倍)以在LC-MS分析过程中克服离子抑制和基体效应。为确认所分析化合物的元素组成，用与以上所述相同的色谱系统进行准确质量分析，所述系统联接至LTQ orbitrap(ThermoFisher)。使用NaTFA混合物(参考)在恒定注入模式下进行质量校正，其方式使得在实验设置过程中，所分析的准确质量可拟合在距离所分析的所有化合物的理论质量2 ppm内。在所转化菌株的样品中发现95 mg/l的衣康酸浓度，空菌株不产生衣康酸。

2.6转化株的遗传分析

进行遗传分析以示出盒在转化株的基因组中的正确整合。分离基因组DNA并且使用PCR反应来示出盒的正确整合和组装。用phusion聚合酶根据手册进行PCR。用于分析的PCR反应和引物对列在表7中。在0.8％琼脂糖凝胶上使用标准电泳技术分析来自各PCR反应的5μl。

表7：PCR反应，其对应的引物对组合以及各PCR结果的预期带大小

PCR反应	克隆	正向引物	反向引物	预期带大小
					1.1	1	con 5 fw	con b rev	3.8 kb
2.1	2	con 5 fw	con b rev	3.8 kb
					1.2	1	con b fw	con d rev	5.7 kb
2.2	2	con b fw	con d rev	5.7 kb
					1.3	1	con d fw	con f rev	6.5 kb
2.3	2	con d fw	con f rev	6.5 kb

图13示出来自结果的图片。转化株给出预期的带大小作为PCR的结果。PCR反应和衣康酸产生结果清楚地示出活性衣康酸代谢途径正确整合在酵母基因组中。因此证明了本文所述方法的效率和有效性。

实施例3：在Rasamsonia emersonii中的标准化的途径构筑

3.1 Rasamsonia emersonii中的标准化的途径构筑系统的总体介绍

此方法能够将基因/途径快速引入到丝状真菌Rasamsonia emersonii中。水平1(参见图9)聚焦于使用称为“Golden Gate克隆”的方法(Engler C.等人(2008)PLoS ONE 3(11)：e3647；以及Engler C.等人(2009)PLoS ONE 4(5)：e5553)，将所谓的标准化的遗传元件启动子、开放阅读框架(ORF)以及终止子克隆到功能性表达盒中。使用吉布森克隆(Gibson DG，Young L，ChuangRY，Venter JC，Hutchison CA三世，Smith HO.(2009).″Enzymatic assemblyof DNA molecules up to several hundred kilobases″.Nature Methods 6(5)：343-345)进行多个表达盒的组装(水平2)。

在两个载体的一个中克隆多个盒片段，其中插入片段一起可应用在所谓的“二分基因靶向法”中(Nielsen等人.，2006，43：54-64)。此方法使用选择标记物的重叠的两个非功能性DNA片段(对于二分法的进一步细节还参见WO2008113847)与基因靶向序列。在正确同源重组时，选择标记物通过整合在同源靶位点处变得有功能。在该实例中，盒靶向RePepA位点。如于WO 2008113847中所详述，设计两个不同的缺失载体Te pep.bbn和pEBA1006，并且将其构建成能够为二分基因靶向提供两个重叠的DNA分子。Te pep.bbn为适于Golden gate克隆的骨架进入载体。

3.2构建可应用在二分基因靶向中的骨架进入载体和第二表达载体

构建适合用于靶向整合到RePepA位点中的骨架进入载体。对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。在基因组中鉴别具有注释为蛋白酶pepA的翻译蛋白的基因。包含ORF的基因组序列以及约3000 bp的5’区和2500 bp的3’侧翼区的Rasamsonia emersoniipepA(RePepA)序列、cDNA以及蛋白序列的分别示出在SEQ ID NO：126、127以及128中。

如以上所述，根据常规克隆程序构建两个载体用于靶向到RePepA位点中。第一载体Te pep.bbn(总体布局如图14)包含在RePepA ORF上游约1.5 kb用于靶向到RePepA位点中的1500 bp 5’侧翼区(ORF和约1500 bp的RePepA启动子)、lox66位点以及由构巢曲霉gpdA启动子驱动的ble编码区的非功能性5’部分(PgpdA-ble序列，其遗失了在ble的3’端的编码序列的最后104个碱基，SEQ ID NO：129)。为允许在大肠杆菌中有效克隆表达盒，将ccdB基因插入5’RePepA侧翼区与lox66位点之间。ccdB盒侧翼为桥和Bsal位点，其允许连接启动子、ORF、终止子盒，如实施例1所述。

第二pEBA1006载体(总体布局如图15)包含ble编码区的非功能3’部分和构巢曲霉trpC终止子(ble-TtrpC序列，其遗失在ble的5’端的编码序列的前12个碱基，SEQ ID NO：130)、lox71位点以及RePepA ORF的用于靶向到RePepA位点的2500 bp 3’侧翼区。在同源重组时，第一和第二非功能性片段变得有功能，从而产生功能性ble盒。RePepA上游和下游基因侧翼区靶向二分片段在预定RePepA基因组位点的同源重组。

3.3用Golden Gate克隆组装表达盒

如实施例1所述，使用Golden gate克隆通过表达盒置换载体Te pep.bbn中的ccdB基因，从而得到表达质粒pEBA328和pEBA332。pEBA328的表达盒由以下组成：由SEQ ID NO：131表示的黄青霉Paf启动子、由SEQ IDNO：132表示的嗜热篮状菌GH61 ORF以及由SEQ ID NO：133表示的黄青霉penDE终止子。pEBA332的表达盒由以下组成：由SEQ ID NO：134表示的R.emersonii启动子2、由SEQ ID NO：135表示的绵毛嗜热丝孢菌GH61ORF以及由SEQ ID NO：136表示的构巢曲霉AmdS终止子。pEBA328的示意性图解在图16中示出，其为pEBA332的代表。

3.4制备和纯化PCR片段用于吉布森克隆

使用表8中所列的引物和模板进行从pEBA328和pEBA332表达质粒的表达盒的扩增。

表8：用于扩增PCR片段以用于吉布森克隆的引物和模板的概况

吉布森片段	模板	正向引物	反向引物
				EBA328盒	pEBA328	5′pepA-Ppaf(SEQ ID NO：137)	TpenDE(SEQ ID NO：138)
EBA332盒	pEBA332	TpenDE-Ppra(SEQ ID NO：139)	Tanid_amds(SEQ ID NO：140)
				载体	pEBA328	Tanid_amds-loxP-gpd-ble(SEQ ID NO：141)	5′pepA(SEQ ID NO：142)

2.5使用吉布森克隆组装多盒构建体

通过吉布森克隆获得表达载体pEBA328-332(总体布局如图17)。如Gibson DG，Young L，Chuang RY，Venter JC，Hutchison CA三世，Smith HO.(2009).″Enzymatic assembly of DNA molecules up to several hundredkilobases″.Nature Methods 6(5)：343-345中所述进行吉布森克隆反应。更具体说，使用http：//2010.igem.Org/Team：Newcastle/Gibson Cloning中所描述的方案。在吉布森反应中，使用75 ng的载体片段、37 ng的EBA328以及37ng的EBA332片段。根据常规克隆程序进行构建体的大肠杆菌转化、DNA分离以及限制酶分析。

实施例4：在Rasamsonia emersonii中灭活ReKu80基因以改善基因靶向

此实施例描述了R.emersonii Ku80基因的克隆和缺失，以改善基因靶向。

4.1克隆ReKu80缺失构建体

对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。鉴别Rasamsonia emersonii Ku80基因(ReKu80)。包含ORF的基因组序列以及约2500 bp的5’区和2500 bp的3’侧翼区的ReKu80的序列、cDNA以及蛋白序列分别在SEQ ID NO：143、144以及145中示出。

根据常规克隆程序(参见图18和19)，构建ReKu80的两个置换载体，即pEBA1001和pEBA1002。如实施例2所述，两个载体的插入片段一起可应用在所谓的“二分基因靶向”法中。pEBA1001载体包含ReKu80 ORF的用于靶向到ReKu80位点的2500 bp 5’侧翼区、lox66位点以及如实施例2所述由构巢曲霉gpdA启动子驱动的ble编码区的5’部分(图18)。pEBA1002载体包含如实施例2所述的ble编码区的3’部分、构巢曲霉trpC终止子、lox71位点以及ReKu80 ORF的用于靶向ReKu80位点的2500 bp 3’侧翼区(图19)。

4.2在Rasamsonia emersonii中缺失ReKu80

分离缺失构建体pEBA1001和pEBA1002的线性DNA并且用于使用如早先WO2011/054899中所述的方法转化Rasamsonia emersonii。这些线性DNA可在ReKu80位点处整合到基因组中，因而通过ble基因取代ReKu80基因，如图20所描绘。在腐草霉素培养基上选择转化株，并且根据如WO2011/054899中所述的程序来纯化并测试菌落。使用缺失盒的gpdA启动子中的引物和5’靶向区直接上游的基因组序列的引物，通过PCR针对在ReKu80位点处的整合来对生长菌落进行诊断。约250种转化株的池中，4种菌株示出基因组ReKu80基因去除。

4.3克隆编码ere重组酶的瞬时表达质粒pEBA513

通过DNA 2.0(Menlo Park，USA)构建pEBA513，并且其含有以下组分：由以下组成的表达盒：黑曲霉glaA启动子、编码cre重组酶(AAY56380)的ORF，以及构巢曲霉niaD终止子；由以下组成的表达盒：构巢曲霉gpdA启动子、编码潮霉素B抗性蛋白的ORF，以及黄青霉penDE终止子(Genbank：M31454.1，核苷酸1750-2219)；pAMPF21衍生载体，其含有AMA1区和CAT氯霉素抗性基因。图21表示pEBA513的图。

4.4通过瞬时表达cre重组酶对腐草霉素抗性ReKu80缺失菌株进行标记物去除

随后，用pEBA513转化3种候选ReKu80敲除菌株，以通过瞬时表达cre重组酶来去除ble选择标记物。将pEBA513转化株覆盖铺板在含有50μg/ml潮霉素B的再生培养基上。使潮霉素抗性转化株在含有50μg/ml潮霉素B的PDA上生长，从而允许表达cre重组酶。将单一菌落铺板在非选择性Rasamsonia琼脂培养基上，以获得纯化的孢子批。通过在具有和没有10μg/ml腐草霉素的培养基上生长转化株来在表型上测试ble标记物的去除。用pEBA513(具有cre重组酶)转化后，大多数(＞90％)转化株是腐草霉素敏感性的，从而指示基于pEBA1001和pEBA1002的ble标记物的去除。随后，通过在具有和没有50μg/ml潮霉素的培养基上生长转化株来在表型上诊断ble阴性菌株中pEBA513构建体的去除。约50％的转化株由于自发失去pEBA513质粒而失去潮霉素抗性。

通过Southern分析和PCR针对ReKu80基因的缺失测试不含候选标记物的敲除菌株。获得不含标记物的ReKu80缺失菌株，并且代表性菌株用于双GH61 pEB328_EBA332构建体的靶向整合(实施例4)。

4.5用pEBA328 332和pEBA1006转化Rasamsonia emersonii

分离pEBA328_332和pEBA1006的线性DNA，并且用于使用如早先在WO2011/054899中所述的方法转化实施例3所述的Rasamsonia emersoniiReKu80敲除菌株。pEBA328_332的线性DNA可与pEBA1006一起在RePepA位点处整合到基因组中，因而通过pEBA328_332双表达盒和ble取代RePepA基因。在腐草霉素培养基上选择转化株，并且根据如WO2011/054899中所述的程序来纯化并测试菌落。通过PCR诊断生长菌落的在RePepA位点处的整合，使用缺失盒的黄青霉Paf启动子中的引物和5’靶向区直接上游的基因组序列的引物。获得其中RePepA被EBA328_EBA332/ble盒置换的候选转化株。

4.6双GH61过度表达菌株中的纤维素酶活性

如用于Rasamsonia emersonii的一般方法中所述，在摇瓶中发酵过度表达两种GH61酶的pEBA328_EBA332转化株的孢子。在2％玉米秸秆活性测定中分析上清液的纤维素酶活性。GH61过度表达和参考菌株的剂量应答曲线在图22中示出。需要得自pEBA328_EBA332转化株发酵的较低剂量的上清液来获得与得自参考菌株的上清液相比相同的玉米秸秆水解水平，从而指示GH61过度表达R.emersonii菌株中的纤维素酶活性改善。

4.7结论

通过使用Golden gate组装组合启动子、ORF以及终止子片段(水平1)并且随后使用吉布森克隆的多盒组装(水平2)成功地产生了多盒构建体。用双表达盒片段转化R.emersonii，并且将盒成功地整合到RePepA位点中。与参考菌株相比，转化株示出改善的纤维素酶活性，其指示多盒片段功能良好。总之，所述方法适于有效克隆多盒构建体并且适于在一个R.emersonii转化步骤中引入多个基因。

Claims

1.一种用于制备两种或更多种标准化的表达盒的方法，所述方法包括：

a.提供两组或更多组元件序列，

每组元件序列一起构成至少一种功能性表达盒，

所述IIs型限制核酸内切酶识别位点和切割位点被选择成使得元件序列的组可组装成功能性表达盒；

b.提供至少两种骨架进入载体，

各骨架进入载体按以下这种顺序包含：(i)限制酶切割位点与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的所述识别位点之间的插入物，

任何骨架进入载体上的所述连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装；以及

c.使用基于使用限制酶消化和经由切割位点连接的方法，在至少两个骨架进入载体中组装所述两组或更多组元件序列作为功能性表达盒；

从而制备两种或更多种标准化的表达盒。

2.一种用于在宿主细胞中在靶位点处体内重组两种或更多种标准化的表达盒的方法，所述方法包括：

a.根据权利要求1所述的方法制备两种或更多种标准化的表达盒，其中：

i.RF和LF连接物序列包含同源重组序列；以及

ii.任何骨架进入载体上的RF和LF连接物序列被选择成使得其可通过体内重组分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及

b.从包含所述LF和RF序列的骨架进入载体回收表达盒；以及

3.一种用于在宿主细胞中在靶位点处将两种或更多种标准化的表达盒体内重组的方法，所述方法包括：

a.根据权利要求1所述的方法制备两种或更多种标准化的模块式表达盒，其中：

i.RF和LF连接物序列包含至少约9个碱基对的同源序列；以及

ii.任何骨架进入载体上的RF和LF连接物序列被选择成使得其可使用这些序列通过体外方法分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行组装；以及

b.从骨架进入载体回收表达盒，并且通过LF和RF序列的体外连接对其进行组装；以及

c.在宿主细胞中在靶位点处将所组装和回收的表达盒体内重组。

4.根据前述权利要求中任一项所述的方法，其中至少两个骨架进入载体按以下这种顺序包含：(i)II型限制酶识别位点，之后是其切割位点，和至少25个碱基对的第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)至少25个碱基对的第二连接物序列(RF)，和II型限制酶的另一切割位点，之后是所述切割位点的识别位点；以及(iv)任选地，在(i)和(iii)的所述识别位点之间的插入物。

5.根据权利要求2至4中任一项所述的方法，其中在两个整合序列存在下进行所述重组步骤，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点的另一侧侧翼序列重组。

6.根据权利要求2至5中任一项所述的方法，其中，在所述重组步骤中，第一表达盒包含与靶位点的侧翼序列重组的整合序列，并且第二表达盒包含与靶位点的另一侧侧翼序列重组的整合序列。

7.根据权利要求2或6中任一项所述的方法，其中所述整合序列包含与用于第二靶位点、任选地不同于所述第一靶位点的种类的宿主细胞中的位点重组的另外的序列。

8.根据权利要求2至7中任一项所述的方法，其中所述整合序列介导经由同源重组或位点特异性重组的整合。

9.根据权利要求7或8所述的方法，其中所述整合序列、连接物或其它元件序列包含用于与所述第二靶位点重组的位点特异性重组序列，所述序列位于所组装的表达盒之外并且允许使用位点特异性重组在所述第二靶位点处、任选地在不同于所述第一靶位点的宿主细胞种类的宿主细胞种类中的靶位点处进行重组。

10.根据权利要求2至9中任一项所述的方法，其中在所述靶位点处按预定顺序顺次组装并重组两种或更多种表达盒。

11.根据前述权利要求中任一项所述的方法，其中至少一种表达盒为标记物表达盒。

12.根据权利要求11所述的方法，其中所述标记物表达盒的侧翼为至少两个位点特异性重组位点。

13.根据权利要求2至12中任一项所述的方法，其中使用不根据权利要求1所述的方法制备的表达盒。

14.根据前述权利要求中任一项所述的方法，其中至少两个元件序列组包含启动子元件、开放阅读框架元件以及终止子元件。

15.根据前述权利要求中任一项所述的方法，其中将每组元件在至少两个骨架进入载体中组装成为功能性表达盒在单锅反应中进行。

16.根据前述权利要求中任一项所述的方法，其中限定每组中的元件以使得按预定顺序组装所述表达盒。

17.一种用于在靶位点处整合DNA序列的方法，其包括：

a.提供：(i)至少约200个碱基对长的至少两个左(int-L)和两个右(int-R)整合序列的组，用于同源重组至宿主细胞中的至少一个靶位点，其中：

(ii)至少一个表达盒，其两侧侧翼为至少约25个碱基对的连接物序列；以及

b.通过在所述int-L和int-R序列的同源靶位点处重组来体内组装来自步骤(a)的至少三个序列的组，以使得至少一个左和至少一个右整合序列按照这种顺序处于所述宿主细胞的靶位点处，

18.根据权利要求17所述的方法，所述方法包括：

i.int-L和int-R序列为启动子、orf或终止子序列的一部分；

ii.RF和LF连接物序列包含至少约25个碱基对的同源重组序列；以及

iii.任何骨架进入载体上的RF和LF序列被选择成使得其可通过分别与LF或RF连接物序列、与相同或不同骨架进入载体和/或与靶位点的侧翼序列进行体内重组来组装；

b.从包含LF和RF序列的所述骨架进入载体回收表达盒；以及

19.根据权利要求17或18所述的方法，所述方法包括选择两个或更多个int-L和两个或更多个int-R序列，用于在一组体内组装和重组反应中使用，从而产生多个宿主细胞，所述细胞具有通过所选择的int-L和int-R序列靶向至少两个允许的组合的组合，其中

a.至少两个int_L序列在靶位点处在至少一个int-R序列的左侧；或

b.至少两个int_R序列在靶位点处在至少一个int-L序列的右侧。

20.根据权利要求17至19中任一项所述的方法，其中第二功能性标记物盒形成在第二靶位点处。

21.根据权利要求17至20中任一项所述的方法，其中在靶位点处的重组导致在所述靶位点处一个或更多个基因的功能性敲除或下调。

22.根据权利要求2至21中任一项所述的方法，其中所述宿主细胞为原核或真核细胞。

23.一种用于制备两种或更多种标准化的表达盒的系统，所述系统包括：

a.两组或更多组元件序列；

每组元件序列一起构成至少一种功能性表达盒，

b.至少两种骨架进入载体，

各骨架进入载体按以下这种顺序包含：(i)限制酶与其识别位点，和第一连接物序列(LF)；(ii)包含可选择标记基因的载体骨架；以及(iii)第二连接物序列(RF)，和限制酶识别位点与其切割序列；以及(iv)任选地，在(i)和(iii)的所述识别位点之间的插入物，

任何骨架进入载体上的连接物序列RF和LF被选择成使得其可分别与相同或不同骨架进入载体上的LF或RF连接物序列进行组装。

24.一种用于产生整合在靶位点处的目的核酸构建体的系统，所述系统包含：

a.根据权利要求23所述的系统；以及

b.至少两个整合序列，其中一个与第一表达盒和靶位点的侧翼序列重组，并且其中第二个与第二表达盒和靶位点另一侧的侧翼序列重组。