CN109563522A

CN109563522A - 真菌宿主细胞中dna片段的基因组整合

Info

Publication number: CN109563522A
Application number: CN201780049670.4A
Authority: CN
Inventors: D·M·K·克里特加德
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2016-09-15
Filing date: 2017-09-13
Publication date: 2019-04-02
Also published as: WO2018050666A1; EP3512953A1; US20190225988A1

Abstract

本发明涉及在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法，所述方法包括用以下转化该宿主细胞：iv.至少一种多核苷酸片段，其依次包含上游侧翼区和该目的多核苷酸的5’部分；v.至少一种多核苷酸片段，其依次包含该目的多核苷酸的3’部分和下游侧翼区；和，任选地vi.一种或多种另外的多核苷酸片段，每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分；其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠，因此这些片段覆盖整个目的多核苷酸，并且其中这些侧翼区具有足够的大小和同源性以实现与该特定靶位点的同源重组，用于染色体整合。

Description

真菌宿主细胞中DNA片段的基因组整合

对序列表的引用

本申请含有一个计算机可读形式的序列表。将该计算机可读形式通过引用结合在此。

技术领域

本发明涉及在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法，所述方法包括用以下转化该宿主细胞：

i.至少一种多核苷酸片段，其依次包含上游侧翼区和该目的多核苷酸的5’部分；

ii.至少一种多核苷酸片段，其依次包含该目的多核苷酸的3’部分和下游侧翼区；和，任选地

iii.一种或多种另外的多核苷酸片段，每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分；

其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠，因此这些片段覆盖整个目的多核苷酸，并且其中这些侧翼区具有足够的大小和同源性以实现与该特定靶位点的同源重组，用于染色体整合。

背景技术

已经披露了用于使用位点特异性重组酶将目的多核苷酸文库重组到丝状真菌宿主细胞的染色体中的方法(WO 2016/026938)。

披露了一种有效的名为双分裂标记系统(DSMS)用于位点特异性和定向染色体整合，其中使启动子以及亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因二者的5'部分缺失，因此使它们的表达失活，并且其中通过双同源重组(重构这两种基因以允许在用NaNO₃作为唯一氮源的基本培养基上进行选择)整合侧翼为每种基因的互补部分的进入的构建体(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with arecyclable marker for Aspergillus nidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],Fungal Genetics and Biology[真菌遗传学和生物学]第43卷:54-64)。

还披露了用于丝状真菌宿主细胞中的基因文库的位点特异性染色体整合的方法，该方法采用自主复制序列和包含该基因文库的整合盒和名为分裂标记或双分裂标记系统(DSMS)(WO 2015/082535)。

本领域普遍认为，在丝状真菌宿主细胞中，如在曲霉属宿主细胞中，有效同源重组需要至少500bp。因此，习惯上使用重叠延伸剪接(SOE)PCR组装基因文库，然后将其转化至真菌宿主进行整合。

发明内容

本发明提供了用于成功地用2-5个DNA片段(各自具有少至20bp同源重叠)来转化丝状真菌米曲霉宿主细胞的方法，随后这些细胞体内重组，并且位点特异性地被整合至该染色体中。进行了几个若干实验以测试这些具有20-1000bp同源重叠的DNA片段是否可以体内组装。结果示出具有仅20bp重叠的2个片段的组装十分有效。该方法被应用于脂肪酶和核酸酶变体的生成以及脂肪酶编码序列的位点饱和文库生成。还进行了一些实验，成功组装了编码脂肪酶的3个片段。该方法消除了对许多应用(如变体生成、文库生成等)进行克隆或重叠延伸剪接(SOE)PCR组装的需要。

因此，在第一方面，本发明涉及用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法，所述方法包括以下步骤：

a)用以下转化该宿主细胞：

其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至少20bp的重叠，因此这些片段覆盖整个目的多核苷酸，并且其中这些侧翼区具有足够的大小并且与该特定染色体靶位点具有足够的同源性以实现与该特定靶位点的同源重组；

b)在有利于体内同源重组发生的条件下培养该转化的宿主细胞，其中重叠PCR片段重组以形成整个目的多核苷酸，并且这些侧翼区与该染色体重组以在该特定染色体靶位点处整合该目的多核苷酸；和

c)选择转化的宿主细胞，其中该目的多核苷酸被整合到该特定染色体靶位点中。

附图说明

图1示出用于体内组装具有20-1000bp重叠的两个片段的转化底物(片段A-G)的图解，如实例1和实例2所描述。

图2示出用于体内组装具有恰好20bp重叠的两至五个片段的转化底物(片段A-I)的图解，如实例3所描述。

图3示出用于体内组装具有恰好20bp重叠的两至五个片段的转化反应(反应I-V)的图解，如实例3所描述。

定义

cDNA：术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体，其在呈现为成熟的剪接的mRNA之前要通过一系列的步骤(包括剪接)进行加工。

编码序列：术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由可读框决定，所述可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码所述多肽的多核苷酸来说可以是天然的(即，来自相同基因)或外源的(即，来自不同基因)，或相对于彼此是天然的或外源的。这类控制序列包括但不限于前导序列、多聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。最少，控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的位点特异性限制性酶切位点的目的，所述控制序列可以提供有多个接头。

表达：术语“表达”包括涉及多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体：术语“表达载体”意指线性或环状DNA分子，所述DNA分子包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。

宿主细胞：术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。

分离的：术语“分离的”意指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质，(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质，所述物质至少部分地从与其性质相关的一种或多种或所有天然存在的成分中去除；(3)相对于自然界中发现的物质通过人工修饰的任何物质；或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如，宿主细胞中的重组产生；编码所述物质的基因的多个拷贝；以及使用比与编码所述物质的基因天然相关的启动子更强的启动子)。

核酸构建体：术语“核酸构建体”意指单-链或双链的核酸分子，所述核酸分子是从天然存在的基因中分离的，或以本来不存在于自然界中的方式被修饰成含有核酸的区段，或是合成的，所述核酸分子包含一个或多个控制序列。

可操作地连接：术语“可操作地连接”意指如下配置：控制序列被放置在相对于多核苷酸的编码序列适当的位置处，这样使得所述控制序列引导所述编码序列的表达。

序列同一性：两个氨基酸序列之间或两个核苷酸序列之间的关联性由参数“序列同一性”描述。

出于本发明的目的，使用如在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS：欧洲分子生物学开放软件套件],Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970，J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下：

(同一的残基x 100)/(比对长度-比对中的空位总数)

出于本发明的目的，使用如在EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite)，Rice等人，2000,见上文)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)确定两个脱氧核糖核苷酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下：

(同一的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)

具体实施方式

在第一方面，本发明涉及用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合该目的多核苷酸的方法，所述方法包括以下步骤：

a)用以下转化该宿主细胞：

宿主细胞

本发明还涉及重组宿主细胞，其包含编码目的多肽或目的酶的目的基因。该目的基因可操作地连接至指导该多肽的产生的一个或多个控制序列。将包含多核苷酸的构建体或载体引入宿主细胞中，从而该构建体或载体被维持为染色体整合体。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码该多肽的基因及其来源。

宿主细胞可以是真菌细胞。如本文使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的，在：Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,CABInternational[国际CAB],University Press[大学出版社],Cambridge[剑桥],英国)。

真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,同上)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长，而碳分解代谢是专性需氧的。

该丝状真菌宿主细胞可以是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟腊菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉菌科(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)、或木霉属(Trichoderma)细胞。

例如，丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporiuminops)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtorulosum)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉(Thielavia terrestris)、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)细胞。

真菌细胞可以通过以下过程转化，所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的合适的程序描述于以下文献中：EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988，Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的合适的方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。

出于本发明的目的，使用非同源末端连接修复缺陷的真菌宿主细胞是有利的；优选地，该宿主细胞包含非同源末端连接修复所需的基因中的失活性突变或缺失；更优选地，该宿主细胞包含kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2，或其进化同系物中的失活性突变；更优选地，该真菌宿主细胞中缺失kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2，或其进化同系物。

在第一方面的优选的实施例中，该真菌宿主细胞的特定染色体靶位点和该上游和下游侧翼区一起包含双分裂选择标记系统(DSMS)，因此可以选择转化的宿主细胞，其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中；优选地，该双分裂选择标记系统基于该宿主细胞中的分裂亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因或其进化同系物，从而允许在补充有NaN0₃的基本培养基上选择成功转化的宿主细胞，其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中，同时在该过程中重构亚硝酸盐还原酶(niiA)和硝酸盐还原酶。

在另一个优选的实施例中，在步骤(a)中用至多100种另外的多核苷酸片段，优选地至多90、80、70、60、50、40、30或20种另外的多核苷酸片段，更优选地至多10种另外的多核苷酸片段，甚至更优选地至多5种另外的多核苷酸片段，最优选地至多1种另外的多核苷酸片段转化该宿主细胞。

多核苷酸

本发明还涉及包含编码目的酶的基因的多核苷酸；优选地，该目的多核苷酸包含编码含有分泌信号肽的酶的基因；更优选地，该目的多核苷酸包含编码以下的基因：水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶；最优选地，该目的多核苷酸包含编码以下的基因：α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

在优选的实施例中，一种或多种转化到该宿主细胞的多核苷酸片段包含编码目的酶的基因中的至少一种突变，因此，当该重叠PCR片段重组以形成整个目的多核苷酸时，该至少一种突变将被包含于编码目的酶的基因中。

在另一个优选的实施例中，该目的多核苷酸包含选择性标记基因。

优选地，本发明的第一方面的每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多1,000bp，优选地至多900bp，至多800bp、至多700bp、至多600bp、至多500bp、至多400bp、至多300bp、至多200bp、至多100bp、至多90bp、至多80bp、至多70bp、至多60bp、至多50bp、至多40bp的重叠并且最优选地，每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多30bp的重叠。

用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段，实现从基因组DNA克隆多核苷酸。参见例如，Innis等人,1990,PCR:A Guide to Methods and Application[PCR：方法和应用指南],学术出版社(Academic Press)，纽约。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。

编码本发明多肽的多核苷酸的修饰对于合成基本上类似于所述多肽的多肽可以是必需的。术语“基本上类似”于所述多肽是指多肽的非天然存在的形式。这些多肽可以因某种工程化方式而与从其天然来源分离的多肽不同，例如在比活性、热稳定性、最适pH等方面不同的变体。可以如下构建变体：基于作为成熟多肽编码序列(例如，其子序列)所提出的多核苷酸，和/或通过引入核苷酸置换，所述核苷酸置换不导致多肽的氨基酸序列变化，但是对应于旨在用于产生酶的宿主生物的密码子使用，或通过引入可以产生不同氨基酸序列的核苷酸置换。对于核苷酸取代的一般描述，参见例如Ford等人,1991,ProteinExpression and Purification[蛋白质表达与纯化]2:95-107。

核酸构建体

本发明还涉及核酸构建体，其包含可操作地连接至一个或多个控制序列的本发明的多核苷酸，在与控制序列相容的条件下，该一个或多个控制序列指导该编码序列在适合的宿主细胞中的表达。

可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体，在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

所述控制序列可为启动子，即，被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。所述启动子包含转录控制序列，其介导所述多肽的表达。启动子可以在宿主细胞中显示转录活性的任何多核苷酸，包括突变型、截短型和杂合型启动子，并且可以是从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

在丝状真菌宿主细胞中，用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(达莉亚)(WO 00/56900)、镶片镰孢Quinn(奎恩)(WO00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶，以及里氏木霉翻译延伸因子，连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子，其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导序列替换未翻译的前导序列；非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子，其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换未翻译的前导序列)；及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。

控制序列也可为由宿主细胞识别以终止转录的转录终止子。所述终止子可操作地连接到编码所述多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。

用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得：构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。

所述控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域，它增加所述基因的表达。

控制序列也可以是前导序列，即对宿主细胞翻译很重要的mRNA的非翻译区域。所述前导序列可操作地连接至编码所述多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。

用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

控制序列也可以是多聚腺苷化序列，一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中有功能的任何聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列从以下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。

控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'-端可固有地含有在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地，编码序列的5'-端可含有对于编码序列为外源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下，可能需要外源信号肽编码序列。可替代地，外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而，可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。

控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽序列和前肽序列二者都存在的情况下，所述前肽序列位于紧邻多肽的N-末端且所述信号肽序列位于紧邻所述前肽序列的N-末端。

也可希望的是添加调节序列，所述调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的那些序列。在真核系统中，这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中，编码多肽的多核苷酸会与调节序列可操作地连接。

表达载体

本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体，其可包括一个或多个便利的限制位点以允许编码所述多肽的多核苷酸在此类位点处的插入或取代。可替代地，可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时，该编码序列位于该载体中，这样使得该编码序列与该用于表达的适当控制序列可操作地连接。

重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。

载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地，载体可以是这样的载体，当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的总DNA，或可以使用转座子。

载体优选地含有允许方便地选择转化的细胞、转染的细胞、转导的细胞等细胞的一个或多个选择性标记。选择性标记是一种基因，其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。

用于丝状真菌宿主细胞中的选择性标记包括但不限于：adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选地用于木霉属细胞的是adeA、adeB、amdS、hph以及pyrG基因。

选择性标记可以是如描述于WO 2010/039889中的双选择性标记系统。在一方面，双选择性标记是hph-tk双选择性标记系统。

载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到所述宿主细胞基因组中，所述载体可以依靠编码所述多肽的多核苷酸序列或用于通过同源或非同源重组整合到所述基因组中的所述载体的任何其他元件。可替代地，该载体可含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性，整合元件应当含有足够数目的核酸，如100至10,000个碱基对、400至10,000个碱基对、和800至10,000个碱基对，所述核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外，整合元件可以是非编码或编码的多核苷酸。另一方面，载体可以通过非同源重组整合入宿主细胞的基因组中。

为了自主复制，载体还可以另外包含复制起点，所述复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67；Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175；WO00/24883)。可根据WO 00/24883中披露的方法完成AMA1基因的分离和包含所述基因的质粒或载体的构建。

可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一种另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目，其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。

用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如，Sambrook等人,1989,见上文)。

实例

材料与方法

根据制造商的说明，使用校对聚合酶Phusion(赛默飞世尔科技公司(ThermoFisher Scientific))，扩增所有用于转化的DNA。根据制造商的说明，使用QIAquick试剂盒纯化DNA。

根据制造商的说明，使用校对聚合酶KAPA HotStart ReadyMix(KAPA Biosystems公司)扩增用于测序的DNA。

通过缺失启动子以及亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因二者的5'部分，而从米曲霉PFJ0220(EP 2147107 B1)产生黑曲霉COLS1300(amyA、amyB、amyC、alpA、nprA、kusA、niaD、niiA、amdS+)，因此使它们的表达失活(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with a recyclable marker for Aspergillusnidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],FungalGenetics and Biology[真菌遗传学和生物学]第43卷:54-64)。

米曲霉菌株DAU716(ligDΔ)描述于WO 2016/026938实例5中。

真菌物种的转化可以使用用于酵母转化的一般方法实现。优选地，将曲霉属宿主菌株接种至补充有10mM尿苷的100ml YPG培养基中，并在80rpm下，在32℃孵育16hr。将球粒进行收集并且用0.6M KCl洗涤，并且将其再悬浮于包含商业β-葡聚糖酶产品(GLUCAN EX^TM，诺维信公司(Novozymes A/S)，鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将悬浮液在32℃伴随振荡(80rpm)孵育直到形成原生质体，并且然后用STC缓冲液洗涤两次。将这些原生质体计数，并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x 10⁷个原生质体/ml。将大约4μg的质粒DNA添加至100μl的原生质体悬浮液中，轻轻混合，并在冰上孵育30分钟。添加1ml的SPTC，并且将原生质体悬浮液在37℃孵育20分钟。在添加10ml的50℃Cove或Cove-N顶层琼脂糖之后，将反应倾倒于Cove或Cove-N(tf)琼脂板上，并且将板于32℃孵育5天。

实例1.通过双分裂标记将2个片段转化至米曲霉中

本实验的目的是示出，与先前描述的直接应用选择组装选择标记的双分裂选择标记系统(DSMS)不同，在不直接选择组装事件的情况下，两个片段的体内组装是可能的(Nielsen M.L.等人2006,Efficient PCR-based gene targeting with a recyclablemarker for Aspergillus nidulans[针对构巢曲霉的有效的基于PCR的用可再循环标记进行的基因靶向],Fungal Genetics and Biology[真菌遗传学和生物学]第43卷:54-64)。然而，应用不直接选择体内组装，因为DSMS系统选择在整合位点的5’末端和3’末端进行整合。

此外，该目的是为示出当两个片段之间具有少至20bp同源重叠时，体内组装这两个片段是可能的。在本实例中，该同源重叠与野生型基因相同，但是该同源重叠可含有任何核苷酸序列，并且可例如用于引入特定突变。

具有20、30、50、100、和1000bp重叠的片段的制备：

如下所述并如图1所说明的，产生两个具有不同重叠长度的用于通过同源重组(HR)整合的PCR片段。通过表达经由双分裂标记系统(DSMS；见上文)整合的疏棉状嗜热丝孢菌脂肪酶来测试该系统。设计PCR片段以分别具有20bp、30bp、50bp、100bp、和1000bp的重叠。使用表1的引物对，通过来自pBGMH0021(WO 2015/082535)的PCR扩增这些片段：

表1.

将PCR反应编程为在95℃进行5分钟的1个循环；35个循环，每个循环在98℃持续30秒、58℃持续30秒、并且在72℃持续4分钟；和在72℃最终延伸5分钟。

COLS1300(kusAΔ)的转化：

如下所示并且如图1所说明的，将片段成对转化至COLS1300。将转化体铺在具有补充有NaN0₃的基本培养基的平板上。在整合盒已经成功地重组到宿主细胞的染色体中并在该过程中重构niiA和niaD位点的情况下，仅孢子可发芽和存活。在30℃孵育3天后计数转化体的数目。

片段	重叠长度(bp)	转化体/μg DNA
			A+B	20	11
A+C	30	17
			A+D	50	60
A+E	100	42
			A+F	1000	23
G(阳性对照)	单个片段	30
			无DNA(阴性对照)	-	0

转化体测序：

使用如下引物从来自每个反应的8个转化体的基因组DNA对该疏棉状嗜热丝孢菌脂肪酶进行PCR扩增：

PKH1271：5’ccaactcaatttacctctatcca(SEQ ID NO:9)

PKH1274：5’acacccactacatacatgatca(SEQ ID NO:10)

将PCR反应编程为在95℃进行3分钟的1个循环；34个循环，每个循环在98℃持续20秒、68℃持续1秒、并且在72℃持续1分钟；和在72℃最终延伸4分钟。

结果

该米曲霉COLS1300菌株是kusAΔ(具有非同源末端连接(NHEJ)修复缺陷)。在此菌株中，在不应用直接选择组装事件的情况下，体内组装两个片段是可能的。此外，体内组装用于HR的含有少至20bp的同源重叠的两个片段是可能的。测序证实所有测试的转化体都整合了两个片段，并且在HR事件期间没有引入突变。

实例2.通过FLP/FRT系统在米曲霉中用两个片段转化

本实验的目的是示出，在不直接选择且不间接选择整合两个转化的PCR片段的情况下，体内组装这两个片段是可能的。该FLP/FRT系统仅选择在整合位点的3’末端进行整合，并且因此没有组装这两个片段的选择。

具有20、30、50、100、和1000bp重叠的片段的制备：

以如下方式产生用于整合HR用、具有不同重叠长度的两个片段的片段。经由位点特异性重组酶FLP/FRT系统，通过表达疏棉状嗜热丝孢菌脂肪酶来测试该系统(WO 2012/160093)。设计片段以分别具有20bp、30bp、50bp、100bp、和1000bp的重叠。使用表2的引物对，通过PCR从质粒pDAU724(WO 2016/026938；图7；其中的SEQ ID NO:30)扩增这些片段：

表2.

将PCR反应编程为在95℃进行5分钟的1个循环；35个循环，每个循环在98℃持续30秒、60℃持续30秒、并且在72℃持续3分钟；和在72℃最终延伸5分钟。

米曲霉菌株DAU716(ligDΔ)的转化：

如表3所示并且并如图1所说明的，将这些片段成对转化至DAU716中，并且在30℃孵育3天后对转化体计数。

表3.

片段	重叠长度(bp)	转化体/μg DNA
			A+B	20	8
A+C	30	24
			A+D	50	21
A+E	100	18
			A+F	1000	4
G(线性阳性对照)	单个片段	0
			pDAU724(环状阳性对照)	单个环状质粒	35
无DNA(阴性对照)	-	0

转化体测序：

使用引物从来自每个反应的8个转化体的基因组DNA对该疏棉状嗜热丝孢菌脂肪酶编码基因进行PCR扩增：

PKH1271：5’ccaactcaatttacctctatcca(SEQ ID NO:9)

PKH1274：5’acacccactacatacatgatca(SEQ ID NO:10)

结果

米曲霉DAU716是ligDΔ(具有NHEJ缺陷)。我们没有应用直接或间接选择组装和整合两个片段，但体内组装两个片段是可能的，其中这两个片段含有用于体内同源重组的少至20bp的同源重叠。

测序证实所有转化体都整合了两个片段，并且在重组期间没有引入突变。因此，具有短的同源重叠的两个片段的正确组装不限于使用特定的整合系统。

实例3.通过DSMS系统在米曲霉中用2-5个片段转化

本实验的目的是示出当仅具有20bp的同源重叠时，在不直接选择整合所有片段的情况下，体内组装多达五个片段是可能的。

具有20bp重叠的片段的制备：

按如下方式并如图2所说明的，产生2-5个具有20bp重叠的整合用片段。经由双分裂标记系统(DSMS)，通过表达疏棉状嗜热丝孢菌脂肪酶来测试该系统。设计片段以整合2-5个片段，并且它们都具有恰好20bp的重叠。使用表4的引物对，通过PCR从pBGMH0021扩增这些片段：

表4

米曲霉COLS1300(kusAΔ)的转化：

如表5所示并如图3所说明的，将这些片段成对转化至COLS1300；在30℃孵育3天后计数转化体。

表5.

转化体测序：

PKH1271：5’ccaactcaatttacctctatcca(SEQ ID NO:9)

PKH1274：5’acacccactacatacatgatca(SEQ ID NO:10)

结果

米曲霉COLS1300是kusAΔ(具有NHEJ缺陷)。在此菌株中，体内组装多达5个转化的PCR片段是可能的，每个片段与另一片段具有少至20bp的重叠用于同源重组。测序证实所有测试的转化体都整合了所有片段，并且在HR事件期间没有引入突变。

观察到转化效率随着片段数量的增加而降低；然而，如果增加宿主的一般转化效率，则有可能组装更多的片段。

序列表

<110> 诺维信公司（Novozymes A/S）

<120> 真菌宿主细胞中DNA片段的基因组整合

<130> 13082-WO-PCT

<160> 18

<170> PatentIn版本3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 dsms0003

<400> 1

atgaaccatg gcttctcatc 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0002

<400> 2

actgttgccg gagcagacct 20

<210> 3

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0003

<400> 3

gcattggcaa ctgttgcc 18

<210> 4

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0004

<400> 4

ccggacatag cttgggtggt g 21

<210> 5

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0005

<400> 5

gaaggtggag gatgctgtga g 21

<210> 6

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0006

<400> 6

aggaccacct ctaggcatcg ga 22

<210> 7

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0001

<400> 7

caggtctgct ccggcaacag 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 dsms0004

<400> 8

tgattgcact aacggcatac 20

<210> 9

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物 PKH1271

<400> 9

ccaactcaat ttacctctat cca 23

<210> 10

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 PKH1274

<400> 10

acacccacta catacatgat ca 22

<210> 11

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物 flp0001

<400> 11

gaattcgagc tcggtacctt gaag 24

<210> 12

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物 flp0003

<400> 12

gaccatgatt acgccaagct tac 23

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0007

<400> 13

cattacgtgc acggccaatg 20

<210> 14

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0008

<400> 14

ataaatgaca tttgctccgg ct 22

<210> 15

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0009

<400> 15

gagacatcgt gaagatagaa ggca 24

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0010

<400> 16

cattggccgt gcacgtaatg 20

<210> 17

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0011

<400> 17

ccggagcaaa tgtcatttat ttc 23

<210> 18

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物 rec0012

<400> 18

ttctatcttc acgatgtctc gtc 23

Claims

1.一种用于在真菌宿主细胞中的特定染色体靶位点处体内组装和整合目的多核苷酸的方法，所述方法包括以下步骤：

a)用以下转化该宿主细胞：

iv.至少一种多核苷酸片段，其依次包含上游侧翼区和该目的多核苷酸的5’部分；

v.至少一种多核苷酸片段，其依次包含该目的多核苷酸的3’部分和下游侧翼区；和，任选地

vi.一种或多种另外的多核苷酸片段，每种多核苷酸片段包含该目的多核苷酸的5’部分和3’部分；

c)选择经转化的宿主细胞，其中该目的多核苷酸被整合到该特定染色体靶位点中。

2.如权利要求1所述的方法，其中该真菌宿主细胞是丝状真菌宿主细胞，优选地该丝状真菌宿主细胞是以下属的：枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、或木霉属；甚至更优选地，该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉宿主细胞。

3.如前述权利要求中任一项所述的方法，其中该真菌宿主细胞具有非同源末端连接修复缺陷；优选地，该宿主细胞包含非同源末端连接修复所需的基因中的失活性突变或缺失；更优选地，该宿主细胞包含kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2，或其进化同系物中的失活性突变；更优选地，该真菌宿主细胞中缺失kusA、ligD、ku70、ku80、mre11、rad50、和/或xrs2，或其进化同系物。

4.如前述权利要求中任一项所述的方法，其中每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多1,000bp，优选地至多900bp，至多800bp、至多700bp、至多600bp、至多500bp、至多400bp、至多300bp、至多200bp、至多100bp、至多90bp、至多80bp、至多70bp、至多60bp、至多50bp、至多40bp的重叠；并且最优选地，每种多核苷酸片段的5’部分和3’部分与另一片段的一个或多个5’部分和3’部分具有至多30bp的重叠。

5.如前述权利要求中任一项所述的方法，其中该目的多核苷酸包含编码目的酶的基因；优选地，该目的多核苷酸包含编码含有分泌信号肽的酶的基因；更优选地，该目的多核苷酸包含编码以下的基因：水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶；最优选地，该目的多核苷酸包含编码以下的基因：α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

6.如权利要求5所述的方法，其中一种或多种转化到该宿主细胞的多核苷酸片段包含编码目的酶的基因中的至少一种突变，因此，当该重叠PCR片段重组以形成整个目的多核苷酸时，该至少一种突变将被包含于编码目的酶的基因中。

7.如前述权利要求中任一项所述的方法，其中该目的多核苷酸包含选择性标记基因。

8.如前述权利要求中任一项所述的方法，其中该真菌宿主细胞的特定染色体靶位点和该上游和下游侧翼区一起包含双分裂选择标记系统(DSMS)，因此可以选择经转化的宿主细胞，其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中；优选地，该双分裂选择标记系统基于该宿主细胞中的分裂亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因或其进化同系物，从而允许在补充有NaN0₃的基本培养基上选择成功转化的宿主细胞，其中该目的多核苷酸以特定方向被整合到该特定染色体靶位点中，同时在该过程中重构亚硝酸盐还原酶(niiA)和硝酸盐还原酶。

9.如前述权利要求中任一项所述的方法，其中在步骤(a)中用至多100种另外的多核苷酸片段，优选地至多90、80、70、60、50、40、30或20种另外的多核苷酸片段，更优选地至多10种另外的多核苷酸片段，甚至更优选地至多5种另外的多核苷酸片段，最优选地至多1种另外的多核苷酸片段转化该宿主细胞。