CN112585267A - 使用内含子制备dna构建体的组合文库 - Google Patents

使用内含子制备dna构建体的组合文库 Download PDF

Info

Publication number
CN112585267A
CN112585267A CN201980044095.8A CN201980044095A CN112585267A CN 112585267 A CN112585267 A CN 112585267A CN 201980044095 A CN201980044095 A CN 201980044095A CN 112585267 A CN112585267 A CN 112585267A
Authority
CN
China
Prior art keywords
host cell
intron
fusarium
polypeptide
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980044095.8A
Other languages
English (en)
Inventor
M.L.尼尔森
N.约丘姆森
J.阿尔瑙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN112585267A publication Critical patent/CN112585267A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1051Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/36Vector systems having a special element relevant for transcription being a transcription termination element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA

Abstract

披露了制备DNA构建体,特别是表达盒的组合文库的手段和方法,所述组合文库包括核酸构建体、表达载体、宿主细胞;制备宿主细胞的方法和产生目的多肽的方法,由此表达包括以下:位于待表达的多核苷酸任一侧的第一内含子和第二内含子以及启动子和终止子。还要求保护构建真核生物宿主细胞的方法,其中这些细胞与三种多核苷酸接触,并且其中第一和第二多核苷酸以及第二和第三多核苷酸能够成对同源重组并且能够随后形成内含子。

Description

使用内含子制备DNA构建体的组合文库
对序列表的引用
本申请含有计算机可读形式的序列表。该计算机可读形式通过引用并入本文。
技术领域
本发明涉及制备DNA构建体(特别是表达盒)的组合文库(其包含核酸构建体、表达载体、宿主细胞)的手段和方法、制备宿主细胞的方法和生产目的多肽的方法。
背景技术
在生物技术产业中,生产相关多肽一般需要优化表达系统的所有组分,以确保最高的可能产量。这其中的一个重要方面是优化表达盒,其包括编码序列的密码子优化,以及阐明指导编码序列表达的控制序列的最佳配置。
历史上,表达盒的优化一直使用基于试错法的方法进行,该方法涉及盒的多样性与筛选时间的折衷。然而,构建表达盒文库的组合方法可以实现高通量筛选,同时保持较高的盒多样性,并且不会损害筛选时间和产物产量。
发明内容
本发明基于出人意料且创造性的发现:内含子可用于产生用于体内生产DNA构建体组合文库的模块化DNA元件。
在第一方面,本发明涉及一种核酸构建体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、第一内含子、编码目的多核苷酸的多核苷酸、第二内含子和转录终止子均可操作地连接。
在第二方面,本发明涉及一种表达载体,该表达载体包含根据第一方面所述的核酸构建体。
在第三方面,本发明涉及一种真核生物宿主细胞,该真核生物宿主细胞在其基因组中包含根据第一方面所述的核酸构建体或根据第二方面所述的表达载体。
在第四方面,本发明涉及一种用于构建真核生物宿主细胞的方法,该方法包括用以下转化真核细胞:
a)第一多核苷酸,其在‘5至3方向上包含启动子和第一DNA序列;
b)第二多核苷酸,其在‘5至‘3方向上包含第二DNA序列、目的多肽的编码序列和第三DNA序列;以及
c)第三多核苷酸,其在‘5至3’方向上包含第四DNA序列和转录终止子;
其中该第一、第二和第三多核苷酸可操作地连接,其中该第一和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
在第五方面,本发明涉及一种用于生产目的多肽的方法,该方法包括以下步骤:
a)提供根据第三方面所述的或通过根据第四方面所述的方法制备的真核生物宿主细胞;
b)在有助于该目的多肽表达的条件下培养所述宿主细胞;以及,任选地
c)回收该目的多肽。
附图说明
图1显示脂肪酶的编码序列可作为两个PCR片段被扩增,并且使用具有与PCR1和PCR2同源的30bp 5’和3’侧翼的不同内含子在体内组装。
图2显示来自于菌株的培养上清液的SDS-PAGE(小图A,底部),所述菌株含有21种不同的内含子(SEQ ID NO:1-21)以及相关对照,和小图A中相应上清液的脂肪酶单元(LU,小图B,顶部)。内含子编号#显示在SDS-PAGE上每个条带的上方,其中“1”对应于SEQ ID NO:1,等等。“pyrG”是众所周知的来自构巢曲霉的内含子pyrG(AN6157),“8k”是不含插入物的对照菌株,“B”是具有空白表达盒的背景菌株,以及“%”是培养基对照。
图3显示了使用三种不同内含子和两种非内含子接头连接几个DNA片段的原则。
图4显示了来自于在YPM中培养了五天的菌株的上清液的SDS-PAGE凝胶。实验1-3因使用不同的启动子(P1-P3)而不同。每一个实验均选择和培养四种菌株(每一情况下的泳道1-4)。“C1”是含有内含子#15(SEQ ID NO:15,来自实例1)的脂肪酶基因;“C2”是含有内含子#21(SEQ ID NO:21,来自实例1)的脂肪酶基因,“C3”是不含内含子但具有不同启动子的脂肪酶基因。
图5显示了脂肪酶载体的构建。载体1和载体2在脂肪酶基因内具有单一内含子。载体3不具有内含子。载体4具有两个位于编码信号肽和前肽的多核苷酸区域的侧翼的内含子。
图6显示了来自于生长了五天的多拷贝菌株的上清液的SDS-PAGE。脂肪酶基因的拷贝数显示于上面每个泳道中。
图7显示了使用三种不同内含子和两种非内含子接头连接几个DNA片段的原则。本文中,同时混合三种不同的启动子可同时构建三种不同类型的转化体并创建组合文库。
图8显示了来自于在30℃下生长了五天的菌株的上清液的SDS-page。“C1”是具有内含子#15(SEQ ID NO:15)的脂肪酶基因,“C2”是具有内含子#21(SEQ ID NO:21)的脂肪酶基因,“C3”是不含内含子但具有不同启动子的脂肪酶基因。
图9显示了实例4中菌株#13的测序,这表明内含子#8(SEQ ID NO:26;SEQ ID NO:27)序列中插入了三十三个核苷酸。
图10显示了在实例2和实例4的菌株中观察到的插入和缺失情况。这些菌株依然能够生产脂肪酶,这表明尽管发生突变,内含子还是具有功能的(SEQ ID NO:28;SEQ ID NO:29;SEQ ID NO:30;SEQ ID NO:31)。
图11显示了内含子#7(SEQ ID NO:7)中单个的碱基缺失,如在实例2的菌株#4中观察到的(SEQ ID NO:32;SEQ ID NO:33)。
图12显示了使用内含子作为接头,构建脂肪酶的六种不同密码子变体的矩阵(虚线框)。
图13显示了来自于在30℃下生长了五天的菌株的上清液的SDS-PAGE。每一个变体均出现,这表明矩阵克隆原理导致了脂肪酶的产生。参照(REF)是实例2中的C3,即不含内含子但是具有不同启动子的脂肪酶基因。#数字表明用于矩阵克隆的特定基因变体。
定义
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其要通过一系列的步骤(包括剪接)进行加工,之后呈现为成熟的剪接的mRNA。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定,该可读框以起始密码子(例如ATG、GTG或TTG)开始并且以终止密码子(例如TAA、TAG或TGA)结束。编码序列可以为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成包含核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。
具体实施方式
本发明基于出人意料且创造性的发现:内含子可用于产生核酸构建体的组合文库。如本文披露的实例所示,内含子可用于以预定顺序连接目的多核苷酸,以形成目的核酸构建体。核酸构建体转录后,内含子通过宿主细胞的mRNA加工机制从所得mRNA中移除。
核酸构建体由模块化DNA元件组装而成,每个元件含有货物序列,其一侧或两侧是内含子形成序列。该货物序列原则上可含有任何目的多核苷酸序列。在表达盒的上下文中,相关的货物序列包括但不限于启动子、编码信号肽的多核苷酸、编码目的多肽的多核苷酸和转录终止子。
模块化DNA元件经合适的宿主细胞转录并且随后在内含子形成序列之间进行同源重组后在体内组合,导致形成含有由功能内含子分隔的货物序列的核酸构建体。核酸构建体中货物序列的顺序通过确保内含子形成序列的受控成对重组来确定。通过改变模块化元件的货物顺序,可以产生核酸构建体的组合文库。通过在合适的条件下培养宿主细胞,核酸构建体可得以表达,并且可以评估单个货物序列对表达结果的影响。因此,在表达盒的上下文中,本发明适用于鉴别启动子、信号肽、编码序列和终止子的最佳配置。
因此,在第一方面,本发明涉及一种核酸构建体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子均可操作地连接。
根据第一方面所述的核酸构建体适用于筛选和评估启动子、编码目的多肽的多核苷酸和转录终止子的组合。然而,在一些情况下,在筛选设置中包括信号肽也可能是有价值的,例如,如果目的多肽是分泌型的。
因此,在第一方面的优选实施例中,该核酸构建体进一步包含编码信号肽的多核苷酸和第三内含子,其中该编码信号肽的多核苷酸和该第三内含子可操作地连接至并且位于第一内含子和目的多肽的编码序列之间。
换言之,在第一方面的优选实施例中,该核酸在5’至3’方向上包含启动子、第一内含子、编码信号肽的多核苷酸序列、第二内含子、目的多肽的编码序列、第三内含子和转录终止子,其中该启动子、第一内含子、编码信号肽的多核苷酸、第二内含子、编码目的多肽的多核苷酸、第三内含子和转录终止子可操作地连接。
任何能够进行RNA剪接的功能性内含子对本发明都是有用的。本发明的内含子可能是天然存在的内含子、天然存在的内含子的变体或片段,或合成内含子。优选地,这些内含子与包含本发明的核酸构建体的宿主细胞是异源的。
在优选的实施例中,这些内含子是不同的,并且独立地包含不超过200个核苷酸,即,不超过175、150、125、100、90、80、70、60或50个核苷酸。
在优选的实施例中,这些内含子包含GT供体位点和/或AG接受位点。
在优选的实施例中,这些内含子在转录后能够进行RNA剪接。
在优选的实施例中,这些内含子独立地选自由SEQ ID NO:1-21组成的组。
在优选的实施例中,该第一内含子位于启动子和编码目的多肽的多核苷酸的起始密码子之间。
在优选的实施例中,该第二内含子位于编码目的多肽的多核苷酸的终止密码子和转录终止子之间。
本发明的核酸构建体可进一步包含用于将核酸构建体插入表达载体或宿主细胞基因组中的接头多核苷酸。
在优选的实施例中,该核酸构建体进一步包含位于启动子上游的接头多核苷酸。
在优选的实施例中,该核酸构建体进一步包含位于终止子下游的接头多核苷酸。
核酸构建体
本发明的第一个方面涉及核酸构建体,其包含与一个或多个控制序列可操作地连接的编码目的多肽的多核苷酸,该一个或多个控制序列在与控制序列相容的条件下指导该多核苷酸在合适的宿主细胞中的表达。
在优选的实施例中,该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
可以用许多方式操作编码目的多肽的多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可能是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。该启动子包含介导多肽的表达的转录控制序列。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
在优选的实施例中,该启动子是异源启动子;优选地,该启动子是真菌启动子。
在优选的实施例中,该真菌启动子是丝状真菌启动子。用于在丝状真菌宿主细胞中指导本发明核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的经修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列);及其变体、截短型、以及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在优选的实施例中,该真菌启动子是酵母启动子。在酵母宿主中,有用的启动子从以下基因中获得:酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。
控制序列也可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
在优选的实施例中,该终止子是真菌终止子。
在优选的实施例中,该真菌终止子是丝状真菌终止子。用于丝状真菌宿主细胞的优选终止子从以下的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延伸因子。
在优选的实施例中,该真菌终止子是酵母终止子。酵母宿主细胞的优选终止子从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人(1992,同上)描述。
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mRNA的非翻译区域。该前导序列可操作地连接至编码该目的多肽的多核苷酸的5'末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
酵母宿主细胞的适合的前导序列从以下的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸化序列,一种可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
用于丝状真菌宿主细胞的优选多腺苷酸化序列从以下的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
酵母宿主细胞的有用的多腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。
控制序列还可以是编码与多肽的N末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5'-末端可以包含对编码序列是外源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
在优选的实施例中,该信号肽是真菌信号肽。
在优选的实施例中,该真菌信号肽是丝状真菌信号肽。用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉(Humicola lanuginosa)脂肪酶、以及米黑根毛霉天冬氨酸蛋白酶。
在优选的实施例中,该真菌信号肽是酵母信号肽。用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等人(1992,同上)描述。
控制序列还可以是编码位于多肽的N末端的前肽的前肽编码序列。所得的多肽被称为前体酶或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。对于真菌宿主细胞,前肽编码序列可以从以下基因获得:嗜热毁丝霉(Myceliophthora thermophila)漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻前肽序列的N-末端。
还可希望的是添加调节序列,该调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在氨甲蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码目的多肽的多核苷酸将与调节序列可操作地连接。
表达载体
在第二方面,本发明还涉及重组表达载体,其包含本发明的核酸构建体。
重组表达载体可以是可以方便地经受重组DNA程序并且可以引起核酸构建体表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
酵母宿主细胞的适合的标记包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)以及trpC(邻氨基苯甲酸合酶)连同其等效物。优选的用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选的用于木霉属细胞的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如WO 2010/039889中所述的双选择性标记系统。在一个实施例中,双选择性标记是hph-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
为了整合至宿主细胞基因组中,载体可以依赖于核酸构建体的多核苷酸序列或用于借助同源或非同源重组整合至基因组中的该载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,这些核酸与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可以根据WO 00/24883中披露的方法完成AMA1基因的分离和包含基因的质粒或载体的构建。
可将本发明核酸构建体的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将构建体的至少一个另外的拷贝整合到宿主细胞基因组中或通过包括一个与该构建体一起的可扩增的选择性标记基因可以获得核酸构建体的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝的细胞、以及由此该构建体的另外的拷贝。
用于连接以上元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,Sambrook等人,1989,同上)。
宿主细胞
在第三方面,本发明还涉及重组宿主细胞,其包含本发明的核酸构建体。将构建体或包含构建体的载体引入到宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所描述。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码目的多肽的多核苷酸及其来源。
该宿主细胞可以是在目的多肽的重组生产中有用的任何细胞。优选地,该宿主细胞是真核生物宿主细胞,如哺乳动物、昆虫、植物或真菌细胞。
在优选的实施例中,该宿主细胞是真菌宿主细胞。宿主细胞可以是真菌细胞。如本文使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人在以下文献中所定义:Ainsworth and Bisby’s Dictionary ofThe Fungi[安斯沃思和拜斯比真菌字典],第8版,1995,CAB International[国际应用生物科学中心],University Press[大学出版社],Cambridge,UK[英国剑桥])。
在优选的实施例中,该真菌宿主细胞是酵母宿主细胞。如本文使用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌纲(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)中所描述的那样定义。
优选地,该酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁弗酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)或解脂耶氏酵母(Yarrowia lipolytica)细胞。
在优选的实施例中,该真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995(同上)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)来进行的,而碳分解代谢可以是发酵性的。
优选地,该丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
更优选地,该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametesvillosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。最优选地,该丝状真菌宿主细胞是黑曲霉、米曲霉、镶片镰孢菌或里氏木霉细胞。
本发明的宿主细胞可以通过用形成本发明核酸构建体所必需的模块化DNA元件转化合适的细胞来制备。
因此,在第四方面,本发明涉及一种用于制备真核生物宿主细胞的方法,该方法包括用以下转化真核生物细胞:
a)第一多核苷酸,其在‘5至3方向上包含启动子和第一DNA序列;
b)第二多核苷酸,其在‘5至‘3方向上包含第二DNA序列、编码目的多肽的多核苷酸和第三DNA序列;以及
c)第三多核苷酸,其在‘5至3’方向上包含第四DNA序列和终止子;
其中该第一、第二和第三多核苷酸可操作地连接,其中该第一和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
宿主细胞的制备包括核酸构建体,该核酸构建体包含需要用另外的模块化DNA元件转化的信号肽。
因此,在优选的实施例中,用第四多核苷酸进一步转化该宿主细胞,该第四多核苷酸在5’至3’方向上包含第五DNA元件、编码信号肽的多核苷酸和第六DNA元件,其中该第一、第二、第三和第四多核苷酸可操作地连接,其中该第一和第五DNA序列、该第六和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中所得内含子能够在转录后进行RNA剪接。
换言之,在优选的实施例中,本发明涉及一种用于制备真核生物宿主细胞的方法,该方法包括用以下转化真核生物细胞:
a)第一多核苷酸,其在‘5至3方向上包含启动子和第一DNA序列;
b)第二多核苷酸,其在‘5至‘3方向上包含第二DNA序列、编码信号肽的多核苷酸和第三DNA序列;
b)第三多核苷酸,其在‘5至3’方向上包含第四DNA序列、编码目的多肽的多核苷酸和第五DNA序列;以及
d)第四多核苷酸,其在‘5至3’方向上包含第六DNA序列和转录终止子;
其中该第一、第二、第三和第四多核苷酸可操作地连接,其中该第一和第二DNA序列、该第三和第四DNA序列以及该第五和第六DNA序列能够成对同源重组,然后形成内含子,并且其中所得内含子能够在转录后进行RNA剪接。
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可以使用由以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,AcademicPress,Inc.[学术出版社有限公司],纽约);Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
生产方法
在第五方面,本发明还涉及用于生产目的多肽的方法,该方法包括:
a)提供根据本发明第三方面所述的或通过根据本发明第四方面所述的方法制备的真核生物宿主细胞;
b)在有助于该目的多肽表达的条件下培养所述宿主细胞;以及,任选地
c)回收该目的多肽。
这些宿主细胞是在适合于使用本领域已知的方法生产该目的多肽的营养培养基中培养的。例如,可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,该培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的适合的营养培养基中。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果目的多肽被分泌到营养培养基中,则可以直接从培养基中回收该多肽。如果该目的多肽不进行分泌,那么其可以从细胞裂解液中进行回收。
可以使用特异性针对这类多肽的本领域已知的方法来检测该目的多肽。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定多肽的活性。
可以使用本领域中已知的方法回收该目的多肽。例如,可通过常规方法,包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养培养基回收多肽。在一个实施例中,回收包含该目的多肽的发酵液。
可以通过本领域已知的多种程序纯化该目的多肽,包括但不限于色谱法(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和尺寸排阻色谱法)、电泳程序(例如,制备型等电聚焦电泳)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见例如,Protein Purification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989),以便获得基本上纯的多肽。
在一个替代性方面,不回收该目的多肽,而是将表达该多肽的本发明的宿主细胞用作该多肽的来源。
优选实施例的以下列表进一步说明了本发明。
优选的实施例
1)一种核酸构建体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、该第一内含子、该编码目的多核苷酸的多核苷酸、该第二内含子和该转录终止子可操作地连接。
2)根据实施例1中所述的核酸构建体,其进一步包含编码信号肽的多核苷酸和第三内含子,其中该编码信号肽的多核苷酸和该第三内含子可操作地连接至并且位于该第一内含子和该编码目的多肽的多核苷酸之间。
3)根据前述实施例中任一项所述的核酸构建体,其中该启动子是异源启动子。
4)根据前述实施例中任一项所述的核酸构建体,其中该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
5)根据前述实施例中任一项所述的核酸构建体,其中这些内含子是不同的,并且独立地包含不超过200个核苷酸,即,不超过175、150、125、100、90、80、70、60或50个核苷酸。
6)根据前述实施例中任一项所述的核酸构建体,其中这些内含子包含GT供体位点和/或AG接受位点。
7)根据前述实施例中任一项所述的核酸构建体,其中这些内含子能够在转录后进行RNA剪接。
8)根据前述实施例中任一项所述的核酸构建体,其中这些内含子与该宿主细胞是异源的。
9)根据前述实施例中任一项所述的核酸构建体,其中这些内含子独立地选自由SEQ ID NO:1-21组成的组。
10)根据前述实施例中任一项所述的核酸构建体,其中该第一内含子位于该启动子和该编码目的多肽的多核苷酸的起始密码子之间。
11)根据前述实施例中任一项所述的核酸构建体,其中该第二内含子位于该编码目的多肽的多核苷酸的终止密码子和该转录终止子之间。
12)根据前述实施例中任一项所述的核酸构建体,其中该表达盒进一步包含位于该启动子上游的接头多核苷酸。
13)根据前述实施例中任一项所述的核酸构建体,其中该表达盒进一步包含位于该终止子下游的接头多核苷酸。
14)一种包含核酸构建体的表达载体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、第一内含子、编码目的多核苷酸的多核苷酸、第二内含子和转录终止子可操作地连接。
15)根据实施例14中所述的表达载体,其中该核酸构建体进一步包含编码信号肽的多核苷酸和第三内含子,其中该编码信号肽的多核苷酸和该第三内含子可操作地连接至并且位于该第一内含子和该编码目的多肽的多核苷酸之间。
16)根据实施例14-15中任一项所述的表达载体,其中该启动子是异源启动子。
17)根据实施例14-16中任一项所述的表达载体,其中该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
18)根据实施例14-17中任一项所述的表达载体,其中这些内含子是不同的,并且独立地包含不超过200个核苷酸,即,不超过175、150、125、100、90、80、70、60或50个核苷酸。
19)根据实施例14-18中任一项所述的表达载体,其中这些内含子包含GT供体位点和/或AG接受位点。
20)根据实施例14-19中任一项所述的表达载体,其中这些内含子能够在转录后进行RNA剪接。
21)根据实施例14-20中任一项所述的表达载体,其中这些内含子与该宿主细胞是异源的。
22)根据实施例14-21中任一项所述的表达载体,其中这些内含子独立地选自由SEQ ID NO:1-21组成的组。
23)根据实施例14-22中任一项所述的表达载体,其中该第一内含子位于该启动子和该编码目的多肽的多核苷酸的起始密码子之间。
24)根据实施例14-23中任一项所述的表达载体,其中该第二内含子位于该编码目的多肽的多核苷酸的终止密码子和该转录终止子之间。
25)根据实施例14-24中任一项所述的表达载体,其中该表达盒进一步包含位于该启动子上游的接头多核苷酸。
26)根据实施例14-25中任一项所述的表达载体,其中该表达盒进一步包含位于该终止子下游的接头多核苷酸。
27)一种真核生物宿主细胞,其在其基因组中包含核酸构建体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、第一内含子、编码序列、第二内含子和转录终止子可操作地连接;或者一种包含核酸构建体的表达载体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、第一内含子、编码目的多核苷酸的多核苷酸、第二内含子和转录终止子可操作地连接。
28)根据实施例27中所述的真核生物宿主细胞,其中该核酸构建体进一步包含编码信号肽的多核苷酸序列和第三内含子,其中该编码信号肽的多核苷酸序列和该第三内含子可操作地连接至并且位于该第一内含子和目的多肽的编码序列之间。
29)根据权利要求27-28中任一项所述的真核生物宿主细胞,所述宿主细胞是哺乳动物、植物或真菌宿主细胞;优选地,所述宿主细胞是真菌宿主细胞。
30)根据实施例29中所述的真核生物宿主细胞,其中该真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁弗酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母和解脂耶氏酵母细胞。
31)根据实施例29中所述的真核生物宿主细胞,其中该真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;最优选地,该丝状真菌宿主细胞选自由以下组成的组:黑曲霉、米曲霉、镶片镰孢和里氏木霉。
32)根据实施例27-31中任一项所述的真核生物宿主细胞,其中该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
33)根据实施例27-32中任一项所述的真核生物宿主细胞,其中这些内含子是不同的,并且独立地包含不超过200个核苷酸,即,不超过175、150、125、100、90、80、70、60或50个核苷酸。
34)根据实施例27-33中任一项所述的真核生物宿主细胞,其中这些内含子包含GT供体位点和/或AG接受位点。
35)根据实施例27-34中任一项所述的真核生物宿主细胞,其中这些内含子能够在转录后进行RNA剪接。
36)根据实施例27-35中任一项所述的真核生物宿主细胞,其中这些内含子与该宿主细胞是异源的。
37)根据实施例27-36中任一项所述的真核生物宿主细胞,其中这些内含子独立地选自由SEQ ID:NO 1-21组成的组。
38)根据实施例27-37中任一项所述的真核生物宿主细胞,其中该第一内含子位于该启动子和该编码目的多肽的多核苷酸的起始密码子之间。
39)根据实施例27-38中任一项所述的真核生物宿主细胞,其中该第二内含子位于该编码目的多肽的多核苷酸的终止密码子和该转录终止子之间。
40)根据实施例27-39中任一项所述的真核生物宿主细胞,其中该表达盒进一步包含位于该启动子上游的接头多核苷酸。
41)根据实施例27-40中任一项所述的真核生物宿主细胞,其中该表达盒进一步包含位于该终止子下游的接头多核苷酸。
42)一种构建真核生物宿主细胞的方法,该方法包括用以下转化真核细胞:
a)第一多核苷酸,其在‘5至3方向上包含启动子和第一DNA序列;
b)第二多核苷酸,其在‘5至‘3方向上包含第二DNA序列、目的多肽的编码序列和第三DNA序列;以及
c)第三多核苷酸,其在‘5至3’方向上包含第四DNA序列和转录终止子;
其中该第一、第二和第三多核苷酸可操作地连接,其中该第一和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
43)根据实施例42所述的方法,其中该宿主细胞用第四多核苷酸进一步转化,该第四多核苷酸在5’至3’方向上包含第五DNA序列、编码信号肽的多核苷酸和第六DNA序列;
其中该第一、第二、第三和第四多核苷酸可操作地连接,其中该第一和第五DNA序列、该第六和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
44)根据实施例42-43中任一项所述的方法,其中该真核生物细胞是真菌细胞。
45)根据实施例44所述的方法,其中该真菌细胞是酵母细胞;优选地,该酵母细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母细胞选自由以下组成的组:乳酸克鲁弗酵母、卡尔斯伯酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母和解脂耶氏酵母细胞。
46)根据实施例44所述的方法,其中该真菌细胞是丝状真菌细胞;优选地,该丝状真菌细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞;更优选地,该丝状真菌细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;最优选地,该丝状真菌细胞选自由以下组成的组:黑曲霉、米曲霉、镶片镰孢和里氏木霉。
47)一种用于产生目的多肽的方法,该方法包括以下步骤:
a)提供根据实施例27-41中任一项所述的或通过根据实施例42-46中任一项所述的方法制备的真核生物宿主细胞;
b)在有助于该目的多肽表达的条件下培养所述宿主细胞;以及,任选地
c)回收该目的多肽。
48)根据实施例44中所述的真核生物宿主细胞,其中该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
实例
材料与方法
菌株
米曲霉COls1300被描述于WO 2018/050666中。
方法
PCR、克隆、培养等的通用方法是本领域普通技术人员熟知的并且可以例如发现于“Molecular cloning:A laboratory manual[分子克隆:实验室手册]”,Sambrook等人(1989),Cold Spring Harbor lab.[冷泉港实验室],冷泉港,纽约州;Ausubel,F.M.等人(编辑);“Current protocols in Molecular Biology[分子生物学实验指南]”,JohnWiley and Sons[约翰威立父子公司],(1995);Harwood,C.R.和Cutting,S.M.(编辑);“DNACloning:A Practical Approach[DNA克隆:实用方法],第I和II卷”,D.N.Glover编辑(1985);“Oligonucleotide Synthesis[寡核苷酸合成]”,M.J.Gait编辑(1984);“APractical Guide To Molecular Cloning[分子克隆实用指南]”,B.Perbal,(1984))。
培养基
YPM培养基(2g/l酵母提取物、2g/l蛋白胨和2%麦芽糖)。
脂肪酶测定(对硝基苯戊酸酯)
稀释缓冲液:50mM Tris,pH 7.5,10mM CaCI2,0.1%Triton x-100;底物原液:将117μl对硝基苯戊酸酯(sigma N4377)稀释于10ml甲醇中;底物:将10ml稀释缓冲液添加至100μl底物原液中。将10μl样品添加至1ml底物中,形成产物然后测量405nm处的吸光度。
通过微滴式数字PCR(ddPCR)确定拷贝数
根据制造商的说明使用BioRad QX200 ddPCR系统以及使用附带的“QuantaSoft”软件套件(伯乐公司(BioRad))确定拷贝数变化。
简言之,使用罗氏“通用探针库”中FAM标记的Taqman探针#29测定脂肪酶基因拷贝数。该单拷贝参考探针由Exiqon公司制造,是罗氏“通用探针库”中探针#70的HEX标记版本。该仪器可对给定样品中DNA分子的既定种类进行精确定量。通过确定单拷贝参考与目的多核苷酸之间的定量来计算拷贝数。
实例1.筛选内含子序列和对脂肪酶基因表达的影响
为了测试不同内含子序列的工程化能否用于建立依赖于mRNA剪接的不同遗传元件的组合的过程,在米曲霉中研究使用内含子进行的异源脂肪酶表达。
构成表达盒的多核苷酸序列(其包含启动子、编码多肽的多核苷酸序列(来自嗜热棉毛菌的脂肪酶,WO 2016102356-A1,UniProtKB登录号O59952)和转录终止子)被用作DNA模板用于PCR。扩增将脂肪酶编码序列分为两部分的两个PCR产物(PCR1和PCR2,见图1)。商业合成了二十一个不同的内含子,其具有分别与PCR 1-3’和PCR2-5’同源的5’(gtgggcgatgtcaccggcttccttgctctc;SEQ ID NO:24)和3’(gacaacacgaacaaattgatcgtcctctct;SEQ ID NO:25)30bp侧翼。内含子选自曲霉属基因组数据库中注释的构巢曲霉内含子,以确保其序列不与米曲霉基因组DNA同源(以防止不需要的同源重组),并且序列长度不能被3整除(以在内含子不能正确发挥作用时确保移码)。
用WO 2018/050666中描述的体内重组方法将500ng PCR1、500ng PCR2和100ng其各自对应的内含子(表1中指定的)混合从而构建菌株。通过使用仅含有同源侧翼的60bp片段(实际插入0bp)来制造对照菌株。
表1.内含子序列#21来源于构巢曲霉(AN6157)中的pyrG,对照序列#22不具有内含子。
Figure BDA0002869381620000251
Figure BDA0002869381620000261
因此,构建了21种不同的菌株,其具有一个置入并且因此可以分开脂肪酶编码序列的独特内含子序列。对照菌株(#22)不具有内含子。通过测序来确认候选序列,以确保内含子序列按照预期放置在驻留基因座,并且进行ddPCR以确保所有菌株均含有脂肪酶基因的单拷贝。这些菌株在YPM中30℃下培养5天,并且过滤发酵液(上清液)。用SDS-PAGE凝胶检测各上清液中存在的蛋白质,并测定脂肪酶活性(图2)。
正如观察到的,大多数使用的内含子耐受良好,并且对脂肪酶的总体表达水平没有负面影响。实际上,与没有内含子的对照或pyrG内含子对照相比,几个经测试的内含子产生相似或更高的脂肪酶水平。
该实例表明功能多肽的编码序列可以工程化以含有内含子,并且依然在真菌宿主中具有功能。
实例2.使用内含子构建遗传元件的组合文库
使用三种内含子(在图3所示的设置中表示为i1、i2和i3)测试多于一个内含子在构建多个基因结构中的用途,从而检测使用内含子作为通用接头组装几个DNA片段的能力。如在实例1中,通过培养物上清液中脂肪酶蛋白的水平和脂肪酶活性来测量该方法的功能性。再次,研究了单拷贝菌株。在该实例中,三种启动子序列(P1、P2和P3)被用作可变的货物序列。
图3中显示的DNA片段(DORA UP、P、S、G、T和DORA DW)均由PCR产生。所用的寡核苷酸含有表2中指定的具有30bp连接重叠序列的尾部。DORA UP和DORA DW都是用于体内重组方法进入菌株COls1300的标准片段,如WO 2018/050666中所描述。在三个实验中使用了三种不同的启动子P1-P3来产生3种不同类型的菌株,各自仅在所选的启动子方面有所不同。这些启动子选自标准真菌启动子。使用500ng DORA UP和DW片段(片段1和片段6,表3)以及指定数量的片段2-5(表3),将这些片段混合。
表2.连接序列的核苷酸序列。序列i1-i3是被发现可产生实例1中功能性脂肪酶的内含子。
Figure BDA0002869381620000271
表3.这三个实验中的每一个均采用指定的数量混合六个DNA片段(F)。
Figure BDA0002869381620000272
从每一个实验,选择四个转化体,并且在30℃下于YPM培养基中培养五天,并且过滤培养上清液。如图4所示,将样品在SDS-PAGE凝胶上跑胶。
如图所示,在三个不同的启动子片段情况下,用内含子组装六个片段是成功的。在所有情况下,上清液中均观察到脂肪酶的存在。因此,在目的基因的编码区内使用内含子作为通用接头可以有效组装几个DNA片段。
实例3.内含子在多拷贝菌株中对于蛋白质表达是功能性的
如WO 2013/178674中披露构建表达载体。简言之,构建了以多拷贝方式整合到米曲霉基因组中单个特定基因座的载体,恢复了选择性基因。可以通过ddPCR来确定所选菌株中脂肪酶基因的拷贝数。通过大肠杆菌中的标准克隆方法(图5)来构建四种载体。
选择来自每种载体的转化体,在30℃下于YPM中培养五天,并且将上清液在SDS-PAGE凝胶上跑胶(图6)。通过ddPCR确定每一个所选转化体中脂肪酶基因的拷贝数。结果表明即使在拷贝数很高时,多个内含子的功能性保持。因此,使用多个内含子能够产生功能性脂肪酶,从而构建具有遗传元件组合的多个菌株。
此外,序列验证表明已经获得了载体4的一个版本(图5),其内含子序列中具有单个碱基缺失,即从
5’-GTAAAGTCTCCCCTCTCCTCCCATCTCATGAACTCTGTAAGCTGACCCATCCAAG-3’变为
5’-GAAAGTCTCCCCTCTCCTCCCATCTCATGAACTCTGTAAGCTGACCCATCCAAG-3’,称作载体4突变。如通过使用两个载体衍生的19拷贝菌株所判断的,wt和突变内含子序列之间的比较表明后者中的脂肪酶可更好的表达(图6)。所以,间插性内含子的序列修饰导致脂肪酶产量增加。
此外,该实例表明内含子的功能性不受低拷贝数的限制,并且使用内含子作为接头也对生产相关菌株的表达起作用。
实例4.多个内含子和启动子文库
除了同时向混合物中添加三种启动子片段外(图7),该实例类似于上文描述的实例2。
表4.将DNA片段(F)1、3、4、5和6与F2的所有三种类型混合,使得转化期间三种启动子中的任何一种被整合。用指定的数量混合这些片段。
Figure BDA0002869381620000281
从同步实验中选择32个转化体,在30℃下于YPM培养基中培养五天,并且将上清液在SDS-PAGE凝胶上跑胶(图8)。随后,对菌株进行测序显示在这个有限的样品量中,3种类型的启动子均出现。因此,该实例表明可使用内含子接头生产组合文库。
实例5.内含子中的多核苷酸序列是灵活的
实例4中十三号菌株的DNA测序表明在这些片段组装期间,内含子#8(SEQ ID NO:8)的序列已经突变,从而产生新颖功能性内含子。新颖内含子(图9)比内含子#8(SEQ IDNO:8)大33个核苷酸,但是如图8所示,菌株#13良好地表达蛋白质,这表明新颖内含子具有完整的功能。
对于内含子#8(SEQ ID NO:8,图10)和内含子#7(SEQ ID NO:7,图11),已观察到内含子内更多序列较小变异的实例,这表明在序列内,内含子对修饰具有耐受性。
实例6.使用内含子作为接头进行密码子变体的矩阵克隆
使用与实例2和实例4中应用的相同方法,建立矩阵来克隆疏棉状嗜热丝孢菌(Thermomyces lanuginosus)脂肪酶(UniProtKB登录号O59952)的六种不同密码子变体。简言之,通过PCR和凝胶纯化扩增片段(表5)。
表5.该表显示了矩阵实验中需要的片段(F)。寡核苷酸#1和寡核苷酸#2是使用的PCR引物,并且所得片段的大小以碱基对(bp)表示。一次转化中每一个片段的所需的DNA数量以ng表示。
Figure BDA0002869381620000291
以表5所示的量使用表6中指定的片段按照WO 2018/050666中描述的进行转化。因此,每个转化混合物由表6中指定的6种片段组成,除了转化Lip#7(阴性对照),其中无DNA被用作为基因变体。矩阵的图解说明示于图12中。
表6.该表显示了用于7个转化的矩阵。“UP”、“启动子”、“信号”、“变体”、“终止子”和“下游”这些分类中的数字代表了表5中的片段编号。片段38和39是脂肪酶的部分重叠片段,它们能够组合以形成完整的基因,因此在Lip#6的案例中,将七种片段添加至转化中。
Figure BDA0002869381620000301
获得了每个基因变体的转化体。这些转化体被选择出并在30℃下于YPM培养基中培养五天,并且将上清液在SDS-PAGE凝胶上跑胶(图13)。令人欣慰的是,每一种脂肪酶变体均出现在转化体中。
参考文献
Cerqueira GC,Arnaud MB,Inglis DO,Skrzypek MS,Binkley G,Simison M,Miyasato SR,Binkley J,Orvis J,Shah P,Wymore F,Sherlock G,Wortman JR(2014).TheAspergillus Genome Database:multispecies curation and incorporation of RNA-Seq data to improve structural gene annotations.Nucleic Acids Res 42(1);D705-10.
Arnaud MB,Cerquiera GC,Inglis DO,Skrzypek MS,Binkley J,Shah P,WymoreF,Binkley G,Miyasato SR,Simison M,Wortman JR,Sherlock G."Aspergillus GenomeDatabase"http://www.aspergillusgenome.org/(20160416).
序列表
<110> 诺维信公司
<120> 制备DNA构建体的组合文库
<130> 14448-WO-PCT
<160> 33
<170> PatentIn 3.5版
<210> 1
<211> 35
<212> DNA
<213> 构巢曲霉
<400> 1
gtcacccggg gggtcccggt acgcgcgcta agtag 35
<210> 2
<211> 41
<212> DNA
<213> 构巢曲霉
<400> 2
gtatgttcgc ttggattgat atttgcgacc cccgctaaca g 41
<210> 3
<211> 46
<212> DNA
<213> 构巢曲霉
<400> 3
gtatgtccct ctggcacatc tgcatctact ttctaacaga aactag 46
<210> 4
<211> 46
<212> DNA
<213> 构巢曲霉
<400> 4
gtgagttggt cgtctatgag ggtccaactt ggctcacaag gaacag 46
<210> 5
<211> 49
<212> DNA
<213> 构巢曲霉
<400> 5
gtaggtcgga tccgccacat atacactgcg cccgctcatg ttgcactag 49
<210> 6
<211> 50
<212> DNA
<213> 构巢曲霉
<400> 6
gtaagattat atcagccgta tacgagctga gcgactgaca tgcatgacag 50
<210> 7
<211> 53
<212> DNA
<213> 构巢曲霉
<400> 7
gtgagtactg tcttttcagc aaatggacga cataacttac aagctgaaaa cag 53
<210> 8
<211> 55
<212> DNA
<213> 构巢曲霉
<400> 8
gtaaagtctc ccctctcctc ccatctcatg aactctgtaa gctgacccat ccaag 55
<210> 9
<211> 55
<212> DNA
<213> 构巢曲霉
<400> 9
gtgagcgcga tctacccgct atattggaag gcaattctga tctccttgat gatag 55
<210> 10
<211> 59
<212> DNA
<213> 构巢曲霉
<400> 10
gtatgctccc cataatctta gaacctgctg catacttcta ctgaccacga tctgtacag 59
<210> 11
<211> 65
<212> DNA
<213> 构巢曲霉
<400> 11
gtaagtctct gcacgcgcta cgcccagtca agattatata aatactgata ttgtatgata 60
catag 65
<210> 12
<211> 65
<212> DNA
<213> 构巢曲霉
<400> 12
gtaagccagc ccggttgcac gggcaccgaa atcgccttac caggcgctga cacggtcaat 60
cgtag 65
<210> 13
<211> 65
<212> DNA
<213> 构巢曲霉
<400> 13
gtttgttaac aatcttgata ctgccctcat tcttgcaatg tgtcactgaa ttgcttgtgg 60
gacag 65
<210> 14
<211> 67
<212> DNA
<213> 构巢曲霉
<400> 14
gtaccttctt ttgtatggct gtacgttatt tcctcccata tggttccgtg tataggactg 60
aagtcag 67
<210> 15
<211> 68
<212> DNA
<213> 构巢曲霉
<400> 15
gtacgtgtct tctttttttt tgcttgttct acctcgcgcc tcagtacaag agatactaat 60
tgatttag 68
<210> 16
<211> 70
<212> DNA
<213> 构巢曲霉
<400> 16
gtgtgttacc caggtttctt gcatattctc tcccgaagtc cctatactct ggctaatccc 60
atatctgcag 70
<210> 17
<211> 70
<212> DNA
<213> 构巢曲霉
<400> 17
gtaagtcttt ccactttctg tctgtgtatg tgggggaaaa cacatgagtg agccctttct 60
gacatctcag 70
<210> 18
<211> 73
<212> DNA
<213> 构巢曲霉
<400> 18
gtatgtcttc aggcgcttat tgttaccgac ctttcccctt ggaaggaatg ctgacagtct 60
ttttctactc cag 73
<210> 19
<211> 73
<212> DNA
<213> 构巢曲霉
<400> 19
gtacgtatca ttcatgtcct tctacattac gcagactttg ttggttggtc gactgactgg 60
tccactgata tag 73
<210> 20
<211> 76
<212> DNA
<213> 构巢曲霉
<400> 20
gtatgaaaga gcggcgtccg gccgctggct gacactgaat cagactttgc aagttgcagc 60
agctaacgcc ccatag 76
<210> 21
<211> 59
<212> DNA
<213> 构巢曲霉
<400> 21
gtacatcctg caccaatgcc cctccaggat aacaaatagc tgatgcgtag tgagtacag 59
<210> 22
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 接头 1
<400> 22
cctaactgcg ctgagggttt acgcgcctga 30
<210> 23
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 接头 2
<400> 23
gaaacctgag gcaacaaggg ggcgcgattt acc 33
<210> 24
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 30 bp侧翼
<400> 24
gtgggcgatg tcaccggctt ccttgctctc 30
<210> 25
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 30 bp侧翼
<400> 25
gacaacacga acaaattgat cgtcctctct 30
<210> 26
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> 内含子 #8
<400> 26
gtaaagtctc ccctctcctc ccatctcatg aactctgtaa gctgacccat ccaatatgaa 60
attcttcaca acaatcttgt ccacagcatc g 91
<210> 27
<211> 124
<212> DNA
<213> 人工序列
<220>
<223> 含插入的内含子 #8
<400> 27
gtaaagtctc ccctctcctc ccatctcatg aactctgtgt ctcccctctc ctcccatctc 60
atgaactctg taagctgacc catccaatat gaaattcttc acaacaatct tgtccacagc 120
atcg 124
<210> 28
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> 共有
<400> 28
gtaaagtctc ccctctcctc ccatctcatg aactctgtaa gctgacccat ccaagatgaa 60
attcttcaca acaatcttgt ccacagcatc g 91
<210> 29
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 菌株#3 (实例 4) 1 bp插入
<400> 29
gtaaagttct cccctctcct cccatctcat gaactctgta agctgaccca tccaagatga 60
aattcttcac aacaatcttg tccacagcat cg 92
<210> 30
<211> 92
<212> DNA
<213> 人工序列
<220>
<223> 实验2 (实例 2)的菌株#1 1 bp插入
<400> 30
gtaaagtctc ccctctcctc ccatcctcat gaactctgta agctgaccca tccaagatga 60
aattcttcac aacaatcttg tccacagcat cg 92
<210> 31
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 菌株#21 (实例 4) 1 bp缺失
<400> 31
gtaaagtctc ccctctcctc ccatctcatg actctgtaag ctgacccatc caagatgaaa 60
ttcttcacaa caatcttgtc cacagcatcg 90
<210> 32
<211> 114
<212> DNA
<213> 人工序列
<220>
<223> 实例 2中实验1的菌株#4 内含子#7
<400> 32
gtcgcacgat cccctattcg acgagtgagt actgtctttt cagcaaatgg acgacataac 60
ttacaagctg aaaacaggag gtctcgcagg atctgtttaa ccagttcaat ctct 114
<210> 33
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 实例 2中实验1的菌株#4 含1 bp缺失的内含子#7
<400> 33
gtcgcacgat cccctattcg acgagtgagt actgtctttt cagcaatgga cgacataact 60
tacaagctga aaacaggagg tctcgcagga tctgtttaac cagttcaatc tct 113

Claims (15)

1.一种核酸构建体,该核酸构建体在5’至3’方向上包含启动子、第一内含子、编码目的多肽的多核苷酸、第二内含子和转录终止子,其中该启动子、该第一内含子、该编码目的多核苷酸的多核苷酸、该第二内含子和该转录终止子可操作地连接。
2.根据权利要求1所述的核酸构建体,该核酸构建体进一步包含编码信号肽的多核苷酸和第三内含子,其中该编码信号肽的多核苷酸和该第三内含子可操作地连接至并且位于该第一内含子和该编码目的多肽的多核苷酸之间。
3.根据前述权利要求中任一项所述的核酸构建体,其中该启动子是异源启动子;优选地,该启动子是真菌启动子。
4.根据前述权利要求中任一项所述的核酸构建体,其中该目的多肽包含酶或由酶组成;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地,该酶选自由以下组成的组:氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
5.根据前述权利要求中任一项所述的核酸构建体,其中这些内含子不相同,并且独立地包含不超过200个核苷酸,即,不超过175个、150个、125个、100个、90个、80个、70个、60个或50个核苷酸。
6.根据前述权利要求中任一项所述的核酸构建体,其中这些内含子独立地选自由SEQID NO:1-21组成的组。
7.根据前述权利要求中任一项所述的核酸构建体,其中该第一内含子位于该启动子和该编码目的多肽的多核苷酸的起始密码子之间,并且其中该第二内含子位于该编码目的多肽的多核苷酸的终止密码子和该转录终止子之间。
8.一种表达载体,该表达载体包含根据权利要求1-7中任一项所述的核酸构建体。
9.一种真核生物宿主细胞,该真核生物宿主细胞在其基因组中包含根据权利要求1-7中任一项所述的核酸构建体或根据权利要求8所述的表达载体。
10.根据权利要求9所述的真核生物宿主细胞,所述宿主细胞是哺乳动物、植物或真菌宿主细胞;优选地,所述宿主细胞是真菌宿主细胞。
11.根据权利要求10所述的真核生物宿主细胞,其中该真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁弗酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母和解脂耶氏酵母细胞。
12.根据权利要求10所述的真核生物宿主细胞,其中该真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;最优选地,该丝状真菌宿主细胞选自由以下组成的组:黑曲霉、米曲霉、镶片镰孢和里氏木霉。
13.一种构建真核生物宿主细胞的方法,该方法包括用以下转化真核细胞:
a)第一多核苷酸,其在‘5至3方向上包含启动子和第一DNA序列;
b)第二多核苷酸,其在‘5至‘3方向上包含第二DNA序列、目的多肽的编码序列和第三DNA序列;以及
c)第三多核苷酸,其在‘5至3’方向上包含第四DNA序列和转录终止子;
其中该第一、第二和第三多核苷酸可操作地连接,其中该第一和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
14.根据权利要求13所述的方法,其中该宿主细胞用第四多核苷酸进一步转化,该第四多核苷酸在5’至3’方向上包含第五DNA元件、编码信号肽的多核苷酸和第六DNA元件;
其中该第一、第二、第三和第四多核苷酸可操作地连接,其中该第一和第五DNA序列、该第六和第二DNA序列以及该第三和第四DNA序列能够成对同源重组,然后形成内含子,并且其中产生的内含子能够在转录后进行RNA剪接。
15.一种用于产生目的多肽的方法,该方法包括以下步骤:
a)提供根据权利要求9-12中任一项所述的或通过根据权利要求13-14中任一项所述的方法制备的真核生物宿主细胞;
b)在有助于该目的多肽表达的条件下培养所述宿主细胞;以及,任选地
c)回收该目的多肽。
CN201980044095.8A 2018-08-02 2019-07-19 使用内含子制备dna构建体的组合文库 Pending CN112585267A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862713838P 2018-08-02 2018-08-02
US62/713,838 2018-08-02
EP18191207 2018-08-28
EP18191207.2 2018-08-28
PCT/EP2019/069495 WO2020025357A1 (en) 2018-08-02 2019-07-19 Preparation of combinatorial libraries of dna constructs using introns

Publications (1)

Publication Number Publication Date
CN112585267A true CN112585267A (zh) 2021-03-30

Family

ID=67441093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980044095.8A Pending CN112585267A (zh) 2018-08-02 2019-07-19 使用内含子制备dna构建体的组合文库

Country Status (4)

Country Link
US (1) US20210301285A1 (zh)
EP (1) EP3830261A1 (zh)
CN (1) CN112585267A (zh)
WO (1) WO2020025357A1 (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994012650A2 (en) * 1992-12-03 1994-06-09 Transkaryotic Therapies, Inc. Activating expression of an amplifying endogenous gene by homologous recombination
US20080293143A1 (en) * 2003-05-15 2008-11-27 Shi-Lung Lin Generation of human embryonc stem-like cells using intronic RNA
US20090142838A1 (en) * 2004-06-14 2009-06-04 Xiaoxia Cui Methods for expressing rnp particles in eukaryotic cells
CN101970661A (zh) * 2007-10-29 2011-02-09 林希龙 使用内含子的核糖核酸生成人类类胚胎干细胞
CN102498126A (zh) * 2009-08-07 2012-06-13 诺维信公司 用于产生甜蛋白的方法
CN102925479A (zh) * 2005-03-08 2013-02-13 巴斯福植物科学有限公司 增强表达的内含子序列
CN105492604A (zh) * 2013-08-23 2016-04-13 诺维信公司 受调节的pepc表达
CN106661573A (zh) * 2014-08-20 2017-05-10 诺维信公司 多核苷酸文库的重组酶介导的整合
CN107429255A (zh) * 2015-03-09 2017-12-01 诺维信公司 将多种表达构建体引入真核细胞的方法
CN108138188A (zh) * 2015-10-30 2018-06-08 诺维信公司 用于体外和体内表达的多核苷酸构建体

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
ES2165420T3 (es) 1994-06-03 2002-03-16 Novozymes Biotech Inc Lacasas myceliophthora purificadas y acidos nucleicos que las codifican.
CN101659926A (zh) 1994-06-30 2010-03-03 诺沃奇梅兹有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
DE69932345T2 (de) 1998-10-26 2007-07-19 Novozymes A/S Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
CN100482801C (zh) 1999-03-22 2009-04-29 诺沃奇梅兹有限公司 用于在真菌细胞中表达基因的启动子
US8021875B2 (en) * 2001-08-27 2011-09-20 Roche Madison Inc. Methods for expression of transgenes
CN102224245B (zh) 2008-09-30 2016-01-13 诺维信股份有限公司 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
CA2836921C (en) * 2011-06-07 2020-08-18 Wisconsin Alumni Research Foundation Hepatocyte based insulin gene therapy for diabetes
WO2013178674A1 (en) 2012-05-31 2013-12-05 Novozymes A/S Improved selection in fungi
DK3237609T3 (da) 2014-12-22 2020-06-08 Novozymes As Detergentsammensætninger, lipasevarianter og polynukleotider, som koder for dem
EP3512953A1 (en) 2016-09-15 2019-07-24 Novozymes A/S Genomic integration of dna fragments in fungal host cells
KR102616820B1 (ko) * 2017-03-17 2023-12-21 애드베룸 바이오테크놀로지스, 인코포레이티드 향상된 유전자 발현을 위한 조성물 및 방법

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994012650A2 (en) * 1992-12-03 1994-06-09 Transkaryotic Therapies, Inc. Activating expression of an amplifying endogenous gene by homologous recombination
US20080293143A1 (en) * 2003-05-15 2008-11-27 Shi-Lung Lin Generation of human embryonc stem-like cells using intronic RNA
US20090142838A1 (en) * 2004-06-14 2009-06-04 Xiaoxia Cui Methods for expressing rnp particles in eukaryotic cells
CN102925479A (zh) * 2005-03-08 2013-02-13 巴斯福植物科学有限公司 增强表达的内含子序列
CN101970661A (zh) * 2007-10-29 2011-02-09 林希龙 使用内含子的核糖核酸生成人类类胚胎干细胞
CN102498126A (zh) * 2009-08-07 2012-06-13 诺维信公司 用于产生甜蛋白的方法
CN105492604A (zh) * 2013-08-23 2016-04-13 诺维信公司 受调节的pepc表达
CN106661573A (zh) * 2014-08-20 2017-05-10 诺维信公司 多核苷酸文库的重组酶介导的整合
CN107429255A (zh) * 2015-03-09 2017-12-01 诺维信公司 将多种表达构建体引入真核细胞的方法
CN108138188A (zh) * 2015-10-30 2018-06-08 诺维信公司 用于体外和体内表达的多核苷酸构建体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KARIN SCHOLTMEIJER等: "Effect of Introns and AT-Rich Sequences on Expression of the Bacterial Hygromycin B Resistance Gene in the Basidiomycete Schizophyllum commune", APPL ENVIRON MICROBIOL, vol. 67, no. 1, pages 481 - 483, XP055558981, DOI: 10.1128/AEM.67.1.481-483.2001 *

Also Published As

Publication number Publication date
WO2020025357A1 (en) 2020-02-06
US20210301285A1 (en) 2021-09-30
EP3830261A1 (en) 2021-06-09

Similar Documents

Publication Publication Date Title
US10351863B2 (en) Selection in fungi
EP2147107B1 (en) Expression cloning method suitable for selecting library clones producing a polypeptide of interest
EP2044203A2 (en) Methods for increasing expression of genes in a fungal cell
US9701970B2 (en) Promoters for expressing genes in a fungal cell
EP3898985B1 (en) Tandem protein expression
US11667922B2 (en) Fungal chaperone proteins
US20220267783A1 (en) Filamentous fungal expression system
WO2018167153A1 (en) Improved filamentous fungal host cell
CN112585267A (zh) 使用内含子制备dna构建体的组合文库
EP4347813A1 (en) Transcriptional regulators and polynucleotides encoding the same
US20160251666A1 (en) Promoters for Expressing Genes in a Fungal Cell
US20220025422A1 (en) Improved Filamentous Fungal Host Cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination