CN101248181A - 用于在真菌细胞中表达基因的曲霉启动子 - Google Patents

用于在真菌细胞中表达基因的曲霉启动子 Download PDF

Info

Publication number
CN101248181A
CN101248181A CNA2006800070050A CN200680007005A CN101248181A CN 101248181 A CN101248181 A CN 101248181A CN A2006800070050 A CNA2006800070050 A CN A2006800070050A CN 200680007005 A CN200680007005 A CN 200680007005A CN 101248181 A CN101248181 A CN 101248181A
Authority
CN
China
Prior art keywords
dna
sequence
seq
host cell
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800070050A
Other languages
English (en)
Inventor
蒂鲍特·乔斯·维恩策尔
诺林·尼古拉斯·玛丽亚·艾里萨伯斯·佩伊·范
阿恩·斯达姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101248181A publication Critical patent/CN101248181A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及经分离的启动子DNA序列、DNA构建体、载体和包含与编码序列可操作连接的这些启动子的宿主细胞。本发明还涉及使用经分离的新启动子用于表达基因和/或制造生物学化合物的方法。本发明还涉及使用本发明的新启动子用于改变内源基因转录水平和/或调节内源基因的方法。

Description

用于在真菌细胞中表达基因的曲霉启动子
技术领域
本发明涉及DNA序列(特别是经分离的启动子)和DNA构建体、载体和包含与编码序列可操作连接的这些启动子的宿主细胞。本发明还涉及用于表达基因和/或制造生物学化合物的方法。
背景技术
在宿主细胞中对重组生物学化合物的生产通常通过构建表达盒完成,在所述表达盒中,编码生物学化合物的DNA和适用于宿主细胞的启动子可操作地连接。表达盒可通过质粒介导或载体介导的转化引入宿主细胞。然后可通过在下述诱导条件下培养经转化的宿主细胞完成对生物学化合物的制造,所述诱导条件是表达盒中所含启动子适当发挥功能所必需的。
对于每种宿主细胞而言,通过转化被引入宿主细胞的编码序列的表达和对由该编码序列编码的重组生物学化合物的制造需要功能启动子的可用性。已知能在多种宿主细胞中发挥作用的大量启动子。真菌宿主细胞中存在启动子跨物种(cross-species)使用的实例是:Aspergillus nidulans启动子(A.nidulans gpdA基因已知在Aspergillus niger(A.niger)中发挥作用(JBiotechnol.1991 Jan;17(1):19-33.Intracellular and extracellular production ofproteins in Aspergillus under the control of expression signals of the highlyexpressed A.nidulans gpdA gene.Punt PJ,Zegers ND,Busscher M,PouwelsPH,van den Hondel CA.)。另一实例为用在A.niger和A.nidulans中的A.niger β-木糖苷酶xlnD启动子,Transcriptional regulation of the xylanolyticenzyme system of Aspergillus,van Peij,NNME,PhD-thesisLandbouwuniversiteit Wageningen,the Netherlands,ISBN 90-5808-154-0和Escherichia coli β-葡糖醛酸糖苷酶基因在A.niger、A.nidulans和Cladosporium fulvum中的表达,如Curr Genet.1989 Mar;15(3):177-80:Roberts IN,Oliver RP,Punt PJ,van den Hondel CA.″Expression of theEscherichia coli beta-glucuronidase gene in industrial and phytopathogenicfilamentous fungi″所述。
然而,仍然需要经改进的启动子,用于控制引入的基因的表达、用于控制内源基因的表达水平、用于控制对内源基因表达的调节或用于介导内源基因的失活,或用于制造多肽,或用于前述应用的组合。这些经改进的启动子可例如比先前已知的启动子更强。它们还可被特定的便利的底物或化合物诱导。当期望在单种宿主细胞中同时过量表达多种基因时,知道若干功能性启动子也是有利的。为了防止噪音抑制(squelching)(特定专利因子的效价(titration)),优选使用多种不同的启动子,每个待表达的基因一个特定的启动子。
附图说明
图1描述了pGBTOPGLA的质粒图谱,其为整合型葡萄糖淀粉酶表达载体。
图2描述了pGBTOPGLA-2的质粒图谱,其为带有多克隆位点的整合型葡萄糖淀粉酶表达载体。
图3描述了pGBTOPGLA-6的质粒图谱,其为含有与葡萄糖淀粉酶编码序列可操作连接的本发明启动子的整合型表达载体。该图还阐释了在这些实施例中构建的其它五个pGBTOPGLA载体的结构,其为pGBTOPGLA-8、pGBTOPGLA-11、pGBTOPGLA-12、pGBTOPGLA-13或pGBTOPGLA-14。
图4描述了通过单同源重组整合的图示。
图5:WT1、WT2和不同pGBTOPGLA载体的转化体的葡萄糖淀粉酶活性。显示标准化的活性,其中WT1第3天的活性设为100%。
图6描述了pGBDEL-PGGLAA的质粒图谱,其为置换型载体。
图7描述了启动子置换的图示。
图8描述了通过同源重组的整合的图示。
发明详述
根据本发明的第一个方面,提供了启动子DNA序列,例如
(a)以下列表示出的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6,
(b)能够与(a)的DNA序列杂交的DNA序列,
(c)与(a)的DNA序列至少50%同源的DNA序列,
(d)(a)到(c)的任何DNA序列的变体,或
(e)(a)到(d)的任何DNA序列的亚序列。
在本发明上下文中,启动子DNA序列为下述DNA序列,所述DNA序列与编码序列可操作连接时能够调控所述编码序列的表达。术语“可操作连接”在本文定义为一种构型,在其中启动子DNA序列适当地置于与编码序列相关的位置,使得启动子DNA序列指导对由所述编码序列编码的产物的制造。
术语“编码序列”在本文定义为转录为mRNA的核酸序列,所述RNA置于适当调控序列调控下时被翻译为多肽。编码序列的边界通常由ATG起始密码子(其通常为mRNA 5’端的开放读码框的起点)和位于mRNA 3’端开放读码框下游的转录终止子序列确定。编码序列可包括但不仅限于基因组DNA、cDNA、半合成的、合成的和重组的核酸序列。
更特别地,术语“启动子”在本文中定义为下述DNA序列,所述DNA序列与RNA聚合酶结合,并指导所述聚合酶至编码多肽的编码序列下游正确的转录起始位点以起始转录。RNA聚合酶能有效催化与编码区适当DNA链互补的信使RNA的装配。术语“启动子”还应被理解为包括用于转录为mRNA后翻译的5’非编码区(在启动子和翻译起点之间)、顺式作用转录调控元件(如增强子)和能够与转录因子相互作用的其它核苷酸序列。
在一种优选的实施方案中,本发明的启动子DNA序列为示于以下列表中的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6。
根据另一优选的实施方案,本发明的启动子DNA序列为能够与示于以下列表中的DNA序列杂交,并仍然保持启动子活性的DNA序列:SEQID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6。
在本发明上下文中,优选通过测量编码序列表达所产生的蛋白质浓度来确定启动子活性,所述编码序列与所述启动子可操作地连接。或者通过测量由编码序列编码的蛋白质的酶活性来确定启动子的活性,所述编码序列与所述启动子可操作地连接。根据一种优选的实施方案,通过测量lacZ报告基因编码序列的表达来确定启动子活性(及其强度)(In Luo(Gene163(1995)127-131)。根据另一优选的实施方案,通过使用绿色荧光蛋白作为编码序列确定启动子的活性(In Microbiology.1999 Mar;145(Pt 3):729-34.Santerre Henriksen AL,Even S,Muller C,Punt PJ,van den Hondel CA,Nielsen J.Study)。另外,可通过测量在启动子调控下产生的转录物的mRNA水平确定启动子活性。MRNA水平可例如通过Northern印迹来测量(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,N.Y.)。所述所有用于确定启动子活性的测定法中,可将启动子活性与另一启动子活性相比较,这例如通过将相同的报告基因或编码序列置于不同启动子调控下并在相同条件下测量启动子活性来实现。
本发明包括(经分离的)在下述条件下与下述核酸探针杂交的启动子DNA序列,所述条件为非常低严格度条件,优选低严格度条件,更优选中严格度条件,更优选中-高严格度条件,进一步更优选高严格度条件,并最优选非常高严格度条件;所述核酸探针对应于
a:SEQ ID NO:1或SEQ ID NO:2的核苷酸1到2000,优选核苷酸100到1990,更优选200到1980,进一步更优选300到1970,进一步更优选350到1950和最优选360到1900,或
b:SEQ ID NO:3的核苷酸1到1490,优选100到1480,更优选200到1470,进一步更优选300到1460,进一步更优选350到1440和最优选360到1400,或
c:SEQ ID NO:4或SEQ ID NO:5的核苷酸1到1997,优选核苷酸100到1987,更优选200到1977,进一步更优选300到1967,进一步更优选350到1950和最优选360到1900,或
d:SEQ ID NO:6的核苷酸1到937,优选50到927,更优选100到917,进一步更优选150到907,进一步更优选200到887和最优选250到867,或
e:(a)、(b)、(c)或(d)的亚序列,或
f:(a)、(b)、(c)、(d)或(e)的互补链。
术语互补链为本领域技术人员已知,并描述于J.Sambrook,E.F.Fritsch,and T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,N.Y中。
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5或SEQ ID NO:6的亚序列可以为至少100个核苷酸,优选至少200个核苷酸,更优选至少300个核苷酸,甚至更优选至少400个核苷酸和最优选至少500个核苷酸。
SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5或SEQ ID NO:6的核酸序列或其亚序列可用于设计核酸探针,所述核酸探针用于从不同属或种的菌株中根据本领域公知的方法鉴定和克隆DNA启动子。具体地,这类探针可用于与目的属或种的基因组或cDNA根据标准Southern印迹程序杂交,从而鉴定并分离其中相应的基因。这类探针可显著短于整个序列,但是应为至少15个,优选至少25个并更优选至少35个核苷酸长度。另外,这类探针可用于通过PCR扩增DNA启动子。通过PCR克隆启动子的实例描述于本文(参阅实施例1.3)。也可使用更长的探针。可使用DNA、RNA和肽核酸(PNA)探针。探针被典型地标记用于检测相应的基因(例如用@32P、@33P@3H、@35S、生物素或抗生素蛋白或荧光标记物)。这类探针包括在本发明中。
因此可筛选从这类生物制备的基因组DNA或cDNA文库,得到与上述探针杂交并编码多肽的DNA。来自这类其它生物的基因组或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离。来自文库的DNA或分离的DNA可转移至或固定在硝酸纤维素上或其它合适的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6或其亚序列同源的克隆或DNA,可在Southern印迹中使用载体材料。
就本发明的目的而言,杂交指核酸序列与经标记的核酸探针在非常低到非常高严格度条件下杂交,所述经标记的核酸探针对应于SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQID NO:6中所示核酸序列、它们的互补链或其亚序列。在这些条件下与核酸探针杂交的分子使用例如X射线胶片检测。也可使用其它杂交技术,例如使用荧光用于检测和使用玻璃片和/或DNA微阵列作为支持物的技术。DNA微阵列杂交检测的实例描述于FEMS Yeast Res.2003 Dec;4(3):259-69(Daran-Lapujade P,Daran JM,Kotter P,Petit T,Piper MD,Pronk JT.″Comparative genotyping of the Saccharomyces cerevisiae laboratory strainsS288C and CEN.PK113-7D using oligonucleotide microarrays″.另外,PNA微阵列用于杂交的用途描述于Nucleic Acids Res.2003 Oct 1;31(19):e119(Brandt O,Feldner J,Stephan A,Schroder M,Schnolzer M,Arlinghaus HF,Hoheisel JD,Jacob A.PNA microarrays for hybridisation of unlabelled DNAsamples.)
在一种优选的实施方案中,核酸探针为SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的核酸序列。在另一优选的实施方案中,核酸探针为具有以下的序列:
a.SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:5的核苷酸20到1980,更优选SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:5的核苷酸500到1950,进一步更优选SEQ ID NO 1、SEQ IDNO:2、SEQ ID NO:4或SEQ ID NO:5的核苷酸800到1920,最优选SEQID NO 1、SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:5的核苷酸900到1900,或
b.SEQ ID NO:3的核苷酸20到1470,更优选SEQ ID NO:3的核苷酸500到1440,进一步更优选SEQ ID NO:3的核苷酸700到1430,最优选SEQ ID NO:3的核苷酸800到1400,或
c.SEQ ID NO:6的核苷酸20到917,更优选SEQ ID NO:6的核苷酸200到907,进一步更优选SEQ ID NO:6的核苷酸300到897,并最优选SEQ ID NO:6的核苷酸400到887。
另一优选的探针为转录起始位点之前紧挨的DNA序列的部分。
对于至少100个核苷酸长度的长探针而言,非常低到非常高严格度条件被定义为:依照标准Southern印迹程序,在42℃下5倍SSPE、0.3%SDS、200毫克/ml经剪切且变性的鲑精DNA和甲酰胺中预杂交和杂交,所述甲酰胺对于非常低和低严格度而言为25%,对于中和中-高严格度而言为35%或对于高和非常高严格度而言为50%。
对于至少100个核苷酸长度的长探针而言,最后用2倍SSC、0.2%SDS,在至少45℃(非常低严格度),更优选至少50℃(低严格度),更优选至少55℃(中严格度),更优选至少60℃(中-高严格度),进一步更优选至少65℃(高严格度)和最优选至少70℃(非常高严格度)下对载体材料洗涤三次,每次15分钟。
对于约15个核苷酸到约70个核苷酸长度的短探针而言,严格度条件定义为:在比使用Bolton and McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)算法计算的Tm低5℃到10℃下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1倍Denhardfs溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中依照标准Southern印迹程序预杂交、杂交和杂交后洗涤。
对于约15个核苷酸到约70个核苷酸长度的短探针而言,在6倍SCC加上0.1%SDS中15分钟对载体材料洗涤一次,并使用6倍SSC在低于所计算的Tm 5℃到10℃下洗涤两次,每次15分钟。
根据另一优选的实施方案,首先用SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6克隆与其可操作连接的天然基因、编码序列或其部分。这可从SEQ ID NO 1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6或先前定义的其亚序列开始并使用该序列作为探针完成。将所述探针与给定宿主的cDNA或基因组文库杂交,所述宿主为Aspergillus niger或本申请文本中定义的任何其它宿主。一旦天然基因或其部分被克隆,可随后使用其自身作为探针,通过本文所述杂交实验克隆来自其它真菌的它的同源基因。
在本发明上下文中,同源基因是指与天然基因至少50%同源(同一)的基因。优选地,同源基因与天然基因至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选至少80%,更优选约90%,进一步更优选约95%,进一步更优选约97%,进一步更优选约98%,进一步更优选约99%,和最优选约99.5%同源。
同源基因编码序列上游的序列为本发明包含的启动子。或者,与本发明启动子可操作连接的天然基因、编码序列或其部分的序列可通过使用SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6或如前定义的其亚序列,用例如如本文所述的比对或BLAST算法搜索基因组数据库鉴定。随后可使用该经鉴定的序列鉴定本申请中定义的任何其它宿主细胞中的直向同源基因或同源基因。经鉴定的直向同源基因或同源基因编码序列上游的序列为本发明所包括的启动子。
根据另一优选的实施方案,本发明的启动子DNA序列为下述(经分离的)DNA序列,其与SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6至少50%同源(同一)。优选地,所述DNA序列与SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选约80%,更优选约90%,进一步更优选约95%,进一步更优选约97%,进一步更优选约98%,进一步更优选约99%和最优选约99.5%同源。
就本发明目的而言,程度优选通过BLAST程序确定两个核酸序列之间的同源性(同一性)。进行BLAST分析的软件可通过国家生物技术信息中心(National  Center  for  Biotechnology  Information)(htttp://www.ncbi.nlm.nih.gov/)公开获得。BLAST算法参数W、T和X确定比对的敏感性和速度。BLAST程序使用11的字长(W)、50的BLOSUM62评分矩阵(参阅Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)、10的期望值(E)、M=5、N=-4和双链比较作为默认值。
在另一优选的实施方案中,启动子为SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的仍然具有启动子活性的亚序列。亚序列优选含有至少约100个核苷酸,更优选至少约200个核苷酸和最优选至少约300个核苷酸。
在另一优选的实施方案中,亚序列除5’和/或3’端的一个或多个核苷酸缺失外为由SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6所包含的核酸序列,所述DNA序列仍然具有启动子活性。
在另一优选的实施方案中,启动子亚序列为“经修剪的(trimmed)”亚序列(即序列片段),其在翻译起始点和/或转录起始点上游。修剪启动子并对其功能性分析的实例描述于Gene.1994 Aug 5;145(2):179-87:theeffect of multiple copies of the upstream region on expression of the Aspergillusniger glucoamylase-encoding gene.Verdoes JC,Punt PJ,Stouthamer AH,vanden Hondel CA).
在本发明的另一实施方案中,启动子DNA序列为SEQ ID NO 1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的变体。
术语“变体”或“变体启动子”在本文定义为具有下述核苷酸序列的启动子,所述核苷酸序列包含母体启动子的一个或多个核苷酸的取代、缺失和/或插入,其中所述变体启动子具有大于或小于相应母体启动子的启动子活性。术语“变体启动子”应包括天然变体和使用本领域公知方法(例如经典诱变、定向诱变和DNA改组(shuffling))体外产生的变体。变体启动子可具有一个或多个突变。各突变为核苷酸的独立取代、缺失和/或插入。
根据一种优选的实施方案,变体启动子为下述启动子,所述启动子与最初鉴定的启动子序列(SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6)相比具有至少一个经修饰的调节位点。这类调节位点可被整体去除或如上所述特异地突变。修饰这类启动子变体的调节使其例如不再被葡萄糖诱导。这类启动子变体和获得它们的技术的实例描述于EP 673 429或WO 94/04673中。
所述启动子变体可以是等位变体。等位变体是指占据相同染色体位点的基因的任两种或更多可选择的形式。等位变体通过突变天然发生,并可由种群中的多态性引起。可通过以下步骤获得变体启动子:(a)在非常低、低、中、中-高、高或非常高严格度条件下将DNA与(i)SEQ ID NO1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:6,(ii)(i)的亚序列或(iii)(i)、(ii)的互补链杂交,和(b)从所述DNA中分离变体启动子。严格度和洗涤条件如本文定义。
本发明的启动子可以是下述启动子,所述启动子的序列可用接头提供,所述接头用于引入特异限制性位点的目的,所述限制性位点便于连接启动子序列和编码多肽的核酸序列编码区。
本文提供的序列信息不应狭义地解释为要求包括错误鉴定的碱基。本文所公开的序列可容易地用于分离最初的DNA序列,优选从有丝真菌(特别是Aspergillus niger)中分离,并进行进一步的序列分析从而鉴定测序错误。
除非另有说明,所有通过测序本文DNA分子确定的核苷酸序列使用自动DNA测序仪确定。因此,如本领域已知,对于通过该自动途径确定的任何DNA序列而言,本文确定的任何核苷酸序列可含有一些错误。
通过自动化确定的核苷酸序列通常与经测序DNA分子的实际核苷酸序列至少约90%相同,更典型地至少约95%相同到至少约99.9%相同。可通过其它手段更为精确地确定实际序列,包括本领域公知的手工DNA测序方法。
本领域技术人员能够鉴定这类被错误鉴定的碱基,并知道如何改正这类错误。
本发明包含典型地含有下述突变的功能性启动子等效物,所述突变不改变启动子所涉及的生物学功能。术语“功能性等效物”还包括A.nigerDNA序列的直向同源物。A.niger DNA序列的直向同源物为能够从其它生物、其它真菌物种或菌株中分离,并具有类似或相同生物学活性的DNA序列。
本发明的启动子序列可从任何属的微生物中获得。就本发明目的而言,本文与给定来源结合使用术语“得自”是指多肽由该来源产生,或由来自该来源基因的被插入的细胞产生。
启动子序列可得自真菌来源,优选来自酵母菌株,例如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces,或Yarrowia strain,更优选来自Saccharomyces carlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomycesdouglasii、Saccharomyces kluyveri、Saccharomyces norbensis或Saccharomyces oviformis菌株。
在另一优选的实施方案中,启动子序列得自有丝真菌菌株,例如Acremonium,Aspergillus、Aureobasidium、Cryptococcus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma strain,更优选得自Aspergillusaculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillusjaponicus、Aspergillus nidulans、Aspergillus niger、Aspergillus oryzae、Aspergillus sojae、Chrysosporium lucknowense、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicillium purpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma Iongibrachiatum、Trichoderma reesei或Trichoderma viride菌株。
在另一优选的实施方案中,启动子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。
应当理解:对于上述物种而言,本发明包括完美和不完美的情况,和其它分类学等价物(例如无性型),而无论其被已知的物种名如何。本领域技术人员会容易地识别合适等价物的性质。公众可以在大量培养物收集中容易地得到这些物种的菌株,所述培养物收集如美国模式培养物保藏单位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection,Northern Regional Research Center(NRRL)。
此外,可使用上述探针从其它来源中鉴定或获得根据本发明的启动子序列,所述其它来源包括从自然(例如土壤、堆肥、水等)中分离的微生物。用于从天然生境中分离微生物的技术为本领域公知。然后可类似地筛选另一微生物地基因组DNA文库得到核酸序列。一旦用探针检测到了编码启动子的核酸序列,则可通过使用本领域常规技术人员已知地技术分离或克隆该序列(参阅例如Sambrook et al.,1989,上文)。
在本发明中,启动子DNA序列还可以是杂交启动子,其包含一个或多个本发明启动子的部分;本发明启动子的部分和另一已知启动子的部分(如一个启动子的前导序列和来自另一启动子的转录起始位点);或本发明一个或多个启动子的部分和一个或多个其它启动子的部分。其它启动子可以是在所选的宿主细胞中显示转录活性的任何启动子序列,包括变体的、截短的和杂交启动子,并可得自编码与所述宿主细胞同源或异源的细胞外或细胞内多肽的基因。其它启动子序列对于编码多肽的核酸序列来说可以是同源或异源的,并可对细胞来说是同源或异源的。
作为优选的实施方案,经鉴定的启动子的重要调节亚序列可与其它“基本”启动子融合以增强它们的启动子活性(例如描述于Mol Microbiol.1994 May;12(3):479-90.Regulation of the xylanase-encoding xlnA gene ofAspergillus tubigensis.de Graaff LH,van den Broeck HC,van Ooijen AJ,Visser J.)
适用于用本发明启动子构建杂交启动子的其它启动子的其它实例包括得自下述基因的启动子:A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自A.niger中性α-淀粉酶基因的启动子和A.oryzae磷酸丙糖异构酶的杂种)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸盐脱氢酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突变体、截短的启动子和杂交启动子。适用于酵母宿主细胞的其它启动子由Romanos et al.,1992,Yeast 8:423-488描述。
在本发明中,启动子DNA序列还可以是“串联启动子”。“串联启动子”在本文中被定义为两个或更多启动子序列,其各与编码序列可操作连接并介导编码序列到mRNA的转录。
串联启动子包含两个或更多本发明的启动子,或者一个或多个本发明的启动子和一个或多个其它已知启动子,如上举例适用于构建杂交启动子的那些。串联启动子的两个或更多启动子序列可同时启动核酸序列的转录。或者串联启动子的一个或多个启动子序列可在细胞生长的不同阶段或菌丝体形态学上不同的部分启动核酸序列的转录。
在本发明中,启动子对编码生物学化合物的编码序列来说可以是外源的,和/或启动子对宿主细胞来说可以是外源的。本发明的变体、杂交或串联启动子应理解为对编码序列来说是外源的,即使野生型启动子对编码序列或对宿主细胞是天然的。
本发明的变体、杂交或串联启动子的启动子活性为至少具有SEQ IDNO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQID NO:6的启动子的约20%,优选至少约40%,更优选至少约60%,更优选至少约80%,更优选至少约90%,更优选至少约100%,进一步更优选至少约200%,最优选至少约300%,和进一步最优选至少约400。启动子活性优选如说明书中先前所述来确定。
本发明还涉及下述DNA构建体,所述DNA构建体包含一个(“一个”在本文中定义为“至少一个”)如上所述的启动子DNA序列和与所述启动子DNA序列可操作连接的编码序列,从而所述编码序列可以在所述启动子DNA序列的调控下表达。这可在任何合适的宿主细胞中检测。或者,这可在合适的体外表达和/或翻译体系中检测。编码序列可从任何原核的、真核的或其它来源中获得。或者编码序列可以是合成的或部分合成的序列。合成基因的密码子选择已经被最优化来匹配宿主细胞物种的密码子选择,从而促进所编码的生物学物质的表达和/或分泌。优化密码子选择的实例描述于WO 97/11086,其中植物多肽的密码子选择被优化为在丝状真菌细胞中表达。优选地,编码序列编码生物学化合物。
或者编码序列可编码反义RNA和/或RNAi(RNA干扰)构建体的表达。反义RNA表达的实例显示于Appl Environ Microbiol.2000 Feb;66(2):775-82.(Characterization of a foldase,protein disulfide isomerase A,inthe protein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,Van Den Hondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysis of the expression of potato uridinediphosphate-glucosepyrophosphorylase and its inhibition by antisense RNA.Planta.(1993);190(2):247-52.)。基因表达的完全失活适用于灭活例如调控不期望的代谢途径分支的基因,例如从而提高特定次级代谢产物如(β-内酰胺)抗生素或类胡萝卜素的产生。完全失活也适用于减少毒素或不期望的化合物的产生(青霉菌中黄青霉素;曲霉中黄曲霉毒素:MacDonald KD et al,:heterokaryon studies and the genetic control of penicillin and chrysogeninproduction in Penicillium chrysogenum.J Gen Microbiol.(1963)33:375-83)。完全失活还适用于以改进发酵过程和下游加工的方式改变生物的形态。
本发明的另一实施方案涉及对宿主细胞广泛的代谢程序重排或工程改造。引入全新的途径和/或修饰不想要的途径会提供特别适用于产生特定生物学化合物(如蛋白质或代谢物)的细胞。
在本发明的方法中,当编码序列编码多肽时,所述多肽还可包括融合的或杂交的多肽,其中另一多肽与所述多肽或其片段的N-末端或C-末端融合。融合的多肽通过将编码一个多肽的核酸序列(或其部分)与编码另一多肽的核酸序列(或其部分)融合制造。用于制造融合多肽的技术为本领域已知,其包括:连接编码多肽的编码序列,使得其符合读码框并且使得融合多肽的表达位于相同的启动子和终止子调控下。杂交多肽可包含得自至少两个不同多肽的多肽序列的部分或全部的组合,其中一个或多个可以与真菌细胞异源。
除启动子DNA序列外,DNA构建体可包含一个或多个调控序列,所述调控序列指导编码序列在合适宿主细胞中与调控序列一致的条件下表达。表达应理解为包括多肽产生中涉及的任何步骤,其包括但不仅限于转录、转录后修饰、翻译、翻译后修饰和分泌。一个或多个调控序列可以对编码序列或宿主是内源的。或者一个或多个调控序列可以用一个或多个对核酸序列外源的调控序列代替,用于该善编码序列在宿主细胞中的表达。
“DNA构建体”在本文中被定义为单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰而含有以天然不存在的方式组合和并置的核酸片段。当DNA构建体含有编码序列和编码序列表达所需的全部调控序列时,术语“DNA构建体”与术语“表达盒”同义。
术语“调控序列”在本文中被定义为包括编码序列表达必需或有利的所有成分,包括本发明的启动子。各调控序列可以对编码多肽的核酸序列是内源的或外源的。这类调控序列包括但不仅限于前导序列、翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870中所述)、翻译起始子编码序列、多腺苷酸化序列、前肽序列、信号肽序列、上游激活序列、本发明的启动子(包括来自它的变体、片段和杂交和串联启动子)、转录终止子和翻译终止子。调控序列最少包括转录和翻译终止信号和本发明启动子(部分)。调控序列可以与用于引入特异限制性位点目的的接头一起提供,所述限制性位点便于连接调控序列与编码多肽的核酸序列的编码区。
调控序列可以是合适的转录终止子序列,即被宿主细胞识别终止转录的序列。终止子序列与编码多肽的编码序列3’末端可操作连接。任何在所选宿主细胞中有功能的终止子可用于本发明。
用于丝状真菌宿主细胞的优选终止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶基因。
用于酵母宿主细胞的优选终止子得自以下基因:Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae细胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸盐脱氢酶。其它用于酵母宿主细胞的有用终止子由Romanos et al,1992,上文描述。
调控序列还可为合适的前导序列,即mRNA的5’非翻译区,其对宿主细胞翻译是重要的。前导序列与编码多肽的核酸序列5’末端可操作地连接。任何在所选宿主细胞中有功能的前导序列可用于本发明。
用于丝状真菌宿主细胞的优选前导序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖异构酶和A.niger glaA基因。
用于酵母宿主细胞的合适前导序列来自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸酯脱氢酶(ADH2/GAP)基因。
调控序列还可以是聚腺苷酸化序列,所述序列与核酸序列3’末端可操作连接并且经转录后被宿主细胞识别为向经转录的mRNA添加聚腺苷残基的信号。在所选宿主细胞中有作用的任何多腺苷酸化序列可用于本发明。
用于丝状真菌宿主细胞的优选的聚腺苷酸化序列得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusariumoxysporum胰蛋白酶样蛋白酶和A.nidulans α-葡萄糖苷酶。
用于酵母宿主细胞的有用聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽氨基端连接的氨基酸序列并指导被编码的多肽进入细胞的分泌途径。核酸序列编码序列的5’端可固有地含有信号肽编码区,所述信号肽编码区与编码被分泌的多肽的编码区区段按翻译读码框天然连接。或者编码序列的5’端可含有对编码序列是外源的信号肽编码区。当编码序列天然不含有信号肽编码区时,需要外源信号肽编码区。或者外源信号肽编码区可简单地替换内源信号肽编码区,从而增强多肽的分泌。然而,指导所表达的多肽进入所选宿主细胞分泌途径的任何信号肽编码区可用于本发明。
用于丝状真菌宿主细胞的有效信号肽编码区为得自A.oryzae TAKA淀粉酶、A.niger中性淀粉酶、A.ficuum植酸酶、A.niger葡萄糖淀粉酶、A.niger木聚糖内切酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicolainsolens纤维素酶和Humicola lanuginosa脂酶基因的信号肽编码区。
用于酵母宿主细胞的有用信号肽得自Saccharomyces cerevisiae α-因子和Saccharomyces cerevisiae转化酶基因。其它有用的信号肽编码区描述于Romanoset al.,1992,上文。
调控序列还可以是前肽编码区,其编码位于多肽氨基端的氨基酸序列。得到的肽称为原酶或前多肽(或一些情况下为酶原)。前多肽通常是无活性的,并可通过将前肽从前多肽上催化或自身催化切除转化为成熟的活性多肽。前肽编码区可得自Bacillus subtilis碱性蛋白酶(aprE)、Bacillussubtilis中性蛋白酶(nprT)、Saccharomyces cerevisiae α-因子、Rhizomucormiehei天冬氨酸蛋白酶、Myceliophthora thermophila漆酶(WO 95/33836)和A.niger木聚糖内切酶(endol)基因。
当信号肽和前肽区均出现在多肽氨基端时,前肽区处在与多肽的氨基端相邻的位置,而信号肽处在与前肽区氨基端相邻的位置。
还可期望添加调节序列,其允许多肽表达的调节与宿主细胞的生长相关。调节体系的实例为响应化学或物理刺激(包括调节化合物的存在)引起基因的表达被打开或关闭。原核体系中的调节体系包括lac和trp操纵子体系。在酵母中可使用ADH2体系或GAL1体系。在丝状真菌中,可使用如US 5,503,991中所述的TAKA α-淀粉酶启动子、A.niger葡萄糖淀粉酶启动子、A.oryzae葡萄糖淀粉酶启动子、A.tubingensis木聚糖内切酶(x/nA)启动子、A.niger硝酸盐还原酶(niaD)启动子、Trichoderma reesei纤维二糖水解酶启动子和A.nidulans醇和醛脱氢酶(分别为alcA和aldA)作为调节序列。调节序列的其它实例为允许基因扩增的调节序列。在真核体系中,这些调节序列包括二氢叶酸还原酶基因(其在存在甲氨喋呤时被扩增)和金属硫蛋白基因(其在有重金属时被扩增)。在这些情况下,编码多肽的核酸序列应与调节序列可操作地连接。
去除creA结合位点(如早先在EP 673 429中所述的碳分解代谢物阻遏)改变pacC和areA(用于pH和氮调节)是重要的。
优选地,DNA构建体包含本发明的启动子DNA序列、与所述启动子DNA序列可操作连接的编码序列和翻译调控序列,如:
-选自以下序列列表的依照5’到3’方向的翻译终止序列:TAAG、TAGA和TAAA,优选TAAA,和/或
-选自以下序列列表的依照5’到3’方向的翻译起始编码序列:GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,优选GCT TCC TTC,和/或
-选自以下序列列表的翻译起始序列:5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′,其中采用针对核苷酸的不确定编码:m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),优选5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。
在本发明上下文中,术语“翻译起始编码序列”被定义为DNA编码序列开放读码框的起始子或起始密码子紧邻上游的九个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子如GTG。
在本发明上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端翻译终止密码子开始的,并依照5’到3’方向的三个或四个核苷酸。
在本发明上下文中,术语“翻译起始序列”被定义为编码多肽的DNA序列开放读码框起始子或起始密码子紧邻下游的十个核苷酸。起始子或起始密码子编码甲硫氨酸这种氨基酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子,如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。
本发明还涉及包含本发明启动子、编码多肽的编码序列和转录和翻译起始和终止信号的重组表达载体。
上述多种编码和调控序列可以结合在一起,产生下述重组表达载体,所述重组表达载体可包括一个或多个便利的限制性位点,所述限制性位点允许在这类位点处插入或取代启动子和/或编码多肽的编码序列。或者可通过例如Gene.1989 Apr 15;77(1):51-9.Ho SN,Hunt HD,Horton RM,PullenJK,Pease LR″Site-directed mutagenesis by overlap extension using thepolymerase chain reaction″)中所述的使用PCR的序列重叠延伸(SOE-PCR),或通过使用GatewayTM克隆体系(Invitrogen)克隆完成编码序列和启动子的融合。或者可通过将编码序列或包含启动子和/或编码序列的DNA构建体插入适当的表达载体来表达编码序列。创建表达载体时,编码序列以下述方式位于载体中:编码序列与本发明启动子和一个或多个适当的表达调控序列可操作连接。
重组表达载体可以是下述任何载体(例如质粒或病毒),所述载体可便利地进行重组DNA操作并可完成编码序列的表达。对载体的选择典型地会取决于载体与其被引入的宿主细胞间的相容性。载体可以是线性或闭环质粒。
载体可以是自主复制载体(即作为染色体外实体存在时其复制不依赖于染色体复制)例如质粒、染色体外因子、微型染色体或人工染色体。对自主复制而言,载体可以包含允许载体在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞的复制起点实例为2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,和ARS4和CEN6的组合。复制起点可以是具有下述突变的复制起点,所述突变使宿主细胞中复制起点的功能对于温度敏感(参阅例如Ehrlich,1978,Proceedings of the National Academy ofSciences USA 75:1433)。丝状真菌中自主修复克隆载体的实例为包含AMA1序列的克隆载体。AMA1为分离自A.nidulans的6.0-kb基因组DNA频段,其能够在Aspergillus中自主修复(参阅例如Aleksenko andClutterbuck(1997),Fungal Genet.Biol.21:373-397)。
或者载体可以是引入宿主细胞时被整合进基因组,并与其被整合进的染色体一起复制的载体。另外,可以使用包含要引入宿主细胞基因组中全部DNA或转座子的单个载体或质粒或两个或更多的载体或质粒。
本发明的载体优选含有一个或多个可选择标记,所述可选择标记允许容易地选择经转化的细胞。宿主可以用至少两个载体共转化,其中一个包含可选择标记。可选择标记是下述基因,所述基因的产物提抗微生物剂或病毒抗性、对重金属的抗性、针对营养缺陷型的原营养等。用于酵母宿主细胞的合适标记为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择标记包括但不仅限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-51-磷酸盐脱羧酶)、sC(硫酸腺嘌呤基转移酶)、trpC(邻氨基苯甲酸合酶)及其等效物。也可使用提供针对例如腐草霉素、潮霉素B或G418抗性的标记。优选用于Aspergillus细胞的为A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS标记基因优选应用EP 635 574或WO 97/0626中所述技术使用。优选的选择性标记基因为与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(EP635574)。也可使用来自其它丝状真菌的amdS基因(WO 97/06261)。
就整合进宿主细胞基因组而言,载体可依赖于启动子序列和/或编码多肽的编码序列或载体的任何其它元件,用于通过同源重组或非同源重组将载体稳定整合进基因组。或者载体可含有用于指导通过同源重组整合进宿主细胞基因组的额外的核酸序列。所述额外的核酸序列使得载体能够在染色体中预先确定的靶位点整合进宿主细胞基因组。为了提高精确位点整合的可能性,整合元件应优选含有足够数量的核酸,例如30到1,500个碱基对,优选100到1,500个碱基对,更优选400到1,500个碱基对,更优选800到1,500个碱基对并最优选至少2kb,所述核酸与相应的靶序列高度同源,以提高同源重组的可能性。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。另外,整合元件可以是非编码或编码核酸序列。为了促进靶向的整合,克隆载体优选在转化宿主细胞之前线性化。线性化优选以下述方式进行:克隆载体的至少一端(但是优选两端)侧翼为与靶位点同源的序列。
优选地,克隆载体中与靶位点同源的整合元件来自高度表达的基因座,即它们来自能够在真菌宿主细胞中高水平表达的基因。能够有高表达水平的基因(即高表达的基因)在本文中定义为下述基因,所述基因的mRNA可占据总细胞mRNA的至少0.5%(w/w)(例如在经诱导的条件下),或可选地,所述基因的基因产物可占据总细胞蛋白质的至少1%(w/w),或在经分泌的基因产物情况下,所述基因的基因产物可分泌至至少0.1g/l的水平(如EP 357 127 B1中所述)。大量优选的高表达真菌基因以实例的方式给出:淀粉酶、葡萄糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或来自Aspergilli或Trichoderma的纤维二糖水解酶基因。用于这些目的的最优选的高表达基因为葡萄糖淀粉酶基因,优选A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6基因座、SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5或SEQ ID NO:6的A.niger基因座或Trichodermareesei纤维二糖水解酶基因。
另一方面,载体可以通过非同源重组整合进宿主细胞基因组。
可将多于一个拷贝的编码生物学化合物的核酸序列插入宿主细胞中,以促进基因产物的制造。这可通过优选将数拷贝DNA序列整合进其基因组中,更优选通过将DNA序列的整合靶向高表达基因座(优选葡萄糖淀粉酶基因座或SEQ ID NO 1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5或SEQ ID NO:6的基因座)中完成。或者这可通过在核酸序列中包含可扩增的可选择标记基因,使细胞含有经扩增的拷贝的可选择标记基因,并从而可通过例如在存在适当可选择剂时培养细胞用于选择额外拷贝的核酸序列。为了进一步提高要过表达的DNA序列的拷贝数,可使用如WO98/46772中所述的基因转换技术。核酸构建体通过同源重组进入宿主细胞基因组的靶向整合(即在预先确定的靶位点整合)的效率优选通过宿主细胞增强的同源重组能力提高。细胞的这类现象优选涉及如W 02005/095624中所述的缺陷的hdfA或hdfB基因。WO2005/095624公开了获得包含经提高的靶向整合效率的丝状真菌细胞的优选方法。
用于连接上述元件以构建本发明重组表达载体的方法为本领域技术人员公知(参阅例如Sambrook et al.,1989,上文)。
本发明还涉及包含与编码序列可操作连接的本发明启动子DNA序列的重组宿主细胞,所述宿主细胞有利地用于制造生物学化合物。将包含与编码序列可操作连接的本发明启动子的载体引入宿主细胞,使得载体作为染色体整合体或作为前文所述的自主复制染色体外载体存在。术语“宿主细胞”包括亲本细胞的任何后代,所述后代由于复制中发生的突变而与亲本细胞不同。宿主细胞的选择很大程度上取决于编码序列的来源和本发明启动子的来源。技术人员会明白如何选择最合适的宿主细胞。
本发明还涉及重组的宿主细胞,所述宿主细胞包含多于一个本发明的启动子DNA序列,各启动子与一个编码序列可操作连接。这类宿主细胞可有利地用于至少一种生物学化合物的重组产生。或者本发明的重组宿主细胞可包含与本领域已知的启动子组合的一个或多个本发明的启动子。本领域已知的这类启动子包括但不仅限于得自下述基因的启动子:A.tubigensis xlnA、A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸性稳定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自A.niger中性α-淀粉酶和A.oryzae磷酸丙糖异构酶的启动子的杂交物)、Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突变的、截短的和杂交的启动子。用于酵母宿主细胞的其它有用启动子描述于Romanoset al.,1992,Yeast 8:423-488。优选地,载体中存在至少一个启动子和与其相连的编码序列。将载体引入宿主细胞使其作为染色体整合体和/或如前所述的自主复制染色体外载体存在。
本发明的宿主细胞和本发明方法中使用的宿主细胞可以是任何宿主细胞。优选地,本发明的宿主细胞为真菌细胞。本文使用“真菌”包括子囊菌亚门(Ascomycota)、担子菌亚门(Basidiomycota)、Chytridiomycota和接合菌衙门(Zygomycota)(如由Hawksworth et al.,In,Ainsworth andBisby′s Dictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义的)以及Oomycota(如Hawksworth et al.,1995,上文,page 171所述)和所有的mitosporic fungi(Hawksworth et al.,1995,上文)。
在更优选的实施方案中,真菌宿主细胞为酵母细胞。本文使用“酵母”包括产子囊酵母(酵母目)、basidiosporogenous酵母和属于Fungilmperfecti(芽生真菌)的酵母。由于酵母的分类将来可变化,就本发明的目的而言,酵母应如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.SymposiumSeries No.9,1980)中所述定义。
在进一步更优选的实施方案中,酵母宿主细胞为Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia细胞。
在最优选的实施方案中,酵母宿主细胞为Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或Saccharomyces oviformis细胞。在另一最优选的实施方案中,酵母宿主细胞为Kluyveromyces lactis细胞。在另一最优选的实施方案中,酵母宿主细胞为Yarrowia lipolytica细胞。
在另一优选的实施方案中,真菌宿主细胞为丝状真菌细胞。“丝状真菌”包括真菌和Oomycota亚门的所有丝状体(如Hawksworth et al.,1995所定义)。丝状真菌表征为由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复合多糖组成的菌丝体壁。营养生长通过菌丝伸长,并且碳分解代谢专性需氧。相反的,酵母如Saccharomyces cerevisiae的营养生长通过单细胞原植体出芽且碳分解代谢可以是发酵的。
优选地,丝状真菌宿主细胞为Acremonium、Aspergillus、Chrysosporium、Fusarium、Humicola、Mucor、Myceliophthora、Neurospora、Penicillium、Thielavia、Tolypocladium或Trichoderma;更优选Aspergillus、Chrysosporium、Penicillium或Trichoderma属的细胞。
在一个更为优选的实施方案中,丝状真菌宿主细胞为Aspergillusawamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger、A.sojae或A.oryzae细胞。在另一更优选的实施方案中,丝状真菌宿主细胞为Chrysosporium lucknowense、Fusarium bactridioides、Fusariumcerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum、Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatun、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、或Fusarium venenatum细胞。在另一更为优选的实施方案中,丝状真菌宿主细胞为Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Penicillium chrysogenum、Thielavia terrestris、Trichodermaharzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride细胞。在最优选的实施方案中,丝状真菌宿主细胞为选自Aspergillus niger、Aspergillus oryzae、Aspergillussojae、Crysosporium lucknowense、Trichoderma reesei或Penicilliumchrysogenum的种。最优选的Aspergillus niger宿主细胞为CBS513.88或其衍生物。
公众可以在大量培养物收集中容易地得到若干丝状真菌的菌株,所述培养物收藏如美国模式培养物保藏单位(ATCC)、Deutsche Sammlungvon Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau VoorSchimmelcultures(CBS)和Agricultural Research Service Patent CultureCollection,Northern Regional Research Center(NRRL),所述菌株为Aspergillus niger CBS 513.88、Aspergillus oryzae ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892、P.chrysogenum CBS 455.95、Penicillium citrinum ATCC38065、Penicillium chrysogenum P2、Acremonium chrysogenum ATCC 36225或ATCC 48272、Trichoderma reesei ATCC 26921或ATCC 56765或ATCC26921、Aspergillus sojae ATCC 11906、Chrysosporium lucknowenseATCC44006。
宿主细胞可以是野生型丝状真菌宿主细胞或变体、突变体或经遗传修饰的丝状真菌宿主细胞。在本发明优选的实施方案中,宿主细胞为蛋白酶缺陷或蛋白酶负型菌株。这可以是称为“alp”的碱性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公开于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外,根据本发明也考虑WO 01/68864中描述的转录激活子(prtT)产生减少的宿主细胞。另一特别考虑的宿主菌株为Aspergillus oryzaeBECh2,其中出现在亲本菌株IF04177中的三个TAKA淀粉酶基因被灭活。另外,两个蛋白酶(碱性蛋白酶和中性金属蛋白酶11)通过基因破坏被破坏。通过突变破坏了形成代谢产物环并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并来自JaL228(描述于WO 98/12300),所述JaL228也是US 5,766,912中公开为A1560的IF04177的突变体。
任选地,丝状真菌宿主细胞与野生型细胞相比包含提高的解折叠蛋白应答(UPR)以增强目的多肽的生产能力。UPR可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技术提高。更具体地,HAC1和/或IRE1和/或PTC2的蛋白质水平被调节,和/或SEC61蛋白质被设计从而获得具有提高的UPR的宿主细胞。
或者,或与提高的UPR一起,宿主细胞通常被遗传修饰以获得下述表型,所述表型与野生型细胞相比显示更低的蛋白酶表达和/或蛋白酶分泌,从而增强目的多肽的制造能力。这类表型可通过缺失和/或修饰和/或灭活蛋白酶表达的转录调节子获得。这类转录调节子为例如prtT。通过调节prtT降低蛋白酶的表达可通过US2004/0191864A1和EP2005/055145中所述技术进行。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌的表型一起,宿主细胞显示草酸盐缺陷表型,从而增强目的多肽的制造量。草酸盐缺陷表型可通过WO2004/070022A2和WO2000/50576中描述的技术获得。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型一起,宿主细胞显示与野生型细胞相比表型差异的组合,从而提高目的多肽的制造量。这些差异可包括,但不仅限于降低的葡萄糖淀粉酶和/或α-淀粉酶A和/或中性α-淀粉酶B、α-1、6转葡萄糖基酶蛋白酶和草酸水解酶的表达。所述由宿主细胞显示的表型差异可根据US2004/0191864A1中所述技术通过遗传修饰获得。
或者,或与上述表型组合,核酸构建体通过同源重组靶向整合进入宿主细胞基因组(即整合进预先确定的靶位点)的效率优选通过宿主细胞的增强的同源重组能力提高。细胞的这类表型优选涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公开了获得具有提高的靶向整合能力的丝状真菌细胞的优选方法。
真菌细胞可通过下述方法转化,所述方法涉及原生质体形成、原生质体转化和以本身已知的方式再生细胞壁。用于转化Aspergillus宿主细胞的合适方法描述于EP 238 023和Yelton et al.,1984,Proceedings of theNational Academy of Sciences USA 81:1470-1474。使用Agrobacteriumtumefaciens转化Aspergillus和其它丝状真菌宿主细胞的合适方法描述于例如Nat Biotechnol.1998 Sep;16(9):839-42.Erratum in:Nat Biotechnol 1998Nov;16(11):1074.Agrobacterium tumefaciens-mediated transformation offilamentous fungi,de Groot MJ,Bundock P,Hooykaas PJ,Beijersbergen AG.Unilever Research Laboratory Vlaardingen,The Netherlands。用于转化Fusarium种的合适方法描述于Malardier et al.,1989,Gene 78:147-156和WO 96/00787。可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;lto etal.,1983,Journal of Bacteriology 153:163;和Hinnen et al.,1978,Proceedingsof the National Academy of Sciences USA 75:1920中描述的方法转化酵母。
本发明的另一方面提供用于在合适宿主细胞中表达编码序列的方法,包括:
(a)提供DNA构建体,其包含与如上所述编码序列可操作连接的本发明的启动子DNA序列,
(b)用所述DNA构建体转化合适的宿主细胞,和
(c)在有助于表达编码序列的培养条件下培养合适的宿主细胞。
本发明的另一方面提供用于在合适的宿主细胞中制造生物学化合物的方法,包括:
(a)提供DNA构建体,其包含与如上所述编码序列可操作连接的本发明的启动子DNA序列,
(b)用所述DNA构建体转化合适的宿主细胞,和
(c)在有助于表达编码序列的培养条件下培养合适的宿主细胞,和任选地
(d)从培养基中回收生物学化合物。
“生物学化合物”可以是任何生物多聚体或代谢物。生物学化合物可由单个编码序列或组成生物合成或代谢途径的一系列编码序列编码,或可以是单一编码序列的直接产物或一系列编码序列的产物。生物学化合物对宿主细胞可以是同源的或异源的。术语“异源生物学化合物”在本文定义为下述生物学化合物,其与给定宿主细胞或天然生物学化合物不同源,其中进行了结构修饰以改变天然生物学化合物。
术语“生物多聚体”在本文定义为相同、相似或不相似亚单元(单体)的链(或多聚体)。生物多聚体可以是任何生物多聚体。生物多聚体可以是例如,但不仅限于核酸如RNA、多胺、多元醇、多肽(或聚酰胺)或多糖。
根据优选的实施方案,产生的生物学化合物为多肽。根据更优选的实施方案,产生的多肽由DNA构建体中存在的编码序列编码,所述DNA构建体包含与所述编码序列可操作连接的本发明的启动子。多肽可以是具有目的生物学活性的任何多肽。术语“多肽”在本文并非意指特定长度的被编码的产物,并因此包含肽、寡肽和蛋白质。术语“多肽”还包括组合以形成所编码的产物的两个或更多多肽。多肽还包括杂交多肽,其包含得自至少两个不同多肽的部分或全部多肽序列的组合,其中之一或更多可对宿主细胞是异源的。多肽还包括上述多肽和杂交多肽的天然存在的等位和设计的变异。
多肽对给定的宿主细胞可以是天然的或异源的。术语“异源多肽”在本文定义为对给定宿主细胞并非天然的多肽。或者异源多肽为其中进行了修饰以改变天然序列的天然多肽,或其表达在数量上被改变的天然多肽,所述改变是是通过重组DNA技术操作真菌细胞的结果。例如,可通过以下方式重组产生天然多肽,例如将编码多肽的序列置于本发明启动子调控下以增强多肽表达,通过使用信号序列加速目的天然多肽输出细胞外,和提高通常由细胞产生的多肽的编码基因的拷贝数。
多肽可以是胶原或明胶,或其变体或杂种。多肽可以是抗体或其部分、抗原、凝固因子、酶、激素或激素变体、受体或其部分、调节蛋白质、结构蛋白质、受体或转运蛋白、分泌过程涉及的蛋白质、折叠过程涉及的蛋白质、伴侣分子、肽氨基酰转运蛋白、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白质。细胞内蛋白质可以是酶,例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨基肽酶、酰基转移酶、醛缩酶、羟化酶、氨基肽酶、脂酶。多肽可以是细胞外分泌的酶。这类酶可以属于氧化还原酶、转移酶、水解酶、裂合酶、异构酶、连接酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶。酶可以是糖酶,例如纤维素酶如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶或β-葡萄糖苷酶、半纤维素酶或胶质水解酶如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂合酶、果胶酶、内切多聚半乳糖醛酸酶、外多聚半乳糖醛酸酶、鼠李半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖酶、阿拉伯木聚糖水解酶、半乳糖醛酸酶、裂合酶或淀粉酶;水解酶、异构酶或连接酶,磷酸酶如植酸酶,酯酶如脂酶,蛋白水解酶,氧化还原酶如氧化酶、转移酶或异构酶。酶可以是植酸酶。酶可以是氨基肽酶、淀粉酶、糖酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶过氧化氢酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶脱氧核糖核酸酶、脂酶、α-半乳糖苷酶、β-半乳糖苷酶、葡萄糖淀粉酶、α-葡萄糖淀粉酶、β-葡萄糖苷酶、卤素过氧化物酶、蛋白水解酶、转化酶、漆酶、脂酶、甘露糖苷酶、变构水解酶(mutanase)、氧化酶、胶质水解酶、过氧化物酶、磷脂酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶或葡萄糖氧化酶、己糖氧化酶、单加氧酶。
可选地,与本发明启动子可操作连接的编码序列可编码细胞内蛋白质,例如陪伴分子或转录因子。其一实例描述于Appl Microbiol Biotechnol.1998 Oct;50(4):447-54(″Analysis of the role of the gene bipA,encoding themajor endoplasmic reticulum chaperone protein in the secretion of homologousand heterologous proteins in black Aspergilli.Punt PJ,van Gemeren IA,Drint-Kuijvenhoven J,Hessing JG,van Muijlwijk-Harteveld GM,Beijersbergen A,Verrips CT,van den Hondel CA)。如果该编码序列(如陪伴分子或转录因子)已知是蛋白质或代谢物产生的限制因子,则这可用于例如促进宿主细胞作为蛋白质生产者或作为代谢物的效力。
生物学化合物可以是多糖。多糖可以是任何多糖,包括但不仅限于粘多糖(例如肝素和透明质酸)和含氮多糖(例如壳多糖)。在更优选的选择中,多糖为透明质酸。
可选地,生物学化合物可以是代谢物。术语“代谢物”包括初级和次级代谢物;所述代谢物可以是任何代谢物。优选的代谢物为柠檬酸。
根据另一优选的实施方案,产生的生物学化合物为代谢物。根据更优选的实施方案,DNA构建体中存在的编码序列编码涉及代谢物产生的酶,所述DNA构建体包含与所述编码序列可操作连接的本发明的启动子。
可选地,本发明的DNA构建体中可存在若干编码序列。各编码序列可编码涉及引起代谢物产生的代谢或生物合成途径的不同的酶。初级代谢物是细胞初级或一般代谢的产物,其涉及能量代谢、生长和结构。次级代谢物是次级代谢(参阅例如R.B.Herbert,The Biosynthesis of SecondaryMetabolites,Chapman and Hall,New York,1981)的产物。初级代谢物可以是,但不仅限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或维生素。优选的初级代谢物为柠檬酸。
次级代谢物可以是,但不仅限于生物碱、香豆素、黄酮类、聚酮化合物、奎宁、类固醇、肽或萜。次级代谢物可以是抗生素、抗饲育剂、引诱剂、杀菌剂、杀真菌剂、激素、杀虫剂或杀鼠剂。优选的抗生素为头孢菌素和内酰胺。
生物学化合物还可以是可选择标记。可选择标记为提供针对抗微生物剂或病毒的抗性、对重金属抗性、对营养缺陷的原营养等的产物。可选择标记包括,但不仅限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-51-磷酸盐脱羧酶)、sC(硫酸腺嘌呤基转移酶)、trpC(邻氨基苯甲酸合酶)、ble(腐草霉素抗性蛋白)及其等效物。
在本发明的制造方法中,细胞使用本领域已知方法在适于制造生物学化合物的营养培养基中培养,所述生物学化合物可以是,但不仅限于多肽或代谢物。例如可以在实验室或工业发酵罐中,在合适培养基中和允许编码序列被表达和/或生物学化合物被分离的条件下,通过摇瓶培养、小规模或大规模发酵(包括持续的、分批的、分批进料或固态发酵)培养细胞。在含有碳和氮源和无机盐的合适的营养培养基中,使用本领域已知方法进行培养。合适的培养基可来自商业供货商或可通过(例如在美国模式培养物培养所的产品目录中)公开的构成制备。如果生物学化合物分泌进营养培养基,所述生物学化合物可直接从培养基中回收。如果生物学化合物(其可以是,但不仅限于多肽或代谢物)不分泌,那么可从细胞裂解物中回收。
可通过本领域已知方法回收产生的生物学化合物(其可以是,但不仅限于多肽或代谢物)。例如,可通过常规方法从营养培养基中回收多肽或代谢物,所述常规方法包括但不仅限于离心、过滤、抽提、喷雾干燥、蒸发或沉淀。
多肽可通过本领域已知的多种方法纯化,所述方法包括,但不仅限于色谱法(例如离子交换、亲和、疏水、色谱聚焦和尺寸排除)、电泳方法(例如准备的等电位聚焦)、差异的溶解度(例如硫酸铵沉淀)、SDS-PAGE或抽提(参阅例如Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。多肽可使用本领域已知的对于多肽特异的方法检测。这些检测方法可包括特异抗体的使用、酶产物的形成或酶底物的消失。
本发明还涉及用于改变编码多肽的编码序列表达的DNA构建体,所述多肽对于真菌宿主细胞是内源的。该构建体可含有改变内源基因表达所需的最少数量的成分。
在一个实施方案中,核酸构建体优选含有(a)靶序列,(b)本发明的启动子DNA序列,(c)外显子,和(d)剪接供体位点。将所述核酸构建体引入细胞时,构建体通过同源重组在内源基因位点处整合进细胞基因组。靶序列指导元件(a)-(d)进入内源基因的整合,使得(b)-(d)与内源基因可操作连接。
在另一实施方案中,核酸构建体含有(a)靶序列,(b)本发明的启动子DNA序列,(c)外显子,(d)剪接供体位点,(e)内含子,和(f)剪接受体位点,其中靶序列指导元件(a)-(f)的整合,使得(b)-(f)与内源基因可操作连接。然而,所述构建体可含有额外的成分,如可选择标记。可使用的可选择标记先前已描述。
在两个实施方案中,这些成分的引入引起新转录单位的产生,其中内源基因的表达被改变。事实上,新的转录单位是通过靶向构建体引入的序列和内源基因的融合产物。在一个内源基因被改变的实施方案中,该基因被激活。在该实施方案中,使用同源重组置换、破坏或灭活下述调节区,所述调节区通常通过调节序列的插入与亲本细胞的内源基因结合,这引起与相应的亲本细胞中的迹象相比所述基因以更高水平表达。
靶向序列可以在内源基因内部、紧邻该基因、在上游基因内部或在上游并与内源基因有段距离。可使用一个或多个靶向序列。例如环形质粒或DNA片段优选使用单个靶向序列,而线性质粒或DNA片段优选使用两个靶向序列。
构建体还含有内源基因的一个或多个外显子。外显子定义为下述DNA序列,所述DNA序列拷贝为RNA并存在于成熟的mRNA分子中,使得外显子序列与内源基因的编码区是符合读码框的。外显子可任选地包含DNA,所述DNA编码一个或多个氨基酸和/或部分地编码氨基酸。可选地,外显子含有对应于5’非编码区的DNA。当外源外显子编码一个或多个氨基酸和/或氨基酸部分时,核酸构建体以以下方式涉及:转录和剪接时,读码框与内源基因是符合读码框的,从而来自第二个外显子的mRNA部分的合适读码框不被改变。构建体的剪接供体位点指导一个外显子剪接为另一外显子。典型地,第一个外显子位于第二个外显子的5’,与第一个外显子3’侧重合并位于其3’侧翼的剪接供体位点识别位于第二个外显子5’侧翼的第二个外显子侧翼的剪接受体位点。剪接受体位点(如剪接供体位点)是指导一个外显子到另一个外显子剪接的序列。与剪接受体位点一同作用的剪接装置用剪接受体位点来影响内含子的去除。
用于改变给定DNA序列表达的优选策略包括缺失给定DNA序列和/或用经修饰的启动子DNA序列(如本发明的启动子)代替给定DNA序列的内源启动子序列。缺失和置换优选通过EP 0357127中所述基因置换技术进行。基因和/或启动子序列的特异缺失优选如EP 635 574中所述使用amdS基因作为选择性标记进行。通过在如EP 635 574中所述在氟乙酰胺培养基上反选择的手段,得到的菌株不含选择性标记并可用于进一步的基因修饰。
可选地,或与其它提到的技术一起,可使用基于在E.coli中体内重组的技术,如A rapid method for efficient gene replacement in the filamentousfungus A.nidulans(2000)Chaveroche,M-K.,Ghico,J-M.and d′Enfert C;Nucleic acids Research,vol 28,no 22所述。该技术可应用于其它丝状真菌,如A.niger。
本文描述和要求的发明并不受限于本文公开的特定实施方案的范围,因为这些实施方案旨在说明本发明的若干方案。任何等效的实施方案旨在包括在本发明范围内。事实上,除本文显示和描述的以外,本发明的多种修饰对前述说明书领域的技术人员而言是明显的。这类修饰也旨在落入附加的权利要求书范围内。在冲突的情况下,以包括定义的本公开文件为准。
本发明通过以下实施例进一步描述,所述实施例不解释为限制本发明的范围。
实施例
实验信息
菌株
WT 1:该A.niger菌株用作野生型菌株。该菌株以保藏号CBS 513.88保藏于CBS中心。
WT 2:该A.niger菌株为包含编码葡萄糖淀粉酶(glaA)基因缺失的WT1菌株。WT2通过使用如EP 0 635 574所述的″MARKER-GENE FREE″方法构建。该专利广泛地描述了如何在CBS 513.88基因组中缺失glaA的特异DNA序列。该步骤得到了MARKER-GENE FREE ΔglaA重组A.nigerCBS513.88菌株,最终完全不含任何外源DNA序列。
葡萄糖淀粉酶活性测定
如WO 98/46772所述使用p-硝基苯基α-D-吡喃葡萄糖苷(Sigma)确定葡萄糖淀粉酶活性。
实施例1
构建含有与编码序列可操作连接的本发明启动子的DNA构建体
该实施例描述了构建含有与编码序列可操作连接的本发明启动子的表达构建体。此处使用的编码序列或报告构建体为编码A.niger葡萄糖淀粉酶的glaA基因。葡萄糖淀粉酶用作报告酶,其能够测量本发明启动子的活性。
1.1对整合的葡萄糖淀粉酶表达载体(pGBTOPGLA)的描述
将葡萄糖淀粉酶启动子和编码来自A.niger的葡萄糖淀粉酶编码基因glaA克隆进表达载体pGBTOP-8中,所述载体描述于WO99/32617。克隆根据已知原则和常规克隆技术进行,并得到质粒pGBTOPGLA(参阅图1)。事实上,该表达载体包含葡萄糖淀粉酶启动子、编码序列和终止区,侧翼为E.coli载体中3’和3”glaA靶向位点。
1.2构建有多克隆位点的整合的葡萄糖淀粉酶表达载体(pGBTOPGLA-2)
使用识别为SEQ ID NO 7的ATgCggCCgCCTCgAgTTAATTAAggCCAggCCggCCggCgCgCCTCAgCAATgTCgTTC CgA-3′和识别为SEQ ID NO 8的5′-AGCCATTGACTTCTTCCCAG-3′和1ng载体pGBTOPGLA作为模板,产生含有部分glaA编码序列的PCR片段。用XhoI和BglII消化该片段并引入XhoI和BglII消化的载体pGBTOPGLA内,得到载体pGBTOPGLA-2(参阅图2)。通过序列分析确认下述经引入的PCR片段的序列,所述序列包含多克隆位点(MCS)和部分glaA编码序列。
1.3构建带有与葡萄糖淀粉酶编码序列可操作连接的本发明启动子的整合表达载体
测序并分析菌株CBS513.88的基因组DNA。使用如下文表1所列的寡核苷酸及其各自的SEQ ID NO,并使用菌株CBS513.88的基因组DNA作为模板通过PCR扩增将适当的限制性位点附加在本发明启动子上。如SEQ ID NO 1、SEQ ID NO:2或SEQ ID NO:3中所识别的序列包含在1.5和2kb之间的得到的片段的序列,如下文表1所示。用AscI和XhoI消化所有三个得到的片段并引入经AscI和XhoI消化的载体pGBTOPGLA-2中,分别得到载体pGBTOPGLA-6、pGBTOPGLA-8或pGBTOPGLA-11,如下文表(载体名称)中所示。通过序列重叠延伸PCR(SOE-PCR,asdescribed in Gene.1989 Apr 15;77(1):51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using thepolymerase chain reaction″)将本发明的其它启动子与葡萄糖淀粉酶编码序列融合。使用被称为SEQ ID NO:9和SEQ ID NO:13的寡核苷酸,和A.niger WT 1的基因组DNA作为模板,通过PCR扩增本发明的识别为片段A的启动子。另外,在片段A的5’末端附着XhoI限制性位点。使用被称为SEQ ID NO:8和SEQ ID NO:14,和载体pGBTOPGLA作为模板,制造含有部分glaA编码序列的PCR片段,识别为片段B。使用识别为SEQ IDNO:9和SEQ ID NO:8的寡核苷酸和片段A和片段B,通过SOE-PCR将得到的片段A和片段B融合,产生片段C。该片段C含有如SEQ ID NO:4所识别的本发明的启动子,和部分glaA编码序列。用BglII和XhoI消化片段C并引入经BglII和XhoI消化的载体pGBTOPGLA-2内,得到载体pGBTOPGLA-12。得到的本发明启动子序列识别为SEQ ID NO:4,其与葡萄糖淀粉酶编码序列可操作连接。
以类似于上述的方式,使用如下文表1所述引物组合,通过序列重叠延伸PCR将本发明的两个其它启动子与葡萄糖淀粉酶编码序列融合。再用BglII和XhoI消化这些启动子-葡萄糖淀粉酶片段并引入经BglII和XhoI消化的载体pGBTOPGLA-2内,分别得到载体pGBTOPGLA-13或pGBTOPGLA-14。得到的本发明启动子序列可识别为SEQ ID NO 5或6(参阅表1),其与葡萄糖淀粉酶编码序列可操作连接。
图3描述了说明所构建的所有六个pGBTOPGLA载体结构的载体。通过序列分析确认包含本发明启动子的多种经引入的PCR片段的序列。
 Oligo SEQ ID NO:  Oligo SEQ ID NO:   载体名称  SEQ ID NO:
 9  10   pGBtopGLA-6  1
 11  10   pGBtopGLA-8  2
 12  10   pGBtopGLA-11  3
 9/13  8/14   pGBtopGLA-12  4
 9/15  8/16   pGBtopGLA-13  5
  17/13   8/14   pGBtopGLA-14   6
表1:经分离的启动子序列综述。列出启动子序列(SEQ ID NO 1到6)、包含启动子序列的各载体和用于分离启动子序列的各PCR引物(Oligo SEQ ID NO′s)
实施例2用DNA构建体转化的真菌宿主细胞
为了将pGBTOPGLA、pGBTOPGLA-6、pGBTOPGLA-8、pGBTOPGLA-11、pGBTOPGLA-12、pGBTOPGLA-13或pGBTOPGLA-14载体引入WT 2,如WO98/46772和WO99/32617所述进行转化和随后的转化体选择。基本上在用NotI消化后分离所有载体的线性DNA,并与含有amdS选择性标记基因的载体共转化,后者称为pGBAAS-1(如EP 635574中所述构建)。载体均包含两个与A.niger宿主菌株的glaA基因座同源的DNA结构域以指导对WT 2中截短的glaA基因座的寻靶作用。在乙酰胺培养基上选择转化体,并根据标准程序纯化菌落。将孢子涂布于氟-乙酰胺培养基上选择丢失amdS标记的菌株。判断生长的菌落在glaA基因座上的整合和拷贝数。选择有相似的评估拷贝数的PGBTOPGLA、pGBTOPGLA-6、pGBTOPGLA-8、pGBTOPGLA-11、pGBTOPGLA-12pGBTOPGLA-13或pGBTOPGLA-14转化体。优选地,选择具有单拷贝或低拷贝数(1A、1B、1C)的转化体。
另外,选择性标记基因和由本发明启动子调控的目的基因被构建为存在于一个表达载体中。这类载体的实例显示于图4中。
实施例3在真菌宿主细胞中制造由位于本发明启动子调控下的glaA编码 序列编码的葡萄糖淀粉酶多肽
在100ml如EP 635 574所述的培养基中于34℃和170rpm下在培养摇床中使用500ml带挡板摇瓶,用如上所述选择的大量WT 2转化体和WT 1和WT 2菌株进行摇瓶实验。发酵3和4天后取样,如上所述确定葡萄糖淀粉酶活性。将葡萄糖淀粉酶活性标准化为第3天时WT 1的活性。WT 1、WT 2和大量为pGBTOPGLA、pGBTOPGLA-6、pGBTOPGLA-8、pGBTOPGLA-11、pGBTOPGLA-12pGBTOPGLA-13或pGBTOPGLA-14选择的转化体的标准化的活性在图5中显示。
从经测量的葡萄糖淀粉酶报告基因的活性推断:本发明提供用于在真菌细胞中高表达目的基因的强启动子和启动子变体。明显地,可检测出少数“异常值”菌株如pGBTOPGLA-1B或pGBTOPGLA-13-IC,其可能含有多于一个拷贝的经引入的构建体。pGBTOPGLA-6中使用的启动子明显强于葡萄糖淀粉酶启动子(从WT 1和pGBTOPGLA转化体所推断的)和例如pGBTOPGLA-8中包含的启动子。另外,pGBTOPGLA-6中使用的启动子变体例如pGBTOPGLA-13(其具有改变的转录起始子序列5′-CACCGTCAAA-3′)明显显示经进一步改进的性能。类似地,本发明的启动子提供用于在宿主细胞中高表达目的基因的可选择的和额外的启动子。
实施例4构建包含本发明启动子的启动子置换构建体pGBDEL-PGLAA
为了改变给定基因在宿主细胞中的表达水平,本发明的启动子可代替所述给定基因的内源启动子。在该实施例中,本发明的启动子在真菌宿主细胞中代替编码葡萄糖淀粉酶的glaA基因的启动子。实施例4、5和6描述该方法中大量不同的步骤。用于葡萄糖淀粉酶启动子的置换启动子根据已知原则设计并常规克隆操作构建(参阅图6)。事实上,通过在预先确定的基因组靶位点上的同源充足,glaA启动子置换型载体pGBDEL-PGLAA包含将被本发明启动子(在本实验中启动子由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ IDNO:6组成)置换的glaA启动子序列的约1000bp侧翼区域。此处使用的侧翼序列(参阅图6)是glaA启动子的5’上游区域和部分glaA编码序列。另外,置换型载体在同向重复间含有A.nidulans双向amdS选择标记。该实施例中使用的同向重复为glaA编码序列的部分。这些缺失载体的一般设计先前描述于EP635574和WO 98/46772。
实施例5在真菌宿主细胞中用本发明启动子置换glaA启动子
分离经NotI消化的缺失载体pGBDEL-PGLAA的线性DNA并用于转化WT 1(CBS513.88)。该线性DNA可在glaA基因座整合进基因组,从而用含有amdS和本发明启动子的构建体取代glaA启动子区(参阅图7)。在乙酰胺培养基上选择转化体并根据标准操作纯化菌落。生长的菌落通过PCR判断在glaA基因座上的整合。GlaA启动子的缺失可通过扩增下述条带检测,所述条带具有对本发明启动子特异的大小并缺失对glaA启动子特异的条带。将孢子涂布于氟-乙酰胺培养基上选择丢失amdS标记的菌株。使用Southern分析检测葡萄糖淀粉酶启动子的适当缺失和被本发明启动子(如属于SEQ ID NO:1到SEQ ID NO:6的)的置换。菌株dPGLAA被选择为glaA启动子被本发明启动子置换并具有经修复的功能性glaA编码序列的代表性菌株(参阅图7)。
实施例6在真菌宿主细胞内制造由位于经置换的本发明启动子调控下的 glaA编码序列编码的葡萄糖淀粉酶多肽
在100ml如EP 635 574 B1所述的培养基中于34℃和170rpm下在培养摇床中使用500ml带挡板摇瓶,用经选择的dPGLAA菌株(在实施例5中被分离的WT 1的适当pGBDEL-PGLAA转化体)进行摇瓶实验。其它条件和活性测量如实施例3中所描述。在发酵的各天,与从未转化的WT1测量的活性相比,所选的pGBDEL-PGLAA转化体中葡萄糖淀粉酶的活性提高。
实施例7在真菌宿主细胞中添加额外的位于本发明启动子调控下的glaA 基因
为了改变给定基因在宿主细胞中的表达水平,可向内源的给定基因中添加多份额外拷贝的与本发明启动子可操作连接的所述基因。在该实施例中,本发明的启动子(如SEQ ID NO:1到SEQ ID NO:6所包含的和与glaA编码序列可操作连接的)邻近真菌宿主细胞中内源存在的葡萄糖淀粉酶编码glaA基因被引入。实施例7和8描述该方法中的步骤。
分离如图8所示的载体构建体并用于转化WT 1(CBS513.88)。载体构建体具有在glaA编码序列处整合进基因组的能力,从而邻近选择性标记amdS加入位于本发明启动子调控下的另一glaA基因(参阅图8)。在乙酰胺培养基上选择转化体并根据标准步骤纯化菌落。生长的菌落通过PCR判断glaA基因座上的整合。GlaA基因座上的整合通过Southern印迹分析确认。菌株P2GLAA被选择为在glaA基因座上整合了至少一个位于本发明启动子调控下的另一glaA基因的代表性菌株。
实施例8在真菌宿主细胞中制造由位于本发明启动子和内源glaA启动子 调控下的glaA编码序列编码的葡萄糖淀粉酶多肽
在实施例7中构建并分离的所选P2GLAA菌株和菌株WT 1在100ml培养基中如实施例3所述进行摇瓶实验。发酵四和六天后,取样确定培养物上清液中的葡萄糖淀粉酶活性。与发酵后四天或五天对WT 1测量的活性相比,在所选的WT 1的P2GLAA转化体中的葡萄糖淀粉酶活性均提高。所观察到的葡萄糖淀粉酶报告基因提高的活性指出:本发明的启动子提供进一步提高目的基因表达的手段,所述目的基因已经在真菌细胞中强启动子下表达。另外,该结果提示本发明的启动子可与已知启动子组合使用。
 申请人或代理人文件参考编号24109WO   国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>用于在细胞中表达基因的启动子
<130>24109WO
<160>17
<170>PatentIn version 3.1
<210>1
<211>2000
<212>DNA
<213>Aspergillus niger
<400>1
cagggtggcc caggacaacg catcgtttga tacacttccc gccaatatgg acgttgtcca     60
gaagcctgtt cagcatcgat ctgggcgtct cgttctgtaa gcattctcct agttactgat    120
gactttcctc tcttatctgt attccgtgaa agaggagggc cactgtcctc tatatagttt    180
atggatataa aaagtttgag cttcttgcca atatgaaaca gatttcccca cattaagagc    240
tgtttctcta taggtttcca atcaatatta gtgccgtcaa aacgtttgtt cagatcagat    300
tgtccacgtt cgtttacaga tactctgact gtagtatcat ctgatctcac acgttggttg    360
tgacgtattt ttcgacgcat aacattttca gcatcctgtg ttatcttcgc ccagtgtgaa    420
ctgggtgcta cagccaagtc ctgttcagtg tcctttgaca cagttcggtt gttcagagtt    480
accttccact caatagtata atgaatacaa ggctttcctc tatgttgcct cgtagtcctt    540
tcttcgggct cctggaagaa acccagatga ttgggctggg attgatgcaa gggagtataa    600
ggttcatcaa gtacatgttc aggtgatggg caaaatacgg atggcgtacg atctctaccg    660
aagtcaccag gggtgggggc atacgatgga gtttgtatcc acggatcagg tggctgaagc    720
tgagaggcat cgtcatcgta gtaaggacta aacgtcatcc cctcaaggca gtagatgcca    780
ctgagaagcc tagtgttggg atcatcatat gttagcctac accatatggg tgtcccagca    840
agagtgtccg tgagggaaga ggtgcagcta acaaaaccag taaaatgatc aggttcatgg    900
acaatgaact aagacaggta cagtattgta gccctacccg tcttggttaa cctggtaagg    960
tcaaaaagga tcgaaccgtg gctcagtaca aacaaaagga atgttaacag tttgcgggag   1020
atgcaaggca catgctttgt catgtttgac gcgtttgcag tgtagaagct tccagctacc   1080
gtagattact gatacaaact caatacacta tttctataac cttactgttc aatacagtac   1140
gatcaaaatt tccggaatat taatgttacg gttaccttcc atatgtagac tagcgcactt   1200
ggcattaggg ttcgaaatac gatcaaagag tattgggggg ggtgacagca gtaatgactc   1260
caactgtaaa tcggcttcta ggcgcgctcc atctaaatgt tctggctgtg gtgtacaggg   1320
gcataaaatt acgcactacc cgaatcgata gaactactca tttttatata gaagtcagaa   1380
ttcatggtgt tttgatcatt ttaaattttt atatggcggg tggtgggcaa ctcgcttgcg   1440
cgggcaactc gcttaccgat tacgttaggg ctgatattta cgtaaaaatc gtcaagggat   1500
gcaagaccaa agtactaaaa ccccggagtc aacagcatcc aagcccaagt ccttcacgga   1560
gaaaccccag cgtccacatc acgagcgaag gaccacctct aggcatcgga cgcaccatcc   1620
aattagaagc agcaaagcga aacagcccaa gaaaaaggtc ggcccgtcgg ccttttctgc   1680
aacgctgatc acgggcagcg atccaaccaa caccctccag agtgactagg ggcggaaatt   1740
tatcgggatt aatttccact caaccacaaa tcacagtcgt ccccggtatt gtcctgcaga   1800
atgcaattta aactcttctg cgaatcgctt ggattccccg cccctggccg tagagcttaa   1860
agtatgtccc ttgtcgatgc gatgtatcac aacatataaa tactagcaag ggatgccatg    1920
cttggaggat agcaaccgac aacatcacat caagctctcc cttctctgaa caataaaccc    1980
cacagaaggc atttatgatg                                                2000
<210>2
<211>2000
<212>DNA
<213>Aspergillus niger
<400>2
tggggtcgaa gtaggctgtg tcgagcatcc gttgctccaa tcgtttcaca ttctcaaatg      60
ccaagtcttg gcgccaagtc cattttccgt cttgctttgt ggcgtcgtaa agcggggtcg     120
cgtggtgggc caacatcggt atgtaatcac ggaaaaagtt aaccacgccc aaaaacttcc     180
gaagttctgt cttattcctc ggtttcggcc agttgcgtat cgttccatcg gagataaccg     240
ggctgcatct gttgtaactg tatcgatggc cgcaataaac aacttctcgt acttttcgct     300
ggcatttcct ttctttcaaa gccaagccgt tctgcctcag gcgtgtctca atgccttgac     360
aaatcctgtc atgttcctgt tcgttgtcgg agaaaaccaa aatatcgtcc aagtgtatcg     420
taacattgtt accaagaaat tcccacagta cattttcgat gtaaatctgc cactctgctg     480
gggccgtgcc gattccgaat ggtaataccg tgtactggta tgttcccatg tgacatctaa     540
acgtcgtcaa aggtctgtct tctttccgta ttgtcatctt gtaatacgct tcctcaatgt     600
cgtatttcga aaagaaacgg gctttcttta tccaatccct gtggtaagat tgatcgtcag     660
gagattatct gcaggaaaca tcatggtggg gtaaccaagg ttgtgtctgt ataatatata     720
catgtaagat acatgagctt cggtgatata atacagaagt accatacagt accgcgttat     780
gaaaacacat taatccggat cctttcctat aatagactag cgtgcttggc attagggttc     840
gaaaaacaat cgaagagtat aaggggatga cagcagtaac gactccaact gtacgcctcc     900
gggtagtaga ccgagcagcc gagccagctc agcgcctaaa acgccttata caattaagca     960
gttaaagaag ttagaatcta cgcttaaaaa gctacttaaa aatcgatctc gcagtcccga    1020
ttcgcctatc aaaaccagtt taaatcaact gattaaaggt gccgaacgag ctataaatga    1080
tataacaata ttaaagcatt aattagagca atatcaggcc gcgcacgaaa ggcaacttaa    1140
aaagcgaaag cgctctacta aacagattac ttttgaaaaa ggcacatcag tatttaaagc    1200
ccgaatcctt attaagcgcc gaaatcaggc agataaagcc atacaggcag atagacctct    1260
acctattaaa tcggcttcta ggcgcgctcc atctaaatgt tctggctgtg gtgtacaggg    1320
gcataaaatt acgcactacc cgaatcgata gaactactca tttttatata gaagtcagaa    1380
ttcatggtgt tttgatcatt ttaaattttt atatggcggg tggtgggcaa ctcgcttgcg    1440
cgggcaactc gcttaccgat tacgttaggg ctgatattta cgtaaaaatc gtcaagggat    1500
gcaagaccaa agtagtaaaa ccccggagtc aacagcatcc aagcccaagt ccttcacgga    1560
gaaaccccag cgtccacatc acgagcgaag gaccacctct aggcatcgga cgcaccatcc    1620
aattagaagc agcaaagcga aacagcccaa gaaaaaggtc ggcccgtcgg ccttttctgc    1680
aacgctgatc acgggcagcg atccaaccaa caccctccag agtgactagg ggcggaaatt    1740
taaagggatt aatttccact caaccacaaa tcacagtcgt ccccggtatt gtcctgcaga    1800
atgcaattta aactcttctg cgaatcgctt ggattccccg cccctggccg tagagcttaa    1860
agtatgtccc ttgtcgatgc gatgtatcac aacatataaa tactagcaag ggatgccatg    1920
cttggaggat agcaaccgac aacatcacat caagctctcc cttctctgaa caataaaccc    1980
cacagaaggc atttatgatg                                                2000
<210>3
<211>1490
<212>DNA
<213>Aspergillus niger
<400>3
gaggttgcct cgtagtcctt tcttcgggct cctggaagaa acccagatga ttgggctggg      60
attgatgcaa gggagtataa ggttcatcaa gtacatgttc aggtgatggg caaaatacgg     120
atggcgtacg atctctaccg aagtcaccag gggtgggggc atacgatgga gtttgtatcc     180
acggatcagg tggctgaagc tgagaggcat cgtcatcgta gtaaggacta aacgtcatcc     240
cctcaaggca gtagatgcca ctgagaagcc tagtgttggg atcatcatat gttagcctac     300
accatatggg tgtcccagca agagtgtccg tgagggaaga ggtgcagcta acaaaaccag     360
taaaatgatc aggttcatgg acaatgaact aagacaggta cagtattgta gccctacccg     420
tcttggttaa cctggtaagg tcaaaaagga tcgaaccgtg gctcagtaca aacaaaagga     480
atgttaacag tttgcgggag atgcaaggca catgctttgt catgtttgac gcgtttgcag     540
tgtagaagct tccagctacc gtagattact gatacaaact caatacacta tttctataac     600
cttactgttc aatacagtac gatcaaaatt tccggaatat taatgttacg gttaccttcc     660
atatgtagac tagcgcactt ggcattaggg ttcgaaatac gatcaaagag tattgggggg     720
ggtgacagca gtaatgactc caactgtaaa tcggcttcta ggcgcgctcc atctaaatgt     780
tctggctgtg gtgtacaggg gcataaaatt acgcactacc cgaatcgata gaactactca     840
tttttatata gaagtcagaa ttcatggtgt tttgatcatt ttaaattttt atatggcggg     900
tggtgggcaa ctcgcttgcg cgggcaactc gcttaccgat tacgttaggg ctgatattta     960
cgtaaaaatc gtcaagggat gcaagaccaa agtactaaaa ccccggagtc aacagcatcc    1020
aagcccaagt ccttcacgga gaaaccccag cgtccacatc acgagcgaag gaccacctct    1080
aggcatcgga cgcaccatcc aattagaagc agcaaagcga aacagcccaa gaaaaaggtc    1140
ggcccgtcgg ccttttctgc aacgctgatc acgggcagcg atccaaccaa caccctccag    1200
agtgactagg ggcggaaatt tatcgggatt aatttccact caaccacaaa tcacagtcgt    1260
ccccggtatt gtcctgcaga atgcaattta aactcttctg cgaatcgctt ggattccccg    1320
cccctggccg tagagcttaa agtatgtccc ttgtcgatgc gatgtatcac aacatataaa    1380
tactagcaag ggatgccatg cttggaggat agcaaccgac aacatcacat caagctctcc    1440
cttctctgaa caataaaccc cacagaaggc attggcgcgc ctcagcaatg               1490
<210>4
<211>1997
<212>DNA
<213>Aspergillus niger
<400>4
cagggtggcc caggacaacg catcgtttga tacacttccc gccaatatgg acgttgtcca      60
gaagcctgtt cagcatcgat ctgggcgtct cgttctgtaa gcattctcct agttactgat     120
gactttcctc tcttatctgt attccgtgaa agaggagggc cactgtcctc tatatagttt     180
atggatataa aaagtttgag cttcttgcca atatgaaaca gatttcccca cattaagagc     240
tgtttctcta taggtttcca atcaatatta gtgccgtcaa aacgtttgtt cagatcagat     300
tgtccacgtt cgtttacaga tactctgact gtagtatcat ctgatctcac acgttggttg     360
tgacgtattt ttcgacgcat aacattttca gcatcctgtg ttatcttcgc ccagtgtgaa     420
ctgggtgcta cagccaagtc ctgttcagtg tcctttgaca cagttcggtt gttcagagtt     480
accttccact caatagtata atgaatacaa ggctttcctc tatgttgcct cgtagtcctt     540
tcttcgggct cctggaagaa acccagatga ttgggctggg attgatgcaa gggagtataa     600
ggttcatcaa gtacatgttc aggtgatggg caaaatacgg atggcgtacg atctctaccg     660
aagtcaccag gggtgggggc atacgatgga gtttgtatcc acggatcagg tggctgaagc     720
tgagaggcat cgtcatcgta gtaaggacta aacgtcatcc cctcaaggca gtagatgcca     780
ctgagaagcc tagtgttggg atcatcatat gttagcctac accatatggg tgtcccagca     840
agagtgtccg tgagggaaga ggtgcagcta acaaaaccag taaaatgatc aggttcatgg     900
acaatgaact aagacaggta cagtattgta gccctacccg tcttggttaa cctggtaagg     960
tcaaaaagga tcgaaccgtg gctcagtaca aacaaaagga atgttaacag tttgcgggag    1020
atgcaaggca catgctttgt catgtttgac gcgtttgcag tgtagaagct tccagctacc    1080
gtagattact gatacaaact caatacacta tttctataac cttactgttc aatacagtac    1140
gatcaaaatt tccggaatat taatgttacg gttaccttcc atatgtagac tagcgcactt    1200
ggcattaggg ttcgaaatac gatcaaagag tattgggggg ggtgacagca gtaatgactc    1260
caactgtaaa tcggcttcta ggcgcgctcc atctaaatgt tctggctgtg gtgtacaggg    1320
gcataaaatt acgcactacc cgaatcgata gaactactca tttttatata gaagtcagaa    1380
ttcatggtgt tttgatcatt ttaaattttt atatggcggg tggtgggcaa ctcgcttgcg    1440
cgggcaactc gcttaccgat tacgttaggg ctgatattta cgtaaaaatc gtcaagggat    1500
gcaagaccaa agtactaaaa ccccggagtc aacagcatcc aagcccaagt ccttcacgga    1560
gaaaccccag cgtccacatc acgagcgaag gaccacctct aggcatcgga cgcaccatcc    1620
aattagaagc agcaaagcga aacagcccaa gaaaaaggtc ggcccgtcgg ccttttctgc    1680
aacgctgatc acgggcagcg atccaaccaa caccctccag agtgactagg ggcggaaatt    1740
tatcgggatt aatttccact caaccacaaa tcacagtcgt ccccggtatt gtcctgcaga    1800
atgcaattta aactcttctg cgaatcgctt ggattccccg cccctggccg tagagcttaa    1860
agtatgtccc ttgtcgatgc gatgtatcac aacatataaa tactagcaag ggatgccatg    1920
cttggaggat agcaaccgac aacatcacat caagctctcc cttctctgaa caataaaccc    1980
cacagaaggc atttatg                                                   1997
<210>5
<211>1997
<212>DNA
<213>Aspergillus niger
<400>5
cagggtggcc caggacaacg catcgtttga tacacttccc gccaatatgg acgttgtcca      60
gaagcctgtt cagcatcgat ctgggcgtct cgttctgtaa gcattctcct agttactgat     120
gactttcctc tcttatctgt attccgtgaa agaggagggc cactgtcctc tatatagttt     180
atggatataa aaagtttgag cttcttgcca atatgaaaca gatttcccca cattaagagc     240
tgtttctcta taggtttcca atcaatatta gtgccgtcaa aacgtttgtt cagatcagat     300
tgtccacgtt cgtttacaga tactctgact gtagtatcat ctgatctcac acgttggttg     360
tgacgtattt ttcgacgcat aacattttca gcatcctgtg ttatcttcgc ccagtgtgaa     420
ctgggtgcta cagccaagtc ctgttcagtg tcctttgaca cagttcggtt gttcagagtt     480
accttccact caatagtata atgaatacaa ggctttcctc tatgttgcct cgtagtcctt     540
tcttcgggct cctggaagaa acccagatga ttgggctggg attgatgcaa gggagtataa     600
ggttcatcaa gtacatgttc aggtgatggg caaaatacgg atggcgtacg atctctaccg     660
aagtcaccag gggtgggggc atacgatgga gtttgtatcc acggatcagg tggctgaagc     720
tgagaggcat cgtcatcgta gtaaggacta aacgtcatcc cctcaaggca gtagatgcca     780
ctgagaagcc tagtgttggg atcatcatat gttagcctac accatatggg tgtcccagca     840
agagtgtccg tgagggaaga ggtgcagcta acaaaaccag taaaatgatc aggttcatgg     900
acaatgaact aagacaggta cagtattgta gccctacccg tcttggttaa cctggtaagg     960
tcaaaaagga tcgaaccgtg gctcagtaca aacaaaagga atgttaacag tttgcgggag    1020
atgcaaggca catgctttgt catgtttgac gcgtttgcag tgtagaagct tccagctacc    1080
gtagattact gatacaaact caatacacta tttctataac cttactgttc aatacagtac    1140
gatcaaaatt tccggaatat taatgttacg gttaccttcc atatgtagac tagcgcactt    1200
ggcattaggg ttcgaaatac gatcaaagag tattgggggg ggtgacagca gtaatgactc    1260
caactgtaaa tcggcttcta ggcgcgctcc atctaaatgt tctggctgtg gtgtacaggg    1320
gcataaaatt acgcactacc cgaatcgata gaactactca tttttatata gaagtcagaa    1380
ttcatggtgt tttgatcatt ttaaattttt atatggcggg tggtgggcaa ctcgcttgcg    1440
cgggcaactc gcttaccgat tacgttaggg ctgatattta cgtaaaaatc gtcaagggat    1500
gcaagaccaa agtactaaaa ccccggagtc aacagcatcc aagcccaagt ccttcacgga    1560
gaaaccccag cgtccacatc acgagcgaag gaccacctct aggcatcgga cgcaccatcc    1620
aattagaagc agcaaagcga aacagcccaa gaaaaaggtc ggcccgtcgg ccttttctgc    1680
aacgctgatc acgggcagcg atccaaccaa caccctccag agtgactagg ggcggaaatt    1740
tatcgggatt aatttccact caaccacaaa tcacagtcgt ccccggtatt gtcctgcaga    1800
atgcaattta aactcttctg cgaatcgctt ggattccccg cccctggccg tagagcttaa    1860
agtatgtccc ttgtcgatgc gatgtatcac aacatataaa tactagcaag ggatgccatg    1920
cttggaggat agcaaccgac aacatcacat caagctctcc cttctctgaa caataaaccc    1980
cacacaccgt caaaatg                                                   1997
<210>6
<211>937
<212>DNA
<213>Aspergillus niger
<400>6
tcgagaagct tccagctacc gtagattact gatacaaact caatacacta tttctataac     60
cttactgttc aatacagtac gatcaaaatt tccggaatat taatgttacg gttaccttcc    120
atatgtagac tagcgcactt ggcattaggg ttcgaaatac gatcaaagag tattgggggg    180
ggtgacagca gtaatgactc caactgtaaa tcggcttcta ggcgcgctcc atctaaatgt    240
tctggctgtg gtgtacaggg gcataaaatt acgcactacc cgaatcgata gaactactca    300
tttttatata gaagtcagaa ttcatggtgt tttgatcatt ttaaattttt atatggcggg    360
tggtgggcaa ctcgcttgcg cgggcaactc gcttaccgat tacgttaggg ctgatattta    420
cgtaaaaatc gtcaagggat gcaagaccaa agtactaaaa ccccggagtc aacagcatcc    480
aagcccaagt ccttcacgga gaaaccccag cgtccacatc acgagcgaag gaccacctct    540
aggcatcgga cgcaccatcc aattagaagc agcaaagcga aacagcccaa gaaaaaggtc    600
ggcccgtcgg ccttttctgc aacgctgatc acgggcagcg atccaaccaa caccctccag    660
agtgactagg ggcggaaatt tatcgggatt aatttccact caaccacaaa tcacagtcgt    720
ccccggtatt gtcctgcaga atgcaattta aactcttctg cgaatcgctt ggattccccg    780
cccctggccg tagagcttaa agtatgtccc ttgtcgatgc gatgtatcac aacatataaa    840
tactagcaag ggatgccatg cttggaggat agcaaccgac aacatcacat caagctctcc    900
cttctctgaa caataaaccc cacagaaggc atttatg                             937
<210>7
<211>63
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>7
atgcggccgc ctcgagttaa ttaaggccag gccggccggc gcgcctcagc aatgtcgttc     60
cga                                                                   63
<210>8
<211>20
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>8
agccattgac ttcttcccag
<210>9
<211>28
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>9
atctcgaggg acaacgcatc gtttgata                                       28
<210>10
<211>30
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>10
atggcgcgcc aatgccttct gtggggttta                                     30
<210>11
<211>28
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>11
atctcgaggg gtcgaagtag gctgtgtc                                       28
<210>12
<211>30
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>12
cctcgaggtt gcctcgtagt cctttcttcg                                     30
<210>13
<211>33
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>13
cgacataaat gccttctgtg gggtttattg ttc                                 33
<210>14
<211>42
<212>DNA
<<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>14
aataaacccc acagaaggca tttatgtcgt tccgatctct  ac                      42
<210>15
<211>42
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>15
cgacattttg acggtgtgtg gggtttattg ttcagagaag gg                       42
<210>16
<211>42
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>16
aataaacccc acacaccgtc aaaatgtcgt tccgatctct ac                       42
<210>17
<211>28
<212>DNA
<213>人工序列
<220>
<223>设计的用作为PCR引物以在聚合酶链式反应中产生DNA片段
     寡核苷酸
<400>17
ctcgagaagc ttccagctac cgtagattac tg                                  32

Claims (11)

1. 启动子DNA序列,如:
(a)出现在以下列表中的DNA序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6;
(b)能够与(a)的DNA序列杂交的DNA序列;
(c)与(a)的DNA序列至少50%同源的DNA序列;
(d)(a)到(c)的任何DNA序列的变体;或
(e)(a)到(d)的任何DNA序列的亚序列。
2. DNA构建体,所述DNA构建体包含根据权利要求1的启动子DNA序列和与所述启动子DNA序列可操作连接的编码序列,使得所述编码序列可以在所述启动子DNA序列的调控下表达。
3. 包含根据权利要求2的DNA构建体的宿主细胞,优选真菌宿主细胞。
4. 根据权利要求所述3的宿主细胞,其中所述宿主细胞来自Aspergillus、Penicillium、Chrysosporium或Trichoderma属。
5. 根据权利要求4所述的宿主细胞,其中宿主细胞为Aspergillusniger、Aspergillus sojae、Aspergillus oryzae、Chrysosporium lucknowense、Trichoderma reesei或Penicillium chrysogenum种。
6. 用于在合适的宿主细胞中表达编码序列的方法,包括:
(a)提供根据权利要求2的DNA构建体,
(b)用所述DNA构建体转化合适的宿主细胞,和
(c)在有利于表达编码序列的培养条件下培养所述合适的宿主细胞。
7. 用于在合适的宿主细胞中制造生物学化合物的方法,包括:
(a)提供如权利要求2中所定义的DNA构建体,
(b)用所述DNA构建体转化合适的宿主细胞,和
(c)在有利于编码序列表达的培养条件下培养合适的宿主细胞,和任选地
(d)从培养基中回收所述生物学化合物。
8. 根据权利要求7的方法,其中所述生物学化合物为多肽。
9. 根据权利要求8的方法,其中产生的所述多肽通过权利要求2所定义的DNA构建体中的所述编码序列编码。
10. 根据权利要求7的方法,其中产生的所述生物学化合物为代谢物。
11. 根据权利要求10的方法,其中权利要求2中定义的DNA构建体中存在的编码序列编码涉及所述代谢物的产生的酶。
CNA2006800070050A 2005-03-01 2006-02-28 用于在真菌细胞中表达基因的曲霉启动子 Pending CN101248181A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP05101536.0 2005-03-01
EP05101546.9 2005-03-01
EP05101546 2005-03-01
EP05109102.3 2005-09-30
EP05109105.6 2005-09-30
EP05109100.7 2005-09-30
EP05109097.5 2005-09-30

Publications (1)

Publication Number Publication Date
CN101248181A true CN101248181A (zh) 2008-08-20

Family

ID=39947907

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800070050A Pending CN101248181A (zh) 2005-03-01 2006-02-28 用于在真菌细胞中表达基因的曲霉启动子

Country Status (1)

Country Link
CN (1) CN101248181A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111699252A (zh) * 2019-01-16 2020-09-22 福尼亚生物处理股份有限公司 内切葡聚糖酶组合物和方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111699252A (zh) * 2019-01-16 2020-09-22 福尼亚生物处理股份有限公司 内切葡聚糖酶组合物和方法

Similar Documents

Publication Publication Date Title
CN1942586B (zh) 用于在真菌细胞中表达基因的真菌启动子
US20080227148A1 (en) Aspergillus Promotors for Expressing a Gene in a Fungal Cell
CN101094919B (zh) 在生产多肽的方法中有用的真菌转录活化因子
CN102597241B (zh) 用于生产感兴趣的化合物的经改进的宿主细胞
AU2008214663B2 (en) A recombinant host cell for the production of a compound of interest
CN105671027A (zh) 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
CN105189730A (zh) 淀粉酶缺陷菌株
CN103596970A (zh) 载体-宿主系统
CN104508114A (zh) 用于在细胞中表达基因的启动子
US8633010B2 (en) Fungal PepC inhibitor
US20120196324A1 (en) Method for Producing an Antifungal Peptide in a Filamentous Fungal Host Cell
US8088598B2 (en) Fungal transcriptional activator useful in methods for producing polypeptides
CN101248181A (zh) 用于在真菌细胞中表达基因的曲霉启动子
US11667922B2 (en) Fungal chaperone proteins
CN103339259A (zh) 用于在真菌细胞中表达基因的启动子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080820