丝状真菌宿主领域的转化系统
发明摘述
本发明涉及一种用于表达和分泌异源蛋白或多肽的丝状真菌宿主领域的新的转化系统。本发明也包括以一种非常经济的方式大量制备多肽或蛋白的方法。本发明的系统包括金孢子菌属,特别是Chrysosporium lucknowense的转化的或转染的真菌菌株和其突变体或衍生物。本发明也包括含有金孢子菌属真菌编码序列的转化体。还公开了新的突变金孢子菌属菌株以及由其衍生的新的酶。
本发明背景
现有技术已经公开了许多用于基因表达的宿主和转化方法。经常提到细菌如大肠杆菌。但是大肠杆菌不能分泌许多种蛋白质或多肽,因此要在工业水平上生产蛋白质和多肽它是一种的不合需要的宿主细胞。大肠杆菌的另外一个同样适用于普通细菌的缺点是原核生物不能提供对于众多所生成的真核蛋白质或多肽活性形式所必需的另外的修饰。确保产生活性形式的蛋白或多肽必需的加工有如蛋白质的糖基化和蛋白质的正确折叠。为确保这样的加工人们有时也可以使用哺乳动物细胞;但是,这些细胞的不利之处在于细胞很难维持并且培养基非常昂贵。因此要在工业水平上生产蛋白质或多肽这样的转化系统是不合实际的。它们可被有效用于生产需求量相对较低但价格昂贵的药物化合物,但当然不能用于工业上生产酶。
已经发展了许多真菌表达系统,如黑曲霉、泡盛曲霉、构巢曲霉、T.reesei等。此外也提出了一些其它的真菌表达系统,但由于各种不同的原因未被广泛接受或使用。一般而言,理想的宿主必须符合以下标准的大部分:
—理想的宿主必须易于发酵并且使用价格低廉的培养基。
—理想的宿主必须有效使用培养基。
—理想的宿主必须高产量地生产蛋白质或多肽,即必须表现出高的蛋白质/生物量比。
—理想的宿主应该能够有效分泌蛋白质或多肽。
—理想的宿主必须保证所需要的蛋白质或多肽易于分离和纯化。
—理想的宿主必须对所需要的蛋白质或多肽进行加工,以使它们以不需要另外活化或修饰步骤的活性形式被生产出来。
—理想的宿主应该易于被转化。
—理想的宿主应该使用广泛范围的表达调控因子从而确保易于运用和多功能性。
—理想的宿主应该使用易于选择并且用起来很便宜的标记。
—理想的宿主应该产生稳定的转化体。
—理想的宿主应该允许在对所表达出的蛋白质或多肽无害的条件下培养,如低粘性、低剪切等。
Berka等人在美国专利5578463中提出的但至今仍未被广泛使用的真菌系统有链孢霉属、柄孢壳属、内座壳属、毛霉菌属、旋孢腔菌属和梨孢霉属以及曲霉属和木霉属。但是只有曲霉属和木霉属提供了转化和表达的例证,其它一些被提出的宿主未提供任何详细资料。
WO 96/02563以及Novo Nordisk的美国专利5602004、5604129和5695985叙述了曲霉属和木霉属真菌系统的缺陷,并且提出其它真菌的培养条件或许会更适于大规模生产蛋白质。任何一种转化的培养唯一的例子是嗜热毁丝霉、阿拉巴门支顶孢、土生梭孢霉和cellulophilum侧孢霉。据报道侧孢霉属菌株在对其它菌株不造成同样结果的发酵条件下裂解并且产生绿色素。也描述了土生梭孢霉的一种由于形态学而被选择的不形成孢子的突变体。但是也表明梭孢霉属和支顶孢属(由此所使用的支顶孢属菌株是所使用的梭孢霉属菌株的未完成体)的原生质体效率很低并且潮霉素不是一种有用的选择标记。许多其它真菌也凭借其形态而被认为是潜在有用的但未叙述它们的转化情况。这些真菌菌株是Corynascus、嗜热子囊菌属、毛壳属、节霉属、柱顶孢霉和Talaromyces。转化的宿主因为所引入的Humicola木聚糖酶产量很低而被提及,梭孢霉属的产量最低;但是,这些信息不很明确并且实际上能够推断梭孢霉属是最佳的实施方案。对这些参考菌株的命名是基于1994年ATCC对工业真菌命名的基础之上的。因而很明显未能获得高程度的异源表达并且实际上在假定的形态学和表达程度之间不存在正相关。根据1996年的ATCC真菌分类,嗜热侧孢霉ATCC 20493是一种嗜热毁丝霉菌株。现在这个菌株仍然被鉴定为嗜热毁丝霉。从这些最近的说明中可以看出本技术领域的不可预知性是明显的。
通过使用醋酸锂方法和Humicola酶编码序列,Allison等人(现代遗传学21:225-229,1992)也叙述了对Humicola grisea突变体thermoidae的转化,但未提供这一菌株表达异源蛋白的报道。
1997年,夏威夷生物技术研究小组被授予了一项用转化的链孢霉属真菌表达哺乳动物肽如凝乳酶的专利。营养缺陷的粗糙脉孢霉的转化是和原生质体一起发生的。引入内源性的转录调控区并实施共转化。并未提供其它宿主和其它转化方案。关于表达水平此说明并不明确。由于免疫学技术(用于检测少量蛋白质)是所使用的证明蛋白质存在的唯一技术,表达水平是否高是难以预料的。并未透漏是否在事实上分离出了此种蛋白质。
Novo Nordisk的专利WO 97/26330提出了一种获得用于生产异源多肽的具有改进特征的丝状真菌亲本细胞突变体的方法。此方法包含首先发现一个特定的形态学改变,然后评价转化体是否比亲本菌株生产出更多的异源多肽。仅就链孢属A3/5菌株和米曲霉举例说明了此方法。此方法可适用于曲霉、木霉、梭孢霉、镰孢霉、链孢霉、支顶孢属、Tolyplocadium、Humicola、柱顶孢属、毁丝霉属或毛霉属的真菌。如上所述,由于本技术领域的不可预知性以及所引用的方法的不可预知性,并未提出一种带有合理的成功预期的普遍适用的方法。
本发明的详细描述
我们现在叙述了仅仅使用上面提及的曲霉和木霉就可满足上面要求的另外的真菌表达系统。在本领域尚未提出或教授此新的表达系统。与经常使用的T.reesei系统相比,本发明的新系统具有转化率较高的额外优点。此外,培养条件有利于所表达的多肽。在本详细说明及附录的权利要求中“多肽”或“感兴趣的多肽”是指本发明表达系统的产物,此术语也包括蛋白质,即具有特定功能和/或二级结构和/或三级结构的多肽。
培养基的酸碱度可以是中性或碱性的,这样所产生的蛋白质或多肽就不再经受侵害性的和可能导致失活的酸性pH。当产生的蛋白质或多肽更适于酸性环境时,也可能在酸性pH例如pH4中培养。适于培养的pH范围是4.0-10.0之间。但是,当宿主菌株在中性或碱性的pH范围内生长较好时,则有限考虑此pH范围,例如pH6到pH9。在某些情况下,在pH8以上甚至是pHl0的碱性环境下生长也是一种好的选择。同样,这些宿主菌株的培养温度对于某些类型的所产生的多肽的稳定性也是有利的。合适的培养温度在25-43℃之间。有利的适用温度范围是从40℃到23或30℃。很明显,对于生产哺乳动物多肽来说这样的条件是尤其让人感兴趣的。所选择的温度取决于培养的成本效率和多肽或培养菌株的密度。这些条件将由本领域熟练技术人员决定。
也已经确定生物量与粘性之间的关系并且所产生的蛋白量对于本发明宿主也是非常有利的。已经将Trichoderma longibrachiatum(以前认为是T.reesei)和黑曲霉进行了比较。在它们各自优化条件下,Trichoderma longibrachiatum的生物量是2.5-5克/升,黑曲霉的生物量是5-10克/升并且根据本发明宿主的生物量是0.5-1克/升,因此,商业上所用的菌株的生物量提高了5-10倍。这些商业菌株在本领域中本身就被认为是高蛋白产量的并且它们已经被成功用于商业生产蛋白质。它们已经被在各自最佳条件下培养、发展并且成功地进行了大规模商业发酵。相同的菌株被用于举例说明本发明宿主培养物粘度值的极大改进,在发酵过程的末尾阶段Trichodermalongibrachiatum的粘度值为200-600cP(厘泊),黑曲霉的粘度值为1500-2000cP,而本发明宿主的粘度值低达10cP。因此本发明宿主提供了比商业菌株的粘度值至少改进了20-200倍。另外一个非常令人惊奇的特点是本发明的宿主细胞的蛋白水平要比商业菌株曲霉和T.reesei高得多,即使它们具有上面所提到的令人惊奇的低生物量和粘度值。总之,本发明引入了一个培养条件改进了的、易于使用的、多用途的改良的转化系统和表达系统。本发明的菌株在改进的条件下令人惊奇地高水平生产蛋白质,并且它们的发酵时间更短。
本发明涉及包含一段编码异源蛋白或多肽的核酸序列的金孢子菌突变株,上述的核酸片段与表达调控区连接并且任选地与编码分泌信号的序列和/或编码载体蛋白的序列可操作连接。本发明优选的重组菌株将分泌感兴趣的多肽。这就避免了为分离感兴趣的多肽而破碎细胞的必要,并且降低了宿主细胞其它组分降解表达产物的危险性。
可根据由Burgess出版公司1972年出版的Barnett和Hunter所著的《举例说明的缺陷真菌属》(第三版)一书中的形态学知识对金孢子菌属真菌进行准确地描述。其它提供关于金孢子菌属真菌分类的详细资料的来源有例如Sutton分类法(Van Oorschot,C.A.N(1980)“金孢子菌属及相关属的修订版”,荷兰Baarn CBS的真菌学研究第20期1-36页)。CBS是布达佩斯条约的菌种保藏机构之一。根据这些教科书,金孢子菌属真菌是属于丝孢目丛梗孢科的一种。所用的标准如下:
1.丝孢目的迹象
分生孢子直接产生在菌丝体、单独的造孢细胞和不同的分生孢子梗上。
2.丛梗孢科的迹象
分生孢子和分生孢子梗(如果有的话)都是无色透明的或亮色的;分生孢子梗是单个的或松散成簇。
3.金孢子Corda1833属的迹象
菌落呈扩散状生长,白色,有时呈奶油色、淡褐色或黄色;毡状或粉末状。菌丝通常是无色透明和表面光滑的,不规则,或多或少带有直生分枝。可繁殖的菌丝显示出很少差别或几乎没有差别。分生孢子是顶孢子、侧生孢子和产孢孢子,遍布于菌丝之上,无梗或位于短突或侧枝上,近于无色或淡黄色,薄壁或厚壁,近球形、棍棒状、梨形或倒卵形,单细胞,很少呈双细胞,以截短形式存在。有时有居间分生孢子,呈单生,偶尔成串,近于无色或淡黄色,比支持菌丝要宽,通常是单细胞的,两端截短。偶尔也有厚垣孢子存在。
另外一个提供真菌命名信息的来源是ATCC(美国),它的网址是
http://www.atcc.org。CBS也有一个提供相关信息的网址(http://www.cbs.knaw.nl)。位于莫斯科的VKM也是一个提供这些信息的可靠来源,VKM的网址是http://www.bdt.org.br.bdt.msdn.vkm/general。另外一个来源是http://NT.ars-grin.gov/fungaldatabases。所有这些机构都能提供区分金孢子菌属真菌特征的教导。
根据本发明的定义,已经明确为嗜热毁丝霉的菌株不再属于金孢子菌属。过去在一些毁丝霉属菌株的命名上一直存在相当大的混淆。本发明所优选的金孢子菌属菌株是可以明显分辨出的,并且不会与毁丝霉属、侧孢霉属或Phanerochaete chrysosporium混淆。
下列的菌株被界定为金孢子菌属菌株,但金孢子菌属的定义并不局限于这些菌株:C.botryoides,C.carmichaelii,C.crassitunicatum,C.europae,C.evolceannui,C.farinicola,C.fastidium,C.filiforme,C.georgiae,C.globiferum,C.globiferum var.articulatum,C.globiferumvar.nivenum,C.hirundo,C.hispanicum,C.holmmii,C.indicum,C.inops,C.keratinophilum,C.kreiselii,C.kuzurovianum,C.lignorum,C.lobatum,C.lucknowense,C.lucknowense Grag 27K,C.medium,C.medium var.spissescens,C.mephiticum,C.merdarium,C.merdarium var.roseum,C.minor;C.pannicola,C.parvum,C.parvum var.crescens,C.pilosum,C.pesudomerdarium,C.pyriformis,C.queenslandicum,C.sigleri,C.sulfureum,C.synchronum,C.tropicum,C.undulatum,C.vallenarense,C.vespertilium,C.zonatum。
C.lucknowense构成了金孢子菌属的一个种,由于它天然高产纤维素酶蛋白(WO 98/15633和相关的美国专利5811381),所以我们对其尤其感兴趣。Chrysosporium lucknowense的特征如下:
在沙氏葡萄糖琼脂培养基上生长14天后菌落直径达到55毫米,呈奶油色,毡状蓬松;中心致密并且3到5毫米厚;边缘清晰、规则并且有伞缘;颜色从淡黄色到奶油色。菌丝是无色透明和表面光滑的并且薄壁,很少分枝。气生菌丝通常是能育的并且密集分隔,大约1到3.5毫米宽;水下菌丝是不能育的,大约1到4.5毫米宽,最薄的菌丝通常被扭曲。分生孢子通常是顶孢子和侧生孢子,大多数是无梗的或位于短的频繁出现的圆锥形突起上或短侧枝上。分生孢子是单生的但相互之间靠得很近;在一个菌丝细胞上生有1到4个分生孢子,近于无色,薄壁或厚壁,大多数近球形,也有棍棒状和倒卵形的,单细胞,2.5×11×1.5-6毫米大小,带有较宽的基板芽痕(1-2毫米)。无居间分生孢子,也无厚垣孢子存在。Chrysosporiumlucknowense菌株的例子有ATCC44006,CBS251.72,CBS143.77和CBS272.77等,在WO 98/15633和相关的美国专利5811381中提供了其它的例子。
从此菌种中分离得到了一株具有更高的产纤维素酶能力的菌株。内部命名为C1菌株,此菌株根据布达佩斯条约于1996年8月29日保藏于位于莫斯科Bakrushina街8号邮编为113184的俄罗斯微生物保藏中心,其保藏编号为VKM F-3500D。此菌株被命名为Chrysosporium lucknowense Garg 27K。C1菌株的特征如下:
在马铃薯葡萄糖琼脂培养基上生长7天菌落直径达到大约55-66毫米;乳白色,毡状。中心厚度为2-3毫米厚,边缘清晰,规则并且有伞缘;菌落颜色从淡色到奶油色;菌丝是无色透明和表面光滑的,薄壁或厚壁,很少分枝。气生菌丝是能育的,分隔,大约2-3毫米宽;水下菌丝是不能育的。分生孢子是顶孢子或侧生孢子;无梗或位于短侧枝上。分生孢子是单生的但相互之间靠得很近;近于无色,薄壁切光滑,近球形,棍棒状或倒卵形,单细胞,4-10毫米大小。无厚垣孢子,也无居间分生孢子存在。
在WO 98/15633和相关的美国专利5811381中描述了分离C1菌株的方法。具有以上形态学特征的菌株被包括在本发明的金孢子菌属的定义之内。那些来源于金孢子菌属前体菌株包括已经自然诱变或人工诱变的菌株也在金孢子菌属的范围之内。本发明尤其包括那些通过引入诱变,特别是通过组合辐射诱变和化学诱变而获得的金孢子菌属突变株。
例如C1菌株经紫外线照射产生了UV13-6菌株,UV13-6菌株进一步经N-甲基-N’-硝基-亚硝基胍的诱变产生了NG7c-19菌株。NG7c-19菌株经紫外线照射突变导致生成UV18-25菌株。突变过程中在液体培养基中或培养皿上以及显微镜下培养物的形态学特征变化很大。随着连续诱变,作为金孢子菌属特征的在培养皿上菌落呈绒毛状或毡状生长的形态学特征逐渐丧失,最后得到一个扁平的无光泽的菌落。野生型菌株在某些培养基中产生棕色色素的现象在突变株中也不是很明显。显著的是UV18-25突变株在液体培养基中的粘性要比野生型C1菌株和UV13-6和NG7c-19突变株低得多。在所有菌株都维持金孢子菌属总显微特征的情况下,经连续突变后菌丝体变窄,并且UV18-25菌株可以明显观察到断裂菌丝。菌丝体断裂可能是引起UV18-25菌株相关的低粘度的原因。每个诱变步骤之后菌株形成孢子的能力降低。以上表明金孢子菌属的每一菌株与上面的形态学定义都有一定的偏差。此外,每一突变步骤之后纤维素酶和细胞外蛋白的产量增加了,但一些突变导致蛋白酶表达降低。真菌分类学标准可以从例如CBS、VKMF和ATCC处得到。
现已发现金孢子菌属菌株无性型尤其适于本发明的生产应用。无性型的代谢使之特别适合于大量表达。由于有性型及无性型的遗传组成是相同的,有性型也适于应用。无性型与有性型之间的区别在于一个是无性状态而另一个是有性状态。两种状态显示出在某些条件下的不同形态学特征。
优选使用本领域已知的一些无毒性的金孢子菌属菌株,这可以降低大规模生产对环境造成的危害并且简化了生产程序同时节约了成本。
表达调控区是用于表达的金孢子菌属菌株所识别的一段DNA序列。它含有一段与编码待表达的多肽的核酸序列可操作连接的启动子序列。启动子的连接使得待表达序列起始密码子的相对位置可以表达。密码子序列可以是组成型的或诱导型的。任何能够允许金孢子菌属菌株多肽表达的表达调控序列或其组合形式均包括在本发明中。表达调控序列优选是真菌表达调控区例如子囊菌调控区。合适的真菌表达调控区来自于下列真菌菌属任何之一表达调控区:曲霉、木霉、金孢子菌属、汉逊酵母、毛霉、毕赤酵母、链孢霉、Tolyplocadium、根毛霉、镰孢霉、青霉、酵母属、Talaromyces或其另外的有性形式如裸壳孢属、Hypocrea等,例如来自木霉的纤维二糖水解酶启动子,来自曲霉的葡糖淀粉酶启动子、甘油醛磷酸脱氢酶启动子、醇脱氢酶A和醇脱氢酶R启动子、TAKA淀粉酶启动子,来自链孢霉的磷酸甘油酸和交叉旁路控制启动子,来自曼赫根毛霉的天冬氨酸蛋白激酶启动子、脂酶启动子和来自变灰青霉的β-半乳糖苷酶启动子。来自与宿主菌株同属的表达调控序列尤其适合,这是因为它很可能特别适应特定的宿主。因此,优选的表达调控序列是来自金孢子菌属真菌的表达调控序列。
我们已经发现以极大量表达蛋白质的特别的金孢子菌属真菌菌株,这些菌株的天然表达调控序列是我们尤其感兴趣的。这些菌株被内部命名为金孢子菌属C1菌株,UV13-6菌株,NG7C-19菌株和UV18-25菌株。已经根据布达佩斯条约将它们保藏在莫斯科的俄罗斯微生物保藏中心(VKM)中。根据布达佩斯条约,野生型C1菌株的保藏号为VKM F-3500D,保藏日期是1996年8月29日;C1UV13-6突变株的保藏号为VKM F-3632D,保藏日期是1998年9月2日;C1 NG7c-19突变株的保藏号为VKM F-3633D,保藏日期是1998年9月2日;C1 UV18-25突变株的保藏号为VKM F-3631D,保藏日期是1998年9月2日。
优选应用能在选择的宿主内高表达的表达调控区。这也可以是一个来自于异源宿主的高表达调控区,如本领域众所周知的。因此要大量表达的蛋白质和为本发明提供合适的表达调控序列的特定的例子不仅仅局限于疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶(例如内切葡聚糖酶;纤维二糖水解酶)和多聚半乳糖醛酸酶。已经明确在固体状态下以及水下发酵条件下都可以高表达。评价这些蛋白质产生和产量的方法是本领域所众所周知的,例如Sigma和Megazyme公司的产品目录里有无数的例子。Megezyme公司位于爱尔兰Wicklow县的Bray商业区内。Sigma公司在全世界范围内有许多分支机构例如密苏里州圣路易丝市的14508信箱。对于纤维素酶的分析我们使用商用分析方法如羧甲基纤维素酶分析法、内粘度计分析法、微晶纤维素酶分析法、β-葡萄糖酶分析法、RBB羧甲基纤维素酶分析法、Cellazyme C分析法。另外的方法是本领域熟练技术人员众所周知的并且可以从关于这个主题的一般文献中查到,这些信息引入本文做参考。我们参考“酶学方法1995第一卷直至1998第297-299卷”作为例子。为确保宿主能够很好地识别我们应用了金孢子菌属真菌的启动子序列。
我们已经发现在金孢子菌属真菌中异源表达调控序列像天然的金孢子菌属真菌序列一样有效地工作。这就允许众所周知的构建物和载体被用于转化金孢子菌属真菌以及为在这种新的表达和分泌宿主中构建高表达的载体提供众多其他的可能性。例如可以使用如Christiansen等在Bio/Technol 6:1419-1422(1998)中所描述的标准的曲霉转化技术。其它文献例如美国专利4816405,5198345,5503991,5364770和5578463,EP-B-215.594(也用于木霉)中提供了曲霉转化载体的详细资料,这些文献以及它们的内容引入本文做参考。由于已经明确金孢子菌属真菌可以以极高水平表达纤维素酶,所以这些蛋白的表达调控区是优选的。我们把前面提到的保藏的金孢子菌属真菌作为特定的例子。
与含有和待表达的多肽可操作连接的核酸表达调控区的金孢子菌属突变株一样,含有来自金孢子菌属真菌,优选来自Chrysosporiumlucknowense的核酸表达调控区或其衍生物的核酸构建体组成了本发明的一个单独的实施方案。这样的合适的核酸构建体是与纤维素酶或木聚糖酶表达,优选与纤维二糖水解酶,特别是55kD纤维二糖水解酶表达有关的金孢子菌属真菌的表达调控区。作为实施例提供了金孢子菌属真菌25kDa(C1-EG5)内切葡聚糖酶和43kDa(C1-EG6)内切葡聚糖酶的启动子序列,其中分子量是根据SDS-PAGE电泳确定的(根据氨基酸序列数据分子量为21.9-39.5kDa)。因此,金孢子菌属真菌的疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、酯酶、果胶酶、β-半乳糖苷酶、纤维素酶(例如内切葡聚糖酶;纤维二糖水解酶)和多聚半乳糖醛酸酶的启动子序列也被认为在本发明的范围之内。在表A或B中任何一种酶表达的启动子或调控区都适于应用。本发明的核酸序列可从本发明的金孢子菌属真菌中得到。确定启动子序列的方式有很多种,并且是本领域众所周知的。在相关基因ATG起始密码子上游区进行核酸缺失实验可以提供这样的序列。例如分析一致序列也可以发现感兴趣的基因。本领域熟练技术人员使用杂交或扩增技术可以很容易地得到相应的启动子序列。
通过克隆相应基因这种方式鉴定了C1内切葡聚糖酶的启动子序列,分别见SEQ ID NO.2(EG5)和SEQ ID NO.1(EG6)。本发明的其它优选的启动子是55kDa的纤维二糖水解酶(CBH1)启动子和30kDa的木聚糖酶(XylF)启动子,因为这些酶通过它们自己的启动子高水平地表达。利用分别在SEQ ID NO:4(为CBH1)和SEQ ID NO:5(为XylF)中提供的部分信息,通过如下所述的直接克隆内切葡聚糖酶的方式可以鉴定相应的启动子序列。金孢子菌属真菌的碳水化合物降解酶启动子特别是C1启动子可被优选用于在宿主有机体特别是真菌或其它微生物宿主机体内表达想要的多肽。与SEQ ID NO.1和2,或与金孢子菌属真菌其它基因序列具有至少60%,优选至少70%,最优选至少80%核苷酸序列相同性的启动子序列也是本发明的一部分。
我们把本发明的重组菌株和核酸序列的特别的实施方案作为例子。我们也利用重组菌株叙述本领域高表达的启动子序列特别是那些在真菌例如曲霉和木霉中提供高表达的启动子序列。本领域提供了许多可用于曲霉的表达调控区,如Novo的美国专利5252726和Unilever的美国专利5705358。这些内容引入文中做参考。
疏水蛋白基因是一个高表达的真菌基因。因此提议疏水蛋白基因,优选来自金孢子菌属真菌的疏水蛋白基因的启动子序列可能适合于在本发明合适的实施方案中用做表达调控序列。本领域已经公开了Trichoderma reesei和Trichoderma harzianum疏水蛋白的基因序列以及烟曲霉和构巢曲霉的基因序列,相关的序列信息引入文中做参考(Munoz等,现代遗传学1997,32(3):225-230;Nakari-SetalaT等,欧洲生物化学杂志1996,15:235(1-2):248-255;M.Parta等,传染免疫学1994 62(10):4389-4395和Stringer M.A.等,分子微生物学1995,16(1):33-44)。利用这些序列信息,本领域熟练技术人员使用上面已经提到的标准技术就可以很容易地得到金孢子菌属真菌疏水蛋白基因的表达调控序列。本发明的金孢子菌属重组菌株包含与编码感兴趣的多肽的序列可操作连接的疏水蛋白调控区。
表达调控序列也可以另外包含增强子或沉默子。这些也是本领域众所周知的并且它们通常都位于离启动子有一段距离的地方。表达调控序列也可以包含带有激活剂结合位点和阻遏蛋白结合位点的启动子。在一些情况下也可以修饰这些位点以消除这种类型的调控。已经描述了带有creA位点的丝状真菌启动子。可以突变这样的creA位点确保阻抑葡萄糖,通常情况下去除未突变的creA位点可导致这种结果。Gist Brocades的WO 94/13820举例说明了这种原理。使用这样的启动子可以使由核酸序列所编码的多肽的表达能够在葡萄糖存在的情况下受此启动子调节。WO 97/09438中也说明了此原理。带有或不带有creA位点的这些启动子都可以使用。creA位点已经被突变的突变株可被用做本发明的重组菌株的表达调控序列,这样它所调节的核酸序列就可以在葡萄糖存在的情况下表达。这些金孢子菌属真菌启动子可以以WO 97/09438中所例证的类似方式脱阻抑。creA位点的鉴定是本领域众所周知的。另外,可以在阻遏系统带有突变例如creA基因本身突变的宿主菌株中应用带有creA结合位点的启动子,因此尽管此菌株带有creA结合位点,它仍然可以在有葡萄糖存在的情况下产生蛋白质或多肽。
终止子序列也是表达调控序列,它们与待表达基因的3’端可操作连接。任何真菌终止子在本发明的金孢子菌属真菌中都是有功能的,例如构巢曲霉trpC终止子(1),构巢曲霉α-葡糖苷酶(2)、构巢曲霉葡糖淀粉酶(3)、曼赫氏毛霉羧基蛋白酶(美国专利5578463)和T.reesei纤维二糖水解酶终止子。天然的终止子序列如EG6终止子在金孢子菌属真菌中也是有功能的并且是相配的。
本发明的合适的金孢子菌属真菌重组株的待表达的核酸序列与编码信号序列氨基酸序列的核酸序列可操作连接。信号序列是与待表达多肽的氨基酸序列可操作连接从而使之分泌到宿主真菌外的氨基酸序列。这样的信号序列可以是与异源多肽有关的,也可以是宿主本身的。它也可以对宿主和多肽来说都是异源的。编码信号序列的核酸序列必须位于读码框内以允许信号序列和异源多肽的翻译。我们设想了任何一种能够使金孢子菌属真菌分泌多肽的信号序列。合适的这样的序列是真菌的信号序列,优选子囊菌信号序列。
合适的信号序列的例子可以来自普通酵母或下列特定的真菌菌属的任何之一:曲霉、木霉、金孢子菌属、毕赤酵母、链孢霉、根毛霉、Humicola、汉逊酵母、毛霉、Tolyplocadium、镰孢霉、青霉、酵母属、Talaromyces或其另外的有性形式如裸壳孢属、Hypocrea等。特别有用的信号序列通常与下列蛋白质天然有关:纤维素酶、多聚半乳糖醛酸酶、纤维二糖水解酶、内切葡聚糖酶、β-半乳糖苷酶、木聚糖酶、果胶酶、酯酶、疏水蛋白、蛋白酶或淀粉酶。例如曲霉或Humicola的淀粉酶(4)、米曲霉的TAKA淀粉酶、黑曲霉的α淀粉酶、毛霉的羧基肽酶(美国专利5578463)、曼赫氏根毛霉的脂酶、木霉的纤维二糖水解酶(5)、变灰青霉的β-半乳糖苷酶以及酵母的α交配因子。
或者,信号序列可以来自于芽孢杆菌的淀粉酶或枯草蛋白酶基因。来自与宿主菌株同属的信号序列是最合适的,这是因为它很可能特异性适应宿主菌株,因此优选的信号序列是金孢子菌属真菌的信号序列。我们已经发现以极大量分泌蛋白质的特别的金孢子菌属真菌菌株,这些菌株的天然信号序列是我们尤其感兴趣的。这些菌株被内部命名为金孢子菌属C1菌株,UV13-6菌株,NG7C-19菌株和UV18-25菌株。如本文其它地方所描述的一样这些菌株也已经根据布达佩斯条约被保藏。来自于丝状真菌、酵母和细菌的信号序列也是有用的。非真菌来源的信号序列也是有用的,特别是来自于细菌、植物和哺乳动物的信号序列。
根据本发明任何一个实施方案重组的金孢子菌属真菌可另外包含一个选择标记。这样的选择标记将允许易于挑选转化的或转染的细胞。选择标记通常编码一种基因产物,此基因产物对未转化的菌株提供了一种异源的特定类型的抗性。这可以是对重金属、抗生素和杀虫剂的抗性。原养型对于非抗生素品种来说也是一种有用的选择标记。当着眼于这种产物更快或较不复杂的调控将感兴趣的蛋白质或多肽用于食品或药物中时,优选非抗生素选择标记。GRAS指标常常用于这样的标记。本领域熟练技术人员可用许多这样的标记。例如FDA提供了一系列这样的标记。最常用的选择标记来自于赋予抗药性或减轻营养缺陷的amdS(乙酰胺酶)、hph(潮霉素磷酸转移酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、trpC(色氨酸合酶)、argB(鸟氨酸氨甲酰基转移酶)、sC(硫酸腺嘌呤转移酶)、bar(膦丝菌素乙酰转移酶)、glufosinate抗性、niaD(硝酸还原酶)、博来霉素抗性基因,更特别的是Sh ble、磺酰脲抗性如乙酰乳酸合成酶ilv1突变。也可以通过共转化选择,其中选择标记在另一个载体上或与编码感兴趣的多肽的多肽编码序列在同一个核酸片段上。
本文中所用的术语异源多肽是通常情况下不被本发明用于表达的金孢子菌属真菌表达和分泌的蛋白质或多肽。多肽可以是植物或动物(脊椎动物或无脊椎动物)起源的例如哺乳动物、鱼、昆虫或微生物起源的,但限制条件是此多肽不能出现在宿主菌株中。哺乳动物包括人。微生物包含病毒、细菌、古细菌和真菌即丝状真菌和酵母。伯杰氏细菌鉴定手册提供了许多系列的细菌和古细菌。为药物应用的目的优先选择人体蛋白,因此构成本发明优选的实施方案的重组宿主是其中带有人体起源的多肽的宿主。为例如食品生产的目的,合适的异源多肽是动物、植物或藻类起源的。因此,这些实施方案也考虑到本发明合适的实施例。其他有用的实施方案也包括细菌、酵母、病毒、古细菌和真菌任何之一起源的异源多肽。真菌起源的多肽是最优选的。
本发明的合适的实施方案包含带有合适的密码子使用的异源核酸序列。这样的序列编码其所起源的宿主的天然的氨基酸序列,但具有不同核酸序列,即某些密码子已经被其他编码相同氨基酸的密码子替换以使之更易于被用于表达的宿主菌株所使用的核酸序列。这可导致异源核酸序列的更好地表达。对于本领域熟练技术人员来说这是很普通的。这种合适的密码子可以在已知的真菌密码子使用对应于非真菌的密码子使用的基础上得到。它也可以更特异地适应于金孢子菌属真菌本身的密码子使用。相似之处是所观察到的木霉、Humicola和曲霉的密码子使用可以在不改变密码子的情况下进行这些有机体之间的序列交换。关于这些真菌密码子使用的详细资料是本领域熟练技术人员可利用的,并且引入本文做参考。
本发明不仅仅局限于上面所提到的金孢子菌属真菌菌株,也包括含有编码金孢子菌属真菌菌株同源多肽的核酸片段的重组菌株,上述的核酸片段与一表达调控区可操作连接并且上述的重组菌株比相应的非重组菌株在同样的条件下产生更多的上述的蛋白。所感兴趣的同源多肽优选是中性或碱性酶如在本文其它地方已经描述的水解酶、蛋白酶或碳水化合物降解酶。多肽也可以是酸性的。优选的重组菌株比非重组菌株表达更多量的多肽。所有提到的关于异源多肽的评论也同样适用于同源多肽纤维素酶。
因此,本发明也包括金孢子菌属真菌基因工程菌株,其中所引入的序列是金孢子菌属起源的。但是,由于以下原因例如用于转化或转染金孢子菌属真菌存在于核酸序列中的异源序列,由于存在编码所感兴趣的多肽的核酸序列的多重拷贝这个事实或由于在同等条件下所表达的多肽的量多于非工程菌这个事实或由于在通常不表达的条件下发生表达这个事实,工程菌可以与原始自然菌株区分开来。后一情况可能是在与非重组菌相反的条件下诱导型启动子调节所感兴趣的序列或着是另外的因子诱导表达的结果。正如在前述的实施方案中所定义的本发明不包括天然金孢子菌属真菌。本发明旨在通过使用经典的基因工程或基因工程方法而获得的菌株。
本发明所有的重组菌株都含有一段编码选自下列物质的核酸片段:碳水化合物降解酶(纤维素酶、木聚糖酶、甘露聚糖酶、甘露糖酶、果胶酶、淀粉酶例如葡糖淀粉酶、α淀粉酶、α和β半乳糖苷酶、α和β葡(萄)糖苷酶、β葡聚糖酶、几丁质酶、聚N-乙酰葡糖胺酶)、蛋白酶(内切蛋白酶、氨基蛋白酶、氨基和羧基肽酶)、其它水解酶(脂酶、酯酶、植酸酶)、氧化还原酶(过氧化氢酶、葡萄糖氧化酶)和转移酶(转谷氨酰胺酶、转糖基酶、异构酶和转化酶)。
表A:酶保持活性和/或稳定性的pH范围
样品 |
保持酶活性大于50%的pH范围 |
保持酶活性大于70%的pH范围 |
最大稳定性%(20小时50℃) |
羧甲基纤维素酶 |
RBB羧甲基纤维素酶 |
其它底物 |
羧甲基纤维素酶 |
RBB羧甲基纤维素酶 |
其它底物 |
PH7.5/8 |
30kD蛋白酶(碱性)30kDXyl(碱性)51kDXyl60kDXyl45kDendo55kDendo25kD(21.8kD*)endo43kD(39.6kD*)endo45kDα,β-Gal/β-Gluc48kDCBH,带痕量β-Gluc55kDCBH65kDPGU90kD蛋白酶100kD酯酶 |
----7.08.07.58.0-5.28.0--- |
----8.08.010.08.0-7.59.0--- |
12.510.08.09.5----6.88.0-8.09.09.0 |
----6.57.06.57.2-5.07.4--- |
----7.07.09.07.2-6.88.5--- |
12.08.57.59.0----5.7--7.39.09.0 |
-80-85755580---70--- |
*分子量(MALDI方法)
注:*所有其它分子量都是用SDS-PAGE方法得到的
*酶都具有相等的蛋白质含量
*xyl指木聚糖酶
*endo指内切葡聚糖酶
*gal指半乳糖苷酶
*gluc指葡糖苷酶
*CBH指纤维二糖水解酶
*PGU指多聚半乳糖醛酸酶
表B从18-25菌株超滤液分离的酶对不同底物的酶活性(pH5),单位/毫克蛋白质
样品 | pI | CMC | RBB-CMC | CMC-41 | FP | CMC(visc) | b-葡聚糖 | pNP-aG | pNP-bG | 纤维二糖 | 微晶纤维素 | MUF-纤维二糖苷 | MUF-乳糖苷 | MUF-木糖苷 | 乳糖 | 木聚糖 | 多聚半乳糖醛酸 | MUF-葡糖苷 | 半乳甘露聚糖 | pNP-a半乳糖苷 | pNP-b半乳糖苷 | 染色的酪蛋白** | pNP丁酸酯 |
| |
50℃ |
40℃ |
40℃ |
50℃ |
40℃ |
50℃ |
40℃ |
40℃ |
40℃ |
40℃ |
40℃ |
40℃ |
40℃ |
40℃ |
50℃ |
50℃ |
40℃ |
50℃ |
40℃ |
40℃ |
50℃ |
60℃ |
30kD蛋白酶 |
8.9 |
0 |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0.4 |
0 |
30kDXyl |
9.1 |
0.1 |
2 |
0.1 |
0.16 |
0.1 |
0 |
- |
0 |
- |
0 |
0 |
0 |
0 |
- |
25 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
51kDXyl |
8.7 |
0.1 |
4.2 |
- |
0.19 |
- |
0 |
- |
0 |
- |
0 |
0 |
0 |
0 |
- |
19 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
60kDXyl |
4.7 |
0 |
- |
- |
0 |
- |
0 |
- |
0 |
- |
0 |
0.14 |
0.02 |
0.04 |
- |
16.3 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
45kDendo |
6 |
51 |
86 |
7.6 |
0.2 |
47 |
36 |
- |
0 |
- |
0.5 |
0 |
0 |
0 |
- |
1 |
- |
0 |
1.8 |
0 |
- |
0 |
0 |
55kDendo |
4.9 |
47 |
94 |
7.7 |
0.3 |
39 |
25 |
- |
0 |
- |
0.5 |
0 |
0 |
0 |
- |
0 |
- |
0 |
0.4 |
0 |
- |
0 |
0 |
25kD(21.8kD*)endo |
4.1 |
19 |
15 |
3.9 |
0.3 |
11 |
3.8 |
- |
0 |
0 |
005 |
0 |
0 |
- |
0 |
0.03 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
43kD(39.6kD*)endo |
4.2 |
0.43 |
0.2 |
0.1 |
0 |
0.2 |
0.2 |
- |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
45kDa,b-Gal/b-Gluc |
4.2 |
0 |
0 |
0 |
0 |
0.01 |
0.01 |
0 |
0.4 |
0.06 |
0 |
0 |
0 |
- |
0.01 |
0 |
0.1 |
0.1 |
0.2 |
0.2 |
0.3 |
0 |
1.7 |
带痕量β-Gluc的48kD CB+葡糖酸-d-内酯 |
4.4 |
0.67 |
1.3 |
1.2 |
0.4 |
0.8 |
0.77 |
0 |
1.7 |
0.08 |
0 |
0.2 |
0.36 |
- |
0 |
0 |
0.1 |
0.4 |
0 |
0 |
0 |
0 |
2.3 |
| | | | | | | |
0 | | | |
0.36 | | | | | | | | | | |
带痕量β-Gluc的55kDCBH+葡糖酸-d-内酯 |
4.4 |
0.7 |
0.16 |
0.27 |
0.4 |
0.1 |
0.1 |
- |
0.05 |
0.08 |
0.46 |
0.2 |
0.7 |
- |
0 |
0.1 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
| | | | | | | |
0 | | |
0.14 |
0.6 | | | | | | | | | | |
65kDPGU |
4.4 |
0 |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
1 |
- |
0 |
0 |
0 |
0 |
0 |
90kD蛋白酶 |
4.2 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
0.91 |
- |
100kD酯酶 |
4.5 |
0 |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
- |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0.8 |
*分子量(MALDI法)
**对染色的酪蛋白的活性以任意单位/毫克表示
本发明所要表达的最令人感兴趣的产品是纤维素酶、木聚糖酶、果胶酶和蛋白酶。其中纤维素酶和果胶酶带有β-1,4-键,纤维素酶包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在本领域已知的各种不同的工业过程中这些蛋白质是非常有用的。特别是纤维素酶我们参考了叙述纤维二糖水解酶和内切葡聚糖酶使用的WO98/15633。上述应用的内容引入文中做参考。我们也参阅了进一步提供金孢子菌属蛋白质详细资料的表A和表B。
根据本发明发现可以制备蛋白酶表达量降低的金孢子菌属突变株,从而使之更适于生产蛋白质产物,特别是对蛋白酶敏感的蛋白质产物。因此本发明也包括与未突变菌株例如C.lucknowense C1菌株(VKMF-3500D)相比蛋白质没产量降低的金孢子菌属突变株。特别是这些菌株的蛋白酶活性小于C1菌株蛋白酶活性的一半,甚至小于30%。可以用已知的方法测量降低的蛋白酶活性如通过测量在脱脂乳平板上所形成的晕的大小或通过BSA降解。
本发明尤其感兴趣的一个实施方案是本模仿的重组金孢子菌属真菌,其中编码感兴趣多肽的核酸序列编码一种在酸性pH下即pH低于6,甚至pH低于5.0,更适合甚至pH低于5和甚至pH4或低于pH4的情况下失活或不稳定的蛋白质或多肽。这是一个特别令人感兴趣的实施方案,因为这个真菌表达系统并不是在中性到碱性的条件下培养而是在酸性条件下培养的。因此,本发明的这个系统提供了一种表达在酸性pH下易于失活或不稳定的蛋白质或多肽的安全的真菌表达系统。
正如在本发明任一实施方案中所详细说明的那样,一个更为特别的重组菌株被认为是本发明的一个优选的实施方案,其中编码感兴趣多肽的核酸序列编码一种在pH5以上,优选中性或碱性pH(即大于7)和/或在pH大于6的情况下具有最佳活性和/或稳定性的蛋白质或多肽。在这样的pH值下最佳活性大于50%,大于70%甚至大于90%被认为是特别有用的实施方案。在培养条件下所表达的多肽在此条件下没有必要必须有活性,由于其活性形式可能对宿主有损害,所以实际上在其失活的条件下培养对它也是有利的。例如蛋白酶就是这种情况。但是,蛋白质或多肽在此培养条件下必须稳定。稳定可以是热稳定。它也可以是针对某些组合物或化学制品的稳定,例如存在于组合物中或生产过程中或在所感兴趣的蛋白质或多肽的应用中。在含有纤维素酶或脂酶的去垢剂组合物中的LAS等是通常对蛋白质有损害的化学制品的例子。在应用中使用时间可能从短到长不等,因此对于每次应用来说稳定性的时间长短可能不同。熟练技术人员在各种情况的基础上将能够确保正确的条件。我们可以使用商用分析方法来确定不同的酶产物的最佳活性。例如Sigma和Megazyme公司的产品目录上有这些分析方法。在本叙述的其它地方也都提到了特定的实施例。制造商提供了应用指导。
我们惊奇地发现能适合被所要表达的感兴趣的序列转化或转染的金孢子菌属真菌菌株其生物量相当低。我们已经发现当培养至发酵的末尾阶段粘度值为200-600cP时金孢子菌属真菌菌株的生物量比T.reesei低2-3倍,当在相应条件下培养至粘度值为1500-2000cP时其生物量比黑曲霉低10-20倍,即它们各自最佳的培养条件能够提供高水平的表达。表达水平极大地超过了两个商用菌株并且其生物量和粘度值相当低。这意味着这个金孢子菌属真菌菌株的表达产量要比黑曲霉和T.reesei稍微高一些。这样的一株转化的或转染的金孢子菌属真菌菌株构成了本发明的一个合适的实施方案。
我们发现在上面所叙述的条件下金孢子菌属C1菌株(18-25)的生物量是0.5-1.0克/升,而T.reesei的生物量是2.5-5.0克/升,黑曲霉的生物量是5-10克/升。在实施例中我们提供了这个过程的详细资料。
在本发明的一个合适的实施方案中本发明的金孢子菌属真菌重组菌株所产生的蛋白质或多肽的量至少应该等同于由UV13-6或C-19菌株所产生的摩尔每升纤维素酶的量,最优选的情况是至少应该等同于或高于由UV18-25菌株在相应条件或相同条件即在它们各自最佳的培养条件下产生的纤维素酶的量。
所未预料到的是,我们也发现当使用显示UV18-25菌丝体形态的金孢子菌属菌株即短的菌丝体片段时表达和分泌率非常高。因此本发明的重组菌株优选显示这样的形态。但是本发明也包括显示这种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。本发明也包括在本发明任一实施方案中所描述的与C1菌株相比进一步表现出在相同的发酵条件下产生孢子能力降低,优选低于UV13-6菌株产孢能力,优选低于NG7C-19菌株产孢能力,优选低于UV18-25菌株产孢能力的金孢子菌属真菌重组菌株。本发明也包括在本发明任一实施方案中所描述的与C1菌株相比,优选在相同的发酵条件下与UV13-6,NG7C-19和UV18-25菌株相比显示出至少蛋白质产量与生物量比的金孢子菌属真菌重组菌株。但是,本发明同样也包括或与其它任一实施方案结合显示这种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。
本发明的另一个吸引人的实施方案也包括在相应或等同的发酵条件下显示出粘度值比NG7C-19菌株低,优选比UV18-25菌株的金孢子菌属真菌重组菌株。但是,本发明同样也包括显示一种或几种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。我们已经确定在它们各自的最佳培养条件下发酵过程的末期阶段UV18-25培养物的粘度值为10cP,而T.reesei的粘度值为200-600cP,黑曲霉的粘度值为1500-2000cP。在实施例中提供了这些测量过程。
在许多情况下粘度值可以通过视觉监测。物质的流动性变化程度很大,它可以呈近乎固体状、酱状或液体状。粘性也很容易通过使用运动粘性管的Brookfield旋转粘度计、降珠粘度计或杯形粘度计确定。这样的低粘度值培养物每个时间单位和每个细胞的产量比已知的高粘度值的商业培养物要高。
对本发明的这些低粘度的培养物进行处理是有利的,特别是测量培养物时。低粘度的金孢子菌属真菌目标菌株在体积大至150000升的培养物中表现得非常好。因此任何一个体积至150000升的培养都是本发明的有用的实施方案。使用本发明的菌株任何其它传统体积大小的发酵也应该能够很好地实施。其后的原因是在大规模生产中出现的问题随着聚集物的形成菌丝体太致密和/或不均匀分布。其结果是培养基在培养过程中不能被有效利用,因此导致生产过程低效,特别是在大规模发酵即体积大于150000升的情况下。通气或混合导致了氧气和营养饥饿因此降低了产物生物量的浓度和减少了培养过程中的多肽产量和/或导致发酵时间延长。此外,在商业发酵过程中高粘度和高剪切是我们所不希望发生的,并且在现在的商业发酵过程中它们是生产限制因素。从这一点上来说使用本发明的金孢子菌属真菌菌株可以克服所有这些负面特征,因为此菌株比商用T.reesei、黑曲霉和米曲霉显示出更好的特征即蛋白质生产水平较高、更好的粘度特征和生物量数值。
选自C1、UV13-6、NG7C-19和UV18-25的金孢子菌属真菌菌株非常好地显示出各种不同的特征。但是,本发明也包括来自这四种保藏的菌株的也显示出任何一种新的和创造性特征或几种特征的金孢子菌属重组菌株和工程菌株。这些菌株的保藏数据在本文各处随处可见。本发明的金孢子菌属菌株也包含一种在相应的培养条件下显示生物量低于T.reesei生物量至少2倍,合适的甚至低于T.reesei,特别是在实施例条件下显示粘度为200-600cP的T.reesei的生物量超过5倍的菌株。本发明的金孢子菌属菌株也包含在相应或等同条件下产生多肽的量至少是C1、UV13-6、NG7C-19或UV18-25所产生的摩尔每升纤维素酶的数量。
如果本发明的金孢子菌属真菌在中性至碱性pH和2543℃温度范围内显示出最佳的生长条件,那么此菌株是进一步优选的。优选的菌株能在中性甚至碱性pH下存在。这样的条件对于许多蛋白质和多肽有利,特别是那些易于受到酸性pH侵害或在低温度下失活或不稳定的多肽和蛋白。但是,本发明的一个实施方案也包括在酸性pH下培养金孢子菌属真菌,因为这对于某些蛋白质和多肽来说是有用的。合适的酸性pH值是7以下,低于6.5的酸性pH被视作本发明的一个好的实施方案。PH在5.0-7.0之间的也是合适的实施方案。中性pH可以是7或7左右如6.5-7.5。正如在本文其他地方所表明的感兴趣的最佳pH值取决于许多因素,这些因素对于本领域熟练技术人员来说是显而易见的。大于7.5的pH值是碱性的,可以利用的合适的碱性pH值是7.5-9.0之间。
当比较本发明菌株以及其它具有最佳条件的菌株(如曲霉或木霉)的测量粘度值时,也应该使用相关的最佳条件下的相关菌株进行生物量和蛋白质产量的比较。这对于本领域熟练技术人员是明显的。
根据本发明的任何一个上面提到的实施方案,金孢子菌属菌株被认为是本发明最有用的实施方案,上述的菌株生产上面所提到的选自碳水化合物降解酶、蛋白酶、其它水解酶、氧化还原酶和转移酶的一种或多种真菌酶。特别是纤维素酶、木聚糖酶、果胶酶、脂酶和蛋白酶是最令人感兴趣的产品。但是作为本发明的实施方案,生产一种或多种在中性或碱性优选碱性条件下显示出最佳活性和/或稳定性的真菌酶的金孢子菌属菌株也是有用的,上述的酶选自碳水化合物降解酶、水解酶和蛋白酶,优选水解酶和碳水化合物降解酶。在非重组金孢子菌属菌株中,像WO 98/15633所公开的那样这些酶是除纤维素酶以外的其它合适的酶。我们所特别感兴趣的酶是木聚糖酶、蛋白酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、β葡聚糖酶和果胶酶。这些酶不仅仅限于上面所提到的酶。本文中关于稳定性和活性的讨论也同样用于此处。
本发明也包括生产所感兴趣的多肽的方法,上述的方法包含培养本发明任一实施方案中所表达和优选分泌感兴趣的多肽的金孢子菌属菌株,并随后回收产生的多肽。
当提到蛋白质或多肽时,天然蛋白质的变种或突变体例如替换、插入或确实突变体被包括在显示非突变体活性的蛋白或多肽中。相应的核酸序列也是如此。通过基因改组、蛋白质工程和定向进化定点突变和随机突变等方法可以得到这样的多肽、变种或突变体。美国专利5223409、5780279和5770356提供了定向进化的方法。利用这些方法例如通过易错聚合酶链反应进行基因改组可在任何细胞类型中产生随机突变的基因序列库。每一基因都带有分泌区和一固定区,从而使产物蛋白分泌出来并且固着在宿主表面。随后创造此特定蛋白生物活性所必须的条件。经过许多循环之后最终导致具有所希望特征的终基因产生。换一句话说一个加速的定向进化过程。美国专利5763192也叙述了通过合成的多聚核苷酸偶联随机产生序列,将其引入宿主中随后选择具有预先设定特点的宿主细胞而获得DNA、RNA、肽、多肽或蛋白质的方法。
使用标准的克隆技术和蛋白质或多肽分离技术以取得所需要的序列信息。部分已知的序列可用做探针分离其它属或株的同源序列。编码特定酶活性的核酸序列可用于筛选例如金孢子菌属序列库。本领域熟练技术人员知道合适的杂交条件。纽约冷泉港Plainview出版的萨姆布鲁克等(编者)(1998)的“分子克隆实验指南”一书以及纽约约翰威利父子公司出版的奥斯伯(编者)的“现代分子生物学实验技术”一书叙述了传统的核酸杂交文库的构建和克隆技术。相关的信息也可以从后者的手册和专利以及本领域的各种商用试剂盒中得到。
在另外的一个实施方案中,上述的方法包含在允许蛋白质或多肽或其前体表达和优选分泌的条件下培养菌株,随后分离所产生的多肽并且任选将前体经过另外的分离和纯化步骤以得到所感兴趣的多肽。这样的方法可能包含将前体裂解为感兴趣的多肽或前体的合适的步骤。当一分泌的蛋白质载体和感兴趣的多肽由一个蛋白酶位点连接时,可使用Kex-2样蛋白酶、任一基本氨基酸配对的蛋白酶或Kex-2蛋白酶裂解。本领域熟练技术人员能够很容易地找到Kex-2样蛋白酶序列,因为现有一致序列的详细资料可以利用并且已经公开了许多其它的序列如弗林蛋白酶。
根据本发明任一实施方案生产多肽的方法,培养的合适pH值大于5,优选5-10,更优选6-9。在此方法中合适的培养温度是25-43℃,优选30-40℃。在此方法中所使用的本发明的金孢子菌属真菌菌株是本发明任一实施方案所公开的非常适合的重组金孢子菌属菌株。本发明的这种方法可进一步以制备本发明的重组金孢子菌属菌株为前提。合适条件的选择取决于待表达的多肽的性质,并且在本领域熟练技术人员的正常工作之内。
生产本发明重组金孢子菌属菌株的方法也是本发明的一部分。此方法包含向金孢子菌属菌株稳定引入一段编码异源或同源多肽的核酸片段,上述的核酸片段与一表达调控区可操作连接,上述的引入已一种已知的转化丝状真菌的形式发生。如上所述有其无数的参考文献可以利用,本文只引用了其中一小部分。所提供的信息足够使本领域熟练技术人员毫不费力地施行此方法。此方法包含引入一段或几段在本发明重组金孢子菌属真菌的各种不同的实施方案中所描述的任一核酸片段。
实施例中核酸片段的引入是通过原生质体转化的方法实现的。在实施例中详细叙述了此方法。正如在本领域其它丝状真菌中所描述的那样,也可以使用另外的原生质体或球芽转化技术。这些方法的详细细节可在许多引用的参考文献中找到,因此这些文献引入本文做参考。本发明合适的方法包含使用本发明的非重组金孢子菌属真菌作为引入所希望的编码感兴趣多肽的核酸序列的起始材料。
本发明也包括生产金孢子菌属真菌酶的方法,上述的方法包含在pH值大于5,优选5-10,更优选6-9,6-7.5,7.5-9是合适的中性和碱性pH范围的培养基中培养本发明的在上面任一实施方案中所描述的金孢子菌属真菌菌株。
通常来说,本发明进一步包含生产表现出中性或碱性最佳活性和/或稳定性,优选碱性最佳活性和/或稳定性的酶的方法。在本文的其它地方已经提供了优选的pH范围和相应的最佳活性以及测量活性的分析方法。如上所述,酶应选自碳水化合物降解酶、蛋白酶、其它水解酶、氧化还原酶和转移酶,上述的方法包含培养用编码相应的酶的核酸片段转化或转染的宿主细胞。金孢子菌属真菌酶是这样的合适的酶。合适的类似的方法包含生产特别是如纤维素酶、木聚糖酶、果胶酶、脂酶和蛋白酶,其中纤维素酶和木聚糖酶带有β-1,4-键,并且纤维素酶包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。本发明的方法可包含培养本发明的含有编码上述的这些酶的核酸片段的金孢子菌属真菌宿主。本发明的合适的非重组金孢子菌属菌株主要生产碳水化合物降解酶、水解酶和蛋白酶。在这种情况下合适的酶是除纤维素酶以外的其它酶。在表A和表B中列出了要生产的合适的产品的实施例。分离方法等同于在WO 98/15633中所叙述的方法,此方法引入本文做参考。
本发明也包括由本发明的金孢子菌属真菌菌株所产生的酶。正如可从本发明的非重组金孢子菌属菌株中分离的酶一样,本发明也包括金孢子菌属真菌起源的酶。它们表现出前述的稳定性、活性特点。合适的是它们在LAS存在时也很稳定。需要特别声称的是具有前述活性稳定性特征的等电点为4-9.5,分子量为25-95kD的蛋白酶;等电点为4.0-9.5,分子量为25-65kD的木聚糖酶;等电点为3.5-6.5,分子量为25-55kD的内切葡聚糖酶;等电点为4-4.5,分子量为45-50kD的β-葡糖苷酶和α、β-半乳糖苷酶;等电点为4-5,分子量为45-60kD的纤维二糖水解酶例如等电点为4.5,分子量为55kD;等电点为4.0-5.0,分子量为60-70kD如65kD的多聚半乳糖醛酸酶;等电点为4-5,分子量为95-105kD的酯酶。分子量是通过SDS-PAGE电泳确定的。如在WO 98/15633中所公开的那样,非重组酶即天然的酶是除纤维素酶以外的其它酶。在WO 98/15633中所公开的酶被排除在外。上面所提到的组合等电点和分子量的酶也包括在内。
本发明也考虑到由本发明的突变(重组)菌株所(过量)产生的非蛋白质产物。这样的非蛋白质产物包括基础代谢产物如有机酸、氨基酸和次级代谢产物如抗生素,例如青霉素和头孢菌素。这些产物是组合几种生化途径的结果,涉及一些目的真菌基因。真菌的基础和次级代谢产物和在真菌中产生这些代谢产物的过程是本领域众所周知的。Mattey M在有机酸的产生,现代生物技术评论12,87-132(1992)一文中描述了基础代谢产物产生的实施例。Penalva等在真菌中青霉素生物合成的优化,生物技术趋势16,483-489(1998)一文中描述了次级代谢产物产生的实施例。
实施例
测定生物量和粘度的实施例
已经使用了三种不同的真菌鉴定了用于真菌发酵的操作参数数据范围。所比较的三种真菌为:Trichoderma longibrachiatum(以前的T.reesei)、黑曲霉和Chrysosporium lucknowense(UV18-25)。
粘度
粘度是使用小的样品适配器和31号转轴在Brookfield LVF粘度计上测量的。
在使用粘度计前5分钟打开循环水泵以平衡水夹套层。水浴温度应为30℃。
收获10毫升新鲜的发酵培养液并将此发酵培养液置于小的样品转轴上。选择转轴速度使其读数范围在10-80内。等待4分钟后读取粘度测量值。读数乘以下面所给出的系数就得到了以厘泊(cP)为单位的粘度值。
转轴速度 系数
6 50
12 25
30 10
60 5
使用上面的方法对特定的真菌所测量的发酵的粘度值范围如下:
粘度值(cP)
T.longibrachiatum 200-600
黑曲霉 1500-2000
C.lucknowense(UV18-25) 低至10
生物量
生物量是通过下列方法测定的:
在铝称量盘上对直径为5.5厘米的滤纸(沃特曼54)预先称重。
在布氏漏斗上过滤5.0毫升全培养液,用10毫升去离子水冲洗滤饼,将洗过的饼和滤器置于平底称量盘上60℃过夜干燥。最后100℃干燥1小时,然后置于干燥器中冷却。
称量干物质的重量。总生物量(克/升)等于两次称量值之差再乘以200得到的数值。
使用上面的方法对特定的真菌所测量的发酵的生物量范围如下:
生物量(克/升)
T.longibrachiatum 2.5-5
黑曲霉 5-10
C.lucknowense(UV18-25) 0.5-1
蛋白质
蛋白质水平是利用Sigma公司的伯乐分析方法测定的。金孢子菌属真菌的蛋白质水平最高。
上面的数值代表发酵过程开始48小时以后直至发酵结束的测量值;曲霉和木霉的所有数值都是来自商业相关的真菌并且反映了真实的商业数据。
真菌菌株C.lucknowense(UV18-25)具有低粘度的特点,从而允许在发酵中使用低功率输入和/或剪切以迎合在一些由于物理损伤产物分子因而剪切压力对产量具有致命性损害的情况下的氧需求。在高蛋白质产量时的低生物量显示了一种更有效的将发酵培养液转化为产物的有机体。因此,金孢子菌属真菌在提供至少同样多蛋白质的同时提供了更好的生物量和粘度数据,实际上比所用的优于通常所保藏的曲霉和T.reesei的两个商业真菌表达系统产生的蛋白质多得多。
由C.lucknowense(UV18-25)所产生的高蛋白质产量低生物量浓度可能允许在发酵条件达到极限之前发展具有更高生物量的发酵条件以生产目的产物,如果增加生物量导致产量提高的话。
由于现有的生物量和粘度水平已经接近实际的极限发酵条件,由T.longibrachiatum和黑曲霉所产生的现有的高水平的生物量和粘度水平限制了生物量的提高。
金孢子菌属真菌、木霉和Tolypocladium转化比较的实施例
在两种培养基(pH6.8的GS培养基和pH6.8的Pridham琼脂(PA)培养基)上测试了两株未转化的金孢子菌属C1菌株和一株T.reesei参考菌株。在培养了7天的PDA培养皿上收获孢子以检测其抗生素抗性水平。所选择的培养皿置于32℃孵育并于第2、4和5天后测量其数值。发现C1菌株NG7C-19和UV18-25很明显对腐草霉素和潮霉素的基础抗性水平很低。这个抗性水平等同于常用的T.reesei实验室参考菌株的抗性水平。因此,很明显这两种标准的真菌选择标记可以很好地应用于金孢子菌属真菌菌株。其它标准的真菌选择标记所带来的问题应该不会出现。
在50毫克/毫升时成功地选择出了Sh ble(腐草霉素抗性)转化的金孢子菌属真菌菌株。这也是用于T.reesei的选择水平,因此表明在金孢子菌属真菌中可以很容易地达到差示选择。150毫克/毫升时,上面的讨论同样适用于带有潮霉素抗性的转化菌株。
表C
|
Gs培养基pH6.8 |
Pridham琼脂培养基pH6.8 |
|
NG7C-19 |
UV18-25 |
T.r.11D5 |
NG7C-19 |
UV18-25 |
T.r.11D5 |
腐草霉素潮霉素 |
7.5μg/ml7.5-10μg/ml |
10μg/ml10μg/ml |
5-7.5μg/ml10μg/ml |
2.5μg/ml15μg/ml |
10μg/ml25μg/ml |
2.5μg/ml15μg/ml |
在普遍使用的真菌转化技术的基础上原生质体转化技术被用于金孢子菌属真菌。在一个直径为55毫米的PDA培养皿上所有的孢子被收获到8毫升的IC1培养液中并转移入带有50毫升IC1培养液的摇瓶中,35℃200转/分钟孵育15小时。然后对培养物离心,沉淀用MnP溶液洗涤,然后重悬于10毫升MnP和10毫克/毫升的C3Caylase的溶液中并于35℃振荡(150转/分钟)孵育30分钟。
过滤溶液,滤液3500转/分钟离心10分钟。用10毫升的MnPCa2+溶液洗涤沉淀。然后于25℃再离心10分钟后加入50微升预冷的PMC溶液。混合物置于冰浴30分钟后加入2.5毫升PMC溶液。室温15分钟后处理的原生质体与3毫升软MnR混合并立即涂布于含有选择因子腐草霉素或潮霉素的MnR培养皿上。30℃孵育5天后分析转化体(48小时以后肉眼可见克隆),使用10微克pAN8-1参考质粒来测定转化效率。结果见下表D。
表D:转化效率(使用10微克pAN8-1参考质粒)
|
T.reesei |
NG7C-19 |
UV18-25 |
成活力 |
106/200微升 |
5×106/200微升 |
5×106/200微升 |
每200微升的转化体数 |
2500 |
104 |
104 |
每106活细胞的转化体数 |
2500 |
2000 |
2000 |
结果表明金孢子菌属真菌的转化体成活力优于木霉的转化体成活力。菌株的转化能力是等同的,因此在一个实验中金孢子菌属真菌所得到的转化体数目是T.reesei的4倍。所以金孢子菌属真菌转化系统不但等同于常用的T.reesei系统,而且甚至要优于T.reesi系统。这种提高对转化效率比pAN8-1低的载体是非常有用的。这些低效转化载体的实施例如通常产生少于此10倍转化体的用于生产非真菌蛋白质的载体蛋白质载体。
用同源的金孢子菌属真菌蛋白质编码序列,也用异源蛋白质编码序列构建了许多其它的转化和表达载体,以用于金孢子菌属真菌转化实验。在图6-11中提供了载体图谱。
待表达的同源蛋白质选自由金孢子菌属真菌产生的由属于家族6(分子量43kDa)的内切葡聚糖酶6组成的纤维素酶,异源蛋白是由青霉产生的属于家族12(分子量25kDa)的内切葡聚糖酶3。
PF6g包含与内切葡聚糖酶6信号序列连接的金孢子菌属真菌内切葡聚糖酶6启动子片段,框内与内切葡聚糖酶6开放读码框连接,其后是内切葡聚糖酶6的终止子序列。通过与选择载体共转化来挑选转化体。
PUT1150包含与内切葡聚糖酶6信号序列连接的T.reesei纤维二糖水解酶启动子,框内与内切葡聚糖酶开放读码框连接,其后是T.reesei纤维二糖水解酶的终止子序列。此外,此载体携带带有选择标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。
PUT1152包含与内切葡聚糖酶6信号序列连接的构巢曲霉甘油醛-3-磷酸脱氢酶启动子,框内与内切葡聚糖酶6开放读码框连接,其后是构巢曲霉色氨酸合酶(trpC)的终止子序列。此外,此载体携带带有选择标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。
PUT1155包含与T.reesei纤维二糖水解酶信号序列连接的构巢曲霉甘油醛-3-磷酸脱氢酶A启动子,框内与连接至内切葡聚糖酶6开放读码框的Sh ble载体蛋白连接,其后是构巢曲霉色氨酸合酶(trpC)的终止子序列。这个载体使用了将载体蛋白融合至目的蛋白的技术,这大大增加了我们所感兴趣的蛋白的分泌。
PUT1160包含与T.reesei纤维二糖水解酶信号序列连接的构巢曲霉甘油醛-3-磷酸脱氢酶A启动子,框内与连接至青霉的内切葡聚糖酶3开放读码框的Sh ble载体蛋白连接,其后是构巢曲霉色氨酸合酶(trpC)的终止子序列。
PUT1162包含与内切葡聚糖酶3信号序列连接的T.reesei纤维二糖水解酶启动子,框内与青霉的内切葡聚糖酶3开放读码框连接,其后是T.reesei纤维二糖水解酶的终止子序列。此外,此载体携带带有选择标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。
表E:比较转化
载体 |
菌株 |
转化 |
转化体数目 |
在液体培养中测定的数目 |
pUT1150pUT1152pF6gpUT1162 |
UV18-25T.geodesUV18-25T.geodesUV18-25T.geodesUV18-25T.geodes |
腐草霉素选择腐草霉素选择pAN8.1共转化pAN8.1共转化pAN8.1共转化pAN8.1共转化腐草霉素选择未做 |
28514439845252127>400 |
555465 |
表E显示了转化金孢子菌属真菌UV18-25和Tolypocladiumgeodes菌株的结果。所用的转化方法见异源转化那一节。
金孢子菌属真菌菌株异源和同源表达的实施例
已经测定了C1菌株(NG7C-19和/或UV18-25)分泌各种异源蛋白的能力:细菌蛋白(Streptoalloteichus hindustanus腐草霉素抗性蛋白,Sh ble)、真菌蛋白(T.reesei木聚糖酶II,XYN2)和人体蛋白(人溶菌酶,HLZ)。
此方法的详细细节如下:
[1]C1菌株分泌Streptoalloteichus hindustanus腐草霉素抗性蛋白(Sh ble)
已经用pUT720质粒1转化C1菌株NG7C-19和UV18-25。此质粒带有以下真菌表达盒:
—构巢曲霉甘油醛-3-磷酸脱氢酶A(
gpdA)启动子2
—合成的T.reesei纤维二糖水解酶I(
cbh1)信号序列1,3
-Streptoalloteichus hindustanus腐草霉素抗性基因
Sh ble 4
—构巢曲霉色氨酸合酶(
trpC)终止子5
此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大肠杆菌复制起点。图2中提供了详细的质粒图谱。
根据Durand等7的方法转化C1原生质体。适应C1菌株(培养基和溶液到处有售):收获一个直径为90毫米的PDA培养皿上未转化C1菌株的所有孢子至8毫升的IC1培养液中,并转移入带有50毫升IC1培养液的摇瓶中,35℃150转/分钟孵育15小时。然后对培养物离心,用MnP溶液洗涤沉淀,重悬于10毫升MnP和10毫克/毫升的C3 Caylase的溶液中并于35℃振荡(150转/分钟)孵育30分钟。过滤溶液,滤液3500转/分钟离心10分钟。用10毫升的MnPCa2+溶液洗涤沉淀。然后3500转/分钟再离心10分钟,沉淀溶于1毫升的MnPCa2+溶液中。向200微升原生质体溶液中加入10微克pUT720DNA室温(约20℃)孵育10分钟。然后加入50微升预冷的PMC溶液。混合物置于冰浴30分钟后加入2.5毫升PMC溶液。室温15分钟后500微升处理的原生质体与3毫升软MnR混合并立即涂布于含有选择因子腐草霉素(pH6.5时50微克/毫升)的MnR培养皿上。30℃孵育5天后分析转化体(48小时以后形成肉眼可见克隆)。
用下列方法分析C1转化体(腐草霉素抗性克隆)所产生的Shble:牙签挑取基本转化体接种至含有腐草霉素(5微克/毫升)的GS平板上,32℃培养5天以确定其抗性。每一经过确认的抗性克隆被亚克隆到GS平板上。为了获得用于液体培养的孢子,将每个转化体的两个亚克隆接种至PDA平板上。在IC1液体培养液中27℃生长5天(200转/分钟摇动)。然后,对培养物离心(5000g,10分钟),收集500微升上清夜。用TCA使这些样品中的蛋白质沉淀下来并且重悬于样品缓冲液中至总蛋白浓度为4毫克/毫升(Lowry方法8)。10微升样品(约40微克总蛋白)上样至12%丙烯酰胺/SDS凝胶上然后电泳(伯乐微型电转印迹系统)。蛋白印迹是根据伯乐的说明(Schleicher和Schull 0.2微米膜)使用兔抗Sh ble抗血清作为一抗进行的。
图1和表F显示了实验结果。
表F:C1菌株中估测的Sh ble表达水平
|
蛋白印迹中所估测的Sh ble的数量 |
生产培养基中估测的Sh ble的浓度 |
未转化的NG7C-19 |
未测出 | |
NG7C-19∷720克隆4-1 |
25纳克 |
0.25毫克/升 |
NG7C-19∷720克隆5-1 |
25纳克 |
0.25毫克/升 |
NG7C-19∷720克隆2-2 |
250纳克 |
2.5毫克/升 |
未转化的UV18-25 |
未测出 | |
UV18-25∷720克隆1-2 |
500纳克 |
5毫克/升 |
UV18-25∷720克隆3-1 |
250纳克 |
2.5毫克/升 |
这些数据表明
1)来自pUT720的异源转录/翻译信号在金孢子菌属真菌中也是起作用的。
2)pUT720的异源信号序列在金孢子菌属真菌中也是起作用的。
3)金孢子菌属真菌可以用做分泌异源细菌蛋白的宿主。
[2]C1菌株分泌人溶菌酶(HLZ)
已经用pUT970G9质粒转化了C1菌株NG7C-19和UV18-25。此载体带有以下真菌表达盒:
—构巢曲霉甘油醛-3-磷酸脱氢酶A(gpdA)启动子2
—合成的T.reesei纤维二糖水解酶I(cbh1)信号序列1,3
—用做载体蛋白10的Streptoalloteichus hindustanus腐草霉素抗性基因
Sh ble 4
—克隆自pAN56-2质粒的黑曲霉葡糖淀粉酶(glaA2)铰链区11,12
—具有KEX2样蛋白酶裂解位点的连接肽(LGERK)1
—合成的人溶菌酶基因(hlz)10
—构巢曲霉色氨酸合酶(trpC)终止子5
此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大肠杆菌复制起点。图3中提供了详细的质粒图谱。
遵循已经在实施例1中描述的相同方法用pUT970G质粒转化C1原生质体。融合蛋白(Sh ble∷GAM铰链HLZ)是具有腐草霉素抗性的,因此可以很容易地选择C1转化体。而且,腐草霉素抗性水平与hlz表达水平密切相关。
用如下的溶菌酶活性分析方法来分析由C1转化体(腐草霉素抗性克隆)所产生的HLZ:牙签挑取基本转化体接种至含有腐草霉素(5微克/毫升)的GS平板(抗性确认)和LYSO平板(通过条带显色清除来检测HLZ活性1,10)上。将平板置于32℃培养5天。每一经过确认的抗性克隆被亚克隆到LYSO平板上。为了获得用于液体培养用的孢子,将每个转化体的两个亚克隆接种至PDA平板上。在IC1液体培养液中27℃生长5天(180转/分钟摇动)。然后,对培养物离心(5000g,10分钟)。根据Morsky等13的方法测量了这些样品的溶菌酶活性。
表G:C1菌株产生的活性HLZ水平
|
培养基中的活性HLZ浓度 |
未转化的NG7C-19 |
0毫克/升 |
NG7C-19∷970G克隆4 |
4毫克/升 |
NG7C-19∷970G克隆5 |
11毫克/升 |
未转化的UV18-25 |
0毫克/升 |
UV18-25∷970G克隆1 |
8毫克/升 |
UV18-25∷970G克隆2 |
4毫克/升 |
UV18-25∷970G克隆3 |
2毫克/升 |
UV18-25∷970G克隆2 |
2.5毫克/升 |
这些数据表明:
1)证实了实施例1中的第一点和第二点
2)Sh ble可以用做金孢子菌属真菌的抗性标志
3)Sh ble可以用做金孢子菌属真菌的载体蛋白
4)在金孢子菌属真菌中存在活性的KEX2样蛋白酶裂解位点(否则HLZ无活性)
5)金孢子菌属真菌可以用做分泌异源哺乳动物蛋白的宿主
[3]C1菌株分泌T.reesei木聚糖酶II(XYN2)
已经用pUT1064和pUT1065质粒转化了C1菌株UV18-25。
pUT1064质粒具有以下真菌表达盒:
第一个表达盒用于选择腐草霉素抗性转化体:
—粗糙脉孢霉交叉旁路控制基因(cpc-1)启动子14
-Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4
—构巢曲霉色氨酸合酶(trpC)终止子5
第二个表达盒是木聚糖酶产生表达盒:
-T.reeseiTR2株cbh1启动子15
-T.reeseiTR2株xyn2基因(包括其信号序列)16
-T.reeseiTR2株cbh1终止子15
此载体也携带来自pUC19质粒6的大肠杆菌复制起点。图4中提供了详细的质粒图谱。
pUT1065质粒具有以下真菌表达盒:
—构巢曲霉甘油醛-3-磷酸脱氢酶(gpdA)启动子2
—合成的T.reesei纤维二糖水解酶I(cbh1)信号序列1,3
—用做载体蛋白10的Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4
—具有KEX2样蛋白酶裂解位点的连接肽(LGERK)1
-T.reeseiTR2株xyn2基因(无信号序列)16
—构巢曲霉色氨酸合酶(trpC)终止子5
此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大肠杆菌复制起点。图2中提供了详细的质粒图谱。
遵循已经在实施例1中描述的相同方法用pUT1064和pUT1065质粒转化C1原生质体。pUT1065质粒中的融合蛋白(Sh ble∷XYN2)是具有腐草霉素抗性的,因此可以很容易地选择C1转化体。而且,腐草霉素抗性水平与xyn2表达水平密切相关。带有自己信号序列的xyn2被克隆到pUT1064质粒中。
用如下的木聚糖酶活性分析方法来分析由C1转化体(腐草霉素抗性克隆)所产生的木聚糖酶:牙签挑取基本转化体接种至含有腐草霉素(5微克/毫升)的GS平板(抗性确认)和XYLAN平板(通过观察透明区带来检测木聚糖酶活性17)上。将平板置于32℃培养5天。每一经过确认的抗性克隆被亚克隆到XYLAN平板上。为了获得用于液体培养用的孢子,将每个转化体的两个亚克隆接种至PDA平板上。在含有5克/升Kphtalate的IC1液体培养液中27℃培养5天(180转/分钟摇动)。然后,对培养物离心(5000g,10分钟)。根据Miller等18的方法,我们使用DNS技术测量了这些样品的木聚糖酶活性。
表H:C1菌株(最佳产量菌株)的活性XYN2生产水平
|
培养基中活性木聚糖酶II的浓度 |
培养基中木聚糖酶II的比活性 |
未转化的UV18-25 |
3.9单位/毫升 |
3.8单位/毫克总蛋白 |
UV18-25∷1064克隆7-1 |
4.7单位/毫升 |
4.7单位/毫克总蛋白 |
UV18-25∷1064克隆7-2 |
4.4单位/毫升 |
4.3单位/毫克总蛋白 |
UV18-25∷1065克隆1-1 |
29.7单位/毫升 |
25.6单位/毫克总蛋白 |
UV18-25∷1065克隆1-2 |
30.8单位/毫升 |
39.4单位/毫克总蛋白 |
这些数据表明:
1)证实了实施例2中的第一至第四点。
2)C1菌株可以用做分泌异源真菌蛋白的宿主。
[4]我们也列出了转化的UV18-25菌株的表达数据,其中表I显示了用于转化的质粒和结果。这个表说明不但用异源表达调控序列和信号序列可以得到内切葡聚糖酶和纤维二糖水解酶很高水平的表达,而且用同源表达调控序列和信号序列也可以。各种质粒的详细资料可在本文其它各处的叙述及图中找到。生产条件是35℃和碱性pH下。
表I:转化的UV18-25菌株的表达数据
培养 |
总蛋白 |
羧甲基纤维素酶 |
β-葡聚糖酶 |
PH值 |
|
mg/ml |
u/ml |
u/mg |
u/ml |
u/mg | |
*UV18-251150-23-301152-3-41160-2-4-11162-1-11F6g-20-25 |
100%94%96%94%100%69%73%92%102%112%104%- |
100%105%105%112%105%81%72%95%105%109%102%- |
100%111%110%120%105%118%98%103%103%98%98%- |
100%140%145%147%132%90%83%120%145%115%130%- |
100%149%151%156%132%131%114%130%142%103%125%- |
7.907.908.107.857.907.908.358.458.208.207.90- |
培养条件(摇瓶):88小时,35℃,230转/分钟。
*所有以上数据都是相对于亲本UV18-25菌株的百分数。
实施例附录:培养基
转化培养基:
Mandels碱: MnP培养基:
KH2PO4 2.0克/升 Mandels碱加
(NH4)2SO4 41.4克/升 肽胨1克/升
MgSO4.7H2O 0.3克/升 MES 2克/升
CaCl2 0.3克/升 蔗糖100克/升
微量元素 1.0毫升/升 调pH值至5
MnR: MnP Ca2+:
MnP+蔗糖 130克/升 MnP培养基+
酵母提取物 2.5克/升 CaCl2.2H2O 50mM
葡萄糖 2.5克/升 调pH值至6.5
琼脂 15克/升
软MnR:只加7.5克/升琼脂
MPC:
CaCl2 50mM pH5.8
MOPS 10mM
PEG 40%
用于选择和培养:
GS:
葡萄糖 10克/升
Biosoyase 5克/升 [Merieux]
琼脂 15克/升 调pH值至6.8
PDA:
马铃薯葡萄糖琼脂 39克/升 [Difco]
调pH值至5.5
MPG:
Mandels碱加
K.Phtalate 5克/升
葡萄糖 30克/升
酵母提取物 5克/升
加入50微克/毫升腐草霉素或100-150微克/毫升潮霉素的再生培养基(MnR)被用于选择转化体。加入5微克/毫升腐草霉素的GS培养基被用于证实抗生素抗性。
PDA是用于快速生长和产生孢子的完全培养基。用1/20的孢子悬液(在一个90毫米PDA平板上所有孢子收获到5毫升0.1%吐温中)接种液体培养基。在摇瓶中(200转)27℃培养。
C1蛋白的分离和鉴定
获得各种不同的蛋白质的方法被认为是蛋白质的许多特征。表A、B和J中提供了纯化方案和纯化过程的详细资料。使用与WO98/15633描述的方法,此方法引入本文做参考,类似的方法用DEAE-Toyotearl离子交换层析从金孢子菌属真菌培养物中分离蛋白质。从此层析中得到的非附着蛋白部分(F60-31CF)在平衡至pH7.6后用大量制备物离子交换层析纯化。收集非附着蛋白部分(NBNB),附着蛋白被洗脱至0.1M NaCl梯度中。NBNB部分提供了19、30、35和46kD的主要蛋白质和51kD的次要蛋白质。蛋白质峰从各个不同的部分被洗脱到0.1M NaCl梯度中。39-41部分包括28、36和60kD蛋白;44-48包括28、45和66kD主要蛋白带和33、36、55、60和67kD蛋白;49-51部分包括30、36、56和68kD蛋白;52-59部分包括33和55kD主要蛋白和28、36kD次要蛋白。收集的NBNB部分经Phenyl superose疏水层析进一步纯化。用pH7.0含有1.2M(NH4)2SO4的0.03M磷酸钠缓冲液平衡NBNB部分,然后上柱。吸附蛋白被洗脱至1.2M-0.6M(NH4)2SO4梯度溶液中。因此如同等电点为8.9的30kD的蛋白酶一样,就得到了分子量分别为30kD和51kD、等电点分别为9.1和8.7的同源木聚糖酶。
此木聚糖酶无MUF纤维二糖酶活性,因此是真正的木聚糖酶。30kD的碱性(等电点为9.1)木聚糖酶在一个非常宽的pH范围即pH5-8内具有高活性,在pH9-10时仍然维持65%的最大活性;它是木聚糖酶F家族中的一员;在SEQ ID NO.5中列出了其部分核苷酸和氨基酸序列。所描述的部分氨基酸序列对应于成熟蛋白N末端大约50-170位氨基酸位置。本发明的木聚糖酶与SEQ ID NO.5部分氨基酸序列具有至少60%,优选至少70%,最优选至少80%的序列相同性。可用SEQ ID NO.5的部分核苷酸序列鉴定相应的作为本发明优选实施方案的木聚糖酶启动子。51kD的木聚糖酶(等电点为8.7)在pH6时具有最大活性,在pH7.5时保持70%的活性,在pH8.0时保持至少50%的活性。它非常不稳定在pH5.5时只具有15%的活性,在pH7.5时只具有4%的活性。30kD木聚糖酶对桦木聚糖的Michaelis常数为4.2克/升,51kD木聚糖酶对桦木聚糖的Michaelis常数为3.4克/升。最适温度较高,两种木聚糖酶都达到了70℃。
30kD蛋白酶在50℃pH7时对NBNB部分蛋白的活性似乎等于0.4×10-3单位/毫升。此部分对染色的酪蛋白的活性为0.4单位/毫克(pH7)。加入尿素作为离液剂导致蛋白酶活性增加2-3倍。蛋白酶对木聚糖酶的效应是显著的。在pH10.3 50℃孵育30分钟后只保持了30%的木聚糖酶活性。在pH8时保持了95%的木聚糖酶活性。加入LAS导致木聚糖酶活性急剧降低,在pH8和pH10.3时孵育10分钟,无论有无蛋白酶抑制剂PMSF,只有50%的木聚糖酶活性保留下来。30kD的蛋白酶是碱性蛋白,其最适pH为pH10-11。其活性受到苯甲基磺酰氟(PMSF)而不是碘乙酸、胃蛋白酶抑制剂和EDTA所抑制说明它是丝氨酸类型的蛋白酶。在无离液剂、50℃中性pH条件下,蛋白酶对C1蛋白无活性。增加pH值和加入离液剂如LAS、SDS和尿素显著增加了蛋白酶解作用。
39-41部分是用Phenyl superose疏水层析纯化的。用pH7.2含有1.5M(NH4)2SO4的0.03M磷酸钠缓冲液平衡此部分,然后上柱。吸附蛋白被洗脱至1.5M-0M(NH4)2SO4梯度溶液中。因此得到了等电点为4.7的60kD同源木聚糖酶。此木聚糖酶对木聚糖、MUF-纤维二糖、MUF-木糖苷和MUF-乳糖苷具有活性。此木聚糖酶可能属于家族10(家族F)。此酶在pH5到8的范围内很稳定,50℃孵育24小时后其活性仍然大于80%。在pH5到7的范围内60℃孵育其保持70%的活性。在pH9时50℃孵育5小时仍然保持80%活性,24小时后保持35%活性。在pH10时50℃孵育0.5小时后保持60%活性。在pH8时60℃孵育5小时后发现其活性为45%,24小时后降为0。其最适pH范围为pH6-7,在pH9时保留70%活性,在pH9.5时保留50%活性。对桦木聚糖酶的Michaelis常数为0.5克/升。最适温度很高,达到了80℃。
44-48部分是用Mono P.A层析聚焦纯化的,7.63-5.96的pH梯度被用于洗脱蛋白。结果是得到了等电点为6的45kD内切葡聚糖酶。此45kD的内切酶在pH5时对羧甲基纤维素具有最大活性,在pH5-7时对RBB羧甲基纤维素具有最大活性。在pH6.5时此内切酶对羧甲基纤维素保持70%的最大活性,pH7.0时对RBB羧甲基纤维素保持70%的最大活性;在pH7时对羧甲基纤维素具有50%的最大活性,pH8时对RBB羧甲基纤维素具有50%的最大活性。对羧甲基纤维素的Michaelis常数为4.8克/升。最适温度很高,达到了80℃。其它28、33、36、55、60和65kD的蛋白也被混在一起洗脱下来。
52-58部分也是用Mono P.A层析聚焦纯化的,7.6-4.5的pH梯度被用于洗脱蛋白。得到了等电点为4.9的55kD内切葡聚糖酶。此55kD的内切酶是中性的。其最适pH值是4.5-6,在pH7.0时对羧甲基纤维素和RBB羧甲基纤维素均保持70%活性,在pH8时对羧甲基纤维素和RBB羧甲基纤维素均保持50%活性。对羧甲基纤维素的Michaelis常数为1克/升。最适温度很高,达到了80℃。许多部分也含有分子量为28、33和36kD的蛋白质。
使用Macro Prep Q层析从50-53部分得到了金孢子菌属真菌培养物的F 60-8UF部分,然后从吸附在DEAE Toyopearl上的F 60-8UF中分离得到了45、48和100kD蛋白。
用0.03M pH5.57的吲哚盐酸缓冲液平衡50-53部分,然后上柱。吸附蛋白被洗脱至0.1-0.25M NaCl梯度溶液中,置于梯度溶液中4小时。其结果是分离出了均质的45kD(等电点4.2)、48kD(等电点4.4)和100kD(等电点4.5)蛋白(图17)。
根据45kD蛋白对对硝基苯基-α-半乳糖苷和硝基苯基-β-半乳糖苷的活性推测它是一种α、β半乳糖苷酶。最适pH是4.5,在pH5.7时具有70%活性,在pH6.8时保留50%活性,最适温度为60℃(图18)。
48kD蛋白是对对硝基苯基-β-半乳糖苷有高活性和对MUF纤维二糖苷、MUF乳糖苷和对硝基苯基丁酸酯有活性的纤维二糖水解酶。48kD蛋白对CMC的最适pH为5,对RBB-CMC的最适pH为5-6(图19)。
等电点为4.5的100kD蛋白酶只对对硝基苯基丁酸酯具有活性。它可能是一种酯酶但不是阿魏酸酯酶,因为它对阿魏酸的甲基酯无活性。其最适pH为中性/碱性(pH8-9),最适温度为55-60℃(图20,21)。
等电点为4.2的90kD蛋白酶分离自结合蛋白部分,50℃pH7时所测量的其对NBNB部分蛋白的活性似乎等于12×10-3单位/毫升。此部分对染色的酪蛋白的活性为0.01单位/毫克(pH7)。在pH7和pH9(50℃)时加入尿素作为离液剂导致蛋白酶活性增加2-3倍。加入LAS也导致如此效果。90kD蛋白酶是中性的,其最适pH为8。其活性受苯甲基磺酰氟(PMSF),而不是碘乙酸、胃蛋白酶抑制剂和EDTA所抑制说明它是丝氨酸类型的蛋白酶。
等电点为4.2的43kD内切葡聚糖酶(33-37部分)、等电点为4.1的25kD内切葡聚糖酶(39-43部分)、等电点为4.9的55kD纤维二糖水解酶(39-43部分)和等电点为4.4的65kD多聚半乳糖醛酸酶(39-43部分)也从结合的蛋白部分分离出来。内切葡聚糖酶对微晶纤维素或MUF-纤维二糖苷并无活性,但对甲基纤维素、RBB羧甲基纤维素、羧甲基纤维素41、β-葡聚糖酶和内切葡聚糖酶具有较高活性。25kD内切葡聚糖酶不从羧甲基纤维素中产生葡萄糖,而43kD内切葡聚糖酶则从中产生。从微晶纤维素中不形成葡萄糖。43kD内切葡聚糖酶的最适pH是4.5,在pH7.2时具有70%最大活性,在pH8时只保留50%最大活性。在pH5和6时孵育25小时后43kD内切葡聚糖酶保留70%活性。在pH7孵育同样时间它只保留0%活性。25kD内切葡聚糖酶对羧甲基纤维素的活性最适pH为5,对RBB羧甲基纤维素活性最适pH较宽,在pH9时具有90%最大活性,在pH10时保留50%最大活性。在pH5和6时孵育120小时后保持100%活性,在pH7、8、8.6和9.6孵育同样时间它仍保留80%活性。25kD内切葡聚糖酶的活性最适温度为70℃。43kD内切葡聚糖酶的活性最适温度为60℃。对羧甲基纤维素的Michaelis常数分别是25kD内切葡聚糖酶62克/升,43kD内切葡聚糖酶12.7克/升。多聚半乳糖醛酸酶是一种果胶酶。对PDA的Michaelis常数为3.8克/升。PGU活性的最适pH范围为pH5-7,最适温度为50-65℃。
编码金孢子菌属真菌蛋白的基因可以用PCR技术得到并通过序列分析鉴定。相应的全基因是通过用分离出的PCR片段筛选(部分)基因库而获得的。已经克隆、测序和分析了C1菌株的43kD内切葡聚糖酶(EG6,家族6)的全基因(包括2.5kb启动子区和0.5kb终止子区)。在SEQ ID NO.1中列出了其核苷酸和氨基酸序列。预测成熟蛋白的分子量为39427道尔顿,等电点为4.53,与实际测量值很接近。与6.2家族的其它糖基水解酶的蛋白质序列比较分析表明C1-EG6并不包括纤维素结合结构域(CBD)。使用SwissPort SAMBA软件(史密斯和沃特曼公式,Gap penalty 12/2,alignment 10,blosum62matrix)进行的同源分析表明C1-EG6与Oxysporum镰孢霉(多于376个氨基酸)具有51.6%的相同性,与Agaricus bisporua CBH3(多于353个氨基酸)具有51.0%的相同性,与T.reeseiCBH2(多于367个氨基酸)具有50.7%的相同性。推测从第1位蛋氨酸到第28位精氨酸为信号序列。启动子具有几个潜在的CreA结合位点,所以启动子很可能在一个CreA调控的真菌菌株中受到葡萄糖抑制。
同样的,已经克隆、测序和分析了C1菌株的25kD内切葡聚糖酶(EG5,家族5)的全基因(包括3.3kb启动子区和0.7kb终止子区)。在SEQ ID NO.2中列出了其核苷酸和氨基酸序列。预测成熟蛋白的分子量为21858道尔顿,等电点为4.66,与实际测量值很接近。这是目前已知的最小的真菌内切葡聚糖酶。与家族45的其它糖基水解酶的蛋白质序列比较分析表明C1-EG5既不包括纤维素结合结构域(CBD),也不包括Cohesin/dockerin结构域。使用NCBI-BLASTP2软件(Gap penalty 11/1,alignment 10,blosum62 matrix)进行的同源分析表明与C1-EG5最接近的蛋白是Oxysporum镰孢霉,具有63%的相同性。推测从第1位蛋氨酸到第18位丙氨酸为信号序列。启动子具有许多潜在的CreA结合位点,所以启动子很可能在一个CreA调控的真菌菌株中受到葡萄糖抑制。
而且,在纤维素酶家族12同源分析的基础上通过PCR技术发现了另外一个内切葡聚糖酶。在SEQ ID NO.3中列出此内切葡聚糖酶(EG3,家族12)的部分核苷酸和氨基酸序列。
55kD蛋白是对MUF-纤维二糖苷、MUF-乳糖苷、FP和微晶纤维素具有活性,也对对硝基苯-β-葡糖苷、纤维二糖和对硝基苯乳糖苷有活性的纤维二糖水解酶(本文参做CBH1)。其对MUF-纤维二糖苷的活性受到纤维二糖抑制。抑制常数为0.4mM。对MUF-纤维二糖苷的Michaelis常数为0.14mM,对MUF-乳糖苷的Michaelis常数为4mM,对羧甲基纤维素为3.6克/升。最适pH相当宽,从pH4.5到7皆可。在pH8时对羧甲基纤维素具有50%最大活性,对RBB羧甲基纤维素具有80%活性。在pH5-8时孵育25小时后保持70-80%活性。最适温度为60-70℃。CBH1可能是纤维二糖水解酶家族7的一员;在SEQ ID NO.4中列出了其部分核苷酸和氨基酸序列。所类出的部分氨基酸序列对应于成熟蛋白N末端300-450位氨基酸位置。本发明的纤维二糖水解酶具有SEQ ID NO.4部分氨基酸序列至少60%,优选至少70%,最优选至少80%的序列相同性。可用SEQ IDNO.4中的部分核苷酸序列鉴定相应的作为本发明优选实施方案的CBH启动子。在微晶纤维素水解过程中观察到了25kD内切葡聚糖酶和55kD CBH之间的协同效应。在25kD内切葡聚糖酶与55kD CBH的比例为80∶20时协同效应最大。Ksyn最大值为1.3。
表J
纯化方案
F60-8(UF-conc)和F60-31CF样品的纯化
通过RNA印迹分析研究了金孢子菌属真菌的5个主要基因的表达水平。在33℃时各种不同的C.lucknowense菌株生长于含有pharmedia纤维二糖和乳糖的丰富培养基(培养基1)和含有pharmedia和葡萄糖的丰富培养基(培养基2)中。48小时后,收获菌丝体分离RNA。用5种不同的探针EG5、EG6、EG3、XylF和CBH与RNA杂交。爆光后剥离RNA印迹,与作为印迹中mRNA数量对照的核酶L3探针再次杂交。在培养基1中生长的许多菌株表现出对CBH很高的反应和对XylF的高反应。在培养基2中生长的半数菌株对所有基因都表现出高反应性,剩下的一半反应较低。从这些数据推断表达强度的顺序为CBH>XylF>EG5>EG3>EG6。
表A、B和J中显示了以上的详细数据。
图的说明:
图1是实施例中所描述的蛋白印迹。
图2是pUT720图谱。
图3是pUT970G图谱。
图4是pUT1064图谱。
图5是pUT1065图谱。
图6是pF6g图谱。
图7是pUT1150图谱。
图8是pUT1152图谱。
图9是pUT1155图谱。
图10是pUT1160图谱。
图11是pUT1162图谱。
图12:DEAE-Toyopearl纯化F 60-31CF样品后对NB部分进行Macro Prep Q离子交换层析。
图13:来自F-60-31CF样品的NB部分的酶活性的pH依赖性。
图14:来自F-60-31CF样品的NB部分的酶在pH5.5和7.5(60℃)时的稳定性。
图15:来自F-60-31CF样品的NB部分的60kD Xyl(pI4.7)Z 60℃和50℃时的pH稳定性。
图16:来自F-60-31CF样品的NB部分的酶的温度依赖性。
图17:在F-60-8样品DEAE-Toyopearl后结合部分50-53的Macro Prep Q的离子交换层析。
图18:F-60-43,UF-conc.的α-半乳糖苷酶活性的pH和温度依赖性。
图19:来自F-60-8UF-conc.的结合部分的48kD CBH(pI4.4)的活性的pH依赖性。
图20:F-60-8UF-conc.针对对硝基苯基丁酸酯的活性的温度依赖性。
图21:F-60-8UF-conc.针对对硝基苯基丁酸酯的活性的pH依赖性。
图22:30kD(pI8.9)和90kD(pI4.2)蛋白酶对C1蛋白的活性的pH过程(50℃,孵育30分钟)。
图23:50℃时30kD(pI8.9)“碱性”蛋白酶对F60-31CF的NBNB部分(Macro Prep Q)木聚糖酶活性的影响。
图24:50℃时90kD(等电点4.2)“中性蛋白酶”对F 60-8UF-conc样品的结合部分#44-45(DEAE-Toyopearl)蛋白的羧甲基纤维素活性的影响。
图25:65kD多聚半乳糖醛酸酶(等电点4.4)完全水解多聚半乳糖醛酸:50℃,pH4.5,PGA浓度为5克/升,蛋白浓度为0.1克/升。
图26:F 6043UF-conc多聚半乳糖醛酸酶活性的pH和温度依赖性。
图27:纤维二糖抑制55kD CBH(等电点4.4)对MUF-纤维二糖苷的活性:pH4.5,40℃。
图28:25kD内切葡聚糖酶(等电点4.1)和55kD CBH(等电点4.4)对微晶纤维素的协同效应(40℃,pH5,25分钟)。
图29:从F 60-8UF-conc样品的附着部分分离出的酶对羧甲基纤维素(a)和微晶纤维素(b)的完全水解(50℃,pH5):羧甲基纤维素和微晶纤维素浓度为5克/升,25kD内切葡聚糖酶浓度为0.01克/升,43kD内切葡聚糖酶浓度为0.02克/升;1代表25kD内切葡聚糖酶(等电点4.1),2代表43kD内切葡聚糖酶(等电点4.2)。
图30:无(a)或有(b)δ葡糖酸内酯时55kD CBH(等电点4.4)对羧甲基纤维素(1)和微晶纤维素(2)的完全水解(50℃,pH4.5):羧甲基纤维素和微晶纤维素浓度为5克/升,蛋白浓度为0.1克/升,δ葡糖酸内酯浓度为5克/升。
图31:从F 60-8UF-conc样品中分离出的酶对羧甲基纤维素和RBB羧甲基纤维素酶活性的pH依赖:1代表25kD内切葡聚糖酶(等电点4.1),2代表43kD内切葡聚糖酶(等电点4.2)。
图32:55kD CBH(等电点4.4)的羧甲基纤维素酶和RBB羧甲基纤维素酶活性的pH依赖。
图33:从F 60-8UF-conc样品的结合部分分离出的酶羧甲基纤维素酶活性(pH4.5)的温度依赖:1代表55kD CBH(等电点4.4),2代表25kD内切葡聚糖酶(等电点4.1),3代表43kD内切葡聚糖酶(等电点4.2)。
图34:从F 60-8UF-conc样品的结合部分分离出的酶的pH稳定性:1代表55kD CBH(等电点4.4),2代表25kD内切葡聚糖酶(等电点4.1),3代表43kD内切葡聚糖酶(等电点4.2)。
图35:从F 60-8UF-conc样品的结合部分分离出的酶的吸附。
参考文献(内容引入本文做参考):
1.Calmels T.P.,Martin F.,Durand H.,和Tiraby G.(1991)在真菌中对分泌蛋白处理过程中发生的蛋白酶解作用。生物工艺学杂志17(1):51-66。
2.Punt P.J.,Dingemanse M.A.,Jacobs-Meijsing B.J.,Pouwels P.H.,和Van den Hondel C.A.(1988)构巢曲霉甘油醛-3-磷酸脱氢酶基因的分离和鉴定。基因69(1):49-57。
3.Shoemaker S.,Schweickart V.,Ladner M.,Gelfand D.,KwokS.,Myambo K.,和Innis M.(1983)来自T.reesei的异源纤维二糖水解酶的分子克隆。Bio/Technology 10:691-696。
4.Drocourt D.,Calmels T.,Reynes J.p.,Baron M.,和Tiraby G.(1990)用于转化具有较打或较高腐草霉素抗性真核生物的Streptoalloteichus hindustanus ble基因表达盒。核酸研究18(13):4009。
5.Mullaney E.J.,Hamer J.E.,Roberti K.A.,Yelton M.M.,和Timberlake W.E.(1985)构巢曲霉trpC基因的一级结构。Mol GenGenet 1999(1):37-45。
6.Yanisch-Perron C.,Vieira J.和Messing J.(1987)改进的M13噬菌体克隆载体和宿主菌株:M13mp18和pUC19载体的核酸序列。基因33:103-119。
7.Durand H.,Baron M.,Calmels T.和Tiraby G.(1988)经典遗传学和分子遗传学用于选择具有改进的纤维素分解活性的T.reesei工业菌株,纤维素酶降解的生物化学和遗传学,J.P.Aubert,编者。AcademicPress135-151。
8.Lowry O.H.,Rosebrough N.J.,Farr A.L.,和Randall R.J.(1951)用氟林酚试剂测量蛋白质。生命的化学杂志193,265-275。
9.Parriche M.,Bousson J.C.,Baron M.,和Tiraby G.在丝状真菌中发展异源蛋白分泌系统,第3届欧洲真菌遗传学会议,1996。慕斯特,德国。
10.Baron M.,Tiraby G.,Calmels T.,Parriche M.和DurandH.(1992)Tolypocladium真菌有效分泌与Sh ble腐草霉素抗性蛋白融合的人溶菌酶。生物工艺学杂志24(3):253-266。
11.Jeenes D.J.,Marczinke B.,MacKenzie D.A.,和Archer D.B.(1993)一个用于黑曲霉分泌异源蛋白的截短的葡糖淀粉酶融合。FEMSMicrobiol.Lett.107(2-3):267-271。
12.Stone P.J.,Makoff A.J.,Parish J.H.,和Radford A.(1993)粗糙脉孢霉的葡糖淀粉酶基因的克隆和序列分析。现代遗传学24(3):205-211。
13.Morsky P.(1983)用Lysodeikticus微球菌细胞比浊法测量溶菌酶:对反应条件的再检查。分析生物化学128:77-85。
14.Paluh J.L.,Orbach M.J.,Legerton T.L.,和Yanofsky C.(1988)粗糙脉孢霉交叉旁路控制基因cpc-1编码与酵母GCN4相似的蛋白和癌基因v-jun编码的蛋白的DNA结合结构域。Proc Natl Acad Sci USA85(11):3728-32。
15.Nakari T.,Onnela M.L.,Ilmen M.,Nevalainen K.和PenttilaM.(1994)葡萄糖存在时有活性的真核启动子。专利WO 94/04673,Alko。
16.Torronen A.,Mach R.L.,Messner R.,Gonzalez R.,KalkkinenN.,Harkki A.和Kubicek C.P.(1992)T.reesei的两种主要的木聚糖酶:两种酶和基因的鉴定。生物工艺学(NY)10(11):1461-5。
17.Farkas V.(1985)检测产生纤维素酶和木聚糖酶的微生物的新的培养基。FEMS Microbiol.Letters 28:137-140。
18.Miller G.L.(1959)使用二硝基水杨酸试剂测定还原糖。分析化学31:426-428。
19.Punt P.J.,Mattern I.E.,van den Hondel C.A.M.J.J.(1988)一种带有腐草霉素抗性的曲霉转化载体。真菌遗传学通讯35,25-30。
金孢子菌序列
SEQ ID No.1:
C1-EG6″43kD″(家族6)是基于“43kD Endo”蛋白测序及家族6纤维素酶同源性分析而经PCR获得。
-2508 GGATCCACACCTACCATACCGGATAGTATGCTACCCAAGTGACATAGG -2461
GTTGGTAAAGTAATACGAGAACTCAGAGAGCACTGCCCATATGGCTCGCCAATGACCTCA -2401
AGTGCCAGGTCAGCTTTGCGAGACAGACCTGAGCGCGTCGGATGTGTGACATGGAACGCG -2341
CCGGATCGCCTTGTTGATTAATTATAGGGAAGTAGCGAGGAAGGTTTCAGCAATTGACGT -2281
GAGCGTACATTAAAAGCTGTATGATTTCAGGAAGACGAGCCATGGACCAGGTTTCAAGGC -2221
TGAATGGCTTGACGACTTAAGCACCGAACGAGGAATGAAAGAATGAAAAGTGGGGGATCA -2161 creA
TTCTGGCCCCTCCTCGTATGTCGAGTGTTAAAGAAGGCGGTTCTACGGAGGACCTAAAGA -2101
GCTCCAATTTGCTCTGTTGAGCTTAAGCCACATATCTCAAGATGAATACATGTCAGGCAT -2041
AGTCACCCTGATCTTGTTCATCAGTCCACACACTTTTCAGTTCAGCATGTTGATTCCTCA -1981
TCCATATCACTTTCCATTACTATCTCTTTATGTCCTTGGTCAAGACTCCAAGGAACCGAT -1921
AGGTGAGCATCGGTGAGGCTCCCTCAAGGTACCAAAGTAGCCATCATCACCGAGGTCTGG -1861
GAATGGCGCCGTGCCCGATCTGAGTCCTCCAACTCCACGGTACGACGACAGCACGTCACA -1801
TTGACGCACCACGGTTGAACAAGCAGAGAGGGACACGTCTTGCTACGCGAATCCTGGCAC -1741
TGGATGGAGACGCGTGTGAGCAGGTTTCCGGAACCATGACGGCCTGGTCCGGCTTCTCGA -1681
ACAAAGAAGTGGAACACAAAAAGAACCGAAACGGAAACGCAGGCACGGCATCGACGACCG -1621
GATTGTCCCACGGGGACCTCGGCCAGTCAAGCGTTGCCCTGGCCGTCAGCTCCCTGGCGA -1561
CGGGGATTCAGCACATCTCACGTTATAGGCGACCTCATCCCCCTTCCGTCTTGTGCGGTC -1501
GTTGCTCCGTGCCGAGTACCCAGGCGTGCCGGGGCCTTTAGCCGGGGCGGAATCAGAGTC -1441 creA
AAGATGCGGCCGAATTGGACGGCAGACGAAGTTTCGTAGAGGGTCATGATCGGCACTGAC -1381
GACACCCACCCCTGCGTGATCCCGTGGCCCTGGGCTGGGAATTGCCGGCTAATAATCTAC -1321
GGCTTAATAGATATGCACTTTGCACGCGGTGCAGATAAATAAGCTGTGGTTTCAAACACT -1261
GGCCTCCGTACTTTACCCACCAACTGCCGCTTAGCGCCGGGACCTGAGTCTTGGGAGTGC -1201
GCGGAGCGGCAGCCACCTCGGGTTAGCGTACACACGACGGCTGCATGCGGGGATGCCGCG -1141 creA
TGCATGGCTTCATAGTGTACGACAGACCGTCAAGTCCAAATCTGGGTGATGCTTGATGAG -1081 creA
ATGACAGCGAGCCCCGTCGGCGGCACCCCGGCTATGCATCGCGAATTGACAACACTCTCA -1021
GCTCTATTGCGACCCATCGGATAAAAGAAGAAGAAAAAAATGGACCTTGAGTACGGGCGT -961
CAGAAACCAAAAAAAAACTCCGGAACCAAATATGTCGGGCATGGCCGGGGTGAACGACCG -901
CTACTCCCCGTTCCCTTCTTCGCAAACAGAACGCTACAGAGGGTTTTCTGGTTTGTCAAA -841
GAGTTCGGAGGTCCTCTGCTCCGCGAATGCGTGGTGAACCCACCAGCAGCCATTGTTCTT -781
GCATGCGTGGCGGACCGTTAGCCGCTGATCGACATGGCGAGCTTCCCACCTCAGACCTGG -721 creA
AGCAGACGGTTGCGAGGAGCAAGGGGCTGCCCTCCCCCTGACGGTCGGACCCCAATGACT -661
TCCCCAAACGGGGACATCGAGGGTCGTGCATGATGGTGGAAAGTAGTTGCAGTATGGGAA -601
GTACCCCGGGTTGCCAGGAACCGTTGTTCGGCCCCCCACATTTTCTCTCTGCCATGTCAA -541
CTGTGTGTCGTTCGAGAGTTCCTGGCTCCGGCCCCCCGTCCAATTCCCTAACGGGACCGC -481 creA
GGGGCATCGCCTGTAACTAACTTCCAAATGAAGCCGGATATGAGGGAGGGAGATTGGATC -421
TGGCAAGCCAGCCATTCGCTGCGATCGGCACTCGTCCGTCAGCCCCGCAGTCCATATCCC -361 areA
CAAAGGCAACTGCTCGGCGCGGCTCAAGTCTTCTTCGGAACGTCCAGCCCGAAGGCGCGC -301
GCCAGCACCGGCCCTATGTTCCTGATTGCGATCCTCGATCTCCAGAGACGGGTCACCTCG -241
CCTCGAGGACGGTGCAGGGGCATCGGCTTCGCTTCCTAGAGCTCCGGGCTGTGTGTGGTC -181
AAGGGGAGAAGGCGGCGGCGCCAAGGTGCGTCTCGGCGCACTCACCCATCGCCTTTACCC -121
CCCTCCCCCCCAGTATATAAAAGATGGCCATCGTCTCCTCGTCTGCTTGGGAAGAAAGGA -61
TCTCTCGACCATGCACCACAGCCTAGCTCTAACCCAGCTTGTCGTGTGTTGTTGCCCAGC -1 转录起始
ATGAAGTTCGTGCAGTCCGCCACCCTGGCGTTCGCCGCCACGGCCCTCGCTGCGCCCTCG +60 推测的信号序列
M K F V Q S A T L A F A A T A L A A P S 20
CGCACGACTCCCCAGAAGCCCCGCCAGGCCTCGGCGGGCTGCGCGTCGGCCGTGACGCTC +120
R T T P Q K P R Q A S A G C A S A V T L 40
GATGCCAGCACCAACGTGTTCCAGCAGTACACGCTGCACCCCAACAACTTCTACCGTGCC +180
D A S T N V F Q Q Y T L H P N N F Y R A 60
GAGGTCGAGGCTGCCGCCGAGGCCATCTCCGACTCGGCGCTGGCCGAGAAGGCCCGCAAG +240
E V E A A A E A I S D S A L A E K A R K 80
GTCGCCGACGTCGGTACCTTCCTGTGGCTCGACACCATCGAGAACATTGGCCGGCTGGAG +300
V A D V G T F L W L D T I E N I G R L E 100
CCCGCGCTCGAGGACGTGCCCTGCGAGAACATCGTGGGTCTCGTCATCTACGACCTCCCG +360
P A L E D V P C E N I V G L V I Y D L P 120
GGCCGTGACTGCGCGGCCAAGGCCTCCAACGGCGAGCTCAAGGTCGGCGAGCTCGACAGG +420
G R D C A A K A S N G E L K V G E L D R 140
TACAAGACCGAGTACATCGACAgtgagttaaccctttgtggccccttcttttcccccgag +480 内含子 1
Y K T E Y I D 147
agagcgtctggttgagtggggttgtgagagagaaaatggggcgagcttaaagactgacgt +540
gttggctcgcagAGATCGCCGAGATCCTCAAGGCCCACTCCAACACGGCCTTCGCCCTCG +600
K I A E I L K A H S N T A F A L 163
TCATCGAGCCCGACTCGCTCCCCAACCTGGTCACCAATAGCGACCTGCAGACGTGCCAGC +660
V I E P D S L P N L V T N S D L Q T C Q 183
AGAGCGCTTCCGGCTACCGCGAGGGTGTCGCCTATGCCCTCAAGCAGCTCAACCTCCCCA +720
Q S A S G Y R E G V A Y A L K Q L N L P 203
ACGTGGTCATGTACATCGATGCCGGCCACGGTGGCTGGCTCGGCTGGGACGCCAACCTCA +780
N V V M Y I D A G H G G W L G W D A N L 223
AGCCCGGCGCCCAGGAGCTCGCCAGCGTCTACAAGTCTGCTGGTTCGCCCTCGCAAGTCC +840
K P G A Q E L A S V Y K S A G S P S Q V 243
GCGGTATCTCCACCAACGTGGCTGGTTGGAACGCCTGgtaagacactctatgtccccctc +900 内含子 2
R G I S T N V A G W N A W 256
gtcggtcaatggcgagcggaatggcgtgaaatgcatggtgctgacctttgatcttttccc +960
cctcctatagGGACCAGGAGCCCGGTGAGTTCTCGGACGCCTCGGATGCCCAGTACAACA +1020
D Q E P G E F S D A S D A Q Y N 272
AGTGCCAGAACGAGAAGATCTACATCAACACCTTTGGCGCTGAGCTCAAGTCTGCCGGCA +1080
K C Q N E K I Y I N T F G A E L K S A G 292
TGCCCAACCACGCCATCATCGACACTGGCCGCAACGGTGTCACCGGTCTCCGCGACGAGT +1140
M P N H A I I D T G R N G V T G L R D E 312
GGGGTGACTGGTGCAACGTCAACGGCGCCGGCTTCGGTGTGCGCCCGACTGCCAACACTG +1200
W G D W C N V N G A G F G V R P T A N T 332
GCGACGAGCTCGCCGACGCCTTCGTGTGGGTCAAGCCCGGTGGCGAGTCCGACGGCACCA +1260
G D E L A D A F V W V K P G G E S D G T 352
GCGACTCGTCGGCGGCGCGCTACGACAGCTTCTGCGGCAAGCCCGACGCCTTCAAGCCCA +1320
S D S S A A R Y D S F C G K P D A F K P 372
GCCCCGAGGCCGGTACCTGGAACCAGGCCTACTTCGAGATGCTCCTCAAGAACGCCAACC +1380
S P E A G T W N Q A Y F E M L L K N A N 392
CGTCCTTCTAAGCTCCTCGACGGCTTCTTGCTGTCAGTCGCTCTGACGGTGGTGTGCTGG +1440 t49
P S F * 395
TGGTGCCCCTGCTCCTGCTGCTGCTGCTCCGCGGGGAGGGGAGGCAACGAAAATGAAGTC +1500 t109
CTGCTTCAAAACAAAACAGAAACAAGCGAGGCGCGGTGCAATGGTCGTGCGTTCGTCTTT +1560 t169
TTTCATGTTCCCTTCTAGTGTAGTAGTTTGATAGTCGTACATAAGGGGTTTCAGAACCGT +1620 t229
CTCTCTGTCTCGGTCTTTTTGCGAGTTGTTGCGACTCGTGATTATGGCCTTTGTTGCTCG +1680 t289
TTGCGGCAGAGTAGAACCACAGCGTGTTGGGGTAGCAGCTTGCTCCGTAGGACGTAGGGA +1740 t349
AACAACCTGAGACTCTGGAATTGCAGTCAGCCTGCGTCGCCCCTCTAGGAAACGAAGGGG +1800 t409
AGAACCAGTAGTGGCTGCAGCTTACAAACGCGAGCATGGTGAACATCTCCGAGAAAAGGG +1860 t469
AGGGATCC +1868 t477
BamHI
SEQ ID No.2:
C1-EG5″25kD″(家族45)基因,其是基于“25kD Endo”蛋白测序和家族45同源性分析而经PCR获得。
-3309 GCTTAGGAG -3301
AATCACGAGAAGCTAATTGGGCTCTATAGTATCCGACAAGATGACCCAGAGCGAGATTGA -3241
GGATCTCGAGGGAACCCTGAAGCAGAGCAGCAACAACGACACCAGCCTCCTCCGCGACCT -3181
GCTCGACAAGATTCCCGATGGCCTCCTCGGCGGCAACAACAAATCCAAGCTGGACGATAT -3121
CCAGAGCAACGCGCAGGCCGCGCAGATGGAGAACCTGAGCGTCTCGCCGCGGGAACCCGA -3061
GGAGCTGACCAGATACGTCCAGGAAGTGTTCCGTCAGATCATGCCCGCCATCAAGTTCCA -3001
TGACCAGCTTCTCCAGGACATCTCGGAGGCCATCGACAAGATCCCGGTGCTGCCCAAGAT -2941
TGTGGAGCAGCTGGAGGAGCAGATGTCCATCTTTGTATTCCAGATCATGGCCCCGTTCGT -2881 creA
GGTTCCGCTTATCGAGCAGATCAAGAACGAGCTCGCGACTGGCTCCAGCGAGATCATCCA -2821
GAGCAGCAGGGCTGAGCAGCACAACGTCTTTGAGGACGACAACGCCACCGACCCGACTCA -2761
CTCGATGTTGGCCAAGGACCACTTTAGTAACGTAAAGCCGACCCTAATCAGAAGCTCGCA -2701
TGTAGAATTGAGTTAGACTGACGCGACTTGTTTCCCGTCTCTGTAGATCCTCAACGAGAT -2641
CGGCGGTCGCGCCGCCTCCAAGGTCGTCTCCTGGGTCGTCCCGCAGCTCATGGAGGCCTG -2581
GGACGATGACAGCGTCGACGTGGACCGCCTGCTTGACAAGATCATTTACGGAGTGTTCCA -2521
CCATCCCGCGCAGCGCACCATGGGCCCTGAGGGGGCGTCCGAGGGCCGGGAGCTCATCTT -2461
CAACATGGTGCGCGAGTGGTGGGAGGACATGAGCGACGGGCAGCGCGACGAGTACCGGGG -2401 creA
CAAGCTGAGCCGCGAGGGAGTCGAGAGAGGCGACAACCACCGCGAGGGCCAGCACGACTG -2341
CGGCCACGGCTGCGGGGGCAAGCTCAAGATGCACAAGAACTTCCGGAACGAGGCGCCCCA -2281 creA
GACGGTAGAGGACCAGATCGCGGGCGCCGCCGCGGAGGCCATCATGGGAGGCGTCAAGCA -2221 creA
GGGCCTGTCGCAGGCCGTGCAGAACGCCGCCGGCCGCCAGGAGTCGTCGGAGAGCAGCGG -2161
CCTGGGTGGGTTCATCAGCAGCGTCGCGGGCGGCCTCCTGGGCGGCGCCCTCAAGAGGGA -2101
CGAGACAGAGTCGTACCAGGCCGGCGGCCGCACCGAGGACGGCGGGTACACGCAGACCAC -2041
GACCGAGTACGGCTACTCCGGAGGCCGCTACGGCCAGGCCCAGTACACGGAGACGCAGTA -1981
CGGCGGCGGCGGCGGCGGCCGCAGCGAGTACCGCCGCTACGAGCAGCGCGAGGATGATGA -1921
CGGCCGGGTCCAGAGCTACGGATACACGGAACAGCGCACCGAGACGCGCTACGACAGCTA -1861
CTCGGGTGGCTATGGCGGCCGCGAGGAGACCAGCAGCTATGGCGGCGGCGGCAGCGCGAG -1801
CGAATACATTCGTAGCTCCCAGCAGAGTAGCTACGGTGGCAGCGGCTATGGCAGTGGGTA -1741
CGGTCGTCGTGATGAAGAAGAGAGCAGCGGCTATGGAAGTGGTTACGGTCGTCGTGATGA -1681
AGAGGAGAGTGGTGGTTATGGTGGCGGCTATGGCCGCCGTCAGGAAGAAGAGAGTAGCAG -1621
CTATGGAAGCGGTTATGGTCGTCGTCGTGATGAAGAAGAGAGCGGCGGTTATGGTGGTGG -1561
CTACGGCCGCCGTCAGGAAGAAGAGAGTAGCGGCTATGGAAGTGGTTACGGTCGTCGTGA -1501
TGAAGAAGGGAGCGGCGGTTATGGTGGTGGCTACGGCCGCCGTCATGAGGAAGAGAGCAG -1441
TGGTTACGGCAGCGGCTATGGTCGTCGCCATGAAGAGGAGGGCGGTGGCTACGGCAGTGG -1381
TTACGGCCGCCGGCGCAACGACGAGGAGGAAGAGGAGGATGGCGGACGCCGGAGGTGGGG -1321 creA
TTACTAGGGTGAACTCTTCCGGCCGGTCTCTTGTTGTGAACCTTGCTGTTGCATGGGCAG -1261
GACCGGTGCATCATGAACAGGACGGTGCGCTGTGTTTTTTTTTTCTCGGGGTCTTGATTG -1201
TTTGTTGAATCTCCCTTTTCGAGGATACGAGCTCTCTCGGGGACGAATAGATGAAGGCAA -1141
TCTGACAGATTTGCTCTCAAAAAAAGACTGATATCTCTTCCACCATGCACTGTATGTACA -1081 nit2
TTACATACATTATCCCCCTCCACTGGATTCGCACAACGGAAAGCAATGGCGCGCTGATTC -1021
AAGAACCATCAGGGCTGTCATTGGCTTGTTTTGTGCCGTGGCCGCGGTGACGCCCACIAT -961
GACTCTCTGGGCAGGCGGCAACTGGGTGCCAGATATATTAATCCGGGGCATAGCGCATAT -901 creA
CTTCCTTGATTTGTAGAGTACTAGTACACTAACCCCCTTCTCCACATGGGGCCACTGTTC -841 nit2
GGTAGATCTGCCCGAAGTGCAAGTGCGGGGGGGGCCAAACTAGGTAATATCCTCCCGCTC -781 creA
TCCCGAGTGCGCGGACTAACCGTCATTGCTCCCAGAGGCTTGCACTCTATCGCAGGCCTT -721 nit2
TTCCAATAAGGATGGGGCGTTCGGCGGTGATGATGCCGGTCGTGCGGGGCATACGGGGAG -661 creA
GGTAGATAGAAAATAACGACGCTGGTGTTTTGGAGAGGGGAGGGGGACTATTAGGGGAGG -601 creA nit2
GAAATACAGGGGCAGGGGGTGAGACGGGTGACGTTCCGGCGGAACCTCGCGCTTGTCAAA -541
CAAGCAGCCCTGTTAGGTTGCTCTAGACTAGTGTACATACATACATATGTACATACTGTA -481
TGTACTGCACATACTTTAACTTGGTGCTTCCCTGTGAGCCGCCAGGAACATCACAACTGC -421
AAGCGGAAAAGGCCCCATATACGGGGCGGCTTGTCGGGATGGCTCCCCCCTTCGGAACGG -361
GTCTGACTTCCGAGGATTTTACCTGCTTCATTTGGGTATTCTGCGATGGCCTGTTCAACC -301
CTTCCCCTGGCCGAACCGTTTCTTGGCTCGATCCTAGTGTACACTACACTACTCGTAGAC -241
TGCCTGCCCGACGATCCGCGGGAACGGGCCAGGAGTGTGGAGTGGAGACGGGCGGCGGTG -181 creA
ATGTCGTGTAATTAAATATATAAGTGAGAGTGTTTTTTGACTGCCCCGGGTTCTGGTAGT -121 TATA 盒
TGAAGGGAAGTTCGATGCTCTCTGCTGTCGTCGCTCTCGTCGCTCTCGTCGGCATCCTCC -61
ATCCGTCCGCCTTTGATAACCCGCTCCCCGACTCAGTCAAGACGACGCATACTTGGCACC -1
ATGCATCTCTCCGCCACCACCGGGTTCCTCGCCCTCCCGGCCCTGGCCCTGGCCCAGCTC +60 推测的信号序列
M H L S A T T G F L A L P A L A L A Q L 20
TCGGGCAGCGGCCAGACGACCCGGTACTGGGACTGCTGCAAGCCGAGCTGCGCCTGGCCC +120
S G S G Q T T R Y W D C C K P S C A W P 40
GGCAAGGGCCCCTCGTCTCCGGTGCAGGCCTGCGACAAGAACGACAACCCGCTCAACGAC +180
G K G P S S P V Q A C D K N D N P L N D 60
GGCGGCTCCACCCGGTCCGGCTGCGACGCGGGCGGCAGCGCCTACATGTGCTCCTCCCAG +240
G G S T R S G C D A G G S A Y M C S S Q 80
AGCCCCTGGGCCGTCAGCGACGAGCTGTCGTACGGCTGGGCGGCCGTCAAGCTCGCCGGC +300
S P W A V S D E L S Y G W A A V K L A G 100
AGCTCCGAGTCGCAGTGGTGCTGCGCCTGCTACGAGCTGACCTTCACCAGCGGGCCGGTC +360
S S E S Q W C C A C Y E L T F T S G P V 120
GCGGGCAAGAAGATGATTGTGCAGGCGACCAACACCGGTGGCGACCTGGGCGACAACCAC +420
A G K K M I V Q A T N T G G D L G D N H 140
TTTGACCTGGCCgtgagttgcctccccttctccccggaccgctcagattagatgagatta +480 内含子 1
F D L A 144
gactttgctcgtaaatcggtccaagattcccttgactgaccaacaaacatcatacgggca +540
gATCCCCGGTGGCGGTGTCGGTATTTTCAACGgtaagctggtgcccccggacccctcccc +600 内含子 2
I P G G G V G I F N 154
ggacccctcccccttttcctccagcgagccgagttgggatcgccgagatcgagaactcac +660
acaacttctctctcgacagCCTGCACCGACCAGTACGGCGCTCCCCCGAACGGCTGGGGC +720
A C T D Q Y G A P P N G W G 168
GACCGCTACGGCGGCATCCATTCCAAGGAAGAGTGCGAATCCTTCCCGGAGGCCCTCAAG +780
D R Y G G I H S K E E C E S F P E A L K 188
CCCGGCTGCAACTGGCGCTTCGACTGgtacgttgctttgacataccggaacccaattcct +840 内含子 3
P G C N W R F D W 197
ccaacccccccccttttctcccccaactccgggggtagtcggaatgtcgcgactgaccct +900
atttcagGTTCCAAAACGCCGACAACCCGTCGGTCACCTTCCAGGAGGTGGCCTGCCCGT +960
F Q N A D N P S V T F Q E V A C P 214
CGGAGCTCACGTCCAAGAGCGGCTGCTCCCGTTAAGAGGGAAGAGAGGGGGCTGGAAGGA +1020 t25
S E L T S K S G C S R * 225
CCGAAAGATTCAACCTCTGCTCCTGCTGGGGAAGCTCGGGCGCGAGTGTGAAACTGGTGT +1080 t85
AAATATTGTGGCACACACAAGCTACTACAGTCCGTCTCGCCGTCCGGCTAACTAGCCTTG +1140 t145
CTGCGGATCTGTCCATCTTCGGTCCGAACTGTCCGTTGCTGTTTTGGCTCGGTGCCTCAT +1200 t205
CTTCTCCCAACCTAGTCAAGAATGAATCGTGAGAGAGGCTGAGAGAGATAAGATCGACTT +1260 t265
CAGAAATCCAGGGTTGAAAGCAATAAAAAAAATTCCTGTGGGATGAATATCTCGTGATGC +1320 polyA 位点
AACGACCCTCCTAGGAAACCTTGACGAAATTTGCTGACGGCAAATTCTTCAAAGACTCGT +1380 t385
TAACCGGTCGCCCGTAGTGGTCCTGTTGCCCCAATCCGTTTGTGTTGAAATGACATTGCG +1440 t445
CGTAACGCCGGACTCATATCAACTGCGTACCGAAAGCCAATCCCTCCCCAAACACGCCCT +1500 t505
CTCTAATAAGCTCTCCCAAACAAGACCTCTTGAGACAGAAAATACGCCCAGATGCTGAGG +1560 t565
ACTTGACAAGCCGGGGGGGGGGGGGGGCTTGTCAAGTGCAAAAACTTGCCCATTTCATGC +1620 t625
TGGTATCAAAAAAACAAAAAAAAAAAAAAACATTTCAAGTCGCGGATGCCCCATTTACAT +1680 t685
TGCTTGCGTGCGCCAATAGAAACTTGCAACACGTCAGTGTCATCTTGCACGCCTTGG +1737 t742
SEQ ID No.3:
C1-EG3(家族12)基因片段,其基于家族12纤维素酶同源性分析而经PCR获得。
GAATTCGGGGATTACGAGCTAATGATCTGgtcagttttttttttcttttttcttttcttcncttttcttttcttttcctttctcctgttttattttctta 100
g d y e l m i w
tccattgcttcgccctctttccttaaccctgctgactctctcttcttgtcaatgatactgtaatagGCTGGCGAGATTCGGCGACGTCTACCCCATCGGC 200
L A R F G D V Y P I G
TCGTCCCAGGGCCACGTCAACGTGGCCGGCCAGGACTGGGAGCTGTGGACGGGCTTCAANGGNAACATGCGGGTCTACAGCTTCGTAGCGCCCANCCCC 299
S S Q G H V N V A G Q D W E L W T G F X G N M R V Y S F V A P X P
CGCAACAGNTTCAGCGCCAACGTCAAGGACTTCTTCAACTATCTCCAGTCCAACCAGGGCTTCCCGGCCAGCAGCCAATACCTTCTCAAgtaaggagacga 400
r n x f s a n v k d f f n y l q s n q g f p a s s g y l l n?
gatctcgaacagcataccatatatgcgtgcggtacaagtgcactaaccccctttttttcccgttcgcagtCTTCCAGTTCGGCACTG 487
? ? ?
SERQ ID No.4:
金孢子菌纤维二糖水解酶CBHI
TTTNGGGCGCCGTCTTACTCCTACCTTGCACCGTGATCGGCCAGTCGCGCTGCGAGGGCG
1 ? G A V L L L P C T V I G Q S R C E G
ACTCGTGCGGCGGTACCTACAGCACCGACCGCTATGCCGGCATCTGCGACCCCGACGGAT
61 D S C G G T Y S T D R Y A G I C D P D G
GCGACTTCAACTCGTACCGCCAGGGCAACAAGACCTTCTACGGCAAGGGCATGACGGTCG
121 C D F N S Y R Q G N K T F Y G K G M T V
ACACGACCAAGAAGATCACGGTCGTCACCCAGTTCCTCAAGAACTCGGCCGGCGAGCTCT
181 D T T K K I T V V T Q F L K N S A G E L
CCGAGATCAAGCGGTTCTACGTCCAGAACGGCAAGGTCATCCCCAACTCCGAGTCCACCA
241 S E I K R F Y V Q N G K V I P N S E S T
TCCCGGGCGTCGAGGGCAACTCCATCACCCAGGACTGGTGCGACCGCCAGAAGGCCGCCT
301 I P G V E G N S I T Q D W C D R Q K A A
TCGGCGACGTGACCGACTTCCAGGACAAGGGCGGCATGGTCCAGATGGGCAAGGCCCTCG
361 F G D V T D F Q D K G G M V Q M G K A L
CGGGGCCCATGGTCCTCGTCATGTCCATATGGGACGACCACGCCAGTNAACA
421 A G P M V L V M S I W D D H A S ? -
SEQ ID No.5:
金孢子菌木聚糖酶F
TGACCTTCTCCTCCTTCTCCCGAACAATAATAGATAATTACGAGCCGGTTCGAGGCTGAC
1
ATTGCGCGATTCTAGCGAGCCGCAATCAATTCAACTTTGCCAACGCCGACGCGGTTGTC
61
S R N Q F N F A N A D A V V
AACTTTGCCCAGGCCAACGGCAAGCTCATCCGCGGCCACACCCTCCTCTGGCACTCTCAG
120
N F A Q A N G K L I R G H T L L W H S Q
CTGCCGCAGTGGGTGCAGAACATCAACGACCGCAACACCTTGACCCAGGTCATCGAGAAC
180
L P Q W V Q N I N D R N T L T Q V I E N
CACGTCACCACCCTTGTCACTCGCTACAAGGGCAAGATCCTCCACTGGGACGTCGTTAAC
240
H V T T L V T R Y K G K I L H W D V V N
GAGATCTTTGCCGAGGACGGCTCGCTCCGCGACAGCGTCTTCAGCCGCGTCCTCGGCGAG
300
E I F A E D G S L R D S V F S R V L G E
GACTTTGTCGGCATCGCCTTCCGCGCCGCCCGCGCCGCCGATCCCAACGCCAAGCTCTAC
360
D F V G I A F R A A R A A D P N A K L Y
ATCAACGACTACAGGTCGACA
420
I N D Y R S T -