CN102174535A

CN102174535A - 在制备多肽的方法中有效的真菌转录激活因子

Info

Publication number: CN102174535A
Application number: CN2011100657414A
Authority: CN
Inventors: 卡斯滕·M·约尔特; C·Mjj·范登·杭德尔; P·J·庞特; F·H·J·舒伦; 托夫·克里斯坦森
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2000-03-14
Filing date: 2001-03-14
Publication date: 2011-09-07
Anticipated expiration: 2021-03-14
Also published as: JP2003526374A; DE60142226D1; CN102174535B; DK1266011T3; CN1425068A; EP1266011B1; ATE469223T1; EP1266011A1; AU2001242299A1; CN1425068B; WO2001068864A1

Abstract

本发明涉及在制备多肽的方法中有效的真菌转录激活因子，具体地涉及分离的核酸序列，其编码具有转录激活活性的多肽，同时本发明涉及所述的多肽。本发明还涉及包括所述核酸序列的核酸构建体、载体以及宿主细胞。本发明进一步涉及有效用于制备所述多肽的宿主细胞，在所述的宿主细胞中转录激活因子的产生或功能被改变，本发明还涉及用于制备所述多肽的方法。

Description

在制备多肽的方法中有效的真菌转录激活因子

本申请是申请日为2001年03月14日，申请号为01808199.1(国际申请号为PCT/DK01/00169)，名称为“在制备多肽的方法中有效的真菌转录激活因子”的发明专利申请的分案申请。

发明领域

本发明涉及分离的核酸序列，其编码具有转录激活活性的多肽，本发明还涉及所述的多肽。本发明还涉及包括所述核酸序列的核酸构建体、载体以及宿主细胞。本发明进一步涉及有效用于制备所述多肽的宿主细胞，在所述的宿主细胞中转录激活因子的产生或功能被改变，本发明还涉及用于制备所述多肽的方法。

背景技术

近年来，重组宿主细胞在异源蛋白表达中的应用大大简化了商品化蛋白的大量制备，否则只有通过从其天然来源中纯化才能获得所述的蛋白。目前，可以选择不同的表达系统，包括细菌和真核宿主，从所述的系统中选择用于制备任何特定蛋白。对适当表达系统的选择通常不仅有赖于宿主细胞在活跃状态产生足够产量蛋白的能力，而且在很大程度上也可能由所述蛋白预期的最终用途决定。

经常遇到的一个问题是由特定宿主细胞产生的或存在于培养基中的高水平的蛋白水解酶。一个建议是提供失去了产生特异性蛋白水解化合物能力的宿主生物体。例如，WO 90/00192(Genencor，Inc.)描述了不能分泌有酶活性的天冬氨酸蛋白酶的丝状真菌宿主。EP 574 347(Ciba Geigy AG)描述了枯草杆菌蛋白酶型的丝氨酸蛋白酶缺陷的曲霉宿主。WO 98/12300(Novo Nordisk A/S)描述了金属蛋白酶以及碱性蛋白酶缺陷的宿主。WO97/12045(Genencor，Inc.)描述了由于参与蛋白酶基因调节的启动子序列的破坏而导致造成蛋白酶缺陷的酵母和细菌宿主系统。

Mattern，I.E等，(1992.分子和普通遗传学(Mol Gen Genet)234：332-336)描述了黑曲霉的一个突变株，其被表明仅仅具有亲代菌株1％到2％的细胞外蛋白酶活性，这显然是由于至少两种蛋白酶曲霉胃蛋白酶A(aspergillopepsin A)和曲霉胃蛋白酶B(aspergillopepsin B)的缺陷。提示蛋白酶缺陷表型可能由影响编码两种蛋白酶基因表达的调控性突变造成。

真核转录在一个特定启动子或一组启动子处的起始需要一种真核转录激活因子，其为一种多肽，但其本身不是RNA聚合酶的一部分。许多转录激活因子结合至启动子上的特定位点形成起始该多肽编码序列的转录所需的一种功能性启动子。然而，只有在其他多肽存在下，转录激活因子也可以被并入一种转录起始复合物。对真菌中具有转录激活活性的多肽已经进行了描述，而且已公开了此类多肽的名单(Dhawale，S.S.，和Lane，A.C.1993.核酸研究(Nucleic Acid Research)21：5537-5546)。

本发明建议的解决方法：

本发明的一个目的是提供改进的方法用于在宿主细胞中增加多肽的产生，在所述的宿主细胞中参与调节蛋白酶产生的转录激活因子的活性被改进。

发明简述

本发明的一个方面涉及一种分离的编码转录激活因子的核酸序列，其选自：

(a)与SEQ ID NO：1或SEQ ID NO：48的核酸序列有至少70％同一性的核酸序列；

(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列有至少50％的同一性。

(c)在低严谨度条件下与(i)SEQ ID NO：1或SEQ ID NO：48的核酸序列，或者(ii)其互补链杂交的核酸序列，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；

(d)(a)、(b)或(c)的等位基因变体；

(e)(a)、(b)、(c)或(d)的亚序列，其中该亚序列编码一种具有转录激活活性的多肽片段；以及

(f)(a)、(b)、(c)或(d)的亚序列，其中该亚序列编码一种具有SEQ ID NO：3的氨基酸序列的多肽。

表示为SEQ ID NO：1的核酸序列是黑曲霉(Aspergillus niger)prtT基因，其编码在下面所述和实施例中的表示为SEQ ID NO：2的转录因子。

表示为SEQ ID NO：48的核酸序列是米曲霉(Aspergillus oryzae)IFO4177prtT基因，其编码SEQ ID NO：49所示的转录因子。米曲霉prtT基因具有一个以795位点开始的编码区，并以2931位点结束。所述prtT基因分别在位点1028-1135，1538-1591，2018-2066，和2297-2347具有4个内含子。下文和实施例中对此进行详述。

在另一方面，本发明还涉及包括所述核酸序列的核酸构建体、载体和宿主细胞，以及由所述核酸序列编码的多肽。本发明进一步涉及可用于制备多肽的宿主细胞，在所述的宿主细胞中转录激活因子的产生或功能被改变，本发明还涉及用于制备所述多肽的方法。

本发明还涉及如下方面：

1.一种分离的核酸序列，其编码一种具有转录激活活性的多肽，其选自：

(a)与SEQ ID NO：1或SEQ ID NO：48的核酸序列有至少70％的同一性的核酸序列；

(b)编码一种多肽的核酸序列，所述多肽具有与SEQ ID NO：2或SEQID NO：49的氨基酸序列至少50％的同一性的氨基酸序列。

(d)(a)、(b)或(c)的等位基因变体；

2.项1的核酸序列，其与SEQ ID NO：1或SEQ ID NO：48的核酸序列具有至少70％，优选至少80％，更优选至少85％，更优选至少90％，更优选至少95％，更优选至少97％，更优选至少99％的同一性。

3.项1的核酸序列，其具有SEQ ID NO：1或SEQ ID NO：48的核酸序列。

4.项1至3中任何一个的核酸序列，其编码一种多肽，所述多肽包括与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列具有至少50％，优选至少60％，优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％同一性的氨基酸序列。

5.项1至4中任何一个的核酸序列，其中所述的核酸序列获自真菌细胞或酵母细胞。

6.项5的核酸序列，其中所述的真菌细胞为丝状真菌细胞。

7.项6的核酸序列，其中所述的丝状真菌细胞为曲霉属、镰刀菌属、青霉属或木霉属细胞。

8.项7的核酸序列，其中所述的曲霉属细胞为黑曲霉或米曲霉的菌株，或者它们的同物异名或有性型。

9.项8的核酸序列，其中所述的曲霉属细胞为黑曲霉DSM 12298或米曲霉IFO4177菌株。

10.项7的核酸序列，其中所述的镰刀菌属细胞为Fusarium venenatum的菌株，或者其同物异名或有性型。

11.项5的核酸序列，其中所述的酵母细胞为汉逊氏酵母属、毕赤氏酵母属或糖酵母属细胞。

12.项1至11中任何一个的核酸序列，其编码一种多肽，所述多肽包括SEQ ID NO：2或SEQ ID NO：49的氨基酸序列或其一个片段，其具有转录激活活性。

13.项1至11中任何一个的核酸序列，其编码一种多肽，所述多肽包括SEQ ID NO：3的氨基酸序列。

14.项1至13中任何一个的核酸序列，其在低严谨度条件下，优选中等严谨度条件下，更优选高严谨度条件下与(i)在SEQ ID NO：1或SEQ ID NO：48中所列的核酸序列或者(ii)相应的互补链或其亚序列杂交。

15.项14的核酸序列，其中将低严谨度定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA以及25％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；将中等严谨度定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA以及35％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于60℃在2×SSC、0.2％SDS中洗涤30分钟；而将高严谨度定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA以及50％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于70℃在2×SSC、0.2％SDS中洗涤30分钟。

16.项1至15中任何一个核酸序列，其包括编码一种包含在质粒pEES中具有转录激活活性的多肽的核酸序列，或编码SEQ ID NO：49的多肽的表示为SEQ ID NO：48的DNA序列，所述的质粒pEES位于大肠杆菌DSM12294内。

17.核酸构建体，其包括项1至16中任何一个的核酸序列，所述的核酸序列可操作地连接于一个或多个在适当的表达宿主中指导所述多肽的产生的调控序列。

18.表达载体，其包括项17的核酸构建体、启动子以及转录和翻译终止信号。

19.宿主细胞，其包括项17的核酸构建体或者项18的表达载体。

20.分离的多肽，其选自：

(a)一种多肽，在一种核酸序列中对其进行编码，所述的核酸序列在低严谨度条件下与(i)SEQ ID NO：1或SEQ ID NO：48的核酸序列；(ii)其互补链，或(iii)SEQ ID NO：1或SEQ ID NO：48中编码具有转录激活活性的多肽片段的亚序列杂交，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；

(b)一种多肽，其具有与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列至少50％同一性的氨基酸序列；

(c)(a)或(b)的等位基因变体；

(d)(a)、(b)或(c)的片段，其中所述的片段具有转录激活活性；以及

(e)一种包括SEQ ID NO：3的氨基酸序列的多肽或者其等位基因变体。

21.项20的多肽，其包括与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列具有至少50％，优选至少60％，优选至少70％，更优选至少80％，还更优选至少90％，更优选至少95％，更优选至少97％，更优选至少99％的同一性的氨基酸序列。

22.项20或21的多肽，其包括SEQ ID NO：2或SEQ ID NO：49的氨基酸序列或其一个片段，其中所述的片段保留有转录激活活性。

23.项20至22中任何一个的多肽，在包含于质粒pEES内的核酸序列中，或表示为SEQ ID NO：48的DNA序列中对其进行编码，所述的质粒pEES包含于大肠杆菌DSM12294内。

24.项20至23中任何一个的多肽，其包括SEQ ID NO：3的氨基酸序列。

25.用于制备项20至24中任何一个多肽的方法，其包括(a)在有助于所述多肽制备的条件下对项19的宿主细胞进行培养；和(b)回收该多肽。

26.可用于制备多肽的真菌宿主细胞，其中所述的细胞：

(a)为亲代真菌细胞的突变体，其中亲代细胞包括一个或多个编码蛋白酶的DNA序列，所述DNA序列的转录由项1至16中任一核酸序列所编码的转录激活因子激活；而且

(b)在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

27.项26的宿主细胞，其中所述转录激活因子产量的降低是通过对细胞内存在的而且是该转录激活因子表达所必需的核酸序列进行修饰或灭活来获得的。

28.项26或27的宿主细胞，其中所述转录激活因子产量的降低是通过对所述多肽表达所需的调控序列进行修饰或灭活来获得的。

29.项28的宿主细胞，其中所述的调控序列为启动子序列或其功能性部分。

30.项26至29中任何一个的宿主细胞，其中待修饰或灭活的核酸序列为在项1至16任何一个中所定义的序列。

31.项26至30中任何一个的宿主细胞，其中所述的修饰或灭活是通过特异性诱变或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或取代、基因阻断或基因置换技术、反义技术或它们的组合来进行的。

32.可用于制备多肽的真菌宿主细胞，其中所述的宿主细胞为亲代细胞的突变体，其中该突变体：

(a)在相同的条件下培养时产生比亲代细胞多的由项1至16中任一核酸序列所编码的转录激活因子；而且

(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

33.项32的宿主细胞，其中通过向亲代细胞中引入一个或多个拷贝的(i)项1至16中任何一个的核酸序列，(ii)项17的核酸构建体或者(iii)项18的表达载体，使所述的宿主细胞产生比亲代细胞多的转录激活因子，由此当在相同条件下培养时，所述宿主细胞产生的所述多肽比亲代细胞多。

34.项32或33的宿主细胞，其中将编码转录激活因子的核酸序列可操作地与启动子相连，所述的启动子比亲代细胞的相应启动子强。

35.项34的宿主细胞，其中所述的启动子介导细胞外蛋白酶的编码基因表达，优选为米曲霉碱性蛋白酶、米曲霉中性金属蛋白酶、黑曲霉曲霉胃蛋白酶、尖孢镰刀菌胰蛋白酶样蛋白酶或者Fusarium venenatum胰蛋白酶。

36.可用于制备多肽的真菌宿主细胞，其中所述的细胞为亲代细胞的突变体，其中该突变体包括

(a)对转录激活因子或其调控序列的修饰或灭活，所述的转录激活因子在天然的如项1至16中任一所述的核酸序列中编码，以及

(b)(i)可操作地与项1至16中任一核酸序列相连的诱导性启动子，和(ii)可以结合项1至16中任一核酸序列所编码的转录激活因子的启动子序列，其可操作地与编码所述多肽的核酸序列相连，其中(i)和(ii)可以被同时或先后引入。

37.项36的宿主细胞，其中通过特异性诱变或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或取代、基因阻断或基因置换技术、反义技术或它们的组合来对所述的天然核酸序列或其调节序列进行修饰或灭活。

38.项36或37的宿主细胞，其中所述的诱导性启动子选自由碳或氮的分解代谢物来介导其诱导的启动子。

39.项33至38中任一个的宿主细胞，其还包括一个启动子序列，其中所述的启动子序列可以被所述转录激活因子激活，而且该序列可操作地与编码所述多肽的核酸序列相连。

40.项33至39中任何一个的宿主细胞，其中所述的启动子序列或其功能性部分来自蛋白酶基因。

41.项33至40中任何一个宿主细胞，其中所述的蛋白酶基因为尖孢镰刀菌胰蛋白酶样蛋白酶基因、米曲霉碱性蛋白酶基因、黑曲霉pacA基因、米曲霉碱性蛋白酶基因、米曲霉中性金属蛋白酶基因、黑曲霉曲霉胃蛋白酶基因或者Fusarium venenatum胰蛋白酶基因。

42.项26至41中任何一个的宿主细胞，其中所述的宿主细胞包括至少一个拷贝的编码所述多肽的核酸序列。

43.项26至42中任何一个宿主细胞，其中在相同条件下培养时所述的宿主细胞产生比亲代细胞少的天然蛋白酶或天然蛋白酶组合。

44.项26至43中任何一个宿主细胞，其中通过在pH4下对³H-标记的抹香鲸肌球蛋白的降解对所述蛋白酶的活性进行检测。

45.制备多肽的方法，其包括：

(a)在适于所述多肽产生的营养培养基中对项26至44中任何一个的宿主细胞进行培养，其中所述的宿主细胞携有编码所述多肽的基因；和

(b)从突变细胞的营养培养基中回收所述的多肽。

46.项45的方法，其中所述的多肽相对所述亲代细胞是天然的。

47.项45的方法，其中所述的多肽相对所述亲代细胞是异源的。

48.项45的方法，其中所述的多肽为抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报告蛋白或转运蛋白。

49.项48的方法，其中所述的酶为氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。

50.项49的方法，其中所述的酶为氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-糖苷酶、β-糖苷酶、卤过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶裂解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶或木聚糖酶。

附图简述

图1显示质粒pPAP的限制性图谱，其构建过程在实施例1中描述。

图2显示质粒pAopyrGcosArp1的限制性图谱，其构建过程在实施例1中描述。

图3显示质粒pEES1的限制性图谱，其构建过程在实施例1中描述。

图4显示质粒pDprt的限制性图谱，其构建过程在实施例3中描述。

图5显示质粒pGPprt的限制性图谱，其构建过程在实施例4中描述。

图6显示在包含米曲霉prtTZn²⁺-指状结构的PCR片段的两个质粒插入的序列。ICA217是来自于其中一个质粒的序列，ICA218是另一个的。

图7显示了基于pSP65(Promega^TM)的质粒pDV8，其包含一个在1.2kbBglII/BamHI片段上的HSV-tk基因，所述基因插入到构巢曲霉(A.nidulans)gpd启动子的1.0kb XhoI/BglII片段和含有构巢曲霉trpC转录终止子0.8kb BamHI/HindIII片段之间。

图8显示了实施例8所述的pJaL554的构建。

发明详述

编码转录激活因子的核酸序列

本发明一方面涉及一种分离的编码转录激活因子的核酸序列，其选自：

(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列具有与SEQ IDNO：2或SEQ ID NO：49的氨基酸序列有至少50％同一性。

(d)(a)、(b)或(c)的等位基因变体；

本文中所用的术语“转录激活因子”指能激活一个特定启动子或一组启动子的多肽，所述的启动子是其连接的多肽编码序列转录起始所必需的。

本文中所用的术语“分离的核酸序列”指一种基本上没有其他核酸序列的核酸序列，例如通过琼脂糖电泳测定纯度为至少大约20％，优选至少大约40％，更优选至少大约60％，甚至更优选至少大约80％，最优选至少大约90％。例如，分离的核酸序列可以通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述的克隆过程可以包括切割和分离含编码该多肽的核酸序列的目的核酸片段，将该片段插入到一种载体分子中，并将该重组载体引入到一种宿主细胞中，在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述的核酸序列可以是基因组序列、cDNA、RNA、半合成、合成来源的或者其任何组合。

在一优选的实施方案中，所述核酸序列与在SEQ ID NO：1或SEQ IDNO：48中所列的核酸序列具有至少大约70％，优选至少大约80％，更优选至少大约85％，甚至更优选至少大约90％，最优选至少大约95％，甚至最优选至少大约97％，更优选至少99％的同一性，其编码一种有活性的多肽。为了本发明的目的，通过Clustal方法(Higgins，1989，CABIOS 5：151-153)以一个同一性表，缺口罚分(gap penalty)为10以及缺口长度罚分为10对两种核酸序列之间同一性的程度进行测定。

在一更优选的实施方案中，编码转录激活因子的核酸序列具有在SEQID NO：1或SEQ ID NO：48中所列的核酸序列。

对编码本发明多肽的核酸序列的修饰可能是合成与该多肽基本上相似的多肽所需的。术语与该多肽“基本上相似”指该多肽的非天然存在的形式。这些多肽可能在一些设计方面上与从其天然来源分离的多肽不同。例如，需要用定点诱变等来合成该多肽的变体，其中变体在比活性、结合特异性和/或亲和力等方面不同。根据作为SEQ ID NO：1或SEQ ID NO：48的多肽编码部分给出的核酸序列，例如其一个亚序列，和/或通过引入核苷酸取代可以构建相似的序列，其中所述的核苷酸取代不产生由该核酸序列所编码的多肽的另一种氨基酸序列，但其与待用于制备该酶的宿主生物体的密码子应用相应，或者所述的核苷酸取代产生不同的氨基酸序列。对于核苷酸取代的一般描述见，例如Ford等，1991，蛋白质表达和纯化(Protein Expression and Purification)2：95-107。

在另一优选的实施方案中，本发明涉及分离的编码多肽的核酸序列，所述多肽的氨基酸序列与在SEQ ID NO：2或SEQ ID NO：49中所列的氨基酸序列具有至少大约50％，优选至少大约60％，优选至少约70％，更优选至少大约80％，甚至更优选至少大约90％，最优选至少大约95％，甚至最优选至少大约97％，更优选至少99％的同一性程度，其在性质上保留有所述多肽的转录激活活性(此后为“同源性多肽”)。

在一优选的实施方案中，同源性多肽具有与SEQ ID NO：2或SEQ IDNO：49中所列氨基酸序列有5个氨基酸，优选4个氨基酸，更优选3个氨基酸，甚至更优选2个氨基酸，最优选1个氨基酸不同的氨基酸序列。为了本发明的目的，通过Clustal方法(Higgins，1989，同上)以一个同一性表，缺口罚分为10以及缺口长度罚分为10对两种氨基酸序列之间的同一性程度进行测定。

杂交表明通过标准的SOUTHERN印迹方法，在低到高严谨度条件下(即，于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA以及相对于低、中等和高严谨度分别为25、35或50％的甲酰胺中预杂交和杂交)，该核酸序列与对应于SEQ ID NO：1中所示核酸序列的多肽编码部分的寡核苷酸探针杂交。为鉴定同源于SEQ ID NO：1或SEQ ID NO：48的克隆或DNA，将杂交反应液用2X SSC，0.2％SDS洗三次，每次30分钟，温度优选为至少50℃，更优选至少55℃，更优选至少60℃，更优选至少65℃，甚至更优选至少70℃，最优选至少75℃。

SEQ ID NO：1或SEQ ID NO：48的核酸序列或者其亚序列，以及SEQ IDNO：2或SEQ ID NO：49的氨基酸序列或者其部分序列，或者SEQ ID NO：3的氨基酸序列可被用来设计寡核苷酸探针，以根据本领域众所周知的方法鉴定并分离或者克隆任何属或种的同源基因。

具体为，为了鉴定并分离目的属或种中相应的基因，按照标准的SOUTHERN印迹方法，可将上述探针用来与目的属或种的基因组或cDNA杂交。上述探针可以大大短于完整序列，但长度应该为至少15个，优选至少25个，而且更优选至少40个核苷酸。更长的探针也可以使用。DNA和RNA探针都可以使用。为了检测相应的基因，通常对探针进行标记(例如，用³²P、³H、³⁵S、生物素或亲和素)。例如，与³²P-、³H-或³⁵S-标记的寡核苷酸探针杂交的分子可以通过利用X线胶片检测到。

因此，可以对由上述其他生物体制备的基因组、cDNA或组合化学文库筛选与上述探针杂交并编码具有转录激活活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳或者其他分离技术可以对来自上述其他生物体的基因组或其他DNA进行分离。来自文库的DNA或者分离的DNA可以被转移并固定于硝酸纤维素或其他适当的载体材料上。然后按照标准的SOUTHERN印迹方法可以对与SEQ ID NO：1或SEQ ID NO：48同源的克隆或DNA进行鉴定。

一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中任何一个。等位基因变异通过突变自然发生，并且可以导致群体内表型的多态性。基因突变可以是沉默突变(即，在所编码的多肽中没有改变)或者可以编码氨基酸序列发生改变的多肽。

术语“多肽的等位基因变体”是由基因的一个等位基因变体所编码的多肽。在一优选的实施方案中，编码本发明的转录激活因子的核酸序列为选自下述核酸序列中的一种核酸序列等位基因变体：(a)与SEQ ID NO：1或SEQID NO：48的核酸序列有至少70％同一性的核酸序列，(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列有至少50％同一性，(c)在低严谨度条件下与SEQ ID NO：1或SEQ IDNO：48的核酸序列，或者其互补链杂交的核酸序列，以及(d)编码一种具有SEQ ID NO：3氨基酸序列的多肽的核酸序列。

本发明还包括由于遗传密码的简并性而与SEQ ID NO：1或SEQ ID NO：48不同的核酸序列。本发明还涉及SEQ ID NO：1或SEQ ID NO：49的亚序列，其中SEQ ID NO：1或SEQ ID NO：48的一个亚序列为除了从5’和/或3’末端的一个或多个核苷酸缺失外，由SEQ ID NO：1所包含的核酸序列。优选SEQ IDNO：1或SEQ ID NO：48的一个亚序列编码一种具有转录激活活性的多肽。在一个更优选的实施方案中，SEQ ID NO：1或SEQ ID NO：48的一个亚序列含有至少一种编码在SEQ ID NO：3中所示多肽序列的核酸序列。

用于对编码一种多肽的核酸序列进行分离或克隆的技术在本领域中是已知的，而且包括从基因组DNA分离、从cDNA制备或者将它们联合。例如通过利用基于聚合酶链式反应(PCR)或者对表达文库进行抗体筛选以检测具有共同结构特征的克隆化DNA片段的方法，从上述基因组DNA中对本发明核酸序列进行克隆是可以实现的(见，例如Innis等，1990，PCR：方法和应用指导(PCR：A Guide to Methods and Application)，Academic Press，纽约)。其它核酸扩增方法也可以利用，例如连接酶链式反应(LCR)、连接激活转录(1igated activated transcription)(LAT)和基于核酸序列的扩增(NASBA)。所述的核酸序列可以克隆自一种微生物或者另一种或相关生物体，因此，例如其可能为所述核酸序列多肽编码区的等位基因变体或物种变体。

由与寡核苷酸探针杂交的核酸序列编码的转录激活因子可以获自任何属的微生物，所述的寡核苷酸探针与SEQ ID NO：1或SEQ ID NO：48的核酸序列、其互补链，或SEQ ID NO：1或SEQ ID NO：48的等位基因变体和亚序列，或者转录激活因子的等位基因变体和片段杂交。

在一优选的实施方案中，转录激活因子可以获自真菌细胞。本文中所用的“真菌”包括子囊菌(Ascomycota)门、担子菌(Basidiomycota)门、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等定义，在Ainsworth和Bisby真菌词典，第8版，1995，CAB International，University Press，Cambridge，UK中)以及卵菌门(Oomycota)(在Hawksworth等，1995，同上，171页中列举)和所有有丝分裂孢子真菌(Hawksworth等，1995，同上)。

在优选的实施方案中，真菌来源为一种丝状真菌菌株。“丝状真菌”包括真菌(Eumycota)和卵菌亚门的所有丝状形式(由Hawksworth等，1995，同上，所定义)。丝状真菌以由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖和其他复杂多糖组成的菌丝体壁为特征。营养生长是通过菌丝延长进行的，碳分解代谢是专性需氧的。丝状真菌菌株包括，但不限于，支顶孢属、曲霉属、短柄霉属、隐球酵母属、Filibasidium、镰刀菌属、腐质霉属、Magnaporthe、毛霉菌属、毁丝霉属、Neocallimastix、链孢霉属、拟青霉属、青霉属、Piromyces、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、Tolypocladium和木霉属的菌株。

在一个更优选的实施方案中，编码本发明一种转录激活因子的核酸序列获自曲霉属菌株，例如泡盛曲霉或构巢曲霉。优选所述的核酸序列获自黑曲霉或米曲霉菌株。甚至更优选所述的核酸序列获自黑曲霉菌株DSM 12298的分离株；例如，在SEQ ID NO：1中所列的核酸序列，或来自于米曲霉IFO4177，即SEQ ID NO：48中所列的核酸序列。

在另一更优选的实施方案中，编码本发明的一种转录激活因子的核酸序列获自镰刀菌属菌株，例如尖孢镰刀菌。优选所述的菌株为Fusarium venenatum的菌株(Nirenberg sp.nov.)。

在另一优选的实施方案中，编码本发明一种转录激活因子的核酸序列获自一种酵母菌株，例如念珠菌属、克鲁维氏酵母属、裂殖糖酵母属(Schizosaccharomyces)或Yarrowia的菌株。优选所述的菌株为汉逊氏酵母属、毕赤氏酵母属或糖母属的菌株。

不言而喻，对于前面提到的物种，不论它们已知的物种名称为何，本发明包括其完整和不完整的名称以及其他分类学等同物，例如无性型。本领域的技术人员很容易识别合适等同物的本体。例如，所述的多肽可以获自为Raper，K.D.和Fennel，D.I.(1965.曲霉属(The Genus Aspergillus)，The Wilkins Company，Baltimore MD)所定义的曲霉属分类学等同物，而不论其已知的物种名称为何。曲霉菌为产有丝分裂孢子的真菌，其特征为：由分生孢子柄组成喷洒器状，泡囊末端不带有已知的有性形式，泡囊本身带有一或两层同步形成的分别称为小梗或瓶梗的特化细胞，以及被称为分生孢子的无性孢子。曲霉属已知的有性型包括Eurotium、新缝匠菌(Neosartorya)和裸孢壳属(Emericella)。曲霉属的菌株及其有性型由多个培养物保藏中心向公众开放，例如美国典型培养物保藏中心(ATCC)、德意志微生物保藏中心(DSM)、真菌菌种保藏中心(CBS)以及农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)、北方区域研究中心(Northern Regional Research Center，NRRL)。

此外，利用上述的探针可以从其他来源中对此类转录激活因子进行鉴定和得到，所述的来源包括自然界(例如，土壤、堆肥、水等)分离的微生物。用于从天然生长环境中分离微生物的技术是本领域所众所周知的。然后类似地通过筛选另一种微生物的基因组文库或cDNA文库可以得到核酸序列。一旦用探针检测到编码转录激活因子的核酸序列，那么用本领域普通技术人员已知的技术可以对该序列进行分离或克隆(见，例如，J.Sambrook，E.F.Fritsch，和T.Maniatus，1989，分子克隆，实验指南，第二版，冷泉港，纽约)。

在另一优选的实施方案中，分离的核酸序列编码一种包含SEQ ID NO：2或SEQ ID NO：49的氨基酸序列或其片段的多肽，所述的多肽具有转录激活活性。

在另一优选的实施方案中，分离的核酸序列编码一种包括SEQ ID NO：3的氨基酸序列的多肽。

本发明还涉及分离的编码本发明转录激活因子的核酸序列，例如利用上述标准的SOUTHERN印迹方法(参看，Sambrook等，1989，同上)，所述的核酸序列在低严谨度条件下，更优选中等严谨度条件下，而最优选高严谨度条件下与一种寡核苷酸探针杂交，所述的寡核苷酸探针在相同的条件下与在SEQ ID NO：1或SEQ ID NO：48的核酸序列或其互补链，或者SEQ ID NO：1或SEQ ID NO：48的编码真菌转录激活因子多肽片段的等位基因变体和亚序列杂交。

在另一更优选的实施方案中，所述的核酸序列编码一种包含在质粒pEES中具有DNA结合活性的多肽，所述的质粒包含于大肠杆菌DSM 12294中。

核酸构建体

本发明的另一个方面涉及包含编码本发明转录激活因子的核酸序列的核酸构建体，所述的核酸序列可操作地连接于一个或多个在适当的表达宿主中控制该转录激活因子产生的调控序列。在一优选的实施方案中，所述的核酸序列编码一种多肽，其包含在质粒pEES中，所述的质粒pEES包容于大肠杆菌DSM 12294内，或编码表示为SEQ ID NO：49的多肽的表示为SEQ IDNO：48的核酸序列。

不言而喻，表达包括多肽产生所涉及的任何步骤，其包括，但不限于，转录、转录后修饰、翻译、翻译后修饰以及分泌。根据表达载体的不同对编码多肽的核酸序列在其插入到该载体之前进行操作可以是优选的或必须的。利用克隆方法修饰核酸序列的技术在本领域中是众所周知的。

本文中将“核酸构建体”定义为一种单链或双链核酸分子，其分离自天然存在的基因或者其被修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列的表达所需的所有调控序列时，术语核酸构建体与术语表达盒意思相同。本文中所定义的术语“编码序列”可被转录成mRNA并被翻译成本发明的转录激活因子。编码序列的界限通常由在mRNA5’末端的ATG起始密码子和mRNA 3’末端紧邻开放阅读框下游的转录终止序列来确定。编码序列可以包括，但不限于，DNA、cDNA和重组核酸序列。

本文中将术语“调控序列”定义为包括多肽表达所必需的或有利的所有元件。每个调控序列对于编码所述多肽的核酸序列可以是天然的或者外源的。此类调控序列包括，但不限于，引导序列、多聚腺苷酸化序列、前肽序列、启动子、信号序列以及转录终止子。调控序列至少包括一个启动子以及转录和翻译终止信号。为了引入特异性限制性位点，以有利于将调控序列与编码多肽的核酸序列的编码区连接，可以为调控序列提供接头。本文中将术语“可操作地连接”定义为一种构型，其中将调控序列放置在相对于DNA序列中编码序列的适当位置上以便该调控序列指导多肽的产生。

调控序列可以为适当的启动子序列，一种为了核酸序列的表达而被宿主细胞识别的核酸序列。启动子序列包括转录调控序列，其介导所述多肽的表达。启动子可以为在所述细胞中表现出转录活性的任何核酸序列，包括突变的、截断的和杂合的启动子，而且可以获自编码与所述细胞同源或异源的细胞外或细胞内多肽的任何基因。

调控序列还可以为适宜的转录终止亚序列，一种被丝状真菌细胞识别来终止转录的序列。将终止亚序列可操作地连接于编码所述多肽的核酸序列的3’末端。任何在所述细胞中有功能的终止子在本发明中均可以使用。

对于丝状真菌细胞优选的终止子获自编码米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶以及尖孢镰刀菌胰蛋白酶样蛋白酶的基因。

调控序列还可以为适宜的前导序列，即mRNA的一个非翻译区，其对于由丝状真菌细胞进行的翻译至关重要。将引导序列可操作地连接于编码所述多肽的核酸序列的5’末端。任何在所述细胞中有功能的前导序列在本发明中均可以使用。

对于丝状真菌细胞优选的前导序列获自编码米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。

调控序列还可以为多聚腺苷酸化序列，其被可操作地连接于所述核酸序列3’末端的序列而且在转录时其被丝状真菌细胞识别为一个信号来向转录的mRNA添加多聚腺苷酸。任何在所述细胞中有功能的多聚腺苷酸化序列在本发明中均可以使用。

对于丝状真菌细胞优选的多聚腺苷酸化序列获自编码米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶以及黑曲霉α-葡糖苷酶的基因。

调控序列还可以为信号肽编码区，其编码连接于多肽氨基末端的氨基酸序列，其能够引导所编码的多肽进入细胞分泌途径。所述核酸序列中编码序列的5’末端可以天然地含有一个信号肽编码区，其与编码分泌型多肽的编码区片段天然相连于翻译阅读框内。或者，编码序列的5’末端可以含有一个信号肽编码区，其对于该编码序列是外源的。编码序列通常不含有信号肽编码区时可能需要外源的信号肽编码区。或者，为了提高所述多肽的分泌，可以简单地用外源的信号肽编码区置换固有的信号肽编码区。信号肽编码区可以获自曲霉种的葡糖淀粉酶或淀粉酶基因，或者根毛霉(Rhizomucor)种的脂肪酶或蛋白酶基因。然而，引导所表达的多肽进入丝状真菌细胞分泌途径的任何信号肽编码区在本发明中均可使用。

对于丝状真菌细胞有效的信号肽编码区为获自米曲霉TAKA淀粉酶基因、黑曲霉中性淀粉酶基因、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶基因或者Humicola lanuginosa纤维素酶基因的信号肽编码区。

调控序列还可以为前肽编码区，其编码位于多肽氨基末端的一段氨基酸序列。所得的多肽被称为酶原或多肽原(或者在某些情况下为酶原)。多肽原通常无活性，而且通过从多肽原中对前肽的催化性或自身催化性切割，可以将其转化为成熟的有活性的多肽。前肽编码区可以获自米赫根毛霉的天冬氨酸蛋白酶基因或者嗜热毁丝霉属的漆酶基因(WO 95/33836)。

信号肽和前肽区均存在于多肽的氨基末端，前肽区紧邻多肽的氨基末端而信号肽区紧邻前肽区的氨基末端。

表达载体

本发明还涉及重组表达载体，其包括本发明的核酸序列、启动子以及转录和翻译终止信号。可以将上述的各种核酸和调控序列连接起来，形成重组表达载体，其可能包括一个或多个方便的限制性位点以使编码所述多肽的核酸序列可以在这些位点处插入或取代。或者，编码所述多肽的核酸序列可以通过将该序列或包括该序列的核酸构建体插入到用于表达的适当载体中进行表达。在制备表达载体的过程中，编码序列位于载体中，以便将该编码序列可操作地与用于表达并且可能用于分泌的适当调控序列相连。

重组表达载体可以为任何载体(例如，质粒或病毒)，其可以很方便地进行重组DNA操作，而且可以使编码所述多肽的核酸序列表达。所述载体的选择通常取决于载体与待引入所述载体的丝状真菌细胞的相容性。所述的载体可以为线性或闭合环状质粒。所述的载体可以为一种自我复制载体，即以一种染色体外单元形式存在的载体，其复制不依赖于染色体的复制，例如，质粒、染色体外元件、极微染色体或人工染色体。所述的载体可以包括用于保证自我复制的任何方式。或者所述的载体可以为下述载体，在将其引入到丝状真菌细胞中时整合到基因组中并与将其整合进来的染色体一起复制。载体系统可以为一个单个载体或质粒，或者两个或多个载体或质粒，所述的载体或质粒含有待引入到丝状真菌细胞基因组中的完整DNA或者转座子。

载体优选含有一个或多个可筛选标记，其使得可以很容易地对转化的细胞进行筛选。选择标记为一种基因，其产物提供生物杀灭剂或病毒抗性、对重金属的抗性、原养型变成营养缺陷型等等。用于在丝状真菌细胞中使用的可筛选标志可以选自，但不限于，amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)，以及来自其他物种的等同物。优选用于在曲霉细胞中使用的为构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。

载体优选含有使所述载体可以稳定整合到宿主细胞基因组中或者可以在细胞中不依赖于细胞的基因组而自我复制的元件。

宿主细胞

本发明的另一个方面涉及包括本发明的核酸构建体或一种表达载体的宿主细胞。

在本发明的方法中对宿主细胞的选择很大程度上取决于编码目的多肽的核酸序列的来源。

表达载体或核酸构建体向丝状真菌细胞中的引入可以包括下述过程：原生质体的形成、原生质体的转化以及细胞壁以其本身已知的一种方式再生。用于转化曲霉细胞的适当的方法描述于EP 238023和Yelton等，1984，美国科学院院刊(Proceedings of the National Academy of Sciences USA)81：1470-1474中。转化镰刀菌属的适当的方法描述于Malardier等，1989，基因(Gene)78：147-156或在WO 96/00787中。

“引入”意指将包括编码所述多肽的核酸序列的载体引入到丝状真菌细胞中，以便将载体保持为染色体的整合体或一种自我复制的染色体外载体。整合通常被认为是一种优点，因为核酸序列将更有可能稳定地保持在细胞中。通过同源重组、非同源重组或转座使载体发生向染色体中的整合。

为了向宿主细胞基因组中整合，所述的载体可以依赖编码所述多肽的核酸序列或所述的载体中用于通过同源或非同源重组将该载体向基因组中稳定整合的任何其他元件。或者，所述的载体可以含有额外的指导通过同源重组整合到宿主细胞基因组中的核酸序列。额外的核酸序列使该载体能整合到宿主细胞基因组中染色体的精确位置上。为了提高在精确位置上整合的可能性，整合元件优选应该含有足够数量的核酸，例如100到1,500个碱基对，优选400到1,500个碱基对，而最优选800到1,500个碱基对，其与相应的靶序列高度同源以提高同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。这些核酸序列可以是任何与宿主细胞基因组中的靶序列同源的序列，并且可以是非编码或编码序列。

为了自我复制，载体可以进一步包括使载体能够在宿主细胞中自我复制的复制起点。

用于连接上述的元件以构建重组表达载体的方法是本领域技术人员众所周知的(见，例如Sambrook，等，同上)。

在一优选的实施方案中，所述的丝状真菌宿主细胞为，但不限于，支顶孢属、曲霉属、镰刀菌属、腐质霉属、毛霉菌属、毁丝霉属、链孢霉属、青霉属、草根霉属、Tolypocladium或木霉属的一种细胞。

在一更优选的实施方案中，所述的丝状真菌细胞为曲霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为支顶孢属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为镰刀菌属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为腐质霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为毛霉菌属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为毁丝霉属属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为链孢霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为青霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为草根霉属属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为Tolypocladium属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为木霉属的细胞。

在一最优选的实施方案中，所述的丝状真菌细胞为泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为杆孢状镰刀菌、Fusarium cerealis、Fusarium crookwellense、黄色镰刀菌、禾谷镰刀菌、禾赤镰刀菌、异孢镰刀菌、合欢木镰刀菌、尖孢镰刀菌、多枝镰刀菌、粉红镰刀菌、接骨木镰刀菌、肤色镰刀菌、硫色镰刀菌、Fusarium toruloseum、Fusarium trichothecioides或Fusarium venenatum细胞。在一最优选的实施方案中，所述的丝状真菌细胞为Fusarium venenatum(Nirenberg sp.nov.)。在另一最优选的实施方案中，所述的丝状真菌细胞为Humicola insolens或Humicola lanuginosa细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为米赫毛霉。在另一最优选的实施方案中，所述的丝状真菌细胞为嗜热毁丝霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为粗糙链孢霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为产紫青霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为Thielavia terrestris细胞。在另一最优选的实施方案中，所述木霉属细胞为Trichoderma harzianum、康宁氏木霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)细胞。

具有转录激活活性的多肽

本发明的另一个方面涉及一种分离的多肽，其选自：

(a)一种多肽，在一种核酸序列中对其进行编码，所述的核酸序列在低严谨度条件下与(i)SEQ ID NO：1或SEQ ID NO：48的核酸序列；(ii)其互补链，或(iii)编码具有转录激活活性的多肽片段的SEQ ID NO：1或SEQ ID NO：48的亚序列杂交，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；

(b)一种多肽，其氨基酸序列与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列有至少50％的同一性；

(c)(a)或(b)的等位基因变体；

(d)(a)、(b)或(c)的一个片段，其中所述的片段具有转录激活活性；以及

(e)包括SEQ ID NO：3的氨基酸序列的一种多肽或者其等位基因变体。

利用本文中所述的技术可以对转录激活因子进行分离。如本文中所定义的，一种“分离”的多肽为一种基本上没有其他多肽的多肽，例如通过SDS-PAGE测定的纯度为至少大约20％，优选至少大约40％，更优选大约60％，甚至更优选大约80％，最优选大约90％，而且还最优选大约95％。

本发明还涉及下述分离的多肽，其氨基酸序列与具有转录激活活性的SEQ ID NO：2或SEQ ID NO：49氨基酸序列的同一性至少大约50％，优选至少大约55％，优选至少大约60％，优选至少大约65％，优选至少大约70％，优选至少大约75％，优选至少大约80％，更优选至少大约85％，甚至更优选至少大约90％，最优选至少大约95％，而且还最优选至少大约97％，更优选至少99％。

在更优选的实施方案中，本发明的转录激活因子包括SEQ ID NO：2或SEQ ID NO：49的氨基酸序列，或者其一个片段，其中所述的片段保留有转录激活活性。在一最优选的实施方案中，所述的多肽具有SEQ ID NO：2或SEQ ID NO：49的氨基酸序列。SEQ ID NO：2或SEQ ID NO：49的一个片段是从该氨基酸序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽。优选，SEQ ID NO：2或SEQ ID NO：49的一个片段至少含有在SEQ ID NO：3中所示的多肽序列。

同源多肽的氨基酸序列可因一个或多个氨基酸残基的插入或缺失和/或被不同氨基酸残基一个或多个氨基酸残基的取代而与SEQ ID NO：2或SEQID NO：49或SEQ ID NO：3的氨基酸序列不同。优选，氨基酸的改变属于一种次要的特性，其为不会显著影响所述蛋白折叠和/或活性的保守性氨基酸取代；通常1至大约30个氨基酸的小的缺失；小的氨基或羧基末端延伸(extension)，例如氨基末端的蛋氨酸残基；多达大约20-25个残基的小的连接肽；或者通过改变净电荷或其他功能而有利于纯化的小的延伸，例如多聚组氨酸域、抗原性表位或结合结构域。

保守性取代的实例在碱性氨基酸(例如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(例如谷氨酸和天冬氨酸)、极性氨基酸(例如谷氨酰胺和天冬酰胺)、疏水性氨基酸(例如亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(例如苯丙氨酸、色氨酸和酪氨酸)以及小的氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和蛋氨酸)内。通常不改变比活性的氨基酸取代在本领域中是已知的，而且由例如H.Neurath和R.L.Hill(1979，蛋白质(The Proteins)，Academic Press，纽约)所描述。最常见的交换为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly，以及这些反过来进行交换。

在一更优选的实施方案中，本发明的转录激活因子获自黑曲霉菌株，更优选获自黑曲霉AB4.1(van Haringsveldt，W.，等，1987，分子和普通遗传学(Mol.Gen.Genet.)206：71-75)，而且最优选获自已在DSM保藏为DSM12298的黑曲霉13PAP2，或其突变株，它们携有例如具有SEQ ID NO：2或SEQ ID NO：49或SEQ ID NO：3氨基酸序列的多肽。

在另一优选的实施方案中，本发明的转录激活因子为由在质粒pEES中所含的核酸序列编码的多肽，而质粒pEES包含于大肠杆菌DSM 12294中，或编码SEQ ID NO：49的多肽的以SEQ ID NO：48表示的核酸序列。

本发明还涉及用于制备本发明的转录激活因子的方法，其包括(a)将携带有核酸构建体或表达载体的宿主细胞在有助于所述多肽产生的条件下进行培养，所述的核酸构建体或表达载体含有编码本发明的转录激活因子的核酸序列；并(b)回收该多肽。

具有改变的转录激活活性的宿主细胞

本发明的另一方面涉及一种对多肽制备有效的宿主细胞，其为亲代真菌细胞的突变体，其中亲代细胞包括一个或多个编码一种蛋白酶的核酸序列，所述核酸序列的转录由本发明的转录激活因子激活，而且在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

利用本领域中众所周知的方法可以构建突变细胞；例如通过在编码转录激活因子的基因中一个或多个核苷酸的插入或缺失。

在一优选的实施方案中，所述突变细胞通过使细胞中表达转录激活因子所必需的核酸序列得到修饰或灭活而获得。

在一更优选的实施方案中，所述的核酸序列选自：(a)与SEQ ID NO：1或SEQ ID NO：48的核酸序列有至少70％同一性的核酸序列；(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2或SEQ ID NO：49的氨基酸序列有至少50％同一性；(c)在低严谨度条件下与(i)SEQ ID NO：1或SEQ ID NO：48的核酸序列，或者(ii)其互补链杂交的核酸序列；(d)(a)、(b)或(c)的等位基因变体；(e)(a)、(b)、(c)或(d)的亚序列，其中该亚序列编码一种具有转录激活活性的多肽片段；以及(f)(a)、(b)、(c)或(d)的亚序列，其中该亚序列编码一种具有SEQ ID NO：3的氨基酸序列的多肽。

在另一优选的实施方案中，转录激活因子在突变细胞中降低的表达是通过对该转录激活因子表达所需的调控序列的修饰或灭活而获得的。如上，在标题为“核酸构建体”的章节中对术语“调控序列”进行了定义。在一更优选的实施方案中，突变细胞中的调控序列为启动子序列或其功能性部分，即足以影响所述核酸序列表达的一个部分。其他可能进行修饰的调控序列包括，但不限于，前导序列、多聚腺苷酸化序列、前肽序列、信号序列和转录终止子。

通过将亲代细胞用于诱变并筛选产生转录激活因子的能力已被降低的突变细胞可以进行基因的修饰或灭活。诱变，其可以为特异的或随机的，例如可以通过利用适当的物理或化学诱变剂、通过利用适当的寡核苷酸，或者通过将该DNA序列用于PCR产生的诱变来进行。另外，可以通过利用这些诱变剂的任何组合来进行诱变。

适于本目的的物理或化学诱变剂的实例包括紫外线(UV)辐射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、邻甲基羟胺、亚硝酸、甲基磺酸乙酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸以及核苷酸类似物。

当利用此类试剂时，诱变通常是通过下述步骤进行：在所选诱变剂的存在下将待诱变的亲代细胞于适当的条件下温育，并筛选表现出所述基因表达降低的突变细胞。

通过在基因的核酸序列或其转录或翻译所需的调节性元件中引入、取代或去除一个或多个核苷酸可以完成对该基因的修饰或灭活。例如，可以将核苷酸插入或去除以便造成终止密码子的引入、起始密码子的去除或者开放阅读框的改变。此类修饰或灭活可以按照本领域已知的方法通过定点诱变或PCR产生的诱变来完成。虽然原则上修饰可以在体内进行，即直接在表达待修饰基因的真菌细胞上进行，但如下面所举例说明的优选在体外进行修饰。

灭活或降低目的真菌细胞中所述基因表达的一种方便方法的实例是以基因置换或基因阻断技术为基础。例如，在基因阻断方法中，在体外将与内源性基因或目的基因片段相应的核酸序列进行诱变以产生一种缺陷的核酸序列，然后将其转化到亲代细胞中以产生一种缺陷的基因。通过同源重组，缺陷的核酸序列取代内源性基因或基因片段。理想的是缺陷的基因或基因片段还编码一种标记，所述的标记可以用于对其中核酸序列已经被修饰或破坏的转化体进行筛选。

或者，所述基因的修饰或灭活可以通过已建立的反义技术利用与该基因的核酸序列互补的一种核苷酸序列来进行。更具体为，通过引入一种核苷酸序列可以降低或清除丝状真菌细胞对所述基因的表达，所述的核苷酸序列与在该细胞中可被转录的核酸序列互补而且能够与细胞中产生的mRNA杂交。因此，在允许互补反义核苷酸序列与所述mRNA杂交的条件下，降低或清除了所翻译的蛋白质的数量。

与SEQ ID NO：1或SEQ ID NO：48的核酸序列互补的一种核苷酸序列可以获自任何微生物来源。优选的来源为真菌，例如，如上所述的酵母和丝状真菌。优选的丝状真菌来源包括，但不限于，支顶孢属、曲霉属、镰刀菌属、腐质霉属、毁丝霉属、毛霉菌属、链孢霉属、青霉属、Phanerochaete、草根霉属、Tolypocladium和木霉属。优选的酵母来源包括，但不限于，念珠菌属、汉逊氏酵母属、克鲁维氏酵母属、毕赤氏酵母属、酵母属、裂殖糖酵母属和Yarrowia属。此外，所述的核酸序列可以是丝状真菌细胞天然的。

在另一优选的实施方案中，亲代细胞携带有一种基因，所述的基因具有编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2或SEQID NO：49的氨基酸序列具有至少50％的同一性。

在另一优选的实施方案中，亲代细胞携带有一种基因，所述基因的核酸序列与SEQ ID NO：1或SEQ ID NO：48的核酸序列具有至少70％的同一性。

在另一优选的实施方案中，突变细胞携带有一种核酸序列，所述的核酸序列已经被上述方法中的任何方法修饰或灭活，而且在相同条件下培养时突变细胞产生少于亲代细胞的蛋白酶或蛋白酶组合。在相同条件下培养时，突变细胞产生的蛋白酶或蛋白酶组合优选比亲代细胞少至少大约25％，更优选少至少大约50％，甚至更优选约75％，而且还更优选约95％。

在一更优选的实施方案中，当在相同条件下培养时，突变细胞与亲代细胞比产生基本上无法检测到的蛋白酶或蛋白酶的组合。

利用已知的方法可以对蛋白酶进行检测。在一个这样的方法中，将一份取自培养48小时的培养基在pH4.0下与³H-标记的抹香鲸肌红蛋白温育，并对TCA-可溶性组分中的放射活性进行检测(van Noort，J.M.，等，1991.分析生物化学(Anal.Biochem)198：385-390)。已对其它鉴定方法进行了描述，它们用于鉴定例如黑曲霉的天冬氨酸蛋白酶A(Takahashi，K.，1991.酶学方法(Meth.In Enzymol.)248：146-155)、内肽酶(Morihara，K.，1995.酶学方法248：242-253)、羧肽酶(Reminton，J.，和Breddam，K.，1994.酶学方法244：231-248)、二肽酶(Ikehara，Y.，等，244：515-227)以及氨肽酶(Little，G.，等，1976.酶学方法45：495-503)。

在另一优选的实施方案中，突变细胞携带有编码目的多肽的核酸序列的至少一个拷贝。

本发明的另一个方面涉及一种对多肽制备有效的宿主细胞，其中宿主细胞为亲代真菌细胞的突变体，其中突变体(a)在相同的条件下培养时与亲代细胞相比产生更多的本发明转录激活因子；而且(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

在一优选的实施方案中，通过向亲代细胞中引入一个或多个拷贝的(i)编码一种转录激活因子的核酸序列、(ii)包括编码一种转录激活因子的核酸序列的核酸构建体或者(iii)如上在“表达载体”部分中所定义的表达载体，当在相同的条件下培养时宿主细胞产生比亲代细胞多的转录激活因子。

包括编码本发明转录激活因子的核酸序列的核酸构建体还可以包括一个或多个核酸序列，所述的核酸序列编码一个或多个有利于指导所述多肽表达的因子，例如转录激活因子(如，反式作用因子)、分子伴侣和加工蛋白酶。在目的丝状真菌细胞选择中有功能的任何因子均可以用于本发明中。编码这些因子中的一个或多个的核酸不必与编码所述多肽的核酸序列串联。

激活因子为一种蛋白，其激活编码多肽的核酸序列的转录(Kudla等，1990，欧洲分子生物学组织杂志(EMBO Journal)9：1355-1364；Jarai和Buxton，1994，当代遗传学(Current Genetics)26：2238-244；Verdier，1990，酵母(Yeast)6：271-297)。编码激活因子的核酸序列可以获自编码酿酒糖酵母血红素活化蛋白1(hap1)、酿酒糖酵母半乳糖代谢蛋白4(gal4)、构巢曲霉氨调节蛋白(areA)以及米曲霉α-淀粉酶激活因子(amyR)的基因。其他实例见Verdier，1990，同上以及MacKenzie等，1993，普通微生物学杂志(Journal of General Microbiology)139：2295-2307。

分子伴侣为一种蛋白，其协助另一种多肽正确地折叠(Hartl等，1994，TIBS 19：20-25；Bergeron等，1994，TIBS 19：124-128；Demolder等，1994，生物技术杂志(Journal of Biotechnology)32：179-189；Craig，1993，科学(Science)260：1902-1903；Gething和Sambrook，1992，自然(Nature)355：33-45；Puig和Gilbert，1994，生物化学杂志(Journal of Biological Chemistry)269：7764-7771；Wang和Tsou，1993，The FASEB Journal7：1515-11157；Robinson等，1994，生物技术(Bio/Technology)1：381-384；Jacobs等，1993，分子微生物学(Molecular Microbiology)8：957-966)。编码分子伴侣的核酸序列可以获自编码米曲霉蛋白二硫化物异构酶或者酿酒酵母calnexin、酿酒酵母BiP/GRP78以及酿酒酵母Hsp70的基因。其他实例见Gething和Sambrook，1992，同上以及Hartl等，1994，同上。

加工蛋白酶为一种蛋白酶，其切割前肽产生成熟的有生物化学活性的多肽(Enderlin和Ogrydziak，1994，酵母10：67-79；Fuller等，1989，美国国家科学院院刊86：1434-1438；Julius等，1984，细胞(Cell)37：1075-1089；Julius等，1983，细胞32：839-852；美国专利第5,702,934号)。编码加工蛋白酶的核酸序列可以获自编码酿酒酵母二肽基氨肽酶、酿酒酵母Kex2、Yarrowia lipolytica二元加工型内切蛋白酶(xpr6)以及尖孢镰刀菌金属蛋白酶(p45基因)的基因。

在一更优选的实施方案中，将编码转录激活因子的核酸序列可操作地与一个启动子或其功能性部分连接，所述的启动子比亲代细胞的相应启动子强。在一更优选的实施方案中，所述启动子或其功能性部分介导编码细胞外蛋白酶的基因表达，例如米曲霉碱性蛋白酶、米曲霉中性金属蛋白酶、黑曲霉曲霉胃蛋白酶、尖孢镰刀菌胰蛋白酶样蛋白酶或者Fusarium venenatum胰蛋白酶。

本发明还涉及一种有效用于多肽制备的宿主细胞，其中宿主细胞为亲代真菌细胞的突变体，其中突变体包括

(a)对本发明转录激活因子或其调控序列的修饰或灭活，以及

(b)(i)诱导性启动子，其可操作地与编码本发明转录激活因子的核酸序列相连，和(ii)所述转录激活因子可以结合的启动子序列，其可操作地与编码所述多肽的核酸序列相连，其中可以将(i)和(ii)同时或顺序引入。

按照上面所公开的任何方法，通过对存在于细胞中并且是天然转录激活因子表达所需的核酸序列进行灭活或修饰可以获得上面(a)中转录激活因子的无活性形式。在一优选的实施方案中，通过下述方法获得所述的灭活或修饰，所述的方法包括，但不限于，一个或多个核苷酸的插入、缺失或取代、特异性或随机诱变、基因置换或基因阻断以及利用与所述转录激活因子的核酸序列互补的核苷酸序列进行的反义技术。在另一优选的实施方案中，通过对所述转录激活因子表达所需的调控序列进行灭活或修饰获得天然转录激活因子的无活性形式。

在另一优选的实施方案中，编码天然转录激活因子的核酸序列具有在SEQ ID NO：1或SEQ ID NO：48中所列的序列。在另一优选的实施方案中，所述的转录激活因子包括具有SEQ ID NO：3中氨基酸序列的多肽。

上面(b)中的可诱导启动子可以为任何启动子序列或其功能性部分，其中根据发酵条件，可以对启动子的转录起始活性进行诱导。优选，该诱导是由一种碳或氮的分解代谢产物介导的。在一优选的实施方案中，启动子为构巢曲霉或米曲霉的amdS启动子；构巢曲霉、米曲霉或黑曲霉的niaD启动子；曲霉属的niiA启动子、曲霉属的碱性磷酸酶启动子、曲霉属的酸性磷酸酶启动子或者黑曲霉的alcA启动子。

在另一优选的实施方案中，宿主细胞还包括一个启动子序列，其中所述的启动子序列可以被所述转录激活因子激活而且它可操作地连接于编码所述多肽的核酸序列。

被本发明转录激活因子激活的启动子序列可以为任何启动子序列或其功能性部分，其选自，但不限于，下述编码基因的启动子：米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、NA2-tpi启动子(黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因启动子的一种杂合体)以及它们突变的、截断的和杂合的启动子。特别优选用于丝状真菌细胞中的启动子为蛋白酶基因的启动子或其功能性部分，例如尖孢镰刀菌胰蛋白酶样蛋白酶基因(美国专利4,288,627)、米曲霉碱性蛋白酶基因(alp)、黑曲霉pacA基因、米曲霉碱性蛋白酶基因、米曲霉中性金属蛋白酶基因、黑曲霉曲霉胃蛋白酶基因或者Fusarium venenatum胰蛋白酶基因。

在另一优选的实施方案中，宿主细胞携带有至少一个拷贝的编码多肽的核酸序列。

在另一优选的实施方案中，当在相同条件下培养时表达本发明转录激活因子的宿主细胞比亲代细胞在产生一种或多种天然蛋白酶时产量减少。利用上述的任何方法可以对所述的蛋白酶进行检测。在一更优选的实施方案中，将一份取自培养48小时的培养基在pH4.0下与³H-标记的抹香鲸肌球蛋白温育，并对TCA-可溶性组分中的放射活性进行检测(van Noort，J.M.，等，同上)。

按照上面在“宿主细胞”部分所述的任何方法可以将本文中所述的核酸构建体引入亲代真菌细胞，以获得一种可有效产生多肽的宿主细胞。在一优选的实施方案中，核酸构建体被整合到细胞染色体中。在另一优选的实施方案中，核酸构建体保持为一种自我复制的染色体外载体。

不言而喻，对于获得突变的真菌细胞，本发明的方法不限于一个具体的顺序。在构建产生多肽的细胞的过程中，可以在任何步骤处将对第二个核酸序列的修饰引入亲代细胞。

制备多肽

本发明的另一方面涉及在本发明的宿主细胞中制备多肽的方法，其包括：(a)在适于所述多肽产生的营养培养基中对携带有编码该多肽的基因的宿主细胞进行培养；并(b)从宿主细胞的营养培养基中回收该多肽。

在一个实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中亲代细胞包括一个或多个编码蛋白酶的基因，所述基因的转录由本发明的转录激活因子激活，而且在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

在另一实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中该突变体(a)在相同的条件下培养时与亲代细胞相比产生更多的本发明转录激活因子；而且(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

在另一实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中该突变体包括(a)对本发明转录激活因子或其调控序列的修饰或灭活，以及(b)可操作地与编码本发明转录激活因子的核酸序列相连的诱导性启动子和所述转录激活因子可以结合的启动子序列，其中可以将(i)和(ii)同时或顺序引入。

利用本领域已知的方法将本发明的宿主细胞培养于适于制备目的多肽的营养培养基中。例如，通过在适当培养基中并在允许对所述多肽进行表达和/或分离的条件下进行摇瓶培养、在实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、分批给料或固态发酵)可以对细胞进行培养。利用本领域已知的方法(见，例如Bennett，J.W.和LaSure，L.编，更多在真菌中的基因操作(More Gene Manipulations in Fungi)，Academic Press，CA，1991)，在包括碳和氮源以及无机盐的适当营养培养基中进行培养。适当的培养基可从供应商处获得，或者可以利用公开的组合物来制备(例如，在美国典型培养物保藏中心的目录中的)。如果所述的多肽被分泌到营养培养基中，那么可以从培养基中直接回收该多肽。如果所述的多肽不被分泌，则从细胞裂解液中将其回收。

通过本领域已知的方法可以对所获的多肽进行分离。例如，通过传统方法可以从营养培养基中对所述的多肽进行分离，所述的传统方法包括，但不限于，离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后通过本领域已知的多种方法可以对分离的多肽进行进一步纯化，所述的方法包括，但不限于，层析法(例如，离子交换层析、亲和层析、疏水层析、层析聚焦以及大小排阻层析)、电泳方法(例如，制备型等电聚焦)、差异溶解法(例如，硫酸铵沉淀)或者提取(见，例如蛋白质纯化(Protein Purification)，J.-C.Janson和Lars Ryden编，VCH Publishers，纽约，1989)。

利用本领域已知的特别针对所述多肽的方法可以对该多肽进行检测。这些检测方法包括特异性抗体的利用、酶产物的形成、酶底物的消失或者SDS-PAGE。例如，可用酶检测法测定所述多肽的活性。很多酶的酶活性测定法在本领域是已知的。

在本发明的方法中，当在相同的条件下培养时，宿主细胞产生的所述多肽比相应的亲代细胞至少多大约20％，优选至少多大约50％，更优选至少多大约100％，甚至更优选至少多大约200％，最优选至少多大约300％。

所述的多肽可以为任何多肽，不论对突变体丝状真菌细胞是天然的还是异源的。本文中将术语“异源多肽”定义为一种并非由细胞产生的多肽。本文中术语“多肽”并非意指一种特定长度的编码产物，因而包括肽、寡肽和蛋白质。所述的多肽还可以为细胞天然多肽的重组多肽，其由一个核酸序列编码，所述的核酸序列包括一个或多个与该核酸序列不同来源的调控序列，所述的调控序列参与所述多肽的制备。所述的多肽可以为野生型多肽或其变体。所述的多肽还可以为一种杂合多肽，其包括对获自至少两种不同多肽的部分或整个多肽序列的联合，其中所述多肽中的一个或多个对于所述的细胞可以是异源的。多肽进一步包括上述多肽的天然等位基因变体和改造的变体。

在一优选的实施方案中，所述的多肽为抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报告分子或转运蛋白。

在一更优选的实施方案中，所述的酶为氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。

在一还更优选的实施方案中，所述的酶为氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶(cutinase)、脱氧核糖核酸酶、葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶(glucoamylase)、α-糖苷酶、β-糖苷酶、卤过氧化物酶(haloperoxidase)、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶裂解酶(pectinolytic enzyme)、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶或木聚糖酶。

在另一还更优选的实施方案中，所述的多肽为人胰岛素或其类似物、人生长激素、红细胞生成素或促胰岛素激素。

编码异源多肽的核酸序列可以获自任何原核的、真核的、或其他来源。为了本发明的目的，本文中与给定来源连用的术语“获自”意指所述的多肽由该来源产生或者由其中已经插入了来自该来源的基因的细胞产生。

在本发明的方法中，突变体丝状真菌细胞还可以用于细胞天然多肽的重组制备。对天然多肽重组制备可通过将编码该多肽的基因置于另一个启动子的控制下以提高该多肽的表达，通过利用信号序列以加速目的天然多肽转运到细胞外，以及增加由细胞正常产生的多肽编码基因的拷贝数。在术语“异源多肽”的范围内，本发明还包括细胞天然多肽的此类重组制备，在这个意义上此类表达涉及非细胞天然的遗传元件的利用，或者固有元件的利用，所述的固有元件经过处理以一种正常在丝状真菌细胞中不存在的方式发挥作用。用于分离或克隆异源多肽的核酸序列的技术在本领域是已知的，包括从基因组DNA分离、从cDNA制备或者两者结合。例如通过利用众所周知的聚合酶链式反应(PCR)可以实现从此类基因组DNA克隆所述核酸序列。见，例如，Innis等，1990，PCR方案：方法和应用指导(PCR Protocols：A Guide to Methods and Application)，Academic Press，纽约。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段向载体分子中的插入以及重组载体向突变体真菌细胞中的掺入，在所述的真菌细胞中所述核酸序列的多个拷贝或克隆将被复制。所述的核酸序列可以为基因组、cDNA、RNA、半合成、合成来源的，或者它们的任何组合。

在本发明的方法中，异源多肽还可以包括融合的或杂合的多肽，其中将另一种多肽融合于所述多肽或其片段的N-末端或C-末端。通过将编码一种多肽的核酸序列(或其一部分)融合于编码另一种多肽的核酸序列(或其一部分)可对融合多肽进行制备。用于制备融合多肽的技术在本领域是已知的，并且包括，将所述多肽的编码序列连接以便它们阅读框一致而且融合多肽的表达处于相同启动子和终止子的控制下。杂合多肽可以包括对获自至少两种不同多肽的部分或整个多肽序列的联合，其中所述多肽中的一个或多个对于所述的突变体真菌细胞可以是异源的。对分离的编码目的异源多肽的核酸序列可以以多种方式进行处理以用于所述多肽的表达。表达应被理解为包括参与所述多肽产生的任何步骤，其包括，但不限于，转录、转录后修饰、翻译、翻译后修饰以及分泌。根据表达载体，对编码多肽的核酸序列在其插入到载体中之前进行的处理是理想的或必需的。用于通过利用克隆方法修饰核酸序列的技术在本领域中是众所周知的。

通过下面的实施例对本发明进行进一步描述，不应将实施例认为是限制本发明的范围。

实施例

材料

用作缓冲液和底物的化学制品为至少试剂级的商品化的产品。

菌株

AB4.1：黑曲霉的一个菌株，其为菌株ATTC 9029的一个cspA1 pyrG1衍生株(van Hartingsveldt，W.，等，1987.分子和普通遗传学206：71-75；Bos，C.J.，等，当代遗传学14：437-443)。

AB1.13：黑曲霉的一个蛋白酶缺陷菌株，其源自AB4.1的UV诱变(Mattern，I.E等，1992.分子和普通遗传学234：332-336)。

13PAP2：AB1.13的一个衍生株，其含有黑曲霉的pepA启动子(Jarai G.和Buxton F.1994.当代遗传学26：238-244)控制下的多个拷贝构巢曲霉amdS基因(Corrick，R.A.，等，1987.基因(Gene)53：63-71)。该菌株具有蛋白酶缺陷表型而且在含有乙酰胺作为唯一氮源的培养基上无法生长。菌株13PAP2已经以DSM NO.12298的名称保藏于DSM。

4PAP6：AB4.1的一个衍生株，其含有黑曲霉的pepA启动子控制下的多个拷贝构巢曲霉amdS基因。该菌株不具有蛋白酶缺陷表型，而且在含有乙酰胺作为唯一氮源的培养基上能够生长。

N402：黑曲霉的一个菌株，其以ATCC号：64974保藏于ATCC(ManassasVA，美国)。

MC1046：大肠杆菌的一个菌株，其以ATCC号：35467保藏于ATCC。

米曲霉IFO4177：得自发酵学院(Institute for Fermentation)，大阪；17-25Juso Hammachi 2-Chome Yodogawa-Ku，大阪，日本。

HowB101：记述于WO 97/35956。

质粒

pPAP：如下在实施例1中所述进行构建并示于图1中

pAopyrGcosArp1：如下在实施例1中所述进行构建并示于图2中

pEES1：如下在实施例1中所述进行构建并示于图3中

p3SR2：如由C.M.Corrick，A.P.Twomey和M.J.Hynes(1987.基因53：63-71)所述，含有构巢曲霉amdS基因

pABPYRG*-Not：如由Verdoes，J.C.，等(1994.基因145：179-187)所述，含有被灭活的pyrG基因

pHelp1：含有来自米曲霉的pyrG基因作为筛选标记，并含有使其可以在黑曲霉中自我复制的AMA1序列，如由Gems，D.，等(1991.基因98：61-67)所述，它们被克隆到大肠杆菌载体pIC20R中

pAnscos1：如由Osiewacz，H.D.(1994.当代遗传学26：87-90)所述，含有两个cos位点

pAO4-2：如由De Ruiter-Jacobs，Y.M.J.T.等(1989.当代遗传学16：159-163)所述，含有米曲霉pyrG基因

pAO4-13：如由De Ruiter-Jacobs，Y.M.J.T.等(1989.当代遗传学16：159-163)所述，含有米曲霉pyrG基因

pUC19：如由Yanisch-Perron，C.，Vieira，J.，和Messig，J.(1985.基因33：103-119)所述

pDV8：记述于实施例8中，参见图7。

pJaL554：记述于实施例8中，参见图8。

生物材料的保藏

下列生物材料已经按照布达佩斯条约保藏于德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Microorganismen und Zellkulturen GmbH，Mascheroder Weg 1b，D-38124Braunschweig，德国)，保藏号如下：

保藏保藏号保藏日期

大肠杆菌，pEES DSM 12294 1998-07-14

黑曲霉13PAP2 DSM 12298 1998-07-14

保藏菌株在本发明申请过程中可确保获得。所述保藏是所述保藏菌株的基本纯的培养物。在提交本发明副本或其后续申请的国家中如果外国专利法规要求，可以获得所述保藏。但是应予以理解的是可获得保藏并不构成在侵害根据国家法规授与的专利权的情况下获得实施本发明的许可。

实施例1：黑曲霉prtT转录激活因子的克隆

prtT基因克隆自13PAP2，一种黑曲霉突变株，所述的菌株无法表达由pepA蛋白酶基因启动子调节的amdS基因，具有蛋白酶缺陷表型(prt-)。

黑曲霉13PAP2报告分子菌株的构建

通过连接下面的三个片段对质粒pPA1进行构建：

1)经EcoRI和KpnI消化的大肠杆菌载体pBlueScript II SK(Stratagene Cloning System，La Jolla CA，美国)；

2)一个1.4kb的EcoRI/BamHI限制性片段，其包括1.2kb的pepA基因启动子区和与之相连的从起始密码子到一内部BamHI位点的大约130bp的amdS编码序列，通过PCR扩增获得；以及

3)来自p3SR2的一个2.1kb的BamHI/KpnI片段，其含有构巢曲霉amdS基因的大部分

片段2是通过两个步骤来构建的。在第一步中，以如下在“粘粒文库的构建”部分中所述从原生质体中制备的来自黑曲霉N402的基因组DNA用作模板，将下面所示的两条寡核苷酸，pepApr和pepA/amdS，用作引物：

PepApr：CGG AAT TCG CAT GCT GGA GGT GCT TCT AA(SEQ ID NO：6)

pepA/amdS：TTC CCA GGA TTG AGG CAT TTT GAC CAC GAG AAT(SEQ ID NO：7)

然后，将获自该反应的1200bp的PCR产物与下面所示的寡核苷酸MBL1213一起，在第二个PCR反应中用作引物，并以质粒p3SR2作为模板。

MBL1213：TAA CTT CCA CCGAGG TC(SEQ ID NO：8)

随后将上述的3个片段连接，所获产物转染到大肠杆菌DH5α中。

在最后的构建步骤中，将pPA1用NotI进行消化，并连接于来自pABPYRG*-Not的一个3.8kb的NotI片段，获得示于图1中的质粒pPAP。将pPAP转化到黑曲霉AB1.13中，并对pPAP以多个拷贝整合到pyrG位点的转化体进行分离。将该转化体的一个自发的5flourotic acid(FOA)抗性、需尿苷的突变体命名为13PAP2，其可以用pyrG基因补足。

pAopyrGcosArp1的构建

通过将下面的3个片段连接随后转染到大肠杆菌DH5α中来对质粒pAopyrGcosArp1进行构建：

1)经Acc65I和BamHI切割的大肠杆菌载体pHelp1

2)来自pAnscos1的一个3.0kb的BamHI/HindIII片段，其含有2个cos位点

3)来自pAO4-2的一个3.2kb的Acc65I/HindIII片段，其含有米曲霉pyrG基因

所获的质粒pAopyrGcosArp1在曲霉中可以自我复制，并且可以通过在缺少尿苷的培养基上培养来对其进行筛选。在图2中对pAopyrGcosArp1进行了描述。

粘粒文库的构建

利用“SuperCos1粘粒载体试剂盒”(Stratagene Cloning Systems，La Jolla CA，美国)按照供应商的说明构建一个黑曲霉的粘粒文库。

从通过标准方法制备的原生质体中制备黑曲霉N402的基因组DNA。

分离后，通过在Beckman GS-6R中于2000rpm离心10分钟使原生质体沉淀，然后将沉淀悬于含有22.5mM三异萘磺酸(tri-isonaphtalene sulphonic acid)、275mM对氨基水杨酸、0.2M Tris-HCl(pH8.5)、0.25M NaCl和50mMEDTA的缓冲液中，随后立即加入1个体积的苯酚/氯仿(1∶1)。小心混合并于3000rpm离心20分钟后，轻轻倾出水相并利用标准的方法沉淀DNA。

通过在0.3％的琼脂糖凝胶上以30伏电压于4℃电泳20个小时来对基因组DNA的大小进行分析。溴化乙锭染色的凝胶显示所获DNA的大小从50kb到大于100kb。利用MboI对所述DNA进行部分消化。通过与上面相同类型的凝胶分析所确定的，消化后DNA的大小为30到50kb。将利用QIAGEN(Venlo，荷兰)的试剂盒按照说明书纯化的pAopyrGcosArp1载体用BamHI消化、去磷酸化并凝胶纯化。按照标准的方法进行连接和组装。

在测定文库的滴度后，将一次连接和组装的所有组装混合物转染到宿主细胞MC1046中，并于50μg/ml氨苄青霉素LB平板上铺板。获得了大约40,000个菌落。来自10个菌落的粘粒制备物显示它们都有预期大小的插入子。然后将40,000个菌落浸泡于LB培养基中并从平板上刮下，然后分装，在15％甘油中储藏于-80℃。这代表对黑曲霉基因组大约40倍的扩增。

黑曲霉prtT克隆的筛选

从所述的文库中制备粘粒DNA并按照由P.J.Punt和C.A.M.J.J.Van DenHondel(1992.酶学方法216：447-457)所描述的转化方法将其引入13PAP2。反复尽力对pyrG标记进行筛选只导致回收了4000到30,000个转化体。对pyrG标记和在含乙酰胺作为唯一氮源的培养基上的生长所进行的双重筛选，从5个不同的实验中产生一共65个初级转化体。

对每个初级转化体筛选蛋白酶活性、在含乙酰胺作为唯一氮源的培养基上的生长以及这两个特征的不稳定性。通过在含乙酰胺的培养基上生长而筛选的乙酰胺酶⁺表型是因报导基因表达盒内pepA启动子的激活而导致的乙酰胺酶活性的一个指示，在所述的表达盒中pepA启动子连接于amdS编码序列。利用含透析过的脱脂奶作为唯一氮源的基本培养基平板对蛋白酶⁺表型进行筛选(Mattern，I.E.，等，1992.分子和普通遗传学234：332-336)。在这些平板上，野生型的AB4.1菌株产生清晰的环，而AB1.13突变体则产生很小的环。这种差别并非由于pepA活性的不同，因为pepA缺失的菌株在这些平板上也可以产生大的环。因此，在乳平板上形成大的环表示其他细胞外蛋白酶的激活。

通过在含尿苷的培养基上培养稀释的孢子原种来对不稳定性进行检测。从这些平板种挑取单个孢子衍生的菌落，并对其检测蛋白酶活性和在乙酰胺上的生长。筛选结果揭示在超过70％的菌落中这两种特征均已丧失。因此，所述的两个表型或者一同丧失，或者一同保留，表明pepA启动子和其他蛋白酶启动子的激活被协同调节，并且与pyrG标记的存在相关联。负责该表型的基因被称为prtT。然后分离了12个乙酰胺酶⁺、蛋白酶⁺转化体。

黑曲霉prtT基因的分离

为了从13PAP2的乙酰胺酶⁺、蛋白酶⁺转化体中挽救prtT基因，如前所述，从生长于基本培养基中的菌丝体中制备DNA。将该DNA用于尝试转化大肠杆菌DH5α感受态细胞。获得数百株氨苄青霉素抗性菌落。DNA分析显示它们均含有源自pHelp1质粒的序列。然后将从大肠杆菌菌落中分离的粘粒DNA重新转化到13PAP2中。两个DNA样品产生转化体，所述的转化体表现出在含有乙酰胺培养基上生长以及增高的蛋白酶活性。然后用几种限制性酶对来自粘粒之一，ACR1的DNA进行消化。然后将所获的片段与pAopyrGcosArp1一起共转化到菌株13PAP2中。EcoRI、PstI、BamHI和KpnI对ACR1的消化产生了能够在乙酰胺上生长并具有高蛋白酶活性的转化体，而SalI和HindIII消化则未产生。因为EcoRI消化产生最简单的模式，所以对单个EcoRI片段利用凝胶进行分离并与pAopyrGcosArp1一起用于共转化13PAP2。只有一个15kb的EcoRI片段产生了能够在含乙酰胺培养基上生长的转化体。为了从粘粒中亚克隆prtT，将该片段亚克隆到pBluescript II SK中。由于该克隆的插入片段仍相当大，所以对分离的PstI条带通过凝胶进行分离并将每个与pAopyrGcosArp1一起共转化到13PAP2中。只有一个2.5kb的PstI片段产生了能够在含乙酰胺培养基上生长的转化体。将该片段亚克隆到pBluescript II SK中。基于限制性图谱，由该质粒构建4个亚克隆，ClE 0.7、ClE 1.8、NcE 1.1和NcE 1.4。此外，对一个6.5kb的SstI/EcoRI片段进行了亚克隆，得到了pEES1(示于图3中)，所述的SstI/EcoRI片段包括2.5kb的PstI片段。

对来自AB4.1的基因组DNA进行的SOUTHERN印迹分析表明只存在一个拷贝的prtT。

实施例2：对黑曲霉prtT基因的测序以及序列分析

利用来自Perkin-Elmer公司(Branchburg NJ，美国)的罗丹明终止剂循环测序试剂盒或BigDye^TM终止剂循环测序试剂盒制备所有的测序反应。将反应在ABI

377DNA测序仪(Perkin-Elmer公司)上按照制造商的说明来运行。

从基因组克隆ClE 0.7、ClE 1.8、NcE 1.1、NcE 1.4和pEES1中对prtT基因进行测序。将所用的序列特异性引物列举如下：

122958：CGA TCG ATG ACT GCC TGT(SEQ ID NO：9)

122956：AGA GAC ACA TAG TGC CTT(SEQ ID NO：10)

122959：GCT TAT AGT CGA TAG CGC(SEQ ID NO：11)

122960：CCT CTC TCC AGC GAT GGT(SEQ ID NO：12)

122962：ATG GAA TAC ATA CTG CTT(SEQ ID NO：13)

122961：ATG AAA CCC ACT GTA GCT(SEQ ID NO：14)

122963：TGC TCG ATA AGC GGG TCC(SEQ ID NO：15)

122964：AAT CTT ATG GAC CCG CTT(SEQ ID NO：16)

124289：CCC CGG GAA ACA AGA ACA GG(SEQ ID NO：17)

124290：GTT GGC GGA CCT TGA CTA TG (SEQ ID NO：18)

125112：ACA GCT ACA GTG GGT TTC ATC T(SEQ ID NO：19)

125111：AGT CAA CGG GGG AAG TCT C(SEQ ID NO：20)

128330：CTA GCA GCG TAT CGG TCA GC(SEQ ID NO：21)

130887：CTT GGA AAA GAA ACG ATA G(SEQ ID NO：22)

130888：AAC GTA CGC TTT CCT CCT T(SEQ ID NO：23)

134135：GGG TCC GTC CAG TCC GTT CTT(SEQ ID NO：24)

-48反向：AGC GGA TAA CAA TTT CAC ACA GGA(SEQ ID NO：25)

-40通用：GTT TTC CCA GTC ACG AC(SEQ ID NO：26)

利用下述引物，通过对分离自突变株AB1.13的基因组DNA进行PCR扩增获得了该基因的一个突变的等位基因：

PstI：TC ATC CCT GGT GTT ACT GC(SEQ ID NO：27)

PstII：C ATG GAT TGG CTG GCC G(SEQ ID NO：28)

prtT基因的完整DNA序列示于SEQ ID NO：1中。所述突变的等位基因的PCR片段的序列示于SEQ ID NO：4中。

利用计算机软件Netgene 2(S.M.Hebsgaard，P.G.Korning，N.Tolstrup，J.Engelbrecht，P.Rouze，S.Brunak，1996.核酸研究24：3439-3452)对DNA序列SEQ ID NO：1的分析表明存在5个外显子(见SEQ ID NO：1的注释)

黑曲霉prtTcDNA的分析

利用市售的多聚(A)⁺RNA分离试剂盒(Pharmacia，Uppsala SE)从来自黑曲霉培养物的总RNA(根据上述实施例1中所述DNA的分离方法分离)中纯化mRNA，所述的黑曲霉培养物在有利于蛋白酶产生的条件下生长(J.P.T.N.Van Den Hombergh，等，1997.欧洲生物化学杂志(Eur.J.Biochem.)247：605-613)。利用标准的方法制备双链cDNA并将其用于利用下列引物进行的PCR反应：

寡聚-dT引物：T₂₀N

Prt270n：TACTCTCCAGATTGCCTG(SEQ ID NO：29)

Prt1420r：TGAGATACCACTCAGCAG(SEQ ID NO：30)

prt1350n：TGCACTTCTCTGTCTCTG(SEQ ID NO：31)

Prt2365r：GACTTCTGGCATCAGTTG(SEQ ID NO：32)

prt2320n：CTCATGGATGGCATGATC(SEQ ID NO：33)

利用引物Prt270n和Prt1420r进行的PCR反应产生一个大约1.0kb的片段。将该片段克隆到pGEM-T载体(Promega公司，Madison WI，美国)中，并利用引物122958、122960、-40通用和-48反向对所获质粒中的插入序列进行测序。结果证实在所述基因的该部分存在2个内含子。

利用引物Prt1350n和Prt2365r进行的第二个PCR反应产生大约0.9kb的片段。将该片段也克隆到一个pGEM-T载体中，并利用引物124289、124290、-40通用和-48反向对所获质粒中的插入序列进行测序。结果证实在所述基因的该部分存在1个内含子。

利用寡聚-dT引物和引物Prt2320n进行的另一个PCR反应产生大约350bp的片段。将该片段也克隆到一个pGEM-T载体中。利用引物-40通用和-48反向对插入序列进行的测序表明该片段含有prtT基因的3’部分并证实存在另一个内含子。

对所翻译的prtT基因推导的蛋白质序列示于SEQ ID NO：2中。对所翻译的突变等位基因prtl3推导的蛋白质序列示于SEQ ID NO：5中。SEQ IDNO：2和SEQ ID NO：5的比较表明两者之间唯一的差别在第112位上，在该位点上，所翻译的prtT基因中的亮氨酸残基在所翻译的prtl3基因中被脯氨酸取代。

对所推导prtT蛋白序列的分析显示存在一个Zinc(II)2Cys6双核簇(binuclear cluster)DNA结合基元(SEQ ID NO：2，47-81位残基)。该基元对GAL4类真菌转录激活因子进行了界定(Reece，M.J.，和Ptashne，M.1993.科学261：909-911)。所述基元在prtT基因中的存在强烈表明prtT为一种转录激活因子。

实施例3：在野生型黑曲霉菌株中对prtT基因的阻断

构建了一种质粒，其中由米曲霉的pryG基因将prtT基因的上游和下游序列分隔开。将质粒pEES1用MunI和NheI消化，去除一个含有prtT大部分编码序列的2.1kb片段。将来自pAO4-13的一个含有米曲霉pyrG基因的2.3kb EcoRI/NheI片段克隆到pEES1的MunI和NheI位点中。所获的质粒被称为pDprt，其示于图4中。然后将该构建体用于转化黑曲霉菌株AB4.1使之变成尿苷原养型。然后在含脱脂奶的平板上对大约150个尿苷原养型转化体分析蛋白酶的活性。这些转化体中有5个在这些平板上不形成晕环，表明蛋白酶活性非常低。prtT基因被阻断的菌株与突变的AB1.13菌株相比在蛋白酶活性或表型上未显示出任何差别。

实施例4：黑曲霉PrtT的过表达

对一种质粒pGPprt(图5)进行构建，其含有与黑曲霉gpd基因启动子融合的prtT的编码区和3′非编码区。gpd基因编码3-磷酸甘油醛脱氢酶，其为参与基本代谢的一种组成型表达酶。所用的启动子为编码区上游的一个片段。将所述的质粒与pyrG筛选质粒pAO4-13共转化到黑曲霉AB4.1中。对通过SOUTHERN印迹分析确定prtT转录增加的转化体分析其增高的蛋白酶表达。

实施例5

从米曲霉prtT基因分离Zn²⁺-指状结构

黑曲霉prtT基因表示为SEQ ID NO：1。导自prtT的DNA序列(SEQ ID NO：2)的蛋白序列包含一个称作Zn²⁺-指状结构基元的结构，预计其负责prtT编码的转录激活因子的DNA结合。Zn²⁺-指状结构基元具有下列氨基酸序列： MetThr Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu Asp Pro Arg GlyHis Ala Cys Arg Arg C

通过DNA Technology A/S，Forskerparken，Gustav Wieds vej 10，DK-8000Aarhus C，丹麦，设计并合成能编码来自基元的氨基酸序列的简并引物。所述引物具有下面的序列：

137396：A T G A C C/T G C C/T T G C/T C A C/T A C C/T T G(SEQID NO：35)

137397：A A/G A/G C A A/G/C/T C G A/G/C/T C G A/G C A A/G G CA/G T G(SEQ ID NO：36)

所述引物用于以基因组米曲霉IFO4177DNA作模板的PCR反应中。进行所述反应的总体积为100μl，其中含有154pmol的引物137396和10164pmol的引物137397。进行30个PCR循环，56℃为退火温度，延长时间为30秒。进行另一PCR反应，采用黑曲霉基因组DNA和引物137394：ATGACTGCCTGTCACACATG(SEQ ID NO：37)和137395：AGACAGCGACGGCACGCATG(SEQ ID NO：38)，它们特异于黑曲霉prtT基因。在此反应中，在100μl反应液中采用各10pmol引物。将两个反应的等分试样上样到3％琼脂糖凝胶。电泳后，在米曲霉反应液中可见3个强度大致相当的带，在黑曲霉反应液中有两个。黑曲霉反应液中的一条带比另一条深，并具有预计的大小。米曲霉的一条带大小相当于黑曲霉的最深的一条带，将其从胶中分离。将片段克隆入载体pCR2.1(Invitrogen^TM)。对来自两个各自克隆的质粒进行测序。序列显示于图1中。两个序列末端不同，反应它们源于不同的简并引物。它们在中间40bp相同，其扩增自基因组DNA。此40个碱基对编码与部分黑曲霉prtT基因的Zn²⁺-指状结构的相同的多肽。

实施例6

米曲霉prtT基因的N-末端的分离

反向PCR方法用于分离米曲霉prtT基因。DNA Technology A/S(丹麦)合成了引物144428：CACCGAGTTTTAAGCTTGCGG (SEQ ID NO：39)和144429：GCGATCTTGATCCACGAGGG(SEQ ID NO：40)。用几个限制酶切基因组DNA并重新连接。将连接混合物用作PCR反应模板，使用引物144428/144429。在采用BamHI限制酶切并采用重新连接的DNA作模板的反应中，琼脂糖凝胶电泳后观察到约2.5kb的片段。通过随机引发的方法用³²P标记片段，并用作针对含有基因组米曲霉DNA载网(gridded)粘粒文库的滤膜的探针。WO 98/01470中记述了文库的构建。粘粒11F8显示同探针的正杂交信号。包含来自用BamHI，EcoRI，PstI或XhoI限制酶切的11F8和基因组DNA的DNA的Southern blot采用2.5kb反向PCR片段探测。将基因组DNA的杂交带大小与粘粒DNA的相对比。由于基因组DNA只有一少部分带在粘粒中有对应，显然所述粘粒发生了一些重排。两个来自粘粒的杂交片段，1.2kb EcoRI片段和1.0kb PstI片段看起来与基因组片段杂交大小相等。从粘粒亚克隆所述两个片段并测序。对序列数据的分析表明所述片段重叠。总共得到了序列的1497bp。编码Zn²⁺-指状结构的寡核苷酸没有包括在所述序列内。发现BamHI位点位于接近所述序列一端的只被EcoRI亚克隆覆盖的区，这样可以确定相对于Zn²⁺-指状结构的测序的基因组片段。引物153468：CGGGATGAATTGTAGAGAGGC(SEQ ID NO：41)由DNATechnology A/S(丹麦)制备。所述引物序列包含在所述1497bp的片段中。发现它位于最接近Zn²⁺-指状结构的一端，并指向那个方向。还由DNATechnology A/S(丹麦)制备了两个引物，它们都是prtTZn²⁺-指状结构的特异性序列并指向下游(140358)或上游(140359)。两个引物的序列如下：140358：CGCAAGCTTAAAACTCGGTGCGATC(SEQ ID NO：42)和140359：CCTCGTGGATCAAGATCGCA(SEQ ID NO：43)。以基因组DNA为模板，分别进行两个PCR反应，一个采用引物153468和140358，一个采用153468和140359。通过琼脂糖凝胶分析，采用153468和140359的反应得到约1.1kb片段的带，另一个反应没有可见的带。将1.1kb片段克隆到pCR4Blunt-TOPO(Invitrogen^TM)并测序。所述片段包括Zn²⁺-指状结构部分和与1497bp片段的重叠。对该序列的翻译显示所述紧接在Zn²⁺-指状结构上游的区编码与黑曲霉prtT的N-末端同源的多肽。

实施例7

完整米曲霉prtT基因的分离

所述基因的残余部分通过两个连续循环的反向PCR克隆。在第一个反向PCR反应中，用EcoRV酶切基因组DNA并重新连接。PCR反应采用的引物为175653：GATGAAAAGAATAATCGGCGAG(SEQ ID NO：44)和175654：CGCGGCACACTACCCCCGTTG(SEQ ID NO：45)。所述反应合成了1.9kb片段，将其克隆到pCR4Blunt-TOPO载体并测序。序列数据分析表明所述片段包含与黑曲霉prtT基因同源的基因，所述基因的3’端缺失。如此进行第二个反向PCR反应。所述引物是B0403G08：ATCTAGCTCAAGCATTAGCGGC(SEQ ID NO：46)和B0403G09：AATTTCGGCCCTTTAGTGTCC(SEQ ID NO：47)。BglII酶切并重新连接的基因组DNA用作模板。得到一2.4kb片段，并将其克隆到pCR4Blunt-TOPO载体并测序。对序列的分析表明已经得到了完整的米曲霉prtT基因。所述米曲霉prtT基因表示为SEQ ID NO：48，推断的被编码蛋白的氨基酸序列表示为SEQ ID NO：49。

实施例8

米曲霉prtT基因的破坏

采用阳性(positive)/阴性(negative)选择方法破坏米曲霉prtT基因。破坏的盒式结构(cassette)由2kb米曲霉prtT基因(SEQ ID NO：48)组成，其正中间插入了prtG基因，将其克隆到载体(pDV8)中，所述载体含有单纯疱疹病毒I tymidine激酶基因(HSV-tk)，其侧接真菌表达信号。tymidine激酶基因的表达使宿主对5-氟-2-脱氧尿苷敏感。可通过对prtG阴性宿主中的prtG基因的阳性选择和不选择(deselection)对5-氟-2-脱氧尿苷的tymidine激酶分离破坏的菌株。由于tymidine激酶基因和prtG基因在同一DNA片段中出现，选择其中发生双交换(double cross-over)的转化体。与只用一个破坏盒的转化相比，所述系统每微克DNA得到更少的转化体，但是其中发生所要的同源重组事件的转化体的频率大大提高。

这里所用的pyrG基因侧接通过选择5-氟乳清酸抗性完成较后去除的重复序列。所述pyrG基因分离自质粒pJaL554。

pDV8质粒

pDV8由Matthew S.Sachs惠赠，University of Oregon，PO Box 91000，Portland，OR 97291-1000，美国。pDV8(图7)是基于pSP65的质粒，其在1.2kb BglII/BamHI片段上含有HSV-tk基因(Promega^TM)，所述片段插入到构巢曲霉gpd启动子1.0kb XhoI/BglII片段和包含有构巢曲霉trpC转录终止子的0.8kb BamHI/HindIII片段之间。

构巢曲霉gpd启动子和trpC转录终止子取自质粒pAN51-2(Punt等，(1990)，Gene 93，101-109页)。HSV-tk基因记载于McKnight S.L.，(1980)，Nucleic Acids Res.8：5949-5964，Database登记号：EMBL v00470，位点252-1479。pDV8的构建记载于Vaught-Alexander D(thesis)Expression of the herpes simplex virus type-1thymidine kinase gen in Neurospora crassa，(1994)，Oregon Graduate Institute of Science&Technologh，University of Portland，POBox 91000，Portland，OR 97291-1000，美国。本申请中pDV8序列包含于SEQID NO：50中。通过转化包含米曲霉niaD基因的pDV8衍生物到米曲霉niaD突变体来分离pDV8米曲霉转化体的单-，双-和多拷贝。通过Southern分析来确定HSV-tk基因的拷贝数量。将转化体和未转化宿主接种到包含不同浓度5-氟-2-脱氧尿苷的平板上。根据对平板上生长情况的观察决定在平板中使用6μM 5-氟-2-脱氧尿苷用于以后的阳性/阴性选择实验。在此浓度下，没有pDV8转化体生长，而非转化宿主只受到轻微抑制。

pJaL554的描述：

通过将316bp Asp718-NheI片段连接到来自包含pyrG的质粒pSO2的5336bp SpeI-SspBI片段来构建pJaL554(记载于WO 97/35956)。因此，pJaL554位于侧接316重复序列的米曲霉pyrG基因上。其构造参见图8。

pDV8载体中prtT破坏质粒的构建：

对染色体米曲霉IFO4177DNA进行PCR反应，采用的引物B1042E05：CGCGCGTATCCTATTGCC(SEQ ID NO：51)和B 1450E07：GCCGGAAATGTTGTACCTAC(SEQ ID NO：52)。

获得2078碱基对的片段并克隆到pCR4Blunt-TOPO(Invitrogen^TM)载体。采用标准M13正向(-40)和反向引物对所得质粒测序，确保所获质粒正确。通过限制酶EcoRV从载体切除PCR片段，所述酶切在片段内进行两次。酶切位点位于SEQ ID NO：48的1位和1964位。所述1964bp片段与pDV8载体连接，所述载体已用HindIII酶切并钝化，以大肠杆菌DNA聚合酶I和dNTP的Klenow片段填充末端。所得质粒用HindIII酶切，其位于SEQ ID NO：48位点962的prtT片段(在编码Zn²⁺-指状结构的部分)，去磷酸化并与分离自pJaL554的pyrG基因连接成为一2.5kb的HindIII片段。

prtT破坏菌株的选择：

采用NotI线性化如上所述的破坏质粒并转化到米曲霉HowB101(如WO97/35956所述)，其是IFO4177的pyrG阴性衍生物。如EP0238023所述完成转化。在含有Coves盐溶液的平板上筛选转化体(Cove DJ，(1966)，Biochim.Biophys.Acta 113：51-56)，还含有为渗透稳定及用作碳源的1M蔗糖，以及20g/L琼脂，10mM NaNO3和6μM 5-氟-2-脱氧尿苷(Sigma)。所述转化体在同样类型平板上再分离一次。通过Southern blot分析鉴定带有破坏的prtT基因的转化体。

带有prtT破坏体的菌株用作表达截短的PDI基因(蛋白二硫化物异构酶基因)的宿主，所述基因位于表达质粒pCaHj445上(记载于美国专利5879664)。通过用包含构巢曲霉amdS基因的质粒p3SR2共转化，pCaHj445转化到米曲霉prtT破坏菌株。如EP0238023所述完成转化和在乙酰胺平板上的筛选。再次分离后，所述转化体在摇瓶或发酵罐中发酵，从所述发酵液中纯化所述PDI蛋白。

在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内，因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上，除了那些在此所示并描述的修改外，本领域的技术人很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。

本文中引用了各种参考文献，其公开内容全文引入作为参考。