CN1661014B

CN1661014B - 分离突变体及克隆互补基因的新方法

Info

Publication number: CN1661014B
Application number: CN200410012059.9A
Authority: CN
Inventors: 伦德特·亨德里克·德格拉夫; 亨丽埃特·凯瑟琳娜·范登布勒克; 雅克·菲瑟
Original assignee: Danisco US Inc
Current assignee: DuPont Nutrition Biosciences ApS; Danisco US Inc
Priority date: 1995-06-23
Filing date: 1996-06-24
Publication date: 2013-05-29
Anticipated expiration: 2016-06-24
Also published as: PL324186A1; NZ311181A; DE69637359D1; EP1514936A3; DK0833922T3; CA2224626C; CN1192106C; BR9608910A; WO1997000962A1; PT833922E; US20030175893A1; US6177261B1; DE69637908D1; EP0833922B1; JP4339400B2; EP1514936B1; JPH11507838A; AU714511B2; EP0833922A1; US8461320B2

Abstract

本发明提供了编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明还提供了包括调节物编码序列的缺乏或突变的突变宿主细胞以及通过培养上述的突变宿主细胞以产生不具有木聚糖裂解副活性的蛋白质或多肽的方法。本发明也提供了所述核酸序列或其等价核酸序列用于过量表达靶基因的用途。

Description

分离突变体及克隆互补基因的新方法

本申请是申请号为96196200.3、申请日为1996年6月24日、发明名称为“分离突变体及克隆互补基因的新方法”的中国发明专利申请的分案申请。

技术领域

本发明属于微生物突变及筛选突变体领域，具体地，本发明涉及一种编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明还涉及以一种简单、直接和特异性的方式获得代谢突变体。

背景技术

目前可以工业应用的并能自动化的制备突变体的方法是没有筛选过程以及后续分析突变体过程的突变方法，这一方面需改进。一种带有筛选过程的替代方法总是需要一富集步骤，而后基于生长或不生长而筛选，这意味着首先需除去大量的不希望的突变体。而且现存方法会产生大量带有不正确表型的突变体，因而筛选率很低。

几年以前，Gist-Brocades开发并介绍了一种用于黑曲霉的pluGBug标记基因自由技术，在G.Selten的GIST94/60 p5-7中描述了一种用于黑曲霉的载体，其包括糖淀粉酶调控区以使其调控的基因高水平表达，选择这种调控区是因为天然黑曲霉天然表达的糖淀粉酶水平很高。使用重组DNA技术将该调控区与感兴趣的基因以及选择标记黑曲霉AmdS合适地融合，使得在将表达盒转移至黑曲霉宿主中后可以筛选所需的转化子，然后多拷贝的表达盒随机整合进黑曲霉基因组。在该文献中描述的所生产的酶是植酸酶。随后可产生不带标记的转化子。在已知系统中，产生不带标记的重组菌株实际是一两步过程，因为amdS基因可以双向使用。首先在一轮转化中筛选含有所提供的表达盒的原始转化子，然后在第二轮中反选择又丧失了amdS基因的最终重组菌株。amdS基因编码能够将乙酰胺转化成铵和乙酸酯的酶，乙酰胺在上述第一轮转化中用作唯一的氮源，在第二轮重组中氟乙酰胺用作选择性氮源，并含有第二种合适的氮源如脲。由于产物氟乙酸酯对于其它细胞是毒性的，因此仅有那些由于在表达盒内DNA重复序列上发生了内部重组而丧失了amdS基因的细胞能繁殖。该已知方法的最大问题是得到的菌株是重组菌株，所需的特征只能通过掺入“外源”核酸而引入，这会延长立法批准所需的时间，甚至有时不能得到批准。另外，该方法不适于开发带有补充代谢的菌株。由于存在酶级联系统和多重反馈环，仅仅掺入一特定的基因不能总是导致所需的结果，该基因所编码的特定产物的过量产生可能会被另一产物的伴随过量表达而补偿或者负调节，从而使掺入基因达不到效果。因此，DNA的掺入经常是不断摸索出错的过程，即所需的核酸的掺入可以筛选到，但是所需的表型不一定能伴随产生。而且，标记基因的丢失是一自发过程，其耗时并且不能保证对于所有含核酸盒的转化子都能发生这一过程。

已知微生物菌株的改良可以通过在不同水平修饰微生物而达到，在转录水平改善基因表达通常通过使用强启动子并增加表达盒中的基因剂量而达到，产生高水平的编码感兴趣产物的mRNA。尽管这一策略可以增加所形成的产物，但是其有原则性的不利之处，由于存在多拷贝的启动子，驱动转录的转录调节物的量可能受到限制，导致调节物的靶基因的表达降低，这一点在携带许多拷贝的amdS基因的构巢曲霉中观察到(Kelly and Hynes，1987；Andrianopoulos and Hynes，1988)，在携带多拷贝的处于alcA启动子下的异源基因的构巢曲霉菌株中也观察到(Gwynneet al.，1987)。在后一种情况下，编码alcA基因的转录调节物的alcR基因的增加导致表达盒的表达增加(Gwynne et al.，1987；Davies，1991)。与在构巢曲霉中发现的作用类似，在使用糖淀粉酶(glaA)启动子的黑曲霉中也观察到类似的限制，这是由于驱动转录的转录调节物受到限制(Verdoes et al.，1993；Verdoes et al.，1995；Verdoes，1994)。因此目前由于缺乏筛选策略而大大阻碍了对glaA调节基因的克隆。

在一个阿糖胶酶(arabinase)基因表达的例子中，增加阿糖胶酶基因的剂量时发现对转录调节物有明显的竞争(Flipphi et al，1994)，反应出在所研究的三个基因中转录调节物的限制是共同的。

现有技术中除了上述缺点外，到目前为止分离和确定调节基因仍非常困难，这是由于大多数调节蛋白在细胞中的浓度非常低，使得很难确定哪种物质负责调节作用。另外，通常调节产物不是酶，而只能通过DNA 结合分析来筛选，这使得很难确定和分离并且非常耗时。目前应用的克隆调节基因的策略例如：

-通过互补作用，但其需要提供突变体，

-通过纯化调控蛋白，但其非常复杂耗时，因为该蛋白仅能通过其结合DNA的特性加以鉴定。一些纯化方法包括使用结合的DNA片段作为基质的亲和层析，这种纯化方法的一个缺点是通常多于一个蛋白与所述的片段特异性及非特异性结合。

-基于基因群集，其中调控基因与通过其基因产物调控的结构基因在基因组内群集，例如prn簇，alc簇。

发明内容

本发明涉及一种编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明也涉及所述核酸序列或其等价核酸序列用于过量表达靶基因的用途。

本发明还涉及一种突变宿主细胞，其包括调节物编码序列的缺乏或突变，从而所述的调节物不表达或者其不具备调节物活性；其中所述的调节物编码序列编码xylR。

本发明还涉及一种产生不具有木聚糖裂解副活性的蛋白质或多肽的方法，包括培养上述的突变宿主细胞并获得所产生的蛋白质。

本发明还涉及一种联合核酸盒用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途，其中所述联合核酸盒包括：1)一种靶基因启动子，其中所述靶基因是可诱导增强序列或激活序列的调节物的靶基因；2)可操纵地连接于另一个启动子的编码所述调节物的核酸序列；3)编码所述蛋白质或肽的序列，所述靶基因启动子可操纵地连接于3)的序列；且其中所述编码调节物的核酸序列编码木聚糖裂解调节物。

本发明涉及以一种简单、直接和特异性的方式获得代谢突变体。在一优选实施方案中，还可以获得不包括重组DNA的所需的突变体，从而由于立法程序较短而促进所述的突变体掺入供人类消费和应用的产品中。本发明的方法涉及随机突变及特异性筛选所需的代谢突变体，该方法可以合适地自动化进行。这种突变体能显示出增加的或降低的代谢活性。本发明的特异性在于所用的筛选条件。得到的突变体的突变之处在于其针对预定的代谢部分的调控功能的变化。根据筛选条件，可以分离到去阻遏突变体，由此展现过量表达，或者可分离到丧失了特定代谢酶活性的突变体，因此可以消除不需要的代谢酶活性或者增加所需的代谢活性。

本发明的方法可以在已广泛应用于工业上的各种熟知来源上进行，例如，过量表达的突变体可以用作高产、低成本的主要酶来源。待突变的原始菌株取决于本领域熟练技术人员公知的几种因素如：对蛋白的有效分泌、大规模生产过程的适应性、发酵液的下游处理的经验、深入的遗传学知识以及确保使用安全的微生物。

根据本发明的另一方面，其也可以确定和鉴别特异的代谢基因调控功能。

附图说明

图1：构建选择质粒pIM130。

图2：去阻遏突变体5B的α-L-阿拉伯呋喃糖苷酶、内切木聚糖酶和β-木糖苷酶的酶活性增加。

图3：用木聚糖酶A编码基因转化黑曲霉增加了木聚糖酶A的酶活性。

具体实施方式

我们现已获得一种系统，其可用于缩短能过量产生特定需要的酶的突变微生物的登记所需时间，该系统克服了“外源”核酸尤其是选择标记基因的多重随机插入的问题，该系统甚至不需要外源核酸来达到所需的特征。得到的突变菌株将不包括异源核酸。另外，本发明的系统能实现代谢的特异突变并不需导致不希望的表型的大量实验工作。

本发明涉及一种核酸盒，其包括编码一双向标记的核酸序列，所述的核酸盒进一步包括与编码双向标记的核酸序列可操作地连接的一个基本转录单位，所述的核酸盒还包括与基本转录单位以如下方式连接的可诱导增强序列或激活序列，所述的连接方式为当诱导增强序列或激活序列时能使编码双向标记的核酸序列表达，所述的可诱导增强序列或激活序列从与代谢系统的一部分的活性相关的基因衍生而来，所述的可诱导增强序列或激活序列从代谢相关基因衍生而来。

基本转录单位包括任何为基因的转录所需的因子，其可包括具有或不具有增强序列的启动子。基本转录单位必须是在宿主生物体内可操作的，其定位必须是可操作地与双向标记基因连接，以使该基因的转录成为可能。对于各种宿主细胞如曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌和乳杆菌已熟知作为基本转录单位的合适的例子。在实施例中，举例示出了从黑曲霉goxC转录单位(Whittington等，1990)衍生的基本转录单位tGOX作为本发明的实施方案。

优选的是可诱导增强序列或激活序列正常参与酶级联系统的调控，或者参与涉及一或多个反馈环的代谢的一部分。在一实施方案中，本发明的核酸盒包括正常参与碳代谢的可诱导增强序列或激活序列。可用于本发明的核酸盒的可诱导增强序列或激活序列的合适的例子是包括在下述任一核酸片段上的上游激活序列(UAS)：

-源自分别编码阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段，

-源自编码糖淀粉酶的glaA基因的片段，

-含有如在alcR和alcA启动子上的alcR结合位点的片段，

-源自CUP1基因的片段，

-源自PHO5基因的片段，

-源自GAL1、GAL7或GAL10基因的片段，

-源自xlnA基因的片段，

-源自pgaII基因的片段，

例如，这些片段可以来源于如文献中所述的下列微生物：

-源自分别编码黑曲霉阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段 (Flipphi M.J.A.et al.1994)，

-源自编码黑曲霉的糖淀粉酶的glaA基因的片段(Fowler T.et al1990)，

-含有如在构巢曲霉的alcR启动子上的alcR结合位点的片段(Felenbok B.et al.1994)，

-源自啤酒酵母CUP1基因的片段(Hinnen A.et al.1995)，

-源自啤酒酵母PHO5基因的片段(Hinnen A.et al.1995)，

-源自啤酒酵母GAL1、GAL7或GAL10基因的片段(Hinnen A.et al.1995)，

-源自构巢曲霉的xlnA、xlnB、xlnC或xlnD基因的片段，

-源自黑曲霉的xlnB、xlnC或xlnD基因的片段(见本说明书的其它处)，

-源自塔宾曲霉的xlnA或xlnD基因的片段(de Graaff et al.1994)，

-源自黑曲霉的pgaII基因的片段(见本说明书的其它处)。

在实施例中，举出xlnA的UAS为本发明的实施方案的例子。

双向标记是本领域熟知的术语，它包括能根据所用的选择条件而指示是否存在表达的选择标记，一个优选的双向标记将赋予以致死性或生长极度降低为基础的可选择性。另外，根据双向标记基因的表达与否而使菌落颜色不同也是可行的实施方案。已知的双向标记的合适例子包括facB、NiaD、AmdS、Can1、Ura3、Ura4和PyrA基因。我们在此指出，PyrA同系物在文献中也称作PyrG、Ura3、Ura4、Pyr4和Pyr1。这些基因可在下述微生物中发现，facB基因见于构巢曲霉，NiaD基因见于黑曲霉，NiaD基因见于米曲霉， AmdS基因见于构巢曲霉，Can1基因见于粟酒裂殖糖酵母，Ura3基因见于啤酒糖酵母，Ura4基因见于粟酒糖酵母，PyrA基因见于曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌。

选择facB突变体即具有阴性表型可以根据氟乙酸抗性为基础，选择FAC B⁺即阳性表型可以以乙酸盐为碳源进行(Katz，M.E.and HynesM.J.1989)。选择niaD突变体即具有阴性表型可以根据氯酸盐抗性为基础，选择NIA D⁺即阳性表型可以以硝酸盐为氮源进行(Unkels S.E.et al.1989a and 1989b)。选择amdS突变体即具有阴性表型可以根据氟乙酰胺抗性为基础，选择AMD S⁺即阳性表型可以以乙酰胺为氮源进行，由于大多数真菌不具有编码乙酰胺酶功能的基因，所以AMD S对于此类真菌是显性标记，其可用在黑曲霉、黑曲霉塔宾变种、黑曲霉泡盛变种、臭曲霉、米曲霉、萨氏曲霉、日本曲霉、棘孢曲霉、曲霉属各种、木霉属各种(Kelly and Hynes 1985 and Bailey et al.1991)。选择can1突变体即具有阴性表型可以根据canavanine抗性为基础，其中canavanine是一种精氨酸类似物，选择CAN 1⁺即阳性表型可以在精氨酸上进行(Ekwall K.1991)。编码乳清酸核苷5’-P-脱羧酶的基因已知为pyrA、pyrG或ura3，其已在各种微生物中发现，如曲霉、木霉、青霉、镰孢、酿酒酵母和克鲁维酵母。选择pyrA突变体即具有阴性表型，也称为pyrG或ura3可以根据氟乳清酸抗性为基础，选择PYR A⁺及其同系物即阳性表型可以根据尿苷或尿嘧啶原养型为基础进行，在实施例中，举出黑曲霉的pyrA(Wilson et al.1988)作为本发明的实施方案的例子。其它的例子是本领域熟练技术人员公知的并可在文献中容易地找到。选择标记的使用取决于待突变的宿主微生物以及其它次一级的考虑如选择的容易性、可靠性以及所用底物的成本等。掺入到转化或表达载体中的核酸盒也包括在本发明的范围内，还包括这种核酸盒或载体在转化和选择方法中的应用。本发明特别涉及产生这样的突变体的方法，所述的突变体显示过量表达一种参与预定代谢部分的酶；以及产生这样的突变体的方法，所述的突变体显示降低或抑制一种参与预定代谢部分的酶的表达；以及确定和分离参与预定代谢部分的的调控基因的方法。

因此，本发明涉及一种制备和筛选微生物突变菌株的方法，所述的突变与未突变的菌株相比能促进预定部分的代谢，所述的方法包括

-将本发明中所述的核酸盒导入宿主，所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型，

-在如下的条件下培养得到的微生物，所述的条件为能使核酸盒上包括的增强序列或激活序列有正常活性，并且双向标记基因可表达，优选的是所述的双向标记基因的表达将导致生长，而不表达则不生长，

-在上述培养条件下选择具有与双向标记基因表达相应的表型的转化子，

-将所选的转化子以已知方式诱变，

-在预定代谢部分的可代谢底物存在下，在如下条件下培养得到的菌株，所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件，以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件，

-选择从诱变后的培养步骤得到的菌株，所述的菌株具有与在选择条件下表达双向标记基因相应的表型，该条件下未突变的含核酸盒亲本菌株不表达双向标记。

在本方法的合适实施方案中，

-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS)，

-预定代谢部分是碳代谢的木聚糖裂解部分，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养，包括在UAS的诱导物的存在下、UAS的阻遏物以及可代谢碳源不存在下培养，

-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件，以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件，即在UAS阻遏物存在下和在可代谢碳源存在下，以及任选地在UAS的诱导物存在下，

-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行，所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件。

在本方法的更进一步的实施方案中，

-核酸盒包括编码双向标记pyrA的核酸序列，

-在导入核酸盒之前，宿主不具有与双向标记的表达相关的pyrA+表型，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养，包括在增强序列或激活序列有正常活性的条件下培养，即在增强子或激活物的诱导物的存在下、增强子或激活物的阻遏物不存在下以及双向标记基因能表达的条件下培养，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件，并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件，即在增强子或激活物的诱导物不存在下或在增强子或激活物的阻遏物存在下和在预定代谢部分的可代谢底物的存在下，

-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行，所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件，即在增强子或激活物的诱导物不存在下或者在增强子或激活物的阻遏物存在下。

合适的是，以上所述的实施方案可以进一步具有如下特征

-核酸盒包括编码双向标记pyrA的核酸序列，

-可诱导的增强序列或激活序列是从xlnA基因衍生的UAS，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养，包括在UAS有正常活性的条件下培养，即在UAS的诱导物如木糖或木聚糖的存在下，并且在UAS的阻遏物不存在下，即不存在葡萄糖，以及双向标记基因能表达的条件下培养，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件，并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件，即在UAS的诱导物如木糖或木聚糖不存在下，或者在UAS的阻遏物存在下即存在葡萄糖和在可代谢碳源的存在下，

-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行，所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件，即在UAS的诱导物如木糖或木聚糖不存在下，或者在UAS的阻遏物存在下即存在葡萄糖。

另外，本发明优选的是制备和筛选未重组的微生物突变菌株的方法，所述的突变与未突变的菌株相比增强了预定代谢部分，所述的方法包括进行以上段落所述的本发明方法的步骤，然后以公知的方式交换除去(crossing out)导入的核酸盒的核酸。

如前所述，本发明提供了制备和筛选微生物突变株的方法，所述的突变与未突变株相比抑制预定的碳代谢部分，所述的方法包括

-将上述本发明的核酸盒导入宿主，

所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型，所述的宿主具有待降低或抑制的预定代谢部分的特征活性类型，

-在如下的条件下培养得到的微生物，所述的条件为能使核酸盒的增强序列或激活序列有正常活性，并且核酸盒的双向标记基因的不表达可使得到的微生物生长和被检测到，并且优选的是所述的双向标记的表达将导致死亡或强烈抑制生长，

-将所选的转化子以已知方式诱变，

-在可代谢底物存在下，在如下条件下培养诱变后得到的菌株，所述的条件为具有与双向标记的不表达相应的表型的菌株可接受的，并且能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性，

-选择从诱变后的培养步骤得到的菌株，所述的菌株具有与在选择条件下降低的或受抑制的预定代谢部分的活性相应的表型，该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性，如在底物上生长时的水解透明区减小，所述的底物为活性待降低或抑制的代谢部分的底物。

在本方法的进一步实施方案中，

-预定代谢部分是碳代谢的木聚糖裂解部分，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养，包括在核酸盒的UAS的阻遏物不存在下、在可代谢碳源存在下、以及优选地在UAS的诱导物的存在下培养，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为对于具有与双向标记的不表达相应的表型的菌株的生长和检测是可接受的；并且对于具有与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸；以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件，即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物，例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源，

-选择从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行，该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性，如在木聚糖上生长时的水解透明区减小。

提供了前一段落所述的方法的例子，其中

-核酸盒包括编码双向标记pyrA的核酸序列，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养，包括在增强子或激活物的诱导物存在下、并且在增强子或激活物的阻遏物不存在下以及在双向标记pyrA能表达的条件下培养，

-选择具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为对于具有与双向标记的不表达相应的表型即PYRA^-表型的菌株的生长和检测是可接受的；并且对于具有PYRA⁺表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸；以及导致未突变的含核酸盒的亲本菌株具有预定代谢部分活性的条件，即存在增强子或激活物的诱导物和可代谢底物并且不存在增强子或激活物的阻遏物或者与诱导物联合使用的另一种非阻遏底物。

在一优选的实施方案中，前述两个段落所述的方法是如下一种方法，其中进一步

-核酸盒包括编码双向标记pyrA的核酸序列，

-可诱导增强序列或激活序列是衍生于xlnA基因的UAS，

-培养步骤，其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养，包括在UAS有正常活性条件下培养，即在UAS的诱导物如木糖或木聚糖的存在下，并且在UAS的阻遏物不存在下，即不存在葡萄糖，以及双向标记pyrA能表达的条件下培养，

-所选的转化子诱变后的培养步骤是在如下条件下进行，所述的条件为对于具有与双向标记的不表达相应的表型即pyrA^-表型的菌株的生长和检测是可接受的；并且对于具有PYRA⁺表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸；以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件，即存在UAS的诱导物和可代谢碳源并且不存在 UAS阻遏物，例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源，

上述的所有方法可以有利地使用具有如下特征的宿主进行，所述的宿主在导入核酸盒之前就具有与编码双向标记的核酸序列的至少一部分对应的核酸，所述的对应程度足以使包含在核酸盒上的编码双向标记的核酸同源重组在染色体上。这一方面确保了核酸盒在预定的位置进行整合。

在一优选的实施方案中，将掺入多拷贝的核酸盒以确保诱变步骤不会失活双向标记，因为当检测标记阴性表型时双向标记的失活会给出不正确的结果，双向标记的失活也能降低标记阳性表型的数量。

在本发明的优选的实施方案中，已构建了一种核酸盒，其可用于产生显示参与预定代谢部分的酶的过量表达的突变体的方法中，可用于产生显示参与预定代谢部分的酶的降低的或受抑制的表达的突变体的方法中，以及可用于确定和分离参与预定代谢部分的调控基因的方法中。我们具体地举例描述了用于碳代谢的突变体的系统。在实施例中描述了具有改变的木聚糖裂解特征的突变体以及导致阿拉伯糖裂解和果胶裂解途径的突变体的阿糖胶酶和聚半乳糖醛酸酶突变体。在实施例中使用曲霉作为待突变的菌株，但是其它工业可接受的微生物均适用，这类微生物的例子包括酿酒酵母，例如啤酒酵母，粟酒糖酵母，曲霉，例如构巢曲霉，木霉，青霉，镰孢，克鲁维酵母和乳杆菌。其它例子是本领域熟练技术人员显而易见的并在本说明书的其它部分有描述。现在可以产生过量表达或不表达预定代谢部分的菌株。我们还可确定可诱导增强序列或激活序列的激活调节物的特征及核酸序列，特别是当这种激活调节物参与代谢时，更具体地当这种激活调节物参与具有酶级联系统或反馈环或多重反馈环的代谢部分时。这种调控基因的核酸序列随后可用于增强靶基因的表达，所述的靶基因为由该调控基因调控的基因。在一优选的实施方案中，这种靶基因具有调控基因的表达产物的结合位点。在一表达盒中将与调节物的靶基因正常相关的启动子与调控基因联合(其中所述的启动子与编码待表达的同源或异源蛋白质或肽的同源或异源序列可操作地连接)能使表达盒在表达同源甚至异源蛋白质或肽方面特别有用。编码调节物的基因可在其天然启动子的控制之下或者在能在所选宿主细胞中表达的任何其它启动子的控制之下。启动子可以是组成型的或诱导型的，这取决于特定生产过程的需要。这种联合表达盒属于本发明的范围，包括这种盒的载体或质粒也属于本发明的范围。表达程度不再受仅存在很少量的调节物的限制，因此待表达基因的表达程度比在相应的待表达基因在相同启动子控制下但是不存在调控基因的宿主细胞中的表达程度高得多。这种增加的表达优选的是在正常包括欲影响的代谢途径部分的组分的生物体细胞中达到，合适的宿主细胞是丝状真菌细胞。将上述类型的组合表达盒掺入到具有调节物的靶基因的宿主细胞中可以增加靶基因的表达或者若存在多个靶基因的话增加所有靶基因的表达。优选的是靶基因相对于宿主细胞是内源的。包括联合表达盒的宿主细胞属于本发明的范围。

在实施例中，提供了木聚糖裂解途径xylR的调节物的核酸序列xlnR，已发现这一调节物的靶基因包括基因xlnA、xlnB、xlnC和xlnD以及axeA。证明了木聚糖酶A表达的增加，并且可用于示意xlyR对xylR调节物的靶基因的作用的通用性。现有技术中已知许多序列，包括上述的xlnA、xlnB、xlnC和xlnD以及axeA基因的序列，这些信息对于本领域熟练技术人员是容易获得的，并认为掺入本文。与xlnR核酸联合应用的优选的感兴趣的启动子可以选自xlnA、xlnB、xlnC和xlnD，使用axeA启动子也是本发明的合适的实施方案。启动子对于本领域熟练技术人员是已知的，并认为掺入本文。xlnA启动子由deGraaff等人1994年描述，xlnB启动子由Kinoshita等人1995年描述，xlnD启动子在EP95201707.7中有描述，并包括在这一文献的序列表的序列号8中。启动子序列可以根据已知的序列容易地合成或者以标准的已知方法得自生物体或包含启动子的载体。当使用术语启动子、增强子或调节物时，包括启动子、增强子或调节物的天然的片段也可采用，只要其可操作性不改变即可。在本发明的构建体中不需要仅掺入相关序列，也可存在任何侧翼的非干扰序列。本发明不仅包括编码表达产物xylR的核酸序列xlnR，而且包括编码等价表达产物和突变表达产物的序列以及本发明的核酸序列的表达产物本身。本文公开的任何xylR或xylR编码序列(＝xlnR)的应用也适用于突变体和编码突变体的核酸序列，这些均认为掺入本文。

用于表达本发明的核酸序列和盒的合适的真菌细胞的例子有曲霉如黑曲霉、塔宾曲霉、棘孢曲霉，泡盛曲霉，米曲霉，构巢曲霉，炭黑曲霉，臭曲霉，土曲霉，萨氏曲霉，川地曲霉，日本曲霉和木霉属、青霉属和镰孢属的种。其它细胞如植物细胞也是可行的宿主细胞，在本文的其它地方描述了其它宿主细胞。

用本发明的表达盒表达或者与本发明的核酸序列联合的特别感兴趣的基因是编码酶的基因。用于表达的合适的基因是编码木聚糖酶、葡聚糖酶、氧化还原酶如己糖氧化酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶和蛋白酶的基因，这些是所需的表达产物的非限制性例子。包括上述基因的许多序列是本领域已知的并且这种信息对于本领域熟练技术人员来说是容易获得的，并被认为掺入本文。所述的基因可以根据文献或数据库中已知的序列容易地合成或者从生物体或包括这些基因的载体中以已知的标准方式衍生，这些均是本领域熟练技术人员容易获得的知识，在此不需进一步的论证。

与序列号9的xylR的氨基酸序列或由序列号9的xlnR的核酸序列(从948位核苷酸开始)编码的氨基酸序列有80-100％的相同性的表达产物被认为是本发明的木聚糖酶调节物(xylR)的等价表达产物，因此属于本发明的范围。该等价表达产物应具有DNA结合活性，优选地，这种DNA结合活性应是表达产物与靶基因的核酸的结合程度与具有序列号9提供的氨基酸序列的表达产物结合的程度相同或更好。用于确定结合活性的优选的靶基因是编码xylA、xylB、xylC和xylD的基因，即xlnA、xlnB、xlnC和xlnD基因。本发明也要求保护至少保持相同程度的靶结合活性的根据序列号9的xlnR基因表达产物xylR的突变体和编码核酸序列xlnR的突变体。被认为属于等价表达产物的定义内的突变体特别包括与序列号9的氨基酸序列相比有氨基酸改变的突变体，这些等价物及其编码核酸序列被认为是本发明的合适的实施方案。具有1-15个氨基酸取代的突变体是合适的，有例如1-5个氨基酸取代的突变体也被认为是本发明特别合适的形成等价表达产物的实施方案。用同类型的其它氨基酸取代特定的氨基酸不会严重影响肽活性这一点是本领域熟练技术人员的常识。根据水疗法(hydropathy)曲线，本领域熟练技术人员将清楚何种取代可以进行。用其它疏水性氨基酸取代疏水性氨基酸以及用其它亲水性氨基酸取代亲水性氨基酸例如能产生本发明的合适的表达产物。这种取代被认为是由本发明的范围所覆盖。在序列号9的编码核酸序列中的点突变被认为能产生属于本发明范围的核酸序列，这种点突变可以导致氨基酸水平的静止突变或者导致上述的取代突变体。本发明也包括任何类型的取代突变体。优选地，与序列号9的氨基酸序列相比突变体的相同性应为85-100％，更优选为90-100％，最优选为95-100％。如上所述，与序列号9的氨基酸序列有80-100％的相同性的氨基酸序列属于本发明的等价物，因此包括了至多为20％、优选少于15％、更优选少于10％、最优选少于5％的本发明氨基酸序列的缺失和/或取代。这种突变体可以包括在氨基酸序列的一或多个部分中的缺失和/或取代，然而，这种缺失和/或取代突变体包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。1-5个氨基酸的缺失突变体被认为属于本发明的范围，超过5个氨基酸的缺失的缺失突变体和/或具有多于5个氨基酸取代和/或点突变的突变体也能保持DNA结合活性，这种较大的缺失和/或取代和/或点突变优选地发生在氨基酸序列的N末端部分以及编码核酸序列的相应部分。据信参与调控和活化的最重要的区域存在于从锌指结合区开始的氨基酸序列的C末端部分，因此，缺失突变体优选地包括至少这一部分的氨基酸序列。优选地在锌指结合区即相应于序列号9的第1110-1260位核苷酸的区域没有突变，如果存在一个突变，则优选地其不涉及与锌配位的6个半胱氨酸间的间隔区，最优选地任何突变均不涉及6个半胱氨酸中的任一个。另外，优选地，在序列号9的氨基酸序列中存在的RRRLWW基序中不存在突变。在所述的氨基酸序列的一或多个片段中可能会发生缺失，然而这种缺失突变体应包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。缺失1-15个氨基酸、优选缺失1-10个氨基酸、最优选缺失1-5个氨基酸是保证等价性的合适的实施方案。等价的核酸序列的实施方案是编码如下表达产物的核酸序列，所述的表达产物具有与序列号9的xylR相同的氨基酸序列或者由序列号9的xlnR核酸序列编码的相同氨基酸序列。与序列号9的xylR的氨基酸序列或由编码序列号9的xylR的核酸序列编码的氨基酸序列有80-100％的相同性的表达产物的编码核酸序列也被认为是xlnR的等价核酸序列，因此属于本发明的范围。本发明的等价核酸序列的另一个实施方案是在如实施例所述的特异性最小严格条件下能与从序列号9的核酸序列衍生的引物或探针杂交的核酸序列，所述的引物或探针是从非锌指结合区衍生的，并且所述的引物或探针的长度至少为20个核苷酸。通常合适的探针和引物的长度为20-60个核苷酸、优选为25-60个核苷酸。优选地，探针或引物从序列号9的从锌指结合区开始的C末端编码部分衍生。本发明的核酸序列的一个优选的实施方案是在至少为实施例中所述的严格程度的特异条件下能与序列号9的核酸序列杂交。等价的核酸序列应能例如通过PCR用上述的基于序列号9的核酸序列的引物从其它生物体中衍生。上述定义的等价核酸序列的表达产物也属于本发明的范围，反过来，编码本发明的等价氨基酸序列的核酸序列也属于术语等价核酸序列的范畴。从丝状真菌和植物中衍生的等价核酸序列及这些序列的表达产物是本发明的优选实施方案。优选地，等价核酸序列包括编码相应于序列号9中的1110-1260位核苷酸编码的锌指结合区的核酸序列。在一优选的实施方案中，等价核酸序列应编码与锌配位的6个半胱氨酸，在进一步的实施方案中，半胱氨酸之间的间隔应对应于序列号9中的间隔区。

包括将实施的等价核酸序列和表达产物的各种实施方案的特征结合在一起的实施方案也属于本发明的范围。在锌指结合区具有突变但能显示增加的DNA结合性能的突变体也属于本发明范围，具有降低的DNA结合性能的突变体也属于本发明的范围，这种突变体可能在锌指结合区有突变。特别要求的是在序列号9中提供的氨基酸序列的突变体。

具有序列号9的至少15个核苷酸的核酸序列的片段也属于本发明范围，这些片段能用作探针或引物来检测和分离等价序列。特别是两个或更多个这种片段的组合可用在试剂盒中以检测和/或分离这种等价序列。优选地，片段应从序列号9的氨基酸序列的C末端部分衍生。在试剂盒的一个合适的实施方案中，片段应不包括形成锌指结合区的核酸序列的一部分。在实施例中举例示出了用作引物的片段的合适组合，任何可通过如实施例所述的PCR利用这些引物获得的序列均属于本发明的范围。在实施例中所用的杂交条件提供了筛选所需的最低的严格程度，可以使用更严格的条件，如由Sambrook等所述的用于获得的序列与序列号9有增加的同源性的杂交条件，低盐浓度通常意味着更严格的条件。编码具有完整序列的靶基因结合活性的多肽的序列号9的序列的任何片段均属于本发明的等价核酸序列或其氨基酸序列的范围，等价的定义如上所述涉及完整序列的杂交和/或突变和/或遗传密码的简并。

包括编码xylR的核酸序列或其如上定义的等价序列的载体或质粒也属于本发明的范围，包括这种序列的载体或质粒以及包括这种额外的序列的宿主细胞也属于本发明的范围。携带至少一个额外拷贝的根据序列号9的编码核酸序列或其等价物的转化宿主细胞如微生物或植物细胞属于本发明的范围。优选地，各种实施方案如此组织以使序列能在载体、质粒或宿主细胞中表达。调控基因可以包括与在宿主细胞中可操作的可变启动子组合的序列号9的完整序列或者仅仅是其编码序列。宿主细胞的合适例子在本说明书的其它部分有描述。针对各种宿主细胞的可以与序列号9的编码序列一起掺入的合适的可操作启动子对于本领域熟练技术人员是清楚的。针对在说明书中例举的宿主细胞的组成型启动子或诱导型启动子是已知的并且不需创造性劳动即可利用它们实施本发明。

提供了生产同源或异源蛋白或肽的方法，所述的方法包括在宿主细胞中表达编码同源或异源蛋白或肽的核酸序列，所述的宿主还包括附加的编码调控基因如xlnR或其等价物的核酸序列，该核酸序列也表达。所述的方法优选地用一种联合核酸序列表达盒进行，所述的表达盒包括可操作地与第一个启动子相连的调控基因，并且所述的表达盒还包括第二个启动子，所述的第二个启动子与调节物的靶基因正常相关，所述的靶基因启动子与编码待表达的同源甚至异源蛋白或肽的核酸序列可操作地相连。第一个启动子可以是与调控基因天然相关的启动子或者可以是能在宿主细胞中操作的启动子。表达程度不再受仅存在非常少量的调节物这一点的限制，因此待表达基因的表达程度比在相应的不存在调控基因的宿主细胞中的表达程度高许多。这种增加的表达优选地在正常包括需影响的代谢途径部分的成分的生物体细胞中实现，合适的宿主细胞是植物细胞或微生物，合适的微生物可以是真菌，特别是丝状真菌。合适的宿主细胞的例子在本说明书的其它处有描述并可认为掺入在此。在包括调节物的靶基因的宿主细胞中掺入上述类型的联合表达盒可以增加靶基因的表达，或者如果存在多个靶基因的话，可以使这些靶基因均增加表达。优选地，靶基因相对于调节物是天然的，这种靶基因优选地是宿主细胞内源性的。在实施例中提供了木聚糖裂解途径xlnR的调节物的核酸序列，已发现这一调节物的天然靶基因包括xlnA、xlnB、xlnC和xlnD以及axeA基因，因此，这些基因是优选的靶基因，也存在其它的靶并认为其包括在术语靶基因中。本发明的宿主细胞的各种实施方案均包括在权利要求书中。如果调控序列和靶基因均天然存在于宿主细胞中，则调控序列应以多个拷贝存在，这种微生物与天然微生物相比将过量表达由靶基因启动子调控的基因。

由于现在已知木聚糖酶调节物的序列，所有可以剔除木聚糖酶调节物，一旦已知待剔除的基因的核酸序列，制备剔除宿主细胞的技术是标准技术。这种方法可参考Berka等(1990)描述的方法以及EP95201707.7的实施例11类似地进行，所述的欧洲专利申请的拷贝在递交本申请时也已附上，该实施例本身也掺入了本申请的实施例中。这种剔除可使宿主细胞缺失木聚糖裂解活性，由于剔除xlnR基因而缺失了木聚糖裂解活性的宿主细胞可以用作产生无木聚糖裂解活性的所选的同源或异源表达产物，具有剔除xlnR基因的宿主细胞属于本发明的范围，这种宿主细胞优选地是植物细胞或丝状真菌，这种丝状真菌优选地是曲霉。各种合适的宿主细胞的例子在本说明书的其它处有描述。

使用本发明的筛选和突变方法产生的在调控基因中具有突变的宿主细胞可以用来与调控基因的调节活性拷贝进行互补。这种互补菌株将随后表达由调节物调控的任何靶基因的产物，这些靶基因产物在未互补的调节物阴性突变体中不存在。比较根据已知方法从两种菌株中获得的蛋白条带，可以明显地看到何种靶产物由调节物调控，随后一旦确定其表达产物即可以以已知的方式确定相应的新的靶基因。以这种方式可以在实施例中发现木聚糖酶调节物xylR的除已知的靶基因之外的其它靶基因。

实施例

实施例1：构建质粒

实施例1.1：构建选择质粒pIM130

如图1所示构建选择质粒pIM130，在PCR1中用寡核苷酸1(SEQID NO：1)5’-CACAATGCATCCCCTTTATCCGCCTGCCGT-3’(式1)和寡核苷酸A(SEQ ID NO：2)5’-CAATTGCGACTTGGAGGACATGATGGGCAGATGAGGG-3’(式2)从pIM120(de Graaff等，1994)产生一个片段。寡核苷酸1衍生于塔宾曲霉xlnA启动子(de Graaff等，1994)的位置600-619(SEQID NO：5)，其中加入了含有NsiI位点的10个核苷酸。寡核苷酸A的3’末端衍生于终止于翻译起始位点之前的黑曲霉goxC转录单位(Whittington等，1990)(位置708-723)(SEQ ID NO：6)，而其5’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编码区(Wilson等，1988)(位置341-359，SEQ ID NO：7)。

通过含10μl 10×反应缓冲液(100mM Tris-HCl，pH8.3，500mMKCl，15mM MgCl₂，0.01％明胶)，16μl1.25mM每种脱氧核苷三磷酸，lng质粒pIM120 DNA和各1μg寡核苷酸1和寡核苷酸A，终体积为100μl的PCR产生片段A。混合这一反应混合物并加入1μl TAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃保温3分钟变性DNA，接着进行92℃1分钟、48℃1分钟、72℃1分钟的25个循环，25个循环后将混合物在72℃保温5分钟。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段，该片段相应于根据基因序列预期的大小。

在PCR2中使用寡核苷酸2(SEQ ID NO：3)：5’-AGAGAGGATATCGATGTGGG-3’(式3)和寡核苷酸B(SEQ IDNO：4)：5’-CCCTCATCTGCCCATCATGTCCTCCAAGTCGCAATTG-3’(式4)从质粒pGW635(Goosen et al.，1987)产生一个片段。寡核苷酸B的5’末端衍生自黑曲霉goxC基本转录单位(位置708-723，SEQ IDNO：6)(Whittington et al.，1990)，而其3’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编码区。寡核苷酸2衍生自pyrA编码区(位置339-359，SEQ ID NO：7)并跨越第602位(SEQ IDNO：7)的EcoRV限制性内切酶位点。

片段B以类似片段A相同的方式产生，只是在这一情况下反应混合物含有各1μg寡核苷酸2和寡核苷酸B以及1ng质粒pGW635 DNA。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段，该片段相应于根据基因序列预期的大小。

电泳后从琼脂糖凝胶中分离片段A和片段B，从琼脂糖凝胶中切下片段，之后用ISCO杯通过电洗脱将它们从琼脂糖小块中回收出来。在这一杯的大小容器上各覆盖一透析膜，在杯中注入0.005×TAE(每1000ml 50×TAE缓冲液含242.0g Trizma碱(Sigma)，7.1ml冰醋酸，100ml 0.5M EDTA pH8.0)，将琼脂糖小块置于杯的大容器中。随后将杯置于电洗脱装置中，使大容器位于含1×TAE的阳极室，小容器位于含1×TAE/3M NaAc的阴极室。在1小时内以100V电洗脱片段，之后从电洗脱装置中取出杯，并除去大容器中的缓冲液，而小容器中的缓冲液仅除去上面的部分，含有DNA片段的剩余缓冲液(200μl)在杯中对蒸馏水透析30分钟。最后通过加入0.1倍体积的3M NaAc，pH5.6和2倍体积的冷(-20℃)乙醇沉淀DNA，在4℃、14,000×g离心30分钟(Eppendorf离心机)收集DNA。除去上清后用Savant Speedvac真空离心机干燥DNA沉淀，将DNA溶于10μl TE缓冲液(TE：10mM Tris/HCl pH7.2，1mM EDTA pH8.0)中，用已知浓度的λDNA作为参考以及检测DNA的溴乙锭染色通过琼脂糖凝胶电泳测定浓度。

在PCR3中融合片段A和片段B，PCR3与PCR1的不同之处是其反应混合物含有各1μg寡核苷酸1和寡核苷酸2以及各约50ng片段A和片段B。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约500bp的片段，该片段相应于根据基因序列预期的大小。

如上所述从琼脂糖凝胶中分离得到的片段C，随后用限制性内切酶NsiI和EcoRV消化，在由下述溶液组成的反应混合物中在37℃消化DNA3小时，所述的溶液为5μl(约0.5μg)DNA溶液、2μl合适的10×反应缓冲液(Life Technologies)、10U限制性内切酶(LifeTechnologies)和无菌蒸馏水至终体积20μl。消化后通过琼脂糖凝胶电泳分析DNA片段并如上所述从凝胶中分离片段。

为了最终构建pIM130，如上所述在500μl的终体积中用50U的限制性内切酶EcoRV和XbaI消化5μg质粒pGW635，产物分离后通过电洗脱从琼脂糖凝胶中分离2.2kb的EcoRV/XbaI片段(片段D)。类似地，用限制性内切酶NsiI/XbaI消化制备1μg载体pGEM-7Zf(+)(Promega)，随后电泳并通过电洗脱从琼脂糖凝胶中分离。

通过如下连接反应构建质粒pIM130：将100ng pGEM-7Zf(+)NsiI/XbaI片段与50ng片段C和50ng片段D混合，向这一混合物中加入4μl 5×连接缓冲液(组成：500mM Tris-HCl，pH7.6；100mM MgCl₂；10mM ATP；10mM二硫苏糖醇；25％PEG-6000)和1μl(1.2U/μl)T4DNA连接酶(Life Technologies)，终体积为20μl。在14℃保温16小时后用无菌水将混合物稀释至100μl，用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞，所述感受态细胞的制备见Sambrook等人，1989所述。

将两个得到的菌落在含100μg/ml氨苄青霉素的LB培养基(每1000ml LB培养基含10g胰化蛋白胨(BBL)，5g酵母提取物(BBL)，10g NaCl，0.5mM Tris-HCl pH7.5)中培养过夜，通过Maniatis等人(1982)所述的碱裂解法从培养物中分离质粒DNA，将质粒DNA用于限制酶分析以筛选携带所需质粒pIM130的克隆。从500ml的在含100μg/ml氨苄青霉素的LB培养基中培养的含pIM130的大肠杆菌DH5α培养物这大量分离质粒DNA(Maniatis等人，1982)。通过CsCl离心、酚抽提、乙醇沉淀纯化质粒并溶于400μl TE，产量约为500μg。

实施例1.2：质粒pIM135的构建

从质粒pIM120构建第二个质粒，该质粒含有与pyrA编码区和终止区融合的goxC基本转录单位。在PCR4中使用寡核苷酸3和寡核苷酸2(式3)从质粒pIM120产生了一个片段，所述的寡核苷酸3序列为5’-CACAATGCATCGTATAAGTAACCTCGTTCG-3’(式5)其衍生自goxC基本转录单位(位置640-660，SEQ ID NO：6)，并且加入了含一个NsiI位点的10个核苷酸。如实施例1.1所述，从凝胶中分离产生的片段，用NsiI和EcoRV消化并与pGW635的2.2kbEcoRV/XbaI片段一起克隆到用XbaI/NsiI消化的质粒pGEM-7Zf(+)中，得到质粒pIM135。

质粒pIM135可用作构建载体来制备本发明的携带任何所需的可诱导增强序列或激活序列、参与代谢的基因的UAS的载体。pIM135包括可操作地与双向标记基因(pyrA)连接的基本转录单位(tGOX)。

实施例2：使用质粒pIM130转化黑曲霉

以1×10⁶个孢子/ml在250ml由曲霉基本培养基(MM)组成的培养基(每升含有：6.0g NaNO₃，1.5gKH₂PO₄，0.5gMgSO₄·7H₂O，0.5gKCl，所指出的碳源，pH6.0，以及1mlVishniac溶液(每升含有10gEDTA，4.4g ZnSO₄·7H₂O，1.0g MnCl₂·4H₂O，0.32g CoCl₂·6H₂O，0.32g CuSO₄·5H₂O，0.22g(NH₄)₆Mo₇O₂₄·4H₂O，1.47g CaCl₂·2H₂O，1.0g FeSO₄·7H₂O，pH4.0)，添加了2％葡萄糖，0.5％酵母抽提物，0.2％酪蛋白氨基酸(不含维生素)，10mML-精氨酸，10μM烟酰胺，10mM尿苷)中接种NW205菌株(cspAl，pyrA6，nicAl，argB13)的孢子，30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。使用B

chner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体，并且用SP6(SP6：0.8％NaCl，10mM磷酸钠缓冲液，pH 6.0)洗涤几次。将150mg的Novozyme 234溶解在20ml SMC(SMC：1.33M山梨醇，50mM CaCl₂，20mM MES缓冲液，pH 5.8)中，加入1g菌丝体(湿重)并且小心地悬浮。30℃下温和振荡培养悬浮液1-2小时，每隔30分钟将菌丝体小心地悬浮，取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×10⁸)时，小心地悬浮这些原生质体并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000 rpm离心10分钟收集原生质体，将其小心地悬浮在5ml STC(STC：1.33M山梨醇，50mM CaCl₂，10mM Tris/HCl，pH7.5)中。这一洗涤步骤重复两次，最后将原生质体以1×10⁸/ml密度悬浮在STC中。

通过以下步骤进行转化：将溶解在10-20μl的TE中的1μgpIM130DNA与50μl的PEG缓冲液(PEG缓冲液：25％PEG-6000，50mM CaCl₂，10mM Tris/HCl，pH7.2)一起加入到200μl的原生质体悬浮液中，然后使用移液管抽吸几次轻轻地将上述液体混合，并在室温下温育20分钟。此后，加入2ml的PEG缓冲液，将溶液轻轻地混合并在室温下温育5分钟，接下来加入4ml的STC并在涡旋混合器中轻轻混合。使用5μg pIM130和1μg和5μg质粒pGW635DNA进行上述相同步骤。向原生质体中加入20μl TE作为阴性对照。

然后将1ml的悬浮液加入到4ml渗透稳定的上层琼脂中，然后倒入含有MMS(以100mM D-葡萄糖或100mM D-木糖作为碳源)的平板中(轻轻旋转以用上层琼脂覆盖平板)。这些培养基(MMS)用0.8M KCl或1.33M山梨醇渗透稳定。

为确定再生百分比，制备转化前的原生质体(未处理的原生质体，保存于冰上)和转化后的原生质体(从阴性对照获得)的系列稀释液。将100μl 10^-3、10^-4、10^-5和10^-6稀释液分别以双份涂布在补加10mM尿苷的MMS平板上。

对于使用pGW635转化真菌的阳性对照，在所有平板上均发现菌落，而在KCl稳定的培养基上的转化率(1-10个转化子/μg质粒DNA)比在山梨醇稳定的培养基上的转化率(100-1000个转化子/μg质粒DNA)低许多，这是由于在后一培养基上的再生率非常高，约为90％，而在KCl稳定的培养基上的再生率为2-5％。

在用质粒pIM130进行转化的情况下，在含D-木糖作为碳源的培养基上发现转化子，而在含D-葡萄糖的培养基上未发现转化子。在山梨醇稳定的培养基上的转化率为100个转化子/μg质粒DNA，而在KCl稳定的培养基上的转化率为少于1个转化子/μg质粒DNA。

实施例3：转化子的分析

通过将在实施例2中获得的pIM130转化子涂布在含有100mM D-葡萄糖、100mM D-葡萄糖/1％燕麦二粒小麦木聚糖(Sigma#X0627)和1％燕麦二粒小麦木聚糖的MM培养基上来分析其表型。筛选转化子影印到这些培养基上并在30℃保温。约75％的转化子在含木聚糖的培养基上生长，而在含D-葡萄糖的培养基上未发现生长。其余的25％的菌落在所测的三种培养基上均生长。

用Southern分析对所选的具有期望表型(在含木聚糖培养基上生长，在含D-葡萄糖培养基上不生长)的5个转化子进行分析。基本上如de Graaff等人(1988)所述通过经修改的用于分离植物RNA的程序分离真菌DNA。收集在培养基中生长过夜的菌丝体，用冷盐水洗涤，在液氮中冷冻并储存于-80℃。用微切机(Braun)破碎0.5g冷冻菌丝体分离核酸。得到的菌丝体粉末用新制备的抽提缓冲液抽提，抽提缓冲液如下制备：将1ml三异丙基萘磺酸(TNA)(20mg/m1)与1ml对氨基水杨酸(PAS)(120mg/ml)充分混合，加入0.5ml 5×RNB缓冲液(1升5×RNB含有121.10g Tris，73.04gNaCl和95.10gEGTA，pH8.5)。加入1.5ml苯酚后在55℃平衡抽提缓冲液10分钟，然后将热的缓冲液加入到菌丝体粉末中，用涡旋振荡器充分混合该悬浮液1分钟。加入1ml氯仿后再次混合悬浮液1分钟。用Sorvall高速离心机以10⁴×g离心10分钟后用等体积苯酚/氯仿(1∶1)再抽提水相一次，然后用氯仿抽提两次。用下述程序从水相中分离DNA：用2倍体积乙醇在室温立即从水相中沉淀DNA，随后用Sorvall高速离心机以10⁴×g离心10分钟收集DNA，通过将DNA重溶于无菌蒸馏水并用乙醇沉淀而洗二次，通过向终溶液中加入RNA酶(20μg/ml)而除去RNA。

如上所述用HpaI(Life Technologies)根据厂商指导消化从野生型黑曲霉N402(cspA1)和5个pIM130转化子分离的高分子量DNA(1-2μg)，得到的片段通过琼脂糖凝胶电泳分离，并如Maniatis等人(1982)所述转移至High-bond N膜。根据下述程序(Sambrook等人)，用如Sambrook等人(1989)所述制备的含黑曲霉pyrA基因的³²P标记的3.8kb XbaI片段作为探针进行杂交：于68℃在6×SSC(每1000ml20×SSC含有175.3g NaCl，107.1g柠檬酸钠·5.5H₂O，pH7.0)，0.1％SDS，0.05％焦磷酸钠，5×Denhardt’s溶液(每500ml 100×Denhardt’s溶液含有10g Ficoll-400，10g聚丙烯吡咯烷酮，10g牛血清白蛋白(Pentax Fraction V))和20μg/ml变性鲱精DNA中预杂交3-5小时，并在含变性放射性标记探针的相同缓冲液中于68℃杂交15-18小时，随后在3×SSC，0.1％SDS中于68℃洗两次，在0.2×SSC，0.1％SDS中于68℃洗两次。用Saran包裹纸覆盖膜，用Konica X光胶片和带常规增感屏的Kodak X-Omatic暗盒在-70℃放射自显影过夜。

结果发现在N402泳道中有一10kb杂交带，而在转化子NW205∷130#1，NW205∷130#2和NW205∷130#3中没有这一杂交带。在转化子NW205∷130#1和NW205∷130#3中发现一15kb杂交片段，而在NW205∷130#2中发现一20kb带。这些结果分别对应于在同源pyrA基因座上的单拷贝和双拷贝整合。在转化子NW205∷130#4和NW205∷130#5中，质粒在非同源基因座上整合。选择转化子NW205∷130#2进行诱变。

pIM130的UAS片段包括阳性调节物所需的结合位点以显示UAS的刺激活性，因此在包括pIM130的宿主细胞中对xlnR的抑制将导致存在于pIM130上的双向标记不表达。xlnR的表达由木聚糖或木糖诱导，因此如果宿主具有xlnR则这些底物的存在应导致pIM130的双向标记的表达。

pIM130的UAS片段不包括存在于黑曲霉xlnA基因的天然UAS上的creA的抑制活性所需的位点，因此葡萄糖的存在赋予黑曲霉CREA⁺，随后抑制xlnA和其它木聚糖裂解酶编码基因如xlnD和axeA的UAS，并且抑制编码上述木聚糖裂解酶编码基因的UAS激活物的xlnR基因，即阻遏木聚糖裂解酶的表达，导致pIM130不表达。

实施例4：突变体的筛选

实施例4.1：去阻遏突变体的筛选

在以高频率振荡的5ml ST(ST：0.8％NaCl，0.05％Tween 20)中收集NW205∷130#2的孢子，并通过在无菌玻璃棉塞中过滤除去菌丝体碎片。通过在台式离心机中于室温以3000rpm离心10分钟收集孢子，重悬于5ml盐水中，这一洗涤步骤重复两次并将孢子以1×10⁷ 个/ml的密度最终重悬于盐水中。将10ml孢子悬液移至玻璃皿中用紫外线以18erg/mm²/min的剂量照射2分钟，诱变后将10⁵和10⁶个孢子涂布于含3％D-葡萄糖的MM+10mM L-精氨酸+10μM烟酰胺平板上(每种10个平板)和含3％D-葡萄糖/3％燕麦二粒小麦木聚糖(Sigma#XO627)的平板上。

4-7天后在每个平板(接种10⁶个孢子的平板)上发现5-10个突变菌落，根据其形态学可以将这些突变菌落分为三类：孢子形成完全的大菌落，孢子形成完全的中等大小菌落，孢子形成能力差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体，发现突变体能在含D-葡萄糖的培养基、含D-葡萄糖/木聚糖的培养基和含木聚糖的培养基上生长，而亲本菌株NW205∷130#2仅能在含木聚糖作为碳源的培养基上生长。另外在不同的生色底物上测试了这些突变体：4-甲基伞形花内酯基(methylumbelliferyl)-β-D-木糖苷(β-木糖苷酶，内切木聚糖酶)(Sigma#M7008)、4-甲基伞形花内酯乙酸酯(乙酰木聚糖酯酶)(Sigma#M0883)、4-甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷(阿拉伯呋喃糖苷酶)(Sigma#M9519)以及Remazol亮蓝修饰的木聚糖(内切木聚糖酶)(Sigma#M5019)。甲基伞形花内酯衍生物以1mM的终浓度加入到含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基中，而RBB-木聚糖以1mg/ml的浓度加入到含D-葡萄糖/ 木聚糖和木聚糖的培养基中。对于所有这些测试的底物，发现突变体在含D-葡萄糖的培养基上生长后具有酶活性，而在亲本菌株NW205∷pIM130#2中未发现表达。在含木聚糖的培养基上发现与NW205∷pIM130相比这些酶表达增加，在所有测试的突变体中5B具有最高的表达水平。在本例中筛选是在作为木聚糖裂解的抑制物有正常活性的底物即葡萄糖上进行的。为确定表达可在不存在阻遏的情况下发生，也包括了木聚糖裂解基因的诱导物木聚糖。这种对照试验优选地包括在本发明的方法中。突变体明显地显示去阻遏。

为比较所产生的活性水平，将黑曲霉N402和突变体5B在含1.5％粗制小麦阿糖基木聚糖作为碳源的MM培养基上培养，在24、42、72和96小时取样测定α-L-阿拉伯呋喃糖苷酶、内切木聚糖酶和β-木糖苷酶的活性。结果(图2A、B、C)显示突变菌株的三种酶活性均增加，α-L-阿拉伯呋喃糖苷酶和内切木聚糖酶活性非常强地增加。

实施例4.2：非表达突变体(non-expression mutant)的筛选

收获菌株NW205∷130#2的孢子并如实施例4.1所述进行突变，随后涂布于含有100mM D-木糖、补加10mM尿苷、10mM L-精氨酸和0.8mg/ml 5-氟乳清酸(Sigma#F5013)的MM上，将这些平板在30℃保温4-7天。通过涂布在含有1％木聚糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上分析具有PYR-表型的64个生长菌落的木聚糖酶表达，在所测的这64个突变体中，有10个突变体在这些含木聚糖的平板上具有缩小的透明区，具有潜在的降低的木聚糖酶水平。在存在和不存在尿苷的含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基上证实了这些突变体的表型，所有10个突变体在不含尿苷的培养基上均不生长。

为进行进一步的分析，将这些突变体在含50mM果糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上于30℃预培养18小时，之后收获菌丝体并将1克湿菌丝体转移至含1％木聚糖的MM上以及转移至含10mM D-木糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上。在30℃培养5.5小时后收获菌丝体和培养物滤液，将培养物滤液对1mM NaP_i pH5.6透析，之后测定木聚糖酶(Bailey等人，1991)和β-木糖苷酶活性(表1)。发现在这些所选的突变体中木聚糖酶和β-木糖苷酶的表达水平均大大降低。

实施例5：非表达突变体的互补

5.1构建黑曲霉基因组质粒文库

为构建质粒文库，将如实施例3所述分离的10μg黑曲霉NW128(cspA1，nicA1，pyrA6，goxC17)的基因组DNA在100μl终体积中用3.5U Sau3A(Life Technologies)根据厂商指导于37℃部分消化30分钟，通过琼脂糖凝胶电泳分离片段后，从低熔点琼脂糖凝胶中切下6.7kb-9.4kb大小的片段，并如Sambrook等人(1989)所述进行分离。从总共6次消化中分离4μg片段，终浓度为100ng/μl。根据厂商指导将600ng得到的片段连接进100ng BamHI消化的pUC18(Pharmacia#27526201)，连接后根据厂商指导用4μl连接混合物转化100μl E.coliDH5α Max Efficiency感受态细胞(Life Technologies，#18258-012)。6个随后的转化实验得到约5×10⁴个菌落，将这些菌落重悬于含100μg/ml氨苄青霉素的TY培养基(每100ml培养基含16克Select蛋白胨140(Life Technologies)，10克NaCl和10克酵母提取物)并于37℃培养3小时，之后分离质粒DNA并通过CsCl离心纯化。

5.2非表达突变体的互补

为了在非表达突变体中的互补，制备三种突变体NW205∷130Ac1-4，NW205∷130 Ac1-15，NW205∷130 Ac4-4的原生质体并如实施例2所述进行转化。在这些转化实验中使用10⁸个原生质体并与下述物质混合：如实施例5.1所述的20μg黑曲霉质粒文库的DNA，10μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA(Gems andClutterbuck，1993)，20μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA，使用2μg pGW635作为阳性对照。转化程序后将混合物涂布于含50mM D-木糖作为碳源并补加10μM烟酰胺和10mM L-精氨酸的用1.33M山梨醇的MM上，约4天后在阳性对照平板上出现菌落并计数，而6天后可以从互补平板上挑取菌落。

通过将得到的转化子菌落涂布于含1％燕麦二粒小麦木聚糖、1mM 4-甲基伞形花内酯-β-D-木糖苷、10μM烟酰胺和10mM L-精氨酸的培养基上而进行分析。在30℃培养6-7天后检测到荧光菌落，2-3天后这些菌落周围出现木聚糖透明区。

实施例6：黑曲霉xlnR基因的克隆

实施例6.1：黑曲霉xlnR基因的分离

黑曲霉xlnR基因是从如实施例5.2所述获得并筛选的转化子中分离。如de Graaff等人(1988)所述从得自NW205∷130 Ac1-4，NW205∷130 Ac1-15，NW205∷130 Ac4-4的13个转化子中分离总DNA。在针对pyrA的选择性(即诱导)条件下培养菌丝体并在作为碳源的1.5％粗制小麦阿糖基木聚糖上木聚糖裂解表达后，用Nucleobond AX100柱(Macherey & Nagel)从其中分离独立复制的质粒。将溶于400μl无菌水中的200μg总DNA与2ml S1缓冲液(50mMTris-HCl pH8.0，10mM EDTA，100μg RNase A)、2ml S2(200mM NaOH，1％SDS)混合并在室温保温5分钟，然后与2ml S3(2.60M KAc，pH5.2)在冰上保温5分钟，在15000g离心30分钟澄清悬液后，根据厂商指导“纯化质粒和粘粒的方法”(5.3改进的碱/SDS裂解)进行质粒的吸附、洗涤、洗脱和沉淀。得到的质粒DNA溶于150μl无菌水中，用其中20μl转化大肠杆菌DH5α(Sambrook等人，1989)。将从每种质粒制备物中得到的12个大肠杆菌菌落在含50μg/ml氨苄青霉素的250ml LB培养基中于37℃培养9-12小时后，根据Sambrook等人(1989)所述的煮沸裂解程序用1.5ml培养物进行质粒DNA微量制备分离，而细胞经离心沉淀储存于-20℃。HinDIII消化后用琼脂糖凝胶电泳分析这些DNA制备物，揭示有三类质粒，分别为pHELP1型质粒、基因组文库型质粒和大的复合型质粒。从含有后一类型质粒的菌落用250ml培养物冷冻沉淀进行大规模质粒分离，使用的是Nucleobond AX100柱，根据厂商提供的改进的碱/SDS裂解法(Macherey-Nagel)进行。分离得到A和B两种类型质粒，分别为互补子(complementant)A和B。用SalI，PstI，EcoRI，HinDIII消化这两种质粒，琼脂糖凝胶电泳后用变性的放射性标记的pHELP1、质粒A和质粒B经Southern分析得到的片段，实验以三份重复进行。结果显示质粒A和质粒B除pHELP部分外还共享相同的基因组区。根据使用pHELP1质粒发现的杂交信号之间的差异(显示载体和AMA1序列和质粒A和质粒B信号)，鉴别和亚克隆与质粒A和质粒B杂交但不与pHELP1杂交的片段。发现质粒B的4kb EcoRI片段和6.5kb HinDIII片段以及质粒A的3kb PstI片段与质粒A和质粒B均杂交，将它们亚克隆进pGEM7/EcoRI，pGEM7/HinDIII和pBluescript/PstI，分别得到质粒pNP1、pNP2和pNP3。繁殖和纯化后将这些质粒用于实施例5.2所述的使用突变体NW205∷130 Ac4-4的互补实验，在这些实验中突变体不使用pHELP1而直接转化，在这些实验中含有6.5kb HinDIII片段的质粒pNP2能互补突变。对pN2衍生质粒的亚克隆和转化揭示亚克隆进pBluescript的5kb BamHI-XbaI片段(得到质粒pNP8)能互补菌株NW205∷130Ac4-4。

实施例6.2：黑曲霉xlnR基因的亚克隆

为了亚克隆xlnR基因，用pNP1的4kbEcoRI片段作为探针筛选如Harmsen等(1990)的描述构建的黑曲霉基因组文库中的含xlnR区的噬菌体。如Maniatis等(1982)的描述，使用大肠杆菌LE392作为铺平板细菌将噬菌体在含0.7％琼脂糖的NZYCM顶层琼脂糖中以3×10³pfu/平板接种在5个直径为85mm的NZYCM(1.5％琼脂)平板上。平板在37℃下过夜培养后，如Maniatis等(1982)的描述将平板转移到HybondN⁺滤膜(Amersham)上，每个平板重复两次。滤膜在3×SSC中浸湿后，室温下将此滤膜在3×SSC中洗涤60分钟。使用如Sambrook等(1989)描述的方法制备的³²p标记的4kb EcoRI片段按照下列方法(Sambrook等，1989)进行杂交：68℃下在6×SSC(1000毫升20×SSC含有：175.3g NaCl，107.1g柠檬酸钠.5.5H₂O，pH7.0)，0.1％SDS，0.05％焦磷酸钠，5×Denhardt溶液(500毫升100×Denhardt溶液含有：10gFicoll-400，10g聚乙烯吡咯烷酮，10g牛血清清蛋白(Pentax组分V))，20μg/ml变性鲱精DNA中预杂交3-5小时；68℃下在相同的含有变性的标记探针的缓冲液中杂交15-18小时，然后68℃下在2×SSC，0.1％SDS中洗涤两次，0.2×SSC，0.1％SDS中洗涤两次。用Saran包装膜覆盖此膜，并在-70℃下使用Konica X-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。

此筛选得到了大约12个阳性噬菌体，纯化了其中的8个。使用巴氏吸管从平板上挑取每一个阳性噬斑，并如Maniatis等(1982)的描述在含有20μl氯仿的1ml SM缓冲液中将所说的噬斑从琼脂填料中洗脱下来。使用影印滤膜通过重复上述的方法从包含50-100个分离噬菌体之噬斑的平板上纯化得到的噬菌体。

纯化后，通过在NZYCM培养基上接种5×10³个噬菌体来繁殖这些噬菌体。37℃下过夜培养后，得到铺满的平板，通过加入5毫升SM缓冲液并将平板在4℃下间歇摇动贮存2小时来从平板中洗脱这些噬菌体。使用吸管收集上清液后，通过4℃下以4,000×g离心10分钟从此溶液中除去细菌。向上清液中加入0.3％氯仿，确定pfu数值。这些噬菌体原液(A-R/H-R)含有大约10⁹pfu/ml。

经Southern分析方法分析如Sambrook等(1989)描述的方法分离的5个选中的噬菌体A-R、B-R、C-R、E-R、F-R的DNA。37℃下在含有下列溶液的反应混合物中将DNA消化5小时：5μl(≈1μg)DNA溶液；2μl合适的10×反应缓冲液(Life Technologies)；限制性内切酶10U(LifeTechnologies)；无菌蒸馏水定容至20μl。65℃下将样品保温10分钟，在溶解在1×TAE缓冲液中上样到0.6％琼脂糖凝胶中之前，在冰上快速冷却。在25V下通过电泳15-18小时分离这些DNA片段。

在电泳后，通过碱性真空印迹法(VacuGene XL，Pharmacia LKB)如VacuGene XL操作说明(pp.25-26)的描述将所说的DNA变性并转移到尼龙膜(Hpbond N，Amserham)上，接下来进行预杂交和使用变性的标记的质粒pNP8的5kb BamHI-XbaI片段杂交，杂交条件如上所述。在-70℃下通过使用增感屏在Kodak XAR-5 X-光胶片上曝光18小时获得杂交图式。在所有5个克隆中，发现了来源于同一个基因组区的片段，并构建了这些片段的限制图谱。

以限制图谱为基础，筛选5kb BamHI-XbaI片段用于亚克隆。将100ng pBluescript BamHI-XbaI消化的片段与250ng的噬菌体B-R的5kb BamHI-XbaI片段混合，并向混合物中加入4μl 5×连接缓冲液(组成：500mM Tris-HCl，pH7.6；100mM MgCl₂；10mM ATP；10mM二硫苏糖醇；25％ PEG-6000)和1μl(1.2U/μl)T₄ DNA连接酶(Life Technologies)，混合物的最终体积为20μl。14℃下保温16小时后，用无菌水将混合物稀释到100μl。用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞(如Sambrook等(1989)的描述进行制备)。得到的6个克隆在含有100μg/ml氨苄青霉素的LB培养基(每1000毫升的LB培养基含有：10g胰酶化蛋白胨(BBL)，5g酵母抽提物(BBL)，10g NaCl，0.5mM Tris-HCl pH7.5)中过夜生长。通过如Maniatis等(1982)描述的煮沸裂解法从培养物中分离质粒DNA，在限制性分析中使用此质粒筛选含有所需要的质粒pIM230的克隆。从生长在含有100μg/ml氨苄青霉素的LB培养基中的500毫升包含pIM230的大肠杆菌DH5α培养物中大规模分离质粒DNA(Maniatis等，1982)。通过CsCl离心，乙醇沉淀纯化质粒，并溶解在400μl TE中。所得的产量大约为500μg。根据布达佩斯条约于1996年6月在真菌菌种保藏中心以保藏号CBS678.96保藏含有质粒pIM230的大肠杆菌。

实施例6.3：黑曲霉xlnR cDNA的亚克隆

为获得xlnR基因的锌指区部分的cDNA克隆，以类似于ZAP^TM -cDNA合成试剂盒(Stratagene)中所述的方法，用起始自位置1476-1496(SEQ ID NO：9)的寡核苷酸在1μg来自培养在木聚糖上30小时的黑曲霉N402野生型菌株的polyA⁺RNA上进行反转录酶和第二条链合成反应。用第二条链反应的一部分样品(1/50)作为模板，利用引物RO26和RO25(从SEQ ID NO：9的946-970位衍生而来)进行PCR，依次为95℃、58℃和72℃各60秒，共35个循环，而后在72℃保温5分钟。将得到的500bp片段亚克隆到pGEM-T载体(Promega)中并测序。

实施例7：xlnR基因的一级结构

实施例7.1：xlnR基因的序列分析

通过从pNP8和pIM230中亚克隆这些片段和使用特异性的寡核苷酸作为测序反应中的引物测定黑曲霉xlnR基因、它的启动子/调节区、基因的结构部分和终止区的序列。

为分析核苷酸序列，分离出限制性片段，然后将其克隆到用适当的限制酶消化的pEMBL、pUC、pBluescript、pGEM DNA载体中。通过双脱氧核苷酸链终止法(Sanger等，1977)使用Pharmacia ALF express自动测序仪和Thermosequenase测序试剂盒(Amersham)测定核苷酸序列。在基因特异性寡核苷酸情况下，联合使用Pharmacia Cy5内部标记试剂盒和T7 DNA聚合酶测序试剂盒(Pharmacia)。根据厂商指导进行反应和电泳，用PC/GENE程序(Intelligenetics)进行计算机分析。在SEQ ID NO：9中给出了测定的序列。

实施例7.2：xlnR基因的描述

包含xlnR结构基因的序列(SEQ ID NO：9)的前端是一个947个核苷酸长的上游区。在上游非编码区发现富CT序列但未发现TATAA框。xlnR基因的结构部分从948到3690位，由两个内含子间断，1174-1237位的内含子已由测定如实施例6.2中所述的pIM230中的基因组片段和实施例6.3中所述的cDNA的一部分的序列所证实。第二个内含子在3496-3549位，该第二个内含子的序列符合正常在真菌中发现的保守内含子序列，用于剪接连接和套索序列。

xlnR基因编码一种875个氨基酸的蛋白质。该衍生的多肽含有一典型的N-末端锌双核簇区，由1110-1260位核苷酸编码，其具有典型的与锌配位的6个半胱氨酸。在这一区域中还有几处与例如Kraulis等人(1992)(引入本文作参考)的图1列出的其它真菌调控蛋白相似处。

在2623-2649位发现一典型的RRRLWW基序，这一基序在几个双核锌簇调控蛋白中均有发现(但略有差异)，如Suarez等人(1995)所注意到的。

实施例7.3：黑曲霉突变体中的xlnR的序列分析

为确定在如实施例4.2所述的不表达木聚糖裂解系统的黑曲霉突变体中的突变是否位于xlnR，测定这些突变体的xlnR基因的序列。为此，针对每种NW205∷130Ac突变体制备富含5.5kb BamHI xlnR片段的文库。为构建这种富含xlnR的文库，从每一菌株中分离用BamHI，HinDIII，XhoI，SstI和KpnI消化的基因组DNA的5.5kb片段，将这些片段与BamHI消化的去磷酸化pUC18载体(Ready-To-Go^TM pUC18BamHI/BAP+连接酶，Pharmacia)混合并连接。根据厂商指导用连接混合物转化大肠杆菌DH5α(MAX Efficiency DH5α^TM感受态细胞，Gibco-BRL)，筛选Amp抗性菌落，得到5×10²-10³个菌落的初级文库。在主平板上复制初级文库后，根据标准程序(Sambrook等人，1989)用变性的放射性标记的pIM230的BamHI-XbaI插入片段作为探针通过菌落滤膜杂交筛选这些黑曲霉xlnR富集文库。

对于每种突变菌株，用牙签从主平板上挑取阳性菌落，在含100μg/ml氨苄青霉素的5ml LB培养基中于37℃培养15-18小时，之后如Sambrook等人(1989)所述用煮沸裂解进行质粒DNA的微量制备分离。用琼脂糖凝胶电泳分析这些DNA制备物并将消化图谱与xlnR特异性图谱比较，揭示出菌落含有正确的5.5kb BamHI xlnR片段。如实施例7.2所述，用特异性xlnR寡核苷酸作为引物在测序反应中测定黑曲霉突变体的序列。对于突变体NW205∷130Ac 1-15，在3479位测定有一单碱基对取代，导致SEQ ID NO：9中823位亮氨酸变为丝氨酸。对于突变体NW205∷130Ac2-5，在3655位测定有一单碱基对取代，导致SEQ ID NO：9中864位酪氨酸变为天冬氨酸。这些突变证实两个突变体均为xlnR突变体。

实施例8：xlnR在黑曲霉中的表达

实施例8.1：不表达木聚糖裂解系统的黑曲霉突变体的互补

为了在所有非表达突变体中的互补，根据实施例2所述转化实施例4所述的所有10种NW205∷130Ac突变体，转化是将原生质体与作为转化率对照的pGW635和测试pIM230的互补能力的pIM230DNA进行合并。

通过涂布于含1％燕麦二粒小麦木聚糖作为碳源的合适培养基上，分析得到的转化菌落的木聚糖裂解能力并与它们的亲本突变菌株比较，2-3天后在所有10种突变体的转化菌落周围有木聚糖透明区，但亲本突变菌株没有该透明区，因此显示木聚糖裂解能力的恢复。

实施例9：xlnR基因的剂量对黑曲霉木聚糖裂解系统表达的作用

为了研究xlnR基因在改进菌株增加木聚糖裂解表达方面潜在的应用，如实施例2所述使用19μg的包含xlnR的质粒pIM230和2μg包含构巢曲霉argB基因(Johnstone等，1985)的质粒pIM650在共转化实验中将含有多拷贝(大约6个)的编码β-木糖苷酶的黑曲霉xlnD基因的菌株N902∷200-18转化成精氨酸原养型。在含有1％燕麦二粒小麦木聚糖的MM平板中筛选获得的增加了内切木聚糖酶表达的转化子。选择4个水解圈形成最快最大的菌落确定xlnR拷贝数。为此，分离这些转化子和受体菌株的DNA，并将系列稀释液点到Hybond N膜上。使用跨越xlnR基因的编码序列的标记的4.5kb SmaI/Xbal片段，从杂交后获得的信号计算拷贝数。基于与受体菌株比较，确定N902∷200-18-R14中的xlnR拷贝数为8，而N902∷200-18-R16中的拷贝数为32。对于这两种转化子，在菌株在液体培养基中生长后，通过Northern分析方法分析增加基因xlnR的剂量的效应。在1％果糖上预培养18小时后，在转移到2％燕麦二粒小麦木聚糖作为碳源的转移实验中进行此项分析。在转移后8和24小时取样(菌丝样品)，使用TriZol(Life Technologies)按照厂商的说明从中分离总RNA，并经Northern印迹分析方法进行分析(Sambrook等，1989)。在这些转化子中，木聚糖酶B的表达水平相对于受体菌株明显增加，这一点是在通过使用标记的黑曲霉xlnB的1 kb EcoRI/XhoI片段杂交后确定的(Kinoshita等，1995)。

为了进一步研究xlnR基因在改进菌株增加内切木聚糖酶表达方面潜在的应用，如实施例2所述根据下述策略转化黑曲霉：1、pGW635(pyrA)(阳性对照)，2、pDB-K(XA)，3、pDB-K(XA)+pIM230，4、pGW635+pIM230。质粒pDB-K(XA)含有在载体pEMBL18中的黑曲霉pyrA基因和来自塔宾曲霉的黑曲霉木聚糖酶A基因。获得所有使用条件的转化子，根据在燕麦二粒小麦木聚糖平板上的水解圈大小筛选过量表达内切木聚糖酶的菌株(测试了来自每组的20个转化子)。

每组选一个转化子培养进行活性分析，将菌株在含果糖的培养基上预培养18小时，之后将菌丝体(50ml中有2.5g湿重菌丝体)转移到含1.4％粗阿糖基木聚糖的培养基，所有培养均在摇瓶中进行。在30℃培养40小时，通过HPLC分析确定木聚糖酶A的水平，同时测定β-木糖苷酶和内切木聚糖酶活性。在标准Pharmacia-LKB HPLC装置(Uppsala，瑞典)中进行层析，以1.5ml/min运行SOURCE 15 Q.HR5/5柱，缓冲液A＝20mM TRIS缓冲液，pH7.5，缓冲液B＝含有1MNaCl的20mM TRIS缓冲液，pH7.5，在30分钟内缓冲液B梯度为0-50％，在280nm检测，Pharmacia-LKB UV-MII，吸收值为0.1-0.2，见图3。用1000μl20mM TRIS缓冲液，pH7.5稀释100μl培养物培养基，将1000μl稀释样品加到柱中，然后可见以约30％B缓冲液洗脱的峰代表木聚糖酶A的活性。图3中示出了每组转化子中在HPLC分析中显示最高木聚糖酶A活性/峰的一个菌株。内切木聚糖酶活性的测定是通过测定从来自Megazyme，Warriewood，澳大利亚的天青蛋白染色的交联小麦阿糖基木聚糖(Xylazyme片)释放的染色片段而进行。通过在40℃、0.1M乙酸盐缓冲液，pH3.4中与100XU/g(木聚糖酶单位)的内标酶比较而计算木聚糖酶活性。在仅有木聚糖酶A发挥内切木聚糖酶活性的pH条件下，在水不溶性阿糖基木聚糖上分析了相同的4个转化子，分析结果如表2所示。

表2

转化子	XU/g
		pyr⁺(对照)	4
DB-K(XA)-15	52
		DB-K(XA)/pIM230-21	111
pIM230-26	24

[0196] 从图3和表2所示的结果可清楚地看出用木聚糖酶A编码基因进行的转化如预期地大大增加了木聚糖酶A的酶活性，更令人吃惊的是，转化后使用激活基因xlnR也大大增加了木聚糖酶A的水平，这提示在未转化的亲本中存在对激活物XYL R(＝xlnR基因产物)水平的限制。因此，预计在pDB-K(XA)多拷贝转化子中反式作用调控因子的量更加有限，这一点通过pDB-K(XA)/pIM230转化子的木聚糖酶A水平是pDB-K(XA)多拷贝转化子的两倍这一结果而证实。

实施例10：筛选丝状真菌的xlnR基因

为了分析是否可通过异源杂交从其它真菌分离xlnR对应物，使用xlnR基因的4.5kb SmaI/XbaI片段作为探针。从下述菌株中分离DNA：黑曲霉N902(argB15，cspA1，fwnA1，metB10，pyrA5)，塔宾曲霉NW184(cspA1，fwnA1，pyrA22)，保藏号为FGSC187的构巢曲霉WG096(pabaA1，yA2)，保藏号为CBS101.43的A.aculeatus NW240(pyrA3)，保藏号为CBS115.80的A.aculeatus NW217(fwnA1，cspA1，pyrA4，lysA1)，保藏号为CBS115.52的A.foetidus(awamori)NW183(cspA1，fwnA1，pyrA13，lysA1)，日本曲霉CBS114.51和Trichodermareesei QM9414。用BamHI或XhoI消化1-2μg DNA后如实施例3所述用Southern分析进行分析。所用杂交条件为：56℃下在6×SSC(1000毫升20×SSC含有：175.3g NaCl，107.1g柠檬酸钠.5.5H₂O，pH7.0)，0.1％SDS，0.05％焦磷酸钠，5×Denhardt溶液(500毫升100×Denhardt溶液含有：10g Ficoll-400，10g聚乙烯吡咯烷酮，10g牛血清清蛋白(Pentax组分V))，20μg/ml变性鲱精DNA中杂交18-24小时；然后68℃下在5×SSC，0.1％ SDS中洗涤两次，每次30分钟，在56℃下在2×SSC，0.1％ SDS中洗涤两次，每次30分钟。杂交后用Saran包装膜覆盖此膜，并在-70℃下使用KonicaX-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。

结果是在所有分析的真菌中均发现杂交片段，在黑曲霉、塔宾曲霉和臭曲霉中发现非常强的杂交信号，而在其它所研究的菌株中也发现了明显的杂交信号。

实施例11：利用其它启动子片段的筛选系统的应用

构建含有来自黑曲霉abfA基因(Flipphi等人，1994)和黑曲霉abfB基因(Flipphi等人，1993)的启动子片段的质粒。为了构建含abfA启动子片段的质粒，如实施例1所述将来自pIM900(Flipphi等人，1994)的1.4kb XhoI/PstI片段连接进SalI/PstI消化的pAlter(Promega)。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-83至-88位创建一XhoI限制位点(Flipphi等人，1994)。从得到的质粒分离953bp SstI/XhoI片段，将这一片段和来自pIM130的1.5kb XhoI片段连接进用SstI/XhoI消化的pBluescript(Stratagene)。通过用BglII消化鉴别含有正确方向的1.5kb XhoI片段的质粒，得到的质粒命名为pAP8。

类似地从pIM991(Flipphi等人，1993)分离来自abfB启动子的910bp PstI片段并连接进PstI消化的pEMBL19，用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用BamHI消化鉴别含有正确方向的两个片段的质粒，得到的质粒命名为pIM132。

含有来自黑曲霉pgaII的片段的第三个质粒的构建是将1450bpXbaI/XhoI片段克隆进载体pAler。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-107至-112位创建一XhoI限制位点(Bussink等人，1991)。从得到的质粒分离1.2kb XbaI/XhoI片段，将这一片段和来自pIMl30的1.5kb XhoI片段连接进用XbaI/XhoI消化的pBluescript(Stratagene)。通过用HinDIII消化鉴别含有正确方向的1.5kb XhoI片段的质粒，得到的质粒命名为pIIP7。从相同的pgaII基因分离来自223bp HinDIII/PstI片段(Bussink等人，1992)并连接进HinDIII/PstI消化的pEMBL19，用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用HinDIII消化鉴别含有正确方向的两个片段的质粒，得到的质粒命名为pHPII。

通过如实施例2所述的转化将全部4个质粒导入黑曲霉NW219，在使用具有abf启动子片段的构建物(质粒AP8和pIM132)的转化实验中用10mM L-阿拉伯糖醇作为诱导物，在使用携带pgaII片段的质粒的转化实验中用1％聚半乳糖醛酸(USB化学品)作为诱导物。尽管发现质粒转化率很高，但是使用含pgaII启动子片段的质粒pIIP7和pHPII的转化实验仅分别发现5和7个转化子。

如实施例3所述对从利用质粒pAP8和pIM132(abf启动子片段)的转化实验得到的转化子进行表型分析，使用的是含10mM L-阿拉伯糖醇/50mM山梨醇，10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mMD-葡萄糖的MM。在从质粒pAP8得到的29个转化子中的10个转化子中以及从质粒pIM132得到的30个转化子中的13个转化子中发现了预期表型，即在10mM L-阿拉伯糖醇/50mM山梨醇上生长，在10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mM D-葡萄糖上不生长。在含1％聚半乳糖醛酸，1％聚半乳糖醛酸/50mM D-葡萄糖和50mM D-葡萄糖的MM上测试了从质粒pIIP7和pHPII得到的转化子，然而所有转化子均不显示预期的表型，所有转化子在三种培养基上均能生长，这提示这些转化子来自pyrA基因座的双交换。

基于含pgaII启动子片段的质粒的结果，我们测试了通过增强诱导是否能提高转化频率。我们假定转化失败或多或少地由缺少诱导物所致，因为没有聚半乳糖醛酸酶的单体诱导物，因此需降解聚合物以释放诱导物，导致表达。我们测试了用少量uridin补加到培养基中是否能克服这一问题。为此，将NW219和转化子NW219∷pIM132#30在含有诱导abfB的1％燕麦二粒小麦木聚糖和分别为0、0.001、0.005、0.01、0.1、1、5和10mM的增加浓度的uridin的培养基上进行测试。在这一实验中，受体菌株NW219在含低于0.01mM uridin的培养基上不生长，而NW219∷pIM132#30转化菌株在所有条件下均生长，然而孢子形成程度和菌落形态有变化，给出类似野生型孢子形成程度的最低uridin浓度约为0.01mM uridin。

基于这些结果，用质粒pIIP7和pHPII重复对黑曲霉NW219的转化，使用的培养基是含有1％柠檬果胶(酯化度45％)(CopenhagenPectin factory)以及分别补加0.01mM和0.005mM uridin的实施例2所述的MMS培养基。这导致转化子数增加，将这些转化子在含如上所述的1％柠檬果胶、1％柠檬果胶/50mM D-葡萄糖和50mM D-葡萄糖的培养基上进行测试，预期表型分别为生长、不生长和不生长。30个pIIP7转化子中有10个转化子以及30个pHPII转化子中有9个转化子具有预期表型。

通过Southern分析法分析具有预期表型的转化子，如实施例3所述分离DNA并分析。对于从含abfA启动子片段的质粒pAP8产生的转化子，用ClaI消化DNA，对于从pIM132(abfB)质粒产生的转化子用ClaI消化DNA，对于从pgaII质粒pIIP7和pHPII产生的转化子用ClaI消化DNA。基于用下述放射性标记的片段的杂交获得的放射自显影图，根据预期拷贝数筛选转化子，所述的标记片段为pyrA基因的3.8kb XbaI和1.2kb ClaI片段。选定了下述转化子：AP8/16(abfA)，NW219∷132#8(2拷贝)和NW219∷132#30(3-4拷贝)(abfB)，NW219∷pIIP7#3(2拷贝)和NW219∷pIIP7#9(2拷贝)(pgaII)。

将选定的转化子如实施例4所述进行诱变，在MM+50mM D-葡萄糖和MM+10mM L-阿拉伯糖醇/50mM D-葡萄糖上筛选阿拉伯呋喃糖苷酶去阻遏突变体，而在MM+50mM D-葡萄糖和MM+1％柠檬果胶/50mM D-葡萄糖上筛选聚半乳糖醛酸酶去阻遏突变体。4-7天后在每个平板上分析5-10个突变体菌落，基于这些菌落的形态学可将其分为三类：孢子形成完全的大菌落，孢子形成完全的中等大小菌落和孢子形成差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体，发现阿拉伯呋喃糖苷酶突变体菌落能在含D-葡萄糖的培养基、含D-葡萄糖/L-阿拉伯糖醇的培养基和含L-阿拉伯糖醇的培养基上生长，而亲本菌株仅能在含L-阿拉伯糖醇作为碳源的培养基上生长。类似地，聚半乳糖醛酸酶突变体也能在MM+50mM D-葡萄糖和MM+1％柠檬果胶/50mMD-葡萄糖和MM+1％柠檬果胶上生长，而亲本菌株仅能在MM+1％柠檬果胶上生长。另外如实施例4所述在生色底物甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷上测试了阿拉伯呋喃糖苷酶突变体(每种20个)。尽管通过底物荧光检测到亲本菌株在含D-葡萄糖/L-阿拉伯糖醇培养基上不表达阿拉伯呋喃糖苷酶，但是突变体具有不同水平的表达，在D-葡萄糖培养基上选择的突变体中发现了最高水平。

在MM+1％柠檬果胶/50mM D-葡萄糖上测试聚半乳糖醛酸酶突变体，接种平板2-3天后通过如Ried and Collmer(1985)所述染色而使聚半乳糖醛酸酶活性肉眼可见。在亲本菌株情况下发现了小水解圈，而在突变体中检测到各种程度的水解圈形成的增大。

根据实施例4，在含FOA的培养基上还筛选了非表达突变体，为此，将NW219∷132#30(abfB)进行突变并涂布在MM+10mM L-阿拉伯糖醇+1mg/ml FOA+10mM uridin上。7-10天后选择突变体并涂布在含10mM L-阿拉伯糖醇/50mM山梨醇、10mM uridin并具有用于检测内切arabinan表达的含0.5％AZCL-阿拉伯聚糖(Megazyme，Sydney，澳大利亚)的顶层琼脂的MM上。所检测的30个转化子中的2个即132/30 F12和F26不能从底物释放染料，指示缺乏内切arabinan活性。在含10mM L-阿拉伯糖醇和10mM uridin的液体MM中培养这些转化子，随后在培养物滤液中测量阿拉伯呋喃糖苷酶活性，发现活性降低至少4倍。

将NW219∷pIIP7#3进行突变并涂布在含1％柠檬果胶/50mM山梨醇、10mM uridin和1mg/ml FOA的MM上。培养6-10天后挑选突变体并如上所述筛选聚半乳糖醛酸酶活性。在所选65个突变体中有3个突变体在聚半乳糖醛酸酶活性染色后有降低的水解圈形成，提示聚半乳糖醛酸酶表达降低。

EP95201707.7是共同未决的欧洲专利申请，本文在此将该申请的实施例7、8和11附上。

EP95201707.7的实施例7：使用质粒pIM200转化黑曲霉

以1×10⁶个孢子/ml在250ml由MM组成的培养基(添加了2％葡萄糖，0.5％酵母抽提物，0.2％酪蛋白氨基酸(不含维生素)，2mM亮氨酸，10μM烟酰胺，10mM尿苷)中接种NW155菌株(cspAl，argB13，pyrA6，nicA1，leuA1，prtF28)(来源于NW228，Van den Hombergh等，1995)的孢子，30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。使用B

chner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体，并且用SP6(SP6：0.8％NaCl，10mM磷酸钠缓冲液，pH 6.0)洗涤几次。将150ml的Novozyme 234溶解在已加入1g菌丝体(湿重)的20ml SMC(SMC：1.33M山梨醇，50mM CaCl₂，20mM EMS缓冲液，pH5.8)中，并且小心地悬浮。30℃下用温和振荡器培养悬浮液1-2小时，每隔30分钟将菌丝体小心地悬浮，取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×10⁸)时，小心地悬浮并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000rpm离心10分钟收集菌丝体，除去上清液，将沉淀物小心地悬浮在5ml STC(STC：1.33M山梨醇，50mM CaCl₂，10mM Tris/HCl，pH 7.2)中。洗涤步骤重复两次，最后将原生质体以1×10⁸/ml密度悬浮在STC中。

通过以下步骤进行转化：将20μg的pIM200 DNA和含有黑曲霉pyrA基因的5μg pGW635(溶解在10-20μl的TE中)与5μl的PEG缓冲液(PEG缓冲液：25％PEG-6000，50mM CaCl₂，10mM Tris/HCl，pH7.2)一起加入到200μl的原生质体悬浮液中，然后使用移液管上下移动多次慢慢地将上述液体混合，并在室温下温育20分钟。此后，加入2μl的PEG缓冲液，将溶液慢慢混合并在室温下温育5分钟，接下来加入4ml的STC并在涡旋混合器中慢慢混合。然后将1ml的悬浮液加入到4ml含有0.95M蔗糖渗透稳定的优质琼脂中，然后倒入渗透稳定的平板中。另外使用pGW635转化黑曲霉作为对照。

EP95201707.7的实施例8：转化子的分析

通过将在实施例7中获得的pIM200转化子接种在含有1％燕麦二粒小麦木聚糖和1mM 4-甲基伞形花内酯基-β-木糖苷的MM培养基上来分析其表型。检验了26个转化子，其中5个显示出增加了的荧光。将这些转化子和转化子PYR⁺(作为参考)一起培养在含有1％燕麦二粒小麦木聚糖的MM上，培养20、27和42小时。此后测量β-木糖苷酶对PNP-X的活性。结果列于表C中。

在全部5个选择的转化子中都发现了β-木糖苷酶活性水平的增加，最高水平比野生活性多30多倍。使用如EP95201707.7的实施例3中的描述制备的抗β-木糖苷酶的抗体通过Western印迹和使用Bio-Rad免疫印迹GAR-AP测定试剂盒按照供应商的说明证实了这些结果。

表C

在下述保温时间后的黑曲霉转化子的β-木糖苷酶活性

(mU/ml培养物滤液)

EP95201707.7的实施例11：黑曲霉xlnD基因的破坏

实施例11.1：破坏(disruption)质粒pIM203和pIM204的构建

通过经PCR产生xlnD基因的内部片段来构建此基因的破坏质粒pIM203和plM204。使用衍生于xlnD序列(SEQ ID NO：1)的寡核苷酸产生所说的片段。xylos001是从1157至1176的位置上产生的，xylos004是从3147至3164位置上产生的。通过包含10μl 10×反应缓冲液(100mM Tris-HCl，pH 8.3，500mM KCl，15mM MgCl₂，0.01％明胶)，4种脱氧核苷三磷酸各16μl 1.25mM，1ng质粒pIM200 DNA，每种寡核苷酸各1μg(定容到100μl)的PCR产生此片段。混合反应混合物，并加入1μlTAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃下温育3分钟使此DNA变性，接下来进行25个循环(92℃，1分钟；52℃，1.5分钟；72℃，1.5分钟)。25个循环后，将混合物在72℃下温育5分钟。经琼脂糖电泳的反应产物分析显示出一个大约2000bp的片段，基于此基因的序列，此片段的大小在预料之内。将所得的片段亚克隆到载体pGEM-T(Promega)中，形成质粒pIM202。在EcoRV/PstI消化的pIM202载体中通过连接pILJ16的SmaI/PstI片段(Johnstone等，1985)(包含构巢曲霉的argB基因(Upshall等，1986))构建质粒pIM203。在SpeI/NsiI消化的pIM202载体中通过连接pIM130(EP 95202346.3)的NsiI/XbaI片段(包含在塔宾曲霉xlnA启动子UAS控制之下的pyrA基因)构建质粒pIM204。

实施例11.2：黑曲霉xlnD基因的破坏

如实施例11.1中所述的包含xlnD内部片段和argB基因(pIM203)或pyrA基因(pIM201)的质粒作为在转化中的选择标记用于破坏黑曲霉xlnD基因。为此，如实施例7中所述，分别利用选择精氨酸或尿苷原养型的质粒pIM203和pIM204转化黑曲霉N902(argB15、cspA1、fwnA1、metB10、pyrA5)。如实施例8所述在1％木聚糖平板上筛选得到的转化体对甲基伞形花内酯基-β-木糖苷的活性。在这两组转化体中筛选了20个转化体。生长24小时后，在这些转化体中每一组的MUX活性水平都有明显减少。选择的转化体的Southern分析表明pIM203转化体在同源的xlnD位点有多拷贝的整合。pIM204转化体在xlnD位点发生单一同源整合。如实施例8中所述的，分析这些转化体的PMP-X的活性表明β-木糖苷酶降低至少100倍。

实施例11.3：xlnD基因的过量表达和失活对黑曲霉木聚糖裂解系统表达的作用

为了确定xlnD表达对木聚糖裂解系统(spectrum)表达的作用效应，将黑曲霉N902、两个在N902中的xlnD多拷贝转化体、xlnD基因破坏菌株在液体培养基上培养。在1％果糖上预培养18小时后，转移到2％燕麦二粒小麦木聚糖或3％D-木糖作为碳源的培养基上培养。在培养物滤液中按照PNP-X活性测定方法确定β-木糖苷酶活性。在这两种碳源中，对于pIM200转化体能够发现明显的过量表达，而对于两种(pIM203和pIM204)失活转化体几乎没有PNP-X活性。xlnD基因破坏转化体表明最初内切木聚糖酶表达水平降低，然而在16小时后其活性最终增加，结果相对于黑曲霉野生型其活性增加，因此，所形成的木聚糖制剂中不含β-木糖苷酶。

接下来使用Dionex系统和脉冲Amperometric检测通过HPLC分析方法分析培养物滤液。为此，收获后立即煮沸1ml培养物滤液，以便失活木聚糖裂解酶，然后将样品离心10分钟(14,000rpm，4℃，Eppendorf离心机)。将得到的上清液用bidest稀释5倍，使用DionexCarbofac100柱通过HPLC分析20μl上清液。分析结果表明在野生型和过量表达的转化体中仅在最初阶段能够在培养物滤液中检测到木糖寡聚物的存在。在破坏突变体中，在培养物滤液中积累木乙糖，而很少积累木丙糖，所以得到木寡聚物尤其是木乙糖和木丙糖的源。

参考文献

Andrianopoulos，A.和Hynes，M.J.(1988)，分子细胞生物学8：3532-3541。

Aviv，H.和Leder，P.(1972)美国科学院院刊11：1408-1412。

Balance D.J.和Turner G.C.(1985)基因36：321-331。

Bailey，A.M.等人(1991)核酸研究19：5273-4278。

Bailey，A.M.，Biely.，P.和Poutanen，K.(1992)生物工程杂志23：257-270。

Berka，R.M.，Ward，M.，Wilson，L.J.，Hayenga，K.J.，Kodama，K.H.，Carlomagno，L.P.和Tahompson，S.A.(1990)，基因86：153-162。

Bussink，H.J.D.，van den Hombergh.J.P.T.W.，van den IJssel，P.R.L.A.和Visser J.(1992)，应用微生物学和生物工程37，324-329.

Davies，R.W.(1991)，曲霉属中的高水平重组蛋白生产系统的分子生物学，见Leong，S.A.和Berka，R.M.和Berka，R.M.编辑的《分子工业真菌学：用于丝状真菌的系统及应用》Marcel Dekker，Inc.，第45-82页。

Ekwall，K.和Ruusla，T.(1991)，核酸研究19：1150。

Felenbok，B.和Sealy-Lewis H.M.(1994)，见《曲霉50年》Martinelli，S.D.和Kinghorn，J.R.编辑，141-179页。

Flipphi，M.J.A.，van den Heuvel，M.，van der Veen，P.，Visser，J.，和deGraaff，L.H.(1993)当今遗传学24：525-532。

Flipphi，M.J.A.，Visser，J.，van der Veen，P.和de Graaff.L.H.(1994)微生物学140：2673-2682。

Fowler，T.等人(1990)，当今遗传学18：537-545。

Gems D.H.和Clutterbuck A.J.(1993)，当今遗传学24：520-524。

Goosen T，Bloemheuvel G，Gysler C，Bie DA de，Broek HWJ vanden，SwartK(1987)，当今遗传学11：499-503。

Graaff LH de(1988)构巢曲霉和黑曲霉的丙酮酸激酶基因的结构和表达，PhD论文，Landbouw大学，Wageningen，荷兰。

Graaff L.H.de，van den Broeck，H.C.，van Ooijen A.J.J.和Visser，J.(1994)，分子微生物学12：479-490。

Gwynne.D.I.，Buxton.F.P.，Gleeson，M.A.和Davies R.W.(1987)，外源蛋白质从曲霉属各物种的基因工程分泌，见Burgess.R.编辑的《蛋白质纯化：微量至常量》Alan R.Liss，纽约，第355-365页。

Harmsen，J.A.M.，Kusters-Van Someren，M.A.，Visser，J.(1990)当今遗传学18：161-166。

c.f.Hinnen，A.等人(1995).见《在重组微生物中的基因表达》Smith，A.编辑，Marcel Dekker Inc.，纽约，121-193页。

Hombergh van den，J.P.T.W.，van de Vodervoort，P.J.I.，van derHeijden，N.C.B.A.，和Visser，J.(1995)，当今遗传学28：299-308。

Johnstone，I.L.，Hughes，J.和Clutterbuck，A.J.(1985)，EMBOJ.4：1307-1331。

Katz，M.E.和Hynes，M.J.(1989)，分子细胞生物学9：5696-5701。

Kelly J.M.和Hynes M.J.(1985)，EMBO J 4：475-479。

Kelly，J.M.和Hynes，M.J.(1987)，当今遗传学12：21-31。

Kinoshita K.，Takano，M.，Koseki.T.，Ito.和Iwano，K.(1995)，发酵及生物工程杂志79，no5，422-428。

Kraulis，P.F.，Raine，A.R.，Gadhavi，P.L.和Laue E.D.(1992)自然356：448-455。

Maniatis，T.，Fritsch，E.F.和Sambrook，J.，(1982)，《分子克隆实验手册》，冷泉港，纽约，冷泉港实验室出版社。

Sambrook，J.，Fritsch，E.F.和Maniatis T.(1989)，《分子克隆实验手册》第二版，冷泉港，纽约，冷泉港实验室出版社。

Sanger，F.，Nickelsen，S.和Coulson A.R.(1977)美国科学院院刊74：5463-5467。

Schutte，J.B.(1991)，D-木糖和L-阿拉伯糖对家禽和猪的营养价值和生理作用，Datapress & Datavisions，Wageningen，第173页。

Suarez，T.，Vieira de Queiroz，M.，Oestreicher，N.和Scazzocchio，C.(1995)，EMBO J.14，no 7：1453-1467。

a)Unkles，S.E.，等人(1989)，基团78：157-166和

b)Unkles，S.E.，等人(1989)，分子及普通遗传学218：99-104。

Verdodes，J.C.，Punt，P.J.，Schrinckx，J.M.，van Verseveld，H.W.，Stouthamer A.H.和van den Hondel，C.A.M.J.J.(1993)，转基因研究2：84-92。

Verdoes，J.C.，Punt，P.J.和van den Hondel C.A.M.J.J.(1995)，应用微生物学及生物工程43：195-205。

Verdoes，J.C.(1994)，黑曲霉中的糖淀粉酶的过量产生的分子遗传学研究，论文，Vrije大学，阿姆斯特丹，荷兰。

Vishniac，W.和Santer.M.(1957)，细菌学综述21：195-213.

Wilson，L.J.，Carmona，C.L.和Ward，M.(1988)，核酸研究16：2389

Whittington，H.，Kerry-Williams，S.，Bidgood，K.，Dodsworth，N.，Peberdy，J.，Dobson，M.，Hinchcliffe，E.和Ballance.D.J(1990)，当今遗传学18：531-536。

序列表

(1)一般信息：

(i)申请人：

(A)姓名：Agricultural University Wageningen

(B)街道：Costerweg 50

(C)城市：Wageningen

(E)国家：荷兰

(F)邮码：6701BH

(ii)发明名称：分离突变体及克隆互补基因的新方法

(iii)序列数：9

(iV)计算机可读形式：

(A)介质类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release #1.0，Version #1.25(EPO)

(2)SEQ ID NO：1信息

(i)序列特征：

(A)长度：30个碱基对

(B)类型：核酸

(C)类型：单链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(xi)序列描述：SEQ ID NO：1：

CACAATGCAT CCCCTTTATC CGCCTGCCGT 30

(2)SEQ ID NO：2信息

(i)序列特征：

(A)长度：37个碱基对

(B)类型：核酸

(C)类型：单链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(xi)序列描述：SEQ ID NO：2：

CAATTGCGAC TTGGAGGACA TGATGGGCAG ATGAGGG 37

(2)SEQ ID NO：3信息

(i)序列特征：

(A)长度：20个碱基对

(B)类型：核酸

(C)类型：单链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(xi)序列描述：SEQ ID NO：3：

AGAGAGGATA TCGATGTGGG 20

(2)SEQ ID NO：4信息

(i)序列特征：

(A)长度：37个碱基对

(B)类型：核酸

(C)类型：单链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(xi)序列描述：SEQ ID NO：4：

CCCTCATCTG CCCATCATGT CCTCCAAGTC GCAATTG 37

(2)SEQ ID NO：5信息

(i)序列特征：

(A)长度：2054个碱基对

(B)类型：核酸

(C)类型：双链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：否

(vi)最初来源：

(A)生物体：塔宾曲霉

(ix)特征：

(A)名称/关键：TATA_信号

(B)位置：848..854

(ix)特征：

(A)名称/关键：外显子

(B)位置：950..1179

(ix)特征：

(A)名称/关键：内含子

(B)位置：1179..1228

(ix)特征：

(A)名称/关键：外显子

(B)位置：1229..1631

(ix)特征：

(A)名称/关键：CDS

(B)位置：连接区(950..1179，1229..1631)

(D)其它信息：/EC_号＝3.2.1.8

/产物＝“1，4-β-木聚糖木聚糖水解酶”

/基因＝″xlnA″

/标准名称＝″内切木聚糖酶″

(ix)特征：

(A)名称/关键：成熟肽

(B)位置：1031..1631

(ix)特征：

(A)名称/关键：信号肽

(B)位置：950..1031

(xi)序列描述：SEQ ID NO：5：

AACGTCTGCA GTCCCGTACT GTTTACCAAA ATGCCAGGCC ACTGGTGGAT ATACAACTTT 60

GTAATACGTT GCCGGAGTCA GCCCCTACTC CCTGATGGGT TCCCACTCCC TAGTTACTTC 120

CTACTGGGTA GTAGGCTCCT AGAGTGGGGT AAAGTTTGCC AAGGGTTTAG CCCCAGTCTT 180

GTTTATGCTT GGCTAGGCAG GACCTGGGTA AGTTGATGGC TCCTGCATTC CTACCTGAGT 240

ATTTCCAGCT ATAAGCGAGA TTTGCCATAC TCTTCAGCGA GTCCGGATGG TCCGCGCCGA 300

GGTTGACCCT GCCTTCATCA CCTACACAAA GAACTCCTCG GCCAACTCCC GGTGGCTTTC 360

GAGCTCCAAA GTACCTTCGC GACCTTTGGC CAGTGTTTCT CGCAGCGTTT ACTGAGCCTA 420

AGGCTTGCTA CAATAAATAA AGAGACATAA CCTTGCAGTA CATACGTCTT GTATGAGCGA 480

GGAACTGTGT TCAGTAGTAG ATCAGTGGGT ACATAATCAT GAACATGACT TCTGAGCCAG 540

AAAACCTTCT GCAGGCAACC GGTGAAGAAA CCCCACTTCC CCGCCTCCAC TAACTGCAGC 600

CCCTTTATCC GCCTGCCCTC CATTTAGCCA AATGTAGTCC ATTTAGCCAA GTGCGGTCCA 660

TTTAGCCAAG TCCAGTGCTT AGGTTGGTGG CTACACAGGA AACGGCCATG AATGTAGACA 720

CAACTATAGA ACTGTCCCTA GAAATAGGCT CGAGGTTGTT AGAGCGTTTA AGGTGATGCG 780

GCAAAATGCA TATGACTGAG TTGCTTCAAC GTGCAGGGGA AAGGGATAAA TAGTCTTTTT 840

CGCAGAATAT AAATAGAGGT AGAGCGGGCT CGCAGCAATA TTGACCAGGA CAGGGCTTCT 900

TTTCCAGTTG CATACATCCA TTCACAGCAT TCAGCTTTCT TCAATCATC ATG AAG 955

Met Lys

-27

GTC ACT GCG GCT TTT GCA GGT CTT TTG GTC ACG GCA TTC GCC GCT CCT 1003

Val Thr Ala Ala Phe Ala Gly Leu Leu Val Thr Ala Phe Ala Ala Pro

-25 -20 -15 -10

GCC CCA GAA CCT GAT CTG GTG TCG CGA AGT GCC GGT ATC AAC TAC GTG 1051

Ala Pro Glu Pro Asp Leu Val Ser Arg Ser Ala Gly Ile Asn Tyr Val

-5 1 5

CAA AAC TAC AAC GGC AAC CTT GGT GAT TTC ACC TAC GAC GAG AGT GCC 1099

Gln Asn Tyr Asn Gly Asn Leu Gly Asp Phe Thr Tyr Asp Glu Ser Ala

10 15 20

GGA ACA TTT TCC ATG TAC TGG GAA GAT GGA GTG AGC TCC GAC TTT GTC 1147

Gly Thr Phe Ser Met Tyr Trp Glu Asp Gly Val Ser Ser Asp Phe Val

25 30 35

GTT GGT CTG GGC TGG ACC ACT GGT TCT TCT AA GTGAGTGACT 1189

Val Gly Leu Gly Trp Thr Thr Gly Ser Ser Asn

40 45 50

GTATTCTTTA ACCAAGGTCT AGGATCTAAC GTCTTTCAG C GCT ATC ACC TAC TCT 1244

Ala Ile Thr Tyr Ser

55

GCC GAA TAC AGC GCT TCT GGC TCC GCT TCG TAC CTC GCT GTG TAC GGC 1292

Ala Glu Tyr Ser Ala Ser Gly Ser Ala Ser Tyr Leu Ala Val Tyr Gly

60 65 70

TGG GTC AAC TAT CCT CAA GCT GAG TAC TAC ATC GTC GAG GAT TAC GGT 1340

Trp Val Asn Tyr Pro Gln Ala Glu Tyr Tyr Ile Val Glu Asp Tyr Gly

75 80 85

GAT TAT AAC CCT TGC AGT TCG GCC ACA AGC CTT GGT ACC GTG TAC TCT 1388

Asp Tyr Asn Pro Cys Ser Ser Ala Thr Ser Leu Gly Thr Val Tyr Ser

90 95 100

GAT GGA AGC ACC TAC CAA GTC TGC ACC GAC ACT CGA ACA AAC GAA CCG 1436

Asp Gly Ser Thr Tyr Gln Val Cys Thr Asp Thr Arg Thr Asn Glu Pro

105 110 115

TCC ATC ACG GGA ACA AGC ACG TTC ACG CAG TAC TTC TCC GTT CGA GAG 1484

Ser Ile Thr Gly Thr Ser Thr Phe Thr Gln Tyr Phe Ser Val Arg Glu

120 125 130 135

AGC ACG CGC ACA TCT GGA ACG GTG ACT GTT GCC AAC CAT TTC AAC TTC 1532

Ser Thr Arg Thr Ser Gly Thr Val Thr Val Ala Asn His Phe Asn Phe

140 145 150

TGG GCG CAC CAT GGG TTC GGC AAT AGC GAC TTC AAT TAT CAG GTC GTG 1580

Trp Ala His His Gly Phe Gly Asn Ser Asp Phe Asn Tyr Gln Val Val

155 160 165

GCG GTG GAA GCA TGG AGC GGT GCT GGC AGC GCT AGT GTC ACA ATC TCT 1628

Ala Val Glu Ala Trp Ser Gly Ala Gly Ser Ala Ser Val Thr Tle Ser

170 175 180

TCT TGAGAGATTA GTGCCCTAGT AGTCGGAAGA TATCAACGCG GCAGTTTGCT 1681

Ser

CTCAGGTGGT GTGATGATCG GATCCGGTCT CTGGGGTTAC ATTGAGGCTG TATAAGTTGT 1741

TGTGGGGCCG AGCTGTCAGC GGCTGCGTTT TCAGCTTGCA CAGATAATCA ACTCTCGTTT 1801

TCTATCTCTT GCGTTTCCTC GCTGCTTATC CTATCCATAG ATAATTATTT TGCCCACTAC 1861

CACAACTTGT TCGGTCGCAG TAGTCACTCC GAGCAAGGCA TTGGGAAATG GGGGATGCGG 1921

GGTGCTGCGT ACCCTCTAAC CTAGGGCATT TTAAAGGATA TTTACCCTCC AGATATTCTA 1981

TAGATACAGA CTTCTTAGGA CTGCGGGTAA TATAGAGAGC GAAATTTCTA CAGTTCGATG 2041

CAGTTCAATG CGA 2054

(2)SEQ IDNO：6信息

(i)序列特征：

(A)长度：3026个碱基对

(B)类型：核酸

(C)类型：双链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：否

(vi)最初来源：

(A)生物体：黑曲霉

(B)菌株：N400(CBS 120.49)

(ix)特征：

(A)名称/关键：TATA_信号

(B)位置：643..648

(ix)特征：

(A)名称/关键：CDS

(B)位置：724..2538

(D)其它信息：/EC_号＝1.1.3.4

/产物＝“葡萄糖氧化酶″

/基因＝″goxC″

(ix)特征：

(A)名称/关键：成熟肽

(B)位置：790..2538

(ix)特征：

(A)名称/关键：信号肽

(B)位置：724..790

(xi)序列描述：SEQ ID NO：6：

CTGCAGGTAC CTGAAGCCTG CCTAGTTTGA TCACCCTGAA ACCAGCACTG CCTGTCTTGA 60

CCTTGGTGGT GAGTTTGCAC GTGGGCTGGC TGTTCAAATA AACTCTCCAA TTGACCCTCT 120

CCCCGTGGAG AACACAGCAA ACACTATAGG CTTTCCATTG AGGGCATGAC GAGGACCCTA 180

TGGTTTGTGC ACTTGGCGAG GGCTGACCGG AGCACGAATC GGGAAGGGCA GAACTCAGAA 240

TTCGGTGTTC TCGGCATGCC GAAAGTCGGT ATCCCTTGGC GCCACGATGA TTTGCGTCCA 300

GGATTCGTAT AGTTCCTCGT CCACGAGGCT GCCTACCGTC AGCGTGAGGC AGTGAGCTAA 360

TATGGGGCCA ATAAGCCACT ACGAGGATGA CATGGCCTCT ACAGAACGAG AGACGCAGAG 420

GATCAGGACG CCAATCCTGC GCTCCACCTG TCTAAGGATT CGCTTTTGGA CTATCCAGGG 480

ATTATGGCTT CGGATTATTG TATTCGGGAT ACCGACGGCT GAGCACACGG AGGATGAGGT 540

TCAGCTCACG GCCCCTATCA GTATGCATTA TGAGGATGGC TTCTTGGAAA GCAGAGGAAT 600

TGGATTATCG AACAAGTTGG TTCTGGACCA TTGACTCGAG CGTATAAGTA ACCTCGTTCG 660

GTCCTCCTGT CACCTTCTGA TCAGCAACCA GCCTTTCCTC TCTCATTCCC TCATCTGCCC 720

ATC ATG CAG ACT CTC CTT GTG AGC TCG CTT GTG GTC TCC CTC GCT GCG 768

Met Gln Thr Leu Leu Val Ser Ser Leu Val Val Ser Leu Ala Ala

-22 -20 -15 -10

GCC CTG CCA CAC TAC ATC AGG AGC AAT GGC ATT GAA GCC AGC CTC CTG 816

Ala Leu Pro His Tyr Ile Arg Ser Asn Gly Ile Glu Ala Ser Leu Leu

-5 1 5

ACT GAT CCC AAG GAT GTC TCC GGC CGC ACG GTC GAC TAC ATC ATC GCT 864

Thr Asp Pro Lys Asp Val Ser Gly Arg Thr Val Asp Tyr Ile Ile Ala

10 15 20 25

GGT GGA GGT CTG ACT GGA CTC ACC ACC GCT GCT CGT CTG ACG GAG AAC 912

Gly Gly Gly Leu Thr Gly Leu Thr Thr Ala Ala Arg Leu Thr Glu Asn

30 35 40

CCC AAC ATC AGT GTG CTC GTC ATC GAA AGT GGC TCC TAC GAG TCG GAC 960

Pro Asn Ile Ser Val Leu Val Ile Glu Ser Gly Ser Tyr Glu Ser Asp

45 50 55

AGA GGT CCT ATC ATT GAG GAC CTG AAC GCC TAC GGC GAC ATC TTT GGC 1008

Arg Gly Pro Ile Ile Glu Asp Leu Asn Ala Tyr Gly Asp Ile Phe Gly

60 65 70

AGC AGT GTA GAC CAC GCC TAC GAG ACC GTG GAG CTC GCT ACC AAC AAT 1056

Ser Ser Val Asp His Ala Tyr Glu Thr Val Glu Leu Ala Thr Asn Asn

75 80 85

CAA ACC GCG CTG ATC CGC TCC GGA AAT GGT CTC GGT GGC TCT ACT CTA 1104

Gln Thr Ala Leu Ile Arg Ser Gly Asn Gly Leu Gly Gly Ser Thr Leu

90 95 100 105

GTG AAT GGT GGC ACC TGG ACT CGC CCC CAC AAG GCA CAG GTT GAC TCT 1152

Val Asn Gly Gly Thr Trp Thr Arg Pro His Lys Ala Gln Val Asp Ser

110 115 120

TGG GAG ACT GTC TTT GGA AAT GAG GGC TGG AAC TGG GAG AAT GTG GCC 1200

Trp Glu Thr Val Phe Gly Asn Glu Gly Trp Asn Trp Asp Asn Val Ala

125 130 135

GCC TAC TCC CTC CAG GCT GAG CGT GCT CGC GCA CCA AAT GCC AAA CAG 1248

Ala Tyr Ser Leu Gln Ala Glu Arg Ala Arg Ala Pro Asn Ala Lys Gln

140 145 150

ATC GCT GCT GGC CAC TAC TTC AAC GCA TCC TGC CAT GGT GTT AAT GGT 1296

Ile Ala Ala Gly His Tyr Phe Asn Ala Ser Cys His Gly Val Asn Gly

155 160 165

ACT GTC CAT GCC GGA CCC CGC GAC ACC GGC GAT GAC TAT TCT CCC ATC 1344

Thr Val His Ala Gly Pro Arg Asp Thr Gly Asp Asp Tyr Ser Pro Ile

170 175 180 185

GTC AAG GCT CTC ATG AGC GCT GTC GAA GAC CGG GGG GTT CCC ACC AAG 1392

Val Lys Ala Leu Met Ser Ala Val Glu Asp Arg Gly Val Pro Thr Lys

190 195 200

AAA GAC TTC GGA TGC GGT GAC CCC CAT GGT GTG TCC ATG TTC CCC AAC 1440

Lys Asp Phe Gly Cys Gly Asp Pro His Gly Val Ser Met Phe Pro Asn

205 210 215

ACC TTG CAC GAA GAC CAA GTG CGC TCC GAT GCC GCT CGC GAA TGG CTA 1488

Thr Leu His Glu Asp Gln Val Arg Ser Asp Ala Ala Arg Glu Trp Leu

220 225 230

CTT CCC AAC TAC CAA CGT CCC AAC CTG CAA GTC CTG ACC GGA CAG TAT 1536

Leu Pro Asn Tyr Gln Arg Pro Asn Leu Gln Val Leu Thr Gly Gln Tyr

235 240 245

GTT GGT AAG GTG CTC CTT AGC CAG AAC GGC ACC ACC CCT CGT GCC GTT 1584

Val Gly Lys Val Leu Leu Ser Gln Asn Gly Thr Thr Pro Arg Ala Val

250 255 260 265

GGC GTG GAA TTC GGC ACC CAC AAG GGC AAC ACC CAC AAC GTT TAC GCT 1632

Gly Val Glu Phe Gly Thr His Lys Gly Asn Thr His Asn Val Tyr Ala

270 275 280

AAG CAC GAG GTC CTC CTG GCC GCG GGC TCC GCT GTC TCT CCC ACA ATC 1680

Lys His Glu Val Leu Leu Ala Ala Gly Ser Ala Val Ser Pro Thr Ile

285 290 295

CTC GAA TAT TCC GGT ATC GGA ATG AAG TCC ATC CTG GAG CCC CTT GGT 1728

Leu Glu Tyr Ser Gly Ile Gly Met Lys Ser Ile Leu Glu Pro Leu Gly

300 305 310

ATC GAC ACC GTC GTT GAC CTG CCC GTC GGC TTG AAC CTG CAG GAC CAG 1776

Ile Asp Thr Val Val Asp Leu Pro Val Gly Leu Asn Leu Gln Asp Gln

315 320 325

ACC ACC GCT ACC GTC CGC TCC CGC ATC ACC TCT GCT GGT GCA GGA CAG 1824

Thr Thr Ala Thr Val Arg Ser Arg Ile Thr Ser Ala Gly Ala Gly Gln

330 335 340 345

GGA CAG GCC GCT TGG TTC GCC ACC TTC AAC GAG ACC TTT GGT GAC TAT 1872

Gly Gln Ala Ala Trp Phe Ala Thr Phe Asn Glu Thr Phe Gly Asp Tyr

350 355 360

TCC GAA AAG GCA CAC GAG CTG CTC AAC ACC AAG CTG GAG CAG TGG GCC 1920

Ser Glu Lys Ala His Glu Leu Leu Asn Thr Lys Leu Glu Gln Trp Ala

365 370 375

GAA GAG GCC GTC GCC CGT GGC GGA TTC CAC AAC ACC ACC GCC TTG CTC 1968

Glu Glu Ala Val Ala Arg Gly Gly Phe His Asn Thr Thr Ala Leu Leu

380 385 390

ATC CAG TAC GAG AAC TAC CGC GAC TGG ATT GTC AAC CAC AAC GTC GCG 2016

Ile Gln Tyr Glu Asn Tyr Arg Asp Trp Ile Val Asn His Asn Val Ala

395 400 405

TAC TCG GAA CTC TTC CTC GAC ACT GCC GGA GTA GCC AGC TTC GAT GTG 2064

Tyr Ser Glu Leu Phe Leu Asp Thr Ala Gly Val Ala Ser Phe Asp Val

410 415 420 425

TGG GAC CTT CTG CCC TTC ACC CGA GGA TAC GTT CAC ATC CTC GAC AAG 2112

Trp Asp Leu Leu Pro Phe Thr Arg Gly Tyr Val His Ile Leu Asp Lys

430 435 440

GAC CCC TAC CTT CAC CAC TTC GCC TAC GAC CCT CAG TAC TTC CTC AAC 2160

Asp Pro Tyr Leu His His Phe Ala Tyr Asp Pro Gln Tyr Phe Leu Asn

445 450 455

GAG CTG GAC CTG CTC GGT CAG GCT GCC GCT ACT CAA CTG GCC CGC AAC 2208

Glu Leu Asp Leu Leu Gly Gln Ala Ala Ala Thr Gln Leu Ala Arg Asn

460 465 470

ATC TCC AAC TCC GGT GCC ATG CAG ACC TAC TTC GCT GGG GAG ACT ATC 2256

Ile Ser Asn Ser Gly Ala Met Gln Thr Tyr Phe Ala Gly Glu Thr Ile

475 480 485

CCC GGT GAT AAC CTC GCG TAT GAT GCC GAT TTG AGC GCC TGG ACT GAG 2304

Pro Gly Asp Asn Leu Ala Tyr Asp Ala Asp Leu Ser Ala Trp Thr Glu

490 495 500 505

TAC ATC CCG TAC CAC TTC CGT CCT AAC TAC CAT GGC GTG GGT ACT TGC 2352

Tyr Ile Pro Tyr His Phe Arg Pro Asn Tyr His Gly Val Gly Thr Cys

510 515 520

TCC ATG ATG CCG AAG GAG ATG GGC GGT GTT GTT GAT AAT GCT GCC CGT 2400

Ser Met Met Pro Lys Glu Met Gly Gly Val Val Asp Asn Ala Ala Arg

525 530 535

GTG TAT GGT GTG CAG GGA CTG CGT GTC ATT GAT GGT TCT ATT CCT CCT 2448

Val Tyr Gly Val Gln Gly Leu Arg Val Ile Asp Gly Ser Ile Pro Pro

540 545 550

ACG CAA ATG TCG TCC CAT GTC ATG ACG GTG TTC TAT GCC ATG GCG CTA 2496

Thr Gln Met Ser Ser His Val Met Thr Val Phe Tyr Ala Met Ala Leu

555 560 565

AAA ATT TCG GAT GCT ATC TTG GAA GAT TAT GCT TCC ATG CAG 2538

Lys Ile Ser Asp Ala Ile Leu Glu Asp Tyr Ala Ser Met Gln

570 575 580

TGAGTGGTAT GATGGGGATA TGAGTGAGGA TATTAGGGGA TGGTACTTAG ATGCTGGGGA 2598

GGTATAATCA TAGATTGGAT AGAATTGGTA GGTTACATAG ACAGGTTACA TGAATAGACG 2658

TTCGTTATAT GTGAGCAGAC ATTACTACCA AACAAGGGCA TTGTTCAGTT AGTCGAACGA 2718

TAGTCATATG TTTTGTACGG GAAGAAAGTT TCACTAATTA TTAAGCAAAC GGATCAGGGG 2778

TTGCCAGCTA AAATACAATC ATCCGATGTT CTATTTTCTT CAAATTGATC GACCAGTCAG 2838

TTAATGAATG CATGAGAGCA ACTCTGCGCA TCCTCTAGCT ATCTAGTCAA TAATAAGCAT 2898

GTTGTTTAAG ATGAAACACC GCCATAGACA TATTCTGTTG CTGGTGAAGC AAGCCCTCGC 2958

TAAATATGCT GATAACTTCC TATGCCAGTA GAATATTTTC CCACTCTGCT GCGCGCTCTC 3018

AAAAGCTT 3026

(2)SEQ ID NO：7信息：

(i)序列特征：

(A)长度：1517个碱基对

(B)类型：核酸

(C)类型：双链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：否

(vi)最初来源：

(A)生物体：黑曲霉

(B)菌株：L112

(ix)特征：

(A)名称/关键：外显子

(B)位置：339..495

(ix)特征：

(A)名称/关键：内含子

(B)位置：496..563

(ix)特征：

(A)名称/关键：外显子

(B)位置：564..1237

(ix)特征：

(A)名称/关键：CDS

(B)位置：连接区(339..495，564..1237)

(D)其它信息：/产物＝“乳清苷-5’-磷酸脱羧酶”

(xi)序列描述：SEQ ID NO：7：

GCAGGGAAAA ATACGAGCTC CAATGAACCT GGGTGTGGCA ACTTCAATGG AAAGGAACTG 60

CCTTTGCAGG TGTGGCTGAA CCCCACGGTT CCGGTCGGAG GCGGCGAAAT CACCCGATGT 120

GGCTGGTGCG TGGAGGGTCG CGATGATTTA CTGAGCTCCT CTTTTGCTCG ACATTGAATG 180

TGCATTGTTC ACCTCATATA AGGGCCAGTC GCTGCTAAAT TATTCGGTAG TATTTGCGCA 240

TCTCTGGATC TACCAATTAG GGCCTATCAG TCGAAACTCC AAGCTACTCA TATTGCACAA 300

GCCTCTTTCA TCCCCGCATT AACCCCTCCA CCGACACC ATG TCC TCC AAG TCG 353

Met Ser Ser Lys Ser

1 5

CAA TTG ACC TAC ACT GCC CGT GCC AGC AAG CAC CCC AAT GCT CTG GCC 401

Gln Leu Thr Tyr Thr Ala Arg Ala Ser Lys His Pro Asn Ala Leu Ala

10 15 20

AAG CGG CTG TTC GAA ATT GCT GAG GCC AAG AAG ACC AAT GTG ACC GTC 449

Lys Arg Leu Phe Glu Ile Ala Glu Ala Lys Lys Thr Asn Val Thr Val

25 30 35

TCT GCC GAC GTT ACC ACC ACT AAG GAG CTA CTA GAT CTT GCT GAC C 495

Ser Ala Asp Val Thr Thr Thr Lys Glu Leu Lau Asp Leu Ala Asp

40 45 50

GTAGGCCGAC CCGCCATTCT GCCTGTTTAT GCTGCATACA AACTTATTAA CGGTGATACC 555

GGACTGAG GT CTC GGT CCC TAC ATC GCC GTG ATC AAA ACC CAC ATC GAT 604

Arg Leu Gly Pro Tyr Ile Ala Val Ile Lys Thr His Ile Asp

55 60 65

ATC CTC TCT GAC TTC AGC GAC GAG ACC ATT GAG GGC CTC AAG GCT CTT 652

Ile Leu Ser Asp Phe Ser Asp Glu Thr Ile Glu Gly Leu Lys Ala Leu

70 75 80

GCG CAG AAG CAC AAC TTC CTC ATC TTC GAG GAC CGC AAA TTC ATC GAC 700

Ala Gln Lys His Asn Phe Leu Ile Phe Glu Asp Arg Lys Phe Ile Asp

85 90 95

ATT GGC AAC ACT GTC CAG AAG CAA TAC CAC CGT GGT ACC CTC CGC ATC 748

Ile Gly Asn Thr Val Gln Lys Gln Tyr His Arg Gly Thr Leu Arg Ile

100 105 110

TCA GAA TGG GCC CAT ATC ATC AAC TGC AGC ATC CTG CCT GGC GAG GGT 796

Ser Glu Trp Ala His Ile Ile Asn Cys Ser Ile Leu Pro Gly Glu Gly

115 120 125 130

ATC GTC GAG GCT CTC GCT CAG ACG GCG TCT GCA CCG GAC TTC TCC TAC 844

Ile Val Glu Ala Leu Ala Gln Thr Ala Ser Ala Pro Asp Phe Ser Tyr

135 140 145

GGC CCC GAA CGT GGT CTG TTG ATC TTG GCG GAA ATG ACC TCT AAG GGT 892

Gly Pro Glu Arg Gly Leu Leu Ile Leu Ala Glu Met Thr Ser Lys Gly

150 155 160

TCC TTG GCC ACC GGC CAG TAC ACT ACT TCT TCG GTT GAT TAT GCC CGG 940

Ser Leu Ala Thr Gly Gln Tyr Thr Thr Ser Ser Val Asp Tyr Ala Arg

165 170 175

AAA TAC AAG AAC TTC GTC ATG GGA TTT GTG TCG ACC CGC TCG TTG GGT 988

Lys Tyr Lys Asn Phe Val Met Gly Phe Val Ser Thr Arg Ser Leu Gly

180 185 190

GAG GTG CAG TCG GAA GTC AGC TCT CCT TCG GAT GAG GAG GAC TTT GTG 1036

Glu Val Gln Ser Glu Val Ser Ser Pro Ser Asp Glu Glu Asp Phe Val

195 200 205 210

GTC TTC ACG ACT GGT GTG AAC ATT TCG TCC AAG GGA GAT AAG CTC GGY 1084

Val Phe THr THr Gly Val Asn Ile Ser Ser Lys Gly Asp Lys Leu Gly

215 220 225

CAG CAG TAC CAG ACT CCC GCA TCG GCT ATC GCT CGG GGT GCT GAC TTC 1132

Gln Gln Tyr Gln THr Pro Ala Ser Ala Ile Gly Arg Gly Ala Asp Phe

230 235 240

ATT ATC GCG GGT CGC GGT ATC TAC GCC GCG CCG GAC CCG GTG CAG GCT 1180

Ile Ile Ala Gly Arg Gly Tle Tyr Ala Ala Pro Asp Pro Val Gln Ala

245 250 255

GCG CAA CAG TAC CAG AAG GAA GGT TGG GAG GCG TAC CTG GCC CGT GTC 1228

Ala Gln Gln Tyr Gln Lys Glu Gly Trp Glu Ala Tyr Leu Ala Arg Val

260 265 270

GGC GGA AAC TAATACTATA AAATGAGGAA AAAAGTTTTG ATGGTTATGA 1277

Gly Gly Asn

275

ATGATATAGA AATGCAACTT GCCGCTACGA TACGCATACA AACTAATGTC GAGCACGGGT 1337

AGTCAGACTG CGGCATCGGA TGTCAAAACG GTATTGATCC TGCAGGCTAT TATAGGGTGG 1397

CACGGGATTA ATGCGGTACG ACGATTTGAT GCAGATAAGC AGGCTGCGAA GTACTTAGTC 1457

CTGTAACTCT TGCGTAGAGC AAATGGCGAC GGGTGGCTGA TAAGGGACGG TGATAAGCTT 1517

(2)SEQ ID NO：8信息

(i)序列特征：

(A)长度：4108个碱基对

(B)类型：核酸

(C)类型：双链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：否

(Vi)最初来源：

(A)生物体：黑曲霉(CBS l20.49)

(B)菌株：NWl47

(ix)特征：

(A)名称/关键：TATA_信号

(B)位置：787..794

(ix)特征：

(A)名称/关键：CDS

(B)位置：855..3266

(D)其它信息：/EC号＝3.2.1.37

/产物＝“1，4-β-D-木聚糖木聚糖水解酶″

/基因＝″xlnD″

/标准名称＝″β-木糖苷酶″

(ix)特征：

(A)名称/关键：信号肽

(B)位置：855..932

(ix)特征：

(A)名称/关键：成熟肽

(B)位置：933..3266

(ix)特征：

(A)名称/关键：polyA_位点

(B)位置：3383

(ix)特征：

(A)名称/关键：polyA_位点

(B)位置：3404

(xi)序列描述：SEQ ID NO：8：

CTGCAGGCCA TGTATCCTGC GAAGATGGGT GAGTGGAAGA AAATCGTCAA GATTGAGGCG 60

GAGATGGCGA GGGCCGCGAT GAAGAAGGGT GGCTGGGCAC CGGAGAAGCC AGCCACCGCC 120

ACGGCGGCGC AGATGAGTAT ACCGTATGCG GTGGCGTTGC AGGTTCTGGA TGGGGAGATT 180

GTGCCGGGGC AGTTTGCGCC GGGCATGTTG AATCGGGAGG AGTTATGGGA TGTGATTAGG 240

CTGGTGGAAT GTCGGGAGGC CAAGGAGCTG GATAATACGT GGGCGCAGAG GGTCAAGATC 300

ACGTTTGAGG ATGGGGAGGT GGTGGAGAAG TTGTTGAAGG CTCCGAAGGG AGTCCATCCT 360

GGGGTGACGA ATGAGGAGGT GTTGCAGAAG TGGCGGGCTG TGACGAAGGG GGTAATTTCG 420

GAAGAGAGGC AGAAGAAGAT CGAGGAGATT GTGTTGAATT TGGAAGAGGT GGAGGATGTG 480

GCTGGTGTTT TGGGCGAGTT GTTGAGGGAA GAGACGGTGA ATGTGCTGCA GTAGACGGTT 540

ACCCCATTTG GACGGGGATG GCTTCATATT TCCCAAGCGA TGTCACGCCA TAGAAAGGGC 600

ACATTTACCC GGTGCCTGAG CGAAACTCTA CTTCGAAGAC AATGCCAATG TTTAACTATC 660

TTGTTTTAAT TGCTAAATGC AAACATTCCA GGTTCTTCCT AATGCCGGCT AAATCATTCA 720

GGCTAAACCC CCGCGATGAA GTCAATCGGT CATTCTCCGG CGCATCTCCG CATCTCCGCA 780

AACCGCTATA AAATCTACCC CAGATTCAGT CCCCGGCCAC CTTTCTATCC CCCCCCCCAC 840

AGACTGGCTC AACC ATG GCG CAC TCA ATG TCT CGT CCC GTG GCT GCC ACT 890

Met Ala His Ser Met Ser Arg Pro Val Ala Ala Thr

-26 -25 -20 -15

GCC GCT GCT CTG CTG GCT CTG GCT CTT CCT CAA GCT CTT GCC CAG GCC 938

Ala Ala Ala Leu Leu Ala Leu Ala Leu Pro Gln Ala Leu Ala Gln Ala

-10 -5 1

AAC ACC AGC TAC GTC GAC TAC AAC ATC GAA GCC AAC CCG GAC TTG TAT 986

Asn Thr Ser Tyr Val Asp Tyr Asn Ile Glu Ala Asn Pro Asp Leu Tyr

5 10 15

CCT TTG TGC ATA GAA ACC ATC CCA CTG AGC TTC CCC GAC TGC CAG AAT 1034

Pro Leu Cys Ile Glu Thr Ile Pro Leu Ser Phe Pro Asp Cys Gln ASn

20 25 30

GGT CCC CTG CGC AGC CAT CTC ATC TGT GAT GAA ACA GCC ACC CCC TAT 1082

Gly Pro Leu Arg Ser His Leu Ile Cys Asp Glu Thr Ala Thr Pro Tyr

35 40 45 50

GAC CGA GCA GCA TCG CTC ATC TCG CTC TTC ACC CTG GAC GAG CTG ATC 1130

Asp Arg Ala Ala Ser Leu Ile Ser Leu Phe Thr Leu Asp Glu Leu Ile

55 60 65

GCC AAC ACC GGC AAC ACC GGC CTC GGT GTC TCC CGA CTG GGC CTC CCT 1178

Ala Asn Thr Gly Asn Thr Gly Leu Gly Val Ser Arg Leu Gly Leu Pro

70 75 80

GCA TAC CAA GTA TGG AGT GAA GCT CTT CAC GGC CTC GAC CGT GCC AAT 1226

Ala Tyr Gln Val Trp Ser Glu Ala Leu His Gly Leu Asp Arg Ala Asn

85 90 95

TTC AGC GAC TCA GGA GCC TAC AAT TGG GCC ACC TCA TTC CCC CAG CCC 1274

Phe Ser Asp Ser Gly Ala Tyr Asn Trp Ala Thr Ser Phe Pro Gln Pro

100 105 110

ATC CTG ACC ACC GCG GCC CTC AAC CGC ACC CTC ATC CAC CAA ATC GCC 1322

Ile Leu Thr Thr Ala Ala Leu Asn Arg Thr Leu Ile His Gln Ile Ala

115 120 125 130

TCC ATC ATC TCT ACC CAA GGC CGC GCC TTC AAC AAC GCC GGC CGC TAC 1370

Ser Ile Ile Ser Thr Gln Gly Arg Ala Phe Asn Asn Ala Gly Arg Tyr

135 140 145

GGC CTC GAC GTC TAC GCC CCC AAC ATC AAC ACC TTC CGG CAC CCC GTC 1418

Gly Leu Asp Val Tyr Ala Pro Asn Ile Asn Thr Phe Arg His Pro Val

150 155 160

TGG GGT CGC GGA CAA GAA ACC CCA GGA GAG GAC GTC TCT CTC GCC GCC 1466

Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu Asp Val Ser Leu Ala Ala

165 170 175

GTC TAC GCC TAC GAA TAC ATC ACC GGC ATC CAG GGT CCC GAC CCA GAA 1514

Val Tyr Ala Tyr Glu Tyr Ile Thr Gly Ile Gln Gly Pro Asp Pro Glu

180 185 190

TCA AAC CTC AAA CTC GCC GCC ACG GCC AAG CAC TAC GCC GGC TAT GAC 1562

Ser Asn Leu Lys Leu Ala Ala Thr Ala Lys His Tyr Ala Gly Tyr Asp

195 200 205 210

ATC GAG AAC TGG CAC AAC CAC TCC CGC CTG GGC AAC GAC ATG AAC ATC 1610

Ile Glu Asn Trp His Asn His Ser Arg Leu Gly Asn Asp Met Asn Ile

215 220 225

ACC CAG CAA GAC CTC TCC GAA TAC TAC ACG CCC CAA TTC CAC GTC GCC 1658

Thr Gln Gln Asp Leu Ser Glu Tyr Tyr Thr Pro Gln Phe His Val Ala

230 235 240

GCC CGC GAC GGC AAA GTC CAG AGT GTC ATG TGC GCC TAC AAC GCC GTC 1706

Ala Arg Asp Ala Lys Val Gln Ser Val Met Cys Ala Tyr Asn Ala Val

245 250 255

AAC GGC GTC CCT GCC TGC GCC GAC TCC TAC TTC CTC CAG ACC CTC CTC 1754

Asn Gly Val Pro Ala Cys Ala Asp Ser Tyr Phe Leu Gln Thr Leu Leu

260 265 270

CGC GAC ACC TTC GGA TTT GTC GAC CAC GGA TAC GTC TCC AGC GAC TGC 1802

Arg Asp Thr Phe Gly Phe Val Asp His Gly Tyr Val Ser Ser Asp Cys

275 280 285 290

GAT GCC GCC TAT AAC ATC TAC AAC CCC CAC GGC TAT GCC TCC TCC CAG 1850

Asp Ala Ala Tyr Asn Ile Tyr Asn Pro His Gly Tyr Ala Ser Ser Gln

295 300 305

GCT GCC GCT GCC GCT GAG GCC ATC CTC GCC GGC ACC GAC ATC GAC TGC 1898

Ala Ala Ala Ala Ala Glu Ala Ile Leu Ala Gly Thr Asp Ile Asp Cys

310 315 320

GGT ACC ACC TAC CAA TGG CAC CTG AAC GAG TCC ATC GCT GCG GGA GAT 1946

Gly Thr Thr Tyr Gln Trp His Leu Asn Glu Ser Ile Ala Ala Gly Asp

325 330 335

CTC TCT CGC CAT GAT ATT GAG CAG GGT GTG ATT CGT CTC TAC ACG ACC 1994

Leu Ser Arg Asp Asp Ile Glu Gln Gly Val Ile Arg Leu Tyr Thr Thr

340 345 350

CTC GTG CAG GCC GGA TAC TTC GAC TCC AAC ACC ACA AAG GCG AAC AAC 2042

Leu Val Gln Ala Gly Tyr Phe Asp Ser Asn Thr Thr Lys Ala Asn Asn

355 360 365 370

CCC TAC CGC GAC CTC TCC TGG TCC GAC GTC CTT GAG ACG GAC GCA TGG 2090

Pro Tyr Arg Asp Leu Ser Trp Ser Asp Val Leu Glu Thr Asp Ala Trp

375 380 385

AAC ATC TCC TAC CAA GCC GCG ACG CAG GGC ATT GTC CTT CTC AAG AAC 2138

Asn Ile Ser Tyr Gln Ala Ala Thr Gln Gly Ile Val Leu Leu Lys Asn

390 395 400

TCC AAC AAC GTC CTC CCC CTC ACC GAG AAA GCT TAC CCA CCA TCC AAC 2186

Ser Asn Asn Val Leu Pro Leu Thr Glu Lys Ala Tyr Pro Pro Ser Asn

405 410 415

ACC ACC GTC GCC CTC ATC GGT CCC TGG GCC AAC GCC ACC ACC CAA CTC 2234

Thr Thr Val Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Leu

420 425 430

CTG GGC AAC TAC TAC GGC AAC GCT CCC TAC ATG ATC AGC CCC CGC GCC 2282

Leu Gly Asn Tyr Tyr Gly Asn Ala Pro Tyr Met Ile Ser Pro Arg Ala

435 440 445 450

GCC TTC GAA GAA GCC GGA TAC AAA GTC AAC TTC GCC GAG GGC ACC GGT 2330

Ala Phe Glu Glu Ala Gly Tyr Lys Val Asn Phe Ala Glu Gly Thr Gly

455 460 465

ATC TCC TCC ACA AGC ACC TCG GGC TTC GCT GCC GCC TTA TCC GCC GCA 2378

Ile Ser Ser Thr Ser THr Ser Gly Phe Ala Ala Ala Leu Ser Ala Ala

470 475 480

CAA TCC GCC GAC GTG ATA ATC TAC GCC GGT GGT ATC GAC AAT ACC CTT 2426

Gln Ser Ala Asp Val Ile Ile Tyr Ala Gly Gly Ile Asp Asn Thr Leu

485 490 495

GAA GGG GAG GCA CTG GAT CGA GAG AGT ATC GCG TGG CCG GGT AAC CAA 2474

Glu Ala Glu Ala Leu Asp Arg Glu Ser Ile Ala Trp Pro Gly Asn Gln

500 505 510

CTG GAC TTG ATC CAG AAG CTC GCC TCG GCG GCC GGA AAG AAG CCG CTC 2522

Leu Asp Leu Ile Gln Lys Leu Ala Ser Ala Ala Gly Lys Lys Pro Leu

515 520 525 530

ATC GTC CTC CAA ATG GGC GGC GGA CAG GTC GAT TCC TCT TCG CTC AAG 2570

Ile Val Leu Gln Met Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys

535 540 545

AAC AAC ACC AAT GTT TCT GCA CTT CTC TGG GGC GGA TAC CCC GGC CAA 2618

Asn Asn Thr Asn Val Ser Ala Leu Leu Trp Gly Gly Tyr Pro Gly Gln

550 555 560

TCT GGC GGC TTC GCT TTG CGG GAT ATC ATC ACG GGG AAG AAG AAC CCC 2666

Ser Gly Gly Phe Ala Leu Arg Asp Ile Ile Thr Gly Lys Lys Asn Pro

565 570 575

GCG GGT AGA CTA GTC ACG ACG CAG TAC CCT GCC AGC TAC GCG GAG GAG 2714

Ala Gly Arg Leu Val Thr Thr Gln Tyr Pro Ala Ser Tyr Ala Glu Glu

580 585 590

TTC CCG GCG ACA GAT ATG AAC CTT CGT CCT GAG GGT GAT AAC CCT GGT 2762

Phe Pro Ala Thr Asp Met Asn Leu Arg Pro Glu Gly Asp Asn Pro Gly

595 600 605 610

CAG ACG TAT AAA TGG TAC ACC GGC GAA GCC GTG TAG GAG TTC GGC CAC 2810

Gln Thr Tyr Lys Trp Tyr Thr Gly Glu Ala Val Tyr Glu Phe Gly His

615 620 625

GGG TTA TTC TAC ACG ACC TTC GCG GAA TCC TCC AGC AAT ACC ACT ACA 2858

Gly Leu Phe Tyr Thr Thr Phe Ala Glu Ser Ser Ser Asn Thr Thr Thr

630 635 640

AAG GAA GTT AAG CTC AAC ATC CAG GAC ATT CTT TCC CAG ACA CAC GAA 2906

Lys Glu Val Lys Leu Asn Ile Gln Asp Ile Leu Ser Gln Thr His Glu

645 650 655

GAC CTG GCG TCG ATT ACC GAG CTC CCT GTG CTG AAC TTC ACC GCC AAT 2954

Asp Leu Ala Ser Ile Thr Gln Leu Pro Val Leu Asn Phe Thr Ala Asn

660 665 670

ATC AGG AAC ACT GGA AAG CTG GAA TCG GAT TAC ACC GCT ATG GTA TTC 3002

Ile Arg Asn Thr Gly Lys Leu Glu Ser Asp Tyr Thr Ala Met Val Phe

675 680 685 690

GCC AAT ACC TCT GAT GCC GGG CCG GCG CCG TAT CCC AAG AAG TGG CTG 3050

Ala Asn Thr Ser Asp Ala Gly Pro Ala Pro Tyr Pro Lys Lys Trp Leu

695 700 705

GTC GGG TGG GAT CGG CTT GGG GAG GTG AAG GTC GGG GAG ACG AGG GAG 3098

Val Gly Trp Asp Arg Leu Gly Glu Val Lys Val Gly Glu Thr Arg Glu

710 715 720

TTG AGG GTC CCC GTT GAG GTG GGG AGC TTT GCG AGG GTG AAT GAG GAT 3146

Leu Arg Val Pro Val Glu Val Gly Ser Phe Ala Arg Val Asn Glu Asp

725 730 735

GGC GAT TGG GTG GTG TTT CCG GGA ACG TTT GAG TTG GCG TTG AAT TTG 3194

Gly Asp Trp Val Val Phe Pro Gly Thr Phe Glu Leu Ala Leu Asn Leu

740 745 750

GAG AGG AAG GTT CGG GTG AAG GTT GTT CTT GAG GGT GAG GAG GAA GTC 3242

Glu Arg Lys Val Arg Val Lys Val Val Leu Glu Gly Glu Glu Glu Val

755 760 765 770

GTG CTG AAG TGG CCG GGG AAG GAG TAGAAAATAC TATTCTGTTG ATGGCTCTAG 3296

Val Leu Lys Trp Pro Gly Lys Glu

775

GGGATGAGAG TCAGCCTATT ACTGGATATG CATAGTGGTG ATACGATGTA TATAGCTCTA 3356

TGAAGTAATT AGTTCAAGTG GGAATACCCC TTTCACACAT ATAGTATGCT GTTATTCCGA 3416

AATAGGGATC ATTTCTGATT AATAGTAGCG GTAGCGATGG TCACACACGA CTTAATGTTC 3476

CCCATTGTAC CGGAAGTAAC AATTCCAGTG ACCTCTTAGA AGAAAGACAG CAAGAAAAAG 3536

TAAGAAAGGG AAATTGATCA AAAAATAAGG CCATCTACAG CCTATTCACA TTTAGCCGGA 3596

TCTGCAATAC AGCTACAGAA ATAAAGTTTG TTAGGCTGCT TGCTAGCATA GCTCCTACTA 3656

TACTAAACCA ACACAATGGG ACAATACCCC AATTAACCAG CCCTCACTCA ACACAAGTGA 3716

ATCCTACCGA CAACATGCAT AAACCACTGC TTCCCCACCC AGCACCCTTC TTCACGATCA 3776

GATCACGGAG AATTACCAAC TACTCTTCGC ATAAAACGTA AACAACGGCC TCGGGCCAGG 3836

ATCCGTCCGA CTCAAAAGCA ACAAATCCCT CGTTCGCATA CTAGCCACAT GAACCTGTTG 3896

CTCCGAGACC TCCTCAACTG GGTCTTCAAA TGCCCAGAAG ACGCTTTCTT CTCGATATCC 3956

ATCGGATACT CGCTGGCCGC TTAGACATAT GAACGATGAG TCTCGTCTGC CAAAGGAAAC 4016

AACCGTGTTC CCGAATCCAG TGTCAAAGTC GTAGGTCTGG AATTTGAAAA GTGTTCGGGC 4076

GTTTCCTTGG AGGGTCGGGA GTGCGACTGC AG 4108

(2)SEQ ID NO：9信息

(i)序列特征：

(A)长度：4173个碱基对

(B)类型：核酸

(C)链型：双链

(D)拓扑结构：线性

(ii)分子类型：DNA(基因组)

(iii)假设：无

(iii)反义：否

(vi)最初来源：

(A)生物体：黑曲霉

(B)菌株：CRS 120.49

(C)个体分离物：N400

(ix)特征：

(A)名称/关键：CDS

(B)位置：连接(948..1173，1238..3495，3550..3690)

(C)鉴定方法：通过实验

(D)其它信息：/功能＝″木聚糖裂解基因的转录激活物″

/产物＝″双核锌指DNA结合蛋白质″

/基因＝″xlnR″

/标准名称＝″XYL R″

(ix)特征：

(A)名称/关键：外显子

(B)位置：948..1173

(ix)特征：

(A)名称/关键：内含子

(B)位置：1174..1237

(ix)特征：

(A)名称/关键：外显子

(B)位置：1238..3495

(ix)特征：

(A)名称/关键：内含子

(B)位置：3496..3549

(ix)特征：

(A)名称/关键：外显子

(B)位置：3550..3690

(xi)序列描述：SEQ ID NO：9

CCCGGGCTTG GTTGGTCTCC GTCTGGCTTC CCCGCCTTTT TCCCCTGCAA TTCTGCATCC 60

CCAATCCTTC TTTTTTCTTT GCCTCGCCAG GCTGTGTCTT TTTTCCCCCT CCCCCTCCTC 120

CCTCGTCAGC TTCTCTTCGA CAGCATGCGT GAGGGTCTGC TACCAACTAC AATCCTTGTT 180

CTCACTGTCT GATGGTCTGA CCCGACCGTG GTGTCTGTGG TGTGTGTGTG AGAGAGAAAG 240

GAAAGCTAGT CAGTCCAGTC ACTCTTTCTC GTGGGTTCTT CACCTTCCCC GGACCTGCCC 300

TCCGACACTA AAAAGCCACT TCCCCCCAAC TGGTTAGTTG CTGCTAGTCT CCTTAGTTCA 360

TGGTCGGCCT TGTCGCTTCT CCGGCTGACA TTCTCCTCTT CTGCTGCCTT CTAGGTGCCT 420

GTTTTTTAGT CCCTGTTTTA GTTGCCCCGC AGACTGAATC GGCAATGCCG TGGAGTTGAT 480

CGTTCCGTGG TTTCCTTGCG ACCGCTCCTC TGCTTCATCA TCTTTTTCCT CCTGCCCTCC 540

TGGTCTTGAA TCGCCTGGCC CTCGTCTAGG ATCTGTTGCG CCAGTGTCGC CTTAATCTCC 600

TTTCCCGCTA GCGTAGTGCC CTTTCACGCT TGGGGCCTTA CGGCCCTTCC ATTCGCCAGC 660

GGTCTGAATA CCTCACTTTC CCCCCCAACG ACCGGGGTCT TCATGACCCG CTGGGGTGAT 720

TGTTCCGCCC GGTGAGGATG TCAACCCCCT CGATTCCTCA ATTCACCAGT CCTTTCTCTC 780

CCTTCTCTTC CGGATCGCAC TCGACTGGCA TGGCGCCGTC TCAGACTGTC GGGTTGGATA 840

CGCTCGCCGA GGGCTCGCAG TACGTCCTGG AACAATTGCA GCTGTCGCGA GACGCTGCGG 900

GAACCGGTGC CGGCGATGGC GCGACCTCCA CTTCCTTGCG AAATTCC ATG TCG CAT 956

Met Ser His

1

ACG AAG GAT CAA CCA CCC TTT GAT AAT GAG AAG AAC CAG AGC ACT GGC 1004

Thr Lys Asp Gln Pro Pro Phe Asp Asn Glu Lys Asn Gln Ser Thr Gly

5 10 15

TCG GGT TTT AGG GAC GCT CTG CAA AGA GAT CCC CTC GTG GAG GCT CGC 1052

Ser Gly Phe Arg Asp Ala Leu Gln Arg Asp Pro Leu Val Glu Ala Arg

20 25 30 35

TCT GCC GTC CGC AAA ACC TCG TCT TCA GCT CCG GTT CGC CGC CGA ATC 1100

Ser Ala Val Arg Lys Thr Ser Ser Ser Ala Pro Val Arg Arg Arg Ile

40 45 50

AGC CGT GCG TGT GAC CAG TGT AAC CAA CTC CGA ACG AAA TGC GAC GGG 1148

Ser Arg Ala Cys Asp Gln Cys Asn Gln Leu Arg Thr Lys Cys Asp Gly

55 60 65

CAG CAT CCG TGC GCT CAT TGC ATT G GTAGGCTTCC GCTCTTTCTC 1193

Gln His Pro Cys Ala His Cys Ile

70 75

CGATGCCGGC GATGAGGCGG ACGCTTGACT GACCTGTTCT GTAG AA TTC GGA CTG 1248

Glu Phe Gly Leu

ACC TGC GAG TAT GCG CGA GAA CGC AAG AAG CGT GGA AAA GCG TCG AAG 1296

Thr Cys Glu Tyr Ala Arg Glu Arg Lys Lys Arg Gly Lys Ala Ser Lys

80 85 90 95

AAG GAT CTG GCG GCG GCA GCT GCG GCG GCT ACC CAA GGG TCG AAT GGT 1344

Lys Asp Leu Ala Ala Ala Ala Ala Ala Ala Thr Gln Gly Ser Asn Gly

100 105 110

CAT TCC GGG CAG GCC AAC GCG TCG CTA ATG GGC GAG CGA ACG TCG GAA 1392

His Ser Gly Gln Ala Asn Ala Ser Leu Met Gly Glu Arg Thr Ser Glu

115 120 125

GAC AGC CGG CCA GGA CAA GAC GTG AAC GGC ACA TAC GAC TCG GCT TTT 1440

Asp Ser Arg Pro Gly Gln Asp Val Asn Gly Thr Tyr Asp Ser Ala Phe

130 135 140

GAG AGC CAC CAT CTT AGC TCG CAG CCA TCG CAT ATG CAG CAT GCA AGC 1488

Glu Ser His His Leu Ser Ser Gln Pro Ser His Met Gln His Ala Ser

145 150 155

ACT GCA GGG ATA TCC GGC CTG CAC GAG TCT CAG ACG GCA CCG TCG CAT 1536

Thr Ala Gly Ile Ser Gly Leu His Glu Ser Gln Thr Ala Pro Ser His

160 165 170 175

TCG CAA TCA TCG CTA GGA ACG ACT ATC GAT GCG ATG CAT TTG AAT CAT 1584

Ser Gln Ser Ser Leu Gly Thr Thr Ile Asp Ala Met His Leu Asn His

180 185 190

TTC AAC ACG ATG AAC GAT TCC GGT CGC CCG GCA ATG TCC ATA TCC GAT 1632

Phe Asn Thr Met Asn Asp Ser Gly Arg Pro Ala Met Ser Ile Ser Asp

195 200 205

CTG CGT TCG CTA CCC CCG TCC GTC TTA CCA CCG CAA GGA CTA AGC TCC 1680

Leu Arg Ser Leu Pro Pro Ser Val Leu Pro Pro Gln Gly Leu Ser Ser

210 215 220

GGG TAC AAC GCG AGC GCC TTC GCT TTG GTG AAC CCG CAA GAG CCG GGC 1728

Gly Tyr Asn Ala Ser Ala Phe Ala Leu Val Asn Pro Gln Glu Pro Gly

225 230 235

TCA CCA GCT AAC CAG TTT CGC TTG GGA AGC TCA GCG GAA AAC CCA ACC 1776

Ser Pro Ala Asn Gln Phe Arg Leu Gly Ser Ser Ala Glu Asn Pro Thr

240 245 250 255

GCA CCG TTT CTT GGT CTC TCG CCT CCA GGA CAG TCG CCT GGA TGG CTC 1824

Ala Pro Phe Leu Gly Leu Ser Pro Pro Gly Gln Ser Pro Gly Trp Leu

260 265 270

CCT CTT CCC TCG CCA TCT CCT GCC AAC TTT CCT TCT TTC AGC TTG CAT 1872

Pro Leu Pro Ser Pro Ser Pro Ala Asn Phe Pro Ser Phe Ser Leu His

275 280 285

CCG TTT TCC AGC ACT TTA CGA TAC CCT GTT TTG CAG CCG GTC CTG CCT 1920

Pro Phe Ser Ser Thr Leu Arg Tyr Pro Val Leu Gln Pro Val Leu Pro

290 295 300

CAC ATC GCC TCC ATT ATT CCG CAG TCG CTA GCG TGT GAC CTT CTG GAT 1968

His Ile Ala Ser Ile Ile Pro Gln Ser Leu Ala Cys Asp Leu Leu Asp

305 310 315

GTT TAC TTC ACT AGT TCC TCT TCG TCC CAC CTG TCT CCC TTG TCC CCA 2016

Val Tyr Phe Thr Ser Ser Ser Ser Ser His Leu Ser Pro Leu Ser Pro

320 325 330 335

TAC GTG GTG GGC TAC ATC TTC CGC AAG CAG TCT TTC CTT CAC CCG ACA 2064

Tyr Val Val Gly Tyr Ile Phe Arg Lys Gln Ser Phe Leu His Pro Thr

340 345 350

AAA CCC CGA ATA TGC AGC CCC GGT CTC CTG GCG AGT ATG CTC TGG GTA 2112

Lys Pro Arg Tle Cys Ser Pro Gly Leu Leu Ala Ser Met Leu Trp Val

355 360 365

GCC GCA CAA ACG AGT GAA GCT GCG TTT CTG ACA TCG CCG CCC TCG GCT 2160

Ala Ala Gln Thr Ser Glu Ala Ala Phe Leu Thr Ser Pro Pro Ser Ala

370 375 380

CGG GGG CGT GTA TGC CAG AAA CTG CTA GAA CTG ACC ATT GGT TTG CTC 2208

Arg Gly Arg Val Cys Gln Lys Leu Leu Glu Leu Thr Ile Gly Leu Leu

385 390 395

CGA CCG TTG GTC CAT GGT CCT GCT ACC GGA GAA GCG TCG CCC AAC TAT 2256

Arg Pro Leu Val His Gly Pro Ala Thr Gly Glu Ala Ser Pro Asn Tyr

400 405 410 415

GCG GCG AAT ATG GTC ATC AAT GGC GTC GCT CTG GGC GGA TTT GGG GTC 2304

Ala Ala Asn Met Val Ile Asn Gly Val Ala Leu Gly Gly Phe Gly Val

420 425 430

TCC ATG GAT CAG CTG GGC GCG CAA AGT AGC GCC ACC GGC GCC GTG GAT 2352

Ser Met Asp Gln Leu Gly Ala Gln Ser Ser Ala Thr Gly Ala Val Asp

435 440 445

CAT GTA GCA ACT TAT GTG CAT CTT GCG ACA GTA GTA TCC GCC AGC GAG 2400

Asp Val Ala Thr Tyr Val His Leu Ala Thr Val Val Ser Ala Ser Glu

450 455 460

TAC AAG GCG GCC AGC ATG CGC TGG TGG ACT GCG GCG TGG TCT CTA GCG 2448

Tyr Lys Ala Ala Ser Met Arg Trp Trp Thr Ala Ala Trp Ser Leu Ala

465 470 475

CGT GAG CTG AAG CTA GGC CGT GAG CTG CCA CCC AAT GTT TCC CAC GCA 2496

Arg Glu Leu Lys Leu Gly Arg Glu Leu Pro Pro Asn Val Ser His Ala

480 485 490 495

CGG CAA GAT GGA GAG CGA GAT GGG GAT GGC GAG GCG GAC AAA CGA CAT 2544

Arg Gln Asp Gly Glu Arg Asp Gly Asp Gly Glu Ala Asp Lys Arg His

500 505 510

CCT CCG ACC CTC ATC ACG TCA CTG GGT CAT GGA TCG GGA AGC TCC GGC 2592

Pro Pro Thr Leu Ile Thr Ser Leu Gly His Gly Ser Gly Ser Ser Gly

515 520 525

ATT AAT GTC ACC GAA GAG GAG CGT GAG GAG CGT CGA CGC CTA TGG TGG 2640

Ile Asn Val Thr Glu Glu Glu Arg Glu Glu Arg Arg Arg Leu Trp Trp

530 535 540

CTC TTA TAT GCG ACC GAT CGG CAC CTG GCG CTG TGC TAC AAC CGG CCC 2688

Leu Leu Tyr Ala Thr Asp Arg His Leu Ala Leu Cys Tyr Asn Arg Pro

545 550 555

CTC ACG CTG CTG GAC AAG GAA TGT GGC GGG CTG CTG CAG CCG ATG AAC 2736

Leu Thr Leu Leu Asp Lys Glu Cys Gly Gly Leu Leu Gln Pro Met Asn

560 565 570 575

GAT GAT CTG TGG CAG GTC GGC GAC TTT GCA GCG GCT GCC TAC CGC CAG 2784

Asp Asp Leu Trp Gln Val Gly Asp Phe Ala Ala Ala Ala Tyr Arg Gln

580 585 590

GTC GGA CCG CCC GTC GAG TGT ACG GGT CAC AGC ATG TAT GGA TAC TTT 2832

Val Gly Pro Pro Val Glu Cys Thr Gly His Ser Met Tyr Gly Tyr Phe

595 600 605

CTA CCG CTG ATG ACG ATT CTT GGA GGG ATC GTC GAT CTG CAC CAC GCT 2880

Leu Pro Leu Met Thr Ile Leu Gly Gly Ile Val Asp Leu His His Ala

610 615 620

GAG AAT CAT CCG CGC TTT GGC CTG GCG TTC CGC AAT AGC CCG GAG TGG 2928

Glu Asn His Pro Arg Phe Gly Leu Ala Phe Arg Asn Ser Pro Glu Trp

625 630 635

GAG CGT CAG GTA CTG GAC GTT ACG CGG CAG CTG GAC ACA TAT GGG CGC 2976

Glu Arg Gln Val Leu Asp Val Thr Arg Gln Leu Asp Thr Tyr Gly Arg

640 645 650 655

AGC TTG AAG GAA TTC GAG GCC CGC TAC ACC AGC AAC TTG ACT CTG GGG 3024

Ser Leu Lys Glu Phe Glu Ala Arg Tyr Thr Ser Asn Leu Thr Leu Gly

660 665 670

GCT ACG GAT AAC GAG CCT GTC GTC GAA GGT GCC CAC TTG GAT CAC ACG 3072

Ala Thr Asp Asn Glu Pro Val Val Glu Gly Ala His Leu Asp His Thr

675 680 685

AGT CCT TCG GGG CGC TCC AGC AGC ACC GTG GGA TCG CGG GTG AGC GAG 3120

Ser Pro Ser Gly Arg Ser Ser Ser Thr Val Gly Ser Arg Val Ser Glu

690 695 700

TCC ATC GTC CAC ACG AGG ATG GTG GTC GCC TAC GGG ACG CAT ATC ATG 3168

Ser Ile Val His Thr Arg Met Val Val Ala Tyr Gly Thr His Ile Met

705 710 715

CAC GTC CTG CAT ATT TTG CTC GCG GGA AAA TGG GAC CCG GTG AAT CTG 3216

His Val Leu His Ile Leu Leu Ala Gly Lys Trp Asp Pro Val Asn Leu

720 725 730 735

TTG GAA GAT CAT GAT CTG TGG ATC TCC TCG GAG TCG TTT GTC TCG GCC 3264

Leu Glu Asp His Asp Leu Trp Ile Ser Ser Glu Ser Phe Val Ser Ala

740 745 750

ATG AGC CAT GCG GTC GGT GCC GCA GAA GCA GCG GCA GAA ATC TTG GAG 3312

Met Ser His Ala Val Gly Ala Ala Glu Ala Ala Ala Glu Ile Leu Glu

755 760 765

TAC CAC CCG GAT CTC AGC TTC ATG CCG TTC TTC TTC GGG ATT TAC CTA 3360

Tyr Asp Pro Asp Leu Ser Phe Met Pro Phe Phe Phe Gly Ile Tyr Leu

770 775 780

CTA CAG GGC AGT TTC TTG CTG CTA CTG GCG GCG GAC AAG TTG CAG GGC 3408

Leu Gln Gly Ser Phe Leu Leu Leu Leu Ala Ala Asp Lys Leu Gln Gly

785 790 795

GAT GCC AGT CCC AGT GTC GTG CGG GCA TGC GAG ACG ATC GTG CGG GCG 3456

Asp Ala Ser Pro Ser Val Val Arg Ala Cys Glu Thr Ile Val Arg Ala

800 805 810 815

CAT GAA GCG TGC GTC GTG ACC TTG AAC ACG GAG TAC CAG GTAGGTTTTC 3505

His Glu Ala Cys Val Val Thr Leu Asn Thr Glu Tyr Gln

820 825

TTGTTTCTCT CCCTAGCTTG GCAATAGTAG CTAACACAAT GTAG AGG ACA TTC CGC 3561

Arg Thr Phe Arg

830

AAG GTC ATG CGA TCG GCG CTG GCA CAG GTT CGA GGA CGC ATC CCA GAG 3609

Lys Val Met Arg Ser Ala Leu Ala Gln Val Arg Gly Arg Ile Pro Glu

835 840 845

GAC TTT GGG GAG CAG CAG CAG CGC CGA CGC GAA GTG CTT GCG CTA TAC 3657

Asp Phe Gly Glu Gln Gln Gln Arg Arg Arg Glu Val Leu Ala Leu Tyr

850 855 860

CGC TGG AGC GGC GAT GGC AGT GGG CTG GCA CTG TAGTTTTGCA GTAACACGGC 3710

Arg Trp Ser Gly Asp Gly Ser Gly Leu Ala Leu

865 870 875

TGATGATGAG ATGCGATTTA TGGCGGTGCA TTGACCGGTC AATGGCTTCT TACATTCTGA 3770

TTTGATACTA CTTTTGGATT CGCTATTTCA CTCCGGGCTT ATGCTGGCTT CATTGTCAAG 3830

AGGGGTGGCA TGGCGAATGG AAATATGCTT ACTTCGTGTT GATACGGATT CGTACATATA 3890

CTTTGGTGAT ATATGTGGAT ATTTGTGGCA TGTACACTAT GCGTGATCTT TGGACATGAT 3950

ACTTTGATAC CAGGTCAATC TAATTGCGTT CTTTTCATTT GTTGCGCAAC AGCCGAGGTA 4010

TGACGCCATG GCTGAGATAA GCTGCCGATA AGCATTCGCA TTCCATCCTC CATCGAAGCA 4070

CCAAAATCTT CTTCATATAA CCAATCCATC AATTCAACAT TCGTAATGAC AATAGTATAA 4130

TCCCCAAAAT GCCCTCCCTA TTACACTCCC TCCGCACTTC CCC 4173

Claims

1.一种核酸序列，其编码序列号9的表达产物xylR。

2.一种核酸序列，其由序列号9的核酸序列组成。

3.由权利要求1或2所述的核酸序列编码的氨基酸序列。

4.权利要求3的氨基酸序列，其中该氨基酸序列是序列号9的氨基酸序列。

5.权利要求3所述的氨基酸序列，其中所述序列具有DNA结合活性。

6.一种突变宿主细胞，其包括调节物编码序列的缺乏或突变，从而所述的调节物不表达或者其不具备调节物活性；其中所述的调节物编码序列编码xylR，其中所述的调节物由权利要求1或2的核酸序列编码或所述的调节物是权利要求3-5任一项所述的氨基酸序列。

7.权利要求6的突变宿主细胞，进一步包括编码一种蛋白质或肽的序列，所述的蛋白质或肽可不具有木聚糖裂解副活性。

8.一种产生不具有木聚糖裂解副活性的蛋白质或多肽的方法，包括培养权利要求6或7的突变宿主细胞并获得所产生的蛋白质。

9.一种联合核酸盒用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途，其中所述联合核酸盒包括：

1)一种靶基因启动子，其中所述靶基因是可诱导增强序列或激活序列的调节物的靶基因，

2)可操纵地连接于另一个启动子的编码所述调节物的核酸序列，

3)编码所述蛋白质或肽的序列，

所述靶基因启动子可操纵地连接于3)的序列，其中所述编码调节物的核酸序列编码木聚糖裂解调节物，且其中所述编码调节物的核酸序列是权利要求1或2所述的核酸序列或所述调节物由权利要求3-5任一项所述的氨基酸序列组成。

10.权利要求9的用途，其中可操纵地连接于所述编码调节物的核酸序列的另一个启动子是与编码所述调节物的核酸序列天然相关的启动子。

11.权利要求9的用途，其中所述靶基因启动子选自与靶基因xlnA、xlnB、xlnC、xlnD或axeA相关的启动子。

12.权利要求9的用途，其中所述靶基因启动子是与靶基因xlnD相关的启动子。

13.权利要求9-12任一项的用途，其中所述序列编码木聚糖酶、葡聚糖酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶、蛋白酶或氧化还原酶。

14.权利要求13的用途，其中所述氧化还原酶是己糖氧化酶。

15.权利要求1或2所述的核酸序列用于过量表达靶基因的用途，所述的过量表达是在包含靶基因的宿主细胞中表达该核酸序列，所述的靶基因与一种启动子可操纵地连接，所述的启动子与由权利要求1或2所述的核酸序列编码的可诱导增强序列或激活序列的调节物的靶基因正常相关，条件是当靶基因和权利要求1或2所述的核酸序列相对于宿主细胞是天然的时，与野生型宿主细胞相比，权利要求1或2所述的序列以多拷贝存在于宿主细胞中。

16.一种宿主细胞用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途，其中所述宿主细胞包括如权利要求9-14任一项定义的联合核酸盒和/或一种包括如权利要求9-14任一项定义的联合核酸盒的载体。

17.权利要求16的宿主细胞的用途，其中所述宿主细胞包括如权利要求9定义的联合核酸盒的成分，所述宿主细胞天然地或通过重组DNA技术包括所述调节物的靶基因，条件是当所述靶基因和调节物对于所述宿主细胞是天然的时，所述调节物以多拷贝存在于宿主细胞中。

18.权利要求16的宿主细胞的用途，其中所述宿主细胞包括多拷贝的如权利要求9定义的编码调节物的核酸序列或如权利要求1或2所述的核酸序列。

19.权利要求16的宿主细胞的用途，其中所述调节物由权利要求1或2所定义的核酸序列编码或是权利要求3-5任一项所述的氨基酸序列，且靶基因启动子如权利要求11所定义。

20.权利要求16的宿主细胞的用途，其中所述宿主细胞选自微生物或植物细胞。

21.权利要求16的宿主细胞的用途，其中所述宿主细胞选自真菌细胞。

22.权利要求16的宿主细胞的用途，所述宿主细胞选自曲霉属、木霉属、青霉属或镰孢属。

23.权利要求16的宿主细胞的用途，所述宿主细胞为选自黑曲霉、塔宾曲霉、棘孢曲霉、泡盛曲霉、米曲霉、构巢曲霉、臭曲霉、土曲霉、萨氏曲霉、川地曲霉、炭黑曲霉或日本曲霉的菌株。

24.权利要求16的宿主细胞的用途，其中所述靶基因对于宿主细胞是内源的。

25.权利要求16-24任一项的的宿主细胞的用途，其中所述靶基因以多拷贝存在。