CN1661014B - 分离突变体及克隆互补基因的新方法 - Google Patents

分离突变体及克隆互补基因的新方法 Download PDF

Info

Publication number
CN1661014B
CN1661014B CN200410012059.9A CN200410012059A CN1661014B CN 1661014 B CN1661014 B CN 1661014B CN 200410012059 A CN200410012059 A CN 200410012059A CN 1661014 B CN1661014 B CN 1661014B
Authority
CN
China
Prior art keywords
sequence
ala
host cell
gene
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN200410012059.9A
Other languages
English (en)
Other versions
CN1661014A (zh
Inventor
伦德特·亨德里克·德格拉夫
亨丽埃特·凯瑟琳娜·范登布勒克
雅克·菲瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DuPont Nutrition Biosciences ApS
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN1661014A publication Critical patent/CN1661014A/zh
Application granted granted Critical
Publication of CN1661014B publication Critical patent/CN1661014B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/38Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from Aspergillus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • C12N15/1027Mutagenizing nucleic acids by DNA shuffling, e.g. RSR, STEP, RPR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01003Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01015Polygalacturonase (3.2.1.15)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01037Xylan 1,4-beta-xylosidase (3.2.1.37)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01055Alpha-N-arabinofuranosidase (3.2.1.55)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01099Arabinan endo-1,5-alpha-L-arabinosidase (3.2.1.99)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明还提供了包括调节物编码序列的缺乏或突变的突变宿主细胞以及通过培养上述的突变宿主细胞以产生不具有木聚糖裂解副活性的蛋白质或多肽的方法。本发明也提供了所述核酸序列或其等价核酸序列用于过量表达靶基因的用途。

Description

分离突变体及克隆互补基因的新方法
本申请是申请号为96196200.3、申请日为1996年6月24日、发明名称为“分离突变体及克隆互补基因的新方法”的中国发明专利申请的分案申请。 
技术领域
本发明属于微生物突变及筛选突变体领域,具体地,本发明涉及一种编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明还涉及以一种简单、直接和特异性的方式获得代谢突变体。 
背景技术
目前可以工业应用的并能自动化的制备突变体的方法是没有筛选过程以及后续分析突变体过程的突变方法,这一方面需改进。一种带有筛选过程的替代方法总是需要一富集步骤,而后基于生长或不生长而筛选,这意味着首先需除去大量的不希望的突变体。而且现存方法会产生大量带有不正确表型的突变体,因而筛选率很低。 
几年以前,Gist-Brocades开发并介绍了一种用于黑曲霉的pluGBug标记基因自由技术,在G.Selten的GIST94/60 p5-7中描述了一种用于黑曲霉的载体,其包括糖淀粉酶调控区以使其调控的基因高水平表达,选择这种调控区是因为天然黑曲霉天然表达的糖淀粉酶水平很高。使用重组DNA技术将该调控区与感兴趣的基因以及选择标记黑曲霉AmdS合适地融合,使得在将表达盒转移至黑曲霉宿主中后可以筛选所需的转化子,然后多拷贝的表达盒随机整合进黑曲霉基因组。在该文献中描述的所生产的酶是植酸酶。随后可产生不带标记的转化子。在已知系统中,产生不带标记的重组菌株实际是一两步过程,因为amdS基因可以双向使用。首先在一轮转化中筛选含有所提供的表达盒的原始转化子,然后在第二轮中反选择又丧失了amdS基因的最终重组菌株。amdS基因编码能够将乙酰胺转化成铵和乙酸酯的酶,乙酰胺在上述第一轮转化中用作唯一的氮源,在第二轮重组中氟乙酰胺用作选择性氮源,并含有第二种合适的 氮源如脲。由于产物氟乙酸酯对于其它细胞是毒性的,因此仅有那些由于在表达盒内DNA重复序列上发生了内部重组而丧失了amdS基因的细胞能繁殖。该已知方法的最大问题是得到的菌株是重组菌株,所需的特征只能通过掺入“外源”核酸而引入,这会延长立法批准所需的时间,甚至有时不能得到批准。另外,该方法不适于开发带有补充代谢的菌株。由于存在酶级联系统和多重反馈环,仅仅掺入一特定的基因不能总是导致所需的结果,该基因所编码的特定产物的过量产生可能会被另一产物的伴随过量表达而补偿或者负调节,从而使掺入基因达不到效果。因此,DNA的掺入经常是不断摸索出错的过程,即所需的核酸的掺入可以筛选到,但是所需的表型不一定能伴随产生。而且,标记基因的丢失是一自发过程,其耗时并且不能保证对于所有含核酸盒的转化子都能发生这一过程。 
已知微生物菌株的改良可以通过在不同水平修饰微生物而达到,在转录水平改善基因表达通常通过使用强启动子并增加表达盒中的基因剂量而达到,产生高水平的编码感兴趣产物的mRNA。尽管这一策略可以增加所形成的产物,但是其有原则性的不利之处,由于存在多拷贝的启动子,驱动转录的转录调节物的量可能受到限制,导致调节物的靶基因的表达降低,这一点在携带许多拷贝的amdS基因的构巢曲霉中观察到(Kelly and Hynes,1987;Andrianopoulos and Hynes,1988),在携带多拷贝的处于alcA启动子下的异源基因的构巢曲霉菌株中也观察到(Gwynneet al.,1987)。在后一种情况下,编码alcA基因的转录调节物的alcR基因的增加导致表达盒的表达增加(Gwynne et al.,1987;Davies,1991)。与在构巢曲霉中发现的作用类似,在使用糖淀粉酶(glaA)启动子的黑曲霉中也观察到类似的限制,这是由于驱动转录的转录调节物受到限制(Verdoes et al.,1993;Verdoes et al.,1995;Verdoes,1994)。因此目前由于缺乏筛选策略而大大阻碍了对glaA调节基因的克隆。 
在一个阿糖胶酶(arabinase)基因表达的例子中,增加阿糖胶酶基因的剂量时发现对转录调节物有明显的竞争(Flipphi et al,1994),反应出在所研究的三个基因中转录调节物的限制是共同的。 
现有技术中除了上述缺点外,到目前为止分离和确定调节基因仍非常困难,这是由于大多数调节蛋白在细胞中的浓度非常低,使得很难确定哪种物质负责调节作用。另外,通常调节产物不是酶,而只能通过DNA 结合分析来筛选,这使得很难确定和分离并且非常耗时。目前应用的克隆调节基因的策略例如: 
-通过互补作用,但其需要提供突变体, 
-通过纯化调控蛋白,但其非常复杂耗时,因为该蛋白仅能通过其结合DNA的特性加以鉴定。一些纯化方法包括使用结合的DNA片段作为基质的亲和层析,这种纯化方法的一个缺点是通常多于一个蛋白与所述的片段特异性及非特异性结合。 
-基于基因群集,其中调控基因与通过其基因产物调控的结构基因在基因组内群集,例如prn簇,alc簇。 
发明内容
本发明涉及一种编码表达产物xylR的核酸序列或其等价核酸序列以及由所述的核酸序列编码的氨基酸序列或其等价物。本发明也涉及所述核酸序列或其等价核酸序列用于过量表达靶基因的用途。 
本发明还涉及一种突变宿主细胞,其包括调节物编码序列的缺乏或突变,从而所述的调节物不表达或者其不具备调节物活性;其中所述的调节物编码序列编码xylR。 
本发明还涉及一种产生不具有木聚糖裂解副活性的蛋白质或多肽的方法,包括培养上述的突变宿主细胞并获得所产生的蛋白质。 
本发明还涉及一种联合核酸盒用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途,其中所述联合核酸盒包括:1)一种靶基因启动子,其中所述靶基因是可诱导增强序列或激活序列的调节物的靶基因;2)可操纵地连接于另一个启动子的编码所述调节物的核酸序列;3)编码所述蛋白质或肽的序列,所述靶基因启动子可操纵地连接于3)的序列;且其中所述编码调节物的核酸序列编码木聚糖裂解调节物。 
本发明涉及以一种简单、直接和特异性的方式获得代谢突变体。在一优选实施方案中,还可以获得不包括重组DNA的所需的突变体,从而由于立法程序较短而促进所述的突变体掺入供人类消费和应用的产品中。本发明的方法涉及随机突变及特异性筛选所需的代谢突变体,该方法可以合适地自动化进行。这种突变体能显示出增加的或降低的代谢活性。本发明的特异性在于所用的筛选条件。得到的突变体的突变之处在于其针对预定的代谢部分的调控功能的变化。根据筛选条件,可以分离 到去阻遏突变体,由此展现过量表达,或者可分离到丧失了特定代谢酶活性的突变体,因此可以消除不需要的代谢酶活性或者增加所需的代谢活性。 
本发明的方法可以在已广泛应用于工业上的各种熟知来源上进行,例如,过量表达的突变体可以用作高产、低成本的主要酶来源。待突变的原始菌株取决于本领域熟练技术人员公知的几种因素如:对蛋白的有效分泌、大规模生产过程的适应性、发酵液的下游处理的经验、深入的遗传学知识以及确保使用安全的微生物。 
根据本发明的另一方面,其也可以确定和鉴别特异的代谢基因调控功能。 
附图说明
图1:构建选择质粒pIM130。 
图2:去阻遏突变体5B的α-L-阿拉伯呋喃糖苷酶、内切木聚糖酶和β-木糖苷酶的酶活性增加。 
图3:用木聚糖酶A编码基因转化黑曲霉增加了木聚糖酶A的酶活性。 
具体实施方式
我们现已获得一种系统,其可用于缩短能过量产生特定需要的酶的突变微生物的登记所需时间,该系统克服了“外源”核酸尤其是选择标记基因的多重随机插入的问题,该系统甚至不需要外源核酸来达到所需的特征。得到的突变菌株将不包括异源核酸。另外,本发明的系统能实现代谢的特异突变并不需导致不希望的表型的大量实验工作。 
本发明涉及一种核酸盒,其包括编码一双向标记的核酸序列,所述的核酸盒进一步包括与编码双向标记的核酸序列可操作地连接的一个基本转录单位,所述的核酸盒还包括与基本转录单位以如下方式连接的可诱导增强序列或激活序列,所述的连接方式为当诱导增强序列或激活序列时能使编码双向标记的核酸序列表达,所述的可诱导增强序列或激活序列从与代谢系统的一部分的活性相关的基因衍生而来,所述的可诱导增强序列或激活序列从代谢相关基因衍生而来。 
基本转录单位包括任何为基因的转录所需的因子,其可包括具有或不具有增强序列的启动子。基本转录单位必须是在宿主生物体内可操作的,其定位必须是可操作地与双向标记基因连接,以使该基因的转录成为可能。对于各种宿主细胞如曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌和乳杆菌已熟知作为基本转录单位的合适的例子。在实施例中,举例示出了从黑曲霉goxC转录单位(Whittington等,1990)衍生的基本转录单位tGOX作为本发明的实施方案。 
优选的是可诱导增强序列或激活序列正常参与酶级联系统的调控,或者参与涉及一或多个反馈环的代谢的一部分。在一实施方案中,本发明的核酸盒包括正常参与碳代谢的可诱导增强序列或激活序列。可用于本发明的核酸盒的可诱导增强序列或激活序列的合适的例子是包括在下述任一核酸片段上的上游激活序列(UAS): 
-源自分别编码阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段, 
-源自编码糖淀粉酶的glaA基因的片段, 
-含有如在alcR和alcA启动子上的alcR结合位点的片段, 
-源自CUP1基因的片段, 
-源自PHO5基因的片段, 
-源自GAL1、GAL7或GAL10基因的片段, 
-源自xlnA基因的片段, 
-源自pgaII基因的片段, 
例如,这些片段可以来源于如文献中所述的下列微生物: 
-源自分别编码黑曲霉阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段 (Flipphi M.J.A.et al.1994), 
-源自编码黑曲霉的糖淀粉酶的glaA基因的片段(Fowler T.et al1990), 
-含有如在构巢曲霉的alcR启动子上的alcR结合位点的片段(Felenbok B.et al.1994), 
-源自啤酒酵母CUP1基因的片段(Hinnen A.et al.1995), 
-源自啤酒酵母PHO5基因的片段(Hinnen A.et al.1995), 
-源自啤酒酵母GAL1、GAL7或GAL10基因的片段(Hinnen A.et al.1995), 
-源自构巢曲霉的xlnA、xlnB、xlnC或xlnD基因的片段, 
-源自黑曲霉的xlnB、xlnC或xlnD基因的片段(见本说明书的其它处), 
-源自塔宾曲霉的xlnA或xlnD基因的片段(de Graaff et al.1994), 
-源自黑曲霉的pgaII基因的片段(见本说明书的其它处)。 
在实施例中,举出xlnA的UAS为本发明的实施方案的例子。 
双向标记是本领域熟知的术语,它包括能根据所用的选择条件而指示是否存在表达的选择标记,一个优选的双向标记将赋予以致死性或生长极度降低为基础的可选择性。另外,根据双向标记基因的表达与否而使菌落颜色不同也是可行的实施方案。已知的双向标记的合适例子包括facB、NiaD、AmdS、Can1、Ura3、Ura4和PyrA基因。我们在此指出,PyrA同系物在文献中也称作PyrG、Ura3、Ura4、Pyr4和Pyr1。这些基因可在下述微生物中发现,facB基因见于构巢曲霉,NiaD基因见于黑曲霉,NiaD基因见于米曲霉, AmdS基因见于构巢曲霉,Can1基因见于粟酒裂殖糖酵母,Ura3基因见于啤酒糖酵母,Ura4基因见于粟酒糖酵母,PyrA基因见于曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌。 
选择facB突变体即具有阴性表型可以根据氟乙酸抗性为基础,选择FAC B+即阳性表型可以以乙酸盐为碳源进行(Katz,M.E.and HynesM.J.1989)。选择niaD突变体即具有阴性表型可以根据氯酸盐抗性为基础,选择NIA D+即阳性表型可以以硝酸盐为氮源进行(Unkels S.E.et al.1989a and 1989b)。选择amdS突变体即具有阴性表型可以根据氟乙酰胺抗性为基础,选择AMD S+即阳性表型可以以乙酰胺为氮源进行,由于大多数真菌不具有编码乙酰胺酶功能的基因,所以AMD S对于此类真菌是显性标记,其可用在黑曲霉、黑曲霉塔宾变种、黑曲霉泡盛变种、臭曲霉、米曲霉、萨氏曲霉、日本曲霉、棘孢曲霉、曲霉属各种、木霉属各种(Kelly and Hynes 1985 and Bailey et al.1991)。选择can1突变体即具有阴性表型可以根据canavanine抗性为基础,其中canavanine是一种精氨酸类似物,选择CAN 1+即阳性表型可以在精氨酸上进行(Ekwall K.1991)。编码乳清酸核苷5’-P-脱羧酶的基因已知为pyrA、pyrG或ura3,其已在各种微生物中发现,如曲霉、木霉、青霉、镰孢、酿酒酵母和克鲁维酵母。选择pyrA突变体即具有阴性表型,也称为pyrG或ura3可以根据氟乳清酸抗性为基础,选择PYR A+及其同系物即阳性表型可以根据尿苷或尿嘧啶原养型为基础进行,在实施例中,举出黑曲霉的pyrA(Wilson et al.1988)作为本发明的实施方案的例子。其它的例子是本领域熟练技术人员公知的并可在文献中容易地找到。选择标记的使用取决于待突变的宿主微生物以及其它次一级的考虑如选择的 容易性、可靠性以及所用底物的成本等。掺入到转化或表达载体中的核酸盒也包括在本发明的范围内,还包括这种核酸盒或载体在转化和选择方法中的应用。本发明特别涉及产生这样的突变体的方法,所述的突变体显示过量表达一种参与预定代谢部分的酶;以及产生这样的突变体的方法,所述的突变体显示降低或抑制一种参与预定代谢部分的酶的表达;以及确定和分离参与预定代谢部分的的调控基因的方法。 
因此,本发明涉及一种制备和筛选微生物突变菌株的方法,所述的突变与未突变的菌株相比能促进预定部分的代谢,所述的方法包括 
-将本发明中所述的核酸盒导入宿主,所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型, 
-在如下的条件下培养得到的微生物,所述的条件为能使核酸盒上包括的增强序列或激活序列有正常活性,并且双向标记基因可表达,优选的是所述的双向标记基因的表达将导致生长,而不表达则不生长, 
-在上述培养条件下选择具有与双向标记基因表达相应的表型的转化子, 
-将所选的转化子以已知方式诱变, 
-在预定代谢部分的可代谢底物存在下,在如下条件下培养得到的菌株,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件, 
-选择从诱变后的培养步骤得到的菌株,所述的菌株具有与在选择条件下表达双向标记基因相应的表型,该条件下未突变的含核酸盒 亲本菌株不表达双向标记。 
在本方法的合适实施方案中, 
-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS), 
-预定代谢部分是碳代谢的木聚糖裂解部分, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS的诱导物的存在下、UAS的阻遏物以及可代谢碳源不存在下培养, 
-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在UAS阻遏物存在下和在可代谢碳源存在下,以及任选地在UAS的诱导物存在下, 
-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件。 
在本方法的更进一步的实施方案中, 
-核酸盒包括编码双向标记pyrA的核酸序列, 
-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在增强序列或激活序 列有正常活性的条件下培养,即在增强子或激活物的诱导物的存在下、增强子或激活物的阻遏物不存在下以及双向标记基因能表达的条件下培养, 
-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或在增强子或激活物的阻遏物存在下和在预定代谢部分的可代谢底物的存在下, 
-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或者在增强子或激活物的阻遏物存在下。 
合适的是,以上所述的实施方案可以进一步具有如下特征 
-核酸盒包括编码双向标记pyrA的核酸序列, 
-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型, 
-可诱导的增强序列或激活序列是从xlnA基因衍生的UAS, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS有正常活性的条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记基因能表达的条件下培养, 
-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖和在可代谢碳源的存在下, 
-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖。 
另外,本发明优选的是制备和筛选未重组的微生物突变菌株的方法,所述的突变与未突变的菌株相比增强了预定代谢部分,所述的方法包括进行以上段落所述的本发明方法的步骤,然后以公知的方式交换除去(crossing out)导入的核酸盒的核酸。 
如前所述,本发明提供了制备和筛选微生物突变株的方法,所述的突变与未突变株相比抑制预定的碳代谢部分,所述的方法包括 
-将上述本发明的核酸盒导入宿主, 
所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型,所述的宿主具有待降低或抑制的预定代谢部分的特征活性类型, 
-在如下的条件下培养得到的微生物,所述的条件为能使核酸盒的增强序列或激活序列有正常活性,并且核酸盒的双向标记基因的不表达可使得到的微生物生长和被检测到,并且优选的是所述的双向标 记的表达将导致死亡或强烈抑制生长, 
-在上述培养条件下选择具有与双向标记基因表达相应的表型的转化子, 
-将所选的转化子以已知方式诱变, 
-在可代谢底物存在下,在如下条件下培养诱变后得到的菌株,所述的条件为具有与双向标记的不表达相应的表型的菌株可接受的,并且能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性, 
-选择从诱变后的培养步骤得到的菌株,所述的菌株具有与在选择条件下降低的或受抑制的预定代谢部分的活性相应的表型,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性,如在底物上生长时的水解透明区减小,所述的底物为活性待降低或抑制的代谢部分的底物。 
在本方法的进一步实施方案中, 
-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS), 
-预定代谢部分是碳代谢的木聚糖裂解部分, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在核酸盒的UAS的阻遏物不存在下、在可代谢碳源存在下、以及优选地在UAS的诱导物的存在下培养, 
-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的 条件为对于具有与双向标记的不表达相应的表型的菌株的生长和检测是可接受的;并且对于具有与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物,例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源, 
-选择从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。     
提供了前一段落所述的方法的例子,其中 
-核酸盒包括编码双向标记pyrA的核酸序列, 
-在导入核酸盒之前,宿主不具有与双向标记的表达相关的PYRA+表型, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在增强子或激活物的诱导物存在下、并且在增强子或激活物的阻遏物不存在下以及在双向标记pyrA能表达的条件下培养, 
-选择具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即PYRA-表型的菌株的生长和检测是可接受的;并且对于具有PYRA+表型即与双向标 记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定代谢部分活性的条件,即存在增强子或激活物的诱导物和可代谢底物并且不存在增强子或激活物的阻遏物或者与诱导物联合使用的另一种非阻遏底物。 
在一优选的实施方案中,前述两个段落所述的方法是如下一种方法,其中进一步 
-核酸盒包括编码双向标记pyrA的核酸序列, 
-在导入核酸盒之前,宿主不具有与双向标记的表达相关的PYRA+表型, 
-可诱导增强序列或激活序列是衍生于xlnA基因的UAS, 
-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在UAS有正常活性条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记pyrA能表达的条件下培养, 
-选择具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行, 
-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即pyrA-表型的菌株的生长和检测是可接受的;并且对于具有PYRA+表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在 UAS阻遏物,例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源, 
-选择从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。 
上述的所有方法可以有利地使用具有如下特征的宿主进行,所述的宿主在导入核酸盒之前就具有与编码双向标记的核酸序列的至少一部分对应的核酸,所述的对应程度足以使包含在核酸盒上的编码双向标记的核酸同源重组在染色体上。这一方面确保了核酸盒在预定的位置进行整合。 
在一优选的实施方案中,将掺入多拷贝的核酸盒以确保诱变步骤不会失活双向标记,因为当检测标记阴性表型时双向标记的失活会给出不正确的结果,双向标记的失活也能降低标记阳性表型的数量。 
在本发明的优选的实施方案中,已构建了一种核酸盒,其可用于产生显示参与预定代谢部分的酶的过量表达的突变体的方法中,可用于产生显示参与预定代谢部分的酶的降低的或受抑制的表达的突变体的方法中,以及可用于确定和分离参与预定代谢部分的调控基因的方法中。我们具体地举例描述了用于碳代谢的突变体的系统。在实施例中描述了具有改变的木聚糖裂解特征的突变体以及导致阿拉伯糖裂解和果胶裂解途径的突变体的阿糖胶酶和聚半乳糖醛酸酶突变体。在实施例中使用曲霉作为待突变的菌株,但是其它工业可接受的微生物均适用,这类微生物的例子包括酿酒酵母,例如啤酒酵母,粟 酒糖酵母,曲霉,例如构巢曲霉,木霉,青霉,镰孢,克鲁维酵母和乳杆菌。其它例子是本领域熟练技术人员显而易见的并在本说明书的其它部分有描述。现在可以产生过量表达或不表达预定代谢部分的菌株。我们还可确定可诱导增强序列或激活序列的激活调节物的特征及核酸序列,特别是当这种激活调节物参与代谢时,更具体地当这种激活调节物参与具有酶级联系统或反馈环或多重反馈环的代谢部分时。这种调控基因的核酸序列随后可用于增强靶基因的表达,所述的靶基因为由该调控基因调控的基因。在一优选的实施方案中,这种靶基因具有调控基因的表达产物的结合位点。在一表达盒中将与调节物的靶基因正常相关的启动子与调控基因联合(其中所述的启动子与编码待表达的同源或异源蛋白质或肽的同源或异源序列可操作地连接)能使表达盒在表达同源甚至异源蛋白质或肽方面特别有用。编码调节物的基因可在其天然启动子的控制之下或者在能在所选宿主细胞中表达的任何其它启动子的控制之下。启动子可以是组成型的或诱导型的,这取决于特定生产过程的需要。这种联合表达盒属于本发明的范围,包括这种盒的载体或质粒也属于本发明的范围。表达程度不再受仅存在很少量的调节物的限制,因此待表达基因的表达程度比在相应的待表达基因在相同启动子控制下但是不存在调控基因的宿主细胞中的表达程度高得多。这种增加的表达优选的是在正常包括欲影响的代谢途径部分的组分的生物体细胞中达到,合适的宿主细胞是丝状真菌细胞。将上述类型的组合表达盒掺入到具有调节物的靶基因的宿主细胞中可以增加靶基因的表达或者若存在多个靶基因的话增加所有靶基因的表达。优选的是靶基因相对于宿主细胞是内源的。包括联合表达盒的宿主细胞属于本发明的范围。 
在实施例中,提供了木聚糖裂解途径xylR的调节物的核酸序列xlnR,已发现这一调节物的靶基因包括基因xlnA、xlnB、xlnC和xlnD以及axeA。证明了木聚糖酶A表达的增加,并且可用于示意xlyR对xylR调节物的靶基因的作用的通用性。现有技术中已知许多序列,包括上述的xlnA、xlnB、xlnC和xlnD以及axeA基因的序列,这些信息对于本领域熟练技术人员是容易获得的,并认为掺入本文。与xlnR核酸联合应用的优选的感兴趣的启动子可以选自xlnA、xlnB、xlnC和xlnD,使用axeA启动子也是本发明的合适的实施方案。启动子对于本领域熟练技术人员是已知的,并认为掺入本文。xlnA启动子由deGraaff等人1994年描述,xlnB启动子由Kinoshita等人1995年描述,xlnD启动子在EP95201707.7中有描述,并包括在这一文献的序列表的序列号8中。启动子序列可以根据已知的序列容易地合成或者以标准的已知方法得自生物体或包含启动子的载体。当使用术语启动子、增强子或调节物时,包括启动子、增强子或调节物的天然的片段也可采用,只要其可操作性不改变即可。在本发明的构建体中不需要仅掺入相关序列,也可存在任何侧翼的非干扰序列。本发明不仅包括编码表达产物xylR的核酸序列xlnR,而且包括编码等价表达产物和突变表达产物的序列以及本发明的核酸序列的表达产物本身。本文公开的任何xylR或xylR编码序列(=xlnR)的应用也适用于突变体和编码突变体的核酸序列,这些均认为掺入本文。 
用于表达本发明的核酸序列和盒的合适的真菌细胞的例子有曲霉如黑曲霉、塔宾曲霉、棘孢曲霉,泡盛曲霉,米曲霉,构巢曲霉,炭黑曲霉,臭曲霉,土曲霉,萨氏曲霉,川地曲霉,日本曲霉和木霉 属、青霉属和镰孢属的种。其它细胞如植物细胞也是可行的宿主细胞,在本文的其它地方描述了其它宿主细胞。 
用本发明的表达盒表达或者与本发明的核酸序列联合的特别感兴趣的基因是编码酶的基因。用于表达的合适的基因是编码木聚糖酶、葡聚糖酶、氧化还原酶如己糖氧化酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶和蛋白酶的基因,这些是所需的表达产物的非限制性例子。包括上述基因的许多序列是本领域已知的并且这种信息对于本领域熟练技术人员来说是容易获得的,并被认为掺入本文。所述的基因可以根据文献或数据库中已知的序列容易地合成或者从生物体或包括这些基因的载体中以已知的标准方式衍生,这些均是本领域熟练技术人员容易获得的知识,在此不需进一步的论证。 
与序列号9的xylR的氨基酸序列或由序列号9的xlnR的核酸序列(从948位核苷酸开始)编码的氨基酸序列有80-100%的相同性的表达产物被认为是本发明的木聚糖酶调节物(xylR)的等价表达产物,因此属于本发明的范围。该等价表达产物应具有DNA结合活性,优选地,这种DNA结合活性应是表达产物与靶基因的核酸的结合程度与具有序列号9提供的氨基酸序列的表达产物结合的程度相同或更好。用于确定结合活性的优选的靶基因是编码xylA、xylB、xylC和xylD的基因,即xlnA、xlnB、xlnC和xlnD基因。本发明也要求保护至少保持相同程度的靶结合活性的根据序列号9的xlnR基因表达产物xylR的突变体和编码核酸序列xlnR的突变体。被认为属于等价表达产物的定义内的突变体特别包括与序列号9的氨基酸序列相比有氨基酸改变的突变体,这些等价物及其编码核酸序列被认为是本发明的合适的实施方案。具有1-15个氨基酸取代的 突变体是合适的,有例如1-5个氨基酸取代的突变体也被认为是本发明特别合适的形成等价表达产物的实施方案。用同类型的其它氨基酸取代特定的氨基酸不会严重影响肽活性这一点是本领域熟练技术人员的常识。根据水疗法(hydropathy)曲线,本领域熟练技术人员将清楚何种取代可以进行。用其它疏水性氨基酸取代疏水性氨基酸以及用其它亲水性氨基酸取代亲水性氨基酸例如能产生本发明的合适的表达产物。这种取代被认为是由本发明的范围所覆盖。在序列号9的编码核酸序列中的点突变被认为能产生属于本发明范围的核酸序列,这种点突变可以导致氨基酸水平的静止突变或者导致上述的取代突变体。本发明也包括任何类型的取代突变体。优选地,与序列号9的氨基酸序列相比突变体的相同性应为85-100%,更优选为90-100%,最优选为95-100%。如上所述,与序列号9的氨基酸序列有80-100%的相同性的氨基酸序列属于本发明的等价物,因此包括了至多为20%、优选少于15%、更优选少于10%、最优选少于5%的本发明氨基酸序列的缺失和/或取代。这种突变体可以包括在氨基酸序列的一或多个部分中的缺失和/或取代,然而,这种缺失和/或取代突变体包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。1-5个氨基酸的缺失突变体被认为属于本发明的范围,超过5个氨基酸的缺失的缺失突变体和/或具有多于5个氨基酸取代和/或点突变的突变体也能保持DNA结合活性,这种较大的缺失和/或取代和/或点突变优选地发生在氨基酸序列的N末端部分以及编码核酸序列的相应部分。据信参与调控和活化的最重要的区域存在于从锌指结合区开始的氨基酸序列的C末端部分,因此,缺失突变体优选地包括至少这一部分的氨基酸序列。优选地在锌 指结合区即相应于序列号9的第1110-1260位核苷酸的区域没有突变,如果存在一个突变,则优选地其不涉及与锌配位的6个半胱氨酸间的间隔区,最优选地任何突变均不涉及6个半胱氨酸中的任一个。另外,优选地,在序列号9的氨基酸序列中存在的RRRLWW基序中不存在突变。在所述的氨基酸序列的一或多个片段中可能会发生缺失,然而这种缺失突变体应包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。缺失1-15个氨基酸、优选缺失1-10个氨基酸、最优选缺失1-5个氨基酸是保证等价性的合适的实施方案。等价的核酸序列的实施方案是编码如下表达产物的核酸序列,所述的表达产物具有与序列号9的xylR相同的氨基酸序列或者由序列号9的xlnR核酸序列编码的相同氨基酸序列。与序列号9的xylR的氨基酸序列或由编码序列号9的xylR的核酸序列编码的氨基酸序列有80-100%的相同性的表达产物的编码核酸序列也被认为是xlnR的等价核酸序列,因此属于本发明的范围。本发明的等价核酸序列的另一个实施方案是在如实施例所述的特异性最小严格条件下能与从序列号9的核酸序列衍生的引物或探针杂交的核酸序列,所述的引物或探针是从非锌指结合区衍生的,并且所述的引物或探针的长度至少为20个核苷酸。通常合适的探针和引物的长度为20-60个核苷酸、优选为25-60个核苷酸。优选地,探针或引物从序列号9的从锌指结合区开始的C末端编码部分衍生。本发明的核酸序列的一个优选的实施方案是在至少为实施例中所述的严格程度的特异条件下能与序列号9的核酸序列杂交。等价的核酸序列应能例如通过PCR用上述的基于序列号9的核酸序列的引物从其它生物体中衍生。上述定义的等价核酸序列的表达产物也属于本发明的范 围,反过来,编码本发明的等价氨基酸序列的核酸序列也属于术语等价核酸序列的范畴。从丝状真菌和植物中衍生的等价核酸序列及这些序列的表达产物是本发明的优选实施方案。优选地,等价核酸序列包括编码相应于序列号9中的1110-1260位核苷酸编码的锌指结合区的核酸序列。在一优选的实施方案中,等价核酸序列应编码与锌配位的6个半胱氨酸,在进一步的实施方案中,半胱氨酸之间的间隔应对应于序列号9中的间隔区。 
包括将实施的等价核酸序列和表达产物的各种实施方案的特征结合在一起的实施方案也属于本发明的范围。在锌指结合区具有突变但能显示增加的DNA结合性能的突变体也属于本发明范围,具有降低的DNA结合性能的突变体也属于本发明的范围,这种突变体可能在锌指结合区有突变。特别要求的是在序列号9中提供的氨基酸序列的突变体。 
具有序列号9的至少15个核苷酸的核酸序列的片段也属于本发明范围,这些片段能用作探针或引物来检测和分离等价序列。特别是两个或更多个这种片段的组合可用在试剂盒中以检测和/或分离这种等价序列。优选地,片段应从序列号9的氨基酸序列的C末端部分衍生。在试剂盒的一个合适的实施方案中,片段应不包括形成锌指结合区的核酸序列的一部分。在实施例中举例示出了用作引物的片段的合适组合,任何可通过如实施例所述的PCR利用这些引物获得的序列均属于本发明的范围。在实施例中所用的杂交条件提供了筛选所需的最低的严格程度,可以使用更严格的条件,如由Sambrook等所述的用于获得的序列与序列号9有增加的同源性的杂交条件,低盐浓度通常意味着更严格的条件。编码具有完整序列的靶基因结合活性的多 肽的序列号9的序列的任何片段均属于本发明的等价核酸序列或其氨基酸序列的范围,等价的定义如上所述涉及完整序列的杂交和/或突变和/或遗传密码的简并。 
包括编码xylR的核酸序列或其如上定义的等价序列的载体或质粒也属于本发明的范围,包括这种序列的载体或质粒以及包括这种额外的序列的宿主细胞也属于本发明的范围。携带至少一个额外拷贝的根据序列号9的编码核酸序列或其等价物的转化宿主细胞如微生物或植物细胞属于本发明的范围。优选地,各种实施方案如此组织以使序列能在载体、质粒或宿主细胞中表达。调控基因可以包括与在宿主细胞中可操作的可变启动子组合的序列号9的完整序列或者仅仅是其编码序列。宿主细胞的合适例子在本说明书的其它部分有描述。针对各种宿主细胞的可以与序列号9的编码序列一起掺入的合适的可操作启动子对于本领域熟练技术人员是清楚的。针对在说明书中例举的宿主细胞的组成型启动子或诱导型启动子是已知的并且不需创造性劳动即可利用它们实施本发明。 
提供了生产同源或异源蛋白或肽的方法,所述的方法包括在宿主细胞中表达编码同源或异源蛋白或肽的核酸序列,所述的宿主还包括附加的编码调控基因如xlnR或其等价物的核酸序列,该核酸序列也表达。所述的方法优选地用一种联合核酸序列表达盒进行,所述的表达盒包括可操作地与第一个启动子相连的调控基因,并且所述的表达盒还包括第二个启动子,所述的第二个启动子与调节物的靶基因正常相关,所述的靶基因启动子与编码待表达的同源甚至异源蛋白或肽的核酸序列可操作地相连。第一个启动子可以是与调控基因天然相关的启动子或者可以是能在宿主细胞中操作的启动子。表达程度不再受仅 存在非常少量的调节物这一点的限制,因此待表达基因的表达程度比在相应的不存在调控基因的宿主细胞中的表达程度高许多。这种增加的表达优选地在正常包括需影响的代谢途径部分的成分的生物体细胞中实现,合适的宿主细胞是植物细胞或微生物,合适的微生物可以是真菌,特别是丝状真菌。合适的宿主细胞的例子在本说明书的其它处有描述并可认为掺入在此。在包括调节物的靶基因的宿主细胞中掺入上述类型的联合表达盒可以增加靶基因的表达,或者如果存在多个靶基因的话,可以使这些靶基因均增加表达。优选地,靶基因相对于调节物是天然的,这种靶基因优选地是宿主细胞内源性的。在实施例中提供了木聚糖裂解途径xlnR的调节物的核酸序列,已发现这一调节物的天然靶基因包括xlnA、xlnB、xlnC和xlnD以及axeA基因,因此,这些基因是优选的靶基因,也存在其它的靶并认为其包括在术语靶基因中。本发明的宿主细胞的各种实施方案均包括在权利要求书中。如果调控序列和靶基因均天然存在于宿主细胞中,则调控序列应以多个拷贝存在,这种微生物与天然微生物相比将过量表达由靶基因启动子调控的基因。 
由于现在已知木聚糖酶调节物的序列,所有可以剔除木聚糖酶调节物,一旦已知待剔除的基因的核酸序列,制备剔除宿主细胞的技术是标准技术。这种方法可参考Berka等(1990)描述的方法以及EP95201707.7的实施例11类似地进行,所述的欧洲专利申请的拷贝在递交本申请时也已附上,该实施例本身也掺入了本申请的实施例中。这种剔除可使宿主细胞缺失木聚糖裂解活性,由于剔除xlnR基因而缺失了木聚糖裂解活性的宿主细胞可以用作产生无木聚糖裂解活性的所选的同源或异源表达产物,具有剔除xlnR基因的宿主细胞 属于本发明的范围,这种宿主细胞优选地是植物细胞或丝状真菌,这种丝状真菌优选地是曲霉。各种合适的宿主细胞的例子在本说明书的其它处有描述。 
使用本发明的筛选和突变方法产生的在调控基因中具有突变的宿主细胞可以用来与调控基因的调节活性拷贝进行互补。这种互补菌株将随后表达由调节物调控的任何靶基因的产物,这些靶基因产物在未互补的调节物阴性突变体中不存在。比较根据已知方法从两种菌株中获得的蛋白条带,可以明显地看到何种靶产物由调节物调控,随后一旦确定其表达产物即可以以已知的方式确定相应的新的靶基因。以这种方式可以在实施例中发现木聚糖酶调节物xylR的除已知的靶基因之外的其它靶基因。 
实施例 
实施例1:构建质粒 
实施例1.1:构建选择质粒pIM130 
如图1所示构建选择质粒pIM130,在PCR1中用寡核苷酸1(SEQID NO:1)5’-CACAATGCATCCCCTTTATCCGCCTGCCGT-3’(式1)和寡核苷酸A(SEQ ID NO:2)5’-CAATTGCGACTTGGAGGACATGATGGGCAGATGAGGG-3’(式2)从pIM120(de Graaff等,1994)产生一个片段。寡核苷酸1衍生于塔宾曲霉xlnA启动子(de Graaff等,1994)的位置600-619(SEQID NO:5),其中加入了含有NsiI位点的10个核苷酸。寡核苷酸A的3’末端衍生于终止于翻译起始位点之前的黑曲霉goxC转录单位(Whittington等,1990)(位置708-723)(SEQ ID NO:6),而其5’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编 码区(Wilson等,1988)(位置341-359,SEQ ID NO:7)。 
通过含10μl 10×反应缓冲液(100mM Tris-HCl,pH8.3,500mMKCl,15mM MgCl2,0.01%明胶),16μl1.25mM每种脱氧核苷三磷酸,lng质粒pIM120 DNA和各1μg寡核苷酸1和寡核苷酸A,终体积为100μl的PCR产生片段A。混合这一反应混合物并加入1μl TAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃保温3分钟变性DNA,接着进行92℃1分钟、48℃1分钟、72℃1分钟的25个循环,25个循环后将混合物在72℃保温5分钟。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段,该片段相应于根据基因序列预期的大小。 
在PCR2中使用寡核苷酸2(SEQ ID NO:3):5’-AGAGAGGATATCGATGTGGG-3’(式3)和寡核苷酸B(SEQ IDNO:4):5’-CCCTCATCTGCCCATCATGTCCTCCAAGTCGCAATTG-3’(式4)从质粒pGW635(Goosen et al.,1987)产生一个片段。寡核苷酸B的5’末端衍生自黑曲霉goxC基本转录单位(位置708-723,SEQ IDNO:6)(Whittington et al.,1990),而其3’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编码区。寡核苷酸2衍生自pyrA编码区(位置339-359,SEQ ID NO:7)并跨越第602位(SEQ IDNO:7)的EcoRV限制性内切酶位点。 
片段B以类似片段A相同的方式产生,只是在这一情况下反应混合物含有各1μg寡核苷酸2和寡核苷酸B以及1ng质粒pGW635 DNA。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段,该片段相应于根据基因序列预期的大小。 
电泳后从琼脂糖凝胶中分离片段A和片段B,从琼脂糖凝胶中 切下片段,之后用ISCO杯通过电洗脱将它们从琼脂糖小块中回收出来。在这一杯的大小容器上各覆盖一透析膜,在杯中注入0.005×TAE(每1000ml 50×TAE缓冲液含242.0g Trizma碱(Sigma),7.1ml冰醋酸,100ml 0.5M EDTA pH8.0),将琼脂糖小块置于杯的大容器中。随后将杯置于电洗脱装置中,使大容器位于含1×TAE的阳极室,小容器位于含1×TAE/3M NaAc的阴极室。在1小时内以100V电洗脱片段,之后从电洗脱装置中取出杯,并除去大容器中的缓冲液,而小容器中的缓冲液仅除去上面的部分,含有DNA片段的剩余缓冲液(200μl)在杯中对蒸馏水透析30分钟。最后通过加入0.1倍体积的3M NaAc,pH5.6和2倍体积的冷(-20℃)乙醇沉淀DNA,在4℃、14,000×g离心30分钟(Eppendorf离心机)收集DNA。除去上清后用Savant Speedvac真空离心机干燥DNA沉淀,将DNA溶于10μl TE缓冲液(TE:10mM Tris/HCl pH7.2,1mM EDTA pH8.0)中,用已知浓度的λDNA作为参考以及检测DNA的溴乙锭染色通过琼脂糖凝胶电泳测定浓度。 
在PCR3中融合片段A和片段B,PCR3与PCR1的不同之处是其反应混合物含有各1μg寡核苷酸1和寡核苷酸2以及各约50ng片段A和片段B。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约500bp的片段,该片段相应于根据基因序列预期的大小。 
如上所述从琼脂糖凝胶中分离得到的片段C,随后用限制性内切酶NsiI和EcoRV消化,在由下述溶液组成的反应混合物中在37℃消化DNA3小时,所述的溶液为5μl(约0.5μg)DNA溶液、2μl合适的10×反应缓冲液(Life Technologies)、10U限制性内切酶(LifeTechnologies)和无菌蒸馏水至终体积20μl。消化后通过琼脂 糖凝胶电泳分析DNA片段并如上所述从凝胶中分离片段。 
为了最终构建pIM130,如上所述在500μl的终体积中用50U的限制性内切酶EcoRV和XbaI消化5μg质粒pGW635,产物分离后通过电洗脱从琼脂糖凝胶中分离2.2kb的EcoRV/XbaI片段(片段D)。类似地,用限制性内切酶NsiI/XbaI消化制备1μg载体pGEM-7Zf(+)(Promega),随后电泳并通过电洗脱从琼脂糖凝胶中分离。 
通过如下连接反应构建质粒pIM130:将100ng pGEM-7Zf(+)NsiI/XbaI片段与50ng片段C和50ng片段D混合,向这一混合物中加入4μl 5×连接缓冲液(组成:500mM Tris-HCl,pH7.6;100mM MgCl2;10mM ATP;10mM二硫苏糖醇;25%PEG-6000)和1μl(1.2U/μl)T4DNA连接酶(Life Technologies),终体积为20μl。在14℃保温16小时后用无菌水将混合物稀释至100μl,用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞,所述感受态细胞的制备见Sambrook等人,1989所述。 
将两个得到的菌落在含100μg/ml氨苄青霉素的LB培养基(每1000ml LB培养基含10g胰化蛋白胨(BBL),5g酵母提取物(BBL),10g NaCl,0.5mM Tris-HCl pH7.5)中培养过夜,通过Maniatis等人(1982)所述的碱裂解法从培养物中分离质粒DNA,将质粒DNA用于限制酶分析以筛选携带所需质粒pIM130的克隆。从500ml的在含100μg/ml氨苄青霉素的LB培养基中培养的含pIM130的大肠杆菌DH5α培养物这大量分离质粒DNA(Maniatis等人,1982)。通过CsCl离心、酚抽提、乙醇沉淀纯化质粒并溶于400μl TE,产量约为500μg。 
实施例1.2:质粒pIM135的构建 
从质粒pIM120构建第二个质粒,该质粒含有与pyrA编码区和终止区融合的goxC基本转录单位。在PCR4中使用寡核苷酸3和寡核苷酸2(式3)从质粒pIM120产生了一个片段,所述的寡核苷酸3序列为5’-CACAATGCATCGTATAAGTAACCTCGTTCG-3’(式5)其衍生自goxC基本转录单位(位置640-660,SEQ ID NO:6),并且加入了含一个NsiI位点的10个核苷酸。如实施例1.1所述,从凝胶中分离产生的片段,用NsiI和EcoRV消化并与pGW635的2.2kbEcoRV/XbaI片段一起克隆到用XbaI/NsiI消化的质粒pGEM-7Zf(+)中,得到质粒pIM135。 
质粒pIM135可用作构建载体来制备本发明的携带任何所需的可诱导增强序列或激活序列、参与代谢的基因的UAS的载体。pIM135包括可操作地与双向标记基因(pyrA)连接的基本转录单位(tGOX)。 
实施例2:使用质粒pIM130转化黑曲霉 
以1×106个孢子/ml在250ml由曲霉基本培养基(MM)组成的培养基(每升含有:6.0g NaNO3,1.5gKH2PO4,0.5gMgSO4·7H2O,0.5gKCl,所指出的碳源,pH6.0,以及1mlVishniac溶液(每升含有10gEDTA,4.4g ZnSO4·7H2O,1.0g MnCl2·4H2O,0.32g CoCl2·6H2O,0.32g CuSO4·5H2O,0.22g(NH4)6Mo7O24·4H2O,1.47g CaCl2·2H2O,1.0g FeSO4·7H2O,pH4.0),添加了2%葡萄糖,0.5%酵母抽提物,0.2%酪蛋白氨基酸(不含维生素),10mML-精氨酸,10μM烟酰胺,10mM尿苷)中接种NW205菌株(cspAl,pyrA6,nicAl,argB13)的孢子,30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。 使用B
Figure 10003_0
chner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体,并且用SP6(SP6:0.8%NaCl,10mM磷酸钠缓冲液,pH 6.0)洗涤几次。将150mg的Novozyme 234溶解在20ml SMC(SMC:1.33M山梨醇,50mM CaCl2,20mM MES缓冲液,pH 5.8)中,加入1g菌丝体(湿重)并且小心地悬浮。30℃下温和振荡培养悬浮液1-2小时,每隔30分钟将菌丝体小心地悬浮,取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×108)时,小心地悬浮这些原生质体并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000 rpm离心10分钟收集原生质体,将其小心地悬浮在5ml STC(STC:1.33M山梨醇,50mM CaCl2,10mM Tris/HCl,pH7.5)中。这一洗涤步骤重复两次,最后将原生质体以1×108/ml密度悬浮在STC中。 
通过以下步骤进行转化:将溶解在10-20μl的TE中的1μgpIM130DNA与50μl的PEG缓冲液(PEG缓冲液:25%PEG-6000,50mM CaCl2,10mM Tris/HCl,pH7.2)一起加入到200μl的原生质体悬浮液中,然后使用移液管抽吸几次轻轻地将上述液体混合,并在室温下温育20分钟。此后,加入2ml的PEG缓冲液,将溶液轻轻地混合并在室温下温育5分钟,接下来加入4ml的STC并在涡旋混合器中轻轻混合。使用5μg pIM130和1μg和5μg质粒pGW635DNA进行上述相同步骤。向原生质体中加入20μl TE作为阴性对照。 
然后将1ml的悬浮液加入到4ml渗透稳定的上层琼脂中,然后倒入含有MMS(以100mM D-葡萄糖或100mM D-木糖作为碳源)的平板中(轻轻旋转以用上层琼脂覆盖平板)。这些培养基(MMS)用0.8M KCl或1.33M山梨醇渗透稳定。 
为确定再生百分比,制备转化前的原生质体(未处理的原生质体,保存于冰上)和转化后的原生质体(从阴性对照获得)的系列稀释液。将100μl 10-3、10-4、10-5和10-6稀释液分别以双份涂布在补加10mM尿苷的MMS平板上。 
对于使用pGW635转化真菌的阳性对照,在所有平板上均发现菌落,而在KCl稳定的培养基上的转化率(1-10个转化子/μg质粒DNA)比在山梨醇稳定的培养基上的转化率(100-1000个转化子/μg质粒DNA)低许多,这是由于在后一培养基上的再生率非常高,约为90%,而在KCl稳定的培养基上的再生率为2-5%。 
在用质粒pIM130进行转化的情况下,在含D-木糖作为碳源的培养基上发现转化子,而在含D-葡萄糖的培养基上未发现转化子。在山梨醇稳定的培养基上的转化率为100个转化子/μg质粒DNA,而在KCl稳定的培养基上的转化率为少于1个转化子/μg质粒DNA。 
实施例3:转化子的分析 
通过将在实施例2中获得的pIM130转化子涂布在含有100mM D-葡萄糖、100mM D-葡萄糖/1%燕麦二粒小麦木聚糖(Sigma#X0627)和1%燕麦二粒小麦木聚糖的MM培养基上来分析其表型。筛选转化子影印到这些培养基上并在30℃保温。约75%的转化子在含木聚糖的培养基上生长,而在含D-葡萄糖的培养基上未发现生长。其余的25%的菌落在所测的三种培养基上均生长。 
用Southern分析对所选的具有期望表型(在含木聚糖培养基上生长,在含D-葡萄糖培养基上不生长)的5个转化子进行分析。基本上如de Graaff等人(1988)所述通过经修改的用于分离植物RNA的程序分离真菌DNA。收集在培养基中生长过夜的菌丝体,用冷盐 水洗涤,在液氮中冷冻并储存于-80℃。用微切机(Braun)破碎0.5g冷冻菌丝体分离核酸。得到的菌丝体粉末用新制备的抽提缓冲液抽提,抽提缓冲液如下制备:将1ml三异丙基萘磺酸(TNA)(20mg/m1)与1ml对氨基水杨酸(PAS)(120mg/ml)充分混合,加入0.5ml 5×RNB缓冲液(1升5×RNB含有121.10g Tris,73.04gNaCl和95.10gEGTA,pH8.5)。加入1.5ml苯酚后在55℃平衡抽提缓冲液10分钟,然后将热的缓冲液加入到菌丝体粉末中,用涡旋振荡器充分混合该悬浮液1分钟。加入1ml氯仿后再次混合悬浮液1分钟。用Sorvall高速离心机以104×g离心10分钟后用等体积苯酚/氯仿(1∶1)再抽提水相一次,然后用氯仿抽提两次。用下述程序从水相中分离DNA:用2倍体积乙醇在室温立即从水相中沉淀DNA,随后用Sorvall高速离心机以104×g离心10分钟收集DNA,通过将DNA重溶于无菌蒸馏水并用乙醇沉淀而洗二次,通过向终溶液中加入RNA酶(20μg/ml)而除去RNA。 
如上所述用HpaI(Life Technologies)根据厂商指导消化从野生型黑曲霉N402(cspA1)和5个pIM130转化子分离的高分子量DNA(1-2μg),得到的片段通过琼脂糖凝胶电泳分离,并如Maniatis等人(1982)所述转移至High-bond N膜。根据下述程序(Sambrook等人),用如Sambrook等人(1989)所述制备的含黑曲霉pyrA基因的32P标记的3.8kb XbaI片段作为探针进行杂交:于68℃在6×SSC(每1000ml20×SSC含有175.3g NaCl,107.1g柠檬酸钠·5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt’s溶液(每500ml 100×Denhardt’s溶液含有10g Ficoll-400,10g聚丙烯吡咯烷酮,10g牛血清白蛋白(Pentax Fraction V))和20μg/ml变性 鲱精DNA中预杂交3-5小时,并在含变性放射性标记探针的相同缓冲液中于68℃杂交15-18小时,随后在3×SSC,0.1%SDS中于68℃洗两次,在0.2×SSC,0.1%SDS中于68℃洗两次。用Saran包裹纸覆盖膜,用Konica X光胶片和带常规增感屏的Kodak X-Omatic暗盒在-70℃放射自显影过夜。 
结果发现在N402泳道中有一10kb杂交带,而在转化子NW205∷130#1,NW205∷130#2和NW205∷130#3中没有这一杂交带。在转化子NW205∷130#1和NW205∷130#3中发现一15kb杂交片段,而在NW205∷130#2中发现一20kb带。这些结果分别对应于在同源pyrA基因座上的单拷贝和双拷贝整合。在转化子NW205∷130#4和NW205∷130#5中,质粒在非同源基因座上整合。选择转化子NW205∷130#2进行诱变。 
pIM130的UAS片段包括阳性调节物所需的结合位点以显示UAS的刺激活性,因此在包括pIM130的宿主细胞中对xlnR的抑制将导致存在于pIM130上的双向标记不表达。xlnR的表达由木聚糖或木糖诱导,因此如果宿主具有xlnR则这些底物的存在应导致pIM130的双向标记的表达。 
pIM130的UAS片段不包括存在于黑曲霉xlnA基因的天然UAS上的creA的抑制活性所需的位点,因此葡萄糖的存在赋予黑曲霉CREA+,随后抑制xlnA和其它木聚糖裂解酶编码基因如xlnD和axeA的UAS,并且抑制编码上述木聚糖裂解酶编码基因的UAS激活物的xlnR基因,即阻遏木聚糖裂解酶的表达,导致pIM130不表达。 
实施例4:突变体的筛选 
实施例4.1:去阻遏突变体的筛选 
在以高频率振荡的5ml ST(ST:0.8%NaCl,0.05%Tween 20)中收集NW205∷130#2的孢子,并通过在无菌玻璃棉塞中过滤除去菌丝体碎片。通过在台式离心机中于室温以3000rpm离心10分钟收集孢子,重悬于5ml盐水中,这一洗涤步骤重复两次并将孢子以1×107 个/ml的密度最终重悬于盐水中。将10ml孢子悬液移至玻璃皿中用紫外线以18erg/mm2/min的剂量照射2分钟,诱变后将105和106个孢子涂布于含3%D-葡萄糖的MM+10mM L-精氨酸+10μM烟酰胺平板上(每种10个平板)和含3%D-葡萄糖/3%燕麦二粒小麦木聚糖(Sigma#XO627)的平板上。 
4-7天后在每个平板(接种106个孢子的平板)上发现5-10个突变菌落,根据其形态学可以将这些突变菌落分为三类:孢子形成完全的大菌落,孢子形成完全的中等大小菌落,孢子形成能力差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体,发现突变体能在含D-葡萄糖的培养基、含D-葡萄糖/木聚糖的培养基和含木聚糖的培养基上生长,而亲本菌株NW205∷130#2仅能在含木聚糖作为碳源的培养基上生长。另外在不同的生色底物上测试了这些突变体:4-甲基伞形花内酯基(methylumbelliferyl)-β-D-木糖苷(β-木糖苷酶,内切木聚糖酶)(Sigma#M7008)、4-甲基伞形花内酯乙酸酯(乙酰木聚糖酯酶)(Sigma#M0883)、4-甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷(阿拉伯呋喃糖苷酶)(Sigma#M9519)以及Remazol亮蓝修饰的木聚糖(内切木聚糖酶)(Sigma#M5019)。甲基伞形花内酯衍生物以1mM的终浓度加入到含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基中,而RBB-木聚糖以1mg/ml的浓度加入到含D-葡萄糖/ 木聚糖和木聚糖的培养基中。对于所有这些测试的底物,发现突变体在含D-葡萄糖的培养基上生长后具有酶活性,而在亲本菌株NW205∷pIM130#2中未发现表达。在含木聚糖的培养基上发现与NW205∷pIM130相比这些酶表达增加,在所有测试的突变体中5B具有最高的表达水平。在本例中筛选是在作为木聚糖裂解的抑制物有正常活性的底物即葡萄糖上进行的。为确定表达可在不存在阻遏的情况下发生,也包括了木聚糖裂解基因的诱导物木聚糖。这种对照试验优选地包括在本发明的方法中。突变体明显地显示去阻遏。 
为比较所产生的活性水平,将黑曲霉N402和突变体5B在含1.5%粗制小麦阿糖基木聚糖作为碳源的MM培养基上培养,在24、42、72和96小时取样测定α-L-阿拉伯呋喃糖苷酶、内切木聚糖酶和β-木糖苷酶的活性。结果(图2A、B、C)显示突变菌株的三种酶活性均增加,α-L-阿拉伯呋喃糖苷酶和内切木聚糖酶活性非常强地增加。 
实施例4.2:非表达突变体(non-expression mutant)的筛选 
收获菌株NW205∷130#2的孢子并如实施例4.1所述进行突变,随后涂布于含有100mM D-木糖、补加10mM尿苷、10mM L-精氨酸和0.8mg/ml 5-氟乳清酸(Sigma#F5013)的MM上,将这些平板在30℃保温4-7天。通过涂布在含有1%木聚糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上分析具有PYR-表型的64个生长菌落的木聚糖酶表达,在所测的这64个突变体中,有10个突变体在这些含木聚糖的平板上具有缩小的透明区,具有潜在的降低的木聚糖酶水平。在存在和不存在尿苷的含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基上证实了这些突变体的表型,所有10个突变体在不含尿苷的培养基上均不生长。 
为进行进一步的分析,将这些突变体在含50mM果糖+10mM尿 苷+10mM L-精氨酸+10μM烟酰胺的MM上于30℃预培养18小时,之后收获菌丝体并将1克湿菌丝体转移至含1%木聚糖的MM上以及转移至含10mM D-木糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上。在30℃培养5.5小时后收获菌丝体和培养物滤液,将培养物滤液对1mM NaPi pH5.6透析,之后测定木聚糖酶(Bailey等人,1991)和β-木糖苷酶活性(表1)。发现在这些所选的突变体中木聚糖酶和β-木糖苷酶的表达水平均大大降低。 
Figure G04112059920041014D000361
实施例5:非表达突变体的互补 
5.1构建黑曲霉基因组质粒文库 
为构建质粒文库,将如实施例3所述分离的10μg黑曲霉NW128(cspA1,nicA1,pyrA6,goxC17)的基因组DNA在100μl终体积中用3.5U Sau3A(Life Technologies)根据厂商指导于37℃部分消化30分钟,通过琼脂糖凝胶电泳分离片段后,从低熔点琼脂糖凝胶中切下6.7kb-9.4kb大小的片段,并如Sambrook等人(1989)所述进行分离。从总共6次消化中分离4μg片段,终浓度为100ng/μl。根据厂商指导将600ng得到的片段连接进100ng BamHI消化的pUC18(Pharmacia#27526201),连接后根据厂商指导用4μl连接混合物转化100μl E.coliDH5α Max Efficiency感受态细胞(Life Technologies,#18258-012)。6个随后的转化实验得到约5×104个菌落,将这些菌落重悬于含100μg/ml氨苄青霉素的TY培养基(每100ml培养基含16克Select蛋白胨140(Life Technologies),10克NaCl和10克酵母提取物)并于37℃培养3小时,之后分离质粒DNA并通过CsCl离心纯化。 
5.2非表达突变体的互补 
为了在非表达突变体中的互补,制备三种突变体NW205∷130Ac1-4,NW205∷130 Ac1-15,NW205∷130 Ac4-4的原生质体并如实施例2所述进行转化。在这些转化实验中使用108个原生质体并与下述物质混合:如实施例5.1所述的20μg黑曲霉质粒文库的DNA,10μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA(Gems andClutterbuck,1993),20μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA,使用2μg pGW635作为阳性对照。转化程序后将 混合物涂布于含50mM D-木糖作为碳源并补加10μM烟酰胺和10mM L-精氨酸的用1.33M山梨醇的MM上,约4天后在阳性对照平板上出现菌落并计数,而6天后可以从互补平板上挑取菌落。 
通过将得到的转化子菌落涂布于含1%燕麦二粒小麦木聚糖、1mM 4-甲基伞形花内酯-β-D-木糖苷、10μM烟酰胺和10mM L-精氨酸的培养基上而进行分析。在30℃培养6-7天后检测到荧光菌落,2-3天后这些菌落周围出现木聚糖透明区。 
实施例6:黑曲霉xlnR基因的克隆 
实施例6.1:黑曲霉xlnR基因的分离 
黑曲霉xlnR基因是从如实施例5.2所述获得并筛选的转化子中分离。如de Graaff等人(1988)所述从得自NW205∷130 Ac1-4,NW205∷130 Ac1-15,NW205∷130 Ac4-4的13个转化子中分离总DNA。在针对pyrA的选择性(即诱导)条件下培养菌丝体并在作为碳源的1.5%粗制小麦阿糖基木聚糖上木聚糖裂解表达后,用Nucleobond AX100柱(Macherey & Nagel)从其中分离独立复制的质粒。将溶于400μl无菌水中的200μg总DNA与2ml S1缓冲液(50mMTris-HCl pH8.0,10mM EDTA,100μg RNase A)、2ml S2(200mM NaOH,1%SDS)混合并在室温保温5分钟,然后与2ml S3(2.60M KAc,pH5.2)在冰上保温5分钟,在15000g离心30分钟澄清悬液后,根据厂商指导“纯化质粒和粘粒的方法”(5.3改进的碱/SDS裂解)进行质粒的吸附、洗涤、洗脱和沉淀。得到的质粒DNA溶于150μl无菌水中,用其中20μl转化大肠杆菌DH5α(Sambrook等人,1989)。将从每种质粒制备物中得到的12个大肠杆菌菌落在含50μg/ml氨苄青霉素的250ml LB培养基中于37℃培养9-12小 时后,根据Sambrook等人(1989)所述的煮沸裂解程序用1.5ml培养物进行质粒DNA微量制备分离,而细胞经离心沉淀储存于-20℃。HinDIII消化后用琼脂糖凝胶电泳分析这些DNA制备物,揭示有三类质粒,分别为pHELP1型质粒、基因组文库型质粒和大的复合型质粒。从含有后一类型质粒的菌落用250ml培养物冷冻沉淀进行大规模质粒分离,使用的是Nucleobond AX100柱,根据厂商提供的改进的碱/SDS裂解法(Macherey-Nagel)进行。分离得到A和B两种类型质粒,分别为互补子(complementant)A和B。用SalI,PstI,EcoRI,HinDIII消化这两种质粒,琼脂糖凝胶电泳后用变性的放射性标记的pHELP1、质粒A和质粒B经Southern分析得到的片段,实验以三份重复进行。结果显示质粒A和质粒B除pHELP部分外还共享相同的基因组区。根据使用pHELP1质粒发现的杂交信号之间的差异(显示载体和AMA1序列和质粒A和质粒B信号),鉴别和亚克隆与质粒A和质粒B杂交但不与pHELP1杂交的片段。发现质粒B的4kb EcoRI片段和6.5kb HinDIII片段以及质粒A的3kb PstI片段与质粒A和质粒B均杂交,将它们亚克隆进pGEM7/EcoRI,pGEM7/HinDIII和pBluescript/PstI,分别得到质粒pNP1、pNP2和pNP3。繁殖和纯化后将这些质粒用于实施例5.2所述的使用突变体NW205∷130 Ac4-4的互补实验,在这些实验中突变体不使用pHELP1而直接转化,在这些实验中含有6.5kb HinDIII片段的质粒pNP2能互补突变。对pN2衍生质粒的亚克隆和转化揭示亚克隆进pBluescript的5kb BamHI-XbaI片段(得到质粒pNP8)能互补菌株NW205∷130Ac4-4。 
实施例6.2:黑曲霉xlnR基因的亚克隆 
为了亚克隆xlnR基因,用pNP1的4kbEcoRI片段作为探针筛选 如Harmsen等(1990)的描述构建的黑曲霉基因组文库中的含xlnR区的噬菌体。如Maniatis等(1982)的描述,使用大肠杆菌LE392作为铺平板细菌将噬菌体在含0.7%琼脂糖的NZYCM顶层琼脂糖中以3×103pfu/平板接种在5个直径为85mm的NZYCM(1.5%琼脂)平板上。平板在37℃下过夜培养后,如Maniatis等(1982)的描述将平板转移到HybondN+滤膜(Amersham)上,每个平板重复两次。滤膜在3×SSC中浸湿后,室温下将此滤膜在3×SSC中洗涤60分钟。使用如Sambrook等(1989)描述的方法制备的32p标记的4kb EcoRI片段按照下列方法(Sambrook等,1989)进行杂交:68℃下在6×SSC(1000毫升20×SSC含有:175.3g NaCl,107.1g柠檬酸钠.5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt溶液(500毫升100×Denhardt溶液含有:10gFicoll-400,10g聚乙烯吡咯烷酮,10g牛血清清蛋白(Pentax组分V)),20μg/ml变性鲱精DNA中预杂交3-5小时;68℃下在相同的含有变性的标记探针的缓冲液中杂交15-18小时,然后68℃下在2×SSC,0.1%SDS中洗涤两次,0.2×SSC,0.1%SDS中洗涤两次。用Saran包装膜覆盖此膜,并在-70℃下使用Konica X-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。 
此筛选得到了大约12个阳性噬菌体,纯化了其中的8个。使用巴氏吸管从平板上挑取每一个阳性噬斑,并如Maniatis等(1982)的描述在含有20μl氯仿的1ml SM缓冲液中将所说的噬斑从琼脂填料中洗脱下来。使用影印滤膜通过重复上述的方法从包含50-100个分离噬菌体之噬斑的平板上纯化得到的噬菌体。 
纯化后,通过在NZYCM培养基上接种5×103个噬菌体来繁殖这些噬菌体。37℃下过夜培养后,得到铺满的平板,通过加入5毫 升SM缓冲液并将平板在4℃下间歇摇动贮存2小时来从平板中洗脱这些噬菌体。使用吸管收集上清液后,通过4℃下以4,000×g离心10分钟从此溶液中除去细菌。向上清液中加入0.3%氯仿,确定pfu数值。这些噬菌体原液(A-R/H-R)含有大约109pfu/ml。 
经Southern分析方法分析如Sambrook等(1989)描述的方法分离的5个选中的噬菌体A-R、B-R、C-R、E-R、F-R的DNA。37℃下在含有下列溶液的反应混合物中将DNA消化5小时:5μl(≈1μg)DNA溶液;2μl合适的10×反应缓冲液(Life Technologies);限制性内切酶10U(LifeTechnologies);无菌蒸馏水定容至20μl。65℃下将样品保温10分钟,在溶解在1×TAE缓冲液中上样到0.6%琼脂糖凝胶中之前,在冰上快速冷却。在25V下通过电泳15-18小时分离这些DNA片段。 
在电泳后,通过碱性真空印迹法(VacuGene XL,Pharmacia LKB)如VacuGene XL操作说明(pp.25-26)的描述将所说的DNA变性并转移到尼龙膜(Hpbond N,Amserham)上,接下来进行预杂交和使用变性的标记的质粒pNP8的5kb BamHI-XbaI片段杂交,杂交条件如上所述。在-70℃下通过使用增感屏在Kodak XAR-5 X-光胶片上曝光18小时获得杂交图式。在所有5个克隆中,发现了来源于同一个基因组区的片段,并构建了这些片段的限制图谱。 
以限制图谱为基础,筛选5kb BamHI-XbaI片段用于亚克隆。将100ng pBluescript BamHI-XbaI消化的片段与250ng的噬菌体B-R的5kb BamHI-XbaI片段混合,并向混合物中加入4μl 5×连接缓冲液(组成:500mM Tris-HCl,pH7.6;100mM MgCl2;10mM ATP;10mM二硫苏糖醇;25% PEG-6000)和1μl(1.2U/μl)T4 DNA连接酶(Life Technologies),混合物的最终体积为20μl。14℃下保温16小时后,用无菌水将混合物稀释到100μl。用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞(如Sambrook等(1989)的描述进行制备)。得到的6个克隆在含有100μg/ml氨苄青霉素的LB培养基(每1000毫升的LB培养基含有:10g胰酶化蛋白胨(BBL),5g酵母抽提物(BBL),10g NaCl,0.5mM Tris-HCl pH7.5)中过夜生长。通过如Maniatis等(1982)描述的煮沸裂解法从培养物中分离质粒DNA,在限制性分析中使用此质粒筛选含有所需要的质粒pIM230的克隆。从生长在含有100μg/ml氨苄青霉素的LB培养基中的500毫升包含pIM230的大肠杆菌DH5α培养物中大规模分离质粒DNA(Maniatis等,1982)。通过CsCl离心,乙醇沉淀纯化质粒,并溶解在400μl TE中。所得的产量大约为500μg。根据布达佩斯条约于1996年6月在真菌菌种保藏中心以保藏号CBS678.96保藏含有质粒pIM230的大肠杆菌。 
实施例6.3:黑曲霉xlnR cDNA的亚克隆 
为获得xlnR基因的锌指区部分的cDNA克隆,以类似于ZAPTM -cDNA合成试剂盒(Stratagene)中所述的方法,用起始自位置1476-1496(SEQ ID NO:9)的寡核苷酸在1μg来自培养在木聚糖上30小时的黑曲霉N402野生型菌株的polyA+RNA上进行反转录酶和第二条链合成反应。用第二条链反应的一部分样品(1/50)作为模板,利用引物RO26和RO25(从SEQ ID NO:9的946-970位衍生而来)进行PCR,依次为95℃、58℃和72℃各60秒,共35个循环,而后在72℃保温5分钟。将得到的500bp片段亚克隆到pGEM-T载体(Promega)中并测序。 
实施例7:xlnR基因的一级结构 
实施例7.1:xlnR基因的序列分析 
通过从pNP8和pIM230中亚克隆这些片段和使用特异性的寡核苷酸作为测序反应中的引物测定黑曲霉xlnR基因、它的启动子/调节区、基因的结构部分和终止区的序列。 
为分析核苷酸序列,分离出限制性片段,然后将其克隆到用适当的限制酶消化的pEMBL、pUC、pBluescript、pGEM DNA载体中。通过双脱氧核苷酸链终止法(Sanger等,1977)使用Pharmacia ALF express自动测序仪和Thermosequenase测序试剂盒(Amersham)测定核苷酸序列。在基因特异性寡核苷酸情况下,联合使用Pharmacia Cy5内部标记试剂盒和T7 DNA聚合酶测序试剂盒(Pharmacia)。根据厂商指导进行反应和电泳,用PC/GENE程序(Intelligenetics)进行计算机分析。在SEQ ID NO:9中给出了测定的序列。 
实施例7.2:xlnR基因的描述 
包含xlnR结构基因的序列(SEQ ID NO:9)的前端是一个947个核苷酸长的上游区。在上游非编码区发现富CT序列但未发现TATAA框。xlnR基因的结构部分从948到3690位,由两个内含子间断,1174-1237位的内含子已由测定如实施例6.2中所述的pIM230中的基因组片段和实施例6.3中所述的cDNA的一部分的序列所证实。第二个内含子在3496-3549位,该第二个内含子的序列符合正常在真菌中发现的保守内含子序列,用于剪接连接和套索序列。 
xlnR基因编码一种875个氨基酸的蛋白质。该衍生的多肽含有一典型的N-末端锌双核簇区,由1110-1260位核苷酸编码,其具有典型的与锌配位的6个半胱氨酸。在这一区域中还有几处与例如Kraulis等人(1992)(引入本文作参考)的图1列出的其它真菌调 控蛋白相似处。 
在2623-2649位发现一典型的RRRLWW基序,这一基序在几个双核锌簇调控蛋白中均有发现(但略有差异),如Suarez等人(1995)所注意到的。 
实施例7.3:黑曲霉突变体中的xlnR的序列分析 
为确定在如实施例4.2所述的不表达木聚糖裂解系统的黑曲霉突变体中的突变是否位于xlnR,测定这些突变体的xlnR基因的序列。为此,针对每种NW205∷130Ac突变体制备富含5.5kb BamHI xlnR片段的文库。为构建这种富含xlnR的文库,从每一菌株中分离用BamHI,HinDIII,XhoI,SstI和KpnI消化的基因组DNA的5.5kb片段,将这些片段与BamHI消化的去磷酸化pUC18载体(Ready-To-GoTM pUC18BamHI/BAP+连接酶,Pharmacia)混合并连接。根据厂商指导用连接混合物转化大肠杆菌DH5α(MAX Efficiency DH5αTM感受态细胞,Gibco-BRL),筛选Amp抗性菌落,得到5×102-103个菌落的初级文库。在主平板上复制初级文库后,根据标准程序(Sambrook等人,1989)用变性的放射性标记的pIM230的BamHI-XbaI插入片段作为探针通过菌落滤膜杂交筛选这些黑曲霉xlnR富集文库。 
对于每种突变菌株,用牙签从主平板上挑取阳性菌落,在含100μg/ml氨苄青霉素的5ml LB培养基中于37℃培养15-18小时,之后如Sambrook等人(1989)所述用煮沸裂解进行质粒DNA的微量制备分离。用琼脂糖凝胶电泳分析这些DNA制备物并将消化图谱与xlnR特异性图谱比较,揭示出菌落含有正确的5.5kb BamHI xlnR片段。如实施例7.2所述,用特异性xlnR寡核苷酸作为引物在测序反应中测定黑曲霉突变体的序列。对于突变体NW205∷130Ac 1-15, 在3479位测定有一单碱基对取代,导致SEQ ID NO:9中823位亮氨酸变为丝氨酸。对于突变体NW205∷130Ac2-5,在3655位测定有一单碱基对取代,导致SEQ ID NO:9中864位酪氨酸变为天冬氨酸。这些突变证实两个突变体均为xlnR突变体。 
实施例8:xlnR在黑曲霉中的表达 
实施例8.1:不表达木聚糖裂解系统的黑曲霉突变体的互补 
为了在所有非表达突变体中的互补,根据实施例2所述转化实施例4所述的所有10种NW205∷130Ac突变体,转化是将原生质体与作为转化率对照的pGW635和测试pIM230的互补能力的pIM230DNA进行合并。 
通过涂布于含1%燕麦二粒小麦木聚糖作为碳源的合适培养基上,分析得到的转化菌落的木聚糖裂解能力并与它们的亲本突变菌株比较,2-3天后在所有10种突变体的转化菌落周围有木聚糖透明区,但亲本突变菌株没有该透明区,因此显示木聚糖裂解能力的恢复。 
实施例9:xlnR基因的剂量对黑曲霉木聚糖裂解系统表达的作用 
为了研究xlnR基因在改进菌株增加木聚糖裂解表达方面潜在的应用,如实施例2所述使用19μg的包含xlnR的质粒pIM230和2μg包含构巢曲霉argB基因(Johnstone等,1985)的质粒pIM650在共转化实验中将含有多拷贝(大约6个)的编码β-木糖苷酶的黑曲霉xlnD基因的菌株N902∷200-18转化成精氨酸原养型。在含有1%燕麦二粒小麦木聚糖的MM平板中筛选获得的增加了内切木聚糖酶表达的转化子。选择4个水解圈形成最快最大的菌落确定xlnR拷贝数。为此, 分离这些转化子和受体菌株的DNA,并将系列稀释液点到Hybond N膜上。使用跨越xlnR基因的编码序列的标记的4.5kb SmaI/Xbal片段,从杂交后获得的信号计算拷贝数。基于与受体菌株比较,确定N902∷200-18-R14中的xlnR拷贝数为8,而N902∷200-18-R16中的拷贝数为32。对于这两种转化子,在菌株在液体培养基中生长后,通过Northern分析方法分析增加基因xlnR的剂量的效应。在1%果糖上预培养18小时后,在转移到2%燕麦二粒小麦木聚糖作为碳源的转移实验中进行此项分析。在转移后8和24小时取样(菌丝样品),使用TriZol(Life Technologies)按照厂商的说明从中分离总RNA,并经Northern印迹分析方法进行分析(Sambrook等,1989)。在这些转化子中,木聚糖酶B的表达水平相对于受体菌株明显增加,这一点是在通过使用标记的黑曲霉xlnB的1 kb EcoRI/XhoI片段杂交后确定的(Kinoshita等,1995)。 
为了进一步研究xlnR基因在改进菌株增加内切木聚糖酶表达方面潜在的应用,如实施例2所述根据下述策略转化黑曲霉:1、pGW635(pyrA)(阳性对照),2、pDB-K(XA),3、pDB-K(XA)+pIM230,4、pGW635+pIM230。质粒pDB-K(XA)含有在载体pEMBL18中的黑曲霉pyrA基因和来自塔宾曲霉的黑曲霉木聚糖酶A基因。获得所有使用条件的转化子,根据在燕麦二粒小麦木聚糖平板上的水解圈大小筛选过量表达内切木聚糖酶的菌株(测试了来自每组的20个转化子)。 
每组选一个转化子培养进行活性分析,将菌株在含果糖的培养基上预培养18小时,之后将菌丝体(50ml中有2.5g湿重菌丝体)转移到含1.4%粗阿糖基木聚糖的培养基,所有培养均在摇瓶中进行。 在30℃培养40小时,通过HPLC分析确定木聚糖酶A的水平,同时测定β-木糖苷酶和内切木聚糖酶活性。在标准Pharmacia-LKB HPLC装置(Uppsala,瑞典)中进行层析,以1.5ml/min运行SOURCE 15 Q.HR5/5柱,缓冲液A=20mM TRIS缓冲液,pH7.5,缓冲液B=含有1MNaCl的20mM TRIS缓冲液,pH7.5,在30分钟内缓冲液B梯度为0-50%,在280nm检测,Pharmacia-LKB UV-MII,吸收值为0.1-0.2,见图3。用1000μl20mM TRIS缓冲液,pH7.5稀释100μl培养物培养基,将1000μl稀释样品加到柱中,然后可见以约30%B缓冲液洗脱的峰代表木聚糖酶A的活性。图3中示出了每组转化子中在HPLC分析中显示最高木聚糖酶A活性/峰的一个菌株。内切木聚糖酶活性的测定是通过测定从来自Megazyme,Warriewood,澳大利亚的天青蛋白染色的交联小麦阿糖基木聚糖(Xylazyme片)释放的染色片段而进行。通过在40℃、0.1M乙酸盐缓冲液,pH3.4中与100XU/g(木聚糖酶单位)的内标酶比较而计算木聚糖酶活性。在仅有木聚糖酶A发挥内切木聚糖酶活性的pH条件下,在水不溶性阿糖基木聚糖上分析了相同的4个转化子,分析结果如表2所示。 
表2 
转化子 XU/g
pyr+(对照) 4
DB-K(XA)-15 52
DB-K(XA)/pIM230-21 111
pIM230-26 24
[0196] 从图3和表2所示的结果可清楚地看出用木聚糖酶A编码基因进行的转化如预期地大大增加了木聚糖酶A的酶活性,更令人吃惊的是,转化后使用激活基因xlnR也大大增加了木聚糖酶A的水平,这提示在未转化的亲本中存在对激活物XYL R(=xlnR基因产物)水平的限制。因此,预计在pDB-K(XA)多拷贝转化子中反式作用调控因子的量更加有限,这一点通过pDB-K(XA)/pIM230转化子的木聚糖酶A水平是pDB-K(XA)多拷贝转化子的两倍这一结果而证实。 
实施例10:筛选丝状真菌的xlnR基因 
为了分析是否可通过异源杂交从其它真菌分离xlnR对应物,使用xlnR基因的4.5kb SmaI/XbaI片段作为探针。从下述菌株中分离DNA:黑曲霉N902(argB15,cspA1,fwnA1,metB10,pyrA5),塔宾曲霉NW184(cspA1,fwnA1,pyrA22),保藏号为FGSC187的构巢曲霉WG096(pabaA1,yA2),保藏号为CBS101.43的A.aculeatus NW240(pyrA3),保藏号为CBS115.80的A.aculeatus NW217(fwnA1,cspA1,pyrA4,lysA1),保藏号为CBS115.52的A.foetidus(awamori)NW183(cspA1,fwnA1,pyrA13,lysA1),日本曲霉CBS114.51和Trichodermareesei QM9414。用BamHI或XhoI消化1-2μg DNA后如实施例3所述用Southern分析进行分析。所用杂交条件为:56℃下在6×SSC(1000毫升20×SSC含有:175.3g NaCl,107.1g柠檬酸钠.5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt溶液(500毫升100×Denhardt溶液含有:10g Ficoll-400,10g聚乙烯吡咯烷酮,10g牛血清清蛋白(Pentax组分V)),20μg/ml变性鲱精DNA中杂交18-24小时;然后68℃下在5×SSC,0.1% SDS中洗涤两次,每次30分钟,在56℃下在2×SSC,0.1% SDS中洗涤两次,每 次30分钟。杂交后用Saran包装膜覆盖此膜,并在-70℃下使用KonicaX-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。 
结果是在所有分析的真菌中均发现杂交片段,在黑曲霉、塔宾曲霉和臭曲霉中发现非常强的杂交信号,而在其它所研究的菌株中也发现了明显的杂交信号。 
实施例11:利用其它启动子片段的筛选系统的应用 
构建含有来自黑曲霉abfA基因(Flipphi等人,1994)和黑曲霉abfB基因(Flipphi等人,1993)的启动子片段的质粒。为了构建含abfA启动子片段的质粒,如实施例1所述将来自pIM900(Flipphi等人,1994)的1.4kb XhoI/PstI片段连接进SalI/PstI消化的pAlter(Promega)。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-83至-88位创建一XhoI限制位点(Flipphi等人,1994)。从得到的质粒分离953bp SstI/XhoI片段,将这一片段和来自pIM130的1.5kb XhoI片段连接进用SstI/XhoI消化的pBluescript(Stratagene)。通过用BglII消化鉴别含有正确方向的1.5kb XhoI片段的质粒,得到的质粒命名为pAP8。 
类似地从pIM991(Flipphi等人,1993)分离来自abfB启动子的910bp PstI片段并连接进PstI消化的pEMBL19,用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用BamHI消化鉴别含有正确方向的两个片段的质粒,得到的质粒命名为pIM132。 
含有来自黑曲霉pgaII的片段的第三个质粒的构建是将1450bpXbaI/XhoI片段克隆进载体pAler。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-107至-112位创建一XhoI限制位点(Bussink等人,1991)。从得到的质粒分离1.2kb XbaI/XhoI片段,将这一片段和来自pIMl30的1.5kb XhoI片段连接进用XbaI/XhoI消化的pBluescript(Stratagene)。通过用HinDIII消化鉴别含有正确方向的1.5kb XhoI片段的质粒,得到的质粒命名为pIIP7。从相同的pgaII基因分离来自223bp HinDIII/PstI片段(Bussink等人,1992)并连接进HinDIII/PstI消化的pEMBL19,用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用HinDIII消化鉴别含有正确方向的两个片段的质粒,得到的质粒命名为pHPII。 
通过如实施例2所述的转化将全部4个质粒导入黑曲霉NW219,在使用具有abf启动子片段的构建物(质粒AP8和pIM132)的转化实验中用10mM L-阿拉伯糖醇作为诱导物,在使用携带pgaII片段的质粒的转化实验中用1%聚半乳糖醛酸(USB化学品)作为诱导物。尽管发现质粒转化率很高,但是使用含pgaII启动子片段的质粒pIIP7和pHPII的转化实验仅分别发现5和7个转化子。 
如实施例3所述对从利用质粒pAP8和pIM132(abf启动子片段)的转化实验得到的转化子进行表型分析,使用的是含10mM L-阿拉伯糖醇/50mM山梨醇,10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mMD-葡萄糖的MM。在从质粒pAP8得到的29个转化子中的10个转化子中以及从质粒pIM132得到的30个转化子中的13个转化子中发现了预期表型,即在10mM L-阿拉伯糖醇/50mM山梨醇上生长,在10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mM D-葡萄糖上不生长。在含1%聚半乳糖醛酸,1%聚半乳糖醛酸/50mM D-葡萄糖和50mM D-葡萄糖的MM上测试了从质粒pIIP7和pHPII得到的转化子,然而所有转化子均不显示预期的表型,所有转化子在 三种培养基上均能生长,这提示这些转化子来自pyrA基因座的双交换。 
基于含pgaII启动子片段的质粒的结果,我们测试了通过增强诱导是否能提高转化频率。我们假定转化失败或多或少地由缺少诱导物所致,因为没有聚半乳糖醛酸酶的单体诱导物,因此需降解聚合物以释放诱导物,导致表达。我们测试了用少量uridin补加到培养基中是否能克服这一问题。为此,将NW219和转化子NW219∷pIM132#30在含有诱导abfB的1%燕麦二粒小麦木聚糖和分别为0、0.001、0.005、0.01、0.1、1、5和10mM的增加浓度的uridin的培养基上进行测试。在这一实验中,受体菌株NW219在含低于0.01mM uridin的培养基上不生长,而NW219∷pIM132#30转化菌株在所有条件下均生长,然而孢子形成程度和菌落形态有变化,给出类似野生型孢子形成程度的最低uridin浓度约为0.01mM uridin。 
基于这些结果,用质粒pIIP7和pHPII重复对黑曲霉NW219的转化,使用的培养基是含有1%柠檬果胶(酯化度45%)(CopenhagenPectin factory)以及分别补加0.01mM和0.005mM uridin的实施例2所述的MMS培养基。这导致转化子数增加,将这些转化子在含如上所述的1%柠檬果胶、1%柠檬果胶/50mM D-葡萄糖和50mM D-葡萄糖的培养基上进行测试,预期表型分别为生长、不生长和不生长。30个pIIP7转化子中有10个转化子以及30个pHPII转化子中有9个转化子具有预期表型。 
通过Southern分析法分析具有预期表型的转化子,如实施例3所述分离DNA并分析。对于从含abfA启动子片段的质粒pAP8产生的转化子,用ClaI消化DNA,对于从pIM132(abfB)质粒产生的转化子 用ClaI消化DNA,对于从pgaII质粒pIIP7和pHPII产生的转化子用ClaI消化DNA。基于用下述放射性标记的片段的杂交获得的放射自显影图,根据预期拷贝数筛选转化子,所述的标记片段为pyrA基因的3.8kb XbaI和1.2kb ClaI片段。选定了下述转化子:AP8/16(abfA),NW219∷132#8(2拷贝)和NW219∷132#30(3-4拷贝)(abfB),NW219∷pIIP7#3(2拷贝)和NW219∷pIIP7#9(2拷贝)(pgaII)。 
将选定的转化子如实施例4所述进行诱变,在MM+50mM D-葡萄糖和MM+10mM L-阿拉伯糖醇/50mM D-葡萄糖上筛选阿拉伯呋喃糖苷酶去阻遏突变体,而在MM+50mM D-葡萄糖和MM+1%柠檬果胶/50mM D-葡萄糖上筛选聚半乳糖醛酸酶去阻遏突变体。4-7天后在每个平板上分析5-10个突变体菌落,基于这些菌落的形态学可将其分为三类:孢子形成完全的大菌落,孢子形成完全的中等大小菌落和孢子形成差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体,发现阿拉伯呋喃糖苷酶突变体菌落能在含D-葡萄糖的培养基、含D-葡萄糖/L-阿拉伯糖醇的培养基和含L-阿拉伯糖醇的培养基上生长,而亲本菌株仅能在含L-阿拉伯糖醇作为碳源的培养基上生长。类似地,聚半乳糖醛酸酶突变体也能在MM+50mM D-葡萄糖和MM+1%柠檬果胶/50mMD-葡萄糖和MM+1%柠檬果胶上生长,而亲本菌株仅能在MM+1%柠檬果胶上生长。另外如实施例4所述在生色底物甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷上测试了阿拉伯呋喃糖苷酶突变体(每种20个)。尽管通过底物荧光检测到亲本菌株在含D-葡萄糖/L-阿拉伯糖醇培养基上不表达阿拉伯呋喃糖苷酶,但是突变体具有不同水平的表达,在D-葡萄糖培养基上选择的突变 体中发现了最高水平。 
在MM+1%柠檬果胶/50mM D-葡萄糖上测试聚半乳糖醛酸酶突变体,接种平板2-3天后通过如Ried and Collmer(1985)所述染色而使聚半乳糖醛酸酶活性肉眼可见。在亲本菌株情况下发现了小水解圈,而在突变体中检测到各种程度的水解圈形成的增大。 
根据实施例4,在含FOA的培养基上还筛选了非表达突变体,为此,将NW219∷132#30(abfB)进行突变并涂布在MM+10mM L-阿拉伯糖醇+1mg/ml FOA+10mM uridin上。7-10天后选择突变体并涂布在含10mM L-阿拉伯糖醇/50mM山梨醇、10mM uridin并具有用于检测内切arabinan表达的含0.5%AZCL-阿拉伯聚糖(Megazyme,Sydney,澳大利亚)的顶层琼脂的MM上。所检测的30个转化子中的2个即132/30 F12和F26不能从底物释放染料,指示缺乏内切arabinan活性。在含10mM L-阿拉伯糖醇和10mM uridin的液体MM中培养这些转化子,随后在培养物滤液中测量阿拉伯呋喃糖苷酶活性,发现活性降低至少4倍。 
将NW219∷pIIP7#3进行突变并涂布在含1%柠檬果胶/50mM山梨醇、10mM uridin和1mg/ml FOA的MM上。培养6-10天后挑选突变体并如上所述筛选聚半乳糖醛酸酶活性。在所选65个突变体中有3个突变体在聚半乳糖醛酸酶活性染色后有降低的水解圈形成,提示聚半乳糖醛酸酶表达降低。 
EP95201707.7是共同未决的欧洲专利申请,本文在此将该申请的实施例7、8和11附上。 
EP95201707.7的实施例7:使用质粒pIM200转化黑曲霉 
以1×106个孢子/ml在250ml由MM组成的培养基(添加了2% 葡萄糖,0.5%酵母抽提物,0.2%酪蛋白氨基酸(不含维生素),2mM亮氨酸,10μM烟酰胺,10mM尿苷)中接种NW155菌株(cspAl,argB13,pyrA6,nicA1,leuA1,prtF28)(来源于NW228,Van den Hombergh等,1995)的孢子,30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。使用B
Figure 10003_1
chner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体,并且用SP6(SP6:0.8%NaCl,10mM磷酸钠缓冲液,pH 6.0)洗涤几次。将150ml的Novozyme 234溶解在已加入1g菌丝体(湿重)的20ml SMC(SMC:1.33M山梨醇,50mM CaCl2,20mM EMS缓冲液,pH5.8)中,并且小心地悬浮。30℃下用温和振荡器培养悬浮液1-2小时,每隔30分钟将菌丝体小心地悬浮,取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×108)时,小心地悬浮并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000rpm离心10分钟收集菌丝体,除去上清液,将沉淀物小心地悬浮在5ml STC(STC:1.33M山梨醇,50mM CaCl2,10mM Tris/HCl,pH 7.2)中。洗涤步骤重复两次,最后将原生质体以1×108/ml密度悬浮在STC中。 
通过以下步骤进行转化:将20μg的pIM200 DNA和含有黑曲霉pyrA基因的5μg pGW635(溶解在10-20μl的TE中)与5μl的PEG缓冲液(PEG缓冲液:25%PEG-6000,50mM CaCl2,10mM Tris/HCl,pH7.2)一起加入到200μl的原生质体悬浮液中,然后使用移液管上下移动多次慢慢地将上述液体混合,并在室温下温育20分钟。此后,加入2μl的PEG缓冲液,将溶液慢慢混合并在室温下温育5分钟,接下来加入4ml的STC并在涡旋混合器中慢慢混合。然后将1ml的悬浮液加入到4ml含有0.95M蔗糖渗透稳定的优质琼脂中,然后倒 入渗透稳定的平板中。另外使用pGW635转化黑曲霉作为对照。 
EP95201707.7的实施例8:转化子的分析 
通过将在实施例7中获得的pIM200转化子接种在含有1%燕麦二粒小麦木聚糖和1mM 4-甲基伞形花内酯基-β-木糖苷的MM培养基上来分析其表型。检验了26个转化子,其中5个显示出增加了的荧光。将这些转化子和转化子PYR+(作为参考)一起培养在含有1%燕麦二粒小麦木聚糖的MM上,培养20、27和42小时。此后测量β-木糖苷酶对PNP-X的活性。结果列于表C中。 
在全部5个选择的转化子中都发现了β-木糖苷酶活性水平的增加,最高水平比野生活性多30多倍。使用如EP95201707.7的实施例3中的描述制备的抗β-木糖苷酶的抗体通过Western印迹和使用Bio-Rad免疫印迹GAR-AP测定试剂盒按照供应商的说明证实了这些结果。 
                     表C 
在下述保温时间后的黑曲霉转化子的β-木糖苷酶活性 
              (mU/ml培养物滤液) 
Figure G04112059920041014D000551
EP95201707.7的实施例11:黑曲霉xlnD基因的破坏 
实施例11.1:破坏(disruption)质粒pIM203和pIM204的构建 
通过经PCR产生xlnD基因的内部片段来构建此基因的破坏质粒pIM203和plM204。使用衍生于xlnD序列(SEQ ID NO:1)的寡核苷酸产生所说的片段。xylos001是从1157至1176的位置上产生的,xylos004是从3147至3164位置上产生的。通过包含10μl 10×反应缓冲液(100mM Tris-HCl,pH 8.3,500mM KCl,15mM MgCl2,0.01%明胶),4种脱氧核苷三磷酸各16μl 1.25mM,1ng质粒pIM200 DNA,每种寡核苷酸各1μg(定容到100μl)的PCR产生此片段。混合反应混合物,并加入1μlTAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃下温育3分钟使此DNA变性,接下来进行25个循环(92℃,1分钟;52℃,1.5分钟;72℃,1.5分钟)。25个循环后,将混合物在72℃下温育5分钟。经琼脂糖电泳的反应产物分析显示出一个大约2000bp的片段,基于此基因的序列,此片段的大小在预料之内。将所得的片段亚克隆到载体pGEM-T(Promega)中,形成质粒pIM202。在EcoRV/PstI消化的pIM202载体中通过连接pILJ16的SmaI/PstI片段(Johnstone等,1985)(包含构巢曲霉的argB基因(Upshall等,1986))构建质粒pIM203。在SpeI/NsiI消化的pIM202载体中通过连接pIM130(EP 95202346.3)的NsiI/XbaI片段(包含在塔宾曲霉xlnA启动子UAS控制之下的pyrA基因)构建质粒pIM204。 
实施例11.2:黑曲霉xlnD基因的破坏 
如实施例11.1中所述的包含xlnD内部片段和argB基因(pIM203)或pyrA基因(pIM201)的质粒作为在转化中的选择标记用于破坏黑曲霉xlnD基因。为此,如实施例7中所述,分别利用选择精氨酸或尿苷原养型的质粒pIM203和pIM204转化黑曲霉N902(argB15、cspA1、fwnA1、metB10、pyrA5)。如实施例8所述在1%木聚糖平 板上筛选得到的转化体对甲基伞形花内酯基-β-木糖苷的活性。在这两组转化体中筛选了20个转化体。生长24小时后,在这些转化体中每一组的MUX活性水平都有明显减少。选择的转化体的Southern分析表明pIM203转化体在同源的xlnD位点有多拷贝的整合。pIM204转化体在xlnD位点发生单一同源整合。如实施例8中所述的,分析这些转化体的PMP-X的活性表明β-木糖苷酶降低至少100倍。 
实施例11.3:xlnD基因的过量表达和失活对黑曲霉木聚糖裂解系统表达的作用 
为了确定xlnD表达对木聚糖裂解系统(spectrum)表达的作用效应,将黑曲霉N902、两个在N902中的xlnD多拷贝转化体、xlnD基因破坏菌株在液体培养基上培养。在1%果糖上预培养18小时后,转移到2%燕麦二粒小麦木聚糖或3%D-木糖作为碳源的培养基上培养。在培养物滤液中按照PNP-X活性测定方法确定β-木糖苷酶活性。在这两种碳源中,对于pIM200转化体能够发现明显的过量表达,而对于两种(pIM203和pIM204)失活转化体几乎没有PNP-X活性。xlnD基因破坏转化体表明最初内切木聚糖酶表达水平降低,然而在16小时后其活性最终增加,结果相对于黑曲霉野生型其活性增加,因此,所形成的木聚糖制剂中不含β-木糖苷酶。 
接下来使用Dionex系统和脉冲Amperometric检测通过HPLC分析方法分析培养物滤液。为此,收获后立即煮沸1ml培养物滤液,以便失活木聚糖裂解酶,然后将样品离心10分钟(14,000rpm,4℃,Eppendorf离心机)。将得到的上清液用bidest稀释5倍,使用DionexCarbofac100柱通过HPLC分析20μl上清液。分析结果表明在野生 型和过量表达的转化体中仅在最初阶段能够在培养物滤液中检测到木糖寡聚物的存在。在破坏突变体中,在培养物滤液中积累木乙糖,而很少积累木丙糖,所以得到木寡聚物尤其是木乙糖和木丙糖的源。 
参考文献 
Andrianopoulos,A.和Hynes,M.J.(1988),分子细胞生物学8:3532-3541。 
Aviv,H.和Leder,P.(1972)美国科学院院刊11:1408-1412。 
Balance D.J.和Turner G.C.(1985)基因36:321-331。 
Bailey,A.M.等人(1991)核酸研究19:5273-4278。 
Bailey,A.M.,Biely.,P.和Poutanen,K.(1992)生物工程杂志23:257-270。 
Berka,R.M.,Ward,M.,Wilson,L.J.,Hayenga,K.J.,Kodama,K.H.,Carlomagno,L.P.和Tahompson,S.A.(1990),基因86:153-162。 
Bussink,H.J.D.,van den Hombergh.J.P.T.W.,van den IJssel,P.R.L.A.和Visser J.(1992),应用微生物学和生物工程37,324-329. 
Davies,R.W.(1991),曲霉属中的高水平重组蛋白生产系统的分子生物学,见Leong,S.A.和Berka,R.M.和Berka,R.M.编辑的《分子工业真菌学:用于丝状真菌的系统及应用》Marcel Dekker,Inc.,第45-82页。 
Ekwall,K.和Ruusla,T.(1991),核酸研究19:1150。 
Felenbok,B.和Sealy-Lewis H.M.(1994),见《曲霉50年》Martinelli,S.D.和Kinghorn,J.R.编辑,141-179页。 
Flipphi,M.J.A.,van den Heuvel,M.,van der Veen,P.,Visser,J.,和deGraaff,L.H.(1993)当今遗传学24:525-532。 
Flipphi,M.J.A.,Visser,J.,van der Veen,P.和de Graaff.L.H.(1994)微生物学140:2673-2682。 
Fowler,T.等人(1990),当今遗传学18:537-545。 
Gems D.H.和Clutterbuck A.J.(1993),当今遗传学24:520-524。 
Goosen T,Bloemheuvel G,Gysler C,Bie DA de,Broek HWJ vanden,SwartK(1987),当今遗传学11:499-503。 
Graaff LH de(1988)构巢曲霉和黑曲霉的丙酮酸激酶基因的结构和表达,PhD论文,Landbouw大学,Wageningen,荷兰。 
Graaff L.H.de,van den Broeck,H.C.,van Ooijen A.J.J.和Visser,J.(1994),分子微生物学12:479-490。 
Gwynne.D.I.,Buxton.F.P.,Gleeson,M.A.和Davies R.W.(1987),外源蛋白质从曲霉属各物种的基因工程分泌,见Burgess.R.编辑的《蛋白质纯化:微量至常量》Alan R.Liss,纽约,第355-365页。 
Harmsen,J.A.M.,Kusters-Van Someren,M.A.,Visser,J.(1990)当今遗传学18:161-166。 
c.f.Hinnen,A.等人(1995).见《在重组微生物中的基因表达》Smith,A.编辑,Marcel Dekker Inc.,纽约,121-193页。 
Hombergh van den,J.P.T.W.,van de Vodervoort,P.J.I.,van derHeijden,N.C.B.A.,和Visser,J.(1995),当今遗传学28:299-308。 
Johnstone,I.L.,Hughes,J.和Clutterbuck,A.J.(1985),EMBOJ.4:1307-1331。 
Katz,M.E.和Hynes,M.J.(1989),分子细胞生物学9:5696-5701。 
Kelly J.M.和Hynes M.J.(1985),EMBO J 4:475-479。 
Kelly,J.M.和Hynes,M.J.(1987),当今遗传学12:21-31。 
Kinoshita K.,Takano,M.,Koseki.T.,Ito.和Iwano,K.(1995),发酵 及生物工程杂志79,no5,422-428。 
Kraulis,P.F.,Raine,A.R.,Gadhavi,P.L.和Laue E.D.(1992)自然356:448-455。 
Maniatis,T.,Fritsch,E.F.和Sambrook,J.,(1982),《分子克隆实验手册》,冷泉港,纽约,冷泉港实验室出版社。 
Sambrook,J.,Fritsch,E.F.和Maniatis T.(1989),《分子克隆实验手册》第二版,冷泉港,纽约,冷泉港实验室出版社。 
Sanger,F.,Nickelsen,S.和Coulson A.R.(1977)美国科学院院刊74:5463-5467。 
Schutte,J.B.(1991),D-木糖和L-阿拉伯糖对家禽和猪的营养价值和生理作用,Datapress & Datavisions,Wageningen,第173页。 
Suarez,T.,Vieira de Queiroz,M.,Oestreicher,N.和Scazzocchio,C.(1995),EMBO J.14,no 7:1453-1467。 
a)Unkles,S.E.,等人(1989),基团78:157-166和 
b)Unkles,S.E.,等人(1989),分子及普通遗传学218:99-104。 
Verdodes,J.C.,Punt,P.J.,Schrinckx,J.M.,van Verseveld,H.W.,Stouthamer A.H.和van den Hondel,C.A.M.J.J.(1993),转基因研究2:84-92。 
Verdoes,J.C.,Punt,P.J.和van den Hondel C.A.M.J.J.(1995),应用微生物学及生物工程43:195-205。 
Verdoes,J.C.(1994),黑曲霉中的糖淀粉酶的过量产生的分子遗传学研究,论文,Vrije大学,阿姆斯特丹,荷兰。 
Vishniac,W.和Santer.M.(1957),细菌学综述21:195-213. 
Wilson,L.J.,Carmona,C.L.和Ward,M.(1988),核酸研究16:2389 
Whittington,H.,Kerry-Williams,S.,Bidgood,K.,Dodsworth,N.,Peberdy,J.,Dobson,M.,Hinchcliffe,E.和Ballance.D.J(1990),当今遗传学18:531-536。 
                              序列表 
(1)一般信息: 
  (i)申请人: 
    (A)姓名:Agricultural University Wageningen 
    (B)街道:Costerweg 50 
    (C)城市:Wageningen 
    (E)国家:荷兰 
    (F)邮码:6701BH 
  (ii)发明名称:分离突变体及克隆互补基因的新方法 
  (iii)序列数:9 
  (iV)计算机可读形式: 
    (A)介质类型:软盘 
    (B)计算机:IBM PC兼容机 
    (C)操作系统:PC-DOS/MS-DOS 
    (D)软件:PatentIn Release #1.0,Version #1.25(EPO) 
(2)SEQ ID NO:1信息 
  (i)序列特征: 
    (A)长度:30个碱基对 
    (B)类型:核酸 
    (C)类型:单链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (xi)序列描述:SEQ ID NO:1: 
CACAATGCAT CCCCTTTATC CGCCTGCCGT                                 30 
(2)SEQ ID NO:2信息 
  (i)序列特征: 
    (A)长度:37个碱基对 
    (B)类型:核酸 
    (C)类型:单链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (xi)序列描述:SEQ ID NO:2: 
CAATTGCGAC TTGGAGGACA TGATGGGCAG ATGAGGG                         37 
(2)SEQ ID NO:3信息 
  (i)序列特征: 
    (A)长度:20个碱基对 
    (B)类型:核酸 
    (C)类型:单链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (xi)序列描述:SEQ ID NO:3: 
AGAGAGGATA TCGATGTGGG                                            20 
(2)SEQ ID NO:4信息 
  (i)序列特征: 
    (A)长度:37个碱基对 
    (B)类型:核酸 
    (C)类型:单链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (xi)序列描述:SEQ ID NO:4: 
CCCTCATCTG CCCATCATGT CCTCCAAGTC GCAATTG                         37 
(2)SEQ ID NO:5信息 
  (i)序列特征: 
    (A)长度:2054个碱基对 
    (B)类型:核酸 
    (C)类型:双链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (iii)假设:无 
  (iii)反义:否 
  (vi)最初来源: 
    (A)生物体:塔宾曲霉 
  (ix)特征: 
    (A)名称/关键:TATA_信号 
    (B)位置:848..854 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:950..1179 
  (ix)特征: 
    (A)名称/关键:内含子 
    (B)位置:1179..1228 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:1229..1631 
  (ix)特征: 
    (A)名称/关键:CDS 
    (B)位置:连接区(950..1179,1229..1631) 
    (D)其它信息:/EC_号=3.2.1.8 
         /产物=“1,4-β-木聚糖木聚糖水解酶” 
         /基因=″xlnA″ 
         /标准名称=″内切木聚糖酶″ 
  (ix)特征: 
    (A)名称/关键:成熟肽 
    (B)位置:1031..1631 
  (ix)特征: 
    (A)名称/关键:信号肽 
    (B)位置:950..1031 
  (xi)序列描述:SEQ ID NO:5: 
AACGTCTGCA GTCCCGTACT GTTTACCAAA ATGCCAGGCC ACTGGTGGAT ATACAACTTT             60 
GTAATACGTT GCCGGAGTCA GCCCCTACTC CCTGATGGGT TCCCACTCCC TAGTTACTTC            120 
CTACTGGGTA GTAGGCTCCT AGAGTGGGGT AAAGTTTGCC AAGGGTTTAG CCCCAGTCTT            180 
GTTTATGCTT GGCTAGGCAG GACCTGGGTA AGTTGATGGC TCCTGCATTC CTACCTGAGT            240 
ATTTCCAGCT ATAAGCGAGA TTTGCCATAC TCTTCAGCGA GTCCGGATGG TCCGCGCCGA            300 
GGTTGACCCT GCCTTCATCA CCTACACAAA GAACTCCTCG GCCAACTCCC GGTGGCTTTC            360 
GAGCTCCAAA GTACCTTCGC GACCTTTGGC CAGTGTTTCT CGCAGCGTTT ACTGAGCCTA            420 
AGGCTTGCTA CAATAAATAA AGAGACATAA CCTTGCAGTA CATACGTCTT GTATGAGCGA            480 
GGAACTGTGT TCAGTAGTAG ATCAGTGGGT ACATAATCAT GAACATGACT TCTGAGCCAG            540 
AAAACCTTCT GCAGGCAACC GGTGAAGAAA CCCCACTTCC CCGCCTCCAC TAACTGCAGC            600 
CCCTTTATCC GCCTGCCCTC CATTTAGCCA AATGTAGTCC ATTTAGCCAA GTGCGGTCCA            660 
TTTAGCCAAG TCCAGTGCTT AGGTTGGTGG CTACACAGGA AACGGCCATG AATGTAGACA            720 
CAACTATAGA ACTGTCCCTA GAAATAGGCT CGAGGTTGTT AGAGCGTTTA AGGTGATGCG            780 
GCAAAATGCA TATGACTGAG TTGCTTCAAC GTGCAGGGGA AAGGGATAAA TAGTCTTTTT            840 
CGCAGAATAT AAATAGAGGT AGAGCGGGCT CGCAGCAATA TTGACCAGGA CAGGGCTTCT            900 
TTTCCAGTTG CATACATCCA TTCACAGCAT TCAGCTTTCT TCAATCATC  ATG AAG               955 
                                                       Met Lys 
                                                       -27 
GTC ACT GCG GCT TTT GCA GGT CTT TTG GTC ACG GCA TTC GCC GCT CCT             1003 
Val Thr Ala Ala Phe Ala Gly Leu Leu Val Thr Ala Phe Ala Ala Pro 
-25                 -20                 -15                 -10 
GCC CCA GAA CCT GAT CTG GTG TCG CGA AGT GCC GGT ATC AAC TAC GTG             1051 
Ala Pro Glu Pro Asp Leu Val Ser Arg Ser Ala Gly Ile Asn Tyr Val 
                 -5                   1               5 
CAA AAC TAC AAC GGC AAC CTT GGT GAT TTC ACC TAC GAC GAG AGT GCC        1099 
Gln Asn Tyr Asn Gly Asn Leu Gly Asp Phe Thr Tyr Asp Glu Ser Ala 
         10                  15                  20 
GGA ACA TTT TCC ATG TAC TGG GAA GAT GGA GTG AGC TCC GAC TTT GTC        1147 
Gly Thr Phe Ser Met Tyr Trp Glu Asp Gly Val Ser Ser Asp Phe Val 
     25                  30                  35 
GTT GGT CTG GGC TGG ACC ACT GGT TCT TCT  AA  GTGAGTGACT                1189 
Val Gly Leu Gly Trp Thr Thr Gly Ser Ser  Asn 
 40                  45                   50 
GTATTCTTTA ACCAAGGTCT AGGATCTAAC GTCTTTCAG C GCT ATC ACC TAC TCT       1244 
                                             Ala Ile Thr Tyr Ser 
                                                              55 
GCC GAA TAC AGC GCT TCT GGC TCC GCT TCG TAC CTC GCT GTG TAC GGC        1292 
Ala Glu Tyr Ser Ala Ser Gly Ser Ala Ser Tyr Leu Ala Val Tyr Gly 
                 60                  65                  70 
TGG GTC AAC TAT CCT CAA GCT GAG TAC TAC ATC GTC GAG GAT TAC GGT        1340 
Trp Val Asn Tyr Pro Gln Ala Glu Tyr Tyr Ile Val Glu Asp Tyr Gly 
             75                  80                  85 
GAT TAT AAC CCT TGC AGT TCG GCC ACA AGC CTT GGT ACC GTG TAC TCT        1388 
Asp Tyr Asn Pro Cys Ser Ser Ala Thr Ser Leu Gly Thr Val Tyr Ser 
         90                  95                 100 
GAT GGA AGC ACC TAC CAA GTC TGC ACC GAC ACT CGA ACA AAC GAA CCG        1436 
Asp Gly Ser Thr Tyr Gln Val Cys Thr Asp Thr Arg Thr Asn Glu Pro 
    105                 110                 115 
TCC ATC ACG GGA ACA AGC ACG TTC ACG CAG TAC TTC TCC GTT CGA GAG        1484 
Ser Ile Thr Gly Thr Ser Thr Phe Thr Gln Tyr Phe Ser Val Arg Glu 
120                 125                 130                 135 
AGC ACG CGC ACA TCT GGA ACG GTG ACT GTT GCC AAC CAT TTC AAC TTC        1532 
Ser Thr Arg Thr Ser Gly Thr Val Thr Val Ala Asn His Phe Asn Phe 
                140                 145                 150 
TGG GCG CAC CAT GGG TTC GGC AAT AGC GAC TTC AAT TAT CAG GTC GTG        1580 
Trp Ala His His Gly Phe Gly Asn Ser Asp Phe Asn Tyr Gln Val Val 
            155                 160                 165 
GCG GTG GAA GCA TGG AGC GGT GCT GGC AGC GCT AGT GTC ACA ATC TCT        1628 
Ala Val Glu Ala Trp Ser Gly Ala Gly Ser Ala Ser Val Thr Tle Ser 
        170                 175                 180 
TCT TGAGAGATTA GTGCCCTAGT AGTCGGAAGA TATCAACGCG GCAGTTTGCT             1681 
Ser 
CTCAGGTGGT GTGATGATCG GATCCGGTCT CTGGGGTTAC ATTGAGGCTG TATAAGTTGT      1741 
TGTGGGGCCG AGCTGTCAGC GGCTGCGTTT TCAGCTTGCA CAGATAATCA ACTCTCGTTT      1801 
TCTATCTCTT GCGTTTCCTC GCTGCTTATC CTATCCATAG ATAATTATTT TGCCCACTAC      1861 
CACAACTTGT TCGGTCGCAG TAGTCACTCC GAGCAAGGCA TTGGGAAATG GGGGATGCGG        1921 
GGTGCTGCGT ACCCTCTAAC CTAGGGCATT TTAAAGGATA TTTACCCTCC AGATATTCTA        1981 
TAGATACAGA CTTCTTAGGA CTGCGGGTAA TATAGAGAGC GAAATTTCTA CAGTTCGATG        2041 
CAGTTCAATG CGA                                                           2054 
(2)SEQ IDNO:6信息 
  (i)序列特征: 
    (A)长度:3026个碱基对 
    (B)类型:核酸 
    (C)类型:双链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (iii)假设:无 
  (iii)反义:否 
  (vi)最初来源: 
    (A)生物体:黑曲霉 
    (B)菌株:N400(CBS 120.49) 
  (ix)特征: 
    (A)名称/关键:TATA_信号 
    (B)位置:643..648 
  (ix)特征: 
    (A)名称/关键:CDS 
    (B)位置:724..2538 
    (D)其它信息:/EC_号=1.1.3.4 
         /产物=“葡萄糖氧化酶″ 
         /基因=″goxC″ 
  (ix)特征: 
    (A)名称/关键:成熟肽 
    (B)位置:790..2538 
  (ix)特征: 
    (A)名称/关键:信号肽 
    (B)位置:724..790 
  (xi)序列描述:SEQ ID NO:6: 
CTGCAGGTAC CTGAAGCCTG CCTAGTTTGA TCACCCTGAA ACCAGCACTG CCTGTCTTGA            60 
CCTTGGTGGT GAGTTTGCAC GTGGGCTGGC TGTTCAAATA AACTCTCCAA TTGACCCTCT           120 
CCCCGTGGAG AACACAGCAA ACACTATAGG CTTTCCATTG AGGGCATGAC GAGGACCCTA           180 
TGGTTTGTGC ACTTGGCGAG GGCTGACCGG AGCACGAATC GGGAAGGGCA GAACTCAGAA           240 
TTCGGTGTTC TCGGCATGCC GAAAGTCGGT ATCCCTTGGC GCCACGATGA TTTGCGTCCA     300 
GGATTCGTAT AGTTCCTCGT CCACGAGGCT GCCTACCGTC AGCGTGAGGC AGTGAGCTAA     360 
TATGGGGCCA ATAAGCCACT ACGAGGATGA CATGGCCTCT ACAGAACGAG AGACGCAGAG     420 
GATCAGGACG CCAATCCTGC GCTCCACCTG TCTAAGGATT CGCTTTTGGA CTATCCAGGG     480 
ATTATGGCTT CGGATTATTG TATTCGGGAT ACCGACGGCT GAGCACACGG AGGATGAGGT     540 
TCAGCTCACG GCCCCTATCA GTATGCATTA TGAGGATGGC TTCTTGGAAA GCAGAGGAAT     600 
TGGATTATCG AACAAGTTGG TTCTGGACCA TTGACTCGAG CGTATAAGTA ACCTCGTTCG     660 
GTCCTCCTGT CACCTTCTGA TCAGCAACCA GCCTTTCCTC TCTCATTCCC TCATCTGCCC     720 
ATC ATG CAG ACT CTC CTT GTG AGC TCG CTT GTG GTC TCC CTC GCT GCG       768 
    Met Gln Thr Leu Leu Val Ser Ser Leu Val Val Ser Leu Ala Ala 
    -22     -20                 -15                 -10 
GCC CTG CCA CAC TAC ATC AGG AGC AAT GGC ATT GAA GCC AGC CTC CTG       816 
Ala Leu Pro His Tyr Ile Arg Ser Asn Gly Ile Glu Ala Ser Leu Leu 
         -5                   1               5 
ACT GAT CCC AAG GAT GTC TCC GGC CGC ACG GTC GAC TAC ATC ATC GCT       864 
Thr Asp Pro Lys Asp Val Ser Gly Arg Thr Val Asp Tyr Ile Ile Ala 
 10                  15                  20                  25 
GGT GGA GGT CTG ACT GGA CTC ACC ACC GCT GCT CGT CTG ACG GAG AAC       912 
Gly Gly Gly Leu Thr Gly Leu Thr Thr Ala Ala Arg Leu Thr Glu Asn 
                 30                  35                  40 
CCC AAC ATC AGT GTG CTC GTC ATC GAA AGT GGC TCC TAC GAG TCG GAC       960 
Pro Asn Ile Ser Val Leu Val Ile Glu Ser Gly Ser Tyr Glu Ser Asp 
             45                  50                  55 
AGA GGT CCT ATC ATT GAG GAC CTG AAC GCC TAC GGC GAC ATC TTT GGC      1008 
Arg Gly Pro Ile Ile Glu Asp Leu Asn Ala Tyr Gly Asp Ile Phe Gly 
         60                  65                  70 
AGC AGT GTA GAC CAC GCC TAC GAG ACC GTG GAG CTC GCT ACC AAC AAT      1056 
Ser Ser Val Asp His Ala Tyr Glu Thr Val Glu Leu Ala Thr Asn Asn 
     75                  80                  85 
CAA ACC GCG CTG ATC CGC TCC GGA AAT GGT CTC GGT GGC TCT ACT CTA      1104 
Gln Thr Ala Leu Ile Arg Ser Gly Asn Gly Leu Gly Gly Ser Thr Leu 
 90                  95                 100                 105 
GTG AAT GGT GGC ACC TGG ACT CGC CCC CAC AAG GCA CAG GTT GAC TCT      1152 
Val Asn Gly Gly Thr Trp Thr Arg Pro His Lys Ala Gln Val Asp Ser 
                110                 115                 120 
TGG GAG ACT GTC TTT GGA AAT GAG GGC TGG AAC TGG GAG AAT GTG GCC      1200 
Trp Glu Thr Val Phe Gly Asn Glu Gly Trp Asn Trp Asp Asn Val Ala 
            125                 130                 135 
GCC TAC TCC CTC CAG GCT GAG CGT GCT CGC GCA CCA AAT GCC AAA CAG      1248 
Ala Tyr Ser Leu Gln Ala Glu Arg Ala Arg Ala Pro Asn Ala Lys Gln 
        140                 145                 150 
ATC GCT GCT GGC CAC TAC TTC AAC GCA TCC TGC CAT GGT GTT AAT GGT      1296 
Ile Ala Ala Gly His Tyr Phe Asn Ala Ser Cys His Gly Val Asn Gly 
    155                 160                 165 
ACT GTC CAT GCC GGA CCC CGC GAC ACC GGC GAT GAC TAT TCT CCC ATC      1344 
Thr Val His Ala Gly Pro Arg Asp Thr Gly Asp Asp Tyr Ser Pro Ile 
170                 175                 180                 185 
GTC AAG GCT CTC ATG AGC GCT GTC GAA GAC CGG GGG GTT CCC ACC AAG      1392 
Val Lys Ala Leu Met Ser Ala Val Glu Asp Arg Gly Val Pro Thr Lys 
                190                 195                 200 
AAA GAC TTC GGA TGC GGT GAC CCC CAT GGT GTG TCC ATG TTC CCC AAC      1440 
Lys Asp Phe Gly Cys Gly Asp Pro His Gly Val Ser Met Phe Pro Asn 
            205                 210                 215 
ACC TTG CAC GAA GAC CAA GTG CGC TCC GAT GCC GCT CGC GAA TGG CTA      1488 
Thr Leu His Glu Asp Gln Val Arg Ser Asp Ala Ala Arg Glu Trp Leu 
        220                 225                 230 
CTT CCC AAC TAC CAA CGT CCC AAC CTG CAA GTC CTG ACC GGA CAG TAT      1536 
Leu Pro Asn Tyr Gln Arg Pro Asn Leu Gln Val Leu Thr Gly Gln Tyr 
    235                 240                 245 
GTT GGT AAG GTG CTC CTT AGC CAG AAC GGC ACC ACC CCT CGT GCC GTT      1584 
Val Gly Lys Val Leu Leu Ser Gln Asn Gly Thr Thr Pro Arg Ala Val 
250                 255                 260                 265 
GGC GTG GAA TTC GGC ACC CAC AAG GGC AAC ACC CAC AAC GTT TAC GCT      1632 
Gly Val Glu Phe Gly Thr His Lys Gly Asn Thr His Asn Val Tyr Ala 
                270                 275                 280 
AAG CAC GAG GTC CTC CTG GCC GCG GGC TCC GCT GTC TCT CCC ACA ATC      1680 
Lys His Glu Val Leu Leu Ala Ala Gly Ser Ala Val Ser Pro Thr Ile 
            285                 290                 295 
CTC GAA TAT TCC GGT ATC GGA ATG AAG TCC ATC CTG GAG CCC CTT GGT      1728 
Leu Glu Tyr Ser Gly Ile Gly Met Lys Ser Ile Leu Glu Pro Leu Gly 
        300                 305                  310 
ATC GAC ACC GTC GTT GAC CTG CCC GTC GGC TTG AAC CTG CAG GAC CAG      1776 
Ile Asp Thr Val Val Asp Leu Pro Val Gly Leu Asn Leu Gln Asp Gln 
    315                 320                 325 
ACC ACC GCT ACC GTC CGC TCC CGC ATC ACC TCT GCT GGT GCA GGA CAG      1824 
Thr Thr Ala Thr Val Arg Ser Arg Ile Thr Ser Ala Gly Ala Gly Gln 
330                 335                 340                 345 
GGA CAG GCC GCT TGG TTC GCC ACC TTC AAC GAG ACC TTT GGT GAC TAT      1872 
Gly Gln Ala Ala Trp Phe Ala Thr Phe Asn Glu Thr Phe Gly Asp Tyr 
                350                 355                 360 
TCC GAA AAG GCA CAC GAG CTG CTC AAC ACC AAG CTG GAG CAG TGG GCC      1920 
Ser Glu Lys Ala His Glu Leu Leu Asn Thr Lys Leu Glu Gln Trp Ala 
            365                 370                 375 
GAA GAG GCC GTC GCC CGT GGC GGA TTC CAC AAC ACC ACC GCC TTG CTC      1968 
Glu Glu Ala Val Ala Arg Gly Gly Phe His Asn Thr Thr Ala Leu Leu 
        380                 385                 390 
ATC CAG TAC GAG AAC TAC CGC GAC TGG ATT GTC AAC CAC AAC GTC GCG      2016 
Ile Gln Tyr Glu Asn Tyr Arg Asp Trp Ile Val Asn His Asn Val Ala 
    395                 400                 405 
TAC TCG GAA CTC TTC CTC GAC ACT GCC GGA GTA GCC AGC TTC GAT GTG      2064 
Tyr Ser Glu Leu Phe Leu Asp Thr Ala Gly Val Ala Ser Phe Asp Val 
410                 415                 420                 425 
TGG GAC CTT CTG CCC TTC ACC CGA GGA TAC GTT CAC ATC CTC GAC AAG      2112 
Trp Asp Leu Leu Pro Phe Thr Arg Gly Tyr Val His Ile Leu Asp Lys 
                430                 435                 440 
GAC CCC TAC CTT CAC CAC TTC GCC TAC GAC CCT CAG TAC TTC CTC AAC      2160 
Asp Pro Tyr Leu His His Phe Ala Tyr Asp Pro Gln Tyr Phe Leu Asn 
            445                 450                 455 
GAG CTG GAC CTG CTC GGT CAG GCT GCC GCT ACT CAA CTG GCC CGC AAC      2208 
Glu Leu Asp Leu Leu Gly Gln Ala Ala Ala Thr Gln Leu Ala Arg Asn 
        460                 465                 470 
ATC TCC AAC TCC GGT GCC ATG CAG ACC TAC TTC GCT GGG GAG ACT ATC      2256 
Ile Ser Asn Ser Gly Ala Met Gln Thr Tyr Phe Ala Gly Glu Thr Ile 
    475                 480                 485 
CCC GGT GAT AAC CTC GCG TAT GAT GCC GAT TTG AGC GCC TGG ACT GAG      2304 
Pro Gly Asp Asn Leu Ala Tyr Asp Ala Asp Leu Ser Ala Trp Thr Glu 
490                 495                 500                 505 
TAC ATC CCG TAC CAC TTC CGT CCT AAC TAC CAT GGC GTG GGT ACT TGC      2352 
Tyr Ile Pro Tyr His Phe Arg Pro Asn Tyr His Gly Val Gly Thr Cys 
                510                 515                 520 
TCC ATG ATG CCG AAG GAG ATG GGC GGT GTT GTT GAT AAT GCT GCC CGT      2400 
Ser Met Met Pro Lys Glu Met Gly Gly Val Val Asp Asn Ala Ala Arg 
            525                 530                 535 
GTG TAT GGT GTG CAG GGA CTG CGT GTC ATT GAT GGT TCT ATT CCT CCT      2448 
Val Tyr Gly Val Gln Gly Leu Arg Val Ile Asp Gly Ser Ile Pro Pro 
        540                 545                 550 
ACG CAA ATG TCG TCC CAT GTC ATG ACG GTG TTC TAT GCC ATG GCG CTA      2496 
Thr Gln Met Ser Ser His Val Met Thr Val Phe Tyr Ala Met Ala Leu 
    555                 560                 565 
AAA ATT TCG GAT GCT ATC TTG GAA GAT TAT GCT TCC ATG CAG              2538 
Lys Ile Ser Asp Ala Ile Leu Glu Asp Tyr Ala Ser Met Gln 
570                 575                 580 
TGAGTGGTAT GATGGGGATA TGAGTGAGGA TATTAGGGGA TGGTACTTAG ATGCTGGGGA    2598 
GGTATAATCA TAGATTGGAT AGAATTGGTA GGTTACATAG ACAGGTTACA TGAATAGACG    2658 
TTCGTTATAT GTGAGCAGAC ATTACTACCA AACAAGGGCA TTGTTCAGTT AGTCGAACGA    2718 
TAGTCATATG TTTTGTACGG GAAGAAAGTT TCACTAATTA TTAAGCAAAC GGATCAGGGG    2778 
TTGCCAGCTA AAATACAATC ATCCGATGTT CTATTTTCTT CAAATTGATC GACCAGTCAG    2838 
TTAATGAATG CATGAGAGCA ACTCTGCGCA TCCTCTAGCT ATCTAGTCAA TAATAAGCAT    2898 
GTTGTTTAAG ATGAAACACC GCCATAGACA TATTCTGTTG CTGGTGAAGC AAGCCCTCGC    2958 
TAAATATGCT GATAACTTCC TATGCCAGTA GAATATTTTC CCACTCTGCT GCGCGCTCTC    3018 
AAAAGCTT                                                             3026 
(2)SEQ ID NO:7信息: 
  (i)序列特征: 
    (A)长度:1517个碱基对 
    (B)类型:核酸 
    (C)类型:双链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (iii)假设:无 
  (iii)反义:否 
  (vi)最初来源: 
    (A)生物体:黑曲霉 
    (B)菌株:L112 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:339..495 
  (ix)特征: 
    (A)名称/关键:内含子 
    (B)位置:496..563 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:564..1237 
  (ix)特征: 
    (A)名称/关键:CDS 
    (B)位置:连接区(339..495,564..1237) 
    (D)其它信息:/产物=“乳清苷-5’-磷酸脱羧酶” 
  (xi)序列描述:SEQ ID NO:7: 
GCAGGGAAAA ATACGAGCTC CAATGAACCT GGGTGTGGCA ACTTCAATGG AAAGGAACTG     60 
CCTTTGCAGG TGTGGCTGAA CCCCACGGTT CCGGTCGGAG GCGGCGAAAT CACCCGATGT     120 
GGCTGGTGCG TGGAGGGTCG CGATGATTTA CTGAGCTCCT CTTTTGCTCG ACATTGAATG     180 
TGCATTGTTC ACCTCATATA AGGGCCAGTC GCTGCTAAAT TATTCGGTAG TATTTGCGCA     240 
TCTCTGGATC TACCAATTAG GGCCTATCAG TCGAAACTCC AAGCTACTCA TATTGCACAA     300 
GCCTCTTTCA TCCCCGCATT AACCCCTCCA CCGACACC ATG TCC TCC AAG TCG         353 
                                          Met Ser Ser Lys Ser 
                                            1               5 
CAA TTG ACC TAC ACT GCC CGT GCC AGC AAG CAC CCC AAT GCT CTG GCC       401 
Gln Leu Thr Tyr Thr Ala Arg Ala Ser Lys His Pro Asn Ala Leu Ala 
                 10                  15                  20 
AAG CGG CTG TTC GAA ATT GCT GAG GCC AAG AAG ACC AAT GTG ACC GTC       449 
Lys Arg Leu Phe Glu Ile Ala Glu Ala Lys Lys Thr Asn Val Thr Val 
             25                  30                  35 
TCT GCC GAC GTT ACC ACC ACT AAG GAG CTA CTA GAT CTT GCT GAC  C        495 
Ser Ala Asp Val Thr Thr Thr Lys Glu Leu Lau Asp Leu Ala Asp 
         40                  45                  50 
GTAGGCCGAC CCGCCATTCT GCCTGTTTAT GCTGCATACA AACTTATTAA CGGTGATACC     555 
GGACTGAG  GT CTC GGT CCC TAC ATC GCC GTG ATC AAA ACC CAC ATC GAT      604 
         Arg Leu Gly Pro Tyr Ile Ala Val Ile Lys Thr His Ile Asp 
                  55                  60                  65 
ATC CTC TCT GAC TTC AGC GAC GAG ACC ATT GAG GGC CTC AAG GCT CTT       652 
Ile Leu Ser Asp Phe Ser Asp Glu Thr Ile Glu Gly Leu Lys Ala Leu 
             70                  75                  80 
GCG CAG AAG CAC AAC TTC CTC ATC TTC GAG GAC CGC AAA TTC ATC GAC       700 
Ala Gln Lys His Asn Phe Leu Ile Phe Glu Asp Arg Lys Phe Ile Asp 
         85                  90                  95 
ATT GGC AAC ACT GTC CAG AAG CAA TAC CAC CGT GGT ACC CTC CGC ATC       748 
Ile Gly Asn Thr Val Gln Lys Gln Tyr His Arg Gly Thr Leu Arg Ile 
    100                 105                 110 
TCA GAA TGG GCC CAT ATC ATC AAC TGC AGC ATC CTG CCT GGC GAG GGT       796 
Ser Glu Trp Ala His Ile Ile Asn Cys Ser Ile Leu Pro Gly Glu Gly 
115                 120                 125                 130 
ATC GTC GAG GCT CTC GCT CAG ACG GCG TCT GCA CCG GAC TTC TCC TAC       844 
Ile Val Glu Ala Leu Ala Gln Thr Ala Ser Ala Pro Asp Phe Ser Tyr 
                135                 140                 145 
GGC CCC GAA CGT GGT CTG TTG ATC TTG GCG GAA ATG ACC TCT AAG GGT       892 
Gly Pro Glu Arg Gly Leu Leu Ile Leu Ala Glu Met Thr Ser Lys Gly 
            150                 155                 160 
TCC TTG GCC ACC GGC CAG TAC ACT ACT TCT TCG GTT GAT TAT GCC CGG       940 
Ser Leu Ala Thr Gly Gln Tyr Thr Thr Ser Ser Val Asp Tyr Ala Arg 
        165                 170                 175 
AAA TAC AAG AAC TTC GTC ATG GGA TTT GTG TCG ACC CGC TCG TTG GGT       988 
Lys Tyr Lys Asn Phe Val Met Gly Phe Val Ser Thr Arg Ser Leu Gly 
    180                 185                 190 
GAG GTG CAG TCG GAA GTC AGC TCT CCT TCG GAT GAG GAG GAC TTT GTG      1036 
Glu Val Gln Ser Glu Val Ser Ser Pro Ser Asp Glu Glu Asp Phe Val 
195                 200                 205                 210 
GTC TTC ACG ACT GGT GTG AAC ATT TCG TCC AAG GGA GAT AAG CTC GGY      1084 
Val Phe THr THr Gly Val Asn Ile Ser Ser Lys Gly Asp Lys Leu Gly 
                215                 220                 225 
CAG CAG TAC CAG ACT CCC GCA TCG GCT ATC GCT CGG GGT GCT GAC TTC      1132 
Gln Gln Tyr Gln THr Pro Ala Ser Ala Ile Gly Arg Gly Ala Asp Phe 
            230                 235                 240 
ATT ATC GCG GGT CGC GGT ATC TAC GCC GCG CCG GAC CCG GTG CAG GCT      1180 
Ile Ile Ala Gly Arg Gly Tle Tyr Ala Ala Pro Asp Pro Val Gln Ala 
        245                 250                 255 
GCG CAA CAG TAC CAG AAG GAA GGT TGG GAG GCG TAC CTG GCC CGT GTC      1228 
Ala Gln Gln Tyr Gln Lys Glu Gly Trp Glu Ala Tyr Leu Ala Arg Val 
    260                 265                 270 
GGC GGA AAC TAATACTATA AAATGAGGAA AAAAGTTTTG ATGGTTATGA              1277 
Gly Gly Asn 
275 
ATGATATAGA AATGCAACTT GCCGCTACGA TACGCATACA AACTAATGTC GAGCACGGGT    1337 
AGTCAGACTG CGGCATCGGA TGTCAAAACG GTATTGATCC TGCAGGCTAT TATAGGGTGG    1397 
CACGGGATTA ATGCGGTACG ACGATTTGAT GCAGATAAGC AGGCTGCGAA GTACTTAGTC    1457 
CTGTAACTCT TGCGTAGAGC AAATGGCGAC GGGTGGCTGA TAAGGGACGG TGATAAGCTT    1517 
(2)SEQ ID NO:8信息 
  (i)序列特征: 
    (A)长度:4108个碱基对 
    (B)类型:核酸 
    (C)类型:双链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (iii)假设:无 
  (iii)反义:否 
  (Vi)最初来源: 
    (A)生物体:黑曲霉(CBS l20.49) 
    (B)菌株:NWl47 
  (ix)特征: 
    (A)名称/关键:TATA_信号 
    (B)位置:787..794 
  (ix)特征: 
    (A)名称/关键:CDS 
    (B)位置:855..3266 
    (D)其它信息:/EC号=3.2.1.37 
         /产物=“1,4-β-D-木聚糖木聚糖水解酶″ 
         /基因=″xlnD″ 
         /标准名称=″β-木糖苷酶″ 
  (ix)特征: 
    (A)名称/关键:信号肽 
    (B)位置:855..932 
  (ix)特征: 
    (A)名称/关键:成熟肽 
    (B)位置:933..3266 
  (ix)特征: 
    (A)名称/关键:polyA_位点 
    (B)位置:3383 
  (ix)特征: 
    (A)名称/关键:polyA_位点 
    (B)位置:3404 
  (xi)序列描述:SEQ ID NO:8: 
CTGCAGGCCA TGTATCCTGC GAAGATGGGT GAGTGGAAGA AAATCGTCAA GATTGAGGCG      60 
GAGATGGCGA GGGCCGCGAT GAAGAAGGGT GGCTGGGCAC CGGAGAAGCC AGCCACCGCC     120 
ACGGCGGCGC AGATGAGTAT ACCGTATGCG GTGGCGTTGC AGGTTCTGGA TGGGGAGATT     180 
GTGCCGGGGC AGTTTGCGCC GGGCATGTTG AATCGGGAGG AGTTATGGGA TGTGATTAGG     240 
CTGGTGGAAT GTCGGGAGGC CAAGGAGCTG GATAATACGT GGGCGCAGAG GGTCAAGATC     300 
ACGTTTGAGG ATGGGGAGGT GGTGGAGAAG TTGTTGAAGG CTCCGAAGGG AGTCCATCCT     360 
GGGGTGACGA ATGAGGAGGT GTTGCAGAAG TGGCGGGCTG TGACGAAGGG GGTAATTTCG     420 
GAAGAGAGGC AGAAGAAGAT CGAGGAGATT GTGTTGAATT TGGAAGAGGT GGAGGATGTG     480 
GCTGGTGTTT TGGGCGAGTT GTTGAGGGAA GAGACGGTGA ATGTGCTGCA GTAGACGGTT     540 
ACCCCATTTG GACGGGGATG GCTTCATATT TCCCAAGCGA TGTCACGCCA TAGAAAGGGC     600 
ACATTTACCC GGTGCCTGAG CGAAACTCTA CTTCGAAGAC AATGCCAATG TTTAACTATC     660 
TTGTTTTAAT TGCTAAATGC AAACATTCCA GGTTCTTCCT AATGCCGGCT AAATCATTCA     720 
GGCTAAACCC CCGCGATGAA GTCAATCGGT CATTCTCCGG CGCATCTCCG CATCTCCGCA     780 
AACCGCTATA AAATCTACCC CAGATTCAGT CCCCGGCCAC CTTTCTATCC CCCCCCCCAC     840 
AGACTGGCTC AACC ATG GCG CAC TCA ATG TCT CGT CCC GTG GCT GCC ACT       890 
                Met Ala His Ser Met Ser Arg Pro Val Ala Ala Thr 
                -26 -25                 -20                 -15 
GCC GCT GCT CTG CTG GCT CTG GCT CTT CCT CAA GCT CTT GCC CAG GCC       938 
Ala Ala Ala Leu Leu Ala Leu Ala Leu Pro Gln Ala Leu Ala Gln Ala 
                -10                  -5                   1 
AAC ACC AGC TAC GTC GAC TAC AAC ATC GAA GCC AAC CCG GAC TTG TAT      986 
Asn Thr Ser Tyr Val Asp Tyr Asn Ile Glu Ala Asn Pro Asp Leu Tyr 
          5                  10                  15 
CCT TTG TGC ATA GAA ACC ATC CCA CTG AGC TTC CCC GAC TGC CAG AAT      1034 
Pro Leu Cys Ile Glu Thr Ile Pro Leu Ser Phe Pro Asp Cys Gln ASn 
     20                  25                  30 
GGT CCC CTG CGC AGC CAT CTC ATC TGT GAT GAA ACA GCC ACC CCC TAT      1082 
Gly Pro Leu Arg Ser His Leu Ile Cys Asp Glu Thr Ala Thr Pro Tyr 
 35                  40                  45                  50 
GAC CGA GCA GCA TCG CTC ATC TCG CTC TTC ACC CTG GAC GAG CTG ATC      1130 
Asp Arg Ala Ala Ser Leu Ile Ser Leu Phe Thr Leu Asp Glu Leu Ile 
                 55                  60                  65 
GCC AAC ACC GGC AAC ACC GGC CTC GGT GTC TCC CGA CTG GGC CTC CCT      1178 
Ala Asn Thr Gly Asn Thr Gly Leu Gly Val Ser Arg Leu Gly Leu Pro 
             70                  75                  80 
GCA TAC CAA GTA TGG AGT GAA GCT CTT CAC GGC CTC GAC CGT GCC AAT      1226 
Ala Tyr Gln Val Trp Ser Glu Ala Leu His Gly Leu Asp Arg Ala Asn 
         85                  90                  95 
TTC AGC GAC TCA GGA GCC TAC AAT TGG GCC ACC TCA TTC CCC CAG CCC      1274 
Phe Ser Asp Ser Gly Ala Tyr Asn Trp Ala Thr Ser Phe Pro Gln Pro 
    100                 105                 110 
ATC CTG ACC ACC GCG GCC CTC AAC CGC ACC CTC ATC CAC CAA ATC GCC      1322 
Ile Leu Thr Thr Ala Ala Leu Asn Arg Thr Leu Ile His Gln Ile Ala 
115                 120                 125                 130 
TCC ATC ATC TCT ACC CAA GGC CGC GCC TTC AAC AAC GCC GGC CGC TAC      1370 
Ser Ile Ile Ser Thr Gln Gly Arg Ala Phe Asn Asn Ala Gly Arg Tyr 
                135                 140                 145 
GGC CTC GAC GTC TAC GCC CCC AAC ATC AAC ACC TTC CGG CAC CCC GTC      1418 
Gly Leu Asp Val Tyr Ala Pro Asn Ile Asn Thr Phe Arg His Pro Val 
            150                 155                 160 
TGG GGT CGC GGA CAA GAA ACC CCA GGA GAG GAC GTC TCT CTC GCC GCC      1466 
Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu Asp Val Ser Leu Ala Ala 
        165                 170                 175 
GTC TAC GCC TAC GAA TAC ATC ACC GGC ATC CAG GGT CCC GAC CCA GAA      1514 
Val Tyr Ala Tyr Glu Tyr Ile Thr Gly Ile Gln Gly Pro Asp Pro Glu 
    180                 185                 190 
TCA AAC CTC AAA CTC GCC GCC ACG GCC AAG CAC TAC GCC GGC TAT GAC      1562 
Ser Asn Leu Lys Leu Ala Ala Thr Ala Lys His Tyr Ala Gly Tyr Asp 
195                 200                 205                 210 
ATC GAG AAC TGG CAC AAC CAC TCC CGC CTG GGC AAC GAC ATG AAC ATC      1610 
Ile Glu Asn Trp His Asn His Ser Arg Leu Gly Asn Asp Met Asn Ile 
                215                 220                 225 
ACC CAG CAA GAC CTC TCC GAA TAC TAC ACG CCC CAA TTC CAC GTC GCC      1658 
Thr Gln Gln Asp Leu Ser Glu Tyr Tyr Thr Pro Gln Phe His Val Ala 
            230                 235                 240 
GCC CGC GAC GGC AAA GTC CAG AGT GTC ATG TGC GCC TAC AAC GCC GTC      1706 
Ala Arg Asp Ala Lys Val Gln Ser Val Met Cys Ala Tyr Asn Ala Val 
        245                 250                 255 
AAC GGC GTC CCT GCC TGC GCC GAC TCC TAC TTC CTC CAG ACC CTC CTC      1754 
Asn Gly Val Pro Ala Cys Ala Asp Ser Tyr Phe Leu Gln Thr Leu Leu 
    260                 265                 270 
CGC GAC ACC TTC GGA TTT GTC GAC CAC GGA TAC GTC TCC AGC GAC TGC      1802 
Arg Asp Thr Phe Gly Phe Val Asp His Gly Tyr Val Ser Ser Asp Cys 
275                 280                 285                 290 
GAT GCC GCC TAT AAC ATC TAC AAC CCC CAC GGC TAT GCC TCC TCC CAG      1850 
Asp Ala Ala Tyr Asn Ile Tyr Asn Pro His Gly Tyr Ala Ser Ser Gln 
                295                 300                 305 
GCT GCC GCT GCC GCT GAG GCC ATC CTC GCC GGC ACC GAC ATC GAC TGC      1898 
Ala Ala Ala Ala Ala Glu Ala Ile Leu Ala Gly Thr Asp Ile Asp Cys 
            310                 315                 320 
GGT ACC ACC TAC CAA TGG CAC CTG AAC GAG TCC ATC GCT GCG GGA GAT      1946 
Gly Thr Thr Tyr Gln Trp His Leu Asn Glu Ser Ile Ala Ala Gly Asp 
        325                 330                 335 
CTC TCT CGC CAT GAT ATT GAG CAG GGT GTG ATT CGT CTC TAC ACG ACC      1994 
Leu Ser Arg Asp Asp Ile Glu Gln Gly Val Ile Arg Leu Tyr Thr Thr 
    340                 345                 350 
CTC GTG CAG GCC GGA TAC TTC GAC TCC AAC ACC ACA AAG GCG AAC AAC      2042 
Leu Val Gln Ala Gly Tyr Phe Asp Ser Asn Thr Thr Lys Ala Asn Asn 
355                 360                 365                 370 
CCC TAC CGC GAC CTC TCC TGG TCC GAC GTC CTT GAG ACG GAC GCA TGG      2090 
Pro Tyr Arg Asp Leu Ser Trp Ser Asp Val Leu Glu Thr Asp Ala Trp 
                375                 380                 385 
AAC ATC TCC TAC CAA GCC GCG ACG CAG GGC ATT GTC CTT CTC AAG AAC      2138 
Asn Ile Ser Tyr Gln Ala Ala Thr Gln Gly Ile Val Leu Leu Lys Asn 
            390                 395                 400 
TCC AAC AAC GTC CTC CCC CTC ACC GAG AAA GCT TAC CCA CCA TCC AAC      2186 
Ser Asn Asn Val Leu Pro Leu Thr Glu Lys Ala Tyr Pro Pro Ser Asn 
        405                 410                 415 
ACC ACC GTC GCC CTC ATC GGT CCC TGG GCC AAC GCC ACC ACC CAA CTC      2234 
Thr Thr Val Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Leu 
    420                 425                 430 
CTG GGC AAC TAC TAC GGC AAC GCT CCC TAC ATG ATC AGC CCC CGC GCC      2282 
Leu Gly Asn Tyr Tyr Gly Asn Ala Pro Tyr Met Ile Ser Pro Arg Ala 
435                 440                 445                 450 
GCC TTC GAA GAA GCC GGA TAC AAA GTC AAC TTC GCC GAG GGC ACC GGT      2330 
Ala Phe Glu Glu Ala Gly Tyr Lys Val Asn Phe Ala Glu Gly Thr Gly 
                455                 460                 465 
ATC TCC TCC ACA AGC ACC TCG GGC TTC GCT GCC GCC TTA TCC GCC GCA      2378 
Ile Ser Ser Thr Ser THr Ser Gly Phe Ala Ala Ala Leu Ser Ala Ala 
            470                 475                 480 
CAA TCC GCC GAC GTG ATA ATC TAC GCC GGT GGT ATC GAC AAT ACC CTT      2426 
Gln Ser Ala Asp Val Ile Ile Tyr Ala Gly Gly Ile Asp Asn Thr Leu 
        485                 490                 495 
GAA GGG GAG GCA CTG GAT CGA GAG AGT ATC GCG TGG CCG GGT AAC CAA      2474 
Glu Ala Glu Ala Leu Asp Arg Glu Ser Ile Ala Trp Pro Gly Asn Gln 
    500                 505                 510 
CTG GAC TTG ATC CAG AAG CTC GCC TCG GCG GCC GGA AAG AAG CCG CTC      2522 
Leu Asp Leu Ile Gln Lys Leu Ala Ser Ala Ala Gly Lys Lys Pro Leu 
515                 520                 525                 530 
ATC GTC CTC CAA ATG GGC GGC GGA CAG GTC GAT TCC TCT TCG CTC AAG      2570 
Ile Val Leu Gln Met Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys 
                535                 540                 545 
AAC AAC ACC AAT GTT TCT GCA CTT CTC TGG GGC GGA TAC CCC GGC CAA      2618 
Asn Asn Thr Asn Val Ser Ala Leu Leu Trp Gly Gly Tyr Pro Gly Gln 
            550                 555                 560 
TCT GGC GGC TTC GCT TTG CGG GAT ATC ATC ACG GGG AAG AAG AAC CCC      2666 
Ser Gly Gly Phe Ala Leu Arg Asp Ile Ile Thr Gly Lys Lys Asn Pro 
        565                 570                 575 
GCG GGT AGA CTA GTC ACG ACG CAG TAC CCT GCC AGC TAC GCG GAG GAG      2714 
Ala Gly Arg Leu Val Thr Thr Gln Tyr Pro Ala Ser Tyr Ala Glu Glu 
    580                 585                 590 
TTC CCG GCG ACA GAT ATG AAC CTT CGT CCT GAG GGT GAT AAC CCT GGT      2762 
Phe Pro Ala Thr Asp Met Asn Leu Arg Pro Glu Gly Asp Asn Pro Gly 
595                 600                 605                 610 
CAG ACG TAT AAA TGG TAC ACC GGC GAA GCC GTG TAG GAG TTC GGC CAC      2810 
Gln Thr Tyr Lys Trp Tyr Thr Gly Glu Ala Val Tyr Glu Phe Gly His 
                615                 620                 625 
GGG TTA TTC TAC ACG ACC TTC GCG GAA TCC TCC AGC AAT ACC ACT ACA      2858 
Gly Leu Phe Tyr Thr Thr Phe Ala Glu Ser Ser Ser Asn Thr Thr Thr 
            630                 635                 640 
AAG GAA GTT AAG CTC AAC ATC CAG GAC ATT CTT TCC CAG ACA CAC GAA      2906 
Lys Glu Val Lys Leu Asn Ile Gln Asp Ile Leu Ser Gln Thr His Glu 
        645                 650                 655 
GAC CTG GCG TCG ATT ACC GAG CTC CCT GTG CTG AAC TTC ACC GCC AAT      2954 
Asp Leu Ala Ser Ile Thr Gln Leu Pro Val Leu Asn Phe Thr Ala Asn 
    660                 665                 670 
ATC AGG AAC ACT GGA AAG CTG GAA TCG GAT TAC ACC GCT ATG GTA TTC      3002 
Ile Arg Asn Thr Gly Lys Leu Glu Ser Asp Tyr Thr Ala Met Val Phe 
675                 680                 685                 690 
GCC AAT ACC TCT GAT GCC GGG CCG GCG CCG TAT CCC AAG AAG TGG CTG      3050 
Ala Asn Thr Ser Asp Ala Gly Pro Ala Pro Tyr Pro Lys Lys Trp Leu 
                695                 700                 705 
GTC GGG TGG GAT CGG CTT GGG GAG GTG AAG GTC GGG GAG ACG AGG GAG      3098 
Val Gly Trp Asp Arg Leu Gly Glu Val Lys Val Gly Glu Thr Arg Glu 
            710                 715                 720 
TTG AGG GTC CCC GTT GAG GTG GGG AGC TTT GCG AGG GTG AAT GAG GAT      3146 
Leu Arg Val Pro Val Glu Val Gly Ser Phe Ala Arg Val Asn Glu Asp 
        725                 730                 735 
GGC GAT TGG GTG GTG TTT CCG GGA ACG TTT GAG TTG GCG TTG AAT TTG      3194 
Gly Asp Trp Val Val Phe Pro Gly Thr Phe Glu Leu Ala Leu Asn Leu 
    740                 745                 750 
GAG AGG AAG GTT CGG GTG AAG GTT GTT CTT GAG GGT GAG GAG GAA GTC      3242 
Glu Arg Lys Val Arg Val Lys Val Val Leu Glu Gly Glu Glu Glu Val 
755                 760                 765                 770 
GTG CTG AAG TGG CCG GGG AAG GAG TAGAAAATAC TATTCTGTTG ATGGCTCTAG     3296 
Val Leu Lys Trp Pro Gly Lys Glu 
                775 
GGGATGAGAG TCAGCCTATT ACTGGATATG CATAGTGGTG ATACGATGTA TATAGCTCTA    3356 
TGAAGTAATT AGTTCAAGTG GGAATACCCC TTTCACACAT ATAGTATGCT GTTATTCCGA    3416 
AATAGGGATC ATTTCTGATT AATAGTAGCG GTAGCGATGG TCACACACGA CTTAATGTTC    3476 
CCCATTGTAC CGGAAGTAAC AATTCCAGTG ACCTCTTAGA AGAAAGACAG CAAGAAAAAG    3536 
TAAGAAAGGG AAATTGATCA AAAAATAAGG CCATCTACAG CCTATTCACA TTTAGCCGGA    3596 
TCTGCAATAC AGCTACAGAA ATAAAGTTTG TTAGGCTGCT TGCTAGCATA GCTCCTACTA    3656 
TACTAAACCA ACACAATGGG ACAATACCCC AATTAACCAG CCCTCACTCA ACACAAGTGA    3716 
ATCCTACCGA CAACATGCAT AAACCACTGC TTCCCCACCC AGCACCCTTC TTCACGATCA    3776 
GATCACGGAG AATTACCAAC TACTCTTCGC ATAAAACGTA AACAACGGCC TCGGGCCAGG    3836 
ATCCGTCCGA CTCAAAAGCA ACAAATCCCT CGTTCGCATA CTAGCCACAT GAACCTGTTG    3896 
CTCCGAGACC TCCTCAACTG GGTCTTCAAA TGCCCAGAAG ACGCTTTCTT CTCGATATCC    3956 
ATCGGATACT CGCTGGCCGC TTAGACATAT GAACGATGAG TCTCGTCTGC CAAAGGAAAC    4016 
AACCGTGTTC CCGAATCCAG TGTCAAAGTC GTAGGTCTGG AATTTGAAAA GTGTTCGGGC    4076 
GTTTCCTTGG AGGGTCGGGA GTGCGACTGC AG                                  4108 
(2)SEQ ID NO:9信息 
  (i)序列特征: 
    (A)长度:4173个碱基对 
    (B)类型:核酸 
    (C)链型:双链 
    (D)拓扑结构:线性 
  (ii)分子类型:DNA(基因组) 
  (iii)假设:无 
  (iii)反义:否 
  (vi)最初来源: 
    (A)生物体:黑曲霉 
    (B)菌株:CRS 120.49 
    (C)个体分离物:N400 
  (ix)特征: 
    (A)名称/关键:CDS 
    (B)位置:连接(948..1173,1238..3495,3550..3690) 
    (C)鉴定方法:通过实验 
    (D)其它信息:/功能=″木聚糖裂解基因的转录激活物″ 
         /产物=″双核锌指DNA结合蛋白质″ 
         /基因=″xlnR″ 
         /标准名称=″XYL R″ 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:948..1173 
  (ix)特征: 
    (A)名称/关键:内含子 
    (B)位置:1174..1237 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:1238..3495 
  (ix)特征: 
    (A)名称/关键:内含子 
    (B)位置:3496..3549 
  (ix)特征: 
    (A)名称/关键:外显子 
    (B)位置:3550..3690 
(xi)序列描述:SEQ ID NO:9 
CCCGGGCTTG GTTGGTCTCC GTCTGGCTTC CCCGCCTTTT TCCCCTGCAA TTCTGCATCC       60 
CCAATCCTTC TTTTTTCTTT GCCTCGCCAG GCTGTGTCTT TTTTCCCCCT CCCCCTCCTC      120 
CCTCGTCAGC TTCTCTTCGA CAGCATGCGT GAGGGTCTGC TACCAACTAC AATCCTTGTT      180 
CTCACTGTCT GATGGTCTGA CCCGACCGTG GTGTCTGTGG TGTGTGTGTG AGAGAGAAAG     240 
GAAAGCTAGT CAGTCCAGTC ACTCTTTCTC GTGGGTTCTT CACCTTCCCC GGACCTGCCC     300 
TCCGACACTA AAAAGCCACT TCCCCCCAAC TGGTTAGTTG CTGCTAGTCT CCTTAGTTCA     360 
TGGTCGGCCT TGTCGCTTCT CCGGCTGACA TTCTCCTCTT CTGCTGCCTT CTAGGTGCCT     420 
GTTTTTTAGT CCCTGTTTTA GTTGCCCCGC AGACTGAATC GGCAATGCCG TGGAGTTGAT     480 
CGTTCCGTGG TTTCCTTGCG ACCGCTCCTC TGCTTCATCA TCTTTTTCCT CCTGCCCTCC     540 
TGGTCTTGAA TCGCCTGGCC CTCGTCTAGG ATCTGTTGCG CCAGTGTCGC CTTAATCTCC     600 
TTTCCCGCTA GCGTAGTGCC CTTTCACGCT TGGGGCCTTA CGGCCCTTCC ATTCGCCAGC     660 
GGTCTGAATA CCTCACTTTC CCCCCCAACG ACCGGGGTCT TCATGACCCG CTGGGGTGAT     720 
TGTTCCGCCC GGTGAGGATG TCAACCCCCT CGATTCCTCA ATTCACCAGT CCTTTCTCTC     780 
CCTTCTCTTC CGGATCGCAC TCGACTGGCA TGGCGCCGTC TCAGACTGTC GGGTTGGATA     840 
CGCTCGCCGA GGGCTCGCAG TACGTCCTGG AACAATTGCA GCTGTCGCGA GACGCTGCGG     900 
GAACCGGTGC CGGCGATGGC GCGACCTCCA CTTCCTTGCG AAATTCC ATG TCG CAT       956 
                                                    Met Ser His 
                                                    1 
ACG AAG GAT CAA CCA CCC TTT GAT AAT GAG AAG AAC CAG AGC ACT GGC      1004 
Thr Lys Asp Gln Pro Pro Phe Asp Asn Glu Lys Asn Gln Ser Thr Gly 
      5                  10                  15 
TCG GGT TTT AGG GAC GCT CTG CAA AGA GAT CCC CTC GTG GAG GCT CGC      1052 
Ser Gly Phe Arg Asp Ala Leu Gln Arg Asp Pro Leu Val Glu Ala Arg 
20                  25                  30                  35 
TCT GCC GTC CGC AAA ACC TCG TCT TCA GCT CCG GTT CGC CGC CGA ATC      1100 
Ser Ala Val Arg Lys Thr Ser Ser Ser Ala Pro Val Arg Arg Arg Ile 
                 40                  45                  50 
AGC CGT GCG TGT GAC CAG TGT AAC CAA CTC CGA ACG AAA TGC GAC GGG      1148 
Ser Arg Ala Cys Asp Gln Cys Asn Gln Leu Arg Thr Lys Cys Asp Gly 
             55                  60                  65 
CAG CAT CCG TGC GCT CAT TGC ATT  G GTAGGCTTCC GCTCTTTCTC             1193 
Gln His Pro Cys Ala His Cys Ile 
         70                  75 
CGATGCCGGC GATGAGGCGG ACGCTTGACT GACCTGTTCT GTAG  AA TTC GGA CTG     1248 
                                                 Glu Phe Gly Leu 
ACC TGC GAG TAT GCG CGA GAA CGC AAG AAG CGT GGA AAA GCG TCG AAG      1296 
Thr Cys Glu Tyr Ala Arg Glu Arg Lys Lys Arg Gly Lys Ala Ser Lys 
 80                  85                  90                  95 
AAG GAT CTG GCG GCG GCA GCT GCG GCG GCT ACC CAA GGG TCG AAT GGT    1344 
Lys Asp Leu Ala Ala Ala Ala Ala Ala Ala Thr Gln Gly Ser Asn Gly 
                100                 105                 110 
CAT TCC GGG CAG GCC AAC GCG TCG CTA ATG GGC GAG CGA ACG TCG GAA    1392 
His Ser Gly Gln Ala Asn Ala Ser Leu Met Gly Glu Arg Thr Ser Glu 
            115                 120                 125 
GAC AGC CGG CCA GGA CAA GAC GTG AAC GGC ACA TAC GAC TCG GCT TTT    1440 
Asp Ser Arg Pro Gly Gln Asp Val Asn Gly Thr Tyr Asp Ser Ala Phe 
        130                 135                 140 
GAG AGC CAC CAT CTT AGC TCG CAG CCA TCG CAT ATG CAG CAT GCA AGC    1488 
Glu Ser His His Leu Ser Ser Gln Pro Ser His Met Gln His Ala Ser 
    145                 150                 155 
ACT GCA GGG ATA TCC GGC CTG CAC GAG TCT CAG ACG GCA CCG TCG CAT    1536 
Thr Ala Gly Ile Ser Gly Leu His Glu Ser Gln Thr Ala Pro Ser His 
160                 165                 170                 175 
TCG CAA TCA TCG CTA GGA ACG ACT ATC GAT GCG ATG CAT TTG AAT CAT    1584 
Ser Gln Ser Ser Leu Gly Thr Thr Ile Asp Ala Met His Leu Asn His 
                180                 185                 190 
TTC AAC ACG ATG AAC GAT TCC GGT CGC CCG GCA ATG TCC ATA TCC GAT    1632 
Phe Asn Thr Met Asn Asp Ser Gly Arg Pro Ala Met Ser Ile Ser Asp 
            195                 200                 205 
CTG CGT TCG CTA CCC CCG TCC GTC TTA CCA CCG CAA GGA CTA AGC TCC    1680 
Leu Arg Ser Leu Pro Pro Ser Val Leu Pro Pro Gln Gly Leu Ser Ser 
        210                 215                 220 
GGG TAC AAC GCG AGC GCC TTC GCT TTG GTG AAC CCG CAA GAG CCG GGC    1728 
Gly Tyr Asn Ala Ser Ala Phe Ala Leu Val Asn Pro Gln Glu Pro Gly 
    225                 230                 235 
TCA CCA GCT AAC CAG TTT CGC TTG GGA AGC TCA GCG GAA AAC CCA ACC    1776 
Ser Pro Ala Asn Gln Phe Arg Leu Gly Ser Ser Ala Glu Asn Pro Thr 
240                 245                 250                 255 
GCA CCG TTT CTT GGT CTC TCG CCT CCA GGA CAG TCG CCT GGA TGG CTC    1824 
Ala Pro Phe Leu Gly Leu Ser Pro Pro Gly Gln Ser Pro Gly Trp Leu 
                260                  265                270 
CCT CTT CCC TCG CCA TCT CCT GCC AAC TTT CCT TCT TTC AGC TTG CAT    1872 
Pro Leu Pro Ser Pro Ser Pro Ala Asn Phe Pro Ser Phe Ser Leu His 
            275                  280                285 
CCG TTT TCC AGC ACT TTA CGA TAC CCT GTT TTG CAG CCG GTC CTG CCT    1920 
Pro Phe Ser Ser Thr Leu Arg Tyr Pro Val Leu Gln Pro Val Leu Pro 
        290                 295                 300 
CAC ATC GCC TCC ATT ATT CCG CAG TCG CTA GCG TGT GAC CTT CTG GAT    1968 
His Ile Ala Ser Ile Ile Pro Gln Ser Leu Ala Cys Asp Leu Leu Asp 
    305                 310                 315 
GTT TAC TTC ACT AGT TCC TCT TCG TCC CAC CTG TCT CCC TTG TCC CCA      2016 
Val Tyr Phe Thr Ser Ser Ser Ser Ser His Leu Ser Pro Leu Ser Pro 
320                 325                 330                 335 
TAC GTG GTG GGC TAC ATC TTC CGC AAG CAG TCT TTC CTT CAC CCG ACA      2064 
Tyr Val Val Gly Tyr Ile Phe Arg Lys Gln Ser Phe Leu His Pro Thr 
                340                 345                 350 
AAA CCC CGA ATA TGC AGC CCC GGT CTC CTG GCG AGT ATG CTC TGG GTA      2112 
Lys Pro Arg Tle Cys Ser Pro Gly Leu Leu Ala Ser Met Leu Trp Val 
            355                 360                 365 
GCC GCA CAA ACG AGT GAA GCT GCG TTT CTG ACA TCG CCG CCC TCG GCT      2160 
Ala Ala Gln Thr Ser Glu Ala Ala Phe Leu Thr Ser Pro Pro Ser Ala 
        370                 375                 380 
CGG GGG CGT GTA TGC CAG AAA CTG CTA GAA CTG ACC ATT GGT TTG CTC      2208 
Arg Gly Arg Val Cys Gln Lys Leu Leu Glu Leu Thr Ile Gly Leu Leu 
    385                 390                 395 
CGA CCG TTG GTC CAT GGT CCT GCT ACC GGA GAA GCG TCG CCC AAC TAT      2256 
Arg Pro Leu Val His Gly Pro Ala Thr Gly Glu Ala Ser Pro Asn Tyr 
400                 405                 410                 415 
GCG GCG AAT ATG GTC ATC AAT GGC GTC GCT CTG GGC GGA TTT GGG GTC      2304 
Ala Ala Asn Met Val Ile Asn Gly Val Ala Leu Gly Gly Phe Gly Val 
                420                 425                 430 
TCC ATG GAT CAG CTG GGC GCG CAA AGT AGC GCC ACC GGC GCC GTG GAT      2352 
Ser Met Asp Gln Leu Gly Ala Gln Ser Ser Ala Thr Gly Ala Val Asp 
            435                 440                 445 
CAT GTA GCA ACT TAT GTG CAT CTT GCG ACA GTA GTA TCC GCC AGC GAG      2400 
Asp Val Ala Thr Tyr Val His Leu Ala Thr Val Val Ser Ala Ser Glu 
        450                 455                 460 
TAC AAG GCG GCC AGC ATG CGC TGG TGG ACT GCG GCG TGG TCT CTA GCG      2448 
Tyr Lys Ala Ala Ser Met Arg Trp Trp Thr Ala Ala Trp Ser Leu Ala 
    465                 470                 475 
CGT GAG CTG AAG CTA GGC CGT GAG CTG CCA CCC AAT GTT TCC CAC GCA      2496 
Arg Glu Leu Lys Leu Gly Arg Glu Leu Pro Pro Asn Val Ser His Ala 
480                 485                 490                 495 
CGG CAA GAT GGA GAG CGA GAT GGG GAT GGC GAG GCG GAC AAA CGA CAT      2544 
Arg Gln Asp Gly Glu Arg Asp Gly Asp Gly Glu Ala Asp Lys Arg His 
                500                 505                 510 
CCT CCG ACC CTC ATC ACG TCA CTG GGT CAT GGA TCG GGA AGC TCC GGC       2592 
Pro Pro Thr Leu Ile Thr Ser Leu Gly His Gly Ser Gly Ser Ser Gly 
            515                 520                 525 
ATT AAT GTC ACC GAA GAG GAG CGT GAG GAG CGT CGA CGC CTA TGG TGG       2640 
Ile Asn Val Thr Glu Glu Glu Arg Glu Glu Arg Arg Arg Leu Trp Trp 
        530                 535                 540 
CTC TTA TAT GCG ACC GAT CGG CAC CTG GCG CTG TGC TAC AAC CGG CCC      2688 
Leu Leu Tyr Ala Thr Asp Arg His Leu Ala Leu Cys Tyr Asn Arg Pro 
    545                 550                 555 
CTC ACG CTG CTG GAC AAG GAA TGT GGC GGG CTG CTG CAG CCG ATG AAC      2736 
Leu Thr Leu Leu Asp Lys Glu Cys Gly Gly Leu Leu Gln Pro Met Asn 
560                 565                 570                 575 
GAT GAT CTG TGG CAG GTC GGC GAC TTT GCA GCG GCT GCC TAC CGC CAG      2784 
Asp Asp Leu Trp Gln Val Gly Asp Phe Ala Ala Ala Ala Tyr Arg Gln 
                580                 585                 590 
GTC GGA CCG CCC GTC GAG TGT ACG GGT CAC AGC ATG TAT GGA TAC TTT      2832 
Val Gly Pro Pro Val Glu Cys Thr Gly His Ser Met Tyr Gly Tyr Phe 
            595                 600                 605 
CTA CCG CTG ATG ACG ATT CTT GGA GGG ATC GTC GAT CTG CAC CAC GCT      2880 
Leu Pro Leu Met Thr Ile Leu Gly Gly Ile Val Asp Leu His His Ala 
        610                 615                 620 
GAG AAT CAT CCG CGC TTT GGC CTG GCG TTC CGC AAT AGC CCG GAG TGG      2928 
Glu Asn His Pro Arg Phe Gly Leu Ala Phe Arg Asn Ser Pro Glu Trp 
    625                 630                 635 
GAG CGT CAG GTA CTG GAC GTT ACG CGG CAG CTG GAC ACA TAT GGG CGC      2976 
Glu Arg Gln Val Leu Asp Val Thr Arg Gln Leu Asp Thr Tyr Gly Arg 
640                 645                 650                 655 
AGC TTG AAG GAA TTC GAG GCC CGC TAC ACC AGC AAC TTG ACT CTG GGG      3024 
Ser Leu Lys Glu Phe Glu Ala Arg Tyr Thr Ser Asn Leu Thr Leu Gly 
                660                 665                 670 
GCT ACG GAT AAC GAG CCT GTC GTC GAA GGT GCC CAC TTG GAT CAC ACG      3072 
Ala Thr Asp Asn Glu Pro Val Val Glu Gly Ala His Leu Asp His Thr 
            675                 680                 685 
AGT CCT TCG GGG CGC TCC AGC AGC ACC GTG GGA TCG CGG GTG AGC GAG      3120 
Ser Pro Ser Gly Arg Ser Ser Ser Thr Val Gly Ser Arg Val Ser Glu 
        690                 695                 700 
TCC ATC GTC CAC ACG AGG ATG GTG GTC GCC TAC GGG ACG CAT ATC ATG      3168 
Ser Ile Val His Thr Arg Met Val Val Ala Tyr Gly Thr His Ile Met 
    705                 710                 715 
CAC GTC CTG CAT ATT TTG CTC GCG GGA AAA TGG GAC CCG GTG AAT CTG      3216 
His Val Leu His Ile Leu Leu Ala Gly Lys Trp Asp Pro Val Asn Leu 
720                 725                 730                 735 
TTG GAA GAT CAT GAT CTG TGG ATC TCC TCG GAG TCG TTT GTC TCG GCC      3264 
Leu Glu Asp His Asp Leu Trp Ile Ser Ser Glu Ser Phe Val Ser Ala 
                740                 745                 750 
ATG AGC CAT GCG GTC GGT GCC GCA GAA GCA GCG GCA GAA ATC TTG GAG      3312 
Met Ser His Ala Val Gly Ala Ala Glu Ala Ala Ala Glu Ile Leu Glu 
            755                 760                 765 
TAC CAC CCG GAT CTC AGC TTC ATG CCG TTC TTC TTC GGG ATT TAC CTA         3360 
Tyr Asp Pro Asp Leu Ser Phe Met Pro Phe Phe Phe Gly Ile Tyr Leu 
        770                 775                 780 
CTA CAG GGC AGT TTC TTG CTG CTA CTG GCG GCG GAC AAG TTG CAG GGC         3408 
Leu Gln Gly Ser Phe Leu Leu Leu Leu Ala Ala Asp Lys Leu Gln Gly 
    785                 790                 795 
GAT GCC AGT CCC AGT GTC GTG CGG GCA TGC GAG ACG ATC GTG CGG GCG         3456 
Asp Ala Ser Pro Ser Val Val Arg Ala Cys Glu Thr Ile Val Arg Ala 
800                 805                 810                 815 
CAT GAA GCG TGC GTC GTG ACC TTG AAC ACG GAG TAC CAG GTAGGTTTTC          3505 
His Glu Ala Cys Val Val Thr Leu Asn Thr Glu Tyr Gln 
                820                 825 
TTGTTTCTCT CCCTAGCTTG GCAATAGTAG CTAACACAAT GTAG AGG ACA TTC CGC        3561 
                                                 Arg Thr Phe Arg 
                                                     830 
AAG GTC ATG CGA TCG GCG CTG GCA CAG GTT CGA GGA CGC ATC CCA GAG         3609 
Lys Val Met Arg Ser Ala Leu Ala Gln Val Arg Gly Arg Ile Pro Glu 
        835                 840                 845 
GAC TTT GGG GAG CAG CAG CAG CGC CGA CGC GAA GTG CTT GCG CTA TAC         3657 
Asp Phe Gly Glu Gln Gln Gln Arg Arg Arg Glu Val Leu Ala Leu Tyr 
    850                 855                 860 
CGC TGG AGC GGC GAT GGC AGT GGG CTG GCA CTG TAGTTTTGCA GTAACACGGC       3710 
Arg Trp Ser Gly Asp Gly Ser Gly Leu Ala Leu 
865                 870                 875 
TGATGATGAG ATGCGATTTA TGGCGGTGCA TTGACCGGTC AATGGCTTCT TACATTCTGA      3770 
TTTGATACTA CTTTTGGATT CGCTATTTCA CTCCGGGCTT ATGCTGGCTT CATTGTCAAG      3830 
AGGGGTGGCA TGGCGAATGG AAATATGCTT ACTTCGTGTT GATACGGATT CGTACATATA      3890 
CTTTGGTGAT ATATGTGGAT ATTTGTGGCA TGTACACTAT GCGTGATCTT TGGACATGAT      3950 
ACTTTGATAC CAGGTCAATC TAATTGCGTT CTTTTCATTT GTTGCGCAAC AGCCGAGGTA      4010 
TGACGCCATG GCTGAGATAA GCTGCCGATA AGCATTCGCA TTCCATCCTC CATCGAAGCA      4070 
CCAAAATCTT CTTCATATAA CCAATCCATC AATTCAACAT TCGTAATGAC AATAGTATAA      4130 
TCCCCAAAAT GCCCTCCCTA TTACACTCCC TCCGCACTTC CCC                        4173 

Claims (25)

1.一种核酸序列,其编码序列号9的表达产物xylR。
2.一种核酸序列,其由序列号9的核酸序列组成。
3.由权利要求1或2所述的核酸序列编码的氨基酸序列。
4.权利要求3的氨基酸序列,其中该氨基酸序列是序列号9的氨基酸序列。
5.权利要求3所述的氨基酸序列,其中所述序列具有DNA结合活性。
6.一种突变宿主细胞,其包括调节物编码序列的缺乏或突变,从而所述的调节物不表达或者其不具备调节物活性;其中所述的调节物编码序列编码xylR,其中所述的调节物由权利要求1或2的核酸序列编码或所述的调节物是权利要求3-5任一项所述的氨基酸序列。
7.权利要求6的突变宿主细胞,进一步包括编码一种蛋白质或肽的序列,所述的蛋白质或肽可不具有木聚糖裂解副活性。
8.一种产生不具有木聚糖裂解副活性的蛋白质或多肽的方法,包括培养权利要求6或7的突变宿主细胞并获得所产生的蛋白质。
9.一种联合核酸盒用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途,其中所述联合核酸盒包括:
1)一种靶基因启动子,其中所述靶基因是可诱导增强序列或激活序列的调节物的靶基因,
2)可操纵地连接于另一个启动子的编码所述调节物的核酸序列,
3)编码所述蛋白质或肽的序列,
所述靶基因启动子可操纵地连接于3)的序列,其中所述编码调节物的核酸序列编码木聚糖裂解调节物,且其中所述编码调节物的核酸序列是权利要求1或2所述的核酸序列或所述调节物由权利要求3-5任一项所述的氨基酸序列组成。
10.权利要求9的用途,其中可操纵地连接于所述编码调节物的核酸序列的另一个启动子是与编码所述调节物的核酸序列天然相关的启动子。
11.权利要求9的用途,其中所述靶基因启动子选自与靶基因xlnA、xlnB、xlnC、xlnD或axeA相关的启动子。
12.权利要求9的用途,其中所述靶基因启动子是与靶基因xlnD相关的启动子。
13.权利要求9-12任一项的用途,其中所述序列编码木聚糖酶、葡聚糖酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶、蛋白酶或氧化还原酶。
14.权利要求13的用途,其中所述氧化还原酶是己糖氧化酶。
15.权利要求1或2所述的核酸序列用于过量表达靶基因的用途,所述的过量表达是在包含靶基因的宿主细胞中表达该核酸序列,所述的靶基因与一种启动子可操纵地连接,所述的启动子与由权利要求1或2所述的核酸序列编码的可诱导增强序列或激活序列的调节物的靶基因正常相关,条件是当靶基因和权利要求1或2所述的核酸序列相对于宿主细胞是天然的时,与野生型宿主细胞相比,权利要求1或2所述的序列以多拷贝存在于宿主细胞中。
16.一种宿主细胞用于从编码一种蛋白质或肽的核酸序列生产所述蛋白质或肽的用途,其中所述宿主细胞包括如权利要求9-14任一项定义的联合核酸盒和/或一种包括如权利要求9-14任一项定义的联合核酸盒的载体。
17.权利要求16的宿主细胞的用途,其中所述宿主细胞包括如权利要求9定义的联合核酸盒的成分,所述宿主细胞天然地或通过重组DNA技术包括所述调节物的靶基因,条件是当所述靶基因和调节物对于所述宿主细胞是天然的时,所述调节物以多拷贝存在于宿主细胞中。
18.权利要求16的宿主细胞的用途,其中所述宿主细胞包括多拷贝的如权利要求9定义的编码调节物的核酸序列或如权利要求1或2所述的核酸序列。
19.权利要求16的宿主细胞的用途,其中所述调节物由权利要求1或2所定义的核酸序列编码或是权利要求3-5任一项所述的氨基酸序列,且靶基因启动子如权利要求11所定义。
20.权利要求16的宿主细胞的用途,其中所述宿主细胞选自微生物或植物细胞。
21.权利要求16的宿主细胞的用途,其中所述宿主细胞选自真菌细胞。
22.权利要求16的宿主细胞的用途,所述宿主细胞选自曲霉属、木霉属、青霉属或镰孢属。
23.权利要求16的宿主细胞的用途,所述宿主细胞为选自黑曲霉、塔宾曲霉、棘孢曲霉、泡盛曲霉、米曲霉、构巢曲霉、臭曲霉、土曲霉、萨氏曲霉、川地曲霉、炭黑曲霉或日本曲霉的菌株。
24.权利要求16的宿主细胞的用途,其中所述靶基因对于宿主细胞是内源的。
25.权利要求16-24任一项的的宿主细胞的用途,其中所述靶基因以多拷贝存在。
CN200410012059.9A 1995-06-23 1996-06-24 分离突变体及克隆互补基因的新方法 Expired - Lifetime CN1661014B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP95201707.7 1995-06-23
EP95201707 1995-06-23
EP95202346.3 1995-08-30
EP95202346 1995-08-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN96196200.3A Division CN1192106C (zh) 1995-06-23 1996-06-24 分离突变体及克隆互补基因的新方法

Publications (2)

Publication Number Publication Date
CN1661014A CN1661014A (zh) 2005-08-31
CN1661014B true CN1661014B (zh) 2013-05-29

Family

ID=26139424

Family Applications (2)

Application Number Title Priority Date Filing Date
CN96196200.3A Expired - Lifetime CN1192106C (zh) 1995-06-23 1996-06-24 分离突变体及克隆互补基因的新方法
CN200410012059.9A Expired - Lifetime CN1661014B (zh) 1995-06-23 1996-06-24 分离突变体及克隆互补基因的新方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN96196200.3A Expired - Lifetime CN1192106C (zh) 1995-06-23 1996-06-24 分离突变体及克隆互补基因的新方法

Country Status (14)

Country Link
US (3) US6177261B1 (zh)
EP (2) EP1514936B1 (zh)
JP (2) JP4339400B2 (zh)
CN (2) CN1192106C (zh)
AT (2) ATE380242T1 (zh)
AU (1) AU714511B2 (zh)
BR (1) BR9608910A (zh)
CA (2) CA2224626C (zh)
DE (2) DE69637908D1 (zh)
DK (2) DK0833922T3 (zh)
NZ (1) NZ311181A (zh)
PL (2) PL184463B1 (zh)
PT (1) PT833922E (zh)
WO (1) WO1997000962A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL184463B1 (pl) 1995-06-23 2002-11-29 Danisco Ingredients As Kaseta kwasu nukleinowego wektor komórka gospodarza i ich zastosowania fragment kwasu nukleinowego mutant sekwencji aminokwasowej sposób wytwarzania i selekcjonowania mutantów oraz sposób identyfikacji i oznaczania sekwencji kwasu nukleinowego
US6391583B1 (en) 1998-12-18 2002-05-21 Wisconsin Alumni Research Foundation Method of producing antihypercholesterolemic agents
IL154059A0 (en) * 2000-07-21 2003-07-31 Syngenta Participations Ag Zinc finger domain recognition code and uses thereof
KR100428998B1 (ko) * 2001-09-10 2004-04-28 한국과학기술원 모체 단백질과는 크기와 서열이 다른 단백질의 변이집단을생산하는 방법
US20090104165A1 (en) * 2004-09-22 2009-04-23 Bioworks, Inc. Transgenic strains of trichoderma and their use in biocontrol
GB0424940D0 (en) 2004-11-11 2004-12-15 Danisco Transcription factors
KR100801960B1 (ko) 2006-11-14 2008-02-12 건국대학교 산학협력단 mRNA 결합 단백질 XaiF, 이를 부착하는 유전자구조물 그리고 이들을 이용한 외래 유전자의 과발현 방법
US8323931B2 (en) * 2008-11-03 2012-12-04 Iogen Energy Corporation Hosts and fermentation processes for cellulase production
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
EP2508600B1 (en) * 2009-12-05 2015-08-12 Amano Enzyme Inc. Mutant enzyme and application thereof
US8624082B2 (en) 2010-08-30 2014-01-07 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
EP2611914A1 (en) 2010-08-30 2013-07-10 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US9267126B2 (en) 2010-08-30 2016-02-23 Novozymes, Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
WO2012030811A1 (en) 2010-08-30 2012-03-08 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
EP2611901B1 (en) 2010-08-30 2016-05-11 Novozymes A/S Polypeptides having beta-glucosidase activity, beta-xylosidase activity, or beta-glucosidase and beta-xylosidase activity and polynucleotides encoding same
CN103374542B (zh) * 2012-04-25 2016-08-10 中国科学院上海生命科学研究院 一种提高拜氏梭菌木糖消耗率的方法
CN109072222B (zh) 2016-03-31 2022-05-06 东丽株式会社 具有突变型bxl1基因的木霉属真菌和使用该真菌制造低聚木糖和葡萄糖的制造方法
CN108315313A (zh) * 2018-03-21 2018-07-24 中国农业科学院饲料研究所 多聚半乳糖醛酸酶及其突变体TePG28b_N85E/S86W和应用
WO2020047304A1 (en) * 2018-08-31 2020-03-05 Genomatica, Inc. Xylr mutant for improved xylose utilization or improved co-utilization of glucose and xylose
CN116355881B (zh) * 2023-03-10 2024-02-23 云南师范大学 酸耐受性提高的β-木糖苷酶突变体D395G及其应用
CN116515841B (zh) * 2023-06-21 2023-09-05 中国科学院天津工业生物技术研究所 一种真菌来源的启动子元件及其应用

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5028530A (en) * 1985-01-28 1991-07-02 Xoma Corporation AraB promoters and method of producing polypeptides, including cecropins, by microbiological techniques
DK160947C (da) * 1986-04-17 1991-10-21 Novo Industri As Gen-udtrykkelsessystem
US5264350A (en) * 1986-08-18 1993-11-23 Institut Pasteur DNA sequence performing a function which is expressed in an over-production of extracellular proteins by various strains of bacillus, and vectors containing this sequence
GB8807939D0 (en) * 1988-04-05 1988-05-05 Univ Brunel Regulatory cassette for expression vectors
AU684524B2 (en) 1993-06-14 1997-12-18 Tet Systems Holding Gmbh & Co. Kg Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
US5464758A (en) * 1993-06-14 1995-11-07 Gossen; Manfred Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
ES2198410T3 (es) 1993-07-23 2004-02-01 Dsm Ip Assets B.V. Cepas recombinantes de hongos filamentosos libres de gen marcador de seleccion: un metodo para obtener dichas cepas y su utilizacion.
PL184463B1 (pl) * 1995-06-23 2002-11-29 Danisco Ingredients As Kaseta kwasu nukleinowego wektor komórka gospodarza i ich zastosowania fragment kwasu nukleinowego mutant sekwencji aminokwasowej sposób wytwarzania i selekcjonowania mutantów oraz sposób identyfikacji i oznaczania sekwencji kwasu nukleinowego

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
L.H. DE GRAAFF ET AL.Regulation of the xylanase-encoding Xln A gene ofAspergillus tubigensis.MOLECULAR MICROBIOLOGY12 3.1994,12(3),全文.
L.H. DE GRAAFF ET AL.Regulation of the xylanase-encoding Xln A gene ofAspergillus tubigensis.MOLECULAR MICROBIOLOGY12 3.1994,12(3),全文. *

Also Published As

Publication number Publication date
PL324186A1 (en) 1998-05-11
NZ311181A (en) 2000-02-28
DE69637359D1 (de) 2008-01-17
EP1514936A3 (en) 2005-04-13
DK0833922T3 (da) 2009-08-03
CA2224626C (en) 2011-11-01
CN1192106C (zh) 2005-03-09
BR9608910A (pt) 1999-05-04
WO1997000962A1 (en) 1997-01-09
PT833922E (pt) 2009-07-27
US20030175893A1 (en) 2003-09-18
US6177261B1 (en) 2001-01-23
DE69637908D1 (de) 2009-06-04
EP0833922B1 (en) 2009-04-22
JP4339400B2 (ja) 2009-10-07
EP1514936B1 (en) 2007-12-05
JPH11507838A (ja) 1999-07-13
AU714511B2 (en) 2000-01-06
EP0833922A1 (en) 1998-04-08
US8461320B2 (en) 2013-06-11
JP2007244387A (ja) 2007-09-27
ATE380242T1 (de) 2007-12-15
CN1661014A (zh) 2005-08-31
EP1514936A2 (en) 2005-03-16
CA2224626A1 (en) 1997-01-09
CN1207128A (zh) 1999-02-03
CA2672126C (en) 2013-01-08
PL185052B1 (pl) 2003-02-28
US6599745B1 (en) 2003-07-29
AU6244396A (en) 1997-01-22
DK1514936T3 (da) 2008-04-14
ATE429499T1 (de) 2009-05-15
JP4339901B2 (ja) 2009-10-07
CA2672126A1 (en) 1997-01-09
DE69637359T2 (de) 2008-10-30
PL184463B1 (pl) 2002-11-29

Similar Documents

Publication Publication Date Title
CN1661014B (zh) 分离突变体及克隆互补基因的新方法
CN105308171B (zh) Agse缺陷菌株
EP0263311A2 (en) Yeast production of human tumor necrosis factor
EA005682B1 (ru) Трансформированные грибы, в частности рода chrysosporium, способные к синтезу гетерологичных полипептидов
CN105671027A (zh) 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
WO1996000787A1 (en) Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
US6300112B1 (en) β-xylosidase, nucleotide sequence encoding it, and use thereof
EP2576793B1 (en) Method for improved protein production in filamentous fungi
US20130078674A1 (en) Method for protein production in filamentous fungi
CN101497908A (zh) 用于在真菌细胞中表达基因的启动子变体
Gouka et al. Cloning of the nitrate-nitrite reductase gene cluster of Penicillium chrysogenum and use of the niaD gene as a homologous selection marker
US5763221A (en) Transformant producing substance PF1022, and method for transforming microorganism belonging to the class hyphomycetes
CN106795504A (zh) 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸
CN101067127B (zh) 在缺乏环己缩酚肽的细胞中制备多肽的方法
CN1188510A (zh) 新的β-木糖苷酶和编码该酶的核苷酸序列以及该酶的用途
AU747607B2 (en) A nucleic acid cassette & method to isolate mutants and to clone the complementing gene
CN111088244B (zh) 蛋白酶基因在促进纤维素酶生产和复杂氮源利用中的应用
WO1998006858A1 (en) BETA-1,4-ENDOGLUCANASE FROM $i(ASPERGILLUS NIGER)
US20030068805A1 (en) Endo beta-1,4-glucanase from aspergillus
Serebryanyi et al. Synthesis of xylanolytic enzymes and other carbohydrases by the fungus Penicillium canescens: Transformants with an altered copy number of the gene xln R and an encoding transcriptional activator
JP2001513637A (ja) 発現エレメント

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Copenhagen

Applicant after: Danisco

Address before: Copenhagen

Applicant before: Danisco

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: DYNISCO, INC. TO: DUPONT NUTRITION BIOSCIENCES APS

C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20130529

EXPY Termination of patent right or utility model