CN101967490B - 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法 - Google Patents

木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法 Download PDF

Info

Publication number
CN101967490B
CN101967490B CN201010268914.8A CN201010268914A CN101967490B CN 101967490 B CN101967490 B CN 101967490B CN 201010268914 A CN201010268914 A CN 201010268914A CN 101967490 B CN101967490 B CN 101967490B
Authority
CN
China
Prior art keywords
seq
sequence
polypeptide
nucleic acid
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN201010268914.8A
Other languages
English (en)
Other versions
CN101967490A (zh
Inventor
B·斯蒂尔
W·卡伦
S·希利
G·黑尔伍德
D·吴
D·布卢姆
A·埃斯特拉利安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Enzymes LLC
Original Assignee
Syngenta Participations AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations AG filed Critical Syngenta Participations AG
Publication of CN101967490A publication Critical patent/CN101967490A/zh
Application granted granted Critical
Publication of CN101967490B publication Critical patent/CN101967490B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C5/00Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
    • D21C5/005Treatment of cellulose-containing material with microorganisms or enzymes
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H17/00Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
    • D21H17/005Microorganisms or enzymes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Paper (AREA)
  • Fodder In General (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及木聚糖酶和编码木聚糖酶的多聚核苷酸。另外,也提供了设计新的木聚糖酶和应用它们的方法。所述木聚糖酶在升高的pH和温度下具有增加的活性和稳定性。

Description

木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法
本申请是分案申请,原申请的申请日为2003年6月16日、申请号为03819147.4(PCT/US03/019153)、发明名称为“木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法”。 
相关申请的交叉参考 
本申请在35U.S.C.§119(e)下要求在2002年6月14日提交的美国临时申请60/389,299的优先权权益。前述的申请在此明确地整体引入作为参考以及用于各种目的。 
技术领域
本发明总体上涉及酶、编码所述酶的多聚核苷酸、这样的多聚核苷酸和多肽的应用,更具体地,是涉及具有木聚糖酶活性的酶,例如催化内部β-1,4-木糖苷键(β-1,4-xylosidic linkage)或内-β-1,4-葡聚糖酶键(endo-β-1,4-glucanase linkages)的水解的酶。 
背景技术
木聚糖酶(例如,内-1,4-β-木聚糖酶,EC 3.2.1.8)水解木聚糖中的内部β-1,4-木糖苷键,产生更小分子量的木糖和木糖寡聚体。木聚糖是由1,4-β-糖苷-连接的D-吡喃木糖形成的多糖。木聚糖酶具有很重要的商业价值,用于食品工业中的面包焙烤和水果蔬菜加工,还在动物饲料的生产和纸浆生产和造纸中用于农业废物的分解。木聚糖酶可由真菌和细菌形成。 
阿拉伯糖基木聚糖是谷类的主要的非淀粉类多糖,根据品种和生长条件,其含量为2.5-7.1%w/w。这种多糖的物化性质为在氧化条件下可产生粘状溶液或甚至凝胶。另外,阿拉伯糖基木聚糖具有很高的水结合能力,在蛋白泡沫的稳定性中具有一定的作用。对于一些工业包括酿造、焙烤、动物营养和造纸工业,所有这些特性都带来了问题。在酿造应用中,木聚糖的存在可导致麦芽汁过滤性(wort filterability)和混浊形成的问题(haze formation issues)。在焙烤应用中(特别是甜饼和饼干),这些阿拉伯糖基木聚糖产生粘性的面团,这使得难以加工和减小饼干的大小。另外,这种糖与烘制品的迅速再水化有关,引起脆性的丢失和保存期限的缩短。对于利用谷类食物的单胃动物饲料应用,阿拉伯糖基木聚糖是肠道内容物的粘度的主要贡献性因素,因此对饲料的消化率和动物生长速率有负面影响。对于反刍动物,这些多糖代表了摄入纤维的实质性成分,阿拉伯糖基木聚糖的更完全消化有助于更高的饲料转化效率。 
木聚糖酶目前在面团加工中用作添加剂(面团性质改进剂)以水解水溶性的阿拉伯糖基木聚糖。在焙烤应用中(特别是甜饼和饼干),这些阿拉伯糖基木聚糖产生粘性的面团,这使得难以加工和减小饼干的大小。另外,这种糖与烘制品 的迅速再水化有关,引起脆性的丢失和保存期限的缩短。 
增强动物饲料中木聚糖的消化可改善有价值的碳水化合物和蛋白饲料营养物质的可利用度和可消化性。对于利用谷类食物的单胃动物饲料应用,阿拉伯糖基木聚糖是肠道内容物的粘度的主要贡献性因素,因此对饲料的消化率和动物生长速率有负面影响。对于反刍动物,这些多糖代表了摄入纤维的实质性成分,阿拉伯糖基木聚糖的更完全消化有助于更高的饲料转化效率。希望动物饲料的木聚糖酶在动物胃中能够保持活性。这需要饲料酶在37℃,单胃动物的低pH(pH 2-4)和反刍动物的近中性pH(pH 6.5-7)下具有很高活性。该酶也应该具有对动物肠木聚糖酶的抵抗性,并在饲料粒化过程的更高温度下具有稳定性。正是如此,在本领域中需要单胃动物饲料的具有高度特异活性的木聚糖酶饲料添加剂,其在35-40℃和pH 2-4时具有活性,在SGF中半衰期超过30分钟,在剂型状态中在85℃时的半衰期>5分钟。对于反刍动物饲料,需要具有很高特异活性的木聚糖酶饲料添加剂,其在35-40℃和pH 6.5-7.0时具有活性,在SRF中半衰期超过30分钟,具有如浓缩干粉的稳定性。 
木聚糖酶也可用于其它的大量应用中。例如,木聚糖酶可用于改善泌乳母牛中产生的乳蛋白的质量和数量(见,例如,Kung,L.等人,J.Dairy Science,2000年1月,83:115-122),可用于增加在猪的胃内和小肠内的可溶性糖类的数量(见,例如,van der Meulen,J.等人,Arch.Tieremahr,200154:101-115),改善母鸡晚期蛋的生产效率和蛋的产量(见,例如,Jaroni,D.等人,Poult.Sci.,1999年6月,78:841-847)。另外,已经显示木聚糖酶可用于化学纸浆的生物漂白和处理(见,例如,美国专利5,202,249),可用于木材或纸浆的生物漂白和处理(见,例如,美国专利5,179,021、5,116,746、5,407,827、5,405,769、5,395,765、5,369,024、5,457,045、5,434,071、5,498,534、5,591,304、5,645,686、5,725,732、5,759,840、5,834,301、5,871,730和6,057,438),可用于降低在木材和改良木材中的木素(见,例如,美国专利5,486,468和5,770,012),可用作面粉、面团和面包改进剂(见,例如,美国专利5,108,765和5,306,633),可用作饲料添加剂和/或补充物,如上所述(见,例如,美国专利5,432,074、5,429,828、5,612,055、5,720,971、5,981,233、5,948,667、6,099,844、6,132,727和6,132,716),可用于制造纤维素溶液(见,例如,美国专利5,760,211)。具有木聚糖酶活性的去垢剂组合物可用于水果、蔬菜和/或泥浆和粘土化合物(见,例如,美国专利5,786,316)。 
为了制造治疗和/或预防球虫病的试剂,木聚糖酶也可用于糖酶和/或木聚糖酶的组合物和应用方法中。制造的试剂可以是基于谷物的动物饲料的形式(见,例如,美国专利5,624,678)。木聚糖酶的其它应用包括用于生产水溶性饮食纤维(见,例如,美国专利5,622,738),改善淀粉的过滤性、分离和生产(见,例如,美国专利4,960,705和5,023,176),在饮料工业中改善麦芽汁或啤酒的过滤性(见,例如,美国专利4,746,517),促进家畜泌乳和改善乳质量的酶组合物(见,例如, 美国专利4,144,354),降低植物材料的粘度(见,例如,美国专利5,874,274),增加食品如果酱、桔子酱、果冻、果汁、浆糊、汤、调味汁等的粘度或胶强度(见,例如,美国专利6,036,981)。木聚糖酶也可用于对其具有选择性的半纤维素的水解,特别是在存在纤维素的情况下。另外,富纤维素酶的滞留物(cellulase rich retentate)适合进行纤维素的水解(见,例如,美国专利4,725,544)。 
木聚糖酶的多种应用包括生产乙醇(见,例如,PCT申请WO0043496和WO8100857),对产乙醇微生物进行转化(见,例如,PCT申请WO99/46362),生产酒类鞣酸和酶组合物(见,例如,PCT申请WO0164830),刺激植物的天然防御(见,例如,PCT申请WO0130161),从半纤维素底物中产生糖类(见,例如,PCT申请WO9203541),清洗水果、蔬菜、土壤泥浆或粘土(见,例如,PCT申请WO9613568),清洗啤酒滤膜(见,例如,PCT申请WO9623579),杀死或抑制微生物细胞的方法(见,例如,PCT申请WO9732480),通过使用两种UV吸收测定的比值和比较该光谱来确定木质纸浆漂洗中工艺用水的特性(见,例如,PCT申请WO9840721)。 
关于用于纸张和纸浆工业中的木聚糖酶,已经从许多来源分离了木聚糖酶。特别地,参见美国专利6,083,733和6,140,095和6,346,407。特别地,注意美国专利6,140,095提出了耐受碱的木聚糖酶。但是,要注意在本领域仍需要可用于纸张和纸浆工业的木聚糖酶,其中该酶在65℃至75℃的温度范围内和大约10的pH是有活性的。另外,本发明的用于纸张和纸浆工业的酶将降低对漂洗化学物质,如二氧化氯的需求。 
在此讨论的出版物被提供,仅仅是显示了它们先于本发明申请日的公开。并不能凭借在此的任何内容认为本发明没有资格先于在前发明的那些公开内容。 
发明概述 
本发明提供了分离出的或重组的核酸,其包括与本发明的示例性核酸例如SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ IDNO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ IDNO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ IDNO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ IDNO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID 
NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ IDNO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ IDNO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ IDNO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQID NO:373、SEQ ID NO:375、SEQ ID NO:377或SEQ ID NO:379在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或更多残基的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性(identity)的核酸序列,编码至少一个具有木聚糖酶活性的多肽,所述的序列同一性是通过采用序列比较算法的分析或通过观察检验(visual inspection)来确定的。 
本发明的示例性核酸也包括编码具有如SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ IDNO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ IDNO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ IDNO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ IDNO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ IDNO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ IDNO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ IDNO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ IDNO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ IDNO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ IDNO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ IDNO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ IDNO:376、SEQ ID NO:378或SEQ ID NO:380所示序列及其子序列(subsequences)和其变异体的多肽的分离出的或重组的核酸。一个方面,所述多肽具有木聚糖酶活性。 
在一个方面,本发明也提供了具有共同的新颖性的编码木聚糖酶的核酸,因为它们都来自混合培养物。本发明提供了从混合培养物中分离出的编码木聚糖酶的核酸,其包括与本发明的示例性核酸例如SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ IDNO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ IDNO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ IDNO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ IDNO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、 SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ IDNO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ IDNO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ IDNO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ IDNO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ IDNO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ IDNO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQID NO:377或SEQ ID NO:379在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150或更多个残基的范围内具有至少大约10、15、20、25、30、35、40、45、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性的核酸序列。 
在一个方面,本发明也提供了具有共同的新颖性的编码木聚糖酶的核酸,因为它们都来自于环境来源,例如混合的环境来源、细菌来源和/或古细菌来源,见下面的表3。在一个方面,本发明提供了从环境来源例如混合的环境来源、细菌来源和/或古细菌来源分离出的编码木聚糖酶的核酸,其包括与本发明的示例性核酸在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多个残基的范围内具有至少大约10、15、20、25、30、35、40、45、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列 同一性的核酸序列,其中所述的核酸编码至少一种具有木聚糖酶活性的多肽,所述的序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的。 
在一个方面,本发明也提供了具有共同的新颖性的编码木聚糖酶的核酸,因为它们来自一个公同的糖苷酶家族,例如在下面图5中所示的家族5、6、8、10、11、26或30。 
在一个方面,所述的序列比较算法是BLAST 2.2.2版算法,其中过滤设置设为blastall-p blastp-d“nr pataa”-F F,其它所有选项都设为默认值。 
本发明的另一个方面是分离出的或重组的核酸,其包括本发明的核酸序列的至少10个连续碱基,与其实质上相同的(substantially identical)序列和与其互补的序列。 
在一个方面,所述木聚糖酶活性包括催化内部β-1,4-木糖苷键(internal β-1,4-xylosidic linkages)的水解。在一个方面,所述木聚糖酶活性包括内-1,4-β-木聚糖酶(endo-β-1,4-xylanase)活性。 
在一个方面,所述木聚糖酶活性包括水解木聚糖以产生更小分子量的木糖和木糖寡聚体。在一个方面,木聚糖包括阿拉伯糖基木聚糖,如水溶性阿拉伯糖基木聚糖。水溶性阿拉伯糖基木聚糖可以构成面团或面包制品。 
在一个方面,所述木聚糖酶活性包括水解含有1,4-β-糖苷连接的D-吡喃木糖的多糖。在一个方面,所述木聚糖酶活性包括水解半纤维素。在一个方面,所述木聚糖酶活性包括水解在木材或纸浆或纸制品中的半纤维素。在一个方面,本发明提供了减少木材或木制品中木素的方法,包括将木材或木制品与本发明的多肽接触。 
在一个方面,所述木聚糖酶活性包括催化饮料或饲料或食品中木聚糖的水解。饲料或食品包括基于谷类的动物饲料、麦芽汁或啤酒、乳或乳制品、水果或蔬菜。在一个方面,本发明提供了包含本发明的多肽的食物、饲料或饮料或饮料前体。食物可以是面团或面包制品。饮料或饮料前体可以是啤酒或麦芽汁。 
在一个方面,本发明提供了面团改良的方法,包括将面团或面包制品与本发明的至少一种多肽在足以改良面团的条件下接触。在一个方面,本发明提供了生产饮料的方法,包括在足以降低饮料粘度的条件下将本发明的至少一种多肽应用于饮料或饮料前体中。 
在一个方面,所述木聚糖酶活性包括在细胞例如植物细胞或微生物细胞中催化木聚糖的水解。 
在一个方面,所述的分离出的或重组的核酸编码具有热稳定的木聚糖酶活性的多肽。所述多肽在一定条件下可保留木聚糖酶活性,所述条件包括大约37℃至大约95℃、大约55℃至大约85℃、大约70℃至大约95℃或大约90℃至大约95℃的温度范围。 
另一个方面,所述的分离出的或重组的核酸编码具有耐热的木聚糖酶活性的 多肽。在暴露于超过37℃至大约95℃的温度或超过55℃至大约85℃的任何温度后,所述多肽仍可保留木聚糖酶活性。在暴露于大约1℃至大约5℃、大约5℃至大约15℃、大约15℃至大约25℃、大约25℃至大约37℃、大约37℃至大约95℃、大约55℃至大约85℃、大约70℃至大约75℃、或大约90℃至大约95℃或更多范围的温度后,所述多肽仍保留木聚糖酶活性。在一个方面,在暴露于超过90℃至大约95℃的温度后,在pH 4.5的多肽仍保留木聚糖酶活性。 
本发明提供了分离出的或重组的核酸,其包括在严紧条件(stringent conditions)下可与含有本发明序列的核酸杂交的序列,所述的本发明序列例如在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ IDNO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ IDNO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ IDNO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ IDNO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQID NO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ IDNO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、 SEQ ID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ IDNO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ IDNO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ IDNO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ IDNO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQID NO:373、SEQ ID NO:375、SEQ ID NO:377或SEQ ID NO:379中所示的序列,或其片段或其子序列。在一个方面,所述核酸编码具有木聚糖酶活性的多肽。所述核酸的长度可以是至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200或更多个残基或基因或转录物的全长。在一个方面,所述严紧条件包括清洗步骤,其包括在大约65℃的温度用0.2×SSC清洗大约15分钟。 
本发明提供了可用于鉴定编码具有木聚糖酶活性的多肽的核酸的核酸探针,其中所述的探针包括一个序列的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多个连续的碱基,所述序列包括本发明的序列或其片段或其子序列,其中通过所述探针的结合或杂交可鉴定所述核酸。所述探针可以包括含有一个序列的至少大约10至50、大约20至60、大约30至70、大约40至80、或大约60至100个连续碱基的寡聚核苷酸,所述的序列包括本发明的序列,或其片段或其子序列。 
本发明提供了可用于鉴定编码具有木聚糖酶活性的多肽的核酸的核酸探针,其中所述的探针包括含有与本发明的核酸在至少大约10、15、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或更多个残基的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性的序列的核酸,其中所述的序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的。 
所述探针可以包括含有本发明核酸序列或其子序列的至少大约10至50、大约20至60、大约30至70、大约40至80、大约60至100个连续碱基的寡聚核苷酸。 
本发明提供了可用于扩增编码具有木聚糖酶活性的多肽的核酸的扩增引物对,其中所述的引物对能够扩增包括本发明的序列或其片段或其子序列在内的核酸。所述扩增引物序列对的一个成员或每一个成员可以包括寡聚核苷酸,其含有序列的至少大约10至50个连续碱基,或序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个连续碱基。 
本发明提供了扩增引物对,其中所述的引物对所包含的第一个成员具有的序列显示为本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基,第二个成员具有的序列显示为第一个成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个残基。 
本发明提供了利用本发明的扩增引物对通过扩增例如通过聚合酶链式反应(PCR)所产生的编码木聚糖酶的核酸。本发明提供了利用本发明的扩增引物对通过扩增例如通过聚合酶链式反应(PCR)所产生的木聚糖酶。本发明提供了利用本发明的扩增引物对通过扩增例如通过聚合酶链式反应(PCR)制备木聚糖酶的方法。在一个方面,所述扩增引物对可从文库例如基因文库,如环境文库中扩增核酸。 
本发明提供了扩增编码具有木聚糖酶活性的多肽的核酸的方法,包括使用能够扩增本发明的核酸序列或其片段或其子序列的扩增引物序列对来扩增模板核酸。 
本发明提供了包括本发明的核酸或其子序列的表达序列盒(expression cassette)。在一个方面,所述的表达序列盒可以含有与启动子有效连接的(operably linked)核酸。所述启动子可以是病毒、细菌、哺乳动物或植物启动子。在一个方面,植物启动子可以是马铃薯、水稻、玉米、小麦、烟草或大麦启动子。启动子可以是组成型启动子。所述组成型启动子可以包括CaMV35S。在另一个方面,启动子可以是诱导型启动子。在一个方面,启动子可以是组织特异性启动子或受环境调节或受发育调节的启动子。因此,启动子可以是例如种子特异性、叶特异性、根特异性、茎特异性或脱落诱导的(abscission-induced)启动子。在一个方面,所述表达序列盒可以进一步包括植物或植物病毒表达载体。 
本发明提供了包括本发明的表达序列盒(如载体)或本发明的核酸的克隆媒介物(vehicles)。所述克隆媒介物可以是病毒载体、质粒、噬菌体、噬粒(phagemid)、粘粒(cosmid)、fos-质粒(fosmid)、细菌噬菌体或人工染色体。所述病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关病毒载体。所述克隆媒介物可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生的载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。 
本发明提供了含有本发明的核酸或本发明的表达序列盒(例如载体)或本发 明的克隆媒介物的转化细胞。在一个方面,所述转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。在一个方面,植物细胞可以是谷类、马铃薯、小麦、水稻、玉米、烟草或大麦细胞。 
本发明提供了含有本发明的核酸或本发明的表达序列盒(例如载体)的转基因非人动物。在一个方面,所述动物是鼠。 
本发明提供了含有本发明的核酸或本发明的表达序列盒(例如载体)的转基因植物。所述转基因植物可以是谷类植物、玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。 
本发明提供了含有本发明的核酸或本发明的表达序列盒(例如载体)的转基因种子。所述的转基因种子可以是谷类植物、玉米种子、小麦种子、含油种子、油菜籽、大豆种子、棕榈仁、向日葵籽、芝麻籽、花生或烟草植物种子。 
本发明提供了反义寡聚核苷酸,其包含了与本发明核酸互补或者能够在严紧条件下与本发明核酸杂交的核酸序列。本发明提供了在细胞中抑制木聚糖酶信息的翻译的方法,包括将反义寡聚核苷酸给予细胞或在细胞中表达反义寡聚核苷酸,所述反义寡聚核苷酸含有与本发明核酸互补的或者能够在严紧条件下与本发明核酸杂交的核酸序列。本发明提供了含有本发明的序列的子序列的双链抑制性RNA(RNAi)分子。在一个方面,所述RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。本发明提供了抑制木聚糖酶在细胞中表达的方法,包括将双链抑制性RNA(RNAi)给予细胞或在细胞中表达双链抑制性RNA(RNAi),其中所述的RNA含有本发明序列的子序列。 
本发明提供了分离出的或重组的多肽,包括与本发明的示例性多肽或肽在至少大约25、50、75、100、125、150、175、200、225、250、275、300、325、350或更多个残基或全长多肽的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性的氨基酸序列,所述的序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的。所述的本发明的示例性多肽或肽序列包括SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ IDNO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ IDNO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ IDNO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ IDNO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ IDNO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ IDNO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ IDNO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ IDNO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ IDNO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ IDNO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ IDNO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ IDNO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ IDNO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ IDNO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ IDNO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ IDNO:376、SEQ ID NO:378或SEQ ID NO:380,及其子序列和其变异体。示例性的多肽也包括长度为至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600或更多个残基的片段,或酶的全长。本发明的示例性多肽或肽序列包括由本发明的核酸编码的序列。本发明的示 例性多肽或肽序列包括特异地结合本发明的抗体的多肽或肽。在一个方面,本发明的多肽具有至少一种木聚糖酶活性。 
本发明的另一个方面提供了分离出的或重组的多肽或肽,包括本发明的多肽或肽序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100或更多个连续碱基,与其实质上相同的序列,和与其互补的序列。所述肽可以是例如一种免疫原性片段、一种基序(例如结合位点)、一种信号序列、一种前体序列(prepro sequence)或活性位点。 
本发明提供了分离出的或重组的核酸,其包含编码具有木聚糖酶活性的多肽的序列和信号序列,其中所述的核酸包括本发明的序列。所述信号序列来自另一种木聚糖酶或非木聚糖酶的(异源)酶。本发明提供了分离出的或重组的核酸,其包含编码具有木聚糖酶活性的多肽的序列,其中所述的序列不含有信号序列,所述核酸包括本发明的序列。 
在一个方面,木聚糖酶活性包括催化内部β-1,4-木糖苷键的水解。在一个方面,木聚糖酶活性包括内-1,4-β-木聚糖酶活性。在一个方面,木聚糖酶活性包括水解木聚糖产生更小分子量的木糖和木糖寡聚物。在一个方面,木聚糖包括阿拉伯糖基木聚糖,如水溶性阿拉伯糖基木聚糖。水溶性阿拉伯糖基木聚糖可以构成面团或面包制品。 
在一个方面,木聚糖酶活性包括水解含有1,4-β-糖苷连接的D-吡喃木糖。在一个方面,木聚糖酶活性包括水解半纤维素。在一个方面,木聚糖酶活性包括水解木材或纸浆或纸制品中的半纤维素。 
在一个方面,木聚糖酶活性包括水解饲料或食品中的木聚糖。饲料或食品可以包括基于谷类的动物饲料、麦芽汁或啤酒、牛奶或乳制品、水果或蔬菜。 
在一个方面,木聚糖酶活性包括在细胞例如植物细胞或微生物细胞中催化木聚糖的水解。 
在一个方面,木聚糖酶活性是热稳定的。所述多肽在下面的条件下可保留木聚糖酶活性,所述条件包括大约1℃至大约5℃之间、大约5℃至大约15℃之间、大约15℃至大约25℃之间、大约25℃至大约37℃之间、大约37℃至大约95℃之间、大约55℃至大约85℃之间、大约70℃至大约75℃之间、或大约90℃至大约95℃之间,或更多的温度范围。在另一个方面,木聚糖酶活性是耐热的。所述多肽在暴露于超过37℃至大约95℃、或超过55℃至大约85℃范围的温度后仍保留木聚糖酶活性。在一个方面,所述多肽在暴露于超过90℃至大约95℃范围的温度后,在pH 4.5仍保留木聚糖酶活性。 
在一个方面,所述分离出的或重组的多肽可以包括缺少信号序列的本发明的多肽。在一个方面,所述分离出的或重组的多肽可以包括含有异源信号序列的本发明多肽,所述异源信号序列如异源木聚糖酶或非木聚糖酶的信号序列。 
在一个方面,本发明提供了嵌合蛋白,其包含含有本发明的信号序列的第一 结构域和至少一个第二结构域。所述蛋白可以是融合蛋白。所述第二结构域可以包含一种酶。所述酶可以是木聚糖酶。 
本发明提供了嵌合多肽,其包含含有本发明的信号肽(SP)、前体序列和/或催化结构域(CD)的至少第一结构域,和含有异源多肽或肽的至少第二结构域,其中所述的异源多肽或肽与信号肽(SP)、前体序列和/或催化结构域(CD)不是天然相关的。在一个方面,所述异源多肽或肽不是木聚糖酶。所述异源多肽或肽可以位于信号肽(SP)、前体序列和/或催化结构域(CD)的氨基末端、羧基末端或位于两个末端。 
本发明提供了分离出的或重组的编码嵌合多肽的核酸,其中所述的嵌合多肽包含含有本发明的信号肽(SP)、前体结构域(prepro domain)和/或催化结构域(CD)的至少第一结构域和含有异源多肽或肽的至少第二结构域,其中所述的异源多肽或肽与信号肽(SP)、前体结构域和/或催化结构域(CD)不是天然相关的。 
本发明提供了分离出的或重组的信号序列(例如信号肽),其由本发明的多肽的残基1至14、1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至40、1至41、1至42、1至43或1至44中所示的序列组成,所述的本发明的多肽例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ IDNO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ IDNO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQID NO:180、SEQ ID NO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、 SEQ ID NO:190、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ IDNO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ ID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ IDNO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ IDNO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ ID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ IDNO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ ID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ IDNO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ ID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ IDNO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ ID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ IDNO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQID NO:376、SEQ ID NO:378或SEQ ID NO:380。 
在一个方面,木聚糖酶活性包括在大约37℃时的比活(specific activity)为每毫克蛋白大约1至大约1200个单位,或每毫克蛋白大约100至大约1000个单位。在另一个方面,木聚糖酶活性包括比活为每毫克蛋白大约100至大约1000个单位,或每毫克蛋白大约500至大约750个单位。可选择地,木聚糖酶活性包括37℃时的比活为每毫克蛋白大约1至大约750个单位,或每毫克蛋白大约500至大约1200个单位。在一个方面,木聚糖酶活性包括37℃时的比活为每毫克蛋白大约1至大约500单位,或每毫克蛋白大约750至大约1000个单位。在另一个方面,木聚糖酶活性包括37℃时的比活为每毫克蛋白大约1至大约250个单位。可选择地,木聚糖酶活性包括在37℃时的比活为每毫克蛋白大约1至大约100个单位。在另一个方面,耐热性包括在被加热至高温后,仍能保留木聚糖酶在37℃的比活的至少一半。可选择地,耐热性可以包括在加热至高温后,可以保留在37℃的范围为每毫克蛋白大约1至大约1200个单位或每毫克蛋白大约500至大约1000个单位的比活。在另一个方面,耐热性可以包括在加热至高温后保留在37℃的范围为每毫克蛋白大约1至大约500个单位的比活。 
本发明提供了分离出的或重组的本发明的多肽,其中所述的多肽含有至少一 个糖基化位点。在一个方面,糖基化可以是N-连接糖基化。在一个方面,多肽可以在毕赤酵母(P.pastoris)或裂变酵母(S.pombe)中被表达后被糖基化。 
在一个方面,所述多肽可以在包括大约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4的条件下保留木聚糖酶活性。在另一个方面,所述多肽可以在包括大约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11的条件下保留木聚糖酶活性。在一个方面,所述多肽可以在暴露于包括大约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH 4的条件后保留木聚糖酶活性。在另一个方面,所述多肽可以在暴露于包括大约pH 7、pH 7.5、pH 8.0、pH 8.5、pH 9、pH 9.5、pH 10、pH 10.5或pH 11的条件后保留木聚糖酶活性。 
本发明提供了含有本发明的多肽的蛋白制剂,其中所述的蛋白制剂包括液体、固体或凝胶。 
本发明提供了含有本发明的多肽和第二蛋白或结构域的杂二聚体。杂二聚体的第二个成员是可以是一个不同的磷脂酶、不同的酶或其它的蛋白。在一个方面,第二结构域可以是一个多肽,杂二聚体可以是一个融合蛋白。在一个方面,第二结构域可以是一个表位(epitope,抗原结合部位)或标记(tag)。在一个方面,本发明提供了含有本发明的多肽的同型二聚体。 
本发明提供了具有木聚糖酶活性的固定化多肽,其中所述的多肽包括本发明的多肽、由本发明核酸编码的多肽、或含有本发明多肽和第二结构域的多肽。在一个方面,所述多肽可固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、平板、阵列或毛细管上。 
本发明提供了含有本发明的固定化核酸的阵列。本发明提供了含有本发明的抗体的阵列。 
本发明提供了分离出的或重组的可与本发明多肽或本发明核酸编码的多肽特异结合的抗体。所述抗体可以是单克隆或多克隆抗体。本发明提供了含有本发明的抗体的杂交瘤,所述的本发明的抗体例如可与本发明多肽或本发明核酸编码的多肽特异结合的抗体。 
本发明提供了分离或鉴定具有木聚糖酶活性的多肽的方法,包括以下步骤:(a)提供本发明的抗体;(b)提供含有多肽的样品;和(c)将步骤(b)的样品与步骤(a)的抗体在一定的条件下接触,其中所述的抗体可与多肽特异结合,因此可分离或鉴定具有木聚糖酶活性的多肽。 
本发明提供了制备抗木聚糖酶抗体的方法,包括将本发明的核酸或本发明的多肽或其子序列给予一种非人动物,其量足以产生体液免疫反应,由此制备出抗木聚糖酶抗体。本发明提供了进行抗木聚糖酶免疫的方法,包括将本发明的核酸或本发明的多肽或其子序列给予一种非人动物,其量足以产生免疫反应。 
本发明提供了产生重组多肽的方法,包括以下步骤:(a)提供与启动子有效连接的本发明的核酸,和(b)在允许多肽表达的条件下表达步骤(a)的核酸,由 此产生重组多肽。在一个方面,该方法可进一步包括用步骤(a)的核酸转化宿主细胞,然后表达步骤(a)的核酸,由此在转化细胞中产生重组的多肽。 
本发明提供了鉴定具有木聚糖酶活性的多肽的方法,包括以下步骤:(a)提供本发明的多肽或由本发明核酸编码的多肽;(b)提供木聚糖酶的底物;和(c)将步骤(a)的多肽或其片段或其变异体与步骤(b)的底物接触,并检测底物量的减少或反应产物量的增加,其中通过所述的底物量的减少或反应产物量的增加可检测出具有木聚糖酶活性的多肽。 
本发明提供了鉴定木聚糖酶底物的方法,包括以下步骤:(a)提供本发明的多肽或由本发明核酸编码的多肽;(b)提供受测底物;和(c)将步骤(a)的多肽与步骤(b)的受测底物接触,并检测底物量的减少或反应产物量的增加,其中通过所述的底物量的减少或反应产物量的增加可确定受测底物为木聚糖酶底物。 
本发明提供了确定受测化合物是否可与多肽特异结合的方法,包括以下步骤:(a)在允许核酸翻译为多肽的条件下表达核酸或含有核酸的载体,其中所述的核酸包括本发明的核酸,或提供本发明的多肽;(b)提供受测化合物;(c)将多肽与受测化合物接触;和(d)确定步骤(b)的受测化合物是否与多肽特异结合。 
本发明提供了鉴定木聚糖酶活性调节物的方法,包括以下步骤:(a)提供本发明的多肽或由本发明核酸编码的多肽;(b)提供受测化合物;(c)将步骤(a)的多肽与步骤(b)的受测化合物接触,测定木聚糖酶的活性,其中与缺少该受测化合物时的活性相比,在存在该受测化合物时测定的木聚糖酶活性的变化可以用来确定该受测化合物是否可调节木聚糖酶活性。在一个方面,通过提供木聚糖酶底物和检测底物量的减少或反应产物量的增加,或底物量的增加或反应产物量的减少来测定木聚糖酶的活性。与没有该受测化合物时的底物或反应产物的量相比,有该受测化合物时的底物量的减少或反应产物量的增加可确定该受测化合物为木聚糖酶活性的激活物。与没有该受测化合物时的底物量或反应产物的量相比,有检测化合物时的底物量的增加或反应产物量的减少可确定该受测化合物为木聚糖酶活性的抑制物。 
本发明提供了包括处理器和数据存储装置的计算机系统,其中所述的数据存储装置中已经储存了本发明的多肽序列或核酸序列(例如,由本发明核酸编码的多肽)。在一个方面,计算机系统可以进一步包括序列比较算法和其中储存有至少一条参考序列的数据存储装置。在另一个方面,序列比较算法包括可指示多态性的计算机程序。在一个方面,计算机系统可以进一步包括可鉴定所述序列中一种或多种特征的标识符(identifier,识别器)。本发明提供了已经储存了本发明的多肽序列或核酸序列的计算机可读介质。本发明提供了鉴定序列中特征的方法,包括以下步骤:(a)使用可鉴别序列中的一种或更多特征的计算机程序读取序列,其中所述的序列包括本发明的多肽序列或核酸序列;和(b)用计算机程序鉴定序列中的一种或更多特征。本发明提供了比较第一序列和第二序列的方法,包括以 下步骤:(a)通过使用可比较序列的计算机程序读取第一序列和第二序列,其中所述的第一序列包括本发明的多肽序列或核酸序列;和(b)用计算机程序测定第一序列和第二序列之间的差异。测定第一序列和第二序列之间差异的步骤可以进一步包括鉴定多态性的步骤。在一个方面,该方法可以进一步包括可鉴别序列中一种或更多特征的标识符。在另一个方面,该方法可以包括使用计算机程序读取第一序列,并鉴别序列中的一种或更多特征。 
本发明提供了从环境样品中分离或回收编码具有木聚糖酶活性的多肽的核酸的方法,包括以下的步骤:(a)提供可扩增编码具有木聚糖酶活性的多肽的核酸的扩增引物序列对,其中所述的引物对能够扩增本发明的核酸;(b)从环境样品中分离核酸或处理环境样品以便样品中的核酸能易与扩增引物对杂交;和(c)将步骤(b)的核酸与步骤(a)的扩增引物对组合,从环境样品中扩增核酸,由此可从环境样品中分离或回收编码具有木聚糖酶活性的多肽的核酸。扩增引物序列对的一个成员或每一个成员可以包括含有本发明序列的至少大约10至50个连续碱基的寡聚核苷酸。在一个方面,扩增引物序列对是本发明的扩增对。 
本发明提供了从环境样品中分离或回收编码具有木聚糖酶活性的多肽的核酸的方法,包括以下步骤:(a)提供含有本发明核酸或其子序列的多聚核苷酸探针;(b)从环境样品中分离核酸或处理环境样品以便样品中的核酸能够与步骤(a)的多聚核苷酸探针杂交;(c)将步骤(b)的分离出的核酸或已处理的环境样品与步骤(a)的多聚核苷酸探针组合;和(d)分离出能与步骤(a)的多聚核苷酸探针特异杂交的核酸,由此可从环境样品中分离或回收编码具有木聚糖酶活性的多肽的核酸。环境样品可以包括水样品、液体样品、土壤样品、空气样品或生物样品。在一个方面,生物样品可以来自细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。 
本发明提供了产生编码具有木聚糖酶活性的多肽的核酸的变异体的方法,包括以下步骤:(a)提供包括本发明核酸的模板核酸;和(b)在模板序列中修改、删除或添加一个或更多个核苷酸或进行以上处理的组合,产生模板核酸的变异体。在一个方面,该方法可以进一步包括表达所述的变异体核酸以产生木聚糖酶多肽变异体。可以通过如下的方法进行修改、添加或删除,包括易错PCR、重排(shuffling)、寡聚核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、基因重装配(例如,GeneReassemblyTM,参见例如美国专利6,537,776)、基因位点饱和诱变(GSSMTM)、合成连接重装配(SLR)和它们的组合。在另一个方面,可通过如下的方法进行修改、添加或删除,包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成和它们的组合。 
在一个方面,本方法可迭代重复,直至从模板核酸编码的多肽中产生具有改变的或不同的活性或改变的或不同的稳定性的木聚糖酶。在一个方面,所述木聚糖酶多肽变异体是耐热的,在暴露于较高温度后仍保留一些活性。在另一个方面,所述的木聚糖酶多肽变异体与由模板核酸编码的木聚糖酶相比,糖基化作用增加。可选择地,所述木聚糖酶多肽变异体在较高的温度具有木聚糖酶活性,其中由模板核酸编码的木聚糖酶在该较高的温度是没有活性的。在一个方面,本方法可迭代重复,直至从模板核酸中产生具有改变的密码子使用的木聚糖酶编码序列。在另一个方面,本方法可迭代重复,直至从模板核酸中产生具有更高或更低水平的信息表达或稳定性的木聚糖酶基因。 
在一个方面,本发明提供了分离出的或重组的核酸,其含有在SEQ ID NO:189中所示的序列,其中所述的SEQ ID NO:189含有以下突变中的一种或多种:位置22至24的核苷酸是TTC,位置31至33的核苷酸是CAC,位置34至36的核苷酸是TTG,位置49至51的核苷酸是ATA,位置31至33的核苷酸是CAT,位置67至69的核苷酸是ACG,位置178至180的核苷酸是CAC,位置190至192的核苷酸是TGT,位置190至192的核苷酸是GTA,位置190至192的核苷酸是GTT,位置193至195的核苷酸是GTG,位置202至204的核苷酸是GCT,位置235至237的核苷酸是CCA,或位置235至237的核苷酸是CCC。在一个方面,本发明提供了制备含有这条序列的核酸的方法,其中所述的在SEQ ID NO:189中的突变可通过基因位点饱和诱变(GSSMTM)来获得。 
在一个方面,本发明提供了构成SEQ ID NO:190的分离出的或重组的核酸,其中所述的SEQ ID NO:190含有下面的一种或多种突变:在氨基酸位置8上的天冬氨酸成为苯丙氨酸,在氨基酸位置11上的谷氨酰胺成为组氨酸,在氨基酸位置12上的天冬酰胺成为亮氨酸,氨基酸位置17上的甘氨酸成为异亮氨酸,氨基酸位置23上的苏氨酸成为由非野生型密码子编码的苏氨酸,氨基酸位置60上的甘氨酸成为组氨酸,氨基酸64上的脯氨酸成为半胱氨酸,氨基酸位置64上的脯氨酸成为缬氨酸,氨基酸位置65上的丝氨酸成为缬氨酸,氨基酸位置68上的甘氨酸成为异亮氨酸,氨基酸位置68上的甘氨酸成为丙氨酸,或氨基酸位置79上的缬氨酸成为脯氨酸。 
本发明提供了修饰编码具有木聚糖酶活性的多肽的核酸中的密码子以增加其在宿主细胞中表达的方法,该方法包括下面的步骤:(a)提供本发明的编码具有木聚糖酶活性的多肽的核酸;和(b)鉴别步骤(a)的核酸中不优选或不太优选的密码子,并将其替换以优选的或中度使用(neutrally used)的与被替换的密码子编码相同氨基酸的密码子,其中所述的优选密码子是在宿主细胞的基因的编码序列中出现频率较多的密码子,非优选或不太优选的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子,由此可修饰核酸以增加其在宿主细胞中的表达。 
本发明提供了修饰编码具有木聚糖酶活性的多肽的核酸中的密码子的方法, 该方法包括以下步骤:(a)提供本发明的核酸;和(b)鉴别步骤(a)的核酸中的密码子,并将其替换以与被替换的密码子编码相同氨基酸的不同密码子,由此可修饰编码木聚糖酶的核酸中的密码子。 
本发明提供了修饰编码具有木聚糖酶活性的多肽的核酸中的密码子以增加其在宿主细胞中表达的方法,该方法包括以下的步骤:(a)提供本发明的编码木聚糖酶多肽的核酸,和(b)鉴别步骤(a)的核酸中非优选或不太优选的密码子,并将其替换以优选的或中度使用的与被替换密码子编码相同氨基酸的密码子,其中所述的优选密码子是在宿主细胞基因的编码序列中出现频率较多的密码子,非优选或不太优选的密码子是在宿主细胞基因的编码序列中出现频率较少的密码子,由此可修饰核酸以增加其在宿主细胞中的表达。 
本发明提供了修饰编码具有木聚糖酶活性的多肽的核酸中的密码子以减少其在宿主细胞中的表达的方法,该方法包括以下步骤:(a)提供本发明的核酸;和(b)鉴别步骤(a)的核酸中的至少一个优选的密码子,并将其替换以与被替换密码子编码相同氨基酸的非优选的或不太优选的密码子,其中所述的优选密码子是在宿主细胞基因的编码序列中出现频率较多的密码子,非优选或不太优选的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子,由此可修饰核酸以减少其在宿主细胞中的表达。在一个方面,宿主细胞可以是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞或哺乳动物细胞。 
本发明提供了产生核酸文库的方法,所述核酸文库编码多个已修饰的木聚糖酶活性位点或底物结合位点,其中所述的已修饰的活性位点或底物结合位点衍生自含有编码第一活性位点或第一底物结合位点的序列的第一核酸,该方法包括以下步骤:(a)提供编码第一活性位点或第一底物结合位点的第一核酸,其中所述的第一核酸序列包括在严紧条件下可与本发明的核酸杂交的序列,所述核酸编码木聚糖酶活性位点或木聚糖酶底物结合位点;(b)提供一组诱变寡聚核苷酸,它们在第一核酸中的多个靶向密码子处编码天然发生氨基酸的变异体;和(c)使用该组诱变寡聚核苷酸以产生一组编码活性位点或编码底物结合位点的核酸变异体,它们在被诱变的各个氨基酸密码子处编码一定范围的氨基酸变异,由此可产生编码多个被修饰的木聚糖酶活性位点或底物结合位点的核酸文库。在一个方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包括优化的定向进化系统、基因位点饱和诱变(GSSMTM)、合成连接重装配(SLR)、易错PCR、重排、寡聚核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体诱变、位点专一性诱变、基因重装配(GeneReassemblyTM,美国专利6,537,776)、基因位点饱和诱变(GSSMTM)、合成连接重装配(SLR)及其组合。在另一个方面,本方法包括通过以下的方法诱变步骤(a)的第一核酸或变异体,所述方法包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修 复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变、限制纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成和它们的组合。 
本发明提供了制备小分子的方法,包括以下步骤:(a)提供多个能够合成或修饰小分子的生物合成酶,其中所述的酶之一包括由本发明核酸编码的木聚糖酶;(b)为步骤(a)中的至少一种酶提供底物;和(c)将步骤(b)中的底物与所述酶在可促进多个生物催化反应的条件下进行反应,通过一系列生物催化反应产生小分子。本发明提供了修饰小分子的方法,包括以下步骤:(a)提供木聚糖酶,其中所述的酶包括本发明的多肽,或由本发明的核酸或其子序列编码的多肽;(b)提供小分子,和(c)将步骤(a)的酶与步骤(b)的小分子在可促进由木聚糖酶催化的酶促反应的条件下反应,由此通过木聚糖酶酶促反应修饰小分子。在一个方面,本方法可以包含步骤(a)的酶的多个小分子底物,由此通过木聚糖酶催化的至少一个酶促反应产生被修饰小分子的文库。在一个方面,本方法可以包括多种其它的酶,在一定条件下可通过这些酶促进多个生物催化反应,形成由多个酶促反应产生的被修饰小分子的文库。在另一个方面,本方法可以进一步包括检测文库的步骤,以确定一种显示所需活性的特定的修饰小分子是否存在于文库中。检测文库的步骤可以进一步包括在文库内系统性去除用来产生一部分多个修饰小分子的生物催化反应中的一个反应之外的所有反应,通过检测一部分修饰小分子中是否存在具有所需活性的特定的修饰小分子,鉴定产生具有所需活性的特定修饰小分子的至少一个特定的生物催化反应。 
本发明提供了确定木聚糖酶的功能片段的方法,包括以下步骤:(a)提供木聚糖酶,其中所述的酶包括本发明的多肽,或由本发明核酸或其子序列编码的多肽;和(b)从步骤(a)的序列中删除多个氨基酸残基,检测剩余子序列的木聚糖酶活性,由此可确定木聚糖酶的功能片段。在一个方面,木聚糖酶活性的测定是通过提供木聚糖酶底物,并检测底物量的减少或反应产物量的增加来完成的。 
本发明提供了通过应用实时代谢流分析(real-time metabolic flux analysis)对新的或修饰的表现型进行全细胞工程改造的方法,该方法包括以下步骤:(a)通过修饰细胞的遗传组成,产生修饰的细胞,其中所述遗传组成通过往所述细胞中添加本发明的核酸而被修饰;(b)培养所述修饰的细胞,产生多个修饰的细胞;(c)通过以实时方式监控步骤(b)的细胞培养物,测量所述细胞的至少一种代谢参数;(d)分析步骤(c)的数据,确定测量到的参数是否与在相似条件下的未修饰细胞有所不同,从而应用实时代谢流分析确定所述细胞中工程化的表型。一方面,所述细胞的遗传组成可以通过包括删除细胞中的序列或修饰细胞中的序列,或者敲除基因的表达的方法而被修饰。一方面,所述方法可以进一步包括选择含有新的工程化表型的细胞。另一方面,所述方法可以进一步包括培养被选择的细胞,由此产生含有新的工程化表型的细胞株。 
本发明提供了增加木聚糖酶多肽的耐热性或热稳定性的方法,该方法包括糖 基化木聚糖酶多肽,其中所述的多肽含有本发明多肽的至少30个连续氨基酸;或由本发明核酸序列编码的多肽,由此增加木聚糖酶多肽的耐热性或热稳定性。在一个方面,木聚糖酶的比活在超过大约37℃至大约95℃的范围内的温度可以是热稳定或耐热的。 
本发明提供了在细胞中过量表达重组的木聚糖酶多肽的方法,包括表达含有核酸的载体,所述核酸包括本发明的核酸,或者表达本发明的核酸序列,其中序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的,其中所述的过量表达受高活性启动子的应用、双顺反子载体的应用或载体的基因扩增的影响。 
本发明提供了制备转基因植物的方法,包括以下步骤:(a)将异源核酸序列导入进细胞中,其中所述的异源核酸序列包括本发明的核酸序列,由此可产生转化的植物细胞;和(b)从转化的细胞中产生转基因植物。在一个方面,步骤(a)可以进一步包括通过电穿孔或微注射植物细胞原生质体来导入异源核酸序列。在另一个方面,步骤(a)可以进一步包括通过DNA微粒轰击(DNA particle bombardment)直接将异源核酸序列导入进植物组织中。可选择地是,步骤(a)可以进一步包括采用根癌农杆菌(Agrobacterium tumefaciens)宿主将异源核酸序列导入进植物细胞DNA中。在一个方面,植物细胞可以是马铃薯、玉米、水稻、小麦、烟草或大麦细胞。 
本发明提供了在植物细胞中表达异源核酸序列的方法,包括以下步骤:(a)用与启动子有效连接的异源核酸序列转化植物细胞,其中所述的异源核酸序列包括本发明的核酸;(b)在一定条件下使植物生长,其中所述的异源核酸序列在植物细胞中表达。本发明提供了在植物细胞中表达异源核酸序列的方法,包括以下步骤:(a)用与启动子有效连接的异源核酸序列转化植物细胞,其中所述的异源核酸序列包括本发明的序列;(b)在一定条件下使植物生长,其中所述的异源核酸序列在植物细胞中表达。 
本发明提供了水解、降解或破坏含有木聚糖的组合物的方法,包括以下步骤:(a)提供本发明的具有木聚糖酶活性的多肽,或由本发明核酸编码的多肽;(b)提供含有木聚糖的组合物;和(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述的木聚糖酶可水解、降解或破坏含有木聚糖的组合物。在一个方面,所述组合物包括植物细胞、细菌细胞、酵母细胞、昆虫细胞或动物细胞。因此,所述组合物可以包括任何植物或植物部分、任何含木聚糖的食物或饲料、废物或类似物。本发明提供了液化或去除含木聚糖的组合物的方法,包括以下步骤:(a)提供具有木聚糖酶活性的本发明的多肽,或由本发明核酸编码的多肽;(b)提供含有木聚糖的组合物;和(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述的木聚糖酶可去除、软化或液化含木聚糖的组合物。 
本发明提供了含有本发明的多肽或由本发明核酸编码的多肽的去垢剂组合 物,其中所述的多肽具有木聚糖酶活性。木聚糖酶可以是一种非表面活性的木聚糖酶或表面活性木聚糖酶。木聚糖酶可配制成非水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶形式、糊剂或膏剂形式。本发明提供了清洗物体的方法,包括以下步骤:(a)提供包含具有木聚糖酶活性的本发明多肽或由本发明核酸编码的多肽的组合物;(b)提供物体;和(c)将步骤(a)的多肽与步骤(b)的物体在一定条件下接触,其中所述的组合物可清洗该物体。 
本发明提供了纺织品或织物,包括例如线,其包含本发明的多肽或由本发明核酸编码的多肽。在一个方面,纺织品或织物包括含木聚糖的纤维。本发明提供了处理纺织品或织物(例如,从组合物中去除染料)的方法,包括以下步骤:(a)提供包含具有木聚糖酶活性的本发明多肽或由本发明核酸编码的多肽的组合物;(b)提供含有木聚糖的纺织品或织物;和(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述的木聚糖酶可处理纺织品或织物(例如,去除染料)。本发明提供了改善织物光洁度的方法,包括以下步骤:(a)提供包含具有木聚糖酶活性的本发明多肽或由本发明核酸编码的多肽的组合物;(b)提供织物;和(c)将步骤(a)的多肽和步骤(b)的织物在一定条件下接触,其中所述的多肽可处理织物,由此可改善织物的光洁度。在一个方面,织物是毛料或丝绸。 
本发明提供了含有本发明多肽或由本发明核酸编码的多肽的饲料或食品。本发明提供了在动物食用前水解饲料或食物中木聚糖的方法,包括以下步骤:(a)获得含有本发明的木聚糖酶或由本发明核酸编码的木聚糖酶的饲料原料;和(b)将步骤(a)的多肽加入至饲料或食物原料中,其量足以在足够的时间内引起木聚糖的水解,形成被处理的食物或饲料,由此可以在被动物食用之前水解食物或饲料中的木聚糖。在一个方面,本发明提供了在动物食用之后水解饲料或食物中木聚糖的方法,包括以下步骤:(a)获得含有本发明的木聚糖酶或由本发明核酸编码的木聚糖酶的饲料原料;(b)将步骤(a)的多肽加入至饲料或食物原料中;和(c)将饲料或食物原料给予动物,其中在被食用后,木聚糖酶可在动物的消化道中水解饲料或食物中的木聚糖。食物或饲料可以是,例如谷类食物、谷粒、玉米和类似物。 
本发明提供了动物的食物或营养添加剂,其含有本发明的多肽,例如由本发明核酸编码的多肽。在一个方面,食物或营养添加剂中的多肽可被糖基化。本发明提供了可食用的酶输送基质,其含有本发明的多肽,例如由本发明核酸编码的多肽。在一个方面,输送基质包括小丸。在一个方面,多肽可被糖基化。在一个方面,木聚糖酶活性是耐热的。在另一个方面,木聚糖酶活性是热稳定的。 
本发明提供了含有本发明多肽的食物、饲料或营养添加剂。本发明提供了使用木聚糖酶作为动物饮食中的营养添加剂的方法,该方法包括:制备含有木聚糖酶的营养添加剂,所述木聚糖酶含有本发明多肽的至少30个连续氨基酸;将该营 养添加剂给予动物以增加动物摄入的饲料或食物中所包含的木聚糖的利用。动物可以是人、反刍动物或单胃动物。木聚糖酶的制备可通过在生物体中表达编码木聚糖酶的多聚核苷酸来完成,所述生物体包括细菌、酵母、植物、昆虫、真菌和动物。所述生物体可选自裂变酵母(S.pombe)、啤酒酵母(S.Cerevisiae)、毕赤酵母(Pichia pastoris)、假单胞菌属(Pseudomonas sp.)、大肠杆菌(E.coli)、链霉菌属(Streptomyces sp.)、杆菌属(Bacillus sp.)和乳酸杆菌属(Lactobacillus sp.)。 
本发明提供了可食用的酶输送基质,其含有热稳定的重组木聚糖酶,例如本发明的多肽。本发明提供了将木聚糖酶添加剂输送至动物的方法,该方法包括:以丸的形式制备可食用的酶输送基质,其含有粒状的可食用载剂和热稳定的重组木聚糖酶,其中所述的丸可很容易地将包含在其中的木聚糖酶分散进入水介质中,并将可食用的酶输送基质施用于动物。重组木聚糖酶可以包含本发明的多肽。粒状的可食用载剂可以包括选自谷物胚芽、去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗粉的载剂。可食用的载剂包括去油的谷物胚芽。木聚糖酶可被糖基化以便在制丸条件下提供热稳定性。输送基质可通过将含有谷物胚芽和木聚糖酶的混合物制成丸剂而形成。制丸的条件可以包括使用蒸汽。制丸条件可以包括应用的温度为超过大约80℃,进行大约5分钟,酶保留的比活为每毫克酶至少350至大约900个单位。 
本发明提供了改善乳制品的质地和味道的方法,包括以下步骤:(a)提供具有木聚糖酶活性的本发明多肽,或由本发明核酸编码的木聚糖酶;(b)提供乳制品;和(c)将步骤(a)的多肽与步骤(b)的乳制品在一定的条件下接触,其中所述的木聚糖酶可改善乳制品的质地或味道。在一个方面,乳制品包括干酪或乳酪。本发明提供了含有本发明的木聚糖酶或由本发明核酸编码的木聚糖酶的乳制品。 
本发明提供了改进从富含油的植物原料中提取油的方法,包括以下步骤:(a)提供具有木聚糖酶活性的本发明多肽,或由本发明核酸编码的木聚糖酶;(b)提供富含油的植物原料;和(c)将步骤(a)的多肽与富含油的植物原料接触。在一个方面,富含油的植物原料包括富含油的种子。油可以是豆油、橄榄油、菜籽(canola)油或向日葵油。 
本发明提供了制备水果或蔬菜汁、果汁、酱或提取物的方法,包括以下步骤:(a)提供具有木聚糖酶活性的本发明多肽,或由本发明核酸编码的木聚糖酶;(b)提供含有水果或蔬菜原料的组合物或液体;和(c)将步骤(a)的多肽和组合物接触,由此制备水果或蔬菜汁、果汁、酱或提取物。 
本发明提供了含有本发明的木聚糖酶,或由本发明核酸编码的多肽的纸或纸制品或纸浆。本发明提供了处理纸或纸浆或木浆的方法,包括以下步骤:(a)提供具有木聚糖酶活性的本发明的多肽,或由本发明的核酸编码的木聚糖酶;(b) 提供含有纸或纸浆或木浆的组合物;和(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,其中所述的木聚糖酶可处理纸或纸浆或木浆。在一个方面,药物组合物可用作一种消化助剂或一种抗微生物剂(例如,抗沙门氏菌)。在一个方面,处理是预防性的。在一个方面,本发明提供了口腔护理产品,其含有具有木聚糖酶活性的本发明多肽,或由本发明核酸编码的木聚糖酶。口腔护理产品可以包括牙膏、牙用乳剂、凝胶或牙粉、牙齿用品、漱口剂、刷牙前或后的清洗剂、口香糖、止咳糖或冰糖。本发明提供了隐形眼镜清洗组合物,其含有具有木聚糖酶活性的本发明多肽,或由本发明核酸编码的木聚糖酶。 
在一个方面,本发明提供了保护动物免受含有木聚糖的微生物的影响的方法,其包括施用本发明的多肽。所述微生物可以是含有木聚糖的细菌,例如,沙门氏菌。 
本发明提供了分离出的核酸,其具有如SEQ ID NO:189中所示的序列,并提供了与SEQ ID NO:189具有至少50%的序列同一性、编码具有木聚糖酶活性的多肽的变异体。在一个方面,所述多肽具有木聚糖酶活性,例如热稳定的木聚糖酶活性。 
本发明提供了含有SEQ ID NO:189的分离出或重组的核酸,其中SEQ IDNO:189包括下列序列变异中的一个或多个或全部:位置22至24上的核苷酸是TTC、位置22至24上的核苷酸是TTT、位置31至33上的核苷酸是CAC、位置31至33上的核苷酸是CAT、位置34至36上的核苷酸是TTG、位置34至36上的核苷酸是TTA、位置34至36上的核苷酸是CTC、位置34至36上的核苷酸是CTT、位置34至36上的核苷酸是CTA、位置34至36上的核苷酸是CTG、位置49至51上的核苷酸是ATA、位置49至51上的核苷酸是ATT、位置49至51上的核苷酸是ATC、位置178至180上的核苷酸是CAC、位置178至180上的核苷酸是CAT、位置190至192上的核苷酸是TGT、位置190至192上的核苷酸是TGC、位置190至192上的核苷酸是GTA、位置190至192上的核苷酸是GTT、位置190至192上的核苷酸是GTC、位置190至192上的核苷酸是GTG、位置193至195上的核苷酸是GTG、位置193至195上的核苷酸是GTC、位置193至195上的核苷酸是GTA、位置193至195上的核苷酸是GTT、位置202至204上的核苷酸是ATA、位置202至204上的核苷酸是ATT、位置202至204上的核苷酸是ATC、位置202至204上的核苷酸是GCT、位置202至204上的核苷酸是GCG、位置202至204上的核苷酸是GCC、位置202至204上的核苷酸是GCA、位置235至237上的核苷酸是CCA、位置235至237上的核苷酸是CCC、或位置235至237上的核苷酸是CCG。 
本发明提供了分离出或重组的多肽,其包括含有SEQ ID NO:190的氨基酸序列,其中SEQ ID NO:190包括下列序列变异中的一个或多个或全部:氨基酸位置8上的天冬氨酸是苯丙氨酸,氨基酸位置11上的谷氨酰胺是组氨酸,氨基酸位置12上的天冬酰胺是亮氨酸,氨基酸位置17上的甘氨酸是异亮氨酸,氨基酸位置23上的苏氨酸是由非野生型密码子的密码子编码的苏氨酸,氨基酸位置60上的甘氨酸 是组氨酸,氨基酸位置64上的脯氨酸是半胱氨酸,氨基酸位置64上的脯氨酸是缬氨酸,氨基酸位置65上的丝氨酸是缬氨酸,氨基酸位置68上的甘氨酸是异亮氨酸,氨基酸位置68上的甘氨酸是丙氨酸,或氨基酸位置79上的丝氨酸是脯氨酸。在一个方面,多肽具有木聚糖酶活性,例如热稳定的木聚糖酶活性。 
本发明提供了分离出的或重组的核酸,其含有SEQ ID NO:189,其中SEQ IDNO:189包括在表1或表2中所示的序列变异中的一个或多个或全部。本发明提供了由含有SEQ ID NO:189的核酸编码的分离出的或重组的多肽,其中SEQ ID NO:189包括表1或表2中所示的序列变异中的一个或多个或全部。在一个方面,多肽具有木聚糖酶活性,例如热稳定的木聚糖酶活性。 
本发明提供了含有SEQ ID NO:379的分离出的或重组的核酸,其中SEQ IDNO:379包括下列序列变异中的一个或多个或全部:在位置22至24上的核苷酸是TTC、在位置3I至33上的核苷酸是CAC、在位置49至51上的核苷酸是ATA、在位置178至180上的核苷酸是CAC、在位置193至195上的核苷酸是GTG、在位置202至204上的核苷酸是GCT。 
本发明提供了含有SEQ ID NO:380的分离出的或重组的多肽,其中SEQ IDNO:380包括以下序列变异的一个或多个或全部:D8F、Q11H、G17I、G60H、S65V和/或G68A。在一个方面,多肽具有木聚糖酶活性,例如热稳定的木聚糖酶活性。 
本发明的分离出的或重组的核酸也被称为“A组核酸序列”。本发明提供了分离出的核酸,其包括在A组核酸序列中所示序列的至少10个连续碱基,与其实质上相同的序列和与其互补的序列。 
本发明的分离出的或重组的多肽——包括本发明的示例性序列的功能片段在内——也被称为“B组氨基酸序列”。本发明的另一个方面是分离出的或重组的核酸,其编码的多肽具有B组氨基酸序列中所示序列和与其实质上相同的序列的至少10个连续氨基酸。仍然在另一个方面,本发明提供了纯化的多肽,其具有B组氨基酸序列中所示的序列和与其实质上相同的序列。本发明的另一个方面是分离出的或纯化的抗体,其可与具有B组氨基酸序列中所示序列和与其实质上相同的序列的多肽特异结合。 
本发明的另一个方面是分离出的或纯化的抗体或其结合片段(binding fragment),其可与具有B组氨基酸序列和与其实质上相同的序列中的一种多肽的至少10个连续氨基酸的多肽特异结合。 
本发明的另一个方面是制备多肽的方法,所述多肽具有B组氨基酸序列中所示的序列和与其实质上相同的序列。该方法包括将编码所述多肽的核酸导入进宿主细胞中,其中所述的核酸可与启动子有效连接,并在允许核酸表达的条件下培养宿主细胞。本发明的另一个方面是制备多肽的方法,所述多肽具有B组氨基酸序列中所示序列和与其实质上相同的序列的至少10个氨基酸。该方法包括将编码所述多肽的核酸导入进宿主细胞中,其中所述的核酸可与启动子有效连接,并在允许 核酸表达的条件下培养宿主细胞,由此可产生多肽。 
本发明的另一个方面是产生变异体的方法,包括获得核酸,其具有A组核酸序列中所示序列、与其实质上相同的序列、与A组核酸序列中的序列互补的序列、含有前述序列的至少30个连续核苷酸的片段,将序列中的一个或多个核苷酸改变为别的核苷酸、删除序列中的一个或多个核苷酸或向序列中加入一个或多个核苷酸。 
本发明的另一个方面是计算机可读介质,在其上储存了A组核酸序列中所示的序列和与其实质上相同的序列,或B组氨基酸序列中所示的多肽序列和与其实质上相同的序列。 
本发明的另一个方面是计算机系统,其包括处理器和数据存储装置,其中所述的数据存储装置上面已经存储了A组核酸序列中所示的序列和与其实质上相同的序列,或B组氨基酸序列中所示的多肽序列和与其实质上相同的序列。 
本发明的另一个方面是比较第一序列和参考序列的方法,其中所述的第一序列是具有A组核酸序列中所示序列和与其实质上相同的序列的核酸,或B组氨基酸序列和与其实质上相同序列的多肽代码。该方法包括通过使用比较序列的计算机程序读取第一序列和参考序列;并使用计算机程序确定第一序列和参考序列之间的差异。 
本发明的另一个方面是鉴定在A组核酸序列所示的序列和与其实质上相同的序列中,或具有B组氨基酸序列所示的序列和与其实质上相同序列的多肽中的特征的方法,包括通过使用可鉴定序列中特征的计算机程序来读取序列;并用计算机程序来鉴别序列中的特征。 
本发明的又另一方面是催化木聚糖或其衍生物分解的方法,包括以下步骤:将含有木聚糖或其衍生物的样品与具有B组氨基酸序列和与其实质上相同的序列的多肽在可促进木聚糖分解的条件下接触。 
本发明的另一个方面是鉴定B组氨基酸序列和与其实质上相同的序列的片段或变异体的分析方法,所述片段或变异体保留了具有B组氨基酸序列和与其实质上相同的序列的多肽的酶功能。该分析方法包括将具有B组氨基酸序列、与其实质上相同的序列的多肽,或多肽片段或变异体与底物分子在可使多肽片段或变异体发挥作用的条件下接触,检测底物水平的减少或多肽和底物之间的反应的特异反应产物水平的增加,由此可鉴定这样的序列的片段或变异体。 
本发明的另一个方面是长度为大约10至50个核苷酸的寡聚核苷酸核酸探针,其具有的至少10个连续核苷酸的片段与选自A组核酸序列中的核酸序列的核酸靶区域有至少50%的互补性;其与核酸靶区域在中度至高度严紧条件下杂交,形成可检测的靶:探针双链体。 
本发明的另一个方面是用于分离或鉴定木聚糖酶基因的多聚核苷酸探针,其具有与A组核酸序列之一的至少一个片段相同的或完全互补的序列。 
仍然在另一个方面,本发明提供了蛋白制剂,其含有的多肽具有选自B组氨基 酸序列的氨基酸序列和与其实质上相同的序列,其中所述的蛋白制剂是液体。 
仍然在本发明的另一个方面,提供了蛋白制剂,其含有的多肽具有选自B组氨基酸序列的氨基酸序列和与其实质上相同的序列,其中所述的多肽是固体。 
还是在本发明的另一个方面,提供了修饰小分子的方法,包括以下步骤:将由选自A组核酸序列、与其实质上相同的序列和与其互补的序列的多聚核苷酸编码的至少一种多肽与至少一种小分子混合,通过至少一个生物催化反应产生至少一种修饰的小分子,其中所述的至少一种多肽具有木聚糖酶活性。 
本发明的另一个方面是含有编码具有木聚糖酶活性的多肽的序列的克隆载体,所述的序列选自A组核酸序列、与其实质上相同的序列和与其互补的序列。 
本发明的另一个方面是含有编码具有木聚糖酶活性的多肽的序列的宿主细胞,所述的序列选自A组核酸序列、与其实质上相同的序列和与其互补的序列。 
仍然在另一个方面,本发明提供了能够在宿主细胞中复制的表达载体,该载体包含多聚核苷酸,该多聚核苷酸具有的序列选自A组核酸序列、与其实质上相同的序列、与其互补的序列和在低、中度和高度严紧条件下与具有任何前述序列的核酸杂交的分离核酸。 
在另一个方面,本发明提供了改进面团的方法,包括将面团与B组氨基酸序列和与其实质上相同的序列中的至少一种多肽在足以改进面团的条件下接触。 
本发明的另一个方面是生产饮料的方法,包括在足以降低麦芽汁或啤酒粘度的条件下施用B组氨基酸序列和与其实质上相同的序列中的至少一种多肽。 
本发明的木聚糖酶可用于破坏动物饲料中的高分子量阿拉伯糖基木聚糖。本发明的木聚糖酶的加入可通过改善消化率刺激生长速率,也可改善动物幼仔的质量。木聚糖酶可通过胃肠道发挥作用,降低肠的粘度和增加胰腺酶的扩散。另外,本发明的木聚糖酶可用于处理饲料谷类的胚乳细胞壁和蔬菜蛋白。在本发明的一个方面,本发明的新型的木聚糖酶可给予动物以便增加食物中木聚糖的利用。本发明的木聚糖酶的这种活性可用于破坏不溶的细胞壁材料,释放细胞壁中的营养物质,然后使其可被动物利用。它也可将半纤维素变化为营养糖类,这样可释放原来被包裹在细胞壁中的营养物质。木聚糖酶也可产生可以成为反刍动物微生物菌群的营养源的化合物。 
本发明的另一个方面提供了在动物饮食中使用木聚糖酶作为营养添加剂的方法,包括制备含有重组木聚糖酶的营养添加剂,该酶含有B组氨基酸序列和与其实质上相同的序列的至少30个连续氨基酸,并将该营养添加剂给予动物以增加被动物摄取的食物中所包含的木聚糖的利用。 
在本发明的另一个方面,提供了将木聚糖酶添加剂输送给动物的方法,其中该方法包括以丸的形式制备可食用的酶输送基质,该丸中含有颗粒状的可食用载剂和热稳定的重组木聚糖酶,其中所述的颗粒很容易将包含在其中的木聚糖酶分散进水介质中,并将这种可食用的酶输送基质给予动物。颗粒状的可食用载剂可 以包括选自去油的谷物胚芽、干草、苜蓿、梯牧草、大豆壳、向日葵籽粉和小麦粗粉的载剂。所述木聚糖酶可以具有B组氨基酸序列中所示的氨基酸序列和与其实质上相同的序列。 
在另一个方面,本发明提供了含有编码具有木聚糖酶活性的多肽的序列的分离出的核酸,其中所述的序列选自A组核酸序列、与其实质上相同的序列和与其互补的序列,其中所述的序列含有信号序列。本发明也提供了含有编码具有木聚糖酶活性的多肽的序列的分离出的核酸,其中所述的序列选自A组核酸序列、与其实质上相同的序列和与其互补的序列,其中所述的序列含有来自别的木聚糖酶的信号序列。另外,本发明提供了含有编码具有木聚糖酶活性的多肽的序列的分离出的核酸,其中所述的序列选自A组核酸序列、与其实质上相同的序列和与其互补的序列,其中所述的序列不含有信号序列。 
仍然是本发明的另一个方面,提供了分离出的核酸,它是SEQ ID NO:189的突变体。另一个方面还提供了氨基酸序列,它是SEQ ID NO:190的突变体。 
本发明的一个或多个实施方案的细节在下面的附图和描述中被显示。本发明的其他特征、目的和优势将显现在这些描述、附图和权利要求书中。 
在此引用的所有出版物、专利、专利申请、GenBank序列和ATCC保藏物均在此明确引入,可用作所有目的的参考。 
附图说明
下面的图是为了说明本发明的一些方面,不能被认为是限制由权利要求书所包含的发明范围。 
本专利或申请文件包含至少一个以彩色绘制的绘图。带有彩色绘图的本专利或专利申请出版物的复件将根据需要和支付必要费用后由专利局提供。 
图1是计算机系统的框图。 
图2是流程图,说明了将新的核酸或蛋白序列与序列数据库进行比较,以确定新序列与数据库中的序列之间的同源性水平的过程的一个方面。 
图3是流程图,说明了计算机中确定两条序列是否同源的过程的一个方面。 
图4是流程图,说明了用于检测序列中特征的存在的标识符过程300的一个方面。 
图5是野生型序列(SEQ ID NO:189和190)与8x突变体(SEQ ID NO:375,376)——表1中突变体D、F、H、I、S、V、X和AA的组合——的活性比较图(野生型木聚糖酶(SEQ ID NOs:189和190)和8x突变体的耐热性)。 
图6A显示了通过SEQ ID NO:190(由SEQ ID NO:189编码)的基因位点饱和诱变(GSSMTM)产生的SEQ ID NO:378(由SEQ ID NO:377编码)的9个氨基酸突变位点,如在下面实施例5中所详述的。 
图6B显示了在熔化温度转变中点(melting temperature transition midpoint,Tm)试验中SEQ ID NO:190和SEQ ID NO:378的去折叠,这是通过DSC对各种酶进行测 定得出的,如在下面实施例5中所详述的。 
图7A显示了酶SEQ ID NO:190和SEQ ID NO:378的pH和温度活性曲线,如在下面实施例5中所详述的。 
图7B显示了对酶SEQ ID NO:190和SEQ ID NO:378最佳的速率/温度活性,如在下面实施例5中所详述的。 
图7C显示了酶SEQ ID NO:190和SEQ ID NO:378的耐热性/残留活性,如下面实施例5中所详述的。 
图8A例示了由9个GSSMTM点突变的所有可能组合构成的GeneReassemblyTM文库,它被构建并用于筛选具有改善的耐热性和活性的变异体,如在下面实施例5中所详述的。 
图8B显示了在最佳温度和pH 6.0下,与SEQ ID NO:190(“野生型”)相比,“6X-2”变异体和“9X”变异体(SEQ ID NO:378)的相对活性,如下面实施例5中所详述的。 
图9A显示了在用SEQ ID NO:190(“野生型”)和“9X”变异体(SEQ ID NO:378)酶水解寡聚木糖(Xyl)3、(Xyl)4、(Xyl)5和(Xyl)6后获得的指纹,如在下面实施例5中所详述的。 
图9B显示了在用SEQ ID NO:190(“野生型”)和“9X”变异体(SEQ ID NO:378)酶水解山毛榉材木聚糖后获得的指纹,如在下面实施例5中所详述的。 
图10A是显示了通过GSSMTM进化所获得的优于SEQ ID NO:190(“野生型”)的热稳定性(由Tm表示)改进水平的示意图,如在下面实施例5中所详述的。 
图10B显示了通过GSSMTM和GeneReassemblyTM技术的结合所获得的SEQ IDNO:378和SEQ ID NO:380形式的酶改良“适合度图(fitness diagram)”,如下面实施例5中所详述的。 
图11是用于确定本发明的木聚糖酶是否可用于预处理纸浆的一个示例性的常规筛选方案的流程示意图(戴弗萨应用实验室生物漂白流程),如在下面实施例6中所详述的。 
在不同的图表中同样的参考标记表示同样的元素。 
发明详述 
本发明涉及木聚糖酶和编码它们的多聚核苷酸,以及制备和应用它们的方法。本发明的多肽的木聚糖酶活性包括具有水解酶活性的酶,例如能够水解木聚糖中存在的糖苷键的酶,例如催化水解内β-1,4-木糖苷键的酶。本发明的木聚糖酶可用来制备和/或加工食物、饲料、营养添加剂、纺织品、洗涤剂和类似物。本发明的木聚糖酶可用于药学组合物中和饮食助剂中。本发明的木聚糖酶可特别用于焙烤、动物饲料、饮料和造纸工艺中。 
定义 
术语“抗体”包括来源于(derived from)、出自于(modeled after)或大体上 编码于(substantially encoded by)一个免疫球蛋白基因或多个免疫球蛋白基因的肽或多肽或者其片断,它们能特异地结合于抗原或抗原决定部位,见例如,Fundamental Immunology,第三版,W.E.Paul,ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括结合抗原的部分,即,具有与抗原结合的能力的“抗原结合位点”(例如,片断、序列、互补性决定区(CDRs)),包括(i)Fab片断,由VL、VH、CL和CH1结构域组成的单价片断;(ii)F(ab’)2片断,包括在铰链区由二硫键连接的两个Fab片断的二价片断;(iii)由VH和CH1结构域组成的Fd片断;(iv)由抗体单臂(a single arm)的VL和VH结构域组成的Fv片断;(v)由VH结构域组成的dAb片断(Ward等,(1989)Nature 341:544-546),和(vi)分离出的互补性决定区(CDR)。单链抗体也被包括在术语“抗体”中。 
在此使用的术语“阵列”或“微阵列”或“生物芯片”或“芯片”是多个靶元素,每个靶元素包括固定在基底表面的确定区域上的确定量的一种或多种多肽(包括抗体)或核酸,以下进一步详细描述。 
正如在此使用的,术语“计算机”、“计算机程序”和“处理器”使用的是它们最广泛的一般内容,并可与所有设备结合,细节在以下详细描述。特定的多肽或蛋白的“编码序列”或“序列编码”是指当置于合适的调控序列的控制之下时,可转录和翻译成为多肽或蛋白的核酸序列。 
在此使用的短语“核酸”或“核酸序列”是指寡聚核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因组DNA或RNA,或合成的起点,它们可以是单链或双链,可以代表正义链或反义链,它们可以是肽核酸(PNA)或任何DNA样或RNA样材料,可以是天然或合成的。短语“核酸”或“核酸序列”包括寡聚核苷酸、核苷酸、多聚核苷酸,或它们的片段,基因组DNA或RNA(例如,mRNA、rRNA、tRNA、iRNA),或合成的起点,它们可以是单链或双链,可以代表正义链或反义链,可以是肽核酸(PNA),或任何DNA样或RNA样材料,可以具有天然或合成的起始点,包括例如iRNA、核糖核蛋白(例如,双链iRNA,例如,iRNPs)。该术语包含了含有天然核苷酸的已知类似物的核酸,寡聚核苷酸。该术语也包含了具有合成的骨架的核酸样结构,见例如,Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。“寡核苷酸”包括可以用化学合成的或者单链的多脱氧核苷酸或者双链的互补多脱氧核苷酸。这样合成的寡核苷酸没有5’磷酸,所以在没有激酶利用ATP增加磷酸基团的情况下,它不会与另外的寡核苷酸连接。合成的寡核苷酸可以与没有脱磷酸化的片断连接。 
特定多肽或蛋白的“编码序列”或编码特定多肽或蛋白的“核苷酸序列”,是当被置于合适调控序列的控制之下时被转录和翻译成多肽或蛋白的核酸序列。 
术语“基因”是指涉及产生多肽链的DNA片段;它包括在编码区域前面和后 面的区域(引导序列(leader)和尾部序列(trailer)),并且有时,个别的编码片段(外显子)之间有插入序列(内含子)。在此使用的“有效连接(operably linked)”是指两个或多个核酸(例如,DNA)片段之间的功能关系。典型的,它是指转录调控序列与被转录序列的功能关系。例如,启动子有效连接到编码序列,例如本发明的核酸,假如它刺激或调控该编码序列在合适的宿主细胞或别的表达系统中的转录的话。一般地,与被转录序列有效连接的启动子转录调控序列与该被转录序列是物理上邻接的,即,它们是顺式作用。然而,一些转录调控序列,例如增强子,并不需要物理邻接于或位置上靠近于转录被其增强的编码序列。 
在此所用的术语“表达序列盒”指的是可以影响结构基因(即,蛋白编码序列,例如本发明的木聚糖酶编码序列)在与这些序列相容的宿主中表达的核苷酸序列。表达序列盒至少包括与多肽编码序列有效连接的启动子;可选择地,也可以与例如转录终止信号的其它序列有效连接。必须的或有助于影响表达的其它要素也可以被使用,例如,增强子。所以,表达序列盒也包括质粒、表达载体、重组病毒、任何形式的重组“裸DNA”载体,以及类似物。“载体”包括能够感染细胞、转染细胞、短期或永久地转导细胞的核酸。可以认识到的是,载体可以是裸露的核酸或与蛋白或脂构成复合物的核酸。载体可选择地包括病毒的或细菌的核酸和/或蛋白质,和/或膜(例如,细胞膜、病毒脂质被膜等等)。载体包括,但不局限于复制子(例如,RNA复制子、噬菌体),DNA片段可以与复制子相连,而变得可以复制。载体包括,但不局限于RNA、自动地自我复制的环状或线状DNA或RNA(例如,质粒、病毒,以及类似物,见,例如美国专利5,217,879),并且包括表达质粒和非表达质粒。当重组微生物或细胞培养物被描述作为“表达载体”的宿主时,这包括染色体外的环状和线状DNA,以及已经整入到宿主染色体的DNA。当载体被宿主细胞保持时,载体或者可以在细胞有丝分裂期间作为自主结构稳定复制,或者整入到宿主基因组中。 
如在此使用的,术语“启动子”包括所有可以驱动在细胞例如植物细胞中编码序列的转录的序列。所以,本发明的构建物中使用的启动子包括顺式作用转录控制元件和调控序列,它们涉及调控或调节基因转录的时间和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、启动子、转录终止子、复制起点、染色体整合序列、5’和3’不翻译区,或涉及转录调控的内含子序列。这些顺式作用序列一般与蛋白质或别的生物分子相互作用(启动/关闭、调节、调控,等等)来进行转录。“组成型”的启动子是在多数环境条件和发育或细胞分化状态下持续驱动表达的启动子。“诱导型”或“调控型”启动子在环境条件或发育条件的影响下指导本发明的核酸的表达。可以影响诱导型启动子进行转录的环境条件的例子包括厌氧条件、提高的温度、干旱或有光。 
“组织特异性”启动子是只在特定细胞或组织或器官,例如植物或动物中,有活性的转录控制元件。组织特异性调控可以通过某些内在因子实现,内在因子 可以确保编码某种组织特异性蛋白的基因的表达。已知这样的因子存在于哺乳动物和植物中,以允许特异性的组织发育。 
术语“植物”包括整个植物、植物的部分(例如,叶、茎、花、根等等)、植物原生质体、种子和植物细胞和其后代。一般地,可以在本发明的方法中使用的植物种类宽泛至可适于转化技术的高等植物,包括被子植物(单子叶植物和双子叶植物),还有裸子植物。它包括多种倍体型的植物,包括多倍体、二倍体、单倍体和半合子。如在此使用的,术语“转基因植物”包括这样的植物或植物细胞,其中插入有异源核酸序列,例如本发明的核酸和各种重组构建物(例如,表达序列盒)。 
“质粒”可以从商业上获得、在自由基础上从公众获得、或者根据公开的程序由可获得的质粒构建。与在此描述的质粒等效的质粒在本领域是已知的,并且对本领域技术人员来说是很显然的。 
在此所使用的“氨基酸”或“氨基酸序列”是指寡肽、肽、多肽或蛋白序列,或这些的片断、部分或亚基,天然发生的或合成的分子。 
“氨基酸”或“氨基酸序列”包括寡肽、肽、多肽或蛋白序列,或这些的片断、部分或亚基,天然发生的或合成的分子。在此所使用的术语“多肽”是指通过肽键或修饰的肽键彼此连接的氨基酸,后者即肽等配物,并且可以包含不同于编码基因的20个氨基酸的修饰的氨基酸。可以通过天然过程,如翻译后加工,或通过本领域中为人所熟知的化学修饰技术来修饰多肽。修饰作用可发生在多肽中的任何位置,包括肽骨架、氨基酸侧链和氨基或羧基末端。要理解的是,相同类型的修饰作用可以相同或不同的程度发生在指定多肽的几个位置上。指定的多肽也可发生多种类型的修饰作用。修饰作用包括乙酰化、酰化、ADP-核糖基化、酰胺化、核黄素的共价附着、血红素基团的共价附着、核苷酸或核苷酸衍生物的共价附着、脂质或脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联的环化作用、二硫键形成、脱甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧化、糖基化、形成GPI锚着(anchor)、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、聚乙二醇化、木聚糖水解酶加工、磷酸化、异戊二烯化、消旋化、硒化(selenoylation)、硫酸盐化和转运RNA介导的向蛋白中添加氨基酸如精氨酰化。(见Creighton,T.E.,Proteins-Structures and Molecular Properties,第二版,W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification of Proteins,B.C.Johnson主编,Academic Press,New York,1-12页(1983))。本发明的肽和多肽也包括所有“模拟(mimetic)”和“肽模拟物(peptidomimetic)”形式,如在下面进一步所详述的。 
如在此所使用的,术语“分离的”是指从其原始环境(例如,如果它是天然发生的,那么就指自然环境)中取出的材料。例如,存在于活的动物中的天然发生的多核苷酸或多肽就不是分离的,但是从天然系统中的一些或全部共存材料分 离到的同样的多核苷酸或多肽就是分离的。这些多核苷酸可以成为载体的一部分,和/或这些多核苷酸或多肽可以成为组合物的一部分,而它们仍然是分离的,因为这些载体或组合物不是天然环境的一部分。如在此所使用的,术语“纯化的”不要求绝对的纯净;相反,它是一个相对的定义。从文库中获得的单种核酸可以照惯例提纯到电泳同质。从这些克隆中获得的序列不能直接从文库中获得,或从人总DNA中获得。本发明的纯化核酸已经相对于生物体中基因组DNA的剩余部分纯化了至少104-106倍。但是,术语“纯化的”也包括已经从基因组DNA或文库中或别的环境中的别的序列中提纯的核酸,其纯度提高至少一个数量级,通常是二或三个数量级,更多的情况是四或五个数量级。 
如在此所使用的,术语“重组”的含义是核酸与在其自然环境中并不邻接的“骨架(backbone)”核酸相邻。另外,为了成为“被富集的(enriched)”,核酸要在核酸骨架分子的群体中占到核酸插入物数量的5%或更多。根据本发明的骨架分子所包括的核酸如表达载体、自我复制的核酸、病毒、整合核酸和其它载体或用来保留或操作感兴趣的核酸插入物的核酸。一般,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的15%或更多。更典型的,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的50%或更多。在一个方面,被富集的核酸在重组的骨架分子的群体中占到核酸插入物数量的90%或更多。 
“重组”多肽或蛋白是指通过重组DNA技术产生的多肽或蛋白;即从用编码所需多肽或蛋白的外源DNA构建物转化的细胞产生的多肽或蛋白。“合成的”多肽或蛋白是通过化学合成制备的多肽或蛋白。固相化学肽合成方法也可用来合成本发明的多肽或片段。自从二十世纪60年代早期在本领域中这种方法就是为人所熟知的(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,111.,11-12页))并已经在最近被用于商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)。这样的商业可获得的实验室试剂盒通常应用了H.M.Geysen等在Proc.Natl.Acad.Sci.,USA,81:3998(1984)中的教导,它们可在联系于单个板的多个“杆”或“钉”的尖端上合成多肽。当使用这样的系统时,一整板的杆或钉被倒转,并插入进第二个板的对应孔或容器中,其中含有可将一种合适的氨基酸附着或锚着到钉或杆的尖端上的溶液。通过重复这样的过程,即倒转和将杆和钉的尖端插入到合适的溶液中,氨基酸可被构建成为所需的肽。另外,许多现有的FMOC肽合成系统可以使用。例如,多肽或片段的组装可在固体支持物上使用Applied Biosystems公司的431A型自动肽合成仪来进行。这样的装置为本发明肽的合成提供了简便途径,它们通过直接合成或通过合成一系列可使用其它已知技术连接在一起的片段。 
启动子序列可“有效连接于”编码序列,此时可在启动子处启动转录的RNA聚合酶将编码序列转录为mRNA。 
“质粒”标注为前面为小写的″p″,后面为大写字母和/或数字。起始的质粒可以是市售的,可以不受限制地从公共获得,或可根据已发表的方法从现有的质粒构建出来。另外,与在此所述的质粒相当的质粒在本领域中是已知的,对普通技术人员是很明显的。 
DNA的“消化”是指使用仅可在DNA中某些序列上作用的限制性酶对DNA进行的催化切割。在此使用的各种限制型酶是商业渠道中可购得的,其使用的反应条件、辅助因子和其他必要条件是普通技术人员已知的。为了进行分析,一般1μg质粒或DNA片段在大约20μl缓冲溶液中使用大约2单位酶。为了分离DNA片段进行质粒构建,一般5至50μg的DNA用20至250单位酶在更大的体积中进行消化。特定的限制性酶的合适缓冲液和底物量由制造商说明。通常使用的孵育时间为在37℃大约1小时,但根据供应商的使用说明可以变化。在消化后,可以进行凝胶电泳以分离所需的片段。 
短语“实质上相同的(substantially identical)”就两个核酸或多肽而言,是指两条或多条序列被比较和比对(aligned)以确定最大一致性(maxium correspondence)时,具有例如至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的核苷酸或氨基酸残基(序列)同一性,所述的最大一致性可以通过使用任何一种已知的序列比较算法进行测量,或者通过观察检验得出。一般,实质上的同一性存在于至少大约100个残基的区域中,最普遍的是,在至少大约150-200个残基的区域中序列是实质上相同的。在一些方面,序列在编码区的整个长度上是实质上相同的。 
另外,“实质上相同的”氨基酸序列是通过一个或多个保守或非保守氨基酸的取代、删除或插入而与参考序列有差异的序列,特别是当这样的取代发生在分子的非活性位点上时,只要该多肽基本上保留其功能特性。保守的氨基酸取代例如将一个氨基酸取代为相同类型的另一个氨基酸(例如,用一种疏水氨基酸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸取代另一种疏水氨基酸,或用一种极性氨基酸替代另一种极性氨基酸,如用精氨酸取代赖氨酸,用谷氨酸取代天冬氨酸,或用谷氨酰胺取代天冬酰胺)。可以从例如木聚糖酶多肽中删除一个或多个氨基酸,产生多肽结构的修饰,而又不明显地改变其生物学活性。例如,对木聚糖酶生物学活性并不是必需的氨基或羧基末端氨基酸可被去掉。本发明的修饰的多肽序列可以通过任何方法来分析木聚糖酶生物学活性,包括将修饰的多肽序列与木聚糖酶底物接触,确定在该分析中修饰的多肽是否可降低特异底物的量或增加功能性木聚糖酶多肽与底物的酶反应的生物产物的量。 
如在此所使用的,“片段”是自然发生的蛋白的一部分,它可以以至少两种 不同的构象存在。片段可以具有与自然发生的蛋白相同的或基本上相同的氨基酸序列。“基本上相同”的含义是很大程度上但不是完全的相同,但又保留了与其相关的序列的至少一种功能活性。通常,如果至少大约85%是相同的,两个氨基酸序列就是“基本上相同的”或“实质上同源的”。也包括具有与自然发生的蛋白不同的三维结构的片段。这样的一个实例是“前体形式(pro-form)”分子,如低活性的蛋白原(proprotein),它可通过切割而被修饰,从而产生具有明显更高活性的成熟酶。 
“杂交”是指核酸链与互补链通过碱基配对联结的过程。杂交反应可以是灵敏的和选择性的,感兴趣的特定序列甚至可以在以非常低的浓度存在于样品中时仍可被识别出来。合适的严紧条件可以通过例如预杂交和杂交溶液中盐或甲酰胺的浓度,或者通过杂交温度被限定,这是在本领域广为人知的。例如,严紧性(stringency)可以通过降低盐浓度、增加甲酰胺的浓度、或者提高杂交温度而增加。在可替代的方面,本发明的核酸可以根据它们在不同严紧条件(例如,高、中、低)下杂交的能力而进行定义,如在此阐明的。 
例如,在高严紧性条件下的杂交可发生在大约50%甲酰胺、大约37℃至42℃。在降低的严紧性条件下的杂交可发生在大约35%至25%甲酰胺、大约30℃至35℃。特别地,在高严紧性条件下的杂交可发生在42℃、在50%甲酰胺、5XSSPE、0.3%SDS和200n/ml的剪切和变性的鲑鱼精DNA中。杂交可如上所述发生在降低的严紧性条件下,但在35%甲酰胺中、在降低的温度35℃。与特定水平的严紧性对应的温度范围可通过计算感兴趣的核酸中嘌呤和嘧啶的比例而进一步缩小,并相应地调整温度。对上述范围和条件的改变在本领域中是为人所熟知的。 
术语“变异体”是指在一个或多个碱基对、密码子、内含子、外显子或氨基酸残基处(分别)被修饰,但仍保留本发明的木聚糖酶生物学活性的本发明的多聚核苷酸或多肽。可通过任何方法来产生变异体,包括的方法如易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR(assembly PCR)、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变(recursive ensemble mutagenesis)、指数整体诱变(exponential ensemble mutagenesis)、位点专一性诱变、基因重装配(例如GeneReassemblyTM,见,例如美国专利6,537,776)、GSSMTM及其任何组合。 
表1和表2列举了通过GSSMTM突变SEQ ID NO:189(编码SEQ ID NO:190)获得的变异体。本发明提供了具有表1和表2中所示序列的1个或多个或所有的核酸,即具有SEQ ID NO:189的变异序列的核酸,其中变异如表1和表2所示,本发明还提供了由这些变异体编码的多肽。 
检测这些GSSMTM变异体(在表1和2中所示)的耐热性(见下面的实施例)。突变体D、F、G、H、I、J、K、S、T、U、V、W、X、Y、Z、AA、DD和EE被发现在表1中的突变体中具有最高的耐热性。突变体也可以被组合以形成一个更大的突变体。例如,表1中的突变体D、F、H、I、S、V、X和AA被组合形成一个命名 为“8x”的更大的突变体,其具有SEQ ID NO:375(编码多肽的核酸)和SEQ IDNO:376(氨基酸序列)中所示的序列。图5是野生型序列(SEQ ID NO:189和190)与8x突变体(SEQ ID NO:259和260)的活性比较的图表。在野生型和8x突变体的比较中,发现两者的最佳温度为65℃,两者的最佳pH为5.5。发现野生型序列在65℃保持其稳定性少于1分钟,而8x突变体(SEQ ID NO:375,376)被发现在85℃可保留其稳定性超过10分钟。使用的底物为AZO-AZO-木聚糖。在一个方面,8x突变体(SEQ ID NO:375,376)通过GSSMTM被进化。在另一个方面,野生型是用于耐热性进化的GSSMTM亲代。 
表1 
  突变体   突变   野生型序列   GSSMTM序列
  A   A2F   GCC   TTT
  B   A2D   GCC   GAC
  C   A5H   GCT   CAC
  D   D8F   GAC   TTC
  E   Q11L   CAA   CTC
  F   Q11H   CAA   CAC
  G   N12L   AAT   TTG
  H   N12L   AAT   TTG
  I   G17I   GGT   ATA
  J   Q11H、T23T   CAA、ACC   CAT、ACG
  K   Q11H   CAA   CAT
  L   S26P   TCT   CCG
  M   S26P   TCT   CCA
  N   S35F   TCA   TTT
  O   无变化   GTT   GTA
  P   A51P   GCA   CCG
  Q   A51P   GCA   CCG
  R   G60R   GGA   CGC
  S   G60H   GGA   CAC
  T   G60H   GGA   CAC
  U   P64C   CCG   TGT
  V   P64V   CCG   GTA
  W   P64V   CCG   GTT
  X   S65V   TCC   GTG
  Y   Q11H   CAA   CAT
  Z   G68I   GGA   ATA
  AA   G68A   GGA   GCT
  BB   A71G   GCT   GGA
  CC   无变化   AAT   AAC
  DD   S79P   TCA   CCA
 
  EE   S79P   TCA   CCC
  FF   T95S   ACT   TCT
  GG   Y98P   TAT   CCG
  HH   T114S   ACT   AGC
  II   无变化   AAC   AAC
  JJ   无变化   AGG   AGA
  KK   I142L   ATT   CTG
  LL   S151I   AGC   ATC
  MM   S138T、S151A   TCG、AGC   ACG、GCG
  NN   K158R   AAG   CGG
  OO   K160V、V172I   AAA、GTA   GTT、ATA
所产生的(SEQ ID NO:189的)变异体是较佳的变异体或具有较“野生型”(SEQ ID NO:189)在耐热性方面有所“改良”的变异体的密码子变异在图2中被突出显示。如上所提到的,本发明提供了含有表2和表1中所示的一种、数种或所有的变异的核酸和编码它们的多肽。 
表2 
在一个方面,B组氨基酸序列中一个氨基酸序列(SEQ ID NO:208)的氨基酸序列可通过单一的氨基酸突变而被修饰。在一个特定的方面,所述突变是天冬酰胺至天冬氨酸的突变。得到的氨基酸序列和对应的核酸序列分别如SEQ ID NO:252和SEQ ID NO:251所示。就木聚糖酶而言,已经显示了使酶的最佳pH获得改善的单个氨基酸突变,如对SEQ ID NO:208的突变。(见,例如,Joshi,M.,Sidhu,G.,Pot,I.,Brayer,G.,Withers,S.,Mclntosh,L.,J.Mol.Bio.299.255-279(2000))。也要注意的是,在这样的单氨基酸突变中,序列的某些部分可在亚克隆过程中被去除。例如,SEQ ID NO:207和SEQ ID NO:251在序列比对的区域中仅有一个核苷酸差异。但是,要注意的是,在SEQ ID NO:207的N末端的78个核苷酸区域在亚克隆中从SEQID NO:251的N末端上被去除。另外,在SEQ ID NO:251中的前三个核苷酸被改变为ATG,然后在SEQ ID NO:251中的第六个核苷酸处制造了点突变。 
术语“饱和诱变”、“基因位点饱和诱变”或“GSSMTM”包括使用简并寡核苷酸引物在多核苷酸中导入点突变的方法,以下详细描述。 
术语“优化的定向进化系统”或“优化的定向进化”包括用于重新装配相关核酸序列例如相关基因的片段的方法,以下详细描述。 
术语“合成的连接重装配(synthetic ligation reassembly)”或者“SLR”包括以非随机方式连接寡核苷酸片段的方法,以下详细描述。 
核酸的产生和操作
本发明提供了核酸(例如,SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ IDNO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ IDNO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ IDNO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ IDNO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ IDNO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ IDNO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ IDNO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ IDNO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ IDNO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217、SEQID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、SEQ ID NO:235、SEQ IDNO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ ID NO:243、SEQ ID NO:245、SEQID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ IDNO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ ID NO:271、SEQ ID NO:273、SEQID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ IDNO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ ID NO:299、SEQ ID NO:301、SEQID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ IDNO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ IDNO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ ID NO:355、SEQ ID NO:357、SEQID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377或SEQ ID NO:379;编码在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ IDNO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ IDNO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQ ID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ IDNO:182、SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQ ID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ IDNO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQID NO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQ ID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ IDNO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQID NO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQ ID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ IDNO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQID NO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQ ID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ IDNO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQID NO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQ ID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ IDNO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQID NO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQ ID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ IDNO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQID NO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQ ID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378 或SEQ ID NO:380中所示的多肽的核酸),包括表达序列盒如表达载体,其编码本发明的多肽。本发明也包括使用本发明的核酸发现新的木聚糖酶序列的方法。本发明也包括使用本发明的核酸抑制木聚糖酶基因、转录物和多肽的表达的方法。也提供了修饰本发明的核酸的方法,例如,通过合成连接重装配、优化的定向进化系统和/或饱和诱变。 
本发明的核酸可通过例如克隆和表达cDNA文库、PCR扩增信息或基因组DNA以及类似的方法来制备、分离和/或操作。例如,本发明的示例性序列最初来自于下述的来源: 
表3 
SEQ ID          来源 
1,2            细菌 
101,102        环境 
103,104        细菌 
105,106        环境 
107,108        细菌 
109,110        环境 
11,12          环境 
111,112        环境 
113,114        环境 
115,116        环境 
117,118        环境 
119,120        环境 
121,122        环境 
123,124        环境 
125,126        环境 
127,128        环境 
129,130        细菌 
13,14          环境 
131,132        环境 
133,134        环境 
135,136        环境 
137,138        环境 
139,140        环境 
141,142        环境 
143,144        细菌 
145,146        真核细胞 
147,148        环境 
149,150        环境 
15,16          环境 
151,152        环境 
153,154        环境 
155,156        环境 
157,158        环境 
159,160        环境 
161,162        环境 
163,164        环境 
165,166        环境 
167,168        环境 
169,170        环境 
17,18          细菌 
171,172        环境 
173,174        环境 
175,176        环境 
177,178        环境 
179,180        环境 
181,182        环境 
183,184        环境 
185,186        环境 
187,188        环境 
189,190        环境 
19,20          环境 
191,192        环境 
193,194        环境 
195,196        环境 
197,198        环境 
199,200        环境 
201,202        环境 
203,204        环境 
205,206        环境 
207,208        环境 
209,210        环境 
21,22          环境 
211,212        环境 
213,214        环境 
215,216        环境 
217,218        环境 
219,220        环境 
221,222        环境 
223,224        环境 
225,226        环境 
227,228        环境 
229,230        环境 
23,24          环境 
231,232        细菌 
233,234        环境 
235,236        环境 
237,238        环境 
239,240        环境 
241,242        环境 
243,244        环境 
245,246        环境 
247,248        环境 
249,250        环境 
25,26          环境 
251,252        环境 
253,254        环境 
255,256        环境 
257,258        环境 
259,260        环境 
261,262        环境 
263,264        环境 
265,266        环境 
267,268        细菌 
269,270        环境 
27,28          环境 
271,272        环境 
273,274        环境 
275,276        环境 
277,278        环境 
279,280        环境 
281,282        环境 
283,284        环境 
285,286        环境 
287,288        环境 
289,290        环境 
29,30          古细菌 
291,292        环境 
293,294        环境 
295,296        环境 
297,298        环境 
299,300        环境 
3,4            环境 
301,302        环境 
303,304        环境 
305,306        细菌 
307,308        环境 
309,310        环境 
31,32          环境 
311,312        环境 
313,314        细菌 
315,316        环境 
317,318        环境 
319,320        环境 
321,322        环境 
323,324        环境 
325,326        环境 
327,328        环境 
329,330        环境 
33,34          环境 
331,332        环境 
333,334        环境 
335,336        环境 
337,338        环境 
339,340        环境 
341,342        环境 
343,344        环境 
345,346        环境 
347,348        环境 
349,350        环境 
35,36          环境 
351,352        环境 
353,354        环境 
355,356        环境 
357,358        环境 
359,360        环境 
361,362        环境 
363,364        环境 
365,366        环境 
367,368        环境 
369,370        环境 
37,38          环境 
371,372        环境 
373,374        环境 
375,376        人造 
377,378        人造 
39,40          环境 
41,42          环境 
43,44          环境 
45,46          环境 
47,48          环境 
49,50          环境 
5,6            环境 
51,52          环境 
53,54          细菌 
55,56          环境 
57,58          环境 
59,60          环境 
61,62          环境 
63,64          环境 
65,66          环境 
67,68        环境 
69,70        环境 
7,8          环境 
71,72        环境 
73,74        环境 
75,76        环境 
77,78        环境 
79,80        环境 
81,82        环境 
83,84        环境 
85,86        细菌 
87,88        环境 
89,90        细菌 
9,10         环境 
91,92        环境 
93,94        环境 
95,96        环境 
97,98        环境 
99,100       环境 
在一个方面,本发明还提供了具有共同的新颖性的编码木聚糖酶的核酸,它们来自环境来源或细菌来源或古细菌来源。 
在实施本发明的方法时,同源基因可以通过对模板核酸的操作而被修饰,如在此所述。本发明也可与本领域中已知的任何方法或方案或装置联合实施,它们在科学文献和专利文献中已被详细描述。 
本发明的一个方面是分离出的核酸,其含有A组核酸序列之一、与其实质上相同的序列、与其互补的序列,或包含A组核酸序列(或与其互补的序列)中的一种序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段。分离出的核酸可以包括DNA,包括cDNA、基因组DNA和合成的DNA。DNA可以是双链或单链的,如果是单链,则可以是编码链或非编码(反义)链。可选择的是,分离出的核酸可以包括RNA。 
如在下面更详细描述的,具有A组核酸序列和与其实质上相同的序列中的一个序列的分离出的核酸,可用来制备B组氨基酸序列与其实质上相同的序列中的一种多肽,或包含B组氨基酸序列和与其实质上相同的序列中的一种序列的至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。 
因此,本发明的另一个方面是分离出的核酸,其编码B组氨基酸序列和与其实 质上相同的序列中的一种多肽,或包括B组氨基酸序列中的一种多肽的至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。这些核酸的编码序列与A组核酸序列的一种核酸的编码序列或其片段可以是相同的,或者,也可以是不同的编码序列,其编码B组氨基酸序列中的一种多肽、与其实质上相同的序列和具有B组氨基酸序列的一种多肽的至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,这是由于遗传代码的丰余或简并性。遗传代码对本领域的技术人员是已知的,可在例如B.Lewin,Genes VI,Oxford University Press,1997的214页上获得。 
编码B组氨基酸序列和与其实质上相同的序列中的一种多肽的分离出的核酸,包括但不限于:仅A组核酸序列和与其实质上相同的序列中的一种序列的编码序列,和其它的编码序列,如引导序列(leader sequences)或蛋白原序列(proprotein sequences)和非编码序列,如内含子或编码序列的5′和/或3′端非编码序列。因此,如在此所使用的,术语“编码多肽的多聚核苷酸”包括仅包含多肽的编码序列的多聚核苷酸以及包括其它额外的编码和/或非编码序列的多聚核苷酸。 
可选择地,可采用常规的技术如位点定向诱变或本领域专业技术人员熟悉的其它的技术,诱变A组核酸序列的核酸序列和与其实质上相同的序列,将一些沉默改变导入进A组核酸序列的多聚核苷酸和与其实质上相同的序列中。如在此所使用的,“沉默改变(silent changes)”包括,例如不改变由多聚核苷酸编码的氨基酸序列的改变。这样的改变可能是被需要的,以便通过导入在宿主生物体中频繁出现的密码子或密码子对来增加含有编码多肽的载体的宿主细胞所产生的多肽的水平。 
本发明也涉及具有可引起B组氨基酸序列和与其实质上相同的序列中的多肽发生氨基酸替代、添加、删除、融合和截断的核苷酸改变的多聚核苷酸。这样的核苷酸改变可使用一些技术被导入,如位点定向诱变、随机化学诱变、核酸外切酶III删除和其它重组DNA技术。可选择地是,这样的核苷酸改变可以是天然的等位基因变异,它们可以通过在此处所提供的高、中或低严紧条件下鉴定可与探针特异结合的核酸而被分离出来,所述探针含有A组核酸序列和与其实质上相同的序列(或与其互补的序列)中的一种序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基。 
一般技术 
用来实施本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或其杂交体,都可从多种来源分离、利用遗传工程进行改造、扩增和/或利用重组技术表达/产生。从这些核酸产生的重组多肽(例如,木聚糖酶)可以被单独分离或克隆,并检测所需的活性。可使用任何的重组表达系统,包括细菌、哺乳动物、酵母、昆虫或植物细胞表达系统。 
可选择地,这些核酸可以通过已知的化学合成技术体外合成,如在例如Adams(1983)J.Am.Chem.Soc,105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommere(1994)Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。 
核酸操作技术,例如亚克隆、标记探针(例如,使用Klenow聚合酶、切口平移、扩增来进行随机引物标记)、测序、杂交等等已经在科学和专利文献中详细描述过,见,例如Sambrook等,MOLECULAR CLONING:A LABORATORYMANUAL(第二版),1-3卷,Cold Spring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel等.John Wiley & Sons Inc.,New York(1997);LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,第I部分.Theory and Nucleic Acid Preparation,Tijssen等.Elsevier,N.Y.(1993)。 
另一种用于实践本发明的方法的有用的获得核酸和操作核酸的方法是从基因组样品中进行克隆,并且假如需要的话,筛选和再克隆从例如基因组克隆或cDNA克隆中分离或扩增出的插入物。在本发明的方法中使用的核酸来源包括基因组文库或cDNA文库,其被包含在例如哺乳动物的人工染色体(MACs)中,见,例如,美国专利5,721,118;6,025,155;人类人工染色体中,见,例如Rosenfeld(1997)Nat.Genet.15:333-335;酵母人工染色体(YAC)中;细菌人工染色体(BAC)中;P1人工染色体中,见,例如Woon(1998)Genomics 50:306-316;P1-衍生的载体(PACs)中,见,例如,Kern(1997)Biotechniques 23:120-124;粘粒、重组病毒、噬菌体或质粒中。 
一方面,编码本发明的多肽的核酸在合适的阶段与引导序列组合,该引导序列能够引导翻译出的多肽或其片断进行分泌。 
本发明提供融合蛋白和编码所述融合蛋白的核酸。本发明的多肽可以与异源的肽或多肽融合,例如与N端识别肽(N-terminal identification peptides)融合,该N端识别肽赋予所期望的特性,例如增加稳定性或使提纯简单化。为了例如产生更高免疫原性的肽、更容易地分离重组合成的肽、确定和分离抗体和表达抗体的B细胞,等等,本发明的肽和多肽也可以合成和表达为融合蛋白,其具有一个或多个与之连接的额外的结构域。有利于检测和提纯的结构域包括,例如,金属螯合肽,例如使得在固定化的金属上进行提纯成为可能的多组氨酸单元和组氨酸-色氨酸模式单元,使得在固定的免疫球蛋白上进行提纯成为可能的蛋白A结构域,和在FLAGS延展/亲和纯化系统中使用的结构域(Immunex Corp,Seattle WA)。为了有利于纯化,可以在纯化结构域和包含上述模体的肽或多肽之间引入可切割的连接序列,例如因子Xa或肠激酶(Inivitrogen,San Diego CA)。例如,表达载体可以包 括与六个组氨酸残基连接的编码抗原决定部位的核酸序列,并连接有硫氧还蛋白和肠激酶切割位点(见,例如,Williams(1995)Biochemistry 34:1787-1797;Dobeli(1998)Protein Expr.Purif 12:404-414)。组氨酸残基有利于检测和纯化,而肠激酶切割位点提供了将抗原决定部位从融合蛋白的剩余部分中纯化出来的方法。关于编码融合蛋白的载体的技术和融合蛋白的应用在科学和专利文献中有很好的描述,见,例如,Kroll(1993)DNA Cell.Biol.,12:441-53。 
转录和翻译控制序列 
本发明提供了与表达(例如,转录或翻译)控制序列有效连接的本发明的核酸(例如,DNA)序列,以指导或调控RNA合成/表达,这里的表达控制序列例如启动子或增强子。表达控制序列可以在表达载体中。典型的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。典型的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白I启动子。 
合适于在细菌中表达多肽的启动子包括E.coli lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子和酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白-I启动子。已知的用来控制基因在原核和真核细胞或它们的病毒中的表达的别的启动子也可以使用。合适于在细菌中表达多肽或其片段的启动子包括E.coli lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸激酶(PGK)的操纵子的启动子和酸性磷酸酶启动子。真菌启动子包括α因子启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、反转录病毒的LTRs、鼠金属硫蛋白-I启动子。已知的用来控制基因在原核和真核细胞或它们的病毒中的表达的别的启动子也可以使用。 
组织特异性植物启动子 
本发明提供了可以以组织特异性方式表达的表达序列盒,例如,可以以组织特异性方式表达本发明的木聚糖酶的表达序列盒。本发明也提供了以组织特异性方式表达本发明的木聚糖酶的植物或种子。所述的组织特异性可以是种子特异性、茎特异性、叶特异性、根特异性、果实特异性以及类似的特异性。 
一方面,组成型启动子例如CaMV 35S启动子可以用于在植物或种子的特异部分或整个植物内的表达。例如,为了过量表达,植物启动子片段可以用于指导核酸在植物例如再生植物的一些或所有组织中表达。这样的启动子在此称为“组成 型”启动子,它可以在大多数环境条件和发育状态或细胞分化情况下具有活性。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区域、衍生于根癌农杆菌的T-DNA的1’-或2’-启动子,以及本领域技术人员已知的来自不同植物基因的别的转录起始区域。这些基因包括,例如,拟南芥(Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33:125-139);拟南芥的Cat3(GenBank号:U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);甘蓝型油菜(Brassica napus)的编码硬脂酰-酰基载体蛋白去饱和酶的基因(Genbank号:X74782,Solocombe(1994)PlantPhysiol.104:1167-1176);玉米的GPcl(GenBank号:X15596;Martinez(1989)J.Mol.Biol 208:551-565);玉米的Gpc2(GenBank号:U45855,Manjunath(1997)Plant Mol.Biol.3397-112);美国专利4,962,028;5,633,440中描述的植物启动子。 
本发明使用的组织特异性或组成型启动子可以衍生自病毒,包括,例如,烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.USA92:1679-1683);只能在受感染的水稻植物的韧皮部细胞中复制的水稻东格鲁杆状病毒(RTBV),其启动子驱动韧皮部特异的报告基因的表达;在导管、叶中轴细胞、根尖中具有最高活性的木薯脉带花叶病毒(cassava vein mosaic virus,CVMV)启动子(Verdaguer(1996)Plant Mol.Biol.31:1129-1139)。 
可选择地,植物启动子可以指导表达木聚糖酶的核酸表达于特定组织、器官或细胞类型中(即,组织特异启动子),或者可以在更加精确的环境或发育控制下或在可诱导启动子的控制下指导表达木聚糖酶的核酸的表达。可以影响转录的环境条件的例子包括厌氧条件、提高温度、有光、或喷撒化学试剂/激素。例如,本发明包括玉米的干旱诱导型启动子(Busk(1997)如上),马铃薯的寒冷、干旱、高盐诱导型启动子(Kirch(1997)Plant Mol.Biol.33:897909)。 
组织特异性启动子只在该组织的发育阶段的某个时间段内促进转录。参见,例如描述拟南芥LEAFY基因启动子的Blazquez(1998)Plant Cell 10:791-800。也见,描述转录因子SPL3的Cardon(1997)Plant J 12:367-77,SPL3识别拟南芥(A.thaliana)的调节植物分生组织形成的基因(meristem identity gene)AP1的启动子区域的保守序列模体;和描述分生组织启动子eIF4的Mandel(1995)Plant Molecular Biology,29卷,995-1004页。可以使用在特定组织的整个生命周期都具有活性的组织特异性启动子。一方面,本发明的核酸与主要在棉花纤维细胞中有活性的启动子有效连接。一方面,本发明的核酸与主要在棉花纤维细胞伸长的阶段具有活性的启动子有效连接,例如,Rinehart(1996)如上所描述的。核酸可以与Fbl2A基因启动子有效连接,这样它将偏好在棉花纤维细胞(Ibid)中表达。也见John(1997)Proc.Natl.Acad.Sci.USA 89:5769-5773;John等,美国专利5,608,148和5,602,321,描述了用于构建转基因棉花植物的棉花纤维特异性启动子和方法。也可以使用根特异性启动子来表达本发明的核酸。根特异性启动子的例子包括乙醇脱氢酶基因中的启动子(DeLisle(1990)Int.Rey.Cytol.123:39-60)。也可以使用别的启动子 来表达本发明的核酸,包括,例如,胚珠特异的、胚芽特异的、胚乳特异的、珠柄特异的、种皮特异的启动子或它们的组合;叶特异的启动子(见,例如,Busk(1997)Plant J.11:12851295,描述玉米的叶特异的启动子);Agrobacteriumrhizogenes的ORF13启动子(ORF13启动子在根部表现出高活性,见,例如Hansen(1997)如上);玉米花粉特异性启动子(见,例如Guerrero(1990)Mol.Gen.Genet.224:161 168);番茄启动子,其在果实成熟、变老、从叶上脱落的过程中有活性,在花中具有低一些的活性(见,例如,Blume(1997)Plant J.12:731746);马铃薯SK2基因的雌蕊特异性启动子(见,例如Ficker(1997)Plant Mol.Biol.35:425431);豌豆的Blec4基因,Blec4基因在蔬菜的表皮组织和转基因苜蓿的花梗顶中具有活性,这使它成为使外源基因靶向表达于活跃地生长的芽或纤维的表皮层的有用工具;胚珠特异的BEL1基因(见,例如,Reiser(1995)Cell 83:735-742,GenBank号:U39944);和/或Klee,美国专利5,589,583中的启动子,描述了一种植物启动子区域,其可导致在分生组织和/或快速分裂细胞中的高水平转录。 
可选择的是,经由对植物激素例如植物生长素的暴露便能被诱导的植物启动子用于表达本发明的核酸。例如,本发明可以使用大豆(Glycine max L.)中的植物生长素响应元件E1启动子片断(AuxREs)(Liu(1997)Plant Physiol.115:397-407);植物生长素响应的拟南芥GST6启动子(也对水杨酸和过氧化氢产生响应)(Chen(1996)Plant J.10:955-966);烟草的植物生长素诱导的parC启动子(Sakai(1996)37:906-913);植物生物素响应元件(Streit(1997)Mol.PlantMicrobe Interact.10:933-937);和对应激激素脱落酸产生响应的启动子(Sheen(1996)Science 274:1900-1902)。 
本发明的核酸也可以与植物启动子有效连接,所述植物启动子暴露于施用于植物的化学试剂例如除草剂或抗生素,便能够被诱导。例如,可以使用由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子(De Veylder(1997)Plant Cell Physiol.38:568-577);不同的除草剂安全剂的应用诱导不同的基因表达模式,包括在根中、排水器中和芽尖分生组织中的表达。编码序列可以处于例如四环素诱导的启动子的控制下,例如,被描述的含有Avena sativa L.(oat)精氨酸脱羧酶基因的转基因烟草植物(Masgrau(1997)Plant J.11:465-473);或者处于水杨酸响应元件的控制之下(Stange(1997)Plant J.11:1315-1324)。使用化学(例如,激素或杀虫剂)诱导的启动子,即,对施用于田间的转基因植物的化学剂发生响应的启动子,本发明的多肽的表达可以在植物发育的特定阶段被诱导。所以,本发明也提供含有可诱导基因的转基因植物,所述可诱导基因编码本发明的多肽,其宿主范围局限于靶向植物种类,例如玉米、水稻、大麦、小麦、马铃薯或别的作物,并且所述可诱导基因在作物发育的任何阶段都可被诱导。 
本领域技术人员会认识到,组织特异性的植物启动子可以驱动有效连接的序列在不是靶向组织的组织中表达。所以,组织特异性启动子是驱动在靶向组织或 细胞类型中产生优势表达的启动子,但是也可以导致在别的组织中的一些表达。 
本发明的核酸也可以与化学试剂诱导的植物启动子有效连接。这些试剂包括例如,除草剂、合成的植物生长激素或抗生素,它们可以通过例如喷雾而施用于转基因植物。本发明的产生木聚糖酶的核酸的可诱导表达将允许对具有最佳的木聚糖酶表达和/或活性的植物进行选择。植物局部的发育也可以因此被控制。这样,本发明提供了促进植物和植物的部分的收获的方法。例如,在许多实施方式中,玉米的由苯磺酰胺除草剂安全剂活化的玉米In2-2启动子被使用(De Veylder(1997)Plant Cell Physiol.38:568-577)。应用不同的除草剂安全剂诱导出不同的基因表达模式,包括在根中、排水器中、芽尖分生组织中的表达。本发明的编码序列也可以处于四环素诱导的启动子的控制之下,例如,对含有燕麦(Avena sativa L.)(oat)精氨酸脱羧酶基因的转基因烟草植物的描述(Masgrau(1997)Plant J.11:465-473);或者,可以由水杨酸响应元件控制(Stange(1997)Plant J.11:1315-1324)。 
在一些方面,适当的多肽表达可能要求该编码区域的3’端有多聚腺苷酸化区域。多聚腺苷酸化区域可以出自天然基因、各种别的植物(或动物或其它)基因、或者根癌农杆菌T-DNA中的基因。 
表达载体和克隆载体 
本发明提供包括本发明的核酸例如编码本发明的木聚糖酶的序列的表达载体和克隆媒介物。本发明的表达载体和克隆媒介物可以包括病毒颗粒、杆状病毒、噬菌体、噬菌粒(phagemids)、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(例如疫苗、腺病毒、禽痘病毒、伪狂犬病病毒和SV40的衍生物)、基于P1的人工染色体、酵母质粒、酵母人工染色体和任何别的对感兴趣的特定宿主(例如,杆状菌、曲霉和酵母)有特异性的载体。本发明的载体可以包括染色体、非染色体和合成的DNA序列。大多数合适的载体对于本领域技术人员都是已知的,并且可以商业获得。典型的载体包括:细菌:pQE载体(Qiagen)、pBluescript质粒、PNH载体、λ-ZAP载体(Stratagene);ptrc99a、PKK223-3、pDR540、pRIT2T(Pharmacia);真核细胞的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以使用任何别的质粒或别的载体,只要它们可以在宿主中复制和维持下去。可以在本发明中使用低拷贝数或高拷贝数的载体。 
表达载体可以包括启动子、翻译起始和转录终止的核糖体结合位点。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’边的非转录序列。一方面,衍生于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于提供所需要的不被转录的基因元件。 
在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因和 使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或具有选择标记的别的载体,从任何期望的基因中选择出来。 
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强子。 
核酸序列可以通过各种程序插入载体中。一般的,把插入物和载体用合适的限制性内切酶消化后,序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。在本领域已知多种克隆技术,例如在Ausubel和Sambrook中描述的。这样的程序和别的程序被认为在本领域技术人员已知的范围内。 
载体可以是质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。 
可以使用的特定的细菌载体包括商业上可获得的质粒,包括以下已知的克隆载体的遗传元件:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)、GEM1(Promega Biotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特定的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何别的载体,只要它可以在宿主细胞中复制和维持。 
本发明的核酸可以在表达序列盒、载体或病毒中表达,在植物细胞和种子中短暂的或稳定的表达。一个典型的短暂表达系统应用了附加体(episomal)表达系统,例如,在核中通过含有超螺旋DNA的附加小染色体的转录而产生的花椰菜花叶病毒(CaMV)RNA,见,例如,Covey(1990)Proc.Natl.Acad.Sci.USA 87:1633-1637。作为选择,编码序列,即本发明的序列的全部或亚片断,可以插入到植物宿主细胞基因组中,而成为该宿主染色体DNA的整合的一部分。正义和反义转录产物可以以这种方式被表达。包含本发明的核酸的序列(例如,启动子或编码区域)的载体可以包括用于在植物细胞或种子中选择表型的标记基因。例如,所述标记可以编码生物杀灭剂抗性,特别是抗生素抗性,例如对卡那霉素、G418、 博来霉素、潮霉素或除草剂的抗性,例如对氯磺隆或Basta的抗性。 
可以在植物中表达核酸和蛋白的表达载体在本领域中是已知的,可以包括,例如,根癌农杆菌的载体、马铃薯病毒X(见,例如,Angell(1997)EMBO J.16:3675-3684)、烟草花叶病病毒(见,例如,Casper(1996)Gene 173:69-73)、番茄丛矮病毒(见,例如,Hillman(1989)Virology 169:42-50)、烟草蚀纹病毒(见,例如,Dolja(1997)Virology 234:243-252)、菜豆金色花叶病毒(见,例如,Morinaga(1993)Microbiol inimunol.37:471-476)、花椰菜花叶病毒(见,例如,Cecchini(1997)Mol.Plant Microbe Interact.10:1094-1101)、玉米Ac/Ds转座元件(见,例如,Rubin(1997)Mol.Cell.Biol.17:6294-6302;Kunze(1996)Curr.Top.Microbiol.Inimunol.204:161-194),和玉米抑制基因-突变基因(Spm)转座元件(见,例如Schlappi(1996)Plant Mol.Biol.32:717-725);和它们的衍生物。 
在一个方面,蛋白载体可以有两套复制系统,使其可以在两种生物中保持,例如在哺乳动物或昆虫细胞中表达,在原核宿主中克隆和扩增。进一步,对于整合表达载体,该表达载体可以包括至少一个与宿主细胞基因组同源的序列。它可以在表达构建物的两侧包含两个同源序列。通过选择包含入载体的合适的同源序列,可以将该整合载体定位到宿主细胞的特定位置。整合载体的构建在本领域已知。 
本发明的表达载体也可以包括选择性的标记基因,以便对已经转化的细菌株进行选择,例如,使细胞对药物,例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素产生抗性的基因。选择性的标记也可以包括生物合成基因,例如在组氨酸、色氨酸和亮氨酸生物合成途径中的基因。 
表达载体中的DNA序列可有效连接于合适的表达控制序列(启动子)以引导RNA的合成。具有特定命名的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。真核细胞启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和鼠金属硫蛋白-I启动子。选择合适的载体和启动子是在本领域普通技术人员的水平之内。表达载体也含有翻译起始和转录终止的核糖体结合位点。载体也包括扩增表达的合适序列。可使用氯霉素转移酶(CAT)载体或其它具有选择性标记的载体从任何期望的基因中选择启动子区域。另外,为选择被转化的宿主细胞,表达载体优选含有一个或多个选择性标记基因以提供一种表型特征,如使真核细胞培养物具有二氢叶酸还原酶或新霉素抗性,或使大肠杆菌具有四环素或氨苄青霉素抗性。 
哺乳动物表达载体也可以包括复制起始点、任何必须的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧的非转录序列。在一些方面,衍生于SV40剪接位点和聚腺苷酸化位点的DNA序列可以用于提供所需要的不被转录的基因元件。 
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达 水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,作用于启动子,增强其转录。例子包括在SV40复制起点下游侧100bp到270bp的增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子和腺病毒增强子。 
另外,表达载体通常含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这些选择性标记包括编码二氢叶酸还原酶的基因和使得真核细胞培养物具有新霉素抗性的基因、使得E.coli具有四环素或氨苄青霉素抗性的基因和酵母(S.cerevisiae)TRP1基因。 
在一些方面,编码B组氨基酸序列和与其实质上相同的序列中的一个多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的核酸在合适的阶段与能够引导翻译出的多肽或其片段分泌的引导序列组装。可选择的是,核酸可编码一种融合多肽,其中B组氨基酸序列和与其实质上相同的序列中的一个多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段与异源肽或多肽融合,这些异源肽例如可提供所需特征如增加的稳定性或简化的纯化步骤的N-末端识别肽。 
核酸序列可以通过各种程序插入载体中。一般的,把插入物和载体用合适的限制性内切酶消化后,序列可以在载体中的期望位置连接。可选择的是,插入物和载体的平末端可以被连接。多种克隆技术在Ausubel等,Current Protocols in Molecular Biology,John Wiley 503 Sons,Inc.1997和Sambrook等,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press(1989)中被公开。这些程序和其它的程序被认为在本领域技术人员所知道的范围之内。 
载体可以是例如质粒、病毒颗粒或噬菌体的形式。别的载体包括染色体的、非染色体的和合成的DNA序列、SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体由Sambrook等,Molecular Cloning:A Laboratory Manual 2nd Ed.,Cold SpringHarbor,N.Y.(1989)描述。 
宿主细胞和转化细胞 
本发明也提供了包含本发明的核酸序列例如编码本发明的木聚糖酶的序列或者本发明的载体的转化细胞。宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞,真核细胞,例如,细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。典型的细菌细胞包括大肠杆菌、链霉菌、枯草芽孢杆菌、鼠伤寒沙门氏菌(Salmonella typhimurium)和假单胞菌属、链霉菌属和葡萄球菌属中的许多种类。典型的昆虫细胞包括果蝇S2和草地夜蛾(Spodoptera)Sf9。典型的动物细胞包括CHO、COS或黑色素瘤细胞或任何鼠或人的细胞系。合适的宿主的选择在本领域技术人员的能力范围内。转化各种高等植物种类的技术是已 知的,在技术和科学文献中有描述,见,例如,Weising(1988)Ann.Rey.Genet.22:421-477;美国专利5,750,870。 
载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。 
一方面,本发明的核酸或载体导入细胞是为了筛选,所以,所述核酸是以合适于该核酸的后续表达的方式进入细胞。导入的方法大体上由靶细胞类型决定。典型的方法包括CaPO4沉淀法、脂质体融合、脂转染法(例如,LIPOFECTINTM)、电穿孔法、病毒感染法,等等。候选的核酸可以稳定地整合到宿主细胞基因组中(例如,用反转录病毒导入)或者可以短暂的或稳定的存在于细胞质中(即,通过使用传统的质粒,利用标准的调控序列、选择标记,等等)。因为许多药学上重要的筛选要求人或模型哺乳动物靶细胞,所以可以使用能够转染这些靶细胞的反转录病毒载体。 
适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。 
细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞溶解试剂。这些方法为本领域技术人员所熟悉。表达的多肽或其片断可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。 
可以以常规方式应用宿主细胞中的构建物以产生由重组序列编码的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或者不包括起始的甲硫氨酸残基。 
也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或其片段的核酸有效连接的启动子。一些方面,该DNA构建物在进行体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。 
表达载体可以含有一个或多个选择性标记基因,为选择转化宿主细胞提供表型性状,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者大肠杆菌的例如四环素或氨苄青霉素的抗性。 
含有感兴趣的多聚核苷酸例如本发明的核酸的宿主细胞可在常规营养培养基中培养,该培养基经改良以适于活化启动子、选择转化子或扩增基因。培养条件如温度、pH和类似的条件是以前那些被选择表达的宿主细胞所使用的条件,这对于普通技术人员是很明显的。被鉴定具有特异酶活性的克隆然后被测序,以鉴定编码具有增强活性的酶的多聚核苷酸序列。 
本发明提供了在细胞中过量表达重组木聚糖酶的方法,包括表达含有本发明的核酸的载体,本发明的核酸例如含有与A组核酸序列中的一个序列在至少大约100个残基的区域内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的核酸序列的核酸,其中所述的序列同一性是通过采用序列比较算法的分析或通过观察检验来确定的,或者,本发明的核酸例如在严紧条件下与A组核酸序列中所示核酸序列或其子序列杂交的核酸。可通过任何手段实现过量的表达,例如使用高活性启动子、双顺反子载体或通过载体的基因扩增。 
本发明的核酸可以用任何的体外或体内表达系统表达或过量表达。任何细胞培养系统都可用来表达或过量表达重组蛋白,包括细菌、昆虫、酵母、真菌或哺乳动物培养物。通过适当地选择启动子、增强子、载体(例如,使用复制子载体、双顺反子载体(见,例如Gurtu(1996)Biochem.Biophys.Res.Commun.229:295-8)、培养基、培养系统等可以实现过量表达。在一个方面,在细胞系统中,使用了选择标记如谷氨酰胺合成酶(见,例如Sanders(1987)Dev.Biol.Stand.66:55-63)的基因扩增可以被用来过量表达本发明的多肽。 
关于这种方法的其它细节可在公共文献中找到,并且/或者它们对于专业技术人员是已知的。在一个特定的非限制性的示例中,这种可获得的公共文献包括EP0659215(WO 9403612 A1)(Nevalainen等);Lapidot,A.,Mechaly,A.,Shoham,Y.,″Overexpression and single-step purification of a thermostable xylanase from Bacillus stearothermophilus T-6,″J.Biotechnol.Nov 51:259-64(1996);Luthi,E.,Jasmat,N.B.,Bergquist,P.L.,″Xylanase from the extremely thermophilic bacterium Caldocellumsaccharolyticum:overexpression of the gene in Escherichia coli and characterization of the gene product,″Appl.Environ.Microbiol.Sep 56:2677-83(1990);以及Sung,W.L.,Luk,C.K.,Zahab,D.M.,Wakarch.uk,W.,″Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli,″Protein Expr.Purif.Jun 4:200-6(1993), 尽管这些参考文献并不能教导本申请中的发明酶。 
宿主细胞可以是本领域技术人员熟悉的任何宿主细胞,包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。作为合适的宿主的代表性例子,细菌细胞例如大肠杆菌、链霉菌、枯草芽孢杆菌、鼠伤寒沙门氏菌和假单胞菌属、链霉菌属和葡萄球菌属中的许多种类,真菌细胞例如酵母,昆虫细胞例如果蝇S2和草地夜蛾Sf9,动物细胞例如CHO、COS或黑色素瘤细胞,以及腺病毒。合适的宿主的选择在本领域技术人员的能力范围内。 
载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods inMolecular Biology,(1986))。 
适当的话,工程宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。 
细胞通常可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞溶解试剂。这些方法为本领域技术人员所熟悉。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水作用色谱、亲和色谱、羟基磷灰石色谱和凝集素色谱在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相色谱(HPLC)。 
也可以应用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系(如Gluzman,Cell,23:175,1981所述)和别的能够由相容性载体表达蛋白质的细胞系,例如C127、3T3、CHO、HeLa和BHK细胞系。 
可以以常规方式应用宿主细胞中的构建物来产生由重组序列编码的基因产物。取决于在重组生产程序中采用的宿主细胞,由含有载体的该宿主细胞产生的多肽可以是糖基化的或者可以是非糖基化的。本发明的多肽可以包括或者不包括起始的甲硫氨酸残基。 
可选择地是,B组氨基酸序列的多肽和与其实质上相同的序列,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段可利用常规的肽合成仪来合成产生。在另一个方面,可以通过肽合成方法来应用多肽的片段或部分以产生相应的全长多肽;因此,片段可用作产生全长多肽的中间体。 
也可以采用无细胞的翻译系统利用由DNA构建物转录得到的mRNA来产生B组氨基酸序列和与其实质上相同的序列中的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,所述DNA构建物包括与编码所述多肽或其片段的核酸有效连接的启动子。一些方面,该DNA构建物在进行体外转录反应之前可以是线性的。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。 
扩增核酸 
在实践本发明时,可以通过扩增来复制本发明的核酸和编码本发明的木聚糖酶的核酸,或本发明的经修饰的核酸。扩增也可以用于克隆或修饰本发明的核酸。所以,本发明提供了用于扩增本发明的核酸的扩增引物序列对。本领域技术人员能够针对这些序列的任何部分或全长设计出扩增引物序列对。 
在一个方面,本发明提供了利用本发明的引物对扩增出的核酸,所述的引物对例如由本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24、或25个残基和互补链的大约前(5′)15、16、17、18、19、20、21、22、23、24或25个残基所示的引物对。 
本发明提供了用于扩增编码具有木聚糖酶活性的多肽的核酸的扩增引物序列对,其中所述的引物对能够扩增含有本发明的序列或片段或其子序列的核酸。扩增引物序列对的一个或每个成员可以包括含有序列的至少大约10至50个连续碱基,或序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或25个连续碱基的寡核苷酸。本发明提供了扩增引物对,其中所述的引物对包含的第一个成员具有本发明核酸的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列,第二个成员具有第一个成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或25个残基所示的序列。本发明提供了利用本发明的扩增引物对通过扩增例如聚合酶链式反应(PCR)产生的木聚糖酶。本发明提供了利用本发明的扩增引物对通过扩增例如聚合酶链式反应(PCR)制备木聚糖酶的方法。在一个方面,扩增引物对可从文库,例如基因文库,如环境文库中扩增出核酸。 
扩增反应也可以用于定量样品中的核酸的量(例如,细胞样品中的信息(message)的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸或定量样品中的特定核酸的量。在本发明的一方面,从细胞或cDNA文库中分离出的信息被扩增。 
熟练的技术人员能够选择和设计适合的寡核苷酸扩增引物。扩增方法在本领域是已知的,包括,例如聚合酶链式反应,PCR(见,例如PCR PROTOCOLS,AGUIDE TO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGLES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接 酶链反应(LCR)(见,例如Wu(1989)Genomics 4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene 89:117);转录扩增(见,例如Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173);和自主序列复制(见,例如Guatelli(1990)Proc.Natl.Acad.Sci.USA 87:1874);Q Beta复制酶扩增(见,例如Smith(1997)J.Clin.Microbiol.35:1477-1491),自动Q-beta复制酶扩增分析(见,例如Burg(1996)Mol.Cell.Probes 10:257-271)和别的RNA聚合酶介导的技术(例如,NASBA,Cangene,Mississauga,Ontario);也见Berger(1987)Metbods Enzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。 
确定序列同一性(sequence identity)的程度
本发明提供了核酸,其包括与本发明的示例性核酸(例如SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ IDNO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ IDNO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ IDNO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ IDNO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ IDNO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ IDNO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ IDNO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ IDNO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ IDNO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ IDNO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ ID NO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQ IDNO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ ID NO:233、 SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQ IDNO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ ID NO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQ IDNO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ ID NO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQ IDNO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQ IDNO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ ID NO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQ IDNO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ ID NO:373、SEQ ID NO:375、SEQ ID NO:377或SEQ ID NO:379)在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500或更多残基的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全(100%)的序列同一性的序列。本发明提供了多肽,其包括与本发明的示范性多肽具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的序列。序列同一性(同源性)的程度可以使用任何计算机程序和相关的参数来测定,包括在此所述的那些程序和参数,如BLAST 2.2.2.或FASTA 3.0t78版,其中使用默认参数(default parameters)。 
所述核酸序列也称为“A组”核酸序列,其包括与其实质上相同的序列,以及与A组核酸序列同源的序列及其片段和与所有前述序列互补的序列。本发明的核酸序列可以包括本发明的示例性序列(例如,A组核酸序列)和与其实质上相同的序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续核苷酸。A组核酸序列的同源序列和片段和与其实质上相同的序列,是指与 这些序列具有至少99%、98%、97%、96%、95%、90%、85%、80%、75%、70%、65%、60%、55%或50%的同源性的序列。同源性可使用在此所述的任何计算机程序和参数来确定,包括FASTA 3.0t78版本,使用默认参数。同源序列也包括RNA序列,其中尿嘧啶替代了A组核酸序列所示的核酸序列中的胸腺嘧啶。同源序列可以使用任何在此描述的程序或者可以由测序错误的校正获得。要理解的是,在A组核酸序列中所示的核酸序列和与其实质上相同的序列,可以用传统的单字符格式来表示(见Stryer,Lubert.Biochemistry,3rd Ed.,W.H Freeman & Co.,New York的背面内页)或者用可记录序列内核苷酸同一性的任何其它格式来表示。 
在本专利说明书的其它地方说明的各种序列比较程序都可被特别地考虑用于本发明的这个方面。蛋白和/或核酸序列的同源性可以应用本领域已知的各种序列比较算法和程序来评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,Nucleic Acids Res.22(2):4673-4680,1994;Higgins等,Methods Enzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,Nature Genetics 3:266-272,1993)。 
同源性或者同一性常常是应用序列分析软件来测定(如地址为1710 University Avenue,Madison,WI 53705的威斯康星大学生物技术中心遗传学计算机组(Genetics Computer Group)的序列分析软件包)。这样的软件通过对各种缺失、替代和其它的修饰赋予表示同源性的数值来匹配相似的序列。联系两个或者多个核酸或者多肽序列的术语“同源性”和“同一性”,是指当两个或更多个序列或子序列在某一比较窗口(comparison window)或者指定区域内被比较和比对以确定最大一致性时,这些序列是相同的,或者具有特定比例的相同氨基酸残基或核苷酸,最大一致性可以应用各种序列比较算法或者通过人工比对和观察检验来测定。 
对于序列比较,通常是一段序列作为参考序列,受测序列与之进行比较。当使用序列比较算法时,将受测序列和参考序列输入到计算机中,指定子序列坐标,如果必要,指定序列算法程序参数。可以使用默认的程序参数,或者可以指定别的参数。以程序参数为基础,然后通过序列比较算法计算出受测序列相对于参照序列的百分序列一致性。 
正如在此所使用的,“比较窗口”包括引用具有选自大约20到600、通常是大约50到大约200、更通常是大约100到大约150的任一数目的连续位置的片段,其中序列与具有同样数目的连续位置的参考序列在优化比对之后,两个序列可以进行比较。用于进行比较的序列比对方法在本领域已知。用于比较的序列的优化比对可以通过例如以下的手段实现:Smith和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性联配算 法,person和Lipman,Proc.Nat′l.Acad.Sci.USA 85:2444,1988的查找相似的方法,这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,WI),手工比对和观察检验。除了BLAST程序(生物信息国家中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外,用于确定同源性或者一致性的其它的算法包括,例如,ALIGN、AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多重序列联配(Protein Multiple Sequence Alignment))、ASSET(联配片段统计评估工具(Aligned Segment Statistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals & Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具(Forced Nucleotide Alignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏的序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列联配(Local Sequence Alignment))、LCP(局部内容程序(Local Content Program))、MACAW(多重联配构建和分析工作台(Multiple Alignment Construction & Analysis Workbench))、MAP(多重联配程序(Multiple Alignment Program))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-Induced Multi-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignment by Genetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库,确定具有大体上相同的序列的多聚核苷酸序列。大量的基因组数据库是可利用的,例如,作为人类基因组测序工程的构成部分的人类基因组的实质部分可以被利用(J.Roach,http://weber.u.Washington.edu/~roach/human_genome_progress  2.html)(Gibbs,1995)。几个基因组序列已经测定,如,生殖器支原体(M.genitalium)(Fraser等,1995)、甲烷球菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae)(Fleischmann等,1995)、大肠杆菌(E.coli)(Blattner等,1997)、和酵母(S.cerevisiae)(Mewes等,1997),和黑腹果蝇(D.melanogaster)(Adams等,2000)。在模式生物的基因组序列的测序上已经取得了很大的进展,如鼠,线虫(C.elegans)和拟南芥(Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织维护,可以通过互联网登录。 
可用的算法的一个实例是BLAST和BLAST 2.0算法,分别在Altschul等人,Nuc.Acids Res.25:3389-3402,1977和Altschul等人,J.Mol.Biol.215:403-410,1990中描述。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来 确定高分序列对(high scoring sequence pairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某个正值的阈值T。T是指作为邻近字串(neighborhood word)的分数阈值(Altschul等,如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核苷酸序列,使用参数M(一对匹配的残基的奖励分数;总是大于0)来计算累积分数;对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是:字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序默认:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。 
BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在受测核酸和参考核酸的比较中,如果最小合计概率小于大约0.2,更优选的是小于0.01,最优选的是小于大约0.001,就认为该核酸与参考序列相似。 
一方面,应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如,五个特定的BLAST程序可以用来进行以下的任务: 
(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较; 
(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较; 
(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较; 
(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较; 
(5)TBLASTN把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。 
BLAST程序通过确定相似片段来确定同源性序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoring segment pairs)”,该受测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992;Henikoff和Henikoff,Proteins 17:49-61,1993)。较不优选地,也可以应用PAM或者PAM250 矩阵(参见如,Schwartz和Dayhoff,eds.,1978,Matrices for Detecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National Biomedical Research Foundation)。BLAST程序可通过美国国立医学图书馆取得。 
上述算法所使用的参数可根据被研究的序列长度和同源性程度来修改。在一些方面,在没有用户指令时所使用的参数可以是该算法所使用的默认参数。 
计算机系统和计算机程序产品
为了确定和鉴定序列一致性、结构同源性、模体等等,本发明的核酸或多肽序列可以在能够由计算机阅读和访问的任何介质上存储、记录和操作。 
因此,本发明提供记录或存储有本发明的核酸和多肽序列的计算机、计算机系统、计算机可读介质、计算机程序产品以及类似物。正如在此所用,词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采用任何已知的方法将信息记录到计算机可读介质上,从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。 
本发明的多肽包括B组氨基酸序列中的多肽序列、本发明的示范性序列和与其实质上相同的序列,和任何前述序列的片段。实质上相同的或同源的多肽序列是指与本发明的示范性序列例如B组氨基酸序列的多肽序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)序列同一性的多肽序列。 
同源性可使用在此所述的任何计算机程序和参数来测定,包括FASTA 3.0t78版,使用默认参数或任何修改的参数。同源序列可以使用任何在此描述的程序或者可以由测序错误的校正获得。多肽片段含有B组氨基酸序列和与其实质上相同的序列中的多肽的至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500或更多的连续氨基酸。要理解的是,如在B组氨基酸序列和与其实质上相同的序列中所示的多肽编码可以以传统的单字符格式或三字母格式表示(见Stryer,Lubert.Biochemistry.3rd Ed.,W.H Freeman & Co.,New York的背面内页)或以可以将多肽序列同一性关联起来的任何其它格式表示。 
本发明的核酸或多肽序列可在能被计算机阅读和存取的任何介质上存储、记录和操作。如在此所使用的,词语“记录”和“存储”是指在计算机介质上储存信息的过程。技术人员可很容易地采用任何以前已知的方法来在计算机可读介质上记录信息以产生一些产品,其含有A组核酸序列和与其实质上相同的序列中所示的一个或更多个核酸序列,B组氨基酸序列和与其实质上相同的序列中所示的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质,上面已经记录了A组 核酸序列和与其实质上相同的序列中所示的至少2、5、10、15或20或更多个核酸序列。 
本发明的另一个方面是计算机可读介质,其上已经记录了A组核酸序列和与其实质上相同的序列中的一个或更多个核酸序列。本发明的另一个方面是计算机可读介质,其上已经记录了B组氨基酸序列与其实质上相同的序列中所示的一个或更多个多肽序列。本发明的另一个方面是计算机可读介质,其上已经记录了如上所示的至少2、5、10、15或20或更多个序列。 
计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存储器(RAM),或者只读存储器(ROM),同时还有本领域技术人员所知的其它类型的其它介质。 
本发明的方面包括存储和操作在此描述的序列信息的系统(如,基于因特网的系统),特别是计算机系统。计算机系统100的一个例子在图1的框图中说明。正如在此所使用的,“计算机系统”是指其硬件部分、软件部分以及用于分析A组核酸序列和与其实质上相同的序列中所示的核酸序列或者B组氨基酸序列中所示的多肽序列的数据存储部分。计算机系统100通常包括用于处理、访问和操作序列数据的处理器。该处理器105可以是任何已知类型的中央处理单元,例如Intel公司的奔腾III,或者来自Sun、Motorola、Compaq、AMD或者IBM的类似处理器。 
通常地,计算机系统100是一种通用系统,包括处理器105和一个或者多个用于存储数据的内部数据存储部分110,以及一个或者多个用于检索存储在数据存储部分中的数据的数据检索装置。技术人员可以很容易地意识到目前可用的计算机系统的任何一个都是合适的。 
一方面,计算机系统100包括处理器105,处理器105连接于数据传送总线,该总线连接于一个主存储器115(优选地,按RAM来实施),计算机系统100还包括一个或者多个内部数据存储装置110,如硬盘驱动器和/或具有数据记录作用的其它的计算机可读介质。在一些方面,计算机系统100可以进一步包括一个或者多个用于读取内部数据存储装置110上储存的数据的数据检索装置118。 
数据检索装置118可以是例如,软盘驱动器、光盘驱动器、磁带驱动器或者可以(如,通过因特网)连接至远端的数据存储系统的调制解调器等。在一些方面,内部数据存储装置110是可移动的计算机可读介质,例如含有控制逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存储部分读取控制逻辑和/或数据。 
计算机系统100包括用于给计算机使用者显示输出结果的显示器120。也应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,提供集中化的计算机系统100访问。 
用于访问和处理A组核酸序列与其实质上相同的序列中所示的核酸序列或B组 氨基酸序列和与其实质上相同的序列中所示的多肽序列的软件(如搜索工具、比较工具和建模工具等)可在运行过程中驻留在主存储器115中。 
在一些方面,计算机系统100可以进一步包含用于比较存储在计算机可读介质上的A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列与存储在计算机可读介质上的参考核苷酸或多肽序列的序列比较算法。“序列比较算法”是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的A组核酸序列和与其实质上相同的序列中所示的核酸序列的核苷酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列与储存在计算机可读介质上的参考序列比较以鉴定同源性或结构基序。 
图2是说明了处理过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。 
过程200开始于起始状态201,然后移至状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。 
过程200然后移至状态204,其中序列数据库被打开以用于分析和比较。然后,过程200移至状态206,其中存储在数据库的第一个序列读取到计算机的存储器中。然后在状态210中进行比较,确定第一序列是否与第二序列相同。重要的是,注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法,尽管它们并不完全相同。例如,为了提高两个待测序列间的同源性水平,可以在一个序列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一般由计算机系统的使用者输入。 
一旦在状态210下进行两个序列的比较,在决定状态210下作出两个序列是否相同的决定。当然,术语“相同”并不限于绝对相同的序列。在过程200中,在使用者输入的同源性参数范围内的序列将标记为“相同”。 
如果决定了两个序列相同,过程200移至状态214,其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者,过程200移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在数据库中没有更多的序列存在,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以这种方式,所述的新序列与数据库中的每一个序列进行 联配和比较。 
应当注意到,如果已经在决定状态212确定了序列并不具有同源性,那么为了确定在数据库中是否有其它的可用于比较的序列,过程200将立即移至决定状态218。 
因此,本发明的一个方面是计算机系统,其含有处理器、其上储存了A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列的数据存储设备、其上可检索地储存了参考核苷酸序列或多肽序列的数据存储设备,所述的参考核苷酸序列或多肽序列将与A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列进行比较,以及执行比较的序列比较器。序列比较器可指示被比较序列之间的同源性水平或在上述的A组核酸序列和与其实质上相同序列的核酸代码,或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列中鉴定结构模体,或可以在与这些核酸代码和多肽代码比较的序列中鉴定结构模体。在一些方面,数据存储设备上面可以存储有A组核酸序列和与其实质上相同的序列中的至少2、5、10、15、20、25、30或40或更多个序列,或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列。 
本发明的另一个方面是用于确定A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列与参考核苷酸序列之间的同源性水平的方法。该方法包括通过使用可测定同源性水平的计算机程序读取核酸代码或多肽代码以及参考核苷酸或多肽序列,并用计算机程序确定核酸代码或多肽代码与参考核苷酸或多肽序列之间的同源性。计算机程序可以是任意的能够测定同源性水平的计算机程序,包括在此特别列举的那些(例如,BLAST2N,使用默认参数,或任何修改的参数)。该方法可使用上述的计算机系统执行。本方法也可这样来执行:通过使用计算机程序读取上述A组核酸序列所示的核酸序列中或B组氨基酸序列中所示的多肽序列中的至少2、5、10、15、20、25、30或40或更多个序列,并测定核酸代码或多肽代码和参考核苷酸序列或多肽序列之间的同源性。 
图3是说明在计算机中确定两个序列是否具有同源性的过程250的一个方面的流程图。过程250开始于起始状态252,然后移至状态254,其中待比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字符,然后到状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核苷酸序列,那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列,那么可以是单字母的氨基酸代码,以便第一序列和第二序列可以很容易地进行比较。 
然后在决定状态264作出是否两个字符是否相同的决定。如果它们是相同的,那么过程250移至状态268,其中读取第一序列和第二序列的下一个字符。然后确 定所述的下一字符是否相同。如果相同,那么过程250继续这一循环直到两个字符是不同的。如果确定了接下来的两个字符并不相同,过程250移至决定状态274,确定在两个序列中是否有任何更多的字符要读取。 
如果没有任何更多的字符被读取,那么过程250移至状态276,其中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一序列中字符总数的比例来确定同源性水平。这样,如果第一个100核苷酸序列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。 
可选择的是,计算机程序可以是将本发明中所示核酸序列的核苷酸序列与一个或更多个参考核苷酸序列进行比较的计算机程序,以便确定A组核酸序列和与其实质上相同的序列的核酸代码是否在一个或更多个位置上不同于参考核酸序列。可任意选择的是,关于参考多核苷酸序列或A组核酸序列和与其实质上相同的序列中所示的核酸序列,这样的程序可记录插入、删除或替代的核苷酸的长度和同一性。在一个方面,计算机程序可以确定A组核酸序列和与其实质上相同的序列中所示的核酸序列是否含有参考核苷酸序列的单核苷酸多态性(SNP)。 
因此,本发明的另一个方面是确定A组核酸序列和与其实质上相同的序列中所示的核酸序列是否与参考核苷酸序列有一个或更多个核苷酸的差异,包括步骤如下:通过使用可鉴定核酸序列间差异的计算机程序读取核酸代码和参考核苷酸序列,并使用计算机程序鉴定核酸代码和参考核苷酸序列之间的差异。在一些方面,计算机程序可鉴定单核苷酸多态性。该方法可通过上述的计算机系统来实施,方法在图3中图示。该方法的执行也可通过使用计算机程序读取A组核酸序列和与其实质上相同的序列中所示的核酸序列的至少2、5、10、15、20、25、30或40或更多个核酸序列,以及参考核苷酸序列,并使用计算机程序鉴定核酸代码和参考核苷酸序列之间的差异。 
在另一个方面,采用了计算机的系统可进一步包含可在A组核酸序列中所示的核酸序列或在B组氨基酸序列中所示的多肽序列和与其实质上相同的序列内鉴别特征的识别器(identifier)。 
“识别器”是指一个或多个程序,其可识别A组核酸序列和与其实质上相同的序列中所示的核酸序列,或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列内的某些特征。在一个方面,识别器可以含有可鉴别A组核酸序列和与其实质上相同的序列中所示的核酸序列中的开放阅读框架的程序。 
图4是说明用于检测在序列中某个特征的存在的识别器处理过程300的一方面的流程图。过程300开始于起始状态302,随后移至状态304,其中待检测特征的第一序列被存储于计算机系统100的存储器115中。过程300然后移至状态306,其中序列特征的数据库被打开。这样的数据库将包括各个特征的属性及其名称的列表。例如,特征的名称可以是“起始密码子”,该特征属性将会是“ATG”。另一个例子是特征名称“TAATAA盒”,该特征的属性将是“TAATAA”。这样的数据 库的例子由威斯康星大学遗传学计算机组制作。可选择地,所述特征可以是结构性多肽模体,如α螺旋、β折叠,或者功能性多肽模体,如酶的活性位点、螺旋-转角-螺旋模体,或者本领域技术人员所知的其它模体。 
一旦特征的数据库在状态306下打开,过程300移至状态308,其中从数据库读取第一特征。然后在状态310进行第一特征的属性和第一序列的比较。然后在决定状态316中作出决定是否在第一序列中发现所述特征的属性。如果发现有该属性,那么过程300移至状态318,其中所发现的特征的名称被显示给使用者。 
过程300然后移至决定状态320,其中决定是否在数据库中存在更多的特征。如果不存在更多的特征,那么过程300终止于结束状态324。然而,如果在数据库中存在更多的特征,那么过程300在状态326中读取下一个序列特征,并且回至状态310,在其中进行所述下一个特征的属性与第一序列比较。如果在决定状态316中所述特征的属性没有在所述第一序列中发现,那么为了决定在数据库中是否存在更多特征,过程300直接移至决定状态320。 
因此,本发明的另一个方面是在A组核酸序列和与其实质上相同的序列所示的核酸序列,或B组氨基酸序列和与其实质上相同的序列所示的多肽序列内鉴别特征的方法,包括通过使用可识别其中特征的计算机程序读取核酸代码或多肽代码,并使用计算机程序鉴别核酸代码内的特征。在一个方面,计算机程序包括可鉴别开放阅读框的计算机程序。本方法的实施可以通过使用计算机程序读取A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列中的单个序列或至少2、5、10、15、20、25、30或40个序列,并使用计算机程序鉴别在核酸代码或多肽代码内的特征。 
在A组核酸序列和与其实质上相同的序列中所示的核酸序列,或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,在A组核酸序列和与其实质上相同的序列中所示的核酸序列,或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列,可以以文本形式储存在字处理文件如Microsoft WORDTM或WORDPERFECTTM中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2TM、SYBASETM或ORACLETM中。另外,许多计算机程序和数据库都可用作序列比较算法、识别器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与A组核酸序列和与其实质上相同的序列中所示的核酸序列、或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列进行比较。下列的列表的目的不是要限制本发明,而是提供可用于A组核酸序列和与其实质上相同的序列中所示的核酸序列或B组氨基酸序列和与其实质上相同的序列中所示的多肽序列的程序和数据库的指南。 
可以被应用于的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular Applications  Group)、Look(Molecular Applications Group)、MacLook(Molecular Applications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(MolecularSimulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular Simulations Inc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库(Comprehensive Medicinal Chemistry database)、德文特的世界药物索引数据库(World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。在本公开内容的技术领域内的技术人员是熟悉很多其它的程序和数据库的。 
应用以上的程序可能检测到的模体包括编码亮氨酸拉链的序列、螺旋-转角-螺旋模体、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸展(acidic stretches)、酶的活性位点、底物结合位点以及酶切割位点。 
核酸的杂交
本发明提供了可在严紧条件下与本发明的示例性序列(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ IDNO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ IDNO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197、SEQ ID NO:199、SEQ ID NO:201、SEQ ID NO:203、SEQ IDNO:205、SEQ ID NO:207、SEQ ID NO:209、SEQ ID NO:211、SEQ ID NO:213、SEQID NO:215、SEQ ID NO:217、SEQ ID NO:219、SEQ ID NO:221、SEQ ID NO:223、SEQ ID NO:225、SEQ ID NO:227、SEQ ID NO:229、SEQ ID NO:231、SEQ IDNO:233、SEQ ID NO:235、SEQ ID NO:237、SEQ ID NO:239、SEQ ID NO:241、SEQID NO:243、SEQ ID NO:245、SEQ ID NO:247、SEQ ID NO:249、SEQ ID NO:251、SEQ ID NO:253、SEQ ID NO:255、SEQ ID NO:257、SEQ ID NO:259、SEQ IDNO:261、SEQ ID NO:263、SEQ ID NO:265、SEQ ID NO:267、SEQ ID NO:269、SEQID NO:271、SEQ ID NO:273、SEQ ID NO:275、SEQ ID NO:277、SEQ ID NO:279、SEQ ID NO:281、SEQ ID NO:283、SEQ ID NO:285、SEQ ID NO:287、SEQ IDNO:289、SEQ ID NO:291、SEQ ID NO:293、SEQ ID NO:295、SEQ ID NO:297、SEQID NO:299、SEQ ID NO:301、SEQ ID NO:303、SEQ ID NO:305、SEQ ID NO:307、SEQ ID NO:309、SEQ ID NO:311、SEQ ID NO:313、SEQ ID NO:315、SEQ IDNO:317、SEQ ID NO:319、SEQ ID NO:321、SEQ ID NO:323、SEQ ID NO:325、SEQID NO:327、SEQ ID NO:329、SEQ ID NO:331、SEQ ID NO:333、SEQ ID NO:335、SEQ ID NO:337、SEQ ID NO:339、SEQ ID NO:341、SEQ ID NO:343、SEQ IDNO:345、SEQ ID NO:347、SEQ ID NO:349、SEQ ID NO:351、SEQ ID NO:353、SEQID NO:355、SEQ ID NO:357、SEQ ID NO:359、SEQ ID NO:361、SEQ ID NO:363、SEQ ID NO:365、SEQ ID NO:367、SEQ ID NO:369、SEQ ID NO:371、SEQ IDNO:373、SEQ ID NO:375、SEQ ID NO:377或SEQ ID NO:379)杂交的分离出的或重组的核酸。所述严紧条件可以是高的严紧条件、中等严紧条件和/或低的严紧条件,包括在此描述的高的和降低的严紧条件。在一方面,正是洗脱条件的严紧性提出了确定一段核酸是否在本发明范围内的条件,如下所述。 
在可选择的方面,本发明的核酸根据它们在严紧条件下杂交的能力来定义,它们可以在大约5个残基到本发明的核酸全长之间;例如它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、 200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000或者更多的残基。也包括比全长核酸短的核酸。这些核酸可以作为如,杂交探针、标记探针、PCR寡聚核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(抗原决定部位)的序列或反义序列、模体、活性位点以及类似物。 
一方面,本发明的核酸由它们在高的严紧条件下杂交的能力来定义,高严紧条件包括在大约37℃到42℃大约50%的甲酰胺。一方面,本发明的核酸由它们在降低的严紧条件下杂交的能力来定义,低严紧条件包括在大约30℃到35℃大约35%到25%的甲酰胺。 
作为选择,本发明的核酸由它们在高的严紧条件下杂交的能力定义,高严紧条件包括42℃,50%的甲酰胺、5×SSPE、0.3%SDS和重复序列封闭核酸,如cot-1或者鲑鱼精DNA(如,200n/毫升剪切的和变性的鲑鱼精DNA)。一方面,本发明的核酸由它们在降低的严紧条件下杂交的能力定义,该低严紧条件包括在降低的温度35℃,35%的甲酰胺。 
在核酸杂交反应中,用来达到特定的严紧水平的条件可根据被杂交的核酸的特性来变化。例如,核酸的杂交区域的长度、互补性程度、核酸序列组成(例如,GC与AT含量)和核酸类型(例如,RNA或DNA)可在选择杂交条件时被加以考虑。其它的考虑是其中一种核酸是否被固定在例如滤纸上。 
杂交可以在低严紧、中等严紧、高严紧条件下进行。作为核酸杂交的一个例子,含有固定的变性核酸的聚合物膜首先在45℃下在含有0.9M NaCl、50mMNaH2PO4,pH 7.0、5.0mM Na2EDTA、0.5%SDS、10×Denhardt′s试剂和0.5毫克/毫升的聚核糖腺苷酸的溶液中预杂交30分钟。然后向该溶液中加入到大约2×107cpm(放射性比度为4-9×108cpm/ug)的32P末端标记的寡聚核苷酸探针。在温育12-16个小时以后,该膜在室温下在含有0.5%SDS的1×SET(150mM NaCl、20mM Tris盐酸,pH 7.8、1mM Na2EDTA)的溶液中洗涤30分钟,随后,用新鲜的1×SET在寡聚核苷酸探针的Tm-10℃洗涤30分钟。该膜随后暴露于放射自显影的胶片以检测杂交信号。 
所有前面的杂交均可被考虑在高严紧条件下进行。 
杂交后,可以洗涤滤膜以去除任何非特异结合的可检测探针。用于洗涤滤膜的严紧度也可以依据杂交的核酸的性质、杂交核酸的长度、互补的程度、核苷酸序列的组成(如GC和AT含量)以及核酸类型(如,RNA,DNA)而变化。越来越高的严紧条件洗涤的例子如下:2×SSC,0.1%SDS在室温下进行15分钟(低严紧度);0.1×SSC,0.5%SDS在室温下进行30分钟到1个小时(中等严紧度);0.1×SSC,0.5%SDS在杂交温度与68℃之间进行15到30分钟(高严紧度);以及0.15M的NaCl在72℃进行15分钟(很高的严紧度)。最后的低严紧度洗涤可以在0.1×SSC在室温进行。以上的例子仅仅是列出一系列可以用于洗膜的条件。本领域技术人员知道,对于不同严紧度的洗涤有各种配方。一些其它的实例如下所示。 
已经与所述探针杂交的核酸可以通过放射自显影或者其它传统的技术鉴定。 
以上的程序可以被修改,以鉴定与所述探针序列的同源性水平降低的核酸。例如,为了得到与可检测探针的同源性降低的核酸,可以应用较低严紧度的条件。例如,在含有大约1M的Na+浓度的杂交缓冲液中杂交温度可以以5℃的幅度从68℃降到42℃。杂交以后,滤膜可以用2×SSC、0.5%SDS在杂交温度下洗涤。认为这些条件中超过50℃是“中等”条件,而低于50℃的条件是“低的”条件。“中等”杂交条件的一个具体例子是当以上的杂交在55℃进行。“低严紧”杂交条件的一个具体例子是当以上的杂交在45℃进行。 
作为选择,杂交可以在缓冲液中进行,如在含有甲酰胺的6×SSC中在42℃的温度进行。在这种情况下,在杂交缓冲液中的甲酰胺的浓度可以以5%的幅度从50%到0%,以鉴定与探针的同源性水平降低的克隆。杂交后,滤膜可以用6×SSC、0.5%SDS在50℃洗涤。认为这些条件中超过25%的甲酰胺是“中等”条件,而低于25%的甲酰胺的条件是“低的”条件。“中等”杂交条件的一个具体例子是当以上的杂交在甲酰胺为30%时进行。“低严紧”杂交条件的一个具体例子是当以上的杂交在甲酰胺为10%时进行。 
然而,杂交形式的选择并不是关键的,而是洗脱条件的严紧度提出了确定一段核酸是否属于本发明范围的条件。用于鉴定核酸是否属于本发明范围的洗脱条件包括,例如在pH 7的大约0.02摩尔的盐浓度,温度至少是大约50℃或者大约55℃到大约60℃;或者在72℃,大约0.15M NaCl的盐浓度,大约15分钟;或者大约0.2×SSC的盐浓度,温度至少为大约50℃或者大约55℃到大约60℃,进行大约15到20分钟;或者,杂交复合物在含有0.1%SDS的大约2×SSC的盐溶液中室温15分钟洗脱两次,然后用含有0.1%SDS的0.1×SSC在68℃、15分钟洗脱两次;或者等效条件,参见Sambrook、Tijssen和Ausubel所说明的SSC缓冲液和等效条件。 
这些方法可用来分离本发明的核酸。例如,前述的方法可用来分离具有与选自A组核酸序列中的一个序列和与其实质上相同的序列,或含有其至少大约10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段和与其互补的序列中的核酸序列具有至少大约97%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%同源性的序列的核酸。可使用联配算法来测定同源性。例如,同源的多核苷酸所具有的编码序列可以是在此所述的一种编码序列的天然发生的等位基因变异体。当与A组核酸序列中的核酸或与其互补的序列比较时,这样的等位基因变异体具有一个或多个核苷酸的取代、删除或添加。 
另外,上述的程序可以被用来分离核酸,所述核酸编码的多肽与具有B组氨基酸序列和与其实质上相同的序列中的一个序列,或含有其5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的多肽具有至少大约99%、95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至 少55%或至少50%的同源性,所述同源性可以使用序列联配算法(例如,如FASTA3.0t78版算法,使用默认参数)来测定。 
寡核苷酸探针和使用它们的方法
本发明也提供了核酸探针,其可以被用来例如鉴定编码具有木聚糖酶活性的多肽或其片段的核酸或者用于鉴定木聚糖酶基因。一方面,所述探针包括本发明的核酸的至少10个连续的碱基。作为选择,本发明的探针可以是本发明的核酸阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150或者大约10到50、大约20到60、大约30到70个连续的碱基。所述探针通过结合和/或杂交来鉴定核酸。所述探针可以用于本发明的阵列,参见以下的讨论,包括,例如毛细管阵列。本发明的探针也可以用于分离其它的核酸或者多肽。 
A组核酸序列和与其实质上相同的序列、与其互补的序列、或含有A组核酸序列和与其实质上相同的序列中的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段、或与其互补的序列的分离核酸也可用作探针以确定一种生物学样品如土样中是否含有具有本发明核酸序列的生物体,或确定获得核酸的生物体。在这样的程序中,很有可能包藏有可以分离出所述核酸的生物体的生物样品被获得,并从所述样品中得到核酸。在允许探针特异地与所述样品中存在的任何互补序列杂交的条件下,让所述核酸与所述探针接触。 
在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以确定允许所述探针特异地与互补的核酸杂交的条件。 
如果样品含有可以从其中分离出所述核酸的生物体,那么探针的特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测,所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的酶。 
使用标记探针来检测在样品中存在的互补核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交方法以及点杂交。每种方法的实验方案都已经由Ausubel等人,Current Protocols in Molecular Biology,John Wiley 503Sons,Inc.(1997)和Sambrook等人,Molecular Cloning:ALaboratory Manual 2nd Ed.,Cold Spring Harbor Laboratory Press(1989)提供。 
作为选择,可以在一个扩增反应中使用多于一种探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发 明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。一方面,所述探针包括寡聚核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述。可选择地是,扩增包括连接酶链式反应、3SR或链置换反应(strand displacement reaction)。(见,Barany,F.,″The Ligase ChainReaction in a PCR World″,PCR Methods and Applications 1:5-16,1991;E.Fahy等人,″Self-sustained Sequence Replication(3SR):An Isothermal Transcription-based Amplification System Alternative to PCR″,PCR Methods and Applications 1:25-33,1991和Walker G.T.等人,″Strand Displacement Amplification-an Isothermal invitro DNA Amplification Technique″,Nucleic Acid Research 20:1691-1696,1992)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选择地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在。 
源自位于A组核酸序列和与其实质上相同的序列中的序列的末端附近的序列的探针也可以在染色体移步(chromosome walking)程序中被应用,以鉴定含有位于A组核酸序列和与其实质上相同的序列中的序列附近的基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码别的蛋白的基因。 
具有A组核酸序列和与其实质上相同的序列、与其互补的序列、或含有A组核酸序列和与其实质上相同的序列中的一个序列的至少10、15、20、25、30、35、40、50、75、100、150、200、300、400或500个连续碱基的片段、或与其互补的序列的分离核酸可用作探针以鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,但是这些生物体可以不是本发明的核酸起初被分离出来的那些生物体。例如,其它的生物体可以是相关的生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交采用以上描述的任何方法来检测。 
通过变化被用来鉴定核酸例如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严紧度,可以鉴定和分离与探针具有不同水平的同源性的核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严紧度变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严紧的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的经验公式计算: 
对于在14到70个核苷酸长度的探针,应用此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。 
如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的 N是探针的长度。 
预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s溶液的配方列于Sambrook等,supra中。 
通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在低于Tm温度15-25℃进行。对于较短的探针,如寡聚核苷酸探针,杂交的过程可以是在低于Tm温度5-10℃下进行。一般,在6×SSC溶液中的杂交过程在大约68℃进行。通常,在含有50%甲酰胺的溶液中的杂交的过程在大约42℃进行。 
抑制木聚糖酶的表达 
本发明提供了与本发明的核酸——例如编码木聚糖酶的核酸——互补的核酸(例如,本发明的核酸的反义序列)。反义序列能够抑制木聚糖酶编码基因的转运、剪接或转录。通过以基因组DNA或信使RNA作为靶标可实现抑制作用。靶核酸的转录或功能可通过例如杂交和/或剪切而被抑制。本发明提供的一组特别有用的抑制剂包括能够结合木聚糖酶基因或信息的寡核苷酸,在两种情况下都可阻止或抑制木聚糖酶的产生或功能。这种联合可以通过序列特异性杂交实现。另一类有用的抑制剂包括可引起木聚糖酶信息失活或剪切的寡核苷酸。该寡核苷酸可以具有导致这样的剪切的酶活性,如核酶(ribozyme)。寡核苷酸可被化学修饰或与能够切割互补核酸的酶或组合物偶联。可以对由很多不同的寡聚核苷酸组成的库进行筛选,以寻找到那些具有所需活性的寡聚核苷酸。因此,本发明提供了各种在核酸和/或蛋白水平抑制木聚糖酶表达的组合物,例如,反义、iRNA和含有本发明的木聚糖酶序列的核酶和本发明的抗木聚糖酶抗体。 
抑制木聚糖酶的表达有大量的工业应用。例如,抑制木聚糖酶表达可延缓或防止酸败。当多糖例如结构性多糖被酶降解时可发生酸败。这可引起水果和蔬菜的变质或腐败。在一个方面,应用可抑制木聚糖酶的表达和/或活性的本发明的组合物,例如抗体、反义寡核苷酸、核酶和RNAi,可以延缓或防止酸败。因此,在一个方面,本发明提供了一些方法和组合物,包括在植物或植物产品(如谷物、谷粒、水果、种子、根、叶等)上使用本发明的抗体、反义寡核苷酸、核酶和RNAi来延缓或防止酸败。这些组合物也可被植物(例如,转基因植物)或其他生物体(如,用本发明的木聚糖酶基因转化的细菌或其他微生物)表达。 
本发明的抑制木聚糖酶表达的组合物(例如,反义、iRNA、核酶、抗体)可被用作药学组合物,例如抗病原体药剂或用于其它治疗中,例如抗微生物试剂,例如抗沙门氏菌试剂。 
反义寡核苷酸 
本发明提供了能够结合木聚糖酶信息的反义寡核苷酸,其能够通过靶向mRNA来抑制木聚糖水解酶活性(例如,催化内β-1,4-木糖苷键的水解)。设计反义寡核苷酸的策略在科学和专利文献中已被详述,专业技术人员能够使用本发明的新型的试剂来设计这样的木聚糖酶寡核苷酸。例如,用于筛选有效的反义寡聚核苷酸的基因移步(gene walking)/RNA作图(RNA mapping)实验方案在本领域是已知的,参见,如,Ho(2000)Methods Enzymol.314:168-183,其说明了RNA作图分析,它是基于标准的分子技术,可以为有效的反义序列的选择提供容易的和可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。 
天然发生的核酸可以作为反义寡聚核苷酸。所述反义寡聚核苷酸可以是任何长度;例如,在可供选择的方面,所述反义寡聚核苷酸是在大约5到100之间、大约10到80之间、大约15到60之间、大约18到40之间。通过常规的筛选来确定最佳的长度。所述反义寡聚核苷酸可以以任何浓度存在。通过常规的筛选来确定最佳的浓度。已知有许多合成的、非天然发生的核苷酸和核酸类似物可以针对这样的潜在的问题。例如,可以应用含有非离子骨架如N-(2-氨乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸酯连接的反义寡聚核苷酸,如在WO 97/03211;WO 96/39154;Mata(1997)Toxicol Appl Pharmacol 144:189-197;Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)中所说明的。本发明提供的具有合成的DNA骨架类似物的反义寡聚核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸,正如以上所说明的。 
也可以应用组合化学方法来产生大量数目的寡聚核苷酸,可以对它们进行快速筛选,找出对某些靶标例如本发明的正义和反义木聚糖酶序列具有合适的结合亲和性和特异性的特异的寡聚核苷酸(参见,如,Gold(1995)J.of Biol.Chem.270:13581-13584)。 
抑制性核酶 
本发明提供可以结合木聚糖酶信息的核酶。这些核酶可以通过,例如靶向mRNA来抑制木聚糖酶活性。设计核酶和选择用于靶向的木聚糖酶特异的反义序列的策略在科学和专利文献中有很好的说明,而且技术人员可以应用本发明的新型的试剂设计出这样的核酶。核酶通过核酶的靶RNA结合部分结合于靶RNA而起作用,核酶的RNA结合部分非常靠近切割靶RNA的RNA酶活部分。这样,通过互补的碱基配对,核酶识别和结合靶RNA,而且一旦结合于正确的位置,便以酶的活性作用来切割靶RNA和使其失活。如果切割发生在编码序列中,以这样的方式切割靶RNA将会破坏其引导合成编码的蛋白的能力。核酶结合和切割其RNA靶之后, 
它可以从结合的RNA上释放出来并且重复切割新的靶子。 
在一些情况下,核酶的酶性质会优于其它的技术,如反义技术(其中核酸分子结合于核酸靶来阻止其转录、翻译或者与其它分子的联系),因为实现治疗效果所必要的核酶有效浓度可能低于反义寡聚核苷酸的浓度。这一潜在的优点反映出核酶可以以酶的方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个分子。此外,核酶是一种典型的高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的反义寡聚核苷酸强。 
本发明的核酶,例如,具有酶活的核酶RNA分子可以形成锤头状模体、发夹模体,如肝炎δ病毒模体、I类内含子模体和/或与RNA引导序列相联系的RNaseP类似的RNA。锤头状模体的例子在如Rossi(1992)Aids Research and Human Retroviruses 8:183中有说明;发夹模体在Hampel(1989)Biochemistry 28:4929和Hampel(1990)Nuc.Acids Res.18:299中有说明;肝炎δ病毒模体在Perrotta(1992)Biochemistry 31:16中有说明;RnaseP模体在Guetrier-Takada(1983)Cell 35:849中有说明;I类内含子在Cech美国专利4,987,071中有说明。这些特定模体的引述并不是限制性的。本领域技术人员将认识到本发明的核酶,如,本发明的有酶活的RNA分子,可以有与一个或者多个靶基因的RNA区域互补的特异的底物结合位点。本发明的核酶可以在底物结合位点内或者其周围具有赋予了该分子RNA切割活性的核苷酸序列。 
RNA干扰(RNAi) 
在一个方面,本发明提供了被称为“RNAi”分子的RNA抑制性分子,其含有本发明的木聚糖酶序列。RNAi分子构成双链RNA(dsRNA)分子。RNAi可抑制木聚糖酶基因的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。本发明不限于任何特殊的作用机制,RNAi可进入细胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。当细胞与双链RNA(dsRNA)接触时,来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为小分子干扰RNA的短的碎片,它可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene-silencing)疗法中,见,例如Shuey(2002)Drug Discov.Today7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi分子可用来 在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是为人所熟知的,见,例如美国专利6,506,559;6,511,824;6,515,109;6,489,127。 
核酸的修饰
本发明提供了产生本发明的核酸的变异体的方法,所述的本发明核酸例如那些编码木聚糖酶的核酸。这些方法可以被重复或者以各种组合方式来应用,以产生与模板核酸编码的木聚糖酶相比具有改变的或不同的活性,或者改变的或不同的稳定性的木聚糖酶。这些方法也可以被重复或者以各种组合方式来应用,以例如使基因/信息表达、信息翻译或者信息稳定性产生变化。另一方面,细胞的遗传学组成可以被改变,通过例如离体进行同源基因的修饰,然后将其重新插入到细胞。 
本发明的核酸可以用任何方法进行变化。例如,无定向或随机方法、或者非随机、或者“定向进化”的方法,参见如,美国专利6,361,974。基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者γ辐射,或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合使用来诱导DNA的断裂,其可以通过重组被修复。另外的化学诱变剂包括,如,亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。 
可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques 18:194-196。可选择地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配(例如GeneReassemblyTM,见例如美国专利6,537,776)、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursive sequence recombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selection mutagenesis)、限制纯化诱变(restriction-purification mutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方 法和其它方法的组合产生。 
以下的出版物描述了各种递归重组程序和/或可以整入到本发明的方法中的方法:Stemmer(1999)“Molecular breeding of viruses for targeting and other clinical properties”Tumor Targeting 4:1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang(1999)“Evolution of a cytokine using DNA family shuffliing”NatureBiotechnology 17:793-797;Minshull(1999)“Protein evolution by molecular breeding”Current Opinion in Chemical Biology 3:284-290;Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264;Crameri(1998)“DNA shuffling of a family of genes from diverse species accelerates directed evolution”Nature 391:288-291;Crameri(1997)“Molecular evolution of an arsenate detoxification pathway by DNA shuffling”Nature Biotechnology 15:436-438;Zhang(1997)“Directed-evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri 等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through display on a lac repressor′headpiece dimer′”Journal of Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia of Molecular Biology.VCH Publishers,New York.447-457页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes”Bio Techniques 18:194-195;Stemmer等(1995)“Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution of Molecular Computation”Science 270:1510;Stemmer(1995)“Searching Sequence Space”Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370:389-391;和Stemmer(1994)“DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution”Proc.Natl.Acad.Sci.USA 91:10747-10751。 
产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)“Approaches to DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462;Botstein & Shortle(1985)“Strategies and applications of in vitro mutagenesis”Science 229:1193-1201;Carter(1986)“Site-directed mutagenesis”Biochem.J.237:l-7;Kunkel(1987)“The efficiency of oligonucleotide directed  mutagenesis”在Nucleic Acids & Molecular Biology(Eckstein,F.和Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等(1987)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242:240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment”Nucleic Acids Res.10:6487-6500;Zoller & Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100:468-500和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye (1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698;Sayers等(1988)“Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.Asids Res.16:791-802;和Sayers等(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814);使用缺口双倍DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex DNA”154:350-367;Kramer等(1988)“Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;和Fritz等(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。 
可以用于实践本发明的另外的实验方案包括点错配修复(Kramer(1984)“Point Mismatch Repair”Cell 38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nucl.Acids  Res.13:4431-4443和Carter(1987)“Improved oligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154:382-403),缺失诱变(Eghtedarzadeh (1986)“Use of oligonucleotides to generate large deletions”Nucl.Acids Res.14:5115),限制-选择和限制-纯化(Wells等(1986)“Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.R.Soc.Lond.A317:415-423),通过全基因合成的诱变(Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein”Science 223:1299-1301;Sakamar和Khorana(1988)“Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)”Nucl.Acids Res.14:6361-6372;Wells等(1985)“Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites”Gene 34:315-323和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993)“Protein engineering for unusual environments”Current Opinion in Biotechnology 4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中有说明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。 
在例如下列的文件中描述了可以用于实践本发明的实验方案,如Stemmer的美国专利5,605,793(1997.2.25),“Methods for In Vitro Recombination”;Stemmer等的美国专利5,811,238(1998.9.22)“Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination”;Stemmer等的美国专利5,830,721(1998.11.3),“DNA Mutagenesis by Random Fragmentation and Reassembly”;Stemmer等的美国专利5,834,252(1998.11.10),“End-Complementary Polymerase Reaction”;Minshull等的美国专利5,837,458(1998.11.17)“Methods and Compositions for Cellular and Metabolic Engineering”;WO 95/22625,Stemmer 和Crameri,“Mutagenesis by Random Fragmentation and Reassembly”;WO 96/33207,Stemmer和Lipschutz,“End Complementary Polymerase Chain Reaction”;WO 97/20078,Stemmer和Crameri的“Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination”;WO 97/35966,Minshull和Stemmer,“Methods and Compositions for Cellular and Metabolic Engineerin”;WO 99/41402,Punnonen等,“Targeting of Genetic Vaccine Vectors”;WO 99/41383,Punnonen等,“Antigen Library Immunization”;WO 99/41369,Punnonen等,“Genetic Vaccine Vector Engineering”;WO 99/41368,Punnonen等,“Optimization of Immunomodulatory Properties of Genetic Vaccines”;EP 752008, Stemmer和Crameri,“DNA Mutagenesis by Random Fragmentation and Reassembly”;EP 0932670,Stemmer,“Evolving Cellular DNA Uptake by Recursive Sequence Recombination”;WO 99/23107,Stemmer等,“Modification of Virus Tropism and Host Range by Viral Genome Shuffling”;WO 99/21979,Apt等,“Human Papillomavirus Vectors”;WO 98/31837,del Cardayre等,“Evolution of Whole Cells and Organisms by Recursive Sequence Recombination”;WO 98/27230,Patten和Stemmer,“Methods and Compositions for Polypeptide Engineering”;WO 98/27230,Stemmer等,“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection”;WO 00/00632,“Methods for Generating Highly Diverse Libraries”;WO 00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences”;WO 98/42832,Amold等,“Polynucleotide Sequences Using Random or Defined Primers”;WO 99/29902,Arnold等,“Method for Creating Polynucleotide and Polypeptide Sequences”;WO 98/41653,Vind,“An in Vitro Method for Construction of a DNA Library”;WO 98/41622,Borchert等,“Method for Constructing a Library Using DNA Shuffling”;以及WO 98/42727,Pati和Zarling,“Sequence Alterations using Homologous Recombination”。 
在例如下列的文件中描述了可以用于实践本发明的方案(提供了关于产生不同多样性的方法的细节),如美国专利申请系列号(USSN)09/407,800,Patten等的“SHUFFLING OF CODON ALTERED GENES”,于1999年9月28日归档;delCardayre等的“EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,美国专利6,379,964;Crameri等的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,美国专利6,319,714;6,368,861;6,376,246;6,423,542;6,426,224和PCT/US00/01203;Welch等的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”,美国专利6,436,675;Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDESHAVING DESIRED CHARACTERISTICS”,2000年1月18日归档,(PCT/US00/01202)和,如Selifonov等的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,2000年7月18日归档,(美国系列号09/618,579);Selifonov和Stemmer的“METHODS OF POPULATING DATA STRUCTURES FOR USE INEVOLUTIONARY SIMULATIONS”,2000年1月18日归档(PCT/US00/01138),和Affholter的“SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATEDRECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”,2000年9月6日归档(美国系列号09/656,549),和美国专利6,177,263;6,153,410。 
非随机的或者“定向进化”的方法包括例如,饱和诱变(GSSMTM)、合成的 连接重装配(SLR),或者它们的组合,它们被用来修饰本发明的核酸,以产生具有新的或者改变的性质的木聚糖酶(如,在强酸性或者强碱性条件、高温等条件下的活性)。由改变了的核酸编码的多肽可以在测定木聚糖水解或者其它活性之前对活性进行筛选。可以应用任何测试形式或者方案,如,用毛细管阵列平台。参见,如,美国专利6,361,974;6,280,926;5,939,250。 
饱和诱变,或者GSSMTM
一方面,应用含有简并的N,N,G/T序列的密码子引物将点突变引入到多聚核苷酸,如,本发明的木聚糖酶或者抗体,以便产生一套子代多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基酸替换,例如,替换的位置可以在将要被改变的酶活性位点或者配基结合位点内的氨基酸残基。这些寡聚核苷酸可以包括邻近的第一同源序列、简并的N,N,G/T序列和可选择的第二同源序列。由这样的寡聚核苷酸的应用获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。一方面,一个这样的简并寡聚核苷酸(例如,由一个简并的N,N,G/T盒构成)被应用,以使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替换。另一方面,应用至少两个简并序列盒——或者是在同一个寡聚核苷酸中或者不是,以使亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替代。例如,在一个寡聚核苷酸中可以含有多于一个的N,N,G/T序列,这样,在多于一个的位点导入氨基酸突变。这样的多个N,N,G/T序列可以是直接邻近的,或者被一个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡聚核苷酸可以单独应用或者与含有N,N,G/T序列的密码子组合应用,以引入氨基酸增加、缺失和/或取代的任何组合或者排列。 
一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡聚核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一方面,可以应用简并度比N,N,G/T序列小的简并盒。例如,在一些例子中,(如,在一个寡聚核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。作为选择,在一些例子中,(如,在一个寡聚核苷酸中)使用简并的N,N,N三联体序列是理想的。 
一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地和容易地在多肽的所有氨基酸位置中的每一个位置获得完整范围的可能的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面,所述方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置可能的20种氨基酸×100个氨基酸位置)。通过应用含有简并N,N,G/T三联体的一段寡聚核苷酸或者一套寡聚核苷酸, 32个不同的序列可以编码所有20种可能的天然氨基酸。因此,在使用至少一种这样的寡聚核苷酸进行亲本多聚核苷酸序列饱和诱变的反应容器中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡聚核苷酸导致在每个反应容器中仅仅有一种子代多肽产物。非简并的寡聚核苷酸可以选择性地与公开的简并引物组合使用;例如,在工作多肽中,可以应用非简并的寡聚核苷酸来产生特异的点突变。这就提供了一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起终止密码子产生和多肽片段相应的表达终止的点突变。 
一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽(如,木聚糖酶)分子的多聚核苷酸,因此所有的20种天然氨基酸都会出现在对应于亲本多聚核苷酸中的被诱变的密码子位置上的特定的氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的宿主,如E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较,在碱性、酸性条件下木聚糖水解活性增强)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。 
一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。 
另一方面,位点饱和诱变可以与重排、嵌合、重组和其它的诱变程序以及筛选一起应用。本发明提供了以反复的方式来应用任何的诱变程序,包括饱和诱变。在一个实例中,任何诱变程序的反复应用与筛选组合使用。 
本发明也提供了所专有的密码子引物(含有简并N,N,N序列)的应用,其可将点突变导入进多核苷酸中,以产生一套子代多肽,其中,在每个氨基酸位置都可以出现完整范围的单个氨基酸替换(基因位点饱和诱变(GSSMTM))。使用的寡聚物包括邻接的第一同源序列、简并N,N,N序列和优选的但不是必需的第二同源序列。由这样的寡聚核苷酸的应用获得的下游的子代翻译产物包括在该多肽上每一个氨基酸位点的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并包括了所有20个氨基酸的密码子。 
一方面,一个这样的简并寡聚物(由一个简并的N,N,N盒构成)被应用,以使亲代多聚核苷酸模板中各个原先的密码子发生完整范围的密码子替换。另一方面, 应用至少两个简并N,N,N序列盒——或者是在同一个寡聚物中或者不是,以使亲代多聚核苷酸模板中的至少两个原先的密码子发生完整范围的密码子替代。例如,在一个寡聚物中可以含有多于一个的N,N,N序列,这样,在多于一个的位点导入氨基酸突变。这样的多个N,N,N序列可以是直接邻近的,或者被一个或者多个另外的核苷酸序列隔开。另一方面,可用于引入增加和缺失的寡聚物可以单独应用或者与含有N,N,N序列的密码子组合应用,以引入氨基酸增加、缺失和/或取代的任何组合或者排列。 
在一个特殊的实例中,可以应用含有邻接的N,N,N三联体,即简并的(N,N,N)n序列的寡聚物,在两个或者多个邻近的氨基酸位置同时进行诱变。 
另一方面,本发明提供了简并度比N,N,N序列小的简并序列盒的应用。例如,在一些例子中,(如,在一个寡聚物中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。可选择的是,在一些实例中(例如,在一个寡聚物中)需要使用简并的N,N,N三联体序列、N,N,G/T,或N,N,G/C三联体序列。 
但要理解的是,在本发明中所公开的简并三联体(如N,N,G/T或N,N,G/C三联体序列)的应用在数个方面都是有优势的。在一个方面,本发明提供了可以系统地和相当容易地在多肽的各个和所有氨基酸位置中产生完整范围的可能的氨基酸(总共20个氨基酸)替代的手段。因此,对于100个氨基酸的多肽,本发明提供了可系统地和相当容易地产生2000个不同的种类(即,每个位点20个可能的氨基酸乘100个氨基酸位点)的方法。要理解的是,通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡聚物,可以提供编码20个可能氨基酸的32条序列。因此,在使用一种这样的寡聚物进行亲本多聚核苷酸序列饱和诱变的反应容器中,产生了32种不同的子代寡聚核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡聚物导致在每个反应容器中仅仅有一种子代多肽产物。 
本发明也提供了非简并寡聚物的应用,其可选择性地与公开的简并引物联合使用。要理解的是,在一些情况下,使用非简并寡聚物在工作多核苷酸中产生特异点突变是有利的。这就提供了一种手段来产生特异的沉默点突变、导致相应的氨基酸改变的点突变和引起终止密码子产生和表达相应多肽片段的点突变。 
因此,在本发明的一个方面,每个饱和诱变反应容器中含有编码至少20种子代多肽分子的多聚核苷酸,这样所有的20种氨基酸都会出现在对应于亲本多聚核苷酸中被诱变的密码子位置的特定的氨基酸位置。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的E.coli宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(与亲本多肽比较)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。 
要理解的是,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,确定出的有利的氨基酸变化可以在超过一个的氨基酸位置。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。 
因此,在一个非限制性的实例中,本发明提供了饱和诱变与其它诱变处理过程的组合应用,例如将两个或更多个相关的多核苷酸导入进合适的宿主细胞中,这样通过重组和还原性重配(reductive reassortment)产生杂交多核苷酸。 
除了沿基因的整个序列进行诱变以外,本发明提出,可以使用诱变在多核苷酸序列中替换任意数目的碱基,其中所述的要被诱变的碱基数目优选从15至100,000的每个整数。因此,可以将任一数目或不连续数目的碱基(总数优选选自从15至100,000)进行诱变。优选使用分离的核苷酸沿多核苷酸序列诱变每个位点或一组位点。要被诱变的一组3个位点可以是密码子。突变优选使用诱变引物导入,该引物含有异源序列盒,也称为诱变序列盒。示例性的序列盒具有1至500个碱基。这样的异源基因盒中的每个核苷酸位点可以是N、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/G或E,其中E可以是非A、C、G、或T的任何碱基(E可以被称为设计者寡聚物)。 
通常意义上,饱和诱变包括在已确定要诱变的多核苷酸序列(其中所述的要被诱变的序列的长度优选从大约15至100,000个碱基)中诱变一整套诱变序列盒(其中所述的每个序列盒的长度优选为大约1-500个碱基)。因此,一组突变(范围从1至100个突变)被导入进要被诱变的每个序列盒中。在进行一轮饱和诱变时,被导入进一个序列盒的一组突变可以与要被导入进第二个序列盒的第二组突变不同或相同。这样的分组的例子是缺失、添加、特定密码子的分组和特定核苷酸序列盒的分组。 
将要被诱变的确定序列包括整个基因、通路、cDNA、整个开放阅读框(ORF)和整个启动子、增强子、阻遏物/反式激活因子、复制起始点、内含子、操纵子或任何多核苷酸功能集团。通常,在此的“确定序列”可以是15个碱基的多核苷酸序列和长度在15个碱基和15,000个碱基之间的任何多核苷酸序列(本发明特别指定其间的任何整数)。在选择密码子组别时的考虑包括由简并诱变序列盒编码的氨基酸类型。 
在一个实例中,可导入进诱变序列盒中一组突变集合,本发明特别地提供了在每个位点上编码2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20个氨基酸的简并密码子取代(使用简并的寡聚物)和由此编码的多肽 文库。 
合成的连接重装配(SLR) 
本发明提供了一种非随机的基因改变系统,命名为“合成的连接重装配”或者简称为“SLR”,这是一种“定向进化方法”,可以产生具有新的或者改变的性质的多肽,例如,本发明的木聚糖酶或抗体。 
SLR是一种非随机地连接寡聚核苷酸片段的方法。这一方法与随机的寡聚核苷酸重排不同,因为核酸构建模块(building blocks)并不进行随机重排、连接或者嵌合,而是进行非随机的装配。参见,如,美国专利申请系列号(USSN)09/332,835,名称为“Synthetic Ligation Ressembly in Directed Evolution”,在1999年6月14日归档(“USSN 09/332,835”)。一方面,SLR包括以下的步骤:(a)提供模板多聚核苷酸,其中该模板多聚核苷酸包括编码同源基因的序列;(b)提供多个构建模块多聚核苷酸,其中所述的构建模块多聚核苷酸被设计为可与模板多聚核苷酸在预定的序列处横跨装配(cross-over reassemble),而且所述的构建模块多聚核苷酸包括所述同源基因的变异体序列以及在变异序列两侧与模板多聚核苷酸同源的序列;(c)将模板多聚核苷酸与构建模块多聚核苷酸结合,以便构建模块多聚核苷酸与模板多聚核苷酸横跨装配,产生包含同源基因序列变异体的多聚核苷酸。 
SLR并不依赖于在待重新组装的多聚核苷酸之间存在高水平的同源性。这样,这一方法可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库。SLR可以用于产生包括超过101000个不同子代嵌合体的文库。这样,本发明包括用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。 
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块以预先制定的顺序联接的话。因此,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。一方面,退火的构建模块用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建模块的共价键连接。 
一方面,寡聚核苷酸构建模块的设计通过分析一套祖先核酸序列模板来得到,该模板作为产生子代一套最终的嵌合多聚核苷酸的基础。这些亲本寡聚核苷酸模板作为序列信息源,辅助待诱变例如待嵌合化或者重排的核酸构建模块的设计。在这一方法的一个方面,为了选择一个或者多个分界点,对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域,并且可以包括一个或者多个核苷酸。这些分界点优选由至少两个祖先模板中共有。所述分界点可以因此用于描 绘将要产生的寡聚核苷酸构建模块的边界,以便重新排列亲本寡聚核苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多聚核苷酸序列共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点可以是由至少半数的亲本多聚核苷酸序列共同拥有的同源区域,或者,是由至少三分之二的亲本多聚核苷酸序列共同拥有的同源区域。更加优选地,可应用的分界点是至少四分之三的亲本多聚核苷酸序列共同拥有的同源区域,或者,是几乎所有的亲本多聚核苷酸序列共同拥有的同源区域。一方面,分界点是由所有的亲本多聚核苷酸序列共同拥有的同源区域。 
一方面,为了产生一个彻底的子代嵌合多聚核苷酸文库,连接重装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能顺序的组合存在于一套最终的嵌合核酸分子中。同时,另一方面,每个组合中的装配顺序(即,各个构建模块的装配顺序,按各个最终的嵌合核酸序列的5’到3’的方向)是按照以上所述设计的(或者是非随机的)。由于本发明的非随机性质,不需要的副产物的可能性大大降低。 
另一方面,系统地实施连接重装配的方法。例如,实施本方法来产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选,例如逐个的筛选。换句话说,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发明的非随机性,产生的子代分子优选地包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可以理解,本发明在分界点的选择、核酸构建模块的大小和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是,本发明的操作对分子间同源性的要求被大大降低了。实际上,甚至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别点。例如,由于密码子的摆动性,即,密码子的简并,核苷酸的替代可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编码的氨基酸。可选择地,一个密码子可以被改变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换,它们能够被引入到核酸构建模块中,由此增加分子间同源的分界点的发生率,这样就允许在构建模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产生。 
合成基因重装配 
在一个方面,本发明提供了称为合成基因重装配的非随机方法(例如,GeneReassemblyTM,见,例如美国专利6,537,776),其不同于随机的重排,因为核酸构建模块并不进行随机重排、连接或者嵌合,而是进行非随机的装配。 
合成基因重装配方法并不依赖于在待重排的多聚核苷酸之间存在高水平的同源性。本发明可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库(或一套子代分子)。令人信服的是,合成基因重装配甚至可以用于产生包括超过101000个不同子代嵌合体的文库。 
因此,在一个方面,本发明提供了用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法,这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。 
在一个方面,合成基因重装配包括:1)制备分子的子代(包括含有多核苷酸序列的分子,例如含有多肽编码序列的分子),所述子代经诱变后相对于一个或多个祖先或亲代模板来说具有了至少一个点突变、添加、缺失和/或嵌合作用;2)筛选子代分子,例如使用高通量方法,筛选出至少一种感兴趣的特性(如酶活性的改善);3)可选地,获得和/或编录关于亲代和/或子代分子的结构和/或功能信息;和4)可选地,重复1)至3)中的任何步骤。在一个方面,在称为“密码子位点饱和诱变”的方法中,(例如从亲代多核苷酸模板中)产生了多核苷酸的子代,子代中的每一个都具有至少一组多至三个的邻接点突变(即,构成新密码子的不同碱基),这样每个密码子位置上都会出现各种密码子(或编码相同氨基酸的简并密码子组成的家族)。对应于这样的多核苷酸子代,也产生了一组由其编码的子代多肽,其中每一个都含有至少一个氨基酸点突变。在一个方面,以称之为“氨基酸位点饱和诱变”的方式,可以产生一个这样的突变多肽,即多肽的所有氨基酸位点中的每一个位点上的α-氨基酸取代作用可以形成19种天然被编码的多肽的每一种。对于亲代多肽的所有氨基酸位置中的每一个位置,可以产生总共20个不同的子代多肽,其中包括了原初的氨基酸,或者有可能产生超过21个的不同子代多肽,如果除20个天然编码的氨基酸之外还使用或替代使用了其它的氨基酸的话。 
因此,在另一个方面,这种方法也可用来产生一些突变体,它们含有除20个天然的形成编码多肽的α-氨基酸之外的和/或与其组合的其它少见的和/或非天然编码的氨基酸和氨基酸衍生物。还是在另一个方面,这种方法也可用来产生一些突变体,通过使用除合适宿主的天然的或未被改变的密码子识别系统之外的和/或与其组合的改变了的、诱变了的和/或设计者密码子的识别系统(例如在含有一个或多个被改变的tRNA分子的宿主细胞中)。 
仍在另一个方面,本发明涉及重组,更具体地,涉及制备编码多肽的多核苷酸的方法,通过对含有部分同源的区域的多核苷酸序列进行重配(re-assortment),装配所述多核苷酸,形成至少一个多核苷酸,并筛选出可产生具有有用的特性的 多肽的多核苷酸。 
仍然在另一个方面,本发明可就通过目前技术获得的任何分子特性(例如,酶活性)或特性的组合,对已形成的突变(特别包括饱和诱变)改变的作用进行分析和编目。因此,提供了全面的方法来确定亲代多肽中每一个氨基酸发生至少19种可能的取代中的任一种时产生的效果。根据其对多肽的可测到的特性的潜在影响,可对亲代多肽中的各个氨基酸进行表征和编目。 
在一个方面,通过核酸构建模块将内含子导入到嵌合子代分子中。内含子通常在两个末端具有共同序列(consensus sequences),这使得它们具有可操作性。除了使基因剪接成为可能,内含子还具有其它的作用,例如通过提供与其它核酸具有同源性的位点,使得同源重组成为可能。为了这个目的和可能的其它目的,有时就需要产生用于导入内含子的大的核酸构建模块。如果所要产生的两个单链寡聚物的大小对于直接的化学合成来说过大,则这种特定的核酸构建模块也可通过直接化学合成两个以上的单链寡聚物或使用基于聚合酶的扩增反应来产生。 
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块能够以预先制定的顺序联接的话。因此,在一个方面,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的,如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。在本发明的一方面,退火的构建模块用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建模块的共价连接。 
偶联也可以这样的方式发生,即其中不使用处于粘末端中的任何核苷酸。所述偶联是存在(例如转化宿主中)的,所述偶联可以经过能够形成所谓的“缝隙连接(gap ligation)”或“有缝隙的连接(gapped ligation)”的连接酶的处理而被强化。这种类型的偶联可产生不必要的背景产物,但它的优势是可用来增加通过设计的连接重装配所产生的子代文库的多样性。某些粘末端能够发生自偶联而形成回文(palindromic)偶联。偶联可以通过使用连接酶进行处理而被实质上增强。在这些粘末端上缺少5’磷酸的优势是可用来防止这种类型的回文自连接。因此,本发明提供了缺少5’磷酸基团的核酸构建模块,它可被化学合成(或被定购)。作为选择,它们可通过某些处理而被去掉,例如用磷酸酶如牛肠碱性磷酸酶(CIAP)进行处理,以便防止在连接重装配的过程中出现回文自连接。 
在另一方面,核酸构建模块的设计是基于对一套祖先核酸模板的序列分析而得到的,该模板作为产生一套子代的最终的嵌合核酸分子的基础。因此,这些祖先核酸模板作为序列信息源,辅助待诱变的即待嵌合化的或者重排的核酸构建模块的设计。 
在一个实例中,本发明提供了一个家族的相关基因的嵌合和它们编码的相关产物的家族。在一个特定的实例中,被编码的产物是酶。本发明的木聚糖酶可根 据在此所述的方法被诱变。 
因此,根据本发明的一个方面,为了选择一个或者多个分界点,对多个祖先核酸模板(例如,具有A组核酸序列的多核苷酸)的序列进行联配,所述分界点可以位于同源的区域。所述分界点可以用于描绘将要产生的核酸构建模块的边界。因此,在祖先分子中确定和选择的分界点用作装配子代分子的潜在的嵌合位点。 
通常可应用的分界点是至少两个祖先模板共有的同源区域(包括至少一个同源核苷酸碱基)。分界点可以是由至少半数的祖先模板共同拥有的同源区域、是由至少三分之二的祖先模板共同拥有的同源区域、是至少四分之三的祖先模板共同拥有的同源区域,优选是几乎所有的祖先模板共同拥有的同源区域。更优选地,分界点是由所有的祖先模板共同拥有的同源区域。 
在一个方面,基因重装配过程被极限地实施,以便产生一个极限文库。换句话说,核酸构建模块的所有可能的组合顺序都存在于一套最终的嵌合核酸分子中。同时,每个组合中的装配顺序(即,各个构建模块在各个最终嵌合核酸的5’至3’序列中的装配顺序)是遵循设计的(或者说是非随机的)。由于本方法的非随机性质,不需要的副产物的可能性大大降低。 
在另一个方面,本方法提出,基因重装配过程可系统地被实施,例如,实施本方法来产生系统地区分化的文库,划分开的文库可以系统地进行筛选,例如逐个地筛选。换句话说,本发明提出,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。 
由于其具有以高度变通而又彻底和系统的方式进行嵌合作用的能力,尤其是当祖先分子之间具有低水平的同源性时,所以本发明提供了可以产生包括很大数目的子代分子的文库(或者一套分子)的方法。由于该基因重装配发明的非随机性,产生的子代分子优选地包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。在一个特定的方面,产生的这种文库含有超过103至超过101000个不同的子代分子种类。 
在一个方面,一组如所述产生的最终嵌合的核酸分子构成编码多肽的多核苷酸。根据一个方面,这种多核苷酸是基因,可以是人造基因。根据另一个方面,这种多核苷酸是基因通路,可以是人造基因通路。本发明提出,可以将本发明产生的一个或多个人造基因整合到人造基因通路中,如可在真核生物(包括植物)中起作用的通路中。 
在另一个实例中,产生构建模块的步骤的合成特性允许设计和导入的核苷酸(例如,可以是密码子或内含子或调控序列的一个或多个核苷酸)在以后在体外程序(例如,通过诱变)或在体内程序(例如,通过宿主生物的基因剪接能力) 被选择性地去掉。可理解的是,在许多实例中,除了形成可应用的分界点的潜在益处之外,还有许多其它的原因导致需要导入这些核苷酸。 
因此,根据另一个方面,本发明提出,可应用核酸构建模块来导入内含子。因此,本发明提出,功能性内含子可被导入进本发明的人造基因中。本发明也提出,功能性内含子可以导入进本发明的人造基因通路中。因此,本发明产生了一种嵌合的多核苷酸,它是含有一个(或多个)人工导入的内含子的人造基因。 
因此,本发明也产生了嵌合的多核苷酸,它是含有一个(或多个)人工导入的内含子的人造基因通路。优选地,人工导入的内含子能够以天然发生的内含子在基因剪接中发挥功能的方式在一种或多种宿主细胞的基因剪接中发挥作用。本发明提供了产生含有人造内含子的多核苷酸的程序,所述多核苷酸可以被导入进宿主生物体中进行重组和/或剪接。 
应用本发明产生的人造基因也可作为与别的核酸进行重组的底物。同样,应用本发明产生的人造基因通路也可作为与别的核酸进行重组的底物。在一个方面,重组可借助于或发生于人造的含内含子的基因和作为重组的另一方的核酸之间的同源区域。在一个方面,重组作用的另一方也可以是本发明产生的核酸,包括人造基因或人造基因通路。重组可借助于或发生于人造基因中一个(或多个)人工导入的内含子处的同源区域。 
本发明的合成基因重装配方法利用了多个核酸构建模块,其中的每一个优选具有两个可连接的末端。在每个核酸构建模块上的两个可连接末端可以是两个钝性末端(即,每个末端都无核苷酸悬出),或优选一个钝性末端和一个粘性末端(悬出端),或更优选的是为两个粘性末端。 
对于此目的,有用的粘性末端可以是3′突出的粘性末端或5′突出的粘性末端。因此,核酸构建模块可以具有一个3′粘末端、一个5′粘末端,或者两个3′粘末端或两个5′粘末端。核酸构建模块被装配成最终的嵌合核酸分子的整个顺序是通过有目的的实验设计来确定的,而非随机的。 
在一个方面,核酸构建模块可以这样来产生,即化学合成两个单链核酸(也称为单链寡聚物),让它们退火形成双链的核酸构建模块。 
双链核酸构建模块的大小是可变的。这些构建模块的大小可以很小或很大。构建模块的示范性大小的范围是从1个碱基对(不包括任何突出端)至100,000个碱基对(不包括任何突出端)。也可以是其它的大小范围,下限是从1bp至10,000bp(包括其间的任一整数值),上限是从2bp至100,000bp(包括其间的任一整数值)。 
对于本发明,可应用许多种产生双链核酸构建模块的方法;这些方法在本领域中是已知的,很容易被专业技术人员实施。 
根据一个方面,双链构建模块可通过首先产生两个单链核酸,再使它们退火形成双链核酸构建模块来产生。双链核酸构建模块的两条链的除了突出端之外的任何核苷酸可以是互补的;因此除任何突出端之外不含有任何错配。根据另一个 方面,双链核酸构建模块的两条链在除了突出端之外的核苷酸处不是完全互补的。因此,根据这个方面,双链核酸构建模块可用来导入密码子简并。优选地,密码子简并通过应用在此所述的位点饱和诱变而被导入,其中使用了一个或多个N,N,G/T序列盒,或者,可以使用一个或多个N,N,N序列盒。 
本发明的体内重组方法可在特定多核苷酸或序列的未知杂合体或等位基因构成的库上实施。但不一定需要知道所述特定多核苷酸的具体DNA或RNA序列。 
在一组混合的基因内应用重组的方法可用来产生任何有用的蛋白,例如,白介素1、抗体、tPA和生长激素。这种方法可用来产生具有改变的特异性或活性的蛋白。该方法也可用来产生杂合的核酸序列,例如启动子区、内含子、外显子、增强子序列、基因的3’未翻译区或5’未翻译区。因此,这种方法可用来产生具有更高的表达率的基因。这种方法也可用于重复DNA序列(repetitive DNA sequences)的研究中。最后,这种方法可用来突变核酶或适体(aptamers)。 
在一个方面,在此所述的本发明涉及使用重复循环的还原性重配、重组和选择,其使得高度复杂的线性序列,如DNA、RNA或蛋白质可以通过重组进行定向分子进化。 
优化的定向进化系统 
本发明提供了一种非随机的基因修改系统,命名为“优化的定向进化系统”,其可以用来生产具有新的或者改变的性质的多肽,如本发明的木聚糖酶或者抗体。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。 
遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。 
此外,这一方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以(在统计学上)偏向于具有预定数目的遗传交换事件,所以嵌合 分子之间的功能多样性的界线减少。当计算出来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。 
产生嵌合子代多聚核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸。每一个寡聚核苷酸优选地包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡聚核苷酸片段的新的变异体。也可以发现另外的一些信息,如,在USSN 09/332,835;美国专利6,361,974中。 
对应于每一个亲本变异体产生的寡聚核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡聚核苷酸序列。相应的,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多聚核苷酸都以交替的顺序含有来自各个亲本变异体的寡聚核苷酸的可能性很低。如果每一个寡聚核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置中来自同一亲本多聚核苷酸的寡聚核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡聚核苷酸的浓度保持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变异体的寡聚核苷酸连接于嵌合序列内而不产生遗传交换。 
相应的,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡聚核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡聚核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变异体到另一个亲本变异体的序列转换发生。这样的点一般在来自两个亲本的寡聚核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡聚核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。 
此外,这些方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含 有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以(在统计学上)倾向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多聚核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。 
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡聚核苷酸,产生嵌合子代多聚核苷酸序列。每一个寡聚核苷酸优选地包括重叠的独特区域,这样把所述寡聚核苷酸混合,得到具有以正确顺序装配的寡聚核苷酸片段的新的变异体。也可参见USSN 09/332,835。 
确定遗传交换事件 
本发明包括系统和软件,它们以所需的遗传交换的概率密度函数(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该程序输出“片段PDF”,它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。在此说明的过程优选地在MATLABTM中进行(The Mathworks,Natick,Massachusetts),MATLABTM是一种用于技术计算的程序语言和开发环境。 
迭代过程 
在实践本发明时,这些过程可以迭代反复。例如,鉴定出改变的或者新的木聚糖酶表型的核酸,再分离,再修饰,再测试活性。这一过程可以重复直到得到所需的表型。例如,完整的生物化学合成代谢的或者分解代谢的途径可以在细胞中设计,包括,例如木聚糖酶活性。 
类似地,如果确定了特定的寡聚核苷酸对于所有所需的性质(如,新的木聚糖酶表型)没有影响,那么就可以合成包括这段序列在内的更大的亲本寡聚核苷酸,从而将作为变量的这段序列去除。由于将这段序列合并到更大的序列中,可以避免任何遗传交换事件,所以在子代多聚核苷酸中,这一序列不再有任何变异。确定哪些寡聚核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的具有特定性质或者活性的蛋白变异体。 
体内重排 
分子的体内重排在本发明的提供本发明的多肽如抗体、木聚糖酶等的变异体的方法中使用。体内重排利用细胞的天然特性进行多聚体重组。体内的重组提供了实现分子多样性的主要的天然途径,而遗传重组仍然是一种相对复杂的过程,其涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombination chiasma)的代谢步骤;和最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。 
在另一个方面,本发明包括由至少第一多聚核苷酸和第二聚多核苷酸产生杂合的多聚核苷酸的方法。本发明通过将至少第一多聚核苷酸和第二聚多核苷酸导入进合适的宿主细胞中,可用来产生杂合的多聚核苷酸,所述的至少第一多聚核苷酸和第二聚多核苷酸共享具有部分序列同源性的至少一个区域(例如,SEQ IDNOS:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251,253、255、257及其组合)。具有部分序列同源性的区域可促进一些过程,这些过程可引起产生杂合多核苷酸的序列改组。正如在此所用,术语“杂合多聚核苷酸”是由本发明的方法产生的任何核苷酸序列,其含有来自至少两个原初的多聚核苷酸序列的序列。这样的杂合多聚核苷酸可以源于分子间重组事件,分子间重组事件促进了DNA分子间的序列整合。此外,这样的杂合多聚核苷酸可以源自分子内还原性重配过程,分子内还原性重配过程利用重复序列来改变DNA分子中的核苷酸序列。 
体内重配主要集中在“分子间”的过程,它们可以统称为“重组”,在细菌中一般视作“依赖于RecA”的现象。本发明可以利用宿主细胞的重组过程来重新组合和重配序列,或者利用细胞介导还原性过程的能力,通过缺失来降低准重复序列的复杂性。“还原性重配”的过程可以通过“分子内”的RecA依赖性的过程发生。 
因此,在本发明的另一个方面,新型的多聚核苷酸可以通过还原性重配过程产生。本方法包括产生含有连续序列(最初的编码序列)的构建物,将它们插入到合适的载体中,随后将它们引入到合适的宿主细胞中。各个分子本体的重配通过具有同源性区域的构建物中的连续序列之间,或准重复单元之间的组合过程发生。重配过程重组和/或降低了重复序列的复杂性和范围,并且导致产生新的蛋白种类。可以应用不同的处理来提高重配率。这些可以包括用紫外线或者DNA损伤化学剂处理,和/或使用表现出高水平“遗传不稳定性”的宿主细胞系。因此,重配过程可以包括同源重组或者准重复序列的天然性质来引导它们自身的进化。 
重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。在本发明中,“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变得本质上无形,并且得到的构建物的准重复性质在分子水平现在 是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板内容,在模板上可以发生滑移事件。因此,含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。 
当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,当例如,所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失的形成将有利于不连续单元的失去。因此,本发明的方法优选的是序列是处于相同的方向。准重复序列的随机定向将会导致重配效率的损失,而序列的一致定向将会提供最高的效率。然而,虽然具有较少的相同定向的连续序列会降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。 
应用各种方法中的任何一种,可以将序列装配成头对尾的定向,包括以下: 
a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过由RNA制备引物的头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。 
b)可以应用包括独特的限制酶切割位点的引物。这需要多重位点、一组独特的序列、和重复的合成和连接步骤。 
c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。 
重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成,即: 
1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。 
2)通过物理程序对缩短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。 
3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。 
4)应用表达载体以及适当的选择,使用定向选择技术。 
相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列可以在本发明中用作准重复序列。以下的实施例说明了几乎相同的原始编码序列(准重复)的重配,然而,这一过程并不限于这种几乎相同的重复。 
以下的例子表明了本发明的典型方法。描述了来源于三(3)种独特物种的编码核酸序列(准重复)。每一个序列编码的每一种蛋白都具有不同的一套性质。这些序列中的每一个在序列的独特位置处的单个或者几个碱基对上有差别。准重 复序列分别或者一起被扩增,并且被连接到随机装配物中,这样所有可能的排列和组合都可以在连接分子的群体中获得。准重复单元的数目可以通过装配条件控制。准重复单元在构建物中的平均数目被定义为重复指数(RI)。 
一旦构建物形成,可以按照已出版的实验方案通过琼脂糖凝胶根据大小进行分离,也可以不分离,将构建物插入到克隆载体中,并转染至适当的宿主细胞。然后细胞繁殖并且实现“还原性重配”。还原性重配过程的速率可以通过引入DNA损伤来进行刺激,如果需要的话。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导,还是通过“分子间”的机制由重组类似的事件来介导是不重要的。最终的结果是分子被重配,得到所有可能的组合。 
可选择地,本方法包括一个额外的步骤,即对重排的文库成员进行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化一个特定的反应(如,酶的催化结构域)的能力的个别的重排文库成员。 
从这样的文库确定出的多肽可以用于治疗、诊断、研究和相关目的(如,催化剂,用于增加水溶液的同渗容摩的溶质,等等),和/或可以用于进行一轮或者多轮附加的重排和/或选择循环。 
另一方面,可以预见,在重组或重配之前,或者在重组或重配的过程中,通过本发明的方法产生的多聚核苷酸可以用试剂处理或进行加工,这些处理或加工促进突变引入到原始的多聚核苷酸中。引入这样的突变将会增加得到的杂合多聚核苷酸及其编码的多肽的多样性。促进诱变的试剂和过程可以包括,但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(见,van de Poll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的特别优选的方法包括紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)。特别包含的方法是DNA加合物或者来自多聚核苷酸或者多聚核苷酸库的含有DNA加合物的多聚核苷酸,在进一步的处理前,其可以通过包括加热含有所述多聚核苷酸的溶液的过程进行释放或者去除。 
本发明的另一个方面涉及产生具有生物学活性的重组蛋白的方法,其通过根据本发明,在可产生杂合或重配的多核苷酸条件的条件下处理含有编码野生型蛋白的双链模板多核苷酸的样品。 
产生序列变异体 
本发明也提供了制备本发明的核酸(如,木聚糖酶)序列的序列变异体的另外的方法。本发明也提供了应用本发明的核酸和多肽分离木聚糖酶的另外的方法。一方面,本发明提供了本发明的木聚糖酶编码序列(如,基因、cDNA或者信息)的变异体,其可以通过任何方法被改变,包括,例如,随机的方法,或者非随机的方法,或者“定向进化”的方法,如上所述。 
被分离的突变体可以是天然发生的。变异体也可以在体外产生。变异体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变异体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变异体的其它方法。这些方法包括这样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述的特征使这些多肽在工业或者实验室应用中具有更高的价值。在这样的程序中,大量的变异体序列被获得和表征,这些变异体序列与从天然分离物中得到的序列相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离得到的核酸序列编码的多肽的氨基酸变化。 
例如,变异体可以通过易错PCR产生。在易错PCR中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如,Leung,D.W.,等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.F.,PCR Methods Applic.,2:28-33,1992中描述。简要地说,在这一程序中,待突变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适合浓度的dNTPs混合,在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fmol待诱变的核酸进行,每种PCR引物30pmol,反应缓冲液包括50mM KCl、10mM TrisHCl(pH8.3)和0.01%明胶、7mM的MgCl2、0.5mM MnCl2、5units的Taq聚合酶、0.2mM dGTP、0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环,每个循环为94℃1分钟;45℃1分钟;和72℃1分钟。然而,这些参数可以适当地变化。诱变的核酸克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。 
变异体也可以用寡聚核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。寡聚核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中描述。简要地说,在这样的程序中,合成多个具有一个或者多个突变的双链寡聚核苷酸,这些寡聚核苷酸所含有的突变将要被导入被克隆的DNA中,将这些寡聚核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估它们编码的多肽的活性。 
另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的PCR反应,其中,一个反 应的产物用作另外一个反应的引物。装配PCR在例如美国专利5,965,408中有说明。 
另一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA 91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mM MgCl2、50mM KCl、10mM的Tris-HCl,pH 9.0以及0.1%的Triton X-100的溶液中,其浓度为10-30ng/μl,以100∶1的比例在反应混合物中加入2.5Units的Taq聚合酶,用以下的条件进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然而,这些参数可以进行适当的变化。在一些方面,寡聚核苷酸可以包括在该PCR反应中。在其它的一些方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR反应,而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多肽的活性。 
变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO 91/16427中有描述,公开日为1991年10月31日,标题为“Methods for Phenotype Creation from Multiple Gene Populations”。 
变异体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡聚核苷酸“盒子”替代。所述寡聚核苷酸一般含有完全和/或部分随机的天然序列。 
递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815中有描述。 
在一些方面,用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中部分的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如,Delegrave(1993)Biotechnology Res.11:1548-1552中有描述。随机和定点诱变在如,Amold(1993)Current Opinion in Biotechnology 4:450-455中有描述。 
在一些方面,变异体利用重排方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,其描述见美国专利5,965,408,1996年7月9日归档,标题为“Method of DNA Reassembly by Interrupting Synthesis”和美国专利5,939,250,1996年5月22日归档,题目为“Production of Enzymes Having Desired Activities by Mutagenesis”。 
B组氨基酸序列的多肽的变异体可以是B组氨基酸序列的多肽的一个或多个氨基酸残基被保守的或非保守的氨基酸残基(优选保守的氨基酸残基)取代所得到的变异体,这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。 
保守的取代是指在多肽中用另一个具有相似性质的氨基酸取代已知的氨基酸。以下的替代通常都被视作保守的取代:用其它的脂肪族氨基酸替换脂肪族的氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸;用苏氨酸替换丝氨酸,或者用丝氨基替换苏氨酸;用其它的酸性残基替换酸性残基如天冬氨酸和谷氨酸;用其它具有酰胺基的氨基酸替换具有酰胺基团的残基如天冬酰胺和谷氨酰胺;用其它的碱性氨基酸替换碱性氨基酸残基如赖氨酸和精氨酸;用其它的芳香氨基酸取代芳香氨基酸如苯丙氨酸,酪氨酸。 
在其它的变异体中,B组氨基酸序列的多肽的一个或多个氨基酸残基包含有取代基团。 
仍然在其它的变异体中,多肽与别的化合物,如用于增加多肽半衰期的化合物,如,聚乙二醇联接。 
在另外的变异体中,另外的氨基酸融合到多肽上,如前导序列、分泌序列、蛋白原序列或者有利于纯化、富集或者所述多肽稳定的序列。 
在一些方面,片段、衍生物和类似物仍保留有与B组氨基酸序列和与其实质上相同的序列的多肽相同的生物学功能或者活性。在其它方面,片段、衍生物或者类似物包括蛋白原,这样,所述片段、衍生物或者类似物可以通过蛋白原部分的切割而活化,产生有活性的多肽。 
优化密码子,实现宿主细胞中高水平的蛋白表达 
本发明提供了修饰编码木聚糖酶的核酸来改变密码子使用的方法。一方面,本发明提供了修饰编码木聚糖酶的核酸中的密码子来增强或者降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而其表达在宿主细胞中增强的木聚糖酶的核酸、经过这样的修饰的木聚糖酶,和制备经修饰的木聚糖酶的方法。该方法包括确定编码木聚糖酶的核酸中“非优选的”或者“较不优选的”密码子,并且用编码同样氨基酸的“优选的密码子”作为替换密码子替换一个或者多个这样的非优选或者较不优选的密码子,并且在所述核酸中至少一个非优选或者较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基 因的编码序列中被优先使用的密码子,而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。 
用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。典型的宿主细胞包括革兰氏阴性细菌,如大肠杆菌(Escherichia coli)和荧光假单胞菌(Pseudomonas fluorescens);革兰氏阳性细菌,如链霉菌(Streptomyces diversa)、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽胞杆菌(Bacillus subtilis)。示范性的宿主细胞也包括真核生物体,如,各种酵母,如酵母菌属(Saccharomyces sp.),包括酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichia pastoris)和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。 
例如,从细菌细胞中分离出的编码木聚糖酶的核酸的密码子被修饰,以便该核酸在不同于获得木聚糖酶的细菌的细胞,如酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)Protein Expr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry 39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)Protein Expr.Purif20:252-264,描述了大肠杆菌中影响分泌的优化的密码子使用。 
转基因非人类的动物
本发明提供了包含本发明的核酸、多肽(例如木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类的动物。本发明也提供了制造和应用这些转基因非人类动物的方法。 
转基因非人类动物可以是,例如包括本发明的核酸的山羊、兔、绵羊、猪、牛、小鼠和大鼠。这些动物可以用作例如体内模型来研究木聚糖酶活性,或者作为模型来在体内筛选改变木聚糖酶活性的试剂。要在转基因非人类动物中表达的多肽的编码序列可以设计为组成型的,或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人类动物可以应用本领域任何已知的方法设计和产生;参见,如,美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698; 5,639,940;5,573,933;5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以及转基因大鼠、小鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods 231:147-157,描述了在转基因奶牛动物的牛奶中生产重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了转基因山羊的生产。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中,移植注射的卵至假孕的雌鼠中,并且生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因鼠,它的基因组具有编码淀粉样蛋白原(APP)的基因的断裂。 
“基因敲除动物”也可以用于实践本发明的方法。例如,在一方面,本发明的转基因动物或者改进的动物包括“基因敲除动物”,如“基因敲除鼠”,它被工程改造,不会表达某种内源基因,取而代之的是,表达可以表达本发明的木聚糖酶或者包含本发明的木聚糖酶的融合蛋白的基因。 
转基因植物和种子
本发明提供了包含本发明的核酸、多肽(例如木聚糖酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如木聚糖酶)的植物产物,如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。 
本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中,这样宿主的木聚糖酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见,如,Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373;Miao(1995)Plant J 7:359-365。参见下面的转基因植物的讨论。 
本发明的核酸可以将所需的性质赋予基本上任何植物,例如产淀粉的植物,如马铃薯、小麦、水稻、大麦等。本发明的核酸可以用于操作植物的代谢途径,以优化或者改变宿主的木聚糖酶的表达。本发明的木聚糖酶可以在转基因植物的生产中被应用,以产生该植物不能天然产生的化合物。这可以降低生产成本或者产生一种新的产物。 
一方面,生产转基因植物的第一步包括制备在植物细胞中表达的表达构建物。 这些技术在本领域是被熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的启动子是更特异的,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。 
一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,可以增强在植物细胞中基因产物的产生。 
为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要启动子和终止序列。 
一方面,制备转基因植物或者种子包括将本发明的序列以及可选择的标记基因整合到目标表达构建物(如,质粒)中,同时设置启动子和终止序列。这可以包括通过合适的方法将修饰的基因转移至植物中。例如,构建物可以应用如电击转化和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballistic methods),如,DNA微粒轰击(DNA particle bombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature 327:70-73;Talcumi(1997)Genes Genet.Syst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒轰击引入YACs至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以买到BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。 
一方面,原生质体可以被固定,并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。 
核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol.Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genesin plants”,Mol.Biotechnol.5:209-221。 
可选择地,核酸,如表达构建物,可以与合适的T-DNA旁侧区域组合,并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根癌农杆菌介导的转化技术,包括disarming和二元载体的应用,在科学文献中有详细的说明。参见,如,Horsch(1984)Science 233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒力(virulence)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根癌农杆菌可以通过伤口感染植物:当一种植物的根或者茎受伤,它释放某种化学信号,作为对这种信号的响应,根癌农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根癌农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。 
本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA 80:4803;Thykjaer(1997)如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。 
一方面,第三步可以包括能够将整合的靶基因传递至下一代的完整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植物激素的操作,典型地,依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,Protoplasts lsolation and Culture,Handbook of Plant Cell Culture,124-176页,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,21-73页,CRC Press,Boca Raton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.of plant Phys.38:467-486中有总体的说明。为了从转基因组织如未成熟的胚胎获得整个植物,它 们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评价子代。 
在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如,木聚糖酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变的植物)可以增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。 
本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属Poa),饲料草如羊茅属,黑麦草属,温带草,如翦股颖属(Agrostis),和谷类,如,小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草,豆类,如羽扇豆,马铃薯,甜菜,豌豆,蚕豆和大豆,以及十字花科植物(Brassicaceae),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的物种:腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子(Cocos)、咖啡(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。 
在可供选择的实施方式中,本发明的核酸在含有纤维细胞的植物中表达,包括,如,棉、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻。在可供选择的实施方式中,本发明的转基因植物可以是棉属(Gossypium)的成员,包括任何棉种(Gossypium)的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海 岛棉(G.barbadense)和陆地棉(G.hirsutum)。 
本发明也提供用于大量生产本发明的多肽(例如木聚糖酶或抗体)的转基因植物。例如,参见Palingren(1997)Trends Genet.13:348;Chong(1997)Transgenic Res.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。 
应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋白的方法在本领域是被熟知的。 
多肽和肽 
一方面,本发明提供了与本发明的示范性序列有着序列同一性(例如,至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多或完全的(100%)的序列同一性)的分离出的或重组的多肽,所述的本发明的示范性序列例如具有在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ IDNO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ IDNO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ IDNO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172、SEQID NO:174、SEQ ID NO:176、SEQ ID NO:178、SEQ ID NO:180、SEQ ID NO:182、 SEQ ID NO:184、SEQ ID NO:186、SEQ ID NO:188、SEQ ID NO:190、SEQ IDNO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198、SEQ ID NO:200、SEQID NO:202、SEQ ID NO:204、SEQ ID NO:206、SEQ ID NO:208、SEQ ID NO:210、SEQ ID NO:212、SEQ ID NO:214、SEQ ID NO:216、SEQ ID NO:218、SEQ IDNO:220、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQID NO:230、SEQ ID NO:232、SEQ ID NO:234、SEQ ID NO:236、SEQ ID NO:238、SEQ ID NO:240、SEQ ID NO:242、SEQ ID NO:244、SEQ ID NO:246、SEQ IDNO:248、SEQ ID NO:250、SEQ ID NO:252、SEQ ID NO:254、SEQ ID NO:256、SEQID NO:258、SEQ ID NO:260、SEQ ID NO:262、SEQ ID NO:264、SEQ ID NO:266、SEQ ID NO:268、SEQ ID NO:270、SEQ ID NO:272、SEQ ID NO:274、SEQ IDNO:276、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:282、SEQ ID NO:284、SEQID NO:286、SEQ ID NO:288、SEQ ID NO:290、SEQ ID NO:292、SEQ ID NO:294、SEQ ID NO:296、SEQ ID NO:298、SEQ ID NO:300、SEQ ID NO:302、SEQ IDNO:304、SEQ ID NO:306、SEQ ID NO:308、SEQ ID NO:310、SEQ ID NO:312、SEQID NO:314、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320、SEQ ID NO:322、SEQ ID NO:324、SEQ ID NO:326、SEQ ID NO:328、SEQ ID NO:330、SEQ IDNO:332、SEQ ID NO:334、SEQ ID NO:336、SEQ ID NO:338、SEQ ID NO:340、SEQID NO:342、SEQ ID NO:344、SEQ ID NO:346、SEQ ID NO:348、SEQ ID NO:350、SEQ ID NO:352、SEQ ID NO:354、SEQ ID NO:356、SEQ ID NO:358、SEQ IDNO:360、SEQ ID NO:362、SEQ ID NO:364、SEQ ID NO:366、SEQ ID NO:368、SEQID NO:370、SEQ ID NO:372、SEQ ID NO:374、SEQ ID NO:376、SEQ ID NO:378或SEQ ID NO:380中所示的序列的蛋白。在一个方面,所述多肽具有木聚糖酶活性,例如可水解多糖内的糖苷键,例如木聚糖内的糖苷键。在一个方面,多肽具有木聚糖酶活性,包括可催化内部β-1,4-木糖苷键的水解。在一个方面,木聚糖酶活性包括内-1,4-β-木聚糖酶活性。在一个方面,木聚糖酶活性包括水解木聚糖产生更小分子量的木糖和木糖寡聚体。在一个方面,木聚糖包括阿拉伯糖基木聚糖,如水溶性阿拉伯糖基木聚糖。 
本发明的多肽包括活性或非活性形式的木聚糖酶。例如,本发明的多肽包括在“成熟”或前体序列(prepro sequences)加工之前的蛋白原(proproteins),所述的加工例如通过蛋白原加工酶,如可以产生“活性”成熟蛋白的蛋白原转换酶进行的加工。本发明的多肽包括为其它原因而灭活的木聚糖酶,例如未通过翻译后加工事件进行“活化”的木聚糖酶,所述的翻译后加工事件例如内肽酶或外肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化、二聚化事件和类似作用。本发明的多肽包括所有的活性形式,包括活性子序列,例如木聚糖酶的催化结构域或活性位点。 
鉴定“前体(prepro)”结构域序列和信号序列的方法在本领域中是为人所熟 知的,见,例如Van de Yen(1993)Crit.Rev.Oncog.4(2):115-136。例如,为了鉴定前体序列,蛋白从细胞外空间纯化出来,测定N-末端蛋白序列,并与未加工的形式进行比较。 
本发明提供了具有或没有信号序列和/或前体序列的多肽。本发明提供了具有异源的信号序列和/或前体序列的多肽。所述前体序列(包括用作异源前体结构域的本发明序列)可位于蛋白的氨基末端或羧基末端。本发明也包括构成本发明的序列的分离出的或重组的信号序列、前体序列和催化结构域(例如,“活性位点”)。 
一定百分数的同一性可以是在所述多肽的全长范围,或者,所述同一性可以是在至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或者更多残基的范围。本发明的多肽也可以比示范性多肽的全长短。在可供选择的方面,本发明提供大小范围在大约5至多肽例如一种酶,如木聚糖酶的全长之间的多肽(肽,片段),典型的大小为大约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700或者更多的残基,如本发明的示范性的木聚糖酶的连续残基。 
本发明的肽(例如,本发明的示范性多肽的子序列)可以用作,例如标记探针,抗原、耐受原、模体、木聚糖酶活性位点(例如,“催化结构域”)、信号序列和/或前体结构域。 
本发明的多肽和肽可以是从天然的来源中分离出的,可以是合成的,或者是由重组产生的多肽。肽和蛋白可以在体外或者在体内重组表达。本发明的肽和多肽可以应用本领域任何已知的方法来制备和分离,本发明的多肽和肽也可以部分或者全部由本领域已知的化学方法合成。参见如,Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K.,Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽的合成可以应用各种固相技术来进行(参见,如,Roberge(1995)Science 269:202;Metrifield (1997)Methods Enzymol.289:3-13),还可以实现自动合成,如,按照制造商提供的说明书,应用ABI 431A肽合成仪(Perkin Elmer)进行合成。 
本发明的肽和多肽也可以是糖基化的,所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖基化模体,所述糖基化模体可以是天然序列,或者是作为肽段而被加入的,或者是在核酸编码序列中加入的。糖基化作用可以是O-连接的或者是N-连接的。 
本发明的肽和多肽,如以上所定义的,包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成,或者是由部分天然的肽氨基酸和 部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守取代,只要这样的取代本质上不改变该模拟物的结构和/或活性。对于作为保守性变异体的本发明的多肽,常规实验将确定一种模拟物是否在本发明的范围内,即,其结构和/或功能并没有实质上的改变。因此,一方面,如果一种模拟化合物具有木聚糖酶活性,那么它在本发明的范围内。 
本发明的多肽模拟化合物可以含有非天然结构组分的任何组合。在可供选择的方面,本发明的模拟化合物包括以下三种结构基团中的一种或所有:a)不是天然酰胺键(“肽键”)连接的残基连接基团;b)取代天然发生的氨基酸残基的非天然残基;或者c)诱导二级结构拟态(mimicry)的残基,即是,诱导或者稳定二级结构,如β转角、γ转角、β折叠、α螺旋构象,等等。例如,当一个多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时,本发明的该多肽可以作为模拟物来表征。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接,如,通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括,如,酮基亚甲基(如,-C(=O)-CH2-代替-C(=O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、retroamide、硫代酰胺或者酯(参见如,Spatola(1983)在Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,第7卷,267-357页,“Peptide Backbone Modifications”Marcell Dekker,NY)。 
本发明的多肽作为模拟物时,其特征也可以是含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基。在科学和专利文献中描述了非天然的残基;作为天然氨基酸残基的模拟物的一些典型的非天然化合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下的取代来产生,如,D-或者L-萘基丙氨酸;D-或者L-苯基甘氨基,D-或L-2thieneyl丙氨酸;D-或者L-1,-2,3-或者4-芘基丙氨酸;D-或者L-3thieneyl丙氨酸;D-或者L-(2-吡啶基)-丙氨酸;D-或者L-(3-吡啶基)-丙氨酸;D-或者L-(2-吡嗪基)-丙氨酸,D-或者L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或者L-p-二苯基苯基丙氨酸;D-或者L-p-甲氧基-二苯基苯基丙氨酸;D-或者L-2-吲哚(烷基)丙氨酸;和,D-或者L-烷基丙氨酸,其中的烷基可以是取代的或者非取代的甲基、乙基、丙基、己基、丁基,戊基、异丙基、异丁基、sec-isotyl、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括,如噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。 
酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮 -4,4-二甲 基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methylpicolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的模拟物。 
本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此,任何天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。 
本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰 化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification of Proteins,B.C.Johnson,Ed.,Academic Press,New York,11-12页(1983)。 
固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的FMOC肽合成系统是可利用的。例如,应用Applied Biosystems,Inc.的Model 431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。 
本发明包括具有或不具有信号的本发明的木聚糖酶。含有本发明的信号序列的多肽可以是本发明的木聚糖酶或另一种木聚糖酶或另一种酶或其它的多肽。 
本发明包括固定化的木聚糖酶、抗木聚糖酶抗体及其片段。本发明提供了抑制木聚糖酶活性的方法,例如使用显性负突变体或本发明的抗木聚糖酶抗体。本发明包括杂合物,例如融合蛋白、杂二聚体等,其中含有本发明的木聚糖酶。 
本发明的多肽可以在各种条件下具有木聚糖酶活性,例如在极端pH和/或温度、氧化剂和类似的条件下。本发明提供了产生可供选择的各种木聚糖酶制备物的方法,它们例如对于温度、氧化剂和变化的清洗条件具有不同的催化效率和稳定性。在一个方面,木聚糖酶变异体可使用定点诱变和/或随机诱变的技术来产生。在一个方面,定向进化可用来产生极大量的木聚糖酶变异体,它们具有各种特异 性和稳定性。 
本发明的蛋白也可用作鉴定木聚糖酶调节物——例如木聚糖酶活性的激活物或抑制物——的研究试剂。简言之,将受测样品(化合物、肉汤、提取物等)加入至木聚糖酶分析中以确定其抑制底物裂解的能力。以这种方式鉴定的抑制物可用于工业和研究中以降低或防止不需要的蛋白水解。对于木聚糖酶,抑制物可被组合在一起以增加活性谱。 
本发明的酶也可用作消化蛋白质的研究试剂或用在蛋白测序中。例如,为了使用例如自动测序仪进行测序,可以使用木聚糖酶将多肽破碎成更小的片段。 
本发明也提供了应用本发明的核酸、多肽和抗体来发现新的木聚糖酶的方法。一方面,筛选噬粒文库,基于表达来发现木聚糖酶。另一方面,筛选λ噬菌体文库,基于表达来发现木聚糖酶。通过筛选噬菌体或噬粒文库,可以检测到毒性克隆;更方便地利用底物;减少工程改造宿主的需要,绕过由文库中大的切除带来任何偏差的可能性;以及获得在低克隆密度下更快的生长速率。噬菌体或噬粒文库的筛选可以是在液相中或者固相中。一方面,本发明提供了在液相中的筛选。与固相筛选相比,这给予了分析条件上的更大灵活性;额外底物的可行性;对于弱的克隆的更高灵敏性;和更容易实现的自动化。 
本发明提供了使用本发明的蛋白和核酸以及机器人自动化来进行筛选的方法,机器人自动化使得在例如一天的短时间内能进行数千个生物催化反应和筛选分析,并且保证了高水平的精确度和可重复性(参见下面关于阵列的讨论)。结果,衍生化合物的文库可以在数周内产生。对于包括小分子在内的分子的修饰的进一步教导,参见PCT/US94/09174。 
本发明的另一个方面是分离出的或纯化的多肽,其含有A组核酸序列和与其实质上相同的序列中的一个序列编码的序列,或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段。如上所述,这样的多肽的获得可通过将编码多肽的核酸插入进载体中,这样,所述编码序列可有效连接于能够在合适的宿主细胞中驱动被编码的多肽表达的序列。例如,表达载体可含有启动子、启动翻译的核糖体结合位点和转录终止子。载体也包括用于扩增表达的合适序列。 
本发明的另一个方面是多肽或其片段,其与B组氨基酸序列和与其实质上相同的序列中的一个多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有至少大约50%、至少大约55%、至少大约60%、至少大约65%、至少大约70%、至少大约75%、至少大约80%、至少大约85%、至少大约90%、至少大约95%或超过大约95%的同源性。同源性可以使用上述的任何程序来确定,它们可联配被比较的多肽或片段,并确定它们之间的氨基酸同一性或相似性程度。要理解的是,氨基酸“同源性”包括保守的氨基酸取代,如上述的那些取代。 
与B组氨基酸序列和与其实质上相同的序列中的一种多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段具有同源性的多肽或片段可使用上述的技术通过分离其编码核酸而获得。 
可选择的,通过生物化学富集或纯化步骤获得同源的多肽或片段。通过木聚糖水解酶消化、凝胶电泳和/或微测序可以确定潜在同源的多肽或片段的序列。预期的同源多肽或片段的序列可使用上述的任何程序,与B组氨基酸序列和与其实质上相同的序列中的一个多肽或含有其至少大约5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段相比较。 
本发明的另一个方面是用于鉴定B组氨基酸序列和与其实质上相同的序列的片段或变异体的分析方法,所述片段或变异体保留了B组氨基酸序列和与其实质上相同的序列的多肽的酶功能。例如所述多肽的片断或变异体可用来催化生物化学反应,这样的反应表明所述片段或变异体保留了B组氨基酸序列中的多肽的酶活性。 
用于确定变异体或片段是否保留了B组氨基酸序列和与其实质上相同的序列的多肽的酶活性的分析方法包括步骤:将多肽片段或变异体与底物分子在允许该多肽片段或变异体发挥作用的条件下接触,并检测底物水平的降低或该多肽和底物之间反应的特异反应产物水平的增加。 
B组氨基酸序列和与其实质上相同的序列的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段可用于大量的应用中。例如,所述多肽或其片段可用来催化生物化学反应。根据本发明的一个方面,提供了一个过程,其中应用具有B组氨基酸序列和与其实质上相同的序列的多肽或编码这样的多肽的多核苷酸来水解糖苷键。在这样的过程中,含有糖苷键的底物(例如,淀粉)与具有B组氨基酸序列或与其实质上相同的序列的多肽在可促进糖苷键水解的条件下接触。 
本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基团的许多起始化合物反应。 
生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。 
酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物催化反 应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。一方面,酶反应在功能基团上的高度特异性允许“追踪”特定的酶促反应,由所述酶促反应制备出了生物催化产生的文库。 
许多程序化的步骤可使用自动化机器人来实施,这使得每天可执行数千个生物催化反应和筛选分析,并保证高水平的准确性和可重复性。结果,在大概几周内便产生了衍生化合物的文库,而采用现今的化学方法则需要几年的时间。 
在一个特定的方面,本发明提供了修饰小分子的方法,包括将在此所述的由多核苷酸编码的多肽或其酶活性片段与小分子接触,产生修饰的小分子。检测被修饰的小分子的文库以确定显示出所需活性的修饰小分子是否存在于文库内。产生具有所需活性的修饰小分子的特异性生物催化反应的鉴定可通过系统性地去除用来产生一部分文库的每个生物催化反应,然后检测在这一部分文库中产生的小分子是否存在具有所需活性的修饰小分子。产生具有所需活性的修饰小分子的特异生物催化反应可选择性地被重复。生物催化反应可用一组生物催化剂来进行,它们可与在小分子的结构中发现的各种不同结构部分反应,每个生物催化剂对一个结构部分或一组相关的结构部分是特异的;每个生物催化剂可与含有各种不同的结构部分的许多不同的小分子反应。 
木聚糖酶信号序列、前体和催化结构域 
本发明提供了木聚糖酶信号序列(例如,信号肽(SP))、前体结构域(prepro domains)和催化结构域(CD)。本发明的SP、前体结构域和/或CD可以是分离出的或重组的肽,或是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CD)、前体结构域和信号序列(SP,例如,具有由本发明多肽的氨基末端残基组成的序列/含有本发明多肽的氨基末端残基的序列的肽)的核酸。在一个方面,本发明提供了信号序列,其包括的肽含有本发明多肽的残基1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至29、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至39、1至40、1至41、1至42、1至43、1至44中所示的序列或由其组成。 
在一个方面,本发明提供了信号序列,其包括的肽含有下面表4中所示的序列/由下面表4中所示的序列组成。例如,就表4而言,本发明提供了一种信号序列,其含有SEQ ID NO:102(由SEQ ID NO:101编码)的残基1至23/由SEQ ID NO:102的残基1至23组成,本发明提供了一种信号序列,其含有SEQ ID NO:104(由SEQ IDNO:103编码)的残基1至41/由SEQ ID NO:104的残基1至41组成,等等。 
表4:本发明的示范性信号序列 
SEQ ID NO:信号序列 
           (氨基酸位置) 
101,102 1-23 
103,104 1-41 
105,106 1-22 
109,110 1-26 
11, 12  1-28 
113,114 1-28 
119,120 1-33 
121,122 1-20 
123,124 1-20 
131,132 1-26 
135,136 1-25 
139,140 1-24 
141,142 1-25 
143,144 1-32 
147,148 1-28 
149,150 1-18 
15, 16  1-20 
151,152 1-21 
153,154 1-16 
155,156 1-21 
157,158  1-29 
159,160  1-23 
161,162  1-32 
163,164  1-26 
165,166  1-23 
167,168  1-36 
169,170  1-24 
17,18    1-31 
171,172  1-29 
173,174  1-22 
175,176  1-27 
177,178  1-26 
179,180  1-19 
181,182  1-25 
183,181  1-32 
185,186  1-27 
187,188  1-28 
19,20    1-29 
191,192  1-27 
193,194  1-21 
195,196  1-23 
197,198  1-28 
199,200  1-30 
203,204  1-30 
205,206  1-29 
207,208  1-27 
209,210  1-25 
21,22    1-28 
211,212  1-29 
215,216  1-31 
217,218  1-29 
219,220  1-23 
221,222  1-24 
223,224  1-28 
225,226  1-25 
227,228  1-39 
229,230  1-28 
23,24    1-29 
231,232  1-41 
233,234  1-26 
235,236  1-28 
237,238  1-32 
239,240  1-30 
241,242  1-28 
243,244  1-33 
245,246  1-32 
249,250  1-33 
253,254  1-24 
255,256  1-51 
259,260  1-24 
261,262  1-26 
263,264  1-29 
267,268  1-30 
27,28    1-27 
271,272  1-22 
273,274  1-74 
277,278  1-19 
279,280  1-22 
283,284  1-28 
287,288  1-23 
289,290  1-22 
295,296  1-26 
299,300  1-24 
301,302  1-28 
303,304  1-74 
305,306  1-32 
309,310  1-20 
311,312  1-33 
313,314  1-22 
315,316  1-28 
319,320  1-27 
325,326  1-27 
327,328  1-29 
329,330  1-35 
33,34    1-23 
331,332  1-28 
333,334  1-30 
335,336  1-50 
339,340  1-23 
341,342  1-45 
347,348  1-20 
349,350  1-20 
351,352  1-73 
353,354  1-18 
355,356  1-21 
357,358  1-25 
359,360  1-31 
361,362  1-26 
365,366  1-65 
367,368  1-23 
369,370  1-27 
39,40    1-24 
41,42    1-37 
45,46    1-25 
47,48    1-26 
5,6      1-47 
51,52    1-30 
53,54    1-37 
55,56    1-24 
57,58    1-22 
59,60    1-21 
63,64    1-20 
65,66    1-22 
67,68    1-28 
69,70  1-25 
7,8    1-57 
73,74  1-21 
75,76  1-22 
77,78  1-27 
79,80  1-36 
83,84  1-30 
87,88  1-29 
89,90  1-40 
9,10   1-36 
95,96  1-24 
99,100 1-33 
本发明的木聚糖酶信号序列(SP)和/或前体序列可以是分离出的肽,或与另一种木聚糖酶或非木聚糖酶多肽连接的序列,例如形成一个融合(嵌合)蛋白。在一个方面,本发明提供了含有本发明的木聚糖酶信号序列的多肽。在一个方面,含有本发明的木聚糖酶信号序列SP和/或前体序列的多肽包含与本发明的木聚糖酶异源的序列(例如,含有本发明的SP和/或前体序列和来自另一种木聚糖酶或非木聚糖酶蛋白的序列的融合蛋白)。在一个方面,本发明提供了具有异源的SP和/或前体序列的本发明的木聚糖酶,例如具有酵母信号序列的序列。本发明的木聚糖酶可以含有存在于载体例如pPIC系列载体(Invitrogen,Carlsbad,CA)中的异源SP和/或前体序列。 
在一个方面,本发明的SP和/或前体序列在鉴定出新的木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路(protein targeting pathways)。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示着它们将转位至内质网腔内。在本组中有超过100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如,在一个方面,新的木聚糖酶信号肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽,又可识别其裂解位点的组合神经网络。(Nielsen等人,“Indentification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites”Protein Engineering,卷10,1,1-6页(1997))。 
应该理解的是,在一些方面,本发明的木聚糖酶可以没有SP和/或前体序列,或“结构域”。在一个方面,本发明提供了缺少所有或部分的SP和/或前体结构域的本发明的木聚糖酶。在一个方面,本发明提供了编码来自一种木聚糖酶的信号序列(SP)和/或前体序列的核酸序列,其有效连接于一种不同的木聚糖酶的核酸序列,或者,可选择地,来自非木聚糖酶蛋白的信号序列(SP)和/或前体结构域 是被需要的。 
本发明也提供了分离出的或重组的多肽,其含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)和异源序列。所述异源序列是与SP、前体结构域和/或CD(例如,与木聚糖酶)天然不相关的序列。与SP、前体结构域和/或CD天然不相关的序列可以在SP、前体结构域和/或CD的氨基末端、羧基末端,和/或SP和/或CD的两个末端上。在一个方面,本发明提供了分离出的或重组的多肽,其包括(或构成于)含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)的多肽,另外的条件是它同与其天然相关的任何序列(例如,木聚糖酶序列)是不相关的。同样,在一个方面,本发明提供了编码这些多肽的分离出的或重组的核酸。因此,在一个方面,本发明的分离出的或重组的核酸包括本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)的编码序列和异源序列(即,与信号序列(SP)、前体结构域和/或催化结构域(CD)天然不相关的序列)。异源序列可在SP、前体结构域和/或CD编码序列的3’末端、5’末端和/或两个末端上。 
杂合(嵌合)木聚糖酶和肽文库
一方面,本发明提供了包含本发明的序列的杂合木聚糖酶和融合蛋白,包括肽库。本发明的肽库可以用于分离目标的肽调节物(如,激活物或者抑制物),如木聚糖酶底物、受体、酶。本发明的肽库可以用于确定目标的形式上的结合配偶,如,配体,例如,细胞因子,激素以及类似物。一方面,本发明提供了嵌合蛋白,其含有本发明的信号序列(SP)、前体结构域和/或催化结构域(CD)或其组合以及异源序列(如上)。 
一方面,本发明的融合蛋白(如,肽部分)是构象稳定的(相对于线形肽),对靶标具有更高的结合亲和性。本发明提供了本发明的木聚糖酶与其它肽的融合,所述其它肽包括已知的肽和随机的肽。它们可以以这样一种方式融合,使得所述木聚糖酶的结构没有明显地被扰乱,并且该肽在代谢上或者结构构象上是稳定的。这样便允许获得肽库,该肽库在细胞内的存在及其数量都是容易监测的。 
本发明的氨基酸序列变异体可以通过该变异的注定的性质来表征,也就是将它们与天然发生的形式区分开的特征,如,木聚糖酶序列的等位基因的或者种间的变异。一方面,本发明的变异体表现出与天然发生的类似物相同性质的生物活性。可选择地,可以选择具有改变的特征的变异体。一方面,尽管引入氨基酸序列变化的区域或者位点是预先决定的,但突变本身并不需要预先决定。例如,为了优化在一个给定位点出现的突变,可以在目标密码子或者区域进行随机诱变,并筛选被表达的木聚糖酶变异体,以寻找所需活性的优化组合。已知在具有已知序列的DNA的预先决定的位点产生取代突变的技术,正如在此说明的,例如,M13引物诱变和PCR诱变。突变体的筛选可以通过应用例如木聚糖水解分析来进行。在可供选择的方面,氨基酸取代物可以是单个残基;插入可以是大约1到20个氨基酸 的水平,尽管可以插入相当大的片段。缺失的范围可以是大约1到大约20、30、40、50、60、70个残基或者更多。为了得到具有优化性质的最终衍生物,替代、缺失、插入或者任何它们的组合可以被应用。一般地,这些变化是在几个氨基酸上进行,以最小化分子的改变。然而,在某些情况下,可以容忍更大的改变。 
本发明提供了木聚糖酶,其中多肽骨架的结构、二级结构或三级结构,例如,α螺旋或β折叠结构,已被修饰。一方面,电荷或疏水性已被修饰。一方面,侧链已被修饰。通过选择较不保守的取代来产生功能或免疫性的本质变化。例如,可以进行这样的取代,它们将更加显著地影响:发生变化的区域的多肽骨架的结构,例如α螺旋或β折叠结构;分子的电荷或疏水位点,其可以是活性位点;或者侧链。本发明提供在本发明的多肽中的取代,其中(a)亲水残基,例如丝氨酰或苏氨酰,被疏水残基例如亮氨酰、异亮氨酰、苯基丙氨酰、缬氨酰或丙氨酰取代;或者相反;(b)半胱氨酸或脯氨酸被任何别的残基取代;或者相反;(c)具有正电性侧链的残基,例如赖氨酰、精氨酰或组氨酰被带负电的残基例如谷氨酰或天冬氨酰取代;或者相反;或者(d)具有大体积侧链的基团,例如苯丙氨酸,被不具侧链的氨基酸例如甘氨酸取代;或者相反。所述变异体可以表现出相同性质的生物学活性(即是木聚糖酶活性),尽管变异体可经选择来按需改变木聚糖酶的特征。 
一方面,本发明的木聚糖酶包括抗原结合部位(epitopes)或者纯化标记、信号序列或者其它的融合序列,等。在一方面,本发明的木聚糖酶可以与随机的多肽融合,形成融合多肽。“融合”或者“有效连接(operably linked)”在此是指随机肽和木聚糖酶连接在一起,以这样的方式来最小化对木聚糖酶结构稳定性的破坏,例如,其仍保持木聚糖酶的活性。所述的融合多肽(或者编码该融合多肽的融合多聚核苷酸)还可以包含进一步的组分,包括在多环(multiple loops)处的多个肽段。 
一方面,肽和编码它们的核酸或者是完全随机化的,或者是在随机化中有偏向,例如,在核苷酸/残基的普遍频率或者每个位置处的频率方面。“随机化”是指每一个核酸或者肽分别由本质上随机的核苷酸和氨基酸组成。一方面,产生所述肽的所述核酸可以通过化学合成,并且可以在任何位置整合进任何核苷酸。因此,当所述核酸被表达形成肽时,任何氨基酸残基可以整合进任何位置。可以设计合成过程来产生随机化的核酸,从而允许在所述核酸的长度范围内形成所有的或者大多数的可能组合,由此形成随机核酸文库。该文库可以提供足量的结构多样的随机化表达产物群体,可以获得概率上充分的细胞响应范围,从而可以提供一种或者多种表现出所需响应的细胞。因此,本发明提供了一个足够大的相互作用文库,以便其成员中的至少一个会具有使其对于一些分子、蛋白或者其他因子具有亲和性的结构。 
木聚糖酶是多结构域的酶,可选择地,其由信号肽、糖类结合模块(module)、木聚糖酶催化结构域、连接子(linker)和/或另一个催化结构域组成。 
本发明提供了产生可以编码生物学活性杂合多肽(例如,杂合木聚糖酶)的嵌合多聚核苷酸的方法。在一个方面,原始的多核苷酸编码生物学活性的多肽。本发明的方法通过利用细胞内过程产生了新的杂合多肽,所述的细胞内过程可整合原始的多核苷酸序列,这样得到的杂合多核苷酸编码证明具有源自原始生物学活性多肽的活性的多肽。例如,原始的多核苷酸可以编码来自不同微生物的特定酶。由来自一个生物体或变异体的第一多核苷酸编码的酶可以,例如,在特殊的环境条件下,例如,高盐,有效地发挥功能。来自不同生物体或变异体的第二多核苷酸编码的酶可在不同的环境条件下,如超高温,有效地发挥功能。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸编码的酶显示了原始多核苷酸编码的两种酶的特性。因此,杂合多核苷酸编码的酶可在第一和第二多核苷酸编码的酶所共有的环境条件下,例如高盐和极端温度下,有效地发挥功能。 
本发明的多核苷酸编码的酶包括但不限于,水解酶,如木聚糖酶。糖苷酶水解酶在1991年首先被分类为各种家族,见,例如Henrissat(1991)Biochem.J.280:309-316。从此,该分类已经不断被更新,见,例如Henrissat(1993)Biochem.J.293:781-788;Henrissat(1996)Biochem.J.316:695-696;Henrissat(2000)Plant Physiology 124:1515-1519。有87个被鉴定出的糖苷酶水解酶家族。在一个方面,本发明的木聚糖酶可以被归类为家族8、10、11、26和30。在一个方面,本发明也提供了编码木聚糖酶的核酸,其具有共同的新颖性,因为它们来自共同的家族,例如家族5、6、8、10、11、26或30,如下面表5所示。 
表5
SEQ ID     家族 
9,10      8 
1,2       8 
5,6       8 
7,8       8 
99,100    10 
11,12     10 
127,128   10 
27,28     10 
97,98     10 
45,46     10 
141,142   10 
107,108   10 
129,130   10 
93,94     10 
63,64     10 
25,26     10 
49,50     10 
67,68     10 
85,86     10 
29,30     10 
51,52     10 
35,36     10 
147,148   10 
119,120   10 
123,124   10 
249,250   10 
149,150   10 
83,84     10 
43,44     10 
133,134   10 
113,114   10 
105,106   10 
75,76     10 
111,112   10 
117,118   10 
115,116   10 
125,126   10 
137,138   10 
135,136   10 
69,70     10 
89,90     10 
31,32     10 
13,14     10 
65,66     10 
57,58     10 
77,78     10 
73,74     10 
109,110   10 
59,60     10 
71,72     10 
139,140   10 
55,56     10 
15,16     10 
131,132    10 
95,96      10 
101,102    10 
39,40      10 
143,144    10 
103,104    10 
17,18      10 
53,54      10 
21,22      10 
151,152    10 
23,24      10 
121,122    10 
41,42      10 
47,48      10 
247,248    10 
33,34      10 
19,20      10 
87,88      10 
81,82      10 
91,92      10 
61,62      10 
37,38      10 
79,80      10 
231,232    11 
157,158    11 
189,190    11 
167,168    11 
207,208    11 
251,252    11 
213,214    11 
177,178    11 
187,188    11 
205,206    11 
211,212    11 
197,198    11 
209,210    11 
185,186    11 
229,230    11 
223,224    11 
179,180    11 
193,194    11 
173,174    11 
217,218    11 
153,154    11 
219,220    11 
183,184    11 
253,254    11 
199,200    11 
255,256    11 
155,156    11 
169,170    11 
195,196    11 
215,216    11 
191,192    11 
175,176    11 
161,162    11 
221,222    11 
225,226    11 
163,164    11 
159,160    11 
233,234    11 
171,172    11 
203,204    11 
181,182    11 
227,228    11 
165,166    11 
257,258    26 
237,238    30 
241,242    30 
239,240    30 
245,246    30 
235,236    30 
313,314    30 
345,346    10 
321,322    10 
323,324    10 
315,316    10 
201,202    10 
265,266    10 
145,146    10 
287,288    10 
293,294    10 
351,352    10 
311,312    10 
279,280    10 
289,290    10 
283,284    10 
373,374    10 
337,338    10 
371,372    10 
291,292    10 
3,4        10 
307,308    10 
343,344    10 
349,350    10 
329,330    10 
355,356    10 
339,340    10 
295,296    10 
333,334    10 
281,282    10 
361,362    10 
347,348    10 
319,320    10 
357,358    10 
365,366    10 
273,274    10 
277,278    10 
271,272    10 
285,286    10 
259,260    10 
325,326    10 
331,332    10 
359,360    10 
303,304    10 
363,364    10 
305,306    10 
341,342    10 
375,376    11 
377,378    11 
379,380    11 
301,302    11 
309,310    11 
263,264    11 
269,270    11 
353,354    11 
299,300    11 
367,368    11 
261,262    11 
369,370    11 
267,268    11 
317,318    11 
297,298    11 
327,328    5 
275,276    6 
由本发明的方法得到的杂合多肽可显示出在原始酶中不具有的特殊酶活性。例如,在编码水解酶活性的多核苷酸重组和/或进行还原性重配后,从得到的由杂合多核苷酸编码的杂合多肽中可筛选出由各个原始酶获得的特殊水解酶活性,即在水解酶作用的键类型和水解酶发挥作用的温度方面被特殊化。因此,例如,水解酶被筛选以确定那些可区分杂合水解酶和原始水解酶的化学功能性,如(a)酰胺(肽键),即木聚糖酶;(b)酯键,即酯酶和脂酶;(c)乙缩醛;即糖苷酶,和例如杂合多肽发挥作用的温度、pH或盐浓度。 
原始多聚核苷酸的来源可以是分离自个体生物体(“分离物”)、已经生长在成分确定的培养基中的生物体收集物(“富集培养物”),或者未经培养的生物体(“来自环境的样品”)。应用不依赖于培养物的方法从来自环境的样品获得编码新的生物活性的多聚核苷酸是最优选的,因为这样便可接触到具有生物多样性的原始来源。 
“环境文库”可以从环境样品中获得,其可以代表天然发生的生物体的基因组集合,这些“环境文库”可以用克隆载体完成,所述克隆载体可以在适合的原 核宿主中扩增繁殖。因为被克隆的DNA起初是直接从环境样品中提取的,所以所述文库并不限于可以在纯培养物中生长的小部分原核生物。另外,存在于这些样品中的来自环境的DNA的标准化使其可以更加公正地代表存在于原始样品的物种的DNA。这可以大大增加从所述样品的次要组成中发现令人感兴趣的基因的效率,所述次要组成与优势种相比,其所占的量可能小几个数量级。 
例如,从一个或者多个未经培养的微生物中获得的基因文库被筛选以发现感兴趣的活性。编码感兴趣的生物活性分子的潜在途径首先在原核细胞中以基因表达文库的形式捕获。编码令人感兴趣的活性的多聚核苷酸从这样的文库中分离出来并导入到宿主细胞中。该宿主细胞在促进重组和/或还原性重配的条件下生长,产生潜在的具有新的或者增强的活性的生物分子。 
另外,可进行亚克隆以进一步分离感兴趣的序列。在亚克隆中,DNA的一部分被扩增、消化——通常是通过限制性酶——以剪切所需的序列,所需的序列被连接进接受载体中,并被扩增。在亚克隆的每个步骤中,该部分被检测感兴趣的活性,以保证编码结构蛋白的DNA不被排除。插入物可在亚克隆的任何步骤中被纯化,例如在连接入载体之前通过凝胶电泳,或在含有接受载体的细胞和不含有接受载体的细胞被置于选择性培养基中时,所述培养基含有例如一种抗生素,其可杀死不含有接受载体的细胞。将cDNA插入物亚克隆进载体中的具体方法在本领域中是为人所熟知的(Sambrook等人,Molecular Cloning:A Laboratory Mannual,第二版,Cold Spring Harbor Laboratory Press(1989))。在另一个方面,本发明的酶是亚克隆。这种亚克隆与亲代克隆的差别在于,例如,长度、突变、标志物(tag)或标记(label)。 
在一个方面,本发明的信号序列在鉴定出新的木聚糖酶多肽之后被鉴定出来。蛋白被分选和转运至其正确的细胞位置的通路通常被称为蛋白靶向通路。在所有这些靶向系统中最重要的元件之一是新合成的多肽的氨基末端上的短的氨基酸序列,称为信号序列。这种信号序列可指引蛋白至其在细胞中的适合位置,并在转运过程中或在蛋白到达其最终目的地时被去除。大多数的溶酶体蛋白、膜蛋白或分泌蛋白都具有氨基末端信号序列,这些信号序列标示着它们将转位至内质网腔内。在本组中有超过100个蛋白信号序列被确定。信号序列的长度可以从13至36个氨基酸残基。识别信号序列的各种方法对于本领域技术人员是已知的。例如,在一个方面,新的木聚糖酶信号肽可通过称为SignalP的方法来鉴定。SignalP应用了既可识别信号肽,又可识别其裂解位点的组合神经网络。(Nielsen等人,“Indentification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites”Protein Engineering,卷10,1,1-6页(1997))。应该理解的是,本发明的一些木聚糖酶可以含有或不含有信号序列。可以期望的是,提供了编码来自一种木聚糖酶的信号序列的核酸序列,其有效连接于一种不同的木聚糖酶的核酸序列,或者,可选择地,来自非木聚糖酶的蛋白的信号序列是被需要的。 
可以制备所述多聚核苷酸的微生物包括原核微生物如真细菌和古细菌,低等真核微生物如真菌、一些藻和原生动物。多聚核苷酸可以是分离自环境样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的酶的多聚核苷酸可以被应用。这样的酶可以在地表温泉和深海的热火山口超过100℃的温度有作用,在北极水域低于0℃的温度有作用,在死海的饱和的盐环境下有作用,在pH值在0附近的煤层沉积物和地热富硫矿泉中起作用,或者在pH值超过11的污水污泥中有作用。例如,来自极端条件下的生物体的几种被克隆和被表达的酯酶和脂酶在很宽的温度和pH范围内表现出高活性。 
如上所述的选择和分离的多核苷酸被导入进合适的宿主细胞中。合适的宿主细胞是能够促进重组和/或还原性重配的任何细胞。被选择的多核苷酸优选已经在包括有合适的控制序列的载体中。宿主细胞可以高等的真核细胞,如哺乳动物细胞,或低等真核细胞,如酵母细胞,或优选地,宿主细胞是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。 
对于典型的适当的宿主,可能被提及的是:细菌细胞,如大肠杆菌、链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sf9;动物细胞如CHO、COS或者黑色素瘤细胞;腺病毒,和植物细胞。选择适合的宿主被认为是在本领域技术人员已知的范围内。 
特别提及可以用于表达重组蛋白的各种哺乳动物细胞培养系统,哺乳动物表达系统的例子包括猴肾纤维原细胞的COS-7细胞系,其在“SV40-transformed simian cells support the replication of early SV40mutants”(Gluzman,1981)中有说明,和其它的可以表达相容性载体的细胞系,例如,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体将包括复制起点、合适的启动子和增强子,以及任何必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。 
另一方面,本发明的方法可以用于产生编码来自一个或者多个操纵子或者基因簇或者其中的部分的生物化学途径的新的多聚核苷酸。例如,细菌和很多真核生物具有用于调控基因的协作机制,所述基因的产物涉及相关的过程。基因成簇排列在单一染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。通过基因簇编码的生物化学途径的一个例子是聚酮化合物(polyketides)。 
基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,尤其是含有 表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于外源DNA具有非常大的容量的载体特别适合用于这样的基因簇的情况,在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生物样品的基因簇是理想的。特定的优选的实施方式是使用被称作“fos-质粒”的克隆载体,或者细菌人工染色体(BAC)载体。它们是源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。用于本发明的另一类型的载体是粘粒载体。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook等,Molecular Cloning:ALaboratory Mannual,第二版,Cold Spring Harbor Laboratory Press(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选,以寻找在起初的基因簇没有发现的活性。 
因此,一方面,本发明涉及用于产生具有生物活性的杂合木聚糖酶多肽以及筛选具有更高活性的多肽的方法,通过: 
1)以有效连接的方式导入至少第一多聚核苷酸和导入至少第二多聚核苷酸到合适的宿主细胞,所述的至少第一多聚核苷酸和第二多聚核苷酸共有具有部分的序列同源性的至少一个区域。 
2)在促进序列重新组织的条件下培养宿主细胞,得到有效连接的杂合多聚核苷酸。 
3)表达由所述杂合多聚核苷酸编码的杂合多肽。 
4)在有利于鉴定增强的生物活性的条件下筛选所述的杂合多肽;和 
5)分离编码该杂合多肽的多聚核苷酸。 
用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨论贯穿于本说明书。当要分离本发明的多聚核苷酸和多肽时,可以应用这些方法。 
筛选的方法学和“在线”监测设备
在实施本发明的方法时,可以应用与本发明的多肽和核酸结合的各种仪器和方法学,从而例如筛选具有木聚糖酶活性的多肽(例如,分析例如酶谱中酪蛋白的水解、从明胶中荧光的释放,或从各种小分子肽底物中释放p-nitroanalide)、筛选可作为木聚糖酶活性的潜在调节物的化合物,例如激活物或抑制物、筛选可与本发明的多肽结合的抗体、可与本发明的核酸杂交的核酸、筛选表达本发明多肽的细胞等。除了下面详细描述的用于筛选样品的阵列形式以外,也可使用别的形式来实施本发明的方法。这样的形式包括,例如质谱仪、色谱仪,例如,高通量 HPLC和其它形式的液相色谱,和更小的形式,如1536-孔板、384-孔板等等。高通量筛选仪器可被改装并用来实施本发明的方法,见,例如美国专利申请20020001809。 
毛细管阵列 
本发明的核酸或多肽可被固定或应用于阵列上。阵列可用来筛选或监测组合物(例如,小分子、抗体、核酸等)的文库,以发现它们结合本发明的核酸或多肽或者调节本发明的核酸或多肽的活性的能力。毛细管阵列,如GIGAMATRIXTM,戴弗萨公司,San Diego,CA;和描述在例如美国专利申请20020080350 A1;WO0231203 A;WO 0244336 A中的阵列,提供了容纳和筛选样品的可供选择的装置。在一个方面,毛细管阵列包括多个毛细管,它们形成具有相互邻接的毛细管的阵列,其中所述的每个毛细管含有至少一个壁,其限定了一个用以保留样品的内腔。这个内腔可以是圆柱形的、正方形的、六边形的或其它任何几何形状,只要其壁能够形成内腔以保留液体或样品。毛细管阵列的毛细管可相互靠近联合在一起形成一个面状的构造。毛细管可通过融合(例如,当毛细管由玻璃制成时)、粘合、键合或面对面的夹合而结合在一起。可选择地,毛细管阵列可以包括在阵列中相邻毛细管之间放置的间质材料(interstitial material),从而形成含有多个穿通孔(through-holes)的固体平面装置。 
毛细管阵列可由任何数量的毛细管形成,例如,100至4,000,000个毛细管。进一步,具有大约100,000或更多个毛细管的毛细管阵列可形成标准大小和形状的Microtiter 板,其适合于标准的实验室设备。通过毛细作用或使用细针的微注射,人工或自动地将腔充满。随后可以从毛细管中移出感兴趣的样品以进行进一步的分析或定性。例如,安置细针样的探头被安置,使其与选择的毛细管能够液体连通,从而可以向腔内加入材料或移走材料。 
在单区筛选分析(single-pot screening assay)中,分析组分在插入到毛细管阵列中之前被混合在一起,产生目的溶液。当至少一部分阵列被浸入目标溶液中时,通过毛细作用充满内腔。在每个毛细管中的化学或生物学反应和/或活性被监测,以发现可检测事件。所述的可检测事件常常被称为“命中事件(hit)”,其常常可以通过光学检测与产生“非命中事件(non-hit)”的毛细管区分开来。因此,毛细管阵列可整体地并行检测“命中事件”。 
在多区筛选分析(multi-pot screening assay)中,多肽或核酸,例如,配体可被导入进第一组分中,该组分被导入进毛细管阵列的至少一部分毛细管中。然后将气泡导入进第一组分后面的毛细管中。然后将第二组分导入进毛细管内,其中所述的第二组分与第一组分通过气泡相隔。通过在毛细管阵列的两侧施加静水压挤破气泡将第一和第二组分混合在一起。然后监测毛细管阵列中由两个组分的反应或非反应而发生的可检测事件。 
在结合筛选分析(binding screening assay)中,目标样品可作为用可检测颗粒标记的第一液体导入进毛细管阵列的毛细管中,其中为了使可检测颗粒与内腔结合,毛细管的内腔包被了一种结合材料。然后第一种液体可从毛细管中移去,其中结合的可检测颗粒仍保留在毛细管内,可以将第二液体导入进毛细管内。然后监测毛细管中由颗粒与第二液体的反应或非反应而发生的可检测事件。 
阵列,或“生物芯片” 
本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的文库,所述筛选或者监测是针对它们结合或者调控本发明的核酸或者多肽的活性的能力。例如,在本发明的一方面,一个被监测的参数是木聚糖酶基因的转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。通过应用在微型芯片上的核酸“阵列”,细胞的一些或者所有转录物可以同时被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被指作“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”,或者它们的变体。阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或者多种生物分子,例如,固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转录物的寡核苷酸。 
在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入,或者也引入它们的变化,例如在下列文献中说明的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;还例如,WO 99/51773;WO 99/09217;WO 97/46313;WO96/17958;还例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques 23:1087-1092;Kern(1997)Biotechniques 23:120-124;Solinas-Toldo(1997)Genes,Chromosomes & Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。也参见出版的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;20010008765。 
抗体和基于抗体的筛选方法
本发明提供了可与本发明的木聚糖酶特异结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的木聚糖酶或相关的多肽。这些抗体可用 来分离在本发明范围内的其它多肽或其它相关的木聚糖酶。抗体经设计可以结合木聚糖酶的活性位点。因此,本发明提供了使用本发明的抗体来抑制木聚糖酶的方法(见上面关于本发明的抗木聚糖酶组合物的应用的讨论)。 
本发明提供了本发明的酶的片段,包括本发明的多肽的免疫原性片段。本发明提供了含有本发明的多肽或肽和佐剂或载体以及类似物的组合物。 
所述抗体可以在免疫沉淀、染色、免疫亲合柱以及类似的程序中被应用。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择的,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法设计细胞表型。 
免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan,CURRENT PROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASIC AND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(第2版)Academic Press,New York,NY(1986);Kohler(1975)Nature 256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring Harbor Publications,New York。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。 
具有B组氨基酸序列和与其实质上相同的序列的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段,也可用来产生与所述多肽或片段特异结合的抗体。得到的抗体可应用于免疫亲和层析程序,以分离或纯化多肽,或确定多肽是否存在于生物样品中。在这样的程序中,蛋白制备物,如提取物,或生物样品与能够同具有B组氨基酸序列和与其实质上相同的序列的一种多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段特异结合的抗体接触。 
在免疫亲和程序中,所述抗体附着于一种固体支持物上,如珠子或者其它的填充柱基质。在所述抗体可以特异地与具有B组氨基酸序列和与其实质上相同的序列的一种多肽或其片段结合的条件下,将所述蛋白制备物与所述抗体接触。当通过清洗去除非特异结合的蛋白后,特异性结合的多肽被洗脱下来。 
在生物样品中蛋白结合所述抗体的能力可以通过使用本领域技术人员所熟悉的各种方法来确定。例如,结合可以通过用例如荧光试剂、酶标记或者放射性同位素的可检测标记物来标记所述抗体来确定。可选择地,所述抗体与所述样品的 结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及Western印迹。 
产生的针对具有B组氨基酸序列和与其实质上相同的序列的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的多克隆抗体可通过直接将多肽注射进动物中或通过将多肽给予动物,例如非人动物而获得。这样获得的抗体然后可与多肽本身结合。以这种方式,甚至仅编码多肽的一个片段的序列也可用来产生可与整个天然多肽结合的抗体。这种抗体然后可用来从表达所述多肽的细胞中分离多肽。 
为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein,Nature,256:495-497,1975)、trioma技术、人B-细胞杂交瘤技术(Kozbor等人,Immunology Today 4:72,1983)和EBV-杂交瘤技术(Cole等人,1985,in Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。 
用于产生单链抗体的技术(美国专利4,946,778)可被改动,以使之适于产生B组氨基酸序列和与其实质上相同的序列的多肽,或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的单链抗体。可选择地是,转基因小鼠可用来表达这些多肽或其片段的人源化抗体。 
产生的针对B组氨基酸序列和与其实质上相同的序列的多肽或含有其至少5、10、15、20、25、30、35、40、50、75、100或150个连续氨基酸的片段的抗体可用于筛选来自其它生物体和样品的类似多肽。在这些技术中,来自生物体的多肽与抗体接触,检测可与抗体特异结合的多肽。上述的任何程序可用来检测抗体的结合。一种这样的筛选分析描述在“Methods for Measuring Cellulase Activities”,Methods in Enzymology,Vol 160,87-116页中。 
试剂盒
本发明提供了试剂盒,其包括组合物,例如本发明的核酸、表达序列盒、载体、细胞、转基因种子或者植物或者植物的一部分、多肽(如木聚糖酶)和/或者抗体。所述试剂盒也可以包括如在此所述的用于教导本发明的方法学以及工业应用的指导性材料。 
全细胞工程和测定代谢参数
本发明的方法提供了细胞的全细胞进化或全细胞工程,其通过修饰细胞的遗传组成开发出具有新的表现型,例如,新的或修饰的木聚糖酶活性的新细胞株。通过向细胞中加入本发明的核酸,例如本发明的酶的编码序列而修饰遗传组成。见,例如,WO0229032;WO0196551。 
为了探测新的表型,在“实时”或者“在线”的时间期间监测被修饰的细胞的至少一种代谢参数。一发面,多个细胞,如培养细胞物被“实时”或者“在线” 监测。一方面,“实时”或者“在线”监测多个代谢参数。代谢参数可以应用本发明的木聚糖酶进行监测。 
代谢流分析(MFA)是以已知的生物化学框架为基础。以质量守恒定律和细胞内代谢的假稳态假说(PSSH)为基础,构建线性独立代谢矩阵。在实践本发明的方法时,建立代谢网络,包括: 
●所有途径底物、产物和中间代谢物的特性, 
●使途径代谢物互变的所有化学反应的特性,途径反应的化学计量学, 
●催化反应的所有酶的特性,酶反应动力学, 
●途径组分之间的调控性相互作用;如变构效应相互作用,酶-酶相互作用等, 
●酶或者酶的任何其它超大分子组织在细胞内的区室化,以及, 
●任何浓度梯度的代谢物、酶或者效应分子的存在,或者它们运动的扩散障碍。 
一旦针对给定的细胞株建立了代谢网络,如果在线代谢数据可用,那么可以通过矩阵概念引入数学表达来评估细胞内的代谢流。代谢表型依赖于细胞内整个代谢网络的变化。代谢表型依赖于途径利用对环境条件、遗传调控、发育状态和基因型等等作出的变化。在本发明方法的一个方面,当计算了在线MFA之后,通过研究所述的途径利用来分析细胞的动力学行为、它们的表型和其它性质。例如,在酵母发酵中,如果葡萄糖供应增加,氧气减少,呼吸途径的利用将会降低和/或者停止,而发酵途径的利用将占优势。在所述的途径分析之后,细胞培养物的生理状态的控制将成为可能。通过确定如何改变底物供给、温度、诱导物的使用等来控制细胞的生理状态朝着所需的方向进行,本发明的方法可以有助于确定如何操纵发酵。在实践本发明的方法时,MFA的结果也可以与转录物组(transcriptome)和蛋白质组(proteome)的数据比较,设计实验和方案用于代谢工程或者基因重排等等。 
在实践本发明的方法时,可以产生和检测到任何经修饰改变的或者新的表型,包括在细胞中新的或者改进的特征。可以监测代谢或者生长的任何方面。 
监测mRNA转录物的表达 
在本发明的一方面,工程化的表型包括增加或者降低mRNA转录物(如,木聚糖酶信息)的表达或者在细胞中产生新的(如,木聚糖酶)转录物。这一增加或者减少的表达可以通过测定本发明的木聚糖酶的存在或者通过木聚糖酶活性分析来跟踪。mRNA转录物或者信息也可以通过本领域已知的任何方法来检测或者定量,包括,例如,Northern印迹、定量扩增反应、阵列杂交以及类似的方法。定量扩增反应包括,如,定量PCR,包括,如,定量反转录聚合酶链式反应,或者RT-PCR;定量实时RT-PCR,或者“实时动力学RT-PCR”(参见,如,Kreuzer(2001)Br.J.Haematol.114:313-318;Xia(2001)Transplantation 72:907-914)。 
在本发明的一方面,工程化的表型是通过敲除同源基因的表达产生。可以敲 除所述基因的编码序列或者一个或多个转录控制元件,如启动子或者增强子。这样,转录物的表达可以完全去除或者降低。 
在本发明的一方面,所述工程化的表型包括增加同源基因的表达。这可以通过敲除负调控元件或者诱变正调控元件而实现,负调控元件包括以顺式或者反式起作用的转录调控元件。细胞的一种或者多种或者所有的转录物可以通过阵列上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。 
监测多肽、肽和氨基酸的表达 
在本发明的一方面,工程化的表型包括增加或者降低多肽(如木聚糖酶)的表达或者在细胞内产生新的多肽。这一增加或者减少的表达可以通过确定存在的木聚糖酶的量或者通过木聚糖酶活性分析来跟踪。也可以通过本领域任何已知的方法来检测并定量多肽、肽和氨基酸,所述方法包括,如,核磁共振(NMR)、分光光度测定法、射线照像术(蛋白放射性标记)、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)、超扩散色谱,各种免疫学方法,如,免疫沉淀、免疫扩散、免疫电泳、放射性免疫分析(RIAs)、酶联免疫吸附分析(ELISAs)、免疫荧光分析,凝胶电泳(如,SDS-PAGE)、用抗体染色、荧光激活的细胞分选器(FACS)、热分解质谱、傅立叶转换红外光谱测定、拉曼光谱、GC-MS和LC-电喷以及cap-LC-串联-电喷质谱,已经类似的方法。应用这些方法或者它们的变体也可以筛选新的生物活性,在美国专利6,057,103中有说明。而且,正如以下详细讨论的,可以应用蛋白阵列测定细胞的一个或者多个或者所有的多肽。 
工业应用
本发明的木聚糖酶是高度选择性的催化剂。它们可催化具有强烈的立体选择性、区域选择性和化学选择性的反应,是常规合成化学无法比拟的。而且,酶是非常通用的。本发明的木聚糖酶可适于在有机溶剂中发挥功能,可在极端pH(例如,高pH和低pH)和极端温度(例如,高温和低温)、极端的盐度水平(例如,高盐度和低盐度)下工作,并可催化同与其天然的生理底物结构不相关的化合物的反应。 
去垢剂组合物 
本发明提供了含有本发明的一种或多种多肽(例如,木聚糖酶)的去垢剂组合物,以及制备和使用这些组合物的方法。本发明并入了制备和使用去垢剂组合物的所有方法,见,例如美国专利6,413,928;6,399,561;6,365,561;6,380,147。去垢剂组合物可以是一个部分和两个部分的含水组合物、不含水的液体组合物、铸型固体、颗粒形式、微粒形式、压缩片剂、凝胶和/或糊剂和浆液的形式。本发明的木聚糖酶也可用作固体或液体形式的去垢剂添加剂产品。这样的添加剂产品可以 考虑用来补充或促进常规的去垢剂组合物的性能,它们可在洗涤过程的任何阶段被加入。 
实际的活性酶含量依赖于制造去垢剂组合物的方法,这不是很严格的,只要去垢剂溶液具有所需的酶活性。在一个方面,存在于最终溶液中的木聚糖酶的量的范围为每克去垢剂组合物大约0.001mg至0.5mg。选择用于本发明的过程和产品中的特定酶依赖于最终应用的条件,包括产品的物理形式、应用时的pH、应用时的温度和要被降解和改变的土壤类型。对于指定的任何一组应用条件,可以选择酶以提供最佳的活性和稳定性。在一个方面,本发明的木聚糖酶在大约4至大约12的pH范围内,大约20℃至大约95℃的温度范围内是有活性的。本发明的去垢剂可以包括阳离子表面活性剂、半极性的非离子表面活性剂或两性离子表面活性剂或其混合物。 
本发明的木聚糖酶可被制成粉末状和液体的去垢剂,具有的pH在4.0和12.0之间,重量为大约0.01%至大约5%(优选0.1%至0.5%)的水平。这些去垢剂组合物也包括其它的酶如木聚糖酶、纤维素酶、脂酶或糖苷内切酶、内-β-1,4-葡聚糖酶、β-葡聚糖酶、内-β-1,3(4)-葡聚糖酶、角质酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、酚氧化酶、木质素酶、支链淀粉酶、阿拉伯聚糖酶、半纤维素酶、甘露聚糖酶、木糖葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李半乳糖醛聚糖乙酰酯酶、聚半乳糖醛酸酶、鼠李半乳糖醛聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷氨酰胺酶。这些去垢剂组合物也包括洗涤增洁剂和稳定剂。 
向传统的洗涤组合物中添加本发明的木聚糖酶不会造成任何特殊的应用限制。换句话说,适合去垢剂的任何温度和pH也适用于本发明的组合物,只要酶在打算使用的pH和/温度下有活性,或是可耐受的。另外,本发明的木聚糖酶可用于不需要去垢剂的洗涤剂中,单独应用或与增洁剂和稳定剂联合应用。 
本发明提供了洗涤组合物,包括清洁硬表面的去垢剂组合物、清洁织物的去垢剂组合物、用于洗碗的组合物、口腔清洁组合物、假牙清洁组合物和隐形眼镜清洁溶液。 
在一个方面,本发明提供了清洗物体的方法,包括将物体与本发明的多肽在可充分洗涤的条件下接触。本发明的木聚糖酶可以作为去垢剂添加剂而被加入。本发明的去垢剂组合物,例如可被配制为含有本发明多肽的手工或机器洗衣的去垢剂组合物。用于预处理染织物的洗衣添加剂可含有本发明的多肽。织物柔软剂组合物可含有本发明的木聚糖酶。可选择的是,本发明的木聚糖酶可被制成去垢剂组合物,用于通常的家庭硬表面清洗工作中。在可选择的方面,本发明的去垢剂添加剂和去垢剂组合物包含一种或多种其它的酶,例如木聚糖酶、脂酶、角质酶、另一种木聚糖酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如,乳糖酶和/或过氧化物酶(也见上)。所选 择的本发明的酶的特性可与所选择的去垢剂相容(即,最佳pH,与其它的酶或非酶成分相容,等),酶是以有效量存在。在一个方面,本发明的木聚糖酶用来从织物中去掉有恶臭的材料。在实施本发明过程中可使用的各种去垢剂组合物和制备它们的方法描述在,例如美国专利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。 
当制成适合用于洗衣机器洗涤方法的组合物时,本发明的木聚糖酶可包括表面活性剂和增白剂化合物。另外,它们可以包括一种或多种去垢剂组分,例如有机聚合的化合物、漂白剂、其它的酶、抑泡剂、分散剂、石灰肥皂分散剂、土壤悬液和防再污染剂和腐蚀抑制剂。本发明的洗衣组合物也可以含有柔软剂作为额外的去垢剂组分。这样的含有糖酶的组合物当制成洗衣去垢剂组合物时,可提供织物的洗涤、染剂的去除、洁白度的保持、软化、着色、染料转移的抑制和卫生处理。 
本发明的洗衣去垢剂组合物的密度范围可以为大约200至1500克/升,或大约400至1200克/升,或大约500至950克/升,或600至800克/升组合物;这是在大约20℃时测定的。 
本发明的洗衣去垢剂组合物的“紧密(compact)”形式最好由密度来反映,就组合物而言,可以通过无机填料盐类的量来反映。无机填料盐是粉末形式的去垢剂组合物的常规成分。在常规的去垢剂组合物中,填料盐类存在的基本量一般为总组合物重量的17%至35%。在所述紧密组合物的一个方面,填料盐类存在的量不超过总组合物重量的15%,或不超过10%,或不超过5%。无机填料盐类选自硫酸盐和氯化物的碱和碱土金属盐类,例如,硫酸钠。 
本发明的液体去垢剂组合物也可以是“浓缩的形式”。在一个方面,与常规的液体去垢剂相比,所述的液体去垢剂组合物含有较低量的水分。在可选择的方面,浓缩液体去垢剂的水含量小于去垢剂组合物重量的40%,或小于30%,或小于20%。本发明的去垢剂化合物可以构成在WO 97/01629中所述的剂型。 
本发明的木聚糖酶可用于配制多种洗涤组合物。多种已知的化合物是合适的表面活性剂包括非离子的,阴离子,阳离子,或可使用两性离子去垢剂,如在美国专利4,404,128;4,261,868;5,204,015中所公开的。另外,木聚糖酶可用于,例如条皂或液体肥皂的应用、碗碟清洗剂型、隐形眼镜清洗溶液或产品、肽水解、废物处理、纺织品应用、在蛋白生产中作为融合-裂解酶,以及类似的应用。与别的去垢剂相比,木聚糖酶在去垢剂组合物提供了增强的性能,即,酶基团可以提高对某些酶敏感的污物的清洗,如对草或血的清洗,这可以在进行标准的洗涤循环后用通常的评价方法来测定。木聚糖酶可被配制到已知的粉末状和液体去垢剂中,pH在6.5和12.0之间,重量水平在大约0.01至大约5%(例如,大约0.1%至0.5%)。这些去垢剂洗涤组合物也可以包括其它的酶,如已知的木聚糖酶、木聚糖酶、淀粉酶、纤维素酶、脂酶或糖苷内切酶,以及增洁剂和稳定剂。 
在一个方面,本发明提供了具有木聚糖酶活性(本发明的木聚糖酶)的去垢剂组合物,其可用于水果、蔬菜和/或泥浆和粘土化合物(见,例如,美国专利5,786,316)。 
处理纤维和纺织品 
本发明提供了使用本发明的一种或多种木聚糖酶处理纤维和织物的方法。木聚糖酶可用于本领域中熟知的任何纤维或织物处理方法中,见,例如,美国专利6,261,828;6,077,316;6,024,766;6,021,536;6,017,751;5,980,581;美国专利申请20020142438 A1。例如,本发明的木聚糖酶可用于纤维和/或织物的脱浆工艺中。在一个方面,织物的质地和外观通过将织物与本发明的木聚糖酶在溶液中接触的方法而被改善。在一个方面,织物用溶液在一定压力下处理。例如,本发明的木聚糖酶可用于去除染料。 
本发明的木聚糖酶可用来处理任何纤维素材料,包括纤维(例如,棉、大麻、亚麻或亚麻布纤维),缝制的和未缝制的织物,例如,由棉、混棉或天然纤维素或人造纤维素(例如,来自含木聚糖的纤维素纤维,如来自木浆)或其混合物制成的编织物、针织物、粗斜纹布、纱线和毛巾料。混合物的实例是棉或人造丝/粘胶与一种或多种伴随材料如羊毛、合成纤维(例如,聚酰胺纤维、丙烯酸纤维、聚酯纤维、聚乙烯醇纤维、聚氯乙烯纤维、聚偏二氯乙烯纤维、聚氨酯纤维、聚脲纤维、芳香族聚酰胺纤维)和含纤维素的纤维(例如,人造丝/粘胶、苎麻、大麻、亚麻/亚麻布、黄麻、乙酸纤维素纤维、莱赛尔(lyocell))的混合物。 
本发明的纺织品处理过程(使用本发明的木聚糖酶)可与其它纺织品处理相结合,例如,刷洗和漂白。刷洗是从棉纤维中去掉非纤维素的材料,例如角质层(主要由蜡组成)和原初的细胞壁(主要由胶质、蛋白质和木糖葡萄糖组成)。适当的蜡去除对获得高的可湿性是必须的。这是染色所必需的。通过本发明的过程去除主要的细胞壁可改善蜡的去除,保证更均匀的染色。用本发明的过程处理纺织品可改善漂白过程中的洁白度。用于刷洗中的主要化学物质是高浓度和高温下的钠、氢氧化物。漂白包括氧化纺织品。漂白一般涉及使用过氧化氢作为氧化剂,以便获得完全漂白(白的)织物或保证染料的洁净色调。 
本发明也提供了碱性木聚糖酶(在碱性条件下有活性的木聚糖酶)。这些酶在织物加工、植物纤维(例如植物韧皮纤维)的脱胶、胶质废水的处理、造纸、咖啡和茶发酵中具有很广泛的应用。见,例如Hoondal(2002)Applied Microbiology and Biotechnology 59:409-418。 
处理食物和食物加工 
本发明的木聚糖酶在食品加工工业中具有大量的应用。例如,在一个方面,本发明的木聚糖酶可用来改善从富油植物原料中油的提取,例如,富含油的种子, 例如来自大豆的大豆油、来自橄榄的橄榄油、来自油菜籽的油菜籽油和/或来自向日葵籽的向日葵油。 
本发明的木聚糖酶可用来分离植物细胞材料中的成分。例如,本发明的木聚糖酶可用于将富含木聚糖的物质(例如,植物细胞)分离成各种成分。在一个方面,本发明的木聚糖酶可用来将富含木聚糖或富含油的作物分离成有价值的蛋白和油和外壳组分。可通过使用本领域中已知的方法执行分离过程。 
本发明的木聚糖酶可用于水果或蔬菜汁、果汁、提取物以及类似物的制备过程以增加产量。本发明的木聚糖酶可用于各种植物细胞壁衍生物质或废料的酶处理(例如,水解含有木聚糖的植物物质),所述的被处理物质例如来自谷类、谷粒、葡萄酒或果汁的生产,或农业残余物如蔬菜外壳、豆荚、制糖甜菜浆、橄榄浆、马铃薯浆以及类似物。本发明的木聚糖酶可用来改变被加工的水果或蔬菜的粘稠度和外观。本发明的木聚糖酶可用来处理植物物质以促进包括食物在内的植物物质的加工,促进植物成分的纯化或提取。本发明的木聚糖酶可用来改善饲料的价值、降低结合水含量、提高污水的降解性和/或改善植物物质向窖藏品的转变以及类似的应用。 
在一个方面,本发明的木聚糖酶可用于烘烤应用中,例如,曲奇和饼干,以水解阿拉伯糖基木聚糖,产生机器不难加工的不粘的面团,并减小饼干的大小。使用本发明的木聚糖酶水解阿拉伯糖基木聚糖可防止烘烤制品的迅速再水化引起的松脆性丢失和储藏寿命的减小。在一个方面,本发明的木聚糖酶可用作面团加工过程中的添加剂。在一个方面,本发明的木聚糖酶可用于面团改进,其中在一个方面,木聚糖酶在大约25-35℃的温度范围内和接近中性pH(7.0-7.5)下具有很高的活性。在一个方面,面团改进酶可在极端温度的烘烤下(>500℉)被灭活。 
在一个方面,本发明的木聚糖酶可在面团加工过程中用作添加剂,在面团pH和温度条件下最佳地发挥作用。在一个方面,本发明的酶可用于面团改进。在一个方面,本发明的木聚糖酶在25-35℃的温度范围内和接近中性的pH(7.0-7.5)下具有很高的活性。在一个方面,酶在极端温度的烘烤下被灭活,例如>500℉。 
纸或纸浆处理 
本发明的木聚糖酶可用于纸或纸浆处理或纸脱墨中。例如,在一个方面,本发明提供了使用本发明的木聚糖酶的纸处理过程。在一个方面,本发明的木聚糖酶可应用在高碱和高温环境中,减少对化学漂白剂如二氧化氯的需求。在一个方面,本发明的木聚糖酶是耐热的碱性木聚糖内切酶,可减少牛皮纸纸浆的二氧化氯需求量超过25%,使纸浆产量的损失小于0.5%。在一个方面,临界的参数为pH 10,65-85℃,处理时间少于60分钟,酶的加样量小于0.001wt%。可以检测一个木聚糖酶库中水解染料标记的木聚糖的能力,例如在pH 10和60℃。在这些条件下检测为阳性的酶然后可以在例如pH 10和70℃被评价。可选择地是,酶可在pH 8和pH 10 在70℃被测试。在发现纸浆和造纸工业中所需的木聚糖酶的过程中,以来自高温或高碱环境的文库作为目标。特别地,这些文库被筛选,以发现可在碱性pH和大约45℃的温度发挥作用的酶。在另一个方面,本发明的木聚糖酶可用于纸浆和造纸工业中降解木质素半纤维素连接,以释放木质素。 
动物饲料和食物或饲料添加剂 
本发明提供了使用本发明的木聚糖酶处理动物饲料和食物和食物或饲料添加剂的方法,动物包括哺乳动物(例如,人)、鸟、鱼和类似物。本发明提供了含有本发明木聚糖酶的动物饲料、食物和添加剂。在一个方面,使用本发明的木聚糖酶处理动物饲料、食物和添加剂可有助于动物饲料或添加剂中的营养素例如淀粉、蛋白等的利用度。通过破坏很难消化的蛋白或间接或直接暴露淀粉(或其它营养物质),木聚糖酶使营养物质更容易接近其它的内源或外源酶。木聚糖酶也可引起很易消化和很易吸收的营养物质和糖类的释放。 
当被加入进动物饲料中时,本发明的木聚糖酶可改善植物细胞壁物质的体内分解,这部分是由于减小了肠内的粘度(见,例如Bedford等人,Proceedings of the 1st Symposium on Enzymes in Animal Nutrition,1993,pp.73-77),因此可实现动物对植物营养物质的更好利用。因此,通过在饲料中使用本发明的木聚糖酶,动物的生长速率和/或饲料转化率(即,被消化饲料相对于增加的体重的重量)被改善。 
本发明的动物饲料添加剂可以是颗粒状的酶产品,其很容易与饲料成分混合。可选择地是,本发明的饲料添加剂可形成一种预混合组分。本发明的颗粒状酶产品可被包被或不包被。酶颗粒的微粒大小可与饲料和预混合组分的大小相容。这为将酶整合进饲料中提供了一种安全和方便的手段。可选择地是,本发明的动物饲料添加剂可以是一种稳定的液体组合物。它可以是一种水基或油基的浆液。见,例如美国专利6,245,546。 
在动物饲料或食物的改变中,本发明的木聚糖酶可在体外(通过改变饲料或食物的成分)或体内加工食物或饲料。木聚糖酶可加入至含有很高含量的木聚糖的动物饲料或食物组合物中,例如含有来自谷类、谷粒以及类似物的植物物质的饲料或食物。当被加入至饲料或食物中时,木聚糖酶可显著地改善含木聚糖物质例如植物细胞壁的体内分解,因此可实现动物(例如,人)对植物营养物质的更好利用。在一个方面,动物的生长速率和/或饲料转化率(即,被消化饲料的重量相对于增加的体重)被改善。例如,部分消化或不消化的含木聚糖的蛋白被本发明的木聚糖酶完全或部分降解成为肽和半乳糖和/或半乳糖寡聚物,其中木聚糖酶可以与其它酶联合,例如β-半乳糖苷酶。这些酶消化产物更容易被动物消化。因此,本发明的木聚糖酶有助于饲料或食物的能量的有效利用。通过促使含木聚糖蛋白的降解,本发明的木聚糖酶也可改善糖类和非糖类饲料或食物成分如蛋白、脂肪和矿物质的消化性和摄取。 
在另一个方面,本发明的木聚糖酶通过直接在转基因饲料作物(如,例如转基因植物、转基因种子以及类似物)中表达酶而被供给,所述转基因作物如谷粒、谷类、玉米、大豆、油菜籽、羽扇豆以及类似物。如在上面所讨论的,本发明提供了转基因的植物、植物部分和植物细胞,其含有编码本发明多肽的核酸序列。在一个方面,核酸被表达,这样本发明的木聚糖酶以可回收的量被产生。木聚糖酶可从任何植物或植物部分中被回收。可选择的是,含有重组多肽的植物或植物部分可用来改善食物或饲料的性质,例如,改善营养价值、可口性和流变性,或破坏抗营养因子。 
在一个方面,本发明提供了在饲料被动物个体消耗之前使用本发明的木聚糖酶从饲料中去除寡糖的方法。在这个过程中,形成了可代谢能值(metabolizable energy value)增加的饲料。除了本发明的木聚糖酶以外,可使用半乳糖苷酶、纤维素酶和其组合。在一个方面,酶以相当于饲料物质重量的大约0.1%至1%的量被加入。在一个方面,饲料是谷类、小麦、谷粒、大豆(例如,磨碎的大豆)物质。见,例如美国专利6,399,123。 
在另一个方面,本发明提供了在动物饮食中应用木聚糖酶作为营养添加物的方法,通过制备含有重组木聚糖酶的营养添加物,所述酶含有B组氨基酸序列的至少30个连续氨基酸,将营养添加物给予动物以增加对包含在被动物消化的食物中的木聚糖的利用。 
仍在另一个方面,本发明提供了一种可食用的丸状的酶输送基质和将木聚糖酶——例如作为一种营养添加物——输送给动物的应用方法。酶输送基质很容易释放木聚糖酶,例如一种具有B组氨基酸序列的氨基酸序列或其至少30个连续氨基酸的酶,其处于含水介质中,例如,动物的消化性液体中。本发明的酶输送基质可用粒状的可食用载剂制备,载剂选自这样一些成分,如无油的谷粒胚芽、干草、苜蓿、梯牧草、大豆荚、向日葵籽粉、小麦粗粉以及类似物,它们很容易将包含在其中的重组酶分散进含水介质中。在应用中,可食用的丸状酶输送基质被给予动物,将木聚糖酶输送给动物。合适的基于谷物的基质可包含或来自任何适合的可食用谷物,如小麦、玉米、大豆、高粱、苜蓿、大麦和类似物。基于谷物的基质的实例是基于玉米的基质。底物可来自谷物的任何合适的部分,但优选被批准用于动物饲料的谷物胚芽,如可在潮湿的或干燥的磨粉过程中获得的玉米胚芽。谷物胚芽优选含有废胚芽,它是油已经被榨出的谷物胚芽,如通过压榨或己烷或其它溶剂萃取。可选择地是,谷物胚芽被压榨机提取,即油已经通过压榨被去除。 
本发明的酶输送基质是以分散的多个微粒、小丸或颗粒形式存在。“颗粒”的含义是被压扁或压紧的微粒,如通过制丸、挤压或类似的压制过程从基质中去除水分。微粒的这种压缩或压紧也可促进微粒的粒子内粘聚性。例如,通过在制丸机中将基于谷物的基质制丸来制备颗粒。由此制备的丸被研磨或粉碎成适合用作动物饲料辅料的颗粒大小。由于基质本身被批准用于动物饲料,所以在动物饲 料中它可用作输送酶的稀释剂。 
优选地,酶输送基质为颗粒的形式,颗粒大小范围为大约4至大约400目(USS);更优选大约8至大约80目;最优选大约14至大约20目。如果谷物胚芽是经溶剂提取被消耗,在制粒机中可能需要使用润滑剂如玉米油,但如果胚芽是被压榨机提取则通常不需要这样的润滑剂。在本发明的另一个方面,通过其它的压制或压缩过程来制备基质,例如通过一个模具挤压基于谷物的基质,并将压出物研磨成合适的颗粒大小。 
酶输送基质可进一步包括多糖成分作为粘合剂以增强基质颗粒的粘聚性。认为粘合剂可提供另外的羟基,可增强基质颗粒内谷类蛋白之间的键合作用。进一步认为,额外的羟基基团可通过增强蛋白与淀粉和其它蛋白的氢键结合而发挥作用。粘合剂可以任何适合的量存在以增强酶输送基质的颗粒的粘聚性。合适的粘合剂包括一种或多种糊精、麦芽糊精、淀粉,如玉米淀粉、面粉、纤维素、半纤维素和类似物。例如,基质中谷胚芽和粘合剂的比例(不包括酶)为78%的玉米胚芽粉和20%重量的玉米淀粉。 
因为本发明的酶释放基质由生物可降解材料制成,基质可能发生酸败,如通过发霉。为了防止或抑制这种发霉,基质可包括发霉抑制剂,如丙酸盐,可以任何足以抑制酶释放基质发霉的量存在,因此提供了以稳定剂型存在的输送基质,其不需要冷冻。 
包含在本发明的酶输送基质和方法中的木聚糖酶优选是热稳定的木聚糖酶,如在此所述,这是为了在制造过程中抵抗木聚糖酶的灭活,在制造过程中高温和/或蒸汽可被应用来制备成垛的酶输送基质。在消化含有本发明的酶输送基质的饲料过程中,水相消化液将引起活性酶的释放。其它类型的热稳定酶和热稳定的营养添加剂也可被掺入输送基质中,其可在任何类型的含水条件下释放。 
出于许多不同的目的,可以对本发明的酶基质微粒应用包衣,如为了向动物饲料中添加调味剂或营养添加剂,为了在胃内条件下延缓动物饲料添加剂和酶的释放,以及类似的目的。或者,可应用包衣来实现功能性的目的,例如在需要延缓酶从基质微粒中的释放或控制酶将被释放的条件时。包衣材料的组合物可以是可选择性地被其敏感的试剂(如热、酸、酶或其它化学物质)分解的材料。可选择地是,对不同的这样的分解剂敏感的两种或更多种包衣可被连续地应用于基质微粒。 
本发明也专注于制备酶释放基质的过程。根据本发明,该过程包括提供基于谷粒的基材的多个分散颗粒,其颗粒大小适合用作酶释放基质,其中所述的颗粒包括由B组氨基酸序列的氨基酸序列或其至少30个连续的氨基酸编码的木聚糖酶。优选该过程包括将酶释放基质的颗粒压制或压缩成微粒,最优选是通过制丸来完成。防霉剂和粘聚剂,当被应用时,可在任何适合的时间被加入,优选与基于谷粒的基材以所需的比例在将基于谷粒的基材制丸之前混合。制丸机进料中的含水 量优选上面所示的与最终产物含水量对应的范围,优选大约14-15%。优选水分以酶的水制剂形式加入至供给原料中,使该原料达到此含水量。在制丸机中的温度优选用蒸汽达到大约82℃。制丸机可在任何条件下进行操作,对供给原料进行足够的操作以提供小丸。对于从含酶组合物中去除水分来说,制丸过程本身是一个很划算的过程。 
在一个方面,制丸机用1/8英寸乘2英寸的模在100Ib./min.的压力下在82℃操作,形成小丸,然后在制丸机粉碎室内被粉碎形成分散的多个颗粒,颗粒大小能够通过8目的筛网但可被保留在20目的筛网上。 
本发明的热稳定的木聚糖酶可用于本发明的小丸中。它们可以具有很高的最适温度和很高的耐热性,这样可以在至今无法进行反应的温度下执行酶反应。根据本发明,编码木聚糖酶的基因(例如,在A组核酸序列的任何一条序列中所示的)可用于制备木聚糖酶(例如,使用在此所述的GSSMTM),所述木聚糖酶具有与B组氨基酸序列的木聚糖酶不同的特性(在最佳pH、最佳温度、耐热性、对溶剂的稳定性、比活、对底物的亲和力、分泌能力、翻译速率、转录调控以及类似的方面)。而且,A组核酸序列的多核苷酸可被用来筛选通过在此所述的方法制备的木聚糖酶变异体,以确定那些具有所需活性的变异体,如具有改善或改变的热稳定性或耐热性的变异体。例如,美国专利5,830,732描述了测定木聚糖酶的耐热性的筛选试验。 
废物处理 
本发明的木聚糖酶可用于其它的各种工业应用中,例如用在废物处理中。例如,在一个方面,本发明提供了使用本发明的木聚糖酶的固体废物消化过程。该法可减少基本上未处理的固体废物的质量和体积。固体废物可在酶溶液(包括本发明的木聚糖酶)存在的情况下用一种酶消化过程在可控的温度下进行处理。这种反应不需要添加微生物形成明显的细菌发酵。固体废物被转变为液化的废物和残余的固体废物。得到的液化废物可与所述的任何残余的固化废物分离。见,例如美国专利5,709,796。 
口腔护理产品 
本发明提供了含有本发明的木聚糖酶的口腔护理产品。示范性的口腔护理产品包括牙膏、牙乳剂、凝胶或牙粉、洗牙剂、漱口剂、刷牙前或后的漱口剂、口香糖、止咳糖或冰糖。见,例如美国专利6,264,925。 
酿造和发酵 
本发明提供了酿造(例如,发酵)含有本发明的木聚糖酶的啤酒的方法。在一个示范性的过程中,含有淀粉的原材料被分解和加工形成麦芽。本发明的木聚 糖酶被用在发酵过程中的任何时候。例如,本发明的木聚糖酶被用于大麦麦芽的加工中。啤酒酿造的主要原材料是大麦麦芽。这是一个三阶段的过程。首先,大麦谷粒被浸泡以增加水含量,例如,大约40%左右。第二,当在赤霉素控制下刺激酶合成时,在15至25℃孵育3至6天可使谷粒发芽。在一个方面,本发明的木聚糖酶在所述过程的这个阶段(或任何其它阶段)被加入。本发明的木聚糖酶可用于任何啤酒或酒精饮料的生产过程中,其描述例如,见美国专利5,762,991;5,536,650;5,405,624;5,021,246;4,788,066。 
在一个方面,本发明的酶用来改善可滤过性和麦芽汁的粘度,对胚乳成分获得更完全的水解。使用本发明的酶也可增加提取物的产量。酿造的过程涉及大麦谷粒的发芽(制麦芽),然后提取和分解储存的糖类以产生简单的糖,这些糖可被酵母用于酒精发酵。存在于大麦胚乳中的糖类储存物和酿造添加剂的有效分解需要几种不同的酶的活性。 
在一个方面,本发明的酶在微酸性pH(例如,5.5-6.0)在例如40℃至70℃的温度范围内具有活性;在一个方面,在95℃时是无活性的。在这样的条件下的活性是最佳的,但对于功效并不是必需的条件。在一个方面,本发明的酶在40-75℃之间和pH 5.5-6.0之间具有活性;在70℃可稳定至少50分钟,在一个方面,在96-100℃被灭活。本发明的酶可与其它的酶一起应用,例如,β-1,4-葡聚糖内切酶和淀粉酶。 
医学和研究应用 
本发明的木聚糖酶由于其溶菌的特性,可用作抗微生物试剂。本发明的木聚糖酶可用来除去沙门氏菌感染或保护动物免受沙门氏菌感染,其描述见,例如PCT申请WO0049890和WO9903497。 
其它工业应用 
本发明的木聚糖酶,包括B组氨基酸序列可用在各种食物、动物饲料和饮料应用中。通过筛选已存在的文库和从多种嗜温和中度嗜热场所以及从目标来源——包括消化性植物、动物废物中的微生物、土壤细菌和高度碱性栖息地——构建出的DNA文库来发现新的木聚糖酶。使用阿拉伯糖基木聚糖底物和/或动物饲料物质中的不溶性多糖组分来进行生物俘获(biotrap)和初步的富集策略也是有用的。 
两种筛选形式(基于活性和基于序列)可用于发现新的木聚糖酶。基于活性的方法是直接在琼脂平板上采用底物如AZO-木聚糖(Megazyme)来筛选木聚糖酶活性。可选择的是,可使用基于序列的方法,这是根据生物信息学和分子生物学来为杂交和生物淘选(biopanning)设计探针。见,例如美国专利6,054,267、6,030,779、6,368,798、6,344,328。为了进行基本的生物化学定性,筛选得到的命中物可被纯化、测序、定性(例如,测定特异性、温度和最适pH)、使用生物信 息学进行分析、亚克隆和表达。这些方法可用来筛选可用于大量应用中的木聚糖酶,包括用于面团改进和作为动物饲料添加酶的木聚糖酶。 
在对由筛选获得的酶进行定性的过程中,可以评价在面团加工和烘烤应用中的实效。定性可以包括,例如,测定底物的特异性(木聚糖、阿拉伯糖基木聚糖、CMC、BBG)、温度和pH稳定性和比活。市售的酶可用作基准。在一个方面,本发明的酶在pH≥7和25-35℃具有显著活性,对不溶的木聚糖是无活性的,在50-67%蔗糖中是稳定和有活性的。 
在另一个方面,可通过候选酶的表征来评价作为饲料添加剂的实效。表征可以包括,例如测量底物的特异性(木聚糖、阿拉伯糖基木聚糖、CMC、BβG)、温度和pH稳定性、比活和胃内的稳定性。在一个方面,为单胃动物设计饲料,在另一方面,为反刍动物设计饲料。在一个方面,本发明的酶在pH2-4和35-40℃具有显著的活性,在胃液中的半衰期超过30分钟,在85℃时剂型(在缓冲液或细胞中)的半衰期超过5分钟,它们可用作单胃动物的饲料添加剂。在另一个方面,本发明的酶具有一种或多种以下的特性:在pH 6.5-7.0和35-40℃具有显著的活性、在瘤胃流体中的半衰期超过30分钟、与干粉同样稳定的剂型稳定性、可用作反刍动物的饲料添加剂。 
酶对于很大范围的天然底物和非天然底物酶都是具有反应性的,因此这使得实际上任何有机先导化合物(lead compound)的修饰都成为可能。而且,不同于传统的化学催化剂,酶是高度对映选择性和区域选择性的。酶所显示的高度的功能基团特异性使人们能够追踪可导致产生新的活性化合物的合成顺序中的每一个反应。酶也能够催化许多与其生理功能在自然状态下不相关的各种反应。例如,过氧化物酶可通过过氧化氢催化苯酚的氧化。过氧化物酶也可催化与该酶的天然功能不相关的羟基化反应。其它的实例是可催化多肽分解的木聚糖酶。在有机溶液中,一些木聚糖酶也可酰化糖类,该功能与这些酶的天然功能不相关。 
本发明开发了酶的独特的催化性质。鉴于生物催化剂(即,纯化的或者粗制的酶,非存活的或者存活的细胞)在化学转化中的应用一般需要确定与特定的起始化合物反应的特定的生物催化剂,本发明应用的经选择的生物催化剂和反应条件是对于存在于很多起始化合物中的功能基团具有特异性的。每种生物催化剂对于一种功能基团或者几种相关的功能基团是特异的,并且可以和含有这一功能基团的许多起始化合物反应。生物催化反应可以从单一的起始化合物生产出一个群体的衍生物。这些衍生物可以进行另一轮的生物催化反应来产生又一个群体的衍生化合物。通过生物催化的衍生作用的每一次迭代可以产生起始化合物的数千种变化。 
酶可以在起始化合物的特定位点发生反应而不影响分子的其它部分,该过程通过传统的化学方法很难实现。这种高度的生物催化特异性提供了用于在文库中鉴定单个活性化合物的方法。该文库是通过用于产生该文库的一系列生物催化反 应来表征,这也称为“生物合成历史”。对该文库的生物活性的筛选和对生物合成历史的追踪确定出产生活性化合物的特定反应顺序。重复该反应顺序,并确认合成出的化合物的结构。这种确认方式,不同于其它的合成和筛选方法,并不需要固定化技术,化合物可以利用实际上任何类型的筛选分析在溶液中自由合成和测试。重要的是,要注意到,酶反应在功能基团上的高度特异性允许“追踪”制备出了生物催化产生的文库的特定酶促反应。 
许多程序化的步骤可使用机器人自动化来实施,这使得每天可进行几千个生物催化反应和筛选测定,并保证高水平的准确性和可重复性。结果是,可在几周内产生衍生化合物的文库,使用现今的化学方法需要几年才能产生。(对于包括小分子在内的分子修饰的进一步教导,见PCT/US94/09174)。 
本发明进一步通过下面的实施例进行说明;但要理解的是本发明不受这些实施例的限制。 
实施例 
实施例1:基于平板的糖苷内切酶(endoglycosidase)的酶发现:表达筛选
λ文库的滴定测定:向600μL大肠杆菌MRF′细胞(OD600=1.0)中加入1.0μL的Lambda Zap Express扩增文库母液。用10mM MgSO4稀释MRF′母液。在37℃孵育混合物15分钟,然后将悬液转移至50℃的5-6mL的NZY上层琼脂中,并轻轻混合。迅速将琼脂溶液倾倒至大的(150mm)NZY培养基平板上,使上层琼脂完全固化(大约30分钟)。倒转平板。将平板在39℃孵育8-12小时。(噬菌斑的数目被估计。测定的噬菌体滴度(titer,效价)达到50,000pfu/板。如果需要,用SM缓冲液稀释一小等份的文库噬菌体。) 
底物筛选:向600μL大肠杆菌MRF′细胞(OD600=1.0)中加入来自扩增文库的Lambda Zap Express(50,000pfu),在37℃孵育15分钟。在噬菌体/细胞悬液被孵育的同时,向50℃的5.0mL NZY上层琼脂中加入1.0mL所需的多糖染料标记的底物(通常1-2%w/v),并充分混合。(溶液保持在50℃备用。)将细胞悬液转移至底物/上层琼脂溶液中,并轻轻混合。迅速将溶液倾倒至大的(150mm)NZY培养基平板上,使上层琼脂完全凝固(大约30分钟),然后倒转平板。在39℃孵育平板8-12小时。观察平板中噬菌斑周围的透明圈(晕)。带有晕的中心噬菌斑被移出琼脂并转移至无菌的微量管中。(大内径的200μL吸管的尖部可很好地移出含有所需噬菌斑的(中心的)琼脂块。)将噬菌体重悬在500μL SM缓冲液中。加入20μL氯仿以抑制细胞的进一步生长。 
分离纯克隆:向500μL大肠杆菌MRF′细胞(OD600=1.0)中加入5μL重悬的噬菌体 悬液。在37℃孵育15分钟。在噬菌体/细胞悬液被孵育的同时,向50℃的3.0mL NZY上层琼脂中加入600μL所需的多糖染料标记的底物(通常1-2%w/v),并充分混合。(溶液保持在50℃备用。)将细胞悬液转移至底物/上层琼脂溶液中,并轻轻混合。迅速将溶液倾倒至小的(90mm)NZY培养基平板上,使上层琼脂完全凝固(大约30分钟),然后倒转平板。在39℃孵育平板8-12小时。观察平板中单个噬菌斑(纯克隆)周围的透明圈(晕)。(如果不能分离出单个噬菌斑,调整滴度,重新在板上涂布噬菌体悬液。)将噬菌体重悬在500μL SM缓冲液中,加入20μL氯仿以抑制细胞的进一步生长。 
切除纯克隆:使纯的噬菌体悬液在室温孵育2至3小时或4℃过夜。向200μL大肠杆菌MRF′细胞(OD600=1.0)中加入100μL纯的噬菌体悬液。加入1.0μL的ExAssist辅助噬菌体(hepler phage)(>1×106pfu/mL;Stratagene)。在37℃孵育悬液15分钟。向细胞悬液中加入3.0mL 2×YT培养基。37℃孵育2-2.5小时同时振摇。转移管至70℃20分钟。转移50-100μL的噬粒悬液至含有200μL的大肠杆菌Exp 505细胞(OD600=1.0)的微量管中。在37℃孵育悬液45分钟。将100μL细胞悬液涂布至LBkan50培养基(LB培养基,含有卡那霉素50μg/mL)中。在37℃孵育平板8-12小时。观察平板的集落。生长的任何集落都含有纯的噬粒。挑出集落,在小的(3-10mL)液体培养中生长8-12小时。培养基是液体LBkan50。 
活性检验:将1.0mL的液体培养物转移至无菌的微量管中。在13200rpm(16000g′s)离心1分钟。弃去上清液,加入200μL磷酸盐缓冲液,pH 6.2。在冰上使用微型探头超声破碎5至10秒。加入200μL合适的底物,轻轻混合,在37℃孵育1.5-2小时。还要有仅含有缓冲液和底物的阴性对照。向悬液中加入1.0mL无水乙醇(200proof)并混合。在13200rpm离心10分钟。观察上清液的颜色。显色的量可有变化,但显色超过对照的任何管都被认为是阳性,也就是有活性。如果需要,在此步骤中可使用分光光度计。(对于Azo-木聚糖,Megazyme,在590nm读数。) 
来自相同文库的纯克隆的RFLP(限制性片段长度多形性分析):将1.0mL的液体培养物转移至无菌的微量管中。13200rpm(16000g′s)离心1分钟。根据QIAprep spinmini kit(Qiagen)的实验手册进行质粒分离,使用40μL纯净水(holy water)作为洗脱缓冲液。将10μL的质粒DNA转移至无菌的微量管中。加入1.5μL缓冲液3(New England Biolabs)、1.5μL 100X BSA溶液(New England Biolabs)和2.0μL holy water。向其中加入1.0μL Not 1和1.0μL Pst 1限制性核酸内切酶(New England Biolabs)。37℃孵育1.5小时。加入3.0μL 6X上样缓冲液(Invitrogen)。将15μL的被消化的样品在1.0%琼脂糖凝胶上于120伏电泳1-1.5小时。用凝胶成像仪观察凝胶。在所有克隆上使用不同消化模式进行序列分析。 
表6描述了本发明的示范性酶的多种特性。 
表6 
#最适pH或最适温度通过初始速率来测定,使用AZO-AZO-木聚糖作为底物 
##热稳定性,酶保留显著活性(大约>50%)的时间 
***面团改进 
****为动物饲料应用进行耐热进化的GSSMTM亲代 
*****引入N35D突变以增加低pH活性——根据公共常识——在pH4时突变酶的相对活性显著增加 
******面团改进 
实施例2:GSSM TM 筛选耐热突变体
下面的实施例描述了筛选耐热酶的示范性方法。 
母板(Master Plates):通过标记96孔板并向每个孔中加入200μL等份的LB Amp100(每个96孔板需要~20ml),为集落拣选器(colony picker)制备母板。在平板从拣选器返回后,从A板的第6排中去掉培养基。代替以SEQ ID NO:189的接种物。置于湿润的37℃孵箱过夜。 
检测板:用大头针将培养物刮入新鲜的96孔板(200μL/孔LB Amp100)中。去掉塑料盖,替换以可透气封条(Gas Permeable Seal)。置于潮湿的孵箱中过夜。去掉封条,换上塑料盖。在桌式离心机将培养物离心使其下沉,3000rpm,10分钟。倒转在纸巾上去掉上清液。向每个孔中加入45μL等份的Cit-Phos-KCl缓冲液,pH 6。将塑料盖换成铝的平板封条。用辊子把封条封好。重悬的细胞在平板震荡器上在6-7级振摇~30秒。 
将96孔板置于80℃孵箱中20分钟。不要堆积。此后,立即将平板移到冰水上冷却几分钟。去掉铝封条,换上塑料盖。加入30μL的2%Azo-木聚糖。如前在平板震荡器上混合。在潮湿的孵箱中37℃孵育过夜。 
向每孔中加入200μL乙醇,用吸液管上下吹打几次进行混合。每次更换枪头,或者,在乙醇清洗液中浸洗,将液体引流至纸巾上干燥。3000rpm离心10分钟。移出100μL上清液至新鲜的96孔板中。在OD590读数。 
实施例3:耐热突变体的命中检验的GSSM TM 测定
下面的实施例描述了测定耐热酶的示范性方法。 
将克隆用大头针刮入或挑入进两个96孔板(200μl/孔LB Amp100)中。去掉塑料盖,换上可透气封条(Gas Permeable Seal)。置于潮湿的孵箱中过夜。去掉封条,换上塑料盖。用大头针将克隆刮入固体琼脂上。用桌式离心机将培养物离心使其下沉,3000rpm,10分钟。倒转至纸巾上去掉上清液。向每个孔中加入25μl等份的BPER/溶菌酶/脱氧核糖核酸酶溶液(见下)。重悬的细胞在平板震荡器上在6-7级振摇~30秒。 
将平板在冰上孵育15分钟。向每个孔中加入20μL的Cit-Phos-KCl缓冲液,pH 6。将塑料盖换为铝的平板封条。用辊子把封条封好。在平板震荡器上在6-7级混合~30秒。 
将一个96孔板置于80℃孵箱中20分钟,另一个在37℃。不要堆积。立即将平板移至冰水上冷却几分钟(如果需要,使用大的塑料托盘)。去掉铝封条。加入30μL2%Azo-木聚糖。用可透气的塑料封条封口。如前在平板震荡器上混合。将一组37℃和80℃平板孵育在潮湿的孵箱中,37℃孵育2小时,另一组4小时。 
孵育后,将平板置于室温~5分钟。向每孔中加入200μL乙醇,用吸液管上下吹打两次进行混合。不要每次更换枪头,而是在乙醇冲洗液中浸洗,将液体引流至 纸巾上干燥。但是,对每个克隆要使用一组新的枪头。3000rpm离心10分钟。移出100μL的上清液至新鲜的96孔板中。在OD590读数。 
BPER/溶菌酶/脱氧核糖核酸酶溶液(总共4.74mL): 
4.5mL BPR 
200μL 10mg/mL溶菌酶(在pH 6的Cit-phos-缓冲液中新鲜配制) 
40μL 5mg/mL DNaseI(在pH 6的Cit-phos缓冲液中新鲜配制) 
实施例4:用小麦阿拉伯糖基木聚糖作为底物的木聚糖酶分析
下面的实施例描述了示范性的木聚糖酶分析,这可用来例如确定一种酶是否在本发明的范围内。 
SEQ ID NOS:11、12、69、70、77、78、113、114、149、150、159、160、163、164、167、168、181、182、197和198在pH 8(Na-磷酸盐缓冲液)和70℃,应用小麦阿拉伯糖基木聚糖作为底物来进行分析。酶的表征如表7中所示。 
表7 
*基于向每个样品中加入1mL水。 
单位(Units)是指每分钟释放出的木糖的微摩尔数,基于还原糖分析(reducing sugarassay)。 
实施例5:产生本发明的示范性木聚糖酶
下面的实施例描述了使用基因位点饱和诱变(GSSMTM)技术产生本发明的示范性木聚糖酶,称为“9x”变异体或突变体(SEQ ID NO:377中所示的核酸,SEQID NO:378中所示的多肽序列)。 
GSSMTM被用来在示范性的SEQ ID NO:190——“野生型”木聚糖酶(由SEQ ID NO:189编码)——中建立点突变的综合文库(comprehensive library)。上面所述的木聚糖酶耐热性筛选鉴定出了9个单点氨基酸突变体(图6A)(D8F,Q11H,N12L,G17I,G60H,P64V,S65V,G68A和S79P),它们相对于野生型酶具有改善的 耐热性(在80℃热处理20分钟后测定)。野生型酶和所有9种单点氨基酸突变体在大肠杆菌中被产生,并应用N-末端六聚组氨酸标志物进行纯化。标志物并没有在活性上造成显著的差异。 
图6图解了通过SEQ ID NO:190“野生型”酶(由SEQ ID NO:189编码)的基因位点饱和诱变(GSSMTM)产生的“变异体9x”的9个单点氨基酸突变,或如SEQ ID NO:378(由SEQ ID NO:377编码)所示。图6A是一个示意图,图示了“野生型”基因(SEQ ID NO:190,由SEQ ID NO:189编码)的耐热点突变的位置、编号以及由此造成的氨基酸变化。基因中的每个氨基酸位点都可产生突变的可含有所有64种密码子的文库(~13,000突变体)被产生,并从中筛选出耐热性增加的突变。通过将所有9种单点突变合并入一个酶中可产生“9X”变异体。通过DSC对每种突变酶测定相应的熔化温度转变中点(Tm),“9X”(SEQ ID NO:378)变异体显示在右侧。图6B图示了“野生型”(SEQ ID NO:190)和“9X”(SEQ ID NO:378)“变异体/突变体”酶的去折叠,这是通过DSC以1℃/min的扫描速率监测的。扣除了基线值的DSC数据就蛋白浓度进行标准化。 
木聚糖酶活性测定 
使用400μL的2%Azo-木聚糖作为底物,在550μL的CP(柠檬酸盐-磷酸盐)缓冲液中,pH 6.0,在指定的温度下测定酶活性。使用50mM Britton和Robinson缓冲溶液(pH 3.0、5.0、6.0、7.0、8.0和9.0)测定作为pH的函数的活性值,该缓冲液的制备是通过混合0.1M磷酸溶液、0.1M硼酸和0.1M乙酸的溶液,然后用1M氢氧化钠调整pH。通过加入50μL的0.1mg/ml的纯化的酶而启动反应。从0至15分钟取时间点,在其时将50μL的反应混合物加入至200μL的沉淀溶液(100%乙醇)中。当获取所有时间点时,混合样品,孵育10分钟,3000g4℃离心10分钟。上清液(150μL)被等份加入新的96孔板中,在590nm测定吸光度。A590值与时间作图,从直线的斜率确定初始速率。 
差示扫描量热法(DSC) 
使用6100Nano II型DSC仪(Calorimetry Sciences Corporation,American Fork,UT)进行热量测定,采用DSCRun软件包进行数据采集,CpCalc进行分析,CpConvert将微瓦转变成摩尔热容,CpDeconvolute进行去卷积。使用1mg/ml重组蛋白在20mM磷酸钾(pH 7.0)和100mM KCl中以1℃/min的扫描速率进行分析。在所有DSC试验中保持5atm的恒压以防止溶液在加热过程中可能的脱气。在实验前,使用充满缓冲液的两个小室,常规地记录仪器的基线。首轮冷却后立即再加热量热计小室中的溶液,检测热受激转变的可逆性。 
耐热性的测定 
所有酶在80℃、20mM磷酸钾(pH 7.0)和100mM KCl中分析耐热性。在薄壁管中在80℃加热酶0、5、10或30分钟,并在冰上冷却。使用Azo-木聚糖作为底物,使用上述测量活性的测定方法测定残余活性。 
多糖的指纹识别 
通过应用了糖类凝胶电泳的多糖分析(PACE),确定多糖指纹图。山毛榉材木聚糖(0.1mg/mL,100μL,Sigma,Poole,Dorset,UK)或木聚寡糖(1mM,20μL,Megazyme,Wicklow,Ireland)用酶(1-3μg)在250μL的总体积中处理16小时。反应在0.1M醋酸铵pH 5.5中缓冲。没有底物或酶的对照在相同的条件下执行反应,以鉴定酶中的任何非特异的化合物、多糖/寡糖或标记试剂。通过煮沸20分钟终止反应。对于每个条件单独执行反应至少2次。如所述使用ANTS(8-氨基萘-1,3,6-三磺酸,Molecular Probes,Leiden,The Netherlands)进行衍化、电泳和成象(Goubet,F.,Jackson,P.,Deery,M.和Dupree,P.(2002)Anal.Biochem.300,53-68)。 
适合度(fitness)计算 
对于指定的酶变异体,n,适合度(Fn)的计算通过平均加权相对于每个参数在所有变异体中的最大差异的变性温度转变中点(Tm)增加量和酶活性增加(或减少)量:Fn=FTn+FVn,其中FTn=变异体的Tm适合度因子,FVn=变异体的活性适合度因子。每种参数(Tm和活性)的适合度因子都是相对于所有变异体的Tm或速率的最大差异。FTn=(Tmn-TmL)/(TmH-TmL)其中Tmn是指定变异体,n,的Tm,TmL是所有变异体中的最低Tm,TmH是所有变异体中最高的Tm,FVn=(Vn-VL)/(VH-VL),其中Vn是指定变异体,n,的相对速率,VL是所有变异体中的最低速率,VH是所有变异体中的最高速率。 
通过GSSMTM法的进化 
GSSMTM技术被用来建立本发明的示范性木聚糖酶SEQ ID NO:190(由SEQ IDNO:189编码)的点突变的综合文库;包括本发明的示范性木聚糖酶SEQ ID NO:378(由SEQ ID NO:377编码)。上述的木聚糖酶耐热性的筛选鉴定了9个单点氨基酸突变体(图6A),D8F,Q11H,N12L,G17I,G60H,P64V,S65V,G68A和S79P,它们相对示范性的“野生型”酶SEQ ID NO:190(由SEQ ID NO:189编码)具有改善的耐热性,如在80℃热处理20分钟后测定的。野生型酶和所有9种单点氨基酸突变体在大肠杆菌中产生,并使用N-末端六聚组氨酸标志物纯化。标志物并没有导致明显的活性差异。 
为了确定单个氨基酸突变对酶活性的影响,所有9个突变体被纯化,其木聚糖酶活性(在野生型的最适温度70℃的初始速率)与示范性的SEQ ID NO:190“野生型”酶进行比较。野生型的酶活性(校正过的初始速率为1.0)与D8F、N12L、G17I、 G60H、P64V、S65V、G68A和S79P突变体(相对的初始速率分别为0.65、0.68、0.76、1.1、1.0、1.2、0.98和0.84)可以相比,这证实了这些突变不会明显改变酶的活性。初始速率被测定3次或更多次,方差一般小于10%。与这8个突变体相比,对于最耐热的单点突变,Q11H(相对初始速率为0.35)观察到了酶活性的显著降低。 
“野生型”和耐热的单点氨基酸突变酶的解链温度(Tm) 
纯化的SEQ ID NO:190“野生型”木聚糖酶和9个耐热单点氨基酸突变体使用差示扫描量热法(DSC)进行分析。野生型酶由明显的聚集现象,其证据是在DSC迹线中有由于其热变性而产生的肩部,见图6B。进化的突变酶没有显示聚集的迹象。对于所有的酶,热诱发的变性是不可逆转的,在第二次扫描样品时没有观察到可辨别的转变。由于变性的不可逆性,仅可计算表观Tm(解链温度)(其描述在例如Sanchez-Ruiz(1992)Biophys.J.61:921-935;Beldarrain(2000)Biotechnol.Appl.Biochem.31:77-84)。野生型酶的Tm为61℃,而所有点突变的Tm都增加,范围从64℃至70℃(图6A)。相对于野生型,Q11H突变导致了最大的增加量(Tm=70℃),然后是P64V(69℃)、G17I(67℃)和D8F(67℃)。 
″9X″组合的GSSMTM示范性酶SEQ ID NO:378 
“9X”酶(SEQ ID NO:378)是通过组合位点定向诱变产生的9个耐热突变体的单点改变(图6A)而构建的。“9X”(SEQ ID NO:378)在大肠杆菌中被表达,被纯化至均质。进行DSC以确定解链温度。“9X”酶的Tm较SEQ ID NO:190“野生型”酶高34度,证明其热稳定性发生了显著的变化(图6B)。 
为了评价组合的突变和升高的解链温度对酶生物化学特性的影响,pH和温度的曲线图被构建并与SEQ ID NO:190“野生型”酶相比。图7图示了“野生型”和“进化的”9X突变酶的生物化学特征。图7A图示了野生型和进化的9X突变酶的活性的pH依赖性。在每个pH在37℃测定木聚糖酶活性,初始速度与在590nm的吸光度进行作图以确定初始速率。图7B图示了野生型和进化的9X突变酶的活性的温度依赖性。在25-100℃的温度范围内,在pH6.0测量野生型和9X突变酶的最适温度,这是基于在5分钟内测定的初始速率。图7C图示了野生型和进化的9X突变酶的热稳定性。通过首先在每个指定的温度加热酶5分钟,然后冷却至室温,测定残余活性(37℃的初始速率,pH 6.0),从而测定了野生型和进化的9X突变酶的活性的热依赖性。对于所有的实验,初始速率测量2次或更多次,方差小于10%。 
SEQ ID NO:190和SEQ ID NO:378(“9X”突变体)酶具有可相比的pH/活性概貌,在pH5和6之间(图7A)具有最高的活性。两种酶在70℃具有相似的初始速率/最适温度,但SEQ ID NO:190,“野生型”在更低的温度(25-50℃)相对于“9X”突变体具有更高的活性,而SEQ ID NO:378(“9X”突变体)在底物存在的情况下,可保留其超过60%的活性,直至100℃(通过初始速率测定)(图7B)。SEQ ID NO:190,“野生型”酶的活性在高于70℃的温度下检测不到。 
为了确定9个组合突变对酶耐热性的影响,测定了残余活性并与SEQ ID NO:190,“野生型”酶比较。通过在每个温度(37、50、60、70、80和90℃)热处理5分钟,然后在37℃下测定活性来测定残余活性。SEQ ID NO:190在70℃以上完全被灭活,而进化的9X突变体在70、80,即使在90℃加热后仍显示明显的活性(图7C)。而且,尽管野生型酶随温度的增加活性降低,但9X变异体在加热至60℃的温度仍有点活性。 
使用GeneReassemblyTM技术产生组合的GSSMTM变异体 
为了鉴定与额外构建的SEQ ID NO:378(“9X”变异体)相比,具有最高的耐热性和活性的9个单点氨基酸突变的组合变异体,所有可能的突变组合(29)的GeneReassemblyTM文库(美国专利6,537,776)被构建和筛选。使用耐热性为筛选标准,9种突变的33种独特组合如原始9X变异体一样被鉴定。进行第二次筛选以选择较进化的9X具有更高活性/表达的变异体。这种筛选产生了10个变异体,其序列具有多种组合的6个和8个之间的初始单突变,如在图8A中所示。图8图示了使用GeneReassemblyTM技术鉴定的组合变异体。图8A图示了9个GSSMTM点突变的所有可能组合的GeneReassemblyTM文库,它被构建和用来筛选具有改善的耐热性和活性的变异体。获得了包括9X变异体的11个变异体。如在图中显示,变异体具有多种组合的6、7、8或9个点突变。通过DSC测定的每个变异体的熔化温度转变中点(Tm)显示在右侧。图8B图示了与野生型相比在最适温度(70℃)和pH6.0处6X-2和9X变异体的相对活性(在5分钟的时间内测定的初始速率)。误差线显示了3次测量的初始速率的范围。 
每个组合变异体的解链温度(Tm)较野生型至少高28℃(图8A),所有再装配的变异体显示较9X酶更高的相对活性。特别是一种变异体,6X-2的活性高于野生型酶,也明显高于9X酶(1.7倍)(图8B)。再装配的变异体的序列比较鉴定了增加热稳定性(>20度)所需的至少6个突变。在初始的热稳定性筛选中发现的所有33个独特的变异体包含有Q11H和G17I突变,证明了其对耐热性的重要性。 
分析野生型和变异体的多糖产物指纹 
由“野生型”、6X-2和9X变异体产生的产物通过应用糖类凝胶电泳的多糖分析(PACE)来进行比较。测试了木聚糖酶对不同的底物(寡糖和多糖)的水解。3种被测试的木聚糖酶的消化产物非常相似,如图9中所图示。所有三种酶都将(Xyl)6和(Xyl)5主要水解为(Xyl)3和(Xyl)2,(Xyl)4被水解为(Xyl)2(图9A)。仅观察到少量的(Xyl)3水解成(Xyl)2和Xyl,表明(Xyl)3是酶的相对弱的底物。对(Xyl)2没有检测到活性。山毛榉材木聚糖含有葡萄糖醛酸残基,它被所有三种酶主要水解成(Xyl)2和(Xyl)3,但也检测到迁移到寡木聚糖带之间的其他带(图9B)。在PACE分析中,取决于糖的组成和聚合程度,每种寡糖具有特异的迁移度(Goubet,F.,Jackson, P.,Deery,M.和Dupree,P.(2002)Anal Biochem.300,53-68),因此,这些带很可能对应于寡葡萄糖醛酸基木聚糖。因此,被进化的酶保留了“野生型”酶的底物特异性。 
如上所提到的,图9图示了“野生型”SEQ ID NO:190(由SEQ ID NO:189编码)、6X-2(SEQ IDNO:380,由SEQ ID NO:379编码)和SEQ IDNO:378(“9X”突变体)酶变异体的产物指纹,这是通过PACE测定的。图9A图示了“野生型”和变异酶水解寡木聚糖(Xyl)3、(Xyl)4、(Xyl)5和(Xyl)6后获得的指纹。对照泳道中含有在缺少酶的分析条件下孵育的寡糖。图9B图示了在野生型和变异酶水解山毛榉材木聚糖后获得的指纹。标准品含有(Xyl)2、(Xyl)3、(Xyl)4。所有测定在37℃和pH5.5进行。 
实验室基因进化策略的组合被用来迅速地产生高度活性、热稳定的木聚糖酶,它们可被优化以适应大量工业市场应用中的工艺。GSSMTM方法被用来扫描示范性的“野生型”木聚糖酶SEQ ID NO:190(由SEQ ID NO:189编码)的整个序列,鉴定出可改善其耐热性的9个点突变。尽管对酶的水解产物的概貌没有明显的作用,如图9中所图示,但向蛋白序列中引入9种突变可在SEQ ID NO:190(“野生型”)的最适温度——70℃引起酶的比活的中度降低,见图9B。使用GeneReassemblyTM法产生9种单点氨基酸突变的组合文库,这种活性的降低可被克服。通过筛选GeneReassemblyTM文库,获得了活性超过“9X”变异体的10个热稳定变异体(Tm在89℃和94℃之间)。6X-2变异体(SEQ ID NO:380,由SEQ ID NO:379编码)是特别值得注意的,其Tm为90℃,酶的比活超过野生型,产物指纹未改变,并可与SEQ ID NO:190(“野生型”)相比。据我们了解,从这些变异体获得的Tm变化是定向进化技术应用所报道的最高的增加量。 
与SEQ ID NO:190(“野生型”)相比,SEQ ID NO:380(6X-2变异体)包括下面的改变:D8F、Q11H、G17I、G60H、S65V和G68A。与“野生型”SEQ ID NO:189相比,SEQ ID NO:379包括下列的核苷酸改变:位点22至24的核苷酸为TTC,位点31至33的核苷酸为CAC,位点49至51的核苷酸为ATA,位点178至180的核苷酸为CAC,位点193至195的核苷酸为GTG,位点202至204的核苷酸为GCT。 
为了将组合式混合(combinatorial mixing)的效率与引入点突变得到所需的表现型进行比较,对每个突变体计算适合度参数,该参数合并了对酶活性和热稳定性改变的贡献。如在此所述,术语适合度不是一个可与其它酶比较的客观测量指标,但是它可评估这种特定的木聚糖酶的定向进化的成功程度。由于酶适合度F是通过对这组变异体的Tm和酶活性的改变进行平均加权计算出的,因此最大的适合度容许值为2(FT≤1和FV≤1,见上)。换句话说,如果具有最佳活性的变异体也具有最高的Tm,其适合度值将为2。6X-2变异体(SEQ ID NO:380,由SEQ IDNO:379编码)具有接近2的适合度值(见图10B),它最接近具有热稳定性和酶活性的最佳可能组合。赋予最佳适合度值的单点突变是S65V。尽管S65V突变体的Tm 低于Q11H突变体(分别为66℃和70℃),但它具有更高的适合度值,因为其比活性相对于野生型是不降低的。 
图10A是一个示意图,图示了通过GSSMTM进化获得的相对于“野生型”的热稳定性(由Tm表示)改善的水平。具有最高热稳定性的单点氨基酸突变体和组合变异体(分别为Q11H和“9X”(SEQ ID NO:378))被显示,并与野生型进行比较。图10B图示了通过结合GSSMTM和GeneReassemblyTM技术获得的酶改善的“适合度图”。使用公式F=FT+FV确定适合度,此适合度(F)是通过平均加权热稳定性适合度(FT)和相对活性适合度(FV)来计算的,如上所述。显示了赋予最高适合度的点突变(S65V)。组合所有9种点突变也可改善适合度(SEQ ID NO:378,“9X”变异体)。但,通过将GSSMTM和GeneReassemblyTM方法组合起来,可获得适合度的最大改善,获得最佳的变异体,6X-2(SEQ ID NO:380)。 
GeneReassemblyTM方法也能鉴定出对于改善的热稳定性似乎是绝对需要的重要残基。两个关键的残基,Q11H和G17I,存在于所有基于耐热性而鉴定出的GeneReassemblyTM变异体中(见图6A)。蛋白热稳定性的结构决定因素已经被研究,几种理论也已经被记录入文献中,例如Kinjo(2001)Eur.Biophys.J.30:378-384;Britton(1999)J.Mol.Biol.293:1121-1132;Ladenstein(1998)Adv.Biochem.Eng.Biotechnol.61:37-85;Britton(1995)Eur.J.Biochem.229:688-695;Tanner(1996)Biochemistry 35:2597-2609;Vetriani(1998)Proc.Natl.Acad.Sci.USA95:2300-2305。氢键结合方式、离子相互作用、疏水堆积和表面环结构的长度减小都是关键因素,即使每种因素对蛋白稳定性的作用还未完全阐明。假定通过检测所有可能的单氨基酸取代而鉴定出的最有益的点取代的大多数都涉及相对极性的、带电荷的或小的(甘氨酸)残基代替大得多的疏水残基,那么推测疏水相互作用在增强这种蛋白的热稳定性方面具有最重要的影响。即使很好地了解了可以增强耐热性的最佳相互作用,预测在哪里制造突变以导入这种相互作用仍不是简单的。但应用了GSSMTM方法的非推理方法,可迅速地对蛋白结构内的所有位点上的所有侧链进行采样。这样的方法可发现没有被预见为能够导入功能性相互作用的氨基酸取代。 
实施例6:用本发明的木聚糖酶预处理纸浆
在一个方面,本发明的木聚糖酶可用来预处理纸浆。本实施例描述了一种示范性的可通用的筛选程序,它可以用来确定一种木聚糖酶是否可用于预处理纸浆;例如,当用来预处理牛皮纸纸浆时,它是否减少漂白化学物质(例如,二氧化氯,ClO2)的使用。 
筛选程序具有两个可供选择的参数:在氧脱木素步骤(an oxygendelignification)后木聚糖酶处理的效果(post-O2纸浆);和木聚糖酶在不包括氧脱木素步骤的过程中的效果(pre-O2粗浆,即pre-O2 brownstock)。 
对于纸浆处理条件,模拟工业情况下的工艺条件,例如,工厂:pH 8.0;70℃;60分钟的持续时间。 
该过程用示意性地描绘在图11的流程图中。 
通过生物化学测试鉴定出在这些条件下有活性的20个木聚糖酶。在这20个木聚糖酶中,6个能够明显地减少对ClO2的需求,当它们在化学漂白之前用来预处理牛皮纸纸浆时。这6个是:SEQ ID NO:182(由SEQ ID NO:181编码);SEQ ID NO:160(由SEQ ID NO:159编码);SEQ ID NO:198(由SEQ ID NO:197编码);SEQID NO:168(由SEQ ID NO:167编码);SEQ ID NO:216(由SEQ ID NO:215编码);SEQ ID NO:260(由SEQ ID NO:259编码)。其它的也显示一些活性,但不太佳。木聚糖酶SEQ ID NO:182(由SEQ ID NO:181编码)和SEQ ID NO:160(由SEQ IDNO:159编码)是模块化的(modular),除了木聚糖酶催化结构域以外,还含有一个糖类结合模块。已经证明,这2种木聚糖酶的仅含有催化结构域的的截短的衍生物在应用中更为有效。最佳的木聚糖酶,SEQ ID NO:160(由SEQ ID NO:159编码)被更全面地研究。结果总结如下: 
-用2单位/g的SEQ ID NO:160(由SEQ ID NO:159编码)预处理post-O2云杉木/松木/冷杉(SPF)纸浆,可减少随后ClO2的用量22%,达到65%GE亮度; 
-用0.5单位/g的SEQ ID NO:160(由SEQ ID NO:159编码)预处理pre-O2粗浆SPF纸浆可减少随后ClO2的用量13%,达到65%GE亮度; 
-用0.5单位/g的SEQ ID NO:160(由SEQ ID NO:159编码)预处理pre-O2白杨木纸浆可减少随后ClO2的用量至少22%; 
-用0.5单位/g的SEQ ID NO:160(由SEQ ID NO:159编码)预处理pre-O2花旗松/铁杉纸浆可减少随后ClO2的用量至少22%; 
-在应用的处理条件下,当与已经在相同卡伯因子(kappa factor)下被漂白但未用木聚糖酶处理的纸浆相比时,木聚糖酶处理引起的产量减小不超过0.5%; 
-用SEQ ID NO:159、160处理post-O2 SPF纸浆的最佳条件为:pH 6-7,酶剂量为0.3单位/g,处理时间为20-25分钟。在这些条件下,ClO2用量减少28%,并可能达到69%GE的亮度。 
在进一步的实验中: 
SEQ ID NO:160(XYLA),由SEQ ID NO:159编码=全长的野生型木聚糖酶: 
·XYLA(E.c)=大肠杆菌中表达的SEQ ID NOS:159、160的截短的变异体,仅含有木聚糖酶催化结构域 
·XYLA(P.f)=同上,但在荧光假单胞菌(P.fluorescens)中表达 
SEQ ID NO:182(XYLB,由SEQ ID NO:181编码)=又一个全长的野生型木聚糖酶: 
·XYLB(E.c)=大肠杆菌中表达的截短的变异体等 
·XYLB(P.f)=同上,但表达在荧光假单胞菌中 
主要的木聚糖酶对Pre-O 2 粗浆的剂量反应数据
木聚糖酶阶段(X-阶段)的条件如下: 
pH 8 
温度70℃ 
时间60分钟 
卡伯因子0.24 
对于无酶的对照,卡伯因子为0.30 
结果显示,对于木聚糖酶处理的样品,在更低的二氧化氯(ClO2)进料量(charge)下(Kf 0.24相对于Kf 0.30),亮度呈剂量依赖性的增加。 
在各种情况下,截短的衍生物都看上去较全长的木聚糖酶更有效。最佳的木聚糖酶剂量似乎在0.6至0.7U/g纸浆左右。 
用最佳的4种木聚糖酶预处理洲际Pre-O 2 粗浆(Intercontinental Pre-O 2  Brownstock)
在D0测定ClO2的剂量反应 
实验提要 
·Pre-O2粗浆 
о初始的卡伯值为31.5 
·X阶段条件 
о木聚糖酶进料量0.7U/gm 
о温度70℃ 
оpH 8 
о处理时间1小时 
о纸浆浓度10% 
·漂白次序XDEp 
о卡伯因子0.22、0.26和0.30(纸浆的%D:2.63、3.12和3.60) 
3-阶段漂白次序后的最终亮度与卡伯因子(ClO 2 进料量)的对比: 
·XYLB-在61.5的最终亮度,X-阶段可使ClO2的用量减少3.89千克/吨纸浆。 
·XYLB(E.c)-在61.5的最终亮度,X-阶段可使ClO2的用量减少4.07千克/吨纸浆。 
·XYLA-在61.5的亮度,X-阶段可使ClO2的用量减少4.07千克/吨纸浆。 
·XYLA(E.c)-在61.5的最终亮度,X-阶段可使ClO2的用量减少4.90千克/吨纸浆。 
在D 0 测定ClO 2 的剂量反应:
木聚糖酶0.7U/g,pH 8.0,70℃,1hr 
纸浆:Pre-O2粗浆,初始卡伯值31.5 
ClO2节省的百分比对工业来说不太重要。最关心的是每吨OD纸浆所需的ClO2的磅数(lbs)。当人们认为,就被节省的ClO2的磅数而言,与较低初始卡伯值的纸浆的较高百分比例的降低相比,高初始卡伯值的粗浆的较低百分比例的节省更有价值,尽管前者需要更低的ClO2总进料量来达到目标亮度的时候,这就变得有意义了。 
对于漂白的对照纸浆,亮度、产量和卡伯因子之间的关系:
结果显示,用增加剂量的ClO2漂白可以达到更高的目标亮度,也引起纸浆产量的损失增加。这是一个问题,因为在此工艺的这个阶段,纸浆的价值为每吨大约为$400,纤维素的丢失会耗费金钱。 
木聚糖酶(例如,本发明的木聚糖酶)的一个好处是使用更低的ClO2剂量,这可降低产量的损失,只要木聚糖酶的作用本身不抵消收益。 
用木聚糖酶XYLB(P.f)预处理Pre-O 2 粗浆的剂量反应数据:
实验提要 
·Northwood Pre-O2粗浆 
-初始卡伯值28.0 
-初始浓度32.46% 
-初始亮度28.37 
·X阶段的条件 
-木聚糖酶进料量0至2.70U/gm 
-温度58℃至61℃ 
-pH 8.2至8.5 
-处理时间1hr 
·漂白次序XDEp 
-卡伯因子0.24 
·对0.24和0.30之间的卡伯因子计算ClO2的节省 
本试验的目的是评价4种木聚糖酶中最佳的一种对未洗涤的SPF粗浆的作用。结果显示,对于用XYLB(E.c)处理的纸浆,最终亮度呈剂量依赖性的增加,在较低的Kf0.24和存在木聚糖酶时达到的亮度,渐近于在较高Kf0.30达到的亮度。 
木聚糖酶XYLB(E.c)的剂量和二氧化氯的节省(Pre-O 2 粗浆)之间的关系:
ClO2的节省,以%OD纸浆计算  ClO2的节省,以千克/吨纸浆计算   木聚糖酶剂量,U/gm
0.299%   2.99   0.31
0.363%   3.63   0.51
0.406%   4.06   0.71
0.439%   4.39   0.91
0.483%   4.83   1.26
0.523%   5.32   1.80
0.587%   5.87   2.70
最佳的木聚糖酶剂量在0.5和0.9U/gm之间 
最佳剂量的范围在0.5至0.9U/g。在这个剂量之上,每增加一单位木聚糖酶,节省量越来越小。以这种级别的剂量进行处理时,每吨纸浆二氧化氯剂量的减少量在商业上是很有意义的。 
3-阶段生物漂白程序
开发了一种3阶段生物漂白程序,它尽量模仿了纸浆漂白工厂中实际的漂白操作(图1)。这种漂白顺序称为(X)DoEp,其中X代表了木聚糖酶处理阶段,D代表二氧化氯漂白阶段,Ep代表了碱性过氧化物的提取阶段。在我们的应用测试中使用初始原料是南部软木牛皮粗浆(Southern Softwood Kraft Brownstock)(没有氧脱木素化)。在生物漂白分析中显示出高的减少漂白化学物质的潜力的最有效的木聚糖酶候选物也在两种硬木牛皮纸浆(枫木和白杨木)上进行了测试。在完成每一轮生物漂白后,随后的纸浆被用来生产TAPPI(Technical Association of Pulp and Paper Industries)-标准手抄纸。每种手抄纸的GE%亮度被测定,亮度值被用来指示在酶预处理阶段(X)中每种酶对纸浆的作用性能。 
结果:
在使用(X)DoEp生物漂白顺序筛选的大约110种木聚糖酶中,4种酶,即XYLA(P.f)、XYLB(P.f)、SEQ ID NO:216(由SEQ ID NO:215编码)、SEQ ID NO:176(由SEQ ID NO:175编码),显示了减少漂白化学物质的应用的最大潜能。XYLA(P.f)和XYLB(P.f)显示了同样的高性能(在4个表现良好者中是最佳的),而XYLA(P.f)较XYLB(P.f)显示了更好的pH耐受性。结果总结如下: 
·使用3阶段漂白顺序[(X)DoEp]可以达到60(GE%)的手抄纸亮度,其中用了下列的四种酶预处理南部软木牛皮粗浆,进料量也列在下面(pH=8,65℃和1h): 
оXYLA(P.f),0.55U/g纸浆 
оXYLB(P.f),0.75U/g纸浆 
оSEQ ID NO:215,216,1.80U/g纸浆 
оSEQ ID NO:175,176,1.98U/g纸浆 
·使用2U/g纸浆的XYLA(P.f)预处理南部软木牛皮粗浆,减少ClO2的使用达18.7%,达到的最终GE%亮度为61。 
·XYLA(P.f)在更高的pH下显示出良好的耐受性,当酶预处理阶段的pH=10时,节省了超过14%的化学物质。 
·使用2U/g纸浆的XYLB(P.f)预处理南部软木牛皮粗浆减少ClO2的使用达16.3%,达到的最终GE%亮度为60.5。 
·使用2U/g纸浆的XYLA(P.f)和XYLB(P.f)预处理白杨牛皮纸浆,减少ClO2的使用达大约35%,达到的最终GE%亮度为77。 
·使用2U/g纸浆的XYLA(P.f)和XYLB(P.f)预处理枫木牛皮纸浆,减少ClO2的使用达大约38%,达到的最终GE%亮度为79。 
·两个表现最佳的木聚糖酶,称为XYLA(P.f)和XYLB(P.f),是被截短的酶,其含有催化结构域,在荧光假单胞菌中产生。 
本发明已经就某些优选的方面进行了详述,但要理解的是,任何修饰和变化都包含在被描述和要求保护的精神和范围之内。 

Claims (17)

1.分离出的、合成的或重组的多肽,其具有木聚糖酶活性,其中该多肽由下列氨基酸序列组成: 
SEQ ID NO:190的氨基酸序列或其具有木聚糖酶活性的变体,其中所述变体选自下列的序列或突变组合:(a)SEQ ID NO:378;(b)D8F、Q11H、N12L、G17I、G60H、P64V、S65V和G68A;(c)D8F、Q11H、N12L、G17I、G60H、P64V、S65V和S79P;(d)D8F、Q11H、N12L、G17I、G60H、S65V、G68A和S79P;(e)Q11H、N12L、G17I、G60H、P64V、S65V、G68A和S79P;(f)D8F、Q11H、N12L、G17I、G60H、G68A和S79P;(g)D8F、Q11H、N12L、G17I、G60H、P64V、G68A和S79P;(h)D8F、Q11H、G17I、G60H、P64V、G68A和S79P;(i)D8F、Q11H、G17I、G60H、S65V、G68A和S79P;(j)SEQ ID NO:380;以及(k)Q11H、N12L、G17I、G60H、P64V和G68A。 
2.分离出的、合成的或重组的核酸,其由下列核酸组成: 
a),编码具有木聚糖酶活性的多肽的核酸,其中所述核酸由SEQ ID NO:189组成;或 
b),由与a)完全互补的序列组成的核酸。 
3.分离出的、合成的或重组的核酸,其由下列核酸组成: 
a),编码具有木聚糖酶活性的多肽的核酸,其中所述多肽由SEQ ID NO:190的氨基酸序列或其具有木聚糖酶活性的变体组成,其中所述变体选自下列的序列或突变组合:(a)SEQ ID NO:378;(b)D8F、Q11H、N12L、G17I、G60H、P64V、S65V和G68A;(c)D8F、Q11H、N12L、G17I、G60H、P64V、S65V和S79P;(d)D8F、Q11H、N12L、G17I、G60H、S65V、G68A和S79P;(e)Q11H、N12L、G17I、G60H、P64V、S65V、G68A和S79P;(f)D8F、Q11H、N12L、G17I、G60H、G68A和S79P;(g)D8F、Q11H、N12L、G17I、G60H、P64V、G68A和S79P;(h)D8F、Q11H、G17I、G60H、P64V、G68A和S79P;(i)D8F、Q11H、G17I、G60H、S65V、G68A和S79P;(j)SEQ ID NO:380;以及(k)Q11H、N12L、G17I、G60H、P64V和G68A;或 
b),由与a)完全互补的序列组成的核酸。
4.表达序列盒或载体,包含权利要求2或3所述的核酸。 
5.权利要求4所述的表达序列盒或载体,其中所述载体是克隆载体。 
6.转化的细胞,其包含: 
(a)权利要求2或3的核酸序列;或 
(b)权利要求4或5的表达序列盒或载体。 
7.下列(a)-(b)中任一项在制备转基因非人动物或转基因植物中的用途, 
(a)权利要求2或3的核酸序列;或 
(b)权利要求4或5的表达序列盒或载体。 
8.下列(a)-(b)中任一项在制备转基因种子中的用途, 
(a)权利要求2或3的核酸序列;或 
(b)权利要求4或5的表达序列盒或载体。 
9.蛋白制剂,包含: 
a)由权利要求4或5的表达序列盒或载体表达的多肽;或 
b)权利要求1所述的多肽。 
10.固定化的多肽,其中所述的多肽是: 
权利要求1所述的多肽。 
11.阵列或生物芯片,包含在权利要求10中所示的固定化的多肽,或者固定化的核酸,所述核酸包括权利要求2或3的核酸序列。 
12.制备抗木聚糖酶抗体的方法,包括给予非人动物权利要求1所述的多肽,其量足以产生体液免疫反应,由此产生抗木聚糖酶抗体。 
13.产生重组多肽的方法,包括步骤:(a)提供与启动子有效连接的核酸,其中所述的核酸是权利要求2或3的核酸;和(b)在允许表达多肽的条件下表达步骤(a)的核酸,由此产生重组的多肽。 
14.鉴定具有木聚糖酶活性的多肽的方法,包括步骤: 
(a)提供权利要求1所述的多肽; 
(b)提供木聚糖酶底物;和 
(c)将所述多肽与步骤(b)的底物接触,检测底物量的减少或反应产物量的增加,其中所述的底物量的减少或反应产物量的增加检测出具有木聚糖酶活性的多肽。 
15.鉴定木聚糖酶底物的方法,包括步骤: 
(a)提供权利要求1所述的多肽; 
(b)提供被测底物;和 
(c)将步骤(a)的多肽与步骤(b)的被测底物接触,检测底物量的减少或反应产物量的增加,其中所述的底物量的减少或反应产物量的增加鉴定被测底物为木聚糖酶的底物。 
16.确定被测化合物是否与多肽特异结合的方法,包括步骤: 
(A)(a)在允许核酸翻译为多肽的条件下表达核酸或含有核酸的载体,其中所述的核酸是权利要求2或3的核酸;(b)提供被测化合物;(c)将所述多肽与所述被测化合物接触;和(d)确定步骤(b)的被测化合物是否与所述多肽特异结合;或 
(B)(a)提供权利要求1所述的多肽;(b)提供被测化合物;(c)将所述多肽与所述被测化合物接触;和(d)确定步骤(b)的被测化合物是否与所述多肽特异结合。 
17.鉴定木聚糖酶活性的调节物的方法,包括步骤: 
(a)提供权利要求1所述的多肽; 
(b)提供被测化合物; 
(c)将步骤(a)的多肽与步骤(b)的被测化合物接触,并测量木聚糖酶的活性,将在所述的被测化合物存在的情况下测量的木聚糖酶活性与缺少所述的被测化合物时的活性作比较,通过其中的变化确定所述的被测化合物调节木聚糖酶的活性。 
CN201010268914.8A 2002-06-14 2003-06-16 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法 Expired - Lifetime CN101967490B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US38929902P 2002-06-14 2002-06-14
US60/389,299 2002-06-14

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA038191474A Division CN1675365A (zh) 2002-06-14 2003-06-16 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法

Publications (2)

Publication Number Publication Date
CN101967490A CN101967490A (zh) 2011-02-09
CN101967490B true CN101967490B (zh) 2014-07-16

Family

ID=29736623

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA038191474A Pending CN1675365A (zh) 2002-06-14 2003-06-16 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法
CN201010268914.8A Expired - Lifetime CN101967490B (zh) 2002-06-14 2003-06-16 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNA038191474A Pending CN1675365A (zh) 2002-06-14 2003-06-16 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法

Country Status (14)

Country Link
US (4) US7504120B2 (zh)
EP (4) EP2305820A1 (zh)
KR (2) KR20050010053A (zh)
CN (2) CN1675365A (zh)
AU (1) AU2003251549B2 (zh)
BR (2) BRPI0312121B1 (zh)
CA (1) CA2488916C (zh)
DK (2) DK2298904T3 (zh)
EA (1) EA200500019A1 (zh)
ES (1) ES2394708T3 (zh)
MX (1) MXPA04012614A (zh)
NZ (1) NZ537597A (zh)
WO (1) WO2003106654A2 (zh)
ZA (2) ZA200500171B (zh)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7504120B2 (en) 2002-06-14 2009-03-17 Verenium Corporation Xylanases, nucleic acids encoding them and methods for making and using them
WO2004097001A2 (en) 2003-04-29 2004-11-11 Genencor International, Inc. Novel bacillus 029cel cellulase
WO2006083240A2 (en) 2003-12-19 2006-08-10 Syngenta Participations Ag Microbially expressed xylanases and their use as feed additives and other uses
US8394435B2 (en) 2004-02-11 2013-03-12 Novozymes A/S Preparation of dough-based product
EP1718159B1 (en) * 2004-02-20 2009-09-02 Novozymes A/S Preparation of dough-based product
CN101023173B (zh) * 2004-03-25 2012-08-08 埃欧金生物制品公司 呈现出增加表达的修饰型木聚糖酶
US20100183695A1 (en) 2004-05-27 2010-07-22 John Knopf Cerberus/coco derivatives and uses thereof
EP1614747A1 (en) * 2004-07-06 2006-01-11 Gesellschaft für Biotechnologische Forschung mbH et al New esterases from rumen
US7024796B2 (en) * 2004-07-19 2006-04-11 Earthrenew, Inc. Process and apparatus for manufacture of fertilizer products from manure and sewage
US7685737B2 (en) 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
US7024800B2 (en) 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US20070084077A1 (en) * 2004-07-19 2007-04-19 Gorbell Brian N Control system for gas turbine in material treatment unit
JP4836701B2 (ja) * 2005-07-26 2011-12-14 花王株式会社 アルカリキシラナーゼ
US20070163316A1 (en) * 2006-01-18 2007-07-19 Earthrenew Organics Ltd. High organic matter products and related systems for restoring organic matter and nutrients in soil
US7610692B2 (en) 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
EP3406621A1 (en) 2006-02-14 2018-11-28 BP Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
WO2007115391A1 (en) 2006-04-12 2007-10-18 National Research Council Of Cananda Modification of xylanases to increase thermophilicity, thermostability and alkalophilicity
EP2617814B1 (en) * 2006-09-21 2015-11-18 BASF Enzymes LLC Phytases, nucleic acids encoding them and methods for making and using them
CA2663094C (en) * 2006-09-29 2016-03-22 Novozymes A/S Xylanases for animal feed
EP2708602B1 (en) 2007-10-03 2019-02-27 BP Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
BRPI0820647A8 (pt) 2007-11-30 2017-06-06 Novozymes As Construção de ácido nucleico, célula microbiana hospedeira recombinante, métodos para produzir o polipeptídeo tendo atividade de alfa-larabinofuranosidase, e para degradar um material 5 contendo xilano
CN101932704A (zh) 2007-12-05 2010-12-29 诺维信公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
WO2009146464A2 (en) * 2008-05-30 2009-12-03 Edenspace Systems Corporation Methods and compositions for modifying levels of lignin and increasing the digestibility of cellulose by the recombinant overexpression of lignocellulolytic enzymes
WO2010006152A2 (en) * 2008-07-09 2010-01-14 The Board Of Regents For Oklahoma State University Thermocellulases for lignocellulosic degradation
TWI466680B (zh) * 2008-08-01 2015-01-01 Oncotherapy Science Inc Melk抗原決定位胜肽及含此胜肽的疫苗
KR101018790B1 (ko) * 2008-08-14 2011-03-03 한국화학연구원 자일라나아제를 생산하는 신규한 페니바실러스 sp. HPL-001 균주, 이로부터 분리한 신규한 자일라나아제 효소 및 이의 생산 방법
US8765438B2 (en) 2008-12-23 2014-07-01 Dupont Nutrition Biosciences Aps Polypeptides with xylanase activity
US8623629B2 (en) 2008-12-23 2014-01-07 Dupont Nutrition Biosciences Aps Polypeptides with xylanase activity
WO2010083518A2 (en) * 2009-01-19 2010-07-22 The Board Of Regents For Oklahoma State University Thermohemicellulases for lignocellulosic degradation
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
US20110108222A1 (en) * 2009-11-11 2011-05-12 International Paper Company Effect of low dose xylanase on pulp in prebleach treatment process
ES2533536T3 (es) * 2009-11-19 2015-04-10 Solis Biodyne Oü Composiciones para aumentar la estabilidad y actividad de polipéptidos, y métodos relacionados
CA2783418C (en) * 2009-12-09 2019-08-13 Novozymes A/S Methods of producing gh8 xylanase variants
EP2336152B1 (en) 2009-12-21 2014-08-13 Süd-Chemie IP GmbH & Co. KG Thermostable xylanase for the selective hydrolysis of pentose-containing polysaccharides
TWI485245B (zh) 2010-01-25 2015-05-21 Oncotherapy Science Inc 經修飾之melk胜肽及含此胜肽之疫苗
MY163622A (en) 2010-02-12 2017-10-13 Kemira Oyj Method for removing ink from paper
CN102286447B (zh) * 2010-06-18 2013-06-05 中国科学院上海生命科学研究院 一种新型内切木聚糖酶及其编码基因和应用
US8563284B2 (en) * 2010-10-08 2013-10-22 Jenn Tu Thermostable Paenibacillus xylanases
BR112013018836A2 (pt) * 2011-01-28 2016-07-19 Univ California "métodos de manipulação, obtenção, elevação e aumento em uma planta que compreende a expressão de gene modificado"
WO2012142591A2 (en) * 2011-04-14 2012-10-18 The Regents Of The University Of Colorado Compositions, methods and uses for multiplex protein sequence activity relationship mapping
US8956842B2 (en) 2011-08-12 2015-02-17 Korea Research Institute Of Chemical Technology Paenibacillus sp. HPL-3 strain producing xylanase having heat-resistance, a wide range of optimum pH and high activity, a novel xylanase separated from the strain, and a method for mass-production of the same using the transformant originated from the strain
PT2771508T (pt) * 2011-10-27 2022-03-23 Buckman Laboratories Int Inc Método e composição para tratamento enzimático de fibras para fabrico de papel e produtos de papel fabricados com elas
CN104039959A (zh) * 2011-11-11 2014-09-10 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
BR112014008493A2 (pt) * 2011-11-11 2019-09-24 Novozymes Inc polipeptídeo isolado, composição, polinucleotídeo isolado, célula hospedeira recombinante, métodos para produção de um polipeptídeo, de um mutante ou célula de origem, e de uma proteína, planta transgênica, parte da planta ou célula vegetal, molécula de rna inibidora de fita dupla, método para inibir a expressão de um polipeptídeo, processos para degradar um material celulósico ou contendo xilano, para produzir um produto de fermentação, e para fermentação de um material celulósico ou contendo xilano, e, formulação de caldo completo ou composição de cultura de células
CN102735642B (zh) * 2012-07-12 2014-07-02 河北大学 一种快速无损鉴别初榨橄榄油和油橄榄果渣油的方法
US8759041B1 (en) * 2013-02-12 2014-06-24 Novozymes Inc. Polypeptides having xylanase activity and polynucleotides encoding same
GB201308853D0 (en) * 2013-03-12 2013-07-03 Verenium Corp Genes encoding xylanase
US9573980B2 (en) 2013-03-15 2017-02-21 Spogen Biotech Inc. Fusion proteins and methods for stimulating plant growth, protecting plants from pathogens, and immobilizing Bacillus spores on plant roots
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
US11981942B2 (en) 2013-07-23 2024-05-14 International N&H Denmark Aps Xylanases for solubilizing arabinoxylan-containing material
HUE041860T2 (hu) * 2014-01-31 2019-06-28 Danisco Us Inc Eljárások melléktermékek javítására fermentációs folyamatokból, amelyek xilanázt használnak
GB201401699D0 (en) * 2014-01-31 2014-03-19 Dupont Nutrition Biosci Aps Protein
MX2016010285A (es) 2014-02-11 2017-01-11 Univ Colorado Regents Ingenieria genetica multiplexada habilitada por crispr.
CN103834627B (zh) * 2014-03-11 2015-05-13 云南师范大学 一种低温木聚糖酶XynAGN16及其基因、重组载体、重组菌株
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
JP6354462B2 (ja) * 2014-08-29 2018-07-11 本田技研工業株式会社 Ghファミリー10に属する耐熱性キシラナーゼ
JP6975039B2 (ja) 2014-09-17 2021-12-01 バイエル クロップサイエンス エルピーBayer Cropscience Lp 組換えバチルス細胞および殺菌剤を含む組成物
AR101959A1 (es) 2014-09-17 2017-01-25 Bayer Cropscience Lp Composiciones que comprenden células recombinantes de bacillus y un insecticida
BR122023020910A2 (pt) 2014-09-17 2024-01-30 Spogen Biotech Inc Método para fornecimento de proteínas ou peptídeos a um animal
WO2016044548A1 (en) 2014-09-17 2016-03-24 Bayer Cropscience Lp Compositions comprising recombinant bacillus cells and another biological control agent
CN104450649B (zh) * 2014-11-17 2017-04-05 北京大学 F52‑6蛋白及其编码基因及水解木聚糖的应用
CN105779491A (zh) * 2014-12-25 2016-07-20 中国石油天然气股份有限公司 嗜热β-1,4木聚糖酶-His融合蛋白、其制备方法及应用、其基因工程菌的构建
CN104651337B (zh) * 2015-01-28 2017-11-03 浙江大学 一种木聚糖酶、其编码基因xyn‑lxy及其应用
AR107895A1 (es) * 2016-03-16 2018-06-28 Spogen Biotech Inc Métodos para promover la salud de las plantas usando enzimas libres y microorganismos que sobreexpresan enzimas
AU2017280353B2 (en) 2016-06-24 2021-11-11 Inscripta, Inc. Methods for generating barcoded combinatorial libraries
AR108861A1 (es) 2016-07-08 2018-10-03 Novozymes As Variantes de xilanasa y polinucleótidos que las codifican
AU2017294066A1 (en) * 2016-07-08 2019-01-17 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
JP2019162036A (ja) * 2016-08-05 2019-09-26 味の素株式会社 ヘミセルラーゼ
US12005456B2 (en) 2016-09-16 2024-06-11 Novozymes A/S Fiber washing method and system
CN108456667B (zh) * 2017-02-17 2019-10-18 中国科学院微生物研究所 一种木聚糖酶及其编码基因和它们的应用
US11499144B2 (en) 2017-06-22 2022-11-15 Novozymes A/S Xylanase variants and polynucleotides encoding same
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
ES2971299T3 (es) 2017-07-24 2024-06-04 Novozymes As GH5 y GH30 en la molienda húmeda
CN111868251A (zh) 2018-01-11 2020-10-30 诺维信公司 动物饲料组合物及其用途
CN108018274B (zh) * 2018-02-01 2020-05-05 中南民族大学 一种极端耐热木聚糖酶1vbr的突变体xynh及其用途
MX2021000149A (es) * 2018-07-06 2021-03-25 Dupont Nutrition Biosci Aps Aditivos para piensos que contienen xilanasa para piensos para animales a base de cereales.
CN109997970B (zh) * 2019-03-07 2022-05-06 青岛红樱桃生物技术有限公司 一类酶活和耐热性提高的酸性木聚糖酶突变体及其编码基因和应用
CN113811191A (zh) 2019-03-11 2021-12-17 诺维信公司 含有gh30葡糖醛酸木聚糖水解酶的基于纤维玉米的动物饲料
CN110124025B (zh) * 2019-04-22 2022-10-25 肇庆大华农生物药品有限公司 一种禽流感与禽腺病毒4型二联基因工程亚单位疫苗及其制备方法
CN112564485B (zh) * 2019-09-10 2022-03-08 中车株洲电力机车研究所有限公司 Llc谐振变换器及其控制方法
WO2021078839A1 (en) 2019-10-22 2021-04-29 Novozymes A/S Animal feed composition
CN111269903B (zh) * 2020-03-30 2021-08-17 郑州大学 木聚糖酶、基因及其应用
EP4152945A1 (en) 2020-05-18 2023-03-29 DSM IP Assets B.V. Animal feed compositions
BR112022023230A2 (pt) 2020-05-18 2022-12-27 Dsm Ip Assets Bv Composições de ração animal
CN111690632B (zh) * 2020-07-14 2022-03-18 云南师范大学 一种内切木聚糖酶突变体s23e11及其制备方法和应用
CN111849943B (zh) * 2020-07-14 2022-06-24 云南师范大学 一种内切木聚糖酶突变体s06h03及制备方法和应用
CN111849942B (zh) * 2020-07-14 2022-06-24 云南师范大学 一种内切木聚糖酶突变体s44a09及制备方法和应用
CN111876398B (zh) * 2020-07-14 2022-03-22 云南师范大学 一种内切木聚糖酶突变体s05f04及其制备方法和应用
CN111848759B (zh) * 2020-07-27 2022-03-29 齐鲁工业大学 一种活性提高的纤维小体对接蛋白突变体36741及应用
CN112322604B (zh) * 2020-11-03 2022-05-17 南京工业大学 一种高比酶活木聚糖酶突变体及其应用
KR20220085367A (ko) * 2020-12-15 2022-06-22 주식회사 잇다 기능성 발효 녹차 복합 생균제 및 이의 제조방법
US20220195410A1 (en) * 2020-12-17 2022-06-23 Fornia Biosolutions, Inc. Xylanase Variants and Methods
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
CN114807093B (zh) * 2022-06-22 2022-09-27 中国农业科学院北京畜牧兽医研究所 一种通过c端添加融合肽段提高木聚糖酶和植酸酶热稳定性的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5916795A (en) * 1994-12-21 1999-06-29 New Oji Paper Company Ltd. Thermostable xylanase
WO2000043496A1 (fr) * 1999-01-25 2000-07-27 Gie Agro Industrie Produit multienzymatique a activites glucoamylasique, proteolytique et xylanasique et procede pour sa production par fermentation a l"etat solide de son de ble avec aspergillus niger
CN1266903A (zh) * 1999-03-15 2000-09-20 财团法人生物技术开发中心 重组木聚糖酶、其制备方法及应用
WO2001049859A1 (en) * 1999-12-30 2001-07-12 Genencor International, Inc. Trichoderma reesei xylanase

Family Cites Families (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2643800C2 (de) * 1976-09-29 1986-10-30 Fritz Werner Industrie-Ausrüstungen GmbH, 6222 Geisenheim Verfahren zur Herstellung von Xylose durch enzymatische Hydrolyse von Xylanen
US4261868A (en) 1979-08-08 1981-04-14 Lever Brothers Company Stabilized enzymatic liquid detergent composition containing a polyalkanolamine and a boron compound
US4404128A (en) 1981-05-29 1983-09-13 The Procter & Gamble Company Enzyme detergent composition
US5021246A (en) 1984-03-30 1991-06-04 Anheuser-Busch, Incorporated Step mashing process for producing low alcohol beer
US5204015A (en) 1984-05-29 1993-04-20 Genencor International, Inc. Subtilisin mutants
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
GB8610670D0 (en) 1986-05-01 1986-06-04 British Petroleum Co Plc Enzyme
US4966850A (en) * 1987-01-21 1990-10-30 Forintek Canada Corp. Production of thermostable xylanase and cellulase
US4788066A (en) 1987-12-14 1988-11-29 Grain Processing Corporation Preparation of low alcohol beer
US5116746A (en) 1988-03-04 1992-05-26 Institut Armand Frappier Cellulase-free endo-xylanase enzyme of use in pulp delignification
US5179021A (en) 1989-02-10 1993-01-12 Gil Inc. (Now Ici Canada Inc.) Pulp bleaching process comprising oxygen delignification and xylanase enzyme treatment
NZ235679A (en) 1989-10-18 1993-01-27 Int Paper Co Bleaching lignocellulosic pulp using (a) treatment with xylanase and (b) one or more chemical bleaching stages
FI89814C (fi) 1990-02-02 1993-11-25 Enso Gutzeit Oy Foerfarande foer blekning av cellulosamassa
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
GB9018426D0 (en) 1990-08-22 1990-10-03 Sandoz Ltd Improvements in or relating to novel compounds
DK203490D0 (da) 1990-08-24 1990-08-24 Novo Nordisk As Fremgangsmaade til behandling af lignocellulosepulp og apparat til udfoerelse af processen
NL9100050A (nl) 1991-01-11 1992-08-03 Heineken Technische Beheer Bv Werkwijze voor het continu bereiden van wort.
FR2672066B1 (fr) 1991-01-25 1997-01-31 Du Pin Cellulose Traitement enzymatique d'une pate ligno-cellulosique chimique.
US5405624A (en) 1991-02-14 1995-04-11 Bio-Technical Resources Process for producing a product with an intensified beer flavor
FI108800B (fi) * 1991-05-07 2002-03-28 Iogen Corp Menetelmä ja laitteisto entsyymin käyttämiseksi paperimassan valmistuksessa ja valkaisussa
DK175391D0 (da) 1991-10-18 1991-10-18 Novo Nordisk As Nye enzymer
CA2082185C (en) 1991-11-26 2004-01-20 Alexander R. Pokora Protease catalyzed treatments of lignocellulose materials
DK87092D0 (da) 1992-07-02 1992-07-02 Novo Nordisk As Nyt enzym
DK105592D0 (da) 1992-08-26 1992-08-26 Novo Nordisk As Nyt enzym
US5785811A (en) * 1992-11-09 1998-07-28 The Mead Corporation Process for treating lignocellulosic material with soybean peroxidase in the presence of peroxide
DE59305188D1 (de) 1992-12-31 1997-02-27 Metallgesellschaft Ag Verfahren zur herstellung von bier
US6021536A (en) 1993-03-04 2000-02-08 Wasinger; Eric Mechanical desizing and abrading device
US5405769A (en) 1993-04-08 1995-04-11 National Research Council Of Canada Construction of thermostable mutants of a low molecular mass xylanase
GB2279955B (en) 1993-07-15 1998-02-18 Solvay Xylanase derived from a Bacillus species, expression vectors for such xylanase and other proteins, host organisms therefor and use thereof
CN1134726A (zh) * 1993-10-04 1996-10-30 诺沃挪第克公司 一种包含修饰酶的酶制剂
BE1007651A3 (fr) 1993-10-22 1995-09-05 Solvay Interox Procede pour le blanchiment d'une pate a papier chimique.
CA2156048C (en) * 1993-12-24 2010-11-16 Pieter Van Solingen Alkali-tolerant xylanases
US5824531A (en) 1994-03-29 1998-10-20 Novid Nordisk Alkaline bacilus amylase
AUPM493594A0 (en) 1994-04-11 1994-05-05 Biotech International Limited Bacterial xylanase
US5437992A (en) 1994-04-28 1995-08-01 Genencor International, Inc. Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp
EP0716702B1 (en) * 1994-06-14 2002-08-28 Genencor International, Inc. Thermostable xylanases
WO1995034644A1 (en) * 1994-06-15 1995-12-21 Novo Nordisk A/S Pyrodictium xylanase, amylase and pullulanase
US5830732A (en) 1994-07-05 1998-11-03 Mitsui Toatsu Chemicals, Inc. Phytase
BE1008751A3 (fr) 1994-07-26 1996-07-02 Solvay Xylanase, microorganismes la produisant, molecules d'adn, procedes de preparation de cette xylanase et utilisations de celle-ci.
US5503709A (en) 1994-07-27 1996-04-02 Burton; Steven W. Environmentally improved process for preparing recycled lignocellulosic materials for bleaching
US5935836A (en) 1994-07-29 1999-08-10 Rohm Enzyme Finland Oy Actinomadura xylanase sequences and methods of use
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5786316A (en) 1994-10-27 1998-07-28 The Procter & Gamble Company Cleaning compositions comprising xylanases
DE69617641T3 (de) 1995-01-26 2009-10-22 Novozymes A/S Xylanase beinhaltende futterzusätze für tiere
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
AU6298896A (en) 1995-06-28 1997-01-30 Novo Nordisk A/S A cellulase with reduced mobility
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
AU6513096A (en) 1995-07-19 1997-02-18 Novo Nordisk A/S Treatment of fabrics
EP0796328A2 (en) 1995-10-13 1997-09-24 Gist-Brocades B.V. Protein detection
EP0857215A1 (en) * 1995-10-17 1998-08-12 Institut National De La Recherche Agronomique (Inra) Xylanase, oligonucleotidic sequence encoding it and its uses
JP3626203B2 (ja) 1995-11-15 2005-03-02 ノボザイムス アクティーゼルスカブ 染色されたデニムの複合糊抜及び「ストーンウォッシュ」方法
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
EP0868506A1 (en) * 1995-12-18 1998-10-07 Röhm Enzyme Finland Oy Novel xylanases and uses thereof
JPH11502255A (ja) 1995-12-29 1999-02-23 ザ、プロクター、エンド、ギャンブル、カンパニー 固定化酵素を含有する洗剤組成物
CN1209838A (zh) 1996-01-29 1999-03-03 诺沃挪第克公司 纤维素织物的脱浆方法
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
US5759840A (en) * 1996-09-09 1998-06-02 National Research Council Of Canada Modification of xylanase to improve thermophilicity, alkalophilicity and thermostability
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
WO1998016191A1 (en) 1996-10-11 1998-04-23 Novo Nordisk A/S CELLULOSE BINDING DOMAINS (CBDs) FOR ORAL CARE PRODUCTS
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
DE69835360T2 (de) 1997-01-17 2007-08-16 Maxygen, Inc., Redwood City EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6023065A (en) 1997-03-10 2000-02-08 Alberta Research Council Method and apparatus for monitoring and controlling characteristics of process effluents
EP0996718B1 (en) 1997-03-18 2008-12-24 Novozymes A/S Method for constructing a library using dna shuffling
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
GB2327345B (en) 1997-07-18 1999-06-23 Finnfeeds Int Ltd Use of an enzyme for manufacturing an agent for controlling bacterial infection
EP2386568B1 (en) 1997-10-30 2014-08-06 Novozymes A/S Alpha-amylase mutants
DE69812403T2 (de) 1997-11-10 2004-01-29 Procter & Gamble Verfahren zur herstellung einer waschmitteltablette
US6187580B1 (en) 1997-11-24 2001-02-13 Novo Nordisk A/S Pectate lyases
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
US6015703A (en) * 1998-03-10 2000-01-18 Iogen Corporation Genetic constructs and genetically modified microbes for enhanced production of beta-glucosidase
WO1999057360A1 (en) 1998-05-01 1999-11-11 Novo Nordisk A/S Enhancers such as n-hydroxyacetanilide
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
US6365390B1 (en) 1998-09-04 2002-04-02 University Of Georgia Research Foundation, Inc. Phenolic acid esterases, coding sequences and methods
US5980581A (en) 1998-09-08 1999-11-09 The Virkler Company Process for desizing and cleaning woven fabrics and garments
US6241849B1 (en) * 1998-09-17 2001-06-05 Novo Nordisk Biochem North America, Inc. Methods for deinking and decolorizing printed paper
DE69933939T3 (de) 1998-11-16 2012-03-01 National Research Council Of Canada Hitzestabile xylanasen
CN1206352C (zh) * 1998-12-23 2005-06-15 丹尼斯科有限公司 木聚糖酶在制备食品中的用途
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6024766A (en) 1999-01-27 2000-02-15 Wasinger; Eric M. Process for enzymatic desizing of garments and enzyme deactivation
JP2000245356A (ja) 1999-02-26 2000-09-12 Fuji Oil Co Ltd マンノース含有コプラミール組成物
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6824646B2 (en) * 1999-03-23 2004-11-30 Oji Paper Co., Ltd. Process for oxygen bleaching and enzyme treating lignocellulosic pulp with liquid treatment and recovery
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
MX250271B (es) 1999-09-09 2007-10-12 Iogen Bio Products Corp Expresion de proteinas en hongos geneticamente modificados.
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
AU2001233621A1 (en) 2000-02-17 2001-08-27 Birgitte Kiaer Ahring A method for processing lignocellulosic material
EP3339434A1 (en) * 2000-03-08 2018-06-27 DuPont Nutrition Biosciences ApS Xylanase variants
US6399123B1 (en) 2000-05-25 2002-06-04 University Of Missouri Board Of Curators Oligosaccharide removal from animal feed
AU2001267171A1 (en) * 2000-05-31 2001-12-11 National Research Council Of Canada Modified xylanases exhibiting increased thermophilicity and alkalophilicity
AU1166502A (en) 2000-10-12 2002-04-22 Exelixis Inc Human ect2 and methods of use
AU2002230784A1 (en) 2000-11-10 2002-05-21 Xencor Novel thermostable alkaliphilic xylanase
WO2002052100A2 (en) 2000-12-22 2002-07-04 Iogen Bio-Products Corporation Alkaline extraction stages comprising xylanase
WO2002057541A2 (en) 2001-01-18 2002-07-25 Iogen Bio-Products Corporation Use of xylanase in pulp bleaching
GB0121387D0 (en) 2001-09-04 2001-10-24 Danisco Modified hydrolases
WO2003074780A1 (en) 2002-03-06 2003-09-12 Iogen Bio-Products Corporation Xylanase treatment of chemical pulp
US20040005674A1 (en) 2002-04-30 2004-01-08 Athenix Corporation Methods for enzymatic hydrolysis of lignocellulose
US7504120B2 (en) 2002-06-14 2009-03-17 Verenium Corporation Xylanases, nucleic acids encoding them and methods for making and using them
US7033077B2 (en) 2002-07-16 2006-04-25 Peter Taylor Sealable bags made of plastics or other materials and method of making plastic sheeting for manufacturing sealable bags
US20040112555A1 (en) 2002-12-03 2004-06-17 Jeffrey Tolan Bleaching stage using xylanase with hydrogen peroxide, peracids, or a combination thereof
WO2004066945A2 (en) 2003-01-24 2004-08-12 Diversa Corporation Enzymes and the nucleic acids encoding them and methods for making and using them
EP3406621A1 (en) 2006-02-14 2018-11-28 BP Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
SG11201510439PA (en) 2013-06-21 2016-01-28 Bio Rad Laboratories Microfluidic system with fluid pickups

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5916795A (en) * 1994-12-21 1999-06-29 New Oji Paper Company Ltd. Thermostable xylanase
WO2000043496A1 (fr) * 1999-01-25 2000-07-27 Gie Agro Industrie Produit multienzymatique a activites glucoamylasique, proteolytique et xylanasique et procede pour sa production par fermentation a l"etat solide de son de ble avec aspergillus niger
CN1266903A (zh) * 1999-03-15 2000-09-20 财团法人生物技术开发中心 重组木聚糖酶、其制备方法及应用
WO2001049859A1 (en) * 1999-12-30 2001-07-12 Genencor International, Inc. Trichoderma reesei xylanase

Also Published As

Publication number Publication date
BR0312121A (pt) 2007-04-03
EP2298904A1 (en) 2011-03-23
NZ537597A (en) 2008-07-31
US20090221051A1 (en) 2009-09-03
AU2003251549A1 (en) 2003-12-31
BRPI0312121B1 (pt) 2019-10-01
EP2305820A1 (en) 2011-04-06
EP1516053A2 (en) 2005-03-23
KR20050010053A (ko) 2005-01-26
EA200500019A1 (ru) 2006-06-30
US7504120B2 (en) 2009-03-17
CN1675365A (zh) 2005-09-28
AU2003251549B2 (en) 2008-03-13
MXPA04012614A (es) 2005-12-14
US20060003433A1 (en) 2006-01-05
EP2298904B1 (en) 2017-05-24
US7547534B2 (en) 2009-06-16
KR20080045764A (ko) 2008-05-23
EP1516053B1 (en) 2012-10-17
ZA200906125B (en) 2015-12-23
WO2003106654A3 (en) 2004-08-26
WO2003106654A2 (en) 2003-12-24
DK1516053T3 (da) 2013-03-25
US20130337507A1 (en) 2013-12-19
US20080248160A1 (en) 2008-10-09
EP2314698A1 (en) 2011-04-27
CN101967490A (zh) 2011-02-09
DK2298904T3 (en) 2017-09-11
US8728769B2 (en) 2014-05-20
CA2488916C (en) 2016-08-09
ES2394708T3 (es) 2013-02-05
US9765319B2 (en) 2017-09-19
CA2488916A1 (en) 2003-12-24
EP1516053A4 (en) 2006-07-12
ZA200500171B (en) 2010-06-30

Similar Documents

Publication Publication Date Title
CN101967490B (zh) 木聚糖酶、编码木聚糖酶的核酸以及制备和应用它们的方法
CN103484485B (zh) 葡聚糖酶,编码它们的核酸以及制备和使用它们的方法
CN101952437B (zh) 木聚糖酶、编码它们的核酸以及其制备和应用方法
CN101175860B (zh) 纤维素酶、编码它们的核酸及其制备和应用的方法
CN101421400A (zh) 淀粉酶、编码它们的核酸及其制备和应用方法
CA2638801A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them
MX2008011442A (es) Aldolasas, acidos nucleicos que las codifican, y metodos para hacer y usar las mismas.
CN103555741A (zh) 纤维素分解酶、其编码核酸及制备和使用它们的方法
CN101395269A (zh) 蛋白酶、编码这些蛋白酶的核酸及它们的制备和应用方法
CN102618564B (zh) 淀粉酶、编码它们的核酸及其制备和应用方法
AU2013202674B2 (en) Glucanases, nucleic acids encoding them and methods for making and using them
AU2008201402B2 (en) Xylanases, nucleic acids encoding them and methods for making and using them
AU2015210488A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them
AU2015215944A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: DIVERSA CORP.

Free format text: FORMER OWNER: SYNGENTA PARTICIPATIONS AG

Effective date: 20141008

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20141008

Address after: California, USA

Patentee after: VERENIUM Corp.

Address before: Basel, Switzerland

Patentee before: Syngenta Participations AG

C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: California, USA

Patentee after: BASF Enzymes LLC

Address before: California, USA

Patentee before: VERENIUM Corp.

CX01 Expiry of patent term

Granted publication date: 20140716

CX01 Expiry of patent term