ES2682284T3 - Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas - Google Patents

Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas Download PDF

Info

Publication number
ES2682284T3
ES2682284T3 ES07751203.6T ES07751203T ES2682284T3 ES 2682284 T3 ES2682284 T3 ES 2682284T3 ES 07751203 T ES07751203 T ES 07751203T ES 2682284 T3 ES2682284 T3 ES 2682284T3
Authority
ES
Spain
Prior art keywords
sequence
optionally
seq
polypeptide
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07751203.6T
Other languages
English (en)
Inventor
David Weiner
David Blum
Shaun Healey
Alexander Varvak
Thomas Todaro
Geoff Hazlewood
Kristine Chang
Hwai Chang
Grace Desantis
Connie Jo Hansen
Charles Hancock
Thomas Woodward
Scott W. Beaver
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BP Corp North America Inc
Original Assignee
BP Corp North America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BP Corp North America Inc filed Critical BP Corp North America Inc
Application granted granted Critical
Publication of ES2682284T3 publication Critical patent/ES2682284T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K10/00Animal feeding-stuffs
    • A23K10/10Animal feeding-stuffs obtained by microbiological or biochemical processes
    • A23K10/12Animal feeding-stuffs obtained by microbiological or biochemical processes by fermentation of natural products, e.g. of vegetable material, animal waste material or biomass
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23KFODDER
    • A23K20/00Accessory food factors for animal feeding-stuffs
    • A23K20/10Organic substances
    • A23K20/163Sugars; Polysaccharides
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L29/00Foods or foodstuffs containing additives; Preparation or treatment thereof
    • A23L29/30Foods or foodstuffs containing additives; Preparation or treatment thereof containing carbohydrate syrups; containing sugars; containing sugar alcohols, e.g. xylitol; containing starch hydrolysates, e.g. dextrin
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L31/00Edible extracts or preparations of fungi; Preparation or treatment thereof
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L31/00Edible extracts or preparations of fungi; Preparation or treatment thereof
    • A23L31/10Yeasts or derivatives thereof
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/10Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives
    • A23L33/125Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof using additives containing carbohydrate syrups; containing sugars; containing sugar alcohols; containing starch hydrolysates
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L5/00Preparation or treatment of foods or foodstuffs, in general; Food or foodstuffs obtained thereby; Materials therefor
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L7/00Cereal-derived products; Malt products; Preparation or treatment thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/2488Mannanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/2488Mannanases
    • C12N9/2494Mannan endo-1,4-beta-mannosidase (3.2.1.78), i.e. endo-beta-mannanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06LDRY-CLEANING, WASHING OR BLEACHING FIBRES, FILAMENTS, THREADS, YARNS, FABRICS, FEATHERS OR MADE-UP FIBROUS GOODS; BLEACHING LEATHER OR FURS
    • D06L4/00Bleaching fibres, filaments, threads, yarns, fabrics, feathers or made-up fibrous goods; Bleaching leather or furs
    • D06L4/40Bleaching fibres, filaments, threads, yarns, fabrics, feathers or made-up fibrous goods; Bleaching leather or furs using enzymes
    • DTEXTILES; PAPER
    • D06TREATMENT OF TEXTILES OR THE LIKE; LAUNDERING; FLEXIBLE MATERIALS NOT OTHERWISE PROVIDED FOR
    • D06LDRY-CLEANING, WASHING OR BLEACHING FIBRES, FILAMENTS, THREADS, YARNS, FABRICS, FEATHERS OR MADE-UP FIBROUS GOODS; BLEACHING LEATHER OR FURS
    • D06L4/00Bleaching fibres, filaments, threads, yarns, fabrics, feathers or made-up fibrous goods; Bleaching leather or furs
    • D06L4/70Multi-step processes
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C3/00Pulping cellulose-containing materials
    • D21C3/003Pulping cellulose-containing materials with organic compounds
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C9/00After-treatment of cellulose pulp, e.g. of wood pulp, or cotton linters ; Treatment of dilute or dewatered pulp or process improvement taking place after obtaining the raw cellulosic material and not provided for elsewhere
    • D21C9/10Bleaching ; Apparatus therefor
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H17/00Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
    • D21H17/005Microorganisms or enzymes
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

Un ácido nucleico aislado, sintético o recombinante que comprende (a) un ácido nucleico que codifica al menos un polipéptido, en el que el ácido nucleico comprende (i) SEQ ID NO: 383 o (ii) la secuencia de la SEQ ID NO: 481, donde el ácido nucleico codifica al menos un polipéptido que tiene una actividad xilanasa, y, opcionalmente, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual, y, opcionalmente, el algoritmo de comparación de secuencias es un algoritmo de BLAST versión 2.2.2 donde una configuración de filtrado se establece en blastall -p blastp -d "nr pataa" -F F, y todas las otras opciones se establecen por defecto; (b) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, en el que el polipéptido comprende la secuencia de la SEQ ID NO: 384 o SEQ ID NO: 482; (c) (i) el ácido nucleico de (a) o (b) y que codifica un polipéptido que tiene al menos una sustitución conservadora de aminoácidos y que conserva su actividad xilanasa; o, (ii) el ácido nucleico de (c) (i), donde la al menos una sustitución conservadora de aminoácidos comprende sustituir un aminoácido por otro aminoácido de características similares; o una sustitución conservadora comprende: reemplazo de un aminoácido alifático por otro aminoácido alifático; reemplazo de una Serina por una Treonina o viceversa; reemplazo de un residuo ácido por otro residuo ácido; reemplazo de un residuo que porta un grupo amida por otro residuo que porta un grupo amida; intercambio de un residuo básico por otro residuo básico; o reemplazo de un residuo aromático por otro residuo aromático; (d) el ácido nucleico de (a), (b) o (c) que codifica un polipéptido que tiene dicha actividad xilanasa pero que carece de una secuencia señal, un dominio prepro, un dominio de dockerina y/o un módulo de unión a carbohidrato (CBM); (e) el ácido nucleico de (a), (b), (c) o (d) que codifica un polipéptido que tiene dicha actividad xilanasa que comprende además una secuencia heteróloga; (f) el ácido nucleico de (e), donde la secuencia heteróloga comprende o consiste en una secuencia que codifica: (i) una secuencia señal heteróloga, un módulo de unión a carbohidrato heterólogo, un dominio de dockerina heterólogo, un dominio catalítico heterólogo (CD) o una combinación de los mismos; (ii) la secuencia de (i), donde la secuencia señal heteróloga, el módulo de unión a carbohidrato o el dominio catalítico (CD) se deriva de una enzima heteróloga; o (iii) una etiqueta, un epítopo, un péptido de dirección, una secuencia escindible, un resto detectable o una enzima; (g) el ácido nucleico de (f), donde el módulo de unión a carbohidrato heterólogo (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión a mannanasa, un módulo específico de xiloglucano y/o un módulo de unión a arabinofuranosidasa; (h) el ácido nucleico de (f), donde la secuencia señal heteróloga dirige la proteína codificada a una vacuola, el retículo endoplásmico, un cloroplasto o un gránulo de almidón; o (i) una secuencia de ácido nucleico completamente complementaria a (a), (b), (c), (d), (e), (f), (g) o (h).

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas Campo de la Invención
La presente invención se refiere generalmente a enzimas, polinucleótidos que codifican las enzimas, el uso de tales polinucleótidos y polipéptidos y más específicamente a enzimas que tienen actividad xilanasa, por ejemplo, que catalizan la hidrólisis de enlaces xiloxídicos p-1,4 internos o enlaces endo-p-1,4-glucanasa; y/o que degradan un polisacárido lineal beta-1,4-xilano en xilosa; o, una actividad de glucanasa, por ejemplo, una actividad de endoglucanasa, por ejemplo, que cataliza la hidrólisis de enlaces endo-p-1,4-glucanasa y 1,3-glucanasa internos, una actividad xilanasa, y/o una actividad mannanasa. Por lo tanto, la invención proporciona métodos y procesos para descomponer hemicelulosa, que es un componente principal de la pared celular de las plantas, incluyendo métodos y procesos para hidrolizar hemicelulosas en cualquier compuesto orgánico, planta o madera o producto o subproducto de madera, residuos de madera, pasta de papel, producto de papel o residuos o subproducto de papel.
Antecedentes
Las xilanasas (por ejemplo, endo-1,4-beta-xilanasa, EC 3.2.1.8) hidrolizan enlaces p-1,4-xilosídicos internos en el xilano para producir oligómeros de xilosa y xilo de peso molecular más bajo. Los xilanos son polisacáridos formados a partir de D-xilopiranosas unidas por 1,4-p-glicósidos. Las xilanasas tienen un valor comercial considerable, utilizándose en la industria alimentaria, para panificación y tratamiento de frutas y vegetales, descomposición de residuos agrícolas, en la fabricación de piensos para animales y en la producción de pasta y papel. Las xilanasas son formadas por hongos y bacterias.
Las arabinoxilanasas son los polisacáridos principales de los cereales aparte del almidón representando 2,5 - 7,1 % p/p dependiendo de la variedad y las condiciones de crecimiento. Las propiedades fisicoquímicas de este polisacárido son tales que dan lugar a soluciones viscosas o incluso geles en condiciones oxidativas. Además, los arabinoxilanos tienen una alta capacidad de unirse a agua y pueden tener un papel en la estabilidad de la espuma de proteína. Todas estas características presentan problemas para varias industrias incluyendo la elaboración de cerveza, panificación, nutrición animal y fabricación de papel. En las aplicaciones para la elaboración de cerveza, la presencia de xilano da como resultado problemas en la filtrabilidad de la malta y la formación de turbidez. En las aplicaciones para panificación (especialmente para galletas y galletas saladas), estos arabinoxilanos crean masas pegajosas y son difíciles de trabajar y reducen el tamaño de la galleta. Además, este carbohidrato está implicado en la rehidratación rápida del producto horneado dando como resultado la pérdida del carácter crujiente y la reducción de vida útil. Para aplicaciones de alimentación de animales monogástricos con dietas de cereales, el arabinoxilano es el factor que más contribuye a la viscosidad del contenido de los intestinos y por lo tanto afecta adversamente a la digestibilidad del alimento y al ritmo de crecimiento del animal. Para animales rumiantes, estos polisacáridos representan componentes sustanciales de la ingesta de fibra y la digestión más completa de los arabinoxilanos facilitaría eficiencias de conversión de alimentos superiores.
Se ha demostrado que las xilanasas son útiles en el blanqueo biológico y el tratamiento de las pastas de papel (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.202.249), el blanqueo biológico y el tratamiento de las pastas de madera y papel (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.179.021, 5.116.746, 5.407.827, 5.405.769, 5.395.765, 5.369.024, 5.457.045, 5.434.071, 5.498.534, 5.591.304, 5.645.686, 5.725.732, 5.759.840, 5.834.301, 5.871.730 y 6.057.438) para reducir el contenido de lignina de la madera y modificar la madera (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.486.468 y 5.770.012) como mejoradores de harinas, masas y pan (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.108.765 y 5.306.633) como aditivos y/o suplementos alimentarios, como se ha mostrado anteriormente (véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.432.074, 5.429.828, 5.612.055, 5.720.971, 5.981.233, 5.948.667, 6.099.844, 6.132.727 y 6.132.716), en la fabricación de soluciones de celulosa (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.760.211). Las composiciones detergentes que tienen actividad xilanasa se utilizan para compuestos de frutas, hortalizas y/o barro y arcilla (véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.786.316). Las xilanasas se pueden utilizar también en la hidrólisis de hemicelulosa para la cual es selectiva, particularmente en presencia de celulosa. Adicionalmente, el producto retenido rico en celulasa es adecuado para la hidrólisis de celulosa (véase, por ejemplo, la Patente de los Estados Unidos Núm. 4.725.544).
El documento WO 2004/066945 es una publicación anterior del solicitante que analiza las xilanasas, que pueden ser termotolerantes o termoestables.
Persiste una necesidad en la técnica de xilanasas para su utilización en la industria del papel y la pasta, por ejemplo, donde la enzima es activa en el intervalo de temperatura de 65 °Ca 75°C y a un pH de aproximadamente 10. Adicionalmente, una enzima útil en la industria del papel y la pasta podría reducir la necesidad de productos químicos de blanqueo, tales como el dióxido de cloro.
5
10
15
20
25
30
35
40
45
50
55
60
65
Sumario de la Invención
La invención proporciona enzimas que tienen actividad xilanasa, por ejemplo, que catalizan la hidrólisis de enlaces p-1,4-glicosídicos internos o enlaces endo- p-1,4-glucanasa y ácidos nucleicos que los codifican, vectores y células que los comprenden, sondas para amplificar e identificar estos ácidos nucleicos que codifican la xilanasa y métodos para fabricar y usar estos polipéptidos y péptidos.
Por ejemplo, la invención proporciona enzimas que tienen actividad xilanasa, y composiciones y métodos que las comprenden, para hidrolizar enlaces internos p-1,4-xilosídicos o enlaces endo-p-1,4-glucanasa, o hemicelulosas, en un producto de madera y madera, pasta de papel, producto de papel o desperdicio de papel. En un aspecto, la actividad xilanasa comprende catalizar la hidrólisis de xilano, por ejemplo, degradar un polisacárido lineal beta-1,4- xilano en una xilosa. Por lo tanto, la invención proporciona métodos y procesos para descomponer una composición que comprende xilano y/o una hemicelulosa, que es un componente principal de la pared celular de las plantas.
La invención proporciona enzimas, composiciones, métodos y procesos para hidrolizar hemicelulosas en cualquier materia orgánica, incluyendo células, plantas y/o productos de madera o madera, desechos de madera, pasta de papel, productos de papel o desperdicios o subproductos de papel.
En otro aspecto, la invención proporciona polipéptidos que tienen actividad lignocelulolítica (lignocelulósica), por ejemplo, una actividad ligninolítica y celulolítica, que tiene una actividad xilanasa, y ácidos nucleicos que los codifican, y métodos para prepararlos y usarlos. La invención proporciona enzimas aisladas, sintéticas o recombinantes para la bioconversión de cualquier biomasa, por ejemplo, un residuo lignocelulósico, en azúcares o polisacáridos fermentables; y estos azúcares o polisacáridos pueden usarse como materia prima química para la producción de alcoholes tales como etanol, propanol, butanol y/o metanol, y en la producción de combustibles, por ejemplo, biocombustibles tales como líquidos sintéticos o gases, tales como gas de síntesis.
En un aspecto, las enzimas de la invención tienen una velocidad catalítica incrementada para mejorar el proceso del sustrato (por ejemplo, una hidrólisis de residuo lignocelulósico, celulosa, bagazo). Esta mayor eficacia en la velocidad catalítica conduce a una eficacia incrementada en la producción de azúcares o polisacáridos, que puede ser útil en aplicaciones industriales, agrícolas o médicas, por ejemplo, para hacer un biocombustible o un alcohol tal como etanol, propanol, butanol y/o metanol. En un aspecto, los azúcares producidos por hidrólisis utilizando enzimas de la presente invención pueden usarse por microorganismos para producción de alcohol (por ejemplo, etanol, propanol, butanol y/o metanol) y/o producción de combustible (por ejemplo, biocombustible).
La invención proporciona aplicaciones industriales, agrícolas o médicas: por ejemplo, biomasa para biocombustible, por ejemplo, etanol, propanol, butanol y/o metanol, usando enzimas de la invención que tienen costes reducidos de enzimas, por ejemplo, costes reducidos en procesos de conversión de biomasa a biocombustible. Por tanto, la invención proporciona procesos eficientes para producir bioalcoholes, biocombustibles y/o composiciones que comprenden biocombustibles (por ejemplo, bioetanol, propanol, butanol y/o metanol), que incluyen combustibles sintéticos, líquidos o gaseosos que comprenden un bioalcohol, de cualquier biomasa.
En un aspecto, las enzimas de la invención, que incluyen los "cócteles" enzimáticos de la invención ("cócteles" que significan mezclas de enzimas que comprenden al menos una enzima de la presente invención), se usan para hidrolizar los componentes principales de una biomasa lignocelulósica o cualquier composición que comprende celulosa y/o hemicelulosa (la biomasa lignocelulósica también comprende lignina), por ejemplo, semillas, granos, tubérculos, residuos de plantas (tales como heno o paja, por ejemplo, paja de arroz o paja de trigo, o cualquier tallo seco de cualquier planta de cereal) o subproductos de procesamiento de alimentos o procesamiento industrial (por ejemplo, tallos), maíz (incluyendo mazorcas, rastrojos, etc.), pastos (por ejemplo, pasto indio, como Sorghastrum nutans, o pasto cambiante, por ejemplo, especies de Panicum, como Panicum virgatum), madera (incluidas astillas de madera, desechos de procesamiento, como desechos de madera), papel, pasta, papel reciclado (por ejemplo, periódico); también incluye una monocotiledónea o una dicotiledónea, o una monocotiledónea de maíz, caña de azúcar o partes de la misma (por ejemplo, cañaverales), arroz, trigo, cebada, césped de pradera o Miscanthus; o un cultivo de semillas oleaginosas de dicotiledóneas, soja, colza, colza, lino, algodón, aceite de palma, remolacha azucarera, maní, árbol, álamo o altramuz; o madera o subproductos de procesamiento de madera, tales como desechos de madera, por ejemplo, en el procesamiento de madera, industria de pasta y/o papel, en fabricación textil y en productos de limpieza domésticos e industriales, y/o en procesamiento de residuos de biomasa.
En un aspecto, las enzimas de la invención se usan para hidrolizar celulosa que comprende una cadena lineal de restos de glucosa unidos por p-1,4, y/o hemicelulosa como una estructura compleja que varía de una planta a otra. En un aspecto, las enzimas de la invención se usan para hidrolizar hemicelulosas que contienen una cadena principal de moléculas de xilosa unidas a pi,4 con ramas intermitentes de arabinosa, galactosa, ácido glucurónico y/o manosa. En un aspecto, las enzimas de la invención se usan para hidrolizar componentes que no contienen carbohidratos que contienen hemicelulosa, tales como grupos acetilo sobre xilosa y ésteres de ácido ferúlico sobre arabinosa. En un aspecto, las enzimas de la invención se usan para hidrolizar hemicelulosas unidas covalentemente a lignina y/o acoplarse a otras cadenas de hemicelulosa a través de enlaces cruzados diferulados.
En un aspecto, las composiciones y métodos de la invención se usan en la digestión enzimática de biomasa y
5
10
15
20
25
30
35
40
45
50
55
60
65
pueden comprender el uso de muchas enzimas diferentes, que incluyen celulasas y hemicelulasas. Las enzimas lignocelulósicas usadas para practicar la invención pueden digerir celulosa a azúcares monoméricos, incluida la glucosa. En un aspecto, las composiciones usadas para practicar la invención pueden incluir mezclas de enzimas, por ejemplo, glicosil hidrolasas, glucosa oxidasas, xilanasas, xilosidasas (por ejemplo, p-xilosidasas), celobiohidrolasas y/o arabinofuranosidasas u otras enzimas que pueden digerir la hemicelulosa y romperla en monómeros de azúcar. Las mezclas de la invención pueden comprender, o consistir en, solo enzimas de la presente invención, o pueden incluir al menos una enzima de la presente invención y otra enzima, que también puede ser una enzima lignocelulósica y/o cualquier otra enzima.
En realizaciones alternativas, la invención proporciona polipéptidos (y los ácidos nucleicos que los codifican) que tienen al menos una sustitución conservadora de aminoácidos y que retienen su actividad xilanasa; o, en el que la al menos una sustitución de aminoácidos conservadora comprende sustituir un aminoácido por otro aminoácido de características similares; o, una sustitución conservadora comprende: reemplazo de un aminoácido alifático con otro aminoácido alifático; reemplazo de una Serina por una Treonina o viceversa; reemplazo de un residuo ácido por otro residuo ácido; reemplazo de un residuo que porta un grupo amida con otro residuo que porta un grupo amida; intercambio de un residuo básico con otro residuo básico; o reemplazo de un residuo aromático con otro residuo aromático;
En realizaciones alternativas, la invención proporciona polipéptidos (y los ácidos nucleicos que los codifican) que tienen una actividad xilanasa pero carecen de una secuencia señal, un dominio prepro, un dominio de dockerina y/o un módulo de unión a carbohidratos (CBM); y en un aspecto, el módulo de unión a carbohidratos (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión mannanasa, un módulo específico de xiloglucano y/o un módulo de unión a arabinofuranosidasa.
En realizaciones alternativas, la invención proporciona polipéptidos (y los ácidos nucleicos que los codifican) que tienen una actividad xilanasa que comprende además una secuencia heteróloga; y en un aspecto, la secuencia heteróloga comprende o consiste en una secuencia que codifica: (i) heteróloga; y en un aspecto, la secuencia heteróloga comprende o consiste en una secuencia que codifica: (i) una secuencia señal heteróloga, un módulo de unión a carbohidrato heterólogo, un dominio de dockerina heterólogo, un dominio catalítico heterólogo (CD), o una combinación de los mismos; (ii) la secuencia de (ii), en la que la secuencia señal heteróloga, el módulo de unión a carbohidrato o el dominio catalítico (CD) se deriva de una enzima heteróloga; o, (iii) una etiqueta, un epítopo, un péptido de dirección, una secuencia escindible, un resto detectable o una enzima; y en un aspecto, el módulo heterólogo de unión a carbohidratos (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión a mannanasa, un módulo específico de xiloglucano y/o un módulo de unión a arabinofuranosidasa; y en un aspecto, la secuencia señal heteróloga se dirige a la proteína codificada a una vacuola, el retículo endoplásmico, un cloroplasto o un gránulo de almidón.
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden un ácido nucleico que codifica al menos un polipéptido que tiene actividad xilanasa, donde el ácido nucleico comprende (i) SEQ ID NO: 383, o (ii) la secuencia de SEQ ID NO: 481.
En un aspecto (opcionalmente) las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual, y en un aspecto (opcionalmente) el algoritmo de comparación de secuencias es un algoritmo BLAST versión 2.2.2 donde se establece una configuración de filtrado para blastall -p blastp -d "nr pataa" -FF, y todas las demás opciones están configuradas por defecto.
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, donde el polipéptido comprende la secuencia de la SEQ ID NO: 384 o SEQ ID NO: 482.
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que comprenden secuencias completamente complementarias a las secuencias de ácido nucleico de la invención (secuencias complementarias (no codificantes) y codificantes también denominadas en el presente documento en conjunto secuencias de ácido nucleico de la invención).
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que codifican un polipéptido que tiene actividad xilanasa, donde el ácido nucleico tiene al menos una modificación de secuencia de una secuencia de ejemplo de la invención o cualquier secuencia de la invención.
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que codifican un polipéptido que tiene actividad xilanasa, donde el ácido nucleico tiene al menos una modificación de secuencia de un ácido nucleico de ejemplo de la invención, en el que la sonda identifica, detecta o aísla la modificación de secuencia que comprende al menos uno. dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios: los nucleótidos en el equivalente de los residuos 10 a 12 de la SEQ ID NO: 383 se cambian a CCT, TTA, TTG, CTC, CTA o CTG, los nucleótidos en el
5
10
15
20
25
30
35
40
45
50
55
60
65
equivalente de los residuos 25 a 27 de la SEQ ID NO: 383 se cambian a CCC, CCG, CCA o CCT, los nucleótidos en el equivalente de los residuos 28 a 30 de la SEQ ID NO: 383 se cambian a TCA, TCC, TCT, TCG, AGT o AGC, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TTT o TTC, los nucleótidos en el equivalente de los residuos 37 a 39 o f SEQ ID NO: 383 se cambian a TAC o TAT, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a ATA, ATT o ATC, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TGG, los nucleótidos equivalentes de los residuos 52 a 54 de la SEQ ID NO: 383 se cambian a TTC o TTT, los nucleótidos en el equivalente de los residuos 73 a 75 de la SEQ ID NO: 383 se cambian a GAG o GAA, los nucleótidos en el equivalente de los restos 73 a 75 de la SEQ ID NO: 383 se cambian a CCC, CCG, CCA o CCT, los nucleótidos en el equivalente de los residuos 88 a 90 de la SEQ ID NO: 383 se cambian a GTG, GTC, GTA o GTT, los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TGT o TGC, los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a CAT o CAC, los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TTG, TTA, CTT, CTC, CTA o CTG, los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAG o GAA, los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAT o GAC, los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a ACA, ACT, ACC o ACG, los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a TGT o TGC, o los nucleótidos en el equivalente de residuos 508 a 582 de la SEQ ID NO: 383 se cambian a CAT o CAC.
La invención proporciona ácidos nucleicos aislados, sintéticos o recombinantes que codifican un polipéptido que tiene actividad xilanasa, donde el ácido nucleico tiene al menos una modificación de secuencia de la SEQ ID NO: 383, o el equivalente de al menos una modificación de secuencia de la SEQ ID NO: 383, y la al menos una modificación de la SEQ ID NO: 383 comprende un cambio en: los nucleótidos en los residuos 10 a 12 son CCT, TTA, TTG, CTC, CTA o CTG, los nucleótidos en los residuos 25 a 27 son CCC, CCG, CCA o CCT, los nucleótidos en los residuos 28 a 30 son TCA, TCC, TCT, TCG, AGT o AGC, los nucleótidos en los residuos 37 a 39 son TTT o TTC, los nucleótidos en los residuos 37 a 39 son TAC o TAT, los nucleótidos en los residuos 37 a 39 son ATA, ATT o ATC, los nucleótidos en los residuos 37 a 39 son TGG, los nucleótidos en los residuos 40 a 42 son CAC o CAT, los nucleótidos en los residuos 52 a 54 son TTC o TTT, los nucleótidos en los residuos 73 a 75 son GAG o GAA, los nucleótidos en los residuos 73 a 75 son CCC, CCG, CCA o CCT, los nucleótidos en los residuos 88 a 90 son GTG, GTC, GTA o GTT, los nucleótidos en los residuos 100 a 102 son TGT o TGC, los nucleótidos en los residuos 100 a 102 son CAT o CAC, los nucleótidos en los residuos 100 a 102 son TTG, TTA, CTT, CTC, CTA o CTG, los nucleótidos en los residuos 103 a 105 son GAG o GAA, los nucleótidos en los residuos 103 a 105 son GAT o GAC, los nucleótidos en los residuos 211 a 213 son ACA, ACT, ACC o ACG, los nucleótidos en los residuos 211 a 213 son TGT o TGC, o los nucleótidos en los residuos 508 a 582 son CAT o CAC. En aspectos alternativos, la modificación de secuencia comprende al menos dos de los cambios, al menos tres de los cambios, al menos cuatro de los cambios, o al menos cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los cambios.
La divulgación también proporciona ácidos nucleicos que codifican enzimas con una novedad común en que codifican un nuevo subconjunto de xilanasas, o un clado, que comprende el "módulo X14" (J Bacteriol. 2002 agosto; 184 (15): 4124-4133). La divulgación también proporciona ácidos nucleicos que codifican enzimas con una novedad común en que codifican un nuevo subconjunto de xilanasas, o un clado, que comprende el "módulo X14". Los miembros de xilanasa que comprenden X14 de este clado se enumeran en la Tabla 9 a continuación. Un nuevo género de xilanasas puede comprender miembros de xilanasa del clado enumerados en la Tabla 9, a continuación, y enzimas relacionadas (por ejemplo, xilanasas que tienen una identidad de secuencia con una enzima de ejemplo de la invención como se enumera en la Tabla 9 a continuación).
Los polipéptidos codificados por los ácidos nucleicos aislados, sintéticos o recombinantes de la invención tienen una actividad xilanasa, por ejemplo, donde la actividad xilanasa comprende catalizar la hidrólisis de los enlaces p-1,4- xilosídicos internos; comprende una actividad endo-1,4-beta-xilanasa; comprende hidrolizar un xilano o un arabinoxilano para producir un xilololigómero y xiloligómero de menor peso molecular; comprende hidrolizar un polisacárido que comprende una D-xilopiranosa unida a 1,4-p-glucósido; comprende hidrolizar una celulosa o una hemicelulosa; comprende hidrolizar una celulosa o una hemicelulosa en una madera, productos de madera, pasta de papel, productos de papel o desechos de papel; comprende catalizar la hidrólisis de un xilano o un arabinoxilano en una alimentación o un producto alimenticio; o, comprende catalizar la hidrólisis de un xilano o un arabinoxilano en una célula microbiana o una célula vegetal. En un aspecto, la actividad xilanasa comprende hidrolizar polisacáridos que comprenden D-xilopiranosas unidas por 1,4-p-glucósido o hidrolizar hemicelulosas, por ejemplo, hidrolizar hemicelulosas en una madera, producto de madera, pasta de papel, producto de papel o desperdicio de papel. En un aspecto, el arabinoxilano es un cereal arabinoxilano, tal como un arabinoxilano de trigo.
En un aspecto, la actividad xilanasa comprende catalizar la hidrólisis de xilanos, en un alimento o un producto alimenticio, tal como un alimento para animales a base de cereales, un mosto o una cerveza, un producto de leche o de leche, una fruta o un vegetal. En un aspecto, la actividad xilanasa comprende catalizar la hidrólisis de xilanos, en una célula microbiana o una célula vegetal.
La actividad xilanasa puede ser termoestable, por ejemplo, en la que el polipéptido retiene una actividad xilanasa en
5
10
15
20
25
30
35
40
45
50
55
60
65
condiciones que comprenden un intervalo de temperatura de entre aproximadamente 1 °C y aproximadamente 5 °C, entre aproximadamente 5 °C y aproximadamente 15 °C, entre aproximadamente 15 °C y aproximadamente 25 °C, entre aproximadamente 25 °C y aproximadamente 37 °C, 37 °C a aproximadamente 95 °C, o entre aproximadamente 55 °C a aproximadamente 85 °C, o entre aproximadamente 70 °C a aproximadamente 75 °C, o entre aproximadamente 70 °C a aproximadamente 95 °C, entre aproximadamente 90 °C a aproximadamente 95 °C, entre aproximadamente 95 °C a aproximadamente 105 °C, o entre aproximadamente 95 °C a aproximadamente 110 °C. El polipéptido puede retener una actividad xilanasa en condiciones que comprenden un intervalo de temperatura de entre aproximadamente 1 °C y aproximadamente 5 °C, entre aproximadamente 5 °C y aproximadamente 15 °C, entre aproximadamente 15 °C y aproximadamente 25 °C, entre aproximadamente 25 °C y aproximadamente 37 °C o los polipéptidos de la invención retienen la actividad a temperaturas hasta 90 °C, 91 °C, 92 °C, 93 °C, 94 °C, 95 °C, 96 °C, 97 °C, 98 °C, 99 °C, 100 °C, 101 °C, 102 °C, 103 °C, 103.5 °C, 104 °C, 105 °C, 107 °C, 108 °C, 109 °C o 110 °C, o más; o los polipéptidos de la invención retienen la actividad después de la exposición a temperaturas de hasta 90 °C, 91 °C, 92 °C, 93 °C, 94 °C, 95 °C, 96 °C, 97 °C, 98 °C, 99 °C, 100 °C, 101 °C, 102 °C, 103 °C, 103.5 °C, 104 °C, 105 °C, 107 °C, 108 °C, 109 °C o 110 °C, o más.
En un aspecto, la actividad xilanasa es termotolerante, por ejemplo, donde el polipéptido retiene una actividad xilanasa después de la exposición a una temperatura en el intervalo de más de 37 °C a aproximadamente 95 °C, o entre aproximadamente 55 °C a aproximadamente 85 °C, o entre aproximadamente 70 °C a aproximadamente 75 °C, o entre aproximadamente 70 °C y aproximadamente 95 °C, entre aproximadamente 90 °C y aproximadamente 95 °C, entre aproximadamente 95 °C y aproximadamente 105 °C, o entre aproximadamente 95 °C y aproximadamente 110 °C. El polipéptido puede retener una actividad xilanasa después de la exposición a condiciones que comprenden un intervalo de temperatura de entre aproximadamente 1 °C y aproximadamente 5 °C, entre aproximadamente 5 °C y aproximadamente 15 °C, entre aproximadamente 15 °C y aproximadamente 25 °C, entre aproximadamente 25 °C y aproximadamente 37 °C. Los polipéptidos de la invención pueden retener una actividad xilanasa después de la exposición a una temperatura de hasta 90 °C, 91 °C, 92 °C, 93 °C, 94 °C, 95 °C, 96 °C, 97 °C, 98 °C, 99 °C, 100 °C, 101 °C, 102 °C, 103 °C, 103.5 °C, 104 °C, 105 °C, 107 °C, 108 °C, 109 °C o 110 °C, o más.
Los polipéptidos de xilanasa codificados por ácidos nucleicos de la invención pueden retener actividad en condiciones ácidas que comprenden aproximadamente pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4 o menos (más ácido), o retienen una actividad xilanasa después de la exposición a condiciones ácidas que comprenden aproximadamente pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4 o menos (más ácido); o, retener actividad bajo condiciones básicas que comprenden aproximadamente pH 7, pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11, pH 11.5, pH 12, pH 12.5 o más (más básico) o, retener una actividad xilanasa después de la exposición a condiciones básicas que comprenden aproximadamente pH 7, pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11, pH 11.5, pH 12, pH 12.5 o más (más BASIC). Los polipéptidos codificados por los ácidos nucleicos de la invención pueden retener actividad a una temperatura de al menos aproximadamente 80 °C, 81 °C, 82 °C, 83 °C, 84 °C, 85 °C, 86 °C, 87 °C, 88 °C, 89 °C, 90 °C, 91 °C, 92 °C, 93 °C, 94 °C, 95 °C, 96 °C, 97 °C, 98 °C, 99 °C, 100 °C, 101 °C, 102 °C, 103 °C, 103.5 °C, 104 °C, 105 °C, 107 °C, 108 °C, 109 °C o 110 °C, o más, y un pH básico de al menos aproximadamente pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12, pH 12,5 o más (más básico).
La invención proporciona casetes de expresión, vehículos de clonación o un vector (por ejemplo, vectores de expresión) que comprenden un ácido nucleico que comprende una secuencia de la invención. El vehículo de clonación puede comprender un vector viral, un plásmido, un fago, un fagemido, un cósmido, un fósmido, un bacteriófago o un cromosoma artificial. El vector viral puede comprender un vector de adenovirus, un vector retroviral o un vector viral adenoasociado. El vehículo de clonación puede comprender un cromosoma artificial que comprende un cromosoma artificial bacteriano (BAC), un vector derivado del bacteriófago P1 (PAC), un cromosoma artificial de levadura (YAC) o un cromosoma artificial de mamífero (MAC).
Las sondas de ácido nucleico para identificar un ácido nucleico que codifica un polipéptido con actividad xilanasa, pueden comprender al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70., 75, 100, 125, 150, 175, 200, 225, 250, 275, 300 o más bases consecutivas de un ácido nucleico que comprende una secuencia de ejemplo de la invención, o cualquier secuencia de la invención (como se define en el presente documento), donde opcionalmente, la sonda comprende un oligonucleótido que comprende entre al menos aproximadamente 10 a 300, aproximadamente 25 a 250, aproximadamente 10 a 50, aproximadamente 20 a 60, aproximadamente 30 a 70, aproximadamente 40 a 80, aproximadamente 60 a 100 o aproximadamente 50 a 150 o más bases consecutivas.
Los pares de cebadores de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene actividad xilanasa son capaces de amplificar un ácido nucleico que comprende una secuencia de ejemplo de la invención, o cualquier secuencia de la invención (como se define en el presente documento) o una subsecuencia de la misma, donde, opcionalmente, un miembro del par de secuencias de cebador de amplificación comprende un oligonucleótido que comprende al menos aproximadamente 10 a 50 bases consecutivas de la secuencia, o, aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 o más bases consecutivas de la secuencia. El par de cebadores puede comprender un primer miembro que tiene una secuencia como la expuesta por aproximadamente el primero (el 5 ') 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 o más residuos de una secuencia de ejemplo de la invención, o
5
10
15
20
25
30
35
40
45
50
55
60
65
cualquier secuencia de la invención (como se define en el presente documento), y segundo miembro que tiene una secuencia según lo establecido por aproximadamente el primero (el 5') 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 o más residuos de la cadena complementaria del primer miembro.
Se pueden generar ácidos nucleicos que codifican xilanasa y/o glucanasa mediante la amplificación de un polinucleótido utilizando dicho par de cebadores de amplificación, donde, opcionalmente, la amplificación es por reacción en cadena de la polimerasa (PCR). El ácido nucleico se puede generar por amplificación de una biblioteca de genes, y, opcionalmente, la biblioteca de genes es una biblioteca ambiental. Las xilanasas aisladas, sintéticas o recombinantes pueden estar codificadas por un ácido nucleico que codifica xilanasa y/o glucanasa generado por la amplificación de un polinucleótido usando dicho par de cebadores de amplificación. Los métodos para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa pueden comprender la etapa de amplificación de un ácido nucleico molde con un par de secuencias de cebador de amplificación capaz de amplificar una secuencia de ejemplo de la invención, o cualquier secuencia de la invención (tal como se define en el presente documento), o una subsecuencia del mismo.
La invención proporciona un casete de expresión, un vector o un vehículo de clonación que comprende un ácido nucleico que comprende una secuencia de la invención, donde, opcionalmente, el vehículo de clonación comprende un vector viral, un plásmido, un fago, un fagemido, un cósmido, un fósmido, un bacteriófago o un cromosoma artificial. El vector viral puede comprender un vector de adenovirus, un vector retroviral o un vector viral adenoasociado, o el cromosoma artificial comprende un cromosoma artificial bacteriano (BAC), un vector derivado del bacteriófago P1 (PAC), un cromosoma artificial de levadura (YAC) o un cromosoma artificial de mamífero (MAC).
La invención proporciona células transformadas que comprenden un ácido nucleico o vector de la invención, o un casete de expresión o vehículo de clonación de la invención. La célula transformada puede ser una célula bacteriana, una célula de mamífero, una célula fúngica, una célula de levadura, una célula de insecto o una célula vegetal.
La invención proporciona animales no humanos transgénicos que comprenden una secuencia de la invención. El animal transgénico no humano puede ser un ratón, una rata, un conejo, una oveja, un cerdo, un pollo, una cabra, un pez, un perro o una vaca. La invención proporciona planta s transgénicas que comprenden una secuencia de la invención, por ejemplo donde la planta es una planta de maíz, una planta de sorgo, una planta de patata, una planta de tomate, una planta de trigo, una planta de semillas oleaginosas, un planta de colza, una planta de soja, una planta de arroz, una planta de cebada, una hierba o una planta de tabaco. La invención proporciona semillas transgénicas que comprenden una secuencia de la invención, por ejemplo donde la semilla es una semilla de maíz, un grano de trigo, una semilla oleaginosa, una semilla de colza, una semilla de soja, una semilla de palma, una semilla de girasol, una semilla de sésamo, una semilla de arroz, una semilla de cebada, una semilla de cacahuete o una semilla de planta de tabaco.
Los oligonucleótidos antisentido pueden comprender una secuencia de ácido nucleico complementaria a o susceptible de hibridación en condiciones restrictivas con una secuencia de la invención (incluyendo, por ejemplo, secuencias ilustrativas de la invención), o una subsecuencia de la misma, en la que opcionalmente el oligonucleótido antisentido está entre aproximadamente 10 a 50, aproximadamente 20 a 60, aproximadamente 30 a 70, aproximadamente 40 a 80 o aproximadamente 60 a 100 bases de longitud, y, opcionalmente, las condiciones rigurosas comprenden una etapa de lavado que comprende un lavado en 0,2X SSC a una temperatura de aproximadamente 65 °C durante aproximadamente 15 minutos.
Los métodos para inhibir la traducción de un mensaje de xilanasa en una célula pueden comprender administrar a la célula o expresar en la célula un oligonucleótido antisentido que comprende una secuencia de ácido nucleico complementaria a o susceptible de hibridación en condiciones restrictivas con una secuencia de la invención (incluyendo, por ejemplo, secuencias de ejemplo de la invención).
Las moléculas de ARN (ARNi) de doble hebra inhibidoras pueden comprender a subsecuencia de una secuencia de la invención (incluyendo, por ejemplo, las secuencias de ejemplo de la invención). La molécula de ARN (ARNi) de doble hebra inhibidoras puede tener aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, o 30 o más nucleótidos dúplex de longitud. Los métodos para inhibir la expresión de una xilanasa en una célula pueden comprender administrar a la célula o expresar en la célula un ARN inhibidor de doble hebra (ARNi), donde el ARN comprende una subsecuencia de una secuencia de la invención (incluyendo, por ejemplo, las secuencias de ejemplo de la invención).
La invención proporciona polipéptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa o polipéptidos capaces de generar una respuesta inmunitaria específica de una xilanasa (por ejemplo, un epítopo), (i) que comprende una secuencia de aminoácidos que tiene la secuencia SEQ ID NO: 160, 384 o SEQ ID NO: 482.
Las secuencias de polipéptido o péptido de la invención incluyen polipéptidos o péptidos unidos específicamente por un anticuerpo divulgado en el presente documento (por ejemplo, epítopos) o polipéptidos o péptidos que pueden generar un anticuerpo de la divulgación (por ejemplo, un inmunógeno).
5
10
15
20
25
30
35
40
45
50
55
60
65
Las enzimas variantes de xilanasa de la invención comprenden las secuencias de: SEQ ID NO: 384 (después, se eliminaron tres residuos de aminoácidos del extremo carboxi terminal del polipéptido SEQ ID NO: 382, que da como resultado SEQ ID NO: 384) y SEQ ID NO. : 482 (véase más adelante). La invención proporciona polipéptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa, donde el polipéptido tiene una secuencia que comprende una modificación de secuencia de una secuencia de ejemplo de la invención, donde la modificación de secuencia comprende al menos uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios: el aminoácido en el equivalente de la treonina en el residuo 4 de la SEQ ID NO: 384 es leucina, el aminoácido en el equivalente de la serina en el residuo 9 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la glutamina en el residuo 10 de la SEQ ID NO: 384 es serina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es fenilalanina, el aminoácido en el equivalente de la treonina en el resto 13 de la SEQ ID NO: 384 es tirosina, el aminoácido en el equivalente de la treonina en el resto 13 de la SEQ ID NO: 384 es isoleucina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es triptófano, el aminoácido en el equivalente de la asparagina en el residuo 14 de la SEQ ID NO: 384 es histidina, el aminoácido en el equivalente de la tirosina en el resto 18 de la SEQ ID NO: 384 es fenilalanina, el aminoácido en el equivalente de la serina en el resto 25 de la SEQ ID NO: 384 es ácido glutámico, el aminoácido en el equivalente de la serina en el resto 25 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la asparagina en el residuo 30 de la SEQ ID NO: 384 es valina, el aminoácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es cisteína, el aminoácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es histidina, el aminoácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es leucina, el aminoácido en el equivalente de la serina en el resto 35 de la SEQ ID NO: 384 es ácido glutámico, el aminoácido en el equivalente de la serina al residuo 35 de la SEQ ID NO: 384 es ácido aspártico, el aminoácido en el equivalente de la serina en el residuo 71 de la SEQ ID NO: 384 es treonina, el aminoácido en el equivalente de la serina en el residuo 71 de SEQ ID NO. : 384 es cisteína, o el aminoácido en el equivalente de la serina en el residuo 194 de la SEQ ID NO: 384 es histidina.
La invención proporciona polipéptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa, donde el polipéptido tiene una secuencia que comprende uno o más de los siguientes cambios en la secuencia de aminoácidos de la SEQ ID NO: 384: la treonina en la posición 4 del aminoácido es leucina, la serina en la posición de aminoácido 9 es prolina, la glutamina en la posición de aminoácido 10 es serina, la treonina en la posición de aminoácido 13 es fenilalanina, la treonina en la posición de aminoácido 13 es tirosina, la treonina en posición de aminoácido 13 es isoleucina, la treonina en la posición de aminoácido 13 es triptófano, la asparagina en la posición
de aminoácido 14 es histidina, la tirosina en la posición de aminoácido 18 es fenilalanina, la serina en la posición de
aminoácido 25 es ácido glutámico, la serina en la posición de aminoácido 25 es prolina, la asparagina en la posición
de aminoácido 30 es valina, la glutamina en la posición de aminoácido 34 es cisteína, la glutamina en la posición de
aminoácido 34 es histidina, la glutamina en la posición de aminoácido 34 es leucina, la serina en la posición de aminoácido 35 es ácido glutámico, la serina en la posición de aminoácido 35 es ácido aspártico, la serina en la posición de aminoácido 71 es treonina, la serina en la posición de aminoácido 71 es cisteína, o la serina en la posición de aminoácido 194 es histidina. En aspectos alternativos, el cambio de secuencia comprende al menos dos de los cambios, al menos tres de los cambios, al menos cuatro de los cambios, o el cambio de secuencia comprende al menos cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los cambios.
Los péptidos aislados, sintéticos o recombinantes de la invención tienen una actividad xilanasa, por ejemplo, donde la actividad xilanasa comprende catalizar hidrólisis de enlaces p-1,4-xilosídicos internos; comprende una actividad endo-1,4-beta-xilanasa; comprende hidrolizar un xilano o un arabinoxilano para producir un xilololigómero y xiloligómero de menor peso molecular; comprende hidrolizar un polisacárido que comprende una D-xilopiranosa unida a 1,4-p-glucósido; comprende hidrolizar una celulosa o una hemicelulosa; comprende hidrolizar una celulosa o una hemicelulosa en una madera, productos de madera, pasta de papel, productos de papel o desechos de papel; comprende catalizar la hidrólisis de un xilano o un arabinoxilano en una alimentación o un producto alimenticio; o, comprende catalizar la hidrólisis de un xilano o un arabinoxilano en una célula microbiana o una célula vegetal. El xilano puede comprender un arabinoxilano, por ejemplo, un arabinoxilano soluble en agua, por ejemplo, un arabinoxilano soluble en agua en una masa o un producto de pan.
En un aspecto, la actividad comprende hidrolizar polisacáridos, por ejemplo, que comprenden D-xilopiranosas unidas por 1,4-p-glucósido, o hidrolizar hemicelulosas, por ejemplo, hidrolizar hemicelulosas en una madera, productos de madera, pasta de papel, productos de papel o residuos de papel.
En un aspecto, la actividad xilanasa comprende catalizar la hidrólisis de polisacáridos, por ejemplo, xilanos, en un alimento o un producto alimenticio, como un alimento para animales a base de cereales, un mosto o una cerveza, una leche o un producto lácteo, una fruta o un vegetal. En un aspecto, la actividad xilanasa comprende catalizar la hidrólisis de xilanos en una célula microbiana o una célula vegetal.
La invención proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden un polipéptido de la invención y que carece de una secuencia señal o una secuencia prepro. La invención proporciona polipéptidos aislados, sintéticos o recombinantes que comprenden un polipéptido de la invención y que tiene una secuencia señal
5
10
15
20
25
30
35
40
45
50
55
60
65
heteróloga o una secuencia prepro heteróloga.
Un polipéptido de la invención puede tener actividad xilanasa que comprende una actividad específica a aproximadamente 37 °C en el intervalo de aproximadamente 100 a aproximadamente 1000 unidades por miligramo de proteína, de aproximadamente 500 a aproximadamente 750 unidades por miligramo de proteína o de aproximadamente 750 a aproximadamente 1000 unidades por miligramo de proteína. Las unidades se pueden definir como 0,1 a 20 unidades/g de pasta, donde una unidad es igual a umol de xilosa liberada por minuto por mg de enzima, usando arabinoxilano como sustrato como se describe en el ensayo de Nelson Somogyi, descrito con detalle más adelante. Los polipéptidos de la invención pueden tener actividad xilanasa en el intervalo de entre aproximadamente 0,05 y 20 unidades por gramo de pasta, o 0,05, 0,10, 0,20, 0,30, 0,40, 0,50, 0,60, 0,70, 0,80, 0,90, 1,0, 1,5, 2,0, 2,5, 3,0, 3,5, 4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 o más unidades por gramo de pasta (donde una unidad equivale a umol de xilosa liberada por minuto por mg de enzima, usando arabinoxilano como sustrato como se describe en el ensayo de Nelson Somogyi).
La termotolerancia de los polipéptidos puede comprender la retención de al menos la mitad de la actividad específica de la xilanasa a 37 °C después de calentarse a una temperatura elevada. La termotolerancia puede comprender la retención de actividad específica a 37 °C en el intervalo de aproximadamente 500 a aproximadamente 1200 unidades por miligramo de proteína después de calentarse a una temperatura elevada.
Los polipéptidos de la invención pueden comprender al menos un sitio de glicosilación o pueden comprender además un polisacárido. La glicosilación puede ser una glicosilación ligada a N, por ejemplo donde el polipéptido está glicosilado después de ser expresado en P. pastoris o S. pombe.
La actividad xilanasa de los polipéptidos de la invención puede conservar actividad en condiciones ácidas que comprenden un pH de aproximadamente 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4 o menor (más ácido) o conservar una actividad xilanasa tras la exposición a condiciones ácidas que comprenden un pH de aproximadamente 6,5, pH 6, pH 5,5, pH 5, pH 4,5 o pH 4 o menor (más ácido) o conservar una actividad xilanasa después de exposición a condiciones básicas que comprenden un pH de aproximadamente 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5 o pH 11, pH 11,5, pH 12, pH 12,5 o mayor (más básico). Los polipéptidos de la invención pueden conservar actividad a una temperatura de al menos aproximadamente 80 °C, 81 °C, 82 °C, 83 °C, 84 °C, 85 °C, 86 °C, 87 °C, 88 °C, 89 °C o 90 °C, y un pH básico de al menos aproximadamente pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12, pH 12,5 o mayor (más básico).
La invención proporciona preparaciones de proteína que comprenden un polipéptido de la invención, donde la preparación de proteína comprende un líquido, una suspensión, un sólido o un gel. Los heterodímeros pueden comprender un polipéptido de la invención y un segundo dominio. El segundo dominio puede ser un polipéptido y el heterodímero es una proteína de fusión. El segundo dominio puede ser un epítopo o una etiqueta.
Los homodímeros o heterodímeros pueden comprender un polipéptido de la invención. Los polipéptidos inmovilizados pueden comprender una secuencia de la invención, o una subsecuencia de la misma o un polipéptido codificado por un ácido nucleico de la invención, o un polipéptido que comprende un polipéptido de la invención y un segundo dominio, por ejemplo donde el polipéptido está inmovilizado sobre o dentro de una célula, una vesícula, un liposoma, una película, una membrana, un metal, una resina, un polímero, una cerámica, un vidrio, un microelectrodo, una partícula grafítica, una cuenta, un gel, una placa, una matriz, un tubo capilar, un cristal, un comprimido, una pastilla, una cápsula, un polvo, un aglomerado, una superficie, una estructura porosa o materiales tales como astillas de madera, pasta de madera, pasta, papel y materiales derivados de los mismos.
Las xilanasas de la invención pueden usarse o formularse solas o como una mezcla (un "cóctel") de xilanasas y/o glucanasas y otras enzimas hidrolíticas tales como celulasas, mannanasas, proteasas, lipasas, amilasas o enzimas redox, tales como lacasas, peroxidasas, catalasas, oxidasas o reductasas. Se pueden usar formuladas en una forma sólida tal como un polvo, una preparación liofilizada, un gránulo, una tableta, una barra, un cristal, una cápsula, una píldora, un gránulo, o en una forma líquida tal como en una solución acuosa, un aerosol, un gel, una pasta, una suspensión, una emulsión acuosa/aceitosa, una crema, una cápsula, o en una suspensión vesicular o micelar. Las formulaciones de la invención pueden comprender cualquiera o una combinación de los siguientes ingredientes: polioles tales como un polietilenglicol, un poli (alcohol vinílico), un glicerol, un azúcar tal como sacarosa, un sorbitol, una trehalosa, una glucosa, una fructosa, una maltosa, una manosa, un agente gelificante tal como una goma guar, un carragenano, un alginato, un dextrano, un derivado celulósico, una pectina, una sal tal como un cloruro de sodio, un sulfato de sodio, un sulfato de amonio, un cloruro de calcio, un cloruro de magnesio, un cloruro de cinc, un sulfato de cinc, una sal de un ácido graso y un derivado de ácido graso, un quelante de metales como un EDTA, un EGTA, un citrato de sodio, un agente antimicrobiano como un ácido graso o un ácido graso derivado, un parabeno, un sorbato, un benzoato, un compuesto modulador adicional para bloquear el impacto de una enzima tal como una proteasa, una proteína a granel tal como una BSA, un hidrolizado de trigo, un compuesto de borato, un aminoácido o un péptido, un compuesto modulador de pH o temperatura apropiado, un emulsionante tal como un detergente no iónico y/o iónico, un agente redox tal como una cistina/cisteína, un glutatión, un glutatión oxidado, un compuesto reducido o un antioxidante tal como un ácido ascórbico o un dispersante. La reticulación y la modificación de proteínas tales como la pegilación, modificación de ácidos grasos, glicosilación también pueden usarse para mejorar
5
10
15
20
25
30
35
40
45
50
55
60
65
la estabilidad de la enzima.
Las matrices pueden comprender polipéptido(s) y/o ácidos nucleicos inmovilizados de la invención, y matrices que comprenden un oligonucleótido inmovilizado de la invención. Las enzimas, fragmentos de las mismas y ácidos nucleicos que codifican las enzimas, o sondas de la invención, y fragmentos de las mismas, se pueden fijar a un soporte sólido; y estas realizaciones pueden ser económicas y eficientes en el uso de enzimas y ácidos nucleicos de la invención en el procesamiento de suplementos industriales, médicos, de investigación, farmacéuticos, alimentos y piensos y alimentos y suplementos alimenticios y otras aplicaciones y procesos. Por ejemplo, un consorcio o cóctel de enzimas (o fragmentos activos del mismo), que se usan en una reacción química específica, se puede unir a un soporte sólido y sumergirlo en una cuba de proceso. La reacción enzimática puede ocurrir. Luego, el soporte sólido puede extraerse de la cuba, junto con las enzimas fijadas a la misma, para un uso repetido. El ácido nucleico aislado se puede fijar a un soporte sólido. El soporte sólido puede seleccionarse del grupo de un gel, una resina, un polímero, una cerámica, un vidrio, un microelectrodo y cualquier combinación de los mismos.
Por ejemplo, los soportes sólidos útiles incluyen geles. Algunos ejemplos de geles incluyen sefarosa, gelatina, glutaraldehído, glutaraldehído tratado con quitosano, albúmina-glutaraldehído, quitosano-xantana, gel de Toyopearl (gel de polímero), alginato, alginato-polilisina, carragenano, agarosa, agarosa con glioxilo, agarosa magnética, dextrano-agarosa, hidrogel de poli (carbamoil sulfonato), hidrogel BSA-PEG, poli (alcohol vinílico) fosforilado (PVA), monoaminoetil-N-aminoetilo (MANA), amino o cualquier combinación de los mismos. Otro soporte sólido útil son resinas o polímeros. Algunos ejemplos de resinas o polímeros incluyen celulosa, acrilamida, nylon, rayón, poliéster, resina de intercambio aniónico AMBERLITE™ XAD-7, AMBERLITE™ XAD-8, AMBERLITE™ IRA-94, AMBERLITE™ IRC-50, polivinilo, poliacrílico, polimetacrilato, o cualquier combinación de los mismos Otro tipo útil de soporte sólido es de cerámica. Algunos ejemplos incluyen cerámica no porosa, cerámica porosa, SiO2, A^O3. Otro tipo útil de soporte sólido es el vidrio. Algunos ejemplos incluyen vidrio no poroso, vidrio poroso, vidrio aminopropilo o cualquier combinación de los mismos. Otro tipo de soporte sólido que se puede usar es un microelectrodo. Un ejemplo es una magnetita recubierta con polietilenimina. Las partículas grafíticas se pueden usar como un soporte sólido. Otro ejemplo de un soporte sólido es una célula, como un glóbulo rojo.
Existen muchos métodos que un experto en la técnica conocería para inmovilizar enzimas o fragmentos de los mismos, o ácidos nucleicos, sobre un soporte sólido. Algunos ejemplos de tales métodos incluyen la generación electrostática de gotas, medios electroquímicos, mediante adsorción, mediante unión covalente, mediante reticulación, a través de una reacción o proceso químico, mediante encapsulación, mediante atrapamiento, a través de alginato de calcio o a través de poli(metacrilato de 2-hidroxietilo). Los métodos similares se describen en Methods in Enzymology, Immobilized Enzymes and Cells, Part C. 1987. Academic Press. Editado por S. P. Colowick y N. O. Kaplan. Volumen 136; e Immobilization of Enzymes and Cells. 1997. Humana Press. Editado por G. F. Bickerstaff. Series: Methods in Biotechnology, Editado por J. M. Walker.
La divulgación proporciona anticuerpos aislados, sintéticos o recombinantes que se unen específicamente a un polipéptido de la invención. El anticuerpo puede ser un anticuerpo monoclonal o policlonal o es un anticuerpo monocatenario. Los hibridomas pueden comprender un anticuerpo que se une específicamente a un polipéptido de la invención.
Los métodos para aislar o identificar un polipéptido con una actividad xilanasa pueden comprender las etapas de: (a) proporcionar dicho anticuerpo; (b) proporcionar una muestra que comprende polipéptidos; y (c) poner en contacto la muestra de la etapa (b) con el anticuerpo de la etapa (a) en condiciones en las que el anticuerpo se puede unir específicamente al polipéptido, aislando o identificando de ese modo un polipéptido que tiene una actividad xilanasa. Los métodos para elaborar un anticuerpo anti-xilanasa comprenden administrar a un animal no humano un ácido nucleico de la invención o una subsecuencia del mismo en una cantidad suficiente para generar una respuesta inmunitaria humoral, elaborando de ese modo un anticuerpo anti-xilanasa. Los métodos para elaborar un anticuerpo anti-xilanasa comprenden administrar a un animal no humano o un polipéptido de la invención o una subsecuencia del mismo en una cantidad suficiente para generar una respuesta inmunitaria humoral, fabricando de este modo un anticuerpo anti-xilanasa.
La invención proporciona métodos para producir un polipéptido recombinante que comprende las etapas de: (a) proporcionar un ácido nucleico conectado operablemente a un promotor, donde el ácido nucleico comprende una secuencia de la invención; y (b) expresar el ácido nucleico de la etapa (a) en condiciones que permitan la expresión del polipéptido, produciendo de ese modo un polipéptido recombinante. El método puede comprender adicionalmente transformar una célula huésped con el ácido nucleico de la etapa (a) seguido de la expresión del ácido nucleico de la etapa (a), produciendo de ese modo un polipéptido recombinante en una célula transformada.
La invención proporciona métodos para identificar un polipéptido que tiene una actividad xilanasa que comprende las siguientes etapas: (a) proporcionar un polipéptido de la invención; o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un sustrato de xilanasa; y (c) poner en contacto el con el sustrato de la etapa (b) y detectar un descenso en la cantidad de sustrato o un incremento en la cantidad de un producto de reacción, donde un descenso en la cantidad del sustrato o un incremento en la cantidad del producto de reacción detecta un polipéptido que tiene actividad xilanasa.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los métodos para identificar un sustrato de xilanasa, mannanasa y/o glucanasa comprenden las siguientes etapas:
(a) proporcionar un polipéptido de la invención; (b) proporcionar un sustrato de ensayo; y (c) poner en contacto el polipéptido de la etapa (a) con el sustrato de ensayo de la etapa (b) y detectar un descenso en la cantidad de sustrato o un incremento en la cantidad de producto de reacción, donde un descenso en la cantidad de sustrato o un incremento en la cantidad de un producto de reacción identifica el sustrato de ensayo como un sustrato de xilanasa, mannanasa y/o glucanasa.
Los métodos para determinar si un compuesto de ensayo se une específicamente a un polipéptido comprenden las siguientes etapas: (a) expresar un ácido nucleico o un vector que comprende el ácido nucleico en condiciones permisivas para la traducción del ácido nucleico a un polipéptido, donde el ácido nucleico tiene una secuencia de la invención; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido con el compuesto de ensayo; y (d) determinar si el compuesto de ensayo de la etapa (b) se une específicamente al polipéptido.
Los métodos para determinar si un compuesto de ensayo se une específicamente a un polipéptido comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención o; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido con el compuesto de ensayo y (d) determinar si el compuesto de ensayo de la etapa
(b) se une específicamente al polipéptido.
Los métodos para identificar un modulador de una actividad xilanasa comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención; (b) proporcionar un compuesto de ensayo; (c) poner en contacto el polipéptido de la etapa (a) con el compuesto de ensayo de la etapa (b) y medir una actividad de la xilanasa, donde un cambio en la actividad xilanasa medida en presencia del compuesto de ensayo en comparación con la actividad en ausencia del compuesto de ensayo proporciona una determinación de que el compuesto de ensayo modula la actividad xilanasa. Se puede medir la actividad xilanasa proporcionando un sustrato de xilanasa y detectando un descenso en la cantidad del sustrato o un incremento en la cantidad de un producto de reacción, o, un incremento en la cantidad del sustrato o un descenso en la cantidad de un producto de reacción. Un descenso en la cantidad del sustrato o un incremento en la cantidad del producto de reacción con el compuesto de ensayo en comparación con la cantidad de sustrato o producto de reacción sin el compuesto de ensayo identifican el compuesto de ensayo como un activador de una actividad xilanasa. Un incremento en la cantidad del sustrato o un descenso en la cantidad del producto de reacción con el compuesto de ensayo en comparación con la cantidad de sustrato o producto de reacción sin el compuesto de ensayo identifican el compuesto de ensayo como un inhibidor de una actividad xilanasa.
Los sistemas informáticos comprenden un procesador y un dispositivo de almacenamiento de datos donde dicho dispositivo de almacenamiento de datos tiene almacenada una secuencia polipeptídica o una secuencia de ácido nucleico, donde la secuencia polipeptídica comprende la secuencia de la invención, un polipéptido codificado por un ácido nucleico de la invención. Los sistemas informáticos pueden comprender además un algoritmo de comparación de secuencias y un dispositivo de almacenamiento de datos que tiene al menos una secuencia de referencia almacenada en el mismo. El algoritmo de comparación de secuencias comprende un programa informático que indica polimorfismos. El sistema informático puede comprender además un identificador que identifica una o más características en dicha secuencia. Los métodos para identificar una característica en una secuencia comprenden los pasos de: (a) leer la secuencia usando un programa informático que identifica una o más características en una secuencia, donde la secuencia comprende una secuencia polipeptídica o una secuencia de ácido nucleico de la invención; y (b) identificar una o más características en la secuencia con el programa informático. Los métodos para comparar una primera secuencia con una segunda secuencia comprenden los pasos de: (a) leer la primera secuencia y la segunda secuencia mediante el uso de un programa informático que compara secuencias, donde la primera secuencia comprende una secuencia polipeptídica o una secuencia de ácido nucleico de la invención; y (b) determinar las diferencias entre la primera secuencia y la segunda secuencia con el programa informático. La etapa de determinar las diferencias entre la primera secuencia y la segunda secuencia puede comprender además la etapa de identificación de polimorfismos. El método puede comprender además un identificador que identifica una o más características en una secuencia. El método puede comprender leer la primera secuencia usando un programa informático e identificar una o más características en la secuencia.
Los métodos para aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental comprenden las etapas de: (a) proporcionar un par de secuencias cebadoras de amplificación para amplificar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa, donde el par de cebadores es capaz para amplificar un ácido nucleico de la invención; (b) aislar un ácido nucleico a partir de la muestra ambiental o tratar la muestra ambiental de manera que el ácido nucleico en la muestra sea accesible para la hibridación al par de cebadores de amplificación; y, (c) combinar el ácido nucleico de la etapa (b) con el par de cebadores de amplificación de la etapa (a) y amplificar el ácido nucleico a partir de la muestra ambiental, aislando o recuperando de ese modo un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental. Uno o cada miembro del par de secuencias cebadoras de amplificación puede comprender un oligonucleótido que comprende al menos aproximadamente 10 a 50 bases consecutivas de una secuencia de la invención. En un aspecto, el par de secuencias cebadoras de amplificación es un par de amplificación de la invención.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los métodos para aislar o recuperar un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental comprenden las etapas de: (a) proporcionar un sonda de polinucleótido que comprende un ácido nucleico de la invención o una subsecuencia del mismo; (b) aislar un ácido nucleico a partir de la muestra ambiental o tratar la muestra ambiental de manera que el ácido nucleico en la muestra sea accesible para la hibridación a una sonda de polinucleótido de la etapa (a); (c) combinar el ácido nucleico aislado o la muestra ambiental tratada de la etapa (b) con la sonda de polinucleótido de la etapa (a); y (d) aislar un ácido nucleico que hibrida específicamente con la sonda de polinucleótido de la etapa (a), aislando o recuperando de ese modo un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa a partir de una muestra ambiental. La muestra ambiental puede comprender una muestra de agua, una muestra líquida, una muestra de suelo, una muestra de aire o una muestra biológica. La muestra biológica se puede obtener de una célula bacteriana, una célula de protozoo, una célula de insecto, una célula de levadura, una célula vegetal, una célula fúngica o una célula de mamífero.
Los métodos para generar una variante de un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa comprenden las etapas de: (a) proporcionar un ácido nucleico molde que comprende un ácido nucleico de la invención; y (b) modificar, suprimir o añadir uno o más nucleótidos en la secuencia molde, o una de sus combinaciones, para generar una variante del ácido nucleico molde. El método puede comprender adicionalmente expresar el ácido nucleico variante para generar una polipéptido de xilanasa variante. Las modificaciones, adiciones o deleciones se pueden introducir mediante un método que comprende PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (por ejemplo, GeneReassembly, véase, por ejemplo, La Patente de los Estados Unidos Núm. 6.537.776), mutagénesis por saturación de sitio de genes (GSSM), reensamblaje de ligación sintética (SLR) o una de sus combinaciones. Las modificaciones, adiciones o supresiones también se pueden introducir por un procedimiento que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis de molde que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis por reparación de apareamiento erróneo, mutagénesis de cepa huésped de reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis por supresión, mutagénesis por restricción-selección, mutagénesis por restricción-purificación, síntesis artificial de genes, mutagénesis de ensamblaje, creación de multímeros de ácidos nucleicos quiméricos y una de sus combinaciones.
El método puede repetirse iterativamente hasta que se produzca una xilanasa que tenga una actividad alterada o diferente o una estabilidad alterada o diferente de la de un polipéptido codificado por el ácido nucleico molde. El polipéptido de xilanasa variante puede ser termotolerante, y conservar cierta actividad después de ser expuesto a una temperatura elevada. El polipéptido de xilanasa variante puede tener una glicosilación aumentada en comparación con la xilanasa codificada por un ácido nucleico molde. Como alternativa, el polipéptido de xilanasa variante tiene actividad xilanasa a alta temperatura, donde la xilanasa codificada por el ácido nucleico molde no es activa a la alta temperatura. El método puede repetirse iterativamente hasta que se produzca una xilanasa que codifique una secuencia que tenga un uso de codón alterado a partir de la del ácido nucleico molde. El método puede repetirse iterativamente hasta que se produzca un gen de xilanasa que tenga un nivel mayor o menor de expresión del mensaje o estabilidad que el del ácido nucleico molde. La formulación del producto final de xilanasa permite un incremento o modulación del funcionamiento de la xilanasa en el producto.
Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para incrementar su expresión en una célula huésped, comprenden las siguientes etapas: (a) proporcionar un ácido nucleico de la invención que codifica un polipéptido que tiene una actividad xilanasa; y, (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y remplazarlo con un codón preferido o utilizado neutramente que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula huésped, modificando de ese modo el ácido nucleico para incrementar su expresión en una célula huésped.
Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa comprenden las siguientes etapas: (a) proporcionar un ácido nucleico de la invención; y, (b) identificar un codón en el ácido nucleico de la etapa (a) y remplazarlo por un codón diferente que codifica el mismo aminoácido que el codón remplazado, modificando de ese modo codones en un ácido nucleico que codifica una xilanasa.
Los métodos para modificar codones en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para incrementar su expresión en una célula huésped comprenden las siguientes etapas: (a) proporcionar un ácido nucleico de la invención que codifica un polipéptido de xilanasa; y, (b) identificar un codón no preferido o menos preferido en el ácido nucleico de la etapa (a) y remplazarlo por un codón preferido o utilizado neutramente que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula huésped, modificando de ese modo el ácido nucleico para incrementar su expresión en una célula huésped.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los métodos para modificar un codón en un ácido nucleico que codifica un polipéptido que tiene una actividad xilanasa para disminuir su expresión en una célula huésped comprenden las siguientes etapas: (a) proporcionar un ácido nucleico de la invención; y (b) identificar al menos un codón preferido en el ácido nucleico de la etapa (a) y remplazarlo por un codón no preferido o menos preferido que codifica el mismo aminoácido que el codón remplazado, donde un codón preferido es un codón representado en exceso en secuencias codificantes en genes en una célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula huésped, modificando de ese modo el ácido nucleico para disminuir su expresión en una célula huésped. La célula huésped puede ser una célula bacteriana, una célula fúngica, una célula de insecto, una célula de levadura, una célula vegetal o una célula de mamífero.
Una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al sustrato, donde los sitios activos modificados o los sitios de unión al sustrato se obtienen de un a primer ácido nucleico que comprende una secuencia que codifica un primer sitio activo o un primer sitio de unión al sustrato se puede producir mediante las siguientes etapas: (a) proporcionar un primer ácido nucleico que codifica un primer sitio activo o el primer sitio de unión al sustrato, donde la primera secuencia de ácido nucleico comprende una secuencia que hibrida en condiciones restrictivas con una secuencia de la invención o una subsecuencia de la misma, y el ácido nucleico codifica un sitio activo de xilanasa o un sitio de unión al sustrato de xilanasa; (b) proporcionar un conjunto de oligonucleótidos mutagénicos que codifican variantes de aminoácidos de origen natural en una pluralidad de codones elegidos como diana en el primer ácido nucleico; y, (c) utilizar el conjunto de oligonucleótidos mutagénicos para generar un conjunto de ácidos nucleicos variantes que codifican el sitio activo o codifican el sitio de unión al sustrato que codifican una variedad de variaciones de aminoácido en cada codón de aminoácido que fue mutagenizado, produciendo de ese modo una biblioteca de ácidos nucleicos que codifican una pluralidad de sitios activos de xilanasa modificados o sitios de unión al sustrato. El método puede comprender mutageneizar el primer ácido nucleico de la etapa (a) por medio de un método que comprende un sistema de evolución directa optimizada, mutagénesis por saturación del sitio de genes (GSSM) o un reensamblaje de ligación sintética (SLR). El método puede comprender mutageneizar el primer ácido nucleico de la etapa (a) o variantes mediante un método que comprende PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (GeneReassembly, Patente de los Estados Unidos Núm. 6.537.776), mutagénesis por saturación de sitio de genes (GSSM), reensamblaje de ligación sintética (SLR) y una de sus combinaciones. El método puede comprender mutageneizar el primer ácido nucleico de la etapa (a) o variantes por medio de un método que comprende recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis de molde que contiene uracilo, mutagénesis de dúplex discontinuo, mutagénesis por reparación de apareamiento erróneo, mutagénesis de cepa huésped de reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis por supresión, mutagénesis por restricción-selección, mutagénesis por restricción-purificación, síntesis artificial de genes, mutagénesis de ensamblaje, creación de multímeros de ácidos nucleicos quiméricos y una de sus combinaciones.
Los métodos para elaborar una molécula pequeña comprenden las siguientes etapas: (a) proporcionar un pluralidad de enzimas biosintéticas capaces de sintetizar o modificar una molécula pequeña, donde una de las enzimas comprende una enzima xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un sustrato para al menos una de las enzimas de la etapa (a); y (c) hacer reaccionar el sustrato de la etapa (b) con las enzimas en condiciones que faciliten una pluralidad de reacciones biocatalíticas para generar una molécula pequeña mediante una serie de reacciones biocatalíticas. Los métodos para modificar una molécula pequeña comprenden las siguientes etapas: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido de la invención, o, un polipéptido codificado por un ácido nucleico de la invención, o una subsecuencia del mismo; (b) proporcionar un molécula pequeña; y (c) hacer reaccionar la enzima de la etapa (a) con la molécula pequeña de la etapa (b) en
condiciones que faciliten una reacción enzimática catalizada por la enzima xilanasa, modificando de ese modo una
molécula pequeña por una reacción enzimática de xilanasa. El método puede comprender una pluralidad de
sustratos de molécula pequeña para la enzima de la etapa (a), generándose de ese modo una biblioteca de
moléculas pequeñas modificadas producidas por al menos una reacción enzimática catalizada por la enzima xilanasa. El método puede comprender una pluralidad de enzimas adicionales en condiciones que faciliten una pluralidad de reacciones biocatalíticas por las enzimas para formar una biblioteca de moléculas pequeñas modificadas producidas por la pluralidad de reacciones enzimáticas. En otro aspecto, el método puede comprender adicionalmente la etapa de someter a ensayo la biblioteca para determinar si una molécula pequeña modificada concreta que muestra una actividad deseada está presente en la biblioteca. La etapa de someter a ensayo la biblioteca puede comprender adicionalmente las etapas de eliminación sistemáticas de todas menos una de las reacciones biocatalíticas utilizadas para producir una porción de la pluralidad de las moléculas pequeñas modificadas en la biblioteca sometiendo a ensayo la porción de la molécula pequeña modificada por la presencia o ausencia de la molécula pequeña modificada concreta con una actividad deseada, e identificación de al menos una reacción biocatalítica específica que produce la molécula pequeña modificada concreta de actividad deseada.
Los métodos para determinar un fragmento funcional de una enzima xilanasa comprenden las etapas de: (a) proporcionar una enzima xilanasa, donde la enzima comprende un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención, o una subsecuencia del mismo; y (b) suprimir una pluralidad de
5
10
15
20
25
30
35
40
45
50
55
60
65
residuos de aminoácidos de la secuencia de la etapa (a) y someter a ensayo la subsecuencia restante para determinar una actividad xilanasa, determinando de ese modo un fragmento funcional de una enzima xilanasa. En un aspecto, la actividad xilanasa se mide proporcionando un sustrato de xilanasa y detectando un descenso en la cantidad del sustrato o un incremento en la cantidad de un producto de reacción.
Los métodos para construir células completas de fenotipos nuevos o modificados utilizando análisis de flujo metabólico en tiempo real comprenden las siguientes etapas: (a) elaborar una célula modificada modificando la composición genética de una célula, donde la composición genética es modificada mediante la adición a la célula de un ácido nucleico de la invención; (b) cultivar la célula modificada para generar una pluralidad de células modificadas; (c) medir al menos un parámetro metabólico de la célula controlando el cultivo celular de la etapa (b) en tiempo real; y, (d) analizar los datos de la etapa (c) determinar si el parámetro medido difiere de una medición comparable en una célula no modificada en condiciones similares, identificando de ese modo un fenotipo construido en la célula utilizando análisis de flujo metabólico en tiempo real. La composición genética de la célula se puede modificar por medio de un método que comprende deleción de una secuencia o modificación de una secuencia en la célula, o, desactivar la expresión de un gen. El método puede comprender adicionalmente seleccionar una célula que comprende un fenotipo construido recientemente. El método puede comprender cultivar la célula seleccionada, generándose de ese modo una nueva cepa celular que comprende un fenotipo construido recientemente.
Las secuencias señal aisladas, sintéticas o recombinantes pueden consistir en, o comprender, una secuencia como se establece en los residuos 1 a 12, 1 a 13, 1a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 40, 1 a 41, 1 a 42, 1 a 43 o 1 a 44, de un polipéptido de la invención, que incluye secuencias polipeptídicas de ejemplo de la invención. Las secuencias señal aisladas, sintéticas o recombinantes pueden consistir en, o comprender secuencias como se expone a continuación en la Tabla 4.
Los polipéptidos quiméricos pueden comprender al menos un primer dominio que comprende un péptido señal (SP) y al menos un segundo dominio que comprende un polipéptido o péptido heterólogo que comprende una secuencia de la invención, o una subsecuencia de la misma, en la que el polipéptido o péptido heterólogo no está asociado de forma natural con el péptido señal (SP). El péptido señal (SP) puede no derivarse de una xilanasa. El polipéptido o péptido heterólogo puede ser amino terminal, carboxi terminal ao en ambos extremos del péptido señal (SP) o un dominio catalítico de xilanasa (CD). Los ácidos nucleicos aislados, sintéticos o recombinantes codifican un polipéptido quimérico, donde el polipéptido quimérico comprende al menos un primer dominio que comprende el péptido señal (SP) y al menos un segundo dominio que comprende un polipéptido o péptido heterólogo que comprende una secuencia de la invención, o una subsecuencia de la misma, donde el polipéptido o péptido heterólogo no está naturalmente asociado con el péptido señal (SP).
Los métodos para aumentar la termotolerancia o la termoestabilidad de un polipéptido de xilanasa comprenden la glicosilación de un polipéptido de xilanasa, donde el polipéptido comprende al menos treinta aminoácidos contiguos de un polipéptido de la invención; o un polipéptido codificado por una secuencia de ácido nucleico de la invención, incrementando de ese modo la termotolerancia o la termoestabilidad del polipéptido de xilanasa. La actividad específica de la xilanasa puede ser termoestable o termotolerante a una temperatura en el intervalo de más de aproximadamente 37 °C a aproximadamente 85 °C, 90 °C, 95 °C, 97 °C o más.
Los métodos para expresar en exceso un polipéptido de xilanasa recombinante en una célula comprenden expresar un vector que comprende un ácido nucleico que comprende un ácido nucleico de la invención o una secuencia de ácido nucleico de la invención, donde las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencia o mediante inspección visual, donde la expresión en exceso se efectúa mediante el uso de un promotor de alta actividad, un vector dicistrónico o mediante amplificación génica del vector.
Los métodos para elaborar una planta y semillas transgénicas comprenden las siguientes etapas: (a) introducir una secuencia de ácido nucleico heteróloga en la célula, donde la secuencia de ácido nucleico heteróloga comprende una secuencia de ácido nucleico de la invención, produciendo de ese modo una célula vegetal o de semilla transformada; y (b) producir una planta transgénica a partir de la célula o semilla transformada. La etapa (a) puede comprender adicionalmente introducir la secuencia de ácido nucleico heteróloga mediante electroporación o microinyección de protoplastos de células vegetales. La etapa (a) puede comprender adicionalmente introducir la secuencia de ácido nucleico heteróloga directamente en tejido vegetal por medio de bombardeo de partículas de ADN. Como alternativa, la etapa (a) puede comprender adicionalmente introducir la secuencia de ácido nucleico heteróloga en el ADN de la célula vegetal utilizando un anfitrión Agrobacterium tumefaciens. La célula vegetal puede ser una célula de patata, maíz, arroz, trigo, tabaco, o cebada.
Los métodos para expresar una secuencia de ácido nucleico heteróloga en una célula vegetal comprenden las siguientes etapas: (a) transformar la célula vegetal con una secuencia de ácido nucleico heteróloga conectado operablemente a un promotor, donde la secuencia de ácido nucleico heteróloga comprende un ácido nucleico de la invención; (b) cultivar la planta en condiciones en las que la secuencia de ácido nucleico heteróloga se exprese en la célula vegetal. Los métodos para expresar una secuencia de ácido nucleico heteróloga en una célula vegetal comprenden las siguientes etapas: (a) transformar la célula vegetal con una secuencia de ácido nucleico heteróloga
5
10
15
20
25
30
35
40
45
50
55
60
65
conectada operablemente a un promotor, donde la secuencia de ácido nucleico heteróloga comprende una secuencia de la invención; (b) cultivar la planta en condiciones en las que la secuencia de ácido nucleico heteróloga se exprese en la célula vegetal.
Los métodos para hidrolizar, romper o desorganizar una composición comprenden xilano que comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un composición que comprende a xilano; y (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa hidroliza, rompe o desorganiza la composición que comprende xilano. La composición puede comprender una célula vegetal, una célula bacteriana, una célula de levadura, una célula de insecto, o una célula animal. De este modo, la composición puede comprender cualquier planta o parte de planta, cualquier alimento o pienso, un producto de desecho y similares.
Los métodos para licuar o separar una composición que comprende xilano comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un composición que comprende un xilano; y (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa separa, reblandece o licua la composición que comprende xilano.
Las composiciones detergentes comprenden un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención, donde el polipéptido tiene una actividad xilanasa. La xilanasa puede ser una xilanasa no tensioactiva o una xilanasa tensioactiva. La xilanasa se puede formular en una composición líquida no acuosa, un sólido moldeado, una forma granular, una forma particulada, una tableta comprimida, una forma de gel, una pasta o una forma en suspensión. Los métodos para lavar un objeto comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un objeto; y (c) poner en contacto el polipéptido de la etapa (a) y el objeto de la etapa (b) en condiciones en las que la composición pueda lavar el objeto.
Los productos textiles o tejidos, que incluyen, por ejemplo, fibras, comprenden un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención. Los productos textiles o tejidos comprenden fibras que contienen xilano. Los métodos para tratar un producto textil o tejido (por ejemplo, eliminando una mancha de una composición) comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un producto textil o tejido que comprende un xilano; y (c) poner en contacto el polipéptido de la etapa
(a) y la composición de la etapa (b) en condiciones en las que la xilanasa pueda tratar el producto textil o tejido (por ejemplo, eliminación de la mancha). Los métodos para mejorar el acabado de un tejido comprenden las siguientes etapas: (a) proporcionar un composición que comprende un polipéptido de la invención que tiene una actividad xilanasa, o un polipéptido codificado por un ácido nucleico de la invención; (b) proporcionar un tejido; y (c) poner en contacto el polipéptido de la etapa (a) y el tejido de la etapa (b) en condiciones en las que el polipéptido pueda tratar el tejido mejorando de ese modo el acabado del tejido. El tejido puede ser una lana o una seda. El tejido puede ser una fibra de celulosa o una mezcla de fibra natural y una fibra sintética.
Los piensos o alimentos comprenden un polipéptido de la invención, o un polipéptido codificado por un ácido nucleico de la invención. Los métodos para hidrolizar xilanos en un pienso o un alimento antes de su consumo por un animal que comprenden las siguientes etapas: (a) obtener un material para pienso que comprende una xilanasa de la invención, o una xilanasa codificada por un ácido nucleico de la invención; y (b) añadir el polipéptido de la etapa (a) al material para pienso o alimento en una cantidad suficiente durante un período de tiempo suficiente para ocasionar la hidrólisis del xilano y la formación de un alimento o pienso tratado, hidrolizando de ese modo los xilanos del alimento o el pienso antes de su consumo por el animal. Los métodos para hidrolizar xilanos en un pienso o un alimento después de su consumo por un animal comprenden las siguientes etapas: (a) obtener un material para pienso que comprende una xilanasa de la invención, o una xilanasa codificada por un ácido nucleico de la invención;
(b) añadir el polipéptido de la etapa (a) al material para pienso o alimento; y (c) administrar el material para pienso o alimento al animal, donde después de su consumo, la xilanasa causa la hidrólisis de los xilanos en el pienso o alimento en el tracto digestivo del animal. El alimento o el pienso pueden ser, por ejemplo, un cereal, un grano, un maíz y similares.
Los productos de masa o pan pueden comprender un polipéptido que tiene una actividad xilanasa, donde el polipéptido comprende una secuencia de la invención, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia de la invención, o un fragmento enzimáticamente activo de la misma. Los métodos de acondicionamiento de masa comprenden poner en contacto una masa o un producto de pan con al menos un polipéptido que tiene actividad xilanasa, donde el polipéptido comprende una secuencia de la invención, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia de la invención, o su fragmento enzimáticamente activo, en condiciones suficientes para acondicionar la masa.
Las bebidas pueden comprender un polipéptido que tiene una actividad xilanasa, donde el polipéptido comprende una secuencia de la invención, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia
5
10
15
20
25
30
35
40
45
50
55
60
65
de la invención. Los métodos de producción de bebidas comprenden la administración de al menos un polipéptido que tiene actividad xilanasa, donde el polipéptido comprende una secuencia de la invención, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia de la invención, o un fragmento enzimáticamente activo de la misma, una bebida o un precursor de bebida en condiciones suficientes para disminuir la viscosidad de la bebida, donde en un aspecto (opcionalmente) el precursor de bebida o bebida es una hierba o una cerveza.
Los alimentos o suplementos nutricionales para un animal pueden comprender un polipéptido de la invención, por ejemplo, un polipéptido codificado por el ácido nucleico de la invención. El polipéptido en el alimento o suplemento nutricional puede ser glicosilado. Las matrices de liberación de enzimas comestibles pueden comprender un polipéptido de la invención, por ejemplo, un polipéptido codificado por el ácido nucleico de la invención. La matriz de liberación puede comprender un pelete. El polipéptido puede ser glicosilado. La actividad xilanasa puede ser termotolerante o termoestable.
Un alimento, un pienso o un suplemento nutricional comprende un polipéptido de la invención. Los métodos para utilizar una xilanasa como suplemento nutricional en una dieta para animales comprenden: preparar un suplemento nutricional que contiene una enzima xilanasa que comprende al menos treinta aminoácidos contiguos de un polipéptido de la invención; y administrar el suplemento nutricional a un animal para incrementar la utilización de un xilano contenido en un pienso o un alimento ingerido por el animal. El animal puede ser un ser humano, un rumiante o un animal monogástrico. La enzima xilanasa se puede preparar mediante la expresión de un polinucleótido que codifica la xilanasa en un organismo seleccionado del grupo que consiste en una bacteria, una levadura, una planta, un insecto, un hongo y un animal. El organismo se puede seleccionar del grupo que consiste en S. pombe, S. cerevisiae, Pichia pastoris, Pseudomonas sp., E. coli, Streptomyces sp., Bacillus sp. y Lactobacillus sp.
Las matrices de liberación de enzimas comestibles comprenden una enzima xilanasa recombinante termoestable, por ejemplo, un polipéptido de la invención. Los métodos para liberar un suplemento de xilanasa a un animal comprenden: preparar una matriz de liberación de enzimas comestible en forma de peletes que comprende un portador comestible granulado y una enzima xilanasa recombinante termoestable, donde los peletes dispersan fácilmente la enzima xilanasa contenida en los mismos en medios acuosos, y administrar la matriz de liberación de enzimas comestible al animal. La enzima xilanasa recombinante puede comprender un polipéptido de la invención. El portador comestible granulado puede comprender un portador seleccionado del grupo que consiste en un germen de grano, un germen de grano residuo de la extracción de aceite, un forraje, una alfalfa, un heno, una cáscara de soja, una harina de semilla de girasol y un salvado de trigo. El portador comestible puede comprender germen de grano usado para aceite. La enzima xilanasa puede ser glicosilada para proporcionar termoestabilidad en condiciones de peletización. La matriz de liberación se puede formar peletizando una mezcla que comprende un germen de grano y una xilanasa. Las condiciones de peletización pueden incluir la aplicación de vapor de agua. Las condiciones de peletización pueden comprender la aplicación de una temperatura en exceso de aproximadamente 80 °C durante aproximadamente 5 minutos y la enzima conserva una actividad específica de al menos 350 a aproximadamente 900 unidades por miligramo de enzima.
Los métodos para mejorar la textura y el sabor de un producto lácteo comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un producto lácteo; y (c) poner en contacto el polipéptido de la etapa (a) y el producto lácteo de la etapa (b) en condiciones en las que la xilanasa pueda mejorar la textura o el sabor del producto lácteo. El producto lácteo puede comprender un queso o un yogurt. Los productos lácteos pueden comprender una xilanasa de la invención o está codificada por un ácido nucleico de la invención.
Los métodos para mejorar la extracción de aceite de un material vegetal rico en aceite comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un material vegetal rico en aceite; y (c) poner en contacto el polipéptido de la etapa (a) y el material vegetal rico en aceite. El material vegetal rico en aceite puede comprender una semilla rica en aceite. El aceite puede ser un aceite de soja, un aceite de oliva, un aceite de colza (canola) o un aceite de girasol.
Los métodos para preparar un zumo, jarabe, puré o extracto de fruta u hortalizas comprenden las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un composición o un líquido que comprende un material de frutas u hortalizas; y (c) poner en contacto el polipéptido de la etapa (a) y la composición, preparando de ese modo el zumo, jarabe, puré o extracto de fruta u hortalizas.
La invención proporciona papeles o productos de papel o la pasta de papel que comprenden una xilanasa de la invención, o un polipéptido codificado por un ácido nucleico de la invención. La invención proporciona métodos para tratar un papel o una pasta de papel o madera que comprende las siguientes etapas: (a) proporcionar un polipéptido de la invención que tiene una actividad xilanasa, o una xilanasa codificada por un ácido nucleico de la invención; (b) proporcionar un composición que comprende a papel o una pasta de papel o madera ; y (c) poner en contacto el polipéptido de la etapa (a) y la composición de la etapa (b) en condiciones en las que la xilanasa pueda tratar papel o pasta de papel o madera.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los métodos para reducir la cantidad de lignina (deslignificación) o solubilizar una lignina en un papel o papel, un desperdicio de papel, una madera, pasta de madera o producto de madera, o una composición de reciclaje de madera o papel, comprenden ponerse en contacto con el papel o papel producto, madera, pasta de madera o producto de madera, o composición de reciclado de madera o papel con un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para hidrolizar hemicelulosas en una madera, producto de madera, pasta de papel, producto de papel o desperdicios de papel comprenden poner en contacto la madera, producto de madera, pasta de papel, producto de papel o desperdicios de papel con un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para el blanqueo enzimático de papel, cáñamo o pasta de lino comprenden poner en contacto el papel, cáñamo o pasta de lino con una xilanasa y un agente blanqueador, en el que la xilanasa comprende un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo. El agente blanqueador puede comprender oxígeno o peróxido de hidrógeno.
Los métodos para blanquear una pasta de lignocelulosa comprenden poner en contacto la pasta de lignocelulosa con una xilanasa, donde la xilanasa comprende un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para el desencofrado enzimático de papel, desperdicios de papel, papel reciclado, destintado de tóner de papel de desecho impreso sin contacto o mezclas de papel de desecho impreso sin contacto incluyen el contacto del papel, papel reciclado, papel reciclado sin contacto o un papel de desecho impreso por contacto con una xilanasa, en el que la xilanasa comprende un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para blanquear un hilo, tela, hilo, tela o textil comprenden poner en contacto el tejido, hilo, tela o tejido con una xilanasa en condiciones adecuadas para producir un blanqueo del material textil, en el que la xilanasa comprende un polipéptido de la invención, o un enzimáticamente fragmento activo del mismo. El hilo, la tela, el hilo, la tela o el textil pueden comprender un hilo celulósico no de algodón, tela, hilo, tela o textil. Telas, hilos, telas o textiles comprenden un polipéptido que tiene una secuencia de la invención, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la invención, o un fragmento enzimáticamente activo del mismo, en el que en un aspecto (opcionalmente) el tejido, hilado, tela o textil comprende una tela, hilo, tela o textil de celulosa no de algodón.
Los métodos para blanquear o destintado periódico comprenden poner en contacto el periódico, en el que la xilanasa comprende un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
La madera, astillas de madera, pasta de madera, productos de madera, pulpas de papel, productos de papel, periódicos o desechos de papel comprenden un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo. Hilo, tela, hilo, tela o textil comprenden un polipéptido de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para reducir lignina en una madera o producto de madera comprenden poner en contacto la madera o el producto de madera con un polipéptido que tiene una actividad xilanasa, donde el polipéptido tiene una secuencia de la invención, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia de la invención, o un fragmento enzimáticamente activo del mismo.
Los métodos para reducir la lignina en una madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel o una pasta de papel en condiciones de alta temperatura y pH básico comprenden los siguientes pasos: (a) proporcionar al menos un polipéptido que tenga una xilanasa actividad, en la que el polipéptido retiene la actividad xilanasa en condiciones que comprenden una temperatura de al menos aproximadamente 80 °C, 85 °C, 90 °C o más, y un pH básico de al menos aproximadamente pH 10,5, pH 11, pH 12, pH 12,5. o más (básico) donde el polipéptido comprende una xilanasa que tiene una secuencia de la invención, o la xilanasa está codificada por un ácido nucleico que comprende una secuencia de la invención, o un fragmento enzimáticamente activo de la misma; (b) proporcionar una madera que comprende lignina, pasta de madera, pasta Kraft, papel, producto de papel o pasta de papel; y (c) poner en contacto la madera, pasta de madera, pasta Kraft, papel, papel o pasta de papel con el polipéptido de la etapa (a) en condiciones que comprenden una temperatura de al menos aproximadamente 80 °C, 85 °C, 90 °C o más, y un pH básico de al menos aproximadamente pH 10.5, pH 11, pH 12, pH 12.5 o más (básico), donde el polipéptido reduce la lignina en la madera, pasta de madera, pasta Kraft, papel, producto de papel o pasta de papel.
Los métodos para tratar una madera, una pasta de madera, una pasta Kraft, un producto de papel, un papel o una pasta de papel en condiciones de temperatura y pH básico comprenden los siguientes pasos: (a) proporcionar al menos un polipéptido que tiene una actividad xilanasa, el polipéptido retiene la actividad xilanasa en condiciones que comprenden una temperatura de al menos aproximadamente 80 °C, 85 °C, 90 °C o más, y un pH básico de al menos aproximadamente pH 10,5, pH 11, pH 12, pH 12,5 o más ( básico), donde el polipéptido comprende una xilanasa
Z8 'Oo 98 'Oo S8 'Oo 08 epewepeiujxojde soubuj |b ep ejnpjediuB} Bun uepuBjdiuoo enb seuojojpuoo ub eseueijx pepjAjpe B| 0U0IJ0J op!id0d||od |0 0nb B| U0 'pepjAjpe bsbubüx Bun bBubj 0nb opjpledjiod un soubuj |e jeuojojodojd gg (e) :sosBd sepejnbjs so| uepuBjdiuoo oojseq Hd A ejnpjediuB} eye 0p seuojojpuoo U0 |Bded 0p eped Bun o |Bded 0p opnpojd un '|0dBd un 'yej>j eped Bun 'ejepeiu 0p eped Bun 'ejepeiu Bun 0p euju6j| Bun JBJ©qn BJBd sopopiu soq
ledsd ep eped o |Bded ep opnpojd '|Bded 'yej>j eped 'ejepeiu ep eped 'ejepeiu B| ep opepjpep |B jsb opueyüoe.}
'isdsd ep eped o |Bded ‘yBJ>| eped 'ejepeiu ep eped 'ejepeiu b| ub sopendiuoo ep sjsjicupjq ezjiepo opjpledjiod |B 09 epuop ‘ u u Hd ayjaiuepeiujxojde soubuj |b ep oopeq Hd un A q0 gs BpBiuepeiuixojde soubuj |b ep ejnpjediuB} sun uepuBjdiuoo enb seuopjpuoo ub (b) edep B| ep opydedüod |B uoo |Bded ep eped o |Bded ep opnpojd '|Bded ‘yBJ>| eped 'BJ0PBLU ep eped 'BJBpBlU B| OpepOO U0 J0UOd (o) A l|0dBd 0p eped O |0ded 0p Opnpojd un '|0dBd ‘yBJ>| eped 'ejepeiu ep eped 'epy epuBjdiuoo enb ejepeiu Bun jeuopjodojd (q) iBwsjw B| ep OAjpe epeiueoyeiuizue cyuewBey un o 'uopueAUj B| ep epuenoes Bun epuBjdiuoo enb oopionu oppe un jod epeoyipoo epe bsbubüx b| o gg ‘uopueAUj B| ep epuenoes Bun Buey enb bsbubüx Bun epuBjdiuoo opydedyod |0 enb |e ue ‘ p p |-|d BpBiuepeiuixojde SOU0UJ |B ep oopeq Hd un A 'sbuj o 'q0 OH. ° Oo 601. 'Oo 801. 'Oo Z0U 'Oo SOI. 'Oo V01 'Oo S'801- 'Oo 801.
Oo 301 Oo U 0 U Oo 001 Oo 66 Oo 86 Oo Z6 Oo 96 Oo S6 Oo t?6 Oo 86 Oo 36 Oo 16 Oo 06 Oo 68 Oo 88 Oo Z8 Oo 98 'Oo S8 'Oo 08 epewepeimxojde soubuj |b ep ejnpjediuB} Bun uepuBjdiuoo enb seuopjpuoo ue bsbubüx pepjAyoe eueyej opydednod |0 epuop 'bsbubüx pepjAyoe Buey enb opydedyod un soubuj \e jeuopjodojd (b) :sosBd sepemOp OS so| uepuBjdiuoo oopeq |yd ep seuopjpuoo A ejnpjBdiue} eye b eped o |Bded ep opepysep BJBd sopopiu soq
soLusjUJ so| ep uopeupiuoo jembieno o opjxcued un 'ooysneo epebe un 'ojop ep opjxcyp un 'ojop un epuBjdiuoo oenbueiq ep oojiujnb opnpojd |0 'BpBiuieuopdo 'epuop loenbueiq ep oseoojd |0 ue SBJopeenbueiq soojiujnb sopnpojd ep osn |0 eonpej es A |Bded ep eped e\ o |Bded |0 ‘pded |0 ‘yBJ>| eped e\ 'ejepeiu gt? ep eped B| ‘Bjepeiu e\ epejbepoiq es enb o| uoo '|Bded ep eped o |eded ep sopnpojd '|Bded ‘ejsed yej>í 'bjspblu ep Bjsed ‘ejspeiu e\ ue sojsendujoo ep spucupiq e\ bzübjbo opydednod |0 epuop '(oopeq) sblu o g ¿;|, Hd '31, Hd 'll Hd 'S OI- Hd eyjeiuBpBimxojdB soubuj \e ep oopeq nd un A 'sbuj o 'q0 01-1- o Oo 601- 'Oo 801- 'Oo Z0U 'Oo SOI- 'Oo WH 'Oo s eo U 'Oo eou 'Oo 30l- 'Oo 101 'Oo 001- 'Oo 66 'Oo 86 'Oo Z6 'Oo 96 'Oo S6 'Oo V6 'Oo £6 'Oo 36 'Oo 1-6 'Oo 06 'Oo 68 'Oo 88 'Oo Z8 'Oo 98 'Oo S8 'Oo 08 eiueujBpBUJjxojdB soueiu |B ep BjnjBjedujej Bun uepuejdiuoo enb seuopipuoo ot? ue (e) edeje e\ ep opydednod |0 uoo |0ded ep Bjsed o |eded 'pdBd 'yBJ>í Bjsed ‘ejepeiu ep Bjsed 'Bjepeuj B| ojobjuoo ue jeuod (o) A !|eded ep Bjsed Bun o ledsd ep ojonpojd un '|0dBd un ‘yej>j Bjsed Bun 'bjbpbuj ep ejsed Bun 'BjepBUJ Bun JBUopjodojd (q) Ibujsiuj b| ep OAyoe ejueujBoyBUJizue oju0uj6bjí un o ‘uopueAUj e\ ep epuenoes eun epuejdiuoo enb ooppnu oppe un jod epeoyipoo ejse eseuenx e\ o ‘uopueAUj e\ ep epuenoes eun euey enb 'eseueüx eun epuejdiuoo opydednod p epuop '(oopeq ) seiu o g ¿;|, Hd '31, Hd 'll Hd 'S OI- Hd eiueiuepeiujxojde gg soueiu |B ep oopeq Hd un A 'sbuj o 'o0 OW o Q0 601. 'Oo 801- 'Oo Z0U 'Oo SOI- 'Oo V01 'Oo S 80U 'Oo 801- 'Oo 30b 'Oo 1-01- 'Oo 001- 'Oo 66 'Oo 86 'Oo Z6 'Oo 96 'Oo S6 'Oo V6 'Oo 86 'Oo 36 'Oo 1-6 'Oo 06 'Oo S8 'Oo 08 ejueiuepeiuixcude soubuj |e ep ejnjejediuej eun uepuejdiuoo enb seuoppuoo ue eseuenx pepjAyoe e\ eueyej opydednod p enb p ue 'eseueüx pepjAyoe eun euey enb opydedjpd un soueiu p jeuopjodojd (e) :sosed sejuembp so| uepuejdiuoo oopeq nd A ejnpjediuej eye ep seuoppuoo ue pded ep eped ep oenbuep ep oseoojd un o pded 'pded ‘yej>| 08
eped 'ejepeiu ep eped 'ejepeiu eun ue sejopeenbuep seojiujnb sepuepns ep osn p jpnpej ejed sopopiu soq
pded ep eped e\ o pded p 'pded p ‘yej>| eped e| 'ejepeiu ep eped e\ 'ejepeiu e\ opueenbueiq 'pded ep eped o pded 'pded ‘yej>| eped 'ejepeiu ep eped 'ejepeiu e\ ue sopendiuoo ep spuojpp e\ eznepo opydedjpd p epuop '(oopeq) seiu o g ¿;|, Hd '31, Hd 'll Hd 'S OI- S3 Hd '0 01- Hd ‘9'6 Hd 0Jqos soubuj p ep oopeq nd un Á 'sbuj o 'q0 oh, o q0 601- 'Oo 801- 'Oo Z0U 'Oo SOI- 'Oo V01 'Oo s eob 'Oo eou 'Oo 30l- 'Oo U0U 'Oo 001- 'Oo 66 'Oo 86 'Oo Z6 'Oo 96 'Oo S6 'Oo V6 'Oo £6 'Oo 36 'Oo 1-6 'Oo 06 'Oo S8 'Oo 08 ayjaiuepeonxojde soubuj p ep ejnpjediuBj eun uepuBjdiuoo enb seuopjpuoo ue (e) edep e\ ep opydedüod p uoo pded ep eped o pded 'pded ‘yej>j eped 'ejepeiu ep eped 'ejepeiu e\ opejuoo ue jeuod (o) A Ipded ep eped eun o pded ep opnpojd un 'pded un ‘yej>| eped eun 'ejepeiu ep eped eun 'ejepeiu eun jeuopjodojd (q) 03
iBiusjiu e| ep OAyoe BjuBiueoyeiuizuB ojubiuObjí un o 'uopueAUj e\ ep epuenoes eun epuejdiuoo enb ooppnu oppe un jod epeoypoo epe bsbubüx b| o 'uopueAUj e\ ep epuenoes eun euey enb bsbubüx eun epuejdiuoo opydedüod p epuop '(oopeq) seiu o g'zi Hd '31, Hd 'll Hd 'g'OI- Hd epeiuepeiujxojde soubuj p ep oopeq nd un A 'seiu 0 Oo 06 'Oo S8 'Oo 08 ayjaiuepeonxojde soubuj p ep ejnpjBdiuBj eun uepuejdiuoo enb seuopjpuoo ue bsbubüx pepjAyoe e\ eueipj opydedüod p enb e\ ue 'pepjAyoe eseuenx eun euey enb opydedipd un soubuj p jeuopjodojd gü (e) :sosed sejuemOp so| epuBjdiuoo opopiu p 'oopeq nd A ejnpjediuBj ep seuopjpuoo ue |0ded ep eped eun o |Bded ep opnpojd un '|Bded un 'yej>j eped eun 'ejepeiu ep eped eun 'ejepeiu eun jbjo|oobp ejed sopopiu soq
'% 38 aiuaiuepeiujxojde soubuj |b o '% qü eyjBiuepeiujxojde soubuj |b ep ejouepjsuoo eun euey eped e| 'opBjiuepjj |ep sendsep (BpBiuieuojodo) opedse un ue enb |0 ub A lejnp ejepeiu A epueiq ejepeiu oí. eun ep BAjjep es |eded ep eped o |Bded 'yej>j eped 'ejepeiu ep eped 'ejepeiu e| o 'ejnp ejepeiu A epueiq ejepeiu epuBjdiuoo |Bded ep eped o |eded ep opnpojd '|eded 'yej>j eped 'ejepeiu ep eped 'ejepeiu e| (BpBiuieuojodo) opedse un ue A 'eped |eded o |eded '|Bded 'yej>j eped 'ejepeiu ep eped 'ejepeiu e| ub sopendiuoo ep sjsnojpjq e| ezjiepo opydedjiod |B epuop '(oojseq) seiu o g ¿;|, Hd '31, Hd 'll Hd 'S OI- Hd epeiuepeiujxojde soubuj |b ep oojseq Hd un A 'seiu o q0 06 'Oo S8 'Oo 08 epewepeiujxojde soubuj |b ep ejnpjBdiuBj eun uepuBjdiuoo enb seuojojpuoo g ub (e) edep e| ep opydedjiod |B uoo |eded ep eped o |Bded '|eded 'yej>j eped 'ejepeiu ep eped 'ejepeiu e| opepoo ub jeuod (o) A l|Bded ep eped eun o |eded ep opnpojd un '|eded un 'yej>j eped eun 'ejepeiu ep eped eun 'ejepeiu eun jeuojojodojd (q) leiusjiu e| ep OAjpe BpBiueoyeiujzuB opeiubej^ un o 'uojouBAUj e| ep ejouenoes eun epuBjdiuoo enb oojBjonu opjoe un jod epeoyjpoo epe bsbubüx e| o 'uojouBAUj e| ep ejouenoes eun euey enb
81.03-60-1.1. 803I-SZZ03
epusjdLuoo 'epejoísuj scyejpiqoqjeo e uomn 0p peppypsdss eun o sopjppoqjeo e uomn 0p peppypsdss BA0nu eun susy 0nb eousuumb eseueyx Bun jeussjp BJBd sopopuu soq 'Q e\qe± e\ U0 ejpsnuu bs oluoo t?UX un epusjduuoo gg
0nb sopjppoqjeo b uomn 0p epusnossqns Bun o 'uopusAUj e\ 0p bsbubüx 0p spusnoss Bun 0p sopjppoqjeo b uomn op epusnossqns Bun spusjduuoo |/\|go |0 spuop ‘(lAiao) sopjppoqjeo b uomn sp o6o|cuspq oinpouu un sou0lu |B uspusjduuoo seousuumb sbsbubüx seq uopenuyuoo b ezyeue A BJBiunuo os oluoo |/\|go un o >|,X 0 22IAI30 ‘91/ViaO >l/\iaO 'qeiAiaO 'eeiAiaO epusjduuoo lAigo P 'spsuuieuopdo '0puop ‘(lAiao) sojBjpiqoqjBO b uomn op o6o|cuspq o|npouj un souslu |b A uopusAUj e\ op eojpjplsdyod spusnoss Bun uspusjduuoo seousuumb sbsbubüx seq 09
UOjOUSAU! B| sp ooppnu OppB un jod epSOyjpOO BSBUBÜX Bun O 'BSBUBÜX pBp|A|pB Bun susy snb UOpUSAUj B| sp opydsdyod un jspusjduuoo uspsnd opepoo sp ssps| sp ezsjdLuy BJBd ssuoppoduuoo seq opuuejeo un o bsBbjB Bun 'sppo un 'opeyjdsopod o -sjd ope6eníus sp sun 'ouoppo un 'eoyuopo uopejedsjd Bun 'oouyyusp OApd un o |s6 un 'ppsp blusjo Bun 'eouypsp eped Bun jspusjduuoo spsnd ponq susjBjq e\ BJBd opnpojd □ uopusAUj gg
B| sp ooppnu oppe un jod epeoyipoo bsbubüx Bun o 'bsbubüx pepjAyoe Bun susy snb uopusAUj e\ sp opydsdyod un jspusjdujoo uspsnd ponq susjBjq e\ BJBd sopnpojd soq ooyoeiyojd jss spsnd opsyjjepj} □ ('b//suou//bs ejpoo 'o|dujsís jod) ouBjqojojLuquB o OAqssBjp speAnApeoo oluoo jsnps spsnd eoynsoeuujey uoppoduuoo sq
B//0L/OO//BS OS
'o|dujsís jod 'oueyx un spusjduuoo snb euspeq sun jss spsnd OLUsmebjoojojLU □ uopusAUj e\ sp opydsdyod un jejpmjLupe uspusjdujoo oueyx un spusjduuoo snb OLUsmebjoojojLU un sp ssieuume so| b JsBsjojd o jeuyjjys BJBd sopopuu soq 'BLUsjLU B| sp OAyoe sjusLUBoqBLUjzus opsuu6ejy un o ‘uopusAUj B| sp Bpusnoss Bun spusjduuoo snb ooppnu oppe un jod opeoyipoo eps opydsdyod |s o 'uopusAUj e\ sp spusnoss sun spusjduuoo opydsdyod |s spuop 'bsbubüx pepjAyoe Bun susy snb opydsdyod un jspusjdujoo uspsnd seoynsoeuujey ssuoppoduuoo ssq gt?
pded sp eped o opnpojd pdsd '|sdsd 'yej>j eped 'bjspblu sp eped 'BJSPBLU B| Sp |OUBJS JSB OpUBJSUSB '|Sdsd Sp eped O |Sdsd 'yBJX eped 'BJSPBLU sp eped 'BJSPBLU B| US sopsnduuoo sp spyojpm e\ ezyepo opydsdyod |s spuop 'u Hd spsuuepeLmxojde souslu |b sp oopeq |gd un A 'seuu o 'Oo OU o Qo 601. 'Oo 801. 'Oo ZOU 'Oo SOI. 'Oo KH 'Oo S'SOU 'Oo 801. 'Oo 201- 'Oo 101 'Oo 001. 'Oo 66 'Oo 86 'Oo Z6 0V 'Oo 96 'Oo S6 'Oo V6 'Oo 86 'Oo 26 'Oo 1-6 'Oo 06 'Oo 68 'Oo 88 'Oo Z8 'Oo 98 'Oo S8 'Oo 08 epeLuepeunxojde sousuj |b sp BjnpjsdLusj sun uspusjdujoo snb ssuopipuoo us (b) edep B| sp opydsdyod |s uoo (q) edep B| sp uoppoduuoo B| opepoo us jsuod (o) A l|sdsd sp eped o |sdsd sp opnpojd un '|sdsd 'ysjx eped 'bjspblu sp eped 'bjspblu Bun spusjduuoo snb uopjuup spusjduuoo snb uoppoduuoo sun jeuopjodojd (q) Iblusilu b| sp OAyoe spsujeoyeujizus opsuu6ejy un o 'uopusAUj e\ sp spusnoss sun spusjduuoo snb ooppnu opps un jod epeoyipoo eps bsbubüx b| o gg ‘uopusAUj B| sp spusnoss sun susy snb bsbubüx sun spusjduuoo opydsd||od |s snb |s us ' \, \, pd spsuuBpBuuixojdB SOUSUJ |B sp ooissq \-\d un A 'sblu o 'q0 OU- o q0 601. 'Oo 801. 'Oo ZOU 'Oo SOI. 'Oo V01 'Oo 9‘80U 'Oo 80 U Oo 201 Oo U0 U Oo 001 Oo 66 Oo 86 Oo Z6 Oo 96 Oo S6 Oo t?6 Oo 86 Oo 26 Oo 16 Oo 06 Oo 68 Oo 88 Oo Z8 'Oo 98 'Oo S8 'Oo 08 ayjaLuepeunxojde souslu |b sp Bjnpjsduusi sun uspusjdujoo snb ssuoppuoo us bsbubüx pepjAjpe susysj opydsdnod |s spuop 'bsbubüx pepiAyos susy snb opydsdnod un souslu |b jsuopjodojd (b) :sosBd 08 sspsmBjs so| spusjduuoo opopuu |s 'Bys Bjnpjsduusi A pd ep ssuoppuoo us pusp JBOuqB^ BJBd sopopuu soq 'BuusjLU B| sp OAyoB spsLUBoyBLUjzus ojusujBbjí un o ‘uopusAUj B| sp spusnoss sun spusjduuoo snb ooppnu opps un jod opeoypoo sps opydsd||od |s o 'uopusAUj e\ sp spusnoss sun susy opydsd||od |s spuop 'bsbubüx pepiAyos sun susy snb opydsd||od un A puep un jspusjduuoo uspsnd ssuoppoduuoo ssq ops us OAyos sjusLUBoyBLUizus ojuslu6bjí un o 'uopusAUj e\ sp spusnoss sun spusjduuoo snb ooppnu opps un jod opeoypoo bjss gz
opydsdjpd |s o 'uopusAUj e\ sp spusnoss sun susy opydsdjpd |s spuop 'bsbubüx pepjAjpe susy snb opydsdyod un uoo uopjuu|B spusjduuoo snb uoppoduuoo sun opspoo us jsuod uspusjduuoo puep jeouqey sjsd sopopuu soq
sjnp ejspeuu
A spusiq ejspeuu sp opsAusp pdsd sp spsd o pdsd 'pdsd 'yejx eped 'bjspblu sp eped 'ejspeuu o 'sjnp bjspblu 02 A epueiq bjspblu spusjduuoo pdsd sp spsd o pdsd 'pdsd ‘yej>j spsd 'bjspblu sp spsd 'ejspeuu e\ 'spsuuieuopdo 'ouusjLU pp OAyoe spsuueoyeuuizus opsuu6ejy o 'uopusAUj e\ sp epusnoss eun spusjduuoo snb ooppnu oppe un jod opeoyjpoo o 'uopusAUj e\ sp eseuenx pepjAjpe eun susy snb opydsdyod un A pded sp eped eun o pded sp opnpojd un 'pded un ‘yej>j eped eun 'ejspeuu sp eped eun 'ejspeuu eun jspusjduuoo uspsnd ssuoppoduuoo seq
SI.
'% OI- spsuuepeujixojde
sp epusppuoo eun susy eped e\ 'opsjLuepjj pp ssndssp 'spsuuieuopdo 'spuop us Ipded sp eped o pded sp opnpojd 'pded ‘yej>j eped 'ejspeuu sp eped 'ejspeuu e\ sp eum6ü sp uopejsqn e\ opouu sps sp opueyipey 'eped pded o pded 'pded ‘yej>j eped 'ejspeuu sp eped 'ejspeuu e\ us sopsnduuoo sp spüojpp e\ ezyepo opydsdyod p snb p us ‘n |yd spsuuepeLUjxojde souslu \e sp oopeq nd un A 'seuu o 'q0 OH. 0 Oo 601. 'Oo 801. 'Oo 01.
Z01 'Oo SO l 'Oo t?01 'Oo s eo l 'Oo eo l 'Oo 20U ‘Oo UOU 'Oo OO l 'Oo 66 'Oo 86 'Oo Z6 'Oo 96 'Oo S6 'Oo fr6 'Oo £6 'Oo 26 'Oo 1-6 'Oo 06 'Oo 68 'Oo 88 'Oo Z8 'Oo 98 'Oo S8 'Oo 08 eyjeLuepeunxojde souslu \e sp ejnpjsduusi eun uspusjduuoo snb ssuopipuoo us (e) edep e\ sp opydsdyod p uoo (q) edep e\ sp pded sp eped eun o pded sp opnpojd 'pded ‘yejx eped 'ejspeuu sp eped 'ejspeuu e\ opepoo us jsuod (o) A Ipded sp eped o pded sp opnpojd 'pded ‘yej>j eped 'ejspeuu sp eped 'eum6y spusjduuoo snb ejspeuu eun jeuopjodojd (q) leiusjuj e\ sp OAyoe spsuueoyeujizus g opsuu6ejy un o 'uopusAUj e\ sp spusnoss eun spusjduuoo snb ooppnu oppe un jod epeoyjpoo eps bsbubüx b| o ‘uopusAUj e| sp spusnoss eun susy snb bsbubüx eun spusjduuoo opydsdyod p spuop ‘ u u Hd spsuuepeujixojde sousuj |B sp oopeq h|d un A 'seuu o 'q0 OU- o q0 601. 'Oo 801. 'Oo ZOU 'Oo SOI. 'Oo WH 'Oo S 80U 'Oo 80 U Oo 201 Oo U0 U Oo 001 Oo 66 Oo 86 Oo Z6 Oo 96 Oo S6 Oo t^6 Oo 86 Oo 26 Oo 16 Oo 06 Oo 68 Oo 88 Oo
8U02-60-U U 802I.SZZ03
5
10
15
20
25
30
35
40
45
50
55
60
65
insertar un módulo de unión a carbohidratos endógeno heterogéneo (CBM) en una xilanasa, donde el CBM comprende una subsecuencia de unión a carbohidratos de una xilanasa de la invención, o una subsecuencia de unión a carbohidratos que comprende un X14 como se expone en la Tabla 9, o, como alternativa, un CBM heterólogo, o un CBM endógeno adicional, se inserta en una secuencia de xilanasa de la invención.
La invención proporciona mezclas de enzimas, o "cócteles" que comprenden al menos una enzima de la invención y una o más enzimas diferentes, que pueden ser otra xilanasa o cualquier otra enzima; por ejemplo, los "cócteles" de la invención, además de al menos una enzima de la presente invención, pueden comprender cualquier otra enzima, tal como xilanasa (no de la presente invención), celulasas, lipasas, esterasas, proteasas o endoglicosidasas, endo - beta.-1,4-glucanasas, beta-glucanasas, endo-beta-1,3 (4) -glucanasas, cutinasas, peroxidasas, catalasas, lacasas, amilasas, glucoamilasas, pectinasas, reductasas, oxidasas, fenoloxidasas, ligninasas, pululanasas, arabinanasas, hemicelulasas, mannanasas, xiloglucanasas, xilanasas, pectina acetil esterasas, ramolgalacturonan acetil esterasas, poligalacturonasas, ramnogalacturonasas, galactanasas, pectinasas, pectinas metilesterasas, celobiohidrolasas y/o transglutaminasas, por nombrar solo algunos ejemplos. En realizaciones alternativas, estas mezclas de enzimas, o "cócteles" que comprenden al menos una enzima de la invención se pueden usar en cualquier proceso o método divulgado aquí, o composición de la divulgación, por ejemplo, en alimentos o piensos, alimentos o suplementos alimenticios, textiles, papeles, maderas procesadas, etc. y métodos para fabricarlos, y en composiciones y métodos para tratar desperdicios o subproductos de papel, pasta, madera, papel, pasta o madera, y similares, y en los productos finales de los mismos.
Los aspectos adicionales de la invención se muestran en las reivindicaciones adjuntas.
Los detalles de una o más realizaciones de la invención se muestran en los dibujos adjuntos y la divulgación de a continuación. Otras características, objetos, y ventajas de la invención resultarán evidentes de la divulgación y los dibujos, y de las reivindicaciones.
Breve divulgación de los dibujos
Los siguientes dibujos son ilustrativos de aspectos de la invención y no se pretende que limiten de ningún modo el alcance de la invención abarcada por las reivindicaciones.
La Figura 1 es un diagrama de bloques de un sistema informático.
La Figura 2 es un diagrama de flujo que ilustra un aspecto de un procedimiento para comparar una nueva secuencia de nucleótidos o proteínas con una base de datos de secuencias con el fin de determinar los niveles de homología entre la nueva secuencia y las secuencias en la base de datos.
La Figura 3 es un diagrama de flujo que ilustra un aspecto de un procedimiento en un ordenador para determinar si dos secuencias son homólogas.
La Figura 4 es un diagrama de flujo que ilustra un aspecto de un procedimiento identificador 300 para detectar la presencia de una característica en una secuencia.
La Figura 5 es un gráfico que compara la actividad de la secuencia de tipo silvestre (SEQ ID NOS: 189 y 190) con la del mutante 8x (SEQ ID NOS: 375, 376), una combinación de mutantes D, F, H, I, S, V, X y AA en la Tabla 1.
La Figura 6A ilustra los nueve mutantes de un solo sitio de aminoácido de la SEQ ID NO: 378 (codificado por la SEQ ID NO: 377) generados por Mutagénesis por Saturación de Sitio de Genes (GSSM por "Gene Site Saturation Mutagenesis") de la SEQ ID NO: 190 (codificado por la SEQ ID NO: 189), como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 6B ilustra el desplegamiento de la SEQ ID NO: 190 y la SEQ ID NO: 378 en experimentos del punto medio de transición de la temperatura de fusión (Tm) según se determina mediante calorimetría de barrido diferencial (DSC) para cada enzima, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 7A ilustra los perfiles de actividad de pH y temperatura para las enzimas de la SEQ ID NO: 190 y SEQ ID NO: 378, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 7B ilustra la actividad optima de velocidad/temperatura para las enzimas de la SEQ ID NO: 190 y SEQ ID NO: 378, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 7C ilustra la tolerancia térmica/actividad residual para las enzimas de la SEQ ID NO: 190 y SEQ ID NO: 378, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 8A ilustra la biblioteca GeneReassembly de todas las combinaciones posibles de las 9 mutaciones puntuales GSSM que se construyó y escrutó para determinar las variantes con tolerancia térmica y actividad mejoradas, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 8B ilustra la actividad relativa de la variante "6X-2" y la variante "9X" (SEQ ID NO: 378) en comparación con la SEQ ID NO: 190 ("tipo silvestre") a un óptimo de temperatura y pH 6,0, como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 9A ilustra las impresiones obtenidas después de la hidrólisis de los oligoxilanos (Xyl)3, (Xyl)4, (Xyl)5 y (Xyl)6 mediante la SEQ iD NO: 190 ("tipo silvestre") y las enzimas variantes "9X" (SEQ ID NO: 378), como se describe con detalle en el Ejemplo 5, a continuación.
La Figura 9B ilustra las impresiones obtenidas después de la hidrólisis de xilano Beechwood por la SEQ ID NO: 190 ("tipo silvestre") y las enzimas variantes "9X" (SEQ ID NO: 378), como se describe con detalle en el Ejemplo
IZ
seuopeuiqLuoo sns sp BJsmb|Bno A |/\|SS0 '(9ZZ'Z£S'9 wnN sopiufl sopejsg so| sp sjusjBd e| ‘oídmele jod '0SB0A 'Á|qLU0SSB0y0U00 'oidwsís jod) ssus6 0p sÍBiqwBsussj 'ooyjosdss ojys 0p sjssusbBjnw gg '|B!ou0uodx0 ojuníuoo 0p sjssusbBjnw 'oAjSjnosj sÍBiqwBsus 0p sjssusbBjnw 'ssjssbo 0p uopjssu! jod sjssusbBjnw ‘oaia ui sjssusbBjnw '|Bnx0s yod Jod sjssusbBjnw 'sÍBiqwBsus 0p yod 'sopqospnuobüo b epjBujp sjssusbBjnw 'opBÍBJBq 'jojj0 b BSUBdojd yod 'oidwsís jod 'oluoo ss|bj sopojsw opuBÁnpu! sojpsw 0p ojswnu Jsmb|Bno jod jpnpojd U0p0nd 0S ssjububa ssq uchousau! e\ 0p bsbubüx Bun 0p BoiBopiq pBpjAqoB e\ une opubajssuoo (SJUSLUBAqOSdSSj) SOppBOUjLUB 0p SOnpjSSJ O 'S0UOX0 'S0UOJJU! 'S0UOPO3 'S0SBq 0P S0JBd SBLU O oun U0 SBPBOÜIPOLU 09 SBpu0no0s U0pu0jdujoo 0nb uopusAUj e\ 0p sopqdsdnod o sopqospnuüod 0p ssjububa Buopjodojd uopusAUj Bq
SBLU o'ii Hd 01U0LUBpBLU!XOjdB
SOU0UJ |B 0P oojSBq yd un A 'sbw o 'o0 0U o Oo 601- 'Oo 801- 'Oo Z0b 'Oo SOI- 'Oo WH 'Oo S £0U 'Oo £0U 'Oo 201- 'Oo 1-01- 'Oo 001- 'Oo 66 'Oo 86 'Oo Z6 'Oo 96 'Oo S6 'Oo t?6 'Oo £6 'Oo ZQ 'Oo 1-6 'Oo 06 'Oo 68 'Oo 88 'Oo SS
Z8 'Oo 98 'Oo S8 'Oo 08 sjusLUBpBLUixojdB souslu |b 0p BjnjBJsdwsj Bun uspusjdwoo 0nb ssuopipuoo U0 pBpjAjpB e\ J0U0J0J 0p0nd uopu0AU| B| 0p bsbubüx Bun ofeq o/Á cq|B yd sp ssuopipuoo b 0}UBJ0|cq o/Á 0jubj0|ojoluj01 jbs 0p0nd uopu0AU| B| 0p blu|zu0 Bun isdsd 0p Bjssd o pdsd 0p sopnpojd 'pdsd 'ysjy Bjssd 'bjspblu 0p Bjssd 'bjspblu A SBpjqsq 'iBLUjUB UOpB}USLU!|B 'uopooo 0P SOS03Ojd U0 S0|qn 0}USLUJB|nO!;jBd UOS UOpUSAUj B| 0P SBSBUB||X SB“|
os
SOOySJSjp S0}USLUS|dLU03 A SBOqnSOBLUJB.} SSUOpjSOdUJOO U0 JBZ||yn U0p0nd 0S UOpUSAUj B| 0P SBSBUB||X SB“| SSJBÜLUjS A SS}US6j0}Sp 'S3|qX3J S3pnp3jd 'S0|BU3pUjnU S3JU0LU0|dnS 'SOSUSjd 'S3JU0LU!|B jBS330jd o/A JBJoqBp BJBd JBZjpn uspsnd os uopusAUj e\ sp sbsbubüx ssq soujsjuj sooipjsonx-t?' p-£) S0OB|U3 so| op spiiojpiq B| opuBZjiBjBO 'o|dLU0Í3 jod 'oub||x |0 U0 0}U3S0jd oojpjsoojiB 0ob|U0 un oidwsís jod 'opuBOBSjiod un U0 soojpjsoojiB S30B|U3 so| JBZjpjpiq op ssoBdso sblwzus UBOJBqB uopusAUj B| 3p sopqdodjiod soq SB|JBZ!pn gt? A SB|JBJoqB|3 BJBd sopojsw A UBoyipoo sb| snb sopqoopnujiod A sbsbubüx Buopjodojd uopusAUj sjusssjd sq
UpjOUSAUj B| 0p BpB||BJ0p UOpduOSSQ
soppsjBd soju3LU3|3 UBOjpuj soínqjp ssjusjsyp so| U3 soppsjBd Bpu0J3^3J sp sopqujjs ot?
■0JUB|0pB SBLU H 0|dLU3Í3 U0 S||B}Sp UOO SqUOSSp 0S OLUOO 'smUSqjJV sp BOyBjS Bun jmjJSUOO BJBd UOJBSn 3S SOJBP SO| A SBJnjBJSdLUS} SBUBA B opw 3S BOjLUJSJ UOpBAjpBUj B| spuop :ON
OI D3S A 28£ :ON ai D3S Bl SP UOPBAIPBU! sp bjBjsus us spusjsyp e\ UBJjssnw snb sojsp BJjsnn 82 ejnBy eq
uopBnuquoo b h 0|dwsÍ3 |3 us s||Bjsp gg
uoo squossp ss oluoo 'Z8fr :ON ai 03S uopusAUj B| sp ..sjuBjnuj,, o o|dujsís sp bsbubüx o sjububa b| A '¿;8£ :ON OI 03S Bl sp „BJ1SSA|!S odq„ |sp BOjLUJSj uopBAqoBU! B| UBJjssnuj snb sojsp UBJjsnü g¿z ejnBy e| A VZZ ejnOy eq ■uopsnuquoo b ‘zí oidLusíy |s us s||Bjsp uoo squossp ss oluoo 'isnppsj pspjAipB sp opojsuj un 'sbluizus BJBd o|dujsís sp BpuBJspjoLUJSj sp oAbsus un sp sopsynssj so| sjusujBoyBj6 BJjsnü gz ejnOy eq
■uopsnuquoo b ‘zí oidLusíy |s us s||Bjsp uoo squossp ss oluoo 'oubüx-ozb sp oAbsus un opussn sbsbubüx o£ BJBd o|dujsís sp BpuBJS|ojoLUJSj sp oAbsus un sp sopsynssj so| sjusujBoyBj6 UBJjsnü gz ejnOy B| A BjnOy Bq
■uopsnuquoo b ‘zí oidLusíy |s us s||Bjsp uoo squossp ss oluoo '!A6oluos-uos|sn sp oAbsus un opussn o6uj sp oubüxoupbjb us uopusAUj e\ sp SBAqBJjsnü sbluizus sb| opussn o|dujsís sp soqBLUjzus pepjAqoe sp oAbsus un sp sopeynssj so| sjusLUBoysjb usjjsnü gz BJnby B| A ZZ BJnby Bq
uopenuquoo s zí oidLusíy |s us s||Bjsp uoo squossp ss oluoo 'uopusAUj gz B| sp o|dujsís sp seujjzus ss| opussn oubüx-ozb sp oAbsus un sp sopeynssj so| sjusLUBoysjb sjjsnü \,z BJnby Bq uopenuquoo s ‘n oidLusíy |s us s||Bjsp uoo squossp ss oluoo 'yd sp soibajsjui sosjsaip us (/v\HN) ZO isjousjsod spioy |sp Bjnp bjspblu B| us Z8Z :ON ai D3S B| siusLusoysjb sjjsnü snb B|qsj sun ss oz Bjnby Bq
uopBnuquoo e‘\ \ oidLusíy
|s us s||Bjsp uoo squossp ss oluoo 'sojsp sojss usujnssj A 'ssuopipuoo SBSJSAjp us (aMSS) poo/v\yos ujsqjnos oz us Z8£ :ON OI D3S B| sjusLUBoysjb UBJjsnü snb SBiqsj uos 61- Bjnby B| A 8b BJn6|d B| '/I- Bjnby B| ‘gp Bjnby Bq uopBnuquoo b 'oí, 0|dujsÍ3 |s us s||B}sp uoo squossp ss oluoo 'uopusAUj e\ sp o|dujsís sp SBLUjzus sb| sp BoqBLUjzus pBpjAqoB B| usjjssnujsp snb sojsp so| sujnssj snb B|qBj sun ss gü Bjnby sq
uopBnuquoo
b '6 0|dujsÍ3 |s us s||Bjsp uoo squossp ss oluoo ojusjLUBsnbuBiqojq sp isujsnpu! ossoojd un BJjsnü p¡, Bjnby sq gü
SJUB|SPB SBLU S||BJSP UOO
squossp ss oluoo ¿;8£ :oN ai 03S Bpusnoss B| us sopbzübsj sojqwBO so| sp usuunssj un BJjsnü £|, Bjnby sq
SJUB|SPB SBLU S||B}Sp UOO SqUOSSp SS OLUOO 'UOpUSAUj B| Sp 0|dLUSÍS sp sbsbubüx opuBsn ..ojusjLUBsnbuBiqoiq,, sp ojpnjss un sp sopsynssj so| sjusLUBoysjb BJjsnü Zi Bjnby sq
uopBnuquoo b 'g 0|dujsÍ3 |s us s||Bjsp ol
uoo squossp SS OLUOO 'isdsd sp BJSBd sp OJUSILUBJBJJSjd |S BJBd |qn SS UOpUSAU! B| sp BSBUBÜX Bun |S JBUjLUJSJSp BJBd OAqBJjsnü ouBuqm BAqosiss uoposjsp sp o|ooojojd un sp ooqsLusnbss oíny sp blubj6b|p un ss \,\, Bjnby sq
uopBnuquoo b 'g 0|dujsÍ3 |s us
s||Bjsp uoo squossp ss oluoo 'A|qujsssBsysus0 A |/\|SS0 sbj6o|ouosj sb| opuBUjqujoo Bpmsjqo ‘09£ :ON ai D3S A 8Z£ :ON OI D3S Bl sp blujo^ us BoqBLUjzus bjoíslu b| sp ..uopBnospB sp blubj6b!p„ un BJjsnü gol- Bjnby sq g
uopBnuquoo b 'g 0|dujsÍ3 |s us s||Bjsp uoo squossp ss oluoo '|/\|SS0 uopnioAS sjuBjpsuj opjusjqo (..sjjssaüs odq„) 061- :ON ai D3S Bl s-iqos (luí J°d spsjusssjdsj) boilujsi pBpiüqBjss sp |sa|u |sp bjoíslu B| Bjjsnü snb ooqsLusnbss blubj6b|p un ss V0I- Bjnby sq
uopBnuquoo b 'g
8Í0Z-60-H-
£0ZI-SZZ03
La Tabla 1 y la Tabla 2 enumera las variantes obtenidas mutando la SEQ ID NO: 189 (que codifica la SEQ ID NO: 190) mediante GSSM. La divulgación incluye ácidos nucleicos que tienen una o más, o todas, de las secuencias como se expone en las Tablas 1 y 2, es decir, ácidos nucleicos que tienen secuencias que son variantes de la SEQ ID NO: 189, donde las variaciones se exponen en la Tabla 1 y la Tabla 2, y los polipéptidos que están codificados 5 por estas variantes.
Estas variantes GSSM (mostradas en las Tablas 1 y 2) se sometieron a ensayo para determinar la tolerancia térmica (véanse los Ejemplos, a continuación). Se encontró que los mutantes D, F, G, H, I, J, K, S, T, U, V, W, X, Y, Z, AA, DD y EE tenían la mayor tolerancia térmica entre los mutantes de la Tabla 1. Los mutantes también se pueden 10 combinar para formar un mutante “mayor” (es decir, un polipéptido que tiene múltiples variaciones de la secuencia, véase también, por ejemplo, la Tabla 10, más adelante). Por ejemplo, los mutantes D, F, H, I, S, V, X y AA de la Tabla 1 se combinaron para formar un mutante mayor denominado "8x" con una secuencia como la mostrada en la SEQ ID NO: 375 (ácido nucleico que codifica polipéptido) y la SEQ ID NO: 376 (secuencia de aminoácidos). La Figura 5 es un gráfico que compara la actividad de la secuencia de tipo silvestre (SEQ ID NOS: 189 y 190) con el 15 mutante 8x (SEQ ID NOS: 259 y 260). Al comparar el tipo silvestre y el mutante 8x, se descubrió que la temperatura óptima para ambos era de 65 °C y que el pH óptimo para ambos era de 5,5. Se encontró que la secuencia de tipo silvestre mantenía su estabilidad durante menos de 1 minuto a 65 °C, mientras que se encontró que el mutante 8x (SEQ ID NOS: 375, 376) mantenía su estabilidad durante más de 10 minutos a 85 °C. El sustrato utilizado fue azo- xilano (por ejemplo, espelta de avena, por ejemplo de Megazyme International Ireland Ltd). El mutante 8x (SEQ ID 20 NOS: 375, 376) se desarrolló mediante GSSm. El tipo silvestre es un progenitor de GSSM para la evolución de la tolerancia térmica.
Tabla 1
Mutante
Mutación Sec. de Tipo silvestre Sec. GSSM
A
A2F GCC TTT
B
A2D GCC GAC
C
A5H GCT CAC
D
D8F GAC TTC
E
Q11L CAA CTC
F
Q11H CAA CAC
G
N12L AAT TTG
H
N12L AAT TTG
I
G171 GGT ATA
J
Q11H, T23T CAA, ACC CAT, ACG
K
Q11H CAA CAT
L
S26P TCT CCG
M
S26P TCT CCA
N
S35F TCA TTT
O
Sin Cambio GTT GTA
P
A51 P GCA CCG
Q
A51P GCA CCG
R
G60R GGA CGC
S
G60H GGA CAC
T
G60H GGA CAC
U
P64C CCG TGT
V
P64V CCG GTA
W
P64V CCG GTT
X
S65V TCC GTG
Y
Q11H CAA CAT
Z
G68I GGA ATA
AA
G68A GGA GCT
BB
A71G GCT GGA
CC
Sin Cambio AAT AAC
DD
S79P TCA CCA
EE
S79P TCA CCC
FF
T95S ACT TCT
GG
Y98P TAT CCG
HH
T114S ACT AGC
II
Sin Cambio AAC AAC
JJ
Sin Cambio AGG AGA
KK
I142L ATT CTG
LL
S151I AGC ATC
MM
S138T, S151A TCG, AGC ACG, GCG
5
10
15
20
25
Mutante
Mutación Sec. de Tipo silvestre Sec. GSSM
NN
K158R AAG CGG
OO
K160V, V1721 AAA, GTA GTT, ATA
Se destacan las variantes codónicas como se muestra en la Tabla 2 que produjeron variantes (de la SEQ ID NO: 189) como la mejor variación o "mejora" sobre el "tipo silvestre" (SEQ ID NO: 189) en tolerancia térmica.
Tabla 2
Mutación Secuencia de tipo Secuencia Otros codones que también codifican el
silvestre GSSM mismo aminoácido cambiado
A2F
GCC TTT TTC
A2D
GCC GAC GAT
A5H
GCT CAC CAT
D8F
GAC TTC TTT
Q11L
CAA CTC TTA, TTG, CTT, CTA, CTG
Q11H
CAA CAC, CAT -
N12L
AAT TTG TTA, CTC, CTT, CTA, CTG
G17I
GGT ATA ATT, ATC
T23T
ACC ACG ACT, ACC, ACA
S26P
TCT CCG, CCA CCC
S35F
TCA TTT TTC
A51P
GCA CCG CCC, CCA
G60R
GGA CGC CGT, CGA, CGG, AGA, AGG
G60H
GGA CAC CAT
P64C
CCG TGT TGC
P64V
CCG GTA, GTT GTC, GTG
S65V
TCC GTG GTC, GTA, GTT
G68I
GGA ATA ATT, ATC
G68A
GGA GCT GCG, GCC, GCA
A71G
GCT GGA GGT, GGC, GGG
S79P
TCA CCA, CCC CCG
T95S
ACT TCT TCC, TCA, TCG, AGT, AGC
Y98P
TAT CCG CCC, CCA
T114S
ACT AGC TCC, TCA, TCG, AGT, TCT
I142L
ATT CTG TTA, CTC, CTT, CTA, TTG
S151I
AGC ATC ATT, ATA
S138T
TCG ACG ACT, ACC, ACA
S151A
AGC GCG GCT, GCC, GCA
K158R
AAG CGG CGT, CGA, CGC, AGA, AGG
K160V
AAA GTT GTC, GTA, GTG
V172I
GTA ATA ATT, ATC
La secuencia de aminoácidos de una secuencia de aminoácidos (SEQ ID NO: 208) de las secuencias de aminoácidos se puede modificar mediante una mutación de un solo aminoácido. Esa mutación puede ser una mutación de asparragina a ácido aspártico. La secuencia de aminoácidos resultante y la secuencia de ácido nucleico correspondiente se muestran como la SEQ ID NO: 252 y la SEQ ID NO: 251, respectivamente. Se han mostrado en la técnica mutaciones de un solo aminoácido con una mejora en el pH óptimo de la enzima, tal como la mutación de la SEQ ID NO: 208, con respecto a las xilanasas. (Véase, por ejemplo, Joshi, M., Sidhu, G., Pot, I., Brayer, G., Withers, S., McIntosh, L., J. Mol. Bio. 299, 255-279 (2000).) También se observa que en tales mutaciones de un solo aminoácido, se pueden eliminar porciones de las secuencias en el procedimiento de subclonación. Por ejemplo, la SEQ ID NO: 207 y la SEQ ID NO: 251 difieren en solo un nucleótido, a lo largo de la zona en la que se alinean las secuencias. Sin embargo, se observa que se eliminó una zona de 78 nucleótidos en el extremo N de la SEQ ID NO: 207 del extremo N de la SEQ ID NO: 251 en la subclonación. Adicionalmente, los tres primeros nucleótidos en la SEQ ID NO: 251 se cambiaron a ATG y a continuación se realizó la mutación puntual en el sexto nucleótido en la SEQ ID NO: 251.
El término "mutagénesis por saturación", "mutagénesis por saturación de sitio de genes" o "GSSM" incluye un método que utiliza cebadores oligonucleotídicos degenerados para introducir mutaciones puntuales en un polinucleótido, como se describe con detalle, a continuación.
5
10
15
20
25
30
35
40
45
El término "sistema de evolución dirigida optimizada" o "evolución dirigida optimizada" incluye un método para reensamblar fragmentos de secuencias de ácido nucleico relacionadas, por ejemplo, genes relacionados, y se explica con detalle, a continuación.
El término "reensamblaje de ligación sintética" o "SLR" incluye un método para ligar fragmentos de oligonucleótidos de un modo no estocástico, y se explica con detalle, a continuación.
Generación y Manipulación de Ácidos Nucleicos
La invención proporciona ácidos nucleicos que codifican polipéptidos que tienen actividad xilanasa, incluyendo enzimas que tienen al menos una modificación de secuencia de secuencias de ácidos nucleicos de ejemplo con la secuencia de la invención (como se ha definido anteriormente), donde la modificación de secuencia comprende al menos 90 % de identidad: una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios: los nucleótidos en el equivalente de los residuos 10 a 12 de la SEQ ID NO: 383 se cambian a CCT, TTA, TTG, CTC, CTA o CTG, los nucleótidos en el equivalente de los restos 25 a 27 de la SEQ ID NO: 160,383 se cambian a CCC, CCG, CCA o CCT, los nucleótidos en el equivalente de los residuos 28 a 30 de la SEQ ID NO: 383 se cambian a TCA, TCC, TCT, TCG, AGT o AGC, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TTT o TTC, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TAC o TAT, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a ATA, ATT o ATC, los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TGG, los nucleótidos en el equivalente de los residuos 40 a 42 de la SEQ ID NO: 383 se cambian a CAC o CAT, los nucleótidos en el equivalente de los residuos 52 a 54 de la SEQ ID NO: 383 se cambian a TTC o TTT, los nucleótidos en el equivalente de los residuos 73 a 75 de SEQ ID NO. : 383 se cambian a GAG o GAA, los nucleótidos en el equivalente de los residuos 73 a 75 de la SEQ ID NO: 383 se cambian a CCC, CCG, CCA o CCT, los nucleótidos en el equivalente de los residuos 88 a 90 de SEQ ID NO. : 383 se cambian a GTG, GTC, GTA o GTT, los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TGT o TGC, los nucleótidos en el equivalente de los residuos 100 a 102 de SEQ ID NO. : 383 se cambian a CAT o CAC, los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TTG, TTA, CTT, CTC, CTA o CTG, los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAG o GAA, los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAT o GAC, los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a ACA, ACT, ACC o ACG, los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a TGT o TGC, o los nucleótidos al equivalente de los residuos 508 a 582 de la SEQ ID NO: 383 se cambia a CAT o CAC), incluyendo casetes de expresión tales como vectores de expresión, que codifican los polipéptidos de la invención.
Los métodos para descubrir nuevas secuencias de xilanasa utilizan los ácidos nucleicos de la invención. Los métodos para inhibir la expresión de genes de xilanasa, transcritos y polipéptidos utilizan los ácidos nucleicos de la invención. Los métodos para modificar los ácidos nucleicos de la invención son, por ejemplo, reensamblaje de ligamiento sintético, sistema de evolución dirigida optimizada y/o mutagénesis de saturación.
Los ácidos nucleicos de la invención se pueden elaborar, aislar y/o manipular, por ejemplo, mediante clonación y expresión de bibliotecas de ADNc, amplificación de mensaje o ADN genómico mediante PCR, y similares. Por ejemplo, las siguientes secuencias ilustrativas de la invención se obtuvieron inicialmente de las siguientes fuentes:
Tabla 3
SEQ ID FUENTE
1,
2 Bacteria
101,
102 Ambiental
103,
104 Bacteria
105,
106 Ambiental
107,
108 Bacteria
109,
110 Ambiental
11,
12 Ambiental
111,
112 Ambiental
113,
114 Ambiental
115,
116 Ambiental
117,
118 Ambiental
119,
120 Ambiental
121,
122 Ambiental
123,
124 Ambiental
125,
126 Ambiental
127,
128 Ambiental
129,
130 Bacteria
13,
14 Ambiental
131,
132 Ambiental
LU
0 0 0 0 0 ro jS 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
H
c C C C C •¡Z o C C Sz C C C C C C C C C C c Ir C C C C C C C C C C
Z
0 0 0 0 0 0 í- 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
LU
O O O O O "o CD O O O O O O O O O O O O O d O o O O O O O O O O O O
_>
F F F F F 0 H m ¿¡ F F F F F F F F F F F F F 0 CD F F F F F F F F F F F F
LL
< < < < < < < < < < < < < < < < < < < < < < < < < < < < < <
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
+-*
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
t” C C C C C c
C
C
C
C
C
C
C
C
C
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
O
d
O
O
O
O
O
O
O
O
O
O
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
0 CD
F
F
F
F
F
F
F
F
F
F
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
<
g
o
LU CO
co co o CM co co o CM CO CO O CM co co o CM co co o CM co co o CM co co o CM CO CO O CM CO CO O CM CO CO O CM CO CO O CM CO CO O
co
co
co
LO CO LO LO LO Lí) co CO co co co l^- co l^- I''- I''- l^- co co co co co O) o O) O) O) O) C_) C_) O C_) C_) t— CM t— t— CM CM CM CM CM CO CO CO CO CO LO
■*”
■*”
■*”
■*”
■*” ■*” ■*” ■*” ■*” ■*” ■*” ■*” ■*” ■*” ■*” ■*” CM ■*” ■*” ■*” CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM
co
LO en CO LO <J> LO CO LO en co LO en CO LO <J> co LO en <J) co LO en CO LO h- en CO LO h-" CT>" CO lo" h- <J) co" t— co" lo" h- <J) ^-T CO LO <J)
co
co
co
co
■y— LO LO LO LO LO CO co co co co — h- h- co co co co co O) O) O) O) O) O O O O o CM — — — CM CM CM CM CM CM CO CO CO CO CO rf
T—
T—
T—
t— t— t— t— t— t— T— T— T— T— T— T— T— T— t— T— T— T— T— t— CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM CM
LO
CM
LU
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ro ro 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
H
c C C C C C C C c Sz C C C C C C C C C C 0 c C C C C C C C c C C C c C C C C C C C C C C C C C C C C C C C C C C C C C C C C
Z
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
LU
_Q _Q _Q _Q _Q _Q _Q _Q d _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q ^ o _Q _Q _Q _Q _Q _Q _Q _Q d _Q _Q _Q _Q d _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q _Q
_>
F F F F F F F F 0 CD F F F F F F F F F F F l< F F F F F F F F 0 CD F F F F 0 CD F F F F F F F F F F F F F F F F F F F F F F F F F F F F F
LL
< < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < < <
CO
CM
CM
CO CO O CM CO CO O CM CO CO O CM CO 00 O CM CO 00 o CM co 00 o CM co 00 o CM CO 00 O CM co 00 o CM co 00 o CM co 00 o CM co 00
LO
LO
LO
LO
CO CO CO CO CO I''- CO h- h- h- l^- CO CO 00 00 00 O) o O) O) O) O) o o o o o T— CM t— T— CM CM CM CM CM CO co co co co LO co LO LO LO LO co co co co co
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CO CM CM CM CM CO co co co co co co CO CO CO CO CO CO CO CO CO CO co co co co co co co co co co co co co co co co co co co co co
,_r
CO lo" h- O> ,_r CO LO h-" en" h-" t— CO LO h-" <J) ro" LO h-" en <j> t— ro" lo" h-" en" co" t— co" lo" h- en" -r-T -r-T CO LO h-" <J> T— CO LO h- en co T— co LO h- en co LO <J> LO co LO en co LO h-
LO
LO
LO
LO
LO
(O CO CO (O (O CM h- h- h- h- 00 00 00 00 00 CM O) en en en en o o o o o CO — T— T— T~ CM CM CM CM CM co co co co co co co LO LO LO LO LO (O (O (O co
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM
CM CM CM CM CM co co co co co CO CO CO CO CO CO CO CO CO co co co co co co co co co co co co co co co co co co co (O
5
10
15
20
25
SEQ ID FUENTE
369,370
Ambiental
37,38
Ambiental
371, 372
Ambiental
373,374
Ambiental
375,376
Artificial
377,378
Artificial
39,40
Ambiental
41, 42
Ambiental
43,44
Ambiental
45, 46
Ambiental
47,48
Ambiental
49, 50
Ambiental
5,6
Ambiental
51, 52
Ambiental
53, 54
Bacteria
55, 56
Ambiental
57,58
Ambiental
59,60
Ambiental
61, 62
Ambiental
63,64
Ambiental
65,66
Ambiental
67, 68
Ambiental
69, 70
Ambiental
7, 8
Ambiental
71, 72
Ambiental
73, 74
Ambiental
75, 76
Ambiental
77, 78
Ambiental
79,80
Ambiental
81, 82
Ambiental
83,84
Ambiental
85, 86
Bacteria
87,88
Ambiental
89,90
Bacteria
9, 10
Ambiental
91, 92
Ambiental
93, 94
Ambiental
95,96
Ambiental
97,98
Ambiental
99, 100
Ambiental
Al poner en práctica los métodos divulgados en el presente documento, los genes homólogos se pueden modificar mediante manipulación de un ácido nucleico molde, como se describe en el presente documento. Esto se puede poner en práctica junto con cualquier método o protocolo o dispositivo conocido en la técnica, que son bien descritos en la bibliografía científica y de patentes.
Un ácido nucleico aislado puede comprender una de las secuencias de la divulgación y las secuencias sustancialmente idénticas a estas, las secuencias complementarias a estas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de una secuencia de la divulgación (o las secuencias complementarias a estas). Los ácidos nucleicos, aislados pueden comprender ADN, incluyendo ADNc, ADN genómico y ADN sintético. El ADN puede ser bicatenario o monocatenario y si es monocatenario puede ser la cadena codificante o la cadena no codificante (anti-sentido). Como alternativa, los ácidos nucleicos aislados pueden comprender ARN.
Un ácido nucleico aislado puede codificar uno de los polipéptidos de la invención o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de uno de los polipéptidos de la invención. Las secuencias codificantes de estos ácidos nucleicos pueden ser idénticas a una de las secuencias codificantes de uno de los ácidos nucleicos de la divulgación o uno de sus fragmentos o pueden ser secuencias codificantes diferentes que codifican uno de los polipéptidos de la invención, secuencias sustancialmente idénticas a estas y fragmentos que tienen al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de uno de los polipéptidos de la invención, como resultado de la redundancia o la degeneración del código genético. El código genético es bien conocido por los expertos en la técnica y se puede obtener, por ejemplo, en la página 214 de B. Lewin, Genes VI, Oxford University Press, 1997.
El ácido nucleico aislado que codifica uno de los polipéptidos de la invención y secuencias sustancialmente idénticas
5
10
15
20
25
30
35
40
45
50
55
60
65
a estas, puede incluir, pero no está limitado a: solo la secuencia codificante de un ácido nucleico de la invención y secuencias sustancialmente idénticas a estas y secuencias codificantes adicionales, tales como secuencias líder o secuencias de proproteínas y secuencias no codificantes, tales como intrones o secuencias no codificantes 5' y/o 3' de la secuencia codificante. De este modo, según se utiliza del presente documento, el término "polinucleótido que codifica un polipéptido" abarca un polinucleótido que incluye solo la secuencia codificante para el polipéptido así como un polinucleótido que incluye una secuencia codificante y/o secuencia no codificante.
Como alternativa, las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, se pueden mutageneizar utilizando técnicas convencionales, tales como mutagénesis dirigida al sitio, u otras técnicas familiares para los expertos en la técnica, para introducir cambios silenciosos en los polinucleótidos de la invención y secuencias sustancialmente idénticas a estas. Según se utiliza en el presente documento, los "cambios silenciosos" incluyen, por ejemplo, cambios que no alteran la secuencia de aminoácidos codificada por el polinucleótido. Tales cambios pueden ser deseables con el fin de incrementar el nivel del polipéptido producido por las células huésped que contienen un vector que codifica el polipéptido mediante la introducción de codones o pares de codones que aparecen frecuentemente en el organismo anfitrión.
La invención también se refiere a polinucleótidos que tienen cambios de nucleótido que dan como resultado sustituciones, adiciones, deleciones, fusiones y truncamientos de aminoácido en los polipéptidos de la invención y secuencias sustancialmente idénticas a estas. Tales cambios de nucleótido se pueden introducir utilizando técnicas tales como mutagénesis dirigida al sitio, mutagénesis química al azar, deleción mediante exonucleasa III y otras técnicas de ADN recombinante. Como alternativa, tales cambios de nucleótido pueden ser variantes alélicas de origen natural que son aisladas identificando los ácidos nucleicos que hibridan específicamente con sondas que comprenden al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de las secuencias de la invención y secuencias sustancialmente idénticas a estas (o las secuencias complementarias a estas) en condiciones de restricción alta, moderada, o baja como se proporciona en el presente documento.
Técnicas Generales
Los ácidos nucleicos utilizados para poner en práctica la presente invención, ya sean ARN, ARNi, ácido nucleico antisentido, ADNc, ADN genómico, vectores, virus o híbridos de los mismos, se pueden aislar de una variedad de fuentes, construir mediante ingeniería genética, amplificar, y/o expresar/generar de forma recombinante. Los polipéptidos recombinantes generados a partir de estos ácidos nucleicos se pueden aislar o clonar individualmente y someter a ensayo para determinar una actividad deseada. Se puede utilizar cualquier sistema de expresión recombinante, incluyendo sistemas de expresión bacterianos, de mamíferos, de levadura, de insecto o de células vegetales.
Como alternativa, estos ácidos nucleicos se pueden sintetizar in vitro por medio de técnicas de síntesis química bien conocidas, como describen, por ejemplo, Adams (1983) J. Am. Chem. Soc. 105:661; Belousov (1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radic. Biol. Med. 19:373-380; Blommers (1994) Biochemistry 33:7886- 7896; Narang (1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109; Beaucage (1981) Tetra. Lett. 22:1859; Patente de los Estados Unidos Núm. 4.458.066.
Las técnicas para la manipulación de ácidos nucleicos, tales como, por ejemplo, subclonación, sondas de marcaje (por ejemplo, marcaje del cebador al azar utilizando polimerasa de Klenow, translación de muescas, amplificación), secuenciación, hibridación y similares están bien descritas en la bibliografía científica y de patentes, véase, por ejemplo, Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACID PROBES, Part I. Theory y Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993).
Otro medio útil para obtener y manipular los ácidos nucleicos utilizados para la clonación en muestras genómicas, y, si se desea, cribar y volver a clonar los insertos aislados o amplificados en, por ejemplo, clones genómicos o clones de ADNc. Las fuentes de ácido nucleico utilizadas incluyen bibliotecas genómicas o de ADNc contenidas, por ejemplo, en cromosomas artificiales de mamífero (MAC), véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 5.721.118; 6.025.155; cromosomas artificiales humanos, véase, por ejemplo, Rosenfeld (1997) Nat. Genet. 15:333-335; cromosomas artificiales de levadura (YAC); cromosomas artificiales bacterianos (BAC); cromosomas artificiales P1, véase, por ejemplo, Woon (1998) Genomics 50:306-316; vectores derivados de P1 (PAC), véase, por ejemplo, Kern (1997) Biotechniques 23:120-124; cósmidos, virus recombinantes, fagos o plásmidos.
Un ácido nucleico que codifica un polipéptido de la invención se puede ensamblar en una fase apropiada con una secuencia líder capaz de dirigir secreción del polipéptido traducido o un fragmento del mismo.
Un polipéptido de la invención se puede fusionar a un péptido o polipéptido heterólogo, tal como péptidos de identificación N-terminal que confieren las características deseadas, tales como aumento de estabilidad o
5
10
15
20
25
30
35
40
45
50
55
60
65
purificación simplificada. Los péptidos y polipéptidos de la invención se pueden sintetizar y expresar también en forma de proteínas de fusión con uno o más dominios adicionales conectados a los mismos para, por ejemplo, producir un péptido más inmunogénico, para aislar más fácilmente un péptido sintetizado de forma recombinante, para identificar y aislar anticuerpos y células B que expresan anticuerpos, y similares. Los dominios que facilitan la detección y purificación incluyen, por ejemplo, péptidos quelantes de metales tales como tractos de polihistidina, y módulos de histidina-triptófano que permiten la purificación en metales inmovilizados, dominios de proteína A que permiten la purificación en inmunoglobulinas inmovilizadas, y el dominio utilizado el sistema de purificación extensión/afinidad FLAGS (Immunex Corp, Seattle WA). La inclusión de un conector de secuencias que se puede dividir tal como el Factor Xa o enteroquinasa (Invitrogen, San Diego CA) entre un dominio de purificación y el péptido que contiene el motivo o el polipéptido para facilitar la purificación. Por ejemplo, un vector de expresión puede incluir una secuencia de ácidos nucleicos que codifique el epítopo conectado a seis residuos de histidina seguidos por una tioredoxina y un sitio de escisión para la enteroquinasa (véase, por ejemplo, Williams (1995) Biochemistry 34:1787- 1797; Dobeli (1998) Protein Expr. Purif. 12:404-14). Los residuos de histidina facilitan la detección y la purificación mientras que el sitio de escisión de la enteroquinasa proporciona una manera para purificar el epítopo del resto de proteínas de fusión. La tecnología relativa a los vectores que codifican las proteínas de fusión y la aplicación de proteínas de fusión están bien descritas en la bibliografía científica y de patentes, véase por ejemplo, Kroll (1993) ADN Cell. Biol., 12:441-53.
Las frases "ácido nucleico" o "secuencia de ácido nucleico" según se utilizan en el presente documento hacen referencia a un oligonucleótido, nucleótido, polinucleótido, o a un fragmento de cualquiera de estos, a ADN o ARN de origen genómico o sintético que pueden ser monocatenarios o bicatenarios y pueden representar una hebra directa o antisentido, a ácido peptidonucleico (PNA), o a cualquier material de tipo ADN o de tipo ARN, de origen natural o sintético. Las frases "ácido nucleico" o "secuencia de ácido nucleico" incluye oligonucleótido, nucleótido, polinucleótido, o a un fragmento de cualquiera de estos, a ADN o ARN (por ejemplo, ARNm, ARNr, ARNt, ARNi) de origen genómico o sintético que puede ser monocatenario o bicatenario y pueden representar una cadena directa o antisentido, a ácido peptidonucleico (PNA), o a cualquier material de tipo ADN o de tipo ARN, de origen natural o sintético, incluyendo, por ejemplo, ARNi, ribonucleoproteínas (por ejemplo, por ejemplo, ARNi bicatenarios, por ejemplo, RNPi). El término abarca ácidos nucleicos, es decir, oligonucleótidos, que contienen análogos conocidos de nucleótidos naturales. El término también abarca estructuras de tipo ácido nucleico con esqueletos sintéticos, véanse por ejemplo, Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197; Strauss-Soukup (1997) Biochemistry 36:8692-8698; Samstag (1996) Antisense Nucleic Acid Drug Dev 6:153-156. "Oligonucleótido" incluye un polidesoxinucleótido monocatenario o dos cadenas complementarias de polidesoxinucleótidos que se pueden sintetizar químicamente. Tales oligonucleótidos sintéticos no tienen fosfato 5' y por tanto no se ligaran a otro oligonucleótido sin añadir un fosfato con un ATP en presencia de una quinasa. Un oligonucleótido sintético se puede ligar a un fragmento que no haya sido desfosforilado.
Una "secuencia codificante de" o una "secuencia de nucleótido que codifica" un polipéptido o proteína concreto, es una secuencia de ácido nucleico que es transcrita y traducida a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas.
El término "gen" significa el segmento de ADN implicado en la producción de una cadena polipeptídica; incluye las regiones anteriores y posteriores a la región codificante (líder y trailer) así como, cuando sea aplicable, las secuencias interpuestas (intrones) entre segmentos codificantes individuales (exones). "Conectado operablemente" según se utilizan en el presente documento hace referencia a una relación funcional entre dos o más segmentos de ácido nucleico (por ejemplo, ADN). Típicamente, hace referencia a la relación funcional de secuencias reguladoras transcripcionales con una secuencia transcrita. Por ejemplo, un promotor está conectado operablemente a una secuencia codificante, tal como un ácido nucleico de la invención, si estimula o modula la transcripción de la secuencia codificante en una célula huésped u otro sistema de expresión apropiado. Generalmente, las secuencias reguladoras de la transcripción promotoras que están conectadas operablemente a una secuencia transcrita son contiguas físicamente a la secuencia transcrita, es decir, actúan en cis. Sin embargo, algunas secuencias reguladoras de la transcripción, tales como los intensificadores, no necesitan estar contiguos físicamente o localizados en íntima proximidad a las secuencias codificantes cuya transcripción intensifican.
El término "casete de expresión" según se utiliza en el presente documento hace referencia a una secuencia de nucleótidos que es capaz de afectar a la expresión de un gen estructural (es decir, una secuencia de proteínas codificante, tal como una xilanasa de la invención) en un anfitrión compatible con tales secuencias. Los casetes de expresión incluyen al menos un promotor conectado operablemente con la secuencia codificante del polipéptido; y, opcionalmente, con otras secuencias, por ejemplo, señales de terminación de la transcripción. También se pueden utilizar factores necesarios o útiles para efectuar la expresión, por ejemplo, intensificadores. De este modo, los casetes de expresión también incluyen plásmidos, vectores de expresión, virus recombinantes, cualquier forma de vector de "ADN desnudo" recombinante, y similares. Un "vector" comprende un ácido nucleico que puede infectar, transfectar, transducir transitoriamente o permanentemente una célula. Se advertirá que un vector puede ser un ácido nucleico desnudo, o un ácido nucleico que forma complejo con proteínas o lípidos. El vector comprende opcionalmente ácidos nucleicos y/o proteínas, y/o membranas virales o bacterianas (por ejemplo, una membrana celular, una envoltura lipídica viral, etc.). Los vectores incluyen, pero no están limitados a replicones (por ejemplo, replicones de ARN, bacteriófagos) a los que se pueden anclar los fragmentos de ADN y replicarlos. Los vectores
5
10
15
20
25
30
35
40
45
50
55
60
65
incluyen así, pero no están limitados a ARN, ADN o ARN circulares o lineales autorreplicantes autónomos (por ejemplo, plásmidos, virus, y similares, véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.217.879), e incluyen plásmidos con expresión y sin expresión. Cuando se describe que un microorganismo recombinante o cultivo celular alberga un "vector de expresión" esto incluye tanto ADN circular y linear extracromosómico como ADN que ha sido incorporado al cromosoma o a los cromosomas del anfitrión. Cuando un vector está siendo mantenido por una célula huésped, el vector puede ser replicado establemente por las células durante la mitosis en forma de una estructura autónoma, o es incorporado al genoma de anfitrión.
Según se utiliza en el presente documento, el término "promotor" incluye todas las secuencias capaces de dirigir la transcripción de una secuencia codificante en una célula, por ejemplo, una célula vegetal. De este modo, los promotores utilizados en las construcciones de la invención incluyen elementos de control de la transcripción que actúan en cis y secuencias reguladoras que están implicadas en la regulación o la modulación de la duración y/o la velocidad de la transcripción de un gen. Por ejemplo, un promotor puede ser un elemento de control de la transcripción que actúa en cis, incluyendo un intensificador, un promotor, un terminador de la transcripción, un origen de replicación, una secuencia de integración cromosómica, regiones no traducidas 5' y 3', o una secuencia intrónica, que están implicados en la regulación de la transcripción. Estas secuencias que actúan en cis interactúan típicamente con proteínas u otras biomoléculas para llevar a cabo (activar/desactivar, regular, modular, etc.) la transcripción. Los promotores "constitutivos" son aquellos que dirigen la expresión continuamente en la mayoría de las condiciones ambientales y estados de desarrollo o diferenciación celular. Los promotores "inducibles" o "regulables" dirigen la expresión del ácido nucleico de la invención bajo la influencia de las condiciones ambientales o condiciones de desarrollo. Los ejemplos de las condiciones ambientales que puede afectar a la transcripción por promotores inducibles incluyen condiciones anaeróbicas, temperatura elevada, sequía, o la presencia de luz.
Los promotores "específicos de tejido" son elementos de control de la transcripción que únicamente son activos en células o tejidos u órganos concretos, por ejemplo, en plantas o animales. La regulación específica del tejido se puede lograr por medio de ciertos factores intrínsecos que aseguran que los genes que codifican proteínas específicas para un tejido dado se expresen. Se sabe que tales factores existen en mamíferos y plantas de manera que permiten que se desarrollen tejidos específicos.
Según se utiliza en el presente documento, el término "aislado" significa que el material es separado de su entorno original (por ejemplo, el entorno natural si es de origen natural). Por ejemplo, polinucleótido o polipéptido de origen natural presente en un animal vivo no está aislado, pero el mismo polinucleótido o polipéptido, separado de alguno o de todos los materiales coexistentes en el sistema natural, está aislado. Tales polinucleótidos podían ser parte de un vector y/o tales polinucleótidos o polipéptidos podían ser parte de una composición y todavía estar aislados ya que tal vector o composición no es parte de su entorno natural. Según se utiliza en el presente documento, el término "purificado" no requiere pureza absoluta; más bien, se pretende que sea una definición relativa. Los ácidos nucleicos individuales obtenidos de una biblioteca se han purificado convencionalmente hasta la homogeneidad electroforética. Las secuencias obtenidas de uno de estos clones no se pudieron obtener directamente a partir de la biblioteca o a partir del ADN humano total. Los ácidos nucleicos purificados de la invención han sido purificados a partir del resto del ADN genómico en el organismo en al menos 104-106 veces. Sin embargo, el término "purificado" también incluye ácidos nucleicos que han sido purificados a partir del resto del ADN genómico o a partir de otras secuencias en una biblioteca u otro entorno en al menos un orden de magnitud, típicamente dos o tres órdenes y más típicamente cuatro o cinco órdenes de magnitud.
Según se utiliza en el presente documento, el término "recombinante" significa que el ácido nucleico es adyacente a un "esqueleto" del ácido nucleico al que no es adyacente en su entorno natural. Adicionalmente, para estar "enriquecidos" los ácidos nucleicos representarán 5 % o más del número de insertos de ácido nucleico en una población de moléculas troncales de ácido nucleico. Las moléculas troncales de acuerdo con la invención incluyen ácidos nucleicos tales como vectores de expresión, ácidos nucleicos autoreplicantes, virus, ácidos nucleicos integrantes y otros vectores o ácidos nucleicos utilizados para mantener o manipular un inserto de ácido nucleico de interés. Típicamente, los ácidos nucleicos enriquecidos representan 15 % o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes. Más típicamente, los ácidos nucleicos enriquecidos representan 50 % o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes. En un aspecto, los ácidos nucleicos enriquecidos representan 90 % o más del número de insertos de ácido nucleico en la población de moléculas troncales recombinantes.
Los "plásmidos" se designan con una "p" minúscula precedida y/o seguida de letras mayúsculas y/o números. Los plásmidos de partida en la presente invención están comercialmente disponibles, están disponibles públicamente sin restricciones, o pueden construirse a partir de plásmidos disponibles de acuerdo con los procedimientos publicados. Además, los plásmidos equivalentes a los descritos en el presente documento son conocidos en la técnica y serán evidentes para el experto en la materia. Los “plásmidos” pueden estar comercialmente disponibles, disponibles públicamente sin restricciones, o pueden construirse a partir de plásmidos disponibles de acuerdo con los procedimientos publicados. Los plásmidos equivalentes a los descritos en el presente documento son conocidos en la técnica y serán evidentes para el experto en la materia.
"Digestión" de ADN hace referencia a la escisión catalítica del ADN con una enzima de restricción que actúa
5
10
15
20
25
30
35
40
45
50
55
60
65
únicamente en ciertas secuencias en el ADN. Las diversas enzimas de restricción utilizadas en el presente documento están disponibles en el mercado y sus condiciones de reacción, cofactores y otros requerimientos se utilizarían como conocen los expertos normales en la técnica. Con fines analíticos, típicamente se utiliza 1 |jg de plásmido o fragmento de ADN con aproximadamente 2 unidades de enzima en aproximadamente 20 jl de solución tampón. Con el fin de aislar fragmentos de ADN para la construcción del plásmido, e digieren típicamente de 5 a 50 jg de ADN con 20 a 250 unidades de enzima en un gran volumen. Los tampones y las cantidades de sustrato apropiados para las enzimas de restricción concretas son especificados por el fabricante. Normalmente se utilizan tiempos de incubación de aproximadamente 1 hora a 37 °C, pero pueden variar de acuerdo con las instrucciones del fabricante. Después de la digestión, se puede realizar la electroforesis en gel para aislar el fragmento deseado.
"Hibridación" hace referencia al procedimiento mediante el cual una hebra de ácido nucleico se une a una hebra complementaria a través de emparejamiento de bases. Las reacciones de hibridación pueden ser sensibles y selectivas de manera que una secuencia de interés concreta se puede identificar incluso en muestras en las que está presente a bajas concentraciones. Las condiciones adecuadamente restrictivas pueden estar definidas, por ejemplo, por las concentraciones de sal o formamida en las soluciones de prehibridación e hibridación, o por la temperatura de hibridación y son bien conocidas en la técnica. En particular, la restricción se puede incrementar reduciendo la concentración de sal, incrementando la concentración de formamida, o subiendo la temperatura de hibridación. En aspectos alternativos, los ácidos nucleicos de la invención se definen por su capacidad de hibridar en diversas condiciones restrictivas (por ejemplo, altas, medias, y bajas), como se muestra en el presente documento.
Por ejemplo, la hibridación en condiciones altamente restrictivas se podría producir en formamida a aproximadamente 50 % a aproximadamente 37 °C a 42 °C. La hibridación se podría producir en condiciones poco restrictivas en formamida de aproximadamente 35 % a 25 % a aproximadamente 30 °C a 35 °C. En particular, hibridación se podría producir en condiciones altamente restrictivas a 42 °C en formamida al 50 %, 5X SSPE, SDS al 0,3 % y 200 n/ml de ADN de esperma de salmón desnaturalizado y sometido a cizalla. La hibridación se podría producir condiciones poco restrictivas como se ha descrito anteriormente, pero en formamida al 35 % a una temperatura reducida de 35 °C. El intervalo de temperatura correspondiente a un nivel de restricción concreto se puede estrechar adicionalmente calculando la proporción de purina a pirimidina del ácido nucleico de interés y ajustando en consecuencia la temperatura. Las variaciones de los intervalos y condiciones anteriores son bien conocidas en la técnica.
Secuencias de control de la transcripción y la traducción
La invención proporciona secuencias de ácido nucleico (por ejemplo, ADN) de la invención conectadas operativamente a una o varias secuencias de control de la expresión (por ejemplo, transcripcional o traduccional), por ejemplo, promotores o intensificadores, para dirigir o modular la síntesis/expresión del ARN. La secuencia de control de la expresión puede estar en un vector de expresión. Los promotores bacterianos ilustrativos incluyen lacl, lacZ, T3, T7, gpt, lambda PR, PL y trp. Los promotores eucarióticos ilustrativos incluyen temprano inmediato de CMV, timidina quinasa de HSV, temprano y tardío de SV40, LTR de retrovirus, y metalotioneína I de ratón. Una secuencia promotora está "conectada operativamente" a una secuencia codificante cuando la ARN polimerasa que inicia la transcripción en el promotor transcribirá la secuencia codificante en ARNm.
Los promotores adecuados para expresar un polipéptido en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor PR de lambda, el promotor PL de lambda, promotores de operones que codifican enzimas glicolíticas tales como 3-fosfoglicerato quinasa (PGK), y el promotor de la fosfatasa ácida. Los promotores eucarióticos incluyen el promotor temprano inmediato de CMV, el promotor de la timidina quinasa de hSv, promotores de choque térmico, el promotor temprano y tardío de SV40, las LTR de retrovirus, y el promotor de la metalotioneína I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus. Los promotores adecuados para expresar el polipéptido o fragmento del mismo en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor Pr de Lambda, el promotor Pl de lambda, promotores de operones que codifican enzimas glicolíticas tales como 3- fosfoglicerato quinasa (PGK) y el promotor de la fosfatasa ácida. Los promotores fúngicos incluyen el promotor del factor a. Los promotores eucarióticos incluyen el promotor temprano inmediato de CMV, el promotor de la timidina quinasa de hSv, promotores de choque térmico, el promotor temprano y tardío de SV40, las LTR de retrovirus, y el promotor de la metalotioneína I de ratón. También se pueden utilizar otros promotores conocidos por controlar la expresión de genes en células procarióticas o eucarióticas o sus virus.
Promotores Vegetales Específicos de Tejidos
La invención proporciona casetes de expresión que se pueden expresar de una manera específica del tejido, por ejemplo, que puede expresar una xilanasa de la invención de una manera específica del tejido. La invención también proporciona plantas o semillas que expresan una xilanasa de la invención de una manera específica del tejido. La especificidad del tejido puede ser específico de la semilla, específico del tallo, específico de la hoja, específico de la raíz, específico del fruto y similares.
5
10
15
20
25
30
35
40
45
50
55
60
65
Se puede utilizar un promotor constitutivo tal como el promotor 35S de CaMV para su expresión en partes específicas de la planta o semilla o en toda la planta. Por ejemplo, para la expresión en exceso, se puede emplear un fragmento de promotor vegetal que dirigirá la expresión de un ácido nucleico en algunos o todos los tejidos de una planta, por ejemplo, una planta regenerada. Tales promotores son referidos en el presente documento como promotores "constitutivos" y son activos en la mayoría de las condiciones ambientales y estados de desarrollo o diferenciación celular. Los ejemplos de los promotores constitutivos incluyen la región de iniciación de la transcripción 35S del virus del mosaico de la coliflor (CaMV) 35S, el promotor 1' o 2' derivado de ADN-T de Agrobacterium tumefaciens, y otras regiones de iniciación de la transcripción de diversos genes vegetales conocidos por los expertos en la técnica. Tales genes incluyen, por ejemplo, ACT11 de Arabidopsis (Huang (1996) Plant Mol. Biol. 33:125-139); Cat3 de Arabidopsis (GenBank No. U43147, Zhong (1996) Mol. Gen. Genet. 251:196-203); el gen codificante de la desaturasa de la proteína portadora de estearoilo-acilo de Brassica napus (Genbank No. X74782, Solocombe (1994) Plant Physiol. 104:1167-1176); GPc1 del maíz (GenBank No. X15596; Martínez (1989) J. Mol. Biol 208:551-565); Gpc2 del maíz (GenBank No. U45855, Manjunath (1997) Plant Mol. Biol. 33:97-112); los promotores vegetales descritos en las Patentes de los Estados Unidos Núms. 4.962.028; 5.633.440.
La invención utiliza promotores específicos de tejido o constitutivos derivados de virus que pueden incluir, por ejemplo, el promotor subgenómico de tobamovirus (Kumagai (1995) Proc. Natl. Acad. Sci. USA 92:1679-1683; el virus baciliforme tungro del arroz (RTBV), que replica solo en células de floema en plantas de arroz infectadas, con su promotor que dirige la expresión del gen informador específico del floema fuerte; el promotor del virus del mosaico de la nervadura de la yuca (CVMV), con la actividad más alta en los elementos vasculares, en células del mesófilo de las hojas, y en las puntas de las raíces (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).
Como alternativa, el promotor vegetal puede dirigir la expresión del ácido nucleico que expresa xilanasa en un tejido específico, órgano o tipo celular (es decir promotores específicos de tejido) o puede estar por el contrario bajo un control ambiental o de desarrollo más preciso o bajo el control de un promotor inducible. Los ejemplos de las condiciones ambientales que pueden afectar a la transcripción incluyen condiciones anaeróbicas, temperatura elevada, la presencia de luz, o pulverización con productos químicos/hormonas. Por ejemplo, la invención incorpora el promotor inducible por sequía del maíz (Busk (1997) supra); el promotor inducible por frío, sequía, y alta concentración de sal de la patata (Kirch (1997) Plant Mol. Biol. 33:897 909).
Los promotores específicos de tejido pueden promover la transcripción solo en un cierto marco temporal del estado de desarrollo de ese tejido. Véase, por ejemplo, Blázquez (1998) Plant Cell 10:791-800, que caracteriza el promotor del gen LEAFY de Arabidopsis. Véase también Cardon (1997) Plant J 12:367-77, que describe el factor de transcripción SPL3, que reconoce un motivo de secuencia conservado en la región promotora del gen AP1 de identidad del meristemo floral de A. thaliana; y Mandel (1995) Plant Molecular Biology, Vol. 29, págs. 995-1004, que describe el promotor del meristemo eIF4. Se pueden utilizar los promotores específicos de tejidos que son activos a lo largo del ciclo de vida de un tejido concreto. Los ácidos nucleicos de la invención pueden estar conectados operablemente a un promotor activo principalmente solo en células de fibra de algodón. O los ácidos nucleicos de la invención están conectados operablemente a un promotor activo principalmente durante las fases de elongación de las células de la fibras de algodón, por ejemplo, como describe Rinehart (1996) supra. Los ácidos nucleicos pueden estar conectados operablemente al promotor del gen Fb12A para ser expresados preferentemente en células de fibra de algodón (Ídem). Véase también, John (1997) Proc. Natl. Acad. Sci. USA 89:5769-5773; John, et al., Patentes de los Estados Unidos Núms. 5.608.148 y 5.602.321, que describen promotores específicos de fibra de algodón y métodos para la construcción de plantas de algodón transgénicas. También se pueden utilizar promotores específicos de raíces para expresar los ácidos nucleicos de la invención. Los ejemplos de los promotores específicos de raíces incluyen el promotor del gen de la alcohol deshidrogenasa (DeLisle (1990) Int. Rev. Cytol. 123:39-60). Otros promotores que se pueden utilizar para expresar los ácidos nucleicos de la invención incluyen, por ejemplo, promotores específicos de ovulo, específicos de embrión, específicos de endospermo, específicos de integumento, específicos del revestimiento de la semilla, o alguna de sus combinaciones; un promotor específico de hoja (véase, por ejemplo, Busk (1997) Plant J. 11:1285 1295, que describe un promotor específico de hoja en el maíz); el promotor ORF13 de Agrobacterium rhizogenes (que muestra alta actividad en raíces, véase, por ejemplo, Hansen (1997) supra); un promotor específico de polen de maíz (véase, por ejemplo, Guerrero (1990) Mol. Gen. Genet. 224:161 168); se puede utilizar un promotor de tomate activo durante la maduración del fruto, la senescencia y la abscisión de las hojas y, en menor grado, de las flores (véase, por ejemplo, Blume (1997) Plant J. 12:731 746); un promotor específico del pistilo del gen SK2 de la patata (véase, por ejemplo, Ficker (1997) Plant Mol. Biol. 35:425 431); el gen Blec4 del guisante, que es activo en tejido epidérmico de ápices de brotes vegetativos y florales de alfalfa transgénica que lo hacen una herramienta útil para dirigir la expresión de genes foráneos a la capa epidérmica de brotes o fibras que crecen activamente; el gen BEL1 específico de óvulos (véase, por ejemplo, Reiser (1995) Cell 83:735-742, GenBank Núm. U39944); y/o, el promotor de Klee, Patente de los Estados Unidos Núm. 5.589.583, que describe una región promotora vegetal que es capaz de convertir elevados niveles de transcripción en tejido meristemático y/o células que se dividen rápidamente.
Como alternativa, los promotores vegetales que son inducibles después de su exposición a hormonas vegetales, tales como las auxinas, se utilizan para expresar los ácidos nucleicos de la invención. Por ejemplo, la invención puede utilizar el fragmento promotor E1 de los elementos de respuesta a auxinas (AuxREs) en la soja (Glycine max L.) (Liu (1997) Plant Physiol. 115:397-407); el promotor GST6 de Arabidopsis sensible a auxinas (también sensible a
5
10
15
20
25
30
35
40
45
50
55
60
65
ácido salicílico y peróxido de hidrógeno) (Chen (1996) Plant J. 10: 955-966); el promotor parC inducible por auxinas del tabaco (Sakai (1996) 37:906-913); un elemento de respuesta a biotina vegetal (Streit (1997) Mol. Plant Microbe Interact. 10:933-937); y, el promotor sensible a la hormona del estrés ácido abscísico (Sheen (1996) Science 274:1900-1902).
Los ácidos nucleicos de la invención se pueden conectar también operablemente a promotores vegetales que son inducibles después de la exposición a reactivos químicos que se pueden aplicar a la planta, tales como herbicidas o antibióticos. Por ejemplo, se puede utilizar el promotor In2-2 de maíz, activado por protectores contra herbicidas de bencenosulfonamida, (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores contra herbicidas induce distintos patrones de expresión génica, incluyendo expresión en la raíz, hidatodos, y el meristemo apical de los brotes. La secuencia codificante puede estar bajo el control de, por ejemplo, un promotor inducible de tetraciclina, por ejemplo, como se ha descrito con las plantas de tabaco transgénicas que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o, un elemento sensible al ácido salicílico (Stange (1997) Plant J. 11:1315-1324). Utilizando promotores inducidos químicamente (por ejemplo, hormona o plaguicida), es decir, un promotor sensible a un agente químico que se puede aplicar a la planta transgénica en el campo, la expresión de un polipéptido de la invención se puede inducir en una fase concreta de desarrollo de la planta. De este modo, la invención también proporciona plantas transgénicas que contienen un gen inducible codificante de polipéptidos de la invención cuya gama de anfitriones está limitada a especies de plantas objetivo, tales como maíz, arroz, cebada, trigo, patata u otros cultivos, inducible en cualquier estado de desarrollo del cultivo.
Un experto en la técnica advertirá que un promotor específico de tejido vegetal puede dirigir la expresión de secuencias conectadas operablemente en tejidos distintos del tejido diana. De este modo, un promotor específico de tejido es el que dirige la expresión preferentemente en el tejido diana o tipo celular, pero puede además conducir a cierta expresión también en otros tejidos.
Los ácidos nucleicos de la invención pueden estar también conectados operablemente a promotores vegetales que son inducibles tras la exposición a reactivos químicos. Estos reactivos incluyen, por ejemplo, herbicidas, auxinas sintéticas, o antibióticos que se pueden aplicar, por ejemplo, pulverizar, sobre las plantas transgénicas. La expresión inducible de los ácidos nucleicos que producen xilanasa de la invención permitirá al productor seleccionar plantas con expresión y/o actividad xilanasa óptima. De este modo se puede controlar el desarrollo de partes de las plantas. De este modo la invención proporciona el medio para facilitar la cosecha de plantas y partes de plantas. Por ejemplo, en diversas realizaciones, se utiliza el promotor In2-2 de maíz, activado por protectores contra herbicidas de bencenosulfonamida (De Veylder (1997) Plant Cell Physiol. 38:568-577); la aplicación de diferentes protectores contra herbicidas induce distintos patrones de expresión génica, incluyendo expresión en la raíz, hidatodos, y el meristemo apical del brote. Las secuencias codificantes de la invención también están bajo el control de un promotor de tetraciclina inducible, por ejemplo, como los descritos con plantas de tabaco transgénica que contienen el gen de la arginina descarboxilasa de Avena sativa L. (avena) (Masgrau (1997) Plant J. 11:465-473); o, un elemento sensible al ácido salicílico (Stange (1997) Plant J. 11:1315-1324).
En algunos aspectos, expresión apropiada del polipéptido puede requerir una región de poliadenilación en el extremo 3' de la región codificante. La región de poliadenilación se puede obtener del gen natural, a partir de una variedad de genes de otra planta (o animal u otro), o a partir de genes en el ADN-T Agrobacterial.
El término "planta" (por ejemplo, como en una planta transgénica o semilla de planta de la presente invención o promotor vegetal usado en un vector de la invención) incluye plantas completas, partes de plantas (por ejemplo, hojas, tallos, flores, raíces, etc.), protoplastos vegetales, semillas y células vegetales y sus progenies; las clases de plantas que se pueden utilizar para poner en práctica la presente invención (incluyendo composiciones y métodos) puede ser tan amplio como la clase de plantas superiores, incluyendo plantas susceptibles de técnicas de transformación, incluyendo angiospermas (plantas monocotiledóneas y dicotiledóneas), así como gimnospermas, incluyendo también plantas de diversos niveles de ploidía, incluyendo estados poliploide, diploide, haploide y hemicigoto. Según se utiliza en el presente documento, el término "planta transgénica" incluye plantas o células vegetales en las que se ha insertado una secuencia de ácido nucleico heteróloga, por ejemplo, los ácidos nucleicos y diversas construcciones recombinantes (por ejemplo, casetes de expresión, tales como vectores) de la invención. Las plantas transgénicas de la invención también se tratan a continuación.
Vectores de expresión y vehículos de clonación
La invención proporciona vectores de expresión y vehículos de clonación que comprenden ácidos nucleicos de la invención, por ejemplo, secuencias que codifican las xilanasas de la invención. Los vectores de expresión y los vehículos de clonación de la invención pueden comprender partículas virales, baculovirus, fagos, plásmidos, fagemidos, cósmidos, fósmidos, cromosomas artificiales bacterianos, ADN viral (por ejemplo, vaccinia, adenovirus, virus de la viruela aviar, pseudorrabia y derivados de SV40), cromosomas artificiales basados en P1, plásmidos de levadura, cromosomas artificiales de levadura, y otros vectores cualesquiera específicos para anfitriones de interés específicos (tales como bacillus, Aspergillus y levadura). Los vectores de la invención pueden incluir secuencias de aDn cromosómico, no cromosómico y sintético. Es conocido un gran número de vectores adecuados por los
5
10
15
20
25
30
35
40
45
50
55
60
65
expertos en la técnica, y están disponibles en el mercado. Los vectores ilustrativos incluyen: vectores bacterianos: pQE (Qiagen), plásmidos pBluescript, vectores pNH, (vectores lambda-ZAP (Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); eucarióticos: pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Sin embargo, se puede utilizar cualquier otro plásmido u otro vector con tal que sean replicables y viables en el anfitrión. Se pueden emplear vectores con bajo número de copias o alto número de copias con la presente invención.
El vector de expresión puede comprender un promotor, un sitio de unión al ribosoma para el comienzo de la traducción y un terminador de la transcripción. El vector puede incluir también las secuencias apropiadas para amplificar la expresión. Los vectores de expresión de mamíferos pueden comprender un origen de replicación, sitios de unión al ribosoma necesarios cualesquiera, un sitio de poliadenilación, un donadores y aceptores de empalme, secuencias de terminación de la transcripción, secuencias no transcritas flanqueantes 5'. En algunos aspectos, se pueden utilizar secuencias de ADN derivadas de los sitios de empalme y poliadenilación de SV40 para proporcionar los elementos genéticos no transcritos requeridos.
En un aspecto, la vectores de expresión contienen uno o más genes marcadores seleccionables para permitir la selección de células huésped que contienen el vector. Tales marcadores seleccionables incluyen genes que codifican la dihidrofolato reductasa o genes que confieren resistencia a la neomicina para el cultivo de células eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli, y el gen TRP1 de S. cerevisiae. Las regiones promotoras se pueden seleccionar a partir de cualquier gen deseado utilizando vectores de cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables.
Los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas pueden contener también intensificadores para incrementar los niveles de expresión. Los intensificadores son elementos que actúan en cis de ADN, usualmente de aproximadamente 10 a aproximadamente 300 pb de longitud que actúan sobre un promotor para incrementar su transcripción. Los ejemplos incluyen intensificador de SV40 en el lado tardío del origen de replicación pb 100 a 270, el intensificador del promotor temprano de citomegalovirus, el intensificador del polioma en el lado tardío del origen de replicación, y los intensificadores de adenovirus.
Una secuencia de ácido nucleico se puede insertar en un vector por medio de una variedad de procedimientos. En general, la secuencia se liga a la posición deseada en el vector después de la digestión del inserto y el vector con endonucleasas de restricción apropiadas. Como alternativa, los extremos romos en el inserto y en el vector se pueden ligar. Una variedad de mecanismos de clonación con conocidas en la técnica, por ejemplo, como describen Ausubel y Sambrook. Se considera que tales procedimientos y otros se encuentran al alcance de los expertos en la técnica.
El vector puede estar en forma de un plásmido, una partícula viral, o un fago. Otros vectores incluyen secuencias de ADN cromosómico, no cromosómico y sintético, derivados de SV40; plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fago, ADN viral tal como vaccinia, adenovirus, virus de la viruela aviar, y pseudorrabia. Una variedad de vectores de clonación y expresión para su uso con anfitriones procarióticos y eucarióticos son descritos, por ejemplo, por Sambrook.
Los vectores bacterianos concretos que se pueden utilizar incluyen los plásmidos asequibles comercialmente comprenden elementos genéticos de vectores de clonación bien conocidos pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suecia), GEM1 (Promega Biotec, Madison, WI, USA) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 y pCM7. Los vectores eucarióticos concretos incluyen pSV2CAT, pOG44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG, y pSVL (Pharmacia). Sin embargo, se puede utilizar cualquier otro vector con tal que sea replicable y viable en la célula huésped.
Los ácidos nucleicos de la invención se pueden expresar en casetes de expresión, vectores o virus y expresar transitoriamente o establemente en células vegetales y semillas. Un sistema de expresión transitorio ilustrativo utiliza sistemas de expresión episómicos, por ejemplo, ARNB viral del virus del mosaico de la coliflor (CaMV) generado en el núcleo mediante transcripción de un mini-cromosoma episómico que contiene ADN superenrollado, véase, por ejemplo, Covey (1990) Proc. Natl. Acad. Sci. USA 87:1633-1637. Como alternativa, se pueden insertar secuencias codificantes, es decir, todas o sub-fragmentos de secuencias de la invención en un genoma de una célula huésped vegetal correspondiente a una parte integrante del ADN cromosómico del anfitrión. Se pueden expresar de esta manera transcritos directos o antisentido. Un vector que comprende las secuencias (por ejemplo, regiones promotoras o codificantes) de ácidos nucleicos de la invención puede comprender un gen marcador que confiere un fenotipo seleccionable en una célula vegetal o una semilla. Por ejemplo, el marcador puede codificar resistencia a biocidas, particularmente resistencia a antibióticos, tal como resistencia a kanamicina, G418, bleomicina, higromicina, o resistencia a herbicidas, tal como resistencia a clorosulfurón o Basta.
Los vectores de expresión capaces de expresar ácidos nucleicos y proteínas en plantas son bien conocidos en la técnica, y pueden incluir, por ejemplo, vectores de Agrobacterium spp., virus X de la patata (véase, por ejemplo, Angell (1997) EMBO J. 16:3675-3684), virus del mosaico del tabaco (véase, por ejemplo, Casper (1996) Gene 173:69-73), virus del enanismo arbustivo del tomate (véase, por ejemplo, Hillman (1989) Virology 169:42-50), virus
5
10
15
20
25
30
35
40
45
50
55
60
65
del grabado del tabaco (véase, por ejemplo, Dolja (1997) Virology 234:243-252), virus del mosaico amarillo de la judía (véase, por ejemplo, Morinaga (1993) Microbiol Immunol. 37:471-476), virus del mosaico de la coliflor (véase, por ejemplo, Cecchini (1997) Mol. Plant Microbe Interact. 10:1094-1101), elemento transponible del maíz Ac/Ds (véase, por ejemplo, Rubin (1997) Mol. Cell. Biol. 17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), y elemento transponible supresor-mutador (Spm) del maíz (véase, por ejemplo, Schlappi (1996) Plant Mol. Biol. 32:717-725); y derivados de los mismos.
El vector de expresión puede tener dos sistemas de replicación para permitirle mantenerse en dos organismos, por ejemplo en células de mamífero o insecto para su expresión y en un anfitrión procariótico para su clonación y amplificación. Además, para los vectores de expresión integrantes, el vector de expresión puede contener al menos una secuencia homóloga al genoma de la célula huésped. Puede contener dos secuencias homólogas que flanquean la construcción de expresión. El vector integrante puede dirigirse a un locus específico en la célula huésped seleccionando la secuencia homóloga apropiada para la inclusión en el vector. Las construcciones para los vectores integrantes son bien conocidos en la técnica.
Los vectores de expresión de la invención pueden incluir también un gen marcador seleccionable para permitir la selección de cepas bacterianas que han sido transformadas, por ejemplo, genes que vuelven la bacteria resistente a fármacos tales como ampicilina, cloramfenicol, eritromicina, kanamicina, neomicina y tetraciclina. Los marcadores seleccionables pueden incluir también genes biosintéticos, tales como los de las rutas biosintéticas de la histidina, el triptófano y la leucina.
La secuencia de ADN en el vector de expresión está conectada operativamente a una o varias secuencias de control de la expresión (promotor) apropiadas para dirigir la síntesis de ARN. Los promotores bacterianos designados concretos incluyen lacI, lacZ, T3, T7, gpt, Pr, Pl de lambda y trp. Los promotores eucarióticos incluyen el temprano inmediato de CMV, timidina quinasa de HSV, temprano y tardío de ate SV40, las LTR de retrovirus y metalotioneína I de ratón. La selección del vector y el promotor apropiados está al nivel de conocimiento práctico normal en la técnica. El vector de expresión también contiene un sitio de unión al ribosoma para el comienzo de la traducción y un terminador de la transcripción. El vector puede incluir también secuencias apropiadas para amplificar la expresión. Las regiones promotoras se pueden seleccionar entre cualquier gen deseado utilizando vectores de la cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables. Además, los vectores de expresión contienen preferentemente uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para la selección de células huésped transformadas tal como dihidrofolato reductasa o resistencia a la neomicina para un cultivo celular eucariótico, o tal como resistencia a tetraciclina o ampicilina en E. coli.
Los vectores de expresión de mamíferos pueden comprender también un origen de replicación, sitios de unión al ribosoma necesarios cualesquiera, un sitio de poliadenilación, sitios donadores o aceptores de empalme, secuencias de terminación de la transcripción y secuencias no transcritas flanqueantes 5'. Se pueden utilizar secuencias ADN derivadas de los sitios de empalme y poliadenilación de SV40 para proporcionar los elementos genéticos no transcritos requeridos.
Los vectores para expresar el polipéptido o fragmento del mismo en células eucarióticas pueden contener también intensificadores para incrementar los niveles de expresión. Los intensificadores son elementos de ADN que actúan en cis, usualmente de aproximadamente 10 a aproximadamente 300 pb de longitud que actúan sobre un promotor para incrementar su transcripción. Sus ejemplos incluyen el intensificador de SV40 en el lado tardío del origen de replicación pb 100 a 270, el intensificador del promotor temprano de citomegalovirus, el intensificador del polioma en el lado tardío del origen de replicación y los intensificadores de adenovirus.
Además, la vectores de expresión contienen típicamente uno o más genes marcadores seleccionables para permitir la selección de células huésped que contienen el vector. Tales marcadores seleccionables incluyen genes que codifican genes de la dihidrofolato reductasa o genes que confieren resistencia a la neomicina para el cultivo de células eucarióticas, genes que confieren resistencia a tetraciclina o ampicilina en E. coli y el gen TRP1 de S. cerevisiae.
En algunos aspectos, el ácido nucleico que codifica uno de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas, o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos del mismo se ensambla en la fase apropiada con una secuencia líder capaz de dirigir la secreción del polipéptido traducido o un fragmento del mismo. El ácido nucleico puede codificar un polipéptido de fusión en el que uno de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas, o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos del mismo se fusiona a péptidos o polipéptidos heterólogos, tales como péptidos de identificación N-terminal que confieren las características deseadas, tales como el aumento de estabilidad o la simplificación de la purificación.
La secuencia de aDn apropiada se puede insertar en el vector por medio de una variedad de procedimientos. En general, la secuencia de ADN se liga a la posición deseada en el vector después de la digestión del inserto y el vector con endonucleasas de restricción apropiadas. Como alternativa, se pueden ligar los extremos romos del inserto y del vector. Una variedad de técnicas de clonación se describe por Ausubel et al. Current Protocols in
5
10
15
20
25
30
35
40
45
50
55
60
65
Molecular Biology, John Wiley 503 Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Se considera que tales procedimientos y otros están al alcance de los expertos en la técnica.
El vector puede estar, por ejemplo, en forma de un plásmido, una partícula viral, o un fago. Otros vectores incluyen secuencias de ADN cromosómico, no cromosómico y sintético, derivados de SV40; plásmidos bacterianos, ADN de fagos, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fagos, ADN viral tal como vaccinia, adenovirus, virus de la viruela aviar y pseudorrabia. Una variedad de vectores de clonación y expresión para su uso con anfitriones procarióticos y eucarióticos son descritos por Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2a Ed., Cold Spring Harbor, N.Y., (1989).
Células huésped y célula transformadas
La invención también proporciona células transformadas que comprenden una secuencia de ácido nucleico de la invención, por ejemplo, una secuencia que codifica una xilanasa de la invención, o un vector de la invención. La célula huésped puede ser cualquiera de las células huésped familiares para los expertos en la técnica, incluyendo células procarióticas, células eucarióticas, tales como células bacterianas, célula fúngicas, células de levadura, células de mamífero, células de insecto, y/o células vegetales. Las células bacterianas ilustrativas incluyen E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium y diversas especies dentro de los géneros Pseudomonas, Streptomyces, y Staphylococcus. Las células de insecto ilustrativas incluyen S2 de Drosophila y Sf9 de Spodoptera. Las células animales ilustrativas incluyen CHO, COS o melanoma de Bowes o cualquier línea celular de ratón o humana. La selección de un anfitrión apropiado se encuentra dentro de las capacidades de los expertos en la técnica. Las técnicas para la transformación de una amplia variedad de especies de plantas supriores son bien conocidas y se describen en la bibliografía técnica y científica. Véase, por ejemplo, Weising (1988) Ann. Rev. Genet. 22:421-477; patente de los Estados Unidos Núm. 5.750.870.
El vector se puede introducir en las células huésped utilizando cualquiera de una variedad de técnicas, incluyendo transformación, transfección, transducción, infección viral, pistolas génicas, o transferencia génica mediada por plásmidos Ti. Los métodos concretos incluyen transfección con fosfato de calcio, transfección mediada por DEAE- Dextrano, lipofección, o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).
En un aspecto, los ácidos nucleicos o vectores de la invención se introducen en las células para cribar, de ese modo, los ácidos nucleicos que entran en las células de una manera adecuada para la posterior expresión del ácido nucleico. El método de introducción está dictado en gran parte por el tipo de célula diana. Los métodos ilustrativos incluyen precipitación con CaPO4, fusión de liposomas, lipofección (por ejemplo, LIPOFECTIN™), electroporación, infección viral, etc. Los ácidos nucleicos candidato se pueden integrar establemente en el genoma de la célula huésped (por ejemplo, con introducción retroviral) o pueden existir transitoriamente o establemente en el citoplasma (es decir a través del uso de plásmidos tradicionales, utilizando secuencias reguladoras convencionales, marcadores de selección, etc.). Puesto que muchas detecciones selectivas farmacéuticamente importantes requieren dianas celulares humanas o de mamíferos modelo, vectores retrovirales capaces de transfectar tales dianas.
Cuando sea apropiado, las células huésped construidas se pueden cultivar en medios nutrientes convencionales según sea apropiado para activar los promotores, seleccionar los transformantes o amplificar los genes de la invención. Después de la transformación de una cepa huésped adecuada y el crecimiento de la cepa huésped hasta una densidad celular apropiada, se puede introducir el promotor seleccionado mediante métodos apropiados (por ejemplo, desplazamiento de temperatura o inducción química) y las células se pueden cultivar durante un período adicional para permitirlas producir el polipéptido deseado o fragmento del mismo.
Las células se pueden cosechar mediante centrifugación, romper mediante métodos físicos o químicos, y el extracto bruto resultante conservar para su purificación adicional. Las células microbianas empleadas para la expresión de las proteínas se pueden romper mediante cualquier método conveniente, incluyendo ciclos de congelación- descongelación, sonicación, rotura mecánica, o uso de agentes de lisis celular. Tales métodos son bien conocidos por los expertos en la técnica. El polipéptido expresado o fragmentos del mismo se pueden recuperar y purificar a partir de cultivos celulares recombinantes mediante métodos que incluyen precipitación con sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía sobre fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía en hidroxilapatita y cromatografía en lectinas. Se pueden utilizar etapas de replegamiento de proteínas, según sea necesario, al completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alta resolución (HPLC) para las etapas de purificación finales.
Las construcciones en las células huésped se pueden utilizar de una manera convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del anfitrión empleado en un procedimiento de producción recombinante, los polipéptidos producidos por las células huésped que contienen el vector pueden estar glicosilados o pueden estar no glicosilados. Los polipéptidos de la invención pueden también incluir o no incluir un residuo de aminoácido de metionina inicial.
5
10
15
20
25
30
35
40
45
50
55
60
65
También se pueden emplear sistemas de traducción sin células para producir un polipéptido de la invención. Los sistemas de traducción sin células pueden utilizar ARNm transcritos a partir de una construcción de ADN que comprende un promotor conectado operablemente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunos aspectos, la construcción de ADN se puede linealizar antes de llevar a cabo una reacción de transcripción in vitro. El ARNm transcrito se incuba a continuación con un extracto de traducción sin células apropiado, tal como un extracto de reticulocito de conejo, para producir el polipéptido deseado o un fragmento del mismo.
Los vectores de expresión pueden contener uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para la selección de células huésped transformadas tal como dihidrofolato reductasa o resistencia a la neomicina para un cultivo celular eucariótico, o tal como resistencia a tetraciclina o ampicilina en E. coli.
Las células huésped que contienen los polinucleótidos de interés, por ejemplo, los ácidos nucleicos de la invención, se pueden cultivar en medios nutrientes convencionales modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar genes. Las condiciones de cultivo, tales como temperatura, pH y similares, son las que se han utilizado previamente con la célula huésped seleccionada para la expresión y resultarán evidentes para los expertos normales en la técnica. Los clones que se identifica que tienen la actividad enzimática especificada se pueden secuenciar a continuación para identificar la secuencia de polinucleótidos que codifica una enzima que tiene la actividad intensificada.
Un método para expresar en exceso una xilanasa recombinante en una célula comprende expresar un vector que comprende un ácido nucleico o, un ácido nucleico que hibrida en condiciones restrictivas con una secuencia de ácido nucleico de la invención o una subsecuencia de la misma. La expresión en exceso se puede efectuar por medio de cualquier método, por ejemplo, uso de un promotor con alta actividad, un vector dicistrónico o mediante amplificación génica del vector.
Los ácidos nucleicos de la invención se pueden expresar, o expresar en exceso, en cualquier sistema de expresión in vitro o in vivo. Se puede emplear cualquier sistema de cultivo celular para expresar, o expresar en exceso, proteína recombinante, incluyendo cultivos bacterianos, de insecto, de levadura, fúngicos o de mamíferos. La expresión en exceso se puede efectuar por medio de la elección apropiada de promotores, intensificadores, vectores (por ejemplo, uso de vectores de replicón, vectores dicistrónicos (véase, por ejemplo, Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8), medios, sistemas de cultivo y similares. En un aspecto, la amplificación de genes utilizando marcadores de selección, por ejemplo, glutamina sintetasa (véase, por ejemplo, Sanders (1987) Dev. Biol. Stand. 66:55-63), en sistemas celulares se utiliza para expresar en exceso los polipéptidos de la invención.
Los detalles adicionales concernientes a este enfoque se encuentran en la bibliografía pública y/o son conocidos por los expertos en la técnica. En una ilustración no limitante concreta, tal bibliografía disponible al público incluye el documento EP 0659215 (W0 9403612 A1) (Nevalainen et al.); Lapidot, A., Mechaly, A., Shoham, Y., "Overexpression and single-step purification of a thermostable xilanase from Bacillus stearotermophilus T-6", J. Biotechnol. Nov 51:259-64 (1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., "Xylanase from the extremely termophilic bacterium Caldocellum saccharolyticum: overexpression of the gen in Escherichia coli y characterization of the gen product", Appl. Environ. Microbiol. Sep 56:2677-83 (1990); y Sung, W.L., Luk, C.K., Zahab, D.M., Wakarchuk, W., "Overexpression of the Bacillus subtilis and circulans xylanases in Escherichia coli", Protein Expr. Purif. Jun 4:200-6 (1993), aunque estas referencias no ilustran las enzimas de la invención de la presente solicitud.
La célula huésped puede ser cualquiera de las células huésped familiares para los expertos en la técnica, incluyendo células procarióticas, células eucarióticas, células de mamífero, células de insecto, o células vegetales. Como ejemplos representativos de los anfitriones apropiados, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium y diversas especies de los géneros Pseudomonas, Streptomyces y Staphylococcus, célula fúngicas, tales como levadura, células de insecto tales como S2 de Drosophila y Sf9 de Spodoptera, células animales tales como CHO, COS o melanoma de Bowes y adenovirus. La selección de un anfitrión apropiado se encuentra dentro de las capacidades de los expertos en la técnica.
El vector se puede introducir en las células huésped utilizando cualquiera de una variedad de técnicas, incluyendo transformación, transfección, transducción, infección viral, pistolas génicas, o transferencia génica mediada por plásmidos Ti. Los métodos concretos incluyen transfección con fosfato de calcio, transfección mediada por DEAE- Dextrano, lipofección, o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).
Cuando sea apropiado, las células huésped diseñadas se pueden cultivar en medios nutrientes convencionales según sea apropiado para activar los promotores, seleccionar los transformantes o amplificar los genes de la invención. Después de la transformación de una cepa huésped adecuada y el crecimiento de la cepa huésped hasta una densidad celular apropiada, se puede introducir el promotor seleccionado mediante métodos apropiados (por ejemplo, desplazamiento de temperatura o inducción química) y las células se pueden cultivar durante un período adicional para permitirlas producir el polipéptido deseado o fragmento del mismo.
5
10
15
20
25
30
35
40
45
50
55
60
65
Las células se pueden cosechar mediante centrifugación, romper mediante métodos físicos o químicos, y el extracto bruto resultante conservar para su purificación adicional. Las células microbianas empleadas para la expresión de las proteínas se pueden romper mediante cualquier método conveniente, incluyendo ciclos de congelación- descongelación, sonicación, rotura mecánica, o uso de agentes de lisis celular. Tales métodos son bien conocidos por los expertos en la técnica. El polipéptido expresado o fragmentos del mismo se pueden recuperar y purificar a partir de cultivos celulares recombinantes mediante métodos que incluyen precipitación con sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía sobre fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía en hidroxilapatita y cromatografía en lectinas. Se pueden utilizar etapas de replegamiento de proteínas, según sea necesario, al completar la configuración del polipéptido. Si se desea, se puede emplear cromatografía líquida de alta resolución (HPLc) para las etapas de purificación finales.
También se pueden emplear diversos sistemas de cultivo de células de mamífero para expresar proteínas recombinantes. Los ejemplos de los sistemas de expresión de mamíferos incluyen las líneas COS-7 fibroblastos de riñón de mono (descritas por Gluzman, Cell, 23:175, 1981) y otras líneas celulares capaces de expresar proteínas a partir de un vector compatible, tales como las líneas celulares C127, 3T3, CHO, HeLa y BHK.
Las construcciones en las células huésped se pueden utilizar de una manera convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del anfitrión empleado en un procedimiento de producción recombinante, los polipéptidos producidos por las células huésped que contienen el vector pueden estar glicosilados o pueden estar no glicosilados. Los polipéptidos de la invención pueden también incluir o no incluir un residuo de aminoácido de metionina inicial.
Como alternativa, los polipéptidos de las secuencias de aminoácidos de la invención o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden producir sintéticamente por medio de sintetizadores peptídicos convencionales. Se pueden emplear fragmentos o porciones de los polipéptidos para producir el polipéptido completo correspondiente mediante síntesis peptídica; por lo tanto, los fragmentos se pueden emplear como intermedios para la producción de polipéptidos completos.
También se pueden emplear sistemas de traducción sin células para producir uno de los polipéptidos de las secuencias de aminoácidos de la invención o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos utilizando los ARNm transcritos a partir de una construcción de ADN que comprende un promotor conectado operablemente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. La construcción de ADN se puede linealizar antes de llevar a cabo una reacción de transcripción in vitro. El ARNm transcrito se incuba a continuación con un extracto de traducción sin células apropiado, tal como un extracto de reticulocito de conejo, para producir el polipéptido deseado o un fragmento del mismo.
Amplificación de Ácidos Nucleicos
Al poner en practica la invención, los ácidos nucleicos de la invención y los ácidos nucleicos que codifican las xilanasas de la invención, o los ácidos nucleicos modificados de la invención, se pueden reproducir mediante amplificación. La amplificación también se puede usar para clonar o modificar los ácidos nucleicos de la invención. Un experto en la técnica puede diseñar pares de secuencias cebadoras de amplificación para cualquier parte de o para toda la longitud de estas secuencias.
Un ácido nucleico se puede amplificar con un par de cebadores como se muestra mediante aproximadamente los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de un ácido nucleico de la invención, y aproximadamente los primeros (los 5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de la hebra complementaria.
Uno o cada miembro de un par de secuencias cebadoras de amplificación pueden comprender un oligonucleótido que comprende al menos aproximadamente 10 a 50 bases consecutivas de la secuencia, o aproximadamente 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, o 25 bases consecutivas de la secuencia. Los pares de cebadores de amplificación pueden comprender un primer miembro que tiene una secuencia como la mostrada mediante aproximadamente los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de un ácido nucleico de la invención, y a segundo miembro que tiene una secuencia como la mostrada mediante aproximadamente los primeros (los 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, o 25 residuos de la hebra complementaria del primer miembro.
Las reacciones de amplificación se pueden utilizar también para cuantificar la cantidad de ácido nucleico en una muestra (tal como la cantidad de mensaje en una muestra celular), marcar el ácido nucleico (por ejemplo, aplicarlo a una matriz o una transferencia), detectar el ácido nucleico, o cuantificar la cantidad de un ácido nucleico específico en una muestra. El mensaje aislado de una célula o una biblioteca de ADNc se puede amplificar.
El experto en la técnica puede seleccionar y diseñar cebadores de amplificación oligonucleotídicos adecuados. Los
5
10
15
20
25
30
35
40
45
50
55
60
65
métodos de amplificación son también bien conocidos en la técnica, e incluyen, por ejemplo, reacción en cadena de la polimerasa, PCR (véase, por ejemplo, PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990) y PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., reacción en cadena de la ligasa (LCR) (véase, por ejemplo, Wu (1989) Genomics 4:560; Landegren (1988) Science 241:1077; Barringer (1990) Gene 89:117); amplificación basada en la transcripción (véase, por ejemplo, Kwoh (1989) Proc. Natl. Acad. Sci. USA 86:1173); y, replicación de secuencias autosostenida (véase, por ejemplo, Guatelli (1990) Proc. Natl. Acad. Sci. USA 87:1874); amplificación de la replicasa Q Beta (véase, por ejemplo, Smith (1997) J. Clin. Microbiol. 35:1477-1491), análisis de amplificación de la replicasa Q Beta automático (véase, por ejemplo, Burg (1996) Mol. Cell. Probes 10:257-271) y otras técnicas mediadas por ARN polimerasa (por ejemplo, NASBA, Cangene, Mississauga, Ontario); véase también Berger (1987) Methods Enzymol. 152:307-316; Sambrook; Ausubel; Patentes de los Estados Unidos Núms. 4.683.195 y 4.683.202; Sooknanan (1995) Biotechnology 13:563-564.
Determinación del grado de identidad de secuencia
En el presente documento se divulgan ácidos nucleicos que comprenden las secuencias que tienen al menos aproximadamente 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %,
65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %,
83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o más, o completa (100 %) de identidad de secuencia con un ácido nucleico de ejemplo de la invención (como se ha definido anteriormente) sobre una región de al menos 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 o más residuos. También se divulgan polipéptidos que comprenden secuencias que tienen al menos aproximadamente 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %,
68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %,
86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, o más, o completa (100 %) de identidad de secuencia con un polipéptido de ejemplo de la invención. El grado de identidad de secuencia (homología) se puede determinar utilizando cualquier programa informático y parámetros asociados, incluyendo los descritos del presente documento, tales como BLASt 2.2.2. o FASTA versión 3.0t78, con los parámetros por defecto.
Según se utiliza en el presente documento, los términos "ordenador", "programa informático" y "procesador" se utilizan en sus contextos generales más amplios e incorporan todos estos dispositivos, como se describe detalladamente a continuación. Una "secuencia codificante de" o una "secuencia que codifica" un polipéptido o proteína concretos, es una secuencia de ácido nucleico que es transcrita y traducida a un polipéptido o proteína cuando se coloca bajo el control de secuencias reguladoras apropiadas.
La frase "sustancialmente idéntico" en el contexto de dos ácidos nucleicos o polipéptidos, hace referencia a dos o más secuencias que tienen, por ejemplo, al menos aproximadamente 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %,
57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %,
75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %,
93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, o más identidad de nucleótidos o residuos de aminoácidos (secuencia),
cuando se comparan y alinean para una correspondencia máxima, según se mide utilizando uno de los algoritmo de comparación de secuencias conocidos o mediante inspección visual. Típicamente, existe identidad sustancial a lo largo de una región de al menos aproximadamente 100 residuos y muy comúnmente las secuencias son sustancialmente idénticas a lo largo de al menos aproximadamente 150-200 residuos. Las secuencias son sustancialmente idénticas a lo largo de la longitud completa de las regiones codificantes.
Adicionalmente una secuencia de aminoácidos "sustancialmente idéntica" es una secuencia que difiere de una secuencia de referencia en una o más sustituciones, deleciones, o inserciones de aminoácidos conservadoras o no conservadoras, particularmente cuando tal sustitución se produce en un sitio que no es el sitio activo de la molécula y siempre que el polipéptido conserve esencialmente sus propiedades funcionales. Una sustitución de aminoácido conservadora, por ejemplo, sustituye un aminoácido por otro de la misma clase (por ejemplo, sustitución de un aminoácido hidrófobo, tal como isoleucina, valina, leucina, o metionina, por otro, o sustitución de un aminoácido polar por otro, tal como la sustitución de arginina por lisina, ácido glutámico por ácido aspártico o glutamina por asparragina). Se pueden suprimir uno o más aminoácidos, por ejemplo, de un polipéptido de xilanasa, dando como resultado la modificación de la estructura del polipéptido, sin alterar significativamente su actividad biológica. Por ejemplo, los aminoácidos amino- o carboxilo terminales que no son requeridos para la actividad biológica de la xilanasa se pueden eliminar. Las secuencias de polipéptidos modificadas de la invención se pueden someter a ensayo para determinar la actividad biológica de la xilanasa mediante cualquier número de métodos, incluyendo poner en contacto la secuencia de polipéptidos modificada con un sustrato de xilanasa y determinar si el polipéptido modificado disminuye la cantidad de sustrato específico en el análisis o aumenta los bioproductos de la reacción enzimática de un polipéptido de xilanasa funcional con el sustrato.
Las secuencias de ácido nucleico de la divulgación pueden comprender al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 nucleótidos consecutivos de una secuencia de la invención ilustrativa y secuencias sustancialmente idénticas a estas. Las secuencias de ácido nucleico de la divulgación pueden comprender
5
10
15
20
25
30
35
40
45
50
55
60
65
secuencias homólogas y fragmentos de las secuencias de ácido nucleico y secuencias sustancialmente idénticas a estas, hacen referencia a una secuencia que tiene al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %,
58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %,
76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %,
94 %, 95 %, 96 %, 97 %, 98 %, 99 %, o más de identidad de secuencia (homología) con estas secuencias. La
homología se puede determinar utilizando cualquiera de los programas informáticos y los parámetros descritos del presente documento, incluyendo FASTA versión 3.0t78 con los parámetros por defecto. Las secuencias homólogas también incluyen secuencias de ARN en las que las uridinas remplazan a las timinas en las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico de la invención. Las secuencias homólogas se pueden obtener utilizando cualquiera de los procedimientos descritos en el presente documento o pueden resultar de la corrección de un error de secuenciación. Se apreciará que las secuencias de ácido nucleico como se muestra en las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, se pueden representar en el formato de un solo carácter tradicional (Véase la contraportada de Stryer, Lubert. Biochemistry, 3a Ed., W. H Freeman & Co., New York.) o en cualquier otro formato que registre la identidad de los nucleótidos en una secuencia.
Se contemplan particularmente para su uso diversos programas de comparación de secuencias identificados en otra parte en esta solicitud de patente. Las homologías de las secuencias de proteínas y/o ácidos nucleicos se pueden evaluar utilizando cualquiera de la variedad de algoritmos de comparación de secuencias y programas conocidos en la técnica. Tales algoritmos y programas incluyen, pero no están limitados de ningún modo a, TBLASTN, BLASTP, FASTA, TFASTA y CLUSTALW (Pearson y Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Thompson et al., Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins et al., Methods Enzymol. 266:383-402, 1996; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Altschul et al., Nature Genetics 3:266-272, 1993).
La homología o la identidad se miden con frecuencia utilizando programas de análisis de secuencias (por ejemplo, Sequence Analysis Software Package de the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Tales programas emparejan secuencias similares mediante la asignación de grados de homología a diversas deleciones, sustituciones u otras modificaciones. Los términos "homología" e "identidad" en el contexto de dos o más ácidos nucleicos o secuencias de polipéptidos, hacen referencia a dos o más secuencias o subsecuencias que son la misma o tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son los mismos cuando se comparan y alinean para una correspondencia máxima a lo largo de una ventana de comparación o región designada según se mide utilizando cualquier número de algoritmos de comparación de secuencias o mediante alineamiento manual e inspección visual.
Para la comparación de secuencias, típicamente una secuencia actúa como una secuencia de referencia, con la que se comparan las secuencias de ensayo. Cuando se utiliza un algoritmo de comparación de secuencias, las secuencias de ensayo y de referencia se introducen en un ordenador, se diseñan las coordenadas de la subsecuencia, si fuera necesario y se diseñan los parámetros del programa de algoritmo de secuencia. Se pueden utilizar parámetros del programa por defecto, o se pueden diseñar parámetros alternativos. El algoritmo de comparación de secuencia calcula a continuación el porcentaje de identidades de secuencia para las secuencias de ensayo con respecto a la secuencia de referencia, basándose en los parámetros del programa.
Una "ventana de comparación", según se utiliza del presente documento, incluye la referencia a un segmento de una cualquiera de las varias posiciones contiguas seleccionadas del grupo que consiste en 20 a 600, usualmente aproximadamente 50 a aproximadamente 200, más usualmente aproximadamente 100 a aproximadamente 150 en las que una secuencia se puede comparar con una secuencia de referencia del mismo número de posiciones contiguas después de haber alineado óptimamente las dos secuencias. Los métodos para el alineamiento de secuencias para su comparación son bien conocidos en la técnica. El alineamiento óptimo de secuencias para su comparación se puede llevar a cabo, por ejemplo, por medio del algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, mediante el algoritmo de alineamiento de homología de Needleman & Wunsch, J. Mol. Biol 48:443, 1970, por medio de la búsqueda para el método de similitud de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444, 1988, por medio de implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en The Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), o por medio de alineamiento manual e inspección visual. Otros algoritmos para determinar la homología o identidad incluyen, por ejemplo, además del programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information "Herramienta de Búsqueda de Alineamiento Local Básico"), ALIGN, AMAS (Analysis of Multiply Aligned Sequences "Análisis de Secuencias Alineadas Multiplicadas"), AMSP (Protein Multiple Sequence Alignment "Alineamiento Múltiple de Secuencias de Proteínas"), ASSET (Aligned Segment Statistical Evaluation Tool "Herramienta de Evaluación Estadística de Segmentos Alineados"), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node "Nodo de Análisis Comparativo de Secuencias Biológicas"), BLIMSP (BLocks IMProved Searcher "Búsqueda de Similitud Contra una Base de Datos de Bloques"), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo Las Vegas, FNAT (Forced Nucleotide Alignment Tool "Herramienta de Alineamiento de Nucleótidos Forzada"), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package "Paquete de Análisis de Secuencia de Fristensky"), GAP (Global Alignment
5
10
15
20
25
30
35
40
45
50
55
60
65
Program "Programa de Alineamiento Global), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison "Comparación de Secuencias Sensibles"), LALIGN (Local Sequence Alignment "Alineamiento de Secuencia Local"), LCP (Local Content Program "Programa de Contenido Local"), MACAW (Multiple Alignment Construction & Analysis Workbench "Construcción de Alineamiento Múltiple y Análisis Workbench"), MAP (Multiple Alignment Program "Programa de Alineamiento Múltiple"), MBLKP, MBLKN, PIMA (Pattern-Induced Multi-secuencia Alignment "Alineamiento Multisecuencia de Patrón Inducido"), SAGA (Sequence Alignment by Genetic Algorithm "Alineamiento de Secuencia mediante Algoritmo Genético") y WHAT-IF. Tales programas de alineamiento se pueden utilizar también para cribar bases de datos genómicas para identificar secuencias de polinucleótidos que tienen secuencias sustancialmente idénticas. Están disponibles varias bases de datos genómicas, por ejemplo, una porción sustancial del genoma humano está disponibles como parte del Proyecto de Secuenciación del Genoma Humano "Human Genome Sequencing Project. Ya se han secuenciado al menos veintiún genomas distintos, incluyendo, por ejemplo, M genitalium (Fraser et al., 1995), M. jannaschii (Bult et al., 1996), H. influenzae (Fleischmann et al., 1995), E. coli (Blattner et al., 1997) y levadura (S. cerevisiae) (Mewes et al., 1997) y D. melanogaster (Adams et al., 2000). También se han realizado progresos significativos en la secuenciación de genomas de organismos modelo, tales como ratón, C. elegans y Arabadopsis sp. Diversas bases de datos que contienen información genómica anotada con cierta información funcional son mantenidas por diferentes organizaciones y son accesibles a través de Internet.
Un ejemplo de un algoritmo útil son los algoritmos BLAST y BLAST 2.0, que son descritos por Altschul et al., en Nuc. Acids Res. 25:3389-3402, 1977 y Altschul et al., J. Mol. Biol. 215:403-410, 1990, respectivamente. Los programas para realizar los análisis BLAST están disponibles al público a través del National Center for Biotechnology Información. Este algoritmo implica identificar en primer lugar pares de secuencia de alta puntuación (HSP) identificando palabras cortas de longitud W en la secuencia problema, que coinciden o satisfacen cierta puntuación T umbral con valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de la base de datos. T es referido como el umbral de puntuación de la palabra vecina (Altschul et al., supra). Estas coincidencias con la palabra vecina inicial actúan como semillas para iniciar búsquedas para encontrar HSP más largos que las contienen. Las coincidencias con las palabras se prolongan en ambas direcciones a lo largo de cada secuencia tanto como aumente la puntuación de alineamiento cumulativa. Las puntuaciones cumulativas se calculan utilizando, para las secuencias de nucleótidos, los parámetros M (la puntuación de recompensa para un par de residuos emparejados; siempre >0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación cumulativa. La prolongación de las coincidencias con las palabras en cada dirección se detiene cuando: la puntuación de alineamiento cumulativa disminuye en la cantidad X de su valor máximo alcanzado; la puntuación cumulativa tiende a cero o menos, debido a la acumulación de uno o más alineamientos de residuos de puntuación negativa; o se alcanza el final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y la velocidad del alineamiento. El programa BLASTN (para secuencias de nucleótidos) utiliza como parámetros por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M=5, N=-4 y una comparación de ambas hebras. Para las secuencias de aminoácidos, el programa BLASTP utiliza como parámetros por defecto una longitud de palabra de 3 y expectativas (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989) alineamientos (B) de 50, expectativa (E) de 10, M=5, N= -4 y una comparación de ambas hebras.
El algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993). Una medida de similitud proporcionada por el algoritmo BLAST es la probabilidad de la suma mínima (P(N)), que proporciona una indicación de la probabilidad por la cual ocurriría por casualidad un emparejamiento entre dos secuencias de nucleótidos o de aminoácidos. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de la suma mínima en una comparación del ácido nucleico de ensayo con respecto al ácido nucleico de referencia es menor de aproximadamente 0,2, más preferentemente menor de aproximadamente 0,01 y muy preferentemente menor de aproximadamente 0,001.
Se pueden evaluar las homologías de las secuencias de proteínas y de ácidos nucleicos utilizando la Herramienta de Búsqueda de Alineamiento Local Básico ("BLAST"). En particular, se utilizan cinco programas BLAST específicos para realizar la siguiente tarea:
(1) BLASTP y BLAST3 comparan una secuencia problema de aminoácidos frente a una base de datos de secuencias de proteínas;
(2) BLASTN compara una secuencia problema de nucleótidos frente a una base de datos de secuencias de nucleótidos;
(3) BLASTX compara los productos de traducción conceptual de seis marcos de una secuencia de nucleótidos problema (ambas hebras) frente a una base de datos de secuencias de proteínas;
(4) TBLASTN compara una secuencia problema de proteínas frente a una base de datos de secuencias de nucleótidos traducidas en los seis marcos de lectura (ambas hebras); y
(5) TBLASTX compara las traducciones de seis marcos de una secuencia problema de nucleótidos frente a las traducciones de seis marcos de una base de datos de secuencias de nucleótidos.
Los programas BLAST identifican secuencias homólogas identificando segmentos similares, que son referidos en el presente documento como "pares de segmentos de alta puntuación", entre una secuencia de aminoácidos o de
5
10
15
20
25
30
35
40
45
50
55
60
65
ácido nucleico y una secuencia de ensayo que se obtiene preferentemente a partir de una base de datos de secuencias de proteínas o de ácido nucleico. Los pares de segmentos de alta puntuación se identifican preferentemente (es decir, se alinean) por medio de una matriz de puntuación, muchas de las cuales son conocidas en la técnica. Preferentemente, la matriz de puntuación utilizada es la matriz BLOSUM62 (Gonnet et al., Science 256:1443-1445, 1992; Henikoff y Henikoff, Proteins 17:49-61, 1993). Menos preferentemente, también se pueden utilizar las matrices PAM o PAM250 (véase, por ejemplo, Schwartz y Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Los programas BLAST son accesibles a través de la U.S. National Library of Medicine.
Los parámetros utilizados con los algoritmos anteriores se pueden adaptar dependiendo de la longitud de la secuencia y el grado de homología estudiado. Los parámetros pueden ser los parámetros por defecto utilizados por los algoritmos en ausencia de instrucciones para el usuario.
Sistemas informáticos y productos de programas informáticos
Para determinar e identificar identidades de secuencia, homologías estructurales, motivos y similares vía simulación computacional, una secuencia de ácido nucleico o polipéptido de la invención se puede almacenar, registrar, y manipular sobre cualquier medio que pueda ser leído y al que se pueda acceder mediante un ordenador.
Según se utiliza en el presente documento, las palabras "registrado" y "almacenado" hacen referencia a un procedimiento para almacenar información en un medio informático. Un experto en la técnica pueda adoptar fácilmente cualquier método conocido para registrar información en un medio legible por ordenador para generar construcciones que comprenden una o más de las secuencias ácido nucleico y/o de polipéptidos de la invención.
Los polipéptidos de la divulgación incluyen las secuencias de ejemplo de la invención, y secuencias sustancialmente idénticas a las mismas, y fragmentos de cualquiera de las secuencias precedentes. Las secuencias de polipéptidos sustancialmente idénticas, u homologas, hacen referencia a una secuencia de polipéptidos que tiene al menos 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %,
69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %,
87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, o más, o completa (100 %) de
identidad de secuencia con una secuencia de ejemplo de la invención, por ejemplo, una secuencia de polipéptidos
de la invención.
La homología se puede determinar utilizando cualquiera de los programas informáticos y los parámetros descritos del presente documento, incluyendo FASTA versión 3.0t78 con los parámetros por defecto o con parámetros modificados cualesquiera. Las secuencias homólogas se pueden obtener utilizando cualquiera de los procedimientos descritos en el presente documento o pueden resultar de la corrección de un error de secuenciación. Los fragmentos polipeptídicos comprenden al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500 o más aminoácidos consecutivos de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas. Se apreciará que los códigos del polipéptido de las secuencias de aminoácidos de la invención y secuencias sustancialmente idénticas a estas, se pueden representar en el formato de un solo carácter o en el formato de tres letras tradicional (Véase la contraportada de Stryer, Lubert. Biochemistry, 3a Ed., citado anteriormente) o en cualquier otro formato que refiera la identidad de los polipéptidos en una secuencia.
Una secuencia de ácido nucleico o polipéptido de la invención se puede almacenar, registrar, y manipular sobre cualquier medio que pueda ser leído y al que se pueda acceder mediante un ordenador.
Los medios legibles por ordenador incluyen medios legibles magnéticamente, medios legibles ópticamente, medios legibles electrónicamente y medios magnéticos/ópticos. Por ejemplo, los medios legibles por ordenador pueden ser un disco duro, un disco flexible, una cinta magnética, un CD-ROM, un Disco Versátil Digital (DVD por "Digital Versatile Disk"), una Memoria de Acceso Aleatorio (RAM por "Random Access Memory"), o una Memoria de Solo Lectura Read Only Memory (ROM por " Read Only Memory") así como otros tipos de otros medios conocidos por los expertos en la técnica.
Los sistemas informáticos almacenan y manipulan la información de la secuencia descrita en el presente documento. Un ejemplo de un sistema informático 100 se ilustra en forma de diagrama de bloques en la Figura 1. Según se utiliza en el presente documento, "un sistema informático" hace referencia a los componentes del equipo físico, los componentes de soporte lógico y los componentes de almacenamiento de datos utilizados para analizar una secuencia de nucleótidos de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos de la invención. El sistema informático 100 incluye típicamente un procesador para procesar, acceder y manipular los datos de secuencia. El procesador 105 puede ser cualquier unidad centras de proceso, tal como, por ejemplo, Pentium III de Intel Corporación, o un procesador similar de Sun, Motorola, Compaq, AMD o International Business Machines.
Típicamente el sistema informático 100 es un sistema de finalidad general que comprende el procesador 105 y uno o
5
10
15
20
25
30
35
40
45
50
55
60
65
más componentes de almacenamiento de datos interno 110 para el almacenamiento de datos y uno o más dispositivos de recuperación de datos para recuperar los datos almacenados en los componentes de almacenamiento de datos. Un experto en la técnica apreciará fácilmente que son adecuados cualquiera de los sistemas informáticos disponibles en la actualidad.
El sistema informático 100 puede incluir un procesador 105 conectado a un bus que está conectado a una memoria principal 115 (preferentemente implementada como RAM) y uno o más dispositivos de almacenamiento de datos internos 110, tal como un disco duro y/u otros medios legibles por ordenador que tienen datos registrados en el mismo. El sistema informático 100 puede incluir adicionalmente uno o más dispositivos de recuperación de datos 118 para leer los datos almacenados en los dispositivos de almacenamiento de datos internos 110.
El dispositivo de recuperación de datos 118 puede representar, por ejemplo, una unidad para disco flexible, una unidad para disco compacto, una unidad para cinta magnética, o un módem susceptible de conexión a un sistema de almacenamiento de datos remoto (por ejemplo, vía Internet) etc. El dispositivo de almacenamiento de datos interno 110 puede ser un medio legible por ordenador extraíble tal como un disco flexible, un disco compacto, una cinta magnética, etc. que contiene registrados lógica de control y/o datos. El sistema informático 100 puede incluir ventajosamente o ser programado por el soporte lógico apropiado para leer la lógica de control y/o los datos del componente de almacenamiento de datos una vez insertados en el dispositivo de recuperación de datos.
El sistema informático 100 incluye una pantalla 120 que se utiliza para la visualización por un usuario del ordenador. También se debe observar que el sistema informático 100 puede estar conectado a otros sistemas informáticos 125a-c en una red o red de área extendida para proporcionar acceso centralizado al sistema informático 100.
El soporte lógico para acceder a, y procesar, las secuencias de nucleótidos de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, (tales como las herramientas de búsqueda, las herramientas de comparación y las herramientas de modelado etc.) puede residir en la memoria principal 115 durante la ejecución.
El sistema informático 100 puede comprender adicionalmente un algoritmo de comparación de secuencia para comparar una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, almacenado en un medio legible por ordenador con una o varias secuencias de nucleótidos o polipéptidos de referencia almacenadas en un medio legible por ordenador. Un "algoritmo de comparación de secuencia" hace referencia a uno o más programas que son implementados (localmente o remotamente) en el sistema informático 100 para comparar una secuencia de nucleótidos con otras secuencias de nucleótidos y/o compuestos almacenados en los medios de almacenamiento de datos. Por ejemplo, el algoritmo de comparación de secuencia puede comparar las secuencias de nucleótidos de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, almacenada en un medio legible por ordenador con secuencias de referencia almacenadas en un medio legible por ordenador para identificar homologías o motivos estructurales.
La Figura 2 es un diagrama de flujo que ilustra un aspecto de un procedimiento 200 para comparar un nuevo nucleótido o secuencia de proteínas con una base de datos de secuencias con el fin de determinar los niveles de homología entre la nueva secuencia y las secuencias de la base de datos. La base de datos de secuencias puede ser una base de datos privada almacenada en el sistema informático 100, o una base de datos pública GENBANK que está disponible a través de Internet.
El procedimiento 200 comienza en un estado de inicio 201 y a continuación se mueve a un estado 202 donde la nueva secuencia que se va a comparar se almacena en una memoria en un sistema informático 100. Como se ha comentado anteriormente, la memoria podría ser cualquier tipo de memoria, incluyendo RAM o un dispositivo de almacenamiento interno.
El procedimiento 200 se mueve a continuación a un estado 204 donde una base de datos de secuencias se abre para el análisis y la comparación. El procedimiento 200 se mueve a continuación a un estado 206 donde la primera secuencia almacenada en la base de datos se lee en una memoria en el ordenador. A continuación se realiza una comparación en un estado 210 para determinar si la primera secuencia es la misma que la segunda secuencia. Es importante observar que esta etapa no está limitada a la realización de una comparación exacta entre la nueva secuencia y la primera secuencia en la base de datos. Los métodos bien conocidos son conocidos por los expertos en la técnica para comparar dos secuencias de nucleótidos o proteínas, incluso si no son idénticas. Por ejemplo, se pueden introducir espacios en una secuencia con el fin de aumentar el nivel de homología entre las dos secuencias sometidas a ensayo. Los parámetros que controlan si se introducen espacios u otras características en una secuencia durante la comparación son insertados normalmente por el usuario del sistema informático.
Una vez que se ha realizado una comparación de las dos secuencias en el estado 210, se realiza una determinación en un estado de decisión 210 si las dos secuencias son iguales. Por supuesto, el término "igual" no está limitado a secuencias que son absolutamente idénticas. Las secuencias que se encuentran dentro de los parámetros de
5
10
15
20
25
30
35
40
45
50
55
60
65
homología introducidos por el usuario se marcarán como "igual" en el procedimiento 200.
Si se realiza una determinación de que las dos secuencias son iguales, el procedimiento 200 se mueve a un estado 214 donde se presenta al usuario el nombre de la secuencia de la base de datos. Este estado notifica al usuario que la secuencia con el nombre presentado cumple las restricciones de homología que se habían introducido. Una vez que el nombre de la secuencia almacenada es presentado al usuario, el procedimiento 200 se mueve a un estado de decisión 218 donde se toma una determinación si existen más secuencias en la base de datos. Si no existen más secuencias en la base de datos, el procedimiento 200 termina en un estado final 220. Sin embargo, si existen más secuencias en la base de datos, el procedimiento 200 se mueve a un estado 224 donde se mueve un puntero hasta la siguiente secuencia en la base de datos de manera que ésta se puede comparar con la nueva secuencia. De esta manera, la nueva secuencia se alinea y compara con cada secuencia de la base de datos.
Se debe observar que si se ha tomado la determinación en el estado de decisión 212 de que las secuencias no eran homólogas, el procedimiento 200 se movería inmediatamente al estado de decisión 218 con el fin de determinar si estarían disponibles otras secuencias cualesquiera en la base de datos para su comparación.
Un sistema informático puede comprender un procesador, un dispositivo de almacenamiento de datos que tiene almacenada una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, un dispositivo de almacenamiento de datos que tiene almacenadas recuperablemente secuencias de nucleótidos o secuencias de polipéptidos de referencia que se van a comparar con una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos como se muestra en las secuencias de aminoácidos de la invención y secuencias sustancialmente idénticas a estas y una secuencia de comparación para llevar a cabo la comparación. La secuencia de comparación puede indicar un nivel de homología entre las secuencias comparadas o identificar motivos estructurales en el código de ácido nucleico descrito anteriormente de las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, o puede identificar motivos estructurales en las secuencias que son comparadas con estos códigos de ácidos nucleicos y códigos de polipéptidos. El dispositivo de almacenamiento de datos puede tener almacenadas las secuencias de al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o las secuencias de polipéptidos como se muestra en las secuencias de aminoácidos de la invención y secuencias sustancialmente idénticas a estas.
Un método para determinar el nivel de homología entre una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, y una secuencia de nucleótidos de referencia incluye leer el código de ácido nucleico o el código de polipéptido y la secuencia de nucleótidos o polipéptidos de referencia a través del uso de un programa informático que determina los niveles de homología y determinar la homología entre el código de ácido nucleico o el código del polipéptido y la secuencia de nucleótidos o polipéptidos de referencia con el programa informático. El programa informático puede ser cualquiera de varios programas informáticos para determinar niveles de homología, incluyendo los enumerados específicamente del presente documento, (por ejemplo, BLAST2N con los parámetros por defecto o con parámetros modificados cualesquiera). El método se puede implementar utilizando los sistemas informáticos descritos anteriormente. El método se puede realizar también leyendo al menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de la secuencias de ácido nucleico descritas anteriormente de la invención o las secuencias de polipéptidos de la invención a través del uso del programa informático y determinar homología entre el código de ácido nucleico o el código de polipéptidos y las secuencias de nucleótidos o las secuencias de polipéptidos de referencia.
La Figura 3 es un diagrama de flujo que ilustra un aspecto de un procedimiento 250 en un ordenador para determinar si dos secuencias son homólogas. El procedimiento 250 comienza en un estado de inicio 252 y se mueve a continuación a un estado 254 donde una primera secuencia que se va a comparar se almacena en una memoria. La segunda secuencia que se va a comparar se almacena a continuación en una memoria en un estado 256. El procedimiento 250 se mueve a continuación a un estado 260 donde el primer carácter en la primera secuencia se lee y a continuación a un estado 262 donde se lee el primer carácter de la segunda secuencia. Se debe entender que si la secuencia es una secuencia de nucleótidos, el carácter sería normalmente A, T, C, G o U. Si la secuencia es una secuencia de proteínas, ésta está preferentemente en el código de aminoácidos de una sola letra de manera que se pueden comprar fácilmente la primera y la segunda secuencias.
A continuación se realiza una determinación en un estado de decisión 264 si los dos caracteres son iguales. Si son iguales, el procedimiento 250 se mueve a un estado 268 donde se leen los siguientes caracteres en la primera y segunda secuencias. A continuación se realiza una determinación si los siguientes caracteres son iguales. Si lo son, el procedimiento 250 continúa este bucle hasta que dos caracteres no son iguales. Si se toma la determinación de que los dos caracteres siguientes no son iguales, el procedimiento 250 se mueve a un estado de decisión 274 para determinar si hay algún otro carácter que cualquier secuencia lea.
Si no hay ningún carácter más para leer, el procedimiento 250 se mueve a un estado 276 donde el nivel de
5
10
15
20
25
30
35
40
45
50
55
60
65
homología entre la primera y la segunda secuencias se presenta al usuario. El nivel de homología se determina calculando la proporción de caracteres entre las secuencias que fueron iguales del número total de secuencias en la primera secuencia. De este modo, si cada carácter en una primera secuencia de 100 nucleótido se alineó con cada carácter en una segunda secuencia, el nivel de homología sería 100 %.
Como alternativa, el programa informático puede ser un programa informático que compara las secuencias de nucleótidos de una secuencia de ácido nucleico como se muestra en la invención, con una o más secuencias de nucleótidos de referencia con el fin de determinar si el código de ácido nucleico de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, difiere de una secuencia de ácido nucleico de referencia en una o más posiciones. Tal programa registra la longitud e identidad de los nucleótidos insertados, suprimidos o sustituidos con respecto a una secuencia del polinucleótido de referencia o a una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas. El programa informático puede ser un programa que determina si una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, contiene un polimorfismo de un solo nucleótido (SNP) con respecto a una secuencia de nucleótidos de referencia.
Un método para determinar si una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, difiere en uno o más nucleótidos de una secuencia de nucleótidos de referencia comprende las etapas de leer el código de ácido nucleico y la secuencia de nucleótidos de referencia a través del uso de un programa informático que identifica diferencias entre secuencias de ácido nucleico e identificar diferencias entre el código de ácido nucleico y la secuencia de nucleótidos de referencia con el programa informático. El programa informático puede ser un programa que identifica polimorfismos de un solo nucleótido. El método se puede implementar mediante los sistemas informáticos descritos anteriormente y el método ilustrado en la Figura 3. El método se puede realizar también leyendo al menos 2, 5, 10, 15, 20, 25, 30, o 40 o más de las secuencias de ácido de la invención y secuencias sustancialmente idénticas a estas y las secuencias de nucleótidos de referencia a través del uso del programa informático e identificar diferencias entre el código de ácido nucleicos y las secuencias de nucleótidos de referencia con el programa informático.
El sistema informatizado puede comprender adicionalmente un identificador para identificar características dentro de una secuencia de ácido nucleico de la invención o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas.
Un "identificador" hace referencia a uno o más programas que identifica ciertas características dentro de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas. El identificador puede comprender un programa que identifica un marco de lectura abierto en una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas.
La Figura 4 es un diagrama de flujo que ilustra un aspecto de un procedimiento identificador 300 para detectar la presencia de una característica en una secuencia. El procedimiento 300 comienza en un estado de inicio 302 y se mueve a continuación a un estado 304 donde una primera secuencia que se va a verificar para determinar sus características se almacena en una memoria 115 en el sistema informático 100. El procedimiento 300 se mueve a continuación a un estado 306 donde se abre una base de datos de características de secuencia. Tal base de datos incluiría una lista de cada uno de los atributos de las características junto con el nombre de la característica. Por ejemplo, un nombre de característica podría ser "Codón de Inicio" y el atributo sería "ATG". Otro ejemplo sería el nombre de la característica "Caja TAATAA" y el atributo de la característica sería "TAATAA". Un ejemplo de tal base de datos es producido por el University of Wisconsin Genetics Computer Group. Como alternativa, las características pueden ser motivos polipeptídicos estructurales tales como hélices alfa, láminas beta, o motivos polipeptídicos funcionales tales como sitios activos enzimáticos, motivos hélice-giro-hélice u otros motivos conocidos por los expertos en la técnica.
Una vez que la base de datos de características se abre en el estado 306, el procedimiento 300 se mueve a un estado 308 donde la primera característica se lee a partir de la base de datos. A continuación se realiza una comparación del atributo de la primera característica con la primera secuencia en un estado 310. Después se realiza una determinación en un estado de decisión 316 si se encontró el atributo de la característica en la primera secuencia. Si se encontró el atributo, el procedimiento 300 se mueve a un estado 318 donde se presenta al usuario el nombre de la característica encontrada.
El procedimiento 300 se mueve a continuación a un estado de decisión 320 donde se realiza una determinación de si existen características de desplazamiento en la base de datos. Si no existen más características, el procedimiento 300 termina en un estado final 324. Sin embargo, si existen más características en la base de datos, el procedimiento 300 lee la siguiente característica de la secuencia en un estado 326 y vuelve al estado 310 donde el atributo de la siguiente característica se compara frente a la primera secuencia. Se debe observar que si no se encuentra el atributo de la característica en la primera secuencia en el estado de decisión 316, el procedimiento 300 se mueve directamente al estado de decisión 320 con el fin de determinar si existe cualquier otra característica en la base de datos.
5
10
15
20
25
30
35
40
45
50
55
60
65
Un método de identificación de una característica dentro de una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, comprende leer el código del ácido o los ácidos nucleicos o el código del polipéptido o los polipéptidos a través del uso de un programa informático que identifica características e identificar características en el código del ácido o los ácidos nucleicos con el programa informático. El programa informático comprende un programa informático que identifica marcos de lectura abiertos. El método se puede realizar leyendo una sola secuencia o al menos 2, 5, 10, 15, 20, 25, 30, o 40 de las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o las secuencias de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, a través del uso del programa informático e identificar características dentro del código de ácido nucleicos o el código de polipéptidos con el programa informático.
Una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, se puede almacenar y manipular en una variedad de programas de tratamiento de datos en una variedad de formatos. Por ejemplo, una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas, se pueden almacenar en forma de texto en un archivo de tratamiento de texto, tal como Microsoft WORD™ o WORDPERFECT™ o en forma de un archivo ASCII en una variedad de programas de base de datos familiares para los expertos en la técnica, tales como DB2™, SYBASE™, o ORACLE™. Además, muchos programas informáticos y bases de datos se pueden utilizar como algoritmo de comparación de secuencias, identificadores, o fuentes de secuencias de nucleótidos o secuencias de polipéptidos de referencia que se van a comparar con una secuencia de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o una secuencia de polipéptidos de la invención y secuencias sustancialmente idénticas a estas. Se pretende que la siguiente lista no limite la invención pero proporcione apoyo a los programas y bases de datos que son útiles con las secuencias de ácido nucleico de la invención y secuencias sustancialmente idénticas a estas, o las secuencias de polipéptidos de la invención y secuencias sustancialmente idénticas a estas.
Los programas y bases de datos que se pueden utilizar incluyen, pero no están limitados a: MacPattem (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST y BLAST2 (NCBI), BLASTN y BLASTX (Altschul et al, J. Mol. Biol. 215: 403, 1990), FASTA (Pearson y Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag et al. Comp. Apágs. Biosci. 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2. DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), la base de datos MDL Available Chemicals Directory, la base de datos MDL Drug Data Report, la base de datos Comprehensive Medicinal Chemistry, la base de datos Derwents's World Drug Index, la base de datos BioByteMasterFile, la base de datos Genbank y la base de datos Genseqn. Muchos otros programas y bases de datos resultarían evidentes para los expertos en la técnica dada la presente divulgación.
Los motivos que se pueden detectar utilizando los programas anteriores incluyen las secuencias que codifican cremalleras de leucina, motivos hélice-giro-hélice, sitios de glicosilación, sitios de ubiquitinación, hélices alfa y láminas beta, secuencias señal que codifican péptidos señal que dirigen la secreción de las proteínas codificadas, secuencias implicadas en la regulación de la transcripción tales como secuencias homeobox, tramos ácidos, sitios activos enzimáticos, sitios de unión al sustrato y sitios de escisión enzimática.
Hibridación de ácidos nucleicos
La divulgación proporciona ácidos nucleicos aislados, sintéticos o recombinantes que hibridan en condiciones restrictivas con una secuencia de ejemplo de la invención. Las condiciones restrictivas pueden ser condiciones altamente restrictivas, condiciones restrictivas intermedias y/o condiciones poco restrictivas, incluyendo las condiciones altamente restrictivas y poco restrictivas descritas en el presente documento.
Los ácidos nucleicos definidos por su capacidad para hibridar en condiciones restrictivas pueden estar entre aproximadamente cinco residuos y la longitud completa del ácido nucleico de la invención; por ejemplo, pueden tener al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, o más, residuos de longitud. También se incluyen los ácidos nucleicos más cortos que la longitud completa. Estos ácidos nucleicos pueden ser útiles, por ejemplo, como sondas de hibridación, sondas de marcaje, sondas oligonucleotídicas para PCR, ARNi (de hebra sencilla o doble), secuencias antisentido o secuencias que codifican péptidos de unión a anticuerpos (epítopos), motivos, sitios activos y similares.
Los ácidos nucleicos se pueden definir por su capacidad para hibridar en condiciones altamente restrictivas que comprenden condiciones en formamida de aproximadamente 50 % a aproximadamente 37 °C a 42 °C o por su
5
10
15
20
25
30
35
40
45
50
55
60
65
capacidad para hibridar en condiciones poco restrictivas que comprende condiciones en formamida de aproximadamente 35 % a 25 % a aproximadamente 30 °C a 35 °C.
Como alternativa, ácidos nucleicos se definen por su capacidad para hibridar en condiciones altamente restrictivas que comprende condiciones a 42 °C en formamida al 50 %, 5X SSPE, SDS al 0,3 %, y una secuencia repetitiva que bloquea el ácido nucleico, tal como cot-1 o ADN de esperma de salmón (por ejemplo, 200 n/ml ADN de esperma de salmón sometido a cizalladura y desnaturalizado). Los ácidos nucleicos de la invención se pueden definir por su capacidad para hibridar en condiciones poco restrictivas que comprenden formamida al 35 % a una temperatura reducida de 35 °C.
En las reacciones de hibridación de ácido nucleico, las condiciones utilizadas para lograr un nivel de rigor concreto variarán, dependiendo de la naturaleza de los ácidos nucleicos que estén hibridando. Por ejemplo, la longitud, el grado de complementariedad, la composición de la secuencia de nucleótidos (por ejemplo, contenido de GC vs. AT) y el tipo de ácido nucleico (por ejemplo, ARN vs. ADN) de las regiones hibridantes de los ácidos nucleicos se pueden considerar al seleccionar las condiciones de hibridación. Una consideración adicional es si uno de los ácidos nucleicos está inmovilizado, por ejemplo, sobre un filtro.
La hibridación se puede llevar a cabo en condiciones poco restrictivas, moderadamente restrictivas o altamente restrictivas. Como ejemplo de una hibridación de ácido nucleico, una membrana polimérica que contiene ácidos nucleicos desnaturalizados inmovilizados se prehibrida en primer lugar durante 30 minutos a 45 °C en una solución que consiste en NaCl 0,9 M, NaH2PO4 50 mM, pH 7,0, Na2EDTA 5,0 mM, SDS al 0,5%, 10X Denhardt y ácido polirriboadenílico de 0,5 mg/ml. Después se añaden a la solución aproximadamente 2X107 cpm (actividad específica 4-9 X108 cpm/ug) de sonda oligonucleotídica marcada en el extremo con P32. Al cabo de 12-16 horas de incubación, la membrana se lava durante 30 minutos a temperatura ambiente en 1X SET (NaCl 150 mM, Tris-hidrocloruro 20 mM, pH 7,8, Na2EDTA 1 mM) que contiene SDS al 0,5 %, seguido de un lavado de 30 minutos en 1X SET de nueva aportación a Tm-10°C para la sonda oligonucleotídica. La membrana se expone a continuación a una película autorradiográfica para la detección de las señales de hibridación.
Se podría considerar que todas las hibridaciones precedentes fueron en condiciones altamente restrictivas.
Después de la hibridación, se puede lavar un filtro para eliminar cualquier sonda detectable no unida específicamente. Las condiciones restrictivas utilizadas para lavar los filtros se pueden variar dependiendo de la naturaleza de los ácidos nucleicos que estén siendo hibridados, la longitud de los ácidos nucleicos que estén siendo hibridados, el grado de complementariedad, la composición de la secuencia de nucleótidos (por ejemplo, contenido de GC vs. AT) y el tipo de ácido nucleico (por ejemplo, ARN vs. DNA). Los ejemplos de los lavados con condiciones restrictivas progresivamente altas son los siguientes: 2X SSC, SDS al 0,1 % a temperatura ambiente durante 15 minutos (condiciones poco restrictivas); 0,1X SSC, SDS al 0,5% a temperatura ambiente durante 30 minutos a 1 hora (condiciones moderadamente restrictivas); 0,1X SSC, SDS al 0,5% durante 15 a 30 minutos entre la temperatura de hibridación y 68 °C (condiciones altamente restrictivas); y NaCl 0,15 M durante 15 minutos a 72 °C (condiciones muy restrictivas). Se puede llevar a cabo un lavado final en condiciones restrictivas en 0,1X SSC a temperatura ambiente. Los Ejemplos anteriores son meramente ilustrativos de un conjunto de condiciones que se pueden utilizar para lavar filtros. Un experto en la técnica conocerá que existen numerosas fórmulas para los lavados en diferentes condiciones restrictivas. Algunos otros Ejemplos se proporcionan a continuación.
Los ácidos nucleicos que han hibridado con la sonda se identifican mediante autorradiografía u otras técnicas convencionales.
El procedimiento anterior se puede modificar para identificar ácidos nucleicos que tienen niveles decrecientes de homología con la secuencia de la sonda. Por ejemplo, para obtener ácidos nucleicos de homología decreciente con la sonda detectable, se pueden utilizar condiciones menos restrictivas. Por ejemplo, la temperatura de hibridación puede disminuir en incrementos de 5 °C de 68 °C a 42 °C en un tampón de hibridación que tiene una concentración de Na+ de aproximadamente 1 M. Después de la hibridación, el filtro se puede lavar con 2X SSC, SDS al 0,5 % a la temperatura de hibridación. Se considera que estas condiciones son condiciones "moderadas" por encima de 50 °C y condiciones "bajas" por debajo de 50 °C. Un ejemplo específico de condiciones de hibridación "moderadas" se produce cuando la hibridación anterior se lleva a cabo a 55 °C. Un ejemplo específico de condiciones de hibridación "poco restrictivas" se produce cuando la hibridación anterior se lleva a cabo a 45 °C.
Como alternativa, la hibridación se puede llevar a cabo en tampones, tales como 6X SSC, que contienen formamida a una temperatura de 42°C. En este caso, la concentración de formamida en el tampón de hibridación se puede reducir en incrementos de 5 % de 50 % a 0 % para identificar los clones que tienen niveles decrecientes de homología con la sonda. Después de la hibridación, el filtro se puede lavar con 6X SSC, SDS al 0,5 % a 50 °C. Se considera que estas condiciones son condiciones "moderadas" por encima de formamida al 25 % y condiciones "bajas" por debajo de formamida al 25 %. Un ejemplo específico de condiciones de hibridación "moderadas" se produce cuando la hibridación anterior se lleva a cabo en formamida al 30 %. Un ejemplo específico de condiciones de hibridación "poco restrictivas" se produce cuando la hibridación anterior se lleva a cabo en formamida al 10 %.
5
10
15
20
25
30
35
40
45
50
55
60
65
Sin embargo, la selección de un formato de hibridación no es crítica - es el rigor de las condiciones de lavado el que establece las condiciones que determinan si un ácido nucleico es de interés. Las condiciones de lavado utilizadas para identificar los ácidos nucleicos dentro del alcance de la invención incluyen, por ejemplo: una concentración de sal de aproximadamente 0,02 molar a pH 7 y a una temperatura de al menos aproximadamente 50 °C o aproximadamente 55 °C a aproximadamente 60 °C; o, una concentración de sal de aproximadamente NaCl 0,15 M a 72°C durante aproximadamente 15 minutos; o, una concentración de sal de aproximadamente 0,2X SSC a una temperatura de al menos aproximadamente 50 °C o aproximadamente 55 °C a aproximadamente 60 °C durante aproximadamente 15 a aproximadamente 20 minutos; o, el complejo de hibridación se lava dos veces con una solución con una concentración de sal de aproximadamente 2X SSC que contiene SDS al 0,1 % a temperatura ambiente durante 15 minutos y a continuación se lava dos veces con 0,1X SSC que contiene SDS al 0,1 % at 68 °C durante 15 minutos; o, condiciones equivalentes. Véase Sambrook, Tijssen y Ausubel para una divulgación de un tampón SSC y condiciones equivalentes.
Los métodos precedentes se pueden utilizar para aislar ácidos nucleicos que tienen una secuencia con una homología de al menos aproximadamente 97 %, al menos 95 %, al menos 90 %, al menos 85 %, al menos 80 %, al menos 75 %, al menos 70 %, al menos 65 %, al menos 60 %, al menos 55 %, o al menos 50 % con una secuencia de ácido nucleico seleccionada del grupo que consiste en una de las secuencias de la invención y secuencias sustancialmente idénticas a estas, o fragmentos que comprenden al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de las mismas y las secuencias complementarias a estas. La homología se puede medir utilizando el algoritmo de alineamiento. Por ejemplo, los polinucleótidos homólogos pueden tener una secuencia codificante que es una variante alélica de origen natural de una de las secuencias codificantes descritas en el presente documento. Tales variantes alélicas pueden tener una sustitución, deleción o adición de uno o más nucleótidos cuando se comparan con los ácidos nucleicos de la invención o las secuencias complementarias a estas.
Adicionalmente, los procedimientos anteriores se pueden utilizar para aislar ácidos nucleicos que codifican polipéptidos que tienen una homología de al menos aproximadamente 99 %, 95 %, al menos 90 %, al menos 85 %, al menos 80 %, al menos 75 %, al menos 70 %, al menos 65 %, al menos 60 %, al menos 55 %, o al menos 50 % con un polipéptido que tiene la secuencia de una de las secuencias de aminoácidos de la invención o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de las mismos según se determina utilizando un algoritmo de alineamiento de secuencias (por ejemplo, tal como el algoritmo FASTA versión 3.0t78 con los parámetros por defecto).
Sondas oligonucleotídicas y métodos para su utilización
Las sondas de ácidos nucleicos se pueden usar, por ejemplo, para identificar ácidos nucleicos que codifican un polipéptido con una actividad xilanasa o fragmentos del mismo o para identificar genes de xilanasa. La sonda puede comprender al menos 10 bases consecutivas de un ácido nucleico de la invención. Como alternativa, una sonda de la invención puede tener al menos aproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 o aproximadamente 10 a 50, aproximadamente 20 a 60 aproximadamente 30 a 70, bases consecutivas de una secuencia como la mostrada en un ácido nucleico de la invención. Las sondas identifican un ácido nucleico mediante unión y/o hibridación. Las sondas se pueden utilizar en matrices, véase la discusión de a continuación, incluyendo, por ejemplo, matrices capilares. Las sondas también se pueden utilizar para aislar otros ácidos nucleicos o polipéptidos.
Dichas sondas se pueden usar para determinar si una muestra biológica, tal como una muestra de suelo, contiene un organismo que tiene una secuencia de ácido nucleico de la invención o un organismo del que se obtuvo el ácido nucleico. En tales procedimientos, se obtiene la muestra biológica que alberga potencialmente el organismo a partir del cual se aisló el ácido nucleico y se obtienen los ácidos nucleicos de la muestra. Los ácidos nucleicos se ponen en contacto con la sonda en condiciones que permiten que la sonda hibride específicamente con secuencias complementarias cualesquiera de las que están presentes.
Cuando sea necesario, las condiciones que permiten que la sonda hibride específicamente con secuencias complementarias se pueden determinar colocando la sonda en contacto con secuencias complementarias de muestras que se sabe que contienen la secuencia complementaria así como secuencias de control que no contienen la secuencia complementaria. Las condiciones de hibridación, tales como la concentración de las del tampón de hibridación, la concentración de formamida del tampón de hibridación, o la temperatura de hibridación, pueden variarse para identificar las condiciones que permitan que la sonda hibride específicamente con los ácidos nucleicos complementarios.
Si la muestra contiene el organismo del cual se aisló el ácido nucleico, a continuación se detecta la hibridación específica de la sonda. La hibridación se puede detectar marcando la sonda con un agente detectable tal como un isótopo radiactivo, un colorante fluorescente o una enzima capaz de catalizar la formación de un producto detectable.
Muchos métodos de utilización de sondas marcadas para detectar la presencia de ácidos nucleicos complementarios en una muestra son familiares para los expertos en la técnica. Estos incluyen Transferencias de
5
10
15
20
25
30
35
40
45
50
55
60
65
Southern, Transferencias Northern, procedimientos de hibridación de colonias y transferencias puntuales. Los protocolos para cada uno de estos procedimientos son proporcionados por Ausubel et al. en Current Protocols en Molecular Biology, John Wiley 503 Sons, Inc. (1997) y Sambrook et al., Molecular Cloning: A Laboratory Manual 2a Ed., Cold Spring Harbor Laboratory Press (1989.
Como alternativa, se puede utilizar más de una sonda (al menos una que sea capaz de hibridar específicamente con secuencias complementarias cualesquiera que estén presentes en la muestra de ácido nucleico), en una reacción de amplificación para determinar si la muestra contiene un organismo que contiene una secuencia de ácido nucleico de la invención (por ejemplo, un organismo del cual se aisló el ácido nucleico). Típicamente, las sondas comprenden oligonucleótidos. La reacción de amplificación puede comprender una reacción PCR. Los protocolos de PCR son descritos por Ausubel y Sambrook, supra. Como alternativa, la amplificación puede comprender una reacción en cadena de la ligasa, 3Sr, o una reacción de desplazamiento de la hebra. (Véanse Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and Applications 1:5-16,1991; E. Fahy et al., "Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33, 1991; y Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro ADN Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992). En tales procedimientos, los ácidos nucleicos de la muestra se ponen en contacto con las sondas, se realiza la reacción de amplificación y se detecta cualquier producto de amplificación resultante. El producto de amplificación se puede detectar realizando la electroforesis en gel de los productos de reacción y tiñendo el gel con un intercalador tal como bromuro de etidio. Como alternativa, una o más de las sondas se pueden aislar con un isótopo radioactivo y se puede detectar la presencia de un producto de amplificación radiactivo mediante autorradiografía después de la electroforesis en gel.
Las sondas derivadas de las secuencias próximas a los extremos de las secuencias de la invención y secuencias sustancialmente idénticas a estas, se pueden utilizar también en procedimientos de paseo cromosómico para identificar clones que contienen secuencias genómicas localizadas adyacentes a las secuencias de la invención y secuencias sustancialmente idénticas a estas. Tales métodos permiten el aislamiento de genes que codifican proteínas adicionales del organismo anfitrión.
Los ácidos nucleicos aislados de la invención y secuencias sustancialmente idénticas a estas, las secuencias complementarias a estas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de la invención y secuencias sustancialmente idénticas a estas, o las secuencias complementarias a estas se pueden utilizar como sondas para identificar y aislar ácidos nucleicos relacionados. En algunos aspectos, los ácidos nucleicos relacionados pueden ser ADNc o ADN genómicos de organismos distintos del que se aislado el ácido nucleico. Por ejemplo, los otros organismos pueden ser organismos relacionados. En tales procedimientos, un ácido nucleico muestra se pone en contacto con la sonda en condiciones que permitan a la sonda hibridar específicamente con secuencias relacionadas. La hibridación de la sonda con ácidos nucleicos del organismo relacionado se detecta a continuación utilizando cualquiera de los métodos descritos anteriormente.
Variando el rigor de las condiciones de hibridación utilizadas para identificar ácidos nucleicos, tales como ADNc o ADN genómicos, que hibridan con la sonda detectable, se pueden identificar y aislar ácidos nucleicos que tienen diferentes niveles de homología con la sonda. Las condiciones restrictivas se pueden variar llevando a cabo la hibridación a temperaturas variables por debajo de las temperaturas de fusión de las sondas. La las sondas, Tm, es la temperatura (a una fuerza iónica y pH definidos) a la que 50 % de la secuencia diana hibrida con una sonda perfectamente complementaria. Se seleccionan condiciones muy restrictivas que sean iguales o aproximadamente 5 °C inferiores que la Tm de una sonda concreta. La temperatura de la sonda se puede calcular utilizando las siguientes formulas:
Para sondas entre 14 y 70 nucleótidos de longitud la temperatura de fusión (Tm) se calcula utilizando la fórmula: Tm=81,5+16,6(log [Na+])+0,41(fracción G+C)-(600/N) donde N es la longitud de la sonda.
Si la hibridación se lleva a cabo en una solución que contiene formamida, la temperatura de fusión se puede calcular utilizando la ecuación: Tm=81,5+16,6(log[Na+])+0,41(fracción G+C)-(0,63 % formamida)-(600/N) donde N es la longitud de la sonda.
Si la hibridación se lleva a cabo en una solución que contiene formamida, la temperatura de fusión puede calcularse usando la ecuación: Tm = 81,5 + 16,6 (log [Na+]) + 0,41 (fracción G + C) - (0,63 %de formamida) - (600 / N), donde N es la longitud de la sonda.
La prehibridación se puede llevar a cabo en 6X SSC, 5X reactivo de Denhardt, SDS al 0,5 %, 100 |jg de ADN de esperma de salmón fragmentado desnaturalizado o 6X SSC, 5X reactivo de Denhardt, SDS al 0,5 %, 100 jg de ADN de esperma de salmón fragmentado desnaturalizado, formamida al 50 %. Las fórmulas para las soluciones de SSC y Denhardt son enumeradas por Sambrook et al., supra.
La hibridación se lleva a cabo añadiendo la sonda detectable a las soluciones de prehibridación enumeradas anteriormente. Cuando la sonda comprende ADN de doble hebra, este se desnaturaliza antes de su adición a la solución de hibridación. El filtro se pone en contacto con la solución de hibridación durante un período de tiempo
5
10
15
20
25
30
35
40
45
50
55
60
65
suficiente para permitir que la sonda hibride con los ADNc o los ADN genómicos que contienen secuencias complementarias a estas y homólogas a estas. Para sondas de más de 200 nucleótidos de longitud, la hibridación se puede llevar a cabo a 15-25 °C por debajo de la Tm. Para sondas más cortas, tales como las sondas oligonucleotídicas, la hibridación se puede llevar a cabo a 5-10 °C por debajo de la Tm. Típicamente, para las hibridaciones en 6X SSC, la hibridación se lleva a cabo a aproximadamente 68°C. Usualmente, para las hibridaciones en soluciones que contienen formamida al 50 %, la hibridación se lleva a cabo a aproximadamente 42°C.
Inhibición de la expresión de glicosil hidrolasas
La divulgación proporciona ácidos nucleicos complementarios a (por ejemplo, secuencias antisentido a) los ácidos nucleicos de la invención. Las secuencias antisentido son capaces de inhibir el transporte, el empalme o la transcripción de genes que codifican xilanasa. La inhibición se puede efectuar a través de la elección como diana de ADN genómico o ARN mensajero. La transcripción o la función del ácido nucleico elegido como diana se puede inhibir, por ejemplo, mediante hibridación y/o escisión. Un grupo particularmente útil de inhibidores proporcionado por la presente invención incluye oligonucleótidos que son capaces de unirse al gen de la xilanasa o a su mensaje, evitando o inhibiendo en cualquier caso la producción o la función de la xilanasa. La asociación puede ser a través de hibridación específica de la secuencia. Otra clase útil de inhibidores incluye oligonucleótidos que ocasionan la inactivación o la escisión del mensaje de la xilanasa. El oligonucleótido puede tener una actividad enzimática que causa tal escisión, tal como ribozimas. El oligonucleótido puede ser modificado químicamente o conjugado con una enzima o composición capaz de escindir el ácido nucleico complementario. Se puede cribar una asociación de muchos de estos oligonucleótidos diferentes para determinar los que tienen la actividad deseada. De este modo, la invención proporciona diversas composiciones para la inhibición de la expresión de la xilanasa en un nivel de ácido nucleico y/o proteína, por ejemplo, secuencias antisentido, ARNi y ribozimas que comprenden secuencias de xilanasa de la invención y los anticuerpos anti-xilanasa.
La inhibición de la expresión de la xilanasa puede tener diversas aplicaciones industriales, médicas, farmacéuticas, de investigación, de procesamiento alimentos y piensos y de suplementos de alimentos y piensos, y otras aplicaciones y procesos. Por ejemplo, la inhibición de expresión de la xilanasa puede ralentizar o evitar la descomposición. La descomposición puede ocurrir cuando se degradan enzimáticamente polisacáridos, por ejemplo, polisacáridos estructurales. Esto puede conducir al deterioro, o podredumbre, de frutos y hortalizas. El uso de las composiciones de la invención que inhiben la expresión y/o la actividad de las xilanasas, por ejemplo, anticuerpos, oligonucleótidos antisentido, ribozimas y ARNi, se utilizan para ralentizar o evitar la descomposición. Los métodos y composiciones comprenden la aplicación sobre una planta o producto vegetal (por ejemplo, un cereal, un grano, un fruto, semilla, raíz, hoja, etc.) de anticuerpos, oligonucleótidos antisentido, ribozimas y ARNi de la divulgación para ralentizar o evitar la descomposición. Estas composiciones también pueden ser expresadas por la planta (por ejemplo, una planta transgénica) u otro organismo (por ejemplo, una bacteria u otro microorganismo transformado con un gen de xilanasa de la invención).
Las composiciones de la invención para la inhibición de la expresión de la xilanasa (por ejemplo, secuencias antisentido, ARNi, ribozimas, anticuerpos) se pueden utilizar como composiciones farmacéuticas, por ejemplo, como agentes antipatógenos o en otras terapias, por ejemplo, como anti-microbianos para, por ejemplo, Salmonella.
Oligonucleótidos antisentido
Los oligonucleótidos antisentido pueden ser capaces de unirse al mensaje de la xilanasa que puede inhibir la actividad xilano hidrolasa (por ejemplo, catalizando la hidrólisis de enlaces p-1,4-xilosídicos internos) eligiendo como diana el ARNm. Las estrategias para el diseño de oligonucleótidos antisentido están bien descritas en la bibliografía científica y de patentes, y el experto en la técnica puede diseñar tales oligonucleótidos de xilanasa. Por ejemplo, los protocolos de paseo cromosómico/cartografiado de ARN para cribar los oligonucleótidos antisentido eficaces son bien conocidos en la técnica, véase, por ejemplo, Ho (2000) Methods Enzymol. 314:168-183, que describe una prueba de cartografiado de ARN, que está basado en técnicas moleculares convencionales para proporcionar un método fácil y fiable para la selección potente de secuencias antisentido. Véase también Smith (2000) Eur. J. Pharm. Sci. 11:191-198.
Los ácidos nucleicos de origen natural se utilizan como oligonucleótidos antisentido. Los oligonucleótidos antisentido pueden ser de cualquier longitud; por ejemplo, en aspectos alternativos, los oligonucleótidos antisentido tienen entre aproximadamente 5 a 100, aproximadamente 10 a 80, aproximadamente 15 a 60, aproximadamente 18 a 40. La longitud óptima se puede determinar mediante detección selectiva rutinario. Los oligonucleótidos antisentido pueden estar presentes a cualquier concentración. La concentración óptima se puede determinar mediante detección selectiva rutinario. Se conoce una amplia gama de análogos de nucleótidos y ácidos nucleicos de origen no natural, sintéticos que pueden abordar este problema potencial. Por ejemplo, se pueden utilizar ácidos peptidonucleicos (PNA) que contiene cadenas principales no iónicas, tales como unidades de N-(2-aminoetil)glicina. También se pueden utilizar oligonucleótidos antisentido que tienen conexiones fosforotioato, como se describe en los documentos WO 97/03211; WO 96/39154; Mata (1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Los oligonucleótidos antisentido que tienen
5
10
15
20
25
30
35
40
45
50
55
60
65
análogos de la cadena principal de ADN sintéticos proporcionados por la invención también pueden incluir fosforo- ditioato, metilfosfonato, fosforamidato, alquilfosfotriésteres, sulfamato, 3'-tioacetal, metileno(metilimino), 3'-N- carbamato, y ácidos morfolinocarbamato- nucleicos, como se ha descrito anteriormente.
Se puede utilizar metodología química combinatoria para crear un enorme número de oligonucleótidos que se pueden cribar rápidamente para determinar los oligonucleótidos específicos que tienen afinidades y especificidades de unión apropiadas hacia cualquier diana, tal como the secuencias de xilanasa directa y antisentido de la invención (véase, por ejemplo, Gold (1995) J. de Biol. Chem. 270:13581-13584).
Ribozimas Inhibidoras
Las ribozimas pueden ser capaces de unirse al mensaje de la xilanasa. Estas ribozimas pueden inhibir la actividad xilanasa, por ejemplo, eligiendo como diana el ARNm. Las estrategias diseñar ribozimas y seleccionar la secuencia antisentido específica de xilanasa para elegirla como diana están bien descritas en la bibliografía científica y de patentes, y el experto en la técnica puede diseñar tales ribozimas. Las ribozimas actúan uniéndose a un ARN diana a través de la porción de unión al ARN diana de una ribozima que es mantenida en íntima proximidad con una porción enzimática del ARN que escinde el ARN diana. De este modo, la ribozima reconoce y se une a una diana de ARN a través de los pares de bases complementarios, y una vez unida en el sitio correcto, actúa enzimáticamente para escindir e inactivar el ARN diana. La escisión de un ARN diana de esta manera destruirá su capacidad para dirigir la síntesis de una proteína codificada si la escisión ocurre en la secuencia codificante. Después de que se ha unido una ribozima y escindido su diana de ARN, ésta se puede liberar de ese ARN para unirse y escindir nuevas dianas repetidamente.
En ciertas circunstancias, la naturaleza enzimática de una ribozima puede ser ventajosa sobre otras tecnologías, tales como la tecnología antisentido (donde una molécula de ácido nucleico se une simplemente a un ácido nucleico diana para bloquear su transcripción, translación o asociación con otra molécula) puesto que la concentración eficaz de ribozima necesaria para efectuar un tratamiento terapéutico puede ser inferior que la de un oligonucleótido antisentido. Esta ventaja potencial refleja la capacidad de la ribozima para actuar enzimáticamente. De este modo, una sola molécula de ribozima es capaz de escindir muchas moléculas de ARN diana. Además, una ribozima es típicamente un inhibidor altamente específico, dependiendo la especificidad de inhibición no solo de mecanismo de emparejamiento de bases, sino también del mecanismo por medio del cual la molécula inhibe la expresión del ARN al que se une. Esto es, la inhibición está causada por la escisión de la diana de ARN y de ese modo la especificidad se define como la proporción de la velocidad de escisión del ARN elegido como diana sobre la velocidad de escisión del ARN no elegido como diana. Este mecanismo de escisión depende de factores adicionales a aquellos implicados en el emparejamiento de bases. De este modo, la especificidad de acción de una ribozima puede ser mayor que la del oligonucleótido antisentido que se une al mismo sitio del ARN.
La ribozima de la invención, por ejemplo, una molécula de ARN ribozima enzimática, se puede formar en un motivo cabeza de martillo, un motivo en horquilla, como un motivo del virus delta de la hepatitis, un motivo de intrón del grupo I y/o un ARN de tipo RNasaP asociado con una secuencia guía de ARN. Los ejemplos de los motivos cabeza de martillo son descritos, por ejemplo, por Rossi (1992) Aids Research and Human Retrovirus 8:183; los motivos en horquilla por Hampel (1989) Biochemistry 28:4929, y Hampel (1990) Nuc. Acids Res. 18:299; el motivo del virus delta de la hepatitis por Perrotta (1992) Biochemistry 31:16; el motivo RNasaP por Guerrier-Takada (1983) Cell 35:849; y el intrón del grupo I por Cech Patente de los Estados Unidos Núm. 4.987.071. No se pretende que la enumeración de estos motivos específicos sea limitante. Los expertos en la técnica advertirán que dicha ribozima, por ejemplo, una molécula de ARN enzimática, puede tener un sitio de unión al sustrato específico complementario a uno o más de las regiones de ARN del gen diana. A ribozima puede tener una secuencia de nucleótidos en o rodeando a ese sitio de unión al sustrato que confiere una actividad de escisión de ARN a la molécula.
Interferencia por ARN (ARNi)
Una molécula inhibidora de ARN, denominada moléculas de "ARNi", comprende una secuencia de la enzima xilanasa de la invención. La molécula de ARNi puede comprender una molécula de ARN de doble hebra (ARNdh), por ejemplo, moléculas de ARNic, miARN y/o ARN de horquilla corta (ARNhc). La molécula de ARNi, por ejemplo ARNic (ARN inhibidor corto) puede inhibir la expresión de un gen de la enzima xilanasa y/o miARN (microARN) para inhibir la traducción de un mensaje de xilanasa. La molécula de ARNi, por ejemplo ARNic y/o miARN tiene aproximadamente 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 o más nucleótidos dúplex de longitud. El ARNi pueden entrar en una célula y causar la degradación de un ARN de hebra sencilla (ARNhs) de secuencias similares o idénticos, incluyendo ARNm endógenos. Cuando una célula se expone a ARN de doble hebra (ARNdh), el ARNm del gen homólogo es degradado selectivamente por un procedimiento denominado interferencia por ARN (RNAi). Un posible mecanismo básico detrás del ARNi es la rotura de un ARN de doble hebra (ARNdh) emparejando una secuencia de genes específica en piezas cortas denominado ARN interferente corto, que desencadena la degradación del ARNm que empareja su secuencia. Los ARNi de la invención se utilizan en agentes terapéuticos silenciadores de genes, véase, por ejemplo, Shuey (2002) Drug Discov. Today 7:1040-1046. Los métodos para degradas selectivamente ARN utilizan dichas moléculas de ARNi, por ejemplo ARNic y/o miARN. El procedimiento se puede poner en práctica in vitro, ex vivo o in vivo. Las moléculas de aRní moléculas se pueden
5
10
15
20
25
30
35
40
45
50
55
60
65
utilizar para generar una mutación de pérdida de función en una célula, un órgano o un animal.
La introducción intracelular del ARNi es por intemalización de un ligando específico de la célula diana unido a una proteína de unión a ARN que comprende un ARNi (por ejemplo, microARN) que se adsorbe. El ligando puede internalizarse espontáneamente después de unirse al antígeno de superficie celular. Si el antígeno de superficie celular único no se internaliza naturalmente después de unirse a su ligando, puede promoverse la internalización mediante la incorporación de un péptido rico en arginina u otro péptido permeable a la membrana en la estructura del ligando o proteína de unión a ARN o unión de dicho péptido al ligando o proteína de unión al ARN. Véase, por ejemplo, las publicaciones de solicitud de patente de Estados Unidos n.° 20060030003; 20060025361; 20060019286; 20060019258. En un aspecto, la invención proporciona formulaciones basadas en lípidos para administrar, por ejemplo, introduciendo ácidos nucleicos de la invención como partículas de lípidos de ácido nucleico que comprenden una molécula de ARNi a una célula, véase, por ejemplo, la publicación de solicitud de patente de Estados Unidos n.° 20060008910.
Los métodos para elaborar y utilizar las moléculas ARNi, por ejemplo ARNic y/o miARN, para degradar selectivamente ARN son bien conocidos en la técnica, véase, por ejemplo, las Patentes de los Estados Unidos Núms. 6.506.559; 6.511.824; 6.515.109; 6.489.127.
Modificación de ácidos nucleicos
Los métodos para generar variantes de los ácidos nucleicos de la invención se pueden repetir o utilizar diversas combinaciones para generar xilanasas que tienen una actividad alterada o diferente o una estabilidad alterada o diferente de la de una xilanasa codificada por el ácido nucleico molde. Estos métodos también se pueden repetir o utilizar en diversas combinaciones, por ejemplo, para generar variaciones en la expresión del gen/mensaje, la traducción del mensaje o la estabilidad del mensaje. La composición genética de una célula se puede alterar, por ejemplo, mediante modificación de un gen homólogo ex vivo, seguido de su reinserción en la célula.
Un ácido nucleico de la invención se puede alterar mediante cualquier método. Por ejemplo, métodos aleatorios o estocásticos, o, métodos no estocásticos, o "evolución dirigida", véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.361.974. Los métodos para la mutación de genes aleatoria son bien conocidos en la técnica, véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.830.696. Por ejemplo, los mutágenos se pueden utilizar para mutar aleatoriamente un gen. Los mutágenos incluyen, por ejemplo, irradiación con luz ultravioleta o gamma, o un mutágeno químico, por ejemplo, mitomicina, ácido nitroso, psoralenos fotoactivados, solos o combinados, para inducir roturas de ADN susceptibles de reparación mediante recombinación. Otros mutágenos químicos incluyen, por ejemplo, bisulfito de sodio, ácido nitroso, hidroxilamina, hidrazina o ácido fórmico. Otros mutágenos son análogos de precursores de nucleótidos, por ejemplo, nitrosoguanidina, 5-bromouracilo, 2-aminopurina, o acridina. Estos agentes se pueden añadir a una reacción PCR en lugar del precursor de nucleótido mutando de este modo la secuencia. También se pueden utilizar agentes intercalantes tales como proflavina, acriflavina, quinacrina y similares.
Se puede utilizar cualquier técnica de biología molecular, por ejemplo, mutagénesis aleatoria por PCR, véase, por ejemplo, Rice (1992) Proc. Natl. Acad. Sci. USA 89:5467-5471; o, mutagenésis múltiple combinatoria por inserción de casetes, véase, por ejemplo, Crameri (1995) Biotécnicas 18:194-196. Como alternativa, los ácidos nucleicos, por ejemplo, los genes, se pueden reensamblar después de la fragmentación aleatoria, "estocástica", véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 6.291.242; 6.287.862; 6.287.861; 5.955.358; 5.830.721; 5.824.514; 5.811.238; 5.605.793. En aspectos alternativos, se introducen modificaciones, adiciones o deleciones mediante PCR propensa a error, barajado, mutagénesis dirigida a oligonucleótidos, PCR de ensamblaje, mutagénesis por PCR sexual, mutagenésis in vivo, mutagenésis por inserción de casetes, mutagenésis de ensamblaje recursivo, mutagenésis de conjunto exponencial, mutagénesis de sitio específico, reensamblaje de genes (por ejemplo, GeneReassembly, véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.537.776), mutagénesis de saturación de sitios de genes (GSSM), reensamblaje por ligación sintética (SLR), recombinación, recombinación de secuencia recursiva, mutagénesis de ADN modificada por fosfotioato, mutagénesis del molde que contiene uracilo, mutagénesis del dúplex con huecos, mutagénesis de reparación puntual de emparejamientos erróneos, mutagénesis de la cepa huésped de reparación deficiente, mutagénesis química, mutagénesis radiogénica, mutagénesis por deleción, mutagénesis de restricción-selección, mutagénesis de restricción- purificación, síntesis de genes artificiales, mutagénesis de ensamblaje, creación de multímeros de ácido nucleico quimérico, y/o una combinación de estas y otros métodos.
Las siguientes publicaciones describen una variedad de procedimientos de recombinación recursiva y/o métodos que se pueden incorporar a los métodos de la invención: Stemmer (1999) "Molecular breeding of virus for targeting and other clinical properties" Tumor Targeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang (1999) "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull (1999) "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999) "Directed evolution of thymidine kinase for AZT fosforilation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri (1997) "Molecular evolution of an arsenate detoxification pathway by ADN shuffling", Nature Biotechnology 15:436-438; Zhang (1997) "Directed evolution of an effective fucosidase from a galactosidase by ADN
5
10
15
20
25
30
35
40
45
50
55
60
65
shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al. (1997) "Applications of ADN Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996) "Construction and evolution of antibody-phage libraries by AdN shuffling" Nature Medicine 2:100-103; Gates et al. (1996) "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer'" Journal of Molecular Biology 255:373-386; Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York. págs. 447-457; Crameri y Stemmer (1995) "Combinatorial multiple mutagenésis by insertion of casetes creates all the permutations of mutant and wildtype casetes" BioTechniques 18:194-195; Stemmer et al. (1995) "Single-step assembly of a gen and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995) "The Evolution of Molecular Computation" Science 270: 1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by ADN shuffling" Nature 370:389-391; y Stemmer (1994) "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution." Proc. Natl. Acad. Sci. USA 91:10747- 10751.
Los métodos mutacionales para generar diversidad incluyen, por ejemplo, mutagénesis dirigida al sitio (Ling et al. (1997) "Approaches to ADN mutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale et al. (1996) "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985) "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; y Kunkel (1987) "The efficiency of oligonucleotide directed mutagenesis" en Nucleic Acids & Molecular Biology (Eckstein, F. y Lilley, D. M. J. eds., Springer Verlag, Berlin)); mutagenesis utilizando moldes que contienen uracilo (Kunkel (1985) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987) "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods en Enzymol. 154, 367-382; y Bass et al. (1988) "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245); mutagenesis dirigida a oligonucleótidos (Methods in Enzymol. 100: 468-500
(1983) ; Methods in Enzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed mutagenesis using M13- derived vectors: an efficient and general procedure for the production of point mutations in any ADN fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983) "Oligonucleotide-directed mutagenesis of fragments of ADN cloned into M13 vectors" Methods en Enzymol. 100:468-500; y Zoller (1987) Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded ADN template" Methods en Enzymol. 154:329-350); mutagenesis de ADN modificada con fosforotioato (Taylor (1985) "The use of phosphorothioate- modified ADN in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to mutagenesis directed to oligonucleotides" Nucl. Acids Res. 14: 96799698; Sayers (1988) "Y-T Exonucleases in phosphorothioate-based mutagenesis directed to oligonucleotides" Nucl. Acids Res. 16:791-802; y Sayers et al. (1988) "Strand specific cleavage of phosphorothioate-containing ADN by reaction with restriction endonucleases in presence of ethidium bromide" Nucl. Acids Res. 16: 803-814); mutagenesis utilizando ADN dúplex con huecos (Kramer et al. (1984) "The gapped duplex ADN approach to oligonucleotide- directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367; Kramer (1988) "Improved enzymatic in vitro reactions in the gapped duplex ADN approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; y Fritz (1988) "Oligonucleotide-directed construction of mutations: a gapped duplex ADN procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16: 6987-6999).
Los protocolos adicionales que se pueden utilizar incluyen reparación puntual de emparejamientos erróneos (Kramer
(1984) "Point Mismatch Repair" Cell 38:879-887), mutagénesis utilizando cepas huésped de reparación deficiente (Carter et al. (1985) "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; y Carter (1987) "Improved mutagenesis directed to oligonucleotides using M13 vectores" Methods in Enzymol. 154: 382-403), mutagénesis por deleción (Eghtedarzadeh (1986) "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. 14: 5115), restricción-selección y restricción-selección y restricción-purificación (Wells et al. (1986) "Importance of hydrogen-bond formation in stabilizing the transition stata of subtilisin" Phil. Trans. R. Soc. Lond. A 317: 415-423), mutagénesis mediante síntesis de genes total (Nambiar et al. (1984) "Total synthesis and cloning of a gen coding for the ribonuclease S protein" Science 223: 1299-1301; Sakamar y Khorana (1988) "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)" Nucl. Acids Res. 14: 6361-6372; Wells et al. (1985) "Casete mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323; y Grundstrom et al. (1985) "Oligonucleotide- directed mutagenesis by microscale 'shot-gun' gene synthesis" Nucl. Acids Res. 13: 3305-3316), double-strand break repair (Mandecki (1986); Arnold (1993) "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450-455. "Oligonucleótido-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific" Proc. Natl. Acad. Sci. USA, 83:7177-7181). Se pueden encontrar detalles adicionales sobre muchos de los métodos anteriores en Methods in Enzymology Volumen 154, que también describe controles útiles para la solución de problemas con diversos métodos de mutagénesis.
Los protocolos que se pueden utilizar se describen, por ejemplo, en la Patente de los Estados Unidos Núms. 5.605.793 de Stemmer (Feb. 25, 1997), "Methods for In Vitro Recombination; "Patente de los Estados Unidos Núm.
5
10
15
20
25
30
35
40
45
50
55
60
65
5.811.238 de Stemmer et al. (Sep. 22, 1998) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;" Patente de los Estados Unidos Núm. 5.830.721 de Stemmer et al. (Nov. 3, 1998), "DNA Mutagenesis by Random Fragmentation and Reassembly;" Patente de los Estados Unidos Núm. 5.834.252 de Stemmer, et al. (Nov. 10, 1998) "End-Complementary Polymerase Reaction;" Patente de los Estados Unidos Núm. 5.837.458 de Minshull, et al. (Nov. 17, 1998), "Methods and Compositions for Cellular and Metabolic Engineering;" documento WO 95/22625, Stemmer and Crameri, "Mutagenesis by Random Fragmentation and Reassembly;" documento WO 96/33207 de Stemmer and Lipschutz "End Complementary Polymerase Chain Reaction;" documento WO 97/20078 de Stemmer and Crameri "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;" documento WO 97/35966 de Minshull and Stemmer, "Methods and Compositions for Cellular and Metabolic Engineering;" documento WO 99/41402 de Punnonen et al. "Targeting of Genetic Vaccine Vectors; "documento WO 99/41383 de Punnonen et al. "Antigen Library Immunization;" documento WO 99/41369 de Punnonen et al. "Genetic Vaccine Vector Engineering;" documento WO 99/41368 de Punnonen et al. "Optimization of Immunomodulatory Properties of Genetic Vaccines;" EP 752008 de Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly"; EP 0932670 de Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination;" documento WO 99/23107 de Stemmer et al., "Modification of Virus Tropism and Host Range by Viral Genome Shuffling;" documento WO 99/21979 de Apt et al., "Human Papillomavirus Vectors;" documento Wo 98/31837 de Cardayre et al. "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination;" documento WO 98/27230 de Patten and Stemmer, "Methods and Compositions for Polypeptide Engineering;" documento WO 98/27230 de Stemmer et al., "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection", documento WO 00/00632, "Methods for Generating Highly Diverse Libraries", documento WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences", documento WO 98/42832 de Arnold et al., "Recombination of Polynucleotide Sequences Using Random or Defined Primers", documento WO 99/29902 de Arnold et al., "Method for Creating Polynucleotide and Polypeptide Sequences", documento WO 98/41653 de Vind, "An in Vitro Method for Construction of a DNA Library", documento WO 98/41622 de Borchert et al., "Method for Constructing a Library Using DNA Shuffling", y documento WO 98/42727 de Pati and Zarling, "Sequence Alterations using Homologous Recombination".
Los protocolos que se pueden utilizar (proporcionando detalles concernientes a diversos métodos generadores de diversidad) se describen, por ejemplo, en la Solicitud de Patente de los Estados Unidos con el Núm. de Serie (USSN) 09/407.800, "SHUFFLING OF CODON ALTERED GENES" de Patten et al. presentada el 28 de Sep. de 1999; "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" de Cardayre et al., Patente de los Estados Unidos Núm. 6.379.964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" de Crameri et al., Patentes de los Estados Unidos Núms. 6.319.714; 6.368.861; 6.376.246; 6.423.542; 6.426.224 y documento PCT/US00/01203; "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING" de Welch et al., Patente de los Estados Unidos Núm. 6.436.675; "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" de Selifonov et al., presentada el 18 de Enero de 2000, (PCT/US00/01202) y, por ejemplo, "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" de Selifonov et al., presentada el 18 de Julio de 2000 (Documento U.S. Núm. Ser. 09/618,579); "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY STIMULATIONS" de Selifonov y Stemmer, presentada el 18 de Enero de 2000 (PCT/US00/01138); y "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" de Affholter, presentada el 6 de Sep. de 2000 (Documento U.S. Núm. Ser. 09/656,549); y Patentes de los Estados Unidos Núms. 6.177.263; 6.153.410.
Los métodos no estocásticos, o de "evolución dirigida" incluyen, por ejemplo, la mutagénesis por saturación (GSSM), reensamblaje por ligación sintética (SLR), o una de sus combinaciones se utilizan para modificar los ácidos nucleicos de la invención para generar xilanasas con propiedades nuevas o alteradas (por ejemplo, actividad bajo condiciones altamente ácidas o alcalinas, temperaturas altas o bajas, y similares). Los polipéptidos codificador por los ácidos nucleicos modificados se pueden cribar para determinar una actividad antes de someter a ensayo la hidrólisis del xilano u otra actividad. Se puede utilizar cualquier modalidad o protocolo de ensayo, por ejemplo, utilizando una plataforma de matriz capilar. Véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 6.361.974; 6.280.926; 5.939.250.
Mutagénesis por saturación, o, GSSM
Los métodos para fabricar enzimas usan mutagénesis de sitio génico por saturación, o GSSM, como se describe en el presente documento y también en las patentes de Estados Unidos n.° 6.171.820 y 6.579.258. Se utilizan cebadores codónicos que contienen una secuencia N,N,G/T degenerada para introducir mutaciones puntuales en un polinucleótido, por ejemplo, una xilanasa o un anticuerpo de la invención, para generar un conjunto de polipéptidos progenie en el que en cada posición de aminoácidos está representada una gama completa de sustituciones de un solo aminoácido, por ejemplo, un residuo de aminoácido en un sitio activo enzimático o un sitio de unión al ligando elegido como diana que se va a modificar. Estos oligonucleótidos pueden comprender una primera secuencia homóloga contigua, una secuencia N,N,G/T degenerada, y, opcionalmente, una segunda secuencia homóloga. Los productos traduccionales de la progenie aguas abajo a partir del uso de tales oligonucleótidos incluyen todos los
5
10
15
20
25
30
35
40
45
50
55
60
65
cambios de aminoácido posibles en cada sitio de aminoácido a lo largo del polipéptido, debido a que la degeneración de la secuencia N,N,G/T incluye codones para los 20 aminoácidos. Uno de tales oligonucleótidos degenerados (que comprende, por ejemplo, un casete N,N,G/T degenerado) puede utilizarse para someter cada codón original en un molde polinucleotídico parental a una gama completa de sustituciones codónicas o al menos dos casetes degenerados - en el mismo oligonucleótido o no, para someter al menos dos codones originales en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. Por ejemplo, en un oligonucleótido puede estar contenida más de una secuencia N,N,G/T para introducir mutaciones de aminoácido en más de un sitio. Esta pluralidad de secuencias N,N,G/T pueden estar directamente contigua, o separada by una o más secuencias de nucleótidos adicionales. Se pueden usar oligonucleótidos prácticos para introducir adiciones y deleciones solos o combinados con los codones que contienen una secuencia N,N,g/t, para introducir cualquier combinación o permutación de adiciones, deleciones, y/o sustituciones de aminoácidos.
La mutagénesis simultanea de dos o más posiciones de aminoácido contiguas se realiza utilizando un oligonucleótido que contiene tripletes N,N,G/T contiguos, es decir una secuencia (N,N,G/T)n degenerada. Se pueden utilizar casetes degenerados que tienen menos degeneración que la secuencia N,N,G/T. Por ejemplo, puede ser deseable en algunos casos (por ejemplo, en un oligonucleótido) una secuencia de triplete degenerado que comprende solo un N, donde dicho N puede estar en la segunda o tercera posición del triplete. Se pueden utilizar otras bases cualesquiera incluyendo cualquiera de sus combinaciones y permutaciones en las dos posiciones restantes del triplete. Como alternativa, puede ser deseable en algunos casos (por ejemplo, en un oligo) utilizar una secuencia de triplete N,N,N degenerado.
El uso de tripletes degenerados (por ejemplo, tripletes N,N,G/T) permite la generación sistemática y fácil de una gama completa de aminoácidos naturales posibles (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido (en aspectos alternativos, los métodos también incluyen la generación de menos de todas las sustituciones posibles por posición de residuo de aminoácido, o codón,). Por ejemplo, para un polipéptido de 100 aminoácidos, se pueden generar 2000 especies distintas (es decir 20 aminoácidos posibles por posición X 100 posiciones de aminoácidos). A través del uso de un oligonucleótido o conjunto de oligonucleótidos que contienen un triplete N,N,G/T degenerado, 32 secuencias individuales pueden codificar los 20 aminoácidos naturales posibles. De este modo, en un recipiente de reacción en el que una secuencia parental de polinucleótidos se somete a mutagénesis por saturación utilizando al menos uno de tales oligonucleótidos, se generan 32 polinucleótidos progenie distintos que codifican 20 polipéptidos distintos. En contraste, el uso de un oligonucleótido no degenerado en la mutagénesis dirigida al sitio conduce solo a un producto polipeptídico progenie por recipiente de reacción. Los oligonucleótidos no degenerados se pueden utilizar, en un aspecto, combinados con los cebadores degenerados descritos; por ejemplo, los oligonucleótidos no degenerados se pueden utilizar para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios de aminoácido correspondientes, y mutaciones puntuales que ocasionan la generación de codones de parada y la correspondiente expresión de fragmentos polipeptídicos.
En un aspecto, cada recipiente de reacción de mutagénesis por saturación contiene polinucleótidos que codifican al menos 20 moléculas de polipéptido progenie de manera que los 20 aminoácidos naturales están representados en una posición de aminoácido específica correspondiente a la posición del codón mutagenizada en el polinucleótido parental (otros aspectos utilizan menos de los 20 combinaciones naturales). La progenie de polipéptidos degenerada 32 veces generada a partir de cada recipiente de reacción de mutagénesis por saturación se puede someter a amplificación clonal (por ejemplo, clonada en un anfitrión adecuado, por ejemplo, anfitrión E. coli, utilizando, por ejemplo, un vector de expresión) y someter a detección selectiva de la expresión. Cuando una progenie de polipéptido individual se identifica para que presente un cambio de propiedades favorable (cuando se compara con el polipéptido parental, tal como el aumento de la actividad de hidrólisis del xilano en condiciones alcalinas o ácidas), ésta se puede secuenciar para identificar la sustitución de aminoácido correspondientemente favorable contenida allí.
Después de mutageneizar todos y cada uno de las posiciones de aminoácido en un polipéptido parental utilizando mutagénesis por saturación como se describe en el presente documento, se pueden identificar cambios de aminoácidos favorables en más de una posiciones de aminoácido. Se pueden generar una o más moléculas progenie que contiene una combinación de todas o parte de estas sustituciones de aminoácido favorables. Por ejemplo, si se identifican 2 cambios de aminoácido favorables específicos en cada una de 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original, y cada uno de dos cambios favorables) y 3 posiciones. De este modo, hay 3 x 3 x 3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente - 6 mutaciones puntuales individuales (es decir 2 en cada una de las tres posiciones) y no hay cambio en ninguna posición.
Se puede utilizar mutagénesis de saturación de sitio junto con barajado, quimerización, recombinación y otros procedimientos mutagenizantes, junto con detección selectiva. Se pueden utilizar procedimientos de mutagenización cualesquiera, incluyendo mutagénesis por saturación, de una manera iterativa. El uso iterativo de procedimientos de mutagenización cualesquiera se puede usar combinado con detección selectiva.
5
10
15
20
25
30
35
40
45
50
55
60
65
Se pueden utilizar cebadores codónicos patentados (que contienen una secuencia N,N,N degenerada) para introducir mutaciones puntuales en un polinucleótido, para generar un conjunto de polipéptidos progenie en el que está representada en cada posición de aminoácido una gama completa de sustituciones individuales de aminoácidos (mutagénesis de saturación de sitios de genes (GSSM)). Los oligos utilizados están compuestos contiguamente de una primera secuencia homóloga, una secuencia N,N,N degenerada y preferentemente pero no necesariamente una segunda secuencia homóloga. Los productos traduccionales de la progenie agua abajo a partir del uso de tales oligos incluyen todos los cambios de aminoácidos posibles en cada sitio de aminoácido a lo largo del polipéptido, puesto que la degeneración de la secuencia N,N,N incluye codones para los 20 aminoácidos.
Uno de tales oligos degenerados (compuestos de un casete N,N,N degenerado) se utiliza para someter cada codón original en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. O se utilizan al menos dos casetes N,N,N degenerados - en el mismo oligo o no, para someter al menos dos codones originales en un molde polinucleotídico parental a una gama completa de sustituciones codónicas. De este modo, puede estar contenida más de una secuencia N,N,N en un oligo para introducir mutaciones de aminoácido en más de un sitio. Esta pluralidad de secuencias N,N,N puede estar directamente contigua, o separada por una o más secuencias de nucleótidos adicionales. O los oligos prácticos para introducir adiciones y deleciones se pueden utilizar solos o combinados con los codones que contienen una secuencia N,N,N, para introducir cualquier combinación o permutación de adiciones, deleciones y/o sustituciones de aminoácidos.
Es posible mutageneizar simultáneamente dos o más posiciones de aminoácidos contiguas utilizando un oligo que contienen tripletes N,N,N contiguos, es decir una secuencia (N,N,N)n degenerada.
Se pueden utilizar casetes degenerados que tienen menos degeneración que la secuencia N,N,N. Puede ser deseable en algunos casos utilizar (por ejemplo, en un oligo) una secuencia triplete degenerada que está compuesta de solo un N, donde el N puede estar en la primera, segunda o tercera posición del triplete. Se pueden utilizar otras bases cualesquiera incluyendo combinaciones y permutaciones cualesquiera de las mismas en las dos posiciones restantes del triplete. Como alternativa, puede ser deseable en algunos casos utilizar (por ejemplo, en un oligo) una secuencia triplete N,N,N degenerada, N,N,G/T, o una secuencia triplete N,N,G/C.
Se aprecia, no obstante, que el uso de un triplete degenerado (tal como N,N,G/T o una secuencia triplete N,N,G/C) es ventajoso por diversas razones. Puede ser un medio para generar sistemáticamente y bastante fácilmente la sustitución de la gama completa de aminoácidos posibles (para un total de 20 aminoácidos) en todas y cada una de las posiciones de aminoácidos en un polipéptido. De este modo, para un polipéptido de 100 aminoácidos, la invención proporciona a una manera de generar sistemáticamente y bastante fácilmente 2000 especies distintas (es decir, 20 aminoácidos posibles por posición en 100 posiciones de aminoácidos). Se aprecia que se proporcionan, a través del uso de un oligo que contiene una secuencia triplete N,N,G/T o N,N,G/C degenerada, 32 secuencias individuales que codifican 20 aminoácidos posibles. De este modo, en un recipiente de reacción en el que una secuencia parental de polinucleótidos se somete a mutagénesis por saturación utilizando uno de tales oligos, se generan 32 polinucleótidos progenie distintos que codifican 20 polipéptidos distintos. En contraste, el uso de un oligo no degenerado en la mutagénesis dirigida al sitio conduce a solo un producto progenie de polipéptidos por recipiente de reacción.
Se pueden utilizar, opcionalmente, oligos no degenerados combinados con los cebadores degenerados descritos. Se aprecia que en algunas situaciones, es ventajoso utilizar oligos no degenerados para generar mutaciones puntuales específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones puntuales silenciosas específicas, mutaciones puntuales que conducen a cambios aminoácido y mutaciones puntuales correspondientes que causan la generación de codones de parada y la expresión correspondiente de fragmentos peptídicos.
Por tanto, cada recipiente de reacción de la mutagénesis por saturación contiene polinucleótidos que codifican al menos moléculas progenie de 20 polipéptidos de manera que los 20 aminoácidos están representados en una posición de aminoácido específica correspondiente a la posición codónica mutagenizada en el polinucleótido parental. La progenie de polipéptidos degenerada 32 veces generada a partir de cada recipiente de reacción de la mutagénesis por saturación se puede someter a amplificación clonal (por ejemplo, clonar en un anfitrión E. coli adecuado utilizando un vector de expresión) y someter a detección selectiva de expresión. Cuando se identifica una progenie de polipéptido individual mediante detección selectiva para presentar un cambio de propiedades favorable (cuando se compara con el polipéptido parental), ésta se puede secuenciar para identificar sustitución de aminoácido correspondientemente favorable contenida allí.
Se aprecia que después de mutageneizar todas y cada una de las posiciones de aminoácido en un polipéptido parental utilizando mutagénesis por saturación como se describe en el presente documento, se pueden identificar los cambios de aminoácido favorables en más de una posición de aminoácido. Se pueden generar una o más moléculas progenie nuevas que contienen una combinación de todas o parte de estas sustituciones de aminoácido favorables. Por ejemplo, si se identifican 2 cambios aminoácido favorables específicos en cada una de las 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (sin cambio del aminoácido original y cada uno de dos los cambios favorables) y 3 posiciones. De este modo, hay 3 x 3 x
5
10
15
20
25
30
35
40
45
50
55
60
65
3 o 27 posibilidades totales, incluyendo 7 que se examinaron previamente - 6 mutaciones puntuales individuales (es decir, 2 en cada una de las tres posiciones) y sin cambio en ninguna posición.
Por tanto, la mutagénesis por saturación puede usarse en combinación con procedimientos de mutagenización adicionales, tal como un procedimiento en el que se introducen dos o más polinucleótidos relacionados en una célula huésped adecuada de manera que se genera una polinucleótido híbrido mediante recombinación y reordenamiento reductivo.
Además para realizar la mutagénesis a lo largo de la secuencia completa de un gen, la mutagénesis se puede utilizar para remplazar cada una de cualquier número de bases en una secuencia de polinucleótidos, donde el número de bases que se va a mutageneizar es preferentemente cada número entero de 15 a 100.000. De este modo, en lugar de mutageneizar cada posición a lo largo de una molécula, se puede someter cada base o un número discreto de bases (totalizando un subgrupo preferentemente de 15 a 100.000) a mutagénesis. Preferentemente, se utiliza un nucleótido separado para mutageneizar cada posición o grupo de posiciones a lo largo de una secuencia de polinucleótidos. Un grupo de 3 posiciones que se vayan a mutageneizar puede ser un codón. Las mutaciones se introducen preferentemente utilizando un cebador mutagénico, que contiene un casete heterólogo, también referido como casete mutagénico. Los casetes ilustrativos pueden tener de 1 a 500 bases. Cada posición de nucleótido en tales casetes heterólogos pueden ser N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G, o E, donde E es cualquier base que no sea A, C, G, o T (E se puede referir como oligo diseñador).
En un sentido general, la mutagénesis por saturación comprende la mutagenización de un conjunto completo de casetes mutagénicos (donde cada casete tiene preferentemente aproximadamente 1-500 bases de longitud) en secuencias de polinucleótidos definidas que se van a mutageneizar (donde la secuencia que se va a mutageneizar tiene preferentemente de aproximadamente 15 a 100.000 bases de longitud). De este modo, se introduce un grupo de mutaciones (que oscila de 1 a 100 mutaciones) en cada casete que se vaya a mutageneizar. Un agrupamiento de mutaciones que se va a introducir en un casete puede ser diferente o igual que un segundo agrupamiento de mutaciones que se va a introducir en un segundo casete durante la aplicación de una ronda de mutagénesis por saturación. Tales agrupamientos se ilustran mediante deleciones, adiciones, agrupamientos de codones concretos y agrupamientos de casetes de nucleótidos concretos.
Las secuencias definidas que se van a mutageneizar incluyen un gen completo, una ruta, un ADNc, un marco de lectura abierto (ORF) completo y un promotor completo, un intensificador, un represor/transactivador, un origen de replicación, un intrón, un operador, o cualquier grupo funcional polinucleotídico. Generalmente, las "secuencias definidas" para este fin pueden ser polinucleótidos cualesquiera que tienen una secuencia de polinucleótidos de 15 bases y secuencias de polinucleótidos de entre 15 bases y 15.000 bases de longitud (la presente invención específicamente nombra cada número entero intermedio). Las consideraciones en la elección de los agrupamientos de codones incluyen los tipos de aminoácidos codificados por un casete mutagénico degenerado.
Con respecto al agrupamiento de mutaciones que se pueden introducir en un casete mutagénico, se proporcionan sustituciones codónicas degeneradas (utilizando oligos degenerados) que codifican 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 y 20 aminoácidos en cada posición y una biblioteca de polipéptidos codificada de ese modo.
Reensamblaje por ligación sintética (SLR)
Se puede usar un sistema de modificación de genes no estocástico denominado "reensamblaje por ligación sintética", o simplemente "SLR", un "proceso de evolución dirigida", para generar polipéptidos, por ejemplo, xilanasas o anticuerpos de la invención, con propiedades nuevas o alteradas.
El SLR es un método para ligar fragmentos de oligonucleótidos entre sí no estocásticamente. Este método difiere de barajado de oligonucleótidos estocástico en que los elementos fundamentales del ácido nucleico no se barajan, concatenan o quimerizan aleatoriamente, sino que en lugar de eso se ensamblan no estocásticamente. Véase, por ejemplo, las patentes de Estados Unidos n.° 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449; 6.537.776. El SLR comprende las siguientes etapas: (a) proporcionar un polinucleótido molde, donde el polinucleótido molde comprende una secuencia que codifica un gen homólogo; (b) proporcionar una pluralidad de polinucleótidos unidades fundamentales, donde los polinucleótidos unidades fundamentales se diseñan para su reensamblaje mediante entrecruzamiento con el polinucleótido molde en una secuencia predeterminada, y un polinucleótido unidad fundamental comprende una secuencia que es una variante del gen homólogo y una secuencia homóloga al polinucleotídico molde que flanquea la secuencia variante; (c) combinar un polinucleótido unidad fundamental con un polinucleótido molde de manera que el polinucleótido unidad fundamental se reensamble mediante entrecruzamiento con el polinucleótido molde para generar polinucleótidos que comprenden variaciones de secuencia de genes homólogos.
El SLR no depende de la presencia de altos niveles de homología entre los polinucleótidos que se va a reordena. De este modo, este método se puede utilizar para generar no estocásticamente bibliotecas (o conjuntos) de moléculas
5
10
15
20
25
30
35
40
45
50
55
60
65
progenie que comprenden más de 10100 quimeras diferentes. El SLR se puede utilizar para generar bibliotecas que comprenden más de 101000 quimeras progenie diferentes. De este modo, los métodos no estocásticos pueden producir un conjunto de molécula de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. Este método incluye las etapas de generar mediante diseño una pluralidad de elementos fundamentales de ácido nucleico específicos que tienen extremos ligables mutuamente compatibles prácticos, y ensamblar estos elementos fundamentales de ácido nucleico, de manera que se logre un orden de ensamblaje global diseñado.
Se considera que los extremos ligables mutuamente compatibles de los elementos fundamentales de ácido nucleico que se van a ensamblar son "prácticos" para este tipo de ensamblaje ordenado si posibilitan el acoplamiento de los elementos fundamentales en los órdenes predeterminados. De este modo, el orden de ensamblaje global en el que los elementos fundamentales de ácido nucleico pueden estar acoplados se especifica mediante el diseño de los extremos ligables. Si se va a utilizar más de una etapa de ensamblaje, el orden de ensamblaje global en el que pueden estar acoplados los elementos fundamentales de ácido nucleico también está especificado por el orden sucesivo de la etapa o las etapas de ensamblaje. Las piezas fundamentales recocidas se pueden tratar con una enzima, tal como una ligasa (por ejemplo, aDn ligasa de T4), para lograr la unión covalente de las piezas fundamentales.
El diseño de los elementos fundamentales del oligonucleótido se puede obtener analizando un conjunto de secuencias progenitoras de moldes de ácido nucleico que sirven como una base para la producción de un conjunto progenie de polinucleótidos quiméricos finalizados. Estos moldes de oligonucleótido parentales sirven así como fuente de información de secuencia que ayuda al diseño de los elementos fundamentales de ácido nucleico que se van a mutageneizar, por ejemplo, quimerizados o barajados. Las secuencias de una pluralidad de moldes de ácido nucleico parentales pueden alinearse con el fin de seleccionar uno o más puntos de demarcación. Los puntos de demarcación pueden estar localizados en una zona de homología, y comprenden uno o más nucleótidos. Estos puntos de demarcación con compartidos preferentemente por al menos dos de los moldes progenitores. Los puntos de demarcación se pueden utilizar de ese modo para delinear los límites de elementos fundamentales de los oligonucleótidos que se van a generar con el fin de reordenar los polinucleótidos parentales. Los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potenciales en el ensamblaje de las moléculas progenie quiméricas finales. Un punto de demarcación puede ser una zona de homología (que comprende al menos un base nucleotídica homóloga) compartida por al menos dos secuencias de polinucleótidos parentales. Como alternativa, un punto de demarcación puede ser una zona de homología que es compartida por al menos la mitad de las secuencias de polinucleótidos parentales, o, puede ser una zona de homología que es compartida por al menos dos tercios de las secuencias de polinucleótidos parentales. Incluso más preferentemente los puntos de demarcación prácticos son una zona de homología que es compartida por al menos tres cuartas partes de las secuencias de polinucleótidos parentales, o, puede ser compartida por casi todas las secuencias de polinucleótidos parentales. Un punto de demarcación es una zona de homología que es compartida por todas las secuencias de polinucleótidos parentales.
Se puede realizar exhaustivamente un procedimiento de reensamblaje por ligación con el fin de generar una biblioteca exhaustiva de polinucleótidos quiméricos progenie. En otras palabras, todas las combinaciones ordenadas posibles de los elementos fundamentales de ácido nucleico están representadas en el conjunto de moléculas de ácido nucleico quiméricas finalizadas. Al mismo tiempo, el orden de ensamblaje (es decir el orden de ensamblaje de cada elemento fundamental en secuencia 5' a 3' de cada ácido nucleico quimérico finalizado) en cada combinación es mediante diseño (o no estocástico) como se ha descrito anteriormente. Debido a la naturaleza no estocástica de la presente invención, se reduce enormemente la posibilidad productos secundarios no deseados.
El método de reensamblaje por ligación se puede realizar sistemáticamente. Por ejemplo, el método se realiza con el fin de generar una biblioteca compartimentalizada sistemáticamente de moléculas progenie, con compartimentos que pueden ser escrutados sistemáticamente, por ejemplo, de uno en uno. En otras palabras, a través del uso selectivo y juicioso de elementos específicos fundamentales de ácido nucleico, acoplado al uso selectivo y juicioso de reacciones de ensamblaje recorridas sucesivamente, se puede lograr un diseño en el que se elaboran conjuntos específicos de productos progenie en cada uno de los diversos recipientes de reacción. Esto permite la realización de un procedimiento sistemático de examen y detección selectiva. De este modo, estos métodos permiten examinar sistemáticamente un número potencialmente muy grande de moléculas progenie en grupos más pequeños. Debido a su capacidad para realizar quimerizaciones de una manera que es altamente flexible aunque también exhaustiva y sistemática, particularmente cuando hay un bajo nivel de homología entre las moléculas progenitoras, estos métodos proporcionan la generación de una biblioteca (o conjunto) que comprende un gran número de moléculas progenie. Debido a la naturaleza no estocástica, las moléculas progenie generadas comprenden preferentemente una biblioteca de moléculas de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. La mutagénesis por saturación y los métodos de evolución dirigida optimizados también se pueden utilizar para generar especies moleculares progenie diferentes. Se aprecia que esto proporciona libertad de elección y control con respecto a la selección de los puntos de demarcación, el tamaño y el número de elementos fundamentales de ácido nucleico, y el tamaño y el diseño de los acoplamientos. Se aprecia además, que el requerimiento de homología intermolecular se encuentra muy relajado por la operabilidad de la presente invención. De hecho, los puntos de demarcación se pueden elegir incluso en zonas de poca o ninguna homología
5
10
15
20
25
30
35
40
45
50
55
60
65
intermolecular. Por ejemplo, debido al balanceo codónico, es decir la degeneración de los codones, se pueden introducir sustituciones de nucleótidos en los elementos fundamentales de ácido nucleico sin alterar el aminoácido codificado originalmente en el molde progenitor correspondiente. Como alternativa, se puede alterar un codón de manera que se altere la codificación para un aminoácido original. El método proporciona que tales sustituciones se pueden introducir en el elemento fundamental del ácido nucleico con el fin de incrementar la incidencia de puntos de demarcación homólogos intermoleculares y permitir así un aumento del número de acoplamientos que se van a lograr entre los elementos fundamentales, lo que a su vez permite la generación de un mayor número de moléculas quiméricas progenie.
Reensamblaje de genes sintético
Un método no estocástico denominado reensamblaje sintético de genes (por ejemplo, GeneReassembly, véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.537.776), difiere del barajado estocástico en que los elementos fundamentales del ácido nucleico no son barajados o concatenados o quimerizados aleatoriamente, sino que en vez de eso se ensamblan no estocásticamente.
El método de reensamblaje sintético de genes no depende de la presencia de un alto nivel de homología entre los polinucleótidos que se van a barajas. El método se puede utilizar para generar no estocásticamente bibliotecas (o conjuntos) de moléculas progenie que comprenden más de 1010 quimeras diferentes. Posiblemente, el reensamblaje sintético de genes se puede utilizar incluso para generar bibliotecas que comprenden más de 101000 quimeras progenie diferentes.
Un procedimiento no estocástico puede producir un conjunto de moléculas de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño, cuyo método comprende las etapas de generación mediante diseño de una pluralidad de elementos específicos fundamentales de ácidos nucleicos que tienen extremos ligables mutuamente compatibles prácticos y ensamblaje de estos elementos fundamentales de ácido nucleico, de manera que se logre un orden de ensamblaje global diseñado.
El reensamblaje sintético de genes comprende un método para: 1) preparar una o varias generaciones de moléculas progenie (incluyendo una molécula que comprende una secuencia de polinucleótidos, por ejemplo, una molécula que comprende una secuencia de polipéptidos codificante), que es mutagenizada para lograr al menos una mutación, adición, deleción, y/o quimerización puntual, a partir de uno o varios moldes de generación ancestral o parental; 2) cribar la molécula o moléculas de la generación progenie, por ejemplo, utilizando un método de alto rendimiento, para al menos una propiedad de interés (tal como una mejora en una actividad enzimática); 3) en un aspecto obtener y/o catalogar información estructural y/o funcional concerniente a las moléculas de la generación parental y/o progenie; y 4) en un aspecto, repetir opcionalmente cualquiera de las etapas 1) a 3). Se pueden generar (por ejemplo, a partir de un molde polinucleotídico parental), en lo que se denomina "mutagénesis de saturación de sitio codónico", una generación progenie de polinucleótidos, que tienen cada uno al menos un conjunto de hasta tres mutaciones puntuales contiguas (es decir diferente bases que comprenden un nuevo codón), de manera que cada codón (o cada familia de codones degenerados que codifican el mismo aminoácido) está representado en cada posición codónica. Correspondiente a, y codificado por, esta generación progenie de polinucleótidos, también se genera un conjunto de polipéptidos progenie, que tienen cada uno al menos una mutación puntual de un solo aminoácido. Se puede generar, en lo que se denomina " mutagénesis de saturación de sitio de aminoácido", uno de tales polipéptidos mutantes para cada una de las 19 sustituciones de alfa-aminoácidos que forman el polipéptido codificado naturalmente en todas y cada una de las posiciones de aminoácidos a lo largo del polipéptido. Esto produce, para todas y cada una de las posiciones de aminoácidos a lo largo del polipéptido parental, un total de 20 polipéptidos progenie distintos incluyendo el aminoácido original, o potencialmente más de 21 polipéptidos progenie distintos si se utilizan aminoácidos adicionales en lugar o además de los 20 aminoácidos codificados naturalmente.
De este modo, este enfoque es también práctico para generar mutantes que contienen, además de y/o combinados con los 20 alfa-aminoácidos que forman polipéptidos codificados naturalmente, otros aminoácidos y derivados de aminoácidos raros y/o no codificados naturalmente. Este enfoque también es práctico para generar mutantes mediante el uso de, además de y/o combinados con sistemas de reconocimiento de codones naturales o no alterados, de sistemas de reconocimiento de codones alterados, mutagenizados, y/o diseñados en anfitriones adecuados (por ejemplo en una célula huésped con una o más moléculas de ARNt alteradas.
Un método para preparar polinucleótidos que codifican un polipéptido puede ser por medio de un método de reagrupamiento in vivo de secuencias de polinucleótidos que contienen regiones de homología parcial, ensamblar los polinucleótidos para formar al menos un polinucleótido y cribar los polinucleótidos para la producción de uno o varios polipéptidos que tienen una propiedad útil.
Esto es práctico para analizar y catalogar, con respecto a cualquier propiedad molecular (por ejemplo, una actividad enzimática) o combinación de propiedades permitidas por la tecnología actual, los efectos de cualquier cambio mutacional (incluyendo particularmente la mutagénesis por saturación). De este modo, se proporciona un método integral para determinar el efecto del cambio de cada aminoácido en un polipéptido parental en cada una de al menos 19 sustituciones posibles. Esto permite caracterizar y catalogar cada aminoácido en un polipéptido parental
5
10
15
20
25
30
35
40
45
50
55
60
65
de acuerdo con su espectro de efectos potenciales sobre una propiedad medible del polipéptido.
Se puede introducir un intrón en una molécula progenie quimérica por medio de un elemento fundamental de ácido nucleico. Los intrones tienen a menudo secuencias consenso en ambos extremos con el fin de hacerlos operativos. Además de permitir el empalme de genes, los intrones pueden servir para el propósito adicional de proporcionar sitios de homología a otros ácidos nucleicos para posibilitar la recombinación homóloga. Para este fin, y potencialmente otros, puede ser deseable a veces generar un elemento fundamental de ácido nucleico grande para introducir un intrón. Si el tamaño es demasiado grande para ser generado fácilmente mediante síntesis química directa de dos oligos de hebra sencilla, tal elemento fundamental de ácido nucleico especializado puede ser generado también mediante síntesis química directa de más de dos oligos de hebra sencilla o utilizando una reacción de reacción amplificación basada en la polimerasa.
Se considera que los extremos ligables mutuamente compatibles de los elementos fundamentales de ácido nucleico que se van a ensamblar son "prácticos" para este tipo de ensamblaje ordenado si posibilitan que los elementos fundamentales se acoplen en los órdenes predeterminados. De este modo, el orden de ensamblaje global en el que el elementos fundamentales de ácido nucleico pueden estar acoplados se especifica mediante el diseño de los extremos ligables y, si se va a utilizar más de una etapa de ensamblaje, el orden de ensamblaje global en el que el elementos fundamentales de ácido nucleico pueden estar acoplados es especificado también por el orden sucesivo de la etapa o etapas de ensamblaje. Las piezas fundamentales recocidas se pueden tratar con una enzima, tal como una ligasa (por ejemplo, ADN ligasa de t4) para lograr la unión covalente de las piezas fundamentales.
El acoplamiento se puede producir de manera que no haga uso de cada nucleótido en un saliente que participe. El acoplamiento es particularmente dinámico para sobrevivir (por ejemplo, en un anfitrión transformado) si el acoplamiento reforzado mediante tratamiento con una enzima ligasa forma lo que puede ser referido como una "ligación con espacios" o una "ligación incompleta". Este tipo de acoplamiento puede contribuir a la generación de uno o varios productos secundarios no buscados, pero también se pueden utilizar para aumentar la diversidad de la biblioteca progenie generada por el reensamblaje ligación diseñado. Algunos salientes con susceptibles de experimentar autoacoplamiento para formar un acoplamiento palindrómico. Un acoplamiento se consolida sustancialmente si se refuerza mediante tratamiento con una enzima ligasa. Se puede utilizar ventajosamente la carencia de fosfatos 5' en estos salientes para prevenir este tipo de autoligación palindrómica. Por lo tanto, se pueden elaborar químicamente (u ordenar) elementos fundamentales de ácido nucleico que carezcan de un grupos fosfato 5'. Como alternativa, éstos se pueden eliminar, por ejemplo, mediante tratamiento con una enzima fosfatasa, tal como una fosfatasa alcalina intestinal de ternera (CIAP), con el fin de prevenir autoligaciones palindrómicas en procedimientos de reensamblaje por ligación.
El diseño de elementos fundamentales de ácido nucleico se puede obtener después del análisis de las secuencias de un conjunto de moldes de ácido nucleico progenitores que sirven como base para la producción de un conjunto progenie de moléculas de ácido nucleico quiméricas finalizadas. Estos moldes de ácido nucleico progenitores sirven de este modo como fuente de información de secuencia que ayuda al diseño de los elementos fundamentales de ácido nucleico que se van a mutageneizar, es decir quimerizar o barajar.
Las xilanasas y/o glucanasas de la presente invención se pueden mutageneizar de acuerdo con los métodos descritos en el presente documento.
Las secuencias de una pluralidad de moldes de ácido nucleico progenitores (por ejemplo, polinucleótidos de la invención) se pueden alienar con el fin de seleccionar uno o más puntos de demarcación, cuyos puntos de demarcación pueden estar localizados en una zona de homología. Los puntos de demarcación se pueden utilizar para delinear los límites de los elementos fundamentales del ácido nucleico que se vaya a generar. De este modo, los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos de quimerización potenciales en el ensamblaje de las moléculas progenie.
Típicamente un punto de demarcación práctico es una zona de homología (que comprende al menos una base nucleotídica homóloga) compartida por al menos dos moldes progenitores, pero el punto de demarcación puede ser una zona de homología que es compartida por al menos la mitad de los moldes progenitores, al menos dos terceras partes de los moldes progenitores, al menos tres cuartas partes de los moldes progenitores y preferentemente casi todos los moldes progenitores. Incluso más preferentemente un punto de demarcación aún más práctico es una zona de homología que es compartida por todos los moldes progenitores.
El proceso de reensamblaje de genes se puede realizar exhaustivamente con el fin de generar una biblioteca exhaustiva. En otras palabras, todas las combinaciones ordenadas posibles de elementos fundamentales de ácido nucleico están representadas en el conjunto de moléculas de ácido nucleico quiméricas finalizadas. Al mismo tiempo, el orden de ensamblaje (es decir el orden de ensamblaje de cada elemento fundamental en la secuencia 5' a 3' de cada ácido nucleico quimérico finalizado) en cada combinación es mediante diseño (o no estocástico). Debido a la naturaleza no estocástica del método, se reduce enormemente la posibilidad de productos secundarios no deseados.
5
10
15
20
25
30
35
40
45
50
55
60
65
El proceso de reensamblaje de genes se puede realizar sistemáticamente, por ejemplo para generar una biblioteca compartimentalizada sistemáticamente, con compartimentos que pueden ser escrutados sistemáticamente, por ejemplo, de uno en uno. En otras palabras, a través del uso selectivo y juicioso de elementos específicos fundamentales de ácido nucleico, acoplado al uso selectivo y juicioso de reacciones de ensamblaje recorridas sucesivamente, se puede lograr un diseño experimental en el que se elaboran conjuntos específicos de productos progenie en cada uno de los diversos recipientes de reacción. Esto permite la realización de un procedimiento sistemático de examen y detección selectiva. De este modo, estos métodos permiten examinar sistemáticamente un número potencialmente muy grande de moléculas progenie en grupos más pequeños.
Debido a su capacidad para realizar quimerizaciones de una manera que altamente flexible aunque también exhaustiva y sistemática, particularmente cuando hay un bajo nivel de homología entre las moléculas progenitoras, el método proporciona la generación de una biblioteca (o conjunto) que comprende un gran número de moléculas progenie. Debido a la naturaleza no estocástica del presente reensamblaje de genes, las moléculas progenie generadas comprenden preferentemente una biblioteca de moléculas de ácido nucleico quiméricas finalizadas que tienen un orden de ensamblaje global que se elige mediante diseño. En un aspecto concreto, tal biblioteca generada comprende más de 103 a más de 101000 especies moleculares progenie diferentes.
Un conjunto de moléculas de ácido nucleico quiméricas finalizadas, producidas como se ha descrito, puede comprender un polinucleótido que codifica un polipéptido. Este polinucleótido puede ser un gen, que puede ser un gen elaborado por el hombre. Este polinucleótido puede ser una ruta génica, que puede ser una ruta génica elaborada por el hombre. Uno o más genes elaborados por el hombre se pueden incorporar a una ruta génica elaborada por el hombre, tal como una ruta génica operable en un organismo eucariótico (incluyendo una planta).
La naturaleza sintética de la etapa en la que se generan los elementos fundamentales permite el diseño e introducción de nucleótidos (porejemplo, uno o más nucleótidos, que pueden ser, por ejemplo, codones o intrones o secuencias reguladoras) que se pueden eliminar después en un aspecto en un procedimiento in vitro (por ejemplo, mediante mutagénesis) o en un procedimiento in vivo (por ejemplo, utilizando la capacidad de empalme del gen de un organismo anfitrión). Se aprecia que en muchos casos puede ser también deseable la introducción de estos nucleótidos por otras muchas razones además del beneficio potencial de la creación de un punto de demarcación práctico.
De este modo, se puede utilizar un elemento fundamental de ácido nucleico para introducir un intrón. Por tanto, los intrones funcionales se pueden introducir en un gel elaborado por el hombre. Los intrones funcionales se pueden introducir en una ruta génica elaborada por el hombre. Esto proporciona la generación de un polinucleótido quimérico que es un gen elaborado por el hombre que contiene uno (o más) intrones introducidos artificialmente, así como la generación de un polinucleótido quimérico que forma parte de una ruta génica elaboradas por el hombre que contiene uno (o más) intrones introducidos artificialmente.
Preferentemente, el intrón o los intrones introducidos artificialmente son funcionales en una o más células huésped para el empalme de genes al igual que los intrones de origen natural sirven funcionalmente para el empalme de genes. Los polinucleótidos que contienen intrones elaborados por el hombre se pueden introducir en organismos anfitriones para la recombinación y/o el empalme.
Un gen elaborado por el hombre producido de este modo puede servir también como sustrato para la recombinación con otros ácido nucleico. Asimismo, una ruta génica elaborada por el hombre producida de este modo puede servir también como sustrato para la recombinación con otro ácido nucleico. La recombinación se puede facilitar mediante, o se produce en, zonas de homología entre el gene que contiene intrones elaborado por el hombre, y un ácido nucleico, que sirve como pareja de recombinación. La pareja de recombinación puede ser también un ácido nucleico generado mediante el método divulgado en el presente documento, incluyendo un gen elaborado por el hombre o una ruta génica elaborada por el hombre. La recombinación puede ser facilitada por, o se puede producir en zonas de homología que existen en uno (o más) intrones introducidos artificialmente en el gen elaborado por el hombre.
El método de reensamblaje sintético de genes utiliza una pluralidad de elementos fundamentales de ácido nucleico, cada uno de los cuales tiene preferentemente dos extremos ligables. Los dos extremos ligables de cada elemento fundamental del ácido nucleico puede tener dos extremos romos (i. e. cada uno tiene un saliente de cero nucleótidos), o preferentemente un extremo romo y un saliente, o aún más preferentemente dos salientes.
Un saliente útil para este fin puede ser un saliente 3' o un saliente 5'. De este modo, un elemento fundamental del ácido nucleico puede tener un saliente 3' o como alternativa un saliente 5' o como alternativa dos salientes 3' o como alternativa dos salientes 5'. El orden general en el que se ensamblan los elementos fundamentales de ácido nucleico para formar una molécula de ácido nucleico quimérico finalizada se determina mediante diseño experimental intencionado y no es aleatorio.
Un elemento fundamental del ácido nucleico se puede generar mediante síntesis química de dos ácidos nucleicos de hebra sencilla (también referidos como oligos de hebra sencilla) y poniéndolos en contacto de manera que se les permita recocerse para formar un elemento fundamental de ácido nucleico de doble hebra.
5
10
15
20
25
30
35
40
45
50
55
60
65
Un elemento fundamental de ácido nucleico de doble hebra puede tener un tamaño variable. Los tamaños de estos elementos fundamentales pueden ser pequeños o grandes. Los tamaños ilustrativos para el elemento fundamental oscilan de 1 par de bases (sin incluir ningún saliente) a 100.000 pares de bases (sin incluir ningún saliente). Se proporcionan también otros intervalos de tamaño ilustrativos, que tienen límites inferiores de 1 pb a 10.000 pb (incluyendo cada valor entero intermedio) y límites superiores de 2 pb a 100.000 pb (incluyendo cada valor entero intermedio).
Existen muchos métodos por medio de los cuales se puede generar un elemento fundamental de ácido nucleico de doble hebra que sea práctico; y éstos son conocidos en la técnica y pueden ser realizados fácilmente por el experto en la técnica.
Un elemento fundamental de ácido nucleico de doble hebra se puede generar en primer lugar dos ácidos nucleicos de hebra sencilla y permitiéndoles recocerse para formar un elemento fundamental de ácido nucleico de doble hebra. Las dos hebras de un elemento fundamental de ácido nucleico de doble hebra pueden ser complementarias a cada nucleótido aparte de cualquiera de los que forman un saliente; sin contener de este modo emparejamientos erróneos, aparte de cualquier saliente o salientes. Las dos hebras de un elemento fundamental de ácido nucleico de doble hebra pueden ser complementarias en no todos los nucleótidos aparte de cualquiera de los que forman un saliente. De este modo, se puede utilizar un elemento fundamental de ácido nucleico de hebra sencilla para introducir degeneración codónica. La degeneración codónica se puede introducir utilizando la mutagénesis de saturación de sitio descrita en el presente documento, utilizando uno o más casetes N,N,G/T o como alternativa utilizando uno o más casetes N,N,N.
El método de recombinación in vivo se puede realizar a ciegas en un agrupamiento de híbridos o alelos desconocidos de un polinucleótido o secuencia específicos. Sin embargo, no es necesario conocer la secuencia de ADN o ARN real del polinucleótido específico.
El enfoque en el que se utiliza la recombinación en una población mixta de genes puede ser útil para la generación de cualquier proteína útil, por ejemplo, interleuquina I, anticuerpos, tPA y hormona del crecimiento. Este enfoque se puede utilizar para generar proteínas que tienen especificidad o actividad alteradas. El enfoque puede ser útil también para la generación de secuencias híbridas de ácido nucleico, por ejemplo, regiones promotoras, intrones, exones, secuencias intensificadoras, regiones no traducidas 3' o regiones no traducidas 5' de genes. De este modo este enfoque se puede utilizar para generar genes que tienen tasas de expresión incrementadas. Este enfoque puede ser útil también en el estudio de secuencias repetitivas ADN. Finalmente, este enfoque puede ser útil para mutar ribozimas o aptámeros.
Los métodos descritos en el presente documento pueden estar dirigidos al uso de ciclos repetidos de reordenamiento reductivo, recombinación y selección que permiten la evolución molecular dirigida de secuencias lineales altamente complejas, tales como ADN, ARN o proteínas a través de recombinación.
Sistema de Evolución Dirigida Optimizada
Un sistema de modificación de genes no estocástico denominado "sistema de evolución dirigida optimizada" puede generar polipéptidos, por ejemplo, xilanasas o anticuerpos de la invención, con propiedades nuevas o alteradas. La evolución directa optimizada está dirigida al uso de ciclos repetidos de reorganización reductiva, recombinación y selección que permiten la evolución molecular dirigida de los ácidos nucleicos a través de recombinación. La evolución dirigida optimizada permite la generación de una gran población de secuencias quiméricas evolucionadas, donde la población generada está enriquecida significativamente en secuencias que tienen un número predeterminado de eventos de entrecruzamiento.
Un evento de entrecruzamiento es un punto en una secuencia quimérica en el que se produce un desplazamiento en la secuencia de una variante parental a otra variante parental. Tal punto se encuentra normalmente en la conexión en la que los oligonucleótidos de los dos orígenes se ligan entre sí para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de las secuencias de oligonucleótidos de manera que la población final de secuencias quiméricas está enriquecida con el número elegido de eventos de entrecruzamiento. Esto proporciona más control sobre las variantes quiméricas de elección que tienen un número predeterminado de eventos de entrecruzamiento.
Además, este método proporciona un medio conveniente para explorar una cantidad enorme del posible espacio variable de proteína en comparación con otros sistemas. Previamente, si se generaran, por ejemplo, 1013 moléculas quiméricas durante una reacción, sería extremadamente difícil someter a ensayo este alto número de variantes quiméricas para una actividad concreta. Por otra parte, una porción significativa de la población progenie tendría un número muy alto de eventos de entrecruzamiento que darían como resultado proteínas que tendrían menos probabilidad de tener aumentos de los niveles de una actividad concreta. Utilizando estos métodos, la población de moléculas quiméricas puede estar enriquecida en esas variantes que tienen un número concreto de eventos de entrecruzamiento. De este modo, aunque todavía se pudieran generar 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para un análisis adicional tendría muy probablemente, por ejemplo,
5
10
15
20
25
30
35
40
45
50
55
60
65
solo tres eventos de entrecruzamiento. Puesto que la población progenie resultante se podría desviar para que tuviera un número predeterminado de eventos de entrecruzamiento, los límites de variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número de variables más controlable cuando se calcula qué oligonucleótido de los polinucleótidos parentales originales sería responsable de la influencia en un rasgo concreto.
Un método para crear una secuencia de polinucleótidos progenie quimérica es crear oligonucleótidos correspondientes a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido incluye preferentemente una región de solapamiento única de manera que la mezcla de oligonucleótidos entre sí da como resultado una nueva variante que tiene fragmentos de oligonucleótidos ensamblados en el orden correcto. También se puede encontrar información adicional, por ejemplo, en el documento USSN 09/332.835; Patente de los Estados Unidos Núm. 6.361.974.
El número de oligonucleótidos generados para cada variante parental produce una relación con respecto al número total de entrecruzamientos resultantes en la molécula quimérica que se ha creado por último. Por ejemplo, se podrían proporcionar tres variantes de secuencias de nucleótidos parentales para que experimentaran una reacción de ligación con el fin de encontrar una variante quimérica que tuviera, por ejemplo, mayor actividad a alta temperatura. Como ejemplo, se puede generar un conjunto de 50 secuencias de oligonucleótidos correspondientes a cada una de las porciones de cada variante parental. Por lo tanto, durante el procedimiento de reensamblaje por ligación podría haber hasta 50 eventos de entrecruzamiento en cada una de las secuencias quiméricas. La probabilidad de que cada uno de los polinucleótidos quiméricos generados contenga oligonucleótidos de cada variante parental en orden alterno es muy baja. Si cada fragmento de oligonucleótido está presente en la reacción de ligación en la misma cantidad molar es probable que en algunas posiciones se liguen oligonucleótidos del mismo polinucleótido parental con otro contiguo y de este modo no se produzca un evento de entrecruzamiento. Si la concentración de cada oligonucleótido de cada progenitor se mantiene constante durante cualquier etapa de ligación en este Ejemplo, existe un tercio de probabilidades (suponiendo 3 progenitores) de que un oligonucleótido de la misma variante parental se ligue en la secuencia quimérica y no produzca entrecruzamiento.
Por lo tanto, se puede determinar la función de densidad de probabilidad (FDP) para pronosticar la población de eventos de entrecruzamiento que es probable que se produzcan durante cada etapa en una reacción de ligación dado un número establecido de variantes parentales, un número de oligonucleótidos correspondiente a cada variante, y las concentraciones de cada variante durante cada etapa en la reacción de ligación. Las estadísticas y matemáticas subyacentes a la determinación de la FPD se describen a continuación. Mediante la utilización de estos métodos, se puede calcular tal función de densidad de probabilidad, y de este modo enriquecer la población progenie quimérica para un número predeterminado de eventos de entrecruzamiento resultantes de una reacción de ligación concreta. Por otra parte, puede estar predeterminado un número objetivo de eventos de entrecruzamiento, y el sistema programado a continuación para calcular las cantidades de partida de cada oligonucleótido parental durante cada etapa en la reacción de ligación para dar como resultado una función de densidad de probabilidad que tiene como eje central el número predeterminado de eventos de entrecruzamiento. Estos métodos están dirigidos al uso de ciclos repetidos de reordenamiento reductivo, recombinación y selección que permite la evolución molecular dirigida de un ácido nucleico que codifica un polipéptido a través de recombinación. Este sistema permite la generación de una gran población de secuencias quiméricas evolucionadas, donde la población generada está enriquecida significativamente en secuencias que tienen un número predeterminado de eventos de entrecruzamiento. Un evento de entrecruzamiento es un punto en una secuencia quimérica en el que se produce un desplazamiento en la secuencia de una variante parental a otra variante parental. Tal punto se encuentra normalmente en la conexión en la que los oligonucleótidos de los dos orígenes se ligan entre sí para formar una sola secuencia. Este método permite el cálculo de las concentraciones correctas de las secuencias de oligonucleótidos de manera que la población final de secuencias quiméricas está enriquecida con el número elegido de eventos de entrecruzamiento. Esto proporciona más control sobre las variantes quiméricas de elección que tienen un número predeterminado de eventos de entrecruzamiento.
Además, estos métodos proporcionan un medio conveniente para explorar una cantidad enorme del posible espacio variable de proteína en comparación con otros sistemas. Utilizando los métodos descritos del presente documento, la población de moléculas quiméricas puede estar enriquecida para esas variantes que tienen un número concreto de eventos de entrecruzamiento. De este modo, aunque todavía se pudieran generar 1013 moléculas quiméricas durante una reacción, cada una de las moléculas elegidas para un análisis adicional tendría muy probablemente, por ejemplo, solo tres eventos de entrecruzamiento. Puesto que la población progenie resultante se podría desviar para que tuviera un número predeterminado de eventos de entrecruzamiento, los límites de variedad funcional entre las moléculas quiméricas son reducidos. Esto proporciona un número de variables más controlable cuando se calcula qué oligonucleótido de los polinucleótidos parentales originales sería responsable de la influencia en un rasgo concreto.
En un aspecto, el método crea una secuencia de polinucleótidos progenie quimérica creando oligonucleótidos correspondiente a fragmentos o porciones de cada secuencia parental. Cada oligonucleótido preferentemente incluye una única región de solapamiento de manera que la mezcla de oligonucleótidos entre sí da como resultado una nueva variante que tiene cada fragmento de oligonucleótido ensamblado en el orden correcto. Véase también el
5
10
15
20
25
30
35
40
45
50
55
60
65
documento USSN 09/332.835.
Determinación de los eventos de entrecruzamiento
Un sistema y soporte lógico reciben una función de densidad de probabilidad de entrecruzamiento (FDE), el número de genes parentales que se van a reensamblar, y el número de fragmentos en el reensamblaje como entradas. La salida de este programa es un "fragmento FDE" que se puede que se puede utilizar para determinar una receta para producir genes reensamblados, y la FDE de entrecruzamiento estimada de esos genes. El procedimiento descrito en el presente documento se realiza preferentemente en MATLAB™ (The Mathworks, Natick, Massachusetts) un lenguaje de programación y entorno de desarrollo para cálculo técnico.
Procedimientos Iterativos
Los procedimientos descritos en el presente documento se pueden repetir iterativamente. Por ejemplo, un ácido nucleico (o, el ácido nucleico) responsable de un fenotipo de xilanasa nuevo o alterado se identifica, re-aísla, se modifica de nuevo, se vuelve a someter a ensayo para determinar su actividad. Este procedimiento se puede repetir iterativamente hasta que se construya un fenotipo deseado. Por ejemplo, se puede construir una ruta bioquímica anabólica o catabólica completa en una célula, incluyendo, por ejemplo, actividad xilanasa.
De un modo similar, si se determina que un oligonucleótido concreto no afecta en absoluto al rasgo deseado (por ejemplo, un fenotipo de xilanasa), éste se puede eliminar como una variable sintetizando oligonucleótidos parentales más grandes que incluyen la secuencia que se va a eliminar. Puesto que la incorporación de la secuencia en una secuencia más grande evita cualquier evento de entrecruzamiento, no habrá ninguna variación de esta secuencia en los polinucleótidos progenie. Esta práctica iterativa para determinar cuáles oligonucleótidos está más relacionados con el rasgo deseado, y cuáles no están relacionados, permite una exploración más eficaz de las variantes de proteínas posibles podrían proporcionar un rasgo o actividad concretos.
Barajado in vivo
El barajado in vivo de moléculas se utiliza para proporcionar variantes de polipéptidos de la invención, por ejemplo, anticuerpos, xilanasas, y similares. El barajado in vivo se puede realizar utilizando la propiedad natural de las células para recombinar multímeros. Si bien la recombinación in vivo ha proporcionado la ruta natural principal para la diversidad molecular, la recombinación genética sigue siendo un procedimiento relativamente complejo que implica
1) el reconocimiento de homologías; 2) escisión de la hebra, invasión de la hebra, y etapas metabólicas que conducen a la producción de un quiasma recombinante; y finalmente 3) la resolución del quiasma a moléculas recombinadas discretas. La formación del quiasma requiere el reconocimiento de secuencias homólogas.
Un polinucleótido híbrido se puede producir a partir de al menos un primer polinucleótido y un segundo polinucleótido que pueden compartir al menos una región de homología parcial de la secuencia y se introducen en una célula huésped adecuada. Las regiones de homología de secuencia parcial promueven procedimientos que dan como resultado reorganización de secuencia produciendo un polinucleótido híbrido. El término "polinucleótido híbrido", según se utiliza del presente documento, es cualquier secuencia de nucleótidos que resulta del método de la divulgación y contiene secuencias de al menos dos secuencias de polinucleótidos. Tales polinucleótido híbridos pueden resultar de eventos de recombinación intermoleculares que promueven la integración de secuencias entre moléculas de ADN. Además, tales polinucleótidos híbridos pueden resultar de procedimientos de reordenamiento reductivo intramolecular que utilizan secuencias repetidas para alterar una secuencia de nucleótidos en una molécula de ADN.
El reordenamiento in vivo está centrado en procedimientos "inter-moleculares" referidos colectivamente como "recombinación" que en bacterias, es considerado generalmente como un fenómeno "dependiente de RecA". Los métodos divulgados en el presente documento pueden basarse en procedimientos de recombinación de una célula huésped para recombinar y reordenar secuencias, o la capacidad de las células para mediar procedimientos reductivos para reducir la complejidad de las secuencias cuasi repetidas en la célula mediante deleción. Este procedimiento de "reordenamiento reductivo" se produce mediante un procedimiento "intra-molecular", independiente de RecA.
Por lo tanto, se pueden generar polinucleótidos novedosos mediante el procedimiento de reordenamiento reductivo. El método implica la generación de construcciones que contienen secuencias consecutivas (secuencias codificantes originales), su inserción en un vector apropiado y su posterior introducción en una célula huésped apropiada. El reordenamiento de las entidades moleculares individuales se produce mediante procedimientos combinatorios entre las secuencias consecutivas en la construcción que posee regiones de homología, o entre unidades cuasi repetidas. El procedimiento de reordenamiento recombina y/o reduce la complejidad y la extensión de las secuencias repetidas y da como resultado la producción de especies moleculares novedosas. Se pueden aplicar diversos tratamientos para aumentar la velocidad de reordenamiento. Estos podrían incluir tratamiento con luz ultravioleta, o agentes químicos que dañan el ADN y/o el uso de líneas de células huésped que despliegan niveles incrementados de "inestabilidad genética". De este modo el procedimiento de reordenamiento puede implicar recombinación homóloga
5
10
15
20
25
30
35
40
45
50
55
60
65
o la propiedad natural de las secuencias cuasi repetidas para dirigir su propia evolución.
Las secuencias repetidas o "cuasi repetidas" juegan un papel en la inestabilidad genética. Las "cuasi-repeticiones" son repeticiones que no están restringidas a su estructura unitaria original. Las unidades cuasi repetidas se pueden presentar como una matriz de secuencias en una construcción; unidades consecutivas de secuencias similares. Una vez ligadas, las conexiones entre las secuencias consecutivas se hacen esencialmente invisibles y la naturaleza cuasi repetitiva de la construcción resultante es ahora continua a nivel molecular. El procedimiento de deleción que realiza la célula para reducir la complejidad de la construcción resultante funciona entre las secuencias cuasi repetidas. Las unidades cuasi repetidas proporcionas un repertorio prácticamente ilimitado sobre los cuales pueden ocurrir eventos de deslizamiento. Las construcciones que contienen las cuasi repeticiones proporcionan de este modo eficazmente suficiente elasticidad molecular como para que puedan ocurrir eventos de deleción (y potencialmente inserción) virtualmente en cualquier parte en las unidades cuasi repetitivas.
Cuando las secuencias cuasi repetidas están ligadas todas en la misma orientación, por ejemplo cabeza a cola o viceversa, la célula no puede distinguir las unidades individuales. Por consiguiente, el procedimiento reductivo puede ocurrir por todas las secuencias. En contraste, cuando por ejemplo, las unidades se presentan cabeza a cabeza, en lugar de cabeza a cola, la inversión perfila los extremos de la unidad adyacente de manera que la formación de la deleción favorecerá la pérdida de unidades discretas. De este modo, es preferible con el presente método que las secuencias se encuentren en la misma orientación. La orientación aleatoria de secuencias cuasi repetidas dará como resultado la pérdida de eficacia de reordenamiento, mientras que la orientación uniforme de las secuencias ofrecerá la mayor eficacia. Sin embargo, si bien la posesión de menos secuencias contiguas en la misma orientación reduce la eficacia, aún puede proporcionar suficiente elasticidad para la recuperación eficaz de las moléculas novedosas. Las construcciones se pueden elaborar con las secuencias cuasi repetidas en la misma orientación para permitir una mayor eficacia.
Las secuencias se pueden ensamblar en una orientación cabeza a cola utilizando cualquiera de una variedad de métodos, incluyendo los siguientes:
a) Se pueden utilizar cebadores que incluyen una cabeza poli-A y una cola poli-T que cuando se elaboran de hebra sencilla proporcionan orientación. Esto se logra elaborando a partir de ARN las primeras pocas bases de los cebadores y por tanto eliminándolas fácilmente con ARNasa H.
b) Se pueden utilizar cebadores que incluyen sitios de escisión por restricción únicos. Se requerirían sitios múltiples, una batería de secuencias únicas y etapas de ligación y síntesis repetidas.
c) Las pocas bases internas del cebador podrían estar tioladas y se utilizaría una exonucleasa para producir las moléculas apropiadamente dotadas de cola.
La recuperación de las secuencias se basa en la identificación de vectores de clonación con un índice repetitivo reducido (IR). Las secuencias codificantes reordenadas se pueden recuperar de este modo mediante amplificación. Los productos se vuelven a clonar y a expresar. La recuperación de los vectores de clonación con IR reducido se puede efectuar mediante:
1) El uso de vectores solo mantenidos establemente cuando la construcción se reduce en complejidad.
2) La recuperación física de los vectores acortados mediante procedimientos físicos. En este caso, el vector de clonación sería recuperado utilizando procedimientos de aislamiento de plásmidos convencionales y se fraccionaría su tamaño en gel de agarosa, o una columna con un bajo peso molecular de corte utilizando procedimientos convencionales.
3) La recuperación de vectores que contienen genes interrumpidos se puede seleccionar cuando el tamaño del inserto disminuye.
4) El uso de técnicas de selección directa con un vector de expresión y la selección apropiada.
Las secuencias codificantes (por ejemplo, genes) de organismos relacionados pueden mostrar un alto grado de homología y codifican productos proteicos bastante diversos. Estos tipos de secuencias son particularmente útiles en forma de cuasi repeticiones. Sin embargo, mientras que los Ejemplos ilustrados a continuación demuestran el reordenamiento de secuencias codificantes originales casi idénticas (cuasi repeticiones), este procedimiento no está limitado a tales repeticiones idénticas.
Se describen las secuencias codificantes de ácido nucleico (cuasi repeticiones) derivadas de tres (3) especies únicas. Cada secuencia codifica una proteína con un conjunto de propiedades distintas. Cada una de las secuencias difiere en uno o unos pocos pares de bases en una única posición de la secuencia. Las secuencias cuasi repetidas se amplifican y se ligan separadamente o colectivamente en ensamblajes aleatorios de manera que estén disponibles todas las permutaciones y combinaciones posibles en la población de moléculas ligadas. El número de unidades cuasi repetidas puede estar controlado por las condiciones de ensamblaje. El número medio de unidades cuasi repetidas en una construcción se define como el índice repetitivo (IR).
Una vez formados, las construcciones pueden ser fraccionadas, o no, por tamaño en un gel de agarosa de acuerdo con los protocolos publicados, insertados en un vector de clonación y transfectados en una célula huésped
5
10
15
20
25
30
35
40
45
50
55
60
65
apropiada. Las células se propagan a continuación y se efectúa el "reordenamiento reductivo". La velocidad del procedimiento de reordenamiento reductivo se puede estimular mediante la introducción de desperfectos en el ADN si se desea. El que la reducción del IR esté mediada por la formación de deleción entre secuencias repetidas por medio de un mecanismo "intra-molecular", o mediada por eventos de tipo recombinación a través de mecanismos "intermoleculares" es irrelevante. El resultado final es un reordenamiento de las moléculas en todas las combinaciones posibles.
El método puede comprender la etapa adicional de detección selectiva de los miembros de la biblioteca de la reserva barajada para identificar miembros de la biblioteca barajados individuales que tienen la capacidad de unirse o interactuar de otro modo, o catalizar una reacción concreta (por ejemplo, tal como el dominio catalítico de una enzima) con una macromolécula predeterminada, tal como por ejemplo un receptor proteinaceo, un oligosacárido, virión, u otro compuesto o estructura predeterminados.
Los polipéptidos que se identifican a partir de tales bibliotecas se pueden utilizar para fines terapéuticos, diagnósticos, de investigación y propósitos relacionados (por ejemplo, catalizadores, solutos para incrementar la osmolaridad de una solución acuosa y similares) y/o se puede someter a uno o más ciclos de barajado y/o selección adicionales.
Se prevé que antes de o durante la recombinación o el reordenamiento, los polinucleótidos generados se puedan someter a agentes o procedimientos que promuevan la introducción de mutaciones en los polinucleótidos originales. La introducción de tales mutaciones aumentaría la diversidad de los híbridos polinucleotídico resultantes y los polipéptidos codificados de allí. Los agentes o procedimientos que promueven la mutagénesis pueden incluir, pero no están limitados a: (+)-CC-1065, o un análogo sintético tal como (+)-CC-1065-(N3-Adenina) (Véase Sun y Hurley, (1992)); un aducto de 4'-fluro-4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (Véase, por ejemplo, van de Poll et al. (1992)); o un aducto de 4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (Véase también, van de Poll et al. (1992), págs. 751-758); cromo trivalente, una sal de cromo trivalente, un hidrocarburo aromático policíclico (HAP), un aducto de ADN capaz de inhibir la replicación de ADN, tal como 7-bromometilbenz[a]antraceno ("BMA"), tris(2,3-dibromopropil)fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano ("DBCP"), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido ("BPDE"), una sal halogenada de platino(II), N-hidroxi-2-amino-3-metilimidazo[4,5-f]-quinolina ("N-hidroxi-IQ") y N-hidroxi-2-amino-1-metil-6- fenilimidazo[4,5-f]-piridina ("N-hidroxi-PhIP"). Los medios ilustrativos para ralentizar o detener la amplificación mediante pCr consisten en luz UV (+)-CC-1065 y (+)-CC-1065-(N3-Adenina). Los medios incluidos particularmente son los aductos de ADN o polinucleótidos que comprenden los aductos de ADN de los polinucleótidos o reservas de polinucleótidos, que se pueden liberar o eliminar mediante un procedimiento que incluye calentar la solución que comprende los polinucleótidos antes de su procesamiento adicional.
Las proteínas recombinantes que tienen actividad biológica se pueden producir mediante tratamiento de una muestra que comprende polinucleótidos molde de doble hebra que codifican una proteína de tipo silvestre en condiciones que proporcionan la producción de polinucleótidos híbridos o reordenados.
Producción de secuencias variantes
Se pueden usar métodos adicionales para elaborar secuencia variantes de las secuencias de ácido nucleico (por ejemplo, xilanasa) de la invención, o para el aislamiento de xilanasas utilizando los ácidos nucleicos y polipéptidos de la invención. Las variantes de una secuencia codificante de xilanasa (por ejemplo, un gen, ADNc o mensaje) de la invención, se pueden alterar mediante cualquier método, incluyendo, por ejemplo, métodos aleatorios o estocásticos, o, métodos no estocásticos, o de "evolución dirigida", como se ha descrito anteriormente.
Las variantes aisladas pueden ser origen natural. También se pueden crear variantes in vitro. Las variantes se pueden crear utilizando técnicas de ingeniería genética tales como mutagénesis dirigida al sitio, mutagénesis química al azar, procedimientos de deleción con Exonucleasa III, y técnicas de clonación convencionales. Como alternativa, tales variantes, fragmentos, análogos, o derivados se pueden crear utilizando procedimientos de síntesis o modificación química. Otros métodos para elaborar variantes son también familiares para los expertos en la técnica. Estos incluyen procedimientos en los que las secuencias de ácidos nucleicos obtenidas de aislados naturales se modifican para generar nuevos ácidos nucleicos que codifican polipéptidos que tienen características que aumentan su valor en procesamiento industrial, médico, de laboratorio (investigación), farmacéutico, alimentos y piensos y alimentos y suplementos de alimentos y piensos, y otras aplicaciones y procesos. En tales procedimientos, se generan y caracterizan un gran número de secuencias variantes que tienen una o más diferencias de nucleótidos con respecto a la secuencia obtenida a partir del producto aislado natural. Estas diferencias de nucleótidos pueden dar como resultado cambios de aminoácidos con respecto a los polipéptidos codificados por los ácidos nucleicos de los productos aislados naturales.
Por ejemplo, se pueden crear variantes utilizando PCT propensa a error. En la PCR propensa a error, la PCR se realiza en condiciones en las que la fidelidad de la copia de la ADN polimerasa es baja, de manera que se obtiene un alta tasa de mutaciones puntuales a lo largo de toda la longitud del producto de pCr. La PCR propensa a error es descrita, por ejemplo, por Leung, D.W., et al., en Technique, 1:11-15, 1989) y Caldwell, R. C. & Joyce G.F., PCR
5
10
15
20
25
30
35
40
45
50
55
60
65
Methods Applic., 2:28-33, 1992. En resumen, tales procedimientos, los ácidos nucleicos que se van a mutageneizar se mezclan con cebadores para PCR, tampón de reacción, MgCh, MnCh, polimerasa Taq y una concentración apropiada de dNTPs para lograr una alta la velocidad de mutación puntual a lo largo de la longitud completa del producto de PCR. Por ejemplo, la reacción se puede realizar utilizando 20 fmoles del ácido nucleico que se va a mutageneizar, 30 pmoles de cada cebador de PCR, un tampón de reacción que comprende KCl 50 mM, Tris HCl 10 mM (pH 8.3) y gelatina al 0,01 %, MgCh 7 mM, MnCh 0,5 mM, 5 unidades de polimerasa Taq, dGTP 0,2 mM, dATP 0,2 mM, dCTP 1 mM, y dTTP 1 mM. La PCR se puede realizar durante 30 ciclos de 94°C durante 1 min, 45 °C durante 1 min, y 72°C durante 1 min. Sin embargo, se apreciará que estos parámetros pueden variarse según sea apropiado. Los ácidos nucleicos mutagenizados se clonan en un vector apropiado y se evalúan las actividades de los polipéptidos codificados por los ácidos nucleicos mutagenizados.
También se pueden crear variantes utilizando mutagénesis dirigida a oligonucleótidos para generar mutaciones de sitio específico en cualquier ADN clonado de interés. La mutagénesis de oligonucleótidos la describen, por ejemplo, Reidhaar-Olson (1988) en Science 241:53-57. En resumen, en tales procedimientos se sintetiza una pluralidad de oligonucleótidos de doble hebra que portan una o más mutaciones que se van a introducir en el ADN clonado y se inserta en el ADN clonado que se va a mutageneizar. Los clones que contienen el ADN mutagenizado se recuperan y se evalúan las actividades de los polipéptidos que codifican.
Otro método para generar variantes es la PCR de ensamblaje. La PCR de ensamblaje implica el ensamblaje de un producto de PCR a partir de una mezcla de fragmentos pequeños de ADN. Se producen en paralelo un gran número de reacciones PCR diferentes en el mismo vial, primando los productos de una reacción sobre los productos de otra reacción. La PCR de ensamblaje se describe, por ejemplo, en la Patente de los Estados Unidos Núm. 5.965.408.
Otro método para generar variantes es la mutagénesis por PCR sexual. En la mutagénesis por PCR sexual, se produce la recombinación homóloga forzada entre moléculas de ADN de secuencias de ADN diferentes pero íntimamente relacionadas in vitro, como resultado de la fragmentación al azar de la molécula de ADN basada en la homología de la secuencia, seguido de fijación del entrecruzamiento por extensión de cebador en una reacción PCR. La mutagénesis por PCR sexual la describe, por ejemplo, Stemmer (1994) en Proc. Natl. Acad. Sci. USA 91:10747-10751. En resumen, en tales procedimientos se digiere con ADNasa una pluralidad de ácidos nucleicos que se van a recombinar para generar fragmentos que tienen un tamaño medio de 50-200 nucleótidos. Los fragmentos de tamaño medio deseado se purifican y resuspenden una mezcla para PCR. La PCR se lleva a cabo en condiciones que faciliten la recombinación entre los fragmentos de ácido nucleico. Por ejemplo, la PCR se puede realizar suspendiendo los fragmentos purificados a una concentración de 10-30 ng/pl en una solución 0,2mM de cada dNTP, MgCh 2,2 mM, KCl 50 mM, Tris HCl 10 mM, pH 9,0, y Triton X-100 al 0,1 %. Se añaden 2,5 unidades de polimerasa Taq por 100:1 de mezcla de reacción y la PCR se realiza utilizando del siguiente régimen: 94°C durante 60 segundos, 94°C durante 30 segundos, 50-55 °C durante 30 segundos, 72°C durante 30 segundos (30-45 veces) y 72°C durante 5 minutos. Sin embargo, se apreciará que estos parámetros se pueden variar según sea apropiado. En algunos aspectos, se pueden incluir oligonucleótidos en las reacciones PCR. En otros aspectos, se puede utilizar el fragmento de Klenow de ADN polimerasa I en un primer grupo de reacciones PCR y se puede utilizar polimerasa Taq en un grupo de reacciones posterior. Las secuencias recombinantes se aíslan y se evalúan las actividades de los polipéptidos que codifican.
También se pueden crear variantes mediante mutagenésis in vivo. En algunos aspectos, se generan mutaciones al azar en una secuencia de interés propagando la secuencia de interés en una cepa bacteriana, tal como una cepa de E. coli, que porta mutaciones en uno o más de las rutas de reparación del ADN. Tales cepas "mutadoras" tienen una tasa de mutación aleatoria más alta que un progenitor de tipo silvestre. La propagación del ADN en una de estas cepas generará finalmente mutaciones al azar en el ADN. Las cepas mutadoras adecuadas para su uso para la mutagenésis in vivo se describen en la Publicación PCT Núm. WO 91/16427, publicada el 31 de Octubre de 1991, titulada "Methods for Phenotype Creation from Multiple Gene Populations".
También se pueden generar variantes utilizando mutagenésis por inserción de casetes. En la mutagenésis por inserción de casetes una pequeña región de una molécula de ADN de doble hebra se remplaza por un "casete" de oligonucleótido sintético que difiere de la secuencia nativa. El oligonucleótido contiene con frecuencia una secuencia nativa completamente y/o parcialmente aleatorizada.
También se puede utilizar mutagénesis recursiva de conjunto para generar variantes. La mutagénesis recursiva de conjunto es un algoritmo para construir proteínas (mutagénesis de proteínas) desarrollado para producir poblaciones diversas de mutantes relacionados fenotípicamente cuyos miembros difieren en la secuencia de aminoácidos. Este método utiliza un mecanismo de retroalimentación para controlar las rondas sucesivas de mutagenésis combinatoria por inserción de casetes. La mutagénesis recursiva de conjunto es descrita por Arkin, A.P. y Youvan, D.C., PNAS, USA, 89:7811-7815, 1992.
En algunos aspectos, la variantes se crean utilizando mutagenésis de conjunto exponencial. La mutagénesis de conjunto exponencial es un procedimiento para generar bibliotecas combinatorias con un alto porcentaje de mutantes únicos y funcionales, donde se asignan al azar en paralelo grupos de residuos para identificar, en cada posición alterada, los aminoácidos que conducen a proteínas funcionales. La mutagénesis de conjunto exponencial
5
10
15
20
25
30
35
40
45
50
55
60
65
es descrita por Delegrave, S. y Youvan, D.C., en Biotechnology Research, 11:1548-1552, 1993. Las mutagénesis al azar y dirigida al sitio son descritas por Arnold, F.H., en Current Opinion in Biotechnology, 4:450-455, 1993.
Las variantes se pueden crear utilizando procedimientos de barajado donde porciones de una pluralidad de ácidos nucleicos que codifican polipéptidos distintos se fusionan entre sí para crear secuencias de ácidos nucleicos quiméricas que codifican polipéptidos quiméricos como se describe en La Patente de los Estados Unidos Núm. 5.965.408, presentada el 9 de Julio de 1996, titulada, "Method of ADN Reassembly by Interrupting Synthesis" y la Patente de los Estados Unidos Núm. 5.939.250, presentada el 22 de May de 1996, titulada, "Producción of Enzymes Having Desired Activities by Mutagénesis".
Las variantes de los polipéptidos de la invención pueden ser variantes en las que uno o más de los residuos de aminoácidos de los polipéptidos de la invención son sustituidos por residuo de aminoácido conservado o no conservado (preferentemente un residuo de aminoácido conservado) y tal residuo de aminoácido sustituido puede ser uno codificado o no por el código genético.
Las sustituciones conservadoras son aquellas que sustituyen un aminoácido dado en un polipéptido por otro aminoácido de características parecidas. Las sustituciones consideradas generalmente como conservadoras son los siguientes remplazos: remplazos de un aminoácido alifático tal como Alanina, Valina, Leucina e Isoleucina por otro aminoácido alifático; remplazo de una Serina por una Treonina o vice versa; remplazo de un residuo ácido tal como ácido Aspártico y ácido Glutámico por otro residuo ácido; remplazo de un residuo que porta un grupo amida, tal como Asparragina y Glutamina, por otro residuo que porta un grupo amida; intercambio de un residuo alcalino tal como Lisina y Arginina por otro residuo alcalino; y remplazo de un residuo aromático tal como Fenilalanina, Tirosina por otro residuo aromático.
Otras variantes son aquellas en las que uno o más de los residuos de aminoácidos de los polipéptidos de la invención incluyen un grupo sustituyente.
Otras variantes más son aquellas en las que el polipéptido está asociado con otro compuesto, tal como un compuesto para incrementar la vida media del polipéptido (por ejemplo, polietilenglicol).
Son variantes adicionales aquellas en las que se fusionan al polipéptido aminoácidos adicionales, tal como una secuencia líder, una secuencia secretora, una secuencia de proproteína o una secuencia que facilita la purificación, el enriquecimiento, o la estabilización del polipéptido.
Los fragmentos, derivados y análogos pueden conservar la misma función o actividad biológica que los polipéptidos de la invención y secuencias sustancialmente idénticas a estas. O el fragmento, derivado, o análogo incluye una proproteína, de manera que el fragmento, el derivado, o el análogo se puedan activar mediante escisión de la porción proproteína para producir un polipéptido activo.
Optimización de codones para lograr altos niveles de expresión de proteínas en células huésped
Los métodos para modificar los ácidos nucleicos que codifican la xilanasa pueden ser para incrementar o disminuir su expresión en una célula huésped. Los ácidos nucleicos pueden codificar una xilanasa modificada para incrementar su expresión en una célula huésped. El método comprende identificar un codón "no preferido" o "menos preferido" en el ácido nucleico codificante de la xilanasa y remplazar uno o más de esos codones no preferidos o menos preferidos por un "codón preferido" que codifica el mismo aminoácido que el codón remplazado y remplazar al menos un codón no preferido o menos preferido en el ácido nucleico por un codón preferido que codifica el mismo aminoácido. Un codón preferido es un codón representado en exceso en secuencias codificantes en genes en la célula huésped y un codón no preferido o menos preferido es un codón infrarrepresentado en secuencias codificantes en genes en la célula huésped.
Las células huésped para expresar células los ácidos nucleicos, casetes de expresión y vectores de la invención incluyen bacterias, levadura, hongos, células vegetales, células de insecto y células de mamífero. Las células huésped de ejemplo incluyen bacterias gram negativas, tales como Escherichia coli y Pseudomonas fluorescens; bacterias gram positives, tales como Streptomyces diversa, Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis. Las células huésped ilustrativas también incluyen organismos eucarióticos, por ejemplo, diversas levaduras, tales como Saccharomyces sp., incluyendo Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris, y Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger, y células mamífero y células y líneas celulares de insecto.
Por ejemplo, los codones de un ácido nucleico que codifica una xilanasa aislado de una célula bacteriana se modifican de manera que el ácido nucleico sea expresado óptimamente en una célula bacteriana diferente de la bacteria de la que derivó la xilanasa, una levadura, un hongo, una célula vegetal, una célula de insecto o una célula de mamífero. Los métodos para optimizar codones son bien conocidos en la técnica, véase, por ejemplo, la Patente de los Estados Unidos Núm. 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998) Protein Expr. Purif. 12:185-188; Narum (2001) Infect. Immun. 69:7250-7253. Véase también Narum (2001) Infect. Immun. 69:7250-7253,
5
10
15
20
25
30
35
40
45
50
55
60
65
que describe codones de optimización en sistemas de ratón; Outchkourov (2002) Protein Expr. Purif. 24:18-24, que describe codones de optimización en levaduras; Feng (2000) Biochemistry 39:15399-15409, que describen codones de optimización en E. coli; Humphreys (2000) Protein Expr. Purif. 20:252-264, que describen el uso de un codón de optimización que afecta a la secreción en E. coli.
Animales no humanos transgénicos
La invención proporciona animales no humanos transgénicos que comprenden un ácido nucleico, un polipéptido (por ejemplo, una xilanasa), un casete de expresión o vector o una célula transfectada o transformada de la invención.
Los animales no humanos transgénicos pueden ser, por ejemplo, cabras, conejos, ovejas, cerdos, vacas, ratas, caballos, perros, peces y ratones, que comprenden los ácidos nucleicos de la invención. Estos animales se pueden utilizar, por ejemplo, como modelos in vivo para estudiar la actividad xilanasa, o, como modelos para cribar agentes que cambian la actividad xilanasa in vivo. Las secuencias codificantes de los polipéptidos que se van a expresar en los animales no humanos transgénicos se pueden diseñar para que sean constitutivas, o, estén bajo el control de factores reguladores transcripcionales específicos de tejido, específicos del desarrollo o inducibles. Los animales no humanos transgénicos se pueden diseñar y generar utilizando cualquier método conocido en la técnica; véanse, por ejemplo, las Patentes de los Estados Unidos Núms. 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166; 6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698; 5.639.940; 5.573.933; 5.387.742; 5.087.571, que describen elaboran y utilizan células transformadas y huevos y ratones, ratas, conejos, ovejas, cerdos, pollos, cabras, peces y vacas transgénicos. Véase también, por ejemplo, Pollock (1999) J. Immunol. Methods 231:147-157, que describe la producción de proteínas recombinantes en la leche de animales productores de leche transgénicos; Baguisi (1999) Nat. Biotechnol. 17:456-461, que demuestra la producción de cabras transgénicas. La Patente de los Estados Unidos Núm. 6.211.428, describes la realización y utilización de mamíferos no humanos transgénicos que expresan en sus cerebros una construcción de ácido nucleico que comprende una secuencia de ADN. La Patente de los Estados Unidos Núm. 5.387.742, describe la inyección de secuencias ADN recombinante o sintético clonadas en huevos de ratón fertilizados, la implantación de los huevos inyectados en hembras pseudo-preñadas, y el crecimiento a largo plazo de ratones transgénicos cuyas células expresan proteínas relacionadas con la patología de la enfermedad de Alzheimer. La Patente de los Estados Unidos Núm. 6.187.992, describe la elaboración y utilización de un ratón transgénico cuyo genoma comprende una interrupción del gen codificante de la proteína precursora del amiloide (PPA).
También se pueden utilizar "animales defectivos". Por ejemplo, los animales transgénicos o modificados de la invención comprenden un "animal defectivo", por ejemplo, un "ratón defectivo", construido para no expresar un gen endógeno, que es remplazado por un gen que expresa una xilanasa de la invención, o, una proteína de fusión que comprende una xilanasa de la invención.
Plantas y Semillas Transgénicas
La invención proporciona planta y semillas transgénicas que comprenden un ácido nucleico, un polipéptido (una xilanasa), un casete de expresión o vector o una célula transfectada o transformada de la invención. La invención también proporciona productos o subproductos de plantas, por ejemplo, frutas, aceites, semillas, hojas, extractos y similares, incluyendo cualquier parte de planta, que comprende un ácido nucleico y/o un polipéptido (una xilanasa) de la invención, por ejemplo, donde el ácido nucleico o polipéptido de la invención es heterólogo para la planta, parte de la planta, semilla, etc. La planta transgénica (que incluye partes de planta, frutos, semillas etc.) puede ser dicotiledónea (dos cotiledones) o monocotiledónea (un cotiledón). La invención también proporciona métodos para elaborar y utilizar estas plantas y semillas transgénicas. La planta o célula vegetal transgénicas que expresan un polipéptido de la presente invención se pueden construir de acuerdo con cualquier método conocido en la técnica. Véase, por ejemplo, la Patente de los Estados Unidos Núm. 6.309.872.
Los ácidos nucleicos y construcciones de expresión de la invención se pueden introducir en una célula vegetal por medio de cualquier método. Por ejemplo, los ácidos nucleicos o construcciones de expresión se pueden introducir en el genoma de una planta anfitriona deseada, o, los ácidos nucleicos o construcciones de expresión pueden ser episomas. La introducción en el genoma de una planta deseada puede ser de manera que la producción de xilanasa por el anfitrión esté regulada por elementos de control de la transcripción o la traducción endógenos. La invención también proporciona "plantas defectivas" donde la inserción de la secuencia génica, por ejemplo, mediante recombinación homóloga, ha interrumpido la expresión del gen endógeno. Los medios para generar plantas "defectivas" son bien conocidos en la técnica, véase, por ejemplo, Strepp (1998) Proc Natl. Acad. Sci. USA 95:4368- 4373; Miao (1995) Plant J 7:359-365. Véase la discusión sobre plantas transgénicas, a continuación.
Los ácidos nucleicos de la invención se pueden utilizar para conferir rasgo deseados a esencialmente cualquier planta, por ejemplo, a plantas que producen almidón, tales como la patata, el trigo, el arroz, la cebada, y similares. Los ácidos nucleicos de la invención se pueden utilizar para manipular las rutas metabólicas de una planta con el fin de optimizar o alterar la expresión en el anfitrión de la xilanasa. Estos pueden cambiar la actividad xilanasa en una planta. Como alternativa, una xilanasa de la invención se puede utilizar en la producción de una planta transgénica para producir un compuesto no producido naturalmente por esa planta. Esto puede reducir los costes de producción
5
10
15
20
25
30
35
40
45
50
55
60
65
o crear un producto novedoso.
La primera etapa en la producción de una planta transgénica implica elaborar una construcción de expresión para su expresión en una célula vegetal. Estos mecanismos son bien conocidos en la técnica. Pueden incluir seleccionar y clonar un promotor, una secuencia codificante para facilitar la unión eficaz de los ribosomas al ARNm y seleccionar las secuencias terminadoras de genes apropiadas. Un promotor constitutivo ilustrativo es CaMV35S, del virus del mosaico de la coliflor, que generalmente da como resultado un alto grado de expresión en plantas. Otros promotores son más específicos y responden a indicaciones en el entorno interno o externo de la planta. Un promotor inducible por luz ilustrativo es el promotor del gen cab, codificante de la proteína de unión a clorofila a/b grande.
El ácido nucleico puede modificarse para lograr una mayor expresión en una célula vegetal. Por ejemplo, es probable que una secuencia de la invención tenga un mayor porcentaje de pares de nucleótidos A-T en comparación con el observado en una planta, algunas de las cuales prefieren pares de nucleótidos G-C. Por lo tanto, los nucleótidos A-T en la secuencia codificante pueden ser sustituidos por nucleótidos G-C sin cambiar significativamente la secuencia de aminoácidos para potenciar la producción del producto génico en las células vegetales.
Se pueden añadir genes con marcadores seleccionables a la construcción génica con el fin de identificar células vegetales o tejidos que tengan integrado el transgén satisfactoriamente. Esto puede ser necesario puesto que lograr la incorporación y expresión de genes en células vegetales es un evento raro, que ocurre solo en un pequeño porcentaje de tejidos o células diana. Los genes marcadores seleccionables codifican proteínas que proporcionan resistencia a agentes que son normalmente tóxicos para las plantas, tales como antibióticos o herbicidas. Únicamente las células vegetales que tienen integrado el gen marcador seleccionable sobrevivirán cuando crezcan sobre un medio que contiene el antibiótico o herbicida apropiado. Como para los otros genes insertados, los genes marcadores también requieren secuencias promotoras y de terminación para su funcionamiento apropiado.
La elaboración de plantas o semillas transgénicas comprende la incorporación de secuencias de la invención y, en un aspecto (opcionalmente), genes marcadores a una construcción de expresión diana (por ejemplo, un plásmido), junto con la colocación de las secuencias promotoras y terminadoras. Esto puede implicar la transferencia del gen modificado a la planta a través de un método adecuado. Por ejemplo, se puede introducir una construcción directamente en el ADN genómico de la célula vegetal utilizando técnicas tales como electroporación y microinyección de protoplastos de células vegetales, o las construcciones se pueden introducir directamente en tejidos vegetales utilizando métodos balísticos, tales como bombardeo de partículas de ADN. Por ejemplo, véase, por ejemplo, Christou (1997) Plant Mol. Biol. 35:197-203; Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73; Takumi (1997) Genes Genet. Syst. 72:63-69, que discute el uso de bombardeo de partículas para introducir transgenes en trigo; y Adam (1997) supra, para el uso de bombardeo de partículas para introducir YAC en células vegetales. Por ejemplo, Rinehart (1997) supra, utilizó bombardeo de partículas para generar plantas de algodón transgénicas. El aparato para acelerar partículas se describe en la Patente de los Estados Unidos Núm. 5.015.580; y, aparato de aceleración de partículas BioRad (Biolistics) PDS-2000 asequible comercialmente; véanse también, John, patente de los Estados Unidos Núm. 5.608.148; y Ellis, patente de los Estados Unidos Núm. 5.681.730, que describen la transformación mediada por partículas de gimnospermas.
Los protoplastos se pueden inmovilizar y se les pueden inyectar ácidos nucleicos, por ejemplo, una construcción de expresión. Aunque la regeneración de plantas a partir de protoplastos no es fácil con cereales, es posible la regeneración de plantas en legumbres utilizando embriogénesis somática de callos derivados de protoplastos. Los tejidos organizados se pueden transformar con ADN desnudo utilizando la técnica de la pistola génica, en la que el ADN se aplica como recubrimiento sobre microproyectiles de tungsteno, disparo 1/1002 del tamaño de las células, que transporta el ADN profundamente a las células u orgánulos. Se induce a continuación la regeneración del tejido transformado, usualmente mediante embriogénesis somática. Esta técnica ha resultado satisfactoria en diversas especies de cereales incluyendo maíz y arroz.
También se pueden introducir ácidos nucleicos, por ejemplo, construcciones de expresión, en células vegetales utilizando virus recombinantes. Se pueden transformar células vegetales utilizando vectores virales, tales como, por ejemplo, vectores derivados del virus del mosaico del tabaco (Rouwendal (1997) Plant Mol. Biol. 33:989-999), véase Porta (1996) "Use of viral replicons for the expresion of genes in plants", Mol. Biotechnol. 5:209-221.
Como alternativa, se pueden combinar ácidos nucleicos, por ejemplo, una construcción de expresión, con regiones flanqueantes de ADN-T adecuadas e introducir en un vector anfitrión de Agrobacterium tumefaciens convencional. Las funciones de virulencia del anfitrión Agrobacterium tumefaciens dirigirá la inserción de la construcción y el marcador adyacente en el ADN de la célula vegetal cuando la célula es infectada por la bacteria. Las transformaciones técnicas mediadas por Agrobacterium tumefaciens, incluyendo el desarme y uso de vectores binarios, están bien descritas en la bibliografía científica. Véase, por ejemplo, Horsch (1984) Science 233:496-498; Fraley (1983) Proc. Natl. Acad. Sci. USA 80:4803 (1983); Gene Transferto Plants, Potrykus, ed. (Springer-Verlag, Berlin 1995). El ADN en una célula de A tumefaciens están contenido en el cromosoma bacteriano así como en otra estructura conocida como plásmido Ti (inductor de tumor). El plásmido Ti contiene un tramo de ADN denominado ADN T (-20 kb de longitud) que es transferido a célula vegetal en el procedimiento de infección y una serie de genes
5
10
15
20
25
30
35
40
45
50
55
60
65
vir (virulencia) que dirige el procedimiento de infección. A. tumefaciens puede infectar solo una planta a través de heridas: cuando una raíz o tallo de una planta se hiere produce ciertas señales químicas, en respuesta a la cual, los genes vir de A. tumefaciens se activan y dirigen una serie de eventos necesarios para la transferencia del ADN T desde el plásmido Ti al cromosoma de la planta. El ADN T entra a continuación en la célula vegetal a través de la herida. Se especula que el ADN T espera hasta que el ADN de la planta se está replicando o transcribiendo, después se autoinserta en el ADN de la planta expuesto. Con el fin de utilizar A. tumefaciens como vector transgén, se tiene que eliminar la sección del ADN T que induce tumor, mientras que se conservan las regiones limítrofes del ADN T y los genes vir. El transgén se inserta a continuación entre las regiones limítrofes del ADN T, donde se transfiere a la célula vegetal y se integra en los cromosomas de las plantas.
Las plantas monocotiledóneas se pueden transformar utilizando los ácidos nucleicos de la invención, incluyendo cereales importantes, véase Hiei (1997) Plant Mol. Biol. 35:205-218. Véanse también, por ejemplo, Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci USA 80:4803; Thykjaer (1997) citado anteriormente; Park (1996) Plant Mol. Biol. 32:1135-1148, que comentan la integración de ADN T en ADN genómico. Véase también D'Halluin, Patente de los Estados Unidos Núm. 5.712.135, que describe un procedimiento para la integración estable de un ADN que comprende un gen que es funcional en una célula de un cereal, u otra planta monocotiledónea.
La tercera etapa puede implicar la selección y regeneración de plantas completas capaces de transmitir el gen diana incorporado a la siguiente generación. Tales técnicas de regeneración se basan en la manipulación de ciertas fitohormonas en un medio de crecimiento de cultivo de tejido, basándose típicamente en un marcador biocida y/o herbicida que ha sido introducido junto con la secuencia de nucleótidos deseada. La regeneración de plantas a partir de protoplastos cultivados es descrita por Evans et al., en Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, págs. 124-176, MacMillilan Publishing Company, New York, 1983; y Binding, Regeneration of Plants, Plant Protoplasts, págs. 21-73, CRC Press, Boca Raton, 1985. La regeneración se puede obtener también a partir de callos, explantes, órganos, o partes de los mismos de plantas. Tales técnicas de regeneración son descritas generalmente por Klee (1987) en Ann. Rev. of Plant Phys. 38:467-486. Para obtener plantas completas a partir de tejidos transgénicos tales como embriones inmaduros, estos se pueden cultivar en condiciones ambientales controladas en una serie de medios que contienen nutrientes y hormonas, un procedimiento conocido como cultivo de tejidos. Una vez que se han generado plantas completas y producen semilla, comienza la evaluación de la progenie.
Después de incorporar establemente el casete de expresión en las plantas transgénicas, éste se puede introducir en otras plantas mediante cruzamiento sexual. Se puede utilizar cualquiera de las diversas técnicas de cría convencionales, dependiendo de las especies que se vayan a cruzar. Puesto que la expresión transgénica de los ácidos nucleicos de la invención conduce a cambios fenotípicos, las plantas que comprenden los ácidos nucleicos recombinante de la invención se pueden cruzar sexualmente con una segunda planta para obtener un producto final. De este modo, la semilla de la invención se puede obtener de un cruce entre dos plantas transgénicas de la invención, o un cruce entre una planta de la invención y otra planta. Los efectos deseados (por ejemplo, la expresión de los polipéptidos de la invención para producir una planta en la que se altera el comportamiento de floración) se pueden potenciar cuando ambas plantas progenitoras expresan los polipéptidos (por ejemplo, una xilanasa) de la invención. Los efectos deseados se pueden pasar a las generaciones de plantas futuras mediante métodos de propagación convencionales.
Los ácidos nucleicos y polipéptidos de la invención son expresados o insertados en cualquier planta o semilla. Las plantas transgénicas de la invención pueden ser dicotiledóneas o monocotiledóneas. Los ejemplos de las plantas transgénicas de un solo cotiledón de la invención son céspedes, tales como gramíneas pratenses (poa de los prados, Poa), hierbas forrajeras tales como festuca, lolium, hierbas de zonas templadas, tales como Agrostis, y cereales, por ejemplo, trigo, avenas, centeno, cebada, arroz, sorgo, y maíz. Los ejemplos de plantas transgénicas de dos cotiledones de la invención son tabaco, legumbres, tal como altramuces, patata, remolacha azucarera, guisante, judías y soja, y plantas crucíferas (familia Brassicaceae), tales como coliflor, semilla de colza, y el organismo modelo íntimamente relacionado Arabidopsis thaliana. De este modo, las plantas y semillas transgénicas de la invención incluyen una amplia gama de plantas, incluyendo, pero no limitadas a, especies de los géneros Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glycine, Gossypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna, y Zea. Las plantas y semillas transgénicas de la invención pueden ser cualquier monocotiledónea o dicotiledónea, por ejemplo, una monocotiledónea de maíz, caña de azúcar, arroz, trigo, cebada, césped de pradera o Miscanthus; o un cultivo de semillas oleaginosas dicotiledóneas, soja, colza, colza, lino, algodón, aceite de palma, remolacha azucarera, cacahuete, árbol, álamo o lupino.
En realizaciones alternativas, los ácidos nucleicos de la invención son expresados en plantas (y/o sus semillas) que contienen células de fibras, incluyendo, por ejemplo, algodón, árbol del algodón (Kapok, Ceiba pentandra), sauce del desierto, arbusto de creosota, salsola, balsa, ramio, kenaf, hemp, rosa de Jamaica, yute, sisal, abacá y linaza. En realizaciones alternativas, las plantas transgénicas de la invención pueden ser miembros del género Gossypium,
5
10
15
20
25
30
35
40
incluyendo miembros de cualquier especie de Gossypium, tales como G. arboreum;. G. herbaceum, G. barbadense, y G. hirsutum.
La invención también proporciona plantas transgénicas (y/o sus semillas) que se van a utilizar para producir grandes cantidades de los polipéptidos. Por ejemplo, véase Palmgren (1997) Trends Genet. 13:348; Chong (1997) Transgenic Res. 6:289-296 (que producen proteína láctea humana beta-caseina en plantas de patata transgénicas utilizando un promotor de manopina sintasa (mas1',2') inducible por auxina, bidireccional con métodos de transformación del disco de la hoja mediados por Agrobacterium tumefaciens).
Utilizando procedimientos conocidos, un experto en la técnica puede cribar plantas (y/o sus semillas) de la invención detectando el aumento o disminución del ARNm transgén o la proteína en plantas transgénicas. Los medios para detectar y cuantificar los ARNm o proteínas son bien conocidos en la técnica.
Polipéptidos y péptidos
En un aspecto, la invención proporciona polipéptidos y péptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa o polipéptidos y péptidos capaces de generar un anticuerpo que se une específicamente a una xilanasa de la presente invención.
Diversas características y propiedades de los polipéptidos desvelados en el presente documento se describen y enumeran en los Ejemplos 13 a 15, a continuación.
La divulgación también proporciona ácidos nucleicos que codifican enzimas con una novedad común en cuanto a que codifican un subconjunto de xilanasas, o un clado, que comprende el "módulo X14". Los ácidos nucleicos que codifican enzimas tienen una novedad común en cuanto a que codifican un clado que comprende el "módulo X14" (J Bacteriol. 2002 August; 184(15): 4124-4133). Los miembros de xilanasa que comprenden X14 de este clado se enumeran en la Tabla 9 a continuación. Se divulga un nuevo género de xilanasas, que comprende los miembros de xilanasa del clado enumerados en la Tabla 9 más adelante, y enzimas relacionadas, por ejemplo, xilanasas que tienen una identidad de secuencia del 50 % o más con una enzima de ejemplo de la invención, como se enumera en la Tabla 9 más adelante. Las secuencias en el clado descritas en la Tabla 9, a continuación, son únicas en cuanto a que todas contienen el módulo X14 de tipo CBM, que es notablemente similar en todas las xilanasas en el clado descrito.
Tabla 9
SEQ ID NOS:
X14 Clado único
169, 170
y y
195, 196
y y
215, 216
y y
161, 162
y y
225, 226
y y
159, 160
y y
299, 300
y y
233, 234
y y
181, 182
y y
165, 166
y y
217, 218
y y
153, 154
y y
219, 220
y y
183, 184
y y
253, 254
y y
255, 256
y y
221, 222
y y
191, 192
y
353, 354
y
367, 368
y
261, 262
y
365, 366
y
205, 206
y
211, 212
y
Las xilanasas quiméricas pueden tener módulos de unión a carbohidratos heterólogos (CBM), por ejemplo, para usar en los procedimientos descritos y en diversas aplicaciones industriales, médicas, farmacéuticas, de investigación, alimentos y piensos para animales y suplementos de alimentos y piensos para animales, y otras aplicaciones. Por ejemplo, las enzimas, por ejemplo, hidrolasas, incluyendo glicosil hidrolasas (tales como xilanasas, glucanasas) comprenden uno o más cBm de una enzima de la invención, incluido el módulo X14 de tipo CBM tratado anteriormente, como se resume en la Tabla 9. O bien, CBM, por ejemplo, los módulos X14, entre diferentes enzimas
5
10
15
20
25
30
de la divulgación pueden intercambiarse; o, como alternativa, uno o más CBM de una o más enzimas de la divulgación pueden empalmarse en una enzima, por ejemplo, una hidrolasa, por ejemplo, cualquier glicosil hidrolasa, tal como una xilanasa.
Las glicosil hidrolasas que utilizan sustratos insolubles son modulares, comprendiendo habitualmente módulos catalíticos unidos a uno o más módulos de unión a carbohidratos no catalíticos (CBM). En la naturaleza, se cree que los CBM promueven la interacción de la glicosil hidrolasa con su sustrato polisacárido diana. Por ejemplo, como se ha tratado anteriormente, X14 es un módulo de enlace xilano. Por lo tanto, las enzimas quiméricas tienen sustratos heterólogos no naturales; incluyendo enzimas quiméricas que tienen sustratos múltiples por la naturaleza de sus CBM heterólogos "empalmados en su interior", por ejemplo, un módulo X14 empalmado en su interior, dando así a la enzima quimérica nueva especificidad para xilano y galactano, o unión potenciada a xilano y galactano. Los CBM heterólogos de las enzimas quiméricas pueden diseñarse para que sean modulares, es decir, que se agreguen a un módulo catalítico o dominio catalítico (por ejemplo, un sitio activo), que también puede ser heterólogo o puede ser homólogo a la enzima.
Se ha demostrado que la utilización de solo el módulo catalítico de una xilanasa o una glucanasa es efectiva. Por lo tanto, los péptidos y polipéptidos pueden consistir en, o comprender, módulos modulares de CBM/sitio activo (por ejemplo, X14, véase la Tabla 9), que pueden emparejarse o unirse homólogamente como pares de CBM de sitios activos quiméricos (heterólogos). De este modo, estos polipéptidos/péptidos quiméricos pueden usarse para mejorar o alterar el rendimiento de una enzima individual, por ejemplo, una enzima xilanasa. Se puede diseñar un módulo catalítico quimérico (que comprende, por ejemplo, al menos un CBM, por ejemplo, X14) para dirigir la enzima a
regiones particulares de un sustrato, por ejemplo, a regiones particulares de una pasta. Por ejemplo, esto se logra haciendo fusiones de la xilanasa y varios CBM (ya sea una xilanasa con uno CBM heterólogo, o un CBM de la divulgación con otra enzima, por ejemplo, una hidrolasa, tal como una xilanasa. Por ejemplo, se sabe que CBM4, CBM6 y CBM22 se unen a xilano y pueden potenciar la eficacia de la xilanasa en el bioblanqueamiento de la pasta (véase, por ejemplo, Czjzek (2001) J. Biol. Chem. 276 (51): 48580-7, lo que indica que cBm4, CBM6, y cBm22 están relacionados y el CBM interactúa principalmente con xilano). La fusión de xilanasa y CBM3a o CBM3b, que se unen a la celulosa cristalina, puede ayudar a la xilanasa a penetrar en la matriz compleja de polisacáridos de la pasta y alcanzar xilanos inaccesibles. Se puede usar cualquier CBM, por ejemplo, como revisan Boraston (2004) Biochem. J. 382: 769-781: Familia Proteína Código PDB CBM1 Celulasa 7A (Trichoderma reesei) 1CBH CBM2 Xilanasa 10A (Cellulomonas fimi) 1EXG
Xilanasa 11A (Cellulomonas fimi) 2XBD
Xilanasa 11A (Cellulomonas fimi) 1HEH
CBM3
Escafoldina (Clostridium cellulolyticum) 1G43
Escafoldina (Clostridium thermocellum) 1NBC
Celulasa 9A (Thermobifida fusca) 1TF4
CBM4
Laminarinasa 16A (Thermotoga marítima) 1GUI
Celulasa 9B (Cellulomonas fimi) 1ULO; 1GU3
Celulasa 9B (Cellulomonas fimi) 1CX1
Xilanasa 10A (Rhodothermus marinus) 1K45
CBM5
Celulasa 5A (Erwinia chrysanthemi) 1AIW
Quitinasa B (Serratia marcescens) 1E15
CBM6
Xilanasa 11A (Clostridium thermocellum) 1UXX
Xilanasa 11A (Clostridium stercorarium) 1NAE
Xilanasa 11A (Clostridium stercorarium) 1UY4
Endoglucanasa 5A (Cellvibrio mixtus) 1UZ0
CBM9
Xilanasa 10A (Thermotoga marítima) 1I8A
0 1 CD O
Xilanasa 10A (Cellvibrio japonicus) 1QLD
CM i CD O
Chitinasa Chi1 (Bacillus circulans) 1ED7
CBM13
* Xilanasa 10A (Streptomyces olivaceoviridis) 1XYF
Xilanasa 10A (Streptomyces lividans) 1MC9
Cadena B de la toxina de ricino (Ricinus communis) 2AAI
Abrina (Abrus precatorius) 1ABR
CBM14
Taquicitina (Tachypleus tridentatus) 1DQC
LO i CD O
Xilanasa 10C (Cellvibrio japonicus) 1GNY
5
10
15
20
25
30
35
Familia
Proteína Código PDB
CBM17
Celulasa 5A (Clostridium cellulovorans) 1J83
CBM18*
Aglutinina (Triticum aestivum) 1WGC
Péptido antimicrobiano (Amaranthus caudatus) 1MMC
Quitinasa/aglutinina (Urtica dioica) 1EIS
CBM20*
Glucoamilasa (Aspergillus niger) 1AC0
p-amilasa (Bacillus cereus) 1CQY
CM CM CD O
Xilanasa 10B (Clostridium thermocellum) 1DYO
CBM27
Mannanasa 5A (Thermotoga marítima) 1OF4
CBM28
Celulasa 5A (Bacillus sp. 1139) 1UWW
CBM29
Proteína 1 no catalítica (Pyromyces equi) 1GWK
CBM32
Sialidasa 33A (Micromonospora viridifaciens) 1EUU
Galactosa oxidasa (Cladobotryum dendroides) 1GOF
CBM34*
a-Amilasa 13A (Thermoactinomyces vulgaris) 1UH2
Neopull¡ulanasa (Geobacillus stearothermophilus) 1J0H
CBM36
Xilanasa 43A (Paenibacillus polymyxa) 1UX7
*Estas familias contienen demasiadas entradas de estructura como para enumerarlas todas, por lo que solo se proporcionan las representativas.
De este modo, se proporcionan hidrolasas quiméricas, por ejemplo, una fusión de una glicosidasa con CBM diferentes (por ejemplo, heterólogos) para dirigir la enzima a polisacáridos insolubles particulares para mejorar el rendimiento en una aplicación. La glicosidasa quimérica puede comprender una enzima de la invención. La enzima quimérica puede comprender fusiones de diferentes CBM para potenciar el rendimiento del bioblanqueamiento de la pasta, por ejemplo, para lograr una mayor reducción porcentual de productos químicos de blanqueamiento. Los métodos comprenden recombinar diferentes CBM con diferentes xilanasas (por ejemplo, CBM de xilanasas de la divulgación) y seleccionar los quiméricos resultantes para encontrar la mejor combinación para una aplicación o sustrato particular.
Una proteína que tiene una secuencia como se expone en la SEQ ID NO: 382, donde la secuencia señal de la xilanasa que tiene una secuencia como se expone en la SEQ ID NO: 160 (codificada por, por ejemplo, la SEQ ID NO: 159) se eliminó (la secuencia señal eliminada era MISLKRVAALLCVAGLGMSAAN), se eliminó el "módulo de unión a carbohidratos" (CBM) y se añadió una metionina de inicio, dando una versión truncada, teniendo la xilanasa una secuencia como se expone en la SEQ ID NO: 382 (codificada por, por ejemplo, la SEQ ID NO: 381).
A continuación, se eliminaron tres residuos de aminoácidos del extremo carboxi terminal del polipéptido de la SEQ ID NO: 382, dando como resultado la SEQ ID NO: 384 (codificado por la SEQ ID NO: 383). Uno de estos residuos fue un glutamato, que, cuando se eliminó aumentó el pI de la proteína. Esta deleción causó un aumento de la capacidad de la enzima para aclarar la pasta de madera a un pH alcalino en comparación con la enzima de tipo silvestre. En otro aspecto, se eliminan tres residuos de aminoácidos del extremo carboxi terminal de una variante GSSM de la SEQ ID NO: 382, por ejemplo, el polipéptido de la SEQ ID NO: 482 (véase a continuación).
Por lo tanto, el rendimiento de una xilanasa se incrementa, por ejemplo, a pH alto, mediante la eliminación de los residuos de aminoácidos "EGG" (o el equivalente) cerca o en el extremo terminal C' de una secuencia de xilanasa. En un aspecto, el "EGG" (o el equivalente) se elimina justo (inmediatamente) después del dominio de glicosil hidrolasa de la xilanasa a modificar.
Otras variaciones también están dentro del alcance de la presente invención, por ejemplo, cuando se eliminan uno, dos, tres, cuatro o cinco o más residuos de los extremos carboxi o amino terminales de cualquier polipéptido de la invención. Otra variación incluye modificar cualquier residuo para aumentar o disminuir el pI de un polipéptido, por ejemplo, eliminar o modificar (por ejemplo, a otro aminoácido) un glutamato. Este método se usó como un esquema general para mejorar las propiedades de la enzima sin crear problemas de regulación, ya que no se mutaron los aminoácidos; y este esquema general puede usarse con cualquier polipéptido de la invención.
El polipéptido de la SEQ ID NO: 384 se desarrolló adicionalmente usando GSSM, tal como se resume en la Tabla 11.
Mutación Posiciones Secuencia de tipo Secuencia Otros codones que también
nucleotídicas silvestre (del ingles: GSSM codifican el mismo aminoácido
del wild type; WT) cambiado
aminoácido cambiado
5
10
15
20
25
30
Mutación
Posiciones Secuencia de tipo Secuencia Otros codones aue también
nucleotídicas silvestre (del ingles: GSSM codifican el mismo aminoácido
del wild type; WT) cambiado
aminoácido cambiado
T4L
10-12 ACC CTT TTA, TTG, CTC, CTA, CTG
S9P
25-27 AGT CCC CCG, CCA, CCT
Q10S
28-30 CAA TCA TCC, TCT, TCG, AGT, AGC
T13F
37-39 ACT TTT TTC
T13Y
37-39 ACT TAC TAT
T13I
37-39 ACT ATA ATT, ATC
T13W
37-39 ACT TGG -
N14H
40-42 AAC CAC CAT
Y18F
52-54 TAT TTC TTT
S25E
73-75 AGT GAG GAA
S25P
73-75 AGT CCC CCG, CCA, CCT
N30V
88-90 AAT GTG GTC, GTA, GTT
Q34C
100-102 CAG TGT TGC
Q34H
100-102 CAG CAT CAC
Q34L
100-102 CAG TTG TTA, CTT, CTC, CTA, CTG
S35E
103-105 TCC GAG GAA
S35D
103-105 TCC GAT GAC
S71T
211-213 TCA ACA ACT, ACC, ACG
S71C
211-213 TCA TGT TGC
S194H
508-582 AGT CAT CAC
El polipéptido de la SEQ ID NO: 384 se desarrolló adicionalmente usando GSSM para generar la SEQ ID NO: 482, codificado, por ejemplo, por la SEQ ID NO: 481:
MAQTCLTSPQTGFHNGFFYSFWKDSPGTVNFCLLEGGRYTSNWSGINNWVGGKGWQTGSRRNITYSGSFNTPGN GYLALYGWTTNPLVEYYWDSWGSWRPPGSDGTFLGTVNSDGGTYDIYRAQRVNAPSNGNATFYQYWSVRQSKRV GGTITTGNHFDAWASVGLNLGTHNYQIMATEGYQSSGSSDITVS (SEQ ID NO: 482)
ATGGCCCAGACCTGCCTCACGTCGCCCCAAACCGGCTTTCACAATGGCTTCTTCTATTCCTTCTGGAAGGACAG
TCCGGGCACGGTGAATTTTTGCCTGTTGGAGGGCGGCCGTTACACATCGAACTGGAGCGGCATCAACAACTGG
GTGGGCGGCAAGGGATGGCAGACCGGTTCACGCCGGAACATCACGTACTCGGGCAGCTTCAATACACCGGGC
AACGGCTACCTGGCGCTTTACGGATGGACCACCAATCCACTCGTCGAGTACTACGTCGTCGATAGCTGGGGGA
GCTGGCGTCCGCCGGGTTCGGACGGAACGTTCCTGGGGACGGTCAACAGCGATGGCGGAACGTATGACATCT
ATCGCGCGCAGCGGGTCAACGCGCCGTCCATCATCGGCAACGCCACGTTCTATCAATACTGGAGCGTTCGGCA
GTCGAAGCGGGTAGGTGGGACGATCACCACCGGAAACCACTTCGACGCGTGGGCCAGCGTGGGCCTGAACCT
GGGCACTCACAACTACCAGATCATGGCGACCGAGGGCTACCAAAGCAGCGGCAGCTCCGACATCACGGTGAGT
TGA (SEQ ID NO: 481)
Diferencias entre la SEQ ID NO: 382 y la SEQ ID NO: 482:
Primero, se eliminaron tres aminoácidos del extremo C de la SEQ ID NO: 382. Esto se hizo con el fin de aumentar el rendimiento del pH de la enzima. En segundo lugar, se cambiaron siete aminoácidos para aumentar el rendimiento de la enzima a altas temperaturas y a un pH elevado. De este modo, la enzima SEQ ID NO: 482 activa en el producto comprende un dominio catalítico de la SEQ ID NO: 382 ligeramente modificado.
Resumen de los cambios realizados en la secuencia de ejemplo SEQ ID NO: 382
Un resumen de los cambios realizados en la secuencia de ejemplo SEQ ID NO: 382 de la invención se resume en la Figura 13; donde la figura ilustra la eliminación de la secuencia de EGG en el extremo C-terminal para proporcionar un rendimiento incrementado a pH alto; seguido por un cambio en siete (7) residuos de aminoácidos; este producto tiene un rendimiento incrementado a pH alto y temperatura alta; el producto final tiene la secuencia de la SEQ ID NO: 482.
5
10
15
20
25
30
35
40
45
50
55
60
Detalles de los cambios de aminoácidos entre la SEQ ID NO: 382 y la SEQ ID NO: 482:
Posición del aminoácido
9 13 14 18 34 35 71
SEQ ID NO:382
S T N Y Q S S
SEQ ID NO:482
P F H F L E T
Por lo tanto, la divulgación proporciona polipéptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa, donde el polipéptido tiene una modificación de secuencia, que incluye cualquier secuencia de aminoácidos de ejemplo de la divulgación (como se ha definido anteriormente, incluyendo todas las secuencias pares entre la SEQ ID NO: 2 y la SEQ ID NO: 636, véase la lista de secuencias), donde la modificación de secuencia comprende al menos uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios: el aminoácido en el equivalente de la treonina en el resto 4 de la SEQ ID NO: 384 es leucina, el aminoácido en el equivalente de la serina en el resto 9 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la glutamina en el resto 10 de la SEQ ID NO: 384 es serina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es fenilalanina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es tirosina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es isoleucina, el aminoácido en el equivalente de treonina en el residuo 13 de la SEQ ID NO: 384 es triptófano, el aminoácido en el equivalente de la asparagina en el residuo 14 de la SEQ ID NO: 384 es histidina, el aminoácido en el equivalente de la tirosina en el residuo 18 de la SEQ ID NO: 384 es fenilalanina, el aminoácido en el equivalente de la serina en el resto 25 de la SEQ ID NO: 384 es ácido glutámico, el aminoácido en el equivalente de la serina en el resto 25 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la asparagina en el resto 30 de la SEQ ID NO: 384 es valina, el aminoácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es cisteína, el aminoácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es histidina, el amino ácido en el equivalente de la glutamina en el resto 34 de la SEQ ID NO: 384 es leucina, el aminoácido en la equivalente de la serina en el resto 35 de la SEQ ID NO: 384 es ácido glutámico, el aminoácido en el equivalente de la serina en el resto 35 de la SEQ ID NO: 384 es ácido aspártico, el aminoácido en el equivalente de la serina en el residuo 71 de la SEQ ID NO: 384 es treonina, el aminoácido en el equivalente de la serina en el residuo 71 de la SEQ ID NO: 384 es cisteína, o el aminoácido en el equivalente de la serina en el residuo 194 de la SEQ ID NO: 384 es histidina. El cambio o los cambios de secuencia también pueden comprender cualquier modificación de aminoácidos para cambiar el pI de un polipéptido, por ejemplo, deleción o modificación de un glutamato, o cambio de un glutamato por otro residuo.
La invención también proporciona polipéptidos aislados, sintéticos o recombinantes que tienen actividad xilanasa, donde el polipéptido tiene una secuencia que comprende uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios en la secuencia de aminoácidos de la SEQ ID NO: 384: la treonina en la posición de aminoácido 4 es leucina, la serina en la posición de aminoácido 9 es prolina, la glutamina en amino la posición ácida 10 es serina, la treonina en la posición de aminoácido 13 es fenilalanina, la treonina en la posición de aminoácido 13 es tirosina, la treonina en la posición de aminoácido 13 es isoleucina, la treonina en la posición de aminoácido 13 es triptófano, la asparagina en amino la posición ácida 14 es histidina, la tirosina en la posición de aminoácido 18 es fenilalanina, la serina en la posición de aminoácido 25 es ácido glutámico, la serina en la posición de aminoácido 25 es prolina, la asparagina en posición de aminoácido 30 es valina, la glutamina en la posición de aminoácido 34 es cisteína, la glutamina en la posición de aminoácido 34 es histidina, la glutamina en la posición de aminoácido 34 es leucina, la serina en la posición de aminoácido 35 es ácido glutámico, la serina en posición de aminoácido 35 es ácido aspártico, la serina en la posición de aminoácido 71 es treonina, la serina en la posición de aminoácido 71 es cisteína, o la serina en la posición de aminoácido 194 es histidina.
La divulgación proporciona además polipéptidos aislados, sintéticos o recombinantes que tienen una identidad de secuencia (por ejemplo, al menos aproximadamente 50 %, 51 %, 52 %, 53 %, 54 %, 55 %, 56 %, 57 %, 58 %, 59 %, 60 %, 61 %, 62 %, 63 %, 64 %, 65 %, 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, o más, o completa (100 %) de identidad de secuencia con respecto a una secuencia de ejemplo de la divulgación.
En un aspecto, el polipéptido tiene una actividad xilanasa; por ejemplo, en el que la actividad xilanasa puede comprender hidrolizar un enlace glicosídico en un polisacárido, por ejemplo, un xilano. En un aspecto, el polipéptido tiene una actividad xilanasa que comprende catalizar la hidrólisis de los enlaces p-1,4-xilosídicos internos. En un aspecto, la actividad xilanasa comprende una actividad endo-1,4-beta-xilanasa. En un aspecto, la actividad xilanasa comprende hidrolizar un xilano para producir un xilololigómero y xilosa de menor peso molecular. En un aspecto, el xilano comprende un arabinoxilano, tal como un arabinoxilano soluble en agua.
Se puede usar cualquier ensayo de xilanasa conocido en la técnica para determinar si un polipéptido tiene actividad xilanasa y está dentro del alcance de la invención. Por ejemplo, se puede usar los ensayos de azúcares reductores, como el método de Nelson-Somogyi o el método del ácido dinitrosalicílico (DNS) para analizar los azúcares del producto (y por lo tanto, la actividad xilanasa). Las reacciones se llevan a cabo mezclando e incubando una dilución
5
10
15
20
25
30
35
40
45
50
55
60
65
de la preparación enzimática con una cantidad conocida de sustrato a pH tamponado y temperatura establecida. Los ensayos de xilanasa son similares a los ensayos de celulasa, excepto que una solución de xilano (por ejemplo, espelta de avena o abedul) se sustituye por CMC o papel de filtro. El ensayo DNS es más fácil de usar que el ensayo Nelson-Somogyi. El análisis de DNS es satisfactorio para actividades de celulasa, pero tiende a sobreestimar la actividad xilanasa. El método de Somogyi-Nelson es más preciso en la determinación de azúcares reductores, para medir actividades específicas y para cuantificar la cantidad total de xilanasa producida en las condiciones de crecimiento optimizadas, véase, por ejemplo, Comparison of the 3, 5-dinitrosalicylic acid and Nelson-Somogyi methods of assaying for reducing sugars and determining cellulase activity, Enzyme Microb. Technol. 7:327-332; Somogyi, M. 1952, Notes on sugar determination, J. Biol. Chem. 195:19-23. Se puede usar cualquier ensayo de azúcar reductor, por ejemplo, de Nelson-Somogyi, por ejemplo, basado en las referencias Nelson, N. (1944) J. Biol. Chem. 153:375-380, and Somogyi, M. (1952) J. Biol. Chem. 195:19-23.
Se ha demostrado que la xilanasa que tiene una secuencia como se expone en la SEQ ID NO: 182 (codificada por, por ejemplo, la SEQ ID NO: 181) ("SEQ ID NO: 181/182") y la xilanasa que tiene una secuencia tal como se establece en la SEQ ID NO: 382 (codificada por, por ejemplo, la SEQ iD NO: 381) ("SEQ ID NO: 381/382") aumentan el brillo de la pasta a pH 8 en mayor medida que otras enzimas. El aumento del brillo es similar para ambas enzimas cuando se dosifican en una cantidad igual de unidades. Estos dos mejores resultados difieren cuando se analizan a pH 10 con la SEQ ID NO: 182 (codificada por, por ejemplo, la SEQ ID NO: 181) ("SEQ ID NO: 181/182"), que da como resultado mayores niveles de brillo que la SeQ ID No: 381/382. La SEQ ID NO: 181/182 tiene un pl de 8,8 y la SEQ ID NO: 382 (codificada por, por ejemplo, la SEQ ID NO: 381 tiene un pl de 7,9. La SEQ ID NO: 381/382 tiene una longitud de 197 aminoácidos. Cuando se eliminan E195, G196 y G194, dando como resultado la SEQ ID NO: 384 (codificada por la SEQ ID NO: 383), el pl se convierte en 8,5. Esta construcción tiene una mejor actividad a pH alto porque el pl de la proteína está más próximo a la SEQ ID NO: 181/182 en la construcción truncada.
Los tres genes, SEQ ID NO: 182 (codificado por, por ejemplo, la SEQ ID NO: 181), SEQ ID NO: 382 (codificado por, por ejemplo, la SEQ ID NO: 381, y la SeQ ID NO: 384 (codificado por, por ejemplo, la SEQ iD NO: 383, se expresaron y los productos génicos se analizaron usando el ensayo de azúcar reductor de Nelson-Somogyi para determinar las U/ml de enzima donde una unidad es la cantidad de enzima que liberará 1 pmol de xilosa min. se dosificaron a 2 U/g de pasta de DO (secado en horno) y se ensayaron de acuerdo con el protocolo de bioblanqueamiento de aplicaciones, descrito en el Ejemplo 8, a continuación.
Los resultados del estudio de "bioblanqueamiento", mostrado en la Figura 12 son: a pH = 8: SEQ ID NO: 382 y SEQ ID NO: 182 funcionaron mejor que el control, C-0.21, como se vio en el pasado; a pH = 10: el rendimiento de la SEQ ID NO: 382 disminuyó por debajo del control, C-0,21, como se vio en el pasado; a pH = 10, el rendimiento de la SEQ ID NO: 182 NO disminuyó por debajo del control, C-0.21, como se ha visto en el pasado; La SEQ ID NO: 384 superó tanto a la SEQ ID NO: 382 como a la SEQ ID NO: 182 a pH = 8; la SEQ ID NO: 384, el rendimiento a pH = 10 NO disminuyó por debajo del control, C-0.21 y era comparable al de la SEQ ID NO: 182. Estos resultados indican que la SEQ ID nO: 384 truncada (codificada, por ejemplo, por la SEQ ID NO: 383) funcionó tan bien como la SEQ iD NO: 182 (codificada, por ejemplo, por la SeQ ID NO: 181) a pH 10 mientras SEQ ID NO: 382 tuvo un rendimiento bajo en estas condiciones. Las enzimas se usaron para tratar SSWB en un factor Kappa de 0,18. En la Figura 12, las líneas negras representan los niveles de brillo del control en 0,18 (línea inferior) y 0,21 (línea superior). Este estudio de "bioblanqueamiento" demuestra el uso del truncamiento de genes para mejorar las propiedades de las enzimas xilanasas. Este estudio de "bioblanqueamiento" también demuestra que el aumento de pI de una xilanasa conduce a un mayor rendimiento de Southern Browwood Pine Brownstock (SSWB).
Los polipéptidos de la invención incluyen xilanasas en una forma activa o inactiva. Por ejemplo, los polipéptidos de la invención incluyen proproteínas antes de la "maduración" o el procesamiento de las secuencias prepro, por ejemplo, por medio de una enzima de procesamiento de proproteínas, tal como una proproteína convertasa para generar una proteína mutante "activa". Los polipéptidos de la invención incluyen xilanasas inactivas por otras razones, por ejemplo, antes de la "activación" mediante un evento de procesamiento post-traduccional, por ejemplo, una acción de endo- o exo-peptidasa o proteinasa, un evento de fosforilación, una amidación, una glicosilación o una sulfuración, un evento de dimerización, y similares. Los polipéptidos de la invención incluyen todas las formas activas, incluyendo subsecuencias activas, por ejemplo, dominios catalíticos o sitios activos, de la xilanasa.
Los métodos para identificar secuencias con dominio "prepro" y secuencias señal son bien conocidos en la técnica, véase, por ejemplo, Van de Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por ejemplo, para identificar una secuencia prepro, la proteína se purifica a partir del espacio extracelular y se determina la secuencia N-terminal de las proteínas y se compara con la forma no procesada.
La invención incluye polipéptidos con o sin una secuencia señal y/o una secuencia prepro. La invención incluye polipéptidos con secuencias señal heterólogas y/o secuencias prepro. La secuencia prepro (incluyendo una secuencia de la invención utilizada como dominio prepro heterólogo) se puede localizar sobre el extremo amino terminal o carboxi terminal de la proteína. La invención también incluye secuencias señal aisladas o recombinantes, secuencias prepro y dominios catalíticos (por ejemplo, "sitios activos") que comprenden secuencias de la invención.
5
10
15
20
25
30
35
40
45
50
55
60
65
El porcentaje de identidad de secuencia se puede encontrar a lo largo de toda la longitud del polipéptido, o, la identidad se puede encontrar a lo largo de una región de al menos aproximadamente 50, 60, 70, 8o, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 o más residuos. Los polipéptidos de la invención pueden ser también más cortos que los péptidos ilustrativos completos. En aspectos alternativos, la invención proporciona polipéptidos (péptidos, fragmentos) que tienen un tamaño que oscila entre aproximadamente 5 y la longitud total de un polipéptido, por ejemplo, una enzima, tal como una xilanasa; siendo los tamaños ilustrativos de aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, o más residuos, por ejemplo, residuos contiguos de una xilanasa ilustrativa de la invención.
Los péptidos de la invención (por ejemplo, una subsecuencia de un polipéptido ilustrativo de la invención) pueden ser útiles, por ejemplo, como sondas de marcaje, antígenos, tolerágenos, motivos, sitios activos de xilanasas (por ejemplo, "dominios catalíticos"), secuencias señal y/o dominios prepro.
Los polipéptidos y péptidos de la invención se pueden aislar a partir de fuentes naturales, ser sintéticos, o ser polipéptidos generados de forma recombinante. Los péptidos y proteínas se pueden expresar de forma recombinante in vitro o in vivo. Los péptidos y polipéptidos de la invención se pueden elaborar y aislar utilizando cualquier método conocido en la técnica. Los polipéptidos y péptidos de la invención se pueden sintetizar también, completamente o en parte, utilizando métodos químicos bien conocidos en la técnica. Véanse por ejemplo, Caruthers (1980) Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic Peptides and Proteins, Formulation, Processing y Delivery Systems (1995) Technomic Publishing Co., Lancaster, pA. Por ejemplo, la síntesis peptídica se puede realizar utilizando diversas técnicas en fase sólida (véanse por ejemplo, Roberge (1995) Science 269:202; Merrifield (1997) Methods Enzymol. 289:3-13) y la síntesis automática se puede lograr, por ejemplo, utilizando el Sintetizador de Péptidos ABI 431A (Perkin Elmer) de acuerdo con las instrucciones proporcionadas por el fabricante.
Los péptidos y polipéptidos de la invención pueden estar también glicosilados. La glicosilación se puede añadir post- traduccionalmente ya sea químicamente o mediante mecanismos biosintéticos celulares, donde el último incorpora el uso de motivos de glicosilación conocidos, que pueden ser nativos para la secuencia o se pueden añadir en forma de un péptido o añadir a la secuencia de ácido nucleico codificante. La glicosilación puede estar conectada a O conectada a N.
"Aminoácido" o "secuencia de aminoácidos" como se usa en el presente documento se refiere a una secuencia de oligopéptido, péptido, polipéptido o proteína, o a un fragmento, porción o subunidad de cualquiera de estos y a moléculas sintéticas o de origen natural. "Aminoácido" o "secuencia de aminoácidos" incluyen una secuencia de oligopéptidos, péptidos, polipéptidos o proteínas, o un fragmento, porción o subunidad de cualquiera de estos, y moléculas naturales o sintéticas. El término "polipéptido", como se usa en el presente documento, se refiere a aminoácidos unidos entre sí mediante enlaces peptídicos o enlaces peptídicos modificados, es decir, isósteros peptídicos y pueden contener aminoácidos modificados distintos de los 20 aminoácidos codificados por el gen. Los polipéptidos pueden modificarse mediante procesos naturales, tales como el procesamiento postraduccional, o mediante técnicas de modificación química que son bien conocidas en la materia. Las modificaciones pueden ocurrir en cualquier parte del polipéptido, incluyendo la cadena principal del péptido, las cadenas laterales de aminoácidos y los extremos amino o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en el mismo o en diversos grados en varios sitios en un polipéptido dado. También un polipéptido dado puede tener muchos tipos de modificaciones. Las modificaciones incluyen acetilación, acilación, ADP-ribosilación, amidación, unión covalente de flavina, unión covalente de un resto hemo, unión covalente de un nucleótido o derivado de nucleótido, unión covalente de un lípido o derivado lipídico, unión covalente de un fosfatidilinositol, ciclación de enlace, formación de enlaces disulfuro, desmetilación, formación de enlaces cruzados covalentes, formación de cisteína, formación de piroglutamato, formilación, gamma-carboxilación, glicosilación, formación de anclaje GPI, hidroxilación, yodación, metilación, miristolización, oxidación, pegilación, xilana hidrolasa procesamiento, fosforilación, prenilación, racemización, selenoilación, sulfatación y adición de aminoácidos mediada por ARN de transferencia a proteínas, tales como arginilación. (Véase, Creighton, TE, Proteins - Structure and Molecular Properties 2a Ed., WH Freeman and Company, Nueva York (1993); Posttranslational Covalent Modification of Proteins, BC Johnson, Ed., Academic Press, Nueva York, pp. 1-12 (1983)). Los péptidos y polipéptidos de la invención también incluyen todas las formas "miméticas" y "peptidomiméticas", como se describe con más detalle a continuación.
Los polipéptidos o proteínas "recombinantes" se refieren a polipéptidos o proteínas producidos por técnicas de ADN recombinante; es decir, producidos a partir de células transformadas por una construcción de ADN exógeno que codifica el polipéptido o proteína deseado. Los polipéptidos o proteínas "sintéticos" son aquellos preparados por síntesis química. Los métodos de síntesis de péptidos químicos en fase sólida también pueden usarse para sintetizar los polipéptidos de la invención. Tal método se conoce en la técnica desde principios de los años 60 (Merrifield, rB, J. Am. Chem. Soc., 85: 2149-2154, 1963) (Véase también Stewart, JM y Young, JD, Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, Ill., Pp. 11-12)) y se han empleado recientemente en kits de síntesis y diseño de péptidos de laboratorio disponibles en el mercado (Cambridge Research Biochemicals). Dichos kits de laboratorio comercialmente disponibles han utilizado generalmente las enseñanzas de H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81: 3998 (1984) y proporcionan la síntesis de péptidos sobre las puntas de una multitud de "varillas" o "espigas", todas las cuales están conectadas a una única placa. Cuando se utiliza un sistema
5
10
15
20
25
30
35
40
45
50
55
60
65
de este tipo, una placa de varillas o espigas se invierte y se inserta en una segunda placa de pocilios o depósitos correspondientes, que contienen soluciones para unir o anclar un aminoácido apropiado a las puntas de los las espigas o varillas. Repitiendo dicho paso del proceso, es decir, invirtiendo e insertando las puntas de la varilla y la espiga en soluciones apropiadas, los aminoácidos se incorporan a los péptidos deseados. Además, hay disponibles varios sistemas de síntesis de péptidos FMOC. Por ejemplo, el ensamblaje de un polipéptido o fragmento se puede llevar a cabo en un soporte sólido usando un sintetizador de péptidos automatizado Modelo 431A de Applied Biosystems, Inc. Tal equipo proporciona acceso fácil a los péptidos de la invención, ya sea por síntesis directa o por síntesis de una serie de fragmentos que se pueden acoplar usando otras técnicas conocidas.
"Fragmentos" como se usan en el presente documento son una porción de una proteína de origen natural que puede existir en al menos dos conformaciones diferentes. Los fragmentos pueden tener la misma o sustancialmente la misma secuencia de aminoácidos que la proteína de origen natural. "Sustancialmente lo mismo" significa que una secuencia de aminoácidos es en gran medida, pero no del todo, la misma, pero conserva al menos una actividad funcional de la secuencia con la que está relacionada. En general, dos secuencias de aminoácidos son "sustancialmente iguales" o "sustancialmente homólogas" si son al menos aproximadamente idénticas en un 85 %. También se incluyen fragmentos que tienen diferentes estructuras tridimensionales como proteína de origen natural. Un ejemplo de esto es una molécula "pro-forma", como una proproteína de baja actividad que puede modificarse por escisión para producir una enzima madura con una actividad significativamente más alta.
Los péptidos y polipéptidos de la invención, como se ha definido anteriormente, incluyen todas las formas "miméticas" y "peptidomiméticas". Los términos "mimético" y "peptidomimético" hacen referencia a un compuesto químico sintético que tiene esencialmente las mismas características estructurales y/o funcionales de los polipéptidos de la invención. El mimético puede estar compuesto completamente de análogos de aminoácidos no naturales, sintéticos, o, es una molécula quimérica parcialmente de aminoácidos de péptidos naturales y parcialmente de análogos de aminoácidos no naturales. El mimético también puede incorporar cualquier cantidad de sustituciones conservadoras de aminoácidos naturales con tal que tales sustituciones no alteren tampoco sustancialmente la estructura y/o actividad del mimético. Como con los polipéptidos de la invención que son variantes conservadoras, la experimentación rutinaria determinará cuándo un mimético se encuentra dentro del alcance de la invención, es decir, que su estructura y/o función no está sustancialmente alterada. De este modo, en un aspecto, una composición mimética se encuentra dentro del alcance de la invención si tiene una actividad xilanasa.
Las composiciones miméticas de polipéptidos de la invención pueden contener cualquier combinación de componentes estructurales no naturales. En un aspecto alternativo, las composiciones miméticas de la invención incluyen uno o todos los siguientes tres grupos estructurales: a) grupos de unión a residuos distintos de las uniones mediante enlace amida natural ("enlace peptídico"); b) residuos no naturales en lugar de residuos de aminoácido de origen natural; o c) residuos que inducen mimetismo estructural secundario, es decir, que inducen o estabilizan una estructura secundaria, por ejemplo, un giro beta, un giro gamma, una lámina beta, una conformación en hélice alfa, y similares. Por ejemplo, un polipéptido de la invención puede ser caracterizado como mimético cuando todos o algunos de sus residuos se conectan mediante medios químicos distintos de los enlaces peptídicos naturales. Los residuos de peptidomiméticos individuales se pueden conectar mediante enlaces peptídicos, otros enlaces o medios de acoplamiento químicos, tales como, por ejemplo, glutaraldehído, ésteres de N-hidroxisuccinimida, maleimidas bifuncionales, N,N'-diciclohexilcarbodiimida (DCC) o N,N'-diisopropilcarbodiimida (DIC). Los grupos conectores que pueden ser una alternativa a las uniones mediante enlace amida tradicional ("enlace peptídico") incluyen, por ejemplo, cetometileno (por ejemplo, -C(=O)-CH2- para -C(=O)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter (CH2-O), tioéter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida, o éster (véase, por ejemplo, Spatola (1983) en Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, págs. 267-357, "Peptide Backbone Modifications", Marcell Dekker, NY).
Un polipéptido de la invención se puede caracterizar también como mimético por contener todos o algunos residuos no naturales en lugar de residuos de aminoácido de origen natural. Los residuos no naturales están bien descritos en la bibliografía científica y de patentes; unas pocas composiciones no naturales ilustrativas útiles como miméticos de residuos de aminoácidos naturales y sus líneas de actuación se describen a continuación. Se pueden generar miméticos de aminoácidos aromáticos remplazando por, por ejemplo, D- o L- naftilalanina; D- o L- fenilglicina; D- o L- 2 tienoilalanina; D- o L-1, -2, 3-, o 4- pirenoilalanina; D- o L-3 tienoilalanina; D- o L-(2-piridinil)-alanina; D- o L-(3- piridinil)-alanina; D- o L-(2-pirazinil)-alanina; D- o L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D- (trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- o L-p-bifenilfenilalanina; D- o L-p-metoxi-bifenilfenilalanina; D- o L-2-indol(alquil)alaninas; y, D- o L-alquilalaninas, donde el alquilo puede ser metilo, etilo, propilo, hexilo, butilo, pentilo, isopropilo, iso-butilo, sec-isotilo, iso-pentilo sustituidos o no sustituidos, o aminoácidos no ácidos. Los anillos aromáticos de un aminoácido no natural incluyen, por ejemplo, anillos aromáticos de tiazolilo, tiofenilo, pirazolilo, benzimidazolilo, naftilo, furanilo, pirrolilo, y piridilo.
Los miméticos de aminoácidos ácidos se pueden generar sustituyendo por, por ejemplo, aminoácidos no carboxilados mientras se mantenga una carga negativa; (fosfono)alanina; treonina sulfatada. Los grupos laterales carboxilados (por ejemplo, aspartilo o glutamilo) se pueden modificar también selectivamente mediante reacción con carbodiimidas (R'-N-C-N-R') tales como, por ejemplo, 1-ciclohexil-3(2-morfolinil-(4-etil)carbodiimida o 1-etil-3(4-
5
10
15
20
25
30
35
40
45
50
55
60
65
azonio-4,4-dimetilpentil)carbodiimida. Aspartilo o glutamilo se pueden convertir también en residuos de asparraginilo y glutaminilo mediante reacción con iones amonio. Los miméticos de aminoácidos alcalinos se pueden generar mediante sustitución con, por ejemplo, (además de lisina y arginina) los aminoácidos ornitina, citrulina, o ácido (guanidino)-acético, o ácido (guanidino)alquil-acético, donde alquilo se ha definido anteriormente. Los derivados de nitrilo (por ejemplo, que contienen el radical CN en lugar de COOH) se pueden sustituir por asparragina o glutamina. Los residuos de asparraginilo y glutaminilo pueden se pueden desaminar a los residuos de aspartilo o glutamilo correspondientes. Se pueden generar miméticos de residuos de arginina haciendo reaccionar arginilo, por ejemplo, con uno o más reactivos convencionales, incluyendo, por ejemplo, fenilglioxal, 2,3-butanodiona, 1,2-ciclo- hexanodiona, o ninhidrina, preferentemente en condiciones alcalinas. Los miméticos de residuos de tirosina se pueden generar haciendo reaccionar tirosilo, por ejemplo, con compuestos de diazonio aromáticos o tetranitrometano. Se pueden utilizar N-acetilimidizol y tetranitrometano para formar especies de O-acetiltirosilo y 3- nitroderivados, respectivamente. Los miméticos de residuos de cisteína se pueden generar haciendo reaccionar residuos de cisteinilo, por ejemplo, con alfa-haloacetates tales como ácido 2-cloroacético o cloroacetamida y las aminas correspondientes; para producir derivados de carboximetilo o carboxamidometilo. Los residuos de miméticos de cisteína se pueden generar también haciendo reaccionar residuos de cisteinilo, por ejemplo, con bromo- trifluoroacetona, ácido alfa-bromo-beta-(5-imidazoil)propiónico; fosfato de cloroacetilo, N-alquilmaleimidas, disulfuro de 3-nitro-2-piridilo; disulfuro de metil-2-piridilo; p-cloromercuribenzoato; 2-cloromercurio-nitrofenol; o, cloro-7- nitrobenzo-oxa-1,3-diazol. Los miméticos de lisina se pueden generar (y los residuos amino terminales pueden ser alterados) haciendo reaccionar lisinilo, por ejemplo, con anhídrido de ácido succínico u otros anhídridos de ácidos carboxílicos. La lisina y otros miméticos de residuos que contienen alfa-amino se pueden generar también mediante reacción con imidoésteres, tales como picolinimidato de metilo, fosfato de piridoxal, piridoxal, cloroborohidruro, ácido trinitro-bencenosulfónico, O-metilisourea, 2,4-pentanodiona, y reacciones catalizadas por transamidasa con glioxilato. Los miméticos de metionina se pueden generar mediante reacción, por ejemplo, con metioninsulfóxido. Los miméticos de prolina incluyen, por ejemplo, ácido pipecólico, ácido tiazolidinocarboxílico, 3- o 4-hidroxiprolina, deshidroprolina, 3- o 4-metilprolina, o 3,3-dimetilprolina. Los miméticos de residuos de histidina se pueden generar haciendo reaccionar histidilo, por ejemplo, con dietilprocarbonato o bromuro de para-bromofenacilo. Otros miméticos incluyen, por ejemplo, los generado mediante hidroxilación de prolina y lisina; fosforilación de los grupos hidroxilo de residuos de serilo o treonilo; metilación de los grupos alfa-amino de lisina, arginina y histidina; acetilación de la amina N-terminal; metilación de residuos amida de la cadena principal o sustitución con N-metil aminoácidos; o amidación de grupos carboxilo C-terminal.
Un residuo, por ejemplo, u aminoácido, de un polipéptido de la invención se puede remplazar también por un aminoácido (o residuo de peptidomimético) de quiralidad opuesta. De este modo, cualquier aminoácido de origen natural en configuración L (que puede ser referida también como R o S, dependiendo de la estructura de la entidad química) se puede remplazar por el aminoácido del mismo tipo estructural químico o un peptidomimético, pero de quiralidad opuesta, referido como D-aminoácido, pero también se puede referir como forma R o S.
Los métodos para modificar los polipéptidos de la invención pueden ser procedimientos naturales, tales como procesamiento postraduccional (por ejemplo, fosforilación, acilación, etc), o mediante técnicas de modificación químicas. Las modificaciones se pueden producir en cualquier parte en el polipéptido, incluyendo el esqueleto peptídico, las cadenas laterales de aminoácidos y los extremos amino o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en el mismo o en grados variables en diversos sitios en un polipéptido dado. Asimismo un polipéptido dado puede tener muchos tipos de modificaciones. Las modificaciones incluyen acetilación, acilación, ribosilación del ADP, amidación, unión covalente de flavina, unión covalente de un radical hemo, unión covalente de un nucleótido o derivado de nucleótido, unión covalente de un lípido o derivado de lípido, unión covalente de un fosfatidilinositol, ciclación de entrecruzamiento, formación de enlaces disulfuro, desmetilación, formación de entrecruzamientos covalentes, formación de cisteína, formación de piroglutamato, formilación, gamma- carboxilación, glicosilación, formación de ancla de GPI, hidroxilación, yodación, metilación, miristoliación, oxidación, pegilación, procesamiento proteolítico, fosforilación, prenilación, racemización, selenoilación, sulfación, y adición de aminoácidos mediada por RNA de transferencia a proteínas tal como arginilación. Véase, por ejemplo, Creighton, T.E., Proteins - Structure and Molecular Properties 2a Ed., W.H. Freeman y Company, New York (1993); Posttraductional Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, págs. 1-12 (1983).
Tales métodos de síntesis química de péptidos en fase sólida se pueden utilizar también para sintetizar los polipéptidos de la invención. Tal método se conoce en la técnica desde principios de la década de 1960 (Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (Véase también Stewart, J. M. y Young, J. D., Solid Phase Peptide Synthesis, 2a Ed., Pierce Chemical Co., Rockford, Ill., págs. 11-12)) y se han empleado recientemente en diseños de péptidos en laboratorio asequibles comercialmente y kits de síntesis (Cambridge Research Biochemicals). Tales kits de laboratorio asequibles comercialmente han utilizado generalmente las enseñanzas de H. M. Geysen et al, Proc. Natl. Acad. Sci., USA, 81:3998 (1984) y proporcionan la síntesis de péptidos sobre las puntas de una multitud de "varillas" o "clavijas" todas las cuales se conectan a una sola placa. Cuando se utiliza tal sistema, una placa de varillas o clavijas se invierte y se inserta en una segunda placa de pocillos o reservorios correspondientes, que contienen soluciones para la unión o el anclaje de un aminoácido apropiado a las puntas de las clavijas o varillas. Repitiendo tal etapa procedimiental, es decir, invirtiendo e insertando las puntas de las varillas y clavijas en las soluciones apropiadas, los aminoácidos se arman para dar los péptidos deseados. Además, están disponibles varios
5
10
15
20
25
30
35
40
45
50
55
60
65
sistemas de síntesis peptídica FMOC asequible. Por ejemplo, el ensamblaje de un polipéptido o fragmento se puede llevar a cabo sobre un soporte sólido utilizando un sintetizador peptídico automático Applied Biosystems, Inc. Modelo 431Atm Tal equipo proporciona acceso fácil a los péptidos de la invención, mediante síntesis directa o mediante síntesis de una serie de fragmentos que se pueden acoplar utilizando otras técnicas conocidas.
La invención incluye xilanasas de la invención con y sin señal. El polipéptido que comprende una secuencia señal de la invención puede ser una xilanasa de la invención u otra xilanasa u otra enzima u otro polipéptido.
Los polipéptidos de la invención pueden tener actividad xilanasa en diversas condiciones, por ejemplo, extremas en pH y/o temperatura, agentes oxidantes, y similares. En el presente documento se divulgan métodos que conducen a preparaciones de xilanasa alternativas con diferentes eficacias y estabilidades catalíticas, por ejemplo, frente a temperatura, agentes oxidantes y condiciones de lavado variables. Se pueden producir variantes de xilanasa utilizando técnicas de mutagénesis dirigida al sitio y/o mutagénesis al azar. Se puede utilizar la evolución dirigida para producir una gran variedad de variantes de xilanasa con especificidades y estabilidad alternativa.
Las proteínas de la invención también son útiles como reactivos de investigación para identificar moduladores de xilanasa, por ejemplo, activadores o inhibidores de la actividad xilanasa. En resumen, se añaden muestras de ensayo (compuestos, caldos, extractos, y similares) a análisis de xilanasa para determinar su capacidad para inhibir la escisión del sustrato. Los inhibidores identificados de este modo se pueden utilizar en industria e investigación para reducir o evitar la proteolisis no deseada. Como con las xilanasas, los inhibidores se pueden combinar para incrementar el espectro de actividad.
Las enzimas de la invención también son útiles como reactivos de investigación para digerir proteínas o para secuenciar proteínas. Por ejemplo, las xilanasas se pueden utilizar para romper polipéptidos en fragmentos más pequeños para su uso en secuenciación, por ejemplo, un secuenciador automático.
La invención también proporciona métodos para descubrir nuevas xilanasas utilizando los ácidos nucleicos, polipéptidos y anticuerpos de la invención. En un aspecto, se escrutas bibliotecas de fagemidos para el descubrimiento de xilanasas basado en su expresión. En otro aspecto, se escrutas bibliotecas de fagos lambda para el descubrimiento de xilanasas basado en su expresión. La detección selectiva de las bibliotecas de fagos o fagemidos puede permitir la detección de clones tóxicos; el acceso mejorado al sustrato; la reducción de la necesidad de construir un anfitrión, evitando el potencial de cualquier tendencia resultante de la escisión masiva de la biblioteca; y, un crecimiento más rápido a bajas densidades de clones. La detección selectiva de bibliotecas de fagos o fagemidos puede ser en fase líquida o en fase sólida. En un aspecto, la invención proporciona la detección selectiva en fase líquida. Esto proporciona una mayor flexibilidad en condiciones de análisis; flexibilidad de sustrato adicional; mayor sensibilidad para clones débiles; y facilidad de automatización a lo largo de la detección selectiva en fase sólida.
La invención proporciona métodos de detección selectiva que utilizan las proteínas y ácidos nucleicos de la invención y automatización robótica para posibilitar la ejecución de muchos miles de reacciones biocatalíticas y análisis de detección selectiva en un corto período de tiempo, por ejemplo, por día, así como la garantía de un alto nivel de exactitud y reproducibilidad (véase la discusión de matrices, a continuación). Como resultado, se puede producir una biblioteca de compuestos derivados en cuestión de semanas. Para enseñanzas adicionales sobre modificación de moléculas, incluyendo moléculas pequeñas, véase PCT/US94/09174.
Un polipéptido aislado o purificado puede comprender la secuencia de uno de la invención y secuencias sustancialmente idénticas a estas, o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos. Como se ha comentado anteriormente, tales polímeros se pueden obtener insertando un ácido nucleico que codifica el polipéptido en un vector de manera que la secuencia codificante esté conectada operablemente a una secuencia capaz de dirigir la expresión del polipéptido codificado en una célula huésped adecuada. Por ejemplo, el vector de expresión puede comprender un promotor, un sitio de unión al ribosoma para el inicio de la traducción y un terminador de la transcripción. El vector puede incluir también secuencias apropiadas para amplificar la expresión.
Los polipéptidos o fragmentos homólogos se pueden obtener a través de procedimientos bioquímicos de enriquecimiento o purificación. La secuencia de polipéptidos o fragmentos potencialmente homólogos se puede determinar mediante digestión con xilano hidrolasa, electroforesis en gel y/o microsecuenciación. La secuencia de polipéptido o fragmento homólogos probable se puede comparar con uno de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas, o un fragmento que comprende al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos utilizando cualquiera de los programas descritos anteriormente.
El análisis para determinar si los fragmentos de variantes conservan la actividad enzimática de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas incluye las etapas de: poner en contacto el fragmento de polipéptido o variante con una molécula sustrato en condiciones que permitan al fragmento de polipéptido o variante funcionar y detectar cualquier descenso en el nivel de sustrato o un incremento en el nivel del producto de reacción
5
10
15
20
25
30
35
40
45
50
55
60
65
específico de la reacción entre el polipéptido y sustrato.
Los polipéptidos de la invención y secuencias sustancialmente idénticas a estas o fragmentos que comprenden al menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de los mismos se pueden utilizar en una variedad de aplicaciones. Por ejemplo, los polipéptidos o fragmentos de los mismos se pueden utilizar para catalizar reacciones bioquímicas. De acuerdo con un aspecto de la invención, se proporciona un procedimiento para la utilización de los polipéptidos de la invención y secuencias sustancialmente idénticas a estas o polinucleótidos que codifican tales polipéptidos para hidrolizar los enlaces glicosídicos. En tales procedimientos, una sustancia que contiene un enlace glicosídico (por ejemplo, un almidón) se pone en contacto con uno de los polipéptidos de la invención, o secuencias sustancialmente idénticas a estas en condiciones que faciliten la hidrólisis del enlace glicosídico.
La presente invención explota las propiedades catalíticas únicas de las enzimas. Mientras que el uso de biocatalizadores (es decir, enzimas purificadas o brutas, células no vivas o vivas) en transformaciones químicas requiere normalmente la identificación de un biocatalizador concreto que reacciona con un compuesto de partida específico, la presente invención utiliza biocatalizadores seleccionados y condiciones de reacción que son específicas para grupos funcionales que están presentes en muchos compuestos de partida, tales como moléculas pequeñas. Cada biocatalizador es específico para un grupo funcional, o varios grupos funcionales relacionados y puede reaccionar con muchos compuestos de partida que contienen este grupo funcional.
Las reacciones biocatalíticas producen una población de derivados a partir de un solo compuesto de partida. Estos derivados se pueden someter a otra ronda de reacciones biocatalíticas para producir una segunda población de compuestos derivados. Se pueden producir miles de variaciones de la molécula pequeña o compuestos originales con cada iteración de la derivatización biocatalítica.
Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar al resto de la molécula, un procedimiento que es muy difícil de lograr utilizando métodos químicos tradicionales. Este alto grado de especificidad biocatalítica proporciona los medios para identificar un solo compuesto activo dentro de la biblioteca. La biblioteca está caracterizada por la serie de reacciones biocatalíticas para producirla, una denominada "historia biosintética". La detección selectiva de la biblioteca para determinar las actividades biológicas y el trazado de la historia biosintética identifica la secuencia de reacción específica que produce el compuesto activo. La secuencia de reacción se repite y se determina la estructura del compuesto sintetizado. Este modo de identificación, a diferencia de otros enfoques de síntesis y detección selectiva, no requiere tecnologías de inmovilización y los compuestos se pueden sintetizar y someter a ensayo libres en solución utilizando virtualmente cualquier tipo de análisis de detección selectiva. Resulta importante observar, que el alto grado de especificidad de las reacciones enzimáticas sobre grupos funcionales permite el "seguimiento" de reacciones enzimáticas específicas que constituyen la biblioteca producida biocatalíticamente.
Muchas de las etapas procedimentales se realizan utilizando automatización robótica que posibilita la ejecución de muchos miles de reacciones biocatalíticas y análisis de detección selectiva por día así como la garantía de un alto nivel de exactitud y reproducibilidad. Como resultado, se puede producir una biblioteca de compuestos derivados en cuestión de semanas que podría tardar años en producirse utilizando los métodos químicos actuales.
En un aspecto concreto, la invención proporciona un método para modificar moléculas pequeñas, que comprende poner en contacto un polipéptido codificado por un polinucleótido descrito en el presente documento o fragmentos enzimáticamente activos del mismo con una molécula pequeña para producir una molécula pequeña modificada. Se somete a ensayo una biblioteca de moléculas pequeñas modificadas para determinar si una molécula pequeña modificada está presente en la biblioteca que exhibe una actividad deseada. Se identifica una reacción biocatalítica específica que produces la molécula pequeña modificada de actividad deseada eliminando sistemáticamente cada una de las reacciones biocatalíticas utilizadas para producir una porción de la biblioteca y después sometiendo a ensayo las moléculas pequeñas producidas en la porción de la biblioteca para determinar la presencia o ausencia de la molécula pequeña modificada con la actividad deseada. Las reacciones biocatalíticas específicas producen la molécula pequeña modificada de actividad deseada se repite opcionalmente. Las reacciones biocatalíticas se llevan a cabo con un grupo de biocatalizadores que reaccionan con radicales estructurales distintos encontrados en la estructura de una molécula pequeña, cada biocatalizador es específico para un radical estructural o un grupo de radicales estructurales relacionados; y cada biocatalizador reacciona con muchas moléculas pequeñas diferentes que contienen el radical estructural distinto.
Secuencias señal de Xilanasa, dominios prepro y catalíticos
Las secuencias señal (por ejemplo, péptidos señal (SP)), dominios prepro y dominios catalíticos (CD) pueden ser péptidos aislados, sintéticos o recombinantes o puede ser parte de una proteína de fusión, por ejemplo, en forma de un dominio heterólogo en una proteína quimérica. Los ácidos nucleicos codifican estos dominios catalíticos (CD), dominios prepro y secuencias señal (SP, por ejemplo, un péptido que tiene una secuencia que comprende/consiste en residuos amino terminales de un polipéptido de la invención). Una secuencia señal comprende un péptido que comprende/consiste en una secuencia como la mostrada en los residuos 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a
20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35,
1 a 36, 1 a 37, 1 a 38, 1 a 39, 1 a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44 de un polipéptido de la invención.
Una secuencia señal comprende un péptido que comprende/consiste en una secuencia como la mostrada en la 5 Tabla 4 de a continuación. Por ejemplo, al leer la Tabla 4, una secuencia señal comprende/consiste en los residuos 1 a 23 de la SEQ ID NO: 102 (codificado por la SEQ ID NO: 101), una secuencia señal comprende/consiste en los
residuos 1 a 41 de la SEQ ID NO: 104 (codificado por la SEQ ID NO: 103), etc.
Tabla 4: secuencias señal ilustrativas
SEQ ID NO:
Secuencia señal (posiciones de aminoácido)
101, 102
1-23
103, 104
1-41
105, 106
1-22
109, 110
1-26
11, 12
1-28
113, 114
1-28
119, 120
1-33
121, 122
1-20
123, 124
1-20
131, 132
1-26
135, 136
1-25
139, 140
1-24
141, 142
1-25
143, 144
1-32
147, 148
1-28
149, 150
1-18
15, 16
1-20
151, 152
1-21
153, 154
1-16
155, 156
1-21
157, 158
1-29
159, 160
1-23
161, 162
1-32
163, 164
1-26
165, 166
1-23
167, 168
1-36
169, 170
1-24
17, 18
1-31
171, 172
1-29
173, 174
1-22
175, 176
1-27
177, 178
1-26
179, 180
1-19
181, 182
1-25
183, 184
1-32
185, 186
1-27
187, 188
1-28
19, 20
1-29
191, 192
1-27
193, 194
1-21
195, 196
1-23
197, 198
1-28
199, 200
1-30
203, 204
1-30
205, 206
1-29
207, 208
1-27
209, 210
1-25
21, 22
1-28
211, 212
1-29
215, 216
1-31
217, 218
1-29
219, 220
1-23
221, 222
1-24
SEQ ID NO:
Secuencia señal (posiciones de aminoácido)
223, 224
1-28
225, 226
1-25
227, 228
1-39
229, 230
1-28
23, 24
1-29
231, 232
1-41
233, 234
1-26
235, 236
1-28
237, 238
1-32
239, 240
1-30
241, 242
1-28
243, 244
1-33
245, 246
1-32
249, 250
1-33
253, 254
1-24
255, 256
1-51
259, 260
1-24
261, 262
1-26
263, 264
1-29
267, 268
1-30
27, 28
1-27
271, 272
1-22
273, 274
1-74
277, 278
1-19
279, 280
1-22
283, 284
1-28
287, 288
1-23
289, 290
1-22
295, 296
1-26
299, 300
1-24
301, 302
1-28
303, 304
1-74
305, 306
1-32
309, 310
1-20
311, 312
1-33
313, 314
1-22
315, 316
1-28
319, 320
1-27
325, 326
1-27
327, 328
1-29
329, 330
1-35
33, 34
1-23
331, 332
1-28
333, 334
1-30
335, 336
1-50
339, 340
1-23
341, 342
1-45
347, 348
1-20
349, 350
1-20
351, 352
1-73
353, 354
1-18
355, 356
1-21
357, 358
1-25
359, 360
1-31
361, 362
1-26
365, 366
1-65
367, 368
1-23
369, 370
1-27
39, 40
1-24
41, 42
1-37
45, 46
1-25
47, 48
1-26
SEQ ID NO:
Secuencia señal (posiciones de aminoácido)
5, 6
1-47
51, 52
1-30
53, 54
1-37
55, 56
1-24
57, 58
1-22
59, 60
1-21
63, 64
1-20
65, 66
1-22
67, 68
1-28
69, 70
1-25
7, 8
1-57
73, 74
1-21
75, 76
1-22
77, 78
1-27
79, 80
1-36
83, 84
1-30
87, 88
1-29
89, 90
1-40
9, 10
1-36
95, 96
1-24
99, 100
1-33
SEQ ID NO:
Secuencia señal (posiciones de aminoácidos) Secuencia señal FUENTE
385, 386
1-25 ADLRRRRLLQAAATLPLLGWCSAQA Ambiental
387, 388
1-28 MLKVLRKPVLSGLSLALLLPVGITSVGA Ambiental
389, 390
1-25 MSVKPFWRQWILCFMVMFFSAQAAA Ambiental
391, 392
1-22 MMKGFRWCVMAMVVMAATNVRA Ambiental
393, 394
1-36 MVMEGKGLLMRRRSVSLLGLAGLLAVPL TVLPQAQA Bacteria
395, 396
1-30 MKVFRNSIIRKSVVLFCAVLWILPAGLSLA Ambiental
397, 398
Ambiental
399, 400
1-28 MTSGRNTCVCLLLIVLAIGLLSKPPASA Ambiental
401, 402
1-26 MLKVLRKPIISGLALALLLPAGAAGA Ambiental
403, 404
1-34 MSQLDLNLKLFRRVFFALVLTSIIASVLSASVAS Ambiental
405, 406
Ambiental
407, 408
1-26 MAFSKDKASFTRRSAIAAGLAAGVSA Ambiental
409, 410
1-19 MKVTAAFAGLLATVLAAPA Ambiental
411, 412
1-19 MVAFTSLLAGFAAIAGVLS Ambiental
413, 414
1-34 MKKRQGFIKKG LVLGVSLLLLALIMMSATSQTSA Ambiental
415, 416
1-22 MKGFRWCVLAVLMLAATNLRAA Ambiental
417, 418
1-21 MNVLRSGLVTMLLLAAFSVQA Ambiental
419, 420
1-19 MLVRLLIAMTVLFSAFAHA Ambiental
421, 422
1-16 MKANIIFCLLAPLVAA Ambiental
423, 424
1-35 MPTGLRAKPCLTRWLAASACALAPLLLGAPASALA Ambiental
425, 426
1-23 MLQTIALIFLALVILIALLISFR Ambiental
427, 428
Ambiental
429, 430
1-21 MNVLRSGIVTMLLLAAFSVQA Ambiental
431, 432
1-19 MVQIKAAALAVLFASNVLS Ambiental
433, 434
1-39 MNTLLPRRRLWSSTAILRTLAAGALAAGMVLAPVSAANA Ambiental
435, 436
Cochliobolus heterostrophus ATCC 48331
437, 438
1-23 MRKPACATLAVMMSLLFTPFSQA Ambiental
439, 440
Ambiental
441, 442
Ambiental
443, 444
Ambiental
445, 446
1-21 MKNIILNLSPVVFALLILTAA Ambiental
447, 448
1-22 MNALRTGAILVLMLAAAQVSAA Ambiental
449, 450
1-22 MMKAFRWCVIALMLAAAPLRAA Ambiental
451, 452
Ambiental
SEQ ID NO:
Secuencia señal (posiciones de aminoácidos) Secuencia señal FUENTE
453, 454
Cochliobolus heterostrophus ATCC 48332
455, 456
Bacteria
457, 458
Ambiental
459, 460
Cochliobolus heterostrophus ATCC 48333
461, 462
1-22 MWQRSKTLVLVLGLLLSHQAFA Ambiental
463, 464
Ambiental
465, 466
Ambiental
467, 468
1-16 MKFFTVLLFFLSFVFS Bacteria
469, 470
Ambiental
471, 472
1-21 MRIHWLGLSSRASLMTAALLA Ambiental
473, 474
Ambiental
475, 476
1-28 MKTHSFNLRSRITLLTAALLFIGATAGA Ambiental
477, 478
1-29 MKRFLSWSLTGILVASALVALALPGSSQA Ambiental
479, 480
1-16 MKVFATLAGLLATALA Ambiental

Claims (27)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un ácido nucleico aislado, sintético o recombinante que comprende
    (a) un ácido nucleico que codifica al menos un polipéptido, en el que el ácido nucleico comprende (i) SEQ ID NO: 383 o (ii) la secuencia de la SEQ ID NO: 481,
    donde el ácido nucleico codifica al menos un polipéptido que tiene una actividad xilanasa,
    y, opcionalmente, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual,
    y, opcionalmente, el algoritmo de comparación de secuencias es un algoritmo de BLAST versión 2.2.2 donde una configuración de filtrado se establece en blastall -p blastp -d "nr pataa" -F F, y todas las otras opciones se establecen por defecto;
    (b) un ácido nucleico que codifica al menos un polipéptido que tiene una actividad xilanasa, en el que el polipéptido comprende la secuencia de la SEQ ID NO: 384 o SEQ ID NO: 482;
    (c) (i) el ácido nucleico de (a) o (b) y que codifica un polipéptido que tiene al menos una sustitución conservadora de aminoácidos y que conserva su actividad xilanasa; o, (ii) el ácido nucleico de (c) (i), donde la al menos una sustitución conservadora de aminoácidos comprende sustituir un aminoácido por otro aminoácido de características similares; o una sustitución conservadora comprende: reemplazo de un aminoácido alifático por otro aminoácido alifático; reemplazo de una Serina por una Treonina o viceversa; reemplazo de un residuo ácido por otro residuo ácido; reemplazo de un residuo que porta un grupo amida por otro residuo que porta un grupo amida; intercambio de un residuo básico por otro residuo básico; o reemplazo de un residuo aromático por otro residuo aromático;
    (d) el ácido nucleico de (a), (b) o (c) que codifica un polipéptido que tiene dicha actividad xilanasa pero que carece de una secuencia señal, un dominio prepro, un dominio de dockerina y/o un módulo de unión a carbohidrato (CBM);
    (e) el ácido nucleico de (a), (b), (c) o (d) que codifica un polipéptido que tiene dicha actividad xilanasa que comprende además una secuencia heteróloga;
    (f) el ácido nucleico de (e), donde la secuencia heteróloga comprende o consiste en una secuencia que codifica: (i) una secuencia señal heteróloga, un módulo de unión a carbohidrato heterólogo, un dominio de dockerina heterólogo, un dominio catalítico heterólogo (CD) o una combinación de los mismos; (ii) la secuencia de (i), donde la secuencia señal heteróloga, el módulo de unión a carbohidrato o el dominio catalítico (CD) se deriva de una enzima heteróloga; o (iii) una etiqueta, un epítopo, un péptido de dirección, una secuencia escindible, un resto detectable o una enzima;
    (g) el ácido nucleico de (f), donde el módulo de unión a carbohidrato heterólogo (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión a mannanasa, un módulo específico de xiloglucano y/o un módulo de unión a arabinofuranosidasa;
    (h) el ácido nucleico de (f), donde la secuencia señal heteróloga dirige la proteína codificada a una vacuola, el retículo endoplásmico, un cloroplasto o un gránulo de almidón; o
    (i) una secuencia de ácido nucleico completamente complementaria a (a), (b), (c), (d), (e), (f), (g) o (h).
  2. 2. Un ácido nucleico aislado, sintético o recombinante que codifica un polipéptido que tiene actividad xilanasa, donde el ácido nucleico comprende
    (a) al menos una modificación de secuencia de la secuencia de la SEQ ID NO: 383 o SEQ ID NO: 481,
    donde la modificación de secuencia comprende al menos uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios:
    los nucleótidos en el equivalente de los residuos 10 a 12 de la SEQ ID NO: 383 se cambian a CCT, TTA, TTG, CTC, CTA o CTG,
    los nucleótidos en el equivalente de los residuos 25 a 27 de la SEQ ID NO: 383 se cambian a CCC, CCG, CCA o CCT,
    los nucleótidos en el equivalente de los residuos 28 a 30 de la SEQ ID NO: 383 se cambian a TCA, TCC, TCT, TCG, AGT o AGC,
    los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TTT o TTC,
    los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TAC o TAT,
    los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a ATA, ATT o ATC,
    los nucleótidos en el equivalente de los residuos 37 a 39 de la SEQ ID NO: 383 se cambian a TGG,
    los nucleótidos en el equivalente de los residuos 40 a 42 de la SEQ ID NO: 383 se cambian a CAC o CAT,
    los nucleótidos en el equivalente de los residuos 52 a 54 de la SEQ ID NO: 383 se cambian a TTC o TTT,
    los nucleótidos en el equivalente de los residuos 73 a 75 de la SEQ ID NO: 383 se cambian a GAG o GAA, los nucleótidos en el equivalente de los residuos 73 a 75 de la SEQ ID NO: 383 se cambian a CCC, CCG, CCA o CCT,
    los nucleótidos en el equivalente de los residuos 88 a 90 de la SEQ ID NO: 383 se cambian a GTG, GTC,
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    GTA o GTT,
    los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TGT o TGC,
    los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a CAT o CAC,
    los nucleótidos en el equivalente de los residuos 100 a 102 de la SEQ ID NO: 383 se cambian a TTG, TTA, CTT, CTC, CTA o CTG,
    los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAG o GAA,
    los nucleótidos en el equivalente de los residuos 103 a 105 de la SEQ ID NO: 383 se cambian a GAT o GAC,
    los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a ACA, ACT, ACC o ACG,
    los nucleótidos en el equivalente de los residuos 211 a 213 de la SEQ ID NO: 383 se cambian a TGT o TGC o
    los nucleótidos en el equivalente de los residuos 508 a 582 de la SEQ ID NO: 383 se cambian a CAT o CAC; o
    (b) al menos una modificación de secuencia de la SEQ ID NO: 383, y la al menos una modificación de la SEQ ID NO: 383 comprende un cambio en:
    los nucleótidos en los residuos 10 a 12 son CCT, TTA, TTG, CTC, CTA o CTG,
    los nucleótidos en los residuos 25 a 27 son CCC, CCG, CCA o CCT,
    los nucleótidos en los residuos 28 a 30 son TCA, TCC, TCT, TCG, AGT o AGC,
    los nucleótidos en los residuos 37 a 39 son TTT o TTC,
    los nucleótidos en los residuos 37 a 39 son TAC o TAT,
    los nucleótidos en los residuos 37 a 39 son ATA, ATT o ATC,
    los nucleótidos en los residuos 37 a 39 son TGG,
    los nucleótidos en los residuos 40 a 42 son CAC o CAT,
    los nucleótidos en los residuos 52 a 54 son TTC o TTT,
    los nucleótidos en los residuos 73 a 75 son GAG o GAA,
    los nucleótidos en los residuos 73 a 75 son CCC, CCG, CCA o CCT,
    los nucleótidos en los residuos 88 a 90 son GTG, GTC, GTA o GTT,
    los nucleótidos en los residuos 100 a 102 son TGT o TGC,
    los nucleótidos en los residuos 100 a 102 son CAT o CAC,
    los nucleótidos en los residuos 100 a 102 son TTG, TTA, CTT, CTC, CTA o CTG,
    los nucleótidos en los residuos 103 a 105 son GAG o GAA,
    los nucleótidos en los residuos 103 a 105 son GAT o GAC,
    los nucleótidos en los residuos 211 a 213 son ACA, ACT, ACC o ACG,
    los nucleótidos en los residuos 211 a 213 son TGT o TGC o
    los nucleótidos en los residuos 508 a 582 son CAT o CAC.
  3. 3. Un casete de expresión, un vector o un vehículo de clonación que comprende un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2, donde, opcionalmente, el vehículo de clonación comprende un vector viral, un plásmido, un fago, un fagemido, un cósmido, un fósmido, un bacteriófago o un cromosoma artificial, donde, opcionalmente, el vector viral comprende un vector de adenovirus, un vector retroviral o un vector viral adenoasociado o el cromosoma artificial comprende un cromosoma artificial bacteriano (BAC), un vector derivado del bacteriófago P1 (PAC), un cromosoma artificial de levadura (YAC) o un cromosoma artificial de mamífero (MAC).
  4. 4. Una célula transformada que comprende un ácido nucleico que tiene una secuencia de la reivindicación 1 o 2, o que comprende un casete de expresión, un vector o un vehículo de clonación como se expone en la reivindicación 3, donde, opcionalmente, la célula es una célula bacteriana, una célula de mamífero, un célula fúngica, una célula de levadura, una célula de insecto o una célula de planta.
  5. 5. Un animal no humano, planta, parte de planta o semilla de planta transgénico que comprende un ácido nucleico que tiene una secuencia de la reivindicación 1 o 2,
    donde, opcionalmente, la planta es una planta de maíz, una planta de sorgo, una planta de patata, una planta de tomate, una planta de trigo, una planta oleaginosa, una planta de colza, una planta de soja, una planta de arroz, una planta de cebada, una hierba, una planta de algodón, una planta de semilla de algodón, una palmera, una planta de sésamo, una planta de cacahuete, una planta de girasol o una planta de tabaco y
    donde, opcionalmente, el animal es un ratón, una rata, un conejo, una oveja, un cerdo, un pollo, una cabra, un pez o una vaca.
  6. 6. Un polipéptido o péptido aislado, sintético o recombinante que tiene una actividad xilanasa que comprende:
    (a) una secuencia de aminoácidos (i) SEQ ID NO: 384, o (ii) SEQ ID NO: 482,
    donde, opcionalmente, las identidades de secuencia se determinan mediante análisis con un algoritmo de comparación de secuencias o mediante una inspección visual, y, opcionalmente, el algoritmo de comparación de secuencias es un algoritmo BLAST versión 2.2.2, donde una configuración de filtrado se establece en blastall -p blastp -d "nr pataa "-FF, y todas las demás opciones están configuradas por defecto;
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    (b) una secuencia de aminoácidos codificada por el ácido nucleico de la reivindicación 1, donde el polipéptido tiene actividad xilanasa;
    (c) la secuencia de aminoácidos de (a) o (b), y que comprende al menos una sustitución conservadora de residuo de aminoácido, y el polipéptido retiene dicha actividad xilanasa;
    (d) la secuencia de aminoácidos de (c), donde la sustitución conservadora comprende la sustitución de un aminoácido alifático por otro aminoácido alifático; reemplazo de una serina por una treonina o viceversa; reemplazo de un residuo ácido por otro residuo ácido; reemplazo de un residuo que porta un grupo amida por otro residuo que porta un grupo amida; intercambio de un residuo básico por otro residuo básico; o reemplazo de un residuo aromático por otro residuo aromático, o una combinación de los mismos,
    y, opcionalmente, el residuo alifático comprende alanina, valina, leucina, isoleucina o un equivalente sintético del mismo; el residuo ácido comprende ácido aspártico, ácido glutámico o un equivalente sintético del mismo; el residuo que comprende un grupo amida comprende ácido aspártico, ácido glutámico o un equivalente sintético del mismo; el residuo básico comprende lisina, arginina o un equivalente sintético del mismo; o el residuo aromático comprende fenilalanina, tirosina o un equivalente sintético del mismo;
    (e) el polipéptido de (a), (b), (c) o (d) que tiene dicha actividad xilanasa pero carece de una secuencia señal, un dominio prepro, un dominio de dockerina y/o un módulo de unión a carbohidrato (CBM),
    donde, opcionalmente, el módulo de unión a carbohidrato (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión a mannanasa, un módulo específico de xiloglucano y/o módulo de unión a arabinofuranosidasa;
    (f) el polipéptido de (a), (b), (c), (d) o (e) que tiene dicha actividad xilanasa que comprende además una secuencia heteróloga;
    (g) el polipéptido de (f), donde la secuencia heteróloga comprende, o consiste en: (i) una secuencia señal heteróloga, un módulo de unión a carbohidrato heterólogo, un dominio de dockerina heterólogo, un dominio catalítico heterólogo (CD) o una combinación de los mismos; (ii) la secuencia de (ii), donde la secuencia señal heteróloga, el módulo de unión a carbohidrato o el dominio catalítico (CD) se deriva de una enzima lignocelulósica heteróloga; y/o (iii) una etiqueta, un epítopo, un péptido de dirección, una secuencia escindible, un resto detectable o una enzima;
    (h) el polipéptido de (g), donde el módulo de unión a carbohidrato heterólogo (CBM) comprende, o consiste en, un módulo de unión a xilano, un módulo de unión a celulosa, un módulo de unión a lignina, un módulo de unión a xilosa, un módulo de unión a manano, un módulo específico de xiloglucano y/o un módulo de unión a arabinofuranosidasa;
    (i) polipéptido de (g), donde la secuencia señal heteróloga dirige la proteína codificada a una vacuola, el retículo endoplásmico, un cloroplasto o un gránulo de almidón;
    (j) el polipéptido de (a), (b), (c), (d), (e), (f), (g), (h) o (i), donde la actividad xilanasa comprende catalizar la hidrólisis de enlaces p-1,4-xilosídicos internos; comprende una actividad endo-1,4-beta-xilanasa; comprende hidrolizar un xilano o un arabinoxilano para producir un xilo-oligómero y xilosa de menor peso molecular; comprende hidrolizar un polisacárido que comprende una D-xilopiranosa enlazada a 1,4-p-glucósido; comprende hidrolizar una celulosa o una hemicelulosa; comprende hidrolizar una celulosa o una hemicelulosa en una madera, producto de madera, pasta de papel, producto de papel o desecho de papel; comprende catalizar la hidrólisis de un xilano o un arabinoxilano en un pienso o un producto alimenticio; o comprende catalizar la hidrólisis de un xilano o un arabinoxilano en una célula microbiana o una célula vegetal, donde, opcionalmente, el xilano o arabinoxilano comprende un arabinoxilano soluble en agua, y, opcionalmente, el xilano o arabinoxilano soluble en agua comprende una masa o un producto de pan, donde, opcionalmente, el pienso o producto alimenticio comprende un alimento para animales a base de cereales, un mosto o una cerveza, una leche o un producto lácteo, una fruta o un vegetal; o
    (k) el polipéptido de (a), (b), (c), (d), (e), (f), (g), (h), (i) o (j), donde, opcionalmente, el polipéptido comprende al menos un sitio de glicosilación o comprende, además, un polisacárido, donde, opcionalmente, la glicosilación es una glicosilación ligada a N, y, opcionalmente, el polipéptido está glicosilado después de expresarse en un P. pastoris o un S. pombe.
  7. 7. Un polipéptido aislado, sintético o recombinante que tiene actividad xilanasa, donde el polipéptido tiene una secuencia que comprende:
    (a) una modificación de secuencia de la secuencia de la SEQ ID NO: 384 o SEQ ID NO: 482,
    donde la modificación de secuencia comprende al menos uno, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete, dieciocho, diecinueve o todos los siguientes cambios :
    el aminoácido en el equivalente de la treonina en el residuo 4 de la SEQ ID NO: 384 es leucina, el aminoácido en el equivalente de la serina en el residuo 9 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la glutamina en el residuo 10 de la SEQ ID NO: 384 es serina, el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es fenilalanina,
    el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es tirosina,
    el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es isoleucina,
    el aminoácido en el equivalente de la treonina en el residuo 13 de la SEQ ID NO: 384 es triptófano,
    el aminoácido en el equivalente de la asparagina en el residuo 14 de la SEQ ID NO: 384 es histidina,
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    el aminoácido en el equivalente de la tirosina en el residuo 18 de la SEQ ID NO: 384 es fenilalanina, el aminoácido en el equivalente de la serina en el residuo 25 de la SEQ ID NO: 384 es ácido glutámico, el aminoácido en el equivalente de la serina en el residuo 25 de la SEQ ID NO: 384 es prolina, el aminoácido en el equivalente de la asparagina en el residuo 30 de la SEQ ID NO: 384 es valina, el aminoácido en el equivalente de la glutamina en el residuo 34 de la SEQ ID NO: 384 es cisteína, el aminoácido en el equivalente de la glutamina en el residuo 34 de la SEQ ID NO: 384 es histidina, el aminoácido en el equivalente de la glutamina en el residuo 34 de la SEQ ID NO: 384 es leucina, el aminoácido en el equivalente de la serina en el residuo 35 de la SEQ ID NO: 384 es ácido glutámico,
    el aminoácido en el equivalente de la serina en el residuo 35 de la SEQ ID NO: 384 es ácido aspártico,
    el aminoácido en el equivalente de la serina en el residuo 71 de la SEQ ID NO: 384 es treonina,
    el aminoácido en el equivalente de la serina en el residuo 71 de la SEQ ID NO: 384 es cisteína o
    el aminoácido en el equivalente de la serina en el residuo 194 de la SEQ ID NO: 384 es histidina; o
    (b) uno o más de los siguientes cambios a la secuencia de aminoácidos de la SEQ ID NO: 384:
    la treonina en la posición 4 de aminoácido es leucina, la serina en la posición 9 de aminoácido es prolina, la glutamina en la posición 10 de aminoácido es serina, la treonina en la posición 13 de aminoácido es fenilalanina, la treonina en la posición 13 de aminoácido es tirosina, la treonina en la posición 13 de aminoácido es isoleucina, la treonina en la posición 13 de aminoácido es triptófano, la asparagina en la posición 14 de aminoácido es histidina, la tirosina en la posición 18 de aminoácido es fenilalanina, la serina en la posición 25 de aminoácido es ácido glutámico,
    la serina en la posición 25 de aminoácido es prolina,
    la asparagina en la posición 30 de aminoácido es valina, la glutamina en la posición 34 de aminoácido es cisteína, la glutamina en la posición 34 de aminoácido es histidina, la glutamina en la posición 34 de aminoácido es leucina, la serina en la posición 35 de aminoácido es ácido glutámico,
    la serina en la posición 35 de aminoácido es ácido aspártico,
    la serina en la posición 71 de aminoácido es treonina,
    la serina en la posición 71 de aminoácido es cisteína o
    la serina en la posición 194 de aminoácido es histidina.
  8. 8. Una composición que comprende un polipéptido de la reivindicación 6 o 7,
    donde, opcionalmente, la composición es una composición farmacéutica, una composición detergente, una solución para lentes de contacto, una composición para el tratamiento de desechos, una pastilla o jabón líquido, o un chicle, pastilla o caramelo,
    donde, opcionalmente, la composición es un alcohol, donde, opcionalmente, el alcohol es etanol, donde, opcionalmente, la composición es un papel, desperdicio de papel, productos de papel reciclado, papel periódico, pasta de papel, madera, producto de madera, desecho de madera, pasta de madera, pasta Kraft, pasta de lignocelulosa, textil, tela, hilo o un paño,
    donde, opcionalmente, la composición es una bebida, un alimento, un pienso o un suplemento nutricional, donde, opcionalmente, la comida es una masa o un pan,
    donde, opcionalmente, la bebida, alimento, pienso o suplemento nutricional es para un animal.
  9. 9. Un método para producir un polipéptido recombinante que comprende las etapas de: (I) (a) proporcionar un ácido nucleico, donde el ácido nucleico comprende una secuencia de la reivindicación 1 o 2; y (b) expresar el ácido nucleico de la etapa (a) en condiciones que permitan la expresión del polipéptido, produciendo de ese modo un polipéptido recombinante, y, opcionalmente, el método comprende además transformar una célula huésped con el ácido nucleico de la etapa (a) seguido de expresión del ácido nucleico de la etapa (a), produciendo de este modo un polipéptido recombinante en una célula transformada; o (II) (a) proporcionar un vector que comprende el ácido nucleico de la reivindicación 1; y (b) expresar el vector de (a), en el que la expresión opcionalmente se efectúa mediante el uso de un promotor de alta actividad, un vector dicistrónico o mediante amplificación génica del vector.
  10. 10. Un polipéptido quimérico que comprende (a) un polipéptido o péptido que comprende una secuencia de la reivindicación 6 o 7, y (b) (i) una secuencia como se establece en los residuos 1 a 12, 1 a 13, 1 a 14, 1 a 15, 1 a 16,
    1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a
    32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 39, 1a 40, 1 a 41, 1 a 42, 1 a 43, 1 a 44, 1 a 45, 1 a 46, 1 a 47,
    1 a 48, 1 a 49 o 1 a 50, de un polipéptido de la reivindicación 6 o 7; (ii) una secuencia como se establece en la Tabla 4; o (iii) un módulo de unión a carbohidrato heterólogo (CBM); donde, opcionalmente, el CBM comprende un CBM3a, CBM3b, CBM4, CBM6, CBM22 o X14, o una subsecuencia de unión a carbohidrato que comprende un X14 como se establece en la Tabla 9.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
  11. 11. Un método para hidrolizar, licuar, romper o fragmentar una composición que comprende xilano que comprende las siguientes etapas:
    (a) proporcionar una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2;
    (b) proporcionar una composición que comprende un xilano; y
    (c) poner en contacto el polipéptido de la etapa (a) con la composición de la etapa (b) en condiciones en las que la xilanasa hidroliza, licua, rompe o fragmenta la composición que comprende xilano,
    donde, opcionalmente, la composición comprende una célula vegetal, una célula bacteriana, una célula de levadura, una célula de insecto o una célula animal.
  12. 12. Un método de producción de alimentos, piensos, suplementos nutricionales o bebidas, que comprende el uso de al menos una xilanasa de la reivindicación 6 o 7, o el polipéptido está codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2.
  13. 13. Un método para blanquear, decolorar o destintar una composición que comprende poner en contacto la composición con una xilanasa de la reivindicación 6 o 7, o una xilanasa codificada por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2,
    donde, opcionalmente, la composición es un papel, desperdicio de papel, producto de papel reciclado, papel periódico, pasta de papel, madera, producto de madera, desecho de madera, pasta de madera, pasta Kraft, pasta de lignocelulosa, textil, tela, hilo o un paño,
    donde, opcionalmente, el método comprende adicionalmente el contacto con un agente blanqueador, donde, opcionalmente, el agente blanqueador comprende oxígeno o peróxido de hidrógeno;
    donde, opcionalmente, el método comprende adicionalmente una etapa de filtración y, opcionalmente, se genera un filtrado,
    y, opcionalmente, el método comprende además reciclar el filtrado, y, opcionalmente, se recogen finos del filtrado; y, opcionalmente, el método comprende adicionalmente una etapa de mezclado, y, opcionalmente, la xilanasa, una mannanasa y/o una glucanasa se añade en múltiples puntos de tiempo o paso por paso en el método, y, opcionalmente, la xilanasa se añade en diferentes momentos o paso por paso en el proceso de blanqueo; y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa, una mannanasa y/o una glucanasa;
    y, opcionalmente, el método comprende condiciones de temperatura alta y pH alto.
  14. 14. Un método para reducir, liberar o solubilizar lignina en una composición que comprende poner en contacto la composición con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2,
    donde, opcionalmente, la composición es un papel, desperdicio de papel, producto de papel reciclado, papel periódico, pasta de papel, madera, producto de madera, desecho de madera, pasta de madera, pasta Kraft, pasta de lignocelulosa, textil, tela, hilo o un paño,
    donde, opcionalmente, el método comprende adicionalmente una etapa de filtración, y, opcionalmente, se genera un filtrado,
    y, opcionalmente, el método comprende además reciclar el filtrado, y, opcionalmente, se recogen finos del filtrado; y, opcionalmente, el método comprende además una etapa de mezcla y, opcionalmente, la xilanasa se añade en múltiples puntos de tiempo o paso por paso en el método,
    y, opcionalmente, el método comprende además un proceso de blanqueo, y, opcionalmente, la xilanasa se añade en diferentes momentos o paso por paso en el proceso de blanqueo;
    y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa; y, opcionalmente, el método comprende condiciones de temperatura alta y pH alto; y, opcionalmente, después del método, la pasta tiene una consistencia de aproximadamente 10 %.
  15. 15. Un método para tratar una madera, una pasta de madera, una pasta Kraft, un producto de papel, un papel o una pasta de papel, comprendiendo el método las siguientes etapas:
    (a) proporcionar al menos una xilanasa de la reivindicación 6 o 7, o una xilanasa codificada por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2;
    (b) proporcionar una madera, una pasta de madera, una pasta Kraft, un papel, un producto de papel o una pasta de papel; y
    (c) poner en contacto la madera, la pasta de madera, la pasta Kraft, el papel, el producto de papel o la pasta de papel con el polipéptido de la etapa (a),
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    donde el polipéptido cataliza la hidrólisis de compuestos en la madera, pasta de madera, pasta Kraft, papel, producto de papel o pasta de papel,
    y donde, opcionalmente, la madera, pasta de madera, pasta Kraft, papel, producto de papel o pasta de papel comprende una madera blanda y madera dura, o la madera, pasta de madera, pasta Kraft, papel o pasta de papel se deriva de una madera blanda y madera dura;
    y donde, opcionalmente, después del tratamiento, la pasta tiene una consistencia de al menos aproximadamente 10 %, o al menos aproximadamente 32 %;
    donde, opcionalmente, el método comprende adicionalmente una etapa de filtración, y, opcionalmente, se genera un filtrado,
    y, opcionalmente, el método comprende además reciclar el filtrado, y, opcionalmente, se recogen finos del filtrado; y, opcionalmente, el método comprende además una etapa de mezcla y, opcionalmente, la xilanasa se añade en múltiples puntos de tiempo o paso por paso en el método,
    y, opcionalmente, el método comprende además un proceso de blanqueo, y, opcionalmente, la xilanasa se añade en diferentes momentos o paso por paso en el proceso de blanqueo;
    y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa.
  16. 16. Un método para preparar un alcohol que comprende (a) poner en contacto una composición con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2,
    donde, opcionalmente, la composición comprende un sacárido, una hemicelulosa, una celulosa, una lignina o una
    combinación de los mismos;
    y, opcionalmente, el alcohol comprende un etanol;
    y, opcionalmente, el método comprende condiciones de temperatura alta y pH básico,
    y, opcionalmente, el método comprende además una etapa de filtración, y, opcionalmente, se genera un filtrado, y, opcionalmente, el método comprende además reciclar el filtrado, y, opcionalmente, se recogen finos del filtrado; y, opcionalmente, el método comprende adicionalmente una etapa de mezclado, y, opcionalmente, la xilanasa, una mannanasa y/o una glucanasa se añade en múltiples puntos de tiempo o paso por paso en el método, y, opcionalmente, el método comprende además un proceso de blanqueo, y, opcionalmente, la xilanasa, una mannanasa y/o una glucanasa se añade en diferentes momentos o paso por paso en el proceso de blanqueo; y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa.
  17. 17. Una mezcla o cóctel de enzimas, que comprende (a) al menos una enzima de la reivindicación 6 o 7, y una o más enzimas adicionales; (b) la mezcla o cóctel de (a), donde la una o más enzimas adicionales es otra xilanasa, glucanasas, celulasas, lipasas, esterasas, proteasas o endoglicosidasas, endo-beta-1,4-glucanasas, beta- glucanasas, endo-beta-1,3(4)-glucanasas, cutinasas, peroxidasas, catalasas, lacasas, amilasas, glucoamilasas, pectinasas, reductasas, oxidasas, fenoloxidasas, ligninasas, pullulanasas, arabinanasas, hemicelulasas, mannanasas, xiloglucanasas, pectina acetilesterasas, ramnogalacturonano acetilesterasas, poligalacturonasas, ramnogalacturonasas, galactanasas, pectina liasas, pectina metilesterasas, celobiohidrolasas y/o transglutaminasas.
  18. 18. Un proceso para hidrolizar una hemicelulosa, celulosa, lignina o sacárido en cualquier compuesto orgánico, planta o madera o producto de madera o pasta de madera o subproducto, desecho de madera, papel, pasta de papel, producto de papel o desperdicio de papel o subproducto que comprende el uso de una mezcla o cóctel de enzimas de la reivindicación 17, la xilanasa de la reivindicación 6 o 7 o el polipéptido codificado por el ácido nucleico de la reivindicación 1 o 2,
    donde, opcionalmente, el método comprende adicionalmente una etapa de filtración, y, opcionalmente, se genera un filtrado,
    y, opcionalmente, el método comprende además reciclar el filtrado (para atrapar finos);
    y, opcionalmente, el método comprende además una etapa de mezcla y, opcionalmente, la xilanasa se añade en múltiples puntos de tiempo o paso por paso en el método,
    y, opcionalmente, el método comprende además un proceso de blanqueo, y, opcionalmente, la xilanasa se añade en diferentes momentos o paso por paso en el proceso de blanqueo;
    y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa.
  19. 19. Un método para aumentar el rendimiento de una xilanasa a un pH alto (alcalino) que comprende (a) eliminar los residuos de aminoácidos "EGG" (o el equivalente) cerca o en el extremo terminal C' de una secuencia de xilanasa; (b) el método de (a), en el que el "EGG" (o el equivalente) se elimina justo (inmediatamente) después del dominio de glicosil hidrolasa de la xilanasa que se va a modificar; o (c) el método de (a) o (b), en el que la xilanasa con un
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    rendimiento aumentado comprende un polipéptido de la reivindicación 6 o 7.
  20. 20. Un método para reducir la cantidad de producto químico blanqueador en una madera, pasta de madera, producto de madera, pasta Kraft, papel, pasta de papel, producto de papel o proceso de papel reciclado, que comprende
    (a) proporcionar una xilanasa de la reivindicación 6 o 7 o un polipéptido codificado por el ácido nucleico de la reivindicación 1 o 2;
    (b) proporcionar madera, pasta de madera, producto de madera, pasta Kraft, papel, pasta de papel, producto de papel o papel reciclado; y
    (c) poner en contacto la madera, la pasta de madera, el producto de madera, la pasta Kraft, el papel, la pasta de papel, el producto de papel o el papel reciclado con el polipéptido de (a),
    donde, opcionalmente, el producto químico de blanqueo comprende un cloro, un dióxido de cloro, un agente cáustico, un peróxido o cualquier combinación de los mismos,
    donde, opcionalmente, el método comprende adicionalmente una etapa de filtración, y, opcionalmente, se genera un filtrado,
    y, opcionalmente, el método comprende además reciclar el filtrado, y, opcionalmente, se recogen finos del filtrado, y, opcionalmente, el método comprende además una etapa de mezcla y, opcionalmente, la xilanasa se añade en múltiples puntos de tiempo o paso por paso en el método,
    y, opcionalmente, el método comprende adicionalmente la adición de enzimas adicionales, y, opcionalmente, las enzimas adicionales se añaden en múltiples puntos de tiempo o paso por paso en el método;
    y, opcionalmente, el método comprende además una etapa de prelavado o una etapa de pretratamiento, y, opcionalmente, el método comprende una etapa de prelavado o un pretratamiento con la xilanasa, y, opcionalmente, las condiciones para el tratamiento después de una etapa de deslignificación con oxígeno (pasta post-O2) con la enzima xilanasa comprenden: pH de entre aproximadamente 6 a 7, dosis de enzima de aproximadamente 0,3 unidades/g, tiempo de tratamiento de entre aproximadamente 20 a 25 minutos, y, opcionalmente, el método comprende un pretratamiento de pasta post-O2 de pícea/pino/abeto (SPF) con aproximadamente 2 unidades/g de xilanasa para reducir el uso posterior de CO2 aumenta el brillo, y, opcionalmente, el método comprende un pretratamiento de materia sin blanquear SPF pre-O2 con aproximadamente 0,5 unidades/g de xilanasa para reducir el uso posterior de CO2 aumenta el brillo, y, opcionalmente, el método comprende un pretratamiento de la pasta pre-O2 de álamo con aproximadamente 0,5 unidades/g de xilanasa para reducir el uso posterior de CO2 aumenta el brillo,
    y, opcionalmente, el método comprende un pretratamiento de pasta pre-O2 de abeto de Douglas/Hemlock con aproximadamente 0,5 unidades/g de xilanasa para reducir el uso posterior de CO2 aumenta el brillo.
  21. 21. Un método para fabricar tableros que comprende poner en contacto una pasta blanqueada o sin blanquear o pasta de papel reciclado con una xilanasa de la reivindicación 6 o 7 o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2.
  22. 22. Un método para reducir álcali en cocción o para disminuir la cocción en la fabricación de tableros que comprende poner en contacto una pasta blanqueada o sin blanquear o pasta de papel reciclado con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2.
  23. 23. Un método para aumentar el número Kappa durante la cocción o aumentar la resistencia de la pasta en la fabricación de tableros, que comprende poner en contacto una pasta blanqueada o sin blanquear o papel reciclado con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2.
  24. 24. Un método para preparar un azúcar que comprende
    (a) poner en contacto una composición que contiene polisacáridos con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2, donde el contacto da como resultado la generación de un azúcar;
    (b) el método de (a), donde la composición que comprende polisacáridos comprende un sacárido, una hemicelulosa, una celulosa, una lignina o una combinación de los mismos;
    (c) el método de (a) o (b), que comprende el uso de una mezcla o cóctel de enzimas de la reivindicación 17; o
    (d) el método de (a), (b) o (c), que comprende además fermentar el azúcar para producir un alcohol.
  25. 25. Un proceso para la hidrólisis enzimática de un polisacárido que comprende
    (a) poner en contacto una composición que contiene polisacáridos con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2, donde el contacto da como resultado la hidrólisis del polisacárido para producir un azúcar;
    (b) el método de (a), donde la composición que comprende polisacáridos comprende un compuesto orgánico,
    una planta o una madera o un producto de madera o subproducto, un desecho de madera, una pasta de papel, un producto de papel o un desperdicio de papel o un subproducto;
    (c) el método de (a) o (b), que comprende el uso de una mezcla o cóctel de enzimas de la reivindicación 17;
    (d) el método de (a), (b) o (c), donde la hidrólisis del polisacárido da como resultado la generación de un azúcar 5 monomérico; o
    (e) el método de (a), (b), (c) o (d), que comprende además fermentar el carbohidrato o el azúcar para producir un alcohol.
  26. 26. Un proceso de fermentación (un proceso para convertir un carbohidrato en un alcohol) que comprende:
    10
    (a) (i) poner en contacto una composición que contiene carbohidratos con una xilanasa de la reivindicación 6 o 7, o un polipéptido codificado por un ácido nucleico que comprende una secuencia de la reivindicación 1 o 2, donde el contacto da como resultado la hidrólisis enzimática del carbohidrato; (ii) fermentar el carbohidrato generado en el paso (i) para producir un alcohol;
    15 (b) el método de (a), en el que la composición que comprende carbohidratos comprende un compuesto orgánico,
    una planta o una madera o un producto de madera o subproducto, un desecho de madera, una pasta de papel, un producto de papel o un desperdicio de papel o un subproducto;
    (c) el método de (a) o (b), que comprende el uso de una mezcla o cóctel de enzimas de la reivindicación 17; o
    (d) el método de (a), (b) o (c), donde la fermentación en la etapa (a) (ii) (la conversión del carbohidrato en el 20 alcohol) da como resultado la generación de etanol.
    imagen1
    125A
    1250
    126C
    100
    SISTEMA INFORMATICO
    105
    PROCESADOR
    i m
    \Tít\Q
    MEMORIA
    120
    □ISPOSÍTIVO CE
    Fa Talla
    RECUPERACION
    DE DATOS
    FI<j, 1
    imagen2
    ALMACENAR LA NUEVA SECUENCIA EN UNA MEMORIA
    ABRIR LA BASE DE DATOS DE SECUENCIAS
    REALIZAR LA COMPARACION DE LA NUEVA SECUENCIA Y LA SECUENCIA ALMACENADA
    IGUAL
    AL USUARIO
    y^MÁS SECUENCIA EN LA BASE DE DATOS
    J
    INICIO
    LEER LA PRIMERA SECUENCA DE LA BASE DE DATOS
    IR A LA SIGUIENTE
    SECUENC A EN LA
    BASE DE DATOS
    C2U
    MOSTRAR EL NOMBRE DE LA SECUENC A ALMACENADA
    imagen3
    IGUAL
    IGUAL
    MAS CARACTERES PARA LEER
    LEER EL PRIMER CARACTER DE LA PRIMERA SECUENCA
    r262
    LEER EL PRIMER CARACTER DE LA SEGUNDA SECUENC A
    LEER EL SIGUIENTE CARACTER DE LA PRIMERA Y
    SEGUNDA SECUENCIAS
    r276
    MOSTRAR EL NIVEL DE HOMOLOG A ENTRE LA
    PR MERA Y SEGUNDA SECUENCIAS
    INICIO
    r254
    ALMACENAR UNA PRIMERA SECUENCIA EN UNA MEMORIA
    ALMACENAR UNA SEGUNDA SECUENC A EN UNA MEMOR A
    imagen4
    INICIO
    ALMACENAR LA NUEVA SECUENCIA EN UNA MEMORIA
    LEER LA PRIMERA CARACTERISTICA DE LA BASE DE DATOS
    ENCONTRADA
    / MAS \ CARACTERÍSTICAS EN LA BASE DE ^ DATOS ^
    r306
    ABRIR UNA BASE DE DATOS DE CARACTERISTICAS DE SECUENCIA
    r3io
    COMPARAR LOS ATRIBUTOS DE LA CARACTERISTICA CON LA PRIMERA SECUENCIA
    r326
    LEER LA SIGUIENTE
    CARACTERISTICA
    EN LA BASE DE
    DATOS
    jjM
    MOSTRAR LA CARACTERISTICA ENCONTRADA AL USUARIO
    Actividad residual (%)
    Figura 5: Tolerancia Térmica de la Xilanasa de Tipo Silvetre
    (SEQ ID NOS: 189 y 190) vs 8x muíante
    imagen5
    3 & to 2 S 3 S
    Z6I.
    031
    OOt
    (O») EJniejddiudj_ 08 09
    Ofr
    03
    imagen6
    Z O
    ■D
    *r "*■ y O »
    9 * 3*
    8 2.
    OV
    Zl
    8
    96
    0¿
    ¿9
    L9
    0‘“0900000000009CX>*»000#‘“000«CXXX)«000«000-
    t t t t T
    sauofoewiAI Jeuiquioo
    o‘“oécxDoooooooo(
    0’’'OOC)OC>^OOCXXX3 o'"oooooooooooo 0"CKXXXXXXX>000 oMocc>cooc)oooooo
    0*“OCOCKXXXXXXX50C<XX>0000‘“ O'^OCXXXX^OOOOOOOCXXX^DOOO^
    o'‘‘ckxooooc>dcmdoocoococoo^ o“*ocooooooooooooooooooo"“ o’'‘ooockxxxxx>ooooooocx>oo*‘‘oooooooooooooooo’'‘o
    imagen7
    imagen8
    X6
    d6¿$
    «90
    AS9S
    At9d
    090
    Itt o
    TON
    HUO
    d80
    1M
    (Do)P± •»*
    89 S9>9 09 ¿I HUI 8 8 1
    sopfoeoufiuy ap eiouanoas ........ ........... 11 1
    a}ue}n¡/\¡
    9 ejndfj
    9103-60- W
    eoziszzoa
    198
    n
    Actividad Residual (%) Razón Inicial Relativa (%)
    imagen9
    imagen10
    os >
    — Razón Inicial Relativa (%)
    ^ e o fe o o o SÍ
    imagen11
    199
    Razón Inicial Relativa (%)
    o a s a I s
    imagen12
    o o o a o o o o o o o o
    imagen13
    ..88888888888
    b lo o 'o lo ‘o !o o o o o o
    SE8882823882
    Secuencia de Aminoácidos
    200
    (Xyl), m* IXyl). (Xylí. Xilano
    « I
    Control
    MTT
    ax-a
    n
    Control
    WT
    SX-2
    ax
    Control
    WT
    ex-2 ax
    Control
    m ex-2 ax
    ! I
    !
    •3 "52
    { | %
    Control
    W
    «x-2
    ax
    1
    I
    I I ! I I
    ■a
    ■s.
    II ll;i
    I
    i
    3 *
    *< *<
    £> 5*
    >
    I
    IQ
    SU
    (O
    imagen14
    202
    Fig. 11.
    Pasta Materia Prima
    ________' f
    Lavar para reducir el pH a 8,5
    Filtro Prensa Dividir en bolsas
    Etapa X Etapa Dn
    Resuspender Ajustar el pH a 8 Filtro Prensa
    imagen15
    Incubar con Enzima @ 10% Sólidos
    65*C y lh Amasar(10 min)
    Etapa E,,
    imagen16
    GE%
    imagen17
    204
    Extremo N
    Extremo N
    Extremo N
    SEQIDNO:382
    imagen18
    Extremo C
    1. Eliminación de la secuencia ECG C-terminal (mayor rendimiento a pH alto)
    t
    Extremo C
  27. 2. Cambio de 7 aminoácidos
    (mayor rendimiento a pH alto y alta temp.)
    V
    imagen19
    Extremo C
    SEQ ID NO:482
    205
    FIGURA 14
    Punto de adición
    Lavado con agua
    Lavado con agua
    imagen20
    (A)
    imagen21
    Estadio
    Consistencia Duración (min)
    X
    60
    Do
    4.0K 1!
    E1
    10% 135
    Bajo/alto
    60 C pH 10 80 C pH 10 90 C pH 10 eocpHS 90 C pH 8
    A Brillo, % ahorro químico A Brillo, % ahorro químico /¿Brillo. % ahorro químico A Brillo, % ahorro químico A Brillo, % ahorro químico
    20 0,16/0,21
    1,9 8,4 2,3 10,3 2.8 13,7 2,0 10,1
    aHHH»
    23 0,14/0,13
    2,9 14,2 2,4 118 27 13.2 1,9 9,3
    24 0.14/0,13
    1,2 5.9 2,2 - 10,6
    25 0,16/0,21
    2,8 12,5 3,1 14,3 2,3 10,1 3,5 15,0 2,4 10,4
    26 0,14/0,13
    0,1 07 1,2 5,5
    27 0,16/0,21
    1,2 5,7 2,4 11,6 3,1 13,2 2,8 12,0
    28 0,16/0,21
    1,0 4,9 1,5 7,0
    29 0,14/0,13
    1,6 7,3 2,5 11,0 3,1 13,0 3,1 13,1
    .30 0,14/0,18
    27 13,0 3,3 160 2,9 12.8 3,2 13,6 2,6 • 11,1
    31 0,14/0,18
    2,3 113 2,2 10.9
    32 0,14/0,18
    0,9 3,8 1,8 7,7
    33 0,14/0,18
    1,7 73 2,1 9,0
    34 0,14/0,18
    1,5 6,4 1,2 5,4
    35 0,14/0,18
    1,6 7,9 2,1 10,7
    36 0,14/0,18
    0.9 3,3 11 4,6
    37 0,14/0,18
    2,1 10,0 2,0 9,4
    38 0,14/0,18
    1,9 " 9.0 2,0 9,4
    15 0.14/0.19
    3,5 14,6 2,6 10,7 1,8 8,0 3,8 16,4 2,1 9.0
    16 0„14/0,20
    3,0 12,5 3,2 13.4 1.3 6,4 21 10.6 2 6 12,6
    17 0,14/0,21
    15 6,4 2,6 10,7
    60CoH10.5 90C0HIO.5 SSWB60CPH10 SSWB 60CpH 10
    A Brillo, % ahorro químico
    A Brillo, % ahorro químico
    A Brillo, % ahorro químico
    A ferilio, % ahorro químico
    ¡imsimMMmmém
    23 0,14/0,18
    0,4 2,0 2,2 9,7 1,6 69 1,8 8,7
    w
    o
    -^l
    O
    ■_
    L_
    O
    -C
    <
    ID
    <D
    imagen22
    C-0,14 C-0,17 0,3 0,6 0,9 0,3 0,6 0,9 0,3 0,6 0,9 0,3 0,6 0,9
    Unidades SE1 ID NO:382/g DO pulpa
    % Ahorro: 15% 18% 20% 17% 19% 21% 16% 18% 20% 20% 24% 19%
    w
    o
    oo
    '■S
    LU
    O
    O
    03
    imagen23
    imagen24
    % Ahorro: 7%
    10%
    13%
    Brillo (GE %)
    imagen25
    70 i
    65 -
    imagen26
    Control-0,22 Control-0,18 0,2 0,4
    U SEQ ID NO:382 (codificada por la SEQ ID NO:381)/g DO pulpa
    % Ahorro: 10% 15% 18%
    imagen27
    imagen28
    1 o
    o o ----1---- O -----I-— es — i—--- CD —j— o ——,— o es
    o o> cd r- «s m cd
    CD
    tn LO w> ira v> IO io LO LO
    (% 30) oiiug
    Control 0,14 Control 0,18 SEQIDNO;382 pH10,60°C SEQIDNO:382 pH10,9Q°C
    212
    Ensayo con Azo-Xylan a ph 10,5 y 37 °C
    imagen29
    ■Sin enzima
    -SEQ ID NO:504
    • SEQ ID NO:502
    ■ SEQ ID NO:512
    ■ SEQ ID NO:490
    • SEQ ID NO:482
    Tiempo (min)
    213
    Actividad de blanqueo por pH datos a 3 Unidades/g
    CN
    O
    O
    u
    o
    <u
    '!?
    o
    Q-
    35,0%
    30,0%
    25,0%
    20,0%
    15,0%
    10,0%
    5,0%
    0,0%
    imagen30
    ■ pH7 OpH 9,5 BpH 10 npH 10,5
    SH3 ID NO:482 SEQDNO:504 SEQIDNO:502 SEQIDNO:512
    214
    imagen31
    pH en estadio X
    215
    Perfil de temperatura de descubrimiento de clones a pH10,4
    imagen32
    Temperatura (C)
    —4—Sin enzima
    -*-SEQID
    NO:520
    -----SEQ ID
    NO:522
    SEQ ID NO:496
    -A-SEQ ID NO:488
    -♦-SEQ ID
    NO:510
    -*-SEQID
    NO:482
    216
    Perfil de temperatura de descubrimiento de clones a pH10,4
    E
    C
    O
    O)
    un
    cu
    t/5
    _Q
    05
    C
    CD
    imagen33
    05
    c
    X
    a>
    ■o
    ■a
    ■o
    o
    o
    tu
    >
    0,01
    0,009
    0,008
    0,007
    0,006
    0,005
    0,004
    0,003
    0,002
    0,001
    0
    imagen34
    Temperatura en C
    217
    SEQ !D NO:512 -Actividad residual a pH 10,0
    imagen35
    imagen36
    Figura 27
    Inactivación con calor tipo silvestre
    tiempo (min)
    Inactivación con calor mutante
    93
    tiempo (min)
    Figura 27A (arriba)
    Figura 27B (abajo)
    219
    imagen37
    ■ WT ▼ Muíante
ES07751203.6T 2006-02-14 2007-02-14 Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas Active ES2682284T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US77312206P 2006-02-14 2006-02-14
US773122P 2006-02-14
PCT/US2007/004429 WO2007095398A2 (en) 2006-02-14 2007-02-14 Xylanases, nucleic acids encoding them and methods for making and using them

Publications (1)

Publication Number Publication Date
ES2682284T3 true ES2682284T3 (es) 2018-09-19

Family

ID=38372169

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07751203.6T Active ES2682284T3 (es) 2006-02-14 2007-02-14 Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas

Country Status (9)

Country Link
US (3) US8043839B2 (es)
EP (5) EP1989302B1 (es)
BR (1) BRPI0707784B1 (es)
CA (2) CA2638801C (es)
DK (1) DK1989302T3 (es)
ES (1) ES2682284T3 (es)
PL (1) PL1989302T4 (es)
TR (1) TR201809912T4 (es)
WO (1) WO2007095398A2 (es)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0312121A (pt) 2002-06-14 2007-04-03 Diversa Corp xinalases, ácidos nucléicos codificando-as e métodos para preparar e empregá-las
US7685737B2 (en) 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
US7024800B2 (en) 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US7610692B2 (en) 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
US8043839B2 (en) 2006-02-14 2011-10-25 Verenium Corporation Xylanases, nucleic acids encoding them and methods for making and using them
WO2009042622A2 (en) * 2007-09-25 2009-04-02 Novozymes A/S Process for the production of a fermentation product from a wood-containing material, wherein the wood-containing material is treated with esterases
EP2205744B1 (en) 2007-10-03 2015-01-14 BP Corporation North America Inc. Xylanases, nucleic acids encoding them and methods for making and using them
US20090158663A1 (en) * 2007-12-21 2009-06-25 General Electric Company Method of biomass gasification
WO2009103026A1 (en) * 2008-02-15 2009-08-20 Gevo, Inc. Engineered microorganisms for producing isopropanol
US20110091941A1 (en) * 2008-07-03 2011-04-21 Novozymes A/S Process For Producing Fermentation Products
US20100077726A1 (en) * 2008-09-30 2010-04-01 General Electric Company Plenum air preheat for cold startup of liquid-fueled pulse detonation engines
CN102317451A (zh) * 2008-12-23 2012-01-11 丹尼斯科公司 具有木聚糖酶活性的多肽
ES2602792T3 (es) 2008-12-23 2017-02-22 Dupont Nutrition Biosciences Aps Polipéptidos con actividad de xilanasa
WO2010141604A2 (en) * 2009-06-02 2010-12-09 Wisconsin Alumni Research Foundation Combinatorial discovery of enzymes with utility in biomass transformation
KR101091152B1 (ko) * 2009-07-23 2011-12-09 한국화학연구원 알칼리성 자일라나아제를 생산하는 신규 페니바실러스 sp. HPL―002 균주, 이로부터 분리한 신규 자일라나아제 효소 및 이의 생산 방법
BRPI1005181A2 (pt) * 2009-08-13 2019-07-02 Geosynfuels Llc processo para a produção de produtos de alto valor de biomassa
AP2012006162A0 (en) 2009-08-13 2012-04-30 Geosynfuels Llc Apparatus and process for fermentation of biomass hydrolysate.
US8420387B2 (en) 2009-11-06 2013-04-16 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
UA117654C2 (uk) * 2009-11-06 2018-09-10 Агрівіда, Інк. Трансгенна рослина, яка експресує фермент, що деградує клітинну стінку, і вектор експресії
US20130071884A1 (en) 2009-11-06 2013-03-21 Agrivida, Inc. Plants expressing cell wall degrading enzymes and expression vectors
US10407742B2 (en) 2009-11-06 2019-09-10 Agrivida, Inc. Intein-modified enzymes, their production and industrial applications
WO2011099015A1 (en) 2010-02-15 2011-08-18 Yeda Research And Development Co. Ltd. Bio-engineered multi-enzyme complexes comprising xylanases and uses thereof
FR2957598B1 (fr) * 2010-03-17 2015-12-04 Lfb Biotechnologies Nouveau peptide signal, et son utilisation pour la production de proteines recombinantes
JP5628544B2 (ja) * 2010-04-07 2014-11-19 株式会社豊田中央研究所 クロストリジウム・サーモセラム由来のタンパク質複合体を構築するためのタンパク質及びその利用
ES2371317B1 (es) * 2010-06-14 2012-11-07 Consejo Superior De Investigaciones Científicas (Csic) Endoxilanasa termorresistente obtenida por mutagénesis y su aplicación al proceso de obtención de bioetanol.
US10443068B2 (en) 2010-06-25 2019-10-15 Agrivida, Inc. Plants with engineered endogenous genes
US9598700B2 (en) 2010-06-25 2017-03-21 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
WO2012014227A1 (en) * 2010-07-26 2012-02-02 Advanced Enzyme Technologies Ltd. An enzyme preparation and method for preparing protein concentrate from soy protein containing materials
BR112013005686A2 (pt) * 2010-09-10 2016-06-28 Syngenta Participations Ag xilanases ativas durante o pré-tratamento de biomassa celulósica.
CA2829207C (en) 2011-03-07 2022-10-11 Agrivida, Inc. Consolidated pretreatment and hydrolysis of plant biomass expressing cell wall degrading enzymes
US20140135252A1 (en) * 2011-04-29 2014-05-15 Danisco Us Inc. Detergent compositions containing geobacillus tepidamans mannanase and methods of use thereof
EA027084B1 (ru) * 2011-09-14 2017-06-30 ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС Ферменты
ES2734145T3 (es) * 2012-08-03 2019-12-04 Dupont Nutrition Biosci Aps Xilanasas para solubilizar material que contiene arabinoxilano
EA201590312A1 (ru) * 2012-08-03 2015-10-30 ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС Ферменты
DK2888283T3 (en) 2012-08-24 2018-11-19 Univ California ANTIBODIES AND VACCINES FOR TREATING ROR1 CANCER AND INHIBITIVE METASTASE
US9145551B2 (en) 2012-09-19 2015-09-29 Wisconsin Alumni Research Foundation Multifunctional cellulase and hemicellulase
US10047352B2 (en) * 2012-10-03 2018-08-14 Agrivida, Inc. Intein-modified proteases, their production and industrial applications
US20140230097A1 (en) * 2013-02-12 2014-08-14 Novozymes Inc. Polypeptides Having Xylanase Activity and Polynucleotides Encoding Same
GB201308853D0 (en) 2013-03-12 2013-07-03 Verenium Corp Genes encoding xylanase
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
US20160083705A1 (en) * 2013-05-18 2016-03-24 Direvo Industrial Biotechnology Gmbh Enzyme compositions for the improvement of fermentation processes and by-products
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
US9616114B1 (en) 2014-09-18 2017-04-11 David Gordon Bermudes Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity
US10542961B2 (en) 2015-06-15 2020-01-28 The Research Foundation For The State University Of New York System and method for infrasonic cardiac monitoring
US10688181B2 (en) 2016-06-27 2020-06-23 The Regents Of The University Of California Cancer treatment combinations
IL247569A0 (en) 2016-08-30 2016-11-30 Yeda Res & Dev An enzymatic complex for the breakdown of lignocellulosic material
CN109983174B (zh) 2016-09-16 2022-10-11 巴斯夫欧洲公司 改性包含纤维素酶的纸浆的方法及其制品
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
CN109402091B (zh) * 2017-08-18 2022-02-11 潍坊康地恩生物科技有限公司 木聚糖酶突变体
CN107604739B (zh) * 2017-09-26 2019-06-07 江南大学 一种过滤用棉秆皮纤维与壳聚糖复合非织布的制备方法
US11248194B2 (en) 2019-03-14 2022-02-15 The Procter & Gamble Company Cleaning compositions comprising enzymes
CA3127171A1 (en) * 2019-03-14 2020-09-17 The Procter & Gamble Company Method for treating cotton
EP3947472A4 (en) * 2019-04-04 2023-02-22 Vanderbilt University THERAPEUTIC ANTIBODIES FOR THE TREATMENT OF LUNG CANCER
US11390970B2 (en) * 2019-04-10 2022-07-19 Rinnovation Co., Ltd. Paper yarn, paper cloth and fabric products
CN110117586B (zh) * 2019-05-06 2022-04-01 武汉轻工大学 一种超耐热的木聚糖酶XynGold及基因与应用
CN111748542B (zh) * 2020-07-14 2021-11-26 云南师范大学 一种内切木聚糖酶突变体s07a11及制备方法和应用
EP4230791A1 (en) * 2022-02-18 2023-08-23 AB Enzymes GmbH A bleaching process
WO2024005099A1 (ja) 2022-06-28 2024-01-04 株式会社Mizkan Holdings でんぷん含有膨化組成物及びその製造方法、並びに、発酵組成物及びその製造方法、並びに発酵酵素処理組成物及びその製造方法

Family Cites Families (262)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1202A (en) 1839-06-27 priestley peters
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
US4261868A (en) 1979-08-08 1981-04-14 Lever Brothers Company Stabilized enzymatic liquid detergent composition containing a polyalkanolamine and a boron compound
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4404128A (en) 1981-05-29 1983-09-13 The Procter & Gamble Company Enzyme detergent composition
US5021246A (en) 1984-03-30 1991-06-04 Anheuser-Busch, Incorporated Step mashing process for producing low alcohol beer
US5204015A (en) 1984-05-29 1993-04-20 Genencor International, Inc. Subtilisin mutants
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3546807C2 (es) 1985-03-30 1991-03-28 Marc Genf/Geneve Ch Ballivet
US4725544A (en) 1986-04-25 1988-02-16 Tan Larry U Method for purifying xylanase
US5780292A (en) 1987-04-29 1998-07-14 Alko Group Ltd. Production of phytate degrading enzymes in trichoderma
GB8610670D0 (en) 1986-05-01 1986-06-04 British Petroleum Co Plc Enzyme
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US4788066A (en) 1987-12-14 1988-11-29 Grain Processing Corporation Preparation of low alcohol beer
US5116746A (en) 1988-03-04 1992-05-26 Institut Armand Frappier Cellulase-free endo-xylanase enzyme of use in pulp delignification
FR2629108A1 (fr) 1988-03-22 1989-09-29 Du Pin Cellulose Procede de fabrication de papiers ou cartons a partir de fibres recyclees, traitees avec des enzymes
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5179021A (en) 1989-02-10 1993-01-12 Gil Inc. (Now Ici Canada Inc.) Pulp bleaching process comprising oxygen delignification and xylanase enzyme treatment
GB8906837D0 (en) 1989-03-23 1989-05-10 Unilever Plc Bread improvers
FI87372C (fi) 1989-03-30 1992-12-28 Genencor Int Europ Foerfarande foer framstaellning av fluffmassa med foerbaettrad rivbarhet
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
NZ235679A (en) 1989-10-18 1993-01-27 Int Paper Co Bleaching lignocellulosic pulp using (a) treatment with xylanase and (b) one or more chemical bleaching stages
FI83182C (fi) 1989-12-27 1991-06-10 Kone Oy Foerfarande och anordning foer avbarkning av traed.
SE465320B (sv) 1990-01-10 1991-08-26 Korsnaes Ab Preparat som uppvisar enzymatisk delignifieringsaktivitet, saett att framstaella detsamma och tillaempningar daerav
US5589583A (en) 1990-01-11 1996-12-31 Monsanto Company Plant promoter
FI89814C (fi) 1990-02-02 1993-11-25 Enso Gutzeit Oy Foerfarande foer blekning av cellulosamassa
WO1991016427A1 (en) 1990-04-24 1991-10-31 Stratagene Methods for phenotype creation from multiple gene populations
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
DK115890D0 (da) * 1990-05-09 1990-05-09 Novo Nordisk As Enzym
CA2084071C (en) 1990-05-29 2004-09-28 Douglas Walter Fodge Hemicellulase supplement to improve the energy efficiency of hemicellulose-containing food and animal feed
CA2085127C (en) 1990-06-15 2002-12-10 Barbara Cordell Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
GB9018426D0 (en) 1990-08-22 1990-10-03 Sandoz Ltd Improvements in or relating to novel compounds
DK30991D0 (da) 1991-02-22 1991-02-22 Novo Nordisk As Hidtil ukendte enzymer
DK203490D0 (da) 1990-08-24 1990-08-24 Novo Nordisk As Fremgangsmaade til behandling af lignocellulosepulp og apparat til udfoerelse af processen
DE69132124T2 (de) 1990-11-23 2000-11-23 Aventis Cropscience Nv Verfahren zur transformation monokotyler pflanzen
GB9027303D0 (en) 1990-12-17 1991-02-06 Enzymatix Ltd Enzyme formulation
JP3298879B2 (ja) 1990-12-20 2002-07-08 イグジス,インコーポレイテッド 結合タンパク質の最適化
NL9100050A (nl) 1991-01-11 1992-08-03 Heineken Technische Beheer Bv Werkwijze voor het continu bereiden van wort.
FR2672066B1 (fr) 1991-01-25 1997-01-31 Du Pin Cellulose Traitement enzymatique d'une pate ligno-cellulosique chimique.
US5405624A (en) 1991-02-14 1995-04-11 Bio-Technical Resources Process for producing a product with an intensified beer flavor
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
FI108800B (fi) 1991-05-07 2002-03-28 Iogen Corp Menetelmä ja laitteisto entsyymin käyttämiseksi paperimassan valmistuksessa ja valkaisussa
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
CA2048322A1 (en) 1991-08-08 1993-02-09 Dieter Kluepfel Xylanase for biobleaching
DK175391D0 (da) 1991-10-18 1991-10-18 Novo Nordisk As Nye enzymer
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
CA2082185C (en) 1991-11-26 2004-01-20 Alexander R. Pokora Protease catalyzed treatments of lignocellulose materials
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
US5369024A (en) 1992-03-25 1994-11-29 The United States Of America As Represented By The Secretary Of Agriculture Xylanase from streptomyces roseiscleroticus NRRL-11019 for removing color from kraft wood pulps
US5498534A (en) 1992-03-25 1996-03-12 The United States Of America As Represented By The Secretary Of Agriculture Method of removing color from wood pulp using xylanase from streptomyces roseiscleroticus NRRL B-11019
DK87092D0 (da) * 1992-07-02 1992-07-02 Novo Nordisk As Nyt enzym
DE4226528A1 (de) 1992-08-11 1994-02-17 Roehm Gmbh Batterien-Xylanase, Verfahren zu ihrer Herstellung sowie dafür geeigneter Bakterienstamm, Plasmid mit zugehörigem Strukturgen, sowie Backmittel und Backverfahren zur Herstellung von Brot und Backwaren unter Verwendung der Xylanase
DK105592D0 (da) 1992-08-26 1992-08-26 Novo Nordisk As Nyt enzym
US5785811A (en) * 1992-11-09 1998-07-28 The Mead Corporation Process for treating lignocellulosic material with soybean peroxidase in the presence of peroxide
EP0625006A4 (en) 1992-11-20 1996-04-24 Agracetus Transgenic cotton plants producing heterologous bioplastic.
PL180116B1 (pl) 1992-12-31 2000-12-29 Metallgesellschaft Ag Sposób ciaglego wytwarzania piwa PL PL PL PL PL PL PL
US6021536A (en) 1993-03-04 2000-02-08 Wasinger; Eric Mechanical desizing and abrading device
US5405769A (en) 1993-04-08 1995-04-11 National Research Council Of Canada Construction of thermostable mutants of a low molecular mass xylanase
GB2279955B (en) 1993-07-15 1998-02-18 Solvay Xylanase derived from a Bacillus species, expression vectors for such xylanase and other proteins, host organisms therefor and use thereof
WO1995008914A1 (en) 1993-09-30 1995-04-06 Agracetus, Inc. Transgenic cotton plants producing heterologous peroxidase
CN1134726A (zh) * 1993-10-04 1996-10-30 诺沃挪第克公司 一种包含修饰酶的酶制剂
BE1007651A3 (fr) 1993-10-22 1995-09-05 Solvay Interox Procede pour le blanchiment d'une pate a papier chimique.
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
WO1995018219A1 (en) * 1993-12-24 1995-07-06 Gist-Brocades N.V. Alkali-tolerant xylanases
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
NZ279676A (en) 1994-03-09 1998-04-27 Abbott Lab Humanized milk produced by non-human transgenic mammal transformed with a heterologous gene coding for human enzyme producing human oligosaccharides and glycoconjugates
CA2184688A1 (en) 1994-03-09 1995-09-14 Pedro Antonio Prieto Transgenic animals producing oligosaccharides and glycoconjugates
MX196038B (es) 1994-03-29 2000-04-14 Novo Nordisk As Amilasa de bacillus alcalino.
AUPM493594A0 (en) 1994-04-11 1994-05-05 Biotech International Limited Bacterial xylanase
US5437992A (en) 1994-04-28 1995-08-01 Genencor International, Inc. Five thermostable xylanases from microtetraspora flexuosa for use in delignification and/or bleaching of pulp
CA2168344C (en) * 1994-06-14 2009-11-24 Vidar Gronberg Thermostable xylanases
AU2669195A (en) * 1994-06-15 1996-01-05 Novo Nordisk A/S Pyrodictium xylanase, amylase and pullulanase
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5750870A (en) 1994-06-17 1998-05-12 Agritope, Inc. Plant genetic transformation methods and transgenic plants
US5582681A (en) 1994-06-29 1996-12-10 Kimberly-Clark Corporation Production of soft paper products from old newspaper
US5830732A (en) 1994-07-05 1998-11-03 Mitsui Toatsu Chemicals, Inc. Phytase
BE1008751A3 (fr) * 1994-07-26 1996-07-02 Solvay Xylanase, microorganismes la produisant, molecules d'adn, procedes de preparation de cette xylanase et utilisations de celle-ci.
US5503709A (en) 1994-07-27 1996-04-02 Burton; Steven W. Environmentally improved process for preparing recycled lignocellulosic materials for bleaching
US5935836A (en) * 1994-07-29 1999-08-10 Rohm Enzyme Finland Oy Actinomadura xylanase sequences and methods of use
US5871730A (en) 1994-07-29 1999-02-16 Universite De Sherbrooke Thermostable xylanase DNA, protein and methods of use
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
GB9416841D0 (en) 1994-08-19 1994-10-12 Finnfeeds Int Ltd An enzyme feed additive and animal feed including it
US6099844A (en) 1994-08-22 2000-08-08 Triarco Industries, Inc. Increasing yield of extractable substances from botanicals with an enzyme composition
US6211428B1 (en) 1994-09-01 2001-04-03 Merck & Co., Inc. Transgenic mouse expressing a familial form of human amyloid precursor protein
US6426200B1 (en) 1994-09-15 2002-07-30 University Of Georgia Research Foundation, Inc. Methods for enzymatic deinking of waste paper
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5786316A (en) 1994-10-27 1998-07-28 The Procter & Gamble Company Cleaning compositions comprising xylanases
US5725732A (en) 1994-11-18 1998-03-10 P. H. Glatfelter Company Process for treating hardwood pulp with an enzyme mixture to reduce vessel element picking
US5770012A (en) 1994-11-18 1998-06-23 P. H. Glatfelter Co. Process for treating paper machine stock containing bleached hardwood pulp with an enzyme mixture to reduce vessel element picking
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5633440A (en) 1994-12-20 1997-05-27 Dna Plant Technology Corporation P119 promoters and their uses
JP3435946B2 (ja) 1994-12-21 2003-08-11 王子製紙株式会社 耐熱性キシラナーゼ
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
ES2169219T5 (es) 1995-01-26 2009-09-01 Novozymes A/S Aditivos alimenticios para animales que comprenden xilanasa.
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
AU698739B2 (en) 1995-06-06 1998-11-05 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
GB0112226D0 (en) 2001-05-18 2001-07-11 Danisco Method of improving dough and bread quality
AU6298896A (en) 1995-06-28 1997-01-30 Novo Nordisk A/S A cellulase with reduced mobility
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5720971A (en) 1995-07-05 1998-02-24 Her Majesty The Queen In Right Of Canada, As Represented By The Department Of Agriculture And Agri-Food Canada Enzyme additives for ruminant feeds
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US6030779A (en) 1995-07-18 2000-02-29 Diversa Corporation Screening for novel bioactivities
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
EP0839224A1 (en) 1995-07-19 1998-05-06 Novo Nordisk A/S Treatment of fabrics
WO1997013853A2 (en) 1995-10-13 1997-04-17 Gist-Brocades B.V. Protein detection
CA2234998A1 (en) 1995-10-17 1997-04-24 Institut National De La Recherche Agronomique (Inra) Xylanase, oligonucleotidic sequence encoding it and its uses
US5721118A (en) 1995-10-31 1998-02-24 The Regents Of The University Of California, San Diego Mammalian artificial chromosomes and methods of using same
EP1021513B1 (en) 1995-11-15 2004-02-18 Novozymes A/S A process for combined desizing and "stone-washing" of dyed denim
US6368798B1 (en) 1995-12-07 2002-04-09 Diversa Corporation Screening for novel bioactivities
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6358709B1 (en) 1995-12-07 2002-03-19 Diversa Corporation End selection in directed evolution
US20030215798A1 (en) 1997-06-16 2003-11-20 Diversa Corporation High throughput fluorescence-based screening for novel enzymes
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US6361974B1 (en) 1995-12-07 2002-03-26 Diversa Corporation Exonuclease-mediated nucleic acid reassembly in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US6344328B1 (en) 1995-12-07 2002-02-05 Diversa Corporation Method for screening for enzyme activity
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
EP0868506A1 (en) 1995-12-18 1998-10-07 Röhm Enzyme Finland Oy Novel xylanases and uses thereof
BR9510676A (pt) * 1995-12-29 1999-11-23 Procter & Gamble Composições detergentes compreendendo enzinas imobilizadas
CN1209838A (zh) 1996-01-29 1999-03-03 诺沃挪第克公司 纤维素织物的脱浆方法
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6254722B1 (en) 1996-03-27 2001-07-03 North Carolina State University Method for making dissolving pulp from paper products containing hardwood fibers
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
AU3568897A (en) 1996-06-07 1998-01-05 Eos Biotechnology, Inc. Immobilised linear oligonucleotide arrays
DE19628263A1 (de) 1996-07-12 1998-01-15 Fraunhofer Ges Forschung Verfahren zur Herstellung von Celluloselösungen in wasserhaltigem Aminoxid
US5759840A (en) 1996-09-09 1998-06-02 National Research Council Of Canada Modification of xylanase to improve thermophilicity, alkalophilicity and thermostability
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
US6057438A (en) 1996-10-11 2000-05-02 Eastman Chemical Company Process for the co-production of dissolving-grade pulp and xylan
WO1998016191A1 (en) 1996-10-11 1998-04-23 Novo Nordisk A/S CELLULOSE BINDING DOMAINS (CBDs) FOR ORAL CARE PRODUCTS
US5948667A (en) 1996-11-13 1999-09-07 Her Majesty The Queen In Right Of Canada, As Represented By The Department Of Agriculture And Agri-Food Xylanase obtained from an anaerobic fungus
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
FI970158A (fi) 1997-01-14 1998-07-15 Neste Oy Uusi kuitulevyliima
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
IL130635A0 (en) 1997-01-17 2000-06-01 Maxygen Inc Evolution of whole cells and organisms by recursive sequence recombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6316251B1 (en) * 1997-03-04 2001-11-13 Bio-Polymer Research Co., Ltd. Gene, group of genes, and novel β-gluclosidase
IL131966A0 (en) 1997-03-18 2001-03-19 Novo Industri As An in vitro method for construction of a dna library
JP4263248B2 (ja) 1997-03-18 2009-05-13 ノボザイムス アクティーゼルスカブ Dnaのシャッフリングによるライブラリーの作成方法
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
DE19723890A1 (de) 1997-06-06 1998-12-10 Consortium Elektrochem Ind Verfahren zur Herstellung von aromatischen und heteroaromatischen Aldehyden und Ketonen
US5916780A (en) 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
JP2002510203A (ja) 1997-06-10 2002-04-02 キシロフィン オイ 製紙等級の硬木パルプからのキシロースの製造方法
US7019827B2 (en) 1997-06-16 2006-03-28 Diversa Corporation GigaMatrix holding tray having through-hole wells
GB2327345B (en) 1997-07-18 1999-06-23 Finnfeeds Int Ltd Use of an enzyme for manufacturing an agent for controlling bacterial infection
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
CA2300940A1 (en) 1997-08-15 1999-02-25 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
US5981233A (en) 1997-08-21 1999-11-09 Roche Vitamins Inc. Process for manufacturing a xylanase enzyme complex from pre-treated thin stillage of rye
CA2301539C (en) 1997-09-11 2003-06-17 Genovations, Inc. Method of making high density arrays
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
WO1999021979A1 (en) 1997-10-28 1999-05-06 Maxygen, Inc. Human papillomavirus vectors
CN1163597C (zh) 1997-10-30 2004-08-25 诺维信公司 α-淀粉酶突变体
EP1690868A1 (en) 1997-10-31 2006-08-16 Maxygen, Inc. Modification of virus tropism and host range by viral genome shuffling
ATE234913T1 (de) 1997-11-10 2003-04-15 Procter & Gamble Verfahren zur herstellung einer waschmitteltablette
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
US6187580B1 (en) 1997-11-24 2001-02-13 Novo Nordisk A/S Pectate lyases
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AU3291099A (en) 1998-02-11 1999-08-30 Maxygen, Inc. Genetic vaccine vector engineering
WO1999041383A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Antigen library immunization
US6015703A (en) * 1998-03-10 2000-01-18 Iogen Corporation Genetic constructs and genetically modified microbes for enhanced production of beta-glucosidase
US6537749B2 (en) 1998-04-03 2003-03-25 Phylos, Inc. Addressable protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
AU3408199A (en) 1998-05-01 1999-11-23 Novo Nordisk A/S Enhancers such as n-hydroxyacetanilide
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
US6060299A (en) 1998-06-10 2000-05-09 Novo Nordisk A/S Enzyme exhibiting mannase activity, cleaning compositions, and methods of use
CN1308683A (zh) 1998-06-29 2001-08-15 菲洛斯公司 用于产生高多样性文库的方法
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
GB2340755B (en) 1998-08-24 2002-09-25 Cannon Rubber Ltd Breast pump insert
EP1109912A1 (en) * 1998-09-04 2001-06-27 University Of Georgia Research Foundation, Inc. Phenolic acid esterases, coding sequences and methods
US5980581A (en) 1998-09-08 1999-11-09 The Virkler Company Process for desizing and cleaning woven fabrics and garments
JP2002525445A (ja) 1998-09-17 2002-08-13 ノボザイムス ノース アメリカ,インコーポレイティド 印刷紙を脱インク及び脱色するための方法
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
EP1131447B2 (en) 1998-11-16 2011-10-12 National Research Council Of Canada Thermostable xylanases
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
EP1141254B1 (en) 1998-12-23 2006-03-08 Danisco A/S Use of a xylanase for preparing a foodstuff
AU753553B2 (en) 1998-12-31 2002-10-24 Ets Robert Stiernon S.A./N.V. Enzymatic composition for refining wood
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6024766A (en) 1999-01-27 2000-02-15 Wasinger; Eric M. Process for enzymatic desizing of garments and enzyme deactivation
JP2000245356A (ja) 1999-02-26 2000-09-12 Fuji Oil Co Ltd マンノース含有コプラミール組成物
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6824646B2 (en) 1999-03-23 2004-11-30 Oji Paper Co., Ltd. Process for oxygen bleaching and enzyme treating lignocellulosic pulp with liquid treatment and recovery
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
US6121034A (en) * 1999-05-13 2000-09-19 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Agriculture And Agri-Food Coniothyrium minitans xylanase gene Cxy1
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
BR0013896A (pt) 1999-09-09 2002-05-14 Iogen Bio Products Corp Sequência de nucleotìdeo, vetor, fungos filamentosos transformados, método de produzir uma proteìna de interesse, proteìna, e, sistema de expressão para produzir uma proteìna de interesse
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
US20010008765A1 (en) 1999-12-06 2001-07-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
CA2293223C (en) 1999-12-23 2004-02-10 Michael G. Paice Electrochemical method for determinating lignin content of pulp
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
DE60136267D1 (de) 2000-02-17 2008-12-04 Biogasol Ipr Aps Methode zur behandlung von lignin- und zellulosehaltigen stoffen
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
NZ520659A (en) 2000-03-08 2005-06-24 Danisco Xylanase variants having altered sensitivity to xylanase inhibitors caused by mutations in the lid region
JP4922524B2 (ja) * 2000-04-13 2012-04-25 ダイアデイツク・インターナシヨナル(ユーエスエイ)インコーポレーテツド 糸状菌の分野における新規発現調節配列および発現産物
US6399123B1 (en) 2000-05-25 2002-06-04 University Of Missouri Board Of Curators Oligosaccharide removal from animal feed
EP1294869A2 (en) 2000-06-14 2003-03-26 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
WO2002029032A2 (en) 2000-09-30 2002-04-11 Diversa Corporation Whole cell engineering by mutagenizing a substantial portion of a starting genome, combining mutations, and optionally repeating
JP2005501217A (ja) 2000-10-10 2005-01-13 ディベルサ コーポレーション 生体活性または生体分子のハイスループットスクリーニングまたはキャピラリーに基づくスクリーニング
WO2002030963A1 (en) 2000-10-12 2002-04-18 Exelixis, Inc. Human ect2 and methods of use
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
AU2002230784A1 (en) 2000-11-10 2002-05-21 Xencor Novel thermostable alkaliphilic xylanase
CA2430559A1 (en) 2000-11-30 2002-06-06 Diversa Corporation Method of making a protein polymer and uses of the polymer
AU2002226210A1 (en) 2000-12-22 2002-07-08 Iogen Bio-Products Corporation Alkaline extraction stages comprising xylanase
CA2435279A1 (en) 2001-01-18 2002-07-25 Iogen Bio-Products Corporation Use of xylanase in pulp bleaching
US20060019913A1 (en) 2001-05-18 2006-01-26 Sirna Therapeutics, Inc. RNA interference mediated inhibtion of protein tyrosine phosphatase-1B (PTP-1B) gene expression using short interfering nucleic acid (siNA)
GB0121387D0 (en) 2001-09-04 2001-10-24 Danisco Modified hydrolases
US20030096394A1 (en) 2001-09-10 2003-05-22 Cheng Huai N. Laccase activity enhancers
WO2003074780A1 (en) 2002-03-06 2003-09-12 Iogen Bio-Products Corporation Xylanase treatment of chemical pulp
US20040005674A1 (en) 2002-04-30 2004-01-08 Athenix Corporation Methods for enzymatic hydrolysis of lignocellulose
JP2005185101A (ja) * 2002-05-30 2005-07-14 National Institute Of Agrobiological Sciences 植物の全長cDNAおよびその利用
BR0312121A (pt) * 2002-06-14 2007-04-03 Diversa Corp xinalases, ácidos nucléicos codificando-as e métodos para preparar e empregá-las
US7033077B2 (en) * 2002-07-16 2006-04-25 Peter Taylor Sealable bags made of plastics or other materials and method of making plastic sheeting for manufacturing sealable bags
US20040112555A1 (en) * 2002-12-03 2004-06-17 Jeffrey Tolan Bleaching stage using xylanase with hydrogen peroxide, peracids, or a combination thereof
WO2004066945A2 (en) 2003-01-24 2004-08-12 Diversa Corporation Enzymes and the nucleic acids encoding them and methods for making and using them
WO2006083240A2 (en) * 2003-12-19 2006-08-10 Syngenta Participations Ag Microbially expressed xylanases and their use as feed additives and other uses
US20060014260A1 (en) 2004-05-07 2006-01-19 Zhiliang Fan Lower cellulase requirements for biomass cellulose hydrolysis and fermentation
US20060030003A1 (en) 2004-05-12 2006-02-09 Simon Michael R Composition and method for introduction of RNA interference sequences into targeted cells and tissues
CA2569664C (en) 2004-06-07 2013-07-16 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering rna
US7635563B2 (en) 2004-06-30 2009-12-22 Massachusetts Institute Of Technology High throughput methods relating to microRNA expression analysis
US20060019258A1 (en) 2004-07-20 2006-01-26 Illumina, Inc. Methods and compositions for detection of small interfering RNA and micro-RNA
US8043839B2 (en) * 2006-02-14 2011-10-25 Verenium Corporation Xylanases, nucleic acids encoding them and methods for making and using them
NZ598285A (en) * 2007-01-30 2013-10-25 Syngenta Participations Ag Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them
US9409174B2 (en) 2013-06-21 2016-08-09 Bio-Rad Laboratories, Inc. Microfluidic system with fluid pickups
US9618579B2 (en) 2015-04-28 2017-04-11 Lattice Semiconductor Corporation Programmable circuits for correcting scan-test circuitry defects in integrated circuit designs

Also Published As

Publication number Publication date
WO2007095398A3 (en) 2008-10-02
DK1989302T3 (en) 2018-07-23
BRPI0707784B1 (pt) 2018-05-22
USRE45660E1 (en) 2015-09-01
EP1989302A2 (en) 2008-11-12
EP1989302A4 (en) 2010-02-24
CA2946924A1 (en) 2007-08-23
CA2638801A1 (en) 2007-08-23
EP3406621A1 (en) 2018-11-28
CA2638801C (en) 2016-12-13
US20150139977A1 (en) 2015-05-21
EP2548954A1 (en) 2013-01-23
WO2007095398A2 (en) 2007-08-23
PL1989302T3 (pl) 2019-03-29
TR201809912T4 (tr) 2018-07-23
US8043839B2 (en) 2011-10-25
EP2548955A1 (en) 2013-01-23
US20090155238A1 (en) 2009-06-18
WO2007095398A8 (en) 2008-04-10
BRPI0707784A2 (pt) 2011-04-26
EP1989302B1 (en) 2018-04-11
EP2548956A1 (en) 2013-01-23
PL1989302T4 (pl) 2019-03-29

Similar Documents

Publication Publication Date Title
ES2682284T3 (es) Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y usarlas
ES2394708T3 (es) Xilanasas, ácidos nucleicos que las codifican y métodos para elaborarlas y purificarlas
JP6484266B2 (ja) キシラナーゼ、キシラナーゼをコードする核酸並びにそれらを製造及び使用する方法
ES2401795T3 (es) Glucanasas, ácidos nucleicos que las codifican y métodos para eleborarlas y utilizarlas
AU2006227965B2 (en) Cellulases, nucleic acids encoding them and methods for making and using them
CA2637013A1 (en) Cellulolytic enzymes, nucleic acids encoding them and methods for making and using them
MX2008011442A (es) Aldolasas, acidos nucleicos que las codifican, y metodos para hacer y usar las mismas.
AU2015210488B2 (en) Xylanases, nucleic acids encoding them and methods for making and using them
AU2013201861B2 (en) Cellulases, nucleic acids encoding them and methods for making and using them
AU2008201402A1 (en) Xylanases, nucleic acids encoding them and methods for making and using them