ES2650636T3 - Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas - Google Patents

Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas Download PDF

Info

Publication number
ES2650636T3
ES2650636T3 ES10184478.5T ES10184478T ES2650636T3 ES 2650636 T3 ES2650636 T3 ES 2650636T3 ES 10184478 T ES10184478 T ES 10184478T ES 2650636 T3 ES2650636 T3 ES 2650636T3
Authority
ES
Spain
Prior art keywords
sequence
polypeptide
amino acid
sequences
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES10184478.5T
Other languages
English (en)
Inventor
Walter Callen
Toby Richardson
Gerhard Frey
Jay M. Short
Janne S. Kerovuo
Eric J. Mathur
Malgorzata Slupska
Kevin Gray
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Enzymes LLC
Original Assignee
BASF Enzymes LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Enzymes LLC filed Critical BASF Enzymes LLC
Application granted granted Critical
Publication of ES2650636T3 publication Critical patent/ES2650636T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21DTREATMENT, e.g. PRESERVATION, OF FLOUR OR DOUGH, e.g. BY ADDITION OF MATERIALS; BAKING; BAKERY PRODUCTS; PRESERVATION THEREOF
    • A21D8/00Methods for preparing or baking dough
    • A21D8/02Methods for preparing dough; Treating dough prior to baking
    • A21D8/04Methods for preparing dough; Treating dough prior to baking treating dough with microorganisms or enzymes
    • A21D8/042Methods for preparing dough; Treating dough prior to baking treating dough with microorganisms or enzymes with enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

Un ácido nucleico aislado, sintético o recombinante que comprende: (A) (i) una secuencia que codifica un polipéptido que tiene actividad de alfa amilasa, en la que dicha secuencia tiene por lo menos 90%, 95%, 96%, 97%, 98%, 99% o 100% de identidad de secuencia con la secuencia de la SEQ ID NO: 53, o fragmentos enzimáticamente activos de las mismas, en donde el fragmento tiene actividad de alfa amilasa, o (ii) la secuencia de (i), en la que la identidad de la secuencia se determina por análisis con un algoritmo de comparación de secuencias, o se determina mediante inspección visual, o (iii) la secuencia de (ii), en la que el algoritmo de comparación de secuencias comprende un algoritmo FASTA versión 3.0t78 con parámetros por defecto; (B) un ácido nucleico que comprende (i) una secuencia que codifica un polipéptido que tiene actividad de alfa amilasa, en la que la secuencia de aminoácidos del polipéptido tiene por lo menos 98%, 99% o 100% de identidad de secuencia con la secuencia de aminoácidos de la SEQ ID NO: 54, o fragmentos enzimáticamente activos de los mismos, en donde el fragmento tiene actividad de alfa amilasa, o (ii) la secuencia de (i), en la que la identidad de la secuencia se determina por análisis con un algoritmo de comparación de secuencias, o se determina mediante inspección visual, o (iii) la secuencia de (ii), en la que el algoritmo de comparación de secuencias comprende un algoritmo FASTA versión 3.0t78 con parámetros por defecto; (C) un ácido nucleico que comprende una secuencia de cualquiera de (A) a (B) que codifica un polipéptido que carece de una secuencia de señal; (D) un ácido nucleico que comprende (i) una secuencia de cualquiera de (A) a (C) que codifica un polipéptido que comprende adicionalmente una secuencia de ácidos nucleicos heteróloga; (ii) la secuencia de (i), en la que la secuencia de ácidos nucleicos heteróloga codifica una secuencia de señal; (iii) la secuencia de (ii), en la que la secuencia de señal heteróloga comprende una secuencia de señal de amilasa; o (E) una secuencia de ácidos nucleicos completamente complementaria a cualquier secuencia de ácidos nucleicos de (A) a (D).

Description

imagen1
DESCRIPCIÓN
Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
Campo de la invención
Esta invención se relaciona de manera general con enzimas, polinucleótidos que codifican las enzimas, el uso de 5 tales polinucleótidos y polipéptidos, y más específicamente con enzimas que tienen actividad de alfa amilasa.
Antecedentes
El almidón es un carbohidrato complejo a menudo encontrado en la dieta humana. La estructura del almidón es de polímeros de glucosa ligados a enlaces α-1,4 y α-1,6 glucosídicos. La amilasa es una enzima que cataliza la hidrólisis de almidones en azucares. Las amilasas hidrolizan los enlaces α-1,4-glucosídicos internos en el almidón, 10 principalmente de manera aleatoria, para producir maltodextrinas de peso molecular más pequeño. La descomposición del almidón es importante en el sistema digestivo y comercialmente. Las amilasas son de valor comercial considerable, siendo utilizadas en etapas iniciales (licuefacción) del procesamiento del almidón; en molienda del maíz en húmedo; en producción de alcohol; en agentes de limpieza en matrices de detergentes; en la industria textil para desencolado de almidón; en aplicaciones de horneado; en la industria de bebidas; en campos
15 petrolíferos en procesos de perforación; en entintado de papel reciclado; y en alimentación animal.
Las amilasas son producidas en una amplia variedad de microorganismos que incluyen Bacillus y Aspergillus, con la mayoría de las amilasas comerciales siendo producidas de fuentes bacterianas tales como Bacillus liqueniformis, Bacillus amiloliquefaciens, Bacillus subtilis, o Bacillus stearotermofilus. En años recientes, las enzimas en uso comercial han sido aquellas del Bacillus liqueniformis en razón de su estabilidad y desempeño en el calor, al menos
20 a pHs neutros y medianamente alcalinos.
El documento JP 09-173077 divulga una alfa-amilasa ácida ultra-termorresistente que tiene un pH óptimo de aproximadamente 5.0 y una temperatura óptima de aproximadamente 100 °C.
En general, el procesamiento de almidón a fructuosa consiste de cuatro etapas: licuefacción de algodón granular, sacarificación del almidón licuificado en dextrosa, purificación, e isomerización a fructosa. El objeto de un proceso de 25 licuefacción de almidón es convertir una suspensión concentrada de gránulos de polímero de almidón en una solución de dextrinas de longitud de cadena más corta solubles de baja viscosidad. Esta etapa es esencial para el manejo conveniente con el equipo estándar y para la conversión eficiente a glucosa o 103 otros azucares. Para licuificar el almidón granular, es necesario gelatinizar los gránulos al elevar la temperatura del almidón granular sobre aproximadamente 72ºC. El proceso de calentamiento afecta instantáneamente los gránulos de almidón
30 insolubles para producir una solución de almidón soluble en agua. La solución de almidón solubilizada es luego licuificada mediante amilasa. Un gránulo de almidón está compuesto de: 69-74% de amilopectina, 26-31% de amilosa, 11-14% de agua, 0.2-0.4% de proteína, 0.5-0.9% de lípido, 0.05-0.1% de ceniza, 0,02-0,03% de fósforo, 0.1% de pentosano. Aproximadamente el 70% de un gránulo es amorfo y el 30% es cristalino.
Un proceso de licuefacción enzimática común involucra ajustar el pH de una suspensión de almidón granular a entre
35 6.0 y 6.5, el pH óptimo de la alfa-amilasa derivado del Bacullus liqueniformis, con la adición de hidróxido de calcio, hidróxido de sodio o carbonato de sodio. La adición de hidróxido de calcio tiene la ventaja de también suministrar iones de calcio que son conocidos por estabilizar la alfa-amilasa contra inactivación. Luego de la adición de alfaamilasa, la suspensión es bombeada a través de un chorro de vapor para elevar instantáneamente la temperatura a entre 80º-115ºC. El almidón es inmediatamente gelatinizado y, debido a la presencia de alfa-amilasa,
40 despolimerizada a través de la hidrólisis aleatoria de enlaces (1-4) glicosídicos mediante alfa amilasa a una masa fluida que es fácilmente bombeada.
En una segunda variación al proceso de licuefacción, la alfa-amilasa se agrega a la suspensión de almidón, la suspensión se mantiene a una temperatura de 80-100ºC para hidrolizar parcialmente los gránulos de almidón, y la suspensión de almidón parcialmente hidrolizada es bombeada a través de un chorro a temperaturas que exceden
45 aproximadamente los 105ºC para gelatinizar completamente cualquier estructura granular restante. Después de enfriar el almidón gelatinizado, una segunda adición de alfa-amilasa se puede hacer para además hidrolizar el almidón.
Una tercera variación de este proceso es denominada proceso de molienda en seco. En la molienda en seco, el grano completo es molido y combinado con agua. El germen es opcionalmente retirado mediante separación por
50 flotación o técnicas equivalentes. La mezcla resultante, que contiene almidón, fibra, proteína y otros componentes del grano, es licuificada utilizando alfa-amilasa. La práctica general en la técnica es desarrollar licuefacción enzimática a una temperatura inferior cuando se utiliza un proceso de molienda en seco. Generalmente, se cree que la licuefacción a temperatura baja es menos eficiente que la licuefacción a temperatura alta en convertir almidón a dextrinas solubles.
55 Típicamente, después de la gelatinización la solución de almidón es mantenida a una temperatura elevada en la presencia de alfa amilasa hasta que se logra un DE de 10-20, usualmente un periodo de 1-3 horas. El equivalente de dextrosa (DE) es el estándar de la industria para medir la concentración de azucares reductores totales, calculada como la D glucosa sobre una base de peso seco. El almidón granular deshidrolizado tiene un DE de virtualmente cero, mientras que el DE de la D-glucosa se define como 100.
imagen2
La molienda en húmedo de maíz es un proceso que produce aceite de maíz, harina de gluten, alimento de gluten y
5 almidón. La amilasa alcalina se utiliza en la licuefacción de almidón y la glicoamilasa se utiliza en la sacarificación, que produce glucosa. El maíz, un grano que consiste de un recubrimiento de semilla externa (fibra), almidón, una combinación de almidón y glucosa y un germen interno, es sometido a un proceso de cuatro etapas, que da como resultado la producción de almidón. El almidón es remojado, se le quitan los gérmenes, se desfibra, y finalmente se separa el gluten. En el proceso de remojo, se retiran los solubles. El producto que permanece después de la
10 remoción de los solubles se le sacan los gérmenes, dando como resultado en producción de aceite de maíz y producción de una torta de aceite, que es agregada a los solubles desde la etapa de remojado. El producto restante es desfibrado y las fibras sólidas son agregadas a la mezcla de torta/soluble de aceite. Esta mezcla de sólidos de fibra, torta de aceite y solubles forma un alimento de gluten. Después de desfibrar, el producto restante se somete a la separación del gluten. Esta separación da como resultado una harina de gluten y almidón.
15 El almidón es luego sometido a licuefacción y sacarificación para producir glucosa.
La retrogradación de los productos horneados (tales como el pan) se ha reconocido como un problema que se vuelve más serio en la medida en que más tiempo pasa entre el momento de la preparación del producto del pan y el momento del consumo. El término retrogradación se utiliza para describir cambios indeseables al consumidor en las propiedades del producto del pan después de dejar el horno, tal como un incremento en la firmeza de la miga,
20 una disminución de la elasticidad de la miga, y cambios en la corteza, que la vuelven dura y correosa. La firmeza de la miga de pan se incrementa adicionalmente durante el almacenamiento hasta un nivel que es considerado como negativo. El incremento en la firmeza de la miga, que es considerado como el aspecto más importante de la retrogradación, se reconoce por el consumidor mucho tiempo antes de que el producto de pan se haya vuelto inadecuado para consumo.
25 Subsiste la necesidad de la industria para la identificación y optimización de amilasas, útiles para varios usos, incluyendo procesos de licuefacción de almidón de maíz comercial. Estas segundas amilasas ácidas de generación ofrecerán elaboración mejorada y/o características de desempeño en las enzimas estándar de la industria provenientes de Bacillus licheniformis, por ejemplo.
Subsiste la necesidad de la identificación y optimización de amilasas que tienen utilidad en lavado de platos en
30 productos para lavado automático de platos (ADW) y detergentes de lavandería. En los productos ADW, la amilasa funcionará a un pH 10-11 y a 45-60ºC en la presencia de queladores de calcio y condiciones oxidativas. Para lavandería, se requerirá actividad a un pH 9-10 y 40ºC en la matriz de detergente apropiada. Las amilasas son también útiles en desencolado textil, procesos de elaboración de cerveza, modificación del almidón en la industria papelera y de pulpa y en otros procesos descritos en la técnica.
35 Las publicaciones discutidas aquí se suministran solamente para su divulgación antes de la fecha de la presentación de la presente solicitud. Nada aquí debe ser considerado como una admisión de que la invención no tiene derecho a anticipar tal divulgación en virtud de invención previa.
Resumen de la invención
La invención suministra un ácido nucleico aislado que tiene una secuencia establecida en la SEQ ID No.: y variantes
40 de la misma que tienen al menos 90%, 95%, 96%, 97%, 98%, 99% de identidad de secuencia con la SEQ ID No.: y polipéptidos codificantes que tienen actividad de alfa amilasa.
Un aspecto de la invención es un ácido nucleico aislado que tiene una secuencia establecida en la SEQ ID No.: (en lo sucesivo denominada como “secuencias de ácido nucleico del grupo A”), secuencias sustancialmente idénticas a esta, y secuencias complementarias a esta.
45 Otro aspecto de la divulgación es un ácido nucleico asilado que incluye al menos 10 bases consecutivas de una secuencia como se establece en las secuencias del ácido nucleico del Grupo A, secuencias sustancialmente idénticas a esta, y secuencias complementarias a esta.
En aún otro aspecto, la invención suministra un ácido nucleico aislado que codifica un polipéptido que tiene una secuencia como se establece en la SEQ ID No.: y variantes de la misma que codifican un polipéptido que tiene
50 actividad de alfa amilasa y que tiene al menos 98%, 99% o 100 % de identidad de secuencia con tales secuencias.
Otro aspecto de la invención es un ácido nucleico aislado que codifica un polipéptido o un fragmento funcional del mismo que tiene una secuencia como se establece en la SEQ ID No.: en lo sucesivo denominado como “secuencias de aminoácido del Grupo B”, y secuencias sustancialmente idénticas a la misma.
imagen3
Otro aspecto de la divulgación es un ácido nucleico aislado que codifica un polipéptido que tiene al menos 10 aminoácidos consecutivos de una secuencia como se establece en las secuencias de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta.
En aún otro aspecto, la invención suministra un polipéptido purificado que tiene una secuencia como se establece en 5 las secuencias de aminoácido del Grupo B y secuencias sustancialmente idénticas a esta.
Otro aspecto de la divulgación es un anticuerpo aislado purificado que se une específicamente a un polipéptido que tiene una secuencia como se establece en las secuencias de aminoácido del Grupo B y secuencias sustancialmente idénticas a esta.
Otro aspecto de la divulgación es un anticuerpo aislado o purificado o un fragmento de unión del mismo, que se une
10 específicamente a un polipéptido que tiene al menos 10 aminoácidos consecutivos de uno de los polipéptidos de las secuencias de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta.
Otro aspecto de la invención es un método para elaborar un polipéptido que tiene una secuencia como se establece en las secuencias de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta. El método incluye introducir un ácido nucleico que codifica el polipéptido en una célula anfitriona, en donde el ácido nucleico está
15 operablemente ligado a un promotor, y cultivar la célula anfitriona bajo condiciones que permitan la expresión del ácido nucleico.
Otro aspecto de la divulgación es un método para elaborar un polipéptido que tiene al menos 10 aminoácidos de una secuencia como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas a esta. El método incluye introducir un ácido nucleico que codifica el polipéptido en una célula anfitriona, en
20 donde el ácido nucleico está operablemente ligado a un promotor, y cultivar la célula anfitriona bajo condiciones que permitan la expresión del ácido nucleico, produciendo de esta manera el polipéptido
Otro aspecto de la divulgación es un método para generar una variante que incluye obtener un ácido nucleico que tiene una secuencia como se establece en las secuencias de ácido nucleico del Grupo A, las subsecuencias sustancialmente idénticas a esta, secuencias complementarias a las secuencias de la secuencia de ácido nucleico
25 del Grupo A, fragmentos que comprenden al menos 30 nucleótidos consecutivos de las secuencias anteriores, y cambiar uno o más nucleótidos en la secuencia a otro nucleótido, suprimiendo uno o más nucleótidos en la secuencia, o agregando uno o más nucleótidos a la secuencia. Otro aspecto de la invención es un medio leíble por ordenador que tiene almacenado en este una secuencia tal como se establece en las secuencias de ácido nucleico del Grupo A, y secuencias sustancialmente idénticas a esta, o una secuencia de polipéptido como se establece en
30 las secuencias de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta. Otro aspecto de la divulgación es un sistema de ordenador que incluye un procesador y un dispositivo de almacenamiento de datos en donde el dispositivo de almacenamiento de datos tiene almacenado en este una secuencia como se establece en las secuencias de ácido nucleico del Grupo A y secuencias sustancialmente idénticas a esta, o un polipéptido que tiene una secuencia como se establece en las secuencias de aminoácido del Grupo B, y secuencias sustancialmente
35 idénticas a esta.
Otro aspecto de la divulgación es un método para comparar una primera secuencia a una secuencia de referencia en donde la primera secuencia es un ácido nucleico que tiene una secuencia como se establece en las secuencias de ácido nucleico de Grupo A, y secuencias sustancialmente idénticas a esta, o un código de polipéptido de la secuencia de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta. El método incluye leer la
40 primera secuencia y la secuencia de referencia a través del uso de un programa de ordenador que compara las secuencias; y determinar las diferencias entre la primera secuencia y las secuencias de referencias con el programa de ordenador.
Otro aspecto de la divulgación es un método para identificar una característica en una secuencia como se establece en las secuencias de ácido nucleico del Grupo A y secuencias sustancialmente idénticas a esta, o un polipéptido que
45 tiene una secuencia como se establece en las secuencias de aminoácido del Grupo B y secuencias sustancialmente idénticas a esta, que incluyen leer la secuencia a través del uso de un programa de ordenador que identifica características en la secuencias; e identificar características en la secuencia con el programa de ordenador.
Otro aspecto de la divulgación es un ensayo para identificar fragmentos o variantes de la secuencia de aminoácido del Grupo B, y secuencia sustancialmente idénticas a esta, que retienen la función enzimática de los polipéptidos de 50 la secuencia de aminoácido del Grupo B, y secuencias sustancialmente idénticas a esta. El ensayo incluye poner en contacto el polipéptido de las secuencias de aminoácido del Grupo B, secuencias sustancialmente idénticas a esta,
o un fragmento de polipéptido o variante con una molécula de sustrato bajo condiciones que le permitan al fragmento de polipéptido o variante funcionar, y detectar una disminución en el nivel del sustrato o un incremento en el nivel del producto de reacción especifico de la reacción entre el polipéptido y el sustrato identificando de esta
55 manera un fragmento o una variante de tales secuencias.
La divulgación también suministra un proceso para preparar una masa o un producto horneado preparado de la masa que comprende agregar una amilasa de la invención a la masa en una cantidad que es efectiva para retardar la retrogradación del pan. La invención también suministra una masa que comprende dicha amilasa y una premezcla que comprende harina junto con dicha amilasa. Finalmente, la invención suministra un aditivo de horneado enzimático, que contiene dicha amilasa.
imagen4
El uso de la amilasa de acuerdo con la presente invención suministra un efecto anti retrogradación mejorado medido mediante, por ejemplo, menos firmeza de la miga, elasticidad retenida de la miga, capacidad de tajado mejorada 5 (por ejemplo más pocas migas, ninguna miga gomosa), palatabilidad y sabor mejorados.
Breve descripción de los dibujos
Los siguientes dibujos son ilustrativos de las realizaciones de la invención y no pretenden limitar el alcance de la invención tal como está comprendida por las reivindicaciones.
La Figura 1 es un diagrama de bloque de un sistema de ordenador
10 La Figura 2 es un diagrama de flujo que ilustra una realización de un proceso para comparar una nueva secuencia de nucleótidos o proteínas con una base de datos de secuencias con el fin de determinar los niveles de homología entre la nueva secuencia y la secuencia en la base de datos.
La Figura 3 es un diagrama de flujo que ilustra una realización de un proceso en un ordenador para determinar si dos secuencias son homólogas.
15 La Figura 4 es un diagrama de flujo que ilustra una realización de un proceso 300 de identificador para detectar la presencia de una característica en una secuencia.
La Figura 5 es una gráfica que muestra la actividad residual de varias amilasas luego del calentamiento a 90ºC durante 10 minutos en el Ejemplo 1
La Figura 6 es una gráfica que muestra el porcentaje neto de almidón retirado versus la concentración de enzima en 20 ensayos de lavado ADW con lejía y queladores.
La Figura 7 es una gráfica que muestra la actividad de las amilasas parentales a un pH 8, 40ºC en una formulación ADW a 55ºC.
La Figura 8 es una gráfica de datos con relación a la tolerancia del H2O2 de las enzimas novedosas en el Ejemplo 4.
La Figura 9 es una gráfica de los datos de pH y temperatura para una selección de las amilasas caracterizadas. La 25 Figura 9a muestra los datos a un pH 8 y 40ºC y la Figura 9b muestra los datos a un pH 10 y 50ºC.
La Figura 10 establece las secuencias a ser utilizadas en experimentos en reensamblajes con las enzimas.
La Figura 11 ilustra una curva estándar de muestra del ensayo del Ejemplo 5.
La Figura 12 ilustra los perfiles de valoración de pH para la SEQ ID NO.: 127, que tiene un pH óptimo neutro y la SEQ ID No.: 211, que tiene un pH óptimo de alrededor de pH 10.
30 La Figura 13 muestra la estabilidad de amilasas diversa vs una enzima comercial, como se discutió en el Ejemplo 2.
La Figura 14 muestra los alineamientos de secuencia de α-amilasas de hipotermofílicas como se establece en el Ejemplo 8. La Figura 14a muestra un alineamiento de las secuencias de amilasa. La SEQ ID No.: 81= un clon ambiental; pyro = Pyrococcus sp. (sepa: KODI) Tachibana, Y., Mendez, L., Takagi, M. y Imanaka, T., J Ferment. Bioeng. 82: 224-232, 1996; pyro2 = Pyrococcus furiosus, Appl. Environ. Microbiol, 63 (9): 3569-3576, 1997; Thermo 35 = Thermococcus sp.; Thermo2 = Thermococcus hydrothermalis, Leveque, E. et al. Patent: Francia 98.05655 05MAYO-1998, no publicada. La Figura 14b muestra el alineamiento de la secuencia de aminoácido de las secuencias identificadas: SEQ ID No.: 81; pyro; SEQ ID No.: 75; SEQ ID No.: 77; SEQ ID No.: 83; SEQ ID No.: 85, thermo2; SEQ ID No.: 79; thermo; pyro2; clonA; Thermo3. La Figura 14c muestra el alineamiento de la secuencia de ácido nucleico que corresponde a la secuencia de polipéptido de las Figuras 5 y 6. SEQ ID No.:81; SEQ ID No.:75; SEQ ID
40 No.:77; SEQ ID No.:83; SEQ ID No.:85; SEQ ID No.:79; Clon A; y SEQ ID No.:73.
La Figura 15 es un árbol de unión de vecinos para Thermococcales.
La Figura 16 es la secuencia de la divulgación.
Descripción detallada de la invención
La presente invención se relaciona con amilasas y pos polinucleótidos que las codifican. Como se utiliza aquí, el
45 término “amilasa” comprende enzimas que tienen actividad de alfa amilasa, por ejemplo, alfa amilasas capaces de hidrolizar enlaces α-1,4-glucano internos en polisacáridos, incluyendo enzimas de amilasa capaces de hidrolizar almidón a azucares a pHs alcalinos o a pHs ácidos. Las amilasas de la invención son particularmente útiles en procesos de molienda de maíz húmedo, detergentes, procesos de horneado, bebidas y en campos petrolíferos (etanol combustible). Las amilasas son también útiles en desencolar textiles, procesos de fabricación de cerveza, modificación de almidón en la industria papelera y de pulpa y otros procesos descritos en la técnica.
imagen5
Los polinucleótidos de la invención se han identificado por codificar los polipéptidos que tienen actividad de alfa amilasa. Las amilasas alcalinas de la divulgación pueden incluir, pero no están limitadas a: SEQ ID NO.: 115, SEQ
5 ID NO.: 207, SEQ ID NO.: 139, SEQ ID NO.:127, SEQ ID NO.:137, SEQ ID NO.:113, SEQ ID NO.:205, SEQ ID NO.:179, SEQ ID NO.:151, SEQ ID NO.:187, SEQ ID NO.:97, SEQ ID NO.:153, SEQ ID NO.:69, SEQ ID NO.:135, SEQ ID NO.:189, SEQ ID NO.:119, SEQ ID NO.:209, y SEQ ID NO.:211.
Las alteraciones en las propiedades que se pueden lograr en variantes de la invención son alteraciones en, por ejemplo, la especificidad del sustrato, la unión del sustrato, el patrón de división del sustrato, estabilidad térmica,
10 perfil de pH/actividad, perfil de pH/estabilidad [tal como estabilidad incrementada a valores de pH bajos (por ejemplo pH<6, en particular pH<5) o alto (por ejemplo pH>9)], estabilidad hacia oxidación, dependencia del Ca2+, actividad específica, y otras propiedades de interés. Por ejemplo, la alteración puede resultar en una variante la cual, comparada con la amilasa padre, tiene una dependencia de Ca2+ reducida y/o un perfil de pH/actividad alterado.
La presente invención se relaciona con alfa amilasas y los polinucleótidos que las codifican. Como se utiliza aquí, el
15 término “alfa amilasa” comprende enzimas que tienen actividad de alfa amilasa, por ejemplo, enzimas capaces de hidrolizar almidón a azúcares. A diferencia de muchas amilasas conocidas, las amilasas de la invención pueden no ser enzimas dependientes de calcio.
Es altamente deseable poder disminuir la dependencia del Ca2+ de una alfa amilasa. De acuerdo con esto, un aspecto de la invención suministra una enzima de amilasa que tiene una dependencia al Ca2+ disminuida comparada 20 con las amilasas comerciales o padres. La dependencia a la Ca2+ disminuida generalmente tendrá la consecuencia funcional de que la variante exhibe una actividad amilolítica satisfactoria en la presencia de una concentración menor de ion calcio en el medio extraño que lo que es necesario para la enzima comercial o padre. Este tendrá a menudo la consecuencia de que la variante es menos sensible a las condiciones de vaciado de ion de calcio tal como aquellas obtenidas en medios que contienen agentes complejantes de calcio (tales como ciertos constructores
25 de detergente).
“Licuefacción” o “licuificar” significa un proceso mediante el cual el almidón es convertido a una cadena más corta y a dextrinas menos viscosas. Generalmente, este proceso involucra la gelatinización del almidón simultáneamente o seguido por la adición de alfa amilasa. En procesos comerciales, se prefiere que el almidón granular se derive de una fuente que comprenda maíz, trigo, milo, sorgo, centeno o bulgor. Sin embargo, la presente invención aplica a
30 cualquier fuente de almidón de grano que sea útil en la licuefacción, por ejemplo, cualquier otro grano o fuente de vegetal conocida por producir almidón adecuado para licuefacción.
“Almidón granular” o “gránulos de almidón” significan un componente insoluble en agua de granos comestibles que permanezca después de la remoción de la cáscara, fibra, proteína, grasa, germen, y solubles a través del remojado, agrietamiento mecánico, separaciones, tamizado, enjuagado en contra corriente y etapas de centrifugación típicas 35 de los procesos de molienda en número de grano. El almidón granular comprende gránulos de almidón intacto que contienen, casi exclusivamente, moléculas de almidón empacadas (es decir, amilopectina y amilosa). En el maíz, el componente de almidón granular comprende aproximadamente 99% de almidón; el restante 1% está comprendido de proteína, grasa, ceniza, fibra y componentes en traza estrechamente asociados con los gránulos. La estructura de empaque del almidón granular retarda severamente la capacidad de la alfa amilasa a hidrolizar el almidón. La
40 gelatinización del almidón se utiliza para afectar los gránulos para formar una solución de almidón soluble y facilitar la hidrólisis enzimática.
“Solución de almidón” significa el almidón gelatinizado soluble en agua que resulta de calentar almidón granular. Luego de calentar los gránulos por encima de aproximadamente 72ºC, el almidón granular se disocia para formar una mezcla acuosa de moléculas de almidón libres. Esta mezcla comprende, por ejemplo, aproximadamente 75% de 45 amilopectina y 25% de amilosa en formas en maíz amarillo dentado forma una solución viscosa en agua. En procesos comerciales para formar glucosa o fructosa, es la solución de almidón la que se licuifica para formar una solución de dextrina soluble, “alfa amilasa” significa una actividad enzimática que divide o hidroliza el enlace alfa (14) glicosídico, por ejemplo, que en el almidón, amilopectina o polímeros de amilosa. Las alfa amilosas adecuadas son las alfa amilosas de ocurrencia natural así como también las amilasas recombinantes o mutantes que son útiles
50 en licuefacción de almidón. Las técnicas para producir variantes de amilasas que tengan actividad a un pH o temperatura, por ejemplo, que es diferente de la amilasa tipo silvestre, están incluidas aquí.
El rango de temperatura de la licuefacción es generalmente cualquier temperatura de licuefacción que sea conocida por ser efectiva para licuificar almidón. Preferiblemente, la temperatura del almidón está entre aproximadamente 80ºC a aproximadamente 115ºC, más preferiblemente desde aproximadamente 100ºC a aproximadamente 110ºC, y
55 más preferiblemente desde aproximadamente 105ºC a aproximadamente 108ºC.
En una realización, las secuencias de señal de la divulgación son identificadas luego de la identificación de la amilasa de los polipéptidos de amilasa novedosos. Las sendas mediante las cuales las proteínas son seleccionadas y transportadas a su ubicación celular adecuada son a menudo denominadas como sendas rutas de orientación de
imagen6
proteína. Uno de los elementos más importantes en todos estos sistemas de orientación es una secuencia corta de aminoácido en el amino terminal del polipéptido nuevamente sintetizado denominada secuencia de señal. Esta secuencia de señal dirige una proteína a su ubicación apropiada en la célula y es retirada durante el transporte o cuando la proteína alcanza su destino final. La mayoría de las proteínas lisosomales, de membrana o secretadas 5 tienen una secuencia de señal amino terminal que las marca para la translocación en el lumen del retículo endoplasmático. Se han determinado más de 100 secuencias de señal para las proteínas en este grupo. Las secuencias varían en longitud desde 13 a 36 residuos de aminoácido. Son conocidos varios métodos de reconocimientos de secuencia de señal por aquellos expertos en la técnica. En una realización, los péptidos se identifican mediante un método denominado como SignalP. El SignalP utiliza una red neural combinada que 10 reconoce tanto los péptidos de señal como sus sitios de división. (Nielsen, H., Engelbrecht, J., Brunalk, S. von Heijne, G., “Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites.” Protein Engineering, vol. 10, no. 1, p. 1-6 (1997)) se debe entender que algunas de las amilasas de la invención pueden no tener secuencias de señal. Puede ser deseable incluir una secuencia de ácido nucleico que codifique una secuencia de señal de una amilasa operablemente ligada a una secuencia de ácido nucleico de una amilasa diferente u,
15 opcionalmente, puede ser deseada una secuencia de señal de una proteína no amilasa. La Tabla 3 muestra las secuencias de señal de la divulgación.
Las expresiones “ácido nucleico” o “secuencia de ácido nucleico” como se utiliza aquí se refieren a un oligonucleótido, nucleótido, polinucleótido, o a un fragmento de cualquiera de estos, a un ADN o ARN de origen genómico o sintético que puede ser de cadena sencilla o cadena doble y puede representar una cadena con sentido
20 o contrasentido, un ácido nucleico peptídico (PNA), o cualquier material similar a ADN o ARN, de origen natural o sintético.
Una “secuencia codificante” de una “que codifica la secuencia de nucleótido” un polipéptido particular o proteína, es una secuencia de ácido nucleico que es transcrita y traducida en un polipéptido o proteína cuando se coloca bajo el control de las secuencias regulatorias apropiadas.
25 El término “gen” significa un segmento de ADN involucrado en producir una cadena de polipéptido, este incluye regiones que preceden y siguen la región codificante (líder y trasera) así como también, donde es aplicable, secuencias intercaladas (intrones) entre segmentos codificantes individuales (exones).
“Aminoácido” o “secuencia de aminoácido” como se utiliza aquí se refiere a un oligopéptido, péptido, polipéptido o secuencia de proteína, o a un fragmento, porción, o subunidad de cualquiera de estos, o a moléculas de ocurrencia
30 natural o sintética.
El término “polipéptido” como se utiliza aquí, se refiere a aminoácidos unidos el uno al otro mediante enlaces peptídicos o enlaces peptídicos modificados, es decir, isoésteres de péptido, y pueden contener aminoácidos modificados diferentes de los 20 aminoácidos codificados por gen. Los polipéptidos se pueden modificar mediante procesos naturales, tales como el procesamiento postraduccional, o mediante técnicas de modificación química que 35 son bien conocidas en el arte. Las modificaciones pueden ocurrir en cualquier parte del polipéptido, incluyendo la estructura del péptido, las cadenas laterales de aminoácido y los terminales amino o carboxilo. Se apreciará que el mismo tipo de modificación puede estar presente en los mismos o variantes grados en varios sitios en un polipéptido dado. También un polipéptido dado puede tener muchos tipos de modificaciones, Las modificaciones incluyen acetilación, acilación, ADP-ribosilación, amidación, unión covalente de flavina, unión covalente de una porción hemo, 40 unión permanente de un nucleótido o un derivado de nucleótido, unión covalente de un lípido o derivado de lípido, unión covalente de un fosfitidilinositol, ciclización reticulada, formación de enance disulfuro, desmetilación, formación de reticulaciones covalentes, formación de cisteína, formación de piroglutamato, formilación, gama-carboxilación, glicosilación, formación de anclaje GPI, hidroxilación, yodinacion, metilación, miristoliación, oxidación, pergilación, procesamiento proteolítico, fosforilación, prenilación racemización, selenoilación, sulfatación, y adición mediada por
45 RAN de transferencia de aminoácidos a proteínas tales como arginilación. (See Creighton, T.E., Proteins – Structure and Molecular Properties 2nd Ed. , W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Protein, B.C. Johnson, Ed., Academmic Press, New York, pp 1-12 (1983)).
Como se utiliza aquí el término “aislado” significa que el material es retirado de su ambiente original (por ejemplo el ambiente natural si este es de ocurrencia natural). Por ejemplo, un polinucleótido de ocurrencia natural o un
50 polipéptido presente en un animal vivo no es aislado, pero el mismo polinucleótido polipéptido, separado de alguno o todos los materiales existentes en el sistema natural, es aislado. Tales polinucleótidos podrían ser parte de un vector y/o tales polinucleótidos o polipéptidos podrían ser parte de una composición, y aun ser aislados de tal manera que tal vector o composición no es parte de su ambiente natural.
Como se utiliza aquí, el término “purificado” no requiere pureza absoluta; en su lugar, se pretende como una
55 definición relativa. Los ácidos nucleicos individuales obtenidos de una biblioteca que han sido convencionalmente purificados a homogeneidad electroforética. Las secuencias obtenidas de estos clones podrían no ser obtenidas directamente de una biblioteca o del ADN humano total. Los ácidos nucleicos purificados de la invención se han purificado del resto del ADN genómico en el organismo durante al menos 104-106 veces. Sin embargo, el término “purificado” también incluye ácidos nucleicos que han sido purificados del resto del ADN genómico o de otras secuencias en una biblioteca o en otro ambiente por al menos un orden de magnitud, típicamente dos o tres órdenes, y más típicamente cuatro o cinco órdenes de magnitud.
imagen7
Como se utiliza aquí, el término “recombinante” significa que el ácido nucleico es adyacente a un ácido nucleico “columna” al cual este no es adyacente en su ambiente natural. Adicionalmente, para ser “enriquecido” los ácidos 5 nucleicos representarán el 5% o más del número de insertos de ácidos nucleicos en una población de moléculas columna de ácido nucleico. Las moléculas columna de acuerdo con la invención incluyen ácidos nucleicos tales como vectores de expresión, ácidos nucleicos autorreplicantes, virus, ácidos nucleicos integrantes, y otros vectores
o ácidos nucleicos utilizados para mantener o manipular un inserto de ácido nucleico de interés. Típicamente, los ácidos nucleicos enriquecidos representan el 15% o más del número de insertos de ácido nucleico en la población
10 de moléculas de columna recombinante. Más típicamente, los ácidos nucleicos enriquecidos representan el 50% o más del número de insertos de ácido nucleico en la población de moléculas de columna recombinante. En una realización, los ácidos nucleicos enriquecidos representan el 90% o más del número de insertos de ácido nucleico en la población de moléculas de columna recombinante.
Polipéptidos o proteínas “recombinantes” se refieren a polipéptidos o proteínas producidos mediante técnicas de
15 ADN recombinante; es decir, producidas de células transformadas mediante una construcción de un ADN exógeno que codifica el polipéptido o proteína deseados. Polipéptidos o proteínas “sintéticos” son aquellos preparados mediante síntesis química. Los métodos de síntesis química de péptido en fase solida también se pueden utilizar para sintetizar el polipéptido o los fragmentos de la invención. Tal método ha sido conocido en el arte desde comienzos de los sesenta (Merrifield, R.B. J. Am, Chem. Soc, 85:2149-2154, 1963) (Ver también Stewart J. M, and
20 Young, J. D. Solid Phases Peptide Synthesis, end ED., Pierce Chemical Co., Rockford, 111., pp. 11-12)) y se han empleado recientemente en diseños de péptidos en laboratorio comercialmente disponible y kits de síntesis (Cambridge Research Biochemicals). Tales kits de laboratorio comercialmente disponibles han utilizado generalmente las enseñanzas de H.M. Geysen et al, Proc. Natl. Acad. Sci. USA, 81: 3998 (1984) y suministran las síntesis de péptidos por las puntas de una multitud de “barra” o “pasadores” todos los cuales están conectados a
25 una placa simple. Cuando se utiliza tal sistema, una placa de barras y pasadores se invierte y se inserta en una segunda placa de los pozos o reservorios correspondientes, los cuales contienen soluciones para unir o anclar un aminoácido apropiado a las puntas de los pasadores o barras. Al repetir tal etapa de proceso, es decir invertir e insertar las puntas de barras y pasadores en las soluciones apropiadas, los aminoácidos son construidos en los péptidos deseados. Además, están disponibles un número de sistemas de síntesis de péptido FMOC disponibles.
30 Por ejemplo, el montaje de un polipéptido o fragmento se puede llevar a cabo sobre un soporte sólido que utiliza un sintetizador de péptidos automático Modelo 431 A de Applied Biosystems, Inc. Tal equipo suministra fácil acceso a los péptidos de la invención, bien sea mediante síntesis directa o mediante síntesis de una serie de fragmentos que se pueden acoplar utilizando otras técnicas conocidas.
Una secuencia promotora está “operablemente ligada” una secuencia de codificante cuando la polimerasa de ARN 35 que inicia la transcripción en el promotor transcribirá la frecuencia codificante en el mARN.
Los “plásmidos” se designan mediante una “p” precedida y/o seguida por letras mayúsculas y/o números, Los plásmidos de partida aquí están comercialmente disponibles, públicamente disponibles o sobre una base no restringida, o se pueden construir de plásmidos disponibles de acuerdo con procedimientos publicados. Además, los plásmidos equivalentes a aquellos descritos aquí son conocidos en la técnica y serán evidentes para la persona
40 medianamente versada.
La “digestión” del ADN se refiere a la división catalítica del ADN con una enzima de restricción que actúa solamente en ciertas secuencias en el ADN. Las varias enzimas de restricción utilizadas aquí están comercialmente disponibles y sus condiciones de reacción, cofactores y otros requisitos se utilizaron como seria conocido por la persona medianamente versada. Para propósitos analíticos, típicamente 1 µg de plásmido o fragmento de ADN se utiliza con 45 aproximadamente 2 unidades de enzima en aproximadamente 20 µl de solución amortiguadora. Con el propósito de aislar los fragmentos de ADN para la construcción de plásmido, típicamente 5 a 50 µg de ADN son digeridos con 20 a 250 unidades de enzima en un volumen mayor. Los amortiguadores apropiados y las cantidades de sustrato para enzimas de restricción particulares se especifican por el fabricante. Los tiempos de incubación de aproximadamente 1 hora a 37ºC son habitualmente utilizados, pero pueden variar de acuerdo con las instrucciones del proveedor.
50 Después de la digestión, se puede efectuar electroforesis de gel para aislar el fragmento deseado.
“Oligonucleótido” se refiere a un polidexosinucleótido de cadena simple o dos cadenas de polidexosinucleótido complementarias que pueden ser químicamente sintetizadas. Tales oligonucleótidos sintéticos no tienen 5’ fosfato y así no ligarán a otro oligonucleótido sin agregar un fosfato con un ATP en la presencia de una quinasa. Un oligonucleótido sintético ligará a un fragmento que no ha sido desfosforilado.
55 La expresión “sustancialmente idéntico” en el contexto de dos ácidos nucleicos o polipéptidos, se refiere a dos o más secuencias que tienen al menos 90%, 95%, 96%, 97%, 98%, 99% de identidad de oligonucleótido o 98%, 99% de identidad con el residuo de aminoácido, cuando se compara y se alinea para correspondencia máxima, medida o utilizando uno de los algoritmos de comparación de secuencia conocida o mediante inspección visual. Típicamente, existe identidad sustancial sobre una región de al menos aproximadamente 100 residuos, y más comúnmente las secuencias son sustancialmente idénticas sobre al menos aproximadamente 150-200 residuos. En algunas realizaciones, las secuencias son sustancialmente idénticas sobre la longitud completa de las regiones codificantes.
imagen8
Adicionalmente una secuencia de aminoácido “sustancialmente idéntica” es una secuencia que difiere de una secuencia de referencia por una o más sustituciones de aminoácido conservadoras o no conservadoras, 5 supresiones o inserciones, particularmente cuando tal sustitución ocurre en el sitio que no es el sitio activo de la molécula, y siempre y cuando el polipéptido retenga esencialmente sus propiedades funcionales. Una sustitución de aminoácido conservadora, por ejemplo, sustituye un aminoácido por otro de la misma clase (por ejemplo sustitución de un aminoácido hidrófobo, tal como isoleucina, valina, leucina o metionina, por otro, o la sustitución de un aminoácido polar por otro, tal como la sustitución de arginina por lisina, ácido glutámico por acido aspártico o 10 glutamina por asparagina). Se pueden suprimir uno o más aminoácidos, por ejemplo, de un polipéptido de alfa amilasa, dando como resultado la modificación de la estructura del polipéptido, sin alterar significativamente su actividad biológica. Por ejemplo, los aminoácidos amino o carboxilo terminales que no se requieren para la actividad biológica de la alfa amilasa se pueden retirar. Las secuencias de polipéptido modificadas de la invención se pueden ensayar para actividad biológica de alfa amilasa por un número de métodos, que incluye poner en contacto la
15 secuencia de polipéptido modificada con un sustrato de alfa amilasa y determinar si el polipéptido modificado disminuye la cantidad de sustrato especifico en el ensayo o incrementa los bioproductos de la reacción enzimática o un polipéptido de alfa amilasa funcional con el sustrato.
“Fragmentos” como se utiliza aquí son una porción de una proteína de ocurrencia natural que puede existir en al menos dos diferentes conformaciones. Los fragmentos pueden tener la misma o sustancialmente la misma 20 secuencia de aminoácido que la proteína de ocurrencia natural. “Sustancialmente la misma” significa que la secuencia de aminoácido es mayormente, sino completamente la misma, pero retiene al menos una actividad funcional de la secuencia que está relacionada. En general dos secuencias de aminoácido son “sustancialmente las mismas” o “sustancialmente homólogas” si ellas son al menos aproximadamente 85% idénticas. Los fragmentos que tienen diferentes estructuras tridimensionales como la proteína de ocurrencia natural también están incluidos. Un
25 ejemplo de esto es una molécula “proforma”, tal como una proteína de baja actividad que se puede modificar mediante división para producir una enzima madura con una actividad significativamente mayor.
“Hibridación” se refiere al proceso mediante el cual una cadena de ácido nucleico se une con una cadena complementaria a través del par base. Las reacciones de hibridación pueden ser sensibles y selectivas de tal manera que una secuencia particular de interés se puede identificar aun en muestras en las cuales ésta está
30 presente a bajas concentraciones. Las condiciones adecuadamente exigentes pueden ser definidas mediante, por ejemplo, las concentraciones de la sal o formamida en la prehibridación y las soluciones de hibridación, o mediante la temperatura de hibridación, y son bien conocidas en la técnica. En particular, la exigencia se puede incrementar al reducir la concentración de sal, incrementando la concentración de formamida, o elevando la temperatura de hibridación.
35 Por ejemplo, la hibridación bajo condiciones de alta exigencia podría ocurrir en aproximadamente 50% de formamida a aproximadamente 37ºC a 42ºC. La hibridación podría ocurrir bajo condiciones de exigencia reducidas en aproximadamente 35% a 25% de formamida a aproximadamente 30ºC a 35ºC. En particular, la hibridación podría ocurrir bajo altas condiciones de exigencia a 42ºC en 50% de formamida, 5X SSPE, 0.3% SDS y 200 n/ml de ADN de esperma de salmón cortado y desnaturalizado. La hibridación podría ocurrir bajo condiciones de exigencia
40 reducidas como se describió anteriormente, pero en 35% de formamida a una temperatura reducida de 35ºC. El rango de temperatura que corresponde a un nivel particular de exigencia puede ser además estrechado al calcular la proporción de purina a pirimidina del ácido nucleico de interés y ajustar la temperatura de acuerdo con esto. Las variaciones en los rangos anteriores y las condiciones son bien conocidas en la técnica.
El término “variante” se refiere a polinucleótidos o polipéptidos de la invención modificados en uno o más pares
45 base, codones, intrones, exones, o residuos de aminoácido (respectivamente) que retengan a una actividad biológica de una alfa amilasa de la invención. Las variantes se pueden producir mediante cualquier número de medios que incluyen métodos tales como, por ejemplo, PCR propenso a error, barajado, mutagénesis dirigida por oligonucleótido, ensamblaje de PCR, mutagénesis de PCR sexual, mutagénesis in vivo, mutagénesis de casete, mutagénesis de ensamble recursivo, mutagénesis de ensamble exponencial, mutagénesis específica del sitio,
50 reensamble de gen, GSSM y cualquier combinación de las mismas. Las técnicas para producir amilasas variantes que tengan actividad a un pH o temperatura, por ejemplo, que sea diferente de la amilasa tipo silvestre, están incluidas aquí.
Las enzimas son catalizadores altamente selectivos. Su distintivo es la capacidad de catalizar reacciones con estéreo, regio y quimio selectividades exquisitas que no tiene paralelo en la química sintética convencional. Más
55 aún, las enzimas son notoriamente versátiles. Ellas pueden ser hechas a medida para funcionar en solventes orgánicos, operar a pHs extremos (por ejemplo, pHs altos y pHs bajos) temperaturas extremas (por ejemplo, altas temperaturas y bajas temperaturas), niveles de salinidad extremos (por ejemplo, alta salinidad y baja salinidad), y catalizar reacciones con compuestos que están estructuralmente no relacionados con sus sustratos naturales, fisiológicos.
5
15
25
35
45
55
Las enzimas son reactivas hacia un amplio rango de sustratos naturales y no naturales, posibilitando así la modificación de virtualmente cualquier compuesto líder orgánico. Más aún, a diferencia de los catalizadores químicos tradicionales, las enzimas son altamente enantio y regio selectivas. El alto grado de la especificidad del grupo funcional exhibido por las enzimas le posibilita a una seguir la pista de cada reacción en una secuencia sintética que conduce a un nuevo compuesto activo. Las enzimas también son capaces de catalizar muchas reacciones diversas no relacionadas con su función fisiológica en la naturaleza. Por ejemplo, las peroxidasas catalizan la oxidación de los fenoles mediante peróxido de hidrógeno. Las peroxidasas también pueden catalizar reacciones de hidroxilación que no están relacionadas con la función nativa de la enzima. Otros ejemplos son proteasas que catalizan la descomposición de los polipéptidos. En solución orgánica algunas proteasas también pueden acilar azúcares, una función no relacionada con la función nativa de estas enzimas.
En un aspecto, la invención incluye un método para licuificar un almidón que contiene la composición que comprende poner en contacto el almidón con un polipéptido de la invención. En una realización preferida, el polipéptido se establece en la secuencia de aminoácido del Grupo B. El almidón puede ser de un material seleccionado de arroz, arroz germinado, maíz, cebada, trigo, legumbres y papa dulce. Un jarabe de glucosa producido por el método de la invención está incluido aquí. Tal jarabe puede ser jarabe de maltosa, un jarabe de glucosa o una combinación de estos. En particular, los jarabes producidos utilizando las amilasas de la invención existe un alto nivel de fracción DP2 y un nivel mayor de DP3 (maltotriosa y/o panosa) y menos del mayor de los fragmentos DP7 comparados con los jarabes producidos por enzimas comerciales. Esto es consistente con el perfil de licuefacción ya que menos fragmentos largos están en los jarabes licuificados de la invención.
La divulgación también suministra un método para retirar almidón que contiene tintes de un material que comprende poner en contacto el material con un polipéptido de la invención. En un aspecto, la divulgación suministra un método para lavar un objeto que comprende poner en contacto el objeto con un polipéptido de la invención bajo condiciones suficientes para lavado. Un polipéptido de la invención puede estar incluido como un aditivo detergente, por ejemplo. La divulgación también incluye un método para desencolado textil que comprende poner en contacto el textil con un polipéptido de la invención bajo condiciones suficientes para desencolar.
La divulgación también suministra un método para reducir la retrogradación de productos de panadería que comprende la adición de un polipéptido de la invención a un producto de panadería, antes del horneado.
La invención también suministra un método para el tratamiento de fibras lignocelulósicas, en donde las fibras son tratadas con un polipéptido de la invención, en una cantidad que es eficiente para mejorar las propiedades de la fibra. La divulgación incluye un método para desentintado enzimático de pulpa de papel reciclada en donde el polipéptido se aplica en una cantidad que es eficiente para el descentintado efectivo de la superficie de la fibra.
Cualquiera de los métodos descritos aquí incluye la posibilidad de la adición de una segunda alfa amilasa o una beta amilasa o una combinación de las mismas. Las amilasas comerciales u otras enzimas adecuadas para uso en combinación con una enzima de la invención son conocidas por aquellos expertos en la técnica.
La invención también incluye un método para incrementar el flujo de fluidos de producción de una formación subterránea al retirar un fluido viscoso, que contiene almidón, nocivo formado durante las operaciones de producción y encontrado dentro de la formación subterránea que circunda una perforación completa que comprende permitirle a los fluidos de producción fluir desde la perforación; reduciendo el flujo de fluidos de producción dese la formación por debajo de tazas de flujo esperadas; formular un tratamiento de enzima al mezclar junta un fluido acuoso y un polipéptido de la invención; bombear el tratamiento de enzima a un sitio deseado dentro de la perforación; permitirle al tratamiento de enzima degradar el fluido viscoso, que contiene almidón, nocivo, por medio del cual el fluido se puede retirar de la formación subterránea a la superficie del pozo; y en donde el tratamiento de enzima es efectivo para atacar los enlaces alfa glucosídicos en el fluido que contiene almidón.
La presente invención explota las propiedades catalíticas únicas de las enzimas. Mientras el uso de biocatalizadores (es decir enzimas purificadas o crudas, células no vivientes o vivientes) en transformaciones químicas normalmente requiere la identificación de un biocatalizador particular que reacciona con un compuesto de partida específico, la presente invención utiliza biocatalizadores seleccionados y condiciones de reacción que son específicas para los grupos funcionales que están presentes en muchos compuestos de partida.
Cada biocatalizador es específico para un grupo funcional, o varios grupos funcionales relacionados, y puede reaccionar con muchos compuestos de partida que contienen este grupo funcional.
Las reacciones biocatalíticas producen una población de derivados desde un compuesto de partida simple. Estos derivados pueden ser sometidos a una ronda de reacciones biocatalíticas para producir una segunda población de compuestos derivados. Se pueden producir miles de variaciones del compuesto original con cada iteración de derivatización biocatalítica.
Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar al resto de la molécula, un proceso que es muy difícil de lograr utilizando métodos químicos tradicionales. Este alto grado de especificidad biocatalítica proporciona los medios para identificar un único compuesto activo dentro de la colección. La colección se caracteriza por la serie de reacciones biocatalíticas utilizadas para producir, una así llamada "historia biosintética". El cribado de la colección de actividades biológicas y el seguimiento de la historia de biosíntesis identifica la secuencia de reacción específica que produce el compuesto activo. La secuencia de reacción se repite y se determina la estructura del compuesto sintetizado. Este modo de identificación, a diferencia de otros métodos de síntesis y cribado, no requiere tecnologías de inmovilización, y los compuestos se pueden sintetizar y probar libres
imagen9
5 en solución utilizando prácticamente cualquier tipo de ensayo de cribado. Es importante señalar, que el alto grado de especificidad de las reacciones de enzimas sobre grupos funcionales permite el "seguimiento" de las reacciones de enzimas específicas que componen la colección producida biocatalíticamente.
Existen muchas ventajas para el cribado de colecciones de fagos lambda para el descubrimiento con base en expresión de amilasas. Estos incluyen mejora de detección de clones tóxicos; mejora de acceso a sustrato;
10 necesidad reducida de manipular por ingeniería un anfitrión; al pasar el potencial de cualquier sesgo resultante de la división de masa de la colección; y crecimiento más rápido en bajas densidades de clones. Adicionalmente, existen ventajas para cribar colecciones de fagos lambda en fase líquida sobre fase sólida. Estos incluyen: mayor flexibilidad en las condiciones de ensayo; flexibilidad de sustito adicional; mayor sensibilidad para clones débiles; y facilidad de automatización.
15 Muchos de las etapas de procedimiento se realizan utilizando la automatización robótica que permite la ejecución de muchas miles de reacciones biocatalíticas y ensayos de cribado por día, así como asegurar un alto nivel de precisión y reproducibilidad. Como resultado, se puede producir una colección de compuestos derivados en cuestión de semanas que tomaría años de producir utilizando los métodos químicos actuales. (Para enseñanzas adicionales sobre modificación de moléculas, que incluyen moléculas pequeñas, véase el documento PCT/US94/09174).
20 En un aspecto, la presente divulgación proporciona un método no estocástico denominado reensamblaje de gen sintético, que está algo relacionado con transposiciones estocásticas, salvo que los elementos fundamentales de ácidos nucleicos no se transpongan o concatenen o quimericen al azar, sino más bien se ensamblen no estocásticamente.
El método de reensamblaje de gen sintético no depende de la presencia de un alto nivel de homología entre los
25 polinucleótidos que se van a transponer. La divulgación se puede utilizar para generar no estocásticamente colecciones (o grupos) de moléculas progenitoras que comprenden más de 10100 quimeras diferentes. Posiblemente, se puede utilizar el reensamblaje de genes sintéticos, incluso para generar colecciones compuestas por más de 101000 quimeras de progenitores diferentes. Por lo tanto, en un aspecto, la divulgación proporciona un método no estocástico para producir un grupo de moléculas de ácidos nucleico quimérico finalizado que tiene un orden de
30 ensamble general que se elige por el diseño, cuyo método se compone de las etapas de generar mediante diseño una pluralidad de específica elementos fundamentales de ácidos nucleicos que tiene extremos que se puede ligar, mutuamente compatibles reparados, y ensamblar estos elementos fundamentales de ácidos nucleicos, de tal manera que se consigue una orden de ensamble general diseñado.
Los extremos que se pueden ligar mutuamente compatibles de los elementos fundamentales de ácidos nucleicos
35 que se van a ensamblar se consideran "útiles" para este tipo de ensamble ordenado si permiten que los elementos fundamentales se acoplen en órdenes predeterminadas. Por lo tanto, en un aspecto, el orden de ensamble general en el que se pueden acoplar los elementos fundamentales de ácidos nucleicos se especifica por el diseño de los extremos que se pueden ligar y, si se va a utilizar más de una etapa de ensamble, entonces, el orden de ensamble general en el que se pueden acoplar los elementos fundamentales de ácidos nucleicos también se especifica por el
40 orden secuencial de la(s) etapa(s) de ensamble. En una realización de la divulgación, los componentes fundamentales hibridados se tratan con una enzima, tal como una ligasa (por ejemplo, ligasa de ADN T4) para lograr unión covalente de los componentes fundamentales.
En otra realización, se obtiene el diseño de elementos fundamentales de ácidos nucleicos en el análisis de las secuencias de un grupo de plantillas de ácido nucleico progenitoras que sirven como base para la producción de un
45 grupo progenitor de moléculas de ácido nucleico quimérico finalizado. Por lo tanto, estas plantillas de ácido nucleico progenitoras sirven como fuente de información de la secuencia que ayuda en el diseño de los elementos fundamentales de ácidos nucleicos que se van a mutar, por ejemplo, quimerizar o transponer.
En una ejemplificación, la divulgación proporciona la quimerización de una familia de genes relacionados y su familia codificada de productos relacionados. En una ejemplificación particular los productos codificados son enzimas. Las
50 amilasas de la presente invención, por ejemplo, alfa amilasas, se pueden mutagenizar de acuerdo con los métodos descritos aquí.
Por lo tanto, de acuerdo con un aspecto de la divulgación, las secuencias de una pluralidad de plantillas de ácidos nucleicos progenitoras (por ejemplo, los polinucleótidos de las secuencias de ácidos nucleicos del Grupo A) se alinean con el fin de seleccionar uno o más puntos de demarcación, cuyos puntos de demarcación se pueden ubicar
55 en un área de homología. Los puntos de demarcación se pueden utilizar para delinear los límites de los elementos fundamentales de ácidos nucleicos que se van a generar. Por lo tanto, los puntos de demarcación identificados y seleccionados en las moléculas progenitoras sirven como puntos quimerización potenciales en el ensamble de moléculas progenitoras.
imagen10
Normalmente, un punto de demarcación útil es un área de homología (compuesta de por lo menos una base de nucleótidos homóloga) compartida mediante por lo menos dos plantillas progenitoras, pero el punto de demarcación puede ser un área de homología que se comparte mediante por lo menos la mitad de las plantillas progenitoras, por lo menos dos tercios de las plantillas progenitoras, por lo menos tres cuartos de las plantillas progenitoras, y
5 preferiblemente casi todas las plantillas progenitoras. Incluso más preferiblemente aún un punto de demarcación útil es un área de homología que se comparte por todas las plantillas progenitoras.
En una realización, el proceso de reensamblaje de genes se realiza de forma exhaustiva con el fin de generar una colección exhaustiva. En otras palabras, todas las posibles combinaciones ordenada de los elementos fundamentales de ácidos nucleicos que están representados en el grupo de moléculas de ácido nucleico quimérico
10 finalizado. Al mismo tiempo, el orden de ensamble (es decir, el orden de ensamble de cada elemento fundamental en la dirección 5 para 3 secuencias de cada ácido nucleico quimérico finalizado) en cada combinación es por diseño (o no estocástico). Debido a la naturaleza no estocástica del método, se reduce considerablemente la posibilidad de productos secundarios no deseados.
En otra realización, el método proporciona que el proceso de reensamblaje de genes se realice de forma
15 sistemática, por ejemplo para generar una colección sistemáticamente en compartimientos, con compartimientos que se pueden cribar de forma sistemática, por ejemplo, uno por uno. En otras palabras, la divulgación proporciona que, a través del uso selectivo y juicioso de elementos fundamentales de ácidos nucleicos específicos, acoplados con el uso selectivo y juicioso de reacciones de ensamble secuencialmente escalonadas, un diseño experimental se puede lograr donde se hacen grupos específicos de productos de progenitores en cada uno de diversos recipientes de
20 reacción. Esto permite que se realice un examen y procedimiento de cribado sistemático. Por lo tanto, permite que se examine sistemáticamente una cantidad muy grande de moléculas progenitoras en grupos más pequeños.
Debido a su capacidad realizar quimerizaciones de una manera que es muy flexible pero exhaustiva y sistemática así como también, particularmente cuando existe un bajo nivel de homología entre las moléculas progenitoras, la presente divulgación proporciona la generación de una colección (o grupo) compuesto de una gran cantidad de
25 moléculas progenitoras. Debido a la naturaleza no estocástica de la presente invención de reensamblaje de gen, las moléculas progenitoras generadas preferiblemente comprenden una colección de moléculas de ácido nucleico quimérico finalizado que tienen un orden de ensamble general que se elige por diseño. En una realización particular, dicha colección generada se compone de más de 103 hasta más de 101000 diferentes especies moleculares progenitoras.
30 En un aspecto, un grupo de moléculas de ácido nucleico quimérico finalizado, producido como se describe se compone de un polinucleótido que codifica un polipéptido. De acuerdo con una realización, este polinucleótido es un gen, que puede ser un gen elaborado por el hombre. De acuerdo con otra realización, este polinucleótido es una ruta de gen, cuya ruta de gen puede ser elaborada por el hombre. La invención proporciona que uno o más genes producidos por el hombre generado por la invención se puedan incorporar en una ruta de gene elaborada por el
35 hombre, tal como ruta operable en un organismo eucariota (que incluye una planta).
En otra ejemplificación, la naturaleza sintética de la etapa en la que se generan los elementos fundamentales permite que el diseño y la introducción de nucleótidos (por ejemplo, uno o más nucleótidos, que pueden ser, por ejemplo, codones o intrones o secuencias reguladoras) más tarde opcionalmente se puedan eliminar en un proceso in vitro (por ejemplo, mediante mutagénesis) o en un proceso in vivo (por ejemplo, al utilizar la capacidad de corte y
40 empalme de genes de un organismo anfitrión). Se aprecia que en muchos casos la introducción de estos nucleótidos también puede ser deseable por muchas otras razones además del beneficio potencial de crear un punto de demarcación útil.
Por lo tanto, de acuerdo con otra realización, la divulgación proporciona que un elemento fundamental de ácido nucleico se pueda utilizar para introducir un intrón. Por lo tanto, la divulgación proporciona intrones funcionales que
45 se pueden introducir en un gen elaborado por el hombre de la invención. La divulgación también proporciona que los intrones funcionales se puedan introducir en una ruta de gen elaborada por el hombre de la invención. De acuerdo con lo anterior, la divulgación proporciona la generación de un polinucleótido quimérico que es un gen elaborado por el hombre que contiene uno (o más) intrón(es) introducido artificialmente.
De acuerdo con lo anterior, la divulgación también proporciona la generación de un polinucleótido quimérico que es
50 una ruta de gen elaborada por el hombre que contiene uno (o más) intrón(es) introducidos artificialmente. Preferiblemente, los intrones introducidos artificialmente son funcionales en una o más células anfitrionas para mucho corte y empalme de genes en la forma en que los intrones de origen natural sirven funcionalmente en el corte y empalme de genes. La divulgación proporciona un proceso para producir polinucleótidos que contienen intrones elaborados por el hombre que se introducen en los organismos anfitriones para la recombinación y/o corte y
55 empalme.
Un gen elaborado por el hombre producido utilizando la divulgación también puede servir como un sustrato para la recombinación con otro ácido nucleico. Del mismo modo, una ruta de gen elaborada por el hombre producido utilizando la divulgación también puede servir como un sustrato para la recombinación con otro ácido nucleico. En un caso preferido, se facilita la recombinación por, o ocurre en, áreas de homología entre el gen que contiene intrón elaborado por el hombre y un ácido nucleico, que sirve como un socio de recombinación. En un ejemplo particularmente preferido, el socio de recombinación también puede ser un ácido nucleico generado por la divulgación, que incluye un gen elaborado por el hombre o una ruta de genes elaborada por el hombre. La recombinación se puede facilitar por o se puede producir en áreas de homología que existen en uno (o más)
imagen11
5 intrón(es) introducidos artificialmente en el gen elaborado por el hombre.
El método de reensamblaje de gen sintético de la divulgación utiliza una pluralidad de elementos fundamentales de ácidos nucleicos, cada uno de ellos preferiblemente tiene dos extremos que se pueden ligar. Los dos extremos que se pueden ligar de cada elemento fundamental de ácido nucleico pueden ser dos extremos romos (es decir, que tienen cada uno una proyección de cero nucleótidos), o, preferiblemente, un extremo romo y una proyección, o más
10 preferiblemente aún dos proyecciones.
Una proyección útil para este propósito puede ser una proyección 3’ o una proyección 5’. Por lo tanto, un elemento fundamental de ácido nucleico puede tener una proyección 3’ o, alternativamente, una proyección 5’ o alternativamente dos proyecciones 3' o alternativamente dos proyecciones 5'. El orden general en el que se ensamblan los elementos fundamentales de ácidos nucleicos para formar una molécula de ácido nucleico quimérico
15 finalizado se determina por el diseño experimental decidido y no es aleatorio.
De acuerdo con una realización preferida, un elemento fundamental de ácido nucleico que se genera mediante síntesis química de dos ácidos nucleicos de cadena sencilla (también denominados como oligos de cadena sencilla) y en contacto con ellos con el fin de permitir que se hibriden para formar un elemento fundamental de ácido nucleico de cadena doble.
20 Un elemento fundamental de ácido nucleico de cadena doble puede tener tamaño variable. Los tamaños de estos elementos fundamentales pueden ser pequeños o grandes. Los tamaños preferidos para el elemento fundamental varían de 1 par de bases (sin incluir ninguna proyección) a 100,000 pares de bases (sin incluir ninguna proyección). También se proporcionan otros rangos de tamaño preferidos, los cuales tienen límites inferiores de 1 pb a 10.000 bp (que incluyen todos los valores enteros entre ellos), y límites superiores de los 2 pb a 100,000 pb (que incluyen
25 todos los valores enteros entre ellos).
Existen muchos métodos por los cuales un elemento fundamental de ácido nucleico de cadena doble se puede generar que es útil para la divulgación; y estos se conocen en la técnica y pueden ser realizadas fácilmente por el experto.
De acuerdo con una realización, un elemento fundamental de ácido nucleico de cadena doble se genera mediante al
30 generar primero dos ácidos nucleicos de cadena sencilla y permitirles hibridarse para formar un elemento fundamental de ácido nucleico de cadena doble. Los dos elementos fundamentales de ácidos nucleicos de cadena doble pueden ser complementarios en cada nucleótido aparte de cualquiera que forman una proyección; que por lo tanto no contiene emparejamientos erróneos, aparte de cualquier proyección(s). De acuerdo con otra realización, los dos elementos fundamentales de ácidos nucleicos de cadena doble son complementarios en menos de cada
35 nucleótido aparte de cualquiera que forma una proyección. Por lo tanto, de acuerdo con esta realización, se puede utilizar un elemento fundamental de ácido nucleico de cadena doble para introducir la degeneración del codón. Preferiblemente, se introduce la degeneración del codón utilizando mutagénesis de saturación en sitio descrita aquí, utilizando uno o más casetes N,N,G/T o, alternativamente, utilizando uno o más casetes N,N,N.
El método de recombinación in vivo de la divulgación se puede realizar en forma cegada en una agrupación de
40 híbridos o alelos desconocidos de un polinucleótido o secuencia específica. Sin embargo, no es necesario conocer la secuencia de ADN o ARN real del polinucleótido específico.
El método para utilizar recombinación dentro de una población mixta de genes puede ser útil para la generación de cualesquier proteínas útiles, por ejemplo, interleuquina I, anticuerpos, tPA y hormona de crecimiento. Se puede utilizar este método para generar proteínas que tienen especificidad o actividad alterada. El método también puede
45 ser útil para la generación de secuencias de ácidos nucleicos híbridas, por ejemplo, regiones promotoras, intrones, exones, secuencias potenciadoras, regiones no traducidas 3' o regiones no traducidas 5’ de genes. Por lo tanto, se puede utilizar este método para generar genes que tengan mayores tasas de expresión. Este método también puede ser útil en el estudio de las secuencias de ADN repetitivas. Finalmente, este método puede ser útil para mutar ribozimas o aptámeros.
50 En un aspecto, la divulgación se dirige al uso de ciclos repetidos de redistribución reductora, recombinación y selección que permite la evolución molecular dirigida de secuencias lineales altamente complejas, tales como ADN, ARN o recombinación completa de proteínas.
La transposición in vivo de moléculas es útil para proporcionar variantes y se puede realizar utilizando la propiedad natural de las células para recombinar multímeros. Mientras que la recombinación in vivo ha proporcionado la ruta
55 natural mayor para la diversidad molecular, la recombinación genética sigue siendo un proceso relativamente complejo que involucra 1) el reconocimiento de homologías; 2) división de cadena, invasión de cadena, y etapas metabólicas que conducen a la producción de quiasma recombinante; y, finalmente, 3) la resolución del quiasma en moléculas recombinadas discretos. La formación del quiasma requiere el reconocimiento de secuencias homólogas.
imagen12
En otra realización, la divulgación incluye un método para producir un polinucleótido híbrido a partir de por lo menos un primer polinucleótido y un segundo polinucleótido. Se puede utilizar la divulgación para producir un polinucleótido híbrido al introducir por lo menos un primer polinucleótido y un segundo polinucleótido que comparten por lo menos una región de homología de secuencia parcial en una célula anfitriona adecuada. Las regiones de homología de
5 secuencia parcial promueven los procesos que resultan en reorganización de secuencia que produce un polinucleótido híbrido. El término "polinucleótido híbrido", como se utiliza aquí, es cualquier secuencia de nucleótidos que resulta del método de la presente divulgación y contiene una secuencia de por lo menos dos secuencias de polinucleótidos originales. Dichos polinucleótidos híbridos pueden ser el resultado de eventos de recombinación intermolecular que promueven la integración de secuencias entre moléculas de ADN. Adicionalmente, dichos polinucleótidos híbridos pueden resultar de procesos de redistribución reductora intramolecular que utilizan secuencias repetidas para alterar una secuencia de nucleótidos dentro de una molécula de ADN.
La divulgación proporciona un medio para generar polinucleótidos híbridos que pueden codificar polipéptidos híbridos biológicamente activos (por ejemplo, alfa amilasas híbridas). En un aspecto, los polinucleótidos originales codifican polipéptidos biológicamente activos. El método de la divulgación produce nuevos polipéptidos híbridos al 15 utilizar procesos celulares que integran la secuencia de los polinucleótidos originales de tal manera que el polinucleótido híbrido resultante codifica un polipéptido que demuestra actividades derivadas de los polipéptidos biológicamente activos originales. Por ejemplo, los polinucleótidos originales pueden codificar una enzima particular a partir de diferentes microorganismos. Una enzima codificada por un primer polinucleótido de un organismo o variante puede, por ejemplo, funcionar efectivamente bajo una condición ambiental particular, por ejemplo alta salinidad. Una enzima codificada por un segundo polinucleótido de un organismo o variante diferente puede funcionar efectivamente bajo una condición ambiental diferente, como temperaturas extremadamente altas. Un polinucleótido híbrido que contiene secuencias del primer y segundo polinucleótidos originales puede codificar una enzima que exhibe características de ambas enzimas codificadas por los polinucleótidos originales. Por lo tanto, la enzima codificada por el polinucleótido híbrido puede funcionar de manera efectiva en condiciones ambientales
25 compartidas por cada uno de las enzimas codificadas por el primer y segundo polinucleótidos, por ejemplo, alta salinidad y temperaturas extremas.
Las enzimas codificadas por los polinucleótidos de la invención incluyen alfa amilasas. Un polipéptido híbrido que resulta del método de la divulgación puede exhibir actividad de enzima especializada no exhibida en las enzimas originales. Por ejemplo, después de recombinación y/o redistribución reductora de polinucleótidos que codifican las actividades de hidrolasa, el polipéptido híbrido resultante codificado por un polinucleótido híbrido se puede cribar para actividades de hidrolasa especializadas obtenidas a partir de cada una de las enzimas originales, es decir, el tipo de enlace sobre el que actúa la hidrolasa y la temperatura en la que funciona la hidrolasa. Por lo tanto, por ejemplo, se puede cribar la hidrolasa para determinar esas funcionalidades químicas que distinguen la hidrolasa híbrida de las hidrolasas originales, tales como: (a) amida (enlaces peptídicos), es decir, proteasas; (b) enlaces
35 éster, es decir, amilasas y lipasas; (c) acetales, es decir, glicosidasas y, por ejemplo, la temperatura, pH o concentración de sal en la que funciona el polipéptido híbrido.
Se pueden aislar fuentes de los polinucleótidos originales de organismos individuales ("aislados"), colecciones de organismos que se han cultivado en medios definidos ("cultivos de enriquecimiento"), u, organismos no cultivados ("muestras ambientales"). El uso de un método independiente de cultivo para derivar polinucleótidos que codifican nuevas actividades biológicas a partir de muestras ambientales es más preferible, ya que permite un acceso a los recursos no explotados de la biodiversidad.
Se generan "colecciones ambientales" a partir de muestras ambientales y representan los genomas colectivos de organismos de origen natural archivados en vectores de clonación que se pueden propagar en anfitriones procariotas adecuados. Debido a que el ADN clonado inicialmente se extrae directamente de muestras ambientales,
45 las colecciones no se limitan a la fracción pequeña de los procariotas que se pueden cultivar en cultivo puro. Adicionalmente, una normalización del ADN ambiental presente en estas muestras podría permitir una representación más equitativa del ADN de todas las especies presentes en la muestra original. Esto puede aumentar drásticamente la eficiencia de la búsqueda de genes interesantes de constituyentes menores de la muestra que puede ser sub-representados en diversos órdenes de magnitud en comparación con la especie dominante.
Por ejemplo, se criban las colecciones de genes generadas a partir de uno o más microorganismos no cultivados para detectar una actividad de interés. Las rutas potenciales que codifican moléculas bioactivas de interés primero se capturan en células procariotas en forma de colecciones de expresión génica. Los polinucleótidos que codifican actividades de interés se aíslan de dichas colecciones y se introducen en una célula anfitriona. La célula anfitriona se cultiva bajo condiciones que promueven la recombinación y/o redistribución reductora que crea biomoléculas
55 potencialmente activas con actividades novedosas o mejoradas.
Los microorganismos de los cuales se puede preparar el polinucleótido incluyen microorganismos procarióticos, tales como Eubacterias y Arqueobacterias, y microorganismos eucariotas inferiores, tales como hongos, algunas algas y protozoos. Los polinucleótidos se pueden aislar a partir de muestras ambientales en cuyo caso el ácido nucleico se puede recuperar sin el cultivo de un organismo o recuperar uno o más cultivos de organismos. En un aspecto, dichos microorganismos pueden ser extremófilos, tales como hipertermofilos, psicrófilos, psicrotrofos, halófilos, barófilos y acidófilos. Se prefieren particularmente polinucleótidos que codifican las enzimas aisladas a partir de
5
10
15
20
25
30
35
40
45
50
55
60
microorganismos extremófilos. Dichas enzimas pueden funcionar a temperaturas superiores a 100°C en manantiales termales terrestres y respiraderos térmicos de aguas profundas, a temperaturas por debajo de 0°C en aguas árticas, en el ambiente saturado con sal del Mar Muerto, a valores de pH de alrededor de 0 en depósitos de carbón y manantiales ricos en azufre geotérmicos, o a valores de pH superiores a 11 en lodos de duración. Por ejemplo, varias amilasas y lipasas clonadas y expresadas de organismos extremófilos muestran una alta actividad a lo largo de un amplio rango de temperaturas y pH.
De las nuevas enzimas de la presente divulgación, muchas se han purificado y caracterizado a pH 8, a 40°C y 50°C, y pH 10, a 40°C y 50°C. De las enzimas encontradas que se van a purificar y caracterizar a pH 8 y 40°C, se ve que tiene tres veces (682 U/mg) de actividad específica de una enzima de B. licheniformis (228 U/mg). Adicionalmente, se considera que otra enzima tiene actividad aproximadamente equivalente (250 U/mg) a la enzima de B. licheniformis. A un pH de 10 y 50°C, una de las enzimas tiene una actividad específica de 31 U/mg y otra tiene una actividad específica de 27.5 U/mg, mientras que B. licheniformis tiene una actividad específica de 27 U/mg.
Los polinucleótidos seleccionados y aislados como se describió anteriormente aquí se introducen en una célula anfitriona adecuada. Una célula anfitriona adecuada es cualquier célula que es capaz de promover recombinación y/o redistribución reductora. Los polinucleótidos seleccionados ya están preferiblemente en un vector que incluye secuencias de control apropiadas. La célula anfitriona puede ser una célula eucariota superior, tal como una célula de mamífero, o una célula eucariota inferior, tal como una célula de levadura, o preferiblemente, la célula anfitriona puede ser una célula procariota, tal como una célula bacteriana. La introducción de la construcción en la célula anfitriona se puede efectuar mediante transfección con fosfato de calcio, transfección mediada por DEAE-Dextrano,
o electroporación (Davis et al., 1986).
Como ejemplos representativos de anfitriones apropiados, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Salmonella typhimurium; células fúngicas, tales como levaduras; células de insecto tales como Drosophila S2 y Espodóptera Sf9; células de animal tales como CHO, COS o melanoma de Bowes; adenovirus; y células de plantas. La selección de un anfitrión apropiado se considera dentro del alcance de aquellos expertos en la técnica a partir de las enseñanzas de este documento.
Con referencias particulares a diversos sistemas de cultivo de células de mamíferos que se pueden emplear para expresar proteína recombinante, los ejemplos de sistemas de expresión de mamíferos incluyen las estirpes de COS7 de fibroblastos de riñón de mono, descritas en "SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981), y otras estirpes celulares capaces de expresar un vector compatible, por ejemplo, las estirpes celulares C127, 3T3, CHO, HeLa y BHK. Los vectores de expresión de mamíferos comprenderán un origen de replicación, un promotor y potenciador adecuado, y también cualesquier sitios de unión de ribosoma necesario, sitio de poliadenilación, sitio de donantes y aceptores de corte y empalme, secuencias de terminación de transcripción, y secuencias no transcritas flanqueantes 5’. Se pueden utilizar secuencias de ADN derivadas del corte y empalme SV40, y sitios de poliadenilación para proporcionar los elementos genéticos no transcritos requeridos.
Las células anfitrionas que contienen los polinucleótidos de interés se pueden cultivar en medios nutrientes convencionales modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar genes. Las condiciones de cultivo, tales como temperatura, pH y similares, son aquellas utilizadas previamente con la célula anfitriona seleccionada para expresión, y serán evidentes para el experto común. Los clones que se identifican por tener actividad de enzima especificada luego se pueden secuenciar para identificar la secuencia de polinucleótido que codifica una enzima que tiene la actividad mejorada.
En otro aspecto, se contempla que el método de la presente divulgación se puede utilizar para generar polinucleótidos novedosos que codifican las rutas bioquímicas a partir de uno o más operones o agrupaciones de genes o porciones de los mismos. Por ejemplo, las bacterias y muchos eucariotas tienen un mecanismo coordinado para regular los genes cuyos productos están implicados en procesos relacionados. Los genes se agrupan, en las estructuras mencionadas como "agrupaciones de genes", sobre un único cromosoma y se transcriben juntos bajo el control de una única secuencia reguladora, que incluyen un único promotor que inicia la transcripción de la agrupación completa. Por lo tanto, una agrupación de genes es un grupo de genes adyacentes que son idénticos o relacionados, usualmente en cuanto a su función. Un ejemplo de una ruta bioquímica codificada por agrupaciones de genes son policétidos. Los policétidos son moléculas que son una fuente extremadamente rica de bioactividades, que incluyen antibióticos (tales como tetraciclinas y eritromicina), agentes contra el cáncer (daunomicina), inmunosupresores (FK506 y rapamicina), y productos veterinarios (monensina). Muchos policétidos (producidos por policétido sintasas) son valiosos como agentes terapéuticos. Las policétido sintasas son enzimas multifuncionales que catalizan la biosíntesis de una enorme variedad de cadenas de carbono que difieren en longitud y patrones de funcionalidad y ciclización. Los genes de policétido sintasa se dividen en agrupaciones de genes y por lo menos un tipo (designado tipo I) de policétido sintasas tienen genes y enzimas de gran tamaño, lo que complica la manipulación genética y los estudios in vitro de estos genes/proteínas.
Se puede aislar el ADN de agrupaciones de genes a partir de diferentes organismos y se ligar en vectores, particularmente vectores que contienen secuencias reguladoras de expresión que pueden controlar y regular la producción de una proteína detectable o actividad de matriz relacionada con proteína de las agrupaciones de genes ligadas. El uso de vectores que tienen una capacidad excepcionalmente grande para introducción de ADN exógeno
imagen13
son particularmente apropiados para uso con dichas agrupaciones de genes y se describen a modo de ejemplo aquí para incluir el factor f (o factor de fertilidad) de E. coli. Este factor f de E. coli es un plásmido que afecta la transferencia de alta frecuencia de sí mismo durante conjugación y es ideal para alcanzar y propagar de forma estable fragmentos de ADN grandes, tales como agrupaciones de genes procedentes de muestras microbianas 5 mezcladas. Una realización particularmente preferida es el uso de vectores de clonación, denominados como "fósmidos" o vectores de cromosoma artificial bacteriano (BAC). Estos se derivan del factor f de E. coli que es capaz de integrar de manera estable grandes segmentos de ADN genómico. Cuando se integra con el ADN de una muestra ambiental no cultivada mezclada, esto hace que sea posible alcanzar grandes fragmentos genómicos en forma de "colección de ADN ambiental" estable. Otro tipo de vector para uso en la presente invención es un vector cósmido. Originalmente se diseñaron vectores cósmidos para clonar y propagar grandes segmentos de ADN genómico. La clonación en vectores cósmidos se describe en detalle en Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989). Una vez se liga en un vector apropiado, dos o más vectores que contienen diferentes agrupaciones de genes de policétido sintasa se pueden introducir en una célula anfitriona adecuada. Las regiones de homología de secuencia parcial compartida por las agrupaciones de
15 genes promoverán procesos que resultan en reorganización secuencia que da lugar a una agrupación de genes híbridos. La agrupación de genes híbrida novedosa luego se puede cribar para actividades mejoradas que no se encuentran en las agrupaciones de genes originales.
Por tanto, la divulgación se relaciona con un método para producir un polipéptido híbrido biológicamente activo y cribar dicho polipéptido para actividad mejorada al:
1) introducir por lo menos un primer polinucleótido en unión operativa y un segundo polinucleótido en unión operativa, dicha por lo menos primer polinucleótido y segundo polinucleótido comparten por lo menos una región de homología de secuencia parcial, en una célula anfitriona adecuada;
2) hacer crecer la célula anfitriona bajo condiciones que promueven la reorganización de secuencia lo que resulta en un polinucleótido híbrido en unión operativa;
25 3) expresar un polipéptido híbrido codificado por el polinucleótido híbrido;
4) seleccionar el polipéptido híbrido bajo condiciones que promueven la identificación de la actividad biológica reforzada; y
5) aislar el polinucleótido que codifica el polipéptido híbrido.
Los métodos para cribar diversas actividades enzimáticas son conocidos por aquellos expertos en la técnica y se discuten a lo largo de la presente especificación. Se pueden emplear dichos métodos al aislar los polipéptidos y polinucleótidos de la invención.
Como ejemplos representativos de vectores de expresión que se pueden utilizar, se pueden mencionar partículas virales, baculovirus, fagos, plásmidos, fagémidos, cósmidos, fósmidos, cromosomas artificiales bacterianos, ADN viral (por ejemplo, vaccinia, adenovirus, virus de la viruela, pseudorrabia y derivados de SV40), cromosomas
35 artificiales a base de P1, plásmidos de levadura, cromosomas artificiales de levadura y cualesquier otro vectores específicos para anfitriones específicos de interés (tales como bacillus, aspergillus y levadura). Por lo tanto, por ejemplo, el ADN puede estar incluido en una cualquiera de una variedad de vectores de expresión para expresar un polipéptido. Dichos vectores incluyen secuencias de ADN cromosómicas, no cromosómicas y sintéticas. Grandes cantidades de vectores adecuados son conocidos por aquellos expertos en la técnica, y están disponibles comercialmente. Se proporcionan a modo de ejemplo los siguientes vectores; Bacterianos: vectores pQE (Qiagen), plásmidos pBluescript, vectores, PNH (vectores lambda-ZAP (Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); eucarióticos: pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Sin embargo, se puede utilizar cualquier otro plásmido u otro vector siempre que sean replicables y viables en el anfitrión. Se pueden emplear bajo número de copias o alto número de copia de vectores con la presente invención.
45 La secuencia de ADN en el vector de expresión se liga operativamente a una secuencia (s) de control de expresión apropiada (promotor) para dirigir la síntesis de ARN. Los promotores bacterianos nombrados particulares incluyen lacI, lacZ, T3, T7, gpt, lambda PR, PL y trp. Los promotores eucarióticos incluyen CMV temprano inmediato, HSV timidina quinasa, SV40 temprano y tardío, LTR de retrovirus, y metalotioneína-I de ratón. La selección del vector y promotor apropiado está bien dentro del nivel del experto común en la técnica. El vector de expresión también contiene un sitio de unión al ribosoma para inicio de traducción y un terminador de transcripción. El vector también puede incluir secuencias apropiadas para amplificar la expresión. Se pueden seleccionar regiones promotoras de cualquier gen deseado utilizando vectores de cloranfenicol transferasa (CAT) u otros vectores con marcadores seleccionables. Adicionalmente, los vectores de expresión contienen preferiblemente uno o más genes marcadores seleccionables para proporcionar un rasgo fenotípico para la selección de células anfitrionas transformadas tales
55 como resistencia a dihidrofolato reductasa o neomicina para cultivo de células eucariotas, o tales como resistencia a tetraciclina o ampicilina en E. coli.
La redistribución in vivo se enfoca en procesos "intermoleculares" mencionados colectivamente como "recombinación", que en las bacterias, generalmente se ve como un fenómeno "dependiente de RecA". La divulgación puede confiar en procesos de recombinación de una célula anfitriona para recombinar y redistribuir secuencias, o la capacidad de las células para mediar en procesos reductores para disminuir la complejidad de las secuencias cuasi repetidas en la célula mediante supresión. Este proceso de "redistribución reductora" se produce por un proceso independiente de RecA "intramolecular".
imagen14
5 Por lo tanto, en otro aspecto de la divulgación, se pueden generar polinucleótidos novedosos mediante el proceso de redistribución reductora. El método implica la generación de construcciones que contienen secuencias consecutivas (secuencias de codificación originales), su inserción en un vector apropiado, y su posterior introducción en una célula anfitriona apropiada. La redistribución de las identidades moleculares individuales se produce mediante procesos combinatorios entre las secuencias consecutivas en las regiones de homología que poseen
10 construcciones, o entre unidades cuasi repetidas. El proceso de redistribución recombina y/o reduce la complejidad y extensión de las secuencias repetidas, y resulta en la producción de especies moleculares novedosas. Se pueden aplicar diversos tratamientos para mejorar la tasa de redistribución. Estos podrían incluir el tratamiento con luz ultravioleta, o químicos que dañan el ADN, y/o el uso de estirpes celulares de anfitriones que exhiben mayores niveles de "inestabilidad genética". Por lo tanto, el proceso de redistribución puede implicar la recombinación
15 homóloga o la propiedad natural de las secuencias cuasi repetidas para dirigir su propia evolución.
Las secuencias repetidas o "cuasi-repetidas" cumplen una función en la inestabilidad genética. En la presente invención, "cuasi repeticiones" son repeticiones que no se limitan a su estructura de unidad original. Las unidades cuasi repetidas se pueden presentar como una matriz de secuencias en una construcción; unidades consecutivas de secuencias similares. Una vez ligadas, las uniones entre las secuencias consecutivas se vuelven esencialmente 20 invisibles y la naturaleza cuasi repetitiva de la construcción resultante es ahora continua en el nivel molecular. Se realiza el proceso de supresión de la célula para reducir la complejidad de la construcción resultantes que operan entre las secuencias cuasi repetidas. Las unidades cuasi repetidas proporcionan un repertorio prácticamente ilimitado de plantillas sobre los que pueden ocurrir eventos de deslizamiento. Por lo tanto las construcciones que contienen las cuasi repeticiones proporcionan efectivamente elasticidad molecular suficiente ya que pueden ocurrir
25 eventos de supresión (y potencialmente inserción) prácticamente en cualquier lugar dentro de las unidades cuasirepetitivas.
Cuando se ligan todas las secuencias cuasi repetidas en la misma orientación, por ejemplo cabeza a cola, o viceversa, la célula puede no distinguir unidades individuales. En consecuencia, puede ocurrir el proceso reductor a lo largo de las secuencias. Por el contrario, cuando, por ejemplo, las unidades se presentan cabeza a cabeza, en 30 lugar de cabeza a cola, la inversión delinea los puntos finales de la unidad adyacente, de tal manera que la formación de supresión favorecerá la pérdida de unidades discretas. Por lo tanto, es preferible con el presente método que las secuencias estén en la misma orientación. La orientación aleatoria de las secuencias cuasi repetidas resultará en la pérdida de eficiencia de redistribución, mientras que la orientación consistente de las secuencias ofrecerá más alta eficiencia. Sin embargo, al mismo tiempo tener menos secuencias contiguas en la misma
35 orientación disminuye la eficiencia, aunque puede proporcionar la suficiente elasticidad para la recuperación efectiva de moléculas novedosas. Las construcciones se pueden hacer con las secuencias cuasi repetidas en la misma orientación para permitir una mayor eficiencia.
Se pueden ensamblar las secuencias en una orientación cabeza a cola utilizando cualquiera de una variedad de métodos, que incluyen los siguientes:
40 a) Se pueden utilizar cebadores que incluyen una cabeza poli-A y cola poli-T que, cuando se elaboran de cadena sencilla proporcionarían orientación. Esto se logra al tener las primeras pocas bases de cebadores hechas de ARN y por lo tanto se elimina fácilmente RNAseH.
b) Se pueden utilizar cebadores que incluyen sitios únicos de división de restricción. Se puede requerir múltiples sitios, una batería de secuencias únicas, y etapas de síntesis y ligación repetidas.
45 c) Las pocas bases internas del cebador se podrían tiolar y utilizar una exonucleasa para producir moléculas con cola apropiadamente.
La recuperación de las secuencias de redistribuidas se basa en la identificación de los vectores de clonación con un índice repetitivo reducido (RI). Se pueden recuperar las secuencias de codificación redistribuidas mediante amplificación. Los productos se vuelven a clonar y a expresar. La recuperación de vectores de clonación con RI
50 reducido se puede ver afectada por:
1) El uso de vectores solo mantenidos de manera estable cuando la construcción se reduce en complejidad.
2) La recuperación física de los vectores acortados por procedimientos físicos. En este caso, el vector de clonación se recupera utilizando los procedimientos de aislamiento de plásmidos estándar y el tamaño fraccionado en un gel de agarosa, ya sea, o columna con un bajo peso molecular de corte utilizando procedimientos estándar.
55 3) La recuperación de vectores que contienen genes interrumpidos que se pueden seleccionar cuando se reduce el tamaño de inserto.
imagen15
4) El uso de técnicas de selección directa con un vector de expresión y la selección apropiada.
Las secuencias de codificación (por ejemplo, genes) de organismos relacionados pueden demostrar un alto grado de homología y codificar productos de proteína muy diversos. Estos tipos de secuencias son particularmente útiles en la presente invención como cuasi repeticiones. Sin embargo, aunque los ejemplos ilustrados adelante demuestran la
5 redistribución de secuencias de codificación originales casi idénticos (cuasi repeticiones), este proceso no se limita a dichas repeticiones casi idénticas.
El siguiente ejemplo demuestra un método de la divulgación. Se describe la codificación de secuencias de ácidos nucleicos (cuasi repeticiones) derivadas de tres (3) especies únicas. Cada secuencia codifica una proteína con un grupo distinto de propiedades. Cada una de las secuencias difiere por un único o unos pocos pares de bases en una
10 posición única en la secuencia. Las secuencias cuasi repetidas se amplifican y se ligan de forma separada o colectiva en los ensambles aleatorios de tal manera que todas las permutaciones y combinaciones posibles están disponibles en la población de moléculas ligadas. La cantidad de unidades cuasi repetidas se puede controlar por las condiciones de ensamble. La cantidad promedio de unidades cuasi repetidas en una construcción se define como el índice repetitivo (RI).
15 Una vez formadas, las construcciones pueden, o no pueden tener el tamaño fraccionado en un gel de agarosa de acuerdo con los protocolos publicados, se inserta en un vector de clonación, y se transfectan en una célula anfitriona apropiada. Las células luego se propagan y se efectúa "redistribución reductora". La tasa del proceso de redistribución reductora se puede estimular por la introducción de daños en el ADN si se desea. Si la reducción de RI se media por la formación de supresión entre secuencias repetidas por un mecanismo "intramolecular", o
20 mediada por eventos similares a recombinación a través de los mecanismos “intermoleculares” es irrelevante. El resultado final es una redistribución de las moléculas en todas las combinaciones posibles.
Opcionalmente, el método comprende la etapa adicional de cribar los miembros de la colección de la agrupación transpuesta para identificar miembros de colección transpuestos individuales que tienen la capacidad de unirse a o de otra manera interactuar, o catalizar una reacción particular (por ejemplo, como dominio catalítico de una enzima)
25 con una macromolécula predeterminada, tal como por ejemplo un receptor proteico, un oligosacárido, virón, u otro compuesto o estructura predeterminada.
Los polipéptidos que se identifican de dichas colecciones se pueden utilizar con propósitos terapéuticos, de diagnóstico, de investigación y relacionados (por ejemplo, catalizadores, solutos para aumentar la osmolaridad de una solución acuosa, y similares), y/o se puede someter a uno o más ciclos adicionales de transposición y/o
30 selección.
En otro aspecto, se prevé que antes o durante recombinación o redistribución, los polinucleótidos generados por el método de la divulgación se pueden someter a agentes o procesos que promueven la introducción de mutaciones en los polinucleótidos originales. La introducción de dichas mutaciones incrementaría la diversidad de polinucleótidos resultante híbridos y polipéptidos codificados de los mismos. Los agentes o procesos que promueven mutagénesis 35 pueden incluir, pero no se limitan a: (+)-CC-1065, o un análogo sintético, tal como (+)-CC-1065-(N3-adenina (Véase Sun and Hurley, (1992); un aducto de 4'-fluoro-4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (véase, por ejemplo, van de Poll et al. (1992)), o un aducto de 4-aminobifenilo N-acetilado o desacetilado capaz de inhibir la síntesis de ADN (véase también, van de Poll et al. (1992), péptido. 751-758); cromo trivalente, una sal de cromo trivalente, un hidrocarburo aromático policíclico (PAH) de aducto de ADN capaz de inhibir la 40 replicación del ADN, tales como 7-bromometilbenz[a]antraceno ("BMA"), tris(2,3-dibromopropil) fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano ("DBCP"), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-dihidrodiol-9-10-epóxido ("BPDE"), una sal de halógeno platino (II), N-hidroxi-2-amino-3-metilimidazo[4,5-f]-quinolina ("N-hidroxi-IQ"), y Nhidroxi-2-amino-1-metil-6-fenilimidazo [4,5-f] piridina ("N-hidroxi-PhIP"). Medios especialmente preferidos para ralentizar o detener la amplificación por PCR se componen de luz UV (+)-CC-1065 y (+)-CC-1065-(N3-adenina).
45 Medios particularmente abarcados son aductos de ADN o polinucleótidos que comprenden los aductos de ADN de los polinucleótidos o agrupaciones de polinucleótidos, que se pueden liberar o eliminar mediante un proceso que incluye calentar la solución que comprende los polinucleótidos antes de procesamiento adicional.
En otro aspecto la divulgación se dirige a un método para producir proteínas recombinantes que tienen actividad biológica al tratar una muestra que comprende polinucleótidos de plantilla de cadena doble que codifica una proteína
50 de tipo silvestre bajo condiciones de acuerdo con la divulgación que proporcionan la producción de polinucleótidos híbridos o redistribuidos.
La divulgación también proporciona el uso de cebadores de codones privados (que contienen una secuencia N,N,N degenerada) para introducir mutaciones de punto en un polinucleótido, con el fin de generar un grupo de polipéptidos progenitores en el que un amplio rango de sustituciones de aminoácidos individuales se representa en 55 cada posición de aminoácido (mutagénesis de sitio de gen saturado (GSSM)). Los oligos utilizados se componen de forma contigua de una primera secuencia homóloga, una secuencia N,N,N, degenerada y preferiblemente, pero no necesariamente una segunda secuencia homóloga. Los productos de traducción de progenitor en dirección 3’ del uso de dichos oligos incluyen todos los posibles cambios de aminoácidos en cada sitio de aminoácidos a lo largo del
imagen16
polipéptido, debido a que la degeneración de la secuencia de N,N,N incluye los codones para todos los 20 aminoácidos.
En un aspecto, uno de dichos oligo degenerados (compuesto por un casete N,N,N degenerado) se utiliza para someter cada codón original en una plantilla de polinucleótido progenitora a un amplio rango de sustituciones de 5 codones. En otro aspecto, se utilizan por lo menos dos casetes N,N,N degenerados -ya sea en el mismo oligo o no, para someter por lo menos dos codones originales en una plantilla de polinucleótido progenitora a un amplio rango de sustituciones de codones. Por lo tanto, más de una secuencia N,N,N puede estar contenida en un oligo para introducir mutaciones de aminoácidos en más de un sitio. Esta pluralidad de secuencias de N,N,N puede estar directamente contigua, o separada por una o más secuencia (s) de nucleótidos adicionales. En otro aspecto, los
10 oligos útiles para introducir adiciones y supresiones se pueden utilizar ya sea solos o en combinación con los codones que contienen una secuencia N,N,N, para introducir cualquier combinación o permutación de adiciones, supresiones, y/o sustituciones de aminoácidos.
En una ejemplificación particular, es posible mutagenizar simultáneamente dos o más posiciones de aminoácidos contiguos utilizando un oligo que contiene tripletes N,N,N contiguos, es decir, una secuencia (N,N,N) degenerada.
15 En otro aspecto, la presente divulgación proporciona el uso de casetes degenerados que tienen menos degeneración de la secuencia N,N,N. Por ejemplo, puede ser deseable en algunos casos utilizar (por ejemplo, en un oligo) una secuencia de triplete degenerada compuesta de sólo un N, en la que dicho N puede estar en la primera segunda o tercera posición del triplete. Cualesquier otras bases que incluyen posibles combinaciones y permutaciones de los mismos se pueden utilizar en las dos posiciones restantes del triplete. Alternativamente, puede
20 ser deseable en algunos casos utilizar (por ejemplo, en un oligo) una secuencia de triplete N,N,N degenerada, secuencia de triplete N,N,G/T, o N,N,G/C.
Sin embargo, se apreciará, que el uso de un triplete degenerado (tal como secuencia de tripletes N,N,G/T o N,N,G/C) como se describe aquí es ventajoso por varias razones. En un aspecto, esta divulgación proporciona un medio para generar sistemáticamente y con bastante facilidad la sustitución del rango completo de posibles 25 aminoácidos (para un total de 20 aminoácidos) en todas y cada posición del aminoácido en un polipéptido. Por lo tanto, para un polipéptido de 100 aminoácidos, la invención proporciona una manera de generar sistemáticamente y con bastante facilidad 2000 especies distintas (es decir, 20 posibles aminoácidos por posición por 100 posiciones de aminoácidos). Se aprecia que se proporciona, a través del uso de un oligo que contiene una secuencia de tripletes N,N,G/T o N,N,G/C degeneradas, 32 secuencias individuales que codifican 20 aminoácidos posibles. Por lo tanto, en
30 un recipiente de reacción en el que una secuencia de polinucleótidos progenitora se somete a mutagénesis de saturación utilizando uno de dichos oligo, se generan 32 polipéptidos progenitores distintos que codifican 20 polipéptidos distintos. En contraste, el uso de un oligo no degenerado en la mutagénesis dirigida a sitio conduce a solo un producto de polipéptido de progenitora por recipiente de reacción.
Esta divulgación también proporciona el uso de oligos no degenerados, que se pueden utilizar opcionalmente en
35 combinación con cebadores degenerados divulgados. Se aprecia que en algunas situaciones, es ventajoso utilizar oligos no degenerados para generar mutaciones de punto específicas en un polinucleótido de trabajo. Esto proporciona un medio para generar mutaciones de punto silenciosas específicas, mutaciones de punto que conducen a cambios de aminoácidos correspondientes, y mutaciones de punto que provocan la generación de codones de parada y la expresión correspondiente de fragmentos de polipéptido.
40 Por lo tanto, en una realización, cada recipiente de reacción de mutagénesis de saturación contiene polinucleótidos que codifican por lo menos 20 moléculas de polipéptido progenitor de tal manera que todos los 20 aminoácidos se representan en la posición de un aminoácido específico que corresponde a la posición de codón mutagenizado en el polinucleótido progenitor. Los polipéptidos progenitores degenerados 32 veces generados a partir de cada recipiente de reacción de mutagénesis de saturación se pueden someter a amplificación clonal (por ejemplo, clonado en un
45 anfitrión de E. coli adecuado utilizando un vector de expresión) y someter a cribado de expresión. Cuando se identifica un polipéptido progenitor individual mediante cribado para exhibir un cambio favorable en propiedad (en comparación con el polipéptido progenitor), se puede secuenciar para identificar la sustitución de aminoácido correspondientemente favorable contenida en el mismo.
Se aprecia que en la mutagénesis de todas y cada posición de aminoácido en un polipéptido progenitor utilizando
50 mutagénesis de saturación como se describe aquí, se pueden identificar cambios de aminoácidos favorables en más de una posición de aminoácido. Se pueden generar una o más nuevas moléculas progenitoras que contienen una combinación de la todo o parte de estas sustituciones de aminoácidos favorables. Por ejemplo, si se identifican 2 cambios de aminoácidos favorables específicos en cada una de 3 posiciones de aminoácidos en un polipéptido, las permutaciones incluyen 3 posibilidades en cada posición (no cambia del aminoácido original, y cada uno de dos
55 cambios favorables) y 3 posiciones. Por lo tanto, existen 3 x 3 x 3 o 27 posibilidades totales, que incluyen 7 que se examinaron previamente -6 mutaciones de punto individuales (es decir, 2 en cada una de las tres posiciones) y ningún cambio en cualquier posición
En aún otro aspecto, se puede utilizar mutagénesis de saturación de sitio junto con transposición, quimerización, recombinación y otros procesos mutagenizantes, junto con el cribado. Esta divulgación proporciona el uso de
5
10
15
20
25
30
35
40
45
50
55
cualquier proceso de mutagénesis(es), que incluye mutagénesis de saturación, de manera iterativa. En una ejemplificación, el uso iterativo de cualquier proceso(s) de mutagénesis se utiliza en combinación con cribado.
Por lo tanto, esta divulgación proporciona el uso de mutagénesis de saturación en combinación con procesos de mutagenización adicionales, tales como proceso en el que dos o más polinucleótidos relacionados se introducen en una célula anfitriona adecuada de tal manera que se genera un polinucleótido híbrido por la recombinación y redistribución reductora.
Además de realizar la mutagénesis a lo largo de toda la secuencia de un gen, la presente divulgación proporciona que se pueda utilizar la mutagénesis para reemplazar cada uno de cualquier número de bases en una secuencia de polinucleótidos, en la que el número de bases que se somete a mutagénesis es preferiblemente cada entero de 15 a 100,000. Por lo tanto, en lugar de mutagenizar cada posición a lo largo de una molécula, se puede someter cada uno o un número discreto de bases (preferiblemente un subgrupo total de 15 a 100,000) a mutagénesis. Preferiblemente, un nucleótido separado se utiliza para mutagénesis de cada posición o grupo de posiciones a lo largo de una secuencia de polinucleótidos. Un grupo de 3 posiciones que se va a mutagenizar puede ser un codón. Las mutaciones se introducen preferiblemente utilizando un cebador mutagénico, que contiene un casete heterólogo, también mencionado como un casete mutagénico. Los casetes preferidos pueden tener de 1 a 500 bases. Cada posición de nucleótido en dichos casetes heterólogos es N, A, C, G, T, A/C, A/G, A T, C/G, C/T, G/T, C/G/T, A G/T, A/C/T, A C/G, o E, donde E es cualquier base que no es A, C, G, o T (E se puede denominar como un oligo diseñador).
En un sentido general, la mutagénesis de saturación se compone de mutagénesis de un grupo completo de casetes mutagénicos (en la que cada casete tiene preferiblemente aproximadamente 1 a 500 bases de longitud) en la secuencia de polinucleótidos definida que se va a mutagenizar (en la que la secuencia que se va a mutagenizar tiene preferiblemente de aproximadamente 15 a 100,000 bases de longitud). Por lo tanto, un grupo de mutaciones (que varía de 1 a 100 mutaciones) se introduce en cada casete que se va a mutagenizar. Una agrupación de mutaciones que se va a introducir en un casete puede ser diferente o el mismo de una segunda agrupación de mutaciones que se va a introducir en un segundo casete durante la aplicación de una ronda de mutagénesis de saturación. Dichas agrupaciones se ejemplifican por supresiones, adiciones, agrupaciones de codones particulares y agrupaciones de casetes de nucleótidos particulares.
Las secuencias definidas que se van a mutagenizar incluyen un gen completo, ruta, cADN, un marco de lectura abierta completo (ORF), y promotor completo, potenciador, represor/transactivador, origen de replicación, intrón, operador, o cualquier grupo funcional de polinucleótido. En general, unas "secuencias definidas" para este propósito pueden ser cualquier polinucleótido de una secuencia de polinucleótidos de 15 bases, y secuencias de polinucleótidos de longitudes entre 15 bases y 15,000 bases (esta divulgación específicamente nombra cada entero entre ellos). Consideraciones en la elección de agrupaciones de codones incluyen tipos de aminoácidos codificados por un casete mutagénico degenerado.
En una ejemplificación particularmente preferida una agrupación de mutaciones se puede introducir en un casete mutagénico, esta divulgación se proporciona específicamente para sustituciones de codones degenerados (utilizando oligos degenerados) que codifican 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, y 20 aminoácidos en cada posición, y una colección de polipéptidos codificados por los mismos.
Un aspecto de la invención es un ácido nucleico aislado que comprende una de las secuencias de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, las secuencias complementarias de las mismas, o un fragmento que comprende por lo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de una secuencia de ácidos nucleicos del Grupo A (o las secuencias complementarias de las mismas). Los ácidos nucleicos aislados, pueden comprender ADN, que incluyen cADN, ADN genómico y ADN sintético. El ADN puede ser de cadena doble o de cadena sencilla, y si es de cadena sencilla puede ser la cadena codificante o cadena no codificante (antisentido). Alternativamente, los ácidos nucleicos aislados pueden comprender ARN.
Como se discute en más detalle a continuación, los ácidos nucleicos aislados de una de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, se pueden utilizar para preparar uno de los polipéptidos de una secuencia de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente activos de uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas.
De acuerdo con lo anterior, otro aspecto de la invención es un ácido nucleico aislado que codifica uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas,
o fragmentos enzimáticamente activos de uno de los polipéptidos de las secuencias de aminoácidos del Grupo B. Las secuencias de codificación de estos ácidos nucleicos pueden ser idénticas a una de las secuencias de codificación de uno de los ácidos nucleicos de secuencias de ácidos nucleicos del Grupo A, o fragmentos de ellas o pueden ser diferentes secuencias de codificación que codifican uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, secuencias sustancialmente idénticas de las mismas, y fragmentos enzimáticamente activos de uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, como resultado de la redundancia
o degeneración del código genético. El código genético es bien conocido por aquellos expertos en la técnica y se puede obtener, por ejemplo, en la página 214 de B. Lewin, Genes VI, Oxford University Press, 1997.
imagen17
El ácido nucleico aislado que codifica uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, puede incluir, pero no se limita a: sólo la secuencia de 5 codificación de una de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas y secuencias de codificación adicionales, tales como secuencias líder o secuencias de proproteína y secuencias sin sentido, tales como intrones o secuencias no codificantes 5 'y/o 3' de la secuencia de codificación. Por lo tanto, como se utiliza aquí, el término "polinucleótido que codifica un polipéptido" abarca un polinucleótido que incluye sólo la secuencia de codificación del polipéptido así como un polinucleótido que incluye secuencia de
10 codificación adicional y/o secuencia de no codificación.
Alternativamente, las secuencias de ácidos nucleicos de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, se pueden mutagenizar utilizando técnicas convencionales, tales como mutagénesis dirigida a sitio u otras técnicas familiares para aquellos expertos en la técnica, para introducir cambios silenciosos en los polinucleótidos de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente
15 idénticas de las mismas. Aquí, "cambios silenciosos" incluyen, por ejemplo, cambios que no alteran la secuencia de aminoácidos codificada por el polinucleótido. Dichos cambios pueden ser deseables con el fin de aumentar el nivel del polipéptido producido por las células anfitrionas que contienen un vector que codifica el polipéptido al introducir codones o pares de codones que ocurren con frecuencia en el organismo anfitrión.
La invención también se relaciona con polinucleótidos que tienen cambios de nucleótidos que resultan en
20 sustituciones, adiciones, supresiones, fusiones y truncamientos de aminoácidos en los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. Dichos cambios de nucleótidos se pueden introducir utilizando técnicas tales como mutagénesis dirigida a sitio, mutagénesis química aleatoria, supresión de exonucleasa III, y otras técnicas de ADN recombinante. Alternativamente, dichos cambios de nucleótidos pueden ser variantes alélicas naturales que se aíslan al identificar ácidos nucleicos que se hibridan
25 específicamente con sondas que comprenden por lo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases consecutivas de una de las secuencias de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas (o las secuencias complementarias de las mismas) bajo condiciones de alta, moderada o baja rigurosidad como se describe aquí.
Los ácidos nucleicos aislados de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente
30 idénticas de las mismas, las secuencias complementarias a las mismas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 bases consecutivas de una de las secuencias de las secuencias de ácido nucleico del Grupo A, y secuencias sustancialmente idénticas de las mismas, o las secuencias complementarias de las mismas también se pueden utilizar como sondas para determinar si una muestra biológica, tal como una muestra de suelo, contiene un organismo que tiene una secuencia de ácidos nucleicos de la invención
35 o un organismo del que se obtuvo el ácido nucleico. En dichos procedimientos, se obtiene una muestra biológica potencialmente que alberga el organismo del que se aisló el ácido nucleico y los ácidos nucleicos se obtienen de la muestra. Los ácidos nucleicos se ponen en contacto con la sonda bajo condiciones que permiten que la sonda se hibride específicamente con cualesquiera secuencias complementarias las que están presentes aquí.
Cuando sea necesario, se pueden determinar las condiciones que permiten que la sonda se hibride específicamente
40 a secuencias complementarias mediante la colocación de la sonda en contacto con secuencias complementarias de las muestras conocidas que contienen la secuencia complementaria, así como secuencias de control que no contienen la secuencia complementaria. Las condiciones de hibridación, tales como la concentración de sal del regulador de hibridación, la concentración de formamida del regulador de hibridación, o la temperatura de hibridación, se pueden variar para identificar las condiciones que permiten a la sonda para hibridarse
45 específicamente con ácidos nucleicos complementarios.
Si la muestra contiene el organismo del que se aisló el ácido nucleico, entonces se detecta la hibridación específica de la sonda. La hibridación se puede detectar mediante al marcar la sonda con un agente detectable tal como un isótopo radiactivo, un colorante fluorescente o una enzima capaz de catalizar la formación de un producto detectable.
50 Muchos métodos para el uso de las sondas marcadas para detectar la presencia de ácidos nucleicos complementarios en una muestra son familiares para aquellos expertos en la técnica. Estos incluyen transferencias Southern, transferencias Northern, procedimientos de hibridación de colonias y transferencias de puntos. Los protocolos para cada uno de estos procedimientos se proporcionan en Ausubel et al. Cunent Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) y Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold
55 Spring Harbor Laboratory Press (1989).
Alternativamente, se puede utilizar más de una sonda (por lo menos una de los cuales es capaz de hibridarse específicamente con cualesquiera secuencias complementarias que están presentes en la muestra de ácido nucleico), en una reacción de amplificación para determinar si la muestra contiene un organismo que contiene secuencia de ácidos nucleicos de la invención (por ejemplo, un organismo del que se aísla el ácido nucleico).
imagen18
Normalmente, las sondas comprenden oligonucleótidos. En una realización, la reacción de amplificación puede comprender una reacción de PCR. Los protocolos de PCR se describen en Ausubel y Sambrook, supra. Alternativamente, la amplificación puede comprender una reacción en cadena de ligasa, 3SR, o la reacción de desplazamiento de cadena. (Barany, F., "The Ligase Chain Reaction in a PCR World", PCR Methods and 5 Applications 1:5-16, 1991; E. Fahy et al., "Self-sustained Sequence Replication (3SR): An Isothermal Transcriptionbased Amplification System Alternative to PCR", PCR Methods and Applications 1 :25-33, 1991; and Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro ADN Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992. En dichos procedimientos, los ácidos nucleicos de la muestra se ponen en contacto con las sondas, se lleva a cabo la reacción de amplificación, y se detecta cualquier producto de amplificación resultante. Se puede detectar el producto de amplificación al realizar electroforesis en gel de los productos de reacción y tinción el gel con un intercalador tal como bromuro de etidio. Alternativamente, una o más de las sondas se pueden marcar con un isótopo radiactivo y la presencia de un producto de amplificación radiactivo se puede detectar por autorradiografía después de electroforesis en gel. Las sondas derivadas de secuencias cercanas a los extremos de las secuencias de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las
15 mismas, también se pueden utilizar en procedimientos para desplazamiento sobre cromosoma para identificar los clones que contienen secuencias genómicas adyacentes a las secuencias de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas. Dichos métodos permiten el aislamiento de genes que codifican proteínas adicionales del organismo anfitrión.
Los ácidos nucleico aislados de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, las secuencias complementarias de las mismas, o un fragmento que comprende al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 bases consecutivas de una de las secuencias de secuencias de ácido nucleico del Grupo A, y secuencias sustancialmente idénticas de las mismas, o las secuencias complementarias de las mismas se pueden utilizar como sondas para identificar y aislar ácidos nucleicos relacionados. En algunas realizaciones, los ácidos nucleicos relacionados pueden ser cADN o ADN genómicos a
25 partir de organismos distintos de aquellos de la que se aisló el ácido nucleico. Por ejemplo, los otros organismos pueden ser organismos relacionados. En dichos procedimientos, una muestra de ácido nucleico se pone en contacto con la sonda bajo condiciones que permitan que la sonda se hibride específicamente a secuencias relacionadas. La hibridación de la sonda a ácidos nucleicos del organismo relacionado luego se detecta utilizando cualquiera de los métodos descritos anteriormente.
En las reacciones de hibridación de ácidos nucleicos, las condiciones utilizadas para conseguir un nivel particular de rigurosidad variarán, dependiendo de la naturaleza de los ácidos nucleicos que se hibridan. Por ejemplo, la longitud, grado de complementariedad, composición de secuencia de nucleótidos (por ejemplo, GC versus contenido de AT) y el tipo de ácido nucleico (por ejemplo, ARN versus ADN) de las regiones de hibridación de los ácidos nucleicos puede ser considerado en las condiciones de hibridación de selección. Una consideración adicional es si uno de los
35 ácidos nucleicos se inmoviliza, por ejemplo, en un filtro.
Se puede llevar a cabo la hibridación en condiciones de baja rigurosidad, moderada rigurosidad o alta rigurosidad. Como un ejemplo de hibridación de ácido nucleico, una membrana de polímero que contiene ácidos nucleicos desnaturalizados inmovilizados se prehibridó primero durante 30 minutos a 45°C en una solución que consiste en NaCl 0.9 M, NaH2PO4 50 mM, pH 7.0, Na2EDTA 5.0 mM, 0.5% de SDS, 10X solución de Denhardt, y 0.5 mg de ácido poliriboadenílico/ml. Aproximadamente luego se agregan 2 X 107 cpm (actividad específica de 4-9 X 108 cpm/ug) de sonda de oligonucleótidos marcada en el extremo con 32P a la solución. Después de 12-16 horas de incubación, la membrana se lava durante 30 minutos a temperatura ambiente en 1X SET (NaCl 150 mM, clorhidrato de Tris 20 mM, pH 7, Na2EDTA 8.1 mM) que contiene 0.5% de SDS, seguido por un lavado de 30 minutos en SET 1X fresca a Tm 10ºC para la sonda de oligonucleótidos. La membrana luego se establece a película
45 autorradiográfica para la detección de señales de hibridación.
Al variar la rigurosidad de las condiciones de hibridación utilizadas para identificar ácidos nucleicos, tales como cADN o ADN genómicos, que se hibridan con la sonda detectable, se pueden identificar y aislar ácidos nucleicos que tienen diferentes niveles de homología con la sonda. La rigurosidad se puede variar mediante la realización de la hibridación a diferentes temperaturas por debajo de las temperaturas de fusión de las sondas. La temperatura de fusión, Tm, es la temperatura (bajo una fuerza iónica y pH definidos) a la que 50% de la secuencia objetivo se hibrida con una sonda perfectamente complementaria. Se seleccionan condiciones muy rigurosas para ser igual o aproximadamente 5°C más baja que la Tm para una sonda particular. La temperatura de fusión de la sonda se puede calcular utilizando las siguientes fórmulas:
Para sondas de entre 14 y 70 nucleótidos de longitud la temperatura de fusión (Tm) se calcula utilizando la fórmula: 55 Tm = 81.5 + 16.6 (log [Na+]) + 0.41 (fracción G + C) -(600/N), donde N es la longitud de la sonda
Si la hibridación se lleva a cabo en una solución que contiene formamida, la temperatura de fusión se puede calcular utilizando la ecuación: Tm = 81.5 + 16.6 (log [Na+]) + 0.41 (fracción G + C)-(0.63% de formamida) -(600/N), donde N es la longitud de la sonda.
La prehibridación se puede realizar en 6X SSC, 5X de reactivo de Denhardt, 0.5% de SDS, 100 µg de ADN de esperma de salmón fragmentado o 6X SSC, 5X de reactivo de Denhardt, 0.5% de SDS, 100 µg de ADN de esperma de salmón desnaturalizado fragmentado, 50% de formamida. Las fórmulas para las soluciones de SSC y de Denhardt se enumeran en Sambrook et al., Supra.
imagen19
La hibridación se conduce al se agrega la sonda detectable a las soluciones de prehibridación enumeradas anteriormente. Cuando la sonda comprende ADN de cadena doble, se desnaturaliza antes de adición a la solución 5 de hibridación. El filtro se pone en contacto con la solución de hibridación durante un período suficiente de tiempo para permitir que la sonda se hibride con cADN o ADN genómicos que contienen secuencias complementarias a la misma o homólogas a ésta. Para sondas de más de 200 nucleótidos de longitud, la hibridación se puede realizar a 15-25°C por debajo de Tm. Para sondas más cortas, tales como sondas de oligonucleótidos, la hibridación se puede llevar a cabo a 5-10°C por debajo de la Tm. Normalmente, para hibridaciones en 6 x SSC, la hibridación se realiza a
10 aproximadamente a 68°C. Usualmente para las hibridaciones en 50% de formamida que contienen soluciones, la hibridación se realiza a aproximadamente 42°C.
Todas las hibridaciones anteriores serían consideradas para estar bajo condiciones de alta rigurosidad.
Luego de hibridación, el filtro se lava para eliminar cualquier sonda detectable unida de forma no específica. La rigurosidad se utiliza para lavar los filtros también se pueden variar dependiendo de la naturaleza de los ácidos 15 nucleicos que se hibridan, la longitud de los ácidos nucleicos que se hibridan, el grado de complementariedad, la composición de secuencia de nucleótidos (por ejemplo, contenido GC versus serían contenido AT), y el tipo de ácido nucleico (por ejemplo, ARN versus ADN). Ejemplos de lavados con condición de rigurosidad progresivamente más elevada son como sigue: 2X SSC, 0.1% de SDS a temperatura ambiente durante 15 minutos (baja rigurosidad); 0.1X SSC, 0.5% se SDS a temperatura ambiente durante 30 minutos a 1 hora (moderada rigurosidad moderada); 0.1X 20 SSC, 0.5% de SDS durante 15 a 30 minutos entre la temperatura de hibridación y 68°C (alta rigurosidad); y NaCl
0.15 M durante 15 minutos a 72°C (muy alta rigurosidad). Un lavado final de baja rigurosidad se puede realizar en
0.1 X SSC a temperatura ambiente. Los ejemplos anteriores son solo ilustrativos de un grupo de condiciones que se pueden utilizar para lavar los filtros. Un experto en la técnica sabe que existen numerosas recetas para diferentes lavados de rigurosidad. Algunos otros ejemplos se dan adelante.
25 Los ácidos nucleicos que se han hibridado con la sonda se identifican mediante autorradiografía u otras técnicas convencionales.
El procedimiento anterior se puede modificar para identificar ácidos nucleicos que tienen niveles decrecientes de homología con la secuencia de sonda. Por ejemplo, para obtener ácidos nucleicos de disminución de homología con la sonda detectable, se pueden utilizar condiciones menos rigurosas. Por ejemplo, la temperatura de hibridación se 30 puede disminuir en rangos de 5°C desde 68°C hasta 42°C en un regulador de hibridación que tiene una concentración de Na+ de aproximadamente 1 M. Luego de hibridación, el filtro se puede lavar con 2X SSC, 0.5% de SDS a la temperatura de hibridación. Estas condiciones se consideran condiciones "moderadas" por encima de 50°C y condiciones "bajas" por debajo de 50°C. Un ejemplo específico de condiciones de hibridación "moderadas" es cuando la hibridación anterior se realiza a 55°C. Un ejemplo específico de condiciones de hibridación "baja
35 rigurosidad" es cuando la hibridación anterior se realiza a 45°C.
Alternativamente, la hibridación se puede llevar a cabo en reguladores, tales como 6x SSC, que contienen formamida a una temperatura de 42°C. En este caso, la concentración de formamida en el regulador de hibridación se puede reducir en incrementos de 5% desde 50% hasta 0% para identificar clones que tienen niveles decrecientes de homología con la sonda. Después de hibridación, el filtro se puede lavar con 6X SSC, 0.5% de SDS a 50°C.
40 Estas condiciones se consideran condiciones "moderadas" por encima de 25% de formamida y condiciones "bajas" por debajo del 25% de formamida. Un ejemplo específico de condiciones de hibridación "moderadas" es cuando la hibridación anterior se realiza a 30% de formamida. Un ejemplo específico de condiciones de hibridación de "baja rigurosidad" es cuando la hibridación anterior se realiza en 10% de formamida.
Por ejemplo, se pueden utilizar los métodos anteriores para aislar ácidos nucleicos que tienen una secuencia con
45 por lo menos aproximadamente 97%, por lo menos 95%, por lo menos 90%, por lo menos 85%, por lo menos 80%, por lo menos 70%, por lo menos 65%, por lo menos 60%, por lo menos 55%, o por lo menos 50% de homología con una secuencia de ácidos nucleicos seleccionada del grupo que consiste en una de las secuencias de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o fragmentos que comprenden por lo menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, o 500 bases
50 consecutivas de la misma, y las secuencias complementarias de las mismas. La homología se puede medir utilizando el algoritmo de alineación. Por ejemplo, los polinucleótidos homólogos pueden tener una secuencia de codificación que es una variante alélica de origen natural de una de las secuencias de codificación descritas aquí. Dichas variantes alélicas pueden tener una sustitución, supresión o adición de uno o más nucleótidos cuando se compara con los ácidos nucleicos de secuencias de ácidos nucleicos del Grupo A o las secuencias complementarias
55 de las mismas.
Adicionalmente, se pueden utilizar los procedimientos anteriores para aislar ácidos nucleicos que codifican polipéptidos que tienen por lo menos aproximadamente 99%, 95%, por lo menos 90%, por lo menos 85%, por lo menos 80%, por lo menos 75%, por lo menos 70%, por lo menos 65%, por lo menos 60%, por lo menos 55%, o por lo menos 50% de homología con un polipéptido que tiene la secuencia de una de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos que comprenden por lo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, o 150 aminoácidos consecutivos de las mismas como se determina utilizando un algoritmo de alineación de secuencias (por ejemplo, tal como el algoritmo FASTA versión 3.0t78 con parámetros predeterminados).
imagen20
5 Otro aspecto de la invención es un polipéptido aislado o purificado codificado por la secuencia de una de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente activos de las mismas. Como se discutió anteriormente, tales polipéptidos se pueden obtener mediante la inserción de un ácido nucleico que codifica el polipéptido en un vector de tal manera que la secuencia de codificación está unida operativamente a una secuencia capaz de dirigir la expresión del polipéptido codificado en
10 una célula anfitriona adecuada. Por ejemplo, el vector de expresión puede comprender un promotor, un sitio de unión al ribosoma para la iniciación de traducción y un terminador de la transcripción. El vector también puede incluir secuencias apropiadas para amplificar la expresión.
Los promotores adecuados para expresar el polipéptido o fragmento del mismo en bacterias incluyen los promotores lac o trp de E. coli, el promotor lacI, el promotor lacZ, el promotor T3, el promotor T7, el promotor gpt, el promotor 15 lambda PR, el promotor PL lambda, los promotores de operones que codifican enzimas glicolíticas tales como 3fosfoglicerato quinasa (PGK), y el promotor de fosfatasa ácida. Los promotores de hongos incluyen el promotor del factor ω. Los promotores eucariotas incluyen el promotor inmediato temprano de CMV, el promotor de timidina quinasa de HSV, los promotores de choque térmico, el promotor SV40 temprano y tardío, LTR de retrovirus, y el promotor de metalotioneína-I de ratón. También se pueden utilizar otros promotores conocidos para controlar la
20 expresión de genes en células procariotas o eucariotas o sus virus.
Los vectores de expresión de mamíferos también pueden comprender un origen de replicación, sitios de unión a ribosomas necesario, un sitio de poliadenilación, sitios de de donantes y aceptores de corte y empalme, secuencias de terminación de transcripción, y secuencias no transcritas flanqueantes 5’. En algunas realizaciones, se pueden utilizar las secuencias de ADN derivadas de corte y empalme de SV40 y sitios de poliadenilación para proporcionar
25 los elementos genéticos no transcritos requeridos.
Los vectores para expresar el polipéptido o fragmento del mismo en las células eucariotas también pueden contener potenciadores para aumentar los niveles de expresión. Los potenciadores son elementos que actúan en cis de ADN, normalmente de aproximadamente 10 a aproximadamente 300 pb de longitud que actúan sobre un promotor para aumentar su transcripción. Ejemplos incluyen el potenciador de SV40 en el lado tardío del origen de replicación pb
30 100 a 270, el el potenciador de promotor temprano de citomegalovirus, el potenciador de polioma en el lado tardío del origen de replicación, y potenciadores de adenovirus.
Adicionalmente, los vectores de expresión normalmente contienen uno o más genes marcadores seleccionables para permitir selección de células anfitrionas que contienen el vector. Dichos marcadores seleccionables incluyen genes que codifican la dihidrofolato reductasa o genes que confieren resistencia a neomicina para cultivo de células
35 eucariotas, los genes que confieren resistencia a ampicilina o tetraciclina en E. coli y el gen TRP1 de S. cerevisiae.
En algunas realizaciones, el ácido nucleico que codifica uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de las mismas se ensambla en la fase apropiada con una secuencia líder capaz de dirigir la secreción del polipéptido traducido o 40 fragmento del mismo. Opcionalmente, el ácido nucleico puede codificar un polipéptido de fusión en el que uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas,
o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de las mismas se fusiona con péptidos o polipéptidos heterólogos, tales como péptidos de identificación de terminal N que imparten características deseadas, tales como el aumento de la estabilidad o
45 purificación simplificada.
La secuencia de ADN apropiada se puede insertar en el vector mediante una variedad de procedimientos. En general, la secuencia de ADN se liga a la posición deseada en el vector después de digestión del inserto y el vector con endonucleasas de restricción apropiadas. Alternativamente, se pueden ligar los extremos romos, en el inserto y el vector. Una variedad de técnicas de clonación se describen Ausubel et al. Cunent Protocols in Molecular Biology,
50 John Wiley 503 Sons, Inc. 1997 y Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989). Dichos procedimientos y otros se consideran dentro del alcance de los expertos en la técnica.
El vector puede estar, por ejemplo, en forma de un plásmido, una partícula viral, o un fago. Otros vectores incluyen secuencias de ADN cromosómicas, no cromosómicas y sintéticas, derivadas de SV40; plásmidos bacterianos, ADN
55 de fago, baculovirus, plásmidos de levadura, vectores derivados de combinaciones de plásmidos y ADN de fago, ADN viral tal como vaccinia, adenovirus, virus de la viruela aviar y pseudorrabia. Una variedad de vectores de clonación y expresión para uso con anfitriones procariotas y eucariotas se describen por Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y., (1989).
5
10
15
20
25
30
35
40
45
50
55
Vectores bacterianos particulares que se pueden utilizar incluyen los plásmidos disponibles comercialmente que comprenden elementos genéticos del vector de clonación bien conocido pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suecia), GEM1 (Promega Biotec, Madison, WI, USA) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pDR540, pRIT5 (Pharmacia), pKK232-8 y pCM7. Vectores eucarióticos particulares incluyen pSV2CAT, p0G44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG y pSVL (Pharmacia). Sin embargo, se puede utilizar cualquier otro vector siempre que sea replicable y viable en la célula anfitriona.
La célula anfitriona puede ser cualquiera de las células anfitrionas familiares para aquellos expertos en la técnica, que incluyen células procariotas, células eucariotas, células de mamífero, células de insecto, o células de plantas. Como ejemplos representativos de anfitriones apropiados, se pueden mencionar: células bacterianas, tales como E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium y varias especies dentro de los géneros Pseudomonas, Streptomyces, y Staphylococcus, células fúngicas, tales como levaduras, células de insectos tales como Drosophila S2 y Espodóptera Sf9, células de animales tales como CHO, COS o melanoma de Bowes y adenovirus. La selección de un anfitrión apropiado está dentro de las capacidades de aquellos expertos en la técnica.
Se puede introducir el vector en células anfitrionas utilizando cualquiera de una variedad de técnicas, que incluyen transformación, transfección, transducción, infección viral, pistolas de genes o transferencia de genes mediada por Ti. Métodos particulares incluyen transfección con fosfato de calcio, transfección mediada por DEAE-dextrano, lipofección, o electroporación (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology, (1986)).
Cuando sea apropiado, las células anfitrionas manipuladas por ingeniería se pueden cultivar en medios nutrientes convencionales modificados según sea apropiado para activar promotores, seleccionar transformantes o amplificar los genes de la invención. Luego de transformación de una cepa anfitriona adecuada y el crecimiento de la cepa anfitriona hasta una densidad celular apropiada, se puede inducir el promotor seleccionado por medios apropiados (por ejemplo, cambio de temperatura o inducción química) y las células se pueden cultivar durante un período adicional para que puedan producir el polipéptido o fragmento deseado del mismo.
Las células se recogen normalmente mediante centrifugación, se rompen por medios físicos o químicos, y el extracto crudo resultante se retiene para una purificación adicional. Las células microbianas empleadas para la expresión de proteínas se pueden romper mediante cualquier método conveniente, que incluyen ciclos de congelacióndescongelación, sonicación, rotura mecánica o uso de agentes de lisis celular. Dichos métodos son bien conocidos por aquellos expertos en la técnica. El polipéptido o fragmento expresado del mismo se pueden recuperar y purificar a partir de cultivos de células recombinantes por métodos que incluyen precipitación de sulfato de amonio o etanol, extracción con ácido, cromatografía de intercambio aniónico o catiónico, cromatografía de fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía de hidroxilapatita y cromatografía de lectina. Se pueden utilizar etapas de replegamiento de proteína, según sea necesario, para completar la configuración del polipéptido. Si se desea, la cromatografía líquida de alta resolución (HPLC) se puede emplear para las etapas finales de purificación.
También se pueden emplear diversos sistemas de cultivo de células de mamífero para expresar la proteína recombinante. Ejemplos de sistemas de expresión de mamíferos incluyen las estirpes COS-7 de fibroblastos de riñón de mono (descritas por Gluzman, Cell, 23: 175, 1981), y otras estirpes celulares capaces de expresar proteínas a partir de un vector compatible, tales como estirpes celulares C127, 3T3, CHO, HeLa y BHK.
Se pueden utilizar construcciones en células anfitrionas de una manera convencional para producir el producto génico codificado por la secuencia recombinante. Dependiendo del anfitrión empleado en un procedimiento de producción recombinante, los polipéptidos producidos por las células anfitrionas que contienen el vector pueden estar glicosilados o pueden estar no glicosilados. Los polipéptidos de la invención también pueden o no incluir un residuo inicial del aminoácido metionina.
Alternativamente, los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de las mismas se pueden producir sintéticamente mediante sintetizadores de péptidos convencionales. En otras realizaciones, se pueden emplear fragmentos o porciones de polipéptidos para producir el correspondiente polipéptido de longitud completa mediante síntesis de péptidos; por lo tanto, se pueden emplear fragmentos como intermedios para producir los polipéptidos de longitud completa.
También se pueden emplear sistemas de traducción libres de células para producir uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y las secuencias sustancialmente idénticas de las mismas, o fragmentos que comprenden al menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 o 150 aminoácidos consecutivos de las mismas utilizando mARN transcrito de una construcción de ADN que comprende un promotor ligado operativamente a un ácido nucleico que codifica el polipéptido o fragmento del mismo. En algunas realizaciones, la construcción de ADN puede ser linealizada antes de conducir una reacción de transcripción in vitro. El mARN transcrito luego se incuba con un extracto de traducción libre de células adecuado, tal como un extracto de reticulocitos de conejo, para producir el polipéptido o fragmento deseado del mismo.
imagen21
La invención también se relaciona con variantes de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente activos de las mismas. El término "variante" incluye derivados o análogos de estos polipéptidos. En particular, las variantes pueden diferir en la secuencia de aminoácidos de los polipéptidos de las secuencias de aminoácidos del Grupo B, y las secuencias
5 sustancialmente idénticas de las mismas, por una o más sustituciones, adiciones, supresiones, fusiones y truncamientos, que pueden estar presentes en cualquier combinación.
Las variantes pueden ser de origen natural o creadas in vitro. En particular, se pueden crear dichas variantes utilizando técnicas de ingeniería genética tales como mutagénesis dirigida a sitio, mutagénesis química aleatoria, procedimientos de supresión con exonucleasa III, y técnicas de clonación estándar. Alternativamente, dichas
10 variantes, fragmentos, análogos, o derivados se pueden crear utilizando procedimientos de síntesis química o de modificación.
Otros métodos de fabricación de variantes también son familiares para aquellos expertos en la técnica. Estos incluyen procedimientos en los que las secuencias de ácidos nucleicos obtenidss a partir de aislados naturales se modifican para generar ácidos nucleicos que codifican polipéptidos que tienen características que mejoran su valor
15 en aplicaciones industriales o de laboratorio. En dichos procedimientos, un gran número de secuencias variantes que tienen una o más diferencias de nucleótidos con respecto a la secuencia obtenida a partir del aislado natural son generados y caracterizados. Normalmente, estas diferencias de nucleótidos dan como resultado cambios de aminoácidos con respecto a los polipéptidos codificados por los ácidos nucleicos de los aislados naturales.
Por ejemplo, se pueden crear las variantes utilizando PCR propensa a error. En la PCR propensa a error, la PCR se
20 realiza bajo condiciones donde es baja la fidelidad de copia del ADN polimerasa, de tal manera que se obtiene una alta tasa de mutaciones de punto a lo largo de toda la longitud del producto de PCR. La PCR propensa a error se describe en Leung, DW, et al, Technique, 1 :11-15, 1989) and Caldwell, R. C. & Joyce G.F., PCR Methods Applic, 2:28-33, 1992. En pocas palabras, en dichos procedimientos, los ácidos nucleicos que se van a mutagenizar se mezclan con cebadores de PCR, regulador de reacción, MgCl2, MnCl2, polimerasa Taq y una concentración
25 apropiada de dNTPs para lograr una alta tasa de mutación puntual a lo largo de toda la longitud del producto de PCR. Por ejemplo, la reacción se puede llevar a cabo utilizando 20 fmoles de ácido nucleico que se ha mutagenizado, 30pmole de cada cebador de PCR, un regulador de reacción que comprende KCl 50 mM, Tris HCl 10 mM (pH 8.3) y 0.01% de gelatina, MgCl2 7 mM, MnCl2 0.5 mM, 5 unidades de polimerasa Taq, dGTP 0.2 mM, dATP 0-2 mM, dCTP 1 mM, y dTTP 1 mM. Se puede realizar PCR durante 30 ciclos de 94°C durante 1 min, 45°C durante
30 1 min, y 72°C durante 1 min. Sin embargo, se apreciará que estos parámetros se pueden variar según sea apropiado. Los ácidos nucleicos mutagenizados se clonan en un vector apropiado y la actividad de los polipéptidos codificados por los se evalúa ácidos nucleicos mutagenizados.
También se pueden crear variantes utilizando mutagénesis dirigida por oligonucleótidos para generar mutaciones específicas del sitio en cualquier ADN clonado de interés. La mutagénesis dirigida a oligonucleótidos se describe en
35 Reidhaar-Olson, J.F. & Sauer, R.T., et al., Science, 241:53-57, 1988. En pocas palabras, en dichos procedimientos se sintetiza una pluralidad de oligonucleótidos de cadena doble que llevan una o más mutaciones que se van a introducir en el ADN clonado y se inserta en el ADN clonado para ser mutagenizada. Los clones que contienen el ADN mutado se recuperan y se evalúan las actividades de los polipéptidos que los codifican.
Otro método para la generación de variantes es PCR de ensamble. El PCR de ensamble implica el ensamble de un
40 producto de PCR a partir de una mezcla de pequeños fragmentos de ADN. Un gran número de diferentes reacciones de PCR se producen en paralelo en el mismo frasco, con los productos de una reacción que ceba los productos de otra reacción. El PCR de ensamble se describe en la Patente Estadounidense No. 5,965,408, presentada el 9 de julio de 1996, titulada "Método de Reensamblaje de ADN mediante Interrupción de Síntesis".
Aún otro método de generación de variantes es mutagénesis de PCR sexual. En la mutagénesis de PCR sexual, se
45 produce recombinación homóloga forzada entre moléculas de ADN de diferentes pero muy relacionadas secuencias de ADN in vitro, como resultado de la fragmentación aleatoria de la molécula de ADN con base en la homología de secuencia, seguido de fijación del filtro de cruce mediante extensión de cebador en una reacción de PCR. La mutagénesis de PCR sexual se describe en Stemmer, WP, PNAS, EE.UU., 91: 10747 a 10751, 1994. En resumen, en este tipo de procedimientos de una pluralidad de ácidos nucleicos que se van a recombinar se digiere con DNasa
50 para generar fragmentos que tienen un tamaño promedio de 50 a 200 nucleótidos. Los fragmentos del tamaño promedio deseado se purifican y se resuspenden en una mezcla de PCR. Se realiza bajo condiciones que facilitan recombinación entre los fragmentos de ácido nucleico. Por ejemplo, se puede realizar PCR al resuspender los fragmentos purificados a una concentración de 10-30 ng/: 1 en una solución de 0.2 mM de cada dNTP, MgC12 2.2 mM, KCl 50 mM, Tris HCl10 mM, pH 9.0, y 0,1% de Triton X-100. Se agregan 2.5 unidades de polimerasa Taq por
55 100: 1 de mezcla de reacción y se realiza PCR utilizando el siguiente régimen: 94°C durante 60 segundos, 94°C durante 30 segundos, 50 a 55°C durante 30 segundos, 72°C durante 30 segundos (30-45 veces) y 72°C durante 5 minutos. Sin embargo, se apreciará que estos parámetros se pueden variar según sea apropiado. En algunas realizaciones, los oligonucleótidos pueden estar incluidos en las reacciones de PCR. En otras realizaciones, se puede utilizar el fragmento de Klenow de la ADN polimerasa I en un primer grupo de reacciones de PCR y se puede
60 utilizar polimerasa Taq en un grupo posterior de reacciones de PCR. Se aíslan las secuencias recombinantes y se evalúan las actividades de los polipéptidos que se van a codificar.
imagen22
También se pueden crear variantes mediante mutagénesis in vivo. En algunas realizaciones, las mutaciones aleatorias en una secuencia de interés se generan mediante la propagación de la secuencia de interés en una cepa bacteriana, tal como una cepa de E. coli, que lleva mutaciones en una o más de las rutas de reparación del ADN. Dichas cepas “mutantes" tienen una mayor tasa de mutación al azar que aquellas de un progenitor silvestre.
5 Propagar el ADN en una de estas cepas generará con el tiempo mutaciones aleatorias dentro del ADN. Las cepas mutantes adecuadas para uso en mutagénesis in vivo se describen en la Publicación PCT No. WO 91/16427, publicada el 31 de octubre de 1991, titulada "Métodos para Creación de Fenotipo de Múltiples Poblaciones de Genes".
También se pueden generar variantes utilizando mutagénesis de casete. En la mutagénesis de casete una pequeña
10 región de una molécula de ADN de cadena doble se sustituye con un "casete" de oligonucleótido sintético que difiere de la secuencia nativa. El oligonucleótido contiene a menudo secuencia nativa completamente y/o parcialmente aleatoria.
También se puede utilizar mutagénesis de ensamble recursiva para generar variantes. La mutagénesis de ensamble recursiva es un algoritmo para la ingeniería de proteínas (mutagénesis de proteínas) desarrollado para producir
15 diversas poblaciones de mutantes fenotípicamente relacionados cuyos miembros difieren en secuencia de aminoácidos. Este método utiliza un mecanismo de retroalimentación para controlar rondas sucesivas de mutagénesis de casete combinatoria. La mutagénesis de ensamble recursiva se describe en Arkin, A.P. and Youvan, D.C, PNAS, USA, 89:7811-7815, 1992.
En algunas realizaciones, las variantes se crean utilizando mutagénesis de ensamble establecencial. La
20 mutagénesis de ensamble establecencial es un proceso para generar colecciones combinatorias con un alto porcentaje de mutantes únicos y funcionales, en el que pequeños grupos de residuos se seleccionan al azar en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. La mutagénesis de ensamble establecencial se describe en Delegrave, S. and Youvan, D.C, Biotechnology Research, 11 :1548-1552, 1993. La mutagénesis aleatoria y dirigida a sitio se describe en Arnold, F.H., Cunent Opinión in
25 Biotechnology, 4:450-455, 1993.
En algunas realizaciones, se crean variantes utilizando procedimientos de transposición, en el que porciones de una pluralidad de ácidos nucleicos que codifican diferentes polipéptidos se fusionan juntos para crear secuencias de ácidos nucleicos quiméricas que codifican polipéptidos quiméricos como se describe en la Patente Estadounidense No. 5,965,408, presentada el 09 de julio de 1996, titulada "Método de Reensamblaje de ADN mediante Interrupción
30 de Síntesis", y la Patente Estadounidense No. 5,939,250, presentada el 22 de mayo de 1996, titulada "Producción de enzimas que tiene Actividades Deseadas mediante Mutagénesis".
Las variantes de los polipéptidos de las secuencias de aminoácidos del Grupo B pueden ser variantes en las que se reemplazan uno o más de los residuos de aminoácidos de los polipéptidos de las secuencias de aminoácidos del Grupo B con un residuo de aminoácido conservado o no conservado (preferiblemente un residuo de aminoácido
35 conservado) y dicho residuo de aminoácido sustituido puede o no ser uno codificado por el código genético.
Las sustituciones conservadoras son aquellas que sustituyen un aminoácido dado en un polipéptido por otro aminoácido de características similares. Normalmente se ven como sustituciones conservadoras las siguientes sustituciones: sustituciones de un aminoácido alifático tal como Alanina, Valina, Leucina e Isoleucina con otro aminoácido alifático; sustitución de una Serina con una Treonina o viceversa; sustitución de un residuo ácido tal
40 como ácido Aspártico y ácido Glutámico por otro residuo de ácido; sustitución de un residuo que lleva un grupo amida, tal como Asparagina y Glutamina, con otro residuo que lleva un grupo amida; intercambio de un residuo básico tal como Lisina y Arginina con otro residuo básico; y sustitución de un residuo aromático tal como Fenilalanina, Tirosina con otro residuo aromático.
Otras variantes son aquellas en las que uno o más de los residuos de aminoácidos de los polipéptidos de las 45 secuencias de aminoácidos del Grupo B incluyen un grupo sustituyente.
Todavía otras variantes son aquellas en las que el polipéptido se asocia con otro compuesto, tal como un compuesto para aumentar la vida media del polipéptido (por ejemplo, polietilenglicol).
Variantes adicionales son aquellas en las que los aminoácidos adicionales se fusionan con el polipéptido, tal como una secuencia líder, una secuencia secretora, una secuencia de proproteína o una secuencia que facilita la
50 purificación, enriquecimiento, o estabilización del polipéptido.
En algunas realizaciones, los fragmentos, derivados y análogos conservan la misma función o actividad biológica que los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. En otras realizaciones, el fragmento, derivado o análogo incluye una proproteína, de tal manera que el fragmento, derivado o análogo se puede activar por división de la porción de proproteína para producir un
55 polipéptido activo.
Otro aspecto de la invención es polipéptidos o fragmentos de los mismos que tienen por lo menos aproximadamente por lo menos aproximadamente 98%, o más de aproximadamente 98% de homología con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o un fragmento enzimáticamente activo de las mismas. Se puede determinar la homología utilizando cualquiera de los programas descritos anteriormente que alinea los polipéptidos o fragmentos que se comparan y determina el grado de identidad
imagen23
o similitud de aminoácido entre ellos. Se apreciará que la "homología" de aminoácido incluye sustituciones de 5 aminoácidos conservadoras, tales como aquellas descritas anteriormente.
Los polipéptidos o fragmentos que tienen homología con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o un fragmento enzimáticamente activo de las mismas se pueden obtener al aislar los ácidos nucleicos que las codifican utilizando las técnicas descritas anteriormente.
10 Alternativamente, se pueden obtener polipéptidos homólogos o fragmentos a través de procedimientos de enriquecimiento o purificación bioquímica. La secuencia de polipéptidos potencialmente homólogos o fragmentos se puede determinar por digestión proteolítica, electroforesis en gel y/o microsecuenciación. La secuencia del polipéptido homólogo prospectivo o fragmento se puede comparar con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o un fragmento enzimáticamente
15 activo de las mismas utilizando cualquiera de los programas descritos anteriormente.
Otro aspecto de la divulgación es un ensayo para identificar fragmentos o variantes de secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, que retienen la función enzimática de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. Por ejemplo, se pueden utilizar los fragmentos o variantes de dichos polipéptidos, para catalizar reacciones
20 bioquímicas, que indican que el fragmento o variante conserva la actividad enzimática de los polipéptidos en las secuencias de aminoácidos del Grupo B.
El ensayo para determinar si los fragmentos de variantes conservan la actividad enzimática de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas incluye las etapas de: poner en contacto el fragmento o variante de polipéptido con una molécula de sustrato bajo condiciones 25 que permiten que el fragmento de polipéptido o variante funcione, y detecte ya sea una disminución del nivel de sustrato o un aumento en el nivel del producto de reacción específico de la reacción entre el polipéptido y el sustrato.
Los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas o fragmentos enzimáticamente activos de las mismas se pueden utilizar en una variedad de aplicaciones. Por ejemplo, los polipéptidos o fragmentos de los mismos se pueden utilizar para catalizar reacciones bioquímicas. 30 De acuerdo con un aspecto de la invención, se proporciona un proceso para utilizar polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas o polinucleótidos que codifican dichos polipéptidos para hidrolizar enlaces glicosídicos. En dichos procedimientos, una sustancia que contiene un enlace glicosídico (por ejemplo, un almidón) se pone en contacto con uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, o secuencias sustancialmente idénticas de las mismas en condiciones que facilitan la
35 hidrólisis del enlace glicosídico.
Los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas o fragmentos enzimáticamente activos de las mismas, también se pueden utilizar en la licuefacción y sacarificación del almidón. Utilizando los polipéptidos o fragmentos enzimáticamente activo de las mismas de esta invención, se puede llevar a cabo la licuefacción a un pH menor que con las enzimas anteriores. En una realización,
40 la licuefacción se realiza a un pH de 4.5. Adicionalmente, los polipéptidos o fragmentos de los mismos de esta invención son menos dependientes de calcio que las enzimas utilizadas anteriormente en estos procesos. En la licuefacción se utilizan amilasas para hidrolizar el almidón. En una realización preferida, los polipéptidos o fragmentos de los mismos de esta invención son termoestables a 90-95°C.
También se pueden utilizar polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias
45 sustancialmente idénticas de las mismas o fragmentos enzimáticamente activos de las mismas, para generar anticuerpos que se unen específicamente a los polipéptidos o fragmentos. Los anticuerpos resultantes se pueden utilizar en procedimientos de cromatografía de inmunoafinidad para aislar o purificar el polipéptido o para determinar si el polipéptido está presente en una muestra biológica. En dichos procedimientos, una preparación de proteína, tal como un extracto, o una muestra biológica se pone en contacto con un anticuerpo capaz de unirse específicamente
50 a uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente la idéntica de las mismas, o fragmentos enzimáticamente activos de las mismas.
En los procedimientos de inmunoafinidad, el anticuerpo se adhiere a un soporte sólido, tal como una perla u otra matriz de columna. La preparación de proteína se pone en contacto con el anticuerpo bajo condiciones en las que el anticuerpo se une específicamente a uno de los polipéptidos de las secuencias de aminoácidos del Grupo B, y
55 secuencias sustancialmente idénticas de las mismas, o fragmento de la misma. Después de un lavado para eliminar las proteínas unidas no específicamente, se eluyen los polipéptidos unidos específicamente.
La capacidad de las proteínas en una muestra biológica de unirse al anticuerpo se puede determinar utilizando cualquiera de una variedad de procedimientos familiares para aquellos expertos en la técnica. Por ejemplo, la unión se puede determinar al marcar el anticuerpo con un marcador detectable tal como un agente fluorescente, un marcador enzimático, o un radioisótopo. Alternativamente, se puede detectar la unión del anticuerpo a la muestra utilizando un anticuerpo secundario que tiene dicha una etiqueta detectable sobre el mismo. Los ensayos particulares incluyen ensayos de ELISA, ensayos tipo sándwich, radioinmunoensayos, y transferencias Western.
imagen24
5 Los anticuerpos policlonales generados contra los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente activos de las mismas se pueden obtener mediante inyección directa de los polipéptidos en un animal o al administrar los polipéptidos a un animal, por ejemplo, un no humano. El anticuerpo obtenido de esa manera luego se unirá al polipéptido en sí mismo. De esta manera, se puede utilizar incluso una secuencia que codifica solo un fragmento del polipéptido para generar
10 anticuerpos que pueden unirse a todo el polipéptido nativo. Dichos anticuerpos se pueden utilizar luego para aislar el polipéptido a partir de células que expresan ese polipéptido.
Para la preparación de anticuerpos monoclonales, se puede utilizar cualquier técnica que proporcione anticuerpos producidos por cultivos continuos de estirpes celulares. Ejemplos incluyen técnica del hibridoma (Kohler and Milstein, Nature, 256: 495-497, 1975), la técnica de trioma, la técnica de hibridoma de células B humanas (Kozbor et al.,
15 Immunology Today 4:72, 1983), y la técnica de hibridoma de EBV (Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., pp. 77-96.).
Las técnicas descritas para la producción de anticuerpos de cadena sencilla (Patente estadounidense No. 4,946,778) se pueden adaptar para producir anticuerpos de cadena sencilla a los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente
20 activos de las mismas. Alternativamente, se pueden utilizar ratones transgénicos para expresar anticuerpos humanizados a estos polipéptidos o fragmentos de los mismos.
Los anticuerpos generados contra los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos enzimáticamente activos de las mismas se pueden utilizar en el cribado de polipéptidos similares de otros organismos y muestras. En dichas técnicas, los polipéptidos del
25 organismo se ponen en contacto con el anticuerpo y se detectan aquellos polipéptidos que se unen específicamente al anticuerpo. Se puede utilizar cualquiera de los procedimientos descritos anteriormente para detectar la unión de anticuerpos. Uno de dichos ensayos de cribado se describe en "Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, pp. 87-116.
Como se utiliza aquí, el término "secuencia de ácidos nucleicos como se establece en las SEQ ID No.:” abarca las
30 secuencias de nucleótidos de las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, así como secuencias homólogas a secuencias de ácidos nucleicos del Grupo A y fragmentos de las mismas y secuencias complementarias a todas las secuencias anteriores. Los fragmentos incluyen porciones de SEQ ID No .: que comprenden al menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 o 500 nucleótidos consecutivos de secuencias de ácido nucleico del Grupo A , y secuencias sustancialmente
35 idénticas a las mismas. Las secuencias homólogas y fragmentos de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, se refieren a una secuencia que tiene por lo menos 99%, 98%, 97%, 96%, 95%, 90% de homología con estas secuencias. Se puede determinar la homología utilizando cualquiera de los programas de ordenador y parámetros descritos aquí, que incluyen FASTA versión 3.0t78 con los parámetros predeterminados. Las secuencias homólogas también incluyen secuencias de ARN en la que las uridinas
40 reemplazan las timinas en las secuencias de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A. Se pueden obtener secuencias homólogas utilizando cualquiera de los procedimientos descritos aquí o puede resultar de la corrección de un error de secuenciación. Se apreciará que las secuencias de ácidos nucleicos como se establecen en las secuencias de ácidos nucleicos del Grupo A y secuencias sustancialmente idénticas de las mismas, se pueden representar en el formato tradicional de carácter individual
45 (Véase la contraportada interior de r, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York.) o en cualquier otro formato que registra la identidad de los nucleótidos en una secuencia.
Como se utiliza aquí, el término "una secuencia de polipéptidos como se establece en la SEQ ID No:” abarca la secuencia de polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, que se codifican por una secuencia como se establece en las SEQ ID No:, secuencias de 50 polipéptidos homólogas a los polipéptidos de las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o fragmentos de cualquiera de las secuencias precedentes. Las secuencias de polipéptidos homóloga se refieren a una secuencia de polipéptidos que tiene por lo menos 99%, 98%, de homología con una de las secuencias de polipéptidos de las secuencias de aminoácidos del Grupo B. Se puede determinar la homología utilizando cualquiera de los programas de ordenador y parámetros descritos aquí, que 55 incluyen FASTA versión 3.0t78 con los parámetros predeterminados o con cualesquier parámetros modificados. Se pueden obtener secuencias homólogas utilizando cualquiera de los procedimientos descritos aquí o pueden resultar de la corrección de un error de secuenciación. Se apreciará que los códigos de polipéptido como se establecen en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, se pueden representar en el formato de un único carácter tradicional o de tres letras (Véase la contraportada interna de formato
60 Stryer, Lubert. Biochemistry, 3rd Ed., W. H Freeman & Co., New York.) o en cualquier otro formato que se relaciona con la identidad de los polipéptidos en una secuencia.
imagen25
Se apreciará por aquellos expertos en la técnica que una secuencia de ácidos nucleicos como se establece en la SEQ ID No: y una secuencia de polipéptidos como se establece en la SEQ ID No: se pueden almacenar, registrar, y manipular en cualquier medio que puede ser leído y se accede por un ordenador. Como se utiliza aquí, las palabras "registrado" y "almacenado" se refieren a un procedimiento para almacenar información en un medio informático. Un
5 experto puede adoptar fácilmente cualquiera de los métodos conocidos actualmente para grabar información en un medio legible por ordenador para generar manufacturas que comprenden una o más de las secuencias de ácidos nucleicos como se establecen en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, una o más de las secuencias de polipéptidos como se establecen en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. Otro aspecto de la divulgación es un medio legible por ordenador que tiene grabado en el mismo por lo menos 2, 5, 10, 15, o 20 secuencias de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas.
Otro aspecto de la divulgación es un medio legible por ordenador que tiene grabado en el mismo una o más de las secuencias de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias
15 sustancialmente idénticas de las mismas. Otro aspecto de la divulgación es un medio legible por ordenador que tiene grabado en el mismo una o más de las secuencias de polipéptido como se establecen en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. Otro aspecto de la divulgación es un medio legible por ordenador que tiene grabado en el mismo, por lo menos, 2, 5, 10, 15 o 20 de las secuencias como se establecen anteriormente.
Los medios legibles por ordenador incluyen medios legibles magnéticamente, medios legibles ópticamente, medios legibles electrónicamente y medios magnéticos/ópticos. Por ejemplo, los medios legibles por ordenador pueden ser un disco duro, un disquete, una cinta magnética, CD-ROM, Disco Versátil Digital (DVD), Memoria de Acceso Aleatorio (RAM), o Memoria de Sólo Lectura (ROM), así como otros tipos de otros medios conocidos por aquellos expertos en la técnica.
25 Las realizaciones de la divulgación incluyen sistemas (sistemas, por ejemplo, con base en internet), en particular sistemas de ordenador que almacenan y manipulan la información de la secuencia descrita aquí. Un ejemplo de un sistema 100 de ordenador se ilustra en forma de diagrama de bloques en la Figura 1. Como se utiliza aquí, "un sistema de ordenador" se refiere a los componentes de hardware, componentes de software y componentes de almacenamiento de datos utilizados para analizar una secuencia de nucleótidos de una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B. El sistema 100 de ordenador normalmente incluye un procesador para procesar, acceder y manipular los datos de la secuencia. El procesador 105 puede ser cualquier tipo bien conocido de unidad de procesamiento central, tal como, por ejemplo, el Pentium III de Intel Corporation, o un procesador similar de Sun, Motorola,
35 Compaq, AMD o International Business Machines.
Normalmente, el sistema 100 de ordenador es un sistema de propósito general que comprende el procesador 105 y uno o más componentes 110 internos de almacenamiento de datos para almacenar datos, y uno o más dispositivos de recuperación de datos para recuperar los datos almacenados en los componentes de almacenamiento de datos. Un experto puede apreciar fácilmente que cualquiera de los sistemas de ordenador disponibles en la actualidad es adecuado.
En una realización particular, el sistema 100 de ordenador incluye un procesador 105 conectado a un bus que está conectado a una memoria 115 principal (implementada preferiblemente como RAM) y uno o más dispositivos 110 de almacenamiento de datos internos, como un disco duro y/u otros medios legibles por ordenador que tienen datos registrados al respecto. En algunas realizaciones, el sistema 100 de ordenador incluye además uno o más
45 dispositivos 118 de recuperación de datos para la leer los datos almacenados en los dispositivos 110 de almacenamiento de datos internos.
El dispositivo 118 de recuperación de datos puede representar, por ejemplo, una unidad de disquete, una unidad de disco compacto, una unidad de cinta magnética, o un módem capaz de conectarse a un sistema de almacenamiento de datos a distancia (por ejemplo, a través de Internet), etc. En algunas realizaciones, el dispositivo 110 de almacenamiento de datos interno es un medio legible por ordenador extraíble como un disquete, un disco compacto, una cinta magnética, etc. que contiene la lógica de control y/o datos registrados en él. El sistema 100 de ordenador puede incluir ventajosamente o ser programado por software apropiado para leer la lógica de control y/o los datos del componente de almacenamiento de datos una vez insertado en el dispositivo de recuperación de datos.
El sistema 100 de ordenador incluye una pantalla 120 que se utiliza para exhibir la salida a un usuario del ordenador.
55 También hay que señalar que el sistema 100 de ordenador puede estar vinculado a otros sistemas 125a-c de ordenador en una red o red de área amplia para proporcionar acceso centralizado al sistema 100 de ordenador.
El software para el acceso y procesamiento de las secuencias de nucleótidos de una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, (tales como herramientas de búsqueda, herramientas de comparación, y herramientas de modelado, etc.) pueden residir en la memoria 115 principal durante ejecución.
imagen26
En algunas realizaciones, el sistema 100 de ordenador puede comprender además un algoritmo de comparación de secuencias para la comparación de una secuencia de ácidos nucleicos como se establece en las secuencias de 5 ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, almacenadas en un medio legible por ordenador a una secuencia (s) de nucleótidos o polipéptido de referencia almacenado en un medio legible por ordenador. Un "algoritmo de comparación de secuencias" se refiere a uno o más programas que se implementan (local o remotamente) en el sistema 100 de 10 ordenador para comparar una secuencia de nucleótidos con otras secuencias de nucleótidos y/o compuestos almacenados en un medio de almacenamiento de datos. Por ejemplo, el algoritmo de comparación de secuencia puede comparar las secuencias de nucleótidos de una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias 15 sustancialmente idénticas a la misma, almacenadas en un medio legible por ordenador para referencia a secuencias almacenadas en un medio legible por ordenador para identificar homologías o motivos estructurales. Diversos programas de comparación de secuencia identificados en otra parte de esta especificación de patente se contemplan particularmente para uso en este aspecto de la divulgación. Se pueden evaluar las homologías de secuencia de proteínas y/o de ácidos nucleicos utilizando cualquiera de la variedad de algoritmos y programas
20 conocidos en la técnica de comparación de secuencias. Tales algoritmos y programas incluyen, pero no son de ninguna manera se limita a, TBLASTN, BLASTP, FASTA, TFASTA, y CLUSTALW (Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Thompson et al., Nucleic Acids Res. 22(2):4673-4680, 1994; Higgins et al., Methods Enzymol. 266:383-402, 1996; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Altschul et al., Nature Genetics 3:266-272, 1993)
25 La homología o identidad a menudo se mide utilizando un software de análisis de secuencia (por ejemplo, Software de Análisis de Secuencia del Paquete del Genetics Computer Group, Universidad de Wisconsin Centro de Biotecnología, 1710 University Avenue, Madison, WI 53705). Dicho tipo de software coincide con secuencias similares asignando grados de homología a diversas supresiones, sustituciones y otras modificaciones. Los términos "homología" e "identidad" en el contexto de dos o más ácidos nucleicos o secuencias de polipéptidos, se refieren a
30 dos o más secuencias o subsecuencias que son iguales o tienen un porcentaje especificado de residuos de aminoácidos o nucleótidos que son los mismos cuando se comparan y alinean para una correspondencia máxima sobre una ventana de comparación o región designada medida utilizando cualquier número de algoritmos de comparación de secuencia o mediante alineamiento manual e inspección visual.
Para la comparación de secuencias, normalmente una secuencia actúa como secuencia de referencia, con la que se
35 comparan las secuencias de prueba. Cuando se utiliza un algoritmo de comparación de secuencias, se introducen las secuencias de prueba y de referencia en un ordenador, se designan las coordenadas de subsecuencia, si es necesario, y se designan los parámetros del programa de algoritmo de secuencia. Se pueden utilizar los parámetros de programa predeterminados, o se pueden designar parámetros alternativos. El algoritmo de comparación de secuencias luego calcula las identidades de secuencia en porcentaje para las secuencias de prueba con respecto a
40 la secuencia de referencia, con base en los parámetros del programa.
Una "ventana de comparación", como se utiliza aquí, incluye la referencia a un segmento de uno cualquiera del número de posiciones contiguas seleccionadas del grupo que consiste de 20 a 600, por lo general aproximadamente 50 a aproximadamente 200, más usualmente de aproximadamente 100 a aproximadamente 150 en el que una secuencia se puede comparar con una secuencia de referencia del mismo número de posiciones contiguas después 45 de que las dos secuencias se alinean de manera óptima. Los métodos de alineación de secuencia para comparación son bien conocidos en la técnica. El alineamiento óptimo de secuencias para comparación se puede llevar a cabo, por ejemplo, mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, by the homology alignment algorithm of Needleman & Wunsch, J. Mol. Biol 48:443, 1970, por la búsqueda del método de similitud de person & Lipman, Proc. Nat’l. Acad. Sci. USA 85:2444, 1988, mediante implementaciones informáticas 50 de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el paquete de software Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI), o mediante alineamiento manual e inspección visual. Otros algoritmos para determinar la homología o identidad incluyen, por ejemplo, además de un programa BLAST (Herramienta de Búsqueda de Alineamiento Local Básica en el Centro Nacional de Información Biológica), ALIGN, AMAS (Análisis de Secuencia Alineadas Multiplicadas), AMPS (Alineación de Secuencias Múltiples de Proteína), 55 ASSET (Herramienta de Evaluación Estadística de Segmento Alineado), BANDS, BESTSCOR, BIOSCAN (Nodo de Análisis Comparativo de Secuencia Biológica), BLIMPS (Buscador Mejorado de Bloques), FASTA, Intervalos y Puntos, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, algoritmo Smith-Waterman, DARWIN, algoritmo Las Vegas, FNAT (Herramienta de Alineación de Nucleótidos Forzada), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Paquete de Análisis de Secuencia Fristensky), GAP (Programa de 60 Alineamiento Global), GENAL, GIBBS, GenQuest, ISSC (Comparación de Secuencia Sensible), LALIGN (Alineamiento de Secuencia Local), LCP (Programa de Contenido Local), MACAW (Construcción y Análisis Workbench de Alineación Múltiple), MAP (Programa de Alineamiento Múltiple), MBLKP, MBLKN, PMA (Alineamiento de Múltiples Secuencias Inducido por Patrón), SAGA (Alineamiento de Secuencia mediante Algoritmo Genético) y
imagen27
WHAT-IF. Dichos programas de alineación también se pueden utilizar para las bases de datos del genoma de pantalla para identificar secuencias de polinucleótidos que tienen secuencias sustancialmente idénticas. Un número de bases de datos del genoma está disponible, por ejemplo, una porción sustancial del genoma humano está disponible como parte del Proyecto de Secuenciación del Genoma Humano (J. Roach,
5 http://weber.u.Washington.edu/~roach/human_genome_progress 2.html) (Gibbs, 1995). Por lo menos también se ha secuenciado otros veintiún genomas, que incluyen, por ejemplo, M. genitalium (Fraser et al., 1995), M. jannaschii (Bult et al., 1996), H. influenzae (Fleischmann et al., 1995), E. coli (Blattner et al., 1997), y la levadura (S. cerevisiae) (Mewes et al., 1997), y D. melanogaster (Adams et al., 2000). También se ha hecho un progreso significativo en la secuenciación de los genomas de organismos modelo, tal como ratón, C elegans, y Arabidopsis sp. Diversas bases de datos que contienen información genómica anotadas con alguna información funcional se mantienen por diferentes organizaciones, y son accesibles a través de Internet, por ejemplo, http://wwwtigr.org/tdb; http://www.genetics.wisc.edu; http://genome-www.stanford.edu/~ball; http://hiv-web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk; http://Pasteur.fr/other/biology; y http://www.genome.wi.mit.edu.
Un ejemplo de un algoritmo útil son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul et al., Nuc.
15 Acids Res. 25: 3.389 a 3402, 1977, y Altschul et al, J. Mol. Biol. 215: 403-410, 1990, respectivamente. El software para realizar análisis BLAST está disponible públicamente a través del Centro Nacional de Información Biotecnológica (http: // www.ncbi.nlm.nih.gov/). Este algoritmo implica primero identificar pares de secuencias de alta puntuación (HSP) al identificar palabras cortas de longitud W en la secuencia de consulta, que coinciden o satisfacen alguna puntuación umbral T de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se refiere como el umbral de puntuación de palabra vecina (Altschul et al., Supra). Estos aciertos de palabra vecina iniciales actúan como semillas para iniciar búsquedas para encontrar HSP más largos que las contienen. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia por lo que se puede aumentar la puntuación de alineamiento acumulativa. Las puntuaciones acumulativas se calculan utilizando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de
25 residuos que coinciden; siempre> 0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabras en cada dirección se detiene cuando: la puntuación de alineamiento acumulativa disminuye en la cantidad X desde su valor máximo alcanzado; la puntuación acumulativa llega a cero o menos, debido a la acumulación de uno o más alineaciones de residuos de puntuación negativa; o se alcanza el final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas cadenas. Para secuencias de aminoácidos, el programa BLASTP utiliza por defecto una longitud de palabra de 3, y expectativas (E) de 10, y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989) alineamientos (B) de 50, expectativa (E) de 10, M = 5, N = -4 y una comparación de
35 ambas cadenas.
El algoritmo BLAST también realiza un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993). Una medida de similitud proporcionada por el algoritmo BLAST es la suma de probabilidad más pequeña (P (N)), que proporciona una indicación de la probabilidad por la cual una coincidencia entre dos secuencias de nucleótidos o aminoácidos se produciría por casualidad. Por ejemplo, un ácido nucleico se considera similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba con el ácido nucleico de referencia es menor de aproximadamente 0.2, más preferiblemente menos de aproximadamente 0.01, y aún más preferiblemente menos de aproximadamente
0.001.
En una realización, se evalúan homologías de secuencias de proteína y ácidos nucleicos utilizando la herramienta
45 Búsqueda de Alineamiento Local Básico ("BLAST") En particular, se utilizan cinco programas BLAST específicos para realizar la siguiente tarea:
(1)
BLASTP y BLAST3 comparan una secuencia de consulta de aminoácidos contra una base de datos de secuencias de proteínas;
(2)
BLASTN compara una secuencia de nucleótidos de consulta contra una base de datos secuencia de nucleótidos;
(3)
BLASTX compara los seis marcos de productos de traducción conceptual de una secuencia de nucleótidos de consulta (ambas cadenas) contra una base de datos de secuencias de proteínas;
(4)
TBLASTN compara una secuencia de proteína de consulta contra una base de datos secuencia de nucleótidos traducida en los seis marcos de lectura (ambas cadenas); y
(5) TBLASTX compara las traducciones de seis marcos de una secuencia de consulta de nucleótidos contra las 55 traducciones de seis marcos de una base de datos secuencia de nucleótidos.
Los programas BLAST identifican secuencias homólogas al identificar segmentos similares, que se denominan aquí como "pares de segmentos de alta puntuación," entre una secuencia de amino o ácidos nucleicos consulta y una secuencia de prueba que se obtiene preferiblemente de una base de datos de secuencia de proteínas o ácidos nucleicos. Los pares de segmentos de alta puntuación preferiblemente se identifican (es decir, alinean) por medio de una matriz de puntuación, muchas de las cuales se conocen en la técnica. Preferiblemente, la matriz de puntuación utilizada es la matriz BLOSUM62 (Gonnet et al., Science 256:1443-1445, 1992; Henikoff and Henikoff, Proteins 17:49-61, 1993). Menos preferiblemente, también se pueden utilizar las matrices PAM o PAM250 (véase, por
imagen28
5 ejemplo, Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Los programas BLAST son accesibles a través de la Biblioteca Nacional de Medicina, de los Estados Unidos, por ejemplo en www.ncbi.nlm.nih.gov.
Los parámetros utilizados con los algoritmos anteriores se pueden adaptar dependiendo de la longitud de la secuencia y grado de homología estudiado. En algunas realizaciones, los parámetros pueden ser los parámetros
10 predeterminados utilizados por los algoritmos en la ausencia de instrucciones del usuario.
La Figura 2 es un diagrama de flujo que ilustra una realización de un proceso 200 para comparar una nueva secuencia de nucleótidos o de proteínas con una base de datos de secuencias con el fin de determinar los niveles de homología entre la nueva secuencia y las secuencias en la base de datos. La base de datos de secuencias puede ser una base de datos privada almacenada en el sistema 100 de ordenador, o una base de datos pública tal
15 como GENBANK que está disponible a través de Internet.
El proceso 200 comienza en un estado 201 de inicio y luego se mueve a un estado 202 en el que la nueva secuencia que se va a comparar se almacena en una memoria en un sistema 100 de ordenador. Como se discutió anteriormente, la memoria podría ser cualquier tipo de memoria, incluyendo RAM o un dispositivo de almacenamiento interno.
20 El proceso 200 luego se mueve a un estado 204 en el que una base de datos de secuencias se abre para análisis y comparación. El proceso 200 luego se mueve a un estado 206 en el que la primera secuencia almacenada en la base de datos se lee en una memoria en el ordenador. Luego se realiza entonces una comparación en un estado 210 para determinar si la primera secuencia es la misma que la segunda secuencia. Es importante tener en cuenta que esta etapa no se limita a la realización de una comparación exacta entre la nueva secuencia y la primera
25 secuencia en la base de datos. Métodos bien conocidos son conocidos por aquellos expertos en la técnica para comparación de dos secuencias de nucleótidos o de proteína, incluso si no son idénticas. Por ejemplo, se pueden introducir espacios en una secuencia con el fin de elevar el nivel de homología entre las dos secuencias probadas. Los parámetros que controlan si los espacios u otras características se introducen en una secuencia durante la comparación son normalmente introducidas por el usuario del sistema de ordenador.
30 Una vez que se ha realizado una comparación de las dos secuencias en el estado 210, se realiza una determinación en un estado 210 de decisión si las dos secuencias son iguales. Por supuesto, el término "igual" no se limita a las secuencias que son absolutamente idénticas. Las secuencias que se encuentran dentro de los parámetros de homología introducidos por el usuario serán marcadas como "igual" en el proceso 200.
Si se hace una determinación de que las dos secuencias son las mismas, el proceso 200 se mueve a un estado 214
35 en el que el nombre de la secuencia de la base de datos se exhibe al usuario. Este estado notifica al usuario que la secuencia con el nombre mostrado cumple las limitaciones de homología que se introdujeron. Una vez que el nombre de la secuencia almacenada se muestra al usuario, el proceso 200 se mueve a un estado 218 de decisión en el que se realiza una determinación de si existen más secuencias en la base de datos. Si no existen más secuencias en la base de datos, entonces el proceso 200 termina en un estado 220 final. Sin embargo, si existen
40 más secuencias en la base de datos, entonces el proceso 200 se mueve a un estado 224 en el que un puntero se mueve a la siguiente secuencia en la base de datos de tal manera que se puede comparar con la nueva secuencia. De esta manera, la nueva secuencia se alinea y se compara con cada secuencia en la base de datos.
Se debe que señalar que si se ha hecho una determinación en el estado 212 de decisión de que las secuencias no eran homólogas, entonces el proceso 200 se movería inmediatamente al estado 218 de decisión para determinar si
45 otras secuencias estaban disponibles en la base de datos para la comparación.
De acuerdo con lo anterior, un aspecto de la divulgación es un sistema de ordenador que comprende un procesador, un dispositivo de almacenamiento de datos que tiene almacenado en el mismo una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en secuencias de aminoácidos del Grupo B, y 50 secuencias sustancialmente idénticas de las mismas, un dispositivo de almacenamiento de datos que tiene almacenadas de forma en el mismo las secuencias de nucleótidos de referencia o secuencias de polipéptidos que se van a comparar con una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, y 55 un comparador de secuencia para la realización de la comparación. El comparador secuencia puede indicar un nivel de homología entre las secuencias de comparación o identificar motivos estructurales en el código de ácido nucleico descrito anteriormente de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, o puede identificar motivos estructurales en las secuencias
imagen29
que se comparan con estos códigos de ácido nucleico y los códigos de polipéptidos. En algunas realizaciones, el dispositivo de almacenamiento de datos puede tener almacenadas en el mismo las secuencias de por lo menos 2, 5, 10, 15, 20, 25, 30 o 40 o más de las secuencias de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o las secuencias de polipéptidos
5 como se establecen en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas.
Otro aspecto de la divulgación es un método para determinar el nivel de homología entre una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del 10 Grupo B, y secuencias sustancialmente idénticas de las mismas, y una secuencia de nucleótidos de referencia. El método incluye la lectura del código de ácido nucleico o el código de polipéptido y la secuencia de nucleótidos o polipéptidos de referencia a través del uso de un programa de ordenador que determina los niveles de homología y la determinación de la homología entre el código de ácido nucleico o código de polipéptido y la secuencia de nucleótidos o polipéptidos de referencia con el programa de ordenador. El programa de ordenador puede ser 15 cualquiera de un número de programas de ordenador para determinar los niveles de homología, que incluyen los enumerados específicamente aquí, (por ejemplo, BLAST2N con los parámetros predeterminados o con cualesquiera parámetros modificados). Se puede implementar el método utilizando los sistemas de ordenador descritos anteriormente. El método también se puede realizar mediante la lectura de por lo menos 2, 5, 10, 15, 20, 25, 30 o 40
o más de las secuencias de ácidos nucleicos descritas anteriormente como se establece en las secuencias de
20 ácidos nucleicos del Grupo A, o las secuencias de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B a través del uso del programa de ordenador y la determinación de la homología entre los códigos de ácido nucleico o códigos de polipéptidos y secuencias de nucleótidos o secuencias de polipéptidos de referencia.
La Figura 3 es un diagrama de flujo que ilustra una realización de un proceso 250 en un ordenador para determinar
25 si dos secuencias son homólogas. El proceso 250 comienza en un estado 252 de inicio y luego se mueve a un estado 254 en el que una primera secuencia que se va a comparar se almacena en una memoria. La segunda secuencia que se va a comparar luego se almacena en una memoria en un estado 256. El proceso 250 luego se mueve a un estado 260 en el que se lee el primer carácter de la primera secuencia y luego a un estado 262 en el que se lee el primer carácter de la segunda secuencia. Se debe entender que si la secuencia es una secuencia de
30 nucleótidos, entonces, el carácter será normalmente ya sea A, T, C, G o U. Si la secuencia es una secuencia de proteína, entonces está preferiblemente en el código de aminoácidos de una sola letra de tal manera que se pueden comparar fácilmente la primera y la segunda secuencias.
Luego se realiza la determinación en un estado 264 de decisión si los dos caracteres son los mismos. Si son los mismos, entonces el proceso 250 se mueve a un estado 268 en el que se leen los siguientes caracteres en la
35 primera y segunda secuencias. La determinación se realiza entonces si los siguientes caracteres son los mismos. Si lo son, entonces el proceso 250 continúa este circuito hasta que dos caracteres no son los mismos. Si se realiza una determinación de que los dos caracteres siguientes no son los mismos, el proceso 250 se mueve a un estado 274 de decisión para determinar si existe cualquier carácter ya sea de secuencia para leer.
Si no existen más caracteres para leer, entonces el proceso 250 se mueve a un estado 276 en el que el nivel de
40 homología entre la primera y segunda secuencias se muestran al usuario. El nivel de homología se determina al calcular la proporción de caracteres entre las secuencias que eran las mismas con respecto al número total de secuencias en la primera secuencia. Por lo tanto, si todos los caracteres en una primera secuencia de 100 nucleótidos alineados con cada carácter de una segunda secuencia, el nivel de homología sería del 100%.
Alternativamente, el programa de ordenador puede ser un programa de ordenador que compara las secuencias de
45 nucleótidos de una secuencia de ácidos nucleicos como se establece en la invención, con una o más secuencias de nucleótidos de referencia con el fin de determinar si el código de ácido nucleico de secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, difiere de una secuencia de ácidos nucleicos de referencia en una o más posiciones. Opcionalmente dicho programa registra la longitud e identidad de los nucleótidos insertados, suprimidos o sustituidos con respecto a la secuencia de cualquiera de los polinucleótidos de
50 referencia o una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas. En una realización, el programa de ordenador puede ser un programa que determina si una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, contiene un polimorfismo de nucleótido único (SNP) con respecto a una secuencia de nucleótidos de referencia.
55 De acuerdo con lo anterior, otro aspecto de la divulgación es un método para determinar si una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, difiere en uno o más nucleótidos de una secuencia de nucleótidos de referencia que comprende las etapas de lectura del código de ácido nucleico y la secuencia de nucleótidos de referencia a través del uso de un programa de ordenador que identifica diferencias entre secuencias de ácidos nucleicos y la
60 identificación de diferencias entre el código de ácido nucleico y la secuencia de nucleótidos de referencia con el programa de ordenador. En algunas realizaciones, el programa de ordenador es un programa que identifica polimorfismos de nucleótido único. Se puede implementar el método por los sistemas de ordenador descritos anteriormente y el método ilustrado en la figura 3. También se puede realizar el método mediante la lectura de por lo menos 2, 5, 10, 15, 20, 25, 30, o 40 o más de las secuencias de ácidos nucleicos como se establecen en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, y las
imagen30
5 secuencias de nucleótidos de referencia a través del uso del programa de ordenador y la identificación de diferencias entre los códigos de ácido nucleico y las secuencias de nucleótidos de referencia con el programa de ordenador.
En otras realizaciones, el sistema basado en ordenador puede comprender además un identificador para la identificación de características dentro de una secuencia de ácidos nucleicos como se establece en las secuencias
10 de ácidos nucleicos del Grupo A o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas.
Un "identificador" se refiere a uno o más programas que identifica ciertas características dentro de una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de
15 aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. En una realización, el identificador puede comprender un programa que identifica un marco de lectura abierto en una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas.
La Figura 5 es un diagrama de flujo que ilustra una realización de un proceso 300 de identificador para detectar la
20 presencia de una característica en una secuencia. El proceso 300 comienza en un estado 302 de inicio y luego se mueve a un estado 304 en el que una primera secuencia que se va a comprobar para características se almacena en una memoria 115 en el sistema 100 de ordenador. El proceso 300 luego se mueve a un estado 306 en el que se abre una base de datos de características de secuencia. Dicha base de datos incluiría una lista de atributos de cada característica, junto con el nombre de la característica. Por ejemplo, un nombre de característica podría ser "Codón
25 de Inicio" y el atributo sería "ATG". Otro ejemplo sería el nombre de la característica "Caja TAATAA" y el atributo característico sería "TAATAA". Se produce un ejemplo de dicha base de datos por Genetics Computer Group de la Universidad de Wisconsin (www.gcg.com). Alternativamente, las características pueden ser motivos de polipéptidos estructurales tales como hélices alfa, láminas beta, o motivos de polipéptidos funcionales, tales como sitios activos enzimáticos, motivos de hélice de giro de hélice u otros motivos conocidos por aquellos expertos en la técnica.
30 Una vez que se abre la base de datos de características en el estado 306, el proceso 300 se mueve a un estado 308 en el que se lee la primera característica de la base de datos. Una comparación del atributo de la primera característica con la primera secuencia luego se realiza en un estado 310. Luego se realiza una determinación, en un estado 316 de decisión si el atributo de la característica se encuentra en la primera secuencia. Si se encuentra el atributo, entonces el proceso 300 se mueve a un estado 318 en el que el nombre de la característica encontrada se
35 muestra al usuario.
El proceso 300 luego se mueve a un estado 320 de decisión en el que se realiza una determinación de si existen características de movimiento en la base de datos. Si no existen más características, entonces el proceso 300 termina en un estado 324 final. Sin embargo, si existen más características en la base de datos, entonces el proceso 300 lee la siguiente secuencia característica en un estado 326 y vuelve de nuevo al estado 310 en el que el atributo
40 de la siguiente característica se compara con la primera secuencia.
Se debe notar que, si el atributo característico no se encuentra en la primera secuencia en el estado 316 de decisión, el proceso 300 se mueve directamente al estado de 320 decisión con el fin de determinar si existen más características en la base de datos.
De acuerdo con lo anterior, otro aspecto de la divulgación es un método de identificación de una característica
45 dentro de una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, que comprende la lectura del código(s) de ácido nucleico o código(s) de polipéptido a través del uso de un programa de ordenador que identifica características en el mismo y la identificación de características dentro del código(s) de ácido nucleico con
50 el programa de ordenador. En una realización, el programa de ordenador comprende un programa de ordenador que identifica los marcos de lectura abiertos. Se puede realizar el método mediante la lectura de una sola secuencia o por lo menos 2, 5, 10, 15, 20, 25, 30, o 40 de las secuencias de ácidos nucleicos como se establecen en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o las secuencias de polipéptido como se establece en las secuencias de aminoácidos del Grupo B, y secuencias
55 sustancialmente idénticas de las mismas, a través del uso del programa de ordenador e identificación de características dentro de los códigos de ácido nucleico o códigos de polipéptido con el programa de ordenador.
Una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, se puede
imagen31
almacenar y manipular en una variedad de programas de procesador de datos en una variedad de formatos. Por ejemplo, una secuencia de ácidos nucleicos como se establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas, se puede 5 almacenar como texto en una archivo de procesamiento de textos, tales como MicrosoftWord o WordPerfect o como un archivo ASCII en una variedad de programas de bases de datos familiares para aquellos expertos en la técnica, tales como DB2, SYBASE, o ORACLE. Adicionalmente, se pueden utilizar muchos programas de ordenador y bases de datos como algoritmos de comparación de secuencia, identificadores, o fuentes de secuencias de nucleótidos de referencia o secuencias de polipéptidos que se van a comparar con una secuencia de ácidos nucleicos como se 10 establece en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o una secuencia de polipéptidos como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas. La siguiente lista está destinada a proporcionar orientación a los programas y bases de datos que son útiles con las secuencias de ácidos nucleicos como se establecen en las secuencias de ácidos nucleicos del Grupo A, y secuencias sustancialmente idénticas de las mismas, o las
15 secuencias de polipéptido como se establece en las secuencias de aminoácidos del Grupo B, y secuencias sustancialmente idénticas de las mismas.
Los programas y bases de datos que se pueden utilizar incluyen: MacPattern (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST and BLAST2 (NCBI), BLASTN and BLASTX (Altschul et al, J. Mol. Biol. 215: 20 403, 1990), FASTA (Pearson and Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius2.DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology 25 (Molecular Simulations Inc.), Modeler (Molecular Simulations Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), la base de datos del Directorio de Productos Químicos Disponible MDL, la base de datos del Informe de Datos de Fármacos MDL, labase de datos de Comprehensive Medicinal Chemistry, la base de datos Índice de Fármacos Mundial de Derwent, la
30 base de datos BioByteMasterFile, la base de datos GenBank, y la base de datos Genseqn. Muchos otros programas y bases de datos serán evidentes para un experto en la técnica dada la presente divulgación.
Los motivos que se pueden detectar utilizando los programas anteriores incluyen secuencias que codifican cremalleras de leucina, motivos de hélice de giro de hélice, sitios de glicosilación, sitios de ubiquitinación, hélices alfa y láminas beta, secuencias de señal que codifican péptidos de señal que dirigen la secreción de las proteínas
35 codificadas, secuencias implicadas en regulación de la transcripción tales como homeocajas, estiramientos ácidos, sitios activos enzimáticos, sitios de unión a sustratos y sitios de división enzimática.
La presente invención aprovecha las propiedades catalíticas de enzimas únicas. Considerando que el uso de biocatalizadores (es decir, las enzimas purificadas o crudas, células vivas o no vivas) en las transformaciones químicas normalmente requiere la identificación de un biocatalizador particular que reacciona con un compuesto de
40 partida específico, la presente invención utiliza biocatalizadores y condiciones de reacción seleccionadas que son específicas para grupos funcionales que están presentes en muchos compuestos de partida, tales como moléculas pequeñas. Cada biocatalizador es específico para un grupo funcional, o varios grupos funcionales relacionados, y puede reaccionar con muchos compuestos de partida que contengan este grupo funcional.
Las reacciones biocatalíticas producen una población de derivados de un único compuesto de partida. Estos
45 derivados se pueden someter a otra ronda de reacciones biocatalíticas para producir una segunda población de compuestos derivados. Se pueden producir miles de variaciones de la molécula pequeña original o compuesto con cada iteración de derivatización biocatalítica.
Las enzimas reaccionan en sitios específicos de un compuesto de partida sin afectar al resto de la molécula, un proceso que es muy difícil de lograr utilizando métodos químicos tradicionales. Este alto grado de especificidad 50 biocatalítica proporciona los medios para identificar un único compuesto activo dentro de la colección. La colección se caracteriza por la serie de reacciones biocatalíticas utilizadas para producirla, una denominada "historia biosintética". El cribado de la colección de actividades biológicas y seguimiento de la historia de biosíntesis identifica la secuencia de reacción específica que produce el compuesto activo. La secuencia de reacción se repite y se determina la estructura del compuesto sintetizado. Este modo de identificación, a diferencia de otros métodos de
55 síntesis y cribado, no requiere tecnologías de inmovilización, y se pueden sintetizar los compuestos y probar libres en solución utilizando prácticamente cualquier tipo de ensayo de cribado. Es importante señalar, que el alto grado de especificidad de las reacciones de enzimas sobre grupos funcionales permite el "seguimiento" de las reacciones de enzimas específicas que componen la colección producida biocatalíticamente.
Se realizan muchas de las etapas de procedimiento utilizando la automatización robótica que permite la ejecución de 60 muchos miles de reacciones biocatalíticas y ensayos de cribado por día, así como asegurar un alto nivel de precisión y reproducibilidad. Como resultado, se puede producir una colección de compuestos de derivados en cuestión de semanas que puede tomar años para producir utilizando los métodos químicos actuales.
imagen32
En una realización particular, la divulgación proporciona un método para modificar moléculas pequeñas, que comprende poner en contacto un polipéptido codificado por un polinucleótido descrito aquí o fragmentos 5 enzimáticamente activos de los mismos con una pequeña molécula para producir una molécula pequeña modificado. Una colección de moléculas pequeñas modificadas se prueba para determinar si una molécula pequeña modificada está presente dentro de la colección que exhibe una actividad deseada. Una reacción biocatalítica específica que produce la pequeña molécula modificada de actividad deseada se identifica mediante eliminación sistemática de cada una de las reacciones biocatalíticas utilizadas para producir una porción de la colección, y luego probar las 10 pequeñas moléculas producidas en la parte de la colección para la presencia o ausencia de la pequeña molécula modificada con la actividad deseada. Las reacciones biocatalíticas específicas que producen la pequeña molécula modificada de actividad deseada se repiten opcionalmente. Las reacciones biocatalíticas se conducen con un grupo de biocatalizadores que reaccionan con unidades estructurales distintas encontradas dentro de la estructura de una molécula pequeña, cada biocatalizador es específico para una unidad estructural o un grupo de unidades
15 estructurales relacionadas; y cada biocatalizador reacciona con muchas diferentes moléculas pequeñas que contienen la unidad estructural distinta.
En otra realización, se identificaron amilasas alcalinas novedosas de la divulgación mediante cribado de la actividad a alto pH e identificación de las amilasas con estabilidad en una formulación de lavado de plato automático (ADW). Se realizaron comparaciones con la amilasa derivada de Bacillus lichenformis. Un estudio de la dependencia de
20 hidrólisis sobre pH mostró que la mayoría de las amilasas alcalinas de la divulgación tiene un pH óptimo de 7 o menos, la excepción es clon B con un óptimo de pH de aproximadamente 8. Las amilasas alcalinas de la divulgación retienen actividad en formulaciones ADW, aunque clon B es sensible a altas temperaturas. Preferiblemente, cuando se utiliza en productos ADW, la amilasa alcalina de la divulgación funcionará a un pH 10 a 11 y en 45 a 60°C
La invención se describirá adicionalmente con referencia a los siguientes ejemplos; sin embargo, se debe entender 25 que la invención no se limita a dichos ejemplos.
Ejemplos
Ejemplo 1
Identificación y caracterización de α-amilasas termoestables
El presente ejemplo muestra la identificación de amilasas ácidas novedosas. El programa de cribado se llevó a cabo
30 bajo condiciones de pH neutro y bajo. Las colecciones de ADN generadas a partir de muestras de pH bajo fueron objeto de descubrimiento. Este esfuerzo produjo el descubrimiento de cientos de clones que tienen la capacidad de degradar el almidón. La secuencia de ADN y análisis bioinformático clasifican muchos de estos genes como amilasas no identificadas previamente.
Estudios bioquímicos
35 El análisis bioquímico de los clones genómicos de amilasa mostró que muchos tenían optimo pH inferior a pH 6. Los lisados de estos clones genómicos se probaron para determinar la tolerancia térmica mediante incubación a 70°C, 80°C, 90°C o 100°C durante 10 minutos y medición de la actividad residual a pH 4.5. Esos clones retienen >50% de actividad después del tratamiento térmico a 80°C se eligieron para su posterior análisis. Estos clones se incubaron a 90°C durante 10 minutos a pH 6.0 y 4.5 y se probaron para actividad residual a pH 4.5 (Figura 1). Un número de
40 clones retienen >40% de su actividad después de este tratamiento. A efectos comparativos, la actividad residual de una amilasa evolucionada, clon de c, era equivalente a la mejor de las enzimas de segunda generación; la actividad específica del clon C fue mayor.
La actividad térmica de los clones con actividad residual después del tratamiento con calor a 90°C a pH 4.5 se midió a temperatura ambiente, 70°C y 90°C a pH 4.5. La Tabla 1 muestra que las tasas de hidrólisis de la SEQ ID NO.: 87
45 (amilasa de B. stearothermophilus) y SEQ ID NO. 113 (amilasa de B. licheniformis) se reducen a temperaturas más altas, mientras que la tasa de SEQ ID NO.: 125 continúa aumentando a medida que se eleva la temperatura a 70°C y sólo se reduce alrededor de 50% a 90°C.
Evaluación de candidatos
Con base en la actividad residual a pH 4.5 después de un tratamiento de calor a 90°C, se compara la actividad
50 específica y la tasa de hidrólisis de almidón a 90°C cuando se compara con amilasa de B. licheniformis, SEQ ID NO.:125 con el clon c de amilasa evolucionado en un ensayo de licuefacción de almidón.
Tabla 1. Tasas de hidrólisis del almidón marcada con tinte (unidad/es relativas de fluorescencia) de tres clones genómicos a pH 4.5 y 3 temperaturas diferentes. 1amilasa de B. stearothermophilus, 2amilasa de B. licheniformis
imagen33
Temperatura ambiente
70°C 90°
SEQ ID NO.:871
1.25 1.43 0.33
SEQ ID NO.: 1132
3.3 1.9 0.39
SEQ ID NO.: 125
1.9 47 19
Ejemplo 2
Amilasas termoestables activas a pH alcalino
El método inicial de este ejemplo fue la evaluación de un panel existente de amilasas en una formulación de lavado
5 automático de plato comercial (ADW). Este esfuerzo identificó dos candidatos: uno con actividad a pH alto (SEQ ID NO.:115) y otro con estabilidad en la formulación ADW (SEQ ID NO.:207). Los estudios también incluyen la identificación de las amilasas de pH alto. Este esfuerzo produjo el descubrimiento de cientos de clones que tienen la capacidad de degradar el almidón. La secuencia de ADN y análisis de la bioinformática clasifican muchos de estos genes como amilasas no identificadas previamente. Los marcos de lectura abiertos restantes eran neopullulanasas,
10 amilopullulanasas y amilomaltasas. Los numerosos estudios bioquímicos y aplicaciones mostraron que 3 candidatos: clon B, SEQ ID NO.:147 y SEQ ID NO.:139) tienen una alta actividad específica a pH 10, pero desafortunadamente carecen de estabilidad en la formulación ADW. En resumen, se ha identificado un panel de amilasas novedosas cada uno tiene fenotipos deseables para la aplicación ADW.
Estudios bioquímicos
15 El análisis bioquímico de los clones genómicos de amilasa mostró que muchos de ellos hidrolizan el almidón a pH 10 y 50°C. Para producir cantidades suficientes de enzima para prueba de aplicaciones adicionales y bioquímicas, los marcos de lectura abiertos de amilasa de los 40 clones genómicos más activos se subclonaron en vectores de expresión. Este esfuerzo incluyó la realización de 2 construcciones para aquellos clones que contienen una secuencia señal putativa y el establecimiento de las condiciones de crecimiento e inducción para cada subclon (más
20 y menos el péptido de señal de amilasa).
Se purificó exitosamente proteína activa, soluble para homogeneidad a partir de 34 subclones y se midió actividad específica (unidades/mg, donde 1 unidad = µmol de azúcares reductores/min) a pH 8 y pH 10 (40°C y 50°C) utilizando 2% almidón en regulador. La amilasa de Bacillus licheniformis (SEQ ID NO.:113) fue elegida como el punto de referencia para estos estudios. La actividad específica se determinó al eliminar las muestras en diversos
25 puntos de tiempo durante una reacción de 30 minutos y analizar azúcares reductores. La tasa inicial se determinó al ajustar las curvas de progreso a una ecuación lineal. Una comparación de los principales candidatos se muestra en la Tabla 2.
Un estudio para determinar la dependencia de la velocidad de hidrólisis en pH mostró que sólo el clon B es una "amilasa alcalina" con un pH óptimo de aproximadamente 8; todos los otros tenían pH óptimo de 7 o menos. No
30 obstante, es evidente que el panel de aciertos incluyó diversas amilasas de plomo con actividad apreciable a pH 10 y 50°C.
Tabla 2. Actividades específicas (U/mg de enzima pura) de amilasas
Enzimas
Actividad específica pH 8, 40°C Actividad específica pH 10, 50°C
Clon B
682 20
SEQ ID NO.:139
430 33
SEQ ID NO.:127
250 47
SEQ ID NO.:137
230 3
SEQ ID NO.:113 (B. licheniformis)
228 27
SEQ ID NO.:205
163 4
Resto
<40
Estabilidad
imagen34
La estabilidad en la presencia de la formulación ADW se midió para cada uno de los 3 candidatos principales identificados mediante análisis bioquímicos. El punto de referencia para estos estudios fue una enzima comercial en la matriz de la formulación. La Figura 13 ilustra la actividad residual (medida a pH 8 y 50°C) después de una incubación de 30 minutos a 50°C en presencia de diferentes componentes de la formulación ADW; pH 8, pH 10.8, 5 solución de ADW (con blanqueador) y solución ADW (sin blanqueador). La actividad medida después de la incubación se expresa como un porcentaje de la actividad original. Los datos muestran que el clon B fue muy sensible a alta temperatura, mientras que las otras amilasas fueron menos afectadas. Cuando las enzimas se incubaron a pH alto y temperatura, la enzima comercial SEQ ID NO.: 139 llegó a ser menos estable; sin embargo, la SEQ ID NO.: 127 retiene actividad completa. Se observó comportamiento aparentemente anómalo de la SEQ ID
10 NO.: 127 después de incubación a pH 10 versus pH 8 en ensayos repetidos.
Cuando se mide la actividad de la amilasa sobre el almidón marcado con tinte en la matriz de ADW a 50°C, la amilasa comercial exhibe más o menos 5% de su actividad a pH 8. En el mismo ensayo, el clon B, SEQ ID NO.: 139 y SEQ ID NO.: 127 exhiben <2% de su actividad original medido a pH 8.
Pruebas de lavado
15 Se realizaron pruebas de lavado utilizando portaobjetos recubiertos de almidón para evaluar el rendimiento de cada una de las enzimas purificadas, en comparación con la amilasa comercial. Los portaobjetos recubiertos con almidón de espagueti se prepararon de acuerdo con el protocolo. Dos portaobjetos previamente pesados recubierto de almidón fueron colocados espalda con espalda en un tubo cónico de 50 ml y se agregaron 25 mL de solución de ADW, +/-enzima por tubo. Los tubos se incubaron durante 20 minutos a 50°C con rotación suave en un carrusel
20 vertical. Luego del período de incubación, los portaobjetos se enjuagaron inmediatamente en agua y secaron en horno durante la noche. Todos los ensayos se realizaron por duplicado y la enzima comercial se ejecutó como un control positivo. Los resultados (Figura 6) de estos experimentos se expresan como el % neto de almidón eliminado, por ejemplo, % de almidón eliminado en ADW con enzima, menos el % de almidón eliminado solo en ADW.
Ejemplo 3
25 Optimización de gen
Se pueden mejorar las propiedades de las enzimas mediante diversas estrategias de evolución, que incluyen GeneSiteSaturation-Mutagénesis (GSSM™) y GeneReassembly™ (Diversa Corporation, San Diego, CA). Dichas técnicas se pueden aplicar a los genes de amilasa descubiertos con el fin de generar agrupaciones de variantes que se pueden cribar para mejorar el rendimiento.
30 Las moléculas progenitoras para la evolución serán una o todas de las siguientes: SEQ ID NO.: 113, SEQ ID NO.: 139, SEQ ID NO.: 115 y SEQ ID NO.: 127 (una forma truncada de la SEQ ID NO.: 127).
Se ha desarrollado un cribado de alto rendimiento para evaluar el rendimiento de enzima en presencia de rendimiento de ADW. El desarrollo de un HTS es de suma importancia en cualquier programa de evolución. El HTS se automatiza y ha mostrado resultados consistentes para las amilasas progenitoras (Figura 7). Las amilasas
35 progenitoras tienen actividad medible en la formulación de ADW, sin embargo se reducen altamente con relación a la actividad de pH 8.
Mutantes de la SEQ ID NO:81 generados por GSSM o por mutación aleatoria
GSSM
Host: E. coli, XL1-azul MRF’
Vector: pSE420
Progenitor: SEQ ID NO:81
Los residuos mutados incluyen #2 a 93, #118-159, #389 y #433.
Lista de clones de amilasa activa elevada que se han secuenciado
Nombre Cambio Datos en E. coli
SEQ ID NO:81/4V Y4V, TAT a GTG 2x aumento en actividad SEQ ID NO:81/4A Y4A, TAT a GCG 2x aumento en actividad SEQ ID NO:81/30V T30V, ACC a GTT 2.5x aumento en actividad SEQ ID NO:81/31Q I31Q, ATC a TAG 1.5x aumento en actividad
39 SEQ ID NO:81-4V-30V 4V+30V 3x aumento en actividad SEQ ID NO:81-2C C154A & C155A 1.2x aumento en actividad SEQ ID NO:81-4C C154A, C155A & C389A, C433A 2x aumento en actividad
imagen35
Nota:
Para la SEQ ID NO:81/31Q, el codón TAG debe codificar un codón de parada, pero este codifica Gln en células XL1-blue MRF’ debido a la mutación supE del anfitrión
Mutación aleatoria Se introdujeron mutaciones aleatoriar a la SEQ ID NO: 81 mediante PCR propensa a errores de la siguiente manera:
Uso de dATP, dCTP, dGTP y dTTP no balanceado en la reacción para introducir mutaciones
Uso de diferente concentración de MnCl2 en la reacción para introducir mutaciones
5 • Uso de combinación de los dos métodos anteriores Comprobación de nuevos clones activos:
Cultivar mutantes UP de cribado primario en tubos Falcon de 15 ml e inducir con IPTG 1 mM
Re-ensayo utilizando RBB-almidón como sustrato
Secuenciar el clon para confirmar la mutación.
10 Lista de clones de amilasa activa elevada que se han secuenciado Nombre Datos en matraz de agitación Datos en fermentador SEQ ID NO:81-4C-UM1 4C 1.3-2x aumento en actividad igual que la SEQ ID NO:81-4C SEQ ID NO:81-4C-UM2 4C 2x aumento en actividad igual que la SEQ END NO:81-4C
Ejemplo 4
Caracterización de α-amilasas que tiene actividad a pH alcalino Las amilasas que tienen actividad en pH alcalino se caracteriza adicionalmente. Se han realizado cinéticas de 2% de almidón a un pH 8 y 10 (40°C y 50°C). 15 Tabla 4: Clones, actividades específicas C pH 8, 40°C pH 10,
SEQ ID NO.: 113 (B. lichenoformis) 228 unidades/mg 27 unidades/mg Clon B unidades/mg 682 unidades/mg 31 unidades/mg SEQ ID NO.: 139 unidades/mg 430 unidades/mg 33 unidades/mg SEQ ID NO.: 127 unidades/mg 540 unidades/mg 50 unidades/mg control 0GL5 (E. coli) 1.8 unidades/mg 0 unidades/mg
1 unidad de actividad se define como liberación de 1 µmol de azúcares reductores por minuto.
Ejemplo 5
Ensayo de actividad de amilasa: ensayo de extremos reductores BCA Se determinó la actividad de amilasa de clones de interés utilizando la siguiente metodología.
20 1. Preparar 2 soluciones de sustrato, de la siguiente manera:
a) solución de almidón 2% soluble (papa) pH 8 al disolver 2 g de almidón de papa en 100 ml de fosfato de sodio 100 mM pH 8).
imagen36
b) solución de almidón 2% soluble (papa) pH 10 al disolver 2 g de almidón de papa en 100 ml de carbonato de sodio 100 mM.
Calentar ambas soluciones en un baño de agua en ebullición, mientras se mezcla, durante 30-40 minutos hasta que se disuelva el almidón.
5 2. Preparar la solución A de de 64 mg/ml de monohidrato de carbonato de sodio, 24 mg/ml de bicarbonato de sodio y
1.95 mg/ml de BCA sal de disodio de (4,4'-dicarboxi-2,2'-biquinolina (Sigma Chemical cat #D-8284). Agregada anteriormente a dH2O.
3. Preparar la solución B al combinar 1.24 mg/ml de sulfato de cobre pentahidratado y 1.26 mg/ml de L-serina. Agregue la mezcla a dH2O
10 4. Preparar un reactivo de trabajo de una relación 1:1 de las soluciones A y B. 5.
5. Preparar una solución estándar de Maltosa de 10 mM en dH2O, donde la maltosa 10 mM, se combina en almidón soluble al 2% a pH deseado a una concentración final de 0, 100, 200, 300, 400, 600 µM. La curva estándar se generará para cada grupo de puntos de tiempo. Dado que la curva se determina al se agrega 10 µl de las normas para el reactivo de trabajo funciona a 0, 1, 2, 3, 4. 6 nmol de maltosa.
15 6. Formar alícuotas de 1 ml de solución de sustrato en tubos de microcentrífuga, equilibrar a temperatura deseada (5 min) en bloque de calor o baño de agua caliente. Se agrega 50 ul de solución de enzima en el interior de la tapa del tubo.
7. Mientras que la solución se equilibra mezclar 5 ml de ambas soluciones A y B. Formar alícuota de 100 µl a placa PCR de de 96 pozos. Colocar placa de hielo.
20 8. Después de 5 minutos de equilibrio de temperatura, cerrar la tapa de los tubos, invertir y agitar 3 veces. Inmediatamente formar alícuotas de 10 µl en la placa cuando t = 0 (punto de tiempo cero). Dejar la mezcla de enzimas en el bloque de calor y formar alícuotas de 10 µl en cada punto de tiempo deseado (por ejemplo, 0, 5, 10, 15, 20, 30 minutos).
9. Asegurarse de que se dejan vacíos 12 pozos (el reactivo de trabajo solo se trabaja en alícuotas) para la adición 25 de 10 µl de los estándares, para la curva estándar.
10.
Cuando se recogen todos los puntos de tiempo y se agregan estándares, se cubre la placa y se calienta a 80°C durante 35 min. La placa se enfría sobre hielo durante 10 minutos. Se agrega 100 ul de H2O a todos los pozos. Se mezcla y forma alícuotas de 100 µl en placas de 96 pozos de fondo plano y se lee la absorbancia a 560 nm.
11.
Cero puntos de tiempo de cada muestra en versus su propio t = 0 (sustraer el valor A560 t = 0 promedio de otros
30 valores A560). Convertir el A560 (experimental) a umol (dividir A560 (experimental) por la pendiente de la curva estándar (A560/umol). Generar una pendiente de los puntos de tiempo y el umol (en umol/min), multiplicar por 100 (ya que el valor umol sólo representa el 10 ul utilizado en el ensayo, no la cantidad hecha en el 1 ml de rxn). Conseguir la actividad específica dividir la pendiente (en umol/min) por los mg de proteína. Todos los puntos se deben hacer en un mínimo por duplicado con los tres mejores. Una curva estándar de ejemplo se establece en la
35 Figura 11.
Tabla 5: Datos de muestra:
(pendiente A560exp/std) Clon Dilución Minutos A560-1 A560-2 Avg A 560 Cero A 560 umol
ENZ 50 0 0.1711 0.1736 0.17235 0 0.0000 5 0.2104 0.2165 0.21345 0.0411 0.0005 10 0.2492 0.2481 0.24865 0.0763 0.0009 15 0.2984 0.2882 0.2933 0.12095 0.0014 20 0.3355 0.3409 0.3382 0.16585 0.0020 30 0.3942 0.3805 0.38735 0.215 0.0026 40 0.4501 0.4412 0.44565 0.2733 0.0033
Actividad =0.008646 umol/min Dividir concentración de proteína (mg/ml) por cualquier dilución para conseguir el mg utilizado Dividir la pendiente anterior por el mg utilizado en el ensayo para conseguir actividad específica Actividad específica =24.93 umol/min/mg
imagen37
(Véase, por ejemplo, Dominic W.S. Wong, Sarah B. Batt, and George H. Robertson (2000). Microassay for rapad screening of alpha-amylase activity. J. Agric.Foood Chem. 48,4540-4543 and Jeffrey D. Fox and John F. Robyt, (1991). Minituratization of three carbohydrate analyses using a micro sample plate reader. Anal. Biochem. 195, 93
5 96).
Ejemplo 6
Detección de actividad de α-amilasa Se puede evaluar la actividad de amilasa de clones por una serie de métodos conocidos en la técnica. La siguiente es la metodología general que se utilizó en la presente invención. El número de placas cribadas, por placa, debe ser 10 de aproximadamente 10,000 pfu. Para cada colección de ADN: por lo menos 50,000 placas por colección aislada y
200,000 placas por colección no aislada se deben cribar dependiendo del título pfu para el lisado amplificado λ ZAP Express. Determinación por título de Lambda Colección 1) µL de cepa de colección amplificada Lambda ZAP Express se agregó a 600 µl de células de E. coli MRF'(OD600 =
15 1.0). Para diluir la cepa de MRF', se utiliza MgSO4 10 mM. 2) Se incuba a 37°C durante 15 minutos. 3) Se transfiere la suspensión a 5-6 mL de agar superior NZY a 50°C y se mezcla suavemente. 4) Inmediatamente se vierte solución de agar sobre un medio de placa NZY grande (150 mm). 5) Se permite que el agar superior se solidifique por completo (aproximadamente 30 minutos), y luego se invierte la
20 placa. 6) Se incuba la placa a 39°C durante 8-12 horas. 7) Se aproxima el número de placas. Se determinan título de fago para dar 10,000 pfu/placa. Se diluye una alícuota
del fago de colección con regulador SM si es necesario. Cribado de sustrato
25 1) Lambda Zap Express (50,000 pfu) de la colección amplificada agrego a 600 µL de células E. coli MRF’ (OD600 = 1.0). Para las colecciones no ambientales, se preparan 4 tubos (50.000 pfu por tubo). 2) Se incuba a 37°C durante 15 minutos. 3) Mientras que se incuba la suspensión de fago/células, 1.0 ml de sustrato de almidón rojo (1.2% p/v) se agrega a
6.0 mL de agar superior NZY a 50°C y se mezcla a fondo. Mantener la solución a 50°C hasta que se necesite.
30 4) Se transfiere 1/5 (10,000 pfu) de la suspensión de células a la solución de sustrato/agar superior y se mezcla suavemente. 5) La solución se vierte inmediatamente sobre la placa de medio NZY grande (150 mm). 6) Se permite que el agar superior se solidifique por completo (aproximadamente 30 minutos), y luego se invierte la
placa.
35 7) Se repiten los procedimientos 4-6 4 veces para el resto de la suspensión celular (1/5 de la suspensión cada vez). 8) Se incuba las placas a 39°C durante 8-12 horas. 9) Se observa la placa para zonas de inhibición (halos) alrededor de las placas. 10) Las placas con halos se eliminan de agar y se transfirieren a un microtubo estéril. Una punta de pipeta 200 µL de
calibre grande funciona bien para eliminar (núcleo) del tapón de agar que contiene la placa deseada. 40 11) Los fagos se resuspendieron en 500 µL de regulador de SM. Se agrega 20 µL de cloroformo para inhibir cualquier crecimiento de células adicional.
imagen38
 µL de suspensión de fago resuspendida a las 500 µL de células de E. coli MRF’ (OD600 = 1.0). 5 2) Se incuba a 37°C durante 15 minutos. 3) Mientras que se incuba la suspensión de fago/células, se agrega 1 mL de sustrato de almidón rojo (1.2% p/v) a
6.0 mL de agar superior NZY a 50°C y se mezcla a fondo. Se mantiene la solución a 50°C hasta que se necesite. 4) La suspensión celular se transfiere a la solución de sustrato/agar superior y se mezcla suavemente. 5) Se vierte la solución inmediatamente sobre la placa de medio NZY grande (150 mm).
10 6) Dejar que el agar superior se solidifique por completo (aproximadamente 30 minutos), y luego se invierte la placa. 7) la placa se incuba a 39°C durante 8-12 horas. 8) Se observa la placa para una zona de inhibición (halo) alrededor de a una sola placa (clon puro). Si no se puede
aislar una sola placa, ajustar título y replantear la suspensión de fagos. 9) Se elimina la placa individual con halo de agar y se transfirió a un microtubo estéril. Una punta de pipeta de 200
15 µL de calibre grande trabaja bien para eliminar (núcleo) el tapón de agar que contiene la placa deseada. Para amplificar el título, placas activas de núcleo 5 individuales en un microtubo. 10) Los fagos se resuspendieron en 500 µL de regulador SM. Se agrega 20 µL de cloroformo para inhibir cualquier
crecimiento adicional de las células. 11) Se incuba la suspensión de fago puro a temperatura ambiente durante 4 horas o durante la noche antes de la
20 siguiente etapa. La suspensión de fago puro se almacena a -80°C y se agrega DMSO en la suspensión de fagos (7% v/v). División de clon puro 1) Se agrega 100 µL de suspensión de fago puro a 200 µL de células E. coli MRF’ (OD600 = 1.0); es decir, 1.0 µL de
fago auxiliar ExAssist (> 1 x 106 pfu/ml; Stratagene). Se utiliza tubo Falcon 2059 para la división. 25 2) Se incuba la suspensión a 37°C durante 15 minutos.
3) 3.0 mL de 2 x medio YT se agrega a la suspensión celular. 4) Se incuba a 30°C durante por lo menos 6 horas o durante la noche mientras se agita. 5) Se transfiere a tubo a 70°C durante 20 minutos. La suspensión de fagémido se puede almacenar a 4°C durante 1
a 2 meses.
30 6) Se transfiere 100 µL de suspensión de fagémido a un microtubo que contiene 200 µL de células E. coli Exp 505 (DO600 = 1.0). 7) La suspensión se incuba a 37°C durante 15 minutos. ) 300 µL de SOB se agrega a la suspensión. 9) Se incuba la suspensión a 37°C durante 30 a 45 minutos. 10) 100 µL de suspensión se transfiere a una placa de
medio LB pequeña (90 mm) que contenía kanamicina (medio LB con kanamicina 50 µg/mL) para las colecciones de 35 ADN ZAP Express o ampicilina (medio LB con kanamicina 100 µg/mL) para las colecciones de ADN Zap II. 11) El resto de la suspensión se transfiere a otra placa de medio LB pequeña. 12) Se utiliza perlas de vidrio estériles para distribuir uniformemente la suspensión en la placa. 13) Las placas se incubaron a 30°C durante 12 a 24 horas. 14) Se observó la placa para colonias. 40 15) Se inocula una única colonia en medio líquido LB que contiene antibiótico adecuado y se incuba a 30°C durante
12 a 24 horas. 16) Se puede preparar glicerol mediante la adición de 80% de glicerol en cultivo líquido (15% v/v) y se almacena a 80°C.
Actividad de verificación
imagen39
1) 50 µ µL de amilopectina Azure al 8% pH 7 en el mismo tubo. Se preparan 2 tubos para cada clon. 2) La actividad se ensaya a 50°C durante 3 horas y durante la noche. Se utiliza de pH 7 como control. 3) se enfría la muestra de ensayo en baño de hielo-agua durante 5 minutos. 5 4) Se agrega 750 µl de Etnol y se mezcla a fondo. 5) Se centrifuga a 13000 rpm (16000 g’s) durante 5 minutos 6) Se mide OD del sobrenadante a 595 nm. Análisis RFLP 1) 1.0 ml de cultivo líquido se transfiere a un microtubo estéril. 10 2) Se centrifuga a 13200 rpm (16000 de g) durante 1 minuto. 3) Se elimina el sobrenadante. Se agrega 1.0 mL de cultivo líquido en el mismo microtubo estéril. 4) Se centrifuga a 13200 rpm (16000 de g) durante 1 minuto. 5) Se elimina el sobrenadante. 6) Se sigue el protocolo de mini equipo QIAprep para aislamiento del plásmido. 15 7) Se controla la concentración de ADN utilizando BioPhotometer. 8) Se utiliza Sac I y Kpn I para primera digestión doble. Se incuba a 37°C durante 1 hora. 9) Se utiliza Pst I y Xho I para segunda digestión doble. Se incuba a 37°C durante 1 hora. 10) Se agrega tinte de carga en la muestra digerida. 11) Se corre la muestra digerida en un gel de agarosa al 1.0% durante 1-1.5 horas a 120 voltios. 20 12) Se observa el gel con gel con formador de imágenes. Todos los clones con un patrón de digestión diferente se enviaran para análisis de secuencias.
Ejemplo 7
Ensayo para amilasas Preparación de cultivos anfitriones
25 1. Iniciar un cultivo durante la noche de células anfitrionas XL1-Blue MRF’. Utilizar una única colonia de una placa consecutiva para inocular 10 mL de LB suplementado con 20 ug/mL de tetraciclina. Hacer crecer cultivo durante la noche con agitación a 37°C durante por lo menos 16 horas.
2. Utilizar una técnica aséptica, inocular 100 mL de un cultivo fresco LBTet diario con el anfitirión XL1-Blue MRF’ del cultivo LBTet durante la noche.
30 3. Haga crecer en un agitador a 37ºC hasta que la OD alcanza 0.75 -1.0.
4.
Se sedimentan células anfitrionas a 1000 x g durante 10 minutos y se resuspenden suavemente en MgSO4 10 mM a OD5.
5.
Diluir una pequeña cantidad de células anfitrionas para OD1 para uso en la titulación y en el uso de Pintool.
6. Se pueden utilizar preparaciones anfitrionas por hasta 1 semana cuando se almacenan en hielo o a 4°C. 35 Comentarios
-Para acortar el tiempo de crecimiento del cultivo diario, utilice ½X de la concentración Tet habitual en LB (½X = 10 ug/mL), u omita por completo el antibiótico. -No utilice NZY al seleccionar con tetraciclina. La alta concentración de Mg++ en un medio NZY hace al Tet inactivo. Colecciones de Titulación Lambda
40 7. Coloque tres tubos de microcentrífuga estériles en un estante.
8.
Se preparan alícuotas de 995 uL de células anfitrionas en un tubo y se preparan 45 uLde células anfitrionas OD1 en cada uno de los dos tubos restantes.
9.
Se agrega 5 uL de colección lambda al tubo que contiene 995 uL de células anfitrionas y se mezcla mediante agitación. Esto resulta en un factor de dilución de 200.
5 10. Se prepara 1/2,000 y 1/20,000 diluciones al agregar consecutivamente 5 uL de la dilución anterior a los dos tubos restantes que contienen 45 uL de células anfitrionas preparadas. Se mezcla mediante agitación después de que se hizo cada dilución.
imagen40
11. Se permite que el fago se absorba en el anfitrión al incubar a 37°C durante 15 minutos
12. Mientras tanto, la pipeta 100 uL de células anfitrionas OD1 preparadas se colocan en cada uno de tres Falcon 10 2059 tubos.
13.
Se agrega 5 uL de cada dilución a un tubo 2059 separado que contiene células anfitrionas.
14.
Se platea cada uno al agregar 3 mL de agar superior a cada tubo y se vierte rápidamente más sobre placas NZY de 90 mm. Asegurar una distribución uniforme suave antes del endurecimiento del agar superior.
15.
Se invierten las placas y se incuban a 37°C durante la noche.
15 16. Se cuentan placas y se calcula el título de la cepa de colección (en unidades formadoras de placa (pfu) por UL). Cribado de microtitulación Lambda para amilasas Preparación
1. Preparar una cantidad suficiente de cultivo anfitrión XL1-Blue MRF’, como se ha descrito anteriormente, para la cantidad de cribado planeado. Un cultivo de 100 mL es generalmente suficiente para el cribado de 2 a 3 colecciones.
20 2. Se someten a autoclave varias botellas compatibles con el dispensador QFill2. Estas son botellas de boca ancha Coming, de 250 mL que contienen un anillo de sellado alrededor de la tapa.
3. Asegúrese de que hay suficiente cantidad de placas de agar superior, almidón BODIPY, solución de almidón rojo, etc. disponibles para el cribado.
4. Programar el robot en el día 2 para que funciona con un representante de automatización. 25 Día1
1.
Marcar las placas 1536 (negro) con el cribado de colección y el número de placa. Los adhesivos Tough-Tags™ de tubo, cortados por la mitad a lo ancho, son ideales para marcar placas de 1536 pozos.
2.
Calcular volúmenes de colección, las células anfitrionas y medio NZY necesarios para el cribado. Esto se hace fácilmente con una hoja de cálculo de Excel.
30 3. Combinar los volúmenes calculados de la colección lambda y células anfitrionas OD5 en una botella Corning de boca ancha de 250 mL estéril (que contiene un anillo de sellado).
4.
Dejar que se produzca la adsorción a 37°C durante 15 minutos.
5.
Agregar el volumen calculado de medio NZY y mezclar bien. Esto se conoce como suspensión de medio de células de fago.
35 6. Realizar una titulación concomitante al combinar de 50 uL de la suspensión de medio de células fago con 250 uL de células anfitrionas OD1 en un tubo Falcon 2059, luego colocar en placa con 9 mL de agar superior en una placa NZY de 150 mm. Incubar placas de titulación concomitante a 37°C durante la noche.
7. Cargar el dispensador con el resto de la suspensión y la matriz cada uno marcado con placa de 1536 pozos a 4
uL por pozo. Si el dispensador deja burbujas de aire en algunos pozos, se pueden eliminar mediante centrifugación 40 de las placas a 200 x g durante 1 minuto.
8. Agregar 0.5 uL de fago de control positivo a la posición de pozo AD46 de por lo menos dos de las placas de ensayo. Utilizar un clon lambda positivo a amilasa fuerte para este propósito. Las versiones lambda de la SEQ ID NO.: 113 o SEQ ID NO.: 199 son buenas opciones para los controles positivos.
9. Incubar placas de ensayo a 37°C durante la noche en un incubador humidificado (≥95%). 45 Día2
imagen41
1.
Contar las pfu en la placa de titulación concomitante y determinar la densidad promedia de semillas por pozo (en pfu por pozo).
2.
Uso de Pintool por lo menos 2 placas de cada cribado de colección (de preferencia 2 que contengan controles positivos) como sigue:
5 a) Preparar 2 placas de césped anfitrión para actuar como una superficie sobre la que el Pintool:
combina 250 uL de células anfitrionas OD1 con 2 mL 2% de almidón rojo y placa con 9 mL de agar superior NZY en placas de 150 mm. Mantenga cada placa se solidifica lo más nivelada posible que el agar superior con el fin de producir una tonalidad uniforme de color rojo en toda la placa.
b) Utilizar un Pintool en la posición 1536 de llama esterilizada dos veces, replicar por lo menos 2 de las placas de 10 cribado en las placas de césped anfitrión.
c) Colocar las placas receptoras que se sometieron a Pintool en una campana de flujo laminar con las tapas durante unos 15-30 minutos (para ventilar el exceso de humedad).
d) Reemplazar las tapas y se incuba invertida a 37°C durante la noche.
3. Preparar el regulador de sustrato de almidón BODIPY 2X como sigue: 15 a) Calcular el volumen total de solución de regulador de sustrato 2X necesario para todas las placas de cribado en 4
uL por pozo (que incluye cualquier volumen de espacio muerto extra que se requiere por el dispensador) y miden esta cantidad de CAPS 100 mM pH 10.4 en un recipiente apropiado para el dispensador utilizado. b) Recuperar suficientes tubos de 0.5 mg de almidón BODIPY para producir el volumen requerido de sustrato
regulador 2X [calculado en la etapa a) anterior] en una concentración final de 20 a 30 ug/mL. 20 c) Disolver cada tubo de 0.5 mg en 50 uL de DMSO a temperatura ambiente, protegido de la luz, con centrifugación
frecuente. Esto toma más de 15 minutos; algunos lotes de producción de almidón BODIPY se disuelven mejor que otros. d) Agregar 50 uL de regulador CAPS 100 mM pH 10.4 a cada tubo y mezclar mediante centrifugación. e) Agrupar los contenidos de todos los tubos y retirar cualquier agregado no disuelto mediante centrifugación
25 durante 1 minuto a velocidad máxima en una microcentrífuga. f) Agregar el sobrenadante al resto de regulador CAPS 100 mM medido en la etapa a) anterior. g) Proteger el regulador de sustrato 2X de la luz envolviéndolo en papel de aluminio.
4. Tomar placas y regulador de sustrato a la sala de automatización y programar el robot con los siguientes parámetros:
30 a) dispensar regulador de sustrato 4 uL por pozo b) 1ª lectura a 1 hora post-sustrato, segunda lectura a las 9 horas, y la tercera lectura a 17 horas; con 37°C de incubación entre lecturas
c) filtro de excitación: 485 nm; filtro de emisión: 535 nm d) establecer la ganancia Spectrafluor a 70, o la ganancia óptima para el lote de regulador de sustrato 2X preparado. 35 e) garantizar que la incubadora utilizada protegerá las placas de ensayo de la luz. Día 3
1. Comprobar las placas sometidas a Pintool para inhibición en el césped bacteriano en todas las posiciones correspondientes a los pozos de la placa de ensayo asociada. También comprobar las compensaciones en el almidón rojo en cualquiera de las posiciones terminales. Si se utilizan placas que contienen controles positivos para
40 usar en Pintool, debería ser capaz de ver una zona de inhibición grande en el fondo rojo. Tenga cuidado con los contaminantes que también forman zonas de inhibición en el almidón rojo (véase comentario "contaminantes que forman zonas de inhibición en almidón rojo" al final del Ejemplo 7).
2. Identificar los aciertos putativos del archivo de datos producido por el ordenador del robot. El programa KANAL
producido por Engineering simplifica el análisis de datos. Como regla general, un acierto putativo se caracteriza 45 como un pozo que tiene intensidad de señal, elevándolo en por lo menos 1.5 veces más de fondo.
imagen42
3. Para cada acierto putativo, retirar 2 uL del pozo y agregar a un tubo que contiene 500 uL de regulador SM y 50 uL de CHCl3. Se centrifuga para mezclar y almacenar a 4°C. Esta solución se denomina en lo sucesivo como la cepa 4e-3. Las placas de cribado originales se deben almacenar a 4°C, protegidas de la luz, por lo menos hasta que se completan los brotes.
5 Este es el método recomendado para descomponer aciertos putativos. Se trata de un ensayo en fase líquida que se basa en la confirmación de la actividad sobre almidón BODIPY. Alternativamente, los aciertos putativos se pueden sembrar directamente en placas de fase sólida que contienen almidón rojo de tal manera que 2,000-3,000 pfu por acierto se examinan para zonas de inhibición. Sin embargo, la incapacidad de observar zonas de inhibición en el almidón rojo no es necesariamente una indicación de que un acierto putativo fue un falso positivo. Luego se
10 necesitaría ensayar utilizando el formato en el que se identificó originalmente (es decir, en fase líquida utilizando almidón BODIPY como sustrato). Adicionalmente, se identifican más fácilmente los positivos muy débiles utilizando el método detallado a continuación.
Día 1
1. En un tubo cónico estéril de 50 mL, se combinan 0.5 mL de células anfitrionas OD5 con 45.5 mL de NZY. Esto se 15 conoce como la suspensión de medio anfitrión.
2.
Para que se analice cada acierto putativo, se forman alícuotas de 1 mL de suspensión de medio anfitrión en cada uno de 3 tres tubos de microcentrífuga estériles.
3.
Fijar la Pipeta de 12 canales en modo de múltiple suminitro con un tamaño alícuota de 20 uL y un número alícuota de 2x. Montar la Pipeta con un grupo limpio de puntas estériles.
20 4. Verter aproximadamente 1 mL de suspensión de medio de anfitrión en un nuevo cuenco con solución estéril y cargar la pipeta de múltiples canales.
5.
Dispensar 20 uL por pozo en la última fila (fila P) de una placa de 384 pozos negra (12 canales x 2 = 24 pozos). Esta fila se utilizará más adelante para los controles.
6.
Expulsar el líquido que queda en la punta al tocar la punta contra la superficie del cuenco y presionar el botón
25 RESET del Pipeta. Colocar la Pipeta de tal manera que se evite la contaminación de las puntas. No hay necesidad de cambiar las puntas en este punto.
7.
Verter el resto del fluido en el cuenco en un contenedor de residuos (como un vaso de precipitados) con cuidado parA evitar de nuevo contaminación con salpicaduras.
8.
Para el primer acierto putativo que se va a analizar, tomar 111 uL de las cepas 4e-3 (véase el Día 2 en Cribado de
30 microtitulación lambda de amilasas) y agregarlo a la primera de una serie de tres tubos que contienen 1 mL de suspensión de medio de anfitrión (etapa 2). Centrifugar para mezclar. Esta es la dilución A.
9. Tomar 111 uL de dilución A y se agrega al siguiente tubo en el grupo. Centrifugar para mezclar. Esta es la dilución
B.
10. Tomar 111 uL de dilución B y se agrega al último tubo en el grupo. Centrifugar para mezclar. Esta es la dilución 35 C. Ahora debería tener tres diluciones de fago, donde las concentraciones de cada uno difieren en un factor de 10.
11.
Verter los contenidos de dilución C (la más diluida de las 3 muestras) en el cuenco de solución y cargar la pipeta de múltiples canales.
12.
Dispensar 20 uL por pozo en la primera fila de la placa de 384 pozos (12 canales x 2 = 24 pozos).
13.
Expulsar el líquido que queda en la punta al tocar la punta contra la superficie del cuenco y presionar el botón
40 RESET de la pipeta. Colocar la pipeta de tal manera que se evite la contaminación de las puntas. No hay necesidad de cambiar las puntas en este punto.
14.
Vaciar el cuenco como se describió anteriormente.
15.
Verter el contenido de Dilución B en el mismo cuenco y cargar la pipeta de múltiples canales.
16.
Dispensar 20 uL por pozo en la segunda fila de la placa de 384 pozos.
45 17. Realizar las etapas 13-16 de manera similar para dispensar Dilución A en la tercera fila de la placa.
18.
Después de que se han dispuesto las tres diluciones en las 3 primeras filas de la placa, descartar todas las puntas y el cuenco de solución en el recipiente para residuos biológicos peligrosos.
19.
Montar la pipeta con un grupo limpio de puntas estériles y abrir un nuevo cuenco con solución estéril.
20.
Repetir las etapas 8-19 para cada acierto putativo restante, utilizando filas restantes en la placa hasta la fila O. Se pueden analizar cinco aciertos putativos en una placa de 384 pozos, con la última fila (fila P) salvo para los controles.
21.
Agregar 0.5 uL de cada control a un pozo separado. Utilizar por lo menos 2-3 controles separados, preferiblemente cubriendo un rango de actividad.
22.
Incubar placas de ensayo a 37°C durante la noche en un incubador humidificado (≥95%). Día 2
imagen43
1.
Someter a Pintool todas las placas de brote sobre un césped anfitrión con el almidón rojo utilizando el mismo método descrito para el día 2 en Cribado de microtitulación lambda de amilasas, excepto que se utiliza un Pintool en la posición 384.
2.
Preparar el regulador de sustrato de almidón BODIPY 2X como sigue: a) Calcular el volumen total de solución reguladora de sustrato 2X necesario para todas las placas de brote a 20 uL
por pozo (incluyendo cualquier volumen de espacio muerto extra que se requiere por el dispensador) y medir esta cantidad de CAPS 100 mM pH 10.4 en un recipiente apropiado para el dispensador utilizado. b) Recuperar suficientes tubos de 0.5 mg de almidón BODIPY para producir el volumen requerido de regulador
sustrato de 2X [calculado en la etapa a) anterior] en una concentración final de 20 a 30 ug/mL. c) Disolver cada tubo de 0.5 mg en 50 uL de DMSO a temperatura ambiente, protegido de la luz, con centrifugación
frecuente. Esto toma más de 15 minutos; algunos lotes de producción de almidón BODIPY se disuelven mejor que otros. d) Agregar 50 uL de regulador CAPS 100 mM pH 10.4 a cada tubo y mezclar mediante agitación. e) Agrupar el contenido de todos los tubos y retirar cualquier agregado no disuelto mediante centrifugación durante 1
minuto a velocidad máxima en una microcentrífuga. f) Agregar el sobrenadante para el resto del regulador CAPS 100 mM medido en la etapa a) anterior. g) Proteger el regulador de sustrato 2X de la luz envolviéndolo en papel de aluminio.
3.
Dispensar 20 uL por pozo en todas las placas de brote.
4.
Envolver todas las placas en papel de aluminio e incubar a temperatura ambiente durante 2-6 horas.
5.
Leer cada plato en el Spectrafluor con las siguientes configuraciones: a) lectura de fluorescencia (filtro de excitación: 485 nm; filtro de emisión: 535 nm) b) definición de placa: 384 pozos negro c) lectura de la parte superior d) ganancia óptima e) número de destellos: 3
6.
En la hoja de cálculo de Excel resultante, trazar cada una de las 3 filas putativas en un gráfico separado y comprobar si hay actividad. Asegurar que los controles positivos producen señales sobre el fondo.
7.
Para cada fila putativa que parece tener una señal real entre los pozos, recolectar una muestra de un pozo positivo de la siguiente manera:
a) Seleccionar un pozo positivo de una fila que representa la mayor dilución inicial. b) Transferir 2 uL de ese pozo en un tubo que contiene 500 uL de SM y 50 uL de CHCl3. Esto se conoce como el brote de cepa.
c) Almacenar a 4°C.
8. Utilizar los métodos descritos anteriormente, la placa de aproximadamente 10 uL de cada brote de cepa en placas NZY de 150 mm utilizando almidón rojo. El objetivo es obtener varias (por lo menos 20) placas bien separadas desde las cuales se aísla el núcleo.
Día 3 1. Comprobar las placas que se sometuiron a Pintool para una incidencia aceptable de las compensaciones en el césped bacteriano correspondientes a los pozos sobre la placa de ensayo asociada. También comprobar las compensaciones en el almidón rojo en los controles positivos y en cualquier acierto putativo probado. Tenga cuidado con los contaminantes que también forman zonas de inhibición en el almidón rojo (véase adelante).
imagen44
5 2. A partir de las placas de fase sólida que contienen diluciones de brotes de cepas, varias placas aisladas centrales, cada una en 500 uL SM con 50 uL de CHCl3. Esto se conoce como la cepa aislada.
3. Las cepas aisladas luego se pueden probar de forma individual sobre almidón BODIPY utilizando los métodos descritos anteriormente. Esta etapa se puede omitir si la placa eliminada en la etapa 2 produjo una zona de inhibición en el fondo del almidón rojo. Las cepas aisladas luego se probaron individualmente en almidón BODIPY
10 utilizando los métodos descritos anteriormente. Sin embargo, esta etapa se puede omitir si la placa que fue central en la etapa 2 produjo una zona de inhibición en el fondo de almidón rojo.
Divisiones
Día 1
1. En un tubo Falcon 2059, mezclar 200 uL de acogida célula anfitriona OD1 XL1-Blue MRF’, 100 uL de cepa aislada 15 lambda, 1 uL de fago ExAssist.
2.
Incubar en 37°C con agitador durante 15 minutos.
3.
Agregar 3 mL de medio NZY.
4.
Incubar a 30°C durante la noche agitador. Día 2
20 1. Calentar el tubo de división a 70°C durante 20 minutos.
2.
Centrifugar 1000 xg durante 10 minutos.
3.
En un tubo Falcon 2059, combinar 50 uL de sobrenadante con 200 uL de anfitrión EXP505 DO1.
4.
Incubar a 37°C con agitador durante 15 minutos.
5.
Agregar 300 uL de medio SOB.
25 6. Incubar a 37ºC con agitador durante 30-45 minutos.
7.
Colocar en placa 50 uL de placa de LBKan50 grande utilizando perlas de vidrio estériles. Si las placas son "secas", se puede agregar medio SOB adicional para ayudar a desembolsar las células.
8.
Incubar la placa a 30°C durante por lo menos 24 horas.
9.
Cultivar un aislado para la secuenciación y/o RFLP.
30 El crecimiento a 30°C reduce el número de copias de plásmido y se utiliza para mitigar la toxicidad aparente de algunos clones de amilasa.
Contaminantes que constituyen zonas de inhibición en almidón rojo
Al utilizar almidón rojo en medio sólido para ensayo de fagos para actividad de amilasa, es común ver a unidades
formadoras de colonias (ufc) contaminantes que forman zonas de inhibición en el almidón rojo. Para las placas 35 sometidas a Pintool, es importante distinguir clones de fagos de amilasa-positiva de estos contaminantes cada vez
que se alinean con una posición de pozo particular. La fuente de los microbios contaminantes es presumiblemente el
2% de solución de almidón rojo, que no se puede esterilizar en autoclave o mediante filtrado después de
preparación. Se considera que son organismos oportunistas que sobreviven del metabolismo del almidón rojo. Con
el fin de reducir estos contaminantes, se utiliza una técnica estéril al hacer 2% de soluciones de almidón rojo y
40 almacenar las cepas ya sea a 4°C o en hielo.
Ejemplo 8
Análisis bioinformático
Un análisis bioinformático inicial se hizo con las secuencias de α-amilasa hipertermofílicas conocidas. La figura 14a
muestra una alineación de las secuencias, algunas de los cuales se han depositado en la base de datos NCBI. Este 45 análisis reveló el potencial para el diseño de cebadores degenerados para PCR, el gen entero menos su secuencia
imagen45
de señal (véase Figura 14a), produciendo potencialmente alfa amilasas de longitud completa novedosas a partir de una colección. Las siguientes colecciones se cribaron por PCR a partir de ADN genómico: Tabla 6
Colección #
Nombre Positivo a PCR Subclonado
5
A.lithotropicus No
13
Pyrodictium occultum No
17
Pyrodictium TAG11 No Si
113
Deep sea enrichme Si Si
170
Deep sea enrichme Si Si
198
Archaeglobus No
206
Acidianus sp No
453
Mixed iceland enrich No
455
Mixed iceland enrich Si Si
La Figura 14b muestra una alineación de las secuencias identificadas y la tabla adelante sus porcentajes de identidad relativos.
Tabla 7: % de identidad de secuencias de nucleótidos
SEQ ID NO.: 81
pyro Pyro 2 thermo therm2 SEQ ID NO.: 75 SEQ ID NO.: 77 SEQ ID NO.: 83 SEQ ID NO.: 85 SEQ ID NO.: 79
SEQ ID NO.: 81
100 91.7 75.1 80.1 82.5 82.6 82.1 82.6 83
pyro
100 74.8 82.5 80.5 82 82.2 82.9 82.8 84
Pyro2
100 71.5 71.1 74 74.2 77 77.1 73
therm
100 81.7 83.5 83.8 82.8 83.2 83.8
therm2
100 88.9 88.8 84.1 84.7 84
SEQ ID NO.: 75
100 98.3 84.6 85.2 85.5
SEQ ID NO.: 77
100 84.8 84.9 85.4
SEQ ID NO.: 83
100 96 83.3
SEQ ID NO.: 85
100 83
SEQ ID NO.: 79
100
Clon A
10 La identidad de aminoácidos varía de aproximadamente una identidad de 85-98%. De acuerdo con lo anterior, estas secuencias son útiles en transposición de genes como se describe aquí.
imagen46
La Figura 14c muestra el alineamiento de ácido nucleico de las secuencias de polipéptidos correspondientes anteriores. La expresión de estas amilasas en el vector de expresión pSE420 y la estirpe de célula anfitriona XII-Blue mostraron que 1703 y 1706 tienen actividad de amilasa.
Ejemplo 9
5 Caracterización de la colección de 63 GP-1 de alfa amilasa pH óptimo y determinación de actividad específica
En los experimentos iniciales, la SEQ ID NO: 81 de Thermococcus mostró que era efectiva en la licuefacción de almidón para molido de maíz en húmedo y desencolado de textiles. Esta enzima tiene un pH óptimo de 4.5 a 5.0. A este pH más bajo, es posible utilizar poco o nada de calcio que reduce los costes operativos totales y da menos formación de subproducto. Adicionalmente, a este pH bajo, se presenta una disminución del uso de productos
10 químicos y de carga de intercambio iónico. El estándar de la industria de amilasa de B. licheniformis es subóptimo en la termoestabilidad y pH óptimo. La amilasa 63GP-1 tiene una actividad específica de aplicación más alta en comparación con la amilasa de B. licheniformis y por lo tanto se requiere mucho menos enzima para hidrolizar una tonelada de almidón (se puede utilizar tanto como 20 veces menos de enzima).
El pH óptimo para la hidrólisis de almidón se determinó al hacer reaccionar 50 uL de las GP-1, 0.35 U/ml, con 100
15 mL de una solución de almidón soluble al 1% (0.0175U/g de almidón) durante 30 minutos a 95 grados C. los extremos reductores generados en la solución de almidón licuada se determinaron al medir el ensayo de neocupronina, que se describe aquí. El porcentaje de hidrólisis de almidón de maíz se determinó al medir el número de extremos reductores de azúcar producidos con el ensayo de neocupronina. Setenta gramos de solución reguladora (pH 4-7) se pesaron y se agregaron 100 ppm de calcio. Treinta gramos de almidón de maíz se mezclaron
20 en la solución reguladora para formar una suspensión de almidón. Se agregó la enzima y se sellaron los recipientes y se incubó a 95 grados C durante 30 minutos con una tasa de calentamiento inicial de seis grados C por minuto. Una muestra de 1 mL se extrajo de los vasos de precipitados de reacción y se analizó por el ensayo de neocupronina. El óptimo para GP-1 fue de entre pH 4.5 y 5, mientras que la amilasa de B. licheniformis comercial se desarrolló óptimamente a un pH de 6.0.
25 Ejemplo 10
Reensamblaje de ligado de amilasa
Nueve fragmentos (cada uno de aproximadamente 150 pb) se amplificaron a partir de cada uno de los clones progenitores SEQ ID NO.: 81, SEQ ID NO.: 77, SEQ ID NO.: 79, que cubre todo el marco de lectura abierto. Los cebadores se proporcionan en la Tabla 8.
30
imagen47
Tabla 8
imagen48
SEQ ID NO: imagen49
GAACACTAGTAGGAGGTAACTTATGGCAAAGTATTCCGAGCTCGAAG
258 SpeI
GAACGGTCTCATTCCGCCAGCCAGGAAGGGGATGAGCGG
259 BsaI
GAACCGTCTCAAAACACGGCCCATGCCTACGGC
260 BsmBI
GAACGTCTCACCTCGACTTCCACCCCAACGAGGTCAAG
261 BsmAI
GAACGTCTCAGGCGCTTTGACTACGTGAAGGGC
262 BsmAI
GAACGGTCTCAACAAGATGGATGAGGCCTTTG
263 BsaI
GAACCGTCTCACGATATAATCTGGAACAAGTACCTTGC
264 BsmBI
GAACCGTCTCAGAAGCACGAGCATAGTTTACTACG
265 BsmBI
GAACCGTCTCAAAGGTGGGTTTATGTGCCG
266 BsmBI
GAACGTCTCAGGAATCCAAATGGCGGATATTCCCGC
267 BsmAI
GAACGGTCTCAGTTTATCATATTGATGAGCTCC
268 BsaI
GAACCGTCTCAGAGGTAGTTGGCAGTATATTTG
269 BsmBI
GAACGTCTCACGCCAGGCATCAACGCCGATG
270 BsmAI
GAACGTCTCATTGTAGTAGAGCGGGAAGTC
271 BsmAI
GAACGGTCTCAATCGGTGTCGTGGTTTGCTAC
272 BsaI
GAACCGTCTCACTTCCACCTGCGAGGTGGTC
273 BsmBI
GAACCGTCTCACCTTCCAACCTTGCTCGAGC
274 BsmBI
TCGAGACTGACTCTCACCCAACACCGCAATAGC
275 imagen50
imagen51
276 SpeI
GAACGGTCTCATTCCCCCGGCGAGCAAGGGC
277 BsaI
GAACCGTCTCAAAACACCGCCCACGCCTACGG
278 BsmBI
GAACGTCTCACCTCGACTTCCACCCCAAC
279 BsmAI
GAACGTCTCAGGCGCTTCGACTACGTCAAGG
280 BsmAI
GAACGGTCTCAACAAGATGGACGCGGCCTTTGAC
281 BsaI
GAACCGTCTCACGATATAATTTGGAACAAGTACCC
282 BsmBI
GAACCGTCTCAGAAGCACCGACATAGTCTAC
283 BsmBI
GAACCGTCTCAAAGGTGGGTCTACGTTCCG
284 BsmBI
GAACGTCTCAGGAATCCATATTGCGGAGATTCCGGC
285 BsmAI
GAACGGTCTCAGTTTATCATGTTCACGAGCTC
286 BsaI
GAACCGTCTCAGAGGTAGTTGGCCGTGTACTTG
287 BsmBI
GAACGTCTCAGCCATGCGTCAACGCCGATG
288 BsmAI
GAACGTCTCATTGTAGTAGAGCGGGAAGTCG
289 BsmAI
GAACGGTCTCAATCGGTGTCGTGGTTTGCAACG
290 BsaI
GAACCGTCTCACTTCCACCGGCGAGGTGGTCGTG
291 BsmBI
GAACCGTCTCACCTTCCGGCCTTGCTCGAGCC
292 BsmBI
TCGAGACTGACTCTCAGCCCACCCCGCAGTAGCTC
293 imagen52
imagen53
294 SpeI
imagen54
imagen55
SEQ ID NO: imagen56
imagen57
imagen58 imagen59
GAACGGTCTCATTCCTCCCGCGAGCAAGGG
295 BsaI
GAACCGTCTCAAAACACCGCCCACGCCTATG
296 BsmBI
GAACGTCTCACCTCGACTTCCACCCGAACGAGC
297 BsmAI
GAACGTCTCAGGCGCTTCGACTACGTCAAGG
298 BsmAI
GAACGGTCTCAACAAGATGGACGAGGCCTTCG
299 BsaI
GAACCGTCTCACGATATAATCTGGAACAAG
300 BsmBI
GAACCGTCTCAGAAGCACTGACATCGTTTACTACG
301 BsmBI
GAACCGTCTCAAAGGTGGGTTTACGTTCCG
302 BsmBI
GAACGTCTCAGGAATCCATATCGCCGAAAT
303 BsmAI
GAACGGTCTCAGTTTATCATGTTTATGAGC
304 BsaI
GAACCGTCTCAGAGGTAGTTGGCCGTGTATTTAC
305 BsmBI
GAACGTCTCACGCCAGGCATCGATGCCGAT
306 BsmAI
GAACGTCTCATTGTAGTAGAGGGCGAAGTCAAAG
307 BsmAI
GAACGGTCTCAATCGGTATCGTGGTTGGCTACAAAC
308 BsaI
GAACCGTCTCACTTCCTCCGGCGAGGTTGTCATG
309 BsmBI
GAACCGTCTCACCTTCCGGCTTTGCTTGAGGC
310 BsmBI
TCGAGACTGACTCTCACCCAACACCGCAGTAGCTCC
311 imagen60
CACACAGCAGCAACCAACCTCGAGACTGACTCTCASCC
312 BbvI
Las condiciones utilizadas para PCR fueron las siguientes: 3 min 94°C, (30 seg 94°C; 30 seg 55°C, 30 seg 68°C) x 30 ciclos, seguido de 10 min 68°C. Se agruparon los productos de PCR correspondientes a las regiones homólogas de los tres progenitores (1:1:1), se cortaron con la enzima de restricción apropiada (véase Tabla 8), y se purificaron 5 en gel. Se combinaron y ligaron iguales cantidades de agrupaciones de fragmentos (16°C; durante la noche). Los productos de ligación de 450 pb resultantes se purificaron en gel y se ligaron para obtener genes de longitud completa de amilasa. Los productos resultantes de longitud completa se purificaron en gel y se amplificaron con PCR utilizando una mezcla de cebadores F1 SEQ ID NO.: 81, SEQ ID NO.: 77, SEQ ID NO.: 79 y el cebador (SEQ ID NO: 312). Las condiciones utilizadas para PCR fueron las siguientes: 3 min 94°C, (30 seg 94°C; 30 seg 50°C, 60
10 seg 68°C) x 30 ciclos, seguido de 10 min 68°C. Se purificaron los productos de PCR resultantes (~1.4 kbp), se cortaron con SpeI y BbvI, se purificaron en gel, se ligaron en pMYC (vector de Mycogen, se cortaron con SpeI/XhoI), y se transforman en E. coli Top 10. El ADN de plásmido de una agrupación de ~21000 colonias se aisló y se transformó en Pseudomonas.
Cribado de α-amilasa reensamblada
15 La Pseudomonas fluorescens transformada (MB214) que contiene pMYC derivado de clones progenitores SEQ ID NO.: 81, SEQ ID NO.: 77, SEQ ID NO.: 79 fueron clasificadas en placas de 96 o 384 pozos mediante FACS y tratadas con urea 6 M. El cribado primario que utilizó RBB-almidón y/o FITC-almidón como sustratos se llevó a cabo como se describe más completamente adelante. Los clones activos elevados se cribaron utilizando RBB-almidón como sustrato utilizando cultivos inducidos y mediante ensayo de licuefacción. Se realizó abastecimiento y
20 secuenciación de nuevos clones activos elevados con base en los datos de licuefacción.
La colección de amilasa reensamblada transformada (MB214 (Pf)), se recolectó y clasificó en placas de 96 pozos (o placas de 384 pozos) a 1 célula/pozo en 50 µl de LB + Tet. Las placas se incubaron durante 24 horas a 30°C. Las placas replicadas se hicieron correspondiente a cada pozo para almacenamiento. Se agregaron cuarenta y cinco
(45) µl de urea 12 M a cada pozo y las placas se agitaron durante 10 minutos. Las placas se mantuvieron a 25 temperatura ambiente durante por lo menos 1 hora y el lisado se almacenó a 4°C.
Ensayo utilizando RBB-almidón Se agregó 75 µl de sustrato RBB-almidón (1% de almidón de maíz insoluble RBB en regulador NaAc 50 mM, pH = 4.5) en cada pozo de una nueva placa de 96 pozos (fondo en V). Cinco microlitros de lisado de enzima se transfirieron en cada pozo con sustrato utilizando Biomek o Zymark. Las placas se sellaron con cinta de sellado de aluminio y se agitaron brevemente en el agitador. Las placas se incubaron a 90°C durante 30 minutos, seguido por
imagen61
5 enfriamiento a temperatura ambiente durante aproximadamente 5 a 10 minutos. Se agregaron cien microlitros de etanol al 100% a cada pozo, se sellaron las placas y se agitaron brevemente en el agitador. Las placas luego se centrifugaron a 4000 rpm durante 20 minutos utilizando centrífuga de mesa. 100 µl del sobrenadante se transfirió a una nueva placa de 96 pozos (fondo plano) por Biomek y lectura OD595. Controles: SEQ ID NO.: 81, SEQ ID NO.: 77, SEQ ID NO.: 79.
10 Ensayo utilizando FITC-almidón
Se agregaron 50 µl de sustrato (0.01% de FITC-almidón en regulador de NaAc 100 mM, pH = 4.5) en cada pozo de una nueva placa de 384 pozos. Se transfirió 5 mL de lisado de enzima en cada pozo con sustrato y se incubó la placa a temperatura ambiente durante la noche. Se lee el cambio de polarización del sustrato, 485 nm de excitación, 535 nm de emisión, para cada pozo. Controles: SEQ ID NO.: 81, SEQ ID NO.: 77, SEQ ID NO.: 79. Preferiblemente
15 se utilizan placas de 96 pozos para todos los ensayos.
Confirmación de los nuevos clones activos
Cada clon positivo del cribado se hizo crecer y se indujo utilizando un protocolo estándar. Cada clon se examinó para crecimiento (es decir, densidad de células en el tiempo), la actividad por nivel celular (ensayo RBB-almidón y ensayo de licuefacción), expresión (gel de proteína) y solubilidad de la proteína (mediante análisis de microscopio).
20 Los nuevos clones elevados confirmados se transfirieron para fermentación.
Aunque la invención se ha descrito en detalle con referencia a ciertas realizaciones preferidas de la misma, se entenderá que las modificaciones y variaciones están dentro del espíritu y alcance de lo que se describe y reivindica.
Tabla 3
SEQ ID NO. Secuencia de señal
SEQ ID NO: 87 AA1-23 (SEQ ID NO:213) SEQ ID NO: 91 AA1-23 (SEQ ID NO: 214) SEQ ID NO: 93 AA1-33 (SEQ ID NO: 215) SEQ ID NO: 97 AA1-31 (SEQ ID NO: 216) SEQ ID NO: 99 AA1-30 (SEQ ID NO: 217) SEQ ID NO: 103 AA1-22 (SEQ ID NO: 218) SEQ ID NO: 105 AA1-33 (SEQ ID NO: 219) SEQ ID NO: 109 AA1-25 (SEQ ID NO: 220) SEQ ID NO: 111 AA1-35 (SEQ ID NO: 221) SEQ ID NO: 113 AA1-28 (SEQ ID NO: 222) SEQ ID NO: 117 AA1-21 (SEQ ID NO: 223) SEQ ID NO: 119 AA1-30 (SEQ ID NO: 224) SEQ ID NO: 123 AA1-35 (SEQ ID NO: 225) SEQ ID NO: 125 AA1-28 (SEQ ID NO: 226) SEQ ID NO: 127 AA1-30 (SEQ ID NO: 227) SEQ ID NO: 131 AA1-30 (SEQ ID NO: 228) SEQ ID NO: 133 AA1-30 (SEQ ID NO: 229) SEQ ID NO: 137 AA1-28 (SEQ ID NO: 230)

Claims (15)

  1. imagen1
    REIVINDICACIONES
    1. Un ácido nucleico aislado, sintético o recombinante que comprende:
    (A)
    (i)
    una secuencia que codifica un polipéptido que tiene actividad de alfa amilasa, en la que dicha secuencia tiene por lo menos 90%, 95%, 96%, 97%, 98%, 99% o 100% de identidad de secuencia con la secuencia de la SEQ ID NO: 53, o fragmentos enzimáticamente activos de las mismas, en donde el fragmento tiene actividad de alfa amilasa, o
    (ii)
    la secuencia de (i), en la que la identidad de la secuencia se determina por análisis con un algoritmo de comparación de secuencias, o se determina mediante inspección visual, o
    (iii) la secuencia de (ii), en la que el algoritmo de comparación de secuencias comprende un algoritmo FASTA versión 3.0t78 con parámetros por defecto;
    (B)
    un ácido nucleico que comprende
    (i)
    una secuencia que codifica un polipéptido que tiene actividad de alfa amilasa, en la que la secuencia de aminoácidos del polipéptido tiene por lo menos 98%, 99% o 100% de identidad de secuencia con la secuencia de aminoácidos de la SEQ ID NO: 54, o fragmentos enzimáticamente activos de los mismos, en donde el fragmento tiene actividad de alfa amilasa, o
    (ii)
    la secuencia de (i), en la que la identidad de la secuencia se determina por análisis con un algoritmo de comparación de secuencias, o se determina mediante inspección visual, o
    (iii) la secuencia de (ii), en la que el algoritmo de comparación de secuencias comprende un algoritmo FASTA versión 3.0t78 con parámetros por defecto;
    (C)
    un ácido nucleico que comprende una secuencia de cualquiera de (A) a (B) que codifica un polipéptido que carece de una secuencia de señal;
    (D)
    un ácido nucleico que comprende
    (i)
    una secuencia de cualquiera de (A) a (C) que codifica un polipéptido que comprende adicionalmente una secuencia de ácidos nucleicos heteróloga;
    (ii)
    la secuencia de (i), en la que la secuencia de ácidos nucleicos heteróloga codifica una secuencia de señal;
    (iii) la secuencia de (ii), en la que la secuencia de señal heteróloga comprende una secuencia de señal de amilasa; o
    (E)
    una secuencia de ácidos nucleicos completamente complementaria a cualquier secuencia de ácidos nucleicos de
    (A)
    a (D).
  2. 2.
    Un método para producir un polipéptido recombinante; que comprende las etapas de introducir un ácido nucleico que codifica el polipéptido en una célula anfitriona bajo condiciones que permiten la expresión del polipéptido, y recuperar el polipéptido, en el que el polipéptido comprende un polipéptido codificado por un ácido nucleico de la reivindicación 1.
  3. 3.
    Un vector que comprende:
    (a)
    un ácido nucleico de la reivindicación 1, o
    (b)
    el vector de (a), en la que el vector es un vector de clonación o un vector de expresión.
  4. 4. Una célula anfitriona que comprende
    (a)
    un ácido nucleico de la reivindicación 1, o el vector de la reivindicación 3; o
    (b)
    la célula anfitriona de (a), en la que la célula anfitriona se selecciona del grupo que consiste de: una célula procariota, una célula eucariota, una célula fúngica, una célula de levadura y una célula vegetal.
  5. 5. Un polipéptido aislado, sintético o recombinante que tiene una actividad de alfa amilasa que comprende:
    (a)
    (i)
    una secuencia de aminoácidos que tiene por lo menos 98%, 99% o 100% de identidad de secuencia con la secuencia de aminoácidos de la SEQ ID NO: 54; o
    (ii)
    la secuencia de (i), en la que la identidad de la secuencia se determina por análisis con un algoritmo de comparación de secuencias, o se determina mediante inspección visual, o
    imagen2
    (iii) la secuencia de (ii), en la que el algoritmo de comparación de secuencias comprende un algoritmo FASTA versión 3.0t78 con parámetros por defecto;
    (b)
    una secuencia de aminoácidos codificada por un ácido nucleico de la reivindicación 1;
    (c)
    un fragmento enzimáticamente activo de (a) o (b), en donde el fragmento tiene actividad de alfa amilasa;
    (d)
    la secuencia de aminoácidos de (a), (b), o (c) en la que el polipéptido genera anticuerpos que se unen específicamente a un polipéptido de alfa amilasa;
    (e)
    la secuencia de aminoácidos de (a) a (d), en la que el polipéptido carece de una secuencia de señal; o
    (f)
    (i)
    la secuencia de aminoácidos de cualquiera de (a) a (e), en la que el polipéptido comprende adicionalmente una secuencia de aminoácidos heteróloga;
    (ii)
    la secuencia de (i), en la que la secuencia de aminoácidos heteróloga comprende una secuencia de señal;
    (iii) la secuencia de (ii), en la que la secuencia de señal heteróloga comprende una secuencia de señal de amilasa; o
    (g) la secuencia de aminoácidos de cualquiera de (a) a (f), en la que el polipéptido comprende una o más modificaciones y tiene por lo menos 98%, 99% o 100% de identidad de secuencia con la secuencia de aminoácidos de la SEQ ID NO: 54, y en la que la modificación comprende acetilación, acilación, ADP-ribosilación, amidación, adhesión covalente de flavina, adhesión covalente de una unidad estructural heme, adhesión covalente de un nucleótido o derivado de nucleótido, adhesión covalente de un lípido o derivado de lípido, adhesión covalente de a fosfatidilinositol, ciclización entrecruzada, formación de enlace de disulfuro, desmetilación, formación de enlaces cruzados covalentes, formación de cisteína, formación de piroglutamato, formilación, gamma-carboxilación, glucosilación, formación de ancla de GPI, hidroxilación, yodinación, metilación, miristoliación, oxidación, pegilación, procesamiento proteolítico, fosforilación, prenilación, racemización, selenoilación, o sulfatación.
  6. 6. Un método para hidrolizar un enlace α-1,4-glucosídico que comprende:
    (A)
    poner en contacto una composición que tiene un enlace α-1,4-glucosídico con un polipéptido capaz de hidrolizar un enlace α-1,4-glucosídico,
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5, bajo condiciones que facilitan la hidrólisis del enlace α-1,4-glucosídico;
    (B)
    el método de (A), en el que la composición comprende almidón, en el que el almidón opcionalmente se deriva de arroz, arroz germinado, maíz, cebada, trigo, leguminosas, patata dulce, milo, sorgo, centeno, bulgur o una combinación de los mismos; o
    (C)
    el método de (A) o (B), que comprende adicionalmente adición de una segunda amilasa, una alfa amilasa, una beta amilasa, otra enzima o una combinación de los mismos.
  7. 7. Un método para licuificar una composición que comprende almidón (licuefacción de almidón), que comprende:
    (A)
    poner en contacto una composición que comprende almidón con un polipéptido que tiene actividad de alfa amilasa bajo condiciones que facilitan licuificar el almidón (licuefacción de almidón) para generar un hidrolizado de almidón soluble,
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5;
    (B)
    el método de (A), en el que el almidón se deriva de arroz, arroz germinado, maíz, cebada, trigo, leguminosas, patata dulce, milo, sorgo, centeno, bulgur o una combinación de los mismos;
    (C)
    el método de (A) o (B), que comprende adicionalmente adición de una segunda amilasa, una alfa amilasa, una beta amilasa, otra enzima o una combinación de las mismas;
    (D)
    el método de (A), (B), o (C), que comprende adicionalmente sacarificar el hidrolizado de almidón soluble.
  8. 8. Un método para el tratamiento de fibras lignocelulósicas, que comprende (A) poner en contacto las fibras lignocelulósicas con un polipéptido que tiene actividad de alfa amilasa en una cantidad que es suficiente para modificar una propiedad de fibra,
    imagen3
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácido nucleico de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5; o (B) el método de (A), en el que el método comprende adicionalmente adición de una segunda amilasa, una alfa amilasa, una beta amilasa, otra enzima o una combinación de las mismas.
  9. 9.
    Uso de un polipéptido de acuerdo con la reivindicación 5 en o para un proceso seleccionado del grupo que consiste de la producción de etanol combustible, un proceso de molido de maíz en húmedo, un proceso de horneado un proceso para elaborar un pan o un producto horneado o un proceso para evitar que un pan se ponga rancio, un proceso de perforación, un proceso de elaboración de cerveza, distinta de un papel o una pulpa, lavado de un objeto, procesamiento de textiles o desencolado, procesamiento de papel o pulpa, y la producción de una bebida.
  10. 10.
    Una composición que comprende
    (A)
    un polipéptido que tiene actividad de alfa amilasa, en la que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5;
    (B)
    la composición de (A) que comprende adicionalmente un segundo polipéptido que comprende una segunda amilasa, una alfa amilasa, o una beta amilasa, otra enzima o una combinación de las mismas;
    (C)
    la composición de (A) o (B), en la que la composición es una composición de alimento, un papel, una pulpa o un papel reciclado, un textil, un detergente o un aditivo de detergente, una premezcla para hornear, un aditivo para hornear, una harina, o una masa; o
    (D)
    la composición de alimento de (C), en la que la composición de alimento comprende arroz, arroz germinado, maíz, cebada, trigo, leguminosas, batata, milo, sorgo, centeno, bulgur o una combinación de los mismos.
  11. 11. Un método para elaborar un alimento que comprende
    (A)
    poner en contacto un alimento con un polipéptido que tiene actividad de alfa amilasa, en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5; o
    (B)
    el método de (A), en el que el método comprende adicionalmente uso de un segundo polipéptido que comprende una segunda amilasa, una alfa amilasa, o una beta amilasa, otra enzima o una combinación de las mismas.
  12. 12. Un método para elaborar un alcohol que comprende
    (A)
    poner en contacto una composición que tiene un enlace α-1,4-glucosídico con un polipéptido que tiene actividad de alfa amilasa, en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5;
    (B)
    el método de (A), que comprende adicionalmente adición de una segunda amilasa, una alfa amilasa, una beta amilasa, otra enzima o una combinación de las mismas; o
    (C)
    el método de (A) o (B), en la que el alcohol comprende un etanol combustible.
  13. 13. Un proceso de molido de maíz en húmedo que comprende
    (A)
    uso de un polipéptido que tiene actividad de alfa amilasa,
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5; o
    (B)
    el método de (A), en el que el proceso comprende adicionalmente uso de un segundo polipéptido que comprende una segunda amilasa, una alfa amilasa, o una beta amilasa, otra enzima o una combinación de las mismas.
  14. 14. Un proceso de campo petrolífero que comprende
    (A)
    uso de un polipéptido que tiene actividad de alfa amilasa,
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5;
    (B)
    el método de (A), en el que el proceso de campo petrolífero comprende adicionalmente el uso de un segundo polipéptido que comprende una segunda amilasa, una alfa amilasa, o una beta amilasa, otra enzima o una combinación de las mismas.
    (C)
    el método de (A) o (B), en el que el proceso de campo petrolífero es perforación; o
    imagen4
    5 (D) el método de (A) o (B), en el que método comprende aumentar el flujo de fluidos de producción de una formación subterránea al eliminar un fluido viscoso que contiene almidón, formado durante operaciones de producción y encontrado dentro de la formación subterránea que rodea un agujero de pozo terminado que comprende
    (a)
    permitir que los fluidos de producción fluyan desde el agujero de pozo;
    (b)
    reducir el flujo de fluidos de producción de la formación subterránea por debajo de las tasas de flujo;
    10 (c) proporcionar un polipéptido que tiene actividad de alfa amilasa, en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácido nucleico de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5;
    (d) bombear el polipéptido a una ubicación deseada dentro del agujero de pozo; y
    (e) permitir que el polipéptido degrade el fluido viscoso, que contiene almidón, en el que opcionalmente el fluido se 15 elimina de la formación subterránea a la superficie del pozo.
  15. 15. Un método para producir azúcar que comprende
    (A) poner en contacto una composición que tiene un enlace α-1,4-glucosídico con un polipéptido que tiene actividad de alfa amilasa,
    en el que el polipéptido comprende (a) una secuencia de aminoácidos codificada por la secuencia de ácidos 20 nucleicos de la reivindicación 1, o, (b) una secuencia de aminoácidos de la reivindicación 5; o
    (B) el método de (A), en el que el procesamiento de papel o pulpa comprende adicionalmente uso de un segundo polipéptido que comprende una segunda amilasa, una alfa amilasa, o una beta amilasa, otra enzima o una combinación de las mismas.
ES10184478.5T 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas Expired - Lifetime ES2650636T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US27049601P 2001-02-21 2001-02-21
US27049501P 2001-02-21 2001-02-21
US270495P 2001-02-21
US270496P 2001-02-21
US29112201P 2001-05-14 2001-05-14
US291122P 2001-05-14

Publications (1)

Publication Number Publication Date
ES2650636T3 true ES2650636T3 (es) 2018-01-19

Family

ID=27402294

Family Applications (4)

Application Number Title Priority Date Filing Date
ES09171688.6T Expired - Lifetime ES2613277T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas.
ES10184415.7T Expired - Lifetime ES2604329T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
ES10184381.1T Expired - Lifetime ES2637501T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
ES10184478.5T Expired - Lifetime ES2650636T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES09171688.6T Expired - Lifetime ES2613277T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas.
ES10184415.7T Expired - Lifetime ES2604329T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
ES10184381.1T Expired - Lifetime ES2637501T3 (es) 2001-02-21 2002-02-21 Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas

Country Status (16)

Country Link
US (10) US7273740B2 (es)
EP (8) EP2333099B1 (es)
JP (9) JP2004533220A (es)
CN (3) CN104593394A (es)
AT (1) ATE510023T1 (es)
AU (3) AU2002240489C1 (es)
BR (1) BRPI0207770A8 (es)
CA (6) CA2438205C (es)
CY (1) CY1111771T1 (es)
DK (4) DK2333097T3 (es)
ES (4) ES2613277T3 (es)
HK (1) HK1060373A1 (es)
MX (1) MXPA03007527A (es)
PT (1) PT1370674E (es)
WO (2) WO2002068597A2 (es)
ZA (2) ZA200306486B (es)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040005673A1 (en) * 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
ATE439437T1 (de) * 1999-01-05 2009-08-15 Univ Boston Verbessertes klonierungsverfahren
US7435562B2 (en) 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
WO2002008408A2 (en) * 2000-07-21 2002-01-31 Trustees Of Boston University Modular vector systems
US7560126B2 (en) 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
CA2438205C (en) * 2001-02-21 2015-11-03 Diversa Corporation Enzymes having alpha amylase activity and methods of use thereof
US7659102B2 (en) 2001-02-21 2010-02-09 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
DE10138753B4 (de) * 2001-08-07 2017-07-20 Henkel Ag & Co. Kgaa Wasch- und Reinigungsmittel mit Hybrid-Alpha-Amylasen
CA2457477C (en) * 2001-08-27 2014-07-08 Syngenta Participations Ag Self-processing plants and plant parts
US7741092B2 (en) 2002-10-31 2010-06-22 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
ES2278210T3 (es) * 2002-12-17 2007-08-01 Novozymes A/S Alfa-amilasas termoestables.
EP3023498B1 (en) * 2003-03-06 2018-11-28 BASF Enzymes LLC Amylases, nucleic acids encoding them and methods for making and using them
AU2015218541A1 (en) * 2003-03-06 2015-10-29 Basf Enzymes Llc Amylases, nucleic acids encoding them and methods for making and using them
WO2004091544A2 (en) 2003-03-06 2004-10-28 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
MXPA05009353A (es) * 2003-03-10 2005-11-04 Genencor Int Composiciones de grano que contienen isomalto-oligosacaridos pre-bioticos y metodos para la elaboracion y uso de las mismas.
PL1654355T3 (pl) 2003-06-13 2010-09-30 Dupont Nutrition Biosci Aps Warianty polipeptydów Pseudomonas o aktywności niemaltogennej egzoamylazy i ich zastosowanie do wytwarzania produktów żywnościowych
ATE549403T1 (de) * 2003-06-25 2012-03-15 Novozymes As Enzyme zur stärkeverarbeitung
AU2004252572B2 (en) * 2003-06-25 2011-09-08 Novozymes A/S Polypeptides having alpha-amylase activity and polypeptides encoding same
US7618795B2 (en) 2003-06-25 2009-11-17 Novozymes A/S Starch process
US8143048B2 (en) 2003-07-07 2012-03-27 Danisco A/S Exo-specific amylase polypeptides, nucleic acids encoding those polypeptides and uses thereof
CN102796717A (zh) * 2003-07-07 2012-11-28 金克克国际有限公司 外切特异性的淀粉酶多肽、编码那些多肽的核酸及其应用
US7169257B2 (en) * 2003-11-12 2007-01-30 Kemira Chemicals, Inc. Method of deinking waste paper using a reduced alkali system
CA2558603A1 (en) * 2004-03-08 2005-10-20 Syngenta Participations Ag Self-processing plants and plant parts
US20050257932A1 (en) * 2004-05-19 2005-11-24 Davidson Eric A Filter cake degradation compositions and associated methods
AU2011203198B2 (en) * 2004-07-07 2013-01-10 Dupont Nutrition Biosciences Aps Polypeptide
ES2648900T3 (es) * 2004-07-07 2018-01-08 Dupont Nutrition Biosciences Aps Variantes de exoamilasa
US20060084150A1 (en) * 2004-09-29 2006-04-20 Qunyu Gao Method for manufacturing maltose-rich products
CA2590245A1 (en) * 2004-11-11 2006-05-18 Modular Genetics, Inc. Ladder assembly and system for generating diversity
DE602005025038D1 (de) 2004-12-22 2011-01-05 Novozymes As Seaminosäuresequenz und einem kohlenhydratbindenden modul als zweiter aminosäuresequenz
US20060147581A1 (en) 2004-12-22 2006-07-06 Novozymes A/S Hybrid enzymes
PT1868426T (pt) * 2005-03-16 2018-05-08 Syngenta Participations Ag Evento de milho 3272 e métodos para a sua deteção
US20070184472A1 (en) * 2005-06-08 2007-08-09 Toagosei Co., Ltd Method of purifying environmental dna and method of efficiently screening for protein-encoding gene from environmental dna
US8030050B2 (en) 2005-07-07 2011-10-04 Danisco A/S Modified amylases from Pseudomonas species
WO2007148224A2 (en) 2006-06-19 2007-12-27 Danisco A/S Polypeptide
US20080014616A1 (en) * 2006-07-11 2008-01-17 Kevin Jarrell Methods of introducing targeted diversity into nucleic acid molecules
BRPI0714876B1 (pt) * 2006-08-04 2022-04-19 Verenium Corporation Ácido nucleico isolado, sintético ou recombinante, cassete de expressão, vetor ou veículo de clonagem, célula bacteriana, fúngica ou de levedura transformada, polipeptídeo isolado, sintético ou recombinante, composição, bem como métodos de produção e de usos dos mesmos
US7808342B2 (en) * 2006-10-02 2010-10-05 Skyworks Solutions, Inc. Harmonic phase tuning filter for RF switches
CA2673525C (en) 2006-12-21 2017-12-05 Verenium Corporation Amylases and glucoamylases, nucleic acids encoding them and methods for making and using them
WO2008150880A1 (en) * 2007-06-01 2008-12-11 Syngenta Participations Ag Process for starch liquefaction and fermentation
US7727726B2 (en) * 2007-06-01 2010-06-01 Syngenta Participations Ag Process for starch liquefaction and fermentation
US7915020B2 (en) * 2007-06-01 2011-03-29 Syngenta Participations Ag Process for starch liquefaction and fermentation
EP2554666B1 (en) 2008-01-02 2015-08-05 Danisco US Inc. A process of obtaining ethanol without glucoamylase using pseudomonas saccharophila G4-amylase and variants thereof
US9816119B2 (en) * 2008-02-29 2017-11-14 Syngenta Participations Ag Methods for starch hydrolysis
CA2726631A1 (en) 2008-06-06 2009-12-10 Danisco Us Inc. Saccharification enzyme composition and method of saccharification thereof
US9090887B2 (en) * 2008-06-06 2015-07-28 Danisco Us Inc. Variant alpha-amylases from Bacillus subtilis and methods of use, thereof
EP2698434A1 (en) 2008-06-06 2014-02-19 Danisco US Inc. Uses of an alpha-amylase from Bacillus subtilis
US7666457B1 (en) 2008-08-19 2010-02-23 Delavau Llc Dry mixes comprising glycerine
CN102341495A (zh) * 2009-03-10 2012-02-01 丹尼斯科美国公司 巨大芽孢杆菌菌株DSM90相关的α-淀粉酶及其使用方法
MX2011010041A (es) * 2009-04-01 2011-11-18 Danisco Us Inc Composiciones y metodos que comprenden variantes de alfa-amilasa con propiedades alteradas.
DK3591046T3 (da) * 2009-05-19 2021-07-26 Dupont Nutrition Biosci Aps Amylasepolypeptide
EP2461702B1 (en) * 2009-08-07 2018-11-21 Danisco US Inc. Alpha-amylase blend for starch processing and method of use thereof
US20120202265A1 (en) * 2009-10-23 2012-08-09 Vivek Sharma Methods for reducing blue saccharide
CN103261408A (zh) * 2010-01-25 2013-08-21 先正达参股股份有限公司 与具有木聚糖酶与纤维素酶活性的双活性酶有关的组合物和方法
US20140206026A1 (en) * 2011-06-30 2014-07-24 Novozymes A/S Method for Screening Alpha-Amylases
US9672126B2 (en) 2011-12-15 2017-06-06 Sybase, Inc. Hybrid data replication
US20130159253A1 (en) * 2011-12-15 2013-06-20 Sybase, Inc. Directing a data replication environment through policy declaration
GB2499463B (en) * 2012-01-31 2014-04-02 Verenium Corp Reduced sugar syrups and methods of making reduced sugar syrups
EP4026902A1 (en) 2012-06-08 2022-07-13 Danisco US Inc. Variant alpha amylases with enhanced activity on starch polymers
CN105189773B (zh) 2013-03-15 2019-10-25 粮食加工公司 低聚麦芽糖的制备
WO2015050724A1 (en) * 2013-10-03 2015-04-09 Danisco Us Inc. Alpha-amylases from a subset of exiguobacterium, and methods of use, thereof
EP3280271A4 (en) 2015-04-10 2019-04-10 Syngenta Participations AG ANIMAL FEED COMPOSITIONS AND METHODS OF USE
EP3334862A2 (en) 2015-08-14 2018-06-20 Basf Se Aqueous surface treatment composition for paper and board
FR3045055B1 (fr) 2015-12-10 2020-02-21 Roquette Freres Hydrolysat d'amidon de basse viscosite presentant un comportement a la retrogradation ameliore
CN108431219A (zh) * 2015-12-18 2018-08-21 巴斯夫酶有限责任公司 α-淀粉酶的液体制剂
DE102016208466A1 (de) 2016-05-18 2017-11-23 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Rhizoctonia solani
DE102016209880A1 (de) 2016-06-06 2017-12-07 Henkel Ag & Co. Kgaa Neue Amylasen
WO2017220787A1 (en) * 2016-06-24 2017-12-28 Evaxion Biotech Aps Vaccines against aearomonas salmonicida infection
CN106011107B (zh) * 2016-06-30 2019-09-10 安徽工程大学 一种耐碱性α-淀粉酶及其基因工程菌的构建方法和应用
CA3036575A1 (en) 2016-09-16 2018-03-22 Basf Se Methods of modifying pulp comprising cellulase enzymes and products thereof
DE102016221851A1 (de) 2016-11-08 2018-05-09 Henkel Ag & Co. Kgaa Amylase für Wasch- und Reinigungsmittelanwendungen
EP3638763A4 (en) * 2017-06-16 2021-04-28 BASF Enzymes LLC PROCESS FOR INCREASING THE OIL YIELD IN THE PRODUCTION OF ETHANOL
EP3694339A4 (en) 2017-10-12 2021-07-21 Syngenta Participations AG IMPROVED FEEDING COMPOSITIONS AND METHODS OF USE
CA3076578A1 (en) 2017-10-25 2019-05-02 Basf Se Beta-amylase enzymes
DE102017220757A1 (de) 2017-11-21 2019-05-23 Henkel Ag & Co. Kgaa Amylase und eine solche enthaltendes Wasch- oder Reinigungsmittel
BR112020018530A2 (pt) * 2018-03-13 2020-12-29 Lallemand Hungary Liquidity Management Llc. Levedura que expressa alfa-amilases termostáveis para hidrólise de amido
CN112368375A (zh) 2018-04-26 2021-02-12 巴斯夫欧洲公司 脂肪酶
WO2019211143A1 (en) 2018-05-03 2019-11-07 Basf Se Amylase enzymes
US11530427B2 (en) * 2018-05-25 2022-12-20 Basf Se Uses of surfactants in starch processing
DE102018208445A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Fomitopsis pinicola (Fpi)
DE102018208444A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Trametes hirsuta (Thi)
EP3802813A1 (en) 2018-05-29 2021-04-14 Basf Se Amylase enzymes
DE102018208443A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase Irpex lacteus (IIa)
DE102018208446A1 (de) 2018-05-29 2019-12-05 Henkel Ag & Co. Kgaa Verbesserte Waschleistung durch eine neue alpha-Amylase aus Fomes fomentarius (Ffo)
CN114096676A (zh) 2019-02-20 2022-02-25 巴斯夫欧洲公司 用确定成分培养基和镁补料的芽孢杆菌工业发酵工艺
MX2021010109A (es) 2019-02-20 2021-09-21 Basf Se Proceso de fermentacion industrial para bacillus mediante el uso de un medio definido y una alimentacion de oligoelementos.
EP3938504A1 (en) 2019-03-11 2022-01-19 Basf Se Amylases and methods for making and using them
US20220162576A1 (en) 2019-03-25 2022-05-26 Basf Se Amylase enzymes
WO2020193532A1 (en) 2019-03-25 2020-10-01 Basf Se Cleaning composition having amylase enzymes
EP3947664A2 (en) 2019-03-25 2022-02-09 Basf Se Amylase enzymes
EP3958890A4 (en) 2019-04-23 2023-05-03 Basf Se BETA-AMYLASE VARIANTS
US11352854B2 (en) 2019-05-13 2022-06-07 Halliburton Energy Services, Inc. Injectivity and production improvement in oil and gas fields
EP3983425A1 (en) 2019-06-13 2022-04-20 Basf Se Method of recovering a protein from fermentation broth using a divalent cation
WO2021004830A1 (en) 2019-07-05 2021-01-14 Basf Se Industrial fermentation process for microbial cells using a fed-batch pre-culture
US20220267748A1 (en) 2019-08-22 2022-08-25 Basf Se Amylase variants
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3847740A (en) * 1972-10-02 1974-11-12 Cpc International Inc Process for the production of levulose-bearing syrups
JPS5823799A (ja) 1981-08-03 1983-02-12 株式会社林原生物化学研究所 高純度マルト−スの製造方法
JPS5872598A (ja) * 1981-10-26 1983-04-30 Hayashibara Biochem Lab Inc 高純度イソマルト−スの製造方法
US4557927A (en) * 1983-03-10 1985-12-10 Kabushiki Kaisha Hoyashibara Food products and process for producing same
ATE93541T1 (de) 1985-07-03 1993-09-15 Genencor Int Hybride polypeptide und verfahren zu deren herstellung.
JPS62104580A (ja) 1985-10-30 1987-05-15 Kunio Yamane 高耐熱性酵素発現dna
CA1272150A (en) * 1985-12-03 1990-07-31 Paul Ducroo Production of glucose syrups and purified starches from wheat and other cereal starches containing pentosans
GB8609288D0 (en) * 1986-04-16 1986-05-21 Ici Plc Debranching enzyme
DK311186D0 (da) 1986-06-30 1986-06-30 Novo Industri As Enzymer
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
JP2696537B2 (ja) 1988-10-28 1998-01-14 東和化成工業株式会社 高純度マルトースの製造方法
EP0528881A4 (en) 1990-04-24 1993-05-26 Stratagene Methods for phenotype creation from multiple gene populations
US6582908B2 (en) * 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
EP0599859A1 (en) 1991-06-25 1994-06-08 Novo Nordisk A/S Mammalian pancreatic lipase and variant thereof
EP0691344B1 (en) 1992-12-28 2003-03-19 Kabushiki Kaisha Hayashibara Seibutsu Kagaku Kenkyujo Purification of trehalose
DE69415659T3 (de) 1993-02-11 2010-05-12 Genencor International, Inc., Palo Alto Oxidativ stabile alpha-amylase
JP3559585B2 (ja) 1993-06-03 2004-09-02 株式会社林原生物化学研究所 トレハロース遊離酵素とその製造方法並びに用途
JPH07143880A (ja) * 1993-10-01 1995-06-06 Takara Shuzo Co Ltd 超耐熱性α−アミラーゼ遺伝子
EP0648843A1 (en) 1993-10-01 1995-04-19 Takara Shuzo Co. Ltd. DNA encoding a hyperthermostable alpha-amylase
WO1995010603A1 (en) * 1993-10-08 1995-04-20 Novo Nordisk A/S Amylase variants
CN1114613C (zh) 1995-06-02 2003-07-16 诺沃奇梅兹有限公司 蛋白质溶液的铝/铁处理和膜浓缩方法
US5736499A (en) 1995-06-06 1998-04-07 Genencor International, Inc. Mutant A-amylase
JPH09173077A (ja) * 1995-07-20 1997-07-08 Tadayuki Imanaka 超耐熱性酸性α−アミラーゼおよび該α−アミラーゼ産生遺伝子を含むDNA断片
US6479258B1 (en) * 1995-12-07 2002-11-12 Diversa Corporation Non-stochastic generation of genetic vaccines
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
CN1222938A (zh) * 1996-05-14 1999-07-14 金克克国际有限公司 经修饰具有改变了的钙离子吉合性质的α-淀粉酶
US5789228A (en) * 1996-05-22 1998-08-04 Diversa Corporation Endoglucanases
AU4551097A (en) * 1996-10-11 1998-05-11 Novo Nordisk A/S Alpha-amylase fused to cellulose binding domain, for starch degradation
AU7107798A (en) * 1997-04-09 1998-10-30 Michigan State University Hyperthermostable alpha-amylase
US6204232B1 (en) * 1997-10-30 2001-03-20 Novo Nordisk A/S α-amlase mutants
AUPP209298A0 (en) * 1998-03-02 1998-03-26 Uniphase Fibre Components Pty Limited Grating writing techniques
FR2778412B1 (fr) * 1998-05-05 2002-08-09 Univ Reims Champagne Ardennes Procede pour preparer une enzyme alpha-amylase thermophile et enzyme ainsi obtenue
CA2336135A1 (en) 1998-06-24 1999-12-29 Aventis Pharma Deutschland Gmbh Mumbaistatin, a process for its production and its use as a pharmaceutical
CN1309835C (zh) 1998-06-25 2007-04-11 应用植物公司 植物可选择标记物和植物转化方法
WO2000058508A2 (en) 1999-03-25 2000-10-05 Genset Biallelic markers related to genes involved in drug metabolism
ES2496568T3 (es) * 1999-03-30 2014-09-19 Novozymes A/S Variantes de alfa-amilasa
TWI315741B (en) * 2000-05-22 2009-10-11 Hayashibara Biochem Lab A-isomaltosyltransferase, process for producing the same and use thereof
WO2002029079A2 (en) 2000-10-04 2002-04-11 Maxygen, Inc. Enantioselective production of amino carboxylic acids
CA2438205C (en) 2001-02-21 2015-11-03 Diversa Corporation Enzymes having alpha amylase activity and methods of use thereof
US7560126B2 (en) * 2001-02-21 2009-07-14 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
US7659102B2 (en) * 2001-02-21 2010-02-09 Verenium Corporation Amylases, nucleic acids encoding them and methods for making and using them
DE10131441A1 (de) 2001-06-29 2003-01-30 Henkel Kgaa Eine neue Gruppe von alpha-Amylasen sowie ein Verfahren zur Identifizierung und Gewinnung neuer alpha-Amylasen
US20030082595A1 (en) 2001-08-03 2003-05-01 Bo Jiang Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use
CA2457477C (en) 2001-08-27 2014-07-08 Syngenta Participations Ag Self-processing plants and plant parts
US20040025917A1 (en) * 2002-08-06 2004-02-12 Jeremy Gin Mobility-aid apparatus and method using tabs on non-boundary region
WO2004091544A2 (en) * 2003-03-06 2004-10-28 Diversa Corporation Amylases, nucleic acids encoding them and methods for making and using them
EP2358873B2 (en) 2008-12-15 2018-02-21 Danisco US Inc. Hybrid alpha-amylases
US8857799B2 (en) 2011-05-12 2014-10-14 Sealy Technology, Llc Advanced conformance encased coil spring units
CN105452839B (zh) 2013-06-21 2019-01-15 伯乐生命医学产品有限公司 具有流体收集管的微流体系统

Also Published As

Publication number Publication date
US7781201B2 (en) 2010-08-24
EP2333098A3 (en) 2011-09-07
JP2011172566A (ja) 2011-09-08
EP1392815A4 (en) 2005-09-21
US8334118B2 (en) 2012-12-18
EP2333098A2 (en) 2011-06-15
US20100047392A1 (en) 2010-02-25
ZA201008280B (en) 2019-12-18
JP5576718B2 (ja) 2014-08-20
US10047350B2 (en) 2018-08-14
US7785855B2 (en) 2010-08-31
JP5719621B2 (ja) 2015-05-20
EP2292784A2 (en) 2011-03-09
EP3305894A1 (en) 2018-04-11
CA2438205A1 (en) 2002-09-06
JP2008142080A (ja) 2008-06-26
DK2169076T3 (en) 2017-02-06
CA2833423A1 (en) 2002-09-06
EP2169076A3 (en) 2010-06-30
CN101724640A (zh) 2010-06-09
JP2017074070A (ja) 2017-04-20
HK1060373A1 (en) 2004-08-06
JP2004533220A (ja) 2004-11-04
US7407677B2 (en) 2008-08-05
MXPA03007527A (es) 2004-07-30
EP1392815B1 (en) 2013-06-26
BR0207770A (pt) 2004-12-07
EP2333097A2 (en) 2011-06-15
JP2010263897A (ja) 2010-11-25
JP2019010100A (ja) 2019-01-24
EP2333099A2 (en) 2011-06-15
AU2002240489C1 (en) 2009-02-05
CA2438884A1 (en) 2002-09-06
CN101724640B (zh) 2014-10-15
WO2002068597A2 (en) 2002-09-06
EP2292784A3 (en) 2011-06-22
ES2604329T3 (es) 2017-03-06
BRPI0207770A8 (pt) 2017-12-12
DK1370674T3 (da) 2011-08-29
WO2002068589A3 (en) 2003-10-23
AU2006207843B2 (en) 2010-03-04
EP1370674A2 (en) 2003-12-17
AU2006207843C1 (en) 2010-07-29
EP2169076A2 (en) 2010-03-31
EP2333099B1 (en) 2017-11-01
DK2333097T3 (da) 2017-08-28
JP2014230543A (ja) 2014-12-11
US20130224800A1 (en) 2013-08-29
EP1370674A4 (en) 2004-10-20
AU2002240489B2 (en) 2006-01-12
CA3032990A1 (en) 2002-09-06
JP4846760B2 (ja) 2011-12-28
CN104593394A (zh) 2015-05-06
EP2169076B1 (en) 2016-11-02
JP2004533219A (ja) 2004-11-04
EP2333097A3 (en) 2011-10-12
EP2333098B1 (en) 2016-08-24
US20080032378A1 (en) 2008-02-07
JP4690381B2 (ja) 2011-06-01
EP1370674B1 (en) 2011-05-18
AU2009222426A1 (en) 2009-10-15
CN100577809C (zh) 2010-01-06
ZA200306486B (en) 2011-01-26
CA2833423C (en) 2019-03-19
EP2333099A3 (en) 2011-09-07
US20180334660A1 (en) 2018-11-22
CN1513059A (zh) 2004-07-14
CA3032990C (en) 2020-07-14
US7666633B2 (en) 2010-02-23
JP2008206525A (ja) 2008-09-11
CY1111771T1 (el) 2015-10-07
US20070161099A1 (en) 2007-07-12
EP2333097B1 (en) 2017-05-17
ES2613277T3 (es) 2017-05-23
DK2333099T3 (da) 2017-11-27
US20160264951A1 (en) 2016-09-15
US20030170634A1 (en) 2003-09-11
WO2002068589A2 (en) 2002-09-06
ES2637501T3 (es) 2017-10-13
JP6305866B2 (ja) 2018-04-04
US20080047037A1 (en) 2008-02-21
JP6402205B2 (ja) 2018-10-10
WO2002068597A3 (en) 2003-10-02
PT1370674E (pt) 2011-08-31
EP1392815A2 (en) 2004-03-03
CA2897239A1 (en) 2002-09-06
CA2438884C (en) 2014-01-28
US20060234280A1 (en) 2006-10-19
US7816108B2 (en) 2010-10-19
ATE510023T1 (de) 2011-06-15
US20030125534A1 (en) 2003-07-03
AU2009222426B2 (en) 2012-07-12
CA2438205C (en) 2015-11-03
CA3081363A1 (en) 2002-09-06
US7273740B2 (en) 2007-09-25
AU2006207843A1 (en) 2006-09-28

Similar Documents

Publication Publication Date Title
ES2650636T3 (es) Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
AU2015221461B2 (en) Enzymes having alpha amylase activity and methods of use thereof
AU2012238328B2 (en) Enzymes having alpha amylase activity and methods of use thereof
BRPI0207770B1 (pt) Enzimas tendo atividade de alfa amilase, preparação compreendendo as mesmas, polinucleotídeos codificando as referidas enzimas, vetores, células hospedeiras, métodos de produção das referidas enizimas, método de hidrolisar uma ligação de amido, produzir um xarope, liquefação do amido, tratamento de fibras lignocelulósicas, para desengomar o tecido, lavar um objeto, detergente aditivo
BR122014028244B1 (pt) ácido nucléico codificando um polipeptídeo com atividade amilase, vetor e célula compreendendo o mesmo, o referido polipeptídeo, seu uso, bem como métodos para produzir o polipeptídeo, para hidrolisar uma ligação alfa-1,4-glicosídica, para liquefazer uma composição contendo amido, tratamento de fibras lignocelulósicas, preparação de uma composição de ração, produção de um álcool, moagem úmida de milho, de campo de petróleo, e para a produção de açúcar
AU2002253986A1 (en) Enzymes having alpha amylase activity and methods of use thereof