MXPA06001725A - Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados. - Google Patents

Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados.

Info

Publication number
MXPA06001725A
MXPA06001725A MXPA06001725A MXPA06001725A MXPA06001725A MX PA06001725 A MXPA06001725 A MX PA06001725A MX PA06001725 A MXPA06001725 A MX PA06001725A MX PA06001725 A MXPA06001725 A MX PA06001725A MX PA06001725 A MXPA06001725 A MX PA06001725A
Authority
MX
Mexico
Prior art keywords
polypeptide
seq
amino acid
hhdh
acid sequence
Prior art date
Application number
MXPA06001725A
Other languages
English (en)
Inventor
Vesna Gavrilovic
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of MXPA06001725A publication Critical patent/MXPA06001725A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)

Abstract

La presente invencion se refiere a polipeptidos de halohidrina deshalogenasa y a los polinucleotidos que los codifican; estos polipeptidos son utiles en la produccion de derivados del acido 4-sustituido-3-butirico y esteres del acido carboxilico hidroxi sustituido, ciano vecinal; la invencion tambien provee vectores relacionados, celulas huesped y metodos.

Description

HALOHIDRINA DESHALOGENASAS MEJORADAS Y POUNUCLEOTIDOS RELACiONADOS CAMPO DE LA INVENCION La presente invención se refiere a polipéptidos de halohidrina deshalogenasa y los polín ucleótidos que los codifican.
ANTECEDENTES DE LA INVENCION La halohidrona deshalogenasa ("HHDH"), también llamada halohidrina hidrogeno-haluro-liasa o halohidrina hepoxidasa [EC4.5.1] cataliza la interconversión de 1 ,2-halohidrinas y los correspondientes 1 ,2-epóxidos: OH - HCi 0 + Cl" La patente de E.U.A No. 4,284,723 describe el uso de una halohidrina epoxidasa para la producción de óxido de etileno. La patente de E.UA Nos. 5,166,061 y 5,210,031 describen el uso de esta actividad enzimática para la conversión de 1 ,3-dicloropropanol (DCP) y epiclorohidrina (ECH) respectivamente a 4-cloro-3-hidroxibutironitrilo (CHBN). Las enzimas de HHDH de Agrobacterium radiobacter y Corynebacteríum se han caracterizado en una escala amplia de sustratos halogenados (Van Hylckama Vlieg et al., J. Bacterial. (2001) 183:5058-5066; Nakamura et ai, Appl.
Environ. Microbiol. (1994) 60:1297-1301 ; Nagasawa et al., Appl. Microbiol. Biotechnol. (1992) 36:478-482). La HHDH también cataliza la abertura de anillo de epoóxidos con nucleófilos diferentes del cloruro o bromuro. Se ha demostrado que la azida (N3"), nitrito (N02") y cianuro (CN") pueden reemplazar el cloruro en la abertura de epóxidos (ver Nakamura et al., Biochem. Biophys Res. Comm. (1991) 180:124-130; Nakamura et al., Tetrahedron (1994) 50: 1821-11826; Lutje Spelberg et al., Orq. Lett. (2001) 3:41-43; Lutje Spelberg et al., Tetrahedron Assvm. (2002) 13:1083): Nakamura et al. (Tetrahedron (1994) 50: 1821-11826) describe el uso de la HHDH para la conversión directa de DCP a cloro-3-hidroxi-butironitrilo (CHBN) a través de epiclorohidrina (ECH) como el intermedio: Algunas halohidrina deshalogenasas se han caracterizado. Por ejemplo, la HHDH de A. radiobacter ADI es un homotetrámero de subunidades 28 kD. Corynebacterium sp. N-1074 produce dos enzimas HHDH, una de las cuales se compone de subunidades 28 kD (la), mientras que la otra se compone de subunidades relacionadas de 35 y/o 32 kD (Ib). La HHDH de algunas fuentes fácilmente se inactiva bajo condiciones de oxidación en un procedimiento que lleva a la disociación de las subunidades, tiene un H óptimo de pH 8 a 9 y una temperatura óptima de 50°C (Tang Enz. icrobial Technol. (2002) 30:251-258; Swanson, Curr. Opin. Biotechnol. (1999) 10:365-369). El pH óptimo para la formación epoxidica catalizada con HHDH se ha referido como 8.0 a 9.0 y la temperatura óptima en la escala de 45°C a 55°C (Van Hylckama Vlieg et al., J. Bacteriol. (2001) 183:5058-5066; Nakamura et al., Appl. Environ. icrobiol. (1994) 60:1297-1301 ; Nagasawa et al., Appl. Microbiol. Biotechnol. (1992) 36:478-482). El pH óptimo para la reacción inversa, la abertura de anillo mediante cloruro, se ha reportado para las dos enzimas N-1074 Corynebacterium sp. y es 7.4 (la) o 5 (Ib). Los estudios de mutagénesis dirigida al sitio en la HHDH AD1 A. radiobacter indican que la inactivación oxidativa se debe a la fractura de la estructura cuaternaria de la enzima a través de oxidación de residuos cisterna (Tang et al., Enz. Microbial Technol. (2002) 30:251-258). Las enzimas HHDH purificadas de diferentes fuentes exhiben actividades sobre DCP que varían de 146 U/mg (Ib) a 2.75 U/mg (la) (Nakamura et al., Appl. Environ. Microbiol. 1994 60:1297-1301 ; Nagasawa et al., Appl. Microbiol. Biotechnol. (1992) 36:478-482). La actividad alta de la enzima Ib se acompaña por una enantioselectividad alta para producir R-ECH a partir de DCP, mientras que la enzima la produce ECH racémica. Los genes que codifican para HHDH se ha identificado en Agrobacterium radiobacter AD1 {hheC), Agrobacterium tumefaciens (halB), Corynebacterium sp {hheA que codifica para la y hheB que codifica para Ib), Arthrobacter sp. {hheAADz), y Mycobacterium sp. GP1 (hheBQpi). Todas las enzimas se han expresado funcionalmente en E. coli. Es altamente aconsejable para las aplicaciones comerciales de HHDH, que la enzima exhiba una alta productividad volumétrica, que las reacciones se corran hasta su terminación en un periodo de tiempo relativamente corto, con una concentración de producto final alta, con alta enantioselectividad, y que no se formen productos secundarios químicos. Estas características de un procedimiento generalmente se pueden usar para definir las características amplias de la enzima: Km bajo para el o los sustratos, alta estabilidad del procedimiento, alta actividad específica, no inhibición de sustrato y producto bajo condiciones donde las reacciones químicas no proceden. Las enzimas de HHDH disponibles actualmente no satisfacen todos estos criterios. Por ejemplo, la conversión en 1 ,2-epoxibutano y cianuro a 3-hidroxivaleronitrilo mediante HHDH procede a una velocidad máxima de 3 mmol/hr y esta velocidad es mantenida solamente por 10 minutos (Nakamura et al., Biochem Biophvs Res. Comm. (1991) 180:124-" 130). La conversión de DCP y ECH a 4-cloro-3-hidroxibutironitrilo (CHBN) también se limita a velocidades de 2-3 mmol/hr (Nakamura, patente de E.U.A Nos. 5,166,061 y 5,210,031). En un análisis profundo de la conversión de ECH a CHBN revela que mientras la enzima HHDH-lb codificada por hheB tiene alta actividad, una alta productividad se mantiene solamente durante 20 minutos después de los cuales se presenta una conversión adicional a una velocidad que es por lo menos 50 veces más lenta, con la conversión total justo sobre el 60% (nakamura et al., Tetrahedron (1994) 50:11821-11826). La conversión directa de DCP, a través de ECH a CHBN procede a una velocidad reducida y resulta en un rendimiento del 65.3%. De esta forma, HHDH según se describe en la literatura no satisface los criterios deseados para un catalizador en aplicaciones comerciales. En consecuencia, las halohidrina deshalogenasas novedosas son altamente deseadas.
BREVE DESCRIPCION DE LA INVENCION La presente invención se refiere a un polipéptido, normalmente un polipéptido aislado y opcionalmente purificado (más típicamente, un polipéptido recombinante) que tiene actividad de halohidrina deshalogenasa, en donde el polipéptido comprende una secuencia de aminoácidos seleccionada del grupo que consta de: ( (a) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 99% idéntica a SEQ ID NO: 4, 12, 16, 18, 34, 38, 44, 48, 52, 66, 80, 84, 114, 154, 158, 170 o 270; (b) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 98% idéntica a la SEQ ID NO: 10, 14, 68, 118, 164, 166 o 180; (c) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 97% idéntica a la SEQ ID NO: 110, 162, 262, 422, 440 ó 520; (d) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 96% idéntica a la SEQ ID NO: 116 ó 448; (e) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 95% idéntica a la SEQ ID NO: 264, 266, 470 ó 476; (f) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 93% idéntica a la SEQ ID NO: 200; (g) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 89% idéntica a la SEQ ID NO: 442; (h) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 88% idéntica a la SEQ ID NO: 702; (i) un polipéptido que es por lo menos 80% idéntico a la SEQ ID NO: 2, cuando se alinea óptimamente con la SEQ ID NO: 2, y el cual comprende por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A o P o S en la posición 3, V en la posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31 , G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 6 , V en ia posición 63, R en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91, D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, S o G en la posición 114, A en a posición 115, P en la posición 117, N en la posición 120, E en la posición 121, P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, l o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181, K en la posición 184, Y en la posición 186, L en la posición 194, N en la posición 198, M en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254; (j) un polipéptido codificado mediante un ácido nucleico que hibridiza bajo condiciones severas sustancialmente sobre toda la longitud de un ácido nucleico que corresponde a SEQ ID NO: 1, y en donde el polipéptido codificado, cuando se alinea óptimamente con SEQ ID NO: 2, comprende una secuencia de aminoácidos que tiene por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A, P o S en la posición 3, V en a posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de S o K o C en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 6 , V en la posición 63, R o Q en la posición 72, 1 en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91, D en la posición 93, Q o G en la posición 95, N en la posición 96, G en la posición 99, K en la posición 107, A en la posición 112, cualquiera de T, G o S en la posición 1 4, A en la posición 115, P en la posición 117, N en la posición 120, E en la posición 121, P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 52, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G en la posición 181, K en la posición 184, Y en la posición 186, T en la posición 189, L en la posición 194, N en la posición 198; M en la posición 199, E en la posición 215, A en la posición 222, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, V o I en la posición 252, y V en la posición 254. En otro aspecto, la presente invención se refiere a un polipéptido normalmente un polipéptido aislado y opcionalmente purificado (más típicamente, un polipéptido recombinante) que tiene HHDH, en donde el polipéptido comprende una secuencia de aminoácidos seleccionada del grupo que consiste de: (a), (b), (c), (d), (e), (f), (g), (h), (i) y (j) como se describió anteriormente, y además comprende un residuo de aminoácido seleccionado del grupo que consiste de Q en la posición 37, Y en la posición 70, Q en la posición 72, Q en la posición 80, G en la posición 99, R en la posición 107, T en la posición 146, C en la posición 153, F en la posición 186, T en la posición 189, y A en la posición 222. En otro aspecto, la presente invención se refiere a halohidrina deshalogenasas (HHDH) que tienen de 1.4 veces a 10,000 veces mayor actividad en comparación a la halohidrina deshalogenasa de tipo silvestre de Agrobacteríum sp. (SEQ ID NO: 2). En un aspecto adicional, la presente invención se refiere a un polipéptido aislado o recombinante que tiene por lo menos 1.4 veces más de actividad HHDH en comparación con la HHDH de tipo silvestre que tiene la secuencia de aminoácidos de SEQ ID NO: 2 y en donde el polipéptido es codificado por un ácido nucleico que hibridiza bajo condiciones severas sobre sustancialmente toda la longitud de un ácido nucleico que tiene una secuencia seleccionada del grupo que consta de SEQ ID NO: 3, 9, 11 , 13, 15, 17, 33, 37, 43, 47, 49, 51 , 65, 67, 79, 83, 109, 113, 115, 117, 153, 157, 161, 163, 165, 169, 179, 161, 199, 261, 263, 265, 269, 421, 439, 441, 447, 469, 475, 519, 701, 725, 729, 731, 733, 735, 737, y secuencias complementarias de las mismas. En otro aspecto, la presente invención se refiere a polinucleótidos de HHDH que codifican polipéptidos que tiene actividad de halohidrina deshalogenasa. Aún en otro aspecto adicional, la presente invención se refiere a un vector que comprende un polinucleótido de HHDH de la presente invención unido operativamente a un promotor. En otras modalidades, la presente invención se refiere a células huésped y métodos para la producción de polipéptidos de HHDH de la presente invención a partir de tales células huésped.
BREVE DESCRIPCION DE LAS FIGURAS La figura 1 es un vector de expresión 3944 bp (PCK 1 0700) de la presente invención que comprende un origen de replicación p15A (p15A ori), un represor lacl, un promotor T5, un sitio de unión ribosomal T7 (T7g10), y un gen de resistencia de cloramfenicol (camR). La figura 2 representa la conversión en porcentaje contra tiempo para las reacciones de (S)-4-cloro-3-hidroxibutirato de etilo con ácido hidrociánico acuoso en presencia de varias enzimas halohidrina deshalogenasa que se describen en los ejemplos 8 al 12.
DESCRIPCION DETALLADA DE LA INVENCION Polipéptidos de HHDH La presente invención provee polipéptidos novedosos que tienen actividad de halohidrina deshalogenasa ("HHDH"), así como los polinucleótidos que los codifican. Los polipéptidos de HHDH de la presente invención son adecuados para catalizar la conversión de derivados del ácido 4-halo-3-hidroxibutírico a derivados del ácido 4-sustituido-3-h¡droxibutírico, usando, por ejemplo, los métodos descritos en la solicitud de patente titulada ""Enzymatic Processes for the Production of 4-Substituted- 3-Hydroxybutyric Acid Derivatives", correspondiente al No. de caso 0339.210 US, presentado en agosto 11 de 2003 y con número de serie de U.S. asignado 10/639,159, que se incorpora por tanto en este documento para referencia. Estos polipéptidos de la invención también son adecuados para catalizar la conversión de ésteres del ácido carboxílico hidroxi sustituido, halógeno vecinal a ésteres del ácido carboxílico hidroxi sustituido, ciano vecinal usando, por ejemplo los métodos descritos en lá solicitud de patente titulada "Enzymatic Processes for the Production of 4-Substituted-3-Hydroxybutyric Acid Derivatives and Vicinal Cyano, Hydroxy Substituted Carboxylic Acid Esters,", correspondiente al No. de caso 0339.310 US, presentado en febrero 18 de 2004 y con numero de serie de U.S. asignado 10/782,258, que se incorpora por lo tanto aquí para referencia. Los polipéptidos de la presente invención son particularmente útiles como catalizadores para convertir halohidrinas a cianohidrinas, los cuales son útiles como intermedios farmacéuticos. En una aplicación específica, los polipéptidos de HHDH de la presente invención se usan para catalizar la conversión de etil-4-cloro-3-hidroxibutirato a etil-4-ciano-3-hidroxibutirato. Los ejemplos que ilustran dicha conversión se proveen posteriormente. Una descripción más detallada de dichos usos se provee en las solicitudes de patente anteriormente mencionadas tituladas, "Enzymatic Processes for the Production of 4-Substituted-3-Hydroxybutyric Acid Derivatives" y "Enzymatic Processes for the Production of 4-Substituted-3-Hydroxybutyric Acid Derivatives and Vicinal Cyano, Hydroxy Substituted Carboxylic Acid Esters". Id. La presente invención provee un polipéptido aislado o recombinante que tiene actividad de HHDH, en donde el polipéptido de HHDH comprende una secuencia de aminoácidos seleccionada del grupo que consiste de: un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 99% idéntica a la SEQ ID NO: 4, 12, 16, 18, 34, 38, 44, 48, 52, 66, 80, 84, 114, 154, 158, 170 ó 270. Como se usa en la presente, los términos "actividad de HHDH" y "actividad de halohidrina deshalogenasa" se usan de manera intercambiable aquí para referirse a la capacidad para catalizar la conversión de (S)-4-cloro-3-hidroxibutirato de etilo ("ECHB") a una cantidad detectable de (R)-4-ciano-3-hidroxibutirato de etilo (??") usando el ensayo descrito en el ejemplo 5A. El término "polipéptido de HHDH" se refiere aquí a un polipéptido que tiene actividad de HHDH. El término "polinucleótido de HHDH" se refiere a un polinucleótido que codifica un polipéptido que tiene actividad de HHDH. Como se usa aquí, el término "aislado" se refiere a un ácido nucleico, polinucleótido, polipéptido, proteína, u otro componente que está parcialmente o completamente separado de los componentes con los cuales normalmente se asocia (otras proteínas, ácidos nucleicos, células, reactivos sintéticos, etc.). Un ácido nucleico o polipéptido es "recombinante" cuando es artificial o diseñado, o derivado de una proteína o ácido nucleico artificial o diseñada. Por ejemplo, un polinucleótido que se inserta en un vector o cualquier otra ubicación heteróloga, por ejemplo, en un genoma de un organismo recombinante, de tal manera que no esté asociado con secuencias de nucleótido que normalmente flanquean el polinucleótido tal como se encuentra en la naturaleza, es un polipéptido recombinante. Una proteína expresada in vitro o in vivo de un polinucleótido recombinante es un ejemplo de un polipéptido recombinante. De manera similar, una secuencia de polinucleótido que no aparece en la naturaleza, por ejemplo una variante de un gen de origen natural, es recombinante. Los términos "por ciento de identidad", "% de identidad", "por ciento idéntico", y "% idéntico" se usan de manera intercambiable aquí para referirse al por ciento de identidad de la secuencia de aminoácidos que se obtiene mediante el análisis ClustalW (versión W 1.8 disponible de European Bioinformatics Institute, Cambridge, UK), que cuenta el número de parejas idénticas en el alineamiento y que divide dicho número de parejas idénticas por la longitud de la secuencia de referencia, y usando los siguientes parámetros de ClustalW predeterminados para lograr alineamientos óptimos en par lento/exacto - Penalidad por abertura de hueco: 10; Penalidad por extensión de hueco: 0.10; matriz de peso de proteína: series de Gonnet; matriz de peso de ADN: IUB; alineamientos en par lento/rápido articulado = alineamiento LENTO O COMPLETO La presente invención también provee un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 98% idéntica a la SEQ ID NO: 10, 14, 68, 118, 164, 166 ó 180. Los polipéptidos de HHDH deseables incluyen aquellos que son por lo menos 99% idénticos a la SEQ ID NO: 10, 14, 68, 118, 164, 166 0 180. En otra modalidad, la presente invención provee un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 97% idéntica a la SEQ ID NO: 110, 162, 262, 422, 440, ó 520. Algunos polipéptidos de HHDH de la presente invención son por lo menos 98%, y algunas veces por lo menos 99% idénticos a la SEQ ID NO: 110, 162, 262, 422, 440, ó 520. En aún otra modalidad, la presente invención se refiere a un polipéptido, usualmente un polipéptido aislado y purificado que tiene actividad de HHDH mayor que la actividad de HHDH de tipo silvestre de SEQ ID NO: 2, y que tiene una secuencia de aminoácidos que es por lo menos 93% idéntica a la SEQ ID NO: 200, usualmente, 95% idéntica a la SEQ ID NO: 200; más usualmente, 97% idéntica a la SEQ ID NO: 200, más típicamente, 99% idéntica a la SEQ ID NO: 200. En aún otra modalidad, la presente invención se refiere a un polipéptido, usualmente un polipéptido aislado y purificado que tiene actividad de HHDH mayor que la actividad de HHDH de tipo silvestre de SEQ ID NO: 2, y que tiene una secuencia de aminoácidos que es por lo menos 89% idéntica a la SEQ ID NO: 442, usualmente, 93% idéntica a la SEQ ID NO: 442; más usualmente, 95% idéntica a la SEQ ID NO: 442, aún más usualmente, 97% idéntica a la SEQ ID NO: 442, más usualmente, 99% idéntica a la SEQ ID NO: 442. En otra modalidad, la presente invención se refiere a un polipéptido usualmente un polipéptido aislado y purificado que tiene actividad de HHDH mayor que la actividad de HHDH de tipo silvestre de SEQ ID NO: 2, y que tiene una secuencia de aminoácidos que es por lo menos 88% idéntica a la SEQ ID NO: 702, usualmente, 93% idéntica a la SEQ ID NO: 702; más usualmente, 95% idéntica a la SEQ ID NO: 702, aún más usualmente, 97% idéntica a la SEQ ID NO: 702; más usualmente, 99% idéntica a la SEQ ID NO:702. En una modalidad adicional, la presente invención provee un polipéptido de HHDH que tiene una secuencia de aminoácidos que es por lo menos 96% idéntica a la SEQ ID NO: 6 ó 448. Los polipéptidos de HHDH de la presente invención incluyen aquellos que son por lo menos 97% idénticos, 98% idénticos, y 99% idénticos a la SEQ ID NO: 116 ó 448. La presente invención además provee un polipéptido de HHDH que tiene una secuencia de aminoácidos que es por lo menos 95% idéntica a la SEQ ID NO: 264, 266, 470 ó 476. Los polipéptidos de HHDH deseables de la presente invención incluyen aquellos que son por lo menos 96% idénticos, 97% idénticos, 98% idénticos, y 99% idénticos a la SEQ ID NO: 264, 266, 470 ó 476. La presente invención además provee un polipéptido de HHDH que es por lo menos 80% idéntico a la SEQ ID NO: 2, cuando óptimamente se alinea con la SEQ ID NO: 2, y que además tiene una o más sustituciones seleccionadas del grupo que consiste de S2T, cualquiera de T3A o T3P, A4V, V6D, cualquiera de V9I o V9F, K10L, G13S, G14S, M15K,G16C, cualquiera de S17T o S17R, cualquiera de R20S, R20C o R20K, A24T, H26Q, V28F, A29T, C30A, H31L, E33G, S34R, F35L, K36N, Q37H, E40D, F44L, A45P, cualquiera de T47P o T47A, K52N, M54V, S55R, E56D, E58K, cualquiera de E61G o E61D, I63V, Q72R, V75I, L76P, S78C, F82Y, cualquiera de P84S o P84L, E85Q, K91 E, A93D, E95Q o E95G, D96N, R107K, V112A, cualquiera de A114T o A114G o A114S, V115A, S117P, K120N, K121 E, R122P, H126R, I130V, A133S, T134A o T134V, F136L o F136W o F136V, W139H, L142I o L142R, T144S, T146S, A152T, C153S, cualquiera de T154S o T154A, I168V, P169T, Y177F, L178V, S180I, E181G o E181 I, P184K, F186Y, T194I, H198N, V199M, K215E, V236G, F237V, W238L, A240T, cualquiera de M245I o M245A o 245V, W249Y, M252V o M252I, y E254V. En algunas modalidades, los polipéptidos de HHDH de la presente invención son por lo menos 85% idénticos a la SEQ ID NO: 2 y tienen una o más de las sustituciones indicadas anteriormente. Algunos polipéptidos de HHDH de la presente invención son por lo menos 90% idénticos a la SEQ ID NO: 2, algunos son por lo menos 95% Idénticos a la SEQ ID NO: 2, y otros son por lo menos 99% idénticos a la SEQ ID NO: 2, todos teniendo una o más de las sustituciones indicadas anteriormente. Algunos de estos polipéptidos de HHDH tienen por lo menos 2 o más sustituciones anteriormente mencionadas, y algunos de estos polipéptidos de HHDH tienen por lo menos 3 o más de las sustituciones anteriormente mencionadas. Cuando se alinean óptimamente con la secuencia SEQ ID NO: 2, ciertos polipéptidos de HHDH de la presente invención tienen una secuencia correspondiente a la SEQ ID NO: 2, pero una o más sustituciones de aminoácidos seleccionadas del grupo que consiste de S2T, cualquiera de T3A o T3P, A4V, V6D, cualquiera de V9I o V9F, K10L, G13S, G14S, M15K, G16C, cualquiera de S17T o S17R, cualquiera de R20S, R20C o R20K, A24T, H26Q, V28F, A29T, C30A, H31L, E33G, S34R, F35L, K36N, Q37H, E40D, F44L, A45P, cualquiera de T47P o T47A, K52N, M54V, S55R, E56D, E58K, cualquiera de E61 G o E61 D, I63V, Q72R, V75I, L76P, S78C, F82Y, cualquiera de P84S o P84L, E85Q, K91 E, A93D, E95Q o E95G, D96N, R107K, V112A, cualquiera de A114T o A114G o A114S, V115A, S117P, K120N, K121 E, R122P, H126R, I130V, A133S, T134A o T134V, F136L o F136W o F136V, W139H, L142I ó L142R, T144S, T146S, A152T, C153S, cualquiera de T154S o T154A, I168V, P169T, Y177F, L178V, S180I, E181G o E181 I, P184K, F186Y, T1941, H198N, V199M, K215E, V236G, F237V, W238L, A240T, cualquiera de o M245I o M245A o M245V, W249Y, M252V o M252I, y E254V. En algunas modalidades, los polipéptidos de HHDH tienen dos o más, y algunas veces tres o cuatro o más de las sustituciones anteriormente mencionadas. Usualmente, en esta modalidad, el polipéptido de HHDH resultante tiene por lo menos 80% de identidad de secuencia con la SEQ ID NO: 2, más usualmente, por lo menos 90% de identidad de secuencia; aún más normalmente por lo menos 95% de identidad de secuencia, y todavía aún más típicamente por lo menos 98% de identidad de secuencia. Los polipéptidos de HHDH descritos aquí pueden adicionalmente tener uno o más residuos de aminoácido seleccionados del grupo que consiste de Q en la posición 37, Y en la posición 70, Q en la posición 72, Q en la posición 80, G en la posición 99, R en la posición 107, T en la posición 146, C en la posición 153, F en la posición 186, T en la posición 189, y A en la posición 222. En algunas modalidades, los polipéptidos de HHDH de la presente invención tienen dos, tres, o cuatro o más de estos residuos seleccionados. De estos residuos, parece que Q37, Y70, Q87, R107, T146, C153 y F186 se correlacionan favorablemente con la actividad de HHDH. Otros parece que se correlacionan favorablemente bien con la resistencia a la inhibición mediante etil-4-cloroacetato, como se discute con más detalle posteriormente. Dos secuencias son "alineadas óptimamente" cuando se alinean para una puntuación de similitud usando una matriz de sustitución de aminoácidos definida (por ejemplo, BLOSUM62), una penalidad de existencia de hueco y una penalidad de extensión de hueco para llegar al núcleo más alto posible para el par de secuencias. Las matrices de sustitución de aminoácidos y su uso en la cuantificación de la similitud entre dos secuencias se conocen bien en la técnica. Véase por ejemplo, Dayhoff et al. (1978), "A model of evolutionary change ¡n proteins"; "Atlas of Protein Sequence and Structure ", Vol. 5, Suppl. 3 (Ed. M.O. Dayhoff), pp. 345-352, Nati. Biomed. Res. Round., Washington, D. C; Henikoff et al. (1992) Proc.Natl. Acad. Sci. USA, 89: 10915-10919. La matriz BLOSUM62 a veces se usa como una matriz de sustitución de puntuación predeterminada en los protocolos de alineamiento de secuencia tal como BLAST 2.0 con hueco. La penalidad de existencia de hueco se impone para la introducción de un hueco de aminoácido simple en una de las secuencias alineadas, y la penalidad de extensión de hueco se impone para cada posición de aminoácido vacía adicional insertada en un hueco ya abierto. El alineamiento se define mediante la posición de aminoácidos de cada secuencia en la cual el alineamiento comienza y termina, y opcionalmente mediante la inserción de un hueco o múltiples huecos en una o ambas secuencias para llegar a la puntuación más alta posible. Aunque el alineamiento y puntuación óptimos se pueden realizar manualmente, el procedimiento se facilita por el uso de un algoritmo de alineamiento implementado por computadora, por ejemplo, BLAST 2.0 con hueco, descrito en Altschul, et al. (1997) Nucleic Acids Res.. 25: 3389-3402, y disponible para el público en el sitio Web centro nacional para información biotecnológica. Los alineamientos óptimos, que incluyen alineamientos múltiples se pueden preparar usando programas disponibles fácilmente tales como PSI-BLAST, los cuales se describen por Altschul, et al. (1997) Nucleic Acids Res.. 25: 3389-3402. Con respecto a una secuencia de aminoácidos que es óptimamente alineada con una secuencia de referencia, un residuo de aminoácido "corresponde a" la posición en la secuencia de referencia con la cual el residuo es pareado en el alineamiento. La "posición" se denota por un número que consecutivamente identifica cada aminoácido en la secuencia de referencia con base en su posición relativa al N-terminal. Debido a las eliminaciones, inserciones, truncamientos, fusiones y lo similar que se deben tomar en cuenta cuando se determina un alineamiento óptimo, en general el número de residuo de aminoácido en una secuencia de prueba se determina mediante el conteo simple del N-terminal que necesariamente no será el mismo que el número de su posición correspondiente en la secuencia de referencia. Por ejemplo, en un caso donde existe una eliminación en una secuencia de prueba alineada, no habrá un aminoácido que corresponda a una posición en la secuencia de referencia en el lugar de la eliminación. Cuando existe una inserción en una secuencia de referencia alineada, esa inserción no corresponderá a alguna posición de aminoácido en la secuencia de referencia. En el caso de truncamientos o fusiones estos pueden ser alargamientos de aminoácidos ya sea en la secuencia de referencia o alineada que no corresponde a algún aminoácido en la secuencia correspondiente. En una modalidad adicional, la presente invención provee un polipéptido de HHDH que es por lo menos 93% idéntico a la SEQ ID NO: 200 (es decir, 18 o menos diferencias de aminoácido en comparación a la SEQ ID NO: 200, cuando se alinean óptimamente con SEQ ID NO: 200). Algunos de estos polipéptidos de HHDH son por lo menos 95% idénticos a la SEQ ID NO: 200, y algunos son por lo menos 97, 98 o 99% idénticos a la SEQ ID NO: 200. En ciertas modalidades, estos polipéptidos tienen uno o más de los siguientes residuos: T (residuo) en la posición 2, A o P o S en la posición 3, V en la posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 61 , V en la posición 63, R en la posición 72, 1 en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91, D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, S o G en la posición 14, A en la posición 115, P en la posición 117, N en la posición 20, E en la posición 121 , P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181, K en la posición 184, Y en la posición 186, L en la posición 194, N en la posición 198, en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254. La presente invención también provee polipéptidos de HHDH codificados mediante un ácido nucleico que hibridiza bajo condiciones severas sobre sustancialmente toda la longitud de un ácido nucleico correspondiente a SEQ ID NO: 1, donde el polipéptido codificado, cuando se alinea óptimamente con SEQ ID NO: 2, comprende una secuencia de aminoácidos que tiene por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A o P o S en la posición 3, V en la posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 5, C en la posición 16, T o R en la posición 17, cualquiera de S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, G o D en la posición 61 , V en la posición 63, R o Q en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91 , D en la posición 93, Q o G en la posición 95, N en la posición 96, G en la posición 99, K en la posición 107, A en la posición 1 2, cualquiera de T, S o G en la posición 14, A en la posición 115, P en la posición 17, N en ia posición 120, E en la posición 121 , P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181, K en la posición 184, Y en la posición 186, T en la posición 189, L en la posición 194, N en la posición 198, M en la posición 199, E en la posición 215, A en la posición 222, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254. La presente invención también provee un polipéptido aislado o recombinante que tiene por lo menos 1.4 veces más actividad de HHDH en comparación a la actividad de HHDH de tipo silvestre que tiene la secuencia de aminoácidos de SEQ ID NO: 2, y en donde el polipéptido se codifica mediante un ácido nucleico que hibridiza bajo condiciones severas sobre sustancialmente toda la longitud de un ácido nucleico que tiene una secuencia seleccionada del grupo que consiste de SEQ ID NO: 3, 9, 11 , 13, 15, 17, 33, 37, 43, 47, 49, 51, 65, 67, 79, 83, 109, 113, 115, 117, 153, 157, 161 , 163, 165, 169, 179, 161 , 199, 261, 263, 265, 269, 421, 439, 441, 447, 469, 475, 519, 701 , 725, 729, 731, 733, 735, 737, y secuencias complementarias de las mismas. Los ácidos nucleicos "hibridizan" cuando se asocian, normalmente en solupión. Los ácidos nucleicos hibridizan debido a una variedad de fuerzas fisicoquímicas bien caracterizadas, tales como enlaces de hidrógeno, exclusión de solvente, acumulación de base y lo similar. Una guía extensa para la hibridación de ácidos nucleicos se encuentra en Tijssen (1993) "Laboratory Techniques in Biochemlstry and Molecular Biology-Hybridization with Nucleic Acid Probes", Parte I, capitulo 2 (Elsevier, New York). Como se usa aquí, el término "condiciones de lavado de hibridación severas" en el contexto de experimentos de hibridación del ácido nucleico, tales como hibridación southern y northern, son secuencias dependientes, y son diferentes bajo diferentes parámetros ambientales. Una guía extensa para la hibridación de ácidos nucleicos se encuentra en Tijessen (1993) "Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes", Parte I, capitulo 2 (Elsevier, New York). Para propósitos de la presente invención, la hibridación "altamente severa" (o "de alta severidad") y las condiciones de lavado generalmente se seleccionan para quedar de cerca de 5°C o más bajo que el punto de fusión térmico (Tm) para la secuencia específica en una concentración iónica definida y pH definido (como se nota abajo, condiciones altamente severas también se pueden referir en términos comparativos). La Tm es la temperatura (bajo la concentración iónica y pH definidos) en la cual 50% de la secuencia de prueba hibridiza a una sonda perfectamente enfrentada. Condiciones muy severas se seleccionan para ser ¡guales a Tm para una sonda particular. La Tm de un ácido nucleico dúplex indica la temperatura a la cual el dúplex es 50% desnaturalizado bajo las condiciones dadas y representa una medición directa de la estabilidad del híbrido del ácido nucleico. De esta manera, la Tm corresponde a la temperatura que corresponde al punto medio en transición del helicoidal a serpentín aleatorio; esto depende de la longitud, composición del nucleótido, y concentración iónica para grandes alargamientos de los nucleótidos. Después de la hibridación, el material de ácido nucleico no hibridizado se puede remover mediante una serie de lavados, la severidad de los cuales se puede ajustar dependiendo de los resultados deseados. Las condiciones de lavado de baja severidad (por ejemplo, usando una sal superior y una temperatura muy baja) aumentan la sensibilidad, pero pueden producir señales de hibridación no específicas y señales de fondo altas (es decir, pérdida de especificidad). Las condiciones de severidad más altas (por ejemplo, usando una sal inferior y una temperatura más alta que está más cerca a la temperatura de hibridación) disminuyen la señal de fondo, usualmente con solo el sobrante de la señal específica (es decir, aumenta la especificidad). Ver Rapley, R. and Walter, J.M. Eds., "Molecular Biomethods Handbook" (Humana Press, Inc. 1998). La Tm de un ADN-ADN dúplex se puede estimar usando la ecuación 1 como sigue: Tm (°C) = 81.5°C + 16.6 (logioM) + 0.41 (%G + C) - 0.72 (%f) - 500/n, donde M es la molaridad de los cationes monovalentes (usualmente Na+), (%G + C) es el porcentaje de nucleótidos de guanosina (G) y citosina (C), (% f) es el porcentaje de formamida y n es el número de bases nucleotídicas (es decir, la longitud) del híbrido. Véase jd- La Tm de un ARN-ADN dúplex se puede estimar al usar la ecuación 2 como sigue: Tm (°C) = 79.8°C + 18.5 (log10M) + 0.58 (%G + C) - 11.8 (%G + C)2 - 0.56 (%f) - 820/n, donde M es la molaridad de los cationes monovalentes (usualmente Na+), (%G + C) es el porcentaje de nucleótidos de guanosina (G) y citosina (C), (%f) es el porcentaje de formamida y n es el número de bases nucelotídicas (es decir, la longitud) del híbrido. Id- Las ecuaciones 1 y 2 son típicamente exactas solamente para los dúplex de híbridos más largos que cerca de 00-200 nucleótidos. Id. La Tm de las secuencias de ácido nucleico más cortas de 50 nucleótidos se puede calcular como sigue: Tm(°C) = 4(G+C) + 2(A + T), donde A (adenina), C, T (tiamina), y G son los números de los nucleótidos correspondientes. Un ejemplo de condiciones de hibridación severas para la hibridación de los ácidos nucleicos complementarios los cuales tiene más de 100 residuos complementarios en un filtro en una prueba southern o northern blot es 50% de formamida con 1 mg de heparina a 42°C, con la hibridación realizándose toda la noche. Un ejemplo de las condiciones de lavado severas es un lavado de 0.2 x SSC a 65°C durante 15 minutos (ver Sambrook, et al., Molecular Cloning - A Laboratory Manual" (1989) Cold Spring Harbor Laboratory (Cold Spring Harbor, New York) para una descripción del regulador de pH SSC). Frecuentemente el lavado de alta severidad es precedido por un lavado de baja severidad para eliminar la señal de la sonda de fondo. Un ejemplo de lavado de baja severidad es 2 x SSC a una temperatura de 40°C durante 15 minutos. En general, una señal para la relación de ruido de 2.5x - 5x (o más alta) que lo observado para una sonda no relacionada en el ensayo de hibridación particular indica la detección de una hibridación específica. La detección de por lo menos una hibridación severa entre dos secuencias en el contexto de la presente invención indica similitud estructural relativamente fuerte u homología a, por ejemplo, los ácidos nucleicos de la presente invención provistos en el listado de secuencias en el presente documento. Como se nota, condiciones "altamente severas" se seleccionan para ser de cerca de 5°C o más bajo que el punto de fusión térmico (Tm) para la secuencia específica en una concentración iónica definida y pH definido. Las secuencias objetivo que son relacionadas estrechamente o idénticas a la secuencia de nucleótidos de interés (por ejemplo, "sonda") se pueden identificar bajo condiciones altamente severas. Las condiciones de baja severidad son apropiadas para las secuencias que son menos complementarias. La hibridación severa (así como condiciones de · hibridación altamente severas, ultra altamente severas, o ultra-ultra altamente severas) y las condiciones de lavado se pueden determinar fácilmente empíricamente para cualquier ácido nucleico de prueba. Por ejemplo, en la determinación de las condiciones de hibridación altamente severas y de lavado, la hibridación y las condiciones de lavado gradualmente se aumentan (por ejemplo, al aumentar la temperatura, disminuir la concentración de sal, aumentar la concentración de detergente y/o aumentar la concentración de solventes orgánicos, tal como formamida, en la hibridación o lavado), hasta que un conjunto seleccionado de criterios se cumpla. Por ejemplo, la severidad de las condiciones de hibridación y condiciones de lavado son gradualmente aumentadas hasta que una sonda que corresponde a la SEQ ID NO: 3, 9, 11 ,13, 15,17, 33, 37, 43, 47, 49, 51, 65, 67, 79, 83, 109, 113, 115, 117, 153, 157, 161 , 163, 165, 169, 179, 161 , 199, 261 , 263, 265, 269, 421, 439, 441, 447, 469, 475, 519, 701 o una secuencia complementaria de las mismas, se una a un objetivo complementario enfrentado perfectamente. Se dice que un ácido nucleico de prueba hibridiza específicamente a un ácido nucleico de sonda cuando hibridiza por lo menos ½ también a la sonda en cuanto ai objetivo complementario perfectamente enfrentado, es decir, con una relación señal a ruido de por lo menos 1/2 tan alta como la hibridación de la sonda al objetivo bajo condiciones en las cuales la sonda perfectamente enfrentada se une al objetivo complementario perfectamente equilibrado. Las condiciones de hibridación de alta severidad y de lavado son aquellas en los cuales la severidad de las condiciones de hibridación y condiciones de lavado se incrementa hasta que la relación de señal a ruido para la unión de la sonda al ácido nucleico objetivo complementario perfectamente enfrentado es por lo menos 10x. Un ácido nucleico objetivo el cual hibridiza a una sonda bajo dichas condiciones, con una relación de señal a ruido de por lo menos 1/2 del ácido nucleico objetivo complementario perfectamente enfrentado que se dice se une a la sonda bajo condiciones de severidad ultra altas. De manera similar, aún niveles más altos de severidad se pueden determinar mediante el incremento de manera gradual de la severidad de las condiciones de hibridación y/o de lavado del ensayo de hibridación relevante. Por ejemplo, aquellos en los cuales la severidad de las condiciones de hibridación y de lavado se incrementan hasta que la relación de señal a ruido para la unión de la sonda al ácido nucleico objetivo complementario perfectamente enfrentado sea de por lo menos 10X, 20X, 50X, 100X, o 500X. Un ácido nucleico objetivo el cual hibridiza a una sonda bajo dichas condiciones, con una relación de señal a ruido de por lo menos 1/2 del ácido nucleico objetivo complementario perfectamente enfrentado que se dice se une a la sonda bajo condiciones de severidad ultra-ultra-altas. Los polipéptidos de HHDH de la presente invención incluyen aquellos que tienen una secuencia de aminoácidos correspondiente a: SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258. 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 298, 300, 302, 304, 306, 308, 310, 312, 314, 316, 318, 320, 322, 324, 326, 328, 330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 368, 370, 372, 374, 376, 378, 380, 382, 384, 386, 388, 390, 392, 394, 396, 398, 400, 402, 404, 406, 408, 410, 412, 414, 416, 418, 420, 422, 424,426, 428, 430, 432, 434, 436, 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594, 596, 598, 600, 602, 604, 606, 608, 610, 612, 614, 616, 618, 620, 622, 624, 626, 628, 630, 632, 634, 636, 638, 640, 642, 644, 646, 648, 650, 652, 654, 656, 658, 660, 662, 664, 666, 668, 670, 672, 674, 676, 678, 680, 682, 684, 686, 688, 690, 692, 694, 696, 698, 700, 702, 704, 706, 708, 710, 712, 714, 716, 718, 720, 722, 724, 726, 728, 730, 732, 734, 736, 738, 740, 742 ó 744. Todos estos polipéptidos de HHDH han demostrado actividad en los ensayos descritos en el ejemplo 5A o 5B. Los polinucleótidos de HHDH ejemplares que codifican estos polipéptidos de HHDH se proveen aquí como SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279, 281, 283, 285, 287, 289, 291, 293, 295, 297, 299, 301, 303, 305, 307, 309, 311, 313, 315, 317, 319, 321, 323, 325, 327, 329, 331, 333, 335, 337, 339, 341, 343, 345, 347, 349, 351, 353, 355, 357, 359, 361, 363, 365, 367, 369, 371, 373, 375, 377, 379, 381, 383, 385, 387, 389, 391, 393, 395, 397, 399, 401, 403, 405, 407, 409, 411, 413, 415, 417, 419, 421, 423, 425, 427, 429, 431 , 433, 435, 437, 439, 441 , 443, 445, 447, 449, 451 , 453, 455, 457, 459, 461 , 463, 465, 467, 469, 4712, 473, 475, 477, 479, 481 , 483, 485, 487, 489, 491 , 493, 495, 497, 499, 501, 503, 505, 507, 509, 511 , 513, 515, 517, 519, 521 , 523, 525, 527, 529, 531, 533, 535, 537, 539, 541 , 543, 545, 547, 549, 551 , 553, 555, 557, 559, 561 , 563, 565, 567, 569, 571 , 573, 575, 577, 579, 581 , 583, 585, 587, 589, 591, 593, 595, 597, 599, 601 , 603, 605, 607, 609, 611 , 613, 615, 617, 619, 621, 623, 625, 627, 629, 631 , 633, 635, 637, 639, 641 , 643, 645, 647, 649, 651, 653, 655, 657, 659, 661 , 663, 665, 667, 669, 671 ,673, 675, 677, 679, 681 , 683, 685, 687, 689, 691 , 693, 695, 697, 699, 701 , 703, 705, 707, 709, 711, 713, 715, 717, 719, 721 , 723, 725, 727, 729, 731 , 733, 735, 739, 741, y 743 respectivamente. Los polipéptidos de HHDH de la presente invención frecuentemente tienen actividad de HHDH que es por lo menos 1.4 veces mayor que la actividad de HHDH en comparación a HHDH de tipo silvestre que tiene la secuencia de aminoácidos de SEQ ID NO: 2, según se mide en el ensayo descrito en el ejemplo 5A. Algunos polipéptidos de HHDH de la presente invención (SEQ ID NOS: 740, 742, 728, 90, 92, 94, 96 y 96) tienen actividad enzimática HHDH que es por lo menos 2 veces y a veces por lo menos 2.4 veces hasta 100 veces mayor que la actividad de HHDH de Agrobacterium sp. (SEQ ID NO: 2); los polipéptidos de HHDH de SEQ ID NOS: 100, 732, 734 y 736 tienen actividad enzimática que es de 100 a 500 veces mayor que la actividad de HHDH de Agrobacterium sp. (SEQ ID NO: 2); y los polipéptidos de HHDH de SEQ ID NOS: 726 y 730 tienen actividad enzimática HHDH que es de 500 a 1000 veces mayor que la actividad de HHDH de Agrobacterium sp. (SEQ ID NO: 2), las actividades enzimaticas se miden en el ensayo descrito en el ejemplo 5A. La presente invención también provee polipéptidos de HHDH que son variantes del poiipéptido de SEQ ID NO: 4, 6, 8, 10, 12, 14, 16,18, 20, 22, 24, 26, 28, 30, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 12, 1 14, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258. 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 298, 300, 302, 304, 306, 308, 310, 312, 314, 316, 318, 320, 322, 324, 326, 328, 330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 368, 370, 372, 374, 376, 378, 380, 382, 384, 386, 388, 390, 392, 394, 396, 398, 400, 402, 404, 406, 408, 410, 412, 414, 416, 418, 420, 422, 424, 426, 428, 430, 432, 434, 436, 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594, 596, 598, 600, 602, 604, 606, 608, 610, 612, 614, 616, 618, 620, 622, 624, 626, 628, 630, 632, 634, 636, 638, 640, 642, 644, 646, 648, 650, 652, 654, 656, 658, 660, 662, 664, 666, 668, 670, 672, 674, 676, 678, 680, 682, 684, 686, 688, 690, 692, 694, 696, 698, 700, 702, 704, 706, 708, 710, 712, 714, 716, 718, 720, 722, 724, 726, 728, 730, 732, 734, 736, 738, 740 o 742 que tienen una sustitución, supresión, y/o inserción de uno a seis residuos de aminoácido. Las variantes de los polipéptidos de HHDH de la presente invención se pueden generar usando métodos que son bien conocidos por aquellos que tienen experiencia ordinaria en la técnica. Las genotecas de estas variantes se pueden generar y seleccionar usando el tamiz de alto rendimiento para la presencia de actividad de HHDH descrita en el ejemplo 4A. En algunos casos puede ser deseable identificar las halohidrina deshalogenasas que exhiben actividad en la presencia del inhibidor de producto cianohidrina, por ejemplo, (R)-4-ciano-3-hidroxibutirato de etilo. Un tamiz de alto rendimiento para la identificación de dichas enzimas se provee en el ejemplo 4B. Cada uno de los cambios de residuo a un polipéptido de HHDH se evalúa para determinar que relación, si la hay, existe entre el cambio de secuencia y la función deseada (actividad enzimática de HHDH aumentada). Para hacer esto, los cambios de la secuencia y la actividad enzimática resultante en los miembros de una genoteca generada mediante el método descrito en WO 00/42561 se evalúa usando el método descrito en USSN 10/379,378 presentada el 3 de marzo de 2003, titulado "Methods, systems, and software for identifying functional biomolecules" e incorporada aquí para referencia. Basado en este método, los codones que codifican residuos importantes en ciertas porciones que parecen correlacionarse favorablemente con la actividad, se identifican e incorporan en los polinucleótidos de una genoteca combinatorial generada subsecuentemente. En otras palabras, los polinucleótidos que codifican el cambio deseado se generan, expresan y después se seleccionan. El método es nuevamente aplicado a las secuencias resultantes y actividad enzimática de estos resultados. Los resultados nuevamente se utilizan para seleccionar aquellos cambios residuales que aumentan la actividad enzimática para la programación dentro de la siguiente genoteca. Usando este método, la funcionalidad de varios cambios de secuencia (y aunque no caracterizados, los cambios estructurales potenciales también) se somete a evaluación inmediata. Los cambios residuales en varias posiciones residuales que se proveen para la actividad enzimática aumentada relativa a la HHDH de tipo silvestre, se describen aquí en secuencias y en otra parte como residuos preferidos en posiciones identificadas. Aquellas variantes que exhiben la presencia de actividad de HHDH se pueden además caracterizar en el ensayo de HHDH cuantitativo descrito en el ejemplo 5A. Las variantes que exhiben actividad de HHDH en la presencia de cianohidrina producto, por ejemplo, (R)-4-clano-3-hidrox¡butirato de etilo, pueden ser además caracterizadas usando el ensayo descrito en el ejemplo 5B. El ejemplo 5B describe un protocolo para el ensayo de las enzimas que son robustas con respecto a la inhibición del producto. De esta manera, las genotecas variantes pueden ser fácilmente seleccionadas y ensayadas para identificar los polipéptidos de HHDH que se activan bajo condiciones que imitan condiciones del procedimiento real. La presente invención provee polipéptidos de HHDH que exhiben actividad significante aún en la presencia del producto, (R)-4-ciano-3-hidroxibutirato de etilo en el ensayo descrito en el ejemplo 5B (por ejemplo SEQ ID NOS : 98, 100, 102, 104, 106, 108, 120, 122, 124, 126, 128, 130, 132, 136, 138, 140, 142, 144, 146, 148, 150, 152, 160, 174, 176, 178, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258, 260, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 300, 302, 304, 306, 308, 310, 312, 314, 316, 318, 320, 322, 324, 326, 328, 330, 332, 334, 336, 338, 340, 342, 344, 346, 348, 350, 352, 354, 356, 358, 360, 362, 364, 366, 368, 370, 372, 374, 376, 378, 380, 382, 384, 386, 388, 390, 392, 394, 396, 398, 400, 402, 404, 406, 408, 410, 412, 414, 416, 418, 420, 422, 424, 426, 428, 430, 432, 434, 436, 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594, 596, 598, 600, 602, 604, 606, 608, 610, 612, 614, 616, 618, 620, 622, 624, 626, 628, 630, 632, 634, 636, 638, 640, 642, 644, 646, 648, 650, 652, 654, 656, 658, 660, 662, 664, 666, 668, 670, 672, 674, 676, 678, 680, 682, 684, 686, 688, 690, 692, 694, 696, 698, 700, 702, 704, 706, 708, 710, 712, 714, 716, 718, 720, 722, 724, 726, 728, 730, 732, 734, 736, 738, 740 o 742. Los polipéptidos que exhiben la capacidad para convertir el (S)-4-cloro-3-hidroxibutirato de etilo a (R)-4-ciano-3-hidroxibutirato de etilo en el ensayo del ejemplo 5B, podrían también demostrar actividad de HHDH en el ensayo del ejemplo 5A. Los métodos para la generación de genotecas variantes son bien conocidos en la técnica. Por ejemplo, la mutagénesis y los métodos de evolución dirigida se pueden aplicar fácilmente a polinucleótidos (tales como, por ejemplo, HHDH de tipo silvestre que codifica para polinucleótidos o los polinucleótidos de la presente invención) para generar genotecas variantes que se pueden expresar, seleccionar, y ensayar usando los métodos descritos aquí. La mutagénesis y los métodos de evolución dirigida son bien conocidos en la técnica. Ver por ejemplo, Ling, et al., "Approaches to DNA mutagénesis: an overview," Anal. Biochem., 254 (2): 157-78 (1997); Dale, et al., "Oligonucleotide-directed random mutagénesis using the phosphorothioate method, "Methods Mol. Biol., 57: 369-74 (1996); Smith, "ln vitro mutagénesis," Ann. Rev. Genet, 19:423-462 (1985); Botstein, et al., "Strategies and applications of in vitro mutagénesis," Science, 229:1193-1201 (1985); Cárter, "Site directed mutagénesis," Biochem. J., 237: 1-7 (1986); Kramer, et al., "Point Mismatch Repair," Cell, 38:879-887 (1984); Wells, et al., "Cassette mutagénesis: an efficient method for generation of múltiple mutations at 1 defined sites," Gene, 34:315-323 (1985); inshull, et al., "Protein evolution by molecular breeding, "Current Opinión in Chemical Biology, 3:284-290 (1999); Christians, et al., "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling", Nature Biotechnology, 17:259-264 (1999); Crameri, et al., "DNA shuffling of a family of genes from diverse species accelerates directed evolution", Nature, 391 :288-291 ; Crameri, et al., "Molecular evolution of an arsenate detoxification pathway by DNA shuffling", Nature Biotechnology, 15:436-438 (1997); Zhang, et al., "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening", Proceedings of the National Academy of Sciencess, U.S.A., 94:45-4-4509; Crameri, et al., "Improved green fluorescent protein by molecular evolution using DNA shuffling, "Nature Biotecnology, 14:315-319(1996); Stemmer, "Rapid evolution of a protein in vitro by DNA shuffling, "Nature, 370:389-391 (1994); Stemmer, "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution", Proceedings of the National Academy of Sciences, U.S.A., 91 :10747-10751 (1994); WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651 ; y WO 01/75767. En otra modalidad, la presente invención también provee un fragmento de los polipéptidos de HHDH descritos aquí que tienen actividad de HHDH que es por lo menos 1.4 veces mayor que la actividad de HHDH de Agrobacteríum sp. (tipo silvestre) (SEQ ID NO: 2) en el ensayo del ejemplo 5A. Como se usa aquí, el término "fragmento" se refiere a un polipéptido que tiene una supresión de 1 a 5 residuos de aminoácido del carboxi terminal, el amino terminal, o ambos. Preferiblemente, la supresión es de 1 a 5 residuos del carboxi terminal.
Polinucleótidos de HHDH La presente invención provee polinucleótidos que codifican los polipéptidos de HHDH de la presente invención. En una modalidad específica de la presente invención, los polinucleótidos de HHDH comprenden un ácido nucleico que hibridiza bajo condiciones severas sobre sustancialmente toda la longitud de un ácido nucleico correspondiente a SEQ ID NO: 1, donde el polipéptido codificado mediante el poiinucleótido de HHDH comprende una secuencia de aminoácidos que tiene por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A o P o S en la posición 3, V en la posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 61 , V en la posición 63, R en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E.en la posición 91 , D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, S o G en la posición 114, A en la posición 115, P en la posición 117, N en la posición 120, E en la posición 121 , P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, l o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181 , K en la posición 184, Y en la posición 186, L en la posición 194, N en la posición 198, en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254, cuando se alinean óptimamente con SEQ ID NO: 2. La presente invención también provee un polinucleótido de HHDH, SEQ ID NO: 1 ; que es un codón optimizado para la expresión en E. coli. El polipéptido codificado mediante este polinucleótido optimizado por codón corresponde al polipéptido de HHDH de Agrobacteríum sp. (SEQ ID NO: 2). Además la presente invención provee polinucleótidos específicos que corresponden a SEQ ID NO: 3, 5, 7, 9, 11 , 13, 15, 17, 19, 21 , 23, 25, 27, 29, 33, 35, 37, 39, 41 , 43, 45, 47, 49, 51 , 53, 55, 57, 59, 61 , 63, 65, 67, 69, 71 , 73, 75, 77, 79, 81 , 83, 85, 87, 89, 91 , 93, 95, 97, 99, 101 , 103, 105, 107,109, 1 11 , 113, 115, 117, 119, 121, 123, 125, 127, 129, 131 , 133, 135, 137, 139, 141 143, 145, 147, 149, 151 , 153, 155, 157, 159, 161, 163, 165, 167,169, 171 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201 203, 205, 207, 209, 211 213, 215, 217, 219, 221 223, 225 227, 229, 231 233, 235, 237, 239, 241 243, 245, 247, 249, 251 253, 255 257, 259, 261 263, 265, 267, 269, 271 273, 275, 277, 279, 281 283, 285 287, 289, 291 293, 295, 297, 299, 301 303, 305, 307, 309, 311 313, 315 317, 319, 321 323, 325, 327, 329, 331 333, 335, 337, 339, 341 343, 345 347, 349, 351 353, 355, 357, 359, 361 363, 365, 367, 369, 371 373, 375 377, 379, 381 383, 385, 387, 389, 391 393, 395, 397, 399, 401 403, 405 407, 409, 411 , 413, 415, 417, 419, 421 423, 425, 427, 429, 431 433, 435 437, 439, 441 , 443, 445, 447, 449, 451 453, 455, 457, 459, 461 463, 465 467, 469, 4712, 473, 475, 477, 479, 481 , 483, 485, 487, 489, 491 493, 495 497, 499, 501 , 503, 505, 507, 509, 511 513, 515, 517, 519, 521 523, 525 527, 529, 531 , 533, 535, 537, 539, 541 543, 545, 547, 549, 551 553, 555 557, 559, 561 , 563, 565, 567, 569, 571 573, 575, 577, 579, 581 583, 585 587, 589, 591 , 593, 595, 597, 599, 601 603, 605, 607, 609, 611 613, 615 617, 619, 62 , 623, 625, 627, 629, 631 633, 635, 637, 639, 641 643, 645 647, 649, 651 , 653, 655, 657, 659, 661 663, 665, 667, 669, 671 673, 675 677, 679, 681 , 683, 685, 687, 689, 691 693, 695, 697, 699, 701 703, 705 707, 709, 71 , 713, 715, 717, 719, 721, 723, 725, 727, 729, 731 , 733, 735, 739, y 741. Aquellos que tienen experiencia en la técnica apreciarán fácilmente que debido a la degeneración del código genético, existe una multitud de secuencias de nucleótido que codifican los polipéptidos de HHDH de la presente invención. El cuadro 1 es un cuadro de codón que provee codones sinónimos para cada aminoácido. Por ejemplo, los codones AGA, AGG, CGA, CGC, CGG, y CGU todos codifican la arginina de aminoácido. De esta manera, en cada posición en los ácidos nucleicos de la invención donde una arginina es especificada mediante un codón, el codón se puede alterar a cualquiera de los codones correspondientes descritos anteriormente sin alterar el polipéptido codificado. Se entiende que U en una secuencia de ARN corresponde a T en una secuencia de ADN.
CUADRO 1 Cuadro de codón Dichas "variaciones silenciosas" son una especie de variación "conservativa". Un experto en la técnica reconocerá que cada codón en un ácido nucleico (excepto AUG, el cual es ordinariamente el codón único para metionina) se puede modificar mediante técnicas estándar para codificar un polipéptido idéntico funcionalmente. En consecuencia, cada variación silenciosa de un ácido nucleico el cual codifica un polipéptido está implícita en cualquier secuencia descrita. La invención contempla y provee cada una y todas las variaciones posibles de la secuencia de ácido nucleico que codifica un polipéptido de la invención que podría realizarse mediante la selección de combinaciones basadas en las selecciones de codón posibles. Estas combinaciones se hacen de acuerdo con el código genético triplete estándar (expuesto en el cuadro 1), como se aplica a las secuencias de polinucleótido de la presente invención. Un grupo de dos o más codones diferentes que, cuando se traducen en el mismo contexto, todos codifican al mismo aminoácido, se refieren aquí como "codones sinónimos". Los polinucleótidos de HHDH de la presente invención puede ser un codón optimizado para la expresión en un organismo huésped particular mediante la modificación de los polinucleótidos para conformarse con el uso del codón óptimo del organismo huésped deseado. Aquellos con experiencia en la técnica reconocerán que los cuadros y otras referencias que proporcionan información de preferencia para una escala amplia de organismos son fácilmente disponibles. Ver, por ejemplo, Henaut y Danchin en "Escherichia coli and Salmonella," Neidhardt, et al. Eds., ASM Pres, Washington D.C. (1996), pp. 2047-2066. Una secuencia de polinucleótidos variante de HHDH ejemplar de la presente invención se proporciona como la SEQ ID NO: 31 , que se expresa bien en E.coii. Este polinucleótido es una variante de SEQ ID NO: 1 que expresa el polipéptido correspondiente a SEQ ID NO: 2 de E. coli en un nivel de cerca de 4 1/2 veces más alto que la cantidad expresada de SEQ ID NO: 1 (es decir, polinucleótido que codifica HHDH que codifica para el HHDH nativo de Agrobacteríum sp.). En algunas modalidades de la presente invención, ciertos codones se prefieren cuando los siguientes residuos se emplean en los polipéptidos de HHDH de la presente invención: ATT que codifica para isoluecina en la posición 5 del aminoácido; AAG que codifica para lisina en la posición 36 de aminoácido; ATT que codifica para isoluecina en la posición 63 del aminoácido; GAG que codifica para el ácido glutámico en la posición 95 del aminoácido; y CCC que codifica para la prolina en la posición 188 del aminoácido. La posición del aminoácido referida anteriormente es la posición del aminoácido correspondiente en SEQ ID NO: 2, cuando los polipéptidos de HHDH de la invención se alinean con SEQ ID NO: 2. Los términos "variaciones modificadas de manera conservativa" y "variaciones conservativas" como se usan intercambiablemente aquí se refieren a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas, o en la situación donde los ácidos nucleicos no codifican las secuencias, el término se refiere a ácidos nucleicos que son idénticos. Un experto en la técnica reconocerá que las sustituciones individuales, supresiones o adiciones que alteran, añaden o suprimen un aminoácido simple o un porcentaje pequeño de aminoácidos en una secuencia codificada son variaciones modificadas de manera conservativa consideradas donde las alteraciones resultan en una o más de las siguientes: la supresión de un aminoácido, la adición de un aminoácido, o la sustitución de un aminoácido con un aminoácido similar químicamente. Cuando más de un aminoácidos se afecta, el porcentaje es típicamente menor de 5% de residuos de aminoácido sobre la longitud de la secuencia codificada, y más usualmente menos del 2%. Las referencias que proporcionan aminoácidos que se consideran sustituciones conservativas para uno otro son bien conocidas en la técnica. Los ejemplos de sustituciones conservativas están dentro del grupo de aminoácidos básicos (arginina, lisina e histiadina), aminoácidos acídicos (ácido glutámico y ácido aspártico), aminoácidos polares (glutamina y asparaginas), aminoácidos hidrófobos (leucina, isoleucina y valina), aminoácidos aromáticos (fenilalanina, triptofano y tirosina), y aminoácidos pequeños (glicina, alanina, serina, treonina, prolina, cisteína y metionina). Las sustituciones de aminoácido las cuales en general no alteran la actividad específica son conocidas en la técnica y se describen, por ejemplo, por H. Neurath y R. L. Hill, 1979, en "The Proteins," Academic Press, New York. Los intercambios de ocurrencia más comúnmente son Ala/Ser, Val/lie, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/lie, LeuA/al, Ala/Glu, y Asp/Gly así como estos a la inversa. Las variaciones sustituidas de manera conservativa de los polipéptidos de HHDH de la presente invención incluyen sustituciones de un porcentaje pequeño, usualmente menos de 5%, más usualmente menos de 2%, y frecuentemente menos de 1% de los aminoácidos de la secuencia de polipéptido, con un aminoácido seleccionado de manera conservativa del mismo grupo de sustitución conservativa. La adición de secuencias las cuales no alteran la actividad codificada de un polinucleótido de HHDH, tal como la adición de una secuencia no funcional o no codificada, se considera una variación conservativa del polinucleótido de HHDH. Los polinucleótidos de la presente invención se pueden preparar usados métodos que son bien conocidos en la técnica. Usualmente, los oligonucleótidos de hasta cerca de 120 bases se sintetizan individualmente, entonces se juntan (por ejemplo, mediante métodos de unión química o enzimática, o métodos mediados por polimerasa) para formar esencialmente cualquier secuencia continua deseada. Por ejemplo, los polinucleótidos de la presente invención se pueden preparar mediante síntesis química usando, por ejemplo, el método de fosforamidita clásico descrito por Beaucage, et al. (1981) Tetrahedron Letters. 22: 1859-69, o el método descrito por Matthes, et al. (1984) EMBO J., 3:801-05, por ejemplo como es usualmente practicado en los métodos sintéticos automatizados. De acuerdo al método de fosforamidita, los oligonucleótidos se sintetizan, por ejemplo, en un sintetizador de ADN automático, purificado, templado, ligado y clonado en vectores apropiados. Además, esencialmente cualquier ácido nucleico se puede ordenar como es usual de cualquiera de una variedad de fuentes comerciales, tales como The Midland Certified Reagent Company (Midland, TX), The Great American Gene Company (Ramona, CA), ExpressGen Inc. (Chicago, IL), Operon Technologies Inc. (Alameda, CA), y muchas otras. Los polinucleótidos también se pueden sintetizar mediante técnicas bien conocidas como se describe en la literatura técnica. Ver, por ejemplo, Carruthers, et al., Cold Spring Harbor Svmp. Quant. Biol., 47: 411-418 (1982) y Adams, et al., J. Am. Chem.Soc. 105: 661 (1983). Los fragmentos de ADN de doble cadena se pueden obtener después ya sea mediante la síntesis de la cadena complementaria y templado de las cadenas en conjunto bajo condiciones apropiadas, o mediante la adición de la cadena complementaria usando ADN polimerasa con una secuencia de iniciador apropiada. Los textos generales los cuales describen técnicas biológicas moleculares útiles aquí, que incluyen el uso de vectores, promotores y muchos tópicos relevantes, incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning-A Laboratorv Manual (2a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") y Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, una empresa unida entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complementada hasta 1999) ("Ausubel"). Los ejemplos de los protocolos suficientes para dirigir personas con experiencia a través de métodos de amplificación in vitro, que incluyen la reacción de cadena de polimerasa (PCR), la reacción de cadena de ligasa (LCR), la amplificación de Q -replicasa y otras técnicas mediadas por la ARN polimerasa (por ejemplo, NASBA), por ejemplo, para la producción de ácidos nucleicos homólogos de la invención se encuentran en Berger, Sambrook, y Ausubel, así como Mullís et al., (1987) Patente de E.U.A. No. 4,683,202; PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, CA (1990) (Innis); Arnheim & Levinson (1 de Octubre de 1990) C & EN 36-47; The Journal Of NIH Research (1991) 3, 81-94 ; (Kwoh et al. (1989) Proa Nati. Acad. Sci. USA 86, 1173; Guatellí et al. (1990) Proc. Nati. Acad. Sci. USA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35, 1826; Landegren et ai., (1988) Science 241, 1077-1080; Van Brunt (1990) Biotechnoloqy 8, 291-294; Wu y Wallace, (1989) Gene 4, 560; Barringer et al. (1990) Gene 89, 117, y Sooknanan y Malek (1995) Biotechnology 13: 563-564. Los métodos mejorados para clonación in vitro de ácidos nucleicos amplificados se describen en Wallace et al., Patente de E.U.A. No. 5,426,039. Los métodos mejorados para la amplificación de ácidos nucleicos largos mediante PCR se resumen en Cheng et al. (1994) Nature 369:684-685 y las referencias citadas ahí, en los cuales los amplicones de PCR de hasta 40 kB se generan. Un experto en la técnica apreciará fácilmente que esencialmente cualquier ARN se puede convertir en un ADN de cadena doble adecuado para la restricción, digestión, expansión de PCR y la secuenciación usando transcriptasa inversa y una polimerasa. Ver, por ejemplo, Ausubel, Sambrook y Berger, todos mencionados anteriormente.
Vectores, promotores, y sistemas de expresión La presente invención también incluye construcciones recombinantes que comprenden una o más de las secuencias de polinucleótidos de HHDH como se describió ampliamente arriba. El término "construcción" o "construcción de ácido nucleico" se refiere aquí a un ácido nucleico ya sea de cadena sencilla o doble, el cual se aisla de un gen de origen natural o que ha sido modificado para contener segmentos de ácidos nucleicos de una manera que no podría existir de otra manera en la naturaleza. El término "construcción de ácido nucleico" es sinónimo con el término "cassette de expresión" cuando la construcción de ácido nucleico contiene las secuencias de control requeridas para la expresión de una secuencia que codifica para HHDH de la presente invención. La presente invención también provee un vector de expresión que comprende un polinucleótido de HHDH de la presente invención operablemente unido a un promotor. El ejemplo 1 provee una descripción de como hacer construcciones de expresión para la expresión de halohidrina deshalogenasa. El término "secuencias de control" se refiere aquí a todos los componentes que son necesarios o ventajosos para la expresión de un poiipéptido de la presente invención. Cada secuencia de control puede ser nativa o ajena a la secuencia de nucleótidos que codifica para el poiipéptido. Dichas secuencias de control incluyen, pero no se limitan a, un guía, una secuencia de poliadenilación, secuencia de propéptido, promotor, secuencia de péptido de señal, y terminador de trascripción. En un mínimo, las secuencias de control incluyen un promotor, y señales de detención transcripcional y de la traducción. Las secuencias de control se pueden proveer con enlazadores con el propósito de introducir sitios de restricción específica para facilitar la unión de las secuencias de control con la región de codificación de la secuencia de nucleótidos que codifica para un poiipéptido. El término "unido operablemente" se refiere aquí a una configuración en la cual una secuencia de control es apropiadamente colocada en una posición relativa a la secuencia de codificación de la secuencia de ADN tal que la secuencia de control dirige la expresión de un polipéptido. Cuando se usa en la presente el término "secuencia de codificación" se pretende cubrir una secuencia de nucleótido, la cual directamente especifica la secuencia de aminoácidos de su producto proteína. Los límites de la secuencia de codificación son generalmente determinados mediante un cuadro de lectura abierta, el cual usualmente inicia con el codón de inicio ATG. La secuencia de codificación usualmente incluye un ADN, ADNc, y/o una secuencia de nucleótidos recombinante. Como se usa aquí, el término "expresión" incluye cualquier etapa involucrada en la producción del polipéptido que incluye, pero no se limita a,, trascripción, modificación transcripcional, traducción, modificación de la traducción posterior, y secreción. El término "vector de expresión" se refiere aquí a una molécula de ADN, lineal o circular, que comprende un segmento que codifica un polipéptido de la invención, y que es operablemente unida a segmentos adicionales que se proveen para su transcripción. Como se usa aquí, el término "célula huésped" se refiere a cualquier tipo de célula que es susceptible a la transformación con una construcción de ácido nucleico. Las construcciones de ácido nucleico de la presente invención comprenden un vector, tal como, una plásmido, un cósmido, un fago, un virus, un cromosoma artificial bacterial (BAC), un cromosoma artificial de levadura (YAC), o lo similar, en los cuales una secuencia de ácido nucleico de la invención se ha insertado, en una orientación hacia adelante o inversa. En un aspecto preferido de esta modalidad, la construcción además comprende secuencias reguladoras, que incluyen, por ejemplo, un promotor, unido operablemente a la secuencia. Los números grandes de vectores y promotores adecuados son conocidos por aquellos con experiencia en la técnica, y son disponibles comercialmente. Los polinucleótidos de la presente invención se pueden incorporar en cualquiera de una variedad de vectores de expresión adecuados para la expresión de un polipéptido. Los vectores adecuados incluyen secuencias de cromosomas, no asociadas a cromosomas y de ADN sintético, por ejemplo derivados de SV40; plásmidos bacterianos; ADN del fago; baculovirus; plásmidos de levadura; vectores derivados de las combinaciones de plásmidos y ADN del fago, ADN viral tal como vaccinia, adenovirus, virus de sífilis de ave, pseudorrabias, adenovirus, virus adeno-asociado, retrovirus y muchos otros. Cualquier vector que transduce material genético en una célula, y, si se desea la replicación, que es replicable y viable en el huésped relevante, se puede usar. Cuando se incorpora en un vector de expresión, un polinucleótido de la invención es operativamente unido a una secuencia de control de trascripción apropiada (promotor) para dirigir la síntesis de ARNm, por ejemplo, el promotor T5. Ejemplos de dichas secuencias de control de trascripción particularmente adecuadas para el uso en plantas transgénicas incluyen virus del mosaico de la coliflor (CaMV) y el virus del mosaico de escrofularia (FMV). Otros promotores conocidos para controlar la expresión de genes en células procarióticas o eucarioticas o sus virus y los cuales se pueden usar en algunas modalidades de la invención incluyen el promotor SV40, promotor E.coli lac o trp, el promotor fago lambda P|_, promotor tac, promotor T7, y lo similar. Un vector de expresión opcionalmente contiene un sitio de unión a ribosoma para la iniciación de la traducción, y un terminador de trascripción, tal como Pinll. El vector también opcionalmente incluye secuencias apropiadas para la amplificación de la expresión, por ejemplo, un intensificador. Además, los vectores de expresión de la presente invención opcionalmente contienen uno o más genes marcadores seleccionabas para proveer un rasgo fenotípico para la selección de las células huésped transformadas. Los genes marcadores adecuados incluyen aquellos que codifican para la resistencia a espectinomicina o estreptomicina antibiótica (por ejemplo, el gen aada), el gen de estreptomicina fosfotransferasa (SPT) que codifica para la resistencia a la estreptomicina, el gen de neomicina fosfotransferasa (NPTII) que codifica para la resistencia a canamicina o geneticina, el gen de higromicina fosfotransferasa (HPT) que codifica para la resistencia a higromicina. Los genes marcadores seleccionables adicionales incluyen resistencia a dihidrofolato reductasa o neomicina para el cultivo celular eucariótico, y resistencia a la tetraciclina o amplicilina en E. coli. Un vector de expresión ejemplar para la expresión de poiipéptidos de HHDH de la presente invención se representa en la figura 1. Los vectores de la presente invención se pueden emplear para transformar un huésped apropiado para permitir al huésped expresar una proteína o polipéptido de la invención. Los ejemplos de huéspedes de expresión apropiados incluyen células bacterianas, tales como E. col¡, B. subtilis, y Streptomyces. En sistemas bacterianos, un número de vectores de expresión se puede seleccionar, tal como, por ejemplo, vectores de expresión y clonación de E. coli multifuncionales. Los polinucleótidos de HHDH de la invención también se pueden fusionar, por ejemplo, en la estructura a ácidos nucleicos que codifican para una secuencia de secreción/localización, a la expresión del polipéptido objetivo a un compartimiento celular deseado, membrana, u organelo de una célula, o para dirigir la secreción del polipéptido al espacio periplásmico o en los medios de cultivo celular. Dichas secuencias son conocidas por aquellos de experiencia, e incluyen péptidos líder de secreción, secuencias que tienen como objetivo el organelo (por ejemplo, secuencias de localización nuclear, señales de retención del retículo endoplásmico (ER), secuencias de tránsito mitocondrial, secuencias de tránsito de cloroplastos), secuencias de localización/fijación de membrana (por ejemplo, secuencias de transferencia de paro, secuencias de fijación GPI), y lo similar.
Huéspedes de expresión La presente invención también se refiere a células huésped diseñadas que son transducidas (transformadas o transfectadas) con un vector o construcción de la invención (por ejemplo, un vector de clonación de la invención o un vector de expresión de la invención), así como la producción de polipéptidos de la invención mediante técnicas recombinantes. El vector puede ser, por ejemplo, una plásmido, una partícula viral, un fago, etc. La célula huésped puede ser una célula eucariótica, tal como una célula de origen vegetal. Alternativamente, la célula huésped puede ser una célula procariótica, tal como una célula de origen vegetal. La introducción de la construcción en la célula huésped se puede realizar mediante la transfección de fosfato de calcio, transfección mediada por DEAE-Dextrano, electroporación, u otras técnicas comunes (Davis, L., Dibner, M. y Battey, I. (1986) Basic Methods in Molecular Biologv). Las células huésped diseñadas se pueden cultivar en medios nutrientes convencionales modificados como sea apropiado para la activación de los promotores, selección de los transformantes, o amplificación del polinucleótido de HHDH. Las condiciones del cultivo, tales como la temperatura, el pH y lo similar, son aquellos usados previamente con la célula huésped para la expresión, y serán aparentes para aquellos expertos en la técnica y en las referencias citadas aquí, que incluyen, por ejemplo, Sambrook, Ausubel y Berger, así como, por ejemplo, Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas aquí. Los polipéptidos de HHDH de la invención se pueden producir en células que no son de origen animal, tales como plantas, levadura, hongos, bacterias, y lo similar. Además de Sambrook, Berger y Ausubel, detalles con respecto a cultivos celulares que no son de origen animal se pueden encontrar en Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg New York) y Atlas y Parks (eds) The Handbook of Microbíological Media (1993) CRC Press, Boca Ratón, FL. La célula huésped puede ser una célula eucariótica, tal como una célula de origen vegetal. Alternativamente, la célula huésped puede ser una célula procariótica, tal como una célula bacteriana. La introducción de la construcción en la célula huésped se puede efectuar mediante la transfección con fosfato de calcio, transfección mediada por DEAE-Dextrano, electroporación, u otras técnicas comunes (Davis, L., Dibner, M., y Battey, I. (1986) Basic Methods ¡n Molecular Bioloqv).
Polipéptidos de fusión para purificación Los polipéptidos de HHDH de la presente invención se pueden expresar también como parte de un polipéptido de fusión para facilitar la purificación del polipéptido de HHDH codificado. Los polinucleótidos que codifican dichos polipéptidos de fusión comprenden una secuencia de ácido nucleico correspondiente a un polinucleótido de HHDH de la presente invención, que está fusionado en estructura a un dominio que facilita la purificación. Como se usa aquí, el término "dominio que facilita purificación" se refiere a un dominio que media la purificación del polipéptido al cual está fusionado. Los dominios de purificación adecuados incluyen péptidos de quelación de metal, módulos histidina-triptofano que permiten la purificación en metales inmovilizados, una secuencia la cual se une a glutationa (por ejemplo, GST), una marca de hemagglutinina (HA) (correspondiente a un epítope derivado de la proteína hemagglutinina de influenza; Wilson et al. (1984) Cell, 37: 767), secuencias de proteína de unión a maltosa, el epítope FLAG utilizado en la extensión FLAGS/sistema de purificación de afinidad (Immunex Corp. Seattle, WA), y lo similar. La inclusión de una secuencia enlazadora de polipéptido segmentable-proteasa entre el dominio de purificación y el polipéptido de HHDH es útil para facilitar la purificación. Un vector de expresión contemplado para el uso en las composiciones y métodos descritos aquí que se provee para la expresión de una proteína de fusión que comprende un polipéptido de la invención fusionado a una región de polihistidina separada mediante un sitio de segmentación de enterocinasa. Los residuos de histidina facilitan la purificación en IMIAC (cromatografía de afinidad iónica de metal inmovilizado, como se describe en Porath et a!. (1992) Protein Expression and Purification 3: 263-281) aunque el sitio de segmentación de enterocinasa provee unos medios para la separación del polipéptido de HHDH de la proteína de fusión. Los vectores pGEX (Promega; Madison, Wl) se pueden usar para expresar los polipéptidos ajenos como las proteínas de fusión con glutationa S-transferasa (GST). En general, dichas proteínas de fusión son solubles y se pueden purificadas fácilmente de células lisadas mediante la adsorción a perlas de ligando-agarosa (por ejemplo, glutationa-agarosa en el caso de fusiones de GST) seguido por la elusión en la presencia de un ligando libre.
Producción y recuperación de polipéptidos de HHDH La presente invención además proporciona un método para la elaboración de un polipéptido de HHDH, dicho método comprende: (a) el cultivo de una célula huésped transformada con un polinucleótido de HHDH bajo condiciones adecuadas para la producción del polipéptido de HHDH; y (b) la recuperación del polipéptido de HHDH. Usualmente, la recuperación es desde el medio de cultivo de la célula huésped, la célula huésped o ambos, usando técnicas de recuperación de proteína que con bien conocidas en la técnica, incluyendo aquellas descritas posteriormente. Siguiendo la transducción de una cepa huésped adecuada y crecimiento (cultivación) de la cepa huésped a una densidad celular apropiada, el promotor seleccionado se induce mediante medios apropiados (por ejemplo, desplazamiento de la temperatura o inducción química) y las células se cultivan por un periodo adicional. Las células típicamente se recolectan mediante centrifugación, separadas mediante medios físicos o químicos, y el extracto crudo resultante retenido para purificación adicional. Las células microbianas empleadas en la expresión de proteínas se pueden separar mediante cualquier método conveniente, que incluye ciclizacion por congelación-deshielo, sonicación, separación mecánica, o el uso de agentes de lisación celular, u otros métodos, los cuales son bien conocidos por aquellos expertos en la técnica. Como es notado, muchas referencias son disponibles para el cultivo y producción de muchas células, que incluyen células de origen bacteriano, vegetal, animal (especialmente mamíferos) y de origen arquebacteriano. Ver, por ejemplo, Sambrook, Ausubel, y Berger (todos mencionados anteriormente), así como Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas aquí; Doyle y Griffiths (1997) Mammalian Cell Culture: Essential Techniques John Wiley and Sons, NY; Humason (1979) Animal Tissue Techniques, cuarta edición W. H. Freeman and Company; y Ricciardelli, er a/., (1989) In vitro Cell Dev. Biol. 25: 1016-1024. Para cultivo y regeneración de células de origen vegetal, Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (eds) (1995) Plant Cell. Tissue and Orqan Culture: Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg New York); Jones, ed. (1984) Plant Gene Transfer and Expression Protocols, Humana Press, Totowa, New Jersey y Plant Molecular Bioloqy (1993) R. R. D. Croy, Ed. Bios Scientific Publishers, Oxford, U.K. ISBN 0 12 198370 6. Los medios de cultivo celular en general se exponen en Atlas y Parks (eds.) The Handbook of Microbioloqical Media (1993) CRC Press, Boca Ratón, FL. La información adicional para el cultivo celular se encuentra en la literatura comercial disponible tal como Life Science Research Cell Culture Catalogue (1998) de Sigma-Aldrich, Inc (St Louis, MO) ("Sigma-LSRCCC") y, por ejemplo, The Plant Culture Catalogue and supplement (1997) también de Sigma-Aldrich, Inc (St Louis, MO) ("Sigma-PCCS"). Los polipéptidos de HHDH de la presente invención se pueden recuperar y purificar de cultivos celulares recombinantes mediante cualquiera de un número de métodos bien conocidos en la técnica, que incluyen sulfato de amonio o solvente (por ejemplo, etanol, acetona, y lo similar) precipitación, extracción ácida, cromatografía de intercambio aniónico o catiónico, cromatografía de fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad (por ejemplo, usando cualquiera de los sistemas de marcado observados aquí), cromatografía de hidroxilapatita, y cromatografía de lecitina. Las etapas de repliegue de proteína se pueden usar, según se desee, en la terminación de la configuración de la proteína madura. Finalmente, la cromatografía líquida de alta resolución (HPLC) se puede emplear en las etapas de purificación finales. Además de las referencias observadas anteriormente, una variedad de métodos de purificación son bien conocidos en la técnica, incluyendo, por ejemplo aquellos expuestos en Sandana (1997) Bioseparation of Proteins, Academic Press, Inc.; y Bollag et al. (1996) Protein Methods. 2a Edición. Wiley-Liss, NY; Walker (1996) The Protein Protocole Handbook Humana Press, NJ, Harris y Angal (1990) Protein Purification Applications: A Practical Approach. IRL Press en Oxford, Oxford, Inglaterra; Harris y Angal Protein Purification Methods: A Practical Approach, IRL Press en Oxford, Oxford, Inglaterra; Scopes (1993) Protein Purification: Principies and Practice 3a Edición, Springer Verlag, NY; Janson y Ryden (1998) Protein Purification: Principies, High Resolution Methods and Applications, Segunda Edición. Wiley-VCH, NY; y Walker (1998) Protein Protocols on CD-ROM, Humana Press, NJ. En algunos casos puede ser deseable producir los polipéptidos de HHDH de la invención en una escala grande adecuada para las aplicaciones industriales y/o comerciales. En dichos casos se emplean los procedimientos de fermentación en volumen. Un procedimiento de fermentación en volumen ejemplar para producir HHDH se provee en el ejemplo 2. Brevemente, un polinucleótido de HHDH se clona en un vector de expresión, tal como, por ejemplo, el vector representado en la figura 1 (PCK110700). Después de la inserción del polinucleótido de interés dentro de un vector, el vector se transforma en huésped bacteriano, tal como, por ejemplo, E. coli BL21 (Strategene, La Jolla, CA) después de pasar a través de E. coli TOP10 (Invitrogen, Carlsbad, CA) usando métodos estándar. Las células transformadas se cultivan en un medio nutriente adecuado para la producción del polipéptido usando métodos que son bien conocidos en la técnica. Por ejemplo, la célula se puede cultivar mediante la cultivación en matraz oscilante, fermentación a pequeña escala o gran escala (que incluye la fermentación continua, por lotes, alimentación por lote o en estado sólido) en fermentadores de laboratorio o de tipo industrial realizados en un medio adecuado y bajo condiciones que permiten al polipéptido ser expresado y/o aislado. La cultivación toma lugar en un medio nutriente adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, usando procedimientos conocidos en la técnica. Los medios adecuados están disponibles de proveedores comerciales o se pueden preparar de acuerdo a composiciones publicadas (por ejemplo, en catálogos de American Type Cultura Coliection). El polipéptido secretado se puede recuperar directamente del medio nutriente (cultivo). El polipéptido resultante se puede aislar mediante métodos conocidos en la técnica. Por ejemplo, el polipéptido se puede aislar del medio nutriente mediante procedimientos convencionales que incluyen, pero no se limitan a, centrifugación, filtración, extracción, secado por aspersión, evaporación, o precipitación. El polipéptido aislado entonces se puede purificar adicionalmente mediante una variedad de procedimientos conocidos en la técnica que incluyen, pero no se limitan a, cromatografía (por ejemplo, de intercambio iónico, afinidad, hidrófoba, cromato- enfoque, y exclusión por tamaño), procedimientos electroforéticos (por ejemplo, enfoque isoeléctrico preparativo), solubilidad diferencial (por ejemplo, precipitación de sulfato de amonio), o extracción (ver, por ejemplo, Bollag et al. ( 996) Protein Methods. 2a Edición, Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook. Humana Press, NJ; Bollag et al. (1996) Protein Methods, 2a Edición. Wiley-Liss, NY; Walker (1996) The Protein Protocols Handbook. Humana Press, NJ). Un procedimiento para la recuperación del polipéptido de HHDH de un lisado celular se ilustra en el ejemplo 3. Se cree que pl de la HHDH de tipo silvestre de SEQ ID NO: 2 puede ser también demasiada baja para la precipitación de polietilenimina (PEI) para usarse para purificar la HHDH de ADN. Los solicitantes han descubierto que se pueden hacer los siguientes cambios de residuo en relación al alineamiento en SEQ ID NO: 2 para producir los polipéptidos de HHDH de la presente invención que tienen una pl suficientemente alta para permitir el aislamiento mediante la precipitación de PEI, pero sin pérdida de la actividad enzimática de HHDH: E40Q.K, E42Q,K, E46Q,K, E56Q.K, E58Q.K, E61Q.K, y E64Q, K. De esta manera, en otra modalidad, la presente invención se refiere a un polipéptido de HHDH que se puede aislar de la solución mediante la precipitación de PEI, el polipéptido de HHDH, cuando se alinea con SEQ ID NO: 2, que tiene cinco o más de los cambios de residuo seleccionados del grupo que consiste de E40Q.K, E42Q.K, E46Q.K, E56Q.K, E58Q,K, E61Q.K, y E64Q.K. Por ejemplo, la precipitación de PEI se aplica al polipéptido de HHDH de SEQ ID NO: 744: MSTAIVTNVKHFGGMGSALRLSEAGHTVACHDESFKHQDQLKAFAKTYPQLI P SEQEPAELIEAVTSALGQVDVLVSNDIYPVEWRPIDKYAVEDYRGTVEAL QIKPFALVNAVASQMKKRKSGHIIFITSAAPFGPWKELSTYSSARAGASALAN ALSKELGEYNIPVFAIAPNYLHSGDSPYYYPTEPWKTSPEHVAHVRKVTALQ R LGTQKELGELVAFLASGSCDYLTGQVFWLTGGFPVIERWPGMPE. Este polipéptido se codifica mediante el oligonucleótido de SEQ ID NO: 743: atgagcaccgctattgtcaccaacgtcaaacattttggaggtatgggtagcgctctgcgtctgagcgaagct ggtcataccgtcgcttgccatgatgaaagctttaagcatcaggatcaactgaaagcttttgctaaaacctacc cacagctgatcccaatgagcgaacaggaaccagctgaactgattgaagctgtcaccagcgctcttggtca ggtcgatgtactggtcagcaacgatatctatcctgtggaatggcggccaatcgataaatacgctgtcgagga ttacaggggtactgtcgaagctctgcagatcaagccatttgctctagtgaatgctgtcgcttcgcaaatgaag aagcgaaagtcggggcacatcatcttcatcacttcggctgccccgttcgggccatggaaggagctatcgac ttactcttcggctcgagctggggctagtgcactagctaatgctctatcgaaggagctaggagagtacaatatc ccggtgttcgctatcgctccgaattacctacactcgggggattcgccgtactattaccccactgagccgtgga agacttctccggagcacgtggctcacgtgcgtaaggtgactgctctacaacgactagggactcaaaaaga gctgggggaattggtggcatttttggcatctggctcttgtgattatttgactggccaggtgttttggttgacaggcg gctttcccgtcatcgaacgttggcccggcatgcccgaataatgaggatccggccaaactgttgtccgtctgca tcacctctaggtaatgtgagcggatacgatgccc. Los sistemas de trascripción/traducción libres de células también se pueden emplear para producir polipéptidos de HHDH usando los polinucleótidos de la presente invención. Varios de dichos sistemas son comercialmente disponibles. Una guía general para los protocolos de trascripción y traducción in vitro se encuentra en Tymms (1995) In vitro Transcription and Translation Protocols: Methods in Molecular Bioloav. Volumen 37, Garland Publishing, NY. El etil-4-cloroacetato (ECAA) es el sustrato para la reacción de reducción acoplada usando KRED/GDH para producir (S)-4-cIoro-3-hidroxibutirato de etilo (ECHB). El ECHB entonces se usa como el sustrato para la reacción de HHDH. Sin embargo, el material de inicio ECAA es un inhibidor potente (Ki aproximadamente = 70 µ?) de HHDH. Debido a que la reacción catalizada de KRED/GDH puede ir al término del 99.9%, en lugar del 99.97% deseado, entonces ECAA al 0.1% queda en el material de ECHB y este ECAA al 0.1% puede inhibir la reacción de HHDH. En otras palabras, el sustrato remanente de la primera reacción es un inhibidor en la segunda reacción. Por lo tanto, es deseable que los polipéptidos de HHDH de la presente invención tengan resistencia a la inhibición mediante ECAA. Los solicitantes han descubierto que se podrían hacer los siguientes cambios de residuo en relación al alineamiento en SEQ ID NO: 2 para producir polipéptidos de HHDH de la presente invención que demuestran resistencia aumentada contra la inhibición mediante: ECAA: A4V, A82Y, A134V, G136W, G136V, L142R, L178V, W238L, A240T, W249Y, M252I. De esta manera, en otra modalidad, la presente invención se refiere a un polipéptido de HHDH que es resistente a la inhibición mediante ECAA, el polipéptido de HHDH, cuando se alinea con SEQ ID NO: 2, que tiene uno o más de los cambios de residuo seleccionados del grupo que consiste en A4V, F82Y, T134V, F136W, F136V, L142R, L178V, W238L, A240T, W249Y y M252I. Un método para analizar los polipéptidos de HHDH de la presente invención para su reactividad en la presencia de ECAA se describe en el ejemplo 5C aquí. Un método cromatográfico de gas para seleccionar los productos de reacción del ejemplo 5C, y determinar la cantidad de producto producido, se describe en el ejemplo 6B en este documento.
Métodos de uso de polipéptidos de HHDH Como describió anteriormente, los polipéptidos de HHDH de la presente invención se pueden usar para catalizar la conversión de derivados del ácido 4-halo-3-hidroxibutírico a derivados del ácido 4-nucleófilo sustituido-3-hidroxibutírico. Las haiohidrina deshalogenasas novedosas de la presente invención son útiles en el procedimiento para resolver enzimáticamente una mezcla de epóxidos enantioméricos mediante la reacción de la mezcla con un nucleofilo aniónico en la presencia de haiohidrina deshalogenasa, en donde la enzima preferiblemente reacciona con uno de los enantiómeros epoxídicos con el nucleofilo para formar una mezcla de alcohol sustituido con nucleofilo vecinal enriquecido enantioméricamente resultante y el epóxido sin reaccionar enriquecido en el otro enantiómero, en la manera descrita en la publicación WO 01/90397, la cual se incorpora aquí para referencia en su totalidad. Los aspectos anteriores y otros aspectos de la invención se pueden entender mejor junto con los siguientes ejemplos no limitativos.
EJEMPLOS EJEMPLO 1 Construcción de constructores de expresión para la expresión de haloihidrina deshalogenasa El gen para haiohidrina deshalogenasa de Agrobacteríum sp es codón optimizado (SEQ ID NO: 1) para la expresión en E. Coli basado en la secuencia de aminoácidos de la haiohidrina deshalogenasa de Agrobacteríum sp. (SEQ ID NO: 2). El gen se sintetiza usando oligómeros de 60 mer, y se clona en el vector de expresión PCK110700 (representado en la figura 1) bajo el control de un promotor T5. El vector se transforma en E. Coli TPO10 (Invitrogen, Carlsbad, CA) del cual el ADN plásmido se prepara usando métodos estándar. El ADN plásmido entonces se transforma en E. Coli BL21 (Stratagene, La Jolla, CA), el huésped de expresión, usando métodos estándar. Un clon se encuentra en la genoteca de expresión que expresa HHDH activa. El gen de este clon es secuenciado (ver SEQ ID NO: 1 (HHDH) y se encuentra que codifica para la HHDH de Agrobacteríum sp. (SEQ ID NO: 2). Los polinucleótidos que codifican para halohidrona deshalogenasas de la presente invención son de manera similar clonados en el vector PCK 110700, representado en la figura 1 , entonces se transforman y expresan de E.Coli BL21 después de pasar a través de E.Coli TOP10 usando métodos estándar.
EJEMPLO 2 Producción de HHDH En un termentador agitado aireado, 10.0 I de medio de crecimiento que contiene 0.528 g/l de sulfato de amonio; 7.5 g/l de trihidrato de fosfato ácido de di-potasio; 3.7 g/l de fosfato diácido de potasio; 2 g/l de extracto de levadura de Tastona-154; 0.05 g/l de sulfato ferroso; y 3 ml/l de una solución de elemento de traza que contiene 2 g/l de dihidrato cloruro de calcio, 2.2 g/l de septahidrato de sulfato de cinc, 0.5 g/l de monohidrato de sulfato de manganeso, 1 g/l de heptahidrato de sulfato cuproso; 0.1 g/l de decahidrato de borato de sodio y 0.5 g/l de EDTA, se lleva a una temperatura de 30°C. El termentador se inocula con un cultivo exponencial tardío de Escherchia coli BL21 (Stratagene, La Jolla, CA) equipado con plásmido que contiene polinucleótidos de HHDH como se describe en el ejemplo 1 , entonces se desarrollan en un matraz de oscilación que contiene LB, 1 % de glucosa (Sigma Chemical Co., St Loius, MO), y 30 µg/ml de cloranfenicol (Sigma Chemical Co., St Louis, MO) a una densidad óptica de inicio en 600 nm (OD6oo) de 0.5 a 2.0. El termentador se agita a 500-1500 rpm y se suministra aire al recipiente de fermentación en 1.0-15.0 l/min para mantener un nivel de oxígeno disuelto de 30% de saturación o mayor. El pH del cultivo se controla en 7.0 mediante la adición de 20% v/v de hidróxido de amonio. Después el cultivo alcanza un OD6oo de 40, la temperatura se mantiene a 30°C y la expresión de halohidrina deshalogenasa se induce mediante la adición de isopropil-p-D-tiogalactosida (IPTG) (Sigma Chemical Corp., St Louis, MO) a una concentración final de 1 mM. El cultivo de desarrolla por otras 15 horas. Después de la inducción, las células se recolectan mediante centrifugación y se lavan con 10 mM de regulador de pH de fosfato de potasio, pH 7.0. La pasta celular se usa directamente en el procedimiento de recuperación corriente abajo o se almacena a -80°C hasta su uso.
EJEMPLO 3 Preparación de la enzima La pasta celular del ejemplo 2 se lava al suspender 1 volumen húmedo en peso de pasta celular en 3 volúmenes de 100 mM de Tris/sulfato (pH 7.2) seguido por la centrifugación a 5000 g durante 40 minutos en un Sorval 12BP. La pasta celular lavada se suspende en 2 volúmenes de 100 mM de Tris/sulfato (pH 7.2). La HHDH intracelular se libera de las células al pasar la suspensión a través de un homogeneizador en dos pasos usando una presión de 984.2 kg/cm2 manométricos para el primer paso y 562.4 kg/cm2 manométricos en el segundo paso. El lisado celular se deja enfriar a 4°C entre los pasos a través del homogeneizador. El lisado se calienta a temperatura ambiente después se añade o el MnS04 2.5M (concentración final 50-350 mM), o una solución 10% p/v de polietilenimina (PEI), pH 7.2, (concentración final 0.6-1.0% p/v) al lisado y se agita durante 30 minutos. El homogenado se centrifuga a entre 5,000 y 10,000 g en una centrifugadora de laboratorio estándar durante 30 a 60 minutos. El sobrenadante se desala, se concentra mediante ultrafiltración, se dispersa en contenedores poco profundos, se congela a -20°C y se liofiliza en un polvo y se almacena a -80°C. Para valorar la calidad de la preparación después de la fermentación, el lisado celular que contiene la enzima halohidrina deshalogenasa expresada se ensaya de acuerdo al siguiente protocolo. Aproximadamente 50 µ? de lisado celular clarificado en 100 mM de Tris-S04, 100 mM de NaCN, pH 8.0 se mezcla con etil-(S)-4-cloro-3-hidroxibutirato (ECHB) (Sigma Aldrich, St Louis, MO). El volumen de reacción total es de 0.2 mi. La reacción se incuba a temperatura ambiente durante 30 minutos a 1 hora. La reacción se extrae con 7 volúmenes de acetato de etilo y la capa orgánica se remueve a un frasco de cromatografía de gas (GC) 1.8 mi. La capa orgánica se analiza mediante GC para la presencia del producto etil-(R)-4-ciano-3-hidroxibutirato. La cantidad de producto producida se determina mediante la comparación a una curva estándar preparada y analizada bajo las mismas condiciones.
EJEMPLO 4 Tamiz de alto rendimiento para la presencia de actividad de HHDH A. no cianohidrina en agarosa Ei siguiente tamiz se usa para indagar la presencia de actividad HHDH. En el día 1, colonias transformadas recientemente en un bandeja Q (Genetix USA, Inc. Beaverton, OR) que contiene 200 mi agar LB + glucosa al 1 %, 30 µg/ml de cloranfenicol se seleccionan usando un colector de colonias robótico Q-bot® (Genetix USA, Inc., Beaverton, OR) en placas Nunc de 384 pozos de poca profundidad que contienen medio (70 µ?/???? 2xYT + glucosa al 1%, 30 µ? ?t?? de cam) (Nalge Nunc International, Rochester, NY) para crecer toda la noche a 30°C, 250 revoluciones por minuto (rpm), 85% de humedad relativa (RH). Un control negativo (E.coli BL21 con vector vacío) y un control positivo (E. Coli BL21 con vector que contiene HHDH Mz1/2G5, SEQ ID NO: 31) se incluye. Estos cultivos de placa de pozo maestro se cubren con una cinta microporosa AirPore™ (Qiagen, Inc., Valencia California). En el día 2, los cultivos de placa maestra son cuadriculados en membranas de nilón (membrana de nilón Pall Biodyne B pre-cortada para Omnitray, 115 x 76 mm, Nalge Nunc #250385) entonces se colocan en una bandeja Q (Genetix USA, Inc., Beaverton, OR) que contiene 200 mi de agar LB + 1% de glucosa, 30 µ9/??? de cloranfenicol. Las bandejas Q se incuban a 30°C durante 8-12 horas hasta que se detecte crecimiento. Cada membrana de nilón se transfiere a una bandeja Q que contiene medio de inducción: 200 mi de agar BL + 1 mM de IPTG, 30 µg/m! de cloranfenicol. Las bandejas Q se incuban entonces a 23°C o a temperatura ambiente toda la noche. En el día 3, la placa de ensayo se prepara como sigue: una solución de 150 mi de 10 mM de Tris-S04, pH 7.0, y 1.0% agarosa de bajo punto de fusión se prepara y enfría a cerca de 45°C. Se añade NaCI 5M para proporcionar una concentración final de NaCI 500mN. Bromcresol púrpura (BCP) y (S)-4-cloro-3-hidrox¡butirato de etilo (ECHB) se añaden a las concentraciones finales de 0.004% y 0.3%, respectivamente. La solución se vierte en una bandeja Q de 150 mi y se deja solidificar. Se remueve la membrana de nilón con las colonias de la bandeja Q que contiene medios de inducción y se invierte en la placa de ensayo. La membrana se representa por imagen a través de bandejas Q invertidas usando ChemStation Alpha Imaging (Alpha Innotech Corporation, San Leandro, California), abertura establecida de 4 con un 420 nm (filtro de +/- 10 nm). Se adquiere una imagen durante la primera hora de la reacción. Los datos de intensidad para cada mancha de imagen entonces se normalizan al valor de las manchas de control. Un valor normalizado mayor que uno indica la presencia de actividad de HHDH. Los clones activos de este tamiz se caracterizan además usando el método descrito en el ejemplo 5A. Los clones de este tamiz además también se caracterizan usando el ensayo de rendimiento del medio descrito en el ejemplo 5B.
B. Cianohidrína en agarosa Este tamiz de alto rendimiento se usa cuando se desea seleccionar los polipéptidos de HHDH que exhiben actividad de HHDH en la presencia de producto cianohidrina, por ejemplo, (R)-4-ciano-3-hidroxibutirato de etilo. El protocolo para los días uno y dos es el mismo como en la parte A. En el día 3, la placa de ensayo se prepara como sigue: una solución 150 mi de agarosa de bajo punto de fusión se produce como sigue: 10 mM de Tris, pH 7.0, 2.0% de agarosa de bajo punto de fusión (fundida en microondas), 0.004% de bromcresol púrpura (1.2 ml/150 mi). La solución se enfría a 37°C toda la noche. En el día 3, ECHB (0.45 mi de ECHB/150 mi de solución) y (R)-4-c¡ano-3-hidroxibutirato de etilo (8.26 mi de (R)-4-ciano-3-hidroxibutirato de etilo/150 mi de solución) se añaden a ECHB al 0.3% y 400 mM de una solución de (R)-4-ciano-3-hidroxibutirato de etilo. La solución se mezcla y vierte en una bandeja Q de 150 mi, después se deja solidificar como se describe en la parte A. La membrana de nilón con las colonias se remueve de la bandeja Q que contiene los medios de inducción y se vierte en la placa de ensayo. A la membrana se proyecta en imagen como se describe en la parte A anterior. Los clones activos de este tamiz además se caracterizan usando el método de cromatografía de gas descrito en el ejemplo 5B (ensayo de rendimiento del medio).
EJEMPLO 5 Caracterización de actividad halohidrina deshalogenasa A. Método de cromatografía de gas para la detección del etil-(R)-4-ciano-3-hidroxibutirato producto A una solución de (S)-4-cloro-3-hidroxibutirato de etilo (10 mM-100mM) en 500 mM de HCN (500 mM de NaCN ajustado a pH 7.0 con ácido fosfórico) se añade a la enzima de halohidrina deshalogenasa como una solución predisuelta en el mismo regulador de pH. Después con el tiempo, las alícuotas de la mezcla se separan y extraen con tres volúmenes de acetato de etilo. La capa orgánica entonces se analiza para el (R)-4-ciano-3-hidroxibutirato de etilo mediante cromatografía de gas (GC), como se describe posteriormente en el ejemplo 6. Las muestras se toman en varios puntos en el tiempo, y el área pico de la cianohidrina producto, (R)-4-ciano-3-hidroxibutirato de etilo, se gráfica como una función del tiempo. Los puntos en el tiempo se seleccionan con baja conversión, por ejemplo, menos de 5% de conversión, para evitar el efecto de la inhibición del producto (por ejemplo, 0.5%, 1.0%, 1.5%, 2.0%, 2.5%), 3.0%, etc.). Las áreas pico se convierten a unidades de concentración usando una curva estándar que se prepara para el (R)-4-ciano-3-hidroxibutirato de etilo. La actividad de la halohidrina deshalogenasa se determina en unidades de µ???? (cianohidrina producida)/min/mg (catalizador de halohidrina deshalogenasa total). Las actividades relativas de algunos de los clones se muestran en el cuadro 2, computadas como actividad de enzima de HHDH mejorada/actividad de HHDH de agrobacterium sp. (SEQ ID NO: 2).
CUADRO 2 Actividad de HHDH relativa de enzimas de HHDH mejorada en substratos de ECHB B. Ensayo de rendimiento de medio- cromatografía de gas en presencia de producto de cianohidrina Los resultados se recogen de las pozos deseadas (10 µ? de cultivo) en la presencia de las placas de pozo maestras pre-selección y se transfieren a los pozos de placas NUNC de 96 pozos (cada pozo que contiene 200 ul de LB + 1 % de glucosa, 30 g/ml de cloranfenicol (cam)) para crecer durante toda la noche a 30°C, 250 rpm, 85% de humedad relativa. Los controles positivos se perforan de las placas de pozo maestras de pre-selección.
El siguiente día, las alícuotas de 10 µ? del crecimiento durante la noche se sub-cultivan en placas de 96 pozos con profundidad cada pozo conteniendo 300 µ? de 2xYT, 100 mM de NaH2P04/Na2HP04 de pH 7, 1 mM de MgS04, 30 µ9??? de cam. Estas placas se incuban a 30°C, 250 rpm, 85% de humedad relativa, 2-4 horas, hasta que la densidad celular alcance un OD 600 nm = 0.6. Las placas entonces se inducen con 1 mM de isopropil-p-D-tiogalactosida (IPTG) (por ejemplo, 10 µ?/???? de una solución de almacenamiento IPTG 34 mM o 30 ul/pozo de solución de almacenamiento IPTG 10 mM) y se incuba a 30°C durante la noche, 250 rpm, 85% de humedad relativa. El siguiente día, las placas se centrifugan (4000 rpm, 10 minutos, 4°C) para nodulizar las células y el media consumido se descarta. Las placas se pueden congelar a -80°C por una hora para ayudar en el rompimiento celular. Las células en forma de pellas se lisan mediante la adición de solución de lisado 200 µ? B-PER® (Pierce, cat# 78243) que contiene 2.04 M de etiI-4-ciano-3-hidroxibutirato ("NH") (320 g/l) (fw= 57, d 1.19, 26.8 ml/100 mi de mezcla de lisis) y 1 ul/10 mi de DNasa (~200 U/ul). La mezcla de células y solución lisina se mueve experimentando efecto de vórtice para resuspender las células y después incubarlas a 50°C con agitación durante dos horas. Una solución de reacción se obtiene en una campana de ventilación, preferiblemente usando un contenedor desechable de plástico (polipropileno). El volumen de la solución de reacción se determina mediante el tamizado con un número de placas. Para preparar la solución de reacción que tiene una concentración final 1 de NaCN, NaCN (fw=49.01, 4.9 g/100 mi) se añade al volumen deseado de 100 mM de fosfato de sodio pH 7 para proporcionar una concentración de 1.47M de NaCN. A cada 68 mi de la solución de NaCN se añaden 24 mi de NaCI de almacenamiento 5M y 8 mi de HCI concentrado (-10 M) para producir el volumen deseado de la mezcla de reacción que es NaCI 1.2 M, 800 mM de HCI, y NaCN 1M. El pH final de la mezcla de reacción es 7.0-7.02. A esta solución se añade ECHB (fw = 166.6, d=1.19) en 280 µ?/100 mi de una mezcla de reacción para obtener una concentración final de 20 mM. Las concentraciones finales en la mezcla de reacción son HCN ~1M, NaCI 2M, 50 mM de fosfato de sodio pH 7.0 a 7.2, 20 mM de ECHB. 200 µ? de la mezcla de reacción se añaden a las células lisadas en cada pozo. Las placas se sellan usando sellador de calor PlateLoc™ velocidad 11. Las placas selladas entonces se agitan a temperatura ambiente durante 120 minutos. Después de agitarse, las placas se abren y 1 mi de timol 1 mM (disuelto en acetato de etilo) se añade a capa pozo. Las placas se vuelven a sellar usando el sellador de calor PlateLoc™ velocidad 11 , se agita vigorosamente, después se deja asentar durante aproximadamente 1 minuto para dejar que las capas se separen. Alícuotas de 150 µ? de la capa superior se transfieren a placas de reacción de polipropileno (PP) con pozos poco profundos de fondo redondo Costar (Cat# 3365) usando un manipulador de desplazamiento líquido positivo Hydra™ (Mode Asp, AV 150, AH 2650, EH 37800, WH 3730, WV completa, Lavado 3). Las muestras se transfieren a la placa con pozos profundos a las placas con pozos poco profundos. Estas placas se sellan usando el sellador de calor PlateLoc™ velocidad 11 y se almacenan a -20°C hasta el análisis mediante cromatografía de gas como se describe en el ejemplo 6B.
C. Ensayo de rendimiento de medio - cromatografía de gas para la inhibición en presencia de etil-4-cloroacetoacetato (ECAA) Los resultados se recogen de los pozos deseados (10 µ? de cultivo) en las placas de pozos maestras de pre-selección y se transfieren en los pozos de placas NUNC de 96 pozos (cada pozo conteniendo 200 ul de LB + 1% de glucosa, 30 g/ml de cloranfenicol (cam)) para el crecimiento durante la noche a 30°C, 250 rpm, 85% de humedad relativa. Los controles positivos se recogen de las placas de pozos maestras de pre-selección. El siguiente día, las alícuotas de 10 µ? del crecimiento durante la noche se sub-cultivan en placas de 96 pozos con profundidad, cada pozo conteniendo 300 µ? de 2xYT, 100 mM de aH2P04 a2HP04 de pH 7, 1 mM de MgS04, 30 µg/ml de cam. Estas placas se incuban a 30°C, 250 rpm, 85% de humedad relativa, 2-4 horas, hasta que la densidad celular alcance un OD 600 nm = 0.6. Las placas entonces se inducen con 1 mM de IPTG (por ejemplo, 10 µ?/???? de una solución de almacenamiento IPTG 34 mM o 30 ul/pozo de solución de almacenamiento IPTG 10 mM) y se incuba a 30°C durante la noche, 250 rpm, 85% de humedad relativa. Al siguiente día, las placas se centrifugaron (4000 rpm, 10 min, 4°C) para nodulizar las células y el medio consumido se descarta. Las placas se pueden congelar a -80°C por una hora para ayudar en la ruptura celular. Las células en forma de pellas se lisan mediante la adición de 200 µ? de solución de lisado B-PER® (Pierce. cat# 78243) con 1 ul/10 mi de DNasa (~200 U/ul). La mezcla de células y solución de lisado se mueve experimentando efecto de vórtice para resuspender las células y después incubarlas a 50°C con agitación durante dos horas. Una solución de reacción se obtiene en una campana de ventilación, preferiblemente usando un contenedor desechable de plástico (polipropileno) (volumen determinado mediante el tamizado con un número de placas). Para preparar la solución de reacción que tiene una concentración final 1 M de NaCN, NaCN (fw=49.01, 4.9 g/100 mi) se añade al volumen deseado de 100 mM de fosfato de sodio pH 7 para proporcionar una concentración de 1.47 M de NaCN. A cada 68 mi de la solución de NaCN se añaden 24 mi de NaCI de almacenamiento 5M y 8 mi de HCI concentrado (~10 M) para producir el volumen deseado de la mezcla de reacción que es NaCI 1.2 M, 800 mM de HCI, y NaCN 1M. El pH final de la mezcla de reacción es 7.0-7.02. A esta solución se añade ECHB (fw = 166.6, d=1. 9) para una concentración final de 100 mM (1400 µ?/100 mi de mezcla de reacción) y ECAA (fw= 164.6, d=1.21) para una concentración final de 5 mM (100 µ?/100 mi de mezcla de reacción). 200 µ? de la mezcla de reacción se añaden a las células lisadas en cada pozo. Las placas se sellan usando sellador de calor PlateLoc™ velocidad 1 . Las placas selladas entonces se agitan a temperatura ambiente durante 60 minutos. Después de agitar, las placas se abren y 1 mi de timol 1 mM (disuelto en acetato de etilo) se añade a capa pozo. Las placas se vuelven a sellar usando sellador de calor PlateLoc™ velocidad 11, se agitan vigorosamente, después se dejan asentar durante aproximadamente 1 minuto para dejar que las capas se separen. Alícuotas de 150 µ? de la capa superior se transfieren a placas de reacción de polipropileno (PP) de pozos poco profundos de fondo redondo Costar (Cat# 3365) usando un manipulador de desplazamiento líquido positivo Hydra™ (modo Asp, AV 150, AH 2650, EH 37800, WH 3730, VW completo, Lavado 3). Las muestras se transfieren a la placa con pozos profundos en las placas de pozos poco profundos. Estas placas se sellan usando el sellador de calor PlateLoc™ velocidad 11 y se almacenan a -20°C hasta el análisis mediante cromatografía de gas como se describe en el ejemplo 6B.
EJEMPLO ? A. Detección de (R)-4-ciano-3-hidroxibutirato de etilo mediante cromatografía de gas El (R)-4-ciano-3-hídroxibut¡rato de etilo producido en el ejemplo 5A se analiza usando cromatografía de gas con detección de ionización a la flama (FID) usando una columna Agilent® HP-5™, longitud de 30 m, diámetro interior de 0.32 mm, película de 0.25 µ??, usando el siguiente programa: 1 minuto a 100°C, 5°C/minuto durante 10 minutos, 25°C/minuto durante 2 minutos; después 2 minutos a 200°C. Las temperaturas de entrada y de salida son ambas de 300°C, y el caudal es de 2 mi/minuto. Bajo estas condiciones, (R)-4-ciano-3-hidroxibutirato de etilo eluye en 6.25 minutos y (S)-4-cloruro-3-hidroxibutirato de etilo eluye en 4.5 minutos. La pureza química de las especies se mide usando las áreas pico integradas de los resultados de cromatografía de gas. La enantioselectividad de la halohidrina deshalogenasa (HHDH) con respecto a (R)-4-ciano-3-hidroxibutirato de etilo se mide mediante la cromatografía de gas y la detección de FID usando una columna Restek gammaDex SA™ (30 m de longitud, 0.32 µ?t? de diámetro interno) usando el siguiente programa: 25 minutos a 165°C y caudal de 2 ml/min. Las temperaturas de entrada y de salida son ambas de 230°C. Bajo estas condiciones (R)-4-ciano-3-hidrox¡butirato de etilo eluye en 19.6 minutos y (S)-4-ciano-3-hidroxibutirato de etilo eluye en 19.2 minutos.
B. Detección de (S)-4-cloro-3-hidroxibutirato de etilo restante mediante cromatografía de gas Las halohidrina deshalogenasas de la presente invención que exhiben actividad en la presencia de producto cianohidrina en el método de pre-selección del ejemplo 4B, además se caracterizan en el ensayo descrito en el ejemplo 5B. El (S)-4-cloro-3-hidroxibutirato de etilo remanente en la mezcla de reacción del ejemplo 5B se analiza usando cromatografía de gas con una columna de fenil metil siloxano al 5% Agilent® 1909IJ-413 HP-5™, 30.0 m de longitud x 320 µ?? de diámetro interno x 0.25 µ?? nominal, y un caudal de 2.6 ml/minuto. El siguiente programa se usa: 1 minuto a 100°C, 50°C/m¡nuto durante 2 minutos, 2 minutos constante, con un tiempo de ciclo de 10 minutos. Las condiciones del detector son como siguen: 300°C, 40 ml/min de H2, 450 ml/min de aire. Bajo estas condiciones, (S)-4-cloro-3-hidroxibutirato de etilo eluye en 3. 2 minutos, (R)-4-ciano-3-hidroxibutirato de etilo eluye en 3.06 minutos, y timol eluye en 3.21 minutos. La actividad se puede caracterizar mediante la cantidad de (S)-4-cloro-3-hidroxibutirato de etilo que permanece normalizado para la eficiencia de extracción, es decir, ECHB área/timol área. El timol se usa como un estándar interno para la eficiencia de extracción de los componentes de reacción de agua a acetato de etilo.
EJEMPLO 7 Producción de (R -ciano-3-hidroxibutirato de etilo a partir de (S)-4 cloro-3-hidroxibutirato de etilo A un matraz de 31 enchaquetado de 3 cuellos equipado con un agitador mecánico y conectado a un titulador automático mediante un electrodo de pH y un tubo de alimentación para la adición de la base, se carga H20 (1200 mi), NaCN (37.25 g) y NaH2P04 (125 g) para llevar la solución a pH de 7. El circulador de agua se establece a 40°C. Después de 10 minutos, se añade haiohidrina deshalogenasa SEQ ID NO: 32 como lisado celular (250 mi). La mezcla de reacción se deja agotar durante 5 minutos. Usando un embudo de adición, (S)-4-cloro-3-hidroxibutirato de etilo (45 g) se añade lentamente alrededor de 1 hora. El pH se mantiene en 7 mediante el titulador automático mediante la adición de NaOH 10 (27 mi) alrededor de 17 horas. Subsecuentemente, la cromatografía de gas de una muestra de reacción muestra la conversión completa al producto. Se añade Celita (16 g) al matraz, el cual después se conecta a una bomba de diafragma, cuya descarga se burbujea en NaOH 5M (200 mi), para remover el HCN. La mezcla se calienta a 60°C bajo una presión de 100 mm Hg. Después de 1 hora, un borboteador de aire sumergido se añade a la solución para ayudar a eliminar el HCN. Después de 3 horas, un detector de HCN indica menos de 5 ppm de HCN en los gases de descarga. La mezcla se deja enfriar a temperatura ambiente, después se filtra a través de una almohadilla de Celita. Se extrae el filtrado con acetato de butilo (3 x 800 mi) y las capas orgánicas combinadas se filtran a través de una almohadilla de carbón vegetal activado. Se elimina el solvente bajo vacío mediante evaporación rotatoria para proveer 28.5 g de (R)-4-ciano-3-hidroxibutirato de etilo. La pureza es de 98% (p/p) mediante HPLC y el exceso enantiomérico es >99% (por GC quiral, el enantiómero S no es detectable). Como se usa aquí, el término "exceso enantiomérico" o "e.e." se refiere a la diferencia absoluta entre el mol o fracciones en peso de enantiómeros principal (F(+)) y menor (F(-)) (es decir, |F(+) - F(-)|), donde F(+) + F(- ) = 1. El porcentaje de e.e es 100 X |F(+) - F(.)|. La composición enantiómerica se puede caracterizar fácilmente al usar el método de cromatografía de gas descrito en el ejemplo 6, anteriormente, y usando métodos que son conocidos en la técnica.
EJEMPLOS 8-12 Conversión de (R)-4-cloro-3-hidroxibutirato de etilo a (S)-4-ciano-3- hidroxibutirato de etilo Para cada uno de los ejemplos 8-12, a un recipiente de 170 mi conectado a un titulador automático mediante un electrodo de pH y un tubo de alimentación para la adición de una base, se carga NaCN (1.5 g, 31 mmol) y agua (50 mi). El recipiente se sella y el pH se ajusta a 7 mediante la adición de H2SO4 concentrado (0.9 mi). La mezcla de reacción se calienta a 40°C y se trata con una solución de halohidrina deshalogenasa (0.4 g en 10 mi de agua). i La halohidrina deshalogenasa usada para estos ejemplos tiene las secuencias de polipéptido dadas para las siguientes SEQ ID NOs: Ejemplo 8 SEQ ID NO: 32 Ejemplo 9 SEQ ID NO: 90 Ejemplo 10 SEQ ID NO: 94 Ejemplo 1 1 SEQ ID NO: 96 Ejemplo 12 SEQ ID NO: 98 Entonces, se añade (S)-4-cloro-3-hidroxibutirato de etilo (5.00 g, 30.1 mmol) vía una jeringa. El titulador automático mantiene el pH a 7 mediante la adición de NaCN 4M. El progreso de las reacciones se monitorea mediante el registro de volumen acumulado de la solución de NaCN añadida vs tiempo. La figura 2 muestra el porcentaje de conversión de (S)-4-cloro-3-hidroxi-butirato de etilo (calculado de los equivalentes acumulados del NaCN añadido) vs tiempo para cada uno de estos ejemplos. El ejemplo 8 usa una halohidrina deshalogenasa que tiene la secuencia de aminoácidos SEQ ID NO: 32, que es la secuencia de aminoácidos de la halohidrina deshalogenasa nativa de Agrobacterium radiobacter AD1 (hheC), expresada del ácido nucleico correspondiente a SEQ ID NO: 31. La comparación del porcentaje de conversión contra el tiempo para los ejemplos 9 hasta el 12 con aquel del ejemplo 8 muestra que la halohidrina deshalogenasa de la presente invención tiene actividad más grande que la halohidrina deshalogenasa nativa de Agrobacterium radiobacter AD1 (hheC).
Todas las publicaciones, patentes, solicitudes de patentes, y otros documentos citados en esta solicitud se incorporan para referencia en su totalidad para todos los propósitos al mismo grado como si cada publicación individual, patente, solicitud de patente, u otro documento se indicaran individualmente para ser incorporados para referencia para todos los propósitos. Aunque las modalidades preferidas de la invención se han ilustrado y descrito, será fácilmente apreciado que varios cambios se pueden hacer en ésta sin separarse de la esencia y alcance de la invención.

Claims (4)

NOVEDAD DE LA INVENCION REIVINDICACIONES
1.- Un polipéptido aislado que tiene actividad de HHDH, en donde el polipéptido comprende una secuencia de aminoácidos que consiste de: (a) una secuencia de aminoácidos que es por lo menos 99% idéntica a SEQ ID NO: 4, 12, 16, 18, 34, 38, 44, 48, 52, 66, 80, 84, 114, 154, 158, 170 ó 270; (b) un polipéptido que tiene una secuencia de aminoácidos que es por lo menos 98% idéntica a la SEQ ID NO: 10, 14, ó 68, 118, 164, 166 o 180; (c) una secuencia de aminoácidos que es por lo menos 97% idéntica a la SEQ ID NO: 110, 162, 262, 422, 440 ó 520; (d) una secuencia de aminoácidos que es por lo menos 96% idéntica a la SEQ ID NO: 116 6 448; (e) una secuencia de aminoácidos que es por lo menos 95% idéntica a la SEQ ID NO: 264, 266, 470 ó 476; (f) una secuencia de aminoácidos que es por lo menos 93% idéntica a la SEQ ID NO: 200; (g) una secuencia de aminoácidos que es por lo menos 89% idéntica a la SEQ ID NO: 442; (h) una secuencia de aminoácidos que es por lo menos 88% idéntica a la SEQ ID NO: 702; (i) una secuencia de aminoácidos que es por lo menos 80% idéntica a la SEQ ID NO: 2, cuando se alinea óptimamente con la SEQ ID NO: 2, y que comprende por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A o P o S en la posición 3, V en la posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 61, V en la posición 63, R en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91 , D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, S o G en la posición 114, A en a posición 115, P en la posición 117, N en la posición 120, E en la posición 121, P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181 , K en la posición 184, Y en la posición 186, L en la posición 194, N en la posición 198, M en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254; o (j) una secuencia de aminoácidos codificada mediante un ácido nucleico que hibridiza bajo condiciones severas sustancialmente sobre toda la longitud de un ácido nucleico que corresponde a SEQ ID NO: 1 , y en donde el polipéptido codificado, cuando se alinea óptimamente con SEQ ID NO: 2, comprende una secuencia de aminoácidos que tiene por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A, P o S en la posición 3, V en a posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31 , G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 61 , V en la posición 63, R o Q en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91, D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, G o S en la posición 14, A en la posición 115, P en la posición 117, N en la posición 120, E en la posición 121, P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G o I en la posición 181 , K en la posición 184, Y en la posición 86, L en la posición 194, N en la posición 198; M en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 254. 2 - El polipéptido aislado de conformidad con la reivindicación 1 , caracterizado además porque el polipéptido tiene una secuencia de aminoácidos correspondiente a SEQ ID NO: 2, pero con una o más sustituciones seleccionadas del grupo que consiste de: S2T, cualquiera de T3A o T3P, A4V, V6D, cualquiera de V9I o V9F, K10L, G13S, G14S, M15K, G16C, cualquiera de S17T o S17R, cualquiera de R20S, R20C o R20K, A24T, H26Q, V28F, A29T, C30A, H31 L, E33G, S34R, F35L, K36N, Q37H, E40D, F44L, A45P, cualquiera de T47P o T47A, K52N, M54V, S55R, E56D, E58K, cualquiera de E61 G o E61 D, I63V, Q72R, V75I, L76P, S78C, F82Y, cualquiera de P84S o P84L, E85Q, K91 E, A93D, E95Q o E95G, D96N, R107K, V1 12A, cualquiera de A1 14T o A1 14G o A114S, V1 15A, S1 17P, K120N, K121 E, R122P, H126R, I130V, A133S, T134A o T134V, F136L o F136W o F136V, W139H, L142I o L142R, T144S, T146S, A152T, C153S, cualquiera de T154S o T154A, I168V, P169T, Y177F, L178V, S180I, E181G o E181 I, P184K, F186Y, T194I, H198N, V199M, K215E, V236G, F237V, W238L, A240T, cualquiera de M245I o M245A o M245V, W249Y, M252V o M252I, y E254V. 3. - El polipéptido aislado de conformidad con la reivindicación 1, caracterizado además porque el polipéptido tiene por lo menos 1.4 veces a 10,000 veces mayor actividad de HHDH en comparación a la actividad de HHDH de tipo salvaje que tiene la secuencia de aminoácidos de SEQ ID NO:
2. 4. - Un polipéptido aislado o recombinante que tiene por lo menos 1.4 veces a 10,000 veces mayor actividad de HHDH en comparación a la actividad de HHDH de tipo salvaje que tiene la secuencia de aminoácidos de SEQ ID NO: 2, y en donde el polipéptido es codificado por un ácido nucleico que hibridiza bajo condiciones severas sobre sustancialmente toda la longitud de un ácido nucleico que tiene una secuencia seleccionada del grupo que consta de SEQ ID NO: 3, 9, 11, 13, 15, 17, 33, 37, 43, 47, 49, 51 , 65, 67, 79, 83, 109, 113, 115, 117, 153, 157, 161, 163, 165, 169, 179, 161 , 199, 261 , 263, 265, 269, 421, 439, 441 , 447, 469, 475, 519, 701 , 725, 729, 731, 733, 735, 737, y secuencias complementarias de las mismas. 5. - Un polinucleótido aislado o recombinante que codifica el polipéptido como se define en la reivindicación 1 , 2 ó 4. 6.- El polinucleótido aislado o recombinante de conformidad con la reivindicación 5, caracterizado además porque el polinucleótido comprende uno o más codones seleccionados del grupo que consiste de ATT que codifica para isoluecina en la posición 5 del aminoácido en un polipéptido de HHDH codificado; AAG que codifica para lisina en la posición 36 de aminoácido en un polipéptido de HHDH codificado; ATT que codifica para isoluecina en la posición 63 del aminoácido en un polipéptido de HHDH codificado; GAG que codifica para el ácido glutámico en la posición 95 del aminoácido en un polipéptido de HHDH codificado; y CCC que codifica para la prolina en la posición 188 del aminoácido en un polipéptido de HHDH codificado; en donde la posición del aminoácido es la posición correspondiente en el polipéptido codificado con referencia a SEQ ID NO: 2. 7. - Un vector de expresión que comprende el polinucleótido como se define en la reivindicación 5 operablemente unido a un promotor. 8. - Una célula huésped transformada con el polinucleótido como se define en la reivindicación 5. 9. - Un método para la elaboración de un polipéptido de HHDH, dicho método comprende (a) cultivar la célula huésped como se define en la reivindicación 8 bajo condiciones adecuadas para la producción del polipéptido de HHDH, y (b) recuperar el polipéptido de HHDH. 10. - El polipéptido aislado de conformidad con la reivindicación 1, caracterizado además porque tiene resistencia a la inhibición mediante ECAA y el polipéptido, cuando se alinea con SEQ ID NO: 2, tiene uno o más de los cambios de residuo seleccionados del grupo que consiste de A4V, F82Y, T134V, F136W, F136V, L142R, L178V, W238L, A240T, W249Y y M252I. 11- El polipéptido de conformidad con la reivindicación 1 , caracterizado además porque el polipéptido comprende una secuencia de aminoácidos que es por lo menos 99% idéntica a SEQ ID NO: 4, 12, 16, 18, 34, 38, 44, 48, 52, 66, 80, 84, 114, 154, 158, 170 ó 270. 12. - El polipéptido de conformidad con la reivindicación 1, caracterizado además porque el polipépíido comprende una secuencia de aminoácidos que es por lo menos 98% idéntica a SEQ ID NO: 10, 14 ó 68, 118, 164, 166 ó 180. 1
3. - El polipéptido de conformidad con la reivindicación 1, caracterizado además porque el polipéptido comprende una secuencia de aminoácidos que es por lo menos 80% idéntica a SEQ ID NO: 2, cuando se alinea óptimamente con SEQ ID NO: 2, y que comprende por lo menos un residuo de aminoácido seleccionado del grupo que consiste de T en la posición 2 (residuo), A, P o S en la posición 3, V en a posición 4, D en la posición 6, cualquiera de I o F en la posición 9, L en la posición 10, S en la posición 13, S en la posición 14, K en la posición 15, C en la posición 16, T o R en la posición 17, cualquiera de C o S o K en la posición 20, T en la posición 24, Q en la posición 26, F en la posición 28, T en la posición 29, A en la posición 30, L en la posición 31, G en la posición 33, R en la posición 34, L en la posición 35, N en la posición 36, H en la posición 37, D en la posición 40, L en la posición 44, P en la posición 45, cualquiera de P o A en la posición 47, N en la posición 52, V en la posición 54, R en la posición 55, D en la posición 56, K en la posición 58, G o D en la posición 61, V en la posición 63, R en la posición 72, I en la posición 75, P en la posición 76, C en la posición 78, Y en la posición 82, cualquiera de S o L en la posición 84, A en la posición 85, E en la posición 91 , D en la posición 93, Q o G en la posición 95, N en la posición 96, K en la posición 107, A en la posición 112, cualquiera de T, G o S en la posición 114, A en la posición 115, P en la posición 117, N en la posición 120, E en la posición 121, P en la posición 122, R en la posición 126, V en la posición 130, S en la posición 133, A o V en la posición 134, L, W o V en la posición 136, H en la posición 139, I o R en la posición 142, S en la posición 144, S en la posición 146, T en la posición 152, S en la posición 153, cualquiera de S o A en la posición 154, V en la posición 168, T en la posición 169, F en la posición 177, V en la posición 178, I en la posición 180, G en la posición 181, K en la posición 184, Y en la posición 186, L en la posición 194, N en la posición 198; M en la posición 199, E en la posición 215, G en la posición 236, V en la posición 237, L en la posición 238, T en la posición 240, cualquiera de I o A o V en la posición 245, Y en la posición 249, V o I en la posición 252, y V en la posición 25
4.
MXPA06001725A 2003-08-11 2004-08-11 Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados. MXPA06001725A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US49438203P 2003-08-11 2003-08-11
US54603304P 2004-02-18 2004-02-18
PCT/US2004/026654 WO2005017141A1 (en) 2003-08-11 2004-08-11 Improved halohydrin dehalogenases and related polynucleotides

Publications (1)

Publication Number Publication Date
MXPA06001725A true MXPA06001725A (es) 2006-04-27

Family

ID=34197997

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06001725A MXPA06001725A (es) 2003-08-11 2004-08-11 Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados.

Country Status (12)

Country Link
US (3) US7824898B2 (es)
EP (1) EP1654356A1 (es)
JP (1) JP2007502123A (es)
KR (1) KR20060064617A (es)
AU (1) AU2004265693A1 (es)
BR (1) BRPI0413501A (es)
CA (1) CA2535255A1 (es)
IL (1) IL173261A0 (es)
MX (1) MXPA06001725A (es)
NO (1) NO20060405L (es)
SG (1) SG148180A1 (es)
WO (1) WO2005017141A1 (es)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004015132A2 (en) 2002-08-09 2004-02-19 Codexis, Inc. Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives
US7588928B2 (en) * 2003-08-11 2009-09-15 Codexis, Inc. Halohydrin dehalogenases and related polynucleotides
KR20060071397A (ko) 2003-08-11 2006-06-26 코덱시스, 인코포레이티드 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법
US7541171B2 (en) 2003-08-11 2009-06-02 Codexis, Inc. Halohydrin dehalogenases and related polynucleotides
SG148180A1 (en) * 2003-08-11 2008-12-31 Codexis Inc Improved halohydrin dehalogenases and related polynucleotides
WO2007071599A2 (en) * 2005-12-21 2007-06-28 Basf Se A process for the production of an optically enriched tertiary alcohol
ATE437954T1 (de) 2006-03-03 2009-08-15 Basf Se Verfahren zur herstellung optisch aktiver 5- substituierter 2-oxazolidinone aus racemischen epoxiden und cyanat unter einsatz einer halohydrin-dehalogenase
US7879585B2 (en) 2006-10-02 2011-02-01 Codexis, Inc. Ketoreductase enzymes and uses thereof
EP2518152A3 (en) 2007-03-07 2013-03-06 Mitsubishi Rayon Co., Ltd. Improved halohydrin epoxidase
US7977078B2 (en) 2007-08-24 2011-07-12 Codexis, Inc. Ketoreductase polypeptides for the production of (R)-3-hydroxythiolane
ES2575005T3 (es) 2008-06-13 2016-06-23 Codexis, Inc. Método de síntesis de variantes de polinucleótidos
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
US8426178B2 (en) 2008-08-27 2013-04-23 Codexis, Inc. Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
WO2010027710A2 (en) 2008-08-27 2010-03-11 Codexis, Inc. Ketoreductase polypeptides and uses thereof
US8187856B2 (en) 2008-12-18 2012-05-29 Codexis, Inc. Recombinant halohydrin dehalogenase polypeptides
ES2448816T3 (es) 2009-02-26 2014-03-17 Codexis, Inc. Biocatalizadores de transaminasa
SG177331A1 (en) 2009-06-22 2012-02-28 Codexis Inc Ketoreductase-mediated stereoselective route to alpha chloroalcohols
US8921079B2 (en) 2009-06-22 2014-12-30 Codexis, Inc. Transaminase reactions
US20110082055A1 (en) * 2009-09-18 2011-04-07 Codexis, Inc. Reduced codon mutagenesis
DK2478137T3 (da) 2009-09-18 2017-11-27 Codexis Inc Reduceret kodonmutagenese
US8895271B2 (en) 2009-12-08 2014-11-25 Codexis, Inc. Synthesis of prazole compounds
EP2566497B1 (en) 2010-05-04 2015-07-29 Codexis, Inc. Biocatalysts for ezetimibe synthesis
US8932836B2 (en) 2010-08-16 2015-01-13 Codexis, Inc. Biocatalysts and methods for the synthesis of (1R,2R)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine
HUE037616T2 (hu) 2010-12-08 2018-09-28 Codexis Inc Biokatalizátorok és eljárások armodafinil szintéziséhez
EP2697662B1 (en) 2011-04-13 2018-06-06 Codexis, Inc. Biocatalytic process for preparing eslicarbazepine and analogs thereof
WO2013074650A1 (en) 2011-11-18 2013-05-23 Codexis, Inc. Biocatalysts for the preparation of hydroxy substituted carbamates
WO2013170050A1 (en) 2012-05-11 2013-11-14 Codexis, Inc. Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
CN104372038A (zh) * 2013-08-12 2015-02-25 南京朗恩生物科技有限公司 两步催化制备(r)-4-氰基-3-羟基丁酸乙酯的方法
JP6643987B2 (ja) 2013-11-13 2020-02-12 コデクシス, インコーポレイテッド ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法
CN107002050A (zh) 2014-11-25 2017-08-01 科德克希思公司 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
DK3256577T3 (da) 2015-02-10 2020-09-14 Codexis Inc Ketoreduktase polypeptider til syntesen af chirale forbindelser
CN104745557B (zh) * 2015-03-05 2017-09-22 浙江工业大学 来源于嗜清洁细小杆菌卤醇脱卤酶突变体及其应用
CN106139887A (zh) 2015-05-13 2016-11-23 三星电子株式会社 包含编码具有羟化酶活性的蛋白质的基因的微生物和使用其降低样品中氟化甲烷浓度的方法
EP3178922B1 (en) 2015-12-07 2019-05-22 Samsung Electronics Co., Ltd. Bacterial cytochrome p450 protein variant and method of reducing concentration of fluorinated methane in sample using the same
EP3587393B1 (en) 2018-06-21 2024-01-17 F.I.S.- Fabbrica Italiana Sintetici S.p.A. Enzymatic process for the preparation of droxidopa
CN109295044A (zh) * 2018-10-26 2019-02-01 浙江大学 一种卤醇脱卤酶突变体及其应用

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2840722B2 (ja) * 1989-07-20 1998-12-24 日東化学工業株式会社 4‐ハロ‐3‐ヒドロキシブチロニトリルの製造法
US5210031A (en) * 1989-07-20 1993-05-11 Nitto Chemical Industry Co., Ltd. Process for the production of R(-)-4-halo-3-hydroxybutyronitrile
JP3073037B2 (ja) 1991-03-04 2000-08-07 三菱レイヨン株式会社 ハロヒドリンエポキシダ−ゼ遺伝子を有する組換え体プラスミドおよび該プラスミドにより形質転換された微生物
JP3171931B2 (ja) * 1992-06-02 2001-06-04 高砂香料工業株式会社 (R)−(−)−4−シアノ−3−ヒドロキシ酪酸t−ブチルエステル及びその製造方法
GB9512837D0 (en) * 1995-06-23 1995-08-23 Zeneca Ltd reduction of ketone groups
US5908953A (en) * 1996-12-18 1999-06-01 Mitsubishi Chemical Corporation Method for producing (R)-4-cyano-3-hydroxybutyric acid lower alkyl ester
JP3728045B2 (ja) 1997-01-31 2005-12-21 三菱レイヨン株式会社 ハロヒドリンより光学活性ジオールへの変換を触媒する新規なタンパク質
EP0879890A1 (en) 1997-05-21 1998-11-25 Rijksuniversiteit te Groningen Enantioselective epoxide hydrolases and genes encoding these
PT1054860E (pt) * 1997-12-19 2007-06-22 Pfizer Ireland Pharmaceuticals Processo para a síntese 1, 2 dióis
HUP0103659A3 (en) * 1998-04-30 2003-01-28 Kaneka Corp Process for producing 6-cyanomethyl-1,3-dioxane-4-acetic acid derivatives
DE69937374T2 (de) * 1998-08-05 2008-07-24 Kaneka Corp. Verfahren zur Herstellung von 3,5-dihydroxy substituierten Estern als Zwischenprodukte zur Herstellung optisch aktiver 2-(6-(Hydroxymethyl)-1,3-dioxan-4-yl)-essigsäure-Derivate
JP2003504070A (ja) * 1999-07-09 2003-02-04 フォルシュングスツェントルム ユーリッヒ ゲゼルシャフト ミット ベシュレンクテル ハフツング ケトカルボン酸及びそのエステルの還元のための方法
CZ20012792A3 (cs) * 1999-12-03 2002-03-13 Kaneka Corporation Polypeptid, polynukleotid kódující polypeptid, expresní vektor, transformant a způsob přípravy
EP1158054A1 (en) 2000-05-25 2001-11-28 Rijksuniversiteit te Groningen Enzymatic conversion of epoxides
WO2004015132A2 (en) * 2002-08-09 2004-02-19 Codexis, Inc. Enzymatic processes for the production of 4-substituted 3-hydroxybutyric acid derivatives
SG148180A1 (en) 2003-08-11 2008-12-31 Codexis Inc Improved halohydrin dehalogenases and related polynucleotides
US7588928B2 (en) 2003-08-11 2009-09-15 Codexis, Inc. Halohydrin dehalogenases and related polynucleotides
US7541171B2 (en) * 2003-08-11 2009-06-02 Codexis, Inc. Halohydrin dehalogenases and related polynucleotides
KR20060071397A (ko) * 2003-08-11 2006-06-26 코덱시스, 인코포레이티드 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법

Also Published As

Publication number Publication date
CA2535255A1 (en) 2005-02-24
KR20060064617A (ko) 2006-06-13
US20100167345A1 (en) 2010-07-01
BRPI0413501A (pt) 2006-10-10
US7824898B2 (en) 2010-11-02
US8535910B2 (en) 2013-09-17
SG148180A1 (en) 2008-12-31
WO2005017141A1 (en) 2005-02-24
US20120208259A1 (en) 2012-08-16
AU2004265693A1 (en) 2005-02-24
NO20060405L (no) 2006-03-10
EP1654356A1 (en) 2006-05-10
US20050153417A1 (en) 2005-07-14
IL173261A0 (en) 2006-06-11
JP2007502123A (ja) 2007-02-08
US8101395B2 (en) 2012-01-24

Similar Documents

Publication Publication Date Title
MXPA06001725A (es) Halohidrina deshalogenasas mejoradas y polinucleotidos relacionados.
US7588928B2 (en) Halohydrin dehalogenases and related polynucleotides
US7541171B2 (en) Halohydrin dehalogenases and related polynucleotides
US7858348B2 (en) N-acetyl-(R,S)-beta-amino acid acylase gene
JP5919192B2 (ja) βアミノ酸の調製
AU2009200199A1 (en) Ribulose 1,5-bisphosphate carboxylase/oxygenase polypeptides and related polynucleotides
WO2007115797A2 (en) A group of novel enantioselective microbial nitrile hydratases with broad substrate specificity
CN110951705A (zh) 胺脱氢酶突变体、酶制剂、重组载体、重组细胞及其制备方法和应用
WO2007047773A2 (en) Alanine 2,3-aminomutases and related polynucleotides
CN113583989A (zh) 经修饰的苏氨酸转醛酶及其应用
JP2004525641A (ja) OchrobactrumAnthropi由来のD−ヒダントイナーゼ
JP2008537477A (ja) 改良されたハロヒドリンデハロゲナーゼおよび関連のポリヌクレオチド
US8940516B2 (en) Method for the synthesis of chiral cyanohydrins via a hydroxynitrile lyase from brassicaceae
CN108624571B (zh) 具有催化dhap或d-g3p合成丙烯酸功能的酶及其应用
WO2024041972A1 (en) Nucleic acids encoding improved lipase proteins
WO2023126017A2 (zh) L-苏氨酸醛缩酶及其制备方法与应用
EP4027969A1 (en) Peroxidase activity towards 10-acetyl-3,7-dihydroxyphenoxazine
CN117402846A (zh) L-丙氨酸脱氢酶突变体及其制备方法和应用
JP2010187573A (ja) (r)−3−ヒドロキシイソ酪酸の製造方法
JPWO2008129873A1 (ja) S体選択性フェニルアラニンアミノムターゼ、これをコードするDNA及び(S)−β−フェニルアラニンの製造方法並びに(S)−β−フェニルアラニン類似体の製造方法