ES2712682T3 - Biocatalizadores y métodos para la hidroxilación de compuestos químicos - Google Patents

Biocatalizadores y métodos para la hidroxilación de compuestos químicos Download PDF

Info

Publication number
ES2712682T3
ES2712682T3 ES13788385T ES13788385T ES2712682T3 ES 2712682 T3 ES2712682 T3 ES 2712682T3 ES 13788385 T ES13788385 T ES 13788385T ES 13788385 T ES13788385 T ES 13788385T ES 2712682 T3 ES2712682 T3 ES 2712682T3
Authority
ES
Spain
Prior art keywords
compound
polypeptide
substrate
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13788385T
Other languages
English (en)
Inventor
Haibin Chen
Yong Koy Bong
Fabien Cabirol
Anupam Gohel
Tao Li
Jeffrey C Moore
Martina Quintanar-Audelo
Hong Yang
Steven Collier
Derek Smith
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Application granted granted Critical
Publication of ES2712682T3 publication Critical patent/ES2712682T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/24Proline; Hydroxyproline; Histidine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/188Heterocyclic compound containing in the condensed system at least one hetero ring having nitrogen atoms and oxygen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11002Procollagen-proline dioxygenase (1.14.11.2), i.e. proline-hydroxylase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Un polipéptido diseñado que tiene actividad de prolina hidroxilasa, que comprende una secuencia de aminoácidos que tiene al menos un 80% de identidad de secuencia con la SEQ ID NO: 2 en la que la prolina hidroxilasa tiene al menos 1,2 veces mayor actividad en comparación con el polipéptido de la SEQ ID NO: 2 y en el que la secuencia de aminoácidos comprende una diferencia de residuos en comparación con la secuencia de la SEQ ID NO: 2 en la posición del residuo X166.

Description

DESCRIPCION
Biocatalizadores y metodos para la hidroxilacion de compuestos qmmicos
1. CAMPO TECNICO
[0001] La descripcion se refiere a biocatalizadores para la hidroxilacion de compuestos qmmicos.
3. ANTECEDENTES
[0002] Los derivados de prolina con grupos funcionales en los carbonos del anillo son bloques de construccion utiles para la smtesis de compuestos farmaceuticos debido a la conformacion restringida de la prolina. Uno de estos derivados, la prolina hidroxilada, es un material de partida para la smtesis de varios compuestos terapeuticos, incluidos los antibioticos carbapenem (vease, por ejemplo, Altamura et al., 1995, J Med Chem. 38 (21): 4244-56), inhibidores de la enzima convertidores de angiotensina, inhibidores de la proteasa (ver, por ejemplo, Chen et al., 2002, J Org Chem. 67 (8):2730-3; Chen et al., 2006, J Med Chem. 49 (3):995-1005), analogos de acido nucleico (efimov et al., 2006, Nucleic Acids Res. 34 (8):2247-2257), inhibidores de la isopreniltransferasa (O'Connell et al., 2000, Chem Pharm Bull. 48 (5):740- 742), y la construccion de la biblioteca de farmacos (Vergnon et al., 2004, J Comb Chem. 6 (1):91-8; Remuzon P., 1996, Tetrahedron 52:13803-13835). De manera similar, los derivados hidroxilados de un homologo de prolina, el acido L-pipecolico, tambien conocido como homoprolina, tambien sirven como bloques de construccion para compuestos farmaceuticos. Por ejemplo, el acido hidroxipipecolico es un intermediario en la smtesis de los inhibidores de la p-lactamasa (ver, por ejemplo, los documentos WO2009091856, WO2010126820 y US20110046102) y los inhibidores de la enzima de conversion de TNF-alfa (TACE) (Levatic et al., 2002, Bioorg Medicinal Chem Lett. 12 (10):1387-1390).
[0003] La hidroxiprolina puede obtenerse a partir de fuentes naturales, tales como materiales vegetales y hidrolizados de colageno. La hidroxiprolina tambien se puede sintetizar qmmicamente, como a partir de los materiales de partida bromuro de alilo y acido dietilacetamida-omalonico (Kyun Lee et al., 1973, Bull. Chem. Soc. Japon, 46:2924), acido D-glutamico (eguchi et al., 1974, Bull. Chem. Soc. Japon, 47:1704-08), glioxal y acido oxaloacetico (Ramaswamy et al., 1977. J. Org. Chem. 42 (21):3440-3443) y p-alanina (Sinha et al., 2000, Proc. ECSOC-4, The Fourth International Electronic Conference on Synthetic Organic Chemistry, ISBN 3-906980-05-7).
[0004] El acido hidroxipipecolico tambien se puede obtener de plantas y otras fuentes naturales (ver, por ejemplo, Romeo et al., 1983, Phytochemistry 22 (7):1615-1617; Fowden, L., 1958, Biochem J. 70 (4):629-33; Clark-Lewis y Mortimer, 1959, Nature 184 (Suppl 16):1234-5). La smtesis qmmica del acido hidroxipipecolico se describe en Callens et al., 2010, Bulletin des Societes Bulletin des Societes Chimiques Belges 91 (8):713-723; Adams et al., 1996, Chem. Comun. 3:349-350; Botman et al., 2004, Organic Letters 6 (26):4941-4944; Cohen et al., 1956, Science 123 (3202):842-843; Beyerman et al., 1959, Recueil des Travaux Chimiques des Pays-Bas, 78 (9):648-658; Marin et al., 2004, J Org Chem. 69 (1):130-41; Kumar et al., 2005, J Org Chem. 70 (1):360-3; Liang et al., 2005, J Org Chem.
70 (24):10182-5; Kalamkar et al., 2008, J Org Chem. 73 (9):3619-22; Chiou et al., 2010, J Org Chem. 75 (5):1748-51; Lemire et al., 2010, J Org Chem. 75 (6):2077-80; y Angelique et al., 2000, Tetrahedron Lett. 41 (36):7033-7036.
[0005] El aislamiento de fuentes naturales esta limitado por la disponibilidad de materias primas, requiere la purificacion de una cantidad significativa de contaminantes de fondo y carece de ciertos diastereomeros deseados. Los metodos qmmicos sinteticos pueden requerir pasos complejos, ser difmiles de escalar a niveles de escala industrial y requerir pasos de purificacion adicionales debido a la formacion de multiples productos hidroxilados.
[0006] Otro enfoque para preparar prolina hidroxilada utiliza hidroxilasas de prolina, que son dioxigenasas dependientes de 2-oxoglutarato, que utilizan arato de 2-oxoglut (a-cetoglutarato) y O2 como co-sustratos e ion ferroso como cofactor (vease, por ejemplo, Klein et al., 2011, Adv Synth. Catal. 353:1375-1383; Patente de EE.UU. N° 5364775; y Shibasaki et al., 1999, Appl Environ Microbiol. 65 (9):4028-4031). A diferencia de las hidroxilasa de prolilos que reconocen espedficamente la peptidilprolina en el pro-colageno y los peptidos relacionados, las hidroxilasas de prolina son capaces de convertir la prolina libre en hidroxiprolina. Se conocen varias enzimas microbianas que producen cis-3-, cis-4-o trans-4-hidroxiprolina (ver, por ejemplo, Patente de EE.UU. N° 5962292; Patente de EE.UU. N° 5963254; Patente de EE.UU. N° 5854040; WO2009139365; y EP2290065) y una enzima que produce trans-3-hidroxiprolina se ha identificado en extractos del hongo Glarea lozoyensis. Muchas de las hidroxilasas de la prolina se encuentran en bacterias, donde estan asociadas con la biosmtesis de antibioticos peptfdicos. La enzima hidroxilasa cis-4-prolina tambien muestra actividad al convertir acido L-pipecolico (es decir, acido (2S)-piperidina-2-carboxflico) en acido cis-5-hidroxipipecolico (es decir, acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico; Klein et al., Supra). Se han demostrado conversiones in vitro para preparar acido 5-hidroxipipecolico usando estas enzimas, pero se ha descubierto que las hidroxilasas de prolina aisladas se desnaturalizan en condiciones de reaccion y tienen una actividad espedfica relativamente baja, lo que hace que los usos in vitro sean impracticables para aplicaciones comerciales (Klein et al., supra). Mientras que las celulas completas recombinantes que expresan hidroxilasas de prolina clonadas son mas adecuadas para los procesos industriales a gran escala, el uso de celulas completas limita las variaciones en las condiciones de reaccion, tales como altas concentraciones de sustrato; restringe los tipos de sustratos que se pueden usar con celulas enteras a aquellos que son permeables a las celulas; y da como resultado subproductos indeseables que deben separarse del producto final. Ademas, los sistemas in vivo pueden requerir medios de crecimiento definidos que no sean optimos ni rentables debido a que el uso de medios de crecimiento ricos preparados a partir de hidrolizados de protemas contienen prolina libre, que puede ser un inhibidor competitivo cuando sustratos distintos de la prolina son el objetivo. Son deseables los metodos alternativos para sintetizar formas hidroxiladas de prolina y analogos de prolina, asf como otros compuestos qmmicos, que se pueden ampliar facilmente y dar como resultado un producto estereomerico sustancialmente puro.
4. RESUMEN
[0007] La presente invencion proporciona un polipeptido disenado que tiene actividad de prolina hidroxilasa, que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia con la SEQ ID NO:2 en la que la hidroxilasa de prolina tiene al menos 1,2 veces mas actividad en comparacion con el polipeptido de SEQ ID NO:2 y en donde la secuencia de aminoacidos comprende una diferencia de residuos en comparacion con la secuencia de la SEQ ID NO:2 en la posicion de residuo X166.
[0008] La presente invencion tambien proporciona un procedimiento para preparar un compuesto de producto de formula (la),
Figure imgf000003_0001
en donde
Q se selecciona del grupo que consiste en un alquileno (C1-C5) y alquenileno (C2-C5);
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (Ci-Ca), ariloxi, alquiltio (Ci-Ca) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
R5 es hidrogeno, o un enlace directo a un atomo de carbono de L para formar un epoxido;
cada aparicion de Ra se selecciona del grupo que consiste en halo, alquilo (C1-Ca) y alquiloxi (C1-Ca); y q es un numero entero de 0 a 4;
en donde la suma de los atomos de carbono del anillo para Q L es un numero entero de 2 a 5;
con la condicion de que
(i) cuando la suma de los atomos de carbono del anillo para Q L es 2, entonces L es un metileno; y (ii) cuando la suma de los atomos de carbono del anillo para Q L es 3, entonces L es un enlace o etileno; el proceso que comprende poner en contacto el compuesto de sustrato de formula (IIa),
Figure imgf000003_0002
en donde L, Q, R1, R2, Ra y q son como se definieron anteriormente para el compuesto de formula (la); y -- - representa un enlace opcional a un atomo de carbono de L para formar un doble enlace;
con un polipeptido disenado de la invencion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0009] La presente descripcion proporciona biocatalizadores de hidroxilasa de prolina disenados, polinucleotidos que codifican los biocatalizadores, metodos de preparacion y procedimientos para preparar compuestos hidroxilados utilizando estos biocatalizadores disenados. Las hidroxilasas de prolina de la presente descripcion se han disenado para tener propiedades mejoradas con respecto a la hidroxilasa de cis-4-prolina natural (SEQ ID NO:2) de Sinorhizobium meliloti, una bacteria Gram negativa fijadora de nitrogeno. Las propiedades mejoradas del biocatalizador de las hidroxilasas de prolina disenadas incluyen, entre otras, actividad, regioselectividad, tolerancia al sustrato y estabilidad. Tambien se encuentra que las hidroxilasas de prolina modificadas hidroxilan una variedad de compuestos de sustrato, incluida la conversion selectiva del acido (2S)-piperidina-2-carboxflico (es decir, acido L-pipecolico) a acido (2S, 5S)-5-hidroxilpiperidina-2-carbox^lico (es decir, acido cis-5-hidroxipipecolico). Las enzimas ingenierizadas con propiedades mejoradas tienen una o mas diferencias de residuos en comparacion con la hidroxilasa de prolina natural, donde las diferencias de residuos ocurren en las posiciones de residuos que afectan las propiedades enzimaticas anteriores.
[0010] Por consiguiente, en un aspecto, la presente descripcion proporciona polipeptidos modificados que tienen actividad de prolina hidroxilasa, donde los polipeptidos comprenden una secuencia de aminoacidos que tiene al menos un 80% de identidad con la SEQ ID NO:2 y una o mas diferencias de residuos en comparacion con la SEQ. ID NO:2 en las posiciones de residuos seleccionadas de:X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271.
[0011] En algunas realizaciones, las diferencias de residuos en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271 se pueden seleccionar de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R. La siguiente descripcion detallada proporciona una grna sobre las opciones de diferencias de residuos que se pueden usar para preparar hidroxilasas de prolina disenadas con las propiedades biocatalfticas mejoradas deseadas.
[0012] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado tiene una secuencia de aminoacidos que comprende al menos una combinacion de caractensticas seleccionadas de:(a) X103L y X166Q; (b) X52P y X255Y; (c) X4E/L/S y X115A; (d) X25R y X58A; (e) X29A y X166T/Q/L; (f) X115H/D/G y X121F; (g) X3S, X103L y X166Q; (H)X103L, X131Y/F, y X166T/Q/L; (i) X26T, X103L y X166T/Q/L; (j) X25R, X66Q, X92V y X115E; (k) X25R, X66Q, X92V, X103L, X115E y X166Q; y (1) X3S, X25R, X66Q, X92V, X103L, X115E y X166Q.
[0013] Como se indico anteriormente, los polipeptidos disenados que tienen actividad hidroxilasa de prolina tambien son capaces de convertir el compuesto de sustrato (2), acido (2S)-piperidina-2-carboxflico en el compuesto del producto (1), (2S, 5S)-5-hidroxilpiperidina, como se muestra en el Esquema 1,
Esquema 1
Figure imgf000004_0001
con propiedades mejoradas en comparacion con la enzima natural. En algunas realizaciones, los polipeptidos disenados pueden convertir el compuesto de sustrato (2) en el compuesto del producto (1 ) con al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o 10 veces o mas La actividad de la enzima natural, y con mas del 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de exceso diastereomerico de acido (2S, 5R)-5-hidroxipiperidina-2-carboxflico.
[0014] En algunas realizaciones, los polipeptidos disenados que tienen actividad hidroxilasa de prolina tambien muestran una regioselectividad incrementada para formar acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico en exceso de otros regioisomeros, por ejemplo (2S,3R)-3-acido hidroxipiperidina-2-carboxflico, mostrado en el Esquema 1 como compuesto (1a). Asf, en algunas realizaciones, las hidroxilasas de prolina son capaces de convertir el compuesto de sustrato (2) en un compuesto de producto (1) en exceso del compuesto de producto (1a), donde la relacion de compuesto de producto (1) se formo sobre el compuesto de producto (1a) es al menos 1,5, 2, 3, 4, 5 o 6 o mas. En algunas realizaciones, las hidroxilasas de prolina disenadas con una mayor selectividad para formar el compuesto de producto (1) en exceso del compuesto de producto (1a) comprenden una secuencia de aminoacidos que tiene una o mas de las siguientes caractensticas:X103L; X115E; X131Y y X166Q, particularmente la combinacion de las caractensticas X103L y X166Q.
[0015] En algunas realizaciones, los polipeptidos disenados que tienen propiedades mejoradas tienen una secuencia de aminoacidos que comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 7678, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, y 228.
[0016] En otro aspecto, la presente descripcion proporciona polinucleotidos que codifican los polipeptidos de hidroxilasa de prolina modificados con propiedades mejoradas. Las secuencias de polinucleotidos ejemplares se proporcionan en el Listado de Secuencias e incluyen las SEQ ID NO:7. 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225 y 227.
[0017] En un aspecto adicional, la presente descripcion tambien proporciona polinucleotidos con codones optimizados que codifican un polipeptido que comprende una secuencia de aminoacidos de la hidroxilasa de prolina de tipo salvaje (SEQ ID NO:2). En algunas realizaciones, los polinucleotidos con codon optimizado tienen una expresion aumentada en una celula huesped bacteriana en comparacion con el polinucleotido de origen natural que codifica la enzima hidroxilasa de prolina. En algunas realizaciones, los polinucleotidos con codones optimizados pueden tener al menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad a la secuencia de acido nucleico optimizada de codon de la SEQ ID NO:1, 3 o 5, que codifica las secuencias polipeptfdicas identicas de la SEQ ID NO:2, 4 o 6, respectivamente. La secuencia optimizada de codon de la SEQ ID NO:1, 3 o 5 puede mejorar la expresion de la hidroxilasa de prolina de tipo salvaje codificada en al menos 1,2 veces, 1,5 veces o 2 veces o mas en comparacion con la secuencia de polinucleotidos de origen natural.
[0018] En otro aspecto, los polinucleotidos de la descripcion pueden incorporarse en vectores de expresion y celulas huesped para la expresion de los polinucleotidos y los polipeptidos de hidroxilasa de prolina codificados correspondientes. Como tal, en algunas realizaciones, la presente descripcion proporciona metodos para preparar los polipeptidos de hidroxilasa de prolina mediante el cultivo de una celula huesped que comprende el polinucleotido o vector de expresion capaz de expresar una hidroxilasa de prolina de la descripcion en condiciones adecuadas para la expresion del polipeptido modificado. En algunas realizaciones, el metodo de preparacion de la hidroxilasa de prolina puede comprender la etapa adicional de aislar el polipeptido expresado.
[0019] En algunas realizaciones, la presente descripcion tambien proporciona metodos para fabricar un polipeptido de hidroxilasa de prolina modificado, en el que el metodo puede comprender: (a) sintetizar un polinucleotido que codifica un polipeptido que comprende una secuencia de aminoacidos seleccionada de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 6062, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y que tienen una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 en las posiciones de residuos seleccionadas de:X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271, y (b) que expresan el polipeptido de hidroxilasa de prolina codificado por el polinucleotido. Como se senalo anteriormente, las diferencias de residuos en las posiciones X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R. Como se proporciona adicionalmente en la descripcion detallada, pueden incorporarse variaciones adicionales durante la smtesis del polinucleotido para preparar hidroxilasas de prolina modificadas con las correspondientes diferencias en las secuencias de aminoacidos expresadas.
[0020] En otro aspecto, los polipeptidos de hidroxilasa de prolina modificados pueden usarse en un proceso para preparar diversos compuestos hidroxilados, tales como prolina hidroxilada o acidos piperidina-2-carboxflicos hidroxilados. Por consiguiente, en algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados se pueden usar en un proceso para la conversion de un compuesto de sustrato de formula (II) en un compuesto de producto de formula (I), como se muestra a continuacion:
Figure imgf000006_0001
en donde
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio; R2 y R3 se seleccionan cada uno independientemente del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
R4 se selecciona del grupo que consiste en alquilo (C1-C6), alquenilo (C2-C6) opcionalmente sustituido, alquinilo (C2-C6), arilo, heteroarilo, cicloalquilo, heterocicloalquilo; o R4 junto con uno de R1 o R2 es un alquileno (C1-Cs) o alquenileno (C2-C5) y forma un anillo heterodclico de 5 a 8 miembros que contiene el atomo de nitrogeno, en donde el anillo esta opcionalmente sustituido con 1 a 4 grupos R6 seleccionados independientemente;
R5 es hidrogeno o un enlace que forma un epoxido con un atomo de carbono de L;
cada aparicion de R6 se selecciona independientemente del grupo que consiste en halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
---- representa un enlace opcional a un atomo de carbono de L para formar un doble enlace;
con la condicion de que
(i) cuando R4 no forma un anillo con un R2 o R3, o cuando R4 forma un anillo heterodclico de 5 miembros que contiene el atomo de nitrogeno con uno de R2 o R3, entonces L es un metileno;
(ii) cuando R4 forma un anillo heterodclico de 6 miembros que contiene el atomo de nitrogeno con uno de R2 o R3, entonces L es un enlace o etileno; y
(iii) cuando R5 es un enlace a un atomo de carbono de L para formar un epoxido, entonces R4 forma el anillo heterodclico que contiene el atomo de nitrogeno con uno de R2 o R3 y L es un alquileno (C1-C4) o alquenileno (C2-C4).
[0021] En algunas realizaciones, la hidroxilasa de prolina modificada se puede usar para la conversion de un compuesto de anillo de formula estructural (IIa) al compuesto producto hidroxilado de formula estructural (la);
Figure imgf000006_0002
en donde
Q se selecciona del grupo que consiste en un alquileno (C1-C5) y alquenileno (C2-C5);
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
R5 es hidrogeno, o un enlace directo a un atomo de carbono de L para formar un epoxido;
cada aparicion de R6 se selecciona del grupo que consiste en halo, alquilo (C1-C6) y alquiloxi (C1-C6);
q es un numero entero de 0 a 4; y
---- representa un enlace opcional a un atomo de carbono de L para formar un doble enlace;
en donde la suma de los atomos de carbono del anillo para Q L es un numero entero de 2 a 5;
con la condicion de que
(i) cuando la suma de los atomos de carbono del anillo para Q L es 2, entonces L es un metileno; y (ii) cuando la suma de los atomos de carbono del anillo para Q L es 3, entonces L es un enlace o etileno.
[0022] En algunas realizaciones, la hidroxilasa de prolina modificada se puede usar para la conversion de un compuesto de sustrato de formula estructural (IV) en el compuesto de producto hidroxilado de formula estructural (iii);
Figure imgf000007_0001
en donde,
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C-i-Ca), ariloxi, alquiltio (C-i-Ca) y ariltio; R2 y R3 se seleccionan cada uno independientemente del grupo que consiste en hidrogeno y alquilo (Ci-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca); y
R4 se selecciona del grupo que consiste en alquilo, alquenilo, alquinilo, arilo, heteroarilo, cicloalquilo y heterocicloalquilo opcionalmente sustituidos.
[0023] En algunas realizaciones, la hidroxilasa de prolina modificada se puede usar para la conversion de un compuesto de sustrato de formula estructural (VI) en el compuesto de producto hidroxilado de formula estructural (V);
Figure imgf000007_0002
en donde,
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (Ci-Ca), ariloxi, alquiltio (Ci-Ca) y ariltio; R2 y R3 se seleccionan independientemente del grupo que consiste en hidrogeno y alquilo (C1-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
cada aparicion de Ra se selecciona independientemente del grupo que consiste en halo, alquilo (C1-Ca) y alquiloxi (C1-Ca);
R7 se selecciona del grupo que consiste en hidrogeno, halo y alquilo (C1-Ca) opcionalmente sustituido y alquilaoxi (C1-Ca); o R7 junto con uno de R2 o R3 forma un anillo heterodclico de 5 a 7 miembros que contiene el atomo de nitrogeno; q es un numero entero de 0 a 4; y
---- representan dobles enlaces opcionales que forman un anillo arilo.
[0024] Las reacciones de hidroxilacion anteriores que utilizan las hidroxilasas de prolina modificadas se llevan a cabo bajo condiciones de reaccion adecuadas en presencia de un co-sustrato (por ejemplo, a-cetoglutarato), un metal de transicion divalente (por ejemplo, Fe+2) y oxfgeno molecular (es decir, O2). Las condiciones de reaccion adecuadas pueden comprender rangos de co-sustrato, metal de transicion divalente, oxfgeno molecular, asf como rangos de otros parametros, como la concentracion de reductor (por ejemplo, acido ascorbico), concentracion de detergente, pH, temperatura, tampon, sistema de solvente, carga de sustrato, carga de polipeptidos, presion y tiempo de reaccion. En algunas realizaciones, la reaccion de hidroxilacion se puede llevar a cabo, en la que la hidroxilasa de prolina modificada se inmoviliza sobre un soporte solido.
[0025] En algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender lo siguiente: (a) carga de sustrato a aproximadamente 5 g/L a 30 g/L; (b) aproximadamente 0,1 g/l a 10 g/l del polipeptido disenado; (c) aproximadamente 19 g/L (0,13 M) a 57 g/L (0,39 M) de a-cetoglutarato; (d) aproximadamente 14 g/L (0,08 M) a a3 g/L (0,3a M) de acido ascorbico; (e) aproximadamente 1,5 g/L (3,8 mM) a 4,5 g/L (11,5 mM) de FeSO4; (f) un pH de aproximadamente a a 7; (g) temperatura de aproximadamente 20° a 40°C; y (h) tiempo de reaccion de 2-24 h. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden la aireacion forzada de la solucion de reaccion con O2 a una velocidad de aproximadamente 3 l/h.
[0026] En algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender lo siguiente: (a) carga de sustrato de aproximadamente 10 g/L a 100 g/L; (b) de aproximadamente 1 g/l a aproximadamente 50 g/l de polipeptido disenado; (c) a-cetoglutarato en aproximadamente 1 a 2 equivalentes molares de compuesto de sustrato; (d) acido ascorbico en aproximadamente 0,25 a 0,75 equivalentes molares de compuesto de sustrato; (e) de aproximadamente 0,5 mM a aproximadamente 12 mM de FeSO4; (f) pH de aproximadamente 6 a 8; (g) temperatura de aproximadamente 20° a 40°C; y (h) tiempo de reaccion de 6 a 120 h. En algunos experimentos, las condiciones de reaccion adecuadas comprenden la aireacion forzada de la solucion de reaccion con O2 a una velocidad de aproximadamente 2 L/ha aproximadamente 5 L/h.
[0027] La orientacion sobre la eleccion de hidroxilasas de prolina modificadas, la preparacion de los biocatalizadores, la eleccion de sustratos enzimaticos y los parametros para llevar a cabo los procesos se describen con mas detalle en la descripcion detallada que sigue.
5. DESCRIPCION DETALLADA
[0028] Como se usa en esta memoria descriptiva y en las reivindicaciones adjuntas, las formas singulares "un", "una", "el" y "la" incluyen referentes plurales a menos que el contexto indique claramente lo contrario. Asf, por ejemplo, la referencia a "un polipeptido" incluye mas de un polipeptido.
[0029] De manera similar, "comprende", "comprenden", "que comprende" "incluye", "incluyen" y "que incluye" son intercambiables y no pretenden ser limitativos.
[0030] Debe entenderse adicionalmente que cuando las descripciones de diversas realizaciones usan el termino "que comprende", los expertos en la tecnica entendenan que en algunos casos espedficos, una realizacion puede describirse alternativamente usando el lenguaje "que consiste esencialmente en" o "que consiste en."
[0031] Se debe entender que tanto la descripcion general anterior como la siguiente descripcion detallada son solo ilustrativas y explicativas y no son restrictivas de esta descripcion.
[0032] Los encabezados de seccion utilizados en el presente documento tienen unicamente fines organizativos y no deben interpretarse como limitantes de la materia descrita.
5.1 Abreviaturas
[0033] Las abreviaturas utilizadas para los aminoacidos codificados geneticamente son convencionales y son las siguientes:
Figure imgf000008_0001
[0034] Cuando se usan las abreviaturas de tres letras, a menos que esten precedidas espedficamente por una "L" o una "D" o que esten claras en el contexto en el que se usa la abreviatura, el aminoacido puede estar en la configuracion L o D sobre el carbono a (Ca). Por ejemplo, mientras que "Ala" designa alanina sin especificar la configuracion sobre el carbono a, "D-Ala" y "L-Ala" designan D-alanina y L-alanina, respectivamente. Cuando se usan las abreviaturas de una letra, las letras mayusculas designan aminoacidos en la configuracion L sobre el carbono a y las letras minusculas designan aminoacidos en la configuracion D sobre el carbono a. Por ejemplo, "A" designa L-alanina y "a" designa D-alanina. Cuando las secuencias de polipeptidos se presentan como una cadena de abreviaturas de una o tres letras (o mezclas de las mismas), las secuencias se presentan en la direccion de amino (N) a carboxi (C) de acuerdo con la convencion comun.
[0035] Las abreviaturas utilizadas para los nucleosidos geneticamente encolados son convencionales y son las siguientes:adenosina (A); guanosina (G); citidina (C); timidina (T); y uridina (U). A menos que este espedficamente delineado, los nucleosidos abreviados pueden ser ribonucleosidos o 2'-desoxirribonucleosidos. Los nucleosidos pueden especificarse como ribonuclosidos o 2'-desoxirribonucleosidos en una base individual o en una base agregada. Cuando las secuencias de acido nucleico se presentan como una cadena de abreviaturas de una letra, las secuencias se presentan en la direccion 5' a 3' de acuerdo con la convencion comun, y los fosfatos no estan indicados.
5.2 Definiciones
[0036] En referencia a la presente descripcion, los terminos tecnicos y cientificos usados en las descripciones en este documento tendran los significados comunmente entendidos por un experto en la tecnica, a menos que se defina espedficamente lo contrario. En consecuencia, se pretende que los siguientes terminos tengan los siguientes significados:
"Protema", "polipeptido" y "peptido" se usan indistintamente en el presente documento para indicar un polfmero de al menos dos aminoacidos unidos covalentemente por un enlace amida, independientemente de la longitud o la modificacion postraduccional (por ejemplo, glicosilacion, fosforilacion, lipidacion, miristilacion, ubiquitinacion, etc.). Dentro de esta definicion se incluyen los aminoacidos D y L, y las mezclas de los aminoacidos D y L.
[0037] "Polinucleotido" o "acido nucleico" se refiere a dos o mas nucleosidos que estan unidos por enlace covalente. El polinucleotido puede estar compuesto por ribonucleotidos (es decir, un ARN), totalmente compuesto por 2' desoxirribonucleotidos (es decir, un ADN) o mezclas de desoxirribonucleotidos ribo y 2'. Mientras que los nucleosidos normalmente se uniran entre sf mediante enlaces fosfodiester estandar, los polinucleotidos pueden incluir uno o mas enlaces no estandar. El polinucleotido puede ser monocatenario o bicatenario, o incluye tanto regiones monocatenarias como regiones bicatenarias. Ademas, mientras que un polinucleotido estara compuesto tfpicamente de las nucleobases codificantes naturales (es decir, adenina, guanina, uracilo, timina y citosina), puede incluir una o mas modificaciones o nucleobases sinteticas, tales como, por ejemplo, inosina, xantina, hipoxantina, etc. Preferiblemente, tales nucleobases modificadas o sinteticas estaran codificando nucleobases.
[0038] "Hidroxilasa de prolina" se refiere a un polipeptido que tiene una capacidad enzimatica para convertir la prolina libre en hidroxiprolina en presencia de co-sustrato a-cetoglutarato y dioxfgeno, como se ilustra a continuacion:
Figure imgf000009_0001
Debe entenderse que las hidroxilasas de prolina no se limitan a la reaccion anterior con prolina, sino que pueden hidroxilar otros sustratos, por ejemplo acido pipecolico. Las hidroxilasas de prolina como se usan en el presente documento incluyen hidroxilasa de prolina natural (de tipo salvaje) asf como polipeptidos modificados geneticamente no naturales generados por la manipulacion humana.
[0039] "Co-sustrato" de una hidroxilasa de prolina se refiere a a-cetoglutarato y analogos de co-sustrato que pueden reemplazar a a-cetoglutarato en la hidroxilacion de prolina y analogos de sustrato de prolina. Los analogos de cosustrato incluyen, a modo de ejemplo y no de limitacion, 2-oxoadipato (vease, por ejemplo, Majamaa et al., 1985, Biochem. J. 229:127-133).
[0040] La "secuencia codificante" se refiere a la porcion de un acido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoacidos de una protema.
[0041] "Que ocurre naturalmente" o "tipo salvaje" se refiere a la forma que se encuentra en la naturaleza. Por ejemplo, una secuencia de polipeptido o polinucleotido de tipo natural o natural es una secuencia presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificada intencionalmente por la manipulacion humana.
[0042] "Recombinante" o "disenado " o "de origen no natural" cuando se usa con referencia a, por ejemplo, una celula, acido nucleico o polipeptido, se refiere a un material, o un material correspondiente a la forma natural o nativa del material, que se ha modificado de una manera que de otra manera no existina en la naturaleza, o es identico al mismo pero producido o derivado de materiales sinteticos y/o mediante manipulacion utilizando tecnicas recombinantes. Los ejemplos no limitantes incluyen, entre otros, celulas recombinantes que expresan genes que no se encuentran dentro de la forma nativa (no recombinante) de la celula o expresan genes nativos que de otro modo se expresan en un nivel diferente.
[0043] "Porcentaje de identidad de secuencia" y "homologfa de porcentaje" se usan de manera intercambiable en el presente documento para referirse a comparaciones entre polinucleotidos y polipeptidos, y se determinan comparando dos secuencias alineadas optimamente en una ventana de comparacion, en donde la porcion del polinucleotido o la secuencia de polipeptidos en la ventana de comparacion puede comprender adiciones o deleciones (es decir, huecos) en comparacion con la secuencia de referencia para el alineamiento optimo de las dos secuencias. El porcentaje puede calcularse determinando el numero de posiciones en las que se produce la base de acido nucleico o aminoacido identico en ambas secuencias para obtener el numero de posiciones coincidentes, dividiendo el numero de posiciones coincidentes por el numero total de posiciones en la ventana de comparar y multiplicar el resultado por 100 para obtener el porcentaje de identidad de secuencia. Alternativamente, el porcentaje puede calcularse determinando el numero de posiciones en las cuales ocurre la misma base de acido nucleico o el residuo de aminoacido en ambas secuencias o una base de acido nucleico o un residuo de aminoacido se alinea con un hueco para obtener el numero de posiciones emparejadas, dividiendo el numero de posiciones coincidentes por el numero total de posiciones en la ventana de comparacion y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Los expertos en la tecnica aprecian que hay muchos algoritmos establecidos disponibles para alinear dos secuencias. La alineacion optima de las secuencias para la comparacion se puede realizar, por ejemplo, mediante el algoritmo de homologfa local de Smith y Waterman, 1981, Adv. Apl. Mates. 2:482, por el algoritmo de alineacion de homologfa de Needleman y Wunsch, 1970, J. Mol. Biol. 48:443, por el metodo de busqueda de similitud de Pearson y Lipman, 1988, Proc. Natl Acad SCI. EE.UU. 85:2444, por implementaciones computarizadas de estos algoritmos (GAP, BE-STFIT, FASTA y TFASTA en el paquete de software GCG Wisconsin), o por inspeccion visual (ver en general, Current Protocols in Molecular Biology, FM Ausubel et al., eds., Current Protocols, Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (Suplemento de 1995) (Ausubel)). Ejemplos de algoritmos que son adecuados para determinar el porcentaje de identidad de secuencia y la similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul et al., 1990, J. Mol. Biol. 215:403­ 410 y Altschul et al., 1977. Nucleic Acids Res. 3389-3402, respectivamente. El software para realizar los analisis de BLAST esta disponible publicamente a traves del sitio web del Centro Nacional de Informacion Biotecnologica. Este algoritmo involucra primero la identificacion de pares de secuencias de alta puntuacion (HSP) identificando palabras cortas de longitud W en la secuencia de consulta, que coinciden o satisfacen alguna puntuacion de umbral de valor positivo T cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se conoce como el umbral de puntuacion de palabras vecinas (Altschul et al, supra). Estos aciertos de palabras vecinas iniciales actuan como semillas para iniciar busquedas para encontrar HSP mas largos que los contengan. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia hasta donde se puede aumentar la puntuacion de alineacion acumulativa. Las puntuaciones acumulativas se calculan utilizando, para secuencias de nucleotidos, los parametros M (puntuacion de recompensa para un par de residuos coincidentes; siempre >0) y N (puntuacion de penalizacion para residuos no coincidentes; siempre <0). Para las secuencias de aminoacidos, se utiliza una matriz de puntuacion para calcular la puntuacion acumulativa. La extension de los aciertos de palabra en cada direccion se detiene cuando: la puntuacion de alineacion acumulada cae en la cantidad X de su valor maximo alcanzado; el puntaje acumulativo llega a cero o por debajo, debido a la acumulacion de una o mas alineaciones de residuos de puntaje negativo; o se llega al final de cualquiera de las secuencias. Los parametros del algoritmo BLAST W, T y X determinan la sensibilidad y la velocidad de la alineacion. El programa BLASTN (para secuencias de nucleotidos) usa como predeterminado una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparacion de ambas cadenas. Para las secuencias de aminoacidos, el programa BLASTP utiliza como valor predeterminado una longitud de palabra (W) de 3, una expectativa (E) de 10, y la matriz de puntuacion BLOSUM62 (vease Henikoff y Henikoff, 1989, Proc Natl Acad Sci EE.UU. 89:10915). La determinacion ejemplar de alineacion de secuencia y % de identidad de secuencia puede emplear los programas BESTFIT o GAP en el paquete de software GCG Wisconsin (Accelrys, Madison WI), usando los parametros predeterminados provistos.
[0044] La "secuencia de referenda" se refiere a una secuencia definida utilizada como base para una comparacion de secuencias. Una secuencia de referencia puede ser un subconjunto de una secuencia mas grande, por ejemplo, un segmento de un gen o secuencia polipeptfdica de longitud completa. En general, una secuencia de referencia tiene una longitud de al menos 20 residuos de nucleotidos o aminoacidos, una longitud de al menos 25 residuos, una longitud de al menos 50 residuos, o la longitud completa del acido nucleico o polipeptido. Dado que dos polinucleotidos o polipeptidos pueden cada uno (1 ) comprender una secuencia (es decir, una porcion de la secuencia completa) que es similar entre las dos secuencias, y (2) puede comprender ademas una secuencia que es divergente entre las dos secuencias, comparaciones de secuencias entre dos (o mas) polinucleotidos o polipeptidos se realizan tfpicamente comparando secuencias de los dos polinucleotidos o polipeptidos en una "ventana de comparacion" para identificar y comparar regiones locales de similitud de secuencias. En algunas realizaciones, una "secuencia de referencia" puede basarse en una secuencia de aminoacidos primaria, donde la secuencia de referencia es una secuencia que puede tener uno o mas cambios en la secuencia primaria.
[0045] La "ventana de comparacion" se refiere a un segmento conceptual de al menos aproximadamente 20 posiciones de nucleotidos contiguas o residuos de aminoacidos en los que se puede comparar una secuencia con una secuencia de referencia de al menos 20 nucleotidos contiguos o aminoacidos y en donde la porcion de la secuencia en la ventana de comparacion puede comprender adiciones o eliminaciones (es decir, huecos) de 20 por ciento o menos en comparacion con la secuencia de referencia (que no comprende adiciones o eliminaciones) para el alineamiento optimo de las dos secuencias. La ventana de comparacion puede tener mas de 20 residuos contiguos e incluye, opcionalmente, 30, 40, 50, 100 o mas ventanas.
[0046] "Identidad sustancial" se refiere a una secuencia de polinucleotidos o polipeptidos que tiene al menos 80 por ciento de identidad de secuencia, al menos 85 por ciento de identidad y 89 a 95 por ciento de identidad de secuencia, mas generalmente al menos 99 por ciento de identidad de secuencia en comparacion con una secuencia de referencia sobre una ventana de comparacion de al menos 20 posiciones de residuos, con frecuencia sobre una ventana de al menos 30-50 residuos, en donde el porcentaje de identidad de secuencia se calcula comparando la secuencia de referencia con una secuencia que incluye deleciones o adiciones que totalizan 20 por ciento o menos de la secuencia de referencia en la ventana de comparacion. En realizaciones espedficas aplicadas a polipeptidos, el termino "identidad sustancial" significa que dos secuencias de polipeptidos, cuando estan alineadas de manera optima, como los programas GAP o BESTFIT que usan pesos de brecha predeterminados, comparten al menos 80 por ciento de identidad de secuencia, preferiblemente al menos 89 por ciento de identidad de secuencia, al menos 95 por ciento de identidad de secuencia o mas (por ejemplo, 99 por ciento de identidad de secuencia). Preferiblemente, las posiciones de residuos que no son identicas difieren por sustituciones conservativas de aminoacidos.
[0047] "Correspondiente a", "referencia a" o "relativo a" cuando se usan en el contexto de la numeracion de un aminoacido dado o secuencia polinucleotfdica se refiere a la numeracion de los residuos de una secuencia de referencia espedfica cuando el aminoacido dado o secuencia de polinucleotidos se compara con la secuencia de referencia. En otras palabras, el numero de residuo o la posicion de residuo de un polfmero dado se designa con respecto a la secuencia de referencia en lugar de por la posicion numerica real del residuo dentro de la secuencia de aminoacidos o polinucleotido dada. Por ejemplo, una secuencia de aminoacidos dada, como la de una hidroxilasa de prolina modificada, puede alinearse con una secuencia de referencia introduciendo espacios para optimizar las coincidencias de residuos entre las dos secuencias. En estos casos, aunque los huecos estan presentes, la numeracion del residuo en la secuencia de aminoacidos o polinucleotidos dada se realiza con respecto a la secuencia de referencia con la que se ha alineado.
[0048] "Diferencia de aminoacidos" o "diferencia de residuos" se refiere a un cambio en el residuo de aminoacido en una posicion de una secuencia polipeptfdica con respecto al residuo de aminoacido en una posicion correspondiente en una secuencia de referencia. En algunos casos, las diferencias de residuos tambien se conocen como "caractensticas" de la secuencia del polipeptido. Las posiciones de las diferencias de aminoacidos generalmente se denominan en este documento "Xn", donde n se refiere a la posicion correspondiente en la secuencia de referencia en la que se basa la diferencia de residuos. Por ejemplo, una "diferencia de residuos en la posicion X103 en comparacion con la SEQ ID NO:2" se refiere a un cambio del residuo de aminoacido en la posicion del polipeptido correspondiente a la posicion 103 de la SEQ ID NO:2. Por lo tanto, si el polipeptido de referencia de la SEQ ID NO:2 tiene una isoleucina en la posicion 103, entonces una "diferencia de residuos en la posicion X103 en comparacion con la SEQ ID NO:2" se refiere a una sustitucion de aminoacidos de cualquier resto que no sea isoleucina en la posicion del polipeptido correspondiente a la posicion 103 de la SEQ ID NO:2. En la mayona de los casos en este documento, la diferencia espedfica de residuos de aminoacidos en una posicion se indica como "XnY", donde "Xn" especifica la posicion correspondiente como se describe anteriormente, e "Y "es el identificador de una sola letra del aminoacido encontrado en el polipeptido disenado (es decir, el residuo diferente que en el polipeptido de referencia). En algunas realizaciones, cuando mas de un aminoacido puede aparecer en una posicion de residuo espedfica, los aminoacidos alternativos pueden enumerarse en la forma XnY/Z, donde Y y Z representan residuos de aminoacidos alternativos, o presentarse como "Xn" seguido por una lista de los residuos especificados. En algunos casos (por ejemplo, en la Tabla 2A, 2B, 2C, 2D y 2E), la presente descripcion tambien proporciona diferencias espedficas de aminoacidos indicadas por la notacion convencional "AnB", donde A es el identificador de una sola letra del residuo en la referencia secuencia, "n" es el numero de la posicion del residuo en la secuencia de referencia, y B es el identificador de una sola letra de la sustitucion del residuo en la secuencia del polipeptido disenado. La presente descripcion incluye secuencias polipeptfdicas disenadas que comprenden una o mas diferencias de aminoacidos que incluyen sustituciones de aminoacidos tanto conservativas como no conservativas.
[0049] "Sustitucion de aminoacidos conservativa" se refiere a una sustitucion de un residuo con un residuo diferente que tiene una cadena lateral similar, y por lo tanto tfpicamente implica la sustitucion del aminoacido en el polipeptido con aminoacidos dentro de la misma clase de aminoacidos o similar definida. A modo de ejemplo y no de limitacion, un aminoacido con una cadena lateral alifatica puede estar sustituido con otro aminoacido alifatico, por ejemplo, alanina, valina, leucina e isoleucina; un aminoacido con cadena lateral hidroxilo esta sustituido con otro aminoacido con una cadena lateral hidroxilo, por ejemplo, serina y treonina; un aminoacido que tiene cadenas laterales aromaticas esta sustituido con otro aminoacido que tiene una cadena lateral aromatica, por ejemplo, fenilalanina, tirosina, triptofano e histidina; un aminoacido con una cadena lateral basica esta sustituido con otro aminoacido con una cadena lateral basica, por ejemplo, lisina y arginina; un aminoacido con una cadena lateral acida esta sustituido con otro aminoacido con una cadena lateral acida, por ejemplo, acido aspartico o acido glutamico; y un aminoacido hidrofobo o hidrofilo se reemplaza con otro aminoacido hidrofobo o hidrofilo, respectivamente. Las sustituciones conservativas ejemplares se proporcionan en la Tabla 1 a continuacion.
Tabla 1
Figure imgf000012_0001
[0050] "Sustitucion no conservativa" se refiere a la sustitucion de un aminoacido en el polipeptido con un aminoacido con propiedades de cadena lateral significativamente diferentes. Las sustituciones no conservativas pueden usar aminoacidos entre los grupos definidos, y no dentro de ellos, y afectan (a) la estructura del esqueleto peptfdico en el area de la sustitucion (p. ej., prolina para glicina), (b) la carga o hidrofobicidad, o (c) la mayor parte de la cadena lateral. A modo de ejemplo y no de limitacion, una sustitucion no conservativa ejemplar puede ser un aminoacido sustituido con un aminoacido basico o alifatico; un aminoacido aromatico sustituido con un pequeno aminoacido; y un aminoacido hidrofilo sustituido con un aminoacido hidrofobo.
[0051] "Eliminacion" se refiere a la modificacion del polipeptido mediante la eliminacion de uno o mas aminoacidos del polipeptido de referencia. Las eliminaciones pueden comprender la eliminacion de 1 o mas aminoacidos, 2 o mas aminoacidos, 5 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta el 10% del numero total de aminoacidos, o hasta el 20% del numero total de aminoacidos que forman la enzima de referencia, al tiempo que conserva la actividad enzimatica y/o retiene las propiedades mejoradas de una enzima hidroxilasa de prolina modificada. Las eliminaciones pueden dirigirse a las porciones internas y/o porciones terminales del polipeptido. En diversas realizaciones, la eliminacion puede comprender un segmento continuo o puede ser discontinua.
[0052] "Insercion" se refiere a la modificacion del polipeptido mediante la adicion de uno o mas aminoacidos del polipeptido de referencia. En algunas realizaciones, las enzimas de hidroxilasa de prolina modificadas comprenden inserciones de uno o mas aminoacidos en el polipeptido de hidroxilasa de prolina que se produce naturalmente, asf como inserciones de uno o mas aminoacidos en otros polipeptidos de hidroxilasa de prolina mejorados. Las inserciones pueden estar en las partes internas del polipeptido, o en el extremo carboxi o amino. Las inserciones como se usan en este documento incluyen protemas de fusion como se conoce en la tecnica. La insercion puede ser un segmento contiguo de aminoacidos o separado por uno o mas de los aminoacidos en la secuencia de referencia.
[0053] "Fragmento" como se usa en el presente documento se refiere a un polipeptido que tiene una eliminacion amino-terminal y/o carboxi-terminal, pero donde la secuencia de aminoacidos restante es identica a las posiciones correspondientes en la secuencia. Los fragmentos pueden tener una longitud de al menos 14 aminoacidos, una longitud de al menos 20 aminoacidos, una longitud de al menos 50 aminoacidos o mas, y hasta un 70%, 80%, 90%, 95%, 98% y 99% del total polipeptido de hidroxilasa de prolina de longitud, por ejemplo el polipeptido de la SEQ ID NO:2 o polipeptido disenado de la SEQ ID NO:34.
[0054] "Polipeptido aislado" se refiere a un polipeptido que esta sustancialmente separado de otros contaminantes que naturalmente lo acompanan, por ejemplo, protemas, lfpidos y polinucleotidos. El termino abarca polipeptidos que se han eliminado o purificado de su entorno natural o sistema de expresion (por ejemplo, celula huesped o smtesis in vitro). Las enzimas hidroxilasas de prolina mejoradas pueden estar presentes dentro de una celula, presentes en el medio celular o preparadas en diversas formas, tales como lisados o preparaciones aisladas. Como tal, en algunas formas de realizacion, la enzima hidroxilasa de prolina mejorada puede ser un polipeptido aislado.
[0055] "Polipeptido sustancialmente puro" se refiere a una composicion en la que la especie polipeptfdica es la especie predominante presente (es decir, en base molar o en peso, es mas abundante que cualquier otra especie macromolecular individual en la composicion), y es generalmente una composicion sustancialmente purificada cuando la especie diana comprende al menos aproximadamente el 50 por ciento de las especies macromoleculares presentes en moles o % en peso. En general, una composicion de hidroxilasa de prolina sustancialmente pura comprendera aproximadamente el 60% o mas, aproximadamente el 70% o mas, aproximadamente el 80% o mas, aproximadamente el 90% o mas, aproximadamente el 95% o mas y aproximadamente el 98% o mas de todas las especies macromoleculares por mol o % en peso presente en la composicion. En algunas realizaciones, la especie diana se purifica hasta homogeneidad esencial (es decir, las especies contaminantes no pueden detectarse en la composicion mediante metodos de deteccion convencionales), en donde la composicion consiste esencialmente en una sola especie macromolecular. Las especies solventes, las moleculas pequenas (<500 Daltons) y las especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipeptido de hidroxilasas de prolina mejorado aislado es una composicion de polipeptido sustancialmente pura.
[0056] "Estereoselectividad" se refiere a la formacion preferencial en una reaccion qmmica o enzimatica de un estereoisomero sobre otro. La estereoselectividad puede ser parcial, donde la formacion de un estereoisomero se favorece sobre el otro, o puede ser completa donde se forma un solo estereoisomero. Cuando los estereoisomeros son enantiomeros, la estereoselectividad se conoce como enantioselectividad, la fraccion (tfpicamente reportada como un porcentaje) de un enantiomero en la suma de ambos. Comunmente se reporta alternativamente en la tecnica (tfpicamente como un porcentaje) como el exceso enantiomerico (e.e.) calculado de acuerdo con la formula [enantiomero mayor - enantiomero menor]/[enantiomero mayor enantiomero menor]. Cuando los estereoisomeros son diastereoisomeros, la estereoselectividad se denomina diastereoselectividad, la fraccion (tfpicamente informada como un porcentaje) de un diastereomero en una mezcla de dos diastereoisomeros, comunmente reportada alternativamente como el exceso diastereomerico (d.e.).
[0057] El exceso enantiomerico y el exceso diastereomerico son tipos de exceso estereomerico. "Altamente estereoselectivo" se refiere a una reaccion qmmica o enzimatica que es capaz de convertir un sustrato, por ejemplo, compuesto (2), en su producto hidroxilado correspondiente, por ejemplo, compuesto (1 ), con al menos aproximadamente el 85% de exceso estereomerico.
[0058] "Regioselectividad" o "reaccion regioselectiva" se refiere a una reaccion en la que una direccion de union o ruptura se produce preferentemente sobre todas las demas direcciones posibles. Las reacciones pueden ser completamente (100%) regioselectivas si la discriminacion es completa, sustancialmente regioselectivas (al menos 75%) o parcialmente regioselectivas (x%), si el producto de la reaccion en un sitio predomina sobre el producto de la reaccion en otros sitios, por ejemplo, formacion preferencial del producto compuesto (1) sobre el producto compuesto (1a)).
[0059] La "propiedad enzimatica mejorada" se refiere a un polipeptido de hidroxilasa de prolina que muestra una mejora en cualquier propiedad enzimatica en comparacion con una hidroxilasa de prolina de referencia. Para los polipeptidos de hidroxilasa de prolina descritos en el presente documento, la comparacion generalmente se realiza con la enzima hidroxina de prolina de tipo salvaje, aunque en algunas realizaciones, la hidroxilasa de prolina de referencia puede ser otra hidroxilasa de prolina. Las propiedades enzimaticas para las cuales es deseable una mejora incluyen, entre otras, la actividad enzimatica (que puede expresarse en terminos de conversion porcentual del sustrato), estabilidad termica, estabilidad del disolvente, perfil de actividad del pH, requisitos de cofactor, refractariedad a los inhibidores (por ejemplo, inhibicion de sustrato o producto), y estereoselectividad.
[0060] "Actividad enzimatica aumentada" se refiere a una propiedad mejorada de los polipeptidos de hidroxilasa de prolina modificados, que puede representarse por un aumento en la actividad espedfica (por ejemplo, producto producido/tiempo/peso de protema) o un aumento en el porcentaje de conversion del sustrato al producto (p. ej., porcentaje de conversion de la cantidad inicial de sustrato a producto en un penodo de tiempo espedfico utilizando una cantidad espedfica de hidroxilasa de prolina) en comparacion con la enzima de hidroxilasa de prolina de referencia. En los ejemplos se proporcionan metodos ejemplares para determinar la actividad de la enzima. Cualquier propiedad relacionada con la actividad enzimatica puede verse afectada, incluidas las propiedades enzimaticas clasicas de Km, Vmax o kcat, cuyos cambios pueden conducir a un aumento de la actividad enzimatica. Las mejoras en la actividad de la enzima pueden ser desde aproximadamente 1,2 veces la actividad enzimatica de la enzima de hidroxilasa de prolina de tipo salvaje correspondiente, hasta 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces o mas actividad enzimatica que la la hidroxilasa de prolina de origen natural u otra hidroxilasa de prolina modificada a partir de la cual se derivaron los polipeptidos de la hidroxilasa de prolina. La actividad de la hidroxilasa de prolina se puede medir mediante uno de los ensayos estandar, como por ejemplo, al monitorear los cambios en las propiedades espectrofotometricas de los reactivos o productos. En algunas realizaciones, la cantidad de productos producidos se puede medir mediante separacion por cromatograffa lfquida de alto rendimiento (HPLC) combinada con absorbancia UV o deteccion fluorescente despues de la derivacion, tal como con o-ftalaldehudo (OPA) o cloruro de dansilo. Las comparaciones de las actividades enzimaticas se realizan utilizando una preparacion definida de enzima, un ensayo definido bajo una condicion establecida y uno o mas sustratos definidos, como se describe con mas detalle en este documento. En general, cuando se comparan los lisados, se determina el numero de celulas y la cantidad de protema analizada, asf como el uso de sistemas de expresion identicos y celulas huesped identicas para minimizar las variaciones en la cantidad de enzima producida por las celulas huesped y presente en los lisados.
[0061] "Conversion" se refiere a la conversion enzimatica del (de los) sustrato(s) en el (los) producto(s) correspondiente(s). "Porcentaje de conversion" se refiere al porcentaje del sustrato que se convierte al producto dentro de un penodo de tiempo en condiciones espedficas. Por lo tanto, la "actividad enzimatica" o "actividad" de un polipeptido de hidroxilasa de prolina se puede expresar como "porcentaje de conversion" del sustrato al producto.
[0062] "Termoestable" se refiere a un polipeptido de hidroxilasa de prolina que mantiene una actividad similar (mas del 60% al 80%, por ejemplo) despues de la exposicion a temperaturas elevadas (por ejemplo, 40-80°C) durante un penodo de tiempo (por ejemplo, 0,5-24 h) en comparacion con la enzima de tipo salvaje.
[0063] "Solvente estable" se refiere a un polipeptido de hidroxilasa de prolina que mantiene una actividad similar (mas de, por ejemplo, 60% a 80%) despues de la exposicion a concentraciones variables (por ejemplo, 5-99%) de disolvente (etanol, alcohol isopropflico, dimetilsulfoxido (DMSO), tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metilo ferc-butilo eter, etc.) durante un penodo de tiempo (p. ej., 0,5-24 h) en comparacion con la enzima de tipo salvaje.
[0064] "Estable termo y solvente" se refiere a un polipeptido de hidroxilasa de prolina que es tanto termoestable como estable a los solventes.
[0065] La "hibridacion rigurosa" se usa en el presente documento para referirse a las condiciones en las que los tnbridos de acido nucleico son estables. Como saben los expertos en la tecnica, la estabilidad de los tnbridos se refleja en la temperatura de fusion (Tm) de los tnbridos. En general, la estabilidad de un tnbrido es una funcion de la fuerza ionica, la temperatura, el contenido de G/C y la presencia de agentes caotropicos. Los valores de Tm para polinucleotidos pueden calcularse utilizando metodos conocidos para predecir las temperaturas de fusion (vease, por ejemplo, Baldino et al., Methods Enzymology 168:761-777; Bolton et al., 1962, Proc. Natl. Acad. sCl. EE.Uu .
48:l390; Bresslauer et al., 1986, Proc. Natl. Acad. Sci EE.UU. 83:8893-8897; Freier et al., 1986, Proc. Natl. Acad. Sci EE.UU. 83:9373-9377; Kierzek et al., Biochemistry 25:7840-7846; Rychlik et al., 1990, Nucleic Acids Res 18:6409-6412 (erratum, 1991, Nucleic Acids Res. 19:698); Sambrook et al., Supra); Suggs et al., 1981, en Developmental Biology Using Purified Genes (Brown et al., Eds.), Pp. 683-693, Academic Press; y Wetmur, 1991, Crit Rev Biochem Mol Biol 26:227-259.). En algunas realizaciones, el polinucleotido codifica el polipeptido descrito en el presente documento e hibrida en condiciones definidas, tales como condiciones moderadamente rigurosas o altamente rigurosas, al complemento de una secuencia que codifica una enzima hidroxilasa de prolina modificada de la presente descripcion.
[0066] La "rigurosidad de hibridacion" se refiere a condiciones de hibridacion, tales como condiciones de lavado, en la hibridacion de acidos nucleicos. En general, las reacciones de hibridacion se realizan en condiciones de menor rigor, seguidas de lavados de mayor rigor variable pero mas alto. El termino "hibridacion moderadamente rigurosa" se refiere a las condiciones que permiten que el ADN diana se una a un acido nucleico complementario que tiene una identidad de aproximadamente el 60%, preferiblemente una identidad de aproximadamente el 75%, una identidad de aproximadamente el 85% con el ADN diana, con una identidad superior a aproximadamente el 90% al objetivo-polinucleotido. Las condiciones ejemplares moderadamente rigurosas son condiciones equivalentes a la hibridacion en formamida al 50%, solucion de 5X Denhart, 5XSSPE, SDS al 0,2% a 42°C, seguido de lavado en 0,2XSSPE, SDS al 0,2%, a 42°C. "Hibridacion de alta rigurosidad" se refiere en general a condiciones que son aproximadamente 10°C o menos a partir de la temperatura de fusion termica Tm segun se determina bajo la condicion de solucion para una secuencia de polinucleotidos definida. En algunas realizaciones, una condicion de rigurosidad alta se refiere a las condiciones que permiten la hibridacion de solo aquellas secuencias de acido nucleico que forman tnbridos estables en NaCl 0,018m a 65°C (es decir, si un tnbrido no es estable en NaCl 0,018M a 65°C, no sera estable en condiciones de alta rigurosidad, como se contempla en este documento). Se pueden proporcionar condiciones de alta rigurosidad, por ejemplo, mediante hibridacion en condiciones equivalentes a 50% de formamida, solucion de 53 Denhart, 5XSSPE, SdS al 0,2% a 42°C, seguido de lavado en 0,1XSSPE y SDS al 0,1% a 65°C. otra condicion de alta rigurosidad es la hibridacion en condiciones equivalentes a la hibridacion en 5X SSC que contiene 0,1% (p:v) SDS a 65°C y lavado en 0,1x SSC que contiene 0,1% SDS a 65°C. Otras condiciones de hibridacion de alta rigurosidad, asf como condiciones moderadamente rigurosas, se describen en las referencias citadas anteriormente.
[0067] El polinucleotido "heterologo" se refiere a cualquier polinucleotido que se introduce en una celula huesped mediante tecnicas de laboratorio, e incluye polinucleotidos que se eliminan de una celula huesped, se someten a manipulacion de laboratorio y luego se reintroducen en una celula huesped.
[0068] "Codon optimizado" se refiere a cambios en los codones del polinucleotido que codifican una protema a los utilizados preferentemente en un organismo particular, de modo que la protema codificada se expresa de manera eficiente en el organismo de interes. Aunque el codigo genetico esta degenerado porque la mayona de los aminoacidos estan representados por varios codones, llamados "sinonimos" o codones "sinonimos", es bien sabido que el uso de codones por parte de organismos particulares no es aleatorio y esta sesgado hacia tripletes de codones particulares. Este sesgo de uso del codon puede ser mayor en referencia a un gen dado, genes de funcion comun u origen ancestral, protemas altamente expresadas frente a protemas de bajo numero de copias y regiones codificantes de protemas agregadas del genoma de un organismo. En algunas realizaciones, los polinucleotidos que codifican las enzimas hidroxinasas de la prolina pueden ser codones optimizados para la produccion optima en el organismo huesped seleccionado para la expresion.
[0069] "Codones de sesgo de sesgo de uso de codones preferidos optimos" se refiere de manera intercambiable a los codones que se usan a mayor frecuencia en las regiones codificantes de protemas que otros codones que codifican para el mismo aminoacido. Los codones preferidos se pueden determinar en relacion con el uso de codones en un solo gen, un conjunto de genes de funcion u origen comun, genes altamente expresados, la frecuencia del codon en las regiones codificantes de protemas agregadas de todo el organismo, la frecuencia de codones en la protema agregada codificando regiones de organismos relacionados, o combinaciones de los mismos. Los codones cuya frecuencia aumenta con el nivel de expresion genica son tipicamente codones optimos para la expresion. Se conoce una variedad de metodos para determinar la frecuencia del codon (por ejemplo, el uso del codon, el uso relativo del codon sinonimo) y la preferencia del codon en organismos espedficos, incluido el analisis multivariado, por ejemplo, el analisis de conglomerados o el analisis de correspondencia, y el numero efectivo de codones utilizados. en un gen (consulte GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, Universidad de Nottingham; Mclnerney, J. O, 1998, Bioinformatics 14:372-73; Stenico et al., 1994, Nucleic Acids Res. 222437 -46; Wright, F., 1990, Gene 87:23-29). Las tablas de uso de codones estan disponibles para muchos organismos diferentes (ver, por ejemplo, Wada et al., 1992, Nucleic Acids Res. 20:2111­ 2118; Nakamura et al., 2000, Nucl. Acids Res. 28:292; Duret, et al., supra; Henaut y Danchin, "Escherichia coli y Salmonella", 1996, Neidhardt, et al. Eds., ASM Press, Washington DC, p. 2047-2066). La fuente de datos para obtener el uso de codones puede depender de cualquier secuencia de nucleotidos disponible capaz de codificar una protema. Estos conjuntos de datos incluyen secuencias de acido nucleico que se sabe que codifican protemas expresadas (p. ej., Secuencias codificantes de protemas completas - CDS), etiquetas de secuencias expresadas (eSTS) o regiones codificadoras predichas de secuencias genomicas (consulte, por ejemplo, Mount, D. Bioinformatics:Secuencia y analisis del genoma, Capttulo 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001; Uberbacher, EC, 1996, Methods Enzymol. 266:259-281; Tiwari et al., 1997. Comput. Appl. Biosci.
13:263-270).
[0070] La "secuencia de control" se define aqrn para incluir todos los componentes, que son necesarios o ventajosos para la expresion de un polinucleotido y/o polipeptido de la presente descripcion. Cada secuencia de control puede ser nativa o ajena a la secuencia de acido nucleico que codifica el polipeptido. Dichas secuencias de control incluyen, pero no se limitan a, promotor, terminador de transcripcion, secuencia lfder (es decir, iniciacion de la traduccion), secuencia de poliadenilacion, secuencia de propeptidos y una secuencia peptfdica senal. Las secuencias de control pueden proporcionarse con enlazadores con el fin de introducir sitios de restriccion espedficos que faciliten la ligadura de las secuencias de control con la region codificante de la secuencia de acido nucleico que codifica un polipeptido.
[0071] "Conectado operativamente" se define en el presente documento como una configuracion en la que una secuencia de control se coloca adecuadamente (es decir, en una relacion funcional) en una posicion relativa a un polinucleotido de interes tal que la secuencia de control dirija o regule la expresion del polinucleotido y/o polipeptido de interes.
[0072] "Secuencia promotora" se refiere a una secuencia de acido nucleico que es reconocida por una celula huesped para la expresion de un polinucleotido de interes, tal como una secuencia de codificacion. La secuencia promotora contiene secuencias de control transcripcional, que median la expresion de un polinucleotido de interes. El promotor puede ser cualquier secuencia de acido nucleico que muestre actividad transcripcional en la celula huesped de eleccion, incluidos los promotores mutantes, truncados e Idbridos, y puede obtenerse a partir de genes que codifican polipeptidos extracelulares o intracelulares, ya sea homologos o heterologos a la celula huesped.
[0073] Las "condiciones de reaccion adecuadas" se refieren a esas condiciones en la solucion de reaccion biocatalttica (por ejemplo, rangos de carga de enzimas, carga de sustrato, carga de co-sustrato, carga de cofactor, temperatura, pH, tampones, codisolventes, etc.) bajo el cual un polipeptido de hidroxilasa de prolina de la presente descripcion es capaz de convertir un compuesto de sustrato en un compuesto de producto (por ejemplo, conversion del compuesto (2) en compuesto (1)). Las "condiciones de reaccion adecuadas" ejemplares se proporcionan en la presente descripcion y se ilustran mediante los ejemplos.
[0074] "Carga", en el sentido de "carga de compuestos" o "carga de enzimas" o "carga de cofactor" se refiere a la concentracion o cantidad de un componente en una mezcla de reaccion al comienzo de la reaccion.
[0075] "Sustrato" en el contexto de un proceso mediado por biocatalizadores se refiere al compuesto o molecula sobre la que actua el biocatalizador. Por ejemplo, un compuesto ejemplar para el biocatalizador de hidroxilasa de prolina en el proceso descrito aqrn es el compuesto (2).
[0076] "Producto" en el contexto de un proceso mediado por un biocatalizador se refiere al compuesto o molecula resultante de la accion del biocatalizador. Por ejemplo, un producto ejemplar para el biocatalizador de hidroxilasa de prolina en el proceso descrito aqrn es el compuesto (1).
[0077] "Reductante" se refiere a un compuesto o agente capaz de convertir Fe+3 en Fe+2. Un reductor ejemplar es el acido ascorbico, que generalmente esta en forma de acido L-ascorbico.
[0078] "Alquilo" se refiere a grupos hidrocarbonados saturados de 1 a 18 atomos de carbono inclusive, ya sea de cadena lineal o ramificada, mas preferiblemente de 1 a 8 atomos de carbono inclusive, y lo mas preferiblemente de 1 a 6 atomos de carbono inclusive. Un alquilo con un numero espedfico de atomos de carbono se indica entre parentesis, por ejemplo, alquilo (C-i-Ca) se refiere a un alquilo de 1 a 6 atomos de carbono.
[0079] "Alquenilo" se refiere a grupos hidrocarburo de 2 a 12 atomos de carbono inclusive, ya sea lineal o ramificado que contiene al menos un doble enlace, pero que opcionalmente contiene mas de un doble enlace.
[0080] "Alquinilo" se refiere a grupos hidrocarbonados de 2 a 12 atomos de carbono inclusive, ya sea lineal o ramificado que contiene al menos un triple enlace pero que opcionalmente contiene mas de un triple enlace, y adicionalmente opcionalmente que contiene uno o mas restos dobles.
[0081] "Alquileno" se refiere a un radical hidrocarbonado divalente de cadena lineal o ramificada que tiene de 1 a 18 atomos de carbono inclusive, mas preferiblemente de 1 a 8 atomos de carbono inclusive, y lo mas preferiblemente de 1 a 6 atomos de carbono inclusivamente, opcionalmente sustituido con uno o sustituyentes mas adecuados. Los "alquilenos" ejemplares incluyen, pero no se limitan a, metileno, etileno, propileno, butileno y similares.
[0082] "Alquenileno" se refiere a un radical hidrocarbonado divalente de cadena lineal o ramificada que tiene 2 a 12 atomos de carbono inclusive y uno o mas dobles enlaces carbono-carbono, mas preferiblemente de 2 a 8 atomos de carbono inclusive, y lo mas preferiblemente 2 a 6 carbono atomos inclusive, opcionalmente sustituidos con uno o mas sustituyentes adecuados.
[0083] "Heteroalquilo," heteroalquenilo "y heteroalquinilo" se refieren a alquilo, alquenilo y alquinilo como se definen en el presente documento en el que uno o mas de los atomos de carbono estan cada uno independientemente reemplazados con los mismos o diferentes heteroatomos o grupos heteroatomicos. Los heteroatomos y/o grupos heteroatomicos que pueden reemplazar a los atomos de carbono en la lista, pero no se limitan a, -O-, -S-, -SO-, -NRy-, -PH-, -S(O)-, -S(O)2-, -S(O)NRY-, -S(0)2NRy-, y similares, incluyendo combinaciones de los mismos, donde cada Ry se selecciona independientemente de hidrogeno, alquilo, heteroalquilo, cicloalquilo, heterocicloalquilo, arilo y heteroarilo.
[0084] "Arilo" se refiere a un grupo carbodclico aromatico insaturado de 6 a 12 atomos de carbono, incluyendo inclusive un solo anillo (por ejemplo, fenilo) o multiples anillos condensados (por ejemplo, naftilo o antrilo). Los arilos ejemplares incluyen fenilo, piridilo, naftilo y similares.
[0085] "Arilalquilo" se refiere a un alquilo sustituido con un arilo, es decir, grupos arilo-alquilo, que tienen preferiblemente de 1 a 6 atomos de carbono inclusive en el resto alquilo y de 6 a 12 atomos de carbono inclusive en el resto arilo. Tales grupos arilalquilo estan ejemplificados por bencilo, fenetilo y similares.
[0086] "Ariloxi" se refiere a grupos -ORA, donde RA es un grupo arilo, que puede estar opcionalmente sustituido.
[0087] "Cicloalquilo" se refiere a grupos alquilo dclicos de 3 a 12 atomos de carbono que tienen inclusive un solo anillo dclico o anillos condensados multiples que pueden estar opcionalmente sustituidos con 1 a 3 grupos alquilo. Los grupos cicloalquilo ejemplares incluyen, pero no se limitan a, estructuras de un solo anillo tales como ciclopropilo, ciclobutilo, ciclopentilo, ciclooctilo, 1-metilo-ciclopropilo, 2-metilciclopentilo, 2-metilciclooctilo y similares, o estructuras de anillos multiples, incluyendo anillos multiples sistemas, tales como adamantilo, y similares.
[0088] "Cicloalquilalquilo" se refiere a un alquilo sustituido con un cicloalquilo, es decir, grupos cicloalquilo-alquilo-, que tienen preferiblemente de 1 a 6 atomos de carbono inclusive en el resto alquilo y de 3 a 12 atomos de carbono inclusive en el resto cicloalquilo. Dichos grupos cicloalquilalquilo estan ejemplificados por ciclopropilmetilo, ciclohexiletilo y similares.
[0089] "Amino" se refiere al grupo -NH2. Amino sustituido se refiere al grupo -NHRr|, NRr|Rn y NRnRnRn, donde cada R se selecciona independientemente entre alquilo, cicloalquilo, cicloheteroalquilo, alcoxi, arilo, heteroarilo, heteroarilo, heteroarilalquilo, acilo, alcoxicarbonilo, sulfanilo, sulfanilo, sulfato, y similares. Los grupos amino tfpicos incluyen, pero estan limitados a, dimetilamino, dietilamino, trimetilamonio, trietilamonio, metilsulfonilamino, furanilooxi-sulfamino, y similares.
[0090] "Aminoalquilo" se refiere a un grupo alquilo en el que uno o mas de los atomos de hidrogeno estan reemplazados con uno o mas grupos amino, incluyendo grupos amino sustituidos.
[0091] "Aminocarbonilo" se refiere a -C(O)NH2. Aminocarbonilo sustituido se refiere a -C(O)NRnRn, donde el grupo amino NRnRn es como se define aqrn.
[0092] "Oxi" se refiere a un grupo divalente -O-, que puede tener varios sustituyentes para formar diferentes grupos oxi, incluyendo eteres y esteres.
[0093] En el presente documento, "alcoxi" o "alquilxi" se usan de manera intercambiable para referirse al grupo -ORZ, en donde RZ es un grupo alquilo, que incluye grupos alquilo opcionalmente sustituidos.
[0094] "Carboxi" se refiere a -COOH.
[0095] "Carbonilo" se refiere a -C(O)-, que puede tener una variedad de sustituyentes para formar diferentes grupos carbonilo incluyendo acidos, halogenuros de acido, aldehudos, amidas, esteres y cetonas.
[0096] "Carboxialquilo" se refiere a un alquilo en el que uno o mas de los atomos de hidrogeno estan reemplazados con uno o mas grupos carboxi.
[0097] "Aminocarbonilalquilo” se refiere a un alquilo sustituido con un grupo aminocarbonilo, como se define en el presente documento.
[0098] "Halogeno" o "halo" se refiere a fluor, cloro, bromo y yodo.
[0099] "Haloalquilo” se refiere a un grupo alquilo en el que uno o mas de los atomos de hidrogeno se reemplazan con un halogeno. Por lo tanto, el termino "haloalquilo” pretende incluir monohaloalquilos, dihaloalquilos, trihaloalquilos, etc. hasta perhaloalquilos. Por ejemplo, la expresion "haloalquilo (Ci C2)" incluye 1-fluorometilo, difluorometilo, trifluorometilo, 1 -fluoroetilo, 1,1-difluoroetilo, 1,2-difluoroetilo, 1,1,1 trifluoroetilo, perfluoroetilo, etc.
[0100] "Hidroxi" se refiere a -OH.
[0101] "Hidroxialquilo” se refiere a un grupo alquilo en el que uno o mas de los atomos de hidrogeno se reemplazan con uno o mas grupos hidroxi.
[0102] "Tiol" o "sulfanilo" se refiere a -SH. Tiol o sulfanilo sustituido se refiere a -S-Rr|, donde Rr| es un alquilo, arilo u otro sustituyente adecuado.
[0103] "Alquiltio" se refiere a -SRZ, donde RZ es un alquilo, que puede estar opcionalmente sustituido. El grupo alquiltio a modo de ejemplo incluye, pero no se limita a, metiltio, etiltio, n-propiltio y similares.
[0104] "Ariltio" se refiere a -SRA, donde RA es un arilo, que puede estar opcionalmente sustituido. Los grupos ariltio ejemplares incluyen, pero no se limitan a, feniltio, (4-metilfenilo)tio, piridiniltio y similares.
[0105] Alquiltioalquilo se refiere a un alquilo sustituido con un grupo alquiltio, -SRZ, donde R where es un alquilo, que puede estar opcionalmente sustituido.
[0106] "Tiolalquilo” se refiere a un grupo alquilo en el que uno o mas de los atomos de hidrogeno estan reemplazados con uno o mas grupos SH.
[0107] "Sulfonilo" se refiere a -SO2-. Sulfonilo sustituido se refiere a -SO2-Rr|, donde Rr| es un alquilo, arilo u otro sustituyente adecuado.
[0108] "Alquilosulfonilo" se refiere a -SO1-RZ, donde RZ es un alquilo, que puede estar opcionalmente sustituido. Los grupos Alquilosulfonilo tfpicos incluyen, pero no se limitan a, metilsulfonilo, etilsulfonilo, n-propilsulfonilo y similares.
[0109] "Alquilosulfonilalquilo” se refiere a un alquilo sustituido con un grupo alquilosulfonilo, -SO2-RZ, donde RZ es un alquilo, que puede estar opcionalmente sustituido.
[0110] "Heteroarilo" se refiere a un grupo heterodclico aromatico de 1 a 10 atomos de carbono inclusive y de 1 a 4 heteroatomos seleccionados inclusivamente entre oxfgeno, nitrogeno y azufre cuando se adelgaza el anillo. Dichos grupos heteroarilo pueden tener un solo anillo (por ejemplo, piridilo o furilo) o multiples anillos condensados (por ejemplo, indolizinilo o benzotienilo).
[0111] "Heteroarilalquilo” se refiere a un alquilo sustituido con un heteroarilo, es decir, grupos heteroarilo-alquilo, que tienen preferiblemente de 1 a 6 atomos de carbono inclusive en el resto alquilo y de 5 a 12 atomos en el anillo inclusive en el resto heteroarilo. Dichos grupos heteroarilalquilo estan ejemplificados por piridilmetilo y similares.
[0112] "Heterociclo", "heterodclico" e indistintamente "heterocicloalquilo” se refiere a un grupo saturado o insaturado que tiene un solo anillo o multiples anillos condensados, de 2 a 10 atomos de anillo de carbono inclusive y de 1 a 4 atomos de anillo hetero seleccionados de forma inclusiva de nitrogeno, azufre u oxfgeno dentro del anillo. Dichos grupos heterodclicos pueden tener un solo anillo (por ejemplo, piperidinilo o tetrahidrofurilo) o multiples anillos condensados (por ejemplo, indolinilo, dihidrobenzofurano o quinuclidinilo). Los ejemplos de heterociclos incluyen, pero no se limitan a, furano, tiofeno, tiazol, oxazol, pirrol, imidazol, pirazol, piridina, pirazina, pirimidina, piridazina, indolizina, isoindol, indolol, purina, quinolizina, isoquinina, ftalazina, naftilpiridina, quinoxalina, quinazolina, cinolina, pteridina, carbazol, carbolina, fenantridina, acridina, fenantrolina, isotiazol, fenazina, isoxazol, fenoxazina, fenotiazina, imidazolidina, imidazolidina, piperidina, piperazina, pirrolidina, indolina y similares.
[0113] "Heterocidoalquilalquilo” se refiere a un alquilo sustituido con un heterocicloalquilo, es dedr, grupos heterocicloalquilo-alquilo, que tienen preferiblemente de 1 a 6 atomos de carbono inclusive en el resto alquilo y de 3 a 12 atomos de anillo, inclusive en el resto heterocicloalquilo.
[0114] "Anillo miembro" pretende abarcar cualquier estructura dclica. El numero que precede al termino "miembro" denota el numero de atomos esqueleticos que constituyen el anillo. Asf, por ejemplo, ciclohexilo, piridina, pirano y tiopirano son anillos de 6 miembros y ciclopentilo, pirrol, furano y tiofeno son anillos de 5 miembros.
[0115] "Anillo bidclico fusionado", como se usa en el presente documento, se refiere a restos de anillos heterodclicos y/o carbodclicos no sustituidos y sustituidos que tienen 5 a 8 atomos en cada anillo, los anillos que tienen 2 atomos comunes.
[0116] A menos que se especifique lo contrario, las posiciones ocupadas por hidrogeno en los grupos anteriores se pueden sustituir adicionalmente con sustituyentes ejemplificados por, pero no limitados a, hidroxi, oxo, nitro, metoxi, etoxi, alcoxi, alcoxi sustituido, trifluorometoxi, haloalcoxi, fluoro, cloro, bromo, yodo, halo, metilo, etilo, propilo, butilo, alquilo, alquenilo, alquinilo, alquilo sustituido, trifluorometilo, haloalquilo, hidroxialquilo, alcoxialquilo, tio, alquiltio, acilo, carboxi, alcoxicarbonilo, carboxiladino, sustituido carboxamido, alquilosulfonilo, alquilosulfinilo, alquilosulfonilamino, sulfonamido, sulfonamido sustituido, ciano, amino, amino sustituido, alquilamino, dialquilamino, aminoalquilo, acilamino, amidino, amidoximo, hidroxamoflo, fenilo, arilo, arilo sustituido, ariloxi, arilalquilo, arilalquenilo, arilalquinilo, piridilo, imidazolilo, heteroarilo, heteroarilo sustituido, heteroariloxi, heteroarilalquilo, heteroarilalquenilo, heteroarilalquinilo, ciclopropilo, ciclobutilo, ciclopentilo, ciclohexilo, cicloalquilo, cicloalquenilo, cicloalquilalquilo, cicloalquilo sustituido, cicloalquilxi, pirrolidinilo, piperidinilo, morfolino, heterociclo, (heterociclo)oxi, y (heterociclo)alquilo; y los heteroatomos preferidos son oxfgeno, nitrogeno y azufre. Se entiende que cuando existen valencias abiertas en estos sustituyentes, se pueden sustituir adicionalmente con grupos alquilo, cicloalquilo, arilo, heteroarilo y/o heterociclo, y que cuando existen estas valencias abiertas en el carbono, se pueden sustituir adicionalmente con halogeno y oxfgeno., sustituyentes unidos a nitrogeno, o azufre, y donde existen multiples valencias abiertas, estos grupos pueden unirse para formar un anillo, ya sea por formacion directa de un enlace o por formacion de enlaces a un nuevo heteroatomo, preferiblemente oxfgeno, nitrogeno, o azufre. Se entiende ademas que las sustituciones anteriores se pueden realizar siempre que la sustitucion del hidrogeno con el sustituyente no introduzca una inestabilidad inaceptable en las moleculas de la presente descripcion y, por lo demas, sea qmmicamente razonable.
[0117] "Opcional" u "opcionalmente" significa que el evento o circunstancia que se describe posteriormente puede o no ocurrir, y que la descripcion incluye casos en los que ocurre el evento o circunstancia y casos en los que no. Un experto en la tecnica entendera que con respecto a cualquier molecula descrita que contenga uno o mas sustituyentes opcionales, solo se pretende incluir compuestos estericamente practicos y/o sinteticamente viables. "Opcionalmente sustituido" se refiere a todos los modificadores posteriores en un termino o serie de grupos qrnmicos. Por ejemplo, en el termino "arilalquilo opcionalmente sustituido, la porcion" alquilo "y la porcion" arilo "de la molecula pueden o no estar sustituidas, y para la serie" alquilo, cicloalquilo, arilo y heteroarilo opcionalmente sustituidos," los grupos alquilo, cicloalquilo, arilo y heteroarilo, independientemente de los otros, pueden estar o no sustituidos.
5.3 Polipeptidos de hidroxilasa de prolina disenados
[0118] La presente descripcion proporciona polipeptidos que tienen actividad de hidroxilasa de prolina, polinucleotidos que codifican los polipeptidos, metodos de preparacion de los polipeptidos y metodos para usar los polipeptidos. Cuando la descripcion se refiere a polipeptidos, debe entenderse que tambien describe los polinucleotidos que codifican los polipeptidos.
[0119] Las hidroxilasas de prolina pertenecen a una clase de enzimas diooxigenasa que catalizan la hidroxilacion de prolina en presencia de a-cetoglutarato y oxfgeno (O2). El a-cetoglutarato se descarboxila estequiometricamente durante la hidroxilacion, con un atomo de la molecula de O2 incorporado en el succinato y el otro en el grupo hidroxilo formado en el residuo de prolina. Como se senalo anteriormente, las hidroxilasas de prolina se distinguen de la hidroxilasa de prolilo por su capacidad para hidroxilar la prolina libre.
[0120] Se han identificado varios tipos de hidroxilasas de prolina basadas en los principales productos diastereomericos formados en la reaccion enzimatica: cis-3-hidroxilasa de prolina (cis-P3H), cis-4-hidroxilasa de prolina (cis-P4H), trans-3-prolina-hidroxilasa (trans-P3H), y trans-4-hidroxilasa de prolina (trans-P4H). Las enzimas cis-P3H se han identificado en Streptomyces sp. TH1, Streptomyces canus y Bacillus sp. TH2 y TH3 (Mori H. et al., 1996, Appl. Environ. Microbiol. 62 (6):1903-1907). trans-P3H se ha identificado en Glarea lozoyensis (Petersen, L. et al., 2003, Appl Microbiol Biotechnol. 62 (2-3):263-7). cis-P4H se han identificado en Lotus corniculatus rhizobia, Mesorhibozium loti, Sinorhizobium meliloti y Medicago sativa rhizobia, (Hara y Kino, 2009, Biochem Biophys Res Commun. 379 (4):882-6; patente de EE.u U. n° de publicacion. 20110091942). trans-P4H se han identificado en Dactylosporangium sp., Amycolatopsis sp., Streptomyces griseoviridus, Streptomyces sp. y Glarea lozoyensis (Shibasaki T. et al., 1999, Appl. Environ. Microbiol 65 (9):4028-31; 2003, Petersen, L. et al., 2003, Appl Microbiol Biotechnol. 62 (2-3):263-7; Mori, H. et al., 1996, Appl. Environ. Microbiol. 62:1903-1907; Lawrence, C-C, et al., 1996, Biochem. J. 313:185-191; y EP0641862).
[0121] La cis-4-hidroxilasa de prolina de Sinorhizobium meliloti convierte la prolina libre en el producto primario cis-4-hidroxiprolina. Segun Klein et al., Supra, la enzima tambien reconoce el acido L-pipecolico, convirtiendolo en una mezcla de acido cis-5-y cis-3-hidroxipipecolico. Sin embargo, la actividad en el acido pipecolico es menor que en la prolina, y se informa que la enzima tiene una actividad espedfica baja y desnaturalizacion en condiciones de reaccion (Klein et al., Supra). En consecuencia, las reacciones de conversion in vitro para preparar hidroxiprolina y
acido hidroxipipecolico con una enzima de tipo salvaje recombinante expresada en E. coli no fueron adecuadas
como estrategia sintetica para preparaciones a escala comercial. Se encontro que las celulas completas que expresaban la enzima eran mas efectivas, pero requenan el uso de un medio de crecimiento definido que carece de
prolina para minimizar la competencia de la prolina libre y tambien simplificar la purificacion del producto de acido hidroxipipecolico (Klein et al., supra).
[0122] En la presente descripcion, se describen hidroxilasas de prolina modificadas que superan las deficiencias de
la cis-4-hidroxilasa de prolina de tipo salvaje de Sinorhizobium meliloti. Los polipeptidos de hidroxilasa de prolina derivados de la enzima de tipo salvaje de Sinorhizobium meliloti son capaces de convertir eficazmente in vitro prolina
libre en cis-4-hidroxiprolina, pero tambien pueden convertir eficientemente una gama de sustratos, incluida la conversion de acido L-pipecolico (es decir, acido (2S)-piperidina-2-carboxflico) al acido cis-5-hidroxipipecolico (es
decir, acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico). Significativamente, la presente descripcion identifica las posiciones de los residuos de aminoacidos y las mutaciones correspondientes en la secuencia del polipeptido de la hidroxilasa de prolina que mejoran las propiedades enzimaticas en comparacion con la enzima natural, incluyendo,
entre otras, actividad, estabilidad, expresion, regioselectividad, estereoselectividad, tolerancia del sustrato, y especificidad del sustrato. En particular, la presente descripcion proporciona polipeptidos disenados para convertir de manera eficiente el compuesto de sustrato (2), acido (2S)-piperidina-2-carboxflico, al compuesto de producto (1), acido (2S, 5S)-5-hidroxipiperidona-2-carboxflico (como se ilustra en el Esquema 1 anterior) en presencia de un cosustrato en condiciones de reaccion adecuadas.
[0123] En algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados muestran una actividad incrementada en la conversion de prolina y acido (2S)-piperidina-2-carboxflico al producto cis-4-hidroxi prolina y
acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico, respectivamente, en un tiempo definido con la misma cantidad de
enzima en comparacion con la enzima de tipo salvaje. En algunas realizaciones, el polipeptido de hidroxilasa de
prolina disenado tiene al menos aproximadamente 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o 10
veces o mas en condiciones de reaccion adecuadas en comparacion con el polipeptido representado por la SEQ ID.
NO:2.
[0124] En algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados han aumentado la regioselectividad en comparacion con la hidroxilasa de prolina de tipo salvaje. Espedficamente, la enzima natural convierte la prolina en, principalmente, si no exclusivamente, cis-4-hidroxiprolina y convierte el acido (2S)-piperidina-2-carboxflico en una mezcla de productos diastereomericos que comprenden el compuesto (1 ), acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico y compuesto (1a), acido (2S,3R)-3-hidroxi-piperidina-2-carboxflico. En algunas realizaciones, los polipeptidos de hidroxilasa de prolina disenados en la presente invencion son capaces de formar selectivamente el compuesto (1) en exceso del compuesto del producto (1a). En algunas realizaciones, los polipeptidos modificados pueden formar selectivamente el compuesto (1 ) en exceso del producto compuesto (1a),
donde la relacion del compuesto (1 ) formado sobre el compuesto (1a) en condiciones de reaccion adecuadas es al menos 1,5, 2, 3, 4, 5 o 6 o mas.
[0125] En algunas realizaciones, los polipeptidos de hidroxilasa de prolina disenados son capaces de convertir el compuesto de sustrato (2) en el compuesto de producto (1) sin formar cantidades significativas de acido trans-5-hidroxipipecolico (es decir, acido (2S, 5R)-5-hidroxipiperidina-2-carboxflico). En algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados son capaces de convertir el compuesto de sustrato (2) en el compuesto del producto (1) en condiciones de reaccion adecuadas en mas del 90%, 91%, 92%, 93%, 94%, 95%.
96%, 97%, 98%, 99%, 99,5 o mas exceso diastereomerico de acido (2S, 5R)-5-hidroxipiperidina-2-carboxflico.
[0126] En algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados son capaces de convertir el compuesto de sustrato (2) en el compuesto de producto (1 ) en condiciones de reaccion adecuadas con mayor tolerancia para la presencia de sustrato en relacion con el polipeptido de referencia de la SEQ ID NO:2. De este
modo, en algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados son capaces de convertir el compuesto de sustrato (2) en el compuesto del producto (1 ) a una concentracion de carga de sustrato de al menos aproximadamente 10 g/L, aproximadamente 20 g/L, aproximadamente 30 g/L L, aproximadamente 40 g/L, aproximadamente 50 g/L, aproximadamente 70 g/L, aproximadamente 100 g/L, aproximadamente 125 g/ aproximadamente 150 g/L, aproximadamente 175 g/L o aproximadamente 200 g/L o mas con un porcentaje d conversion de al menos aproximadamente el 40%, al menos aproximadamente el 50%, al menos aproximadamente
el 60%, al menos aproximadamente el 70%, al menos aproximadamente el 80%, al menos aproximadamente el
90%, al menos aproximadamente el 95%, al menos aproximadamente el 98%, o al menos aproximadamente el 99%,
en un tiempo de reaccion de aproximadamente 120 horas o menos, 72 horas o menos, aproximadamente 48 horas o
menos, aproximadamente 36 horas o menos, o aproximadamente 24 h menos, en condiciones de reaccion adecuadas.
[0127] Las condiciones de reaccion adecuadas bajo las cuales las propiedades mejoradas descritas anteriormente de los polipeptidos disenados llevan a cabo la reaccion de hidroxilacion se pueden determinar con respecto a las concentraciones o cantidades de polipeptido, sustrato, co-sustrato, cofactor de metal de transicion, reductor, tampon, co-disolvente, pH, condiciones que incluyen temperatura y tiempo de reaccion, y/o condiciones con el polipeptido inmovilizado sobre un soporte solido, como se describe mas adelante y en los ejemplos.
[0128] Los polipeptidos disenados a modo de ejemplo que tienen actividad hidroxilasa de prolina con propiedades mejoradas, particularmente en la conversion del compuesto (2) en compuesto (1), comprenden una secuencia de aminoacidos que tiene una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 en las siguientes posiciones de residuos: X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. Las diferencias de aminoacidos espedficas en cada una de estas posiciones que estan asociadas con las propiedades mejoradas de los polipeptidos ejemplares de las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H incluyen: X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0129] La informacion de la estructura y funcion de los polipeptidos de hidroxilasa de prolina de origen no natural (o disenados) de la presente descripcion se basa en la conversion del compuesto (2) en el compuesto (1), cuyos resultados se muestran a continuacion en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H. Los identificadores de secuencia numerada impar (es decir, las SEQ ID NO) se refieren a la secuencia de nucleotidos que codifica la secuencia de aminoacidos proporcionada por las SEQ ID NO de numero par. Las secuencias ejemplares se proporcionan en el archivo de listado de secuencia electronica que acompana a esta descripcion. Las diferencias de residuos de aminoacidos se basan en la comparacion con la secuencia de referencia de SEQ ID NO:2 (o SEQ ID NO:4, o 6), que representan la secuencia de aminoacidos de origen natural de la cis-4-hidroxilasa de prolina de Sinorhizobium meliloti. La actividad de cada polipeptido disenado con respecto al polipeptido de referencia de la SEQ ID NO:2 se determino como la conversion del sustrato, acido (2S)-piperidina-2-carboxflico, al producto, acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico durante un penodo de tiempo y temperatura establecidos en un ensayo de alto rendimiento (HTP), que se uso como pantalla principal. Los valores del ensayo HTP en las Tablas 2A, 2B y 2F se determinaron usando lisados de celulas claras de E. coli. en formato de placa de 96 pocillos de ~ 200 pl de volumen por pocillo siguientes a condiciones de reaccion de ensayo como se indica en la tabla y los Ejemplos. En algunos casos, se utilizo un ensayo en polvo en matraz de agitacion (SFP) o en polvo procesado posteriormente (DSP) como cribado secundario para evaluar las propiedades de las hidroxilasas de prolina, cuyos resultados se proporcionan en las Tablas 2C, 2D, 2E, 2G, y 2H. Las formas SFP proporcionan una preparacion en polvo mas purificada de los polipeptidos disenados y pueden contener los polipeptidos disenados que representan hasta aproximadamente el 30% de la protema total. Las preparaciones de dSp pueden proporcionar una forma aun mas purificada del polipeptido disenado ya que las preparaciones pueden contener las hidroxilasas de prolina disenadas que son hasta aproximadamente el 80% de la protema total. Las hidroxilasas de prolina modificadas tambien se examinaron para determinar sus regioselectividades midiendo la relacion (expresada como la relacion de selectividad) del compuesto del producto (1), acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico, al compuesto del producto (1a), acido (2S,3R)-3-hidroxipiperidina-2-carboxflico, formado en las reacciones.
Tabla 2A: Polipeptidos disenados y mejoras de enzimas relativas utilizando preparaciones de HTP
Figure imgf000021_0001
(Continuado)
Figure imgf000022_0002
Tabla 2B: Polipeptidos disenados y mejoras de enzimas relativas utilizando preparaciones de HTP
Figure imgf000022_0001
Tabla 2C: Polipeptidos disenados y mejoras de enzimas relativas que utilizan preparaciones enzimaticas "Mini-DSP"
Figure imgf000023_0001
Tabla 2D: Polipeptidos disenados y mejoras de enzimas relativas utilizando preparaciones completas de DSP
Figure imgf000023_0002
(Continuado)
Figure imgf000024_0001
Tabla 2E: Polipeptidos disenados y mejoras de enzimas relativas utilizando preparaciones de SFP
Figure imgf000024_0002
Tabla 2F: Polipeptidos disenados y mejoras en la enzima relativa usando preparaciones de HTP
Figure imgf000025_0001
(Continuado)
Figure imgf000026_0001
(Continuado)
Figure imgf000027_0001
Tabla 2G: Polipeptidos disenados y mejoras en la enzima relativa utilizando preparaciones de SFP
Figure imgf000028_0001
Tabla 2H: Polipeptidos disenados y mejoras de enzimas relativas utilizando preparaciones DSP
Figure imgf000029_0001
[0130] A partir de un analisis de los polipeptidos ejemplares, las mejoras en las propiedades enzimaticas se asocian con diferencias de residuos en comparacion con la s Eq ID NO:2 en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. Las diferencias espedficas de residuos en cada una de estas posiciones que estan asociadas con las propiedades mejoradas incluyen:X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; yX271R.
[0131] Las propiedades enzimaticas espedficas asociadas con las diferencias de residuos en comparacion con la SEQ ID NO:2 en las posiciones de residuos anteriores incluyen, entre otras, la actividad enzimatica, la regioselectividad, la expresion de polipeptidos y la tolerancia del sustrato. Las mejoras en la actividad enzimatica y la tolerancia del sustrato estan asociadas con diferencias de residuos en las posiciones de los residuos X3; X17; X24;
X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X103; X112; X113; X114; X115;
X116; X121; X131; X140; X150; X151; X166; X188; X225; X230; X270; y X271. Las mejoras en la regioselectividad estan asociadas con diferencias de residuos en las posiciones de residuos:X3; X25; X42; X66; X92; X98; X103;
X115; X131; y X166. Las mejoras en la expresion de polipeptidos estan asociadas con diferencias de residuos en las posiciones de residuos:X2; X4; X5; X9; y X13. Por consiguiente, las diferencias de residuos en las posiciones de residuos anteriores se pueden usar individualmente o en varias combinaciones para producir polipeptidos de hidroxilasa de prolina disenados que tengan las propiedades mejoradas deseadas, que incluyen, entre otras, la actividad enzimatica, la regioselectividad, la estereoselectividad y la tolerancia al sustrato. Se pueden usar otras diferencias de residuos que afectan a la expresion del polipeptido para aumentar la expresion de la hidroxilasa de prolina disenada.
[0132] A la luz de la grna proporcionada en este documento, se contempla ademas que cualquiera de los polipeptidos disenados a modo de ejemplo de SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38,
40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98,
100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146,
148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192,
194, 196, 198, 200, 202, 204, 206, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228 pueden ser utilizados como la secuencia de aminoacidos de partida para sintetizar otros polipeptidos de hidroxilasa de prolina modificados, por ejemplo mediante rondas de evolucion posteriores que incorporan nuevas combinaciones de diversas diferencias de aminoacidos de otros polipeptidos en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H, y otras posiciones de residuos descritas en este documento. Se pueden generar mejoras adicionales al incluir las diferencias de aminoacidos en las posiciones de los residuos que se han mantenido sin cambios durante las rondas anteriores de evolucion.
[0133] Por consiguiente, en algunas realizaciones, el polipeptido disenado que tiene actividad hidroxilasa de prolina comprende una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%.,
93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad de secuencia a la secuencia de referencia SEQ ID NO:2 y una o mas diferencias de residuos en comparacion con SEQ ID NO:2 en las posiciones de residuos seleccionadas de:X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88;
X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205;
X225; X230; X270; y X271.
[0134] En algunas realizaciones, el polipeptido disenado que tiene actividad hidroxilasa de prolina con propiedades mejoradas en comparacion con la SEQ ID NO:2, comprende una secuencia de aminoacidos que tiene al menos
80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad con una secuencia de referencia seleccionada de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36,
38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146,
148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192,
194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 en las posiciones de residuos seleccionadas de:X2; X3; X4; X5;
X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103;
X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. En algunas realizaciones, la secuencia de aminoacidos de referencia se selecciona de la SEQ ID NO:10, 24,
104, 106, 108, 110, 132, 164, 222, 224, 226 y 228. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:10. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:24. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:104. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:108. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:110. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:132. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:164. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:222. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:224. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:226. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:228.
[0135] En algunas realizaciones, el polipeptido disenado que tiene actividad hidroxilasa de prolina con propiedades mejoradas en comparacion con la s Eq ID NO:2, comprende una secuencia de aminoacidos seleccionada de la SEQ
ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64,
66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118,
120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166,
168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212,
214, 216, 218, 220, 222, 224, 226 y 228, y que tienen una o mas diferencias de residuos en comparacion con la
SEQ ID NO:2 en las posiciones de residuos seleccionadas de:X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29;
X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116;
X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. En algunas realizaciones, la secuencia de aminoacidos se selecciona de la SEQ ID NO:10, 24, 104, 106, 108, 110, 132, 164, 222, 224, 226 y
228. En algunas realizaciones, la secuencia de aminoacidos es la SEQ. ID NO:10. En algunas realizaciones, la secuencia de aminoacidos es la SEQ ID NO:24. En algunas realizaciones, la secuencia de aminoacidos es la SEQ ID NO:104. En algunas realizaciones, la secuencia de aminoacidos es la SEQ ID NO:108. En algunas realizaciones, la secuencia de aminoacidos es la SEQ ID NO:110. En algunas realizaciones, la secuencia de aminoacidos es la SEQ ID NO:132. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:164. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:222. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:224. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:226. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:228.
[0136] En algunas realizaciones, las diferencias de residuos en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0137] Por consiguiente, en algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados que muestran una o mas de las propiedades mejoradas descritas en este documento pueden comprender una secuencia de aminoacidos que tiene la identidad de la secuencia de aminoacidos a una secuencia de referencia como se describe anteriormente, y una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de:X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0138] En algunas realizaciones, la hidroxilasa de prolina modificada tiene una secuencia de aminoacidos que comprende al menos una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: X25R; X26T; X103L; X115E; X131Y/F; y X166Q.
[0139] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado comprende una secuencia de aminoacidos que tiene al menos una combinacion de diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: (a) X103L y X166Q; (b) X52P y X255Y; (c) X4E/L/S y X115A; (d) X25R y X58A; (e) X29A y X166T/Q/L; (f) X115H/D/G y X121F; (g) X3S, X103L y X166Q;(H)X103L, X131Y/F, y X166T/Q/L; (i) X26T, X103L y X166T/Q/L; (j) X25R, X66Q, X92V y X115E; (k) X25R, X66Q, X92V, X103L, X115E y X166Q; y (1) X3S, X25R, X66Q, X92V, X103L, X115E y X166Q.
[0140] Como apreciara el experto en la materia, en algunas realizaciones, una o una combinacion de las diferencias de residuos anteriores que se seleccionan pueden mantenerse constantes (es decir, mantenerse) en las hidroxilasas de prolina como una caractenstica central, y diferencias adicionales de residuos. en otras posiciones de residuos incorporadas en la secuencia para generar polipeptidos de hidroxilasa de prolina modificados adicionales con propiedades mejoradas. Por consiguiente, debe entenderse para cualquier hidroxilasa de prolina incorporada que contenga una o un subconjunto de las diferencias de residuos anteriores, la presente descripcion se refiere a otras hidroxilasas de prolina modificadas que comprenden una o un subconjunto de las diferencias de residuos, y adicionalmente una o mas diferencias de residuos en las otras posiciones de residuos descritas en este documento. A modo de ejemplo y no de limitacion, una hidroxilasa de prolina disenada que comprende una diferencia de residuos en la posicion del residuo X103, puede incorporar ademas una o mas diferencias de residuos en las otras posiciones del residuo, por ejemplo, X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. Otro ejemplo es una hidroxilasa de prolina disenada que comprende una diferencia de residuos en la posicion del residuo X166, que puede comprender ademas una o mas diferencias de residuos en las otras posiciones del residuo, por ejemplo, X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X186; X188; X205; X225; X230; X270; y X271.
[0141] Como se indico anteriormente, los polipeptidos disenados que tienen actividad de hidroxilasa de prolina tambien son capaces de convertir el compuesto de sustrato (2) en el compuesto de producto (1). En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado es capaz de convertir el compuesto de sustrato (2) en el compuesto del producto (1) con al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces o mas actividad en relacion con la actividad del polipeptido de referencia de la SEQ ID NO:2. En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado para convertir el compuesto de sustrato (2) en el compuesto del producto (1) con al menos 1,2 veces, 1,5 veces La actividad 2 veces, 3 veces, 4 veces, 5 veces, 10 veces o mas en relacion con la actividad del polipeptido de referencia de la SEQ ID NO:2 comprende una secuencia de aminoacidos que tiene una o mas caractensticas seleccionadas de:X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0142] En algunas realizaciones, el polipeptido de hidroxilasa de prolina modificado es capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1 ) con al menos 1,2 veces la actividad con respecto a la SEQ ID NO:2 y comprende una secuencia de aminoacidos seleccionada de:SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 210, 212, 214, 216, 218, 220, 222, 224, 226, y 228.
[0143] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado es capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1) con al menos 2 veces la actividad con respecto a la SEQ ID NO:2 y comprende una secuencia de aminoacidos que tiene una o mas diferencias de residuos seleccionadas de:X3S; X30P; X86S; X103L; X103Q; X113E; X115E; X150S; X166Q; X151S; X225L; y 270E.
[0144] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado para convertir el compuesto de sustrato (2) en el compuesto de producto (1) con al menos 2 veces la actividad con respecto a la SEQ ID NO:2 comprende una secuencia de aminoacidos seleccionada de:SEQ ID NO:10, 12, 18, 24, 28, 66, 68, 70, 72, 76, 98, 100, 102, 104, 106, 108, 110; 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
[0145] En algunas realizaciones, el polipeptido de hidroxilasa de prolina modificado es capaz de convertir al menos el 50% o mas, el 60% o mas, el 70% o mas, el 89% o mas, el 90% o mas, el 91% o mas, el 92% o mas, 93% o mas, 94% o mas, o 95% o mas del compuesto (2) al compuesto (1) en 120 horas o menos, 72 horas o menos, 48 horas o menos, o 24 o menos, a una carga de sustrato de aproximadamente 100 g/L, aproximadamente 50 g/L, o aproximadamente 20 g/L en condiciones de ensayo HTP, en condiciones de ensayo SFP, o condiciones de ensayo DSP. En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado es capaz de convertir al menos el 50% o mas del compuesto (2) en el compuesto (1) en 24 horas o menos a una carga de sustrato de aproximadamente 20 g/L en condiciones de ensayo DSP a aproximadamente 25°C.
[0146] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado es capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1) en exceso del compuesto (1a). Las diferencias de residuos identificadas en las hidroxilasas de prolina modificadas a modo de ejemplo de las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H se muestran para mantener o aumentar la regioselectividad para el compuesto (1) sobre el compuesto (1a) en la reaccion de conversion. En algunas realizaciones, los polipeptidos de hidroxilasa de prolina modificados son capaces de convertir el compuesto de sustrato (2) en el compuesto del producto (1 ) en exceso del compuesto (1a), donde la proporcion del compuesto (1 ) formado sobre el compuesto (1a) es al menos una relacion de 1,5, 2, 3, 4, 5 o 6 o mas, en particular bajo las condiciones del ensayo HTP, el ensayo SFP o el ensayo DSP.
[0147] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado para convertir el compuesto de sustrato (2) en el compuesto del producto (1 ) en exceso del compuesto (1a) en al menos una relacion de 2 o mas comprende una secuencia de aminoacidos con al menos una o mas de las siguientes funciones:X103L; X115E; X166q y X131Y. En algunas realizaciones, la hidroxilasa de prolina modificada capaz de convertir el compuesto de sustrato (2) en un compuesto de producto (1 ) en exceso del compuesto (1a) en al menos una relacion de 2 o mas comprende una secuencia de aminoacidos seleccionada de la SeQ ID NO:10, 24, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
[0148] En algunas realizaciones, el polipeptido de hidroxilasa de prolina disenado para convertir el compuesto de sustrato (2) en el compuesto del producto (1) en exceso del compuesto (1a) en al menos una relacion de 4 o mas comprende una secuencia de aminoacidos. Al menos las caractensticas X103L y X166Q. En algunas realizaciones, la hidroxilasa de prolina modificada capaz de convertir el compuesto de sustrato (2) en el compuesto del producto (1 ) en exceso del compuesto (1a) en al menos una relacion de 4 o mayor comprende una secuencia de aminoacidos seleccionada de la SEQ ID NO:104, 106, 108, 110, 130, 132134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, y 228.
[0149] En algunas realizaciones, la hidroxilasa de prolina modificada es capaz de convertir el compuesto de sustrato (2) en el compuesto del producto (1) en exceso estereomerico del compuesto (1R), acido (2S, 5R)-5hidroxipiperidina-2-carboxflico,
Figure imgf000033_0001
[0150] La enzima de tipo salvaje se caracteriza por su capacidad para convertir el acido (2S)-piperidina-2-carboxflico
en acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico, con poco o nada del producto trans hidroxi. (1R). Como se muestra en el presente documento, las diferencias de residuos en los polipeptidos de hidroxilasa de prolina modificados ejemplares de las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H mantienen la alta diastereoselectividad, incluidos aquellos polipeptidos con cambios no conservadores en la secuencia de aminoacidos. En algunas realizaciones, la hidroxilasa de prolina modificada capaz de convertir el compuesto de sustrato (2) en el compuesto
del producto (1) en exceso diastereomerico del compuesto (1R) comprende una secuencia de aminoacidos que tiene
una o mas caracteristicas seleccionadas de:X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V,
X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q;
X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H;
X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T;
X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R. En algunas realizaciones, el producto compuesto (1) se forma en al menos un 90%, 95%, 96%, 97%, 98%, 99% o un exceso diastereomerico mayor del compuesto (1R). En algunas realizaciones, no se forma una cantidad detectable de producto trans hidroxi (1R) por los polipeptidos disenados bajo condiciones de reaccion adecuadas.
[0151] En algunas realizaciones, la hidroxilasa de prolina modificada tiene una secuencia de aminoacidos que comprende una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 que aumentan la expresion de la actividad de hidroxilasa de prolina modificada en una celula huesped bacteriana, particularmente en E. coli. En algunas realizaciones, la secuencia de aminoacidos que muestra una expresion incrementada en una celula huesped bacteriana comprende una o mas diferencias de residuos seleccionadas de:X2K; X2T; X4Q; X4L; X4E;
X4S; X5I; X5L; X5M; X9I; y X13T.
[0152] En algunas realizaciones, el polipeptido de hidroxilasa de prolina modificado con propiedades mejoradas en
la version del compuesto (2) al compuesto (1 ) tiene una secuencia de aminoacidos que comprende una secuencia seleccionada de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52,
54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110,
112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158,
160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204,
206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
[0153] En algunas realizaciones, el polipeptido disenado que tiene actividad de hidroxilasa de prolina, comprende
una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,
95%, 96%, 97%, 98%, o 99% de identidad con una de las SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30,
32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92,
94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142,
144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188,
190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y las diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO:2 presentes en cualquiera de la SEQ ID
NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66,
68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 210, 212, 218, 220, 222, 224, 226 y 228, segun lo dispuesto en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H.
[0154] Ademas de las posiciones de residuos especificadas anteriormente, cualquiera de los polipeptidos de hidroxilasa de prolina descritos aqrn puede comprender ademas otras diferencias de residuos en relacion con la
SEQ ID NO:2 en otras posiciones de residuos, es decir, posiciones de residuos distintas de X2; X3; X4; X5; X9; X13;
X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112;
X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. Las diferencias de residuos en estas otras posiciones de residuos pueden proporcionar variaciones adicionales en la secuencia de aminoacidos sin afectar adversamente la capacidad del polipeptido para llevar a cabo la conversion de
prolina en cis-4-hidroxiprolina, asf como la conversion del compuesto (2) en compuesto (1). Por consiguiente, en algunas realizaciones, ademas de las diferencias de residuos de aminoacidos presentes en cualquiera de los polipeptidos de hidroxilasa de prolina seleccionados seleccionados de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, la secuencia puede comprender ademas 1-2, 1-3, 1-4, 1-5, 1-6, 1-7. 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, o 1-50 diferencias de residuos en otras posiciones de residuos de aminoacidos en comparacion con la SEQ ID NO:2. En algunas realizaciones, el numero de diferencias de residuos de aminoacidos en comparacion con la secuencia de referencia puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17. 18, 19, 20, 21,22, 23, 24, 25, 30, 30, 35, 40, 45 o 50 posiciones de residuos. En algunas realizaciones, el numero de diferencias de residuos de aminoacidos en comparacion con la secuencia de referencia puede ser 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 o 25 posiciones de residuos. La diferencia de residuos en estas otras posiciones puede ser cambios conservativos o cambios no conservativos. En algunas realizaciones, las diferencias de residuos pueden comprender sustituciones conservativas y sustituciones no conservativas en comparacion con el polipeptido de hidroxilasa de prolina natural de la SEQ ID n O:2.
[0155] En algunas realizaciones, la presente descripcion tambien proporciona polipeptidos disenados que comprenden un fragmento de cualquiera de los polipeptidos de hidroxilasa de prolina disenados que retiene la actividad funcional y/o la propiedad mejorada de esa hidroxilasa de prolina. Por consiguiente, en algunas realizaciones, la presente descripcion proporciona un fragmento de polipeptido capaz de convertir el compuesto (2) en el compuesto (1 ) en condiciones de reaccion adecuadas, en donde el fragmento comprende al menos aproximadamente 80%, 90%, 95%, 96%, 97%, 98% o 99% de una secuencia de aminoacidos de longitud completa de un polipeptido de hidroxilasa de prolina de la presente descripcion, tal como un polipeptido de hidroxilasa de prolina de ingeniena seleccionado de SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 6668, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
[0156] En algunas realizaciones, el polipeptido de hidroxilasa de prolina modificado puede tener una secuencia de aminoacidos que comprende una eliminacion de uno cualquiera de los polipeptidos de hidroxilasa de prolina de descritos en este documento, tales como los polipeptidos ejemplares de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
Asf, para cada una de las realizaciones de los polipeptidos de hidroxilasa de prolina modificados de la descripcion, la secuencia de aminoacidos puede comprender deleciones de uno o mas aminoacidos, 2 o mas aminoacidos, 3 o mas aminoacidos, 4 o mas aminoacidos, 5 o mas aminoacidos, 6 o mas aminoacidos, 8 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta el 10% del numero total de aminoacidos, hasta el 10% del numero total de aminoacidos, hasta el 20% del numero total de aminoacidos, o hasta el 30% del numero total de aminoacidos de los polipeptidos de hidroxilasa de prolina, donde se mantienen la actividad funcional asociada y/o las propiedades mejoradas de la hidroxilasa de prolina disenada en el presente documento. En algunas realizaciones, las eliminaciones pueden comprender 1-2, 1-3, 1-4, 1-5, 1-6, 1-7. 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1­ 22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, o 1-50 aminoacidos residuos. En algunas realizaciones, el numero de eliminaciones puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17. 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 o 50 residuos de aminoacidos. En algunas realizaciones, las supresiones pueden comprender deleciones 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, o 25 residuos de aminoacidos.
[0157] En algunas realizaciones, el polipeptido de hidroxilasa de prolina modificado geneticamente en el presente documento puede tener una secuencia de aminoacidos que comprende una insercion en comparacion con uno cualquiera de los polipeptidos de hidroxilasa de prolina modificado geneticamente descritos en el presente documento, tales como los polipeptidos modificados ejemplares de la SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 6062, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
De este modo, para cada una de las realizaciones de los polipeptidos de hidroxilasa de prolina de la descripcion, las inserciones pueden comprender uno o mas aminoacidos, 2 o mas aminoacidos, 3 o mas aminoacidos, 4 o mas aminoacidos, 5 o mas aminoacidos, 6 o mas aminoacidos, 8 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, 20 o mas aminoacidos, 30 o mas aminoacidos, 40 o mas aminoacidos, o 50 o mas aminoacidos, donde se mantiene la actividad funcional asociada y/o las propiedades mejoradas de la hidroxilasa de prolina disenada aqrn descrita. Las inserciones pueden ser en el extremo amino o carboxi, o en porciones internas del polipeptido de la hidroxilasa de prolina.
[0158] En algunas realizaciones, el polipeptido de hidroxilasa de prolina manipulado en el presente documento puede tener una secuencia de aminoacidos que comprende una secuencia seleccionada de la SEQ ID NO:8, 10, 12,
14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y opcionalmente una o varias (por ejemplo, hasta 3, 4, 5 o hasta 10) deleciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, la secuencia de aminoacidos tiene opcionalmente 1-2, 1-3, 1-4, 1-5, 1-6, 1-7. 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1­
45, o 1-50 eliminaciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, el numero de secuencias de aminoacidos tiene opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 o 50 deleciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, la secuencia de aminoacidos tiene opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 o 25 eliminaciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, las sustituciones pueden ser sustituciones conservativas o no conservativas.
[0159] En las realizaciones anteriores, las condiciones de reaccion adecuadas para los polipeptidos disenados pueden ser las descritas en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H. Por consiguiente, en algunas realizaciones, las condiciones de reaccion adecuadas son las condiciones del ensayo HTP, que pueden comprender: 10 g/L o 20 g/L de carga de compuestos de sustrato; 19 g/L de acido a-cetoglutarico; 21 g/L de acido L-ascorbico; Sal de Mohr
1,5 mM; tampon de fosfato de potasio 50 mM, pH 6,3 (pH ajustado con KOH); 100 pl de lisado crudo; y una temperatura de reaccion a aproximadamente 25°C (temperatura ambiente) durante un tiempo de reaccion de aproximadamente 24 h.
[0160] En algunas realizaciones, las condiciones de reaccion adecuadas son las descritas para los ensayos en polvo de matraz de agitacion (SFP), que pueden comprender: 30 g/L de carga de compuesto de sustrato; 52,5 g/L de acido a-cetoglutarico; 21 g/L de acido L-ascorbico; sal de Mohr 2,25 mM; tampon de fosfato de potasio 50 mM, pH
6,3 (pH ajustado con KOH); 5 g/L de protema de preparacion de polvo de enzima SFP; y una temperatura de reaccion de aprox. 25°C (temperatura ambiente) durante un tiempo de reaccion de aproximadamente 24 h.
[0161] En algunas realizaciones, las condiciones de reaccion adecuadas son las descritas para los mini ensayos de polvo de proceso descendente (DSP), que comprenden: 10 g/L o 20 g/L de carga de sustrato; 19 g/L de acido acetoglutarico; 21 g/L de acido L-ascorbico; sal de Mohr 1,5 mM; tampon de fosfato de potasio 50 mM, pH 6,3; 20 g/l de protema de preparacion de polvo DSP; y una temperatura de reaccion de aproximadamente 25°C (temperatura ambiente) durante aproximadamente el tiempo de reaccion de aproximadamente 24 h.
[0162] La grna para el uso de estas condiciones de reaccion anteriores y los polipeptidos de hidroxilasa de prolina se dan, entre otras, en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H, y los Ejemplos.
[0163] En algunas realizaciones, los polipeptidos de la descripcion pueden estar en forma de polipeptidos de fusion en los que los polipeptidos disenados se fusionan con otros polipeptidos, tales como, a modo de ejemplo y sin limitacion, etiquetas de anticuerpos (por ejemplo, epftopo myc), secuencias de purificacion (p. ej., etiquetas His para unirse a metales) y senales de localizacion celular (p. ej., senales de secrecion). Por lo tanto, los polipeptidos disenados aqu descritos se pueden usar con o sin fusiones a otros polipeptidos.
[0164] Debe entenderse que los polipeptidos descritos en el presente documento no estan restringidos a los aminoacidos codificados geneticamente. Ademas de los aminoacidos codificados geneticamente, los polipeptidos descritos en el presente documento pueden estar compuestos, en su totalidad o en parte, de aminoacidos no codificados de origen natural y/o sinteticos. Ciertos aminoacidos no codificados comunmente encontrados de los cuales pueden estar comprendidos los polipeptidos descritos en el presente documento incluyen, pero no se limitan a: los estereomeros D de los aminoacidos codificados geneticamente; acido 2,3-diaminopropionico (Dpr); acido aaminoisobutmco (Aib); acido £-aminohexanoico (Aha); acido d-aminovalerico (Ava); N-metilglicina o sarcosina
(MeGly o Sar); ornitina (Orn); citrulina (Cit); t-butilalanina (Bua); t-butilglicina (Bug); N-metilisoleucina (Melle); fenilglicina (Phg); ciclohexilalanina (Cha); norleucina (Nle); naftilalanina (Nal); 2-clorofenilalanina (Ocf); 3-clorofenilalanina (Mcf); 4-clorofenilalanina (Pcf); 2-fluorofenilalanina (Off); 3-fluorofenilalanina (Mff); 4-fluorofenilalanina (Pff); 2-bromofenilalanina (Obf); 3-bromofenilalanina (Mbf); 4-bromofenilalanina (Pbf); 2-metilfenilalanina (Omf); 3-metilfenilalanina (Mmf); 4-metilfenilalanina (Pmf); 2-nitrofenilalanina (Onf); 3-nitrofenilalanina (Mnf); 4-nitrofenilalanina (Pnf); 2-cianofenilalanina (Ocf); 3-cianofenilalanina (Mcf); 4-cianofenilalanina (Pcf); 2-trifluorometilfenilalanina (Otf); 3-trifluorometilfenilalanina (Mtf); 4-trifluorometilfenilalanina
(Ptf); 4-aminofenilalanina (Paf); 4-yodofenilalanina (Pif); 4-aminometilfenilalanina (Pamf); 2,4-diclorofenilalanina
(Opef); 3,4-diclorofenilalanina (Mpcf); 2,4-difluorofenilalanina (Opff); 3,4-difluorofenilalanina (Mpff); pirid-2-ilalanina (2pAla); pirid-3-ilalanina (3pAla); pirid-4-ilalanina (4pAla); naft-1-ilalanina (1nAla); naft-2-ilalanina (2nAla); tiazolilalanina (taAla); benzotienilalanina (bAla); tienilalanina (tAla); furilalanina (fAla); homofenilalanina (hPhe); homotirosina (hTyr); homotriptofano (hTrp); pentafluorofenilalanina (5ff); estirilcalanina (sAla); autilalanina (aAla); 3,3-difenilalanina (Dfa); acido 3-amino-5-fenipentanoico (Afp); penicilamina (pluma); acido 1,2,3,4-tetrahidroisoquinolina-3-carboxflico (Tic); p-2-tienilalanina (Thi); sulfoxido de metionina (Mso); N(w)-nitroarginina (Narg); homolisina (hLys); fosfinometilfenilalanina (pmPhe); Fosfoserina (pSer); fosfotreonina (pThr); acido homoaspartico (hAsp); acido homoglutanico (hGlu); acido 1-aminociclopent-(2 o 3)-en-4-carboxflico; acido pipecolico (PA), acido azetidina-3-carbox^lico (ACA); acido 1-aminociclopentano-3-carbox^lico; alilglicina (aGly); propargilglicina (pgGly); homoalanina (hAla); norvalina (nVal); homoleucina (hLeu), homovalina (hVal); homoisoleucina (hle); homoarginina (hArg); N-acetilo lisina (AcLys); acido 2,4-diaminobutmco (Dbu); acido 2,3-diaminobutmco (Dab); N-metilvalina (MeVal); homocistema (hCys); homoserina (hSer); Hidroxiprolina (Hyp) y homoprolina (hPro). Los aminoacidos no codificados adicionales de los cuales los polipeptidos descritos en el presente documento pueden estar comprendidos seran evidentes para los expertos en la tecnica (vease, por ejemplo, los diversos aminoacidos proporcionados en Fasman, 1989, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC). Press, Boca Raton, FL, en las paginas 3-70 y las referencias citadas en el mismo). Estos aminoacidos pueden estar en la configuracion L o D.
[0165] Los expertos en la tecnica reconoceran que los aminoacidos o residuos que llevan grupos protectores de la cadena lateral tambien pueden comprender los polipeptidos descritos en el presente documento. Los ejemplos no limitativos de dichos aminoacidos protegidos, que en este caso pertenecen a la categona aromatica, incluyen (grupos protectores enumerados entre parentesis), pero no se limitan a: Arg (tos), Cys (metilbencilo), Cys (nitropiridinesulfenilo), Glu (8-bencilester), Gln (xantilo), Asn (N-8-xantilo), His (bom), His (benzilo), His (tos), Lys (fmoc), Lys (tos), Ser (O-bencilo), Thr (O-bencilo) y Tyr (O-bencilo).
[0166] Los aminoacidos no codificantes que estan limitados conformacionalmente de los cuales pueden componerse los polipeptidos descritos en este documento incluyen, pero no se limitan a, N-metilaminoacidos (configuracion L); acido 1-aminociclopent-(2 o 3)-en-4-carboxflico; acido pipecolico; acido azetidina-3-carboxflico; homoprolina (hPro); y acido 1-aminociclopentano-3-carboxflico.
[0167] En algunas realizaciones, los polipeptidos modificados pueden estar en diversas formas, por ejemplo, como una preparacion aislada, como una enzima sustancialmente purificada, celulas completas transformadas con genes que codifican la enzima, y/o como extractos celulares y/o lisados de tales celulas. Las enzimas pueden liofilizarse, secarse por pulverizacion, precipitarse o estar en forma de una pasta cruda, como se explica mas adelante.
[0168] En algunas realizaciones, los polipeptidos disenados pueden proporcionarse sobre un soporte solido, tal como una membrana, resina, portador solido u otro material en fase solida. Un soporte solido puede estar compuesto de polfmeros organicos tales como poliestireno, polietileno, polipropileno, polifluoroetileno, polietilenoxi y poliacrilamida, asf como tambien copolfmeros e injertos de los mismos. Un soporte solido tambien puede ser inorganico, como vidrio, sflice, vidrio de poro controlado (CPG), sflice de fase inversa o metal, como oro o platino. La configuracion de un soporte solido puede ser en forma de perlas, esferas, partfculas, granulos, un gel, una membrana o una superficie. Las superficies pueden ser planas, sustancialmente planas o no planas. Los soportes solidos pueden ser porosos o no porosos, y pueden tener caractensticas de hinchamiento o no hinchamiento. Un soporte solido puede configurarse en forma de pozo, depresion u otro contenedor, recipiente, caractenstica o ubicacion.
[0169] En algunas realizaciones, los polipeptidos disenados que tienen actividad hidroxilasa de prolina de la presente descripcion pueden inmovilizarse sobre un soporte solido de modo que conserven su actividad mejorada, estereoselectividad y/u otras propiedades mejoradas con respecto al polipeptido de referencia de la SEQ ID NO.:2. En tales realizaciones, los polipeptidos inmovilizados pueden facilitar la conversion biocatalttica de los compuestos de sustrato de formula (II), (VI) u otros sustratos adecuados, al compuesto de producto de formula (I), (V), o productos correspondientes, respectivamente (por ejemplo, como se muestra en los Esquemas 1, 2 y 3), y una vez completada la reaccion, se retienen facilmente (por ejemplo, al retener las perlas en las que se inmoviliza el polipeptido) y luego se reutilizan o reciclan en reacciones posteriores. Tales procesos enzimaticos inmovilizados permiten una mayor eficiencia y reduccion de costos. Por consiguiente, se contempla ademas que cualquiera de los metodos de uso de los polipeptidos de hidroxilasa de prolina de la presente descripcion se puede llevar a cabo utilizando los mismos polipeptidos de hidroxilasa de prolina unidos o inmovilizados sobre un soporte solido.
[0170] Los metodos de inmovilizacion de enzimas son bien conocidos en la tecnica. Los polipeptidos disenados pueden unirse de forma no covalente o covalente. Varios metodos para la conjugacion e inmovilizacion de enzimas a soportes solidos (por ejemplo, resinas, membranas, perlas, vidrio, etc.) son bien conocidos en la tecnica y se describen en, por ejemplo: Yi et al., "Covalent immobilization of w-transaminase from Vibrio fluvialis JSl7 on chitosan beads," Process Biochemistry 42 (5):895-898 (mayo de 2007); Martin et al., "Characterization of free and immobilized (S)-aminotransferase for acetophenone production," Applied Microbiolology and Biotechnology 76 (4):843-851 (septiembre de 2007); Koszelewski et al., "Immobilization of w-transaminases by en- capsulation in a solgel/celite matrix", Journal of Molecular Catalysis B: Enzymatic, 63:39-44 (abril de 2010); Truppo et al., "Development of an Improved Immobilized CAL-B for the Enzymatic Resolution of a Key Intermediate to Odanacatib," Organic Process Research & Development, publicado en lmea:dx.doi.org/10.1021/op200157c; Hermanson, GT, Bio­ conjugate Techniques, Segunda Edicion, Academic Press (2008); Mateo et al., "Epoxy sepabeads: a novel epoxy support for stabilization of industrial enzymes via very intense multipoint covalent attachment," Biotechnology Progress 18 (3):629-34 (2002); y Bioconjugation Protocols: Strategies and Methods, In Methods in Molecular Biology, CM Niemeyer E-d., Humana Press (2004). Los soportes solidos utiles para inmovilizar las hidroxilasas de prolina modificadas de la presente descripcion incluyen, pero no se limitan a, perlas o resinas que comprenden polimetacrilato con grupos funcionales epoxido, polimetacrilato con grupos funcionales amino epoxido, copolfmero de estireno/DVB o polimetacrilato con grupos funcionales octadecilo. Soportes solidos ejemplares utiles para inmovilizar los polipeptidos de hidroxilasa de prolina modificados de la presente descripcion incluyen, pero no se limitan a, perlas de quitosan, Eupergit C y SEPABEADs (Mitsubishi), incluidos los siguientes tipos diferentes de SEPABEAD:EC-EP, EC -HFA/S, EXA252, EXE119 y EXE120.
[0171] En algunas realizaciones, los polipeptidos descritos en el presente documento pueden proporcionarse en forma de kits. Las enzimas en los kits pueden estar presentes individualmente o como una pluralidad de enzimas. Los kits pueden incluir ademas reactivos para llevar a cabo las reacciones enzimaticas, sustratos para evaluar la actividad de las enzimas, asf como reactivos para detectar los productos. Los kits tambien pueden incluir dispensadores de reactivos e instrucciones para el uso de los kits.
[0172] En algunas realizaciones, los kits de la presente descripcion incluyen matrices que comprenden una pluralidad de polipeptidos de hidroxilasa de prolina diferentes en una posicion direccionable diferente, en la que los diferentes polipeptidos son variantes diferentes de una secuencia de referencia, cada una con al menos una propiedad enzimatica mejorada diferente. En algunas realizaciones, una pluralidad de polipeptidos inmovilizados sobre soportes solidos se puede configurar en una matriz en varias ubicaciones, direccionables para el suministro robotico de reactivos, o mediante metodos de deteccion y/o instrumentos. La matriz se puede usar para ensayar una variedad de compuestos de sustrato para la conversion de los polipeptidos. Dichas matrices que comprenden una pluralidad de polipeptidos disenados y metodos de su uso se describen, por ejemplo, en el documento WO2009/008908A2.
5.4 Polinudeotidos que codifican las hidroxilasas de prolina, los vectores de expresion y las celulas hospedadoras
[0173] En otro aspecto, la presente descripcion proporciona polinucleotidos que codifican los polipeptidos de hidroxilasa de prolina modificados descritos en el presente documento. Los polinucleotidos pueden unirse operativamente a una o mas secuencias reguladoras heterologas que controlan la expresion genica para crear un polinucleotido recombinante capaz de expresar el polipeptido. Las construcciones de expresion que contienen un polinucleotido heterologo que codifica la hidroxilasa de prolina modificada se pueden introducir en celulas huesped apropiadas para expresar el polipeptido de hidroxilasa de prolina correspondiente.
[0174] Como sera evidente para el experto en la materia, la disponibilidad de una secuencia proteica y el conocimiento de los codones correspondientes a los diversos aminoacidos proporcionan una descripcion de todos los polinucleotidos capaces de codificar los polipeptidos en cuestion. La degeneracion del codigo genetico, donde los mismos aminoacidos estan codificados por codones alternativos o sinonimo, permite que se produzca una gran cantidad de acidos nucleicos, todos los cuales codifican las enzimas hidroxinasas de prolina mejoradas. Por lo tanto, al tener conocimiento de una secuencia de aminoacidos particular, los expertos en la tecnica podnan producir cualquier numero de acidos nucleicos diferentes simplemente modificando la secuencia de uno o mas codones de una manera que no cambie la secuencia de aminoacidos de la protema. En este sentido, la presente descripcion contempla espedficamente todas y cada una de las posibles variaciones de polinucleotidos que podnan realizarse codificando los polipeptidos descritos en este documento mediante la seleccion de combinaciones basadas en las posibles opciones de codones, y todas estas variaciones deben considerarse espedficamente descritas para cualquier polipeptido descrito en este documento, incluidas las secuencias de aminoacidos presentadas en las Tablas 2A, 2B, 2c, 2D, 2E, 2F, 2G y 2H y se describen en la lista de secuencias como SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228.
[0175] En diversas realizaciones, los codones se seleccionan preferiblemente para adaptarse a la celula huesped en la que se produce la protema. Por ejemplo, los codones preferidos utilizados en bacterias se utilizan para expresar el gen en bacterias; Los codones preferidos usados en levadura se usan para la expresion en levadura; y los codones preferidos usados en mairnferos se usan para la expresion en celulas de mairnferos. En algunas realizaciones, no es necesario reemplazar todos los codones para optimizar el uso de codones de las hidroxilasas de prolina, ya que la secuencia natural comprendera los codones preferidos y porque el uso de codones preferidos puede no ser necesario para todos los residuos de aminoacidos. En consecuencia, los polinucleotidos optimizados de codones que codifican las enzimas hidroxinasas de la prolina pueden contener codones preferidos en aproximadamente el 40%, 50%, 60%, 70%, 80% o mas del 90% de las posiciones de los codones de la region codificante de longitud completa.
[0176] En algunas realizaciones, el polinucleotido comprende una secuencia de nucleotidos optimizada de codon que codifica la secuencia de aminoacidos del polipeptido de hidroxilasa de prolina que se produce de forma natural, como se representa por la SEQ ID NO:2. En algunas realizaciones, el polinucleotido tiene una secuencia de acido nucleico que comprende al menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad. para las secuencias de acido nucleico optimizadas en codon de SEQ ID NO:1, 3 o 5, cada una de las cuales codifica las secuencias polipeptidicas identicas de SEQ ID NO:2, 4 o 6, respectivamente. Las secuencias optimizadas de codon de SEQ ID NO:1, 3 o 5 mejoran la expresion de la hidroxilasa de prolina de tipo salvaje codificada, proporcionando preparaciones de enzima capaces de convertir in vitro mas del 80% del compuesto (2) al compuesto (1) bajo condiciones de ensayo mini DSP, y conversion de mas del 45% del compuesto (2) al compuesto
(1) en condiciones de ensayo DSP. En algunas realizaciones, la secuencia de polinucleotido optimizada en codon
puede mejorar la expresion de la hidroxilasa de prolina en al menos 1,2 veces, 1,5 veces o 2 veces o mas en comparacion con la secuencia de polinucleotido natural de Sinorhizobium meliloti, que se describe en este documento como SEQ ID NO:135.
[0177] En algunas realizaciones, los polinucleotidos son capaces de hibridar en condiciones altamente rigurosas con
una secuencia de referencia de SEQ ID NO:1, 3 o 5, o un complemento de los mismos, y codifica un polipeptido que
tiene actividad de hidroxilasa de prolina.
[0178] En algunas realizaciones, como se describio anteriormente, el polinucleotido codifica un polipeptido disenado
que tiene actividad de hidroxilasa de prolina con propiedades mejoradas en comparacion con la SEQ ID NO:2, donde el polipeptido comprende una secuencia de aminoacidos que tiene al menos el 80%, 85%, 86%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad con una secuencia de referencia seleccionada de SEQ ID NO:8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52,
54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110,
112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y una o mas diferencias de residuos en comparaci con la SEQ ID NO:2 seleccionadas de:X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q;
X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H;
X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T;
X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; yX271R. En algunas realizaciones, la secuencia de aminoacidos de referencia se selecciona de la SEQ ID NO:10, 24, 104, 106, 108, 110,
132, 164, 222, 224, 226 y 228. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:10. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:24. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:104. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:108. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:110. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:132. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:164. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:222. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:224. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:226. En algunas realizaciones, la secuencia de aminoacidos de referencia es la SEQ ID NO:228.
[0179] En algunas realizaciones, el polinucleotido codifica un polipeptido de hidroxilasa de prolina capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1 ) con propiedades mejoradas en comparacion con la
SEQ ID NO:2, en donde el polipeptido comprende una secuencia de aminoacidos que tiene en al menos 80%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas la identidad de la secuencia a
la secuencia de referencia SEQ ID NO: 2 y una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2
en las posiciones de residuos seleccionadas de: X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42;
X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140;
X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271.
[0180] En algunas realizaciones, el polinucleotido codifica un polipeptido de hidroxilasa de prolina capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1 ) con propiedades mejoradas en comparacion con la
SEQ ID NO: 2, en donde el polipeptido comprende una secuencia de aminoacidos que tiene en al menos 80%, 85%,
86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas la identidad de la secuencia a
la secuencia de referencia SEQ ID NO: 2, y al menos una combinacion de diferencias de residuos en comparacion
con la SEQ ID NO: 2 seleccionada de: (a) X103L y X166Q; (b) X52P y X255Y; (c) X4E/L/S y X115A; (d) X25R y
X58A; (e) X29A y X166T/Q/L; (f) X115H/D/G y X121F; (g) X3S, X103L y X166Q; (h) X103L, X131Y/F, y X166T/Q/L;
(i) X26T, X103L y X166T/Q/L; (j) X25R, X66Q, X92V y X115E; (k) X25R, X66Q, X92V, X103L, X115E y X166Q; y (l)
X3S, X25R, X66Q, X92V, X103L, X115E y X166Q.
[0181] En algunas realizaciones, el polinucleotido codifica un polipeptido de hidroxilasa de prolina capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1 ) con propiedades enzimaticas mejoradas en comparacion con el polipeptido de referencia de la SEQ ID NO: 2, en donde el polipeptido comprende una secuencia
de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,
98%, o 99% de identidad con un polipeptido de referencia seleccionado de una cualquiera de las SEQ ID NO: 8, 10,
12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72,
74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124,
126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172,
174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, con la condicion de que la secuencia de aminoacidos comprende cualquiera de los conjuntos de diferencias de residuos en comparacion con la SEQ ID NO: 2 contenida en una cualquiera de las secuencias polipeptfdicas de la SEQ ID NO: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, como se indica en las Tablas 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H.
[0182] En algunas realizaciones, el polinucleotido que codifica la hidroxilasa de prolina disenada comprende una secuencia de polinucleotido seleccionada de la SEQ ID NO: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225 y 227.
[0183] En algunas realizaciones, los polinucleotidos son capaces de hibridar en condiciones altamente rigurosas con una secuencia de polinucleotidos de referencia seleccionada de la SEQ ID NO: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225 y 227. o un complemento del mismo, y codifica un polipeptido que tiene actividad hidroxilasa de prolina con una o mas de las propiedades mejoradas descritas en el presente documento. En algunas realizaciones, el polinucleotido capaz de hibridar en condiciones altamente rigurosas codifica un polipeptido de hidroxilasa de prolina que tiene una secuencia de aminoacidos que comprende una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2 en las posiciones de residuos seleccionadas de: X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271. En algunas realizaciones, las diferencias de residuos en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0184] En algunas realizaciones, los polinucleotidos codifican los polipeptidos descritos en este documento pero tienen al menos aproximadamente el 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mas de identidad de secuencia a nivel de nucleotido a un polinucleotido de referencia que codifica la hidroxilasa de prolina modificada. En algunas realizaciones, la secuencia de polinucleotidos de referencia se selecciona de la SEQ ID NO: 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225 y 227.
[0185] Un polinucleotido aislado que codifica un polipeptido de hidroxilasa de prolina mejorado puede manipularse en una variedad de formas para proporcionar la expresion del polipeptido. En algunas realizaciones, los polinucleotidos que codifican los polipeptidos pueden proporcionarse como vectores de expresion en los que esta presente una o mas secuencias de control para regular la expresion de los polinucleotidos y/o polipeptidos. La manipulacion del polinucleotido aislado antes de su insercion en un vector puede ser deseable o necesaria dependiendo del vector de expresion. Las tecnicas para modificar polinucleotidos y secuencias de acido nucleico que utilizan metodos de ADN recombinante son bien conocidas en la tecnica. Se proporciona orientacion en Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3a Ed., Cold Spring Harbor Laboratory Press; y Current Protocols in Molecular Biology, Ausubel. F. Ed., Greene Pub. Asociados, 1998, actualizaciones a 2006.
[0186] En algunas realizaciones, la secuencia de control incluye, entre otras, un promotor, una secuencia lfder, una secuencia de poliadenilacion, una secuencia de propeptidos, una secuencia de peptidos senal y un terminador de la transcripcion. Los promotores adecuados pueden seleccionarse basandose en las celulas hospedadoras utilizadas. Para las celulas hospedadoras bacterianas, los promotores adecuados para dirigir la transcripcion de los constructos de acido nucleico de la presente descripcion incluyen los promotores obtenidos del operon lac de E. coli, el gen de la agarasa de Streptomyces coelicolor (dagA), el gen de Bacillus subtilis levansacarasa (sacB), Bacillus licheniformis gen de alfa-amilasa (amyL), gen de la amilasa maltogenica de Bacillus stearothermophilus (amyM), gen de la alfa amilasa de Bacillus amyloliquefaciens (amyQ), gen de penicilinasa Bacillus licheniformis (penP), genes xulA y xylB Bacillus subtilis, y gen de betalactamasa procariotica (Villa-Kamaroff et al., 1978, Proc. Natl Acad. SCI. EE.UU. 75: 3727-3731), asf como el promotor tac (DeBoer et al., 1983, Proc. Natl Acad. SCI. EE.UU. 80: 21-25). Promotores ejemplares para celulas huesped fungicas filamentosas, incluyen promotores obtenidos a partir de los genes para amilasa TAKA Aspergillus oryzae, proteinasa aspartica Rhizomucor miehei, alfa-amilasa neutra Aspergillus niger, alfa-amilasa estable de acido Aspergillus niger, glucoamilasa Aspergillus niger o Aspergillus awamori (glaA), lipasa Rhizomucor miehei, proteasa alcalina Aspergillus oryzae, isomerasa de fosfato de triosa Aspergillus oryzae, acetamidasa Aspergillus nidulans, y proteasa de tipo tripsina Fusarium oxysporum (WO 96/00787), asf como el promotor NA2-tpi (un hubrido de los promotores de los genes de alfa-amilasa neutra Aspergillus niger y isomerasa de fosfato de triosa Aspergillus oryzae), y promotores mutantes, truncados e hubridos de los mismos. Promotores celulares de levadura ejemplares pueden ser de genes que pueden ser genes de enolasa Saccharomyces cerevisiae (eNO-1), galactocinasa Saccharomyces cerevisiae (GAL1), alcohol deshidrogenasa/gliceraldehndo-3-fosfato dehidrogenasa Saccharomyces cerevisiae (ADH2/GAP), y 3-fosfoglicerato quinasa Saccharomyces cerevisiae. Otros promotores utiles para celulas huesped de levadura se describen en Romanos et al., 1992, Yeast 8: 423-488.
[0187] La secuencia de control tambien puede ser una secuencia de terminacion de la transcripcion adecuada, una secuencia reconocida por una celula huesped para terminar la transcripcion. La secuencia de terminacion esta unida operativamente al extremo 3' de la secuencia de acido nucleico que codifica el polipeptido. Cualquier terminador que sea funcional en la celula huesped de eleccion puede usarse en la presente invencion. Por ejemplo, los terminadores de transcripcion ejemplares para celulas bacterianas se describen en Ermolaeva et al., 2001, J. Mol. Biol. 301: 27-33. Ejemplos de terminadores de la transcripcion para celulas huesped fungicas filamentosas pueden obtenerse a partir de los genes de la amilasa TAKA Aspergillus oryzae, glucoamilasa Aspergillus niger, antranilato sintasa Aspergillus nidulans, alfa-glucosidasa Aspergillus niger, proteasa de tipo tripsina Fusarium oxysporum. Los terminadores ejemplares para las celulas huesped de levadura se pueden obtener de los genes para la enolasa Saccharomyces cerevisiae, citocromo C Saccharomyces cerevisiae (CYC1) y Saccharomyces cerevisiae gliceraldehndo-3-fosfato deshidrogenasa. Otros terminadores utiles para celulas huesped de levadura se describen por Romanos et al., 1992, supra.
[0188] La secuencia de control tambien puede ser una secuencia lfder adecuada que contiene una secuencia de inicio de la traduccion. La secuencia lfder esta unida operativamente al extremo 5' de la secuencia de acido nucleico que codifica el polipeptido. Se puede usar cualquier secuencia lfder que sea funcional para iniciar la traduccion en la celula huesped elegida. La secuencia de iniciacion de la traduccion bacteriana ejemplar se puede obtener de cualquier gen bacteriano expresado, tal como de E. coli., Bacillus subtilis, Lactococcus lactic y Sinorhizobium meliloti (vease, por ejemplo, Sakai, et al., 2001, J. Mol. Evol. 52: 164-170; Ma et al., 2002, J Bacteriol. 184 (20): 5733-5745). En algunas realizaciones, se pueden usar secuencias de iniciacion de la traduccion artificial (por ejemplo, secuencia de Shine-Delgarno) (ver, por ejemplo, Vimberg et al., 2007. BMC Molecular Biology 8: 100). Lfderes ejemplares para celulas huesped fungicas filamentosas se obtienen a partir de los genes para la amilasa TAKA de Aspergillus oryzae y la isomerasa de fosfato triosa de Aspergillus nidulans. Los lfderes adecuados para las celulas huesped de levadura se obtienen de los genes para enolasa Saccharomyces cerevisiae (ENO-1), 3-fosfoglicerate kinasa Saccharomyces cerevisiae, alfa-factor Saccharomyces cerevisiae, y alcohol deshidrogenasa/gliceraldehndo-3-fosfato deasa Saccharomyces cerevisiae).
[0189] La secuencia de control tambien puede ser una secuencia de poliadenilacion, una secuencia operativamente unida al extremo 3' de la secuencia de acido nucleico y que, cuando se transcribe, es reconocida por la celula huesped como una senal para agregar residuos de poliadenosina al ARNm transcrito. Cualquier secuencia de poliadenilacion que sea funcional en la celula huesped elegida puede usarse en la presente invencion. Secuencias de poliadenilacion ejemplares para celulas huesped fungicas filamentosas pueden ser de los genes de amilasa TAKa Aspergillus oryzae, glucoamilasa Aspergillus niger, antranilato sintasa Aspergillus nidulans, proteasa de tipo tripsina Fusarium oxisporum, y alfa-glucosidasa Aspergillus niger. Las secuencias de poliadenilacion para las celulas huesped de levadura se describen por Guo y Sherman, 1995, Mol Cell Bio 15: 5983-5990.
[0190] La secuencia de control tambien puede ser una region codificante de peptido senal que codifica una secuencia de aminoacidos unida al extremo amino de un polipeptido y dirige el polipeptido codificado hacia la via secretora de la celula. El extremo 5' de la secuencia codificante de la secuencia de acido nucleico puede contener inherentemente una region codificante de peptido senal enlazada naturalmente en el marco de lectura de traduccion con el segmento de la region codificante que codifica el polipeptido secretado. Alternativamente, el extremo 5' de la secuencia de codificacion puede contener una region de codificacion del peptido senal que es ajena a la secuencia de codificacion. En la presente invencion se puede usar cualquier region codificante de peptido senal que dirige el polipeptido expresado hacia la ruta secretora de una celula huesped elegida. Las regiones codificantes del peptido senal eficaz para las celulas huesped bacterianas son las regiones codificantes del peptido senal obtenidas de los genes para la amilasa maltogenica de Bacillus NClB 11837. Bacillus stearothermophilus alfa, la airngdala de Bacillus, la adiccion de Bacillus licheniformis beta-lactamasa, beta-lactamasa, nprM), y Bacillus subtilis prsA. Otros peptidos senal son descritos por Simonen y Palva, 1993, Microbiol Rev 57: 109-137. Las regiones codificantes del peptido senal eficaz para las celulas huesped fungicas filamentosas pueden ser las regiones codificantes del peptido senal obtenidas de los genes de la amilasa TAKA de Aspergillus oryzae, la amilasa neutra de Aspergillus niger, la glucoamilasa de Aspergillus niger, la proteinasa aspartica Rhizomucor miehei, celulasa Humicola insolens, y lipasa Humicola lanuginosa. Los peptidos senales utiles para celulas huesped de levadura pueden proceder de los genes para alfa-factor Saccharomyces cerevisiae e invertasa Saccharomyces cerevisiae. Otras regiones de codificacion de peptidos senal utiles estan descritas por Romanos et al., 1992, supra.
[0191] La secuencia de control tambien puede ser una region de codificacion de propeptido que codifica una secuencia de aminoacidos posicionada en el extremo amino de un polipeptido. El polipeptido resultante se conoce como proenzima o propolipeptido (o zimogeno en algunos casos). Un propolipeptido puede convertirse en un polipeptido activo maduro por escision catalftica o autocatalttica del propeptido del propolipeptido. La region codificante del propeptido se puede obtener a partir de los genes de la proteasa alcalina de Bacillus subtilis (aprE), de la proteasa neutra de Bacillus subtilis (nprT), del factor alfa de Saccharomyces cerevisiae, de la proteinasa aspartica Rhizomucor miehei, y de la lactasa Myceliophthora thermophila (WO 95/33836). Donde ambas regiones de peptidos y propeptidos senales estan presentes en el extremo amino de un polipeptido, la region propeptidica se coloca al lado del extremo amino de un polipeptido y la region peptfdica se coloca al lado del extremo amino de la region propeptido.
[0192] Tambien puede ser deseable anadir secuencias reguladoras, que permitan la regulacion de la expresion del polipeptido con respecto al crecimiento de la celula huesped. Ejemplos de sistemas reguladores son aquellos que causan que la expresion del gen se active o desactive en respuesta a un estfmulo qmmico o ffsico, incluida la presencia de un compuesto regulador. En las celulas hospedadoras procarioticas, las secuencias reguladoras adecuadas incluyen los sistemas operadores lac, tac y trp. En celulas huesped de levadura, los sistemas reguladores adecuados incluyen, como ejemplos, el sistema ADH2 o el sistema GAL1. En los hongos filamentosos, las secuencias reguladoras adecuadas incluyen el promotor de alfa-amilasa TAKA, el promotor de glucoamilasa de Aspergillus niger y el promotor de glucoamilasa de Aspergillus oryzae.
[0193] En otro aspecto, la presente descripcion tambien se dirige a un vector de expresion recombinante que comprende un polinucleotido que codifica un polipeptido de hidroxilasa de prolina disenado, y una o mas regiones reguladoras de la expresion tales como un promotor y un terminador, un origen de replicacion, etc. Dependiendo del tipo de huespedes en los que se van a introducir. Las diversas secuencias de control y acido nucleico descritas anteriormente pueden unirse para producir un vector de expresion recombinante que puede incluir uno o mas sitios de restriccion convenientes para permitir la insercion o sustitucion de la secuencia de acido nucleico que codifica el polipeptido en dichos sitios. Alternativamente, la secuencia de acido nucleico de la presente descripcion puede expresarse insertando la secuencia de acido nucleico o una construccion de acido nucleico que comprende la secuencia en un vector apropiado para la expresion. Al crear el vector de expresion, la secuencia de codificacion se ubica en el vector de modo que la secuencia de codificacion este unida operativamente con las secuencias de control apropiadas para la expresion.
[0194] El vector de expresion recombinante puede ser cualquier vector (por ejemplo, un plasmido o virus), que puede someterse convenientemente a procedimientos de ADN recombinante y puede provocar la expresion de la secuencia polinucleotfdica. La eleccion del vector dependera tfpicamente de la compatibilidad del vector con la celula huesped en la que se va a introducir el vector. Los vectores pueden ser plasmidos circulares lineales o cerrados.
[0195] El vector de expresion puede ser un vector de replicacion autonoma, es decir, un vector que existe como una entidad extracromosomica, cuya replicacion es independiente de la replicacion cromosomica, por ejemplo, un plasmido, un elemento extracromosomico, un minicromosoma o cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicacion. Alternativamente, el vector puede ser uno que, cuando se introduce en la celula huesped, se integra en el genoma y se replica junto con el (los) cromosoma(s) en donde se ha integrado. Ademas, se puede usar un solo vector o plasmido o dos o mas vectores o plasmidos que juntos contienen el ADN total que se introducira en el genoma de la celula huesped, o un transposon.
[0196] El vector de expresion contiene preferiblemente uno o mas marcadores seleccionables, que permiten una facil seleccion de celulas transformadas. Un marcador seleccionable es un gen cuyo producto proporciona biocida o resistencia viral, resistencia a metales pesados, prototrofia a auxotrofos y similares. Ejemplos de marcadores seleccionables bacterianos son los genes dal de Bacillus subtilis o Bacillus licheniformis, o marcadores, que confieren resistencia a los antibioticos como la ampicilina, kanamicina, cloranfenicol (ejemplo 1) o resistencia a la tetraciclina. Los marcadores adecuados para celulas huesped de levadura son ADE2, HIS3, LEU2, LYS2, MET3, TRP1 y URA3. Los marcadores seleccionables para usar en una celula huesped fungica filamentosa incluyen, pero no se limitan a, amdS (acetamidasa), argB (ornitina carbamoiltransferasa), barra (fosfinotricina acetiltransferasa), hph (hidro-micina fosfotransferasa), niaD (nitrato reductasa), pyrg (orotidina-5'-fosfato descarboxilasa), sC (sulfato adenilo-transferasa) y trpC (antranilato sintetasa), asf como sus equivalentes. Las realizaciones para uso en una celula de Aspergillus incluyen los genes amdS y pyrG de Aspergillus nidulans o Aspergillus oryzae y el gen bar de Streptomyces hygroscopicus.
[0197] En otro aspecto, la presente descripcion proporciona una celula huesped que comprende un polinucleotido que codifica un polipeptido de hidroxilasa de prolina mejorado de la presente descripcion, estando el polinucleotido unido operativamente a una o mas secuencias de control para la expresion de la enzima hidroxina de prolina en la celula huesped. Las celulas hospedadoras para uso en la expresion de los polipeptidos codificados por los vectores de expresion son bien conocidas en la tecnica e incluyen, pero no se limitan a, celulas bacterianas, tales como celulas de E. coli, Bacillus subtilis, Streptomyces y Salmonella typhimurium; celulas fungicas, tales como celulas de levadura (p. ej., Saccharomyces cerevisiae o Pichia pastoris (N° de acceso ATCC 201178)); celulas de insecto tales como celulas Drosophila S2 y Spodoptera Sf9; celulas animales tales como CHO, COS, BHK, 293 y celulas de melanoma de Bowes; y celulas vegetales. Las celulas hospedadoras ejemplares son Escherichia coli W3110 (AfhuA) y BL21.
[0198] Por consiguiente, en otro aspecto, la presente descripcion proporciona metodos para fabricar los polipeptidos de hidroxilasa de prolina disenados, en los que el metodo puede comprender cultivar una celula huesped capaz de expresar un polinucleotido que codifica el polipeptido de hidroxilasa de prolina en condiciones adecuadas para la expresion del polipeptido. El metodo puede comprender ademas aislar o purificar el polipeptido de hidroxilasa de prolina expresado, como se describe en el presente documento.
[0199] Los medios de cultivo apropiados y las condiciones de crecimiento para las celulas huesped descritas anteriormente son bien conocidas en la tecnica. Los polinucleotidos para la expresion de la hidroxilasa de prolina pueden introducirse en las celulas mediante diversos metodos conocidos en la tecnica. Las tecnicas incluyen, entre otras, electroporacion, bombardeo de partfculas biolfsticas, transfeccion mediada por liposomas, transfeccion con cloruro de calcio y fusion de protoplastos.
[0200] En las realizaciones de este documento, se pueden obtener los polipeptidos mejorados y los polinucleotidos correspondientes utilizando metodos utilizados por los expertos en la tecnica. La secuencia de polinucleotidos de origen natural que codifica la hidroxilasa de cis-4-prolina de Sinorhizobium meliloti que se produce de manera natural se describe en la publicacion de patente de EE.UU. US20110091942 y la publicacion de Patente Internacional N° WO2009139365. Las hidroxilasas de prolina manipuladas descritas en el presente documento pueden obtenerse sometiendo el polinucleotido que codifica la hidroxilasa de prolina de origen natural u otra modificada a metodos de mutagenesis y/o evolucion dirigida, como se discute aqrn. Una tecnica de evolucion dirigida ejemplar es la mutagenesis y/o el barajado de ADN como se describe en Stemmer, 1994, Proc Natl Acad Sci EE.UU. 9 l: 10747­ 10751; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 y la patente de EE.UU. 6.537,746. Otros procedimientos de evolucion dirigida que pueden usarse incluyen, entre otros, el proceso de extension escalonada (StEP), la recombinacion in vitro (Zhao et al., 1998, Nat. Biotechnol. 16: 258-261), la PCR mutagenica (Caldwell et al., 1994, PCR METHODS Appl. 3: S136-S140), y mutagenesis en casete (Black et al., 1996, Proc Natl Acad Sci EE.UU. 93: 3525-3529). Las tecnicas de mutagenesis y evolucion dirigida utiles para los propositos en este documento tambien se describen en las siguientes referencias: Ling, et al., 1997. Anal. Biochem.
254 (2): 157-78; Dale et al., 1996, "Oligonucleotide-directed random mutagenesis using the phosphorothioate method", en Methods Mol. Biol. 57: 369-74; Smith, 1985, Ann. Rev. Genet. 19: 423-462; Botstein et al., 1985, Science 229: 1193-1201; Carter, 1986, Biochem. J. 237: 1-7; Kramer et al., 1984, Cell, 38: 879-887; Wells et al., 1985, Gene 34: 315-323; Minshull et al., 1999, Curr Opin Chem Biol 3: 284-290; Christians et al., 1999, Nature Biotech 17: 259-264; Crameri et al., 1998, Nature 391: 288-291; Crameri et al., 1997. Nature Biotech 15: 436-438; Zhang et al., 1997. Proc Natl Acad Sci EE.UU. 94: 45-4-4509; Crameri et al., 1996, Nature Biotech 14: 315-319; Stemmer, 1994, Nature 370: 389-391; Stemmer, 1994, Proc Natl Acad Sci EE.UU. 91: 10747-10751; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 y la patente de EE.UU. 6.537.746.
[0201] Los clones obtenidos despues del tratamiento de mutagenesis pueden cribarse para detectar hidroxilasas de prolina que tienen una o mas propiedades enzimaticas mejoradas deseadas. Por ejemplo, cuando la propiedad enzimatica mejorada deseada es la regioselectividad, la actividad enzimatica puede medirse para la produccion del compuesto (1) y del compuesto (1a). Los clones que contienen un polinucleotido que codifica una hidroxilasa de prolina con las caractensticas deseadas, por ejemplo, una mayor proporcion de compuesto (1 ) sobre el compuesto (1a), se afslan, se secuencian para identificar los cambios en la secuencia de nucleotidos (si los hay) y se usan para expresar la enzima en una celula huesped. La medicion de la actividad enzimatica de las bibliotecas de expresion se puede realizar utilizando las tecnicas bioqmmicas estandar, como el analisis por HPLC y/o la derivacion de productos (antes o despues de la separacion), por ejemplo, con cloruro de dansilo u OPA (ver, por ejemplo, Yaegaki et al., 1986, J. Chromatogr. 356 (1): 163-70).
[0202] En el caso de que se conozca la secuencia del polipeptido modificado, los polinucleotidos que codifican la enzima se pueden preparar mediante metodos estandar en fase solida, de acuerdo con metodos sinteticos conocidos. En algunas realizaciones, los fragmentos de hasta aproximadamente 100 bases pueden sintetizarse individualmente, luego unirse (por ejemplo, mediante metodos de litigacion enzimaticos o qmmicos, o metodos mediados por polimerasa) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleotidos y oligonucleotidos que codifican porciones de la hidroxilasa de prolina se pueden preparar por smtesis qmmica utilizando, por ejemplo, el metodo clasico de fosforamidita descrito por Beaucage et al., 1981, Tet Lett 22: 1859-69, o el metodo descrito por Matthes et al., 1984, EMBO J. 3: 801-05, por ejemplo, tal como se practica tfpicamente en metodos sinteticos automatizados. De acuerdo con el metodo de la fosforamidita, los oligonucleotidos se sintetizan, por ejemplo, en un sintetizador de ADN automatico, se purifican, se recocen, se ligan y se clonan en vectores apropiados. Ademas, esencialmente cualquier acido nucleico puede obtenerse de cualquiera de una variedad de fuentes comerciales. En algunas realizaciones, se pueden crear variaciones adicionales sintetizando oligonucleotidos que contienen deleciones, inserciones y/o sustituciones, y combinando los oligonucleotidos en varias permutaciones para crear hidroxilasas de prolina modificadas con propiedades mejoradas.
[0203] Por consiguiente, en algunas realizaciones, un metodo para preparar el polipeptido de hidroxilasas de prolina modificado puede comprender: (a) sintetizar un polinucleotido que codifica un polipeptido que comprende una secuencia de aminoacidos seleccionada de la SeQ ID NO: 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 6668, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226 y 228, y que tienen una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2 en las posiciones de residuos seleccionadas de: X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271; y (b) expresan el polipeptido de hidroxilasa de prolina codificado por el polinucleotido.
[0204] En algunas realizaciones del metodo, las diferencias de residuos en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X62; X66; X86; X88; X92; X95; X98; X103; X112; X113; X114; X115; X116; X121; X131; X140; X150; X151; X166; X186; X188; X205; X225; X230; X270; y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S; X25R; X26R; X26T; X26W; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X62Q; X66Q; X86S; X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X166T; X166L; X166Q; X186G; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0205] En algunas realizaciones del metodo, el polinucleotido puede codificar una hidroxilasa de prolina disenada que tiene opcionalmente una o varias (por ejemplo, hasta 3, 4, 5 o hasta 10) deleciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, la secuencia de aminoacidos tiene opcionalmente 1-2, 1-3, 1-4, 1-5, 1-6, 1-7. 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1­ 45, o 1-50 eliminacion de residuos de aminoacidos, inserciones y/o sustituciones. En algunas realizaciones, la secuencia de aminoacidos tiene opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 o 50 deleciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, la secuencia de aminoacidos tiene opcionalmente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 o 25 eliminaciones, inserciones y/o sustituciones de residuos de aminoacidos. En algunas realizaciones, las sustituciones pueden ser sustituciones conservativas o no conservativas.
[0206] En algunas realizaciones, cualquiera de las enzimas hidroxilasas de prolina modificadas expresadas en una celula huesped puede recuperarse de las celulas y/o el medio de cultivo utilizando una o mas de las tecnicas bien conocidas para la purificacion de protemas, incluyendo, entre otras, tratamiento con lisozima, sonicacion, filtracion, salado, ultra centrifugacion y cromatograffa. Las soluciones adecuadas para la lisis y la extraccion de protemas de alta eficacia de bacterias, como E. coli, estan disponibles comercialmente, como CelLytic BTM de Sigma-Aldrich de St. Louis MO.
[0207] Las tecnicas cromatograficas para el aislamiento del polipeptido de hidroxilasa de prolina incluyen, entre otras, cromatograffa lfquida de alta resolucion, cromatograffa de fase inversa, cromatograffa de intercambio ionico, electroforesis en gel y cromatograffa de afinidad. Las condiciones para purificar una enzima particular dependeran, en parte, de factores tales como la carga neta, la hidrofobicidad, la hidrofilicidad, el peso molecular, la forma molecular, etc., y seran evidentes para los expertos en la tecnica.
[0208] En algunas realizaciones, pueden usarse tecnicas de afinidad para aislar las enzimas hidroxilasas de prolina mejoradas. Para la purificacion por cromatograffa de afinidad, se puede usar cualquier anticuerpo que se una espedficamente al polipeptido de la hidroxilasa de prolina. Para la produccion de anticuerpos, pueden inmunizarse diversos animales hospedadores, que incluyen, entre otros, conejos, ratones, ratas, etc., mediante inyeccion con un polipeptido de hidroxilasa de prolina, o un fragmento del mismo. El polipeptido o fragmento de hidroxilasa de prolina se puede unir a un portador adecuado, tal como BSA, por medio de un grupo funcional de cadena lateral o enlazadores unidos a un grupo funcional de cadena lateral. En algunas realizaciones, la purificacion por afinidad puede usar un ligando espedfico unido a la hidroxilasa de prolina, como la columna de afinidad de tinte o poli(L-prolina) (ver, por ejemplo, EP0641862; Stellwagen, E., 2001, "Dye Affinity Chromatography," In Current Protocols in Protein Science Unit 9.2-9.2.16).
5.7 Metodos de uso de las enzimas de hidroxilasa de prolina disenadas
[0209] En otro aspecto, las hidroxilasas de prolina descritas en el presente documento pueden usarse en un proceso para convertir un sustrato adecuado en su producto hidroxilado. En general, el proceso para realizar la reaccion de hidroxilacion comprende poner en contacto o incubar el compuesto de sustrato en presencia de un co-sustrato, como el a-cetoglutarato, con un polipeptido de hidroxilasa de prolina de la descripcion en condiciones de reaccion adecuadas para la formacion del producto hidroxilado. En algunas formas de realizacion, las hidroxilasas de prolina se pueden usar en la conversion del compuesto de sustrato (II) en el compuesto de producto (I), como se ilustra en el Esquema 2:
Esquema 2
Figure imgf000044_0001
en donde
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio; R2 y R3 se seleccionan cada uno independientemente del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
R4 se selecciona del grupo que consiste en alquilo (C1-C6), alquenilo (C2-C6) opcionalmente sustituido, alquinilo (C2-C6), arilo, heteroarilo, cicloalquilo, heterocicloalquilo; o R4 junto con uno de R1 o R2 es un alquileno (C1-C5) o alquenileno (C2-C5) y forma un anillo heterodclico de 5 a 8 miembros que contiene el atomo de nitrogeno, en donde el anillo esta opcionalmente sustituido con 1 a 4 grupos R6 seleccionados independientemente;
R5 es hidrogeno o un enlace que forma un epoxido con un atomo de carbono de L;
cada aparicion de R6 se selecciona independientemente del grupo que consiste en halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
---- representa un enlace opcional a un atomo de carbono de L para formar un doble enlace,
con la condicion de que
(i) cuando R4 no forma un anillo con un R2 o R3, o cuando R4 forma un anillo heterodclico de 5 miembros que contiene el atomo de nitrogeno con uno de R2 o R3, entonces L es un metileno;
(ii) cuando R4 forma un anillo heterodclico de 6 miembros que contiene el atomo de nitrogeno con uno de R2 o R3, entonces L es un enlace o etileno; y
(iii) cuando R5 es un enlace a un atomo de carbono de L para formar un epoxido, entonces R4 forma el anillo heterodclico que contiene el atomo de nitrogeno con uno de R2 o R3 y L es un alquileno (C1-C4) o alquenileno (C2-C4).
[0211] Por consiguiente, en algunas realizaciones, un proceso para preparar el compuesto de producto (I) puede comprender ponerse en contacto con el compuesto de sustrato de formula (II)
Figure imgf000044_0002
en donde
L, R1, R2, R3, R4 y R6 son como se definieron anteriormente,
---- representa un enlace opcional a un atomo de carbono de L para formar un doble enlace
con un polipeptido manipulado descrito aqrn en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0212] En algunas realizaciones del proceso, el compuesto de formula (I) comprende el compuesto de formula (Ia),
Figure imgf000044_0003
en donde
Q se selecciona del grupo que consiste en un alquileno (C1-C5) y alquenileno (C2-C5);
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio;
R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
R5 es hidrogeno, o un enlace a un atomo de carbono de L para formar un epoxido;
cada aparicion de R6 se selecciona del grupo que consiste en halo, alquilo (C1-C6) y alquiloxi (C1-C6); y q es un numero entero de 0 a 4;
en donde la suma de los atomos de carbono del anillo para Q L es un numero entero de 2 a 5;
con la condicion de que
(i) cuando la suma de los atomos de carbono del anillo para Q L es 2, entonces L es un metileno; y
(ii) cuando la suma de los atomos de carbono del anillo para Q L es 3, entonces L es un enlace o etileno.
[0213] Por consiguiente, un proceso para preparar el compuesto de formula (la) comprende poner en contacto el compuesto de formula (lla),
Figure imgf000045_0001
en donde
L, Q, R1, R2, R6 y q son como se definieron anteriormente para el compuesto de formula (la); y
---- representa un enlace opcional a un atomo de carbono de L para formar un doble enlace;
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0214] En algunas realizaciones del proceso, el compuesto de formula (la) comprende el compuesto de formula (lb),
Figure imgf000045_0002
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio;
R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
cada aparicion de R6 se selecciona independientemente del grupo que consiste en halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
k es un numero entero de 1 a 5;
r es un numero entero de 0 a 4;
en donde k r es 3, 4 o 5; y
q es un numero entero de 0 a 4;
con la condicion de que cuando k r es 3, entonces k es 1 o 3.
[0215] Por consiguiente, un proceso para preparar el compuesto de formula (lb) comprende poner en contacto el compuesto de formula (IIb),
Figure imgf000046_0001
en donde
R1, R2, R6, k, r y q son los definidos anteriormente para el compuesto de formula (Ib);
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas. En algunas realizaciones, k es 1 y r es 2, 3 o 4.
[0216] En algunas realizaciones del proceso, el compuesto de formula (la) comprende el compuesto de formula (Ic),
Figure imgf000046_0002
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio;
R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
cada aparicion de R6 se selecciona independientemente del grupo que consiste en hidrogeno, halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
q es un numero entero de 0 a 4.
[0217] Por consiguiente, un proceso para preparar el compuesto de formula (Ic) comprende poner en contacto el compuesto de formula (IIc),
Figure imgf000046_0003
en donde
R1, R2, R6 y q son como se definieron anteriormente para el compuesto de formula (Ic);
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0218] En algunas realizaciones del proceso, el compuesto de formula (Ic) se forma en exceso del compuesto del producto de formula (Ic3),
Figure imgf000047_0001
[0219] Por consiguiente, un proceso para preparar el compuesto de formula (Ic) en exceso del compuesto de formula (Ic3) comprende poner en contacto el compuesto de formula (IIc) con un polipeptido modificado descrito en el presente documento que tiene una capacidad de reaccion para el compuesto del producto (1 ) sobre el compuesto del producto (1a) en presencia de un co-sustrato en condiciones de reaccion adecuadas. En algunas realizaciones del proceso, el compuesto producto de formula (Ic) se forma en exceso del compuesto producto de formula (Ic3), donde la proporcion de compuesto (Ic) formado sobre el compuesto (Ic3) es de al menos 1,5, 2, 3, 4, 5 o 6 o mas.
[0220] En algunas realizaciones del proceso, el compuesto de producto (Ic) se forma en un exceso diastereomerico de compuesto (IcR),
Figure imgf000047_0002
[0221] En algunas realizaciones del proceso, el compuesto del producto (Ic) se forma en al menos un 90%, 95%, 96%, 97%, 98%, 99% o mayor exceso diastereomerico del compuesto (IcR). En algunas realizaciones, no se forma una cantidad detectable de compuesto (IcR) en el proceso.
[0222] En algunas realizaciones del proceso para la preparacion de los compuestos de producto de formula (Ic), R1 es hidroxi, R2 es hidrogeno yq es 0, Como tal, en algunas realizaciones del proceso, el compuesto de formula (I) comprende el compuesto de formula (1 ),
Figure imgf000047_0003
[0223] Por consiguiente, un procedimiento para preparar el compuesto de formula (1) comprende poner en contacto el compuesto de formula (2),
Figure imgf000047_0004
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0224] En algunas realizaciones del proceso, el compuesto del producto (1) se forma en exceso del compuesto del producto (1a). En algunas realizaciones, el compuesto del producto (1) se forma en exceso sobre el compuesto (1a) en una relacion de al menos 1,5, 2, 3, 4, 5 o 6 o mas. En algunas realizaciones del proceso, el polipeptido disenado util para preparar el compuesto (1 ) en exceso del compuesto de formula (1a) comprende poner en contacto el compuesto de formula (2) con un polipeptido disenado descrito en el presente documento que tiene regioselectividad para el compuesto del producto (1 ) sobre el compuesto (1a) en condiciones de reaccion adecuadas.
[0225] En algunas realizaciones del procedimiento, el compuesto de producto (1) se forma en un exceso diastereomerico del compuesto (1R),
Figure imgf000048_0001
[0226] En algunas realizaciones del proceso, el compuesto del producto (1) se forma en al menos 90%, 95%, 96%, 97%, 98%, 99% o mayor exceso diastereomerico del compuesto (1R). En algunas realizaciones, no se forma una cantidad detectable de compuesto (1R) en el proceso.
[0227] En algunas realizaciones, el compuesto de formula (1a) comprende el compuesto de formula (le),
Figure imgf000048_0002
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
cada aparicion de R6 se selecciona independientemente del grupo que consiste en hidrogeno, halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
q es un numero entero de 0 a 3.
[0228] Por consiguiente, en algunas realizaciones, un proceso para preparar el compuesto de producto de formula (le) comprende poner en contacto el compuesto de formula (IIe),
Figure imgf000048_0003
en donde R1, R2, R6 y q son como se definen para el compuesto de formula (le),
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0229] En algunas realizaciones del proceso, el compuesto de formula (le) se forma en exceso diastereomerico del compuesto de formula (leR),
Figure imgf000049_0001
[0230] En algunas realizaciones del proceso, el compuesto producto de formula (le) se forma en al menos un 90%, 95%, 96%, 97%, 98%, 99% o mayor exceso diastereomerico del compuesto de formula (leR). En algunas realizaciones, no se forma una cantidad detectable del compuesto de formula (leR).
[0231] En algunas realizaciones del procedimiento para preparar el producto compuesto de formula (le), R1 es hidroxi, R2 es hidrogeno y q es 0, Como tal, en algunas realizaciones, el compuesto de formula (le) comprende el compuesto (3),
Figure imgf000049_0002
en donde el proceso para preparar el compuesto (3) comprende poner en contacto el compuesto (4),
Figure imgf000049_0003
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0232] En algunas realizaciones del proceso, el compuesto (3) se forma en exceso diastereomerico del compuesto (3R),
Figure imgf000049_0004
[0233] En algunas realizaciones del proceso, el compuesto del producto (3) se forma en al menos 90%, 95%, 96%, 97%, 98%, 99% o mayor exceso diastereomerico del compuesto (3R). En algunas realizaciones, no se forma una cantidad detectable del compuesto (3R).
[0234] En algunas realizaciones, el compuesto de formula (la) comprende el compuesto (5),
Figure imgf000050_0001
[0235] Por consiguiente, un procedimiento para preparar el compuesto (5) comprende poner en contacto el compuesto (6);
Figure imgf000050_0002
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0236] En algunas realizaciones, el compuesto de formula (I) comprende el compuesto de formula (III),
Figure imgf000050_0003
en donde,
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (Ci-Ca), ariloxi, alquiltio (Ci-Ca) y ariltio; R2 y R3 se seleccionan cada uno independientemente del grupo que consiste en hidrogeno y alquilo (Ci-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca); y
R4 se selecciona del grupo que consiste en alquilo, alquenilo, alquinilo, arilo, heteroarilo, cicloalquilo y heterocicloalquilo opcionalmente sustituidos;
[0237] En algunas realizaciones, el alquilo opcionalmente sustituido se selecciona del grupo que consiste en alquilo (Ci-Ca), aminocarbonilo (Ci-Ca)alquilo, amino (Ci-Ca)alquilo, tiol (Ci-Ca)alquilo, y alquiltio (Ci-Ca)alquilo, alquilosulfonilo (Ci-Ca)alquilo, arilo (Ci-Ca)alquilo, heteroarilo (Ci-Ca)alquilo, cicloalquilo (Ci-Ca) alquilo y heterocicloalquilo (C1-Ca) alquilo.
[0238] Por consiguiente, en algunas realizaciones, un proceso para preparar el compuesto de formula (III) comprende poner en contacto el compuesto de formula (IV),
Figure imgf000050_0004
en donde,
R1, R2, R3 y R4 son como se definieron anteriormente para el compuesto de formula (III),
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0239] En algunas realizaciones, los polipeptidos disenados pueden usarse en un proceso para llevar a cabo la conversion mostrada en el Esquema 3,
Esquema 3
Figure imgf000051_0001
en donde,
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (Ci-Ca), ariloxi, alquiltio (Ci-Ca) y ariltio;
R2 y R3 se seleccionan independientemente del grupo que consiste en hidrogeno y alquilo (Ci-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
cada aparicion de Ra se selecciona independientemente del grupo que consiste en halo, alquilo (Ci-Ca) y alquiloxi (C1-Ca);
R7 se selecciona del grupo que consiste en hidrogeno, halo y alquilo (Ci-Ca) y alquiloxi (Ci-Ca) opcionalmente sustituidos o R7 junto con uno de R2 o R3 forma un anillo heterodclico de 5 a 7 miembros que contiene el atomo de nitrogeno; q es un numero entero de 0 a 4; y
---- representan dobles enlaces opcionales que forman un anillo arilo.
[0240] Por consiguiente, en algunas realizaciones, un procedimiento para preparar el compuesto de formula (V) comprende poner en contacto el compuesto de formula (VI),
Figure imgf000051_0002
en donde Ri , R2, R3, Ra, R7 y q son como se definen para el compuesto de formula (V),
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0241] En algunas realizaciones, el compuesto de formula (V) comprende el compuesto de formula (Va),
Figure imgf000051_0003
en donde,
Ri se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (Ci-Ca), ariloxi, alquiltio (Ci-Ca) y ariltio;
5i
R2 y R3 se seleccionan independientemente del grupo que consiste en hidrogeno y alquilo (C-i-Ca) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-Ca);
cada aparicion de Ra se selecciona independientemente del grupo que consiste en halo, alquilo (Ci-Ca) y alquiloxi (Ci-Ca); y
q es un numero entero de 0 a 4.
[0242] Por consiguiente, en algunas realizaciones, un proceso para preparar el compuesto de formula (Va) comprende poner en contacto el compuesto de formula (Via),
Figure imgf000052_0001
en donde R1, R2, R3, Ra y q son como se definieron anteriormente para el compuesto de formula (Va),
con un polipeptido disenado de la descripcion en presencia de un co-sustrato en condiciones de reaccion adecuadas.
[0243] Para los procesos anteriores, se puede usar cualquiera de las hidroxilasas de prolina disenadas aqrn. A modo de ejemplo y sin limitacion, en algunas realizaciones, los procesos pueden usar un polipeptido de hidroxilasa de prolina disenado que comprende una secuencia de aminoacidos que tiene al menos 80%, 85%, 8a%, 87%, 88%,
89%, 90%, 91%, 92%, 93%, 94%, 95%, 9a%, 97%, 98%, 99% o mas de identidad con una secuencia de referencia seleccionada de la SEQ ID NO: 8, 10, 12, 14, ia, 18, 20, 22, 24, 2a, 28, 30, 32, 34, 3a, 38, 40, 42, 44, 4a, 48, 50, 52,
54, 5a, 58, a0, a2, a4, aa, a8, 70, 72, 74, 7a, 78, 80, 82, 84, 8a, 88, 90, 92, 94, 9a, 98, 100, 102, 104, 10a, 108, 110,
112, 114, 11a, 118, 120, 122, 124, 12a, 128, 130, 132, 134, 138, 140, 142, 144, 14a, 148, 150, 152, 154, 15a, 158,
1a0, 1a2, 1a4, 1aa, 1a8, 170, 172, 174, 17a, 178, 180, 182, 184, 18a, 188, 190, 192, 194, 19a, 198, 200, 202, 204,
20a, 208, 210, 212, 214, 21a, 218, 220, 222, 224, 22a, y 228.
[0244] En algunas realizaciones de los procesos, el polipeptido de hidroxilasa de prolina disenado comprende una secuencia de aminoacidos que tiene una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2 en las posiciones de residuos X2; X3; X4; X5; X9; X13; X17; X24; X25; X2a; X29; X30; X3a; X42; X52; X57; X58; X59; Xa2;
Xaa; X8a; X88; X92; X95; X98; X103; X112; X113; X114; X115; X11a; X121; X131; X140; X150; X151; X1aa; X18a;
X188; X205; X225; X230; X270; y X271.
[0245] En algunas realizaciones de los procesos, las diferencias de residuos en las posiciones de residuos X2; X3;
X4; X5; X9; X13; X17; X24; X25; X2a; X29; X30; X3a; X42; X52; X57; X58; X59; Xa2; Xaa; X8a; X88; X92; X95; X98;
X103; X112; X113; X114; X115; X11a; X121; X131; X140; X150; X151; X1aa; X18a; X188; X205; X225; X230; X270;
y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X17V, X24R; X24S;
X25R; X2aR; X2aT; X2aW; X29A; X30V; X30P; X3aT; X42E; X52P; X57T; X57A; X58A; X59G; Xa2Q; XaaQ; X8aS;
X88R; X92V; X95M; X98F; X98T; X103L; X103Q; X112T; X112V; X113E; X114N; X115E; X115H; X115D; X115G;
X115S; X115A; X11aL; X121F; X131Y; X131F; X140L; X150S; X151A; X151H; X151S; X1aaT; X1aaL; X1aaQ;
X18aG; X188G; X205V; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
[0246] Como se indico anteriormente, en algunas realizaciones para preparar un compuesto de producto de formula
(Ic) en exceso sobre el compuesto de formula (Ic3), o para preparar compuesto (1) en exceso sobre el compuesto
(1a), el polipeptido disenado puede comprender una secuencia de aminoacidos que tiene una o mas caractensticas seleccionadas de: X103L; X115E; X131Y y X1aaQ. Polipeptidos ejemplares disenados con la regioselectividad relevante pueden comprender una secuencia de aminoacidos seleccionada del grupo que consiste en las SEQ ID
NO: 10, 24, 100, 102, 104, 10a, 108, 110, 112, 114, 11a, 118, 120, 122, 124, 12a, 128, 130, 132, 134, 138, 140, 142,
144, 14a, 148, 150, 152, 154, 15a, 158, 1a0, 1a2, 1a4, 1aa, 1a8, 170, 172, 174, 17a, 178, 180, 182, 184, 18a, 188,
190, 192, 194, 19a, 198, 200, 202, 204, 20a, 208, 210, 212, 214, 21a, 218, 220, 222, 224, 22a, y 228.
[0247] En algunas realizaciones, los polipeptidos de hidroxilasas de prolina ejemplares capaces de llevar a cabo los procedimientos en el presente documento pueden tener una secuencia de aminoacidos que comprende una secuencia seleccionada de la SEQ ID NO: 8, 10, 12, 14, 1a, 18, 20, 22, 24., 2a, 28, 30, 32, 34, 3a, 38, 40, 42, 44, 4a,
48, 50, 52, 54, 5a, 58, a0, a2, a4, aa, a8, 70, 72, 74, 7a, 78, 80, 82, 84, 8a, 88, 90, 92, 94, 9a, 98, 100, 102, 104,
10a, 108, 110, 112, 114, 11a, 118, 120, 122, 124, 12a, 128, 130, 132, 134, 138, 140, 142, 144, 14 154, 158, 1a0, 1a2 1a4, 1aa, 1a8, 170, 172, 174, 17a, 178, 180, 182, 184, 18a, 188, 190, 192, 19 202, 204, 20a, 208, 210, 212, 214, 21a, 218, 220, 222, 224, 22a y 228. En las descripciones de e proporciona orientacion sobre la eleccion y el uso de las hidroxilasas de prolina modificadas, por ejemplo, las Tablas
2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H y los Ejemplos.
[0248] En las realizaciones de este documento e ilustradas en los Ejemplos, diversos intervalos de condiciones de reaccion adecuadas que pueden usarse en los procesos incluyen, entre otros, carga de sustrato, carga de cosustrato, reductor, metal de transicion divalente, pH, temperatura, tampon, sistema de disolventes, carga de polipeptidos y tiempo de reaccion. Otras condiciones de reaccion adecuadas para llevar a cabo el proceso para la conversion biocatalttica de compuestos de sustrato a compuestos de producto que utilizan un polipeptido de hidroxilasa de prolina descrito en este documento pueden optimizarse facilmente en vista de la gma proporcionada en este documento por experimentacion rutinaria que incluye, pero no se limita a, poner en contacto el polipeptido de hidroxilasa de prolina y el compuesto de sustrato bajo condiciones de reaccion experimentales de concentracion, pH, temperatura y condiciones de solvente, y la deteccion del compuesto del producto.
[0249] Las condiciones de reaccion adecuadas que usan los polipeptidos de hidroxilasa de prolina modificadas comprenden tipicamente un co-sustrato, que se utiliza estequiometricamente en la reaccion de hidroxilacion. Generalmente, el co-sustrato para las hidroxilasas de prolina es a-cetoglutarato, tambien denominado acido acetoglutarico y acido 2-oxoglutarico. Se pueden usar otros analogos del a-cetoglutarato que son capaces de servir como co-sustratos para las hidroxilasas de prolina. Un analogo ejemplar que puede servir como un co-sustrato es el 2-oxoadipato. Debido a que el co-sustrato se utiliza estequiometricamente, el co-sustrato esta presente en una cantidad equimolar o mayor que la del compuesto de sustrato, es decir, la concentracion molar de co-sustrato es equivalente o superior a la concentracion molar del compuesto de sustrato. En algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender una concentracion molar de co-sustrato de al menos 1 vez, 1,5 veces, 2 veces, 3 veces 4 veces o 5 veces o mas que la concentracion molar del compuesto de sustrato. En algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender una concentracion de cosustrato, particularmente a-cetoglutarato, de aproximadamente 0,001 M a aproximadamente 2 M, 0,01 M a aproximadamente 2 M, 0,1 M a aproximadamente 2 M, 0,2 M a aproximadamente 2 M de aproximadamente 0,5 M a aproximadamente 2 M, o de aproximadamente 1 M a aproximadamente 2 M. En algunas realizaciones, las condiciones de reaccion comprenden una concentracion de co-sustrato de aproximadamente 0,001, 0,01, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 1, 1,5 o 2 M. En algunas realizaciones, se puede agregar un co-sustrato adicional durante la reaccion.
[0250] El compuesto de sustrato en las mezclas de reaccion se puede variar, teniendo en cuenta, por ejemplo, la cantidad deseada de compuesto de producto, el efecto de la concentracion de sustrato sobre la actividad enzimatica, la estabilidad de la enzima en condiciones de reaccion y el porcentaje de conversion de sustrato a producto. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una carga de compuesto de sustrato de al menos aproximadamente 0,5 a aproximadamente 200 g/L, 1 a aproximadamente 200 g/L, 5 a aproximadamente 150 g/L, aproximadamente 10 a aproximadamente 100 g/L, 20 a aproximadamente 100 g/l o aproximadamente 50 a aproximadamente 100 g/L. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una carga de compuesto de sustrato de al menos aproximadamente 0,5 g/L, al menos aproximadamente 1 g/L, al menos aproximadamente 5 g/L, al menos aproximadamente 10 g/L, al menos aproximadamente 15 g/L g/L, al menos aproximadamente 20 g/L, al menos aproximadamente 30 g/L, al menos aproximadamente 50 g/L, al menos aproximadamente 75 g/L, al menos aproximadamente 100 g/L, al menos aproximadamente 150 g/L L o al menos unos 200 g/L, o incluso mayor. Los valores para cargas de sustratos que se proporcionan aqrn se basan en el peso molecular del compuesto (2), sin embargo, tambien contempla que las cantidades molares equivalentes de varios hidratos y sales del compuesto (2) tambien se pueden usar en el proceso. Ademas, los compuestos de sustrato cubiertos por las formulas (II) y (Vl), incluidos los compuestos de formula (IIa), (IVa) y (Via) tambien pueden usarse en cantidades apropiadas, a la luz de las cantidades utilizadas para el compuesto (2).
[0251] Al llevar a cabo los procesos mediados por la hidroxilasa de prolina descritos en el presente documento, el polipeptido disenado se puede agregar a la mezcla de reaccion en forma de una enzima purificada, una enzima parcialmente purificada, celulas completas transformadas con el gen o los genes que codifican la enzima, como extractos celulares y/o lisados de dichas celulas, y/o como una enzima inmovilizada sobre un soporte solido. Se pueden emplear celulas completas transformadas con el gen o los genes que codifican la enzima hidroxilasa de prolina o los extractos celulares disenados, sus lisados y enzimas aisladas en una variedad de formas diferentes, incluido el solido (por ejemplo, liofilizado, secado por pulverizacion y similares) o semisolido (por ejemplo, una pasta cruda). Los extractos celulares o lisados celulares pueden purificarse parcialmente mediante precipitacion (sulfato de amonio, polietilenimina, tratamiento termico o similar, seguido de un procedimiento de desalinizacion antes de la liofilizacion (por ejemplo, ultrafiltracion, dialisis y similares). Cualquiera de las preparaciones enzimaticas (incluyendo preparaciones de celulas completas) se pueden estabilizar mediante reticulacion utilizando agentes de reticulacion conocidos, como, por ejemplo, glutaraldehfdo o inmovilizacion en una fase solida (por ejemplo, Eupergit C, y similares).
[0252] El gen o los genes que codifican los polipeptidos de hidroxilasa de prolina modificados se pueden transformar en la celula huesped por separado o juntos en la misma celula huesped. Por ejemplo, en algunas realizaciones, un conjunto de celulas huesped puede transformarse con uno o varios genes que codifican un polipeptido de hidroxilasa de prolina disenado y otro conjunto puede transformarse con uno o mas genes que codifican otro polipeptido de hidroxilasa de prolina. Ambos conjuntos de celulas transformadas se pueden utilizar juntos en la mezcla de reaccion en forma de celulas completas, o en forma de lisados o extractos derivados de ellos. En otras realizaciones, una celula huesped puede transformarse con uno o varios genes que codifican polipeptidos de hidroxilasa de prolina de ingeniena multiple. En algunas realizaciones, los polipeptidos modificados pueden expresarse en forma de polipeptidos secretados y el medio de cultivo que contiene los polipeptidos secretados puede usarse para la reaccion de la hidroxilasa de prolina.
[0253] La actividad mejorada y/o la estereoselectividad de los polipeptidos de hidroxilasa de prolina modificados proporcionan procesos en los que se puede lograr un mayor porcentaje de conversion con concentraciones mas bajas del polipeptido modificado. En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden una cantidad de polipeptido disenado de aproximadamente 1% (p/p), 2% (p/p), 5% (p/p), 10% (p/p),
20% (p/p), 30% (p/p), 40% (p/p), 50% (p/p), 75% (p/p), 100% (p/p) o mas de carga de compuestos de sustrato.
[0254] En algunas realizaciones, el polipeptido modificado esta presente a aproximadamente 0,01 g/L hasta aproximadamente 50 g/L; aproximadamente 0,05 g/L a aproximadamente 50 g/L; aproximadamente 0,1 g/L a aproximadamente 40 g/L; aproximadamente 1 g/L a aproximadamente 40 g/L; aproximadamente 2 g/L a aproximadamente 40 g/L; aproximadamente 5 g/L a aproximadamente 40 g/L; aproximadamente 5 g/L a aproximadamente 30 g/L; aproximadamente 0,1 g/L a aproximadamente 10 g/L; aproximadamente 0,5 g/L a aproximadamente 10 g/L; aproximadamente 1 g/L a aproximadamente 10 g/L; aproximadamente 0,1 g/L aproximadamente 5 g/L; aproximadamente 0,5 g/L a aproximadamente 5 g/L; o aproximadamente 0,1 g/L hasta aproximadamente 2 g/L. En algunas realizaciones, el polipeptido de hidroxilasa de prolina esta presente a aproximadamente 0,01 g/L, 0,05 g/L, 0,1 g/L, 0,2 g/L, 0,5 g/L, 1, 2 g/L, 5 g/L, 10 g/L, 15 g/L, 20 g/L, 25 g/L, 30 g/L, 35 g/L, 40 g/L, o 50 g/L.
[0255] En algunas realizaciones, las condiciones de reaccion tambien comprenden un metal de transicion divalente capaz de servir como un cofactor en la reaccion de oxidacion. En general, el cofactor del metal de transicion divalente es un ion ferroso, es decir, Fe+2. El ion ferroso puede proporcionarse en diversas formas, tales como sulfato ferroso (FeSO4), cloruro ferroso (FeCh), carbonato ferroso (FeCOa) y las sales de acidos organicos tales como citratos, lactatos y fumaratos. Una fuente ejemplar de sulfato ferroso es la sal de Mohr, que es sulfato de amonio ferroso (NH4)2Fe(SO4)2 y esta disponible en formas anhidras e hidratadas (es decir, hexahidrato). Si bien el ion ferroso es el cofactor del metal de transicion que se encuentra en la hidroxilasa de prolina natural y funciona de manera eficiente en las enzimas disenadas, debe entenderse que otros metales de transicion divalentes capaces de actuar como cofactor pueden usarse en los procesos. En algunas realizaciones, el cofactor de metal de transicion divalente puede comprender Mn+2 y Cr+2. En algunas realizaciones, las condiciones de reaccion pueden comprender un cofactor de metal de transicion divalente, particularmente Fe+2, a una concentracion de aproximadamente 0,1 mM a 10 mM, 0,1 mM a aproximadamente 5 mM, 0,5 mM a aproximadamente 5 mM, aproximadamente 0,5 mM a aproximadamente 3 mM o aproximadamente 1 mM a aproximadamente 2 mM. En algunas realizaciones, las condiciones de reaccion comprenden una concentracion de cofactor de metal de transicion divalente de aproximadamente 0,1 mM, 0,2 |j M, 0,5 mM, 1 mM, 1,5 mM, 2 mM, 3 mM, 5 mM, 7,5 mM o 10 mM. En algunas realizaciones, se pueden usar concentraciones mas altas de cofactor de metal de transicion divalente, por ejemplo hasta 50 mM o hasta 100 mM.
[0256] En algunas realizaciones, las condiciones de reaccion pueden comprender ademas un reductor capaz de reducir el ion ferrico, Fe+3 a ion ferroso, Fe+2. En algunas realizaciones, el reductor comprende acido ascorbico, tfpicamente acido L-ascorbico. Si bien no se requiere acido ascorbico para la reaccion de hidroxilacion, la actividad enzimatica aumenta en su presencia. Sin pretender imponer ninguna teona, se cree que el ascorbato mantiene o regenera la forma de la enzima-Fe+2, que es la forma activa que media en la reaccion de hidroxilacion. En general, las condiciones de reaccion pueden comprender una concentracion de acido ascorbico que corresponde proporcionalmente a la carga del sustrato. En algunas realizaciones, el acido ascorbico esta presente en al menos aproximadamente 0,1 veces, 0,2 veces 0,3 veces, 0,5 veces, 0,75 veces, 1 vez, 1,5 veces o al menos 2 veces la cantidad molar de sustrato. En algunas realizaciones, el reductor, particularmente el acido ascorbico L, esta en una concentracion de aproximadamente 0,001 M a aproximadamente 0,5 M, aproximadamente 0,01 M a aproximadamente 0,5 M, aproximadamente 0,01 M a aproximadamente 0,4 M, aproximadamente 0,1 a aproximadamente 0,4 M, o aproximadamente 0,1 a aproximadamente 0,3 M. En algunas realizaciones, el reductor, particularmente acido ascorbico, esta a una concentracion de aproximadamente 0,001 M, 0,005 M, 0,01 M, 0,02 M,
0,03 M, 0,05 M, 0,1 M, 0,15 M, 0,2 M 0,3 M, 0,4 M o 0,5 M.
[0257] En algunas realizaciones, las condiciones de reaccion comprenden oxfgeno molecular, es decir, O2. Sin pretender imponer ninguna teona, se incorpora un atomo de oxfgeno del oxfgeno molecular al compuesto del sustrato para formar el compuesto producto hidroxilado. El O2 puede estar presente de forma natural en la solucion de reaccion, o introducirse y/o complementarse en la reaccion artificialmente. En algunas realizaciones, las condiciones de reaccion pueden comprender una aireacion forzada (por ejemplo, burbujeo) con aire, gas O2 u otros gases que contienen O2. En algunas realizaciones, el O2 en la reaccion se puede aumentar al aumentar la presion de la reaccion con O2 o un gas que contiene O2. Esto se puede hacer llevando a cabo la reaccion en un recipiente que puede presurizarse con gas O2. En algunas realizaciones, el gas O2 se puede rociar a traves de la solucion de reaccion a una velocidad de al menos 1 litro por hora (L/h), al menos 2 L/h, al menos 3 L/h, al menos 4 L/h, al menos
5 L/h, o mas. En algunas realizaciones, el gas O2 se puede rociar a traves de la solucion de reaccion a una velocidad
de entre aproximadamente 1 L/h y 10 L/h, entre aproximadamente 2 L/h y 7 L/h, o entre aproximadamente 3 L/h y 5 L/h.
[0258] Durante el curso de la reaccion, el pH de la mezcla de reaccion puede cambiar. El pH de la mezcla de reaccion se puede mantener a un pH deseado o dentro de un rango de pH deseado. Esto se puede hacer mediante la adicion de un acido o una base, antes y/o durante el curso de la reaccion. Alternativamente, el pH puede controlarse utilizando un tampon. Por consiguiente, en algunas realizaciones, la condicion de reaccion comprende un tampon. Los tampones adecuados para mantener los intervalos de pH deseados son conocidos en la tecnica e incluyen, a modo de ejemplo y sin limitacion, borato, fosfato, acido 2-(N-morfolino) etanosulfonico (MES), acido 3-(N-morfolino)propanosulfonico (MOPS), acetato, trietanolamina y 2-amino-2-hidroximetilo-propano-1,3-diol (Tris), y similares. En algunas realizaciones, el tampon es fosfato. En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden una concentracion de tampon (por ejemplo, fosfato) de aproximadamente 0,01 a aproximadamente 0,4 M, de 0,05 a aproximadamente 0,4 M, de 0,1 a aproximadamente 0,3 M, o de aproximadamente 0,1 a aproximadamente 0,2 M. En algunas realizaciones, la condicion de reaccion comprende una concentracion de tampon (por ejemplo, fosfato) de aproximadamente 0,01, 0,02, 0,03, 0,04, 0,05, 0,07. 0,1, 0,12, 0,14, 0,16, 0,18, 0,2, 0,3 o 0,4 M. En algunas realizaciones, las condiciones de reaccion comprenden agua como un disolvente adecuado sin tampon presente.
[0259] En las realizaciones del proceso, las condiciones de reaccion pueden comprender un pH adecuado. El pH deseado o el rango de pH deseado se pueden mantener mediante el uso de un acido o base, un tampon apropiado, o una combinacion de tamponamiento y adicion de acido o base. El pH de la mezcla de reaccion se puede controlar antes y/o durante el curso de la reaccion. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una solucion de pH de aproximadamente 4 a aproximadamente 10, pH de aproximadamente 5 a aproximadamente 10, pH de aproximadamente 5 a aproximadamente 9, pH de aproximadamente 6 a aproximadamente 9, pH de aproximadamente 6 a aproximadamente 8. En algunas realizaciones, las condiciones de reaccion comprenden un pH de solucion de aproximadamente 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 9,5 o 10.
[0260] En las realizaciones de los procesos de este documento, se puede usar una temperatura adecuada para las condiciones de reaccion, por ejemplo, teniendo en cuenta el aumento en la velocidad de reaccion a temperaturas mas altas y la actividad de la enzima durante el penodo de tiempo de reaccion. Por consiguiente, en algunas realizaciones, las condiciones de reaccion adecuadas comprenden una temperatura de aproximadamente 10°C a aproximadamente 60°C, aproximadamente 10°C a aproximadamente 55°C, aproximadamente 15°C a aproximadamente 60°C, aproximadamente 20°C. a aproximadamente 60°C, aproximadamente 20°C a aproximadamente 55°C, aproximadamente 25°C a aproximadamente 55°C, o aproximadamente 30°C a aproximadamente 50°C. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una temperatura de aproximadamente 10°C, 15°C, 20°C, 25°C, 30°C, 35°C, 40°C, 45°C, 50°C, 55°C, o 60°C. En algunas realizaciones, la temperatura durante la reaccion enzimatica se puede mantener a una temperatura espedfica a lo largo del curso de la reaccion. En algunas realizaciones, la temperatura durante la reaccion enzimatica se puede ajustar sobre un perfil de temperatura durante el curso de la reaccion.
[0261] Los procesos de la descripcion se llevan a cabo generalmente en un disolvente. Los disolventes adecuados incluyen agua, soluciones tampon acuosas, disolventes organicos, disolventes polimericos y/o sistemas de codisolventes, que generalmente comprenden disolventes acuosos, disolventes organicos y/o disolventes polimericos. El solvente acuoso (agua o sistema de co-solvente acuoso) puede estar tamponado con pH o sin amortiguar. En algunas realizaciones, los procesos que utilizan los polipeptidos de hidroxilasa de prolina disenados se pueden llevar a cabo en un sistema acuoso de co-solvente que comprende un solvente organico (por ejemplo, etanol, isopropanol (IPA), dimetilsulfoxido (DMSO), dimetilformamida (DMF) acetato etflico, acetato de butilo, 1-octanol, heptano, octano, metilo t butilo eter (MTBE), tolueno y similares), disolventes ionicos o polares (por ejemplo, tetrafluoroborato de 1-etilo 4 metilimidazolio, tetrafluoroborato de 1-butilo-3-metilimidazolio, hexafluorofosfato de 1-butilo-3-metilimidazolio, glicerol, polietilenglicol y similares). En algunas realizaciones, el co-disolvente puede ser un disolvente polar, tal como un poliol, dimetilsulfoxido (DMSO) o alcohol inferior. El componente de co-disolvente no acuoso de un sistema de co-disolvente acuoso puede ser miscible con el componente acuoso, proporcionando una sola fase lfquida, o puede ser parcialmente miscible o inmiscible con el componente acuoso, proporcionando dos fases lfquidas. Los sistemas de co-solvente acuosos ejemplares pueden comprender agua y uno o mas co-solventes seleccionados de entre un solvente organico, solvente polar y solvente de poliol. En general, el componente cosolvente de un sistema acuoso co-solvente se elige de tal manera que no inactive adversamente la enzima hidroxilasa de prolina bajo las condiciones de reaccion. Los sistemas de co-solventes apropiados pueden identificarse facilmente midiendo la actividad enzimatica de la enzima hidroxinasa de prolina disenada espedfica con un sustrato definido de interes en el sistema de solvente candidato, utilizando un ensayo de actividad enzimatica, como los descritos en este documento.
[0262] En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden un co-solvente acuoso, donde el co-solvente comprende DMSO en aproximadamente 1% a aproximadamente 50% (v/v), aproximadamente 1 a aproximadamente 40% (v/v), de aproximadamente 2% a aproximadamente 40% (v/v), de aproximadamente 5% a aproximadamente 30% (v/v), de aproximadamente 10% a aproximadamente 30% (v/v) o de aproximadamente 10% a aproximadamente 20% (v/v). En algunas realizaciones del proceso, las condiciones de reaccion adecuadas pueden comprender un co-disolvente acuoso que comprende DMSO a aproximadamente el 1% (v/v), aproximadamente el 5% (v/v), aproximadamente el 10% (v/v), aproximadamente el 15% (v/v), aproximadamente el 20% (v/v), aproximadamente el 25% (v/v), aproximadamente el 30% (v/v), aproximadamente el 35% (v/v), aproximadamente el 40% (v/v), aproximadamente el 45% (v/v), o aproximadamente el 50% (v/v).
[0263] En algunas realizaciones, las condiciones de reaccion pueden comprender un tensioactivo para estabilizar o mejorar la reaccion. Los tensioactivos pueden comprender tensioactivos no ionicos, cationicos, anionicos y/o anfifflicos. Los tensioactivos ejemplares incluyen, a modo de ejemplo y sin limitacion, nonilo fenoxipolietoxietanol (NP40), Triton X-100, polioxietileno-estearilamina, bromuro de cetiltrimetilamonio, oleilamidosulfato de sodio, polioxietileno-sorbitanmonostearato, hexadecildimetilamina, etc. Puede emplearse cualquier tensioactivo que podna estabilizar o potenciar la reaccion. La concentracion del tensioactivo a emplear en la reaccion puede ser generalmente de 0,1 a 50 mg/ml, particularmente de 1 a 20 mg/ml.
[0264] En algunas realizaciones, las condiciones de reaccion pueden incluir un agente antiespumante, que ayuda a reducir o evitar la formacion de espuma en la solucion de reaccion, tal como cuando las soluciones de reaccion se mezclan o burbujean. Los agentes antiespumantes incluyen aceites no polares (por ejemplo, minerales, siliconas, etc.), aceites polares (por ejemplo, acidos grasos, alquilaminas, alquilo amidas, alquilo sulfatos, etc.) e hidrofobos (por ejemplo, sflice tratada, polipropileno), etc.), algunos de los cuales tambien funcionan como tensioactivos. Los agentes antiespumantes ejemplares incluyen, Y-30® (Dow Corning), copolfmeros de poliglicol, alcoholes oxi/etoxilados y polidimetilsiloxanos. En algunas realizaciones, el antiespumante puede estar presente en aproximadamente 0,001% (v/v) a aproximadamente 5% (v/v), aproximadamente 0,01% (v/v) a aproximadamente 5% (v/v), aproximadamente 0,1 % (v/v) a aproximadamente 5% (v/v), o aproximadamente 0,1% (v/v) a aproximadamente 2% (v/v). En algunas realizaciones, el agente antiespumante puede estar presente a aproximadamente el 0,001% (v/v), aproximadamente el 0,01% (v/v), aproximadamente el 0,1% (v/v), aproximadamente el 0,5% (v/v), aproximadamente 1% (v/v), aproximadamente 2% (v/v), aproximadamente 3% (v/v), aproximadamente 4% (v/v), o aproximadamente 5% (v/v) o mas como deseable para promover la reaccion.
[0265] Las cantidades de reactivos usados en la reaccion de hidroxilasa generalmente variaran dependiendo de las cantidades de producto deseadas, y concomitantemente la cantidad de sustrato de hidroxilasa de prolina empleada. Los expertos en la tecnica entenderan facilmente como variar estas cantidades para adaptarlas al nivel deseado de productividad y escala de produccion.
[0266] En algunas realizaciones, el orden de adicion de los reactivos no es cntico. Los reactivos pueden agregarse juntos al mismo tiempo a un solvente (por ejemplo, solvente monofasico, sistema de co-solvente acuoso bifasico y similares), o alternativamente, algunos de los reactivos pueden agregarse por separado, y algunos juntos en diferentes momentos. Por ejemplo, el cofactor, el co-sustrato, la hidroxilasa de prolina y el sustrato se pueden agregar primero al solvente.
[0267] Los reactivos solidos (por ejemplo, enzimas, sales, etc.) pueden proporcionarse a la reaccion en una variedad de formas diferentes, que incluyen polvo (por ejemplo, liofilizado, secado por aspersion y similares), solucion, emulsion, suspension. y similares. Los reactivos se pueden liofilizar o secar por pulverizacion facilmente utilizando metodos y equipos que son conocidos por los expertos en la tecnica. Por ejemplo, la solucion de protema se puede congelar a -80°C en pequenas alfcuotas, y luego agregarse a una camara de liofilizacion previamente enfriada, seguido de la aplicacion de un vacfo.
[0268] Para mejorar la eficacia de la mezcla cuando se usa un sistema de co-disolvente acuoso, la hidroxilasa de prolina y el cofactor se pueden agregar y mezclar primero en la fase acuosa. La fase organica puede luego agregarse y mezclarse, seguido de la adicion del sustrato de hidroxilasa de prolina y el co-sustrato. Alternativamente, el sustrato de hidroxilasa de prolina se puede premezclar en la fase organica, antes de la adicion a la fase acuosa.
[0269] El proceso de hidroxilacion generalmente se deja avanzar hasta que la conversion adicional del sustrato a producto hidroxilado no cambie significativamente con el tiempo de reaccion, por ejemplo, menos del 10% del sustrato que se esta convirtiendo, o menos del 5% del sustrato que se esta convirtiendo). En algunas realizaciones, se permite que la reaccion continue hasta que haya una conversion completa o casi completa del sustrato en producto. La transformacion del sustrato en producto se puede monitorear usando metodos conocidos mediante la deteccion de sustrato y/o producto, con o sin derivatizacion. Los metodos analtticos adecuados incluyen cromatograffa de gases, HPLC, MS y similares.
[0270] En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden una carga de sustrato de al menos aproximadamente 5 g/L, 10 g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, o mas, y en donde el metodo resulta en al menos aproximadamente 50%, 60%, 70%, 80%, 90%, 95% o mas de conversion de sustrato de compuesto a producto compuesto en aproximadamente 48 h o menos, en aproximadamente 36 h o menos, o en aproximadamente 24 h o menos.
[0271] Los polipeptidos de hidroxilasa de prolina modificados de la presente descripcion cuando se usan en el proceso en condiciones de reaccion adecuadas dan como resultado un exceso del producto hidroxilado en cis en al menos el 90%, 95%, 96%, 97%, 98%, 99%, o mayor exceso diastereomerico sobre el producto trans-hidroxilado. En algunas realizaciones, no se forma una cantidad detectable de compuesto transhidroxilado.
[0272] En realizaciones adicionales de los procesos para convertir el compuesto de sustrato en un compuesto de producto hidroxilado usando los polipeptidos de hidroxilasa de prolina disenados, las condiciones de reaccion adecuadas pueden comprender una carga de sustrato inicial en la solucion de reaccion que luego se pone en contacto con el polipeptido. Esta solucion de reaccion se complementa luego con un compuesto de sustrato adicional como una adicion continua o discontinua a lo largo del tiempo a una velocidad de al menos aproximadamente 1 g/L/h, al menos aproximadamente 2 g/L/h, al menos aproximadamente 4 g/L/h, al menos aproximadamente 6 g/L/h, o superior. Por lo tanto, de acuerdo con estas condiciones de reaccion adecuadas, el polipeptido se agrega a una solucion que tiene una carga de sustrato inicial de al menos aproximadamente 20 g/L, 30 g/L o 40 g/L. A continuacion, a esta adicion de polipeptido le sigue una adicion continua de sustrato adicional a la solucion a una velocidad de aproximadamente 2 g/L/h, 4 g/L/h, o 6 g/L/h hasta una carga final de sustrato mucho mayor. se alcanza al menos aproximadamente 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, 150 g/L, 200 g/L o mas. En consecuencia, en algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden la adicion del polipeptido a una solucion que tiene una carga de sustrato inicial de al menos aproximadamente 20 g/L, 30 g/L, o 40 g/L seguido de la adicion de un sustrato adicional a la solucion a una velocidad de aproximadamente 2 g/L/h, 4 g/L/h, o 6 g/L/h hasta que se alcanzan una carga de sustrato final de al menos aproximadamente 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L o mas. Esta condicion de reaccion de suplementacion de sustrato permite lograr mayores cargas de sustrato mientras que se mantienen altas tasas de conversion de sustrato a producto hidroxilado de al menos aproximadamente 50%, 60%, 70%, 80%, 90% o mas de conversion de sustrato. En algunas realizaciones de este proceso, el sustrato agregado se encuentra en una solucion que comprende a-cetoglutarato en una cantidad equimolar o superior del sustrato adicional agregado.
[0273] En algunas realizaciones de los procesos, la reaccion que usa un polipeptido de hidroxilasa de prolina disenada puede comprender las siguientes condiciones de reaccion adecuadas: (a) carga de sustrato de aproximadamente 5 g/L a 30 g/L; (b) aproximadamente 0,1 g/L a 10 g/L del polipeptido disenado; (c) aproximadamente 19 g/L (0,13 M) a 57 g/L (0,39 M) de a-cetoglutarato; (d) aproximadamente 14 g/L (0,08 M) a 63 g/L (0,36 M) de acido ascorbico; (e) aproximadamente 1,5 g/L (3,8 mM) a 4,5 g/L (11,5 mM) de FeSO4; (f) un pH de aproximadamente 6 a 7; (g) temperatura de aproximadamente 20° a 40°C; y (h) tiempo de reaccion de 2-24 h.
[0274] En algunas realizaciones de los procesos, la reaccion que usa un polipeptido de hidroxilasa de prolina disenada puede comprender las siguientes condiciones de reaccion adecuadas: (a) carga de sustrato de aproximadamente 10 g/L a 100 g/L; (b) de aproximadamente 1 g/L a aproximadamente 50 g/L de polipeptido disenado; (c) a-cetoglutarato en aproximadamente 1 a 2 equivalentes molares de compuesto de sustrato; (d) acido ascorbico en aproximadamente 0,25 a 0,75 equivalentes molares de compuesto de sustrato; (e) de aproximadamente 0,5 mM a aproximadamente 12 mM de FeSO4; (f) pH de aproximadamente 6 a 8; (g) temperatura de aproximadamente 20° a 40°C; y (h) tiempo de reaccion de 6 a 120 h.
[0275] En algunas realizaciones, se llevan a cabo componentes de reaccion adicionales o tecnicas adicionales para complementar las condiciones de reaccion. Estos pueden incluir tomar medidas para estabilizar o prevenir la inactivacion de la enzima, reducir la inhibicion del producto, cambiar el equilibrio de la reaccion a la formacion del producto hidroxilado.
[0276] En otras realizaciones, cualquiera de los procesos descritos anteriormente para la conversion de compuesto de sustrato en compuesto de producto puede comprender ademas una o mas etapas seleccionadas de: extraccion; aislamiento; purificacion; y cristalizacion del producto compuesto. Metodos, tecnicas y protocolos para extraer, aislar, purificar y/o cristalizar el producto hidroxilado a partir de mezclas de reacciones biocatalfticas producidas por los procesos descritos anteriormente son conocidos por los expertos en la tecnica y/o se accede a ellos mediante experimentacion rutinaria. Ademas, los metodos ilustrativos se proporcionan en los ejemplos a continuacion.
[0277] Se ilustran varias caractensticas y realizaciones de la descripcion en los siguientes ejemplos representativos, que pretenden ser ilustrativos, y no limitativos.
6. EJEMPLOS
Ejemplo 1: Sintesis, optimizacion y cribado de polipeptidos de hidroxilasa de prolina disenados
[0278] Sintesis y optimizacion de genes: la secuencia de polinucleotidos que codifica el polipeptido de cis-4-hidroxilasa de prolina de tipo salvaje informado de Sinorhizobium meliloti, como se representa por la SEQ ID NO: 2, se sintetizo como el gen de la SEQ ID NO: 1, el gen sintetico de la SEQ ID NO: 1 se clono en un sistema de vector pCK110900 (vease, por ejemplo, la publicacion de solicitud de patente estadounidense 20060195947) y se expreso posteriormente en E. coli W3110fhuA. La E. coli W3110 expresa los polipeptidos de hidroxilasa de prolina bajo el control del promotor lac. Sobre la base de las comparaciones de secuencia con otras hidroxilasas de prolina y el modelado computarizado de la estructura enzimatica acoplada al sustrato prolina, se identificaron las posiciones de residuos asociadas con el sitio activo, los bucles peptfdicos, la interfaz solucion/sustrato y las posibles posiciones de estabilidad y se sometieron a mutagenesis. Estas variantes de la primera ronda se seleccionaron en condiciones de ensayo HTP con acido (2S)-piperidina-2-carbox^lico como sustrato. Se identificaron variantes con mayor actividad enzimatica y/o expresion. Tambien se generaron dos polinucleotidos optimizados en codones adicionales que codifican la secuencia de aminoacidos de la enzima natural (es decir, la SEQ ID NO: 3 y 5) con fines de comparacion. Los polinucleotidos 3 y 5 optimizados de codon que expresan la hidroxilasa de cis-4-prolina de origen natural mostraron una expresion aumentada con respecto al polinucleotido de la SEQ ID NO: 1, Las diferencias de residuos de la primera ronda de seleccion se combinaron en varias permutaciones y se seleccionaron para obtener propiedades mejoradas en las condiciones del Ensayo HTP, el Ensayo SFP y el Ensayo DSP. Las secuencias polipeptfdicas de hidroxilasa de la prolina y las mutaciones espedficas y las actividades relativas obtenidas de las pantallas se enumeran en la Tabla 2A, 2B, 2C, 2D, 2E, 2F, 2G y 2H.
Ejemplo 2: Produccion de hidroxilasas de prolina modificadas
[0279] Los polipeptidos de hidroxilasa de prolina modificados se produjeron en E. coli W3110 bajo el control del promotor lac. Las preparaciones de enzimas para los ensayos de HTP, DSP y SFP se realizaron de la siguiente manera.
[0280] Preparacion de crecimiento, expresion y de lisado de alto rendimiento. Las celulas se recogieron y se cultivaron durante la noche en medio LB que contema 1% de glucosa y 30 pg/ml de cloranfenicol (CAM), 30°C, 200 rpm, 85% de humedad. Una alfcuota de 20 pl de crecimiento durante la noche se transfirio a una placa de pocillos profundos que contema 380 pl de medio de cultivo 2xTB que contema 30 pg/ml de CAM, 1 mM de IPTG y se incubo durante aproximadamente l 8 horas a 30°C, 200 rpm, 85% de humedad. Los cultivos celulares se centrifugaron a 4000 rpm, 4°C durante 10 min, y los medios desechados. Los sedimentos celulares se resuspendieron en 100 pl de tampon de lisis (50 mM de tampon fosfato, pH 6,3, que contema sal de Mohr 100 pM (es decir, (NH4)2Fe(SO4)2), 0,5 mg/ml de PMBS (sulfato de polimixina B) y 1 mg/mL de Lisozima). El tampon de lisis se preparo recien anadiendo a 60 ml de tampon fosfato 50 mM, pH 6,3, 60 mg de lisozima y 30 mg de PMBS. Despues de mezclar la solucion de lisozima, se agregaron 0,6 ml de solucion de sal de Mohr 10 mM (en H2O).
[0281] Produccion de polvos de matraz de agitacion (SFP): Se uso un procedimiento de matraz de agitacion para generar polvos polipeptfdicos de polipropillasa usados en ensayos de cribado secundarios o en los procesos biocataltticos descritos en el presente documento. El polvo del matraz de agitacion (SFP) proporciona una preparacion mas purificada (por ejemplo, hasta el 30% de la protema total) de la enzima disenada en comparacion con el lisado celular utilizado en los ensayos de HTP. Una sola colonia de E. coli que contiene un plasmido que codifica un polipeptido de interes se inocula en 50 ml de caldo Luria Bertani que contiene 30 pg/ml de cloranfenicol y 1% de glucosa. Las celulas se cultivan durante la noche (al menos 16 horas) en una incubadora a 30°C con agitacion a 250 rpm. El cultivo se diluye en 250 ml de Terrific Broth (12 g/L de bacto-triptona, 24 g/L de extracto de levadura, 4 ml/l de glicerol, fosfato de potasio 65 mM, pH 7, MgSO41 mM) que contiene 30 pg/ml de cloranfenicol en un matraz de 1 litro a una densidad optica de 600 nm (OD600) de 0,2 y se deja crecer a 30°C. La expresion del gen de la hidroxilasa de prolina se induce mediante la adicion de isopropilo-p-D-tiogalactosido ("IPTG") a una concentracion final de 1 mM cuando la OD600 del cultivo es de 0,6 a 0,8. La incubacion se continua durante la noche (al menos 16 horas). Las celulas se recogen por centrifugacion (5.000 rpm, 15 min, 4°C) y el sobrenadante se descarta. El sedimento celular se resuspende con un volumen igual de tampon de fosfato de potasio 50 mM fno (4°C), pH 6,3, y se recoge por centrifugacion como anteriormente. Las celulas lavadas se resuspenden en dos volumenes del tampon de fosfato de potasio 50 mM fno, pH 6,3 y se pasan a traves de un French Press dos veces a 12.000 psi mientras que se mantienen a 4°C. Los residuos celulares se eliminan por centrifugacion (9.000 rpm, 45 minutos, 4°C). El sobrenadante de lisado transparente se recoge y almacena a -20°C. La liofilizacion del lisado claro congelado proporciona un polvo de matraz de agitacion seco de polipeptido en bruto. Alternativamente, el sedimento celular (antes o despues del lavado) se puede almacenar a 4°C o -80°C.
[0282] Produccion de polvos de proceso descendente (DSP): Los polvos DSP proporcionan una preparacion mas purificada de la enzima hidroxilasa de prolina modificada en comparacion con el lisado celular utilizado en los ensayos de HTP o SFP. La fermentacion a gran escala de la hidroxilasa de prolina disenada para la produccion de polvos DSP (~100 - 120 g a partir de 10 L) se puede llevar a cabo como un lote corto seguido de un proceso de alimentacion por lotes de acuerdo con los metodos estandar de bioprocesos. En resumen, la expresion de hidroxilasa de prolina se induce mediante la adicion de IPTG a una concentracion final de 1 mM. Despues de la fermentacion, las celulas se recolectan y se resuspenden en tampon fosfato 50 mM, luego se rompen mecanicamente por homogeneizacion. Los residuos celulares y el acido nucleico se floculan con polietilenimina (PEI) y la suspension se clarifica por centrifugacion. El sobrenadante transparente resultante se concentra utilizando una membrana de ultrafiltracion de flujo cruzado tangencial para eliminar las sales y el agua. El concentrado de enzimas parcialmente purificado y concentrado puede luego secarse en un liofilizador y envasarse (por ejemplo, en recipientes de polietileno).
Ejemplo 3: Procedimientos analiticos
[0283] Metodo 1 - Analisis por HPLC de las reacciones de ensayo de HTP: En un bloque de ensayo de 96 pocillos profundos, se diluyeron 10 |jl de solucion de reaccion con 230 |jl de solucion de bicarbonato de sodio al 5% seguido de 160 j l de solucion de cloruro de dansilo (6 mg/mL de cloruro de dansilo en MeCN). La placa se sello termicamente, se centrifugo y se coloco en una incubadora a 55°C durante 45 minutes. La solucion de reaccion cambia de amarillo a amarillo claro cuando se completa la derivacion con cloruro de dansilo. En los casos en que la solucion permanecio amarilla, la placa se calento durante otros 15 minutos. Despues de la incubacion, la placa se centrifugo durante 5 minutos a 4.000 rpm. Una alteuota de 200 j l de sobrenadante se transfirio a una placa de 96 Corning para el analisis de HPLC. La concentracion final del sustrato fue inferior a 0,25 g/L.
[0284] La reaccion inactivada se sometio a analisis por HPLC en las siguientes condiciones.
Figure imgf000059_0001
[0285] La conversion del compuesto (2) en el compuesto (1) se determino a partir de los cromatogramas resultantes de la siguiente manera:
% Conversion = {(RF x Area de producto)/[(RF x Area de producto) Area de sustrato]} x 100 donde
Factor de respuesta (RF) = Area de sustrato/Area de producto.
[0286] Este metodo se utilizo para la identificacion rapida para la conversion del acido (2S)-piperidina-2-carboxflico en acido hidroxipiperidina-2-carboxflico.
[0287] Los perfiles cromatograficos de elucion, indicados como "Tiempo de respuesta", son los siguientes:
Figure imgf000060_0001
[0288] Metodo 2 - Analisis por HPLC de las reacciones de DSP y SFP: 10 pl de solucion de reaccion de una reaccion de DSP o SFP se pipeteo en un tubo Eppendorf de 1,5 ml y se diluyo con 230 pl de bicarbonato de sodio al 5%. Luego se anadio una alfcuota de 160 pl de solucion de cloruro de dansilo (6 mg/ml de cloruro de dansilo en MeCN). El tubo se calento con una cubierta abierta a 55°C durante al menos 30 minutos en un bloque de calentamiento para asegurar la derivacion completa, como lo indica el cambio en el color de la mezcla de derivacion de un color amarillo a un amarillo claro. El tubo se agito en vortex y luego se centrifugo a 12.000 rpm durante 5 minutos. Se transfirio una parte alfcuota de 200 pl de sobrenadante a un vial de HPLC de 2 ml con el inserto. El vial se sometio a fase inversa HPLC-UV para su analisis, como se describe a continuacion. La concentracion final del sustrato fue inferior a 0,25 g/l.
[0289] La reaccion inactivada se sometio a analisis por HPLC en las siguientes condiciones.
Figure imgf000060_0002
[0290] Los perfiles cromatograficos de elucion son los siguientes:
Figure imgf000061_0001
Ejemplo 4: Cribado de alto rendimiento (HTP) de hidroxilasas de prolina para la conversion del compuesto (2) en el compuesto (1)
[0291] Ensayos de cribado de HTP: el cribado de alto rendimiento utilizado para guiar la seleccion primaria de variantes se llevo a cabo en placas de 96 pocillos utilizando lisados celulares. Se utilizaron dos condiciones, la condicion A y la condicion B.
[0292] Las reacciones de la condicion A se llevaron a cabo como sigue. Las celulas se cultivaron en placas de 96 pocillos como se describe anteriormente y los lisados se prepararon dispensando 100 pl de tampon de lisis en cada pocillo. El tampon de lisis se preparo disolviendo 30 mg de lisozima y 15 mg de PMBS en 30 ml de tampon fosfato 50 mM, pH 6,3. Se anadio un volumen de 600 pl de sal de Mohr 10 mM recien preparada en agua esteril a la solucion de lisozima. La placa se sello termicamente y luego se agito en un agitador de placa de titulacion a velocidad n° 8 durante 2 horas a temperatura ambiente. Posteriormente, la placa se centrifugo rapidamente para asentar el lisado en el fondo de la placa. Este lisado crudo se usana para la reaccion.
[0293] Las reacciones de la condicion A en una escala de 200 pl se llevaron a cabo en placas de 98 pocillos. Se preparo una solucion madre de premezcla disolviendo 1,33 g de acido a-cetoglutarico y 1,47 g de acido L-ascorbico en 31,5 ml de tampon fosfato 50 mM, pH 6,3 (pH ajustado usando KOH). Despues de mezclarse, el pH se ajusto a 6,3 con KOH. A la premezcla de pH ajustado, se agregaron 41,16 mg de sal de Mohr. La solucion se vuelve turbia debido a la baja solubilidad de la sal de Mohr en disolventes acuosos.
[0294] A cada 100 j l de lisados crudos preparados anteriormente, se agregaron 90 j l de la solucion madre de premezcla a cada pocillo, seguido inmediatamente por 10 uL/pocillo de una solucion madre de sustrato de 200 g/L, es decir, el compuesto (2) preparado en tampon fosfato 50 mM, pH 6,3. La placa se sello con un sello AirPore (Qiagen) y la reaccion se dejo proceder durante toda la noche en un agitador de tttulos, con una velocidad de agitacion de N° 2,5 a temperature ambiente.
[0295] La condicion A tiene los siguientes parametros de reaccion finales: (a) 10 g/L de carga de sustrato; (b) 19 g/L de acido a-cetoglutarico; (c) 21 g/L de acido ascorbico; (d) sal de Mohr 1,5 mM; (e) tampon fosfato 50 mM, pH 6,3 (pH ajustado con KOH); (f) temperatura ambiente (20°C a 25°C); y (g) tiempo de reaccion de aprox. 24 h.
[0296] Despues de la incubacion durante la noche, las placas se centrifugaron a 4.000 rpm durante 5 minutos a temperatura ambiente. Las muestras de reaccion se derivaron y se detuvieron mediante la alfcuota de 10 j l de la mezcla de reaccion transparente en una placa de 96 pocillos profundos que contema 230 jl/pocillo de bicarbonato de sodio al 5% (ac.). Se anadio un volumen de 160 j l de 6 mg/ml de cloruro de dansilo en MeCN a cada pocillo, la placa se sello por calor y luego se centrifugo rapidamente para depositar la solucion de reaccion en el fondo del pozo. La placa se calento luego a 55°C durante al menos 45 minutos sin agitacion, y se centrifugo a 4.000 rpm durante 10 minutos a temperatura ambiente. Un volumen de 200 j l de la solucion derivada se transfirio a una placa de fondo redondo 96 y se envio para analisis de HPLC.
[0297] Las reacciones de la condicion B se llevaron a cabo de la siguiente manera. Las celulas se cultivaron en placas de 96 pocillos como se describio anteriormente y los lisados se prepararon dispensando 100 j l de tampon de lisis en cada pocillo. El tampon de lisis se preparo recientemente disolviendo 30 mg de lisozima y 15 mg de PMBS en 30 ml de tampon fosfato 50 mM, pH 6,3, seguido de un volumen de 600 j l de sal de Mohr 10 mM, recien preparado en agua esteril. La placa de lisis se sello termicamente y luego se agito en un agitador de placa de titulacion a velocidad N° 8 durante 2 horas a temperatura ambiente. Posteriormente, la placa se centrifugo rapidamente para asentar el lisado en el fondo de la placa. Este lisado crudo de 100 j l debfa usarse para la reaccion.
[0298] Las reacciones de la condicion B en una escala de 200 j l se llevaron a cabo en placas de 98 pocillos. Una solucion de reserva de premezcla fue preparada disolviendo 1,33 g de acido a-cetoglutarico y 1,47 g de acido L-ascorbico en 31,5 ml de tampon fosfato 50 mM, pH 6,3 (pH ajustado utilizando KOH). Despues de mezclarse, el pH se ajusto a 6,3 con KOH. A la premezcla de pH ajustado, se agregaron 41,16 mg de sal de Mohr.
[0299] A cada 100 j l de lisados brutos preparados anteriormente, se agregaron 90 j l de la solucion madre de premezcla a cada pocillo, seguido inmediatamente por 10 uL/pocillo de una solucion madre de sustrato de 200 g/L, es decir, el compuesto (2) preparado en tampon fosfato 50 mM, pH 6,3. La placa se sello con un sello AirPore® (Qiagen) y la reaccion se dejo proceder durante la noche en un agitador de tftulos, con una velocidad de agitacion de N° 2,5 a temperatura ambiente.
[0300] La condicion B tiene los siguientes parametros de reaccion finales: (a) 10 g/L de carga de sustrato; (b) 19 g/L de acido a-cetoglutarico; (c) 21 g/L de acido ascorbico; (d) sal de Mohr 1,5 mM; (e) tampon fosfato 50 mM, pH 6,3 (pH ajustado con KOH); (f) temperatura ambiente (20°C a 25°C); y (g) tiempo de reaccion de ca 24 h.
[0301] Despues de la incubacion general, las placas se centrifugaron a 4.000 rpm durante 5 minutos a temperatura ambiente. Las muestras de reaccion se derivaron y se detuvieron mediante la alfcuota de 10 j l de la mezcla de reaccion transparente en una placa de 96 pocillos profundos que contema 230 jl/pocillo de bicarbonato de sodio al 5% (ac.). Se anadio un volumen de 160 j l de 6 mg/ml de cloruro de dansilo en MeCN a cada pocillo, la placa se sello por calor y luego se centrifugo rapidamente para depositar la solucion de reaccion en el fondo del pozo. La placa se calento luego a 55°C durante al menos 45 minutos con agitacion en un Infors HT Microtron con una velocidad de agitacion de 500 rpm. Las placas se centrifugaron a 4.000 rpm durante 10 minutos a temperatura ambiente. Un volumen de 200 j l de la solucion derivada se transfirio a una placa de fondo redondo 96 y se envio para HPLC para su analisis.
Ejemplo 5: Proceso para la conversion del Compuesto (2) en el Compuesto (1) usando preparaciones en polvo de matraz de agitacion (SFP)
[0302] Se llevo a cabo una reaccion a escala de 200 j l usando polvo de enzima SFP como sigue. Se preparo recientemente una solucion madre de premezcla disolviendo 1,05 g de acido a-cetoglutarico, 420 mg de acido L-ascorbico y 600 mg de sustrato (2S)-piperidina-2-carboxflico en 10 ml de tampon fosfato 50 mM, pH 6,3 (pH ajustado usando kOh ). Despues de mezclar bien la solucion, el pH se ajusto a 6,3 con KOH. A la solucion de premezcla de pH ajustado, se agregaron 45 mg de sal de Mohr.
[0303] Se preparo una solucion madre de enzima disolviendo 20 mg de polvo de enzima SFP en 2 ml de tampon fosfato 50 mM, pH 6,3. Para iniciar la reaccion, se agregaron 100 j l de solucion de enzima a una placa, seguido de 100 |jl de solucion madre de premezcla para un volumen de reaccion final de 200 jl. La placa se sello con un sello AirPore® (Qiagen) y se permitio que la reaccion transcurriera durante la noche (aprox. 24 h) con agitacion en un mezclador de placas de titulacion (velocidad N° 2.5) a temperature ambiente.
[0304] La condicion del Ensayo de SFP (es decir, la Condicion C) tiene los siguientes parametros finales: (a) 5 g/L de carga de enzima en polvo; (b) 30 g/L de carga de sustrato; (c) 52,5 g/L de acido a-cetoglutarico; (d) 21 g/L de acido L-ascorbico; (e) sal de Mohr 2,25 mM; (f) tampon de fosfato de potasio 50 mM, pH 6,3 (pH ajustado con KOH), (g) temperature de reaccion a temperature ambiente; y (h) tiempo de reaccion de aprox. 24 h. En algunas reacciones, las condiciones de reaccion conteman ademas un 1% (v/v) de antiespumante Y-30® (Dow Corning), y la solucion de reaccion se rocio con gas 02 a 2 l/h.
[0305] Las reacciones se inactivaron con 400 j l de MeCN al 75% y H2O al 25%. Las placas se agitaron durante 10 minutos a temperatura ambiente y se centrifugaron a 4.000 rpm. La derivacion se llevo a cabo transfiriendo 20 j l de reaccion inactivada a una placa de 96 pocillos que contema 230 jl/pocillo de bicarbonato de sodio al 5% (ac). Se anadio a cada pocillo una alfcuota de 150 j l de cloruro de dansilo 21 mg/ml en MeCN. La placa se sello termicamente y se centrifugo rapidamente, y las placas se incubaron a 65°C durante al menos 1 h con agitacion en un Infors HT Microtron a una velocidad de agitacion de 500 rpm. Las placas se centrifugaron a 4.000 rpm durante 10 minutos a temperatura ambiente. Un volumen de 200 j l de la solucion derivada se transfirio a una placa de fondo redondo 96 y se envio para analisis por HPLC.
Ejemplo 6: Proceso para la conversion del compuesto (2) en el compuesto (1) usando preparaciones de polvo de proceso aguas abajo (DSP)
[0306] Se usaron dos condiciones de reaccion para preparaciones de polvo de proceso aguas abajo (DSP). Las primeras condiciones de reaccion, denominadas condiciones "mini-DSP" (es decir, condicion D) se llevaron a cabo en una escala de 1 ml de la siguiente manera. Se preparo recientemente una solucion madre de premezcla disolviendo 120 mg de acido (2S)-piperidina-2-carboxflico (es decir, acido L-pipecolico), 228 mg de acido acetoglutarico y 252 mg de acido L-ascorbico en 11,88 ml de tampon fosfato 50 mM, pH 6,3. El pH de la solucion de premezcla se ajusto luego a 6,3 utilizando KOH. Se anadio un volumen de 120 j l de sal de Mohr 150 mM (en agua esteril) para formar la solucion madre de premezcla.
[0307] Las reacciones se llevaron a cabo pesando 20 mg del polvo de enzima DSP en un vial seguido de 1 ml de solucion madre de premezcla. La solucion se mezclo completamente y el vial se dejo abierto durante la noche (~ 24 h) a temperatura ambiente. La solucion de reaccion se agito a 1.200 rpm durante el curso de la reaccion.
[0308] Las condiciones de reaccion del "mini DSP" tienen los siguientes parametros: (a) 20 g/L de carga de sustrato; (b) 34 g/L de acido a-cetoglutarico (1,5 equivalentes de sustrato); (c) 13,6 g/L de acido ascorbico (0,5 equivalentes de sustrato); (d) 1,5 mM de sal de mohr; (e) 20 g/L de protema de preparacion de enzima DSP; (f) tampon fosfato 50 mM, pH 6,3 (pH ajustado con KOH); (f) temperatura ambiente; y (g) tiempo de reaccion de ~ 24 h. En algunas reacciones, la solucion de reaccion contema ademas un 1% (v/v) de antiespumante Y-30® (Dow Corning) y la solucion de reaccion se rocio con gas 02 a 2 l/h durante el curso de la reaccion.
[0309] Para seguir el curso de la reaccion, se tomaron muestras de 10 j l y se disolvieron en 230 j l de bicarbonato de sodio al 5% (acuoso). Luego se agrego un volumen de 160 j l de 6 mg/ml de cloruro de dansilo en MeCN a la mezcla, los tubos se mezclaron bien y luego se calentaron, se destaparon a 50°C durante 30 minutos. Las muestras se centrifugaron y el sobrenadante transparente se analizo por HPLC como se describe en el Ejemplo 2.
[0310] Las segundas condiciones de reaccion, denominadas condiciones "DSP completas", se llevaron a cabo de la siguiente manera. Se preparo una solucion madre de premezcla recien preparada para reacciones a escala de 1 ml disolviendo 240 mg de acido (2S)-piperidina-2-carboxflico (acido L-pipecolico), 228 mg de acido a-cetoglutarico y 252 mg de acido L-ascorbico en 11,88 ml de tampon fosfato 50 mM, pH 6,3. El pH de la solucion de premezcla se ajusto a 6,3 con KOH. Se anadio un volumen de 120 j l de sal de Mohr 150 mM (en agua esteril) para formar la solucion madre de premezcla.
[0311] Las reacciones se realizaron pesando 10 mg del polvo de enzima DSP y anadiendo 1 ml de solucion madre de premezcla. Despues de mezclarse, el vial se dejo abierto durante la noche (~ 24 h) a temperatura ambiente. La solucion de reaccion se agito a 1.200 rpm durante el curso de la reaccion.
[0312] Las condiciones de reaccion de "DSP completo" tienen los siguientes parametros; (a) 10 g/L de carga de sustrato; (b) 38 g/L de acido a-cetoglutarico; (c) 21 g/L de acido ascorbico; (d) sal de Mohr 1,5 mM; (e) 10 g/L de preparacion de enzima DSP; (f) tampon fosfato 50 mM, pH 6,3 (pH ajustado con KOH); (f) temperatura de reaccion de 25°C; y (g) tiempo de reaccion de ca 24 h. En algunas reacciones, la solucion de reaccion contema un 1% (v/v) de antiespumante Y-30® (Dow Corning) y la solucion de reaccion se rocio con gas O2 a 2 l/h.
[0313] Para seguir el curso de la reaccion, se retiraron muestras de 10 j l y se mezclaron con 230 j l de bicarbonato de sodio al 5% (ac). Luego se anadio a la mezcla un volumen de 160 j l de 6 mg/ml de cloruro de dansilo en MeCN.
Los tubos se mezclaron completamente y luego se calentaron, se destaparon a 50°C durante 30 minutes. Las muestras se centrifugaron y el sobrenadante transparente se analizo por HPLC como se describe en el Ejemplo 2. Ejemplo 7: Proceso para la conversion de compuestos de formula (II) en compuestos de formula (I) usando polvos DSP de polipeptidos de hidroxilasa de prolina modificados
[0314] Se examino la capacidad de las hidroxilasas de prolina modificadas para reconocer sustratos distintos de la prolina o el acido pipecolico. Las condiciones de reaccion comprendieron (a) 20 g/L de carga de sustrato; (b) 35 g/L de acido a-cetoglutarico; (c) 14 g/L de acido ascorbico; (d) sal de Mohr 1,5 mM; (e) 10 g/L de protema de preparacion de enzima DSP de la SEQ ID NO: 108; (f) tampon fosfato 50 mM, p H 6,3 (pH ajustado con KOH); (f) temperatera de reaccion de 25°C; y (g) tiempo de reaccion de ~ 24 h. Los controles negativos utilizaron preparaciones de enzimas obtenidas de celulas transformadas con un vector de expresion que no tema un gen que codificara una hidroxilasa de prolina.
Figure imgf000065_0001
[0315] Las reacciones se inactivaron diluyendo 2.000 veces en 50:50 acetonitrilo:H2O, y los productos de la reaccion se analizaron por LC/MS/MS.
[0316] El analisis de LC/MS/MS para acido pipecolico, prolina y norvalina se llevo a cabo en las siguientes condiciones:
Figure imgf000066_0001
[0317] La reaccion inactivada para el acido tetrahidroisoquinolina carboxflico se sometio a analisis de LC/MS/MS en las siguientes condiciones:
Figure imgf000066_0002
Ejemplo 8: Proceso para la conversion de acido L-pipecolico (compuesto (2)) en acido (2S, 5S)-5-hidroxipiperidina-2-carboxiMco (compuesto (1)) seguido de la etapa de proteccion con Boc
[0318] Reaccion enzimatica: una solucion de acido L-pipecolico (15 g) disuelta en 138 ml de tampon de fosfato de potasio 50 mM, pH 6,3, se cargo en una solucion premezclada que contema: (i) Preparacion de dSp del polipeptido de la SEQ. ID NO: 132 (5 g); (II) emulsion antiespumante Y-30 (5 ml); (iii) sal de Mohr (1,08 g); (iv) acido acetoglutarico (25,5 g); y (iv) acido ascorbico (10,2 g); todo disuelto en 250 ml de tampon de fosfato de potasio 50 mM, pH 6.3. La mezcla resultante se agito y se rocio con oxfgeno a una velocidad de 3 L/h y 25°C. El progreso de la reaccion enzimatica se controlo mediante HPLC utilizando el Metodo 2 del Ejemplo 3. La conversion del acido L-pipecolico a (2S, 5S)-5-hidroxi-piperidina-2-carboxflico siguio un curso de la reaccion de ~ conversion 78% en 25 h, ~ 92% de conversion en 45 h, y ~ 94% de conversion en 52 h, pero no alcanzo una mayor conversion a las 75 h. La pureza de la region del producto acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico despues de 52 h de reaccion fue de 6: 1.
[0319] Proteccion de Boc: la mezcla cruda de la reaccion enzimatica se ajusto a pH 9,5 con KOH (50% p/p), se calento a 60°C durante 1 h, y luego se enfrio a temperatura ambiente. Posteriormente, se anadio adyuvante de filtracion de Celite (15 g) con agitacion (10 minutos) y la mezcla se filtro a traves de una almohadilla de Celite 545 de 1 cm de espesor. La torta del filtro se lavo con agua (60 ml) y el filtrado se cargo con NaOH. (38,5 ml a 10 M) y

Claims (19)

REIVINDICACIONES
1. Un polipeptido disenado que tiene actividad de prolina hidroxilasa, que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia con la SEQ ID NO: 2 en la que la prolina hidroxilasa tiene al menos 1,2 veces mayor actividad en comparacion con el polipeptido de la SEQ ID NO: 2 y en el que la secuencia de aminoacidos comprende una diferencia de residuos en comparacion con la secuencia de la SEQ ID NO: 2 en la posicion del residuo X166.
2. El polipeptido disenado segun la reivindicacion 1:
(i) en el que las diferencias de residuos en las posiciones de residuos X166 se seleccionan de X166Q; X166L; X166T y/o
(ii) que comprenden ademas una o mas diferencias de residuos en comparacion con la secuencia de la SEQ ID NO: 2 en las posiciones de residuos; X2; X3; X4; X5; X9; X13; X25; X26; X29; X30; X36; X42; X52; X57; X58; X59; X66; X86; X92; X95; X103; X112; X113; X115; X116; X121; X131; X150; X151; X225; X230; X270; y X271.
3. El polipeptido disenado segun la reivindicacion 2, en el que las diferencias de residuos en las posiciones de residuos X2; X3; X4; X5; X9; X13; X25; X26; X29; X30; X36; X42; X52, X57; X58; X59; X66; X92; X95; X103; X112; X115; X116; X121; X131; X150; X151; X225; X230; y X271 se seleccionan de X2K; X2T; X3S; X4Q; X4L; X4E; X4S; X5I; X5L; X5M; X9I; X13T; X25R; X26T; X29A; X30V; X30P; X36T; X42E; X52P; X57T; X57A; X58A; X59G; X66Q; X86S; X92V; X95M; X103L; X103Q; X112T; X112V; X113E, X115E; X115H; X115D; X115G; X115S; X115A; X116L; X121F; X131Y; X131F; X150S; X151S; X225L; X225Y; X225W; X230V; X270E; X271K; y X271R.
4. El polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en el que la secuencia de aminoacidos comprende al menos una combinacion de caractensticas seleccionadas de:
(a) X103L y X166Q;
(b) X52P y X255Y;
(c) X4E/L/S y X115A;
(d) X25R y X58A;
(e) X29A y X166T/Q/L;
(f) X115H/D/G y X121F;
(g) X3S, X103L y X166Q;
(h) X103L, X131Y/F, y X166T/Q/L;
(i) X26T, X103L y X166T/Q/L;
(j) X25R, X66Q, X92V y X115E;
(k) X25R, X66Q, X92V, X103L, X115E y X166Q; y
(l) X3S, X25R, X66Q, X92V, X103L, X115E y X166Q.
5. El polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 4, que comprende ademas una o mas diferencias de residuos en comparacion con la secuencia de la SEQ ID NO: 2 en las posiciones de residuos seleccionadas de: X17, X24, X26, X62, X88, X98, X114, X140, X151, X186, X188 y X205.
6. El polipeptido disenado segun la reivindicacion 5, en el que las diferencias de residuos en las posiciones de residuos X17, X24, X26, X62, X88, X114, X140, X151, X186, X188 y X205 se seleccionan entre X17V, X24R, X24S, X26R, X26W, X62Q, X88R, X98F, X98T, X114N, X140L, X151A, X151H, X186G, X188G y X205V.
7. El polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 6, que es capaz de convertir el compuesto de sustrato (2), acido (2S)-piperidina-2-carboxflico,
Figure imgf000250_0001
al producto compuesto (1), acido (2S, 5S)-5-hidroxipiperidina-2-carboxflico,
Figure imgf000251_0001
bajo condiciones de reaccion adecuadas.
8. El polipeptido disenado segun la reivindicacion 7, en el que el polipeptido es capaz de convertir el compuesto de sustrato (2) en el compuesto del producto (1) con al menos 2 veces la actividad de la SEQ ID NO: 2.
9. El polipeptido disenado segun la reivindicacion 8, en el que la secuencia de aminoacidos comprende una o mas caractensticas seleccionadas de: X3S; X4Q; X4L; X5I; X5L; X24S; X25R; X30P; X66Q; X86S; X92V; X103L; X103Q; X113E; X115E; X150S; X166Q; X151S; X225L; y X270E.
10. El polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 9, que es capaz de:
i) convertir el compuesto de sustrato (2) en el compuesto de producto (1) en exceso del producto compuesto (1a), acido (2S, 3R)-3-hidroxipiperidina-2-carboxflico,
Figure imgf000251_0002
en donde la secuencia de aminoacidos comprende una o mas caractensticas seleccionadas de: X103L; X115E; X131Y y X166Q; o
ii) compuesto de producto formador (1),
Figure imgf000251_0003
en exceso diastereomerico del producto compuesto (1R), acido (2S, 5R)-5-hidroxipiperidina-2-carboxflico,
Figure imgf000251_0004
11. El polipeptido disenado segun la reivindicacion 1 que tiene actividad de prolina hidroxilasa en la que la secuencia de aminoacidos comprende una secuencia seleccionada del grupo que consiste en la SEQ ID NO: 24, 20, 22, 100, 104, 106, 108, 110, 112, , 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164 , 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214,216, 218, 220, 222, 224, 226 y 228.
12. Un polinucleotido que codifica el polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 11.
13. Un polinucleotido que codifica el polipeptido de la reivindicacion 1-11 que incluye una secuencia de acido nucleico optimizada para la expresion en E. coli.
14. Un vector de expresion que comprende el polinucleotido de la reivindicacion 12 o 13.
15. Una celula huesped que comprende el polinucleotido de la reivindicacion 12 o 13.
16. Un metodo para preparar el polipeptido modificado de una cualquiera de las reivindicaciones 1 a 11, que comprende cultivar la celula huesped de la reivindicacion 15 en condiciones adecuadas para la expresion del polipeptido.
17. Un proceso para preparar un producto compuesto de formula (la),
Figure imgf000252_0001
en donde
Q se selecciona del grupo que consiste en un alquileno (C1-C5) y alquenileno (C2-C5);
L se selecciona del grupo que consiste en un enlace, alquileno (C1-C4) y alquenileno (C2-C4);
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C-i-Ca), ariloxi, alquiltio (C-i-Ca) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
R5 es hidrogeno, o un enlace directo a un atomo de carbono de L para formar un epoxido;
cada aparicion de Ra se selecciona del grupo que consiste en halo, alquilo (C1-Ca) y alquiloxi (C1-Ca); y q es un numero entero de 0 a 4;
en donde la suma de los atomos de carbono del anillo para Q L es un numero entero de 2 a 5;
con la condicion de que
(i) cuando la suma de los atomos de carbono del anillo para Q L es 2, entonces L es un metileno; y (ii) cuando la suma de los atomos de carbono del anillo para Q L es 3, entonces L es un enlace o etileno; el proceso que comprende poner en contacto el compuesto de sustrato de formula (lla),
Figure imgf000252_0002
en donde L, Q, R1, R2, Ra y q son como se definieron anteriormente para el compuesto de formula (la); y ----representa un enlace opcional a un atomo de carbono de L para formar un doble enlace;
con un polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 11, en presencia de un co-sustrato en condiciones de reaccion adecuadas.
18. El proceso de la reivindicacion 17 en el que:
i) el compuesto de formula (la) comprende el compuesto de formula (lb),
Figure imgf000253_0001
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (CrCa), ariloxi, alquiltio (CrCa) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (Ci-Ca) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
cada aparicion de Ra se selecciona independientemente del grupo que consiste en halo, alquilo (Ci-Ca) y alquiloxi (Ci-Ca); y
k es un numero entero de 1 a 5;
r es un numero entero de 0 a 4;
en donde k r es 3, 4 o 5; y
q es un numero entero de 0 a 4;
con la condicion de que cuando k r es 3, entonces k es 1 o 3;
el proceso que comprende poner en contacto el compuesto de sustrato de formula (IIb),
Figure imgf000253_0002
en la que R1, R2, Ra, k, r y q son como se definieron anteriormente para el compuesto de formula (Ib), con un polipeptido disenado de una cualquiera de las reivindicaciones 1 a 11 en presencia de un co-sustrato en condiciones de reaccion adecuadas;
ii) el compuesto de formula (la) comprende el compuesto de formula (Ic),
Figure imgf000253_0003
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-Ca), ariloxi, alquiltio (CrCa) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (CrCa) opcionalmente sustituido, alquenilo (C2-Ca) y alquinilo (C2-Ca);
cada aparicion de Ra se selecciona independientemente del grupo que consiste en hidrogeno, halo, alquilo (C1-Ca) y alquiloxi (CrCa); y
q es un numero entero de 0 a 4;
que comprende poner en contacto el compuesto de sustrato de formula (IIc),
Figure imgf000254_0001
en donde
R1, R2, R6 y q son como se definieron anteriormente para el compuesto de formula (Ic),
con un polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 11 en presencia de un co-sustrato en condiciones de reaccion adecuadas;
iii) el compuesto de formula (la) comprende el compuesto de formula (le),
Figure imgf000254_0002
en donde
R1 se selecciona del grupo que consiste en hidroxi, amino, alquiloxi (C1-C6), ariloxi, alquiltio (C1-C6) y ariltio; R2 se selecciona del grupo que consiste en hidrogeno y alquilo (C1-C6) opcionalmente sustituido, alquenilo (C2-C6) y alquinilo (C2-C6);
cada aparicion de R6 se selecciona independientemente del grupo que consiste en hidrogeno, halo, alquilo (C1-C6) y alquiloxi (C1-C6); y
q es un numero entero de 0 a 3;
el proceso que comprende poner en contacto el compuesto de sustrato de formula (lie),
Figure imgf000254_0003
en donde
R1, R2, R6 y q son los definidos para el compuesto de formula (le);
con un polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 11 en presencia de un co-sustrato en condiciones de reaccion adecuadas; o
iv) el compuesto de formula (la) comprende el compuesto (5),
Figure imgf000254_0004
el proceso que comprende poner en contacto el compuesto de sustrato (6),
Figure imgf000255_0001
con un polipeptido disenado de acuerdo con una cualquiera de las reivindicaciones 1 a 11, en presencia de un co-sustrato en condiciones de reaccion adecuadas.
19. El proceso de cualquiera de las reivindicaciones 17 y 18 en el que:
i) el co-sustrato comprende acido a-cetoglutarico, opcionalmente a una concentracion equimolar o superior a la de la concentracion del compuesto de sustrato;
ii) las condiciones de reaccion comprenden Fe+2, opcionalmente en el que el Fe+2 esta en forma de (NH4)2(FeSO4)2;
iii) las condiciones de reaccion comprenden un reductor capaz de reducir Fe+3 a Fe+2, opcionalmente en el que el reductor comprende acido ascorbico presente en al menos aproximadamente 0,1 veces, 0,2 veces, 0,3 veces, 0,5 veces, 0,75 veces, 1 vez, 1,5 veces, o al menos 2 veces la concentracion molar del compuesto de sustrato; iv) las condiciones de reaccion comprenden O2, opcionalmente en el que el O2 se proporciona por aireacion forzada; o
v) las condiciones de reaccion adecuadas comprenden (a) carga de sustrato de aproximadamente 10 g/L a 100 g/L; (b) de aproximadamente 1 g/l a aproximadamente 50 g/l de polipeptido disenado; (c) a-cetoglutarato en aproximadamente 1 a 2 equivalentes molares de compuesto de sustrato; (d) acido ascorbico en aproximadamente 0,25 a 0,75 equivalentes molares de compuesto de sustrato; (e) de aproximadamente 0,5 mM a aproximadamente 12 mM de FeSO4; (f) pH de aproximadamente 6 a 8; (g) temperatura de aproximadamente 20° a 40°C; y (h) tiempo de reaccion de 6 a 120 h.
ES13788385T 2012-05-08 2013-05-07 Biocatalizadores y métodos para la hidroxilación de compuestos químicos Active ES2712682T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261644135P 2012-05-08 2012-05-08
PCT/US2013/039874 WO2013169725A2 (en) 2012-05-08 2013-05-07 Biocatalysts and methods for hydroxylation of chemical compounds

Publications (1)

Publication Number Publication Date
ES2712682T3 true ES2712682T3 (es) 2019-05-14

Family

ID=49551430

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13788385T Active ES2712682T3 (es) 2012-05-08 2013-05-07 Biocatalizadores y métodos para la hidroxilación de compuestos químicos

Country Status (8)

Country Link
US (6) US9790527B2 (es)
EP (1) EP2847327B1 (es)
CN (2) CN107699548B (es)
DK (1) DK2847327T3 (es)
ES (1) ES2712682T3 (es)
HU (1) HUE042605T2 (es)
SG (1) SG11201407295YA (es)
WO (1) WO2013169725A2 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9790527B2 (en) 2012-05-08 2017-10-17 Codexis, Inc. Engineered proline hydroxylase polypeptides
WO2015098774A1 (ja) * 2013-12-26 2015-07-02 株式会社カネカ 光学活性環状イミノ酸の製造方法
JP6687238B2 (ja) * 2013-12-27 2020-04-22 株式会社エーピーアイ コーポレーション 5−ヒドロキシピペリジン−2−カルボン酸の製造方法
ES2773889T3 (es) * 2014-01-31 2020-07-15 Api Corp Hidroxilasa en la posición 4 de ácido pipecolínico y método para producir 4-hidroxiaminoácido usando la misma
JP6724285B2 (ja) 2014-11-12 2020-07-15 株式会社エーピーアイ コーポレーション シス−5−ヒドロキシ−l−ピペコリン酸の製造方法
CN107304430B (zh) * 2016-04-19 2020-10-27 中国科学院微生物研究所 用于制备反式-4-羟基-l-脯氨酸的dna分子和方法
CN109715817B (zh) * 2016-06-09 2022-12-09 科德克希思公司 用于化合物的羟基化的生物催化剂和方法
WO2018082030A1 (zh) 2016-11-04 2018-05-11 凯莱英医药集团(天津)股份有限公司 脯氨酸羟化酶及其应用
CN106834244B (zh) * 2016-11-04 2021-07-06 凯莱英医药集团(天津)股份有限公司 脯氨酸羟化酶及其应用
CN111373033A (zh) * 2017-11-23 2020-07-03 豪夫迈·罗氏有限公司 脯氨酸羟化酶及其相关用途、方法和产品
US20230002744A1 (en) * 2019-11-26 2023-01-05 Codexis, Inc. Biocatalysts and methods for hydroxylation of chemical compounds
CN113499732B (zh) * 2021-07-09 2022-07-26 山东科技大学 一种压裂液及其制备方法和应用

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05130883A (ja) 1991-11-13 1993-05-28 Kyowa Hakko Kogyo Co Ltd トランス−l−ヒドロキシプロリンの製造法
KR100356926B1 (ko) 1993-09-07 2003-01-10 교와 핫꼬 고교 가부시끼가이샤 트랜스-4-히드록시-l-프롤린의제조법
US5962292A (en) 1993-09-07 1999-10-05 Kyowa Hakko Kogyo Co., Ltd. Process for producing cis-3-hydroxy-L-proline
US5854040A (en) 1993-09-07 1998-12-29 Kyowa Hakko Kogyo Co., Ltd. Process for producing trans-4-hydroxy-L-proline
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
WO1995033836A1 (en) 1994-06-03 1995-12-14 Novo Nordisk Biotech, Inc. Phosphonyldipeptides useful in the treatment of cardiovascular diseases
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
KR0160191B1 (ko) 1995-08-12 1999-01-15 김광호 역광보정방법 및 그 장치
KR20010032861A (ko) 1997-12-08 2001-04-25 캘리포니아 인스티튜트 오브 테크놀로지 폴리뉴클레오티드 및 폴리펩티드 서열을 형성하는 방법
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1272967A2 (en) 2000-03-30 2003-01-08 Maxygen, Inc. In silico cross-over site selection
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
JP2007502124A (ja) 2003-08-11 2007-02-08 コデクシス, インコーポレイテッド 改良ケトレダクターゼポリペプチドおよび関連ポリヌクレオチド
US20090118130A1 (en) 2007-02-12 2009-05-07 Codexis, Inc. Structure-activity relationships
DK2231667T3 (da) 2008-01-18 2013-12-16 Merck Sharp & Dohme Beta-lactamase-hæmmere
FR2930553B1 (fr) 2008-04-29 2010-05-21 Novexel Composes azabicycliques, leur preparation et leur utilisation comme medicaments, notamment inhibiteurs de beta-lactamases
US8541209B2 (en) * 2008-05-12 2013-09-24 Kyowa Hakko Bio Co., Ltd. L-proline cis-4-hydroxylase and use thereof to produce cis-4-hydroxy-L-proline
WO2009139635A1 (en) 2008-05-15 2009-11-19 Prosensa Technologies B.V. Polymyxin derivatives and uses thereof
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
CN102186972B (zh) * 2008-08-29 2014-08-20 科德克希思公司 用于立体选择性生产(4s)-3-[(5s)-5-(4-氟苯基)-5-羟基戊酰基]-4-苯基-1,3-噁唑烷-2-酮的酮还原酶多肽
WO2010126820A2 (en) 2009-04-30 2010-11-04 Merck Sharp & Dohme Corp. Preparation of alkyl esters of n-protected oxo-azacycloalkylcarboxylic acids
US9790527B2 (en) * 2012-05-08 2017-10-17 Codexis, Inc. Engineered proline hydroxylase polypeptides

Also Published As

Publication number Publication date
US20150118719A1 (en) 2015-04-30
CN107699548A (zh) 2018-02-16
CN104428412B (zh) 2017-09-08
WO2013169725A2 (en) 2013-11-14
EP2847327A2 (en) 2015-03-18
US20200325510A1 (en) 2020-10-15
CN107699548B (zh) 2021-10-22
US10995349B2 (en) 2021-05-04
EP2847327A4 (en) 2015-11-18
CN104428412A (zh) 2015-03-18
US11549132B2 (en) 2023-01-10
US9790527B2 (en) 2017-10-17
US20190323046A1 (en) 2019-10-24
US20230227875A1 (en) 2023-07-20
US20210230654A1 (en) 2021-07-29
US10731189B2 (en) 2020-08-04
EP2847327B1 (en) 2018-12-26
HUE042605T2 (hu) 2019-07-29
US10370688B2 (en) 2019-08-06
DK2847327T3 (en) 2019-03-11
US20170121744A1 (en) 2017-05-04
SG11201407295YA (en) 2014-12-30
WO2013169725A3 (en) 2014-03-06

Similar Documents

Publication Publication Date Title
ES2712682T3 (es) Biocatalizadores y métodos para la hidroxilación de compuestos químicos
US11634695B2 (en) Vectors for expression of biocatalysts
US11987818B2 (en) Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
JP2016536990A (ja) ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法
JP2016536990A5 (es)
WO2021108209A1 (en) Biocatalysts and methods for hydroxylation of chemical compounds
WO2023173058A2 (en) Engineered monoamine oxidases for the preparation of stereomerically pure fused bicyclic proline compounds