ES2694327T3 - Polipéptidos de transaminasa modificados por biocatálisis industrial - Google Patents

Polipéptidos de transaminasa modificados por biocatálisis industrial Download PDF

Info

Publication number
ES2694327T3
ES2694327T3 ES14757245.7T ES14757245T ES2694327T3 ES 2694327 T3 ES2694327 T3 ES 2694327T3 ES 14757245 T ES14757245 T ES 14757245T ES 2694327 T3 ES2694327 T3 ES 2694327T3
Authority
ES
Spain
Prior art keywords
compound
sequence
polypeptide
seq
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14757245.7T
Other languages
English (en)
Inventor
Martina QUINTANAR-AUDELO
Ellen Eberhard
Jovana Nazor
Derek Smith
Cuixia Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Application granted granted Critical
Publication of ES2694327T3 publication Critical patent/ES2694327T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D487/00Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, not provided for by groups C07D451/00 - C07D477/00
    • C07D487/02Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, not provided for by groups C07D451/00 - C07D477/00 in which the condensed system contains two hetero rings
    • C07D487/04Ortho-condensed systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/182Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Nitrogen Condensed Heterocyclic Rings (AREA)
  • Application Of Or Painting With Fluid Materials (AREA)

Abstract

Un polipéptido modificado que tiene actividad transaminasa que comprende una secuencia de aminoácidos que tiene al menos un 80% de identidad de secuencia con la secuencia de referencia de la SEQ ID NO: 2 y diferencias de residuos de aminoácidos en comparación con la SEQ ID NO: 2 de X155T/I/V/K/A/L y X42A/G.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Polipeptidos de transaminasa modificados por biocatalisis industrial 1. CAMPO TECNICO
[0001] La descripcion se refiere a polipeptidos de transaminasa modificados utiles en condiciones de procesos industrials para la produccion de compuestos de amina qmmica farmaceutica y finas.
3. ANTECEDENTES
[0002] Las transaminasas (E.C. 2.6.1) catalizan la transferencia de un grupo amino, un par de electrones y un proton de un compuesto donador de amino al grupo ceto de un compuesto aceptor de amino. Las reacciones con transaminasas pueden dar como resultado la formacion de un compuesto de producto de amina quiral. Como se muestra en el Esquema 1, un compuesto aceptor de amino (B) (que es el precursor de sustrato ceto de un producto de amina quiral (D) deseado) se hace reaccionar con un compuesto donador de amino (A) en presencia de una transaminasa. La transaminasa cataliza la transferencia del grupo amino primario del compuesto donador de amino (A) al grupo ceto del compuesto aceptor de amino (B). La reaccion de la transaminasa da como resultado un compuesto de producto de amina quiral (D) (suponiendo que R1 no es lo mismo que R2) y un nuevo compuesto de subproducto (C) de subproducto amino aceptor (o "subproducto de carbonilo") que tiene un grupo ceto.
Esquema 1
NH2 O 0 nh2
imagen1
(A) (B) (C) (D)
[0003] Los compuestos de amina quirales se utilizan con frecuencia en las industrias farmaceutica, agroqmmica y qmmicas como productos intermedios o sintones para la preparacion de amplia gama de compuestos comercialmente deseadas, tales como derivados de cefalosporina o pirrolidina. Tfpicamente, estas aplicaciones industriales de compuestos de aminas quirales implican el uso de una sola forma estereomerica particular de la molecula, por ejemplo, solo el enantiomero (R) o(s) es fisiologicamente activo. Las transaminasas son altamente estereoselectivas y tienen muchos usos industriales potenciales para la smtesis de compuestos de aminas quirales opticamente puros.
[0004] Los ejemplos de los usos de las transaminasas para hacer compuestos de amina quiral incluyen: el enriquecimiento enantiomerico de aminoacidos (vease, por ejemplo, Shin et al., 2001, Biosci. Biotechnol. Biochem. 65: 1782-1788; Iwasaki et al., 2003, Biotech. Lett. 25: 1843-1846; Iwasaki et al., 2004, Appl. Microb. Biotech. 69: 499-505, Yun et al., 2004, Appl. Environ. Microbiol. 70: 2529-2534; y Hwang et al., 2004, Enzyme Microbiol. Technol. 34: 429-426); la preparacion de intermedios y precursores de pregabalina (por ejemplo, WO 2008/127646); la transaminacion enzimatica de los analogos de ciclopamina (p. ej., WO 2011/017551); la smtesis estereoespedfica y el enriquecimiento enantiomerico de p-aminoacidos (p.ej., documento WO 2005/005633); el enriquecimiento enantiomerico de aminas (por ejemplo, la Patente de Ee.UU. N° 4.950.606; Patente de EE.UU. N° 5.300.437; y Patente de EE.UU. N° 5.169.780); la produccion de aminoacidos y derivados (por ejemplo, la Patente de EE.UU. N° 5.316.943; Patente de EE.UU. N° 4.518.692; Patente de EE.UU. N° 4.826.766; Patente de EE.UU. N° 6.197.558; y Patente de EE.UU. N° 4.600.692); y en la produccion de los compuestos farmaceuticos, sitagliptina, rivastigmina y vemakalant (Vease, por ejemplo, la Patente de EE.UU. N° 8.293.507 B2, publicada el 23 de octubre de 2012; Savile, et al., 2010, "Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin man- ufacture," Science 329 (5989): 305-9; WO2011/159910, publicada el 22 de diciembre de 2011; y WO2012/024104, publicada el 23 de febrero de 2012).
[0005] Transaminasas de tipo salvaje que tienen la capacidad de catalizar una reaccion del Esquema 1 han sido aisladas de diversos microorganismos, incluyendo, pero no limitado a, Alcaligenes denitrificans, Bordetella bronchiseptica, Bordetella parapertussis, Brucella melitensis, Burkholderia malle, Burkholderia pseudomallei, Chromobacterium violaceum, Oceanicola granulosus HTCC2516, Oceanobacter sp. RED65, Oceanospirillum sp. MED92, Pseudomonas putida, Ralstonia solanacearum, Rhizobium meliloti, Rhizobium sp. (cepa NGR234), Bacillus thuringensis, Klebsiella pneumonia, Vibrio fluvialis (vease, por ejemplo, Shin et al., 2001, Biosci. Biotechnol, Biochem. 65: 1782-1788), y Arthrobacter sp. KNK168 (Vease, por ejemplo, Iwasaki et al., Appl. Microbiol. Biotechnol., 2006, 69: 499-505, Patente de EE.UU. N° 7.169.592). Varios de estos genes de transaminasas de tipo salvaje y polipeptidos codificados han sido secuenciados, incluyendo, por ejemplo, Ralstonia solanacearum (Genbank Acc. YP_002257813.1, GI: 207739420), Burkholderia pseudomallei 1710b (Genbank Acc. N° ABA47738.1, GI: 76578263), Bordetella petrii (Genbank Acc. AM902716.1, GI: 163258032), Vibrio fluvialis JS17 (Genbank Acc. AEA39183.1, GI: 327207066), y Arthrobacter sp. KNK168 (GenBank Acc. BAK39753.1, GI: 336088341). Al menos
5
10
15
20
25
30
35
40
45
50
55
60
65
dos transaminasas de tipo salvaje de las clases EC 2.6.1.18 y EC 2.6.1-19, han sido cristalizadas y caracterizadas estructuralmente (vease, por ejemplo, Yonaha et al., 1983, Agric. Biol. Chem. 47 (10): 2257-2265).
[0006] Se conocen transaminasas que tienen (R)-selectivo o (S)-selectivo estereoselectivamente. Por ejemplo, la transaminasa de tipo salvaje de Arthrobacter sp. KNK168 se considera (R)-selectiva y produce principalmente compuestos de (R)-amina a partir de ciertos sustratos (Vease, por ejemplo, Iwasaki y otros, Appl. Microbiol. Biotechnol., 2006, 69: 499-505, Patente de EE.UU. N° 7,169,592), mientras que la transaminasa de tipo salvaje de Vibrio fluvialis JS17 se considera (S)-selectiva y produce principalmente compuestos de (S)-amina a partir de ciertos sustratos (vease, por ejemplo, Shin et al., "Purification, characterization, and molecular cloning of a novel amine:pyruvate transaminase from Vibrio fluvialis JS17," Appl. Microbiol. Biotechnol. 61 (5-6), 463-471 (2003)).
[0007] Transaminasas de origen no natural que tienen (R)-selectividad, mayor estabilidad disolvente y termica, y otras propiedades mejoradas para la conversion de una amplia gama de sustratos aceptores amino, se han generado por genesis mutatis y/o evolucion dirigida de secuencias del esqueleto de la transaminasa de tipo salvaje y otras de ingeniena (vease, por ejemplo, la Patente de EE.UU. N° 8.293.507 B2, publicada el 23 de octubre de 2012; WO2011/005477A1, publicada el 13 de enero de 2011; WO2012/024104, publicada el 23 de febrero de 2012; y Savile, et al., 2010, "Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin manufacture," Science 329 (5989): 305-9).
[0008] Sin embargo, las transaminasas generalmente tienen propiedades que son indeseables para su aplicacion comercial en el preparacion de compuestos de amina quiral, tal como la inestabilidad de las condiciones de proceso industrialmente utiles (por ejemplo, disolvente, temperatura), pobre reconocimiento de, y estereoselectividad para, sustratos comercialmente utiles de aceptor de amino y/o donadores de amino, y bajos rendimientos de producto debido al equilibrio de reaccion desfavorable. Por lo tanto, existe la necesidad de transaminasas modificadas mediante ingeniena genetica que puedan usarse en procesos industriales para preparar compuestos de aminas quirales en una forma opticamente activa.
[0009] El documento US 2012/0329108 se refiere a polipeptidos que tienen actividad transaminasa, polinucleotidos que codifican los polipeptidos y metodos de uso de los polipeptidos.
4. RESUMEN
[0010] La presente invencion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos 80% de identidad de secuencia para hacer referencia a la secuencia de la SEQ ID NO:2 y diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO:2 de X155T/I/V/K/A/L y X42A/G.
[0011] La presente invencion tambien proporciona un procedimiento para preparar un compuesto de formula estructural (I):
imagen2
tener la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico de al menos 70% sobre el enantiomero opuesto, en donde
Z es OR2 o NR2R3;
R1 es alquilo C1-8, arilo, heteroarilo, arilo-C-i-2 alquilo, heteroarilo-C1-2 alquilo o un sistema de anillo heterodclico de 5 a 6 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S, y N, el anillo heterodclico no sustituido o sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco fluoros;
R2 y R3 son cada uno independientemente hidrogeno, C1-8 alquilo, arilo o arilo-C-i-2 alquilo; o R2 y R3 junto con el atomo de nitrogeno al que estan unidos forman un sistema de anillo heterodclico de 4 a 7 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco atomos de fluor; y el sistema de anillo heterodclico se fusiona opcionalmente con un sistema de anillo
5
10
15
20
25
30
35
40
45
50
55
60
65
carbodclico aromatico saturado o aromatico de 5 a 6 miembros o un sistema de anillo heterodclico aromatico saturado o aromatico de 5 a 6 miembros que contiene uno a dos heteroatomos seleccionados de O, S y N, el sistema de anillo condensado no sustituido o sustituido con uno a dos sustituyentes seleccionados de hidroxi, amino, fluor, C1-4 alquilo, C1-4 alcoxi, y trifluorometilo; el proceso comprende la etapa de poner en contacto un compuesto de Formula estructural (II):
imagen3
con un polipeptido modificado de la invencion en presencia de un donante de grupo amino en un disolvente organico adecuado en condiciones de reaccion adecuadas.
[0012] La presente invencion tambien proporciona un procedimiento para preparar un compuesto de formula estructural (la):
imagen4
tener la (R)-configuracion en el centro estereogenico marcado con un ***; en un exceso enantiomerico de al menos 70% sobre el enantiomero que tiene la (S)-configuracion opuesta; en donde,
Ar es fenilo que esta sin sustituir o sustituido con uno a cinco sustituyentes seleccionados independientemente del grupo que consiste en fluor, trifluorometilo y trifluorometoxi; y
R4 es hidrogeno o C1-4 alquilo no sustituido o sustituido con uno a cinco fluoros; El proceso que comprende el paso de:
poner en contacto una cetona proquiral de formula estructural (lla):
imagen5
con un polipeptido modificado de la invencion, en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
La presente invencion tambien proporciona un proceso de preparacion del compuesto (1)
imagen6
5
10
15
20
25
30
35
40
45
50
55
60
65
que comprende una etapa de contacto con un sustrato del compuesto (2)
imagen7
con un polipeptido modificado de la invencion, en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0013] La presente divulgacion proporciona polipeptidos modificados que tienen actividad transaminasa, polinucleotidos que codifica los polipeptidos, los metodos de la fabricacion de los polipeptidos, y metodos de uso de los polipeptidos para la conversion biocatalttica de compuestos de sustrato de aceptor amino (es decir, grupo ceto que contiene compuestos) a compuestos de productos de aminas quirales. Los polipeptidos de transaminasas de la presente divulgacion se han disenado para tener una o mas diferencias de residuos en comparacion con un polipeptido de transaminasas previamente disenado (de la secuencia de aminoacidos SEQ ID NO:2) y una estabilidad termica y solvente asociada en relacion con los polipeptidos de transaminasas previamente disenados (Vease, por ejemplo, el documento US 8.293.507 B2, publicado el 23 de octubre de 2012; la publicacion PCT WO2011005477A1, publicada el 13 de enero de 2011, y la publicacion PCT WO2012024104, publicada el 23 de febrero de 2012). Las diferencias de residuos de amino se ubican en las posiciones de los residuos que dan como resultado la mejora de varias propiedades enzimaticas, entre ellas, la actividad, la estereoselectividad, la estabilidad, la expresion y la tolerancia del producto.
[0014] En particular, los polipeptidos de transaminasa modificados de la presente descripcion han sido disenados para la conversion eficiente del sustrato, 4-oxo-4-[3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]- 1-(2,4,5-trifluorofenilo)butano-2-ona (referido aqrn como "compuesto (2)”) a su correspondiente compuesto de producto de amina quiral, (2R)-4-oxo-4-[3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]-1-(2,4,5- trifluorofenilo)butano-2-amina (referido aqrn como "compuesto (1)”) como se muestra en el Esquema 2.
Esquema 2
F F
imagen8
[0015] El Compuesto (1), tambien conocido con el nombre de "sitagliptina", es el ingrediente activo de JANUVIA®, un producto farmaceutico que ha recibido aprobacion de comercializacion en los EE.UU. y otros pafses para el tratamiento de la diabetes tipo 2.
[0016] Las caractensticas estructurales evolucionadas de los polipeptidos de transaminasa modificados de la presente descripcion, sin embargo, tambien permiten la conversion biocatalftica de una gama de compuestos de sustrato cetona de formula (II) (incluyendo compuestos distintos de compuesto (2)) a sus correspondientes compuestos de productos de aminas quirales de Formula (I) (incluidos los compuestos distintos del compuesto (1)) como se muestra en el Esquema 3,
Esquema 3
imagen9
5
10
15
20
25
30
35
40
45
50
55
60
65
en donde
Z es O o NR2R3;
R1 es C1-8 alquilo, arilo, heteroarilo, arilo-Ci-2 alquilo, heteroarilo-Ci-2 alquilo o un sistema de anillo heterodclico de 5 a 6 miembros que opcionalmente contiene un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no sustituido o sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco fluoros;
R2 y R3 son cada uno independientemente hidrogeno, C1-8 alquilo, arilo o arilo-C1-2 alquilo; o R2 y R3 junto con el atomo de nitrogeno al que estan unidos forman un sistema de anillo heterodclico de 4 a 7 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco atomos de fluor; y el sistema de anillo heterodclico se fusiona opcionalmente con un sistema de anillo carbodclico aromatico saturado o aromatico de 5 a 6 miembros o un sistema de anillo heterodclico aromatico saturado o aromatico de 5 a 6 miembros que contiene uno a dos heteroatomos seleccionados de O, S y N, el sistema de anillo condensado no sustituido o sustituido con uno a dos sustituyentes seleccionados de hidroxi, amino, fluor, C1-4 alquilo, C1-4 alcoxi y trifluorometilo.
[0017] En algunas realizaciones, el polipeptido de transaminasa modificado son capaces de la conversion biocatalftica de compuestos de formula (II) en compuestos de Formula (I) que tienen la configuracion estereoqrnmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico de al menos 70% sobre el enantiomero opuesto.
[0018] En algunas realizaciones, la presente descripcion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos 80% de identidad de secuencia para hacer referencia a la secuencia de la SEQ ID NO:2 y (a) una diferencia de residuo de aminoacido en comparacion con SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X152A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0019] En algunas realizaciones de los polipeptidos modificados que tienen actividad transaminasa de la presente descripcion, la secuencia de aminoacidos puede comprender ademas una o mas diferencias de residuos en comparacion con SEQ ID NO:2 seleccionados de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241R, X267V, X270T, X273H, X325M y X328I.
[0020] En algunas realizaciones, la presente descripcion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos 80% de identidad de secuencia para hacer referencia a la secuencia de la SEQ ID NO:2 y (a) una diferencia de residuo de aminoacido en comparacion con la SEQ ID NO:2 seleccionada de G36C, I41C, I41F, I41K, I41M, I41N, I41R, E42G, P48D, P48G,
5
10
15
20
25
30
35
40
45
50
55
60
65
P48K, P48T, A51K, S54P, M122F, M122Q, Y148Q, C152T, Q155A, Q155T, Q155V, C215H, C215L, Y273H, L325M y A241R; o (b) una combinacion de diferencias de residuos seleccionadas de: A5K, E42G, S49T, S54P, C152S, Q155T y W156Q; P33L, I41C, E42G, S54P, S150F, C152S, Q155K, F160P y C215G; P33L, I41K, E42G, S54P, S150F, C152S, Q155I, F160P y C215L; P33L, E42G, P48G, S54P, S150F, C152S, Q155T y C215H; P33L, E42G, S54P, A109S, S150F, C152S, Q155K, W156Q y C215H; P33L, E42G, S54P, E117G, S150F, C152S, Q155I, W156Q y C215G; P33L, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G; P33L, E42G, S54P, S150F, C152S, Q155K, W156Q y C215H; P33L, E42G, S54P, S150F, C152S, Q155L, W156Q y C215H; P33L, E42G, S54P, S150F, C152S, Q155L, W156Q, C215H y A241R; G36C, E42G, P48G, S54P, S150F, C152S, Q155I. y C215H; G36C, E42G, P48K, S54P, S150F, C152S, Q155T y C215H; G36C, E42G, S54P, S150F, C152S, Q155I, C215H y A241R; G36C, E42G, S54P, S150F, C152S, Q155K, C215H y A241R; G36C, E42G, S54P, S150F, C152S, Q155T y A241R; G36C, E42G, S54P, S150F, C152S, Q155V y C215H; I41C, E42G, S49T, S54P, S150F, C152S, Q155I, F160P, C215G y I267V; I41C, E42G, S49T, S54P, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S y Q155K; I41C, E42G, S54P, I108V, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S, Q155T, W156Q y C215G; I41C, E42G, S54P, E117G, S150F, C152S, Q155K y F160P; I41C, E42G, S54P, E117G, S150F, C152S, Q155K y C215L; I41C, E42G, S54P, E117G, S150F, C152S, Q155L y C215L; I41C, E42G, S54P, S150F, C152S, Q155I y C215G; I41C, E42G, S54P, S150F, C152S, Q155I y C215L; I41C, E42G, S54P, S150F, C152S, Q155K, W156Q, C215G y 1267V; I41C, E42G, S54P, S150F, C152S, Q155K y C215L; I41C, E42G, S54P, S150F, C152S, Q155K y C215G; I41C, E42G, S54P, S150F, C152S, Q155L, F160P, C215G e I267V; I41C, E42G, S54P, S150F, C152S, Q155T, W156Q, F160P y C215L; I41C, E42G, S54P, S150F, C152S, Q155T, W156Q y C215L; I41F, E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q y C215G; I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I y C215G; I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R; I41F, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G; I41K, E42G, P48E, S54P, S150F, C152S, Q155K y W156Q; I41K, E42G, P48E, S54P, S150F, C152S, Q155L y C215L; I41K, E42G, S54P, I108V, E117G, S150F, C152S, Q155K y C215L; I41K, E42G, S54P, I108V, S150F, C152S, Q155T y C215G; I41K, E42G, S54P, E117G, S150F, C152S, Q155L y C215G; I41K, E42G, S54P, E117G, S150F, C152S, Q155K, C215L y I267V; I41K, E42G, S54P, S150F, C152S, Q155K, W156Q y C215G; I41K, E42G, S54P, S150F, C152S, Q155K, F160P, C215G e I267V; I41K, E42G, S54P, S150F, C152S, Q155K y C215L; I41K, E42G, S54P, S150F, C152S y Q155T; I41K, E42G, S54P, S150F, C152S, Q155T y F160P; I41K, E42G, S54P, S150F, C152S, Q155T y C215G; I41K, E42G, S54P, S150F, C152S, Q155T, C215G e I267V; I41K, E42G, S54P, S150F, C152S, Q155K, W156Q y C215G; I41N, E42G, S54P, S150F, C152S, Q155I y F160P; I41N, E42G, S54P, E117G, S150F, C152S, Q155T; y W156Q; I41N, S49T, E42G, S54P, S150F, C152S, Q155L, F160P, D165N y C215L; E42A, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V; E42G, A44Q, S54P, I108V, S150F, C152S y Q155T; E42G, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V; E42G, A44Q, S54P, S150A, C152S y Q155T; E42G, A44Q, S54P, S150F, C152S y Q155T; E42G, P48G, S54P, S150F, C152S, Q155L, W156Q y C215H; E42G, P48G, S54P, S150F, C152S y Q155T; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155L, F160P y C215L; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155K, W156Q y C215G; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155T, W156Q, C215G e I267V; E42G, S49T, S54P, C152S, Q155T y W156Q; E42G, S54P, I55L, T126A, C152S, Q155T, L218M y A270T; E42G, S54P, F60V, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, T68A, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, T69S, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, N76S, T126A, C152S, Q155T, S182T, L218M, A270T y V328I; E42G, S54P, I108V, S150F, C152S, Q155K y C215H; E42G, S54P, I108V, S150F, C152S y Q155T; E42G, S54P, I108V, S150F, C152S, Q155T e I267V; E42G, S54P, I108V, S150F, C152S, Q155V, W156Q y F160P; E42G, S54P, E117G, C152S y Q155T; E42G, S54P, E117G, C152S, Q155T y W156Q; E42G, S54P, M122Q, S150F, C152S, Q155I, W156Q, C215G y A241R; E42G, S54P, M122Q, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R; E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q, V171I, C215G y A241R; E42G, S54P, T126M, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, P135I, F136Y, S150F, C152S, Q155L, W156Q, W192F y C215G; E42G, S54P, F136I, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, F136I, S150F, C152S, Q155L, W156Q, C215G y G224I; E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G, S282V y G284I; E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G y G284P; E42G, S54P, F136Y, S150F, C152S, Q155L, W156Q, C215G, S282V y G284P; E42G, S54P, S150A, C152S, Q155T e I267V; E42G, S54P, S150F, C152S, Q155I, W156Q, F160P, C215L e I267V; E42G, S54P, S150F, C152S, Q155I, W156Q, V171I, C215G y A241R; E42G, S54P, S150F, C152S, Q155I, W156Q y C215L; E42G, S54P, S150F, C152S, Q155I, F160P y C215G; E42G, S54P, S150F, C152S, Q155I y C215H; E42G, S54P, S150F, C152S, Q155K y W156Q; E42G, S54P, S150F, C152S, Q155K, W156Q e I267V; E42G, S54P, S150F, C152S, Q155L, W156Q, G193M y C215G; E42G, S54P, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G, S282V y G284I; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y T283S; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y G284I; E42G, S54P, S150F, C152S, Q155L, W156Y y C215G; E42G, S54P, S150F, C152S, Q155L y C215H; E42G, S54P, S150F, C152S y Q155T; E42G, S54P, S150F, C152S, Q155T, C215G e I267V; E42G, S54P, S150F, C152S, Q155T e I267V; E42G, S54P, S150F, C152S, Q155T, W156Q, F160P, C215L e I267V; E42G, S54P, S150F, C152S, Q155T, W156Q, C215G e I267V; E42G, S54P, S150F, C152S, Q155T y W156R; E42G, S54P, S150F, C152S, Q155T, F160P y C215G; E42G, S54P, S150F, C152S, Q155T, F160P y C215L; E42G, S54P, S150F, C152S, Q155T, C215G e I267V; E42G, S54P, S150F, C152S, Q155T e I267V; E42G, S54P, C152S, Q155I y W156S; E42G, S54P, C152S, Q155K y W156S; E42G, S54P, C152S, Q155L y W156S; E42G, S54P, C152S y Q155T; E42G, S54P, C152S, Q155T y F160P; E42G, S54P, C152S, Q155T y R164P; E42G, S54P, C152S, Q155T y W156Q; E42G, S54P, C152S, Q155T y W156S; E42G, S54P, C152S, Q155T y R164P; E42G, S54P, C152S, Q155T, S182T, L218M y A270T; E42G, S54P, C152S, Q155T y C215G; E42G, S54P, C152S, Q155T y C215L; y E42G, S54P, C152S, Q155V y W156S.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0021] En algunas realizaciones de los polipeptidos modificados que tienen actividad transaminasa de la presente descripcion, el polipeptido modificado es capaz de convertir un sustrato de compuesto (2) a un producto del compuesto (1) en condiciones de reaccion adecuadas. En algunas realizaciones, el polipeptido modificado es capaz de convertir el compuesto (2) en el compuesto (1) con al menos 1,2 veces, 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces, 75 veces, 100 veces, o mas actividad de la SEQ ID NO:2 en condiciones de reaccion adecuadas. En algunas realizaciones, el polipeptido modificado es capaz de convertir el compuesto (2) en el compuesto (1) con una actividad incrementada en relacion con la SEQ ID NO:2 en la que las condiciones de reaccion adecuadas comprenden el compuesto (1) a una carga de al menos 50 g/L, 1 mM PLP, DMSO al 50% (v/v), 1,5 M de isopropilamina, pH 11 y 55°C.
[0022] En algunas realizaciones de la presente descripcion, la secuencia de aminoacidos del polipeptido modificado
comprende una secuencia seleccionada de las siguientes secuencias de ejemplo de la SEQ ID nO:4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38,40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 01, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126,

128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 154, 156, 158, 160, 162, 164, 166, 168, 170,

172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216,

218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 246, 248, 250, 252, 254, 256, 258, 260, 262, 264,
266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 298, 300, 302, 304 y 306. Cada una de estas secuencias polipeptfdicas ejemplares comprende una combinacion diferente de diferencias de aminoacidos relativas a la SEQ ID nO:2 como se describe en este documento (Vease, por ejemplo, las Tablas 2A, 2B y 2C). En algunas realizaciones, el polipeptido modificado comprende una secuencia que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98%, 99% o mas de identidad con cualquiera de estas secuencias ejemplares, y que comprende ademas una combinacion de diferencias de aminoacidos en relacion con la SEQ ID NO:2, como se encuentra en cualquiera de estas secuencias de aminoacidos ejemplares. En algunas realizaciones, el polipeptido modificado que comprende una combinacion de diferencias de aminoacidos en relacion con la SEQ ID NO:2, como se encuentra en cualquiera de estas secuencias de aminoacidos ejemplares, puede comprender ademas diferencias de aminoacidos adicionales en comparacion con la SEQ ID NO:2 seleccionada de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241R, X267V, X270T, X273H, X325M y X328I; u otras diferencias de aminoacidos descritas en la tecnica de los polipeptidos de transaminasas modificados por ingeniena genetica (Vease, por ejemplo, diferencias de aminoacidos descritas en la patente de EE.UU. N° 8.293.507 B2, publicada el 23 de octubre de 2012; WO2011/005477A1, publicada el 13 de enero de 2011; WO2012/024.104, publicada el 23 de febrero de 2012.).
[0023] En algunas realizaciones de la presente descripcion, el polipeptido configurado que tiene actividad de transaminasa se inmoviliza sobre un soporte solido, opcionalmente en el que el soporte solido se selecciona de una perla o resina que comprende polimetacrilato con grupos funcionales epoxido, polimetacrilato con grupos funcionales amino epoxido, copolfmero de estireno/DVB o polimetacrilato con grupos funcionales de octadecilo.
[0024] En otros aspectos, la presente descripcion proporciona un polinucleotido que codifica el polipeptido
modificado que tiene actividad de transaminasa descrita aqrn. En algunas realizaciones, el polinucleotido puede comprender una secuencia de nucleotidos seleccionada de la SEQ ID NO:3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85., 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137,

139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 169, 171, 173, 175, 177, 179, 181, 183, 185.,

187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225, 227, 229, 231,

233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 375, 277,
279, 281,283, 285, 287, 291, 293, 295, 297, 299, 301, 303, y 305.
[0025] Ademas, la presente descripcion proporciona vectores de expresion y celulas huesped que comprenden un polinucleotido que codifica el polipeptido modificado que tiene actividad de transaminasa descrita en este documento. Asf, en algunas realizaciones, la presente descripcion proporciona un vector de expresion que comprende el polinucleotido que codifica un polipeptido modificado como se describe en el presente documento, y que opcionalmente comprende ademas una secuencia de control. En otras realizaciones, la presente divulgacion proporciona una celula huesped que comprende un polinucleotido que codifica un polipeptido modificado como se describe en el presente documento. En otras realizaciones, la presente divulgacion proporciona una celula huesped que comprende un vector de expresion, en la que el vector de expresion comprende un polinucleotido que codifica un polipeptido modificado como se describe en el presente documento. En otras realizaciones, de la presente descripcion se proporciona un metodo para preparar un polipeptido modificado como se describe en el presente documento, en el que el metodo comprende cultivar una celula huesped en condiciones adecuadas para la expresion del polipeptido. En algunas realizaciones, el metodo de preparacion del polipeptido modificado comprende ademas el aislamiento del polipeptido.
[0026] La presente divulgacion tambien proporciona procedimientos para usar los polipeptidos de transaminasa modificados descritos en este documento para la preparacion de amplia variedad de compuestos de amina quirales. En algunas realizaciones, la presente divulgacion proporciona un metodo para preparar un compuesto de Formula estructural (I):
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen10
tener la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico de al menos 70% sobre el enantiomero opuesto, en donde
Z es O o NR2R3;
R1 es C1-8 alquilo, arilo, heteroarilo, arilo-Ci-2 alquilo, heteroarilo-Ci-2 alquilo o un sistema de anillo heterodclico de 5 a 6 miembros que opcionalmente contiene un heteroatomo adicional seleccionado de O, S, and N, estando el anillo heterodclico no sustituido o sustituido con uno a tres sustituyentes independientemente seleccionados de oxo, hydroxi, halogeno, C1-4 alcoxi, and C1-4 alquilo, en donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco fluoros;
R2 y R3 son cada uno independientemente hidrogeno, C1-8 alquilo, arilo o arilo-Ci-2 alquilo; o R2 y R3 junto con el atomo de nitrogeno al que estan unidos forman un sistema de anillo heterodclico de 4 a 7 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, en donde alquilo y alcoxi no estan sustituidos o estan sustituidos con uno a cinco fluoros; y el sistema de anillo heterodclico se fusiona opcionalmente con un sistema de anillo carbodclico aromatico saturado o aromatico de 5 a 6 miembros o un sistema de anillo heterodclico aromatico saturado o aromatico de 5 a 6 miembros que contiene uno a dos heteroatomos seleccionados de O, S y N, el sistema de anillo condensado no sustituido o sustituido con uno a dos sustituyentes seleccionados de hidroxi, amino, fluor, C1-4 alquilo, C1-4 alcoxi, y trifluorometilo; El proceso comprende la etapa de poner en contacto una cetona proquiral de formula estructural (II):
imagen11
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en un disolvente organico adecuado en condiciones de reaccion adecuadas.
[0027] En algunas realizaciones del proceso para preparar un compuesto de formula estructural (I), R1 es bencilo y el grupo fenilo del bencilo esta no sustituido o sustituido de uno a tres sustituyentes seleccionados del grupo que consiste en fluor, trifluorometilo y trifluorometoxi. En algunas realizaciones del proceso, Z es NR2R3, en donde NR2R3 es un heterociclo de la Formula estructural (III):
imagen12
en donde R4 es hidrogeno o C1-4 alquilo que esta sin sustituir o sustituido con uno a cinco fluoros.
[0028] En algunas realizaciones del proceso para preparar un compuesto de formula estructural (I), el compuesto de Formula (II) excluye espedficamente compuesto (2) y el compuesto de Formula (I) preparado por el metodo espedficamente excluye el compuesto (1).
[0029] En algunas realizaciones, la presente divulgacion proporciona procedimiento para preparar un compuesto de formula estructural (Ia):
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen13
tener la (R)-configuracion en el centro estereogenico marcado con un ***; en un exceso enantiomerico de al menos 70% sobre el enantiomero que tiene la (S)-configuracion opuesta; en donde
Ar es fenilo que esta sin sustituir o sustituido con uno a cinco sustituyentes seleccionados independientemente del grupo que consiste en fluor, trifluorometilo y trifluorometoxi; y
R4 es hidrogeno o C1.4 alquilo no sustituido o sustituido con uno a cinco fluoros; el proceso comprende la etapa de: poner en contacto una cetona proquiral de formula estructural (IIa):
imagen14
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas. En algunas realizaciones del proceso para preparar el compuesto de Formula (la), Ar se selecciona de 2,5-difluorofenilo o 2,4,5-trifluorofenilo, y R4 es trifluorometilo.
[0030] En algunas realizaciones del proceso para preparar un compuesto de formula estructural (la), el compuesto de Formula (IIa) excluye espedficamente el compuesto (2) y el compuesto de Formula (la) preparado por el metodo espedficamente excluye el compuesto (1).
[0031] En algunas realizaciones, la presente descripcion proporciona un procedimiento de preparacion del compuesto (1)
imagen15
que comprende una etapa de contacto con un sustrato del compuesto (2)
imagen16
5
10
15
20
25
30
35
40
45
50
55
60
65
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0032] En algunas realizaciones, la presente divulgacion tambien proporciona un procedimiento de preparacion del Compuesto (3), gemigliptina,
imagen17
que comprende una etapa de poner en contacto un sustrato del compuesto (4), o un sustrato del compuesto (4) modificado con un grupo protector,
imagen18
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0033] En algunas realizaciones, los procedimientos que utilizan los polipeptidos modificados descritos en este documento puede llevarse a cabo en el que el compuesto de amina quiral de formula (I), el compuesto de Formula (Ia), el compuesto (1), o el compuesto (3), se produce en al menos 90%, 97%, 98%, 99% o mas de exceso enantiomerico.
[0034] Cualquiera de los procedimientos descritos en este documento usando los polipeptidos modificados para la preparacion de compuestos de Formula (I), los compuestos de Formula (la), el compuesto (1), o compuesto (3) puede llevarse a cabo bajo una serie de condiciones de reaccion adecuadas, que incluyen, entre otras, rangos de donante de aminas, pH, temperatura, tampon, sistema de solvente, carga de sustrato, carga de polipeptidos, carga de cofactor, presion y tiempo de reaccion. Por ejemplo, en algunas realizaciones, la preparacion de compuestos de Formula (I), compuestos de Formula (la), compuesto (1) o compuesto (3) se puede llevar a cabo en donde las condiciones de reaccion adecuadas comprenden: (a) carga de sustrato de aproximadamente 10 a 200 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) de aproximadamente 0,5 g/L a 5 g/L de polipeptido modificado; (c) concentracion de MlP de aproximadamente 0,1 a 3 M; (d) concentracion de cofactor de PLP de aproximadamente 0,1 a 1 mM; (e) concentracion de DMSO de aproximadamente 30% (v/v) a aproximadamente 60% (v/v); (f) pH de aproximadamente 9,5 a 11,5; y (g) temperatura de aproximadamente 45°C a 60°C. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden: (a) aproximadamente 50 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) aproximadamente 2 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 1 M isopropilamina (IPM); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) sobre pH 10; y (g) unos 50°C.
[0035] En algunas realizaciones, los procedimientos que utilizan los polipeptidos modificados descritos en este documento pueden llevarse a cabo en donde el donante de grupo amino se selecciona de isopropilamina, alanina, acido 3-aminobutmco, o metilbencilamina. En algunas realizaciones, el donante del grupo amino es isopropilamina.
5
10
15
20
25
30
35
40
45
50
55
[0036] En algunas realizaciones, los procedimientos que utilizan los polipeptidos modificados descritos en este documento pueden llevarse a cabo en donde el procedimiento comprende etapas adicionales de aislamiento de los compuestos producto de la Formula (I), Formula (la), compuesto (1), o compuesto (3), a partir de la reaccion.
[0037] En algunas realizaciones, los procedimientos que utilizan los polipeptidos modificados descritos en este documento puede llevarse a cabo en donde el procedimiento comprende ademas la etapa de convertir el compuesto de Formula (I), el compuesto de Formula (la), el compuesto (1) o el compuesto (3) en una sal farmaceuticamente aceptable. En algunas realizaciones, el proceso de formacion de la sal farmaceuticamente aceptable comprende la etapa adicional de poner en contacto dicho compuesto con un acido farmaceuticamente aceptable en un disolvente de reaccion adecuado. En algunas realizaciones del proceso, el acido farmaceuticamente aceptable es acido fosforico y la sal farmaceuticamente aceptable es la sal de fosfato de dihidrogeno. En algunas realizaciones, los procesos pueden comprender ademas la etapa de cristalizar la sal farmaceuticamente aceptable del disolvente de reaccion.
[0038] Como se senalo anteriormente, el compuesto (1) es sitagliptina, el ingrediente farmaceutico activo en JANUVIA®, por consiguiente, los procedimientos descritos en este documento usando polipeptidos modificados para la fabricacion de compuesto (1), y/o su sal o acido farmaceuticamente aceptable, pueden ser utilizados en procesos mas grandes para la produccion de JANUVIA® o compuestos farmaceuticos relacionados. En algunas realizaciones, la presente divulgacion tambien proporciona un proceso para la preparacion de (2R)-4-oxo-4-[3-(trifluorometilo)-5,6- dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]-1-(2,4,5-trifluorofenilo)butano-2-amina fosfato (1:1) monohidrato, en donde el proceso comprende una etapa de conversion de un compuesto de sustrato (2) a un compuesto producto (1) poniendo en contacto un sustrato del compuesto (2) con un polipeptido modificado como se describe en el presente documento en presencia de un grupo amino donante en condiciones de reaccion adecuadas.
[0039] Del mismo modo, la presente divulgacion proporciona un procedimiento para la preparacion del compuesto
(3) , o una sal o acido del compuesto farmaceuticamente aceptable (3), en donde el procedimiento comprende una etapa de convertir un compuesto de sustrato (4), o un sustrato del compuesto (4) modificado con un grupo protector, a un compuesto del producto (3), poniendo en contacto un sustrato del compuesto (4), o un sustrato del compuesto
(4) modificado con un grupo protector, con un polipeptido modificado como se describe aqu en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0040] Orientacion adicional sobre la eleccion de polipeptidos modificados, su preparacion, la eleccion de sustratos y los parametros para llevar a cabo los procesos se describen con mas detalle en la descripcion mas detallada y en los ejemplos que siguen.
5. DESCRIPCION DETALLADA
[0041] Como se usa en esta especificacion y las reivindicaciones adjuntas, las formas singulares "un", "una", "el" y "ella" incluyen referentes plurales a menos que el contexto indique claramente lo contrario. Asf, por ejemplo, la referencia a "un polipeptido" incluye mas de un polipeptido.
[0042] De manera similar, "comprenden", "comprende", "que comprende" "incluye", "que incluye", "incluye", "tiene", y "que tiene" son intercambiables y no pretenden ser limitantes.
[0043] Ha de entenderse que cuando descripciones de diversas realizaciones usan el termino "que comprende", los expertos en la tecnica entenderan que en algunos casos espedficos, una forma de realizacion puede ser descrita alternativamente usando el lenguaje "consiste esencialmente en" o "consiste de."
[0044] Se ha de entender, ademas, que tanto la descripcion anterior en general, incluidos los dibujos, y la siguiente descripcion detallada son ejemplares y explicativas y no son restrictivas de la presente divulgacion.
[0045] Los encabezados de seccion usados en este documento son con fines de organizacion solamente y no deben interpretarse como limitantes del objeto descrito.
5.1 Abreviaturas
[0046] Las abreviaturas utilizadas para los aminoacidos codificados geneticamente son convencionales y son las siguientes:
5
10
15
20
25
30
35
40
45
50
55
60
65
Aminoacido
Abreviatura de tres letras Abreviatura de una letra
Alanina
Ala A
Arginina
Arg R
Asparagina
Asn N
Aspartato
Asp D
Cistema
Cys C
Glutamato
Glu E
Glutamina
Gln Q
Glicina
Gly G
Histidina
HIS H
Isoleucina
Ile I
Leucina
Leu L
Lisina
Lys K
Metionina
Met M
Fenilalanina
Phe F
Prolina
Pro P
Serina
Ser S
Treonina
Thr T
Triptofano
Trp W
Tirosina
Tyr Y
Valina
Val V
[0047] Cuando se utilizan las abreviaturas de tres letras, a menos precedidas espedficamente por una "L" o una "D" o claro por el contexto en el que se utiliza la abreviatura, el aminoacido puede estar en la configuracion L o D sobre el carbono a (Ca). Por ejemplo, mientras que "Ala" designa alanina sin especificar la configuracion sobre el carbono a, "D-Ala" y " L-Ala" designan D-alanina y L-alanina, respectivamente. Cuando se usan las abreviaturas de una letra, las letras mayusculas designan aminoacidos en la configuracion L sobre el a-carbono y las letras minusculas designan aminoacidos en la D-configuracion por el a-carbono. Por ejemplo, "A" designa L-alanina y "a" designa D- alanina. Cuando las secuencias de polipeptidos se presentan como una cadena de abreviaturas de una letra o de tres letras (o mezclas de las mismas), las secuencias se presentan en la direccion amino (N) a carboxi (C) de acuerdo con la convencion comun.
[0048] Las abreviaturas utilizadas para los nucleosidos que codifican geneticamente son convencionales y son como sigue: la adenosina (A); guanosina (G); citidina (C); timidina (T); y uridina (U). A menos que este espedficamente delineado, los nucleotidos abreviados pueden ser ribonucleosidos o 2'-desoxirribonucleosidos. Los nucleosidos pueden especificarse como ribonucleosidos o 2'-desoxirribonucleosidos en una base individual o en una base agregada. Cuando las secuencias de acido nucleico se presentan como una cadena de abreviaturas de una letra, las secuencias se presentan en la direccion 5' a 3' de acuerdo con la convencion comun, y los fosfatos no estan indicados.
5.2 Definiciones
[0049] En referencia a la presente descripcion, los terminos tecnicos y cientfficos usados en las descripciones en el presente documento tendran los significados comunmente entendidos por un experto normal en la tecnica, salvo que se defina espedficamente lo contrario. Por consiguiente, los siguientes terminos estan destinados a tener los siguientes significados:
[0050] "Protema", "polipeptido" y "peptido" se usan indistintamente en este documento para denotar un polfmero de al menos dos aminoacidos unidos covalentemente mediante un enlace amida, independientemente de modificacion de longitud o postraduccional (p.ej., glicosilacion, fosforilacion, lipidacion, miristilacion, ubiquitinacion, etc.). Dentro de esta definicion se incluyen los aminoacidos D y L, y las mezclas de los aminoacidos D y L.
[0051] "Transaminasas" o "aminotransferasa" se usan indistintamente en este documento para referirse a un polipeptido que tiene una capacidad enzimatica de transferencia de un grupo amino (-NH2), un par de electrones, y un proton de la amina primaria de un compuesto de donante de amina al grupo carbonilo (C=O) de un compuesto aceptor de amina, convirtiendo asf el compuesto donador de amina en su correspondiente compuesto carbonilo y el compuesto aceptor de carbonilo en su correspondiente compuesto de amina primaria (vease, por ejemplo, el Esquema 1). Las transaminasas como se usan en este documento incluyen transaminasas naturales (tipo salvaje) asf como polipeptidos modificados geneticamente no naturales generados por la manipulacion humana.
[0052] El "donante de grupo amino" o "donante de amino" se usa indistintamente en el presente documento para referirse a un compuesto que contiene un grupo amino que es capaz de donar un grupo amino a un compuesto
5
10
15
20
25
30
35
40
45
50
55
60
65
carbonilo aceptor (es dedr, un aceptor de grupo amino), convirtiendose asf en un subproducto de carbonilo. Los donantes de grupos amino tienen la formula estructural general,
imagen19
en el que cada uno de R1 y R2, cuando se toman independientemente, es un grupo alquilo, un grupo alquilarilo o grupo arilo que no esta sustituido o esta sustituido con uno o mas grupos no inhibidores enzimaticamente. R1 puede ser igual o diferente de R2 en su estructura o quiralidad. Los grupos R1 y R2, tornados juntos, pueden formar un anillo que no esta sustituido, sustituido o fusionado con otros anillos. Los donantes de grupos amino tfpicos incluyen aminoacidos quirales y aquirales, y aminas quirales y aquirales.
[0053] "Amina quiral" se refiere a aminas de formula general R°-CH(NH2)-Rp y se emplea en el presente documento en su sentido mas amplio, incluyendo una amplia variedad de compuestos alifaticos y alidclicos de diferente, y tipos mixtos, funcionales, caracterizados por la presencia de un grupo amino primario unido a un atomo de carbono secundario que, ademas de un atomo de hidrogeno, lleva (i) un grupo divalente que forma una estructura dclica quiral o (ii) dos sustituyentes (distintos del hidrogeno) diferentes entre sf en estructura o quiralidad. Los grupos divalentes que forman una estructura dclica quiral incluyen, por ejemplo, 2-metilbutano-1,4-diilo, pentano-1,4-diilo, hexano-1,4-diilo, hexano-1,5-diilo, 2- metilpentano-1,5-diilo. Los dos sustituyentes diferentes en el atomo de carbono secundario (Ray Rp anteriores) tambien pueden variar ampliamente e incluyen alquilo, arilalquilo, arilo, halo, hidroxi, alquilo inferior, alquiloxi inferior, alquiltio inferior, cicloalquilo, carboxi, carbalquiloxi, carbamoflo, carbamoflo sustituido por mono- y di-(alquilo inferior), trifluorometilo, fenilo, nitro, amino, amino mono- y di-(alquilo inferior) sustituido, alquilo-sulfonilo, arilsulfonilo, alquilcarboxamido, arilcarboxamido, etc., asf como alquilo, arilalquilo o arilo sustituido por lo anterior.
[0054] "Subproducto de carbonilo" se refiere al compuesto de carbonilo formado a partir del donante de grupo amino cuando el grupo amino en el donante de grupo amino se transfiere al aceptor del grupo amino en una reaccion de transaminacion. El subproducto de carbonilo tiene la formula estructural general,
O
imagen20
en donde R1 y R2 se definen anteriormente para el grupo amino donante.
[0055] El "aceptor de amino" y el "aceptor de amina", "sustrato ceto" se usan indistintamente en el presente documento para referirse a un compuesto que contiene un grupo carbonilo que acepta el grupo amino de un donante del grupo amino en una reaccion mediada por una transaminasa (vease por ejemplo, Esquema 1). En el contexto de la presente divulgacion, el compuesto aceptor de amino para la transaminasa puede incluir, entre otros, el compuesto de Formula (II), el compuesto de Formula (IIa), el compuesto (2), y el compuesto (4), como se describe adicionalmente en el presente documento.
[0056] "Cofactor", como se usa en este documento, se refiere a un compuesto no proteico que funciona en combinacion con una enzima para catalizar una reaccion. Como se usa en este documento, "cofactor" pretende abarcar los compuestos de la familia de la vitamina B6 PLP, PN, PL, PM, PNP y PMP, que a veces tambien se denominan coenzimas.
[0057] "Piridoxal-fosfato", "PLP", "piridoxal-5'-fosfato", "PEP", y "P5P" se usan indistintamente en este documento para referirse al compuesto que actua como un cofactor en las reacciones de transaminasas. En algunas realizaciones, el fosfato de piridoxal se define por la estructura del acido 1-(4'-formilo-3'-hidroxi-2'-metilo-5'- piridilo)metoxifosfonico, numero CAS [54-47-7]. El piridoxal-5'-fosfato se puede producir in vivo mediante la fosforilacion y oxidacion del piridoxol (tambien conocido como vitamina Be). En las reacciones de transaminacion que utilizan enzimas transaminasas, el grupo amina del donante amino se transfiere al cofactor para producir un subproducto ceto, mientras que el piridoxal-5'-fosfateconvertido se convierte en fosfato de piridoxamina. Piridoxal-5'- fosfato regenerado por reaccion con un compuesto ceto diferente (el aceptor de amino). La transferencia del grupo amina del fosfato de piridoxamina al aceptor amino produce una amina y regenera el cofactor. En algunas realizaciones, el piridoxal-5'-fosfato puede ser reemplazado por otros miembros de la familia de la vitamina Be, incluyendo piridoxina (PN), piridoxal (PL), piridoxamina (PM) y sus contrapartes fosforiladas; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP).
5
10
15
20
25
30
35
40
45
50
55
60
65
[0058] La "secuencia de codificacion" se refiere a la porcion de un acido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoacidos de una protema.
[0059] "De origen natural" o "de tipo salvaje" se refiere a la forma encontrada en la naturaleza. Por ejemplo, una secuencia de polipeptido o polinucleotido de tipo natural o silvestre es una secuencia presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificada intencionalmente por la manipulacion humana.
[0060] "Recombinante" o "disenado" o "de origen no natural" cuando se usa con referencia a, por ejemplo, una celula, acido nucleico, o polipeptido, se refiere a un material, o un material correspondiente a la forma natural o nativa del material, que se ha modificado de una manera que de otra manera no existina en la naturaleza, o es identico al mismo pero producido o derivado de materiales sinteticos y/o mediante manipulacion utilizando tecnicas recombinantes. Los ejemplos no limitantes incluyen, entre otros, celulas recombinantes que expresan genes que no se encuentran dentro de la forma nativa (no recombinante) de la celula o que expresan genes nativos que de otra manera se expresan a un nivel diferente.
[0061] "Porcentaje de identidad de secuencia" y "homologfa de porcentaje" se usan de manera intercambiable en el presente documento para referirse a comparaciones entre polinucleotidos y polipeptidos, y se determinan comparando dos secuencias alineadas optimamente en una ventana de comparacion, en donde la porcion del polinucleotido o La secuencia de polipeptidos en la ventana de comparacion puede comprender adiciones o deleciones (es decir, huecos) en comparacion con la secuencia de referencia para el alineamiento optimo de las dos secuencias. El porcentaje puede calcularse determinando el numero de posiciones en las que se produce la base de acido nucleico o aminoacido identico en ambas secuencias para obtener el numero de posiciones coincidentes, dividiendo el numero de posiciones coincidentes por el numero total de posiciones en la ventana de comparar y multiplicar el resultado por 100 para obtener el porcentaje de identidad de secuencia. Alternativamente, el porcentaje puede calcularse determinando el numero de posiciones en las cuales ocurre la misma base de acido nucleico o el residuo de aminoacido en ambas secuencias o una base de acido nucleico o un residuo de aminoacido se alinea con un hueco para producir el numero de posiciones emparejadas, dividiendo el numero de posiciones coincidentes por el numero total de posiciones en la ventana de comparacion y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Los expertos en la tecnica aprecian que hay muchos algoritmos establecidos disponibles para alinear dos secuencias. La alineacion optima de las secuencias para la comparacion puede realizarse, por ejemplo, mediante el algoritmo de homologfa local de Smith y Waterman, 1981, Adv. Apl. Math. 2: 482, por el algoritmo de alineacion de homologfa de Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443, por el metodo de busqueda de similitud de Pearson y Lipman, 1988, Proc. Natl Acad Sci. EE.UU. 85: 2444, por implementaciones computarizadas de estos algoritmos (GAP, BE-STFIT, FASTA y TFASTA en el paquete de software GCG Wisconsin), o por inspeccion visual (vease en general, Current Protocols in Molecular Biology, FM Ausubel et al., eds., Current Protocols, una empresa conjunta entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (Suplemento de 1995) (Ausubel)). Ejemplos de algoritmos que son adecuados para determinar el porcentaje de identidad de secuencia y la similitud de secuencia son los algoritmos BLAST y BLAST 2.0, que se describen en Altschul et al., 1990, J. Mol. Biol. 215: 403-410 y Altschul et al., 1977, Nucleic Acids Res. 3389-3402, respectivamente. El software para realizar los analisis de BLAST esta disponible publicamente a traves del sitio web del Centro Nacional de Informacion Biotecnologica. Este algoritmo involucra primero la identificacion de pares de secuencias de alta puntuacion (HSP) identificando palabras cortas de longitud W en la secuencia de consulta, que coinciden o satisfacen alguna puntuacion de umbral de valor positivo T cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se conoce como el umbral de puntuacion de palabras vecinas (Altschul et al, supra). Estos aciertos de palabras vecinas iniciales actuan como semillas para iniciar busquedas para encontrar HSP mas largos que los contengan. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia hasta donde se puede aumentar la puntuacion de alineacion acumulativa. Las puntuaciones acumulativas se calculan utilizando, para secuencias de nucleotidos, los parametros M (puntuacion de recompensa para un par de residuos coincidentes; siempre> 0) y N (puntuacion de penalizacion para residuos no coincidentes; siempre <0). Para las secuencias de aminoacidos, se utiliza una matriz de puntuacion para calcular la puntuacion acumulativa. La extension de los aciertos de palabra en cada direccion se detiene cuando: la puntuacion de alineacion acumulada cae en la cantidad X desde su valor maximo alcanzado; la puntuacion acumulativa va a cero o por debajo, debido a la acumulacion de una o mas alineaciones de residuos de puntuaciones negativas; o se llega al final de cualquiera de las secuencias. Los parametros del algoritmo BLAST W, T y X determinan la sensibilidad y la velocidad de la alineacion. El programa BLASTN (para secuencias de nucleotidos) usa como predeterminado una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparacion de ambas cadenas. Para las secuencias de aminoacidos, el programa BLASTP utiliza como valor predeterminado una longitud de palabra (W) de 3, una expectativa (E) de 10, y la matriz de puntuacion BLOSUM62 (vease Henikoff y Henikoff, 1989, Proc Natl Acad Sci EE.UU. 89: 10915). La determinacion ejemplar de alineacion de secuencia y % de identidad de secuencia puede emplear los programas BESTFIT o GAP en el paquete de software GCG Wisconsin (Accelrys, Madison WI), utilizando los parametros predeterminados provistos.
[0062] La "secuencia de referencia" se refiere a una secuencia definida utilizada como base para una comparacion de secuencias. Una secuencia de referencia puede ser un subconjunto de una secuencia mas grande, por ejemplo, un segmento de una secuencia de gen o polipeptido de longitud completa. En general, una secuencia de referencia
5
10
15
20
25
30
35
40
45
50
55
60
65
tiene una longitud de al menos 20 residuos de nucleotidos o aminoacidos, una longitud de al menos 25 residuos, una longitud de al menos 50 residuos, o la longitud total del acido nucleico o polipeptido. Dado que dos polinucleotidos o polipeptidos pueden cada uno (1) comprender una secuencia (es dedr, una parte de la secuencia completa) que es similar entre las dos secuencias, y (2) puede comprender ademas una secuencia que es divergente entre las dos secuencias, comparaciones de secuencia entre dos (o mas) polinucleotidos o polipeptidos se realizan tipicamente comparando secuencias de los dos polinucleotidos o polipeptidos en una "ventana de comparacion" para identificar y comparar regiones locales de similitud de secuencias. En algunas realizaciones, una "secuencia de referenda" puede basarse en una secuencia de aminoacidos primaria, donde la secuencia de referencia es una secuencia que puede tener uno o mas cambios en la secuencia primaria. Por ejemplo, una "secuencia de referencia basada en la SEQ ID NO:2 que tiene en el residuo correspondiente a X9 una histidina" se refiere a una secuencia de referencia en la cual el resto correspondiente a X9 en la SEQ ID NO:2, que es una tirosina, ha sido cambiado a histidina.
[0063] La "ventana de comparacion" se refiere a un segmento conceptual de al menos aproximadamente 20 posiciones de nucleotidos contiguas o residuos de aminoacidos en los que se puede comparar una secuencia con una secuencia de referencia de al menos 20 nucleotidos contiguos o aminoacidos y en donde la porcion de la secuencia en la ventana de comparacion puede comprender adiciones o eliminaciones (es decir, huecos) de 20 por ciento o menos en comparacion con la secuencia de referencia (que no comprende adiciones o eliminaciones) para el alineamiento optimo de las dos secuencias. La ventana de comparacion puede tener mas de 20 residuos contiguos e incluye, opcionalmente, 30, 40, 50, 100 o mas ventanas.
[0064] "Correspondiente a", "referencia a" o "en relacion con" cuando se usa en el contexto de la numeracion de una secuencia de aminoacidos dada o polinucleotido se refiere a la numeracion de los residuos de una secuencia de referencia especificada cuando el aminoacido dado o secuencia de polinucleotidos se compara con la secuencia de referencia. En otras palabras, el numero de residuo o la posicion de residuo de un polfmero dado se designa con respecto a la secuencia de referencia en lugar de por la posicion numerica real del residuo dentro de la secuencia de aminoacidos o polinucleotido dada. Por ejemplo, una secuencia de aminoacidos dada, como la de una transaminasa modificada por ingeniena genetica, puede alinearse con una secuencia de referencia introduciendo espacios para optimizar las coincidencias de residuos entre las dos secuencias. En estos casos, aunque los huecos estan presentes, la numeracion del residuo en la secuencia de aminoacidos o polinucleotidos dada se realiza con respecto a la secuencia de referencia con la que se ha alineado.
[0065] "Diferencia de aminoacidos" o "diferencia de residuos" se refiere a una diferencia en el residuo de aminoacido en una posicion de una secuencia polipeptfdica con respecto al residuo de aminoacido en una posicion correspondiente en una secuencia de referencia. Las posiciones de las diferencias de aminoacidos generalmente se denominan en este documento "Xn", donde n se refiere a la posicion correspondiente en la secuencia de referencia en la que se basa la diferencia de residuos. Por ejemplo, una "diferencia de residuos en la posicion X12 en comparacion con la SEQ ID NO:2" se refiere a una diferencia del residuo de aminoacido en la posicion del polipeptido correspondiente a la posicion 12 de la SEQ ID NO:2. Por lo tanto, si el polipeptido de referencia de la SEQ ID NO:2 tiene una tirosina en la posicion 12, entonces una "diferencia de residuos en la posicion X12 en comparacion con la SEQ ID NO:2" es una sustitucion de aminoacidos de cualquier resto que no sea la tirosina en la posicion del polipeptido correspondiente a la posicion 12 de la SEQ ID NO:2. En la mayona de los casos en este documento, la diferencia de residuos de aminoacidos espedficos en una posicion se indica como "XnY", donde "Xn" especifica la posicion correspondiente como se describe anteriormente, y "Y" es el identificador de una sola letra del aminoacido encontrado en el polipeptido modificado (es decir, el residuo diferente que en el polipeptido de referencia). En algunos casos (por ejemplo, en las Tablas 2A, 2B y 2C), la presente descripcion tambien proporciona diferencias espedficas de aminoacidos indicadas por la notacion convencional "AnB", donde A es el identificador de una sola letra del residuo en la secuencia de referencia, "n" es el numero de la posicion del residuo en la secuencia de referencia, y B es el identificador de una sola letra de la sustitucion del residuo en la secuencia del polipeptido modificado. En algunos casos, un polipeptido de la presente divulgacion puede incluir una o mas diferencias de residuos de aminoacidos con respecto a una secuencia de referencia, lo que se indica mediante una lista de las posiciones especificadas donde las diferencias de residuos estan presentes con respecto a la secuencia de referencia. En algunas realizaciones, cuando se puede usar mas de un aminoacido en una posicion de residuo espedfica de un polipeptido, los diversos residuos de aminoacidos que se pueden usar estan separados por una "/" (por ejemplo, X192A/X192G). La presente divulgacion incluye secuencias de polipeptidos modificados que comprenden una o mas diferencias de aminoacidos que incluyen sustituciones de aminoacidos conservativas y no conservativas.
[0066] "Sustitucion de aminoacidos conservativa" se refiere a una sustitucion de un residuo con un residuo diferente que tiene una cadena lateral similar y, por lo tanto, tfpicamente implica la sustitucion del aminoacido en el polipeptido con aminoacidos dentro de la misma o similar clase de aminoacidos definida. A modo de ejemplo y no de limitacion, un aminoacido con una cadena lateral alifatica puede estar sustituido con otro aminoacido alifatico, por ejemplo, alanina, valina, leucina e isoleucina; un aminoacido con la cadena lateral hidroxilo esta sustituido con otro aminoacido con una cadena lateral hidroxilo, por ejemplo, serina y treonina; un aminoacido que tiene cadenas laterales aromaticas esta sustituido con otro aminoacido que tiene una cadena lateral aromatica, por ejemplo, fenilalanina, tirosina, triptofano e histidina; un aminoacido con una cadena lateral basica esta sustituido con otro aminoacido con una cadena lateral basica, por ejemplo, lisina y arginina; un aminoacido con una cadena lateral
5
10
15
20
25
30
35
40
45
50
55
60
65
acida esta sustituido con otro aminoacido con una cadena lateral acida, por ejemplo, acido aspartico o acido glutamico; y un aminoacido hidrofobo o hidrofilo se reemplaza con otro aminoacido hidrofobo o hidrofilo, respectivamente. Las sustituciones conservativas ejemplares se proporcionan en la Tabla 1 a continuacion:
Tabla 1
Residuo
Posibles sustituciones conservadoras
A, L, V, I
Otros alifaticos (A, L, V, I) Otros no polares (A, L, V, I, G, M)
G, M
Otros no polares (A, L, V, I, G, M)
D, E
Otros acidos (D, E)
K, R
Otros basicos (K, R)
N, Q, S, T
Otro polares
H, Y, W, F
Otros aromaticos (H, Y, W, F)
C, P
Ninguna
[0067] "Sustitucion no conservativa" se refiere a la sustitucion de un aminoacido en el polipeptido con un aminoacido con propiedades de cadena lateral significativamente diferentes. Las sustituciones no conservativas pueden usar aminoacidos entre los grupos definidos, y no dentro de ellos, y afectan (a) la estructura del esqueleto peptfdico en el area de la sustitucion (p.ej., prolina para glicina) (b) la carga o hidrofobicidad, o (c) la mayor parte de la cadena lateral. A modo de ejemplo y no de limitacion, una sustitucion no conservativa ejemplar puede ser un aminoacido acido sustituido con un aminoacido basico o alifatico; un aminoacido aromatico sustituido con un pequeno aminoacido; y un aminoacido hidrofilo sustituido con un aminoacido hidrofobo.
[0068] "Delecion" se refiere a la modificacion del polipeptido mediante la eliminacion de uno o mas aminoacidos del polipeptido de referencia. Las eliminaciones pueden comprender la eliminacion de 1 o mas aminoacidos, 2 o mas aminoacidos, 5 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta el 10% del numero total de aminoacidos, o hasta el 20% del numero total de aminoacidos que componen la enzima de referencia, al tiempo que conserva la actividad enzimatica y/o retiene las propiedades mejoradas de una enzima transaminasa modificada por ingeniena genetica. Las eliminaciones pueden dirigirse a las porciones internas y/o porciones terminales del polipeptido. En diversas realizaciones, la eliminacion puede comprender un segmento continuo o puede ser discontinua.
[0069] "Insercion" se refiere a la modificacion del polipeptido mediante la adicion de uno o mas aminoacidos del polipeptido de referencia. En algunas realizaciones, las enzimas transaminasas modificadas por ingeniena genetica comprenden inserciones de uno o mas aminoacidos en el polipeptido de la transaminasa natural, asf como inserciones de uno o mas aminoacidos en otros polipeptidos de la transaminasa mejorada. Las inserciones pueden estar en las porciones internas del polipeptido, o en el extremo carboxi o amino. Las inserciones como se usan en este documento incluyen protemas de fusion como se conoce en la tecnica. La insercion puede ser un segmento contiguo de aminoacidos o separado por uno o mas de los aminoacidos en el polipeptido natural.
[0070] "Fragmento" como se usa en el presente documento se refiere a un polipeptido que tiene una eliminacion amino-terminal y/o carboxi-terminal, pero donde la secuencia de aminoacidos restante es identica a las posiciones correspondientes en la secuencia. Los fragmentos pueden tener una longitud de al menos 14 aminoacidos, una longitud de al menos 20 aminoacidos, una longitud de al menos 50 aminoacidos o mas larga, y hasta un 70%, 80%, 90%, 95%, 98% y 99% de un total polipeptido de transaminasa de longitud.
[0071] "Polipeptido aislado" se refiere a un polipeptido que esta sustancialmente separado de otros contaminantes que naturalmente lo acompanan, por ejemplo, protemas, lfpidos y polinucleotidos. El termino abarca polipeptidos que se han eliminado o purificado de su entorno natural o sistema de expresion (por ejemplo, celula huesped o smtesis in vitro). Las enzimas transaminasas mejoradas pueden estar presentes dentro de una celula, presentes en el medio celular, o preparadas en diversas formas, tales como lisados o preparaciones aisladas. Como tal, en algunas realizaciones, la enzima transaminasa mejorada puede ser un polipeptido aislado.
[0072] "Polipeptido sustancialmente puro" se refiere a una composicion en la que la especie polipeptfdica es la especie predominante presente (es decir, en base molar o en peso es mas abundante que cualquier otra especie macromolecular individual en la composicion), y es generalmente una composicion sustancialmente purificada cuando la especie objeto comprende al menos alrededor del 50 por ciento de las especies macromoleculares presentes en moles o % en peso. En general, una composicion de transaminasa sustancialmente pura comprendera aproximadamente el 60% o mas, aproximadamente el 70% o mas, aproximadamente el 80% o mas, aproximadamente el 90% o mas, aproximadamente el 95% o mas, y aproximadamente el 98% o mas de todos los componentes macromoleculares. Especies por mol o % en peso presentes en la composicion. En algunas realizaciones, la especie diana se purifica hasta homogeneidad esencial (es decir, las especies contaminantes no pueden detectarse en la composicion mediante metodos de deteccion convencionales), en donde la composicion
5
10
15
20
25
30
35
40
45
50
55
60
65
consiste esencialmente en una sola especie macromolecular. Las especies solventes, las moleculas pequenas (<500 Daltons) y las especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipeptido de transaminasas mejorado aislado es una composicion de polipeptido sustancialmente pura.
[0073] "Estereoselectividad" se refiere a la formacion preferencial en una reaccion qmmica o enzimatica de un estereoisomero sobre otro. La estereoselectividad puede ser parcial, donde la formacion de un estereoisomero se favorece sobre el otro, o puede ser completa donde se forma un solo estereoisomero. Cuando los estereoisomeros son enantiomeros, la estereoselectividad se conoce como enantioselectividad, la fraccion (tfpicamente reportada como un porcentaje) de un enantiomero en la suma de ambos. Comunmente se reporta alternativamente en la tecnica (tfpicamente como un porcentaje) como el exceso enantiomerico (e.e.) calculado de acuerdo con la formula [enantiomero mayor - enantiomero menor]/[enantiomero mayor + enantiomero menor]. Cuando los estereoisomeros son diastereoisomeros, la estereoselectividad se denomina diastereoselectividad, la fraccion (tfpicamente reportada como un porcentaje) de un diastereomero en una mezcla de dos diastereoisomeros, comunmente reportada alternativamente como el exceso diastereomerico (d.e.). Cuando una mezcla contiene mas de dos diastereomeros, es comun informar la relacion de diastereomeros o "relacion diastereomerica" en lugar de exceso diastereomerico. El exceso enantiomerico y el exceso diastereomerico son tipos de exceso estereomerico. "Altamente estereoselectivo" se refiere a un polipeptido de transaminasa que es capaz de convertir el sustrato en el producto de amina quiral correspondiente con al menos aproximadamente el 85% de exceso estereomerico.
[0074] La "propiedad enzimatica mejorada" se refiere a un polipeptido de transaminasa que muestra una mejora en cualquier propiedad enzimatica en comparacion con una transaminasa de referencia, tal como la enzima transaminasa de tipo salvaje u otra transaminasa modificada por ingeniena genetica. Las propiedades enzimaticas para las que es deseable una mejora incluyen, entre otras, la actividad enzimatica (que puede expresarse en terminos de conversion porcentual del sustrato), estabilidad termica, estabilidad del disolvente, perfil de actividad del pH, requisitos del cofactor, refractariedad a los inhibidores (por ejemplo, inhibicion de sustrato o producto), estereoespecificidad y estereoselectividad (incluida la enantioselectividad).
[0075] "Aumento de la actividad enzimatica" se refiere a una propiedad mejorada de los polipeptidos de transaminasa modificados, que puede ser representado por un aumento en la actividad espedfica (por ejemplo, producto producido/hora de protema/peso) o un aumento en el porcentaje de conversion del sustrato al producto (por ejemplo, el porcentaje de conversion de la cantidad inicial de sustrato a producto en un penodo de tiempo espedfico utilizando una cantidad espedfica de transaminasa) en comparacion con la enzima transaminasa de referencia. En los ejemplos se proporcionan metodos ejemplares para determinar la actividad de la enzima. Cualquier propiedad relacionada con la actividad enzimatica puede verse afectada, incluidas las propiedades enzimaticas clasicas de Km, Vmax o kcat, cuyos cambios pueden conducir a un aumento de la actividad enzimatica. Las mejoras en la actividad enzimatica pueden ser desde aproximadamente 1,1 veces la actividad enzimatica de la enzima transaminasa de tipo salvaje correspondiente, hasta 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces, 75 veces, 100 veces o mas actividad enzimatica que la transaminasa de origen natural u otra transaminasa disenada a partir de la cual se derivaron los polipeptidos de la transaminasa. En realizaciones espedficas, la enzima transaminasa modificada por ingeniena genetica presenta una actividad enzimatica mejorada en el intervalo de 1,5 a 50 veces, 1,5 a 100 veces o mayor que la de la enzima transaminasa parental. La actividad de la transaminasa se puede medir mediante cualquiera de los ensayos estandar, como el monitoreo de cambios en las propiedades espectrofotometricas de los reactivos o productos. En algunas realizaciones, la cantidad de productos producidos se puede medir mediante separacion por cromatograffa lfquida de alto rendimiento (HPLC) combinada con absorbancia UV o deteccion fluorescente despues de la derivatizacion con o-ftalialdehudo (OPA). Las comparaciones de las actividades enzimaticas se realizan utilizando una preparacion definida de la enzima, un ensayo definido en una condicion establecida y uno o mas sustratos definidos, como se describe con mas detalle en este documento. Generalmente, cuando se comparan los lisados, se determinan los numeros de celulas y la cantidad de protema analizada, asf como el uso de sistemas de expresion identicos y celulas huesped identicas para minimizar las variaciones en la cantidad de enzima producida por las celulas huesped y presente en los lisados.
[0076] "Conversion" se refiere a la conversion enzimatica del (de los) sustrato(s) para el (los) producto(s) correspondiente(s). "Porcentaje de conversion" se refiere al porcentaje del sustrato que se convierte al producto dentro de un penodo de tiempo en condiciones espedficas. Por lo tanto, la "actividad enzimatica" o "actividad" de un polipeptido de transaminasa se puede expresar como "porcentaje de conversion" del sustrato al producto.
[0077] "Termoestable" se refiere a un polipeptido de transaminasa que mantiene una actividad similar (mas de 60% a 80% por ejemplo) despues de la exposicion a temperaturas elevadas (por ejemplo, 40-80°C) durante un penodo de tiempo (por ejemplo, 0,5-24 horas) en comparacion con la enzima de tipo salvaje.
[0078] "Disolvente estable" se refiere a un polipeptido de transaminasa que mantiene una actividad similar (mas de por ejemplo, 60% a 80%) despues de la exposicion a concentraciones variables (por ejemplo, 5-99%) de disolvente (etanol, alcohol isopropflico, dimetilsulfoxido (DMSO), tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metilo terc-butilo eter, etc.) durante un penodo de tiempo (por ejemplo, 0,5-24 horas) en comparacion con la enzima de tipo salvaje.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0079] La "rigurosidad de hibridacion" se refiere a condiciones de hibridacion, tales como condiciones de lavado, en la hibridacion de acidos nucleicos. En general, las reacciones de hibridacion se realizan en condiciones de menor rigurosidad, seguidas de lavados de rigurosidad variable pero superior. El termino "hibridacion moderadamente rigurosa" se refiere a las condiciones que permiten que el ADN diana se una a un acido nucleico complementary que tiene una identidad de aproximadamente el 60%, preferiblemente una identidad de aproximadamente el 75%, una identidad de aproximadamente el 85% con el ADN diana, con una identidad superior a aproximadamente el 90% al polinucleotido diana. Los ejemplos de condiciones moderadamente rigurosas son condiciones equivalentes a la hibridacion en 50% de formamida, 5 X solucion de Denhart, 5 X SSPE, 0,2% de SDS a 42°C, seguido de lavado en 0,2xSSPE, 0,2% de SDS, a 42°C. "Hibridacion de alta rigurosidad" se refiere en general a condiciones que son aproximadamente 10°C o menos a partir de la temperatura de fusion termica Tm, segun se determina bajo la condicion de solucion para una secuencia de polinucleotidos definida. En algunas realizaciones, una condicion de rigurosidad alta se refiere a las condiciones que permiten la hibridacion solo de las secuencias de acido nucleico que forman hnbridos estables en NaCl 0,018M a 65°C (es dedr, si un hnbrido no es estable en NaCl 0,018M a 65°C), no sera estable en condiciones de alta rigurosidad, como se contempla en el presente documento). Se pueden proporcionar condiciones de alta rigurosidad, por ejemplo, mediante hibridacion en condiciones equivalentes a 50% de formamida, 5x solucion de Denhart, 5 X SSPE, 0,2% SDS a 42°C, seguido de lavado en 0,1 X SSPE y 0,1% SDS a 65°C. Otra condicion de alta rigurosidad es la hibridacion en condiciones equivalentes a la hibridacion en 5X SSC que contiene 0,1% (p:v) SDS a 65°C y lavado en 0,1x SSC que contiene 0,1% SDS a 65°C. Otras condiciones de hibridacion de alta rigurosidad, asf como condiciones moderadamente rigurosas, se describen en las referencias citadas anteriormente.
[0080] "Codon optimizado" se refiere a cambios en los codones del polinucleotido que codifican una protema a los utilizados preferentemente en un organismo particular, de manera que la protema codificada se expresa de manera mas eficiente en el organismo de interes. Aunque el codigo genetico esta degenerado porque la mayona de los aminoacidos estan representados por varios codones, llamados "sinonimos" o codones "sinonimos", es bien sabido que el uso de codones por parte de organismos particulares no es aleatorio y esta sesgado hacia tripletes de codones particulares. Este sesgo de uso del codon puede ser mayor en referencia a un gen dado, genes de funcion comun u origen ancestral, protemas altamente expresadas versus protemas de bajo numero de copias, y las regiones codificantes de protemas agregadas del genoma de un organismo. En algunas realizaciones, los polinucleotidos que codifican las enzimas transaminasas pueden ser codones optimizados para la produccion optima del organismo huesped seleccionado para la expresion.
[0081] La "secuencia de control" se refiere aqrn a la inclusion todos los componentes, que son necesarios o ventajosos para la expresion de un polinucleotido y/o polipeptido de la presente divulgacion. Cada secuencia de control puede ser nativa o ajena a la secuencia de acido nucleico que codifica el polipeptido. Dichas secuencias de control incluyen, entre otras, un lfder, una secuencia de poliadenilacion, una secuencia de propeptidos, un promotor, una secuencia de peptidos senal y un terminador de transcripcion. Como mmimo, las secuencias de control incluyen un promotor y senales de parada de transcripcion y traduccion. Las secuencias de control pueden proporcionarse con enlazadores con el fin de introducir sitios de restriccion espedficos que faciliten la ligadura de las secuencias de control con la region codificante de la secuencia de acido nucleico que codifica un polipeptido.
[0082] "Conectado operativamente" se define en el presente documento como una configuracion en la que una secuencia de control se coloca adecuadamente (es decir, en una relacion funcional) en una posicion relativa a un polinucleotido de interes tal que la secuencia de control dirige o regula la expresion del polinucleotido y/o polipeptido de interes.
[0083] "Secuencia promotora" se refiere a una secuencia de acido nucleico que es reconocida por una celula huesped para la expresion de un polinucleotido de interes, tal como una secuencia de codificacion. La secuencia promotora contiene secuencias de control transcripcional, que median la expresion de un polinucleotido de interes. El promotor puede ser cualquier secuencia de acido nucleico que muestre actividad transcripcional en la celula huesped de eleccion, incluidos los promotores mutantes, truncados e hnbridos, y puede obtenerse de genes que codifican polipeptidos extracelulares o intracelulares, ya sea homologos o heterologos a la celula huesped.
[0084] "Alquilo" se refiere a grupos de 1 a 18 atomos de carbono, ya sea de cadena lineal o ramificada, particularmente de 1 a 8 atomos de carbono, y mas particularmente de 1 a 6 atomos de carbono. Un alquilo con un numero espedfico de atomos de carbono se indica entre parentesis, por ejemplo, alquilo (C1-C4) se refiere a un alquilo de 1 a 4 atomos de carbono.
[0085] "Alquenilo" se refiere a grupos de de 2 a 12 atomos de carbono, ya sean lineales o ramificados que contienen al menos un doble enlace, pero que contiene opcionalmente mas de un doble enlace.
[0086] "Alquinilo" se refiere a grupos de 2 a 12 atomos de carbono, ya sean lineales o ramificados que contienen al menos un triple enlace, pero que opcionalmente contienen mas de un enlace triple, y que contienen opcionalmente uno o mas restos dobles unidas.
[0087] "Arilo" se refiere a un grupo carbodclico aromatico insaturado de 5 a 14 atomos de carbono que tiene un solo
5
10
15
20
25
30
35
40
45
50
55
60
65
anillo (por ejemplo, fenilo) o multiples anillos condensados (por ejemplo, naftilo o antrilo). Para anillos condensados multiples, al menos uno de los anillos es aromatico. Arilos representativos incluyen fenilo, piridilo, naftilo y similares.
[0088] "Arilalquilo" se refiere a un alquilo sustituido con un resto arilo. Los grupos arilalquilo representativos incluyen bencilo, fenetilo y similares.
[0089] "Arilalquenilo" se refiere a un alquenilo como se define aqrn sustituido con un grupo arilo.
[0090] "Arilalquinilo" se refiere a un alquinilo como se define aqrn sustituido con un grupo arilo.
[0091] "Heteroarilo" se refiere a un grupo heterodclico aromatico de 5 a 14 atomos anulares que contienen 1 a 4 heteroatomos en el anillo seleccionado entre oxfgeno, nitrogeno y azufre dentro del anillo. Los grupos heteroarilo pueden tener un solo anillo (por ejemplo, piridilo o furilo) o multiples anillos condensados (por ejemplo, indolizinilo o benzotienilo). Para anillos condensados multiples, al menos uno de los anillos es aromatico.
[0092] "Heteroarilalquilo" se refiere a un alquilo sustituido con un resto heteroarilo como se define aqrn.
[0093] "Heteroarilalquenilo" se refiere a un alquenilo sustituido con un grupo heteroarilo como se define aqrn.
[0094] "Heteroarilalquinilo" se refiere a un alquinilo sustituido con un resto heteroarilo como se define aqrn.
[0095] "Cicloalquilo" se refiere a grupos alquilo dclicos de 3 a 12 atomos de carbono que tienen un solo anillo dclico o multiples anillos condensados. Los grupos cicloalquilo representativos incluyen, a modo de ejemplo, estructuras de un solo anillo tales como ciclopropilo, ciclobutilo, ciclopentilo, ciclooctilo, 1 -metilciclopropilo, 2-metilciclopentilo, 2- metilciclooctilo, y similares, o estructuras de multiples anillos, tales como sistemas de anillos de puente, tales como como adamantilo, y similares.
[0096] "Heterociclo" y de manera intercambiable "heterocicloalquilo" se refiere a un grupo saturado o insaturado que tiene un solo anillo o multiples anillos condensados, de 3 a 14 atomos en el anillo que tienen de 1 a 4 heteroatomos seleccionados de nitrogeno, azufre u oxfgeno dentro del anillo. Los grupos heterodclicos pueden tener un unico anillo (por ejemplo, piperidinilo o tetrahidrofurilo) o multiples anillos condensados (por ejemplo, indolinilo, dihidrobenzofurano o quinuclidinilo). Los heterociclos y heteroarilos representativos incluyen, pero no se limitan a, furano, tiofeno, tiazol, oxazol, pirrol, imidazol, pirazina, piridina, pirazina, pirimidina, piridazina, indolizina, isoindol, indol, indazol, purina, quinolizina, isoquinolina, quinolina, ftalazina, naftilpiridina, quinoxalina, quinazolina, cinolina, pteridina, carbazol, carbolina, fenantridina, acridina, fenantrolina, isotiazol, fenazina, isoxazol, fenoxazina, fenotiazina, imidazolidina, imidazolina, piperidina, piperazina, pirrolidina, indolina y similares.
[0097] "Cicloalquilalquilo" se refiere a un alquilo sustituido con un resto cicloalquilo como se define en el presente documento.
[0098] "Cicloalquilalquenilo" se refiere a un alquenilo sustituido con un resto cicloalquilo como se define en el presente documento.
[0099] "Cicloalquilalquinilo" se refiere a un alquinilo sustituido con un resto cicloalquilo como se define en el presente documento.
[0100] "Heterocicloalquilalquilo" se refiere a un alquilo sustituido con un resto heterocicloalquilo como se define en el presente documento.
[0101] "Heterocicloalquenilo" se refiere a un alquenilo sustituido con un resto heterocicloalquilo como se define en el presente documento.
[0102] "Heterocicloalquilalquinilo" se refiere a un alquinilo sustituido con un resto heterocicloalquilo como se define en el presente documento.
[0103] "Alcoxi" o "alquiloxi" se refiere al grupo alquilo-O- en el que el grupo alquilo es como se define anteriormente, incluyendo grupos alquilo opcionalmente sustituidos como tambien se definen anteriormente.
[0104] "Amino" se refiere al grupo -NH2. Amino sustituido se refiere al grupo -NHR', NR'R' y NR'R'R', donde cada R' es independientemente de los otros seleccionados entre alquilo, cicloalquilo, heterocicloalquilo, cicloalquilalquilo, cicloalquilalquilo, alquiloxi, arilo, heteroarilo, arilalquilo, heteroarilalquilo, acilo, alquiloxicarbonilo, sulfanilo, sulfinilo, sulfonilo y similares. Los grupos amino tipicos incluyen, pero estan limitados a, dimetilamino, dietilamino, trimetilamonio, trietilamonio, metilsulfonilamino, furanilo-oxi-sulfamino, y similares.
[0105] "Carboxi" se refiere a -COOH.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0106] "Carbonilo" se refiere a -C(O)-, que puede tener una variedad de sustituyentes para formar diferentes grupos carbonilo, incluyendo acidos, halogenuros de acido, aldetudos, amidas, esteres y cetonas.
[0107] "Hidroxi" se refiere a -OH.
[0108] "Ciano" se refiere a -CN.
[0109] "Halogeno" o "halo" se refiere a fluor, cloro, bromo y yodo.
[0110] "Sulfonilo" se refiere a -SO2-. Sulfonilo sustituido se refiere a -SO2R', donde R' es un sustituyente adecuado como se describe abajo.
[0111] "Fusionado" o "anillos fusionados", tal como arilo fusionado o heteroarilo fusionado, se refiere a dos o mas anillos unidos de manera que tienen al menos dos atomos de anillo en comun. Arilo fundido se refiere a anillos fundidos en los cuales al menos uno de los anillos es un arilo. Heteroarilo fusionado se refiere a anillos fusionados en los que al menos uno de los anillos es un heteroarilo.
[0112] "Sustituido", a menos que se especifique lo contrario, se refiere al reemplazo de las posiciones ocupadas por el hidrogeno en los grupos anteriores con sustituyentes ejemplificados por, pero no limitados a, hidroxi, oxo, nitro, metoxi, etoxi, alquiloxi, alquiloxi sustituido, trifluorometoxi, haloalquiloxi, fluor, cloro, bromo, yodo, halo, metilo, etilo, propilo, butilo, alquilo, alquenilo, alquinilo, alquilo sustituido, trifluorometilo, haloalquilo, hidroxialquilo, alquiloxialquilo, tio, alquiltio, acilo, carboxi, alquiloxi-carbonilo, carboxamido, carboxamido sustituido, alquilsulfonilo, alquilsulfinilo, alquilsulfonilamino, sulfonamido, sulfonamido sustituido, ciano, amino, amino sustituido, alquilamino, dialquilamino, aminoalquilo, acilamino, amidino, amidoximo, hidroxamoflo, fenilo, arilo, arilo sustituido, arilalquilo, arilalquenilo, arilalquinilo, piridilo, imidazolilo, heteroarilo, heteroarilo sustituido, heteroariloxi, heteroarilalquilo, heteroarilalquenilo, heteroarilalquinilo, ciclopropilo, ciclobutilo, ciclopentilo, ciclohexilo, cicloalquilo, cicloalquenilo, cicloalquilalquilo, cicloalquilo sustituido, cicloalquiloxi, pirrolidinilo, piperidinilo, morfolino, heterociclo, (heterociclo)oxi, y (heterociclo)alquilo; y los heteroatomos preferidos son oxfgeno, nitrogeno y azufre. Se entiende que cuando existen valencias abiertas en estos sustituyentes, se pueden sustituir adicionalmente con grupos alquilo, cicloalquilo, arilo, heteroarilo y/o heterociclo, y que cuando existen estas valencias abiertas en el carbono, se pueden sustituir adicionalmente con halogeno y oxfgeno., sustituyentes unidos a nitrogeno, o azufre, y donde existen multiples valencias abiertas, estos grupos pueden unirse para formar un anillo, ya sea por formacion directa de un enlace o por formacion de enlaces a un nuevo heteroatomo, preferiblemente oxfgeno, nitrogeno, o azufre. Se entiende ademas que las sustituciones anteriores se pueden realizar siempre que la sustitucion del hidrogeno con el sustituyente no introduzca una inestabilidad inaceptable en las moleculas de la presente invencion y, por lo demas, sea qmmicamente razonable.
[0113] "Opcional" u "opcionalmente" significa que el evento o circunstancia que se describe posteriormente puede o no ocurrir, y que la descripcion incluye casos en los que dicho evento o circunstancia ocurre y casos en los que no. Un experto en la tecnica entendera que con respecto a cualquier molecula descrita por contener uno o mas sustituyentes opcionales, solo compuestos estericamente practicos y/o sinteticamente factibles deben incluirse. "Opcionalmente sustituido" se refiere a todos los modificadores posteriores en un termino o serie de grupos qrnmicos. Por ejemplo, en el termino "arilalquilo opcionalmente sustituido, la porcion "alquilo" y la porcion "arilo" de la molecula pueden o no estar sustituidas, y para la serie "alquilo, cicloalquilo, arilo y heteroarilo opcionalmente sustituidos," los grupos de alquilo cicloalquilo, arilo y heteroarilo, independientemente de los otros, pueden estar o no sustituidos.
[0114] "Grupo protector" se refiere a un grupo de atomos que enmascaran, reducen o previenen la reactividad del grupo funcional cuando se unen a un grupo funcional reactivo en una molecula. Tfpicamente, un grupo protector puede eliminarse selectivamente segun se desee durante el curso de una smtesis. Se pueden encontrar ejemplos de grupos protectores en Wuts y Greene, "Greene's Protective Groups in Organic Synthesis", 4a ed., Wiley Interscience (2006), y Harrison et al., Compendium of Synthetic Organic Methods, Vols. 1-8, 1971-1996, John Wiley & Sons, NY. Los grupos funcionales que pueden tener un grupo protector incluyen, pero no se limitan a, grupos hidroxi, amino y carboxi. Los grupos protectores de amino representativos incluyen, pero no se limitan a, formilo, acetilo, trifluoroacetilo, bencilo, benciloxicarbonilo ("CBZ"), terc-butoxicarbonilo ("Boc"), trimetilsililo ("TMS"), 2-trimetilsililo- etanosulfonilo (“SES”), grupos tritilo y tritilo sustituido, aliloxicarbonilo, 9-flu-orenilmetiloxicarbonilo (“FMOC”), nitro- veratriloxicarbonilo (“NVOC”) y similares. Los grupos protectores de hidroxilo representativos incluyen, pero no se limitan a, aquellos en los que el grupo hidroxilo esta acilado (por ejemplo, esteres metflicos y etflicos, grupos acetato o propionato o esteres glicolicos) o alquilados tales como eteres bendlicos y tritflicos, asf como eteres alqrnlicos, eteres de tetrahidropiranilo, eteres de trialquilsililo (por ejemplo, grupos TMS o TIPPS) y eteres de alilo. Otros grupos protectores se pueden encontrar en las referencias indicadas en este documento.
[0115] "Grupo saliente" generalmente se refiere a cualquier atomo o resto que puede ser desplazado por otro atomo o resto en una reaccion qrnmica. Mas espedficamente, un grupo saliente se refiere a un atomo o resto que se desplaza facilmente y se sustituye por un nucleofilo (por ejemplo, una amina, un tiol, un alcohol o un cianuro). Dichos grupos salientes son bien conocidos e incluyen carboxilatos, N-hidroxisuccinimida ("NHS"), N-hidroxibenzotriazol, un
5
10
15
20
25
30
35
40
45
50
55
60
65
halogeno (fluor, cloro, mina o yodo) y grupos alquiloxi. Se pueden encontrar caractensticas no limitantes y ejemplos de grupos salientes, por ejemplo en Organic Chemistry, 2d ed., Francis Carey (1992), paginas 328-331; Introduction to Organic Chemistry, 2a ed., Andrew Streitwieser y Clayton Heathcock (1981), paginas 169-171; y Organic Chemistry, 5a edicion, John McMurry, Brooks/Cole Publishing (2000), paginas 398 y 4o8.
[0116] "Condiciones de reaccion adecuadas" se refiere a aquellas condiciones en la solucion de reaccion biocatalttica (por ejemplo, rangos de carga de enzimas, carga de sustrato, carga de cofactor, temperatura, pH, tampones, codisolventes, etc.) bajo los cuales se encuentra una transaminasa. El polipeptido de la presente divulgacion puede convertir un sustrato en el compuesto de producto amino deseado, por ejemplo, convertir el compuesto (2) en el compuesto (1). Las "condiciones de reaccion adecuadas" ejemplares se proporcionan en la presente divulgacion y se ilustran mediante los Ejemplos.
[0117] "Carga", como en "carga de compuesto" o "carga de enzima" se refiere a la concentracion o cantidad de un componente en una mezcla de reaccion al comienzo de la reaccion.
[0118] "Sustrato" en el contexto de un proceso mediado por biocatalizadores se refiere al compuesto o molecula sobre la que actua el biocatalizador. Por ejemplo, un sustrato ejemplar para el biocatalizador de transaminasas en los procesos descritos en este documento es el compuesto (2), cuya preparacion se describe en la patente de EE.UU. N° 7,326,708 B2, emitida el 5 de febrero de 2008.
[0119] "Producto" en el contexto de un proceso mediado por biocatalizadores se refiere al compuesto o molecula resultante de la accion del biocatalizador. Por ejemplo, un producto ejemplar para el biocatalizador de transaminasas en los procesos descritos en este documento es el compuesto (1).
5.3 Polipeptidos modificados que tienen actividad de transaminasa
[0120] La presente divulgacion proporciona polipeptidos modificados que tienen actividad de transaminasa (tambien denominados aqu "polipeptidos de transaminasa modificados") utiles para la transaminacion selectiva de compuestos de sustrato de aceptor amino de formula estructural (II) (vease el Esquema 3) para producir productos de amina quiral de Formula estructural (I), que, en algunas realizaciones, pueden incluir el compuesto (1), el ingrediente farmaceutico activo, sitagliptina. Por consiguiente, en un aspecto, la presente divulgacion se refiere a polipeptidos modificados que tienen actividad de transaminasa que son capaces de convertir el compuesto de sustrato (2) en el compuesto del producto (1) como se muestra en el Esquema 2. Ademas, la presente divulgacion proporciona polinucleotidos que codifican los polipeptidos modificados mediante ingeniena genetica. Vectores asociados y celulas huesped que comprenden los polinucleotidos, metodos para fabricar los polipeptidos modificados y metodos para usar los polipeptidos modificados, incluidas las condiciones de reaccion adecuadas.
[0121] Los polipeptidos modificados de la descripcion son las transaminasas no naturales disenadas para tener propiedades enzimaticas mejoradas (tales como una mayor estereoselectividad) en comparacion con el polipeptido de transaminasa de tipo salvaje de Arthrobacter sp. KNK168 (GenBank Acc. BAK39753.1, GI: 336088341), y tambien en comparacion con el polipeptido de transaminasa de referencia de SEQ ID NO:2, que se uso como la secuencia principal de partida para la evolucion dirigida de los polipeptidos modificados geneticamente de la presente divulgacion. El polipeptido de transaminasa de referencia de la SEQ ID NO:2 tiene las siguientes 28 diferencias de aminoacidos con respecto a la transaminasa de tipo salvaje de Arthrobacter sp. KNK168: S8P, Y60F, L61Y, H62T, V65A, V69T, D81G, M94I, I96L, F122M, S124T, S126T, G136F, Y150S, V152C, A169L, V199I, A209L, G215C, G217N, S223P, L269P, L273Y, T282S, A284G, P297S, I306V y S321P.
[0122] Los polipeptidos de transaminasa modificados de la presente descripcion se generaron por evolucion dirigida de sEq ID NO:2 para la conversion eficaz de compuesto (2) en el compuesto (1) bajo ciertas condiciones industrialmente relevantes y tiene una o mas diferencias de residuos en comparacion con el polipeptido de la transaminasa modificado geneticamente de referencia de la SEQ ID NO:2. Estas diferencias de residuos se asocian con mejoras en diversas propiedades enzimaticas, particularmente en el aumento de la actividad, el aumento de la estereoselectividad, el aumento de la estabilidad y la tolerancia al aumento del sustrato y/o la concentracion del producto (por ejemplo, disminucion de la inhibicion del producto). Por consiguiente, en algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa son capaces de convertir el compuesto de sustrato (2) en el compuesto (1) con una actividad que se incrementa al menos aproximadamente 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces, 20 veces, 30 veces, 40 veces, 50 veces, 100 veces, 200 veces, 500 veces, 1000 veces o mas con respecto a la actividad del polipeptido de referencia de la SEQ ID NO:2 en condiciones de reaccion adecuadas. En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa pueden convertir el sustrato del compuesto (2) en el compuesto (1) con un porcentaje de conversion de al menos aproximadamente el 40%, al menos aproximadamente el 50%, al menos aproximadamente el 60%, al menos aproximadamente el 70%, al menos aproximadamente el 80%, o al menos aproximadamente el 90%, al menos aproximadamente el 95%, al menos aproximadamente el 98%, al menos aproximadamente el 99%, en un tiempo de reaccion de aproximadamente 48 h, aproximadamente 36 h, aproximadamente 24 h, o incluso un penodo de tiempo mas corto, en condiciones de reaccion adecuadas. En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa son capaces de convertir el compuesto (2) en el compuesto (1) en un exceso
5
10
15
20
25
30
35
40
45
50
55
60
65
enantiomerico de al menos 90%, 95%, 97%, 98%, 99% o mayor, bajo condiciones de reaccion adecuada.
[0123] La presente divulgacion proporciona numerosos polipeptidos de transaminasa modificados ejemplares que comprenden secuencias de aminoacidos de los identificadores de secuencia de numero par SEQ ID NO:4 - 306. Estos polipeptidos de transaminasa modificados ejemplares comprenden secuencias de aminoacidos que incluyen una o mas de las siguientes diferencias de residuos asociadas con sus propiedades mejoradas para la conversion del compuesto (2) en compuesto (1) en comparacion con la SEQ ID NO:2: (a) X33L, X36C, X41c/f/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R; y/o (b) una combinacion de diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0124] En algunos casos, los polipeptidos ejemplares de ingeniena tienen una secuencia de aminoacidos que comprende, ademas, una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T, X152S/T/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241R, X267V, X270T, X273H, X225M y X328I. C215G. En algunos casos, los polipeptidos modificados a modo de ejemplo tienen una secuencia de aminoacidos que comprende ademas una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: G36C, I41C, I41F, I41K, I41M, I41N, I41R, E42G, P48D, P48E, P48G, P48K, P48T, A51K, S54P, M122F, M122Q, Y148Q, C152T, Q155A, Q155I, Q155K, Q155T, Q155V, C215H, C215L, Y273H, L325M, y A1121; o (b) una combinacion de diferencias de residuos seleccionadas de: A5K, E42G, S49T, S54P, C152S, Q155T y W156Q; P33L, I41C, E42G, S54P, S150F, C152S, Q155K, F160P y C215G; P33L, I41K, E42G, S54P, S150F, C152S, Q155I, F160P y C215L; P33L, E42G, P48G, S54P, S150F, C152S, Q155T y C215H; P33L, E42G, S54P, A109S, S150F, C152S, Q155K, W156Q y C215H; P33L, E42G, S54P, E117G, S150F, C152S, Q155I, W156Q y C215G; P33L, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G; P33L, E42G, S54P, S150F, C152S, Q155K, W156Q y C215H; P33L, E42G, S54P, S150F, C152S, Q155L, W156Q y C215H; P33L, E42G, S54P, S150F, C152S, Q155L, W156Q, C215H y A241R; G36C, E42G, P48G, S54P, S150F, C152S, Q155I. y C215H; G36C, E42G, P48K, S54P, S150F, C152S, Q155T y C215H; G36C, E42G, S54P, S150F, C152S, Q155I, C215H y A241R; G36C, E42G, S54P, S150F, C152S, Q155K, C215H y A241R; G36C, E42G, S54P, S150F, C152S, Q155T y A241R; G36C, E42G, S54P, S150F, C152S, Q155V y C215H; I41C, E42G, S49T, S54P, S150F, C152S, Q155I, F160P, C215G y I267V; I41C, E42G, S49T, S54P, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S y Q155K; I41C, E42G, S54P, I108V, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S, Q155T, W156Q y C215G; I41C, E42G, S54P, E117G, S150F, C152S, Q155K y F160P; I41C, E42G, S54P, E117G, S150F, C152S, Q155K y C215L; I41C, E42G, S54P, E117G, S150F, C152S, Q155L y C215L; I41C, E42G, S54P, S150F, C152S, Q155I y C215G; I41C, E42G, S54P, S150F, C152S, Q155I y C215L; I41C, E42G, S54P, S150F, C152S, Q155K, W156Q, C215G y I267V; 141C, E42G, S54P, S150F, C152S, Q155K y C215L; 141C, E42G, S54P, S150F, C152S, Q155K y C215G; I41C, E42G, S54P, S150F, C152S, Q155L, F160P, C215G e I267V; I41C, E42G, S54P, S150F, C152S, Q155T, W156Q, F160P y C215L; I41C, E42G, S54P, S150F, C152S, Q155T, W156Q y C215L; I41F, E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q y C215G; I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I y C215G; I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R; I41F, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G; I41K, E42G, P48E, S54P, S150F, C152S, Q155K y W156Q; I41K, E42G, P48E, S54P, S150F, C152S, Q155L y C215L; I41K, E42G, S54P, I108V, E117G, S150F, C152S, Q155K y C215L; I41K, E42G, S54P, I108V, S150F, C152S, Q155T y C215G; I41K, E42G, S54P, E117G, S150F, C152S, Q155L y C215G; I41K, E42G, S54P, E117G, S150F, C152S, Q155K, C215L y I267V; I41K, E42G, S54P, S150F, C152S, Q155K,
5
10
15
20
25
30
35
40
45
50
55
60
65
W156Q y C215G; I41K, E42G, S54P, S150F, C152S, Q155K, F160P, C215G e I267V; I41K, E42G, S54P, S150F, C152S, Q155K y C215L; I41K, E42G, S54P, S150F, C152S y Q155T; I41K, E42G, S54P, S150F, C152S, Q155T y F160P; I41K, E42G, S54P, S150F, C152S, Q155T y C215G; I41K, E42G, S54P, S150F, C152S, Q155T, C215G e I267V; I41K, E42G, S54P, S150F, C152S, Q155K, W156Q y C215G; I41N, E42G, S54P, S150F, C152S, Q155I y F160P; I41N, E42G, S54P, E117G, S150F, C152S, Q155T; y W156Q; I41N, S49T, E42G, S54P, S150F, C152S, Q155L, F160P, D165N y C215L; E42A, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V; E42G, A44Q, S54P, I108V, S150F, C152S y Q155T; E42G, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V; E42G, A44Q, S54P, S150A, C152S y Q155T; E42G, A44Q, S54P, S150F, C152S y Q155T; E42G, P48G, S54P, S150F, C152S, Q155L, W156Q y C215H; E42G, P48G, S54P, S150F, C152S y Q155T; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155L, F160P y C215L; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155K, W156Q y C215G; E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155T, W156Q, C215G e I267V; E42G, S49T, S54P, C152S, Q155T y W156Q; E42G, S54P, I55L, T126A, C152S, Q155T, L218M y A270T; E42G, S54P, F60V, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, T68A, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, T69S, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, N76S, T126A, C152S, Q155T, S182T, L218M, A270T y V328I; E42G, S54P, I108V, S150F, C152S, Q155K y C215H; E42G, S54P, I108V, S150F, C152S y Q155T; E42G, S54P, I108V, S150F, C152S, Q155T e I267V; E42G, S54P, I108V, S150F, C152S, Q155V, W156Q y F160P; E42G, S54P, E117G, C152S y Q155T; E42G, S54P, E117G, C152S, Q155T y W156Q; E42G, S54P, M122Q, S150F, C152S, Q155I, W156Q, C215G y A241R; E42G, S54P, M122Q, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R; E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q, V171I, C215G y A241R; E42G, S54P, T126M, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, P135I, F136Y, S150F, C152S, Q155L, W156Q, W192F y C215G; E42G, S54P, F136I, S150F, C152S, Q155L, W156Q y C215G; E42G, S54P, F136I, S150F, C152S, Q155L, W156Q, C215G y G224I; E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G, S282V y G284I; E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G y G284P; E42G, S54P, F136Y, S150F, C152S, Q155L, W156Q, C215G, S282V y G284P; E42G, S54P, S150A, C152S, Q155T e I267V; E42G, S54P, S150F, C152S, Q155I, W156Q, F160P, C215L e I267V; E42G, S54P, S150F, C152S, Q155I, W156Q, V171I, C215G y A241R; E42G, S54P, S150F, C152S, Q155I, W156Q y C215L; E42G, S54P, S150F, C152S, Q155I, F160P y C215G; E42G, S54P, S150F, C152S, Q155I y C215H; E42G, S54P, S150F, C152S, Q155K y W156Q; E42G, S54P, S150F, C152S, Q155K,
W156Q e I267V; E42G, S54P, S150F, C152S, Q155L, W156Q, G193M y C215G; E42G, S54P, S150F, C152S,
Q155L, W156Q y C215G; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G, S282V y G284I; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y T283S; E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y G284I; E42G, S54P, S150F, C152S, Q155L, W156Y y C215G; E42G, S54P, S150F, C152S, Q155L y C215H; E42G, S54P, S150F, C152S y Q155T; E42G, S54P, S150F, C152S, Q155T, C215G e I267V; E42G, S54P, S150F, C152S, Q155T e I267V; E42G, S54P, S150F, C152S, Q155T, W156Q, F160P, C215L e I267V; E42G, S54P, S150F, C152S, Q155T, W156Q, C215G e I267V; E42G, S54P, S150F, C152S, Q155T y W156R; E42G, S54P, S150F, C152S,
Q155T, F160P y C215G; E42G, S54P, S150F, C152S, Q155T, F160P y C215L; E42G, S54P, S150F, C152S,
Q155T, C215G e I267V; E42G, S54P, S150F, C152S, Q155T e I267V; E42G, S54P, C152S, Q155I y W156S; E42G, S54P, C152S, Q155K y W156S; E42G, S54P, C152S, Q155L y W156S; E42G, S54P, C152S y Q155T; E42G, S54P, C152S, Q155T y F160P; E42G, S54P, C152S, Q155T y R164P; E42G, S54P, C152S, Q155T y W156Q; E42G, S54P, C152S, Q155T y W156S; E42G, S54P, C152S, Q155T y R164P; E42G, S54P, C152S, Q155T, S182T, L218M y A270T; E42G, S54P, C152S, Q155T y C215G; E42G, S54P, C152S, Q155T y C215L; y E42G, S54P, C152S, Q155V y W156S.
[0125] En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa son capaces de convertir el compuesto (2) en el compuesto (1) con tolerancia incrementada para la presencia del sustrato con respecto a la tolerancia del sustrato del polipeptido de referencia de la SEQ ID NO:2 bajo condiciones de reaccion adecuadas. Por consiguiente, en algunas realizaciones, los polipeptidos modificados por ingeniena genetica son capaces de convertir el sustrato del compuesto (2) en el compuesto (1) en presencia de una concentracion de carga de sustrato de al menos aproximadamente 1 g/L, 5 g/L, 10 g/L, 20 g/L, aproximadamente 30 g/L, aproximadamente 40 g/L, aproximadamente 50 g/L, aproximadamente 70 g/L, aproximadamente 100 g/L, con un porcentaje de conversion de al menos aproximadamente el 40%, a al menos aproximadamente el 50%, al menos aproximadamente el 60%, al menos aproximadamente el 70%, al menos aproximadamente el 80%, al menos aproximadamente el 90%, al menos aproximadamente el 95%, al menos aproximadamente el 98%, o al menos aproximadamente el 99%, en un tiempo de reaccion de aproximadamente 72 h, aproximadamente 48 h, aproximadamente 36 h, aproximadamente 24 h, o incluso un penodo de tiempo mas corto, en condiciones de reaccion adecuadas.
[0126] Las condiciones de reaccion adecuadas en las que las propiedades mejoradas descritas anteriormente de los polipeptidos modificados se pueden determinar con concentraciones respeto o cantidades de polipeptido, sustrato, donante de amina, cofactor, tampon, co-disolvente, pH, y/o condiciones, incluyendo temperatura y tiempo de reaccion. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden las condiciones de ensayo de HTP, SFP o DSP descritas a continuacion y en los Ejemplos.
[0127] La estructura y la informacion de la funcion para polipeptidos de transaminasas modificados de forma no natural ejemplares de la presente divulgacion se muestran a continuacion en las Tablas 2A, 2B y 2C. Los identificadores de secuencia numerada impar (es decir, SEQ ID NO) se refieren a la secuencia de nucleotidos (nt) que codifica la secuencia de aminoacidos (aa) proporcionada por las SEQ ID NO numeradas pares, y las secuencias
5
10
15
20
25
30
35
40
45
50
55
60
65
se proporcionan en el archivo de listado de secuencia electronica que acompana a este revelacion. Las diferencias de residuos de aminoacidos se basan en la comparacion con la secuencia polipeptidica de referencia de la SEQ ID NO:2, cuya secuencia genica se uso como punto de partida para la evolucion dirigida de polipeptidos modificados geneticamente que tienen mayor actividad en la conversion del compuesto (2) en compuesto (1) bajo ciertas condiciones de reaccion industrialmente utiles. La actividad de cada polipeptido modificado se determino utilizando un ensayo de alto rendimiento (HTP) (como un cribado primario) y, en algunos casos, un ensayo secundario en polvo de matraz de agitacion (SFP) y/o un ensayo en polvo procesado en sentido descendente (DSP). Los valores de ensayo de HTP proporcionados en la Tabla 2A se determinaron utilizando lisados de celulas claras de E. coli en un formato de placa de 96 pocillos despues de las condiciones de reaccion del ensayo como se indica en la Tabla. Las preparaciones de enzimas SFP y DSP proporcionan una preparacion en polvo mas purificada de los polipeptidos modificados. Los valores de ensayo de SFP en la Tabla 2B se determinaron usando SFP de los polipeptidos modificados en un formato de vial de 5 mL usando las condiciones de reaccion indicadas en la Tabla. Los valores del ensayo DSP en la Tabla 2C se determinaron usando polvos DSP de los polipeptidos modificados en un formato de vial de 5 mL usando las condiciones de reaccion indicadas en la Tabla. En los ejemplos se describen detalles adicionales de las preparaciones y ensayos de HTP, SFP y DSP.
Tabla 2A: Actividad HTP
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) Actividad Pliegue- Mejora1 Condiciones de reaccion del ensayo2
1/2
Ninguna 1 A
3/4
A241R 1,5 A
5/6
A241R; L325M 1,4 A
7/8
G36C 1,4 A
9/10
P48D 1,5 A
11/12
P48T 1,2 A
13/14
I41R 1,5 A
15/16
I41K; L325M 1,9 A
17/18
E42G 1,3 A
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) Actividad Pliegue- Mejora1 Condiciones de reaccion del ensayo2
19/20
A51K 2,7 A
21/22
P48G 1,3 A
23/24
P48E 1,6 A
25/26
I41F 1,5 A
27/28
I41R; L325M 1,6 A
29/30
P48K 1,5 A
31/32
S54P 1,4 A
33/34
I41M 1,3 A
35/36
I41N 1,6 A
37/38
I41C 1,9 A
39/40
M122Q 2,3 A
41/42
M122F 1,7 A
43/44
Q155I 1,3 A
45/46
Y148Q 1,4 A
47/48
Q155V 1,7 A
49/50
Q155K 1,7 A
51/52
Q155T 2,0 A
53/54
Q155A 1,6 A
55/56
C152T 1,6 A
57/58
C215L; Y273H 1,2 A
59/60
C215H 1,4 A
61/62
E42G; S54P; C152S; Q155T 4,0 A
63/64
E42G; S54P; C152S; Q155T; R164P 5,6 A
65/66
E42G; S54P; I108V; S150F; C152S; Q155T 5,6 B
67/68
E42G; A44Q; S54P; I108V; S150F; C152S; Q155T 6,4 B
69/70
E42G; S54P; S150F; C152S; Q155T; I267V 7,6 B
71/72
E42G; S54P; I108V; S150F; C152S; Q155T; I267V 4,4 B
73/74
E42G; A44Q; S54P; I108V; S150F; C152S; Q155T; I267V 6,0 B
75/76
E42G; A44Q; S54P; S150F; C152S; Q155T 6,8 B
77/78
E42G; S54P; S150F; C152S; Q155T 7,6 B
79/80
E42A; A44Q; S54P; I108V; S150F; C152S; Q155T; I267V 6,4 B
81/82
E42G; S54P; S150A; C152S; Q155T; I267V 2,4 B
83/84
E42G; A44Q; S54P; S150A; C152S; Q155T 3,6 B
85/86
E42G; S54P; N76S; T126A; C152S; Q155T; S182T; L218M A270T; V328I 5,2 B
87/88
E42G; S54P; I55L; T126A; C152S; Q155T; L218M; A270T 6,0 B
89/90
E42G; S54P; C152S; Q155T; S182T; L218M; A270T 3,2 B
91/92
A5K; E42G; S49T; S54P; C152S; Q155T; W156Q 4,8 B
93/94
E42G; S54P; E117G; C152S; Q155T; W156Q 5,6 B
95/96
E42G; S54P; C152S; Q155T; W156Q 7,6 B
97/98
E42G; S54P; E117G; C152S; Q155T 4,8 B
99/100
E42G; S49T; S54P; C152S; Q155T; W156Q 6,8 B
101/102
E42G; S54P; C152S; Q155T; W156S 9,2 B
103/104
E42G; S54P; C152S; Q155T; C215L 6,0 B
105/106
E42G; S54P; C152S; Q155T; C215G 6,4 B
107/108
E42G; S54P; C152S; Q155I; W156S 13,2 B
109/110
E42G; S54P; C152S; Q155V; W156S 9,6 B
111/112
E42G; S54P; C152S; Q155L; W156S 14,8 B
113/114
E42G; S54P; C152S; Q155K; W156S 13,6 B
115/116
E42G; S54P; C152S; Q155T; F160P 6,8 B
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) Actividad Pliegue- Mejora1 Condiciones de reaccion delensayo2
117/118
I41K; E42G; S54P; S150F; C152S; Q155T; C215G 14,4 B
119/120
I41C; E42G; S54P; S150F; C152S; Q155I; C215G 12,8 B
121/122
E42G; S54P; S150F; C152S; Q155T; C215G; 1267V 14,8 B
123/124
I41K; E42G; S54P; I108V; S150F; C152S; Q155T; C215G 12,4 B
125/126
I41C; E42G; S54P; I108V; S150F; C152S; Q155K; W156Q; C215G; I267V 18,4 B
127/128
E42G; S49T; S54P; I108V; E117G; S150F; C152S; Q155L; F160P; C215L 4,0 B
129/130
E42G; S54P; S150F; C152S; Q155L; W156Q; C215G 5,6 B
131/132
I41C; E42G; S49T; S54P; S150F; C152S; Q155K; W156Q; C215G; I267V 6,4 B
133/134
I41C; E42G; S54P; S150F; C152S; Q155T; W156Q; C215L 7,6 B
135/136
E42G; S54P; S150F; C152S; Q155K; W156Q; I267V 4,4 B
137/138
I41N; E42G; S54P; S150F; C152S; Q155I; F160P 6,0 B
139/140
I41K; E42G; S54P; S150F; C152S; Q155K; F160P; C215G; I267V 6,8 B
141/142
I41N; S49T; E42G; S54P; S150F; C152S; Q155L; F160P; D165N; C215L 7,6 B
143/144
I41C; E42G; S54P; S150F; C152S; Q155K; C215G 6,4 B
145/146
141K; E42G; P48E; S54P; S150F; C152S; Q155K; W156Q 2,4 B
147/148
I41C; E42G; S54P; S150F; C152S; Q155T; W156Q; F160P; C215L 3,6 B
149/150
I41C; E42G; S54P; E117G; S150F; C152S; Q155K; F160P 5,2 B
151/152
E42G; S54P; S150F; C152S; Q155I; W156Q; F160P; C215L; I267V 6,0 B
153/154
I41C; E42G; S54P; S150F; C152S; Q155K; C215L 3,2 B
155/156
E42G; S54P; S150F; C152S; Q155T; W156Q; C215G; I267V 4,8 B
157/158
E42G; S54P; S150F; C152S; Q155T; F160P; C215L 5,6 B
159/160
P33L; E42G; S54P; E117G; S150F; C152S; Q155I; W156Q; C215G 7,6 B
161/162
141K; E42G; S54P; S150F; C152S; Q155K; C215L 4,8 B
163/164
E42G; S54P; I108V; S150F; C152S; Q155T 6,8 B
165/166
I41C; E42G; S54P; I108V; S150F; C152S; Q155T; W156Q; C215G 9,2 B
167/168
E42G; S54P; S150F; C152S; Q155T; F160P; C215G 6,0 B
169/170
141C; E42G; S54P; E117G; S150F; C152S; Q155L; C215L 6,4 B
171/172
I41C; E42G; S54P; S150F; C152S; Q155K; W156Q; C215G; I267V 13,2 B
173/174
I41C; E42G; S49T; S54P; S150F; C152S; Q155I; F160P; C215G; I267V 9,6 B
175/176
I41C; E42G; S54P; S150F; C152S; Q155L; F160P; C215G; I267V 14,8 B
177/178
I41K; E42G; S54P; S150F; C152S; Q155K; W156Q; C215G 13,6 B
179/180
I41K; E42G; P48E; S54P; S150F; C152S; Q155L; C215L; 6,8 B
181/182
P33L; I41K; E42G; S54P; S150F; C152S; Q155I; F160P; C215L 14,4 B
183/184
I41K;E42G;S54P;E117G; S150F; C152S; Q155L; C215G 12,8 B
185/186
I41N; E42G; S54P; E117G; S150F; C152S; Q155T; W156Q 14,8 B
187/188
E42G; S54P; I108V; S150F; C152S; Q155V; W156Q; F160P 12,4 B
189/190
E42G; S54P; S150F; C152S; Q155T; W156Q; F160P; C215L; I267V 18,4 B
191/192
P33L; I41C; E42G; S54P; S150F; C152S; Q155K; F160P; C215G 4,0 B
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) Actividad Pliegue- Mejora1 Condiciones de reaccion delensayo2
193/194
E42G; S54P; S150F; C152S; Q155I; F160P; C215G 5,6 B
195/196
I41C; E42G; S54P; S150F; C152S; Q155I; C215L 6,4 B
197/198
E42G; S49T; S54P; I108V; E117G; S150F; C152S; Q155K; W156Q; C215G 7,6 B
199/200
I41C; E42G; S54P; E117G; S150F; C152S; Q155K; C215L 4,4 B
201/202
E42G; S54P; S150F; C152S; Q155I; W156Q; C215L 6,0 B
203/204
E42G; S54P; S150F; C152S; Q155T; W156R 6,8 B
205/206
I41K; E42G; S54P; I108V; E117G; S150F; C152S; Q155K; C215L 7,6 B
207/208
E42G; S54P; S150F; C152S; Q155K; W156Q 6,4 B
209/210
I41K; E42G; S54P; S150F; C152S; Q155T; F160P 2,4 B
211/212
I41K;E42G;S54P;E117G; S150F; C152S; Q155K; C215L; I267V 3,6 B
213/214
141K; E42G; S54P; S150F; C152S; Q155T 5,2 B
215/216
I41K; E42G; S54P; S150F; C152S; Q155T; C215G; I267V 6,0 B
217/218
I41C; E42G; S54P; I108V; S150F; C152S; Q155K 3,2 B
219/220
E42G; S49T; S54P; I108V; E117G; S150F; C152S; Q155T; W156Q; F160P; C215G; I267V 4,8 B
221/222
P33L; E42G; P48G; S54P; S150F; C152S; Q155T; C215H 5,6 B
223/224
G36C; E42G; S54P; S150F; C152S; Q155K; C215H; A241R 7,6 B
225/226
G36C; E42G; P48K; S54P; S150F; C152S; Q155T; C215H 4,8 B
227/228
G36C; E42G; P48G; S54P; S150F; C152S; Q155I; C215H 6,8 B
229/230
E42G; S54P; I108V; S150F; C152S; Q155K; C215H 9,2 B
231/232
E42G; P48G; S54P; S150F; C152S; Q155T 6,0 B
233/234
E42G; S54P; S150F; C152S; Q155L; C215H 6,4 B
235/236
G36C; E42G; S54P; S150F; C152S; Q155I; C215H; A241R 13,2 B
237/238
G36C; E42G; P48K; S54P; S150F; C152S; Q155I; C215H 9,6 B
239/240
E42G; S54P; S150F; C152S; Q155I; C215H 14,8 B
241/242
G36C; E42G; S54P; S150F; C152S; Q155T; A241R 13,6 B
243/244
G36C; E42G; S54P; S150F; C152S; Q155V; C215H 6,8 B
245/246
P33L;E42G;S54P;S150F; C152S;Q155K;W156Q; C215H 1,513 C
247/248
E42G;P48G;S54P;S150F; C152S;Q155L;W156Q; C215H 1,469 C
249/250
P33L;E42G;S54P;S150F; C152S;Q155L;W156Q; C215H 1,481 C
251/252
P33L;E42G;S54P;A109S; S150F;C152S;Q155K; W156Q;C2 15H 1,429 C
253/254
P33L;E42G;S54P;S150F; C152S;Q155L;W156Q; C215H;A2 41R 1,47 C
255/256
141F;E42G;S54P;S150F; C152S;Q155L;W156Q; C215G 1,295 C
257/258
141F;E42G;S54P;M122Q; S150F;C152T;Q155V; W156Q;C2 15G 1,213 C
259/260
E42G;S54P;M122Q; S150F;C152T;Q155V; W156Q;V171I; C215G; A241R 1,667 C
261/262
I41F;E42G;S54P;S150F; C152S;Q155I;W156Q; V171I;C215 G 1,333 C
263/264
I41F;E42G;S54P;S150F; C152S;Q155L;W156Q; V171I;C21 5G;A241R 1,245 C
265/266
E42G;S54P;S150F; C152S;Q155I;W156Q; V171I;C215G;A 241R 1,307 C
267/268
141F;E42G;S54P;S150F; C152S;Q155I;W156Q; C215G 1,28 C
269/270
P33L;E42G;S54P;S150F; C152S;Q155I;W156Q; C215G 1,22 C
271/272
I41F;E42G;S54P;S150F; C152S;Q155L;W156Q; V171I;C21 5G 1,545 C
5
10
15
20
25
30
35
40
45
50
55
60
65
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) Actividad Pliegue- Mejora1 Condiciones de reaccion delensayo2
273/274
E42G;S54P;M122Q; S150F;C152S;Q155I; W156Q;C215G; A241R 1,605 C
275/276
E42G;S54P;M122Q; S150F;C152S;Q155L; W156Q;V171I;C215G; A241R 1,248 C
277/278
E42G;S54P;T69S;S150F; C152S;Q155L;W156Q; C215G 1,57 C
279/280
E42G;S54P;S150F; C152S;Q155L;W156Q; C215G;T283S 1,573 C
281/282
E42G;S54P;S150F; C152S;Q155L;W156Q; C215G;S282V; G284I 1,507 C
283/284
E42G;S54P;F136Y; S150F;C152S;Q155L; W156Q;C215G;S 282V; G284P 1,337 C
285/286
E42G;S54P;S150F; C152S;Q155L;W156Y; C215G 1,5 C
287/288
E42G;S54P;F136I;S150F; C152S;Q155L;W156Y; C215G;S2 82V;G284I 1,367 C
289/290
E42G;S54P;S150F; C152S;Q155L;W156Q; C215G;G284I 1,496 C
291/292
E42G;S54P;FI36I;SI50F; CI52S;QI55L;WI56Q; C215G 1,636 C
293/294
E42G;S54P;F136I;S150F; C152S;Q155L;W156Q; C215G;G 2241 1,391 C
295/296
E42G;S54P;F136I;S150F; C152S;Q155L;W156Y; C215G;G 284P 1,366 C
297/298
E42G;S54P;P135I;F136Y; S150F;C152S;Q155L; W156Q;W 192F;C215G 1,438 C
299/300
E42G;S54P;T126M; S150F;C152S;Q155L; W156Q;C215G 1,389 C
301/302
E42G;S54P;S150F; C152S;Q155L;W156Q; G193M;C215G 1,54 C
303/304
E42G;S54P;T68A;SI50F; C152S;Q155L;W156Q; C215G 1,473 C
305/306
E42G;S54P;F60V;S150F; C152S;Q155L;W156Q; C215G 1,405 C
1La meiora de la actividad se calculo como el porcentaie de conversion del sustrato del compuesto (2) en el compuesto del producto (1) por el polipeptido disenado espedfico bajo las condiciones de reaccion del ensayo de actividad (anotadas a continuacion y en los ejemplos) por el porcentaje de conversion del mismo sustrato al producto en las mismas condiciones de reaccion por el polipeptido disenado de la SEQ ID NO:2. El porcentaje de conversion del compuesto de sustrato (2) en el producto (1) se determino mediante analisis de HPLC de las muestras de ensayo inactivadas preparadas como se indica a continuacion y en el Ejemplo 1. El porcentaje de conversion se cuantifico dividiendo las areas de picos de productos de HPLc por la suma de las areas de los picos de producto y sustrato. 2Condiciones de reaccion del ensayo de actividad: Condiciones A Lisis: las celulas se lisaron agitando durante 2 h a 250 rpm y a temperatura ambiente en 200 uL de tampon de lisis que contema TEA 0,1 M, 1 g/L de lisozima y 0,5 g/L de sulfato de polimixina B y PLP 0,25 mM, a pH 8,5. Reaccion enzimatica: 40 pL de lisado de celulas claras agregadas a 140 pL volumen de la premezcla original de PLP 1,4 mM (en agua esteril), isopropilamina 2,1 M (IPM), en DMSO al 57% (v/v), a pH 11; luego, la reaccion comenzo con la adicion de 20 pL de 500 g/L de compuesto de sustrato (2) en DMSO al 100%. Concentracion final del ensayo: 50 g/L de compuesto de sustrato (2), 1,5 M IPM, 1 mM PLP y DMSO al 50%, a pH 11. La placa de reaccion se sello termicamente y se agito a 200 rpm a 55°C durante 18 h. La reaccion se detuvo mediante la adicion de 1 mL de acetonitrilo y se agito durante 5 minutos, seguido de centrifugacion de la placa durante 10 minutos a 4000 x g a 18°C. Condiciones B Lisis: Las celulas se lisaron con agitacion durante 2 h a 250 rpm y temperatura ambiente en 200 uL de tampon de lisis que contema TEA 0,1 M, 1 g/L de lisozima y 0,5 g/L de sulfato de polimixina B y PLP 0,25 mM, a pH 8,5. Reaccion enzimatica. 20 pL de lisado de celulas claras agregado a 160 pL volumen de premezcla madre de PLP 1,25 mM (en agua esteril), isopropilamina 2,5 M (IPM), en DMSO al 57% (v/v), a pH 11.5; luego, la reaccion comenzo con la adicion de 20 pL de 500 g/L de compuesto de sustrato (2) en DMSO al 100%. Concentracion final del ensayo: 50 g/L compuesto de sustrato (2), 2 M IPM, 1 mM PLP y DMSO al 50%, a pH 11,5. La placa de reaccion se sello termicamente y se agito a 200 rpm a 55°C durante 18 h. La reaccion se detuvo mediante la adicion de 1 mL de acetonitrilo y se agito durante 5 minutos, seguido de centrifugacion de la placa durante 10 minutos a 4000 x g a 18°C.
5
10
15
20
25
30
35
40
45
50
55
60
65
Condiciones C
Lisis: las celulas se lisaron agitando durante 2 horas a 250 rpm y a temperatura ambiente en 200 uL de tampon de lisis que contema 0,1 M TEA, 1 g/L de lisozima y 0,5 g/L de sulfato de polimixina B y PLP 0,25 mM, a pH 8,5. Reaccion enzimatica: se anadieron 10 pL de lisado de celulas claras a 180 pL de volumen de la premezcla madre de PLP 1,33 mM (en agua esteril), isopropilamina 2,2 M (IPM), en DMSO al 55,5% (v/v), a pH 11,5; luego, la reaccion comenzo con la adicion de 10 pL de 1000 g/L de compuesto de sustrato (2) en DMSO al 100%. Concentracion final del ensayo: 50 g/L compuesto de sustrato (2), IPM 2 M, PLP 1,2 mM y DMSO al 50%, a pH 11,5. La placa de reaccion se sello termicamente y se agito a 200 rpm a 55°C durante 4 h. La reaccion se detuvo mediante la adicion de 1 mL de acetonitrilo y se agito durante 5 minutos, seguido de centrifugacion de la placa durante 10 minutos a 4000 x g a 18°C.
Tabla 2B: Actividad SFP y Estabilidad
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparadas con la SEQ ID NO:2) %Conv.1 (50°C) %Conv.2 (55°C) %Conv.3 (60°C) %Conv.4 (55°C, 2h) % e.e.2 (55°C)
1/2
Ninguna N.d. 4,8 N.d. N.d. 99,9
39/40
M122Q; N.d. 11,5 N.d. N.d. 99,9
61/62
E42G; S54P; C152S; Q155T; N.d. 11,8 N.d. N.d. 99,9
69/70
E42G; S54P; S150F; C152S; Q155T; I267V; N.d. 15,8 N.d. N.d. 99,9
77/78
E42G; S54P; S150F; C152S; Q155T; 74,6 27,8 18,6 N.d. 99,9
121/122
E42G; S54P; S150F; C152S; Q155T; C215G; I267V; 72,6 53,6 48,6 N.d. N.d.
129/130
E42G; S54P; S150F; C152S; Q155L; W156Q; C215G; 72,5 64,4 62,7 8,6 N.d.
159/160
P33L; E42G; S54P; E117G; S150F; C152S; Q155I; W156Q; C215G; 60,2 76,5 63,5 N.d. N.d.
177/178
I41K; E42G; S54P; S150F; C152S; Q155K; W156Q; C215G; 66,1 54,4 46,1 N.d. N.d.
191/192
P33L; I41C; E42G; S54P; S150F; C152S; Q155K; F160P; C215G; 79,1 6,4 0,1 N.d. N.d.
245/246
P33L; E42G; S54P; S150F; C152S; Q15 5K; W156Q; C215H; N.d. N.d. N.d. 14,29 N.d.
247/248
E42G; P48G; S54P; S150 F; C152S; Q1 55L; W156Q; C215H; N.d. N.d. N.d. 13,20 N.d.
249/250
P33L; E42G; S54P; S150F; C152S; Q15 5L; W156Q; C215H; N.d. N.d. N.d. 14,61 N.d.
259/260
E42G; S54P; M122Q; S15 0F; C152T; Q 155V; W156 Q; V171I; C215G; A241R; N.d. N.d. N.d. 11,40 N.d.
271/272
I41F; E42G; S54P; S150F; C152S; Q15 5L; W156Q; V171I; C215 G; N.d. N.d. N.d. 12,54 N.d.
273/274
E42G; S54P; M122Q; S15 0F; C152S; Q 155I; W156 Q; C215G; A 241R; N.d. N.d. N.d. 11,85 N.d.
291/292
E42G; S54P; F136I; S150 F; C152S; Q1 55L; W156Q; C215G; N.d. N.d. N.d. 10,42 N.d.
"n.d." = no determinado
5
10
15
20
25
30
35
40
45
50
55
60
65
El porcentaje de conversion del compuesto de sustrato (2) en el producto (1) se determino mediante analisis de HPLc de las muestras de ensayo inactivadas preparadas como se indica a continuacion y en el Ejemplo 1. El porcentaje de conversion se cuantifico dividiendo las areas de picos de productos de HPLC por la suma de las areas de Los picos de producto y sustrato.
1 Condiciones de reaccion para 50°C Ensayo SFP: 50 g/L de sustrato, 2 g/L SFP preparacion de polipeptido disenado, 1 mM g/L piridoxal-5'-fosfato (PLP), 1 M isopropilamina (|Pm), 50% v/v DMSO, pH 10,0. Volumen de reaccion total: 5 mL.
2
Condiciones de reaccion para el ensayo SFP a 55°C: 50 g/L de sustrato, 2 g/L SFP preparacion de polipeptido disenado, piridoxal-5'-fosfato 1 mM (PLP), isopropilamina 2 M (IPM), 50% v/v DMSO, pH 11,5. Volumen de reaccion total: 5 mL.
3 Condiciones de reaccion para el ensayo SFP a 60°C: 50 g/L de sustrato, 2 g/L SFP preparacion de polipeptido disenado, 1 mM g/L piridoxal-5'-fosfato (PLP), isopropilamina 2 M (IPM), 50% v/v DMSO, pH 11,5. Volumen de reaccion total: 5 mL.
4 Condiciones de reaccion para un ensayo de SFP 2h a 55°C: 50 g/L de sustrato, 0,5, 1 O2g/L SFP preparacion de polipeptido disenado, piridoxal-5'-fosfato (PLP) 1,2 mM, isopropilamina 2 M (IPM), 50% v/v DMSO, pH 11,5. Volumen de reaccion total: 5 mL.
Tabla 2C: Actividad DSP y Estabilidad
SEQ ID NO: (nt/aa)
Diferencias de aminoacidos (comparado con la SEQ ID NO:2) 50°C Ensayo 55°C Ensayo
%Conv.1 (1,0 g/L enzima)
%Conv.2 (0,5 g/L enzima) % e.e. %Conv.3 (1,0 g/L enzima) %Conv.4 (0,5 g/L enzima) % e.e.
1/2
Ninguna 59,7 33,3 99,9 7,8 4,1 99,9
63/64
E42G; S54P; C152S; Q155T; R164P; 82,8 71,4 99,9 22,9 8,7 99,9
121/122
E42G; S54P; S150F; C152S; Q155T; C215G; I267V; 81,7 71,8 99,9 52,1 37,1 99,9
129/130
E42G; S54P; S150F; C152S; Q155L; W156Q; C215G; 83,5 72,8 99,9 68,4 54,3 99,9
El porcentaje de conversion del compuesto de sustrato (2) en el producto (1) se determino mediante analisis de HPLC de las muestras de ensayo preparadas como se indica a continuacion y en el Ejemplo 1. El porcentaje de conversion se cuantifico dividiendo las areas de los picos de producto de HPLC por la suma de las areas de los picos de producto y sustrato.
1 Condiciones de reaccion para 50°C, 1 g/L ensayo DSP: 50 g/L compuesto de sustrato (2), 1 g/L preparacion DSP de polipeptido disenado, 1 mM g/L piridoxal-5'-fosfato (PLP), Isopropilamina 1 M (IPM), 50% v/v DMSO, pH 10,0, 50°C. Volumen de reaccion total: 5 mL.
2 Condiciones de reaccion para 50°C, 0,5 g/L ensayo DSP: 50 g/L compuesto de sustrato (2), 0,5 g/L DSP preparacion de polipeptido disenado, piridoxal-5-fosfato (PLP) 1 mM, isopropilamina 1 M (IPM), DMSO al 50% v/v, pH 10. Volumen de reaccion total: 5 mL.
3 Condiciones de reaccion para 55°C, 1 g/L ensayo SFP: 50 g/L compuesto de sustrato (2), 1 g/L preparacion DSP de polipeptido disenado, 1 mM g/L piridoxal-5'-fosfato (PLP), Isopropilamina 2 M (IPM), 50% v/v DMSO, pH 11,5. Volumen de reaccion total: 5 mL.
4 Condiciones de reaccion para 55°C, 0,5 g/L ensayo SFP: 50 g/L compuesto de sustrato (2), 0,5 g/L DSP preparacion de polipeptido configurado, 1 mM g/L piridoxal-5'-fosfato (PLP), 2 M isopropilamina (IPM), 50% v/v DMSO, pH 11,5. Volumen de reaccion total: 5 mL.
[0128] Como se muestra en las Tablas 2A-2C, los polipeptidos ejemplares configurados que tienen actividad de transaminasa de los identificadores de secuencia de numeracion par de SEQ ID NO:4 - 306 incluyen una o mas de las siguientes diferencias de residuos en comparacion con SEQ ID NO:2: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q,
5
10
15
20
25
30
35
40
45
50
55
60
65
X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241M, X267V, X270T, X273H, X325M y X328I. Basandose en las propiedades de los polipeptidos modificados por ingeniena de la SEQ ID NO:4 - 306 a modo de ejemplo descritos en las Tablas 2A-2C (y el Ejemplo 1), las propiedades enzimaticas mejoradas, como la actividad incrementada para convertir el compuesto (2) en el compuesto (1), el aumento termico, el disolvente y/o la estabilidad del pH estan asociados con al menos las siguientes diferencias de residuos en comparacion con la SEQ ID NO:2: en algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos 80 % de identidad de secuencia a la secuencia de referencia de la SEQ ID NO:2 y (a) una diferencia de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0129] Como sera evidente para el experto en la materia, las posiciones de los restos anteriores y en los residuos de aminoacidos espedficos para cada posicion de residuo puede usarse individualmente o en varias combinaciones para sintetizar polipeptidos de transaminasas que tiene propiedades mejoradas deseadas, incluyendo, entre otros, la actividad enzimatica, preferencia de sustrato/producto, estereoseectividad, tolerancia de sustrato/producto y estabilidad en diversas condiciones, como aumento de la temperatura, disolvente y/o pH.
[0130] A la luz de la gma proporcionada en el presente documento, se contempla ademas que cualquiera de los polipeptidos modificados a modo de ejemplo que tienen los identificadores de secuencia de numeros pares de SEQ ID NO:4 - 306 se puede usar como la secuencia de aminoacidos de partida para sintetizar otros polipeptidos de transaminasas disenados, por ejemplo, mediante rondas subsiguientes de evolucion al agregar nuevas combinaciones de diversas diferencias de aminoacidos de otros polipeptidos en las Tablas 2A, 2B y 2C, y otras posiciones de residuos descritas en este documento. Se pueden generar mejoras adicionales al incluir las diferencias de aminoacidos en las posiciones que se mantuvieron sin cambios durante las rondas anteriores de evolucion.
[0131] Por consiguiente, en algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97 %, 98%, 99% o mas de identidad con la secuencia de referencia SEQ ID NO:2 y en algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos el 80% de identidad de secuencia con la secuencia de referencia de la SEQ ID NO:2 y (a) una diferencia de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G,
5
10
15
20
25
30
35
40
45
50
55
60
65
X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X1361, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0132] En algunas realizaciones, el polipeptido modificado que tiene actividad de transaminasa comprende una secuencia de aminoacidos y una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92 %, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mas de identidad con una secuencia de referencia seleccionada de los identificadores de secuencia con numeros pares de SEQ ID NO:4 - 306, y (a) una o mas diferencias de residuos de aminoacidos seleccionadas de En algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia con la secuencia de referencia de la SEQ ID NO:2 y (a) una diferencia de residuo de aminoacido en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X1361, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0133] En algunas realizaciones, la secuencia de referencia se selecciona de la SEQ ID NO:4, 40, 62, 64, 70, 78, 122, 130, 160, 178, y 192. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO. 4. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:40. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:62. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:64. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:70. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:78. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:122. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:130. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:160. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:178. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:192.
[0134] En algunas realizaciones, el polipeptido modificado que tiene actividad de transaminasa comprende una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad con una de las secuencias que tienen los identificadores de secuencia con numero par de SEQ ID NO:4 - 306, y la combinacion de diferencias de residuo de aminoacido en comparacion con la SEQ ID NO:2 presente en una cualquiera de las secuencias que tienen los identificadores de secuencia de numeros pares de la SEQ ID NO:4 - 306. En algunas realizaciones, el polipeptido modificado que tiene actividad de
5
10
15
20
25
30
35
40
45
50
55
60
65
transaminasa comprende una secuencia de aminoacidos seleccionada de los identificadores de secuencia de numeros pares de SeQ ID NO:4 - 306.
[0135] Ademas de las posiciones de residuos especificadas anteriormente, cualquiera de los polipeptidos de transaminasas modificados por ingeniena genetica aqu descritos puede comprender ademas diferencias de residuos con respecto a la secuencia polipeptfdica de referencia de la SEQ ID NO:2 en otras posiciones de residuos, es decir, posiciones de residuos distintas de X5, X33, X36, X41, X42, X44, X48, X49, X51, X54, X55, X76, X108, X117, X122, X126, X148, X150, X152, X155, X156, X160, X164, X162, X182, X215, X218, X241, X267, X270, X273, X325 y X328. Las diferencias de residuos en estas otras posiciones de residuos pueden proporcionar variaciones adicionales en la secuencia de aminoacidos sin alterar la actividad de la transaminasa del polipeptido. Por consiguiente, en algunas realizaciones, ademas de las diferencias de residuos de aminoacidos de uno cualquiera de los polipeptidos de transaminasas seleccionadas seleccionados de los polipeptidos que tienen los identificadores de secuencia de numeros pares de SEQ ID NO:4 - 306, la secuencia puede comprender ademas 1 -2, 1-3, 1-4, 1-5, 16, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55, o 1-60 diferencias de residuos en otras posiciones de residuos de aminoacidos en comparacion con la SEQ ID NO:2. En algunas realizaciones, el numero de diferencias de residuos de aminoacidos en comparacion con la secuencia de referencia puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30, 30, 35, 40, 45, 50, 55 o 60 posiciones de residuos. En algunas realizaciones, las diferencias de residuos en otras posiciones de residuos de aminoacidos pueden comprender sustituciones conservativas y/o sustituciones no conservativas en comparacion con una secuencia de referencia del polipeptido de tipo natural de la SEQ ID NO:2 o el polipeptido modificado por ingeniena genetica de la SEQ ID NO: 2.
[0136] Diferencias residuales de aminoacidos en otras posiciones relativas a la secuencia de tipo salvaje de la SEQ ID nO:2 y el efecto de estas diferencias en funcion de la enzima se describen, por otros polipeptidos de transaminasa modificados descritos en la Patente de EE.UU.. N° 8.293.507 B2, emitida el 23 de octubre de 2012, publicacion PCT WO2011005477A1, publicada el 13 de enero de 2011, y publicacion PCT WO2012024104, publicada el 23 de febrero de 2012. En consecuencia, en algunas realizaciones, una o mas de las diferencias de aminoacidos en comparacion con la secuencia de tipo salvaje de la SEQ ID NO:2 tambien se pueden introducir en un polipeptido de transaminasa modificado por ingeniena genetica de la presente divulgacion en las posiciones de residuos seleccionadas de X2; X4; X5; X7; X8; X9; X10; X11; X14; X18; X22; X25; X26; X27; X28; X30; X37; X38; X41; X44; X48; X49; X50; X55; X58; X60; X65; X81; X82; X94; X96L; X102; X108; X120; X135; X137; X138; X141; X142; X146; X148; X163; X163; X164; X169; X171; X178; X181; X182; X204; X209; X210; X211; X213; X215; X217; X218; X223; X225; X230; X242; X245; X252; X265; X292; X297; X302; X306; X321; X328 y X329. En particular, las opciones de residuos de aminoacidos en las posiciones anteriores se pueden seleccionar de las siguientes: X2K/Q/S; X4I/Y; X5K/H/I/L/N/S/T/V; X7A; X8P/T; X9N/Q/S; X10V; X11K; X14R; X18C; X22I; X25Q; X26H; X27T; X28P; X30M/Q; X37R; X38G; X41H/S/F; X44Q/V; X48A/D/G/Q/V; X49T; X50L; X55V/L; X58L; X60F; X65A/T/C/G/S; X81G; X82S; X94I/L; X96L; X102L/K; X108V; X120Y; X135Q; X137T/I; X138K/P; X141L; X142R/T; X146R; X148A/F; X163H/V; X164P/V/A; X169L; X171A; X178S; X181G; X182T; X204A; X209L/C/D/E; X210S; X21II; X213P; X215F/Y/C; X217N/S; X218M; X223I/L/M/N/P; X225Y; X230V; X242T; X245S; X252F; X265T; X292T; X297S; X302A; X306L; X321P; X328I; y X329H. En las referencias citadas se puede encontrar orientacion adicional sobre la eleccion de los residuos de aminoacidos en las posiciones de residuos.
[0137] Como se discutio anteriormente, la secuencia del polipeptido modificado de la SEQ ID NO:2 utiliza como el eje de partida para la generacion de los polipeptidos de transaminasa modificados ejemplar es tambien un polipeptido de transaminasa modificado que tiene las siguientes 28 diferencias de aminoacidos relativas a la transaminasa de origen natural de Arthrobacter sp. KNK168 (GenBank Acc. BAK39753.1, GI: 336088341): S8P, Y60F, L61Y, H62T, V65A, V81T, D81G, M94I, I96L, F122M, S124T, S126T, G136F, Y150S, V122C, A209L, G215C, G217N, S223P, L269P, L273Y, T282S, A284G, P297S, I306V y S321P. Asf, en algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa que comprenden una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%. 94%, 95%, 96%, 97%, 98% o 99% de identidad con una secuencia de aminoacidos de referencia seleccionada de una cualquiera de las secuencias que tienen los identificadores de secuencia con numeros pares de SEQ ID NO:4 - 306, tiene una secuencia de aminoacidos que no incluya una diferencia de residuos en comparacion con la SEQ ID NO:2 en una o mas de las siguientes posiciones: X8; X60; X61; X62; X65; X81; X94; X96; X122; X124; X136; X169; X199; X209; X215; X217; X223; X269; X273; X282; X284; X297; X306; y X321.
[0138] En algunas realizaciones, la presente divulgacion tambien proporciona polipeptidos de transaminasas modificados que comprenden un fragmento de cualquiera de los polipeptidos de transaminasas modificados descritos en el presente documento que conserva la actividad funcional de la transaminasa y/o la propiedad mejorada de ese polipeptido de transaminasa modificado. Por consiguiente, en algunas realizaciones, la presente divulgacion proporciona un fragmento de polipeptido que tiene actividad de transaminasa (por ejemplo, capaz de convertir el compuesto (2) en el compuesto (1) en condiciones de reaccion adecuadas), en donde el fragmento comprende al menos aproximadamente el 80%. 90%, 95%, 98% o 99% de una secuencia de aminoacidos de longitud completa de un polipeptido modificado segun la presente divulgacion, tal como un ejemplo de polipeptido modificado que tiene los identificadores de secuencia de numeros pares de la SEQ ID NO:4 306.
5
10
15
20
25
30
35
40
45
50
55
60
65
[0139] En algunas realizaciones, el polipeptido de transaminasa modificado de la divulgacion puede tener una secuencia de aminoacidos que comprende una delecion en comparacion con una cualquiera de las secuencias de polipeptidos de transaminasa modificados se describe en la presente memoria, tales como las secuencias de polipeptidos modificados ejemplares que tienen la identificadores de secuencia de numeros pares de SEQ ID NO:4 - 306. Por lo tanto, para cada una de las realizaciones de los polipeptidos de transaminasas modificados por ingeniena genetica de la divulgacion, la secuencia de aminoacidos puede comprender deleciones de uno o mas aminoacidos, 2 o mas aminoacidos, 3 o mas aminoacidos, 4 o mas aminoacidos, 5 o mas aminoacidos, 6 o mas aminoacidos, 8 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, hasta el 10% del numero total de aminoacidos, hasta el 10% del numero total de aminoacidos, hasta el 20% del numero total de aminoacidos, o hasta el 30% del numero total de aminoacidos de los polipeptidos de transaminasas, donde se mantiene la actividad funcional asociada y/o propiedades mejoradas de la transaminasa disenada en el presente documento. En algunas realizaciones, las eliminaciones pueden comprender, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 110, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, 1-50, 1-55 o 1-60 residuos de aminoacidos. En algunas realizaciones, el numero de eliminaciones puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, 50, 55 o 60 residuos de aminoacidos. En algunas realizaciones, las eliminaciones pueden comprender deleciones 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, 25 o 30 residuos de aminoacidos.
[0140] En algunas realizaciones, la presente divulgacion proporciona un polipeptido de transaminasa modificado que tiene una secuencia de aminoacidos que comprende una insercion en comparacion con una cualquiera de las secuencias de polipeptidos de transaminasa modificados se describe en el presente documento, tales como las secuencias de polipeptidos modificados de ejemplo que tiene identificadores de secuencia de numero par de SEQ ID NO:4 - 306. Por lo tanto, para cada una de las realizaciones de los polipeptidos de transaminasas de la divulgacion, las inserciones pueden comprender uno o mas aminoacidos, 2 o mas aminoacidos, 3 o mas aminoacidos, 4 o mas aminoacidos, 5 o mas aminoacidos, 6 o mas aminoacidos, 8 o mas aminoacidos, 10 o mas aminoacidos, 15 o mas aminoacidos, o 20 o mas aminoacidos, donde la actividad funcional asociada y/o propiedades mejoradas de la transaminasa disenada en el presente documento se mantiene. Las inserciones pueden ser en el extremo amino o carboxi, o porciones internas del polipeptido de transaminasa.
[0141] En algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tienen actividad de transaminasa, que comprende una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad con las secuencias que tienen los identificadores de secuencia con numeros pares de SEQ ID NO:4 - 306, con la condicion de que la secuencia de aminoacidos no es identica a (es decir, excluye) cualquiera de las secuencias de aminoacidos de polipeptidos de transaminasas modificados a modo de ejemplo descritas en la patente de EE.UU. N° 8.293.507 B2, emitida el 23 de octubre de 2012, publicacion PCT WO2011005477A1, publicada el 13 de enero de 2011, publicacion PCT WO2012024104, publicada el 23 de febrero de 2012, y Sol. de PCT N° PCT/US12/54300, presentada el 7 de septiembre de 2012.
[0142] En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa de la presente divulgacion tambien son capaces de convertir un compuesto de sustrato de Formula (II), Formula (IIa), compuesto (2) y/o compuesto (4) en un compuesto de producto de amina correspondiente de Formula (I), Formula (la), compuesto (1) y/o compuesto (3), respectivamente. En algunas realizaciones, los polipeptidos modificados tienen una actividad y/o estabilidad mejoradas con respecto a la actividad y/o estabilidad del polipeptido modificado de la SEQ ID NO:2 al convertir un compuesto de sustrato de Formula (II), Formula (IIa) y/o compuesto (2) a un compuesto de producto de amina correspondiente de Formula (I), Formula (Ia) y/o compuesto (1), en condiciones de reaccion adecuadas. En particular, las condiciones de reaccion son utiles para la produccion a escala industrial de tales compuestos.
[0143] En las realizaciones anteriores, las condiciones de reaccion adecuados para los polipeptidos modificados son los descritos en las Tablas 2A, 2B y 2C. Por consiguiente, en algunas realizaciones, las condiciones de reaccion adecuadas comprenden: (a) carga de sustrato de aproximadamente 10 a 200 g/L de compuesto de sustrato de Formula (II), Formula (IIa), compuesto (2) o compuesto (4); (b) concentracion de polipeptidos modificados de aproximadamente 0,5 g/L a 5 g/L; (c) concentracion de MIP de aproximadamente 0,1 a 3 M; (d) concentracion de cofactor de PLP de aproximadamente 0,1 a 1 mM; (e) concentracion de DMSO de aproximadamente 30% (v/v) a aproximadamente 60% (v/v); (f) pH de aproximadamente 9,5 a 11,5; y (g) temperatura de aproximadamente 45°C a 60°C. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden: (a) aproximadamente 50 g/L de compuesto de sustrato de Formula (II), Formula (IIa), compuesto (2) o compuesto (4); (b) aproximadamente 2 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 1 M isopropilamina (IPM); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) sobre pH 10; y (g) unos 50°C. Orientacion para el uso de estas condiciones de reaccion y los polipeptidos de la transaminasa se proporcionan, entre otras, en las Tablas 2A, 2B y 2C, y en los Ejemplos.
[0144] En algunas realizaciones, los polipeptidos de la divulgacion pueden estar en forma de polipeptidos de fusion en los que los polipeptidos modificados se fusionan con otros polipeptidos, tales como, a modo de ejemplo y sin limitacion, etiquetas de anticuerpos (por ejemplo, epitope myc), secuencias de purificacion (p. ej., etiquetas His para
5
10
15
20
25
30
35
40
45
50
55
60
65
unirse a metales) y senales de localizacion celular (p. ej., senales de secrecion). Por lo tanto, los polipeptidos modificados por ingeniena genetica aqu descritos se pueden usar con o sin fusiones a otros polipeptidos.
[0145] Los polipeptidos de transaminasa modificados descritos en este documento no se limitan a los aminoacidos codificados geneticamente. Por lo tanto, ademas de los aminoacidos codificados geneticamente, los polipeptidos descritos en el presente documento pueden estar compuestos, en su totalidad o en parte, de aminoacidos no codificados de origen natural y/o sinteticos. Ciertos aminoacidos no codificados comunmente encontrados de los que pueden estar comprendidos los polipeptidos descritos en el presente documento incluyen, entre otros: los estereoisomeros D de los aminoacidos codificados geneticamente; acido 2,3-diaminopropionico (Dpr); acido a- aminoisobutmco (Aib); acido £-aminohexanoico (Aha); acido 8-aminovalerico (Ava); N-metilglicina o sarcosina (MeGly o Sar); ornitina (Orn); citrulina (Cit); t-butilalanina (Bua); t-butilglicina (Bug); N-metilisoleucina (Melle); fenilglicina (Phg); ciclohexilalanina (Cha); norleucina (Nle); naftilalanina (Nal); 2-clorofenilalanina (Ocf); 3-
clorofenilalanina
(Mcf); 4-clorofenilalanina (Pcf); 2-fluorofenilalanina (Off); 3-fluorofenilalanina (Mff); 4-
fluorofenilalanina
(Pff); 2-bromofenilalanina (Obf); 3-bromofenilalanina (Mbf); 4-bromofenilalanina (Pbf); 2-
metilfenilalanina
(Omf); 3-metilfenilalanina (Mmf); 4-metilfenilalanina (Pmf); 2-nitrofenilalanina (Onf); 3-
nitrofenilalanina
(Mnf); 4-nitrofenilalanina (Pnf); 2-cianofenilalanina (Ocf); 3-cianofenilalanina (Mcf); 4-
cianofenilalanina (Pcf); 2-trifluorometilfenilalanina (Otf); 3-trifluorometilfenilalanina (Mtf); 4-trifluorometilfenilalanina (Ptf); 4-aminofenilalanina (Paf); 4-yodofenilalanina (Pif); 4-aminometilfenilalanina (Pamf); 2,4-diclorofenilalanina (Opef); 3,4-diclorofenilalanina (Mpcf); 2,4-difluorofenilalanina (Opff); 3,4-difluorofenilalanina (Mpff); pirid-2-ilalanina (2pAla); pirid-3-ilalanina (3pAla); pirid-4-ilalanina (4pAla); naft-1-ilalanina (InAla); naft-2-ilalanina (2nAla); ti- azolilalanina (taAla); benzotienilalanina (bAla); tienilalanina (tAla); furilalanina (fAla); homofenilalanina (hPhe); homotirosina (hTyr); homotriptofano (hTrp); pentafluorofenilalanina (5ff); estirilkalanina (sAla); autilalanina (aAla); 3,3- difenilalanina (Dfa); Acido 3-amino-5-fenipentanoico (Afp); penicilamina (pluma); Acido 1,2,3,4-tetrahidroisoquinolina- 3-carbox^lico (Tic); p -2-tienilalanina (Thi); sulfoxido de metionina (Mso); N (w)-nitroarginina (nArg); homolisina (hLys); fosfonometilfenilalanina (pmPhe); fosfoserina (pSer); fosfotreonina (pThr); acido homoaspartico (hAsp); acido homoglutamico (hGlu); Acido 1-aminociclopent-(2 o 3)-en-4-carboxflico; acido pipecolico (PA), acido azetidina-3- carbox^lico (ACA); acido 1-aminociclopentano-3-carbox^lico; alilglicina (aOly); propargilglicina (pgGly); homoalanina (hAla); norvalina (nVal); homoleucina (hLeu), homovalina (hVal); homoisoleucina (hle); homoarginina (hArg); lisina de N-acetilo (AcLys); acido 2,4-diaminobutmco (Dbu); acido 2,3-diaminobutmco (Dab); N-metilvalina (MeVal); homocistema (hCys); homoserina (hSer); hidroxiprolina (Hyp) y homoprolina (hPro). Los aminoacidos no codificados adicionales de los cuales pueden estar comprendidos los polipeptidos descritos en el presente documento seran evidentes para los expertos en la tecnica (Vease, por ejemplo, los diversos aminoacidos proporcionados en Fasman, 1989, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC Press, Boca Raton, FL, en las paginas 3-70 y las referencias citadas en el mismo). Estos aminoacidos pueden estar en la configuracion L o D.
[0146] Los expertos en la tecnica reconoceran que los aminoacidos o residuos que llevan grupos protectores de la cadena lateral pueden comprender tambien los polipeptidos descritos en el presente documento. Los ejemplos no limitativos de tales aminoacidos protegidos, que en este caso pertenecen a la categona aromatica, incluyen (grupos protectores enumerados entre parentesis), pero no se limitan a: Arg (tos), Cys (metilbencilo), Cys (nitropiridinesulfenilo), Glu (8 -bencilester), Gln (xantilo), Asn (N-5-xantilo), His (bom), His (benzilo), His (tos), Lys (fmoc), Lys (tos), Ser (O-bencilo), Thr (O-bencilo) y Tyr (O-bencilo).
[0147] Aminoacidos no de codificacion que estan conformacionalmente restringidos de los cuales los polipeptidos descritos en el presente documento pueden estar compuestos incluyen, pero no se limitan a, aminoacidos N-metilo (L-configuracion); Acido 1-aminociclopent-(2 o 3)-en-4-carboxflico; acido pipecolico; acido azetidina-3-carboxflico; homoprolina (hPro); y acido 1-aminociclopentano-3-carboxflico.
[0148] En algunas realizaciones, los polipeptidos modificados se pueden proporcionar en un soporte solido, tal como una membrana, resina, vehfculo solido, o de otro material de fase solida. Un soporte solido puede estar compuesto de polfmeros organicos tales como poliestireno, polietileno, polipropileno, polifluoroetileno, polietilenoxi y poliacrilamida, asf como tambien copolfmeros e injertos de los mismos. Un soporte solido tambien puede ser inorganico, como vidrio, sflice, vidrio de poro controlado (CPG), sflice de fase inversa o metal, como oro o platino. La configuracion de un soporte solido puede ser en forma de perlas, esferas, partfculas, granulos, un gel, una membrana o una superficie. Las superficies pueden ser planas, sustancialmente planas o no planas. Los soportes solidos pueden ser porosos o no porosos, y pueden tener caractensticas de hinchamiento o no hinchamiento. Un soporte solido puede configurarse en forma de pozo, depresion u otro contenedor, recipiente, caractenstica o ubicacion.
[0149] En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa estan obligados o inmovilizados sobre el soporte solido de tal manera que retienen su actividad mejorada, enantioselectividad, estereoselectividad, otras propiedades mejoradas y/o en relacion con el polipeptido de referencia de la SEQ ID NO:2. En tales realizaciones, los polipeptidos inmovilizados pueden facilitar la conversion biocatalftica del compuesto de sustrato de Formula (II), Formula (IIa), compuesto (2) y/o compuesto (4) en un compuesto de producto de amina correspondiente de Formula (I), Formula (la), compuesto (1) y/o compuesto (3), y una vez completada la reaccion, se retienen facilmente (por ejemplo, reteniendo perlas en las que se inmoviliza el polipeptido) y luego se reutiliza o se recicla en reacciones posteriores. Tales procesos enzimaticos inmovilizados permiten una mayor eficiencia y
5
10
15
20
25
30
35
40
45
50
55
60
65
reduccion de costos. Por consiguiente, se contempla ademas que cualquiera de los metodos de uso de los polipeptidos de transaminasas modificados por ingeniena genetica de la presente divulgacion se puede llevar a cabo usando los mismos polipeptidos de transaminasas unidos o inmovilizados sobre un soporte solido.
[0150] El polipeptido de transaminasa modificado puede estar unido de forma no covalente o covalente. En la tecnica se conocen bien diversos metodos para la conjugacion e inmovilizacion de enzimas a soportes solidos (por ejemplo, resinas, membranas, perlas, vidrio, etc.). En particular, la publicacion PCT WO2012/177527 A1 polipeptidos de transaminasas modificados geneticamente inmovilizados capaces de convertir el compuesto (2) en el compuesto (1) (incluido el polipeptido de referencia de la SEQ ID NO:2), y los metodos de preparacion de los polipeptidos inmovilizados, en los que el polipeptido esta unido ffsicamente a una resina mediante interacciones hidrofobas o enlaces covalentes, y es estable en un sistema de solvente que comprende al menos hasta 100% de solvente organico. Otros metodos para la conjugacion e inmovilizacion de enzimas a soportes solidos (p.ej., resinas, membranas, perlas, vidrio, etc.) son bien conocidos en la tecnica y se describen en p. ej.: Yi et al., "Covalent immobilization of 1-transaminase from Vibrio fluvialis JS17 on chitosan beads," Process Biochemistry 42 (5): 895-898 (mayo de 2007); Martin et al., "Characterization of free and immobilized (S)-aminotransferase for acetophenone production," Applied Microbiology and Biotechnology 76 (4): 843-851 (septiembre de 2007); Koszelewski et al., "Immobilization of 1-transaminases by encapsulation in a sol-gel/celite matrix", Journal of Molecular Catalysis B: Enzymatic, 63: 39-44 (abril de 2010); Truppo et al., "Development of an Improved Immobilized CAL-B for the Enzymatic Resolution of a Key Intermediate to Odanacatib," Organic Process Research & Development, publicado en lmea: dx.doi.org/10.1021/op200157c; Hermanson, GT, Bioconjugate Techniques, segunda edicion, Academic Press (2008); Mateo et al., "Epoxy sepabeads: a novel epoxy support for stabilization of industrial enzymes via very intense multipoint covalent attachment", Biotechnology Progress 18 (3): 629-34 (2002); y los protocolos de bioconjugacion: estrategias y metodos, In Methods in Molecular Biology, CM Niemeyer ed., Humana Press (2004).
[0151] Los soportes solidos utiles para la inmovilizacion de los polipeptidos de transaminasa modificados de la presente descripcion incluyen, pero no se limitan a perlas o resinas que comprenden polimetacrilato con grupos epoxido funcionales, polimetacrilato con grupos funcionales amino epoxi, copolfmero de estireno/DVB o polimetacrilato con grupos funcionales de octadecilo. Los ejemplos de soportes solidos utiles para inmovilizar las transaminasas modificadas mediante ingeniena genetica de la presente divulgacion incluyen, sin limitacion, perlas de quitosan, Eupergit C y SEPABEADs (Mitsubishi), incluidos los siguientes tipos diferentes de SEPABEAD: EC-EP, EC-HFA/S, EXA252, EXE119 y EXE120.
[0152] En algunas realizaciones, los polipeptidos de transaminasa modificados se pueden proporcionar en forma de una matriz en la que los polipeptidos estan dispuestos en lugares distintos posicionalmente. En algunas realizaciones, las localizaciones distintas de posicion son pozos en un soporte solido tal como una placa de 96 pocillos. Se puede configurar una pluralidad de soportes en una matriz en varias ubicaciones, direccionables para la entrega robotica de reactivos, o mediante metodos de deteccion y/o instrumentos. Dichas matrices pueden usarse para probar una variedad de compuestos de sustrato para la conversion por los polipeptidos.
[0153] En algunas realizaciones, los polipeptidos modificados descritos aqu pueden proporcionarse en forma de kits. Los polipeptidos en los kits pueden estar presentes individualmente o como una pluralidad de polipeptidos. Los kits pueden incluir ademas reactivos para llevar a cabo reacciones enzimaticas, sustratos para evaluar la actividad de los polipeptidos, asf como reactivos para detectar los productos. Los kits tambien pueden incluir dispensadores de reactivos e instrucciones para el uso de los kits. En algunas realizaciones, los kits de la presente divulgacion incluyen matrices que comprenden una pluralidad de polipeptidos de transaminasas modificados diferentes en una posicion direccionable diferente, en donde los polipeptidos diferentes son variantes diferentes de una secuencia de referencia, teniendo cada una al menos una propiedad enzimatica mejorada diferente. Tales matrices que comprenden una pluralidad de polipeptidos modificados y metodos de su uso son conocidos (vease, por ejemplo, el documento WO2009/008908A2).
5.4 Polinucleotidos, secuencias de control, vectores de expresion y celulas huesped utiles para preparar polipeptidos de transaminasas modificados
[0154] En otro aspecto, la presente descripcion proporciona polinucleotidos que codifican los polipeptidos modificados que tienen actividad de transaminasa descrita en este documento. Los polinucleotidos pueden unirse operativamente a una o mas secuencias reguladoras heterologas que controlan la expresion genica para crear un polinucleotido recombinante capaz de expresar el polipeptido. Las construcciones de expresion que contienen un polinucleotido heterologo que codifica la transaminasa modificada por ingeniena genetica se pueden introducir en las celulas huesped apropiadas para expresar el polipeptido de transaminasa modificado geneticamente correspondiente.
[0155] Como sera evidente para el experto en la tecnica, la disponibilidad de una secuencia de protema y el conocimiento de los codones correspondientes a los diversos aminoacidos proporcionan una descripcion de todos los polinucleotidos capaces de codificar la secuencia de la protema sujeto. La degeneracion del codigo genetico, donde los mismos aminoacidos estan codificados por codones alternativos o sinonimos, permite que se produzca una gran cantidad de acidos nucleicos, todos los cuales codifican las enzimas transaminasas mejoradas descritas en
5
10
15
20
25
30
35
40
45
50
55
60
65
este documento. Por lo tanto, habiendo identificado una secuencia de aminoacidos particular, los expertos en la tecnica podnan producir cualquier numero de acidos nucleicos diferentes simplemente modificando la secuencia de uno o mas codones de una manera que no cambie la secuencia de aminoacidos de la protema. A este respecto, la presente divulgacion contempla espedficamente todas y cada una de las posibles variaciones de polinucleotidos que podnan realizarse seleccionando combinaciones basadas en las posibles elecciones de codones, y todas estas variaciones deben considerarse espedficamente divulgadas para cualquier polipeptido descrito en este documento, incluidas las secuencias de aminoacidos de los polipeptidos modificados a modo de ejemplo proporcionados en las Tablas 2A, 2B y 2C, y descritos en el listado de secuencias como las secuencias de los identificadores de secuencia de numeros pares de SEQ ID NO:4 - 306. Como se describe en este documento, en algunas realizaciones, se excluyen de las realizaciones de los polinucleotidos las secuencias que codifican una o mas secuencias de aminoacidos seleccionadas de la SEQ iD NO:4, 40, 62, 64, 70, 78, 122, 130, 160, 178, y 192.
[0156] En diversas realizaciones, los codones se seleccionan preferiblemente para adaptarse a la celula huesped en la que se produce la protema. Por ejemplo, los codones preferidos utilizados en bacterias se utilizan para expresar el gen en bacterias; Los codones preferidos usados en levadura se usan para la expresion en levadura; y los codones preferidos usados en mairnferos se usan para la expresion en celulas de mamfferos. En algunas realizaciones, no es necesario reemplazar todos los codones para optimizar el uso de los codones de las transaminasas ya que la secuencia natural comprendera los codones preferidos y porque el uso de los codones preferidos puede no ser necesario para todos los residuos de aminoacidos. En consecuencia, los polinucleotidos optimizados de codon que codifican las enzimas transaminasas pueden contener codones preferidos en aproximadamente el 40%, 50%, 60%, 70%, 80% o mas del 90% de las posiciones de codon de la region codificante de longitud completa.
[0157] En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa que comprende una secuencia de aminoacidos que es al menos aproximadamente 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, o mas identica a una secuencia de referencia seleccionada de los identificadores de secuencia con numeros pares de SEQ ID NO:4 - 306, donde el polipeptido tiene actividad de transaminasa y una o mas de las propiedades mejoradas como se describe en este documento, por ejemplo, la capacidad de convertir el compuesto (2) en el compuesto del producto (1) con una actividad incrementada en comparacion con el polipeptido de la SEQ ID NO:2. En algunas realizaciones, la secuencia de referencia se selecciona de la SEQ ID nO:4, 40, 62, 64, 70, 78, 122, 130, 160, 178 y 192. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:4. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:40. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:62. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:64. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:70. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:78. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:122. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:130. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:160. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:178. En algunas realizaciones, la secuencia de referencia es la SEQ ID NO:192.
[0158] En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa modificado que comprende una secuencia de aminoacidos que tiene el porcentaje de identidad descrito anteriormente y (a) tiene una o mas diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada. En las realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia a la secuencia de referencia de la SEQ ID NO:2 y (a) una diferencia de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, x54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G;
5
10
15
20
25
30
35
40
45
50
55
60
65
X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0159] En algunas realizaciones, el polinucleotido codifica un polipeptido de transaminasa modificado que comprende una secuencia de aminoacidos que tiene el porcentaje de identidad descrito anteriormente y una o mas diferencias de residuos en comparacion a SEQ ID NO:2 seleccionada de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215/H/L, X218M, X241R, X267V, X270T, X273H, X325M y X328I.
[0160] En algunas realizaciones, el polinucleotido que codifica el polipeptido de transaminasa modificado comprende una secuencia seleccionada de entre los identificadores de secuencia impares del SEQ ID NO:3 - 305. En algunas realizaciones, las secuencias de polinucleotidos se seleccionan de entre SEQ ID NO:3, 39, 61, 63, 69, 77, 121,129,159,177 y 191.
[0161] En algunas realizaciones, la presente descripcion proporciona un polinucleotido que se hibrida en condiciones definidas, tales como condiciones moderadamente rigurosas o muy rigurosas, a una secuencia de polinucleotido (o complemento de la misma) que codifica una transaminasa modificada de la presente descripcion. En algunas realizaciones, los polinucleotidos son capaces de hibridarse en condiciones altamente rigurosas a un polinucleotido seleccionado de las secuencias que tienen los identificadores de secuencia de numeros impares de SEQ ID NO:3 - 305, o un complemento de los mismos, y codifica un polipeptido que tiene actividad de transaminasa con una o mas de las propiedades mejoradas descritas en este documento. En algunas realizaciones, el polinucleotido capaz de hibridar en condiciones altamente rigurosas codifica un polipeptido de transaminasa modificado que comprende una secuencia de aminoacidos que tiene (a) una o mas diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada en algunas realizaciones, la presente divulgacion proporciona un polipeptido modificado que tiene actividad de transaminasa que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia con la secuencia de referencia de la SEQ ID NO:2 y (a) una diferencia de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/F/K/M/N/R, X42G, X48D/E/G/K/T, X51K, X54P, X76S, X122F/Q, X148Q, X152T, X155A/I/K/T/V, X156R, X160P, X215G/H/L, X241R, X270T, X273H, X325M; y X241R, y/o (b) una combinacion de diferencias de residuos seleccionadas de: X42G, X54P, X152S y X155T; X42G, X54P, X152S, X155T y R164P; X42G, X54P, X150F, X152S y X155T; X42G, X54P, X150F, X152S, X155T y X267V; X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V; X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G; X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R; X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G; X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G; X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G; X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H; X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R; X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P; X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R; X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G; X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S; X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I; y X42G, X54P, X150F, X152S, X155L, X156Y y X215G.
[0162] En algunas realizaciones, el polinucleotido capaz de hibridar en condiciones altamente rigurosas codifica un polipeptido de transaminasa que tiene el porcentaje de identidad descrito anteriormente y una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241R, X267V, X270T, X273H, X325M, y X328I.
[0163] En algunas realizaciones, los polinucleotidos codifican los polipeptidos descritos en el presente documento, pero tienen aproximadamente 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% o mas de identidad de secuencia a nivel de nucleotido a un polinucleotido de referencia que codifica el polipeptido de transaminasa. En algunas realizaciones, la secuencia de polinucleotidos
5
10
15
20
25
30
35
40
45
50
55
60
65
de referencia se selecciona de las secuencias que tienen los identificadores de secuencia de numeros impares de la SEQ ID NO:3 -305.
[0164] Un polinucleotido aislado que codifica un polipeptido de transaminasa modificado por ingeniena genetica puede manipularse en una variedad de formas para proporcionar la expresion del polipeptido, incluyendo la alteracion adicional de la secuencia mediante la optimizacion del codon para mejorar la expresion, la insercion en una expresion adecuada con o sin secuencias de control adicionales y la transformacion en una celula huesped adecuada para la expresion y produccion del polipeptido.
[0165] La manipulacion del polinucleotido aislado antes de su insercion en un vector puede ser deseable o necesaria dependiendo del vector de expresion. Las tecnicas para modificar polinucleotidos y secuencias de acido nucleico utilizando los metodos de ADN recombinante son bien conocidas en la tecnica. Se proporciona orientacion en Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press; y Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, cambios a 2010.
[0166] Los polinucleotidos descritos en este documento pueden comprender ademas una secuencia de promotor,
dependiendo del sistema de produccion celular particular utilizado. Para las celulas hospedadoras bacterianas, los promotores adecuados para dirigir la transcripcion de los constructos de acido nucleico de la presente divulgacion incluyen, entre otros, los promotores obtenidos del operon lac de E. coli, el gen de la agarasa de Streptomyces coelicolor (dagA), el gen de la levansucrasa de Bacillus subtilis (sacB), gen de alfa-amilasa Bacillus licheniformis (amyL), gen de amilasa maltogenica Bacillus stearothermophilus (amyM), gen de alfa-amilasa Bacillus amyloliquefaciens (amyQ), gen de penicilinasa Bacillus licheniformis (penP), genes xylA y xylB Bacillus subtilis, y gen de beta-lactamasa procariotico (Villa-Kamaroff et al., 1978, Proc. Natl Acad. Sci. EE.UU. 75: 3727-3731), y el promotor tac (DeBoer et al., 1983, Proc. Natl Acad. Sci. EE.UU. 80: 21-25). Para las celulas huesped fungicas filamentosas, los promotores adecuados para dirigir la transcripcion de las construcciones de acido nucleico de la presente divulgacion incluyen promotores obtenidos de los genes para amilasa TAKA de Aspergillus oryzae, proteinasa aspartica Rhizomucor miehei, alfa-amilasa neutra Aspergillus niger, alfa-amilasa de acido estable Aspergillus niger, glucoamilasa Aspergillus niger o Aspergillus awamori (glaA), lipasa Rhizomucor miehei, proteasa alcalina Aspergillus oryzae, isomerasa de fosfato de triosa Aspergillus oryzae, acetamidasa Aspergillus nidulans, y Fusarium oxisporum similar a la tripsina de la proteasa (WO 96/00787), asf como el promotor NA2-tpi (un tubrido de los promotores de los genes para la alfa-amilasa neutra de Aspergillus niger y la isomerasa de fosfato de triosa Aspergillus oryzae), y promotores mutantes, truncados e tubridos de los mismos. En un huesped de levadura, promotores utiles pueden ser de los genes para enolasa Saccharomyces cerevisiae (ENO-1), galactoquinasa Saccharomyces cerevisiae (GAL1), alcohol deshidrogenasa/gliceraldetndo-3-fosfato deshidrogenasa
Saccharomyces cerevisiae (ADH2/GAP), y 3-fosfoglicerato quinasa Saccharomyces cerevisiae. Otros promotores utiles para celulas huesped de levadura se describen por Romanos et al., 1992, Yeast 8: 423-488.
[0167] La secuencia de control puede tambien ser una secuencia del terminador de transcripcion adecuada, una secuencia reconocida por una celula huesped para terminar la transcripcion. La secuencia terminadora esta unida operativamente al extremo 3' de la secuencia de acido nucleico que codifica el polipeptido. Cualquier terminador que sea funcional en la celula huesped de eleccion puede usarse en la presente divulgacion. Por ejemplo, se pueden obtener terminadores de transcripcion ejemplares para celulas huesped fungicas filamentosas a partir de los genes para amilasa TAKA Aspergillus oryzae, glucoamilasa Aspergillus niger, sintasa de antranilato Aspergillus nidulans, alfa-glucosidasa Aspergillus niger, y proteasa de tipo tripsina Fusarium oxisporum. Se pueden obtener terminadores ejemplares de celulas huesped de levadura a partir de los genes para enolasa Saccharomyces cerevisiae, citocromo C Saccharomyces cerevisiae (CYC1) y gliceraldetndo-3-fosfato deshidrogenasa Saccharomyces cerevisiae. Otros terminadores utiles para celulas huesped de levadura estan descritos por Romanos et al., 1992, supra.
[0168] La secuencia de control puede tambien ser una secuencia lfder adecuada, una region no traducida de un ARNm que es importante para la traduccion por la celula huesped. La secuencia lfder esta unida operativamente al extremo 5' de la secuencia de acido nucleico que codifica el polipeptido. Se puede usar cualquier secuencia lfder que sea funcional en la celula huesped de eleccion. Las secuencias lfder bacterianas ejemplares pueden usar la secuencia lfder pelB (Lei et al., 1987, J Bacteriol. 169 (9): 4379-4383) y las secuencias lfder de dsbA, dsbC, Bce, CupA2, CupB2 de Pseudomonas fluorescens (Patente de EE.UU. 7.618.799). Las secuencias lfder ejemplares para celulas huesped fungicas filamentosas se obtienen a partir de los genes para la amilasa TAKA de Aspergillus oryzae y la isomerasa de fosfato de triosa Aspergillus nidulans. Los lfderes adecuados para las celulas huesped de levadura se obtienen de los genes para enolasa Saccharomyces cerevisiae (ENO-1), 3-fosfoglicerato quinasa Saccharomyces cerevisiae, alfa-factor Saccharomyces cerevisiae, y alcohol deshidrogenasa/gliceraldetndo-3-fosfato dehidrogenasa Saccharomyces cerevisiae (ADH2/GAP).
[0169] La secuencia de control tambien puede ser una secuencia de poliadenilacion, una secuencia operativamente vinculada al termino 3' de la secuencia de acido nucleico y que, cuando se transcribe, es reconocida por la celula huesped como una senal para anadir residuos de poliadenosina al ARNm transcrito. Cualquier secuencia de poliadenilacion que sea funcional en la celula huesped elegida puede usarse en la presente descripcion. Secuencias de poliadenilacion ejemplares para celulas huesped fungicas filamentosas pueden ser de los genes de amilasa TAKa Aspergillus oryzae, glucoamilasa Aspergillus niger, sintasa de antranilato Aspergillus nidulans, proteasa de
5
10
15
20
25
30
35
40
45
50
55
60
65
tipo tripsina Fusarium oxisporum, y alfa-glucosidasa Aspergillus niger. Guo y Sherman, 1995, Mol Cell Bio 15: 59835990 describen secuencias utiles de poliadenilacion para celulas huesped de levadura. Se pueden encontrar secuencias ejemplares de poliandenilacion en mairnferos en Zhang et al., 2005, Nucleic Acids Res. 33: D116-D120.
[0170] La secuencia de control puede tambien ser una region codificante del peptido senal que codifica para una secuencia de aminoacidos enlazada al termino amino de un polipeptido y dirige el polipeptido codificado en la v^a secretora de la celula. El extremo 5' de la secuencia codificante de la secuencia de acido nucleico puede contener inherentemente una region codificante de peptido senal enlazada naturalmente en el marco de lectura de traduccion con el segmento de la region codificante que codifica el polipeptido secretado. Alternativamente, el extremo 5' de la secuencia de codificacion puede contener una region de codificacion del peptido senal que es ajena a la secuencia de codificacion. La region de codificacion del peptido de senal extrana puede ser necesaria cuando la secuencia de codificacion no contiene naturalmente una region de codificacion del peptido de senal.
[0171] Alternativamente, la region de codificacion del peptido de senal extrana puede simplemente reemplazar la region de codificacion del peptido de senal natural para aumentar la secrecion del polipeptido. Sin embargo, se puede usar cualquier region codificante del peptido senal que dirige el polipeptido expresado en la ruta secretora de una celula huesped de eleccion. Regiones de codificacion del peptido senal eficaces para celulas huespedes bacterianas son el peptido senal obtenidas de los genes para la codificacion de amilasa maltogenica Bacillus NCIB 11837, alfa-amilasa Bacillus stearothermophilus, subtilisina Bacillus licheniformis, beta-lactamasa Bacillus licheniformis, proteasas neutras Bacillus stearothermophilus (nprT, nprS, nprM), y prsA Bacillus subtilis. Otros peptidos senal son descritos por Simonen y Palva, 1993, Microbiol Rev 57: 109-137. Regiones de codificacion del peptido senal eficaces para celulas huespedes filamentosas fungicas pueden ser el peptido senal obtenido de los genes para la codificacion de amilasa de TAKA Aspergillus oryzae, amilasa neutral Aspergillus niger, glucoamilasa Aspergillus niger, proteinasa aspartica Rhizomucor miehei, celulasa Humicola insolens, y lipasa Humicola lanuginosa. Peptidos senal utiles para celulas huespedes de levadura pueden ser de los genes para factor alfa de Saccharomyces cerevisiae, y invertasa Saccharomyces cerevisiae. Otras regiones de codificacion de peptidos senal utiles estan descritas por Romanos et al., 1992, supra.
[0172] La secuencia de control puede tambien ser una region codificante del propeptido que codifica para una secuencia de aminoacidos situada en el termino amino de un polipeptido. El polipeptido resultante se conoce como proenzima o pro-polipeptido (o zimogeno en algunos casos). Un pro-polipeptido puede convertirse en un polipeptido activo maduro por escision catalttica o autocatalttica del pro-peptido del pro-polipeptido. La region codificante del pro-peptido se puede obtener a partir de los genes para la proteasa alcalina de Bacillus subtilis (aprE), la proteasa neutra de Bacillus subtilis (nprT), el factor alfa de Saccharomyces cerevisiae, la proteinasa aspartica Rhizomucor miehei, la proteinasa aspartica de Myceliophthora (WO 95/33/33836). Cuando ambas regiones de peptido senal y propeptido estan presentes en el extremo amino de un polipeptido, la region pro-peptido se coloca al lado del extremo amino de un polipeptido y la region de peptido se coloca al lado del extremo amino de la region pro-peptido.
[0173] Tambien puede ser deseable anadir secuencias reguladoras que permiten la regulacion de la expresion del
polipeptido con respecto al crecimiento de la celula huesped. Ejemplos de sistemas reguladores son aquellos que causan que la expresion del gen se active o desactive en respuesta a un estfmulo qmmico o ffsico, incluida la
presencia de un compuesto regulador. En las celulas hospedadoras procarioticas, las secuencias reguladoras
adecuadas incluyen los sistemas operadores lac, tac y trp. En celulas huesped de levadura, los sistemas reguladores adecuados incluyen, como ejemplos, el sistema ADH2 o el sistema GAL1. En hongos filamentosos, las secuencias reguladoras adecuadas incluyen el promotor de alfa-amilasa TAKA, el promotor de glucoamilasa de Aspergillus niger y el promotor de glucoamilasa de Aspergillus oryzae. Otros ejemplos de secuencias reguladoras son aquellas que permiten la amplificacion de genes. En los sistemas eucariotas, estos incluyen el gen de la
reductasa de dihidrofolato, que se amplifica en presencia de metotrexato, y los genes de metalotionema, que se
amplifican con metales pesados. En estos casos, la secuencia de acido nucleico que codifica el polipeptido de la presente divulgacion estana unida operativamente con la secuencia reguladora.
[0174] En otro aspecto, la presente divulgacion tambien se dirige a un vector de expresion recombinante que comprende un polinucleotido que codifica un polipeptido de transaminasa modificado por ingeniena genetica o una variante del mismo, y una o mas regiones reguladoras de la expresion tales como un promotor y un terminador, un origen de replicacion, etc., dependiendo del tipo de huespedes en los que se van a introducir. Las diversas secuencias de control y acido nucleico descritas anteriormente pueden unirse para producir un vector de expresion recombinante que puede incluir uno o mas sitios de restriccion convenientes para permitir la insercion o sustitucion de la secuencia de acido nucleico que codifica el polipeptido en tales sitios. Alternativamente, la secuencia de acido nucleico de la presente divulgacion puede expresarse insertando la secuencia de acido nucleico o una construccion de acido nucleico que comprende la secuencia en un vector apropiado para la expresion. Al crear el vector de expresion, la secuencia de codificacion se ubica en el vector de modo que la secuencia de codificacion este unida operativamente con las secuencias de control apropiadas para la expresion.
[0175] El vector de expresion recombinante puede ser cualquier vector (por ejemplo, un plasmido o virus), que puede ser convenientemente sometido a procedimientos de aDn recombinante y puede provocar la expresion de la secuencia de polinucleotido. La eleccion del vector dependera tfpicamente de la compatibilidad del vector con la
5
10
15
20
25
30
35
40
45
50
55
60
65
celula huesped en la que se va a introducir el vector. Los vectores pueden ser plasmidos circulares lineales o cerrados. El vector de expresion puede ser un vector de replicacion autonomo, es decir, un vector que existe como una entidad extracromosomica, cuya replicacion es independiente de la replicacion cromosomica, por ejemplo, un plasmido, un elemento extracromosomico, un minicromosoma o un cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicacion. Alternativamente, el vector puede ser uno que, cuando se introduce en la celula huesped, se integra en el genoma y se replica junto con el (los) cromosoma(s) en el (los) que se ha integrado. Ademas, se puede usar un solo vector o plasmido o dos o mas vectores o plasmidos que juntos contienen el ADN total para ser introducido en el genoma de la celula huesped, o un transposon.
[0176] El vector de expresion de la presente descripcion puede incluir uno o mas marcadores seleccionables, que permiten la seleccion facil de celulas transformadas. Un marcador seleccionable es un gen cuyo producto proporciona biocida o resistencia viral, resistencia a metales pesados, prototrofia a auxotrofos y similares. Ejemplos de marcadores seleccionables de bacterias son los genes dal de Bacillus subtilis o Bacillus licheniformis, o marcadores que confieren resistencia a los antibioticos como la ampicilina, kanamicina, cloranfenicol o resistencia a la tetraciclina. Los marcadores adecuados para celulas huesped de levadura son ADE2, HIS3, LEU2, LYS2, MET3, TRP1 y URA3. Los marcadores seleccionables para uso en una celula huesped fungica filamentosa incluyen, pero no se limitan a, amdS (acetamidasa), argB (carbamoiltransferasa de ornitina), barra (acetiltransferasa de fosfinotricina), hph (fosfotransferasa de higromicina), niaD (reductasa de nitrato), pyrG (orotidina-5'-fosfato descarboxilasa), sC (adeniltransferasa de sulfato) y trpC (sintasa de antranilato), asf como sus equivalentes. Las realizaciones para uso en una celula de Aspergillus incluyen los genes amdS y pyrG de Aspergillus nidulans o Aspergillus oryzae y el gen bar de Streptomyces hygroscopicus.
[0177] Los vectores de expresion de la presente descripcion tambien pueden incluir un (unos) elemento(s) que permite la integracion del vector en el genoma de la celula huesped o la replicacion autonoma del vector en la celula independiente del genoma. Para la integracion en el genoma de la celula hospedadora, el vector puede confiar en la secuencia de acido nucleico que codifica el polipeptido o cualquier otro elemento del vector para la integracion del vector en el genoma mediante recombinacion homologa o no homologa.
[0178] Alternativamente, el vector de expresion puede contener secuencias de acido nucleico adicionales para dirigir la integracion por recombinacion homologa en el genoma de la celula huesped. Las secuencias de acido nucleico adicionales permiten que el vector se integre en el genoma de la celula huesped en una(s) ubicacion(s) precisa(s) en el (los) cromosoma(s). Para aumentar la probabilidad de integracion en una ubicacion precisa, los elementos de integracion deben contener preferiblemente un numero suficiente de acidos nucleicos, como 100 a 10.000 pares de bases, preferiblemente 400 a 10.000 pares de bases, y lo mas preferiblemente 800 a 10.000 pares de bases, que son altamente homologos con la secuencia diana correspondiente para aumentar la probabilidad de recomposicion homologa. Los elementos integracionales pueden ser cualquier secuencia que sea homologa con la secuencia diana en el genoma de la celula huesped. Ademas, los elementos de integracion pueden ser secuencias de acido nucleico no codificantes o codificantes. Por otro lado, el vector puede integrarse en el genoma de la celula huesped mediante recombinacion no homologa.
[0179] Para la replicacion autonoma, el vector puede comprender ademas un origen de replicacion que permite al vector replicarse de manera autonoma en la celula huesped en cuestion. Ejemplos de ongenes bacterianos de replicacion son P15A ori o los ongenes de replicacion de los plasmidos pBR322, pUC19, pACYC177 (cuyo plasmido tiene el P15A ori), o pACYC184 que permiten la replicacion en E. coli, y pUB110, pE194, pTA1060, o pAM beta 1 permitiendo la replicacion en Bacillus. Ejemplos de ongenes de replicacion para uso en una celula huesped de levadura son el origen de replicacion de 2 micras, ARS1, ARS4, la combinacion de ARS1 y CEN3, y la combinacion de ARS4 y CEN6. El origen de la replicacion puede ser uno que tenga una mutacion que lo haga funcionar de manera sensible a la temperatura en la celula huesped (Vease, por ejemplo, Ehrlich, 1978, Proc Natl Acad Sci. EE.UU. 75: 1433).
[0180] Mas de una copia de una secuencia de acido nucleico de la presente divulgacion puede insertarse en la celula huesped para aumentar la produccion del producto genico. Se puede obtener un aumento en el numero de copias de la secuencia de acido nucleico integrando al menos una copia adicional de la secuencia en el genoma de la celula huesped o incluyendo un gen marcador seleccionable amplificable con la secuencia de acido nucleico donde las celulas que contienen copias amplificadas de la secuencia seleccionable. El gen marcador, y por lo tanto las copias adicionales de la secuencia de acido nucleico, pueden seleccionarse cultivando las celulas en presencia del agente seleccionable apropiado.
[0181] Muchos vectores de expresion utiles con las realizaciones de la presente divulgacion estan disponibles comercialmente. Los vectores de expresion comerciales adecuados incluyen vectores de expresion p3xFLAGTM de Sigma-Aldrich Chemicals, que incluyen un promotor de CMV y un sitio de poliadenilacion de hGH para la expresion en celulas huesped de mairnferos y un origen de replicacion de pBR322 y marcadores de resistencia a la ampicilina para la amplificacion en E. coli. Otros vectores de expresion adecuados son pBlue-scriptII SK(-) y pBK-CMV, que estan disponibles comercialmente en Stratagene, LaJolla CA, y plasmidos que se derivan de pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) o pPoly (Lathe et al., 1987, Gene 57: 193-201).
5
10
15
20
25
30
35
40
45
50
55
60
65
[0182] Un vector de expresion ejemplar se puede preparar uniendo operativamente un polinucleotido que codifica una transaminasa mejorada en el plasmido pCK11090oi que contiene el promotor lac bajo el control del represor lacl. El vector de expresion tambien contiene el origen de replicacion P15a y el gen de resistencia al cloranfenicol.
[0183] En otro aspecto, la presente descripcion proporciona una celula huesped que comprende un polinucleotido que codifica un polipeptido de transaminasa mejorado de la presente descripcion, el polinucleotido esta unido operativamente a una o mas secuencias de control para la expresion de la enzima transaminasa en la celula huesped. Las celulas hospedadoras para uso en la expresion de los polipeptidos codificados por los vectores de expresion de la presente divulgacion son bien conocidas en la tecnica e incluyen, pero no se limitan a, celulas bacterianas, tales como E. coli, Arthrobacter sp. KNK168, celulas de Streptomyces y Salmonella typhimurium; celulas fungicas, tales como celulas de levadura (p. ej., Saccharomyces cerevisiae o Pichia pastoris (N° de Acceso ATCC 201178)); celulas de insecto tales como Drosophila S2 y celulas Spodoptera Sf9; celulas animales tales como CHO, COS, BHK, 293 y celulas de melanoma de Bowes; y celulas vegetales. Una celula huesped ejemplar es Escherichia coli W3110 (AfhuA). Los medios de cultivo apropiados y las condiciones de crecimiento para las celulas huesped descritas anteriormente son bien conocidas en la tecnica.
[0184] Los polinucleotidos para la expresion de la transaminasa pueden introducirse en celulas mediante diversos metodos conocidos en la tecnica. Las tecnicas incluyen, entre otras, electroporacion, bombardeo de partfculas biolfsticas, transfeccion mediada por liposomas, transfeccion con cloruro de calcio y fusion de protoplastos. Varios metodos para introducir polinucleotidos en celulas seran evidentes para el experto en la tecnica.
5.6 Metodos de generacion de polipeptidos de transaminasas modificados
[0185] En algunas realizaciones, para hacer los polinucleotidos modificados por ingeniena genetica y los polipeptidos modificados por ingeniena genetica de la presente divulgacion, la enzima transaminasa de origen natural que cataliza la reaccion de transaminacion se obtiene (o deriva) de Arthrobacter sp. KNK168. En algunas realizaciones, la secuencia de polinucleotido principal id codon opton esta disenado para mejorar la expresion de la transaminasa en una celula huesped especificada. La secuencia polinucleotfdica parental que codifica el polipeptido de tipo salvaje de Arthrobacter sp. Se ha descrito KNK168 (vease, por ejemplo, Iwasaki et al., Appl. Microbiol. Biotechnol., 2006, 69: 499-505). Las preparaciones de transaminasas disenadas segun esta secuencia parental tambien se describen en la publicacion de patente de EE.UU. N° 2010/0285541A1 y la solicitud internacional publicada WO2010/099501.
[0186] Las transaminasas modificadas se pueden obtener sometiendo el polinucleotido que codifica la transaminasa de origen natural a mutagenesis y/o metodos de evolucion dirigida, como se discutio anteriormente. Una tecnica de evolucion dirigida ejemplar es la mutagenesis y/o el barajado de ADN como se describe en Stemmer, 1994, Proc Natl Acad Sci EE.UU. 91:10747-10751; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 y la patente de EE.UU. 6.537.746. Otros procedimientos de evolucion dirigida que pueden usarse incluyen, entre otros, el proceso de extension escalonada (StEP), la recombinacion in vitro (Zhao et al., 1998, Nat. Biotechnol. 16: 258-261), la PCR mutagenica (Caldwell et al., 1994, PCR Methods Appl. 3: S136-S140), y mutagenesis en casete (Black et al., 1996, Proc Natl Acad Sci EE.UU. 93: 3525-3529). Las tecnicas de mutagenesis y evolucion dirigida utiles para los propositos en este documento tambien se describen en, por ejemplo, Ling, et al., 1997, Anal. Biochem. 254 (2): 157-78; Dale et al., 1996, "Oligonucleotide-directed random mutagenesis using the phosphorothioate method", en Methods Mol. Biol. 57: 369-74; Smith, 1985, Ann. Rev. Genet. 19: 423-462; Botstein et al., 1985, Science 229: 1193-1201; Carter, 1986, Biochem. J. 237: 1-7; Kramer et al., 1984, Cell, 38: 879-887; Wells et al., 1985, Gene 34: 315-323; Minshull et al., 1999, Curr Opin Chem Biol 3: 284-290; Christians et al., 1999, Nature Biotech 17: 259-264; Crameri et al., 1998, Nature 391: 288-291; Crameri et al., 1997, Nature Biotech 15: 436-438; Zhang et al., 1997, Proc Natl Acad Sci EE.UU. 94: 45-4-4509; Crameri et al., 1996, Nature Biotech 14: 315-319; Stemmer, 1994, Nature 370: 389-391; Stemmer, 1994, Proc Natl Acad Sci EE.UU. 91:10747-10751; Publicacion PCT. N° WO 95/22625, WO 97/0078, WO 97/35966, WO 98/27230, WO 00/42651 y WO 01/75767; y la patente de EE.UU. N° 6.537.746.
[0187] Los clones obtenidos despues de tratamiento de mutagenesis se pueden cribar para transaminasas modificadas que tienen una propiedad mejorada de la enzima deseada. La medicion de la actividad enzimatica a partir de las bibliotecas de expresion se puede realizar utilizando las tecnicas bioqmmicas estandar, como el analisis por HPLC despues de la derivacion OPA del producto amina.
[0188] Cuando la propiedad de la enzima mejorada deseada es termoestabilidad, la actividad de la enzima se puede medir despues de la sujecion a las preparaciones enzimaticas a una temperatura definida y midiendo la cantidad de actividad enzimatica que queda despues de los tratamientos termicos. Los clones que contienen un polinucleotido que codifica una transaminasa se afslan, se secuencian para identificar los cambios en la secuencia de nucleotidos (si hay alguno) y se usan para expresar la enzima en una celula huesped.
[0189] Cuando se conoce la secuencia del polipeptido modificado por ingeniena genetica, los polinucleotidos que codifican la enzima pueden prepararse mediante metodos estandar en fase solida, de acuerdo con metodos sinteticos conocidos. En algunas realizaciones, los fragmentos de hasta aproximadamente 100 bases pueden
5
10
15
20
25
30
35
40
45
50
55
60
65
sintetizarse individualmente, luego unirse (por ejemplo, mediante metodos de litigios enzimaticos o qmmicos, o metodos mediados por polimerasa) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleotidos y oligonucleotidos de la divulgacion se pueden preparar por smtesis qmmica utilizando, por ejemplo, el metodo clasico de fosforamidita descrito por Beaucage et al., 1981, Tet Lett 22: 1859-69, o el metodo descrito por Matthes et al. al., 1984, EMBO J. 3: 801-05, por ejemplo, como se practica ffpicamente en metodos sinteticos automatizados. De acuerdo con el metodo de la fosforamidita, los oligonucleotidos se sintetizan, por ejemplo, en un sintetizador de ADN automatico, se purifican, se recocen, se ligan y se clonan en vectores apropiados. Ademas, esencialmente cualquier acido nucleico se puede obtener de una variedad de fuentes comerciales.
[0190] En algunas realizaciones, la presente descripcion tambien proporciona metodos para preparar o fabricar los polipeptidos de transaminacion neered nieros capaces de convertir el compuesto (2) en el compuesto (1) bajo condiciones de reaccion adecuadas, en donde los metodos comprenden cultivar una celula huesped capaz de expresar un polinucleotido que codifica el polipeptido incorporado en condiciones de cultivo adecuadas para la expresion del polipeptido. En algunas realizaciones, el metodo para la preparacion del polipeptido comprende ademas aislar el polipeptido. Los polipeptidos modificados pueden expresarse en celulas apropiadas (como se describio anteriormente) y aislarse (o recuperarse) de las celulas hospedadoras y/o el medio de cultivo usando una o mas de las tecnicas bien conocidas usadas para la purificacion de protemas, incluyendo, entre otras., tratamiento con lisozima, sonicacion, filtracion, salado, ultra centrifugacion y cromatograffa. Las tecnicas cromatograficas para el aislamiento del polipeptido incluyen, entre otras, cromatograffa ffquida de alto rendimiento, cromatograffa de fase inversa, cromatograffa de intercambio ionico, electroforesis en gel y cromatograffa de afinidad. Las condiciones para purificar un polipeptido modificado particular dependeran, en parte, de factores como la carga neta, la hidrofobicidad, la hidrofilicidad, el peso molecular, la forma molecular, etc., y seran evidentes para los expertos en la tecnica.
5.7 Metodos de uso de las enzimas transaminasas disenadas y compuestos preparados con ellas
[0191] En otro aspecto, los polipeptidos de transaminasas modificados geneticamente descritos en el presente documento pueden usarse en un proceso para la conversion del compuesto de sustrato (2), o analogos estructurales de los mismos, en el producto del compuesto (1) o el analogo estructural correspondiente. En general, los analogos estructurales del compuesto (1) estan incluidos en la formula estructural (I) y la formula estructural (Ia).
[0192] En algunas realizaciones, los polipeptidos modificados por ingeniena genetica descritos en el presente documento pueden usarse en un proceso para la preparacion de compuestos de amina quiral. En algunas realizaciones, la presente divulgacion proporciona un metodo para preparar un compuesto de Formula estructural (I):
imagen21
tener la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico de al menos 70% sobre el enantiomero opuesto, en donde
Z es O2o NR2R3;
R1 es C1-8 alquilo, arilo, heteroarilo, arilo-C1-2 alquilo, heteroarilo-C1-2 alquilo o un sistema de anillo heterodclico de 5 a 6 miembros que opcionalmente contiene un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no sustituido o sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, en donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco fluoros
R2 y R3 son cada uno independientemente hidrogeno, C1-8 alquilo, arilo o arilo-C1-2 alquilo; o R2 y R3 junto con el atomo de nitrogeno al que estan unidos forman un sistema de anillo heterodclico de 4 a 7 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, en donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco atomos de fluor; y el sistema de anillo heterodclico se fusiona opcionalmente con un sistema de anillo carbodclico aromatico saturado o aromatico de 5 a 6 miembros o un sistema de anillo heterodclico aromatico saturado o aromatico de 5 a 6 miembros que contiene uno a dos heteroatomos seleccionados de O, S y N, el sistema de anillo condensado no sustituido o sustituido con uno a dos sustituyentes seleccionados de hidroxi, amino, fluor, C1-4 alquilo, C1-4 alcoxi, y trifluorometilo; el proceso comprende la etapa de poner en contacto un compuesto estructural de sustrato de cetona proquiral (II):
5
10
15
20
25
30
35
40
45
50
55
60
imagen22
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en un disolvente organico adecuado en condiciones de reaccion adecuadas. En algunas realizaciones del proceso, R1 es bencilo y el grupo fenilo del bencilo esta no sustituido o sustituido una a tres sustituyentes seleccionados del grupo que consiste en fluor, trifluorometilo y trifluorometoxi.
[0193] En algunas realizaciones del proceso para la preparacion de un compuesto de Formula (I), Z es NR2R3, en el que NR2R3 es un heterociclo de la formula estructural (IN):
imagen23
en donde R4 es hidrogeno o C1-4 alquilo que esta sin sustituir o sustituido con uno a cinco fluoros.
[0194] En algunas realizaciones del proceso para preparar un compuesto de formula estructural (I), el compuesto de Formula (II) excluye espedficamente el compuesto (2) y el compuesto de Formula (I) preparado por el metodo espedficamente excluye el compuesto (1).
[0195] En algunas realizaciones, los polipeptidos modificados que tienen actividad de transaminasa de la presente divulgacion se pueden usar en un proceso para preparar un compuesto de Formula estructural (Ia):
imagen24
tener la (R)-configuracion en el centro estereogenico marcado con un ***; en un exceso enantiomerico de al menos 70% sobre el enantiomero que tiene la (S)-configuracion opuesta; donde
Ar es fenilo que esta sin sustituir o sustituido con uno a cinco sustituyentes seleccionados independientemente del grupo que consiste en fluor, trifluorometilo y trifluorometoxi; y
R4 es hidrogeno o C1-4 alquilo no sustituido o sustituido con uno a cinco fluoros; el proceso comprende la etapa de: poner en contacto un compuesto de sustrato de cetona proquiral de formula estructural (IIa):
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen25
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas. En algunas realizaciones del proceso para preparar el compuesto de Formula (la), Ar se selecciona de 2,5-difluorofenilo o 2,4,5-trifluorofenilo, y R4 es trifluorometilo.
[0196] En algunas realizaciones del proceso para preparar un compuesto de formula estructural (la), el compuesto de Formula (lla) excluye espedficamente compuesto (2) y el compuesto de Formula (la) preparado por el metodo espedficamente excluye el compuesto (1).
[0197] En algunas realizaciones, la presente descripcion proporciona un procedimiento de preparacion del Compuesto (1), sitagliptina,
que comprende una etapa de
imagen26
imagen27
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0198] La presente descripcion tambien contempla que los polipeptidos de transaminasa modificados se pueden utilizar para la preparacion de otros compuestos de amina quirales que son analogos estructurales de sitagliptina. Gemigliptina es un agente anti-hiperglucemico oral en la misma clase de inhibidores de peptidasa-4 dipeptidilo (DPP-4) que la sitagliptina. Gemigliptina es un compuesto de amina quiral que tiene la estructura del compuesto (3)
5
10
15
20
25
30
35
40
45
50
55
60
65
imagen28
[0199] La gemigliptina tiene una estructura analoga a la sitagliptina (compuesto (1)), y esta dentro del mismo genera de estructuras de Formula (I). Por consiguiente, en una realizacion, la presente divulgacion proporciona un proceso para preparar el compuesto (3), que comprende una etapa de poner en contacto un sustrato ceto del compuesto (4), o el compuesto (4) modificado con un grupo protector,
imagen29
con un polipeptido modificado como se describe en el presente documento en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
[0200] Como se describe aqrn, y se ilustra en los ejemplos, la presente divulgacion contempla los rangos de condiciones de reaccion adecuadas que se pueden utilizar en los procesos de la presente memoria, incluyendo pero no limitado a los rangos de pH, temperatura, tampon, sistema de disolvente, carga de sustrato, mezcla de estereoisomeros compuestos de sustrato, carga de polipeptidos, carga de cofactor, presion y tiempo de reaccion. Las condiciones de reaccion adecuadas adicionales para llevar a cabo el proceso para la conversion biocatalttica de compuestos de sustrato a compuestos de producto utilizando un polipeptido de transaminasa modificado en el presente documento pueden optimizarse facilmente mediante experimentacion rutinaria que incluye, pero no se limita a, poner en contacto el polipeptido de transaminasa y compuesto de sustrato en condiciones de reaccion experimentales de concentracion, pH, temperatura, condiciones de solvente y deteccion del compuesto del producto, por ejemplo, utilizando los metodos descritos en los Ejemplos proporcionados en este documento.
[0201] Como se describio anteriormente, los polipeptidos modificados que tienen actividad de transaminasa para uso en los procedimientos de la presente divulgacion comprenden generalmente una secuencia de aminoacidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90 %, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% de identidad con una secuencia de aminoacidos de referencia seleccionada de una cualquiera de las secuencias de numeros pares de SEQ ID NO:2 - 306, y un polipeptido de transaminasa modificado que comprende una secuencia de aminoacidos que tiene (a) una o mas diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO:2 seleccionada de X33L, X36C, X41C/M/R, X48K, X51K, X76S, X122F/Q, X148Q, X155K, X156R, X160P, X215G, X241R, X270T, X273H y X325M; y/o (b) una combinacion de diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: (i) X42G, X54P, X152S y X155T; (ii) X42G, X54P, X152S, X155T y R164P; (iii) X42G, X54P, X150F, X152S y X155T; (iv) X42G, X54P, X150F, X152S, X155T y X267V; (v) X42G, X54P, X150F, X152S, X155L, W156Q y C215G; (vi) X42G, X54P, X150F, X152S, X155T, X215G y X267V; (vii) X33L; X42G, X54P, X117G; X150F, X152S, X155I, X156Q y C215G; y (viii) X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G. En algunas realizaciones, el polinucleotido capaz de hibridacion en condiciones altamente rigurosas codifica un polipeptido de transaminasa que tiene el porcentaje de identidad descrito anteriormente y una o mas diferencias de residuos en comparacion con la SEQ ID NO:2 seleccionada de: X5K, X33L, X36C, X41C/F/K/M/N/R, X42A/G, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X152S/T, X155A/I/K/L/T/V, X156Q/R/S, X160P, X164P, X165N, X182T, X215G/H/L, X218M, X241R, X267V, X270T, X273H, X225M, y X328I.
[0202] La actividad mejorada, estabilidad, y/o estereoselectividad de los polipeptidos de transaminasa modificados descritos en este documento en la conversion de compuestos de Formula (II) a compuestos de Formula (I),
5
10
15
20
25
30
35
40
45
50
55
60
65
compuestos de Formula (IIa) a compuestos de Formula (la), el compuesto (2) al compuesto (1), y/o el compuesto (4) al compuesto (3), incluyendo varios analogos de los mismos, proporciona procesos en los que se puede lograr un mayor porcentaje de conversion con concentraciones mas bajas del polipeptido modificado y tambien reduce la cantidad de protema residual que puede necesitar eliminarse en pasos subsiguientes para la purificacion del compuesto del producto (por ejemplo, el compuesto (1)) y la purificacion de los compuestos aguas abajo del compuesto del producto. En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden una concentracion de polipeptidos modificados de aproximadamente 0,1 a aproximadamente 40 g/L,
aproximadamente 0,5 a aproximadamente 20 g/L, aproximadamente 1,0 a aproximadamente 10 g/L,
aproximadamente 2 a aproximadamente 5 g/L, aproximadamente 40 g/L o menos, aproximadamente 20 g/L o menos, aproximadamente 15 g/L o menos, aproximadamente 10 g/L o menos, aproximadamente 5 g/L o menos, aproximadamente 3 g/L o menos, aproximadamente 2 g/L o menos, aproximadamente 1,5 g/L o menos, aproximadamente 1,0 g/L o menos, aproximadamente 0,75 g/L o menos.
[0203] El compuesto de sustrato en las mezclas de reaccion se puede variar, teniendo en cuenta, por ejemplo, la cantidad deseada de compuesto de producto, el efecto de la concentracion de sustrato sobre la actividad enzimatica, la estabilidad de la enzima en condiciones de reaccion y el porcentaje de conversion de sustrato en producto. En algunas realizaciones del metodo, las condiciones de reaccion adecuadas comprenden una carga de compuesto de sustrato de al menos aproximadamente 0,5 a aproximadamente 200 g/L, 1 a aproximadamente 200 g/L, 5 a aproximadamente 150 g/L, aproximadamente 10 a aproximadamente 100 g/L, o aproximadamente 50 a aproximadamente 100 g/L. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una carga de compuesto de sustrato de al menos aproximadamente 0,5 g/L, al menos aproximadamente 1 g/L, al menos aproximadamente 5 g/L, al menos aproximadamente 10 g/L, al menos aproximadamente 15 g/L g/L, al menos aproximadamente 20 g/L, al menos aproximadamente 30 g/L, al menos aproximadamente 50 g/L, al menos aproximadamente 75 g/L, al menos aproximadamente 100 g/L, al menos aproximadamente 150 g/L L o al menos unos 200 g/L, o incluso mas. Los valores para las cargas de sustratos proporcionados aqrn se basan en el peso molecular del compuesto (2), sin embargo, tambien contempla que las cantidades molares equivalentes de varios hidratos y sales del compuesto (2) tambien se pueden usar en el proceso. Ademas, los compuestos de sustrato cubiertos por la Formula (II), y (IIa), y el compuesto (4) tambien se pueden usar en cantidades apropiadas, a la luz de las cantidades utilizadas para el compuesto (2).
[0204] En los procesos descritos en el presente documento, el polipeptido de transaminasa modificado utiliza un donante amino para formar los compuestos de productos. En algunas realizaciones, el donante de amino en la condicion de reaccion comprende un compuesto seleccionado de isopropilamina (tambien denominado "MIP"), putrescina, L-lisina, a-fenetilamina, D-alanina, L-alanina o D, L-alanina, o D, L-ornitina. En algunas realizaciones, el donante de amino se selecciona del grupo que consiste en IPM, putrescina, L-lisina, D o L-alanina. En algunas realizaciones, el donante de amino es IPM. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden el donante de amino, en particular IPM, presente en una concentracion de al menos aproximadamente 0,1 a aproximadamente 3,0 M, 0,2 a aproximadamente 2,5 M, aproximadamente 0,5 a aproximadamente 2 M o aproximadamente 1 a aproximadamente 2 M. En algunas realizaciones, el donante de amino esta presente en una concentracion de aproximadamente 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 1, 1,5, 2, 2,5 o 3 M.
[0205] Las condiciones de reaccion adecuados para los procesos tambien comprenden tfpicamente la presencia de un cofactor en la mezcla de reaccion. Debido a que las transaminasas disenadas generalmente utilizan miembros de la familia de la vitamina B6, la condicion de reaccion puede comprender un cofactor seleccionado de -piridoxal-5'- fosfato (tambien conocido como piridoxal-fosfato, PLP, P5P), piroxoxina (PN), piridoxal (PL), piridoxamina (PM) y sus homologos fosforilados; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP). En algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender la presencia de un cofactor seleccionado de PLP, PN, PL, PM, PNP y PMP, a una concentracion de aproximadamente 0,1 g/L a aproximadamente 10 g/L, aproximadamente 0,2 g/L L a aproximadamente 5 g/L, aproximadamente 0,5 g/L a aproximadamente 2,5 g/L. En algunas realizaciones, el cofactor es PLP. Por consiguiente, en algunas realizaciones, las condiciones de reaccion adecuadas pueden comprender la presencia del cofactor, PLP, en una concentracion de aproximadamente 0,1 g/L a aproximadamente 10 g/L, aproximadamente 0,2 g/L a aproximadamente 5 g/L, aproximadamente 0,5 g/L a alrededor de 2,5 g/L. En algunas realizaciones, las condiciones de reaccion comprenden una concentracion de PLP de aproximadamente 10 g/L o menos, aproximadamente 5 g/L o menos, aproximadamente 2,5 g/L o menos, aproximadamente 1,0 g/L o menos, aproximadamente 0,5 g/L o menos, o aproximadamente 0,2 g/L o menos.
[0206] En algunas realizaciones del proceso (por ejemplo, donde se utilizan celulas enteras o lisados), el cofactor esta presente naturalmente en el extracto de celulas y no necesita ser complementado. En algunas realizaciones del proceso (por ejemplo, utilizando una enzima transaminasa parcialmente purificada o purificada), el proceso puede comprender ademas una etapa de adicion de cofactor a la mezcla de reaccion enzimatica. En algunas realizaciones, el cofactor se agrega al comienzo de la reaccion y/o se agrega el cofactor adicional durante la reaccion.
[0207] Durante el curso de las reacciones de transaminacion, el pH de la mezcla de reaccion puede cambiar. El pH de la mezcla de reaccion se puede mantener a un pH deseado o dentro de un rango de pH deseado. Esto se puede hacer mediante la adicion de un acido o una base, antes y/o durante el curso de la reaccion. Alternativamente, el pH puede controlarse utilizando un tampon. Por consiguiente, en algunas realizaciones, la condicion de reaccion
5
10
15
20
25
30
35
40
45
50
55
60
65
comprende un tampon. Los tampones adecuados para mantener los intervalos de pH deseados son conocidos en la tecnica e incluyen, a modo de ejemplo y sin limitacion, tampon borato, carbonato, fosfato, trietanolamina (TEA), y similares. En algunas realizaciones, el tampon es TEA. En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden una solucion tampon de TEA, donde la concentracion de TEA es de aproximadamente 0,01 a aproximadamente 0,4 M, de 0,05 a aproximadamente 0,4 M, de 0,1 a aproximadamente 0,3 M, o de aproximadamente 0,1 a aproximadamente 0,2 M En algunas realizaciones, la condicion de reaccion comprende una concentracion de TEA de aproximadamente 0,01, 0,02, 0,03, 0,04, 0,05, 0,07, 0,1, 0,12, 0,14, 0,16, 0,18, 0,2, 0,3 o 0,4 M. En algunas realizaciones, las condiciones de reaccion comprenden agua como un disolvente adecuado sin tampon presente.
[0208] En las realizaciones del proceso, las condiciones de reaccion pueden comprender un pH adecuado. Como se indico anteriormente, el pH deseado o el rango de pH deseado se pueden mantener mediante el uso de un acido o base, un tampon apropiado, o una combinacion de tamponamiento y adicion de acido o base. El pH de la mezcla de reaccion se puede controlar antes y/o durante el curso de la reaccion. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden un pH de la solucion de aproximadamente 8 a aproximadamente 12,5, un pH de aproximadamente 8 a aproximadamente 12, un pH de aproximadamente 9,0 a aproximadamente 11,5, o un pH de aproximadamente 9,5 a aproximadamente 11,0. En algunas realizaciones, las condiciones de reaccion comprenden un pH de la solucion de aproximadamente 8, 8,5, 9, 9,5, 10, 10,5, 11, 11,5, 12 o 12,5.
[0209] En las realizaciones de los procesos en la presente memoria, una temperatura adecuada se puede utilizar
para las condiciones de reaccion, por ejemplo, teniendo en cuenta el aumento de la velocidad de reaccion a temperaturas mas altas, la actividad de la enzima para la duracion suficiente de la reaccion, y como se describe mas adelante, aumente la velocidad de epimerizacion de los diastereomeros del sustrato (para propositos de resolucion cinetica dinamica). Por ejemplo, los polipeptidos modificados por ingeniena genetica de la presente divulgacion tienen una estabilidad incrementada en relacion con el polipeptido de transaminasa natural, y el polipeptido modificado geneticamente de la SEQ ID NO:2, que permite que los polipeptidos modificados geneticamente de la presente divulgacion se usen a temperaturas mas altas para aumentar tasas de conversion y caractensticas de solubilidad del sustrato mejoradas para la reaccion. Por consiguiente, en algunas realizaciones, las condiciones de reaccion adecuadas comprenden una temperatura de aproximadamente 10°C a aproximadamente 70°C, aproximadamente 10°C a aproximadamente 65°C, aproximadamente 15°C a aproximadamente 60°C,
aproximadamente 20°C a aproximadamente 60°C, aproximadamente 20°C a aproximadamente 55°C,
aproximadamente 30°C a aproximadamente 55°C, o aproximadamente 40°C a aproximadamente 50°C. En algunas realizaciones, las condiciones de reaccion adecuadas comprenden una temperatura de aproximadamente 10°C, 15°C, 20°C, 25°C, 30°C, 35°C, 40°C, 45°C, 50°C, 55°C, 60°C, 65°C, o 70°C. En algunas realizaciones, la temperatura durante la reaccion enzimatica se puede mantener a una temperatura durante todo el curso de la
reaccion. En algunas realizaciones, la temperatura durante la reaccion enzimatica se puede ajustar sobre un perfil
de temperatura durante el curso de la reaccion.
[0210] En algunas realizaciones del proceso, las condiciones de reaccion adecuados pueden comprender, ademas,
la presencia del cofactor reducido, el dinucleotido de adenina de nicotinamida (NADH), que puede actuar para limitar la inactivacion de la enzima de transaminasa (Vease, por ejemplo, van Ophem et al., 1998, Biochemistry 37 (9): 2879-88). En dichas realizaciones donde esta presente NADH, se puede usar un sistema de regeneracion de
cofactor, tal como deshidrogenasa de glucosa (GDH) y glucosa o deshidrogenasa de formiato y formiato para
regenerar el NADH en el medio de reaccion.
[0211] Los procedimientos que utilizan las transaminasas modificadas se llevan a cabo generalmente en un disolvente. Los disolventes adecuados incluyen agua, soluciones de tampon acuosas, disolventes organicos, y/o sistemas de co-disolvente, que generalmente comprenden disolventes acuosos y disolventes organicos. El solvente acuoso (agua o sistema de co-solvente acuoso) puede tener un pH tamponado o no tamponado. En algunas realizaciones, los procesos que utilizan los polipeptidos de transaminasas modificados generalmente se llevan a cabo en un sistema de co-disolvente acuoso que comprende un disolvente organico (por ejemplo, etanol, isopropanol (IPA), dimetilsulfoxido (DMSO), acetato de etilo, acetato de butilo, 1-octanol, heptano, octano, metilo t- butilo eter (MTBE), tolueno y similares), lfquidos ionicos (por ejemplo, tetrafluoroborato de 1 -etilo 4-metilimidazolio, tetrafluoroborato de 1-butilo-3-metilimidazolio, 1-butilo-hexafluorofosfato de 3-metilimidazolio, y similares). El componente de disolvente organico de un sistema de co-disolvente acuoso puede ser miscible con el componente acuoso, proporcionando una unica fase lfquida, o puede ser parcialmente miscible o inmiscible con el componente acuoso, proporcionando dos fases lfquidas. Los sistemas de co-disolvente acuosos ejemplares comprenden agua y uno o mas disolventes organicos. En general, un componente de disolvente organico de un sistema de co-disolvente acuoso se selecciona de modo que no inactive completamente la enzima de transaminasa. Los sistemas de co- disolvente apropiados pueden identificarse facilmente midiendo la actividad enzimatica de la enzima de transaminasa disenada espedficamente con un sustrato definido de interes en el sistema de disolvente candidato, utilizando un ensayo de actividad enzimatica, como los descritos en este documento. En algunas realizaciones del proceso, las condiciones de reaccion adecuadas comprenden un co-disolvente acuoso que comprende DMSO a una concentracion de aproximadamente 1% a aproximadamente 80% (v/v), aproximadamente 1 a aproximadamente 70% (v/v), aproximadamente 2 % a aproximadamente 60% (v/v), entre el 5% y el 40% (v/v), entre el 10% y el 40% (v/v), entre el 10% y el 30% (v/v), o entre el 10% y el 20% (v/v). En algunas realizaciones del proceso, las
5
10
15
20
25
30
35
40
45
50
55
60
65
condiciones de reaccion adecuadas comprenden un co-disolvente acuoso que comprende DMSO a una concentracion de al menos aproximadamente 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75% o 80% (v/v).
[0212] Las condiciones de reaccion adecuadas pueden comprender una combinacion de parametros de reaccion que proporcionan para la conversion biocatalttica de los compuestos de sustrato a sus compuestos de productos correspondientes. Por consiguiente, en algunas realizaciones del proceso, la combinacion de parametros de reaccion comprende: (a) carga de sustrato de aproximadamente l0 a 200 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) concentracion de polipeptidos modificados de aproximadamente 0,5 g/L a 5 g/L; (c) concentracion de MIP de aproximadamente 0,1 a 3 M; (d) concentracion de cofactor de PLP de aproximadamente 0,1 a 1 mM; (e) concentracion de DMSO de aproximadamente 30% (v/v) a aproximadamente 60% (v/v); (f) pH de aproximadamente 9,5 a 11,5; y (g) temperatura de aproximadamente 45°C a 60°C.
[0213] En algunas realizaciones, la combinacion de parametros de reaccion comprende: (a) aproximadamente 50 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) aproximadamente 2 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 1 M de isopropilamina (IPM); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) sobre pH 10; y (g) unos 50°C.
[0214] En algunas realizaciones, la combinacion de parametros de reaccion comprende: (a) aproximadamente 50 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) aproximadamente 1 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 1 M isopropilamina (IPM); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) sobre pH 11; y (g) unos 55°C.
[0215] En algunas realizaciones, la combinacion de parametros de reaccion comprende: (a) aproximadamente 50 g/L de compuesto de sustrato (por ejemplo, compuesto (2)); (b) aproximadamente 0,5 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 2 M isopropilamina (MIP); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) alrededor de pH 11.5; y (g) unos 55°C.
[0216] Las condiciones de reaccion ejemplares adicionales incluyen las condiciones de ensayo proporcionados en las Tablas 2A, 2B y 2C, y en el Ejemplo 1.
[0217] En la realizacion de las reacciones de transaminacion descritas en este documento, el polipeptido de transaminasa modificado se puede anadir a la mezcla de reaccion en la enzima parcialmente purificada o purificada, celulas completas transformadas con el (los) gen(es) que codifican la enzima, y/o como extractos de celulas y/o lisados de tales celulas. Se pueden emplear celulas completas transformadas con el gen o los genes que codifica(n) la enzima transaminasa modificada por ingeniena genetica o extractos celulares, sus lisados y enzimas aisladas en una variedad de formas diferentes, que incluyen solidos (por ejemplo, liofilizados, secados por aspersion y similares) o semisolido (por ejemplo, una pasta cruda). Los extractos celulares o los lisados celulares se pueden purificar parcialmente mediante precipitacion (por ejemplo, sulfato de amonio, polietilenimina, tratamiento termico o similares), seguido de un procedimiento de desalinizacion (por ejemplo, ultrafiltracion, dialisis y similares) antes de la liofilizacion. Cualquiera de las preparaciones enzimaticas se puede estabilizar mediante reticulacion utilizando agentes de reticulacion conocidos, como, por ejemplo, glutaraldetndo, o inmovilizarse en un material en fase solida (por ejemplo, resinas, perlas como quitosan, Eupergit C, SEPABEADs y similares).
[0218] En algunas realizaciones de las reacciones de transaminacion descritas en este documento, la reaccion se lleva a cabo bajo las condiciones de reaccion adecuadas descritas en este documento, en donde el polipeptido de transaminasa modificado se inmoviliza a un soporte solido. Los soportes solidos utiles para inmovilizar las transaminasas disenadas para llevar a cabo las reacciones de transaminacion incluyen, pero no se limitan a, perlas o resinas que comprenden polimetacrilato con grupos funcionales epoxido, polimetacrilato con grupos funcionales amino epoxido, copolfmero de estireno/DVB o polimetacrilato con grupos funcionales octadecilo. Los soportes solidos ejemplares incluyen, pero no se limitan a, perlas de quitosan, Eupergit C y SEPABEADs (Mitsubishi), incluidos los siguientes tipos diferentes de SEPABEAD: EC-EP, EC-HFA/S, EXA252, EXE119 y EXE120.
[0219] En algunas realizaciones en las que el polipeptido modificado se puede expresar en la forma de un polipeptido secretado, el medio de cultivo que contiene los polipeptidos secretados se puede utilizar en el proceso de la presente memoria.
[0220] En algunas realizaciones, reactivos solidos (por ejemplo, de enzimas, sales, etc.) pueden proporcionarse a la reaccion en una variedad de diferentes formas, incluso en polvo (por ejemplo, liofilizado, secado por pulverizacion, y similares), solucion de emulsion, suspension, y similares. Los reactivos pueden liofilizarse o secarse por pulverizacion facilmente utilizando metodos y equipos que son conocidos por los expertos en la tecnica. Por ejemplo, la solucion de protema se puede congelar a -80°C en pequenas alfcuotas, y luego agregarse a una camara de liofilizacion previamente enfriada, seguido de la aplicacion de un vacfo.
[0221] En algunas realizaciones, el orden de adicion de los reactivos no es cntico. Los reactivos pueden agregarse juntos al mismo tiempo a un solvente (por ejemplo, solvente monofasico, sistema de co-solvente acuoso bifasico y
5
10
15
20
25
30
35
40
45
50
55
60
65
similares), o alternativamente, algunos de los reactivos pueden agregarse por separado, y algunos juntos en diferentes momentos puntos. Por ejemplo, el cofactor, transaminasa y sustrato de transaminasa se pueden agregar primero al disolvente. Para mejorar la eficiencia de mezcla cuando se usa un sistema de co-solvente acuoso, la transaminasa y el cofactor se pueden agregar y mezclar primero en la fase acuosa. Luego se puede agregar y mezclar la fase organica, seguido de la adicion del sustrato de transaminasa. Alternativamente, el sustrato de la transaminasa se puede premezclar en la fase organica, antes de la adicion a la fase acuosa.
[0222] En algunas realizaciones, el proceso puede comprender ademas una etapa de eliminacion del subproducto de carbonilo formado a partir del donante de grupo amino cuando el grupo amino se transfiere al compuesto sustrato de formula (II), (IIa), compuesto (2), o compuesto (4). Dicha eliminacion in situ puede reducir la velocidad de la reaccion inversa, de manera que la reaccion directa domina y luego se convierte mas sustrato en producto. La eliminacion del subproducto de carbonilo se puede llevar a cabo de varias maneras. Cuando el donante del grupo amino es un aminoacido, como la alanina, el subproducto de carbonilo, un cetoacido, puede eliminarse por reaccion con un peroxido (Vease, por ejemplo, la Publicacion de Patente de EE.UU. 2008/0213845A1). Peroxidos que pueden usarse incluyen, entre otros, peroxido de hidrogeno; peroxiacidos (peracidos), tales como acido peracetico (CH3CO3H), acido trifluoroperacetico y acido metacloroperoxibenzoico; peroxidos organicos como el peroxido de t- butilo ((CH3)3COOH) u otros oxidantes selectivos como el perrutenato de tetrapropilamonio, MnO2, KMnO4, tetroxido de rutenio y compuestos relacionados. Alternativamente, la eliminacion de piruvato se puede lograr a traves de su reduccion a lactato empleando deshidrogenasa de lactato para cambiar el equilibrio al producto amina (Vease, por ejemplo, Koszelewski et al., 2008, Adv Syn Catal. 350: 2761-2766). La eliminacion de piruvato tambien se puede lograr a traves de su descarboxilacion a dioxido de carbono acetaldehfdo empleando descarboxilasa de piruvato (vease, por ejemplo, Hohne et al., 2008, Chem BioChem 9: 363-365).
[0223] En algunas realizaciones, cuando la eleccion del donante de amino resulta en un subproducto de carbonilo que tiene una presion de vapor mas alta que el agua (por ejemplo, un coproducto de bajo punto de ebullicion, como un compuesto carbomlico organico volatil), el subproducto de carbonilo puede eliminarse rociando la solucion de reaccion con un gas no reactivo o aplicando un vacfo para disminuir la presion de reaccion y eliminando el subproducto de carbonilo presente en la fase gaseosa. Un gas no reactivo es cualquier gas que no reacciona con los componentes de la reaccion. Varios gases no reactivos incluyen nitrogeno y gases nobles (por ejemplo, gases inertes). En algunas realizaciones, el gas no reactivo es gas nitrogeno. En algunas realizaciones, el donante de amino usado en el proceso es isopropilamina (IPM), que forma la acetona del subproducto de carbonilo tras la transferencia del grupo amino al aceptor del grupo amino. La acetona se puede eliminar rociando con gas nitrogeno o aplicando un vacfo a la solucion de reaccion y eliminando la acetona de la fase gaseosa mediante una trampa de acetona, como un condensador u otra trampa fria. Alternativamente, la acetona puede eliminarse por reduccion a isopropanol utilizando una cetoreductasa.
[0224] En algunas realizaciones del proceso donde se elimina el subproducto de carbonilo, el donante de grupo amino correspondiente se puede anadir durante la reaccion de transaminacion para reponer el donante de grupo amino y/o mantener el pH de la reaccion. La reposicion del donante del grupo amino tambien desplaza el equilibrio hacia la formacion del producto, aumentando asf la conversion del sustrato en producto. Por lo tanto, en algunas realizaciones donde el donante del grupo amino es IPM y el producto de acetona se elimina in situ, el proceso puede comprender ademas un paso de agregar IPM a la solucion de reaccion para reponer el donante del grupo amino perdido durante la eliminacion de la acetona y mantener el pH de la reaccion (por ejemplo, entre aproximadamente
8,5 y aproximadamente pH 11,5).
[0225] En algunas realizaciones, tambien se contempla que el proceso que comprende la conversion biocatalftica de compuestos de sustrato aceptor de amina a compuestos de productos amina quiral usando polipeptidos de transaminasa de la presente divulgacion pueden comprender ademas las etapas de formacion de sales o acidos farmaceuticamente aceptables, formulaciones farmaceuticamente aceptable, elaboracion del producto, extraccion, aislamiento, purificacion y/o cristalizacion, cada una de las cuales puede llevarse a cabo bajo una serie de condiciones.
[0226] En algunas realizaciones, los procesos que usan los polipeptidos modificados aqrn descritos pueden llevarse a cabo en donde el proceso comprende ademas la etapa de aislar el compuesto de Formula (I), el compuesto de Formula (la), el compuesto (1), o el compuesto (3) de la reaccion.
[0227] En algunas realizaciones, los procesos que utilizan los polipeptidos modificados aqrn descritos pueden llevarse a cabo en donde el proceso comprende ademas la etapa de convertir el compuesto de Formula (I), el compuesto de Formula (Ia), el compuesto (1) o el compuesto (3) en una sal farmaceuticamente aceptable poniendo en contacto dicho compuesto con un acido farmaceuticamente aceptable en un disolvente de reaccion adecuado. En algunas realizaciones del proceso, el acido farmaceuticamente aceptable es acido fosforico y la sal farmaceuticamente aceptable es la sal de fosfato de dihidrogeno. En algunas realizaciones, los procesos pueden comprender ademas la etapa de cristalizar la sal farmaceuticamente aceptable del disolvente de reaccion.
[0228] En algunas realizaciones, los procesos que usan los polipeptidos modificados en el presente documento pueden llevarse a cabo en donde el grupo amino donante se selecciona de isopropilamina, alanina, acido 3-
5
10
15
20
25
30
35
40
45
50
55
60
65
aminobutmco o metilbencilamina. En algunas realizaciones, el donante del grupo amino es isopropilamina.
[0229] Como se senalo anteriormente, el compuesto (1) es sitagliptina, el ingrediente farmaceutico activo en JANUVIA®, Por consiguiente, los procedimientos descritos en este documento usando polipeptidos modificados para la fabricacion de compuesto (l), y/o su acido o sal farmaceuticamente aceptable, pueden ser utilizados en procesos mas grandes para la produccion de JANUVIA® o compuestos farmaceuticos relacionados. En algunas realizaciones, la presente divulgacion tambien proporciona un proceso para la preparacion de (2R)-4-oxo-4-[3- (trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)-ilo]-1-(2,4,5-trifluorofenilo)butano-2-amina fosfato (1:1) monohidrato, en donde el proceso comprende una etapa de conversion de un compuesto de sustrato (2) a un compuesto producto (1) poniendo en contacto un sustrato del compuesto (2) con un polipeptido modificado como se describe en el presente documento en presencia de un grupo amino donante en condiciones de reaccion adecuadas.
[0230] En algunas realizaciones, la presente divulgacion proporciona ademas un procedimiento para la preparacion del compuesto (3), o una sal o acido del compuesto farmaceuticamente aceptable (3), en donde el procedimiento comprende una etapa de convertir un compuesto de sustrato (4), o un sustrato del compuesto (4) modificado con un grupo protector, a un compuesto del producto (3), poniendo en contacto un sustrato del compuesto (4), o un sustrato del compuesto (4) modificado con un grupo protector, con un polipeptido como se describe en el presente documento en presencia de un donante del grupo amino en condiciones de reaccion adecuadas.
[0231] Los metodos, tecnicas y protocolos para extraer, aislar, formar una sal de purificar y/o cristalizar compuestos de productos aminados o compuestos ciclados a partir de mezclas de reaccion biocatalttica producidas por los procesos descritos anteriormente son conocidos por el experto en la materia y/o se accede a traves de la experimentacion rutinaria. Adicionalmente, metodos ilustrativos se proporcionan en los ejemplos a continuacion.
[0232] Varias caractensticas y realizaciones de la descripcion se ilustran en los siguientes ejemplos representativos, que estan destinados a ser ilustrativos, y no limitantes.
6. EJEMPLOS
Ejemplo 1: Smtesis, optimizacion y seleccion de polipeptidos modificados
A. Adquisicion y optimizacion de genes
[0233] Se uso un gen de codon omptimizado y de transaminasa modificada (SEQ ID NO:1) que codifica el polipeptido modificado geneticamente de referencia de SEQ ID NO:2 como la columna vertebral de partida para la evolucion dirigida a generar los genes que codifican los polipeptidos modificados que tienen actividad de transaminasa de los identificadores de secuencia de numeros pares de SEQ ID NO:4 - 306, cada uno de los cuales es capaz de convertir el compuesto de sustrato (2) en el compuesto de producto (1) con propiedades enzimaticas mejoradas en relacion con el y/o el polipeptido de referencia de SEQ ID NO:2. El gen de la SEQ ID NO:1 y el polipeptido de la SEQ ID NO:2 de la presente divulgacion corresponden a la SEQ ID NO:109 y 110 de la US
8.293.507 B2, expedida el 23 de octubre de 2012. El polipeptido de la transaminasa modificado por ingeniena genetica de la SEQ ID NO:2 tiene las siguientes 28 diferencias de aminoacidos en relacion con la secuencia polipeptfdica de tipo salvaje Arthrobacter sp. de KNK168 (acceso a GenBank: BAK39753.1; GI: 336088341): S8P, Y60F, L61Y, H62T, V65T, D81G, M94I, I96L, V128V, V124S, V124S, V124S, V124S, V124S, V124T, G116F, Y150 S A209L, G215C, G217N, S223P, L269P, L273Y, T282S, A284G, P297S, I306V y S321P. La clonacion de la SEQ ID NO:1 en el sistema del vector pCK110900 (Vease, por ejemplo, la Publicacion de Solicitud de Patente de EE.UU. 2006/0195947A1) y la expresion subsiguiente en E. coli W3110 fhu A fue como se describe en el documento US
8.293.507 B2, publicado el 23 de octubre de 2012. En pocas palabras, E. coli W3110 expresa los polipeptidos de la transaminasa como una protema intracelular bajo el control del promotor lac. El polipeptido se acumula principalmente como una enzima activa citosolica soluble. Los metodos estandar de evolucion dirigida a traves de la generacion de bibliotecas de variantes iterativas por sintesis de genes seguidos de la seleccion y secuenciacion de aciertos para generar los derivados modificados de la secuencia de genes SEQ ID NO:1 descritos aqrn. Los ensayos de HTP utilizados para la seleccion primaria se llevaron a cabo utilizando el lisado celular eliminado de la expresion de estas celulas de E. coli W3110 (consulte la Tabla 2A y mas adelante).
B. Ensayos de HTP
[0234] Celulas E. coli que expresan los polipeptidos modificados se lisaron mediante la adicion de 200 pL de tampon de lisis que contema tampon de 0,1 M de TEA, 1 g/L de lisozima, y 0,5 g/L de sulfato de polimixina B, y 0,25 mM de PLP, a pH 8,5, luego agitando (a 250 rpm) durante 2 h a temperatura ambiente. Las condiciones generales del ensayo de actividad de HTP fueron: 50 g/L de compuesto de sustrato (2), 1 o 1,2 mM de PLP, 50% (v/v) de DMSO, 20 pL o 40 pL de lisado de celulas claras (que contienen polipeptidos modificados expresados), 1,5 M o 2 M IPM, pH 11 o pH 11,5, y agitacion a 200 rpm y 55°C durante 4 horas o 18 horas. La reaccion del ensayo se detuvo mediante la adicion de 1 mL de acetonitrilo y se agito durante 5 minutos, seguido de centrifugacion de la placa durante 10 minutos a 4000 x g a 18°C. Las condiciones espedficas de reaccion de ensayo y lisis se indican en la Tabla 2A.
5
10
15
20
25
30
35
40
45
50
55
60
65
C. Preparaciones y ensayos de SFP
[0235] Ademas del ensayo HTP para el cribado primario, en algunos casos, una seleccion secundaria se llevo a cabo en una escala de 5 mL usando preparaciones de polvo del matraz de agitacion (SFP) de los polipeptidos de transaminasa modificados. El polvo del matraz de agitacion (SFP) incluye aproximadamente un 30% de protema total y, por consiguiente, proporciona una preparacion mas purificada de una enzima ingerida en comparacion con el lisado celular utilizado en los ensayos de HTP.
[0236] Para la preparacion de SFPs, una sola colonia microbiana de E. coli que contienen un plasmido que codifica una transaminasa modificada de interes se inoculo en 50 mL de caldo Luria Bertani que contiene 30 pg/mL de cloranfenicol (CAM) y 1% de glucosa. Las celulas se cultivaron durante la noche (al menos 16 horas) en una incubadora a 30°C con agitacion a 250 rpm. El cultivo se diluyo en 250 mL de medio 2xYT (Difco) que contema 30 pg/ml de CAM y 100 mM de piridoxina, en un matraz de 1000 mL a una densidad optica a 600 nm (OD600) de 0,1 y se dejo crecer a 30°C. La expresion del gen de transaminasa modificada mediante ingeniena genetica se indujo mediante la adicion de isopropilo-P-D-tiogalactosido ("IPTG") a una concentracion final de 1 mM cuando la OD600 del cultivo fue de 0,6 a 0,8. La incubacion se continuo durante la noche (al menos 16 horas). Las celulas se recogieron por centrifugacion (5000 rpm, 30 min, 5°C) y el sobrenadante se descarto. El sedimento celular se resuspendio con 12 mL de 50 mM de tampon fno (4°C) de fosfato de potasio pH 8,5, que contiene 100 pM piridoxal 5' fosfato, y se hizo pasar una vez a traves de un disruptor de un solo disparo (Constant System Ltd) a 16 kpsi, mientras que se mantiene a 4°C. Los residuos celulares se eliminaron por centrifugacion (10.000 rpm, 40 minutos, 5°C). El sobrenadante de lisado claro se recogio y almaceno a -80°C. La liofilizacion del lisado claro congelado proporciona un polvo de matraz de agitacion seco del polipeptido de la transaminasa en bruto. Alternativamente, el sedimento celular (antes o despues del lavado) se puede almacenar a 4°C o -80°C.
[0237] El ensayo SFP general contema la siguiente mezcla de partida de reaccion en un volumen total de 5 mL: 50 g/L de sustrato de compuesto (2), 0,5, 1 o 2 g/L del polipeptido modificado SFP, 1 o 1,2 mM PLP, 1 Mo 2M IPM, 50% (v/v) DMSO y 0,05 M de tampon TEA. Las condiciones de reaccion de la SFP fueron: pH 10 y 50°C; pH 11,5 y 55°C; o pH 11,5 y 60°C. El tiempo de reaccion del ensayo SFP fue de 2 o 24 h con agitacion a 250 rpm con un agitador magnetico.
[0238] El protocolo general para el ensayo de SFP fue como sigue. Se preparo una solucion madre (premezcla) diariamente para cada grupo de experimentos de la siguiente manera: a 0,5 mL de PLP 10 o 12 mM en agua esteril, 0,82 mL de IPM, 2,5 mL de DMSO y compuesto de sustrato (2) a concentracion de 50 g/L. El pH de la solucion de premezcla se ajusto con HCl al 37%. Se preparo una solucion madre de polipeptido modificado geneticamente de 25, 50 o 100 g/L disolviendo 12,5, 25 o 50 mg de SFP del polipeptido en 0,5 ml de tampon TEA (0,1 M, pH 8,5).
[0239] Para cada experimento, se anadio 4,9 mL de solucion de premezcla de reserva en un vial de tapon de rosca de vidrio. El vial se cerro hermeticamente y se calento a 50, 55 o 60°C con agitacion magnetica a 250 rpm. Se anadieron a la mezcla de reaccion 100 pL de una solucion del polvo de la enzima en 0,2 M de borato, pH 10,5. El vial se cerro hermeticamente y la reaccion se dejo continuar agitando durante 2 o 24 h. La reaccion se detuvo despues de 2 o 24 h mediante la adicion de 20 mL de acetonitrilo.
D. Preparaciones y ensayos de DSP
[0240] Los polvos de DSP de los polipeptidos de transaminasas modificados por ingeniena genetica se prepararon como una breve fermentacion discontinua seguida de un proceso discontinuo alimentado de acuerdo con metodos de bioprocesamiento estandar con 5 mM de piridoxina HCl anadido a la alimentacion y al medio fermentador. Brevemente, la expresion del polipeptido de transaminasa se indujo mediante la adicion de IPTG a una concentracion final de 1 mM. Despues de la fermentacion, las celulas se recogieron y se resuspendieron en 100 mM de tampon TEA con pH 7,5, y luego se rompieron mecanicamente mediante la homogeneizacion del polipeptido de transaminasa. Los residuos celulares y el acido nucleico se flocularon con polietilenimina (PEI) y la suspension se clarifico por centrifugacion. El sobrenadante transparente resultante se concentro utilizando una membrana de ultrafiltracion de flujo cruzado tangencial para eliminar las sales y el agua. El concentrado de enzimas parcialmente purificado y concentrado se seco luego en un liofilizador para proporcionar el polvo de DSP, que se empaqueto en recipientes (por ejemplo, polietileno).
[0241] Los ensayos de actividad de DSP se llevaron a cabo a una escala de 5 mL utilizando los mismos metodos descritos anteriormente para los ensayos de actividad de SFP, con la unica diferencia de que la concentracion final del ensayo del polipeptido modificado geneticamente modificado fue de solo 0,5 g/L o 1,0 g/L.
E. Analisis HPLC de ensayos
[0242] Despues de ejecutar los ensayos de HTP, SFP o DSP como se describio anteriormente, se analizaron muestras de las soluciones de reaccion de ensayo enfriadas con acetonitrilo para determinar el porcentaje de conversion del sustrato del compuesto (2) en el producto del compuesto (1), asf como la pureza estereoisomerica
5
10
15
20
25
30
35
40
45
50
55
60
65
(es dedr, % e.e.) del producto utilizando metodos analtticos de HPLC quiral y quiral estandar tal como se describe en, por ejemplo, el Ejemplo 4 del documento US 8.293.507 B2 (vease tambien: Savile, et al., 2010, "Biocatalytic asymmetric synthesis of chiral amines from ketones applied to sitagliptin manufacture," Science 329 (5989): 305-9 y Supporting Online Materials).
[0243] Brevemente, el porcentaje de conversion del sustrato de compuesto (2) en el compuesto (1) se determino usando un Agilent 1200 HPLC equipado con una columna Agilent Eclipse XDB-C8 (4,6 x 150 mm, 5 pm), usando 45:55 10 mM NH4Ac/MeCN como eluyente a un caudal de 1,5 ml/min y una temperatura de columna de 40°C. Tiempos de retencion: compuesto de sustrato (2) = 1,7 min; compuesto (l) = 1,4 min. El sustrato y el producto en el eluyente se determinaron como el area del pico a 210 nm o 286 nm, con una longitud de recorrido de 1 cm.
[0244] La pureza estereoisomerica del compuesto (1) se determino usando una HPLC Agilent 1200 equipada con una columna Daicel Chiralpak AD-H (4,6 x 150 mm, 5 pm) usando 60:40: 0,1: 0,1 EtOH/heptano/dietilamina/agua como eluyente a un caudal de 0,8 ml/min y una temperatura de columna de 35°C. Tiempos de retencion: compuesto de sustrato (2) = 6.3 min; compuesto de producto(s) enantiomerico(s) = 8,4 min; compuesto (1) = 10,8 min. El sustrato y el producto se determinaron como el area del pico a 210 nm o 268 nm con una longitud de recorrido de 1 cm.
F. Resultados
[0245] Los resultados de los ensayos de actividad, estabilidad y estereopurez espedficos para las preparaciones de HTP, SFP y DSP de polipeptidos modificados espedficos que tienen actividad de transaminasa de la presente descripcion se proporcionan en las Tablas 2A, 2B y 2C.
LISTADO DE SECUENCIAS
[0246]
<110> CODEXIS, INC. QUINTANAR-AUDELO, Martina EBERHARD, Ellen NAZOR, Jovana SMITH, Derek WANG,
Cuixia
<120> POLIPEPTIDOS DE TRANSAMINASA MODIFICADOS PARA BIOCATALISIS INDUSTRIAL <130> CX2- 129USP1
<160> 306
<170> Patentln version 3.5
<210> 1 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 1
atggcgttct cagcggacac ccctgaaatc gtttacaccc acgacaccgg tctggactat 60 atcacctact ctgactacga actggacccg gctaacccgc tggctggtgg tgctgcttgg 120 atcgaaggtg otttcgttcc gccgtctgaa gctcgtatct ctatcttcga ccagggtttt 180 tatacttctg acgctaccta caccaccttc cacgtttgga acggtaacgc tttccgtctg 240 ggggaccaca tcgaacgtct gttctctaat gcggaatcta ttcgtttgat cccgccgotg 300 acecaggacg aagttaaaga gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360 gcgatggtta ccgttacgat cacccgtggt tactcttcta ccccattcga gcgtgacatc 420 accaaacatc gtccgcaggt ttacatgagc gcttgcccgt accagtggat cgtaccgttt 480 gaccgcatcc gtgacggtgt tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540 agctctatcg acccgcaggt taaaaacttc cagtggggtg acctgatccg tgcaattcag 600 gaaacccacg accgtggttt cgagttgccg ctgetgctgg actgcgacaa cctgctggct 660 gaaggtccgg gttteaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720 gctgctctgc cgggtatcac ccgtaaaacc gttcfcggaaa tcgctgaatc tctgggtcac 780 gaagotatcc tggctgacat caccccggct gaaetgtacg acgotgacga agttctgggt 840 tgctoaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaaotc tatctctgac 900 ggtgttccgg gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960 cctt.ct.tctc tgctgacccc ggtacagtac 990
5
10
15
20
25
30
35
40
45
50
55
60
65
<210> 2 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 2
Met 1
Ala Phe Ser Ala 5 ASp Thr Pro
Gly Leu
Asp Tyr 20 He Thr Tyr Ser
Pro
Leu Ala 35 Gly Gly Ala Ala Trp 40
Ser
Glu 50 Ala Arg lie Ser lie 55 Phe
AX 3.
Thr Tyr Thr Thr Phe His Val
Glu
lie 10 < H Tyr Thr His ASp 15 Thr
Asp 25
Tyr Glu Leu Asp Pro 30 Ala Asn
lie
Glu Gly Ala Phe 45 Val Pro Pro
ASp
Gin Gly Phe 60 Tyr Thr Ser Asp
Trp
Asn Gly Asn Ala Phe Arg Ii€£U
65
70
Gly
ASp His lie Glu 85 Arg
He
Pro Pro Leu 100 Thr Gin
Val
Ala Lys 115 Thr Glu Leu
Arg
Gly 130 Tyr Ser Ser Thr
Pro 145
Gin Val Tyr Met Ser 150
ASp
Arg lie Arg Asp 165 Gly
Arg
Thr Pro Arg 180 Ser Ser
Gly
Asp Leu 195 He Arg 1 3L
Leu
Pro 210 Leu Leu Leu Asp
Phe 225
Asn val Val Val He 230
Ala
li^S#U Pro Gly 245 He
Ser
Leu Gly His 260 Glu Ala
Tyr
Asp Ala 275 Asp Glu Val
Pro
Phe 290 Val Ser Val Asp
Pro 305
Val Thr Gin Ser lie 310
Pro
Ser Ser Leu Leu 325 Thr
Leu
Phe Ser Asn 75 Ala
Asp
Glu Val 90 Lys Glu
Arg
Glu 105 Ala Met Val
Pro
120 Phe Glu Arg Asp
135 Ala
Cys Pro Tyr Gin
Val
His Leu Met 155 val
Iife
Asp Pro 170 Gin val
He
Gin 185 Glu Thr His
Cys
200 Asp Asn Leu Leu
215 Lys
Asp Gly Val Val
Thr
Arg Lys Thr 235 Val
lie
Leu Ala 250 Asp
lie
Leu
Gly 265 Cys Ser Thr
Gly
280 Asn Ser lie Ser
295 lie
Arg Arg Tyr Trp
Pro
Val Gin Tyr 315
330
80
Glu
Ser He Arg 95 Leu
lie
Ala Leu 110 Glu Leu
Thr
Val 125 Thr He
Thr
lie 140
Thr Lys His Arg
Trp
lie Val Pro Phe 160
Ala
Gin Ser val 175 Arg
Lys
Asn Phe 190 Gin Trp
Asp
Arg 205 Gly Phe Glu
Ala 220
Glu Gly Pro Gly
Arg
Ser Pro Gly Arg 240
Leu
Glu lie Ala 255 Glu
Thr
Pro Ala 270 Glu Leu
Gly
Gly 285 Gly Val Trp
Asp 300
Gly Val Pro Gly
Glu
Leu Asn Val Glu 320
5
10
15
20
25
30
35
40
45
50
55
60
65
<210> 3 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 3
atggcgttct cagcggacac ccctgaaatc gtttacaccc acgacaccgg tctggactat 60 atcacctact ctgactaega actggacccg gctaacccgc tggctggtgg tgctgcttgg 120
a+'/'/Taa/TfTf'/T /-i 4— 4— 4— 4- »-« j-i a a +■ /*'!+■ rrra /i/iartfr/tt*4-4- 4- *1 Q H

ct l ody y uy i» uy u uww y ooy uu i>y cl cl y w wwy uo Lw l u u cl l> l> l> i»wy cl codyyy uu i>l> io u
4- a4- /-»+- rr a /-t 4- a r<r<4' a r^a/a/^a/^/"i4-4- y-i-j 4- 4- rmss sa at a 4- 4- 4* jti t*i Oijfl

^ _ i*^i. ^ -i^i.t. _ ^ ^ .i. _ i.. i. j rt -( 3 tllll. ^ i1Ml-C1Ml-1 _t _ft t _^ rfi i _i _ ^ ^ _ iIM_ i( _i**! i( ^ tr L j -i .11.,i I _ n tlir.i 3 c. _ Ir ^ r ^ r _( i ^ _ t._ ^ _t .i "a ^

ggggaccaca tcgaacgtct gttctctaat gcggaatcta ttogtttgat cccgccgctg 300

acccaggacg aagttaaaga gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360

gcgatggtta ccgttacgat cacccgtggt tactcttcta ccccattcga gcgtgacatc 420

accaaacatc gtccgcaggt ttacatgagc gcttgcccgt accagtggat egtaccgttt 480

gaccgcatcc gtgacggtgt tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540

agctctatcg acccgcaggt taaaaacttc cagtggggtg acctgatccg tgcaattcag 600

gaaacccacg accgtggttt cgagttgccg etgctgctgg actgcgacaa cctgctggct 660

gaaggtccgg gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720

agggctctgc cgggtatcac ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780

gaagctatcc tggctgacat caccccggct gaactgtacg acgctgacga agttctgggt 840

tgctcaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaactc tatctctgac 900

ggtgttccgg gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960

ccttcttctc tgctgacccc ggtacagtac 990
<210> 4 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 4
5
10
15
20
25
30
35
40
45
50
55
60
65
Met
Ala Phe Ser Ala Asp Thr Pro Glu lie H > Tyr Thr His Asp Thr
1
5 10 15
Gly
Leu Asp Tyr He Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn
20 25 30
Pro
Leu Ala Gly Gly Ala Ala Trp lie Glu Gly Ala Phe Val
Pro
Pro
35 40 45
Ser
Glu Ala Arg lie Ser lie Phe Asp Gin Gly Phe Tyr Thr Ser Asp
50 55 60
AX 3.
Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu
65
70 75 80
Gly
Asp His He Glu Arg Leu Phe Ser Asn Ala Glu Ser He Arg Leu
85 90 95
lie
Pro Pro Leu Thr Gin Asp Glu Val Lys Glu lie Ala Leu Glu Leu
100 105 110
Val
Ala Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr lie Thr
115 120 125
Arg
Gly Tyr Ser Ser Thr Pro Phe Glu Arg Asp lie Thr Lys His
Arg
130 135 140
Pro
Gin Val Tyr Met Ser Ala Cys Pro Tyr Gin Trp X le Val Pro Phe
145
150 155 160
Asp
Arg X le Arg Asp Gly Val His Leu Met Val Ala Gin Ser Val Arg
165 170 175
Arg
Thr Pro Arg Ser Ser lie Asp Pro Gin Val Lys Asn Phe Gin Trp
180 185 190
Gly
Asp Leu lie Arg Ala X le Gin Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Leu
Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly Pro Gly
210 215 220
Phe
Asn Val Val Val lie Lys Asp <3iy Val Val Arg Ser Pro Gly Arg
225
230 235 240
Arg
Ala Leu Pro Gly lie Thr Arg Lys Thr Val Leu Glu lie Ala Glu
245 250 255
Ser
Leu Gly His Glu Ala lie Leu Ala Asp lie Thr Pro Ala Glu Leu
260 265 270
Tyr
Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp
275 280 285
Pro
Phe Val Ser Val Asp Gly Asn Ser lie Ser Asp Gly Val Pro Gly
290 295 300
Pro
Val Thr Gin Ser lie Xle Arg Arg Tyr Trp Glu Leu Asn Val Glu
305
310 315 320
Pro
Ser Ser Leu Leu Thr Pro Val Gin Tyr
325 330
<210> 5 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 5
atggcgttct cagcggacac ccctgaaatc gtttacaccc acgacaccgg tctggactat 60
5
10
15
20
25
30
35
40
45
50
55
60
65
atcacctact ctgactacga atcgaaggtg ctttcgttcc tatacttctg acgctaccta ggggaccaca tcgaacgtct acccaggacg aagttaaaga gcgatggtta ccgttacgat accaaacatc gtccgcaggt gaccgcatcc gtgacggtgt agctctatcg acccgcaggt gaaacccacg accgtggttt gaaggtccgg gtttcaacgt cgggctetge cgggtatcac gaagctatcc tggctgacat tgctcaaccg gtggtggtgt ggtgttccgg gtccggttac ccttcttctc tgatgacccc
actggacccg gctaacccgc tggctggtgg tgctgcttgg 120 gccgtctgaa gctcgtatct ctatcttcga ccagggtttt 180 caccaccttc cacgtttgga acggtaacgc tttccgtctg 240 gttctctaat gcggaatcta ttcgtttgat cccgccgctg 300 gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360 cacccgtggt tactcttcta ccccattcga gcgtgacatc 420 ttacatgagc gcttgcccgt accagtggat cgtaccgttt 480 tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540 taaaaacttc cagtggggtg acctgatccg tgcaattcag 600 cgagttgccg ctgctgctgg actgcgacaa cctgctggct 660 tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720 ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780 caccccggct gaactgtacg acgctgacga agttctgggt 840 ttggccgttc gtttctgttg acggtaactc tatctctgac 900 ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960 ggtacagtac 990
<210> 6 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 6
5
10
15
20
25
30
35
40
45
50
55
60
65
Met 1
Ala Phe Ser Ala 5 Asp Thr Pro Glu lie 10 Val Tyr Thr His Asp 15 Thr
Gly
Leu Asp 20 lie Thr Ser Asp 25 Tyr Glu Leu Asp Pro 30 Ala Asn
Pro
Leu Ala 35 Gly Gly Ala AJLa. Trp 40 He Glu Gly Ala Phe 45 Val
Pro
Pro
Ser
Glu 50 Ala Jlrg lie Ser lie 55 Phe Asp Gin Gly Phe 60 Tyr Thr Ser Asp
JO. 3. 65
Thr Tyr Thr Thr Phe 70 His Val Trp Asn Gly 75 Asn Ala Phe Arg Leu 80
Gly
Asp His lie Glu 85 Arg Leu Phe Ser Asn 90 Ala Glu Ser lie Arg 95 Leu
Tip J. -i-53
Pro Pro Leu 100 Thr Gin Asp Glu Val 105 Lys Glu lie Ala Leu 110 Glu Leu
Val
Ala Lys 115 Thr Glu Leu Arg Glu 120 Ala Met Val Thr Val 125 Thr Xle Thr
Arg
Gly 130 Tyr Ser Ser Thr Pro 135 Phe Glu Arg Asp lie 1. Thr Lys His
Arg
Pro 145
Gin Val Tyr Met Ser 150 Ala Cys Pro Tyr Gin 1 Rfs **■ Trp He Val Pro Phe 160
Asp
Jkrg lie Arg Asp 165 Gly Val His Leu Met 170 Val Ala Gin Gd T* Val 175 Jkrg
Arg
Thr Pro Arg 180 Ser Ser He Asp Pro 185 Gin Val Lys Asn Phe 190 Gin Trp
Gly
Asp Leu 195 1 le Arg Ala 1 le Gin 200 Glu Thr Hrs Asp Arg 205 Gly Phe Glu
Leu
Pro 210 Leu Leu Leu Asp Cys 215 Asp Asn Leu Leu Ala 220 Glu Gly Pro Gly
Phe 225
Asn val val Val He 230 Lys Asp Gly Val val 235 Arg Ser Pro Gly Arg 240
Arg
Ala Leu Pro Gly 245 lie Thr Arg Lys Thr 250 Val Leu Glu lie Ala 255 Glu
Ser
Leu Gly His 260 Glu Ala lie Leu Ala 265 Asp lie Thr Pro Ala 270 Glu Leu
Tyr
Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp
275 280 285
Pro
Phe Val Ser val Asp Gly Asn Ser lie Ser Asp Gly val Pro Gly
290 295 300
Pro
Val Thr Gin Ser lie He Arg Arg Tyr Trp Glu Leu Asn Val Glu
305
310 315 320
Pro
Ser Ser Leu Met Thr Pro Val Gin Tyr
325 330
<210> 7 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 7
5
10
15
20
25
30
35
40
45
50
55
60
65

atggcgttct cagcggacac ccctgaaate gtttacaccc acgacaccgg tctggactat 60

atcacctact ctgactacga actggacccg gctaacccgc tggcttgtgg tgctgcttgg 120

atcgaaggtg otttcgttcc gccgtctgaa gctogtatct otatottcga ccagggtttt 180

tatacttctg acgctaecta caccaccttc cacgtttgga acggtaacgc tttccgtctg 240

ggggaccaca tcgaacgtct gttctctaat gcggaatcta ttcgtttgat cccgccgctg 300

acccaggacg aagttaaaga gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360

gcgatggtta ccgttacgat caecegtggt tactcttcta ccccattega gcgtgacatc 420

accaaacatc gtccgcaggt ttacatgagc gcttgcecgt accagtggat cgtaccgttt 480

gaccgcatcc gtgacggtgt tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540

agctctatcg aeccgcaggt taaaaacttc cagtggggtg acctgatccg tgcaatteag 600

gaaacccacg accgtggttt cgagttgccg ctgctgctgg actgcgacaa cctgctggct 660

gaaggtccgg gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tcegggtcgt 720

gctgctctgc cgggtatcac ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780

gaagctatcc tggctgacat caocccggct gaactgtacg acgctgacga agttctgggfc 840

tgctcaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaactc tatctctgac 900

ggtgttccgg gtccggttac ecagtetatc atccgtegtt actgggaact gaaegttgaa 960

ccttcttctc tgctgacccc ggtacagtac 990
<210> 8 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 8
Met 1
Ala Phe Ser
Gly
Leu Asp Tyr 20
Pro
Leu Ala 35 Cys
Ser
Glu 50 Ala Arg
Ala 65
Thr Tyr Thr
Gly
Asp His He
lie
Pro Pro Leu 100
Val
Ala Lys 115 Thr
Arg
Gly 130 Tyr Ser
Ala 5
Asp Thr Pro
He
Thr Tyr Ser
Gly
Ala Ala Trp 40
lie
Ser lie 55 Phe
Thr
Phe 70 His Val
Glu 85
Arg Leu Phe
Thr
Gin Asp Glu
Glu
Leu Arg Glu 120
Ser
Thr Pro 135 Phe
Glu
M hi O H <D Val Tyr
Asp 25
Tyr Glu Leu
lie
Glu Gly Ala
Asp
Gin Gly Phe 60
Trp Asn
Gly 75 Asn
Ser
Asn 90 Ala Glu
Val 105
Lys Glu He
Ala
Met val Thr
Glu Arg
Asp He 140
Thr
His Asp 15
Thr
Asp
Pro 30 Ala Asn
Phe 45
Val Pro Pro
Tyr
Thr Ser Asp
Ala
Phe Arg Leu 80
Ser
lie Arg 95 Leu
Ala
Leu 110 Glu Leu
Val 125
Thr lie Thr
Thr
Lys His Arg
5
10
15
20
25
30
35
40
45
50
55
60
65
Pro
Gin Val Tyr Met Ser Ala Cys Pro Tyr Gin Trp Il@ Val Pro Phe
145
150 155 160
Asp
Arg He Arg Asp Gly Val His Leu Met Val Ala Gin Ser Val Arg
165 170 175
Arg
Thr Pro Arg Ser Ser lie Asp Pro Gin Val Lys Asn Phe Gin Trp
180 185 190
Gly
Asp Leu He Arg Ala lie Gin Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Leu
Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly Pro Gly
210 215 220
Phe
Asn Val Val Val lie Lys Asp Gly Val Val Arg Ser Pro Gly Arg
225
230 235 240
Ala
Ala
Leu Pro Gly I le Thr Arg Lys Thr Val Leu Glu lie Ala Glu
245 250 255
Ser
Leu Gly His Glu Ala 1 le Leu Ala Asp lie Thr Pro Ala Glu Leu
260 265 270
Tyr
Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp
275 280 285
Pro
Phe Val Ser Val Asp Gly Asn Ser He Ser Asp Gly Val Pro Gly
290 295 300
Pro
val Thr Gin Ser He lie Arg Arg Tyr Trp Glu Leu Asn val Glu
305
310 315 320
Pro
Ser Ser Leu Leu Thr Pro Val Gin Tyr
325 330
<210> 9 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 9
atggogttct
atcacctact
■a 4- st <-t
CLv** CLCLxj^ Lj
tatacttctg
ggggaocaca
acccaggacg
gcgatggtta
accaaacatc
gaccgcatcc
agctctatcg
gaaacccacg
gaaggtccgg
gctgctctgc
gaagctatcc
tgcteaaceg
ggtgttccgg
ccttcttctc
cagcggacac
ctgactacga
ctttcgttcc
acgctaccta
tcgaacgtct
aagttaaaga
ccgttacgat
gtccgcaggt
gtgacggtgt
acccgcaggt
accgtggttt
gtttcaacgt
cgggtatcac
tggctgacat
gtggtggtgt
gtccggttac
tgctgacccc
ccctgaaatc actggacccg ggattctgaa caccaccttc gttctctaat gatcgctctg cacccgtggt ttacatgagc tcaoctgatg taaaaacttc cgagttgccg tgttgttatc ccgtaaaacc caccccggct ttggccgttc ccagt estate ggtacagtae
gtttacaccc
gctaacccgc
getegtatet
cacgtttgga
geggaateta
gaactggttg
tactcttcta
gcttgcccgt
gttgctcagt
cagtggggtg
ctgctgctgg
aaagacggtg
gttctggaaa
gaactgtacg
gtttctgttg
atccgtcgtt
aegacaccgg
tggctggtgg
i-i4-a 4" rH-«/ta w w CL w Lm» w w L-#v-£ CL
aeggtaaege
ttcgtttgat
ctaaaaccga
ccccattcga
accagtggat
cagttcgtcg
acctgatccg
actgcgacaa
ttgttcgttc
tegetgaatc
aegetgaega
acggtaactc
actgggaaet
tctggactat 60 tgctgcttgg 120 ccagggtttt 180 tttccgtctg 240 cccgccgctg 300 actgcgtgaa 360 gcgtgacatc 420 cgtaccgttt 480 tacaccgcgt 540 tgcaattcag 600 cctgctggct 660 tccgggtcgt 720 tctgggtcac 780 agttctgggt 840 tatetetgae 900 gaaegttgaa 960 990
5
10
15
20
25
30
35
40
45
50
55
60
65
<210> 10 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 10
Met
Ala Phe Ser Ala Asp Thr Pro Glu lie Val Tyr Thr His Asp Thr
1
5 10 15
Gly
Leu Asp Tyr lie Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn
20 25 30
Pro
Leu Ala Gly Gly Ala Ala Trp lie Glu Gly Ala Phe Val Pro Asp
35 40 45
Ser
Glu Ala Arg lie Ser lie Phe Asp Gin Gly Phe Tyr Thr Ser Asp
50 55 60
Ale
Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu
65
70 75 80
Gly
Asp His i le Glu Arg Leu Phe Ser Asn Ala Glu Ser He Arg Leu
85 90 95
lie
Pro Pro Leu Thr Gin Asp Glu val Lys Glu lie Ala Leu Glu Leu
100 105 110
Val
Ala Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr lie Thr
115 120 125
Arg
Gly Tyr SCilT ger Thr Pro Phe Glu Arg Asp lie Thr Lys His
Arg
130 135 140
Pro
Gin Val Tyr Met Ala Cys Pro Tyr Gin Trp X le Val Pro Phe
«t* <1
150 ICC 1DD 160
Asp
Arg He Arg Asp Gly Val His Leu Met val Ala Gin Ser val Arg
165 170 175
Arg
Thr Pro Arg Ser Ser lie Asp Pro Gin Val Lys Asn Phe Gin Trp
180 185 190
Gly
Asp Leu lie Arg Ala lie Gin Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Leu
Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu ly Pro
210 215 220
Phe
Asn Val Val Val lie Lys Asp Gly Val Val Arg Ser Pro Gly Arg
225
230 235 240
Ala
Ala
Leu Pro Gly He Thr Arg Ly s Thr Val Leu Glu He Ala Glu
245 250 255
Ser
Leu Gly His Glu Ala lie Leu Ala Asp He Thr Pro Ala Glu Leu
260 265 270
Tyr
Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly val Trp
275 280 285
Pro
Phe Val Ser val Asp Gly Asn Ser lie Ser Asp Gly val Pro Gly
290 295 300
Pro
Val Thr Gin Ser lie He Arg Arg Tyr Trp Glu Leu Asn Val Glu
305
310 315 320
Pro
Ser Ser Leu Leu Thr Pro Val Gin Tyr
325 330
<210> 11 <211> 990 <212> ADN
<213> Secuencia artificial
5
10
15
20
25
30
35
40
45
50
55
60
65
<220>
<223> Variante de transaminasa modificada <400> 11
atggcgttct
atcacctact
atcgaaggtg
tatacttctg
ggggaccaca
acccaggacg
gcgatggtta
accaaacatc
gaccgcatcc
agetctatcg
cagcggacac
ctgactacga
atttogttcc
acgctaccta
tcgaacgtct
aagttaaaga
ccgttacgat
gtccgcaggt
gtgacggtgt
acccgcaggt
ccctgaaatc
actggacccg
gacttctgaa
caccaccttc
gttctctaat
gatogctctg
cacccgtggt
ttacatgagc
tcacctgatg
taaaaacttc
gtttacaccc
gctaacccgc
gctcgtatct
cacgtttgga
gcggaatcta
gaaotggttg
tactcttcta
gcttgcccgt
gttgctcagt
cagtggggtg
acgacaccgg
tggctggtgg
otatcttcga
acggtaacgc
ttcgtttgat
ctaaaaccga
ccccattcga
accagtggat
cagttcgtcg
acctgatccg
tctggactat
tgctgcttgg
ccagggtttt
tttccgtctg
cccgccgctg
actgcgtgaa
gcgtgacatc
cgtaccgttt
tacaccgcgt
tgcaattcag
60
120
180
240
300
360
420
480
540
600
gaaacccacg accgtggttt cgagttgccg ctgctgctgg actgcgacaa cctgctggct 660 gaaggtccgg gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720 gctgctctgc cgggtatcac ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780 gaagctatcc tggctgacat caccccggct gaactgtacg acgctgacga agttctgggt 840 tgctcaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaactc tatctctgac 900 ggtgttccgg gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960 ccttcttctc tgctgacccc ggtacagtac 990
<210> 12 <211> 330 <212> PRT
<213> Secuencia artificial
<220>
<223> Variante de transaminasa modificada
<400> 12
5
10
15
20
25
30
35
40
45
50
55
60
65
Met
Ala Phe Ser Ala Asp Thr Pro Glu lie Val Thr His Asp Thr
1
5 10 15
Gly
Leu Asp Tyr lie Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn
20 25 30
Pro
Leu Ala Gly Gly Ala Ala Trp lie Glu Gly Ala Phe Val Pro Thr
35 40 45
Ser
Glu Ala Arg lie Ser lie Phe Asp Gin Gly Phe Tyr Thr Ser Asp
50 55 60
Ala
Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu
65
70 75 80
siy
Asp His 1 le Glu Arg Leu Phe Ser Asn Ala Glu Ser He Arg Leu
85 90 95
lie
Pro Pro Leu Thr Gin Asp Glu Val Lys Glu He Ala Leu Glu Leu
100 105 110
Val
Ala Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr He Thr
115 120 125
Arg
Gly Tyr Ser Ser Thr Pro Phe Glu Arg Asp He Thr Lys His
Arg
130 135 140
Pro
Glu val Tyr Met Ser Ala Cys Pro Tyr Gin Trp i le Val Pro Phe
145
150 155 160
Asp
Arg He Arg Asp Gly Val His Leu Met Val Ala Gin Ser Val Arg
165 170 175
Arg
Thr Pro Arg Ser Ser lie Asp Pro Gin Val Lys Asn Phe Gin Trp
180 185 190
Gly
Asp Leu lie Arg Ala lie Gin Glu Thr His Asp Arg Gly Phe Glu
195 200 205
Leu
Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu a Glu Gly Pro Gly
210 215 220
Phe
Asn val val val He Lys Asp Gly val val Arg Ser Pro Gly Arg
225
230 235 240
Ala
Ala
Leu Pro Gly lie Thr Arg Lys Thr Val Leu Glu lie Ala Glu
245 250 255
Ser
Leu Gly His Glu Ala lie Leu Ala Asp lie Thr Pro Ala Glu Leu
260 265 270
Tyr
Asp Ala Asp Glu val Leu Gly Cys Ser Thr Gly Gly Gly val Trp
275 280 285
Pro
Phe Val Ser Val Asp Gly Asn Ser lie Ser Asp Gly Val Pro Gly
290 295 300
Pro
Val Thr C5 l*n Ser He lie Arg Arg Tyr Trp Glu Leu Asn Val l*ut
305
310 315 320
Pro
Ser Ser Leu Leu Thr Pro Val Gin Tyr
325 330
<210> 13 <211> 990 <212> ADN
<213> Secuencia artificial
5
10
15
20
25
30
35
40
45
50
55
60
65
<220>
<223> Variante de transaminasa modificada <400> 13
atggegttct cagcggacac atcacctact ctgactacga cgggaaggtg ctttcgttcc tatacttctg acgctaccta ggggaccaca tcgaacgtct acccaggacg aagttaaaga gcgatggtta ccgttacgat accaaacatc gtccgcaggt gaccgcatcc gtgacggtgt agctctatcg acccgcaggt gaaacccacg accgtggttt gaaggtccgg gtttcaacgt gctgctctgc cgggtatcac gaagctatco tggctgacat tgctcaaccg gtggtggtgt ggtgttccgg gtccggttac ccttcttctc tgctgacccc
ccctgaaatc gtttacaccc actggacccg gctaacccgc gccgtctgaa gctcgtatct caccaccttc cacgtttgga gttctctaat gcggaatcta gatcgctctg gaactggttg cacccgtggt tactcttcta ttacatgagc gcttgcccgt tcacctgatg gttgctcagt taaaaacttc cagtggggtg cgagttgccg ctgctgctgg tgttgttatc aaagacggtg ccgtaaaacc gttctggaaa caccccggct gaactgtacg ttggccgttc gtttctgttg ccagtctatc atccgtcgtt ggtacagtac
<210> 14 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 14
acgacaccgg
tggctggtgg
ctatcttcga
acggtaacgc
ttogtttgat
ctaaaaccga
ccccattoga
accagtggat
cagttcgtcg
acctgatccg
actgcgacaa
ttgttcgttc
tcgctgaatc
acgotgacga
acggtaactc
actgggaaet
tctggactat
tgctgcttgg
ccagggtttt
tttccgtctg
cccgccgctg
actgcgtgaa
gcgtgacatc
cgtaccgttt
tacaccgcgt
tgcaattcag
cctgctggct
tccgggtcgt
tctgggtcae
agttctgggt
tatotctgac
gaacgttgaa
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
990
Met 1
Ala Phe Ser Ala 5 Asp Thr Pro Glu He 10 HI > Tyr Thr His Asp 15 Thr
Gly
Leu Asp Tyr 20 He Thr Tyr Ser Asp 25 Tyr Glu Leu Asp Pro 30 Ala Asn
Pro
Leu Ala 35 Gly Gly Ala Ala Trp 40 Arg Glu Gly Ala Phe 45 Val
Pro
Pro
Ser
Glu 50 Ala Arg lie Ser lie 55 Phe Asp Gin Gly Phe 60 Tyr Thr Ser Asp
Ala 65
Thr Tyr Thr Thr Phe 70 His Val Trp Asn Gly 75 Asn Ala Phe Arg Leu 80
Gly
Asp His He Glu 85 Arg Leu Phe Ser Asn 90 Ala Glu Ser lie Arg 95 Leu
He
Pro Pro Leu 100 Thr Gin Asp Glu Val 105 Lys Glu lie Ala Leu 110 Glu Leu
Val
Ala Lys 115 Thr Glu Leu Arg Glu 120 Ala Met Val Thr Val 125 Thr lie Thr
Arg
Gly 130 Tyr Ser Ser Thr Pro 135 Phe Glu Arg Asp lie 140 Thr Lys His
Arg
Pro 145
Gin Val Tyr Met Ser 150 Ala Cys Pro Tyr Gin 155 Trp lie Val Pro Phe 160
Asp
Arg lie Arg Asp 165 Gly Val His Leu Met 170 Val Ala Gin Ser Val 175 Arg
Arg
Thr Pro Arg 180 Ser Ser lie Asp Pro 185 Gin Val Lys Asn Phe 190 Gin Trp
Gly
Asp Leu 195 He Arg Ala lie Gin 200 Glu Thr His Asp Arg 205 Gly Phe Glu
Leu
Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly Pro Gly
5
10
15
20
25
30
35
40
45
50
55
60
65
210 215
Phe 225
Asn Val Val Val lie 230 Lys
Ala
Ala
Leu Pro Gly 245 lie Thr
Ser
Leu His 260 Glu Ala lie
Tyr
Asp Ala 275 Asp Glu Val Leu
Pro
Phe 290 Val Ser Val Asp Gly 295
Pro 305
Val Thr Gin Ser lie 310 lie
Pro
Ser Ser Leu Leu 325 Thr
Pro
220
Asp Gly Val Val Arg Ser
235
Arg Lys Thr Val Leu Glu
250
Leu Ala Asp lie Thr Pro
265
Gly Cys Ser Thr Gly Gly 280 285
Asn Ser lie Ser Asp Gly
300
Arg Arg Tyr Trp Glu Leu
315
Val Gin Tyr 330
Pro Gly Arg 240
Xle Ala Glu 255
270
Gly Val Trp Val Pro Gly
Asn Val Glu
320
<210> 15 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 15
a 4- fTf-Tr-Mrl” +* rt4- •r*strrr*fmsn~i>su~*
atcacctaot ctgactacga aaggaaggtg ctttcgttcc
f af ar>f f nf rv a ar,/^t-3
UGtLdtwLwWLy dw^ w LdWw vd
m'Yi'tfTar*r+Skf^zat I* ("’rta a rY+" f* +*
i ,J i 3 t 3 t 1 rt.t . t. — o C -I - t 1 d.d, 1 -1 j 1 - L .. 1 -
acccaggacg aagttaaaga gcgatggtta ccgttacgat accaaacata gtccgcaggt gaccgcatcc gtgacggtgt agctctatcg acccgcaggt gaaacccacg accgtggttt gaaggtccgg gtttcaacgt gctgctctgc cgggtatcac gaagctatcc tggctgacat tgctcaaccg gtggtggtgt ggtgttccgg gtccggttac ccttcttctc taatgacccc
ccctgaaatc gtfctacaccc actggacccg gctaacccgc gcogtctgaa gctcgtatct
•¥• r* r* a <-« <-*•+- 4“ rr/ta
L>dta#tn#dwWW W W Wdw^ W L
La LbL*B Lb L* Lb C3Ld* Lb xj L*b\b| d & Lb L^ L* d
gatcgctctg gaactggttg cacccgtggt tactcttcta ttaoatgagc gcttgcccgt tcacctgatg gttgctcagt taaaaacttc cagtggggtg cgagttgccg ctgctgctgg tgttgttatc aaagacggtg ccgtaaaacc gttctggaaa oaccccggct gaactgt acg ttggccgttc gtttctgttg ccagtctatc atccgtcgtt ggtacagtac
acgacaccgg LcLggactat. 60 tggctggtgg tgctgcttgg 120 ctatcttcga ocagggtttt 180 acggtaacgc Ltfc ccgfcctg^ 240 ttcgtttgat cccgccgctg 300 ctaaaaccga actgcgtgaa 360 ccccattcga gcgtgacatc 420 accagtggat cgtaccgttt 480 cagttcgtcg tacaccgcgt 540 acctgatccg tgcaattcag 600 aotgcgacaa cctgctggct 660 ttgttcgttc tccgggtcgt 720 tcgctgaato tctgggtcac 780 acgctgacga agttctgggt 840 acggtaactc tatctctgac 900 actgggaact gaacgttgaa 960
990
<210> 16 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 16
5
10
15
20
25
30
35
40
45
50
55
60
65
Ala
Phe Ser Ala 5 Asp Thr Pro Glu lie 10 <S H Tyr Thr His Asp 15
Leu
Asp Tyr 20 lie Thr Tyr Ser Asp 25 Tyr Glu Leu Asp Pro 30 Ala
Leu
Ala 35 Gly Gly Ala Ala Trp 40 Lys Glu Gly Ala Phe 45 Val Pro
Glu 50
Ala Arg lie Ser lie 55 Phe Asp Gin Gly Phe 60 Tyr Thr Ser
Thr
Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg
70
75
145
225
305
Asp
His lie Glu Arg Leu Phe Ser Asn Ala Glu Ser lie Arg
85 90 95
Pro
Pro
Leu Thr Gin Asp Glu Val Lys Glu He Ala Leu Glu
100 105 110
Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr He
115 120 125
Gly
Tyr Ser Ser Thr Pro Phe Glu Arg Asp He Thr Lys His
130
135 140
Gin
Val Tyr Met Ser Ala Cys Pro Tyr Gin Trp He Val Pro
150 155
Arg
He Arg Asp Gly val His Leu Met val Ala Gin Ser val
165 170 175
Thr
Pro Arg Ser Ser lie Asp Pro Gin Val Lys Asn Phe Gin
180 185 190
Asp
Leu lie Arg Ala lie Gin Glu Thr His Asp Arg Gly Phe
195 200 205
Pro
Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly
Pro
210
215 220
Asn
val val val lie Lys Asp Gly val Val Arg Ser Pro Gly
230 235
Ala
Leu Pro Gly 1 le Thr Arg Lys Thr Val Leu Glu He
Ala
245 250 255
Leu
Gly His Glu Ala lie Leu Ala Asp lie Thr Pro Ala Glu
260 265 270
Asp
Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val
275 280 285
Phe
Val Ser Val Asp Gly Asn Ser He Ser Asp Gly Val Pro
290
295 300
val
Thr Gin Ser He lie Arg Arg Tyr Trp Glu Leu Asn Val
310 315
Ser
Ser
Leu Met Thr Pro Val Gin Tyr
325 330
160
240
320
<210> 17 <211> 990 <212> ADN
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada
<400> 17
5
10
15
20
25
30
35
40
45
50
55
60
65
atggcgttct
atcacctact
atcggtggtg
tatacttctg
ggggaccaca
acccaggacg
gcgatggtta
accaaacatc
gaccgcatcc
agctctatcg
gaaacccacg
gaaggtccgg
gctgctctgc
gaagctatcc
tgctoaaccg
ggtgttccgg
ccttcttctc
cagcggacac
ctgactacga
ctttcgttcc
acgctaccta
tcgaacgtct
aagttaaaga
ccgttacgat
gtccgcaggt
gtgacggtgt
acccgcaggt
accgtggttt
gtttcaacgt
cgggtatcac
tggctgacat
gtggtggtgt
gtccggttac
tgctgacccc
ccctgaaatc gtttacaccc acgacaccgg tctggactat 60 actggacccg gctaacccgc tggctggtgg tgctgcttgg 120 gccgtctgaa gctcgtatct ctatcttcga ccagggtttt 180 caccaccttc cacgtttgga acggtaacgc tttccgtotg 240 gttctctaat gcggaatcta ttcgtttgat cccgccgctg 300 gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360 cacocgtggt tactcttcta ccccattcga gcgtgacatc 420 ttacatgagc gcttgcccgt accagtggat cgtaccgttt 480 tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540 taaaaactto cagtggggtg acctgatccg tgcaattcag 600 cgagttgccg ctgctgctgg actgcgaoaa cctgctggct 660 tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720 ccgtaaaacc gttctggaaa tcgctgaatc tctgggtoac 780 caccccggct gaactgtacg acgctgacga agttctgggt 840 ttggccgttc gtttctgttg acggtaactc tatctctgac 900 ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960 ggtacagtac 990
<210> 18 <211> 330 <212> PRT
<213> Secuencia artificial <220>
<223> Variante de transaminasa modificada <400> 18

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un polipeptido modificado que tiene actividad transaminasa que comprende una secuencia de aminoacidos que tiene al menos un 80% de identidad de secuencia con la secuencia de referencia de la SEQ ID NO: 2 y diferencias de residuos de aminoacidos en comparacion con la SEQ ID NO: 2 de X155T/I/V/K/A/L y X42A/G.
  2. 2. El polipeptido modificado segun la reivindicacion 1:
    (a) que comprende una combinacion de diferencias de residuos seleccionadas de:
    X42G, X54P, X152S y X155T;
    X42G, X54P, X152S, X155T y R164P;
    X42G, X54P, X150F, X152S y X155T;
    X42G, X54P, X150F, X152S, X155T y X267V;
    X42G, X54P, X150F, X152S, X155L, W156Q y C215G; X42G, X54P, X150F, X152S, X155T, X215G y X267V;
    X33L, X42G, X54P, X117G, X150F, X152S, X155I, X156Q y C215G; X41K, X42G, X54P, X150F, X152S, X155K, X156Q y C215G;
    X33L, X42G, X54P, X109S, X150F, X152S, X155K, X156Q y X215H; X33L, X42G, X54P, X150F, X152S, X155I, X156Q y X215G;
    X33L, X42G, X54P, X150F, X152S, X155K, X156Q y X215H;
    X33L, X42G, X54P, X150F, X152S, X155L, X156Q y X215H;
    X33L, X42G, X54P, X150F, X152S, X155L, X156Q, X215H y X241R;
    X41F, X42G, X54P, X122Q, X150F, X152T, X155V, X156Q y X215G;
    X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X41F, X42G, X54P, X150F, X152S, X155I, X156Q, V171I y X215G;
    X41F, X42G, X54P, X150F, X152S, X155I, X156Q y X215G;
    X41F, X42G, X54P, X150F, X152S, X155L, X156Q, X171I y X215G;
    X41F, X42G, X54P, X150F, X152S, X155L, X156Q y X215G;
    X42G, X48G, X54P, X150F, X152S, X155L, X156Q y X215H;
    X42G, X54P, X60V, X150F, X152S, X155L, X156Q y X215G;
    X42G, X54P, X68A, X150F, X152S, X155L, X156Q y X215G;
    X42G, X54P, X69S, X150F, X152S, X155L, X156Q y X215G;
    X42G, X54P, X122Q, X150F, X152S, X155I, X156Q, X215G y X241R;
    X42G, X54P, X122Q, X150F, X152S, X155L, X156Q, X171I, X215G y X241R; X42G, X54P, X122Q, X150F, X152T, X155V, X156Q, X171I, X215G y X241R; X42G, X54P, X126M, X150F, X152S, X155L, X156Q y X215G;
    X42G, X54P, X135I, X136Y, X150F, X152S, X155L, X156Q, X192F y X215G; X42G, X54P, X136I, X150F, X152S, X155L, X156Q y X215G;
    X42G, X54P, X136I, X150F, X152S, X155L, X156Q, X215G y X224I;
    X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G, X282V y X284I; X42G, X54P, X136I, X150F, X152S, X155L, X156Y, X215G y X284P;
    X42G, X54P, X136Y, X150F, X152S, X155L, X156Q, X215G, X282V y X284P; X42G, X54P, X150F, X152S, X155I, X156Q, X171I, X215G y X241R;
    X42G, X54P, X150F, X152S, X155L, X156Q, X193M y X215G;
    X42G, X54P, X150F, X152S, X155L, X156Q, X215G, X282V y X284I;
    X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X283S;
    X42G, X54P, X150F, X152S, X155L, X156Q, X215G y X284I;
    X42G, X54P, X150F, X152S, X155L, X156Y y X215G;
    (b) que comprende ademas una diferencia de residuos de aminoacidos en comparacion con la SEQ ID NO: 2 seleccionada de G36C, I41C, I41F, I41K, I41M, I41N, I41R, P48D, P48E, P48G, P48K, P48T, A51K, S54P, M122F, M122Q, Y148Q, C152T, C215H, C215L, Y273H, L325M y A241R; o
    (c) que comprende una combinacion de diferencias de residuos seleccionadas de:
    A5K, E42G, S49T, S54P, C152S, Q155T y W156Q;
    P33L, I41C, E42G, S54P, S150F, C152S, Q155K, F160P y C215G;
    P33L, I41K, E42G, S54P, S150F, C152S, Q155I, F160P y C215L;
    P33L, E42G, P48G, S54P, S150F, C152S, Q155T y C215H;
    P33L, E42G, S54P, A109S, S150F, C152S, Q155K, W156Q y C215H; P33L, E42G, S54P, E117G, S150F, C152S, Q155I, W156Q y C215G; P33L, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G;
    P33L, E42G, S54P, S150F, C152S, Q155K, W156Q y C215H;
    P33L, E42G, S54P, S150F, C152S, Q155L, W156Q y C215H;
    P33L, E42G, S54P, S150F, C152S, Q155L, W156Q, C215H y A241R; G36C, E42G, P48G, S54P, S150F, C152S, Q155I y C215H;
    G36C, E42G, P48K, S54P, S150F, C152S, Q155T y C215H;
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    G36C, E42G, S54P, S150F, C152S, Q155I, C215H y A241R;
    G36C, E42G, S54P, S150F, C152S, Q155K, C215H y A241R;
    G36C, E42G, S54P, S150F, C152S, Q155T y A241R;
    G36C, E42G, S54P, S150F, C152S, Q155V y C215H;
    I41C, E42G, S49T, S54P, S150F, C152S, Q155I, F160P, C215G y I267V; I41C, E42G, S49T, S54P, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S y Q155K;
    I41C, E42G, S54P, I108V, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, I108V, S150F, C152S, Q155T, W156Q y C215G;
    I41C, E42G, S54P, E117G, S150F, C152S, Q155K y F160P;
    I41C, E42G, S54P, E117G, S150F, C152S, Q155K y C215L;
    I41C, E42G, S54P, E117G, S150F, C152S, Q155L y C215L;
    I41C, E42G, S54P, S150F, C152S, Q155I y C215G;
    I41C, E42G, S54P, S150F, C152S, Q155I y C215L;
    I41C, E42G, S54P, S150F, C152S, Q155K, W156Q, C215G y I267V; I41C, E42G, S54P, S150F, C152S, Q155K y C215L;
    I41C, E42G, S54P, S150F, C152S, Q155K y C215G;
    I41C, E42G, S54P, S150F, C152S, Q155L, F160P, C215G e I267V;
    I41C, E42G, S54P, S150F, C152S, Q155T, W156Q, F160P y C215L;
    I41C, E42G, S54P, S150F, C152S, Q155T, W156Q y C215L;
    I41F, E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q y C215G;
    I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I y C215G;
    I41F, E42G, S54P, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R;
    I41F, E42G, S54P, S150F, C152S, Q155I, W156Q y C215G;
    I41K, E42G, P48E, S54P, S150F, C152S, Q155K y W156Q;
    I41K, E42G, P48E, S54P, S150F, C152S, Q155L y C215L;
    I41K, E42G, S54P, I108V, E117G, S150F, C152S, Q155K y C215L;
    I41K, E42G, S54P, I108V, S150F, C152S, Q155T y C215G;
    I41K, E42G, S54P, E117G, S150F, C152S, Q155L y C215G;
    I41K, E42G, S54P, E117G, S150F, C152S, Q155K, C215L y I267V;
    I41K, E42G, S54P, S150F, C152S, Q155K, W156Q y C215G;
    I41K, E42G, S54P, S150F, C152S, Q155K, F160P, C215G e I267V;
    I41K, E42G, S54P, S150F, C152S, Q155K y C215L;
    I41K, E42G, S54P, S150F, C152S y Q155T;
    I41K, E42G, S54P, S150F, C152S, Q155T y F160P;
    I41K, E42G, S54P, S150F, C152S, Q155T y C215G;
    I41K, E42G, S54P, S150F, C152S, Q155T, C215G e I267V;
    I41K, E42G, S54P, S150F, C152S, Q155K, W156Q y C215G;
    I41N, E42G, S54P, S150F, C152S, Q155I y F160P;
    I41N, E42G, S54P, E117G, S150F, C152S, Q155T y W156Q;
    I41N, S49T, E42G, S54P, S150F, C152S, Q155L, F160P, D165N y C215L;
    E42A, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V;
    E42G, A44Q, S54P, I108V, S150F, C152S y Q155T;
    E42G, A44Q, S54P, I108V, S150F, C152S, Q155T y I267V;
    E42G, A44Q, S54P, S150A, C152S y Q155T;
    E42G, A44Q, S54P, S150F, C152S y Q155T;
    E42G, P48G, S54P, S150F, C152S, Q155L, W156Q y C215H;
    E42G, P48G, S54P, S150F, C152S y Q155T;
    E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155L, F160P y C215L;
    E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155K, W156Q y C215G;
    E42G, S49T, S54P, I108V, E117G, S150F, C152S, Q155T, W156Q, C215G e I267V; E42G, S49T, S54P, C152S, Q155T y W156Q;
    E42G, S54P, I55L, T126A, C152S, Q155T, L218M y A270T;
    E42G, S54P, F60V, S150F, C152S, Q155L, W156Q y C215G;
    E42G, S54P, T68A, S150F, C152S, Q155L, W156Q y C215G;
    E42G, S54P, T69S, S150F, C152S, Q155L, W156Q y C215G;
    E42G, S54P, N76S, T126A, C152S, Q155T, S182T, L218M, A270T y V328I;
    E42G, S54P, I108V, S150F, C152S, Q155K y C215H;
    E42G, S54P, I108V, S150F, C152S y Q155T;
    E42G, S54P, I108V, S150F, C152S, Q155T e I267V;
    E42G, S54P, I108V, S150F, C152S, Q155V, W156Q y F160P;
    E42G, S54P, E117G, C152S y Q155T;
    E42G, S54P, E117G, C152S, Q155T y W156Q;
    E42G, S54P, M122Q, S150F, C152S, Q155I, W156Q, C215G y A241R;
    E42G, S54P, M122Q, S150F, C152S, Q155L, W156Q, V171I, C215G y A241R;
    E42G, S54P, M122Q, S150F, C152T, Q155V, W156Q, V171I, C215G y A241R; E42G, S54P, T126M, S150F, C152S, Q155L, W156Q y C215G;
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    E42G, S54P, P135I, F136Y, S150F, C152S, Q155L, W156Q, W192F y C215G; E42G, S54P, F136I, S150F, C152S, Q155L, W156Q y C215G;
    E42G, S54P, F136I, S150F, C152S, Q155L, W156Q, C215G y G224I;
    E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G, S282V y G284I; E42G, S54P, F136I, S150F, C152S, Q155L, W156Y, C215G y G284P;
    E42G, S54P, F136Y, S150F, C152S, Q155L, W156Q, C215G, S282V y G284P; E42G, S54P, S150A, C152S, Q155T e I267V;
    E42G, S54P, S150F, C152S, Q155I, W156Q, F160P, C215L e I267V;
    E42G, S54P, S150F, C152S, Q155I, W156Q, V171I, C215G y A241R;
    E42G, S54P, S150F, C152S, Q155I, W156Q y C215L;
    E42G, S54P, S150F, C152S, Q155I, F160P y C215G;
    E42G, S54P, S150F, C152S, Q155I y C215H;
    E42G, S54P, S150F, C152S, Q155K y W156Q;
    E42G, S54P, S150F, C152S, Q155K, W156Q e I267V;
    E42G, S54P, S150F, C152S, Q155L, W156Q, G193M y C215G;
    E42G, S54P, S150F, C152S, Q155L, W156Q y C215G;
    E42G, S54P, S150F, C152S, Q155L, W156Q, C215G, S282V y G284I;
    E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y T283S;
    E42G, S54P, S150F, C152S, Q155L, W156Q, C215G y G284I;
    E42G, S54P, S150F, C152S, Q155L, W156Y y C215G;
    E42G, S54P, S150F, C152S, Q155L y C215H;
    E42G, S54P, S150F, C152S y Q155T;
    E42G, S54P, S150F, C152S, Q155T, C215G e I267V;
    E42G, S54P, S150F, C152S, Q155T e I267V;
    E42G, S54P, S150F, C152S, Q155T, W156Q, F160P, C215L e I267V;
    E42G, S54P, S150F, C152S, Q155T, W156Q, C215G e I267V;
    E42G, S54P, S150F, C152S, Q155T y W156R;
    E42G, S54P, S150F, C152S, Q155T, F160P y C215G;
    E42G, S54P, S150F, C152S, Q155T, F160P y C215L;
    E42G, S54P, S150F, C152S, Q155T, C215G e I267V;
    E42G, S54P, S150F, C152S, Q155T e I267V;
    E42G, S54P, C152S, Q155I y W156S;
    E42G, S54P, C152S, Q155K yW156S;
    E42G, S54P, C152S, Q155L yW156S;
    E42G, S54P, C152S y Q155T;
    E42G, S54P, C152S, Q155T y F160P;
    E42G, S54P, C152S, Q155T y R164P;
    E42G, S54P, C152S, Q155T yW156Q;
    E42G, S54P, C152S, Q155T yW156S;
    E42G, S54P, C152S, Q155T y R164P;
    E42G, S54P, C152S, Q155T, S182T, L218M y A270T;
    E42G, S54P, C152S, Q155T y C215G;
    E42G, S54P, C152S, Q155T y C215L; y E42G, S54P, C152S, Q155V y W156S.
  3. 3. El polipeptido modificado segun la reivindicacion 1 o la reivindicacion 2 (a):
    (a) en donde la secuencia de aminoacidos comprende ademas una o mas diferencias de residuos en comparacion con la SEQ ID NO: 2, seleccionadas de: X5K, X33L, X36C, X41C/F/K/M/N/R, X44Q, X48D/E/G/K/T, X49T, X51K, X54P, X55L, X76S, X108V, X117G, X122F/Q, X126A, X148Q, X150A/F, X155S/T, X156Q/R/S, X164P, X164P, X165N, X182/H/L, X218M, X241R, X267V, X270T, X273H, X325M y X328I;
    (b) en donde dicho polipeptido modificado es capaz de convertir un compuesto de sustrato (2)
    imagen1
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    a un compuesto de producto (1)
    imagen2
    en condiciones de reaccion adecuadas, opcionalmente que es capaz de convertir el compuesto (2) en compuesto (1) con al menos 1,2 veces la actividad de la SEQ ID NO: 2 en condiciones de reaccion adecuadas, tales como en las que las condiciones de reaccion adecuadas comprenden la carga de compuesto (2) de al menos 50 g/L, 1 mM PLP, DMSO al 50% (v/v), 1,5 M isopropilamina, pH 11 y 55°C;
    (c) en donde la secuencia de aminoacidos comprende una secuencia seleccionada de la SEQ ID NO: 62, 64, 66,

    68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118,

    120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 154, 156, 158, 160,

    162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204,

    206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248,
    250, 252, 254,256,258,260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 282, 284, 286, 288, 290, 292, 294, 296, 298, 300, 302, 304 y 306; o
    (d) en donde el polipeptido esta inmovilizado sobre un soporte solido, opcionalmente en el que el soporte solido es una perla o resina que comprende polimetacrilato con grupos funcionales epoxido, polimetacrilato con grupos funcionales amino epoxido, copolfmero de estireno/DVB o polimetacrilato con grupos funcionales de octadecilo.
  4. 4. Un polinucleotido que codifica el polipeptido modificado por ingeniena genetica de una cualquiera de las
    Reivindicaciones 1, 2 o la Reivindicacion 3(a)-(c), que comprende ademas opcionalmente una secuencia de nucleotidos seleccionada de la SEQ ID NO: 61, 63, 65, 67, 69, 71,73. , 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123 , 125, 127, 129, 131, 133, 135, 137, 139, 141, 143,

    145, 147, 149, 151, 153, 157, 159, 161, 163, 165, 167, 169, 171, 173 , 175, 177, 179, 181, 183, 185, 187, 189, 191,

    193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221,223,225, 227, 229, 231, 233, 235, 237,

    239, 241, 243, 245, 247, 249, 251, 253, 255, 257, 251, 261, 263, 265, 267, 269, 271,273, 273 , 375, 277, 279, 281,
    283, 285, 287, 291, 293, 295, 297, 299, 301, 303 y 305.
  5. 5. Un vector de expresion que comprende el polinucleotido de la reivindicacion 4, que comprende opcionalmente al menos una secuencia de control.
  6. 6. Una celula huesped que comprende el polinucleotido de la reivindicacion 4 o el vector de expresion de la reivindicacion 5.
  7. 7. Un metodo para preparar el polipeptido modificado por ingeniena genetica de una cualquiera de las Reivindicaciones 1, 2 o 3(a)-(c), que comprende cultivar la celula huesped de la Reivindicacion 6, en condiciones adecuadas para la expresion del polipeptido, que comprende opcionalmente ademas el aislamiento del polipeptido.
  8. 8. Un proceso para preparar un compuesto de Formula estructural (I):
    imagen3
    tener la configuracion estereoqmmica indicada en el centro estereogenico marcado con un *; en un exceso enantiomerico de al menos 70% sobre el enantiomero opuesto, en donde
    Z es OR2 o NR2R3;
    R1 es alquilo C1-8, arilo, heteroarilo, arilo-C1-2 alquilo, heteroarilo-C1-2 alquilo o un sistema de anillo heterodclico
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    de 5 a 6 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S, y N, el anillo heterodclico no sustituido o sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco fluorinas; R2 y R3 son cada uno independientemente hidrogeno, C1-8 alquilo, arilo o arilo-Ci-2 alquilo; o R2 y R3 junto con el atomo de nitrogeno al que estan unidos forman un sistema de anillo heterodclico de 4 a 7 miembros que contiene opcionalmente un heteroatomo adicional seleccionado de O, S y N, el anillo heterodclico no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados independientemente de oxo, hidroxi, halogeno, C1-4 alcoxi, y C1-4 alquilo, donde alquilo y alcoxi estan no sustituidos o sustituidos con uno a cinco atomos de fluor; y el sistema de anillo heterodclico se fusiona opcionalmente con un sistema de anillo carbodclico aromatico saturado o aromatico de 5 a 6 miembros o un sistema de anillo heterodclico aromatico saturado o aromatico de 5 a 6 miembros que contiene uno a dos heteroatomos seleccionados de O, S y N, el sistema de anillo condensado no sustituido o sustituido con uno a dos sustituyentes seleccionados de hidroxi, amino, fluor, C1-4 alquilo, C1-4 alcoxi, y trifluorometilo; El proceso comprende la etapa de poner en contacto un compuesto de Formula estructural (II):
    o o
    imagen4
    con un polipeptido modificado de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en presencia de un donante de grupo amino en un disolvente organico adecuado en condiciones de reaccion adecuadas.
  9. 9. El proceso de la reivindicacion 8, en el que:
    (i) R1 es bencilo en el que el grupo fenilo de bencilo no esta sustituido o esta sustituido con uno a tres sustituyentes seleccionados del grupo que consiste en fluor, trifluorometilo y trifluorometoxi;
    (ii) Z es NR2R3, opcionalmente en donde NR2R3 es un heterociclo de la Formula estructural (III):
    imagen5
    en donde R4 es hidrogeno o alquilo C1-4 que esta sin sustituir o sustituido con uno a cinco fluor; y/o (iii) el compuesto de Formula estructural (II) excluye el compuesto (2) y el compuesto de Formula estructural (I) excluye el compuesto (1).
  10. 10. Un proceso para preparar un compuesto de Formula estructural (Ia):
    imagen6
    tener la (R)-configuracion en el centro estereogenico marcado con un ***; en un exceso enantiomerico de al menos 70% sobre el enantiomero que tiene la (S)-configuracion opuesta; en donde,
    Ar es fenilo que esta sin sustituir o sustituido con uno a cinco sustituyentes seleccionados independientemente del grupo que consiste en fluor, trifluorometilo y trifluorometoxi; y
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    R4 es hidrogeno o C1-4 alquilo no sustituido o sustituido con uno a cinco fluoros; el proceso que comprende el paso de:
    poner en contacto una cetona proquiral de formula estructural (IIa):
    imagen7
    con un polipeptido modificado de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
  11. 11. El proceso de la reivindicacion 10, en el que:
    (i) Ar es 2,5-difluorofenilo o 2,4,5-trifluorofenilo y R4 es trifluorometilo, opcionalmente en donde Ar es 2,4,5- trifluorofenilo; y/o
    (ii) en donde el compuesto de Formula estructural (IIa) excluye el compuesto (2) y el compuesto de Formula estructural (la) excluye el compuesto (1).
  12. 12. Un proceso de preparacion de compuesto (1)
    imagen8
    que comprende una etapa de contacto con un sustrato del compuesto (2)
    imagen9
    con un polipeptido modificado de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en presencia de un donante de grupo amino en condiciones de reaccion adecuadas.
  13. 13. El proceso de cualquiera de las Reivindicaciones 8 a 12:
    (i) en donde el compuesto de Formula (I), el compuesto de Formula (la), o el compuesto (1) se produce en al menos 90% de exceso enantiomerico;
    (ii) en donde el compuesto de Formula (I), el compuesto de Formula (la), o el compuesto (1) se produce en al menos 99% de exceso enantiomerico;
    (iii) en donde el donante del grupo amino se selecciona entre isopropilamina, alanina, acido 3-aminobutmco o
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    metilbencilamina, opcionalmente en donde el donante del grupo amino es isopropilamina, opcionalmente a una concentracion de aproximadamente 0.1 a aproximadamente 3,0 M, 0,2 a aproximadamente 2,5 M, aproximadamente 0,5 a aproximadamente 2 M o aproximadamente 1 a aproximadamente 2 M;
    (iv) en donde las condiciones de reaccion adecuadas comprenden un pH de aproximadamente pH 9.5 a aproximadamente pH 11,5;
    (v) en donde las condiciones de reaccion adecuadas comprenden una temperatura de aproximadamente 45°C a aproximadamente 60°C;
    (vi) en donde las condiciones de reaccion adecuadas comprenden dimetilsulfoxido (DMSO) en aproximadamente 30% (v/v) a aproximadamente 60% (v/v);
    (vii) en donde las condiciones de reaccion adecuadas comprenden el compuesto de sustrato en una carga de aproximadamente 5 g/L a aproximadamente 200 g/L, aproximadamente 10 g/L a aproximadamente 150 g/L, o aproximadamente 50 g/L a aproximadamente 100 g/L;
    (viii) en donde las condiciones de reaccion adecuadas comprenden el polipeptido modificado a una concentracion de aproximadamente 0,5 g/L a aproximadamente 5 g/L, aproximadamente 0,5 g/L a aproximadamente 3 g/L, aproximadamente 0,5 g/L a aproximadamente 2 g/L, o de aproximadamente 0,5 g/L a aproximadamente 1 g/L;
    (ix) que comprende ademas la etapa de aislar el compuesto de Formula (I), el compuesto de Formula (la) o el compuesto (1) de la reaccion; y/o
    (x) que comprende ademas la etapa de convertir el compuesto de Formula (la), o el compuesto (1) en una sal farmaceuticamente aceptable poniendo en contacto dicho compuesto con un acido farmaceuticamente aceptable en un disolvente de reaccion adecuado; opcionalmente, en el que el acido farmaceuticamente aceptable es acido fosforico y la sal farmaceuticamente aceptable es la sal fosfato de dihidrogeno, que comprende ademas la etapa de cristalizar la sal farmaceuticamente aceptable del disolvente de reaccion.
  14. 14. El proceso de la reivindicacion 12, en el que:
    (1) las condiciones de reaccion adecuadas comprenden: (a) carga de sustrato de aproximadamente 10 a 200 g/L de compuesto de sustrato (2); (b) concentracion de polipeptidos modificados de aproximadamente 0,5 g/L a 5 g/L; (c) concentracion de MIP de aproximadamente 0,1 a 3 M; (d) concentracion de cofactor de PLP de aproximadamente 0,1 a 1 mM; (e) concentracion de DMSO de aproximadamente 30% (v/v) a aproximadamente 60% (v/v); (f) pH de aproximadamente 9,5 a 11,5; y (g) temperatura de aproximadamente 45°C a 60°C; o
    (ii) las condiciones de reaccion adecuadas comprenden: (a) aproximadamente 50 g/l de compuesto de sustrato
    (2) ; (b) aproximadamente 2 g/L de polipeptido modificado; (c) aproximadamente 50% (v/v) de dimetilsulfoxido (DMSO); (d) aproximadamente 1 M isopropilamina (IPM); (e) aproximadamente 1 mM de fosfato de piridoxal (PLP); (f) sobre pH 10; y (g) unos 50°C.
  15. 15. Un proceso para la preparacion de (2R)-4-oxo-4-[3-(trifluorometilo)-5,6-dihidro[1,2,4]triazolo[4,3-a]pirazina-7(8H)- ilo]-1-(2,4,5-trifluorofenilo)butano-2-amina fosfato (1:1) monohidrato, el proceso comprende una etapa de conversion de un compuesto de sustrato (2)
    imagen10
    a un compuesto de producto (1)
    imagen11
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    poniendo en contacto un sustrato del compuesto (2) con un polipeptido modificado de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en presencia de un donante del grupo amino en condiciones de reaccion adecuadas, opcionalmente en donde el donante del grupo amino es isopropilamina.
ES14757245.7T 2013-02-28 2014-02-24 Polipéptidos de transaminasa modificados por biocatálisis industrial Active ES2694327T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361770814P 2013-02-28 2013-02-28
US201361770814P 2013-02-28
PCT/US2014/018005 WO2014133960A1 (en) 2013-02-28 2014-02-24 Engineered transaminase polypeptides for industrial biocatalysis

Publications (1)

Publication Number Publication Date
ES2694327T3 true ES2694327T3 (es) 2018-12-19

Family

ID=51428721

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14757245.7T Active ES2694327T3 (es) 2013-02-28 2014-02-24 Polipéptidos de transaminasa modificados por biocatálisis industrial

Country Status (12)

Country Link
US (5) US9617573B2 (es)
EP (1) EP2961844B1 (es)
JP (2) JP6436541B2 (es)
CN (2) CN115927231A (es)
CA (1) CA2902824C (es)
DK (1) DK2961844T3 (es)
ES (1) ES2694327T3 (es)
HU (1) HUE042206T2 (es)
IL (1) IL240565B (es)
SG (1) SG11201506748WA (es)
SI (1) SI2961844T1 (es)
WO (1) WO2014133960A1 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2446026B1 (en) * 2009-06-22 2017-08-09 Codexis, Inc. Transaminase reactions
CN105073983B (zh) * 2013-02-28 2018-09-18 默沙东公司 固定化转氨酶和制备及使用固定化转氨酶的方法
WO2014133960A1 (en) 2013-02-28 2014-09-04 Codexis, Inc. Engineered transaminase polypeptides for industrial biocatalysis
JP7138106B2 (ja) * 2016-12-23 2022-09-15 ノバルティス アーゲー 初期サクビトリル中間体のための新規な方法
CA3064574A1 (en) 2017-06-14 2018-12-20 Codexis, Inc. Engineered transaminase polypeptides for industrial biocatalysis
EP3415630A1 (en) 2017-06-14 2018-12-19 EntreChem, S.L. Method for one-pot production of a primary amine from an alcohol
CN109251925A (zh) * 2017-07-14 2019-01-22 上海蓝木化工有限公司 一种离子交换树脂固定化转氨酶的制备及其应用
WO2019207443A1 (en) * 2018-04-24 2019-10-31 Unichem Laboratories Ltd An enzymatic process for the preparation of (r)-sitagliptin
JP2022518212A (ja) * 2019-01-15 2022-03-14 コデクシス, インコーポレイテッド 操作されたトランスアミナーゼポリペプチド
CN109777813B (zh) * 2019-01-25 2021-05-07 浙江工业大学 一种转氨酶-plp共固定化酶及其制备与应用
CN110106130B (zh) * 2019-05-23 2021-05-04 浙江工业大学 一种转氨酶-辅酶共固定化工程菌细胞及应用
WO2020237552A1 (zh) * 2019-05-30 2020-12-03 凯莱英生命科学技术(天津)有限公司 转氨酶突变体及其应用
CN110747181B (zh) * 2019-11-27 2021-05-28 江南大学 一种ω-转氨酶突变体及其在生产手性芳香胺中的应用
CN113061594B (zh) * 2019-12-31 2023-11-24 弈柯莱生物科技(集团)股份有限公司 转氨酶突变体、固定化转氨酶及用于制备西他列汀的用途
CN111189813B (zh) * 2020-01-14 2022-05-17 重庆师范大学 一种以戊二醛-壳聚糖非共轭荧光聚合物为荧光探针检测gsh的方法
CN112094856B (zh) * 2020-09-23 2023-06-27 国药集团威奇达药业有限公司 一种转氨酶突变体及其在西格列汀合成中的应用
CN114277008A (zh) * 2020-09-28 2022-04-05 弈柯莱生物科技(上海)股份有限公司 一种(r)-选择性转氨酶及其应用
CN113789310B (zh) * 2021-01-25 2023-11-10 上海予君生物科技发展有限公司 一种转氨酶及其在制备莫西沙星或其中间体中的应用
CN115466756A (zh) * 2021-06-11 2022-12-13 弈柯莱生物科技(上海)股份有限公司 转氨酶、固定化转氨酶及用于制备西他列汀的用途
CN113481254B (zh) * 2021-06-29 2023-05-26 台州酶易生物技术有限公司 西他列汀中间体的制备方法
WO2024121301A1 (en) 2022-12-09 2024-06-13 Krka, D.D., Novo Mesto Process for the preparation of sitagliptin

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4600692A (en) 1983-02-10 1986-07-15 Purification Engineering, Inc. Immobilized cells for preparing phenylalanine
US4518692A (en) 1983-09-01 1985-05-21 Genetics Institute, Inc. Production of L-amino acids by transamination
US4826766A (en) 1985-09-23 1989-05-02 Genetics Institute, Inc. Production of amino acids using coupled aminotransferases
US5316943A (en) 1988-06-14 1994-05-31 Kidman Gene E Racemic conversion of using a transaminase
US5169780A (en) 1989-06-22 1992-12-08 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5300437A (en) 1989-06-22 1994-04-05 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US4950606A (en) 1989-06-22 1990-08-21 Celgene Corporation Enantiomeric enrichment and stereoselective synthesis of chiral amines
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
KR970703426A (ko) 1994-06-03 1997-07-03 제임스 쉐한 정제된 Myceliophthora 락카제 및 그것을 암호화 하는 핵산(PURIFIED MYCELIOPHTHORA LACCASES AND NUCLEIC ACIDS ENCODING SAME)
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
JP4213771B2 (ja) 1997-04-23 2009-01-21 株式会社カネカ 光学活性アミノ化合物の製造方法
US6197558B1 (en) 1997-05-19 2001-03-06 Nsc Technologies Transaminase biotransformation process
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
WO2001075767A2 (en) 2000-03-30 2001-10-11 Maxygen, Inc. In silico cross-over site selection
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
JO2625B1 (en) 2003-06-24 2011-11-01 ميرك شارب اند دوم كوربوريشن Phosphoric acid salts of dipeptidyl betidase inhibitor 4
US20050009151A1 (en) 2003-07-10 2005-01-13 Pharmacia Corporation Methods for the stereospecific and enantiomeric enrichment of beta-amino acids
CA2533838A1 (en) 2003-08-11 2005-02-24 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
US7618799B2 (en) 2007-01-31 2009-11-17 Dow Global Technologies Inc Bacterial leader sequences for increased expression
EP2118281A2 (en) 2007-02-12 2009-11-18 Codexis, Inc. Structure-activity relationships
WO2008108998A2 (en) 2007-03-02 2008-09-12 Richmond Chemical Corporation Method to increase the yield and improve purification of products from transaminase reactions
WO2008127646A2 (en) 2007-04-11 2008-10-23 Dsm Ip Assets B.V. Transaminase-based processes for preparation of pregabalin
EP2225390A4 (en) * 2008-01-03 2012-05-09 Cargill Inc AMINO TRANSFERASE AND OXIDOREDUCTASE NUCLEIC ACIDS AND POLYPEPTIDES AND METHOD FOR THEIR USE
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
WO2010099501A2 (en) 2009-02-26 2010-09-02 Codexis, Inc. Transaminase biocatalysts
EP2446026B1 (en) 2009-06-22 2017-08-09 Codexis, Inc. Transaminase reactions
WO2011017551A1 (en) 2009-08-05 2011-02-10 Infinity Pharmaceuticals, Inc. Enzymatic transamination of cyclopamine analogs
EP2582799B1 (en) 2010-06-17 2017-12-20 Codexis, Inc. Biocatalysts and methods for the synthesis of (s)-3-(1-aminoethyl)-phenol
WO2012024100A2 (en) * 2010-08-16 2012-02-23 Merck Sharp & Dohme Corp. Process for preparing aminocyclohexyl ether compounds
WO2012024104A2 (en) 2010-08-16 2012-02-23 Codexis, Inc. Biocatalysts and methods for the synthesis of (1r,2r)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine
US9587229B2 (en) 2011-06-24 2017-03-07 Merck Sharp & Dohme Corp. Immobilized transaminases and process for making and using immobilized transaminase
EP2753640B1 (en) * 2011-09-08 2016-03-09 Codexis, Inc. Biocatalysts and methods for the synthesis of substituted lactams
WO2014133960A1 (en) 2013-02-28 2014-09-04 Codexis, Inc. Engineered transaminase polypeptides for industrial biocatalysis

Also Published As

Publication number Publication date
CN105164263A (zh) 2015-12-16
US20160002688A1 (en) 2016-01-07
EP2961844A4 (en) 2016-10-19
CA2902824A1 (en) 2014-09-04
IL240565A0 (en) 2015-09-24
US9617573B2 (en) 2017-04-11
US20210348138A1 (en) 2021-11-11
WO2014133960A1 (en) 2014-09-04
US11098292B2 (en) 2021-08-24
CA2902824C (en) 2021-06-22
US20200172882A1 (en) 2020-06-04
EP2961844B1 (en) 2018-09-26
US9963685B2 (en) 2018-05-08
US20180223265A1 (en) 2018-08-09
CN105164263B (zh) 2022-07-01
HUE042206T2 (hu) 2019-06-28
IL240565B (en) 2019-10-31
JP6436541B2 (ja) 2018-12-12
JP2016509841A (ja) 2016-04-04
JP2018019723A (ja) 2018-02-08
SI2961844T1 (sl) 2018-11-30
US20170175090A1 (en) 2017-06-22
EP2961844A1 (en) 2016-01-06
US10604744B2 (en) 2020-03-31
SG11201506748WA (en) 2015-09-29
CN115927231A (zh) 2023-04-07
DK2961844T3 (da) 2019-01-02

Similar Documents

Publication Publication Date Title
ES2694327T3 (es) Polipéptidos de transaminasa modificados por biocatálisis industrial
ES2448816T3 (es) Biocatalizadores de transaminasa
US11597918B2 (en) Biocatalysts and methods for the synthesis of substituted lactams
US10526587B2 (en) Engineered biocatalysts and methods for synthesizing chiral amines
CN116209754A (zh) 用于合成手性胺的工程化生物催化剂及方法