ES2748460T3

ES2748460T3 - Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes

Info

Publication number: ES2748460T3
Application number: ES13714246T
Authority: ES
Inventors: Michael Crowe; Michael Foulkes; Giancarlo Francese; Dominique Grimler; Ernst Kuesters; Kurt Laumen; Yunzhong Li; Changxue Lin; Jovana Nazor; Thomas Ruch; Derek Smith; Shiwei Song; Shangjun Teng
Original assignee: Novartis AG
Current assignee: Novartis AG
Priority date: 2012-03-23
Filing date: 2013-03-22
Publication date: 2020-03-16
Anticipated expiration: 2033-03-22
Also published as: CY1122087T1; LT2828256T; CA2866222A1; HRP20191632T1; US20150045562A1; MX2014011489A; RU2662815C2; AP2014007906A0; RU2014142621A; PT2828256T; AU2013237330B2; BR112014022909A2; DK2828256T5; JP6117906B2; KR20140137374A; ES2962530T3; EP3578557B1; EP2828256A1; HK1202289A1; DK2828256T3

Abstract

Un proceso para preparar un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,**Fórmula** que comprende transaminar enzimáticamente un compuesto de fórmula (I) a un compuesto de fórmula (II), o una de sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,**Fórmula** R4 y R7 son cada uno, independientemente, H o -Cl; R5 es H, -OH, -CH3, -OCH3, -F, -Cl, -CF3 o -CN; R6 es H, -OH, -OCH3, -F o -Cl; R8 es H, -CH3, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CF3.

Description

DESCRIPCIÓN

Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes

Referencia a la lista de secuencias, tabla o programa informático

La copia oficial de la Lista de secuencias se presenta conjuntamente con la memoria como un archivo de texto en formato ASCII a través de EFS-Web, con el nombre de archivo "PAT055051_seql2.txt", fecha de creación 22 de marzo de 2013 y un tamaño de 447 kilobytes. La Lista de secuencias presentada a través de EFS-Web es parte de la memoria y se incorpora en este documento por referencia en su totalidad.

Estado anterior de la técnica

Se conocen (1 ’R,3'S)-5,7'-dicloro-6'-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirído[3,4-b]indol]-2-ona (por ejemplo, un compuesto de fórmula (IV), que comprende una molécula espiroindolona) y un método de síntesis de 6 pasos para prepararla, que incluye un compuesto intermedio amina quiral conocida (IIA) (WO 2009/132921):

La presente invención se refiere a un método mejorado para la síntesis de compuestos espiroindolona, en particular, (1 R ,3 ’S)-5,7’-dicloro-6'-fluoro-3’-metil-2',3’,4 ',9’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona, y compuestos intermedios utilizados en el método mejorado.

En una primera realización, la invención es un proceso para preparar un compuesto de fórmula (II), o una de sus sales o solvatos o hidratos,

sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,

(I)

donde:

o

R4 y R7 son cada uno, independientemente, H o -Cl;

R5 es H, -OH, -CHs, -OCH3, -F, -Cl, -CFs o -CN;

R6 es H, -OH, -OCHs, -F o -Cl;

R8 es H, -CHa, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CFs.

En una segunda realización, la invención es un proceso para preparar un compuesto de fórmula (IIA), o una de sus sales o hidratos o solvatos,

(IIA)

que comprende transaminar enzimáticamente un compuesto de fórmula (IA) o una de sus sales o solvatos o hidratos,

(IA),

para proporcionar el compuesto de fórmula (IIA).

En una tercera realización, la invención es un proceso para preparar un compuesto de fórmula (IVA), o una de sus sales o solvatos o hidratos,

(IVA)

que comprende hacer reaccionar un compuesto de fórmula (IIIA) o una de sus sales o solvatos o hidratos,

(NIA)

con un compuesto de fórmula (IIA) o una de sus sales o solvatos o hidratos,

(NA)

para proporcionar el compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,

en donde el compuesto de fórmula (IIA) se prepara mediante transaminación enzimática del compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,

y en donde la enzima es SEQ ID NO: 134.

En una cuarta realización la invención es el compuesto:

La invención se refiere a nuevos procesos, un nuevo paso del proceso y un nuevo compuesto intermedio útiles para la preparación de compuestos espiroindolona útiles para el tratamiento de enfermedades parasitarias, que comprenden, por ejemplo, una molécula espiroindolona como (1 R,3'S)-5,7'-dicloro-6'-fluoro-3'-metil-2',3',4',9'-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona.

Antecedentes de la invención

La presente invención se refiere a procesos para la preparación de compuestos espiroindolona, como por ejemplo, (1 R,3 ’S)-5,7’-dicloro-6 ’-fluoro-3 ’-metil-2 ’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona.

(1 R,3'S)-5,7'-dicloro-6’-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirído[3,4-b]indol]-2-ona es útil en el tratamiento y/o la prevención de infecciones como las causadas por Plasmodium falciparum, Plasmodium vivax, Plasmodium malariae, Plasmodium ovale, Trypanosoma cruzi y parásitos del género Leishmania genus como, por ejemplo, Leishmania donovani., y tiene la estructura siguiente:

(IVA)

(1 ’R,3 ’S)-5,7’-dicloro-6 ’-fluoro-3 ’-metil-2 ’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona y una síntesis de la misma se describen en WO 2009/132921 A1 en particular en el Ejemplo 49 de ese documento.

Existe la necesidad de nuevos procesos para la preparación de (1 ’R,3'S)-5,7'-dicloro-6'-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona a fin de mejorar la eficiencia general de la síntesis para hacerla adecuada para la fabricación. En particular, existe la necesidad de aumentar la eficiencia de la síntesis del compuesto intermedio amina quiral (IIA):

(IIA).

Descripción detallada de la invención

Los procesos, de acuerdo con la presente divulgación, para producir compuestos espiroindolona, como los compuestos de acuerdo con la fórmula (IV), o una de sus sales, o hidratos o solvatos, y los compuestos intermedios, según se definen en este documento, se resumen en el Esquema 1.

Esquema 1

A saber, un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, se convierte en un compuesto de fórmula (II), o una de sus sales o hidratos o solvatos, de acuerdo con los métodos 1,2, 3, 4, 5 o 6 en donde

- el método 1 comprende

a) La transaminación enzimática para convertir un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, en un compuesto de fórmula (II), o una de sus sales o hidratos o solvatos

Un compuesto de fórmula (II), o una de sus sales, se puede convertir en un compuesto de fórmula (IV), o una de sus sales, por ejemplo, según se describe en WO 2009/132921 en particular según se describe en las reivindicaciones y los ejemplos pertinentes, que se incorporan por referencia en este documento.

La divulgación se refiere especialmente a los procesos descritos en cada sección. La divulgación se refiere asimismo, independientemente, a cada paso individual descrito en una secuencia del proceso en la sección correspondiente. Por lo tanto, la divulgación también se refiere a las realizaciones del proceso, de acuerdo con las cuales un compuesto que se puede obtener como compuesto intermedio en cualquier paso del proceso se utiliza como un material de partida.

La divulgación se refiere asimismo a nuevos materiales de partida que han sido desarrollados específicamente para la preparación de los compuestos de acuerdo con la invención, a su uso y a los procesos para su elaboración.

La divulgación también se refiere a compuestos intermedios que han sido desarrollados específicamente para la preparación de los compuestos de acuerdo con la invención, a su uso y a los procesos para su elaboración.

Se observa que en la presente solicitud, habitualmente las explicaciones proporcionadas en una sección también son aplicables en otras secciones, a menos que se indique lo contrario. Por ejemplo, las explicaciones para el residuo R1 en la fórmula (I) dadas en la sección A también aplican si la fórmula (I) aparece en otras secciones, como la Sección B, a menos que se indique lo contrario.

Sección A: Preparación de un compuesto de fórmula (I)

Un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, se puede preparar como se describe más

; o

Sección B: Conversión de un compuesto de fórmula (I) en un compuesto de fórmula (II).

sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,

donde:

o

R4 y R7 son cada uno, independientemente, H o -Cl;

R5 es H, -OH, -CHa, -OCHa, -F, -Cl, -CFa o -CN;

R6 es H, -OH, -OCHa, -F o -Cl;

R8 es H, -CHa, -CHaCHa, -CH2OH, -CO2H, -COaCHa, -COaCHaCHa o -CFa.

En una primera realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 y R6 son fluoro cuando: R8 es -CHa.

En una segunda realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde,R5 y R6 son fluoro y cloro, cuando: R8 es -CH3.

En una primera realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 y R6 son hidrógenoo cuando: R8 es -CH3.

En una cuarta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 es fluoro cuando R6 es hidrógeno.

En una quinta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, el compuesto de fórmula (II) es de fórmula (IIA), o una de sus sales o solvatos o hidratos,

(IIA).

En una sexta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, el compuesto de fórmula (I) es un compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,

En otra realización, la invención es un proceso para preparar un compuesto de fórmula (IIA), o una de sus sales o hidratos o solvatos,

(IIA)

(IA).

para proporcionar el compuesto de fórmula (IIA).

Generalmente, la cetona, compuesto (I), se disuelve en un solvente orgánico, por ejemplo glicol, y se agrega a una mezcla acuosa de clorhidrato de isopropilamina y piridoxalfosfato, seguido de la adición de tampón TEA. Después se ajusta el pH hasta neutralidad con una base adecuada, por ejemplo NaOH, seguido de calentamiento y adición de la transaminasa. La reacción se deja en agitación a temperatura durante aproximadamente 24 h. El producto amina quiral sólida (compuesto de fórmula (II)) se aísla por medios conocidos por un experto en la materia y/o de acuerdo con los ejemplos 10-12.

En una realización de ejemplo, la enzima es SEQ ID NO: 134.

Sección C: Conversión de un compuesto de fórmula (II) en un compuesto de fórmula (IV).

(IVA)

(NIA)

con un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,

(NA)

y en donde la enzima es SEQ ID NO: 134.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde, el compuesto de fórmula (IIA) se convierte en una sal de fórmula (IIB):

(IIB)

antes de la reacción con el compuesto de fórmula (IIIA).

De acuerdo con la invención, la enzima es SEQ ID NO: 134.

En otra realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la reacción se lleva a cabo en condiciones básicas.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la reacción se lleva a cabo en presencia de trietilamina.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) se aísla como una sal de fórmula (IVB):

(IVB).

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre con carbonato de sodio.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) es un hidrato.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) es un / hidrato.

En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) / hidrato en donde el compuesto de fórmula (IVA) / hidrato se muele después del aislamiento.

Sección D: Uso de los compuestos nuevos e inventivos de fórmula (IC).

En otra realización, la invención es un compuesto de fórmula (I), en donde el compuesto es de fórmula (IA):

o una de sus sales o hidratos o solvatos farmacéuticamente aceptables.

Sección I: Términos generales

A continuación se listan las definiciones de varios términos utilizados para describir los nuevos compuestos intermedios y los pasos de síntesis de la presente invención. Estas definiciones, ya sea reemplazando una, más de una, o todas las expresiones o los símbolos generales utilizados en la presente divulgación y, por lo tanto, dando lugar a realizaciones de la invención, se aplican en particular a los términos tal como se usan en toda la memoria a menos que se definan de otra manera en instancias específicas ya sea individualmente o como parte de un grupo más grande. Por lo tanto, las definiciones generales utilizadas antes y más adelante, a menos que se definan de manera diferente, tienen los significados siguientes:

El término "C1-C20-" define un resto con hasta y como máximo 20, especialmente hasta y como máximo 7 átomos de carbono, donde dicho resto puede ser de cadena ramificada (una o más veces) o lineal y unido través de un carbono terminal o no terminal.

Alquilo como un radical o como parte de un radical es una cadena de carbonos lineal o ramificada (una o, si se desea y es posible, más veces), y es especialmente alquilo C1-C7, alquilo C1-C4, en particular alquilo C1-C4 ramificado, como isopropilo. Los términos "inferior" o "C1-C7-" definen un resto con hasta y como máximo 7, especialmente hasta y como máximo 4 átomos de carbono, donde dicho resto puede ser de cadena ramificada (una o más veces) o lineal y unido a través de un carbono terminal o no terminal. Alquilo inferior o alquilo C1-C7, por ejemplo, es n-pentilo, n-hexilo o n heptilo o preferentemente alquilo C1-C4, especialmente como metilo, etilo, n-propilo, iso-propilo, n-butilo, ¡sobutilo, secbutilo, tert-butilo, en particular metilo, etilo, n-propilo, iso-propilo, n-butilo, isobutilo, sec-butilo, tert-butilo; preferentemente metilo.

Alquilamino y dialquilamino se refieren a alquil-NH- y (alquil^N-, respectivamente, en donde el alquilo puede ser lineal o ramificado. El grupo alquilo, por ejemplo, contiene de 1 a 7, y en particular de 1 a 4 átomos de C. Algunos ejemplos son metilamino, dimetilamino, etilamino y dietilamino; preferentemente metilamino.

Halo o halógeno es preferentemente fluoro, cloro, bromo o yodo, preferentemente fluoro o cloro; cuando se menciona halo como un sustituyente, cuando sea posible, pueden estar presentes uno o más (por ejemplo, hasta tres o uno) átomos de halógeno, por ejemplo, en halo-alquilo C1-C7, como trifluorometilo, 2 ,2-difluoroetilo o 2 ,2 ,2-trifluoroetilo. Halo-alquilo C1-C7 puede ser lineal o ramificado y en particular contiene 1 a 4 átomos de C, por ejemplo, 1 o 2 átomos de C. Los ejemplos son fluorometilo, difluorometilo, trifluorometilo, clorometilo, diclorometilo, triclorometilo, 2-cloroetilo y 2 ,2 ,2-trifluoroetilo; preferentemente trifluorometilo.

Alcoxi, como un radical o parte de un radical, se refiere a -O-alquilo, en donde el término alquilo es el definido en este documento, e incluye, por ejemplo, alcoxi C1-C20 (-O-alquilo C1-C20), preferentemente alcoxi C1-C7 (-O-alquilo C1-C7). En particular, alcoxi incluye, por ejemplo, radicales metoxi, etoxi, n-propiloxi, isopropiloxi, n-butiloxi, isobutiloxi, secbutiloxi, tert-butiloxi, pentiloxi, hexiloxi y heptiloxi; preferentemente metoxi.

La expresión "base ópticamente activa" describe, por ejemplo, aminas quirales, preferentemente aminas terciarias quirales, más preferentemente alcaloides de cinchona, como quinidina y quinina, muy preferentemente alcaloides de cinchona modificados. Los ejemplos de dichos alcaloides de cinchona modificados se detallan, por ejemplo, en Tian, S.-K.; Chen, Y.; Hang, J.; Tang, L.; McDiad, P.; Deng, L. Acc. Chem. Res. 2004, 37, 621-631 y las referencias citadas en este documento.

La expresión "catalizador de transferencia de fase" según se usa en este documento se refiere a una cantidad catalítica de un agente químico que aumenta la velocidad de una reacción entre especies químicas ubicadas en fases diferentes (por ejemplo, líquidos inmiscibles o sólido y líquido), mediante extracción de uno de los reactivos, muy comúnmente un anión, a través de la interfase hacia la otra fase. Estos catalizadores incluyen sales de amonio cuaternario o fosfonio (por ejemplo, sales de tetraalquilamonio, en las que el alquilo puede ser el mismo o diferente), o agentes que forman complejos con cationes inorgánicos (por ejemplo, éteres corona u otros criptandos). El catión catalizador no se consume en la reacción aunque ocurre un intercambio aniónico. En particular, los catalizadores de transferencia de fase adecuados para usar de acuerdo con la presente invención son sales de amonio cuaternario, por ejemplo de fórmula RmRnRlRkNX, en donde RmRnRlRk son alquilo, iguales o diferentes, y X es halo (por ejemplo, cloruro, bromuro, yoduro) o hidróxido, por ejemplo, hidróxido de tetra-n-butylammonium hydroxide.

Un catalizador "heterogéneo" según se usa en este documento se refiere a un catalizador soportado en un portador, generalmente, aunque no necesariamente, un sustrato compuesto por un material inorgánico, por ejemplo, un material poroso como carbono, silicio y/u óxido de aluminio.

Un catalizador "homogéneo" según se usa en este documento se refiere a un catalizador que no está soportado en un portador.

El término "quiral" se refiere a moléculas que tienen la propiedad de no superponerse con su imagen especular, en tanto el término "aquiral" se refiere a moléculas que se superponen con su imagen especular.

El término "catalizador" significa cualquier sustancia que afecta la velocidad de una reacción química mediante disminución de la energía de activación para la reacción química.

La expresión "catalizador en polvo" significa un catalizador con un contenido de agua de 0 a 30% de masa.

La expresión "relación entre sustrato y catalizador" (S/C) se refiere a la relación molar entre los compuestos de partida, o sus sales, y el "metal de transición catalizador".

La expresión "tratamiento final" significa el trabajo de aislamiento y/o purificación que se lleva a cabo una vez que termina la reacción.

Según se usa en este documento, a menos que se especifique lo contrario, la expresión "temperatura ambiente" o "temperatura ambiental" significa una temperatura entre 15 y 30°C, tal como entre 20 y 30°C, tal como entre 20 y 25°C.

El término "inerte" según se usa en toda esta solicitud, significa que no reacciona con ninguno de los reactivos, solventes u otros componentes de la mezcla de reacción. Dichas condiciones inertes se logran generalmente utilizando gas inerte como dióxido de carbono, helio, nitrógeno o argón, entre otros gases.

Los enlaces con el (*) indican puntos de unión con el resto de la molécula.

Los compuestos de la presente invención pueden poseer uno o más centros asimétricos. Las configuraciones absolutas preferidas son las que se indican específicamente en este documento. Sin embargo, cualquier posible enantiómero puro, diastereoisómero puro, o sus mezclas, por ejemplo, mezclas de enantiómeros, como racematos, están comprendidos por la presente invención.

En las fórmulas de la presente solicitud los símbolos ", " " o " ------" en un C-sp3 representan un enlace covalente en el que la estereoquímica del enlace no está definida. Esto significa que los símbolos " ys\s\s\s"' o " ------" en un C-sp3 comprenden una configuración (S) así como una configuración (R) del centro quiral respectivo. Además, también están comprendidas las mezclas, por ejemplo, las mezclas de enantiómeros, como racematos, están comprendidas por la presente invención.

En las fórmulas de la presente solicitud, los símbolos ” ^ ^ s \ s '" o " " en un C-sp2 representan un enlace covalente, en el que la estereoquímica o la geometría del enlace no está definida. Esto significa que el símbolo " ' / w v ' " en un C-sp2 comprende una configuración cis (Z) así como una configuración trans (E) del doble enlace respectivo. Además, también están comprendidas las mezclas, por ejemplo, las mezclas de isómeros de doble enlace están comprendidas por la presente invención.

En las fórmulas de la presente solicitud, el símbolo " ..........-" indica un enlace Csp3-Csp3 o un enlace Csp2-Csp2.

Los compuestos de la presente invención pueden poseer uno o más centros asimétricos. Las configuraciones absolutas preferidas son las que se indican específicamente en este documento.

En las fórmulas de la presente solicitud el símbolo " ^ " en un C-sp3 indica la estereoquímica absoluta, ya sea (R) o (S).

o# 3

En las fórmulas de la presente solicitud el símbolo " ■'' " en un C-sp3 indica la estereoquímica absoluta, ya sea (R) o (S).

La expresión "pureza estereoisomérica" en un determinado porcentaje significa que el estereoisómero indicado predomina en ese porcentaje indicado en una mezcla de estereoisómeros.

El término "estereoisómero" significa una de las configuraciones absolutas de una molécula orgánica individual que tiene al menos un carbono asimétrico. Están incluidos en la definición de estereoisómeros los enantiómeros y los diastereoisómeros.

El término "resolución" se refiere a la separación o concentración o agotamiento de uno de los estereoisómeros de una molécula.

Las sales son especialmente sales farmacéuticamente aceptables o generalmente sales de cualquiera de los compuestos intermedios mencionados en este documento, un experto en la materia entenderá fácilmente que las sales no son excluidas por razones químicas. Se pueden formar cuando estén presentes grupos formadores de sales, tales como grupos básicos o ácidos, que pueden existir en forma disociada al menos parcialmente, por ejemplo, en un intervalo de pH de 4 a 10 en soluciones acuosas, o se pueden aislar especialmente en forma sólida, especialmente cristalina.

Dichas sales se forman por ejemplo, como sales de adición de ácido, preferentemente con ácidos orgánicos o inorgánicos, a partir de los compuestos o cualquiera de los compuestos intermedios mencionados en este documento, con un átomo de nitrógeno básico (por ejemplo, imino o amino), especialmente las sales farmacéuticamente aceptables. Los ácidos inorgánicos adecuados son por ejemplo, ácidos de halógeno, como ácido clorhídrico, ácido sulfúrico o ácido fosfórico. Los ácidos orgánicos adecuados son, por ejemplo, ácidos carboxílicos, fosfónicos, sulfónicos o sulfámicos, por ejemplo ácido acético, ácido propiónico, ácido láctico, ácido fumárico, ácido succínico, ácido cítrico, aminoácidos, como ácido glutámico o ácido aspártico, ácido maleico, ácido hidroximaleico, ácido metilmaleico, ácido benzoico, ácido metano o etanosulfónico, ácido etano-1,2-disulfónico, ácido bencenosulfónico, ácido 2-naftalenosulfónico, ácido 1,5-naftalenodisulfónico, ácido N-cicIohexilsulfámico, ácido N-metil-, N-etil- o N-propilsulfámico, u otros ácidos orgánicos protónicos, como ácido ascórbico.

En presencia de radicales cargados negativamente, como carboxi o sulfo, las sales también se pueden formar con bases, por ejemplo, sales de metales o de amonio, como sales de metales alcalinos o metales alcalinotérreos, por ejemplo, sales de sodio, potasio, magnesio o calcio, o sales de amonio con amoníaco o aminas orgánicas adecuadas, por ejemplo, trietilamina o tri(2-hidroxietil)amina, N-etilpiperidina, N,N'-dimetilpiperazina, t-butilamina, n-butilamina, feniletilamina, diciclohexilamina o ciclohexilamina.

Cuando un grupo básico y un grupo ácido están presentes en la misma molécula, cualquiera de los compuestos intermedios mencionados en este documento también puede formar sales internas.

Con fines de aislamiento o purificación de cualquiera de los compuestos intermedios mencionados en este documento también es posible utilizar sales que no sean farmacéuticamente aceptables, por ejemplo picratos o percloratos.

Las formas salinas preferidas incluyen, por ejemplo, las sales de adición de ácido. Los compuestos que tienen al menos un grupo ácido (por ejemplo, COOH o 5-tetrazolilo) también pueden formar sales con bases. Las sales adecuadas con bases son, por ejemplo, sales metálicas, como sales de metales alcalinos o metales alcalinotérreos, por ejemplo, sales de sodio, potasio, calcio o magnesio, o sales con amoníaco o una amina orgánica, como morfolina, tiomorfolina, piperidina, pirrolidina, una mono-, di- o trialquilamina inferior, por ejemplo, etil-, tert-butil-, dietil-, diisopropil-, trietil-, tributil- o dimetilpropilamina, o una mono-, di- o trihidroxi-alquilamina inferior, por ejemplo, mono-, di- o trietanolamina. Además se pueden formar las correspondientes sales internas. También están incluidas sales que no son adecuadas para usos farmacéuticos pero que se pueden emplear, por ejemplo, para el aislamiento o la purificación de compuestos libres I o de sus sales farmacéuticamente aceptables. Muy preferentemente la sal de fórmula (IV) y la sal del ácido canforsulfónico.

En particular, la expresión "sal de un compuesto de fórmula (IV)" se refiere, por ejemplo, a una sal de amina de este, una sal de un metal alcalino o de un metal alcalinotérreo de este (por ejemplo, sal de sodio, sal de potasio, sal de calcio, sal de magnesio, etc). En particular, el término "amina" en la expresión "sal de amina de este", por ejemplo cuando se refiere a una sal de amina del compuesto de fórmula (IV), significa una amina terciaria de fórmula NR9R10R11, una amina secundaria de fórmula NHR9R10R una amina primaria de fórmula NH2R9, en donde R9, R10 y R11 son, independientemente uno de otro, alquilo, arilo, cicloalquilo o heterociclilo, según se definieron en este documento, preferentemente alquilo o cicloalquilo. El término "amina" es, por ejemplo, difenilamina, diisopropilamina, dimetilamina, trietilamina, diisopropiletilamina, diciclohexilamina, t-butilamina, n-butilamina o ciclohexilamina, en particular, t-butilamina, n-butilamina o ciclohexilamina, más preferentemente n-butilamina o ciclohexilamina.

Según se usa en esta memoria y en las reivindicaciones adjuntas, las formas en singular "un", "una", "el" y "la" incluyen los referentes en plural a menos que el contexto indique claramente lo contrario. Por lo tanto, por ejemplo, la referencia a "un polipéptido" incluye más de un polipéptido.

Análogamente, "comprenden," "comprende", "que comprende(n)", "incluyen," "incluye" y "que incluye(n)", son intercambiables y no pretenden ser limitantes.

Además se debe entender que cuando las descripciones de diversas realizaciones usan la expresión "que comprende(n)" los expertos en la materia deberán entender que en instancias específicas, una realización puede ser descrita alternativamente usando las expresiones "que consiste esencialmente en" o "que consiste en".

Se debe entender que tanto la descripción general precedente, incluidas las figuras, y la descripción detallada siguiente, son únicamente ejemplares y explicatorias, y no restrictivas de esta divulgación.

Los títulos de sección utilizados en este documento son solo con fines organizativos y no deben interpretarse como limitantes del tema descrito.

Las abreviaturas utilizadas para los aminoácidos codificados genéticamente son convencionales y son las siguientes:

Aminoácidos Tres letras Abreviatura de una letra

Alanina Ala A

Arginina Arg R

Asparragina Asn N

Aspartato Asp D

_{Cisteína Cys}C

Glutamato Glu E

Glutamina Gln _Q

Glicina Gly G

Histidina His H

Isoleucina Ile I

Leucina Leu L

Lisina Lys K

Metionina Met M

Fenilalanina Phe F

Prolina Pro P

Serina Ser S

Treonina Thr T

Triptófano Trp W

Tirosina Tyr Y

Valina Val V

Cuando se utilizan las abreviaturas de tres letras, a menos que estén precedidas específicamente por una "L" o una "D" o sea claro a partir del contexto en el cual se usa la abreviatura, el aminoácido puede estar en la configuración L o D- en un carbono a (Ca). Por ejemplo, mientras que "Ala" designa alanina sin especificar la configuración en el carbono a, "D-Ala" y "L-Ala" designan D-alanina y L-alanina, respectivamente. Cuando se usan las abreviaturas de una letra, las letras mayúsculas designan aminoácidos en la configuración L- en el carbono a y las letras minúsculas designan los aminoácidos en la configuración D- en el carbono a. Por ejemplo, "A" designa L-alanina y "a" designa D-alanina. Cuando las secuencias de polipéptidos se presentan como una cadena de abreviaturas de una letra o tres letras (o sus mezclas), las secuencias se presentan en la dirección de amino (N) a carboxi (C), de conformidad con la convención común.

Las abreviaturas utilizadas por los nucleósidos que codifican genéticamente son convencionales y son las siguientes: adenosina (A); guanosina (G); citidina (C); timidina (T); y uridina (U). A menos que se delinee específicamente, los nucleótidos abreviados pueden ser ribonucleósidos o 2'-desoxirribonucleósidos. Se puede especificar que los nucleósidos son ribonucleósidos o 2'-desoxirribonucleósidos de forma individual o agregada. Cuando las secuencias de ácido nucleico se presentan como una cadena de abreviaturas de una letra, las secuencias se presentan en la dirección 5' a 3', de conformidad con la convención común, y los fosfatos no están indicados.

En relación con la presente divulgación, los términos técnicos y científicos utilizados en las descripciones de este documento tendrán los significados comúnmente entendidos por un experto en la materia, a menos que se defina específicamente lo contrario. En consecuencia, los términos siguientes están destinados a tener los significados siguientes:

“Proteína", "polipéptido" y "péptido" se usan indistintamente en este documento para indicar un polímero de al menos dos aminoácidos unidos covalentemente por un enlace amida, independientemente de la longitud o la modificación postraducciónal (por ejemplo, glicosilación, fosforilación, lipidación, miristilación, ubiquitinación, etc.). Están incluidos en esta definición los aminoácidos D- y L-, y las mezclas de aminoácidos D- y L-.

“Polinucleótido" o "ácido nucleico" se refieren a dos o más nucleósidos que están unidos covalentemente entre sí. El polinucleótido puede estar totalmente compuesto por ribonucleósidos (es decir, un ARN), totalmente compuesto por 2'-desoxirribonucleósidos (es decir, un ADN) o mezclas de ribo- y 2' desoxirribonucleósidos. Mientras que los nucleósidos estarán generalmente unidos entre sí a través de enlaces fosfodiester estándar, los polinucleótidos pueden incluir uno o más enlaces no estándar. El polinucleótido puede ser monocatenario o bicatenario, o puede incluir tanto regiones monocatenarias como bicatenarias. Además, si bien un polinucleótido estará compuesto generalmente por nucleobases codificantes de origen natural (es decir, adenina, guanina, uracilo, timidina y citocina), puede incluir una o más nucleobases modificadas y/o sintéticas, como, por ejemplo, inosina, xantina, hipoxantina, etc. Preferentemente, dichas nucleobases modificadas o sintéticas serán nucleobases codificantes.

"Aminotransferasa" y "transaminasa" se usan indistintamente en este documento para referirse a un polipéptido que tiene la capacidad enzimática de transferir un grupo amino (NH2) de una amina primaria a un grupo carbonilo (C=O) de una molécula aceptora. Las transaminasas utilizadas en este documento incluyen transaminasas de origen natural (tipo silvestre) así como polipéptidos genomanipulados que no son de origen natural, generados mediante manipulación humana.

“Aceptor de amino" y "aceptor de amina", "sustrato ceto", "ceto" y "cetona" se usan indistintamente en este documento para referirse a un compuesto carbonilo (ceto o cetona) que acepta un grupo amino de una amina dadora. En algunas realizaciones, los receptores de amino son moléculas de la fórmula general siguiente,

aceptor de amino

En la cual cada uno de Ra y Rp, cuando se consideran independientemente, es un alquilo, cicloalquilo, heterocicloalquilo, arilo o heteroarilo, el que puede no estar sustituido o estar sustituido con uno o más grupos enzimáticamente aceptables. Ra puede ser igual o diferente a Rp en estructura o quiralidad. En algunas realizaciones, R° y R°, tomados juntos, pueden formar un anillo que está sustituido, no sustituido o fusionado a otros anillos. Los receptores de amino incluyen ácidos ceto carboxílicos y alcanonas (cetonas). Generalmente los ácidos ceto carboxílicos son ácidos a-ceto carboxílicos como ácido glioxálico, ácido pirúvico, ácido oxalacético, y similares, así como las sales de estos ácidos. Los aceptores de amino también incluyen sustancias que son convertidas en aceptores de amino mediante otras enzimas o procesos de células enteras, como el ácido fumárico (que se puede convertir en ácido oxalacético), glucosa (que se puede convertir en piruvato), lactato, ácido maleico y otras. Los aceptores de amino que se pueden utilizar incluyen, a modo de ejemplo y no limitante, 3,4-dihidronaftalen-1(2H)-ona, 1-fenilbutan-2-ona, 3,3-dimetilbutan-2-ona, octan-2-ona, 3-oxobutanoato de etilo, 4-fenilbutan-2-ona, 1-(4-bromofenil)etanona, 2-metil-ciclohexanona, 7-metoxi-2-tetralona, 1-hidroxibutan-2-ona, ácido pirúvico, acetofenona, 3'-hidroxiacetofenona, 2-metoxi-5-fluoroacetofenona, ácido levulínico, 1-fenilpropan-1-ona, 1-(4-bromofenil)propan-1-ona, 1-(4-nitrofenil)propan-1-ona, 1-fenilpropan-2-ona, ácido 2-oxo-3-metilbutanoico, 1-(3-trifluorometilfenil)propan-1-ona, hidroxipropanona, metoxioxipropanona, 1-fenilbutan-1-ona, 1-(2,5-dimetoxi-4-metilfenil)butan-2-ona, 1-(4-hidroxifenil)butan-3-ona, 2-acetilnaftaleno, ácido fenilpirúvico, ácido 2-cetoglutárico y ácido 2-cetosuccínico, incluidos ambos isómeros individuales (R) y (S), cuando es posible.

“Dador de amino" o "dador de amina" se refieren a un compuesto amino que dona un grupo amino al aceptor de amino, volviéndose por lo tanto una especie carbonilo. En algunas realizaciones, los dadores de amino son moléculas de la fórmula general siguiente,

dador de amino

en la cual cada uno de RE y R6, cuando se consideran independientemente, es un alquilo, cicloalquilo, heterocicloalquilo, arilo o heteroarilo, el que puede no estar sustituido o estar sustituido con uno o más grupos enzimáticamente no inhibidores. RE puede ser igual o diferente a R6 en estructura o quiralidad. En algunas realizaciones, RE y R6, tomados juntos, pueden formar un anillo que está sustituido, no sustituido o fusionado a otros anillos. Los dadores de amino típicos que se pueden utilizar, incluyen aminoácidos quirales y aquirales, y aminas quirales y aquirales. Los dadores de amino que se pueden utilizar incluyen, a modo de ejemplo y no limitante, isopropilamina (también denominada 2-aminopropano), a-fenetilamina (también denominada 1-feniletanamina), y sus enantiómeros (S)-1-feniletanamina y (R)-1-feniletanamina, 2-amino-4-fenilbutano, glicina, ácido L-glutámico, L-glutamato, glutamato monosódico, L-alanina, D-alanina, D,L-alanina, ácido L-aspártico, L-lisina, D,L-ornitina, palanina, taurina, n-octilamina, ciclohexilamina, 1,4-butanodiamina (también denominada putrescina), 1,6-hexanodiamina, ácido 6-aminohexanoico, ácido 4-aminobutírico, tiramina, y bencilamina, 2-aminobutano, 2-amino-1-butanol, 1-amino-1-feniletano, 1-amino-1-(2-metoxi-5-fluorofenil)etano, 1-amino-1-fenilpropano, 1-amino-1-(4-hidroxifenil)propano, 1-amino-1-(4-bromofenil)propano, 1-amino-1-(4-nitrofenil)propano, 1-fenil-2-aminopropano, 1-(3-trifluorometilfenil)-2-aminopropano, 2-aminopropanol, 1-amino-1-fenilbutano, 1-fenil-2-aminobutano, 1-(2,5-dimetoxi-4-metilfenil)-2-aminobutano, 1-fenil-3-aminobutano, 1-(4-hidroxifenil)-3-aminobutano, 1-amino-2-metilciclopentano, 1-amino-3-metilciclopentano, 1-amino-2-metilciclohexano, 1-amino-1-(2-naftil)etano, 3-metilciclopentilamina, 2-metilciclopentilamina, 2-etilciclopentilamina, 2-metilciclohexilamina, 3-metilciclohexilamina, 1-aminotetralina, 2aminotetralina, 2-amino-5-metoxitetralina y 1 -aminoindano, incluidos ambos isómeros individuales (R) y (S) cuando es posible, e incluidas todas las posibles sales de las aminas.

"Amina quiral" se refiere a amina de fórmula general R1-CH(NH2)- R1 y se emplea en este documento en su sentido más amplio, que incluye una amplia variedad de compuestos alifáticos y alicíclicos de tipos funcionales diferentes, y mixtos, caracterizados por la presencia de un grupo amino primario unido a un átomo de carbono secundario que, además de un átomo de hidrógeno, tiene unido (i) un grupo divalente que forma una estructura cíclica quiral, o (ii) dos sustituyentes (distintos de hidrógeno) que difieren entre sí en estructura o quiralidad. Los grupos divalentes que forman una estructura cíclica quiral incluyen, por ejemplo, 2-metilbutano-1,4-diilo, pentano-1,4-diilo, hexano-1,4-diilo, hexano-1,5-diilo, 2-metilpentano-1,5-diilo. Los dos sustituyentes diferentes en el átomo de carbono secundario (R1 y R2 anteriores) también pueden variar ampliamente e incluyen alquilo, aralquilo, arilo, halo, hidroxi, alquilo inferior, alcoxi inferior, alquiltio inferior, cicloalquilo, carboxi, carbalcoxi, carbamoilo, mono- y di-(alquilo inferior), carbamoilo, trifluorometilo, fenilo, nitro, amino, mono- y di-(alquilo inferior) sustituidos, amino, alquilsulfonilo, arilsulfonilo, alquilcarboxamido, arilcarboxamido, etc., sustituidos, así como alquilo, aralquilo o arilo sustituidos con los precedentes.

"Piridoxal-fosfato", "PLP" "piridoxal-5'-fosfato", "PYP" y "P5P" se usan indistintamente en este documento para referirse al compuesto que actúa como una coenzima en reacciones de transaminasa. En algunas realizaciones, el piridoxal fosfato es definido por la estructura ácido 1 -(4'-formil-3'-hidroxi-2'-metil-5'-piridil)metoxifosfónico, número CAS [54-47-7], el piridoxal-5'-fosfato se puede producir in vivo mediante fosforilación y oxidación de piridoxol (también conocido como vitamina B6). En las reacciones de transaminación que usan enzimas transaminasa, el grupo amina del dador de amino se transfiere a la coenzima para producir un subproducto ceto, mientras que el piridoxal-5'-fosfato se convierte en fosfato de piridoxamina. El piridoxal-5'-fosfato se regenera mediante reacción con un compuesto ceto diferente (el aceptor de amino). La transferencia del grupo amina desde fosfato de piridoxamina al aceptor de amino produce una amina quiral y regenera la coenzima. En algunas realizaciones, el piridoxal-5'-fosfato puede ser reemplazado por otros miembros de la familia de la vitamina B6, que incluyen piridoxina (PN), piridoxal (PL), piridoxamina (PM), y sus contrapartes fosforiladas; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP).

“Secuencia de codificación" se refiere a la porción de un ácido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoácidos de una proteína.

“De origen natural" o "tipo silvestre" se refiere a la forma que se encuentra en la naturaleza. Por ejemplo, un polipéptido o secuencia de polinucleótidos de origen natural o tipo silvestre es una secuencia presente en un organismo que se puede aislar de una fuente de la naturaleza y que no ha sido modificado intencionalmente mediante manipulación humana.

“Recombinante" o "genomanipulado" o "que no es de origen natural" cuando se utiliza con referencia a, por ejemplo, una célula, un ácido nucleico o un polipéptido, se refiere a un material, o a un material correspondiente a la forma natural o nativa del material, que ha sido modificado de una manera que de otra forma no existiría en la naturaleza, o es idéntico a, pero producido a partir de, o derivado de, materiales sintéticos y/o mediante manipulación empleando técnicas de recombinación. Los ejemplos no limitantes incluyen, entre otros, células recombinantes que expresan genes que no se encuentran en la forma nativa (no recombinante) de la célula o que expresan genes nativos que de lo contrario se expresan en un nivel diferente.

“Porcentaje de identidad de secuencia" y "porcentaje de homología" se usan indistintamente en este documento para referirse a comparaciones entre polinucleótidos y polipéptidos, y se determinan comparando dos secuencias alineadas óptimamente en una ventana de comparación, en donde la porción de la secuencia del polinucleótido o el polipéptido en la ventana de comparación puede comprender adiciones o deleciones (es decir, huecos) en comparación con la secuencia de referencia, para la alineación óptima de las dos secuencias. El porcentaje se puede calcular determinando el número de posiciones en las que aparece una base de ácido nucleico o residuo de aminoácido idéntico en ambas secuencias para calcular el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Alternativamente, el porcentaje se puede calcular determinando el número de posiciones en las que aparece o bien la base de ácido nucleico o bien el residuo de aminoácido idéntico en ambas secuencias o una base de ácido nucleico o un residuo de aminoácido se alinea con un hueco, para calcular el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Los expertos en la materia apreciarán que se dispone de muchos algoritmos establecidos para alinear dos secuencias. La alineación óptima de las secuencias por comparación se puede realizar mediante, por ejemplo, el algoritmo de homología local de Smith y Waterman, 1981, Adv. Appl. Math. 2:482, mediante el algoritmo de alineación de homología de Needleman y Wunsch, 1970, J. Mol. Biol. 48:443, mediante la búsqueda por método de similitud de Pearson y Lipman, 1988, Proc. Natl. Acad. Sci. USA 85:2444, mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el paquete informático GCG Wisconsin), o mediante inspección visual (véase en general, Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, un proyecto conjunto entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (Suplemento 1995) (Ausubel)).

Los ejemplos de algoritmos que son adecuados para determinar el porcentaje de identidad de secuencia y la similitud de secuencia son los algoritmos BLAST y BLAST 2.0 que se describen en Altschul et al., 1990, J. Mol. Biol. 215: 403 410 y Altschul et al., 1977, Nucleic Acids Res. 3389-3402, respectivamente. El programa informático para realizar análisis BLAST está disponible para el público a través del sitio web del National Center for Biotechnology Information. Este algoritmo implica primero identificar pares de secuencias de puntuación alta (HSP) mediante la identificación de palabras cortas de longitud W en la secuencia de interrogación, que coinciden o satisfacen alguna puntuación de umbral de valor positivo T cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T es mencionada como la puntuación umbral de las palabras del vecindario (Altschul et al, supra). Estos resultados iniciales de palabras cercanas actúan como semillas para iniciar búsquedas con el fin de encontrar HSP más largas que las contengan. Los (hits) de palabras se extienden después en ambas direcciones a lo largo de cada secuencia, tan lejos como se pueda incrementar la puntuación de alineación acumulada. Las puntuaciones acumuladas se calculan usando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos coincidentes; siempre > 0) y N (puntuación de penalización para residuos que no coinciden; siempre < 0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los resultados de las palabras en cada dirección se detiene cuando: la puntuación de alineación acumulativa cae fuera en una cantidad X de su valor máximo conseguido; la puntuación acumulativa se reduce hasta cero o por debajo, debido a la acumulación de una o más alineaciones de residuos con puntuación negativa; o se llega al final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas hebras. Para la secuencia de aminoácidos, el programa BLASTP usa por defecto una longitud de palabra (W) de 3, una expectativa (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff, 1989, Proc Natl Acad Sci USA 89:10915). El ejemplo de determinación de la alineación de secuencias y del % de identidad de secuencia puede emplear los programas BESTFIT o GAP del paquete informático GCG Wisconsin (Accelrys, Madison WI), usando los parámetros predeterminados provistos.

“Secuencia de referencia" se refiere a una secuencia definida utilizada como base para una comparación de secuencias. Una secuencia de referencia puede ser un subconjunto de una secuencia más grande, por ejemplo, un segmento de una secuencia de longitud completa de un gen o un polipéptido. Generalmente, una secuencia de referencia tiene al menos 20 nucleótidos o residuos de aminoácidos de longitud, al menos 25 residuos de longitud, al menos 50 residuos de longitud, o la longitud completa del ácido nucleico o polipéptido. Dado que dos polinucleótidos o polipéptidos pueden cada uno (1 ) contener una secuencia (es decir, una porción de la secuencia completa) que sea similar entre las dos secuencias, y (2) contener además una secuencia que sea divergente entre las dos secuencias, se realizan habitualmente comparaciones de secuencias entre dos (o más) polinucleótidos o polipéptidos por comparación de las secuencias de los dos polinucleótidos o polipéptidos en una "ventana de comparación" para identificar y comparar regiones locales de similitud de secuencia. En algunas realizaciones, una "secuencia de referencia" se puede basar en una secuencia de aminoácidos primaria, donde la secuencia de referencia es una secuencia que puede tener uno o más cambios en la secuencia primaria. Por ejemplo, una "secuencia de referencia basada en SEQ ID NO: 4 que tiene en el residuo correspondiente a X14 una valina" o X14V se refiere a una secuencia de referencia en la cual el residuo correspondiente a X14 en SEQ ID NO: 4, que es una tirosina, ha sido cambiado a valina.

Una "ventana de comparación", se refiere a un segmento conceptual de al menos alrededor de 20 posiciones de nucleótidos o residuos de aminoácidos contiguos donde una secuencia se puede comparar con una secuencia de referencia de al menos 20 nucleótidos o aminoácidos contiguos y donde la porción de la secuencia en la ventana de comparación puede comprender adiciones o deleciones (es decir, huecos) de 20 por ciento o menos en comparación con la secuencia de referencia (que no comprende adiciones ni deleciones) para la alineación óptima de las dos secuencias. La ventana de comparación puede ser más larga que 20 residuos contiguos, e incluye, opcionalmente ventanas de 30, 40, 50, 100, o más largas.

“Identidad sustancial" se refiere a una secuencia de polinucleótido o polipéptido que tiene al menos 80 por ciento de identidad de secuencia, al menos 85 por ciento de identidad y 89 a 95 por ciento de identidad de secuencia, más habitualmente al menos 99 por ciento de identidad de secuencia en comparación con una secuencia de referencia en una ventana de comparación de al menos 20 posiciones de residuos, frecuentemente en una ventana de al menos 30-50 residuos, en donde el porcentaje de identidad de secuencia se calcula mediante comparación de la secuencia de referencia con una secuencia que incluye deleciones o adiciones que totalizan 20 por ciento o menos de la secuencia de referencia en la ventana de comparación. En realizaciones específicas aplicadas a polipéptidos, la expresión "identidad sustancial" significa que dos secuencias polipeptídicas, cuando están alineadas óptimamente, por ejemplo mediante los programas GAP o BESTFIT usando los pesos predeterminados de los huecos, comparten al menos 80% de identidad de secuencia, preferentemente al menos 89% de identidad de secuencia, al menos 95% de identidad de secuencia o más (por ejemplo, 99% de identidad de secuencia). Preferentemente, las posiciones de los residuos que no son idénticos difieren en sustituciones conservadoras de aminoácidos.

“Correspondiente a", "con respecto a" o "en relación con" cuando se usan en el contexto de la numeración de una determinada secuencia de aminoácidos o polinucleótido se refiere a la numeración de los residuos de una secuencia de referencia especificada, cuando la secuencia de aminoácidos o polinucleótido dada se compara con la secuencia de referencia. En otras palabras, el número del residuo o la posición del residuo de un determinado polímero se designan con respecto a la secuencia de referencia más bien que por la posición numérica real del residuo dentro de la secuencia de aminoácidos o polinucleótido dada. Por ejemplo, una determinada secuencia de aminoácidos, tal como la de una transaminasa genomanipulada, se puede alinear con una secuencia de referencia introduciendo huecos para optimizar la coincidencia de residuos entre las dos secuencias. En estos casos, aunque están presentes los huecos, la numeración del residuo en la secuencia de aminoácidos o polinucleótido dada, se hace con respecto a la secuencia de referencia con la cual ha sido alineada.

“Diferencia de aminoácido" o "diferencia de residuo" se refiere a un cambio en el residuo de aminoácido en una posición de una secuencia polipeptídica en relación con el residuo de aminoácido en la posición correspondiente de la secuencia de referencia. Las posiciones de las diferencias de aminoácidos generalmente se indican en este documento como "Xn," donde n se refiere a la posición correspondiente en la secuencia de referencia sobre la cual se basa la diferencia de residuo. Por ejemplo, una "diferencia de residuo en la posición X14 en comparación con SEQ ID NO: 4" se refiere a un cambio del residuo de aminoácido en la posición del polipéptido correspondiente a la posición 14 de SEQ ID NO: 4. Por lo tanto, si el polipéptido de referencia de SEQ ID NO: 4 tiene una tirosina en la posición 14, entonces una "diferencia de residuo en la posición X14 en comparación con SEQ ID NO: 4" es una sustitución del aminoácido con cualquier residuo distinto de tirosina en la posición del polipéptido correspondiente a la posición 14 de SEQ ID NO: 4. En la mayoría de los casos de este documento, la diferencia de residuo de aminoácido específica en una posición, se indica como "XnY" donde "Xn" especifica la posición correspondiente, según se describió antes, e "Y" es el identificador de una sola letra del aminoácido encontrado en el polipéptido genomanipulado (es decir, el residuo diferente al del polipéptido de referencia). En algunas realizaciones, puede aparecer más de un aminoácido en una posición especificada del residuo, los aminoácidos alternativos se pueden indicar en forma de XnY/Z, donde Y y Z representan los residuos de aminoácidos alternativos. En algunos casos (por ejemplo, en las Tablas 2A y 2B), la presente divulgación también proporciona diferencias de aminoácidos específicas, indicadas mediante la anotación convencional "AnB", donde A es el identificador de una sola letra del residuo en la secuencia de referencia, "n" es el número de la posición del residuo en la secuencia de referencia, y B es el identificador de una sola letra del residuo sustituto en la secuencia del polipéptido genomanipulado. Además, en algunos casos, un polipéptido de la presente divulgación puede incluir una o más diferencias de residuos de aminoácidos en relación con una secuencia de referencia, lo que se indica mediante una lista de las posiciones especificadas en donde se hacen los cambios en relación con la secuencia de referencia. La presente divulgación incluye secuencias de polipétidos genomanipuladas que comprenden una o más diferencias de aminoácidos que incluyen sustituciones de aminoácidos tanto conservadoras como no conservadoras.

"Sustitución de aminoácido conservadora" se refiere a una sustitución de un residuo con un residuo diferente que tiene una cadena lateral similar, y por lo tanto implica generalmente la sustitución del aminoácido en el polipéptido con aminoácidos dentro de la misma clase definida de aminoácidos o una similar. A modo de ejemplo y no limitante, un aminoácido con una cadena lateral alifática puede ser sustituido con otro aminoácido alifático, por ejemplo, alanina, valina, leucina e isoleucina; un aminoácido con una cadena lateral hidroxilo se sustituye con otro aminoácido con una cadena lateral hidroxilo, por ejemplo, serina y treonina; un aminoácido que tiene una cadena lateral aromática se sustituye con otro aminoácido que tiene una cadena lateral aromática, por ejemplo, fenilalanina, tirosina, triptófano e histidina; un aminoácido con una cadena lateral básica se sustituye con otro aminoácido con una cadena lateral básica, por ejemplo, lisina y arginina; un aminoácido con una cadena lateral ácida se sustituye con otro aminoácido con una cadena lateral ácida, por ejemplo, ácido aspártico o ácido glutámico; y un aminoácido hidrófobo o hidrófilo es reemplazado por otro aminoácido hidrófobo o hidrófilo, respectivamente. Ejemplos de sustituciones conservadoras se proporcionan en la Tabla 1 a continuación.

Tabla 1

“Sustitución no conservadora" se refiere a la sustitución de un aminoácido en el polipéptido con un aminoácido con propiedades de cadena lateral que difieren significativamente. Las sustituciones no conservadoras pueden usar aminoácidos entre los grupos definidos, más bien que dentro de ellos, y afectan (a) la estructura del esqueleto del péptido en la zona de la sustitución (por ejemplo, prolina por glicina), (b) la carga o hidrofobicidad, o (c) el volumen de la cadena lateral. A modo de ejemplo y no limitante, una sustitución no conservadora ejemplar puede ser un aminoácido ácido sustituido con un aminoácido básico o alifático; un aminoácido aromático sustituido con un aminoácido pequeño; y un aminoácido hidrófilo sustituido con un aminoácido hidrófobo.

"Deleción" se refiere a la modificación del polipéptido mediante la eliminación de uno o más aminoácidos del polipéptido de referencia. Las deleciones pueden comprender la eliminación de 1 o más aminoácidos, 2 o más aminoácidos, 5 o más aminoácidos, 10 o más aminoácidos, 15 o más aminoácidos, o 20 o más aminoácidos, hasta el 10% del número total de aminoácidos, o hasta el 20% del número total de aminoácidos que forman la enzima de referencia pero reteniendo la actividad enzimática y/o reteniendo las propiedades mejoradas de una enzima transaminasa genomanipulada. Las deleciones pueden dirigirse a las porciones internas y/o porciones terminales del polipéptido. En diversas realizaciones, la deleción puede comprender un segmento continuo o puede ser discontinua.

"Inserción" se refiere a la modificación del polipéptido mediante adición de uno o más aminoácidos del polipéptido de referencia. En algunas realizaciones, las enzimas transaminasa genomanipuladas mejoradas, comprenden inserciones de uno o más aminoácidos en el polipéptido transaminasa de origen natural, así como inserciones de uno o más aminoácidos en otros polipéptidos transaminasas mejorados. Las inserciones pueden estar en las porciones internas del polipéptido, o en el extremo carboxi o amino terminal. Las inserciones, según se usan en el presente documento, incluyen proteínas de fusión como es sabido en el área. La inserción puede ser un segmento contiguo de aminoácidos o estar separada por uno o más de los aminoácidos del polipéptido de origen natural.

"Fragmento" según se usa en este documento, se refiere a un polipéptido que tiene una deleción amino-terminal y/o carboxi-terminal, pero donde la secuencia de aminoácidos restante es idéntica a las posiciones correspondientes en la secuencia. Los fragmentos pueden tener al menos 14 aminoácidos de longitud, al menos 20 aminoácidos de longitud, al menos 50 aminoácidos de longitud o más, y hasta 70%, 80%, 90%, 95%, 98% y 99% del polipéptido transaminasa de longitud completa, por ejemplo, el polipéptido de SEQ ID NO: 2 o la transaminasa genomanipulada de SEQ ID NO: 34.

"Polipéptido aislado" se refiere a un polipéptido que está sustancialmente separado de otros contaminantes que lo acompañan naturalmente, por ejemplo, proteínas, lípidos y polinucleótidos. El término abarca polipéptidos que han sido eliminados o purificados de su entorno natural o sistema de expresión (por ejemplo, célula hospedadora o síntesis in vitro). Las enzimas transaminasa mejoradas pueden estar presentes dentro de una célula, presentes en el medio celular o preparadas de diversas formas, tales como lisados o preparaciones aisladas. Como tal, en algunas realizaciones, la enzima transaminasa mejorada puede ser un polipéptido aislado.

"Polipéptido sustancialmente puro" se refiere a una composición en la que la especie polipéptido es la especie predominante presente (es decir, en base molar o en peso es más abundante que cualquier otra especie macromolecular individual en la composición), y generalmente es una composición sustancialmente purificada cuando la especie objeto comprende al menos alrededor de 50 por ciento de la especie macromolecular presente en moles o % en peso. Generalmente, una composición de transaminasa sustancialmente pura comprenderá aproximadamente 60% o más, aproximadamente 70% o más, aproximadamente 80% o más, aproximadamente 90% o más, aproximadamente 95% o más, y aproximadamente 98% o más de todas las especies macromoleculares en moles o % en peso presentes en la composición. En algunas realizaciones, la especie objeto se purifica hasta homogeneidad esencial (es decir, las especies contaminantes no se pueden detectar en la composición por métodos de detección convencionales) en donde la composición consiste esencialmente en una única especie macromolecular. La especie solvente, las moléculas pequeñas (< 500 Dalton) y las especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipéptido transaminasa mejorado aislado, es una composición de polipéptido sustancialmente pura.

"Estereoselectividad" se refiere a la formación preferencial en una reacción química o enzimática de un estereoisómero respecto a otro. La estereoselectividad puede ser parcial, cuando se favorece la formación de un estereoisómero respecto al otro, o puede ser completa cuando solo se forma un estereoisómero. Cuando los estereoisómeros son enantiómeros, la estereoselectividad se denomina enantioselectividad, la fracción (habitualmente informada como un porcentaje) de un enantiómero en la suma de ambos. Comúnmente se informa alternativamente en el área (habitualmente como un porcentaje) como el exceso enantiomérico (e.e.) calculado a partir de la fórmula [enantiómero mayor - enantiómero menor]/[enantiómero mayor enantiómero menor]. Cuando los estereoisómeros son diastereoisómeros, la estereoselectividad se denomina diastereoselectividad, la fracción (habitualmente informada como un porcentaje) de un diastereómero en una mezcla de dos diastereómeros, comúnmente informada alternativamente como el exceso diastereoisomérico (e.d.). El exceso enantiomérico y el exceso diastereoisomérico son tipos de exceso estereoisomérico.

"Altamente estereoselectiva" se refiere a una reacción química o enzimática que es capaz de convertir un sustrato, por ejemplo, el Compuesto (IA), en su correspondiente producto amina quiral, por ejemplo, el Compuesto (IIA), con al menos alrededor de 85% de exceso estereoisomérico.

“Propiedad enzimática mejorada" se refiere a un polipéptido transaminasa que presenta una mejora en cualquier propiedad enzimática en comparación con una transaminasa de referencia. Para los polipéptidos transaminasa genomanipulados descritos en este documento, la comparación se hace generalmente con la enzima transaminasa tipo silvestre, aunque en algunas realizaciones, la transaminasa de referencia puede ser otra transaminasa genomanipulada mejorada. Las propiedades enzimáticas para las cuales es deseable una mejora incluyen, pero no exclusivamente, actividad enzimática (que se puede expresar en términos de porcentaje de conversión del sustrato), termoestabilidad, estabilidad al solvente, perfil de actividad del pH, requisitos de cofactores, refractariedad a los inhibidores (por ejemplo, inhibición por sustrato o producto), estereoespecificidad y estereoselectividad (incluida la enantioselectividad).

“Mayor actividad enzimática" se refiere a una propiedad mejorada de los polipéptidos transaminasa genomanipulados, que se puede representar mediante un aumento en la actividad específica (por ejemplo producto producido/tiempo/peso de proteína) o un aumento en el porcentaje de conversión del sustrato en el producto (por ejemplo, porcentaje de conversión de la cantidad de partida del sustrato en producto, en un período de tiempo especificado, utilizando una cantidad especificada de transaminasa) en comparación con la enzima transaminasa de referencia. Los ejemplos de métodos para determinar la actividad enzimática se proporcionan en los Ejemplos. Cualquier propiedad relacionada con la actividad enzimática puede ser afectada, incluidas las propiedades enzimáticas clásicas de K^m, V^máx o k^cat, cuyos cambios pueden conducir a una mayor actividad enzimática. Las mejoras en la actividad enzimática pueden ser desde alrededor de 1,2 veces la actividad enzimática de la enzima transaminasa tipo silvestre correspondiente, hasta más de 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces, 75 veces, 100 veces, o más la actividad enzimática de la transaminasa de origen natural u otra transaminasa genomanipulada de la cual derivan los polipéptidos transaminasa. La actividad de transaminasa se puede medir por cualquiera de los ensayos estándar, como mediante control de los cambios en las propiedades espectrofotométricas de los reactivos o los productos. En algunas realizaciones, la cantidad de productos producida se puede medir mediante separación por cromatografía líquida de alto rendimiento (HPLC) combinada con absorbancia UV o detección fluorescente después de la derivatización, por ejemplo con o-ftaldialdehído (OPA). Las comparaciones de actividades enzimáticas se hacen usando una preparación de enzima definida, un ensayo definido en una condición establecida, y uno o más sustratos definidos, como se describe en detalle más adelante en este documento. Generalmente, cuando se comparan lisados, se determinan el número de células y la cantidad de proteína ensayada así como el uso de sistemas de expresión idénticos y células hospedadoras idénticas para minimizar las variaciones en la cantidad de enzima producida por las células hospedadoras y presente en los lisados.

“Conversión" se refiere a la conversión enzimática del o los sustratos en el o los productos correspondientes. “Porcentaje de conversión" se refiere el porcentaje de sustrato que se convierte en el producto dentro de un período de tiempo, en condiciones especificadas. Por lo tanto, la "actividad enzimática" o "actividad" de un polipéptido transaminasa se puede expresar como "porcentaje de conversión" del sustrato en el producto.

“Termoestable" se refiere al polipéptido transaminasa que mantiene una actividad similar (más de 60% a 80%, por ejemplo) después de la exposición a temperaturas elevadas (por ejemplo, 40-80°C) durante un período de tiempo (por ejemplo, 0,5-24 h) en comparación con la enzima tipo silvestre.

“Estable al solvente" se refiere a un polipéptido transaminasa que mantiene una actividad similar (más de, por ejemplo, 60% a 80%) después de la exposición a concentraciones variables (por ejemplo, 5-99%) de solvente (etanol, alcohol isopropílico, dimetilsulfóxido (DMSO), tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metil tert-butil éter, etc.) por un período de tiempo (por ejemplo, 0,5-24 h) en comparación con la enzima tipo silvestre.

“Termoestable y estable al solvente" se refiere a un polipéptido transaminasa que es tanto termoestable como estable al solvente.

“Hibridación rigurosa" se usa en este documento para referirse a las condiciones bajo las cuales los híbridos de ácido nucleico son estables. Como saben los expertos en la materia, la estabilidad de los híbridos se refleja en la temperatura de fusión (T^f) de los híbridos. En general, la estabilidad de un híbrido es una función de la fuerza iónica, la temperatura, el contenido G/C, y la presencia de agentes caotrópicos. Los valores de T^f para los polinucleótidos se pueden calcular empleando métodos conocidos para predecir las temperaturas de fusión (véanse, por ejemplo, Baldino et al., Methods Enzymology 168:761-777; Bolton et al., 1962, Proc. Natl. Acad. Sci. USA 48:1390; Bresslauer et al., 1986, Proc. Natl. Acad. Sci USA 83:8893-8897; Freier et al., 1986, Proc. Natl. Acad. Sci USA 83:9373-9377; Kierzek et al., Biochemistry 25:7840-7846; Rychlik et al., 1990, Nucleic Acids Res 18:6409-6412 (erratum, 1991, Nucleic Acids Res 19:698); Sambrook et al., supra); Suggs et al., 1981, In Developmental Biology Using Purified Genes (Brown et al., eds.), pp.683-693, Academic Press; y Wetmur, 1991, Crit Rev Biochem Mol Biol 26:227-259. En algunas realizaciones, el polinucleótido codifica el polipéptido dado a conocer en este documento y se hibrida en condiciones definidas, como condiciones moderadamente rigurosas o altamente rigurosas, al complemento de la secuencia que codifica una enzima transaminasa genomanipulada de la presente divulgación.

“Rigurosidad de hibridación" se refiere a las condiciones de hibridación, como condiciones de lavado en la hibridación de ácidos nucleicos. Generalmente, las reacciones de hibridación se llevan a cabo en condiciones de baja rigurosidad, seguidas de lavados de rigurosidad variable pero mayor. La expresión "hibridación moderadamente rigurosa" se refiere a las condiciones que permiten que el ADN-diana se una a un ácido nucleico complementario que tiene alrededor de 60% de identidad, preferentemente alrededor de 75% de identidad, alrededor del 85% de identidad con el ADN diana, con más de alrededor de 90% de identidad con el polinucleótido-diana. Ejemplos de condiciones moderadamente rigurosas son condiciones equivalentes a la hibridación en 50% de formamida, 5 x solución de Denhart, 5 x SSPE, 0,2% de SDS a 42°C, seguido de lavado en 0,2 x SSPE, 0,2% de SDS, a 42°C.

“Hibridación altamente rigurosa" se refiere generalmente a condiciones que son alrededor de 10°C o menos de la temperatura de fusión térmica Tf según se determina en la condición de solución para una secuencia de polinucleótido definida. En algunas realizaciones, una condición de alta rigurosidad se refiere a las condiciones que permiten la hibridación de solo aquellas secuencias de ácido nucleico que forman híbridos estables en NaCl 0,018 M a 65°C (es decir, si un híbrido no es estable en NaCl 0,018 M a 65°C, no ser estable en condiciones de alta rigurosidad, según se contempla en este documento). Se pueden proporcionar condiciones de alta rigurosidad, por ejemplo, mediante hibridación en condiciones equivalentes a 50% de formamida, 5 x solución de Denhart, 5 x SSPE, 0,2% de SDS a 42°C, seguida de lavado en 0,1 x SSPE, y 0,1% de SDS a 65°C. Otra condición de alta rigurosidad es hibridar en condiciones equivalentes a la hibridación en 5 x SSC que contiene 0,1% (p:v) de SDS a 65°C y lavado en 0,1 x SSC que contiene 0,1% de SDS a 65°C. Otras condiciones de alta rigurosidad de hibridación, así como condiciones moderadamente rigurosas, se describen en las referencias citadas antes.

Polinucleótido "heterólogo" se refiere a cualquier polinucleótido que es introducido en la célula hospedadora mediante técnicas de laboratorio, e incluye polinucleótidos que son extraídos de una célula hospedadora, sometidos a manipulación en el laboratorio, y luego reintroducidos en una célula hospedadora.

“Codones optimizados" se refiere a los cambios en los codones del polinucleótido que codifica una proteína a los preferencialmente utilizados en un organismo particular, de modo que la proteína codificada se exprese eficientemente en el organismo de interés. Aunque el código genético está degenerado en cuanto a que la mayoría de los aminoácidos están representados por varios codones, denominados "sinónimos" o codones "sinónimos", es bien sabido que el uso de codones por organismos particulares no es aleatorio y está sesgado hacia tripletes de codones particulares. Este sesgo de uso de codones puede ser mayor en referencia a un determinado gen, genes de función u origen ancestral común, proteínas altamente expresadas frente a proteínas de bajo número de copias y regiones de codificación de proteínas agregadas del genoma de un organismo. En algunas realizaciones, los polinucleótidos que codifican las enzimas transaminasa pueden tener codones optimizados para la producción óptima desde el organismo hospedador elegido para la expresión.

"Codones preferidos, óptimos, de alto sesgo en el uso de codones" se refiere indistintamente a codones que se usan con mayor frecuencia en las regiones de codificación de proteínas que otros codones que codifican el mismo aminoácido. Los codones preferidos se pueden determinar en relación con el uso de codones en un solo gen, un conjunto de genes de función u origen común, genes altamente expresados, la frecuencia de codones en las regiones de codificación de proteínas agregadas en todo el organismo, la frecuencia de codones en las regiones de codificación de proteínas agregadas de organismos relacionados, o sus combinaciones. Los codones cuya frecuencia aumenta con el nivel de expresión del gen, son habitualmente codones óptimos para la expresión. Se conocen diversos métodos para determinar la frecuencia de codones (por ejemplo, uso de codones, uso relativo de codones sinónimos) y la preferencia de codones en organismos específicos, que incluyen análisis multivariable, por ejemplo, usando análisis de conglomerados o análisis de correspondencia, y el número efectivo de codones utilizados en un gen (véanse GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, University of Nottingham; McInerney, J. O, 1998, Bioinformatics 14:372-73; Stenico et al., 1994, Nucleic Acids Res. 222437-46; Wright, F., 1990, Gene 87:23-29). Se dispone de tablas de uso de codones para una lista creciente de organismos (véanse por ejemplo, Wada et al., 1992, Nucleic Acids Res. 20:2111-2118; Nakamura et al., 2000, Nucl. Acids Res. 28:292; Duret, et al., supra; Henaut y Danchin, "Escherichia coli and Salmonella," 1996, Neidhardt, et al. Eds., ASM Press, Washington D.C., pp. 2047-2066. La fuente de datos para obtener el uso de codones puede basarse en cualquier secuencia de nucleótidos disponible capaz de codificar una proteína. Estos conjuntos de datos incluyen secuencias de ácido nucleico que se sabe en la actualidad que codifican proteínas expresadas (por ejemplo, secuencias que codifican proteínas completas-CDS), etiquetas de secuencias expresadas (ESTS), o regiones de codificación predichas de secuencias genómicas (véanse por ejemplo, Mount, D., Bioinformatics: Sequence and Genome Analysis, capítulo 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2001; Uberbacher, E. C., 1996, Methods Enzymol.

266:259-281; Tiwari et al., 1997, Comput. Appl. Biosci. 13:263-270).

“Secuencia de control" se define en este documento de modo de incluir todos los componentes, que son necesarios o ventajosos para la expresión de un polinucleótido y/o polipéptido de la presente divulgación. Cada secuencia control puede ser nativa o extraña a la secuencia de ácido nucleico que codifica el polipéptido. Dichas secuencias de control incluyen, pero no exclusivamente, un líder, una secuencia de poliadenilación, una secuencia de propéptido, un promotor, una secuencia de péptido señal y un terminador de la transcripción. Como mínimo, las secuencias de control incluyen un promotor y señales de parada de la transcripción y la traducción. Las secuencias de control pueden estar provistas de conectores con el fin de introducir sitios de restricción específicos que faciliten la ligación de las secuencias de control con la región de codificación de la secuencia de ácido nucleico que codifica un polipéptido.

“Unido operativamente" se define en este documento como una configuración en la cual una secuencia de control se coloca adecuadamente (es decir, en una relación funcional) en una posición en relación con un polinucleótido de interés, de modo que la secuencia de control dirija o regule la expresión del polinucleótido y/o polipéptido de interés.

“Secuencia promotora" se refiere a una secuencia de ácido nucleico que es reconocida por una célula hospedadora para la expresión de un polinucleótido de interés, como una secuencia de codificación. La secuencia promotora contiene secuencias de control transcripcional, que median la expresión de un polinucleótido de interés. El promotor puede ser cualquier secuencia de ácido nucleico que tenga actividad transcripcional en la célula hospedadora de elección, incluidos los promotores mutantes, truncados e híbridos, y que se pueda obtener de genes que codifican polipéptidos extracelulares o intracelulares ya sean homólogos o heterólogos a la célula hospedadora.

“Condiciones de reacción adecuadas" se refieren a las condiciones en la solución de reacción biocatalítica (por ejemplo, intervalos de carga de enzima, carga de sustrato, carga de cofactor, temperatura, pH, tampones, cosolventes, etc.) en las cuales un polipéptido transaminasa de la presente divulgación es capaz de convertir un compuesto sustrato en un compuesto producto (por ejemplo, conversión de un Compuesto (IA) en un Compuesto (IIA)). Ejemplos de las "condiciones de reacción adecuadas" se proporcionan en la presente divulgación y se ilustran mediante los Ejemplos.

“Carga", como en "carga de compuesto" o "carga de enzima" o "carga de cofactor" se refiere la concentración o cantidad de un componente en una mezcla de reacción al inicio de la reacción.

“Sustrato" en el contexto de un proceso mediado por biocatalizador se refiere al compuesto o la molécula sobre el/la que actúa el biocatalizador. Por ejemplo, un ejemplo de sustrato para el biocatalizador transaminasa en el proceso dado a conocer en este documento es el compuesto (IA).

“Producto" en el contexto de un proceso mediado por biocatalizador se refiere el compuesto o la molécula que resulta de la acción del biocatalizador. Por ejemplo, un ejemplo de producto para el biocatalizador transaminasa en el proceso dado a conocer en este documento es el compuesto (IIA).

La presente divulgación proporciona métodos de uso de polipéptidos que tienen actividad de transaminasa para la síntesis de (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico de (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina. Cuando la descripción se refiere a polipéptidos, se debe entender que también describe los polinucleótidos que codifican los polipéptidos.

Las aminotransferasas, también conocidas como transaminasas, catalizan la transferencia de un grupo amino desde una amina primaria de un sustrato dador de amino al grupo carbonilo (por ejemplo, un grupo ceto o aldehido) de una molécula aceptora de amino. Se han identificado aminotransferasas de diversos organismos como Alcaligenes denitrificans, Bordetella bronchiseptica, Bordetella parapertussis, Brucella melitensis, Burkholderia malle, Burkholderia pseudomallei, Chromobacterium violaceum, Oceanicola granulosus HTCC2516, Oceanobacter sp. RED65, Oceanospirillum sp. MED92, Pseudomonas putida, Ralstonia solanacearum, Rhizobium meliloti, Rhizobium sp. (cepa NGR234), Vibrio fluvialis, Bacillus thuringensis, y Klebsiella pneumoniae (Shin et al., 2001, Biosci. Biotechnol, Biochem. 65:1782-1788).

Las transaminasas son útiles para la resolución quiral de aminas racémicas al explotar la capacidad de las transaminasas para llevar a cabo la reacción de manera estereoespecífica, es decir conversión preferencial de un enantiómero en la cetona correspondiente, de lo que resulta una mezcla enriquecida en el otro enantiómero (véase, por ejemplo, Koselewski et al., 2009, Org Lett. 11(21 ):4810-2). La estereoselectividad de las transaminasas en la conversión de una cetona en la amina correspondiente también hace que estas enzimas sean útiles en la síntesis asimétrica de aminas ópticamente puras a partir de los correspondientes compuestos ceto (véanse, por ejemplo, Hohne et al., "Biocatalytic Routes to Optically Active Amines," Chem Cat Chem 1(1):42 - 51; Zua y Hua, 2009, Biotechnol J. 4(10):1420-31).

La w-transaminasa de Vibrio fluvialis (w-VfT) posee una alta enantioselectividad por el enantiómero (S) de las aminas quirales y tiene especificidad de sustrato distintiva por las aminas aromáticas quirales (Shin y Kim, 2001, J. Org. Chem.

67:2848-2853). Alta enantioselectividad de w-VfT se ha aplicado a la resolución quiral de aminas (H. Yun, B.-K. Cho, B.-G. Kim, Biotechnol. Bioeng. 2004, 87, 772-778; J.-S. Shin, B.-G. Kim, Biotechnol. Bioeng. 1997, 55, 348-358; M. Hghne, K. Robins, U. T. Bornscheuer, Adv. Synth. Catal. 2008, 350,802-807). La enzima también ha sido utilizada en la síntesis asimétrica de aminas ópticamente puras usando un sustrato cetona proquiral. Sin embargo, la limitación en la síntesis asimétrica es el equilibrio desfavorable de la reacción inversa (Shin y Kim, 1999, Biotechnol. Bioeng. 65, 206-211), inhibición de la enzima w-VfT por el producto amina (Shin et al., 2001, Biotechnol Bioeng 73:179-187; Yun y Kim, 2008, Biosci. Biotechnol. Biochem. 72(11):3030-3033); baja actividad en aceptores de amino que tienen cadenas laterales voluminosas como grupos aromáticos (Shin y Kim, 2002, J. Org. Chem. 67:2848-2853); y baja estabilidad de la enzima (Yun y Kim, supra).

Transaminasas genomanipuladas derivadas de la transaminasa de Vibrio fluvialis que tienen mayor resistencia a las cetonas alifáticas se describen en Yun et al., 2005, Appl Environ Micriobiol., 71 (8):4220-4224) mientras que w -VfT con más amplia especificidad por un sustrato dador de amino se describen en Cho et al., 2008, Biotechnol Bioeng.

99(2):275-84. Las publicaciones de patentes WO2010081053 y US20100209981 describen w-VfT genomanipuladas con mayor estabilidad a la temperatura y/o al solvente orgánico y actividad enzimática frente a moléculas receptoras de amino estructuralmente diferentes.

La presente divulgación se refiere a métodos de uso de polipéptidos transaminasa genomanipulados derivados de V. fluvialis que median de manera eficiente la conversión de 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico. Significativamente, la divulgación identifica las posiciones de residuos de aminoácidos y las mutaciones correspondientes en el polipéptido transaminasa, que aumentan la actividad enzimática, la enantioselectividad, la estabilidad y la refractariedad a la inhibición por el producto en la conversión de 1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina.

En consecuencia, en un aspecto la presente divulgación se refiere a métodos de uso de polipéptidos que son capaces de convertir el sustrato compuesto (IA), 1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (IIA), (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina,

Esquema 1

en presencia de un dador de amino, donde la (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina se produce en exceso enantiomérico del compuesto (IIC), (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina.

En algunos aspectos de la divulgación, los polipéptidos utilizados en los métodos son transaminasas que no son de origen natural, genomanipuladas para mejorar las propiedades en comparación con el polipéptido V. fluvialis tipo silvestre de SEQ ID NO: 2, u otro polipéptido genomanipulado, por ejemplo SEQ ID NO: 4. Estos polipéptidos transaminasa genomanipulados adaptados para la conversión eficiente de la conversión de 1-(1H-5-fluoro-6-cloroindol-3-il)propan-2-ona en (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina tienen una o más diferencias de residuos en comparación con la secuencia de aminoácidos de SEQ ID NO: 2 o un polipéptido transaminasa genomanipulado de referencia, como el polipéptido de referencia de SEQ ID NO: 4. Las diferencias de residuos se asocian con mejoras en las propiedades enzimáticas, que incluyen actividad enzimática, estabilidad enzimática y resistencia a la inhibición por el producto amina.

En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación, presentan mayor actividad en la conversión del sustrato 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona en el producto (S)-1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, producto en exceso enantiomérico, en un tiempo definido con la misma cantidad de enzima en comparación con la enzima tipo silvestre o una enzima genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos alrededor de 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces, 20 veces, 30 veces, 40 veces, o 50 veces o más actividad en comparación con el polipéptido representado por SEQ ID NO: 4, en condiciones de reacción adecuadas.

En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación tiene mayor estabilidad a la temperatura y/o los solventes empleados en la reacción de conversión en comparación con la enzima tipo silvestre o genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces o más estabilidad en comparación con el polipéptido de SEQ ID NO: 4, en condiciones de reacción adecuadas.

En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación tienen mayor refractariedad o resistencia a la amina producto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en comparación con la enzima tipo silvestre o genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o más resistencia a la inhibición por 1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en particular (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en comparación con el polipéptido representado por SEQ ID NO: 4, en condiciones de reacción adecuadas, como se describe más detalladamente a continuación.

En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación son capaces de convertir el sustrato 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona en el producto (S)-1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico mayor de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5 o mayor respecto a (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en condiciones de reacción adecuadas.

En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación son capaces de convertir el compuesto (IA) en el compuesto (IIA) con mayor tolerancia por la presencia de sustrato en relación con el polipéptido de referencia de SEQ ID NO: 4, en condiciones de reacción adecuadas. Por lo tanto, en algunos aspectos, los polipéptidos transaminasa genomanipulados son capaces de convertir el sustrato compuesto (IIA) en el producto compuesto (IA) en presencia de una concentración de carga de sustrato de al menos alrededor de 1 g/L, alrededor de 5 g/L, alrededor de 10 g/L, alrededor de 20 g/L, alrededor de 30 g/L, alrededor de 40 g/L, alrededor de 50 g/L, alrededor de 70 g/L, alrededor de 100 g/L, alrededor de 125 g/L, alrededor de 150 g/L, alrededor de 175 g/L o alrededor de 200 g/L o más con un porcentaje de conversión de al menos alrededor de 50%, al menos alrededor de 60%, al menos alrededor de 70%, al menos alrededor de 80%, al menos alrededor de 90%, al menos alrededor de 95%, al menos alrededor de 98% o al menos alrededor de 99%, en un tiempo de reacción de alrededor de 72 h o menos, alrededor de 48 h o menos, alrededor de 36 h o menos, o alrededor de 24 h o menos, en condiciones de reacción adecuadas.

Las condiciones de reacción adecuadas en las cuales las propiedades mejoradas descritas antes de los polipéptidos genomanipulados llevan a cabo la conversión, se pueden determinar con respecto a concentraciones o cantidades de polipéptido, sustrato, cofactor, tampón, cosolvente, pH, y/o condiciones que incluyen temperatura y tiempo de reacción, como se describe más detalladamente más adelante y en los Ejemplos.

Los ejemplos de polipéptidos genomanipulados utilizados en la presente divulgación tienen asociadas con sus propiedades mejoradas para la conversión del compuesto (IA) en el compuesto (IIA) que incluyen una o más diferencias de residuos en comparación con SEQ ID NO: 2 en las posiciones de residuos siguientes: X9; X14; X18; X21; X26; X31; X33; X41; X45; X47; X57; X70; X86; X88; X107; X113; X132; X133; X146; X147; X148; X153; X163; X168; X173; X177; X203; X211; X233T; X235; X244; X250; X284; X294; X314; X315; X318; X323; X324; X324; X346; X383; X391; X395; X398; X400; X417; X419; X420; X423; X424; X427; X448; y X451. Las diferencias de aminoácidos específicas en cada una de estas posiciones que están asociadas con las propiedades mejoradas de los polipéptidos de ejemplo de las Tablas 2A y 2B incluyen: X9T; X14V; X18A; X21H; X26R; X31M; X31S; X33T; X41L; X45H; X47N; X57F; X57Y; X70A; X86D; X86Y; X88A; X88L; X107P; X113L; X113V; X132F; X133R; X146L; X147K; X148Q; X148R; X153S; X163F; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X177L; X203S; X211K; X233T; X235P; X244T; X250A; X284A; X294V; X314N; X315G; X318D; X323T; X324G; X324H; X346L; X383V; X391A; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X424A; X427Y; X448E; y X451D.

Las diferencias de residuos en comparación con la transaminasa genomanipulada representada por SEQ ID NO: 4 incluyen aquellas en las posiciones de residuos: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X113; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X420; X423; X424; X448; y X451. Las diferencias de aminoácidos específicas en esas posiciones incluyen: X14V; X26R; X31S; X33T; X41L; X47N; X57F; X57Y; X70A; X86D; X88A; X88L; X107P; X113L; X113V; X132F; X148Q; X148R; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X203S; X250A; X284A; X314N; X315G; X324H; X346L; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X448E; y X451D. Aunque las diferencias de residuos en comparación con SEQ ID NO: 4 también se producen en las posiciones de residuos X153 y X383, estas diferencias representan reversiones al residuo de aminoácido presente en la secuencia tipo silvestre de SEQ ID NO: 2, lo que indica que las interconversiones entre los aminoácidos S y V en la posición del residuo X153 y entre los aminoácidos A y V en la posición del residuo X383 no tienen efectos perjudiciales significativos sobre las propiedades de la enzima genomanipulada.

La información de estructura y función para los ejemplos de polipéptidos transaminasa que no son de origen natural (o genomanipulados) utilizados en el método de la presente divulgación se muestran más adelante en las Tablas 2A y 2B. Los identificadores de secuencia de número impar (es decir, SEQ ID NO) se refieren a la secuencia de nucleótidos que codifica la secuencia de aminoácidos provista por las SEQ ID NO de número par, y las secuencias se proporcionan en el archivo electrónico de Lista de secuencias que acompaña esta divulgación, que se incorpora por referencia en este documento. Las diferencias de residuos de aminoácidos se basan en la comparación con la secuencia de referencia de SEQ ID NO: 4, que es una transaminasa genomanipulada derivada del polipéptido w-VfT tipo silvestre que tiene las 24 diferencias de residuos de aminoácidos siguientes A9T; G18A; D21H; V31M; N45H; F86Y; A133R; R146L; W147K; V153S; K163F; V177L; R211K; P233T; A235P; P244T; M294V; P318D; A323T; S324G; A383V; T391A; C424A; F427Y con respecto a SEQ ID NO: 2. La actividad de cada polipéptido genomanipulado con respecto al polipéptido de referencia de SEQ ID NO: 4 se determinó como la conversión del sustrato cetona 1 -(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto amina compuesto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en un período de tiempo y una temperatura establecidos en un ensayo de alto rendimiento (HTP), que se usó como cribado primario. Los valores del ensayo HTP de la Tabla 2A se determinaron utilizando lisados celulares claros de E. coli. en el formato de placas de 96 pocillos de ~200 pL de volumen por pocillo, siguiendo las condiciones de reacción del ensayo indicadas en la Tabla y en los Ejemplos. En algunos casos, se usó un ensayo de polvo en matraz de agitación (SFP) y/o de procesamiento descendente del polvo (DSP) como un cribado secundario para evaluar las propiedades de las transaminasas genomanipuladas, cuyos resultados se proporcionan en la Tabla 2B. Las formas SFP y DSP proporcionan una preparación en polvo más purificada de los polipéptidos genomanipulados. Por ejemplo, la transaminasa genomanipulada en las preparaciones SFP es aproximadamente 30% de la proteína total mientras que las preparaciones DSP pueden contener las transaminasas genomanipuladas que son aproximadamente 80% de la proteína total.

Los niveles de actividad (es decir, "+" "++", etc.) se definen de la manera siguiente: "+" indica 1,2 veces o más actividad, en comparación con la de SEQ ID NO: 4 para el polipéptido transaminasa genomanipulado SEQ ID NO: 6 a 14, y 1,2 o más actividad, en comparación con la de SEQ ID NO: 8 para el polipéptido transaminasa genomanipulado SEQ ID NO: 16 a 154; y un "++" indica 5 veces o más actividad, en comparación con la de SEQ ID NO: 4 para los polipéptidos transaminasa genomanipulados SEQ ID NO: 6-14; y 5 veces o más actividad, en comparación con la de SEQ ID NO: 8 para los polipéptidos transaminasa genomanipulados SEQ ID NO: 16 a 154. Los datos de estabilidad se obtienen incluyendo las cantidades siguientes del producto (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en el ensayo y comparando la actividad con la de una enzima de referencia en las mismas condiciones: 14 g/L para el análisis de los polipéptidos transaminasa genomanipulados de SEQ ID NO 6 a 14, y 16 g/L para el análisis de los polipéptidos transaminasa genomanipulados SEQ ID NO 16 a 154. La evaluación de la estabilidad se hizo comparando las actividades a dos temperaturas diferentes, 55°C y 50°C.

Tabla 2A: Polipéptidos genomanipulados y mejoras enzimáticas relativas utilizando preparaciones HTP (SEQ ID 134 de acuerdo con la invención SEQ ID 1-133 135-154 solo como referencia

Tabla 2B: Polipéptidos genomanipulados y mejoras enzimáticas relativas utilizando preparaciones en polvo en matraz d - -

A partir de una inspección de los ejemplos de polipéptidos útiles en los métodos de la presente divulgación, las mejoras en las propiedades enzimáticas se asocian con diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X113; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X420; X423; X424; X448; y X451. Las diferencias de los residuos específicas en cada una de estas posiciones están asociadas con las propiedades mejoradas incluyen: X14V; X26R; X31S; X33T; X41L; X47N; X57F; X57Y; X70A; X86D; X88A; X88L; X107P; X113L; X113V; X132F; X148Q; X148R; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X203S; X250A; X284A; X314N; X315G; X324H; X346L; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X448E; y X451D.

En consecuencia, en algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado útil en los métodos de la presente divulgación capaz de convertir el sustrato Compuesto (IA), 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto Compuesto (IIA), (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de referencia SEQ ID NO: 2 y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; x 86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M.

En algunos aspectos, el polipéptido transaminasa genomanipulado útil en los métodos dados a conocer en la presente, capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de referencia SEQ ID NO: 4 y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, los polipéptidos transaminasa genomanipulados son capaces de llevar a cabo la conversión con las enantioselectividades descritas antes, por ejemplo, > 90% de ee.

En algunos aspectos, el polipéptido transaminasa útil en los métodos dados a conocer en la presente, capaz de convertir el sustrato Compuesto (IA) en producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad con una secuencia de referencia elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de referencia se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia de referencia SEQ ID NO: 4. En algunos aspectos, la secuencia de referencia SEQ ID NO: 8. En algunos aspectos, la secuencia de referencia SEQ ID NO: 134. En otro aspecto de la divulgación, la secuencia de referencia es SEQ ID NO: 146.

En algunos aspectos de la divulgación, el polipéptido transaminasa capaz de convertir el sustrato Compuesto (IA) en producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y que tiene una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de aminoácidos se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia de aminoácidos es SEQ ID NO: 4. En algunos aspectos, la secuencia de aminoácidos es SEQ ID NO: 8. En una realización, la secuencia de aminoácidos es SEQ ID NO: 134. En otro aspecto, la secuencia de aminoácidos es SEQ ID NO: 146.

En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con al menos 1,2 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos elegida entre: SEQ ID NO: 6, 8, 10, 12, 14, 16, 22, 24, 28, 30, 32, 48, 52, 56, 62, 64, 66, 68, 86, 88, 90, 92, 98, 100, 104, 106, 108, 110, 112, 114, 116, 118, 124, 126, 128, 132, 134, 136, 142, 144, 148, y 154.

En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con al menos 5 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos que tiene una o más diferencias de residuos elegidas entre: X14V, X26R; X33T; X88A/L; X163I/L; y X284A.

En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado útil en los métodos dados a conocer en la presente, es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (I IA) con al menos 5 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos elegida entre: SEQ ID NO: 6, 8, 10, 14, 16, 22, 24, 28, 30, 32, 48, 52, 56, 62, 64, 86, 88, 90, 92, 98, 100, 104, 106, 108, 110, 112, 114, 116, 118, 124, 126, 128, 132, 134, 136, 142, 144, 148, y 154.

En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o más refractariedad a la inhibición por 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en particular (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en comparación con el polipéptido representado por SEQ ID NO: 4 en la conversión del Compuesto (IA) en el Compuesto (IIA). Generalmente el aumento en la refractariedad o resistencia a la inhibición por el compuesto producto se puede medir en las condiciones del ensayo HTP en presencia de 14 g/L o 16 g/L de Compuesto (IIA), como se describe en las Tablas 2A y 2B y los Ejemplos. En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado que tiene al menos 1,2 veces o más refractariedad a la inhibición por 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina comprende una secuencia de aminoácidos que tiene al menos una o más diferencias de residuos en comparación con SEQ ID NO: 4 elegidas entre: X26R; X70A; X86D; X88A/L; X132F; X163L; X315G; X395P; X398L; y X419S.

En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado con propiedades mejoradas en la conversión del Compuesto (IA) en el Compuesto (IIA) tiene una secuencia de aminoácidos que comprende una secuencia elegida entre SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154.

En algunos aspectos de la divulgación, la transaminasa genomanipulada capaz de convertir el Compuesto (IA) en el Compuesto (IIA), en condiciones de reacción adecuadas, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad con una de las SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y las diferencias de residuos de aminoácidos en comparación con SEQ ID NO: 4 presentes en cualquiera de las SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, como se proporciona en las Tablas 2A and 2B.

En algunos aspectos de la divulgación, los polipéptidos genomanipulados pueden estar en diversas formas, por ejemplo, como una preparación aislada, como una enzima sustancialmente purificada, células enteras transformadas con uno o más genes que codifican la enzima, y/o como extractos celulares y/o como lisados de dichas células. Las enzimas se pueden liofilizar, secar por aspersión, precipitar o estar en forma de una pasta cruda, como se trata más adelante.

En algunos aspectos de la divulgación, los polipéptidos transaminasa pueden estar unidos sobre un sustrato físico. El polipéptido transaminasa puede estar unido covalente o no covalentemente sobre un sustrato físico de modo de retener su actividad, estereoselectividad, tolerancia al producto y estabilidad mejoradas, y/u otras propiedades mejoradas en relación con el péptido de referencia de SEQ ID NO: 4. En dichos aspectos, los polipéptidos inmovilizados pueden facilitar la conversión biocatalítica de los sustratos cetona adecuados, por ejemplo, el Compuesto (IA) o sus análogos estructurales, en el correspondiente producto amina, por ejemplo, el Compuesto (IIA) o sus correspondientes análogos estructurales, y una vez que la reacción se completa son fácilmente retenidos (por ejemplo, mediante perlas de retención sobre las que el polipéptido se inmoviliza) y después reutilizados o reciclados en reacciones subsiguientes. Dichos procesos de enzimas inmovilizadas permiten una mayor eficiencia y reducción de costos. Los métodos de inmovilización de enzimas son bien conocidos en el área. Diversos métodos para la conjugación con sustratos, por ejemplo, membranas, perlas, vidrio, etc. se describen en, entre otros, Hermanson, G.T., Bioconjugate Techniques, 2a edición, Academic Press; (2008), y Bioconjugation Protocols: Strategies and Methods, In Methods in Molecular Biology, C.M. Niemeyer ed., Humana Press (2004).

Polinucleótidos que codifican transaminasas genomanipuladas, vectores de expresión y células hospedadoras

En otro aspecto, la presente divulgación proporciona polinucleótidos que codifican los polipéptidos transaminasa genomanipulados descritos en este documento. Los polinucleótidos pueden estar unidos operativamente a una o más secuencias reguladoras heterólogas que controlan la expresión génica para crear un polinucleótido recombinante capaz de expresar el polipéptido. Los constructos de expresión que contienen un polinucleótido heterólogo que codifica la transaminasa genomanipulada se pueden introducir en células hospedadoras apropiadas para expresar el polipéptido transaminasa correspondiente.

Como será evidente para los técnicos con experiencia, la disponibilidad de una secuencia de proteína y el conocimiento de los codones correspondientes a los diversos aminoácidos, proporcionan una descripción de todos los polinucleótidos capaces de codificar los polipéptidos en cuestión. La degeneración del código genético, en la que los mismos aminoácidos son codificados por codones alternativos o sinónimos, permite que se produzca una cantidad extremadamente grande de ácidos nucleicos, todos los cuales codifican las enzimas transaminasa mejoradas. Por lo tanto, teniendo conocimiento de una secuencia de aminoácidos particular, los expertos en la materia podrían producir cualquier cantidad de ácidos nucleicos diferentes simplemente modificando la secuencia de uno o más codones de una manera que no cambie la secuencia de aminoácidos de la proteína. En este sentido, la presente divulgación contempla específicamente cada una y todas las posibles variaciones de polinucleótidos que podrían producirse codificando los polipéptidos descritos en este documento mediante selección de combinaciones basadas en las posibles elecciones de codones, y todas dichas variaciones deben ser consideradas específicamente divulgadas para cualquier polipéptido descrito en este documento, incluidas las secuencias de aminoácidos presentadas en las Tablas 2A y 2B, y dadas a conocer en la Lista de secuencias incorporada en este documento por referencia como SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154.

En diversos aspectos de la divulgación, los codones se eligen preferentemente para que se adapten a la célula hospedadora en la cual se produce la proteína. Por ejemplo, los codones preferidos utilizados en bacterias se usan para expresar el gen en las bacterias; los codones preferidos utilizados en levaduras se usan para la expresión en levaduras; y los codones preferidos utilizados en mamíferos se usan para la expresión en células de mamífero. En algunos aspectos, no todos los codones necesitan ser reemplazados para optimizar el uso de codones de las transaminasas dado que la secuencia natural comprenderá los codones preferidos y porque el uso de codones preferidos puede no ser necesario para todos los residuos de aminoácidos. Consecuentemente, los polinucleótidos con codones optimizados que codifican las enzimas transaminasa pueden contener codones preferidos en alrededor de 40%, 50%, 60%, 70%, 80% o más de 90% de las posiciones de los codones de la región de codificación de longitud completa.

Un polinucleótido aislado que codifica un polipéptido transaminasa mejorado puede ser manipulado de diversas maneras para proporcionar la expresión del polipéptido. En algunas realizaciones, los polinucleótidos que codifican los polipéptidos se pueden proporcionar como vectores de expresión donde están presentes una o más secuencias de control para regular la expresión de los polinucleótidos y/o los polipéptidos. La manipulación del polinucleótido aislado antes de su inserción en un vector puede ser deseable o necesaria dependiendo del vector de expresión. Las técnicas para modificar polinucleótidos y secuencias de ácido nucleico que utilizan métodos de recombinación del ADN son bien conocidas en el área. Se proporciona una guía en Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3a Ed., Cold Spring Harbor Laboratory Press; y Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, actualizaciones hasta 2006.

En aspectos de la divulgación de este documento, los polipéptidos mejorados y los correspondientes polinucleótidos se pueden obtener empleando métodos utilizados por los expertos en la materia. La secuencia del polinucleótido progenitor que codifica el polipéptido tipo silvestre de Vibrio fluvialis se describe en Shin et al., 2003, Appl. Microbiol. Biotechnol. 61(5-6):463-471, y los métodos para generar polipéptidos transaminasa genomanipulados con mejores propiedades de estabilidad y reconocimiento del sustrato se dan a conocer en las publicaciones de solicitudes de patentes WO2010081053 y US20100209981.

Cuando la secuencia del polipéptido genomanipulado es conocida, los polinucleótidos que codifican la enzima se pueden preparar mediante métodos estándar en fase sólida de acuerdo con métodos de síntesis conocidos. En algunas realizaciones, se pueden sintetizar individualmente fragmentos de hasta alrededor de 100 bases, y luego unir (por ejemplo mediante métodos de ligación enzimática o química, o métodos mediados por polimerasa) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleótidos y oligonucleótidos de la invención se pueden preparar por síntesis química, por ejemplo, usando el método clásico de fosforamidita descrito por Beaucage et al., 1981, Tet Lett 22:1859-69, o el método descrito por Matthes et al., 1984, EMBO J. 3:801-05, por ejemplo, como se practica habitualmente en métodos de síntesis automatizados. De acuerdo con el método de la fosforamidita, los oligonucleótidos se sintetizan, por ejemplo, en un sintetizador de ADN automático, se purifican, se aparean, se ligan y se clonan en los vectores apropiados. Además, esencialmente cualquier ácido nucleico se puede obtener de cualquiera de una diversidad de fuentes comerciales.

En consecuencia, en algunos aspectos de la divulgación, un método para preparar los polipéptidos transaminasa genomanipulados puede comprender: (a) sintetizar un polinucleótido que codifica un polipéptido que comprende la secuencia de aminoácidos elegidas entre SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154 y que tiene una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, en donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M.; y (b) expresar el polipéptido transaminasa codificado por el polinucleótido.

Se puede medir la propiedad mejorada deseada de la transaminasa genomanipulada expresada, por ejemplo, actividad, enantioselectividad, estabilidad y tolerancia al producto, en la conversión del compuesto (IA) en el compuesto (IIA), mediante cualquiera de las condiciones de ensayo descritas en este documento.

En algunos aspectos de la divulgación, cualquiera de las enzimas transaminasa genomanipuladas expresadas en una célula hospedadora, puede ser recuperada de las células y/o del medio de cultivo empleando una o más de las técnicas bien conocidas para la purificación de proteínas, que incluyen, entre otras, tratamiento con lisozima, ultrasonido, filtración, salting-out (precipitación salina), ultracentrifugación y cromatografía. Soluciones comerciales adecuadas para la lisis y la extracción de alta eficiencia de proteínas de bacterias, como E. coli, se pueden adquirir con el nombre comercial CelLytic B™ a Sigma-Aldrich de St. Louis MO.

Las técnicas cromatográficas para el aislamiento del polipéptido transaminasa incluyen, entre otras, cromatografía líquida de alto rendimiento de fase inversa, cromatografía de intercambio iónico, electroforesis en gel y cromatografía por afinidad. Las condiciones para purificar una enzima particular dependerán, en parte, de factores como carga neta, hidrofobicidad, hidrofilicidad, peso molecular, forma molecular, etc., y serán evidentes para los expertos en la materia.

En algunos aspectos, se pueden usar las técnicas de afinidad para aislar las enzimas transaminasa mejoradas. Para

la purificación por cromatografía de afinidad, se puede utilizar cualquier anticuerpo que se una específicamente al polipéptido transaminasa. Para la producción de anticuerpos, se pueden inmunizar diversos animales hospedadores, incluidos pero no exclusivamente, conejos, ratones, ratas, etc., mediante inyección de un polipéptido transaminasa o

un fragmento de este. El polipéptido transaminasa o sus fragmentos pueden estar unidos a un portador adecuado, como BSA, por medio de un grupo funcional de cadena lateral o conectores unidos a un grupo funcional de cadena

lateral. Se pueden utilizar diversos adyuvantes para aumentar la respuesta inmunitaria, dependiendo de las especies hospedadoras, incluidos pero no exclusivamente, el adyuvante de Freund (completo e incompleto), geles minerales

como hidróxido de aluminio, surfactantes como lisolecitina, polioles plurónicos, polianiones, péptidos, emulsiones oleosas, hemocianina de lapa californiana, dinitrofenol y adyuvantes humanos potencialmente útiles como BCG (bacilo

de Calmette Guerin) y Corynebacterium parvum.

Métodos de uso de las enzimas transaminasa genomanipuladas

En otro aspecto, las transaminasas descritas en este documento se pueden usar en un proceso para llevar a cabo reacciones con transaminasa en las que un grupo amino de un dador de amino se transfiere a un aceptor de amino, por ejemplo, un sustrato cetona, para producir una amina. El uso de un aceptor cetona proquiral puede resultar en la producción de una amina quiral en exceso enantiomérico. En general, el proceso para realizar la reacción de transaminación comprende poner en contacto o incubar un dador de amino y un aceptor de amino con un polipéptido transaminasa genomanipulado de la divulgación, en condiciones de reacción adecuadas para convertir el aceptor de

amino en una amina.

En algunos aspectos de la divulgación, se pueden usar las transaminasas en la conversión del sustrato compuesto de

fórmula (I) en el producto compuesto de fórmula (II). En consecuencia, en algunos aspectos, un proceso para preparar el compuesto de fórmula (II) en exceso enantiomérico comprende poner en contacto el compuesto de fórmula (I) en presencia de un dador de amino, en condiciones de reacción adecuadas, con un polipéptido transaminasa genomanipulado descrito en este documento. En algunos aspectos de la divulgación del proceso, el compuesto de

fórmula (II) se puede formar en al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de exceso enantiomérico.

Para los procesos precedentes, se puede utilizar cualquiera de las transaminasas genomanipuladas descritas en este documento. A modo de ejemplo y sin limitación, en algunas realizaciones, el proceso puede utilizar un polipéptido transaminasa genomanipulado que comprenda una secuencia de aminoácidos que tenga al menos 80%, 85%, 86%,

87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad con una secuencia de referencia elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46,

48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y

154, y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas

entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284;

X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, en donde las diferencias de residuos

en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y;

X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de referencia se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia

de referencia es SEQ ID NO: 4. En algunos aspectos, la secuencia de referencia es SEQ ID NO: 8. En una realización, la secuencia de referencia es SEQ ID NO: 134. En algunos aspectos, la secuencia de referencia es SEQ ID NO: 146.

En algunos aspectos de la divulgación, los ejemplos de transaminasas capaces de llevar a cabo los procesos de este documento pueden ser un polipéptido que comprenda una secuencia de aminoácidos elegida entre SEQ ID NO: 6, 8,

10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154. Se proporciona una guía sobre la elección

y el uso de las transaminasas genomanipulada en las descripciones de este documento, por ejemplo en la Tabla 2 y

los Ejemplos.

En las realizaciones de este documento e ilustradas en los Ejemplos, diversos intervalos de condiciones de reacción adecuadas que se pueden usar en los procesos, incluyen pero no exclusivamente, intervalos de dador de amino, pH, temperatura, tampón, sistema solvente, carga de sustrato, carga de polipéptido, carga de cofactor, presión y tiempo

de reacción. Otras condiciones de reacción adecuadas para llevar a cabo los procesos para la conversión biocatalítica

de compuestos sustrato en compuestos producto utilizando un polipéptido transaminasa genomanipulado descrito en

este documento, se pueden optimizar fácilmente en vista de la guía provista en este documento por la experimentación

de rutina que incluye, pero no exclusivamente, poner en contacto el polipéptido transaminasa genomanipulado y el compuesto sustrato en condiciones de reacción experimentales de concentración, pH, temperatura, condiciones del solvente, y detectar el compuesto producto.

En las realizaciones descritas en este documento, el polipéptido transaminasa usa un dador de amino para formar los compuestos producto. En algunas realizaciones, el dador de amino en la condición de reacción se puede elegir entre isopropilamina (también denominada en este documento como ''IPM''), putrescina, L-lisina, a-fenetilamina, D-alanina, L-alanina o D,L-alanina o D,L-ornitina. En algunas realizaciones, el dador de amino se elige del grupo que consiste en IPM, putrescina, L-lisina, D- o L- alanina. En algunas realizaciones, el dador de amino es IPM. En algunas realizaciones, las condiciones de reacción adecuadas comprenden el dador de amino, en particular IPM, presente en una concentración entre al menos alrededor de 0,1 y alrededor de 3,0 M, 0,2 y alrededor de 2,5 M, alrededor de 0,5 y alrededor de 2 M o alrededor de 1 y alrededor de 2 M. En algunas realizaciones, el dador de amino está presente en una concentración de alrededor de 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 1; 1,5; 2; 2,5 o 3 M. Se pueden usar mayores concentraciones de dador de amino, por ejemplo, IPM, para cambiar el equilibrio hacia la formación del producto amina.

Las condiciones de reacción adecuadas utilizando polipéptidos transaminasa genomanipulados también comprenden generalmente un cofactor. Los cofactores útiles en los procesos que usan las enzimas transaminasa genomanipuladas incluyen, pero no exclusivamente, piridoxal-5'-fosfato (también conocido como piridoxal-fosfato, PLP, P5P), piridoxina (PN), piridoxal (PL), piridoxamina (PM), y sus contrapartes fosforiladas; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP). En algunas realizaciones, el cofactor PLP está presente naturalmente en el extracto celular y no necesita ser complementado. En algunas realizaciones de los métodos, las condiciones de reacción adecuadas comprenden el cofactor agregado a la mezcla de reacción de la enzima, por ejemplo, cuando se usa la enzima transaminasa parcialmente purificada o purificada. En algunas realizaciones, las condiciones de reacción adecuadas pueden comprender la presencia de un cofactor elegido entre PLP, PN, PL, PM, PNP y PMP, a una concentración entre alrededor de 0,1 g/L y alrededor de 10 g/L, alrededor de 0,2 g/L y alrededor de 5 g/L, alrededor de 0,5 g/L y alrededor de 2,5 g/L. En algunas realizaciones, las condiciones de reacción comprenden una concentración de PLP de alrededor de 0,1 g/L o menos, 0,2 g/L o menos, 0,5 g/L o menos, 1 g/L o menos, 2,5 g/L o menos, 5 g/L o menos, o 10 g/L o menos. En algunas realizaciones, el cofactor se puede agregar al comienzo de la reacción y/o se puede agregar más cofactor durante la reacción.

El compuesto sustrato en las mezclas de reacción puede variar, teniendo en consideración, por ejemplo, la cantidad deseada del compuesto producto, el efecto de la concentración de sustrato sobre la actividad de la enzima, la estabilidad de la enzima en las condiciones de reacción y el porcentaje de conversión del sustrato en producto. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un compuesto sustrato con una carga de al menos entre alrededor de 0,5 y alrededor de 200 g/L, 1 y alrededor de 200 g/L, 5 y alrededor de 150 g/L, alrededor de 10 y alrededor de 100 g/L, 20 y alrededor de 100 g/L o alrededor de 50 y alrededor de 100 g/L. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un compuesto sustrato con una carga de al menos alrededor de 0,5 g/L, al menos alrededor de 1 g/L, al menos alrededor de 5 g/L, al menos alrededor de 10 g/L, al menos alrededor de 15 g/L, al menos alrededor de 20 g/L, al menos alrededor de 30 g/L, al menos alrededor de 50 g/L, al menos alrededor de 75 g/L, al menos alrededor de 100 g/L, al menos alrededor de 150 g/L o al menos alrededor de 200 g/L, o incluso mayor.

La actividad y/o estereoselectividad mejoradas de los polipéptidos transaminasa genomanipulados dados a conocer en este documento proporcionan procesos en los que se puede lograr un mayor porcentaje de conversión con menores concentraciones del polipéptido genomanipulado. En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una concentración de polipéptido genomanipulado entre alrededor de 0,01 y alrededor de 50 g/L; alrededor de 0,05 y alrededor de 50 g/L; alrededor de 0,1 y alrededor de 40 g/L; alrededor de 1 y alrededor de 40 g/L; alrededor de 2 y alrededor de 40 g/L; alrededor de 5 y alrededor de 40 g/L; alrededor de 5 y alrededor de 30 g/L; alrededor de 0,1 y alrededor de 10 g/L; alrededor de 0,5 y alrededor de 10 g/L; alrededor de 1 y alrededor de 10 g/L; alrededor de 0,1 y alrededor de 5 g/L; alrededor de 0,5 y alrededor de 5 g/L; o alrededor de 0,1 y alrededor de 2 g/L. En algunas realizaciones, el polipéptido transaminasa está en una concentración de alrededor de 0,01; 0,05; 0,1; 0,2; 0,5; 1; 2; 5; 10; 15; 20; 25; 30; 35; 40 o 50 g/L.

En el transcurso de las reacciones de transaminación, el pH de la mezcla de reacción puede cambiar. El pH de la mezcla de reacción se puede mantener en el pH deseado o dentro de un intervalo de pH deseado. Esto se puede hacer mediante la adición de un ácido o una base, antes y/o durante el transcurso de la reacción. Alternativamente, el pH se puede controlar utilizando un tampón. En consecuencia, en algunas realizaciones, la condición de la reacción comprende un tampón. Los tampones adecuados para mantener los intervalos de pH deseados son conocidos en el área e incluyen, a modo de ejemplo y sin limitación, tampones de borato, carbonato, fosfato, trietanolamina, y similares. En algunas realizaciones, el tampón es de borato. En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una solución tampón de trietanolamina, en la que la concentración de trietanolamina es entre alrededor de 0,01 y alrededor de 0,4 M, 0,05 y alrededor de 0,4 M, 0,1 y alrededor de 0,3 M o alrededor de 0,1 y alrededor de 0,2 M. En algunas realizaciones, las condiciones de reacción comprenden una concentración de trietanolamina de alrededor de 0,01; 0,02; 0,03; 0,04; 0,05; 0,07; 0,1; 0,12; 0,14; 0,16; 0,18; 0,2; 0,3 o 0,4 M. En algunas realizaciones las condiciones de reacción comprenden agua como un solvente adecuado sin tampón presente.

En las realizaciones del proceso, las condiciones de reacción pueden comprender un pH adecuado. El pH deseado o el intervalo de pH deseado se pueden mantener mediante el uso de un ácido o una base, un tampón apropiado, o una combinación de adición de tampón y de ácido o base. El pH de la mezcla de reacción se puede controlar antes y/o durante el transcurso de la reacción. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un pH de la solución que comprende un pH entre alrededor de 6 y alrededor de 12, un pH entre alrededor de 6 y alrededor de 10, un pH entre alrededor de 6 y alrededor de 8, un pH entre alrededor de 7 y alrededor de 10, un pH entre alrededor de 7 y alrededor de 9 o un pH entre alrededor de 7 y alrededor de 8. En algunas realizaciones, las condiciones de reacción comprenden un pH de la solución de alrededor de 6; 6,5; 7; 7,5; 8; 8,5; 9; 9,5; 10; 10,5; 11; 11,5 o 12.

En las realizaciones de los procesos de este documento, se puede usar una temperatura adecuada para las condiciones de reacción, por ejemplo, teniendo en consideración el aumento en la velocidad de reacción a mayores temperaturas y la actividad de la enzima durante el período de tiempo de la reacción. Por ejemplo, los polipéptidos genomanipulados de la presente divulgación tienen mayor estabilidad en relación con el polipéptido transaminasa de origen natural por ejemplo, el polipéptido tipo silvestre de SEQ ID NO: 2, lo que permite que los polipéptidos genomanipulados se usen a mayores temperaturas para aumentar las velocidades de conversión y mejorar las características de solubilidad del sustrato para la reacción. En consecuencia, en algunas realizaciones, las condiciones de reacción adecuadas comprenden una temperatura entre alrededor de 10°C y alrededor de 70°C, alrededor de 10°C y alrededor de 65°C, alrededor de 15°C y alrededor de 60°C, alrededor de 20°C y alrededor de 60°C, alrededor de 20°C y alrededor de 55°C, alrededor de 30°C y alrededor de 55°C o alrededor de 40°C y alrededor de 50°C. En algunas realizaciones, las condiciones de reacción adecuadas comprenden una temperatura de alrededor de 10°C, 15°C, 20°C, 25°C, 30°C, 35°C, 40°C, 45°C, 50°C, 55°C, 60°C, 65°C, o 70°C. En algunas realizaciones, la temperatura durante la reacción enzimática se puede mantener a una temperatura durante todo el transcurso de la reacción. En algunas realizaciones, la temperatura durante la reacción enzimática se puede ajustar en un perfil de temperatura durante el curso de la reacción.

Los procesos de la divulgación se llevan a cabo generalmente en un solvente. Los solventes adecuados incluyen agua, soluciones tampón acuosas, solventes orgánicos, solventes poliméricos y/o sistemas cosolventes, que generalmente comprenden solventes acuosos, solventes orgánicos y/o solventes poliméricos. El solvente acuoso (agua o sistema cosolvente acuoso) puede estar tamponado o sin tamponar. En algunas realizaciones, los procesos que utilizan los polipéptidos transaminasa genomanipulados se llevan a cabo generalmente en un sistema cosolvente acuoso que comprende un solvente orgánico (por ejemplo, etanol, isopropanol (IPA), dimetilsulfóxido (DMSO), acetato de etilo, acetato de butilo, 1-octanol, heptano, octano, metil t-butil éter (MTBE), tolueno, y similares), solvente iónicos o polares (por ejemplo, tetrafluoroborato de 1 -etil-4-metilimidazolio, tetrafluoroborato de 1 -butil-3-metilimidazolio, hexafluorofosfato de 1 -butil-3-metilimidazolio, glicerol, polietilenglicol, y similares). En algunas realizaciones, el cosolvente puede ser un solvente polar, como un poliol, dimetilsulfóxido, DMSO, o un alcohol inferior. El componente cosolvente no acuoso de un sistema cosolvente acuoso puede ser miscible con el componente acuoso, proporcionando una única fase líquida, o puede ser parcialmente miscible o inmiscible con el componente acuoso, proporcionando dos fases líquidas. Los ejemplos de sistemas cosolventes acuosos pueden comprender agua y uno o más cosolventes elegidos entre un solvente orgánico, un solvente polar y un solvente poliol. En general, el componente cosolvente de un sistema cosolvente acuoso se elige de modo que no inactive de manera adversa a la enzima transaminasa en las condiciones de reacción. Los sistemas cosolventes apropiados se pueden identificar fácilmente midiendo la actividad enzimática de la enzima transaminasa genomanipulada especificada con un sustrato definido de interés, en el sistema solvente candidato, utilizando un ensayo de actividad enzimática como los descritos en este documento.

En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso, donde el cosolvente comprende un solvente poliol, particularmente glicoles. Los ejemplos de solventes polioles adecuados incluyen, a modo de ejemplo y no limitante, polietilenglicol, polietilenglicol metil éter, dietilenglicol dimetil éter, trietilenglicol dimetil éter y propilenglicol. En algunas realizaciones, el cosolvente acuoso comprende polietilenglicol, que está disponible en diferentes pesos moleculares. Son particularmente útiles los glicoles de peso molecular más bajo como PEG 200 a PEG 600. En consecuencia, en algunas realizaciones, el cosolvente acuoso comprende PEG 200 entre alrededor de 1% y alrededor 40% v/v; alrededor de 1% y alrededor de 40% v/v; alrededor de 2% y alrededor de 40% v/v; alrededor de 5% y alrededor de 40% v/v; 2% y alrededor de 30% v/v; 5% y alrededor de 30% v/v; 1 y alrededor de 20% v/v; alrededor de 2% y alrededor de 20% v/v; alrededor de 5% y alrededor de 20% v/v; alrededor de 1 % y alrededor de 10% v/v; alrededor de 2% y alrededor de 10% v/v. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un cosolvente acuoso que comprende PEG 200 en alrededor de 1 %, 2%, 5%, 10%, 15%, 20%; 25%; 30%; 35%; 35% o alrededor de 40% v/v.

En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso, donde el cosolvente comprende DMSO entre alrededor de 1% y alrededor de 80% (v/v), alrededor de 1 y alrededor de 70% (v/v), alrededor de 2% y alrededor de 60% (v/v), alrededor de 5% y alrededor de 40% (v/v), 10% y alrededor de 40% (v/v), 10% y alrededor de 30% (v/v), o alrededor de 10% y alrededor de 20% (v/v). En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso que comprende DMSO en al menos alrededor de 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, o 80% (v/v).

Las cantidades de reactivos utilizadas en la reacción de transaminación variarán generalmente dependiendo de las cantidades de producto deseadas, y concomitantemente la cantidad de sustrato transaminasa empleada. Los expertos en la materia entenderán fácilmente como variar estas cantidades para adaptarlas al nivel deseado de productividad y escala de producción.

En algunas realizaciones, el orden de adición de los reactivos no es fundamental. Los reactivos se pueden agregar juntos al mismo tiempo a un solvente (por ejemplo, solvente monofásico, sistema cosolvente acuoso bifásico, y similares), o alternativamente, algunos de los reactivos se pueden agregar por separado y algunos juntos, en diferentes momentos. Por ejemplo, el cofactor, la transaminasa y el sustrato de la transaminasa se pueden agregar al solvente primero.

Los reactivos sólidos (por ejemplo, enzima, sales, etc.) se pueden proporcionar a la reacción de diversas formas, que incluyen polvo (por ejemplo liofilizado, secado por aspersión, y similares), solución, emulsión, suspensión, y similares. Los reactivos se pueden liofilizar o secar por aspersión fácilmente, empleando métodos y equipos conocidos por los expertos en la materia. Por ejemplo, la solución de proteína se puede congelar a -80°C en pequeñas alícuotas, después agregar a la cámara de liofilización previamente enfriada, seguido de la aplicación de vacío.

Para una mayor eficiencia de mezcla cuando se usa un sistema cosolvente acuoso, la transaminasa y el cofactor se pueden agregar y mezclar primero en la fase acuosa. Después se puede agregar la fase orgánica y mezclar allí, seguido de la adición del sustrato de la transaminasa. Alternativamente, el sustrato de la transaminasa se puede premezclar en la fase orgánica, antes de la adición a la fase acuosa.

La reacción de transaminación se deja proceder generalmente hasta que la conversión posterior del sustrato cetona en el producto amina no cambia significativamente con el tiempo de reacción, (por ejemplo, menos de 10% de sustrato es convertido o menos de 5% de sustrato es convertido). En algunas realizaciones, la reacción se deja proceder hasta que haya conversión completa o casi completa del sustrato cetona en el producto amina. La transformación de sustrato en producto se puede controlar empleando métodos conocidos para detectar sustrato y/o producto. Los métodos adecuados incluyen cromatografía de gases, HPLC, y similares. Los rendimientos de la conversión del producto amina quiral generado en la mezcla de reacción son generalmente mayores de alrededor de 50%, pueden incluso ser mayores de alrededor de 60%, pueden incluso ser mayores de alrededor de 70%, pueden incluso ser mayores de alrededor de 80%, pueden incluso ser mayores de 90% y a menudo son mayores de alrededor de 97%. En algunas realizaciones, los métodos para preparar compuestos de fórmula (II) que emplean un polipéptido transaminasa genomanipulado, en condiciones de reacción adecuadas, resultan en la al menos alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de conversión de sustrato cetona, por ejemplo, compuesto de fórmula (I), en el producto compuesto amina, por ejemplo, el compuesto de fórmula (II) en alrededor de 48 h o menos, en alrededor de 36 h o menos, en alrededor de 24 h o menos, o incluso en menos tiempo.

En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una carga de sustrato, de compuestos sustrato, de al menos alrededor de 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, o más, y donde el método da como resultado al menos alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de conversión del compuesto sustrato en el compuesto producto en alrededor de 48 h o menos, en alrededor de 36 h o menos, o en alrededor de 24 h o menos.

Los polipéptidos transaminasa genomanipulados de la presente divulgación cuando se usan en el proceso en condiciones de reacción adecuadas dan como resultado un exceso enantiomérico de la amina quiral en al menos 97%, 98, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, o 99,9%. de e.e.

En otra realización de los métodos para convertir el compuesto sustrato en el compuesto amina producto utilizando los polipéptidos transaminasa genomanipulados, las condiciones de reacción adecuadas comprenden una carga de sustrato inicial en la solución de reacción la cual después se pone en contacto con el polipéptido. Posteriormente esta solución de reacción es complementada con más compuesto sustrato como una adición continua en el tiempo a una velocidad de al menos alrededor de 1 g/L/h, al menos alrededor de 2 g/L/h, al menos alrededor de 4 g/L/h, al menos alrededor de 6 g/L/h, o mayor. Por lo tanto, de acuerdo con estas condiciones de reacción adecuadas el polipéptido se agrega a una solución que tiene una carga inicial de sustrato de al menos alrededor de 20 g/L, 30 g/L o 40 g/L. Esta adición de polipéptido es seguida de la adición continua de más sustrato a la solución a una velocidad de alrededor de 2 g/L/h, 4 g/L/h o 6 g/L/h hasta que se alcanza una carga final de sustrato mucho mayor de al menos alrededor de 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, 150 g/L, 200 g/L o más. En consecuencia, en algunas realizaciones del método, las condiciones de reacción adecuadas comprenden la adición del polipéptido a una solución que tiene una carga inicial de sustrato de al menos alrededor de 20 g/L, 30 g/L o 40 g/L, seguido de la adición de más sustrato a la solución a una velocidad de alrededor de 2 g/L/h, 4 g/L/h o 6 g/L/h hasta que se alcanza una carga final de sustrato de al menos alrededor de 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L o más. Esta condición de reacción de complementación de sustrato permite que se alcancen cargas de sustrato mayores mientras se mantienen altas tasas de conversión del sustrato cetona en el producto amina al menos de alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mayores. En algunas realizaciones de este método, el sustrato adicional agregado está en una solución que contiene isopropilamina o acetato de isopropilamina en una concentración de al menos alrededor de 0,5 M, al menos alrededor de 1,0 M, al menos alrededor de 2,5 M, al menos alrededor de 5,0 M, al menos alrededor de 7,5 M, al menos alrededor de 10,0 M.

En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 5 g/L y 200 g/L; (b) alrededor de 0,1 a 50 g/L de polipéptido transaminasa; (c) isopropilamina (IPM) alrededor de 0,1 a 4 M; (d) alrededor de 0,1 a 10 g/L de cofactor piridoxal fosfato (PLP); (e) pH de alrededor de 6 a 9; y (f) temperatura de alrededor de 30 a 60°C.

En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 5 y alrededor de 20 g/L; (b) alrededor de 0,05 a 2 g/L de polipéptido transaminasa; (c) alrededor de 1 a 10% v/v de PEG 200; (d) isopropilamina (IPM) alrededor de 1 a 2 M; (e) alrededor de 0,1 a 1 g/L de cofactor piridoxal fosfato (PLP); (f) trietanolamina (TEA) entre alrededor de 0,1 y alrededor de 0,5 M; (g) pH de alrededor de 6 a 8; y (h) temperatura de alrededor de 45 a 55°C.

En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 25 y alrededor de 100 g/L; (b) alrededor de 0,5 a 10 g/L de polipéptido transaminasa; (c) alrededor de 1 a 10% v/v de PEG 200; (d) isopropilamina (IPM) alrededor de 1 a 2 M; (e) alrededor de 0,1 a 1 g/L de cofactor piridoxal fosfato (PLP); (f) trietanolamina entre alrededor de 0,1 y alrededor de 0,5 M; (g) pH de alrededor de 6 a 8; y (h) temperatura de alrededor de 45 a 55°C.

En algunas realizaciones, se usan componentes de reacción adicionales o se llevan a cabo técnicas adicionales para complementar las condiciones de reacción. Estas pueden incluir tomar medidas para estabilizar o prevenir la inactivación de la enzima, reducir la inhibición por el producto, cambiar el equilibrio de reacción para la formación del producto amina.

En consecuencia, en algunas realizaciones del proceso para preparar una amina, tal como una amina quiral, se pueden agregar cantidades adicionales del aceptor de amino (hasta la saturación) y/o el aceptor de amino (cetona) formado se puede extraer continuamente de la mezcla de reacción. Por ejemplo, se puede usar un puente de solvente o un sistema cosolvente de dos fases para desplazar el producto amina a una solución de extracción, y de esa manera reducir la inhibición por el producto amina y también cambiar el equilibrio hacia la formación del producto (véase, por ejemplo, Yun y Kim, 2008, Biosci. Biotechnol. Biochem. 72(11):3030-3033).

En algunas realizaciones de los procesos, las condiciones de reacción adecuadas comprenden la presencia del cofactor reducido, nicotinamida adenina dinucleótido (NADH), que puede actuar para limitar la inactivación de la enzima transaminasa (véase, por ejemplo, van Ophem et al., 1998, Biochemistry 37(9):2879-88). En dichas realizaciones en las que está presente NADH, se puede usar un sistema de regeneración del cofactor, como glucosa deshidrogenasa (GDH) y glucosa o formiato deshidrogenasa y formiato, para regenerar el NADH en el medio de reacción.

En algunas realizaciones, el proceso puede comprender además la eliminación del subproducto carbonilo formado a partir del dador de grupo amino cuando el grupo amino se transfiere al aceptor del grupo amino. Dicha eliminación in situ puede reducir la velocidad de la reacción inversa de modo que domine la reacción hacia adelante y entonces más sustrato se convierta en producto. La eliminación del subproducto carbonilo se puede llevar a cabo de varias maneras. Cuando el dador del grupo amino es un aminoácido, como alanina, el subproducto carbonilo, un ceto ácido, se puede eliminar por reacción con un peróxido (véase, por ejemplo, US 2008/0213845).

Los peróxidos que se pueden usar incluyen, entre otros, peróxido de hidrógeno; peroxiácidos (perácidos) como ácido peracético (CH3CO3H), ácido trifluoroperacético y ácido metacloroperoxibenzoico; peróxidos orgánicos como t-butil peróxido ((CH3)3COOH), u otros oxidantes selectivos como perrutenato de tetrapropilamonio, MnO2, KMnO4, tetróxido de rutenio y compuestos relacionados. Alternativamente, la eliminación del piruvato se puede lograr mediante su reducción a lactato empleando lactato deshidrogenasa para cambiar el equilibrio a la amina producto (véase, por ejemplo Koszelewski et al., 2008, Adv. Syn. Catal. 350: 2761-2766). La eliminación del piruvato también se puede lograr mediante su descarboxilación empleando piruvato descarboxilasa (véase, por ejemplo, Hohne et al., 2008, Chem BioChem 9: 363-365) o acetolactato sintasa (véase, Yun y Kim, supra).

Alternativamente, en realizaciones en las que se usa un aminoácido como dador del grupo amino, el subproducto carbonilo del ceto ácido puede ser reciclado en el aminoácido mediante reacción con amoníaco y NADH utilizando una enzima deshidrogenasa apropiada, por ejemplo aminoácido deshidrogenasa, en presencia de un dador de amina, como amoníaco, reponiendo así el grupo dador de amino.

En algunas realizaciones, en las que la elección del dador de amino resulta en un subproducto carbonilo que tiene la presión de vapor superior a la del agua (por ejemplo, un coproducto con bajo punto de ebullición como un compuesto carbonilo orgánico volátil), el subproducto carbonilo se puede eliminar asperjando la solución de reacción con un gas no reactivo o aplicando vacío para disminuir la presión de la reacción y eliminando el subproducto carbonilo presente en la fase gaseosa. Un gas no reactivo es cualquier gas que no reacciona con los componentes de la reacción. Diversos gases no reactivos incluyen nitrógeno y gases nobles (por ejemplo, gases inertes). En algunas realizaciones, el gas no reactivo es gas de nitrógeno. En algunas realizaciones, el dador de amino utilizado en el proceso es isopropilamina (IPM), que forma el subproducto carbonilo acetona, después de la transferencia del grupo amino al grupo aceptor de amino. La acetona se puede eliminar mediante aspersión con gas de nitrógeno o aplicando un vacío a la solución de reacción y eliminando la acetona de la fase gaseosa mediante una trampa de acetona, como un condensador u otra trampa fría. Alternativamente, la acetona se puede eliminar por reducción a isopropanol utilizando una transaminasa.

En algunas realizaciones de los procesos anteriores en las que se elimina el subproducto carbonilo, el grupo dador de amino correspondiente se puede agregar durante la reacción de transaminación para reponer el grupo dador de amino y/o mantener el pH de la reacción. Reponer el grupo dador de amino también cambia el equilibrio hacia la formación de producto, aumentando así la conversión de sustrato en producto. Por lo tanto, en algunas realizaciones en las que el grupo dador de amino es isopropilamina y el producto acetona se elimina in situ, se puede agregar isopropilamina a la solución para reponer el grupo dador de amino perdido durante la eliminación de acetona y para mantener el pH de la reacción (por ejemplo en alrededor de 8,5).

En otras realizaciones, cualquiera de los procesos descritos antes para la conversión del compuesto sustrato en el compuesto producto puede comprender además uno o más de los pasos seleccionados entre: extracción; aislamiento; purificación; y cristalización del compuesto producto. Los métodos, las técnicas y los protocolos para extraer, aislar, purificar y/o cristalizar el producto amina de mezclas de reacción biocatalíticas producidas por los métodos dados a conocer antes, son conocidos por los técnicos con experiencia y/o accesibles mediante experimentación de rutina. Además, se proporcionan métodos ilustrativos en los Ejemplos más adelante.

Sección J: Ejemplos

Abreviaturas:

5 cambio químico

Hl microlitro

gm micrómetro

ac acuoso(a)

(+)CSA ácido (+) canforsulfónico

ESTP acetato de etilo

IPA acetato de isopropilo

TRMA trietilamina

Ac acetilo

AcOH ácido acético

br ancho

brm multiplete ancho

br. m. multiplete ancho

br. mult. multiplete ancho

br. s. señal ancha

br. sign. señal ancha

cat. cantidad catalítica

compl. m. multiplete complejo

compl. mult. multiplete complejo

copl. m. multiplete complejo

cpl. m. multiplete complejo

CDCl3 cloroformo deuterados

CH2Cl2 diclorometano

CH2O formaldehído

CO2 dióxido de carbono

d doblete

dd doblete de doblete

de exceso diastereoisomérico

dr relación diastereoisomérica

DCM diclorometano

DEA dietilamina

DMSO dimetilsulfóxido

DMSO-afe dimetilsulfóxido deuterado

ee exceso enantiomérico

equiv equivalente

ES electronebulización

ES+ ionización por electronebulización positiva

ESI ionización por electronebulización

Et etilo

Et2O éter dietílico

EtOAc acetato de etilo

EtOH etanol

FTIR espectroscopia infrarroja por transformada de Fourier g gramo(s)

GC cromatografía gaseosa

h hora(s)

HCl ácido clorhídrico

HCl(ac) solución acuosa de cloruro de hidrógeno HNMR resonancia magnética nuclear de protón 1HNMR resonancia magnética nuclear de protón

HPLC cromatografía líquida de alta resolución

H3PO4 ácido fosfórico

HRMS espectrometría de masas de alta resolución H2SO4 ácido sulfúrico

Hz hertzio

iPr isopropilo

iPr2NEt N-etildiisopropilamina

iPrOAc acetato de isopropilo

iPrOH isopropanol

IR infrarrojo

J constante de acoplamiento

K2CO3 carbonato de potasio

L litro

LC-MS cromatografía líquida-espectrometría de masas LCMS cromatografía líquida-espectrometría de masas LRMS espectroscopía de masas de baja resolución m multiplete

m/e relación masa a carga

mg miligramo

min minuto(s)

ml mililitro

mL mililitro

mmol(s) milimoles

mol(s) moles

monosub. monosustituido(a)

pf punto de fusión

p.f. punto de fusión

mult. d dobletes de multiplete

m/z relación masa a carga

M molaridad/molar

Me metilo

2-MeTHF 2-metiltetrahidrofurano

MeOH metanol

MgSO4 sulfato de magnesio

MS espectrometría de masas

[MS]+ masa de aducto de protones

MTBE tert-butil metil éter

nm nanómetro

N átomo de nitrógeno

N2 nitrógeno

NaCl cloruro de sodio

Na2CÜ3 carbonato de sodio

NaHCO3 bicarbonato de sodio

NaHMDS bis(trimetilsilil)amida de sodio

NaOH hidróxido de sodio

Na2SO4 sulfato de sodio

NH4CI cloruro de amonio

NMR resonancia magnética nuclear

oct. octete

ppm partes por millón

psi libras por pulgada cuadrada

Pd/C paladio sobre carbón

Pd(PPh3)4 tetrakis(trifenilfosfina)paladio(0)

Pt/C platino sobre carbón

q cuartete

Rh/C rodio sobre carbón

TA = ta temperatura ambiente

s singulete

sev. brm varios multipletes anchos

sev. dd varios dobletes de dobletes

t triplete

Temp. temperatura

T temperatura

tR tiempo de retención

tBu butilo terciario

TEA trietilamina

TFA ácido trifluoroacético

THF tetrahidrofurano

Tol tolueno

UV luz ultravioleta

vol. volumen

p peso

Ejemplo 1: Síntesis de compuesto intermedio cetona

6-cloro-5-fluoro-3-hidrox¡-3-(2-oxo-prop¡l)-1,3-d¡h¡dro-indol-2-ona

A la suspensión de 6-cloro-5-fluoro-isatina (25 g, 125 mmol) en acetona (620 ml), se le agregaron Et2NH (0,9 g, 12,5 mmol) y K2CO3 (1,7 g, 12,5 mmol). La mezcla de reacción se calentó a reflujo durante 2 horas. Después de enfriarla hasta temperatura ambiente, la mezcla de reacción se filtró y el solvente se eliminó a presión reducida. El producto crudo se volvió a disolver en MeOH (300 ml) a 50°C y se le agregó agua (300 ml). Con la adición de agua, el sólido precipitó. Se eliminó el MeOH (250 mL) a presión reducida a 50 °C. La mezcla se enfrió hasta 0-5 °C y se agitó durante 30 min. El sólido se filtró y se secó para producir 6-cloro-5-fluoro-3-hidroxi-3-(2-oxo-propil)-1,3-dihidro-indol-2-ona (27 g). 1H RMN (DMSO-ds): 2,00(3H, s, CH3), 3,09(1H, d, CH, J =16Hz), 3,39(1H, d, CH, J =16Hz), 6,16(1 H, s, OH); 6,88(1 H, d, CH, J =8Hz), 7,36(1H, d, CH, J =12Hz), 10,37(1H, s, NH). MS (ESI) m/z 258,0 (M+H)+

Método HpLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de h 3pO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C. Tiempo de retención: 7.52 min.

6-Cloro-5-fluoro-3-h¡drox¡-3-(2-met¡l-[1,3]d¡oxolan-2-¡lmet¡l)-1,3-d¡h¡dro-¡ndol-2-ona

A la suspensión de 6-cloro-5-fluoro-3-hidroxi-3-(2-oxopropil)indolin-2-ona (25 g, 97 mmol) en etilenglicol (250 mL), se le agregaron ortoformiato de trietilo (43 g, 291 mmol) y ácido tolueno-4-sulfónico monohidratado (0,9 g, 4,8 mmol). La mezcla de reacción se calentó a 40-50°C durante 2 horas. Se agregaron sucesivamente MeTHF (500 mL) y solución acuosa de NaCl al 10% (500 mL). La capa orgánica se separó y se lavó con agua dos veces. Después que el solvente se evaporó al vacío, el sólido blanco se lavó con TBME (400 mL) y se secó para producir 6-cloro-5-fluoro-3-hidroxi-3-(2-metil-[1,3]dioxolan-2-ilmetil)-1,3-dihidro-indol-2-ona (27,8 g). 1H RMN (DMSO-d6): 1,00(3H, s, CH3), 2,37(2H, d, CH2,), 3,13(1 H, c, CHH,), 3,58(1 H, c, CHH,), 3,59(1H, c, CHH,), 3,68(1H, c, CHH,), 6,00(1H, s, OH); 6,85(1H, d, CH, J =8Hz), 7,31 (1H, d, CH, J =12Hz), 10,24(1H, s, NH). MS (ESI) m/z 302,0 (M+H)+ Método HPLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de H3PO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C. Tiempo de retención: 7.94 min.

1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona

A la solución de 6-cloro-5-fluoro-3-hidroxi-3-((2-metil-1,3-dioxolan-2-il)metil)indolin-2-ona (27,8 g, 92 mmol) en THF (250 mL), se le agregó lentamente Red-Al (79,8 g, 276 mmol) en THF (100 mL) a 60°C en atmósfera de N2. Después de la adición, la mezcla se agitó a temperatura ambiente durante 3 horas. Se agregó HCl al 20% (400 mL) y la mezcla se agitó durante 20 min. Se agregó acetato de etilo (500 mL) y se agitó durante 10 min. La capa orgánica se separó y se lavó con agua (100 ml x 2). Después de tratarla con Na2SO4 (50 g) y carbón activado (5 g) a temperatura ambiente, la mezcla se filtró y el filtrado se concentró. El producto crudo se recristalizó con MeOH (80 mL) y agua (60 mL) para producir 1-(6-cloro-5-fluoro-1H-indol-3-il)-propan-2-ona (15,5 g).

1H RMN (DMSO-d6): 2,21 (3H, s, CH3), 3,78(2H, s, CH2,), 7,13(1 H, d, CH, J = 4Hz); 7,23(1 H, d, CH, J =8Hz), 7,33(1 H, d, CH, J =8Hz), 8,23(1 H, s, NH).

MS (ESI) m/z 226,0 (M+H)+

Método HPLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de H3PO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C Tiempo de retención: 10.75 min.

Ejemplo 2: Segunda síntesis alternativa de material de partida cetona

1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona

Se cargó Pt/C (10 g, 5% de Pt sobre carbón), bajo N2, a la suspensión de 6-cloro-5-fluoro-3-((Z)-2-nitro-propenil)-1H-indol (100 g, 0,39 mol) en acetato de etilo (500 mL). La mezcla de reacción se sometió a vacío y se purgó con H2 tres veces, y se agitó a temperatura ambiente toda la noche. El catalizador se separó por filtración y el solvente orgánico se eliminó a presión reducida para dar un aceite marrón. El aceite se volvió a disolver en EtOH (500 mL) y se le agregó bisulfito de sodio (81,7 g, 0,79 mol) en H2O (). La suspensión se calentó hasta 80°C toda la noche. El precipitado se separó por filtración y el etanol se eliminó a presión reducida. El residuo se diluyó con agua (500 mL) y se extrajo con acetato de etilo (300 mL x 2). La capa orgánica combinada se secó en Na2SÜ4 y se condensó en evaporador rotatorio para dar un aceite marrón (53 g, 60% de rendimiento).

Ejemplo 3: Segunda síntesis alternativa del compuesto intermedio cetona

1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona

Se cargaron níquel Raney (0,75 g) y ácido acético (1,1 mL, 19,6 mmol) en la suspensión de 6-cloro-5-fluoro-3-((Z)-2-nitro-propenil)-1 H-indol (5 g, 19,6 mmol) en la mezcla de MeOH y H2O (2:1,50 mL) a temperatura ambiente. La mezcla de reacción se sometió a vacío y se purgó con H2 tres veces, y se calentó a 50°C toda la noche. Se agregó MeOH (50 mL) a la mezcla de reacción y el catalizador se filtró sobre Celite. El solvente se concentró hasta 50 mL y se le agregó H2O (300 ml). Con la adición de H2O, se produjo un sólido blancuzco. El sólido se filtró y se lavó con agua. Después de secar en la estufa, se aislaron 2,53 g de sólido blancuzco.

Ejemplo 4: Síntesis, optimización y cribado de polipéptidos transaminasa genomanipulados

Síntesis y optimización de genes: A la secuencia de polinucleótidos que codifica el polipéptido transaminasa omega tipo silvestre reportado de Vibrio fluvialis de SEQ ID NO: 2 se le optimizaron los codones y se sintetizó como el gen de SEQ ID NO: 1. El gen sintético de SEQ ID NO: 1 se clonó en un sistema vector pCK110900 (véase, por ejemplo, la publicación de la solicitud de patente de los Estados Unidos 20060195947) y a continuación se expresó en E. coli W3110fhuA. La E. co liW3110 expresa los polipéptidos transaminasa como una proteína intracelular bajo el control del promotor lac. El polinucleótido (SEQ ID NO:3) que codifica el polipéptido transaminasa genomanipulado de SEQ ID NO: 4 se obtuvo por evolución dirigida del gen con codones optimizados SEQ ID NO:1. El polipéptido de SEQ ID NO: 4 tiene 24 diferencias de residuos de aminoácidos (A9T; G18A; D21H; V31M; N45H; F86Y; A133R; R146L; W147K; V153S; K163F; V177L; R211K; P233T; A235P; P244T; M294V; P318D; A323T; S324G; A383V; T391A; C424A; F427Y) en relación con SEQ ID NO: 2. Este gen sintético de SEQ ID NO: 3 (que codifica el polipéptido de SEQ ID NO: 4) se usó como el esqueleto de partida para la optimización posterior usando métodos estándar de evolución dirigida a través de la generación iterativa de bibliotecas de variantes mediante síntesis de genes, seguido de cribado y secuenciación de los hits para generar genes que codifiquen transaminasas genomanipuladas capaces de convertir el compuesto (IA) en el compuesto (IIA) con propiedades enzimáticas mejoradas en relación con los polipéptidos SEQ ID NO: 2 y 4. Las secuencias de polipéptidos transaminasa genomanipulados resultantes, las mutaciones específicas y las actividades relativas se listan en la Tabla 2A.

Ejemplo 5: Producción de transaminasas genomanipuladas

Los polipéptidos transaminasa genomanipulados se produjeron en E. coli W3110 como una proteína intracelular expresada bajo el control del promotor lac. El polipéptido se acumula principalmente como una enzima activa citosólica soluble. Se usó un procedimiento de matraz de agitación para generar polvos de polipéptido genomanipulado que pueden ser utilizados en ensayos de actividad o en el proceso biocatalítico dado a conocer en este documento.

Multiplicación de alto rendimiento y expresión. Se picaron células y se cultivaron toda la noche en medio LB que contenía 1% de glucosa y 30 pg/mL de cloranfenicol (CAM), 30°C, 200 rpm, 85% de humedad. 20 pL del cultivo de toda la noche se transfirieron a una placa de pocillo hondo que contenía 380 pL de medio cultivo 2xYT que contenía 30 pg/mL de CAM, IPTG 1 mM, MgSO4, 1 mM, y se incubó durante ~18 h a 30°C, 200 rpm, 85% de humedad. Se preparó subcultivo de medio TB de medio TB (380 pL/pocillo), 30 pg/mL de CAM, MgSO4 1 mM e IPTG 1 mM. Los cultivos celulares se centrifugaron a 4000 rpm, 4°C durante 10 min, y el medio se desechó. Se resuspendieron los sedimentos celulares en 200 o 400 pL de tampón de lisis (tampón de trietanolamina (TEA) 0,1 M, pH 9,0, que contenía MgSO4, 1 mM, 400 pg/mL de PMBS y 500 pg/mL de lisozima), como se describe más adelante.

Producción de polvos en matraz de agitación (SFP): Se usó un procedimiento de matraz de agitación para generar polvos de polipéptidos transaminasa genomanipulados que pueden ser utilizados en ensayos secundarios de cribado o en el proceso biocatalítico dado a conocer en este documento. El polvo de matraz de agitación (SFP) incluye aproximadamente 30% de la proteína total y en consecuencia proporciona una preparación más purificada de una enzima genomanipulada en comparación con el lisado celular utilizado en los ensayos HTP. Una única colonia microbiana de E. coli que contiene un plásmido que codifica una transaminasa genomanipulada de interés se inocula en 50 mL de caldo Luria Bertani que contiene 30 pg/ml de cloranfenicol y 1% de glucosa. Las células se cultivan toda la noche (al menos 16 horas) en una estufa de incubación a 30°C con agitación a 250 rpm. El cultivo se diluye en 250 mL de caldo Terrific (12 g/L de bacto-triptona, 24 g/L de extracto de levadura, 4 mL/L de glicerol, fosfato de potasio 65 mM, pH 7,0; MgSC>41 mM) que contiene 30 pg/ml de cloranfenicol, en un matraz de 1 litro hasta una densidad óptica a 600 nm (DC600) de 0,2 y se deja en cultivo a 30°C. La expresión del gen de transaminasa es inducida mediante adición de isopropil-p-D-tiogalactósido ("IPTG") hasta una concentración final de 1 mM cuando la DC600 del cultivo es de 0,6 a 0,8 y después la incubación se continúa toda la noche (al menos 16 horas). Las células se recogen por centrifugación (5000 rpm, 15 min, 4°C) y el sobrenadante se desecha. El sedimento celular se resuspende en un volumen igual de tampón de trietanolamina (cloruro) 100 mM frío (4°C), pH 7,0 (que incluye opcionalmente MgSO42 mM), y se recoge por centrifugación igual que antes. Las células lavadas se resuspenden en dos volúmenes de tampón de trietanolamina (cloruro) frío y se pasan dos veces a través de una prensa francesa a 12.000 psi mientras se mantienen a 4°C. Los desechos celulares se eliminan por centrifugación (9000 rpm, 45 minutos, 4°C). El sobrenadante del lisado claro se recoge y se almacena a -20°C. La liofilización del lisado claro congelado proporciona un polvo de matraz de agitación de polipéptido transaminasa crudo. Alternativamente, el sedimento celular (antes o después del lavado) se puede almacenar a 4°C o -80°C.

Producción de polvos por el proceso descendente (DSP): Los polvos DSP contienen aproximadamente 80% de la proteína total y en consecuencia proporcionan una preparación más purificada de la enzima transaminasa genomanipulada en comparación con el lisado celular utilizado en el ensayo de alto rendimiento. Se puede llevar a cabo una fermentación a mayor escala (~100 - 120 g) de la transaminasas genomanipulada para la producción de polvos DSP como un lote corto seguido de un proceso de alimentación por lotes de acuerdo con métodos estándar debió procesamiento. Brevemente, la expresión de la transaminasa es inducida por adición de IPTG hasta una concentración final de 1 mM. Después de la fermentación, las células se recogen y se resuspenden en tampón de trietanolamina-H2SC4 100 mM, y después se rompen mecánicamente mediante homogeneización. Los desechos celulares y el ácido nucleico se floculan con polietilenimina (PEI) y la suspensión se clarifica por centrifugación. El sobrenadante claro resultante se concentra usando una membrana de ultrafiltración de flujo cruzado tangencial para eliminar las sales y el agua. El concentrado de enzima concentrado y parcialmente purificado se puede secar después en un liofilizador y envasar (por ejemplo, en recipientes de polietileno).

Ejemplo 6: Procedimientos analíticos

Análisis HPLC de reacciones HTP: Se sometió una alícuota de la reacción detenida a análisis de HPLC en las c n i i n i i n

La conversión del compuesto (IA) en el compuesto (IIA) se determinó de los cromatograma resultantes de la manera siguiente:

Conversión (%) = área del producto/(área del producto área del sustrato x 0,73) x 100%

Análisis HPLC de reacciones en escalas de 5 mL y 100 mL: Se sometieron alícuotas de la reacción detenida a análisis de HPLC en las condiciones^ si uientes.

La conversión del compuesto (IA) en el compuesto (IIA) se determinó de los cromatogramas de la manera siguiente: Conversión (%) = área del producto/(área del producto área del sustrato x 0,73) x 100%

Determinación de la pureza quiral del producto (% de ee): La pureza quiral del exceso enantiomérico del compuesto (I

Determinación de la pureza del producto: La pureza del producto se determinó por HPLC utilizando las condiciones si i n :

Ejemplo 7: Cribado de alto rendimiento (HTP) de transaminasas para la conversión del compuesto (IA) en el compuesto (IIA)

Ensayos de cribado HTP: El cribado de alto rendimiento utilizado para guiar la selección primaria de variantes se llevó a cabo en placas de 96 pocillos utilizando lisados celulares en condiciones de ensayo de 10 g/L de compuesto (IA); piridoxal fosfato (PLP)1 mM; isopropilamina (IPM) 2 M, pH 7,0; trietanolamina (TEA) 0,1 M, pH 7; 5% v/v de PEG 200; 10 pL de lisado; y 50 o 55°C.

Las células se cultivaron en placas de 96 pocillos como se describió antes y los lisados se prepararon distribuyendo 200 pL (para la ronda 1) o 400 pL (para la ronda 2) de tampón de lisis (1 mg/mL de lisozima, 0,5 mg/mL de sulfato de polimixina B, PLP 1 mM, trietanolamina (TEA) 0,1 M, pH 7,0) en cada pocillo. Las placas se sellaron, se agitaron durante 2 h, y después se centrifugaron durante 20 min a 4000 rpm a 4°C para sedimentar los desechos celulares.

Se agregaron 10 pL de solución madre de sustrato (200 g/L de compuesto (IIA) disuelto en PEG 200) a cada pocillo de una placa de 96 pocillos, seguido de 180 pL de una solución madre de isopropilamina (IPM)/piridoxal fosfato (PLP) (IPM 2,2 M y PLP 1,06 mM en TEA 100 mM, pH 7,0). Para evaluar la refractariedad a la inhibición por el producto compuesto (IIA), se agregó el compuesto (IIA) a la mezcla de reacción hasta una concentración final de 14 g/L para los ensayos de ronda 1 y de 16 g/L de ronda 2. Las reacciones se iniciaron agregando 10 pL de lisado de células/pocillo. Las placas se sellaron y se incubaron con agitación a 50 o 55°C durante 24 h. Las reacciones se detuvieron con 600 pL de acetonitrilo y las muestras se examinaron por HPLC como se describe en el Ejemplo 5.

Ejemplo 8: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 5 mL

Se llevaron a cabo reacciones en una escala de 5 ml de la manera siguiente. A un vial de vidrio de 20 mL equipado con una barra de agitación magnética en forma de cruz se le agregó 0,75 mL (o 0,5 mL en el caso de concentración de 10% v/v de PEG 200) de tampón de TEA 100 mM (pH 7,0). Se agregaron 2 mL de solución madre de IPM^HCl 5 M al vial, seguido de 1 mL de solución madre de PLP 5 mM. La mezcla se agitó a 500 rpm (agitación magnética). El pH de la mezcla se ajustó después a 7,0 con solución de NaOH 1 M. Después se agregaron 125 mg (o 250 mg para una concentración de 50 g/L o 500 mg para 100 g/L) de sustrato (sólido) al vial. Después se agregaron a la mezcla 0,25 mL (o 0,5 mL para 10% v/v) de PEG 200. Las concentraciones finales de los componentes fueron: 25 g/L (o 50 o 100 g/L) de compuesto (IA); Pl P 1 mM; IPM 2 M; 5% v/v (o 10%) de PEG 200; 2 g/L de enzima TA; TEA 100 mM, pH 7.0. Después la mezcla se agitó y se calentó hasta 50°C.

Las reacciones se iniciaron agregando 1 mL de la solución madre de la enzima (10 g/L). Se tomaron muestras de 20 pL en diferentes momentos y se diluyeron con 750 pL de metanol, y se analizaron por HPLC. Después de 24 h, las mezclas de reacción se detuvieron con 5 mL de acetonitrilo y las muestras se analizaron por HPLC para obtener el % de conversión final.

Ejemplo 9: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 100 mL

Se llevaron a cabo reacciones en una escala de 100 mL de la manera siguiente. A un balón de 250 mL con una cuchilla de agitación en forma de ancla se le agregaron 15 mL de tampón de TEA 100 mM (pH 7). Se agregaron 40 mL de solución madre de IPM^HCl 5 M al balón, seguido de 20 mL de solución madre de PLP 5 mM. La mezcla se agitó a 100 rpm (agitación aérea) y el pH se ajustó a 7,0 usando NaOH 10 M. Después se agregó el sustrato sólido Compuesto (IA) al balón en el transcurso de ~5 min con agitación. Después se agregó PEG 200 (5 mL) y la mezcla se calentó hasta 50°C. Después se agregaron 20 mL de la solución madre de enzima (10 g/L) para iniciar la reacción. La reacción se agitó a 200 rpm (agitación magnética). Se tomaron muestras de 20 pL en diferentes momentos y se diluyeron con 750 pL de metanol, y se analizaron por HPLC. En algunos casos, en los que no se prosiguió con el tratamiento final, después de 24 h, las mezclas de reacción se detuvieron con 100 mL de acetonitrilo y las muestras se analizaron por HPLC para obtener el % de conversión final (Figura 9). Concentración de los diferentes componentes en la reacción: cetona: 25 g/L (o 50 o 100 g/L); PLP: 1 mM; IPM: 2 M; PEG 200: 5% v/v; enzima TA: 2 g/L; tampón: TEA 100 mM, pH 7.0. La conversión de sustrato en producto se analizó por HPLC como se describe en el Ejemplo 3.

Tratamiento final del producto: Después de 24 h de reacción en las condiciones descritas antes (hasta el punto 11), la mezcla de reacción se enfrió hasta temperatura ambiente. La mezcla se filtró a través de un embudo de vidrio sinterizado G4 estándar con una pieza de papel de filtro (Whatman 1, tamaño de poro 11 pm). El balón se enjuagó con 20 mL de agua desionizada que después se filtró a través del mismo embudo. La torta de filtración se lavó dos veces con 20 mL de agua desionizada. El pH del filtrado se ajustó de 6,8 a 3 con solución de HCl 5 M. Después el filtrado se transfirió a un embudo de separación y se extrajo con 100 mL de MTBE. Se permitió que la mezcla bifásica se separara. La capa de MTBE que contenía el sustrato sin reaccionar y las impurezas se desechó. La capa acuosa se transfirió a un vaso de precipitados y se agregaron 100 ml de MBTE. El pH de la capa acuosa se ajustó después de 3 a 10 utilizando solución de NaOH 10 M. Después la mezcla se transfirió a un embudo de separación y se permitió que las fases se separaran. La capa acuosa se extrajo después con 100 mL MTBE tres veces (nb: se repitió hasta que el producto no estuvo presente en la capa acuosa). Las fases de MTBE de las tres extracciones se combinaron y se evaporaron hasta sequedad usando un evaporador rotatorio. El producto crudo se secó posteriormente al vacío durante 48 h.

Ejemplo 10: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 30 g

Se disolvieron 152,48 g de clorhidrato de /'so-propilamina y 0,204 g de piridoxal fosfato monohidratado en 495 ml de agua mientras se agitaba. A esta solución clara de color amarillo se le agregaron una solución de 30,0 g de cetona en 85 ml de polietilenglicol (peso molecular promedio 200) en el transcurso de 15 minutos. Después de la adición la cetona precipitó como partículas finas que se distribuyeron uniformemente en el medio de reacción. Se agregaron a la suspensión 180 ml de tampón de trietanolamina (0,1 mol/l, pH 7) y el pH se ajustó a 7 por adición de solución acuosa de hidróxido de sodio (1 mol/l). La mezcla de reacción se calentó hasta 50°C y se agregó una solución de 1,62 g de transaminasa SEQ ID NO: 134 disuelta en 162 ml de tampón de trietanolamina (0.1 mol/l, pH 7). La mezcla de reacción se mantuvo continuamente a pH 7 mediante adición de solución acuosa de hidróxido de sodio de 1 mol/l. La mezcla de reacción se agitó 24 h a 50°C y se hizo pasar una corriente de nitrógeno sobre la superficie de la mezcla de reacción para quitar la acetona formada. Después la mezcla de reacción se enfrió hasta 25°C y se filtró sobre un lecho de conglomerado de celulosa. El pH del filtrado se ajustó a =1 mediante adición de ácido sulfúrico concentrado. El filtrado acidificado se extrajo con 250 ml de acetato de /so-propilo. Las capas se separaron y el pH de la fase acuosa se ajustó a =10 mediante adición de solución acuosa concentrada de hidróxido de sodio. La fase acuosa basificada se extrajo con acetato de /so-propilo. Las capas se separaron y la fase orgánica se lavó con 100 ml de agua. La fase orgánica se concentró por destilación a 2/3 de su volumen original. En un segundo reactor se disolvieron 33,98 g de ácido (+)-canforsulfónico en 225 ml de acetato de /so-propilo después de calentar a reflujo y se agregó la fase orgánica concentrada en el transcurso de 10 minutos. Después que se completó la adición, la suspensión densa formada se enfrió hasta 0°C en el transcurso de 2 horas y se mantuvo a 0°C durante 15 horas. La sal precipitada (+)-canforsulfonato de amina se filtró, se lavó con 70 ml de acetato de /so-propilo y se secó a 40°C al vacío produciendo 51,57 g de cristales incoloros (84,5% de rendimiento c.t.)

Datos analíticos

IR:

v (cm-1)=3296, 3061, 2962, 2635, 2531, 2078, 1741, 1625, 1577, 1518, 1461, 1415, 1392, 1375, 1324, 1302, 1280, 1256, 1226, 1170, 1126, 1096, 1041,988, 966, 937, 868, 834, 814, 790, 766, 746, 719, 669, 615.

LC-MS (ESI ):

Ion amonio: m/z =227 ([M+H]), 268 ([M+H+CHaCN]), 453 ([2M+H]).

Ion canforsulfonato: m/z =250 ([M+NH4]), 482 ([2M+NH4]).

LC-MS (ESI -):

Ion canforsulfonato: m/z=231 ([M-H]), 463 ([2M-H]).

1H-RMN (DMSO-d6, 400 MHz):

11,22 (s a., 1H), 7,75 (s a., 3H), 7,59 (d, J = 10,3 Hz, 1H), 7,54 (d, J = 6,5 Hz, 1H), 7,36 (d, J = 2,3 Hz, 1H), 3,37 - 3,50 (m, 1H), 2,98 (dd, J = 14,3, 5,8 Hz, 1H), 2,91 (d, J = 14,8 Hz, 1H), 2,81 (dd, J = 14,3, 8,0 Hz, 1H), 2,63 - 2,74 (m, 1H), 2,41 (d, J = 14,6 Hz, 1H), 2,24 (dt, J = 18,3, 3,8 Hz, 1H), 1,94 (t, J = 4,4 Hz, 1H), 1,86 (dt, J = 7,4, 3,6 Hz, 1H), 1,80 (d, J = 18,1 Hz, 1H), 1,23 - 1,35 (m, 2H), 1,15 (d, J = 6,3 Hz, 3H), 1,05 (s, 3H), 0,74 (s, 3H)

Amina libre (obtenida evaporando la capa de acetato de iso-propilo después de la extracción de la capa acuosa basificada):

1H RMN (400MHz, DMSO-da):

11,04 (s a., 1H), 7,50 (d, J = 10,5 Hz, 1H), 7,48 (d, J = 6,5 Hz, 1H), 7,25 (s, 1H), 3,03 (sxt, J = 6,3 Hz, 1H), 2,61 (dd, J = 14,3, 6,5 Hz, 1H), 2,57 (dd, J = 14,1,6,5 Hz, 1H), 1,36 (s a., 2H), 0,96 (d, J = 6,3 Hz, 3H)

Ejemplo 11: Proceso para la conversión del compuesto (IIA) en el compuesto (IVB)

Se suspendieron 13,62 g de 5-cloroisatina en 35 ml de /'so-propanol y se agregaron 2,3 g de trietilamina. La suspensión se calentó a reflujo y se le agregó una solución de 34,42 g de sal (+)-canforsulfonato de amina disuelta en 300 ml de /so-propanol, en el transcurso de 50 minutos. La mezcla de reacción se agitó a reflujo durante 17 horas. La mezcla de reacción se enfrió hasta 75°C y se agregaron 17,4 g de ácido (+)-canforsulfónico a la mezcla de reacción. Se eliminaron aproximadamente 300 ml de /so-propanol mediante destilación al vacío. El /so-propanol eliminado por destilación se reemplazó con acetato de /so-propilo y se continuó con la destilación al vacío. Esta destilación se repitió una segunda vez. Al residuo de la destilación se le agregaron 19 ml de etanol y 265 ml de acetato de etilo y la mezcla se calentó a reflujo. La mezcla se enfrió en rampas hasta 0°C y se mantuvo a 0°C durante 24 horas. Los cristales de color beige a blancuzco se separaron por filtración, se lavaron con 3 porciones (cada una de 25 ml) de acetato de etilo enfriado previamente (0°C) y se secaron al vacío produciendo 40,3 g de cristales beige a blancuzcos. (rendimiento 86,3% c.t.) IR:

v (cm-1)= 3229, 3115, 3078, 3052, 2971, 2890, 2841, 2772, 2722, 2675, 2605, 2434, 1741, 1718, 1621, 1606, 1483, 1460, 1408, 1391, 1372, 1336, 1307, 1277, 1267, 1238, 1202, 1184, 1162, 1149, 1128, 1067, 1036, 987, 973, 939, 919, 896, 871,857, 843, 785, 771,756, 717, 690, 678, 613.

LC-MS (ESI ):

Ion amonio: m/z =390 ([M+H]), 431 ([M+H+CH3CN])

Ion canforsulfonato: m/z =250 ([M+NH4]), 482 ([2M+NH4])

LC-MS (ESI -):

Ion canforsulfonato: m/z=231 ([M-H]), 463 ([2M-H])

1H RMN (DMSO-da, 600 MHz):

11,49 (s, 1H), 11,23 (s, 1H), 10,29 - 10,83 (m, 1H), 9,78 - 10,31 (m, 1H), 7,55 - 7,60 (m, 2H), 7,52 (s, 1H), 7,40 (d, J = 6,2 Hz, 1H), 7,16 (d, J = 8,8 Hz, 1H), 4,52 - 4,63 (m, 1H), 3,20 (dd, J = 16,3, 4,2 Hz, 1H), 2,96 (dd, J = 16,1, 11,3 Hz, 1H), 2,90 (d, J = 15,0 Hz, 1H), 2,56 - 2,63 (m, 1H), 2,39 (d, J = 14,6 Hz, 1H), 2,21 (dt, J = 18,0, 3,8 Hz, 1H), 1,89 - 1,93 (m, 1H), 1,81 (ddd, J = 15,3, 7,8, 3,7 Hz, 1H), 1,76 (d, J = 18,3 Hz, 1H), 1,53 (d, J = 6,6 Hz, 3H), 1,20 - 1,33 (m, 2H), 0,98 (s, 3H), 0,70 (s, 3H)

Ejemplo 12: Proceso para preparar un compuesto de fórmula (IVA) / hidrato

(ALABD) y 100 ml de agua desionizada

La solución clara, amarillenta, se calentó hasta 58°C de temperatura interna. La solución clara, amarillenta, se calentó hasta 58°C de temperatura interna. Se agregaron a la solución 85 g de una solución acuosa de carbonato de sodio al 10% en el transcurso de 10 minutos. La solución clara se filtró en un filtro para partículas en un segundo recipiente de reacción. El recipiente y el filtro de partículas se enjuagaron cada uno con 25 ml de una mezcla de etanol:agua (3:1 v/v) en el segundo recipiente de reacción. La solución combinada filtrada de partículas se calentó hasta 58°C de temperatura interna y se le agregaron gota a gota 200 ml de agua (WEM) en el transcurso de 15 minutos. Hacia el final de la adición la solución se volvió turbia. La mezcla se agitó durante 10 minutos a 58°C de temperatura interna y después se enfrió lentamente hasta temperatura ambiente en el transcurso de 4 horas 30 minutos formando una suspensión blanca densa, bien estirable. Se agregaron 200 ml de agua a la suspensión y la mezcla se agitó durante otras 15 horas 20 minutos a temperatura ambiente. La suspensión se filtró y la torta de filtración se lavó dos veces con porciones de 25 ml de una mezcla de etanol:agua 9:1 (v/v). Los cristales incoloros se secaron a 60°C al vacío produciendo 26,23 g (= 91,2% de rendimiento).

1H RMN (400 MHz, DMSO-da)

10,70 (s, 1H), 10,52 (s, 1H), 7,44 (d, J = 10,0 Hz, 1H), 7,33 (dd, J = 8,4, 2,1 Hz, 1H), 7,26 (d, J = 6,5 Hz, 1H), 7,05 (d, J = 2,3 Hz, 1H), 6,93 (d, J = 8,3 Hz, 1H), 3,83 - 4,00 (m, 1H), 3,13 (d, J = 6,0 Hz, 1H), 2,77 (dd, J = 15,1,3,8 Hz, 1H), 2,38 (dd, J = 15,1, 10,5 Hz, 1H), 1,17 (d, J = 6,3 Hz, 3H).

Claims

REIVINDICACIONES

1. Un proceso para preparar un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,

sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,

donde:

R4 y R7 son cada uno, independientemente, H o -Cl;

R5 es H, -OH, -CH3, -OCH3, -F, -Cl, -CF3 o -CN;

R6 es H, -OH, -OCH3, -F o -Cl;

R8 es H, -CH3, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CF3.

2. El proceso de la reivindicación 1, en donde R5 y R6 son fluoro cuando: R8 es -CH3.

3. El proceso de la reivindicación 1, en donde R5 y R6 son fluoro y cloro, cuando: R8 es -CH3.

4. El proceso de la reivindicación 1, en donde R5 y R6 son hidrógeno cuando: R8 es -CH3.

5. El proceso de la reivindicación 1, en donde R5 es fluoro cuando: R6 es hidrógeno.

6. El proceso de la reivindicación 1, en donde el compuesto de fórmula (II) es de fórmula (IIA), o una de sus sales o solvatos o hidratos,

(IIA).

7. El proceso de acuerdo con la reivindicación 1, en donde el compuesto de fórmula (I) es un compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,

(IA).

8. Un proceso para preparar un compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,

hacer reaccionar un compuesto de fórmula (IIIA) o una de sus sales o solvatos o hidratos,

(IIIA)

con un compuesto de fórmula (IIA) o una de sus sales o solvatos o hidratos,

(IIA)

y en donde la enzima es SEQ ID NO: 134.

9. El proceso de la reivindicación 8, en donde el compuesto de fórmula (IIA) se convierte en una sal de fórmula (IIB):

antes de la reacción con el compuesto de fórmula (IIIA).

10. El proceso de acuerdo con la reivindicación 8, en donde el compuesto de fórmula (IVA) se aísla como una sal de fórmula (IVB):

(IVB).

11. El proceso de la reivindicación 8, en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre.

12. El compuesto de fórmula (IA):

(IA);

o una de sus sales o hidratos o solvatos farmacéuticamente aceptables.