ES2285774T3 - Procedimiento informatico que utiliza calculos de energia libre para el diseño de ligandos y la prediccion de dianas de union. - Google Patents

Procedimiento informatico que utiliza calculos de energia libre para el diseño de ligandos y la prediccion de dianas de union. Download PDF

Info

Publication number
ES2285774T3
ES2285774T3 ES98925162T ES98925162T ES2285774T3 ES 2285774 T3 ES2285774 T3 ES 2285774T3 ES 98925162 T ES98925162 T ES 98925162T ES 98925162 T ES98925162 T ES 98925162T ES 2285774 T3 ES2285774 T3 ES 2285774T3
Authority
ES
Spain
Prior art keywords
binding
molecule
processor
energy
atoms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES98925162T
Other languages
English (en)
Inventor
Ernesto Freire
Irene Luque
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Johns Hopkins University
Original Assignee
Johns Hopkins University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Johns Hopkins University filed Critical Johns Hopkins University
Application granted granted Critical
Publication of ES2285774T3 publication Critical patent/ES2285774T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2299/00Coordinates from 3D structures of peptides, e.g. proteins or enzymes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biochemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Steroid Compounds (AREA)

Abstract

Un procedimiento asistido por ordenador para generar dianas de unión predichas de una molécula seleccionada, usando un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, que incluye las etapas de: (a) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en la molécula seleccionada; (b) determinar, usando el procesador, para cada átomo en la molécula seleccionada, una energía libre de Gibbs predicha de unión del átomo a un ligando ideal para el átomo (c) generar, usando el procesador, un modelo de predicción tridimensional de dianas de unión en la molécula seleccionada mediante la generación, usando las coordenadas tridimensionales de cada uno de los átomos en la molécula seleccionada, de un modelo de átomos en la molécula seleccionada y mapear en cada átomo descrito en el modelo la energía libre de Gibbs de unión predicha correspondientemente determinada; y (d) descargar, al dispositivo de salida, el modelo de predicción tridimensional generado de dianas de unión.

Description

Procedimiento informático que utiliza cálculos de energía libre para el diseño de ligandos y la predicción de dianas de unión.
Declaración como investigación patrocinada por el gobierno federal
Esta invención se hizo en parte con el respaldo del gobierno bajo los números de subvención del INS RR04328 y GM51362. El gobierno de los Estados Unidos puede tener ciertos derechos en la invención.
Antecedentes 1. Campo técnico
Esta invención se refiere a procedimientos asistidos por ordenador para identificar sitios de unión diana en una molécula de interés y procedimientos para diseñar ligandos que se unen a una molécula de interés.
2. Información previa
El diseño de fármacos basados en la estructura es una actividad muy importante en los laboratorios farmacéuticos. El reciente desarrollo de los inhibidores de la proteasa del VIH-1 es un testimonio muy importante a este efecto. En el diseño de fármacos basados en la estructura, el objetivo global es diseñar una pequeña molécula que se una a un sitio específico en una molécula diana, normalmente una proteína u otra macromolécula. Si la proteína diana es una enzima, el sitio diana específico es frecuentemente el sitio de unión del sustrato o sitio activo de la enzima. Si la proteína diana es un receptor, el sitio diana específico es frecuentemente el sitio de unión para un ligando natural del receptor. En todos los casos, el objetivo es alterar el comportamiento de la molécula diana de un modo determinado como resultado de la unión de la pequeña molécula.
El punto de partida en el procedimiento de diseño es la disponibilidad de la estructura de alta resolución de la proteína diana. Como se indica anteriormente, en la mayoría de las situaciones, el sitio diana para unir el fármaco de molécula pequeña es el sitio de unión del sustrato o sitio activo de una enzima o el sitio de unión del ligando de un receptor. En algunos casos, la localización de estos sitios en la superficie de la proteína diana se conoce partir de estudios bioquímicos o estructurales. Por este motivo, la mayoría de los compuestos más destacados son análogos de ligandos o sustratos naturales. La situación es más complicada si la localización de estos sitios no es conocida o si se requiere la elección como diana de un segundo sitio de unión (una situación necesaria, por ejemplo, en los casos en los que se desarrolla resistencia hacia un fármaco existente). Además, la optimización de compuestos más destacados es un esfuerzo muy exigente que requiere la síntesis y caracterización química de un número muy grande de derivados. Es evidente que la disponibilidad de un algoritmo que pueda identificar, mapear y clasificar sitios de unión y ligandos de diseño tendría un impacto positivo en el diseño de fármacos. La presente invención proporciona tales capacidades.
Resumen
La invención ofrece un procedimiento basado en ordenador para la identificación de dianas de unión en proteínas y otras macromoléculas. Más particularmente, la invención incluye un algoritmo que tiene como objetivo predecir dianas de unión en proteínas y otras macromoléculas. El algoritmo, denominado en lo sucesivo "Woolford", requiere el conocimiento de la estructura tridimensional de la proteína diana o macromolécula diana seleccionada. Sin embargo, Woolford no requiere el conocimiento de la localización o la identidad de sitios de unión o ligandos naturales. Las dianas de unión en la proteína se identifican y se clasifican según sus afinidades óptimas esperadas. Las dianas de unión pueden localizarse en la superficie de la proteína o en superficies internas que se exponen como resultado de desplegamiento parcial, cambios conformacionales, disociación de subunidades u otros acontecimientos. La proteína entera se mapea según el potencial de unión de sus átomos constituyentes. En otro aspecto de la invención, una vez que se han identificado las dianas de unión, los ligandos óptimos se diseñan y se forman progresivamente por la adición de átomos individuales o aminoácidos en el caso del diseño de péptidos que complementan estructuralmente y energéticamente el sitio diana seleccionado.
Se espera que el algoritmo de Woolford y los procedimientos asociados de la invención tengan aplicaciones significativas en el diseño de fármacos basados en la estructura ya que permiten: 1) identificación de dianas de unión en proteínas y otras macromoléculas; 2) identificación de dianas de unión adicionales si se conoce una diana de unión primaria; 3) diseño de moléculas ("ligando") con afinidades de unión óptimas para la diana de unión seleccionada; y 4) refinamiento de los compuestos más destacados mediante la definición de la localización y naturaleza de grupos químicos para la óptima afinidad de unión.
La invención ofrece procedimientos para la identificación de dianas de unión en proteínas y otras macromoléculas. Las dianas de unión pueden localizarse en la superficie de la proteína o en superficies internas que se exponen como resultado de desplegamiento parcial, cambios conformacionales, disociación de subunidades u otros acontecimientos.
El procedimiento para la identificación de dianas de unión internas incluye la identificación de las conformaciones parcialmente plegadas más probables de una proteína y/o las energías de disociación.
La invención también ofrece procedimientos para el diseño de ligandos orgánicos sintéticos y ligandos de péptidos que se unen a dianas de unión identificadas.
La invención también ofrece procedimientos para optimizar la conformación de ligandos y el cálculo de las afinidades de unión esperadas de ligandos.
La invención también ofrece procedimientos para calcular la energía libre de Gibbs de unión de un ligando a una macromolécula. El procedimiento implica las etapas de: (a) introducir en el ordenador programado, a través de un dispositivo de entrada, datos que incluyen las coordenadas tridimensionales y la identidad de cada uno de los átomos en el ligando, las coordenadas tridimensionales y la identidad de cada uno de los átomos en la macromolécula y las coordenadas tridimensionales de cada uno de los átomos en el complejo del ligando unido a la macromolécula; (b) determinar, usando el procesador, la diferencia entre la energía libre de Gibbs del complejo del ligando y la macromolécula y la energía libre de Gibbs del ligando no complejado y la macromolécula no complejada; (c) descargar al dispositivo de salida la diferencia entre la energía libre de Gibbs del complejo del ligando y la macromolécula y la energía libre de Gibbs del ligando no complejado y la macromolécula no complejada.
Breve descripción de los dibujos
La fig. 1 es un diagrama de flujo del algoritmo de Woolford básico.
La fig. 2 es un diagrama de flujo del algoritmo usado para el diseño de ligandos.
La fig. 3 es un diagrama de flujo que detalla el procedimiento de identificación del sitio de unión usado en el algoritmo de diseño de ligandos.
La fig. 4 es un diagrama de flujo que detalla la creación de un ligando del péptido más destacado.
La fig. 5 es un diagrama de flujo que detalla el procedimiento de modificación del ligando del péptido más destacado usado en el algoritmo de diseño de ligandos.
La fig. 6 es un diagrama de flujo que detalla la creación de un ligando del compuesto más destacado.
La fig. 7 es un diagrama de flujo que detalla el procedimiento de modificación del ligando del compuesto más destacado usado en el algoritmo de diseño de ligandos.
La fig. 8 es una ilustración de la superficie de unión de la proteasa del VIH-1 calculada usando el algoritmo de Woolford.
La fig. 9 es una ilustración del diseño del sustrato de la proteasa del VIH-1 usando un inhibidor como el compuesto más destacado.
La fig. 10 es una serie de estructuras químicas de los trece inhibidores de la proteasa del VIH-1 considerados en este documento. La bibliografía original para cada inhibidor se facilita en el texto.
La fig. 11 muestra las afinidades de unión predichas y experimentales para los trece inhibidores de la proteasa del VIH-1 considerados en este documento. Los cálculos se realizaron como se describen usando los archivos PDB correspondientes para cada complejo (A77003: 1hvi, A78791: 1hvj, A76928: 1hvk, A74704: 9hvp, A76889: 1hvl, VX478: 1hpv, SB203386: 1sbg, SB203238: 1hbv, SB206343: 1hps, U 100313: 2UPJ, U89360: 1gno, A98881: 1pro, CGP53820: 1hih).
Las fig. 12A y 12B son dos vistas diferentes de los residuos de aminoácidos en el punto de unión de la molécula de proteasa del VIH-1 que contribuyen con más de 0,1 kcal/mol a la energía de Gibbs de unión. Los residuos coloreados de rojo contribuyen entre -0,7 y -0,9 kcal/mol; los residuos coloreados de naranja entre -0,5 y -0,7 kcal/mol; los residuos coloreados de amarillo entre -0,3 y -0,5 kcal/mol; y los residuos coloreados de verde -0,1 y -0,3 kcal/mol. Como guía para el ojo, el inhibidor A77003 se muestra usando una representación de varillas.
La fig. 13 muestra las constantes de estabilidad de residuos calculadas para la molécula de proteasa del VIH-1. Estas constantes se calcularon según el algoritmo de COREX (Hilser y col., 1996 (a); Hilser y col., 1997 (a); Hilser y col., 1997 (b)) y mapean la molécula de proteína en términos de la estabilidad estructural de regiones diferentes. Los círculos indican la localización de los residuos que contribuyen con más de 0,1 kcal/mol a la energía de Gibbs de unión del inhibidor (tabla 2).
La fig. 14 muestra la diferencia en la contribución del residuo de proteasa del VIH-1 a la energía de Gibbs de unión de A77003 a la proteasa de tipo natural y al mutante resistente V84A. \Delta\DeltaG se calcula como (\DeltaG_{mutante} - \DeltaG_{tipo \ natural}) para todos los residuos que contribuyen con más de 0,1 kcal/mol a la energía libre de unión.
Las fig. 15A y 15B muestran dos conformaciones diferentes de una cadena lateral hipotética.
La fig. 16 es un perfil de energía para una cadena lateral de fenilalanina expuesta a disolvente en una conformación de hélice a como una función de los diedros de cadena lateral \chi_{1} y \chi_{2}.
La fig. 17 es un cálculo del perfil del potencial de Gibbs como una función de los diedros de cadena lateral \chi_{1}, y \chi_{2} para la fenilalanina en la posición 5 en el mutante A5F de pepstatina A.
La fig. 18 es un cálculo de los valores de \Delta\DeltaG(25) para doce mutantes diferentes de pepstatina A en la posición cinco. \Delta\DeltaG(25) es la diferencia en la energía de unión de Gibbs a endotiapepsina entre el inhibidor mutante y de tipo natural a 25°C (\Delta\DeltaG(25) = \DeltaG_{mut} (25) - \DeltaG_{salvaje} (25)).
Las fig. 19A y 19B muestran la localización de Ala 5 de pepstatina A en el complejo con endotiapepsina y la situación predicha para el mutante ASF, respectivamente.
La fig. 20 muestra la localización predicha de Glu 7 de pepstatina A en el complejo con endotiapepsina.
Descripción detallada
La realización preferida y los ejemplos mostrados a lo largo de esta descripción deben considerarse como a modo de ejemplo, en vez de como limitaciones de la presente invención. En la descripción de esta invención, la discusión se centra en las proteínas, pero los conceptos son igualmente válidos para otras moléculas.
1. Visión general del algoritmo de Woolford
Una molécula de proteína tiene el potencial para definir muchos sitios de unión (dianas de unión). Sin embargo, se espera que la inmensa mayoría de esas dianas de unión se unan a ligandos con afinidades extremadamente bajas. Además, debido a que la mayoría de esas dianas de unión no son topológica o estructuralmente únicas, se espera que carezcan de especificidad. Un ejemplo que viene al caso es la asociación de desnaturalizantes de proteínas, o la asociación entre proteína y moléculas como ANS que reconocen rasgos que son comunes a casi todas las proteínas. Sólo unos pocos puntos en la superficie de una proteína dada presentarán las características intrínsecas necesarias para la unión de alta afinidad. Estas características incluyen rasgos químicos, topológicos y estructurales que juntos pueden maximizar las contribuciones energéticas a la afinidad de unión.
En el diseño de fármacos, el sitio de unión se define normalmente por la localización del sitio activo natural o la localización del sitio de reconocimiento para un ligando natural. Normalmente se encuentra experimentalmente mediante el estudio de un complejo formado por la proteína con un ligando o sustrato natural. Muchas aproximaciones al diseño racional de fármacos implican la sustitución del ligando o sustrato natural por un ligando inerte, un inhibidor o alguna otra molécula que altere la actividad natural de la proteína diana. Por ejemplo, los inhibidores de la proteasa del VIH-1 inhiben la proteasa viral mediante la competición con los sustratos naturales por el mismo sitio de unión. La situación es mucho más difícil si la localización del sitio de unión del sustrato o ligando en la molécula diana no es conocida o si se desea un segundo sitio en la molécula diana.
A diferencia de muchas aproximaciones convencionales al diseño racional de fármacos, los procedimientos de la invención no requieren un conocimiento previo de la localización del sitio de unión del sustrato o ligando (sitio diana) en la molécula diana. Esto es debido a que los procedimientos de la invención, mediante el uso del algoritmo de Woolford, permiten la identificación de sitios diana para el diseño de fármacos en una molécula diana dada mediante la producción de un mapeo completo de las contribuciones de unión óptimas de cada átomo de la molécula diana. El algoritmo de Woolford produce un mapa de las contribuciones de unión óptimas de cada átomo mediante el uso de un ligando idealizado que explora la superficie entera de la molécula diana, normalmente una proteína, y define la contribución de unión máxima de cada átomo en la molécula diana en condiciones ideales.
La figura 1 es un diagrama de flujo del algoritmo de Woolford básico. Las coordenadas tridimensionales medidas de una molécula seleccionada se introducen en un sistema informático (Etapa 100). Para cada átomo de la molécula, el procesador del ordenador determina una energía libre de Gibbs de unión predicha del átomo respecto al ligando ideal para el átomo (Etapa 102). Entonces, el procesador genera en la molécula seleccionada un modelo de predicción tridimensional de dianas de unión usando las coordenadas tridimensionales de cada uno de los átomos en la molécula seleccionada y la energía libre de Gibbs de unión predicha correspondiente determinada en la Etapa 102 se mapea en cada átomo descrito en el modelo de predicción tridimensional (Etapa 104). Finalmente, el modelo de predicción tridimensional de dianas de unión se descarga a un dispositivo de salida adecuado como la predicción calculada de los sitios de unión actuales de la molécula (Etapa 106).
El potencial de unión de cada átomo se determina por la energía de Gibbs de unión. La contribución óptima de cada átomo en la proteína a la energía de unión se calcula usando una modificación de parametrización estructural conocida descrita más adelante (Bardi y col., 1997; D'Aquino y col., 1996; Freire y col., 1991; Freire, 1993; Gomez y col., 1995 (a); Hilser y col., 1996 (b); Lee y col., 1994; Luque y col., 1996; Luque y col., 1997; Murphy y col., 1992 (a); Murphy y col., 1992 (b); Murphy y col., 1993; Murphy y col., 1994; Straume y col., 1992; Xie y col., 1994 (a); Xie y col., 1994 (b)).
\newpage
Las superficies de las proteínas (tanto externas como internas) son topológica y químicamente heterogéneas. Desde un punto de vista topológico, las superficies de las proteínas son rugosas y se caracterizan por la presencia de depresiones, cavidades, grietas, montañas, prominencias, etc. Desde un punto de vista químico, las superficies de las proteínas son heterogéneas y se caracterizan por la presencia de grupos químicos que presentan diferentes características, por ejemplo grupos hidrófobos, grupos polares, grupos que están eléctricamente cargados positiva o negativamente, etc. En general, un sitio de unión es un sitio en la proteína que tiene características topológicas y químicas que permiten que otra molécula con características topológicas y químicas complementarias se una a ese sitio con una afinidad relativamente alta.
El algoritmo de Woolford puede identificar y mapear sitios diana potenciales en una molécula diana (por ejemplo, una proteína), incluyendo sitios activos naturales, y clasificar cada sitio según sus óptimas afinidades de unión. Además, el algoritmo crea un ligando ideal que provoca el máximo potencial de unión de cada sitio diana. Este ligando ideal puede usarse como un diseño para la identificación o síntesis de moléculas orgánicas que mejor se aproximen a las características del ligando ideal.
El algoritmo de Woolford se ilustrará de un modo sencillo. Cualquier región en una proteína se considera como que es un sitio de unión potencial. Lo que es muy importante, no toda región tiene el mismo potencial de unión. Sólo muy pocos puntos en una proteína tienen el potencial de afinidad de alta unión. De hecho, la inmensa mayoría de los sitios de unión potenciales mostrarán afinidad mínima si está disponible el ligando ideal para ese sitio. Entonces, el primer objetivo es identificar aquellas regiones de la proteína que tienen el potencial de unión más alto. Esto puede ilustrarse imaginándose una superficie hipotética de la proteína con un sitio de unión definido por cuatro grupos químicos diferentes. Un ligando se unirá a ese sitio si complementa el sitio estructural y químicamente de tal manera que la interacción sea energéticamente favorable. El objetivo global en el diseño molecular es precisamente el diseño de una molécula que será complementaria a los grupos en el sitio de unión. Sin embargo, aunque se encuentre un ligando que presenta alta complementariedad, no se asegura la alta afinidad de unión. Hay un límite superior para la afinidad de unión que puede alcanzarse mediante cualquier sitio de unión dado. Este límite superior depende de la composición química (tipos de átomos), tamaño y topología del propio sitio de unión, es decir, es una propiedad intrínseca de la proteína. En general, este límite superior sólo será alcanzado por un ligando ideal que ofrezca un perfecto apareamiento al sitio. No todos los sitios tienen el mismo límite superior. En principio, este límite superior puede estimarse para un ligando perfecto idealizado. Esta afinidad de límite superior se denomina en lo sucesivo "potencial de unión". En esencia, el potencial de unión representa la máxima contribución de cualquier átomo o grupo de átomos dados dentro de la proteína a la energía de Gibbs de unión del mejor ligando posible.
En las proteínas hay muchos grupos químicos, pudiendo servir todos ellos como sitios de unión potenciales, aunque con potenciales de unión infinitamente diferentes. El objetivo del algoritmo de Woolford es estimar el potencial de unión de cada átomo en la proteína y seleccionar las regiones que contienen una alta densidad de átomos con altos potenciales de unión. Estas regiones constituyen dianas de unión para el diseño de fármacos.
El problema tratado por el algoritmo puede expresarse brevemente del siguiente modo:
Dado un cierto número de grupos con diferentes geometrías, topologías y características químicas, ¿puede identificarse y mapearse la región o regiones que definen sitios de unión de alta afinidad? ¿pueden clasificarse esos sitios de unión en términos de sus potenciales de unión? Además, ¿se pueden crear los ligandos ideales que complementan perfectamente cada sitio de unión? La solución a este problema tiene implicaciones significativas en el diseño de fármacos: 1) permite la identificación de dianas de unión en proteínas; 2) permite la identificación de dianas adicionales si se conoce la diana primaria; 3) permite refinar los compuestos más destacados mediante la definición de la localización y naturaleza de grupos químicos para la afinidad de unión óptima; y 4) permite el diseño de nuevos ligandos para cada sitio de unión.
La mayor afinidad que puede alcanzar un sitio de unión se corresponde con la esperada para el ligando ideal. La afinidad hacia el ligando ideal es por definición el límite superior o la afinidad óptima que puede expresarse por cualquier átomo dado y se usa para definir el potencial de unión. El ligando ideal es por definición perfectamente complementario al sitio de unión. Además, la conformación del ligando ideal en disolución es igual a la conformación unida y no pierde entropía conformacional con la unión. El ligando ideal es un constructo informático, el apareamiento perfec-
to para un sitio de unión. Por este motivo también se proporciona el modelo para diseñar y construir ligandos reales.
Cada átomo en la proteína es una diana de unión potencial; sin embargo, cada átomo no tiene el mismo potencial de unión. Una región de proteína con el potencial para unirse a un ligando con alta afinidad es una que presenta una alta densidad de átomos con alto potencial de unión. La tarea de identificar sitios diana reduce en gran parte el cálculo y el mapeo de la proteína según el potencial de unión de sus diferentes átomos.
2. Visión general del procedimiento de diseño de ligandos
El flujo completo del procedimiento de diseño de ligandos se ilustra en la figura 2. En primer lugar se identifica un sitio de unión diana (Etapa 1000). En algunos casos, el sitio de unión diana será conocido basándose en datos experimentales. En los casos en los que no se conoce el sitio de unión diana, el algoritmo de Woolford puede usarse para seleccionar un sitio de unión diana (Etapa 2000). Además, incluso si ya se conoce un sitio de unión diana, puede desearse identificar, usando el algoritmo de Woolford, un sitio de unión diana alternativo (Etapa 2000).
En segundo lugar, el usuario selecciona la estructura general del ligando deseado (Etapa 3000), por ejemplo, o un péptido o algún otro compuesto (por ejemplo, una molécula orgánica no peptídica).
En tercer lugar se identifica un ligando más destacado (o un péptido (Etapa 4000) o algún otro compuesto (Etapa 5000)) o de datos experimentales o mediante cálculos ab initio, es decir, cálculo de un "ligando más destacado idealizado" (Etapa 7000 o Etapa 9000), véase la figura 4 y la figura 6.
En cuarto lugar, el ligando más destacado se modifica o en la Etapa 6000 o en la Etapa 8000 y la constante de unión esperada se calcula (véase la figura 5 y la figura 7) usando la parametrización estructural descrita anteriormente.
Identificación del sitio de unión
La primera etapa en el procedimiento de diseño de ligandos se explica resumidamente en la figura 3, que es un diagrama de flujo del algoritmo de Woolford usado para identificar potenciales sitios de unión diana. Las coordenadas tridimensionales medidas de una molécula diana seleccionada se introducen en un sistema informático (Etapa 2100). Para cada átomo de la molécula diana, el procesador del ordenador determina una energía libre de Gibbs de unión predicha del átomo respecto al ligando ideal para ese átomo. Entonces, el procesador genera un modelo tridimensional de dianas de unión en la molécula diana seleccionada mediante el uso de las coordenadas tridimensionales de cada uno de los átomos en la molécula diana seleccionada. Entonces, la energía libre de Gibbs de unión predicha correspondiente se mapea en cada átomo descrito en el modelo tridimensional de la molécula diana (Etapa 2200). El procesador identifica las regiones con el potencial de unión más alto (Etapa 2300 y Etapa 2400) y clasifica cada sitio de unión potencial según la naturaleza química, área superficial, localización, etc. (Etapa 2500). Finalmente, el procesador selecciona un sitio de unión diana potencial según criterios del usuario, por ejemplo, tipo de ligando, afinidad de unión, tamaño, geometría y un modelo de predicción tridimensional de la diana de unión se descarga a un dispositivo de salida adecuado (Etapa 2600).
Diseño de novo de un ligando del péptido más destacado y modificación del mismo
La figura 4 es un diagrama de flujo del procedimiento usado para el diseño de novo de un diseño de péptidos más destacados. Una vez que se ha seleccionado el sitio de unión diana, el procesador caracteriza el sitio de unión según uno o más criterios, por ejemplo, su geometría, naturaleza química y potencial de unión (Etapa 7100). Con esta información, el procesador selecciona varios dipéptidos "semilla" de una biblioteca que está constituida por 400 dipéptidos de procedencia natural, aminoácidos no nativos y aminoácidos químicamente modificados (Etapa 7200).
Entonces, el procesador revisa los posibles dipéptidos semilla y determina qué dipéptidos semilla podrían producir ligandos adecuados dada su geometría y características químicas (Etapa 7300). La afinidad de unión para cada uno de los dipéptidos semilla seleccionados se calcula del siguiente modo. En primer lugar, el procesador coloca el dipéptido semilla en el sitio de unión diana seleccionado (Etapa 7400). En segundo lugar, el procesador minimiza la función de energía del dipéptido semilla unido mediante rotación alrededor del esqueleto del péptido y ángulos de torsión de las cadenas laterales (Etapa 7425). En tercer lugar, el procesador calcula la afinidad de unión para el dipéptido semilla cuando el dipéptido semilla está en la conformación minimizada en energía determinada en la etapa precedente (Etapa 7450).
Después de completarse este procedimiento, el procesador selecciona los ligandos de dipéptidos semilla con las mayores afinidades de unión (Etapa 7500).
El procesador empieza ahora un procedimiento de "reptación", descrito más adelante, que forma un ligando del péptido más destacado a partir de un dipéptido semilla seleccionado mediante la adición de aminoácidos en uno o ambos extremos del dipéptido semilla seleccionado (Etapa 7600). Después de la adición de cada aminoácido, el procesador minimiza la función de energía del péptido más destacado unido mediante cambios conformacionales en los ángulos de rotación del esqueleto y de torsión de las cadenas laterales (Etapa 7625). Una vez minimizada, el procesador calcula la afinidad de unión para el péptido más destacado (Etapa 7650).
En la Etapa 7675, el procesador sigue añadiendo aminoácidos (Etapa 7600), minimizando la energía conformacional (Etapa 7625) y calculando la afinidad de unión (Etapa 7650) hasta que no aumente la afinidad de unión calculada.
El procesador selecciona el siguiente dipéptido semilla y empieza a formar otro péptido más destacado del mismo modo que se describe anteriormente (Etapa 7500 a Etapa 7675). Una vez que el procesador ha usado todos los dipéptidos semilla para formar péptidos más destacados, se identifica el péptido más destacado con la mayor afinidad de unión (Etapa 7700). Este péptido más destacado puede someterse a modificación, como se describe más adelante (véase la figura 5).
Una vez que se ha identificado un ligando del péptido más destacado, puede modificarse. Este procedimiento se explica resumidamente en la figura 5, que es un diagrama de flujo de un procedimiento de modificación para un ligando identificado del péptido más destacado.
En primer lugar, el procesador del ordenador calcula la energía libre de Gibbs de unión del péptido más destacado para el sitio de unión diana (Etapa 6100). Entonces, el procesador calcula la contribución de cada residuo de aminoácido a la energía de unión (Etapa 6200). Los residuos de aminoácidos que menos contribuyen a la energía de unión se seleccionan para modificarse mediante mutación, adición o deleción de aminoácidos (Etapa 6300).
El procesador selecciona e inserta sistemáticamente aminoácidos usados para la adición y mutación para crear y alterar el péptido más destacado (Etapa 6400). El procesador genera las coordenadas atómicas para cada péptido más destacado alterado (Etapa 6400). Entonces se determina la energía conformacional más baja de cada péptido más destacado alterado (Etapa 6500). A continuación se calcula la constante de unión esperada para unir el péptido más destacado alterado al sitio de unión diana (Etapa 6600). Entonces se determina un mapa tridimensional de cada péptido más destacado alterado unido al sitio de unión diana (Etapa 6700). El procedimiento de modificación (Etapa 6100 a Etapa 6700) puede repetirse según sea necesario hasta que la modificación del ligando del péptido más destacado dé como resultado una mejora de la afinidad de unión calculada.
Diseño de novo de un ligando del compuesto más destacado y modificación del mismo
La figura 6 es un diagrama de flujo de un algoritmo usado para crear un ligando del compuesto más destacado. Una vez que se ha identificado el sitio de unión diana basado o en datos experimentales o en el algoritmo presentado anteriormente (véase la figura 3), el procesador caracteriza el sitio de unión según su geometría, naturaleza química y potencial de unión (Etapa 9100). Con esta información, el procesador sitúa, a distancias de van der Waals óptimas, varios átomos que son energéticamente complementarios a los átomos en el sitio de unión (Etapa 9200). La disposición geométrica del conjunto de átomos se usa como una plantilla para seleccionar varios compuestos más destacados (Etapa 9300). La selección se hace o a partir de una base de datos de compuestos conocidos o mediante la construcción de una molécula con una disposición atómica apropiada.
La afinidad de unión para cada compuesto más destacado se calcula del siguiente modo. En primer lugar, el procesador sitúa uno de los compuestos más destacados en el sitio de unión diana seleccionado (Etapa 9400). En segundo lugar, el procesador minimiza la función de energía del compuesto más destacado unido mediante la rotación sistemática de enlaces (Etapa 9425). En tercer lugar, el procesador calcula la afinidad de unión para el compuesto más destacado en su configuración minimizada en energía (Etapa 9450). Entonces, el procesador selecciona los compuestos más destacados con las mayores afinidades de unión (Etapa 9500).
El procesador empieza ahora un procedimiento -similar al procedimiento de reptación tratado anteriormente- para optimizar cada uno de los compuestos más destacados seleccionados mediante la adición o sustitución de grupos químicos (Etapa 9600). Después de cada adición o sustitución, el procesador minimiza la función de energía del compuesto más destacado modificado unido mediante rotación sistemática de enlaces (Etapa 9625). Una vez que se ha identificado la conformación minimizada en energía del compuesto más destacado modificado, el procesador calcula la afinidad de unión del compuesto más destacado modificado minimizado en energía para el sitio de unión diana (Etapa 9650). En la Etapa 9675, el procesador sigue modificando (Etapa 9600), minimizando la energía conformacional (Etapa 9625) y calculando la afinidad de unión (Etapa 9650) hasta que no aumente la afinidad de unión calculada. El procesador selecciona el siguiente compuesto más destacado y empieza a modificar el compuesto más destacado del mismo modo que se describe anteriormente (Etapa 9500 a Etapa 9675). Una vez que el procesador ha modificado todos los compuestos más destacados, se selecciona el compuesto más destacado con la mayor afinidad de unión (Etapa 9700) para someterse a modificación adicional (véase la figura 7).
La figura 7 es un diagrama de flujo de un procedimiento de modificación para un ligando del compuesto más destacado. El procesador del ordenador calcula el cambio de la energía libre de Gibbs del compuesto más destacado unido al sitio de unión de la molécula diana (Etapa 8100) e identifica la contribución de cada átomo a la energía de unión (Etapa 8200). Los átomos que menos contribuyen a la energía de unión se seleccionan para modificarse mediante sustitución de grupos químicos, adición de grupos químicos o deleción de grupos químicos (Etapa 8300). Los grupos químicos para la sustitución o adición se seleccionan de una caja de herramientas de grupos orgánicos habituales, por ejemplo metilo, amino, hidroxilo y similares (Etapa 8400). Para cada modificación, el procesador genera las coordenadas atómicas del compuesto más destacado modificado (Etapa 8400), la conformación de energía más baja del compuesto más destacado modificado (Etapa 8500) y la constante de unión esperada para cada compuesto más destacado modificado minimizado en energía (Etapa 8600). Se genera un mapa tridimensional para el compuesto mutado unido al sitio de unión diana (Etapa 8700). El procedimiento de modificación (Etapa 8100 a Etapa 8700) puede repetirse según sea necesario hasta que la modificación del ligando del compuesto más destacado dé como resultado una mejora de la afinidad de unión calculada.
3. Cálculo del potencial de unión por átomo
La afinidad de unión se determina mediante la energía de Gibbs de unión. La afinidad de unión del ligando ideal se calcula calculando la energía de Gibbs esperada de cada átomo en la proteína para un ligando ideal. La energía de Gibbs es sensible al contexto y depende de la posición y naturaleza de los átomos restantes. El potencial de unión se calcula a partir de las consideraciones termodinámicas basadas en la estructura. En los cálculos de energía presentados en este documento se usa una parametrización estructural de las energías descritas en este documento. El nivel de refinamiento previamente conocido de esta parametrización se resume en la siguiente bibliografía: (Bardi y col., 1997; D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996). Esta parametrización estructural de las energías ha mostrado que predice correctamente afinidades de unión de la estructura para una variedad de moléculas, incluyendo el conjunto de inhibidores de la proteasa del VIH-1 para los que están disponibles estructuras de alta resolución (ejemplo 1). Sin embargo, el algoritmo de Woolford no depende de esta función de energía y puede ponerse en práctica con otras funciones de energía. La puesta en práctica del algoritmo de Woolford con cualquier otra función de energía está dentro del alcance de la presente invención.
La energía de Gibbs de unión está compuesta de componentes entálpicos y entrópicos. Ambos componentes incluyen contribuciones debidas a la formación de interacciones entre el ligando y la proteína, y contribuciones debidas a cambios en la hidratación. Las contribuciones entálpicas son una función de la distancia de separación entre átomos y los cambios en la accesibilidad atómica al disolvente. El cambio de entropía contiene contribuciones del disolvente que también son proporcionales a los cambios en la accesibilidad del disolvente, y la reducción en grados de libertad conformacionales. Los cambios en los grados de libertad translacionales son los mismos para diferentes ligandos y por tanto no contribuyen a la discriminación entre afinidades de unión, aunque contribuyen a la afinidad
actual.
Si se supone que el ligando ideal establece las características de empaquetamiento atómico promedio encontradas en el interior de proteínas, entonces la mayor contribución al valor de entalpía a cualquier temperatura dada (\DeltaH_{gen}(T)) viene dada por una ecuación de la forma:
100
en la que los coeficientes a_{H}(T) y b_{H}(T) son parámetros de parametrización estructural y \DeltaASA_{ap} y \DeltaASA_{pol} son los cambios en las accesibilidades de disolventes apolares y polares para los átomos tanto en la proteína como en el ligando con la unión. Similarmente, a cualquier temperatura T dada, la entropía asociada al disolvente \DeltaS_{disolv}(T):
101
también se reduce a términos de los cambios en las accesibilidades de disolventes apolares y polares con un conjunto de coeficientes a_{S}(T) y b_{S}(T) también obtenidos de la parametrización estructural conocida de las energías. Por otra parte, los cambios en la entropía conformacional no se relacionan linealmente con cambios en la accesibilidad, aunque se espera que la flexibilidad conformacional sea proporcional a la exposición al disolvente. Las interacciones electrostáticas se calculan según un potencial de Coulomb estándar que depende de las distancias interatómicas entre cargas.
De las ecuaciones anteriores es obvio que el área superficial que queda tapada por el disolvente 5 con la unión, expresada como cambios en las accesibilidades de los disolventes, son cantidades clave en el cálculo de potenciales de unión, especialmente ya que su magnitud depende de la configuración topológica del sitio de unión. Para cualquier átomo en la proteína o ligando, el cambio en la accesibilidad del disolvente es igual a la accesibilidad en la forma libre menos la accesibilidad del mismo átomo en el complejo. La accesibilidad atómica 0 en la proteína libre se calcula a partir de la estructura de alta resolución. El cambio en la accesibilidad del disolvente con la unión depende de la localización topológica del átomo y del tamaño y geometría del ligando.
La fracción del área tapada por el disolvente con la unión de un ligando de pequeño peso molecular depende de la geometría de la superficie. En general, el cambio en el área superficial accesible del disolvente 5 con la unión es una función de la concavidad de la superficie en la que está localizado. En general, excepto para grupos cargados, la energía de unión es proporcional al cambio en la accesibilidad del disolvente (es decir, la cantidad de área superficial que se tapa por el disolvente con la unión). Por esta razón, los sitios de unión de alta afinidad están localizados generalmente en puntos o grietas que optimizan la cantidad de superficie que se tapa por el disolvente.
4. Identificación y clasificación de dianas de unión
Las dianas de unión se identifican mapeando el potencial de unión de cada átomo en la estructura tridimensional de la proteína. Las dianas de unión pueden clasificarse según su naturaleza química (por ejemplo, grado de hidrofobicidad, carga, etc.), su área superficial u otro parámetro apropiado. En la mayoría de las situaciones, el tamaño de la diana de unión y la hidrofobicidad son los parámetros más importantes. Debido a que se prefieren compuestos de bajo peso molecular como fármacos farmacéuticos, la alta afinidad debe provocarse en una diana de unión pequeña. Esta consideración favorece fuertemente ligandos sumamente hidrófobos, haciendo que el efecto hidrófobo sea la fuerza impulsora dominante en la unión de estas pequeñas moléculas orgánicas.
El algoritmo de Woolford permite al usuario examinar potenciales de unión en términos del grado de hidrofobicidad del sitio. Así por ejemplo, es posible buscar dianas de unión con el potencial de unión más alto, o dianas de unión con el mayor potencial para un grado de hidrofobicidad dado. Dentro de este contexto, el grado de hidrofobicidad se expresa en términos de la proporción de átomos polares y no polares en cualquier sitio dado. El área superficial de integración (el tamaño del sitio de unión) también es una variable que puede ajustar el usuario.
5. El ligando ideal
Una vez que se ha identificado un sitio de unión potencial, el ligando ideal se forma mediante la colocación de átomos que son energéticamente complementarios a aquellos en el sitio de unión a distancias de van der Waals óptimas. El conjunto de formación básico está compuesto de átomos carbono, nitrógeno y oxígeno, aunque pueden incluirse otros tipos de átomos. Los átomos de este fondo se usan para llenar el sitio de unión. El número, tipo y localización exacta de cada átomo se obtiene mediante la optimización global de la energía de unión de Gibbs.
El conjunto de átomos resultante (número, tipo y coordenadas de posición) define el ligando ideal. En esta fase, los átomos en el ligando ideal no pertenecen a ningún tipo o clase particular de molécula. En este nivel, el ligando se define como un agregado de átomos que sólo satisface requisitos de radios de van der Waals y niveles de energía óptimos. El modo particular en que se unen los átomos de ligando entre sí se resuelve posteriormente usando procedimientos apropiados de química orgánica.
Los tipos de átomos se colocan diferentes en el espacio tridimensional de forma que la afinidad de unión hacia la diana seleccionada sea óptima. Los átomos en el ligando ideal no están unidos juntos. Definen un diseño tridimensional para la identificación y/o diseño de moléculas orgánicas que se aproximan mucho a las características del ligando
ideal.
6. Formación del ligando
El ligando ideal se define como una matriz tridimensional de átomos que maximizará la afinidad de unión si estuvieran formando una única molécula. Como tal, esta matriz puede usarse como un diseño para identificar o construir una molécula que presentará la misma disposición atómica respecto a la diana de unión. Esta disposición puede definirse exclusivamente mediante los átomos especificados por el algoritmo o por un mayor número de átomos, o como se requiera para presentar la superficie de unión apropiada para la diana.
La afinidad de unión de un ligando real sólo se puede aproximarse a la del ligando ideal. El ligando ideal no sólo presenta complementariedad perfecta, sino que también carece de grados de libertad conformacionales cuando está libre en disolución, es decir, no pierde entropía conformacional con la unión. Estos requisitos son muy difíciles de reproducir en la realidad.
El procedimiento de construir una molécula de ligando implica la identificación del la mejor disposición de unión que concuerde con las coordenadas de posición de los átomos en la molécula de ligando. Esto puede hacerse usando consideraciones de teoría de gráficos u otros procedimientos apropiados que incluyen la identificación de la molécula de ligando más apropiada de un base de datos empíricos de compuestos químicos. Este procedimiento no siempre conduce a una única molécula y en algunas situaciones son posibles varios candidatos potenciales.
7. Dianas de unión no superficiales
En la descripción de la invención, la superficie de la proteína de la estructura de la proteína nativa se ha usado como un ejemplo para identificar dianas de unión. Sin embargo, el algoritmo también se aplica a superficies internas de proteínas que se exponen como resultado de cambios conformacionales, o a interfases de oligomerización en proteínas multiméricas. Por tanto, la aplicación de este algoritmo a otras macromoléculas (por ejemplo, ácidos nucleicos) o membranas biológicas también debe incluirse en la invención.
Tradicionalmente, la localización de dianas de unión se ha restringido a las superficies expuestas de una proteína. Un área nueva y aún sin explorar es la elección como diana de ligandos para superficies internas. El algoritmo de Woolford también considera la existencia de sitios de unión localizados en superficies internas. Estas superficies internas normalmente no están accesibles para el disolvente o los ligandos. Están localizadas en interfases entre diferentes regiones de proteínas o en las interfases entre subunidadades en el caso de proteínas de múltiples subunidades. Con el fin de que se produzca la unión, parte de la proteína necesita desplegarse (o separarse mediante un cambio conformacional del resto de la proteína) y poner a disposición el sitio de unión. Formalmente puede decirse que el ligando estabiliza un estado de la proteína parcialmente plegado, es decir, un estado de la proteína en el que algunas regiones están plegadas y otras regiones están desplegadas.
En la situación anterior, la energía de Gibbs total asociada con la unión del ligando es la suma de la energía de Gibbs requerida para desplegar la región de la proteína que expone el sitio de unión (o la energía de Gibbs para el cambio de conformación) más la energía de Gibbs intrínseca de unión.
Es evidente que la energía de unión total se optimizará si la energía de Gibbs requerida para desplegar la región de la proteína que expone el sitio de unión es pequeña. Por tanto, un elemento crucial en el descubrimiento de sitios de unión internos es la correcta identificación de aquellas regiones de la proteína que tienen la estabilidad estructural más baja o, equivalentemente, la identificación de los estados parcialmente plegados que tienen las mayores probabilidades de poblarse.
El algoritmo para identificar los estados parcialmente plegados más probables implica el uso de la estructura de alta resolución de una proteína como una plantilla para generar un gran número de conformaciones parcialmente plegadas. Las conformaciones parcialmente plegadas se crean desplegando ciertas regiones de la proteína con el ordenador, a la vez que las regiones restantes se mantienen en su conformación nativa. Las energías de Gibbs de todos los estados parcialmente plegados se calculan usando la parametrización estructural de las energías junto con un conjunto de parámetros estructurales optimizados para el estado desplegado. El estado parcialmente plegado con la mayor probabilidad es el de menor energía de Gibbs.
La generación de estados parcialmente plegados se alcanza usando un algoritmo combinatorio seguido por el refinamiento de la estructura parcialmente plegada resultante. El algoritmo combinatorio considera la proteína como si estuviera formada de un número arbitrario de unidades plegables. Cada unidad plegable puede estar o plegada o desplegada. Los estados de las proteínas se generan con el ordenador de un modo combinatorio mediante el plegamiento y desplegamiento de unidades plegables en todas las combinaciones posibles. El número total de estados que se genera es proporcional al número de unidades plegables (N) y es igual a 2^{N}. El número de unidades plegables determina la resolución del análisis. El punto de partida es normalmente N=16, que da como resultado un conjunto inicial de 65536 estados. Una vez que se ha identificado el estado parcialmente plegado con la menor energía de Gibbs, los límites precisos de aminoácidos se localizan usando un procedimiento de refinamiento que implica mover los límites entre regiones plegables/desplegables por un residuo en un tiempo.
Una vez que se ha encontrado el estado parcialmente plegado más probable, se identifica la superficie que se expone como resultado del despliegue parcial. Esta superficie está localizada en las regiones plegadas del estado parcialmente plegado, pero está tapada por el disolvente en el estado nativo. Esta superficie se expone al disolvente con el despliegue de las regiones adyacentes. La identificación de la diana de unión con el potencial de unión más alto en esta superficie sigue el mismo procedimiento descrito en esta descripción para otras dianas de unión.
8. Diseño de ligandos de péptidos
Se presenta un algoritmo para el diseño y acoplamiento de ligandos de péptidos. Este algoritmo usa la estructura tridimensional de una proteína u otra macromolécula como una plantilla para el diseño de péptidos que se asociarán con afinidad de unión predefinida a sitios diana seleccionados en una molécula de proteína. Se consideran dos situaciones, una en la que se conoce la estructura de alta resolución de la proteína diana en asociación con un péptido más destacado o de tipo natural; y una en la que sólo se conoce la estructura de la proteína diana. En la primera situación, el diseño de ligandos puede hacerse mediante la adición, deleción o sustitución de aminoácidos específicos en localizaciones específicas dentro del péptido más destacado. En la segunda situación, el punto de partida en el procedimiento de diseño es la definición de un péptido de núcleo mínimo que se trata como un péptido más destacado virtual por el algoritmo. El diseño molecular se pone en práctica mediante sustitución, adición o deleción molecular o atómica secuencial seguida por minimización de energía. La construcción molecular se realiza poniendo en práctica un procedimiento de "reptación" guiado por energía. El péptido de núcleo mínimo se define mediante una búsqueda sistemática o exhaustiva de una biblioteca de péptidos pequeños (dipéptidos, tipéptidos, etc.) hasta que se encuentra un péptido más destacado apropiado. En todos los procedimientos de energía se usa una parametrización estructural empíricamente derivada de las energías. El algoritmo puede usarse con sitios diana conocidos o para descubrir nuevos sitios de unión diana de péptidos. Además, el algoritmo se pone en práctica para aminoácidos naturales o no
naturales.
Los estudios con diferentes péptidos que se unen a proteínas (por ejemplo angiotensina, pepstatina A, etc.) indican que la energía de unión total no se distribuye uniformemente por toda la molécula y que algunos grupos (frecuentemente llamados puntos calientes en la bibliografía) llevan una mayor proporción de la energía de unión. Usando péptidos pequeños como sondas es posible identificar sitios específicos en la proteína que tienen la mayor afinidad de unión potencial. Esto es un problema que puede tratarse con el ordenador. Si sólo se incluyen aminoácidos naturales son posibles 400 dipéptidos y 8.000 tripéptidos. Los números no aumentan significativamente si se incluyen aminoácidos no naturales. La primera etapa en el procedimiento es el mapeo de la superficie de la proteína en términos del potencial de unión de cada uno de sus átomos constituyentes. Usando este mapa se seleccionan los péptidos que son complementarios a los sitios con el mayor potencial de unión. Al final de este procedimiento se obtiene un mapa de la superficie de la proteína en términos de afinidades de unión máximas para pequeños péptidos más destacados. Entonces, este mapa se usa en la selección de un sitio de unión y el diseño de un ligando de péptido usando el péptido más destacado como punto de partida.
En el pasado, uno de los obstáculos principales para los algoritmos de diseño molecular basados en la estructura ha sido la ausencia de una función de energía con la capacidad para predecir con exactitud la afinidad de unión. La presente invención proporciona una función de energía que puede predecir con exactitud la afinidad de unión.
Como se indica anteriormente, la afinidad de unión se determina mediante la energía de Gibbs de unión. La contribución óptima de cada átomo en la proteína a la energía de unión se calcula usando una modificación especial de una parametrización estructural previamente desarrollada de las energías de unión (Bardi y col., 1977; D'Aquino y col., 1996; Freire y col., 1991; Freire, 1993; Gomez y col., 1995 (a); Hilser y col., 1996 (b); Lee y col., 1994; Luque y col., 1996; Luque y col., 1997; Murphy y col., 1992 (a); Murphy y col., 1992 (b); Murphy y col., 1993; Murphy y col., 1994; Straume y col., 1992; Xie y col., 1994 (a); Xie y col., 1994 (b)).
9. Sitios de unión e identificación de un péptido más destacado
En la realización preferida, el diseño de un ligando de péptido empieza con la identificación de un péptido más destacado. Hay cuatro posibilidades, pudiendo tratarse todas mediante el algoritmo:
1)
El péptido más destacado y el sitio de unión no son conocidos.
2)
El sitio de unión es conocido, pero el péptido más destacado no es conocido.
3)
El péptido más destacado es conocido y el sitio de unión no es conocido.
4)
El péptido más destacado y el sitio de unión son conocidos.
En el primer caso, la primera tarea es usar la estructura de alta resolución de la proteína con el fin de identificar la localización del sitio de unión y la secuencia de aminoácidos del péptido más destacado (normalmente, pero no se limita a un dipéptido). Esto es una búsqueda conjunta ya que el potencial de unión esperado de un sitio dado en la proteína no puede realizarse a menos que se especifique la secuencia óptima de péptidos. La identificación de candidatos para posibles localizaciones del sitio de unión se hace mediante la construcción de un mapa de la superficie de la proteína en términos de afinidades de unión potenciales para "péptidos más destacados idealizados". Una vez que se han identificado los mejores candidatos se hace una búsqueda sistemática con las estructuras atómicas completas de los péptidos. Este procedimiento da como resultado la selección de un sitio de unión y el péptido más destacado correspondiente, que constituye el punto de partida para el diseño del ligando del péptido final.
En el segundo caso, la localización del sitio de unión es conocido y por tanto la búsqueda para la mejor localización y secuencia del péptido más destacado se restringe a una región más pequeña de la proteína. En este caso, la identificación del mejor péptido más destacado se hace directamente con estructuras atómicas completas de todos los posibles péptidos más destacados.
En el tercer caso, el péptido del ligando es conocido pero el sitio de unión no es conocido. Esta situación se aproxima al problema de acoplamiento clásico. En el algoritmo, el péptido del ligando original se descompone en sus componentes dipeptídicos elementales. Entonces, el mismo procedimiento usado en el caso uno se realiza para cada uno de los dipéptidos elementales. Los dipéptidos elementales se usan en el análisis porque sus conformaciones pueden tratarse con el ordenador, mientras que no las de péptidos más largos. Una vez que se ha identificado el péptido más destacado se usa el mismo procedimiento de minimización de energía, excepto que el resto de la secuencia de péptidos ya es conocida.
En el cuarto caso, en el que el péptido más destacado y el sitio de unión son conocidos, el problema puede reducirse a encontrar la conformación que minimiza la energía de unión. Sin embargo, en situaciones en las que se conoce la estructura de alta resolución de una proteína en complejo con un ligando de péptido, el objetivo es frecuentemente el diseño de una versión diferente del péptido con diferentes características de unión. Si este es el caso, el péptido experimental se usa como péptido más destacado. En este documento, la primera tarea es mapear las contribuciones relativas de cada aminoácido en el péptido a la energía de unión. Entonces, este mapa de energía se usa para seleccionar aminoácidos que se eligen como diana para la mutación. Si se desea una afinidad más alta se seleccionan los aminoácidos que hacen las contribuciones más bajas; y viceversa, si se desea una afinidad más baja se seleccionan los aminoácidos que hacen las mayores contribuciones. Si no puede hacerse la discriminación de aminoácidos, o si las mutaciones no son factibles, entonces la longitud del péptido es la variable restante.
10. Sustitución, adición o deleción de aminoácidos y minimización de energía
El punto de partida para el diseño es el péptido más destacado. Como se trata anteriormente, el péptido más destacado se define o mediante ordenador o se define mediante la estructura de alta resolución de un complejo péptido/proteína existente. En ambas situaciones, las manipulaciones son similares.
El diseño de un ligando de péptido que tiene como punto de partida un péptido más destacado implica tres operaciones elementales: 1) la adición; 2) deleción; o 3) sustitución de un tipo de aminoácido por otro (mutación). Se logran otras operaciones más complejas mediante la combinación de varias operaciones elementales. Una vez que se realiza la operación, la conformación más probable se selecciona mediante la identificación de la de menor energía de unión.
Adición de aminoácidos
Los aminoácidos pueden añadirse o en los extremos amino o carboxi del péptido más destacado. Las adiciones en las posiciones centrales no se consideran explícitamente debido a que pueden lograrse mediante la combinación de mutaciones con adición/defecciones en cualquier extremo. El procedimiento por el que un nuevo aminoácido se añade en el extremo amino o carboxi del péptido puede considerarse como un movimiento de reptación en el que el nuevo aminoácido muestra diferentes orientaciones del esqueleto y de las cadenas laterales hasta que encuentra la que minimiza la energía de unión. Cada orientación viene impuesta por un conjunto de valores para los ángulos de torsión \phi y \psi del esqueleto y el conjunto de diedros de cadenas laterales {\chi}.
Deleción de aminoácidos
Los aminoácidos pueden someterse a deleción o en el extremo amino o carboxi del péptido más destacado.
Mutación de aminoácidos
Las mutaciones de aminoácidos pueden realizarse en cualquier posición a lo largo de la secuencia de péptidos. Implican la sustitución de cadenas laterales, seguido por la minimización de energía.
Minimización de energía
La búsqueda de la conformación más probable es equivalente a la búsqueda de la conformación que minimiza la función de potencial de Gibbs \DeltaG_{ef}. La probabilidad de una conformación de péptido único, definida por un conjunto específico de coordenadas de las cadenas laterales y del esqueleto, viene impuesta por la función de potencial de Gibbs, \DeltaG_{ef}, especificada por la entalpía y entropía de solvatación. \DeltaG_{ef} es una función de los ángulos de torsión de las cadenas laterales y del esqueleto. Por definición, la entropía conformacional del propio péptido no entra en la ecuación. \DeltaG_{ef} es la función de energía de Gibbs de una única conformación y no debe confundirse con la energía de Gibbs de unión que incluye todas las conformaciones aceptables. La probabilidad de cualquier conformación dada viene dada por la ecuación
102
en la que e^{\Delta G} _{ef,i}/RT es el exponente de Boltzmann para esa conformación, y la suma en el denominador es la función de partición conformacional definida como la suma de los exponentes de Boltzmann de todas las conformaciones. La función de potencial de Gibbs, \DeltaG_{ef}, se usa para identificar la conformación más probable de una cadena lateral o esqueleto. Debe tenerse en cuenta que el procedimiento de minimización de energía usado en este documento implica términos entálpicos que surgen de interacciones intra e intermoleculares, además de las interacciones con el disolvente, y la entropía de solvatación.
Las conformaciones se generan variando sistemáticamente los ángulos diédricos entre 0 y 360 grados cada 10 grados. Para conformaciones del esqueleto, los ángulos de torsión también se varían cada 10 grados entre 0 y 360 grados. Se hacen refinamientos identificando conformaciones que están próximas a un mínimo de energía y reducen los intervalos de rotación. Para situaciones sencillas es posible una búsqueda exhaustiva. Para situaciones más complicadas se usan algoritmos de búsqueda habituales que tienen como objetivo identificar mínimos de funciones (por ejemplo gradiente, simplex, máxima pendiente, etc.). Debido a los impedimentos estéricos no son factibles todas las conformaciones generadas por la rotación alrededor de un enlace dado. Por tanto, para cada conformación se comprueban las condiciones de van der Waals usando el conjunto de MMII de radios de van der Waals eficaces publicados por Iijima y col. (1987). Se rechazan aquellas conformaciones que presentan colisiones de van der Waals. La función de potencial de Gibbs \DeltaG_{ef} sólo se calcula para conformaciones permitidas.
11. La energía libre de Gibbs de unión
La afinidad de unión se determina por la energía libre de Gibbs de unión, descrita en más detalle a continuación. Todos los cálculos de energía presentados en este documento se basan en una parametrización estructural de las energías descritas en este documento. El nivel de refinamiento anterior de esta parametrización se resume en la siguiente bibliografía: (Bardi y col., 1997; D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996). Esta parametrización estructural proporciona la mayor parte de la energía de Gibbs. Sin embargo, para el nivel de exactitud requerido en este algoritmo, algunas veces se requieren términos adicionales. Estos términos adicionales incluyen, entre otros, restricciones conformacionales debidas a la densidad de carga, una parametrización explícita de las restricciones conformacionales debidas a puentes disulfuro u otros enlaces covalentes, la dependencia de la constante dieléctrica en la accesibilidad del disolvente, la dependencia de pK de grupos químicos en el entorno, valores habituales parametrizados para las accesibilidades de las cadenas laterales de todos los aminoácidos. Además, se han incluido descripciones paramétricas de aminoácidos no habituales.
La energía de Gibbs de unión está compuesta de componentes entálpicos y entrópicos. Ambos componentes incluyen contribuciones debidas a la formación de interacciones entre el ligando y la proteína, y contribuciones debidas a cambios en la hidratación. Las contribuciones entálpicas son una función de la distancia de separación entre átomos y los cambios en la accesibilidad atómica al disolvente. El cambio de entropía contiene contribuciones del disolvente que también son proporcionales a los cambios en la accesibilidad del disolvente, y la reducción en los grados de libertad conformacionales. Las interacciones electrostáticas y los acontecimientos de protonación/desprotonación acoplados a la unión también son importantes y se incluyen en el análisis. Los cambios en los grados de libertad translacionales son los mismos para diferentes ligandos y por tanto no contribuyen a la discriminación entre afinidades de unión, aunque contribuyen a la afinidad actual.
12. La identificación de la conformación con menor energía
La identificación de la conformación con menor energía utiliza una función de energía similar a la energía de Gibbs parametrizada de unión, excepto que no contiene el término de entropía conformacional. El motivo es que en el procedimiento de minimización de energía se está tratando con conformaciones únicas.
Cada conformación de péptido se define por un conjunto de diedros de cadenas laterales {\chi} y ángulos de torsión \phi y \chi del esqueleto. La energía de unión es una función de {\chi}, \phi y \chi. Por tanto, en la rutina de minimización de energía, el objetivo es encontrar el conjunto de {\chi}, \phi y \chi para el que la energía es un mínimo. Están disponibles varios procedimientos matemáticos para encontrar los mínimos de las funciones. El algoritmo usado en los procedimientos de la invención no se basa en un procedimiento particular de localización de mínimos.
13. La identificación de sitios de unión de péptidos
Si el sitio de unión no es conocido, es necesario seleccionar algunas regiones en la proteína como los candidatos más probables para servir de sitios de unión de péptidos. Esto se hace mapeando la superficie de la proteína en términos del potencial de unión de cada uno de sus átomos constituyentes usando el algoritmo de Woolford (descrito más adelante).
Una vez que se ha obtenido el mapa de potenciales de unión atómicos, se transforma en un mapa de potenciales de unión de dipéptidos. Este nuevo mapa se obtiene seleccionando regiones de dimensiones similares a las encontradas en los dipéptidos (normalmente oscilan de 7,0 por 2,5 \ring{A} a 14 por 6,0 \ring{A}, que se corresponden con Gly-Gly y Trp-Trp). Las dimensiones geométricas y la distribución de la superficie polar y no polar dentro de cada región se usa para determinar progresivamente la secuencia del dipéptido más apropiado. La filosofía general en este documento es aumentar el nivel de detalle en la descripción del candidato para dipéptido más destacado a medida que avanza el nivel de refinamiento. Así por ejemplo, un protocolo común es aumentar el nivel de detalle según el siguiente orden: 1) dimensiones geométricas del sitio de unión seleccionado; 2) fracción de superficie polar y no polar; 3) distribución topológica de la superficie polar y no polar; 4) descripción atómica completa.
14. Parametrización estructural de energías de unión
En todos los casos presentados en este documento, la energía de Gibbs de unión, \DeltaG, se calculó a partir de las estructuras cristalográficas publicadas usando procedimientos previamente descritos (D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996). Estos cálculos requieren las estructuras del complejo, además de las estructuras de la proteína no ligada y el inhibidor no ligado. En esta aproximación, la parte genérica de la energía de Gibbs, \DeltaG_{gen}, se calcula a partir de un cálculo por separado de sus componentes de entalpía y entropía. Esta parte de la energía de Gibbs contiene las contribuciones normalmente asociadas con la formación de la estructura secundaria y terciaria (interacciones de van der Waals, enlace por puente de hidrógeno, hidratación y entropía conformacional). Las contribuciones adicionales a la energía de Gibbs de unión no se separan en componentes entálpicos y entrópicos. Incluyen efectos electrostáticos y de ionización, G_{ion}, y la contribución del cambio en grados de libertad translacionales, \DeltaG_{tr},
103
Contribuciones genéricas a la energía de Gibbs
Las contribuciones estructurales/ de solvatación más significativas a la energía libre total de unión están contenidas en el término \DeltaG_{gen} = \DeltaH_{gen} - T\cdot\DeltaS_{gen}, que se calcula estimando por separado sus componentes de entalpía y entropía. Los cambios estructurales importantes para estos cálculos son los cambios en las áreas superficiales accesibles de disolventes apolares y polares (\DeltaASA_{ap} y \DeltaASA_{pol}) y la distribución de las distancias interatómicas entre diferentes tipos de átomos que determina la densidad de empaquetamiento.
Los cambios en las áreas superficiales accesibles se calcularon poniendo en práctica el algoritmo de Lee y Richards (Lee y col., 1971). En todos los cálculos se usaron un radio de disolvente de 1,4\ring{A} y un ancho de corte de 0,25\ring{A}.
Con el fin de definir mejor pequeñas diferencias en la accesibilidad del disolvente entre inhibidores o mutantes se consideran 64 orientaciones de proteínas/inhibidores diferentes con respecto al plano de corte en los cálculos del área superficial accesible. Estas orientaciones se generan rotando la molécula alrededor del eje x, y y z cada 90 grados. De este modo, la accesibilidad del disolvente resultante para cada átomo es el promedio en número de los valores obtenidos para todas las orientaciones moleculares. Si se necesitan las accesibilidades del disolvente para conformaciones desplegadas se usa un conjunto de valores optimizados de energía libre (Luque y col., 1996).
Componente entálpico de la contribución genérica a la energía libre de Gibbs
En la unión o el plegamiento, la mayor parte del cambio de entalpía origina la formación de interacciones internas (enlaces de van der Waals, de hidrógeno, etc.) y la desolvatación paralela de los grupos que interactúan. Como es lógico, la mayor parte del cambio de entalpía se reduce tanto en términos de cambios de \DeltaASA como en las distancias interatómicas entre los grupos que interactúan. A la temperatura de referencia de 60°C puede escribirse como (Hilser y col., 1996 (b)):
104
en la que los coeficientes empíricos \alpha y \beta se han estimado a partir de un análisis de la base de datos termodinámica de proteínas y son iguales a \alpha_{ap} = -12,96, \beta_{ap} = 25,34, \alpha_{pol}, = 24,38, \beta_{pol} = 16,57 y \alpha_{mix} = 16,42. Los términos U_{i} representan la densidad de empaquetamiento de átomos apolares, polares y mixtos y es igual a la energía promedio en peso de la relación entre la distancia de separación en el mínimo en el pozo de potencial y la separación actual entre tipos de átomos. La ecuación anterior puede generalizarse para tipos arbitrarios de átomos como:
105
Para la densidad de empaquetamiento promedio en las proteínas, \DeltaH_{gen}(60) se aproxima mucho a:
106
A cualquier otra temperatura, \DeltaH_{gen}(T) se obtiene de la ecuación termodinámica habitual:
107
\DeltaH_{gen} no necesita ser igual a la entalpía experimental. Por ejemplo, se ha mostrado que para procedimientos de unión en los que los protones se liberan o se absorben, la entalpía medida depende de la entalpía de ionización del tampón (Gomez y col., 1995 (b)).
Componente entrópico de la contribución genérica a la energía libre de Gibbs
En el cálculo del cambio de entropía se incluyen dos contribuciones primarias, una debido a cambios en la solvatación y la otra debida a cambios en los grados de libertad conformacionales (\DeltaS_{gen}(T) = \DeltaS_{solv}(T) + \DeltaS_{conf}). La entropía de solvatación depende de la temperatura, mientras que la entropía conformacional es esencialmente una constante a diferentes temperaturas. La entropía de solvatación puede escribirse en términos de capacidad calorífica si las temperaturas a las que las entropías de hidratación apolares y polares son cero (T*S,ap y T*S,pol) se usan como temperaturas de referencia:
108
Se ha sabido que T*_{S,ap} es igual a 385,15K durante algún tiempo (Baldwin, 1986; Murphy y col., 1992 (b)) y recientemente se ha encontrado que T*_{S,pol} es próxima a 335,15K (D'Aquino y col., 1996). Mientras que la entropía de solvatación apolar parece ser aditiva, se sabe que la situación para la solvatación polar depende en número y proximidad de los grupos funcionales polares en la molécula (Cabani y col., 1981).
Las entropías conformacionales con la unión o el plegamiento se evalúan considerando explícitamente las tres siguientes contribuciones para cada aminoácido: 1) \DeltaS_{bu->ex}, el cambio de entropía asociado con la transferencia de una cadena lateral que está tapada en el interior de la proteína respecto a su superficie; 2) \DeltaS_{ex->u}, el cambio de entropía ganado por una cadena lateral expuesta en la superficie cuando el esqueleto del péptido cambia de una conformación única a una conformación desplegada; y 3) \DeltaS_{bb}, el cambio de entropía ganado por el propio esqueleto con el despliegue de una única conformación. Se ha estimado la magnitud de estos términos para cada aminoácido mediante análisis computacional de la probabilidad de diferentes confórmeros como una función de los ángulos diédricos y de torsión (D'Aquino y col., 1996; Lee y col., 1994; Luque y col., 1996).
Debido a que algunos ligandos considerados no son péptidos, puede ponerse en práctica una parametrización especial para explicar el cambio en los grados de libertad conformacionales entre las formas unidas y libres de las moléculas de ligando. Como se muestra en la figura 10, el número total de átomos, además del número de enlaces rotatorios, varía entre ligandos. En general, la entropía conformacional del ligando libre en disolución será proporcional al número de enlaces rotatorios. Sin embargo, para un número dado de enlaces rotatorios, los efectos de volumen excluidos aumentarán con el número total de átomos en la molécula. Por tanto, como una primera aproximación, el cambio de entropía conformacional de ligandos no peptídicos con la unión, \DeltaS_{np}, se consideró como una función lineal del número de enlaces rotatorios (N_{rb}) y del número total de átomos (N_{átomos})
109
Los coeficientes k_{1} y k_{2} se estimaron a partir de una base de datos experimental de ligandos no peptidicos. Se encontró que el coeficiente k_{1} era igual a -1,76 cal/K\cdotmol, que está próximo al valor de entropía conformacional observada para enlaces C-C en parafinas de cadena larga (Schellman, 1955 (a); Schellman, 1955 (b)). Se encontró que el coeficiente k_{2} era igual a 0,414 cal/K\cdotmol y esencialmente explica las restricciones de entropía conformacional en el ligando libre debido al volumen excluido.
El cambio de capacidad calorífica es una función débil de la temperatura y se ha parametrizado en términos de cambios en áreas superficiales accesibles del disolvente (\DeltaASA) ya que origina principalmente cambios en la hidratación (Gomez y col., 1995 (a); Gomez y col., 1995 (b); Murphy y col., 1992 (a)):
110
en las que los coeficientes a_{C}(T) = 0,45 + 2,63x10^{-4} \cdot (T - 25) - 4,2x10^{-5}\cdot (T - 25)^{2} y b_{C}(T) = -0,26 + 2,85x10^{-4} \cdot (T - 25) + 4,31x10^{-5} \cdot (T - 25)^{2}. La hidratación del grupo hidroxilo en las cadenas laterales de hidroxilo alifático (Ser y Thr) parece contribuir positivamente y no negativamente a \DeltaCp como se supuso previamente (0,17 cal\cdotK^{-1}\cdotmol^{-1} \ring{A}2 a 25°C) (Gomez y col., 1995 (b)). En la ecuación anterior, los cambios de \DeltaASA cambios son en \ring{A}2 y la capacidad calorífica en cal\cdotK^{-1}\cdotmol^{-1}. En general, para cálculos a baja temperatura (T<80°C), los coeficientes independientes de la temperatura son suficientes (Gomez y col., 1995 (a); Gomez y col., 1995 (b)). Los efectos específicos, como los cambios de capacidad calorífica asociados a cambios en la protonación, unión diferencial de ligandos o desnaturalizantes, etc., necesitan considerarse individualmente (Gomez y col., 1995 (a); Gomez y col., 1995
(b)).
Contribuciones iónicas y electrostáticas a la energía libre de Gibbs
En esta situación necesitan considerarse dos tipos de efectos electrostáticos. Las contribuciones de Coulomb debido a las interacciones entre sitios cargados, y la energía propia que surge al cargar un único sitio o alternativamente la energía propia que surge al transferir una carga entre ambientes con constantes dieléctricas diferentes. Estas contribuciones electrostáticas se calcularon como se describe por Garcia-Moreno (Garcia-Moreno, 1995) usando la ecuación habitual:
111
en la que Z es la carga, r_{i} el radio de la partícula cargada, r_{ij} la separación entre dos cargas, A y A_{ref} los parámetros de atenuación en el complejo y la referencia. Estos parámetros incorporan efectos dieléctricos y de selección como se trata en (Garcia-Moreno, 1995) y (Garcia-Moreno y col., 1997).
Los efectos protonación se tratan como se describe anteriormente (Gomez y col., 1995 (b)) a partir de un conocimiento del pKa de los grupos que cambian el estado de ionización con la unión.
Contribución de entropía translacional a la energía de Gibbs
La asociación de dos o más moléculas reduce los grados de libertad translacionales disponibles para esas moléculas. Ha habido una discusión considerable en lo referente a la magnitud exacta de este término ya que no se dispone de cálculos precisos (véase, por ejemplo, Janin, 1995; Kauzmann, 1959; Murphy y col., 1994). En este trabajo (Gomez y col., 1995 (b); Murphy y col., 1994) se ha encontrado que el valor que mejor explica los resultados experimentales en la entropía crática propuesta por Kauzmann (Kauzmann, 1959). Para la formación de un complejo bimolecular, la entropía crática es igual a -8 cal/K\cdotmol, que asciende a aproximadamente 2,4 kcal/mol a 25°C.
Cálculo de constantes de estabilidad de residuos
Las constantes de estabilidad aparente de residuos dan un conjunto importante de parámetros para mapear la estabilidad estructural de diferentes regiones de una proteína. Para cualquier residuo dado, la constante de estabilidad aparente por residuo, K_{fj}, se define como la relación de las probabilidades de todos los estados en los que el residuo está plegado, P_{fj}, respecto a las probabilidades de los estados en los que el mismo residuo no está plegado:
112
La constante de estabilidad aparente por residuo, K_{fj}, es la cantidad de que se medirá si fuera posible determinar experimentalmente la estabilidad de la proteína monitorizando cada residuo individual. Por tanto, las variaciones en las constantes de estabilidad por residuo permiten una evaluación de las diferencias de estabilidad estructural entre regiones de la proteína. En muchos casos, los factores de protección de intercambio de hidrógeno medidos por RMN permiten una determinación experimental de las constantes de estabilidad aparente por residuo (Hilser y col., 1996 (a); Hilser y col., 1997 (a); Hilser y col., 1997 (b)).
Ejemplo 1 Predicción de afinidades de unión de inhibidores de la proteasa del VIH-1
La proteasa del VIH-1 ha sido objeto de intensa investigación durante los últimos años. El desarrollo de inhibidores de la proteasa es un esfuerzo importante para varias compañías farmacéuticas, ya que la inhibición satisfactoria de esta proteína detiene la maduración viral. Los inhibidores de la proteasa del VIH-1 son análogos de sustrato, es decir, funcionan compitiendo con los sustratos naturales por el sitio activo. Debido a que los sustratos se hidrolizan rápidamente por la proteasa, las estructuras cristalográficas de complejos enzima/sustrato no pueden obtenerse, creándose así obstáculos adicionales para el procedimiento de diseño.
En el ejemplo presentado en este documento, la conocida estructura de la proteasa del VIH-1 con el inhibidor Ace-Thr-Ile-Nle-Nle-Gln-Arg-NH_{2} (4hvp del archivo pdb) se usa para generar la estructura del sustrato cromogénico ampliamente usado Lys-Ala-Arg-Val-Nle-NPhe-Glu-Ala-Nle-NH_{2}. En las formulas químicas, Nle representa norleucina y NPhe p-nitro-fenilalanina. El inhibidor tiene seis aminoácidos con un enlace peptídico reducido entre Nle 3 y Nle 4. Por otra parte, el sustrato tiene nueve aminoácidos, sólo uno de ellos (Nle 3) se conserva del inhibidor. Por consiguiente, el diseño del sustrato se hace usando el inhibidor como un péptido más destacado y poniendo en práctica una combinación de mutaciones y extensiones de péptidos en ambos extremos carboxi y amino (figura 9).
El algoritmo de Woolford se aplicó a la estructura cristalográfica de VIH-1 y se le pidió que buscara dianas de unión sin especificar a priori la localización del sitio de unión natural. Woolford predice correctamente la localización del sitio de unión principal, incluyendo la participación de aminoácidos de tanto la región de lengüeta como del cuerpo principal de la proteína (figura 8). Debe tenerse en cuenta que el algoritmo también predice la presencia de sitios adicionales con potencial diana. Estos sitios adicionales representan dianas potenciales secundarias que pueden explorarse para el desarrollo de nuevos fármacos.
El siguiente estudio de la unión de la proteasa del VIH-1 a inhibidores de proteasa del VIH-1 conocidos ilustra funciones de parametrización de energía que pueden usarse en el procedimiento de la invención. Sin embargo, la invención no se limita al uso de estas funciones. Aquellos expertos en la materia pueden usar otras funciones.
Varios inhibidores de la proteasa del VIH-1 ya están en uso clínico y han mostrado una promesa significativa en tratamientos de combinación que incluyen inhibidores de nucleosidos o varios inhibidores de la proteasa. Un resultado clínico significativo ha sido la aparición de cepas virales que presentan resistencia a múltiples inhibidores de la proteasa del VIH-1 (Condra y col., 1995, Ho y col., 1994, Kaplan y col., 1994, Roberts, 1995, Tisdale, 1996).
La pérdida de sensibilidad a los inhibidores de la proteasa se produce porque las cepas virales resistentes codifican moléculas de proteasa que contienen mutaciones de aminoácidos específicos que disminuyen la afinidad por los inhibidores, manteniendo todavía suficiente afinidad por el sustrato. Todavía no están claros los orígenes de la resistencia. Mientras que algunas de las mutaciones observadas se localizan directamente en el sitio de unión, otras mutaciones están lejos del punto de unión. También es aparente que los diferentes inhibidores provocan diferentes modelos mutacionales y que los modelos de resistencia cruzada no son los mismos, a pesar del hecho de que todos los inhibidores eligen como diana el mismo sitio de unión.
Sería útil predecir la afinidad de unión de una molécula dada a la proteasa del VIH. El procedimiento descrito en este documento puede usarse para hacer tales predicciones.
La parametrización estructural de las energías de unión y plegamiento descritas más adelante explican cuantitativamente la unión de trece inhibidores de la proteasa del VIH-1 para los que están disponibles estructuras de alta resolución (A77003, A78791, A76928, A74704, A76889, VX478, SB203386, SB203238, SB206343, U100313, U89360, A98881, CGP53820). Las energías libres de unión para los inhibidores se predicen con una desviación estándar de \pm 1,1 kcal/mol o \pm 10%. Además, el formalismo predice correctamente el cambio observado en la constante de inhibición para el complejo de A77003 y el mutante de proteasa resistente V82A, para el que también está disponible la estructura de alta resolución. El análisis presentado en este documento proporciona un mapeo estructural de las diferentes contribuciones a las energías de unión. La comparación del mapa de unión con el mapa de estabilidad del residuo indica que el punto de unión en la molécula de proteasa tiene un carácter dual, la mitad del sitio de unión se define por la región más estable de la proteína, mientras que la otra mitad no está estructurada antes de la unión del inhibidor o sustrato. Esta característica del sitio de unión acentúa efectos cooperativos que permiten mutaciones en residuos distales que tienen un efecto significativo en la afinidad de unión. Estos resultados permiten una evaluación inicial de los efectos de mutaciones en la actividad de los inhibidores de la proteasa.
El desarrollo de estrategias satisfactorias para el diseño molecular basado en la estructura requiere la capacidad de predecir con exactitud afinidades de unión a partir de consideraciones estructurales. Se conoce la parametrización estructural de la energía de plegamiento y unión de proteínas y péptidos (D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996). Se ha mostrado que esta parametrización es suficientemente exacta para predecir las propensiones helicoidades de aminoácidos con una exactitud mejor de 0,2 kcal/mol (Luque y col., 1996), y para predecir correctamente la estabilidad global de proteínas y las constantes de estabilidad por residuo como se refleja en el modelo de factores de intercambio de hidrógeno detectados por RMN (Hilser y col., 1996 (a); Hilser y col., 1997 (a); Hilser y col., 1997 (b)).
Esta metodología se ha aplicado a la asociación de trece inhibidores diferentes de la proteasa del VIH-1 para los que están disponibles estructuras cristalográficas de alta resolución. Están disponibles las constantes de inhibición para estos inhibidores, algunos de los cuales están en ensayos clínicos o uso clínico. Los trece inhibidores son: A77003, A78791, A76928, A74704, A76889, VX478, SB203386, SB203238, SB206343, U100313, U89360, A98881, CGP53820 (Abdel-Meguid y col., 1994; Erickson y col., 1990; Fassler y col., 1993; Hoog y col., 1995; Kim y col., 1995; Lin y col., 1993; Madhusoodan y col., 1994; Thaisrivongs y col., 1995; Thompson y col., 1994). Sus estructuras se muestran en la figura 10. El análisis también se realizó en el complejo de A77003 con el mutante de proteasa resistente al inhibidor V82A para el que está disponible alta resolución (Baldwin y col., 1995).
El desarrollo de una nueva generación de inhibidores de la proteasa que trate eficazmente el asunto de la resistencia requiere un mejor entendimiento de las interacciones, tanto entre proteasa e inhibidores como entre proteasa y sustratos. La secuenciación de cepas virales de pacientes que se someten a tratamiento con inhibidores de la proteasa ha permitido identificar la localización y el carácter de las mutaciones, pero no ha proporcionado la descripción molecular del origen de la resistencia. El análisis presentado en este documento proporciona un mapeo estructural detallado de las energías de unión para trece inhibidores diferentes de la proteasa y una explicación cuantitativa de los efectos de la mutación V82A en la afinidad por el inhibidor A77003. Como tales, estos estudios deben ayudar en el desarrollo de una nueva generación de inhibidores.
El conjunto de constantes de estabilidad de residuos para la molécula de proteasa del VIH-1 se calculó de la estructura según el algoritmo de COREX (Hilser y col., 1996 (a), Hilser y col., 1997 (a), Hilser y col., 1997 (b)). En estos cálculos se usaron un total de 126.496 estados con grados de plegamiento que oscilaban de los estados nativos a los completamente desplegados. Los estados se generaron usando un bloque de deslizamiento de ventanas de 16 aminoácidos cada una. La energía de Gibbs, la función de partición y la probabilidad relativa de los 126.496 estados se calcularon usando la parametrización estructural de las energías descritas anteriormente.
La figura 11 muestra las afinidades de unión predichas y experimentales para los trece inhibidores de la proteasa del VIH-1 considerados en este documento. Para estos complejos proteasa/inhibidor para los que está disponible la estructura de la enzima libre, los cálculos se realizaron usando ambos, la estructura de la enzima libre (Spinelli y col., 1991), además de la estructura de la enzima en el complejo, pero sin el inhibidor, como proteína no ligada. Los resultados fueron equivalentes en ambos casos, siendo las diferencias en las energías de Gibbs en promedio inferiores a 0,5 kcal/mol. Para los casos en los que las desviaciones fueron mayores (2upj, 1hvi, 1hvj, 1hvk, 9hvp del archivo pdb), las desviaciones se hallaron en las conformaciones de cadena lateral de Phe 53B, Lys 55B, Arg 41A y Arg 41B. Estas cadenas laterales se exponen a disolventes y lejos del sitio de unión, que indica que las diferencias conformacionales no están referidas al inhibidor. El análisis estadístico de los datos revela que las energías libres de unión se predicen con una desviación estándar de \pm 1,1 kcal/mol y un error estándar de 0,3 kcal/mol. La desviación estándar asciende a una incertidumbre relativa de \pm 10%. El análisis de correlación entre los valores de \DeltaG experimentales y predichos da una pendiente de 0,982 con un coeficiente de correlación de 0,85. Las predicciones estructurales no muestran desviaciones sistemáticas y son suficiente exactas para permitir un examen de las diferentes contribuciones a la energía de
unión.
Según el análisis, la unión de los trece inhibidores a la enzima está dominada por el efecto hidrófobo. Con la unión, no sólo el propio inhibidor, sino también los residuos de proteasa localizados en el punto de unión, tapan una superficie no polar significativa del disolvente. De hecho, la fracción promedio de área no polar tapada por el disolvente con la unión es 0,737 \pm 0,02, que es mucho mayor que la fracción tapada por una proteína globular típica con el plegamiento (entre 0,55-0,60). Como es lógico, la mayor contribución a la energía de Gibbs de unión se da por la entropía favorable resultante de la liberación de las moléculas de agua asociadas con la desolvatación de estas superficies. Por otra parte, las contribuciones entálpicas debidas a esos efectos genéricos son desfavorables a temperatura ambiente ya que están dominadas por la entalpía positiva de desolvatar grupos hidrófobos. El desglose de las energías se resume en la tabla 1.
Los valores de capacidad calorífica enumerados en la tabla 1 son de la misma magnitud que los medidos para otros inhibidores de la proteasa (Gomez y col., 1995). La magnitud de los cambios de las capacidades caloríficas está dominada por cambios en la solvatación de grupos polares y no polares y no se espera que esté significativamente afectada por otras interacciones (Gomez y col., 1995). Los valores de las entalpías enumeradas en la tabla 1 sólo incluyen contribuciones genéricas y no pueden compararse directamente con valores experimentales ya que no están incluidas las contribuciones electrostáticas y otras. Esta entalpía genérica está compuesta fundamentalmente de dos efectos opuestos, un componente favorable debido a la formación de enlaces de van der Waals, de hidrógeno y otras interacciones entre el inhibidor y la proteasa, y un componente desfavorable debido a la desolvatación. Debido al carácter sumamente hidrófobo de los inhibidores, el término dominante es el término de desolvatación. Sin embargo, esto no es un fenómeno general como se demuestra para la unión de algunos inhibidores de péptidos que presenta una entalpía favorable en ciertas condiciones (Gomez y col., 1995 (b)). Como se muestra en la tabla 1, los términos de estructura/solvatación incluidos en \DeltaG_{gen} hacen la mayor contribución a la energía de Gibbs total de unión. Todos los inhibidores son sumamente hidrófobos y carecen de grupos polares. Por este motivo se predice que las interacciones electrostáticas contribuyen muy poco a la energía de Gibbs de unión. La única contribución electrostática significativa descrita por la ecuación 10 surge del cambio en el entorno de Asp 25, Asp 29 y Asp 30, que pueden contribuir hasta 0,7 kcal/mol dependiendo del inhibidor. Esta contribución surge de la transferencia de carga del agua a un entorno con una constante dieléctrica algo inferior. Según los resultados experimentales de Garcia-Moreno y col. (Garcia-Moreno y col., 1997), la constante dieléctrica en el interior de una proteína no es inferior a \sim15. Según estos autores, la constante dieléctrica de diferentes regiones de proteínas oscila entre 15 y 78,5 dependiendo de la accesibilidad del disolvente.
Mapeo estructural de residuos de proteasa que contribuyen a la afinidad de unión
Para el conjunto entero de inhibidores, esencialmente el mismo conjunto de residuos de proteasa, aunque con diferente resistencia, se observó que contribuyen a las energías de unión, reflejando el hecho de que han sido elegidas como diana para el mismo sitio en la molécula. La tabla 2 resume los aminoácidos en la molécula de proteasa que contribuyen con más de 0,1 kcal/mol a la energía libre total de unión para al menos uno de los inhibidores. Los valores enumerados en la tabla no incluyen la contribución correspondiente al inhibidor (\sim 55% de la energía de Gibbs total de unión) o la entropía translacional que no puede atribuirse a un aminoácido particular. Las figuras 12A y 12B muestran la localización de estos aminoácidos en la estructura de proteasa.
Desde un punto de vista energético, el punto de unión se define por aminoácidos que pertenecen a cuatro regiones no contiguas en la secuencia. Los aminoácidos en la región contienen el grupo Asp catalítico (Asp25, GIy27, A1a28, Asp29, Asp30), la denominada región de lengüeta (Met 46, Ile 47, Gly 48, Gly 49, Ile 50), la hebra entre los residuos 80-86 (Pro 81, Val 82, Ile 84) y Arg8 que contribuye significativamente a la energía de unión. Debido a la estructura química de los inhibidores, ambas cadenas en la molécula de proteasa contribuyen de un modo más o menos simétrico a la energía de Gibbs total de unión. En todos los casos, la región que contiene el grupo Asp catalítico es la mayor contribuyente a la energía de unión.
Estabilidad estructural de residuos de proteasa que contribuyen a la unión del inhibidor
La figura 13 muestra las constantes de estabilidad de residuos calculadas para la molécula de proteasa del VIH-1. Estas constantes mapean la molécula de proteína en términos de la estabilidad estructural de regiones diferentes (Hilser y col., 1996 (a); Hilser y col., 1997 (a); Hilser y col., 1997 (b)). Los residuos de proteínas con una alta probabilidad de estar en la conformación nativa se caracterizan por altas constantes de estabilidad, mientras que los residuos que son más probables de no estar estructurados tienen bajas constantes de estabilidad.
Se predice que dos regiones de la molécula de proteasa del VIH-1 tienen la mayor estabilidad. La región que incluye los residuos 13-32 y la región que incluye los residuos 82-92. Estas dos regiones están distantes en la secuencia, pero próximas en el espacio tridimensional y definen, hasta un grado significativo, el núcleo hidrófobo de la molécula. Se predice que las partes de estas dos regiones (residuos 23-29 en el extremo amino y 86-99 en el extremo carboxi), además de los nueve primeros residuos en la secuencia, contribuyen significativamente a la interfase de dimerización. Se predice que esta región de la proteína está plegada y bien estructurada en la inmensa mayoría de los estados conformacionales que son accesibles a la proteasa en condiciones nativas. La tríada del sitio activo (Asp 25, Thr 26, Gly 27) está localizada en la parte más estable de la molécula como se muestra en las figuras 12A y 12B. Esta conclusión concuerda con los resultados de los análisis cristalográficos que identifican este área de la molécula como bastante rígida debido a una densa red de enlaces de hidrógeno (Wlodawer y col., 1993). Los residuos 82-92 comprenden la mayoría de la hélice h' bien definida y sumamente estable. A la inversa, la región entre los residuos 40-60, que se corresponde con la lengüeta, se caracteriza por constantes de estabilidad muy bajas por residuo y se predice que no está estructurada, incluso en condiciones nativas. En los complejos, la lengüeta está estabilizada por sus interacciones con los inhibidores. Se obtuvieron resultados similares con la estructura de la proteína libre (1hhp del archivo pdb) o con estructuras de proteínas obtenidas de complejos mediante la eliminación de las coordenadas del inhibidor. Esta observación sugiere que en el complejo proteasa/inhibidor la lengüeta está estabilizada por interacciones con el inhibidor y no con la proteína.
Las figuras 12A, 12B y 13 también indican la localización de los residuos que contribuyen significativamente a la energía de Gibbs de unión. Es obvio que el sitio de unión está compuesto de residuos que pertenecen a las regiones más y menos estables de la molécula de proteasa. Este carácter dual del punto de unión define uno de los rasgos más fundamentales de la unión del inhibidor a la molécula de proteasa. Esencialmente, la mitad del sitio de unión está previamente formado, mientras que la otra mitad se forma durante la unión. La región más estable (que contiene componentes del sitio de unión Asp 25, Gly 27, Ala 28, Asp 29, Asp 30, Pro 81, Val 82, Ile 84) está esencialmente bloqueada en una conformación competente por la unión antes de que se produzca la unión. Por otra parte, la región de lengüeta (que contiene componentes del sitio de unión Met 46, Ile 47, Gly 48, Gly 49, Ile 50) no está estructurada en buena parte antes de la unión y está forzada a una única conformación por su interacción con el inhibidor. Por este motivo, los residuos de proteasa que no están en contacto directo con el inhibidor, pero que pueden afectar, estructural o energéticamente, la facilidad con la que la lengüeta adopta su conformación de unión, influirán las energías de unión globales.
La base molecular de la resistencia de la proteasa
Las energías de unión descritas anteriormente proporcionan cierto entendimiento sobre la naturaleza de los cambios en los mutantes de la proteasa del VIH-1 que se han observado que provocan resistencia in vivo a múltiples inhibidores. Se han identificado varias mutaciones en cepas virales de pacientes tratados con inhibidores de la proteasa. Por ejemplo, se ha mostrado que el tratamiento con Ro31-8959 (saquinavir) induce consistentemente el mutante doble G48V + L90M (Roberts, 1995). La selección in vitro de mutantes por A77003 incluyen V821, M46L, M46F, V321, V32I + V82I y R8Q (Kaplan y col., 1994). Las variantes resistentes a VX478 que se han identificado son M461 y 150V (Schinazi y col., 1996; Tisdale, 1996). Un estudio reciente ha mostrado que cuatro mutaciones (M46I + L63P + V82T + 184V) son suficientes para provocar resistencia cruzada a los inhibidores MK639, XM323, A80987, Ro31-8959, VX478 y SC52151 (Condra y col., 1995). Algunas de estas mutaciones están localizadas en el punto de unión y se cree que afectan la afinidad de unión mediante una alteración directa de las interacciones proteasa/inhibidor. Otras mutaciones están en localizaciones distantes y se espera que afecten la afinidad mediante interacciones cooperativas.
En general, las mutaciones en la proteasa del VIH-1 pueden afectar las energías de unión mediante una interacción directa con el inhibidor, mediante un efecto cooperativo en que el aminoácido mutado no interacciona directamente con el inhibidor, pero afecta las interacciones entre los residuos de proteasa que provocan una interacción proteasa/inhibidor alterada, o mediante cualquier combinación de ambos. Por ejemplo, algunas mutaciones están localizadas o en la región de lengüeta o bisagra y algunas de ellas están distales del sitio de unión (por ejemplo L63P, A71 V). Como se trata anteriormente, la lengüeta está esencialmente desordenada en la enzima libre. Por tanto, si una mutación induce una barrera de energía sustancial para que la lengüeta adopte su conformación unida, afectará la afinidad de unión, aunque la mutación está distal del punto de unión. Las mutaciones como L63P o A71 V disminuirán los grados de libertad conformacionales de esa región y harán inaccesibles algunas conformaciones o energéticamente desfavorables (D'Aquino y col., 1996).
Se han medido las constantes de inhibición para A77003 hacia algunos mutantes (Kaplan y col., 1994) y hay un caso para el que también está disponible la estructura cristalográfica del complejo; el complejo de A77003 con la proteasa del VIH-1 del mutante V82A (Baldwin y col., 1995). Los cálculos termodinámicos basados en la estructura se realizaron en el complejo mutante dando una energía libre de unión de -12394 cal/mol comparada con el valor de -13167 cal/mol obtenido para el tipo natural. Estas energías libres se traducen en un reducción de 3,7 veces la afinidad de unión para el mutante que se compara favorablemente con la reducción de 4 veces medida experimentalmente (Baldwin y col., 1995). Más importante que la comparación numérica es el mecanismo mediante el que una única mutación afecta la afinidad de unión. El mapeo estructural de las energías de unión en los complejos salvajes y mutantes revela que el hecho de la mutación no puede asignarse a un único sitio y que la energía libre de Gibbs de unión está redistribuida por todo el punto de unión. Este resultado está de acuerdo con el análisis cristalográfico de Baldwin y col. (Baldwin y col., 1995), quienes también concluyeron que el efecto de la mutación V82A no puede racionalizarse por la deleción de un único grupo metilo en cada cadena, y que el efecto global es debido a que la reorganización del esqueleto inducida por esa mutación. La figura 14 muestra los valores de \Delta\DeltaG calculados entre el tipo mutante y salvaje para todos los residuos que contribuyen con más de 0,1 kcal/mol a la energía libre de unión. Este caso ilustra muy claramente que, incluso para la sustitución de un único grupo metilo, la energía de Gibbs de unión no puede racionalizarse mediante la simple adición de contribuciones de grupo. Las contribuciones tales como aquellas tabuladas en la tabla 2 dependen del contexto global de cada grupo. También indica que la interpretación del efecto de mutaciones en la afinidad de unión de un inhibidor requiere un análisis global, aunque la mutación está localizada en el punto de unión.
La energía libre de unión del inhibidor a la molécula de proteasa refleja un discreto equilibrio entre términos de entalpía y entropía mutuamente compensatorios. Estos términos compensatorios definen los controles termodinámicos principales en el diseño molecular. Las modificaciones moleculares que dan como resultado una entalpía más favorable ocasionan contribuciones de entropía desfavorables, un fenómeno conocido como compensación de entalpía-entropía. Por tanto, los propios cambios de entalpías y entropías están compuestos de contribuciones opuestas. La entalpía de desolvatación se opone a la entalpía de formación de interacciones internas, y la entropía conformacional se opone a la entropía de desolvatación. El diseño molecular requiere una predicción exacta de estos efectos con el fin de minimizar las consecuencias no deseadas de cambios compensatorios.
La alta exactitud con la que pueden predecirse las afinidades de unión de varios inhibidores de la proteasa del VIH-1 a partir de la estructura sugiere que la aproximación presentada en este documento pueden usarse para ayudar en el diseño de nuevos inhibidores de la proteasa. Además, dado que la parametrización estructural de las energías de unión explica bien el cambio observado en la constante de inhibición entre el tipo natural y un mutante resistente de la proteasa del VIH-1 para el que está disponible la estructura de alta resolución, esta aproximación tiene potencial para tratar el asunto de la resistencia en el diseño molecular.
Ejemplo 2 Aplicación del diseño termodinámico basado en la estructura de inhibidores de péptidos de la endotiapepsina de la proteasa aspártica
El desarrollo de una parametrización de la estructura de las energías de plegamiento y unión de la proteína (Bardi y col., 1997; D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996) ha mostrado ser suficientemente exacto para predecir las propensiones helicoidades de aminoácidos con una exactitud mejor de 0,2 kcal/mol (Luque y col., 1996), para predecir correctamente la estabilidad global de proteínas y las constantes de estabilidad por residuo como se refleja en el modelo de los factores de protección de intercambio de hidrógeno detectados por RMN (Hilser y col., 1996 (c); Hilser y col., 1997 (a); Hilser y col., 1997 (b)), y para predecir la afinidad de unión de trece inhibidores de la proteasa del VIH-1 para los que están disponibles estructuras de alta resolución con una exactitud mejor a \pm 1 kcal/mol (Bardi y col., 1997). Debido a que la parametrización ha alcanzado el estado en el que parece posible la exacta predicción de energías de plegamiento de proteínas o afinidades de unión, parece apropiado empezar el desarrollo de estrategias de diseño molecular basadas en estos principios termodinámicos.
Las proteinasas aspárticas comprenden una gran familia de enzimas ampliamente distribuidas encontradas en vertebrados, hongos, plantas y retrovirus. Algunos miembros de la familia han llegado a ser el foco de interés creciente debido a su relevancia médica, por ejemplo, la proteasa del VIH codificada por el virus de la inmunodeficiencia humana que desempeña un papel principal en la maduración del virus, la renina que desempeña un papel importante en la regulación de la tensión arterial, catepsina D, una enzima clave en la degradación intracelular de proteínas y de la que se sospecha que participa en procedimientos tales como el catabolismo de proteínas, procesamiento de antígenos, enfermedades degenerativas y progresión del cáncer de mama, etc. Previamente se ha mostrado que la endotiapepsina es un modelo de buen comportamiento para el análisis termodinámico de proteasas aspárticas (Gomez y col., 1995 (b)). En particular, la asociación del inhibidor general de proteasas aspárticas, pepstatina A, se ha estudiado en gran detalle con esta proteína (Gomez y col., 1995 (b)). Además, las estructuras cristalográficas del complejo de endotiapepsina con pepstatina A, además de la proteína libre, son conocidas (Bailey y col., 1993; Blundell y col., 1990), facilitando así la aplicación y prueba de las estrategias de diseño basadas en la estructura tratadas en este documento.
En el ejemplo presentado en este documento se ha puesto en práctica un simple algoritmo de minimización para identificar la secuencia de un ligando de péptido que satisface criterios de unión predeterminados. El punto de partida de este algoritmo es la estructura de alta resolución del complejo péptido/proteína que se usa como una plantilla para mutaciones y el análisis conformacional. La aplicación satisfactoria de este algoritmo a la asociación de pepstatina A y endotiapepsina demuestra que la parametrización estructural de las energías puede usarse en el diseño molecular racional.
Este ejemplo trata de la modificación de un ligando de péptido y el diseño de variantes de péptidos que presentan diferentes afinidades de unión para la proteína diana. Se consideran dos procedimientos no mutuamente exclusivos. Las mutaciones en la secuencia mediante la sustitución de cadenas laterales en posiciones existentes en el péptido y la alteración de la longitud de cadena del péptido mediante la adición o deleción de aminoácidos. En todos los casos, el punto de partida es un complejo péptido/proteína para el que se conoce la estructura de alta resolución. Se supone que la estructura global del complejo mutado permanece esencialmente inalterada y que los efectos de una mutación están restringidos a sus alrededores inmediatos.
Una vez que se hace la mutación es necesario mostrar el conjunto de posibles conformaciones y evaluar la energía y probabilidad correspondiente de cada conformación. La probabilidad de una única conformación de péptido, definida por un conjunto específico de coordenadas de las cadenas laterales y el esqueleto, viene impuesta por una función de energía de Gibbs, \DeltaG_{ef}, especificada por la entalpía de interacciones péptido/proteína intra e intermoleculares más la entalpía y entropía de solvatación. \DeltaG_{ef} es una función de los ángulos de torsión de las cadenas laterales y el esqueleto. Por definición, la entropía conformacional del propio péptido no entra dentro de la ecuación. \DeltaG_{ef} es la función de energía de Gibbs o función de potencial de Gibbs de una única conformación y no debe confundirse con la energía de Gibbs de unión que incluye todas las conformaciones aceptables. La situación se ilustra en las figuras 15A y 15B para dos conformaciones hipotéticas de una cadena lateral. Estas conformaciones no sólo presentan diferentes interacciones intramoleculares, sino también diferentes grados de solvatación que definen la función de energía de Gibbs, \DeltaG_{ef}. La probabilidad de cualquier conformación dada viene dada por la ecuación
113
en la que e^{- \Delta G} _{ef,i}/RT es el exponente de Boltzmann para esa conformación, y la suma en el denominador es la función de partición conformacional definida como la suma de los exponentes de Boltzmann de todas las conformaciones. La función de potencial de Gibbs, \DeltaG_{ef}, se usa para identificar la conformación más probable de una cadena lateral o esqueleto. Para cualquier conformación dada, \DeltaG_{ef} se calcula a partir de la estructura usando la parametrización estructural de las energías descritas anteriormente (Bardi y col., 1997; Gomez y col., 1995 (a); Gomez y col., 1995 (b); D'Aquino y col., 1996; Hilser y col., 1996 (b); Luque y col., 1996) sin incluir la entropía conformacional.
Las conformaciones de cadenas laterales se generan variando sistemáticamente los ángulos diédricos entre 0° y 360° (\chi_{1} para Cys, Ser, Thr y Val; y \chi_{2} para Asn, Asp, His, Ile, Leu, Phe, Trp, Tyr; \chi_{1}, \chi_{2} y \chi_{3} para Gln, Glu, Met; \chi_{1}, \chi_{2}, \chi_{3} y \chi_{4} para Lys; y \chi_{1}, \chi_{2}, \chi_{3}, \chi_{4} y \chi_{5} y para Arg). Para estas cadenas laterales con un único diedro, el valor de \chi_{1} varía cada grado, para cadenas con hasta tres diedros cada 10°, y para números mayores cada 30°. Para conformaciones del esqueleto los ángulos de torsión \phi y \psi también varían cada 10° entre 0° y 360°.
Pueden hacerse refinamientos identificando conformaciones que están próximas a un mínimo de energía y reducen los intervalos de rotación. No todas las conformaciones generadas de este modo son factibles debido a impedimentos estéricos. Para cada conformación se comprueban las colisiones de van der Waals usando el conjunto de MMII de radios de van der Waals eficaces publicados por Iijima y col. (Calibration of effective van der Waals atomic contact radii for proteins and peptides, Protein, 2:330-339, 1987). Se rechazan aquellas conformaciones que presentan colisiones de van der Waals. La función de potencial de Gibbs \DeltaG_{ef} sólo se calcula para conformaciones permitidas. Este algoritmo de minimización se ha puesto en práctica en el programa informático CALVIN.
Se probó la capacidad de la parametrización estructural para localizar correctamente mínimos de energía mediante la aplicación del algoritmo de minimización para la optimización de conformaciones de cadena lateral en posiciones centrales de hélices alfa expuestas. Los perfiles de energías resultantes y en particular la localización de los mínimos y submínimos se caracterizaron bien por el algoritmo y concuerdan bien con los publicados anteriormente (Janin y col., 1978; Lee y col., 1994). Los resultados obtenidos para fenilalanina se ilustran en la figura 16.
Generación de péptidos mutados
En todos los casos, los conjuntos de coordenadas para los complejos entre la proteína y los péptidos mutados se generan usando las coordenadas del complejo de tipo natural como una plantilla. Los mutantes de sustitución se crean mediante la sustitución de la cadena lateral original con la mutación deseada, dejando el esqueleto en la conformación original. Para mutaciones que implican la adición de un aminoácido extra en cualquier extremo de la cadena del péptido, los ángulos de torsión del esqueleto también están incluidos en la minimización.
La pepstatina A (Iva-Val-Val-Sta-Ala-Sta, en la que Iva representa ácido isovalérico) es un potente inhibidor y de procedencia natural de la proteinasa aspártica. El inhibidor contiene dos residuos del aminoácido inusual estatina (Sta: ácido 4(S)-amino-3(S)-hidroxi-6-metilheptanoico). La estatina central actúa como un estado de transición no hidrolizable de manera análoga a los dos residuos que contribuyen al enlace peptídico escindible en el sustrato. Se estudiaron dos diferentes mutaciones de pepstatina A. En la primera se eligió como diana para la sustitución Ala 5, que se identificó antes como un débil contribuyente a la energía de Gibbs de unión (Gomez y col., 1995 (b)). En esta posición se consideraron doce mutaciones posibles (Cys, Gly, His, Ile, Leu, Met, Phe, Ser, Thr, Trp, Tyr, Val). Para cada una de estas mutaciones se identificó la conformación más probable. En el segundo caso se consideró la adición de un aminoácido al extremo carboxi de pepstatina A. En este caso se realizó una optimización simultánea de las conformaciones de la cadena lateral y el esqueleto con el fin de identificar la conformación más probable.
Cálculo de las afinidades de unión
La afinidad de unión del péptido para la proteína viene impuesta por la energía de Gibbs de unión que se calcula a partir de las estructuras del complejo, la proteína libre y el péptido libre como se describen anteriormente (Bardi y col., 1997; D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996). Para cada complejo mutante se usaron las coordenadas atómicas correspondientes a la conformación que minimiza la función de potencial de Gibbs. Para los péptidos libres, las accesibilidades del disolvente se corresponden con un promedio en peso de Boltzmann de las conformaciones de las cadenas laterales y del esqueleto (Luque y col., 1996).
La figura 17 muestra el perfil del potencial de Gibbs como una función de los diedros de cadenas laterales \chi_{1} y \chi_{2} para el mutante A5F. Claramente se observa que el anillo aromático está esencialmente bloqueado en un estrecho conjunto de valores de \chi_{1}, mientras que tiene una probabilidad finita de mostrar un intervalo más amplio de valores de \chi_{2}. Las probabilidades a lo largo de \chi_{1} y \chi_{2} se determinan mediante una estadística de Boltzmann definida en términos del potencial de Gibbs de cada conformación. A lo largo del eje \chi_{1} y \chi_{2}, el perfil del potencial de Gibbs muestra un mínimo bien definido a 169° y 51°, respectivamente.
La figura 18 resume las diferencias esperadas en energías de Gibbs calculadas para las diferentes mutaciones de aminoácidos en la posición 5. Los valores de \Delta\DeltaG están referidos al tipo natural. Es obvio en el gráfico que los aminoácidos aromáticos (Phe, Trp y Tyr) están predichos para provocar el mayor aumento en la afinidad de unión. Las constantes de unión predichas para los tres aminoácidos aromáticos están dentro de 0,2 kcal/mol, que está por debajo de la incertidumbre de predicción esperada y no pueden considerarse estadísticamente significativas. Para comprobar la predicción termodinámica basada en la estructura se sintetizó el mutante A5F de pepstatina A y la constante de inhibición global se determinó experimentalmente. Como se muestra en la tabla 3, según el comportamiento predicho, el mutante A5F se une a endotiapepsina más fuertemente que la propia pepstatina A. Su constante de unión predicha, 7,4 x 10^{9} M^{-1}, está muy próxima a la experimentalmente determinada, 5,3 x 10^{9} M^{-1}, y la desviación de \DeltaG de su valor predicho (0,2 kcal/mol) está dentro del error experimental. Desafortunadamente, debido a que el mutante A5F es más hidrófobo que la pepstatina A de tipo natural y presenta menor solubilidad en agua, en este caso no fue posible una medición calorimétrica directa del cambio de la entalpía de unión y de la capacidad calorífica.
La segunda mutación considerada en este estudio implicó la adición de un aminoácido en el extremo carboxi del péptido. Con el fin de mejorar la solubilidad del péptido y facilitar el análisis calorimétrico, se decidió añadir un residuo de glutamato a pesar de la predicción de una menor afinidad de unión. A 16°C, la unión de este inhibidor fue exotérmica y se caracterizó por un cambio de entalpía (\DeltaH) de -4,6 \pm 0,1 kcal/mol. El cambio de la capacidad calorífica (\DeltaC_{p}) obtenido a partir de la dependencia de la temperatura de la entalpía de unión fue igual a -260 \pm 20 cal/K\cdotmol. Para comparación, la capacidad calorífica calculada de la estructura derivada es -220 cal/K\cdotmol, y el cambio de entalpía genérica, excluyendo los efectos de protonación, es -6,8 kcal/mol. Estos valores son del mismo orden que los medidos para pepstatina A en las mismas condiciones (\DeltaH = -4,1 kcal/mol y \DeltaC_{p} = -310 cal/K-mol)^{2}. Este resultado indica que la diferencia principal en las afinidades de unión entre el tipo natural y el mutante de adición E7 es fundamentalmente entrópica.
Los parámetros termodinámicos experimentales y calculados para pepstatina A y las dos mutaciones se resumen en la tabla 3. Como se predice, el mutante A5F tiene una afinidad más alta que la pepstatina A de tipo natural, mientras que el mutante de adición E7 tiene una afinidad inferior que el tipo natural. La concordancia entre los valores de \DeltaG predichos y experimentales es excelente. La diferencia promedio entre \DeltaG predicha y experimental es 0,23 \pm 0,06 kcal/mol. Este resultado indica que la parametrización basada en la estructura de las energías tiene suficiente sensibilidad y resolución para el diseño de péptidos.
Para endotiapepsina se conocen las estructuras de alta resolución de la proteína en su forma libre y unida y son posibles cálculos exactos de afinidades de unión. Sin embargo, en muchos casos sólo se conoce la estructura del complejo. Si este es el caso, las energías de Gibbs de unión del mutante respecto al tipo natural todavía pueden calcularse con la misma exactitud, y por tanto el diseño de péptidos puede hacerse con la misma precisión. Esta situación persiste aunque haya un cambio conformacional significativo entre las proteínas libres y complejadas.
Mapeo estructural de energías de unión
En pepstatina A, el residuo de alanina en la posición 6 está localizado en un sitio hidrófobo relativamente grande sin establecer buenos contactos de van der Waals con la enzima y sin tapar una superficie significativa del disolvente (figura 19A). Se predice que Phe, Tyr y Trp presentan una afinidad más alta debido a que el anillo aromático de estos aminoácidos se ajusta parcialmente en esa cavidad y optimiza las interacciones con Leu 133, Ser 78, Ile 77 y Ser 39 como se muestra en la figura 19B. Aunque el anillo aromático de fenilalanina sólo se tape parcialmente, las interacciones y la desolvatación adicional presentada por Leu 133, Ser 78, Ile 77 y Ser 39 proporcionan más de la energía de Gibbs adicional de unión.
La energía de Gibbs de unión del mutante A5F es aproximadamente 1 kcal/mol más favorable que el tipo natural. La contribución debido a la entropía de desolvatación adicional que se produce tapando un número mayor de grupos hidrófobos es próxima a 4 kcal/mol. Sin embargo, esta contribución entrópica está parcialmente compensada por un cambio de entalpía menos favorable (\sim2 kcal/mol más positiva para A5F) y una mayor pérdida de entropía conformacional (\sim1 kcal/mol) debido a las restricciones adicionales en los grados de libertad de la cadena lateral con la formación del complejo. El cambio de entalpía para A5F es menos favorable que para el tipo natural porque la entalpía de desolvatación adicional no puede completarse completamente por las interacciones adicionales entre el péptido y la molécula de proteasa. Como es el caso en todos los procedimientos de unión, simultáneamente se producen varias interacciones de compensación: 1) compensación de entalpía/entropía; 2) compensación entálpica entre interacciones de solvatación/intermoleculares; y 3) compensación entrópica entre entropía de solvatación y conformacional. Como resultado, el cambio de energía libre global es más pequeño que las contribuciones aisladas.
En el caso del mutante E7, la longitud del péptido se ha aumentado en el extremo carboxi. El glutamato adicional indica hacia fuera del cuerpo de la proteína y no interacciona significativamente con ningún residuo. Esto se refleja en las entalpías similares y las capacidades caloríficas observadas para este mutante y la pepstatina A de tipo natural. La diferencia en las energías de Gibbs de unión es principalmente entrópica y debida fundamentalmente a la pérdida de entropía conformacional del glutamato con la unión. Esta pérdida de entropía conformacional no está compensada por una interacción favorable ni entálpica ni entrópica, y da como resultado un aumento significativo en \DeltaG y la consiguiente pérdida de afinidad de unión. La figura 20 muestra la localización predicha del residuo de glutamato.
Los resultados presentados en este documento demuestran que la parametrización estructural de las energías desarrolladas anteriormente en este laboratorio (Bardi y col., 1997; D'Aquino y col., 1996; Gomez y col., 1995 (a); Gomez y col., 1995 (b); Hilser y col., 1996 (b); Luque y col., 1996) tiene la exactitud y resolución necesaria para usarse en algoritmos de minimización para el diseño molecular. El algoritmo descrito en este documento ha permitido el diseño de dos péptidos mutantes que presentan energías de unión experimentales similares a las predichas mediante ordenador. El éxito de este procedimiento valida el uso de esta aproximación en el diseño de ligandos de péptidos.
Puesta en práctica
Los procedimientos y mecanismos descritos en este documento no se limitan a ninguna configuración particular de hardware o software, sino que pueden encontrar aplicabilidad en cualquier entorno informático o de procesamiento usado junto con servicios informáticos en línea.
La invención puede ponerse en práctica en hardware o software, o una combinación de ambos. Sin embargo, preferentemente, la invención se pone en práctica en programas informáticos ejecutados en ordenadores programables, comprendiendo cada uno al menos un procesador, al menos un sistema de almacenamiento de datos (que incluye memoria volátil y no volátil y/o elementos de almacenamiento), al menos un dispositivo de entrada y al menos un dispositivo de salida. El código de programa se aplica para introducir datos para realizar las funciones descritas en este documento y generar información de salida. La información de salida se aplica de modo conocido a uno o más dispositivos de salida.
Cada programa se pone en práctica preferentemente en un lenguaje de programación de procedimiento de alto nivel u orientado a objetos para comunicar con un sistema informático.
Sin embargo, los programas pueden ponerse en práctica en conjunto o lenguaje de máquina, si se desea. En cualquier caso, el lenguaje puede ser un lenguaje compilado o interpretado.
Cada uno de tales programas informáticos se almacena preferentemente en un medio o dispositivo de almacenamiento (por ejemplo, ROM o disquete magnético) legible por un ordenador programable para fines generales o especiales, para configurar y hacer funcionar el ordenador cuando el medio o dispositivo de almacenamiento es leído por el ordenador para realizar los procedimientos descritos en este documento. El sistema inventivo también puede considerarse como puesto en práctica como un medio de almacenamiento legible por ordenador configurado con un programa informático, en el que el medio de almacenamiento así configurado hace que un ordenador funcione de un modo específico y predefinido para realizar las funciones descritas en este documento.
Se han descrito varias realizaciones de la presente invención. Sin embargo, se entenderá que pueden hacerse diversas modificaciones sin apartarse del alcance de la invención. Por consiguiente, otras realizaciones están dentro del alcance de las reivindicaciones.
TABLA I
1
2
3
TABLA III
4
Bibliografía
Abdel-Meguid, S.S. y col., Biochem., 1994, 33:11671-11677
Bailey y col., Biochem., 1993, 289:363-371.
Baldwin y col., Nature Struc. Biol., 1995, 2:244-249.
Baldwin, R.L., Proc. Natl. Acad. Sci. USA, 1986, 83:8069-8072.
Bardi y col., Biochem., 1997, 36:6588-6596.
Blundell y col., J. Mol. Biol., 1990, 211:919-941.
Brown y col., Agric. Biol. Chem., 1990, 54:1563-1565.
Cabani y col., J. Sol. Chem., 1981, 10:563-595.
Cha, S., Biochem. Pharmac., 1975, 24:2177-2185.
Condra y col., Nature, 1995, 374:569-571.
DAquino y col., Proteins, 1996, 25:143-156.
Dunn y col., Biochem. J., 1986, 237:899-906.
Erickson y col., Science, 1990, 249:527-529.
Fassler y col., Bioorg. Med. Chem. Lett., 1993, 3:2817-2842.
Freire y col., Anal. Chem., 1990, 62:950A-959A.
Freire y col., J. Mol. Biol., 1991, 222:687-698.
Freire, E., Archives Biochem. Biophys., 1993, 303:181-184.
Garcia-Moreno y col., Methods Enzymol., 1995, 259:512-538.
Garcia-Moreno y col., BioDhvs. Chem. In Press, 1997.
Gomez y col., Proteins: Structure, Function and Genetics, 1995, 22:404-412.
Gomez y col., J. Mol. Biol., 1995 (b), 252:337-350.
Gomez y col., "Structure and Function of Aspartic Proteinases: Retroviral and Cellular Enzymes", (Eds. James, M.N.G.), Plenum Publishing Co., Nueva York, 1997.
Hilser y col., J. Mol. Bio., 1996 (a), 262:756-772.
Hilser y col., Proteins, 1996 (b), 26:123-133.
Hilser y col., Proteins, 1997 (a), 27:171-183.
Hilser y col., Biophysical Chem., 1997 (b), 64:69-79.
Ho, D.D. y col., J. Virol., 1994, 68, 2016-2020.
Hoog S.S. y col., J. Med. Chem., 1995, 38, 3246-3252.
Hyland, L.J. y col., Biochemistry, 1991, 30, 8454-8463.
Iijima y col., Proteins, 1987, 2:330-339.
Janin y col., J. Mol. Biol., 1978, 125:357-386.
Janin, J., Proteins, 1995, 21:30-39.
Kaplan y col., Proc. Natl. Acad. Sci. USA, 1994, 91:5597-5601.
Kauzmann, W., Adv. Protein Chem., 1959, 14:1-63.
Kim y col., J. Am. Chem. Soc., 1995, 117:1181-1182.
Kuzmic, P., Anal. Biochem., 1996, 237:260-273.
Larson y col., J. Diary Sci., 1970, 53:253-262.
Lee y col., J. Mol. Biol., 1971, 55:379-400.
Lee y col., Proteins: Struct. Func. and Genetics, 1994, 20:68-84.
Levitt, M., J. Mol. Biol., 1974, 82:393-420.
Lin y col., Biochem., 1993, 34:1143-1152.
Luque y col., Biochemistry, 1996, 35:13681-13688.
Luque y col., 1997 en la prensa.
Madhusoodan y col., J. Am. Chem. Soc., 1994, 116:847-855.
Murphy y col., J. Mol. Biol., 1992 (a), 227:293-306.
Murphy y col., Adv. Protein Chem., 1992 (b), 43:313-361.
Murphy y col., Proteins: Struct. Func. Genetics, 1993, 15:113-120.
Murphy y col., Proteins: Struct. Func. Genetics, 1994, 18:63-67.
Rich, D. H., en Proteinase Inhibitors (eds. Barret & Salvesen) (Elsevier Science Publishers, Nueva York, 1986).
Rich y col., Biochem. Pharmacol., 1980, 29.
Roberts, N. A., AIDS, 1995, 9:S27-S32.
Schellman, Compt. Rend. Tray..Carlsburg, Ser. Chim., 1955 (a), 29:230-259.
Schellman, C. R. Tray. Lab. Carlsburg Ser. Chim., 1955 (b), 29:223-229.
Schinazi y col., Int. Antiviral News, 1996, 4:95-100.
Smith y col., Nature Struc. Biol., 1996, 3:946-950.
Spinelli y col., Biochimie, 1991, 73:1391-1396.
Straume y col., ``Thermodynamic Strategies for Protein Design: Increased Temperature Stability. In Biocatalysis at Extreme Temperature: Enzyme Systems Near and Above 100°C, (Adams, M. W. W. & Kelly R. M., eds.) 1992, páginas 122-135, ACS Books, Washington, DC.
Thaisrivongs y col., J. Med. Chem., 1995, 38:3624-3637.
Thompson y col., J. Med. Chem., 1994, 37: 3100-3107.
Tisdale, M., Int. Antiviral News, 1996, 4.
Wang y col., Biochemistry, 1996, 35:9945-9950.
Whitaker, J.R., Methods in Enzymol., 1970, 19:436-445.
Williams y col., Methods Enzymol, 1979, 63:437-467.
Wiseman y col., Anal. Biochem., 1989, 179:131-135.
Wlodawer y col., Ann. Rev. Biochem., 1993, 62:543-585.
Xie y col., Proteins: Struct. Func. Genetics, 1994 (a), 19:291-301.
Xie y col., J. Mol. Biol., 1994 (b), 24:62-80.

Claims (12)

1. Un procedimiento asistido por ordenador para generar dianas de unión predichas de una molécula seleccionada, usando un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, que incluye las etapas de:
(a) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en la molécula seleccionada;
(b) determinar, usando el procesador, para cada átomo en la molécula seleccionada, una energía libre de Gibbs predicha de unión del átomo a un ligando ideal para el átomo
(c) generar, usando el procesador, un modelo de predicción tridimensional de dianas de unión en la molécula seleccionada mediante la generación, usando las coordenadas tridimensionales de cada uno de los átomos en la molécula seleccionada, de un modelo de átomos en la molécula seleccionada y mapear en cada átomo descrito en el modelo la energía libre de Gibbs de unión predicha correspondientemente determinada; y
(d) descargar, al dispositivo de salida, el modelo de predicción tridimensional generado de dianas de unión.
2. Un procedimiento asistido por ordenador para predecir la afinidad de unión de un ligando seleccionado para unirse a un sitio de unión seleccionado de una molécula seleccionada, usando un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, que incluye las etapas de:
(a) generar dianas de unión predichas de la molécula seleccionada según el procedimiento de la reivindicación 1;
(b) identificar el sitio de unión seleccionado como una región de la molécula seleccionada con una alta densidad de átomos con alto potencial de unión;
(c) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en el sitio de unión seleccionado de una molécula seleccionada;
(d) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en un compuesto seleccionado;
(e) generar, usando el procesador, un modelo del compuesto seleccionado unido al sitio de unión seleccionado;
(f) determinar, usando el procesador, las coordenadas tridimensionales de una estructura minimizada en energía del compuesto seleccionado cuando el compuesto seleccionado está unido al sitio de unión seleccionado; y
(g) determinar, usando el procesador, una afinidad de unión predicha del compuesto seleccionado minimizado en energía para el sitio de unión seleccionado.
3. Un procedimiento asistido por ordenador para construir un modelo de un ligando ideal para unirse a un sitio de unión seleccionado de una molécula seleccionada, usando un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, que incluye las etapas de:
(a) generar dianas de unión predichas de la molécula seleccionada según el procedimiento de la reivindicación 1;
(b) identificar el sitio de unión seleccionado como una región de la molécula seleccionada con una alta densidad de átomos con alto potencial de unión;
(c) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en el sitio de unión seleccionado de la molécula seleccionada;
(d) determinar, usando el procesador, la identidad y localización de un conjunto de átomos de ligando que son energéticamente complementarios a cada uno de los átomos en el sitio de unión seleccionado de la molécula seleccionada basado en la optimización global de la energía de Gibbs de unión de cada uno de los átomos de ligando en el conjunto de átomos de ligando;
(e) generar, usando el procesador, un modelo tridimensional del conjunto de átomos de ligando unido al sitio de unión seleccionado;
(f) descargar, al dispositivo de salida, el modelo tridimensional del conjunto de átomos de ligando unido al sitio de unión seleccionado.
\newpage
4. Un procedimiento asistido por ordenador para clasificar cada ligando en un conjunto de ligandos seleccionados por sus afinidades de unión predichas para unirse a un sitio de unión seleccionado de una molécula seleccionada, usando un ordenador programado que incluye un procesador, un dispositivo de entrada y un dispositivo de salida, que incluye las etapas de:
(a) generar dianas de unión predichas de la molécula seleccionada según el procedimiento de la reivindicación 1;
(b) identificar el sitio de unión seleccionado como una región de la molécula seleccionada con una alta densidad de átomos con alto potencial de unión;
(c) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en un sitio de unión seleccionado de una molécula seleccionada;
(d) determinar la afinidad de unión predicha de cada ligando en el conjunto de ligandos para el sitio de unión seleccionado de la molécula seleccionada mediante:
(i)
introducción en el ordenador programado, mediante el dispositivo de entrada, de datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en el compuesto seleccionado;
(ii)
generación, usando el procesador, de un modelo del compuesto seleccionado unido al sitio de unión seleccionado;
(iii)
determinación, usando el procesador, de las coordenadas tridimensionales de una estructura minimizada en energía del compuesto seleccionado cuando el compuesto seleccionado está unido al sitio de unión seleccionado; y (iv) determinación, usando el procesador, de una afinidad de unión predicha del compuesto seleccionado minimizado en energía para el sitio de unión seleccionado; y
(e) clasificar cada ligando según su afinidad de unión predicha determinada.
5. El procedimiento asistido por ordenador para generar dianas de unión predichas de una molécula seleccionada según la reivindicación 1, en el que las dianas de unión predichas están en una superficie interna no expuesta al disolvente de la molécula seleccionada, comprendiendo dicho procedimiento las etapas de:
(a) introducir en el ordenador programado, mediante el dispositivo de entrada, datos que incluyen la identidad y las coordenadas tridimensionales de cada uno de los átomos en un estado parcialmente desplegado seleccionado de la molécula seleccionada, incluyendo el estado parcialmente plegado seleccionado una parte plegada y una parte desplegada;
(b) determinar, usando el procesador, para cada átomo en la parte plegada del estado parcialmente desplegado seleccionado de la molécula seleccionada, una energía libre de Gibbs predicha de unión del átomo al ligando ideal para el átomo;
(c) generar, usando el procesador, un modelo de predicción tridimensional de dianas de unión en la parte plegada del estado parcialmente desplegado seleccionado de la molécula seleccionada mediante la generación, usando las coordenadas tridimensionales de cada uno de los átomos en la parte plegada del estado desplegado seleccionado de la molécula seleccionada, de un modelo de los átomos en la parte plegada del estado parcialmente desplegado seleccionado de la molécula seleccionada y mapear en cada átomo descrito en el modelo la energía libre de Gibbs predicha determinada correspondiente de unión; y
(d) descargar, al dispositivo de salida, el modelo de predicción tridimensional generado de dianas de unión.
6. El procedimiento de la reivindicación 2, en el que dicho ligando seleccionado es un dipéptido.
7. El procedimiento de la reivindicación 6, que incluye además: repetir las etapas (a)-(g) para una pluralidad de dipéptidos seleccionados e identificar como dipéptido más destacado el dipéptido seleccionado que tiene la mayor afinidad de unión determinada.
8. El procedimiento de la reivindicación 6 o la reivindicación 7, que incluye además:
(h) seleccionar un primer polipéptido de tres o más aminoácidos, incluyendo el polipéptido el dipéptido;
(i) generar, usando el procesador, un modelo del primer polipéptido seleccionado unido al sitio de unión seleccionado;
(j) determinar, usando el procesador, las coordenadas tridimensionales de una estructura minimizada en energía del primer polipéptido seleccionado cuando el primer polipéptido seleccionado está unido al sitio de unión seleccionado; y
(k) determinar, usando el procesador, una afinidad de unión predicha del primer polipéptido minimizado en energía para el sitio de unión seleccionado.
9. El procedimiento de la reivindicación 8, que incluye además:
(l) seleccionar un segundo polipéptido que incluye el primer polipéptido;
(m) generar, usando el procesador, un modelo del segundo polipéptido seleccionado unido al sitio de unión seleccionado;
(n) determinar, usando el procesador, las coordenadas tridimensionales de una estructura minimizada en energía del segundo polipéptido seleccionado cuando el segundo polipéptido seleccionado está unido al sitio de unión seleccionado; y
(o) determinar, usando el procesador, una afinidad de unión predicha del segundo polipéptido minimizado en energía para el sitio de unión seleccionado.
10. El procedimiento de la reivindicación 8, que incluye además:
(l) seleccionar una variante del polipéptido seleccionado;
(m) generar, usando el procesador, un modelo del polipéptido de variante seleccionada unido al sitio de unión seleccionado;
(n) determinar, usando el procesador, las coordenadas tridimensionales de una estructura minimizada en energía del polipéptido de variante seleccionada en el que el polipéptido de variante seleccionada está unido al sitio de unión seleccionado; y
(o) determinar, usando el procesador, una afinidad de unión predicha del polipéptido de variante seleccionado minimizado en energía para el sitio de unión seleccionado.
11. El procedimiento de la reivindicación 5, en el que el estado parcialmente desplegado seleccionado es el estado parcialmente desplegado que tiene la menor energía de Gibbs de cualquier estado parcialmente desplegado potencial de la molécula seleccionada.
12. Un producto de programa informático que reside en un medio legible por ordenador para realizar las etapas de una cualquiera las reivindicaciones 1 a 11 cuando dicho producto se ejecuta en un ordenador.
ES98925162T 1997-06-02 1998-06-02 Procedimiento informatico que utiliza calculos de energia libre para el diseño de ligandos y la prediccion de dianas de union. Expired - Lifetime ES2285774T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US4827497P 1997-06-02 1997-06-02
US48274P 1997-06-02
US6649597P 1997-11-25 1997-11-25
US66495P 1997-11-25

Publications (1)

Publication Number Publication Date
ES2285774T3 true ES2285774T3 (es) 2007-11-16

Family

ID=26725962

Family Applications (1)

Application Number Title Priority Date Filing Date
ES98925162T Expired - Lifetime ES2285774T3 (es) 1997-06-02 1998-06-02 Procedimiento informatico que utiliza calculos de energia libre para el diseño de ligandos y la prediccion de dianas de union.

Country Status (7)

Country Link
US (3) US6226603B1 (es)
EP (1) EP1025521B1 (es)
AT (1) ATE359561T1 (es)
CA (1) CA2292697C (es)
DE (1) DE69837555T2 (es)
ES (1) ES2285774T3 (es)
WO (1) WO1998054665A1 (es)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6027711A (en) * 1995-06-07 2000-02-22 Rhomed Incorporated Structurally determined metallo-constructs and applications
EP1228370A2 (en) * 1999-11-10 2002-08-07 Structural Bioinformatics Inc. Computationally derived protein structures in pharmacogenomics
TW486653B (en) * 2000-03-17 2002-05-11 Hitachi Ltd Chemical material integrated management system and method thereof
WO2001071347A1 (en) * 2000-03-23 2001-09-27 California Institute Of Technology Method and apparatus for predicting ligand binding interactions
CA2346588A1 (en) * 2000-05-08 2001-11-08 Molecular Simulations Inc. Methods and systems for estimating binding affinity
WO2002023189A1 (en) * 2000-09-12 2002-03-21 Johns Hopkins University Structural prediction of allosterism
JPWO2002025274A1 (ja) * 2000-09-20 2004-01-29 清野 祐子 反応検出方法、免疫反応検出方法及び装置
EP1209610A1 (fr) * 2000-11-28 2002-05-29 Valentin Capital Management Dispositif et procédé de détermination de données d'affinité entre une cible et un ligand
WO2002044990A2 (en) * 2000-11-28 2002-06-06 Valentin Capital Management Apparatus and method for determining affinity data between a target and a ligand
US20050014193A1 (en) * 2003-06-17 2005-01-20 Sharma Shubh D. Identification of target-specific folding sites in peptides and proteins
US7351690B2 (en) * 2000-12-19 2008-04-01 Palatin Technologies, Inc. Knockout identification of target-specific sites in peptides
WO2002054063A1 (en) * 2001-01-04 2002-07-11 Yeda Research And Development Co. Ltd. Database system and method useful for predicting the effect of amino acid substitutions on protein structure and stability
US20030032065A1 (en) * 2001-03-12 2003-02-13 Vince Hilser Ensemble-based strategy for the design of protein pharmaceuticals
WO2002073193A1 (en) * 2001-03-12 2002-09-19 Board Of Regents, The University Of Texas System Computer-based strategy for peptide and protein conformational ensemble enumeration and ligand affinity analysis
US7560424B2 (en) 2001-04-30 2009-07-14 Zystor Therapeutics, Inc. Targeted therapeutic proteins
US7629309B2 (en) * 2002-05-29 2009-12-08 Zystor Therapeutics, Inc. Targeted therapeutic proteins
ES2300439T3 (es) 2001-04-30 2008-06-16 Zystor Therapeutics , Inc. Reconocimiento subcelular de proteinas terapeuticas.
US20040005309A1 (en) * 2002-05-29 2004-01-08 Symbiontics, Inc. Targeted therapeutic proteins
EP1409982A4 (en) * 2001-06-14 2006-05-24 Anadys Pharmaceuticals Inc PROCESS FOR SCREENING ON LIGANDS OF TARGET MOLECULES
US7107156B2 (en) * 2001-07-23 2006-09-12 Accelrys Software Inc. Method and apparatus for estimating solvation energies of membrane bound molecules
US20030072761A1 (en) * 2001-10-16 2003-04-17 Lebowitz Jonathan Methods and compositions for targeting proteins across the blood brain barrier
US20090182542A9 (en) * 2001-12-22 2009-07-16 Hilton Jeremy P Hybrid classical-quantum computer architecture for molecular modeling
US6671628B2 (en) * 2002-03-04 2003-12-30 Chemnavigator, Inc. Methods for identifying a molecule that may bind to a target molecule
US20030216867A1 (en) * 2002-03-26 2003-11-20 Campbell Phil G. Methods and systems for molecular modeling
WO2003095494A1 (en) 2002-05-10 2003-11-20 Bio-Layer Pty Limited Generation of surface coating diversity
CA2487006A1 (en) * 2002-05-23 2003-12-04 Vince Hilser Predicting the significance of single nucleotide polymorphisms (snps) using ensemble-based structural energetics
DE60312330T2 (de) * 2002-06-10 2007-11-22 Algonomics N.V. Verfahren zur vorhersage der bindungsaffinität der mhc-peptid-komplexe
US20040034481A1 (en) * 2002-08-16 2004-02-19 Hurst John R. Methods for identifying a prospective binding site on a target molecule and for characterizing a site on a target molecule
US7660677B2 (en) * 2002-09-03 2010-02-09 Sei-ichi Tanuma Method of designing physiologically active peptide and use thereof
EP1610825A2 (en) * 2003-03-31 2006-01-04 Xencor, Inc. Methods for rational pegylation of proteins
US7610156B2 (en) 2003-03-31 2009-10-27 Xencor, Inc. Methods for rational pegylation of proteins
US7642340B2 (en) 2003-03-31 2010-01-05 Xencor, Inc. PEGylated TNF-α variant proteins
WO2005057462A1 (en) * 2003-12-12 2005-06-23 Bio-Layer Pty Limited A method for designing surfaces
DE602005020745D1 (de) * 2004-02-10 2010-06-02 Zystor Therapeutics Inc Saure alpha-glukosidase und fragmente davon
US20070239366A1 (en) * 2004-06-05 2007-10-11 Hilton Jeremy P Hybrid classical-quantum computer architecture for molecular modeling
US8168445B2 (en) 2004-07-02 2012-05-01 Bio-Layer Pty Limited Use of metal complexes
US20060052943A1 (en) * 2004-07-28 2006-03-09 Karthik Ramani Architectures, queries, data stores, and interfaces for proteins and drug molecules
US8117902B2 (en) * 2005-11-03 2012-02-21 University Of Massachusetts Nanopatterned surfaces and related methods for selective adhesion, sensing and separation
US20090306342A1 (en) * 2005-12-30 2009-12-10 Bio-Layer Pty Limited Binding of molecules
EP2004678A1 (en) * 2006-03-15 2008-12-24 Csir Modulation of glutamine synthetase activity
EP1916516A1 (en) 2006-10-27 2008-04-30 Bayer CropScience AG Method for the determination of intra- and intermolecular interactions in aqueous solution
EP2099523A2 (en) * 2006-11-13 2009-09-16 ZyStor Therapeutics , Inc. Methods for treating pompe disease
US20090006059A1 (en) * 2007-06-27 2009-01-01 Nidhi Arora Systems and methods for mapping binding site volumes in macromolecules
US7756674B2 (en) * 2007-08-03 2010-07-13 The Trustees Of Columbia University In The City Of New York Methods of calculating differences of binding affinities between congeneric pairs of ligands by way of a displaced solvent functional
US8374828B1 (en) 2007-12-24 2013-02-12 The University Of North Carolina At Charlotte Computer implemented system for protein and drug target design utilizing quantified stability and flexibility relationships to control function
US8244504B1 (en) 2007-12-24 2012-08-14 The University Of North Carolina At Charlotte Computer implemented system for quantifying stability and flexibility relationships in macromolecules
ES2830350T3 (es) 2008-05-07 2021-06-03 Biomarin Pharm Inc Péptidos de dirección lisosómica y usos de los mismos
ES2569514T3 (es) 2009-06-17 2016-05-11 Biomarin Pharmaceutical Inc. Formulaciones para enzimas lisosómicas
EA025399B1 (ru) 2010-11-22 2016-12-30 Борис Славинович ФАРБЕР Способ синтеза лечебных и профилактических лекарственных препаратов
WO2013097012A1 (pt) * 2011-12-30 2013-07-04 Embrapa - Empresa Brasileira De Pesquisa Agropecuária Inibidores das enzimas poligalacturonases de fungos fitopatogênicos
US20130280238A1 (en) * 2012-04-24 2013-10-24 Laboratory Corporation Of America Holdings Methods and Systems for Identification of a Protein Binding Site
CN103870644B (zh) * 2014-03-11 2016-08-03 中国石油大学(华东) 一种识别MoP催化剂脱氮活性位的方法
JP6845157B2 (ja) 2015-05-01 2021-03-17 シュレーディンガー エルエルシーSchrodinger,Llc 化合物の溶解度を予測するための物理学をベースにした計算方法
EP3374906B1 (en) * 2015-11-09 2022-01-05 The University Of British Columbia Systems and methods for predicting misfolded protein epitopes by collective coordinate biasing
US11728011B2 (en) 2019-04-29 2023-08-15 International Business Machines Corporation System and method for molecular design on a quantum computer
IT201900022545A1 (it) 2019-11-29 2021-05-29 Univ Degli Studi Di Bari Aldo Moro Metodo per l’identificazione di regioni di legame specifiche di deidrogenasi fad/nadh-dipendenti di mammiferi e/o di microorganismi patogeni per uomo, altri mammiferi e piante, per il disegno di nuovi farmaci
WO2023172635A1 (en) * 2022-03-08 2023-09-14 Emory University Predictive model for variants associated with drug resistance and theranostic applications thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5331573A (en) * 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5642292A (en) * 1992-03-27 1997-06-24 Akiko Itai Methods for searching stable docking models of biopolymer-ligand molecule complex
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations
US5495423A (en) * 1993-10-25 1996-02-27 Trustees Of Boston University General strategy for vaccine and drug design
US5867402A (en) * 1995-06-23 1999-02-02 The United States Of America As Represented By The Department Of Health And Human Services Computational analysis of nucleic acid information defines binding sites
US5854992A (en) * 1996-09-26 1998-12-29 President And Fellows Of Harvard College System and method for structure-based drug design that includes accurate prediction of binding free energy

Also Published As

Publication number Publication date
WO1998054665A1 (en) 1998-12-03
EP1025521B1 (en) 2007-04-11
DE69837555T2 (de) 2007-12-20
US6772073B2 (en) 2004-08-03
CA2292697A1 (en) 1998-12-03
US6226603B1 (en) 2001-05-01
CA2292697C (en) 2006-08-08
EP1025521A4 (en) 2000-11-29
DE69837555D1 (de) 2007-05-24
EP1025521A1 (en) 2000-08-09
US20050010368A1 (en) 2005-01-13
ATE359561T1 (de) 2007-05-15
US20010000807A1 (en) 2001-05-03

Similar Documents

Publication Publication Date Title
ES2285774T3 (es) Procedimiento informatico que utiliza calculos de energia libre para el diseño de ligandos y la prediccion de dianas de union.
Jwad et al. Strategies for fine-tuning the conformations of cyclic peptides
Kuntz et al. Structure-based molecular design
Kamenik et al. Peptidic macrocycles-conformational sampling and thermodynamic characterization
Majeux et al. Exhaustive docking of molecular fragments with electrostatic solvation
Giordanetto et al. Fragment hits: what do they look like and how do they bind?
Guerois et al. Predicting changes in the stability of proteins and protein complexes: a study of more than 1000 mutations
Danelius et al. Halogen bonding: A powerful tool for modulation of peptide conformation
Günther et al. Utilising structural knowledge in drug design strategies: applications using Relibase
London et al. Druggable protein–protein interactions–from hot spots to hot segments
Geng et al. Accurate structure prediction and conformational analysis of cyclic peptides with residue-specific force fields
Lamb et al. Design, docking, and evaluation of multiple libraries against multiple targets
Jusot et al. Exhaustive exploration of the conformational landscape of small cyclic peptides using a robotics approach
Santini et al. Rapid in silico design of potential cyclic peptide binders targeting protein-protein interfaces
JP4315960B2 (ja) タンパク質のリガンド結合部位の特定方法およびタンパク質−リガンド複合体の立体構造構築方法
Waibl et al. Comparison of hydrophobicity scales for predicting biophysical properties of antibodies
Lindenburg et al. Improved RAD51 binders through motif shuffling based on the modularity of BRC repeats
Delaunay et al. Des3pi: a fragment-based approach to design cyclic peptides targeting protein–protein interactions
Moon et al. 3D database searching and de novo construction methods in molecular design
Brylinski et al. Is the protein folding an aim-oriented process? Human haemoglobin as example
JP2019502978A (ja) D−タンパク質リガンドの構造ベース設計
Clark A ligand’s-eye view of protein binding
Li et al. Insights into the structural function of the complex of HIV-1 protease with TMC-126: molecular dynamics simulations and free-energy calculations
Bansia et al. Small glycols discover cryptic pockets on proteins for fragment-based approaches
Simões et al. Properties that rank protein: protein docking poses with high accuracy