ES2949063T3 - Sistemas y métodos para predecir la glucosilación de proteínas - Google Patents

Sistemas y métodos para predecir la glucosilación de proteínas Download PDF

Info

Publication number
ES2949063T3
ES2949063T3 ES16797239T ES16797239T ES2949063T3 ES 2949063 T3 ES2949063 T3 ES 2949063T3 ES 16797239 T ES16797239 T ES 16797239T ES 16797239 T ES16797239 T ES 16797239T ES 2949063 T3 ES2949063 T3 ES 2949063T3
Authority
ES
Spain
Prior art keywords
glycosylation
network
reactions
glycosylation profile
profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16797239T
Other languages
English (en)
Inventor
Philipp N Spahn
Nathan E Lewis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Application granted granted Critical
Publication of ES2949063T3 publication Critical patent/ES2949063T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/08Computing arrangements based on specific mathematical models using chaos models or non-linear system models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Library & Information Science (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)

Abstract

La tecnología divulgada proporciona un modelado de predicción computacional que comprende un algoritmo novedoso para la predicción de la glicosilación o para optimizar la producción biofarmacéutica de proteínas de relevancia terapéutica. El modelo de la tecnología divulgada se puede utilizar para predecir cambios de glicosilación basándose únicamente en los perfiles de glicosilación establecidos en cualquier célula huésped y en reglas conocidas o sugeridas sobre la especificidad de la enzima. También se proporcionan aplicaciones del modelo de invención. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Sistemas y métodos para predecir la glucosilación de proteínas
Campo de la invención
Los aspectos de la invención están relacionados en general con la ingeniería racional de las condiciones de cultivo celular bioindustriales. Más específicamente, se refiere a la utilización de herramientas computacionales para optimizar la producción biofarmacéutica de proteínas de importancia terapéutica.
Antecedentes de la invención
Las proteínas terapéuticas son cada vez más importantes para la industria farmacéutica. El gasto mundial en proteínas terapéuticas, tales como anticuerpos, hormonas y factores sanguíneos, alcanzó los 138 000 millones de dólares en 2010. La mayoría de estas proteínas son glucoproteínas, es decir, se modifican en la célula mediante la adición de cadenas de azúcares (glucanos). Existen varias clases de estas modificaciones de glucanos que difieren por la naturaleza de su enlace químico. En concreto, las modificaciones con los llamados N-glucanos confieren propiedades químicas que son cruciales para la función biológica de la proteína y, por lo tanto, para su eficacia terapéutica y bioseguridad. En consecuencia, es de suma importancia, para la producción industrial de estas proteínas, controlar su modificación con N-glucanos.
Por desgracia, a diferencia de la síntesis de proteínas que sigue una plantilla de ADN y, por lo tanto, puede adaptarse con facilidad a la ingeniería racional, la N-glucosilación (es decir, el proceso en el que se añaden N-glucanos a la proteína en la célula) se produce de forma estocástica sin plantillas. Esto también es cierto para todas las demás formas de glucanos, tales como los O-glucanos, glucolípidos, glucosaminoglucanos, oligosacáridos de leche, etc. Una serie de enzimas agregará restos azúcar a la cadena de glucano en crecimiento, que depende de una interacción compleja de varios factores influyentes. Estos factores incluyen, entre otros, el nivel de expresión de estas enzimas, la disponibilidad de los componentes de reacción implicados, así como las restricciones estéricas en las interacciones de estas enzimas con la glucoproteína concreta. Como resultado de esta complejidad, las modificaciones con N-glucanos en una glucoproteína o la estructura de cualquier glucano normalmente siguen una distribución estadística, lo que se conoce como perfil de glucosilación. Este perfil de glucosilación es específico para una determinada glucoproteína, glucolípido o cualquier otra muestra biológica en el sentido de que muestra una gama reproducible de determinados glucanos, pero la fracción cuantitativa de cada glucano puede variar entre diferentes líneas celulares o condiciones de proceso, proteína, lípido o muestra biológica. El control de este perfil de glucosilación durante la producción es un requisito de calidad fundamental, ya que ciertos glucanos son cruciales para determinados parámetros fisiológicos de una glucoproteína, tales como la afinidad de unión o el recambio y, por lo tanto, los glucanos adecuados representan una calidad crucial del producto. El control del perfil de glucosilación también desempeña un papel importante en la fabricación de biosimilares (biomoléculas que son copias de un producto existente, pero que son comercializadas por una empresa diferente) ya que el perfil de glucosilación del producto original es parte del fármaco aprobado y, por lo tanto, debe reproducirse con precisión junto con la propia proteína.
Dada esta importancia, el control de la glucosilación representa un desafío importante en la producción de proteínas biofarmacéuticas o el desarrollo de otras productos terapéuticos que incluyan glucanos y se han propuesto numerosas estrategias para ajustar las condiciones del proceso hacia determinados perfiles de glucosilados deseados. La mayoría de estas estrategias implican (i) la modificación genética de la línea de células hospedadoras o (ii) cambios químicos en la suplementación de nutrientes en el medio de crecimiento. En gran medida, sin embargo, estos ajustes se han basado en conjeturas sofisticadas y experimentación de prueba y error. En un intento por conseguir un enfoque más racional hacia el desarrollo de estas estrategias de ajuste, en los últimos años se han propuesto varios enfoques computacionales que se dirigen a la predicción por medios informáticos de la glucosilación mediante la utilización de modelos matemáticos, por ejemplo, el documento WO 2015/010088 A1 (Universidad Técnica de Dinamarca), que divulga el análisis computacional de la glucosilación de proteínas. Si bien estos modelos han mostrado un gran potencial para ayudar a comprender los complejos mecanismos que dirigen la glucosilación, la mayoría de ellos se basan en numerosos parámetros del modelo que normalmente no están disponibles o son difíciles de obtener.
Sumario de la invención
La invención comprende un algoritmo que permite predecir cómo los cambios en las condiciones de cultivo de células de mamíferos (cambios genéticos en la línea celular o cambios químicos en el medio de crecimiento) afectan el perfil de glucanos, incluidos, entre otros, N-glucanos en las proteínas producidas a partir de esa línea celular. El método requiere mediciones del perfil de N-N-glucanos, por ejemplo, N-glucanos, O-glucanos, oligosacáridos de leche, glucosaminoglucanos, etc., obtenido de una línea celular de tipo salvaje como patrón de calibración. A continuación, reconstruye la red de reacción bioquímica que conduce al perfil observado y lo transforma en un marco estocástico (una cadena de Markov). A continuación utiliza el cálculo basado en probabilidades para predecir cómo reaccionaría la red de reacción ante los cambios genéticos del hospedador o los cambios nutricionales en las condiciones del medio. Produce un perfil de glucano predicho, respaldado por evaluaciones estadísticas de márgenes de error en las frecuencias de los glucanos individuales.
Como ejemplo, la bioquímica de la red de reacción de la N-glucosilación se ha estudiado a fondo. En concreto, las enzimas participantes están bien caracterizadas con respecto a sus especificidades de reacción, es decir, los sustratos de glucano sobre los que actúan, así como sus restricciones de reacción, por ejemplo, epítopos de glucanos que impiden su reacción a pesar de la presencia del sustrato (tabla 1). Para la mayoría de las enzimas, también es bien conocida su localización intracelular. Así, su lugar de acción dentro de la jerarquía de la reacción está bien definido. El proceso de N-glucosilación siempre comienza con la misma estructura inicial (el glucano MangGlcNAc2) y, con el conjunto de reglas de todas las enzimas conocidas, el algoritmo genera sucesivamente todos los glucanos que, en teoría, pueden sintetizarse por la acción combinada de las enzimas de glucosilación (figura 1). Esto produce una red de reacción genérica, capaz de crear decenas de miles de estructuras de glucano (figuras 2, 3).
Tabla 1
Enzimas re las de reacción im lementadas en el modelo
Figure imgf000003_0001
CLAVE:
... = Continuación, es decir, cualquier cadena (posiblemente vacía) con todos los paréntesis coincidentes
| = Posible punto de ramificación, es decir, cadena vacía o (...)
Dado que esta red genera todos los glucanos teóricamente posibles, representa un mero depósito en lugar de un modelo para la red de reacción en una línea celular productora de una proteína específica. Para inferir la red de reacción específica que subyace a la glucosilación de una proteína concreta producida, se aprovecha la información del perfil de glucosilación medido en esta proteína (suministrada por el usuario) (figura 4) para adaptar la red genérica al perfil específico mediante la identificación de todas las reacciones que no se requieren para obtener los glucanos que aparecen en este perfil. Luego se eliminan de la red, dejando la red de reacción mínima requerida para producir el perfil medido. Este método de "reducción de modelos" es parte de la caja de herramientas de reconstrucción y modelización basado en restricciones (COBRA) que proporciona herramientas de optimización lineal para el análisis de redes de reacciones bioquímicas. Después de adaptar la red, por lo general, queda una gran ambigüedad sobre cómo las rutas a través de esta red conducen desde el punto de inicio de la red (por ejemplo, para la N-glucosilación, el glucano ManyGlcNAc2 inicial) hasta el punto final (el perfil de glucosilación observado) (figura 5). Esta variación en el flujo de reacción se evalúa a través del muestreo de Monte-Carlo implementado en la herramienta optGpSampler (figura 6).
Los flujos de reacción entre los glucanos en la red, junto con sus varianzas, se reformulan como probabilidades de pasar de un glucano a otro (figura 7), una transformación que es posible porque el flujo total a través de la red de glucosilación se normaliza a 1, y el flujo entrante en cada glucano es igual al flujo saliente en el red de reacción ya que se basa en una hipótesis de estado estacionario (figura 8). Esta reformulación permite la transformación de la red de reacción en una cadena de Markov, una clase bien estudiada de procesos estocásticos, lo cual permite simular la glucosilación en un marco probabilístico.
Para simular cómo la perturbación en la red de reacción afecta el perfil de glucosilación producido, la cadena de Markov reconstruida se modifica para tener en cuenta la manipulación que se va a simular.
Para simular una disminución en la actividad enzimática (una atenuación ("knock-down" o "knock-out")), el algoritmo identifica primero todas las reacciones en la red que dependen de la enzima respectiva (figura 9, etapa 1). Las probabilidades de las reacciones que dependen de la enzima se reducen luego en un factor £ (especificado por el usuario) (figura 9, etapa 2). Dado que las probabilidades de transición a otros glucanos deben sumar 1, estas modificaciones requieren que las probabilidades restantes del glucano respectivo se ajusten como consecuencia de la perturbación (Figura 9, etapa 3). Estos ajustes se obtienen de forma que se mantengan las proporciones de probabilidad de reacción entre reacciones competidoras bajo la restricción de la perturbación aplicada. Aparte de estas modificaciones, todas las demás probabilidades de reacción permanecen sin cambios. Con estas modificaciones, la cadena de Markov se vuelve a ejecutar para predecir cómo el flujo a través de la red de reacción conduce ahora a un perfil de glucosilación alterado.
En caso de una regulación al alza de la actividad enzimática ("sobreexpresión"), el procedimiento es análogo a a), excepto que las probabilidades de reacción afectadas se escalan en un factor E (>1) (figura 10).
Los procedimientos de atenuación de un conjunto de una o más enzimas y de sobreexpresión simultánea de un conjunto diferente de una o más enzimas (figuras 9, 10) se realizan de uno en uno bajo el supuesto de la independencia.
El flujo de trabajo en la figura 9 puede revertirse utilizando un perfil de glucosilación obtenido en condiciones perturbadas, en lugar de predecirlo. La acción secuencial de las enzimas de glucosilación sobre la cadena de glucanos en crecimiento se produce a través de la localización diferencial de estas enzimas en diferentes compartimentos del aparato de Golgi. El conocimiento sobre la localización de enzimas es relevante ya que las enzimas colocalizadas compiten por los mismos sustratos. Así, diferentes suposiciones sobre la localización de las enzimas influyen considerablemente en la topología de la red de reacción. Aunque la bioquímica de muchas enzimas de glucosilación está bien caracterizada (en especial para la glucosilación enlazada a través de N), su localización subcelular no ha sido estudiada con el mismo detalle. Para probar la validez de ciertas hipótesis con respecto a la localización física de ciertas enzimas de glucosilación, el algoritmo compara perfiles de glucosilación simulados con perfiles de glucosilación observados para evaluar qué hipótesis produce predicciones que son congruentes con los datos experimentales. Las hipótesis de localización alternativas implican diferentes topologías de reacción y, por lo tanto, diferentes conjuntos de reglas de reacción. Usando cualquiera de estas topologías de reacción alternativas, las redes de reacción alternativas se reconstruyen cuando se adapta la red genérica a un perfil de glucosilación de una línea celular patrón. La simulación de una perturbación se realiza para cada reconstrucción alternativa por separado y, si los datos experimentales de una perturbación están disponibles, la coherencia de la hipótesis de localización subyacente puede evaluarse por la congruencia de los datos experimentales con cada una de las predicciones obtenidas.
De forma similar, el flujo de trabajo de la figura 9 se puede invertir para analizar los cambios en la red de reacción de glucosilación en función de los patrones de glucosilación observados a partir de una condición perturbada. Los trastornos congénitos de la glucosilación son causados por defectos genéticos que conducen a una glucosilación aberrante, con consecuencias fisiológicas y de desarrollo potencialmente graves. Aparte de los perfiles de glucosilación aberrantes observables del paciente, se desconoce la base genética de muchas afecciones y, por lo tanto, se desconoce qué tipo de perturbación en la red de reacción conduce realmente a los patrones de glucosilación aberrantes. A partir de una perturbación hipotética (como la atenuación de una o más enzimas), el algoritmo calcula un perfil de glucosilación predicho y cuantifica el ajuste del perfil aberrante predicho con el perfil observado del paciente. Luego utiliza un algoritmo genético para cambiar aleatoriamente la perturbación supuesta para mover el perfil predicho lo más cerca posible del perfil observado. El punto final de este proceso de optimización revela qué perturbación de la red de reacción de glucosilación muestra la mayor congruencia con los datos observables (figura 11).
Las perturbaciones de la red de reacción de glucosilación también pueden aparecer al cambiar las concentraciones (y por lo tanto la disponibilidad) de los precursores de la reacción requeridos, en lugar de cambiar los niveles de expresión de las enzimas implicadas. Para simular tales cambios químicos, el modelo de la cadena de Markov está vinculado a una red de reacción que describe las vías metabólicas de las células y el transporte de metabolitos dentro y fuera de las células. Esto podría incluir todas las reacciones metabólicas en la célula o una enumeración más directa de las reacciones subyacentes al metabolismo de los nucleótidos de azúcar en la célula, ya que los nucleótidos de azúcar representan las especies químicas que actúan como precursores de todas las reacciones de glucosilación (figura 12). A partir de un perfil de glucosilación observado, los requisitos cuantitativos (flujos) de cada uno de estos precursores de nucleótidos de azúcar se pueden reconstruir de forma exclusiva durante el procedimiento de adaptación. Estos flujos reconstruidos se utilizan luego para reconstruir el flujo a través de la red metabólica de nucleótidos de azúcar a partir de los nutrientes (por ejemplo, glucosa, glutamina) proporcionados al medio de cultivo. La suplementación con nutrientes adicionales conduce a perturbaciones en estos flujos metabólicos que se pueden simular utilizando métodos de la caja de herramientas COBRA u otro software para la modelización basado en restricciones, optimización lineal o técnicas en análisis convexo. Los cambios resultantes en los flujos de nucleótidos de azúcar se relacionan luego con la condición patrón, y su proporción (perturbado/patrón) se toma como un factor para alterar las probabilidades de las reacciones de glucosilación en función de estos precursores (figura 13). A partir de aquí, se lleva a cabo el método ilustrado en la figura 14, en función de si la proporción indica una disminución o un aumento en la probabilidad de reacción o una mezcla o ambos. Como en la figura 9, la ejecución de nuevo de la cadena de Markov con estas probabilidades ajustadas produce una predicción de cómo cambia el perfil de glucosilación en respuesta a los cambios en la suplementación.
Entonces, en un aspecto, la invención se refiere a un método que comprende:
generar, mediante un dispositivo informático, usando una estructura inicial conocida y una pluralidad de enzimas y/o reacciones de glucosilación conocidas, una red de reacción de glucosilación genérica que comprende una pluralidad de glucanos;
recibir, en el dispositivo informático, información relacionada con un perfil de glucosilación medido de una proteína concreta, comprendiendo el perfil de glucosilación medido una pluralidad de glucanos del perfil de glucosilación, teniendo cada uno una frecuencia relativa asociada;
adaptar la red de reacción de glucosilación genérica al perfil de glucosilación medido para proporcionar una red adaptada, comprendiendo la red adaptada un conjunto reducido de la pluralidad de glucanos, incluyendo el conjunto reducido los glucanos del perfil de glucosilación, en donde la adaptación de la red de reacción de glucosilación genérica comprende identificar una pluralidad de reacciones que no se requieren para obtener la pluralidad de glucanos del perfil de glucosilación y comprende además usar la reducción del modelo a través del análisis convexo o de algoritmos de optimización;
transformar la red adaptada en una cadena de Markov, representando la cadena de Markov una red estocástica en donde cada glucano del perfil de glucosilación en el conjunto reducido se considera como un estado en la red estocástica que puede pasar a otro estado en la red estocástica con una probabilidad de transición concreta, en donde la transformación de la red adaptada en una cadena de Markov comprende:
evaluar la varianza en los flujos de reacción de la red adaptada mediante el muestreo de Monte Carlo, produciendo el muestreo de Monte Carlo una pluralidad de vectores de flujo que tienen una varianza asociada, en donde cada flujo de reacción representa una ruta a través de la red adaptada desde la estructura inicial conocida hasta el perfil de glucosilación medido; y
reformular cada uno de la pluralidad de vectores de flujo en una pluralidad de probabilidades de transición asociadas, y
comprende además determinar una combinación óptima de cambios para que coincida con un perfil de glucosilación deseado mediante:
proporcionar un algoritmo de optimización para implementar un proceso de optimización que simule posibles perturbaciones que conduzcan a un perfil de glucosilación deseado, minimizando el algoritmo de optimización una función objetivo que mide una distancia entre un perfil de glucosilación predicho y observado; recibir una hipótesis inicial de perturbaciones y una condición de parada;
y determinar un punto final del proceso de optimización, en donde el punto final representa la combinación óptima de cambios y comprende un conjunto de perturbaciones que proporciona un perfil de glucosilación simulado dentro de un margen de error especificado del perfil de glucosilación deseado;
en donde las células de mamífero se cultivan posteriormente en un medio de cultivo, en donde las células de mamífero y/o el medio de cultivo se modifican de acuerdo con dicho conjunto de perturbaciones.
En otro aspecto, la invención se refiere a un método para predecir cambios en la localización de enzimas de glucosilación, comprendiendo el método:
a) adaptar la red de reacción de glucosilación genérica descrita anteriormente para una localización alternativa, en donde la localización de la enzima de glucosilación es subcelular; y
b) simular por separado perturbaciones de las redes alternativas y comparar los perfiles de glucosilación predichos resultantes con un perfil de glucosilación deseado para determinar qué perfil de glucosilación predicho es más coherente con el perfil de glucosilación deseado;
en donde la predicción se verifica posteriormente mediante el cultivo de células de mamíferos en un medio de cultivo, en donde las células de mamífero y/o el medio de cultivo se modifican de acuerdo con las perturbaciones que proporcionan el perfil de glucosilación predicho más coherente con el perfil de glucosilación deseado, y midiendo el perfil de glucosilación de las células de mamífero cultivadas.
Estos y otros aspectos de la presente invención serán evidentes para los expertos en la materia a partir de la descripción, las reivindicaciones y los dibujos siguientes.
Breve descripción de los dibujos
Figura 1. Generación de una red de reacción de glucosilación genérica (I): Diagrama que describe las primeras 8 iteraciones del algoritmo de generación siguiendo el conjunto de reglas para la N-glucosilación en la tabla 1. El aparato de Golgi se modeliza con tres compartimentos (cis, medial y trans). Las reacciones de secreción se omiten en la figura para mayor claridad, pero están incluidos en el modelo computacional.
Figura 2. Generación de una red de reacción de glucosilación genérica para la glucosilación enlazada a través de N (II): Comenzando en el glucano MangGlcNAc2 inicial, una aplicación iterativa de las reglas de reacción de la tabla 1 genera la red de reacción genérica de N-glucosilación. El "nivel de complejidad" se refiere al número de iteraciones del algoritmo de generación.
Figura 3. El número de posibles glucanos muestra un aumento exponencial antes de estabilizarse.
Figura 4. Perfil de N-glucosilación: N-glucanos recuperados de la eritropoyetina producida en una línea de células CHO (datos de Yang et al., 2015).
Figura 5. Varianza en el flujo. Por lo general, el flujo que vincula el glucano inicial con el perfil de glucanos final no es exclusivo (es decir, existen múltiples vías que se pueden tomar para producir un glucano). Desde el punto de vista matemático, la totalidad de estos flujos representan un subconjunto de un plano multidimensionales que se puede explorar mediante un muestreo uniforme.
Figura 6. Resultados del muestreo. Después del muestreo de Monte-Carlo, el flujo medio y la desviación estándar se representan gráficamente para cada reacción en la red adaptada. Los flujos se representan después de la transformación en probabilidades (figura 8).
Figura 7. Transformación en un marco estocástico (I). Los flujos a través de la red de reacción se transforman en probabilidades tomando las proporciones de flujo. Cada flujo se divide por la suma de todos los flujos que salen de un glucano concreto.
Figura 8. Transformación en un marco estocástico (II). La suposición de un estado estacionario de concentraciones de metabolitos (uno de los axiomas clave en el marco de modelización COBRA) permite la transformación en un marco estocástico, ya que implica que las probabilidades suman 1 para cada glucano. La transformación funciona a la inversa, haciendo que la formulación estocástica y de flujo sean equivalentes.
Figura 9. Modelización de la atenuación de las enzimas. Etapa 1: Se identifican todas las reacciones en la reacción de glucosilación de tipo salvaje catalizadas por la enzima o enzimas que se van a atenuar (por ejemplo, la fucosiltransferasa). Etapa 2: Las probabilidades de transición de estas reacciones luego se reducen. Para modelizar una atenuación completa, se establecen en 0 como se ilustra en el presente documento. Etapa 3: Las probabilidades de transición de reacciones alternativas, es decir, aquellas que toman el mismo sustrato de glucano que el que se está atenuando (flechas negras), deben ajustarse para mantener una suma de probabilidad de 1 para cada glucano en la red. Etapa 4: Si no existen reacciones alternativas, se supone que el glucano abandonará el compartimento de Golgi correspondiente sin haber sido modificado y transitará al siguiente compartimento o se secretará (si ya está en el trans-Golgi). Para mayor claridad, los marcadores de localización de los glucanos se han omitido en los dibujos restantes. Todas las demás probabilidades de transición siguen siendo idénticas a la red de tipo salvaje.
Figura 10. Modelización de la sobreexpresión de enzimas. Por analogía con el enfoque de atenuación, la sobreexpresión se modeliza escalando una determinada probabilidad de transición en un factor E (> 1), especificado por el usuario. Las probabilidades restantes deben ajustarse manteniendo sus proporciones como en el caso de la atenuación.
Figura 11. Análisis asistido por modelos de deficiencias en la glucosilación. Diagrama de flujo que muestra el flujo de trabajo del algoritmo genético que usa el modelo de Markov para descubrir la perturbación en la red de reacción de glucosilación que mejor explica el perfil de glucosilación patológico de un paciente.
Figura 12. Acoplamiento del modelo de Markov al metabolismo de los nucleótidos de azúcar. Al acoplar el modelo de glucosilación de Markov a un modelo COBRA del metabolismo de nucleótidos de azúcar, los efectos de las manipulaciones en las condiciones de crecimiento, tales como las estrategias alternativas de alimentación, pueden vincularse a simulaciones de glucosilación en estas condiciones perturbadas.
Figura 13. Los cambios en la alimentación conducen a cambios en los flujos de nucleótidos de azúcar que conducirán a cambios en los N-glucanos. En el modelo más simple, se supone una relación lineal entre la proporción de flujo de los nucleótidos de azúcar (antes y después de la perturbación) y las probabilidades de reacción de las reacciones de glucosilación que requieren el nucleótido de azúcar concreto (n^t y nw se refieren a las probabilidades de reacción antes y después de la perturbación, respectivamente).
Figura 14. Diagrama de flujo que ilustra un método según la presente divulgación.
Figura 15. Modelo de la cadena de Markov de glucosilación. La matriz de transición II comprende las probabilidades de transición de cada glucano (filas) a cualquier otro glucano (columnas) en una etapa de reacción. El orden y la numeración de los glucanos son arbitrarios.
Figura 16. La distribución inicial no de la cadena refleja el inicio de la N-glucosilación y, por tanto, se concentra en el glucano MangGlcNAc2. Los glucanos que se van a secretar pueden transicionar a un estado de absorción artificial (glucano enmarcado) que transiciona a sí mismo con una probabilidad de 1 en cada etapa, lo que conduce a la absorción de la cadena.
Figura 17. Transformación de un modelo COBRA en una matriz de transición de Markov. Tal como se muestra en 1705, la red de reacción COBRA se describe mediante una matriz estequiométrica S en la que cada columna representa una reacción, cada fila representa un metabolito y las entradas son los coeficientes estequiométricos (Palsson, 2015). Para transformar S en una matriz de transición de Markov II, el algoritmo identifica las posibles transiciones para cada glucano en la red al descubrir las reacciones en las que este glucano concreto (G1) reacciona a otro (por ejemplo, G2). A continuación se introduce un parámetro para la probabilidad de transición (desconocida) de G1, por ejemplo, a G2 en la posición correspondiente en II. Tal como se muestra en 1710, las secreciones están representadas por reacciones de secreción en la modelización basada en restricciones que permiten que un glucano (G) se consuma sin la producción de otro. En este caso, el algoritmo crea un nuevo estado de absorción artificial (Go) en la matriz de Markov al que G puede transicionar. Go se transiciona a sí mismo con probabilidad 1. Todas las entradas en IT que no correspondan a una reacción o secreción de glucanos son 0.
Figuras 18A-18B. Descubrir una coincidencia más cercana para un glucano extraño. Los N-glucanos pueden tener un máximo de cuatro ramificaciones en la punta que se denominan I-1/I-2/II-1/II-2 para este propósito. La configuración de las ramificaciones del glucano extraño se compara con las configuraciones de las ramificaciones de cada glucano presente en el compartimento de Golgi. Los glucanos que tienen el mayor número de ramificaciones en común con el extraño se conservan como candidatos. Las ramificaciones que faltan se procesan. Se supone que los glucanos extraños a los que les faltan ramificaciones se comportarán de manera más similar a los glucanos que tienen una copia de la ramificación vecina donde falta la ramificación extraña.
Figuras 19A-19B. Procesamiento de glucanos "extraños" después de un atenuación enzimática (I). Después de que FUT8 se atenúe, el glucano no fucosilado pasa al aparato de trans-Golgi, donde ya no reacciona más, ya que todos los glucanos de trans-Golgi en la red de tipo salvaje están fucosilados. Como este glucano "extraño" no fucosilado se parece mucho a su variante fucosilada (la "coincidencia más cercana"), probablemente se someterá a un procesamiento análogo (galactosilación, en este caso), por lo tanto, se supone que las reacciones en la coincidencia más cercana se producen de la misma manera en el extraño (flechas de puntos). Etapa 1: Para construir las reacciones de los glucanos extraños, la coincidencia más cercana a un glucano extraño se elige del conjunto de glucanos de tipo salvaje disponibles en el mismo compartimento basándose en la similitud química y estructural (figura 18A). Etapa 2: Las reacciones análogas se vinculan al glucano extraño (en este caso: galactosilación de ambas ramificaciones). Etapa 3: Se supone que las probabilidades de transición correspondientes son idénticas a los análogos en el tipo salvaje. Se requieren ligeros ajustes en casos más complicados, en donde ciertas reacciones en la coincidencia más cercana no se pueden copiar porque carecen de un sustrato de reacción en el extraño. Dado que, generalmente, las reacciones análogas en el extraño crearán nuevos glucanos extraños que no están presentes en la red de tipo salvaje (en este caso, glucanos galactosilados que carecen de la fucosa central), este procedimiento se repite hasta que todos los extraños hayan sido procesados. Los marcadores de localización de los glucanos se omiten para mayor claridad.
Figuras 20A-20B. Procesamiento de glucanos "extraños" después de una atenuación enzimática (II). Etapa 1: En este ejemplo, una atenuación simulada de GnTV conduce a glucanos extraños en el trans-Golgi que, a diferencia de sus homólogos de tipo salvaje, carecen de la bisección p1-6-GlcNAc. Etapa 2: En consecuencia, las modificaciones posteriores de esta ramificación no tienen análogos en el glucano extraño, ya que falta el sustrato requerido y no se puede copiar la reacción correspondiente. Etapa 3: Para calcular las probabilidades de transición, se aplican estos mismos ajustes que para la atenuación, bajo la restricción de que falta una transición, es decir, tiene una probabilidad de 0 (figura 20B).
Figura 21. Fuga de glucanos (I). Después de la atenuación de una enzima dominante (SiaT) en un compartimento de Golgi, se produce la fuga de glucanos cuando la enzima colocalizada (iGnT) no es capaz de procesar la mayor parte de los sustratos de glucanos. Por tanto, estos pasarán a través del compartimiento sin haber sido modificados.
Figuras 22A-22B. Fuga de glucanos (II). (2205). En este ejemplo, la reconstrucción de la red de glucosilación indicó un papel dominante de la fucoiltransferasa (FucT) en el procesamiento del glucano concreto. La reacción competidora (dependiente de GnTIV) se produjo solo con un 5 % de probabilidad. Sin la suposición de fuga de glucanos, toda la masa de probabilidad se desplazaría a GnTIV en caso de una atenuación de FucT. (2010). La fuga solo tiene lugar si la masa de probabilidad perdida por una atenuación supera un umbral T, que se basa en la suposición de que las enzimas colocalizadas probablemente compensarán las pérdidas de pequeñas masas de probabilidad. En caso de fuga, su probabilidad aumentará cuanto más masa de probabilidad se pierda durante la atenuación.
Figura 23. Predicción de perfiles de glucosilación mutantes. Simulaciones de atenuación (£ = 0) utilizando el modelo de Markov (barras grises). Como se muestra en 2305, las barras representan la media /- d.e. Los glucanos con una frecuencia del 0 % se muestran transparentes. Los datos experimentales se muestran en barras negras. Perfil de glucosilación de IgG1 de una línea celular CHO/DG44 de tipo salvaje y con atenuación de FUT8 con las correspondientes predicciones del modelo (datos experimentales de Imai-Nishiya et al., 2007). En 2310 se muestra el perfil de glucosilación de EPO de una línea CHO-GS de tipo salvaje y con atenuación de GnTIV con las predicciones correspondientes (datos experimentales de (Yang et al., 2015)). En 2315 se muestran perfiles de glucosilación del secretoma completo de un cultivo en suspensión de CHO-S de tipo salvaje y con atenuación de FUT8 con las predicciones correspondientes.
Figura 24. Perfil de glucosilación en EPO después de la atenuación de a3SiaT. El perfil de glucosilación de la línea celular de tipo salvaje se muestra en la figura 23. Los datos proceden de Wan et al., 2015.
Figura 25. Simulación del modelo de Markov con un umbral de fuga supuesto de 0,75.
Figura 26. Simulación del modelo de Markov, ejecutada con el umbral de fuga establecido en 1,0 (sin fuga en efecto). Figura 27. Perfil de atenuación de FUT8 experimental junto con simulaciones de atenuación, ejecutadas suponiendo que el Golgi está compartimentado (barras de color gris claro) o no compartimentado (barras de color gris oscuro). Figura 28. Una sección de las topologías de red implícitas en un modelo de Golgi compartimentado y no compartimentado, respectivamente. En caso de la compartimentación, la atenuación de la reacción de fucosilación conduce al paso del glucano no fucosilado (n.° 4) al trans-Golgi, donde se procesa de acuerdo con las reacciones presentes en su coincidencia más cercana (n.° 1). En caso de que no haya compartimentación, la acción paralela implícita de FUT8 y GalT conduce a una topología que solo secretaría un único glucano completamente galactosilado (glucano n.° 6) cuando se atenúa la fucosilación.
Figura 29. Perfil experimental de atenuación de GnTIV (barras negras) junto con simulaciones de atenuación, ejecutadas suponiendo que el Golgi está compartimentado (barras de color gris claro) o no compartimentado (barras de color gris oscuro).
Figura 30. En caso de la compartimentación, la atenuación de la ramificación dependiente de GnTIV en el aparato de Golgi medial conduce al paso del glucano no bifurcado (n.° 11) al trans-Golgi, donde se procesa de acuerdo con las reacciones presentes en su coincidencia más cercana (n.° 12), lo que conduce, en último término, a cuatro estructuras triantenarias (n.° 5-n.° 8). En caso de que no haya compartimentación, las enzimas GalT y GnTIV actúan en paralelo. Como consecuencia de la topología de red implícita, solo dos glucanos, en lugar de cuatro (n.° 9, n.° 10) serían secretados una vez que GnTIV sea atenuada.
Figura 31. Perfil de glucosilación aberrante de un paciente con CDG. El paciente ("AC") muestra una composición alterada de N-glucanos de las glucoproteínas de transferrina en la sangre.
Figura 32. Un perfil de glucosilación de la transferencia procedente de un paciente sano. Los datos provienen de Butler, 2003.
Figura 33. Aplicación del modelo de Markov para analizar un trastorno de glucosilación. Mejor ajuste (negro) y ajuste medio (azul) del perfil de paciente predicho al perfil observado, representados gráficamente durante 75 generaciones hasta la convergencia.
Figura 34. Frecuencias de glucanos predichas (oscuras) y observadas (claras) después de concluir el algoritmo genético.
Figura 35. Simulación de la suplementación con galactosa. La captación de galactosa se simula en relación con la captación de glucosa. La suplementación con galactosa conduce a un aumento de los glucanos galactosilados (n.° 1-n.° 4) con una disminución concomitante del glucano no galactosilado n.° 5.
Figura 36. Simulación de suplementación con GlcNAc. La suplementación con GlcNAc conduce a un aumento del glucano no galactosilado n.° 4 y a una disminución de los glucanos galactosilados. El perfil de referencia sin suplementos de galactosa ni GlcNAc (Ga20x, G1cNAc0x) se muestra en color claro.
Figura 37. Ejemplo de cómo el marco del modelo markoviano se puede usar de manera análoga para describir las redes de O-glucosilación: La red de reacción para la O-glucosilación del ligando de la glucoproteína selectina P (PSGL), como se describe en Liu y Neelamegham, 2014, se convierte en un modelo de Markov emitiendo un parámetro de probabilidad de transición para cada reacción e introduciendo estados absorbentes (glucanos enmarcados) para todos los glucanos que aparecen en el perfil secretado (glucanos marcados como n.° 1-n.° 12).
Figura 38. Las probabilidades de transición se ensamblan en una matriz de transición de Markov. Al ajustar el modelo a las frecuencias medidas de los glucanos secretados n.° 1-n.° 12, estas probabilidades de transición desconocidas se pueden inferir como se describe para la N-glucosilación.
Figura 39. Diagrama de bloques de una arquitectura de sistema informático ilustrativa 3900, de acuerdo con una implementación de ejemplo.
Descripción detallada de la invención
A menos que se definan de otro modo, todos los términos y expresiones técnicos y científicos usados en el presente documento tienen el mismo significado que el que entiende habitualmente un experto en la materia a la que pertenece la invención. Otros términos definidos de manera específica deben interpretarse de manera concordante con la definición proporcionada en el presente documento. Aunque, en la práctica, pueden utilizarse cualquier método y material similar o equivalente a los descritos en el presente documento para las pruebas de la presente invención, los materiales y los métodos preferidos se describen en el presente documento. En la descripción y la reivindicación de la presente invención, se utilizará la siguiente terminología.
Tal como se usan en la presente memoria descriptiva y en las reivindicaciones adjuntas, las formas en singular "un/una" y "el/la" incluyen los referentes en plural a menos que el contenido indique claramente lo contrario. Así, por ejemplo, la referencia a "una construcción" incluye una combinación de dos o más construcciones de ácido nucleico y similares.
La tecnología divulgada describe un determinado algoritmo y proceso que permite la predicción de cómo los cambios en las condiciones de cultivo de células de mamíferos (cambios genéticos en la línea celular o cambios químicos en el medio de crecimiento) afectan al perfil de glucanos producidos a partir de esa línea celular. Esto se aplica a los N-glucanos en proteínas, O-glucanos, glucosaminoglucanos, glucolípidos, oligosacáridos de leche u otros glucanos. En algunas realizaciones, el método usa mediciones del perfil de N-glucanos tomadas de una línea celular de tipo salvaje como patrón de calibración (por ejemplo, los N-glucanos en una célula, o proteínas o glucanos en una muestra o fluido biológico). A continuación, la tecnología divulgada puede reconstruir la red de reacción bioquímica que conduce al perfil observado y lo transforma en un marco estocástico (una cadena de Markov). Además, la tecnología divulgada puede utilizar el cálculo basado en probabilidades para predecir cómo reaccionaría la red de reacción ante cambios genéticos del hospedador o cambios nutricionales en las condiciones del medio. Además, la tecnología divulgada puede usar un perfil de glucanos predicho (por ejemplo, el perfil de N-glucanos), respaldado por evaluaciones estadísticas de márgenes de error en las frecuencias de los glucanos individuales.
La fortaleza de la tecnología divulgada es su enfoque en la aplicabilidad industrial y la omisión de una parametrización intensa. En cambio, después de que el modelo haya sido calibrado con un perfil de glucosilación de una línea celular patrón, un producto de proteína, un fluido biológico o una muestra, no se necesitan más entradas de parámetros por parte del usuario para simular cómo cambiaría el perfil si se perturban ciertas reacciones enzimáticas en la glucosilación, por ejemplo, mediante la regulación genética al alza o a la baja de un conjunto de enzimas o alterando el nivel de los precursores de la reacción requeridos. Además, la tecnología divulgada proporciona más aplicaciones de este marco de modelización, tales como un método para probar hipótesis de localización de enzimas de glucosilación en la célula, así como la identificación de mutaciones genéticas desconocidas implicadas en trastornos congénitos de glucosilación, o para identificar enzimas que catalizan etapas en la síntesis de glucanos, o para descubrir etapas enzimáticas que regulan la glucosilación.
Generación de la red de reacción de glucosilación genérica
Se pueden preparar redes de glucosilación genéricas para cualquier tipo de glucosilación. En algunas realizaciones, se crea una red de reacción de glucosilación enlazada a través de N genérica como una red de reacción de equilibrio de flujo (Palsson, 2015) y utilizando métodos de la caja de herramientas de COBRA, tal como se implementa en MATLAB. En primer lugar, se agrega manualmente un conjunto de 40 reacciones para proporcionar el glucano MangGlcNAc2 inicial, así como todos los componentes de la reacción secundarios necesarios para las enzimas de glucosilación, tales como agua, fosfato y nucleótidos de azúcar. Los glucanos se codifican como cadenas de texto en LinearCode y se guardan en una lista (que, al principio, solo contiene el glucano MangGlcNAc2 inicial), aunque se puede usar cualquier otro patrón de nomenclatura de glucanos (por ejemplo, IUPAC, Glyde, etc.). Las enzimas de glucosilación agregan restos azúcar a los glucanos existentes. El programa, por lo tanto, itera a través de un ciclo (donde el usuario especifica el límite máximo de iteración) en el que, para cada glucano en la lista actual, cada una de las 12 enzimas de glucosilación utiliza una expresión regular para descubrir una subcadena en el glucano que indique un sustrato coincidente. Si se descubre, la reacción se agrega a la red de reacciones y el nuevo glucano se agrega a la lista de glucanos. Además, cada glucano en la lista porta un marcador de localización como una subcadena terminal que indica en cuál de los tres subcompartimentos del Golgi (cis-, medial o trans-Golgi) se localiza. Por consiguiente, cuando se descubre una subcadena de sustrato coincidente, la localización del glucano también debe coincidir con la localización de la enzima para que se produzca la reacción. Además de estas reacciones enzimáticas, cada glucano recién generado implicará la adición de una reacción de transporte de ese glucano a otro subcompartimento. Por tanto, en esta implementación, el transporte se produce desde cis a medial y desde medial a trans-Golgi. Sin embargo, los compartimentos se pueden ajustar a las necesidades del modelo o tipo de glucosilación. Un glucano localizado en el trans-Golgi desencadena la generación de una reacción de salida que imita su secreción. Después de terminar el bucle de iteración, la red de reacción de glucosilación genérica se completa y se guarda como un archivo COBRA, aunque la red podría guardarse en cualquier otro formato que contenga la información de la red. Un enfoque alternativo, que no se reivindica, a la generación de una red genérica implica la enumeración de todas las reacciones que podrían usarse para sintetizar todos los glucanos medidos de una clase concreta, paso a paso.
Adaptación del modelo a un perfil de glucosilación suministrado
La red de reacciones de glucosilación creada en la etapa anterior contiene todas las reacciones posibles y, por lo tanto, solo representa un depósito de reacciones genérico. Para modelizar la glucosilación de una glucoproteína concreta, esta red genérica debe adaptarse para que sea específica. Para ello, el usuario proporciona un perfil de glucosilación de tipo salvaje medido, es decir, una lista de cadenas de glucanos junto con sus frecuencias relativas (estas pueden obtenerse experimentalmente, por ejemplo, a través de cromatografía líquida acoplada a espectrometría de masas (LC-Ms )).
Dado que solo se segregarán los glucanos proporcionados en el perfil, el programa cierra todas las reacciones de secreción en la red genérica restringiendo su flujo a 0, a excepción las que aparecen en el perfil. Los flujos para estas se ajustan a las frecuencias especificadas (el flujo hacia el glucano MangGlcNAc2 inicial se normaliza a 1). Luego, la red se adapta utilizando la reducción del modelo a través del análisis de variabilidad de flujo como parte de la caja de herramientas COBRA (Burgard et al., 2001; Gudmundsson y Thiele, 2010). Esta red reducida ahora representa la topología de reacción que describe cómo el flujo del MangGlcNAc2 inicial conduce a la generación del perfil de glucosilación suministrado por el usuario, aunque la ruta de este flujo no es exclusiva. El conjunto de este espacio generalmente muy grande de posibles flujos se muestrea utilizando métodos de Monte-Carlo, tales como los descritos en Megchelenbrink et al., 2014, para muestrear un espacio convexo y obtener una representación de la totalidad de los flujos posibles. El usuario puede especificar la profundidad de muestreo y, en este ejemplo, se utiliza una estadística de muestreo heurístico (Gelman y Rubin, 1992) para evaluar hasta qué punto se ha muestreado el conjunto de forma exhaustiva, aunque se pueden utilizar otras métricas tales como, entre otras, las descritas en Schellenberger, Lewis, Palsson, Biophysical Journal, 2011; y Schellenberger y Palsson, Journal of Biological Chemistry, 2009.
Transformación en una cadena de Markov
En la etapa siguiente, la red de reacción se transforma en una cadena de Markov, es decir, cada glucano en la red se considera un estado en una red estocástica que puede transicionar a otros con una cierta probabilidad de transición (figura 15). La secreción de glucanos se modeliza como estados absorbentes, estados de significado que transicionan a sí mismos con probabilidad 1 (figura 16). La matriz de transición de Markov n que describe esta cadena de Markov se construye leyendo la información de la red de reacción. Si se descubre una reacción que convierte el glucano Gi en el glucano G2, se agrega un parámetro de probabilidad correspondiente a la matriz de transición para la transición de G1 a G2 (figura 17). Si se descubre una reacción que secreta un glucano, se introduce un estado absorbente para ese glucano, se añade un parámetro de probabilidad a la transición a ese estado, y el estado se convierte en absorbente añadiendo una probabilidad de 1 para su transición a sí mismo (figura 16). Después de establecer la cadena de Markov, su probabilidad de absorción describe la probabilidad con la que la cadena alcanza un estado de absorción (comenzando en el MangGlcNAc2 inicial) por medio de:
Figure imgf000010_0001
Se puede demostrar que esta formulación es equivalente a un problema de equilibrio de flujo en la forma en que las probabilidades de absorción de la cadena de Markov son iguales a los flujos de secreción en el problema de equilibrio de flujo.
Los flujos muestreados generados en la etapa anterior se transforman en probabilidades de transición transformándose en proporciones de flujo. Así, la probabilidad de transición del glucano G1 al glucano G2 se calcula relacionando el flujo de G1 a G2 con la suma de flujo total que emana del glucano G1. De esa manera, un flujo a través de la red de reacción desde el MangGlcNAc2 inicial al perfil de glucosilación observado se transforma en una matriz de transición de Markov de probabilidades de reacción (figura 7; figura 8). Al ejecutar esta transformación para cada muestra de flujo en la etapa anterior se produce un conjunto de matrices de transición, cada una de los cuales describe cómo se genera el perfil de glucosilación de forma probabilística.
(a) Simulación de una perturbación en la red de reacción: Atenuación de enzimas
Para simular la atenuación de una enzima de glucosilación, el programa primero identifica todos los glucanos en la red que reaccionan con otro glucano en una reacción que requiere la enzima especificada. Para cada uno de estos glucanos, las probabilidades de reacción deben ajustarse para simular la situación de atenuación. En primer lugar, la probabilidad de la reacción o reacciones afectadas se reduce en un factor £ (0 ≤ £ ≤ 1) especificado por el usuario, dando como resultado una nueva probabilidad n ' = £ • n (figura 9, etapa 2). A continuación, las probabilidades de transición restantes deben ajustarse para mantener una estructura de probabilidad adecuada (las probabilidades de reacción para cada glucano deben sumar 1 después de la atenuación). Para ello, el programa primero cuenta el número de reacciones alternativas, es decir, reacciones que no dependen de la enzima que se atenúa. Si no hay reacciones alternativas, se supone que, como consecuencia de la atenuación, el glucano se transporta al siguiente compartimento con una probabilidad de 1 - n'. En caso de una atenuación en el trans-Golgi, se secretaría el glucano (figura 9, etapa 4).
Si hay reacciones alternativas, sus probabilidades ajustadas se calculan manteniendo sus proporciones de probabilidad de reacción apareadas bajo la restricción de que la masa de probabilidad total disponible para ellas ha cambiado de 1 - n a 1 - n ' (figura 9, etapa 3). Estos ajustes se realizan para todo el conjunto de matrices de transición.
Tal como se ha explicado anteriormente, una atenuación puede hacer que un glucano pase a un compartimento donde no se localiza en la red de tipo salvaje. Así, este glucano ahora representa un "extraño" en el nuevo compartimento para el cual no hay reacciones presentes para procesarlo. Se realiza un seguimiento de estas "entradas de extraños", ya que requieren un procesamiento especial.
Para cada glucano extraño encontrado en la etapa anterior, el script identifica su "coincidencia más cercana" entre los glucanos de tipo salvaje en ese compartimento (figuras 18A-18B). Basándose en la suposición de que los glucanos similares probablemente estén sujetos a reacciones similares, el script trata de reconstruir las reacciones del extraño en función de las reacciones presentes para el glucano de tipo salvaje que es más cercano a él en cuanto a morfología y similitud química. Para ello, primero se identifican todos los glucanos de tipo salvaje del compartimento que tienen el número máximo de ramificaciones (codificadas como subcadenas) en común con el extraño. Entre estos, el programa compara cada ramificación por separado en cuanto a su congruencia con la ramificación correspondiente del extraño y calcula una medida que representa la distancia total entre el glucano de tipo salvaje y el glucano extraño en función de las comparaciones de todas las ramificaciones. La morfología se considera comparando las longitudes de las ramificaciones (= número de unidades de monosacáridos), mientras que la similitud química se considera comparando los monosacáridos en las puntas de las ramificaciones, ya que estos representan el sustrato para reacciones adicionales. En total, la función de distancia es:
Figure imgf000011_0001
siendo dl = |L1 L \ la diferencia en longitud de las ramificaciones y:
Figure imgf000011_0002
siendo la discrepancia química (G* es el monosacárido de terminación en el glucano i). Ambas partes de la función de distancia se pueden ponderar con parámetros elegidos por el usuario (a = 1, @ = 3 utilizado por defecto).
Si, como consecuencia de una atenuación de una enzima de ramificación, el glucano extraño no contiene una ramificación que está presente en todos los glucanos de tipo salvaje, el script ofrece la distancia más baja al glucano de tipo salvaje cuya ramificación correspondiente es igual a la ramificación vecina que falta en el extraño. En el caso teórico de que la coincidencia más cercana sea ambigua, el programa continúa con la primera y muestra un mensaje de advertencia.
A continuación, el programa considera todas las reacciones que tienen lugar en la coincidencia más cercana y agrega reacciones análogas al glucano extraño, si está presente el sustrato de reacción adecuado y el extraño cumple con las restricciones de reacción estructurales para la enzima concreta (tabla 1). Si no se puede añadir una reacción análoga, el extraño pasa al siguiente compartimento o se segrega, respectivamente. Las probabilidades de las reacciones análogas reconstruidas se calculan con la misma lógica que en la atenuación, con la única diferencia de que las probabilidades n ahora representan las probabilidades de las reacciones en la coincidencia más cercana (figuras 19A-19B; figuras 20A-20B).
Por último, se puede usar un parámetro opcional para controlar la capacidad de las enzimas restantes para compensar por completo la pérdida de una enzima competidora debido a una atenuación. Es concebible (y se ha respaldado por medio de experimentos, véase a continuación) que, después de que una enzima dominante haya sido atenuada en un compartimento del Golgi, las enzimas restantes no puedan procesar la mayor parte de los sustratos de glucano presentes en el compartimento. En este caso, una fracción de glucanos pasará por el compartimento sin sufrir más modificaciones, un concepto que los inventores denominan "fuga de glucanos" (figura 21; figuras 22A-22B). El usuario puede controlar esta fuga especificando un umbral de fuga (uno para cada compartimento). Si, después de una atenuación, la masa de probabilidad total perdida a través de esa atenuación excede este umbral, se producirá una fuga de glucanos. Cuanta más masa de probabilidad se pierde durante la atenuación, mayor es la probabilidad de fuga (figuras 22A-22B).
Después de que se haya llevado a cabo este procesamiento para todos los premodelos de atenuación, se obtiene un conjunto de matrices de transición que representan un modelo de Markov para la situación de atenuación. Cuando se ejecutan estos modelos de Markov, es decir, cuando se calcula su probabilidad de absorción, se produce el perfil de glucano mutante predicho.
(b) Simulación de perturbación en la red de reacción: Sobreexpresión de enzimas
La sobreexpresión de enzimas se simula de manera análoga a una atenuación de enzimas. El usuario suministra un modelo de Markov de tipo salvaje junto con una enzima que se va a sobreexpresar, así como parámetros de sobreexpresión E > 1. El programa primero identifica todos los glucanos en la red que tienen reacciones que dependen de la enzima que se va a sobreexpresar y, posteriormente, recorre esta lista de glucanos para ajustar las probabilidades de transición. Para ello, la probabilidad de la reacción afectada se escala a:
n ' = min (E • n, 1)
y las probabilidades de reacciones alternativas (si están presentes) se calculan como se ha indicado anteriormente (figura 10). Dado que las transiciones a nuevos compartimentos no se crean de esta manera, el procesamiento de los extraños no es necesario, y la cadena de Markov se puede volver a ejecutar con facilidad para producir el perfil de glucosilación predicho obtenido a través de la sobreexpresión.
Se supone que cada perturbación de la red tiene lugar de forma independiente. Así, se puede simular un número arbitrario de perturbaciones ejecutando el protocolo de perturbación para una atenuación o una sobreexpresión de uno en uno como se describió anteriormente.
(c) Simulación de perturbación en la red de reacción: Atenuación y sobreexpresión de enzimas combinadas
Se supone que cada perturbación de la red tiene lugar de forma independiente. Así, se puede simular un número arbitrario de perturbaciones ejecutando el protocolo de perturbación para una atenuación o una sobreexpresión de uno en uno como se describió anteriormente.
(d) Simulación de hipótesis alternativas de localización
El conocimiento sobre la localización de enzimas es importante, ya que las enzimas colocalizadas compiten por los mismos sustratos. Así, diferentes suposiciones sobre la localización de las enzimas influyen considerablemente en la topología de la red de reacción. Con el fin de probar dos hipótesis de localización en competencia, la adaptación de la red se realiza por separado para cada una de las dos hipótesis. A continuación, las perturbaciones de la red para las cuales el usuario tiene datos experimentales se simulan por separado y producen perfiles de glucosilación predichos que probablemente serán diferentes entre sí. La comparación visual con el perfil experimental por parte del usuario ahora permite juzgar qué hipótesis de localización es más coherente con los datos reales y, por lo tanto, es más probable que sea cierta.
El conocimiento de la localización también se puede utilizar para la modificación de la glucosilación utilizando este marco. La localización de enzimas se puede cambiar en el modelo para identificar la localización de enzimas que daría como resultado el perfil de glucanos deseado o un perfil que se acerque a un perfil deseado. Dado que la mayoría de las enzimas tienen dominios que determinan la localización en la célula, las estrategias de edición de enzimas pueden utilizar esta información para cambiar la localización de la enzima en función de los resultados del modelo. Por ejemplo, usando mutagénesis dirigida específica de sitio o síntesis de genes, se puede alterar o intercambiar dominios de proteína en glucosiltransferasas que especifican la localización intra-Golgi de la enzima (por ejemplo, para localizar la proteína en el trans-Golgi en lugar del medial). Tal cambio de localización cambiaría la topología de toda la red de reacción genérica, ya que permitiría que tuvieran lugar reacciones que antes no eran posibles y, al mismo tiempo, eliminaría reacciones. En la generación de la red de glucosilación genérica, la localización de cada glucosiltransferasa es un parámetro elegido por el usuario. Así, los cambios experimentales en la localización de glucosiltransferasa se pueden modelizar con facilidad. Después de la generación de tal red de reacción alternativa, la red se adapta ajustándose a un perfil de glucosilación (obtenido de la línea celular con la glucosiltransferasa localizada en otro lugar) para reconstruir las probabilidades de reacción en esta red alternativa.
(e) Simulación de enfermedades congénitas de glucosilación ("congenital diseases of glycosylation", CDG)
La red de glucosilación genérica se adapta al perfil de glucosilación observado obtenido de un paciente sano. A continuación, el espacio de posibles perturbaciones (atenuaciones/sobreexpresiones) que conducen al perfil de glucosilación observado del paciente con CDG se explora utilizando un algoritmo genético implementado en MATLAB. Sin embargo, se puede emplear cualquier otro algoritmo de optimización para identificar la mejor combinación de perturbaciones que coincida con el perfil de glucosilación del paciente. Para ello, el programa minimiza una función objetivo que mide la distancia euclidiana entre el perfil previsto y el observado. También se pueden emplear otras métricas de distancia. Si usa un algoritmo genético, el usuario especifica una hipótesis inicial de perturbaciones (tales como, entre otras, aumentos o disminuciones en el nivel de enzima, cambios en la actividad enzimática a través de la regulación o de concentraciones de sustrato, etc.), así como una condición de parada, tal como un número máximo de iteraciones del algoritmo genético, un umbral crítico para la función objetivo o un límite de tiempo de ejecución. El punto final obtenido del proceso de optimización es un conjunto de perturbaciones que explica mejor los datos obtenidos del paciente y puede actuar como guía para evaluar la gravedad con la que se ven afectadas las reacciones dependientes de enzimas individuales, y, por lo tanto, qué defectos genéticos son una causa probable de la enfermedad.
(f) Simulación de ajustes de medios de crecimiento
Un modelo COBRA se crea manual o algorítmicamente y comprende la red de reacción bioquímica (tal como se describe en la bibliografía) que vincula diversos nutrientes (glucosa, galactosa, manosa, fructosa, glutamina y otros) a la producción de nucleótidos de azúcar que actúan como precursores para las reacciones de glucosilación en el aparato de Golgi. La adaptación de la red de glucosilación genérica a un perfil de glucosilación obtenido de una línea celular en condiciones convencionales reconstruye los flujos en los que los nucleótidos de azúcar se incorporan a la red de glucosilación. Estos flujos son fijos (es decir, no varían entre las diferentes muestras de flujo tomadas), ya que solo los flujos internos dentro de la red de reacción pueden mostrar variación. Así, estos flujos pueden imponerse en la red de reacción de nucleótidos de azúcar para reconstruir el flujo a través de la red de nucleótidos de azúcar que produce el perfil de glucosilación observado (figura 12). Al restringir los flujos de absorción de todos los compuestos no incluidos en los medios de crecimiento del cultivo, el muestreo de los flujos a través de la red de nucleótidos de azúcar reconstruye el espacio de posibles rutas metabólicas a través de las cuales los nutrientes externos (por ejemplo, glucosa y glutamina) se vinculan con la generación de nucleótidos de azúcar que alimentan la glucosilación. Para simular el efecto de la suplementación con nutrientes adicionales (por ejemplo, galactosa), se utiliza un método de la caja de herramientas COBRA (minimización del ajuste metabólico, "Minimization Of Metabolic Adjustment", MOMA) para calcular cómo cambiará un flujo reconstruido una vez que se introduce un nutriente adicional en la red. Sin embargo, se pueden usar otros algoritmos que predicen los flujos ajustados después de una perturbación, incluidos, entre otros, los descritos en Lewis, Nagarajan y Palsson, Nature Reviews Microbiology, 2012. Los cambios resultantes en los flujos de exportación de los nucleótidos de azúcar se guardan y se ajustan en relación con los flujos en la condición convencional. Estas proporciones ahora representan el aumento o disminución en x veces de la síntesis de nucleótidos de azúcar y, por lo tanto, la disponibilidad mayor/menor en x veces de ese compuesto para las reacciones de glucosilación posteriores. Estas proporciones (q) ahora afectan a la probabilidad con la cual se llevarán a cabo las reacciones de glucosilación que dependen de estos compuestos. En un modelo lineal simple, las probabilidades se pueden escalar de nuevo de acuerdo con n ' = q • n. También se puede usar modelos alternativos, incluidos modelos no lineales. Por lo tanto, las reacciones tienen lugar con una probabilidad mayor/menor en x veces si la disponibilidad de los nucleótidos de azúcar requeridos aumenta/disminuye en x veces. Después de ejecutar el protocolo de ajuste de probabilidad como se describe, la cadena de Markov se vuelve a ejecutar para producir el perfil de glucosilación predicho como respuesta a la suplementación nutricional modificada (figura 14).
(g) Identificación de etapas de modificación de la glucosilación para la producción de biosimilares
Los aspectos de la presente divulgación son aplicables a la fabricación de biosimilares. Los biosimilares tienen que parecerse mucho al perfil de glucosilación del producto original que, generalmente, presenta una mezcla de glucanos. En otras palabras, en lugar de comenzar con la perturbación de las probabilidades de reacción (por ejemplo, a través de una atenuación) y luego calcular el perfil de glucosilación, la fabricación de biosimilares requiere invertir el flujo de trabajo para comenzar con un perfil de glucosilación e inferir las perturbaciones en la probabilidad de reacción que conducirán al perfil de glucosilación.
Así, en algunas realizaciones, se comienza con una línea celular de tipo salvaje en condiciones convencionales cuyo perfil de glucosilación se puede medir (el perfil de glucosilación inicial). Además, se conoce el perfil de glucosilación deseado (el perfil de glucosilación diana). Como en el caso anterior, primero se ajustaría el modelo de Markov al perfil de glucosilación inicial para calcular las probabilidades de reacción. A continuación, se debe hacer una conjetura inicial sobre qué perturbaciones (es decir, la glucosiltransferasa o glucosiltransferasas que se van a atenuar) convertirían el perfil de glucosilación inicial en el perfil de glucosilación diana. Un algoritmo genético (como, por ejemplo, implementado en MATLAB) puede tomar esta conjetura inicial como punto de partida y ejecutar iterativamente simulaciones de la cadena de Markov que finalmente convergerían e identificarían qué glucosiltransferasas se deben eliminar (o sobreexpresar) y en qué cantidad. para pasar del perfil de glucosilación inicial al perfil de glucosilación diana. Los algoritmos genéticos no son el único enfoque, por lo que podrían aplicarse otros algoritmos de optimización conocidos por los expertos en la materia a esta aplicación.
Es importante destacar que una realización del modelo solo identifica los cambios requeridos en la red de reacción de glucosilación, pero se dejaría a discreción del usuario hacer una elección con respecto a los medios experimentales para lograr estos cambios requeridos. Por ejemplo, la ejecución de la simulación podría terminar afirmando que se requiere una reducción del 67,2 % en las reacciones dependientes de fucosiltransferasa para obtener el perfil de glucosilación diana. El usuario ahora podría elegir una técnica experimental para implementar este requisito, por ejemplo, a través de un ARNhc dirigido al transcrito de fucosiltransferasa, un inhibidor químico (cuya dosis habría que ajustar para obtener la reducción de actividad requerida) o cambios en los medios de crecimiento que conducirían a una reducción de GDP-fucosa, que es el sustrato de las reacciones dependientes de fucosiltransferasa. Independientemente del método experimental, los aspectos de la tecnología divulgada pueden proporcionar pautas claras sobre cómo modificar las condiciones del proceso en la fabricación de biosimilares para que coincidan con el perfil de glucosilación del producto original. Este enfoque es aplicable, tal como se ha descrito anteriormente, al desarrollo de biosimilares, pero también se puede aplicar a cualquier otro intento de obtener un perfil de glucosilación específico para un diseño biofarmacéutico o biomejorado.
Este flujo de trabajo de ingeniería inversa del perfil de glucosilación es análogo a la identificación de fallos en el gen de la glucosilación en el contexto de los trastornos congénitos de la glucosilación descritos en el presente documento.
(h) Ampliación a redes de reacción de glucosilación alternativas
Como apreciará un experto en la materia, la presente divulgación no se limita a la glucosilación enlazada a través de N. Dada una tabla de conjuntos de reglas de glucosiltransferasa en analogía con la tabla 1, se puede construir una red de reacción genérica para, por ejemplo, la glucosilación enlazad a través de O u oligosacáridos de leche humana utilizando los métodos expuestos anteriormente. Dado un perfil de glucosilación, las probabilidades de reacción se pueden inferir en estas redes como se indicó anteriormente.
(i) Identificación de genes de glucosiltranferasa
Varios tipos de glucanos están menos estudiados, tales como los oligosacáridos de la leche, los glucanos vegetales y los glucanos microbianos. Aunque no se reivindica, el sistema y el método divulgados pueden aplicarse para descubrir y usar glucosiltransferasas. A continuación se describirá un ejemplo con oligosacáridos de la leche humana. Si bien la necesidad de ciertas reacciones enzimáticas en la red de reacción de oligosacáridos de la leche humana es claramente evidente partiendo de las estructuras de oligosacáridos resultantes observadas en los perfiles de glucosilados, los genes correspondientes que codifican las glucosiltransferasas requeridas son, en muchos casos, desconocidos, es decir, se puede conocer un conjunto de candidatos putativos partiendo del análisis de secuencias, pero se desconoce cuál de ellos realmente muestra expresión y actividad sobre los oligosacáridos de la leche. A través de la combinación con perfiles transcripcionales profundos (tales como RNA-seq), proteómica u otros ensayos que cuantifican la expresión o actividad de genes o proteínas, el sistema y el método divulgados pueden ayudar en la identificación de estos genes. Para ello, se generará una red genérica de todas las reacciones posibles que podrían contribuir a la síntesis de todos los oligosacáridos de la leche en función de las estructuras de glucano. Luego, se usaría un perfil de oligosacáridos para adaptar la red genérica a los glucanos específicos medidos. Luego se utilizarán cantidades de oligosacáridos para inferir las probabilidades de reacción para un perfil de oligosacáridos de un sujeto. Esto se haría para múltiples sujetos. Luego, los cambios en las probabilidades de Markov entre los sujetos se compararían con la expresión génica diferencial o las mediciones de proteínas para identificar los genes candidatos que covarían con las probabilidades. La comparación de la probabilidad de reacción inferida con la fuerza de expresión de los posibles genes candidatos da pistas sobre cuál de los genes es el candidato más probable. Al recopilar estos datos de no uno, sino de una cohorte de pacientes, estas inferencias se pueden corroborar a través del análisis de correlación. Se proporciona el siguiente ejemplo para describir la invención con mayor detalle. Pretenden ilustrar, pero no limitar la invención.
Ejemplos
Ejemplo 1: Predicción de perfiles de glucosilación después de la atenuación de enzimas
Ejemplos de simulación de perturbaciones en la red de reacción: Se muestran atenuaciones de enzimas en cuatro casos. El primer perfil de glucosilación analizado, tal como se describe en Imai-Nishiya et al., 2007, para una línea celular CHO productora de anticuerpos, consistía en glucanos biantenarios fucosilados. La eliminación experimental de FUT8 usando ARNip ha llevado a la omisión satisfactoria de la fucosilación del núcleo y la sustitución de los tres glucanos por sus versiones no fucosiladas (Imai-Nishiya et al., 2007), un resultado muy bien predicho por el modelo de Markov en simulaciones (figura 23).
Con el objetivo de validar un conjunto de datos más complejo, se analizaron los perfiles de glucosilación publicados recientemente de una línea celular CHO-GS que expresa eritropoyetina (EPO) (Yang et al., 2015). La simulación de una atenuación de GnTIV produjo una buena concordancia cuantitativa con el perfil de atenuación experimental (figura 23), lo que demuestra que el modelo de Markov puede servir como una herramienta predictiva útil incluso en redes multidimensionales donde el análisis intuitivo de las atenuaciones es imposible debido a la gran cantidad de rutas posibles.
En tercer lugar, se demostró cómo el modelo puede predecir los perfiles de glucosilación de atenuación incluso cuando se aplica a una mezcla de proteínas en lugar de una proteína aislada. Se demostró que la simulación de una atenuación de FUT8 en una línea celular CHO-S se parece mucho al perfil de atenuación medido, tomado de la totalidad de las proteínas secretadas en lugar de una sola proteína purificada (figura 23).
Por último, el fenómeno de la fuga de glucanos se hizo evidente al simular una atenuación de a3SiaT, tal como se ha documentado experimentalmente en CHO-GS que expresan EPO (Yang et al., 2015). Suponiendo una fuga de glucanos, el modelo es capaz de predecir el perfil de glucosilación observado con alta precisión (figura 24, figura 25). Cuando se supone que no hay fugas, el modelo predice una fracción dominante de glucanos portadores de poli-LacNAc en el perfil (figura 26, flecha) porque supone que la enzima colocalizada (iGnT) es capaz de compensar por completo la pérdida de a3SiaT y procesar la totalidad de los sustratos de glucanos.
Ejemplo 2: Evaluación de un aparato de Golgi no compartimentado
Si bien las localizaciones supuestas para este modelo se basan en un consenso ampliamente aceptado (tabla 1) (Moremen et al., 2012), sigue habiendo desacuerdos sobre cómo y en qué medida se implementa la compartimentación del Golgi en los modelos de glucosilación. Dada la disponibilidad de perfiles de glucosilación mutantes, el modelo de la invención puede probar el impacto de la compartimentación del Golgi ejecutando simulaciones con diferentes escenarios de localización y comparándolos con los resultados experimentales. Para demostrar esto, se realizaron simulaciones de atenuación con todas las enzimas localizadas en el mismo compartimento, convirtiendo así efectivamente el aparato de Golgi en un orgánulo no compartimentado. Tal como se observa en los conjuntos de datos de validación, esto conduce a predicciones de atenuación que no están en congruencia con los perfiles de glucosilación experimentales (figura 27). Las discrepancias observadas en este caso provienen de cambios en la topología de la red causados por la aparición de reacciones que estaban ausentes en el caso compartimentado debido al confinamiento de las enzimas en diferentes compartimentos. Por ejemplo, en el caso de la red de glucosilación de anticuerpos (figura 28), la ausencia de compartimentación implica la competencia entre GalT y Fut8, que no estaba presente con ambas enzimas localizadas en diferentes compartimentos. Como consecuencia, la simulación de una atenuación de Fut8 en este escenario cambia significativamente el perfil de glucosilación predicho, que en este caso solo contendría un único glucano completamente galactosilado (glucano n.° 6, figura 28). Cambios similares en la topología de la red conducen a glucanos falsamente predichos en una atenuación de GnTIV si se supone que GalT compite directamente con GnTIV en un aparato de Golgi no compartimentado (figura 29, FIG. 30). Por consiguiente, se concluye que la compartimentación de Golgi es una propiedad vital para los intentos de modelización de la glucosilación computacionales. Así, probando diferentes escenarios de localización, el modelo de la invención sirve como una herramienta para evaluar la probabilidad de una hipótesis de localización en función de la congruencia entre los perfiles de glucosilación de atenuación predichos y observados, y para predicciones de cómo se puede modificar la localización de la glucosiltransferasa para obtener un perfil de glucosilación deseado.
Ejemplo 3: Análisis de un trastorno congénito de la glucosilación
Se obtuvo un perfil de glucosilación anómalo de un paciente que padecía un trastorno de glucosilación con un origen genético poco claro (Butler, 2003) (figura 31). Después de adaptar la red de glucosilación genérica al perfil de glucosilación de un paciente sano (figura 32), se usó un algoritmo genético (tal como se implementa en MATLAb ) para descubrir la perturbación en la red de reacción que se acercaría más al perfil observado en el paciente. Después de ejecutar el algoritmo durante 75 generaciones, la distancia euclidiana entre el perfil de paciente predicho y observado no mostró mejoría adicional, lo que indica un óptimo local (figura 33). En el óptimo, se predijo que las reacciones dependientes de ManII se reducirían al 71 %, las reacciones dependientes de GnTI al 85% y las reacciones dependientes de GnTII al 87 %, mientras que se predijo que las reacciones dependientes de a3SiaT y GnTV serían del 0 % (figura 34). Estos resultados indican que la red de glucosilación del paciente se ve más afectada de lo que se suponía en la descripción de los datos originales, en los que solo se consideró que las vías dependientes de GnTII estaban reguladas a la baja (Butler, 2003).
Ejemplo 4: Desplazamiento del perfil de glucosilación mediante la suplementación de medios
El modelo de Markov se adaptó a un perfil de IgG (Gramer et al., 2011) y se reconstruyeron los flujos de nucleótidos de azúcar necesarios para el perfil. Después de restringir la red de nucleótidos de azúcar a estos flujos, además de no permitir ningún otro flujo de entrada de nutrientes que no fuera de glucosa y glutamina, se usó optGpSampler (Megchelenbrink et al., 2014) para muestrear el espacio de posibles flujos de reacción desde la captación de glucosa y glutamina hasta la generación de los flujos de nucleótidos de azúcar requeridos. A continuación, se simuló la absorción de galactosa o GlcNAc restringiendo los flujos de absorción de estos compuestos y usando métodos de la caja de herramientas COBRA ("Minimización del ajuste metabólico") para modelizar cómo se desviaría el flujo en la red del flujo reconstruido con estas nuevas restricciones. La simulación de la captación de galactosa conduce a un aumento del flujo de UDP-galactosa en el aparato de Golgi, mientras que la simulación de la captación de GlcNAc conduce a una disminución del flujo de UDP-galactosa. Por consiguiente, la simulación de la glucosilación en estos casos produjo unas frecuencias aumentadas de glucanos galactosilados en el primer caso y una disminución en el segundo (figura 35, figura 36), en coherencia con los datos experimentales (Gramer et al., 2011; Kildegaard et al., 2015).
MATERIALES Y MÉTODOS
Cultivo de células
Se cultivaron células CHO-S (Life Technologies, Thermo Scientific, Rockford, IL) en suspensión en medio CD CHO suplementado con L-glutamina 8 mM y agente antiaglomerante 2 ul/ml (Life Technologies, Thermo Scientific, Rockford, IL). Las células se expandieron en matraces de agitación con tapón de ventilación Corning (Sigma-Aldrich, St. Louis, MO) en una estufa de incubación humidificada a 120 rpm (órbita de 25 mm), a 37 °C y 5 % de CO2. Las densidades de células viables se midieron utilizando el contador de células NucleoCounter NC-200 (ChemoMetec, Allerod, Dinamarca) y las células se pasaron a medio fresco cada dos o tres días con densidades de siembra de 3-5 x 105 células/ml.
Construcción del vector de expresión Cas9 marcado con fluorescencia
La clonación de GFP_2A_Cas9 se realizó mediante clonación sin costuras con el reactivo de escisión específico de uracilo ("uracil specific excision reagent", USER) de dos productos de PCR; GFP_2A y el vector de expresión Cas9 (Ronda et al., 2014) y la PCR se realizó con la ADN polimerasa X7 (N0 rholm 2010). Después del tratamiento con DpnI (Thermo Fisher Scientific, Waltham, MA) del fragmento del esqueleto (vector de expresión Cas9), los amplicones se purificaron en gel de agarosa TAE al 1 % utilizando el gel NucleoSpin® Gel y el kit PCR Clean-up (Macherey-Nagel, Düren, Alemania). Los dos productos de PCR se mezclaron y trataron con la enzima USER (New England Biolabs, Ipswich, MA) de acuerdo con las recomendaciones del fabricante. Tras el tratamiento con la enzima USER, la mezcla de reacción se transformó en células competentes de E. coli One Shot® Mach1™ (Life Technologies, Paisley, Reino Unido) de acuerdo con los procedimientos convencionales. Las células transformantes se seleccionaron en placas LB con ampicilina 100 μg/ml. La construcción se verificó mediante secuenciación y se purificó con el kit NucleoBond® Xtra Midi (Macherey-Nagel) de acuerdo con las recomendaciones del fabricante. Sin embargo, más adelante se detectó una mutación no deseada P28L en Cas9 del vector de expresión GFP_2A_Cas9, aplicado en este estudio. Por lo tanto, este plásmido se denominó GFP_2A_Cas9m.
Construcción de líneas celulares FUT8 KO usando CRISPR Cas9
Las células CHO-S se lavaron y sembraron a 5-6 x 105 células/ml sin agentes antiaglomerantes un día antes de la transfección. Las células se transfectaron con vectores de expresión que codifican GFP_2A_Cas9m y ARNgu dirigidos a FUT8 (sgRNA2_F o sgRNA3_F, publicados anteriormente en Ronda et al., 2014). Para cada muestra, se transfectaron 3 millones de células con una densidad de 1 x 106 células/ml en una placa multipocillo de 6 pocillos (BD Biosciences, San José, CA) con 1,875 μg de GFP_2A_Cas9 y 1,875 μg de ARNgu utilizando el reactivo FreeStyleTM MAX junto con el medio OptiPRO SFM (Life Technologies) según las recomendaciones del fabricante. Se aplicaron las transfecciones con el vector pmaxGFP® (Lonza, Basilea, Suiza) como control para las eficiencias de transfección. Dos días después de la transfección, se usó un FACSJazz (BD Biosciences) para clasificar individualmente las células transfectadas. Antes de clasificar las células, las células se prepararon por centrifugación a 100 g durante 5 min y se resuspendieron en 1 ml de medio fresco. Las células se filtraron a través de un tamiz para células de 40 μm para lograr una suspensión de células individuales y se transfirieron a un tubo FACS. Las células se clasificaron en placas con fondo en U de 96 pocillos (BD Biosciences, San José, CA). Se sembró 1 célula por pocillo en 200 ul de medio CD CHO que contenía L-glutamina 8 mM, penicilina-estreptomicina al 1 % y medio acondicionado filtrado al 20%. Después de 10 días, se añadió un agente antiaglomerante a cada pocillo con colonias para alcanzar una concentración final de 2 μl/ml. El día 14, las colonias se trasladaron a placas de fondo plano de 96 pocillos para que se expandieran aún más. Las colonias confluentes se dividieron y las placas replicadas se sembraron y recolectaron para un análisis de secuenciación profunda cuando estaban cerca de la confluencia. El ADN genómico se extrajo de las células clonales recolectadas utilizando la solución de extracción de ADN QuickExtract (Epicentre, Illumina, Madison, WI) de acuerdo con las instrucciones del fabricante y se conservó a -20 °C. La secuenciación profunda se realizó en un MiSeq Benchtop Sequencer (Illumina, San Diego, CA) utilizando el protocolo publicado anteriormente (Ronda et al., 2014). A partir de los datos de la secuenciación profunda, se seleccionó y expandió una línea celular FUT8 KO generada a partir de cada uno de los dos ARNgu (línea celular sgRNA2_F FUT8_2029, línea celular sgRNA3_F FUT8_2030).
Análisis fenotípico basado en tinción con lectina de células con atenuación de FUT8
Se centrifugaron (200 g, TA, 5 min) 5 x 105 células en el medio y se descartó el sobrenadante. Las células se resuspendieron en 500 μl de medio que contenía Hoechst 33342 5 μg/ml (Pierce, Thermo Scientific, Rockford, IL) o 500 μl de medio que contenía Hoechst 5 μg/ml y aglutinina culinaria de fluoresceína-Lens 20 μg/ml (F-LCA, Vector Laboratories, Peterborough, Reino Unido) y se incubaron durante 30 minutos a temperatura ambiente en la oscuridad. Las células se lavaron dos veces en 1 ml de PBS por centrifugación (200 g, TA, 5 min). Por último, las células se resuspendieron en 500 μl de PBS y se transfirieron 20 μl de la suspensión celular a pocillos en una microplaca black/clear® tratada para cultivo de tejidos de 96 pocillos (Greiner Bio-one, Frickenhausen, Alemania) y posteriormente se añadieron 180 μl de PBS a cada pocillo. La placa se centrifugó brevemente (100 g, 15 s, temperatura ambiente) y se realizó una citometría de formación de imágenes de fluorescencia en un citómetro de células de formación de imágenes Celigo (Nexcelom Bioscience, Lawrence, MA) utilizando la aplicación mask targetl. Los canales de fluorescencia azul y verde se utilizaron como mask (Hoechst) y targetI (F-LCA), respectivamente.
Determinación del perfil de glucosilación
Se sembraron células en crecimiento exponencial a 1 x 106 células/ml en matraces de agitación con tapón de ventilación Corning de 250 ml (Sigma-Aldrich, St. Louis, MO). Cuatro días después de la siembra, se recogieron 40 ml de sobrenadante por centrifugación (2000 g, 15 min, TA). Los sobrenadantes se filtraron (0,2 μm) y las proteínas se concentraron hasta aproximadamente 1,5 ml en columnas Amicon Ultra (Merck Millipore, Merck KGaA, Darmstadt, Alemania) con un corte de 3000 Da. Los concentrados se centrifugaron (17000 g, 15 min, TA) y los sobrenadantes se transfirieron a tubos nuevos. Los N-glucanos de las proteínas retenidas se liberaron y se marcaron con fluorescencia con el kit GlykoPrep Rapid N-Glycan (ProZyme Inc., Hayward, CA) según las instrucciones del fabricante utilizando 2-aminobenzamida (2-AB) como marcador fluorescente. Los N-glucanos marcados se analizaron mediante LC-MS en un Thermo Ultimate 3000 HPLC con un detector de fluorescencia acoplado en línea a un Thermo Velos Pro Iontrap MS. La separación se realizó en una columna BEH Glycan de 100 mm x 2,1, 1,7 μm (Waters, Milford, MA) utilizando los siguientes tampones: Tampón A: acetonitrilo al 100 %, Tampón B: Formiato de amonio 50 mM, pH 4,4 ajustado con ácido fórmico y filtrado (0,2 μm). Se aplicó un gradiente de separación desde tampón A al 39 % hasta tampón A al 47 % durante 16 min a un caudal de 0,5 ml/min. El detector de fluorescencia se configuró con una lámpara de alta potencia y una excitación de 360 nm, emisión a 428 nm. Ajustes de MS: análisis completo: 700-2000 m/z, fragmentación de fuente 60 V, polaridad negativa.
Según se desee, las implementaciones de la tecnología descrita pueden incluir un dispositivo informático con más o menos de los componentes ilustrados en la figura 39. Se entenderá que la arquitectura del dispositivo informático 100 se proporciona únicamente a modo de ejemplo y no limita el alcance de las diversas implementaciones de los sistemas. métodos y medios legibles por ordenador divulgados en el presente documento.
La arquitectura del dispositivo informático 3900 de la figura 39 incluye una unidad central de procesamiento (CPU) 3902, donde se procesan las instrucciones del ordenador; una interfaz de pantalla 3904 que actúa como una interfaz de comunicación y proporciona funciones para renderizar video, gráficos, imágenes y textos en la pantalla. En ciertas implementaciones de ejemplo de la tecnología divulgada, la interfaz de pantalla 3904 se puede conectar directamente a una pantalla local, como una pantalla táctil asociada a un dispositivo informático portátil. En otro ejemplo de implementación, la interfaz de visualización 3904 puede configurarse para proporcionar datos, imágenes y otra información para una pantalla externa/remota que no está necesariamente conectada físicamente al dispositivo informático portátil. Por ejemplo, se puede usar un monitor de escritorio para duplicar gráficos y otra información que se presenta en un dispositivo informático portátil. En ciertos ejemplos de implementaciones, la interfaz de pantalla 3904 puede comunicarse de forma inalámbrica, por ejemplo, a través de un canal WiFi u otra interfaz de conexión de red disponible 3912 a la pantalla externa/remota.
En un ejemplo de implementación, la interfaz de conexión de red 3912 puede configurarse como una interfaz de comunicación y puede proporcionar funciones para renderizar video, gráficos, imágenes, texto, otra información o cualquier combinación de los mismos en la pantalla. En un ejemplo, una interfaz de comunicación puede incluir un puerto en serie, un puerto en paralelo, un puerto de entrada y salida de propósito general ("general purpose input and output", GPIO), un puerto de juegos, un bus universal en serie (USB), un puerto micro-USB, un puerto multimedia de alta definición (HDMI), un puerto de vídeo, un puerto de audio, un puerto de Bluetooth, un puerto de comunicación de campo cercano ("nearfield communication", NFC), otra interfaz de comunicación similar o cualquier combinación de los mismos. En un ejemplo, la interfaz de pantalla 3904 puede acoplarse operativamente a una pantalla local, tal como una pantalla táctil asociada a un dispositivo portátil. En otro ejemplo, la interfaz de pantalla 3904 puede configurarse para proporcionar video, gráficos, imágenes, texto, otra información o cualquier combinación de los mismos a una pantalla externa/remota que no está necesariamente conectada al dispositivo informático portátil. En un ejemplo, se puede usar un monitor de escritorio para duplicar o ampliar la información gráfica que se puede presentar en un dispositivo portátil. En otro ejemplo, la interfaz de pantalla 3904 puede comunicarse de forma inalámbrica, por ejemplo, a través de la interfaz de conexión de red 3912, tal como un transceptor Wi-Fi, con la pantalla externa/remota.
La arquitectura del dispositivo informático 3900 puede incluir una interfaz de teclado 3906 que proporciona una interfaz de comunicación a un teclado. En un ejemplo de implementación, la arquitectura del dispositivo informático 3900 puede incluir una interfaz de pantalla sensible a la presencia 3908 para conectarse a una pantalla sensible a la presencia 3907. De acuerdo con ciertos ejemplos de implementaciones de la tecnología divulgada, la interfaz de pantalla sensible a la presencia 3908 puede proporcionar una interfaz de comunicación para diversos dispositivos, tales como un dispositivo señalador, una pantalla táctil, una cámara de profundidad, etc., que pueden o no estar asociados a una pantalla.
La arquitectura del dispositivo informático 3900 puede configurarse para usar un dispositivo de entrada a través de una o más interfaces de entrada/salida (por ejemplo, la interfaz de teclado 3906, la interfaz de pantalla 3904, la interfaz de pantalla sensible a la presencia 3908, la interfaz de conexión de red 3912, la interfaz de cámara 3914, la interfaz de sonido 3916, etc.), para permitir que un usuario capture información hacia la arquitectura del dispositivo informático 3900. El dispositivo de entrada puede incluir un ratón, una bola de seguimiento, un panel direccional, un panel táctil, un panel táctil con verificación táctil, un panel táctil sensible a la presencia, una pantalla sensible a la presencia, una rueda de desplazamiento, una cámara digital, una videocámara digital, una cámara web, un micrófono, un sensor, una tarjeta inteligente y similares. Además, el dispositivo de entrada puede estar integrado en la arquitectura del dispositivo informático 3900 o puede ser un dispositivo separado. Por ejemplo, el dispositivo de entrada puede ser un acelerómetro, un magnetómetro, una cámara digital, un micrófono y un sensor óptico.
Los ejemplos de implementaciones de la arquitectura del dispositivo informático 3900 pueden incluir una interfaz de antena 3910 que proporciona una interfaz de comunicación con una antena; una interfaz de conexión de red 3912 que proporciona una interfaz de comunicación a una red. Tal como se ha mencionado anteriormente, la interfaz de pantalla 3904 puede estar en comunicación con la interfaz de conexión de red 3912, por ejemplo, para proporcionar información para mostrar en una pantalla remota que no está directamente conectada o unida al sistema. En determinadas implementaciones, se proporciona una interfaz de cámara 3914 que actúa como una interfaz de comunicación y proporciona funciones para capturar imágenes digitales de una cámara. En determinadas implementaciones, se proporciona una interfaz de sonido 3916 como interfaz de comunicación para convertir el sonido en señales eléctricas usando un micrófono y para convertir señales eléctricas en sonido usando un altavoz. De acuerdo con determinados ejemplos de implementaciones, se proporciona una memoria de acceso aleatorio ("random access memory", RAM) 3918, donde las instrucciones y los datos del ordenador pueden almacenarse en un dispositivo de memoria volátil para ser procesados por la CPU 3902.
De acuerdo con un ejemplo de implementación, la arquitectura del dispositivo informático 3900 incluye una memoria de solo lectura ("read-only memory", ROM) 3920 donde el código del sistema de bajo nivel invariable o los datos para las funciones básicas del sistema, tales como entrada y salida (E/S) básicas, inicio o recepción de pulsaciones de teclas desde un teclado, se almacenan en un dispositivo de memoria no volátil. De acuerdo con un ejemplo de implementación, la arquitectura del dispositivo informático 3900 incluye un medio de almacenamiento 3922 u otro tipo adecuado de memoria (por ejemplo, RAM, ROM, memoria de solo lectura programable ("programmable read-only memory", PROM), memoria de solo lectura programable y borrable ("erasable programmable read-only memory", EPROM), memoria de solo lectura programable y borrable eléctricamente ("electrically erasable programmable readonly memory", EEPROM), discos magnéticos, discos ópticos, disquetes, discos duros, cartuchos extraíbles, memorias USB), donde los archivos incluyen un sistema operativo 3924, programas de aplicación 3926 (que incluyen, por ejemplo, una aplicación de navegador web, un motor de widgets o gadgets u otras aplicaciones, según sea necesario) y los archivos de datos 3928 se almacenan. De acuerdo con un ejemplo de implementación, la arquitectura del dispositivo informático 3900 incluye una fuente de alimentación 3930 que proporciona una corriente alterna (CA) o corriente continua (CC) adecuada para alimentar los componentes.
De acuerdo con un ejemplo de implementación, la arquitectura del dispositivo informático 3900 incluye un subsistema de telefonía 3932 que permite que el dispositivo 3900 transmita y reciba sonido a través de una red telefónica. Los dispositivos constituyentes y la CPU 3902 se comunican entre sí a través de un bus 3934.
De acuerdo con un ejemplo de implementación, la CPU 3902 tiene la estructura apropiada para ser un procesador de ordenador. En una configuración, la CPU 3902 puede incluir más de una unidad de procesamiento. La RAM 3918 interactúa con el bus del ordenador 3934 para proporcionar un almacenamiento de RAM rápido a la CPU 3902 durante la ejecución de programas de software, tales como los programas de aplicación del sistema operativo y los controladores de dispositivos. Más específicamente, la CPU 3902 carga etapas de procesos ejecutables por ordenador desde el medio de almacenamiento 3922 u otros medios en un campo de la RAM 3918 para ejecutar programas de software. Los datos pueden almacenarse en la RAM 3918, donde el ordenador CPU 3902 puede acceder a los datos durante la ejecución. En un ejemplo de configuración, la arquitectura del dispositivo 3900 incluye al menos 3928 MB de RAM y 256 MB de memoria flash.
El medio de almacenamiento 3922 en sí mismo puede incluir varias unidades de disco físico, tales como una matriz redundante de discos independientes ("redundant array of independent disks", RAID), una unidad de disquete, una memoria flash, una memoria USB, una unidad de disco duro externa, un lápiz de memoria, un pendrive, una unidad de llave, una unidad de disco óptico de disco versátil digital de alta densidad ("High-Density Digital Versatile Disc", HD-DVD), una unidad de disco duro interna, una unidad de disco óptico Blu-Ray o una unidad de disco óptico Holographic Digital Data Storage (HDDS), una memoria de acceso aleatorio dinámica síncrona ("synchronous dynamic random access memory", SDRAM) de minimódulo de memoria dual en línea ("dual in-line memory module", DIMM) externa o una SDRAM micro-DIMM externa. Dichos medios de almacenamiento legibles por ordenador permiten que un dispositivo informático acceda a etapas del proceso ejecutables por ordenador, programas de aplicación y similares, almacenados en medios de memoria extraíbles y no extraíbles, para descargar datos del dispositivo o para cargar datos en el dispositivo. Un producto de programa de ordenador, tal como un producto que utilice un sistema de comunicación, puede incorporarse tangiblemente en el medio de almacenamiento 3922, que puede comprender un medio de almacenamiento legible por máquina.
De acuerdo con un ejemplo de implementación, la expresión dispositivo informático, tal como se usa en el presente documento, puede ser una CPU, o puede conceptualizarse como una CPU (por ejemplo, la CPU 3902 de la figura 39). En este ejemplo de implementación, el dispositivo informático (CPU) puede estar acoplado, conectado y/o en comunicación con uno o más dispositivos periféricos, tales como una pantalla. En otro ejemplo de implementación, la expresión dispositivo informático, tal como se usa en el presente documento, puede referirse a un dispositivo informático portátil, tal como un teléfono inteligente, una tableta o un reloj inteligente. En este ejemplo de implementación, el dispositivo informático puede enviar contenido a su pantalla y/o altavoces locales. En otro ejemplo de implementación, el dispositivo informático puede enviar contenido a un dispositivo de visualización externo (por ejemplo, a través de Wi-Fi), tal como un televisor o un sistema informático externo.
En ejemplos de implementaciones de la tecnología divulgada, un dispositivo informático puede incluir un número cualquiera de aplicaciones de hardware y/o software que se ejecutan para facilitar cualquiera de las operaciones. En ejemplos de implementaciones, una o más interfaces de E/S pueden facilitar la comunicación entre el dispositivo informático y uno o más dispositivos de entrada/salida. Por ejemplo, un puerto de bus universal en serie, un puerto en serie, una unidad de disco, una unidad de CD-ROM y/o uno o más dispositivos de interfaz de usuario, tal como una pantalla, un teclado, un teclado numérico, un ratón, un panel de control, un pantalla táctil, un micrófono, etc., puede facilitar la interacción del usuario con el dispositivo informático. Dichas una o más interfaces de E/S se pueden usar para recibir o recopilar datos y/o instrucciones del usuario desde una amplia variedad de dispositivos de entrada. Los datos recibidos pueden ser procesados por uno o más procesadores informáticos según se desee en diversas implementaciones de la tecnología divulgada y/o almacenados en uno o más dispositivos de memoria.
Una o más interfaces de red pueden facilitar la conexión de las entradas y salidas del dispositivo informático a una o más redes y/o conexiones adecuadas; por ejemplo, las conexiones que facilitan la comunicación con cualquier número de sensores asociados al sistema. Dichas una o más interfaces de red pueden facilitar además la conexión a una o más redes adecuadas; por ejemplo, una red de área local, una red de área amplia, internet, una red de telefonía móvil, una red de radiofrecuencia, una red habilitada para Bluetooth, una red habilitada para Wi-Fi, una red por satélite, cualquier red por cable, cualquier red inalámbrica, etc., para la comunicación con dispositivos y/o sistemas externos.
En la descripción anterior, se exponen numerosos detalles específicos. Debe entenderse, sin embargo, que las implementaciones de la tecnología divulgada pueden practicarse sin estos detalles específicos. En otros casos, no se han mostrado en detalle los métodos, las estructuras y las técnicas bien conocidos para no complicar la comprensión de esta descripción. Las referencias a "una implementación", "ejemplo de implementación", "diversas implementaciones", etc., indican que las implementaciones de la tecnología divulgada así descrita pueden incluir un rasgo, una estructura o una característica concretos, pero no todas las implementaciones incluyen necesariamente el rasgo, estructura o característica concretos. Además, el uso repetido de la expresión "en una implementación" no se refiere necesariamente a la misma implementación, aunque puede referirse a ella.
A lo largo de la memoria descriptiva y las reivindicaciones, los siguientes términos y expresiones tienen al menos los significados asociados explícitamente en el presente documento, a menos que el contexto dictamine claramente lo contrario. El término "conectado" significa que una función, un rasgo, una estructura o una característica está directamente unido o en comunicación con otra función, rasgo, estructura o característica. El término "acoplado" significa que una función, un rasgo, una estructura o una característica está directa o indirectamente unida o en comunicación con otra función, rasgo, estructura o característica. Se entiende que el uso de "o" hace referencia a un "o " inclusivo. Además, los términos "un/una" y "el/la" tienen la intención de significar uno o más, a menos que se especifique lo contrario o quede claro por el contexto para se refieren a una forma singular.
Tal como se usa en el presente documento, a menos que se especifique lo contrario, el uso de los adjetivos ordinales "primero", "segundo", "tercero", etc., para describir un objeto común, simplemente indican que se hace referencia a diferentes casos de objetos similares, y no pretenden implicar que los objetos así descritos deban estar en una secuencia determinada, ya sea temporal, espacial, en la clasificación o de cualquier otra manera.
Determinadas implementaciones de la tecnología divulgada se han descrito anteriormente con referencia a diagramas de bloques y de flujo de sistemas y métodos y/o productos de programas informáticos de acuerdo con ejemplos de implementaciones de la tecnología divulgada. Se entenderá que uno o más bloques de los diagramas de bloques y diagramas de flujo, y las combinaciones de bloques en los diagramas de bloques y diagramas de flujo, respectivamente, pueden implementarse mediante instrucciones de programa ejecutables por ordenador. Igualmente, algunos bloques de los diagramas de bloques y de los diagramas de flujo pueden no tener que ejecutarse necesariamente en el orden presentado, o puede que no sea necesario ejecutarlos en absoluto, de acuerdo con algunas implementaciones de la tecnología divulgada.
Estas instrucciones de programas ejecutables por ordenador pueden cargarse en un ordenador de uso general, un ordenador de uso especial, un procesador u otro aparato de procesamiento de datos programable para producir una máquina concreta, de modo que las instrucciones que se ejecutan en el ordenador, el procesador u otro aparato de procesamiento de datos programable crean medios para implementar una o más funciones especificadas en el bloque o bloques del diagrama de flujo. Estas instrucciones de programa informático también pueden almacenarse en una memoria legible por ordenador que puede dirigir un ordenador u otro aparato de procesamiento de datos programable para que funcione de una manera concreta, de modo que las instrucciones almacenadas en la memoria legible por ordenador produzcan un artículo de fabricación que incluya medios de instrucción que implementen una o más funciones especificadas en el bloque o bloques del diagrama de flujo.
Las implementaciones de la tecnología divulgada pueden proporcionar un producto de programa informático, que comprende un medio legible por ordenador que tiene incorporado un código de programa legible por ordenador o instrucciones de programa, estando adaptado dicho código de programa legible por ordenador para ser ejecutado para implementar una o más funciones especificadas en el bloque o bloques del diagrama de flujo. Las instrucciones del programa informático también se pueden cargar en un ordenador u otro aparato procesador de datos programable para provocar que se realice una serie de etapas o elementos operativos en el ordenador u otro aparato programable, para producir un proceso implementado por ordenador, de forma que las instrucciones que se ejecutan en el ordenador u otro aparato programable proporcionen etapas o elementos para implementar las funciones especificadas en el bloque o bloques del diagrama de flujo.
Por consiguiente, los bloques de los diagramas de bloques y los diagramas de flujo admiten combinaciones de medios para realizar las funciones especificadas, combinaciones de elementos o etapas para realizar las funciones especificadas y medios de instrucción del programa para realizar las funciones especificadas. También se entenderá que cada bloque de los diagramas de bloques y diagramas de flujo, y las combinaciones de bloques en los diagramas de bloques y diagramas de flujo, puede ser implementado por sistemas informáticos basados en hardware de uso especial que realizan las funciones, los elementos o las etapas especificadas, o combinaciones de hardware de uso especial e instrucciones de ordenador.
Más allá de la arquitectura informática, las implementaciones de la tecnología descrita pueden incluir una máquina que incluye un dispositivo informático con más o menos de los componentes ilustrados en la figura 39. Se entenderá que la arquitectura del dispositivo, los componentes mecánicos y las etapas se proporcionan solo a modo de ejemplo y no limitan el alcance de las diversas implementaciones. Esto se proporciona como un ejemplo de una máquina que se puede desarrollar para implementar los procesos reivindicados en el presente documento.
Una máquina que lleva a cabo los procesos descritos en el presente documento podría hacer lo siguiente. La máquina podría tener un dispositivo para cultivar células. En el momento deseado, el perfil de glucosilación se medirá con un enfoque como el siguiente. La máquina podría extraer el sobrenadante o sacrificar las células. Luego, los glucanos se purifican de la muestra a través de métodos cromatográficos y/o tratamiento enzimático (por ejemplo, PNGasa, glucosidasas) usando métodos establecidos por los expertos en la materia. Los glucanos purificados (o glucopéptidos o glucolípidos) se pueden cuantificar utilizando un método cromatográfico en línea (por ejemplo, HPLC que utilice diversos tipos de columnas). Los glucanos pueden cuantificarse utilizando picos cromatográficos o introducirse en un espectrómetro de masas y cuantificarse utilizando las alturas de los picos. Luego, las cantidades se pueden introducir en el modelo y el algoritmo descrito en el presente documento puede escanear combinaciones de atenuación, sobreexpresión y/o cambios en la alimentación de medios. Luego, la máquina puede implementarlos (por ejemplo, con un ajuste de medios en línea o un recipiente que agregaría herramientas de ingeniería genética prediseñadas, tales como los ARN guía de CRISPR, ARNhc u otras herramientas). El usuario puede clasificar las células con modificaciones genéticas en línea o fuera de línea mediante la clasificación de células asistida por fluorescencia, dispositivos de microfluidos u otras herramientas. Luego se implementan las células editadas o los medios optimizados. Las células se pueden cultivar y, en última instancia, el perfil de glucosilación se puede medir en línea nuevamente, y los datos se pueden retroalimentar al modelo para identificar una segunda ronda de ediciones para que coincida con el cambio deseado. Esto se puede repetir hasta que se obtenga el perfil de glucosilación deseado. El software incluiría la red genérica y los algoritmos.
El alcance de la presente invención no debe estar limitado por las realizaciones específicas descritas en el presente documento. De hecho, diversas modificaciones de la invención, además de las descritas en el presente documento, serán evidentes para los expertos en la materia a partir de la descripción anterior. Se pretende que tales modificaciones estén dentro del alcance de las reivindicaciones adjuntas.

Claims (14)

REIVINDICACIONES
1. Un método que comprende:
generar, mediante un dispositivo informático, usando una estructura inicial conocida y una pluralidad de enzimas y/o reacciones de glucosilación conocidas, una red de reacción de glucosilación genérica que comprende una pluralidad de glucanos;
recibir, en el dispositivo informático, información relacionada con un perfil de glucosilación medido de una proteína concreta, comprendiendo el perfil de glucosilación medido una pluralidad de glucanos del perfil de glucosilación, teniendo cada uno una frecuencia relativa asociada;
adaptar la red de reacción de glucosilación genérica al perfil de glucosilación medido para proporcionar una red adaptada, comprendiendo la red adaptada un conjunto reducido de la pluralidad de glucanos, incluyendo el conjunto reducido los glucanos del perfil de glucosilación, en donde la adaptación de la red de reacción de glucosilación genérica comprende identificar una pluralidad de reacciones que no se requieren para obtener la pluralidad de glucanos del perfil de glucosilación y comprende además usar la reducción del modelo a través del análisis convexo o de algoritmos de optimización;
transformar la red adaptada en una cadena de Markov, representando la cadena de Markov una red estocástica en donde cada glucano del perfil de glucosilación en el conjunto reducido se considera como un estado en la red estocástica que puede pasar a otro estado en la red estocástica con una probabilidad de transición concreta, en donde la transformación de la red adaptada en una cadena de Markov comprende:
evaluar la varianza en los flujos de reacción de la red adaptada mediante el muestreo de Monte Carlo, produciendo el muestreo de Monte Carlo una pluralidad de vectores de flujo que tienen una varianza asociada, en donde cada flujo de reacción representa una ruta a través de la red adaptada desde la estructura inicial conocida hasta el perfil de glucosilación medido; y
reformular cada uno de la pluralidad de vectores de flujo en una pluralidad de probabilidades de transición asociadas, y
comprende además determinar una combinación óptima de cambios para que coincida con un perfil de glucosilación deseado mediante:
proporcionar un algoritmo de optimización para implementar un proceso de optimización que simule posibles perturbaciones que conduzcan a un perfil de glucosilación deseado, minimizando el algoritmo de optimización una función objetivo que mide una distancia entre un perfil de glucosilación predicho y uno observado;
recibir una hipótesis inicial de perturbaciones y una condición de parada;
y determinar un punto final del proceso de optimización, en donde el punto final representa la combinación óptima de cambios y comprende un conjunto de perturbaciones que proporciona un perfil de glucosilación simulado dentro de un margen de error especificado del perfil de glucosilación deseado; en donde se cultivan posteriormente las células de mamífero en un medio de cultivo, en donde las células de mamífero y/o el medio de cultivo se modifican de acuerdo con dicho conjunto de perturbaciones.
2. El método de la reivindicación 1, en donde la pluralidad de glucanos puede sintetizarse (i) mediante la acción combinada de la pluralidad de enzimas conocidas o (ii) mediante cambios químicos en el medio de crecimiento.
3. El método de la reivindicación 1, en donde la estructura inicial conocida es MangGlcNAc2.
4. El método de la reivindicación 1, en donde la red de reacción de glucosilación genérica es una red de equilibrio de flujo; y las frecuencias relativas asociadas se obtienen experimentalmente y en donde las frecuencias relativas asociadas se obtienen experimentalmente a través de al menos uno de cromatografía líquida acoplada a espectrometría de masas (LC-MS), cromatografía líquida y matrices de lectina de cromatografía líquida.
5. El método de la reivindicación 1, en donde la red adaptada representa una topología de reacción que describe cómo el flujo de una estructura inicial conocida conduce a la generación del perfil de glucosilación medido, y en donde la red adaptada proporciona una red de reacción mínima para producir el perfil de glucosilación medido.
6. El método de la reivindicación 1, que comprende además:
simular una perturbación en la red adaptada modificando la cadena de Markov para determinar cómo afectará la perturbación al perfil de glucosilación medido.
7. El método de la reivindicación 6, en donde la perturbación es una disminución en la actividad de una enzima particular y la simulación de la disminución en la actividad de la enzima concreta comprende:
identificar un primer subconjunto de reacciones en la red adaptada que depende de la enzima concreta, y un segundo subconjunto de reacciones en la red adaptada que representa las reacciones restantes en la red adaptada que no dependen de la enzima concreta;
reducir, en un factor proporcionado por el usuario, el primer subconjunto de reacciones para proporcionar un conjunto de reacciones reducidas;
modificar, en función de las reacciones reducidas, las probabilidades de transición asociadas al segundo subconjunto de reacciones; y
generar una cadena de Markov actualizada que produce un perfil de glucosilación predicho obtenido a través de la disminución de la actividad de la enzima concreta.
8. El método de la reivindicación 6, en donde la perturbación es una regulación al alza de la actividad de una enzima concreta y la simulación de la regulación al alza de la actividad de la enzima concreta comprende:
identificar un primer subconjunto de reacciones en la red adaptada que depende de la enzima concreta, y un segundo subconjunto de reacciones en la red adaptada que representa las reacciones restantes en la red adaptada que no dependen de la enzima concreta;
escalar, en un factor proporcionado por el usuario, el primer subconjunto de reacciones para proporcionar un conjunto de reacciones escaladas;
modificar, en función de las reacciones escaladas, las probabilidades de transición asociadas al segundo subconjunto de reacciones; y
generar una cadena de Markov actualizada que produce un perfil de glucosilación predicho obtenido a través de la regulación al alza de la actividad de la enzima concreta.
9. El método de la reivindicación 1, en donde la cadena de Markov tiene una probabilidad de absorción, y la probabilidad de absorción proporciona la probabilidad de que la cadena de Markov alcance un estado de absorción a partir de la estructura inicial conocida.
10. El método de la reivindicación 9, en donde la probabilidad de absorción viene dada por:
Figure imgf000022_0001
11. El método de la reivindicación 1, en donde la red de reacción de glucosilación genérica describe al menos uno seleccionado del grupo que comprende la N-glucosilación, la O-glucosilación, la síntesis de oligosacáridos, la síntesis de glucosaminoglucanos, glucolípidos, proteoglucanos, glucoconjugados y peptidoglucanos.
12. El método de la reivindicación 1, en donde las posibles perturbaciones simuladas reducen la actividad enzimática o aumentan la actividad enzimática, cambian los sustratos enzimáticos o cambian las condiciones de los medios.
13. Un método para predecir cambios en la localización de enzimas de glucosilación, comprendiendo el método: a) adaptar la red de reacción de glucosilación genérica de la reivindicación 1 para una localización alternativa, en donde la localización de la enzima de glucosilación es subcelular; y
b) simular por separado perturbaciones de las redes alternativas y comparar los perfiles de glucosilación predichos resultantes con un perfil de glucosilación deseado para determinar qué perfil de glucosilación predicho es más coherente con el perfil de glucosilación deseado;
c) en donde la predicción se verifica posteriormente mediante el cultivo de células de mamíferos en un medio de cultivo, en donde las células de mamífero y/o el medio de cultivo se modifican de acuerdo con las perturbaciones que proporcionan el perfil de glucosilación predicho más coherente con el perfil de glucosilación deseado, y midiendo el perfil de glucosilación de las células de mamífero cultivadas.
14. El método de la reivindicación 13, en donde las predicciones se usan para cambiar la localización de las enzimas de glucosilación a través de medios genéticos o cambios químicos en el medio de crecimiento para cambiar el perfil de glucosilación.
ES16797239T 2015-05-18 2016-05-18 Sistemas y métodos para predecir la glucosilación de proteínas Active ES2949063T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562162901P 2015-05-18 2015-05-18
PCT/US2016/033136 WO2016187341A1 (en) 2015-05-18 2016-05-18 Systems and methods for predicting glycosylation on proteins

Publications (1)

Publication Number Publication Date
ES2949063T3 true ES2949063T3 (es) 2023-09-25

Family

ID=57320771

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16797239T Active ES2949063T3 (es) 2015-05-18 2016-05-18 Sistemas y métodos para predecir la glucosilación de proteínas

Country Status (4)

Country Link
US (1) US11670399B2 (es)
EP (1) EP3298135B1 (es)
ES (1) ES2949063T3 (es)
WO (1) WO2016187341A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3377981B1 (en) * 2015-11-18 2023-10-11 Thrive Bioscience, Inc. Cell culture incubator
EP3548652B1 (en) 2016-12-01 2024-04-03 Nautilus Subsidiary, Inc. Methods of assaying proteins
US11721412B2 (en) 2017-10-23 2023-08-08 Nautilus Subsidiary, Inc. Methods for identifying a protein in a sample of unknown proteins
BR112020013252A2 (pt) 2017-12-29 2020-12-01 Nautilus Biotechnology, Inc. abordagens de decodificação para a identificação de proteína
CA3156025A1 (en) * 2019-11-20 2021-05-27 The Regents Of The University Of California METHOD FOR DESIGNING CARBOHYDRATES
CN111640468B (zh) * 2020-05-18 2021-08-24 天士力国际基因网络药物创新中心有限公司 一种基于复杂网络筛选疾病相关蛋白的方法
CN114171130A (zh) * 2021-10-22 2022-03-11 西安电子科技大学 一种核心岩藻糖鉴定方法、系统、设备、介质及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016390A1 (en) 2002-03-06 2007-01-18 Bernardo Diego D Systems and methods for reverse engineering models of biological networks
WO2003081211A2 (en) * 2002-03-19 2003-10-02 Cengent Therapeutics, Inc. Discrete bayesian analysis of data
CA2500526A1 (en) * 2002-10-01 2004-04-15 Luke V. Schneider Artificial intelligence for analyzing hypothetical models
CN101675339B (zh) * 2007-04-16 2014-04-16 动量制药公司 涉及细胞表面糖基化作用的方法
WO2009027041A1 (en) * 2007-08-31 2009-03-05 F. Hoffmann-La Roche Ag Glycosylation profile analysis
US8311790B2 (en) * 2008-04-11 2012-11-13 University Of Delaware Reverse engineering genome-scale metabolic network reconstructions for organisms with incomplete genome annotation and developing constraints using proton flux states and numerically-determined sub-systems
US20160160270A1 (en) * 2013-07-19 2016-06-09 Markus J. Herrgard Methods for modeling chinese hamster ovary (cho) cell metabolism

Also Published As

Publication number Publication date
EP3298135B1 (en) 2023-06-07
EP3298135C0 (en) 2023-06-07
US20180101643A1 (en) 2018-04-12
EP3298135A1 (en) 2018-03-28
WO2016187341A1 (en) 2016-11-24
EP3298135A4 (en) 2019-06-05
US11670399B2 (en) 2023-06-06

Similar Documents

Publication Publication Date Title
ES2949063T3 (es) Sistemas y métodos para predecir la glucosilación de proteínas
Spahn et al. A Markov chain model for N-linked protein glycosylation–towards a low-parameter tool for model-driven glycoengineering
Suhail et al. Systems biology of cancer metastasis
Nilsson et al. Metabolic models of protein allocation call for the kinetome
Siolas et al. Patient-derived tumor xenografts: transforming clinical samples into mouse models
Saha et al. Recent advances in the reconstruction of metabolic models and integration of omics data
Chasman et al. Network-based approaches for analysis of complex biological systems
AU2012376214B2 (en) Interrogatory cell-based assays and uses thereof
Bennun et al. Systems glycobiology: integrating glycogenomics, glycoproteomics, glycomics, and other ‘omics data sets to characterize cellular glycosylation processes
Cheng et al. Understanding cancer mechanisms through network dynamics
Assmus et al. Dynamics of biological systems: role of systems biology in medical research
Papaleo et al. Gaining insights into cancer biology through exploration of the cancer secretome using proteomic and bioinformatic tools
Kunej Rise of systems glycobiology and personalized glycomedicine: why and how to integrate glycomics with multiomics science?
He et al. Oncoproteomics: Current status and future opportunities
Qin et al. Deciphering organoids: high-dimensional analysis of biomimetic cultures
Adams et al. Can computers conceive the complexity of cancer to cure it? Using artificial intelligence technology in cancer modelling and drug discovery
Nguyen et al. Functional genomics approaches to improve pre‐clinical drug screening and biomarker discovery
Elmes et al. Learning epistatic gene interactions from perturbation screens
Spahn et al. DTU DTU Library
Cardner et al. Inferring signalling dynamics by integrating interventional with observational data
Engineering Biology Research Consortium An Assessment of Short-Term Milestones in EBRC’s 2019 Roadmap, Engineering Biology
Flobak et al. Fine tuning a logical model of cancer cells to predict drug synergies: combining manual curation and automated parameterization
Dingerdissen Comprehensive Analysis of Glycosyltransferases in Cancer Identified from a Multifaceted Genomics Approach
Ochab et al. Piece-wise linear models of biological systems—Application, analysis, and comparison with nonlinear models using the example of the p53 regulatory module
Del Pino Herrera et al. A war on many fronts: cross disciplinary approaches for novel cancer treatment strategies