ES2848949T3 - Algoritmo y un método in vitro basado en la edición de ARN para seleccionar un efecto particular inducido porcompuestos activos - Google Patents

Algoritmo y un método in vitro basado en la edición de ARN para seleccionar un efecto particular inducido porcompuestos activos Download PDF

Info

Publication number
ES2848949T3
ES2848949T3 ES17724104T ES17724104T ES2848949T3 ES 2848949 T3 ES2848949 T3 ES 2848949T3 ES 17724104 T ES17724104 T ES 17724104T ES 17724104 T ES17724104 T ES 17724104T ES 2848949 T3 ES2848949 T3 ES 2848949T3
Authority
ES
Spain
Prior art keywords
editing
isoforms
algorithm
target
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17724104T
Other languages
English (en)
Inventor
Dinah Weissmann
Der Laan Siem Van
Nicolas Salvetat
Franck Molina
Jean-François Pujol
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Alcediag SAS
Original Assignee
Centre National de la Recherche Scientifique CNRS
Alcediag SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Alcediag SAS filed Critical Centre National de la Recherche Scientifique CNRS
Application granted granted Critical
Publication of ES2848949T3 publication Critical patent/ES2848949T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/142Toxicological screening, e.g. expression profiles which identify toxicity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

Un metodo implementado por ordenador para predecir la probabilidad o el riesgo de un farmaco, un compuesto o una molecula, de inducir efectos particulares en un paciente, preferentemente efectos secundarios, con mayor preferencia efectos secundarios adversos o deseados, dicho metodo usa como una diana que exhibe una edicion A a I de ARN, cuyo pre-ARNm es el sustrato de enzimas ADAR, la accion de dichas ADAR conduce a la produccion de diferentes isoformas o sitios, en donde dicho metodo comprende las etapas de: A) Analizar el perfil de edicion de ARN de la diana en una muestra que se ha tratado con dicho farmaco o compuesto o molecula, con el fin de obtener la proporcion de nivel de edicion de ARN de dicha diana para cada una de sus isoformas de edicion, y, en donde dicho perfil de edicion de ARN de la diana se obtiene segun se obtiene para una molecula de la coleccion de moleculas en el algoritmo obtenido para dichos efectos particulares, y en donde dicho algoritmo es un algoritmo para predecir in vitro la probabilidad de que un compuesto induzca un efecto particular en un paciente, en donde dicho algoritmo o modelo se obtiene por un metodo que comprende las etapas de: a) - seleccionar al menos una diana que exhibe una edicion A a I de ARN, cuyo pre-ARNm es el sustrato de las enzimas ADAR (adenosina desaminasas que actuan sobre el ARN), la accion de dichas ADAR en al menos un sitio de edicion conduce a la produccion de diferentes isoformas o sitios, - seleccionar al menos una linea celular que exprese endogenamente dicha al menos una diana y al menos las enzimas ADAR, - seleccionar un compuesto de control positivo que pueda alterar de manera dependiente de la dosis la proporcion relativa de dichas isoformas de la diana o sitios de edicion cuando las celulas de dicha linea celular se tratan con dicho control positivo, - seleccionar una coleccion de moleculas compuesta por una proporcion de compuestos anotados con una puntuacion de riesgo para inducir dichos efectos particulares, b) tratar las celulas de dicha linea celular con cada molecula individual de dicha coleccion de moleculas, junto con un control negativo y dicho control positivo, c) analizar dicho al menos un perfil de edicion de ARN de la diana en cada muestra que se ha tratado con una molecula de la coleccion, con el fin de obtener la proporcion del nivel de edicion de ARN de dicha diana para cada una de sus isoformas y/o sitios de edicion para cada una de las moleculas de dicha coleccion, d) -i) mediante un metodo estadistico de analisis univariado, evaluar para cada isoforma/o sitio de edicion su precision y su poder para discriminar el riesgo de que una molecula induzca dichos efectos particulares; y/o -ii) mediante un metodo estadistico de analisis multivariado, evaluar para cada combinacion de isoformas/o sitios de edicion, su precision y su poder para discriminar el riesgo de que una molecula induzca dichos efectos particulares, y -iii) seleccionar la combinacion que exhiba el mejor desempeno discriminativo, e) construir un algoritmo con el uso de dicha combinacion seleccionada de isoformas/o sitios de edicion, y usar dicho algoritmo asi obtenido para predecir la probabilidad de que dicho compuesto induzca dichos efectos particulares en un paciente, y: en donde la etapa d)-i) comprende una etapa de calcular para cada isoforma o una combinacion de estas: - el umbral optimo de sensibilidad (Se %) de al menos 60 y especificidad (Sp %) de al menos 60 % para dichos efectos particulares; - los valores predictivos positivos (PPV, %) y negativos (NPV, %) para evaluar la proporcion de verdadera presencia [verdadero positivo / (verdadero positivo+ falso positivo] y verdadera ausencia [verdadero negativo / (verdadero negativo+ falso negativo)]; y en donde en la etapa c), el perfil de edicion de ARN se lleva a cabo mediante un metodo que incluye: - metodo NGS (secuenciacion de proxima generacion) que comprende la preparacion de una genoteca de NGS; y - la secuenciacion de todas las genotecas de NGS obtenidas, para obtener el perfil de edicion de la diana; y en donde en la etapa d)-i) y d)-ii), dicho metodo estadistico que permite la obtencion de dicho algoritmo o modelo se lleva a cabo mediante un metodo que incluye un metodo o una combinacion de metodos seleccionados del grupo que consiste en: - programa mROC, en particular para identificar la combinacion lineal, que maximiza la ROC AUC (Area bajo la curva) y en donde se proporciona la ecuacion para la combinacion respectiva y se puede usar como un nuevo marcador virtual Z, de la siguiente manera: Z = a1. (Isoforma 1) + a2. (Isoforma 2) + ...ai. (Isoforma i) + ⋯an. (Isoforma n) donde a1 son los coeficientes calculados e (Isoforma i) es la proporcion relativa del nivel de edicion de ARN individual de la diana de la isoforma; y/o - un modelo de regresion logistica aplicado para analisis univariado y multivariado para estimar el riesgo relativo de moleculas a diferentes valores de las isoformas; y/o - un enfoque CART (arboles de clasificacion y regresion) aplicado para evaluar combinaciones de isoformas; y/o - un enfoque de bosque aleatorio (RF) aplicado para evaluar las combinaciones de isoformas, en particular para clasificar la importancia de la isoforma de edicion y combinar las mejores isoformas para clasificar el "riesgo relativo" de la molecula, y/o - un analisis multivariado aplicado para evaluar la combinacion de isoformas para el "riesgo relativo" de las moleculas, que se selecciona del grupo que consiste en como - enfoque de maquina de vectores de soporte (SVM); - enfoque de red neuronal artificial (ANN); - Enfoque de red bayesiana; - enfoque wKNN (k vecinos mas cercanos ponderados); - minimo cuadrado parcial - analisis discriminante (PLS-DA); - analisis discriminante lineal y cuadratico (LDA / QDA);

Description

DESCRIPCIÓN
Algoritmo y un método in vitro basado en la edición de ARN para seleccionar un efecto particular inducido por compuestos activos
La presente invención se basa en un algoritmo y método que utiliza el mismo algoritmo para predecir in vitro la probabilidad de que un fármaco o un compuesto induzca un efecto particular en un paciente, dicho método utiliza al menos una diana que exhibe una edición A a I de ARN. La presente invención se refiere, además, a kits para la implementación del método.
Los trastornos mentales tienen cada vez más peso en los sistemas de salud en todo el mundo (1). Son trastornos comunes en las sociedades occidentales y afectan a 1 de cada 5 personas al menos una vez en la vida. Los trastornos psiquiátricos son causados por vías moleculares perturbadas que afectan los circuitos cerebrales, la neurotransmisión y la plasticidad neuronal. Trabajos recientes muestran que las alteraciones de las modificaciones epigenéticas en el ADN y el ARN, como la metilación, acetilación y desaminación, se asocian, por ejemplo, con la depresión mayor, el trastorno bipolar y la esquizofrenia (2, 3). Estudios recientes también arrojan luz sobre la importancia de las enzimas de edición que catalizan la desaminación de adenosina en el ARN (edición A a I del ARN). Se ha demostrado que este mecanismo específico regula directamente la función de genes que codifican esencialmente para neurotransmisores altamente conservados y factores relacionados con la sinapsis (4-7). Es importante destacar que el papel en la salud y la enfermedad de esta maquinaria de edición de ARN y las enzimas ADAR afines (Adenosina Desaminasas que actúan sobre el ARN), recientemente ha ganado terreno más profundo por la evidencia acumulada de su desregulación en el cerebro de pacientes que padecen trastornos psiquiátricos (8, 9). Las ADAR actúan sobre bucles de tallo de pre-ARNm bicatenarios para desaminar específicamente los residuos preferenciales de adenosina. La desaminación de los residuos que residen en la secuencia codificante conducirá a sustituciones de aminoácidos que producen variantes de receptores con diferentes propiedades farmacológicas (por ejemplo, receptor de serotonina 2c, receptor de glutamato) (10).
Se ha propuesto que las anomalías de la biología de la serotonina en el cerebro son un rasgo característico que subyace a la depresión y/o al comportamiento suicida (11-13). Al analizar el tejido cerebral post mortem de víctimas de suicidio, nosotros y otros hemos observado distintas alteraciones de la actividad de edición del ARN en el pre-ARNm del receptor de serotonina 2C (5HT2cR), conocido por alterar en gran medida las propiedades farmacológicas de 5-HT2CR (10, 14). Curiosamente, estas alteraciones en el perfil de edición del ARNm de 5-HT2cR en la corteza humana de víctimas de suicidio se superponen parcialmente con los cambios inducidos por interferón observados en las células SH-SY5Y. Identificamos biomarcadores específicos para caracterizar una “firma de edición de ARN” de 5-HT2cR vinculada a pacientes deprimidos/suicidas.
Por ejemplo, se puede citar el documento de solicitud de patente PCT publicado con el número WO2010/070074 (Dinah Weissmann y otros) que describe métodos in vitro para la determinación de la posible toxicidad de compuestos de prueba y para la selección de compuestos terapéuticos útiles para el tratamiento de una patología relacionada con una alteración del mecanismo de edición de ARNm de ADAR dependiente de la edición de ARNm de A a I del 5-HTR2cR.
También se puede citar el documento de solicitud de patente PCT publicado con el número WO2011/161253 (Dinah Weissmann y otros) que describe el uso del perfil de edición de pre-ARNm de PDE8A como un biomarcador específico de las actividades de ADAR en tejidos humanos y un método in vitro para predecir la alteración del mecanismo de la edición de pre-ARNm catalizada por ADAR de genes diana, mediante el análisis del perfil de edición de pre-ARNm de PDE8A en una muestra de sangre.
Se ha informado que varios fármacos pertenecientes a diferentes clases terapéuticas pueden inducir efectos adversos psiquiátricos graves, en particular depresión y tendencias suicidas (15-18). Hoy en día, no existe una prueba aprobada para identificar tales moléculas y la Administración de Alimentos y Medicamentos (FDA) solo puede emitir alertas generales sobre clases terapéuticas completas.
Por lo tanto, existe la necesidad de proporcionar una prueba in vitro que pueda determinar con alta precisión y con un alto poder de discriminación el riesgo de que un fármaco o un fármaco candidato induzca efectos secundarios adversos.
Validamos un ensayo in vitro innovador diseñado previamente que predice los efectos secundarios psiquiátricos inducidos por fármacos con el uso de una línea celular cuidadosamente seleccionada (SH-SY5Y). Seleccionamos más de 260 compuestos aprobados para su comercialización para examinar las alteraciones de la edición de 5-HT2cR inducidas por fármacos. Los compuestos se seleccionaron de una amplia gama de clases terapéuticas (antidepresivos, antipsicóticos, antiobesidad, antivirales, antiinflamatorios, antifúngicos, antiepilépticos, agentes estabilizadores del estado de ánimo y otros), conocidos porque pueden inducir suicidio (que tienen una etiqueta de advertencia de la FDA y/o numerosos informes de casos) o no (sin informes de efectos secundarios psiquiátricos). Los datos se utilizaron para identificar compuestos "en riesgo" con alta especificidad y sensibilidad.
En un primer aspecto, la presente invención se dirige a un algoritmo para predecir in vitro la probabilidad de que un compuesto, particularmente un fármaco induzca un efecto o efectos particulares en un paciente, en donde dicho algoritmo se obtiene mediante un método que comprende las etapas de:
a)
- seleccionar al menos una diana que exhiba una edición A a I de ARN, cuyo pre-ARNm es el sustrato de enzimas ADAR (adenosina desaminasas que actúan sobre el ARN), la acción de dichas ADAR conduce a la producción de diferentes isoformas/o sitios,
- seleccionar al menos una línea celular que exprese endógenamente dicha al menos una diana y al menos las enzimas ADAR,
- seleccionar un compuesto de control positivo capaz de alterar, de manera dependiente de la dosis, la proporción relativa de dicha(s) isoforma(s) diana/o sitio(s) de edición cuando las células de dicha línea celular se tratan con dicho control positivo,
- seleccionar una colección de moléculas compuestas por una proporción de fármacos o compuestos anotados con una puntuación de riesgo para inducir dichos efectos particulares,
b) tratar las células de dicha línea celular con cada molécula individual de dicha colección de moléculas, junto con un control negativo y dicho control positivo,
c) analizar dicho al menos un perfil de edición de ARN de la diana en cada muestra que haya sido tratada con una molécula de la colección, con el fin de obtener la proporción de nivel de edición de ARN de dicha diana para cada una de sus isoformas/o sitios de edición y para cada una de las moléculas de dicha colección, d)
-i) mediante un método estadístico de análisis univariado, evaluar para cada isoforma/o sitio de edición su precisión y su poder para discriminar el riesgo de que una molécula induzca dichos efectos particulares; y/o -ii) mediante un método estadístico de análisis multivariado, evaluar para cada combinación de isoformas/o sitios de edición, su precisión y su poder para discriminar el riesgo de que una molécula induzca dichos efectos particulares, y
-iii) seleccionar la combinación que exhiba el mejor desempeño discriminativo,
e) construir un algoritmo con el uso de dicha combinación seleccionada de isoformas/o sitios de edición, y usar dicho algoritmo así obtenido para predecir la probabilidad de que un fármaco, compuesto o molécula induzca dichos efectos particulares en un paciente.
Por compuestos, en la presente descripción, se entiende un compuesto mineral, químico o biológico, particularmente que puede ser activo en un ser humano, un paciente animal o en una planta.
En la presente descripción, el término "paciente" también incluye plantas
El término "algoritmo" incluye además un modelo estadístico (como el modelo Cart).
En una modalidad preferida, en dicho algoritmo de acuerdo con la presente invención dichos efectos particulares, o efecto, son efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos.
En una modalidad preferida, dicha diana que exhibe una edición A a I de ARN se selecciona del grupo que consiste en 5-HT2cR, PDE8A (fosfodiesterasa 8A), GRIA2 (receptor de glutamato 2), GRIA3, GRIA4, GRIK1, GRIK2, GRIN2C, GRM4, GRM6, FLNB (Filamina B), 5-HT2A, GABRA3 (GABAa3), FLNA, CYFIP2.
En una modalidad preferida, dichos efectos particulares, preferentemente efectos secundarios, con mayor preferencia efectos secundarios deseados o adversos, se seleccionan del grupo que comprende efectos secundarios adversos cardiovasculares, de alergología, del SNC, particularmente psiquiátricos, dermatológicos, endocrinológicos, gastroenterológicos, hematológicos, de infectología, del metabolismo, neuromusculares, oncológicos, inflamatorios y de obesidad.
Los efectos secundarios adversos psiquiátricos tienen mayor preferencia.
En una modalidad preferida, la célula de dicha línea celular de acuerdo con el algoritmo de la invención es de una línea celular que expresa endógenamente dicha diana y ADAR(s).
Con mayor preferencia, dicha línea celular se selecciona del grupo que consiste en:
- línea celular humana o animal que puede expresar endógenamente dicha diana y mostrar la expresión de enzimas ADAR en un estado de equilibrio similar al observado en la corteza humana,
- líneas celulares de neuroblastoma, preferentemente líneas celulares humanas,
- líneas celulares de neuroblastoma para las cuales el control positivo indujo la expresión de ADARIa con una inducción de al menos 4, preferentemente al menos 5 o 6 veces cuando se normalizó con relación a los controles negativos o de vehículo, y
- la línea celular humana SH-SY5Y.
En una modalidad preferida, en la etapa b) del algoritmo de acuerdo con la presente invención, las células de dicha línea celular se tratan durante un período de tiempo comprendido entre 12 h y 72 h, con mayor preferencia durante 48 h /- 4 h con la molécula o control a ensayar, con máxima preferencia 48 h.
En una modalidad preferida, en el algoritmo de acuerdo con la invención, dicho control positivo es el interferón alfa, o un compuesto que puede reproducir la curva del perfil de edición de ARN de interferón a 100 UI/ml (como se muestra por ejemplo en la figura 6). Se utilizó la línea celular de neuroblastoma humano SH-SY5Y porque expresa de forma endógena el ARNm de 5-HT2cR y muestra un estado de equilibrio en la expresión de enzimas ADAR similar al observado en el interferón alfa de la corteza humana.
En una modalidad preferida, en el algoritmo o modelo de acuerdo con la invención, la etapa c) comprende una etapa de determinar el nivel basal de la edición de ARN para cada isoforma o sitio en dicha línea celular en comparación con las células de control tratadas con vehículo, con el fin de obtener para cada molécula y cada isoforma de edición o sitio de edición la proporción relativa media/mediana del nivel de edición de ARN de dicha diana.
Preferentemente, dichas células de control tratadas con vehículo son células de control tratadas con DMSO.
En una modalidad preferida, en el algoritmo o modelo de acuerdo con la invención, dicho método es un método para predecir in vitro la probabilidad de que un compuesto, particularmente un fármaco induzca dichos efectos particulares, o efecto, preferentemente efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos, sin riesgo o con bajo riesgo o con alto riesgo, preferentemente sin riesgo o con alto riesgo.
En una modalidad particular preferida, en el algoritmo o modelo de acuerdo con la invención, dicha colección de moléculas está compuesta por una proporción equilibrada de moléculas anotadas con una puntuación de alto riesgo y muy bajo riesgo, preferentemente sin riesgo, para inducir dichos efectos particulares, o efecto, son efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos.
Por una "proporción equilibrada de moléculas" se debe entender una colección de moléculas bien anotadas para dichos efectos secundarios adversos deseados, que se sabe que tienen un riesgo nulo o bajo o alto para inducir dichos efectos secundarios adversos, y que presentan al menos 3, preferentemente al menos 4 o 5, clases terapéuticas diferentes, particularmente seleccionadas del grupo de clases terapéuticas cardiovascular, alergología, SNC, particularmente psiquiátrica, dermatología, endocrinología, gastroenterología, hematología, infectología, metabolismo, neuromuscular, oncología, inflamatoria y obesidad.
Preferentemente, la cantidad de moléculas incluidas en cada una de dichas al menos 3, 4, 5, 6, 7 u 8 clases terapéuticas diferentes, representa al menos el 10 % del total de las moléculas de la colección.
En una modalidad de mayor preferencia, la clase terapéutica que representa la clase del efecto, o efectos particulares deseados, preferentemente efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos incluyen más del 20 %, preferentemente, 25 %, 30 % o 35 % del total de las moléculas de la colección.
En una modalidad preferida, en el algoritmo de acuerdo con la invención, en la etapa c) dicha colección de moléculas se analiza simultáneamente, preferentemente a diferentes concentraciones para cada molécula de la colección.
En una modalidad preferida, en el algoritmo de acuerdo con la invención, la etapa 1) d) i) comprende una etapa de calcular, para cada isoforma o sitio, o una combinación de estos:
- el umbral óptimo de sensibilidad (Se %), de al menos 60 %, preferentemente 70 % y preferentemente superior al 80 % y la especificidad (Sp %) de al menos 60 %, preferentemente 70 % y preferentemente superior al 80 % para dicho efecto, o efectos particulares, preferentemente efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos o efecto secundario adverso;
- los valores predictivos positivo (PPV, %) y negativo (NPV, %) para evaluar la proporción de verdadera presencia [verdadero positivo/ (verdadero positivo falso positivo] y verdadera ausencia [verdadero negativo/ (verdadero negativo falso negativo)], dicho método permite la determinación del rendimiento global de la elección de dicha(s) isoforma(s)/o sitio(s) o la combinación de estos.
En una modalidad preferida, en el algoritmo o modelo de acuerdo con la invención, en la etapa c), el perfil de edición de ARN se lleva a cabo mediante un método que incluye:
- Método NGS (secuenciación de próxima generación) que comprende la preparación de la genoteca de NGS, preferentemente con el uso de un método de PCR de 2 pasos para secuenciar selectivamente el fragmento de secuencia de interés (que comprende el sitio o sitios de edición) de la(s) diana(s);
- la secuenciación de todas las genotecas de NGS obtenidas; y, opcionalmente
- el análisis bioinformático de dichos datos de secuenciación, dicho análisis bioinformático comprende preferentemente las etapas de:
- procesamiento de prealineación y control de calidad de las secuencias
- la alineación contra la secuencia de referencia; y
- el cálculo de los niveles de edición,
para obtener el perfil de edición de la diana.
En una modalidad preferida, en el algoritmo de acuerdo con la invención, en la etapa d) i) y d) ii), y en la etapa e), dicho método estadístico que permite la obtención de dicho algoritmo se realiza mediante un método que incluye: - programa mROC, en particular para identificar la combinación lineal, que maximiza la ROC AUC (Área bajo la curva) y en donde se proporciona la ecuación para la combinación respectiva y se puede utilizar como un nuevo marcador virtual Z, de la siguiente manera: Z = ai. (Isoforma 1) a2. (Isoforma 2) ...ai. (Isoforma i) ... an. (Isoforma n) donde ai son los coeficientes calculados e (Isoforma i) es la proporción relativa del nivel de edición de ARN individual de la diana de la isoforma; y/o
- un modelo de regresión logística aplicado para análisis univariado y multivariado para estimar el riesgo relativo de moléculas en diferentes valores de isoforma(s)/o sitio(s) de edición; y/o
- un enfoque CART (árboles de clasificación y regresión) aplicado para evaluar las combinaciones de isoforma(s) o sitio(s) de edición; y/o
- un enfoque de bosque aleatorio (RF) aplicado para evaluar las combinaciones de isoformas o sitios de edición, en particular para clasificar la importancia de la isoforma o el sitio de edición y combinar las mejores isoformas o sitios de edición para clasificar el "riesgo relativo" de la molécula, y/u opcionalmente
- un análisis multivariado aplicado para evaluar la combinación de isoformas/sitios de edición para el "riesgo relativo" de las moléculas que se seleccionan del grupo que consiste en como
- enfoque de máquina de vectores de soporte (SVM);
- enfoque de red neuronal artificial (ANN);
- Enfoque de red bayesiana;
- enfoque wKNN (k vecinos más cercanos ponderados);
- Mínimo cuadrado parcial: análisis discriminante (PLS-DA); y
- Análisis discriminante lineal y cuadrático (LDA/QDA).
En una modalidad preferida, en el algoritmo de acuerdo con la invención,
- dicha al menos una diana es 5-HT2cR, y
- dichos efectos secundarios adversos son efectos secundarios adversos psiquiátricos, y
- la línea celular es la línea celular de neuroblastoma humano SH-SY5Y, y
- el control positivo es el interferón alfa, y
y en donde:
- la combinación de sitios que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 2, 3, 4 o 5 de los sitios individuales seleccionados del grupo constituido por los siguientes sitios de 5-HT2cR:
A, B, C, D y E,
preferentemente una combinación de al menos 3, 4 o 5 de dichos sitios,
- o la combinación de isoformas que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o 13 de las isoformas individuales seleccionadas del grupo constituido por las siguientes isoformas de 5-HT2cR:
A, B, AB, ABC, AC, C, D, AD, AE, ACD, AEC, ABCD y NE,
preferentemente una combinación de al menos 5, 6 o 7 de dichas isoformas,
y, opcionalmente, en donde:
dicho método estadístico que permite la obtención de dicho algoritmo o modelo se lleva a cabo mediante un método que incluye:
- programa mROC, enfoque de bosque aleatorio y/o algoritmo Cart.
En un segundo aspecto, la presente invención se dirige a un método in vitro que predice la probabilidad o el riesgo de un fármaco, un compuesto o una molécula, de inducir efectos particulares en un paciente, preferentemente efectos secundarios, con mayor preferencia efectos secundarios adversos o deseados, dicho método utiliza como diana que exhibe una edición A a I de ARN, cuyo pre-ARNm es el sustrato de enzimas ADAR, la acción de dichas ADAR conduce a la producción de diferentes isoformas o sitios de edición, en donde dicho método comprende las etapas de:
A) Analizar el perfil de edición de ARN de la diana en una muestra que se ha tratado con dicho fármaco o compuesto o molécula, con el fin de obtener la proporción de nivel de edición de ARN de dicha diana para cada una de sus isoformas de edición, y, en donde se obtiene dicho perfil de edición de ARN de la diana según se obtiene para una molécula de la colección de moléculas en el algoritmo o el modelo de acuerdo con una de las reivindicaciones 1 a 15 obtenido para dichos efectos particulares;
B) calcular el valor final o aplicar el algoritmo o modelo obtenido para dicho fármaco o compuesto con el uso del algoritmo o modelo obtenido para dicha diana y dichos efectos particulares de acuerdo con una de las reivindicaciones 1 a 15; y
C) determinar si dicho fármaco o compuestos están en riesgo, particularmente con bajo riesgo frente a alto riesgo, de inducir dichos efectos particulares en un paciente a la vista de los resultados obtenidos en la etapa B). En otra modalidad, dicho método in vitro que predice la probabilidad o el riesgo de un fármaco, un compuesto o una molécula, de inducir efectos particulares en un paciente de acuerdo con la presente invención, utiliza una combinación de al menos 2, 3 o 4 dianas que exhiban una edición A a I de ARN, cuyo pre-ARNm es el sustrato de las enzimas ADAR, la acción de dichas ADAR conduce a la producción de diferentes isoformas o sitios, en donde dicho método comprende las etapas de:
A) Analizar cada uno de los perfiles de edición de ARN de las dianas de dicha combinación de dianas en una muestra que se ha tratado con dicho fármaco o compuesto o molécula, con el fin de obtener la proporción de nivel de edición de ARN para cada una de dichas dianas para cada una de sus isoformas o sitios de edición, y, en donde dicho perfil de edición de ARN de cada una de dichas dianas se obtiene según se obtiene para una molécula de la colección de moléculas en el algoritmo o el modelo de acuerdo con una de las reivindicaciones 1 a 15 obtenido para dichos efectos particulares;
B) calcular el valor final o aplicar el algoritmo o modelo obtenido para dicho fármaco o compuesto con el uso del algoritmo o modelo obtenido para tales de dichas dianas y dichos efectos particulares de acuerdo con una de las reivindicaciones 1 a 15; y
C) determinar si dicho fármaco o compuestos están en riesgo, particularmente sin riesgo o con bajo riesgo frente a alto riesgo, de inducir dichos efectos particulares en un paciente a la vista de los resultados obtenidos en la etapa B).
En otra modalidad preferida, dicha combinación de al menos 2, 3 o 4 dianas que exhiben una edición A a I de ARN, cuyo pre-ARNm es el sustrato de enzimas ADAR, la diana que exhibe una edición A a I de ARN se selecciona de una combinación de dianas seleccionadas del grupo que consiste en 5-HT2cR, PDE8A (fosfodiesterasa 8A), GRIA2 (receptor de glutamato 2), GRIA3, GRIA4, GRIK1, GRIK2, GRIN2C, GRM4, GRM6, FLNB (Filamina B), 5-HT2A, GABRA3 (GABAa3), FLNA, CYFIP2.
En un tercer aspecto, la presente solicitud está dirigida a un kit para determinar si un compuesto, preferentemente un fármaco, está en riesgo, particularmente en riesgo bajo versus riesgo alto, para inducir dichos efectos particulares, o efecto, preferentemente efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos en un paciente que comprende:
1) instrucciones para usar un algoritmo de acuerdo con la invención, o para aplicar el método para predecir la probabilidad o el riesgo de un compuesto o preferentemente un fármaco para inducir dichos efectos particulares, o efecto, preferentemente efectos secundarios, preferentemente seleccionados de efectos secundarios adversos o deseados, preferentemente efectos secundarios adversos en un paciente de acuerdo con la invención, con el fin de obtener el valor final cuyo análisis determina el riesgo de inducir dichos efectos secundarios adversos en un paciente para dicho fármaco de prueba, donde dichas instrucciones comprenden opcionalmente una curva ROC o un árbol de decisión Cart; y
2) reactivos para determinar el perfil de edición de ARN obtenido para dicho fármaco de prueba de acuerdo con los reactivos necesarios para obtener el perfil de edición de ARN para cada molécula de la colección de moléculas utilizadas para determinar dicho algoritmo o dicho modelo de dichas instrucciones de 1).
En una modalidad preferida, dichos reactivos incluyen el conjunto de cebadores necesarios para la PCR de 2 pasos para la preparación de genotecas de NGS cuando se usa este método en el algoritmo o modelo de la presente invención.
En una modalidad de mayor preferencia, dichos reactivos incluyen secuencias de oligonucleótidos utilizadas para obtener el perfil de edición de ARN de acuerdo con las reivindicaciones 1 a 17 para al menos una de dichas dianas o para una combinación de al menos 2, 3 o 4 dianas.
En una modalidad de mayor preferencia, dichos reactivos incluyen uno o una combinación de un conjunto de cebadores necesarios para la PCR de 2 pasos para la preparación de genotecas de NGS y en donde dicha al menos una diana o dicha combinación de dianas se selecciona de las dianas seleccionadas del grupo que consiste en 5-HT2cR, PDE8A (fosfodiesterasa 8A), GRIA2 (receptor de glutamato 2), GRIA3, GRIA4, GRIK1, GRIK2, GRIN2C, GRM4, GRM6, FLNB (Filamina B), 5-HT2A, GABRA3 (GABAa3), FLNA, CYFIP2.
En otra modalidad de mayor preferencia, dichos reactivos incluyen uno o una combinación de un conjunto de cebadores seleccionados del grupo que consiste en:
- para la diana PDE8A
PDE8A_izquierda: 5'-CAACCCACTTATTTCTGCCTAG-3' (SEQ ID NO. 1)
PDE8A_Derecha: 5'-TTCTGAAAACAATGGGCACC-3' (SEQ ID NO. 2);
- para la diana FNLB
FLNB_Izquierda: 5'-AAATGGGTCGTGCGGTGTAT-3' (SEQ ID NO. 3)
FLNB_Derecha: 5'-CCTGCTCGGGTGGTGTTAAT-3' (SEQ ID NO. 4);
- para la diana GRIA2
GRIA2_Izquierda: 5'-CTCTTTAGTGGAGCCAGAGTCT-3' (SEQ ID NO. 5)
GRIA2_Derecha: 5'-TCCTCAGCACTTTCGATGGG-3' (SEQ ID NO. 6);
- para la diana GRIK2
GRIK2_Izquierda: 5'-CCTGAATCCTCTCTCCCCTG-3' (SEQ ID NO. 7)
GRIK2_Derecha: 5'-CCAAATGCCTCCCACTATCC-3' (SEQ ID NO. 8); y
- para la diana GABRA3
GABRA3_Izquierda: 5'-ccaccttgagtatcagtgcc-3' (SEQ ID NO. 9)
GABRA3_Derecha: 5'-cgatgttgaaggtagtgctgg-3' (SEQ ID NO. 10).
Los siguientes ejemplos y las figuras y leyendas de aquí en adelante se eligieron para proporcionar a los expertos en la técnica una descripción completa con el fin de poder implementar y utilizar la presente invención.
Otras características y ventajas de la invención surgirán en el resto de la descripción con los Ejemplos y Figuras, cuyas leyendas se proporcionan a continuación.
Leyendas de las figuras:
Figura 1: Edición de ARN inducida por interferón alfa (respuesta a la dosis) (IFNa) “perfil” de edición del ARNm de 5-HT2cR en la línea celular de neuroblastoma humano SH-SY5Y.
Análisis de dosis-respuesta del efecto del interferón alfa (IFNa) después de 48 horas de tratamiento con FNa. La proporción relativa de ARNm de 5-HT2cR se analizó mediante secuenciación basada en NGS. El perfil se obtuvo por sustracción de la proporción relativa de edición de ARNm de 5-HT2cR en células de control tratadas con vehículo a la proporción relativa de edición de ARNm de 5-HT2cR medida en células tratadas con IFNa.
Figuras 2A-2B: Gráfico circular de la clasificación terapéutica de los 260 compuestos analizados en el ensayo in vitro. En la parte B de la figura se muestra una subclasificación adicional de los compuestos que actúan sobre el sistema nervioso central (SNC).
Figura 3: Representación esquemática de la configuración experimental y el enfoque aplicado durante la prueba de las moléculas seleccionadas. Los 260 compuestos se analizaron en cinco réplicas biológicas independientes. Cada placa de cultivo celular individual se trató con 10 moléculas, un control de vehículo (DMSO) así como con interferón alfa 100 UI/ml. Se probaron cinco réplicas biológicas independientes generando exactamente 1620 muestras que se procesaron de manera idéntica mediante el método de cuantificación de edición de ARN basado en NGS.
Figuras 4A-4I: expresión de ARNm de ADAR1a en cada pocillo individual
Análisis de PCR cuantitativa (qPCR) de la expresión de ADAR1a en células SH-SY5Y tratadas con las moléculas durante 48 horas. Los niveles de expresión de ARNm de ADAR1a se han cuantificado en cada muestra después de 48 horas de tratamiento con la molécula, vehículo (DMSO) o IFNa. Se muestra una única réplica biológica (n = 1). Como se esperaba, cada pocillo tratado con IFNa mostró una expresión aumentada de ADAR1a (A a J). Es de destacar que la molécula 165 también mostró un fuerte aumento de los niveles de expresión de ARNm de ADAR1a tras la exposición a la molécula.
Figuras 5A-5B:
Datos sin procesar de todos los controles de vehículo y células SH-SY5Y tratadas con IFNa (100 Ul/ml) (A) Análisis global de los 150 controles de vehículo (DMSO) y pocillos tratados con IFN. (A) Las tablas muestran todas las características estadísticas básicas de todas las isoformas de edición de ARNm de 5-HT2cR. Las condiciones tratadas con vehículo y con IFNa obtenidas durante todo el experimento (n = 150) se combinaron en el análisis para generar la medición estándar de los cambios de edición de ARN inducidos por IFN en 5-HT2cR. (B) Histogramas que muestran las isoformas de edición de 5HT2cR más afectadas significativamente por el tratamiento con IFN. La media, la mediana, la desviación estándar y el coeficiente de variación (CV expresado como porcentaje) se proporcionan para los pocillos tratados con vehículo (DMSO) y tratados con IFNa para todas las isoformas de edición de ARNm de 5-HT2cR.
Figura 6: Curva de perfil - Curva de edición de ARN IFN100
Perfil de edición de ARNm de 5HT2cR obtenido por sustracción de la proporción relativa de edición de ARNm de 5-HT2cR en células de control tratadas con vehículo a la proporción relativa de edición de ARNm de 5-HT2cR medida en células tratadas con IFNa. Se proporcionan los valores de la media y la mediana, las barras de error representan el error estándar de la media (sem, n = 150).
Figuras 7A-7B: ejemplos ilustrativos del perfil de edición de ARNm de 5HT2cR obtenido después de 48 horas de tratamiento con las moléculas respectivas. Se da un ejemplo para un conjunto de 4 compuestos “con riesgo” (aririprazol, sertralina, isotretinoína y taranabant) (A) y 4 moléculas de “bajo riesgo” (litio, ketamina, ondansetrón y ribavirina) (B). En cada gráfico se da la referencia de IFN (en negro). Se proporcionan los valores medios, las barras de error representan el error estándar de la media (sem, n = 5).
Figura 8: Ejemplos ilustrativos del potencial de diagnóstico de las isoformas de edición de ARNm de 5HT2cR más representativas para discriminar moléculas de bajo riesgo de las moléculas de alto riesgo. La representación de diagrama de caja es una forma conveniente de representar gráficamente grupos de datos numéricos a través de sus resúmenes de cinco números (la observación más pequeña, el cuartil inferior (Q1), la mediana (Q2), el cuartil superior (Q3) y la observación más grande). Los diagramas de caja pueden ser útiles para mostrar diferencias entre poblaciones sin hacer suposiciones sobre la distribución estadística subyacente. Se utilizó la prueba de rango de la suma de Wilcoxon para los valores de p. El símbolo * indica un valor de p < 0,05, ** indica un valor de p < 0,01 y *** indica un valor de p < 0,001.
Figura 9: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 2 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = 0,121xACD - 0,142xNE.
Figura 10: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 3 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = -0,1449xC 0,569xAE - 0,1548xNE.
Figura 11: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 4 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = 0,0235xAB 0,1567xACD 0,3880xAEC - 0,1355xNE.
Figura 12: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 5 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = 0,016xAB - 0,0563xABC 0,183xACD 0,386xAEC - 0,1428xNE.
Figura 13: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 6 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = 0,0157xAB - 0,0557xABC 0,0187xD 0,1817xACD 0,3883xAEC - 0,1426xNE.
Figura 14: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 7 isoformas seleccionadas del grupo de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = -0,0505xB 0,0224xAB 0,001xD 0,163xACD 0,389xAEC - 0,1402xABCD - 0,1385xNE. Figura 15: Ejemplo ilustrativo de curvas de características operativas del receptor (ROC) con el uso de una combinación de 13 isoformas en un conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Regla de decisión: Z = 0,2035xA 0,1283xB 0,1979xAB 0,1147xABC 0,1860xAC 0,04331xC 0,1884xD 0,1259xAD 0,7739xAE 0,4295xACD 0,4775xAEC - 0, 0415xABCD 0,0245xNE.
Figuras 16A-16C: ejemplos ilustrativos de curvas de características operativas del receptor (ROC) del algoritmo de bosque aleatorio (Rf ) con el uso de la combinación de 7 isoformas de la figura 14 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo). La curva ROC de todo el conjunto de datos se representa con una línea negra y la curva ROC del conjunto de datos de prueba se representa con líneas discontinuas (A). Importancia (peso) de las isoformas en el modelo de RF (B) (C).
Figuras 17A-17C: Ejemplo del rendimiento de diagnóstico con un enfoque de RF, ejemplos ilustrativos de curvas de características operativas del receptor (ROC) del algoritmo de bosque aleatorio (RF) con el uso de la combinación de las 13 isoformas de la figura 15 en el conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo versus alto riesgo). La curva ROC de todo el conjunto de datos se representa con una línea negra y la curva ROC del conjunto de datos de prueba se representa con líneas discontinuas (A). Importancia (peso) de las isoformas en el modelo de RF (B) (C).
Figuras 18A-18C: Cuantificación de la actividad de edición de ARN medida por otras dianas: GRIA2 (A), FLNB (B) y PDE8A (C). En todos los casos, el tratamiento con IFN indujo un aumento en la proporción relativa de las isoformas editadas como se ilustra por la disminución en el ARNm no editado (NE).
Figuras 19A-19B: Perfil de edición de ARNm de 5HT2cR en líneas celulares de neuroblastoma (HTR2C) LN18 (A) y LN229 (B) obtenido por sustracción de la proporción relativa de edición de ARNm de 5-HT2cR en células de control tratadas con vehículo a la proporción relativa de edición de ARNm de 5-HT2cR medida en células tratadas con IFNa en células LN18 (A) y células LN229 (B). Se proporcionan los perfiles de edición de ARNm medios del ARNm de 5HT2cR.
Figura 20: Predicción y algoritmo CART
Ejemplo ilustrativo de un árbol de decisión representativo y del rendimiento diagnóstico del algoritmo CART con el uso de 6 isoformas en un conjunto de datos de moléculas (n = 143, moléculas de bajo riesgo frente a moléculas de alto riesgo).
Figuras 21A-21D: Los perfiles de edición de ARN obtenidos para dos compuestos con riesgo bajo o nulo de inducir un efecto particular en un paciente. Como ejemplo se proporciona el perfil de edición de ARN obtenido con lidocaína (A) y ondansetrón (B) en comparación con las células de control tratadas con vehículo. Los perfiles de edición de ARN obtenidos para dos compuestos con alto riesgo de inducir un efecto particular en un paciente, como reserpina (C) y fluoxetina (D).
Figuras 22A-22C: Análisis del curso temporal de los cambios de edición de ARN observados con Aripiprazol (A), Interferón (IFN) (B) y Reserpina (C) en HTR2C.
Figuras 23A-23C: Alteraciones dependientes de la dosis de los perfiles de edición de ARN después del tratamiento de células SH-SY5Y con tres compuestos diferentes: clozapina (A), sertralina (B) y ketamina (C).
Ejemplo 1: Material y métodos
Creación de una base de datos de efectos secundarios adversos psiquiátricos inducidos por fármacos
Se adquirió de Prestwick Chemicals una biblioteca química que contenía una colección de 1280 moléculas pequeñas disueltas en DMSO a exactamente 10 mM. Todas las moléculas pequeñas contenidas en la biblioteca son medicamentos 100 % aprobados (FDA, EMA y otras agencias), presentan el mayor grado posible de similitud con los medicamentos y han sido seleccionadas por su alta diversidad química y farmacológica, así como por su conocida biodisponibilidad en seres humanos. En la compra de la biblioteca química (Prestwick Chemicals), se proporcionó una base de datos con muchas anotaciones que contiene información detallada sobre la diana, la clase/efecto terapéutico, la patente y ADMET de cada molécula. Buscamos los informes emitidos sobre los efectos secundarios adversos de los medicamentos relacionados con el suicidio y la depresión cuando se prescriben a seres humanos, mediante la consulta de bases de datos que actualizan periódicamente la información de seguridad y los informes de casos (como FDA Medwatch, EMEA,...). A continuación, compilamos los resultados de las consultas y atribuimos una puntuación de riesgo a cada fármaco contenido en la biblioteca química. El sistema de puntuación se estableció para cuantificar el riesgo de los fármacos de inducir potencialmente efectos secundarios psiquiátricos adversos (efectos secundarios adversos de depresión y/o relacionados con el suicidio) teniendo en cuenta una variedad de parámetros, como el número de casos que informan efectos secundarios adversos relacionados con el suicidio y/o la depresión, el grado de prescripción del medicamento, estar en la lista de medicamentos esenciales de acuerdo con la OMS y muchos más. Obtuvimos una base de datos amplia con información específica sobre el riesgo de inducir efectos secundarios psiquiátricos adversos.
Cultivo de células
Se utilizó la línea celular de neuroblastoma humano SH-SY5Y porque expresa de forma endógena el ARNm de 5-HT2cR y muestra un estado de equilibrio de expresión de las enzimas ADAR1 similar al observado en la corteza humana (Cavarec y otros 2013, Weissmann y otros 2016, Translational Psychiatry, Patente TOXADAR). La línea celular de neuroblastoma humano SH-SY5Y se adquirió de Sigma Aldrich. Las células se cultivaron de forma rutinaria en condiciones estándar a 37 °C en una atmósfera humidificada de CO2 al 5 %. Se prefirió el suero bovino fetal dializado (FBS Science Tech número de referencia FB-1280D/500) al no dializado debido a la desensibilización y la regulación negativa de la expresión del ARNm de 5-HT2cR por la serotonina presente a menudo en el suero (Saucier y otros 1998). Durante el transcurso de los experimentos, las células se cultivaron entre el número de pases P8 y P22. Antes de la siembra de las células en la placa de cultivo celular de 12 pocillos, la estimación del número de células se realizó mediante dos cargas independientes de la suspensión de células tripsinizadas en la cámara Kovaslide (Kova International), un portaobjetos de microscopio, desechable, fabricado de plástico ópticamente transparente con una rejilla de recuento de hemocitómetro. Ambas cámaras fueron contadas por dos técnicos de laboratorio y el promedio de los cuatro resultados de los recuentos independientes se utilizó además para calcular el número de células y sembrar en placas de cultivo celular de 12 pocillos.
Tratamiento farmacológico y lisis celular
Una vez recibida, la biblioteca química de Prestwick completa se transfirió a tubos individuales, se codificó, se dividió en alícuotas y se almacenó a -80 °C hasta su uso posterior. De nuestra base de datos de efectos secundarios adversos psiquiátricos inducidos por fármacos, generada internamente, seleccionamos 260 moléculas compuestas por una proporción equilibrada de fármacos anotados con una puntuación de riesgo alto y muy bajo. Los fármacos se codificaron y se tuvo cuidado de procesar aleatoriamente las moléculas a lo largo del diseño experimental. Las 260 moléculas se analizaron simultáneamente en cada experimento junto con un control negativo (el vehículo DMSO) y un control positivo (interferón alfa). En cada placa de cultivo celular de 12 pocillos se añadió un control negativo y un control positivo dejando 10 posiciones vacantes para analizar las moléculas. A su vez, cada réplica individual consistió en 27 placas de cultivo de 12 pocillos (ref). El experimento se repitió cinco veces de una manera exactamente similar, lo que generó cinco réplicas biológicas independientes (n = 5) para cada molécula analizada. Durante el transcurso del experimento, se generaron un total de 1620 muestras, es decir, 27 (número de placas de pocillos) x12 (número de pocillos por placa) x5 (número de réplicas). Un experimento preliminar permitió identificar 7 moléculas letales para las células SH-SY5Y a 10 pM. Para estas moléculas, la concentración se adaptó y se redujo hasta que se pudo detectar una toxicidad reducida. Antes de la experimentación, todas las diluciones de moléculas y controles se prepararon y colocaron en gradillas. La densidad celular, la morfología, la viabilidad y la contaminación de los 324 pocillos (27x12 pocillos) se controlaron mediante el microscopio previo al tratamiento. Además, se tomó una fotografía de cada pocillo con una cámara digital Canon EOS700. Exactamente 48 horas después del tratamiento de las células con las moléculas, se tomó una fotografía de cada pocillo con el uso de los parámetros definidos con la cámara digital. Después de retirar cuidadosamente el medio de cultivo, se añadieron 350 pl de tampón de lisis RLT (Qiagen) que contenía beta-mercaptoetanol al 1 % para la lisis química completa de las células. Las placas de 12 pocillos se apilaron y almacenaron en el congelador hasta la extracción del ARN.
Extracción de ARN total, control de calidad y transcripción inversa
La extracción de ARN total se llevó a cabo siguiendo las pautas del fabricante (Qiagen). El mini kit RNeasy proporciona una rápida purificación de ARN de alta calidad a partir de células con el uso de columnas de centrifugación RNeasy de membrana de sílice. Todos los lisados celulares se extrajeron con el uso de la preparación de muestras totalmente automatizada QIAcube. Las extracciones se procesaron con el uso de un procedimiento estándar en lotes de 12 muestras (una placa completa de 12 pocillos) por ejecución, con el protocolo apropiado. Durante la preparación de la muestra y la extracción de ARN, se tomaron precauciones estándar para evitar la degradación del ARN por las ARNasas. Todas las muestras de ARN extraídas fueron analizadas por labChipGx (Perkin Elmer) para cuantificar y calificar el ARN total. También se realizó una cuantificación basada en fluorescencia por Qubit para validar los datos de LabChipGx. Se determinó la puntuación de calidad del ARN (puntuación RQS) para cada muestra individual (puntuación RQS media de las 1620 muestras = 9,6/10). A continuación, las muestras se normalizaron y se realizó la transcripción inversa del ARN purificado con el uso del kit Takara (PrimeScript RT Takara ref # RR037A) a partir de 1 pg de material de ARN en un volumen de reacción final de 20 pl. La síntesis de cDNA se realizó a 42 °C en un termociclador Peqstar 96x durante 15 minutos y las mezclas de reacción se mantuvieron a 4 °C hasta su uso posterior.
Expresión relativa de ARNm por PCR cuantitativa (qPCR)
Después de la síntesis de cDNA, las muestras se almacenaron a 4 °C antes del análisis de la expresión de ARNm de ADAR1a mediante qPCR en un sistema LC480 (Roche). Los datos de qPCR se cuantificaron con el uso del método de curva patrón. Se sabe que la expresión de ARNm de ADAR1a es inducida por el tratamiento con interferón alfa (IFNa). Como era de esperar, todas las muestras que se trataron con FNa durante 48 horas mostraron un aumento de la expresión de ADAR1a con una inducción de la expresión génica de entre 6 y 7 veces. Además, el tratamiento con reserpina también aumentó constantemente los niveles de ARNm de ADAR1a.
Preparación de la genoteca NGS
Para la preparación de la genoteca de NGS, se empleó un método de PCR de 2 pasos para secuenciar selectivamente el exón V del 5-HT2cR previamente descrito y confirmado por nosotros y otros para ser sometido a edición de ARN. Se utilizaron cebadores de PCR validados para amplificar la región de interés mediante PCR. Para la amplificación por PCR, se utilizó la enzima Q5 Hot Start de alta fidelidad (New England Biolabs) de acuerdo con las indicaciones del fabricante (ref. # M0494S). La reacción de PCR se realizó en un termociclador Peqstar 96x con el uso de un protocolo de PCR optimizado. Después de la PCR, todas las muestras fueron analizadas por LabChipGx (Perkin Elmer) y se evaluó tanto la cantidad como la calidad del producto de PCR. Se determinó la pureza del amplicón y se realizó la cuantificación con el uso del método Qubit basado en fluorescencia. Después del control de calidad, las 96 reacciones de PCR (microplaca) se purificaron con el uso de perlas magnéticas (sistema High Prep PCR MAGbio de Mokascience). El ADN posterior a la purificación se cuantificó con el uso del sistema Qubit y se calculó el rendimiento de la purificación. A continuación, las muestras se indexaron individualmente mediante amplificación por PCR con el uso de la enzima de PCR de alta fidelidad Q5 Hot start (New England Biolabs) y el kit Illumina 96 Indexes (kit de índice Nextera XT; Illumina). Después de la PCR, las muestras se combinaron en una genoteca y se purificaron con el uso del sistema de limpieza Magbio PCR. La genoteca se desnaturalizó y se cargó en un cartucho de secuenciación de acuerdo con las indicaciones de Illumina para secuenciar FASTQ solo en una plataforma MiSeq. Se incluyó un conjunto de plásmido que contenía cantidades determinadas de isoformas 5HT2cR en cada genoteca para controlar la calidad de la secuenciación y el error en cada ejecución de secuenciación. Además, se incorporó un conjunto de ARN estándar en las genotecas para determinar la variabilidad entre diferentes celdas de flujo de secuenciación durante el curso del experimento. Para secuenciar las 1620 muestras, se necesitaron 18 kits de reactivos MiSeq V3 (Illumina). Todas las genotecas de NGS se secuenciaron a 14 pM y se añadió Phix al 10 % (PhiX Control V3) para introducir diversidad de genotecas.
Ejemplo 2: Análisis bioinformático de los datos de secuenciación
1. Procesamiento de prealineación y control de calidad de secuencias Fastq
Los datos de secuenciación se descargaron del secuenciador Miseq (Illumina) como archivo fastq. Para evaluar la calidad de la secuenciación, se realizó una calidad inicial de cada archivo fastq sin procesar con el uso del software FastQC versión 0.11.5. Se realizó una etapa de pretratamiento que consistió en eliminar las secuencias adaptadoras y el filtrado de las secuencias de acuerdo con su tamaño y la puntuación de calidad (se eliminaron todas las lecturas cortas (<50 nts) y las lecturas con QC promedio <30). A continuación, para facilitar y mejorar la calidad de la alineación de las secuencias se usó una herramienta flexible de corte de lectura para los datos de NGS de Illumina (programas trimmomatic versión 0.35). Después de realizar las etapas de preprocesamiento se llevó a cabo otro control de calidad de cada archivo fastq limpio antes de otro procesamiento de secuencias.
2. Alineación contra una secuencia de referencia
La alineación de las lecturas procesadas se realizó con el uso de bowtie2 versión 2.2.5 con modo sensible de extremo a extremo. La alineación se realizó para la última anotación de la secuencia del genoma humano (UCSC hg38) y regiones de alineación con lecturas múltiples, las lecturas con poca calidad de alineación (Q<40) o lecturas que contenían inserción/deleción (INDEL) se eliminaron del análisis posterior. El filtrado de la alineación del archivo se llevó a cabo con el programa informático SAMtools versión 1.2 que proporciona varias utilidades para manipular las alineaciones en el formato SAM, que incluyen clasificar, mezclar, indexar y generar alineaciones en un formato por posición.
3. Cálculo de los niveles de edición
A continuación, se usó SAMtools mpileup para acumular los datos de los resultados de alineación obtenidos de las múltiples muestras simultáneamente. Se ejecutó una secuencia de comandos interna para contar la cantidad de diferentes nucleótidos ATGC en cada ubicación genómica (“recuento de bases”). Por tanto, para cada ubicación genómica, la secuencia de comandos interna calcula el porcentaje de lecturas que tienen una “G” [Número de lecturas “G” / (Número de lecturas “G” Número de lecturas “A”) * 100]. La referencia “A” de la ubicación genómica con porcentaje en lecturas “G” > 0,5 son detectadas automáticamente por la secuencia de comandos y se consideran como “sitio de edición A a I”. La última etapa fue calcular el porcentaje de todas las combinaciones posibles de “sitio de edición A a I” descrito anteriormente para obtener el perfil de edición de la diana.
4. Comparación entre el perfil de edición basal y de la molécula de la diana
Analizamos el perfil de edición de ARN de 5HT2cR de un extenso conjunto de moléculas (n = 260). Para comparar las moléculas entre sí, en una primera etapa, determinamos el nivel basal de la edición de ARN de nuestra diana para cada isoforma/o sitios en la línea celular de neuroblastoma humano SH-SY5Y en comparación con las células de control tratadas con vehículo (DMSO). Para ello, calculamos, en el ejemplo dado, el promedio del nivel de edición de ARN de 5HT2cR de más de 150 experimentos independientes con vehículo (réplicas). En segundo lugar, una secuencia de comandos interna ha calculado automáticamente la desviación de cada réplica de molécula (n = 5) con relación a la referencia de control (CTRL).
Finalmente, para cada molécula y cada isoformas/o sitios de edición obtuvimos la proporción relativa media/mediana del nivel de edición de ARN de la diana.
Ejemplo 3: Análisis estadístico
Todos los análisis estadísticos y las cifras se calcularon con el programa estadístico de código abierto "R/Bioconductor" (19, 20). Los valores de edición de ARN se presentan generalmente como media ± error estándar de la media (SEM). Se realizó un análisis diferencial con la prueba de suma de rangos de Wilcoxon no paramétrica y la prueba t de Welch. Con las múltiples metodologías de prueba, es importante ajustar el valor de p de cada isoforma de edición (por ejemplo: 32 isoformas de edición de ARN, incluida la isoforma no editada (Ne) para 5HT2cR de 5 sitios de edición (A, B, C, E, D)) para controlar la tasa de descubrimientos falsos (FDR). Se aplicó el procedimiento de Benjamini y Hochberg (BH) (21) en todas las pruebas estadísticas con el "paquete multtest" y se consideró estadísticamente significativo un valor de p ajustado por debajo de 0,05. La proporción relativa de los niveles de edición se distribuyó normalmente y, en consecuencia, no se aplicó ninguna normalización. Todas las distribuciones de datos se ilustran como medianas y gráficas de barras o diagramas de cajas para cada isoforma significativa. Se muestra, además, para cada molécula una curva del perfil de edición de isoformas significativas y que representa el nivel de edición de ARN de 5HT2cR en la línea celular de neuroblastoma humano SH-SY5Y. Se aplicó una prueba de correlación de Pearson para identificar la correlación de isoformas para todos los grupos de moléculas.
El rendimiento diagnóstico de la isoforma de edición de 5HT2cR podría caracterizarse por: sensibilidad, que representa su capacidad para detectar el grupo de “moléculas de alto riesgo” y la especificidad, que representa su capacidad para detectar el grupo de “moléculas de riesgo bajo o nulo”. Los resultados de la evaluación de una prueba diagnóstica se pueden resumir en una tabla de contingencia 232 que compara estos dos grupos bien definidos. Al fijar un límite, los dos grupos podrían clasificarse en categorías de acuerdo con los resultados de la prueba, categorizados como positivos o negativos. Dada una isoforma particular, podemos identificar un número de moléculas con un resultado de prueba positivo entre el grupo de "alto riesgo" (el "Verdadero Positivo": TP) y b moléculas con un resultado de prueba positivo entre el grupo de "bajo riesgo" (el "Verdadero Negativo": TN). De la misma manera, se observan c moléculas con resultado negativo de la prueba entre el grupo de “alto riesgo” (el "falso positivo": FP) y d moléculas con un resultado negativo de la prueba entre el grupo de "bajo riesgo" (el "Falso Negativo": FN). La sensibilidad se define como TP/ (TP FN); que se denomina en el presente documento "tasa de verdaderos positivos". La especificidad se define como TN/ (TN FP); que se denomina en el presente documento "tasa de verdaderos negativos".
La precisión de cada isoforma de edición de 5HT2cR y su poder discriminatorio se evaluó mediante un análisis de características operativas de recepción (ROC). Las curvas ROC son la visualización gráfica de la relación recíproca entre la sensibilidad (Se) y la especificidad (Sp) de una prueba para varios valores.
Además, todas las isoformas de edición de 5HT2cR se combinaron entre sí para evaluar el posible aumento de la sensibilidad y la especificidad con el uso de varios enfoques como el programa mROC [Comput. Methods Programs Biomed. 2001; 66:199-207], regresión logística (22) y con dos algoritmos de aprendizaje supervisado, CART (23) y RandomForest (24).
mROC es un programa dedicado para identificar la combinación lineal (25, 26), que maximiza la ROC de AUC (Área bajo la curva) (27). Se proporciona la ecuación para la combinación respectiva y se puede utilizar como un nuevo marcador virtual Z, de la siguiente manera:
Z = a x Isoforma 1 b x Isoforma2 c x Isoforma3,
donde a, b, c son coeficientes calculados y la Isoforma 1, 2, 3 son la proporción relativa del nivel de edición de ARN individual de la diana de la isoforma.
Una combinación de 2, 3 o 4 dianas se puede combinar entre sí para evaluar el posible aumento de la sensibilidad y la especificidad con el uso de enfoques multivariados como, por ejemplo, el programa mROC o la regresión logística. Se puede calcular una ecuación para la combinación respectiva y se puede usar como un nuevo marcador virtual Zn, de la siguiente manera:
Zn = ni x diana1 n2 x diana2 n3 x diana3,
donde ni, n2, n3...son coeficientes calculados y la diana 1,2,3 es, por ejemplo, un valor correlacionado con el nivel de las dianas.
Se aplicó, además, un modelo de regresión logística para el análisis univariado y multivariado para estimar el riesgo relativo de moléculas a diferentes valores de isoformas o sitios. Analizamos las isoformas ya sea como variables continuas (datos no mostrados) y categóricas (con el uso de los valores de terciles como puntos de corte). En los últimos casos, se calcula la razón de probabilidades (OR) y su intervalo de confianza del 95 %. Se aplicó, además, una versión penalizada de la regresión logística (enfoques LASSO, ridge o Elastic-Net) sobre las variables continuas. Para estos métodos se utilizan los paquetes: glmnet versión 2.0-3 del software R versión 3.2.3.
Se aplicó, además, un enfoque CART (árboles de clasificación y regresión) para evaluar las combinaciones de isoformas. Este enfoque de árbol de decisión permite producir un conjunto de reglas de clasificación, representadas por un gráfico jerárquico fácilmente comprensible para el usuario. En cada nodo del árbol, se toma una decisión. Por convención, la rama izquierda corresponde a una respuesta positiva a la pregunta de interés y la rama derecha corresponde a una respuesta negativa a la pregunta de interés. El procedimiento de clasificación se puede traducir como un conjunto de reglas “SI-ENTONCES” (ver Figura 20 para un ejemplo).
Se aplicó un enfoque de bosque aleatorio (RF) como anteriormente para evaluar las combinaciones de isoformas. Este método combina la idea de "bagging" de Breiman y la selección aleatoria de características para construir una colección de árboles de decisión con varianza controlada. Por lo tanto, los bosques aleatorios se pueden utilizar para clasificar la importancia de las isoformas de edición y combinar las mejores isoformas para clasificar el "riesgo relativo" de la molécula (ver las Figuras 16 y 17).
CART y Bosque Aleatorio son métodos de aprendizaje supervisados. Estos métodos requieren el uso de un conjunto de entrenamiento utilizado para construir el modelo y un conjunto de prueba para validarlo. Por tanto, compartimos nuestro conjunto de datos: 2 / 3 del conjunto de datos se utilizan para la fase de aprendizaje y 1/3 se utilizan para la fase de validación. Este intercambio ha sido aleatorio y respeta la proporción inicial de los distintos estatutos en cada muestra. Para estimar la predicción de errores de estos clasificadores, utilizamos el método de validación cruzada de 10 veces, repetido 10 veces para evitar problemas de sobreajuste. Para estos enfoques, usamos el "paquete rpart 4.1-10" y el "paquete randomForest 4.6-12" de la versión 3.2.3 del software R.
Se puede utilizar otro análisis multivariado para evaluar la combinación de isoformas de edición de 5HT2cR para el "riesgo relativo" de las moléculas como:
- Enfoque de máquina de vectores de soporte (SVM) (28);
- Enfoque de red neuronal artificial (ANN) (29);
- Enfoque de red bayesiana (30);
- enfoque wKNN (k vecinos más cercanos ponderados) (31);
- Mínimo cuadrado parcial: análisis discriminante (PLS-DA) (32);
- Análisis discriminante lineal y cuadrático (LDA/QDA) (33);
- y más.
Ejemplo 4: Resultados
Validación de la línea celular SH-SY5Y
Antes del experimento, la línea celular de neuroblastoma humano (SH-SY5Y) se trató con una dosis creciente de interferón y se midió la edición de ARN de 5HT2cR con el uso de un enfoque basado en NGS. Como era de esperar, la proporción relativa de las isoformas de 5HT2cR se altera y, en particular, puede aumentar en función de la dosis (Figura 1), lo que confirma la respuesta inducida por IFN descrita anteriormente en esta línea celular cultivada en particular. El perfil de IFN coincidió estrechamente con los datos obtenidos previamente con el uso de un método analítico diametralmente diferente (34, 35).
Procedimiento experimental
Solo una vez que la línea celular mostró características de crecimiento estables y respondió en consecuencia al tratamiento con IFN, se preparó el cribado de 260 moléculas. Con base en criterios definidos internamente, se atribuyó una puntuación de riesgo a cada una de las 1280 moléculas de la biblioteca química. Por razones prácticas, se seleccionaron 260 moléculas para realizar pruebas adicionales en un ensayo in vitro patentado. Durante el procedimiento de selección de las moléculas, se tuvo cuidado de cubrir parte de todas, preferentemente al menos 3, 4, 5, 6 o 7 de las principales clases terapéuticas, identificadas en la figura 2, contenidas en la biblioteca química (figura 2). De las 260 moléculas, 112 son medicamentos recetados para trastornos del sistema nervioso central como anticonvulsivos, antidepresivos y otros (figura 2B). Todas las moléculas se transfirieron y se dividieron en alícuotas en tubos apropiados antes del tratamiento. La configuración experimental elegida para el cribado de las 260 moléculas consistió en 26 placas de pocillos (placa de 12 pocillos) tratadas individualmente con 10 moléculas, un control de vehículo (DMSO) e interferón alfa a 100 UI/ml, que a su vez produjeron un control positivo y negativo para cada placa de cultivo celular. Se usó una placa de cultivo celular adicional para agregar pocillos de control adicionales. Cada molécula se probó en 5 réplicas biológicas en un intervalo de 3 semanas (Figura 3). Exactamente a las 48 horas de tratamiento, las células se lisaron en tampón de lisis apropiado y se almacenaron a -20 °C hasta su posterior procesamiento. Toda la extracción de ARN se realizó con el uso de la extracción de ARN automatizada de Qiacube y las placas se procesaron individualmente (lotes de 12 muestras por extracción).
Expresión relativa de ARNm de ADARIa
Después de la extracción de ARN, se sintetizó ADNc y se evaluó la expresión de ADARIa en un ciclador de luz LC480 (Roche) en una placa de 384 micropocillos. De esta manera, todas las muestras del mismo lote pudieron analizarse en una única ejecución de qPCR. Se observó una inducción de ADAR1a dependiente de interferón para todas las células tratadas con IFN en cada placa de 12 pocillos, lo que refleja la solidez de la respuesta. Curiosamente, la molécula 165 indujo además la expresión de ARNm de ADAR1a (Figuras 4A-4I, placa 17). Esta respuesta se pudo observar en todas las réplicas biológicas (n = 5). Como se observó previamente en las células SH-SY5Y, el IFN indujo la expresión de ADAR1a con una inducción de 6,6 veces cuando se normalizó con relación a los controles de vehículo (Tabla 1). El coeficiente de variación de 9,31 % ilustra claramente la reproducibilidad del fenómeno biológico.
Tabla 1: Características estadísticas básicas de la expresión de ARNm de ADAR1a después del tratamiento con IFN en células SH-SY5Y. Media de la inducción en veces (en comparación con las células de control tratadas n DM vi i n n r m i n V x r m r n .
Figure imgf000014_0001
A) Análisis univariado de las isoformas de edición de 5HT2cR
Comparación de las isoformas de edición de ARN de IFN con el control en células SH-SY5Y
Después del paso de síntesis de cDNA, se aplicó un enfoque de PCR de 2 pasos para dirigirse al exón V del 5HT2cR para construir genotecas de NGS y cuantificar con precisión la proporción relativa de cada ARNm de 5HT2cR individual en todas las muestras. El valor medio de todos los controles de vehículo y pocillos tratados con IFN (n = 150) se muestra en la figura 5A y se representa como un histograma. Pueden observarse claras diferencias en la proporción relativa de la isoforma entre los controles de vehículo y las condiciones tratadas con IFN (Figura 5B). Estos datos se expresaron como un perfil de edición de ARN que genera el perfil de edición de ARN descrito anteriormente (figuras 7A-7B) que coincide muy de cerca con el perfil descrito anteriormente (ver la figura 1 y Cavarec y otros).
Como ejemplo, al comparar los niveles de isoformas de edición de ARN de 5-HT2cR en presencia de IFN (n = 150) con el control de vehículo (vehículo, n = 150) en las líneas celulares SH-SY5Y, los niveles de edición de ARN en AC, ABC, AB, A, AE, ACE, D, AbCD, ABE, C, B, BC y ABCE de 5-HT2cR se alteraron significativamente (Figuras 5A-5B y Figura 6). El nivel de las isoformas no editadas de 5-HT2cR (Ne) son las más significativas para la comparación de la molécula de IFN con el control de vehículo (Basa10). Además, observamos un aumento de los niveles de edición de ARN de 5-HT2cR de AC, ABC, AB, A, AE, AEC, a Bc d , ABE, C, B, BC y ABEC y una disminución de los niveles de D y de las isoformas no editadas (Ne) de edición de ARN de 5-HT2cR. Estos resultados sugieren que, globalmente, la actividad de edición de ARN en 5-HT2cR aumenta en células SH-SY5Y en presencia de IFN.
Tabla 2: análisis diferencial de los niveles de edición de ARN de 5-HT2cR al comparar la molécula de IFN n=150 con el control n=150
Figure imgf000015_0001
Comparación de los niveles de isoformas de edición de ARN de moléculas de alto riesgo con moléculas de bajo riesgo en células SH-SY5Y
Por ejemplo, al comparar moléculas de bajo riesgo (n = 82) con moléculas de alto riesgo (n = 61), los niveles de edición única o sin edición (Ne) de las isoformas 5-HT2cR pueden alterarse significativamente (Figuras 7A-7B). Según el análisis de la característica operativa del receptor (ROC) para los niveles de edición de ARN de las isoformas de 5-HT2cR, el área bajo la curva (AUC) para las isoformas individuales permitió discriminar moléculas con bajo o alto riesgo (Tabla 3).
Tabla 3: Rendimiento discriminativo de una isoforma de edición única al comparar moléculas de bajo riesgo n=82 con moléculas de alto ries o n=61
Figure imgf000015_0002
La precisión de cada isoforma y su poder discriminatorio se evaluó mediante un análisis de características operativas de recepción (ROC). Las curvas rOc son la visualización gráfica de la relación recíproca entre la sensibilidad (Se) y la especificidad (Sp) de una prueba para varios valores. AUC significa área bajo la curva, con su intervalo de confianza (IC). Las curvas ROC se basan en modelos de predicción del riesgo relativo de las moléculas mediante el cálculo del umbral óptimo de sensibilidad (Se %) y especificidad (Sp %) para un solo marcador. Se calcularon los valores predictivos positivos (PPV, %) y negativos (NPV, %) para las isoformas de edición de ARN única para evaluar la proporción de verdadera presencia [verdadero positivo/ (verdadero positivo falso positivo] y verdadera ausencia [verdadero negativo/ (verdadero negativo falso) negativo)] de moléculas de alto riesgo en el “grupo de efectos secundarios suicidas”.
B) Análisis multivariado de isoformas de edición de 5-HT2cR
El análisis de marcadores múltiples con el enfoque mROC (característica operativa del receptor múltiple) mejoró significativamente el AUC al comparar moléculas de bajo riesgo con moléculas de alto riesgo. La combinación de isoformas asociadas por ejemplo 2, 3, 4, 5, 6, 7 o las 13 isoformas seleccionadas del grupo de las 13 isoformas de la siguiente combinación: A B AB ABC AC C D AD AE ACD AEC ABCD NE, combinación obtenida por el método de la presente invención, tiene un valor predictivo de mayor riesgo de efecto secundario suicida en moléculas de alto riesgo según lo informado por la mayor sensibilidad y especificidad que las obtenidas en Cavarec y otros (2013). El análisis estadístico que combina 2, 3, 4, 5, 6, 7, 8, 9, 0, 11, 12 y las 13 isoformas identificadas en la combinación de la presente invención generó una serie de reglas de decisión; se calculó un nuevo marcador virtual (Z) para cada combinación como se ilustra en las Figuras 9 a 15 y las siguientes Tablas 4 a 9 correspondientes (moléculas de bajo riesgo frente a moléculas de alto riesgo).
La precisión del panel de isoformas múltiples y su poder discriminatorio se evaluó mediante un análisis de las características operativas de recepción (ROC). Las curvas ROC son la visualización gráfica de la relación recíproca entre la sensibilidad (Se) y la especificidad (Sp) de una prueba para varios valores. AUC significa área bajo la curva, con su intervalo de confianza (IC). Las curvas ROC se basan en modelos de predicción de alto riesgo de toxicidad mediante el cálculo del umbral óptimo de sensibilidad (Se %) y especificidad (Sp %) para un panel de isoformas múltiples. Se calcularon los valores predictivos positivos (p Pv , %) y negativos (NPV, %) para el marcador combinado para evaluar la proporción de verdadera presencia [verdadero positivo/(verdadero positivo falso positivo] y verdadera ausencia [verdadero negativo/(verdadero negativo falso negativo)] de una molécula de alto riesgo de efectos secundarios adversos que inducen suicidio/depresión.
Tabla 4: Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 2 isoformas moléculas de bao ries o frente a moléculas de alto ries o
Figure imgf000016_0001
Tabla 5: Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 3 isoformas m l l ri fr n m l l l ri
Figure imgf000016_0002
continuación
Figure imgf000017_0001
Tabla 6: Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 4 isoformas m l l ri fr n ml l l ri
Figure imgf000018_0001
continuación
Figure imgf000019_0001
Tabla 7: Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 5 isoformas m l l ri fr n ml l l ri
Figure imgf000019_0002
continuación
Figure imgf000020_0001
Tabla 8; Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 6 isoformas m l l ri fr n ml l l ri
Figure imgf000020_0002
continuación
Figure imgf000021_0001
Tabla 9; Rendimiento de las isoformas de edición de 5-HT2cR mediante análisis multivariado con 7 isoformas m l l ri fr n ml l l ri
Figure imgf000021_0002
continuación
Figure imgf000022_0001
Tabla 10: Rendimiento de isoformas de edición de 5-HT2cR mediante análisis multivariado con 13 isoformas m l l ri fr n ml l l ri
Figure imgf000022_0002
C) Enfoque del árbol de decisiones: análisis multivariado
El algoritmo CART que significa "árboles de clasificación y regresión" es un enfoque de árbol de decisión. Estos árboles ayudarán a construir un conjunto de reglas de clasificación, representadas como un gráfico jerárquico fácilmente comprensible para el usuario. El árbol consta de nodo interno (nodo de decisión), borde y hoja terminal. Estos nodos están etiquetados por pruebas y las posibles respuestas a la prueba coinciden con las etiquetas de los bordes de este nodo. Si el árbol de decisión es binario, por convención, el borde izquierdo corresponde a una respuesta positiva a la prueba y el borde derecho corresponde a la respuesta negativa. El procedimiento de clasificación obtenido tendrá una traducción inmediata en términos de regla de decisión.
Los árboles de decisión son métodos populares y eficientes de clasificación supervisada. Este método requiere el uso de un conjunto de entrenamiento para construir el modelo y un conjunto de prueba para validarlo. Entonces, para construir el conjunto de datos, hemos compartido nuestra lista de moléculas “no ambiguas” (n = 143): el 90 % del conjunto de datos se usa para la fase de aprendizaje (n = 93 fármacos) y el 10 % se usa para la fase de prueba (50 fármacos). Este intercambio ha sido aleatorio y respeta la proporción inicial de los diversos estatutos en cada molécula. Además,
Como ejemplo, hemos combinado las 6 isoformas de edición de ARN en el “perfil de IFN”, con el método CART para construir un modelo de toma de decisiones (figura 20).
Tabla 11: Rendimiento diagnóstico de las isoformas de edición de 5-HT2cR con el uso del algoritmo CART con una combinación de 5 isoformas X1, X2, X3, X4 y X5 seleccionadas de las isoformas o la combinación C13, en l n n m l l m l l ri fr n m l l l ri
Figure imgf000023_0002
Los rendimientos diagnósticos del modelo CART con el uso de 5 isoformas de edición de ARN de 5-HT2cR en la prueba de datos también pueden ser muy interesantes para discriminar las moléculas de bajo riesgo frente a las de alto riesgo.
D) Enfoque de bosque aleatorio: análisis multivariado
El bosque aleatorio es un método popular y eficiente de clasificación supervisada. Este método requiere el uso de un conjunto de entrenamiento para construir el modelo y un conjunto de prueba para validarlo. Entonces, para construir el conjunto de datos, hemos compartido nuestra lista de moléculas “no ambiguas” (n = 143): el 65 % del conjunto de datos se usa para la fase de aprendizaje (n = 93 fármacos) y el 35 % se usa para la fase de prueba (50 fármacos). Este intercambio ha sido aleatorio y respeta la proporción inicial de los diversos estatutos en cada molécula. Además, hemos ponderado el conjunto de datos de aprendizaje de IFN para mejorar el poder de separación de fármacos con “perfil de IFN” y fármacos con “perfil basal0”. Por tanto, hemos agregado 12 moléculas de IFN y 8 de control (basal0) tomados al azar en el conjunto de aprendizaje (n = 113).
Como ejemplo, combinamos 7 y los 13 representantes de isoformas de edición de ARN (Ver RD1 de C7, Tabla 9, y C13, Tabla 10) en el “Perfil de IFN”, con el algoritmo RandomForest (RF) para construir un modelo de toma de decisiones (Parámetros del modelo de RF: mtryStart = 1, stepFactor = 2, ntree = 500, mejorar = 0,01; estimación fuera de bolsa (OOB) del modelo de RF = 0,21) (figuras 16A-C y 17A-C)).
Tabla 12: Tablas de contingencia que utilizan un algoritmo de bosque aleatorio con 7 isoformas en el conjunto m l l m l l ri fr n m l l l ri
Figure imgf000023_0001
Tabla 13: Rendimiento diagnóstico de isoformas de edición de 5-HT2cR con el uso de un algoritmo de bosque aleatorio con 13 isoformas en un conjunto de datos de moléculas (moléculas de bajo riesgo frente a moléculas de alto ries o
Figure imgf000024_0001
Los rendimientos diagnósticos del modelo de RF con el uso de 7 o 13 isoformas de edición de ARN de 5-HT2cR son muy interesantes para discriminar las moléculas de bajo riesgo frente a las moléculas de alto riesgo con una sensibilidad, especificidad y precisión superiores al 90 % (para C7) y superiores al 95 % (para C13), significativamente superior a los descritos en Cavarec y otros (2013).
Ejemplo 5: Diversificación de dianas
Para complementar aún más la edición de ARNm de 5HT2cR en células SH-SY5Y, analizamos otros sustratos de ADAR (g RiA2, FLNB, PDE8A, GRIK2 y GABRA3). Curiosamente, el tratamiento con IFN alteró la proporción relativa de las isoformas de edición de ARN para las tres dianas estudiadas (figura 11). Por lo tanto, es previsible agregar biomarcadores adicionales para aumentar aún más el rendimiento diagnóstico de la prueba.
Ejemplo 6: Perfiles de edición de ARN, específicos de compuestos, obtenidos mediante análisis basado en NGS de varias dianas
Se han obtenido los perfiles de edición de ARN específicos de compuestos mediante análisis basado en NGS de las dianas GABRA3, GRIA2, GRIK2 y HTR2C (véanse las Figuras 21A-21B).
En las figuras 21A y 21B, los histogramas muestran la proporción relativa del nivel de edición de ARN cuantificado en cada sitio específico en la línea celular de neuroblastoma humano SH-SY5Y tratada con los compuestos indicados en comparación con las células de control tratadas con vehículo.
Un valor positivo (%) indica un aumento en la edición de ARN en el sitio específico inducido por el compuesto en comparación con las células tratadas con vehículo. Por el contrario, un valor negativo (%) indica una disminución en la edición de ARN en el sitio específico como resultado del tratamiento con el compuesto en comparación con las células tratadas con vehículo.
Los perfiles de edición de ARN se han obtenido para dos compuestos con riesgo bajo o nulo de inducir un efecto particular en un paciente (ver FIG.21A, 21B). Como ejemplo se proporciona el perfil de edición de ARN obtenido con lidocaína (A) y ondansetrón (B) en comparación con las células de control tratadas con vehículo.
Los perfiles de edición de ARN se han obtenido para dos compuestos con alto riesgo de inducir un efecto particular en un paciente como reserpina (ver la figura 21C) y fluoxetina (ver la figura 21D).
Ejemplo 7: Análisis del curso temporal de la edición de ARN
Se observó el análisis del curso temporal de los cambios de edición del ARN para aripiprazol, interferón (IFN) y reserpina en HTR2C (véanse las figuras 22A-22C). El tratamiento de las células SH-SY5Y con los tres compuestos condujo a alteraciones del perfil de edición de ARN dependientes del tiempo. Esto se ilustra claramente por la respectiva proporción relativa del HTR2C no editado que muestra una disminución con el tiempo. Curiosamente, la especificidad de los cambios inducidos por el tratamiento se ilustra mediante los diferentes perfiles obtenidos entre aripiprazol (ver la figura 22A) e interferón (ver la figura 22B) o reserpina (ver la figura 22C). Se aplicó el algoritmo de máxima preferencia para determinar la puntuación de riesgo de cada compuesto en cada punto de tiempo estudiado (prob(Algoritmo)). Si bien las puntuaciones de riesgo de interferón y reserpina fueron altas en todos los puntos de tiempo, el tratamiento con aripiprazol se identificó positivamente en riesgo a partir de las 24 horas y más (consulte la Tabla 14 a continuación).
Tabla 14: Puntajes del nivel de riesgo en puntos de tiempo, después del tratamiento con aripiprazol, interferón y reser ina
Figure imgf000025_0001
Ejemplo 8: Alteraciones dependientes de la dosis de los perfiles de edición de ARN después del tratamiento de las células SH-SY5Y con diferentes compuestos
Se han obtenido alteraciones dependientes de la dosis de los perfiles de edición de ARN después del tratamiento de células SH-SY5Y con tres compuestos diferentes, clozapina, sertralina y ketamina (véanse las figuras 23A-23C).
Los perfiles de edición de ARN representan la proporción relativa respectiva de edición de ARN de HTR2C en comparación con las células SH-SY5Y tratadas con vehículo.
Referencias
1. (WHO) WHO. Preventing suicide: A global imperative. 2014.
2. Labonte B, Turecki G. The epigenetics of suicide: explaining the biological effects of early life environmental adversity. Archives of suicide research: official journal of the International Academy for Suicide Research.
2010;14(4):291-310. PubMed PMID: 21082447.
3. Gurevich I, Englander MT, Adlersberg M, Siegal NB, Schmauss C. Modulation of serotonin 2C receptor editing by sustained changes in serotonergic neurotransmission. The Journal of neuroscience: the official journal of the Society for Neuroscience. 15 de dic de 2002;22(24):10529-32. PubMed PMID: 12486144.
4. Sodhi MS, Burnet PW, Makoff AJ, Kerwin RW, Harrison PJ. RNA editing of the 5-HT(2C) receptor is reduced in schizophrenia. Molecular psychiatry. Jul de 2001;6(4):373-9. PubMed PMID: 11443520.
5. Alon S, Garrett SC, Levanon EY, Olson S, Graveley BR, Rosenthal JJ, y otros. The majority of transcripts in the squid nervous system are extensively recoded by A a I RNA editing. eLife. 2015;4. PubMed PMID: 25569156. Pubmed Central PMCID: 4384741.
6. Khermesh K, D'Erchia AM, Barak M, Annese A, Wachtel C, Levanon EY, y otros. Reduced levels of protein recoding by A a I RNA editing in Alzheimer's disease. Rna. Feb de 2016;22(2):290-302. PubMed PMID: 26655226. Pubmed Central PMCID: 4712678.
7. Porath HT, Carmi S, Levanon EY. A genome-wide map of hyper-edited RNA reveals numerous new sites. Nature communications. 2014; 5:4726. PubMed PMID: 25158696. Pubmed Central PMCID: 4365171.
8. Seeburg PH, Higuchi M, Sprengel R. RNA editing of brain glutamate receptor channels: mechanism and physiology. Brain research Brain research reviews. May de 1998;26(2-3):217-29. PubMed PMID: 9651532.
9. Yang W, Wang Q, Kanes SJ, Murray JM, Nishikura K. Altered RNA editing of serotonin 5-HT2C receptor induced by interferon: implications for depression associated with cytokine therapy. Brain research Molecular brain research. 29 de abr de 2004;124(1):70-8. PubMed PMID: 15093687.
10. Dracheva S, Patel N, Woo DA, Marcus SM, Siever LJ, Haroutunian V. Increased serotonin 2C receptor mRNA editing: a possible risk factor for suicide. Molecular psychiatry. Nov de 2008;13(11):1001-10. PubMed PMID: 17848916.
11. Mann JJ, Brent DA, Arango V. The neurobiology and genetics of suicide and attempted suicide: a focus on the serotonergic system. Neuropsychopharmacology: official publication of the American College of Neuropsychopharmacology. Mayo de 2001;24(5):467-77. PubMed PMID: 11282247.
12. Mann JJ, Currier DM. Stress, genetics and epigenetic effects on the neurobiology of suicidal behavior and depression. European psychiatry: the journal of the Association of European Psychiatrists. Junio de 2010;25(5):268-71. PubMed PMID: 20451357. Pubmed Central PMCID: 2896004.
13. Mann JJ, Huang YY, Underwood MD, Kassir SA, Oppenheim S, Kelly TM, y otros. A serotonin transporter gene promoter polymorphism (5-HTTLPR) and prefrontal cortical binding in major depression and suicide. Archives of general psychiatry. Ago de 2000;57(8):729-38. PubMed PMID: 10920459.
14. Dinah Weissmann, Laurent Vincent, Mark D. Underwood, Laurent Cavarec, Nicolas Salvetat, Siem van der Laan, y otros. REGION SPECIFIC ALTERATIONS OF RNA EDITING OF SEROTONIN 2C RECEPTOR IN CORTEX OF SUICIDES WITH MAJOR DEPRESSION. Translational psychiatry. 2016; Minor revision.

Claims (14)

  1. REIVINDICACIONES
    Un método implementado por ordenador para predecir la probabilidad o el riesgo de un fármaco, un compuesto o una molécula, de inducir efectos particulares en un paciente, preferentemente efectos secundarios, con mayor preferencia efectos secundarios adversos o deseados, dicho método usa como una diana que exhibe una edición A a I de ARN, cuyo pre-ARNm es el sustrato de enzimas ADAR, la acción de dichas ADAR conduce a la producción de diferentes isoformas o sitios, en donde dicho método comprende las etapas de:
    A) Analizar el perfil de edición de ARN de la diana en una muestra que se ha tratado con dicho fármaco o compuesto o molécula, con el fin de obtener la proporción de nivel de edición de ARN de dicha diana para cada una de sus isoformas de edición, y, en donde dicho perfil de edición de ARN de la diana se obtiene según se obtiene para una molécula de la colección de moléculas en el algoritmo obtenido para dichos efectos particulares, y en donde dicho algoritmo es un algoritmo para predecir in vitro la probabilidad de que un compuesto induzca un efecto particular en un paciente, en donde dicho algoritmo o modelo se obtiene por un método que comprende las etapas de:
    a)
    - seleccionar al menos una diana que exhibe una edición A a I de ARN, cuyo pre-ARNm es el sustrato de las enzimas ADAR (adenosina desaminasas que actúan sobre el ARN), la acción de dichas ADAR en al menos un sitio de edición conduce a la producción de diferentes isoformas o sitios,
    - seleccionar al menos una línea celular que exprese endógenamente dicha al menos una diana y al menos las enzimas ADAR,
    - seleccionar un compuesto de control positivo que pueda alterar de manera dependiente de la dosis la proporción relativa de dichas isoformas de la diana o sitios de edición cuando las células de dicha línea celular se tratan con dicho control positivo,
    - seleccionar una colección de moléculas compuesta por una proporción de compuestos anotados con una puntuación de riesgo para inducir dichos efectos particulares,
    b) tratar las células de dicha línea celular con cada molécula individual de dicha colección de moléculas, junto con un control negativo y dicho control positivo,
    c) analizar dicho al menos un perfil de edición de ARN de la diana en cada muestra que se ha tratado con una molécula de la colección, con el fin de obtener la proporción del nivel de edición de ARN de dicha diana para cada una de sus isoformas y/o sitios de edición para cada una de las moléculas de dicha colección,
    d)
    -i) mediante un método estadístico de análisis univariado, evaluar para cada isoforma/o sitio de edición su precisión y su poder para discriminar el riesgo de que una molécula induzca dichos efectos particulares; y/o
    -ii) mediante un método estadístico de análisis multivariado, evaluar para cada combinación de isoformas/o sitios de edición, su precisión y su poder para discriminar el riesgo de que una molécula induzca dichos efectos particulares, y
    -iii) seleccionar la combinación que exhiba el mejor desempeño discriminativo,
    e) construir un algoritmo con el uso de dicha combinación seleccionada de isoformas/o sitios de edición, y usar dicho algoritmo así obtenido para predecir la probabilidad de que dicho compuesto induzca dichos efectos particulares en un paciente,
    y:
    en donde la etapa d)-i) comprende una etapa de calcular para cada isoforma o una combinación de estas: - el umbral óptimo de sensibilidad (Se %) de al menos 60 y especificidad (Sp %) de al menos 60 % para dichos efectos particulares;
    - los valores predictivos positivos (PPV, %) y negativos (NPV, %) para evaluar la proporción de verdadera presencia [verdadero positivo / (verdadero positivo+ falso positivo] y verdadera ausencia [verdadero negativo / (verdadero negativo+ falso negativo)]; y
    en donde en la etapa c), el perfil de edición de ARN se lleva a cabo mediante un método que incluye: - método NGS (secuenciación de próxima generación) que comprende la preparación de una genoteca de NGS; y
    - la secuenciación de todas las genotecas de NGS obtenidas,
    para obtener el perfil de edición de la diana; y
    en donde en la etapa d)-i) y d)-ii), dicho método estadístico que permite la obtención de dicho algoritmo o modelo se lleva a cabo mediante un método que incluye un método o una combinación de métodos seleccionados del grupo que consiste en:
    - programa mROC, en particular para identificar la combinación lineal, que maximiza la ROC AUC (Área bajo la curva) y en donde se proporciona la ecuación para la combinación respectiva y se puede usar como un nuevo marcador virtual Z, de la siguiente manera:
    Z = ai. (Isoforma 1) a2. (Isoforma 2) ...ai. (Isoforma i) ...an. (Isoforma n)
    donde ai son los coeficientes calculados e (Isoforma i) es la proporción relativa del nivel de edición de ARN individual de la diana de la isoforma; y/o
    - un modelo de regresión logística aplicado para análisis univariado y multivariado para estimar el riesgo relativo de moléculas a diferentes valores de las isoformas; y/o
    - un enfoque CART (árboles de clasificación y regresión) aplicado para evaluar combinaciones de isoformas; y/o
    - un enfoque de bosque aleatorio (RF) aplicado para evaluar las combinaciones de isoformas, en particular para clasificar la importancia de la isoforma de edición y combinar las mejores isoformas para clasificar el "riesgo relativo" de la molécula, y/o
    - un análisis multivariado aplicado para evaluar la combinación de isoformas para el "riesgo relativo" de las moléculas, que se selecciona del grupo que consiste en como
    - enfoque de máquina de vectores de soporte (SVM);
    - enfoque de red neuronal artificial (ANN);
    - Enfoque de red bayesiana;
    - enfoque wKNN (k vecinos más cercanos ponderados);
    - mínimo cuadrado parcial - análisis discriminante (PLS-DA);
    - análisis discriminante lineal y cuadrático (LDA / QDA);
    B) calcular el valor final o aplicar el algoritmo o modelo obtenido para dicho fármaco o compuesto con el uso de dicho algoritmo o modelo obtenido para dicha diana y dichos efectos particulares; y
    C) determinar si dicho fármaco o compuestos están en riesgo, particularmente con bajo riesgo frente a alto riesgo, de inducir dichos efectos particulares en un paciente a la vista de los resultados obtenidos en la etapa B).
  2. 2. El método implementado por ordenador de acuerdo con la reivindicación 1, en donde en dicho algoritmo, dichos efectos son efectos secundarios seleccionados de efectos secundarios adversos o deseados.
  3. 3. El método implementado por ordenador de acuerdo con la reivindicación 1 o 2, en donde en dicho algoritmo dicha diana que exhibe una edición A a I de ARN se selecciona del grupo que consiste en 5-HT2cR, PDE8A (fosfodiesterasa 8A), GRIA2 (receptor de glutamato 2), GRIA3, GRIA4, GRIK1, GRIK2, GRIN2C, GRM4, GRM6 FLNB (Filamina B), 5-HT2A, GABRA3, FLNA, CYFIP2.
  4. 4. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 3, en donde en dicho algoritmo dichos efectos particulares son efectos secundarios psiquiátricos adversos.
  5. 5. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 4, en donde en dicho algoritmo dicha línea celular expresa endógenamente dicha diana y ADAR(s), y se selecciona en el grupo que consiste en:
    - líneas celulares de neuroblastoma,
    - líneas celulares de neuroblastoma para las que el control positivo indujo la expresión del gen de ADAR1a con una inducción de al menos 4, 5 o 6 veces cuando se normalizó con relación a controles negativos o de vehículo, y
    - la línea celular humana SH-SY5Y.
  6. 6. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 5, en donde en la etapa b) de dicho algoritmo las células de dicha línea celular se tratan durante un período de tiempo comprendido entre 12 h y 72 h con las moléculas o controles a analizar.
  7. 7. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 6, en donde en dicho algoritmo dicho control positivo es interferón alfa.
  8. 8. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 7, en donde la etapa c) de dicho algoritmo comprende una etapa de determinar el nivel basal de la edición de ARN para cada isoforma/o sitio en dicha línea celular en comparación con las células de control tratadas con vehículo con el fin de obtener para cada molécula y cada isoformas de edición/o sitios de edición la proporción relativa media/mediana del nivel de edición de ARN de dicha diana.
  9. 9. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 8, en donde dicho método es un método implementado por ordenador para predecir in vitro la probabilidad de que un fármaco o un compuesto induzca efectos particulares sin riesgo o con un riesgo bajo o con un riesgo alto.
  10. 10. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 8, en donde en dicho algoritmo dicha colección de moléculas está compuesta por una proporción equilibrada de las clases terapéuticas de moléculas, cada molécula se anota con una puntuación de alto riesgo y bajo riesgo para inducir dichos efectos particulares.
  11. 11. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 10, en donde dicho algoritmo comprende además en la etapa c) el análisis bioinformático de dichos datos de secuenciación, dicho análisis bioinformático comprende las etapas de:
    - procesamiento de prealineación y control de calidad de las secuencias
    - la alineación contra la secuencia de referencia; y
    - el cálculo de los niveles de edición.
  12. 12. El método implementado por ordenador de acuerdo con una de las reivindicaciones 1 a 11, en donde: en dicho algoritmo:
    - dicha diana es 5-HT2cR,
    - dichos efectos particulares son efectos secundarios adversos psiquiátricos, -- la línea celular es la línea celular de neuroblastoma humano SH-SY5Y,
    - el control positivo es el interferón alfa,
    y en donde:
    la combinación de sitios que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 2, 3, 4 o 5 de los sitios individuales seleccionados del grupo constituido por los siguientes sitios de 5-HT2cR:
    A, B, C, D y E,
    - o la combinación de isoformas que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o 13 de las isoformas individuales seleccionadas del grupo constituido por las siguientes isoformas de 5-HT2cR: A, B, AB, ABC, AC, C, D, AD, AE, ACD, AEC, AbCd y NE,
    y en donde:
    dicho método estadístico que permite la obtención de dicho algoritmo o modelo se lleva a cabo mediante un método que incluye:
    - programa mROC, enfoque de bosque aleatorio y/o algoritmo Cart.
  13. 13. El método implementado por ordenador de la reivindicación 12, en donde en dicho algoritmo la combinación de sitios que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 3, 4 o 5 de los sitios individuales seleccionados del grupo constituido por los sitios A, B, C, D y E de 5-HT2cR.
  14. 14. El método implementado por ordenador de la reivindicación 12 o 13, en donde en dicho algoritmo la combinación de isoformas que puede discriminar si el fármaco de prueba tiene un riesgo bajo o alto de inducir dichos efectos secundarios adversos psiquiátricos comprende al menos una combinación de al menos 5, 6 o 7 de las isoformas individuales seleccionadas del grupo constituido por las isoformas de 5-HT2cR A, B, AB, ABC, AC, C, D, AD, AE, ACD, AEC, ABCD y NE.
ES17724104T 2016-03-11 2017-03-13 Algoritmo y un método in vitro basado en la edición de ARN para seleccionar un efecto particular inducido porcompuestos activos Active ES2848949T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16000600 2016-03-11
PCT/IB2017/000417 WO2017153849A1 (en) 2016-03-11 2017-03-13 Algorithm and an in vitro method based on rna editing to select particular effect induced by active compounds

Publications (1)

Publication Number Publication Date
ES2848949T3 true ES2848949T3 (es) 2021-08-13

Family

ID=55587999

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17724104T Active ES2848949T3 (es) 2016-03-11 2017-03-13 Algoritmo y un método in vitro basado en la edición de ARN para seleccionar un efecto particular inducido porcompuestos activos

Country Status (9)

Country Link
US (1) US20190249251A1 (es)
EP (1) EP3426801B1 (es)
JP (2) JP7227006B2 (es)
CN (1) CN108779494B (es)
BR (1) BR112018068128A2 (es)
CA (1) CA3016657A1 (es)
ES (1) ES2848949T3 (es)
IL (1) IL261579B2 (es)
WO (1) WO2017153849A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112018068128A2 (pt) * 2016-03-11 2019-01-15 Alcediag algoritmo e um método in vitro com base em edição de rna para selecionar o efeito particular induzido por compostos ativos
EP3819386A1 (en) * 2019-11-08 2021-05-12 Alcediag Diagnosing of mood disorders using blood rna editing biomarkers

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3272881B9 (en) 2007-06-13 2023-10-04 Alcediag Peripherical tissue sample containing cells expressing the 5htr2c and/or adars as markers of the alteration of the mechanism of the 5htr2c mrna editing and its applications
WO2010064231A1 (en) * 2008-12-02 2010-06-10 Tel Hashomer Medical Research Infrastructure And Services Ltd. Methods of analyzing a-i rna editing and nucleic acid constructs capable of same
EP2202321A1 (en) * 2008-12-17 2010-06-30 Biocortech Evaluation of the potential risk of drug induced mood disturbance and suicide:use of a dedicated platform
US20150056622A1 (en) * 2013-08-06 2015-02-26 Biocortech Editing profiling of pde8a pre -mrna: use as specific biomarker of adars activities in human tissues to diagnose and to predict and assess therapeutic efficacy and/or efficiency or potential drug side effects
EP3868896A1 (en) * 2010-06-24 2021-08-25 Alcediag Editing profiling of pde8a pre -mrna : use as specific biomarker of adars activities in human tissues to diagnose and to predict and assess therapeutic efficacy and/or efficiency or potential drug side effects
KR20140147797A (ko) * 2011-06-27 2014-12-30 더 잭슨 래보라토리 암 및 자가면역 질환의 치료 방법 및 조성물
BR112018068128A2 (pt) * 2016-03-11 2019-01-15 Alcediag algoritmo e um método in vitro com base em edição de rna para selecionar o efeito particular induzido por compostos ativos

Also Published As

Publication number Publication date
CN108779494B (zh) 2024-05-14
JP7227006B2 (ja) 2023-02-21
EP3426801B1 (en) 2020-10-14
BR112018068128A2 (pt) 2019-01-15
IL261579A (en) 2018-10-31
CA3016657A1 (en) 2017-09-14
WO2017153849A1 (en) 2017-09-14
JP2022134134A (ja) 2022-09-14
EP3426801A1 (en) 2019-01-16
IL261579B2 (en) 2023-07-01
JP2019515651A (ja) 2019-06-13
CN108779494A (zh) 2018-11-09
US20190249251A1 (en) 2019-08-15
IL261579B1 (en) 2023-03-01

Similar Documents

Publication Publication Date Title
Zhao et al. Misuse of RPKM or TPM normalization when comparing across samples and sequencing protocols
Sheng et al. Multi-perspective quality control of Illumina RNA sequencing data analysis
Panigrahi et al. Computational studies on Alzheimer’s disease associated pathways and regulatory patterns using microarray gene expression and network data: Revealed association with aging and other diseases
Galla et al. De novo sequencing of the Hypericum perforatum L. flower transcriptome to identify potential genes that are related to plant reproduction sensu lato
Yang et al. Expression signatures of long non-coding RNA and mRNA in human traumatic brain injury
Morgan et al. Repeated sampling facilitates within-and between-subject modeling of the human sperm transcriptome to identify dynamic and stress-responsive sncRNAs
Zerti et al. Understanding the complexity of retina and pluripotent stem cell derived retinal organoids with single cell RNA sequencing: current progress, remaining challenges and future prospective
JP2022134134A (ja) 活性化合物によって誘発される特定の効果を選択するための、rna編集に基づくアルゴリズム及びインビトロの方法
McDonald et al. Beyond GWAS in COPD: probing the landscape between gene-set associations, genome-wide associations and protein-protein interaction networks
Perzel Mandell et al. Characterizing the dynamic and functional DNA methylation landscape in the developing human cortex
Aevermann et al. Production of a preliminary quality control pipeline for single nuclei Rna-Seq and its application in the analysis of cell type diversity of post-mortem human brain neocortex
Wang et al. Circular RNA as a potential biomarker for forensic age prediction
Sosina et al. Strategies for cellular deconvolution in human brain RNA sequencing data
França et al. Drug-induced adaptation along a resistance continuum in cancer cells
Bauernfeind et al. High spatial resolution proteomic comparison of the brain in humans and chimpanzees
Kos et al. Dopamine perturbation of gene co-expression networks reveals differential response in schizophrenia for translational machinery
Gao et al. Identifying new susceptibility genes on dopaminergic and serotonergic pathways for the framing effect in decision-making
Rizzardi et al. Neuronal brain region-specific DNA methylation and chromatin accessibility are associated with neuropsychiatric disease heritability
Xu et al. Physiological RNA dynamics in RNA-Seq analysis
Detera-Wadleigh et al. A resource of induced pluripotent stem cell (iPSC) lines including clinical, genomic, and cellular data from genetically isolated families with mood and psychotic disorders
Joglekar et al. Single-cell long-read sequencing-based mapping reveals specialized splicing patterns in developing and adult mouse and human brain
Perry et al. Nascent transcription reveals regulatory changes in extremophile fishes inhabiting hydrogen sulfide-rich environments
Liu et al. Gene coexpression and evolutionary conservation analysis of the human preimplantation embryos
Dong et al. Transcribed enhancers in the human brain identify novel disease risk mechanisms
Meng et al. Network-based Analysis Approach to Prioritize GWAS of CSF in the ADNI Cohort