ES3045282T3

ES3045282T3 - A method for determining the temporal progression of a biological phenomenon and associated methods and devices

Info

Publication number: ES3045282T3
Application number: ES17722887T
Authority: ES
Inventors: Stanley Durrleman; Jean-Baptiste Schiratti; Stéphanie Allassonniere; Olivier Colliot
Original assignee: ECOLE POLYTECH; Centre National de la Recherche Scientifique CNRS; Assistance Publique Hopitaux de Paris APHP; Ecole Polytechnique; Institut National de la Sante et de la Recherche Medicale INSERM; Institut National de Recherche en Informatique et en Automatique INRIA; Sorbonne Universite; Institut du Cerveau et de La Moelle Epiniere ICM
Current assignee: ECOLE POLYTECH; Centre National de la Recherche Scientifique CNRS; Assistance Publique Hopitaux de Paris APHP; Ecole Polytechnique; Institut National de la Sante et de la Recherche Medicale INSERM; Institut National de Recherche en Informatique et en Automatique INRIA; Sorbonne Universite; Institut du Cerveau et de La Moelle Epiniere ICM
Priority date: 2016-05-11
Filing date: 2017-05-10
Publication date: 2025-11-27
Anticipated expiration: 2037-05-10
Also published as: JP2019525133A; US10832089B2; US20190138846A1; JP7221053B2; EP3455793B1; WO2017194995A1; JP7221053B6; WO2017195126A1; EP3455793A1; EP3455793C0; PL3455793T3

Abstract

La invención se refiere a enfermedades cerebrales relacionadas con la edad, como el párkinson o el alzhéimer. Los modelos estadísticos basados en la regresión de mediciones con la edad resultan inadecuados para modelar la progresión de dichas enfermedades. Por consiguiente, los inventores desarrollaron un modelo numérico para determinar la progresión temporal de dicho fenómeno biológico, consistente en una función en una variedad de Riemann. Dicho modelo permite obtener un método para determinar la progresión temporal de un fenómeno biológico, que puede implementarse informáticamente y ofrece mejores resultados que los modelos estadísticos basados en la regresión de mediciones. Este método de determinación puede aplicarse para predecir el riesgo de padecer dicha enfermedad, diagnosticarla, identificar un tratamiento o un biomarcador y analizar compuestos útiles como medicamento. (Traducción automática con Google Translate, sin valor legal)

Description

[0001] DESCRIPCIÓN

[0002] Procedimiento para determinar la progresión temporal de un fenómeno biológico y procedimientos y dispositivos asociados

[0003] CAMPO TÉCNICO DE LA INVENCIÓN

[0004] La presente invención se refiere a un procedimiento para determinar la progresión temporal de un fenómeno biológico. La presente invención se refiere también a un procedimiento asociado de predicción, un procedimiento asociado de diagnóstico, un procedimiento asociado de identificación de una diana terapéutica, un procedimiento asociado de identificación de un biomarcador y un procedimiento asociado de cribado. La presente invención se refiere también a un producto de programa informático y a un medio legible por ordenador adaptado para realizar uno de estos procedimientos.

[0005] ANTECEDENTES DE LA INVENCIÓN

[0006] Las enfermedades cerebrales relacionadas con la edad, como la enfermedad de Parkinson o la de Alzheimer, son enfermedades complejas que tienen múltiples efectos sobre el metabolismo, la estructura y la función del cerebro. Los modelos de progresión de la enfermedad que muestran la secuencia y el momento de estos efectos durante el transcurso de la enfermedad siguen siendo en gran medida hipotéticos. En los últimos años se han recopilado grandes bases de datos multimodales con la esperanza de proporcionar evidencia experimental de los patrones de progresión de la enfermedad basándose en la estimación de modelos impulsados por datos. Estas bases de datos son longitudinales, en el sentido de que contienen mediciones repetidas de varios sujetos en múltiples puntos temporales que no se corresponden necesariamente entre los sujetos. De hecho, los modelos de aprendizaje de progresión de la enfermedad a partir de dichas bases de datos plantean grandes desafíos metodológicos.

[0007] El documento de BILGEL MURAT y col. "A multivariate nonlinear mixed effects model for longitudinal image analysis: Application to amyloid imaging" NEUROIMAGE, ELSEVIER, AMSTERDAM, NL, vol. 134, 18 de abril de 2016 (16-04-2016), páginas 658-670, ISSN: 1053-8119, DOl: 10.1016/J.NEUROIMAGE.2016.04.001 o el documento US 2004/242972 A1 son ejemplos de dichos modelos de progresión de la enfermedad.

[0008] La principal dificultad radica en el hecho de que la edad de un individuo dado no proporciona información sobre el estadio de progresión de la enfermedad de este individuo. Los primeros síntomas clínicos de la enfermedad de Alzheimer pueden aparecer a los cuarenta años para un paciente y a los ochenta años para otro. La duración de la enfermedad también puede variar entre pacientes desde unos años a varias décadas. Por otra parte, la aparición de la enfermedad no se corresponde con la aparición de los síntomas: según estudios recientes, es probable que los síntomas estén precedidos por una fase silenciosa de la enfermedad, de la que se sabe poco. Como consecuencia, los modelos estadísticos basados en la regresión de las mediciones con la edad son inadecuados para modelizar la progresión de la enfermedad.

[0009] En el documento "Mixed-effects model for the spatiotemporal analysis of longitudinal manifold-valued data", MATHEMATICAL FOUNDATIONS OF COMPUTATIONAL ANATOMY, 9 de octubre de 2015 (09-10-2016), páginas 48-59, Schiratti y col. describen una variedad de Riemann para modelizar la progresión temporal de enfermedades neurodegenerativas.

[0010] RESUMEN DE LA INVENCIÓN

[0011] La invención tiene como objetivo determinar la progresión temporal de un fenómeno biológico, en particular una enfermedad neurodegenerativa, basándose en los datos tomados de un sujeto.

[0012] Con este fin, la invención se refiere a un procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo el procedimiento como se define en la reivindicación 1.

[0013] La presente invención permite determinar la progresión temporal de un fenómeno biológico basándose en los datos tomados de un sujeto.

[0014] Los datos tomados del sujeto son biomarcadores para el sujeto estudiado, siendo los biomarcadores relativos a la progresión del fenómeno biológico.

[0015] Hay poca restricción en los datos tomados del sujeto, lo que permite realizar el procedimiento con datos tomados del sujeto diferentes de los datos usados para construir el modelo numérico. La única restricción es que los datos tomados del sujeto y los datos usados para construir el modelo numérico se refieran al mismo biomarcador o biomarcadores.

[0016] La etapa de convertir garantiza dicha libertad.

[0017] Además, el modelo numérico permite obtener resultados interesantes al proponer un marco estadístico genérico para la definición y estimación de modelos de efectos mixtos para datos longitudinales con valores en variedades. El uso de las herramientas de la geometría permite derivar un procedimiento que realiza pocas suposiciones acerca de los datos y del problema que se va a tratar. Las opciones de modelización se reducen a la definición de la métrica en la variedad. Esta modelización geométrica también permite introducir el concepto de curvas paralelas en una variedad, que es una clave para descomponer las diferencias vistas en los datos de una manera singular en un componente espacial y uno temporal. Debido a la no linealidad del modelo, la estimación de los parámetros se basará en una maximización adecuada de la probabilidad observada. Para abordar esta cuestión, se usa una versión estocástica del algoritmo de maximización de expectativas.

[0018] Según aspectos adicionales de la invención que son ventajosos pero no obligatorios, el procedimiento para determinar la progresión temporal de un fenómeno biológico puede incorporar una o varias de las características siguientes, tomadas en cualquier combinación técnicamente admisible:

[0019] - el fenómeno biológico es un fenómeno biológico cuya progresión temporal se extiende durante más de tres años. - el fenómeno biológico es una enfermedad neurodegenerativa.

[0020] - en la etapa de proporcionar los primeros datos, los primeros datos son biomarcadores neuropsicológicos.

[0021] - el sujeto estudiado es un animal, preferentemente un mamífero, más preferentemente un ser humano.

[0022] - en la etapa de proporcionar el modelo numérico, la aproximación estocástica en una técnica de maximización de expectativas es una técnica de maximización de expectativas por aproximación estocástica de Monte-Carlo basada en cadenas de Markov.

[0023] - en la etapa de proporcionar el modelo numérico, el número de sujetos es superior o igual a 100.

[0024] - en el modelo numérico, los datos relativos a la dispersión de la trayectoria de progresión para el fenómeno biológico entre una pluralidad de sujetos se proporcionan como desviaciones típicas de tiempo para una pluralidad de valores de biomarcadores.

[0025] La invención se refiere también a un procedimiento de predecir que un sujeto está en riesgo de padecer una enfermedad, comprendiendo el procedimiento de predecir al menos la etapa de realizar las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado como se ha descrito anteriormente, siendo el fenómeno biológico la enfermedad, para obtener una primera progresión temporal, y la etapa de predecir que el sujeto está en riesgo de padecer la enfermedad basándose en la primera progresión temporal.

[0026] La invención se refiere también a un procedimiento para diagnosticar una enfermedad, comprendiendo el procedimiento de diagnosticar al menos la etapa de realizar las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado como se ha descrito anteriormente, siendo el fenómeno biológico la enfermedad, para obtener una primera progresión temporal, y la etapa de diagnosticar la enfermedad basándose en la primera progresión temporal.

[0027] La invención se refiere también a un procedimiento para identificar un biomarcador, siendo el biomarcador un biomarcador de diagnóstico de una patología, un biomarcador de propensión a padecer una patología, un biomarcador de pronóstico de una patología o un biomarcador predictivo en respuesta al tratamiento de una patología, comprendiendo el procedimiento las etapas de realizar el procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado como se ha descrito anteriormente, siendo los primeros datos unos datos relativos a un sujeto que padece la patología, para obtener una primera progresión temporal, de realizar el procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado como se ha descrito anteriormente, siendo los primeros datos unos datos relativos a un sujeto que no padece la patología, para obtener una segunda progresión temporal, y de

[0028] seleccionar un biomarcador basándose en la comparación de las progresiones temporales primera y segunda.

[0029] La invención se refiere también a un producto de programa informático comprendiendo instrucciones para realizar las etapas de un procedimiento como se ha descrito anteriormente, cuando dicho producto de programa informático se ejecuta en un dispositivo informático adecuado. La invención se refiere también a un medio legible por ordenador que tiene codificado en él un producto de programa informático como se ha descrito anteriormente.

[0030] BREVE DESCRIPCIÓN DE LOS DIBUJOS

[0031] La invención se entenderá mejor a partir de la descripción siguiente que se proporciona en correspondencia con las figuras adjuntas. En las figuras adjuntas:

[0032] - la Figura 1 muestra esquemáticamente un sistema y un producto de programa informático cuya interacción permite llevar a cabo un procedimiento para determinar la progresión temporal de un fenómeno biológico;

[0033] - la Figura 2 muestra un diagrama de flujo de un ejemplo de realización de un procedimiento para determinar la progresión temporal de un fenómeno biológico;

[0034] - la Figura 3 muestra esquemáticamente un ejemplo de datos longitudinales con valores en variedades;

[0035] - la Figura 4 muestra esquemáticamente un ejemplo de modelo numérico en una variedad de Riemann;

[0036] - las Figuras 5 a 7 muestran esquemáticamente el cálculo en la variedad de Riemann para obtener otro ejemplo de modelo numérico, y

[0037] - las Figuras 8 a 16 muestran esquemáticamente los resultados experimentales obtenidos usando el modelo numérico de las Figuras 5 a 7.

[0038] DESCRIPCIÓN DETALLADA DE ALGUNAS REALIZACIONES

[0039] En la Figura 1 se representan un sistema 10 y un producto de programa informático 12. La interacción entre el producto de programa informático 12 y el sistema 10 permite llevar a cabo un procedimiento para determinar la progresión temporal de un fenómeno biológico.

[0040] El sistema 10 es un ordenador. En el presente caso, el sistema 10 es un ordenador portátil.

[0041] Más en general, el sistema 10 es un ordenador o sistema informático, o un dispositivo de cómputo electrónico similar adaptado para manipular y/o transformar datos representados como magnitudes físicas, por ejemplo electrónicas, dentro de los registros y/o memorias del sistema informático en otros datos representados de forma similar como magnitudes físicas dentro de las memorias, registros u otros dispositivos de almacenamiento, transmisión o visualización de dicha información dentro del sistema informático.

[0042] El sistema 10 comprende un procesador 14, un teclado 22 y una unidad de visualización 24.

[0043] El procesador 14 comprende una unidad de procesamiento de datos 16, memorias 18 y un lector 20. El lector 20 está adaptado para leer un medio legible por ordenador.

[0044] El producto de programa informático 12 comprende un medio legible por ordenador.

[0045] El medio legible por ordenador es un medio que puede ser leído por el lector del procesador. El medio legible por ordenador es un medio adecuado para almacenar instrucciones electrónicas y apto para acoplarse a un bus del sistema informático.

[0046] Dicho medio de almacenamiento legible por ordenador es, por ejemplo, un disco, un disquete, discos ópticos, CD-ROM, discos magnetoópticos, memorias de solo lectura(Read-Only Memories,ROM), memorias de acceso aleatorio(Random Access Memories,RAM), memorias de solo lectura programables eléctricamente(Electrically Programmable Read-Only Memories,EPROM), memorias de solo lectura programables y borrables eléctricamente(Electrically Erasable and Programmable Read Only Memories,EEPROM), tarjetas magnéticas u ópticas o cualquier otro tipo de medios adecuados para almacenar instrucciones electrónicas, y aptos para acoplarse a un bus de sistema informático.

[0047] Un programa informático se almacena en el medio de almacenamiento legible por ordenador. El programa informático comprende una o más secuencias almacenadas de instrucciones de programa.

[0048] El programa informático puede cargarse en la unidad de procesamiento de datos 16 y está adaptado para provocar la ejecución del procedimiento al objeto de determinar la progresión temporal de un fenómeno biológico cuando el programa informático es ejecutado por la unidad de procesamiento de datos 16.

[0049] A continuación se describe el funcionamiento del sistema 10 en referencia a un ejemplo de realización de un procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado.

[0050] El sujeto estudiado es un animal.

[0051] Preferentemente, el sujeto estudiado es un mamífero.

[0052] Más preferentemente, el sujeto estudiado es un ser humano.

[0053] Con fines de ejemplificación, en el resto de la memoria descriptiva se supone que el sujeto estudiado es un ser humano.

[0054] En la definición más genérica, el fenómeno biológico es un fenómeno biológico para el cual se puede definir una progresión temporal.

[0055] En la presente invención reivindicada, el fenómeno biológico es una enfermedad o el envejecimiento.

[0056] Según una realización específica, el fenómeno biológico es un fenómeno biológico cuya progresión temporal se extiende durante más de tres años.

[0057] Según una realización más específica, el fenómeno biológico es un fenómeno biológico cuya progresión temporal se extiende durante más de diez años.

[0058] Además, al menos uno de la aparición del fenómeno biológico o la duración del fenómeno biológico varía de un sujeto a otro.

[0059] Un ejemplo típico de dicho fenómeno biológico es una enfermedad neurodegenerativa.

[0060] Enfermedad neurodegenerativa designa un conjunto de enfermedades que afectan principalmente a las neuronas en el cerebro humano.

[0061] La enfermedad de Alzheimer, la enfermedad de Parkinson, la enfermedad priónica, la enfermedad de la neurona motora, la enfermedad de Huntington, la ataxia espinocerebelosa y la atrofia muscular espinal son ejemplos de enfermedades neurodegenerativas.

[0062] Con fines de ejemplificación, en el resto de la memoria descriptiva se supone que el fenómeno biológico es la enfermedad de Alzheimer.

[0063] El procedimiento de determinación comprende cuatro etapas: una etapa S30 de proporcionar los primeros datos, una etapa S32 de proporcionar un modelo numérico, una etapa S34 de convertir y una etapa S36 de usar.

[0064] En la etapa S30 se proporcionan los primeros datos.

[0065] Los primeros datos son biomarcadores para el sujeto estudiado.

[0066] Los biomarcadores se refieren a la progresión del fenómeno biológico.

[0067] Por ejemplo, los primeros datos son datos recogidos a través de pruebas cognitivas dedicadas a detectar la enfermedad de Alzheimer.

[0068] Según otra realización, los primeros datos son datos obtenidos mediante imágenes médicas.

[0069] Según otra realización más, los primeros datos son una combinación de datos recogidos de diferentes maneras. Como ejemplo, los primeros datos son datos recogidos a través de pruebas cognitivas y datos mediante imágenes médicas.

[0070] Preferentemente, los primeros datos son datos recogidos en varios puntos temporales para el mismo sujeto.

[0071] En el ejemplo específico descrito, los primeros datos son biomarcadores neuropsicológicos, por ejemplo, evaluando las funciones cognitivas o motoras, como la memoria o las praxias.

[0072] En la etapa S32 se proporciona un modelo numérico etiquetado como NM.

[0073] El modelo numérico NM es una función en una variedad de Riemann llamada RM.

[0074] El modelo numérico NM asocia a los valores de los biomarcadores una trayectoria de progresión temporal para el fenómeno biológico y datos relativos a la dispersión de la trayectoria de progresión para el fenómeno biológico entre una pluralidad de sujetos.

[0075] Según una realización preferida, los datos relativos a la dispersión de la trayectoria de progresión para el fenómeno biológico entre una pluralidad de sujetos se proporcionan como desviaciones típicas de tiempo para una pluralidad de valores de biomarcadores.

[0076] Por lo tanto, el modelo numérico NM se puede interpretar como un modelo estadístico.

[0077] [0058] El modelo numérico NM se obtiene mediante el uso de una aproximación estocástica en una técnica de maximización de expectativas en datos relativos a biomarcadores tomados en diferentes puntos temporales para una pluralidad de sujetos.

[0078] Esto significa que el modelo numérico NM se refiere a datos longitudinales.

[0079] La Figura 3 ilustra un ejemplo específico de datos longitudinales.

[0080] Para cada sujeto, se toman varias imágenes de su cerebro en diferentes instantes.

[0081] Más en concreto, para el sujeto 1 se proporcionan dos imágenes I40 e I42.

[0082] Para el sujeto 2, se proporcionan tres imágenes I44, I46 e I48.

[0083] Para el sujeto 3, se proporcionan dos imágenes I50 e I52.

[0084] A excepción de las imágenes I48 e I52 (como se ilustra esquemáticamente con la flecha de la Figura 3), las imágenes se toman en diferentes momentos.

[0085] El caso de la Figura 3 es puramente ilustrativo, siendo los datos longitudinales generalmente más numerosos.

[0086] De hecho, preferiblemente, el número de sujetos es superior o igual a 100.

[0087] En otras palabras, los datos consisten en mediciones multivariadas repetidas depindividuos. Para un individuo dado, las mediciones se obtienen en los puntos temporalesti,i< ... <ti,ni.La medición y-ésima del i-ésimo individuo se denota pory,j. En el resto de la memoria descriptiva, se supone que cada observación y,yes un punto en una variedad de Riemann deNdimensiones<M>incrustada en y equipada con una métrica de Riemann [0069] El modelo espaciotemporal genérico pertenece a una clase de modelos estadísticos para los cuales no se pueden obtener estimaciones de máxima probabilidad de forma cerrada. Este problema se aborda mediante el uso de una aproximación estocástica en una técnica de maximización de expectativas.

[0088] Preferentemente, la aproximación estocástica en una técnica de maximización de expectativas es una técnica de maximización de expectativas por aproximación estocástica de Monte-Carlo basada en cadenas de Markov.

[0089] En la Figura 4 se representa esquemáticamente un ejemplo del modelo numérico NM proporcionado en la etapa S32.

[0090] El modelo numérico NM puede proporcionarse suministrando tres curvas que son Cmed, C1 y C2. Las tres curvas corresponden a tres tipos de progresión temporal para la enfermedad de Alzheimer. Estas curvas pueden representar la trayectoria media de progresión de la enfermedad (Cmed) y la dispersión de esta trayectoria a más o menos una desviación típica en los valores de biomarcadores para una pluralidad de sujetos (C1 y C2).

[0091] En la Figura 4 se representan dos curvas L1 y L2. Estas curvas indican una correspondencia temporal entre la curva media Cmed y la segunda curva C2.

[0092] Como un ejemplo específico, en relación con las Figuras 5 a 7, a continuación se ilustra cómo obtener un modelo numérico específico NM relevante para la enfermedad de Alzheimer.

[0093] _ _ ,<M>,y„ m

[0094] ) una variedad de Riemann de dimensiónNequipada con una métrica de Riemannu„ m

, que se supone que es geodésicamente completa.

[0096] Una métrica de Riemann es geodésicamente completa si las geodésicas de M se definen en D&, siendo esta notación para el conjunto de números reales. Se recuerda que una geodésica es una curva dibujada en la variedad Y • ~ q u e no tiene aceleración.

[0097] La métrica de Riemann define una conexión afín única en ™11 en concreto la conexión de Levi-Civita, denotada por V vM . Sea y una geodésica de 141 y toEM, ge recuerda que, dado un vector tangente 5 en el transporte paralelo de £ a lo largo de y, denotado porX(s) =Py,to,s(G),es un campo vectorial a lo largo de y que cumple las siguientes ecuaciones:

[0098]

[0101] <Sea>p e M.

[0103] La exponencial de Riemann en ™ en p se denota por

.

[0105] Para

denota el valor en el tiempo 1 de la geodésica en

emitida desde p con velocidad inicial v.

[0106] Se estudia la progresión temporal de una familia deN (N> 2) biomarcadores escalares. Se considera un conjunto de datos longitudinales de la forma (y<y>, t<y>)<y>. Este conjunto de datos longitudinales se obtiene observando apindividuos en puntos temporales repetidos. El vector yy denota la j-ésima observación (1 <j <nj) del /-ésimo individuo. La ^-ésima coordenada de yy, denotada por yy,k, corresponde a la medición del ^-ésimo biomarcador, en el tiempo tij.

[0107] Se supone que cada medición yy,k pertenece a una variedad de Riemann de dimensión uno(M, g)que es geodésicamente completa. En este escenario, las observaciones yy = (y / , /y / , /«y pueden considerarse como puntos en la variedad de productos

= La progresión media de esta familia de biomarcadores se modeliza mediante una trayectoria geodésica en la variedad M qUe está equipada con la métrica del producto, denotada por „H

[0108] 9.

[0109] El modelo numérico NM se describe para observaciones en una variedad que es un producto de variedades unidimensionales. Este marco es particularmente conveniente para analizar la progresión temporal de una familia de biomarcadores.

[0110] Para determinar la progresión relativa de los biomarcadores entre sí, la trayectoria media se elige entre la familia paramétrica de geodésicas:

[0113]

[0115] donde:

[0116] • 8 = (0, 5 i....5n-i ) y

[0117] • Yo es una geodésica, de la variedad unidimensional M, parametrizada por un punto po enM,un tiempo to y una velocidad vo enTpoM.

[0118] Esta parametrización de la geodésica Yo es la parametrización natural tal que:

[0121]

[0123] Al elegir la trayectoria media entre esta familia parametrizada de geodésicas, se supone que, en promedio, los biomarcadores siguen la misma trayectoria pero desplazados en el tiempo. El retardo entre la progresión de los diferentes biomarcadores es medido por el vector ® = (0,5i ,...,5n- i) e IKiw . Los parámetros 5¡ (1£ i < N - ' \ )miden un retardo relativo entre dos biomarcadores consecutivos. El parámetro to desempeña el papel del tiempo de referencia, ya que la trayectoria del primer biomarcador alcanzará el valor po en el tiempo to mientras que las otras trayectorias alcanzarán el mismo valor po en diferentes puntos temporales, desplazados con respecto al tiempo to.

[0124] [0087] El modelo numérico NM es un modelo jerárquico: se supone que los puntos de datos se muestrean a partir de trayectorias de progresión específicas del sujeto. Estas trayectorias individuales se derivan de la trayectoria media yg. La trayectoria específica del sujeto del /'-ésimo individuo se construye considerando un vector tangente distinto de cero w¡ en ortogonal aYs(to)para el producto interno definido por la métrica . Este vector tange nte w¡ = (w i,¡,...,wn,¡) es un desplazamiento espacial que permite registrar las trayectorias individuales en el espacio de mediciones. El vector tangente<w>¡ es transportado a lo largo de la geodésica yb desde el tiempotohasta el tiempo s usando el transporte paralelo. Este vector tangente transportado se denota porPY,to,s(w¡).En el punto Ys(s), se obtiene un nuevo punto en M tomando la exponencial de Riemann dePy,to,s(w)Este nuevo punto se denota porqw/(ys,s).A medida que s varía, este punto describe la curva s^ qw/(ys,s),que se considera una "paralela" a la curva Ys (véase la Figura 5). La condición de ortogonalidad en los vectores tangentes Wi es una hipótesis importante que garantiza que un puntoqwi(ys,s)en una paralela se mueve al mismo ritmo en esta paralela que en la trayectoria media. Esta hipótesis asegura la singularidad de la descomposición entre componentes espaciales y temporales.

[0126] La trayectoria Yi del individuo /-ésimo se obtiene reparametrizando la paralelaqwi(ys,.):y¡(s) = qw/(ys^/(s)),donde la correspondenciay/(s) = a(s - to - t/) toes una reparametrización afín específica del sujeto que permite registrar en el tiempo las diferentes trayectorias individuales de progresión. Dicha reparametrización afín corresponde a una distorsión de tiempo donde el vector tangente Wi se puede considerar, a la luz del modelo univariado, como un efecto aleatorio asociado al puntopo.

[0128] El parámetro ai es un factor de aceleración que codifica si el /-ésimo individuo está progresando más rápido o más lento que la media, Ti, es un desplazamiento temporal que caracteriza el avance o retardo del individuo

[0129] /-ésimo con respecto a la media y Wi es un desplazamiento espacial que codifica la variabilidad en las mediciones entre individuos en un estadio dado, una vez que se normalizan los ritmos a los que se siguen las trayectorias individuales. Se supone que cada uno de estos parámetros es aleatorio, no observado y variable.

[0131] Dado que M está equipada con la métrica del producto, el transporte paralelo del vector tangente

[0132] <W¡ E Tv>rs(to)

es un vector deNdimensiones cuyo componente /(-ésimo (1< k < N) e sigual al transporte paralelo del vector tangenteWkJ6 7Vo(-+Sjf- i)M a lo largo de la curva s —>yo(s+5k-i)en la variedad unidimensional M. Se deduce que:

[0135]

[0138] Tomar la exponencial de Riemann, en M , del vector tangentePy,to,s(Wi)equivale a tomar la exponencial

[0140] MI

[0141] de Riemann, en M, de cada componente del vector. Sie” denota el mapa exponencial de Riemann en M, el componente k-ésimo (1 <k< N)deqw/(ys,s)viene dado por:

[0143]

(s í * - 1 w T T

[0144] Para el conjunto de datos longitudinales (yi,j,t¡,j) (1 </ < p,1 <j < n/),el modelo numérico NM se escribe como:

[0147]

[0150] En particular, para el k-ésimo biomarcador, este modelo numérico NM se escribe como:

[0153]

[0155] Donde:

[0157] -*r

[0158] se supone que a =exp(q¡)conq¡sigue una distribución de probabilidad

siendo uv la distribución

[0159] gaussiana con media cero y varianza

[0161] • se supone que<t>¡ sigue una distribución de probabilidad según

<i>siendo la varianza de la distribución gaussiana,

[0163] • se supone que £¡j sigue una distribución de probabilidad segúnN(0, (r? .in) s/endo a2la varianza de la distribución gaussiana e In la matriz de identidad de orden n, y

[0164] • se supone que los vectores tangentes w¡ son una combinación lineal deNs<Ncomponentes estadísticamente independientes. Esto se escribe como w¡ = A.s¡ donde A es una matrizNxNsde rangoNscuyas columnas son vectores

[0165] en y s¡ es un vector deNsfuentes independientes que sigue una distribución de Laplace con parámetro 1/2.

[0166] Como consecuencia, los efectos fijos del modelo son los parámetros de la geodésica media: el punto po en la variedad, el punto temporal to y la velocidad V0. Los efectos aleatorios son los factores de aceleración ai, los desplazamientos temporales Ti y los desplazamientos espaciales Wi. Los efectos aleatorios z =(q, t,sy)(1 < i <py 1 <j < Ns)se consideran variables ocultas. Con los datos observados y = (y¡,j,k)¡,j,k, (y, z) forman los datos completos del modelo. En este contexto, el algoritmo de maximización de expectativas (EM) es muy eficiente para calcular la estimación de máxima probabilidad de los parámetros del modelo, denotada como 0.

[0167] En otras palabras, parece que el modelo numérico NM depende del parámetro vectorial 0 que se escribe como:

[0170]

[0172] donde vec(A) representa las entradas de la matriz A concatenadas en un vector sin procesar.

[0173] Además, los efectos aleatorios del modelo se describen mediante (ai,<t>¡,<w>¡) (1 < i <p).

[0174] Se usa una versión estocástica del algoritmo de maximización de expectativas (EM) para estimar el parámetro vectorial 0 del modelo numérico NM. Debido a la no linealidad del modelo, la etapa E del algoritmo EM no se puede tratar. Se usa una versión estocástica del algoritmo EM, en concreto el algoritmo de maximización de expectativas por aproximación estocástica de Monte-Carlo basada en cadenas de Markov (MCMC-SAEM).

[0175] Con el fin de garantizar la convergencia teórica del algoritmo MCMC-SAEM, los parámetros del modelo se consideran realizaciones de variables aleatorias gaussianas independientes, lo que equivale a garantizar que el modelo pertenezca a la familia exponencial curva.

[0176] Este enfoque da lugar a la siguiente hipótesis:

[0178] • po sigue una distribución de probabilidad según

y siendo la media y la varianza de la distribución gaussiana respectivamente,

[0179] •t0 sigue una distribución de probabilidad

siendo la media y la varianza de la distribución gaussiana respectivamente,

[0180] •vosigue una distribución de probabilidad

siendo la media y la varianza de la distribución gaussiana respectivamente,

[0181] • para todok, 5ksigue una distribución de probabilidad

y siendo la media y la varianza de la distribución gaussiana respectivamente, y

[0182] se supone que la matriz A puede escribirse como donde, para todok, ck siguiendo una distribución de probabilidad segúnN J

siendo la media y la varianza de la distribución gaussiana respectivamente, siendo Ak una base ortonormal del subespacio en qUe es ortogonal ay'(to)obtenido usando un proceso de Gram-Schmidt. Según esta hipótesis, las variables aleatoriasc1,...,c(n-1)nsse consideran variables ocultas para el modelo. La hipótesis anterior en relación con la matriz A garantiza la condición de ortogonalidad en las columnas de A. La condición de ortogonalidad garantiza que un punto en la curva paralelaqwi(Y ,.)se mueva al mismo ritmo que en la trayectoria media, por lo que solo los parámetros de la función de parametrización en el tiempo explican la diferencia en la dinámica de la progresión entre los sujetos. Esta propiedad es crucial para garantizar una descomposición única entre los componentes espacial y temporal y, por lo tanto, la capacidad de identificación del modelo.

[0183] Por lo tanto, según las hipótesis anteriores, el parámetro vectorial 0 del modelo es:

[0186]

[0188] mientras que las variables ocultas z del modelo son:

[0190] z ~(Po> t-0> Vo,( ^ fc ) l< k < N - l» ( c fc ) l< k < (N - l)N s < 0 ? ¿ ) l< i< p ' ( T í ) l< i< p ' C ^ A ií lS js N s .lS is p )

[0191] [0101] Para obtener el parámetro vectorial 0 y las variables ocultas z, el MCMC-SAEM se itera, hasta la convergencia, entre tres subetapas: una primera subetapa de simular, una segunda subetapa de aproximar de forma estocástica y una tercera subetapa de maximizar.

[0192] Sea k un número entero mayor que 1 y0(k-1)(respectivamentez(k-1))que denota los parámetros (respectivamente las variables ocultas) en la iteración (k-l)-ésima del algoritmo.

[0193] A continuación puede describirse la k-ésima iteración.

[0194] En la subetapa de simular, z(k) se muestrea a partir del núcleo de transición de una Cadena de Markov ergódica cuya distribución estacionaria es la distribución condicional de las variables ocultas conociendo las observaciones y = (y¡j)ij y las estimaciones actuales de los parámetrosQ(k-1).Este muestreo se realiza usando una técnica de Hasting-Metropolis dentro de un esquema de muestreo de Gibbs.

[0195] En la subetapa de aproximar de forma estocástica, la aproximación estocástica se realiza calculando estadísticas suficientes de la siguiente manera:

[0198]

[0200] donde(tk)kuna secuencia decreciente de tamaños de etapa positivos.

[0201] En otras palabras, la subetapa de aproximar de forma estocástica consiste en una aproximación estocástica sobre la probabilidad logarítmica completa log q(y, z | 0) resumido de la siguiente manera:

[0204]

[0206] donde(et)tes una secuencia decreciente de tamaños de etapa positivos en ]0, 1 ] que cumple £t st =<y>St £t = oo yI t ^ t< ° ° .

[0207] En la subetapa de maximizar, las actualizaciones de parámetros se obtienen en forma cerrada a partir de la aproximación estocástica sobre las estadísticas suficientes.

[0208] Por ejemplo, las estimaciones de parámetros se actualizan en la etapa de maximizar según la siguiente fórmula:

[0211]

[0213] En resumen, se ha descrito un modelo espaciotemporal jerárquico genérico para datos longitudinales con valores en variedades. Los datos consisten en mediciones repetidas a lo largo del tiempo para un grupo de individuos. Este modelo numérico NM permite estimar una trayectoria de progresión promedio de grupo, considerada como una geodésica de una variedad de Riemann dada. Las trayectorias individuales de progresión se obtienen como variaciones aleatorias, que consisten en desplazamiento paralelo y reparametrización en el tiempo, de la trayectoria media. Estas transformaciones espaciotemporales permiten al solicitante caracterizar cambios en la dirección y en el ritmo al que se siguen las trayectorias. Los parámetros del modelo se estiman usando una aproximación estocástica del algoritmo de maximización de expectativas (EM), el algoritmo de EM por aproximación estocástica de Monte Carlo basada en cadenas de Markov (M<c>M<c>-SAEM).

[0214] Los resultados experimentales obtenidos con el modelo numérico NM se ilustran en la sección experimental.

[0215] Por lo tanto, al final de la etapa de proporcionar S32, se obtienen tanto los primeros datos como un modelo numérico NM.

[0216] En la etapa de convertir S34, los primeros datos se convierten en al menos un punto en la misma variedad de Riemann RM.

[0217] En la etapa de usar S36, se usa el modelo numérico NM para determinar una progresión temporal para la enfermedad de Alzheimer para el sujeto estudiado.

[0218] Estas etapas S34 y S36 son difíciles de realizar dado que requieren adaptar (personalizar) los parámetros del NM para que la trayectoria de progresión pase a través, o lo más cerca posible, de los primeros datos convertidos como puntos en la variedad de Riemann RM.

[0219] Por ejemplo, se pueden usar los parámetros de dispersión del NM para generar series de trayectorias en la variedad de Riemann RM, que se deriva de la trayectoria media por transformaciones espacio-temporales, tales como las curvas C1 y C2 en el ejemplo de la Figura 4. El o los puntos a los que corresponden los primeros datos en la variedad de Riemann RM se usan para seleccionar la curva que minimiza una distancia con estos puntos.

[0220] Si la distancia con la primera curva C1 es la más pequeña, se determina que la progresión temporal esperada para la enfermedad de Alzheimer para el sujeto estudiado es la primera curva C1.

[0221] Por lo tanto, la presente invención permite determinar la progresión temporal de un fenómeno biológico según los datos tomados de un sujeto.

[0222] El presente procedimiento proporciona una buena versatilidad dado que la variedad de Riemann RM y su métrica se eligen a priori, lo que permite introducir restricciones anatómicas y fisiológicas en el modelo. La definición del modelo espaciotemporal genérico no requiere otra opción. Los modelos que se presentan en esta invención se basan en el concepto de curvas paralelas en una variedad. Los efectos aleatorios del modelo permiten registrar espacial y temporalmente las trayectorias individuales de progresión.

[0223] La ausencia de otra opción requerida en la presente invención es diferente de la técnica anterior en que el modelo está limitado para ajustarse a los datos. En otras palabras, se usa un modelo reducido (con hipótesis) para ajustar los datos, lo que significa que antes de cualquier ajuste, las hipótesis ya se conocen. Por el contrario, el modelo se adapta en la etapa S36 a los datos y el modelo obtenido permite determinar las hipótesis. En dicho contexto, la etapa S34 puede interpretarse como una etapa de reescalar los parámetros del modelo para que los datos estén próximos. Este reescalado se explica especialmente en el segundo y en el tercer experimento.

[0224] Además, debe resaltarse que el procedimiento propuesto para la determinación es particularmente fácil de implementar siempre que no se impongan restricciones a los primeros datos.

[0225] Dada la complejidad del problema que se aborda, se podría haber esperado que se impusieran restricciones a los datos que se van a proporcionar. En particular, no hay necesidad de datos tomados en puntos temporales específicos. Como ejemplo específico, no hay necesidad de obtener datos en un momento de referencia específico, como la fecha en que comienza la enfermedad.

[0226] Además, el presente procedimiento para determinar una progresión temporal se puede usar en múltiples aplicaciones.

[0227] Por ejemplo, dicho procedimiento para determinar una progresión temporal se usa en un procedimiento de predecir que un sujeto está en riesgo de padecer una enfermedad.

[0228] El procedimiento de predicción comprende realizar las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo el fenómeno biológico la enfermedad, para obtener una primera progresión temporal. El procedimiento de predicción también comprende predecir que el sujeto está en riesgo de padecer la enfermedad según la primera progresión temporal.

[0229] Según una realización específica, el procedimiento de predicción proporciona además cuándo se espera que se produzcan síntomas específicos para el sujeto.

[0230] Según otro ejemplo, el procedimiento para determinar una progresión temporal se usa en un procedimiento para diagnosticar una enfermedad.

[0231] El procedimiento para el diagnóstico comprende realizar las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo el fenómeno biológico la enfermedad, para obtener una primera progresión temporal. El procedimiento para el diagnóstico también comprende una etapa para diagnosticar la enfermedad basándose en la primera progresión temporal.

[0232] Según otro ejemplo, el procedimiento para determinar una progresión temporal se usa en un procedimiento para identificar una diana terapéutica para prevenir y/o tratar una patología.

[0233] El procedimiento para identificar una diana terapéutica comprende la realización de las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que padece la patología, para obtener una primera progresión temporal.

[0234] [0130] El procedimiento para identificar una diana terapéutica también comprende la realización de las etapas del procedimiento para determinar una progresión temporal que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que no padece la patología, para obtener una segunda progresión temporal.

[0235] El procedimiento para identificar una diana terapéutica también comprende una etapa de seleccionar una diana terapéutica basándose en la comparación de las progresiones temporales primera y segunda.

[0236] En dicho contexto, el término "diana terapéutica" debe interpretarse en sentido amplio como que abarca la selección de un tipo específico de pacientes.

[0237] Según otro ejemplo más, el procedimiento de determinación se usa en un procedimiento de identificación de un biomarcador.

[0238] El biomarcador puede variar según el ejemplo específico considerado. Por ejemplo, el biomarcador es un biomarcador de diagnóstico de una patología. Como variante, el biomarcador es un biomarcador de propensión a padecer una patología, un biomarcador de pronóstico de una patología o un biomarcador predictivo en respuesta al tratamiento de una patología.

[0239] El procedimiento para identificar un biomarcador comprende la realización de las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que padece la patología, para obtener una primera progresión temporal.

[0240] El procedimiento para identificar un biomarcador también comprende la realización de las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que no padece la patología, para obtener una segunda progresión temporal.

[0241] El procedimiento para identificar un biomarcador también comprende una etapa de seleccionar un biomarcador basándose en la comparación de las progresiones temporales primera y segunda.

[0242] Según otro ejemplo, el procedimiento para la determinación se usa en un procedimiento para cribar un compuesto útil como medicamento.

[0243] El compuesto tiene un efecto en una diana terapéutica conocida, para prevenir y/o modificar y/o tratar una patología.

[0244] El procedimiento para el cribado comprende la realización de las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que padece la patología y que ha recibido el compuesto, para obtener una primera progresión temporal.

[0245] El procedimiento para el cribado también comprende la realización de las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo los primeros datos unos datos relativos a un sujeto que padece la patología y que no ha recibido el compuesto, para obtener una segunda progresión temporal.

[0246] El procedimiento para identificar una diana terapéutica también comprende una etapa de seleccionar una diana terapéutica basándose en la comparación de las progresiones temporales primera y segunda.

[0247] Cada aplicación descrita anteriormente ilustra la posibilidad del procedimiento propuesto para determinar una progresión temporal.

[0248] SECCIÓN EXPERIMENTAL: PRIMER EXPERIMENTO

[0249] El modelo numérico NM se usa para analizar la progresión temporal de una familia de biomarcadores. Este modelo de progresión estima un escenario normativo de los deterioros progresivos de varias funciones cognitivas, consideradas aquí como biomarcadores, durante el curso de la enfermedad de Alzheimer. La trayectoria media estimada proporciona un escenario normativo de progresión de la enfermedad. Los efectos aleatorios proporcionan información singular sobre las variaciones en el orden y el momento de la sucesión de deficiencias cognitivas en diferentes individuos.

[0250] Datos considerados

[0251] Se usaron las pruebas de evaluación neuropsicológica "ADAS-Cog 13" de las cohortes ADNI1, ADNIGO o ADNI2 de la Iniciativa de Neuroimagen de la Enfermedad de Alzheimer (Alzheimer’s Disease Neuroimaging Initiative,ADNI). Estas pruebas están disponibles especialmente en la dirección de Internet https://ida.loni.usc.edu/.

[0252] El “ADAS-Cog 13” consta de 13 preguntas, que permiten probar el deterioro de varias funciones cognitivas. Para el propósito del análisis, estos elementos se agrupan en cuatro categorías: memoria (5 elementos que son los elementos 1, 4, 7, 8 y 9), lenguaje (5 elementos que son los elementos 2, 5, 10, 11 y 12), praxias (2 elementos que son los elementos 3 y 6) y concentración (1 elemento que es el elemento 13).

[0253] En el estudio se incluyó a 248 individuos. A estos 248 individuos se les diagnosticó un deterioro cognitivo leve en su primera visita y el diagnóstico cambió a enfermedad de Alzheimer antes de su última visita. Hay una media de 6 visitas por sujeto, con una duración media de 6 o 12 meses entre visitas consecutivas. El número mínimo de visitas fue de 3 y el número máximo de visitas fue de 11.

[0254] Para los experimentos de las Figuras 8 a 12

[0255] Según un primer caso, la puntuación de cada elemento se normalizó por la máxima puntuación posible. En consecuencia, cada punto de datos de cada individuo consiste en trece puntuaciones normalizadas, que pueden verse como un punto en la variedad M = l0, 413

[0256] En el caso donde M = ]0, 1[13, el número de fuentes independientesNspuede ser cualquier número entero entre 1 y 12. La elección del número de fuentes independientes influye en el número de parámetros que se van a estimar, que es igual a 9 12*Ns.Con el fin de mantener un tiempo de ejecución razonable, se realizaron tres experimentos conNsiguales a 1, 2 y 3. Para cada experimento, el algoritmo MCMC-SAEM se ejecutó cinco veces con diferentes parámetros iniciales. Solo se mantuvo el experimento que arrojó la menor varianza de ruido residual. El aumento del número de fuentes permitió disminuir el ruido residual entre los experimentos: a2 =0,02 paraNs= 1 , o2 = 0,0162 paraNs= 2 y a2 = 0,0159 paraNs= 3. Debido a que el ruido residual fue casi similar paraNs= 2 yNs= 3 fuentes, se describen los resultados obtenidos con el modelo menos complejo. Como consecuencia, a continuación se desarrollan los resultados obtenidos con dos fuentes independientes.

[0257] La trayectoria media Ys se proporciona en la Figura 8, donde cada curva representa la progresión temporal de un elemento específico de la prueba ADAS-Cog. Los efectos fijos estimados son p0 = 0,74, tü = 79,88 años, v0 = 0,047 unidad por año, y en años:

[0260]

[0262] Esto significa que, en promedio, los elementos relacionados con la memoria (elementos 1, 4, 7, 8, 9) alcanzan el valor p0 = 0,74 en respectivamente t0, fc-64, fe-67, fe-de y fc-dg años, que corresponden respectivamente a 79,88, 75,2, 87,6, 80,7 y 94,3 años. El elemento de concentración alcanza el mismo valor en fe-613 = 86,1 años. La progresión del elemento de concentración es seguida por los elementos de praxias y lenguaje.

[0263] Los efectos aleatorios muestran la variabilidad de esta trayectoria media dentro de la población estudiada. La desviación típica del desplazamiento temporal es igual a O<t>=8,3 años, lo que significa que el modelo de progresión de la enfermedad en la Figura 8 se desplaza en el tiempo como máximo ±8,3 años para el 95 % de la población. Esto explica la variabilidad en la edad de inicio de la enfermedad entre la población. Los efectos de la varianza de los factores de aceleración y los dos componentes independientes de los desplazamientos espaciales se ilustran en la Figura 10.

[0264] La primera columna de la Figura 10 ilustra la variabilidad en el ritmo de la progresión de la enfermedad (se supone que los desplazamientos temporales son cero para ilustrar el efecto del factor de aceleración solamente). Esta variabilidad está codificada por la varianza an = 0,8 del factor de aceleración logarítmico.

[0265] Los componentes independientes primero y segundo ilustran la variabilidad en el tiempo relativo de los deterioros cognitivos.

[0266] La primera dirección independiente muestra que algunos elementos de memoria y elementos de lenguaje se desplazan en el tiempo con respecto a los otros, especialmente para el elemento de memoria 4 ( ) y el elemento 7 (°). El orden del elemento de memoria 7 (°) y el elemento de concentración se invierte para los individuos con un desplazamiento espacial Wi =-asu,A1.Para esos individuos, los elementos de praxias se deterioran más tarde, después de los elementos de lenguaje 2(*), los elementos 12 (A) y el elemento 5 ( ).

[0267] El segundo componente independiente muestra una mayor variabilidad para los elementos relacionados con la memoria que para los primeros componentes independientes, en particular para el elemento de memoria 9 (A) y el elemento 4 ( ). Para individuos con un desplazamiento espacial Wi =-asi,2A2,los elementos relacionados con el lenguaje pueden verse afectados más tarde que el individuo promedio, especialmente para el elemento de lenguaje

[0268] Los efectos aleatorios específicos del sujeto estimados para cada individuo se obtienen de la etapa de muestrear la última iteración del MCMC-SAEM y se representan en la Figura 9. La figura 9 muestra que los individuos que tienen un desplazamiento temporal positivo (respectivamente negativo) (están evolucionando hacia delante, respectivamente hacia atrás, de la trayectoria media) son los individuos que experimentaron tarde (respectivamente temprano) la conversión a enfermedad de Alzheimer. Esto significa que los desplazamientos temporales individuales se corresponden bien con la edad a la que en un individuo dado se diagnosticó la enfermedad de Alzheimer. También debe observarse que existe una correlación negativa, igual a -0,4, entre los factores de aceleración logarítmica estimados y los desplazamientos temporales. Existe una tendencia a que los pacientes de inicio temprano experimenten una progresión rápida.

[0269] A través de su reparametrización afín específica del sujeto, la edad de un individuo dado se registra en la línea de tiempo común del escenario promedio.

[0270] En la Figura 11 se representa la evolución de la suma de los errores absolutos con el tiempo. En este caso, la suma de los errores absolutos esy,M\t1diaB-i/riirV

'<ill>dondetLd;iaacorresponde a la edad a la que el i-ésimo individuo experimentó la conversión a enfermedad de Alzheimer. Como se aprecia en la Figura 11, la suma de los errores absolutos muestra un mínimo único en t* = 77,45 años. Esta edad puede entenderse como la edad de inicio de los síntomas en la línea de tiempo del escenario normativo de la progresión de la enfermedad.

[0271] La Figura 12 corresponde a un histograma que proporciona el número de individuos con relación a los errores absolutos sobre la edad de conversión a la enfermedad de Alzheimer en años. En otras palabras, el histograma de la Figura 12 proporciona el número de individuos según el error absoluto que es lf¡31(t *4. El análisis del histograma de la Figura 12 muestra que la edad ^ es una predicción de la verdadera edad de conversión: el error de predicción es inferior a 5 años para el 50 % de la población. Esta predicción es la más notable ya que esta predicción se obtiene mediante el análisis de puntuaciones cognitivas, que inherentemente presentan ruido y cuya reproducibilidad es limitada.

[0272] Para los experimentos de las Figuras 13 a 16

[0273] Según un segundo caso, las puntuaciones dentro de cada categoría se suman y normalizan por la máxima puntuación posible. En consecuencia, cada punto de datos consiste en cuatro puntuaciones normalizadas, que pueden verse como un punto en la variedad = 1^’ ^ .

[0274] El modelo se aplicó con Ns = 1, 2 o 3 fuentes independientes. En cada experimento, el MCMC-SAEM se ejecutó cinco veces con diferentes valores de parámetros iniciales. Se conservó el experimento que devolvió la menor varianza residual a2. El número máximo de iteraciones se estableció arbitrariamente en 5.000 y el número de iteraciones de calentamiento se estableció en 3.000 iteraciones. El límite de 5.000 iteraciones es suficiente para observar la convergencia de las secuencias de estimaciones de parámetros. Como resultado, dos y tres fuentes permitieron disminuir la varianza residual mejor que una fuente (a2 = 0,012 para una fuente, a2 = 0,08 para dos fuentes y a2 = 0,084 para tres fuentes). El algoritmo se implementó en MATLAb® sin ningún esquema de optimización particular. Las 5.000 iteraciones requirieron aproximadamente un día.

[0275] El número de parámetros para estimar fue igual a 9+3*Ns. Por lo tanto, el número de fuentes no afectó drásticamente al tiempo de ejecución. La simulación fue la parte más costosa desde el punto de vista computacional del algoritmo. Para cada ejecución del algoritmo de Hasting-Metropolis, la distribución de la propuesta fue la distribución previa.

[0276] Para mayor claridad y debido a que los resultados obtenidos con tres fuentes fueron similares a los resultados con dos fuentes, se detallan adicionalmente los resultados experimentales obtenidos con dos fuentes independientes.

[0277] En la Figura 13 se representa el modelo promedio de progresión de la enfermedad yb. La Figura 13 es un gráfico que muestra la evolución con la edad de la memoria, el lenguaje, las praxias y la concentración en términos de puntuación cognitiva normalizada. Las cuatro curvas representadas corresponden a la trayectoria media estimada. Se traza una línea vertical en tü = 72 años y una línea horizontal en p0 = 0,3.

[0278] Al analizar la Figura 13, se observa que los efectos fijos estimados son p0 = 0,3, fe = 72 años, v0 = 0,04 unidad por año, y B = [0; -15; -13; -5] años. Esto significa que, en promedio, la puntuación de memoria (primera coordenada) alcanza el valor p0 en fe = 72 años, seguido por la concentración que alcanza el mismo valor en fe 5 = 77 años, y después seguido por praxias y lenguaje a la edad de 85 y de 87 años respectivamente.

[0279] [0167] Los efectos aleatorios muestran la variabilidad de esta trayectoria media dentro de la población estudiada. La desviación típica del desplazamiento temporal es igual a Ot = 7,5 años, lo que significa que el modelo de progresión de la enfermedad en la Figura 13 se desplaza ±7,5 años para tener en cuenta la variabilidad en la edad de inicio de la enfermedad. Los efectos de la varianza del factor de aceleración ai, y los dos componentes independientes Ai y A2 de los desplazamientos espaciales se ilustran en la Figura 15.

[0280] La Figura 15 es una serie de seis gráficos que ilustran la variabilidad en la progresión de la enfermedad superpuesta con la trayectoria media yb (líneas de puntos).

[0281] En la primera columna se representan los efectos del factor de aceleración ai con gráficas de yb (exp(±an)(t-to)+to). El factor de aceleración ai muestra la variabilidad en el ritmo de progresión de la enfermedad, que oscila entre 7 veces más rápido y 7 veces más lento que la media.

[0282] En la segunda columna se ¡lustran los efectos del primer componente independiente de desplazamiento ficas de<M>

[0283] '<—>1(y'j

[0284] espacial con gráv s ' -j□ primer componente independiente Ai muestra variabilidad en el tiempo relativo de las deficiencias cognitivas: en una dirección, la memoria y la concentración se deterioran casi al mismo tiempo, seguidas del lenguaje y las praxias; en la otra dirección, la memoria es seguida por la concentración y luego el lenguaje y las praxias casi se superponen.

[0285] En la tercera columna, se representan los efectos del primer componente independiente delr\—ffS2 ( y

[0286] desplazamiento espacial con gráficos de 'K-/s‘ ' 1.El segundo componente independiente A2 mantiene casi fijo el tiempo de memoria y concentración, y muestra una gran variabilidad en el tiempo relativo del deterioro de las praxias y el lenguaje. Muestra que el orden de los dos últimos puede invertirse en diferentes individuos. En general, estos componentes de desplazamiento espacial muestran que el inicio del deterioro cognitivo tiende a ocurrir por pares: memoria y concentración, seguidas del lenguaje y las praxias.

[0287] Las estimaciones de los efectos aleatorios para cada individuo se obtienen a partir de la etapa de simulacr la última iteración del algoritmo y se representan en la Figura 16. De manera similar a la Figura 9, la Figura 16 muestra que los desplazamientos temporales individuales estimados se corresponden bien con la edad a la que en los individuos se diagnosticó la enfermedad de Alzheimer. Esto significa que el valor po estimado por el modelo es un buen umbral para determinar el diagnóstico (un hecho que ha ocurrido por casualidad) y, lo que es más importante, que la distorsión en el tiempo registra correctamente la dinámica de las trayectorias individuales para que la edad normalizada corresponda al mismo estadio de progresión de la enfermedad en todos los individuos. Este hecho se corrobora en la Figura 14, que muestra que la edad normalizada de conversión a la enfermedad de Alzheimer se selecciona a los 77 años con una pequeña variación en comparación con la distribución real de la edad de conversión. La Figura 14 es un diagrama de tipo histograma de las edades de conversión a la enfermedad de Alzheimer con distorsión en el tiempo (barras grises) y las edades normalizadas de conversión a la enfermedad de Alzheimer (barras negras).

[0288] SECCION EXPERIMENTAL: SEGUNDO EXPERIMENTO

[0289] Datos

[0290] Se usó este modelo para resaltar los patrones espaciotemporales típicos de atrofia cortical durante el curso de la enfermedad de Alzheimer a partir de la MRI longitudinal de los convertidores de MCI de la base de datos de ADNI. Estos 154 convertidores de m C i corresponden a 787 observaciones, siendo cada sujeto observado 5 veces en promedio. Para obtener un gráfico fijo común, se alinearon las mediciones en un atlas común con FreeSurfer (que está disponible públicamente, especialmente en http://surfer.nmr.mgh.harvard.edu) para distribuir los mapas de mediciones en el mismo gráfico subyacente G, constituido por 1.827 nodos correspondientes a áreas distribuidas uniformemente sobre la superficie cerebral. De estos vértices, el solicitante seleccionó 258 nodos de control que codifican la interpolación espacial de la propagación. La matriz de distancia D usada se define por una distancia geodésica en el gráfico G.

[0291] Mediciones de espesor cortical

[0292] El solicitante usó la ejemplificación del modelo definida en el siguiente párrafo para caracterizar la disminución del espesor cortical. Múltiples ejecuciones de 30.000 iteraciones (~4 horas) de este MCMC-SAEM de 1.827 dimensiones conducen a una desviación típica de ruido a igual a 0,27 con el 90 % de los datos incluidos en el segmento [1,5, 3,6].

[0293] [0175] Para representar esta propagación, el solicitante calculó la diferencia de espesor durante períodos de 5 años. La propagación espaciotemporal media a medida que el espesor cortical disminuye entre los 80 y 90 años muestra que el área más afectada es el lóbulo medial-temporal, seguido de la neocorteza temporal. La corteza de asociación parietal y el lóbulo frontal también están sujetos a alteraciones importantes. Por otro lado, la corteza sensorio-motora y la corteza visual están menos involucradas en la propagación de la lesión. Estos resultados son muy consistentes con el conocimiento previo de los efectos de la enfermedad de Alzheimer en la estructura cerebral. Como el modelo es capaz de mostrar patrones espaciotemporales individuales con su ritmo de progresión asociado respectivamente, se refieren a individuos con una propagación más rápida y más lenta de la enfermedad. Por lo tanto, la disminución del espesor es, respectivamente, más y menos sustancial que el escenario medio.

[0294] Instanciación del modelo

[0295] Como muchas mediciones corresponden a valores positivos (por ejemplo, el espesor cortical, las relaciones de volumen), el solicitante considera a continuación el intervalo abierto M = ]0,+~[ como una variedad de Riemann unidimensional equipada con una métrica de Riemanngtal que para todop e My para todo(u,v) e TpM, gp(u,v) = uv/p.Con esta métrica y dada ke{1,...,Nv}, Mes una variedad de Riemann geodésicamente completa cuyas geodésicas tienen la forma

[0296] t -► pk exp(vk/pk*(t - 10 - 5k)) conpk e M, t0,w* C l f l yvke TpkM.

[0297] Por motivos de capacidad de identificación, se eligió fijar el parámetro pk entre los nodos, lo que lleva a un parámetro compartido<po.>Teniendo en cuenta las funciones de interpolación introducidas anteriormente y el hecho j j '■

[0298] de que los parámetros ) son(6k,Vk),lleva a definir:

[0301]

[0303] El modelo se puede reescribir como:

[0306]

[0309] <de manera que>0<= (po .ío .(^ )líííJVc- ( ^ ) lái£JVc>c<^ )>' y z = (W iQi, Ti)l<i<p.

[0310] Discusión y perspectivas

[0311] Se ha propuesto un modelo de efecto mixto que es capaz de evaluar una propagación espaciotemporal media grupal de una señal en los nodos de una malla gracias a los datos de neuroimagen longitudinal distribuidos en una red común. Los bordes de la red describen la evolución de la señal, mientras que sus vértices codifican una distancia entre los nodos a través de una matriz de distancia. La alta dimensionalidad del problema se aborda mediante la introducción de nodos de control: permiten evaluar un menor número de parámetros al tiempo que garantizan la suavidad de la propagación de la señal a través de nodos vecinos. Por otra parte, los parámetros individuales caracterizan los patrones personalizados de propagación como variaciones del escenario medio.

[0312] La evaluación de este modelo no lineal de alta dimensión se realiza con el algoritmo MCMC-SAEM que conduce a resultados convincentes: se pudieron resaltar áreas afectadas por una pérdida neuronal considerable como el lóbulo medial-temporal o la neocorteza temporal.

[0313] La matriz de distancia, que codifica aquí la distancia geodésica en la malla cortical, puede cambiarse para tener en cuenta la información de conectividad estructural o funcional.

[0314] En este caso, los cambios de señal pueden propagarse no solo a través de ubicaciones vecinas, sino también en nodos muy separados en el espacio pero cercanos entre sí en el conectoma.

[0315] Este modelo también podría usarse con datos multimodales, como en exploraciones PET, introduciendo modelos numéricos de enfermedades neurodegenerativas. Estos modelos podrían informar primero sobre la evolución de una enfermedad en el nivel poblacional a la vez que se pueden personalizar para adaptarse a los datos individuales, prediciendo así el estadio de la enfermedad o el tiempo hasta el inicio de los síntomas.

[0316] SECCIÓN EXPERIMENTAL: TERCER EXPERIMENTO

[0317] [0184] En el experimento, el solicitante propone un procedimiento para predecir la evolución longitudinal específica del sujeto de las estructuras cerebrales extraída de la MRI de línea de base y evaluar su rendimiento en los datos de la enfermedad de Alzheimer. La progresión de la enfermedad se modeliza como una trayectoria en un grupo de difeomorfismos en el contexto de la correspondencia métrica difeomórfica de gran deformación. El solicitante muestra primero las capacidades predictivas limitadas de la extrapolación de regresión geodésica en este grupo. Sobre la base del concepto reciente de curvas paralelas en variedades de formas, el solicitante introduce un segundo protocolo predictivo que personaliza las trayectorias previamente aprendidas para nuevos sujetos e investiga los rendimientos relativos de dos paradigmas de desplazamiento paralelo. Este diseño solo requiere los datos de imágenes de línea de base. Finalmente, los coeficientes que codifican la dinámica de la enfermedad se obtienen a partir de mediciones cognitivas longitudinales para cada sujeto, y se aprovechan para refinar la metodología, que se demuestra que predice con éxito las visitas de seguimiento.

[0319] Introducción

[0321] Se cree que los desarrollos patológicos primarios de una enfermedad neurodegenerativa como el Alzheimer surgen mucho antes de los primeros síntomas de deterioro cognitivo. Las alteraciones estructurales graduales sutiles del cerebro surgen y se desarrollan a lo largo del curso de la enfermedad, en particular en las regiones del hipocampo, cuyos volúmenes son biomarcadores clásicos en los ensayos clínicos. Entre otros factores, esas transformaciones dan lugar en última instancia a la disminución de las funciones cognitivas, que pueden evaluarse a través de pruebas estandarizadas. Por lo tanto, ser capaz de rastrear y predecir futuros cambios estructurales en el cerebro es clave para estimar el estadio individual de la progresión de la enfermedad, para seleccionar pacientes en ensayos clínicos y para evaluar la eficacia del tratamiento.

[0323] Con este fin, el trabajo del solicitante se establece para predecir la forma futura de las estructuras cerebrales segmentadas a partir de las MRI. El solicitante propone una metodología basada en tres bloques constitutivos: extrapolar a partir del pasado de un sujeto; transferir la progresión de un sujeto de referencia observado durante un período de tiempo más largo a nuevos sujetos; y refinar esta transferencia con información sobre la dinámica relativa de la enfermedad extraída de las evaluaciones cognitivas. En lugar de limitarse a características específicas como los volúmenes, se propone ver cada observación de un paciente en un punto temporal dado como una imagen o una malla de superficie segmentada en un espacio de forma.

[0325] En la anatomía computacional, los espacios de forma suelen definirse mediante la acción de un grupo de difeomorfismos. En este marco, se puede estimar un flujo de difeomorfismos de modo que una forma deformada continuamente por este flujo se ajuste mejor a las observaciones repetidas del mismo sujeto a lo largo del tiempo, lo que conduce a una trayectoria espaciotemporal específica del sujeto de los cambios de forma. Si el flujo es geodésico en el sentido de un camino más corto en el grupo de difeomorfismos, este problema se denomina regresión geodésica y puede considerarse como la extensión en las variedades de Riemann del concepto de regresión lineal. Resulta tentador entonces usar tal regresión para inferir la evolución futura de la forma dadas varias observaciones pasadas. Hasta donde se sabe, el poder predictivo de dicho procedimiento aún no se ha evaluado exhaustivamente. El solicitante demostrará que solo se pueden obtener resultados satisfactorios cuando se dispone de un gran número de puntos de datos durante largos períodos de tiempo, y que se deben esperar datos pobres en el escenario de casos prácticos más interesante de un par de observaciones.

[0327] En tales situaciones, una solución atractiva sería transferir el conocimiento previamente adquirido de otro paciente observado durante un período de tiempo más largo. Esta idea requiere la definición de un procedimiento de emparejamiento espaciotemporal para transportar la trayectoria de los cambios de forma en un espacio de un sujeto diferente. Se han propuesto varias técnicas para registrar series temporales de imágenes de diferentes sujetos. A menudo requieren que las series de tiempo tengan el mismo número de imágenes, o que tengan correspondencias entre imágenes a través de series de tiempo, y por lo tanto no son aptas para fines de pronóstico. El transporte paralelo en grupo de difeomorfismos se ha introducido recientemente para inferir la deformación de las imágenes de seguimiento a partir del emparejamiento de línea de base. Tales paradigmas se han usado principalmente para transportar trayectorias espaciotemporales al mismo espacio anatómico para la prueba de hipótesis]. Se tomó como base este concepto para inferir la continuación de la trayectoria del sujeto en el futuro. Han surgido dos metodologías principales, ya sea transportando la serie de tiempo paralela al emparejamiento de línea de base o transportando el emparejamiento de línea de base en paralelo a la serie de tiempo como en la presente invención. Ambos procedimientos se evalúan en esta sección.

[0329] En cualquier caso, estos enfoques requieren hacer coincidir la forma de línea de base con una en la serie temporal de referencia. Idealmente, se deberían emparejar los resultados correspondientes al mismo estadio de la enfermedad, que se desconoce. El solicitante propone complementar dichos enfoques con estimaciones del estadio del paciente y el ritmo de progresión usando evaluaciones neuropsicológicas repetidas de los sujetos, en el espíritu de esta invención. Estas estimaciones se pueden usar para ajustar la dinámica de los cambios de forma del sujeto de referencia al sujeto de prueba, según las diferencias dinámicas observadas en las pruebas cognitivas.

[0331] Procedimiento

[0332] Sea (y/)/=i,...,n una serie temporal de mallas superficiales segmentadas para un sujeto dado, obtenida a las edades(t¡)F1,...,n.El solicitante construye un grupo de difeomorfismos del espacio ambiente que actúan sobre las mallas segmentadas, siguiendo el procedimiento descrito en la técnica anterior. Se generan flujos de difeomorfismos de integrando los campos vectoriales variables en el tiempo de la formav {t,x )= , K(x,ck(t))¡3k( t )

donde: • K es un núcleo gaussiano,

[0333] • (Ck(t))Fi,...,w son puntos de control de la deformación, y

[0334] •(pk(t))¡=i,. ,Nson los momentos de la deformación.

[0335] El espacio de difeomorfismos está dotado de una norma que mide el coste de la deformación. A continuación, solo se consideran flujos geodésicos de difeomorfismos, es decir, flujos de norma mínima que conectan la identidad con un difeomorfismo dado. Dichos flujos están parametrizados de manera singular por sus puntos de control iniciales y momentos (c°,p°). Bajo la acción del flujo de difeomorfismos, una forma de plantilla inicialTse deforma continuamente y describe una trayectoria en el espacio de forma, que el solicitante denotará como Ypojso)(T,.). Simultáneamente, las mallas de superficie están dotadas de una norma varifold ||. || que permite medir un término de ajuste de datos entre mallas sin correspondencia de puntos.

[0336] Regresión geodésica

[0337] En el espíritu de la regresión lineal, se puede realizar una regresión geodésica en el espacio de forma estimando la intersecciónTy la pendiente (c°,p°) de manera que Y(<c>°,,<s>°)(T,.) minimice la siguiente función:

[0340]

[0342] donde R es un término de regularización que penaliza la energía cinética de la deformación. Se estima una solución de la ecuación (1) con un descenso por gradiente de Nesterov como se implementa en el software Deformetrica (www.deformetrica.org), donde el gradiente con respecto a los puntos de control, los momentos y la plantilla se calcula con una integración hacia atrás del término de ajuste de datos a lo largo de la geodésica. La resolución de este problema de optimización proporciona una descripción de la progresión de las estructuras cerebrales que se encuentra en el espacio tangente en la identidad del grupo de difeomorfismos.

[0343] Una vez que se encuentra un óptimo, el solicitante puede extrapolar la geodésica a edades posteriores e intentar predecir la evolución futura de las estructuras cerebrales.

[0344] Dos procedimientos para transportar trayectorias espaciotemporales de formas

[0345] Como se demostrará más adelante, la extrapolación de regresión geodésica produce una predicción precisa solo si los datos durante un largo período de tiempo están disponibles para el sujeto, lo que no es compatible con la ambición del pronóstico temprano.

[0346] Dada una geodésica de referencia, se usa el transporte paralelo de Riemann para generar una nueva trayectoria. Primero se realiza un emparejamiento de línea de base entre el sujeto de referencia y el nuevo sujeto, que puede describirse como un vector en el espacio tangente del grupo de difeomorfismos. Se dispone de dos paradigmas para obtener una trayectoria paralela. En la técnica anterior se sabe cómo transportar la regresión de referencia a lo largo del emparejamiento y luego proceder a la activación. En el espacio de forma, se genera así una geodésica que comienza en la forma de línea de base; por esta razón, esta solución se llamaparalelización geodésica.Por otro lado, en la presente invención, se sugiere transportar el vector coincidente a lo largo de la geodésica de referencia y luego construir una trayectoria con este vector transportado desde cada punto de la geodésica de referencia. Este procedimiento se denominaparalelización exp.

[0347] En un entorno de tan alta dimensión, el cálculo del transporte paralelo a menudo se basa en el esquema de escalera de Schild. Sin embargo, en el caso del solicitante, el cálculo del logaritmo de Riemann solo se puede calcular resolviendo un problema de emparejamiento de forma, lo que da lugar no solo a un algoritmo no tratable sino también a una aproximación incontrolada del esquema. Para implementar estos procedimientos de desplazamiento paralelo se usó un algoritmo que se basa en una aproximación del transporte a puntos cercanos mediante un campo de Jacobi bien elegido, con un control nítido de la complejidad computacional. Se obtiene la misma tasa de convergencia que la escalera de Schild a un coste reducido.

[0348] Dinámica de puntuaciones cognitivas

[0349] [0197] El protocolo descrito en la sección anterior tiene dos inconvenientes principales. En primer lugar, la elección del tiempo de emparejamiento en la trayectoria de referencia es arbitraria, la línea de base es puramente una elección de conveniencia e idealmente el emparejamiento debe realizarse en estadios similares de la enfermedad. En segundo lugar, no tiene en cuenta el ritmo de progresión del sujeto. En la presente invención, el solicitante propone un modelo estadístico que permite aprender, de manera no supervisada, parámetros dinámicos de los sujetos a partir de los resultados de la prueba ADAS-cog, una prueba cognitiva estandarizada diseñada para el seguimiento de la progresión de la enfermedad. Más en concreto, suponen que cada paciente sigue una trayectoria paralela a una media, con una reparametrización en el tiempo:

[0352]

[0354] que establece una correspondencia entre el tiempo del sujeto y un marco de tiempo normalizado, dondea> 0 ytson parámetros escalares. Un valor alto (respectivamente bajo) de a corresponde, por lo tanto, a una progresión rápida (respectivamente lenta) de las puntuaciones. Con estos parámetros dinámicos, la evolución de la forma se puede ajustar volviendo a parametrizar la trayectoria paralela de la misma manera.

[0355] Resultados

[0356] Datos, preprocesamiento y parámetros globales

[0357] Las MRI se extraen de la base de datos de ADNI, donde solo se mantienen los convertidores de MCI con 7 o más visitas, para un total de N=74 sujetos y 634 visitas. Se observa a los sujetos durante un periodo de tiempo que varía de 4 a 9 años (5,9 de media), con 12 visitas como máximo.

[0358] Las 634 MRI se segmentan usando el software FreeSurfer. A continuación, las máscaras cerebrales extraídas se registran de manera afín hacia el cerebro medio de Colin 27 usando el software FSL. Las transformaciones estimadas se aplican finalmente a los pares de estructuras subcorticales caudadas, hipocámpicas y del putamen.

[0359] Todas las operaciones difeomórficas, es decir, emparejamiento, estimación de regresión geodésica, disparo, paralelización exp y paralelización geodésica, se realizan mediante el software Deformetrica mencionado anteriormente. Se elige una distancia varifold con un ancho de núcleo gaussiano de 3 mm para cada estructura y un ancho de núcleo de deformación de 5 mm. La resolución de discretización de tiempo se establece en 2 meses.Extrapolación de regresión geodésica

[0360] El factor de aceleraciónaen la ecuación (2) codifica la tasa de progresión de cada paciente. Al multiplicar este coeficiente con la ventana de observación real se obtiene una noción de la longitud absoluta de la ventana de observación, en el marco de referencia de tiempo de la enfermedad. Solo los 22 primeros sujetos según esta medición se han considerado para esta sección: de hecho, se espera que presenten grandes alteraciones estructurales, lo que hace que el procedimiento de regresión geodésica sea más preciso.

[0361] La Tabla 1 presenta los resultados obtenidos para diferentes conjuntos de datos de aprendizaje y extensiones de extrapolación.

[0362] La métrica de rendimiento entre dos conjuntos de mallas es el coeficiente de Dice, que es la suma de los volúmenes de las intersecciones de las mallas correspondientes, dividido por las sumas totales de los volúmenes. Está comprendido entre 0 y 1 es igual a 1 para un emparejamiento perfecto y 0 para estructuras disjuntas. El rendimiento predictivo de la regresión geodésica se compara con uno de referencia que consiste en las últimas estructuras cerebrales observadas en el conjunto de datos de aprendizaje. Se realizó una prueba de Mann-Whitney con la hipótesis nula de que las distribuciones de coeficientes de Dice observadas son las mismas para obtener los niveles de significación estadística.

[0363] Las mallas extrapoladas son satisfactorias solo en el caso de que se usen todos los puntos de datos menos uno para realizar la regresión geodésica, logrando un alto índice de Dice y superando al de referencia, por un pequeño margen y sin alcanzar el nivel de significación (p = 0,25). Cuando la ventana de observación se vuelve más estrecha, la precisión de la predicción disminuye y se vuelve peor que la de referencia.

[0364] Tabla 1: Mediciones de rendimiento de Dice promediadas

[0366]

[0367]

[0369] La etiqueta [reg] indica la predicción basada en regresión y [ref] la de referencia. Cada fila corresponde a un conjunto de datos de aprendizaje cada vez mayor, y los pacientes son observados durante períodos de tiempo cada vez más amplios. Cada columna corresponde a una visita prevista cada vez más remota desde la línea de base. Niveles de significación [,05, ,01, ,001, ,0001].

[0370] Transporte no reparametrizado

[0371] Entre los 22 sujetos cuyo poder predictivo basado en regresión se ha evaluado en la sección anterior, los dos que obtuvieron mejores resultados se eligen como referencias para el resto de este artículo. Sus progresiones se transportan a los otros 73 sujetos con los dos procedimientos de desplazamiento paralelo diferentes. Se obtuvo un total de 288 trayectorias espaciotemporales previstas; se excluyeron algunas visitas porque fallaron rotundamente en algún estadio del flujo de procesamiento, por razones inexplicadas. Con más detalle, para cada par de sujetos de referencia y diana, primero se registra en la referencia la forma diana de línea de base. A continuación, la regresión geodésica de referencia se paraleliza como exp o se paraleliza geodésicamente. A continuación, se evalúa el rendimiento de la predicción: se calcula el índice de Dice entre la predicción y la observación real, para los dos modos de transporte, y se compara con el índice de Dice entre las mallas de línea de base y la observación real, la única información disponible en ausencia de un paradigma predictivo.

[0372] La parte superior de la tabla 2 presenta los resultados. En la mayoría de los casos, las mallas obtenidas por el protocolo propuesto son de menor calidad que las de referencia, según la métrica de rendimiento de Dice. Los dos procedimientos de transporte son esencialmente predictivos de manera similar, aunque la paralelización geodésica supera ligeramente a la paralelización exp para la predicción M12.

[0373] Tabla 2: Mediciones de rendimiento de Dice promediadas

[0376]

[0379] En cada celda, la primera línea proporciona el Dice promedio de la predicción basada en paralelizaciónexp [exp], la línea media la basada en paralización geodésica [geod] y la última línea el Dice de referencia [ref]. Cada columna corresponde a una visita prevista cada vez más remota desde la línea de base. Niveles de significación [,05, ,01, ,001, ,0001].

[0380] Refinamiento con parámetros dinámicos cognitivos

[0381] A excepción de la predicción M12, ambos protocolos son superiores constantemente a la referencia. Las predicciones de M36, M48, M72 y M96 son las más impresionantes, con valores de p siempre inferiores al 1 %. Esto muestra que el ritmo de la evolución de la puntuación cognitiva está bien correlacionado con el ritmo de los cambios cerebrales estructurales y, por lo tanto, permite una mejor predicción de las formas de seguimiento.

[0382] No se puede extraer ninguna conclusión en lo que respecta a las dos metodologías de desplazamiento paralelo, obteniéndose un único resultado de significación débil para la predicción M12.

[0383] Conclusión

[0384] El solicitante realizó un estudio cuantitativo de la extrapolación de regresión geodésica, mostrando sus limitadas capacidades predictivas. A continuación, el solicitante propuso un procedimiento para transportar una trayectoria espaciotemporal a un espacio de un sujeto diferente con una reparametrización temporal derivada del deterioro cognitivo, y puso de relieve su potencial de pronóstico. Los resultados muestran lo crucial que es la dinámica en la modelización de enfermedades y cómo se pueden aprovechar los datos de modalidad cruzada para mejorar un algoritmo de aprendizaje. Se demostró que los dos paradigmas principales que han surgido para el transporte de trayectorias paralelas funcionan igualmente bien en esta tarea de predicción. No obstante, dada la importancia de la parametrización en el tiempo, la paralelización de la expansión ofrece una ventaja metodológica en el sentido de que puede combinarse más fácilmente con dicha reparametrización en un modelo estadístico generativo para datos longitudinales.

[0385] No se ha evaluado la robustez del protocolo propuesto para la elección del sujeto de referencia. Dicha elección podría evitarse construyendo un modelo de enfermedad promedio. Este marco también se puede usar para estimar una imagen conjunta y un modelo cognitivo para estimar mejor los parámetros dinámicos individuales de la progresión de la enfermedad.

Claims

1. REIVINDICACIONES

1. Un procedimiento implementado por ordenador para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado, siendo el fenómeno biológico una enfermedad o el envejecimiento, comprendiendo el procedimiento las etapas de:

- proporcionar primeros datos, siendo los primeros datos biomarcadores de la progresión de la enfermedad o el envejecimiento para el sujeto estudiado,

- proporcionar un modelo numérico (NM), siendo el modelo numérico (NM) una función en una variedad de Riemann (RM), asociando el modelo numérico (NM) a valores de biomarcadores una trayectoria de progresión temporal para el fenómeno biológico y la dispersión de la trayectoria de progresión para el fenómeno biológico entre una pluralidad de sujetos, obteniéndose el modelo numérico (NM) usando una aproximación estocástica en una técnica de maximización de expectativas en biomarcadores tomados en diferentes puntos temporales para una pluralidad de sujetos,

- convertir los primeros datos en al menos un punto en la misma variedad de Riemann (RM), y

- usar el modelo numérico (NM) en el al menos un punto obtenido en la etapa de convertir para determinar una progresión temporal para el fenómeno biológico para el sujeto estudiado.

2. El procedimiento según la reivindicación 1, donde el fenómeno biológico es un fenómeno biológico cuya progresión temporal se extiende durante más de tres años.

3. El procedimiento según la reivindicación 1 o 2, donde el fenómeno biológico es una enfermedad neurodegenerativa.

4. El procedimiento según cualquiera de las reivindicaciones 1 a 3, donde, en la etapa de proporcionar los primeros datos, los primeros datos son biomarcadores neuropsicológicos.

5. El procedimiento según cualquiera de las reivindicaciones 1 a 4, donde el sujeto estudiado es un animal, preferentemente un mamífero, más preferentemente un ser humano.

6. El procedimiento según cualquiera de las reivindicaciones 1 a 5, donde en la etapa de proporcionar el modelo numérico (NM), la aproximación estocástica en una técnica de maximización de expectativas es una técnica de maximización de expectativas por aproximación estocástica de Monte-Carlo basada en cadenas de Markov.

7. El procedimiento según cualquiera de las reivindicaciones 1 a 6, donde en la etapa de proporcionar el modelo numérico (NM), el número de sujetos es superior o igual a 100.

8. El procedimiento según cualquiera de las reivindicaciones 1 a 7, donde, en el modelo numérico (NM), la dispersión de la trayectoria de progresión para el fenómeno biológico entre una pluralidad de sujetos se proporciona como desviaciones típicas de tiempo para una pluralidad de valores de biomarcadores.

9. Un procedimiento para predecir que un sujeto está en riesgo de padecer una enfermedad, comprendiendo el procedimiento de predicción al menos la etapa de:

- realizar las etapas del procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado según cualquiera de las reivindicaciones 1 a 8, siendo el fenómeno biológico la enfermedad, para obtener una primera progresión temporal, y

- predecir que el sujeto está en riesgo de padecer la enfermedad basándose en la primera progresión temporal.

10. Un procedimiento para diagnosticar una enfermedad, comprendiendo el procedimiento de diagnóstico al menos la etapa de:

- diagnosticar la enfermedad basándose en la primera progresión temporal.

11. Procedimiento para identificar un biomarcador, siendo el biomarcador un biomarcador de diagnóstico de una patología, un biomarcador de propensión a padecer una patología, un biomarcador de pronóstico de una patología o un biomarcador predictivo en respuesta al tratamiento de una patología, comprendiendo el procedimiento las etapas de:

- realizar el procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado según cualquiera de las reivindicaciones 1 a 8, siendo los primeros datos unos datos relativos a un sujeto que padece la patología, para obtener una primera progresión temporal,

- realizar el procedimiento para determinar la progresión temporal de un fenómeno biológico que puede afectar a un sujeto estudiado según cualquiera de las reivindicaciones 1 a 8, siendo los primeros datos unos datos relativos a un sujeto que no padece la patología, para obtener una segunda progresión temporal,

- seleccionar un biomarcador basándose en la comparación de las progresiones temporales primera y segunda.

12. Un producto de programa informático comprendiendo instrucciones para realizar las etapas de un procedimiento según cualquiera de las reivindicaciones 1 a 11 cuando dicho producto de programa informático se ejecuta en un dispositivo informático adecuado.

13. Un medio legible por ordenador que tiene codificado en él un producto de programa informático según la reivindicación 12.