ES2701095T3 - Un sistema y método para anotar imágenes propagando información - Google Patents

Un sistema y método para anotar imágenes propagando información Download PDF

Info

Publication number
ES2701095T3
ES2701095T3 ES13771199T ES13771199T ES2701095T3 ES 2701095 T3 ES2701095 T3 ES 2701095T3 ES 13771199 T ES13771199 T ES 13771199T ES 13771199 T ES13771199 T ES 13771199T ES 2701095 T3 ES2701095 T3 ES 2701095T3
Authority
ES
Spain
Prior art keywords
images
image
information
location
annotations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13771199T
Other languages
English (en)
Inventor
Manuel Jorge Cardoso
Sebastien Ourselin
Robin Wolz
Daniel Rueckert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UCL Business Ltd
Original Assignee
UCL Business Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UCL Business Ltd filed Critical UCL Business Ltd
Application granted granted Critical
Publication of ES2701095T3 publication Critical patent/ES2701095T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/162Segmentation; Edge detection involving graph-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20128Atlas-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20216Image averaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

Un método implementado por ordenador para anotar imágenes en un conjunto de datos que comprende un primer conjunto de imágenes que inicialmente tienen anotaciones y un segundo conjunto de imágenes que inicialmente no tienen anotaciones, comprendiendo el método las etapas de: determinar (110) correspondencias espaciales para todos los pares de imágenes, Ya, Yb, en el conjunto de datos, en los que cada correspondencia espacial representa un mapeo de una ubicación Yai en una primera imagen Ya con respecto a una ubicación correspondiente Ybj en una segunda imagen Yb; para cada mapeo, calcular una métrica de distancia Da-b(i) entre una ubicación Yai de una imagen Ya y su ubicación correspondiente Ybj en la imagen Yb usando una medida de similitud por pares entre una o más características en el par de imágenes Ya e Yb que se calcula localmente en una porción restringida del par de imágenes, de tal forma que la fuerza de conexión sea espacialmente variante en un par de imágenes; definir un gráfico vecinal local para cada ubicación en cada imagen, en el que los nodos del gráfico comprenden la ubicación Yai en la imagen Ya y las ubicaciones correspondientes Ybj en las imágenes Yb para las que la métrica de distancia Da-b(i) es menor que un umbral ajustado dt, y determinar (120) las fuerzas de conexión Wa-b(i) entre los nodos del gráfico utilizando la métrica de distancia Da-b(i); y propagar de forma iterativa la información (130) a través del gráfico utilizando: (i) las fuerzas de conexión y (ii) una estimación de la precisión de la información que se está propagando, como ponderaciones para propagar la información, en donde la información propagada se utiliza para proporcionar anotaciones a imágenes que inicialmente no tienen anotaciones, y en donde cada iteración realiza una propagación a través de todas las imágenes en el segundo conjunto.

Description

DESCRIPCIÓN
Un sistema y método para anotar imágenes propagando información
Campo de la invención
La presente invención se refiere a un sistema y un método de anotación de imágenes mediante la propagación de información de un primer conjunto de imágenes que inicialmente tienen anotaciones a un segundo conjunto de imágenes que inicialmente no tienen anotaciones.
Antecedentes de la invención
Se usan bases de datos de imágenes en una amplia diversidad de aplicaciones, tal como imágenes médicas, análisis de seguridad de equipaje, observaciones por satélite de la tierra, etc. En el contexto particular de la imagen médica, las imágenes pueden estar en forma bidimensional o tridimensional, y pueden adquirirse a través de diversas modalidades, tales como IRM, rayos X, etc. Estas imágenes se pueden usar entonces para una variedad de propósitos, incluida la detección y supervisión de enfermedades o anomalías, preparación y forma de forma de realización de intervenciones, tal como cirugía, etc.
Una imagen puede procesarse para realizar una segmentación y/o anotación. Por ejemplo, la segmentación puede determinar qué partes de la imagen se relacionan con un órgano (u órganos) en particular, mientras que la anotación puede etiquetar ciertas características que son visibles en la imagen. En la neuroimagen, las técnicas de clasificación patológica se han basado principalmente en dichas características extraídas de imágenes de IRM, ya sea utilizando características basadas en vóxel [16,17] o características estimadas a partir de estructuras segmentadas o regiones de interés (ROI) que se sabe que están afectadas por ciertas patologías, como la densidad de la materia gris [18], el volumen [19] o la forma [20]. A pesar del notable éxito de los métodos anteriores, existen inconvenientes derivados de la complejidad inherente del problema. Los métodos basados en vóxel se basan en la capacidad para mapear todos los sujetos patológicos y no patológicos en un espacio común de comparación, denominado espacio grupal. Esta correspondencia es un problema muy mal planteado que no puede determinarse únicamente por los atributos de imagen basados en la intensidad y donde puede no existir en absoluto una correspondencia anatómica exacta debido a la variabilidad anatómica entre los sujetos. Por ejemplo, puede que no sea posible mapear a la perfección los sujetos con dos patrones de plegado cortical diferentes a través de una transformación biológicamente significativa. Por lo tanto, las grandes diferencias morfológicas entre un individuo y el espacio grupal pueden dar como resultado una cantidad significativa de información residual que la transformación no captura [21]. Este desajuste residual entre sujetos actúa como una confusión morfológica [22], reduciendo el poder estadístico de las técnicas basadas en vóxel. Por otro lado, las técnicas basadas en ROI no utilizan espacios grupales para la comparación y, por lo tanto, no tienen la misma limitación de mapeo. Sin embargo, requieren seleccionar y segmentar con precisión la ROI, un proceso que puede llevar mucho tiempo, ser propenso a errores, y requerir hipótesis a priori sobre una ROI relevante. Además, las técnicas basadas en ROI realizan de manera eficaz la reducción de características, descartando características potencialmente útiles y dando como resultado un rendimiento inferior para la clasificación de patologías [23].
Recientemente, ha surgido una tercera clase de técnicas basadas en el concepto de propagación y fusión de etiquetas. Esta clase de técnicas generalmente utiliza un conjunto de imágenes anatómicas (atlas) con un mapa de etiquetas asociado a nivel de vóxeles. Usando técnicas de registro de imágenes, se pueden propagar los atlas y sus mapas de etiquetas correspondientes a una nueva imagen invisible. Después del alineamiento, los atlas y las etiquetas más similares (según una métrica de similitud) se utilizan en la etapa de fusión para obtener un mapa de etiquetas óptimo para la nueva imagen invisible. Típicamente, los mapas de etiquetas descritos anteriormente representan una parcelación cerebral estructural [24, 25], aunque este marco puede extenderse a cualquier tipo de información, es decir, segmentaciones probabilísticas, atlas de población y clasificaciones patológicas. El trabajo reciente de [26] exploró el uso de un marco de fusión de etiquetas para calificar patológicamente las estructuras anatómicas. A pesar de las muchas limitaciones de este marco, se obtuvo un alto grado de precisión para la clasificación "EA frente a control", concretamente, una tasa de éxito del 90%, que es competitiva con los enfoques de aprendizaje automático del estado de la técnica.
Sin embargo, la información estructural y anatómica solo está disponible para un pequeño subconjunto de datos de imagen que están disponibles para los investigadores en diversas bases de datos de imágenes. Asimismo, los datos clínicos (por ejemplo, información sobre el sujeto de la imagen y su afección médica) rara vez están disponibles. Desafortunadamente, proporcionar esta información adicional, tal como parcelaciones y/o segmentaciones manuales, ubicaciones de puntos de referencia anatómicos, antecedentes de tejidos, clasificación patológica del sujeto, etc., requiere grandes cantidades de interacción humana, generalmente de un profesional experto. Por lo tanto, no es factible en la práctica proporcionar información completa sobre las imágenes en muchas bases de datos a través de la interacción manual.
Por lo tanto, se han hecho intentos en el contexto de la obtención de imágenes médicas para extrapolar y propagar esta información complementaria a través de conjuntos de datos de imágenes morfológicamente diferentes de una manera coherente y sin errores. En el análisis de imágenes neurológicas, un ejemplo de dicha propagación de información es la segmentación multi-atlas. Muchos investigadores han demostrado que la propagación de parcelaciones estructurales de múltiples fuentes, mapeándolas con respecto a nuevos datos invisibles utilizando el registro de imágenes y luego fusionando las parcelaciones candidatas, proporciona una buena estimación de la verdadera parcelación subyacente [1, 2]. Sin embargo, en el caso de una fuente de información limitada y morfológicamente agrupada, como los 30 sujetos de control jóvenes con una parcelación asociada de 83 áreas clave del cerebro proporcionada por Hammers et al. [3], la propagación de la parcelación estructural puede ser problemática. Dado que estas parcelaciones se definen solo en controles jóvenes con anatomía normal, no es trivial mapear esta información directamente con respecto a sujetos morfológicamente diferentes y patológicos [4, 5] sin introducir grandes errores.
Más recientemente, Wolz et al. [6] introdujeron el enfoque LEAP (incrustaciones de aprendizaje para la propagación del atlas) para la segmentación cerebral (véase también el documento WO2011/039515), en particular, para la propagación de la segmentación del hipocampo. En LEAP, se utiliza una representación de baja dimensión de los datos para encontrar conjuntos de datos morfológicamente similares. Esta similitud morfológica se usa entonces para difundir gradualmente la segmentación del cerebro desde los 30 atlas de Hammers [3] a los pacientes con enfermedad de Alzheimer patológica a través de conjuntos de datos intermedios morfológicamente similares, lo que aumenta considerablemente la precisión de la segmentación. Por consiguiente, las segmentaciones disponibles se propagan gradualmente y se transfieren entre sujetos morfológicamente diferentes a través de múltiples imágenes morfológicamente intermedias. Sin embargo, este método todavía tiene algunas limitaciones con respecto a su complejidad computacional, su restricción con respecto a la caracterización morfométrica global y el conjunto limitado de características que puede usar. Además, a medida que aumenta el tamaño de la región de interés, la incrustación morfológica se vuelve menos localizada, dando como resultado potencialmente una disminución del rendimiento. Un marco similar, pero para el registro de imágenes geodésicas, también se introdujo por Hamm et al.
[7] con el método GRAM (registro geodésico en variedades anatómicas). Esta familia de algoritmos de propagación por etapas será cada vez más relevante a medida que la disponibilidad de bases de datos de imágenes cada vez más grandes continúe impulsando la necesidad de propagar automáticamente la segmentación, anotaciones y otra información adicional de este tipo.
Resumen de la invención
La invención se define en las reivindicaciones adjuntas.
Se proporciona un método implementado por ordenador para anotar imágenes en un conjunto de datos que comprende un primer conjunto de imágenes que inicialmente tienen anotaciones y un segundo conjunto de imágenes que inicialmente no tienen anotaciones. El método se define en la reivindicación 1.
Cada iteración realiza una propagación a través de todas las imágenes en el conjunto de datos. En particular, se hace un intento de propagar la información de todas las imágenes con anotaciones (ya sea proporcionadas inicialmente o ya determinadas por una iteración anterior) a todas las imágenes que inicialmente no tenían anotaciones (incluso si ahora han sido anotadas por una iteración anterior). Sin embargo, cabe apreciar que algunas imágenes que aún no tienen anotaciones pueden estar demasiado alejadas de aquellas que sí tienen anotaciones para recibir información propagada en la iteración actual; dichas imágenes recibirán entonces información propagada en una iteración posterior, ya que las anotaciones se difunden a través del conjunto de datos.
Cabe apreciar que la información que se está propagando puede representar cualquier forma de datos, etiquetado, etc. asociados con la imagen, ya sea una segmentación, parcelación, etiquetado de una característica, identificación de una afección patológica potencial, un campo vectorial, etc.
La determinación de la fuerza de conexión puede incluir la definición de una medida de similitud por pares entre una o más características en un par de imágenes. La medida de similitud por pares puede basarse en la similitud de intensidad entre las imágenes y/o una característica de deformación entre un par de imágenes. La similitud también puede basarse en los metadatos clínicos asociados con las imágenes, incluidos la edad, el sexo, el estado patológico, las pruebas cognitivas o biológicas (como ejemplos), lo que proporciona una técnica muy flexible y potente para evaluar la fuerza de conexión. Se apreciará que en algunas implementaciones, la fuerza de conexión se puede determinar a partir de múltiples factores.
La medida de similitud por pares puede calcularse localmente en una porción restringida de las imágenes (en lugar de globalmente a través de imágenes completas), de manera que la fuerza de conexión puede variar espacialmente a través del par de imágenes. Esta determinación de la fuerza de conexión local mejora aún más la flexibilidad y la potencia de la técnica.
La etapa de propagación se puede realizar mediante promedios ponderados, fusión de clasificador o regresión del núcleo. Se puede propagar una amplia variedad de información, incluyendo etiquetas, intensidades, campos de desplazamiento, probabilidades, estado patológico, estadísticas, vectores o una combinación de estos. (Otras implementaciones pueden propagar otros parámetros además o en lugar de los enumerados anteriormente).
La fuerza de conexión y/o la etapa de propagación de información pueden aumentarse mediante una operación de refinamiento basada en la intensidad. Esto permite la propagación de otros tipos de información entre sujetos, tal como el estado patológico.
La resistencia de conexión utilizada en la etapa de propagación de información puede aumentarse mediante una estimación de la precisión de propagación. Por ejemplo, la estimación de la precisión de propagación puede basarse en el número de iteraciones antes de que se anote una imagen; por lo tanto, las imágenes que inicialmente se anotan (o se anotan en una iteración temprana) tienen más ponderación para propagar información que las imágenes que solo se anotan mediante una iteración relativamente tardía.
La suma ponderada puede implicar ponderaciones que se basan en una distancia geodésica, de manera que las imágenes en el segundo conjunto que están más cerca de las imágenes en el primer conjunto se consideran que tienen una mayor precisión. Por ejemplo, la ponderación puede basarse en la suma de (i) el valor más pequeño de la distancia geodésica de un vecino, y (ii) la distancia por pares para todos los nodos vecinos. Tal distancia geodésica representa la distancia entre una posición dada en una imagen en el segundo conjunto y la fuente de información más cercana para esa posición en una imagen separada del primer conjunto. En otras implementaciones, las ponderaciones pueden basarse solo en la distancia por pares para todos los nodos vecinos (que son más sencillos de calcular, aunque no siempre dan tales propagaciones precisas).
El enfoque descrito en el presente documento puede utilizarse para una amplia diversidad de imágenes, incluidas imágenes bidimensionales o tridimensionales, monocromáticas, en color, etc. Además, las imágenes pueden haberse adquirido a través de varias modalidades de imagen diferentes, tales como IRM, rayos X, óptica, ultrasonidos, PET, SPECT, etc. Las imágenes se pueden haber obtenido para varios propósitos, tal como imágenes médicas, imágenes de seguridad, etc.
Por lo tanto, el enfoque descrito en el presente documento ayuda a difundir lentamente la información desde su fuente a todas las demás imágenes en una base de datos (conjunto de datos) de manera imparcial. En particular, la información se puede propagar a lo largo de una trayectoria geodésica de incrustaciones de datos locales. Estas incrustaciones locales se pueden representar como un gráfico no dirigido implícito a nivel de vóxeles, con una ponderación de reconstrucción de información basada en el núcleo térmico que utiliza tanto la similitud de la imagen local como la morfología de la imagen local como una métrica para controlar la propagación. Este enfoque no solo permite que la información (parcelaciones estructurales, atlas de tejidos, etc.) se transfiera entre imágenes anatómicamente dispares con mayor precisión, sino que también permite la estimación de mapas de distancia geodésicos que representan el grado local de confianza y la extrapolación de la información propagada. En general, dado que las ponderaciones de reconstrucción son tanto simétricas como consistentes inversas, el marco puede usarse para propagar cualquier información de cualquier sujeto (o grupo de sujetos) a todos los demás sujetos en un conjunto de datos utilizando un flujo de información imparcial.
Un enfoque de este tipo permite homogeneizar la disponibilidad de información generada manualmente en grandes bases de datos de imágenes, especialmente con respecto a imágenes médicas. Debido a la naturaleza prolongada de segmentar, parcelar y localizar manualmente puntos de referencia en imágenes médicas, estas fuentes de información tienden a ser escasas y limitadas a pequeños conjuntos de datos, y a veces morfológicamente similares. El enfoque descrito en el presente documento ayuda a propagar estas fuentes de información a imágenes morfológicamente diferentes difundiendo y mapeando la información a través de etapas intermedias. La incrustación de datos de variante espacial utiliza la morfología local y la similitud de intensidad entre imágenes para difundir información solo entre imágenes localmente similares. Por lo tanto, un enfoque de este tipo permite que cualquier forma de información (por ejemplo, segmentaciones manuales, parcelaciones estructurales, atlas de tejidos, hallazgos patológicos, etc.) se propague desde un conjunto de imágenes en una base de datos a un nuevo conjunto invisible de imágenes de una manera sólida y precisa.
En particular, la información se puede propagar a imágenes morfológicamente muy distintas difundiendo y mapeando la información a través de etapas intermedias, aumentando de este modo la robustez y la precisión. Se utiliza una incorporación de datos de variante espacial que tiene en cuenta tanto la morfología local como la similitud de intensidad entre imágenes para difundir la información solo entre imágenes localmente similares, evitando de este modo grandes errores de extrapolación. Se puede utilizar un proceso de reconocimiento iterativo para resolver el problema de difusión de información, asegurando que la variedad no sea lineal y esté completamente conectada. Tal marco también permite la caracterización de la anomalía de la imagen y la incertidumbre de la información, lo que permite la identificación de formas y apariencias atípicas, que luego se correlacionan con los hallazgos patológicos.
Un enfoque de este tipo se puede usar, por ejemplo, para el desarrollo de biomarcadores proporcionando mediciones volumétricas y tasas de cambio (por ejemplo, atrofia de la estructura, cambios en la señal de la imagen) de estructuras anatómicas, localización y delimitación de las regiones de interés para el análisis de imagen funcional (captación por PET/SPECT), clasificación de la enfermedad al observar el grado de anomalía de la imagen y en la clasificación patológica de las imágenes más similares en la base de datos.
Se puede propagar una amplia diversidad de información, incluyendo segmentaciones y anotaciones. En algunas formas de realización, los campos vectoriales pueden propagarse. Un campo vectorial de este tipo podría representar, por ejemplo, la dirección y la magnitud del movimiento (tal como el encogimiento de ciertos componentes cerebrales como resultado de la enfermedad de Alzheimer).
El enfoque descrito en el presente documento puede implementarse como un programa informático que se ejecuta en hardware de propósito general, tal como uno o más procesadores informáticos. En algunas implementaciones, al menos parte del programa informático puede ejecutarse en hardware especializado particularmente adecuado para el procesamiento de imágenes, tal como una GPU (unidad de procesamiento de gráficos). En algunas implementaciones, el enfoque descrito en el presente documento puede implementarse, al menos en parte, utilizando hardware dedicado (en lugar de software). En algunas implementaciones, la funcionalidad descrita en el presente documento puede implementarse mediante un sistema informático independiente. En otras implementaciones, la funcionalidad puede proporcionarse por (integrarse en) un sistema de imagen, por ejemplo, un escáner de IRM, un sistema de imagen por rayos X, etc.
Breve descripción de los dibujos
La Figura 1 ilustra: (i) (izquierda) el uso de una variedad implícita para la propagación de información de acuerdo con una forma de forma de realización de la invención, y (ii) (derecha) las conexiones entre los puntos de datos en la variedad implícita de acuerdo con una forma de forma de realización de la invención. La Figura 2 ilustra diversos conjuntos de datos de imagen (conocidos) utilizados en la prueba de un método de acuerdo con una forma de forma de realización de la invención.
La Figura 3 ilustra una imagen de uno de los conjuntos de datos de la Figura 2.
La Figura 4 es un gráfico que representa el rendimiento de un método de flujo de información geodésica de acuerdo con una forma de forma de realización de la invención, en comparación con el rendimiento de una técnica conocida.
La Figura 5 ilustra una imagen y la segmentación/parcelación resultante obtenida por un método de acuerdo con una forma de forma de realización de la invención.
La Figura 6 ilustra una variedad implícita (izquierda) y las conexiones entre los puntos de datos en la variedad implícita (derecha), según se aplica al diagnóstico diferencial en la demencia de acuerdo con una forma de forma de realización de la invención.
La Figura 7 es un diagrama de flujo que ilustra un método para anotar imágenes de acuerdo con una forma de forma de realización de la invención.
Descripción detallada
Métodos
En primer lugar se introduce el marco matemático y el gráfico no dirigido para el flujo de información geodésica seguido de la introducción de una métrica de distancia que describe tanto la similitud de intensidad de imagen como la similitud morfológica entre las imágenes. Finalmente, después de construir el gráfico de incrustación, la etapa de propagación de información geodésica se presenta para dos tipos de información: atributos numéricos y de etiqueta.
La incrustación de datos local implícita
Se espera que un conjunto Y con imágenes R sea el conjunto completo de datos anatómicos de valores de gris observados con la a-ésima imagen de este conjunto representada por Ya . Cada imagen Ya es un vector de tamaño Na, con su i-ésimo vóxel representado por Ya,i.
Para incrustar los datos observados dentro de una variedad, se comienza normalmente encontrando una distancia entre cada par de imágenes. Esta distancia proporciona información sobre la similitud global entre las imágenes y, posteriormente, sobre la estructura de variedad de los datos. Teóricamente, esta incrustación global supone que se puede representar el espacio abarcado por los datos completos en un espacio de baja dimensión. Sin embargo, debido a la complejidad de los datos de imagen médica, las dimensiones de la variedad pueden carecer de interpretabilidad y utilidad. Por ejemplo, Gerber et al. [8] exploraron la estructura de variedad del espacio de imágenes del cerebro y concluyeron que la primera dimensión de la variedad representa la expansión ventricular global debido a la enfermedad y el envejecimiento, mientras que el significado de la segunda dimensión se describe como "menos obvio".
De manera ideal, se desearía capturar la estructura de variedad local del cerebro en un vecindario espacialmente restringido y no la morfología cerebral global. Con una representación de variedad por vóxel, se podría describir la morfología del cerebro local y la similitud como una medida de la distancia entre dos ubicaciones mapeadas, y vecindarios respectivos, en dos imágenes diferentes. Sin embargo, debido a los requisitos computacionales y de memoria, este problema generalmente no se puede solucionar. Como ejemplo, solo para almacenar una matriz de distancia por pares para una imagen única en cada vóxel y suponiendo un conjunto de 120 imágenes vecinas con un tamaño promedio de 2003, se necesitarían aproximadamente 400 GB de memoria. Además, los requisitos de memoria crecen en proporción a R2 , donde R es el número de conjuntos de datos (imágenes). Por lo tanto, no se puede tener una representación explícita de la variedad a nivel de vóxel.
Como se describe en el presente documento, en lugar de construir una representación explícita de la variedad, se representa implícitamente la variedad a través del gráfico de vecindad local de cada punto de datos. Esto reduce enormemente la complejidad computacional y los requisitos de memoria, haciendo que el problema sea solucionable y linealmente escalable con el número de conjuntos de datos R en la base de datos. Se espera que D sea un conjunto de matrices de distancia, con la a-ésima matriz de este conjunto representado por Da. Aquí, Da es una matriz de Na x (R - 1) que describe la distancia entre la imagen a y cada una de las imágenes restantes (R - 1) en cada posición de muestra i. Más específicamente, Dâ b(i) contiene la distancia entre la i-ésima muestra de la imagen Ya y su muestra correspondiente en la imagen Yb . Ahora se presenta un umbral dt sobre estas distancias. Al hacerlo, ahora se puede construir un gráfico no dirigido donde la vecindad de cada punto de datos está restringida solo a los puntos de datos con Da ^ b (i) < dt. Cabe apreciar que el gráfico no está dirigido solo si las distancias son una semimétrica (no se requiere subaditividad). La Figura 1 (izquierda) ilustra esta variedad implícita con la vecindad definida como todos los puntos de datos dentro de una cierta distancia. Cabe apreciar que si la variedad es escasa, algunos puntos de datos podrían estar desconectados.
Como se describe en el presente documento, no se representa explícitamente el gráfico completo; más bien, para resolver el problema de difusión de información en una ubicación determinada, solo se hace un seguimiento de la vecindad del gráfico en esa ubicación específica. Esto se ilustra en la Figura 1 (derecha), que muestra un diagrama que representa las conexiones y distancias observadas y no observadas desde el punto de vista del punto de datos a. El ámbito de las observaciones (las conexiones azules) desde el punto de datos a en negrita está limitado por sus nodos vecinos directos con distancias por debajo de dt.
Bajo esta suposición de gráfico no dirigido, se usa una función de degradación del núcleo de calor Wa ^ b (i) para difundir la información [9], Este núcleo se define como:
Figure imgf000006_0001
siendo t una temperatura del núcleo de calor que determinará la velocidad y la distancia que la información puede difundir. En el presente caso, se establece dt = t, lo que significa que la elección de t determinará tanto la distancia máxima recorrida por la información como la cantidad de difusión de información que se produce en cada iteración.
La métrica de distancia
La función de degradación del núcleo de calor se basa en el supuesto de que se puede calcular una distancia entre dos nodos en el gráfico. Esta distancia debe ser al menos semimétrica, respetando tanto la coincidencia como los axiomas de separación y la simetría. En un marco de imágenes médicas, y más específicamente en la neuroimagen, la distancia local entre las imágenes debe tener en cuenta tanto la morfología local como la similitud de la imagen local. Para lograr este objetivo, Gerber et al. [8] proponen el uso de transformaciones de coordenadas como una métrica de distancia que informa sobre la morfología del objeto. Estas transformaciones de coordenadas mapean una imagen Ya con respecto a una imagen Yb encontrando la transformación óptima Ta^ b que minimiza alguna función de coste. Para que sea una semi-métrica, esta transformación de coordenadas debe ser simétrica, inversaconsistente y difeomórfica. Como se describe en el presente documento, se usa una variante simétrica de un algoritmo de registro de forma libre no rígido como se describe en [10]. Bajo las restricciones de simetría y difeomorfismo, la transformación Ta^ b = T-1b^ a y Ta^ b ◦ Tb^ a = Id , siendo T'1 la inversa de la transformación, siendo ◦ el operador de composición e Id la transformación de identidad.
Para eliminar el componente afín local que varía suavemente de la transformación que caracteriza las diferencias de forma anatómicas globales, se elimina el componente de baja frecuencia de la transformación. A partir de la versión de alta frecuencia restante de la transformación, se puede encontrar entonces el campo de desplazamiento Fa^ b que describe cuánto tiene que moverse un punto i en Ya para coincidir con el punto j correspondiente en Yb .
Aunque el campo de desplazamiento determinado como anteriormente describe las diferencias morfológicas entre los cerebros, también se combina con una métrica de similitud de intensidad para evaluar la similitud local entre las imágenes después de la transformación [11]. Este término de similitud se usa para caracterizar tanto las diferencias locales en la apariencia del tejido debido a la patología (por ejemplo, la sustancia blanca dañada en la demencia) como también cualquier posible error en el registro local. La similitud local entre una imagen Ya y una imagen Yb transformada por Tb^ a , representada por La^ b , se puede calcular como la suma local de diferencias al cuadrado (LSSD) entre la intensidad en estas imágenes, utilizando un núcleo cúbico de spline B como una función de suavizado local. Se combinan las dos métricas juntas al establecer Da (i, b) = oLa^ b (i) (1-a) Fa^ b (i), siendo a una ponderación relativa, de manera que tanto un desplazamiento bajo como un valor bajo de LSSD son necesarios para obtener una baja distancia Da (i, b) entre imágenes. En el enfoque descrito en el presente documento, a = 0,5, pero otras implementaciones pueden usar valores diferentes, dependiendo de las circunstancias particulares. Por ejemplo, las imágenes de intensidad Y pueden tener una puntuación z antes de calcular L para equilibrar la influencia de L y F en la métrica.
La métrica de distancia también se puede extender para alojar metadatos para las imágenes. Por ejemplo, uno o más parámetros de metadatos pueden estar disponibles para una imagen, tal como la identidad del sujeto, la edad/género/origen étnico del sujeto, información patológica, modalidad de imagen, etc. Esto puede ser útil cuando, por ejemplo, la morfología cambia con la edad, de manera que para un par de imágenes, la edad respectiva de los sujetos proporciona una indicación de cuán similares son probablemente las morfologías respectivas. Como otro ejemplo, la propagación podría estar restringida o prohibida desde una imagen que representa una patología a una imagen que representa una patología muy diferente. Se apreciará que se pueden combinar múltiples factores, según sea apropiado, para determinar la métrica de distancia.
Estimación de la distancia geodésica
Cuando se difunde información a través del gráfico implícito, la Ecuación (1) asume que la distancia entre los nodos, y por lo tanto, la calidad de la información disponible, solo depende de su distancia por pares Da^ b (i). Sin embargo, los nodos que están más cerca de la fuente de información generalmente deben tener información más precisa (por ejemplo, segmentación), ya que el error de extrapolación será menor. Por consiguiente, en algunas formas de realización, esta métrica de precisión también se usa para procesos de flujo de información.
Para hacer esto, se introduce un vector Ga (i) para representar una distancia geodésica entre la posición i en la imagen a y la fuente de información más cercana en una imagen separada, concretamente, la imagen b. Se espera que K sea un conjunto de todas las imágenes que son fuentes de información, es decir, pueden tener información aumentativa predefinida. Suponiendo que la distancia euclidiana Ga (i) = 0Va s K, entonces la distancia geodésica en la posición tGb (i) se puede calcular como la ruta más corta desde todos a s K siguiendo la estructura implícita del gráfico.
En el marco del flujo de información geodésica, debido a la naturaleza implícita del gráfico, no se tiene acceso a la estructura completa del gráfico. Por lo tanto, no se puede estimar directamente Ga (i), sino que Ga (i) se puede obtener resolviendo iterativamente en cada vóxel de cada imagen a i K por
Ga(i) = argmin (cb(Tâ b(i)) + 0a-.t>(O) ParB b e Dâ b(i) < dt (Ec. a i >
En otras palabras, la distancia geodésica en el vóxel (posición) i y la imagen a es igual al valor más pequeño de la distancia geodésica del vecino, G b ( T a ^ b ( i ) ) , más la distancia por pares, D a ^ b ( i ) para todos los nodos vecinos. Cabe apreciar que para todos a i K , la distancia geodésica se establece inicialmente en G a ( i ) = .
Se puede reformular la Ecuación (1) teniendo en cuenta la Ecuación 1A para dar:
C (Ch(Tu-h(0)+Pa-h (0 )
Wa-*(¿) = Y 1 Da->b(í) < dt Ec. (1B)
^ 0 de lo contrario
Si i es un nodo no resuelto o desconectado, entonces Wa ^ b (i)=0, ya que e-=0. De manera similar, un nodo de origen i tendrá una ponderación dependiente de D a ^ b ( i ) solamente. Dado que una mayor proximidad a la fuente de información da como resultado mayores ponderaciones, este enfoque para reconstruir la información propagará la información más rápido que si G = 0, análogo a una propagación de frente de onda en marcha rápida.
Cabe apreciar que la Ecuación 1B proporciona una formulación alternativa para la función de degradación del núcleo de calor ( W ), en comparación con la formulación de la Ecuación 1. Puede adoptarse cualquiera de las formulaciones para anotar imágenes como se describe en el presente documento, aunque la Ecuación 1B puede proporcionar anotaciones más precisas (y más rápidas) en algunas circunstancias.
Flujos de información geodésica
Las dos secciones anteriores han definido el gráfico de vecindad y la métrica de distancia. Esta sección aprovecha la estructura del gráfico para introducir el concepto de propagación de información entre nodos vecinos del gráfico. Se espera que I sea un conjunto de vectores, con el a-ésimo vector de este conjunto representado por Ia. Cada vector la tiene su i-ésimo elemento representado por Ia ,, que representa la información asociada en la ubicación i para la imagen Ya. Suponiendo que la información que se va a propagar solo está disponible en un subconjunto de imágenes dentro de la base de datos completa, solo se definirán algunos de los vectores la. Ahora, se espera que un vector indicador Ka, indexado por Ka,i, caracterice el estado de la información en la ubicación la,i. Aquí, Ka,¡ se ajusta a 2 si la,i es una fuente de información, se ajusta a 1 si la información se ha difundido y ha alcanzado la ubicación la,i, o se ajusta a 0 si la información no existen en la ubicación la,i. Como el ámbito de las observaciones en cada ubicación espacial está limitado por sus vecinos más cercanos, el flujo de datos se aproxima mediante una suma ponderada normalizada de la información disponible dentro del vecindario. Por lo tanto:
Figure imgf000008_0001
siendo j la coordenada transformada espacialmente i en el espacio de la imagen lb , mapeada utilizando la transformación descrita anteriormente. Por lo tanto, el flujo de información se rige por las ponderaciones derivadas del núcleo de calor Wa^ b (i). Si el conjunto b s (Kb,j > 0) no está vacío, la información en lb,j puede propagarse entonces a la,. En este caso, Ka,i se establece en 1, de lo contrario, Ka,i se establece en 0. Cabe apreciar que la Ecuación (2) solo es válida para la propagación de datos de coma flotante como un atlas probabilístico. La misma ecuación se puede reformular en un esquema de fusión de etiquetas ponderadas haciendo que la,¡ sea igual a p(la,i, l), representando la probabilidad de que la ubicación i en la imagen a tenga la etiqueta l, y haciendo que lb,j sea igual a p(lb,j, l), que representa la probabilidad de que la ubicación j tenga la etiqueta l en la imagen b. La ecuación (2) se resuelve de forma iterativa para todas las muestras en las que Ka,i < 2, hasta que todas se marcan como resueltas, es decir, Ka= 1. El número de veces la,i no se pudo resolver, porque Kb j > 0 V b es un conjunto vacío, representa el número necesario de etapas a través de la ruta geodésica del gráfico para transportar la información desde su fuente. Este número de etapas se puede ver como una distancia que representa la cantidad de extrapolación de información, donde una extrapolación más grande debería dar como resultado una menor precisión de propagación. Finalmente, dado que la temperatura t determina el tamaño de la vecindad y, en consecuencia, la existencia de una conexión desde cada fuente de información a todos los objetivos, el flujo de información geodésica se resuelve varias veces para varios valores de t. En una implementación, esta temperatura t se reduce de 5 a 1 con decrementos de 0,5. De manera similar a un proceso de reconocimiento, la información a la temperatura más baja posible se guarda como la respuesta, ya que la distancia recorrida por cada etapa de extrapolación es la más baja. En la Ecuación (2), el vector indicador Kb sirve para rastrear las imágenes a las que se debe propagar la información. Sin embargo, también se puede considerar como indicativo de la precisión estimada de la información (anotación) dentro de Ib . Por lo tanto, en la implementación particular anterior, K = 2 indica una imagen con información original (muy precisa), mientras que K = 1 indica una imagen con información propagada (menos precisa). En otras implementaciones, K puede establecerse en otros valores para dar una estimación más matizada de la precisión de la información propagada. Por ejemplo, si N es el número de iteraciones antes de que una imagen reciba información propagada (como se mencionó anteriormente), entonces K podría establecerse en 1/N (o en alguna otra función que disminuya a medida que N aumenta). Otra posibilidad es que K refleje la precisión ponderada de sus vecinos directos, por lo que si una imagen que recibe información de imágenes que a su vez se considera que tienen información relativamente precisa, entonces se considera que la imagen receptora tiene información relativamente precisa.
Figure imgf000009_0001
La Ecuación (3) es una modificación de la Ecuación (2) donde, sin pérdida de generalidad, Kb j se considera un valor entre 0 y 1 para representar la precisión en la ubicación Ia,i, donde 0 indica que no hay información disponible (aún) para esta imagen, 1 indica que la imagen se anotó inicialmente en esa ubicación, y los valores intermedios indican la precisión estimada de la información que se ha propagado hasta ahora a esta ubicación de la imagen. Por consiguiente, la propagación de la información de la Ecuación (3) no solo es ponderada por la fuerza de conexión (W), sino también por la precisión estimada de la información de propagación (K), es decir, la propagación de la imagen B a la imagen A (para un par de ubicaciones dado) es más fuerte si (i) la fuerza de conexión (W) entre las ubicaciones en B y A es relativamente alta, y (ii) si la precisión estimada (K) de la información en la ubicación en la imagen B es relativamente alta.
Validación
Los datos utilizados en este trabajo, representados en la Figura 2, comprenden dos conjuntos: (i) 30 controles jóvenes con parcelación estructural asociada de 83 estructuras clave [3] (http://www.brain-development.org); y (ii) 90 sujetos de la base de datos ADNI (http://adni.loni.ucla.edu), subdivididos en 30 controles, 30 pacientes con deterioro cognitivo leve (MCI) y 30 pacientes con enfermedad de Alzheimer (EA) con segmentaciones manuales asociadas del cerebro. La Figura 3 muestra un conjunto de datos de la base de datos ADNI junto con la parcelación estructural asociada. En particular, la parte superior izquierda indica una imagen de RM resonancia magnética de un sujeto patológicamente normal, mientras que la parte superior derecha indica una imagen de RM de un sujeto con enfermedad de Alzheimer. La parte inferior izquierda indica una parcelación de la imagen del cerebro desde la parte superior izquierda a las subestructuras de composición, mientras que la parte inferior derecha indica una máscara cerebral (en efecto, el área identificada como cerebro) superpuesta en la imagen del cerebro desde la parte superior derecha.
El enfoque descrito en el presente documento ayuda a homogeneizar las bases de datos bajo el supuesto de que la información adicional solo está disponible en un subconjunto de los datos. De estas fuentes de información adicional, la medición de la precisión de extrapolación de la información está necesariamente limitada por la variabilidad anatómica y patológica dentro del conjunto de datos completo y por el rango de segmentaciones disponibles. Además, las fuentes más complejas de información adicional, como los 30 controles jóvenes con parcelaciones cerebrales completas, no están disponibles en los sujetos patológicos, lo que hace que la validación sea anecdótica para las morfologías no probadas.
La validación descrita en el presente documento tiene dos componentes. En primer lugar, la precisión de superposición de la propagación de información de etiquetas múltiples se puede estimar y comparar con MAPER [4] mediante un enfoque de dejar uno fuera en los 30 controles jóvenes. En segundo lugar, la precisión de la extrapolación de la información se puede caracterizar mediante la propagación de las segmentaciones cerebrales del grupo de control de ancianos a los pacientes con MCI y EA.
Precisión de propagación de etiquetas múltiples: La precisión de la información de propagación a través de una ruta geodésica se comparó con MAPER [4], un método de fusión de información directa basado en la votación por mayoría. Dado que el número de parcelaciones disponibles para la validación es limitado, solo se realizó una validación cruzada de dejar uno fuera en los 30 controles jóvenes que tienen parcelaciones cerebrales manuales. Cabe señalar que la disponibilidad limitada de segmentaciones restringe el rango de variabilidad morfológica en la propagación y, por lo tanto, no es totalmente representativo del rendimiento al segmentar sujetos morfológicamente diferentes.
La puntuación Dice [13] se usó como una medida de precisión. Las puntuaciones medias de Dice por estructura para la validación cruzada de dejar uno fuera se muestran en la Figura 4 para la propagación directa y geodésica de una máscara cerebral que representa una segmentación del cerebro, proporcionando una localización píxel a píxel del cerebro. De las 83 estructuras, 15 estructuras tuvieron una puntuación de Dice significativamente más alta utilizando el enfoque descrito en el presente documento (flujo de información geodésica/propagación geodésica) en comparación con MAPER, mientras que solo dos estructuras (giro lingual y giro parietal superior) se segmentaron mejor en MAPER. La puntuación media de Dice sobre todas las estructuras y todos los pacientes para el método propuesto (0,8197) era significativamente superior (p < 10-4) que en MAPER (0,8089). Se presentan detalles adicionales de estos resultados se presentan en la Tabla 1 a continuación, que muestra el coeficiente de Dice medio para un conjunto de estructuras clave, comparando el método descrito en el presente documento (flujo de información geodésica) con la técnica MAPER [4]. (Se ha de tener en cuenta que la Tabla 1 solo incluye un número limitado de estructuras a modo de ejemplo).
Tabla 1
Figure imgf000010_0001
Exactitud de extrapolación de información: En la subsección anterior, la precisión de propagación de información a través de una ruta geodésica se limitó a un conjunto de sujetos morfológicamente similares y, por lo tanto, dicha validación no reflejará la capacidad de extrapolar información a sujetos anatómicamente dispares. Por lo tanto, la precisión de extrapolación de información se evalúa utilizando solo un subconjunto (el grupo de control de ancianos) de todas las segmentaciones cerebrales manuales, un conjunto de datos agrupados morfológicamente, para segmentar tanto el grupo MCI como EA. El enfoque descrito en el presente documento, utilizando la propagación geodésica, se compara con un algoritmo de propagación directa basado en el algoritmo de votación mayoritaria ponderada localmente con una ponderación exponencial inversa, según lo propuesto por Yushkevich et al. [12]. Los resultados se presentan en la Figura 4, con la precisión de la segmentación medida de nuevo utilizando la similitud de Dice. La puntuación media (estándar) de Dice para el método geodésico descrito en el presente documento fue de 0,940(0,009) y 0,947(0,008) para los grupos de EA y MCI respectivamente, mientras que para el método de propagación directa, la puntuación media (estándar) de Dice fue de 0,934(0,009) y 0,942(0,008) para los grupos de EA y MCI respectivamente. Esto representa un aumento estadísticamente significativo (p <10-4) en la precisión de la segmentación de acuerdo con una prueba t pareada de dos colas para la comparación estadística. (Se ha de tener en cuenta que no se deben comparar estos resultados con otros métodos de segmentación cerebral debido a la falta de procesamiento posterior y al tamaño limitado del conjunto de entrenamiento).
La Figura 5 representa un ejemplo de la propagación tanto de la parcelación estructural como de la segmentación cerebral para un sujeto con EA altamente atrofiado (ID: 1281) de la base de datos de ADNI utilizando el enfoque descrito en el presente documento. En particular, la fila superior de la Figura 5 muestra imágenes de RM desde diferentes ángulos de un paciente con EA. La fila central de la Figura 5 muestra una máscara cerebral superpuesta en la imagen correspondiente de la fila superior para indicar la ubicación del cerebro (esta imagen se omite en la columna de la izquierda). La fila inferior de la Figura 5 muestra la parcelación resultante en las subestructuras de composición del cerebro para la imagen correspondiente de la fila superior, obtenida mediante la técnica de propagación de información descrita en el presente documento. Se ha de tener en cuenta la segmentación correcta del ventrículo y la separación suave de la materia gris profunda.
El método de procesamiento de imágenes descrito en el presente documento se puede aplicar, por ejemplo, en el contexto de la demencia, donde existen importantes desafíos para mejorar el diagnóstico temprano. Los biomarcadores de imágenes cuantitativas pueden desempeñar un papel transformador para abordar estos desafíos. La imagen estructural tradicional se recomienda en las guías clínicas, pero los biomarcadores cuantitativos de imagen por RM ayudan a añadir confianza a un diagnóstico. Sin embargo, solo una minoría de personas que presuntamente padecen demencia se someten a un escáner de RM en la actualidad, y una pequeña fracción se somete a un análisis cuantitativo de la exploración de RM, que sigue siendo una tarea que requiere mucha mano de obra y que generalmente no está disponible fuera de los centros altamente especializados. Por lo tanto, la adición de imágenes de RM cuantitativa automatizada ofrece la posibilidad de transformar significativamente el valor de la imagen para acelerar la toma de decisiones clínicas, reduciendo potencialmente el número de visitas repetidas en clínicas de memoria, y mejorando la calidad de vida al hacer que los pacientes apropiados reciban tratamientos sintomáticos más temprano.
Tal imagen de RM cuantitativa automatizada implica la identificación de combinaciones de datos de imágenes y sin imágenes (por ejemplo, edad, educación, puntuación cognitiva, muestreo de LCR, genotipo APOE4) para proporcionar una mejor predicción de la progresión, considerando la firma de imagen multimodal de cada enfermedad específica, teniendo en cuenta la incertidumbre potencial que proviene de los datos. En particular, los datos multimodales, incluyendo la información sin imágenes, de un paciente individual pueden compararse con cohortes que son compatibles morfológicamente con el sujeto en cuestión. Esto proporciona un medio de normalización de los biomarcadores extraídos y se puede utilizar para estimar la certeza/incertidumbre del diagnóstico.
El marco del flujo de información geodésica (GIF) descrito en el presente documento aborda los desafíos de complejidad computacional de las técnicas existentes, utilizando morfología local en lugar de global, y permite que se combinen múltiples fuentes de características. Los datos (por ejemplo, segmentaciones y clasificaciones patológicas) se propagan entre imágenes morfológicamente distintas difundiendo y mapeando la información local a través de etapas intermedias. Este marco reconoce que comparar imágenes morfológicamente similares es una tarea relativamente sencilla, mientras que hacer lo mismo para sujetos morfológicamente diferentes es mucho más propenso a error [21]. El marco GIF utiliza una estructura gráfica para conectar cada ubicación (píxel o vóxel) en una imagen a las ubicaciones correspondientes en las imágenes más similares localmente en una base de datos [14]. Por lo tanto, cada imagen puede conectarse a un conjunto diferente de sujetos en cada posición espacial, ya que cada ubicación en el cerebro podría pertenecer a un subgrupo morfológico diferente (por ejemplo, diferentes patrones de surco, formas subcorticales y volúmenes). En este marco, la existencia de una conexión de gráfico en una determinada ubicación entre un par de imágenes depende de una ponderación de borde de gráfico. La ponderación de borde de gráfico representa el grado de proximidad morfológica y patológica entre dos imágenes, combinando tanto características de imágenes clínicas (por ejemplo, edad, educación, puntuación cognitiva, APOE4) como locales (por ejemplo, intensidad, correlación de señal, información mutua, mapas de desplazamiento, captación de PET de amiloide).
Las potentes herramientas clásicas para la caracterización de gráficos se pueden aplicar directamente al marco GIF.
Las características de gráficos como el pequeño mundo del gráfico, la robustez de la red, la densidad del gráfico y las distancias geodésicas del gráfico pueden proporcionar conocimientos sobre el grado de agolpamiento morfológico, la presencia de conexiones espurias, la incertidumbre debida a la falta de datos y la presencia de morfologías atípicas y sujetos atípicos. El marco GIF también permite el aprendizaje por refuerzo, donde el sujeto sometido a pruebas se puede añadir al gráfico dependiendo del grado de incertidumbre de la clasificación, dando como resultado una mejora en la precisión general de la clasificación y la cobertura morfológica del gráfico.
La Figura 6 ilustra el marco generalizado del flujo de información geodésica (GIF), análogo a la Figura 1, aplicado al diagnóstico diferencial en la demencia, en particular que ilustra la variabilidad local del surco en la forma y el espesor cortical. Como se muestra en la parte derecha de la Figura 6, cada imagen en la base de datos está conectada localmente a los sujetos más parecidos morfológicamente a través de una estructura de gráfico. Esta estructura gráfica se puede utilizar entonces para transferir información entre pares de imágenes. Como se muestra en la parte izquierda de la Figura 6, si se desconoce el estado patológico de una imagen, se puede reconstruir esa información faltante al observando el vecindario del gráfico inmediato y las ponderaciones de similitud D.
La Figura 7 es un diagrama de flujo que ilustra un método para propagar información de acuerdo con una forma de realización de la invención. El método comienza con la determinación de correspondencias espaciales para todos los pares de imágenes en el conjunto de datos, en donde cada correspondencia espacial representa un mapeo de una ubicación en una primera imagen con respecto a una ubicación correspondiente en una segunda imagen (110). En otras palabras, se encuentra una transformación que minimiza una función de coste con respecto a un área local de una imagen que mapea un área local de otra imagen. Esta transformación puede basarse (al menos en parte) en la morfología del objeto que se está obteniendo en imágenes, y proporciona una forma de registro (local) entre las dos imágenes en cuestión.
A continuación, para cada mapeo de ubicaciones por pares, se calcula una fuerza de conexión entre la ubicación en la primera imagen y la ubicación correspondiente en la segunda imagen (transformada) (120). Esta fuerza de conexión se basa en una métrica de distancia (similitud por pares) con respecto a las ubicaciones de imagen correspondientes y generalmente tiene en cuenta tanto la morfología local como la similitud de imagen local. La importancia relativa o la contribución de estos dos factores se puede ajustar según corresponda. Además, la similitud por pares también puede reflejar los metadatos disponibles para las imágenes, es decir, la similitud por pares puede mejorarse si los metadatos indican algún punto en común entre las dos imágenes. Por ejemplo, los metadatos pueden indicar que dos imágenes son del mismo sujeto, relacionarlas con sujetos de edad similar, constitución similar y/o del mismo género, relacionarlas con una patología similar, que se obtuvieron utilizando una modalidad de imagen similar, relacionarlas con una postura similar, etc. Se apreciará que los parámetros de metadatos (si los hubiera) utilizados para determinar la similitud pueden depender del parámetro o parámetros disponibles para las imágenes en cuestión, el tipo particular de imágenes, etc.
Habiendo determinado las fuerzas de conexión entre las ubicaciones, la información se propaga iterativamente a través de imágenes en el conjunto de datos usando las fuerzas de conexión de los mapeos como ponderaciones para propagar la información (130). La información propagada se utiliza para proporcionar anotaciones a las imágenes que inicialmente no tienen anotaciones. Al determinar las propagaciones, las fuerzas de conexión pueden aumentarse mediante una estimación de la precisión de la propagación. Esta estimación puede ser relativamente sencilla, por ejemplo, en función de si la propagación es a partir de una imagen que se anotó originalmente en comparación con una imagen que se anotó posteriormente por la información de propagación. En otras implementaciones, se puede hacer una estimación más sofisticada de la estimación de propagación; por ejemplo, la precisión de propagación estimada para una ubicación de imagen puede disminuir a medida que se requieren más iteraciones para anotar esa ubicación de imagen.
Cabe apreciarse que cada iteración implica determinar la propagación de información en todo el conjunto de datos. Por ejemplo, se supone que existen las imágenes A-Z, y que A-F están anotadas inicialmente. La primera iteración puede conducir a la anotación adicional de las imágenes G-L, basándose en la información propagada de las imágenes A-F. En la segunda iteración, la información se propaga desde las imágenes A-L. Esto conduce a (se dice) que las imágenes M-V sean recientemente anotadas. Además, las imágenes G-L se reanotan, con valores potencialmente diferentes de la primera iteración; esto se debe a que la imagen L (por ejemplo), ahora recibe información propagada de las imágenes A-K, en lugar de la A-F como en la primera iteración. Después de cada iteración, se realiza una prueba (140) para determinar si se debe realizar una iteración adicional. En el presente ejemplo, dado que las imágenes W-Z deben anotarse, se realiza una tercera iteración. Suponiendo que esto propaga información a las imágenes W-Z (así como reanotando las imágenes G-V), entonces el procesamiento puede terminar, con todas las imágenes anotadas ahora.
Por consiguiente, el enfoque descrito en el presente documento proporciona un método en el que la información se propaga geodésicamente a través de un gráfico de vecindario implícito local. La aplicación del método (a modo de ejemplo) a la parcelación estructural y la propagación de la segmentación cerebral han demostrado ventajas significativas en comparación con los métodos existentes.
Se han descrito anteriormente diversas formas de realización de la invención. El experto apreciará que las características de estas formas de realización pueden combinarse entre sí según sea apropiado, o modificarse de acuerdo con las circunstancias particulares de cualquier aplicación dada. El alcance de la invención se define por las reivindicaciones adjuntas y sus equivalentes.
Bibliografía
1. Rohlfing, T., Russakoff, D.B., Maurer, C.R.: Performance-based classifier combination in atlas-based image segmentation using expectation-maximization parameter estimation. IEEE TMI 23(8) (August 2004) 983-994
2. Aljabar, P., Heckemann, R.A., Hammers, A., Hajnal, J.V., Rueckert, D.: Multi-atlas based segmentation of brain images: atlas selection and its effect on accuracy. Neurolmage 46(3) (July 2009)726-738
3. Hammers, A., Chen, C., Lemieux, L.: Statistical neuroanatomy of the human inferior frontal gyrus and probabilistic atlas in a stereotaxic space. HBM (2007)
4. Heckemann, R.A., Keihaninejad, S., Aljabar, P.: Improving intersubject image registration using tissueclass information benefits robustness and accuracy of multi-atlas based anatomical segmentation. Neurolmage (2010)
5. Cardoso, M.J., Modat, M., Keihaninejad, S., Cash, D., Ourselin, S.: Multi-STEPS: Multi-label Similarity and Truth Estimation for Propagated Segmentations. MM- BIA (January 2012) 153-158
6. Wolz, R., Aljabar, P., Hajnal, J.V., Hammers, A., Rueckert, D., Alzheimer's Disease Neuroimaging Initiative: LEAP: learning embeddings for atlas propagation. Neurolmage 49(2) (January 2010) 1316-1325 7. Hamm, J., Ye, D.H., Verma, R., Davatzikos, C.: GRAM: A framework for geodesic registration on anatomical manifolds. MedIA 14(5) (October 2010) 633-642
8. Gerber, S., Tasdizen, T., Joshi, S., Whitaker, R.: On the manifold structure of the space of brain images. Medical Image Computing and Computer-Assisted Intervention 12 (2009) 305-312
9. Kondor, R.I., Lafferty, J.: Diffusion kernels on graphs and other discrete input spaces. ICML (January 2002)
10. Marc Modat, Manuel Jorge Cardoso, Pankaj Daga, David M. Cash, Nick C. Fox, Sébastien Ourselin, Inverse-Consistent Symmetric Free Form Deformation. 79-88, WBIR 2012
11. Souvenir, R., Pless, R.: Image distance functions for manifold learning. Image and Vision Computing 25(3) (March 2007) 365-373
12. Yushkevich, P.A., Wang, H., Pluta, J., Das, S.R., Craige, C., Avants, B.B., Weiner, M.W., Mueller, S.: Nearly automatic segmentation of hippocampal subfields in in vivo focal T2-weighted MRI. Neurolmage 53(4) (December 2010) 1208-1224
13. Dice, L.: Measures of the amount of ecologic association between species. Ecology 26(3) (1945) 297­ 302
14. Cardoso, 2012 MICCAI
16. Ashburner et al., 1999 HBM
17. Ashburner et al., 2000 Neurolmage
18 Kloppel et al., 2008 Brain
19. Barnes et al., 2004 Neuroimage
20. Ferrarini et al., 2009 Journal of Alzheimer's Disease
21. Baloch et al., 2009 Neuroimage
22. Hamm et al., 2010 Medical Image Analysis
23. Cuingnet et al., 2011 Neuroimage
24. Heckemann et al., 2006 Neuroimage
25. Artaechevarria et al., 2009 IEEE TMI
26. Coupé et al., 2012 Neuroimage

Claims (15)

REIVINDICACIONES
1. Un método implementado por ordenador para anotar imágenes en un conjunto de datos que comprende un primer conjunto de imágenes que inicialmente tienen anotaciones y un segundo conjunto de imágenes que inicialmente no tienen anotaciones, comprendiendo el método las etapas de:
determinar (110) correspondencias espaciales para todos los pares de imágenes, Ya , Yb, en el conjunto de datos, en los que cada correspondencia espacial representa un mapeo de una ubicación Yai en una primera imagen Ya con respecto a una ubicación correspondiente Ybj en una segunda imagen Yb;
para cada mapeo, calcular una métrica de distancia Da-b(i) entre una ubicación Yai de una imagen Ya y su ubicación correspondiente Ybj en la imagen Yb usando una medida de similitud por pares entre una o más características en el par de imágenes Ya e Yb que se calcula localmente en una porción restringida del par de imágenes, de tal forma que la fuerza de conexión sea espacialmente variante en un par de imágenes; definir un gráfico vecinal local para cada ubicación en cada imagen, en el que los nodos del gráfico comprenden la ubicación Yai en la imagen Ya y las ubicaciones correspondientes Ybj en las imágenes Yb para las que la métrica de distancia Da-b(i) es menor que un umbral ajustado dt , y determinar (120) las fuerzas de conexión Wa-b(i) entre los nodos del gráfico utilizando la métrica de distancia Da-b(i); y propagar de forma iterativa la información (130) a través del gráfico utilizando: (i) las fuerzas de conexión y (ii) una estimación de la precisión de la información que se está propagando, como ponderaciones para propagar la información, en donde la información propagada se utiliza para proporcionar anotaciones a imágenes que inicialmente no tienen anotaciones, y en donde cada iteración realiza una propagación a través de todas las imágenes en el segundo conjunto.
2. El método de la reivindicación 1, en el que la medida de similitud por pares se basa en la similitud de intensidad entre las imágenes.
3. El método de la reivindicación 1 o 2, en el que la medida de similitud por pares se basa en una característica de deformación entre un par de imágenes.
4. El método de cualquier reivindicación anterior, en el que la medida de similitud por pares se basa en metadatos clínicos, incluidos la edad, el género, el estado patológico, las pruebas cognitivas o biológicas.
5. El método de cualquier reivindicación anterior, en el que la etapa de propagación se realiza mediante promedios ponderados, fusión de clasificador o regresión del núcleo.
6. El método de cualquier reivindicación anterior, en el que la etapa de propagar la información comprende propagar etiquetas, intensidades, probabilidades, estado patológico, estadísticas, vectores, campos de desplazamiento o una combinación de estos.
7. El método de cualquier reivindicación anterior, en el que la fuerza de conexión y/o la etapa de propagación de información se aumenta mediante una operación de refinamiento basada en la intensidad.
8. El método de cualquier reivindicación anterior, en el que la estimación de la precisión de la información que se está propagando desde una imagen se basa en el número de iteraciones antes de que se anote la imagen.
9. El método de cualquier reivindicación anterior, en el que la estimación de la precisión de la información que se está propagando se basa en una suma ponderada normalizada de la información disponible en las imágenes que están contiguas en el gráfico.
10. El método de la reivindicación 9, en el que la suma ponderada implica ponderaciones que se basan en una distancia geodésica, de manera que las imágenes en el segundo conjunto que están más cerca de las imágenes en el primer conjunto se consideran que tienen una mayor precisión.
11. El método de la reivindicación 10, en el que la distancia geodésica representa la distancia entre una posición dada en una imagen en el segundo conjunto y la fuente de información más cercana para esa posición en una imagen separada del primer conjunto.
12. El método de la reivindicación 10 u 11, en el que la ponderación se basa en la suma de (i) el valor más pequeño de la distancia geodésica de un vecino, y (ii) la distancia por pares para todos los nodos vecinos en el gráfico.
13. El método de cualquier reivindicación anterior, en el que un par de imágenes representa diferentes propiedades del mismo objeto, y/o en el que las imágenes son de diferentes sujetos, diferentes patologías, diferentes puntos temporales del mismo sujeto, o cualquier combinación de estos.
14. Un programa de ordenador que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador realice todas las etapas del método de cualquier reivindicación anterior.
15. Un sistema informático para anotar imágenes en un conjunto de datos que comprende un primer conjunto de imágenes que inicialmente tienen anotaciones y un segundo conjunto de imágenes que inicialmente no tienen anotaciones, estando configurado el sistema informático para realizar todas etapas del método de la reivindicación 1.
ES13771199T 2012-09-28 2013-09-27 Un sistema y método para anotar imágenes propagando información Active ES2701095T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1217372.0A GB201217372D0 (en) 2012-09-28 2012-09-28 A system and method for annotating images by propagating information
US201261721640P 2012-11-02 2012-11-02
PCT/GB2013/052525 WO2014049368A1 (en) 2012-09-28 2013-09-27 A system and method for annotating images by propagating information

Publications (1)

Publication Number Publication Date
ES2701095T3 true ES2701095T3 (es) 2019-02-20

Family

ID=47225358

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13771199T Active ES2701095T3 (es) 2012-09-28 2013-09-27 Un sistema y método para anotar imágenes propagando información

Country Status (6)

Country Link
US (1) US9619890B2 (es)
EP (1) EP2901417B1 (es)
DK (1) DK2901417T3 (es)
ES (1) ES2701095T3 (es)
GB (1) GB201217372D0 (es)
WO (1) WO2014049368A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9874749B2 (en) 2013-11-27 2018-01-23 Magic Leap, Inc. Virtual and augmented reality systems and methods
US10180734B2 (en) 2015-03-05 2019-01-15 Magic Leap, Inc. Systems and methods for augmented reality
US10838207B2 (en) 2015-03-05 2020-11-17 Magic Leap, Inc. Systems and methods for augmented reality
NZ735465A (en) 2015-03-05 2021-07-30 Magic Leap Inc Systems and methods for augmented reality
JP6676299B2 (ja) * 2015-07-21 2020-04-08 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
KR20180090355A (ko) 2015-12-04 2018-08-10 매직 립, 인코포레이티드 리로컬리제이션 시스템들 및 방법들
KR20210025721A (ko) 2016-08-02 2021-03-09 매직 립, 인코포레이티드 고정-거리 가상 및 증강 현실 시스템들 및 방법들
US10812936B2 (en) 2017-01-23 2020-10-20 Magic Leap, Inc. Localization determination for mixed reality systems
CN110419061B (zh) 2017-03-17 2023-09-29 奇跃公司 混合现实系统及使用该系统生成虚拟内容的方法
US10762598B2 (en) 2017-03-17 2020-09-01 Magic Leap, Inc. Mixed reality system with color virtual content warping and method of generating virtual content using same
KR102366140B1 (ko) 2017-03-17 2022-02-21 매직 립, 인코포레이티드 가상 콘텐츠 워핑을 갖는 혼합 현실 시스템 및 이를 사용하여 가상 콘텐츠를 생성하는 방법
EP3486674A1 (en) * 2017-11-17 2019-05-22 Koninklijke Philips N.V. Artificial intelligence-enabled localization of anatomical landmarks
CN112513712B (zh) 2018-07-23 2023-05-09 奇跃公司 具有虚拟内容翘曲的混合现实系统和使用该系统生成虚拟内容的方法
WO2020023523A1 (en) 2018-07-23 2020-01-30 Magic Leap, Inc. Intra-field sub code timing in field sequential displays
US11527329B2 (en) * 2020-07-28 2022-12-13 Xifin, Inc. Automatically determining a medical recommendation for a patient based on multiple medical images from multiple different medical imaging modalities
US11620359B2 (en) * 2020-12-03 2023-04-04 Ping An Technology (Shenzhen) Co., Ltd. Method, device, and computer program product for self-supervised learning of pixel-wise anatomical embeddings in medical images

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0917154D0 (en) * 2009-09-30 2009-11-11 Imp Innovations Ltd Method and apparatus for processing medical images

Also Published As

Publication number Publication date
EP2901417B1 (en) 2018-09-26
GB201217372D0 (en) 2012-11-14
EP2901417A1 (en) 2015-08-05
WO2014049368A1 (en) 2014-04-03
US9619890B2 (en) 2017-04-11
DK2901417T3 (da) 2019-01-02
US20150262372A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
ES2701095T3 (es) Un sistema y método para anotar imágenes propagando información
ES2595210T3 (es) Método y aparato para procesar imágenes médicas
Huynh et al. Estimating CT image from MRI data using structured random forest and auto-context model
Gooya et al. Deformable registration of glioma images using EM algorithm and diffusion reaction modeling
Eskildsen et al. BEaST: brain extraction based on nonlocal segmentation technique
Chen et al. Localization and segmentation of 3D intervertebral discs in MR images by data driven estimation
Rivest-Hénault et al. Robust inverse-consistent affine CT–MR registration in MRI-assisted and MRI-alone prostate radiation therapy
US9361686B2 (en) Method and apparatus for the assessment of medical images
Noble et al. An atlas-navigated optimal medial axis and deformable model algorithm (NOMAD) for the segmentation of the optic nerves and chiasm in MR and CT images
US20070081712A1 (en) System and method for whole body landmark detection, segmentation and change quantification in digital images
US20120170823A1 (en) System and method for image based multiple-modality cardiac image alignment
Klein et al. Early diagnosis of dementia based on intersubject whole-brain dissimilarities
Wu et al. Registration of longitudinal brain image sequences with implicit template and spatial–temporal heuristics
WO2021058843A1 (es) Método y sistema para la segmentación automática de hiperintensidades de sustancia blanca en imágenes de resonancia magnética cerebral
Kuijf et al. Automatic extraction of the midsagittal surface from brain MR images using the Kullback–Leibler measure
Alukaev et al. A deep learning framework for vertebral morphometry and Cobb angle measurement with external validation
Li et al. Automatic brain tumor segmentation from MR images via a multimodal sparse coding based probabilistic model
Alvén et al. Überatlas: fast and robust registration for multi-atlas segmentation
Studholme Dense feature deformation morphometry: Incorporating DTI data into conventional MRI morphometry
Garcia-Cabrera et al. Semi-supervised learning of cardiac MRI using image registration
Wang et al. Fully automatic stitching of diffusion tensor images in spinal cord
Lötjönen et al. Improved generation of probabilistic atlases for the expectation maximization classification
Zhou et al. Mining anatomical, physiological and pathological information from medical images
ES2769962A1 (es) Procedimiento de identificacion de imagenes oseas
Guerrero et al. Group-constrained Laplacian Eigenmaps: longitudinal AD biomarker learning