ES2928897T3 - Método y software para analizar el crecimiento microbiano - Google Patents

Método y software para analizar el crecimiento microbiano Download PDF

Info

Publication number
ES2928897T3
ES2928897T3 ES12754708T ES12754708T ES2928897T3 ES 2928897 T3 ES2928897 T3 ES 2928897T3 ES 12754708 T ES12754708 T ES 12754708T ES 12754708 T ES12754708 T ES 12754708T ES 2928897 T3 ES2928897 T3 ES 2928897T3
Authority
ES
Spain
Prior art keywords
classifier
pixel
pixels
image
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12754708T
Other languages
English (en)
Inventor
Lusia Halina Guthrie
John Hughes Glasson
Den Hengel Anton John Van
Rhys Ernst Hill
Benjamin William Stephen Ward
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LBT Innovations Ltd
Original Assignee
LBT Innovations Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2011900786A external-priority patent/AU2011900786A0/en
Application filed by LBT Innovations Ltd filed Critical LBT Innovations Ltd
Application granted granted Critical
Publication of ES2928897T3 publication Critical patent/ES2928897T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

Un método para analizar el crecimiento microbiano en un medio de cultivo sólido, incluyendo el método la obtención de datos de imagen del medio de cultivo sólido y cualquier crecimiento microbiano, generando un vector de características asociado de valores obtenidos mediante la aplicación de uno o más filtros a los datos de imagen, utilizando un clasificador. para clasificar cada píxel en una pluralidad de píxeles en los datos de imagen en función del vector de características asociado, analizando los resultados de las clasificaciones de píxeles de cada píxel para derivar una evaluación microbiológica del medio de cultivo sólido y cualquier crecimiento microbiano, y generar la evaluación microbiológica. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método y software para analizar el crecimiento microbiano
CAMPO DE LA INVENCIÓN
La presente invención se refiere a un método y software para analizar el crecimiento microbiano en un medio de cultivo sólido, particularmente el crecimiento microbiano en forma de colonias bacterianas aisladas cultivadas después de la inoculación e incubación del medio de cultivo sólido con una muestra microbiológica. Se espera que el método y el software de la presente invención encuentren uso en un laboratorio microbiológico.
ANTECEDENTES DE LA INVENCIÓN
El aislamiento de colonias individuales de microorganismos (y en particular de bacterias) es un procedimiento importante en muchos laboratorios microbiológicos. Este aislamiento de las bacterias normalmente lo realizan manualmente técnicos de laboratorio especializados o se realiza de forma automática con equipos robóticos de siembra en estrías. En cualquier caso, primero se dispensa una muestra microbiológica sobre la superficie de un medio de cultivo sólido seguido de la extensión de la muestra microbiológica por la superficie del medio (lo que se denomina "siembra en estrías"). Normalmente, se realizan múltiples siembras en estría de dilución en aumento del inóculo en el medio de cultivo sólido.
La siembra en estrías de dilución en aumento tienden a proporcionar, generalmente hacia la cola de las estrías, un número de células individuales que permiten el crecimiento de colonias microbiológicas aisladas después de la incubación. Estas colonias aisladas pueden analizarse después en busca de diversas características físicas, p. ej. morfología de la colonia, y pueden someterse a tinción y a otros procedimientos que pueden ser necesarios para determinar, por ejemplo, el género, la especie y/o la cepa del organismo no identificado previamente en la muestra microbiológica.
Tradicionalmente, técnicos especializados han realizado este análisis visualmente en un laboratorio microbiológico, siendo el técnico el que realiza una evaluación microbiológica. Esta evaluación puede basarse en la detección de la presencia o ausencia de colonias bacterianas, la detección de color(es) de cada tipo de colonia, el mapeo de la distribución del color para determinar la presencia de variaciones en el color que podrían atribuirse a la fermentación o hemólisis, la diferenciación entre el crecimiento de colonias confluentes y aisladas, la medición de la textura o viscosidad de la colonia, y la determinación de la forma bidimensional y tridimensional, y/o enumeración de los diferentes tipos de colonias.
Cuando se identifica el crecimiento de bacterias potencialmente patógenas, el medio de cultivo sólido pasa a la siguiente etapa del flujo de trabajo del laboratorio y se convierte en objeto de una identificación de confirmación adicional y de pruebas de susceptibilidad a los antibióticos, de acuerdo con los requisitos reglamentarios vigentes.
Un artículo titulado "An automated bacterial colony counting ans classification system", de Chen et al., describe un contador de colonias bacterianas automatizado y un sistema de clasificación activado manualmente. El contador de colonias examina los componentes (p. ej., píxeles) de una imagen de un medio de cultivo sólido y el crecimiento microbiano y, posteriormente, detecta colonias de crecimiento microbiano. El contador de colonias también detecta colonias agrupadas, las separa y enumera las colonias de crecimiento microbiano. Sin embargo, para clasificar las colonias de crecimiento microbiano, se requiere la entrada del usuario para recopilar datos de entrenamiento para un clasificador. Específicamente, se solicita a los usuarios que seleccionen varias colonias de una cepa específica de la imagen y después las características de las colonias seleccionadas se utilizan como datos de entrenamiento para construir un clasificador para clasificar posteriormente los píxeles en la imagen como, por ejemplo, una cepa bacteriana en particular.
Es un objeto de la presente invención proporcionar un método y software para analizar imágenes con el fin de proporcionar una evaluación microbiológica, donde esta evaluación se genera sin ninguna (o con solo una mínima) intervención humana por parte de un operario.
Antes de pasar a un resumen de la presente invención, debe apreciarse que la descripción anterior del estado de la técnica se ha proporcionado simplemente como antecedente para explicar el contexto de la invención.
COMPENDIO DE LA INVENCIÓN
La presente invención proporciona un método para analizar el crecimiento microbiano en un medio de cultivo sólido, incluyendo el método, obtener, mediante un aparato que comprende un procesador y una memoria, utilizando el procesador, el crecimiento microbiano en un medio de cultivo sólido, datos de imágenes del medio de cultivo sólido y de cualquier crecimiento microbiano, para una pluralidad de píxeles en los datos de la imagen, generando, utilizando el procesador, un vector característico asociado compuesto por valores obtenidos al aplicar uno o más filtros a los datos de la imagen, utilizando un clasificador para clasificar, utilizando el procesador, cada píxel en la pluralidad de píxeles en función del vector característico asociado, incluyendo la introducción del vector característico en el clasificador, en donde el clasificador se ha entrenado para clasificar cada píxel en la pluralidad de píxeles según una etiqueta asociada con un píxel en datos de la imagen de entrenamiento, en función de los conjuntos de entrenamiento de los vectores característicos obtenidos al filtrar datos de imágenes, y donde las etiquetas son diferentes para diferentes tipos de bacterias y agar de interés; analizando, utilizando el procesador, los resultados de las clasificaciones de píxeles de cada píxel para determinar una serie de regiones indicativas de colonias previstas del crecimiento microbiano, y enumerar, utilizando el procesador, las colonias del crecimiento microbiano de la serie de regiones en función de un tamaño y/o forma de cada una de las regiones; extrayendo, del análisis, utilizando el procesador, una evaluación microbiológica del crecimiento microbiano en el medio de cultivo sólido; y generando, utilizando el procesador, la evaluación microbiológica. El método incluye además: utilizar, mediante el procesador, la evaluación microbiológica del medio de cultivo sólido y del crecimiento microbiano para categorizar una placa de cultivo que contiene el medio de cultivo sólido en una de cuatro categorías: descartada, donde el medio de cultivo sólido no incluyó la identificación de bacterias potencialmente patógenas, se requiere reincubación, identificación de bacterias potencialmente patógenas, y para revisión humana, y envío por parte del aparato, basándose en la evaluación, de cada placa de cultivo a una de varias pilas de placas de salida del aparato correspondientes a cada una de las cuatro categorías.
Los expertos en la materia apreciarán que, con respecto a la expresión "en un medio de cultivo sólido", la palabra "sobre" se utiliza para abarcar el crecimiento microbiano tanto sobre la superficie del medio de cultivo sólido como dentro del medio de cultivo sólido. En adelante, la expresión "medio de cultivo sólido" se denominará simplemente "medio" en la memoria descriptiva. Por ejemplo, se apreciará que, en lo sucesivo una muestra microbiológica, a menudo denominada simplemente "muestra", puede dispensarse sobre la superficie del medio o dentro del medio para que el crecimiento microbiano pueda desarrollarse después de la inoculación e incubación del medio con la muestra. Es decir, el crecimiento microbiano en el medio es el resultado de la inoculación e incubación de la muestra, tal como una muestra de orina, una muestra intestinal, una muestra de sangre, una muestra de linfa, una muestra de tejido, una muestra de agua, una muestra de alimento u otra muestra relevante, en el medio.
Además, los expertos en la materia también apreciarán que el medio será normalmente, por ejemplo, agar y generalmente estará contenido en un recipiente tal como una placa, y, en un ejemplo más específico, una placa de Petri, que puede tener una tapa. La combinación del medio y la placa se denomina en lo sucesivo a lo largo de la memoria descriptiva "placa de cultivo" que a veces podría denominarse en la técnica como "placa de agar".
La presente invención utiliza el clasificador para clasificar píxeles en una imagen del medio con o sin crecimiento microbiano para proporcionar la evaluación microbiológica. Se requiere poca o ninguna intervención humana por parte del operario. Esto puede permitir un ahorro de tiempo para clasificar las placas de cultivo y puede permitir una utilización más eficaz de los recursos humanos especializados, que se puede dedicar a otras tareas. El método incluye la clasificación del crecimiento microbiano en el medio en función de los resultados de las clasificaciones de píxeles.
El método incluye además enumerar una o más colonias del crecimiento microbiano en función de los resultados de las clasificaciones de píxeles. El método puede entonces analizar los resultados de las clasificaciones de píxeles utilizando, por ejemplo, un algoritmo de componentes conectados para determinar una serie de regiones indicativas de colonias previstas del crecimiento microbiano. En este caso, el método incluye además la etapa de enumerar las colonias del crecimiento microbiano de la serie de regiones en función del tamaño y/o forma de cada una de dichas regiones.
El crecimiento microbiano puede incluir, por ejemplo, uno o más crecimientos bacterianos, crecimientos fúngicos, placas víricas o crecimientos de protistas y el crecimiento puede adoptar la forma de una colonia, micelio, hifa, placa u otra estructura microbiana visible. En algunas realizaciones, cada crecimiento microbiano puede ser un crecimiento que se origine a partir de un solo microbio (como cuando una muestra se aplica a un medio de manera diluida de manera que los microbios individuales se separan).
El medio puede incluir cualquier medio que soporte el crecimiento de un microbio. Como tal, un medio puede contener uno o más nutrientes microbianos que incluyen, por ejemplo, una fuente de carbono, una fuente de nitrógeno, elementos esenciales y/o vitaminas esenciales. Normalmente, el medio también contendrá un agente gelificante que incluya, por ejemplo, gelatina, agar, goma gelana, agarosa o gel de agar.
El medio puede incluir un medio de cultivo selectivo, que generalmente se sabe en la técnica que incluye medios con composiciones de nutrientes restringidas, medios que contienen un antibiótico, o similar, que permiten el crecimiento de algunos microorganismos mientras impiden el crecimiento de otros microorganismos.
La muestra para análisis se puede disponer en más de una placa de cultivo o en una placa de cultivo dividida que tenga más de un segmento. En estas realizaciones, el análisis del crecimiento microbiano se realiza tomando imágenes de las diferentes placas de cultivo, o segmentos, y los resultados de las clasificaciones de píxeles se analizan como se indicó anteriormente para que se pueda realizar una evaluación microbiológica basada en una comparación del crecimiento microbiano en las diferentes placas de cultivo o segmentos.
Se apreciará que algunas muestras microbiológicas pueden no dar como resultado un crecimiento microbiano en un medio particular. Por ejemplo, la muestra microbiológica puede no incluir un microbio capaz de crecer en un medio selectivo (p. ej., un medio que contenga un antibiótico específico o una composición de nutrientes específica que restrinja el crecimiento de algunos microbios) o la muestra microbiológica puede ser estéril (p. ej., no incluir ningún microbio). En estos casos, los datos de imagen obtenidos del medio pueden no incluir un crecimiento microbiano en el medio (p. ej., un resultado negativo).
La evaluación microbiológica se utiliza para identificar si la placa de cultivo se encuentra en una de hasta 4 categorías - 1. descartada (p. ej., la placa de cultivo no mostró patógenos), 2. se requiere reincubación, 3. identificación de bacterias potencialmente patógenas (p. ej., la placa de cultivo mostró un resultado positivo y requiere revisión de acuerdo con las reglamentaciones) o 4. para revisión humana (p. ej., el ordenador no pudo tomar una decisión clara, como en las categorías 1 a 3, o un operario especializado llevó la placa de cultivo a una estación de salida requerida).
Esta evaluación del medio y de cualquier crecimiento microbiano del análisis de los datos de la imagen es indicativa de una evaluación realizada por un técnico especializado, como se ha descrito anteriormente. Es decir, la evaluación incluye la detección de colonias de crecimiento microbiano en el medio y puede incluir, por ejemplo, la clasificación de estas colonias, tales como colonias bacterianas, y el mapeo de la distribución del color del medio para determinar la presencia de variaciones en el color que podrían atribuirse a la fermentación o la hemólisis, la diferenciación entre el crecimiento de colonias confluentes y aisladas, la medida de la textura o viscosidad de la colonia, y la determinación de la forma bidimensional y tridimensional, y/o enumeración de los diferentes tipos de colonia en el medio.
Los datos de imagen del medio y de cualquier crecimiento microbiano en el mismo, pueden incluir una o más imágenes tomadas con un dispositivo de captura de imágenes, tal como una cámara digital en color de alta resolución, un telémetro láser o cualquier otro dispositivo apropiado. En un ejemplo, los datos de la imagen se obtienen de una imagen existente que podría haber sido tomada, por ejemplo, para otro propósito. En otro ejemplo, los datos de la imagen se obtienen a partir de una imagen tomada utilizando un dispositivo de captura de imágenes dedicado al presente método. En cualquier caso, las imágenes pueden procesarse para producir los datos de la imagen, por ejemplo, se puede promediar una pluralidad de imágenes que incluyan el mismo crecimiento microbiano, interpolación cromática y calibrado de color. Los datos de imagen pueden incluir una serie de dichas imágenes procesadas, por ejemplo, tomadas utilizando diferentes configuraciones de iluminación. A continuación se darán más detalles sobre la captura y el procesamiento de imágenes.
El clasificador puede ser un clasificador reforzado. Como alternativa, el clasificador puede ser un árbol de decisión, bosque aleatorio, o puede utilizar análisis discriminante lineal (ADL) o cualquier otra técnica para clasificar los píxeles. Un clasificador reforzado combina el resultado de un conjunto de clasificadores "débiles" (con una precisión de clasificación baja pero mejor que la aleatoria) para producir un único clasificador "fuerte" con alta precisión. Al combinar los clasificadores débiles, el resultado de cada clasificador débil se pondera preferiblemente según el valor de confianza en la corrección del clasificador débil. Un ejemplo de un algoritmo de refuerzo apropiado para crear el clasificador reforzado es Discrete AdaBoost, que se describirá más adelante con más detalle. Discrete AdaBoost es una variante de AdaBoost, descrita en Yoav Freund y Robert E. Schapire. "A decision-theoretic generalization of online learning and an application to boosting." J. Comput. Syst. Sci., 55:119-139, agosto de 1997. Discrete AdaBoost mejora de forma adaptativa el rendimiento del clasificador al dar mayor peso a los ejemplos mal clasificados por un clasificador débil al entrenar al siguiente clasificador débil. Como alternativa pueden utilizarse otros algoritmos de refuerzo, tal como Real AdaBoost, Gentle AdaBoost o FilterBoost. Las variantes utilizan diferentes métodos de ponderación y entrenamiento de los clasificadores débiles.
En una realización, el clasificador utilizado para clasificar los píxeles es un clasificador de árbol de decisión reforzado. En esta realización, los clasificadores débiles utilizados son árboles de decisión. Los árboles de decisión son árboles binarios donde cada nodo contiene una norma, cada rama representa un resultado de la norma, y por tanto una decisión, y cada hoja representa una clasificación. En esta disposición, cada norma es una prueba de un valor en el vector característico en la forma x i< t donde x ies un valor del vector característico x = (x1, ..., Xn) y t es un valor umbral. El árbol se recorre desde el nodo raíz para clasificar un solo vector característico. Una disposición común es que si una prueba para la rama izquierda de ese nodo atravesada, de lo contrario, se atraviesa la rama derecha.
El clasificador de árbol de decisión reforzado puede ser un clasificador multiclase. Por ejemplo, el procedimiento AdaBoost.MH (Multi-Label Hamming) puede utilizarse para clasificar los píxeles en una de una pluralidad de clases. El algoritmo AdaBoost.MH se describe en Jerome Friedman, Trevor Hastie y Robert Tibshirani. "Additive logistic regression: a statistical view of boosting." Annals of Statistics, 28:2000, 1998. J Z
Para mejorar la velocidad y el rendimiento de la clasificación, la clasificación puede realizarse como un proceso de dos fases. Por ejemplo, el método puede incluir el uso de un primer clasificador para clasificar inicialmente cada píxel como uno de una primera pluralidad de clases, y posteriormente utilizar un segundo clasificador para clasificar cada píxel en una o más de la primera pluralidad de clases como uno de una segunda pluralidad de clases. El resultado es una cadena de clasificadores dependientes, donde el resultado del primer clasificador se utiliza para aumentar los vectores característicos o restringir los píxeles aplicables al entrenar el segundo clasificador. El primer clasificador puede ser un clasificador binario en cascada para clasificar inicialmente cada píxel como fondo o no fondo, y el segundo clasificador puede ser un clasificador de árbol de decisión reforzado multiclase para clasificar cada píxel que no es de fondo como una de la segunda pluralidad de clases.
La clasificación gruesa inicial de los píxeles de fondo reduce la cantidad de píxeles que deben clasificarse con mayor precisión en uno de los tipos de colonias. La clasificación binaria inicial puede tener una alta tasa de falsos positivos (píxeles de fondo clasificados como no fondo) ya que los píxeles mal clasificados pueden clasificarse correctamente en la siguiente etapa. Un clasificador binario inicial adecuado puede seguir el método de clasificación en cascada descrito en Paul Viola y Michael Jones "Robust real-time object detection", Second International Workshop on Statistical and Computational Theories of Vision, 13 de julio de 2001.
Las clases pueden representar el género, la especie o la cepa del organismo, tipos de agar, con fondo, sin fondo. Las clases son flexibles, para permitir diferentes tipos de agar y tipos de organismos que pueden ser de interés para diferentes usuarios finales.
El método puede incluir además la asignación de un valor de confianza a cada clasificación de píxeles. El valor de confianza representa la probabilidad de clasificación correcta del píxel.
El método puede incluir además la aplicación de un algoritmo de procesamiento posterior para mejorar los resultados de las clasificaciones de píxeles. Se puede aplicar una variedad de algoritmos diferentes para eliminar etiquetas falsas o áreas inciertas. Por ejemplo, el algoritmo de procesamiento posterior puede incluir operaciones morfológicas tales como dilatación o erosión o, como alternativa, un corte gráfico. Un ejemplo de un algoritmo de corte de gráfico adecuado se da en Yuri Boykov, Olga Veksler y Ramin Zabih "Fast approximate energy minimization via graph cuts" IEEE Trans. Pattern Anal. Mach. Intell., 23:1222-1239, noviembre de 2001. Los algoritmos de corte de gráficos calculan una división óptima de un gráfico en dos o más conjuntos. La aplicación del algoritmo de corte de gráfico puede dar lugar a la reclasificación de algunos de los píxeles de los datos de imagen. La aplicación de un algoritmo de corte de gráfico puede incluir:
(a) construir un gráfico que tenga una pluralidad de nodos, correspondiendo cada nodo a uno de la pluralidad de píxeles en los datos de la imagen, y una pluralidad de etiquetas, correspondiendo cada etiqueta a una clase, (b) añadir bordes entre nodos correspondientes a píxeles vecinos en los datos de imagen,
(c) añadir bordes entre cada nodo y cada etiqueta, y
(d) utilizar el algoritmo de corte de gráfico para cortar bordes en un nodo y dividir el gráfico en clases, basándose el algoritmo de corte de gráfico en los resultados de la clasificación de píxeles para el píxel correspondiente a ese nodo y los píxeles vecinos.
La aplicación de un algoritmo de corte de gráfico puede mejorar los resultados de clasificación para las clasificaciones de píxeles a las que el clasificador les ha dado poco valor de confianza. El algoritmo de corte de gráfico puede tener en cuenta el valor de confianza de la clasificación de píxeles para el píxel correspondiente a ese nodo y/o el valor de confianza de la clasificación de píxeles para los píxeles vecinos. Esto homogeneiza espacialmente los resultados, reduciendo el ruido en las clasificaciones finales. En concreto, normalmente se mantendrán las anotaciones de alta confianza, mientras que las anotaciones de confianza baja pueden reemplazarse para obtener un resultado más homogéneo. Por ejemplo, si un píxel de confianza baja está rodeado por píxeles vecinos clasificados en la misma clase con confianza alta, puede haber más confianza en la clasificación del píxel de baja confianza. De la misma manera, si los píxeles vecinos se clasifican en una clase diferente con alta confianza, hay un caso sólido para cambiar la clasificación del píxel de baja confianza a esa clase.
El algoritmo de corte de gráfico puede ser un algoritmo de corte de gráfico multiclase, que divide el gráfico en tres o más conjuntos. Este es un algoritmo más complicado que un corte de gráfico binario, pero permite que se proporcione una evaluación más significativa ya que los píxeles se pueden clasificar de manera más específica. Dicho algoritmo puede ser un procedimiento de expansión alfa. En expansión alfa, se realizan una serie de cortes de gráficos, segmentando cada vez entre la etiqueta actual de cada nodo y una etiqueta candidata del conjunto de etiquetas posibles. Este procedimiento se repite, iterando a través de cada etiqueta posible, hasta la convergencia. Al construir el gráfico, se añaden nodos auxiliares entre nodos adyacentes con diferentes etiquetas, incluyendo el coste de este etiquetado en el corte. En la solicitud internacional en trámite junto con la presente del mismo Solicitante y con la misma fecha de presentación titulada "Method for Improving Classification Results of a Classifier" se describen más detalles de los algoritmos de corte de gráfico apropiados.
Volviendo ahora al vector característico x = (x1, ..., Xn) que se introduce en el clasificador. El vector característico se compone de valores tomados de imágenes de características, que se crean aplicando uno o más filtros a los datos de imagen de la muestra. La obtención de imágenes características es una etapa intermedia, y se apreciará que, como alternativa, los vectores característicos podrían estar compuestos por valores tomados aplicando los filtros píxel por píxel. Debe entenderse que el término "filtro" abarca cualquier procesamiento de imágenes u otro algoritmo que convierte parte o la totalidad de los datos de la imagen en uno o más valores que pueden introducirse en el clasificador.
El uno o más filtros pueden elegirse de un grupo que incluye:
o filtro RGB, que crea hasta tres imágenes características, uno para el canal rojo, uno para el canal verde y otro para el canal azul.
o filtro LAB, que crea hasta tres o más imágenes características en el espacio de color LAB, donde L representa luminosidad y A y B contienen información de color cromático.
◦ Filtro gaussiano orientado, que aplica en la imagen un núcleo gaussiano 1D en una variedad de direcciones. También es posible utilizar derivadas de primer y segundo orden del núcleo Gaussiano.
o Filtro de posición, que, por ejemplo, crea una imagen característica que muestra la distancia de cada píxel desde el borde de la placa de cultivo. Otros filtros de posición pueden mostrar la distancia de cada píxel desde una etiqueta en particular, si el filtro se aplica cuando el resultado de un clasificador anterior está disponible. ◦ Filtro de cuantificación de color, donde se reduce el número de colores en la imagen, generalmente a través de un histograma, para ayudar a localizar áreas de color similar, y
o Filtro de textura, que crea una o más imágenes características que miden la textura alrededor de cada píxel.
Los filtros pueden mejorar las diferencias entre las colonias y el medio y la propia placa. Algunos de los filtros incluyen un mecanismo de retroalimentación, por lo que el resultado de un clasificador anterior puede utilizarse como entrada.
Los vectores característicos pueden construirse utilizando cualquier número de filtros. Por ejemplo, el vector característico de un píxel puede incluir 9 valores: x1, x2 y x3 que corresponden a los valores de los canales R, G y B para ese píxel, correspondiendo x4, x5 y x6 a los valores de L, A y B para ese píxel, correspondiendo x7 a la distancia del píxel desde el borde de la placa y correspondiendo x8 y xg a los gradientes de imagen en las direcciones x e y. Se apreciará que puede utilizarse cualquier número de valores característico y que se pueden tomar valores característicos de diferentes datos de imagen para el mismo crecimiento (p. ej., iluminado por una luz superior o una luz inferior).
En relación con la textura, la aplicación de uno o más filtros a los datos de la imagen puede incluir la medición de la textura de los datos de la imagen mediante
(a) la extracción de valores de gradiente para cada píxel en la imagen, y
(b) el cálculo de un rastro de una matriz de covarianza de los valores de gradiente en una ventana alrededor de cada píxel.
Los valores de gradiente se pueden extraer convolucionando en las direcciones x e y de los datos de la imagen utilizando un núcleo Sobel. El uso de un núcleo Sobel homogeneiza la imagen al mismo tiempo que extrae información de gradiente. Al calcular el rastro de la matriz de covarianza de los gradientes de la imagen, se mide la variabilidad de los gradientes en la región y, por lo tanto, el grado de textura, proporcionando una métrica de "homogeneidad".
El cálculo requerido durante el entrenamiento puede reducirse muestreando escasamente la pluralidad de píxeles de los datos de la imagen. Esto es especialmente útil para imágenes grandes. Dos algoritmos que pueden utilizarse incluyen muestreo denso o disperso. El muestreo denso toma cada 1/N píxeles, mientras que el método de muestreo disperso toma N píxeles al azar del grupo disponible de píxeles etiquetados en los datos de la imagen. En el entrenamiento, el método de muestreo disperso construye un grupo distinto de cada clase que se entrena, lo que lleva a N píxeles disponibles de cada clase. El método denso construye un solo grupo de todas las clases, por lo que el número de píxeles de cada clase dependerá de la distribución de esa clase en las imágenes.
El método también puede identificar el medio como un control negativo. Por ejemplo, el clasificador puede clasificar los píxeles como fondo o sin crecimiento. El método puede determinar si el número de píxeles clasificados como fondo supera un número mínimo predefinido para que la captura y el análisis de la imagen sean válidos. El número mínimo predeterminado de píxeles que deben clasificarse como fondo (p. ej., agar básico) puede obtenerse de una tabla de valores que depende del tipo de agar y de las otras bacterias que se identifican en la placa de cultivo. Tenga en cuenta que el máximo es simplemente el número de píxeles que se encuentran en la placa de cultivo en la imagen.
Como verificación adicional de la integridad de la captura y el análisis de la imagen, puede examinarse el valor de confianza de las clasificaciones. Si existen regiones de tamaño suficiente con un nivel de confianza constantemente bajo, es probable que haya un elemento desconocido en la placa de cultivo. En este caso, se puede alertar al operario o se puede marcar la placa de cultivo para su inspección.
Para generar la evaluación, se analizan los resultados de las clasificaciones de píxeles. Esto puede implicar el procesamiento de las clasificaciones de píxeles para extraer metadatos adicionales, tales como recuentos de colonias, tamaños de colonias, la gama de organismos presentes en la placa de cultivo, patrones de crecimiento, hemólisis, artefactos, contaminantes, defectos en el agar, etc., como se ha descrito anteriormente.
El número de cada tipo de colonia se cuenta (enumera) mediante un proceso conocido como cuantificación. Los expertos en la materia apreciarán que el recuento de las colonias es una tarea ardua, ya que muchas colonias pueden no estar aisladas unas de otras. Por lo tanto, se proponen tres enfoques:
1. Recuento básico, donde el recuento de colonias se estima determinando un tamaño de colonia promedio para cada tipo de organismo en cada tipo de agar. El número de píxeles de cada organismo detectado en una placa de cultivo en particular puede dividirse entre este número para obtener el número de colonias.
2. Recuento basado en la densidad, donde la distancia desde el borde de cada colonia se incluye en el algoritmo de recuento. Esto se basa en la observación de que las grandes áreas de crecimiento deben contarse como varias colonias distintas. Por lo tanto, a los píxeles interiores en el centro de una colonia se les asigna mayor peso para lograr tal resultado. Se forma una tabla que mide muchos recuentos de colonias manualmente y se tabulan los resultados contra esta métrica. Después, la tabla puede utilizarse para obtener un recuento de colonias a partir de la métrica cuando se evalúa en una placa de cultivo nueva.
3. Recuento basado en el procesamiento de imágenes, donde la imagen que contiene las etiquetas se analiza primero mediante un algoritmo de componentes conectados. A su vez, cada componente detectado por este algoritmo se examina. Si una colonia en particular se considera demasiado grande según una tabla preestablecida de umbrales, entonces se aplica el método propuesto como número uno. Si la colonia se considera demasiado pequeña, se cuenta como una sola colonia. De lo contrario, se puede considerar la forma del componente. Si parece circular, cuenta como una sola colonia. De lo contrario, se aplica un algoritmo Watershed que divide el componente en colonias individuales, cada una de las cuales incrementa el recuento de colonias.
Después, un algoritmo calculará una enumeración apropiada de cada tipo de colonia detectado en la placa de cultivo. Dicha enumeración es significativa para un experto en el campo y puede adoptar la forma de una especificación de cuadrante, tal como '1+', o una estimación del número de colonias por mililitro de solución, tal como 103 ufc/ml. Las enumeraciones de una o más placas de cultivo se combinan después para obtener la evaluación de la muestra.
Al generar la evaluación, el método también puede utilizar normas clínicas para interpretar las clasificaciones generadas por el clasificador y/o la cuantificación (enumeración) generada, como se ha descrito anteriormente. Estas normas clínicas podrán evaluar la edad o el estado clínico del paciente, el tipo de muestra analizada del paciente, el tipo de bacteria identificada, la práctica de laboratorio local o una variedad de otras condiciones personalizadas definidas por el usuario que anularán las decisiones normales del clasificador. Las reglas clínicas proporcionan un puente desde la evaluación de bajo nivel proporcionada por el software, tal como recuentos y tamaños exactos de colonias, a una evaluación típica de alto nivel en un formato apropiado para un técnico de laboratorio, donde solo se reporta la información más destacada.
Los detalles del aparato apropiado que puede utilizarse con el método se proporcionan en la solicitud de patente internacional en tramitación junto con la presente del mismo solicitante y con la misma fecha de presentación titulada "Image Capture and Lighting Apparatus".
Se apreciará que los datos de imagen del medio pueden obtenerse mediante cualquier disposición adecuada de uno o más dispositivos de captura de imágenes (p. ej., cámaras) con uno o más dispositivos de iluminación.
Los datos de la imagen pueden incluir la imagen de la superficie del medio, la placa que contiene el medio y del área alrededor de la placa de cultivo. Idealmente, los datos de la imagen se almacenarán en una base de datos junto con los datos de la placa relevantes, incluyendo los datos del código de barras de la placa, los parámetros de adquisición de imágenes, un sello de hora/fecha y datos de especificación del dispositivo de captura de imágenes.
Para realizar un análisis preciso de los datos de la imagen indicativos del crecimiento microbiano, se requieren datos de imagen precisos y de alta calidad. Se pueden tomar medidas para procesar las imágenes en bruto desde el dispositivo de captura de imágenes en una forma adecuada. El procesamiento de las imágenes capturadas puede incluir promediar una serie de imágenes capturadas, seguido de interpolación cromática (demosiacing), equilibrio de blancos y corrección de color para obtener los datos de imagen adecuados para el análisis. Los detalles de los métodos de calibración de color que pueden utilizarse se describen en la solicitud de patente internacional en tramitación del mismo solicitante y con la misma fecha de presentación titulada "Colour Calibration Method for an Image Capture Device".
En un ejemplo, el aparato y el método pueden proporcionar una función completa de adquisición y análisis de imágenes, y pueden proporcionarse a un laboratorio como un paquete completo. Como alternativa, los datos de la imagen pueden provenir de otro proveedor, ubicación o país, lejos de donde se llevan a cabo las etapas del método de la presente invención, por lo que cualquier aparato de adquisición de imágenes utilizado para obtener los datos de imagen también puede ubicarse lejos de donde tiene lugar el análisis de los datos de imagen.
La presente invención se amplía al software para su uso con un ordenador que incluye un procesador y una memoria para almacenar el software, incluyendo este una serie de instrucciones que, cuando las ejecuta el procesador, lleva a cabo el método de acuerdo con una cualquiera de las realizaciones descritas anteriormente.
La presente invención también se amplía a un medio legible por ordenador que incluye el software y un aparato que incluye un procesador, una memoria y un software residente en la memoria accesible al procesador, el software, cuando lo ejecuta el procesador, lleva a cabo el método de acuerdo con una cualquiera de las realizaciones descritas anteriormente.
En otro aspecto, la presente invención proporciona un método para entrenar un clasificador para su uso en el análisis del crecimiento microbiano en un medio de cultivo sólido, incluyendo el método:
obtener datos de imagen de una pluralidad de muestras de crecimiento microbiano en el medio de cultivo sólido; para cada uno de una pluralidad de píxeles en los datos de imagen, generando, utilizando un procesador, un vector característico asociado de valores obtenidos aplicando uno o más filtros a los datos de la imagen; y utilizar los vectores característicos asociados para entrenar un clasificador para clasificar cada píxel en la pluralidad de píxeles según una etiqueta asociada con el píxel en los datos de la imagen.
Los resultados de las clasificaciones de píxeles de cada uno de dichos píxeles se analizan para obtener una evaluación microbiológica del crecimiento microbiano en el medio de cultivo sólido.
Breve descripción de los dibujos
Ahora se describirán realizaciones de la presente invención, solo a modo de ejemplo, con referencia a los dibujos adjuntos. Debe entenderse que la particularidad de los dibujos no reemplaza la generalidad de la descripción anterior de la invención.
La figura 1 es un diagrama esquemático de un aparato para su uso en el análisis del crecimiento microbiano en un medio de cultivo sólido en una placa de cultivo.
La figura 2(a) es una captura de pantalla de una GUI (graphical userinterface, interfaz gráfica de usuario) para que un usuario capture imágenes, Las figuras 2(b) a 2(e) son vistas detalladas del lado izquierdo de la captura de pantalla de la figura 2(a).
La figura 3 es una serie de capturas de pantalla que muestran una GUI para introducir la posición de una placa de cultivo en una imagen.
La figura 4 es un diagrama de flujo que muestra un método para capturar una imagen de un medio de cultivo sólido y cualquier crecimiento microbiano en el mismo.
La figura 5 es un diagrama de flujo que muestra un método para procesar la imagen capturada.
La figura 6 es un diagrama de flujo que ilustra un método para estimar un mapeo del color aparente al color real.
La figura 7 es un gráfico que muestra una curva de ejemplo para corregir el brillo de una imagen capturada. La figura 8 es un diagrama de un espacio HSV que muestra una pluralidad de puntos de control dentro de un espacio de matiz circular.
La figura 9 es una representación gráfica de (a) el mapeo a través del espacio de tono/saturación, (b) la función de mapeo de tono aislado y (c) la función de mapeo de saturación aislada para un dispositivo de captura de imagen particular.
La figura 10 es un gráfico que muestra la precisión del mapeo.
La figura 11 son dos fotografías de una tabla de colores (a) antes de la calibración del color y (b) después de la calibración del color.
La figura 12 es un diagrama de flujo que ilustra un método para mapear un color aparente con un color real. La figura 13 es un diagrama de flujo que muestra la canalización de captura de imágenes que se ejecuta en una placa de cultivo dividida.
La figura 14 es un diagrama de flujo que muestra un método para entrenar un clasificador para su uso en el análisis del crecimiento microbiano en un medio de cultivo sólido.
La figura 15 es una serie de representaciones de (a) datos de imagen del crecimiento microbiano en un medio de cultivo sólido, (b) una imagen característica del canal rojo, (c) una imagen característica de canal verde y (d) una imagen característica de canal azul.
La figura 16 es una serie de representaciones de (a) una imagen característica L, (b) una imagen característica A, (c) una imagen característica B, (d) una varianza de L en una imagen característica de ventana de 11 x 11, (e) una varianza de A en una imagen característica de ventana de 11 x 11, (f) una varianza de B en una imagen característica de ventana de 11 x 11, (g) una media de L en una imagen característica de ventana de 11 x 11, (h) una media de A en una imagen característica de ventana de 11 x 11 e (i) una media de B en una imagen característica de ventana de 11 x 11.
La figura 17 es una representación de una imagen característica de posición de una placa de cultivo dividida. La figura 18 es una serie de representaciones de (a) una imagen característica de valores de gradiente en la dirección x, (b) una imagen característica de valores de gradiente en la dirección y, (c) una imagen característica de homogeneidad para una ventana de 5 x 5, (d) una imagen característica de homogeneidad para una ventana de 13 x 13 y (e) una imagen característica de uniformidad para una ventana de 21 x 21.
La figura 19 es un ejemplo de un árbol de decisión.
La figura 20 es un diagrama de flujo de un método para analizar una serie de imágenes de crecimiento microbiano en un medio de cultivo sólido.
La figura 21 es un diagrama de flujo de un método para aplicar un algoritmo de corte de gráfico para mejorar los resultados de clasificación del clasificador reforzado.
La figura 22 muestra (a) un gráfico inicial y (b) un gráfico dividido que muestra el etiquetado después de que se haya aplicado un algoritmo de corte de gráfico.
La figura 23 muestra un gráfico construido con un nodo auxiliar para su uso en el procedimiento de expansión alfa.
La figura 24 es un conjunto de gráficos que muestran posibles cortes que pueden realizarse en el procedimiento de expansión alfa.
DESCRIPCIÓN DETALLADA DE UNA REALIZACIÓN
Descripción general del software del ordenador
Hay cuatro componentes principales del software:
o una biblioteca de datos que se utiliza para almacenar y gestionar información y procesos,
o software en forma de programas de línea de comandos que se ejecutan en un servidor para entrenar el clasificador reforzado, y
o se utiliza un programa GUI que se ejecuta en un ordenador de sobremesa para capturar y procesar imágenes y generar informes de placas de cultivo desconocidas, y
o un programa GUI ejecutado en un ordenador de sobremesa para proporcionar etiquetas de entrenamiento y manipular metadatos.
En la biblioteca, los archivos de lenguaje de marcado extensible (XML, Extensible Markup Language) se utilizan para almacenar metadatos y el formato de gráficos de red portátiles (PNG, Portable Network Graphics) se utiliza para almacenar imágenes. Todos los archivos pueden almacenarse directamente en el disco o en una base de datos. Los metadatos se almacenan en tres tipos principales de archivos XML: un archivo de metadatos de imagen, un archivo de metadatos de placas y un archivo de metadatos principal para almacenar metadatos adicionales y vincular los archivos de metadatos de imágenes y placas. La biblioteca puede estar vinculada a un sistema de gestión de información de laboratorio (LIMS, Laboratory Information Management System) para acceder a información sobre el paciente y la muestra.
Los datos de las imágenes se almacenan de cuatro maneras: un archivo de metadatos de imagen, la imagen sin procesar (valores sin procesar leídos de la cámara), la imagen procesada (con interpolación cromática y con corrección de color) y una imagen de vista previa (que tiene un tamaño más pequeño). El archivo de metadatos de la imagen captura una variedad de información. A continuación se muestra un archivo de metadatos de imagen de ejemplo:
Listado 1: Un archivo de metadatos de imagen de ejemplo
!
2
3
4
5
b
7
s
y
11
12
13
14
17
I -ir
I
I-'
: i
22
23
24
2?
Figure imgf000009_0001
Los metadatos almacenados incluyen el tiempo de exposición, la fecha de captura, la información de la luz, la transformación de color utilizada para corregir los datos de la imagen y de la cámara. Se puede utilizar un conjunto de propiedades en el archivo para ubicar y verificar la imagen en particular. La primera propiedad es la trayectoria, que proporciona la ubicación del archivo de imagen, en relación con la ubicación del archivo de metadatos principal, indicada más adelante. La anchura y la altura de la imagen se almacenan, junto con el tamaño de la imagen en el disco, en bites. Por último, para garantizar que los datos no se hayan modificado desde que se tomaron, se almacena una suma de comprobación MD5. Estas propiedades se pueden comprobar en la carga de la imagen. Además, los archivos XML están firmados criptográficamente para impedir modificaciones.
A continuación se muestra un archivo de metadatos de placa de ejemplo.
Listado 3: Un ejemplo de archivo de metadatos relacionados
1
2
3
4
5
6
7
,s
V
tn
t i
12
13
14
Figure imgf000010_0001
Como una placa de Petri puede estar dividida, teniendo dos o más agares diferentes en la misma placa de cultivo, una placa puede tener varios archivos de metadatos de placa asociados. Los metadatos almacenados incluyen el tipo de agar, la información de crecimiento adecuada al tipo de muestra que contiene, una lista de tipos de organismos, que son definidos por el operario o por el proceso de análisis automático. La lista de organismos asocia el nombre del organismo con un número de etiqueta, proporcionando una forma de interpretar las imágenes etiquetadas. Por último, se proporciona una máscara para la placa de cultivo, para permitir que el software lea la sección apropiada de la imagen etiquetada. Se utiliza una sola imagen etiquetada para una sola placa de Petri, pero como una placa puede contener múltiples agares y, por lo tanto, múltiples archivos de metadatos de placa, las máscaras se utilizan para determinar qué etiquetas están asociadas con qué agar.
A continuación se muestra un archivo de metadatos principal de ejemplo.
Listado 2: Un mosaico de metadatos de ejemplo
1
2
3
4
5
6
*(7
8
u
10
11
■j^
13
14
15
le»
17
18
19
20
21
TI
1•;
Figure imgf000011_0001
Los metadatos almacenados incluyen una ID interna de la placa de cultivo, del tipo de placa de cultivo que es, ya sea completa o dividida, una ID del paciente (que debe leerse a partir de un código de barras en la placa de cultivo), la fecha de captura, el nombre del operario que estaba usando el software cuando se capturó la imagen, el tipo de muestra que se colocó en la placa de cultivo (p. ej., orina o intestinal) y una lista de referencias a los archivos de metadatos de la placa. Después, se registra un diagnóstico para la placa de cultivo, cuya fuente puede ser el operarios o el software de análisis automático. Los valores permitidos para el diagnóstico son positivo, negativo, incubar o inspeccionar. El operario también puede introducir texto arbitrario, que se almacena en la etiqueta de notas. La ubicación de la placa de cultivo se almacena en un formato relativo. Para obtener la ubicación de píxeles de la placa de cultivo, las coordenadas x e y deben multiplicarse por la anchura de la imagen, w (width), y la altura (heighf), h, respectivamente. El radio debe multiplicarse por Vw2 h2. A continuación, se hace referencia a cada una de las imágenes que se adjuntan a la placa de cultivo a través de sus archivos de metadatos de imagen. También se hace referencia a las imágenes etiquetadas a través de la trayectoria a sus archivos PNG. El archivo principal de metadatos también puede incluir una referencia a las etiquetas calculadas, pero esto es opcional.
Para garantizar la coherencia en el etiquetado, también puede utilizarse una base de datos de biología, que enumera valores aceptables para tipos de agar, muestras y organismos de un caso de metadatos en particular. El contenido exacto de la base de datos depende del laboratorio donde se implemente el sistema. La base de datos de biología está organizada primero por tipo de muestra, después por tipo de agar. Cada tipo de agar contiene una lista de organismos válidos. Cada entrada en la base de datos contiene al menos tres campos: Un nombre, una breve descripción y una descripción. El nombre se utiliza siempre que se requiera un nombre legible por máquina para la entidad y actúa como una clave en la base de datos. La breve descripción está diseñada para utilizarse en una GUI en lugares donde dicho texto sea apropiado, como en los menús u otros elementos de la interfaz de usuario. La descripción puede ser arbitrariamente larga y es el nombre técnico completo de una entidad en particular.
Captura de imagen
La figura 1 muestra una realización de un aparato 100 para su uso en el análisis del crecimiento microbiano en un medio en una placa de cultivo 102 en forma de placa de agar. El aparato 100 incluye los siguientes componentes:
• Un dispositivo de captura de imágenes 104 en forma de una cámara 106 digital de alta resolución de calidad de visión artificial con una lente 108 de distancia focal fija apropiada. La cámara 106 está situada unos 200 mm por encima de un anillo de luz 110.
El anillo de luz 110 tiene un gran diámetro en relación con el diámetro de la placa de cultivo 102. En este ejemplo, la luz del anillo tiene un diámetro de 180 mm. El anillo de luz 110 contiene varios cientos de LED blancos dispuestos en una matriz circular y un difusor. Esta luz proporciona iluminación lateral difusa de ángulo bajo para permitir una iluminación uniforme de la placa de cultivo. El anillo de luz 110 se coloca unos 40 mm por encima de una cubierta 112 opaca que forma parte del marco 118 y, por tanto, unos 30 mm por encima de la placa de cultivo 102. La colocación del anillo de luz 110 de modo que la luz de los LED blancos incida sobre la superficie de la placa de cultivo 102 en un ángulo bajo impide que el dispositivo de captura de imágenes 104 capture una reflexión especular de los LED desde una superficie central del medio.
Un dispositivo de iluminación 114 en forma de un panel de luz plano basado en una matriz de LED blancos detrás de un difusor. El dispositivo de iluminación 114 se encuentra a unos 150 mm por debajo de la cubierta 112 opaca. Esta distancia se elige para que la luz del anillo de luz 110 caiga sobre los deflectores en lugar de la luz 114, para reducir la iluminación trasera de la placa de cultivo 102.
Un soporte 116 para sostener la placa de cultivo 102 en el campo de visión directo del dispositivo de captura de imágenes 104. El soporte 116 es una platina de vidrio transparente de 3 mm de grosor. El vidrio se puede reemplazar si se raya con el tiempo. El soporte 116 incluye dos o más elementos de posicionamiento transparentes en forma de triángulo para colocar la placa de cultivo 102 sobre el soporte. Los vértices de los triángulos apuntan hacia el centro del soporte para la colocación de la placa de cultivo 102 de forma que los vértices toquen la circunferencia de la placa de cultivo 102.
Un marco 118 coloca el dispositivo de captura de imágenes 104, el soporte 116, el anillo de luz 110 y el dispositivo de iluminación 114 entre sí. El marco 118 está fabricado de un material opaco, tal como láminas de metal o plástico, lo que reduce la cantidad de luz que entra en el aparato 100. Las superficies internas del aparato 100 se oscurecen cuando es posible para reducir el reflejo de la luz desde las superficies internas hacia la lente 108.
El marco 118 incluye una puerta 120 que proporciona un parche de acceso para que un operario humano coloque la placa de cultivo 102 en el soporte 116. Como alternativa, un dispositivo robótico de manipulación de placas puede utilizar la trayectoria de acceso para colocar la placa de cultivo 102 con precisión en el soporte 116 para obtener imágenes y después retirar la placa de cultivo a un canal/portaobjetos de salida designado. Por ejemplo, la placa de cultivo puede colocarse en un canal de salida que represente una de las cuatro categorías descritas anteriormente.
La cubierta 112 opaca es una placa de aluminio que se extiende a lo ancho del marco 118 y divide eficazmente el marco 118 en un recinto superior 122 y un recinto inferior 124. La cubierta 112 opaca incluye un orificio 126 para permitir que la luz del dispositivo de iluminación 114 se transmita a través de la placa de cultivo 102. La anchura del orificio 126 es ligeramente mayor que la anchura de la placa de cultivo 102 (que es de 90 mm en este ejemplo y normalmente está entre 88 y 100 mm) y es menor que el diámetro del anillo de luz 110. Esto impide que la luz emitida por el anillo de luz 110 se refleje en la superficie inferior 128 del marco 118 o en la superficie del panel de luz plano 114 y regrese a través de la placa de cultivo 102.
El marco 118 también incluye deflectores de luz 130 colocados debajo de la cubierta 112 opaca.
También se proporcionan medios 131 para cambiar la posición del anillo de luz 110 con respecto al soporte 116 en forma de un conjunto de cremallera y piñón.
El marco 118, la cubierta 112 opaca y los deflectores de luz 130 definen una cavidad 132 de manera que el soporte 116 sostiene la placa de cultivo 102 entre el dispositivo de captura de imágenes 104 y la cavidad 132. El soporte (platina de vidrio) 116 sella la cavidad 132 e impide que caiga material no deseado en la cavidad 132. Cuando el anillo de luz 110 está iluminado y el dispositivo de iluminación 114 está apagado, la cubierta 112 opaca impide que la luz del anillo de luz 110 ilumine áreas visibles de la cavidad 132. En esta configuración, la cavidad 132 parece un fondo negro.
Para iluminar la placa de cultivo 102 se utiliza una luz de ángulo lateral 134 desde un ángulo para resaltar cualquier topografía superficial en el agar, como hoyuelos o una textura granular. Una alternativa a la luz de ángulo lateral 134 es activar solo algunos de los LED en el anillo de luz 110, de modo que la placa de cultivo 102 se ilumine desde una sola dirección.
Un medio de procesamiento tal como un ordenador 136 está conectado al dispositivo de captura de imágenes 104, al anillo de luz 110 y al dispositivo de iluminación 114 a través de una interfaz física o inalámbrica. El ordenador 136 puede incluir un procesador 138 y una memoria 140 que almacena el software 142 para activar los diferentes componentes, capturar datos sin procesar y procesar los datos. •
Una biblioteca de imágenes, los metadatos y otra información pueden almacenarse en el ordenador 136, o pueden ser accesibles en el ordenador 136 a través de una red. De manera similar, se puede acceder al LIMS a través del ordenador 136.
Se apreciará que se pueden sustituir diferentes componentes por cualquiera de los componentes del dispositivo descritos anteriormente, y que se puede ajustar la distancia entre los componentes y la posición de los componentes. Por ejemplo, aunque la cámara 106 y la lente 108 se muestran dentro del marco 118, en otro ejemplo, podrían colocarse fuera del marco 118, con la lente 108 sobresaliendo a través de un orificio en la superficie superior del marco 118. Es más, la anchura del marco 118 podría disminuirse para reducir el tamaño total del aparato 100.
Ahora se describirá un proceso de adquisición de imágenes usando el aparato 100. Este proceso puede ser adecuado para obtener imágenes para su uso en la clasificación del crecimiento microbiano en la placa de cultivo 102 utilizando un clasificador de aprendizaje automático entrenado, o en el entrenamiento de dicho clasificador. Se describirá un proceso manual, donde muchas etapas son realizadas por un operario humano, pero se apreciará que muchas de las etapas del proceso pueden automatizarse y realizarse en un software o mediante un dispositivo robótico.
En primer lugar, un usuario coloca una placa de cultivo 102, inoculada e incubada, sobre el soporte 116, dentro de los topes triangulares. Las placas de cultivo 102 generalmente se almacenan en un laboratorio con el agar hacia abajo (para impedir que la condensación en la tapa caiga y dañe, la superficie de agar), por lo que colocar la placa de cultivo 102 sobre el soporte puede incluir quitar una tapa de la placa de cultivo 102 y girar la placa de cultivo de modo que el agar quede hacia arriba.
El software 142 se activa para comenzar el proceso de captura de imágenes. El software 142 requiere que el usuario escanee un código de barras en la placa de cultivo 102, o introduzca un número manualmente. El código de barras se vincula a una identificación de muestra, que vincula la placa de cultivo a una muestra particular y, a través de un sistema LIM, a un paciente en particular. Una vez introducido el código de barras, en la ventana aparece una vista previa de video en vivo de la salida de la cámara que se muestra en la figura 2 (a). El usuario puede ajustar la ubicación de la placa de cultivo 102 o el enfoque o la apertura de la lente 108, en función de los comentarios proporcionados por la transmisión de video en vivo.
Después se requiere que el usuario seleccione el tipo de placa de cultivo (p. ej., dividida o completa), tipo de muestra (p. ej., orina, intestinal, sangre o tejido) y tipo(s) de agar (p. ej., sangre o cromogénico). En la figura 2(b) y en la parte superior izquierda de la figura 2(a) se muestra un ejemplo de las opciones de selección de datos de una placa. En una alternativa, en lugar de requerir que el usuario seleccione la placa de cultivo, muestra y tipo de agar, esta información puede extraerse del sistema LIM, basado en el código de barras introducido.
Una vez introducidos estos datos, se introduce la posición de la placa de cultivo. Hay dos formas en las que el usuario puede introducir esta información. La primera es a través de un conjunto tradicional de deslizadores, que permiten introducir la ubicación x, y de la placa, junto con su radio. Si la placa es una placa dividida, el usuario también debe introducir la ubicación de la división. Un ejemplo de esto se muestra en la figura 2(c) y en la parte inferior izquierda de la figura 2(a). El segundo método consiste en manipular un conjunto de marcadores sobre la vista previa del video en vivo. El usuario coloca el círculo alrededor del agar a través de tres puntos, que el usuario puede mover de forma interactiva. Estos tres puntos definen de forma única un círculo. Un cuarto punto de control permite al usuario especificar la ubicación de la división central, si es apropiado. Dichos puntos de control son rápidos y fáciles de colocar con mucha precisión. La figura 3 muestra un ejemplo de cómo podría ser tal interacción. En un sistema con una colocación de placa de cultivo robótica, se conocerá la ubicación de la placa de cultivo y se podrá calcular la ubicación de la división.
Los ajustes de exposición y luz pueden extraerse de una base de datos en función de la placa de cultivo, muestra y tipo(s) de agar seleccionados.
La exposición correcta es importante para la captura de imágenes de buena calidad. Durante la prueba de la cámara 106, se determinó que se requieren exposiciones distintas para cada lado de una placa de cultivo dividida, debido a las diferentes opacidades de los diferentes tipos de agares que pueden contener. La elección de la iluminación también influirá en gran medida en los ajustes de exposición necesarios, por lo que el usuario también puede obtener una vista previa de la imagen en cualquier configuración disponible, con las luces superior o inferior activadas. La figura 2(d) muestra los botones de radio que se pueden utilizar para seleccionar la luz superior o la luz inferior a activar. Aunque no se muestra, el usuario puede elegir alternativamente la luz de ángulo lateral a activar.
El usuario puede ajustar los ajustes de exposición, por ejemplo, utilizando una gama de algoritmos de exposición automática que pueden seleccionarse mediante un menú desplegable como el que se muestra en la figura 3(e). Cada uno de los algoritmos de exposición automática tiene el mismo núcleo. Dado un brillo determinado (target, tgt), btgt, y un brillo medido (measured), bmeas, la nueva (new) exposición, enew, se calcula como:
^meas
0, 8 p0id SÍ bmeas > 1
0 ,5 pold sí a < 0,5 p^new 2 pold sí a > 2
a pold de otra manera
Dicho de otro modo, si el brillo es demasiado alto (la imagen está saturada), reducir incondicionalmente la exposición al 80 % de su valor anterior. Si este no es el caso, el cambio se fija entonces entre 0,5 y 2. El ajuste se detiene si dos ajustes de exposición sucesivos tienen una diferencia de 10 microsegundos entre sí. Ambas medidas de brillo normalmente se representan como un número entre cero y uno, donde un valor de cero significa negro (sin brillo) y un valor de uno significa blanco (brillo total).
La diferencia entre los diversos algoritmos de exposición automática radica en cómo se calcula el brillo de la imagen actual. Los diferentes algoritmos que pueden utilizarse incluyen:
Media - En este modo, se calcula el brillo medio de todos los píxeles de la imagen.
Media ponderada al centro: la media ponderada al centro calcula el brillo medio de todos los píxeles, pero proporciona los píxeles dentro de V8 x r del peso adicional del centro (cada muestra del centro se cuenta 8 veces).
Puntual: Este método vuelve a calcular un brillo medio, pero solo de los píxeles dentro de V20% del centro. Este método no es tan apropiado para placas de agar, ya que el punto central no tiene un significado especial.
Mediana: este método calcula el brillo medio de la imagen mediante un cálculo de histograma. Cada bin del histograma tiene 4 niveles de anchura, por lo tanto, si las imágenes de entrada son de 16 bits, el histograma tiene 16384 bin. La verdadera profundidad de bits de las imágenes también podría leerse desde la cámara y proporcionarse al algoritmo.
Verde - Este método es el mismo que el de la Media, pero utiliza solo el canal verde para calcular el brillo. Esto es ventajoso por dos razones. En primer lugar, hay el doble de píxeles verdes verdaderos en una imagen en mosaico de Bayer que rojos o azules. En segundo lugar, el ojo humano es sensible al verde, por lo que utilizarlo para ajustar las imágenes debería proporcionar una imagen conceptualmente de alta calidad.
El software 142 puede incluir además procesos para ayudar al usuario a seleccionar buenos ajustes de exposición, por ejemplo, pulsando píxeles entre su color normal y el rojo. Esto ayuda a identificar píxeles sobreexpuestos o saturados que pueden corregirse reduciendo el brillo determinado de la imagen.
Los ajustes de exposición inicial se cargan desde la base de datos y se ajustan antes de cada captura utilizando uno de los algoritmos descritos anteriormente. Una vez finalizados los ajustes de exposición para una configuración de iluminación dada, la captura de imágenes se realiza utilizando un método que se muestra en la figura 4. En la etapa 164, se inicia la captura, en la etapa 166 se activa la configuración de iluminación (p. ej., el anillo de luz 110). Utilizando esta configuración de iluminación, el dispositivo de captura de imágenes 104 captura la imagen en la etapa 168. La captura de imágenes se repite varias veces para cada placa de cultivo, teniendo cada vez la misma exposición (etapa 170). Cada una de estas imágenes se promedia entre sí durante la fase de procesamiento para reducir el ruido de la imagen. Basta con una secuencia de cinco imágenes. El proceso se repite para el otro lado de la placa de cultivo en el caso de una placa de cultivo dividida (etapa 172) y para otras configuraciones de iluminación, p. ej., para el dispositivo de iluminación inferior 114 (etapa 174). En la etapa 176, las imágenes capturadas se entregan para el procesamiento de datos y luego se completa la captura de imágenes (etapa 178). Como ejemplo, capturar una imagen de una placa de cultivo dividida puede requerir 5 x 2 x 2 = 20 imágenes, lo que tardaría unos 2 segundos, suponiendo que la cámara 106 funcione a 9 fotogramas por segundo.
Una vez capturadas las imágenes, pueden transferirse a un subproceso de ejecución distinto para el procesamiento asíncrono. La ventana de captura vuelve a esperar a que se introduzca un código de barras. Cada vez que se captura una imagen de placa de cultivo, la imagen, junto con cualquier metadato destacado se guarda en la biblioteca.
Se apreciará que aunque en el software descrito anteriormente, se requiere que el usuario coloque la placa de cultivo e introduzca los metadatos, este proceso podría automatizarse. Por ejemplo, un brazo robótico puede colocar la placa de cultivo en el soporte antes de la captura de imágenes y retirarla después de la captura de imágenes. El software podría detectar automáticamente la posición de la placa de cultivo en la imagen y si está dividida o completa. Puede usarse un sistema robótico para leer un identificador o código de barras en la placa de cultivo. El código de barras u otro identificador puede permitir el acceso a información como el tipo de placa de cultivo, tipo de muestra y tipo de agar para que el usuario no tenga que introducir esta información. En una versión del software destinada al procesamiento totalmente automático, el usuario no ajustaría la exposición o los ajustes de brillo determinado.
Procesamiento de imágenes
Una vez capturadas las imágenes con buena exposición, los datos sin procesar del dispositivo de captura de imágenes se procesan para obtener una imagen más precisa de la muestra que puede utilizarse para generar imágenes características para su uso en el algoritmo de refuerzo para generar el clasificador reforzado. Se apreciará que aunque esta realización describe el uso de un algoritmo reforzado, el clasificador podría generarse alternativamente usando una técnica diferente.
Con referencia al método que se muestra en la figura 5, el procesamiento de imágenes comienza en la etapa 163, e incluye, en la etapa 165, promediar las imágenes tomadas por el dispositivo de captura de imágenes, en la etapa 167 la interpolación cromática de las imágenes promediadas, en la etapa 169 corregir el color de la imagen resultante, en la etapa 171 calcular los vectores característicos y en la etapa 173 detener el procesamiento.
Las imágenes se promedian para combinar las cinco (u otro número) de imágenes tomadas con las mismas exposiciones en una sola imagen general. El uso de cinco imágenes promediadas reduce los efectos del ruido.
La interpolación cromática se realiza porque la mayoría de las cámaras tienen sensores que pueden medir solo un color en cada ubicación física, por ejemplo, utilizando una disposición de Bayer de filtros de color. Esto significa que los datos sin procesar de la cámara son un patrón de mosaico de píxeles individuales rojos, verdes y azules. Los métodos adecuados de interpolación cromática incluyen:
o Vecino más cercano: el vecino más cercano es un método sencillo que produce resultados de baja calidad. En este método, cada bloque de 2 x 2 se procesa en conjunto. Los valores rojo y azul se copian desde su ubicación original a los otros tres píxeles a los que les falta ese valor respectivo. Los valores verdes se pueden copiar vertical u horizontalmente. Esto da como resultado que cada bloque de 2 x 2 tenga todos los canales llenos en todas las ubicaciones.
◦ Submuestreo: el método de submuestreo produce posiblemente los mejores resultados a expensas de la resolución. En este método, cada bloque de 2 x 2 se contrae en un solo píxel. Los dos valores verdes se promedian y los valores rojo y azul simplemente se asignan. Este método no requiere interpolación y, por lo tanto, es el más fiel a los datos de píxeles originales.
◦ Interpolación cromática dirigida por homogeneidad adaptativa (DHA): este algoritmo ha resultado ser el más adecuado. Detalles del proceso DHA pueden encontrarse en K. Hirakawa y T. W. Parks. "Adaptive homogeneity-directed demosaicing algorithm" ICIP, 2003. En esencia, la DHA avanza interpolando vertical y horizontalmente el canal verde para producir dos imágenes. A cada uno de estas se la añade un canal rojo y azul homogeneizando la diferencia entre los canales rojo y verde y los canales azul y verde. Por último, las dos imágenes se combinan identificando regiones homogéneas y seleccionando la imagen más apropiada para dibujar píxeles en cada punto. Este proceso genera un resultado de muy alta calidad.
La corrección de color de la imagen implica la corrección del equilibrio de blancos y del brillo, y el uso de un mapeo precalculado para mapear el color aparente de la imagen promediada al color verdadero. El equilibrio de blancos y la corrección del color son beneficiosos para garantizar una determinación exacta del color (o clores) del agar y de la colonia, lo cual es importante para la especiación y la detección de fenómenos como la fermentación y la hemólisis. Por lo tanto, la calibración del color de alta calidad es importante.
Los parámetros de equilibrio de blancos y corrección de color utilizados para corregir la imagen son específicos del dispositivo de captura de imágenes y la disposición de la iluminación y se calculan previamente mediante una tabla de colores. Con referencia a la Fig. 6(a), en la etapa 180, se captura una imagen de una tabla de colores de referencia. El gráfico puede ser un "Gráfico de reproducción de color Gretagmacbeth ColorChecker™" estándar, que tiene 24 parches de color, cada uno de los cuales tiene un valor de canal rojo, verde y azul de referencia. La imagen puede capturarse activando la cámara 106 manualmente o mediante señales electrónicas enviadas utilizando el software 142. Los datos capturados por los sensores de la cámara se transmiten al ordenador 36 a través de la conexión física o inalámbrica, con la calibración de color deshabilitada.
En la etapa 182, el usuario indica la ubicación de cada parche de color en la tabla de colores de referencia. Por ejemplo, el software podría hacer que una GUI muestre una vista previa de la imagen de la cámara 106, y el usuario puede hacer clic en los cuatro cuadrados de las esquinas del gráfico en un orden específico para permitir que se determinen las ubicaciones de los parches de color. En otras alternativas, la ubicación de los parches puede determinarse utilizando una interfaz de usuario diferente, técnicas de visión artificial o mediante la colocación de la tabla de colores de referencia en una ubicación específica conocida que está a una distancia fija de la cámara.
El color promedio de cada ubicación se captura en una ventana de 21 x 21 píxeles y se utiliza para el color del parche en la etapa 184. Por supuesto, se apreciará que pueden utilizarse ventanas de píxeles de diferentes tamaños para calcular el color promedio.
En la etapa 186, el equilibrio de blancos se calcula a partir de un solo parche, es decir, el tercer parche gris más oscuro en la tabla de colores de referencia. Se supone que los valores R, G y B son iguales en este parche gris neutro. El equilibrio de blancos se representa como:
rr'1 wrr
9 — 9
\-b'\ Wbb_
donde Wg se define implícitamente como uno. Las ponderaciones Wr y Wb se calculan para producir valores de r' y b' iguales al valor de g'. Los valores calculados de equilibrio de blancos w = [wr 1 , wt] se utilizarán para corregir el equilibrio de blancos de las imágenes capturadas por la cámara.
Una vez calculado el equilibrio de blancos, en la etapa 188, se calcula una curva C que mapea los valores de color gris aparentes lo mejor posible. Esto proporciona un mapeo de brillo para la cámara. La forma de la curva es: g ’ = agb + c donde g es el color de entrada, g' es el resultado y a, b y c son los parámetros de la curva C que se calculan. La Fig. 7 muestra una curva de ejemplo obtenida de este proceso. Una vez estimado, la curva puede aplicarse independientemente por canal de color. La fase final de la función de mapeo de color (etapa 190) tiene como objetivo producir un mapeo para el tono y la saturación de cada píxel.
Se miden el tono aparente y la saturación de una pluralidad de parches de color, basándose en el equilibrio de blancos y en la imagen con corrección de color y en la etapa 190 se calcula un mapeo de tono y saturación. El mapeo de tono se proporciona utilizando una serie de puntos de control para mapear los valores de tono aparentes a los valores de tono reales. Para ello se utiliza interpolación cúbica (u otro método de interpolación de orden superior). Cada punto de control consta de una posición en un espacio de tono circular, que es fijo, y un desplazamiento angular, que se calcula durante la optimización. El desplazamiento se interpola cúbicamente para proporcionar un desplazamiento para un valor de tono particular que asignará el valor de tono particular a un tono real.
La función de mapeo de saturación utiliza una serie de puntos de control para escalar los valores de saturación. Estos puntos de control pueden ser iguales o diferentes de los puntos de control utilizados para mapear los valores de tono. La función de mapeo de saturación puede utilizar el mismo esquema de interpolación que la función de mapeo de tono. Tenga en cuenta que la saturación debe estar en el intervalo [0, 1] y, por lo tanto, el valor de salida de esta función se fija para garantizar que se cumpla este intervalo. En una alternativa, el mapeo de saturación puede realizarse a través de una curva similar a la aplicada para la corrección de brillo.
Los puntos de control utilizados en las funciones de mapeo de tono y saturación pueden distribuirse uniformemente alrededor del borde del espacio de tono circular como se muestra en la Fig. 8. Este espacio de tono circular incluye 16 puntos de control, representados por círculos de colores (por ejemplo, punto de control 192). Por ejemplo, el círculo de color con tonalidad de 0 grados y saturación de 1 puede ser rojo, con un tono de 90 grados y una saturación de 1 puede ser verde, con un tono de 180 grados y una saturación de 1 puede ser azul y con un tono de 270 grados y una saturación de 1 puede ser púrpura. La dirección del desplazamiento angular 194 y la escala 196 también se muestran en la Fig. 4. La posición angular de los puntos de control se define por su valor de tono y la posición radial de los puntos de control se define por su saturación. Se muestran dos anillos de puntos de control, un anillo interior con una saturación de 0,5 y un anillo exterior con una saturación de 1. En el caso de un solo anillo de puntos de control, solo se requiere un único valor para seleccionar el punto apropiado, el valor correspondiente al tono. El tono se expresa como un ángulo y la función debe tener esto en cuenta al seleccionar los puntos de control.
El número máximo de puntos de control se define por el número de muestras de color disponibles. Cada punto de control tiene dos parámetros y cada muestra proporciona tres residuales. Así pues, n muestras de color pueden tener como máximo 3n/2 puntos de control. Sin embargo, en la práctica, el proceso de medición induce errores en las mediciones de color. La selección de los puntos de control puede incluir el cálculo de un error para una serie de mapeos candidatos utilizando diferentes números de puntos de control, y la selección de un mapeo de la serie basado en el número mínimo de puntos que produce un error aceptable. Se ha descubierto que 12 puntos de control son suficientes para un gráfico con 24 parches.
Dado que la curva de brillo ya ha sido estimada, se supone que los valores de brillo son correctos, por lo tanto, no es necesario ajustarlos. Los desplazamientos angulares y las escalas se optimizan para mapear mejor los colores aparentes de los parches de la imagen en los colores reales de los parches de color equivalentes en la tabla de colores de referencia. Esto se hace calculando un mapeo f (p), de manera que se minimice la distancia entre los colores reales y mapeados:
Figure imgf000016_0001
donde Pe es un color verdadero yP* es un color medido. El color puede representarse en cualquier espacio de color, por ejemplo RGB, YUV, LAB or XYZ.
La función de coste incluye términos que garantizan que las escalas mantengan un valor de aproximadamente uno y los desplazamientos de aproximadamente cero para evitar cambios muy grandes (como desplazamientos mayores a 360°). Dada la siguiente medida de error:
Figure imgf000017_0001
dónde Si es el desplazamiento del punto de control y Si es la escala del punto de control. Se busca seleccionar Si y Si para minimizar G es decir
argm in5l..5m,Si ...sJ e | |2
Se puede obtener una solución a esta ecuación utilizando el algoritmo de Levenberg-Marquardt, aunque cualquier otro minimizador sin restricciones también sería suficiente. La función de coste intenta minimizar el error al mapear los colores juntos, mientras mantiene los desplazamientos de tono cerca de cero y las escalas de saturación cerca de uno.
En resumen, se determina un desplazamiento angular 194 y una escala 196 para cada punto de control de modo que la suma de los cuadrados de la distancia entre cada color aparente transformado (por ejemplo, RGB) y el color de referencia (por ejemplo, RGB) para cada parche se minimice mientras se mantiene el desplazamiento angular cerca cero y la escala cercana a uno (minimiza 1 menos la escala).
La figura 9 muestra una representación gráfica de (a) el mapeo a través del espacio de tono/saturación, (b) la función de mapeo de tono aislada y (c) la función de mapeo de saturación aislada para una cámara en particular. La figura 10 proporciona algunos detalles sobre la precisión del mapeo. Cada posición en el eje y representa uno de los 24 parches de color y el eje x representa los valores de color, donde cada uno puede estar entre cero y uno. En la figura 11 se muestra un ejemplo de corrección de color de una imagen mediante el mapeo. La primera imagen (a) muestra la imagen de entrada, capturada por la cámara, después de que el usuario haya seleccionado la posición de los parches de color. Tenga en cuenta que en este ejemplo, el equilibrio de blancos ya es más o menos correcto. La segunda imagen (b) muestra los colores corregidos. Los pequeños cuadrados de colores visibles sobre los parches muestran el verdadero color de cada parche.
Este mapeo puede utilizarse para corregir el color de una imagen capturada utilizando el mismo (o el mismo tipo de) dispositivo de captura de imágenes. Con referencia a la figura 12, un método para mapear un color aparente a un color real incluye en la etapa 181 capturar una imagen utilizando la cámara. Los valores de color RGB aparentes de cada píxel pueden determinarse y los valores de color pueden corregirse con respecto al equilibrio de blancos y brillo utilizando los pesos/curva calculados previamente. El método implica entonces la etapa 183 para uno o más píxeles en la imagen determinando el tono aparente y la saturación del píxel (etapa 185), interpolar entre los desplazamientos angulares de dos o más puntos de control en el espacio circular de tono para determinar un desplazamiento angular asociado con el tono aparente (etapa 187), interpolar entre las escalas de los dos o más puntos de control en el espacio de tono circular para determinar una escala asociada con la saturación aparente (etapa 189), aplicar el desplazamiento angular al tono aparente (etapa 191), y aplicar la escala a la saturación aparente (etapa 193).
Una vez aplicado el mapeo, el color del espacio HSV puede volver a transformarse en el espacio RGB o en cualquier otro espacio de salida que se desee.
Un método lineal también puede sustituirse por el método HSV, donde los colores se mapean a través de:
wrr y + cr
23X3 &r cg
wbbr cb
donde T es una matriz de transformación de 3x3 y las variables restantes son escalares.
La Fig. 13 muestra la canalización de captura de imágenes general de una placa de cultivo dividida que tiene la mitad de agar sangre y la mitad de agar cromogénico. La canalización se ejecuta dos veces, una vez para cada configuración de iluminación (luz superior iluminada y luz inferior iluminada). La canalización también tiene dos ramas, para capturar imágenes de cada lado de la placa de cultivo por separado, optimizándose cada rama para el tipo de agar. Dada una placa de cultivo 200 de entrada, la exposición se establece para la mitad cromogénica 202 o de sangre 204, después, las imágenes sin procesar 206, 208 de la cámara se capturan e interpolan cromáticamente 210, 212 para producir dos imágenes RGB distintas. Las mitades relevantes de las imágenes interpoladas cromáticamente se unen para formar una imagen compuesta 214 con corrección de color 216. En una alternativa, las imágenes sin procesar pueden componerse entre sí y la imagen compuesta se puede interpolar cromáticamente, reduciendo el cálculo requerido.
Una vez promediadas las imágenes, la interpolación cromática y calibrado de color, el resultado son datos de imagen para un medio. Para obtener datos de imagen para entrenar el clasificador puede utilizarse el mismo proceso de captura y procesamiento de imágenes y los datos de imagen para clasificar una placa de cultivo.
Etiquetado de imágenes
Con el propósito de entrenar al clasificador, un microbiólogo experimentado etiqueta los datos de las imágenes. Esto se puede realizarse fuera del sitio y lejos del aparato de obtención de imágenes e iluminación. El etiquetado es el proceso de proporcionar etiquetas correctas para los datos de imagen de una placa de cultivo en particular. La elección de las etiquetas es diferente para los diferentes tipos de bacterias y agar de interés. En el momento del etiquetado, el operario también puede verificar los metadatos de la placa de cultivo para asegurarse de que sean correctos.
El etiquetado puede realizarse con herramientas de dibujo sencillas, la habituales de cualquier software de pintura. El programa de etiquetado puede cargar metadatos asociados con una imagen en particular y usar eso para determinar qué organismos son aplicables a una placa de cultivo en particular. Después, el usuario puede seleccionar qué lado de la placa de cultivo desea etiquetar, si es una placa de cultivo dividida, lo que puede cambiar el conjunto de organismos disponibles. En una realización, habiendo elegido un organismo para pintar, el usuario tiene tres herramientas principales disponibles para pintar: Una herramienta de pincel, una herramienta de relleno y un borrador. La herramienta de pincel es un pincel circular de tamaño variable. La herramienta de relleno realiza un relleno por inundación desde el punto situado debajo del cursor. Rellena regiones contiguas de fondo o un color de etiqueta en particular, dependiendo de lo que estaba bajo el cursor cuando se hizo clic. El borrador funciona igual que la herramienta de pincel, pero escribe la etiqueta 'desconocido' en lugar de una etiqueta de organismo.
El usuario también puede disponer de otras herramientas: un gotero, un inspector y una herramienta de ubicación de placas. El gotero se utiliza para cambiar el organismo actualmente seleccionado al que está debajo del cursor. También establece el estado de la ventana al nombre del organismo bajo el cursor, al mover el ratón por la pantalla. El inspector establece el estado de la ventana en el color actual debajo del cursor y la posición en píxeles del cursor en la imagen. También resalta cualquier organismo debajo del cursor y proporciona su tamaño en píxeles. La herramienta de ubicación de placas es la misma que la de la herramienta de la ventana de captura y se utiliza para ajustar la posición de la placa de cultivo en la imagen.
Cuando el microbiólogo selecciona una zona en los datos de la imagen para darle una etiqueta particular, a cada píxel dentro del área seleccionada se le asigna esa etiqueta. Los datos de imagen etiquetados se almacenan en la biblioteca, junto con los metadatos extraídos de las etiquetas.
Entrenamiento
Utilizando las etiquetas proporcionadas por el usuario para un conjunto de imágenes y vectores característicos (que se describen a continuación), se entrena un clasificador de árbol de decisiones reforzado para distinguir entre la propia placa y el crecimiento bacteriano, y entre diferentes tipos de crecimiento.
En cuanto a la figura 14, un método para entrenar el clasificador incluye, en la etapa 220, obtener datos de imagen etiquetados de una pluralidad de muestras de crecimiento microbiano, en la etapa 222, para cada dato de imagen etiquetado: para una pluralidad de píxeles en los datos de la imagen, generar un vector característico de valores obtenidos aplicando uno o más filtros a los datos de la imagen (en la etapa 224), y en la etapa 226, utilizar los vectores característicos para entrenar un clasificador reforzado para clasificar cada píxel en la pluralidad de píxeles según una etiqueta asociada con el píxel en los datos de la imagen etiquetados.
El uno o más filtros se aplican para transformar los datos de la imagen y extraer información que se utiliza para entrenar el clasificador, permitiéndole aprender las características distintivas de cada tipo de crecimiento bacteriano. Los filtros extraen información sobre el color y la textura de la placa de cultivo en y alrededor de cada píxel. La salida de los filtros puede ser un conjunto de imágenes características. A continuación se dan algunos ejemplos de filtros y sus imágenes características resultantes:
Filtro RGB: algunos tipos de crecimiento se pueden distinguir fácilmente por su color. El filtro RGB es el tipo de filtro más sencillo y copia los canales RGB de los datos de la imagen en el vector característico, dando los valores R, G y B de cada píxel. La figura 15 muestra los datos de la imagen original (a), la imagen característica del canal rojo (b), la imagen característica del canal verde (c) y la imagen característica del canal azul (d).
Filtro LAB: el filtro LAB proporciona información de color adicional. Este filtro convierte principalmente los datos de imagen RGB en el espacio de color LAB (donde el canal L representa la luminosidad y los canales A y B contienen información de color). Este espacio permite realizar una discriminación más fácil entre los colores de algunos tipos de bacterias. Además, este filtro puede utilizarse para medir la media y la varianza de L, A y B en ventanas de diferentes tamaños. Se ha observado que las ventanas de 5 x 5, 11 x 11 y 21 x 21 proporcionan buenos resultados. Esta información adicional sobre el color en la vecindad de un píxel puede ayudar a distinguir entre tipos con una apariencia similar, que pueden compartir colores para píxeles individuales, pero difieren en la gama de colores que se ven en regiones más grandes. La figura 16 muestra una imagen característica L (a), una imagen característica A (b), una imagen característica B (c), una varianza de L en una imagen característica de ventana de 11 x 11 (d), una varianza de A en una imagen característica de ventana de 11 x 11 (e), una varianza de B en una imagen característica de ventana de 11 x 11 (f), una media de L en una imagen característica de ventana de 11 x 11 (g), una media de A en una imagen característica de ventana de 11 x 11 (h) y una media de B en una imagen característica de ventana de 11 x 11 (i). Filtro gaussiano orientado, que aplica en la imagen un núcleo gaussiano 1D en una variedad de direcciones. También es posible utilizar derivadas de primer y segundo orden del núcleo Gaussiano.
Filtro de posición: el filtro de posición proporciona al clasificador la distancia de cada píxel desde el borde de la placa de cultivo. Esta característica se debe a la observación de que a menudo hay casos muy complicados en el borde de la placa de cultivo, ya sea en el menisco del agar o sobre los pies de plástico de la placa. La presencia de la información de posición permite que el clasificador se adapte al aspecto variable de la placa de cultivo a diferentes distancias desde el borde. La distancia de cada píxel desde el borde se obtiene realizando una transformación de distancia en la imagen de la máscara. En la figura 17 se muestra un ejemplo de una imagen de característica de posición.
El filtro de cuantificación de color, donde se reduce el número de colores en la imagen, generalmente a través de un histograma, ayuda a localizar zonas de color similar.
Filtro de textura: la información de textura ayuda al clasificador a distinguir entre tipos con colores similares, pero diferentes texturas superficiales. Al aplicar el filtro de textura, la imagen se convierte primero a escala de grises. Para reducir el ruido, la imagen se homogeneiza después mediante convolución con un núcleo Gaussiano. El núcleo gaussiano 2D se define como:
1 x2 y 2
G(x,y) exp (
2 na2 2 a2 ■)
Como este núcleo es linealmente separable, en la práctica, esta convolución se realiza convolucionando primero con un núcleo gaussiano 1D G(x) = ^ j^ e x p ( - ^ ^ e n la dirección x, y después convolucionando con un núcleo 1D en la dirección y, siendo o = 4:0. Después, el filtro de textura extrae información de borde, devolviendo en cada píxel los gradientes de imagen x e y en una escala de grises. Los valores de gradiente de los píxeles se extraen por convolución con los núcleos de Sobel,
-1 0 1
Dx -2 0 2
-1 0 1
y
-1 -2 -1
S y 0 0 0
1 2 1
En la figura 18(a) se muestra una imagen característica de valores de gradiente en la dirección x, y en la figura 18(b) se muestra una imagen característica de valores de gradiente en la dirección y.
El filtro también calcula una métrica de homogeneidad en ventanas de 5 x 5, 13 x 13 y 21 x 21 píxeles alrededor del píxel, midiendo la textura de la placa de cultivo en esa región. La métrica de homogeneidad utilizada es el rastro de la matriz de covarianza de los valores de gradiente en cada ventana, dando una medida de la varianza total del gradiente en esa ventana. En la figura 17 (c), se muestran ejemplos de imágenes características de homogeneidad para una ventana de 5 x 5, 13 x 13 y 21 x 21, (d) y (e) respectivamente.
Una vez creadas las imágenes características, se genera un vector de valores característicos x = (x1, ..., Xn) para cada uno de una pluralidad de píxeles a partir de estas imágenes características y se pasa al clasificador. Si hay más de una imagen de una placa de cultivo (por ejemplo, un conjunto de primeras imágenes tomadas con una configuración de iluminación superior y un conjunto de segundas imágenes tomadas con una configuración de iluminación inferior), entonces el vector característico puede incluir valores de imágenes características creadas utilizando uno o ambos conjuntos de imágenes. Una etiqueta y asociada con cada píxel también se pasa al clasificador.
Se puede generar un vector característico para cada píxel en los datos de la imagen, o solo en relación con una muestra de píxeles. El muestreo de los píxeles reduce el cálculo requerido y, por lo tanto, reduce el tiempo necesario para entrenar el clasificador. Se puede utilizar un procedimiento de muestreo aleatorio para seleccionar el conjunto de ejemplos utilizados en el entrenamiento del conjunto completo de píxeles etiquetados. Este puede ser un procedimiento de muestreo disperso o de muestreo denso. El método de muestreo disperso construye un grupo distinto de cada clase que se entrena, de las cuales se seleccionan N muestras. Si el número de píxeles etiquetados para una clase es menor que este número especificado de muestras, los píxeles se muestrean con reemplazo. El entrenamiento en conjuntos de ejemplos del mismo tamaño de cada clase impide sesgar al clasificador hacia un mejor rendimiento en los tipos más comunes. El método de muestreo denso recupera una de cada N muestras. Al entrenar el clasificador de fondo, el conjunto de ejemplos negativos incluye ejemplos de cada tipo de crecimiento. Para muestras N negativas y tipos de crecimiento J, se seleccionan N/J muestras de cada tipo.
Para clasificar cada píxel y, por lo tanto, etiquetarlo como fondo de placa o como uno de un conjunto de tipos de crecimiento, debe entrenarse un clasificador. En esta realización, se entrena un clasificador reforzado, utilizando árboles de decisión como clasificadores débiles. En el entrenamiento, se construye recurrentemente un árbol de decisión, comenzando con un nodo raíz, encontrando la prueba en cada nodo que da la división óptima de los datos de entrada en muestras positivas y negativas, dividiendo después los datos según la prueba y repitiendo el proceso para cada nodo secundario en su subconjunto de datos. Un nodo secundario se dividirá a menos que el árbol haya alcanzado una profundidad máxima especificada, que todas las muestras de un nodo pertenezcan a la misma clase, que no se pueda encontrar ninguna división que proporcione una separación de datos mejor que la aleatoria o que un nodo tenga muy pocas muestras para realizar una división significativa. En la figura 19 se muestra un ejemplo de un árbol de decisión.
El procedimiento de refuerzo utilizado en esta realización es Discrete AdaBoost. El pseudocódigo de Discrete AdaBoost se proporciona a continuación:
Algoritmo 1 Discrete AdaBoost_________________________________________________ Inicializar pesos w* = F, * = i , ...,f
para t = 1,...,T hacer
Entrena clasificador débil ht (x) e {-1,1}, minimizando el error et = £ f=1 w^y; ^ ht (x;)] Calcular Yt = log (1 ]F)
et
Establecer w; ^ w; exp(ít [y¡ ^ ht (x;) ] ) , í = 1,...,e
Renormalizar los pesos, w; ^
Figure imgf000020_0001
fin para
Salida del clasificador final fo(x) = s e ñ a lg ^ YA(x)1_______________________________
Discrete AdaBoost entrena iterativamente una serie de clasificadores T débiles h t(x), adaptándose para mejorar el rendimiento del entrenamiento con cada clasificador adicional. Cada clasificador se entrena en el conjunto de N ejemplos de entrenamiento etiquetados (x, y), con un peso w i asociado con cada ejemplo que indica la importancia relativa de ese ejemplo. Cada ejemplo de entrenamiento (x, y) consta de un vector característico de valores x = (x1, ... Xn), y una etiqueta y e {-1,1} que indica si es un ejemplo positivo (+1) o negativo (-1). El clasificador débil está optimizado para minimizar el error £ t, que es la suma de los pesos de los ejemplos clasificados incorrectamente por ese clasificador.
Después de entrenar un clasificador óptimo para un conjunto dado de pesos, los pesos se actualizan para dar mayor importancia a los ejemplos que están mal clasificados por el conjunto actual de clasificadores, para mejorar el rendimiento en estos ejemplos para el próximo clasificador. Esto se hace aumentando el peso de un ejemplo mal clasificado en función del error del clasificador y normalizando los pesos en todos los ejemplos.
Para clasificar para más de dos tipos utilizando un clasificador binario, se puede utilizar el procedimiento AdaBoost.MH. En este algoritmo, se añade un valor característico adicional al vector característico para cada píxel, que tiene un valor entero (1, ..., J) que indica la clase del ejemplo de entrenamiento. Para las clases J, cada ejemplo de entrenamiento se repite J veces con la etiqueta y para el ejemplo establecido en 1 si J es la clase de la muestra, o -1 en caso contrario. Al píxel se le asigna la clase con el resultado del clasificador más fuerte. Se puede establecer un valor de confianza para ese píxel dependiendo de la fuerza relativa del clasificador más fuerte.
Por ejemplo, el valor de confianza pli(x) al asignar la etiqueta al vector característico xi calculado con la fórmula para la probabilidad de clasificación correcta en un clasificador multiclase con clases J, puede obtenerse utilizando la siguiente ecuación:
Figure imgf000020_0002
Se pueden ejecutar varios clasificadores de forma independiente en paralelo para obtener resultados para tipos de colonias particulares, tipos de medios, desorden de fondo, propiedades de colonias adicionales u otras características distintivas.
Para mejorar la velocidad y el rendimiento de la clasificación, la clasificación puede realizarse como un proceso de dos fases. En la primera fase, un clasificador binario, que distingue entre píxeles de fondo y los restantes tipos, clasifica rápidamente la mayoría de los píxeles de fondo. Después, un clasificador multiclase clasifica los píxeles restantes.
El clasificador binario inicial puede seguir el método del clasificador en cascada. Este clasificador pretende clasificar rápidamente gran parte del fondo, con una clasificación más precisa realizada en la siguiente fase. Como tal, una tasa de falsos positivos relativamente alta (píxeles de fondo clasificados como primer plano) es aceptable, ya que los píxeles mal clasificados pueden clasificarse correctamente en la siguiente fase. Sin embargo, la tasa de falsos negativos debe ser muy baja, ya que esto no se puede corregir en la siguiente fase. Para una clasificación rápida, el número de árboles utilizados por el clasificador se mantiene lo más pequeño posible. Se entrena un clasificador inicial y se prueba su rendimiento de clasificación frente a una tasa máxima de falsos positivos especificada. Si es mayor que este umbral, se entrena un nuevo clasificador, y esto continúa hasta que la combinación de clasificadores tiene la tasa de falsos positivos deseada. A medida que se añade cada clasificador, el umbral de la clasificación en primer plano se ajusta para lograr la tasa de falsos negativos deseada para esa etapa del clasificador.
A continuación se proporciona un pseudocódigo para entrenar una cascada de clasificadores:
Algoritmo 2 Cascada________________________________________________________________
F0 = 1,0, D0 = 1,0
i = 0
mientras Fi > Fdeterminado hacer
i^ i + 1
ni 0; F-1
mientras Fi > f x Fu hacer
n ^ rn + 1
Use AdaBoost para entrenar un clasificador con ni árboles utilizando ejemplos de entrenamiento en P y N
Establecer ti por lo que el clasificador en cascada actual tiene una tasa de detección > dxD-1 Evaluar Fi
terminar mientras
N ^ 0
si Fi > Fdeterminado entonces
Clasifique el conjunto de ejemplos negativos y añada detecciones falsas al conjunto N
terminar si
terminar mientras
donde f es la tasa máxima aceptable de falsos positivos por fase, d es la tasa mínima aceptable de verdaderos positivos por capa, Fi es la tasa de falsos positivos para la fase i, Di es la tasa de verdaderos positivos para la fase i, Fdeterminado es la tasa máxima general de falsos positivos, P es el conjunto de ejemplos positivos, N es el conjunto de ejemplos negativos, y ti es el umbral de clasificación para cada capa, por encima del cual una predicción del clasificador en esa fase se considera positiva.
El resultado de la fase de entrenamiento es un clasificador reforzado que puede utilizarse para clasificar píxeles en datos de imágenes de nuevos especímenes.
Para mejorar los resultados de la clasificación, las etiquetas en los datos de la imagen etiquetada se pueden editar, principalmente para corregir errores del clasificador, y el clasificador se puede volver a entrenar, creando un circuito de retroalimentación. Esto puede repetirse cualquier número de veces, pero, en la práctica, dos o tres veces suele ser suficiente. Los resultados de un clasificador también pueden utilizarse como entrada en un filtro, para crear vectores característicos para entrenar un nuevo clasificador como se describe anteriormente.
El clasificador puede entrenarse en un servidor, con una biblioteca de datos de imágenes de entrenamiento. Se puede ejecutar un programa de entrenamiento y, al finalizar, escribir un clasificador, junto con varias estadísticas y resultados de la ejecución del entrenamiento. El clasificador puede utilizarse para etiquetar automáticamente píxeles en una nueva placa de cultivo.
Análisis automático de placas
En la figura 20 se muestra un método para analizar una nueva placa de cultivo que tiene un crecimiento microbiano desconocido. En la etapa 250, se establecen los metadatos para la placa de cultivo. Un usuario puede introducir los metadatos u obtenerse de un Sistema LIM como se describe anteriormente. Las opciones para los valores de los metadatos pueden elegirse de una base de datos biológica 252. En la etapa 254 se captura una imagen de la placa de cultivo (o se capturan imágenes de múltiples placas de cultivo si las placas de cultivo se procesan en masa). Un operario puede realizar la captura de imagen a través de un programa GUI como se ha descrito anteriormente. Después, el software toma la imagen, se interpola cromáticamente y detecta la ubicación de la placa de cultivo en la etapa 256, en la etapa 258 se ejecuta un conjunto de filtros de imagen sobre la imagen con interpolación cromática y después, en la etapa 260, se introducen los resultados en el clasificador apropiado. Las etapas de filtrado y clasificación se repiten si fuera necesario. Después, el clasificador genera una estimación por píxel de las bacterias en la placa de cultivo, que incluye una etiqueta prevista y el valor de confianza en la etiqueta. En la etapa 262 se ejecuta un corte de gráfico en la estimación y el resultado del corte de gráfico se utiliza para generar un informe en la etapa 264.
Los algoritmos de corte de gráfico calculan una división óptima de un gráfico en dos o más conjuntos. En la figura 21 se muestra un método para mejorar los resultados de la clasificación de píxeles. En la etapa 270, se construye un gráfico con cada nodo correspondiente a un píxel (o uno de una muestra de píxeles) en los datos de la imagen. También se añaden etiquetas, correspondiendo cada etiqueta a una clase. En la etapa 272, se añaden bordes entre nodos correspondientes a píxeles adyacentes o vecinos, y en la etapa 274 se añade un borde entre cada nodo y cada etiqueta. En la etapa 276, el algoritmo de corte de gráfico se utiliza para cortar los bordes de un nodo y dividir el gráfico en clases, utilizando el algoritmo de corte de gráfico como entrada los resultados de la clasificación de píxeles para el píxel correspondiente a ese nodo y los píxeles vecinos.
La figura 22 muestra un ejemplo de un gráfico inicial (a) y el gráfico dividido (b) que muestra el etiquetado después del corte. En la figura 22, un nodo fuente S y un nodo sumidero T corresponden a las posibles etiquetas de nodo. El corte del gráfico determina una etiqueta para cada nodo, cortando el borde entre cada nodo y el sumidero o fuente, y cortando los bordes entre nodos adyacentes con diferentes etiquetas. Cada vez que se corta un enlace en particular, se incurre en un coste. Al calcular el recorte de coste mínimo, el procedimiento de corte gráfico minimiza una función de energía de la forma:
Figure imgf000022_0001
donde I es el conjunto de etiquetas, N es el conjunto de nodos, M es el conjunto de todos los nodos vecinos, x es la característica de datos, U(li; xi) asigna un coste a cada nodo por cada posible asignación de etiqueta (implementada como un coste al cortar el borde a la fuente o sumidero), y V(lp, lq) asigna un coste a cada borde por asignar diferentes etiquetas a los nodos adjuntos.
U(lO,xO) = min ( - log(l,0 - pí¿(T;)) ,20,0)
pli(Xi) es el valor de confianza en la etiqueta de asignación li para el vector característico xi, calculado con la fórmula de probabilidad de clasificación correcta en un clasificador multiclase con J clases donde h(x,k) es el resultado del clasificador para la clase k:
Figure imgf000022_0002
mientras
v ( iP, i q) = \ 20,0 s i lp * l{
l 0 de otra manera
Otras entradas en el algoritmo de corte de gráfico pueden incluir el color de la imagen y los datos de los bordes. Además, el tamaño de colonia esperado para un etiquetado podría incluirse en la asignación de coste U(li; xi). Otro factor que puede tenerse en cuenta es una norma predeterminada de un sistema experto, como definiciones de tipos de colonias que no aparecerían una al lado de la otra o es probable que aparezcan juntas. Esto puede incorporarse al término de homogeneidad V(lp, lq).
Si el número de etiquetas posibles es mayor que 2, se utiliza un procedimiento de expansión alfa para realizar un etiquetado de clases múltiples a partir de un etiquetado binario. El pseudocódigo de un procedimiento de expansión alfa se proporciona en la página 2 de Yuri Boykov, Olga Vekslery Ramin Zabih ”Fast approximate energy minimization via graph cuts” IEEE Trans. Pattern Anal. Mach. Intell., 23:1222-1239, noviembre de 2001 como se muestra a continuación.
1. Comience con un etiquetado arbitrario f
2. Establecer éxito: = 0
3. Para cada etiqueta a E t
3.1. Encontrar € = argmin £ ( f ') entre f'dentro de una a - expansión de f (Sección 4)
3.2. Si £ ( f ) < £ ( f) , establecer f := f y exito := 1
4. Si éxito = 1 ir a 2
5. Volver a f
El procedimiento se repite sobre las etapas 3.1 y 3.2 para cada una de las posibles clases de, por ejemplo, tipo de bacteria o fondo, verificando si alguna etiqueta en diferentes clases podría cambiarse a esa clase sin aumentar la energía total E del gráfico. Una vez que se ha repetido el procedimiento para cada clase y no es posible reducir más la energía, se devuelve el etiquetado óptimo.
Al construir el gráfico, se añaden nodos auxiliares entre nodos adyacentes con diferentes etiquetas, incluyendo el coste de este etiquetado en el corte. La figura 23 muestra la adición de un nodo auxiliar a entre los nodos p y q, y da los pesos de borde para este gráfico. El coste de un corte es igual a la suma de los pesos de sus bordes. Para cada par de píxeles, un corte debe separar uno de los tres grupos de bordes, como se muestra en la figura 24. Este diagrama fue tomado de la página 6 del artículo de Yuri Boykov, Olga Vekslery Ramin Zabih. El procedimiento de expansión alfa determina cuál de los tres grupos tiene el peso de borde mínimo y corta estos bordes. A un píxel se le asigna la etiqueta alfa si el corte separa el píxel de la etiqueta alfa.
Una vez realizado el corte del gráfico, las clasificaciones resultantes de los píxeles pueden analizarse para generar una evaluación. Esto puede implicar contar cuántos píxeles están etiquetados en cada clase para determinar los tipos y cantidades de crecimiento en la placa de cultivo. Puede implicar evaluar si el número de píxeles de una clase particular es mayor que un número predeterminado.
Se proponen tres enfoques para contar colonias:
1. Recuento básico, donde el recuento de colonias se estima determinando un tamaño de colonia promedio para cada tipo de organismo en cada tipo de agar. El número de píxeles de cada organismo detectado en una placa de cultivo en particular puede dividirse entre este número para obtener el número de colonias.
2. Recuento basado en la densidad, donde la distancia desde el borde de cada colonia se incluye en el algoritmo de recuento. Esto se basa en la observación de que las grandes áreas de crecimiento deben contarse como varias colonias distintas. Por lo tanto, a los píxeles interiores en el centro de una colonia se les asigna mayor peso para lograr tal resultado. Se forma una tabla que mide muchos recuentos de colonias manualmente y se tabulan los resultados contra esta métrica. Después, la tabla puede utilizarse para obtener un recuento de colonias a partir de la métrica cuando se evalúa en una placa de cultivo nueva.
3. Recuento basado en el procesamiento de imágenes, donde la imagen que contiene las etiquetas se analiza primero mediante un algoritmo de componentes conectados. A su vez, cada componente detectado por este algoritmo se examina. Si una colonia en particular se considera demasiado grande según una tabla preestablecida de umbrales, entonces se aplica el método propuesto como número uno. Si la colonia se considera demasiado pequeña, se cuenta como una sola colonia. De lo contrario, se puede considerar la forma del componente. Si parece circular, cuenta como una sola colonia. De lo contrario, se aplica un algoritmo Watershed que divide el componente en colonias individuales, cada una de las cuales incrementa el recuento de colonias.
Después, los recuentos se cuantifican para producir una medida significativa de crecimiento para un experto en microbiología.
La evaluación puede incluir una identificación del medio como control negativo. Este método determina un valor esperado para el área de agar básico (p. ej., un número mínimo predefinido de píxeles clasificados como fondo) y este debe exceder un área mínima determinada para que la captura y el análisis de la imagen sean válidos. El área exacta de agar básico que debe ser visible se obtiene de una tabla de valores que depende del tipo de agar y de las otras bacterias que se identifican en la placa de cultivo.
Las normas clínicas se utilizan para analizar el resultado de las clasificaciones y/o cuantificaciones de píxeles y generar la evaluación. Las normas clínicas pueden incluir una tabla que incorpore el tipo de muestra del paciente, el tipo de agar, la mezcla de bacterias que se han identificado, estándares nacionales, práctica de laboratorio local y algunas normas personalizables por el usuario.
Los metadatos principales y los archivos de metadatos de placas pueden actualizarse para reflejar la evaluación y añadir más información extraída de las clasificaciones.
Además, basándose en la evaluación, cada placa de cultivo se envía después a una de las cuatro pilas de placas de salida del aparato 100 (no mostrado en las Figuras): (1) descartada, (2) reincubar, (3) identificación de bacterias potencialmente patógenas, o (4) revisión humana requerida. Se contempla que, en algunas formas, algunas de estas pilas puedan combinarse en una sola pila. En cualquier caso, un operario puede retirar después las placas de cultivo de las pilas de placas de salida para realizar otras acciones. Una vez procesadas todas las placas de cultivo, todo el flujo de trabajo puede repetirse o el sistema puede pararse.
A la luz de las enseñanzas anteriores, la presente invención puede implementarse en un software (software), soporte lógico (firmware) y/o equipo (hardware) de diversas maneras como lo entendería el experto en la materia.

Claims (15)

REIVINDICACIONES
1. Un método para analizar, mediante un aparato que comprende un procesador y una memoria, el crecimiento microbiano en un medio de cultivo sólido, incluyendo el método:
la obtención, utilizando el procesador (138), de datos de imagen del medio de cultivo sólido y de cualquier crecimiento microbiano,
para una pluralidad de píxeles en los datos de la imagen, generando, utilizando el procesador, un vector característico asociado compuesto por valores obtenidos aplicando uno o más filtros a los datos de la imagen, utilizando un clasificador para clasificar, utilizando el procesador, cada píxel en la pluralidad de píxeles en función del vector característico asociado, incluyendo la introducción del vector característico en el clasificador, en donde el clasificador se ha entrenado para clasificar cada píxel en la pluralidad de píxeles según una etiqueta asociada con un píxel en datos de la imagen de entrenamiento, en función de los conjuntos de entrenamiento de los vectores característicos obtenidos al filtrar datos de imágenes, y donde las etiquetas son diferentes para diferentes tipos de bacterias y agar de interés;
analizando, utilizando el procesador, los resultados de las clasificaciones de píxeles de cada uno de dichos píxeles para determinar una serie de regiones indicativas de colonias previstas del crecimiento microbiano, y enumerar, utilizando el procesador, las colonias del crecimiento microbiano de la serie de regiones en función de un tamaño y/o forma de cada una de dichas regiones;
extrayendo, del análisis, utilizando el procesador, una evaluación microbiológica del crecimiento microbiano en el medio de cultivo sólido; y
generando, utilizando el procesador, la evaluación microbiológica,
caracterizado por que el método incluye además:
utilizar, mediante el procesador, la evaluación microbiológica del medio de cultivo sólido y del crecimiento microbiano para categorizar una placa de cultivo que contiene dicho medio de cultivo sólido en una de cuatro categorías: descartada, donde el medio de cultivo sólido no incluyó la identificación de bacterias potencialmente patógenas; se requiere reincubación; identificación de bacterias potencialmente patógenas; y para revisión humana; y
envío por el aparato, basándose en la evaluación, de cada placa de cultivo a una de varias pilas de placas de salida del aparato correspondientes a cada una de las cuatro categorías.
2. El método de la reivindicación 1, en donde la evaluación microbiológica incluye además al menos uno de:
detección de colonias de crecimiento microbiano en el medio de cultivo sólido:
mapeo de la distribución de color del medio de cultivo sólido para determinar la presencia de variaciones de color;
diferenciación entre el crecimiento de colonias confluentes y aisladas de una o más colonias,
medición de la textura o viscosidad de la una o más colonias; y
determinación de la forma bidimensional y tridimensional de la una o más colonias.
3. El método según la reivindicación 1 o 2, que incluye además el análisis de los resultados de las clasificaciones de píxeles utilizando un algoritmo de componentes conectados para determinar una serie de regiones indicativas de colonias previstas del crecimiento microbiano, preferiblemente enumerando dicha una o más colonias del crecimiento microbiano de la serie de regiones en función del tamaño y/o forma de cada una de las regiones.
4. El método según una cualquiera de las reivindicaciones 1 a 3, en donde el clasificador es un clasificador multiclase para clasificar los píxeles en tres o más clases o el clasificador es un clasificador reforzado, preferiblemente, el clasificador reforzado es un clasificador de árbol de decisión reforzado.
5. El método según una cualquiera de las reivindicaciones 1 a 4, en donde el uso de dicho clasificador para clasificar cada píxel en la pluralidad de píxeles incluye:
utilizar un primer clasificador para clasificar inicialmente cada píxel como uno de una primera pluralidad de clases, y
utilizar posteriormente un segundo clasificador para clasificar cada píxel en una o más de la primera pluralidad de clases como una de una segunda pluralidad de clases.
6. El método según la reivindicación 5, en donde el primer clasificador es un clasificador binario en cascada para clasificar inicialmente cada píxel como fondo o no fondo, y el segundo clasificador es un clasificador de árbol de decisión reforzado multiclase para clasificar cada píxel que no es fondo como una de la segunda pluralidad de clases.
7. El método según una cualquiera de las reivindicaciones anteriores, que incluye además:
aplicar un algoritmo de procesamiento posterior para mejorar los resultados de las clasificaciones de píxeles, siendo, preferiblemente, el algoritmo de procesamiento posterior un algoritmo de corte de gráfico.
8. El método según la reivindicación 7, que incluye además:
construir (270) un gráfico que tenga una pluralidad de nodos, correspondiendo cada nodo a uno de la pluralidad de píxeles en los datos de la imagen, y una pluralidad de etiquetas, correspondiendo cada etiqueta a una clase, añadir bordes (272) entre nodos correspondientes a píxeles vecinos en los datos de imagen,
añadir bordes (274) entre cada nodo y cada etiqueta, y
utilizar (276) el algoritmo de corte de gráfico para cortar bordes en un nodo y dividir el gráfico en clases, basándose el algoritmo de corte de gráfico en los resultados de la clasificación de píxeles para el píxel correspondiente a ese nodo y los píxeles vecinos.
9. El método según la reivindicación 8, que incluye además la asignación de un valor de confianza a cada una de las clasificaciones de píxeles, en donde el algoritmo de corte de gráfico se basa además en el valor de confianza de la clasificación de píxeles para el píxel correspondiente a ese nodo, preferiblemente, el algoritmo de corte de gráfico se basa además en el valor de confianza de la clasificación de píxeles para los píxeles vecinos.
10. El método según una cualquiera de las reivindicaciones anteriores, en donde la evaluación incluye además una identificación del medio de cultivo sólido como control negativo.
11. El método según una cualquiera de las reivindicaciones anteriores, que incluye además el uso de normas clínicas para analizar los resultados de las clasificaciones de píxeles y obtener la evaluación.
12. El método según una cualquiera de las reivindicaciones anteriores, que incluye además el entrenamiento del clasificador para su uso en el análisis del crecimiento microbiano en el medio de cultivo sólido mediante:
la obtención (220), utilizando un procesador (138), de datos de imagen de una pluralidad de muestras de crecimiento microbiano en el medio de cultivo sólido;
para cada uno de una pluralidad de píxeles en los datos de imagen, generando (224), utilizando un procesador (138), un vector característico asociado de valores obtenidos aplicando uno o más filtros a los datos de la imagen; y
utilizar (226) los vectores característicos asociados para entrenar al clasificador para clasificar cada píxel en la pluralidad de píxeles de acuerdo con una etiqueta asociada con el píxel en los datos de la imagen.
13. El método según la reivindicación 12, en donde la pluralidad de píxeles se muestrea escasamente de los datos de imagen.
14. Un medio legible por ordenador que incluye un software (142) para su uso con un ordenador (136) que incluye un procesador (138) y una memoria (140) para almacenar el software (142), incluyendo el software (142) una serie de instrucciones que, cuando el procesador (138) las ejecuta, se lleva a cabo el método según una cualquiera de las reivindicaciones 1 a 13.
15. Aparato (100) que incluye
un procesador (138);
una memoria (140); y
un software (142) residente en dicha memoria (140) accesible al procesador (138), incluyendo el software (142) una serie de instrucciones que, cuando el procesador (138) las ejecuta, se lleva a cabo el método según una cualquiera de las reivindicaciones 1 a 13.
ES12754708T 2011-03-04 2012-03-02 Método y software para analizar el crecimiento microbiano Active ES2928897T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU2011900786A AU2011900786A0 (en) 2011-03-04 Method and software for analysing microbial growth
PCT/AU2012/000211 WO2012119191A1 (en) 2011-03-04 2012-03-02 Method and software for analysing microbial growth

Publications (1)

Publication Number Publication Date
ES2928897T3 true ES2928897T3 (es) 2022-11-23

Family

ID=46797325

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12754708T Active ES2928897T3 (es) 2011-03-04 2012-03-02 Método y software para analizar el crecimiento microbiano

Country Status (8)

Country Link
US (1) US9292729B2 (es)
EP (1) EP2681715B1 (es)
JP (1) JP5997185B2 (es)
KR (1) KR101989202B1 (es)
CN (1) CN103518224B (es)
AU (1) AU2012225196B2 (es)
ES (1) ES2928897T3 (es)
WO (1) WO2012119191A1 (es)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9292927B2 (en) * 2012-12-27 2016-03-22 Intel Corporation Adaptive support windows for stereoscopic image correlation
JP6174894B2 (ja) * 2013-04-17 2017-08-02 キヤノン株式会社 画像処理装置および画像処理方法
US9549161B2 (en) * 2013-07-08 2017-01-17 Samsung Display Co., Ltd. Image and video in mosaic formats
AU2015212758B2 (en) 2014-01-30 2019-11-21 Bd Kiestra B.V. A system and method for image acquisition using supervised high quality imaging
EP3102664A4 (en) * 2014-02-04 2017-11-01 Molecular Devices, LLC System for identifying and picking spectrally distinct colonies
CN103871031A (zh) * 2014-03-07 2014-06-18 西安电子科技大学 基于核回归的sar图像相干斑抑制
CN105095901B (zh) * 2014-04-30 2019-04-12 西门子医疗保健诊断公司 用于处理尿液沉渣图像的待处理区块的方法和装置
WO2016013885A1 (en) * 2014-07-25 2016-01-28 Samsung Electronics Co., Ltd. Method for retrieving image and electronic device thereof
FR3026745B1 (fr) * 2014-10-06 2018-03-02 Fondation Mediterranee Infection Methode d'analyse et interpretation automatisee d'un antibiogramme
WO2016120463A1 (en) * 2015-01-31 2016-08-04 Ventana Medical Systems, Inc. Systems and methods for area-of-interest detection using slide thumbnail images
ES2826400T3 (es) 2015-04-23 2021-05-18 Bd Kiestra Bv Recolección de contraste de colonias
CA3211036A1 (en) 2015-04-23 2016-10-27 Bd Kiestra B.V. A method and system for automated microbial colony counting from streaked sample on plated media
EP3147893B1 (en) * 2015-09-24 2021-06-09 Dolby Laboratories Licensing Corporation Light field simulation techniques for dual modulation
CN106097231A (zh) * 2016-08-15 2016-11-09 黄星 一种用于洁净区域的微生物监测统计管理方法
US10585121B2 (en) * 2016-09-12 2020-03-10 Tektronix, Inc. Recommending measurements based on detected waveform type
EP3535382A4 (en) * 2016-11-04 2020-06-10 Becton, Dickinson and Company SYSTEM AND METHOD FOR SELECTING COLONIES
US11057542B2 (en) 2017-04-26 2021-07-06 Hewlett-Packard Development Company, L.P. Color calibration
US11727699B2 (en) * 2017-10-05 2023-08-15 Becton, Dickinson And Company Application development environment for biological sample assessment processing
CN107833187A (zh) * 2017-10-27 2018-03-23 中国农业大学 一种基于孢子计数的设施蔬菜病害预警方法及系统
US11982627B2 (en) 2018-01-31 2024-05-14 Monsanto Technology Llc Systems and methods for quantitative phenotype analysis
CN112424612A (zh) * 2018-07-23 2021-02-26 株式会社岛津制作所 微流体器件观察装置及微流体器件观察方法
EP3620984B1 (en) * 2018-09-06 2024-04-10 Accenture Global Solutions Limited Digital quality control using computer visioning with deep learning
WO2020050687A1 (ko) * 2018-09-07 2020-03-12 주식회사 더웨이브톡 미생물 정보 제공 장치 및 방법
BR112021005978A2 (pt) * 2018-09-28 2021-06-29 Dow Global Technologies Llc sistema para treinar um classificador de aprendizado de máquina híbrido, método implementado por computador, artigo de fabricação, e, dispositivo de computação.
WO2020079933A1 (ja) * 2018-10-18 2020-04-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理装置、情報処理方法及びプログラム
JP7311310B2 (ja) * 2018-10-18 2023-07-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 情報処理装置、情報処理方法及びプログラム
KR102140385B1 (ko) * 2018-12-31 2020-07-31 (주)유아이엠디 골수 판독을 위한 셀존 레이블링 장치 및 이를 포함하는 셀존 검출 시스템
US20220139527A1 (en) * 2019-03-01 2022-05-05 Agricam Aktiebolag Method, device and system for detection of micro organisms
WO2020261555A1 (ja) * 2019-06-28 2020-12-30 オリンパス株式会社 画像生成システムおよび画像生成方法
EP3848472A3 (en) * 2020-01-13 2021-12-15 Airamatrix Private Limited Methods and systems for automated counting and classifying microorganisms
US20230351602A1 (en) * 2020-08-17 2023-11-02 Thrive Bioscience, Inc. Cell segmentation image processing methods
CN112651305B (zh) * 2020-12-10 2022-08-30 哈尔滨师范大学 一种微生物种类的鉴别方法
EP4341373A2 (en) * 2021-05-20 2024-03-27 Clara Foods Co. Systems for end-to-end optimization of precision fermentation-produced animal proteins in food applications
WO2024091807A1 (en) * 2022-10-24 2024-05-02 Charles River Laboratories, Inc. Automated enumeration system
CN117253555A (zh) * 2023-11-17 2023-12-19 山东阜丰发酵有限公司 一种改进黄原胶发酵工艺的方法及其运行系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690817B1 (en) * 1993-08-18 2004-02-10 Applied Spectral Imaging Ltd. Spectral bio-imaging data for cell classification using internal reference
US20040253660A1 (en) * 2003-06-12 2004-12-16 Giles Scientific, Inc. Automated microbiological testing apparatus and method
US7711174B2 (en) * 2004-05-13 2010-05-04 The Charles Stark Draper Laboratory, Inc. Methods and systems for imaging cells
US7958063B2 (en) * 2004-11-11 2011-06-07 Trustees Of Columbia University In The City Of New York Methods and systems for identifying and localizing objects based on features of the objects that are mapped to a vector
CN101916359B (zh) * 2005-01-27 2012-06-20 剑桥研究和仪器设备股份有限公司 把样本的不同区域分类到相应类别的方法和设备
JP4999163B2 (ja) * 2006-04-17 2012-08-15 富士フイルム株式会社 画像処理方法および装置ならびにプログラム
US8278057B2 (en) * 2007-09-14 2012-10-02 Nestec S.A. Addressable antibody arrays and methods of use
JP4891197B2 (ja) * 2007-11-01 2012-03-07 キヤノン株式会社 画像処理装置および画像処理方法
CN103080331B (zh) * 2010-06-23 2014-07-09 株式会社N-Tech 微生物检测方法、微生物检测设备和程序

Also Published As

Publication number Publication date
WO2012119191A1 (en) 2012-09-13
EP2681715A1 (en) 2014-01-08
JP5997185B2 (ja) 2016-09-28
AU2012225196A1 (en) 2013-03-21
US20140219538A1 (en) 2014-08-07
CN103518224A (zh) 2014-01-15
JP2014515128A (ja) 2014-06-26
CN103518224B (zh) 2017-05-17
US9292729B2 (en) 2016-03-22
KR101989202B1 (ko) 2019-07-05
KR20140045923A (ko) 2014-04-17
AU2012225196B2 (en) 2015-05-14
EP2681715B1 (en) 2022-07-13
EP2681715A4 (en) 2014-10-08

Similar Documents

Publication Publication Date Title
ES2928897T3 (es) Método y software para analizar el crecimiento microbiano
ES2826400T3 (es) Recolección de contraste de colonias
US11756318B2 (en) Convolutional neural networks for locating objects of interest in images of biological samples
JP7422825B2 (ja) 顕微鏡スライド画像のための焦点重み付き機械学習分類器誤り予測
CN113723573B (zh) 基于自适应比例学习的肿瘤组织病理分类系统及方法
ES2680678T3 (es) Detección de los bordes de un núcleo usando análisis de imágenes
ES2641480T3 (es) Sistema de aprendizaje automático basado en objetos de tejido para puntuación automatizada de portaobjetos digitales completos
US20150186755A1 (en) Systems and Methods for Object Identification
CN110060229A (zh) 一种骨髓白细胞的细胞自动定位分割方法
WO2018041900A1 (en) Method, system and computer program product for determining the presence of microorganisms and identifying said microorganisms
Fernández-Carrobles et al. Automatic quantification of IHC stain in breast TMA using colour analysis
CN116797791A (zh) 一种基于深度学习的线粒体分割与分类方法
BR112021011795A2 (pt) Sistema e método para monitorar o crescimento bacteriano de colônias bacterianas e prever biomassa de colônia
ES2928631T3 (es) Proceso implementado por ordenador sobre una imagen de una muestra biológica
JP5860970B2 (ja) 固有画像の生成を改良するための後処理
Kaur et al. A novel methodology for automatic bacterial colony counter
CN116195264A (zh) 用于确定相机参数值的方法及装置
Shen et al. OMG-Net: A Deep Learning Framework Deploying Segment Anything to Detect Pan-Cancer Mitotic Figures from Haematoxylin and Eosin-Stained Slides
CN115641578A (zh) 基于核质比筛选阳性突变细胞的方法及系统
Chatburn et al. VAPI: low-cost, rapid automated visual inspection system for Petri plate analysis
AU2007249081B2 (en) Method quantitative video-microscopy and associated system and computer software program product