ES2664867T3 - Método de procesamiento de imagen - Google Patents

Método de procesamiento de imagen Download PDF

Info

Publication number
ES2664867T3
ES2664867T3 ES11735520.6T ES11735520T ES2664867T3 ES 2664867 T3 ES2664867 T3 ES 2664867T3 ES 11735520 T ES11735520 T ES 11735520T ES 2664867 T3 ES2664867 T3 ES 2664867T3
Authority
ES
Spain
Prior art keywords
foi
image
size
local
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11735520.6T
Other languages
English (en)
Inventor
Keith Christopher Markham
Andrew John Sherriff
Philip Nathan Townsend
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MBDA UK Ltd
Original Assignee
MBDA UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP10275077A external-priority patent/EP2410466A1/en
Priority claimed from GBGB1012221.6A external-priority patent/GB201012221D0/en
Application filed by MBDA UK Ltd filed Critical MBDA UK Ltd
Application granted granted Critical
Publication of ES2664867T3 publication Critical patent/ES2664867T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

Un método para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, que comprende convolucionar una característica de interés (en adelante FOI) (12, 14, 16, 18) seleccionada dentro de una imagen con una máscara, caracterizado por que el método comprende convolucionar la FOI (12, 14, 16, 18) con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de la convolución como una indicación del tamaño de la primera FOI (12, 14, 16, 18), repetir el método para al menos otra FOI (12, 14, 16, 18) y clasificar las FOI (12, 14, 16, 18) de acuerdo con su tamaño indicado.

Description

5
10
15
20
25
30
35
40
45
DESCRIPCION
Método de procesamiento de imagen
Esta invención se refiere a un método de procesamiento de imagen, a un aparato de procesamiento de imagen configurado para operar el método y a un medio legible por ordenador que comprende un programa informático para realizar el método. Es particularmente aplicable, pero no exclusivamente, para la presentación a un observador de una imagen en la que se seleccionan y priorizan las potenciales regiones de interés en la imagen.
A un operador de equipos controlados a distancia, a menudo se le presenta con una imagen como vista por el equipo o por algún otro origen de imagen remota. Se requiere que el operador interprete la imagen y luego dirija el equipo controlado remotamente para que responda adecuadamente. Como ejemplo, el equipo controlado a distancia puede ser un vehículo aéreo no tripulado (UAV) que transporta una cámara de video cuyas imágenes se transmiten a un operador en la superficie o en otro avión. Se requiere que el operador interprete las imágenes y determine cuáles de las posibles características de interés reveladas en las imágenes (en adelante por conveniencia, "objetivos") deben involucrarse o investigarse adicionalmente por el UAV. Debido a que las imágenes pueden mostrar muchos objetivos posibles, es importante que el operador identifique correctamente los más importantes.
La solicitud de patente europea EP 1693782 da a conocer un método para extraer una región de interés de una imagen para un análisis más detallado.
En general, un objetivo potencial se presentará a sí mismo en la imagen como teniendo intensidad de contraste (más brillante o más oscuro) en relación con su entorno. Por lo tanto, cualquier área de contraste es potencialmente de interés, y la presente invención está dirigida, al menos en sus realizaciones preferidas, a evaluar y priorizar tales áreas de la imagen, de modo que los objetivos más probables, se presentan preferentemente al operador.
En un aspecto, la invención proporciona un método de procesamiento de imagen para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, el método que comprende convolucionar una FOI seleccionada dentro de una imagen con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de convolución, como una indicación del tamaño de la FOI, repetir el método para al menos una FOI adicional y clasificar las FOI de acuerdo con su tamaño indicado.
Al evaluar la característica de interés de acuerdo con su tamaño, es posible reconocer aquellos que son de un tamaño apropiado para los objetivos que se buscan. Por ejemplo, es posible distinguir un objetivo del tamaño de un vehículo de una característica mucho más pequeña pero más intensa, como un pequeño fuego o un destello de señuelo, el cual podría proporcionar un retorno en la imagen procesada comparable al retorno de menor intensidad pero mayor proporcionado por un vehículo.
El método puede comprender comparar la relación con un intervalo preferido de valores de relación y asignar a la FOI una puntuación que indica la proximidad de la relación a un valor asociado con un tamaño preferido de FOI.
La convolución preferiblemente es una que es linealmente sensible a los cambios de contraste.
La convolución puede ser Laplaciano del Gaussiano. Alternativamente, puede ser la Diferencia del Gaussiano o el Determinante del Hessiano.
Las máscaras pueden ser cuadrados con lados definidos por números impares de píxeles de la imagen. Alternativamente, podrían ser de otras formas, por ejemplo, rectángulos alargados si los objetivos de interés son largos y delgados.
El método puede repetirse para al menos otra FOI seleccionada, y las FOI pueden clasificarse de acuerdo con sus relaciones o sus puntuaciones asignadas.
El método puede comprender filtrar una imagen de entrada y seleccionar como una FOI, una región para la cual la respuesta de filtro es un máximo local.
También puede comprender seleccionar como una sola FOI dos dichos máximos locales que caen dentro de una plantilla representativa del tamaño preferido de FOI.
5
10
15
20
25
30
35
La imagen de entrada puede ser una imagen filtrada de paso de banda. La imagen filtrada de paso de banda puede producirse al convolucionar una imagen de entrada con un desenfoque Gaussiano y un filtro de paso alto.
El método puede comprender identificar como dicho máximo local un píxel de la imagen filtrada que tiene una respuesta de filtro mayor que la de cualquier otro píxel que sea contiguo al píxel.
Los máximos locales identificados pueden clasificarse por orden de magnitud de respuesta de filtro.
Se puede considerar para la identificación como dicho máximo local, únicamente píxeles que tienen una respuesta de filtro que excede un valor umbral.
El valor umbral puede ajustarse para limitar el número de píxeles considerados para la identificación como dichos máximos locales.
Esos máximos locales, cuyas respuestas de filtro exceden un segundo valor umbral más alto pueden clasificarse como iguales.
El segundo valor umbral puede ajustarse de modo que el número de máximos locales cuya respuesta de filtro excede ese valor umbral, tienda hacia un número predeterminado.
Un dicho valor umbral puede ajustarse por medio de un filtro alfa.
La invención puede comprender además seleccionar características en la imagen de acuerdo con el contraste total (como se define en el presente documento), clasificar las características seleccionadas de acuerdo con el tamaño y clasificar las características clasificadas de acuerdo con su aproximación a un tamaño preferido.
Por "contraste total" nos referimos a la intensidad relativa total de una característica de interés (en adelante la FOI) con relación a las partes circundantes de la imagen. Se apreciará que la intensidad relativa total es una función de la intensidad local de punto a punto sumada sobre el área de la FOI. Por lo tanto, una FOI intensa pero pequeña puede tener el mismo contraste total que una más grande pero menos intensa.
El método puede comprender filtrar la imagen para enfatizar los cambios de contraste locales en la misma, y seleccionar características de interés de acuerdo con la magnitud local de la respuesta de filtro.
Un aspecto adicional de la invención proporciona un aparato de procesamiento de imagen configurado para operar un método como se expone anteriormente.
Preferiblemente, las FOI priorizadas se resaltan al superponerlas en una imagen mostrada al operador.
La invención también proporciona un medio legible por ordenador que comprende un programa informático que, cuando se instala y opera, realiza un método como se expone anteriormente.
La invención se describirá ahora meramente a modo de ejemplo con referencia a los dibujos adjuntos, en los que:
La Figura 1 ilustra un escenario operacional típico de un UAV,
la Figura 2 muestra los bloques algorítmicos clave de una realización de la invención,
las Figuras 3, 4, 5 y 6 ilustran la operación de partes del algoritmo,
las Figuras 7 y 9 muestran la lógica empleada en partes del algoritmo, y
la Figura 8 ilustra componentes Laplacianos del Gaussiano típicos,
Con referencia a la Figura 1, se muestra un UAV 10 que sobrevuela el terreno que contiene un emplazamiento de arma 12, un edificio 14, un vehículo blindado de combate (tanque) 16 y un fuego 18 pequeño pero intenso.
Como es conocido per se, el UAV tiene una cámara a bordo con un campo de visión 22 que transmite imágenes de vuelta a una estación terrestre, donde las imágenes son procesadas por un ordenador 24 y se muestran en una pantalla 26 para su interpretación por un operador, que controla el UAV a través de un teclado 28 que típicamente también incluye una palanca de mando.
5 Dependiendo de su interpretación de las imágenes recibidas, el operador puede (por ejemplo) instruir al UAV para que examine uno o más de los objetivos más de cerca, o que lo ataque, o que no realice ninguna acción. Los cuatro objetivos ilustrados en la práctica pueden ser solo una pequeña proporción de un número mucho mayor, y el ordenador 24 contiene un software de procesamiento de imagen de acuerdo con la invención para ordenar y priorizar las características de interés vistas por la cámara del UAV antes de que las imágenes sean presentadas al 10 operador.
Con referencia a la Figura 2, la rutina de procesamiento de imagen en esta realización preferida comprende una selección inicial 30 de potenciales puntos de interés (características de imagen) seguida de un procedimiento de puntuación en dos etapas 32, 34 que da como resultado en la pantalla del operador regiones de interés similares al objetivo, aquí el emplazamiento de arma y el tanque 12, 16.
15 La selección inicial de puntos de interés se logra al convolucionar la imagen recibida con un filtro de paso de banda que comprende un desenfoque Gaussiano (que proporciona un límite de banda) y un filtro de paso alto. Esto dará como resultado una respuesta de filtro en la que se identifican y enfatizan los cambios locales en el contraste en la imagen original. Puesto alternativamente, el filtro de paso de banda actúa como un diferenciador y proporciona una indicación de la tasa de cambio de intensidad de imagen en todo el campo de imagen. La Figura 3 ilustra la 20 respuesta de filtro, en la que hay una serie de potenciales características de interés representadas por máximos locales en la respuesta de filtro, siendo las tres más grandes 36, 37 y 38. En la práctica, es probable que haya muchos de estos picos en esta etapa de la rutina de procesamiento de imagen y la mayoría de ellas se descartan para centrarse solo en las significativas, reduciendo así la carga de procesamiento de datos en el ordenador 24.
Por lo tanto, cada una de las respuestas se compara con un valor umbral 40, de modo que la mayoría de las 25 respuestas se rechazan inmediatamente, como se muestra en la Figura 3. El umbral de respuesta 40 se ajusta en base al número de respuestas que exceden el umbral en cada fotograma de imagen, para seleccionar un número manejable. En la Figura 3, solo se seleccionarían las tres respuestas 36, 37, 38 prominentes ajustando el umbral 40. En una realización alternativa de la invención, cada uno de los fotogramas de imagen se divide en subimágenes. Se pueden aplicar diferentes valores de umbral para cada una de las subimágenes. Este proceso asegura una 30 distribución más uniforme de las Características de Interés en toda la imagen.
Con referencia de nuevo a la realización preferida descrita en las Figuras, cada una de las respuestas supervivientes luego se evalúa comparando los píxeles que forman la característica de imagen con sus vecinos. Cada uno de los píxeles 42 (figura 4) se compara con sus ocho vecinos 44 inmediatos, y solo se aceptan máximos locales. Un máximo local es un píxel en el que la respuesta de filtro es mayor que en cualquiera de los píxeles inmediatamente 35 vecinos.
Las características de imagen restantes se consideran características de interés (FOI) y éstas se ordenan por intensidad de respuesta para crear una lista ordenada. Aunque este paso es computacionalmente intensivo, la carga general del procesador se reduce como resultado de los pasos anteriores. Los clústeres locales de FOI se agrupan, ya que una característica de imagen fragmentada puede generar múltiples FOI. Cada una de las FOI se examina 40 sucesivamente, empezando por la más intensa, y se absorbe cualquier FOI dentro de una distancia de píxel predeterminada de otro, calculada de acuerdo con el tamaño del objetivo buscado. Por ejemplo, si el tamaño de objetivo preferido es 3x3 píxeles, todos los máximos locales que caen dentro de una plantilla de 3x3 se consideran del mismo objetivo. Puesto alternativamente, en este caso, se supone cualquier máximo local que se encuentre dentro de los dos píxeles entre sí son del mismo objetivo. La magnitud de la respuesta más fuerte de cada uno de 45 los grupos de píxeles se mantiene. En la Figura 5 se ilustran dos ejemplos de agrupación. Los píxeles 46, 48 se destacan de sus vecinos y están separados por un píxel en diagonal. Caen dentro de una plantilla de 3x3 y, por lo tanto, se representarían como una sola FOI si 3x3 es el tamaño objetivo deseado. La posición de la FOI está determinada por las coordenadas x e y promedio de los dos píxeles. Los píxeles 50, 52 son dos píxeles que están más separados en diagonal y, por lo tanto, dan lugar a dos fOi distintas si el tamaño de objetivo deseado es 3x3. Si 50 la plantilla de tamaño de objetivo preferido es de 5x5 píxeles, sin embargo, se asimilarían como una sola FOI.
A las FOI identificadas de ese modo se les asigna una puntuación que indica su prioridad. Las puntuaciones máximas y mínimas, Smax y Smin respectivamente, definen el rango de puntuaciones. La puntuación se realiza en dos pasos:
1. Las puntuaciones no refinadas se producen, en base a la respuesta de convolución del filtro de paso de
55 banda.
5
10
15
20
25
30
35
40
45
2. Las puntuaciones se refinan utilizando una relación de respuestas de convolución del Laplaciano del Gaussiano.
En la primera etapa del proceso de priorización, cada una de las respuestas, R, se compara con un umbral superior e inferior, Tu y Tl, respectivamente. El umbral inferior Tl es adicional al umbral 40. Las puntuaciones, S, se asignan en una escala lineal en base a la respuesta de cada una de las FOI en relación con los valores umbral. Las FOI con respuestas que caen por debajo del umbral inferior Tlse descartan, mientras que las FOI con respuestas por encima del umbral superior Tu se capan a la puntuación máxima, Smax. Todas las respuestas que se encuentran entre los umbrales superior e inferior se puntúan como sigue:
S
imagen1
-S^XR-T,) (Tu ~T¡)
Los umbrales superior e inferior se ajustan usando un filtro alfa, con parámetros dependientes del número de FOI que exceden cada uno de los umbrales. El filtro alfa genérico, para k-1, k > 0, respuestas deseadas que exceden el umbral T, viene dado por
imagen2
donde Rk es la k-ésima respuesta clasificada. El valor de a puede aumentarse para forzar al umbral a adaptarse más rápidamente. La naturaleza promedio del mecanismo asegura que el esquema de puntuación se adapta a los cambios persistentes en la escena de imagen sin reaccionar innecesariamente a las fluctuaciones de fotogramas individuales. Esto garantiza que las puntuaciones sean consistentes en todos los fotogramas de imagen, pero adaptables a diferentes escenarios.
El objetivo es ajustar los umbrales superior e inferior para controlar el número de FOI y las puntuaciones asociadas. Para el umbral superior, Tu, (Figura 6) se realiza un ajuste grande cuando el número de respuestas de FOI que exceden el umbral es mayor que tres o igual a cero, se realiza un pequeño ajuste cuando el umbral se excede en una o dos respuestas de FOI, y no ocurre ningún cambio cuando exactamente tres respuestas FOI están por encima del umbral, ilustradas en la Figura 7. En general, esto da como resultado dos o tres fOi que reciben una puntuación máxima.
Del mismo modo, el umbral inferior se ajusta para permitir un número fijo de FOI (un número adecuado al tamaño de imagen, para evitar la sobrecarga de la imagen) para alcanzar al menos la puntuación mínima, Smin, descartando todas las FOI que puntúen menos de Smin.
La segunda etapa del mecanismo de priorización, refinamiento de la puntuación, se logra por convolución con un par de máscaras del Laplaciano del Gaussiano de diferentes tamaños. La Figura 8 ilustra las componentes x e y de una máscara del Laplaciano del Gaussiano típica; las áreas claras son valores altos y las áreas más oscuras son cero. Esta representación indica que se esperaría una respuesta fuerte cuando la componente x (a la izquierda en la Figura 8) se convoluciona con un área de la imagen que contiene un borde vertical, mientras que la componente y responde a los bordes horizontales. Una respuesta fuerte combinada desde cada una de las componentes es indicativa de la presencia de una mancha en la imagen.
Convolucionar cada una de las máscaras con todos los píxeles de imagen llevaría mucho tiempo, pero en esta etapa, las máscaras solo necesitan convolucionarse en cada una de las FOI ya identificadas. El principio detrás de la utilización de los pares de máscaras es reducir el impacto del contraste, haciendo énfasis en la coincidencia de tamaños. Muchos filtros tienen la desventaja de proporcionar respuestas similares para características de imagen pequeñas de alto contraste y características de imagen más grandes de contraste moderado. En esta realización de la invención, sin embargo, al inspeccionar la relación de las dos respuestas de los pares de máscaras del Laplaciano del Gaussiano, se reduce el efecto del contraste. La Tabla 1 enumera las respuestas de máscaras teóricas de 9x9 píxeles y 15x15 píxeles para varios tamaños de características de imagen, cada una de un cuadrado blanco sobre fondo negro, donde C es el contraste de la característica de imagen. Con las imágenes tal como se reciben en la práctica, las relaciones resultantes son menos distintas, pero el método, sin embargo, puede proporcionar un medio eficiente para eliminar falsas alarmas y ayudar a la priorización.
Tabla 1: Respuestas del Laplaciano del Gaussiano para las características de imagen ideales
Tamaño (píxeles)
9x9 15x15
Sigma
1,2 2,0
Tamaño de Característica de Imagen
1x1
0,221C 0,080C
5
10
15
20
25
30
35
40
Tamaño (píxeles)
9x9 15x15
Sigma
1,2 2,0
Tamaño de Característica de Imagen
3x3
0,764C 0,511C
5x5
0,350C 0,736C
7x7
0,056C 0,557C
9x9
0,004C 0,272C
11x11
0,004C 0,095C
El refinamiento de puntuación utiliza la relación del Laplaciano del Gaussiano calculada para ajustar la puntuación de FOI. Utilizando un conjunto de secuencias de prueba con ubicaciones de características de imagen marcadas, los datos de prueba se han recopilado para encontrar una distribución y una relación esperada para las respuestas del Laplaciano. A las FOI con relaciones que coinciden estrechamente con las expectativas, se les da un gran aumento de puntuación, mientras que a las FOI con relaciones mucho más alejadas se les da una reducción de puntuación. Por ejemplo, con referencia a la tabla 1, cuando se buscan características de imagen de tamaño 3x3, la relación del Laplaciano del Gaussiano (LoG) para las características de imagen de tamaño 1x1 (aquí 0,221 / 0,08 = 2,76) probablemente sería significativamente mayor que la relación deseada para un Imagen de 3x3 (0,764 / 0,511 = 1,50), resultando en una disminución de la puntuación. De manera similar, se puede ver que las características mayores que 3x3 píxeles producen relaciones de LoG significativamente más pequeñas que 1,5. Así, al reducir las puntuaciones de FOI que tienen relaciones de LoG fuera de un rango preferido, p. ej. 1 a 2 cuando se buscan objetivos de tamaño 3x3, se puede enfatizar las FOI del tamaño preferido. El rango se basa inicialmente en los valores teóricos para un cuadrado blanco sobre un fondo negro, y se puede refinar utilizando datos reales. La puntuación revisada se mantiene dentro del intervalo [Smin, Smax] capando las puntuaciones a Smax y descartando cualquier FOI que ahora puntúe menos de Smin. El resultado es una lista priorizada de FOI que favorece las características de imagen del tamaño esperado. La lógica de refinamiento se ilustra en la Figura 9. En realizaciones operacionales de la invención, estas relaciones, y las relaciones correspondientes para otros tamaños de imagen que el operador puede seleccionar como de interés, están incorporadas en tablas de consulta en una base de datos 46 (figura 1), a las que se accede de acuerdo con el tamaño de objetivo deseado ingresado por el operador.
La etapa final del algoritmo implica la selección de características de interés 48, Figura 2, en base a la puntuación refinada. El resultado es una lista de características de interés contrastantes seleccionadas de acuerdo con el tamaño, que se puede determinar por un único parámetro ingresado por el operador. Estas FOI pueden mostrarse convenientemente al operador al superponerlas en la imagen mostrada original con etiquetas en pantalla, de modo que las de mayor interés sean inmediatamente evidentes.
Considerando además la base teórica de la invención, es una característica de las operaciones de transformación de características invariante a la escala (SIFT) que la respuesta de un filtro es sensible tanto al tamaño como al contraste, donde el paso de banda del filtro se selecciona para dar una respuesta pico para objetos de un tamaño elegido. Pueden surgir problemas cuando un objeto, que no es del tamaño elegido, tiene un alto contraste, de modo que un filtro desarrolla una respuesta significativa que excede la respuesta de un objeto de menor contraste de mayor tamaño. Como precursor del desarrollo de cualquier proceso de normalización, es necesario examinar las respuestas de filtro para objetos objetivo ideales, en este caso un cuadrado de intensidad uniforme. Se debe considerar un rango de factores de escala a, estos se pueden seleccionar usando la regla que relaciona el lado L del cuadrado y la respuesta pico de un operador de SIFT Laplaciano:
imagen3
y así para tamaños de objeto de 3x3, 9x9 y 17x17 píxeles, los factores de escala son 1,2, 3,6 y 6,8 respectivamente.
Considerar la respuesta de estos filtros SIFT a un objetivo cuadrado de intensidad uniforme de contraste C, en un fondo suave. El efecto del filtro es eliminar la respuesta de fondo, respondiendo solo a la señal de contraste del objetivo. La integración de la función de respuesta de impulso de filtro en todo el espacio 2D da como resultado cero; la señal objetivo puede considerarse como una señal de fondo a la que se ha agregado un conjunto de señales de contraste objetivo, que genera la respuesta de filtro. La siguiente tabla 2 (que es similar a la tabla 1, pero más detallada) muestra la variación en la respuesta de filtro como una función de factor de escala y de tamaño del objetivo:
Tabla 2. Comparación de las salidas del filtro SIFT
Tamaño de Objetivo
Tamaño de Máscara = 9x9 Tamaño de Máscara = 27x27 Tamaño de Máscara = 51x51
(NxN píxeles)
01 = 1,2 o2 = 3,6 03 = 6,8
5
10
15
20
25
1
0,2210C 0,0246C 0,0069C
3
0,7638C 0,1994C 0,0602C
5
0,3510C 0,4512C 0,1578C
7
0,0556C 0,6529C 0,2839C
9
0,0038C 0,7250C 0,4186C
11
0,0038C 0,6652C 0,5426C
13
0,5245C 0,6400C
15
0,3640C 0,7008C
17
0,2260C 0,7216C
19
0,1268C 0,7047C
21
0,0648C 0,6569C
23
0,0303C 0,5874C
25
0.0130 C 0.5057 C
27
0.0051 C 0.4204 C
Se puede ver que al considerar la relación de las respuestas de dos tamaños de máscara diferentes para un tamaño de objetivo deseado dado, se elimina el contraste C.
Supongamos que definimos tres categorías de objetivos:
Pequeño - 3x3 píxeles
Mediano - 9x9 píxeles
Grande - 17x17 píxeles
y dejar que la respuesta de filtro sea R(Ok) en un píxel al factor de escala k-ésima. En base a la Tabla 2, un
posible esquema para clasificar respuestas de objetos es:
í?(o-i)>í?(o-2)a ) > i?(o"3 ) =^> Pequeño
R(<?2)>R(v i)a R(cJ2 ) > R(g3 ) => Mediano R(cJ3 ) > R(cJ1 ) A R(<33 ) > R(cJ2 ) =^> Grande
La operación de la realización de la invención descrita específicamente en el presente documento se puede resumir de la siguiente manera:
• Un filtro de paso de banda se convoluciona con una imagen de entrada
• Se identifican características de imagen significativas, que son píxeles cuyas respuestas de filtro son máximos locales, es decir cada uno excede el de sus ocho vecinos y un valor de umbral.
• Las características de imagen se consideran características de interés (FOI) y se ordenan por respuesta.
• Los clústeres locales de píxeles se agrupan como una sola FOI.
• Las puntuaciones no refinadas se basan linealmente en los valores de respuesta de FOI en relación con los
umbrales inferior y superior.
• Las puntuaciones se refinan utilizando la relación de dos convoluciones del Laplaciano del Gaussiano.
• Un conjunto de FOI priorizadas se ordena de acuerdo con la puntuación.
La invención comprende cualquier característica novedosa o combinación de características descrita en el presente documento, reivindicada específicamente o no. El resumen adjunto se repite aquí como parte de la especificación.
Un método de procesamiento de imagen comprende convolucionar una característica de interés (FOI) seleccionada dentro de la imagen con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de las respuestas de convolución, como una indicación del tamaño de la FOI. Preferiblemente, las máscaras de convolución son del Laplaciano del Gaussiano. El método puede ser útil para priorizar objetivos potenciales en un campo de visión para su presentación a un operador.

Claims (16)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    REIVINDICACIONES
    1. Un método para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, que comprende convolucionar una característica de interés (en adelante FOI) (12, 14, 16, 18) seleccionada dentro de una imagen con una máscara, caracterizado por que el método comprende convolucionar la FOI (12, 14, 16, 18) con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de la convolución como una indicación del tamaño de la primera FOI (12, 14, 16, 18), repetir el método para al menos otra FOI (12, 14, 16, 18) y clasificar las FOI (12, 14, 16, 18) de acuerdo con su tamaño indicado.
  2. 2. El método de la reivindicación 1 que comprende comparar cada una de las relaciones con un rango preferido de valores de relación y asignar a la respectiva FOI (12, 14, 16, 18) una puntuación que indica la cercanía de la relación a un valor asociado con un tamaño preferido de FOI (12, 14, 16, 18).
  3. 3. El método de la reivindicación 1 o la reivindicación 2, en donde la convolución es el Laplaciano del Gaussiano.
  4. 4. El método de cualquiera de las reivindicaciones 1 a 3, en donde las máscaras son cuadrados que tienen lados definidos por números impares de píxeles (42, 44) de la imagen.
  5. 5. El método de cualquiera de las reivindicaciones 1 a 4, que comprende filtrar una imagen de entrada para proporcionar una respuesta de filtro y seleccionar como una FOI (12, 14, 16, 18) una región para la cual la respuesta de filtro es un máximo local (36, 37, 38).
  6. 6. El método de las reivindicaciones 2 y 5, que comprende seleccionar como una sola FOI (12, 14, 16, 18) dos dichos máximos locales (36, 37, 38) que caen dentro de una plantilla representativa del tamaño preferido de FOI (12, 14, 16, 18).
  7. 7. El método de la reivindicación 5 o 6, en donde la imagen de entrada está filtrada por paso de banda, el método que comprende opcionalmente producir la imagen filtrada por paso de banda, convolucionando una imagen de entrada con un desenfoque Gaussiano y un filtro de paso alto.
  8. 8. El método de cualquiera de las reivindicaciones 5 a 7, que comprende identificar como dicho máximo local (36, 37, 38) un píxel de la imagen filtrada que tiene una respuesta de filtro mayor que la de cualquier otro píxel que sea contiguo al píxel.
  9. 9. El método de cualquiera de las reivindicaciones 5 a 8 que comprende clasificar los máximos locales identificados (36, 37, 38) en orden de magnitud de respuesta de filtro.
  10. 10. El método de la reivindicación 9, que comprende considerar para la identificación como dicho máximo local (36, 37, 38) solo píxeles que tienen una respuesta de filtro que excede un valor umbral (40) y opcionalmente ajustar el valor umbral (40) para limitar el número de píxeles considerados para la identificación como dichos máximos locales (36, 37, 38).
  11. 11. El método de la reivindicación 10, que comprende clasificar como iguales los máximos locales (36, 37, 38) cuyas respuestas de filtro exceden un segundo valor umbral (40) más alto y opcionalmente ajustar el segundo valor umbral (40) para que el número de máximos locales (36, 37, 38) cuya respuesta de filtro excede ese valor umbral (40) tienda hacia un número predeterminado.
  12. 12. El método de cualquiera de las reivindicaciones 10 u 11, que comprende ajustar dicho valor umbral (40) por medio de un filtro alfa.
  13. 13. Un método de procesamiento de imagen, que comprende un método de acuerdo con cualquier reivindicación precedente, que comprende seleccionar características (12, 14, 16, 18) en la imagen de acuerdo con el contraste total, ordenar las características seleccionadas de acuerdo con el tamaño, y clasificar las características ordenadas de acuerdo con su aproximación a un tamaño preferido.
  14. 14. El método de la reivindicación 13, que comprende filtrar la imagen para enfatizar los cambios locales de contraste en la misma y seleccionar características de interés de acuerdo con la magnitud local de la respuesta de filtro.
  15. 15. El método de la reivindicación 13 o 14, en donde dicha ordenación se realiza por referencia a la relación de un par de convoluciones del Laplaciano del Gaussiano para cada una de las imágenes seleccionada.
  16. 16. El método de una cualquiera de las reivindicaciones 13 a 15, que comprende superponer las características de interés priorizadas en una imagen mostrada al observador.
    5 17. Un medio legible por ordenador que comprende un programa informático que, cuando se instala y opera, realiza
    el método de cualquiera de las reivindicaciones precedentes.
ES11735520.6T 2010-07-21 2011-07-18 Método de procesamiento de imagen Active ES2664867T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP10275077A EP2410466A1 (en) 2010-07-21 2010-07-21 Image processing method
EP10275077 2010-07-21
GB201012221 2010-07-21
GBGB1012221.6A GB201012221D0 (en) 2010-07-21 2010-07-21 Image processing method
PCT/GB2011/051341 WO2012010873A1 (en) 2010-07-21 2011-07-18 Image processing method

Publications (1)

Publication Number Publication Date
ES2664867T3 true ES2664867T3 (es) 2018-04-23

Family

ID=45496556

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11735520.6T Active ES2664867T3 (es) 2010-07-21 2011-07-18 Método de procesamiento de imagen

Country Status (6)

Country Link
US (1) US9165200B2 (es)
EP (1) EP2596458B1 (es)
AU (1) AU2011281313B2 (es)
CA (1) CA2805730C (es)
ES (1) ES2664867T3 (es)
WO (1) WO2012010873A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9299191B2 (en) * 2012-06-04 2016-03-29 Google Inc. Adaptive artifact removal
KR20140086632A (ko) * 2012-12-28 2014-07-08 삼성디스플레이 주식회사 영상 처리 장치 및 그것을 포함하는 표시 장치
GB2539461B (en) * 2015-06-16 2020-01-08 Canon Kk Image data encapsulation
US10049434B2 (en) * 2015-10-15 2018-08-14 The Boeing Company Systems and methods for object detection

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4603430A (en) 1984-09-21 1986-07-29 Hughes Aircraft Company Target discrimination utilizing median filters
JP2000259814A (ja) * 1999-03-11 2000-09-22 Toshiba Corp 画像処理装置及びその方法
US6801645B1 (en) 1999-06-23 2004-10-05 Icad, Inc. Computer aided detection of masses and clustered microcalcifications with single and multiple input image context classification strategies
US7305145B2 (en) 2003-05-23 2007-12-04 Lockheed Martin Corporation Method and apparatus for filtering an image
GB2422739B (en) 2005-01-31 2010-07-14 Hewlett Packard Development Co Image processing method and apparatus
DE602005012672D1 (de) * 2005-02-21 2009-03-26 Mitsubishi Electric Corp Verfahren zum Detektieren von Gesichtsmerkmalen
US20100150413A1 (en) 2005-06-28 2010-06-17 Konica Minolta Medical & Graphic, Inc. Abnormal shadow candidate detecting method and abnormal shadow candidate detecting device
WO2007031946A2 (en) 2005-09-12 2007-03-22 Dvp Technologies Ltd. Medical image processing
US7965890B2 (en) 2007-01-05 2011-06-21 Raytheon Company Target recognition system and method
GB0705223D0 (en) 2007-03-19 2007-04-25 Univ Sussex Method, apparatus and computer program for analysing medical image data
US8160382B2 (en) * 2007-10-15 2012-04-17 Lockheed Martin Corporation Method of object recognition in image data using combined edge magnitude and edge direction analysis techniques
CN101449973B (zh) * 2007-12-04 2010-09-29 深圳迈瑞生物医疗电子股份有限公司 用于心电干扰信号识别的判断指标的生成方法及装置
US8103055B2 (en) 2008-01-11 2012-01-24 Omg Plc Detection of blobs in images
EP2110697B1 (en) 2008-04-17 2016-02-10 Ruprecht-Karls-Universität Heidelberg Wave field microscope with sub-wavelength resolution and methods for processing microscopic images to detect objects with sub-wavelength dimensions

Also Published As

Publication number Publication date
EP2596458A1 (en) 2013-05-29
CA2805730A1 (en) 2012-01-26
CA2805730C (en) 2018-08-21
AU2011281313A1 (en) 2013-02-28
EP2596458B1 (en) 2018-02-21
US20130148893A1 (en) 2013-06-13
AU2011281313B2 (en) 2015-01-22
WO2012010873A1 (en) 2012-01-26
US9165200B2 (en) 2015-10-20

Similar Documents

Publication Publication Date Title
ES2664867T3 (es) Método de procesamiento de imagen
CN101460975B (zh) 采用非线性和/或空间变化图像处理的光学成像系统与方法
CN111339997B (zh) 火点区域的确定方法及装置、存储介质和电子装置
DE112013005337T5 (de) Objekterfassung und Nachverfolgung mit veränderlichen Feldbeleuchtungsvorrichtungen
KR20050067389A (ko) 화상 융합 시스템 및 방법
CN105847703A (zh) 一种图像处理方法和电子设备
WO2009097216A1 (en) Video image processing and fusion
CN107240092A (zh) 一种图像模糊度检测方法及装置
US11416707B2 (en) Information processing method, information processing system, and information processing apparatus
CN110349114A (zh) 应用于aoi设备的图像增强方法、装置及道路视频监控设备
CN109996379B (zh) 一种灯光控制方法及装置
CN110557628A (zh) 一种检测摄像头遮挡的方法、装置及电子设备
CN106033597A (zh) 图像去雾的方法和设备
JP2021145859A5 (es)
US20160275698A1 (en) Method for viewing a multi-spectral image
CN106803920A (zh) 一种图像处理的方法、装置及智能会议终端
Przybył et al. Virtual methods of testing automatically generated camouflage patterns created using cellular automata
US7689054B1 (en) Computationally enhanced image recognition device
CN110197465B (zh) 一种有雾图像增强方法
Ong et al. Comparative analysis of RGB and HSV color models in extracting color features of green dye solutions
EP3468167A1 (en) Image capturing device and image processing method
Kwok et al. Color image contrast enhancement using a local equalization and weighted sum approach
US7627190B1 (en) Computationally enhanced image recognition system
EP2410466A1 (en) Image processing method
JP2023533018A (ja) オブジェクトを描く画像フレームの自動露光を管理しながらオブジェクトを割り引くための装置、システムおよび方法