ES2664867T3

ES2664867T3 - Método de procesamiento de imagen

Info

Publication number: ES2664867T3
Application number: ES11735520.6T
Authority: ES
Inventors: Keith Christopher Markham; Andrew John Sherriff; Philip Nathan Townsend
Original assignee: MBDA UK Ltd
Current assignee: MBDA UK Ltd
Priority date: 2010-07-21
Filing date: 2011-07-18
Publication date: 2018-04-23
Anticipated expiration: 2031-07-18
Also published as: EP2596458A1; CA2805730A1; CA2805730C; AU2011281313A1; EP2596458B1; US20130148893A1; AU2011281313B2; WO2012010873A1; US9165200B2

Abstract

Un método para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, que comprende convolucionar una característica de interés (en adelante FOI) (12, 14, 16, 18) seleccionada dentro de una imagen con una máscara, caracterizado por que el método comprende convolucionar la FOI (12, 14, 16, 18) con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de la convolución como una indicación del tamaño de la primera FOI (12, 14, 16, 18), repetir el método para al menos otra FOI (12, 14, 16, 18) y clasificar las FOI (12, 14, 16, 18) de acuerdo con su tamaño indicado.

Description

5

10

15

20

25

30

35

40

45

DESCRIPCION

Método de procesamiento de imagen

Esta invención se refiere a un método de procesamiento de imagen, a un aparato de procesamiento de imagen configurado para operar el método y a un medio legible por ordenador que comprende un programa informático para realizar el método. Es particularmente aplicable, pero no exclusivamente, para la presentación a un observador de una imagen en la que se seleccionan y priorizan las potenciales regiones de interés en la imagen.

A un operador de equipos controlados a distancia, a menudo se le presenta con una imagen como vista por el equipo o por algún otro origen de imagen remota. Se requiere que el operador interprete la imagen y luego dirija el equipo controlado remotamente para que responda adecuadamente. Como ejemplo, el equipo controlado a distancia puede ser un vehículo aéreo no tripulado (UAV) que transporta una cámara de video cuyas imágenes se transmiten a un operador en la superficie o en otro avión. Se requiere que el operador interprete las imágenes y determine cuáles de las posibles características de interés reveladas en las imágenes (en adelante por conveniencia, "objetivos") deben involucrarse o investigarse adicionalmente por el UAV. Debido a que las imágenes pueden mostrar muchos objetivos posibles, es importante que el operador identifique correctamente los más importantes.

La solicitud de patente europea EP 1693782 da a conocer un método para extraer una región de interés de una imagen para un análisis más detallado.

En general, un objetivo potencial se presentará a sí mismo en la imagen como teniendo intensidad de contraste (más brillante o más oscuro) en relación con su entorno. Por lo tanto, cualquier área de contraste es potencialmente de interés, y la presente invención está dirigida, al menos en sus realizaciones preferidas, a evaluar y priorizar tales áreas de la imagen, de modo que los objetivos más probables, se presentan preferentemente al operador.

En un aspecto, la invención proporciona un método de procesamiento de imagen para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, el método que comprende convolucionar una FOI seleccionada dentro de una imagen con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de convolución, como una indicación del tamaño de la FOI, repetir el método para al menos una FOI adicional y clasificar las FOI de acuerdo con su tamaño indicado.

Al evaluar la característica de interés de acuerdo con su tamaño, es posible reconocer aquellos que son de un tamaño apropiado para los objetivos que se buscan. Por ejemplo, es posible distinguir un objetivo del tamaño de un vehículo de una característica mucho más pequeña pero más intensa, como un pequeño fuego o un destello de señuelo, el cual podría proporcionar un retorno en la imagen procesada comparable al retorno de menor intensidad pero mayor proporcionado por un vehículo.

El método puede comprender comparar la relación con un intervalo preferido de valores de relación y asignar a la FOI una puntuación que indica la proximidad de la relación a un valor asociado con un tamaño preferido de FOI.

La convolución preferiblemente es una que es linealmente sensible a los cambios de contraste.

La convolución puede ser Laplaciano del Gaussiano. Alternativamente, puede ser la Diferencia del Gaussiano o el Determinante del Hessiano.

Las máscaras pueden ser cuadrados con lados definidos por números impares de píxeles de la imagen. Alternativamente, podrían ser de otras formas, por ejemplo, rectángulos alargados si los objetivos de interés son largos y delgados.

El método puede repetirse para al menos otra FOI seleccionada, y las FOI pueden clasificarse de acuerdo con sus relaciones o sus puntuaciones asignadas.

El método puede comprender filtrar una imagen de entrada y seleccionar como una FOI, una región para la cual la respuesta de filtro es un máximo local.

También puede comprender seleccionar como una sola FOI dos dichos máximos locales que caen dentro de una plantilla representativa del tamaño preferido de FOI.

5

10

15

20

25

30

35

La imagen de entrada puede ser una imagen filtrada de paso de banda. La imagen filtrada de paso de banda puede producirse al convolucionar una imagen de entrada con un desenfoque Gaussiano y un filtro de paso alto.

El método puede comprender identificar como dicho máximo local un píxel de la imagen filtrada que tiene una respuesta de filtro mayor que la de cualquier otro píxel que sea contiguo al píxel.

Los máximos locales identificados pueden clasificarse por orden de magnitud de respuesta de filtro.

Se puede considerar para la identificación como dicho máximo local, únicamente píxeles que tienen una respuesta de filtro que excede un valor umbral.

El valor umbral puede ajustarse para limitar el número de píxeles considerados para la identificación como dichos máximos locales.

Esos máximos locales, cuyas respuestas de filtro exceden un segundo valor umbral más alto pueden clasificarse como iguales.

El segundo valor umbral puede ajustarse de modo que el número de máximos locales cuya respuesta de filtro excede ese valor umbral, tienda hacia un número predeterminado.

Un dicho valor umbral puede ajustarse por medio de un filtro alfa.

La invención puede comprender además seleccionar características en la imagen de acuerdo con el contraste total (como se define en el presente documento), clasificar las características seleccionadas de acuerdo con el tamaño y clasificar las características clasificadas de acuerdo con su aproximación a un tamaño preferido.

Por "contraste total" nos referimos a la intensidad relativa total de una característica de interés (en adelante la FOI) con relación a las partes circundantes de la imagen. Se apreciará que la intensidad relativa total es una función de la intensidad local de punto a punto sumada sobre el área de la FOI. Por lo tanto, una FOI intensa pero pequeña puede tener el mismo contraste total que una más grande pero menos intensa.

El método puede comprender filtrar la imagen para enfatizar los cambios de contraste locales en la misma, y seleccionar características de interés de acuerdo con la magnitud local de la respuesta de filtro.

Un aspecto adicional de la invención proporciona un aparato de procesamiento de imagen configurado para operar un método como se expone anteriormente.

Preferiblemente, las FOI priorizadas se resaltan al superponerlas en una imagen mostrada al operador.

La invención también proporciona un medio legible por ordenador que comprende un programa informático que, cuando se instala y opera, realiza un método como se expone anteriormente.

La invención se describirá ahora meramente a modo de ejemplo con referencia a los dibujos adjuntos, en los que:

La Figura 1 ilustra un escenario operacional típico de un UAV,

la Figura 2 muestra los bloques algorítmicos clave de una realización de la invención,

las Figuras 3, 4, 5 y 6 ilustran la operación de partes del algoritmo,

las Figuras 7 y 9 muestran la lógica empleada en partes del algoritmo, y

la Figura 8 ilustra componentes Laplacianos del Gaussiano típicos,

Con referencia a la Figura 1, se muestra un UAV 10 que sobrevuela el terreno que contiene un emplazamiento de arma 12, un edificio 14, un vehículo blindado de combate (tanque) 16 y un fuego 18 pequeño pero intenso.

Como es conocido per se, el UAV tiene una cámara a bordo con un campo de visión 22 que transmite imágenes de vuelta a una estación terrestre, donde las imágenes son procesadas por un ordenador 24 y se muestran en una pantalla 26 para su interpretación por un operador, que controla el UAV a través de un teclado 28 que típicamente también incluye una palanca de mando.

5 Dependiendo de su interpretación de las imágenes recibidas, el operador puede (por ejemplo) instruir al UAV para que examine uno o más de los objetivos más de cerca, o que lo ataque, o que no realice ninguna acción. Los cuatro objetivos ilustrados en la práctica pueden ser solo una pequeña proporción de un número mucho mayor, y el ordenador 24 contiene un software de procesamiento de imagen de acuerdo con la invención para ordenar y priorizar las características de interés vistas por la cámara del UAV antes de que las imágenes sean presentadas al 10 operador.

Con referencia a la Figura 2, la rutina de procesamiento de imagen en esta realización preferida comprende una selección inicial 30 de potenciales puntos de interés (características de imagen) seguida de un procedimiento de puntuación en dos etapas 32, 34 que da como resultado en la pantalla del operador regiones de interés similares al objetivo, aquí el emplazamiento de arma y el tanque 12, 16.

15 La selección inicial de puntos de interés se logra al convolucionar la imagen recibida con un filtro de paso de banda que comprende un desenfoque Gaussiano (que proporciona un límite de banda) y un filtro de paso alto. Esto dará como resultado una respuesta de filtro en la que se identifican y enfatizan los cambios locales en el contraste en la imagen original. Puesto alternativamente, el filtro de paso de banda actúa como un diferenciador y proporciona una indicación de la tasa de cambio de intensidad de imagen en todo el campo de imagen. La Figura 3 ilustra la 20 respuesta de filtro, en la que hay una serie de potenciales características de interés representadas por máximos locales en la respuesta de filtro, siendo las tres más grandes 36, 37 y 38. En la práctica, es probable que haya muchos de estos picos en esta etapa de la rutina de procesamiento de imagen y la mayoría de ellas se descartan para centrarse solo en las significativas, reduciendo así la carga de procesamiento de datos en el ordenador 24.

Por lo tanto, cada una de las respuestas se compara con un valor umbral 40, de modo que la mayoría de las 25 respuestas se rechazan inmediatamente, como se muestra en la Figura 3. El umbral de respuesta 40 se ajusta en base al número de respuestas que exceden el umbral en cada fotograma de imagen, para seleccionar un número manejable. En la Figura 3, solo se seleccionarían las tres respuestas 36, 37, 38 prominentes ajustando el umbral 40. En una realización alternativa de la invención, cada uno de los fotogramas de imagen se divide en subimágenes. Se pueden aplicar diferentes valores de umbral para cada una de las subimágenes. Este proceso asegura una 30 distribución más uniforme de las Características de Interés en toda la imagen.

Con referencia de nuevo a la realización preferida descrita en las Figuras, cada una de las respuestas supervivientes luego se evalúa comparando los píxeles que forman la característica de imagen con sus vecinos. Cada uno de los píxeles 42 (figura 4) se compara con sus ocho vecinos 44 inmediatos, y solo se aceptan máximos locales. Un máximo local es un píxel en el que la respuesta de filtro es mayor que en cualquiera de los píxeles inmediatamente 35 vecinos.

Las características de imagen restantes se consideran características de interés (FOI) y éstas se ordenan por intensidad de respuesta para crear una lista ordenada. Aunque este paso es computacionalmente intensivo, la carga general del procesador se reduce como resultado de los pasos anteriores. Los clústeres locales de FOI se agrupan, ya que una característica de imagen fragmentada puede generar múltiples FOI. Cada una de las FOI se examina 40 sucesivamente, empezando por la más intensa, y se absorbe cualquier FOI dentro de una distancia de píxel predeterminada de otro, calculada de acuerdo con el tamaño del objetivo buscado. Por ejemplo, si el tamaño de objetivo preferido es 3x3 píxeles, todos los máximos locales que caen dentro de una plantilla de 3x3 se consideran del mismo objetivo. Puesto alternativamente, en este caso, se supone cualquier máximo local que se encuentre dentro de los dos píxeles entre sí son del mismo objetivo. La magnitud de la respuesta más fuerte de cada uno de 45 los grupos de píxeles se mantiene. En la Figura 5 se ilustran dos ejemplos de agrupación. Los píxeles 46, 48 se destacan de sus vecinos y están separados por un píxel en diagonal. Caen dentro de una plantilla de 3x3 y, por lo tanto, se representarían como una sola FOI si 3x3 es el tamaño objetivo deseado. La posición de la FOI está determinada por las coordenadas x e y promedio de los dos píxeles. Los píxeles 50, 52 son dos píxeles que están más separados en diagonal y, por lo tanto, dan lugar a dos fOi distintas si el tamaño de objetivo deseado es 3x3. Si 50 la plantilla de tamaño de objetivo preferido es de 5x5 píxeles, sin embargo, se asimilarían como una sola FOI.

A las FOI identificadas de ese modo se les asigna una puntuación que indica su prioridad. Las puntuaciones máximas y mínimas, Smax y Smin respectivamente, definen el rango de puntuaciones. La puntuación se realiza en dos pasos:

1. Las puntuaciones no refinadas se producen, en base a la respuesta de convolución del filtro de paso de

55 banda.

5

10

15

20

25

30

35

40

45

2. Las puntuaciones se refinan utilizando una relación de respuestas de convolución del Laplaciano del Gaussiano.

En la primera etapa del proceso de priorización, cada una de las respuestas, R, se compara con un umbral superior e inferior, Tu y Tl, respectivamente. El umbral inferior Tl es adicional al umbral 40. Las puntuaciones, S, se asignan en una escala lineal en base a la respuesta de cada una de las FOI en relación con los valores umbral. Las FOI con respuestas que caen por debajo del umbral inferior Tlse descartan, mientras que las FOI con respuestas por encima del umbral superior Tu se capan a la puntuación máxima, Smax. Todas las respuestas que se encuentran entre los umbrales superior e inferior se puntúan como sigue:

S

imagen1

-S^XR-T,) (Tu ~T¡)

Los umbrales superior e inferior se ajustan usando un filtro alfa, con parámetros dependientes del número de FOI que exceden cada uno de los umbrales. El filtro alfa genérico, para k-1, k > 0, respuestas deseadas que exceden el umbral T, viene dado por

imagen2

donde Rk es la k-ésima respuesta clasificada. El valor de a puede aumentarse para forzar al umbral a adaptarse más rápidamente. La naturaleza promedio del mecanismo asegura que el esquema de puntuación se adapta a los cambios persistentes en la escena de imagen sin reaccionar innecesariamente a las fluctuaciones de fotogramas individuales. Esto garantiza que las puntuaciones sean consistentes en todos los fotogramas de imagen, pero adaptables a diferentes escenarios.

El objetivo es ajustar los umbrales superior e inferior para controlar el número de FOI y las puntuaciones asociadas. Para el umbral superior, Tu, (Figura 6) se realiza un ajuste grande cuando el número de respuestas de FOI que exceden el umbral es mayor que tres o igual a cero, se realiza un pequeño ajuste cuando el umbral se excede en una o dos respuestas de FOI, y no ocurre ningún cambio cuando exactamente tres respuestas FOI están por encima del umbral, ilustradas en la Figura 7. En general, esto da como resultado dos o tres fOi que reciben una puntuación máxima.

Del mismo modo, el umbral inferior se ajusta para permitir un número fijo de FOI (un número adecuado al tamaño de imagen, para evitar la sobrecarga de la imagen) para alcanzar al menos la puntuación mínima, Smin, descartando todas las FOI que puntúen menos de Smin.

La segunda etapa del mecanismo de priorización, refinamiento de la puntuación, se logra por convolución con un par de máscaras del Laplaciano del Gaussiano de diferentes tamaños. La Figura 8 ilustra las componentes x e y de una máscara del Laplaciano del Gaussiano típica; las áreas claras son valores altos y las áreas más oscuras son cero. Esta representación indica que se esperaría una respuesta fuerte cuando la componente x (a la izquierda en la Figura 8) se convoluciona con un área de la imagen que contiene un borde vertical, mientras que la componente y responde a los bordes horizontales. Una respuesta fuerte combinada desde cada una de las componentes es indicativa de la presencia de una mancha en la imagen.

Convolucionar cada una de las máscaras con todos los píxeles de imagen llevaría mucho tiempo, pero en esta etapa, las máscaras solo necesitan convolucionarse en cada una de las FOI ya identificadas. El principio detrás de la utilización de los pares de máscaras es reducir el impacto del contraste, haciendo énfasis en la coincidencia de tamaños. Muchos filtros tienen la desventaja de proporcionar respuestas similares para características de imagen pequeñas de alto contraste y características de imagen más grandes de contraste moderado. En esta realización de la invención, sin embargo, al inspeccionar la relación de las dos respuestas de los pares de máscaras del Laplaciano del Gaussiano, se reduce el efecto del contraste. La Tabla 1 enumera las respuestas de máscaras teóricas de 9x9 píxeles y 15x15 píxeles para varios tamaños de características de imagen, cada una de un cuadrado blanco sobre fondo negro, donde C es el contraste de la característica de imagen. Con las imágenes tal como se reciben en la práctica, las relaciones resultantes son menos distintas, pero el método, sin embargo, puede proporcionar un medio eficiente para eliminar falsas alarmas y ayudar a la priorización.

Tabla 1: Respuestas del Laplaciano del Gaussiano para las características de imagen ideales

Tamaño (píxeles): 9x9 15x15

Sigma: 1,2 2,0

Tamaño de Característica de Imagen

1x1: 0,221C 0,080C

5

10

15

20

25

30

35

40

Tamaño (píxeles): 9x9 15x15

Sigma: 1,2 2,0

Tamaño de Característica de Imagen

3x3: 0,764C 0,511C

5x5: 0,350C 0,736C

7x7: 0,056C 0,557C

9x9: 0,004C 0,272C

11x11: 0,004C 0,095C

El refinamiento de puntuación utiliza la relación del Laplaciano del Gaussiano calculada para ajustar la puntuación de FOI. Utilizando un conjunto de secuencias de prueba con ubicaciones de características de imagen marcadas, los datos de prueba se han recopilado para encontrar una distribución y una relación esperada para las respuestas del Laplaciano. A las FOI con relaciones que coinciden estrechamente con las expectativas, se les da un gran aumento de puntuación, mientras que a las FOI con relaciones mucho más alejadas se les da una reducción de puntuación. Por ejemplo, con referencia a la tabla 1, cuando se buscan características de imagen de tamaño 3x3, la relación del Laplaciano del Gaussiano (LoG) para las características de imagen de tamaño 1x1 (aquí 0,221 / 0,08 = 2,76) probablemente sería significativamente mayor que la relación deseada para un Imagen de 3x3 (0,764 / 0,511 = 1,50), resultando en una disminución de la puntuación. De manera similar, se puede ver que las características mayores que 3x3 píxeles producen relaciones de LoG significativamente más pequeñas que 1,5. Así, al reducir las puntuaciones de FOI que tienen relaciones de LoG fuera de un rango preferido, p. ej. 1 a 2 cuando se buscan objetivos de tamaño 3x3, se puede enfatizar las FOI del tamaño preferido. El rango se basa inicialmente en los valores teóricos para un cuadrado blanco sobre un fondo negro, y se puede refinar utilizando datos reales. La puntuación revisada se mantiene dentro del intervalo [Smin, Smax] capando las puntuaciones a Smax y descartando cualquier FOI que ahora puntúe menos de Smin. El resultado es una lista priorizada de FOI que favorece las características de imagen del tamaño esperado. La lógica de refinamiento se ilustra en la Figura 9. En realizaciones operacionales de la invención, estas relaciones, y las relaciones correspondientes para otros tamaños de imagen que el operador puede seleccionar como de interés, están incorporadas en tablas de consulta en una base de datos 46 (figura 1), a las que se accede de acuerdo con el tamaño de objetivo deseado ingresado por el operador.

La etapa final del algoritmo implica la selección de características de interés 48, Figura 2, en base a la puntuación refinada. El resultado es una lista de características de interés contrastantes seleccionadas de acuerdo con el tamaño, que se puede determinar por un único parámetro ingresado por el operador. Estas FOI pueden mostrarse convenientemente al operador al superponerlas en la imagen mostrada original con etiquetas en pantalla, de modo que las de mayor interés sean inmediatamente evidentes.

Considerando además la base teórica de la invención, es una característica de las operaciones de transformación de características invariante a la escala (SIFT) que la respuesta de un filtro es sensible tanto al tamaño como al contraste, donde el paso de banda del filtro se selecciona para dar una respuesta pico para objetos de un tamaño elegido. Pueden surgir problemas cuando un objeto, que no es del tamaño elegido, tiene un alto contraste, de modo que un filtro desarrolla una respuesta significativa que excede la respuesta de un objeto de menor contraste de mayor tamaño. Como precursor del desarrollo de cualquier proceso de normalización, es necesario examinar las respuestas de filtro para objetos objetivo ideales, en este caso un cuadrado de intensidad uniforme. Se debe considerar un rango de factores de escala a, estos se pueden seleccionar usando la regla que relaciona el lado L del cuadrado y la respuesta pico de un operador de SIFT Laplaciano:

imagen3

y así para tamaños de objeto de 3x3, 9x9 y 17x17 píxeles, los factores de escala son 1,2, 3,6 y 6,8 respectivamente.

Considerar la respuesta de estos filtros SIFT a un objetivo cuadrado de intensidad uniforme de contraste C, en un fondo suave. El efecto del filtro es eliminar la respuesta de fondo, respondiendo solo a la señal de contraste del objetivo. La integración de la función de respuesta de impulso de filtro en todo el espacio 2D da como resultado cero; la señal objetivo puede considerarse como una señal de fondo a la que se ha agregado un conjunto de señales de contraste objetivo, que genera la respuesta de filtro. La siguiente tabla 2 (que es similar a la tabla 1, pero más detallada) muestra la variación en la respuesta de filtro como una función de factor de escala y de tamaño del objetivo:

Tabla 2. Comparación de las salidas del filtro SIFT

Tamaño de Objetivo: Tamaño de Máscara = 9x9 Tamaño de Máscara = 27x27 Tamaño de Máscara = 51x51

(NxN píxeles): 01 = 1,2 o2 = 3,6 03 = 6,8

5

10

15

20

25

1: 0,2210C 0,0246C 0,0069C

3: 0,7638C 0,1994C 0,0602C

5: 0,3510C 0,4512C 0,1578C

7: 0,0556C 0,6529C 0,2839C

9: 0,0038C 0,7250C 0,4186C

11: 0,0038C 0,6652C 0,5426C

13: 0,5245C 0,6400C

15: 0,3640C 0,7008C

17: 0,2260C 0,7216C

19: 0,1268C 0,7047C

21: 0,0648C 0,6569C

23: 0,0303C 0,5874C

25: 0.0130 C 0.5057 C

27: 0.0051 C 0.4204 C

Se puede ver que al considerar la relación de las respuestas de dos tamaños de máscara diferentes para un tamaño de objetivo deseado dado, se elimina el contraste C.

Supongamos que definimos tres categorías de objetivos:

Pequeño - 3x3 píxeles

Mediano - 9x9 píxeles

Grande - 17x17 píxeles

y dejar que la respuesta de filtro sea R(Ok) en un píxel al factor de escala k-ésima. En base a la Tabla 2, un

posible esquema para clasificar respuestas de objetos es:

í?(o-i)>í?(o-2)a ) > i?(o"3 ) =^> Pequeño

R(<?2)>R(v i)a R(cJ2 ) > R(g3 ) => Mediano R(cJ3 ) > R(cJ1 ) A R(<33 ) > R(cJ2 ) =^> Grande

La operación de la realización de la invención descrita específicamente en el presente documento se puede resumir de la siguiente manera:

• Un filtro de paso de banda se convoluciona con una imagen de entrada

• Se identifican características de imagen significativas, que son píxeles cuyas respuestas de filtro son máximos locales, es decir cada uno excede el de sus ocho vecinos y un valor de umbral.

• Las características de imagen se consideran características de interés (FOI) y se ordenan por respuesta.

• Los clústeres locales de píxeles se agrupan como una sola FOI.

• Las puntuaciones no refinadas se basan linealmente en los valores de respuesta de FOI en relación con los

umbrales inferior y superior.

• Las puntuaciones se refinan utilizando la relación de dos convoluciones del Laplaciano del Gaussiano.

• Un conjunto de FOI priorizadas se ordena de acuerdo con la puntuación.

La invención comprende cualquier característica novedosa o combinación de características descrita en el presente documento, reivindicada específicamente o no. El resumen adjunto se repite aquí como parte de la especificación.

Un método de procesamiento de imagen comprende convolucionar una característica de interés (FOI) seleccionada dentro de la imagen con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de las respuestas de convolución, como una indicación del tamaño de la FOI. Preferiblemente, las máscaras de convolución son del Laplaciano del Gaussiano. El método puede ser útil para priorizar objetivos potenciales en un campo de visión para su presentación a un operador.

Claims

5

10

15

20

25

30

35

40

45

REIVINDICACIONES

1. Un método para priorizar potenciales objetos de interés en un campo de visión para su presentación a un operador, que comprende convolucionar una característica de interés (en adelante FOI) (12, 14, 16, 18) seleccionada dentro de una imagen con una máscara, caracterizado por que el método comprende convolucionar la FOI (12, 14, 16, 18) con una máscara de un primer tamaño, repetir la convolución con una máscara de un segundo tamaño y calcular la relación de los resultados de la convolución como una indicación del tamaño de la primera FOI (12, 14, 16, 18), repetir el método para al menos otra FOI (12, 14, 16, 18) y clasificar las FOI (12, 14, 16, 18) de acuerdo con su tamaño indicado.
2. El método de la reivindicación 1 que comprende comparar cada una de las relaciones con un rango preferido de valores de relación y asignar a la respectiva FOI (12, 14, 16, 18) una puntuación que indica la cercanía de la relación a un valor asociado con un tamaño preferido de FOI (12, 14, 16, 18).
3. El método de la reivindicación 1 o la reivindicación 2, en donde la convolución es el Laplaciano del Gaussiano.
4. El método de cualquiera de las reivindicaciones 1 a 3, en donde las máscaras son cuadrados que tienen lados definidos por números impares de píxeles (42, 44) de la imagen.
5. El método de cualquiera de las reivindicaciones 1 a 4, que comprende filtrar una imagen de entrada para proporcionar una respuesta de filtro y seleccionar como una FOI (12, 14, 16, 18) una región para la cual la respuesta de filtro es un máximo local (36, 37, 38).
6. El método de las reivindicaciones 2 y 5, que comprende seleccionar como una sola FOI (12, 14, 16, 18) dos dichos máximos locales (36, 37, 38) que caen dentro de una plantilla representativa del tamaño preferido de FOI (12, 14, 16, 18).
7. El método de la reivindicación 5 o 6, en donde la imagen de entrada está filtrada por paso de banda, el método que comprende opcionalmente producir la imagen filtrada por paso de banda, convolucionando una imagen de entrada con un desenfoque Gaussiano y un filtro de paso alto.
8. El método de cualquiera de las reivindicaciones 5 a 7, que comprende identificar como dicho máximo local (36, 37, 38) un píxel de la imagen filtrada que tiene una respuesta de filtro mayor que la de cualquier otro píxel que sea contiguo al píxel.
9. El método de cualquiera de las reivindicaciones 5 a 8 que comprende clasificar los máximos locales identificados (36, 37, 38) en orden de magnitud de respuesta de filtro.
10. El método de la reivindicación 9, que comprende considerar para la identificación como dicho máximo local (36, 37, 38) solo píxeles que tienen una respuesta de filtro que excede un valor umbral (40) y opcionalmente ajustar el valor umbral (40) para limitar el número de píxeles considerados para la identificación como dichos máximos locales (36, 37, 38).
11. El método de la reivindicación 10, que comprende clasificar como iguales los máximos locales (36, 37, 38) cuyas respuestas de filtro exceden un segundo valor umbral (40) más alto y opcionalmente ajustar el segundo valor umbral (40) para que el número de máximos locales (36, 37, 38) cuya respuesta de filtro excede ese valor umbral (40) tienda hacia un número predeterminado.
12. El método de cualquiera de las reivindicaciones 10 u 11, que comprende ajustar dicho valor umbral (40) por medio de un filtro alfa.
13. Un método de procesamiento de imagen, que comprende un método de acuerdo con cualquier reivindicación precedente, que comprende seleccionar características (12, 14, 16, 18) en la imagen de acuerdo con el contraste total, ordenar las características seleccionadas de acuerdo con el tamaño, y clasificar las características ordenadas de acuerdo con su aproximación a un tamaño preferido.
14. El método de la reivindicación 13, que comprende filtrar la imagen para enfatizar los cambios locales de contraste en la misma y seleccionar características de interés de acuerdo con la magnitud local de la respuesta de filtro.
15. El método de la reivindicación 13 o 14, en donde dicha ordenación se realiza por referencia a la relación de un par de convoluciones del Laplaciano del Gaussiano para cada una de las imágenes seleccionada.
16. El método de una cualquiera de las reivindicaciones 13 a 15, que comprende superponer las características de interés priorizadas en una imagen mostrada al observador.

5 17. Un medio legible por ordenador que comprende un programa informático que, cuando se instala y opera, realiza

el método de cualquiera de las reivindicaciones precedentes.