ES2252309T3 - Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes. - Google Patents

Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes.

Info

Publication number
ES2252309T3
ES2252309T3 ES01982419T ES01982419T ES2252309T3 ES 2252309 T3 ES2252309 T3 ES 2252309T3 ES 01982419 T ES01982419 T ES 01982419T ES 01982419 T ES01982419 T ES 01982419T ES 2252309 T3 ES2252309 T3 ES 2252309T3
Authority
ES
Spain
Prior art keywords
regions
value
maximum entropy
entropy
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01982419T
Other languages
English (en)
Inventor
Timor Kadir
Paola Marcella Hobson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Oxford
Original Assignee
University of Oxford
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Oxford filed Critical University of Oxford
Application granted granted Critical
Publication of ES2252309T3 publication Critical patent/ES2252309T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

Método para clasificar píxeles en una imagen por grados de prominencia que incluye las etapas de: a) definir (200, 210) una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, en la que cada una de dichas regiones, para uno cualquiera de los píxeles en coordenadas (x, y), tiene una escala s diferente; b) calcular (230) un valor de entropía para cada una de dichas regiones; c) identificar (260) cualquier región de entropía máxima, siendo las regiones de entropía máxima regiones que incluyen un valor de entropía máximo; d) ponderar (270) dicho valor de entropía máximo de cada una de dichas regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico de dicho valor de entropía máximo; y e) clasificar (290) dichas regiones mediante dichos valores de entropía máximos ponderados, clasificándose así dichos píxeles.

Description

Método y aparato para determinar regiones de interés en imágenes y para una transmisión de imágenes.
Campo de la invención
La presente invención se refiere en general al campo del procesamiento de imágenes. Más particular, aunque no exclusivamente, la invención trata de métodos y un aparato para determinar regiones de interés en imágenes para una transmisión.
Antecedentes de la invención
Existe una brecha creciente entre la demanda de datos transmitidos a través de redes de ordenadores y el ancho de banda disponible. Similarmente, hay una gran demanda de la transmisión de datos por enlaces de radio digital, por ejemplo, desde y a radios móviles y teléfonos móviles. Esto ha avivado la búsqueda de métodos mejorados de compresión de datos y de tecnologías de transmisión más eficientes.
Las tecnologías de transmisión de la técnica anterior que son particularmente aptas para las aplicaciones de vídeo se centran en interpretar datos de imagen en la fuente de transmisión, transmitir los datos de interpretación en vez de la propia imagen y usar los datos de interpretación en el destino. Los datos de interpretación pueden o no transmitirse en forma comprimida.
Dos enfoques alternativos a la interpretación de imágenes son el enfoque "basado en imágenes", o de abajo arriba, y el enfoque "basado en modelos", o de arriba abajo.
El enfoque basado en imágenes se basa en que características en la imagen, tales como bordes o ángulos, se propaguen "naturalmente" y formen descripciones o modelos con sentido del contenido de imagen. Un ejemplo típico es la segmentación de imágenes fundada en figuras, en la que la tarea es separar el objeto de interés en primer plano del fondo.
En el enfoque basado en modelos se utiliza información con respecto a una expectativa del contenido para extraer un significado de unas imágenes. Un ejemplo típico es el reconocimiento de objetos, en el que un modelo de diseño asistido por ordenador (CAD) se compara con bordes encontrados en la imagen - un enfoque comúnmente empleado en la fabricación de aplicaciones de inspección de líneas.
La diferencia esencial entre los enfoques basados en imágenes y los basados en modelos reside en la etapa de agrupación de rasgos. En el enfoque basado en imágenes, los puntos de referencia para la agrupación de rasgos proceden de la imagen, mientras que en el enfoque basado en modelos los puntos de referencia proceden de los modelos de comparación.
En una variación de un enfoque basado en imágenes, se identifica un número de pequeñas zonas prominentes, o "iconos", dentro de una imagen. Estos iconos representan descripciones de áreas de interés. En este enfoque, la prominencia se define en términos de la complejidad o impredicibilidad locales de la señal o, más específicamente, de la entropía de los atributos locales. Los iconos con una gran complejidad de la señal tienen una distribución de la intensidad más plana y por tanto una mayor entropía. En términos más generales, es la gran complejidad de cualquier descriptor adecuado la que puede usarse como medida de la prominencia local.
Las técnicas conocidas de selección de iconos prominentes miden la prominencia de iconos a la misma escala a través de toda la imagen. La escala a usar para la selección a través de toda la imagen puede elegirse de varias maneras. Normalmente se escoge la escala más pequeña a la que se produce un máximo en la entropía global media. Sin embargo, el tamaño de las características de imagen varía. Por tanto, una escala de análisis que es óptima para una característica dada de un cierto tamaño puede no ser óptima para una característica de un tamaño diferen-
te.
El documento "Saliency maps and attention selection in scale and spatial coordinates: an information theoretic approach", por M. Jagersand, en Proceedings of the Fifth International Conference on Computer Vision 1995, págs. 195-202, da a conocer un método para determinar regiones de interés mediante una evaluación de las distancias Kullback-Leibler de las distribuciones locales en escala de grises de escalas adyacentes.
J. Sporring y J. Weickert resumen en "On generalized entropies and scale-space", Proceedings of the First International Conference on Scale-Space Theory in Computer Vision 1997, págs. 53-64, varias medidas de la información empleadas para describir el contenido de información de imágenes representadas en espacio escala e ilustran su uso para describir la prominencia de regiones de imagen en escalas diferentes.
Sumario de la invención
La presente invención da a conocer métodos y un aparato para determinar regiones de interés en imágenes. La presente invención proporciona maneras de ampliar a escala la medida de la prominencia y así encontrar características que existen en una gama muy limitada de escalas. Esto da lugar a iconos prominentes que tienen un nivel óptimo de entropía.
Según una realización preferida de la presente invención, un método para clasificar píxeles en una imagen por grados de prominencia incluye las etapas de: definir una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, donde cada una de las regiones para uno cualquiera de los píxeles en coordenadas (x,y) tiene una escala s diferente; calcular un valor de entropía para cada una de las regiones; identificar a cualquiera de las regiones como teniendo un valor de entropía máximo; ponderar el valor de entropía máximo de cada una de las regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico del valor de entropía máximo; clasificar las regiones de los valores de entropía máximos ponderados, clasificándose así los píxeles.
Además, según una realización preferida de la presente invención, la etapa de cálculo puede incluir calcular una estimación de una función de densidad de probabilidad (FDP) para los píxeles en cada una de las regiones. La etapa de cálculo puede incluir calcular utilizando un estimador FDP de ventanas de Parzen.
Adicionalmente, la etapa de cálculo puede incluir calcular utilizando una división en barras (binning) de histograma. El método puede incluir además la etapa de aplicar un promediado de 3 tomas a la estimación de la anchura del pico antes de realizarse la etapa de ponderación.
Además, según una realización preferida de la presente invención, la etapa de ponderación puede incluir ponderar según un valor W(x,y,s) según la fórmula:
S(x,y,s) = H(x,y,s) \cdot W(x,y,s)
donde
W(x,y,s)=\sum\limits_{i} |p_{i}(s)-p_{i}(s+1)|\cdot s
y H(x,y,s) es la entropía de una región (x,y,s), y p_{i} son probabilidades discretas.
Según una realización preferida de la presente invención, también se proporciona un método para determinar regiones de prominencia en una imagen, incluyendo el método las etapas de a) definir una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, donde cada una de las regiones para cada uno de los píxeles en coordenadas (x,y) tiene una escala s diferente, b) calcular un valor de entropía para cada una de las regiones, c) identificar a cualquiera de las regiones como teniendo un valor de entropía máximo, d) ponderar el valor de entropía máximo de cada una de las regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico del valor de entropía máximo y e) para cada una seleccionada de las regiones de entropía máxima f) seleccionar al menos una región vecina de entropía máxima, g) determinar la media y la varianza de cada una de x, y y s para la región de entropía máxima seleccionada y la al menos una región vecina, y cuando la mayor de las varianzas no sobrepasa un umbral predeterminado, h) eliminar de las regiones de entropía máxima cualquier región a una distancia predeterminada del punto (x,y,s) medio e i) almacenar los valores medios, designándose así una región de interés.
Además, según una realización preferida de la presente invención, el método incluye además realizar la etapa e) en el orden de los valores de entropía máximos ponderados.
La invención comprende además un método de transmisión de imágenes según la reivindicación 11 adjunta y dispositivos según las reivindicaciones 12 y 13 adjuntas.
Breve descripción de los dibujos
La presente invención se comprenderá y apreciará en mayor profundidad a partir de la siguiente descripción detallada tomada en conjunción con los dibujos adjuntos, en los que:
La figura 1A es una ilustración simplificada de un icono 10 ejemplar, útil para comprender la presente invención;
la figura 1B es una ilustración gráfica simplificada de un análisis de entropía para unos puntos P_{1} y P_{2} de la figura 1A, útil para comprender la presente invención;
la figura 2 es un diagrama de flujo simplificado de un método para determinar la prominencia de iconos, operativo según una realización preferida de la presente invención;
la figura 3 es un diagrama de flujo simplificado de un método para seleccionar regiones prominentes, operativo según una realización preferida de la presente invención; y
\newpage
la figura 4 es un ilustración pictórica que muestra los resultados de una implementación del método de las figuras 2 y 3.
La figura 5 ilustra un dispositivo para clasificar píxeles en una imagen por grados de prominencia, según una realización de la invención.
Las figuras 6 y 7 ilustran aplicaciones de la invención al reconocimiento de características y escalas prominentes en imágenes de huellas dactilares.
Descripción detallada de realizaciones preferidas
La presente invención amplía las medidas de la prominencia de la técnica anterior para ser capaz de comparar la prominencia tanto de puntos como de escalas espaciales diferentes. La invención permite la selección de ciertas escalas prominentes y ubicaciones espaciales prominentes simultáneamente. Inherente a esta idea es que una característica puede tener un valor de prominencia diferente a escalas diferentes. La invención permite una comparación directa de estos.
La mayoría de los enfoques multiescala al procesamiento de señales caen en dos categorías principales. Los esquemas en la primera categoría intentan captar la naturaleza multiescala de señales procesando una representación multiescala completa de la señal. Los esquemas en la segunda categoría intentan encontrar una mejor escala o conjunto de escalas para representar la señal, a menudo analizando sintácticamente una representación multiescala completa a fin de escoger la(s) escala(s) particular(es) de interés. La invención supone un desarrollo en el área general del segundo de estos enfoques.
Selección de las escalas de iconos y cálculo de los valores de prominencia
El método de la invención se explica de la mejor manera considerando en comportamiento de la métrica de escalas de entropía con parámetros de escala variables.
El problema de la selección de escala puede verse con referencia a la figura 1A y la figura 1B. La figura 1A es una ilustración simplificada de un icono 10 ejemplar. La figura 1B es una ilustración gráfica simplificada de un análisis de entropía para unos puntos P_{1} y P_{2}.
En la figura 1A, el icono 10 es ilustrativo de una característica dentro de una imagen. A efectos ilustrativos, la característica se muestra como un círculo. En una imagen real, las características pueden ser evidentemente radicalmente diferentes en forma de este caso idealizado.
Considerando la figura 1A, el icono 10 se muestra comprendiendo un círculo 12 en el que, en el borde y el centro del círculo 12, respectivamente, se muestran dos puntos P_{1} y P_{2}. La totalidad del círculo 12, incluyendo los puntos P_{1} y P_{2}, ha de entenderse como siendo un icono/característica completamente negro de la imagen. Sin embargo, la figura 1A muestra el área dentro del círculo 12 como una región sombreada a fin de que en la figura puedan reconocerse las ubicaciones de los puntos P_{1} y P_{2}.
Un cuadrado 14 alrededor del círculo 12 representa el cuadrado limitativo para la escala a la que se produce el máximo en entropía para el icono 10 cuando se toma en torno al punto P_{2}. Este máximo de entropía se ilustra en la figura 1B como el pico en la gráfica de entropía marcado como P2.
En la figura 1B existe claramente un pico en ambas gráficas P1 y P2 para los puntos P_{1} y P_{2}, respectivamente. Basándose únicamente en la entropía máxima, no estaría claro cuál de P_{1} y P_{2} sería el más prominente, ya que tanto P_{1} como P_{2} tienen valores de entropía máximos, aunque a escalas diferentes. Por tanto, ambas gráficas parecerían ser igualmente útiles para determinar la escala apropiada.
Sin embargo, en la figura 1B también puede observarse que las dos gráficas de entropía frente a la escala tienen distintas anchuras del pico. En la figura 1B, la gráfica para P_{1} es aproximadamente el doble de ancha que la gráfica para P_{2}. Por lo general, se supone que una característica que está presente a través de un gran número de escalas es particularmente prominente. Sin embargo, tal como se ha descrito anteriormente, la prominencia se basa en la complejidad, definida en términos de impredicibilidad. En las imágenes de la vida real, esta existe en un pequeño número de escalas y ubicaciones espaciales, y por tanto se considera relativamente rara. Si una imagen era compleja e impredecible en todas las ubicaciones espaciales y a todas las escalas, sería entonces o bien una imagen aleatoria o bien fractal. Por tanto, en la figura 1B, el pico de P_{2} es en realidad más prominentes que el de P_{1}. Debería notarse que un cierto punto puede tener varios máximos de entropía, cada uno a una escala diferente.
Este análisis de la figura 1B indica que la anchura de la gráfica de entropía, tomada en torno a distintos puntos en una imagen, puede servir como indicador útil. En particular, una estimación de la prominencia basada únicamente en la altura del pico no permite hacer una distinción entre las dos gráficas de la diferencia 1B.
Ahora se hace referencia a la figura 2, que es una ilustración simplificada de un diagrama de flujo de un método para determinar la prominencia de iconos, operativo según una realización preferida de la presente invención.
En el método de la figura 2, se define una región circular de un radio s, normalmente inicializado en un valor s_{1} de escala mínimo (etapa 200), alrededor de un píxel en coordenadas (x, y) en una imagen (etapa 210). A continuación, se estima la función de densidad de probabilidad (FDP) de los valores de los píxeles en la región (etapa 220). Los valores pueden ser valores de intensidad de nivel gris, niveles de color o cualquier otra característica empleada para definir el tipo de interés deseado para las características de imagen. Preferiblemente se emplea un estimador FDP de ventanas de Parzen, en el que un núcleo (kernel) predefinido se coloca en los puntos de datos del conjunto de muestras. La estimación FDP es entonces la suma de todos los núcleos a través del eje de datos. Para su maleabilidad matemática y la resultante estimación FDP suave, se emplea preferiblemente un núcleo gaussiano, donde la sigma controla el grado de suavización aplicado a la estimación FDP. Puesto que no hay división en barras arbitraria, el valor de entropía es estable ante cambios de intensidad lineal.
Como alternativa al algoritmo de estimación FDP de ventanas de Parzen puede utilizarse un método básico de división en barras de histograma. En este método, en vez de colocarse un núcleo (por ejemplo, un núcleo gaussiano) en cada punto de datos y luego sumarse todos los núcleos para calcular la estimación FDP, simplemente se divide el eje datos en un número de barras, por ejemplo, 16 o 32 barras, teniendo con cada barra unos valores de datos superior e inferior. Se lleva una cuenta para cada barra y se incrementa para cada píxel dentro de la ventana local que está entre los valores de datos superior e inferior para esa barra.
Una vez que se calcula la FDP, entonces la entropía H de la región (x,y,s) se calcula (etapa 230) usando la fórmula:
H(x,y,s)=-\sum\limits_{i}p_{i}(log(p_{i}))
donde p_{i} son las probabilidades discretas y 0 < p_{i} <= 1.
A continuación, el radio s se incrementa en el siguiente incremento de escala (etapa 240), y las etapas anteriores se repiten para todas las escalas de s entre s_{1} y un valor s_{2} de escala máxima (etapa 250). Una vez que la entropía se ha calculado para todas las regiones entre s_{1} y s_{2} para un píxel (x,y), se determinan aquellas regiones que tienen una entropía máxima en relación con la entropía de las regiones inmediatamente precedentes y subsiguientes (etapa 260).
La entropía H para cada región de pico se pondera entonces según un valor W(x,y,s) que es proporcional a su estimación de la anchura del pico (etapa 270) a fin de proporcionar una medida de la prominencia S empleando la fórmula:
S(x,y,s) = H(x,y,s) \cdot W(x,y,s)
donde
W(x,y,s)=\sum\limits_{i} |p_{i}(s)-p_{i}(s+1)|\cdot s
Las etapas 200 a 270 se repiten preferiblemente para todos los píxeles en la imagen (etapa 280). Una vez que se han ponderado los valores de entropía de las regiones de entropía máxima, se clasifican preferiblemente por valor de entropía máximo ponderado, resultando así en una clasificación de los píxeles por prominencia del pico (etapa
290).
El método de la invención es novedoso debido al uso de la anchura del pico como factor de ponderación en el cálculo de la prominencia. Sin embargo, la técnica propiamente dicha seleccionada para la estimación de la anchura del pico representa una mejora adicional de la idea general de usar la anchura del pico.
Los inventores han escogido una técnica para la estimación de la anchura del pico que implica calcular la suma de gradientes absolutos del histograma medidos en el pico. El histograma al que se hace referencia aquí es una aproximación de la función de densidad de probabilidad (PDF) continua de las distribuciones de intensidad en torno a los puntos tales como P_{1} y P_{2} en la figura 1A. Si la suma es grande, esto indica que el pico en la distribución de intensidades, véase la figura 1B, es bastante puntiagudo. Un valor pequeño de la suma indica que es probable que el pico sea bastante ancho. La ventaja de este cálculo de la suma de diferencias absolutas es que evita casos particulares con los que hay que tratar por separado para una simple medición de la anchura del pico. Estos casos particulares frenarían el cálculo si los inventores hubiesen elegido realizar una simple medición de la anchura del pico. El cálculo de la suma de diferencias absolutas es, por tanto, robusto y no sufre retardos significativos en el cálculo.
El cálculo de la suma de diferencias absolutas es el cálculo al que se ha hecho referencia anteriormente con la fórmula:
W(x,y,s)=\sum\limits_{i} |p_{i}(s)-p_{i}(s+1)|\cdot s
W es por tanto la suma de diferencias absolutas, ponderada por la escala s.
A fin de incrementar la robustez frente al ruido, puede aplicarse un sencillo promediado de 3 tomas a la estimación de la anchura del pico antes de ponderar el valor de entropía. Una vez que se ha calculado el valor de ponderación, el valor W(x,y,s) proporcional a la estimación de la anchura del pico a cada escala s se sustituye por el promedio de los valores a s-1. s y s+1. Ese promedio es:
(W(x,y,s-1) + W(x,y,s) +W(x,y,s+1))/3
Esta operación normalmente no se realizaría a las escalas mínima y máxima.
Selección y agrupamiento de regiones
Resulta ventajoso escoger robustamente puntos individuales de máximos de entropía. Esto se basa en la persistencia de estos puntos en varias condiciones de formación de imágenes, tales como el ruido o pequeñas cantidades de movimiento. Es sabido que la presencia de ruido en una imagen actúa como un aleatorizador y generalmente aumenta el valor de entropía, afectando más a valores de entropía bajos que a valores de entropía altos. Sin embargo, el efecto del ruido también depende sobremanera de la forma de la superficie de entropía local en torno al máximo. Puesto que el punto máximo de un pico estrecho se ve menos afectado por el ruido que el de un pico ancho, la robustez de escoger puntos individuales de máximos de entropía se basa entonces en lo puntiagudo del pico.
La forma de la superficie de entropía depende de tres factores principales: la superficie de intensidad de la imagen original, la forma de la ventana de muestreo o región de interés (ROI - Region of Interest) y el tamaño de la ROI (escala). La forma de la ROI es circular, ya que esto permite que el valor de entropía sea rotacionalmente invariable. La dependencia de la superficie de la imagen es un resultado de un desajuste entre el tamaño y/o la forma de la ROI de muestreo y la característica de interés de la imagen. Suponiendo que la escala está correctamente ajustada y que la forma de la ROI es fija, se deduce que esta dependencia no es controlable y que escoger puntos individuales en el espacio de entropías no es un método robusto.
Un método más robusto sería escoger regiones en vez de puntos en el espacio de entropías. Aunque los píxeles individuales en una región prominente puedan verse afectados por el ruido en cualquier instante dado, no es probable que afecte a todos ellos de manera que la región en conjunto se vuelva no prominente.
Ahora se hace referencia a la figura 3. La figura 3 es una ilustración simplificada de un diagrama de flujo de un método para seleccionar regiones prominentes, operativo según una realización preferida de la presente invención.
En el método de la figura 3 sólo se procesan las regiones de entropía máxima, tal como se determinaron en la figura 2. El procesamiento de estas regiones es el siguiente.
Se selecciona (etapa 300) la región (x,y,s) de pico de mayor prominencia, tal como determinó el método de la figura 2. El propio pico (x,y,s) está definido por el punto central de la región.
A continuación se seleccionan las K regiones de pico más próximas (etapa 310). En el espacio (x,y,s), la proximidad puede definirse basándose en una suma de los cuadrados de la distancia vectorial (x^{2} + y^{2} + s^{2}). El valor de K determina la robustez frente al ruido de las características que están detectándose. Un valor más alto de K tendrá como resultado que se detecten regiones más grandes con propiedades bien especificadas, por ejemplo, un automóvil en la imagen. Un valor más pequeño de K permite detectar características de detalles más finos, por ejemplo, una antena de coche en la imagen. Preferiblemente, K está adaptado hasta que se sobrepase un umbral de varianza predeterminado.
Una vez que se han determinado las K regiones de pico para la región de pico seleccionada, se calculan la media y la varianza de x, y y s para todas las regiones seleccionadas (etapa 320). A continuación, la más grande de las tres varianzas se compara con un umbral. El valor del umbral puede fijarse según algoritmos de agrupamiento conocidos, normalmente 0,7 (etapa 330). Una varianza que es menor que el umbral indica normalmente que las regiones están bien agrupadas, en cuyo caso se almacenan entonces los valores medios de x, y y s (etapa 340).
Aquellas de las K regiones de pico que estén a una distancia D multiplicada por la(s) media(s) del punto (x,y,s) medio se eliminan entonces de la lista de regiones de pico de prominencia creada por el método de la figura 2 (etapa 350). Se puede fijar D para que sea cualquier valor o, preferiblemente, un valor adaptativo relacionado con la varianza, tal como un valor proporcional a 3 x la desviación estándar.
Una varianza (etapa 330) que es más grande que el umbral indica normalmente que no se encuentra ningún agrupamiento, en cuyo caso el punto puede almacenarse como un punto aislado, el valor de K puede reducirse hasta que se consiga el agrupamiento, posiblemente hasta un punto individual, o bien el punto puede sencillamente permanecer en la lista de puntos prominentes para ver si se agrupa con alguna otra cosa (etapa 370).
Las etapas 300-350 se realizan entonces sobre la siguiente región restante más alta de entropía máxima (etapa 360) hasta que se hayan procesado todas las regiones de entropía máxima, preferiblemente, en orden de valor de entropía máximo ponderado.
El presente método de agrupamiento tiene en cuenta por tanto el impacto del ruido sobre el cálculo de la prominencia de la figura 2 y da consideración a puntos de alta entropía que están muy correlacionados en el espacio de prominencia.
Si las regiones son regiones de puntos, entonces la varianza puede ser cero. El cálculo de la varianza puede descartarse cuando en el cálculo sólo se utilicen dos regiones.
La figura 4 muestra los resultados de una implementación del método de las figuras 2 y 3. En la figura 4, se han hecho corresponder iconos prominentes entre las dos imágenes 30 y 32 empleando el método de la invención. En la implementación, se han seleccionado regiones y escalas prominentes en las dos imágenes 30 y 32. Los iconos se han correlacionado, en 34, para encontrar los iconos que mejor corresponden entre las dos imágenes.
Antes de llevarse a cabo los métodos descritos en la presente memoria, pueden usarse etapas de preprocesamiento para reducir el ruido en la imagen original. Los métodos de difusión son muy conocidos por sus propiedades de reducción del ruido y de suavización y se citan mucho como útiles para generar representaciones en espacio escala de la señal original. Los métodos de espacio escala intentan representar la señal original a un número de escalas mediante unas operaciones de suavización sucesivas. Aunque se considera que la difusión lineal, que es equivalente a suavizar con un filtro gaussiano, proporciona la suavización más general, la experimentación ha mostrado que resultan preferibles la difusión isotrópica no lineal y la difusión anisotrópica no lineal. Los métodos de difusión isotrópica no lineal y de difusión anisotrópica no lineal ajustan la suavización de manera que no se suavicen unos bordes significativos predefinidos. En la difusión isotrópica no lineal, la suavización se pondera mediante una función de gradiente local. En la difusión anisotrópica no lineal, la suavización también se dirige a la dirección de los bordes. La difusión anisotrópica no lineal también elimina el ruido en los bordes.
Método de transmisión de imágenes
La presente invención comprende también un método de transmisión de imágenes. Este método de transmisión de imágenes comprende los métodos explicados anteriormente.
En particular, los métodos de clasificación de píxeles y de determinación de la prominencia en una imagen proporcionan una manera de identificar regiones importantes de una imagen. Tal identificación puede emplearse para identificar partes de una imagen que se transmiten entonces de manera preferente.
Por ejemplo, una imagen puede transmitirse por un enlace de radio, a o desde una radio móvil (PMR - Private Mobile Radio) o un teléfono móvil. El ancho de banda del enlace de radio disponible puede restringir sustancialmente la cantidad de datos que puede transmitirse de una imagen. Los píxeles clasificados en los primeros puestos o las regiones más prominentes pueden transmitirse más a menudo que otros datos. De hecho, estos pueden ser las únicas partes de una imagen que se transmitan, por ejemplo, durante periodos cuando una imagen cambia rápidamente con el tiempo.
Aparato
La invención se ha descrito anteriormente en términos de un método. Sin embargo, la invención también comprende dispositivos que funcionan según la invención.
Una realización de un dispositivo así se ilustra en la figura 5 adjunta. El dispositivo (500) de la figura 5 sirve para clasificar píxeles en una imagen por grados de prominencia. El dispositivo comprende:
a) un medio (510) para definir una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen (505), teniendo cada una de las regiones una escala s diferente para cualquiera de dichos píxeles en coordenadas x, y;
b) un medio (530) para calcular un valor de entropía para cada una de las regiones;
c) un medio (560) para identificar cualquier región de entropía máxima, siendo las regiones de entropía máxima regiones que incluyen un valor de entropía máximo;
d) un medio (570) para ponderar el valor de entropía máximo de cada una de las regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico del valor de entropía máxi-
mo;
e) un medio (590) para clasificar las regiones por los valores de entropía máximos ponderados, clasificándose así los píxeles.
En la figura 5 también se muestra una unidad 508 de "adquisición y estructura de trama", que incluye una cámara para barrer la imagen. El experto en la técnica conoce tal unidad y por tanto no se describe con más detalle. El estimador 520 FDP proporciona la función de densidad de probabilidad, tal como se ha descrito anteriormente con referencia a los métodos de la invención.
La invención también se extiende a un dispositivo de transmisión de imágenes. El dispositivo de transmisión de imágenes comprende un dispositivo, tal como el explicado anteriormente y explicado generalmente en conexión con la figura 5. El dispositivo de transmisión de imágenes puede seleccionar regiones prominentes de una imagen para una transmisión preferente. Particularmente, cuando la transmisión tiene lugar por un enlace de radio a o desde una radio móvil o portátil (PMR) o un teléfono móvil, la transmisión puede comprender únicamente las regiones seleccionadas, o estas regiones pueden transmitirse con más frecuencia que otras regiones.
El dispositivo de transmisión de imágenes puede formar parte de una radio móvil o portátil (PMR) o de un teléfono móvil.
Mapas de características diferentes
En el método y el aparato básicos de la invención, se ha empleado la distribución local de valores de intensidad como el descriptor de la prominencia. Sin embargo, la invención no está restringida a esto. Puede utilizarse cualquier mapa de características adecuado para la tarea particular entre manos.
Por ejemplo, al realizar un análisis de imágenes de huellas dactilares, normalmente se considera que las bifurcaciones y los puntos finales de las crestas son prominentes. Para esta tarea se emplea un mapa de características de dirección de cresta. Las partes no prominentes son aquellas que constan de líneas a una sola escala y en una sola dirección predominante. Las bifurcaciones y los puntos finales se componen de muchas direcciones de borde y, posiblemente, escalas. En vez de usar la FDP de los valores de intensidad, se utiliza la FDP de direcciones de borde y de escalas. La figura 6 muestra las partes más prominentes, y sus escalas respectivas, de una imagen de huella dactilar encontradas empleando este método. Véase también la figura 7.
Por tanto, el método y el aparato de la invención pueden usar cualquier mapa de características adecuado en la determinación de la prominencia.
Correspondencia de regiones prominentes
La correspondencia es una operación muy común necesaria en muchas tareas de visión por ordenador. Por ejemplo, en el reconocimiento de objetos debe encontrarse el modelo apropiado en la base de datos de objetos. Esto se realiza normalmente intentando probar exhaustivamente la correspondencia entre todos los modelos en la base de datos y las características de imagen.
El método de prominencia de la presente invención puede mejorar la realización de tales tareas al reducir la cantidad de datos que es necesario almacenar para cada modelo. Por tanto, esto reduce la complejidad de la búsqueda de modelo. Hace esto de dos maneras principales:
(i) Reduce el número de descriptores que es necesario almacenar. Sólo se describen las regiones prominentes.
(ii) Se almacenan las escalas respectivas para cada región prominente. Por tanto, se reduce la dimensionalidad del espacio de búsqueda. Esto es porque se conoce la escala de los bits prominentes, por lo que no hay necesidad de probar muchas escalas entre el modelo y la imagen.
El descriptor apropiado para la tarea debería escogerse de manera que sea más potente (o descriptivo) que el usado para el mapa de características de prominencia. En los ejemplos de correspondencia mostrados en la figura 4, se ha utilizado directamente el vector de valores de píxel. Este puede considerarse como un descriptor muy potente.
En algunas aplicaciones, puede resultar más apropiado usar descriptores menos discriminantes, tales como invariantes estadísticas o geométricas de grandes dimensiones. Estos pueden proporcionar beneficios tales como una invarianza rotacional o fotométrica.
Una vez que se han seleccionado las regiones prominentes, pueden usarse en una tarea de correspondencia.
Los métodos y el aparato descritos en la presente memoria se han descrito de manera suficiente como para permitirles a los expertos en la técnica adaptar fácilmente hardware y software disponible comercialmente según sea necesario para reducir cualquiera de las realizaciones de la presente invención a la práctica sin demasiada experimentación y empleando técnicas convencionales.
Aunque la presente invención se haya descrito con referencia a unas pocas realizaciones específicas, se pretende que la descripción sea ilustrativa como un todo y que no se interprete como que limita la invención a las realizaciones mostradas. Se aprecia que a los expertos en la técnica pueden ocurrírseles varias modificaciones que, aunque no se muestren específicamente en la presente memoria, están no obstante dentro del verdadero alcance de la invención, tal como se define en las reivindicaciones adjuntas.

Claims (13)

1. Método para clasificar píxeles en una imagen por grados de prominencia que incluye las etapas de:
a) definir (200, 210) una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, en la que cada una de dichas regiones, para uno cualquiera de los píxeles en coordenadas (x,y), tiene una escala s diferente;
b) calcular (230) un valor de entropía para cada una de dichas regiones;
c) identificar (260) cualquier región de entropía máxima, siendo las regiones de entropía máxima regiones que incluyen un valor de entropía máximo;
d) ponderar (270) dicho valor de entropía máximo de cada una de dichas regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico de dicho valor de entropía máximo; y
e) clasificar (290) dichas regiones mediante dichos valores de entropía máximos ponderados, clasificándose así dichos píxeles.
2. Método según la reivindicación 1, en el que dicha etapa b) de cálculo comprende calcular (220) una estimación de una función de densidad de probabilidad (FDP) para dichos píxeles en cada una de dichas regiones.
3. Método según la reivindicación 2, en el que dicha etapa b) de cálculo comprende calcular (220) utilizando un estimador FDP de ventanas de Parzen.
4. Método según la reivindicación 2, en el que dicha etapa b) de cálculo comprende calcular (200) utilizando una división en barras de histograma.
5. Método según la reivindicación 1 y que comprende además la etapa de aplicar un promediado de 3 tomas a dicha estimación de la anchura del pico antes de realizarse dicha etapa d) de ponderación.
6. Método según la reivindicación 1, en el que dicha etapa d) de ponderación comprende ponderar según un valor W(x,y,s) según la fórmula S(x,y,s) = H(x,y,s) · W(x,y,s), donde:
W(x,y,s)=\sum\limits_{i} |p_{i}(s)-p_{i}(s+1)|\cdot s
y H(x,y,s) es la entropía local.
7. Método para determinar regiones de prominencia en una imagen, incluyendo el método las etapas de:
a) definir (200, 210) una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, en la que cada una de dichas regiones para cada uno de dicha píxeles en coordenadas (x,y) tiene una escala s diferente;
b) calcular (230) un valor de entropía para cada una de dichas regiones;
c) identificar (260) a cualquiera de dichas regiones como teniendo un valor de entropía máximo;
d) ponderar (270) dicho valor de entropía máximo de cada una de dichas regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico de dicho valor de entropía máximo; y
e) para cada una seleccionada de dichas regiones de entropía máxima (300):
f)
seleccionar (310) al menos una región vecina de entropía máxima;
g)
determinar (320) la media y la varianza de cada una de x, y y s para dicha región de entropía máxima seleccionada y dicha al menos una región vecina; y
cuando la mayor de las varianzas no sobrepasa un umbral (330) predeterminado,
h)
eliminar (350) de dichas regiones de entropía máxima cualquier región a una distancia predeterminada de dicho punto (x,y,s) medio; e
i)
almacenar (340) dichos valores medios, designándose así una región de interés.
8. Método según la reivindicación 7 y que comprende además realizar la etapa e) en el orden de dichos valores de entropía máximos ponderados.
\newpage
9. Método según la reivindicación 7 o la reivindicación 8, en el que las regiones son regiones de puntos y la varianza es cero.
10. Método según cualquiera de las reivindicaciones 7 a 9, en el que sólo hay dos regiones y el cálculo de la varianza se descarta.
11. Método de transmisión de imágenes, que comprende un método según cualquier reivindicación anterior.
12. Dispositivo (500) para clasificar píxeles en una imagen por grados de prominencia, que comprende:
a) un medio (510) para definir una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen (505), teniendo cada una de dichas regiones una escala s diferente para cualquiera de dichos píxeles en coordenadas x, y;
b) un medio (530) para calcular un valor de entropía para cada una de dichas regiones;
c) un medio (560) para identificar cualquier región de entropía máxima, siendo las regiones de entropía máxima regiones que incluyen un valor de entropía máximo;
d) un medio (570) para ponderar dicho valor de entropía máximo de cada una de dichas regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico de dicho valor de entropía máximo;
e) un medio (590) para clasificar dichas regiones por dichos valores de entropía máximos ponderados, clasificándose así los píxeles.
13. Dispositivo de transmisión de imágenes, que comprende un dispositivo según la reivindicación 12 para seleccionar regiones prominentes de una imagen para una transmisión preferente.
ES01982419T 2000-10-09 2001-10-09 Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes. Expired - Lifetime ES2252309T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0024669 2000-10-09
GB0024669A GB2367966B (en) 2000-10-09 2000-10-09 Method and apparatus for determining regions of interest in images and for image transmission

Publications (1)

Publication Number Publication Date
ES2252309T3 true ES2252309T3 (es) 2006-05-16

Family

ID=9900909

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01982419T Expired - Lifetime ES2252309T3 (es) 2000-10-09 2001-10-09 Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes.

Country Status (11)

Country Link
US (1) US7162081B2 (es)
EP (1) EP1374168B1 (es)
JP (1) JP3964327B2 (es)
KR (1) KR20040010540A (es)
AT (1) ATE308085T1 (es)
AU (1) AU2002214009A1 (es)
DE (1) DE60114469T2 (es)
EA (1) EA004910B1 (es)
ES (1) ES2252309T3 (es)
GB (1) GB2367966B (es)
WO (1) WO2002031766A2 (es)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2375908B (en) * 2001-05-23 2003-10-29 Motorola Inc Image transmission system image transmission unit and method for describing texture or a texture-like region
GB2393062B (en) * 2002-09-13 2005-01-05 Motorola Inc Image transmission system and method for determining regions of interest in an image transmission
US7382897B2 (en) * 2004-04-27 2008-06-03 Microsoft Corporation Multi-image feature matching using multi-scale oriented patches
US7327865B2 (en) * 2004-06-30 2008-02-05 Accuray, Inc. Fiducial-less tracking with non-rigid image registration
US7522779B2 (en) * 2004-06-30 2009-04-21 Accuray, Inc. Image enhancement method and system for fiducial-less tracking of treatment targets
US7231076B2 (en) * 2004-06-30 2007-06-12 Accuray, Inc. ROI selection in image registration
US7366278B2 (en) * 2004-06-30 2008-04-29 Accuray, Inc. DRR generation using a non-linear attenuation model
US7426318B2 (en) * 2004-06-30 2008-09-16 Accuray, Inc. Motion field generation for non-rigid image registration
US8902971B2 (en) 2004-07-30 2014-12-02 Euclid Discoveries, Llc Video compression repository and model reuse
US9578345B2 (en) 2005-03-31 2017-02-21 Euclid Discoveries, Llc Model-based video encoding and decoding
US9532069B2 (en) 2004-07-30 2016-12-27 Euclid Discoveries, Llc Video compression repository and model reuse
US9743078B2 (en) 2004-07-30 2017-08-22 Euclid Discoveries, Llc Standards-compliant model-based video encoding and decoding
US20060117268A1 (en) * 2004-11-30 2006-06-01 Micheal Talley System and method for graphical element selection for region of interest compression
US8396153B1 (en) 2004-12-07 2013-03-12 Adaptix, Inc. Cooperative MIMO in multicell wireless networks
US8908766B2 (en) * 2005-03-31 2014-12-09 Euclid Discoveries, Llc Computer method and apparatus for processing image data
JP4427001B2 (ja) * 2005-05-13 2010-03-03 オリンパス株式会社 画像処理装置、画像処理プログラム
US7330578B2 (en) * 2005-06-23 2008-02-12 Accuray Inc. DRR generation and enhancement using a dedicated graphics device
US7512574B2 (en) * 2005-09-30 2009-03-31 International Business Machines Corporation Consistent histogram maintenance using query feedback
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
WO2007138533A2 (en) * 2006-05-25 2007-12-06 Pace Plc Identifying and dynamically presenting regions of interest in a digital image
JP2010517427A (ja) 2007-01-23 2010-05-20 ユークリッド・ディスカバリーズ・エルエルシー 個人向けのビデオサービスを提供するシステムおよび方法
JP2010517426A (ja) 2007-01-23 2010-05-20 ユークリッド・ディスカバリーズ・エルエルシー オブジェクトアーカイブシステムおよび方法
US8228809B1 (en) 2007-12-21 2012-07-24 Adaptix, Inc. Intelligent mode switching in communication networks
US8131107B2 (en) * 2008-05-12 2012-03-06 General Electric Company Method and system for identifying defects in NDT image data
JP5567021B2 (ja) 2008-10-07 2014-08-06 ユークリッド・ディスカバリーズ・エルエルシー 特徴を基礎とするビデオ圧縮
US20100164986A1 (en) * 2008-12-29 2010-07-01 Microsoft Corporation Dynamic Collage for Visualizing Large Photograph Collections
JP5461845B2 (ja) * 2009-02-05 2014-04-02 株式会社東芝 超音波診断装置及び超音波診断装置の制御プログラム
JP2010205067A (ja) * 2009-03-04 2010-09-16 Fujifilm Corp 領域抽出装置、領域抽出方法及び領域抽出プログラム
FR2989198A1 (fr) * 2012-04-06 2013-10-11 St Microelectronics Grenoble 2 Procede et dispositif de detection d'un objet dans une image
US10097851B2 (en) 2014-03-10 2018-10-09 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
WO2015138008A1 (en) 2014-03-10 2015-09-17 Euclid Discoveries, Llc Continuous block tracking for temporal prediction in video encoding
US10091507B2 (en) 2014-03-10 2018-10-02 Euclid Discoveries, Llc Perceptual optimization for model-based video encoding
CN104360854B (zh) * 2014-11-03 2018-08-10 联想(北京)有限公司 一种信息处理方法及电子设备
CN104715251B (zh) * 2015-02-13 2017-12-19 河南科技大学 一种基于直方图线性拟合的显著目标检测方法
WO2017201494A1 (en) * 2016-05-19 2017-11-23 Avantis Medical Systems, Inc. Methods for polyp detection
US10552968B1 (en) * 2016-09-23 2020-02-04 Snap Inc. Dense feature scale detection for image matching
CN107239760B (zh) * 2017-06-05 2020-07-17 中国人民解放军军事医学科学院基础医学研究所 一种视频数据处理方法及系统
US11809789B2 (en) * 2019-11-06 2023-11-07 Rtx Corporation Parametric component design process
CN112016661B (zh) * 2020-08-20 2022-05-06 浙江大学 一种基于擦除显著性区域的行人重识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4922915A (en) * 1987-11-27 1990-05-08 Ben A. Arnold Automated image detail localization method
US5588071A (en) * 1994-10-26 1996-12-24 Minnesota Mining And Manufacturing Company Identifying an area of interest using histogram data arranged in predetermined sequence
US5799100A (en) * 1996-06-03 1998-08-25 University Of South Florida Computer-assisted method and apparatus for analysis of x-ray images using wavelet transforms
KR100189922B1 (ko) * 1996-06-20 1999-06-01 윤종용 히스토그램 등화를 이용한 동영상의 콘트라스트개선회로 및 그 방법
US6735330B1 (en) * 2000-10-17 2004-05-11 Eastman Kodak Company Automatic digital radiographic bright light
US6895103B2 (en) * 2001-06-19 2005-05-17 Eastman Kodak Company Method for automatically locating eyes in an image

Also Published As

Publication number Publication date
GB2367966A8 (en) 2002-04-17
EA200300451A1 (ru) 2003-10-30
EA004910B1 (ru) 2004-08-26
US7162081B2 (en) 2007-01-09
EP1374168B1 (en) 2005-10-26
EP1374168A2 (en) 2004-01-02
WO2002031766A3 (en) 2003-09-12
WO2002031766A2 (en) 2002-04-18
GB0024669D0 (en) 2000-11-22
AU2002214009A1 (en) 2002-04-22
GB2367966A (en) 2002-04-17
JP3964327B2 (ja) 2007-08-22
KR20040010540A (ko) 2004-01-31
DE60114469D1 (de) 2005-12-01
ATE308085T1 (de) 2005-11-15
US20040042656A1 (en) 2004-03-04
GB2367966B (en) 2003-01-15
DE60114469T2 (de) 2006-07-20
JP2004519759A (ja) 2004-07-02

Similar Documents

Publication Publication Date Title
ES2252309T3 (es) Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes.
US20200242424A1 (en) Target detection method and apparatus
JP4712487B2 (ja) 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体
CN112446327A (zh) 一种基于无锚框的遥感图像目标检测方法
Aytekın et al. Unsupervised building detection in complex urban environments from multispectral satellite imagery
Yang et al. Traffic sign recognition in disturbing environments
KR101650994B1 (ko) 객체 인식에서 피처 생성을 개선시키기 위한 시스템들 및 방법들
JPWO2019193702A1 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US9785850B2 (en) Real time object measurement
WO2018059365A1 (zh) 图形码处理方法及装置、存储介质
Yang et al. Classified road detection from satellite images based on perceptual organization
CN110019912A (zh) 基于形状的图形搜索
US20150220804A1 (en) Image processor with edge selection functionality
Lee et al. Edge detection analysis
US8687854B2 (en) Information processing apparatus, control method for the same, and computer-readable storage medium
Yan et al. Salient object detection in hyperspectral imagery using spectral gradient contrast
US6041138A (en) Method and device for extracting features from gray-scale image and generating boundaries of document elements
Kusetogullari et al. Unsupervised change detection in landsat images with atmospheric artifacts: a fuzzy multiobjective approach
Castelló et al. Reducing complexity in polygonal meshes with view-based saliency
Hall et al. Nonparametric estimation of a point-spread function in multivariate problems
Sung et al. Feature based ghost removal in high dynamic range imaging
Krishnan et al. Shadow removal from single image using color invariant method
CN104615988A (zh) 一种图像识别方法
Gui et al. Application of variogram function in image analysis
Moreno et al. Graph-based perceptual segmentation of stereo vision 3D images at multiple abstraction levels