ES2252309T3 - Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes. - Google Patents
Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes.Info
- Publication number
- ES2252309T3 ES2252309T3 ES01982419T ES01982419T ES2252309T3 ES 2252309 T3 ES2252309 T3 ES 2252309T3 ES 01982419 T ES01982419 T ES 01982419T ES 01982419 T ES01982419 T ES 01982419T ES 2252309 T3 ES2252309 T3 ES 2252309T3
- Authority
- ES
- Spain
- Prior art keywords
- regions
- value
- maximum entropy
- entropy
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
Método para clasificar píxeles en una imagen por grados de prominencia que incluye las etapas de: a) definir (200, 210) una pluralidad de regiones para cada uno de una pluralidad de píxeles en una imagen, en la que cada una de dichas regiones, para uno cualquiera de los píxeles en coordenadas (x, y), tiene una escala s diferente; b) calcular (230) un valor de entropía para cada una de dichas regiones; c) identificar (260) cualquier región de entropía máxima, siendo las regiones de entropía máxima regiones que incluyen un valor de entropía máximo; d) ponderar (270) dicho valor de entropía máximo de cada una de dichas regiones de entropía máxima por un valor de ponderación correspondiente a una estimación de la anchura del pico de dicho valor de entropía máximo; y e) clasificar (290) dichas regiones mediante dichos valores de entropía máximos ponderados, clasificándose así dichos píxeles.
Description
Método y aparato para determinar regiones de
interés en imágenes y para una transmisión de imágenes.
La presente invención se refiere en general al
campo del procesamiento de imágenes. Más particular, aunque no
exclusivamente, la invención trata de métodos y un aparato para
determinar regiones de interés en imágenes para una transmisión.
Existe una brecha creciente entre la demanda de
datos transmitidos a través de redes de ordenadores y el ancho de
banda disponible. Similarmente, hay una gran demanda de la
transmisión de datos por enlaces de radio digital, por ejemplo,
desde y a radios móviles y teléfonos móviles. Esto ha avivado la
búsqueda de métodos mejorados de compresión de datos y de
tecnologías de transmisión más eficientes.
Las tecnologías de transmisión de la técnica
anterior que son particularmente aptas para las aplicaciones de
vídeo se centran en interpretar datos de imagen en la fuente de
transmisión, transmitir los datos de interpretación en vez de la
propia imagen y usar los datos de interpretación en el destino. Los
datos de interpretación pueden o no transmitirse en forma
comprimida.
Dos enfoques alternativos a la interpretación de
imágenes son el enfoque "basado en imágenes", o de abajo
arriba, y el enfoque "basado en modelos", o de arriba
abajo.
El enfoque basado en imágenes se basa en que
características en la imagen, tales como bordes o ángulos, se
propaguen "naturalmente" y formen descripciones o modelos con
sentido del contenido de imagen. Un ejemplo típico es la
segmentación de imágenes fundada en figuras, en la que la tarea es
separar el objeto de interés en primer plano del fondo.
En el enfoque basado en modelos se utiliza
información con respecto a una expectativa del contenido para
extraer un significado de unas imágenes. Un ejemplo típico es el
reconocimiento de objetos, en el que un modelo de diseño asistido
por ordenador (CAD) se compara con bordes encontrados en la imagen -
un enfoque comúnmente empleado en la fabricación de aplicaciones de
inspección de líneas.
La diferencia esencial entre los enfoques basados
en imágenes y los basados en modelos reside en la etapa de
agrupación de rasgos. En el enfoque basado en imágenes, los puntos
de referencia para la agrupación de rasgos proceden de la imagen,
mientras que en el enfoque basado en modelos los puntos de
referencia proceden de los modelos de comparación.
En una variación de un enfoque basado en
imágenes, se identifica un número de pequeñas zonas prominentes, o
"iconos", dentro de una imagen. Estos iconos representan
descripciones de áreas de interés. En este enfoque, la prominencia
se define en términos de la complejidad o impredicibilidad locales
de la señal o, más específicamente, de la entropía de los atributos
locales. Los iconos con una gran complejidad de la señal tienen una
distribución de la intensidad más plana y por tanto una mayor
entropía. En términos más generales, es la gran complejidad de
cualquier descriptor adecuado la que puede usarse como medida de la
prominencia local.
Las técnicas conocidas de selección de iconos
prominentes miden la prominencia de iconos a la misma escala a
través de toda la imagen. La escala a usar para la selección a
través de toda la imagen puede elegirse de varias maneras.
Normalmente se escoge la escala más pequeña a la que se produce un
máximo en la entropía global media. Sin embargo, el tamaño de las
características de imagen varía. Por tanto, una escala de análisis
que es óptima para una característica dada de un cierto tamaño
puede no ser óptima para una característica de un tamaño
diferen-
te.
te.
El documento "Saliency maps and attention
selection in scale and spatial coordinates: an information theoretic
approach", por M. Jagersand, en Proceedings of the Fifth
International Conference on Computer Vision 1995, págs.
195-202, da a conocer un método para determinar
regiones de interés mediante una evaluación de las distancias
Kullback-Leibler de las distribuciones locales en
escala de grises de escalas adyacentes.
J. Sporring y J. Weickert resumen en "On
generalized entropies and scale-space",
Proceedings of the First International Conference on
Scale-Space Theory in Computer Vision 1997, págs.
53-64, varias medidas de la información empleadas
para describir el contenido de información de imágenes representadas
en espacio escala e ilustran su uso para describir la prominencia de
regiones de imagen en escalas diferentes.
La presente invención da a conocer métodos y un
aparato para determinar regiones de interés en imágenes. La presente
invención proporciona maneras de ampliar a escala la medida de la
prominencia y así encontrar características que existen en una gama
muy limitada de escalas. Esto da lugar a iconos prominentes que
tienen un nivel óptimo de entropía.
Según una realización preferida de la presente
invención, un método para clasificar píxeles en una imagen por
grados de prominencia incluye las etapas de: definir una pluralidad
de regiones para cada uno de una pluralidad de píxeles en una
imagen, donde cada una de las regiones para uno cualquiera de los
píxeles en coordenadas (x,y) tiene una escala s diferente; calcular
un valor de entropía para cada una de las regiones; identificar a
cualquiera de las regiones como teniendo un valor de entropía
máximo; ponderar el valor de entropía máximo de cada una de las
regiones de entropía máxima por un valor de ponderación
correspondiente a una estimación de la anchura del pico del valor de
entropía máximo; clasificar las regiones de los valores de entropía
máximos ponderados, clasificándose así los píxeles.
Además, según una realización preferida de la
presente invención, la etapa de cálculo puede incluir calcular una
estimación de una función de densidad de probabilidad (FDP) para los
píxeles en cada una de las regiones. La etapa de cálculo puede
incluir calcular utilizando un estimador FDP de ventanas de
Parzen.
Adicionalmente, la etapa de cálculo puede incluir
calcular utilizando una división en barras (binning) de histograma.
El método puede incluir además la etapa de aplicar un promediado de
3 tomas a la estimación de la anchura del pico antes de realizarse
la etapa de ponderación.
Además, según una realización preferida de la
presente invención, la etapa de ponderación puede incluir ponderar
según un valor W(x,y,s) según la fórmula:
S(x,y,s)
= H(x,y,s) \cdot
W(x,y,s)
donde
W(x,y,s)=\sum\limits_{i}
|p_{i}(s)-p_{i}(s+1)|\cdot
s
y H(x,y,s) es la entropía de
una región (x,y,s), y p_{i} son probabilidades
discretas.
Según una realización preferida de la presente
invención, también se proporciona un método para determinar regiones
de prominencia en una imagen, incluyendo el método las etapas de a)
definir una pluralidad de regiones para cada uno de una pluralidad
de píxeles en una imagen, donde cada una de las regiones para cada
uno de los píxeles en coordenadas (x,y) tiene una escala s
diferente, b) calcular un valor de entropía para cada una de las
regiones, c) identificar a cualquiera de las regiones como teniendo
un valor de entropía máximo, d) ponderar el valor de entropía máximo
de cada una de las regiones de entropía máxima por un valor de
ponderación correspondiente a una estimación de la anchura del pico
del valor de entropía máximo y e) para cada una seleccionada de las
regiones de entropía máxima f) seleccionar al menos una región
vecina de entropía máxima, g) determinar la media y la varianza de
cada una de x, y y s para la región de entropía máxima seleccionada
y la al menos una región vecina, y cuando la mayor de las varianzas
no sobrepasa un umbral predeterminado, h) eliminar de las regiones
de entropía máxima cualquier región a una distancia predeterminada
del punto (x,y,s) medio e i) almacenar los valores medios,
designándose así una región de interés.
Además, según una realización preferida de la
presente invención, el método incluye además realizar la etapa e) en
el orden de los valores de entropía máximos ponderados.
La invención comprende además un método de
transmisión de imágenes según la reivindicación 11 adjunta y
dispositivos según las reivindicaciones 12 y 13 adjuntas.
La presente invención se comprenderá y apreciará
en mayor profundidad a partir de la siguiente descripción detallada
tomada en conjunción con los dibujos adjuntos, en los que:
La figura 1A es una ilustración simplificada de
un icono 10 ejemplar, útil para comprender la presente
invención;
la figura 1B es una ilustración gráfica
simplificada de un análisis de entropía para unos puntos P_{1} y
P_{2} de la figura 1A, útil para comprender la presente
invención;
la figura 2 es un diagrama de flujo simplificado
de un método para determinar la prominencia de iconos, operativo
según una realización preferida de la presente invención;
la figura 3 es un diagrama de flujo simplificado
de un método para seleccionar regiones prominentes, operativo según
una realización preferida de la presente invención; y
\newpage
la figura 4 es un ilustración pictórica que
muestra los resultados de una implementación del método de las
figuras 2 y 3.
La figura 5 ilustra un dispositivo para
clasificar píxeles en una imagen por grados de prominencia, según
una realización de la invención.
Las figuras 6 y 7 ilustran aplicaciones de la
invención al reconocimiento de características y escalas prominentes
en imágenes de huellas dactilares.
La presente invención amplía las medidas de la
prominencia de la técnica anterior para ser capaz de comparar la
prominencia tanto de puntos como de escalas espaciales diferentes.
La invención permite la selección de ciertas escalas prominentes y
ubicaciones espaciales prominentes simultáneamente. Inherente a esta
idea es que una característica puede tener un valor de prominencia
diferente a escalas diferentes. La invención permite una
comparación directa de estos.
La mayoría de los enfoques multiescala al
procesamiento de señales caen en dos categorías principales. Los
esquemas en la primera categoría intentan captar la naturaleza
multiescala de señales procesando una representación multiescala
completa de la señal. Los esquemas en la segunda categoría intentan
encontrar una mejor escala o conjunto de escalas para representar
la señal, a menudo analizando sintácticamente una representación
multiescala completa a fin de escoger la(s) escala(s)
particular(es) de interés. La invención supone un desarrollo
en el área general del segundo de estos enfoques.
El método de la invención se explica de la mejor
manera considerando en comportamiento de la métrica de escalas de
entropía con parámetros de escala variables.
El problema de la selección de escala puede verse
con referencia a la figura 1A y la figura 1B. La figura 1A es una
ilustración simplificada de un icono 10 ejemplar. La figura 1B es
una ilustración gráfica simplificada de un análisis de entropía para
unos puntos P_{1} y P_{2}.
En la figura 1A, el icono 10 es ilustrativo de
una característica dentro de una imagen. A efectos ilustrativos, la
característica se muestra como un círculo. En una imagen real, las
características pueden ser evidentemente radicalmente diferentes en
forma de este caso idealizado.
Considerando la figura 1A, el icono 10 se muestra
comprendiendo un círculo 12 en el que, en el borde y el centro del
círculo 12, respectivamente, se muestran dos puntos P_{1} y
P_{2}. La totalidad del círculo 12, incluyendo los puntos P_{1}
y P_{2}, ha de entenderse como siendo un icono/característica
completamente negro de la imagen. Sin embargo, la figura 1A muestra
el área dentro del círculo 12 como una región sombreada a fin de que
en la figura puedan reconocerse las ubicaciones de los puntos
P_{1} y P_{2}.
Un cuadrado 14 alrededor del círculo 12
representa el cuadrado limitativo para la escala a la que se produce
el máximo en entropía para el icono 10 cuando se toma en torno al
punto P_{2}. Este máximo de entropía se ilustra en la figura 1B
como el pico en la gráfica de entropía marcado como P2.
En la figura 1B existe claramente un pico en
ambas gráficas P1 y P2 para los puntos P_{1} y P_{2},
respectivamente. Basándose únicamente en la entropía máxima, no
estaría claro cuál de P_{1} y P_{2} sería el más prominente, ya
que tanto P_{1} como P_{2} tienen valores de entropía máximos,
aunque a escalas diferentes. Por tanto, ambas gráficas parecerían
ser igualmente útiles para determinar la escala apropiada.
Sin embargo, en la figura 1B también puede
observarse que las dos gráficas de entropía frente a la escala
tienen distintas anchuras del pico. En la figura 1B, la gráfica para
P_{1} es aproximadamente el doble de ancha que la gráfica para
P_{2}. Por lo general, se supone que una característica que está
presente a través de un gran número de escalas es particularmente
prominente. Sin embargo, tal como se ha descrito anteriormente, la
prominencia se basa en la complejidad, definida en términos de
impredicibilidad. En las imágenes de la vida real, esta existe en
un pequeño número de escalas y ubicaciones espaciales, y por tanto
se considera relativamente rara. Si una imagen era compleja e
impredecible en todas las ubicaciones espaciales y a todas las
escalas, sería entonces o bien una imagen aleatoria o bien fractal.
Por tanto, en la figura 1B, el pico de P_{2} es en realidad más
prominentes que el de P_{1}. Debería notarse que un cierto punto
puede tener varios máximos de entropía, cada uno a una escala
diferente.
Este análisis de la figura 1B indica que la
anchura de la gráfica de entropía, tomada en torno a distintos
puntos en una imagen, puede servir como indicador útil. En
particular, una estimación de la prominencia basada únicamente en la
altura del pico no permite hacer una distinción entre las dos
gráficas de la diferencia 1B.
Ahora se hace referencia a la figura 2, que es
una ilustración simplificada de un diagrama de flujo de un método
para determinar la prominencia de iconos, operativo según una
realización preferida de la presente invención.
En el método de la figura 2, se define una región
circular de un radio s, normalmente inicializado en un valor s_{1}
de escala mínimo (etapa 200), alrededor de un píxel en coordenadas
(x, y) en una imagen (etapa 210). A continuación, se estima la
función de densidad de probabilidad (FDP) de los valores de los
píxeles en la región (etapa 220). Los valores pueden ser valores de
intensidad de nivel gris, niveles de color o cualquier otra
característica empleada para definir el tipo de interés deseado para
las características de imagen. Preferiblemente se emplea un
estimador FDP de ventanas de Parzen, en el que un núcleo (kernel)
predefinido se coloca en los puntos de datos del conjunto de
muestras. La estimación FDP es entonces la suma de todos los núcleos
a través del eje de datos. Para su maleabilidad matemática y la
resultante estimación FDP suave, se emplea preferiblemente un
núcleo gaussiano, donde la sigma controla el grado de suavización
aplicado a la estimación FDP. Puesto que no hay división en barras
arbitraria, el valor de entropía es estable ante cambios de
intensidad lineal.
Como alternativa al algoritmo de estimación FDP
de ventanas de Parzen puede utilizarse un método básico de división
en barras de histograma. En este método, en vez de colocarse un
núcleo (por ejemplo, un núcleo gaussiano) en cada punto de datos y
luego sumarse todos los núcleos para calcular la estimación FDP,
simplemente se divide el eje datos en un número de barras, por
ejemplo, 16 o 32 barras, teniendo con cada barra unos valores de
datos superior e inferior. Se lleva una cuenta para cada barra y se
incrementa para cada píxel dentro de la ventana local que está entre
los valores de datos superior e inferior para esa barra.
Una vez que se calcula la FDP, entonces la
entropía H de la región (x,y,s) se calcula (etapa 230) usando la
fórmula:
H(x,y,s)=-\sum\limits_{i}p_{i}(log(p_{i}))
donde p_{i} son las
probabilidades discretas y 0 < p_{i} <=
1.
A continuación, el radio s se incrementa en el
siguiente incremento de escala (etapa 240), y las etapas anteriores
se repiten para todas las escalas de s entre s_{1} y un valor
s_{2} de escala máxima (etapa 250). Una vez que la entropía se ha
calculado para todas las regiones entre s_{1} y s_{2} para un
píxel (x,y), se determinan aquellas regiones que tienen una entropía
máxima en relación con la entropía de las regiones inmediatamente
precedentes y subsiguientes (etapa 260).
La entropía H para cada región de pico se pondera
entonces según un valor W(x,y,s) que es proporcional a su
estimación de la anchura del pico (etapa 270) a fin de proporcionar
una medida de la prominencia S empleando la fórmula:
S(x,y,s)
= H(x,y,s) \cdot
W(x,y,s)
donde
W(x,y,s)=\sum\limits_{i}
|p_{i}(s)-p_{i}(s+1)|\cdot
s
Las etapas 200 a 270 se repiten preferiblemente
para todos los píxeles en la imagen (etapa 280). Una vez que se han
ponderado los valores de entropía de las regiones de entropía
máxima, se clasifican preferiblemente por valor de entropía máximo
ponderado, resultando así en una clasificación de los píxeles por
prominencia del pico (etapa
290).
290).
El método de la invención es novedoso debido al
uso de la anchura del pico como factor de ponderación en el cálculo
de la prominencia. Sin embargo, la técnica propiamente dicha
seleccionada para la estimación de la anchura del pico representa
una mejora adicional de la idea general de usar la anchura del
pico.
Los inventores han escogido una técnica para la
estimación de la anchura del pico que implica calcular la suma de
gradientes absolutos del histograma medidos en el pico. El
histograma al que se hace referencia aquí es una aproximación de la
función de densidad de probabilidad (PDF) continua de las
distribuciones de intensidad en torno a los puntos tales como
P_{1} y P_{2} en la figura 1A. Si la suma es grande, esto indica
que el pico en la distribución de intensidades, véase la figura 1B,
es bastante puntiagudo. Un valor pequeño de la suma indica que es
probable que el pico sea bastante ancho. La ventaja de este cálculo
de la suma de diferencias absolutas es que evita casos particulares
con los que hay que tratar por separado para una simple medición de
la anchura del pico. Estos casos particulares frenarían el cálculo
si los inventores hubiesen elegido realizar una simple medición de
la anchura del pico. El cálculo de la suma de diferencias absolutas
es, por tanto, robusto y no sufre retardos significativos en el
cálculo.
El cálculo de la suma de diferencias absolutas es
el cálculo al que se ha hecho referencia anteriormente con la
fórmula:
W(x,y,s)=\sum\limits_{i}
|p_{i}(s)-p_{i}(s+1)|\cdot
s
W es por tanto la suma de diferencias absolutas,
ponderada por la escala s.
A fin de incrementar la robustez frente al ruido,
puede aplicarse un sencillo promediado de 3 tomas a la estimación
de la anchura del pico antes de ponderar el valor de entropía. Una
vez que se ha calculado el valor de ponderación, el valor
W(x,y,s) proporcional a la estimación de la anchura del pico
a cada escala s se sustituye por el promedio de los valores a
s-1. s y s+1. Ese promedio es:
(W(x,y,s-1)
+ W(x,y,s)
+W(x,y,s+1))/3
Esta operación normalmente no se realizaría a las
escalas mínima y máxima.
Resulta ventajoso escoger robustamente puntos
individuales de máximos de entropía. Esto se basa en la persistencia
de estos puntos en varias condiciones de formación de imágenes,
tales como el ruido o pequeñas cantidades de movimiento. Es sabido
que la presencia de ruido en una imagen actúa como un aleatorizador
y generalmente aumenta el valor de entropía, afectando más a
valores de entropía bajos que a valores de entropía altos. Sin
embargo, el efecto del ruido también depende sobremanera de la forma
de la superficie de entropía local en torno al máximo. Puesto que
el punto máximo de un pico estrecho se ve menos afectado por el
ruido que el de un pico ancho, la robustez de escoger puntos
individuales de máximos de entropía se basa entonces en lo
puntiagudo del pico.
La forma de la superficie de entropía depende de
tres factores principales: la superficie de intensidad de la imagen
original, la forma de la ventana de muestreo o región de interés
(ROI - Region of Interest) y el tamaño de la ROI (escala). La forma
de la ROI es circular, ya que esto permite que el valor de entropía
sea rotacionalmente invariable. La dependencia de la superficie de
la imagen es un resultado de un desajuste entre el tamaño y/o la
forma de la ROI de muestreo y la característica de interés de la
imagen. Suponiendo que la escala está correctamente ajustada y que
la forma de la ROI es fija, se deduce que esta dependencia no es
controlable y que escoger puntos individuales en el espacio de
entropías no es un método robusto.
Un método más robusto sería escoger regiones en
vez de puntos en el espacio de entropías. Aunque los píxeles
individuales en una región prominente puedan verse afectados por el
ruido en cualquier instante dado, no es probable que afecte a todos
ellos de manera que la región en conjunto se vuelva no
prominente.
Ahora se hace referencia a la figura 3. La figura
3 es una ilustración simplificada de un diagrama de flujo de un
método para seleccionar regiones prominentes, operativo según una
realización preferida de la presente invención.
En el método de la figura 3 sólo se procesan las
regiones de entropía máxima, tal como se determinaron en la figura
2. El procesamiento de estas regiones es el siguiente.
Se selecciona (etapa 300) la región (x,y,s) de
pico de mayor prominencia, tal como determinó el método de la figura
2. El propio pico (x,y,s) está definido por el punto central de la
región.
A continuación se seleccionan las K regiones de
pico más próximas (etapa 310). En el espacio (x,y,s), la proximidad
puede definirse basándose en una suma de los cuadrados de la
distancia vectorial (x^{2} + y^{2} + s^{2}). El valor de K
determina la robustez frente al ruido de las características que
están detectándose. Un valor más alto de K tendrá como resultado
que se detecten regiones más grandes con propiedades bien
especificadas, por ejemplo, un automóvil en la imagen. Un valor más
pequeño de K permite detectar características de detalles más finos,
por ejemplo, una antena de coche en la imagen. Preferiblemente, K
está adaptado hasta que se sobrepase un umbral de varianza
predeterminado.
Una vez que se han determinado las K regiones de
pico para la región de pico seleccionada, se calculan la media y la
varianza de x, y y s para todas las regiones seleccionadas (etapa
320). A continuación, la más grande de las tres varianzas se compara
con un umbral. El valor del umbral puede fijarse según algoritmos de
agrupamiento conocidos, normalmente 0,7 (etapa 330). Una varianza
que es menor que el umbral indica normalmente que las regiones están
bien agrupadas, en cuyo caso se almacenan entonces los valores
medios de x, y y s (etapa 340).
Aquellas de las K regiones de pico que estén a
una distancia D multiplicada por la(s) media(s) del
punto (x,y,s) medio se eliminan entonces de la lista de regiones de
pico de prominencia creada por el método de la figura 2 (etapa 350).
Se puede fijar D para que sea cualquier valor o, preferiblemente, un
valor adaptativo relacionado con la varianza, tal como un valor
proporcional a 3 x la desviación estándar.
Una varianza (etapa 330) que es más grande que el
umbral indica normalmente que no se encuentra ningún agrupamiento,
en cuyo caso el punto puede almacenarse como un punto aislado, el
valor de K puede reducirse hasta que se consiga el agrupamiento,
posiblemente hasta un punto individual, o bien el punto puede
sencillamente permanecer en la lista de puntos prominentes para ver
si se agrupa con alguna otra cosa (etapa 370).
Las etapas 300-350 se realizan
entonces sobre la siguiente región restante más alta de entropía
máxima (etapa 360) hasta que se hayan procesado todas las regiones
de entropía máxima, preferiblemente, en orden de valor de entropía
máximo ponderado.
El presente método de agrupamiento tiene en
cuenta por tanto el impacto del ruido sobre el cálculo de la
prominencia de la figura 2 y da consideración a puntos de alta
entropía que están muy correlacionados en el espacio de
prominencia.
Si las regiones son regiones de puntos, entonces
la varianza puede ser cero. El cálculo de la varianza puede
descartarse cuando en el cálculo sólo se utilicen dos regiones.
La figura 4 muestra los resultados de una
implementación del método de las figuras 2 y 3. En la figura 4, se
han hecho corresponder iconos prominentes entre las dos imágenes 30
y 32 empleando el método de la invención. En la implementación, se
han seleccionado regiones y escalas prominentes en las dos imágenes
30 y 32. Los iconos se han correlacionado, en 34, para encontrar los
iconos que mejor corresponden entre las dos imágenes.
Antes de llevarse a cabo los métodos descritos en
la presente memoria, pueden usarse etapas de preprocesamiento para
reducir el ruido en la imagen original. Los métodos de difusión son
muy conocidos por sus propiedades de reducción del ruido y de
suavización y se citan mucho como útiles para generar
representaciones en espacio escala de la señal original. Los métodos
de espacio escala intentan representar la señal original a un número
de escalas mediante unas operaciones de suavización sucesivas.
Aunque se considera que la difusión lineal, que es equivalente a
suavizar con un filtro gaussiano, proporciona la suavización más
general, la experimentación ha mostrado que resultan preferibles la
difusión isotrópica no lineal y la difusión anisotrópica no lineal.
Los métodos de difusión isotrópica no lineal y de difusión
anisotrópica no lineal ajustan la suavización de manera que no se
suavicen unos bordes significativos predefinidos. En la difusión
isotrópica no lineal, la suavización se pondera mediante una función
de gradiente local. En la difusión anisotrópica no lineal, la
suavización también se dirige a la dirección de los bordes. La
difusión anisotrópica no lineal también elimina el ruido en los
bordes.
La presente invención comprende también un método
de transmisión de imágenes. Este método de transmisión de imágenes
comprende los métodos explicados anteriormente.
En particular, los métodos de clasificación de
píxeles y de determinación de la prominencia en una imagen
proporcionan una manera de identificar regiones importantes de una
imagen. Tal identificación puede emplearse para identificar partes
de una imagen que se transmiten entonces de manera preferente.
Por ejemplo, una imagen puede transmitirse por un
enlace de radio, a o desde una radio móvil (PMR - Private Mobile
Radio) o un teléfono móvil. El ancho de banda del enlace de radio
disponible puede restringir sustancialmente la cantidad de datos
que puede transmitirse de una imagen. Los píxeles clasificados en
los primeros puestos o las regiones más prominentes pueden
transmitirse más a menudo que otros datos. De hecho, estos pueden
ser las únicas partes de una imagen que se transmitan, por ejemplo,
durante periodos cuando una imagen cambia rápidamente con el
tiempo.
La invención se ha descrito anteriormente en
términos de un método. Sin embargo, la invención también comprende
dispositivos que funcionan según la invención.
Una realización de un dispositivo así se ilustra
en la figura 5 adjunta. El dispositivo (500) de la figura 5 sirve
para clasificar píxeles en una imagen por grados de prominencia. El
dispositivo comprende:
a) un medio (510) para definir una pluralidad de
regiones para cada uno de una pluralidad de píxeles en una imagen
(505), teniendo cada una de las regiones una escala s diferente para
cualquiera de dichos píxeles en coordenadas x, y;
b) un medio (530) para calcular un valor de
entropía para cada una de las regiones;
c) un medio (560) para identificar cualquier
región de entropía máxima, siendo las regiones de entropía máxima
regiones que incluyen un valor de entropía máximo;
d) un medio (570) para ponderar el valor de
entropía máximo de cada una de las regiones de entropía máxima por
un valor de ponderación correspondiente a una estimación de la
anchura del pico del valor de entropía máxi-
mo;
mo;
e) un medio (590) para clasificar las regiones
por los valores de entropía máximos ponderados, clasificándose así
los píxeles.
En la figura 5 también se muestra una unidad 508
de "adquisición y estructura de trama", que incluye una cámara
para barrer la imagen. El experto en la técnica conoce tal unidad y
por tanto no se describe con más detalle. El estimador 520 FDP
proporciona la función de densidad de probabilidad, tal como se ha
descrito anteriormente con referencia a los métodos de la
invención.
La invención también se extiende a un dispositivo
de transmisión de imágenes. El dispositivo de transmisión de
imágenes comprende un dispositivo, tal como el explicado
anteriormente y explicado generalmente en conexión con la figura 5.
El dispositivo de transmisión de imágenes puede seleccionar regiones
prominentes de una imagen para una transmisión preferente.
Particularmente, cuando la transmisión tiene lugar por un enlace de
radio a o desde una radio móvil o portátil (PMR) o un teléfono
móvil, la transmisión puede comprender únicamente las regiones
seleccionadas, o estas regiones pueden transmitirse con más
frecuencia que otras regiones.
El dispositivo de transmisión de imágenes puede
formar parte de una radio móvil o portátil (PMR) o de un teléfono
móvil.
En el método y el aparato básicos de la
invención, se ha empleado la distribución local de valores de
intensidad como el descriptor de la prominencia. Sin embargo, la
invención no está restringida a esto. Puede utilizarse cualquier
mapa de características adecuado para la tarea particular entre
manos.
Por ejemplo, al realizar un análisis de imágenes
de huellas dactilares, normalmente se considera que las
bifurcaciones y los puntos finales de las crestas son prominentes.
Para esta tarea se emplea un mapa de características de dirección de
cresta. Las partes no prominentes son aquellas que constan de líneas
a una sola escala y en una sola dirección predominante. Las
bifurcaciones y los puntos finales se componen de muchas direcciones
de borde y, posiblemente, escalas. En vez de usar la FDP de los
valores de intensidad, se utiliza la FDP de direcciones de borde y
de escalas. La figura 6 muestra las partes más prominentes, y sus
escalas respectivas, de una imagen de huella dactilar encontradas
empleando este método. Véase también la figura 7.
Por tanto, el método y el aparato de la invención
pueden usar cualquier mapa de características adecuado en la
determinación de la prominencia.
La correspondencia es una operación muy común
necesaria en muchas tareas de visión por ordenador. Por ejemplo, en
el reconocimiento de objetos debe encontrarse el modelo apropiado en
la base de datos de objetos. Esto se realiza normalmente intentando
probar exhaustivamente la correspondencia entre todos los modelos en
la base de datos y las características de imagen.
El método de prominencia de la presente invención
puede mejorar la realización de tales tareas al reducir la cantidad
de datos que es necesario almacenar para cada modelo. Por tanto,
esto reduce la complejidad de la búsqueda de modelo. Hace esto de
dos maneras principales:
(i) Reduce el número de descriptores que es
necesario almacenar. Sólo se describen las regiones prominentes.
(ii) Se almacenan las escalas respectivas para
cada región prominente. Por tanto, se reduce la dimensionalidad del
espacio de búsqueda. Esto es porque se conoce la escala de los bits
prominentes, por lo que no hay necesidad de probar muchas escalas
entre el modelo y la imagen.
El descriptor apropiado para la tarea debería
escogerse de manera que sea más potente (o descriptivo) que el
usado para el mapa de características de prominencia. En los
ejemplos de correspondencia mostrados en la figura 4, se ha
utilizado directamente el vector de valores de píxel. Este puede
considerarse como un descriptor muy potente.
En algunas aplicaciones, puede resultar más
apropiado usar descriptores menos discriminantes, tales como
invariantes estadísticas o geométricas de grandes dimensiones.
Estos pueden proporcionar beneficios tales como una invarianza
rotacional o fotométrica.
Una vez que se han seleccionado las regiones
prominentes, pueden usarse en una tarea de correspondencia.
Los métodos y el aparato descritos en la presente
memoria se han descrito de manera suficiente como para permitirles
a los expertos en la técnica adaptar fácilmente hardware y software
disponible comercialmente según sea necesario para reducir
cualquiera de las realizaciones de la presente invención a la
práctica sin demasiada experimentación y empleando técnicas
convencionales.
Aunque la presente invención se haya descrito con
referencia a unas pocas realizaciones específicas, se pretende que
la descripción sea ilustrativa como un todo y que no se interprete
como que limita la invención a las realizaciones mostradas. Se
aprecia que a los expertos en la técnica pueden ocurrírseles varias
modificaciones que, aunque no se muestren específicamente en la
presente memoria, están no obstante dentro del verdadero alcance de
la invención, tal como se define en las reivindicaciones
adjuntas.
Claims (13)
1. Método para clasificar píxeles en una imagen
por grados de prominencia que incluye las etapas de:
a) definir (200, 210) una pluralidad de regiones
para cada uno de una pluralidad de píxeles en una imagen, en la que
cada una de dichas regiones, para uno cualquiera de los píxeles en
coordenadas (x,y), tiene una escala s diferente;
b) calcular (230) un valor de entropía para cada
una de dichas regiones;
c) identificar (260) cualquier región de entropía
máxima, siendo las regiones de entropía máxima regiones que incluyen
un valor de entropía máximo;
d) ponderar (270) dicho valor de entropía máximo
de cada una de dichas regiones de entropía máxima por un valor de
ponderación correspondiente a una estimación de la anchura del pico
de dicho valor de entropía máximo; y
e) clasificar (290) dichas regiones mediante
dichos valores de entropía máximos ponderados, clasificándose así
dichos píxeles.
2. Método según la reivindicación 1, en el que
dicha etapa b) de cálculo comprende calcular (220) una estimación de
una función de densidad de probabilidad (FDP) para dichos píxeles en
cada una de dichas regiones.
3. Método según la reivindicación 2, en el que
dicha etapa b) de cálculo comprende calcular (220) utilizando un
estimador FDP de ventanas de Parzen.
4. Método según la reivindicación 2, en el que
dicha etapa b) de cálculo comprende calcular (200) utilizando una
división en barras de histograma.
5. Método según la reivindicación 1 y que
comprende además la etapa de aplicar un promediado de 3 tomas a
dicha estimación de la anchura del pico antes de realizarse dicha
etapa d) de ponderación.
6. Método según la reivindicación 1, en el que
dicha etapa d) de ponderación comprende ponderar según un valor
W(x,y,s) según la fórmula S(x,y,s) = H(x,y,s) ·
W(x,y,s), donde:
W(x,y,s)=\sum\limits_{i}
|p_{i}(s)-p_{i}(s+1)|\cdot
s
y H(x,y,s) es la entropía
local.
7. Método para determinar regiones de prominencia
en una imagen, incluyendo el método las etapas de:
a) definir (200, 210) una pluralidad de regiones
para cada uno de una pluralidad de píxeles en una imagen, en la que
cada una de dichas regiones para cada uno de dicha píxeles en
coordenadas (x,y) tiene una escala s diferente;
b) calcular (230) un valor de entropía para cada
una de dichas regiones;
c) identificar (260) a cualquiera de dichas
regiones como teniendo un valor de entropía máximo;
d) ponderar (270) dicho valor de entropía máximo
de cada una de dichas regiones de entropía máxima por un valor de
ponderación correspondiente a una estimación de la anchura del pico
de dicho valor de entropía máximo; y
e) para cada una seleccionada de dichas regiones
de entropía máxima (300):
- f)
- seleccionar (310) al menos una región vecina de entropía máxima;
- g)
- determinar (320) la media y la varianza de cada una de x, y y s para dicha región de entropía máxima seleccionada y dicha al menos una región vecina; y
- cuando la mayor de las varianzas no sobrepasa un umbral (330) predeterminado,
- h)
- eliminar (350) de dichas regiones de entropía máxima cualquier región a una distancia predeterminada de dicho punto (x,y,s) medio; e
- i)
- almacenar (340) dichos valores medios, designándose así una región de interés.
8. Método según la reivindicación 7 y que
comprende además realizar la etapa e) en el orden de dichos valores
de entropía máximos ponderados.
\newpage
9. Método según la reivindicación 7 o la
reivindicación 8, en el que las regiones son regiones de puntos y la
varianza es cero.
10. Método según cualquiera de las
reivindicaciones 7 a 9, en el que sólo hay dos regiones y el cálculo
de la varianza se descarta.
11. Método de transmisión de imágenes, que
comprende un método según cualquier reivindicación anterior.
12. Dispositivo (500) para clasificar píxeles en
una imagen por grados de prominencia, que comprende:
a) un medio (510) para definir una pluralidad de
regiones para cada uno de una pluralidad de píxeles en una imagen
(505), teniendo cada una de dichas regiones una escala s diferente
para cualquiera de dichos píxeles en coordenadas x, y;
b) un medio (530) para calcular un valor de
entropía para cada una de dichas regiones;
c) un medio (560) para identificar cualquier
región de entropía máxima, siendo las regiones de entropía máxima
regiones que incluyen un valor de entropía máximo;
d) un medio (570) para ponderar dicho valor de
entropía máximo de cada una de dichas regiones de entropía máxima
por un valor de ponderación correspondiente a una estimación de la
anchura del pico de dicho valor de entropía máximo;
e) un medio (590) para clasificar dichas regiones
por dichos valores de entropía máximos ponderados, clasificándose
así los píxeles.
13. Dispositivo de transmisión de imágenes, que
comprende un dispositivo según la reivindicación 12 para seleccionar
regiones prominentes de una imagen para una transmisión
preferente.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB0024669 | 2000-10-09 | ||
GB0024669A GB2367966B (en) | 2000-10-09 | 2000-10-09 | Method and apparatus for determining regions of interest in images and for image transmission |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2252309T3 true ES2252309T3 (es) | 2006-05-16 |
Family
ID=9900909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES01982419T Expired - Lifetime ES2252309T3 (es) | 2000-10-09 | 2001-10-09 | Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes. |
Country Status (11)
Country | Link |
---|---|
US (1) | US7162081B2 (es) |
EP (1) | EP1374168B1 (es) |
JP (1) | JP3964327B2 (es) |
KR (1) | KR20040010540A (es) |
AT (1) | ATE308085T1 (es) |
AU (1) | AU2002214009A1 (es) |
DE (1) | DE60114469T2 (es) |
EA (1) | EA004910B1 (es) |
ES (1) | ES2252309T3 (es) |
GB (1) | GB2367966B (es) |
WO (1) | WO2002031766A2 (es) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2375908B (en) * | 2001-05-23 | 2003-10-29 | Motorola Inc | Image transmission system image transmission unit and method for describing texture or a texture-like region |
GB2393062B (en) * | 2002-09-13 | 2005-01-05 | Motorola Inc | Image transmission system and method for determining regions of interest in an image transmission |
US7382897B2 (en) * | 2004-04-27 | 2008-06-03 | Microsoft Corporation | Multi-image feature matching using multi-scale oriented patches |
US7327865B2 (en) * | 2004-06-30 | 2008-02-05 | Accuray, Inc. | Fiducial-less tracking with non-rigid image registration |
US7522779B2 (en) * | 2004-06-30 | 2009-04-21 | Accuray, Inc. | Image enhancement method and system for fiducial-less tracking of treatment targets |
US7231076B2 (en) * | 2004-06-30 | 2007-06-12 | Accuray, Inc. | ROI selection in image registration |
US7366278B2 (en) * | 2004-06-30 | 2008-04-29 | Accuray, Inc. | DRR generation using a non-linear attenuation model |
US7426318B2 (en) * | 2004-06-30 | 2008-09-16 | Accuray, Inc. | Motion field generation for non-rigid image registration |
US8902971B2 (en) | 2004-07-30 | 2014-12-02 | Euclid Discoveries, Llc | Video compression repository and model reuse |
US9578345B2 (en) | 2005-03-31 | 2017-02-21 | Euclid Discoveries, Llc | Model-based video encoding and decoding |
US9532069B2 (en) | 2004-07-30 | 2016-12-27 | Euclid Discoveries, Llc | Video compression repository and model reuse |
US9743078B2 (en) | 2004-07-30 | 2017-08-22 | Euclid Discoveries, Llc | Standards-compliant model-based video encoding and decoding |
US20060117268A1 (en) * | 2004-11-30 | 2006-06-01 | Micheal Talley | System and method for graphical element selection for region of interest compression |
US8396153B1 (en) | 2004-12-07 | 2013-03-12 | Adaptix, Inc. | Cooperative MIMO in multicell wireless networks |
US8908766B2 (en) * | 2005-03-31 | 2014-12-09 | Euclid Discoveries, Llc | Computer method and apparatus for processing image data |
JP4427001B2 (ja) * | 2005-05-13 | 2010-03-03 | オリンパス株式会社 | 画像処理装置、画像処理プログラム |
US7330578B2 (en) * | 2005-06-23 | 2008-02-12 | Accuray Inc. | DRR generation and enhancement using a dedicated graphics device |
US7512574B2 (en) * | 2005-09-30 | 2009-03-31 | International Business Machines Corporation | Consistent histogram maintenance using query feedback |
US8176414B1 (en) * | 2005-09-30 | 2012-05-08 | Google Inc. | Document division method and system |
WO2007138533A2 (en) * | 2006-05-25 | 2007-12-06 | Pace Plc | Identifying and dynamically presenting regions of interest in a digital image |
JP2010517427A (ja) | 2007-01-23 | 2010-05-20 | ユークリッド・ディスカバリーズ・エルエルシー | 個人向けのビデオサービスを提供するシステムおよび方法 |
JP2010517426A (ja) | 2007-01-23 | 2010-05-20 | ユークリッド・ディスカバリーズ・エルエルシー | オブジェクトアーカイブシステムおよび方法 |
US8228809B1 (en) | 2007-12-21 | 2012-07-24 | Adaptix, Inc. | Intelligent mode switching in communication networks |
US8131107B2 (en) * | 2008-05-12 | 2012-03-06 | General Electric Company | Method and system for identifying defects in NDT image data |
JP5567021B2 (ja) | 2008-10-07 | 2014-08-06 | ユークリッド・ディスカバリーズ・エルエルシー | 特徴を基礎とするビデオ圧縮 |
US20100164986A1 (en) * | 2008-12-29 | 2010-07-01 | Microsoft Corporation | Dynamic Collage for Visualizing Large Photograph Collections |
JP5461845B2 (ja) * | 2009-02-05 | 2014-04-02 | 株式会社東芝 | 超音波診断装置及び超音波診断装置の制御プログラム |
JP2010205067A (ja) * | 2009-03-04 | 2010-09-16 | Fujifilm Corp | 領域抽出装置、領域抽出方法及び領域抽出プログラム |
FR2989198A1 (fr) * | 2012-04-06 | 2013-10-11 | St Microelectronics Grenoble 2 | Procede et dispositif de detection d'un objet dans une image |
US10097851B2 (en) | 2014-03-10 | 2018-10-09 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
WO2015138008A1 (en) | 2014-03-10 | 2015-09-17 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
US10091507B2 (en) | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
CN104360854B (zh) * | 2014-11-03 | 2018-08-10 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN104715251B (zh) * | 2015-02-13 | 2017-12-19 | 河南科技大学 | 一种基于直方图线性拟合的显著目标检测方法 |
WO2017201494A1 (en) * | 2016-05-19 | 2017-11-23 | Avantis Medical Systems, Inc. | Methods for polyp detection |
US10552968B1 (en) * | 2016-09-23 | 2020-02-04 | Snap Inc. | Dense feature scale detection for image matching |
CN107239760B (zh) * | 2017-06-05 | 2020-07-17 | 中国人民解放军军事医学科学院基础医学研究所 | 一种视频数据处理方法及系统 |
US11809789B2 (en) * | 2019-11-06 | 2023-11-07 | Rtx Corporation | Parametric component design process |
CN112016661B (zh) * | 2020-08-20 | 2022-05-06 | 浙江大学 | 一种基于擦除显著性区域的行人重识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4922915A (en) * | 1987-11-27 | 1990-05-08 | Ben A. Arnold | Automated image detail localization method |
US5588071A (en) * | 1994-10-26 | 1996-12-24 | Minnesota Mining And Manufacturing Company | Identifying an area of interest using histogram data arranged in predetermined sequence |
US5799100A (en) * | 1996-06-03 | 1998-08-25 | University Of South Florida | Computer-assisted method and apparatus for analysis of x-ray images using wavelet transforms |
KR100189922B1 (ko) * | 1996-06-20 | 1999-06-01 | 윤종용 | 히스토그램 등화를 이용한 동영상의 콘트라스트개선회로 및 그 방법 |
US6735330B1 (en) * | 2000-10-17 | 2004-05-11 | Eastman Kodak Company | Automatic digital radiographic bright light |
US6895103B2 (en) * | 2001-06-19 | 2005-05-17 | Eastman Kodak Company | Method for automatically locating eyes in an image |
-
2000
- 2000-10-09 GB GB0024669A patent/GB2367966B/en not_active Expired - Lifetime
-
2001
- 2001-10-09 WO PCT/EP2001/011715 patent/WO2002031766A2/en active IP Right Grant
- 2001-10-09 EP EP01982419A patent/EP1374168B1/en not_active Expired - Lifetime
- 2001-10-09 AU AU2002214009A patent/AU2002214009A1/en not_active Abandoned
- 2001-10-09 ES ES01982419T patent/ES2252309T3/es not_active Expired - Lifetime
- 2001-10-09 EA EA200300451A patent/EA004910B1/ru not_active IP Right Cessation
- 2001-10-09 US US10/398,528 patent/US7162081B2/en not_active Expired - Lifetime
- 2001-10-09 KR KR10-2003-7005016A patent/KR20040010540A/ko not_active Application Discontinuation
- 2001-10-09 AT AT01982419T patent/ATE308085T1/de not_active IP Right Cessation
- 2001-10-09 DE DE60114469T patent/DE60114469T2/de not_active Expired - Lifetime
- 2001-10-09 JP JP2002535076A patent/JP3964327B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
GB2367966A8 (en) | 2002-04-17 |
EA200300451A1 (ru) | 2003-10-30 |
EA004910B1 (ru) | 2004-08-26 |
US7162081B2 (en) | 2007-01-09 |
EP1374168B1 (en) | 2005-10-26 |
EP1374168A2 (en) | 2004-01-02 |
WO2002031766A3 (en) | 2003-09-12 |
WO2002031766A2 (en) | 2002-04-18 |
GB0024669D0 (en) | 2000-11-22 |
AU2002214009A1 (en) | 2002-04-22 |
GB2367966A (en) | 2002-04-17 |
JP3964327B2 (ja) | 2007-08-22 |
KR20040010540A (ko) | 2004-01-31 |
DE60114469D1 (de) | 2005-12-01 |
ATE308085T1 (de) | 2005-11-15 |
US20040042656A1 (en) | 2004-03-04 |
GB2367966B (en) | 2003-01-15 |
DE60114469T2 (de) | 2006-07-20 |
JP2004519759A (ja) | 2004-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2252309T3 (es) | Metodo y aparato para determinar regiones de interes en imagenes y para una transmision de imagenes. | |
US20200242424A1 (en) | Target detection method and apparatus | |
JP4712487B2 (ja) | 画像処理方法及び装置、デジタルカメラ装置、並びに画像処理プログラムを記録した記録媒体 | |
CN112446327A (zh) | 一种基于无锚框的遥感图像目标检测方法 | |
Aytekın et al. | Unsupervised building detection in complex urban environments from multispectral satellite imagery | |
Yang et al. | Traffic sign recognition in disturbing environments | |
KR101650994B1 (ko) | 객체 인식에서 피처 생성을 개선시키기 위한 시스템들 및 방법들 | |
JPWO2019193702A1 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
US9785850B2 (en) | Real time object measurement | |
WO2018059365A1 (zh) | 图形码处理方法及装置、存储介质 | |
Yang et al. | Classified road detection from satellite images based on perceptual organization | |
CN110019912A (zh) | 基于形状的图形搜索 | |
US20150220804A1 (en) | Image processor with edge selection functionality | |
Lee et al. | Edge detection analysis | |
US8687854B2 (en) | Information processing apparatus, control method for the same, and computer-readable storage medium | |
Yan et al. | Salient object detection in hyperspectral imagery using spectral gradient contrast | |
US6041138A (en) | Method and device for extracting features from gray-scale image and generating boundaries of document elements | |
Kusetogullari et al. | Unsupervised change detection in landsat images with atmospheric artifacts: a fuzzy multiobjective approach | |
Castelló et al. | Reducing complexity in polygonal meshes with view-based saliency | |
Hall et al. | Nonparametric estimation of a point-spread function in multivariate problems | |
Sung et al. | Feature based ghost removal in high dynamic range imaging | |
Krishnan et al. | Shadow removal from single image using color invariant method | |
CN104615988A (zh) | 一种图像识别方法 | |
Gui et al. | Application of variogram function in image analysis | |
Moreno et al. | Graph-based perceptual segmentation of stereo vision 3D images at multiple abstraction levels |