ES2301292B1

ES2301292B1 - Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico.

Info

Publication number: ES2301292B1
Application number: ES200502100A
Authority: ES
Inventors: Javier Portilla Muelas; Carlos Dorronsoro Diaz; Deitze Otaduy Del Paso
Original assignee: Universidad de Granada
Current assignee: Universidad de Granada
Priority date: 2005-08-19
Filing date: 2005-08-19
Publication date: 2009-04-01
Anticipated expiration: 2025-08-19
Also published as: ES2301292A1

Abstract

Método de predicción lineal óptima para la reconstrucción de la imagen en cámaras digitales con sensor de mosaico que permite obtener una imagen en color completa a partir de otra en mosaico procedente del sensor de una cámara digital con matriz de filtros de color. La invención interpola linealmente las muestras ausentes, minimizando el error cuadrático medio. En un proceso de entrenamiento previo, a partir de la estimación de la correlación espacial y cromática en imágenes naturales, se obtienen máscaras de interpolación de tamaño reducido para cada componente de color y tipo de vecindad. El método asegura un coste computacional reducido, que lo hace aplicable no sólo a soluciones software para revelado digital a posteriori, sino también a soluciones hardware en tiempo real, embebidas en las cámaras. Se presentan, además, soluciones alternativas basadas en el auto entrenamiento de la imagen, que proporcionan mejor calidad con mayor procesamiento, una generalización del método para el caso de que exista ruido y/o emborronamiento, así como métodos de ingeniería inversa. (Ver figura)

Description

Método de predicción lineal óptima para la reconstrucción de la imagen en cámaras digitales con sensor de mosaico.

Campo de la invención

La presente invención pertenece al campo de la captación digital de imágenes, concretamente a la adquisición de imágenes a color con sensores que utilizan mosaicos de filtro de color.

Estado de la técnica

Las cámaras digitales, tanto fotográficas como de vídeo, son cada vez más populares. La mayoría proporcionan imágenes en color a partir de un único sensor de estado sólido formado por una matriz de fotodetectores, donde cada detector corresponde a un pixel de la imagen. Sobre dicha matriz de fotodetectores se superpone una matriz de filtros de color (CFA en sus siglas inglesas) (por ejemplo, Bayer, U.S. Patent 3,971,065, 1976) que altera la composición espectral de la radiación incidente. De esta forma cada detector recibe información de una sola componente de color, siguiendo la matriz de filtros de color una estructura que se repite a lo largo de la imagen con una determinada periodicidad espacial. La solución más extendida es superponer a sensores con tecnología CCD una matriz con tres componentes de color: rojo, verde, azul -RGB en sus siglas inglesas- existiendo varias formas de crear la matriz CFA RGB, es decir, de distribuir espacialmente las distintas componentes de color. Lógicamente, esta solución es menos costosa que utilizar varios sensores completos (típicamente tres) cada uno con un único filtro de color para todos los fotodetectores. También se aplica esta técnica a sensores basados en otras tecnologías y además existen varias alternativas en cuanto al número y respuesta espectral de la matriz de filtros de color. El resultado en todos los casos es una única imagen en mosaico de color. Si se desdobla en sus canales de color, en cada canal aparecen huecos -vacíos de información- en los fotodetectores que están asociados a otros canales. Para obtener la imagen con contenido completo de color es necesario un proceso de interpolación para estimar las componentes de color no captadas por el sensor a partir de las componentes vecinas. Este proceso se denomina demosaico.

Las interpolaciones más sencillas, como la replicación de un vecino cercano o la interpolación bilineal producen artificios de falso color que deterioran de forma significativa la calidad de la imagen resultante. Se han publicado recientemente un gran número de métodos, de distintos grados de sofisticación, tanto en forma de artículos científicos (una revisión exhaustiva: B. K. Gunturk et al. "Demosaicking: Color filter array interpolation in single chip digital cameras", IEEE Signal Processing Magazine, September 2004) como de patentes (Hel-Or US2005031222 - 2005-02-10, Stavely And Whitman US2004240726 - 2004-12-02, Okutomi And Goto WO2004068862 - 2004-08-12, Zhang And Kakarala EP1416739 - 2004-05-06, Keshet and Maurer WO03079695 - 2003-09-25, Guenter US2004001641 -
2004-01-01, Baharav et al. EP1288855 - 2003-03-05, Tao WO0126359 - 2001-04-12, Taubman US2003197796 - 2003-10-23) para intentar mejorar la apariencia de las imágenes resultantes y su fidelidad respecto a la imagen original. Los resultados son muy variables. La experiencia en el uso y comparación entre cámaras demuestra que el algoritmo de demosaico tiene una gran importancia, no sólo en la calidad final de las imágenes (resolución, artificios de color, apariencia general) sino también en el tiempo de procesado de la imagen.

Es de destacar que muchos de los algoritmos propuestos son excesivamente costosos, desde un punto de vista computacional, para aplicaciones prácticas. Los métodos de demosaico han de ser implementados en algoritmos que funcionan en forma de software, o hardware en cámaras de distintas resoluciones: alta (fotografía), media (vídeo, televisión digital) o baja (cámaras de vigilancia, teléfonos móviles, webcams).

Aunque la capacidad de cálculo tanto de los ordenadores como de los sistemas de procesado integrados en las cámaras aumenta constantemente, también lo hace la cantidad de datos a procesar, por el aumento de la resolución espacial de las imágenes, la profundidad en bits de cada pixel o la tasa de adquisición de fotogramas por segundo. En otros casos -baja resolución- la capacidad de procesado está muy limitada por cuestiones de tamaño del dispositivo, consumo, o simplicidad, como en el caso de sensores con electrónica de procesado integrada en el propio chip (caso de tecnologías CMOS). Por tanto, para aplicaciones prácticas, se prefieren algoritmos de baja complejidad frente a algoritmos de gran sofisticación, más lentos en su ejecución (como los propuestos en: B. K. Gunturk and R M. Mersereau, "Color plane interpolation using alternating projections", IEEE Trans. on Image Proc., vol. 11, no. 9, pp. 997-1013, 2002., o en: W. Lu and Y. P. Tan, "Color filter array demosaicing: new method and performance measures", IEEE Trans. on Image Proc., vol. 12, no. 10, pp. 1194-1210, 2003.).

Por otro lado, los nuevos formatos de imagen y vídeo, y las actuales mejoras en las herramientas de visualización e impresión exigen métodos de demosaico que mantengan buenas prestaciones. Un caso significativo es la televisión digital, cuya alta definición hace apreciables defectos antes no percibidos, entre los que destacan los artificios de color de las imágenes provocados, en mayor o menor medida, por los algoritmos de demosaico.

Se han propuesto en la literatura científica algunos modelos lineales de formación de la imagen (D. H. Brainard, "Bayesian method for reconstructing color images from trichromatic samples", in Proc. IS&T 47th Annual Meeting, Rochester NY, 1994, pp. 375-380.; D. Taubman, "Generalized wiener recontruction of images from colour sensor data using a scale invariant prior", Proc. of Int. Conf. on Image Proc., vol. 3, pp. 801-804, 2000.; H. J. Trussel and Robert E. Hartwig, "Mathematics for demosaicking", IEEE Trans. on Image Proc., vol. 11, no. 4, pp. 485-492, 2002.). El demosaico se basa entonces en aplicar criterios de error cuadrático mínimo para estimar de forma lineal la imagen completa de color, típicamente en un marco bayesiano. Estos métodos tienen la posibilidad de incorporar en el modelo el efecto de emborronamiento debido, principalmente, a la óptica. Sin embargo, los métodos de este tipo propuestos hasta la actualidad no son adecuados para una implementación real. En el trabajo de Trussel y Hartwig mencionado, se limita drásticamente el potencial del método, ya que la resolución del planteamiento matemático se basa en aproximaciones poco realistas (asume separabilidad entre la correlación espacial y de color de las imágenes, algo que, como se verá en el ejemplo de realización de la invención, y en la figura 4, no es correcto). Los trabajos de Taubman y Trussel/Hartwig realizan los cálculos en el dominio de Fourier, algo mucho más costoso computacionalmente que realizarlos en el dominio espacial con máscaras de convolución pequeñas. El trabajo de Brainard no llega a un algoritmo práctico. El método propuesto por S. C. Pei and I. K. Tam, ("Effective color interpolation in CCD color filter arrays using signal correlation", IEEE Tran. on Cir. and Sys. for Video Technology, vol. 13, no. 6, pp. 503-513, 2003.) es eficiente y basado en correlación, pero no es óptimo desde el punto de vista lineal de mínimos cuadrados.

Objeto de la invención

La presente invención supone una mejora de la técnica de demosaico ya que representa una de las soluciones de coste computacional más reducido, a la vez que proporciona una fidelidad a la imagen original cercana a la que proporcionan los mejores algoritmos existentes, típicamente mucho más lentos que el propuesto. Además posibilita compensación de ruido y emborronamiento y recuperación del mosaico original en las imágenes demosaicadas.

Descripción general de la invención

La presente invención proporciona un método de demosaico basado en un modelo lineal de la imagen y la aplicación de criterios de error cuadrático mínimo, que combina bajo coste computacional y buena calidad gracias a las siguientes estrategias novedosas que permiten la resolución matemática del problema:

-: En lugar de representar cada componente del modelo de formación de imagen y tratar de resolver analíticamente las ecuaciones resultantes, el método se centra en que las muestras que faltan o que han sido degradadas pueden ser estimadas a través de combinaciones lineales de los datos proporcionados por el sensor (debido al uso de un modelo lineal y optimización de error cuadrático medio).

-: En lugar de usar un modelo a priori de la imagen (como en los trabajos de Brainard o Taubman, ya mencionados), el método se basa en el uso de la estadística de la correlación conjunta espacial cromática obtenida de un conjunto pequeño de imágenes típicas. Esto proporciona una buena calidad de interpolación, como se muestra en el ejemplo de realización de la invención.

-: En lugar de imponer restricciones a la estadística de las imágenes, en este método solo se imponen restricciones en el propio estimador lineal, para hacerlo adecuado para computación: un soporte espacial limitado N \times N de las máscaras de interpolación. Usando N \geq 9 podemos realizar los cálculos de forma eficiente en el dominio espacial, sin que se afecten significativamente las prestaciones finales.

-: El método descompone el problema de estimación en un conjunto de problemas de predicción independientes, que resultan de los diferentes mosaicos locales posibles al desplazar por el sensor la ventana de estimación.

Además la presente invención tiene en cuenta, en primer lugar, medidas de la estadística conjunta espacio-color realizadas por los autores en imágenes naturales consideradas representativa, y en segundo lugar, medidas de comparación, tanto en términos de fidelidad de imagen resultante como de tiempo de procesado, con los algoritmos más relevantes descritos en la literatura científica aplicados a imágenes conocidas y con mosaico simulado.

Descripción detallada de la invención

En la figura 1 se muestra un esquema simple que ilustra el funcionamiento de una cámara digital, que contiene un cuerpo de cámara (1) que soporta un sistema óptico (2) que forma una imagen sobre un sensor (3). El sensor está formado por una matriz de fotodetectores (4) sobre la que hay una matriz de filtros de color (CFA) (5), que filtra espectralmente la luz que le llega a cada detector individual. La matriz de filtros de color esta diseñada de manera que separa la imagen en componentes de color, de forma periódica, con un determinado patrón de mosaico. Es necesaria una electrónica de lectura y procesado de las señales eléctricas (6). Un conversor analógico-digital da lugar al fotograma digital, que en esta etapa es una única imagen en mosaico, que será almacenada en una memoria o dispositivo de registro (7). La formación de la imagen final (10) requiere el procesado (8) de esta imagen en mosaico que comprende, además del balance de blancos y otros tratamientos como compresión, la unidad de demosaico objeto de esta invención (9). La unidad de demosaico interpola la imagen original (en mosaico), en la cual en cada pixel solo hay información de una componente de color, para obtener en cada pixel contenido completo de color, y por lo tanto contenido completo espacial y de color en toda la imagen. Dicho de otro modo, y tal y como se muestra en la figura 2 (para una imagen con componentes RGB, a modo de ejemplo), si la imagen en mosaico (11) se desdobla en las capas correspondientes a las componentes de color existentes (R, G y B, en este caso), en cada capa (12, 13 y 14, respectivamente) aparecen huecos, y la unidad de demosaico (15) llena estos huecos por interpolación para dar lugar a una imagen en la que cada capa de color está completa (16, 17 y 18).

Proceso

El proceso para desarrollar la unidad de demosaico se ha dividido en tres fases. Las fases 1 y 2 son preparatorias y de obtención de datos estadísticos y solamente se realizan una vez. Pueden ser consideradas por tanto como etapas de diseño. La fase 3 describe el método de demosaico en sí, y cómo se ha de procesar cada una de las imágenes. Esta última fase está basada en los datos estadísticos obtenidos anteriormente. La figura 3 muestra un esquema general de todo el proceso. A continuación se describen detalladamente las fases mencionadas.

1. Cálculo de la estadística espacial-cromática de las imágenes

Se estudia la estadística conjunta espacial-cromática de imágenes en términos de correlación de la señal, entre las distintas componentes de color en posiciones espaciales vecinas:

C_{xx}(c_{1}, c_{2}, \Delta_{n}, \Delta_{m}) = E {x(c_{1}, n, m) x (c_{2}, n, + \Delta_{n}, m + \Delta_{m})} donde E representa la esperanza matemática, (n, m) son las coordenadas espaciales y (c_{1}, c_{2}) son un par de componentes de color. Esta esperanza matemática se estima en la práctica promediando sobre datos reales. La figura 4 muestra las curvas de correlación (19 a 24), normalizadas, para el caso típico de un sensor RGB y un conjunto variado de imágenes naturales.

2. Estimación basada en un modelo lineal y error cuadrático mínimo

Usamos el siguiente modelo de imagen para la imagen que captura una cámara con sensor de tipo CFA:

\vskip1.000000\baselineskip

1

\vskip1.000000\baselineskip

donde H representa la función respuesta al impulso (Point Spread Function, PSF) que describe el emborronamiento producido por la óptica, w_{0} es ruido blanco independiente de media cero, y S el muestreo de color llevado a cabo por el sensor CFA. Siendo P el número de píxeles de la imagen, x tiene 3P elementos e y solamente P elementos. Es más conveniente utilizar y = SHx + w, donde w = Sw_{0} sigue siendo ruido blanco. La solución de mínimo error cuadrático medio sin restricciones de este sistema lineal es:

\vskip1.000000\baselineskip

2

\vskip1.000000\baselineskip

que es una función lineal de y. Sin embargo, como las matrices y vectores involucrados tienen un gran tamaño, la solución directa de esta ecuación es computacionalmente costosa.

\vskip1.000000\baselineskip

2.1 Submosaicos locales

Algunos autores han impuesto restricciones a la estadística para resolver la fórmula 2 globalmente en el dominio de Fourier. En lugar de ese acercamiento, en esta invención se propone forzar los estimadores lineales a un soporte espacial limitado, considerando tan solo los vecinos alrededor de la muestra a predecir (ya sea porque falte o porque esté degradada). Esta ventana local permite una solución más simple y, consecuentemente, un tiempo computacional menor. A consecuencia de localizar la ventana de estimación aparecen diferentes posibilidades de estructura de mosaico local, para diferentes localizaciones en el sensor CFA. El mosaico está formado por la repetición de un patrón de mosaico básico formado por J elementos, de los N_{C} colores distintos del sensor (J > N_{C}. De acuerdo con esto, existen J posibilidades de mosaico local en forma de ventana cuadrada de tamaño impar alrededor de cada pixel. En la figura 5 se ilustra este hecho para el caso típico de un mosaico tipo Bayer en el cual N_{C} = 3 (3 colores: R, G y B) y J = 4 (el patrón de mosaico básico (25) tiene 4 elementos). Existen por tanto J = 4 posibilidades de mosaico local (26 a 29). Este método distingue entre esos J casos, obteniéndose estimadores diferentes para cada mosaico local. Nótese que al desacoplar el problema de esta forma la solución global sujeta a la limitación espacial sigue siendo óptima. Otros métodos también han usado interpoladores diferentes para diferentes localizaciones, pero ninguno de ellos deriva su estimación de la estadística de las imágenes.

\vskip1.000000\baselineskip

2.2 Predictor de Demosaico

Sea x_{i}^{j} el vector de las muestras desconocidas del pixel (i, j), donde j indica el tipo de mosaico del los J posibles, e i indica el número de pixel de los L_{j} posibles con ese mosaico j. Construimos las matrices X_{j} = (x_{1}^{j} ...x_{L_{j}}^{j}), j =1...J. Cada una de estas matrices tiene dimensión (N_{C} -1) \times L_{j}, donde N_{C} es el número de colores (por ejemplo N_{C} = 3 y J = 4
para una matriz CFA de Bayer). Sea \tilde{x}_{i}^{j} el vector que contiene todas las muestras de color observadas en la ventana
N \times N alrededor del pixel (i, j) (N^{2} elementos). Se construye una matriz con todos esos vecindarios, siguiendo el mismo orden que antes: \tilde{X}_{j} = (\tilde{x}_{1}^{j} ... \tilde{x}_{L_{j}}^{j}). Siguiendo el modelo de estimación lineal, toda muestra de color desconocida se puede predecir como una combinación lineal de sus vecinos observados:

3

y la optimización por estimación lineal de error cuadrático medio implica que:

4

Operando se obtiene:

5

Los elementos de las matrices del término de la derecha de la fórmula 5 son muestras de correlación espacial cromática. Las matrices C_{M}^{j} y C_{C}^{j} son los estimadores muestrales de la correlación espacial cromática (de los elementos del mosaico observados, y cruzada entre estos y los elementos que no aparecen en el mosaico, respectivamente). Los elementos de las matrices C_{M}^{j} y C_{C}^{j} están contenidos en C_{xx}, y, por tanto, dichas matrices se obtienen reordenando adecuadamente los términos (posiciones espaciales relativas y colores) de C_{xx}. La matriz D, que engloba las J matrices D_{j}, es el estimador lineal, o conjunto de filtros óptimos de predicción lineal para reconstruir la imagen.

2.3 Predictor de Demosaico con compensación de emborronamiento y ruido

La resolución del problema a partir de un modelo de imagen lineal permite de forma natural extender el método anterior al caso de imágenes deterioradas por emborronamiento (por ejemplo de la óptica de la cámara) y ruido (por ejemplo del sensor y del conversor analógico-digital), de forma que la compensación del ruido y emborronamiento se realice conjuntamente con el demosaico y sin carga computacional adicional. Esta técnica requiere un modelado previo de la degradación en la etapa de entrenamiento. Se simulan imágenes degradadas (convolucionándolas con la PSF -función respuesta al impulso de la cámara- y añadiendo el ruido con los estadísticos deseados) que nos servirán, junto con las originales de referencia (no degradadas) para obtener los filtros predictores óptimos. Para el entrenamiento, tras la degradación simulada (a través de un filtro de emborronamiento y la adición de ruido a las imágenes originales), se estima
la correlación cruzada original-degradada espacio-color C_{xy} y la correlación degradada-degradada espacio-color C_{yy}.

Matemáticamente, se opera de forma alternativa a la etapa 2.2, incluyendo en este caso todas las (N_{C}) muestras en X_{j}. Llamamos \tilde{Y}_{j} a cada una de las J matrices construidas con las vecindades de las muestras de color observadas, y obtenemos:

6

A partir de esta fórmula la estimación es entonces \hat{X}_{j} = D_{j}^{b} \tilde{Y}_{j}. C_{xy} y C_{yy} se obtienen reordenando términos, como antes, a partir de C_{xy} y C_{yy}. Nótese que cuando se pretende compensar el ruido o emborronamiento presente, típicamente se requiere un soporte espacial más grande que para el caso de interpolación pura. Es de destacar que esta solución de demosaico y compensación simultánea representa una mejora respecto a los procedimientos actuales. Normalmente la compensación de emborronamiento se aplica después de que la imagen haya sido interpolada a partir de su mosaico, lo que supone un procedimiento subóptimo, tanto en calidad como en coste computacional.

3. Interpolación

Una vez obtenido el estimador lineal D adaptado a las características de la imagen, se aplican a la imagen submuestreada en espacio y en componentes de color (lectura del sensor CFA) siguiendo la fórmula 3. Se obtiene entonces una imagen con contenido completo en espacio y en color. El balance de blancos de dicha imagen es el correspondiente a las imágenes que se han usado en el entrenamiento. Se pueden aplicar unos factores de corrección que den cuenta de las diferencias entre el sensor usado en el entrenamiento y el sensor CFA que captura la imagen (variaciones en la sensibilidad de los detectores, en la transmisión de los filtros de color, o en la electrónica de lectura), o simplemente que se adapten a las condiciones de la imagen, especialmente la iluminación.

Además, existe la posibilidad de usar un método de eliminación de artificios de color o aliasing, lo que se denominan métodos de postprocesado de demosaico, como por ejemplo los métodos propuestos en el trabajo, ya mencionado, de Gunturk.

Origen de los datos estadísticos - Imágenes de entrenamiento

Como se ha explicado, el cálculo del conjunto de filtros óptimos de predicción lineal (D) se basa en el estudio de la correlación espacial-cromática en imágenes en las cuales en cada uno de sus píxeles se han capturado, no deducido, todas las componentes de color: imágenes de entrenamiento. Hay varias formas de obtener este tipo de imágenes de entrenamiento.

Existen cámaras que incorporan un sensor por cada componente de color alineados por medio de prismas. Otra tecnología que puede ser usada como fuente de imágenes completas es la de sistemas formadores de imágenes a partir de sensores de múltiples pozos (Merrill, US Patent 5,965,875, 1999) que se basa en integrar en un único sensor distintas capas, cada una de ellas sensible a una banda espectral. Para el entrenamiento también es posible utilizar imágenes denominadas multi o hiperespectrales que recogen (por métodos variados) decenas o cientos de estrechas bandas espectrales en cada pixel. El uso de estas imágenes requiere el paso intermedio de agrupar bandas para dar lugar a canales de color con respuesta espectral similar a las componentes de color del sensor para el cual se desarrollan los filtros de predicción. También es posible utilizar imágenes fotográficas tradicionales (de emulsión) digitalizadas. Por último, se propone en esta invención el uso de imágenes procedentes de sensores CFA, reescaladas a un tamaño inferior de tal forma que en los nuevos pixeles se disponga de información fiable (promediada) de los tres canales de color.

En cuanto al contenido de las imágenes de entrenamiento, se debe tener en cuenta que los filtros predictores funcionarán tanto mejor cuanto más se parezca la estadística de la imagen en mosaico a procesar a la estadística utilizada en el entrenamiento.

Como solución más genérica se recomienda utilizar para el entrenamiento un conjunto variado de imágenes naturales. Los resultados, considerados de forma global sobre un conjunto variado de imágenes de prueba, no dependen significativamente de la selección del conjunto de imágenes de entrenamiento, siempre que este sea también suficientemente variado y amplio. Esto es algo que se ha comprobado en distintas pruebas realizadas durante el desarrollo de la presente invención.

Por otro lado, para cada imagen individual, si se realiza una selección de las imágenes de entrenamiento con una estadística espacial-cromática similar a la de la imagen en mosaico a procesar, se obtienen mejoras apreciables. En la práctica esto es especialmente útil en el caso de que se conozca a priori el tipo de imagen o la escena en la que se van a tomar las imágenes (entornos industriales, estudios, cámaras de propósitos específicos, fijas). En esas condiciones, es útil seleccionar imágenes de entrenamiento del mismo tipo que las imágenes tomadas por la cámara.

Usando la misma idea, en algunas ocasiones puede ser prioritaria la reconstrucción óptima de algunos objetos o escenas de especial interés. En ese caso conviene usar una estadística procedente del entrenamiento con ese tipo de objetos. La calidad en la reproducción de estos objetos aumentará, a costa de posibles pérdidas en la calidad general de la imagen.

Para estos demosaicos adaptados a la escena o aplicación, conviene disponer a priori de los filtros de predicción derivados de entrenamiento o modelos estadísticos de la situaciones posibles, de forma se pueda pasar de una a otra sin necesidad de realizar el entrenamiento cada vez.

Conviene recalcar que, en el caso de demosaico conjunto con restauración de imagen, el entrenamiento incluye la descripción del emborronamiento que se pretende corregir. Por tanto, si fuera necesario corregir distintas cantidades (o tipos) de emborronamiento, también sería necesario haber calculado a priori, para una determinada correlación espacial-cromática de las imágenes, los filtros lineales óptimos para cada nivel y/o tipo de emborronamiento. Este cálculo se puede realizar también de forma matemática, para una cantidad de emborronamiento arbitraria, si se tiene una expresión analítica tanto de la respuesta al impulso (PSF) como de la correlación espacial cromática.

El caso extremo de demosaico adaptado es el de utilizar la misma imagen en mosaico a procesar para realizar el entrenamiento, en un proceso denominado autoentrenamiento. Para obtener la imagen con contenido completo espacial y de color, necesaria para extraer la estadística de la imagen, sería necesaria una imagen paralela tomada con otro sensor sin mosaico. Como esto no tiene sentido en la práctica, existen varias aproximaciones: Se puede usar la misma imagen tras un demosaico genérico, o una versión reducida (escalada) de la misma imagen en la que no se realice interpolación sino promediado. En este último caso, para no tener que asumir invarianza a escala, se puede usar otra imagen del mismo motivo tomada con el mismo sensor desde más cerca de tal forma que tras el escalado la estadística sea similar a la de la imagen original.

Alternativas y mejoras

Un objetivo adicional de la presente invención es proporcionar un procedimiento para la obtención de forma directa de los filtros de predicción lineal. A partir de la fórmula 3 X_{j} \approx D_{j} \tilde{X}_{j}, se obtiene D_{j} = X_{j} (\tilde{X}_{j})^{#}, donde el operador # indica la pseudoinversa de la matriz. Este acercamiento sigue siendo lineal y mantiene el desdoblamiento en submosaicos locales, es conceptualmente sencillo y fácil de implementar. Sin embargo, es altamente ineficiente desde el punto de vista computacional.

La estimación lineal de error cuadrático medio puede ser realizada en otros espacios de color distintos del espacio en el cual se ha tomado o se va a mostrar la imagen final. Esto puede suponer mejoras en distintos aspectos de la imagen resultante. Esta transformación a nuevos espacios, dadas las características del problema, sólo tiene sentido si la transformación no es lineal. Típicamente (aunque no únicamente) se utilizarán espacios del tipo Luminancia - Crominancia como por ejemplo el Lab. En el nuevo espacio cada una de las muestras originales (con o sin información) pasa a tener varias componentes, cada una correspondiente a una de las nuevas componentes cromáticas. Entonces cada una de las nuevas componentes cromáticas puede estimarse bien como una combinación lineal de las componentes vecinas observadas del mismo tipo, o como una combinación genérica de todas las componentes vecinas. El coste computacional tanto del entrenamiento como del demosaico en sí, aumenta en esta variante, pero no se añade complejidad conceptual al método original.

Otra mejora al método propuesto consiste en la utilización durante el proceso de optimización de una métrica no lineal (por ejemplo S-CIELab \DeltaE_{ab}*) para ponderar de acuerdo a su impacto perceptual el peso de los errores de estimación, en sustitución de la métrica euclídea usada en la versión original.

Tanto en la literatura científica como en la literatura de patentes se describen multitud de métodos de postprocesado de imágenes en mosaico interpoladas. Estos pretenden corregir los errores residuales típicos que se producen en un proceso de interpolación como es el de demosaico: aliasing y artificios de color. El método objeto de esta invención puede ser combinado con estos métodos de procesado para mejorar los resultados. Es recomendable utilizar un postprocesado ligero desde el punto de vista computacional para no perder ventajas clave de esta invención, como la simplicidad y la rapidez.

Una mejora de la unidad de procesado descrita en la presente invención, orientada a disminuir aún más su complejidad y por tanto a reducir el tiempo de cálculo, es la descomposición de los filtros de predicción lineal obtenidos, en filtros separables (mediante la descomposición en valores singulares, SVD en sus siglas inglesas). Se trata de descomponer cada filtro bidimensional como suma de productos externos de filtros unidimensionales (filtros separables, que se aplican a las filas y columnas de la imagen) Tomando sólo las componentes más significativas de esta descomposición se obtiene una aproximación que sólo supone una pérdida marginal de calidad, mientras que se puede obtener una reducción adicional sustancial del coste computacional.

Ingeniería inversa

Como se ha indicado, la presente invención puede ser llevada a la práctica en forma de algoritmos que pueden ser el motor de una unidad de demosaico tanto en forma de software como de electrónica embebida o hardware de cámaras.

Una interesante aplicación de la versión software es la utilización del método propuesto para realizar ingeniería inversa de imágenes demosaicadas por electrónica embebida o hardware de cámaras:

-: Recuperación del mosaico original: la mayoría de las imágenes digitales provienen de imágenes en mosaico, pero una vez realizado el revelado digital (demosaico y otros procesos) no se dispone de información sobre los datos originales o el proceso seguido. Esta información perdida puede ser útil en algunos casos. En concreto, la recuperación de la imagen en mosaico (o una buena aproximación) permite, por ejemplo, realizar un nuevo demosaico de mayor calidad. También puede tener interés en el área de la compresión de imágenes sin pérdidas, ya que una imagen RGB en mosaico ocupa tres veces menos que una imagen en color en mapa de bits y no supone una pérdida de información si la imagen proviene de ese mosaico.

-: Identificación del dispositivo o (familia de dispositivos) digital de captación con el que se obtuvo una imagen: aplicación de posible utilidad en entornos forenses (policiales o de inteligencia). Dado que las distintas cámaras incorporan distintos procesados, los filtros predictores lineales obtenidos de este proceso inverso pueden ser utilizados como firmas de los diferentes procesados y, por tanto, de los distintos dispositivos y modelos.

Se describe a continuación un método para la detección del mosaico original a partir de una imagen proporcionada por una cámara digital con mosaico, así como para el cálculo aproximado de los filtros de interpolación utilizados para el demosaico de la imagen observada.

Este método se basa en la suposición de que, o bien el método de demosaico utilizado es lineal (en cuyo caso pueden obtenerse sin error los filtros de interpolación lineal utilizados), o bien, aún teniendo el demosaico una componente no lineal, se cumple que la distorsión (medida como error cuadrático medio) cometida aproximando la imagen observada (dimensión N_{C} \times P, siendo N_{C} el número de componentes cromáticas) con un subespacio de dimensión P (número de pixeles) es mínima cuando las muestras de color elegidas como base para ese subespacio son las del mosaico original. Esta suposición resulta razonable cuando la interpolación realizada en la etapa de demosaico tiene una fuerte componente lineal. Se ha demostrado de forma empírica que este método da lugar a diferencias sustanciales en las medidas de error que permiten una identificación robusta de la fase original del mosaico, supuesto conocida la estructura de este último. A continuación se describen los pasos de este método:

1. Elegimos un tamaño N \times N para la máscara de interpolación.

2. Para cada fase de mosaico posible, p = 1...J

a.: Para cada tipo de mosaico local posible, j = 1...J,

i.: Construimos la matriz de componentes de color de cada pixel no incluidas en el mosaico elegido, X_{j}^{p}

ii.: Construimos la matriz de componentes de color de las vecindades correspondientes a las componentes anteriores, \tilde{X}_{j}^{p}

iii.: La matriz que predice con mínimo error cuadrático medio X_{j}^{p} a partir de \tilde{X}_{j}^{p} es:

7

: donde C_{M}^{j,p} y C_{C}^{j,p} son los estimadores muestrales (calculados sobre la imagen completa observada) de las matrices de correlación espacio-color de los vectores de componentes de color del mosaico (M) y de correlación cruzada (C) entre los componentes de fuera del mosaico y los del mosaico, respectivamente, para las vecindades con submosaico j obtenidas asumiendo fase p para el mosaico global.

iv.: El error cuadrático medio mínimo en la aproximación para el tipo de vecindad j es:

8

: donde el subíndice "F" indica norma de Frobenius (suma de componentes al cuadrado).

b.: Calculamos el error total para la fase p: E_{p} = \sum\limits_{j=1}^{J} e_{j,p}^{2}

3. Elegimos la fase p^{\text{*}} definida como p* = arg min E_{p} {}\hskip7,1cm ^{p}

4. Las matrices de predicción estimadas para el demosaico son, entonces:

10

La obtención de las matrices D_{j}^{p\text{*}}, así como de los valores e_{j,p\text{*}}^{2}, posiblemente con distintos tamaños de ventana N, puede servir para caracterizar el demosaico realizado y, por lo tanto, potencialmente, para identificar el modelo y/o tipo de dispositivo utilizado para la obtención de la imagen. Este es un problema clásico de clasificación, que se puede abordar fácilmente, por ejemplo, utilizando un vector Gaussiano de distribución entrenado con varias muestras de imágenes reales tomadas con un conjunto de cámaras entre las que se quiere discriminar.

Ejemplo de realización de la invención

Como caso práctico de realización de la invención, se describe a continuación un posible procedimiento de aplicación, llevado a cabo para un sensor de tipo CCD con el CFA de tipo Bayer (Bayer, U.S. Patent 3,971,065, 1976) con filtros rojos, verde y azul (RGB), que se muestra en la figura 5. Para el entrenamiento se utilizó una selección de las imágenes del "Eastman Kodak® photographic color image database (1993)" -imágenes bien conocidas en la literatura de demosaico- en formato 512 x 768 pixeles, RGB. Es de destacar que estas imágenes proceden de la digitalización de película fotográfica de emulsión, pero la escala utilizada es suficientemente grande y el grano fotográfico no se aprecia. (Otra forma simple de obtener este conjunto de entrenamiento podría ser usar imágenes digitales procedentes de un sensor FOVEON. Existen incluso algunas colecciones de imágenes a la venta). La figura 4 muestra un perfil radial promedio de la estadística conjunta espacial cromática estimada a partir de este conjunto de imágenes, para cada uno de los seis pares de colores posibles: RB(19), RG (20), GB (21), BB (22), RR (23), GG (24). Cuando se considera una única componente de color, se aprecia un alto factor de (auto) covarianza entre pixeles vecinos (22, 23 y 24). El factor de covarianza decrece con la distancia entre píxeles. Entre componentes de color, el factor de covarianza (cruzada) es menor y también decrece con la distancia (19, 20 y 21).

Para el caso en el que no hay o no se quiere compensar emborronamiento, se siguen los cálculos de la sección 2.2, teniendo en cuenta que en este caso particular hay 3 componentes de color (N_{C} = 3) y existen 4 componentes de color en el patrón de muestreo básico (25) y por tanto existen 4 submosaicos locales (J =4) (26, 27, 28, 29).
Se estima C_{xx} y se derivan los 4 D_{j} estimadores lineales correspondientes en los que se desdobla el problema. Como cada uno de ellos ha de predecir dos de las tres componentes de color existentes, se obtienen un total de (N_{C} -1) \times J = 8 filtros bidimensionales. Para un tamaño de vecindad de 9 píxeles (N = 9), cada filtro predictor tiene una dimensión N^{2} = 81. Los filtros predictores resultantes fueron aplicados a imágenes en formato de negativo digital (formatos crudo o RAW) obtenidas en varias cámaras fotográficas digitales de gama profesional. La comparación visual directa entre las imágenes resultantes de la unidad de procesado objeto de esta invención y las procesadas con herramientas disponibles comercialmente muestra una mayor nitidez favorable a este procedimiento. Para extraer resultados numéricos se comparó nuestra unidad de demosaico con otras (cuatro de ellas descritas recientemente en la literatura científica y otras dos utilizadas frecuentemente como referencia) que fueron implementadas en la misma plataforma (MATLAB® sobre un Pentium IV, 2.39 GHz) con un nivel similar de eficiencia computacional del
código.

Las imágenes de prueba fueron imágenes con contenido completo RGB en las que se había simulado el mosaico. Se comparó el resultado de cada unidad de demosaico con la imagen real con una métrica S-CIELab (\DeltaE_{ab}*), que tiene en cuenta la relevancia perceptual de los errores (considerando una visualización de la imagen de 72 puntos por pulgada observada a 18 pulgadas de distancia). La figura 6 muestra los resultados de error frente al tiempo necesario para completar el procesado de la imagen. Los métodos con los que se compara el objeto de la invención (círculos), se pueden agrupar en dos clases amplias: "Alta velocidad, baja calidad" y "Baja velocidad, alta calidad". Este nuevo método (cuadrado) (30), debido a su simplicidad podría por velocidad agruparse con los primeros, y por prestaciones con los segundos.

Para el caso de demosaico con compensación de emborronamiento, se simuló desenfoque con un filtro gaussiano isotrópico con sigma = 3, tras el cual se aplicó ruido de cuantificación correspondiente a 8 bits. Siguiendo la descripción matemática de la sección 2.3, con los mismos parámetros descritos anteriormente excepto que en este caso se usó
N = 15, se obtuvieron 12 predictores lineales (N_{C} \times J = 12). La figura 7 muestra el resultado de la unidad de demosaico con compensación de emborronamiento. Se observa que la imagen tras aplicación de demosaico y compensación de emborronamiento de forma simultánea y en un único filtrado (32), muestra mayor detalle incluso que la imagen de entrada previa al mosaico (imagen emborronada y con ruido) (31).

La invención puede llevarse a cabo sobre una plataforma software con un control gradual que permita en tiempo real modificar los parámetros de grado de desenfoque de la imagen y de la cantidad de ruido, de tal forma que el usuario seleccione visualmente los parámetros que proporcionan la mejor imagen final.

Breve descripción de las figuras

Figura 1. Esquema simple de una cámara de estado sólido que incorpora la presente invención. Dicha cámara digital contiene un cuerpo de cámara (1) que soporta un sistema óptico (2) que forma una imagen sobre un sensor (3). El sensor está formado por una matriz de fotodetectores (4) sobre la que hay una matriz de filtros de color (CFA, color array filter) (5), que filtra espectralmente la luz que le llega a cada detector individual. La matriz de filtros de color esta diseñada de manera que separa la imagen en componentes de color (típicamente rojo (R), verde (G) y azul (B)), de forma periódica, con un determinado patrón de mosaico.

Es necesaria una electrónica de lectura y procesado de las señales eléctricas (6). Un conversor analógico-digital da lugar al fotograma digital, que en esta etapa es una única imagen en mosaico, que será almacenada en una memoria o dispositivo de registro (7). La formación de la imagen final (10) requiere el procesado (8) de esta imagen en mosaico que comprende, además del balance de blancos y otros tratamientos como compresión, la unidad de demosaico objeto de esta invención (9). La unidad de demosaico interpola la imagen original (en mosaico), en la cual en cada pixel solo hay información de una componente de color, para obtener en cada pixel contenido completo de color, y por lo tanto contenido completo espacial y de color en toda la imagen, imagen final (10).

Figura 2. Proceso de demosaico para una imagen con componentes RGB (siglas inglesas para Rojo, Verde y Azul), a modo de ejemplo. Si la imagen en mosaico (11) se desdobla en las capas correspondientes a las componentes de color existentes, en cada capa (rojo 12, verde 13 y azul 14) aparecen huecos. La unidad de demosaico (15) llena estos huecos por interpolación para dar lugar a una imagen en la que cada capa de color está completa (16, 17 y 18).

Figura 3. Esquema general del proceso de demosaico propuesto en la presente invención. El proceso consta de tres fases, la fase 1 en la que se estudia la estadística de las imágenes naturales, la fase 2 en las que a partir de un conjunto de imágenes, que llamaremos imágenes de entrenamiento, hallamos el conjunto de filtros óptimos de predicción lineal y por último, la fase 3 en las que se utiliza este conjunto para obtener a partir de la imagen en mosaico, la imagen final con contenido completo espacial y de color.

Figura 4. Ilustración, a modo de ejemplo, de los factores de covarianza, medida entre componentes de color de una imagen con componentes de color RGB, en función de la distancia en pixeles (curvas de la 19 a 24). R, G y B están representados por símbolos "+", "o" y "x" respectivamente. En las tres curvas de inferiores (19, 20, 21) se superponen símbolos distintos expresando covarianza-cruzada mientras que en las superiores (22, 23, 24) la superposición de símbolos iguales expresa auto-covarianza.

\newpage

Figura 5. Ejemplo de Matriz de Filtros de Color de tipo Bayer. Tres componentes de color posibles (N_{C} = 3). 25: Patrón de mosaico básico con cuatro elementos (J = 4). 26, 27, 28, 29: Los cuatro tipos de vecindades posibles, para una ventana N = 5.

Figura 6. Muestra los resultados de error frente al tiempo necesario para completar el procesado de la imagen. Métodos con los que se compara el objeto de la invención (círculos) y el nuevo método propuesto en esta invención (cuadrado) (30).

Figura 7. Muestra el resultado de la unidad de demosaico con compensación de emborronamiento. Se observa que la imagen tras aplicación de demosaico y compensación de emborronamiento de forma simultánea y en un único filtrado (32), muestra mayor detalle incluso que la imagen de entrada previa al mosaico (imagen emborronada y con ruido) (31).

Claims

1. Procedimiento de demosaico por predicción lineal óptima basado en la estadística conjunta espacio-color de imágenes naturales para obtener una imagen con contenido completo espacial y de color en sensores de imagen de tipo mosaico, que comprende las siguientes fases:

a.: Estudio previo en una o más imágenes naturales de entrenamiento con contenido completo de color (todas las componentes de color en cada uno de los píxeles) de la correlación conjunta espacio-color típica.

b.: Obtención de un conjunto de filtros óptimos de predicción lineal (D), óptimos en un sentido de mínimos cuadrados, entre la lectura del sensor y la imagen completa, para cada una de las componentes de color posibles y cada uno de los tipos de vecindad presentes en el mosaico.

c.: Uso de dichos filtros de predicción para reconstrucción de la imagen completa (demosaico de la imagen procedente del sensor).

2. Método para el cálculo del conjunto de filtros de predicción D a partir de estimadores muestrales de correlación espacial y de color en imágenes de entrenamiento según la reivindicación anterior que comprende las siguientes
fases:

a.: Para cada pareja de colores y posiciones espaciales posibles dentro de la vecindad considerada (N \times N) cálculo de la correlación muestral espacial cromática C_{xx}, usando los píxeles (R,G,B) completos de las imágenes de entrenamiento.

b.: Desdoblamiento del problema para cada una de las J vecindades (submosaicos) posibles.

c.: Ordenando adecuadamente los coeficientes C_{xx}, anteriores, cálculo de la matriz de correlación cruzada C^{j}_{C} entre elementos de color cualesquiera de la vecindad completa (3N^{2} elementos, siendo N^{2} el numero de píxeles de la vecindad) y elementos del mosaico de la vecindad j (N^{2} elementos), por un lado, y cálculo de la matriz de correlación de dichos elementos del mosaico en la vecindad j, C^{j}_{M}, por otro.

d.: Cálculo de los filtros de predicción lineales óptimos para cada una de las J vecindades (submosaicos) mediante la fórmula:

11

3. Método para el cálculo, del conjunto de filtros D a partir del cálculo directo de la matriz pseudoinversa, según la reivindicación 1, consistente en:

a.: Simulación de un mosaico a partir de la imagen completa para cada una de las imágenes de entrenamiento.

b.: Obtención del filtro de predicción lineal óptimo para cada tipo de vecindad (submosaico), ajustando por mínimos cuadrados (pseudoinversa) los valores conocidos (imágenes de entrenamiento) como combinaciones lineales de las observaciones (imágenes de mosaico).

4. Utilización del procedimiento de demosaico por predicción lineal óptima, según reivindicaciones anteriores, adaptado a una sóla imagen y aplicando el conjunto de filtros de predicción D_propia obtenido con entrenamiento sobre una sóla imagen, para conseguir un resultado óptimo en imágenes de estadística similar a la usada en dicho entrenamiento.

5. Utilización del procedimiento de demosaico por predicción lineal óptima, según reivindicaciones anteriores, adaptado a un tipo de imágenes y aplicando el conjunto de filtros de predicción D_adaptado obtenido con entrenamiento sobre un conjunto determinado de imágenes naturales, para conseguir un resultado óptimo en imágenes de estadística similar a las usadas en dicho entrenamiento.

6. Utilización del procedimiento de demosaico por predicción lineal óptima, según reivindicaciones anteriores, aplicando el conjunto de filtros de predicción D_global obtenido con entrenamiento sobre imágenes naturales convencionales, para conseguir un resultado óptimo en imágenes en general.

7. Método para el cálculo por iteración de una aproximación a la D_propia de una imagen, llamada D_autoentrena-
miento, según reivindicaciones anteriores y basado únicamente en la información disponible del sensor, que comprende las siguientes fases:

a.: Obtención de una primera aproximación a la imagen completa por medio del demosaico de la imagen con las matrices D_adaptada o D_global descritas en las reivindicaciones 6 ó 7

b.: Uso de la estadística espacio-color de esa imagen o una versión modificada de la misma, por ejemplo espacialmente escalada, para el cálculo de su D_propia según reivindicación 5. Esa D_propia, por proceder de la misma imagen, pasará a llamarse D_autoentrenamiento, y podrá ser utilizada para el demosaico de la imagen original.

\vskip1.000000\baselineskip

8. Método para realizar el cálculo del conjunto de filtros de predicción óptimos en un sentido de mínimos cuadrados, según reivindicaciones 1, 2, ó 7 caracterizado por utilizar métricas visuales que minimicen el impacto visual de los artificios de demosaico.

9. Un método para realizar el cálculo de los filtros de predicción óptimos en un sentido de mínimos cuadrados, según reivindicaciones 1, 2, ó 7, caracterizado por utilizar una transformación no-lineal previa a un espacio de color en el cual la estadística espacio-color esté menos correlacionada.

10. Método para acelerar la implementación del filtrado de predicción lineal según las reivindicaciones 4, 5, ó 6, caracterizado por aproximar los filtros predictores como suma de un conjunto reducido de filtros separables en las componentes vertical y horizontal, utilizando la descomposición en valores singulares (SVD).

11. Método para realizar restauración de imágenes degradadas por ruido y desenfoques moderados a la vez que demosaico, mediante el cálculo de los filtros de predicción óptimos en un sentido de mínimos cuadrados entre imágenes degradadas e imágenes libres de degradación que comprende las siguientes fases:

a.: Estimación muestral de la matriz de correlación cruzada (C_{xy}) entre imágenes originales (x) e imágenes con degradación simulada (y).

b.: Estimación muestral de la matriz de correlación de los elementos de las imágenes degradadas (C_{yy}).

c.: Obtención, para cada tipo de vecindad, de la matriz de correlación cruzada C^{j}_{C} reordenando términos de C_{xy}.

d.: Obtención, para cada tipo de vecindad, de la matriz de correlación de las observaciones en el mosaico C^{j}_{M} reordenando términos de la matriz C_{yy}.

e.: Cálculo de los filtros de predicción lineales óptimos para cada una de las J vecindades (submosaicos) mediante la fórmula:

12

\vskip1.000000\baselineskip

12. Dispositivo para la captación de imágenes digitales caracterizado por llevar implementados los métodos según reivindicaciones anteriores.

13. Cámara digital caracterizada por incorporar los métodos descritos en las reivindicaciones 1 a 11.

14. Utilización del procedimiento de demosaico por predicción lineal óptima, según reivindicaciones anteriores en un soporte que permita interpolar el mosaico, con compensación de desenfoque y emborronamiento, de imágenes RAW, que permita modificar los parámetros de estadística conjunta espacio-color de las imágenes, grado de desenfoque de la imagen y de la cantidad de ruido para la obtención de la mejor imagen final.

15. Método para obtener la imagen en mosaico original (o una aproximación de la misma) a partir de la selección de la fase o desplazamiento para una estructura de mosaico dada, que comprende los siguientes pasos:

a.: Obtención de los J mosaicos posibles, de acuerdo a sus fases.

b.: Obtención del las matrices de predicción lineal óptima para cada una de las J fases, según reivindicación 2, pero en lugar de usar datos de entrenamiento con otras imágenes, usando una matriz de correlación muestral espacio-color obtenida únicamente con la imagen completa observada.

c.: Obtención de la aproximación lineal óptima (demosaico), usando las matrices de predicción del punto anterior, para cada una de las J fases.

d.: Obtención del error cuadrático (suma de diferencias al cuadrado con el original) en el demosaico para cada fase.

e.: Elección de la fase que proporciona el menor error cuadrático.

\newpage

16. Método para la detección del tipo de mosaico de filtros de color que tenía el sensor que tomó una imagen digital, que comprende los siguientes pasos:

a.: Obtención del error cuadrático para la fase óptima de cada una de las estructuras de mosaico candidatas, según reivindicación 15.

b.: Selección de la estructura de mosaico que proporcione menor error cuadrático.

\vskip1.000000\baselineskip

17. Método para el cálculo del conjunto de filtros de predicción D que permite la mejor aproximación lineal a la imagen observada, a partir de la imagen en mosaico original que comprende los siguientes pasos:

a.: Identificación de la estructura del mosaico, a partir de un conjunto de estructuras candidatas, según reivindicación 16.

b.: Identificación de la fase del mosaico según reivindicación 15.

c.: Selección de los filtros de predicción correspondientes a la fase elegida en el método descrito en la reivindicación 15.

\vskip1.000000\baselineskip

18. Utilización del procedimiento de cálculo del conjunto de filtros de predicción D que permite la mejor aproximación lineal a la imagen observada, según reivindicaciones 15 a 17, para la estimación de las probabilidades respectivas de que la imagen digital observada haya sido capturada con un conjunto de modelos de dispositivos de captura de imagen digital.