ES2301292B1 - Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. - Google Patents
Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. Download PDFInfo
- Publication number
- ES2301292B1 ES2301292B1 ES200502100A ES200502100A ES2301292B1 ES 2301292 B1 ES2301292 B1 ES 2301292B1 ES 200502100 A ES200502100 A ES 200502100A ES 200502100 A ES200502100 A ES 200502100A ES 2301292 B1 ES2301292 B1 ES 2301292B1
- Authority
- ES
- Spain
- Prior art keywords
- image
- images
- color
- mosaic
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012549 training Methods 0.000 claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000013459 approach Methods 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000015556 catabolic process Effects 0.000 claims description 3
- 238000006731 degradation reaction Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 claims 1
- 238000006073 displacement reaction Methods 0.000 claims 1
- 238000004088 simulation Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 18
- 238000012545 processing Methods 0.000 abstract description 14
- 238000011161 development Methods 0.000 abstract description 3
- 238000012407 engineering method Methods 0.000 abstract 1
- 230000006872 improvement Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- QOSTVEDABRQTSU-UHFFFAOYSA-N 1,4-bis(methylamino)anthracene-9,10-dione Chemical compound O=C1C2=CC=CC=C2C(=O)C2=C1C(NC)=CC=C2NC QOSTVEDABRQTSU-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- LFZDEAVRTJKYAF-UHFFFAOYSA-L barium(2+) 2-[(2-hydroxynaphthalen-1-yl)diazenyl]naphthalene-1-sulfonate Chemical compound [Ba+2].C1=CC=CC2=C(S([O-])(=O)=O)C(N=NC3=C4C=CC=CC4=CC=C3O)=CC=C21.C1=CC=CC2=C(S([O-])(=O)=O)C(N=NC3=C4C=CC=CC4=CC=C3O)=CC=C21 LFZDEAVRTJKYAF-UHFFFAOYSA-L 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4015—Image demosaicing, e.g. colour filter arrays [CFA] or Bayer patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G06T5/001—
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Color Television Image Signal Generators (AREA)
- Image Processing (AREA)
Abstract
Método de predicción lineal óptima para la reconstrucción de la imagen en cámaras digitales con sensor de mosaico que permite obtener una imagen en color completa a partir de otra en mosaico procedente del sensor de una cámara digital con matriz de filtros de color. La invención interpola linealmente las muestras ausentes, minimizando el error cuadrático medio. En un proceso de entrenamiento previo, a partir de la estimación de la correlación espacial y cromática en imágenes naturales, se obtienen máscaras de interpolación de tamaño reducido para cada componente de color y tipo de vecindad. El método asegura un coste computacional reducido, que lo hace aplicable no sólo a soluciones software para revelado digital a posteriori, sino también a soluciones hardware en tiempo real, embebidas en las cámaras. Se presentan, además, soluciones alternativas basadas en el auto entrenamiento de la imagen, que proporcionan mejor calidad con mayor procesamiento, una generalización del método para el caso de que exista ruido y/o emborronamiento, así como métodos de ingeniería inversa. (Ver figura)
Description
Método de predicción lineal óptima para la
reconstrucción de la imagen en cámaras digitales con sensor de
mosaico.
La presente invención pertenece al campo de la
captación digital de imágenes, concretamente a la adquisición de
imágenes a color con sensores que utilizan mosaicos de filtro de
color.
Las cámaras digitales, tanto fotográficas como
de vídeo, son cada vez más populares. La mayoría proporcionan
imágenes en color a partir de un único sensor de estado sólido
formado por una matriz de fotodetectores, donde cada detector
corresponde a un pixel de la imagen. Sobre dicha matriz de
fotodetectores se superpone una matriz de filtros de color (CFA en
sus siglas inglesas) (por ejemplo, Bayer, U.S. Patent 3,971,065,
1976) que altera la composición espectral de la radiación
incidente. De esta forma cada detector recibe información de una
sola componente de color, siguiendo la matriz de filtros de color
una estructura que se repite a lo largo de la imagen con una
determinada periodicidad espacial. La solución más extendida es
superponer a sensores con tecnología CCD una matriz con tres
componentes de color: rojo, verde, azul -RGB en sus siglas inglesas-
existiendo varias formas de crear la matriz CFA RGB, es decir, de
distribuir espacialmente las distintas componentes de color.
Lógicamente, esta solución es menos costosa que utilizar varios
sensores completos (típicamente tres) cada uno con un único filtro
de color para todos los fotodetectores. También se aplica esta
técnica a sensores basados en otras tecnologías y además existen
varias alternativas en cuanto al número y respuesta espectral de la
matriz de filtros de color. El resultado en todos los casos es una
única imagen en mosaico de color. Si se desdobla en sus canales de
color, en cada canal aparecen huecos -vacíos de información- en los
fotodetectores que están asociados a otros canales. Para obtener la
imagen con contenido completo de color es necesario un proceso de
interpolación para estimar las componentes de color no captadas por
el sensor a partir de las componentes vecinas. Este proceso se
denomina demosaico.
Las interpolaciones más sencillas, como la
replicación de un vecino cercano o la interpolación bilineal
producen artificios de falso color que deterioran de forma
significativa la calidad de la imagen resultante. Se han publicado
recientemente un gran número de métodos, de distintos grados de
sofisticación, tanto en forma de artículos científicos (una
revisión exhaustiva: B. K. Gunturk et al. "Demosaicking:
Color filter array interpolation in single chip digital cameras",
IEEE Signal Processing Magazine, September 2004) como de patentes
(Hel-Or US2005031222 -
2005-02-10, Stavely And Whitman
US2004240726 - 2004-12-02, Okutomi
And Goto WO2004068862 - 2004-08-12,
Zhang And Kakarala EP1416739 -
2004-05-06, Keshet and Maurer
WO03079695 - 2003-09-25, Guenter
US2004001641 -
2004-01-01, Baharav et al. EP1288855 - 2003-03-05, Tao WO0126359 - 2001-04-12, Taubman US2003197796 - 2003-10-23) para intentar mejorar la apariencia de las imágenes resultantes y su fidelidad respecto a la imagen original. Los resultados son muy variables. La experiencia en el uso y comparación entre cámaras demuestra que el algoritmo de demosaico tiene una gran importancia, no sólo en la calidad final de las imágenes (resolución, artificios de color, apariencia general) sino también en el tiempo de procesado de la imagen.
2004-01-01, Baharav et al. EP1288855 - 2003-03-05, Tao WO0126359 - 2001-04-12, Taubman US2003197796 - 2003-10-23) para intentar mejorar la apariencia de las imágenes resultantes y su fidelidad respecto a la imagen original. Los resultados son muy variables. La experiencia en el uso y comparación entre cámaras demuestra que el algoritmo de demosaico tiene una gran importancia, no sólo en la calidad final de las imágenes (resolución, artificios de color, apariencia general) sino también en el tiempo de procesado de la imagen.
Es de destacar que muchos de los algoritmos
propuestos son excesivamente costosos, desde un punto de vista
computacional, para aplicaciones prácticas. Los métodos de
demosaico han de ser implementados en algoritmos que funcionan en
forma de software, o hardware en cámaras de distintas resoluciones:
alta (fotografía), media (vídeo, televisión digital) o baja
(cámaras de vigilancia, teléfonos móviles, webcams).
Aunque la capacidad de cálculo tanto de los
ordenadores como de los sistemas de procesado integrados en las
cámaras aumenta constantemente, también lo hace la cantidad de
datos a procesar, por el aumento de la resolución espacial de las
imágenes, la profundidad en bits de cada pixel o la tasa de
adquisición de fotogramas por segundo. En otros casos -baja
resolución- la capacidad de procesado está muy limitada por
cuestiones de tamaño del dispositivo, consumo, o simplicidad, como
en el caso de sensores con electrónica de procesado integrada en el
propio chip (caso de tecnologías CMOS). Por tanto, para aplicaciones
prácticas, se prefieren algoritmos de baja complejidad frente a
algoritmos de gran sofisticación, más lentos en su ejecución (como
los propuestos en: B. K. Gunturk and R M. Mersereau, "Color plane
interpolation using alternating projections", IEEE Trans. on
Image Proc., vol. 11, no. 9, pp. 997-1013, 2002., o
en: W. Lu and Y. P. Tan, "Color filter array demosaicing: new
method and performance measures", IEEE Trans. on Image Proc.,
vol. 12, no. 10, pp. 1194-1210, 2003.).
Por otro lado, los nuevos formatos de imagen y
vídeo, y las actuales mejoras en las herramientas de visualización
e impresión exigen métodos de demosaico que mantengan buenas
prestaciones. Un caso significativo es la televisión digital, cuya
alta definición hace apreciables defectos antes no percibidos, entre
los que destacan los artificios de color de las imágenes
provocados, en mayor o menor medida, por los algoritmos de
demosaico.
Se han propuesto en la literatura científica
algunos modelos lineales de formación de la imagen (D. H. Brainard,
"Bayesian method for reconstructing color images from
trichromatic samples", in Proc. IS&T 47th Annual Meeting,
Rochester NY, 1994, pp. 375-380.; D. Taubman,
"Generalized wiener recontruction of images from colour sensor
data using a scale invariant prior", Proc. of Int. Conf. on Image
Proc., vol. 3, pp. 801-804, 2000.; H. J. Trussel
and Robert E. Hartwig, "Mathematics for demosaicking", IEEE
Trans. on Image Proc., vol. 11, no. 4, pp. 485-492,
2002.). El demosaico se basa entonces en aplicar criterios de error
cuadrático mínimo para estimar de forma lineal la imagen completa
de color, típicamente en un marco bayesiano. Estos métodos tienen
la posibilidad de incorporar en el modelo el efecto de
emborronamiento debido, principalmente, a la óptica. Sin embargo,
los métodos de este tipo propuestos hasta la actualidad no son
adecuados para una implementación real. En el trabajo de Trussel y
Hartwig mencionado, se limita drásticamente el potencial del
método, ya que la resolución del planteamiento matemático se basa en
aproximaciones poco realistas (asume separabilidad entre la
correlación espacial y de color de las imágenes, algo que, como se
verá en el ejemplo de realización de la invención, y en la figura
4, no es correcto). Los trabajos de Taubman y Trussel/Hartwig
realizan los cálculos en el dominio de Fourier, algo mucho más
costoso computacionalmente que realizarlos en el dominio espacial
con máscaras de convolución pequeñas. El trabajo de Brainard no
llega a un algoritmo práctico. El método propuesto por S. C. Pei
and I. K. Tam, ("Effective color interpolation in CCD color
filter arrays using signal correlation", IEEE Tran. on Cir. and
Sys. for Video Technology, vol. 13, no. 6, pp.
503-513, 2003.) es eficiente y basado en
correlación, pero no es óptimo desde el punto de vista lineal de
mínimos cuadrados.
La presente invención supone una mejora de la
técnica de demosaico ya que representa una de las soluciones de
coste computacional más reducido, a la vez que proporciona una
fidelidad a la imagen original cercana a la que proporcionan los
mejores algoritmos existentes, típicamente mucho más lentos que el
propuesto. Además posibilita compensación de ruido y
emborronamiento y recuperación del mosaico original en las imágenes
demosaicadas.
La presente invención proporciona un método de
demosaico basado en un modelo lineal de la imagen y la aplicación de
criterios de error cuadrático mínimo, que combina bajo coste
computacional y buena calidad gracias a las siguientes estrategias
novedosas que permiten la resolución matemática del problema:
- -
- En lugar de representar cada componente del modelo de formación de imagen y tratar de resolver analíticamente las ecuaciones resultantes, el método se centra en que las muestras que faltan o que han sido degradadas pueden ser estimadas a través de combinaciones lineales de los datos proporcionados por el sensor (debido al uso de un modelo lineal y optimización de error cuadrático medio).
- -
- En lugar de usar un modelo a priori de la imagen (como en los trabajos de Brainard o Taubman, ya mencionados), el método se basa en el uso de la estadística de la correlación conjunta espacial cromática obtenida de un conjunto pequeño de imágenes típicas. Esto proporciona una buena calidad de interpolación, como se muestra en el ejemplo de realización de la invención.
- -
- En lugar de imponer restricciones a la estadística de las imágenes, en este método solo se imponen restricciones en el propio estimador lineal, para hacerlo adecuado para computación: un soporte espacial limitado N \times N de las máscaras de interpolación. Usando N \geq 9 podemos realizar los cálculos de forma eficiente en el dominio espacial, sin que se afecten significativamente las prestaciones finales.
- -
- El método descompone el problema de estimación en un conjunto de problemas de predicción independientes, que resultan de los diferentes mosaicos locales posibles al desplazar por el sensor la ventana de estimación.
Además la presente invención tiene en cuenta, en
primer lugar, medidas de la estadística conjunta
espacio-color realizadas por los autores en imágenes
naturales consideradas representativa, y en segundo lugar, medidas
de comparación, tanto en términos de fidelidad de imagen resultante
como de tiempo de procesado, con los algoritmos más relevantes
descritos en la literatura científica aplicados a imágenes
conocidas y con mosaico simulado.
En la figura 1 se muestra un esquema simple que
ilustra el funcionamiento de una cámara digital, que contiene un
cuerpo de cámara (1) que soporta un sistema óptico (2) que forma
una imagen sobre un sensor (3). El sensor está formado por una
matriz de fotodetectores (4) sobre la que hay una matriz de filtros
de color (CFA) (5), que filtra espectralmente la luz que le llega a
cada detector individual. La matriz de filtros de color esta
diseñada de manera que separa la imagen en componentes de color, de
forma periódica, con un determinado patrón de mosaico. Es necesaria
una electrónica de lectura y procesado de las señales eléctricas
(6). Un conversor analógico-digital da lugar al
fotograma digital, que en esta etapa es una única imagen en
mosaico, que será almacenada en una memoria o dispositivo de
registro (7). La formación de la imagen final (10) requiere el
procesado (8) de esta imagen en mosaico que comprende, además del
balance de blancos y otros tratamientos como compresión, la unidad
de demosaico objeto de esta invención (9). La unidad de demosaico
interpola la imagen original (en mosaico), en la cual en cada pixel
solo hay información de una componente de color, para obtener en
cada pixel contenido completo de color, y por lo tanto contenido
completo espacial y de color en toda la imagen. Dicho de otro modo,
y tal y como se muestra en la figura 2 (para una imagen con
componentes RGB, a modo de ejemplo), si la imagen en mosaico (11)
se desdobla en las capas correspondientes a las componentes de color
existentes (R, G y B, en este caso), en cada capa (12, 13 y 14,
respectivamente) aparecen huecos, y la unidad de demosaico (15)
llena estos huecos por interpolación para dar lugar a una imagen en
la que cada capa de color está completa (16, 17 y 18).
El proceso para desarrollar la unidad de
demosaico se ha dividido en tres fases. Las fases 1 y 2 son
preparatorias y de obtención de datos estadísticos y solamente se
realizan una vez. Pueden ser consideradas por tanto como etapas de
diseño. La fase 3 describe el método de demosaico en sí, y cómo se
ha de procesar cada una de las imágenes. Esta última fase está
basada en los datos estadísticos obtenidos anteriormente. La figura
3 muestra un esquema general de todo el proceso. A continuación se
describen detalladamente las fases mencionadas.
Se estudia la estadística conjunta
espacial-cromática de imágenes en términos de
correlación de la señal, entre las distintas componentes de color en
posiciones espaciales vecinas:
C_{xx}(c_{1}, c_{2},
\Delta_{n}, \Delta_{m}) = E {x(c_{1}, n,
m) x (c_{2}, n, + \Delta_{n}, m +
\Delta_{m})} donde E representa la esperanza matemática,
(n, m) son las coordenadas espaciales y
(c_{1}, c_{2}) son un par de componentes de color.
Esta esperanza matemática se estima en la práctica promediando
sobre datos reales. La figura 4 muestra las curvas de correlación
(19 a 24), normalizadas, para el caso típico de un sensor RGB y un
conjunto variado de imágenes naturales.
Usamos el siguiente modelo de imagen para la
imagen que captura una cámara con sensor de tipo CFA:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
donde H representa la función
respuesta al impulso (Point Spread Function, PSF) que describe el
emborronamiento producido por la óptica, w_{0} es ruido blanco
independiente de media cero, y S el muestreo de color llevado a cabo
por el sensor CFA. Siendo P el número de píxeles de la
imagen, x tiene 3P elementos e y solamente P
elementos. Es más conveniente utilizar y = SHx + w, donde w =
Sw_{0} sigue siendo ruido blanco. La solución de mínimo error
cuadrático medio sin restricciones de este sistema lineal
es:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
que es una función lineal de y. Sin
embargo, como las matrices y vectores involucrados tienen un gran
tamaño, la solución directa de esta ecuación es computacionalmente
costosa.
\vskip1.000000\baselineskip
Algunos autores han impuesto restricciones a la
estadística para resolver la fórmula 2 globalmente en el dominio de
Fourier. En lugar de ese acercamiento, en esta invención se propone
forzar los estimadores lineales a un soporte espacial limitado,
considerando tan solo los vecinos alrededor de la muestra a predecir
(ya sea porque falte o porque esté degradada). Esta ventana local
permite una solución más simple y, consecuentemente, un tiempo
computacional menor. A consecuencia de localizar la ventana de
estimación aparecen diferentes posibilidades de estructura de
mosaico local, para diferentes localizaciones en el sensor CFA. El
mosaico está formado por la repetición de un patrón de mosaico
básico formado por J elementos, de los N_{C}
colores distintos del sensor (J > N_{C}. De
acuerdo con esto, existen J posibilidades de mosaico local en
forma de ventana cuadrada de tamaño impar alrededor de cada pixel.
En la figura 5 se ilustra este hecho para el caso típico de un
mosaico tipo Bayer en el cual N_{C} = 3 (3 colores: R, G y
B) y J = 4 (el patrón de mosaico básico (25) tiene 4
elementos). Existen por tanto J = 4 posibilidades de mosaico
local (26 a 29). Este método distingue entre esos J casos,
obteniéndose estimadores diferentes para cada mosaico local. Nótese
que al desacoplar el problema de esta forma la solución global
sujeta a la limitación espacial sigue siendo óptima. Otros métodos
también han usado interpoladores diferentes para diferentes
localizaciones, pero ninguno de ellos deriva su estimación de la
estadística de las imágenes.
\vskip1.000000\baselineskip
Sea x_{i}^{j} el vector de las
muestras desconocidas del pixel (i, j), donde j indica
el tipo de mosaico del los J posibles, e i indica
el número de pixel de los L_{j} posibles con ese mosaico
j. Construimos las matrices X_{j} = (x_{1}^{j}
...x_{L_{j}}^{j}), j =1...J. Cada una de estas
matrices tiene dimensión (N_{C} -1) \times
L_{j}, donde N_{C} es el número de colores (por
ejemplo N_{C} = 3 y J = 4
para una matriz CFA de Bayer). Sea \tilde{x}_{i}^{j} el vector que contiene todas las muestras de color observadas en la ventana
N \times N alrededor del pixel (i, j) (N^{2} elementos). Se construye una matriz con todos esos vecindarios, siguiendo el mismo orden que antes: \tilde{X}_{j} = (\tilde{x}_{1}^{j} ... \tilde{x}_{L_{j}}^{j}). Siguiendo el modelo de estimación lineal, toda muestra de color desconocida se puede predecir como una combinación lineal de sus vecinos observados:
para una matriz CFA de Bayer). Sea \tilde{x}_{i}^{j} el vector que contiene todas las muestras de color observadas en la ventana
N \times N alrededor del pixel (i, j) (N^{2} elementos). Se construye una matriz con todos esos vecindarios, siguiendo el mismo orden que antes: \tilde{X}_{j} = (\tilde{x}_{1}^{j} ... \tilde{x}_{L_{j}}^{j}). Siguiendo el modelo de estimación lineal, toda muestra de color desconocida se puede predecir como una combinación lineal de sus vecinos observados:
y la optimización por estimación
lineal de error cuadrático medio implica
que:
Operando se obtiene:
Los elementos de las matrices del término de la
derecha de la fórmula 5 son muestras de correlación espacial
cromática. Las matrices C_{M}^{j} y C_{C}^{j} son los
estimadores muestrales de la correlación espacial cromática (de los
elementos del mosaico observados, y cruzada entre estos y los
elementos que no aparecen en el mosaico, respectivamente). Los
elementos de las matrices C_{M}^{j} y C_{C}^{j} están
contenidos en C_{xx}, y, por tanto, dichas matrices se
obtienen reordenando adecuadamente los términos (posiciones
espaciales relativas y colores) de C_{xx}. La matriz D,
que engloba las J matrices D_{j}, es el estimador lineal, o
conjunto de filtros óptimos de predicción lineal para reconstruir
la imagen.
La resolución del problema a partir de un modelo
de imagen lineal permite de forma natural extender el método
anterior al caso de imágenes deterioradas por emborronamiento (por
ejemplo de la óptica de la cámara) y ruido (por ejemplo del sensor
y del conversor analógico-digital), de forma que la
compensación del ruido y emborronamiento se realice conjuntamente
con el demosaico y sin carga computacional adicional. Esta técnica
requiere un modelado previo de la degradación en la etapa de
entrenamiento. Se simulan imágenes degradadas (convolucionándolas
con la PSF -función respuesta al impulso de la cámara- y añadiendo
el ruido con los estadísticos deseados) que nos servirán, junto con
las originales de referencia (no degradadas) para obtener los
filtros predictores óptimos. Para el entrenamiento, tras la
degradación simulada (a través de un filtro de emborronamiento y la
adición de ruido a las imágenes originales), se estima
la correlación cruzada original-degradada espacio-color C_{xy} y la correlación degradada-degradada espacio-color C_{yy}.
la correlación cruzada original-degradada espacio-color C_{xy} y la correlación degradada-degradada espacio-color C_{yy}.
Matemáticamente, se opera de forma alternativa a
la etapa 2.2, incluyendo en este caso todas las (N_{C})
muestras en X_{j}. Llamamos \tilde{Y}_{j} a cada una de las
J matrices construidas con las vecindades de las muestras de
color observadas, y obtenemos:
A partir de esta fórmula la estimación es
entonces \hat{X}_{j} = D_{j}^{b} \tilde{Y}_{j}.
C_{xy} y C_{yy} se obtienen reordenando términos,
como antes, a partir de C_{xy} y C_{yy}. Nótese
que cuando se pretende compensar el ruido o emborronamiento
presente, típicamente se requiere un soporte espacial más grande
que para el caso de interpolación pura. Es de destacar que esta
solución de demosaico y compensación simultánea representa una
mejora respecto a los procedimientos actuales. Normalmente la
compensación de emborronamiento se aplica después de que la imagen
haya sido interpolada a partir de su mosaico, lo que supone un
procedimiento subóptimo, tanto en calidad como en coste
computacional.
Una vez obtenido el estimador lineal D adaptado
a las características de la imagen, se aplican a la imagen
submuestreada en espacio y en componentes de color (lectura del
sensor CFA) siguiendo la fórmula 3. Se obtiene entonces una imagen
con contenido completo en espacio y en color. El balance de blancos
de dicha imagen es el correspondiente a las imágenes que se han
usado en el entrenamiento. Se pueden aplicar unos factores de
corrección que den cuenta de las diferencias entre el sensor usado
en el entrenamiento y el sensor CFA que captura la imagen
(variaciones en la sensibilidad de los detectores, en la
transmisión de los filtros de color, o en la electrónica de
lectura), o simplemente que se adapten a las condiciones de la
imagen, especialmente la iluminación.
Además, existe la posibilidad de usar un método
de eliminación de artificios de color o aliasing, lo que se
denominan métodos de postprocesado de demosaico, como por ejemplo
los métodos propuestos en el trabajo, ya mencionado, de Gunturk.
Como se ha explicado, el cálculo del conjunto de
filtros óptimos de predicción lineal (D) se basa en el estudio de
la correlación espacial-cromática en imágenes en las
cuales en cada uno de sus píxeles se han capturado, no deducido,
todas las componentes de color: imágenes de entrenamiento. Hay
varias formas de obtener este tipo de imágenes de
entrenamiento.
Existen cámaras que incorporan un sensor por
cada componente de color alineados por medio de prismas. Otra
tecnología que puede ser usada como fuente de imágenes completas es
la de sistemas formadores de imágenes a partir de sensores de
múltiples pozos (Merrill, US Patent 5,965,875, 1999) que se basa en
integrar en un único sensor distintas capas, cada una de ellas
sensible a una banda espectral. Para el entrenamiento también es
posible utilizar imágenes denominadas multi o hiperespectrales que
recogen (por métodos variados) decenas o cientos de estrechas
bandas espectrales en cada pixel. El uso de estas imágenes requiere
el paso intermedio de agrupar bandas para dar lugar a canales de
color con respuesta espectral similar a las componentes de color
del sensor para el cual se desarrollan los filtros de predicción.
También es posible utilizar imágenes fotográficas tradicionales (de
emulsión) digitalizadas. Por último, se propone en esta invención
el uso de imágenes procedentes de sensores CFA, reescaladas a un
tamaño inferior de tal forma que en los nuevos pixeles se disponga
de información fiable (promediada) de los tres canales de
color.
En cuanto al contenido de las imágenes de
entrenamiento, se debe tener en cuenta que los filtros predictores
funcionarán tanto mejor cuanto más se parezca la estadística de la
imagen en mosaico a procesar a la estadística utilizada en el
entrenamiento.
Como solución más genérica se recomienda
utilizar para el entrenamiento un conjunto variado de imágenes
naturales. Los resultados, considerados de forma global sobre un
conjunto variado de imágenes de prueba, no dependen
significativamente de la selección del conjunto de imágenes de
entrenamiento, siempre que este sea también suficientemente variado
y amplio. Esto es algo que se ha comprobado en distintas pruebas
realizadas durante el desarrollo de la presente invención.
Por otro lado, para cada imagen individual, si
se realiza una selección de las imágenes de entrenamiento con una
estadística espacial-cromática similar a la de la
imagen en mosaico a procesar, se obtienen mejoras apreciables. En la
práctica esto es especialmente útil en el caso de que se conozca
a priori el tipo de imagen o la escena en la que se van a
tomar las imágenes (entornos industriales, estudios, cámaras de
propósitos específicos, fijas). En esas condiciones, es útil
seleccionar imágenes de entrenamiento del mismo tipo que las
imágenes tomadas por la cámara.
Usando la misma idea, en algunas ocasiones puede
ser prioritaria la reconstrucción óptima de algunos objetos o
escenas de especial interés. En ese caso conviene usar una
estadística procedente del entrenamiento con ese tipo de objetos. La
calidad en la reproducción de estos objetos aumentará, a costa de
posibles pérdidas en la calidad general de la imagen.
Para estos demosaicos adaptados a la escena o
aplicación, conviene disponer a priori de los filtros de
predicción derivados de entrenamiento o modelos estadísticos de la
situaciones posibles, de forma se pueda pasar de una a otra sin
necesidad de realizar el entrenamiento cada vez.
Conviene recalcar que, en el caso de demosaico
conjunto con restauración de imagen, el entrenamiento incluye la
descripción del emborronamiento que se pretende corregir. Por
tanto, si fuera necesario corregir distintas cantidades (o tipos)
de emborronamiento, también sería necesario haber calculado a
priori, para una determinada correlación
espacial-cromática de las imágenes, los filtros
lineales óptimos para cada nivel y/o tipo de emborronamiento. Este
cálculo se puede realizar también de forma matemática, para una
cantidad de emborronamiento arbitraria, si se tiene una expresión
analítica tanto de la respuesta al impulso (PSF) como de la
correlación espacial cromática.
El caso extremo de demosaico adaptado es el de
utilizar la misma imagen en mosaico a procesar para realizar el
entrenamiento, en un proceso denominado autoentrenamiento. Para
obtener la imagen con contenido completo espacial y de color,
necesaria para extraer la estadística de la imagen, sería necesaria
una imagen paralela tomada con otro sensor sin mosaico. Como esto
no tiene sentido en la práctica, existen varias aproximaciones: Se
puede usar la misma imagen tras un demosaico genérico, o una
versión reducida (escalada) de la misma imagen en la que no se
realice interpolación sino promediado. En este último caso, para no
tener que asumir invarianza a escala, se puede usar otra imagen del
mismo motivo tomada con el mismo sensor desde más cerca de tal
forma que tras el escalado la estadística sea similar a la de la
imagen original.
Un objetivo adicional de la presente invención
es proporcionar un procedimiento para la obtención de forma directa
de los filtros de predicción lineal. A partir de la fórmula 3
X_{j} \approx D_{j} \tilde{X}_{j}, se obtiene D_{j} =
X_{j} (\tilde{X}_{j})^{#}, donde el operador # indica
la pseudoinversa de la matriz. Este acercamiento sigue siendo lineal
y mantiene el desdoblamiento en submosaicos locales, es
conceptualmente sencillo y fácil de implementar. Sin embargo, es
altamente ineficiente desde el punto de vista computacional.
La estimación lineal de error cuadrático medio
puede ser realizada en otros espacios de color distintos del
espacio en el cual se ha tomado o se va a mostrar la imagen final.
Esto puede suponer mejoras en distintos aspectos de la imagen
resultante. Esta transformación a nuevos espacios, dadas las
características del problema, sólo tiene sentido si la
transformación no es lineal. Típicamente (aunque no únicamente) se
utilizarán espacios del tipo Luminancia - Crominancia como por
ejemplo el Lab. En el nuevo espacio cada una de las muestras
originales (con o sin información) pasa a tener varias componentes,
cada una correspondiente a una de las nuevas componentes
cromáticas. Entonces cada una de las nuevas componentes cromáticas
puede estimarse bien como una combinación lineal de las componentes
vecinas observadas del mismo tipo, o como una combinación genérica
de todas las componentes vecinas. El coste computacional tanto del
entrenamiento como del demosaico en sí, aumenta en esta variante,
pero no se añade complejidad conceptual al método original.
Otra mejora al método propuesto consiste en la
utilización durante el proceso de optimización de una métrica no
lineal (por ejemplo S-CIELab \DeltaE_{ab}*) para
ponderar de acuerdo a su impacto perceptual el peso de los errores
de estimación, en sustitución de la métrica euclídea usada en la
versión original.
Tanto en la literatura científica como en la
literatura de patentes se describen multitud de métodos de
postprocesado de imágenes en mosaico interpoladas. Estos pretenden
corregir los errores residuales típicos que se producen en un
proceso de interpolación como es el de demosaico: aliasing y
artificios de color. El método objeto de esta invención puede ser
combinado con estos métodos de procesado para mejorar los
resultados. Es recomendable utilizar un postprocesado ligero desde
el punto de vista computacional para no perder ventajas clave de
esta invención, como la simplicidad y la rapidez.
Una mejora de la unidad de procesado descrita en
la presente invención, orientada a disminuir aún más su complejidad
y por tanto a reducir el tiempo de cálculo, es la descomposición de
los filtros de predicción lineal obtenidos, en filtros separables
(mediante la descomposición en valores singulares, SVD en sus siglas
inglesas). Se trata de descomponer cada filtro bidimensional como
suma de productos externos de filtros unidimensionales (filtros
separables, que se aplican a las filas y columnas de la imagen)
Tomando sólo las componentes más significativas de esta
descomposición se obtiene una aproximación que sólo supone una
pérdida marginal de calidad, mientras que se puede obtener una
reducción adicional sustancial del coste computacional.
Como se ha indicado, la presente invención puede
ser llevada a la práctica en forma de algoritmos que pueden ser el
motor de una unidad de demosaico tanto en forma de software como de
electrónica embebida o hardware de cámaras.
Una interesante aplicación de la versión
software es la utilización del método propuesto para realizar
ingeniería inversa de imágenes demosaicadas por electrónica
embebida o hardware de cámaras:
- -
- Recuperación del mosaico original: la mayoría de las imágenes digitales provienen de imágenes en mosaico, pero una vez realizado el revelado digital (demosaico y otros procesos) no se dispone de información sobre los datos originales o el proceso seguido. Esta información perdida puede ser útil en algunos casos. En concreto, la recuperación de la imagen en mosaico (o una buena aproximación) permite, por ejemplo, realizar un nuevo demosaico de mayor calidad. También puede tener interés en el área de la compresión de imágenes sin pérdidas, ya que una imagen RGB en mosaico ocupa tres veces menos que una imagen en color en mapa de bits y no supone una pérdida de información si la imagen proviene de ese mosaico.
- -
- Identificación del dispositivo o (familia de dispositivos) digital de captación con el que se obtuvo una imagen: aplicación de posible utilidad en entornos forenses (policiales o de inteligencia). Dado que las distintas cámaras incorporan distintos procesados, los filtros predictores lineales obtenidos de este proceso inverso pueden ser utilizados como firmas de los diferentes procesados y, por tanto, de los distintos dispositivos y modelos.
Se describe a continuación un método para la
detección del mosaico original a partir de una imagen proporcionada
por una cámara digital con mosaico, así como para el cálculo
aproximado de los filtros de interpolación utilizados para el
demosaico de la imagen observada.
Este método se basa en la suposición de que, o
bien el método de demosaico utilizado es lineal (en cuyo caso
pueden obtenerse sin error los filtros de interpolación lineal
utilizados), o bien, aún teniendo el demosaico una componente no
lineal, se cumple que la distorsión (medida como error cuadrático
medio) cometida aproximando la imagen observada (dimensión
N_{C} \times P, siendo N_{C} el número
de componentes cromáticas) con un subespacio de dimensión P
(número de pixeles) es mínima cuando las muestras de color elegidas
como base para ese subespacio son las del mosaico original. Esta
suposición resulta razonable cuando la interpolación realizada en
la etapa de demosaico tiene una fuerte componente lineal. Se ha
demostrado de forma empírica que este método da lugar a diferencias
sustanciales en las medidas de error que permiten una identificación
robusta de la fase original del mosaico, supuesto conocida la
estructura de este último. A continuación se describen los pasos de
este método:
1. Elegimos un tamaño N \times
N para la máscara de interpolación.
2. Para cada fase de mosaico posible, p =
1...J
- a.
- Para cada tipo de mosaico local posible, j = 1...J,
- i.
- Construimos la matriz de componentes de color de cada pixel no incluidas en el mosaico elegido, X_{j}^{p}
- ii.
- Construimos la matriz de componentes de color de las vecindades correspondientes a las componentes anteriores, \tilde{X}_{j}^{p}
- iii.
- La matriz que predice con mínimo error cuadrático medio X_{j}^{p} a partir de \tilde{X}_{j}^{p} es:
- donde C_{M}^{j,p} y C_{C}^{j,p} son los estimadores muestrales (calculados sobre la imagen completa observada) de las matrices de correlación espacio-color de los vectores de componentes de color del mosaico (M) y de correlación cruzada (C) entre los componentes de fuera del mosaico y los del mosaico, respectivamente, para las vecindades con submosaico j obtenidas asumiendo fase p para el mosaico global.
- iv.
- El error cuadrático medio mínimo en la aproximación para el tipo de vecindad j es:
- donde el subíndice "F" indica norma de Frobenius (suma de componentes al cuadrado).
- b.
- Calculamos el error total para la fase p: E_{p} = \sum\limits_{j=1}^{J} e_{j,p}^{2}
3. Elegimos la fase p^{\text{*}}
definida como p* = arg min E_{p}
{}\hskip7,1cm ^{p}
4. Las matrices de predicción estimadas para el
demosaico son, entonces:
La obtención de las matrices
D_{j}^{p\text{*}}, así como de los valores
e_{j,p\text{*}}^{2}, posiblemente con distintos tamaños de
ventana N, puede servir para caracterizar el demosaico
realizado y, por lo tanto, potencialmente, para identificar el
modelo y/o tipo de dispositivo utilizado para la obtención de la
imagen. Este es un problema clásico de clasificación, que se puede
abordar fácilmente, por ejemplo, utilizando un vector Gaussiano de
distribución entrenado con varias muestras de imágenes reales
tomadas con un conjunto de cámaras entre las que se quiere
discriminar.
Como caso práctico de realización de la
invención, se describe a continuación un posible procedimiento de
aplicación, llevado a cabo para un sensor de tipo CCD con el CFA de
tipo Bayer (Bayer, U.S. Patent 3,971,065, 1976) con filtros rojos,
verde y azul (RGB), que se muestra en la figura 5. Para el
entrenamiento se utilizó una selección de las imágenes del
"Eastman Kodak® photographic color image database (1993)"
-imágenes bien conocidas en la literatura de demosaico- en formato
512 x 768 pixeles, RGB. Es de destacar que estas imágenes proceden
de la digitalización de película fotográfica de emulsión, pero la
escala utilizada es suficientemente grande y el grano fotográfico
no se aprecia. (Otra forma simple de obtener este conjunto de
entrenamiento podría ser usar imágenes digitales procedentes de un
sensor FOVEON. Existen incluso algunas colecciones de imágenes a la
venta). La figura 4 muestra un perfil radial promedio de la
estadística conjunta espacial cromática estimada a partir de este
conjunto de imágenes, para cada uno de los seis pares de colores
posibles: RB(19), RG (20), GB (21), BB (22), RR (23), GG
(24). Cuando se considera una única componente de color, se aprecia
un alto factor de (auto) covarianza entre pixeles vecinos (22, 23 y
24). El factor de covarianza decrece con la distancia entre
píxeles. Entre componentes de color, el factor de covarianza
(cruzada) es menor y también decrece con la distancia (19, 20 y
21).
Para el caso en el que no hay o no se quiere
compensar emborronamiento, se siguen los cálculos de la sección
2.2, teniendo en cuenta que en este caso particular hay 3
componentes de color (N_{C} = 3) y existen 4 componentes de
color en el patrón de muestreo básico (25) y por tanto existen 4
submosaicos locales (J =4) (26, 27, 28, 29).
Se estima C_{xx} y se derivan los 4 D_{j} estimadores lineales correspondientes en los que se desdobla el problema. Como cada uno de ellos ha de predecir dos de las tres componentes de color existentes, se obtienen un total de (N_{C} -1) \times J = 8 filtros bidimensionales. Para un tamaño de vecindad de 9 píxeles (N = 9), cada filtro predictor tiene una dimensión N^{2} = 81. Los filtros predictores resultantes fueron aplicados a imágenes en formato de negativo digital (formatos crudo o RAW) obtenidas en varias cámaras fotográficas digitales de gama profesional. La comparación visual directa entre las imágenes resultantes de la unidad de procesado objeto de esta invención y las procesadas con herramientas disponibles comercialmente muestra una mayor nitidez favorable a este procedimiento. Para extraer resultados numéricos se comparó nuestra unidad de demosaico con otras (cuatro de ellas descritas recientemente en la literatura científica y otras dos utilizadas frecuentemente como referencia) que fueron implementadas en la misma plataforma (MATLAB® sobre un Pentium IV, 2.39 GHz) con un nivel similar de eficiencia computacional del
código.
Se estima C_{xx} y se derivan los 4 D_{j} estimadores lineales correspondientes en los que se desdobla el problema. Como cada uno de ellos ha de predecir dos de las tres componentes de color existentes, se obtienen un total de (N_{C} -1) \times J = 8 filtros bidimensionales. Para un tamaño de vecindad de 9 píxeles (N = 9), cada filtro predictor tiene una dimensión N^{2} = 81. Los filtros predictores resultantes fueron aplicados a imágenes en formato de negativo digital (formatos crudo o RAW) obtenidas en varias cámaras fotográficas digitales de gama profesional. La comparación visual directa entre las imágenes resultantes de la unidad de procesado objeto de esta invención y las procesadas con herramientas disponibles comercialmente muestra una mayor nitidez favorable a este procedimiento. Para extraer resultados numéricos se comparó nuestra unidad de demosaico con otras (cuatro de ellas descritas recientemente en la literatura científica y otras dos utilizadas frecuentemente como referencia) que fueron implementadas en la misma plataforma (MATLAB® sobre un Pentium IV, 2.39 GHz) con un nivel similar de eficiencia computacional del
código.
Las imágenes de prueba fueron imágenes con
contenido completo RGB en las que se había simulado el mosaico. Se
comparó el resultado de cada unidad de demosaico con la imagen real
con una métrica S-CIELab (\DeltaE_{ab}*), que
tiene en cuenta la relevancia perceptual de los errores
(considerando una visualización de la imagen de 72 puntos por
pulgada observada a 18 pulgadas de distancia). La figura 6 muestra
los resultados de error frente al tiempo necesario para completar el
procesado de la imagen. Los métodos con los que se compara el
objeto de la invención (círculos), se pueden agrupar en dos clases
amplias: "Alta velocidad, baja calidad" y "Baja velocidad,
alta calidad". Este nuevo método (cuadrado) (30), debido a su
simplicidad podría por velocidad agruparse con los primeros, y por
prestaciones con los segundos.
Para el caso de demosaico con compensación de
emborronamiento, se simuló desenfoque con un filtro gaussiano
isotrópico con sigma = 3, tras el cual se aplicó ruido de
cuantificación correspondiente a 8 bits. Siguiendo la descripción
matemática de la sección 2.3, con los mismos parámetros descritos
anteriormente excepto que en este caso se usó
N = 15, se obtuvieron 12 predictores lineales (N_{C} \times J = 12). La figura 7 muestra el resultado de la unidad de demosaico con compensación de emborronamiento. Se observa que la imagen tras aplicación de demosaico y compensación de emborronamiento de forma simultánea y en un único filtrado (32), muestra mayor detalle incluso que la imagen de entrada previa al mosaico (imagen emborronada y con ruido) (31).
N = 15, se obtuvieron 12 predictores lineales (N_{C} \times J = 12). La figura 7 muestra el resultado de la unidad de demosaico con compensación de emborronamiento. Se observa que la imagen tras aplicación de demosaico y compensación de emborronamiento de forma simultánea y en un único filtrado (32), muestra mayor detalle incluso que la imagen de entrada previa al mosaico (imagen emborronada y con ruido) (31).
La invención puede llevarse a cabo sobre una
plataforma software con un control gradual que permita en tiempo
real modificar los parámetros de grado de desenfoque de la imagen y
de la cantidad de ruido, de tal forma que el usuario seleccione
visualmente los parámetros que proporcionan la mejor imagen
final.
Figura 1. Esquema simple de una cámara de estado
sólido que incorpora la presente invención. Dicha cámara digital
contiene un cuerpo de cámara (1) que soporta un sistema óptico (2)
que forma una imagen sobre un sensor (3). El sensor está formado
por una matriz de fotodetectores (4) sobre la que hay una matriz de
filtros de color (CFA, color array filter) (5), que filtra
espectralmente la luz que le llega a cada detector individual. La
matriz de filtros de color esta diseñada de manera que separa la
imagen en componentes de color (típicamente rojo (R), verde (G) y
azul (B)), de forma periódica, con un determinado patrón de
mosaico.
Es necesaria una electrónica de lectura y
procesado de las señales eléctricas (6). Un conversor
analógico-digital da lugar al fotograma digital, que
en esta etapa es una única imagen en mosaico, que será almacenada
en una memoria o dispositivo de registro (7). La formación de la
imagen final (10) requiere el procesado (8) de esta imagen en
mosaico que comprende, además del balance de blancos y otros
tratamientos como compresión, la unidad de demosaico objeto de esta
invención (9). La unidad de demosaico interpola la imagen original
(en mosaico), en la cual en cada pixel solo hay información de una
componente de color, para obtener en cada pixel contenido completo
de color, y por lo tanto contenido completo espacial y de color en
toda la imagen, imagen final (10).
Figura 2. Proceso de demosaico para una imagen
con componentes RGB (siglas inglesas para Rojo, Verde y Azul), a
modo de ejemplo. Si la imagen en mosaico (11) se desdobla en las
capas correspondientes a las componentes de color existentes, en
cada capa (rojo 12, verde 13 y azul 14) aparecen huecos. La unidad
de demosaico (15) llena estos huecos por interpolación para dar
lugar a una imagen en la que cada capa de color está completa (16,
17 y 18).
Figura 3. Esquema general del proceso de
demosaico propuesto en la presente invención. El proceso consta de
tres fases, la fase 1 en la que se estudia la estadística de las
imágenes naturales, la fase 2 en las que a partir de un conjunto de
imágenes, que llamaremos imágenes de entrenamiento, hallamos el
conjunto de filtros óptimos de predicción lineal y por último, la
fase 3 en las que se utiliza este conjunto para obtener a partir de
la imagen en mosaico, la imagen final con contenido completo
espacial y de color.
Figura 4. Ilustración, a modo de ejemplo, de los
factores de covarianza, medida entre componentes de color de una
imagen con componentes de color RGB, en función de la distancia en
pixeles (curvas de la 19 a 24). R, G y B están representados por
símbolos "+", "o" y "x" respectivamente. En las tres
curvas de inferiores (19, 20, 21) se superponen símbolos distintos
expresando covarianza-cruzada mientras que en las
superiores (22, 23, 24) la superposición de símbolos iguales
expresa auto-covarianza.
\newpage
Figura 5. Ejemplo de Matriz de Filtros de Color
de tipo Bayer. Tres componentes de color posibles (N_{C} =
3). 25: Patrón de mosaico básico con cuatro elementos (J =
4). 26, 27, 28, 29: Los cuatro tipos de vecindades posibles, para
una ventana N = 5.
Figura 6. Muestra los resultados de error frente
al tiempo necesario para completar el procesado de la imagen.
Métodos con los que se compara el objeto de la invención (círculos)
y el nuevo método propuesto en esta invención (cuadrado) (30).
Figura 7. Muestra el resultado de la unidad de
demosaico con compensación de emborronamiento. Se observa que la
imagen tras aplicación de demosaico y compensación de
emborronamiento de forma simultánea y en un único filtrado (32),
muestra mayor detalle incluso que la imagen de entrada previa al
mosaico (imagen emborronada y con ruido) (31).
Claims (18)
1. Procedimiento de demosaico por predicción
lineal óptima basado en la estadística conjunta
espacio-color de imágenes naturales para obtener una
imagen con contenido completo espacial y de color en sensores de
imagen de tipo mosaico, que comprende las siguientes fases:
- a.
- Estudio previo en una o más imágenes naturales de entrenamiento con contenido completo de color (todas las componentes de color en cada uno de los píxeles) de la correlación conjunta espacio-color típica.
- b.
- Obtención de un conjunto de filtros óptimos de predicción lineal (D), óptimos en un sentido de mínimos cuadrados, entre la lectura del sensor y la imagen completa, para cada una de las componentes de color posibles y cada uno de los tipos de vecindad presentes en el mosaico.
- c.
- Uso de dichos filtros de predicción para reconstrucción de la imagen completa (demosaico de la imagen procedente del sensor).
2. Método para el cálculo del conjunto de
filtros de predicción D a partir de estimadores muestrales de
correlación espacial y de color en imágenes de entrenamiento según
la reivindicación anterior que comprende las siguientes
fases:
fases:
- a.
- Para cada pareja de colores y posiciones espaciales posibles dentro de la vecindad considerada (N \times N) cálculo de la correlación muestral espacial cromática C_{xx}, usando los píxeles (R,G,B) completos de las imágenes de entrenamiento.
- b.
- Desdoblamiento del problema para cada una de las J vecindades (submosaicos) posibles.
- c.
- Ordenando adecuadamente los coeficientes C_{xx}, anteriores, cálculo de la matriz de correlación cruzada C^{j}_{C} entre elementos de color cualesquiera de la vecindad completa (3N^{2} elementos, siendo N^{2} el numero de píxeles de la vecindad) y elementos del mosaico de la vecindad j (N^{2} elementos), por un lado, y cálculo de la matriz de correlación de dichos elementos del mosaico en la vecindad j, C^{j}_{M}, por otro.
- d.
- Cálculo de los filtros de predicción lineales óptimos para cada una de las J vecindades (submosaicos) mediante la fórmula:
3. Método para el cálculo, del conjunto de
filtros D a partir del cálculo directo de la matriz pseudoinversa,
según la reivindicación 1, consistente en:
- a.
- Simulación de un mosaico a partir de la imagen completa para cada una de las imágenes de entrenamiento.
- b.
- Obtención del filtro de predicción lineal óptimo para cada tipo de vecindad (submosaico), ajustando por mínimos cuadrados (pseudoinversa) los valores conocidos (imágenes de entrenamiento) como combinaciones lineales de las observaciones (imágenes de mosaico).
4. Utilización del procedimiento de demosaico
por predicción lineal óptima, según reivindicaciones anteriores,
adaptado a una sóla imagen y aplicando el conjunto de filtros de
predicción D_propia obtenido con entrenamiento sobre una sóla
imagen, para conseguir un resultado óptimo en imágenes de
estadística similar a la usada en dicho entrenamiento.
5. Utilización del procedimiento de demosaico
por predicción lineal óptima, según reivindicaciones anteriores,
adaptado a un tipo de imágenes y aplicando el conjunto de filtros
de predicción D_adaptado obtenido con entrenamiento sobre un
conjunto determinado de imágenes naturales, para conseguir un
resultado óptimo en imágenes de estadística similar a las usadas en
dicho entrenamiento.
6. Utilización del procedimiento de demosaico
por predicción lineal óptima, según reivindicaciones anteriores,
aplicando el conjunto de filtros de predicción D_global obtenido
con entrenamiento sobre imágenes naturales convencionales, para
conseguir un resultado óptimo en imágenes en general.
7. Método para el cálculo por iteración de una
aproximación a la D_propia de una imagen, llamada
D_autoentrena-
miento, según reivindicaciones anteriores y basado únicamente en la información disponible del sensor, que comprende las siguientes fases:
miento, según reivindicaciones anteriores y basado únicamente en la información disponible del sensor, que comprende las siguientes fases:
- a.
- Obtención de una primera aproximación a la imagen completa por medio del demosaico de la imagen con las matrices D_adaptada o D_global descritas en las reivindicaciones 6 ó 7
- b.
- Uso de la estadística espacio-color de esa imagen o una versión modificada de la misma, por ejemplo espacialmente escalada, para el cálculo de su D_propia según reivindicación 5. Esa D_propia, por proceder de la misma imagen, pasará a llamarse D_autoentrenamiento, y podrá ser utilizada para el demosaico de la imagen original.
\vskip1.000000\baselineskip
8. Método para realizar el cálculo del conjunto
de filtros de predicción óptimos en un sentido de mínimos
cuadrados, según reivindicaciones 1, 2, ó 7 caracterizado
por utilizar métricas visuales que minimicen el impacto visual de
los artificios de demosaico.
9. Un método para realizar el cálculo de los
filtros de predicción óptimos en un sentido de mínimos cuadrados,
según reivindicaciones 1, 2, ó 7, caracterizado por utilizar
una transformación no-lineal previa a un espacio de
color en el cual la estadística espacio-color esté
menos correlacionada.
10. Método para acelerar la implementación del
filtrado de predicción lineal según las reivindicaciones 4, 5, ó 6,
caracterizado por aproximar los filtros predictores como
suma de un conjunto reducido de filtros separables en las
componentes vertical y horizontal, utilizando la descomposición en
valores singulares (SVD).
11. Método para realizar restauración de
imágenes degradadas por ruido y desenfoques moderados a la vez que
demosaico, mediante el cálculo de los filtros de predicción óptimos
en un sentido de mínimos cuadrados entre imágenes degradadas e
imágenes libres de degradación que comprende las siguientes
fases:
- a.
- Estimación muestral de la matriz de correlación cruzada (C_{xy}) entre imágenes originales (x) e imágenes con degradación simulada (y).
- b.
- Estimación muestral de la matriz de correlación de los elementos de las imágenes degradadas (C_{yy}).
- c.
- Obtención, para cada tipo de vecindad, de la matriz de correlación cruzada C^{j}_{C} reordenando términos de C_{xy}.
- d.
- Obtención, para cada tipo de vecindad, de la matriz de correlación de las observaciones en el mosaico C^{j}_{M} reordenando términos de la matriz C_{yy}.
- e.
- Cálculo de los filtros de predicción lineales óptimos para cada una de las J vecindades (submosaicos) mediante la fórmula:
\vskip1.000000\baselineskip
12. Dispositivo para la captación de imágenes
digitales caracterizado por llevar implementados los métodos
según reivindicaciones anteriores.
13. Cámara digital caracterizada por
incorporar los métodos descritos en las reivindicaciones 1 a
11.
14. Utilización del procedimiento de demosaico
por predicción lineal óptima, según reivindicaciones anteriores en
un soporte que permita interpolar el mosaico, con compensación de
desenfoque y emborronamiento, de imágenes RAW, que permita
modificar los parámetros de estadística conjunta
espacio-color de las imágenes, grado de desenfoque
de la imagen y de la cantidad de ruido para la obtención de la
mejor imagen final.
15. Método para obtener la imagen en mosaico
original (o una aproximación de la misma) a partir de la selección
de la fase o desplazamiento para una estructura de mosaico dada, que
comprende los siguientes pasos:
- a.
- Obtención de los J mosaicos posibles, de acuerdo a sus fases.
- b.
- Obtención del las matrices de predicción lineal óptima para cada una de las J fases, según reivindicación 2, pero en lugar de usar datos de entrenamiento con otras imágenes, usando una matriz de correlación muestral espacio-color obtenida únicamente con la imagen completa observada.
- c.
- Obtención de la aproximación lineal óptima (demosaico), usando las matrices de predicción del punto anterior, para cada una de las J fases.
- d.
- Obtención del error cuadrático (suma de diferencias al cuadrado con el original) en el demosaico para cada fase.
- e.
- Elección de la fase que proporciona el menor error cuadrático.
\newpage
16. Método para la detección del tipo de mosaico
de filtros de color que tenía el sensor que tomó una imagen digital,
que comprende los siguientes pasos:
- a.
- Obtención del error cuadrático para la fase óptima de cada una de las estructuras de mosaico candidatas, según reivindicación 15.
- b.
- Selección de la estructura de mosaico que proporcione menor error cuadrático.
\vskip1.000000\baselineskip
17. Método para el cálculo del conjunto de
filtros de predicción D que permite la mejor aproximación lineal a
la imagen observada, a partir de la imagen en mosaico original que
comprende los siguientes pasos:
- a.
- Identificación de la estructura del mosaico, a partir de un conjunto de estructuras candidatas, según reivindicación 16.
- b.
- Identificación de la fase del mosaico según reivindicación 15.
- c.
- Selección de los filtros de predicción correspondientes a la fase elegida en el método descrito en la reivindicación 15.
\vskip1.000000\baselineskip
18. Utilización del procedimiento de cálculo del
conjunto de filtros de predicción D que permite la mejor
aproximación lineal a la imagen observada, según reivindicaciones
15 a 17, para la estimación de las probabilidades respectivas de
que la imagen digital observada haya sido capturada con un conjunto
de modelos de dispositivos de captura de imagen digital.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ES200502100A ES2301292B1 (es) | 2005-08-19 | 2005-08-19 | Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ES200502100A ES2301292B1 (es) | 2005-08-19 | 2005-08-19 | Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. |
Publications (2)
Publication Number | Publication Date |
---|---|
ES2301292A1 ES2301292A1 (es) | 2008-06-16 |
ES2301292B1 true ES2301292B1 (es) | 2009-04-01 |
Family
ID=39469660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES200502100A Active ES2301292B1 (es) | 2005-08-19 | 2005-08-19 | Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. |
Country Status (1)
Country | Link |
---|---|
ES (1) | ES2301292B1 (es) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020167602A1 (en) * | 2001-03-20 | 2002-11-14 | Truong-Thao Nguyen | System and method for asymmetrically demosaicing raw data images using color discontinuity equalization |
US20030169353A1 (en) * | 2002-03-11 | 2003-09-11 | Renato Keshet | Method and apparatus for processing sensor images |
US7133553B2 (en) * | 2003-02-18 | 2006-11-07 | Avago Technologies Sensor Ip Pte. Ltd. | Correlation-based color mosaic interpolation adjustment using luminance gradients |
US7916940B2 (en) * | 2004-01-31 | 2011-03-29 | Hewlett-Packard Development Company | Processing of mosaic digital images |
-
2005
- 2005-08-19 ES ES200502100A patent/ES2301292B1/es active Active
Also Published As
Publication number | Publication date |
---|---|
ES2301292A1 (es) | 2008-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khashabi et al. | Joint demosaicing and denoising via learned nonparametric random fields | |
CN111194458A (zh) | 用于处理图像的图像信号处理器 | |
US10147167B2 (en) | Super-resolution image reconstruction using high-frequency band extraction | |
CN110463197B (zh) | 增强立体相机成像系统中的空间分辨率 | |
TW202042550A (zh) | 用於轉換非拜耳圖案彩色濾光器陣列影像資料之系統及方法 | |
CN101521751B (zh) | 摄像设备 | |
JP5306563B2 (ja) | 撮像装置及び画像生成方法 | |
KR20100042957A (ko) | 고감도 컬러 영상을 제공하기 위한 영상 처리 장치 및 방법 | |
JP2017502598A (ja) | デモザイク化の方法 | |
WO2003047234A2 (en) | System and method for providing multi-sensor super-resolution | |
US9336570B2 (en) | Demosaicking system and method for color array based multi-spectral sensors | |
Hore et al. | An edge-sensing generic demosaicing algorithm with application to image resampling | |
Su | Highly effective iterative demosaicing using weighted-edge and color-difference interpolations | |
Simpkins et al. | An introduction to super-resolution imaging | |
De Lavarène et al. | Practical implementation of LMMSE demosaicing using luminance and chrominance spaces | |
KR100565429B1 (ko) | 컬러 필터 어레이에서 손실된 컬러값 복원 방법 및 장치 | |
Wu et al. | Color demosaicking with sparse representations | |
Paul et al. | Maximum accurate medical image demosaicing using WRGB based Newton Gregory interpolation method | |
US10360661B2 (en) | Determining multispectral or hyperspectral image data | |
Karch et al. | Robust super-resolution by fusion of interpolated frames for color and grayscale images | |
ES2301292B1 (es) | Metodo de prediccion lineal optima para la reconstruccion de la imagen en camaras digitales con sensor de mosaico. | |
JP2008160210A (ja) | 情報処理方法および撮像装置 | |
Azgin et al. | A high performance alternating projections image demosaicing hardware | |
Lee et al. | Adaptive demosaicing algorithm using characteristics of the color filter array pattern | |
Chung et al. | Enhanced integrated gradient and its applications to color demosaicing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EC2A | Search report published |
Date of ref document: 20080616 Kind code of ref document: A1 |