ES2212235T3

ES2212235T3 - Procedimiento de produccion de datos cartograficos por estereovision.

Info

Publication number: ES2212235T3
Application number: ES98402025T
Authority: ES
Inventors: Nicolas Ayache; David Canu; Jacques Ariel Sirat
Original assignee: EADS Systems and Defence Electronics SAS
Current assignee: Airbus DS SAS
Priority date: 1997-08-12
Filing date: 1998-08-10
Publication date: 2004-07-16
Anticipated expiration: 2018-08-10
Also published as: EP0897163B1; FR2767404A1; EP0897163A1; CA2245044C; FR2767404B1; CA2245044A1; US6175648B1

Abstract

EL PROCEDIMIENTO PROPORCIONA DATOS CARTOGRAFICOS EN TRES DIMENSIONES A PARTIR DE N IMAGENES A DOS DIMENSIONES DE LA ESCENA, PROPORCIONADOS POR N DETECTORES CON PUNTOS DE VISTA DIFERENTES. SE CALIBRA CADA DETECTOR PARA ESTIMAR LOS PARAMETROS DE LOS N MODELOS F I (X,Y,Z) QUE DEFINEN LA RELACION ENTRE LAS COORDENADAS X,Y,Z DE UN PUNTO DE LA ESCENA Y LAS COORDENADAS (P,Q) I DE SU PROYECCION EN LA IMAGEN J, SE PONE EN CORRESPONDENCIA CADA UNO DE LOS N-1 PARES DE IMAGENES (LLEVANDO TODAS ELLAS UNA MISMA IMAGEN DE REFERENCIA), BUSCANDO EL HOMOLOGO DE CADA PIXEL DE LA IMAGEN DE REFERENCIA A LO LARGO DEL EPIPOLAR CORRESPONDIENTE DE LA OTRA IMAGEN DEL PAR; EN CADA PAR DE DOS IMAGENES Y PARA CADA PIXEL DE LA IMAGEN DE REFERENCIA, SE ESTABLECE UNA CURVA DE SIMILITUD EN FUNCION DE LA DISPARIDAD, A LO LARGO DEL EPIPOLAR DE LA OTRA IMAGEN; SE LLEVAN TODAS LAS CURVAS EN UN REFERENCIAL COMUN; SE EFECTUA LA SUMA DE LAS CURVAS, Y SE RETIENE EL PICO MAS ELEVADO DE LA CURVA RESULTANTE; Y FINALMENTE SE CALCULANLAS COORDENADAS X,Y,Z A PARTIR DE LA DISPARIDAD DEL PICO Y DE LOS PARAMETROS DE LOS N MODELOS.

Description

Procedimiento de producción de datos cartográficos por estereovisión.

La presente invención se refiere a los procedimientos de producción de datos cartográficos en tres dimensiones a partir de n imágenes en dos dimensiones de una escena, proporcionadas por n sensores que tienen unos puntos de vista diferentes de la escena.

Se sabe desde hace largo tiempo definir la posición en el espacio de estructuras presentes en una escena y visibles en dos imágenes tomadas bajo diferentes ángulos de vista, por unas técnicas estereoscópicas. Este procedimiento ha sido generalizado en el caso de n imágenes, siendo n un entero superior a 2, constituyendo estas n imágenes un sistema estereoscópico con varias líneas de base.

Se conocen en particular unos procedimientos que comprenden las etapas siguientes:

-: se calibran los n sensores (utilizando el conocimiento 3D de su posición relativa con respecto a la escena observada y/o unos procedimientos de reconocimiento de formas, de manera que se dispongan unos parámetros de n modelos F_{i}(x,y,z) que definen cada uno la relación entre un punto de la escena, de coordenadas x, y, z, y las coordenadas (p,q)_{i} de su proyección en cada una de las n imágenes, para i que va de 1 a n;

-: se ponen en correspondencia las n imágenes, de manera que se localicen en las imágenes las coordenadas de la proyección de un mismo punto en el espacio en tres dimensiones;

-: se efectúa una reconstrucción 3D, que consiste en obtener las coordenadas x, y y z del punto 3D correspondiente a cada emparejamiento entre imágenes, a partir del conocimiento de los módulos F_{i} y de los puntos de imágenes emparejados.

Un procedimiento de este tipo se describe en el artículo de Sing Bing Kang et al. "A Multibaseline Stereo System with Active Illumination and Real-Time Acquisition", Proceedings IEEE Int. Conf. on Computer Vision, páginas 88-93, junio 1995 (ver también la referencia [13] citada en el artículo: Masataski Okutorni et al. "A multiple baseline stereo", IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 15., nº 4, Abril 1995, pp. 353-363). El procedimiento propuesto en este artículo utiliza cuatro cámaras cuyos ejes ópticos convergen aproximadamente en un mismo punto. La imagen proporcionada por una de las cámaras se elige como referencia. Dado que los ejes de las cámaras no son paralelos, las líneas epipolares asociadas no son paralelas a las líneas de las imágenes. Para simplificar la restitución de la altitud a partir de las imágenes estereoscópicas, es decir la reconstrucción en 3D, las imágenes son sometidas a una rectificación que transforma cada par de imágenes de origen en otro par tal que las líneas epipolares que resultan de él sean paralelas, iguales y confundidas con las líneas de las imágenes. El modo de puesta en correspondencia utiliza una variable \lambda, definida como la distancia al centro óptico, según el eje de visión que pasa por el centro óptico de la cámara de referencia y el punto considerado, para calcular la zona de búsqueda de homólogos potenciales en las imágenes a emparejar con la imagen de referencia. La utilización de esta variable \lambda conduce inevitablemente a un modelo de paso no lineal entre las imágenes, lo que complica los cálculos. La estrategia enseñada por el artículo, consistente en asignar una importancia igual a cada par, es fuente de error cada vez que unos puntos son enmascarados en una o en varias de las imágenes.

Un estudio detallado de algoritmos de fusión de varias representaciones para restituir unos datos cartográficos 3D a partir de varias imágenes 2D de una escena, se da en la tesis de la Universidad de Paris Sud, Centre d'Orsay, mayo 1988 "Construction et Fusion de Répresentations Visuelles 3D: Applications à la Robotique Mobile" de N. Ayache.

La presente invención prevé proporcionar un procedimiento de producción de datos cartográficos que responda mejor que los anteriormente conocidos a las exigencias de la práctica, en particular porque facilita la puesta en correspondencia multipares de n imágenes (siendo n un entero superior a 2) y es suficientemente flexible para adaptarse sin dificultad a numerosos campos, tales como:

-: la detección de obstáculos y el guiado autónomo de un robot móvil, en una escena fija,

-: la modelización 3D de lugares reales,

-: la cartografía,

-: el reconocimiento aéreo, que permite obtener un perfil del terreno,

-: la modelización de trayectorias óptimas, cuando tiene lugar la preparación de una misión aérea.

Para ello, el procedimiento utiliza en particular la constatación de que, cualquiera que sea la naturaleza de los sensores (estenotipos, varilla de lugares fotodetectores, sensor de barrido) y su posición relativa en el momento de la adquisición de las imágenes (a condición de que sean estereoscópicas y que haya un recubrimiento entre varias imágenes) siempre se puede expresar las n-1 curvas de parecido, que corresponden cada una a un par de imágenes de las cuales una imagen de referencia única, en función de la disparidad, definida en un par cualquiera: para ello, se efectúa un cambio de referencial de las curvas de parecido, siempre que puede ser realizado por un modelo afín de paso de la disparidad de un par a la de otro par.

La disparidad podrá ser asimilada en general a la abscisa curvilínea de un punto con respecto a otro a lo largo de la epipolar; la misma puede ser medida en píxeles en el caso frecuente de una imagen representada por unos puntos elementales afectados cada uno de por lo menos un valor radiométrico (luminancia y/o crominancia).

La invención propone en particular un procedimiento de producción de datos cartográficos en tres dimensiones a partir de n imágenes en dos dimensiones de la escena, proporcionadas por n sensores con unos puntos de vista diferentes, siendo n un entero superior a 2, según el cual:

a): se calibra cada sensor de orden i para estimar los parámetros de los n modelos F_{i}(x,y,z) que definen la relación entre las coordenadas x, y, z de un punto de la escena y las coordenadas (p,q)_{i} de su proyección en la imagen i entre las n imágenes;

b): se ponen en correspondencia cada uno de los n-1 pares de imágenes que comprenden todas una misma imagen de referencia elegida entre las n imágenes, buscando el homólogo de cada píxel o zona de la imagen con referencia a lo largo de la epipolar correspondiente de la otra imagen del par;

c): en cada uno de los n-1 pares de dos imágenes que comprenden cada una una imagen de referencia y para cada píxel o zona de la imagen de referencia, se establece una curva de parecido (curva de variación de un índice de similaridad) en función de la disparidad, a lo largo de la epipolar de la otra imagen;

d): se llevan todas las curvas a un referencial común, por un modelo por ejemplo afín, para emparejar el mayor número posible de imágenes;

e): se efectúa la suma de las curvas, eliminando eventualmente cada pico situado en una disparidad singular con respecto al de todas las otras curvas y se retiene el pico más elevado de la curva resultante; y

f): se calculan las coordenadas x, y, z a partir de la disparidad del pico retenido y de los parámetros de los n modelos F_{i}(x,y,z).

También es posible calcular varias imágenes de disparidad tomando diferentes imágenes como referencia. La fusión puede efectuarse después del cálculo de las coordenadas en tres dimensiones; la misma puede efectuarse también a nivel de las imágenes de disparidad, lo cual es una solución ventajosa cuando los sensores están calibrados en un espacio proyectivo.

La fusión de los resultados de puesta en correspondencia multipares puede ser realizada con la ayuda de una votación mayoritaria, asignando un coeficiente de ponderación más elevado a los picos que corresponden a los puntos de vista más distantes en la imagen de referencia.

El procedimiento que acaba de ser descrito permite eliminar en la mayor parte de los casos las dificultades encontradas para encontrar con seguridad el homólogo de un punto de la imagen en una o varias otras imágenes. La utilización de un número n superior a 2 permite eliminar las consecuencias de una ocultación en una o varias imágenes. La coherencia geométrica de los emparejamientos múltiples reduce los errores y eleva las ambigüedades. La presencia de imágenes que tienen unos puntos de vista próximos permite tratar unas imágenes parecidas que tienen poca ocultación entre ellas; la utilización de imágenes que tienen unos puntos de vista distantes permite obtener una información 3D precisa.

Las características anteriores, así como otras, aparecerán mejor con la lectura de la descripción que sigue de modos particulares de realización de la invención, dados a título de ejemplo no limitativo. La descripción se refiere a los planos que la acompañan, en los cuales:

- la figura 1 es un esquema que representa una disposición posible de los sensores y que muestra la función de la rectificación;

- la figura 2 muestra el principio de los emparejamientos de un punto por búsqueda sobre unas porciones de epipolar;

- la figura 3 muestra unos ejemplos de curvas de variación de un índice de parecido en función de la disparidad;

- la figura 4 representa un ejemplo de esquema de explotación de las imágenes en el marco del emparejamiento multiimágenes;

- la figura 5 muestra un procedimiento de fusión de los tratamientos multiimágenes;

- la figura 6 muestra un modo de referenciado de curvas de parecido con respecto a un plano; y

- las figuras 7A y 7B, que muestran unas curvas de parecido en función de la disparidad, muestran el interés de una selección de las curvas.

Se describirá en primer lugar la arquitectura general del procedimiento, que es conservada cualquiera que sea la aplicación, antes de prever unos casos particulares. Para simplificar, las partes ya bien conocidas del procedimiento según la invención sólo serán brevemente recordadas y se podrá hacer referencia a los documentos ya mencionados así como:

-: en lo que concierne al caso simple de sensores de tipo estenotipado, todos idénticos, que proporcionan unas imágenes adquiridas en unas posiciones coplanarias, a la misma altitud, al artículo de R. Y. Tsai "Multiframe Image Point Matching and 3-D Surface Reconstruction" IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-5, nº 2, páginas 159-164, marzo 1983;

-: en lo que concierne a la cartografía a partir de planos de imágenes aéreas numéricas calibradas, al artículo de L. Gabet et al. "Construction Automatique de Modèle Numérique de Terrain à Haute Résolution en Zone Urbaine", Bul. SFPT nº 135, páginas 9-25, 1994.

El procedimiento según la invención comprende tres fases esenciales.

-: el calibrado de los sensores (etapa (a) anterior);

-: la puesta en correspondencia o emparejado de las imágenes, que implica la fusión de por lo menos n resultados de puesta en correspondencia multipares, siendo estos resultados los planos de disparidad directamente obtenidos o unos modelos numéricos de elevación (MNE) calculados a partir de estos últimos,

-: la reconstrucción 3D (etapa (f)).

Estas tres fases serán descritas sucesivamente.

Calibrado

El calibrado de los sensores tiene por objetivo proporcionar una estimación de los parámetros de los modelos F_{1}(x,y,z) y F_{i} (x,y,z) que definen la relación entre las coordenadas x, y, z de un punto 3D de la escena y las coordenadas 2D (p,q) de su proyección en el plano imagen respectivamente \pi_{1} y \pi_{i}.

El procedimiento exige dicho calibrado previo de los sensores. En el caso simple de dos sensores solamente, ilustrado en la figura 1, el calibrado tiene por objetivo estimar los parámetros de los modelos

F_{1}(x,y,z)

F_{2}(x,y,z)

que definen la relación entre un punto S_{k} de la escena, definido en tres dimensiones por sus coordenadas x, y y z, y las coordenadas (p, q)_{i} de su proyección en el plano imagen \pi_{i} (con i = 1 ó 2).

El calibrado se efectúa de manera diferente según la naturaleza de los sensores, por unos procedimientos conocidos, como por ejemplo el descrito en el artículo de Ayache mencionado más arriba. Se pueden utilizar unas correspondencias entre unos puntos homólogos de las imágenes, definidos manualmente u obtenidos por unas técnicas de reconocimiento de forma que se refieren a unas proximidades.

Al final de esta etapa, se dispone del conjunto de los modelos F_{i}(x,y,z) con i\in{1,...,n} y de unas direcciones de búsqueda de los puntos correspondientes, que son las de las epipolares.

Sin embargo, cuando el calibrado se realiza sin conocimiento inicial 3D de la escena, la reconstrucción 3D no puede ser definida por los procedimientos clásicos con la transformación proyectiva cerca del espacio proyectivo 3D. Se verá más adelante que el procedimiento multipares según la invención es independiente de la geometría y permite tomar las variaciones de altitud en la escena.

Puesta en correspondencia multipares

El emparejamiento de las imágenes se efectúa buscando el homólogo de cada punto P de una imagen de referencia, generalmente definido con su proximidad en forma de una viñeta, a lo largo de las epipolares E_{2}, E_{3}, ... de las otras imágenes (figura 2). Para ello, se establecen unas curvas de similaridad en función de la disparidad d_{12}, d_{13}, .... (líneas A y B). El índice de similaridad S puede ser en particular un coeficiente de intercorrelación o un índice de parecido sobre unos contornos o unas regiones. Todas las curvas son llevadas a continuación a un referencial común, por ejemplo d_{13}, que hará aparecer un emparejamiento probable con una precisión subpixélica que corresponde a la coincidencia de los picos (línea C de la figura 3).

Es necesario un cambio de referencial si se quieren expresar todas las curvas en un mismo referencial con vistas a su fusión; utiliza un modelo afín elaborado en función de la geometría de adquisición de las imágenes. Este modelo es de la forma, para un ejemplo que implica tres imágenes en total:

d_{13} = a(\eta ,\mu)d_{12} + b(\eta ,\mu)

en la que d designa la disparidad, \eta y \mu designan los parámetros que definen la geometría de los pares (1,2) y (1,3) para una posición p sobre la epipolar de la primitiva (punto, contorno o región) a emparejar en la imagen 1.

Cuando el calibrado se realiza sin conocimiento 3D de la escena, los coeficientes a(\eta,\mu) y b(\eta,\mu) del modelo afín son calculados utilizando una rectificación de las imágenes, destinada a transformar cada par de imágenes planas 2D en otro par tal que las líneas epipolares sean paralelas y confundidas con las líneas o las columnas de las imágenes, como se ha indicado en la figura 1 en la que las epipolares conjugadas rectificadas están indicadas en los planos retinianos virtuales \Gamma_{1,2} y \Gamma_{2,1} por los puntos I^{1}_{k} y I^{2}_{k} en los planos imagen \pi_{1} y \pi_{2}. La rectificación facilita la puesta en correspondencia permitiendo establecer inmediatamente las curvas de la figura 3.

A título de ejemplo, se puede indicar que el modelo de paso (p,q) = F_{i}(x,y,z) para un modelo estonotipado es, en coordenadas proyectivas, una función lineal de la forma:

1

P es una matriz 3x4 definida pudiendo diferir en un lector multiplicativo; w y s son unos factores multiplicativos. Para determinar la matriz, son necesarios 11 parámetros. Pueden ser determinados a condición de disponer de por lo menos 6 puntos homólogos.

Si se consideran únicamente dos imágenes, se puede definir un modelo de paso de un punto 3D de la escena a las coordenadas dadas de su proyección en cada una de las imágenes rectificadas 1 y 2; las matrices de proyección perspectivas M y N para la imagen 1 y la imagen 2 que definen los modelos de paso son:

\vec{u}_{1} = M \vec{x}

\vec{u}_{2} = N \vec{x}

Para calcular los coeficientes de las matrices M y N, pudiendo diferir en un factor de escala, es preciso respetar diversas obligaciones:

-: epipolares paralelas en las dos imágenes (epipolos en el infinito);

-: para un punto 3D cualquiera S_{k} que no pertenece al plano focal de las cámaras definidas después de rectificado, ordenadas de los píxeles, representadas por los puntos I_{k}^{1,2} y I_{k}^{2,1}, idénticas (figura 1);

-: coordenadas de los centros ópticos C_{1} y C_{2} invariables para la rectificación.

Las ecuaciones a las cuales conducen estas obligaciones se dan en el documento Ayache mencionado más arriba.

Se puede encontrar una solución a estas ecuaciones de forma que se limiten las distorsiones de las imágenes rectificadas. A título de ejemplo, se dan las expresiones siguientes para las matrices M y N:

2

: c_{1} y c_{2} son los vectores de las coordenadas 3D de los centros ópticos C_{1} y C_{2} de las cámaras con estenotipado;

: \alpha y \beta son unos factores de escala, que condicionan la deformación de las imágenes rectificadas en la dirección de las epipolares para una y en la dirección ortogonal para la otra (si las epipolares después de rectificación se eligen horizontales).

: f es un vector que impone la orientación del plan de rectificación (que permite limitar las distorsiones de las imágenes rectificadas).

La geometría proyectiva permite calcular también las matrices M y N por medio de las matrices fundamentales. Se encontrará en la tesis de la Escuela Politécnica "Vision stéréoscopique et propriétés différentielles des surfaces" de F. Devernay la descripción de dicho estudio.

Las matrices de paso de las imágenes reales (o adquiridas) a las imágenes rectificadas pueden deducirse de las matrices M y N, por ejemplo de la manera indicada en el documento Ayache.

Es preciso a continuación definir un modelo de interdisparidad por sus coeficientes a(\lambda,\mu) y b(\lambda,\mu) tales que:

d_{13}(p) = a (\eta ,\mu).d_{12} + b(\eta ,\mu)

Este modelo hace pasar de la disparidad d_{12}(p) del punto p en el par de las imágenes rectificadas 1 y 2 a la disparidad d_{13}(p) en el par formado por las imágenes 1 y 3. \eta designa el par de imágenes (1,2) y \mu designa el par de imágenes (1,3).

Las ecuaciones paramétricas de las líneas de visión en la cámara 1, definidas a partir de las coordenadas del píxel p en la imagen rectificada en la geometría del par \eta y en la geometría del par \mu son:

\vec{x}=c_{1}+\lambda_{1}^{\eta}t_{\eta}

\hskip1cm

y

\hskip1cm

\vec{x}=c_{1}+\lambda_{1}^{\mu}t_{\mu}

en la que x designa las coordenadas 3D de un punto c_{1} (coordenadas del centro óptico de la cámara 1) y t_{\eta} y t_{\mu} son los vectores directores definidos de forma simple en función de los términos de la matriz M:

t_{\eta}=\varepsilon_{\eta}(m_{1}^{\eta}-p_{1}^{\eta}m_{3}^{\eta}) ^ (m_{2}^{\eta}-q_{1}^{\eta}m_{3}^{\eta})

t_{\mu}=\varepsilon_{\mu}(m_{1}^{\mu}-p_{1}^{\mu}m_{3}^{\mu}) ^ (m_{2}^{\mu}-q_{1}^{\mu}m_{3}^{\mu})

en las que \varepsilon designa un coeficiente de normalización del vector t.

Se deduce que \lambda_{1}^{\eta}= \tau^{\mu.\eta}. \lambda_{1}^{\eta}

con n \tau^{\mu.\eta} = (t_{\eta}^{T}.t_{\mu})/||t_{\eta}||

Las expresiones de a y b se deducen directamente de ello.

a(\eta,\mu)= \frac{\kappa_{1}^{\eta}\cdot \tau^{\mu,\eta}}{\kappa_{1}^{\eta}}

b(\eta,\mu)= \kappa_{2}^{\mu}-\frac{\kappa_{1}^{\mu}}{\kappa_{1}^{\eta}} \cdot \kappa_{2}^{\eta}\cdot\tau^{\mu,\eta}

Se considerará de nuevo el caso particular y simple en el que los sensores son de tipo estenotipado. El emparejamiento multipares puede efectuarse por la marcha esquematizada en la figura 4, en el caso de cuatro imágenes reales, numeradas 1, 2, 3 y 4. Después de la rectificación, un punto P de la imagen 1 tomado como referencia será buscado sobre las epipolares correspondientes de las imágenes 2, 3 y 4. Utilizando la anotación representada en la figura 4, los emparejamientos multipares se realizan entre las imágenes g_{i}y d_{i}, con i\in{1,2,3}

Los coeficientes a y b del modelo afín del paso de la disparidad de un par a la disparidad de otro par pueden expresarse simplemente en función de la posición del píxel P a emparejar, de la geometría del par de origen y de la del par de destino.

Como se ha indicado más arriba, se fusiona a continuación el conjunto de los emparejamientos obtenidos tomando n diferentes imágenes como referencia (n = 4 en el caso de la figura 4). Esta operación puede efectuarse después del cálculo de los modelos numéricos de terreno (MNT) o de elevación (MNE), como se ha indicado en la figura 5. Pero la misma puede ser efectuada por fusión de los mapas de disparidad, para obtener un mapa de disparidad final, antes de determinar el MNE final.

Preferentemente, la fusión se realiza sobre el principio de los votos mayoritarios o de la selección de un valor medio. Se utiliza una ponderación en el momento de la realización de los votos. La misma es calculada asignando un peso máximo a los puntos de vista más distantes de la imagen de referencia.

Cuando se conoce la geometría de los sensores (modelo estenotipado, escáner, varilla) se darán algunas indicaciones sobre un modo de puesta en correspondencia o emparejamiento en el caso de dos imágenes 1 y 2, siendo la imagen I la imagen de referencia. Las anotaciones son las de la figura 6. La puesta en referencia tiene en cuenta un plano \Sigma a una altitud constante z = z_{0}. Las funciones F_{i} son conocidas, y, en el caso de modelos estenotipados, vuelven a las matrices de proyección perspectiva M_{i}. En consecuencia, se pueden expresar siempre las coordenadas (p,q) en 2D en el plano \Sigma para z = z_{0} a partir de dos píxeles (p_{1},q_{1}) y (p_{2},q_{2}) puestos en correspondencia en las imágenes 1 y 2.

Si (x_{1},y_{1}) es el punto del plano \Sigma que es la imagen del píxel (p_{1},q_{1}) a emparejar de la imagen 1, y (x_{2},y_{2}) es la imagen del píxel (p_{2},q_{2}) de la imagen 2, entonces se define la disparidad asociada a este emparejamiento potencial como la distancia euclidiana en el plano \Sigma entre los puntos (x_{1},y_{1}) y (x_{2},y_{2}):

d_{12}(x_{1},y_{1})=\sqrt{(x_{1}-x_{2})^{2}+(y_{1}-y_{2})^{2}}

A partir de esta definición de la disparidad, el cálculo muestra que se puede expresar la disparidad en un par de imágenes (1,2) en forma de:

d_{12}(x_{1},y_{1})=\sqrt{(a_{n}-a_{m})^{2}+(c_{n}-c_{m})^{2}} \cdot (z_{0}-z)

en la que a_{n}, a_{m}, c_{n}y c_{m} son unos coeficientes que se pueden deducir de los sistemas lineales que unen, con z_{0} constante, p y q y el vector \vec{m} definido más arriba en cada imagen.

En el caso de las imágenes 1 y 3, se detendría, de forma similar, una relación:

d_{13}(x_{1},y_{1})= \sqrt{(a_{p}-a_{m})^{2}+(c_{p}-c_{m})^{2}} \cdot (z_{0}-z)

en la que a_{p} y c_{p} desempeñan la misma función que a_{n} y c_{n}. El modelo lineal de paso interdisparidad entre el par \eta de las imágenes (1,2) y el par \mu de las imágenes (1,3) cuando el plano \Sigma está especificado, se escribe muy simplemente en forma de:

d_{13} (x_{1},y_{1}) = a(\eta,\mu) \cdot d_{12}(x_{1},y_{1})

con:

a(\eta,\mu)=\frac{{\sqrt{(a_{p}-a_{m})^{2}+(c_{p}-c_{m})^{2}}}}{\sqrt{(a_{n}-a_{m})^{2}+(c_{n}-c_{m})^{2}}}

Así se pueden establecer, por un cálculo que podrá realizarse en paralelo, todas las curvas de similaridad con vistas a hacer aparecer los picos que se corresponden.

Cuando tiene lugar el emparejamiento, conviene separar los picos debidos a una ocultación de puntos en una de las imágenes del par. La figura 7B muestra, a título de ejemplo, las curvas de parecido en función de la disparidad para cuatro pares. El píxel de la imagen de referencia está enmascarado en la otra imagen en el par 4, que hace aparecer unos picos para unas disparidades en las que las otras curvas no presentan máximo. En este caso, convendrá separar la curva 4 para encontrar la disparidad correcta para el píxel enmascarado. Este resultado puede obtenerse en particular por un voto mayoritario.

Claims

1. Procedimiento de producción de datos cartográficos en tres dimensiones a partir de n imágenes en dos dimensiones de la escena, proporcionadas por n sensores con unos puntos de vista diferentes, siendo n un entero superior a 2, según el cual:

b): se ponen en correspondencia cada uno de los n-1 pares de imágenes que comprenden todos una misma imagen de referencia elegida entre las n imágenes, buscando el homólogo de cada píxel o zona de la imagen de referencia a lo largo de la epipolar correspondiente de la otra imagen del par;

d): se llevan de nuevo todas las curvas a referencial común, por un modelo por ejemplo afín, para emparejar el mayor número posible de imágenes;

e): se efectúa la suma de las curvas, eliminando eventualmente cada pico situado a una disparidad singular con respecto al de todas las otras curvas y se retiene el pico más elevado de la curva resultante; y

2. Procedimiento según la reivindicación 1, caracterizado porque se efectúan varios emparejamientos tomando diferentes imágenes como referencia.

3. Procedimiento según la reivindicación 1 ó 2, caracterizado porque se fusionan los resultados de puesta en correspondencia multipares con la ayuda de una votación mayoritaria, asignando un coeficiente de ponderación más elevado a los picos que corresponden a los puntos de vista más distantes de la imagen de referencia.