WO2007017597A2

WO2007017597A2 - Procede et dispositif pour determiner la pose d'un moyen de capture video dans le repere de numerisation d'au moins un objet virtuel en trois dimensions modelisant au moins un objet reel

Info

Publication number: WO2007017597A2
Application number: PCT/FR2006/001934
Authority: WO
Inventors: Valentin Lefevre; Marion Passama
Original assignee: Total Immersion
Priority date: 2005-08-09
Filing date: 2006-08-09
Publication date: 2007-02-15
Also published as: JP2009505191A; EP1913556A2; FR2889761A1; WO2007017597A3; US20100134601A1; JP4917603B2; FR2889761A3

Abstract

L'invention est relative à un procédé de détermination de la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions, ledit au moins un objet virtuel étant une modélisation correspondant à au moins un objet réel présent dans des images du flux d'images vidéo, caractérisé en ce qu'il comprend les étapes suivantes : réception d'un flux d'images vidéo à partir du moyen de capture vidéo ; affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel ; appariement, en temps réel, de points dudit au moins un objet virtuel avec des points correspondant dans ledit au moins un objet réel présent dans des images du flux d'images vidéo ; détermination de la pose dudit moyen de capture vidéo en fonction des points dudit au moins un objet virtuel et de leur point apparié dans ledit au moins un objet réel présent dans des images du flux d'images vidéo.

Description

PROCEDE ET DISPOSITIF POUR DETERMINER LA POSE

D'UN MOYEN DE CAPTURE VIDEO DANS LE REPERE DE NUMERISATION

D'AU MOINS UN OBJET VIRTUEL EN TROIS DIMENSIONS

MODELISANT AU MOINS UN OBJET REEL

La présente invention concerne la détermination de la pose d'un moyen de capture vidéo dans un environnement réel et plus particulièrement un procédé et un dispositif pour déterminer la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions modélisant au moins un objet réel.

Elle trouve une application générale dans la détermination de la pose d'une caméra en vue de l'insertion d'objets virtuels dans les images vidéo capturées par la caméra.

La réalité augmentée, en effet, consiste à insérer des objets virtuels dans une image vidéo en provenance d'un moyen de capture vidéo.

Une fois insérés dans les images vidéo, les objets virtuels doivent être vus relativement aux objets réels présent dans la vidéo, avec la bonne perspective, le bon positionnement et avec une taille correcte.

L'insertion d'objets virtuels dans une vidéo est réalisée aujourd'hui après avoir capturé la vidéo. Par exemple, l'insertion est réalisée sur des prises de vue statiques dans la vidéo. Ces opérations d'insertion d'objets virtuels dans une vidéo nécessitent des coûts de développement importants.

En outre, l'insertion d'objets virtuels en temps réel, c'est-à-dire à la réception des images vidéo capturées est réalisée de manière approximative dans les images.

L'invention permet de résoudre au moins un des problèmes exposés précédemment.

L'invention a ainsi pour objet un procédé de détermination de la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions, ledit au moins un objet virtuel étant une modélisation correspondant à au moins un objet réel présent dans des images du flux d'images vidéo, caractérisé en ce qu'il comprend les étapes suivantes :

- réception d'un flux d'images vidéo à partir du moyen de capture vidéo ;

- affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel ;

- appariement, en temps réel, de points dudit au moins un objet virtuel avec des points correspondant dans ledit un moins un objet réel présent dans des images du flux d'images vidéo ;

- détermination de la pose dudit moyen de capture vidéo en fonction des points dudit au moins un objet virtuel et de leur point apparié dans ledit au moins un objet réel présent dans des images du flux d'images vidéo.

Le procédé selon l'invention permet de déterminer la pose d'une caméra dans le repère de numérisation de l'objet virtuel modélisé en trois dimensions en vue ultérieurement d'être apte à insérer, rapidement et de manière ajustée des objets virtuels dans l'environnement réel.

La modélisation est réalisée au moyen d'objets virtuels en trois dimensions.

La détermination de la pose est réalisée à partir de l'appariement de points entre des points d'au moins un objet virtuel et des points des images vidéo, notamment à partir de l'appariement de points sélectionnés sur l'objet virtuel et leur équivalent dans l'image vidéo.

Il est à noter que la détermination de la pose d'un moyen de capture vidéo est associée à la pose d'une caméra virtuelle paramétrant le rendu des objets virtuels en trois dimensions qui constituent les éléments ajoutés dans le flux d'images vidéo.

Ainsi, la détermination de la pose du moyen de capture vidéo détermine également la pose de la caméra virtuelle associée au moyen de capture vidéo dans le repère de numérisation de l'objet virtuel correspondant à l'objet réel présent dans le flux d'images vidéo. Selon une caractéristique particulière, le procédé comprend en outre, une étape d'affichage dudit au moins un objet virtuel de manière superposée au flux d'images vidéo reçu.

Selon cette caractéristique, il est possible de visualiser l'objet virtuel dans la fenêtre vidéo afin de vérifier la qualité de la pose déterminée du moyen de capture vidéo et incidemment de la caméra virtuelle.

Selon une autre caractéristique particulière, l'affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel est réalisé respectivement dans deux fenêtres de visualisation côte à côte.

Selon une autre caractéristique particulière, l'appariement est réalisé manuellement.

Selon encore une autre caractéristique particulière, des points dudit au moins un objet virtuel sont sélectionnés au moyen d'un algorithme d'extraction d'un point en trois dimensions à partir d'un point sélectionné dans un objet virtuel.

Selon cette caractéristique, l'utilisateur sélectionnant un sommet du maillage en trois dimensions présentant l'objet virtuel, l'algorithme d'extraction est apte à déterminer le point en trois dimensions de ce maillage le plus proche de l'endroit sélectionné par l'utilisateur.

Selon une autre caractéristique particulière, la modélisation comprend en outre au moins un objet virtuel sans correspondance avec les objets réels présents dans des images du flux d'images vidéo reçu.

Selon cette caractéristique, la modélisation de l'environnement réel peut comprendre des objets qui peuvent compléter l'environnement réel.

Selon une caractéristique particulière, le procédé comprend en outre une étape de modification, en temps réel, du point de vue dudit au moins un objet virtuel.

Selon cette caractéristique, il est permis de visualiser l'objet virtuel selon différents points de vue, permettant ainsi à l'utilisateur de vérifier la validité des points appariés entre eux. L'invention a également pour objet un programme d'ordinateur comprenant des instructions adaptées à la mise en œuvre de chacune des étapes du procédé décrit précédemment.

Corrélativement, l'invention fournit également un dispositif de détermination de la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions, ledit au moins un objet virtuel étant une modélisation correspondant à au moins un objet réel présent dans des images du flux d'images vidéo, caractérisé en ce qu'il comprend :

- des moyens de réception d'un flux d'images vidéo à partir du moyen de capture vidéo ;

- des moyens d'affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel ;

- des moyens d'appariement, en temps réel, de points dudit au moins un objet virtuel avec des points correspondant dans ledit au moins un objet réel présent dans des images du flux d'images vidéo ;

- des moyens de détermination de la pose dudit moyen de capture vidéo en fonction des points dudit au moins un objet virtuel et de leur point apparié dans ledit au moins un objet réel présent dans des images du flux d'images vidéo.

Ce dispositif présente les mêmes avantages que le procédé de détermination brièvement décrit ci-dessus.

D'autres avantages, buts et caractéristiques de la présente invention ressortent de la description détaillée qui suit, faite à titre d'exemple non limitatif, au regard du dessin annexé dans lequel :

- la figure 1 illustre de façon schématique l'opération d'appariement conformément à la présente invention.

Le dispositif et le procédé selon l'invention permet de déterminer la pose d'un moyen de capture vidéo dans le repère de numérisation de l'objet virtuel modélisant un objet réel présent dans les images du flux d'images afin d'être apte ultérieurement à insérer des objets virtuels en temps réel de manière rapide et correctement ajustée dans la vidéo capturée.

Il est à noter que la pose est la position et l'orientation du moyen de capture vidéo.

Il est à noter que la détermination de la pose d'un moyen de capture vidéo est associée à la pose d'une caméra virtuelle dans la vue des objets virtuels en trois dimensions modélisant des objets réels présents dans des images du flux d'images vidéo.

Ainsi, la détermination de la pose du moyen de capture vidéo détermine également la pose de la caméra virtuelle associée au moyen de capture vidéo dans le repère de numérisation de l'objet virtuel correspondant à l'objet réel présent dans des images du flux d'images vidéo.

Pour ce faire, le dispositif comprend un moyen de capture vidéo, par exemple une caméra.

Selon un premier mode de réalisation, le moyen de capture vidéo est une caméra robotisée en cap / tangage / zoom, éventuellement posée sur un trépied. Il s'agit par exemple d'une caméra Sony EVI D100 ou d'une caméra Sony EVI D1 OOP.

Selon un deuxième mode de réalisation, le moyen de capture vidéo est une caméra fixe.

Selon un troisième mode de réalisation, le moyen de capture vidéo est une caméra à laquelle on a associé un capteur de mouvement, le capteur de mouvement permettant de déterminer en temps réel la position et l'orientation de la caméra dans le repère du capteur de mouvement. Le dispositif comprend également un moyen de traitement du type ordinateur individuel (ou Personal Computer, PC). Il s'agit par exemple d'un ordinateur portable pour une plus grande mobilité.

Le moyen de capture vidéo est connecté au moyen de traitement par deux types de connexions. La première connexion est une connexion vidéo. Il peut s'agir d'une connexion vidéo composite, S-Video, DV (« Digital Video » en terminologie anglo-saxonne), SDI (« Sériai Digital Interface » en terminologie anglo-saxonne) ou HD-SDI (« High Définition Sériai Digital Interface » en terminologie anglo-saxonne).

La seconde connexion est une connexion sur un port de communication, par exemple, un port série, un port USB ou tout autre port de communication. Cette connexion est facultative. Toutefois, elle permet par exemple l'envoi en temps réel des paramètres de type cap, tangage et zoom de la caméra de type Sony EVI D100 vers l'ordinateur.

Le moyen de traitement est équipé notamment, du moyen de traitement de la réalité augmentée en temps réel, par exemple, du logiciel D'FUSION de la société TOTAL IMMERSION.

Afin de réaliser la mise en œuvre du procédé de détermination de la pose du moyen de capture vidéo dans le repère de numérisation de l'objet virtuel modélisé en trois dimensions, l'utilisateur emmène le dispositif précédemment décrit dans l'environnement réel.

Ensuite, l'utilisateur choisit l'emplacement de la caméra selon le point de vue qui lui semble le plus pertinent et il installe la caméra par exemple la caméra en cap / tangage /zoom sur un trépied.

On décrit maintenant la procédure de détermination rapide de la pose de la caméra virtuelle dans le repère de modélisation de l'objet virtuel modélisé en trois dimensions conformément à l'invention. Cette procédure permet d'obtenir la pose de la caméra et de la caméra virtuelle associée pour ultérieurement réaliser un bon positionnement des objets virtuels insérés dans la vidéo, c'est-à-dire sur la scène réelle et un tracé parfait des objets virtuels. En effet, les paramètres de la caméra virtuelle sont utilisés lors du rendu, et ces paramètres permettent d'obtenir en final des objets virtuels parfaitement intégrés dans l'image vidéo, notamment en position, en taille et en perspective.

Une fois le logiciel de localisation initialisé, une fenêtre apparaît, contenant, d'une part, une zone de vidéo temps réel, où sont visualisées les images capturées par la caméra, et d'autre part, une zone appelée « image de synthèse », visualisant un ou plusieurs objets virtuels en 3 dimensions, tel qu'illustré en Figure 1. La zone « image de synthèse » contient au moins l'affichage d'un objet virtuel dont la modélisation en trois dimensions correspond à un objet réel présent dans le flux d'images vidéo.

Les images de synthèse sont tracées en temps réel, ce qui permet à l'utilisateur de configurer son point de vue, notamment à l'aide d'un clavier ou de la souris.

Ainsi, l'utilisateur peut changer la position et l'orientation de son point de vue.

En outre, l'utilisateur peut changer le champ de vision de son point de vue.

Selon ces fonctionnalités, il est permis de régler le point de vue de l'image de synthèse de sorte que la fenêtre de synthèse affiche les objets virtuels de manière similaire aux objets réels correspondant de la fenêtre vidéo.

La visualisation d'un objet réel de la vidéo et de l'objet virtuel à peu près sous le même angle, depuis la même position et avec le même champ de vision permet d'augmenter la rapidité d'appariement des points et rend cet appariement plus aisé à réaliser.

Cette modélisation en trois dimensions comprend notamment des objets déjà présents sur l'endroit réel de la caméra. Toutefois, la modélisation peut aussi contenir des objets futurs non présents dans l'endroit réel.

Ensuite, on procède, notamment manuellement, à l'appariement de points entre des points en trois dimensions sélectionnés sur les objets virtuels affiché dans la zone d'image de synthèse et des points en deux dimensions correspondants dans le flux d'images de la vidéo temps réel de la zone vidéo. Des points caractéristiques sont notamment sélectionnés.

Selon un mode de réalisation, on sélectionne dans la fenêtre vidéo des points des objets réels présents dans les images du flux d'images capturé par la caméra, afin de déterminer un ensemble de points en deux dimensions. Chacun de ces points est identifié au moyen d'un index.

De la même manière, on sélectionne les points équivalents dans la fenêtre d'image de synthèse, notamment selon un algorithme d'extraction de points en trois dimensions. Pour ce faire, l'utilisateur sélectionne un sommet du maillage en trois dimensions d'un objet virtuel et le logiciel détermine le point en trois dimensions le plus proche de l'endroit sélectionné par l'utilisateur. Chacun de ces points est également identifié au moyen d'un index.

Le fait de pouvoir changer en temps réel, le point de vue de la fenêtre de l'image de synthèse permet à l'utilisateur de vérifier si l'extraction des points dans l'objet virtuel est correcte.

Ainsi, tel qu'illustré sur la Figure 1 , le point clé 1 de l'objet virtuel est apparié avec le point clé 1 du l'image de la zone vidéo.

Ce processus doit être aussi précis et rapide que possible afin de permettre une détermination précise et sans erreur de la pose de la caméra et incidemment de la caméra virtuelle associée à la caméra, pour ultérieurement réaliser l'insertion d'objets virtuels de manière ajustée.

Pour ce faire, le dispositif comprend les fonctionnalités suivantes.

Dans un premier temps, il est décrit la sélection de points, notamment de points clés dans les images de la vidéo capturée.

Dans le mode de réalisation dans lequel le moyen de capture est une caméra robotisée, on contrôle le mouvement de la caméra, notamment au moyen d'une manette, par exemple à la souris. Les mouvements de la caméra sont guidées par les fonctions cap et tangage contrôlés avec les axes X et Y de la souris, alors que le contrôle du zoom est contrôlé notamment avec la molette de la souris.

Dans le mode de réalisation dans lequel le moyen de capture est une caméra robotisée, on contrôle le zoom optique sur les points clés réels pour améliorer Ia précision. Les points clés réels peuvent être sélectionnés à l'intérieure de l'image zoomée.

Une fois sélectionné, un point clé réel reste affiché, et un numéro d'index lui est notamment associé et affiché dans les images vidéo même si la caméra bouge selon les fonctions cap/tangage/zoom.

L'utilisateur peut sélectionner une pluralité de points clés (N) dans la zone vidéo, ces points restant affichés en temps réel avec leur index allant de 1 à N. Il est à noter que ces points sont des points dont les coordonnées sont définies en deux dimensions. Dans un second temps, il est décrit la sélection de points, notamment de points clés dans l'image présente dans la zone « image de synthèse », cette zone contenant des objets virtuels. Il est à noter que ces points sont des points dont les coordonnées sont définies en trois dimensions.

L'utilisateur peut déplacer, par exemple à la manette ou à la souris, le point de vue de la caméra virtuelle pour obtenir rapidement un point de vue virtuel « proche » du point de vue de la caméra réelle. En effet, la position et l'orientation de la caméra virtuelle sont modifiables comme dans un modeleur standard.

Une fois le point de vue fixé dans la zone « synthèse », l'utilisateur peut sélectionner les N points clés virtuels, notamment en sélectionnant les points la souris.

Les points clés virtuels sont affichés avec leur index, et ils restent correctement positionnés, même si l'utilisateur change les paramètres de la caméra virtuelle.

Grâce à l'algorithme d'extraction d'un point en trois dimensions (« picking » en terminologie anglo-saxonne), chaque point clé virtuel sélectionné, notamment avec un périphérique de pointage en deux dimensions, est localisé au moyen de 3 coordonnées (X, Y, Z) dans le repère de l'image de synthèse.

Ensuite, on procède à la détermination de la pose de la caméra en fonction des coordonnées des points en trois dimensions sélectionnés sur les objets virtuels et des points en deux dimensions appariés dans le flux d'images vidéo.

Pour ce faire, le logiciel possède en mémoire les informations suivantes :

- la pluralité des points clés réels en deux dimensions des N points clés réels appariés dans l'image réelle, ainsi que leur index entre 1 et N ;

- la pluralité des points clés virtuels en trois dimensions des points clés virtuels sélectionnés sur les objets virtuels, avec pour chaque point clé virtuel ses coordonnées (X, Y, Z) dans le repère de numérisation des objets virtuels et son index entre 1 et N. A partir de ces informations, on procède à la détermination de la pose de la caméra dans le repère de numérisation des objets virtuels. Pour ce faire, l'algorithme appelé POSIT est utilisé afin de déterminer la pose de la caméra et de la caméra virtuelle associée à la caméra, dans le repère de numérisation des objets virtuels correspondant aux objets réels présent dans les images du flux d'images reçu.

Pour de plus amples informations concernant ces méthodes, le lecteur est renvoyé notamment à la référence suivante : l'article intitulé "Model- Based Object Pose in 25 Lines of Code", de D. DeMenthon et L.S. Davis, publié à « International Journal of Computer Vision », 15, pp. 123-141, Juin 1995, présent notamment à l'adresse http://www.cfar.umd.edu/~daniel/.

Selon un mode de réalisation, l'objet virtuel de l'image virtuelle ayant servi à l'appariement peut être superposé à l'objet réel présent dans les images du flux d'images ayant servi à l'appariement, notamment pour vérifier la qualité de la détermination de la pose. D'autres objets virtuels peuvent aussi enrichir la visualisation vidéo.

Pour ce faire, une première étape consiste à dé-distorsionner en temps réel les images de la caméra.

Ensuite, on utilise les informations de pose de la caméra ou de la caméra virtuelle déterminée au moyen du procédé décrit précédemment.

Lors d'insertion d'objets virtuels dans la vidéo, ces informations de pose sont utilisées pour tracer correctement les objets virtuels dans le flux vidéo, notamment, à partir du bon point de vue, donc à partir d'une perspective correcte, et pour réaliser un placement des objets corrects par rapport au monde réel.

En outre, si nécessaire, les objets virtuels sont affichés en transparence sur le flux d'images vidéo au moyen des fonctions de transparences (« blending » en terminologie anglo-saxonne) mises en œuvre notamment dans la technologie D'FUSION.

Il est à noter que le dispositif conforme à l'invention est aisément transportable car il ne nécessite qu'un ordinateur portable et une caméra.

En outre, il peut fonctionner sur des maquettes ou à l'échelle 1. Le dispositif est également apte à fonctionner à l'intérieur ou à l'extérieur de bâtiments ou de véhicules.

Le procédé et le dispositif conforme à l'invention présente également l'avantage, d'une part, d'être installé rapidement et, d'autre part, de déterminer rapidement la pose de la caméra dans le repère de numérisation de l'objet virtuel.

En outre, il n'est pas nécessaire d'utiliser un capteur matériel dans le cas où la caméra est en plan fixe. En effet, l'appariement des points est réaliser sans toutefois changer l'orientation et la position de la caméra réelle.

Il est à noter que le mode de réalisation dans lequel le moyen de capture est une caméra disposant des fonctions cap/tangage/zoom, le procédé et le dispositif conformes à l'invention peuvent être utilisés dans des bâtiments, notamment pour travailler à l'échelle 1 face à des buildings ou en intérieur de bâtiments. En effet, la plupart du temps, l'utilisateur ne dispose que de peu de recul, donc la scène réelle n'est vue que partiellement par la caméra.

Une liste non exhaustive des applications visées est maintenant décrite :

- dans le domaine de la construction ou du bâtiment :

• sur un chantier, pour la vérification de l'état d'avancement des travaux, notamment en superposant les travaux théoriques (modélisés au moyen d'un ensemble d'objets virtuels) sur les travaux réels filmés par la caméra.

• sur une maquette miniature réelle illustrant le but à atteindre, pour l'ajout d'objets virtuels.

• Pour l'implantation d'usines, il est permis de visualiser des travaux non encore réalisés dans une usine existante, pour tester la viabilité du projet.

- dans le domaine automobile :

• pour le calage d'un cockpit virtuel sur un cockpit réel.

• pour le calage d'un véhicule virtuel dans un environnement réel, par exemple, pour réaliser un showroom.

Claims

REVENDICATIONS

1. Procédé de détermination de la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions, ledit au moins un objet virtuel étant une modélisation correspondant à au moins un objet réel présent dans des images du flux d'images vidéo, caractérisé en ce qu'il comprend les étapes suivantes :

- réception d'un flux d'images vidéo à partir du moyen de capture vidéo ;

- affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel ;

- appartement, en temps réel, de points dudit au moins un objet virtuel avec des points correspondant dans ledit au moins un objet réel présent dans des images du flux d'images vidéo ;

2. Procédé de détermination selon la revendication 1 , caractérisé en ce que le procédé comprend en outre, une étape d'affichage dudit au moins un objet virtuel de manière superposée au flux d'images vidéo reçu.

3. Procédé de détermination selon la revendication 1 , caractérisé en ce que l'affichage du flux d'images vidéo reçu et dudit au moins un objet virtuel est réalisé respectivement dans deux fenêtres de visualisation côte à côte.

4. Procédé de détermination selon l'une quelconque des revendications précédentes, caractérisé en ce que l'appariement est réalisé manuellement.

5. Procédé de détermination selon l'une quelconque des revendications précédentes, caractérisé en ce que des points dudit au moins un objet virtuel sont sélectionnés au moyen d'un algorithme d'extraction d'un point en trois dimensions à partir d'un point sélectionné dans un objet virtuel.

6. Procédé de détermination selon l'une quelconque des i revendications précédentes, caractérisé en ce que la modélisation comprend en outre au moins un objet virtuel sans correspondance avec les objets réels présents dans des images du flux d'images vidéo reçu.

7. Procédé de détermination selon l'une quelconque des ι revendications précédentes, caractérisé en ce que le procédé comprend en outre une étape de modification, en temps réel, du point de vue dudit au moins un objet virtuel.

8. Programme d'ordinateur comprenant des instructions adaptées à la mise en œuvre de chacune des étapes du procédé selon les revendications 1 à 7.

9. Dispositif de détermination de la pose d'un moyen de capture vidéo dans le repère de numérisation d'au moins un objet virtuel en trois dimensions, ledit au moins un objet virtuel étant une modélisation correspondant à au moins un objet réel présent dans des images du flux d'images vidéo, caractérisé en ce qu'il comprend :

- des moyens d'appariement, en temps réel, de points dudit au moins un objet virtuel avec des points correspondant dans ledit au moins un objet réel présent dans des images du flux d'images vidéo;

10. Dispositif de détermination selon la revendication 9, caractérisé en ce que le dispositif comprend en outre des moyens d'affichage dudit au moins un objet virtuel de manière superposée au flux d'images vidéo reçu.

11. Dispositif de détermination selon la revendication 9, caractérisé en ce que les moyens d'affichage sont aptes à afficher le flux d'images vidéo reçu et ledit au moins un objet virtuel respectivement dans deux fenêtres de visualisation côte à côte.

12. Dispositif de détermination selon l'une quelconque des revendications 9 à 11 , caractérisé en ce que le dispositif comprend des moyens de commande manuelle de l'appariement.

13. Dispositif de détermination selon l'une quelconque des revendications 9 à 12, caractérisé en ce que des points dudit au moins un objet virtuel sont sélectionnés au moyen d'un algorithme d'extraction d'un point en trois dimensions à partir d'un point sélectionné dans un objet virtuel.

14. Dispositif de détermination selon l'une quelconque des revendications 9 à 13, caractérisé en ce que la modélisation comprend en outre au moins un objet virtuel sans correspondance avec les objets réel présents dans des images du flux d'images vidéo reçu.

15. Dispositif de détermination selon l'une quelconque des revendications 9 à 14, caractérisé en ce que le dispositif comprend en outre des moyens de modification, en temps réel, du point de vue dudit au moins un objet virtuel.