WO2021136895A1

WO2021136895A1 - Synthese iterative de vues a partir de donnees d'une video multi-vues

Info

Publication number: WO2021136895A1
Application number: PCT/FR2020/052454
Authority: WO
Inventors: Joël JUNG
Original assignee: Orange
Priority date: 2020-01-02
Filing date: 2020-12-15
Publication date: 2021-07-08
Also published as: EP4085613A1; US20230053005A1; FR3106014A1

Abstract

L'invention concerne la synthèse d'une image d'une vue à partir de données d'une vidéo multi-vues, comprenant une phase de traitement d'image comme suit : - générer (S1₀) des données de synthèse d'image (DS₀) à partir de données de texture d'au moins une image d'une vue de la vidéo multi-vues, - calculer (S2₀) une image d'une vue synthétisée (IS₀) à partir desdites données de synthèse générées et d'au moins une image d'une vue de la vidéo multi-vues, - analyser (S3₀) l'image de ladite vue synthétisée par rapport à un critère de performance de synthèse, - si ledit critère est respecté, délivrer l'image de ladite vue synthétisée, - sinon, itérer ladite phase de traitement, le calcul (S2_c) d'une image d'une vue synthétisée (IS_c) à une itération courante comprenant la modification, à partir de données de synthèse (DS_c) générées à l'itération courante, d'une image (IS_c-1) de la vue synthétisée calculée lors d'une phase de traitement précédant l'itération courante.

Description

DESCRIPTION

Titre: Synthèse itérative de vues à partir de données d’une vidéo multi-vues Domaine de l'invention

La présente invention se rapporte de manière générale au domaine de la synthèse d’images.

La présente invention s’applique plus particulièrement à la synthèse de points de vue intermédiaires non capturés, à partir d’images de plusieurs vues 2D (deux dimensions), 360°, 180°, etc., qui sont capturées pur générer une vidéo immersive, telle que notamment une vidéo 360°, 180°, etc.

L’invention peut notamment, mais non exclusivement, s’appliquer au décodage vidéo mis en oeuvre dans les décodeurs vidéo actuels HEVC (abréviation anglaise de «High Efficiency Video Coding ») et ses extensions MV-HEVC (abréviation anglaise de « Multiview HEVC »), 3D-HEVC, etc.

Art antérieur

Dans un contexte de vidéo immersive, c’est à dire où le spectateur a la sensation d’être immergé dans une scène 3D (trois dimensions), la scène est classiquement capturée par un ensemble de caméras. Ces caméras peuvent être :

- de type 2D, pour capturer un angle particulier de la scène, et/ou

- de type 360 ° , 180° ou autres, pour capturer toutela scène à 360 degrés, 180 degrés ou autres, autour de la caméra.

Les images de telles vues capturées sont traditionnellement codées, puis décodées par le terminal du spectateur. Néanmoins, afin de fournir une qualité d’expérience suffisante, et donc une qualité visuelle et une bonne immersion, afficher les vues capturées est insuffisant. Les images d’une multitude de vues, dites intermédiaires, doivent être calculées, à partir des images des vues décodées.

Le calcul d’images de ces vues intermédiaires est réalisé par un algorithme dit « de synthèse » de vue (« view synthesis algorithm » en anglais). Un algorithme de synthèse est capable, à partir d’images de N vues, avec N>1 , de synthétiser une image d’un point de vue intermédiaire situé à n’importe quel endroit de l’espace. L’image d’une vue considérée parmi N comprend une composante de texture et une carte de profondeur qui indique la distance séparant les différents éléments de la scène de la caméra qui a capturé l’image de cette vue. Ainsi, l’image d’une vue intermédiaire obtenue par synthèse comprend elle aussi une composante de texture synthétisée à partir des N composantes de texture des images des N vues.

Pour une vue considérée parmi N, la carte de profondeur est soit capturée, soit calculée à partir des N composantes de texture. Cependant, dans les deux cas, une telle carte de profondeur peut contenir de nombreuses erreurs qui sont soit liées à la capture, soit liées au calcul, soit liées à la compression des images des N vues.

De telles erreurs se répercutent donc inévitablement dans l’image d’une vue synthétisée à partir de l’image de chacune de ces N vues, ce qui réduit notablement les performances des algorithmes de synthèse actuels.

En outre, de tels algorithmes de synthèse sont complexes en termes de ressources en calculs car tous les pixels de chacune des N composantes de texture et tous les points des N cartes de profondeur sont systématiquement utilisés pour synthétiser l’image d’une vue, alors que certains de ces pixels et/ou certains de ces points ne sont pas toujours utiles à prendre en compte dans la synthèse.

Objet et résumé de l'invention

Un des buts de l'invention est de remédier à des inconvénients de l'état de la technique précité. A cet effet, un objet de la présente invention concerne un procédé de synthèse d’une image d’une vue à partir de données d’une vidéo multi-vues, mis en oeuvre dans un dispositif de synthèse d’image.

Un tel procédé comprend une phase de traitement d’image comme suit :

- générer des données de synthèse d’image à partir de données de texture d’au moins une image d’une vue de la vidéo multi-vues,

- calculer une image d’une vue synthétisée à partir des données de synthèse générées et à partir d’au moins une image d’une vue de la vidéo multi-vues,

- analyser l’image de la vue synthétisée par rapport à un critère de performance de synthèse, - si le critère est respecté, délivrer l’image de la vue synthétisée,

- sinon, itérer la phase de traitement, l’étape de calcul d’une image d’une vue synthétisée à une itération courante comprenant la modification, à partir de données de synthèse générées à l’itération courante, d’une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante.

Grâce au caractère itératif de la phase de traitement d’image précitée d’un tel procédé de synthèse et à la prise en compte d’un critère de performance de synthèse lors de chaque étape d’analyse de l’image synthétisée calculée, il est ainsi possible d’obtenir l’image d’une vue synthétisée ayant une très bonne qualité visuelle, des zones non ou mal synthétisées lors d’une phase de traitement courante étant synthétisées ou raffinées lors d’itérations suivantes. Un mécanisme de correction itératif et adaptatif de l’image d’une vue synthétisée est ainsi avantageusement mis en oeuvre, apportant de la souplesse aux procédés de synthèse existants.

En outre, le procédé de synthèse selon l’invention permet d’optimiser un compromis - qualité visuelle/complexité calculatoire- car l’étape de génération de données de synthèse d’image n’utilise pas obligatoirement toutes les données de texture d’une image d’une vue de la vidéo.

Enfin, un autre avantage du procédé de synthèse itératif selon l’invention ouvre les perspectives d’une scalabilité en complexité, dans le cas où un terminal qui requiert l’affichage de l’image d’une vue synthétisé ne permet pas l’affichage de cette image avec une résolution élevée ou une qualité élevée.

Plus précisément, une phase de traitement courante à l’itération courante se déroule comme suit :

- générer des données de synthèse à partir de données de texture d’au moins une image d’une vue de la vidéo multi-vues et/ou à partir de données de texture d’au moins une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante,

- à partir des données de synthèse générées à l’itération courante, modifier une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante,

- analyser l’image de la vue synthétisée modifiée par rapport au critère de performance de synthèse.

Selon un mode de réalisation particulier, à l’itération courante, une image d’une vue utilisée pour générer les données de synthèse est sélectionnée en fonction du résultat de l’analyse de l’image de la vue synthétisée modifiée lors d’une phase de traitement précédant l’itération courante. Une telle sélection étant conditionnée au résultat d’une analyse précédente de l’image de la vue synthétisée, il est ainsi possible d’utiliser à chaque nouvelle étape de génération de données de synthèse au moins une image d’une vue de la vidéo multi-vues qui soit la plus pertinente possible pour compléter/raffiner la synthèse d’image effectuée lors d’une ou de plusieurs phase(s) de traitement précédente(s). Selon un autre mode de réalisation particulier, à l’itération courante, la génération des données de synthèse utilise les données de synthèse générées lors d’une phase de traitement précédant l’itération courante.

La prise en compte à l’itération courante de données de synthèse générées précédemment permet de raffiner les données de synthèse qui sont générées à l’itération courante et/ou de venir en complément de ces dernières.

Selon un autre mode de réalisation particulier, à l’itération courante, la génération de données de synthèse comprend une modification des données de synthèse générées lors d’une phase de traitement précédant l’itération courante, à partir de données de texture utilisées à l’itération courante.

Un tel mode de réalisation permet avantageusement de raffiner les données de synthèse générées lors d’une ou plusieurs phases de traitement précédant l’itération courante, en prenant en compte une ou plusieurs nouvelle(s) vue(s) considérée(s). Selon un autre mode de réalisation particulier, les données de synthèse générées à l’itération courante sont combinées avec des données de synthèse générées lors d’une phase de traitement précédant l’itération courante.

Un tel mode de réalisation permet avantageusement d’obtenir à l’itération courante l’image d’une vue synthétisée qui contient de moins en moins de zones d’occlusion. La qualité visuelle de l’image synthétisée est ainsi améliorée au fur et à mesure des itérations.

Selon un autre mode de réalisation particulier, les données de synthèse générées au cours d’une phase de traitement appartiennent au groupe comprenant :

- des données de profondeur associées aux données de texture de l’image de la vue de la vidéo multi-vues utilisées dans ladite phase de traitement,

- des données de contour associées aux données de texture de l’image de la vue de la vidéo multi-vues utilisées dans ladite phase de traitement, - un élément visuel de l’image de la vue de la vidéo multi-vues utilisée dans ladite phase de traitement, ledit élément visuel ne variant pas d’une image d’une vue de la vidéo multi-vues à l’autre,

- des données statistiques calculées sur des données de texture de l’image de la vue de la vidéo multi-vues utilisées dans ladite phase de traitement.

De tels exemples de données de synthèse générées ne sont bien sûr pas exhaustifs. Ils sont cités ici comme étant particulièrement judicieux à utiliser pour optimiser la synthèse de l’image d’une vue mise en oeuvre par le procédé de synthèse selon l’invention, en termes de compromis qualité visuelle/complexité calculatoire.

Selon un autre mode de réalisation particulier, les données de synthèse générées au cours d’une phase de traitement sont associées à une valeur d’incertitude sur la corrélation desdites données de synthèse avec les données de texture correspondantes de ladite au moins une image de ladite vue qui ont été utilisées pour générer lesdites données de synthèse.

De telles valeurs d’incertitude constituent des informations complémentaires pertinentes à prendre en compte dans une phase de traitement suivante et guident dans le choix, au cours de cette phase de traitement suivante, notamment :

- de telles ou telles données de texture, dans telle ou telle image d’une vue, à utiliser dans l’étape de génération de nouvelles donnée de synthèse,

- de telle ou telle image d’une vue de la vidéo multi-vues à utiliser dans l’étape de modification de l’image de la vue synthétisée à l’itération précédente,

- etc.

Selon un autre mode de réalisation particulier, au cours d’une phase de traitement, la génération de données de synthèse utilise au moins une image de profondeur d’une vue de la vidéo multi-vues et/ou au moins une information associée à la vidéo multi- vues.

Dans cet autre mode de réalisation, la génération de données de synthèse utilise avantageusement d’autres données que des données de texture d’au moins une image d’une vue de la vidéo multi-vues. Il peut s’agir de données de profondeur qui viennent en complément des données de texture pour enrichir l’étape de génération de données de synthèse. En complément de ces données de profondeur ou alternativement à celles-ci, il peut s’agir d’au moins une information associée à la vidéo multi-vues. Une telle information est représentative d'une différence ou d'une corrélation entre les vues de la vidéo multi-vues (paramètres de caméra, carte d'occlusion, différence de modes de décodage, etc..).

Selon un autre mode de réalisation particulier, à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente utilise des données de synthèse générées précédemment à l’itération courante.

Dans cet autre mode de réalisation, afin d’affiner davantage l’image de la vue synthétisée obtenue par le procédé de synthèse de l’invention, une image synthétisée calculée lors d’une phase de traitement précédant l’itération courante est utilisée en complément des données de synthèse générées à l’itération courante et de ladite au moins une image d’une vue de la vidéo multi-vues, pour modifier l’image synthétisée calculée à l’itération précédente.

Selon un autre mode de réalisation particulier, à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente comprend le calcul d’une image d’une vue synthétisée à partir desdites données de synthèse générées à l’itération courante et de l’image de ladite vue synthétisée calculée à ladite itération précédente.

Dans cet autre mode de réalisation, l’image de la vue synthétisée à l’itération précédente est utilisée en tant que paramètre d’entrée de l’étape de modification de l’image de la vue synthétisée précédemment calculée, venant ainsi en complément des données de synthèse générées à l’itération courante et de l’image d’au moins une vue de la vidéo multi-vues qui sont utilisées en entrée de cette étape. L’image de la vue synthétisée calculée à l’itération courante présente ainsi une qualité visuelle optimisée.

Selon un autre mode de réalisation particulier, à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente comprend ce qui suit :

- calculer une image d’une vue synthétisée à partir des données de synthèse générées à l’itération courante et à partir de l’image d’une vue de la vidéo multi-vues,

- combiner l’image de la vue synthétisée calculée avec l’image de la vue synthétisée calculée à l’itération précédente.

Dans cet autre mode de réalisation, l’image de la vue synthétisée à l’itération précédente est utilisée une fois que l’image de la vue synthétisée a été obtenue à l’itération courante, en étant combinée/fusionnée avec celle-ci, de manière à compléter totalement ou en partie les zones d’occlusion encore présentes dans l’image synthétisée à l’itération courante.

Selon un autre mode de réalisation particulier, l’itération courante est mise en oeuvre en réponse à un message du dispositif de synthèse, un tel message contenant : - soit des informations de localisation d’une ou plusieurs zones/d’un ou plusieurs pixels de l’image de la vue synthétisée calculée précédemment à l’itération courante, qui ne respectent pas le critère de performance de synthèse,

- soit un pourcentage de pixels non synthétisés de l’image de la vue synthétisée précédemment à l’itération courante. Un tel mode de réalisation permet de rendre le procédé de synthèse interactif en itérant une phase de traitement d’image en réponse à un message contenant des informations explicites servant à guider le dispositif de synthèse dans le choix des paramètres à considérer pour mettre en oeuvre la phase de traitement courante. Ainsi, l’image d’une vue synthétisée peut être améliorée progressivement d’une itération à la suivante, sur la base de paramètres choisis selon le résultat de l’analyse des images synthétisées précédemment.

Selon un autre mode de réalisation particulier, l’itération courante est mise en oeuvre en outre en réponse à la réception de valeurs d’incertitude associées aux données de synthèse générées à l’itération précédente. Un tel mode de réalisation permet d’accompagner le message envoyé pour relancer une itération courante par des valeurs d’incertitude associées aux données de synthèse générées à l’itération précédente, pour guider encore mieux le choix des paramètres à considérer pour mettre en oeuvre la phase de traitement à l’itération courante. Les différents modes ou caractéristiques de réalisation précités peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, au procédé de synthèse défini ci-dessus.

L'invention concerne également un dispositif de synthèse d’une image d’une vue à partir de données d’une vidéo multi-vues, ledit dispositif comprenant un processeur qui est configuré pour mettre en oeuvre ce qui suit :

- mettre en oeuvre une phase de traitement d’image comme suit :

-- générer des données de synthèse d’image à partir de données de texture d’au moins une image d’une vue de la vidéo multi-vues, -- calculer une image d’une vue synthétisée à partir des données de synthèse générées et à partir d’au moins une image d’une vue de la vidéo multi-vues,

-- analyser l’image de ladite vue synthétisée par rapport à un critère de performance de synthèse, -- si ledit critère est respecté, délivrer l’image de ladite vue synthétisée,

-- sinon, itérer la phase de traitement, le calcul d’une image d’une vue synthétisée à une itération courante comprenant la modification, à partir de données de synthèse générées à l’itération courante, d’une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante. Un tel dispositif de synthèse est notamment apte à mettre en oeuvre le procédé de synthèse précité.

L’invention concerne également un procédé de décodage d’un signal de données codées d’une vidéo multi-vues, mis en oeuvre dans un dispositif de décodage d’image, comprenant ce qui suit : - décoder des images de plusieurs vues codées, produisant un ensemble d’images de plusieurs vues décodées,

- synthétiser une image d’une vue à partir dudit ensemble d’images conformément au procédé de synthèse précité, selon l’un quelconque de ses modes de réalisation précités. Selon un mode de réalisation particulier, les données de synthèse sont générées à partir de données de texture d’au moins une des images décodées dudit ensemble. Grâce à ce mode de réalisation, les données de synthèse n’ont pas besoin d’être transmises, ce qui permet une réduction non négligeable du coût de signalisation des données codées. Selon un autre mode de réalisation particulier, les données de synthèse étant préalablement codées, elles sont générées comme suit :

- lire les données de synthèse codées dans ledit signal de données ou dans un autre signal de données,

- décoder les données de synthèse lues. Cet autre mode de réalisation permet de réduire la complexité du décodeur.

L'invention concerne encore un programme d'ordinateur comportant des instructions pour la mise en oeuvre du procédé de synthèse selon l'invention ou du procédé de décodage intégrant le procédé de synthèse selon l'invention, selon l’un quelconque des modes particuliers de réalisation décrits précédemment, lorsque ledit programme est exécuté par un processeur.

De telles instructions peuvent être stockées durablement dans un support mémoire non transitoire du dispositif de synthèse mettant en oeuvre le procédé de synthèse précité ou du décodeur mettant en oeuvre le procédé de décodage précité.

Ce programme peut utiliser n’importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n’importe quelle autre forme souhaitable.

L’invention vise également un support d’enregistrement ou support d’informations lisible par un ordinateur, et comportant des instructions d’un programme d’ordinateur tel que mentionné ci-dessus.

Le support d'enregistrement peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une clé USB ou un disque dur.

D'autre part, le support d'enregistrement peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.

Alternativement, le support d'enregistrement peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé de synthèse ou du procédé de décodage précité.

Brève description des dessins

D'autres caractéristiques et avantages apparaîtront à la lecture de modes de réalisation particuliers de l'invention, donnés à titre d’exemples illustratifs et non limitatifs, et des dessins annexés, parmi lesquels :

[Fig. 1] la figure 1 représente le déroulement d’un procédé de synthèse d’image itératif, dans un mode de réalisation particulier de l’invention,

[Fig. 2] la figure 2 représente un dispositif de synthèse mettant en oeuvre le procédé de synthèse de la figure 1 , [Fig. 3A] la figure 3A représente un agencement du dispositif de synthèse de la figure 2, dans un mode de réalisation particulier de l’invention,

[Fig. 3B] la figure 3B représente un agencement du dispositif de synthèse de la figure 2, dans un autre mode de réalisation particulier de l’invention,

[Fig. 4A] la figure 4A représente un exemple de données de synthèse et d’image d’une vue synthétisée obtenues lors de la mise en oeuvre d’une première phase de traitement d’image du procédé de synthèse de la figure 1 ,

[Fig. 4B] la figure 4B représente un exemple de données de synthèse et d’image d’une vue synthétisée obtenues lors de la mise en oeuvre d’une itération de la phase de traitement d’image de la figure 4A,

[Fig. 5A] la figure 5A représente une étape de génération de données de synthèse, dans un mode de réalisation particulier de l’invention,

[Fig. 5B] la figure 5B représente une étape de génération de données de synthèse, dans un autre mode de réalisation particulier de l’invention,

[Fig. 6A] la figure 6A représente une façon de générer des données de synthèse lors de la mise en oeuvre d’une itération d’une phase de traitement d’image du procédé de synthèse de la figure 1 , dans un mode de réalisation particulier de l’invention,

[Fig. 6B] la figure 6B représente une façon de générer des données de synthèse lors de la mise en oeuvre d’une itération d’une phase de traitement d’image du procédé de synthèse de la figure 1 , dans un autre mode de réalisation particulier de l’invention,

[Fig. 6C] la figure 6C représente une façon de générer des données de synthèse lors de la mise en oeuvre d’une itération d’une phase de traitement d’image du procédé de synthèse de la figure 1 , dans encore un autre mode de réalisation particulier de l’invention,

[Fig. 7A] la figure 7A représente une façon de calculer une image synthétisée lors de la mise en oeuvre d’une itération d’une phase de traitement d’image du procédé de synthèse de la figure 1 , dans un mode de réalisation particulier de l’invention,

[Fig. 7B] la figure 7B représente une façon de calculer une image synthétisée lors de la mise en oeuvre d’une itération d’une phase de traitement d’image du procédé de synthèse de la figure 1 , dans un autre mode de réalisation particulier de l’invention. Description détaillée d’un mode de réalisation de l’invention

On décrit ci-après en référence à la figure 1 , la mise en oeuvre d’un procédé de synthèse d’image itératif selon un mode de réalisation de l’invention, lequel utilise des images d’une pluralité de vues Vi à VN d’une vidéo multi-vues (N>1), représentant une scène 3D selon respectivement une pluralité d’angles de vue ou une pluralité de positions/orientations.

Sur la figure 1 , sont représentées en entrée du procédé de synthèse itératif :

- une image IVi de la vue V-i,

- une image IV2 de la vue V2,

- une image IVk de la vue Vk,

- une image IVN de la vue VN.

De telles images sont des images qui ont été reconstruites par un décodeur, préalablement à la mise en oeuvre du procédé de synthèse itératif.

Ce procédé est réalisé par un dispositif de synthèse d’images SYNT, dont une représentation simplifiée est illustrée sur la figure 2.

Selon un mode particulier de réalisation de l'invention, les actions exécutées par le procédé de synthèse sont mises en oeuvre par des instructions de programme d'ordinateur. A cet effet, le dispositif de synthèse SYNT a l'architecture classique d'un ordinateur et comprend notamment une mémoire MEM_S, une unité de traitement UT_S, équipée par exemple d'un processeur PROC_S, et pilotée par un programme d'ordinateur PG_S stocké en mémoire MEM_S. Le programme d'ordinateur PG_S comprend des instructions pour mettre en oeuvre les actions du procédé de synthèse tel que décrit ci-dessus, lorsque le programme est exécuté par le processeur PROC_S.

A l'initialisation, les instructions de code du programme d'ordinateur PG_S sont par exemple chargées dans une mémoire RAM (non représentée) avant d'être exécutées par le processeur PROC_S. Le processeur PROC_S de l'unité de traitement UT_S met notamment en oeuvre les actions du procédé de synthèse décrit ci-dessous, selon les instructions du programme d'ordinateur PG_S.

Un tel dispositif de synthèse SYNT peut être agencé, comme illustré sur la figure 3A, en sortie d’un décodeur DEC ayant préalablement reconstruit les images IV1 à IVN, ou bien faire partie d’un tel décodeur DEC, comme illustré sur la figure 3B.

Selon un mode particulier de réalisation de l'invention, les actions exécutées par le décodeur DEC sont mises en oeuvre par des instructions de programme d'ordinateur. A cet effet, le décodeur DEC a l'architecture classique d'un ordinateur et comprend notamment une mémoire MEM_D, une unité de traitement UT_D, équipée par exemple d'un processeur PROC_D, et pilotée par un programme d'ordinateur PG_D stocké en mémoire MEM_D. Le programme d'ordinateur PG_D comprend des instructions pour mettre en oeuvre les actions du procédé de décodage tel que décrit ci-dessous, lorsque le programme est exécuté par le processeur PROC_D.

A l'initialisation, les instructions de code du programme d'ordinateur PG_D sont par exemple chargées dans une mémoire RAM (non représentée) avant d'être exécutées par le processeur PROC_D. Le processeur PROC_D de l'unité de traitement UT_D met notamment en oeuvre les actions du procédé de décodage décrit ci-dessous, selon les instructions du programme d'ordinateur PG_D.

Selon l’invention, en référence à la figure 2, le dispositif de synthèse SYNT comprend les trois modules suivants montés en cascade et pilotés par le processeur PROC_S :

- un module M1 d’estimation de données de synthèse,

- un module M2 de calcul d’une image synthétisée,

- un module M3 d’analyse d’image synthétisée configuré pour communiquer avec le module M1.

Le dispositif de synthèse SYNT selon l’invention est ainsi configuré avantageusement pour réaliser une synthèse d’image, dans laquelle l’estimation de données de synthèse est réalisée de façon conjointe et interactive avec le calcul d’une image d’une vue synthétisée, la synthèse étant itérée au besoin pour modifier/compléter/raffiner l’image synthétisée obtenue, grâce à la communication existant entre le module M3 et le module M1.

Comme représenté sur la figure 1 , un tel procédé de synthèse comprend une phase de traitement d’image PO qui s’applique à une image d’une vue qui fait partie de la pluralité de vues V-i,..., VN d’une vidéo multi-vues, la pluralité de vues représentant une scène 3D selon respectivement une pluralité d’angles de vue ou une pluralité de positions/orientations.

Sur la figure 1 , sont représentées en entrée du procédé de synthèse itératif : - une image IV1 d’une vue V-i,

- une image IV2 d’une vue V2,

- une image IVk d’une vue Vk,

- une image IVN d’une vue VN.

De telles images sont des images qui ont été reconstruites par le décodeur DEC des figures 3A et 3B, préalablement à la mise en oeuvre du procédé de synthèse itératif. La phase de traitement d’image PO comprend ce qui suit.

En S1o, des données de synthèse d’image DSo sont générées par le module M1 de la figure 2, à partir de données de texture d’au moins une des images IV1 à IVN. Il s’agit par exemple de données de synthèse DSo générées à partir de données de texture de l’image IVi. Selon l’invention, ces données de texture Ti correspondent à seulement certains pixels de la composante de texture CTi de l’image IVi reconstruite préalablement. A l’issue de l’étape S1o, est obtenue une carte de données de synthèse DSo générées pour ces certains pixels. Une telle carte est représentée sur la figure 4A.

Selon un premier mode de réalisation représenté à la figure 5A, la génération des données de synthèse d’image DSo revient :

- à lire, à partir d’un flux FX reçu en provenance d’un codeur vidéo (non représenté), des données de synthèse d’image DSCi qui ont été préalablement générées au codeur à partir de données de texture originales de la composante de texture CTi de l’image IVi, puis codées, et

- à décoder ces données de synthèse lues.

Selon un deuxième mode de réalisation représenté à la figure 5B, la génération des données de synthèse d’image DSo revient à calculer ces données de synthèse d’image DSo à partir de données de texture de l’image IVi reconstruite préalablement. Selon l’invention, les données de synthèse DSo sont générées à partir de données de texture Ti qui correspondent à seulement certains pixels de la composante de texture CTi de l’image IVi reconstruite préalablement. Les ressources en calculs pour la mise en oeuvre de l’étape de génération de données de synthèse sont donc particulièrement allégées par rapport aux estimations de profondeur mises en oeuvre dans l’art antérieur qui considèrent tous les pixels d’une image.

De manière préférentielle, les données de synthèse DSo générées sont des données de profondeur associées aux données de texture Ti. Toutefois, d’autres types de données de synthèse DSo peuvent bien sûr être envisagés.

Des exemples de données de synthèse DSo peuvent être, de manière non exhaustive:

- des cartes de profondeur partielles, i.e. des images pour lesquelles certains pixels ont une valeur de profondeur associée et d'autres ont une valeur réservée indiquant qu'aucune valeur de profondeur n'a pu être associée à ces pixels ;

- des cartes de contour ou des angles présents dans une image: les informations structurelles contenues dans les cartes de contour, les angles et les contours actifs peuvent être utilisés par le procédé de synthèse d’image itératif selon l’invention, par exemple pour éviter les artefacts de rémanence (« ghosting artifacts » en anglais). Ceci peut être réalisé en améliorant l'algorithme de synthèse ou en améliorant les cartes de profondeur. Les approches de détection de contour peuvent comprendre l'utilisation d'opérateurs de type Sobel, Canny, Prewitt ou Roberts. Les angles peuvent être estimés à l'aide d'un opérateur de détection d'angle de type Harris ;

- des caractéristiques extraites par des algorithmes de type SIFT ("Scale-lnvariant Feature Transform" en anglais), ou SURF ("Speeded-Up Robust Features" en anglais). De tels algorithmes sont utilisés pour l'estimation d'homographies, de matrices fondamentales et d'appariement d'images. Les caractéristiques extraites par ces méthodes partagent donc des caractéristiques similaires à celles des cartes de profondeur, ce qui implique une relation entre les images. L'algorithme SURF est une extension de l'algorithme SIFT, remplaçant le filtre gaussien dans SIFT par un filtre moyen ;

- des caractéristiques statistiques calculées sur une ou plusieurs textures (locales ou sur l'image complète), des données d’histogrammes, etc.

De telles caractéristiques statistiques sont par exemple représentatives du pourcentage de texture, ou de contour, dans des zones données de l’image d’une vue. Elles sont utilisées par le dispositif de synthèse SYNT dans le but de synthétiser une image avec un pourcentage de texture ou de contour qui s’en approche. Il en va de même pour les données d’histogrammes concernant différentes zones de l’image d’une vue, le dispositif de synthèse SYNT essayant de conserver ces données d’histogrammes pour chacune de ces zones pour l’image de la vue synthétisée par ce dernier.

Des méthodes d'apprentissage machine (« machine learning » en anglais), telles que des réseaux de neurones en convolution (CNN pour « Convolutional Neural Networks » en anglais), peuvent également être utilisées pour extraire à partir de données de texture reconstruites des caractéristiques utiles à la synthèse d’images. Ces différentes données de synthèse peuvent, au cours de l’étape S1o, être utilisées individuellement ou en combinaison.

On appellera par la suite données de synthèse, les données DSo générées à l’issue de l’étape S1o et plus généralement les données générées à chaque itération. Une telle expression couvre non seulement des cartes de profondeur partielles ou non, mais aussi les données précitées. D'autres types de données non citées ici sont aussi possibles.

De façon optionnelle, et pour cela représenté en pointillé sur la figure 1 , les données de synthèse DSo peuvent être générées également à partir d’au moins une information MD associée à la séquence d’images multi-vues IVi à IVN et/ou d’une ou plusieurs cartes de profondeur CPi à CPN disponibles, associées respectivement aux composantes de texture CTi à CTN des images IVi à IVN. Une information MD est par exemple une métadonnée représentative d'une différence ou d'une corrélation entre les vues Vi à VN, telle que un ou plusieurs paramètres de caméra, une ou plusieurs cartes d'occlusion, des différences de modes de décodage, etc.

Une telle information MD est par exemple transmise dans un flux reçu par le dispositif de synthèse itératif SYNT illustré en figure 2. L’information MD peut également être déjà disponible au niveau du dispositif de synthèse.

Dans le cas où les données de synthèse DSo sont des données de profondeur :

- si ces données de profondeur sont générées à partir de données de texture d’une seule image d’une vue parmi N, l’estimation de profondeur est mise en oeuvre par exemple à l’aide d’un réseau de neurones monoculaire, d’un algorithme d’estimation de profondeur basé contour ou T-jonctions (« T-junctions » en anglais), etc. ;

- si ces données de profondeur sont générées à partir de données de texture d’au moins deux images parmi N, l’estimation de profondeur est mise en oeuvre par exemple à l’aide d’un algorithme de mise en correspondance stéréoscopique

(« stéréo matching » en anglais), d’un algorithme de mise en correspondance basé motif (« template matching » en anglais), etc.

De façon optionnelle, et pour cette raison représenté en pointillé sur la figure 1 , les données de synthèse DSo sont associées à une valeur d’incertitude sur la corrélation desdites données de synthèse avec les données de texture correspondantes de l’image IVi. De façon connue en soi, ces valeurs d’incertitude sont regroupées dans une carte telle que par exemple :

- une carte d’occupation OM (« occupancy map » en anglais) qui est une carte binaire indiquant, pour les pixels considérés dans la composante de texture CTi, si les valeurs de profondeur correspondantes sont corrélées (valeur mise à 1) ou non (valeur mise à 0) aux valeurs de ces pixels ;

- une carte de confiance CM (« confidence map » en anglais) qui est une carte de valeurs discrètes représentatives, pour les pixels considérés dans la composante de texture CTi, d’un degré de confiance sur la corrélation de la valeur de ces pixels avec les données DSo générées pour chacun de ces pixels.

Selon un mode de réalisation, la génération des données de synthèse est mise en oeuvre à partir d’un seuil qui est par exemple une valeur de distorsion SAD (« Sum of Absolute Différences » en anglais) qui est représentative de la qualité de la mise en correspondance stéréoscopique par exemple ou bien plus généralement à partir de tout autre indicateur permettant d’établir un degré de confiance en chaque pixel, pour la donnée de synthèse à générer pour ce pixel.

Selon un mode de réalisation préféré, la carte de données de synthèse n’est remplie que pour les pixels dont la confiance est supérieure à un seuil donné.

Selon un autre mode de réalisation, la carte de données de synthèse est remplie pour tous les pixels de l’image, mais s’accompagne soit d’une carte de confiance en chaque point, soit de la valeur SAD qui doit être comparée au seuil, en chaque point. Selon encore un autre mode de réalisation, la carte de données de synthèse est incomplète, mais s’accompagne tout de même soit d’une carte de confiance en chaque point existant, soit de la valeur SAD qui doit être comparée au seuil, en chaque point existant.

Le procédé de synthèse itératif selon l’invention se poursuit par un calcul S2o par le module de calcul M2 de la figure 2 d’une image d’une vue synthétisée ISo, à partir des données de synthèse DSo générées en S1o et d’au moins une image IVj parmi les images IVi à IVN. L’image IVj peut être l’image IVi ou bien une autre image parmi N. Le calcul S2o est mis en oeuvre par un algorithme de synthèse classique, tel que par exemple du type RVS (« Reference View Synthesizer » en anglais), VVS (« Versatile View Synthesizer » en anglais), etc... Un exemple d’image synthétisée ISo est représenté à la figure 4A.

En S3o, l’image synthétisée ISo est analysée par rapport à un critère de performance de synthèse CS, au moyen du module d’analyse M3 de la figure 2.

Différents critères de performance de synthèse sont possibles à ce stade. A titre d’exemples non exhaustifs, ces critères sont :

- CS1 : nombre de pixels manquants dans l’image synthétisée ISo inférieur à un seuil ; et/ou

- CS2 : taille de la plus grande zone à remplir de l’image synthétisée ISo inférieure à un seuil, un tel critère signifiant qu’un algorithme d’inpainting parviendra à reconstruire les données manquantes de cette image efficacement ; et/ou

- CS3 : qualité visuelle de l’image synthétisée ISo jugée suffisante, telle que mesurée par exemple par un algorithme d’évaluation objective avec ou sans référence (« full- reference, reduced-reference, no-reference objective metric » en anglais).

Si le critère est respecté, l’image synthétisée ISo est considérée valide et est délivrée pour être stockée en attente d’être affichée par un terminal d’un utilisateur ayant requis cette image et/ou directement affichée par le terminal.

Si le critère n’est pas respecté, en S4o, le module d’analyse M3 transmet au module M1 une information INFo sur les pixels/zones de pixels de l’image synthétisée ISo qui n’ont pas été synthétisé(e)s ou qui n’ont pas étés considéré(e)s comme synthétisé(e)s correctement à l’issue de la phase de traitement d’image PO. Une telle information INFo est contenue dans un message ou une requête dédiée. De façon plus particulière, l’information INFo est représentée sous la forme des coordonnées de ces pixels non ou mal synthétisés selon les critères précités ou bien encore sous la forme d’un pourcentage de pixels non synthétisés. De façon optionnelle, le module d’analyse M3 transmet également en S4o la carte d’occupation OMi ou la carte de confiance CMi générées en S1o.

Le dispositif de synthèse SYNT déclenche alors une nouvelle phase de traitement d’image P1 , afin d’améliorer/raffiner l’image synthétisée ISo qui a été obtenue précédemment.

A cet effet, en S11, le module M1 de génération de données de synthèse génère à nouveau des données de synthèse DSi à partir de données de texture (pixels) d’au moins une des images IVi à IVN. Il peut s’agir par exemple :

- des données de texture Ti utilisées en S1o, et/ou

- de données de texture T) de la composante de texture CTi de la même image IVi mais différentes des données de texture Ti, et/ou

- de données de texture d’une autre image IVk parmi N (1 <k£N).

Comme en S1o, les données de synthèse DSi peuvent être générées également à partir d’au moins une information MD associée à la séquence d’images multi-vues IVi à IVN et/ou d’une ou plusieurs cartes de profondeur CPi à CPN disponibles, associées respectivement aux composantes de texture CTi à CTN des images IVi à IVN. Il peut également s’agir de données de profondeur, de cartes de profondeur partielles, de cartes de contour, etc. utilisées individuellement ou en combinaison, le choix du type de ces données n’étant pas obligatoirement le même que celui utilisé en S1o.

A l’issue de l’étape S11, est obtenue une carte de données de synthèse DSi générée pour ces données de texture. Une telle carte est représentée sur la figure 4B.

La sélection de la/des images pour générer les données de synthèse DSi peut être mise en oeuvre de différentes façons.

Si par exemple les deux composantes de texture CTi et CT2 ont été utilisées pour générer les données de synthèse DSo en S1o, le module M1 de génération de données de synthèse peut être configuré pour sélectionner en S11 les deux composantes de texture CT3 et CÏ4 respectives des images les plus proches IV3 et IV4 des images IV1 et IV2.

Selon un autre exemple, compte tenu du fait que chacune des images IV1 à IVN dispose d’informations capturées différentes de la scène, si le module M1 a utilisé les composantes de texture CTi et CT2 pour générer les données de synthèse DSo en S1o, il peut être configuré pour utiliser en S11 les composantes de texture CTi et CT3 ou encore CT2 et CT3 pour générer les données de synthèse DS-i.

Selon encore un autre exemple, le module M1 peut utiliser simultanément plusieurs composantes de texture, par exemple quatre composantes de texture CT3, CÏ4, CTs, CTe.

Selon encore un autre exemple, le module M1 peut utiliser en plus ou à la place des composantes de texture CTi à CTN, une ou plusieurs images préalablement synthétisée(s). Par exemple, en S11, le module M1 peut utiliser l’image synthétisée ISo pour générer les données de synthèse DSi.

Selon encore un autre exemple, le choix en S11 des données de texture

et/ou P et/ou Tk est conditionné par l’information INFo. Si par exemple l’information INFo est représentative de la localisation d’une ou plusieurs zones d’occlusion dans l’image synthétisée ISo, le module M1 est configuré pour sélectionner en S11 une ou plusieurs composantes de texture d’images plus éloignées que celle(s) utilisées en S1o afin de combler ces zones. Une telle sélection peut être guidée par l’information MD correspondant par exemple à des paramètres de caméra, tel que par exemple l’angle de la caméra et sa position dans la scène.

Lorsque la sélection des données de texture Ti et/ou T’i et/ou Tk est conditionnée par l’information INFo, est représenté ci-dessous, à titre d’exemple uniquement, un tableau Tableaul qui associe à chaque critère de performance de synthèse CS1 à CS3 qui n’est pas rempli, le contenu de l’information INFo correspondante et l’action à mettre en oeuvre en S11 par le module M1 de génération de données de synthèse. [Tableau 1]

Selon un mode de réalisation représenté à la figure 6A, les données de synthèse DSi sont générées d’une manière similaire aux données DSo.

Selon un autre mode de réalisation représenté à la figure 6B, les données de synthèse DSi sont générées en modifiant tout ou partie des données de synthèse DSo avec les données de texture Ti et/ou T’i et/ou Tk.

Selon un autre mode de réalisation représenté à la figure 6C, des données de synthèse intermédiaires DS^inti sont générées d’une manière similaire aux données de synthèse DSo. Ces données de synthèse intermédiaires sont alors combinées/fusionnées avec les données de synthèse DSo, fournissant les données de synthèse DS-i.

Pour fusionner les données de synthèse DSo et DS^inti, différents modes de réalisation peuvent être mis en oeuvre. Selon un premier mode de réalisation, les données de synthèse manquantes dans une carte de données de synthèse, par exemple la carte contenant les données de synthèse DS^inti, sont récupérées parmi les données de synthèse DSo existantes de l’autre carte, ou bien inversement.

Selon un deuxième mode de réalisation, si parmi les données de synthèse DS-i, certaines étaient déjà présentes parmi les données de synthèse DSo et qu’elles sont associées chacune dans la carte de données de synthèse DSi à un degré de confiance supérieur à celui qui leur était associé dans la carte de données de synthèse DSo, ces données de synthèse DSo sont substituées par les données de synthèse DSi correspondantes obtenues en S11. Par exemple, la valeur de SAD peut être calculée par un algorithme de mise en correspondance stéréoscopique qui réalise un appariement entre l’image IVi ou IVk utilisée en S1i pour générer les données de synthèse et une autre image parmi N. Les vecteurs trouvés pour apparier ces deux images sont issus d’une estimation de mouvement qui retourne un niveau de corrélation SAD qui est considéré comme un exemple de degré de confiance.

Selon un troisième mode de réalisation, si parmi les données de synthèse DSi, certaines étaient déjà présentes parmi les données de synthèse DSo, et que ces données de synthèse DSi sont des valeurs de profondeur associées à des éléments situés par exemple au premier plan de la scène, alors que les données de synthèse DSo déjà présentes sont des valeurs de profondeur associées à des éléments situés par exemple à l’arrière-plan de la scène, ces données de synthèse DSo sont substituées par ces données de synthèse DSi, de manière à conserver les informations d’un plan de profondeur en priorité (dans cet exemple, le premier plan de la scène).

La phase de traitement d’image P1 se poursuit par un calcul S2i, par le module de calcul M2 de la figure 2, d’une nouvelle image d’une vue synthétisée IS-i. Comme en S2o, le calcul S2i est mis en oeuvre par un algorithme de synthèse classique, tel que par exemple RVS ou VVS. Un exemple d’image synthétisée ISi est représenté à la figure 4B.

Selon un premier mode de réalisation de la synthèse S2i représenté en figure 7A, le module de calcul M2 modifie l’image synthétisée ISo calculée en S2o, au moins à partir des données de synthèse DSi générées en S11. Au moins une image parmi les images IVi à IVN peut également être utilisée lors de cette modification.

Selon un deuxième mode de réalisation représenté en figure 7B, le module de calcul M2 calcule une image synthétisée intermédiaire IS^inti à partir des données de synthèse DSi obtenues en S1i et éventuellement d’une ou plusieurs images IVi à IVN, puis combine l’image synthétisée intermédiaire IS^inti avec l’image synthétisée ISo calculée précédemment en S2o pour générer une image synthétisée IS-i.

Il existe différentes manières de combiner les images synthétisées IS^inti et ISo.

Selon un premier mode de réalisation, l’image synthétisée ISi est obtenue en récupérant les pixels manquants dans une image synthétisée parmi les images IS^inti et ISo, par exemple l’image IS^inti, parmi les pixels existants dans l’image ISo.

Selon un deuxième mode de réalisation, dans le cas où des pixels synthétisés dans l’image IS^inti sont également présents dans l’image ISo, dans la même position, l’image de synthèse ISi est obtenue en sélectionnant parmi les images IS^inti et ISo, le pixel synthétisé commun qui est associé au degré de confiance le plus élevé à l’aide de la carte de confiance CM précitée.

Selon un troisième mode de réalisation, dans le cas où des pixels synthétisés dans l’image IS^inti sont également présents dans l’image ISo dans la même position, l’image de synthèse ISi est obtenue en sélectionnant parmi les images IS^inti et ISo, le pixel synthétisé commun qui est associé à un plan de profondeur en priorité, le premier plan de la scène par exemple.

La phase de traitement d’image P1 se poursuit par une analyse, en S3i, de l’image synthétisée ISi par rapport à un critère de performance de synthèse CS, au moyen du module d’analyse M3 de la figure 2.

Les critères de performance utilisés dans la phase de traitement d’image P1 peuvent être les mêmes que les critères CS1 à CS3 précités. Deux autres critères suivants peuvent également être considérés de manière non exhaustive :

-CS4 : qualité de la cohérence temporelle entre l’image synthétisée ISi et l’image synthétisée ISo jugée suffisante ; et/ou

-CS5 : la valeur de certains pixels synthétisés dans l’image synthétisée ISi est égale ou sensiblement égale à celle de certains pixels synthétisés de même position respective dans l’image synthétisée ISo, amenant à deux images synthétisées semblables.

Si le/les critères CS1 à CS5 est/sont respecté(s), l’image synthétisée ISi est considérée valide et est délivrée pour être stockée en attente d’être affichée par un terminal d’un utilisateur ayant requis cette image et/ou directement affichée par le terminal.

Si le/les critère(s) CS1 à CS5 n’est/ne sont pas respecté(s), le module d’analyse M3 transmet en S4i au module M1 une information INF1. Si l’analyse S3i de l’image synthétisée IS1 utilise le critère de performance de synthèse CS4, l’information INF1 contient les coordonnées des pixels de la/des zone(s) de l’image synthétisée IS1 considérés comme manquant de cohérence temporelle avec les pixels de position correspondante dans l’image synthétisée ISo. Si l’analyse S3i de l’image synthétisée IS1 utilise le critère de performance de synthèse CS5, l’information IN Fi contient les coordonnées des pixels de la/des zone(s) de l’image synthétisée IS1 considérés comme manquant de cohérence pixellique avec les pixels de position correspondante dans l’image synthétisée ISo.

Le dispositif de synthèse SYNT déclenche alors une nouvelle phase de traitement d’image P2 similaire à la phase de traitement d’image P1 , afin d’améliorer/raffiner/compléter encore davantage l’image synthétisée IS1 qui a été obtenue précédemment.

Il convient de noter qu’à partir de la phase de traitement d’image P2, si la sélection de telles ou telles données de texture est conditionnée par l’information INF1, les critères CS4 et CS5 précités peuvent être considérés pour générer de nouvelles données de synthèse DS2. A cet effet, est représenté ci-dessous, à titre d’exemple uniquement, un tableau Tableau2 qui associe à chaque critère de performance de synthèse CS1 à CS5 qui n’est pas rempli, le contenu de l’information INF1 correspondante et l’action à mettre en oeuvre en P2 par le module M1 de génération de données de synthèse.

[Tableau 2]

Conformémen à l’invention, une phase de traitement d’image peut être itérée tant qu’un ou plusieurs critère(s) de performance de synthèse n’est/ne sont pas respecté(s).

En référence à la figure 1 , et de manière générale, une phase de traitement d’image courante Pc se déroule de la manière suivante :

En Sic, le module M1 de génération de données de synthèse génère à nouveau des données de synthèse DSc à partir de données de texture (pixels) d’au moins une des images IV1 à IVN. Il peut s’agir par exemple :

- des données de texture Ti, T’i. Tk déjà utilisées dans les étapes de génération de données de synthèse précédentes, et/ou

- de données de texture de la composante de texture d’au moins une image qui a déjà été utilisée dans les étapes de génération de données de synthèse précédentes, mais qui diffèrent des données de texture déjà utilisées pour cette composante de texture, et/ou

- de données de texture d’une autre image IV_m parmi N (1 <m£N).

Comme en S1o et en S1i, les données de synthèse DSc peuvent être générées également à partir d’au moins une information MD associée à la séquence d’images multi-vues IV1 à IVN et/ou d’une ou plusieurs cartes de profondeur CPi à CPN disponibles, associées respectivement aux composantes de texture CTi à CTN des images IV1 à IVN. Il peut également s’agir de données de profondeur, de cartes de profondeur partielles, de cartes de contour, etc. utilisées individuellement ou en combinaison, le choix du type de ces données n’étant pas obligatoirement le même que celui utilisé dans les étapes de génération de données de synthèse précédentes S1 o, S11, etc..

La sélection de la/des images pour générer les données de synthèse DSc est mise en oeuvre de la même manière que dans les modes de réalisation précités.

En particulier, le module M1 de génération de données de synthèse peut être configuré pour sélectionner en Sic une ou plusieurs composantes de texture des images IVi à IVN qui, selon le résultat de l’analyse des images synthétisées effectuée dans les phases de traitement d’image précédentes, peuvent être plus proches ou plus éloignées des images déjà utilisées dans les phases de traitement d’image précédentes.

Selon encore un autre exemple, le module M1 peut utiliser en plus ou à la place des composantes de texture CTi à CTN, une ou plusieurs images ISo, ISi , ...déjà synthétisée(s) lors des phases de traitement précédentes.

Comme déjà expliqué plus haut, le choix en S1_c des données de texture peut être conditionné par l’information INF_c-i, ce choix pouvant être également complété par les informations INFo, INF-i, ... générées à l’issue des étapes de calcul d’images de synthèse ISo, ISi,... respectivement. La sélection des nouvelles données de texture se basera sur les critères du tableau Tableau2 mentionné plus haut en considérant l’image l_c-i synthétisée lors de la phase de traitement d’image précédente Pc-1 , au regard d’au moins une des autres images ISo, ISi,... déjà synthétisées lors des phases de traitement précédentes.

Comme déjà expliqué lors de la description de l’étape S11, les données de synthèse DSc peuvent être générées en Sic en modifiant, à l’aide des données de texture Ti et/ou T’i et/ou Tk et/ou Tm utilisées en entrée du module M1 , tout ou partie des données de synthèse DSc-i générées dans la phase de traitement d’image précédente P_c-i, mais aussi les données de synthèse DSo, DS-i, ...avant la phase P_c- 1.

Comme déjà expliqué plus haut, lors de la description de l’étape S1o, selon un mode de réalisation, la génération Sic des données de synthèse peut-être mise en oeuvre à partir d’un seuil qui est par exemple une valeur de distorsion SAD. La valeur de distorsion SAD peut être la même à chaque itération. Toutefois, une telle valeur SAD peut-être variable. Dans les premières phases de traitement d’image PO, P1 , P2, la valeur SAD requise est par exemple la plus faible possible et est augmentée dans les phases de traitement suivantes, par exemple à partir de la phase de traitement d’image courante Pc. Selon un autre exemple, la valeur SAD peut être augmentée progressivement à chaque itération d’une phase de traitement d’image.

De façon similaire à la phase de traitement d’image P1 précitée, la phase de traitement d’image courante Pc se poursuit par un calcul S2_C, par le module de calcul M2 de la figure 2, d’une nouvelle image d’une vue synthétisée ISc. Comme déjà expliqué précédemment, le calcul S2_C est mis en oeuvre par un algorithme de synthèse classique, tel que par exemple RVS ou VVS.

Comme déjà expliqué lors de la description de l’étape S2i, selon un premier mode de réalisation, le module de calcul M2 modifie l’image synthétisée ISc-i obtenue lors de la phase de traitement d’image précédente P_c-i, au moins à partir des données de synthèse DSc générées en Sic. Au moins une image parmi les images IVi à IVN peut également être utilisée lors de cette modification. Selon un deuxième mode de réalisation, le module de calcul M2 calcule une image synthétisée intermédiaire IS^int _c à partir des données de synthèse DSc obtenues en Sic et éventuellement d’une ou plusieurs images IVi à IVN, puis combine l’image synthétisée intermédiaire IS^int _c avec l’image synthétisée ISc-i calculée précédemment dans la phase de traitement d’image précédente Pc-1 et éventuellement avec une ou plusieurs images ISo,

ISi,.... déjà synthétisées avant la phase de traitement d’image précédente Pc-1.

La phase de traitement d’image Pc se poursuit par une analyse, en S3c, de l’image synthétisée ISc par rapport à un critère de performance de synthèse CS, au moyen du module d’analyse M3 de la figure 2.

Les critères de performance utilisés dans la phase de traitement d’image Pc sont les critères CS1 à CS5 précités. Si un ou plusieurs de ces critères est/sont respecté(s), l’image synthétisée ISc est considérée valide et est délivrée pour être stockée en attente d’être affichée par un terminal d’un utilisateur ayant requis cette image et/ou directement affichée par le terminal. Si un ou plusieurs de ces critères n’est/ne sont pas respecté(s), le module d’analyse M3 transmet en S4_C au module M1 une information INF_C. Une nouvelle phase de traitement d’image Pc+1 est alors déclenchée.

Claims

REVENDICATIONS

[Revendication 1 ] Procédé de synthèse d’une image d’une vue à partir de données d’une vidéo multi-vues, mis en oeuvre dans un dispositif de synthèse d’image, le procédé comprenant une phase de traitement d’image comme suit :

- générer (S1 o) des données de synthèse d’image (DSo) à partir de données de texture d’au moins une image d’une vue de la vidéo multi-vues,

- calculer (S2o) une image (ISo) d’une vue synthétisée à partir desdites données de synthèse générées et à partir d’au moins une image d’une vue de la vidéo multi-vues,

- analyser (S3o) l’image de ladite vue synthétisée par rapport à un critère de performance de synthèse (CS),

- si ledit critère est respecté, délivrer l’image de ladite vue synthétisée,

- sinon, itérer ladite phase de traitement, l’étape de calcul (S2_C) d’une image d’une vue synthétisée (ISc) à une itération courante comprenant la modification, à partir de données de synthèse (DSc) générées à l’itération courante, d’une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante.

[Revendication 2] Procédé de synthèse selon la revendication 1 , dans lequel, à l’itération courante, une image d’une vue utilisée pour générer les données de synthèse est sélectionnée en fonction du résultat de l’analyse de l’image de la vue synthétisée modifiée lors d’une phase de traitement précédant l’itération courante.

[Revendication 3] Procédé de synthèse selon la revendication 1 ou la revendication 2, dans lequel à l’itération courante, la génération des données de synthèse utilise les données de synthèse générées lors d’une phase de traitement précédant l’itération courante.

[Revendication 4] Procédé de synthèse selon la revendication 3, dans lequel à l’itération courante, la génération de données de synthèse comprend une modification des données de synthèse générées lors d’une phase de traitement précédant l’itération courante, à partir de données de texture utilisées à l’itération courante.

[Revendication 5] Procédé de synthèse selon la revendication 3, dans lequel les données de synthèse générées à l'itération courante sont combinées avec des données de synthèse générées lors d’une phase de traitement précédant l’itération courante.

[Revendication 6] Procédé de synthèse selon l’une quelconque des revendications 1 à 5, dans lequel les données de synthèse générées au cours d’une phase de traitement appartiennent au groupe comprenant :

- des données de contour associées aux données de texture de l’image de la vue de la vidéo multi-vues utilisées dans ladite phase de traitement,

- un élément visuel de l’image de la vue de la vidéo multi-vues utilisée dans ladite phase de traitement, ledit élément visuel ne variant pas d’une image d’une vue de la vidéo multi-vues à l’autre,

[Revendication 7] Procédé de synthèse selon l’une quelconque des revendications 1 à 6, dans lequel les données de synthèse générées au cours d’une phase de traitement sont associées à une valeur d’incertitude sur la corrélation desdites données de synthèse avec les données de texture correspondantes de ladite au moins une image de ladite vue qui ont été utilisées pour générer lesdites données de synthèse.

[Revendication 8] Procédé de synthèse selon l’une quelconque des revendications 1 à 7, dans lequel, au cours d’une phase de traitement, la génération de données de synthèse utilise au moins une image de profondeur d’une vue de la vidéo multi-vues et/ou au moins une information associée à la vidéo multi-vues.

[Revendication 9] Procédé de synthèse selon l’une quelconque des revendications 1 à 8, dans lequel à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente utilise des données de synthèse générées précédemment à l’itération courante.

[Revendication 10] Procédé de synthèse selon l’une quelconque des revendications 1 à 9, dans lequel à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente comprend le calcul d’une image d’une vue synthétisée à partir desdites données de synthèse générées à l’itération courante et de l’image de ladite vue synthétisée calculée à ladite itération précédente.

[Revendication 11 ] Procédé de synthèse selon l’une quelconque des revendications 1 à 9, dans lequel à l’itération courante, la modification de l’image de la vue synthétisée calculée à une itération précédente comprend ce qui suit :

- calculer une image d’une vue synthétisée à partir desdites données de synthèse générées à l’itération courante et à partir de l’image d’une vue de la vidéo multi-vues, - combiner l’image de ladite vue synthétisée calculée avec l’image de la vue synthétisée calculée à ladite itération précédente.

[Revendication 12] Procédé de synthèse selon l’une quelconque des revendications 1 à 11 , dans lequel l’itération courante est mise en oeuvre en réponse à un message du dispositif de synthèse, ledit message contenant :

- soit des informations de localisation d’une ou plusieurs zones/d’un ou plusieurs pixels de l’image de la vue synthétisée calculée précédemment à l’itération courante, qui ne respectent pas le critère de performance de synthèse,

- soit un pourcentage de pixels non synthétisés de l’image de la vue synthétisée précédemment à l’itération courante.

[Revendication 13] Procédé de synthèse selon la revendication 7 et la revendication 12, dans lequel l’itération courante est mise en oeuvre en outre en réponse à la réception de valeurs d’incertitude associées aux données de synthèse générées à l’itération précédente.

[Revendication 14] Dispositif de synthèse d’une image d’une vue à partir de données d’une vidéo multi-vues, ledit dispositif comprenant un processeur (UT_S) qui est configuré pour mettre en oeuvre ce qui suit :

- mettre en oeuvre une phase de traitement d’image comme suit :

-- générer des données de synthèse d’image à partir de données de texture d’au moins une image d’une vue de la vidéo multi-vues,

-- calculer une image d’une vue synthétisée à partir desdites données de synthèse générées et à partir d’au moins une image d’une vue de la vidéo multi-vues,

- analyser l’image de ladite vue synthétisée par rapport à un critère de performance de synthèse,

-- si ledit critère est respecté, délivrer l’image de ladite vue synthétisée,

-- sinon, itérer la phase de traitement, le calcul d’une image d’une vue synthétisée à une itération courante comprenant la modification, à partir de données de synthèse générées à l’itération courante, d’une image de la vue synthétisée calculée lors d’une phase de traitement précédant l’itération courante.

[Revendication 15] Procédé de décodage d’un signal de données codées d’une vidéo multi-vues, mis en oeuvre dans un dispositif de décodage d’image, comprenant ce qui suit :

- décoder des images de plusieurs vues codées, produisant un ensemble d’images de plusieurs vues décodées,

- synthétiser une image d’une vue à partir dudit ensemble d’images conformément au procédé de synthèse selon l’une quelconque des revendications 1 à 13.

[Revendication 16] Procédé de décodage selon la revendication 15, dans lequel les données de synthèse sont générées à partir de données de texture d’au moins une des images décodées dudit ensemble.

[Revendication 17] Procédé de décodage selon la revendication 15, dans lequel les données de synthèse étant préalablement codées, elles sont générées comme suit :

- lire les données de synthèse codées dans ledit signal de données ou dans un autre signal de données, - décoder les données de synthèse lues.

[Revendication 18] Dispositif de décodage d’un signal de données codées d’une vidéo multi-vues, ledit dispositif de décodage comprenant un processeur (UT_D) qui est configuré pour mettre en oeuvre ce qui suit :

- synthétiser une image d’une vue à partir de données d’une vidéo multi-vues, conformément au procédé de synthèse selon l’une quelconque des revendications 1 à 13.

[Revendication 19] Programme d'ordinateur comportant des instructions de code de programme pour la mise en oeuvre du procédé de synthèse selon l’une quelconque des revendications 1 à 13 ou du procédé de décodage selon l’une quelconque des revendications 15 à 17, lorsqu'il est exécuté sur un ordinateur.

[Revendication 20] Support d'informations lisible par un ordinateur, et comportant des instructions d'un programme d'ordinateur selon la revendication 19.